diff --git a/annotator/uniformer/__init__.py b/annotator/uniformer/__init__.py
index 3364d40997..e6ff24f630 100644
--- a/annotator/uniformer/__init__.py
+++ b/annotator/uniformer/__init__.py
@@ -18,10 +18,12 @@ def __init__(self):
         if not os.path.exists(modelpath):
             from basicsr.utils.download_util import load_file_from_url
             load_file_from_url(checkpoint_file, model_dir=annotator_ckpts_path)
+        # config.py（默认ADE20K）
         config_file = os.path.join(os.path.dirname(annotator_ckpts_path), "uniformer", "exp", "upernet_global_small", "config.py")
         self.model = init_segmentor(config_file, modelpath).cuda()
 
     def __call__(self, img):
         result = inference_segmentor(self.model, img)
+        # palette: cityscapes, ade, voc
         res_img = show_result_pyplot(self.model, img, result, get_palette('ade'), opacity=1)
         return res_img
diff --git a/annotator/uniformer/exp/mask2former/mask2former_r101_8xb2-90k_cityscapes-512x1024.py b/annotator/uniformer/exp/mask2former/mask2former_r101_8xb2-90k_cityscapes-512x1024.py
new file mode 100644
index 0000000000..28d756873a
--- /dev/null
+++ b/annotator/uniformer/exp/mask2former/mask2former_r101_8xb2-90k_cityscapes-512x1024.py
@@ -0,0 +1,5 @@
+_base_ = ['./mask2former_r50_8xb2-90k_cityscapes-512x1024.py']
+
+model = dict(
+    backbone=dict(
+        depth=101))
\ No newline at end of file
diff --git a/annotator/uniformer/exp/mask2former/mask2former_r50_8xb2-90k_cityscapes-512x1024.py b/annotator/uniformer/exp/mask2former/mask2former_r50_8xb2-90k_cityscapes-512x1024.py
new file mode 100644
index 0000000000..c62a6e900b
--- /dev/null
+++ b/annotator/uniformer/exp/mask2former/mask2former_r50_8xb2-90k_cityscapes-512x1024.py
@@ -0,0 +1,183 @@
+_base_ = ['../../configs/_base_/default_runtime.py', '../../configs/_base_/datasets/cityscapes.py']
+
+crop_size = (512, 1024)
+num_classes = 19
+model = dict(
+    type='EncoderDecoder',
+    backbone=dict(
+        type='ResNetV1c',
+        depth=50,
+        num_stages=4,
+        out_indices=(0, 1, 2, 3),
+        frozen_stages=-1,
+        norm_cfg=dict(type='SyncBN', requires_grad=False),
+        style='pytorch'),
+    decode_head=dict(
+        type='Mask2FormerHead',
+        in_channels=[256, 512, 1024, 2048],
+        strides=[4, 8, 16, 32],
+        feat_channels=256,
+        out_channels=256,
+        num_classes=num_classes,
+        num_queries=100,
+        num_transformer_feat_level=3,
+        align_corners=False,
+        pixel_decoder=dict(
+            type='mmdet.MSDeformAttnPixelDecoder',
+            num_outs=3,
+            norm_cfg=dict(type='GN', num_groups=32),
+            act_cfg=dict(type='ReLU'),
+            encoder=dict(  # DeformableDetrTransformerEncoder
+                num_layers=6,
+                layer_cfg=dict(  # DeformableDetrTransformerEncoderLayer
+                    self_attn_cfg=dict(  # MultiScaleDeformableAttention
+                        embed_dims=256,
+                        num_heads=8,
+                        num_levels=3,
+                        num_points=4,
+                        im2col_step=64,
+                        dropout=0.0,
+                        batch_first=True,
+                        norm_cfg=None,
+                        init_cfg=None),
+                    ffn_cfg=dict(
+                        embed_dims=256,
+                        feedforward_channels=1024,
+                        num_fcs=2,
+                        ffn_drop=0.0,
+                        act_cfg=dict(type='ReLU', inplace=True))),
+                init_cfg=None),
+            positional_encoding=dict(  # SinePositionalEncoding
+                num_feats=128, normalize=True),
+            init_cfg=None),
+        enforce_decoder_input_project=False,
+        positional_encoding=dict(  # SinePositionalEncoding
+            num_feats=128, normalize=True),
+        transformer_decoder=dict(  # Mask2FormerTransformerDecoder
+            return_intermediate=True,
+            num_layers=9,
+            layer_cfg=dict(  # Mask2FormerTransformerDecoderLayer
+                self_attn_cfg=dict(  # MultiheadAttention
+                    embed_dims=256,
+                    num_heads=8,
+                    attn_drop=0.0,
+                    proj_drop=0.0,
+                    dropout_layer=None,
+                    batch_first=True),
+                cross_attn_cfg=dict(  # MultiheadAttention
+                    embed_dims=256,
+                    num_heads=8,
+                    attn_drop=0.0,
+                    proj_drop=0.0,
+                    dropout_layer=None,
+                    batch_first=True),
+                ffn_cfg=dict(
+                    embed_dims=256,
+                    feedforward_channels=2048,
+                    num_fcs=2,
+                    act_cfg=dict(type='ReLU', inplace=True),
+                    ffn_drop=0.0,
+                    dropout_layer=None,
+                    add_identity=True)),
+            init_cfg=None),
+        loss_cls=dict(
+            type='mmdet.CrossEntropyLoss',
+            use_sigmoid=False,
+            loss_weight=2.0,
+            reduction='mean',
+            class_weight=[1.0] * num_classes + [0.1]),
+        loss_mask=dict(
+            type='mmdet.CrossEntropyLoss',
+            use_sigmoid=True,
+            reduction='mean',
+            loss_weight=5.0),
+        loss_dice=dict(
+            type='mmdet.DiceLoss',
+            use_sigmoid=True,
+            activate=True,
+            reduction='mean',
+            naive_dice=True,
+            eps=1.0,
+            loss_weight=5.0),
+        train_cfg=dict(
+            num_points=12544,
+            oversample_ratio=3.0,
+            importance_sample_ratio=0.75,
+            assigner=dict(
+                type='mmdet.HungarianAssigner',
+                match_costs=[
+                    dict(type='mmdet.ClassificationCost', weight=2.0),
+                    dict(
+                        type='mmdet.CrossEntropyLossCost',
+                        weight=5.0,
+                        use_sigmoid=True),
+                    dict(
+                        type='mmdet.DiceCost',
+                        weight=5.0,
+                        pred_act=True,
+                        eps=1.0)
+                ]),
+            sampler=dict(type='mmdet.MaskPseudoSampler'))),
+    train_cfg=dict())
+
+# dataset config
+train_pipeline = [
+    dict(type='LoadImageFromFile'),
+    dict(type='LoadAnnotations'),
+    dict(
+        type='RandomChoiceResize',
+        scales=[int(1024 * x * 0.1) for x in range(5, 21)],
+        resize_type='ResizeShortestEdge',
+        max_size=4096),
+    dict(type='RandomCrop', crop_size=crop_size, cat_max_ratio=0.75),
+    dict(type='RandomFlip', prob=0.5),
+    dict(type='PhotoMetricDistortion'),
+    dict(type='PackSegInputs')
+]
+train_dataloader = dict(dataset=dict(pipeline=train_pipeline))
+
+# optimizer
+embed_multi = dict(lr_mult=1.0, decay_mult=0.0)
+optimizer = dict(
+    type='AdamW', lr=0.0001, weight_decay=0.05, eps=1e-8, betas=(0.9, 0.999))
+optim_wrapper = dict(
+    type='OptimWrapper',
+    optimizer=optimizer,
+    clip_grad=dict(max_norm=0.01, norm_type=2),
+    paramwise_cfg=dict(
+        custom_keys={
+            'backbone': dict(lr_mult=0.1, decay_mult=1.0),
+            'query_embed': embed_multi,
+            'query_feat': embed_multi,
+            'level_embed': embed_multi,
+        },
+        norm_decay_mult=0.0))
+# learning policy
+param_scheduler = [
+    dict(
+        type='PolyLR',
+        eta_min=0,
+        power=0.9,
+        begin=0,
+        end=90000,
+        by_epoch=False)
+]
+
+# training schedule for 90k
+train_cfg = dict(type='IterBasedTrainLoop', max_iters=90000, val_interval=5000)
+val_cfg = dict(type='ValLoop')
+default_hooks = dict(
+    timer=dict(type='IterTimerHook'),
+    logger=dict(type='LoggerHook', interval=50, log_metric_by_epoch=False),
+    param_scheduler=dict(type='ParamSchedulerHook'),
+    checkpoint=dict(
+        type='CheckpointHook', by_epoch=False, interval=5000,
+        save_best='mIoU'),
+    sampler_seed=dict(type='DistSamplerSeedHook'),
+    visualization=dict(type='SegVisualizationHook'))
+
+# Default setting for scaling LR automatically
+#   - `enable` means enable scaling LR automatically
+#       or not by default.
+#   - `base_batch_size` = (8 GPUs) x (2 samples per GPU).
+auto_scale_lr = dict(enable=False, base_batch_size=16)
\ No newline at end of file
diff --git a/annotator/uniformer/exp/mask2former/mask2former_swin-l-in22k-384x384-pre_8xb2-90k_cityscapes-512x1024.py b/annotator/uniformer/exp/mask2former/mask2former_swin-l-in22k-384x384-pre_8xb2-90k_cityscapes-512x1024.py
new file mode 100644
index 0000000000..05ff96b8ea
--- /dev/null
+++ b/annotator/uniformer/exp/mask2former/mask2former_swin-l-in22k-384x384-pre_8xb2-90k_cityscapes-512x1024.py
@@ -0,0 +1,42 @@
+_base_ = ['./mask2former_swin-t_8xb2-90k_cityscapes-512x1024.py']
+pretrained = 'https://download.openmmlab.com/mmsegmentation/v0.5/pretrain/swin/swin_large_patch4_window12_384_22k_20220412-6580f57d.pth'  # noqa
+
+depths = [2, 2, 18, 2]
+model = dict(
+    backbone=dict(
+        pretrain_img_size=384,
+        embed_dims=192,
+        depths=depths,
+        num_heads=[6, 12, 24, 48],
+        window_size=12,
+        init_cfg=dict(type='Pretrained', checkpoint=pretrained)),
+    decode_head=dict(in_channels=[192, 384, 768, 1536]))
+
+# set all layers in backbone to lr_mult=0.1
+# set all norm layers, position_embeding,
+# query_embeding, level_embeding to decay_multi=0.0
+backbone_norm_multi = dict(lr_mult=0.1, decay_mult=0.0)
+backbone_embed_multi = dict(lr_mult=0.1, decay_mult=0.0)
+embed_multi = dict(lr_mult=1.0, decay_mult=0.0)
+custom_keys = {
+    'backbone': dict(lr_mult=0.1, decay_mult=1.0),
+    'backbone.patch_embed.norm': backbone_norm_multi,
+    'backbone.norm': backbone_norm_multi,
+    'absolute_pos_embed': backbone_embed_multi,
+    'relative_position_bias_table': backbone_embed_multi,
+    'query_embed': embed_multi,
+    'query_feat': embed_multi,
+    'level_embed': embed_multi
+}
+custom_keys.update({
+    f'backbone.stages.{stage_id}.blocks.{block_id}.norm': backbone_norm_multi
+    for stage_id, num_blocks in enumerate(depths)
+    for block_id in range(num_blocks)
+})
+custom_keys.update({
+    f'backbone.stages.{stage_id}.downsample.norm': backbone_norm_multi
+    for stage_id in range(len(depths) - 1)
+})
+# optimizer
+optim_wrapper = dict(
+    paramwise_cfg=dict(custom_keys=custom_keys, norm_decay_mult=0.0))
\ No newline at end of file
diff --git a/annotator/uniformer/exp/mask2former/mask2former_swin-t_8xb2-90k_cityscapes-512x1024.py b/annotator/uniformer/exp/mask2former/mask2former_swin-t_8xb2-90k_cityscapes-512x1024.py
new file mode 100644
index 0000000000..6d7936b3fa
--- /dev/null
+++ b/annotator/uniformer/exp/mask2former/mask2former_swin-t_8xb2-90k_cityscapes-512x1024.py
@@ -0,0 +1,52 @@
+_base_ = ['./mask2former_r50_8xb2-90k_cityscapes-512x1024.py']
+pretrained = 'https://download.openmmlab.com/mmsegmentation/v0.5/pretrain/swin/swin_tiny_patch4_window7_224_20220317-1cdeb081.pth'  # noqa
+depths = [2, 2, 6, 2]
+model = dict(
+    backbone=dict(
+        _delete_=True,
+        type='SwinTransformer',
+        embed_dims=96,
+        depths=depths,
+        num_heads=[3, 6, 12, 24],
+        window_size=7,
+        mlp_ratio=4,
+        qkv_bias=True,
+        qk_scale=None,
+        drop_rate=0.,
+        attn_drop_rate=0.,
+        drop_path_rate=0.3,
+        patch_norm=True,
+        out_indices=(0, 1, 2, 3),
+        with_cp=False,
+        frozen_stages=-1,
+        init_cfg=dict(type='Pretrained', checkpoint=pretrained)),
+    decode_head=dict(in_channels=[96, 192, 384, 768]))
+
+# set all layers in backbone to lr_mult=0.1
+# set all norm layers, position_embeding,
+# query_embeding, level_embeding to decay_multi=0.0
+backbone_norm_multi = dict(lr_mult=0.1, decay_mult=0.0)
+backbone_embed_multi = dict(lr_mult=0.1, decay_mult=0.0)
+embed_multi = dict(lr_mult=1.0, decay_mult=0.0)
+custom_keys = {
+    'backbone': dict(lr_mult=0.1, decay_mult=1.0),
+    'backbone.patch_embed.norm': backbone_norm_multi,
+    'backbone.norm': backbone_norm_multi,
+    'absolute_pos_embed': backbone_embed_multi,
+    'relative_position_bias_table': backbone_embed_multi,
+    'query_embed': embed_multi,
+    'query_feat': embed_multi,
+    'level_embed': embed_multi
+}
+custom_keys.update({
+    f'backbone.stages.{stage_id}.blocks.{block_id}.norm': backbone_norm_multi
+    for stage_id, num_blocks in enumerate(depths)
+    for block_id in range(num_blocks)
+})
+custom_keys.update({
+    f'backbone.stages.{stage_id}.downsample.norm': backbone_norm_multi
+    for stage_id in range(len(depths) - 1)
+})
+# optimizer
+optim_wrapper = dict(
+    paramwise_cfg=dict(custom_keys=custom_keys, norm_decay_mult=0.0))
\ No newline at end of file
diff --git a/cldm/cldm.py b/cldm/cldm.py
index 0b3ac7a575..febc615e76 100644
--- a/cldm/cldm.py
+++ b/cldm/cldm.py
@@ -331,10 +331,21 @@ def apply_model(self, x_noisy, t, cond, *args, **kwargs):
 
         cond_txt = torch.cat(cond['c_crossattn'], 1)
 
+        # !!!
+        # obstruction_txt = None
+        # if cond['obstruction_c_crossattn'] != None:
+        #     obstruction_txt = torch.cat(cond['obstruction_c_crossattn'], 1)
+
         if cond['c_concat'] is None:
             eps = diffusion_model(x=x_noisy, timesteps=t, context=cond_txt, control=None, only_mid_control=self.only_mid_control)
         else:
+            # !!!
             control = self.control_model(x=x_noisy, hint=torch.cat(cond['c_concat'], 1), timesteps=t, context=cond_txt)
+            # if obstruction_txt != None:
+            #     control = self.control_model(x=x_noisy, hint=torch.cat(cond['c_concat'], 1), timesteps=t, context=obstruction_txt)
+            # else:
+            #     control = self.control_model(x=x_noisy, hint=torch.cat(cond['c_concat'], 1), timesteps=t, context=cond_txt)
+
             control = [c * scale for c, scale in zip(control, self.control_scales)]
             eps = diffusion_model(x=x_noisy, timesteps=t, context=cond_txt, control=control, only_mid_control=self.only_mid_control)
 
diff --git a/control_sd.py b/control_sd.py
new file mode 100644
index 0000000000..12be31be4b
--- /dev/null
+++ b/control_sd.py
@@ -0,0 +1,140 @@
+import cv2
+import einops
+import numpy as np
+import torch
+import random
+# import gradio as gr
+from pytorch_lightning import seed_everything
+from ControlNet.annotator.util import resize_image, HWC3
+from ControlNet.cldm.model import create_model, load_state_dict
+from ControlNet.cldm.ddim_hacked import DDIMSampler
+# import config as config
+save_memory = False
+
+
+class ControlSD:
+    def __init__(self, model_config, checkpoint_path):
+        self.model = create_model(model_config).cpu()
+        self.model.load_state_dict(load_state_dict(checkpoint_path, location='cuda'))
+        self.model = self.model.cuda()
+        self.ddim_sampler = DDIMSampler(self.model)
+
+    def process(self, detected_map, prompt, a_prompt, n_prompt, num_samples, image_resolution, detect_resolution, 
+                ddim_steps, guess_mode, strength, scale, seed, eta):
+        print(detected_map.shape, "detected_map.shape")
+        print(prompt, "prompt")
+        print(a_prompt, "a_prompt")
+        print(n_prompt, "n_prompt")
+        print(num_samples, type(num_samples), "num_samples")
+        print(image_resolution, type(image_resolution), "image_resolution")
+        print(detect_resolution, type(detect_resolution), "detect_resolution")
+        print(ddim_steps, type(ddim_steps), "ddim_steps")
+        print(guess_mode, type(guess_mode), "guess_mode")
+        print(strength, type(strength), "strength")
+        print(scale, type(scale), "scale")
+        print(seed, type(seed), "seed")
+        print(eta, type(eta), "eta")
+        print("111")
+        with torch.no_grad():
+            detected_map = HWC3(detected_map)
+            img = resize_image(detected_map, image_resolution)
+            H, W, C = img.shape
+            detected_map = cv2.resize(detected_map, (W, H), interpolation=cv2.INTER_NEAREST)
+            print("222")
+            control = torch.from_numpy(detected_map.copy()).float().cuda() / 255.0
+            control = torch.stack([control for _ in range(num_samples)], dim=0)
+            control = einops.rearrange(control, 'b h w c -> b c h w').clone()
+            print("333")
+            if seed == -1:
+                seed = random.randint(0, 65535)
+            seed_everything(seed)
+            print("444")
+            if save_memory:
+                self.model.low_vram_shift(is_diffusing=False)
+            print("555")
+            cond = {
+                "c_concat": [control], 
+                "c_crossattn": [self.model.get_learned_conditioning([prompt + ', ' + a_prompt] * num_samples)]
+            }
+            print("666")
+            un_cond = {
+                "c_concat": None if guess_mode else [control], 
+                "c_crossattn": [self.model.get_learned_conditioning([n_prompt] * num_samples)]
+            }
+            print("777")
+            shape = (4, H // 8, W // 8)
+            print("888")
+            if save_memory:
+                self.model.low_vram_shift(is_diffusing=True)
+
+            self.model.control_scales = [strength * (0.825 ** float(12 - i)) for i in range(13)] if guess_mode else ([strength] * 13)
+
+            samples, _ = self.ddim_sampler.sample(ddim_steps, num_samples, shape, cond, verbose=False, eta=eta,
+                                                  unconditional_guidance_scale=scale, unconditional_conditioning=un_cond)
+            print("999")
+            if save_memory:
+                self.model.low_vram_shift(is_diffusing=False)
+            print("1010")
+            x_samples = self.model.decode_first_stage(samples)
+            x_samples = (einops.rearrange(x_samples, 'b c h w -> b h w c') * 127.5 + 127.5).cpu().numpy().clip(0, 255).astype(np.uint8)
+            print("1111")
+            results = [x_samples[i] for i in range(num_samples)]
+        return [detected_map] + results
+
+
+def create_control_sd():
+    # model_config = '/home/data2/yangsp22/code/ControlNet/models/cldm_v21.yaml'
+    # checkpoint_path = '/home/data2/yangsp22/code/finetune-output/sam-new/BDD-all/weights/lightning_logs/version_1/checkpoints/epoch=9-step=35139.ckpt'
+    
+    model_config = '/home/tmp/workspace/diffusion_app/backend/ControlNet/models/cldm_v21.yaml'
+    checkpoint_path = '/home/tmp/workspace/diffusion_app/backend/epoch=9-step=35139.ckpt'
+    
+    # model = create_model('/home/tmp/workspace/diffusion_app/backend/ControlNet/models/cldm_v21.yaml').cpu()
+    # model.load_state_dict(load_state_dict('/home/tmp/workspace/diffusion_app/backend/epoch=9-step=35139.ckpt', location='cuda'))
+    return ControlSD(model_config, checkpoint_path)
+
+
+control_sd_instance = create_control_sd()
+process = control_sd_instance.process
+
+
+# def create_gradio_interface(control_sd):
+#     block = gr.Blocks().queue()
+#     with block:
+#         with gr.Row():
+#             gr.Markdown("## Control Stable Diffusion with Segmentation Maps (Mask input)")
+#         with gr.Row():
+#             with gr.Column():
+#                 input_image = gr.Image(source='upload', type="numpy")
+#                 prompt = gr.Textbox(label="Prompt")
+#                 run_button = gr.Button(label="Run")
+#                 with gr.Accordion("Advanced options", open=False):
+#                     num_samples = gr.Slider(label="Images", minimum=1, maximum=12, value=1, step=1)
+#                     image_resolution = gr.Slider(label="Image Resolution", minimum=256, maximum=768, value=512, step=64)
+#                     strength = gr.Slider(label="Control Strength", minimum=0.0, maximum=2.0, value=1.0, step=0.01)
+#                     guess_mode = gr.Checkbox(label='Guess Mode', value=False)
+#                     detect_resolution = gr.Slider(label="Segmentation Resolution", minimum=128, maximum=1024, value=512, step=1)
+#                     ddim_steps = gr.Slider(label="Steps", minimum=1, maximum=100, value=20, step=1)
+#                     scale = gr.Slider(label="Guidance Scale", minimum=0.1, maximum=30.0, value=9.0, step=0.1)
+#                     seed = gr.Slider(label="Seed", minimum=-1, maximum=2147483647, step=1, randomize=True)
+#                     eta = gr.Number(label="eta (DDIM)", value=0.0)
+#                     a_prompt = gr.Textbox(label="Added Prompt", value='best quality, extremely detailed')
+#                     n_prompt = gr.Textbox(label="Negative Prompt",
+#                                           value='longbody, lowres, bad anatomy, bad hands, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality')
+#             with gr.Column():
+#                 result_gallery = gr.Gallery(label='Output', show_label=False, elem_id="gallery").style(grid=2, height='auto')
+
+#         ips = [input_image, prompt, a_prompt, n_prompt, num_samples, image_resolution, detect_resolution, ddim_steps, guess_mode, strength, scale, seed, eta]
+#         run_button.click(fn=control_sd.process, inputs=ips, outputs=[result_gallery])
+
+#     return block
+
+
+def main():
+    control_sd = create_control_sd()
+    block = create_gradio_interface(control_sd)
+    block.launch(server_name='0.0.0.0')
+
+
+if __name__ == "__main__":
+    main()
diff --git a/finetune/nohup.out b/finetune/nohup.out
new file mode 100644
index 0000000000..1b4e41d174
--- /dev/null
+++ b/finetune/nohup.out
@@ -0,0 +1,9456 @@
+GPU available: True, used: True
+TPU available: False, using: 0 TPU cores
+IPU available: False, using: 0 IPUs
+/home/yangsp22/.conda/envs/control/lib/python3.8/site-packages/pytorch_lightning/trainer/configuration_validator.py:118: UserWarning: You defined a `validation_step` but have no `val_dataloader`. Skipping val loop.
+  rank_zero_warn("You defined a `validation_step` but have no `val_dataloader`. Skipping val loop.")
+/home/yangsp22/.conda/envs/control/lib/python3.8/site-packages/pytorch_lightning/trainer/configuration_validator.py:280: LightningDeprecationWarning: Base `LightningModule.on_train_batch_start` hook signature has changed in v1.5. The `dataloader_idx` argument will be removed in v1.7.
+  rank_zero_deprecation(
+/home/yangsp22/.conda/envs/control/lib/python3.8/site-packages/pytorch_lightning/trainer/configuration_validator.py:287: LightningDeprecationWarning: Base `Callback.on_train_batch_end` hook signature has changed in v1.5. The `dataloader_idx` argument will be removed in v1.7.
+  rank_zero_deprecation(
+initializing distributed: GLOBAL_RANK: 0, MEMBER: 1/4
+initializing distributed: GLOBAL_RANK: 1, MEMBER: 2/4
+initializing distributed: GLOBAL_RANK: 2, MEMBER: 3/4
+initializing distributed: GLOBAL_RANK: 3, MEMBER: 4/4
+----------------------------------------------------------------------------------------------------
+distributed_backend=nccl
+All distributed processes registered. Starting with 4 processes
+----------------------------------------------------------------------------------------------------
+
+LOCAL_RANK: 2 - CUDA_VISIBLE_DEVICES: [2,4,6,7]
+LOCAL_RANK: 1 - CUDA_VISIBLE_DEVICES: [2,4,6,7]
+LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [2,4,6,7]
+LOCAL_RANK: 3 - CUDA_VISIBLE_DEVICES: [2,4,6,7]
+
+  | Name              | Type                   | Params
+-------------------------------------------------------------
+0 | model             | DiffusionWrapper       | 865 M 
+1 | first_stage_model | AutoencoderKL          | 83.7 M
+2 | cond_stage_model  | FrozenOpenCLIPEmbedder | 354 M 
+3 | control_model     | ControlNet             | 364 M 
+-------------------------------------------------------------
+1.2 B     Trainable params
+437 M     Non-trainable params
+1.7 B     Total params
+6,671.302 Total estimated model params size (MB)
+No module 'xformers'. Proceeding without it.
+ControlLDM: Running in eps-prediction mode
+DiffusionWrapper has 865.91 M params.
+making attention of type 'vanilla' with 512 in_channels
+Working with z of shape (1, 4, 32, 32) = 4096 dimensions.
+making attention of type 'vanilla' with 512 in_channels
+Loaded model config from [/home/data2/yangsp22/code/ControlNet/models/cldm_v21.yaml]
+Loaded state_dict from [/home/data2/yangsp22/code/ControlNet/models/control_sd21_ini.ckpt]
+Training: 0it [00:00, ?it/s]Training:   0%|          | 0/1208 [00:00<?, ?it/s]Epoch 0:   0%|          | 0/1208 [00:00<?, ?it/s] No module 'xformers'. Proceeding without it.
+ControlLDM: Running in eps-prediction mode
+DiffusionWrapper has 865.91 M params.
+making attention of type 'vanilla' with 512 in_channels
+Working with z of shape (1, 4, 32, 32) = 4096 dimensions.
+making attention of type 'vanilla' with 512 in_channels
+Loaded model config from [/home/data2/yangsp22/code/ControlNet/models/cldm_v21.yaml]
+Loaded state_dict from [/home/data2/yangsp22/code/ControlNet/models/control_sd21_ini.ckpt]
+No module 'xformers'. Proceeding without it.
+ControlLDM: Running in eps-prediction mode
+DiffusionWrapper has 865.91 M params.
+making attention of type 'vanilla' with 512 in_channels
+Working with z of shape (1, 4, 32, 32) = 4096 dimensions.
+making attention of type 'vanilla' with 512 in_channels
+Loaded model config from [/home/data2/yangsp22/code/ControlNet/models/cldm_v21.yaml]
+Loaded state_dict from [/home/data2/yangsp22/code/ControlNet/models/control_sd21_ini.ckpt]
+No module 'xformers'. Proceeding without it.
+ControlLDM: Running in eps-prediction mode
+DiffusionWrapper has 865.91 M params.
+making attention of type 'vanilla' with 512 in_channels
+Working with z of shape (1, 4, 32, 32) = 4096 dimensions.
+making attention of type 'vanilla' with 512 in_channels
+Loaded model config from [/home/data2/yangsp22/code/ControlNet/models/cldm_v21.yaml]
+Loaded state_dict from [/home/data2/yangsp22/code/ControlNet/models/control_sd21_ini.ckpt]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]/home/yangsp22/.conda/envs/control/lib/python3.8/site-packages/pytorch_lightning/utilities/data.py:56: UserWarning: Trying to infer the `batch_size` from an ambiguous collection. The batch size we found is 1. To avoid any miscalculations, use `self.log(..., batch_size=batch_size)`.
+  warning_cache.warn(
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.76it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.84it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.83it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.83it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.78it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.79it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.79it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.80it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.78it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.78it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.78it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.83it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.78it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.83it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.78it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.78it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.78it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.83it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.78it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.83it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.83it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]Epoch 0:   0%|          | 1/1208 [00:40<13:34:08, 40.47s/it]Epoch 0:   0%|          | 1/1208 [00:40<13:34:11, 40.47s/it, loss=0.0132, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=6.09e-5, train/loss_step=0.0132, global_step=0.000]Epoch 0:   0%|          | 2/1208 [00:41<6:57:11, 20.76s/it, loss=0.0132, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=6.09e-5, train/loss_step=0.0132, global_step=0.000] Epoch 0:   0%|          | 2/1208 [00:41<6:57:12, 20.76s/it, loss=0.0673, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.0004, train/loss_step=0.121, global_step=0.000]   Epoch 0:   0%|          | 3/1208 [00:42<4:44:49, 14.18s/it, loss=0.0673, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.0004, train/loss_step=0.121, global_step=0.000]Epoch 0:   0%|          | 3/1208 [00:42<4:44:49, 14.18s/it, loss=0.116, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000764, train/loss_step=0.213, global_step=0.000]Epoch 0:   0%|          | 4/1208 [00:45<3:49:18, 11.43s/it, loss=0.116, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000764, train/loss_step=0.213, global_step=0.000]Epoch 0:   0%|          | 4/1208 [00:45<3:49:19, 11.43s/it, loss=0.0884, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=2.86e-5, train/loss_step=0.00545, global_step=0.000]Epoch 0:   0%|          | 5/1208 [00:46<3:07:48,  9.37s/it, loss=0.0884, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=2.86e-5, train/loss_step=0.00545, global_step=0.000]Epoch 0:   0%|          | 5/1208 [00:46<3:07:48,  9.37s/it, loss=0.0844, v_num=0, train/loss_simple_step=0.0687, train/loss_vlb_step=0.000238, train/loss_step=0.0687, global_step=1.000] Epoch 0:   0%|          | 6/1208 [00:47<2:39:56,  7.98s/it, loss=0.0844, v_num=0, train/loss_simple_step=0.0687, train/loss_vlb_step=0.000238, train/loss_step=0.0687, global_step=1.000]Epoch 0:   0%|          | 6/1208 [00:47<2:39:57,  7.98s/it, loss=0.223, v_num=0, train/loss_simple_step=0.917, train/loss_vlb_step=0.461, train/loss_step=0.917, global_step=1.000]      Epoch 0:   1%|          | 7/1208 [00:48<2:20:00,  6.99s/it, loss=0.223, v_num=0, train/loss_simple_step=0.917, train/loss_vlb_step=0.461, train/loss_step=0.917, global_step=1.000]Epoch 0:   1%|          | 7/1208 [00:48<2:20:00,  6.99s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.3e-5, train/loss_step=0.0112, global_step=1.000]Epoch 0:   1%|          | 8/1208 [00:52<2:10:25,  6.52s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.3e-5, train/loss_step=0.0112, global_step=1.000]Epoch 0:   1%|          | 8/1208 [00:52<2:10:26,  6.52s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=1.47e-5, train/loss_step=0.00243, global_step=1.000]Epoch 0:   1%|          | 9/1208 [00:53<1:58:14,  5.92s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=1.47e-5, train/loss_step=0.00243, global_step=1.000]Epoch 0:   1%|          | 9/1208 [00:53<1:58:14,  5.92s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000124, train/loss_step=0.0337, global_step=2.000] Epoch 0:   1%|          | 10/1208 [00:54<1:48:25,  5.43s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000124, train/loss_step=0.0337, global_step=2.000]Epoch 0:   1%|          | 10/1208 [00:54<1:48:26,  5.43s/it, loss=0.151, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000399, train/loss_step=0.121, global_step=2.000]  Epoch 0:   1%|          | 11/1208 [00:55<1:40:21,  5.03s/it, loss=0.151, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000399, train/loss_step=0.121, global_step=2.000]Epoch 0:   1%|          | 11/1208 [00:55<1:40:21,  5.03s/it, loss=0.148, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000384, train/loss_step=0.116, global_step=2.000]Epoch 0:   1%|          | 12/1208 [00:58<1:37:20,  4.88s/it, loss=0.148, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000384, train/loss_step=0.116, global_step=2.000]Epoch 0:   1%|          | 12/1208 [00:58<1:37:20,  4.88s/it, loss=0.144, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=2.000]Epoch 0:   1%|          | 13/1208 [00:59<1:31:27,  4.59s/it, loss=0.144, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=2.000]Epoch 0:   1%|          | 13/1208 [00:59<1:31:27,  4.59s/it, loss=0.153, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00102, train/loss_step=0.265, global_step=3.000] Epoch 0:   1%|          | 14/1208 [01:00<1:26:23,  4.34s/it, loss=0.153, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00102, train/loss_step=0.265, global_step=3.000]Epoch 0:   1%|          | 14/1208 [01:00<1:26:23,  4.34s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=6.03e-5, train/loss_step=0.0132, global_step=3.000]Epoch 0:   1%|          | 15/1208 [01:01<1:21:59,  4.12s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=6.03e-5, train/loss_step=0.0132, global_step=3.000]Epoch 0:   1%|          | 15/1208 [01:01<1:21:59,  4.12s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0668, train/loss_vlb_step=0.000225, train/loss_step=0.0668, global_step=3.000]Epoch 0:   1%|▏         | 16/1208 [01:05<1:20:42,  4.06s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0668, train/loss_vlb_step=0.000225, train/loss_step=0.0668, global_step=3.000]Epoch 0:   1%|▏         | 16/1208 [01:05<1:20:43,  4.06s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.000141, train/loss_step=0.0395, global_step=3.000]Epoch 0:   1%|▏         | 17/1208 [01:06<1:17:10,  3.89s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.000141, train/loss_step=0.0395, global_step=3.000]Epoch 0:   1%|▏         | 17/1208 [01:06<1:17:10,  3.89s/it, loss=0.156, v_num=0, train/loss_simple_step=0.545, train/loss_vlb_step=0.0139, train/loss_step=0.545, global_step=4.000]    Epoch 0:   1%|▏         | 18/1208 [01:07<1:13:59,  3.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.545, train/loss_vlb_step=0.0139, train/loss_step=0.545, global_step=4.000]Epoch 0:   1%|▏         | 18/1208 [01:07<1:13:59,  3.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=8.16e-5, train/loss_step=0.0188, global_step=4.000]Epoch 0:   2%|▏         | 19/1208 [01:08<1:11:08,  3.59s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=8.16e-5, train/loss_step=0.0188, global_step=4.000]Epoch 0:   2%|▏         | 19/1208 [01:08<1:11:09,  3.59s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00844, train/loss_vlb_step=4.19e-5, train/loss_step=0.00844, global_step=4.000]Epoch 0:   2%|▏         | 20/1208 [01:11<1:10:41,  3.57s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00844, train/loss_vlb_step=4.19e-5, train/loss_step=0.00844, global_step=4.000]Epoch 0:   2%|▏         | 20/1208 [01:11<1:10:41,  3.57s/it, loss=0.154, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00292, train/loss_step=0.389, global_step=4.000]    Epoch 0:   2%|▏         | 21/1208 [01:12<1:08:17,  3.45s/it, loss=0.154, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00292, train/loss_step=0.389, global_step=4.000]Epoch 0:   2%|▏         | 21/1208 [01:12<1:08:17,  3.45s/it, loss=0.168, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00123, train/loss_step=0.290, global_step=5.000]Epoch 0:   2%|▏         | 22/1208 [01:13<1:06:05,  3.34s/it, loss=0.168, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00123, train/loss_step=0.290, global_step=5.000]Epoch 0:   2%|▏         | 22/1208 [01:13<1:06:05,  3.34s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=1.79e-5, train/loss_step=0.00315, global_step=5.000]Epoch 0:   2%|▏         | 23/1208 [01:14<1:04:03,  3.24s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=1.79e-5, train/loss_step=0.00315, global_step=5.000]Epoch 0:   2%|▏         | 23/1208 [01:14<1:04:03,  3.24s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00873, train/loss_vlb_step=4.25e-5, train/loss_step=0.00873, global_step=5.000]Epoch 0:   2%|▏         | 24/1208 [01:17<1:03:58,  3.24s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00873, train/loss_vlb_step=4.25e-5, train/loss_step=0.00873, global_step=5.000]Epoch 0:   2%|▏         | 24/1208 [01:17<1:03:58,  3.24s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00565, train/loss_vlb_step=3.12e-5, train/loss_step=0.00565, global_step=5.000]Epoch 0:   2%|▏         | 25/1208 [01:18<1:02:13,  3.16s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00565, train/loss_vlb_step=3.12e-5, train/loss_step=0.00565, global_step=5.000]Epoch 0:   2%|▏         | 25/1208 [01:18<1:02:14,  3.16s/it, loss=0.149, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.28e-5, train/loss_step=0.011, global_step=6.000]    Epoch 0:   2%|▏         | 26/1208 [01:19<1:00:35,  3.08s/it, loss=0.149, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.28e-5, train/loss_step=0.011, global_step=6.000]Epoch 0:   2%|▏         | 26/1208 [01:19<1:00:35,  3.08s/it, loss=0.106, v_num=0, train/loss_simple_step=0.061, train/loss_vlb_step=0.000219, train/loss_step=0.061, global_step=6.000]Epoch 0:   2%|▏         | 27/1208 [01:21<59:04,  3.00s/it, loss=0.106, v_num=0, train/loss_simple_step=0.061, train/loss_vlb_step=0.000219, train/loss_step=0.061, global_step=6.000]  Epoch 0:   2%|▏         | 27/1208 [01:21<59:04,  3.00s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0528, train/loss_vlb_step=0.000191, train/loss_step=0.0528, global_step=6.000]Epoch 0:   2%|▏         | 28/1208 [01:24<59:09,  3.01s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0528, train/loss_vlb_step=0.000191, train/loss_step=0.0528, global_step=6.000]Epoch 0:   2%|▏         | 28/1208 [01:24<59:10,  3.01s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.78e-5, train/loss_step=0.0032, global_step=6.000] Epoch 0:   2%|▏         | 29/1208 [01:25<57:48,  2.94s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.78e-5, train/loss_step=0.0032, global_step=6.000]Epoch 0:   2%|▏         | 29/1208 [01:25<57:48,  2.94s/it, loss=0.119, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00102, train/loss_step=0.252, global_step=7.000]  Epoch 0:   2%|▏         | 30/1208 [01:26<56:30,  2.88s/it, loss=0.119, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00102, train/loss_step=0.252, global_step=7.000]Epoch 0:   2%|▏         | 30/1208 [01:26<56:30,  2.88s/it, loss=0.134, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00362, train/loss_step=0.423, global_step=7.000]Epoch 0:   3%|▎         | 31/1208 [01:27<55:19,  2.82s/it, loss=0.134, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00362, train/loss_step=0.423, global_step=7.000]Epoch 0:   3%|▎         | 31/1208 [01:27<55:19,  2.82s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0571, train/loss_vlb_step=0.000189, train/loss_step=0.0571, global_step=7.000]Epoch 0:   3%|▎         | 32/1208 [01:30<55:31,  2.83s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0571, train/loss_vlb_step=0.000189, train/loss_step=0.0571, global_step=7.000]Epoch 0:   3%|▎         | 32/1208 [01:30<55:31,  2.83s/it, loss=0.149, v_num=0, train/loss_simple_step=0.464, train/loss_vlb_step=0.00427, train/loss_step=0.464, global_step=7.000]   Epoch 0:   3%|▎         | 33/1208 [01:31<54:25,  2.78s/it, loss=0.149, v_num=0, train/loss_simple_step=0.464, train/loss_vlb_step=0.00427, train/loss_step=0.464, global_step=7.000]Epoch 0:   3%|▎         | 33/1208 [01:31<54:25,  2.78s/it, loss=0.146, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000752, train/loss_step=0.206, global_step=8.000]Epoch 0:   3%|▎         | 34/1208 [01:32<53:22,  2.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000752, train/loss_step=0.206, global_step=8.000]Epoch 0:   3%|▎         | 34/1208 [01:32<53:22,  2.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.562, train/loss_vlb_step=0.00612, train/loss_step=0.562, global_step=8.000] Epoch 0:   3%|▎         | 35/1208 [01:33<52:23,  2.68s/it, loss=0.173, v_num=0, train/loss_simple_step=0.562, train/loss_vlb_step=0.00612, train/loss_step=0.562, global_step=8.000]Epoch 0:   3%|▎         | 35/1208 [01:33<52:24,  2.68s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=2.65e-5, train/loss_step=0.00495, global_step=8.000]Epoch 0:   3%|▎         | 36/1208 [01:37<52:40,  2.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=2.65e-5, train/loss_step=0.00495, global_step=8.000]Epoch 0:   3%|▎         | 36/1208 [01:37<52:40,  2.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00213, train/loss_step=0.359, global_step=8.000]   Epoch 0:   3%|▎         | 37/1208 [01:38<51:47,  2.65s/it, loss=0.186, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00213, train/loss_step=0.359, global_step=8.000]Epoch 0:   3%|▎         | 37/1208 [01:38<51:47,  2.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0433, train/loss_vlb_step=0.000165, train/loss_step=0.0433, global_step=9.000]Epoch 0:   3%|▎         | 38/1208 [01:39<50:54,  2.61s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0433, train/loss_vlb_step=0.000165, train/loss_step=0.0433, global_step=9.000]Epoch 0:   3%|▎         | 38/1208 [01:39<50:55,  2.61s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0044, train/loss_vlb_step=2.35e-5, train/loss_step=0.0044, global_step=9.000]  Epoch 0:   3%|▎         | 39/1208 [01:40<50:05,  2.57s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0044, train/loss_vlb_step=2.35e-5, train/loss_step=0.0044, global_step=9.000]Epoch 0:   3%|▎         | 39/1208 [01:40<50:05,  2.57s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00435, train/loss_vlb_step=2.37e-5, train/loss_step=0.00435, global_step=9.000]Epoch 0:   3%|▎         | 40/1208 [01:43<50:21,  2.59s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00435, train/loss_vlb_step=2.37e-5, train/loss_step=0.00435, global_step=9.000]Epoch 0:   3%|▎         | 40/1208 [01:43<50:21,  2.59s/it, loss=0.156, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00143, train/loss_step=0.313, global_step=9.000]   Epoch 0:   3%|▎         | 41/1208 [01:44<49:36,  2.55s/it, loss=0.156, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00143, train/loss_step=0.313, global_step=9.000]Epoch 0:   3%|▎         | 41/1208 [01:44<49:36,  2.55s/it, loss=0.161, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00223, train/loss_step=0.375, global_step=10.00]Epoch 0:   3%|▎         | 42/1208 [01:45<48:51,  2.51s/it, loss=0.161, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00223, train/loss_step=0.375, global_step=10.00]Epoch 0:   3%|▎         | 42/1208 [01:45<48:51,  2.51s/it, loss=0.183, v_num=0, train/loss_simple_step=0.449, train/loss_vlb_step=0.00481, train/loss_step=0.449, global_step=10.00]Epoch 0:   4%|▎         | 43/1208 [01:46<48:09,  2.48s/it, loss=0.183, v_num=0, train/loss_simple_step=0.449, train/loss_vlb_step=0.00481, train/loss_step=0.449, global_step=10.00]Epoch 0:   4%|▎         | 43/1208 [01:46<48:09,  2.48s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000133, train/loss_step=0.0328, global_step=10.00]Epoch 0:   4%|▎         | 44/1208 [01:49<48:26,  2.50s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000133, train/loss_step=0.0328, global_step=10.00]Epoch 0:   4%|▎         | 44/1208 [01:49<48:26,  2.50s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=9.56e-5, train/loss_step=0.0217, global_step=10.00] Epoch 0:   4%|▎         | 45/1208 [01:50<47:47,  2.47s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=9.56e-5, train/loss_step=0.0217, global_step=10.00]Epoch 0:   4%|▎         | 45/1208 [01:50<47:47,  2.47s/it, loss=0.186, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000131, train/loss_step=0.035, global_step=11.00] Epoch 0:   4%|▍         | 46/1208 [01:51<47:08,  2.43s/it, loss=0.186, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000131, train/loss_step=0.035, global_step=11.00]Epoch 0:   4%|▍         | 46/1208 [01:51<47:08,  2.43s/it, loss=0.189, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000398, train/loss_step=0.121, global_step=11.00]Epoch 0:   4%|▍         | 47/1208 [01:53<46:31,  2.40s/it, loss=0.189, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000398, train/loss_step=0.121, global_step=11.00]Epoch 0:   4%|▍         | 47/1208 [01:53<46:31,  2.40s/it, loss=0.187, v_num=0, train/loss_simple_step=0.00447, train/loss_vlb_step=2.43e-5, train/loss_step=0.00447, global_step=11.00]Epoch 0:   4%|▍         | 48/1208 [01:56<46:50,  2.42s/it, loss=0.187, v_num=0, train/loss_simple_step=0.00447, train/loss_vlb_step=2.43e-5, train/loss_step=0.00447, global_step=11.00]Epoch 0:   4%|▍         | 48/1208 [01:56<46:50,  2.42s/it, loss=0.211, v_num=0, train/loss_simple_step=0.487, train/loss_vlb_step=0.00539, train/loss_step=0.487, global_step=11.00]    Epoch 0:   4%|▍         | 49/1208 [01:57<46:15,  2.39s/it, loss=0.211, v_num=0, train/loss_simple_step=0.487, train/loss_vlb_step=0.00539, train/loss_step=0.487, global_step=11.00]Epoch 0:   4%|▍         | 49/1208 [01:57<46:15,  2.39s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0599, train/loss_vlb_step=0.000212, train/loss_step=0.0599, global_step=12.00]Epoch 0:   4%|▍         | 50/1208 [01:58<45:41,  2.37s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0599, train/loss_vlb_step=0.000212, train/loss_step=0.0599, global_step=12.00]Epoch 0:   4%|▍         | 50/1208 [01:58<45:41,  2.37s/it, loss=0.198, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.00275, train/loss_step=0.360, global_step=12.00]   Epoch 0:   4%|▍         | 51/1208 [01:59<45:09,  2.34s/it, loss=0.198, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.00275, train/loss_step=0.360, global_step=12.00]Epoch 0:   4%|▍         | 51/1208 [01:59<45:09,  2.34s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00896, train/loss_vlb_step=4.36e-5, train/loss_step=0.00896, global_step=12.00]Epoch 0:   4%|▍         | 52/1208 [02:02<45:27,  2.36s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00896, train/loss_vlb_step=4.36e-5, train/loss_step=0.00896, global_step=12.00]Epoch 0:   4%|▍         | 52/1208 [02:02<45:27,  2.36s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.28e-5, train/loss_step=0.00423, global_step=12.00]Epoch 0:   4%|▍         | 53/1208 [02:03<44:57,  2.34s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.28e-5, train/loss_step=0.00423, global_step=12.00]Epoch 0:   4%|▍         | 53/1208 [02:03<44:57,  2.34s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000229, train/loss_step=0.0676, global_step=13.00] Epoch 0:   4%|▍         | 54/1208 [02:04<44:27,  2.31s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000229, train/loss_step=0.0676, global_step=13.00]Epoch 0:   4%|▍         | 54/1208 [02:04<44:27,  2.31s/it, loss=0.144, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000399, train/loss_step=0.121, global_step=13.00]  Epoch 0:   5%|▍         | 55/1208 [02:05<43:57,  2.29s/it, loss=0.144, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000399, train/loss_step=0.121, global_step=13.00]Epoch 0:   5%|▍         | 55/1208 [02:05<43:57,  2.29s/it, loss=0.154, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000752, train/loss_step=0.216, global_step=13.00]Epoch 0:   5%|▍         | 56/1208 [02:09<44:16,  2.31s/it, loss=0.154, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000752, train/loss_step=0.216, global_step=13.00]Epoch 0:   5%|▍         | 56/1208 [02:09<44:16,  2.31s/it, loss=0.138, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=9.07e-5, train/loss_step=0.021, global_step=13.00] Epoch 0:   5%|▍         | 57/1208 [02:10<43:49,  2.28s/it, loss=0.138, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=9.07e-5, train/loss_step=0.021, global_step=13.00]Epoch 0:   5%|▍         | 57/1208 [02:10<43:49,  2.28s/it, loss=0.17, v_num=0, train/loss_simple_step=0.694, train/loss_vlb_step=0.0328, train/loss_step=0.694, global_step=14.00]  Epoch 0:   5%|▍         | 58/1208 [02:11<43:22,  2.26s/it, loss=0.17, v_num=0, train/loss_simple_step=0.694, train/loss_vlb_step=0.0328, train/loss_step=0.694, global_step=14.00]Epoch 0:   5%|▍         | 58/1208 [02:11<43:22,  2.26s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.39e-5, train/loss_step=0.0119, global_step=14.00]Epoch 0:   5%|▍         | 59/1208 [02:12<42:55,  2.24s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.39e-5, train/loss_step=0.0119, global_step=14.00]Epoch 0:   5%|▍         | 59/1208 [02:12<42:55,  2.24s/it, loss=0.18, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000732, train/loss_step=0.203, global_step=14.00] Epoch 0:   5%|▍         | 60/1208 [02:15<43:13,  2.26s/it, loss=0.18, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000732, train/loss_step=0.203, global_step=14.00]Epoch 0:   5%|▍         | 60/1208 [02:15<43:13,  2.26s/it, loss=0.174, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000677, train/loss_step=0.194, global_step=14.00]Epoch 0:   5%|▌         | 61/1208 [02:16<42:48,  2.24s/it, loss=0.174, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000677, train/loss_step=0.194, global_step=14.00]Epoch 0:   5%|▌         | 61/1208 [02:16<42:48,  2.24s/it, loss=0.178, v_num=0, train/loss_simple_step=0.444, train/loss_vlb_step=0.00278, train/loss_step=0.444, global_step=15.00] Epoch 0:   5%|▌         | 62/1208 [02:17<42:24,  2.22s/it, loss=0.178, v_num=0, train/loss_simple_step=0.444, train/loss_vlb_step=0.00278, train/loss_step=0.444, global_step=15.00]Epoch 0:   5%|▌         | 62/1208 [02:17<42:24,  2.22s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.61e-5, train/loss_step=0.0155, global_step=15.00]Epoch 0:   5%|▌         | 63/1208 [02:18<42:01,  2.20s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.61e-5, train/loss_step=0.0155, global_step=15.00]Epoch 0:   5%|▌         | 63/1208 [02:18<42:01,  2.20s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.75e-5, train/loss_step=0.0203, global_step=15.00]Epoch 0:   5%|▌         | 64/1208 [02:21<42:17,  2.22s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.75e-5, train/loss_step=0.0203, global_step=15.00]Epoch 0:   5%|▌         | 64/1208 [02:21<42:17,  2.22s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.5e-5, train/loss_step=0.0169, global_step=15.00] Epoch 0:   5%|▌         | 65/1208 [02:23<41:55,  2.20s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.5e-5, train/loss_step=0.0169, global_step=15.00]Epoch 0:   5%|▌         | 65/1208 [02:23<41:55,  2.20s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0315, train/loss_vlb_step=0.000118, train/loss_step=0.0315, global_step=16.00]Epoch 0:   5%|▌         | 66/1208 [02:24<41:33,  2.18s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0315, train/loss_vlb_step=0.000118, train/loss_step=0.0315, global_step=16.00]Epoch 0:   5%|▌         | 66/1208 [02:24<41:33,  2.18s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000132, train/loss_step=0.0345, global_step=16.00]Epoch 0:   6%|▌         | 67/1208 [02:25<41:12,  2.17s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000132, train/loss_step=0.0345, global_step=16.00]Epoch 0:   6%|▌         | 67/1208 [02:25<41:12,  2.17s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0743, train/loss_vlb_step=0.000256, train/loss_step=0.0743, global_step=16.00]Epoch 0:   6%|▌         | 68/1208 [02:28<41:27,  2.18s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0743, train/loss_vlb_step=0.000256, train/loss_step=0.0743, global_step=16.00]Epoch 0:   6%|▌         | 68/1208 [02:28<41:27,  2.18s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.000111, train/loss_step=0.0285, global_step=16.00]Epoch 0:   6%|▌         | 69/1208 [02:29<41:07,  2.17s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.000111, train/loss_step=0.0285, global_step=16.00]Epoch 0:   6%|▌         | 69/1208 [02:29<41:07,  2.17s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0099, train/loss_vlb_step=4.83e-5, train/loss_step=0.0099, global_step=17.00] Epoch 0:   6%|▌         | 70/1208 [02:30<40:46,  2.15s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0099, train/loss_vlb_step=4.83e-5, train/loss_step=0.0099, global_step=17.00]Epoch 0:   6%|▌         | 70/1208 [02:30<40:46,  2.15s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00387, train/loss_vlb_step=2.15e-5, train/loss_step=0.00387, global_step=17.00]Epoch 0:   6%|▌         | 71/1208 [02:31<40:26,  2.13s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00387, train/loss_vlb_step=2.15e-5, train/loss_step=0.00387, global_step=17.00]Epoch 0:   6%|▌         | 71/1208 [02:31<40:26,  2.13s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.98e-5, train/loss_step=0.00349, global_step=17.00]Epoch 0:   6%|▌         | 72/1208 [02:34<40:42,  2.15s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.98e-5, train/loss_step=0.00349, global_step=17.00]Epoch 0:   6%|▌         | 72/1208 [02:34<40:42,  2.15s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1.35e-5, train/loss_step=0.00226, global_step=17.00]Epoch 0:   6%|▌         | 73/1208 [02:35<40:23,  2.14s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1.35e-5, train/loss_step=0.00226, global_step=17.00]Epoch 0:   6%|▌         | 73/1208 [02:35<40:23,  2.14s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=2.24e-5, train/loss_step=0.00407, global_step=18.00]Epoch 0:   6%|▌         | 74/1208 [02:36<40:05,  2.12s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=2.24e-5, train/loss_step=0.00407, global_step=18.00]Epoch 0:   6%|▌         | 74/1208 [02:36<40:05,  2.12s/it, loss=0.111, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000681, train/loss_step=0.192, global_step=18.00]   Epoch 0:   6%|▌         | 75/1208 [02:38<39:47,  2.11s/it, loss=0.111, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000681, train/loss_step=0.192, global_step=18.00]Epoch 0:   6%|▌         | 75/1208 [02:38<39:47,  2.11s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0516, train/loss_vlb_step=0.000189, train/loss_step=0.0516, global_step=18.00]Epoch 0:   6%|▋         | 76/1208 [02:41<40:01,  2.12s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0516, train/loss_vlb_step=0.000189, train/loss_step=0.0516, global_step=18.00]Epoch 0:   6%|▋         | 76/1208 [02:41<40:01,  2.12s/it, loss=0.122, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.003, train/loss_step=0.396, global_step=18.00]     Epoch 0:   6%|▋         | 77/1208 [02:42<39:43,  2.11s/it, loss=0.122, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.003, train/loss_step=0.396, global_step=18.00]Epoch 0:   6%|▋         | 77/1208 [02:42<39:43,  2.11s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000782, train/loss_step=0.200, global_step=19.00]Epoch 0:   6%|▋         | 78/1208 [02:43<39:27,  2.09s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000782, train/loss_step=0.200, global_step=19.00]Epoch 0:   6%|▋         | 78/1208 [02:43<39:27,  2.09s/it, loss=0.102, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000401, train/loss_step=0.122, global_step=19.00] Epoch 0:   7%|▋         | 79/1208 [02:44<39:10,  2.08s/it, loss=0.102, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000401, train/loss_step=0.122, global_step=19.00]Epoch 0:   7%|▋         | 79/1208 [02:44<39:10,  2.08s/it, loss=0.112, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00287, train/loss_step=0.399, global_step=19.00] Epoch 0:   7%|▋         | 80/1208 [02:47<39:24,  2.10s/it, loss=0.112, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00287, train/loss_step=0.399, global_step=19.00]Epoch 0:   7%|▋         | 80/1208 [02:47<39:24,  2.10s/it, loss=0.111, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000543, train/loss_step=0.165, global_step=19.00]Epoch 0:   7%|▋         | 81/1208 [02:48<39:07,  2.08s/it, loss=0.111, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000543, train/loss_step=0.165, global_step=19.00]Epoch 0:   7%|▋         | 81/1208 [02:48<39:07,  2.08s/it, loss=0.0907, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000174, train/loss_step=0.0457, global_step=20.00]Epoch 0:   7%|▋         | 82/1208 [02:49<38:51,  2.07s/it, loss=0.0907, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000174, train/loss_step=0.0457, global_step=20.00]Epoch 0:   7%|▋         | 82/1208 [02:49<38:51,  2.07s/it, loss=0.0903, v_num=0, train/loss_simple_step=0.00681, train/loss_vlb_step=3.44e-5, train/loss_step=0.00681, global_step=20.00]Epoch 0:   7%|▋         | 83/1208 [02:50<38:35,  2.06s/it, loss=0.0903, v_num=0, train/loss_simple_step=0.00681, train/loss_vlb_step=3.44e-5, train/loss_step=0.00681, global_step=20.00]Epoch 0:   7%|▋         | 83/1208 [02:50<38:35,  2.06s/it, loss=0.108, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.00181, train/loss_step=0.382, global_step=20.00]     Epoch 0:   7%|▋         | 84/1208 [02:54<38:50,  2.07s/it, loss=0.108, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.00181, train/loss_step=0.382, global_step=20.00]Epoch 0:   7%|▋         | 84/1208 [02:54<38:50,  2.07s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0684, train/loss_vlb_step=0.000231, train/loss_step=0.0684, global_step=20.00]Epoch 0:   7%|▋         | 85/1208 [02:55<38:35,  2.06s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0684, train/loss_vlb_step=0.000231, train/loss_step=0.0684, global_step=20.00]Epoch 0:   7%|▋         | 85/1208 [02:55<38:35,  2.06s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0782, train/loss_vlb_step=0.00026, train/loss_step=0.0782, global_step=21.00] Epoch 0:   7%|▋         | 86/1208 [02:56<38:19,  2.05s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0782, train/loss_vlb_step=0.00026, train/loss_step=0.0782, global_step=21.00]Epoch 0:   7%|▋         | 86/1208 [02:56<38:19,  2.05s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00796, train/loss_vlb_step=3.94e-5, train/loss_step=0.00796, global_step=21.00]Epoch 0:   7%|▋         | 87/1208 [02:57<38:05,  2.04s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00796, train/loss_vlb_step=3.94e-5, train/loss_step=0.00796, global_step=21.00]Epoch 0:   7%|▋         | 87/1208 [02:57<38:05,  2.04s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0491, train/loss_vlb_step=0.000174, train/loss_step=0.0491, global_step=21.00] Epoch 0:   7%|▋         | 88/1208 [03:00<38:18,  2.05s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0491, train/loss_vlb_step=0.000174, train/loss_step=0.0491, global_step=21.00]Epoch 0:   7%|▋         | 88/1208 [03:00<38:18,  2.05s/it, loss=0.115, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=21.00]  Epoch 0:   7%|▋         | 89/1208 [03:01<38:04,  2.04s/it, loss=0.115, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=21.00]Epoch 0:   7%|▋         | 89/1208 [03:01<38:04,  2.04s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0783, train/loss_vlb_step=0.000263, train/loss_step=0.0783, global_step=22.00]Epoch 0:   7%|▋         | 90/1208 [03:02<37:49,  2.03s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0783, train/loss_vlb_step=0.000263, train/loss_step=0.0783, global_step=22.00]Epoch 0:   7%|▋         | 90/1208 [03:02<37:49,  2.03s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0685, train/loss_vlb_step=0.000239, train/loss_step=0.0685, global_step=22.00]Epoch 0:   8%|▊         | 91/1208 [03:03<37:35,  2.02s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0685, train/loss_vlb_step=0.000239, train/loss_step=0.0685, global_step=22.00]Epoch 0:   8%|▊         | 91/1208 [03:03<37:35,  2.02s/it, loss=0.132, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.00074, train/loss_step=0.211, global_step=22.00]   Epoch 0:   8%|▊         | 92/1208 [03:07<37:48,  2.03s/it, loss=0.132, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.00074, train/loss_step=0.211, global_step=22.00]Epoch 0:   8%|▊         | 92/1208 [03:07<37:49,  2.03s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=0.0001, train/loss_step=0.0259, global_step=22.00]Epoch 0:   8%|▊         | 93/1208 [03:08<37:35,  2.02s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=0.0001, train/loss_step=0.0259, global_step=22.00]Epoch 0:   8%|▊         | 93/1208 [03:08<37:35,  2.02s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0642, train/loss_vlb_step=0.000217, train/loss_step=0.0642, global_step=23.00]Epoch 0:   8%|▊         | 94/1208 [03:09<37:21,  2.01s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0642, train/loss_vlb_step=0.000217, train/loss_step=0.0642, global_step=23.00]Epoch 0:   8%|▊         | 94/1208 [03:09<37:21,  2.01s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00977, train/loss_vlb_step=4.68e-5, train/loss_step=0.00977, global_step=23.00]Epoch 0:   8%|▊         | 95/1208 [03:10<37:08,  2.00s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00977, train/loss_vlb_step=4.68e-5, train/loss_step=0.00977, global_step=23.00]Epoch 0:   8%|▊         | 95/1208 [03:10<37:08,  2.00s/it, loss=0.137, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000932, train/loss_step=0.240, global_step=23.00]   Epoch 0:   8%|▊         | 96/1208 [03:13<37:21,  2.02s/it, loss=0.137, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000932, train/loss_step=0.240, global_step=23.00]Epoch 0:   8%|▊         | 96/1208 [03:13<37:21,  2.02s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.88e-5, train/loss_step=0.0212, global_step=23.00]Epoch 0:   8%|▊         | 97/1208 [03:14<37:08,  2.01s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.88e-5, train/loss_step=0.0212, global_step=23.00]Epoch 0:   8%|▊         | 97/1208 [03:14<37:08,  2.01s/it, loss=0.13, v_num=0, train/loss_simple_step=0.443, train/loss_vlb_step=0.00308, train/loss_step=0.443, global_step=24.00]   Epoch 0:   8%|▊         | 98/1208 [03:15<36:55,  2.00s/it, loss=0.13, v_num=0, train/loss_simple_step=0.443, train/loss_vlb_step=0.00308, train/loss_step=0.443, global_step=24.00]Epoch 0:   8%|▊         | 98/1208 [03:15<36:55,  2.00s/it, loss=0.125, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=7.06e-5, train/loss_step=0.016, global_step=24.00]Epoch 0:   8%|▊         | 99/1208 [03:16<36:43,  1.99s/it, loss=0.125, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=7.06e-5, train/loss_step=0.016, global_step=24.00]Epoch 0:   8%|▊         | 99/1208 [03:16<36:43,  1.99s/it, loss=0.126, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00265, train/loss_step=0.432, global_step=24.00]Epoch 0:   8%|▊         | 100/1208 [03:19<36:55,  2.00s/it, loss=0.126, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00265, train/loss_step=0.432, global_step=24.00]Epoch 0:   8%|▊         | 100/1208 [03:19<36:55,  2.00s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0074, train/loss_vlb_step=3.79e-5, train/loss_step=0.0074, global_step=24.00]Epoch 0:   8%|▊         | 101/1208 [03:21<36:43,  1.99s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0074, train/loss_vlb_step=3.79e-5, train/loss_step=0.0074, global_step=24.00]Epoch 0:   8%|▊         | 101/1208 [03:21<36:43,  1.99s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0593, train/loss_vlb_step=0.000207, train/loss_step=0.0593, global_step=25.00]Epoch 0:   8%|▊         | 102/1208 [03:22<36:30,  1.98s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0593, train/loss_vlb_step=0.000207, train/loss_step=0.0593, global_step=25.00]Epoch 0:   8%|▊         | 102/1208 [03:22<36:30,  1.98s/it, loss=0.138, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00261, train/loss_step=0.379, global_step=25.00]   Epoch 0:   9%|▊         | 103/1208 [03:23<36:18,  1.97s/it, loss=0.138, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00261, train/loss_step=0.379, global_step=25.00]Epoch 0:   9%|▊         | 103/1208 [03:23<36:18,  1.97s/it, loss=0.136, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00182, train/loss_step=0.338, global_step=25.00]Epoch 0:   9%|▊         | 104/1208 [03:26<36:30,  1.98s/it, loss=0.136, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00182, train/loss_step=0.338, global_step=25.00]Epoch 0:   9%|▊         | 104/1208 [03:26<36:30,  1.98s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.000193, train/loss_step=0.0537, global_step=25.00]Epoch 0:   9%|▊         | 105/1208 [03:27<36:18,  1.98s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.000193, train/loss_step=0.0537, global_step=25.00]Epoch 0:   9%|▊         | 105/1208 [03:27<36:18,  1.98s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000123, train/loss_step=0.0309, global_step=26.00]Epoch 0:   9%|▉         | 106/1208 [03:28<36:07,  1.97s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000123, train/loss_step=0.0309, global_step=26.00]Epoch 0:   9%|▉         | 106/1208 [03:28<36:07,  1.97s/it, loss=0.139, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000453, train/loss_step=0.137, global_step=26.00]  Epoch 0:   9%|▉         | 107/1208 [03:29<35:56,  1.96s/it, loss=0.139, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000453, train/loss_step=0.137, global_step=26.00]Epoch 0:   9%|▉         | 107/1208 [03:29<35:56,  1.96s/it, loss=0.146, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000787, train/loss_step=0.199, global_step=26.00]Epoch 0:   9%|▉         | 108/1208 [03:32<36:07,  1.97s/it, loss=0.146, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000787, train/loss_step=0.199, global_step=26.00]Epoch 0:   9%|▉         | 108/1208 [03:32<36:07,  1.97s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.25e-5, train/loss_step=0.0139, global_step=26.00]Epoch 0:   9%|▉         | 109/1208 [03:33<35:56,  1.96s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.25e-5, train/loss_step=0.0139, global_step=26.00]Epoch 0:   9%|▉         | 109/1208 [03:33<35:56,  1.96s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0323, train/loss_vlb_step=0.000126, train/loss_step=0.0323, global_step=27.00]Epoch 0:   9%|▉         | 110/1208 [03:34<35:45,  1.95s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0323, train/loss_vlb_step=0.000126, train/loss_step=0.0323, global_step=27.00]Epoch 0:   9%|▉         | 110/1208 [03:34<35:45,  1.95s/it, loss=0.147, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.0012, train/loss_step=0.230, global_step=27.00]    Epoch 0:   9%|▉         | 111/1208 [03:36<35:35,  1.95s/it, loss=0.147, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.0012, train/loss_step=0.230, global_step=27.00]Epoch 0:   9%|▉         | 111/1208 [03:36<35:35,  1.95s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0767, train/loss_vlb_step=0.000261, train/loss_step=0.0767, global_step=27.00]Epoch 0:   9%|▉         | 112/1208 [03:39<35:45,  1.96s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0767, train/loss_vlb_step=0.000261, train/loss_step=0.0767, global_step=27.00]Epoch 0:   9%|▉         | 112/1208 [03:39<35:46,  1.96s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=2.5e-5, train/loss_step=0.00452, global_step=27.00]Epoch 0:   9%|▉         | 113/1208 [03:40<35:35,  1.95s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=2.5e-5, train/loss_step=0.00452, global_step=27.00]Epoch 0:   9%|▉         | 113/1208 [03:40<35:35,  1.95s/it, loss=0.152, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00178, train/loss_step=0.325, global_step=28.00]   Epoch 0:   9%|▉         | 114/1208 [03:41<35:24,  1.94s/it, loss=0.152, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00178, train/loss_step=0.325, global_step=28.00]Epoch 0:   9%|▉         | 114/1208 [03:41<35:24,  1.94s/it, loss=0.161, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000656, train/loss_step=0.190, global_step=28.00]Epoch 0:  10%|▉         | 115/1208 [03:42<35:13,  1.93s/it, loss=0.161, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000656, train/loss_step=0.190, global_step=28.00]Epoch 0:  10%|▉         | 115/1208 [03:42<35:13,  1.93s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0656, train/loss_vlb_step=0.000226, train/loss_step=0.0656, global_step=28.00]Epoch 0:  10%|▉         | 116/1208 [03:45<35:25,  1.95s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0656, train/loss_vlb_step=0.000226, train/loss_step=0.0656, global_step=28.00]Epoch 0:  10%|▉         | 116/1208 [03:45<35:25,  1.95s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.00011, train/loss_step=0.0286, global_step=28.00] Epoch 0:  10%|▉         | 117/1208 [03:46<35:15,  1.94s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.00011, train/loss_step=0.0286, global_step=28.00]Epoch 0:  10%|▉         | 117/1208 [03:46<35:15,  1.94s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00634, train/loss_vlb_step=3.18e-5, train/loss_step=0.00634, global_step=29.00]Epoch 0:  10%|▉         | 118/1208 [03:47<35:05,  1.93s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00634, train/loss_vlb_step=3.18e-5, train/loss_step=0.00634, global_step=29.00]Epoch 0:  10%|▉         | 118/1208 [03:47<35:05,  1.93s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00508, train/loss_vlb_step=2.56e-5, train/loss_step=0.00508, global_step=29.00]Epoch 0:  10%|▉         | 119/1208 [03:48<34:54,  1.92s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00508, train/loss_vlb_step=2.56e-5, train/loss_step=0.00508, global_step=29.00]Epoch 0:  10%|▉         | 119/1208 [03:48<34:55,  1.92s/it, loss=0.148, v_num=0, train/loss_simple_step=0.778, train/loss_vlb_step=0.131, train/loss_step=0.778, global_step=29.00]      Epoch 0:  10%|▉         | 120/1208 [03:52<35:05,  1.93s/it, loss=0.148, v_num=0, train/loss_simple_step=0.778, train/loss_vlb_step=0.131, train/loss_step=0.778, global_step=29.00]Epoch 0:  10%|▉         | 120/1208 [03:52<35:05,  1.93s/it, loss=0.159, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000878, train/loss_step=0.230, global_step=29.00]Epoch 0:  10%|█         | 121/1208 [03:53<34:55,  1.93s/it, loss=0.159, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000878, train/loss_step=0.230, global_step=29.00]Epoch 0:  10%|█         | 121/1208 [03:53<34:55,  1.93s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000126, train/loss_step=0.0327, global_step=30.00]Epoch 0:  10%|█         | 122/1208 [03:54<34:45,  1.92s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000126, train/loss_step=0.0327, global_step=30.00]Epoch 0:  10%|█         | 122/1208 [03:54<34:45,  1.92s/it, loss=0.149, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000721, train/loss_step=0.204, global_step=30.00]  Epoch 0:  10%|█         | 123/1208 [03:55<34:35,  1.91s/it, loss=0.149, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000721, train/loss_step=0.204, global_step=30.00]Epoch 0:  10%|█         | 123/1208 [03:55<34:35,  1.91s/it, loss=0.15, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.0021, train/loss_step=0.367, global_step=30.00]   Epoch 0:  10%|█         | 124/1208 [03:58<34:46,  1.92s/it, loss=0.15, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.0021, train/loss_step=0.367, global_step=30.00]Epoch 0:  10%|█         | 124/1208 [03:58<34:46,  1.92s/it, loss=0.155, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000507, train/loss_step=0.153, global_step=30.00]Epoch 0:  10%|█         | 125/1208 [03:59<34:36,  1.92s/it, loss=0.155, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000507, train/loss_step=0.153, global_step=30.00]Epoch 0:  10%|█         | 125/1208 [03:59<34:37,  1.92s/it, loss=0.171, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00185, train/loss_step=0.345, global_step=31.00] Epoch 0:  10%|█         | 126/1208 [04:00<34:27,  1.91s/it, loss=0.171, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00185, train/loss_step=0.345, global_step=31.00]Epoch 0:  10%|█         | 126/1208 [04:00<34:27,  1.91s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=5e-5, train/loss_step=0.0105, global_step=31.00] Epoch 0:  11%|█         | 127/1208 [04:01<34:18,  1.90s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=5e-5, train/loss_step=0.0105, global_step=31.00]Epoch 0:  11%|█         | 127/1208 [04:01<34:18,  1.90s/it, loss=0.16, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=31.00]Epoch 0:  11%|█         | 128/1208 [04:05<34:27,  1.91s/it, loss=0.16, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=31.00]Epoch 0:  11%|█         | 128/1208 [04:05<34:27,  1.91s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0041, train/loss_vlb_step=2.33e-5, train/loss_step=0.0041, global_step=31.00]Epoch 0:  11%|█         | 129/1208 [04:06<34:18,  1.91s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0041, train/loss_vlb_step=2.33e-5, train/loss_step=0.0041, global_step=31.00]Epoch 0:  11%|█         | 129/1208 [04:06<34:18,  1.91s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=3.04e-5, train/loss_step=0.00572, global_step=32.00]Epoch 0:  11%|█         | 130/1208 [04:07<34:09,  1.90s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=3.04e-5, train/loss_step=0.00572, global_step=32.00]Epoch 0:  11%|█         | 130/1208 [04:07<34:09,  1.90s/it, loss=0.16, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00122, train/loss_step=0.269, global_step=32.00]     Epoch 0:  11%|█         | 131/1208 [04:08<34:00,  1.89s/it, loss=0.16, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00122, train/loss_step=0.269, global_step=32.00]Epoch 0:  11%|█         | 131/1208 [04:08<34:00,  1.89s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0505, train/loss_vlb_step=0.000169, train/loss_step=0.0505, global_step=32.00]Epoch 0:  11%|█         | 132/1208 [04:11<34:10,  1.91s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0505, train/loss_vlb_step=0.000169, train/loss_step=0.0505, global_step=32.00]Epoch 0:  11%|█         | 132/1208 [04:11<34:10,  1.91s/it, loss=0.177, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.0033, train/loss_step=0.367, global_step=32.00]    Epoch 0:  11%|█         | 133/1208 [04:12<34:01,  1.90s/it, loss=0.177, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.0033, train/loss_step=0.367, global_step=32.00]Epoch 0:  11%|█         | 133/1208 [04:12<34:01,  1.90s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0368, train/loss_vlb_step=0.000142, train/loss_step=0.0368, global_step=33.00]Epoch 0:  11%|█         | 134/1208 [04:13<33:52,  1.89s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0368, train/loss_vlb_step=0.000142, train/loss_step=0.0368, global_step=33.00]Epoch 0:  11%|█         | 134/1208 [04:13<33:52,  1.89s/it, loss=0.16, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000415, train/loss_step=0.125, global_step=33.00]   Epoch 0:  11%|█         | 135/1208 [04:14<33:43,  1.89s/it, loss=0.16, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000415, train/loss_step=0.125, global_step=33.00]Epoch 0:  11%|█         | 135/1208 [04:14<33:43,  1.89s/it, loss=0.169, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000919, train/loss_step=0.248, global_step=33.00]Epoch 0:  11%|█▏        | 136/1208 [04:17<33:53,  1.90s/it, loss=0.169, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000919, train/loss_step=0.248, global_step=33.00]Epoch 0:  11%|█▏        | 136/1208 [04:17<33:53,  1.90s/it, loss=0.179, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00109, train/loss_step=0.245, global_step=33.00] Epoch 0:  11%|█▏        | 137/1208 [04:18<33:44,  1.89s/it, loss=0.179, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00109, train/loss_step=0.245, global_step=33.00]Epoch 0:  11%|█▏        | 137/1208 [04:18<33:44,  1.89s/it, loss=0.196, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00205, train/loss_step=0.340, global_step=34.00]Epoch 0:  11%|█▏        | 138/1208 [04:20<33:36,  1.88s/it, loss=0.196, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00205, train/loss_step=0.340, global_step=34.00]Epoch 0:  11%|█▏        | 138/1208 [04:20<33:36,  1.88s/it, loss=0.205, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000636, train/loss_step=0.182, global_step=34.00]Epoch 0:  12%|█▏        | 139/1208 [04:21<33:27,  1.88s/it, loss=0.205, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000636, train/loss_step=0.182, global_step=34.00]Epoch 0:  12%|█▏        | 139/1208 [04:21<33:27,  1.88s/it, loss=0.181, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00153, train/loss_step=0.297, global_step=34.00] Epoch 0:  12%|█▏        | 140/1208 [04:24<33:36,  1.89s/it, loss=0.181, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00153, train/loss_step=0.297, global_step=34.00]Epoch 0:  12%|█▏        | 140/1208 [04:24<33:36,  1.89s/it, loss=0.186, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00177, train/loss_step=0.328, global_step=34.00]Epoch 0:  12%|█▏        | 141/1208 [04:25<33:28,  1.88s/it, loss=0.186, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00177, train/loss_step=0.328, global_step=34.00]Epoch 0:  12%|█▏        | 141/1208 [04:25<33:28,  1.88s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0479, train/loss_vlb_step=0.000176, train/loss_step=0.0479, global_step=35.00]Epoch 0:  12%|█▏        | 142/1208 [04:26<33:20,  1.88s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0479, train/loss_vlb_step=0.000176, train/loss_step=0.0479, global_step=35.00]Epoch 0:  12%|█▏        | 142/1208 [04:26<33:20,  1.88s/it, loss=0.193, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00186, train/loss_step=0.322, global_step=35.00]   Epoch 0:  12%|█▏        | 143/1208 [04:27<33:12,  1.87s/it, loss=0.193, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00186, train/loss_step=0.322, global_step=35.00]Epoch 0:  12%|█▏        | 143/1208 [04:27<33:12,  1.87s/it, loss=0.19, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00125, train/loss_step=0.315, global_step=35.00] Epoch 0:  12%|█▏        | 144/1208 [04:30<33:20,  1.88s/it, loss=0.19, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00125, train/loss_step=0.315, global_step=35.00]Epoch 0:  12%|█▏        | 144/1208 [04:30<33:20,  1.88s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0954, train/loss_vlb_step=0.000318, train/loss_step=0.0954, global_step=35.00]Epoch 0:  12%|█▏        | 145/1208 [04:31<33:12,  1.87s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0954, train/loss_vlb_step=0.000318, train/loss_step=0.0954, global_step=35.00]Epoch 0:  12%|█▏        | 145/1208 [04:31<33:12,  1.87s/it, loss=0.175, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=36.00]  Epoch 0:  12%|█▏        | 146/1208 [04:32<33:04,  1.87s/it, loss=0.175, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=36.00]Epoch 0:  12%|█▏        | 146/1208 [04:32<33:04,  1.87s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0848, train/loss_vlb_step=0.00028, train/loss_step=0.0848, global_step=36.00]Epoch 0:  12%|█▏        | 147/1208 [04:33<32:56,  1.86s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0848, train/loss_vlb_step=0.00028, train/loss_step=0.0848, global_step=36.00]Epoch 0:  12%|█▏        | 147/1208 [04:33<32:56,  1.86s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0904, train/loss_vlb_step=0.000303, train/loss_step=0.0904, global_step=36.00]Epoch 0:  12%|█▏        | 148/1208 [04:37<33:04,  1.87s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0904, train/loss_vlb_step=0.000303, train/loss_step=0.0904, global_step=36.00]Epoch 0:  12%|█▏        | 148/1208 [04:37<33:04,  1.87s/it, loss=0.185, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000475, train/loss_step=0.139, global_step=36.00]  Epoch 0:  12%|█▏        | 149/1208 [04:38<32:57,  1.87s/it, loss=0.185, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000475, train/loss_step=0.139, global_step=36.00]Epoch 0:  12%|█▏        | 149/1208 [04:38<32:57,  1.87s/it, loss=0.195, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000792, train/loss_step=0.216, global_step=37.00]Epoch 0:  12%|█▏        | 150/1208 [04:39<32:49,  1.86s/it, loss=0.195, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000792, train/loss_step=0.216, global_step=37.00]Epoch 0:  12%|█▏        | 150/1208 [04:39<32:49,  1.86s/it, loss=0.189, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000506, train/loss_step=0.144, global_step=37.00]Epoch 0:  12%|█▎        | 151/1208 [04:40<32:41,  1.86s/it, loss=0.189, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000506, train/loss_step=0.144, global_step=37.00]Epoch 0:  12%|█▎        | 151/1208 [04:40<32:41,  1.86s/it, loss=0.187, v_num=0, train/loss_simple_step=0.00404, train/loss_vlb_step=2.22e-5, train/loss_step=0.00404, global_step=37.00]Epoch 0:  13%|█▎        | 152/1208 [04:43<32:49,  1.87s/it, loss=0.187, v_num=0, train/loss_simple_step=0.00404, train/loss_vlb_step=2.22e-5, train/loss_step=0.00404, global_step=37.00]Epoch 0:  13%|█▎        | 152/1208 [04:43<32:49,  1.87s/it, loss=0.18, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.00093, train/loss_step=0.231, global_step=37.00]     Epoch 0:  13%|█▎        | 153/1208 [04:44<32:42,  1.86s/it, loss=0.18, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.00093, train/loss_step=0.231, global_step=37.00]Epoch 0:  13%|█▎        | 153/1208 [04:44<32:42,  1.86s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00626, train/loss_vlb_step=3.22e-5, train/loss_step=0.00626, global_step=38.00]Epoch 0:  13%|█▎        | 154/1208 [04:45<32:34,  1.85s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00626, train/loss_vlb_step=3.22e-5, train/loss_step=0.00626, global_step=38.00]Epoch 0:  13%|█▎        | 154/1208 [04:45<32:34,  1.85s/it, loss=0.173, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.53e-5, train/loss_step=0.020, global_step=38.00]    Epoch 0:  13%|█▎        | 155/1208 [04:46<32:27,  1.85s/it, loss=0.173, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.53e-5, train/loss_step=0.020, global_step=38.00]Epoch 0:  13%|█▎        | 155/1208 [04:46<32:27,  1.85s/it, loss=0.17, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000632, train/loss_step=0.182, global_step=38.00]Epoch 0:  13%|█▎        | 156/1208 [04:49<32:35,  1.86s/it, loss=0.17, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000632, train/loss_step=0.182, global_step=38.00]Epoch 0:  13%|█▎        | 156/1208 [04:49<32:35,  1.86s/it, loss=0.184, v_num=0, train/loss_simple_step=0.529, train/loss_vlb_step=0.0124, train/loss_step=0.529, global_step=38.00] Epoch 0:  13%|█▎        | 157/1208 [04:51<32:28,  1.85s/it, loss=0.184, v_num=0, train/loss_simple_step=0.529, train/loss_vlb_step=0.0124, train/loss_step=0.529, global_step=38.00]Epoch 0:  13%|█▎        | 157/1208 [04:51<32:28,  1.85s/it, loss=0.199, v_num=0, train/loss_simple_step=0.635, train/loss_vlb_step=0.0223, train/loss_step=0.635, global_step=39.00]Epoch 0:  13%|█▎        | 158/1208 [04:52<32:21,  1.85s/it, loss=0.199, v_num=0, train/loss_simple_step=0.635, train/loss_vlb_step=0.0223, train/loss_step=0.635, global_step=39.00]Epoch 0:  13%|█▎        | 158/1208 [04:52<32:21,  1.85s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0045, train/loss_vlb_step=2.42e-5, train/loss_step=0.0045, global_step=39.00]Epoch 0:  13%|█▎        | 159/1208 [04:53<32:13,  1.84s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0045, train/loss_vlb_step=2.42e-5, train/loss_step=0.0045, global_step=39.00]Epoch 0:  13%|█▎        | 159/1208 [04:53<32:13,  1.84s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.91e-5, train/loss_step=0.0246, global_step=39.00]Epoch 0:  13%|█▎        | 160/1208 [04:56<32:21,  1.85s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.91e-5, train/loss_step=0.0246, global_step=39.00]Epoch 0:  13%|█▎        | 160/1208 [04:56<32:21,  1.85s/it, loss=0.165, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000351, train/loss_step=0.106, global_step=39.00] Epoch 0:  13%|█▎        | 161/1208 [04:57<32:14,  1.85s/it, loss=0.165, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000351, train/loss_step=0.106, global_step=39.00]Epoch 0:  13%|█▎        | 161/1208 [04:57<32:14,  1.85s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=2.22e-5, train/loss_step=0.00402, global_step=40.00]Epoch 0:  13%|█▎        | 162/1208 [04:58<32:07,  1.84s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=2.22e-5, train/loss_step=0.00402, global_step=40.00]Epoch 0:  13%|█▎        | 162/1208 [04:58<32:07,  1.84s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0807, train/loss_vlb_step=0.00027, train/loss_step=0.0807, global_step=40.00]  Epoch 0:  13%|█▎        | 163/1208 [04:59<32:00,  1.84s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0807, train/loss_vlb_step=0.00027, train/loss_step=0.0807, global_step=40.00]Epoch 0:  13%|█▎        | 163/1208 [04:59<32:00,  1.84s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00478, train/loss_vlb_step=2.57e-5, train/loss_step=0.00478, global_step=40.00]Epoch 0:  14%|█▎        | 164/1208 [05:02<32:07,  1.85s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00478, train/loss_vlb_step=2.57e-5, train/loss_step=0.00478, global_step=40.00]Epoch 0:  14%|█▎        | 164/1208 [05:02<32:07,  1.85s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00853, train/loss_vlb_step=4.08e-5, train/loss_step=0.00853, global_step=40.00]Epoch 0:  14%|█▎        | 165/1208 [05:03<32:00,  1.84s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00853, train/loss_vlb_step=4.08e-5, train/loss_step=0.00853, global_step=40.00]Epoch 0:  14%|█▎        | 165/1208 [05:03<32:00,  1.84s/it, loss=0.134, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000557, train/loss_step=0.163, global_step=41.00]   Epoch 0:  14%|█▎        | 166/1208 [05:04<31:53,  1.84s/it, loss=0.134, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000557, train/loss_step=0.163, global_step=41.00]Epoch 0:  14%|█▎        | 166/1208 [05:04<31:53,  1.84s/it, loss=0.154, v_num=0, train/loss_simple_step=0.484, train/loss_vlb_step=0.00526, train/loss_step=0.484, global_step=41.00] Epoch 0:  14%|█▍        | 167/1208 [05:05<31:47,  1.83s/it, loss=0.154, v_num=0, train/loss_simple_step=0.484, train/loss_vlb_step=0.00526, train/loss_step=0.484, global_step=41.00]Epoch 0:  14%|█▍        | 167/1208 [05:05<31:47,  1.83s/it, loss=0.161, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000962, train/loss_step=0.236, global_step=41.00]Epoch 0:  14%|█▍        | 168/1208 [05:09<31:54,  1.84s/it, loss=0.161, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000962, train/loss_step=0.236, global_step=41.00]Epoch 0:  14%|█▍        | 168/1208 [05:09<31:54,  1.84s/it, loss=0.162, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000546, train/loss_step=0.165, global_step=41.00]Epoch 0:  14%|█▍        | 169/1208 [05:10<31:47,  1.84s/it, loss=0.162, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000546, train/loss_step=0.165, global_step=41.00]Epoch 0:  14%|█▍        | 169/1208 [05:10<31:47,  1.84s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0997, train/loss_vlb_step=0.00033, train/loss_step=0.0997, global_step=42.00]Epoch 0:  14%|█▍        | 170/1208 [05:11<31:40,  1.83s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0997, train/loss_vlb_step=0.00033, train/loss_step=0.0997, global_step=42.00]Epoch 0:  14%|█▍        | 170/1208 [05:11<31:40,  1.83s/it, loss=0.164, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00189, train/loss_step=0.302, global_step=42.00]  Epoch 0:  14%|█▍        | 171/1208 [05:12<31:34,  1.83s/it, loss=0.164, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00189, train/loss_step=0.302, global_step=42.00]Epoch 0:  14%|█▍        | 171/1208 [05:12<31:34,  1.83s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.39e-5, train/loss_step=0.0147, global_step=42.00]Epoch 0:  14%|█▍        | 172/1208 [05:15<31:41,  1.84s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.39e-5, train/loss_step=0.0147, global_step=42.00]Epoch 0:  14%|█▍        | 172/1208 [05:15<31:41,  1.84s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=3.23e-5, train/loss_step=0.00619, global_step=42.00]Epoch 0:  14%|█▍        | 173/1208 [05:16<31:34,  1.83s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=3.23e-5, train/loss_step=0.00619, global_step=42.00]Epoch 0:  14%|█▍        | 173/1208 [05:16<31:34,  1.83s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0879, train/loss_vlb_step=0.000292, train/loss_step=0.0879, global_step=43.00] Epoch 0:  14%|█▍        | 174/1208 [05:17<31:28,  1.83s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0879, train/loss_vlb_step=0.000292, train/loss_step=0.0879, global_step=43.00]Epoch 0:  14%|█▍        | 174/1208 [05:17<31:28,  1.83s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00906, train/loss_vlb_step=4.28e-5, train/loss_step=0.00906, global_step=43.00]Epoch 0:  14%|█▍        | 175/1208 [05:18<31:21,  1.82s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00906, train/loss_vlb_step=4.28e-5, train/loss_step=0.00906, global_step=43.00]Epoch 0:  14%|█▍        | 175/1208 [05:18<31:21,  1.82s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00617, train/loss_vlb_step=3.2e-5, train/loss_step=0.00617, global_step=43.00] Epoch 0:  15%|█▍        | 176/1208 [05:21<31:28,  1.83s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00617, train/loss_vlb_step=3.2e-5, train/loss_step=0.00617, global_step=43.00]Epoch 0:  15%|█▍        | 176/1208 [05:21<31:28,  1.83s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.000177, train/loss_step=0.0485, global_step=43.00]Epoch 0:  15%|█▍        | 177/1208 [05:23<31:21,  1.83s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.000177, train/loss_step=0.0485, global_step=43.00]Epoch 0:  15%|█▍        | 177/1208 [05:23<31:21,  1.83s/it, loss=0.113, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00254, train/loss_step=0.408, global_step=44.00]   Epoch 0:  15%|█▍        | 178/1208 [05:24<31:15,  1.82s/it, loss=0.113, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00254, train/loss_step=0.408, global_step=44.00]Epoch 0:  15%|█▍        | 178/1208 [05:24<31:15,  1.82s/it, loss=0.135, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00377, train/loss_step=0.439, global_step=44.00]Epoch 0:  15%|█▍        | 179/1208 [05:25<31:09,  1.82s/it, loss=0.135, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00377, train/loss_step=0.439, global_step=44.00]Epoch 0:  15%|█▍        | 179/1208 [05:25<31:09,  1.82s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0662, train/loss_vlb_step=0.000232, train/loss_step=0.0662, global_step=44.00]Epoch 0:  15%|█▍        | 180/1208 [05:28<31:15,  1.82s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0662, train/loss_vlb_step=0.000232, train/loss_step=0.0662, global_step=44.00]Epoch 0:  15%|█▍        | 180/1208 [05:28<31:15,  1.82s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000125, train/loss_step=0.0308, global_step=44.00]Epoch 0:  15%|█▍        | 181/1208 [05:29<31:09,  1.82s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000125, train/loss_step=0.0308, global_step=44.00]Epoch 0:  15%|█▍        | 181/1208 [05:29<31:09,  1.82s/it, loss=0.146, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.000969, train/loss_step=0.252, global_step=45.00]  Epoch 0:  15%|█▌        | 182/1208 [05:30<31:03,  1.82s/it, loss=0.146, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.000969, train/loss_step=0.252, global_step=45.00]Epoch 0:  15%|█▌        | 182/1208 [05:30<31:03,  1.82s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00535, train/loss_vlb_step=2.86e-5, train/loss_step=0.00535, global_step=45.00]Epoch 0:  15%|█▌        | 183/1208 [05:31<30:57,  1.81s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00535, train/loss_vlb_step=2.86e-5, train/loss_step=0.00535, global_step=45.00]Epoch 0:  15%|█▌        | 183/1208 [05:31<30:57,  1.81s/it, loss=0.16, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00277, train/loss_step=0.373, global_step=45.00]     Epoch 0:  15%|█▌        | 184/1208 [05:34<31:03,  1.82s/it, loss=0.16, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00277, train/loss_step=0.373, global_step=45.00]Epoch 0:  15%|█▌        | 184/1208 [05:34<31:03,  1.82s/it, loss=0.175, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00149, train/loss_step=0.300, global_step=45.00]Epoch 0:  15%|█▌        | 185/1208 [05:35<30:57,  1.82s/it, loss=0.175, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00149, train/loss_step=0.300, global_step=45.00]Epoch 0:  15%|█▌        | 185/1208 [05:35<30:57,  1.82s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.00011, train/loss_step=0.0298, global_step=46.00]Epoch 0:  15%|█▌        | 186/1208 [05:36<30:51,  1.81s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.00011, train/loss_step=0.0298, global_step=46.00]Epoch 0:  15%|█▌        | 186/1208 [05:36<30:51,  1.81s/it, loss=0.145, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.94e-5, train/loss_step=0.013, global_step=46.00]  Epoch 0:  15%|█▌        | 187/1208 [05:37<30:45,  1.81s/it, loss=0.145, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.94e-5, train/loss_step=0.013, global_step=46.00]Epoch 0:  15%|█▌        | 187/1208 [05:37<30:45,  1.81s/it, loss=0.145, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00109, train/loss_step=0.253, global_step=46.00]Epoch 0:  16%|█▌        | 188/1208 [05:41<30:51,  1.81s/it, loss=0.145, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00109, train/loss_step=0.253, global_step=46.00]Epoch 0:  16%|█▌        | 188/1208 [05:41<30:51,  1.81s/it, loss=0.144, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000467, train/loss_step=0.140, global_step=46.00]Epoch 0:  16%|█▌        | 189/1208 [05:42<30:45,  1.81s/it, loss=0.144, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000467, train/loss_step=0.140, global_step=46.00]Epoch 0:  16%|█▌        | 189/1208 [05:42<30:45,  1.81s/it, loss=0.163, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00526, train/loss_step=0.476, global_step=47.00] Epoch 0:  16%|█▌        | 190/1208 [05:43<30:39,  1.81s/it, loss=0.163, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00526, train/loss_step=0.476, global_step=47.00]Epoch 0:  16%|█▌        | 190/1208 [05:43<30:39,  1.81s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0564, train/loss_vlb_step=0.000199, train/loss_step=0.0564, global_step=47.00]Epoch 0:  16%|█▌        | 191/1208 [05:44<30:33,  1.80s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0564, train/loss_vlb_step=0.000199, train/loss_step=0.0564, global_step=47.00]Epoch 0:  16%|█▌        | 191/1208 [05:44<30:33,  1.80s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.5e-5, train/loss_step=0.0122, global_step=47.00]  Epoch 0:  16%|█▌        | 192/1208 [05:47<30:39,  1.81s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.5e-5, train/loss_step=0.0122, global_step=47.00]Epoch 0:  16%|█▌        | 192/1208 [05:47<30:39,  1.81s/it, loss=0.16, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000708, train/loss_step=0.193, global_step=47.00] Epoch 0:  16%|█▌        | 193/1208 [05:48<30:33,  1.81s/it, loss=0.16, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000708, train/loss_step=0.193, global_step=47.00]Epoch 0:  16%|█▌        | 193/1208 [05:48<30:33,  1.81s/it, loss=0.173, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00186, train/loss_step=0.342, global_step=48.00]Epoch 0:  16%|█▌        | 194/1208 [05:49<30:27,  1.80s/it, loss=0.173, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00186, train/loss_step=0.342, global_step=48.00]Epoch 0:  16%|█▌        | 194/1208 [05:49<30:27,  1.80s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0671, train/loss_vlb_step=0.000223, train/loss_step=0.0671, global_step=48.00]Epoch 0:  16%|█▌        | 195/1208 [05:50<30:22,  1.80s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0671, train/loss_vlb_step=0.000223, train/loss_step=0.0671, global_step=48.00]Epoch 0:  16%|█▌        | 195/1208 [05:50<30:22,  1.80s/it, loss=0.188, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00102, train/loss_step=0.255, global_step=48.00]   Epoch 0:  16%|█▌        | 196/1208 [05:54<30:27,  1.81s/it, loss=0.188, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00102, train/loss_step=0.255, global_step=48.00]Epoch 0:  16%|█▌        | 196/1208 [05:54<30:27,  1.81s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.67e-5, train/loss_step=0.0151, global_step=48.00]Epoch 0:  16%|█▋        | 197/1208 [05:55<30:22,  1.80s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.67e-5, train/loss_step=0.0151, global_step=48.00]Epoch 0:  16%|█▋        | 197/1208 [05:55<30:22,  1.80s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0691, train/loss_vlb_step=0.000234, train/loss_step=0.0691, global_step=49.00]Epoch 0:  16%|█▋        | 198/1208 [05:56<30:16,  1.80s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0691, train/loss_vlb_step=0.000234, train/loss_step=0.0691, global_step=49.00]Epoch 0:  16%|█▋        | 198/1208 [05:56<30:16,  1.80s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=1.44e-5, train/loss_step=0.00245, global_step=49.00]Epoch 0:  16%|█▋        | 199/1208 [05:57<30:10,  1.79s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=1.44e-5, train/loss_step=0.00245, global_step=49.00]Epoch 0:  16%|█▋        | 199/1208 [05:57<30:10,  1.79s/it, loss=0.149, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000344, train/loss_step=0.104, global_step=49.00]   Epoch 0:  17%|█▋        | 200/1208 [06:00<30:16,  1.80s/it, loss=0.149, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000344, train/loss_step=0.104, global_step=49.00]Epoch 0:  17%|█▋        | 200/1208 [06:00<30:16,  1.80s/it, loss=0.157, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000725, train/loss_step=0.192, global_step=49.00]Epoch 0:  17%|█▋        | 201/1208 [06:01<30:10,  1.80s/it, loss=0.157, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000725, train/loss_step=0.192, global_step=49.00]Epoch 0:  17%|█▋        | 201/1208 [06:01<30:10,  1.80s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=7.07e-5, train/loss_step=0.0161, global_step=50.00]Epoch 0:  17%|█▋        | 202/1208 [06:02<30:05,  1.79s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=7.07e-5, train/loss_step=0.0161, global_step=50.00]Epoch 0:  17%|█▋        | 202/1208 [06:02<30:05,  1.79s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.82e-5, train/loss_step=0.0209, global_step=50.00]Epoch 0:  17%|█▋        | 203/1208 [06:03<29:59,  1.79s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.82e-5, train/loss_step=0.0209, global_step=50.00]Epoch 0:  17%|█▋        | 203/1208 [06:03<29:59,  1.79s/it, loss=0.136, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000563, train/loss_step=0.164, global_step=50.00] Epoch 0:  17%|█▋        | 204/1208 [06:06<30:05,  1.80s/it, loss=0.136, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000563, train/loss_step=0.164, global_step=50.00]Epoch 0:  17%|█▋        | 204/1208 [06:06<30:05,  1.80s/it, loss=0.137, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00167, train/loss_step=0.320, global_step=50.00] Epoch 0:  17%|█▋        | 205/1208 [06:07<30:00,  1.79s/it, loss=0.137, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00167, train/loss_step=0.320, global_step=50.00]Epoch 0:  17%|█▋        | 205/1208 [06:07<30:00,  1.79s/it, loss=0.156, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00441, train/loss_step=0.412, global_step=51.00]Epoch 0:  17%|█▋        | 206/1208 [06:08<29:54,  1.79s/it, loss=0.156, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00441, train/loss_step=0.412, global_step=51.00]Epoch 0:  17%|█▋        | 206/1208 [06:08<29:54,  1.79s/it, loss=0.166, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000818, train/loss_step=0.217, global_step=51.00]Epoch 0:  17%|█▋        | 207/1208 [06:10<29:49,  1.79s/it, loss=0.166, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000818, train/loss_step=0.217, global_step=51.00]Epoch 0:  17%|█▋        | 207/1208 [06:10<29:49,  1.79s/it, loss=0.176, v_num=0, train/loss_simple_step=0.444, train/loss_vlb_step=0.0034, train/loss_step=0.444, global_step=51.00]  Epoch 0:  17%|█▋        | 208/1208 [06:13<29:54,  1.79s/it, loss=0.176, v_num=0, train/loss_simple_step=0.444, train/loss_vlb_step=0.0034, train/loss_step=0.444, global_step=51.00]Epoch 0:  17%|█▋        | 208/1208 [06:13<29:54,  1.79s/it, loss=0.176, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.00052, train/loss_step=0.149, global_step=51.00]Epoch 0:  17%|█▋        | 209/1208 [06:14<29:49,  1.79s/it, loss=0.176, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.00052, train/loss_step=0.149, global_step=51.00]Epoch 0:  17%|█▋        | 209/1208 [06:14<29:49,  1.79s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00382, train/loss_vlb_step=2.08e-5, train/loss_step=0.00382, global_step=52.00]Epoch 0:  17%|█▋        | 210/1208 [06:15<29:43,  1.79s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00382, train/loss_vlb_step=2.08e-5, train/loss_step=0.00382, global_step=52.00]Epoch 0:  17%|█▋        | 210/1208 [06:15<29:43,  1.79s/it, loss=0.156, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000396, train/loss_step=0.121, global_step=52.00]   Epoch 0:  17%|█▋        | 211/1208 [06:16<29:38,  1.78s/it, loss=0.156, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000396, train/loss_step=0.121, global_step=52.00]Epoch 0:  17%|█▋        | 211/1208 [06:16<29:38,  1.78s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0689, train/loss_vlb_step=0.000227, train/loss_step=0.0689, global_step=52.00]Epoch 0:  18%|█▊        | 212/1208 [06:19<29:44,  1.79s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0689, train/loss_vlb_step=0.000227, train/loss_step=0.0689, global_step=52.00]Epoch 0:  18%|█▊        | 212/1208 [06:19<29:44,  1.79s/it, loss=0.164, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.0014, train/loss_step=0.303, global_step=52.00]    Epoch 0:  18%|█▊        | 213/1208 [06:20<29:38,  1.79s/it, loss=0.164, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.0014, train/loss_step=0.303, global_step=52.00]Epoch 0:  18%|█▊        | 213/1208 [06:20<29:38,  1.79s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000109, train/loss_step=0.0273, global_step=53.00]Epoch 0:  18%|█▊        | 214/1208 [06:21<29:33,  1.78s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000109, train/loss_step=0.0273, global_step=53.00]Epoch 0:  18%|█▊        | 214/1208 [06:21<29:33,  1.78s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.14e-5, train/loss_step=0.0117, global_step=53.00] Epoch 0:  18%|█▊        | 215/1208 [06:22<29:28,  1.78s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.14e-5, train/loss_step=0.0117, global_step=53.00]Epoch 0:  18%|█▊        | 215/1208 [06:22<29:28,  1.78s/it, loss=0.141, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000494, train/loss_step=0.150, global_step=53.00] Epoch 0:  18%|█▊        | 216/1208 [06:26<29:33,  1.79s/it, loss=0.141, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000494, train/loss_step=0.150, global_step=53.00]Epoch 0:  18%|█▊        | 216/1208 [06:26<29:33,  1.79s/it, loss=0.147, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000479, train/loss_step=0.146, global_step=53.00]Epoch 0:  18%|█▊        | 217/1208 [06:27<29:28,  1.78s/it, loss=0.147, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000479, train/loss_step=0.146, global_step=53.00]Epoch 0:  18%|█▊        | 217/1208 [06:27<29:28,  1.78s/it, loss=0.154, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000693, train/loss_step=0.201, global_step=54.00]Epoch 0:  18%|█▊        | 218/1208 [06:28<29:23,  1.78s/it, loss=0.154, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000693, train/loss_step=0.201, global_step=54.00]Epoch 0:  18%|█▊        | 218/1208 [06:28<29:23,  1.78s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.7e-5, train/loss_step=0.0212, global_step=54.00]Epoch 0:  18%|█▊        | 219/1208 [06:29<29:18,  1.78s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.7e-5, train/loss_step=0.0212, global_step=54.00]Epoch 0:  18%|█▊        | 219/1208 [06:29<29:18,  1.78s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.21e-5, train/loss_step=0.0111, global_step=54.00]Epoch 0:  18%|█▊        | 220/1208 [06:32<29:23,  1.78s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.21e-5, train/loss_step=0.0111, global_step=54.00]Epoch 0:  18%|█▊        | 220/1208 [06:32<29:23,  1.78s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.15e-5, train/loss_step=0.00194, global_step=54.00]Epoch 0:  18%|█▊        | 221/1208 [06:33<29:18,  1.78s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.15e-5, train/loss_step=0.00194, global_step=54.00]Epoch 0:  18%|█▊        | 221/1208 [06:33<29:18,  1.78s/it, loss=0.146, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000444, train/loss_step=0.135, global_step=55.00]  Epoch 0:  18%|█▊        | 222/1208 [06:34<29:13,  1.78s/it, loss=0.146, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000444, train/loss_step=0.135, global_step=55.00]Epoch 0:  18%|█▊        | 222/1208 [06:34<29:13,  1.78s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.1e-5, train/loss_step=0.00182, global_step=55.00]Epoch 0:  18%|█▊        | 223/1208 [06:35<29:08,  1.77s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.1e-5, train/loss_step=0.00182, global_step=55.00]Epoch 0:  18%|█▊        | 223/1208 [06:35<29:08,  1.77s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000122, train/loss_step=0.0328, global_step=55.00]Epoch 0:  19%|█▊        | 224/1208 [06:39<29:12,  1.78s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000122, train/loss_step=0.0328, global_step=55.00]Epoch 0:  19%|█▊        | 224/1208 [06:39<29:12,  1.78s/it, loss=0.162, v_num=0, train/loss_simple_step=0.782, train/loss_vlb_step=0.0405, train/loss_step=0.782, global_step=55.00]    Epoch 0:  19%|█▊        | 225/1208 [06:40<29:08,  1.78s/it, loss=0.162, v_num=0, train/loss_simple_step=0.782, train/loss_vlb_step=0.0405, train/loss_step=0.782, global_step=55.00]Epoch 0:  19%|█▊        | 225/1208 [06:40<29:08,  1.78s/it, loss=0.162, v_num=0, train/loss_simple_step=0.416, train/loss_vlb_step=0.00353, train/loss_step=0.416, global_step=56.00]Epoch 0:  19%|█▊        | 226/1208 [06:41<29:03,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.416, train/loss_vlb_step=0.00353, train/loss_step=0.416, global_step=56.00]Epoch 0:  19%|█▊        | 226/1208 [06:41<29:03,  1.77s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00579, train/loss_vlb_step=2.97e-5, train/loss_step=0.00579, global_step=56.00]Epoch 0:  19%|█▉        | 227/1208 [06:42<28:58,  1.77s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00579, train/loss_vlb_step=2.97e-5, train/loss_step=0.00579, global_step=56.00]Epoch 0:  19%|█▉        | 227/1208 [06:42<28:58,  1.77s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000118, train/loss_step=0.0317, global_step=56.00] Epoch 0:  19%|█▉        | 228/1208 [06:45<29:02,  1.78s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000118, train/loss_step=0.0317, global_step=56.00]Epoch 0:  19%|█▉        | 228/1208 [06:45<29:02,  1.78s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.62e-5, train/loss_step=0.0203, global_step=56.00] Epoch 0:  19%|█▉        | 229/1208 [06:46<28:57,  1.78s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.62e-5, train/loss_step=0.0203, global_step=56.00]Epoch 0:  19%|█▉        | 229/1208 [06:46<28:57,  1.78s/it, loss=0.132, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000504, train/loss_step=0.149, global_step=57.00] Epoch 0:  19%|█▉        | 230/1208 [06:47<28:53,  1.77s/it, loss=0.132, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000504, train/loss_step=0.149, global_step=57.00]Epoch 0:  19%|█▉        | 230/1208 [06:47<28:53,  1.77s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000106, train/loss_step=0.0263, global_step=57.00]Epoch 0:  19%|█▉        | 231/1208 [06:48<28:48,  1.77s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000106, train/loss_step=0.0263, global_step=57.00]Epoch 0:  19%|█▉        | 231/1208 [06:48<28:48,  1.77s/it, loss=0.136, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.000963, train/loss_step=0.252, global_step=57.00]  Epoch 0:  19%|█▉        | 232/1208 [06:51<28:52,  1.78s/it, loss=0.136, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.000963, train/loss_step=0.252, global_step=57.00]Epoch 0:  19%|█▉        | 232/1208 [06:51<28:52,  1.78s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.66e-5, train/loss_step=0.0179, global_step=57.00]Epoch 0:  19%|█▉        | 233/1208 [06:52<28:48,  1.77s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.66e-5, train/loss_step=0.0179, global_step=57.00]Epoch 0:  19%|█▉        | 233/1208 [06:52<28:48,  1.77s/it, loss=0.126, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000329, train/loss_step=0.100, global_step=58.00] Epoch 0:  19%|█▉        | 234/1208 [06:54<28:43,  1.77s/it, loss=0.126, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000329, train/loss_step=0.100, global_step=58.00]Epoch 0:  19%|█▉        | 234/1208 [06:54<28:43,  1.77s/it, loss=0.13, v_num=0, train/loss_simple_step=0.094, train/loss_vlb_step=0.000315, train/loss_step=0.094, global_step=58.00] Epoch 0:  19%|█▉        | 235/1208 [06:55<28:38,  1.77s/it, loss=0.13, v_num=0, train/loss_simple_step=0.094, train/loss_vlb_step=0.000315, train/loss_step=0.094, global_step=58.00]Epoch 0:  19%|█▉        | 235/1208 [06:55<28:38,  1.77s/it, loss=0.134, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00105, train/loss_step=0.243, global_step=58.00]Epoch 0:  20%|█▉        | 236/1208 [06:58<28:42,  1.77s/it, loss=0.134, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00105, train/loss_step=0.243, global_step=58.00]Epoch 0:  20%|█▉        | 236/1208 [06:58<28:42,  1.77s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0576, train/loss_vlb_step=0.000198, train/loss_step=0.0576, global_step=58.00]Epoch 0:  20%|█▉        | 237/1208 [06:59<28:38,  1.77s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0576, train/loss_vlb_step=0.000198, train/loss_step=0.0576, global_step=58.00]Epoch 0:  20%|█▉        | 237/1208 [06:59<28:38,  1.77s/it, loss=0.127, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000494, train/loss_step=0.147, global_step=59.00] Epoch 0:  20%|█▉        | 238/1208 [07:00<28:33,  1.77s/it, loss=0.127, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000494, train/loss_step=0.147, global_step=59.00]Epoch 0:  20%|█▉        | 238/1208 [07:00<28:33,  1.77s/it, loss=0.138, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000853, train/loss_step=0.235, global_step=59.00]Epoch 0:  20%|█▉        | 239/1208 [07:01<28:28,  1.76s/it, loss=0.138, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000853, train/loss_step=0.235, global_step=59.00]Epoch 0:  20%|█▉        | 239/1208 [07:01<28:28,  1.76s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=1.91e-5, train/loss_step=0.00325, global_step=59.00]Epoch 0:  20%|█▉        | 240/1208 [07:04<28:33,  1.77s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=1.91e-5, train/loss_step=0.00325, global_step=59.00]Epoch 0:  20%|█▉        | 240/1208 [07:04<28:33,  1.77s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=1.27e-5, train/loss_step=0.00214, global_step=59.00]Epoch 0:  20%|█▉        | 241/1208 [07:05<28:28,  1.77s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=1.27e-5, train/loss_step=0.00214, global_step=59.00]Epoch 0:  20%|█▉        | 241/1208 [07:05<28:28,  1.77s/it, loss=0.148, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00199, train/loss_step=0.335, global_step=60.00]    Epoch 0:  20%|██        | 242/1208 [07:06<28:23,  1.76s/it, loss=0.148, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00199, train/loss_step=0.335, global_step=60.00]Epoch 0:  20%|██        | 242/1208 [07:06<28:23,  1.76s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000106, train/loss_step=0.0263, global_step=60.00]Epoch 0:  20%|██        | 243/1208 [07:07<28:19,  1.76s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000106, train/loss_step=0.0263, global_step=60.00]Epoch 0:  20%|██        | 243/1208 [07:07<28:19,  1.76s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.0001, train/loss_step=0.0248, global_step=60.00]  Epoch 0:  20%|██        | 244/1208 [07:11<28:23,  1.77s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.0001, train/loss_step=0.0248, global_step=60.00]Epoch 0:  20%|██        | 244/1208 [07:11<28:23,  1.77s/it, loss=0.11, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.3e-5, train/loss_step=0.016, global_step=60.00]   Epoch 0:  20%|██        | 245/1208 [07:12<28:18,  1.76s/it, loss=0.11, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.3e-5, train/loss_step=0.016, global_step=60.00]Epoch 0:  20%|██        | 245/1208 [07:12<28:18,  1.76s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.0654, train/loss_vlb_step=0.000219, train/loss_step=0.0654, global_step=61.00]Epoch 0:  20%|██        | 246/1208 [07:13<28:14,  1.76s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.0654, train/loss_vlb_step=0.000219, train/loss_step=0.0654, global_step=61.00]Epoch 0:  20%|██        | 246/1208 [07:13<28:14,  1.76s/it, loss=0.11, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00251, train/loss_step=0.355, global_step=61.00]     Epoch 0:  20%|██        | 247/1208 [07:14<28:09,  1.76s/it, loss=0.11, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00251, train/loss_step=0.355, global_step=61.00]Epoch 0:  20%|██        | 247/1208 [07:14<28:09,  1.76s/it, loss=0.114, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000385, train/loss_step=0.115, global_step=61.00]Epoch 0:  21%|██        | 248/1208 [07:17<28:13,  1.76s/it, loss=0.114, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000385, train/loss_step=0.115, global_step=61.00]Epoch 0:  21%|██        | 248/1208 [07:17<28:13,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000793, train/loss_step=0.220, global_step=61.00]Epoch 0:  21%|██        | 249/1208 [07:18<28:09,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000793, train/loss_step=0.220, global_step=61.00]Epoch 0:  21%|██        | 249/1208 [07:18<28:09,  1.76s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0062, train/loss_vlb_step=3.17e-5, train/loss_step=0.0062, global_step=62.00]Epoch 0:  21%|██        | 250/1208 [07:19<28:04,  1.76s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0062, train/loss_vlb_step=3.17e-5, train/loss_step=0.0062, global_step=62.00]Epoch 0:  21%|██        | 250/1208 [07:19<28:04,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000596, train/loss_step=0.170, global_step=62.00] Epoch 0:  21%|██        | 251/1208 [07:20<28:00,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000596, train/loss_step=0.170, global_step=62.00]Epoch 0:  21%|██        | 251/1208 [07:20<28:00,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.27e-5, train/loss_step=0.0234, global_step=62.00]Epoch 0:  21%|██        | 252/1208 [07:24<28:04,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.27e-5, train/loss_step=0.0234, global_step=62.00]Epoch 0:  21%|██        | 252/1208 [07:24<28:04,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00834, train/loss_vlb_step=4.1e-5, train/loss_step=0.00834, global_step=62.00]Epoch 0:  21%|██        | 253/1208 [07:25<28:00,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00834, train/loss_vlb_step=4.1e-5, train/loss_step=0.00834, global_step=62.00]Epoch 0:  21%|██        | 253/1208 [07:25<28:00,  1.76s/it, loss=0.114, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000458, train/loss_step=0.139, global_step=63.00]  Epoch 0:  21%|██        | 254/1208 [07:26<27:55,  1.76s/it, loss=0.114, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000458, train/loss_step=0.139, global_step=63.00]Epoch 0:  21%|██        | 254/1208 [07:26<27:55,  1.76s/it, loss=0.122, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00102, train/loss_step=0.252, global_step=63.00] Epoch 0:  21%|██        | 255/1208 [07:27<27:51,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00102, train/loss_step=0.252, global_step=63.00]Epoch 0:  21%|██        | 255/1208 [07:27<27:51,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000433, train/loss_step=0.132, global_step=63.00]Epoch 0:  21%|██        | 256/1208 [07:30<27:55,  1.76s/it, loss=0.117, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000433, train/loss_step=0.132, global_step=63.00]Epoch 0:  21%|██        | 256/1208 [07:30<27:55,  1.76s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00353, train/loss_vlb_step=2e-5, train/loss_step=0.00353, global_step=63.00]Epoch 0:  21%|██▏       | 257/1208 [07:31<27:50,  1.76s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00353, train/loss_vlb_step=2e-5, train/loss_step=0.00353, global_step=63.00]Epoch 0:  21%|██▏       | 257/1208 [07:31<27:50,  1.76s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.15e-5, train/loss_step=0.0109, global_step=64.00]Epoch 0:  21%|██▏       | 258/1208 [07:32<27:46,  1.75s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.15e-5, train/loss_step=0.0109, global_step=64.00]Epoch 0:  21%|██▏       | 258/1208 [07:32<27:46,  1.75s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.27e-5, train/loss_step=0.00212, global_step=64.00]Epoch 0:  21%|██▏       | 259/1208 [07:33<27:41,  1.75s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.27e-5, train/loss_step=0.00212, global_step=64.00]Epoch 0:  21%|██▏       | 259/1208 [07:33<27:41,  1.75s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=7.12e-5, train/loss_step=0.0157, global_step=64.00]  Epoch 0:  22%|██▏       | 260/1208 [07:36<27:45,  1.76s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=7.12e-5, train/loss_step=0.0157, global_step=64.00]Epoch 0:  22%|██▏       | 260/1208 [07:36<27:45,  1.76s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.00479, train/loss_vlb_step=2.56e-5, train/loss_step=0.00479, global_step=64.00]Epoch 0:  22%|██▏       | 261/1208 [07:37<27:41,  1.75s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.00479, train/loss_vlb_step=2.56e-5, train/loss_step=0.00479, global_step=64.00]Epoch 0:  22%|██▏       | 261/1208 [07:37<27:41,  1.75s/it, loss=0.0814, v_num=0, train/loss_simple_step=0.037, train/loss_vlb_step=0.000142, train/loss_step=0.037, global_step=65.00]   Epoch 0:  22%|██▏       | 262/1208 [07:39<27:37,  1.75s/it, loss=0.0814, v_num=0, train/loss_simple_step=0.037, train/loss_vlb_step=0.000142, train/loss_step=0.037, global_step=65.00]Epoch 0:  22%|██▏       | 262/1208 [07:39<27:37,  1.75s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00123, train/loss_step=0.282, global_step=65.00] Epoch 0:  22%|██▏       | 263/1208 [07:40<27:33,  1.75s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00123, train/loss_step=0.282, global_step=65.00]Epoch 0:  22%|██▏       | 263/1208 [07:40<27:33,  1.75s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.00571, train/loss_vlb_step=3.01e-5, train/loss_step=0.00571, global_step=65.00]Epoch 0:  22%|██▏       | 264/1208 [07:43<27:36,  1.75s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.00571, train/loss_vlb_step=3.01e-5, train/loss_step=0.00571, global_step=65.00]Epoch 0:  22%|██▏       | 264/1208 [07:43<27:36,  1.75s/it, loss=0.0945, v_num=0, train/loss_simple_step=0.0411, train/loss_vlb_step=0.000153, train/loss_step=0.0411, global_step=65.00] Epoch 0:  22%|██▏       | 265/1208 [07:44<27:32,  1.75s/it, loss=0.0945, v_num=0, train/loss_simple_step=0.0411, train/loss_vlb_step=0.000153, train/loss_step=0.0411, global_step=65.00]Epoch 0:  22%|██▏       | 265/1208 [07:44<27:32,  1.75s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.00651, train/loss_vlb_step=3.5e-5, train/loss_step=0.00651, global_step=66.00]Epoch 0:  22%|██▏       | 266/1208 [07:45<27:28,  1.75s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.00651, train/loss_vlb_step=3.5e-5, train/loss_step=0.00651, global_step=66.00]Epoch 0:  22%|██▏       | 266/1208 [07:45<27:28,  1.75s/it, loss=0.085, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000863, train/loss_step=0.225, global_step=66.00]   Epoch 0:  22%|██▏       | 267/1208 [07:46<27:24,  1.75s/it, loss=0.085, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000863, train/loss_step=0.225, global_step=66.00]Epoch 0:  22%|██▏       | 267/1208 [07:46<27:24,  1.75s/it, loss=0.0794, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=1.46e-5, train/loss_step=0.00245, global_step=66.00]Epoch 0:  22%|██▏       | 268/1208 [07:49<27:27,  1.75s/it, loss=0.0794, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=1.46e-5, train/loss_step=0.00245, global_step=66.00]Epoch 0:  22%|██▏       | 268/1208 [07:49<27:27,  1.75s/it, loss=0.0691, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.59e-5, train/loss_step=0.0144, global_step=66.00]  Epoch 0:  22%|██▏       | 269/1208 [07:50<27:23,  1.75s/it, loss=0.0691, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.59e-5, train/loss_step=0.0144, global_step=66.00]Epoch 0:  22%|██▏       | 269/1208 [07:50<27:23,  1.75s/it, loss=0.0696, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.49e-5, train/loss_step=0.0151, global_step=67.00]Epoch 0:  22%|██▏       | 270/1208 [07:51<27:19,  1.75s/it, loss=0.0696, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.49e-5, train/loss_step=0.0151, global_step=67.00]Epoch 0:  22%|██▏       | 270/1208 [07:51<27:19,  1.75s/it, loss=0.076, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00122, train/loss_step=0.300, global_step=67.00]   Epoch 0:  22%|██▏       | 271/1208 [07:52<27:15,  1.75s/it, loss=0.076, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00122, train/loss_step=0.300, global_step=67.00]Epoch 0:  22%|██▏       | 271/1208 [07:52<27:15,  1.75s/it, loss=0.0782, v_num=0, train/loss_simple_step=0.0671, train/loss_vlb_step=0.000229, train/loss_step=0.0671, global_step=67.00]Epoch 0:  23%|██▎       | 272/1208 [07:56<27:19,  1.75s/it, loss=0.0782, v_num=0, train/loss_simple_step=0.0671, train/loss_vlb_step=0.000229, train/loss_step=0.0671, global_step=67.00]Epoch 0:  23%|██▎       | 272/1208 [07:56<27:19,  1.75s/it, loss=0.0782, v_num=0, train/loss_simple_step=0.00866, train/loss_vlb_step=4.05e-5, train/loss_step=0.00866, global_step=67.00]Epoch 0:  23%|██▎       | 273/1208 [07:57<27:15,  1.75s/it, loss=0.0782, v_num=0, train/loss_simple_step=0.00866, train/loss_vlb_step=4.05e-5, train/loss_step=0.00866, global_step=67.00]Epoch 0:  23%|██▎       | 273/1208 [07:57<27:15,  1.75s/it, loss=0.0714, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.51e-5, train/loss_step=0.00261, global_step=68.00]Epoch 0:  23%|██▎       | 274/1208 [07:58<27:11,  1.75s/it, loss=0.0714, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.51e-5, train/loss_step=0.00261, global_step=68.00]Epoch 0:  23%|██▎       | 274/1208 [07:58<27:11,  1.75s/it, loss=0.059, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=2.25e-5, train/loss_step=0.00407, global_step=68.00] Epoch 0:  23%|██▎       | 275/1208 [07:59<27:06,  1.74s/it, loss=0.059, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=2.25e-5, train/loss_step=0.00407, global_step=68.00]Epoch 0:  23%|██▎       | 275/1208 [07:59<27:06,  1.74s/it, loss=0.0648, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000981, train/loss_step=0.248, global_step=68.00]  Epoch 0:  23%|██▎       | 276/1208 [08:02<27:10,  1.75s/it, loss=0.0648, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000981, train/loss_step=0.248, global_step=68.00]Epoch 0:  23%|██▎       | 276/1208 [08:02<27:10,  1.75s/it, loss=0.0733, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000574, train/loss_step=0.173, global_step=68.00]Epoch 0:  23%|██▎       | 277/1208 [08:03<27:06,  1.75s/it, loss=0.0733, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000574, train/loss_step=0.173, global_step=68.00]Epoch 0:  23%|██▎       | 277/1208 [08:03<27:06,  1.75s/it, loss=0.0729, v_num=0, train/loss_simple_step=0.00283, train/loss_vlb_step=1.64e-5, train/loss_step=0.00283, global_step=69.00]Epoch 0:  23%|██▎       | 278/1208 [08:04<27:02,  1.74s/it, loss=0.0729, v_num=0, train/loss_simple_step=0.00283, train/loss_vlb_step=1.64e-5, train/loss_step=0.00283, global_step=69.00]Epoch 0:  23%|██▎       | 278/1208 [08:04<27:02,  1.74s/it, loss=0.0737, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=8.01e-5, train/loss_step=0.0193, global_step=69.00]  Epoch 0:  23%|██▎       | 279/1208 [08:05<26:58,  1.74s/it, loss=0.0737, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=8.01e-5, train/loss_step=0.0193, global_step=69.00]Epoch 0:  23%|██▎       | 279/1208 [08:05<26:58,  1.74s/it, loss=0.0815, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000574, train/loss_step=0.171, global_step=69.00] Epoch 0:  23%|██▎       | 280/1208 [08:09<27:01,  1.75s/it, loss=0.0815, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000574, train/loss_step=0.171, global_step=69.00]Epoch 0:  23%|██▎       | 280/1208 [08:09<27:01,  1.75s/it, loss=0.0943, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00105, train/loss_step=0.261, global_step=69.00] Epoch 0:  23%|██▎       | 281/1208 [08:10<26:57,  1.75s/it, loss=0.0943, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00105, train/loss_step=0.261, global_step=69.00]Epoch 0:  23%|██▎       | 281/1208 [08:10<26:57,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00197, train/loss_step=0.371, global_step=70.00] Epoch 0:  23%|██▎       | 282/1208 [08:11<26:53,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00197, train/loss_step=0.371, global_step=70.00]Epoch 0:  23%|██▎       | 282/1208 [08:11<26:53,  1.74s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.0074, train/loss_vlb_step=3.73e-5, train/loss_step=0.0074, global_step=70.00]Epoch 0:  23%|██▎       | 283/1208 [08:12<26:49,  1.74s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.0074, train/loss_vlb_step=3.73e-5, train/loss_step=0.0074, global_step=70.00]Epoch 0:  23%|██▎       | 283/1208 [08:12<26:49,  1.74s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=5.06e-5, train/loss_step=0.0105, global_step=70.00]Epoch 0:  24%|██▎       | 284/1208 [08:15<26:52,  1.75s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=5.06e-5, train/loss_step=0.0105, global_step=70.00]Epoch 0:  24%|██▎       | 284/1208 [08:15<26:52,  1.75s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.00533, train/loss_vlb_step=2.79e-5, train/loss_step=0.00533, global_step=70.00]Epoch 0:  24%|██▎       | 285/1208 [08:16<26:48,  1.74s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.00533, train/loss_vlb_step=2.79e-5, train/loss_step=0.00533, global_step=70.00]Epoch 0:  24%|██▎       | 285/1208 [08:16<26:48,  1.74s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.000135, train/loss_step=0.0362, global_step=71.00] Epoch 0:  24%|██▎       | 286/1208 [08:17<26:44,  1.74s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.000135, train/loss_step=0.0362, global_step=71.00]Epoch 0:  24%|██▎       | 286/1208 [08:17<26:44,  1.74s/it, loss=0.098, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000952, train/loss_step=0.239, global_step=71.00]   Epoch 0:  24%|██▍       | 287/1208 [08:18<26:40,  1.74s/it, loss=0.098, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000952, train/loss_step=0.239, global_step=71.00]Epoch 0:  24%|██▍       | 287/1208 [08:18<26:40,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.508, train/loss_vlb_step=0.00421, train/loss_step=0.508, global_step=71.00] Epoch 0:  24%|██▍       | 288/1208 [08:22<26:43,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.508, train/loss_vlb_step=0.00421, train/loss_step=0.508, global_step=71.00]Epoch 0:  24%|██▍       | 288/1208 [08:22<26:43,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00514, train/loss_vlb_step=2.7e-5, train/loss_step=0.00514, global_step=71.00]Epoch 0:  24%|██▍       | 289/1208 [08:23<26:40,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00514, train/loss_vlb_step=2.7e-5, train/loss_step=0.00514, global_step=71.00]Epoch 0:  24%|██▍       | 289/1208 [08:23<26:40,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.67e-5, train/loss_step=0.0157, global_step=72.00] Epoch 0:  24%|██▍       | 290/1208 [08:24<26:36,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.67e-5, train/loss_step=0.0157, global_step=72.00]Epoch 0:  24%|██▍       | 290/1208 [08:24<26:36,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0882, train/loss_vlb_step=0.000297, train/loss_step=0.0882, global_step=72.00]Epoch 0:  24%|██▍       | 291/1208 [08:25<26:32,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0882, train/loss_vlb_step=0.000297, train/loss_step=0.0882, global_step=72.00]Epoch 0:  24%|██▍       | 291/1208 [08:25<26:32,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000635, train/loss_step=0.186, global_step=72.00]  Epoch 0:  24%|██▍       | 292/1208 [08:28<26:35,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000635, train/loss_step=0.186, global_step=72.00]Epoch 0:  24%|██▍       | 292/1208 [08:28<26:35,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000433, train/loss_step=0.128, global_step=72.00]Epoch 0:  24%|██▍       | 293/1208 [08:29<26:31,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000433, train/loss_step=0.128, global_step=72.00]Epoch 0:  24%|██▍       | 293/1208 [08:29<26:31,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00212, train/loss_step=0.336, global_step=73.00] Epoch 0:  24%|██▍       | 294/1208 [08:30<26:27,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00212, train/loss_step=0.336, global_step=73.00]Epoch 0:  24%|██▍       | 294/1208 [08:30<26:27,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.584, train/loss_vlb_step=0.0107, train/loss_step=0.584, global_step=73.00]  Epoch 0:  24%|██▍       | 295/1208 [08:31<26:23,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.584, train/loss_vlb_step=0.0107, train/loss_step=0.584, global_step=73.00]Epoch 0:  24%|██▍       | 295/1208 [08:31<26:23,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000648, train/loss_step=0.190, global_step=73.00]Epoch 0:  25%|██▍       | 296/1208 [08:35<26:26,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000648, train/loss_step=0.190, global_step=73.00]Epoch 0:  25%|██▍       | 296/1208 [08:35<26:26,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0682, train/loss_vlb_step=0.000238, train/loss_step=0.0682, global_step=73.00]Epoch 0:  25%|██▍       | 297/1208 [08:36<26:22,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0682, train/loss_vlb_step=0.000238, train/loss_step=0.0682, global_step=73.00]Epoch 0:  25%|██▍       | 297/1208 [08:36<26:22,  1.74s/it, loss=0.198, v_num=0, train/loss_simple_step=0.726, train/loss_vlb_step=0.0254, train/loss_step=0.726, global_step=74.00]    Epoch 0:  25%|██▍       | 298/1208 [08:37<26:19,  1.74s/it, loss=0.198, v_num=0, train/loss_simple_step=0.726, train/loss_vlb_step=0.0254, train/loss_step=0.726, global_step=74.00]Epoch 0:  25%|██▍       | 298/1208 [08:37<26:19,  1.74s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=3.45e-5, train/loss_step=0.00677, global_step=74.00]Epoch 0:  25%|██▍       | 299/1208 [08:38<26:15,  1.73s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=3.45e-5, train/loss_step=0.00677, global_step=74.00]Epoch 0:  25%|██▍       | 299/1208 [08:38<26:15,  1.73s/it, loss=0.195, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000424, train/loss_step=0.128, global_step=74.00]   Epoch 0:  25%|██▍       | 300/1208 [08:41<26:18,  1.74s/it, loss=0.195, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000424, train/loss_step=0.128, global_step=74.00]Epoch 0:  25%|██▍       | 300/1208 [08:41<26:18,  1.74s/it, loss=0.198, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00179, train/loss_step=0.323, global_step=74.00] 
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.76it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.75it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.75it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.74it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.74it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.75it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.74it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.75it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.76it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.75it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.76it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.76it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.76it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.76it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.77it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:09,  1.76it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.78it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.78it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.75it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.75it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.75it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 0:  25%|██▍       | 301/1208 [09:12<27:44,  1.83s/it, loss=0.198, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00179, train/loss_step=0.323, global_step=74.00]Epoch 0:  25%|██▍       | 301/1208 [09:12<27:44,  1.83s/it, loss=0.192, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.0012, train/loss_step=0.257, global_step=75.00] Epoch 0:  25%|██▌       | 302/1208 [09:13<27:39,  1.83s/it, loss=0.192, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.0012, train/loss_step=0.257, global_step=75.00]Epoch 0:  25%|██▌       | 302/1208 [09:13<27:39,  1.83s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0865, train/loss_vlb_step=0.000297, train/loss_step=0.0865, global_step=75.00]Epoch 0:  25%|██▌       | 303/1208 [09:14<27:35,  1.83s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0865, train/loss_vlb_step=0.000297, train/loss_step=0.0865, global_step=75.00]Epoch 0:  25%|██▌       | 303/1208 [09:14<27:35,  1.83s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00665, train/loss_vlb_step=3.24e-5, train/loss_step=0.00665, global_step=75.00]Epoch 0:  25%|██▌       | 304/1208 [09:17<27:37,  1.83s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00665, train/loss_vlb_step=3.24e-5, train/loss_step=0.00665, global_step=75.00]Epoch 0:  25%|██▌       | 304/1208 [09:17<27:37,  1.83s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.9e-5, train/loss_step=0.0104, global_step=75.00]   Epoch 0:  25%|██▌       | 305/1208 [09:18<27:33,  1.83s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.9e-5, train/loss_step=0.0104, global_step=75.00]Epoch 0:  25%|██▌       | 305/1208 [09:18<27:33,  1.83s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=0.000101, train/loss_step=0.0257, global_step=76.00]Epoch 0:  25%|██▌       | 306/1208 [09:19<27:29,  1.83s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=0.000101, train/loss_step=0.0257, global_step=76.00]Epoch 0:  25%|██▌       | 306/1208 [09:19<27:29,  1.83s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.57e-5, train/loss_step=0.0127, global_step=76.00] Epoch 0:  25%|██▌       | 307/1208 [09:20<27:25,  1.83s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.57e-5, train/loss_step=0.0127, global_step=76.00]Epoch 0:  25%|██▌       | 307/1208 [09:20<27:25,  1.83s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.000112, train/loss_step=0.0285, global_step=76.00]Epoch 0:  25%|██▌       | 308/1208 [09:23<27:27,  1.83s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.000112, train/loss_step=0.0285, global_step=76.00]Epoch 0:  25%|██▌       | 308/1208 [09:23<27:27,  1.83s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0981, train/loss_vlb_step=0.000324, train/loss_step=0.0981, global_step=76.00]Epoch 0:  26%|██▌       | 309/1208 [09:24<27:23,  1.83s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0981, train/loss_vlb_step=0.000324, train/loss_step=0.0981, global_step=76.00]Epoch 0:  26%|██▌       | 309/1208 [09:24<27:23,  1.83s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0546, train/loss_vlb_step=0.000192, train/loss_step=0.0546, global_step=77.00]Epoch 0:  26%|██▌       | 310/1208 [09:26<27:19,  1.83s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0546, train/loss_vlb_step=0.000192, train/loss_step=0.0546, global_step=77.00]Epoch 0:  26%|██▌       | 310/1208 [09:26<27:19,  1.83s/it, loss=0.166, v_num=0, train/loss_simple_step=0.071, train/loss_vlb_step=0.000237, train/loss_step=0.071, global_step=77.00]  Epoch 0:  26%|██▌       | 311/1208 [09:27<27:15,  1.82s/it, loss=0.166, v_num=0, train/loss_simple_step=0.071, train/loss_vlb_step=0.000237, train/loss_step=0.071, global_step=77.00]Epoch 0:  26%|██▌       | 311/1208 [09:27<27:15,  1.82s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00646, train/loss_vlb_step=3.42e-5, train/loss_step=0.00646, global_step=77.00]Epoch 0:  26%|██▌       | 312/1208 [09:30<27:17,  1.83s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00646, train/loss_vlb_step=3.42e-5, train/loss_step=0.00646, global_step=77.00]Epoch 0:  26%|██▌       | 312/1208 [09:30<27:17,  1.83s/it, loss=0.161, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000727, train/loss_step=0.195, global_step=77.00]   Epoch 0:  26%|██▌       | 313/1208 [09:31<27:13,  1.83s/it, loss=0.161, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000727, train/loss_step=0.195, global_step=77.00]Epoch 0:  26%|██▌       | 313/1208 [09:31<27:13,  1.83s/it, loss=0.152, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000501, train/loss_step=0.152, global_step=78.00]Epoch 0:  26%|██▌       | 314/1208 [09:32<27:09,  1.82s/it, loss=0.152, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000501, train/loss_step=0.152, global_step=78.00]Epoch 0:  26%|██▌       | 314/1208 [09:32<27:09,  1.82s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0861, train/loss_vlb_step=0.000297, train/loss_step=0.0861, global_step=78.00]Epoch 0:  26%|██▌       | 315/1208 [09:33<27:05,  1.82s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0861, train/loss_vlb_step=0.000297, train/loss_step=0.0861, global_step=78.00]Epoch 0:  26%|██▌       | 315/1208 [09:33<27:05,  1.82s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0865, train/loss_vlb_step=0.000289, train/loss_step=0.0865, global_step=78.00]Epoch 0:  26%|██▌       | 316/1208 [09:36<27:07,  1.83s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0865, train/loss_vlb_step=0.000289, train/loss_step=0.0865, global_step=78.00]Epoch 0:  26%|██▌       | 316/1208 [09:36<27:07,  1.83s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000139, train/loss_step=0.0367, global_step=78.00] Epoch 0:  26%|██▌       | 317/1208 [09:37<27:04,  1.82s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000139, train/loss_step=0.0367, global_step=78.00]Epoch 0:  26%|██▌       | 317/1208 [09:37<27:04,  1.82s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.00012, train/loss_step=0.0322, global_step=79.00]Epoch 0:  26%|██▋       | 318/1208 [09:38<27:00,  1.82s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.00012, train/loss_step=0.0322, global_step=79.00]Epoch 0:  26%|██▋       | 318/1208 [09:38<27:00,  1.82s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.00399, train/loss_vlb_step=2.17e-5, train/loss_step=0.00399, global_step=79.00]Epoch 0:  26%|██▋       | 319/1208 [09:39<26:56,  1.82s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.00399, train/loss_vlb_step=2.17e-5, train/loss_step=0.00399, global_step=79.00]Epoch 0:  26%|██▋       | 319/1208 [09:39<26:56,  1.82s/it, loss=0.0795, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.08e-5, train/loss_step=0.0163, global_step=79.00]  Epoch 0:  26%|██▋       | 320/1208 [09:43<26:58,  1.82s/it, loss=0.0795, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.08e-5, train/loss_step=0.0163, global_step=79.00]Epoch 0:  26%|██▋       | 320/1208 [09:43<26:58,  1.82s/it, loss=0.0636, v_num=0, train/loss_simple_step=0.00434, train/loss_vlb_step=2.43e-5, train/loss_step=0.00434, global_step=79.00]Epoch 0:  27%|██▋       | 321/1208 [09:44<26:54,  1.82s/it, loss=0.0636, v_num=0, train/loss_simple_step=0.00434, train/loss_vlb_step=2.43e-5, train/loss_step=0.00434, global_step=79.00]Epoch 0:  27%|██▋       | 321/1208 [09:44<26:54,  1.82s/it, loss=0.0558, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=80.00]   Epoch 0:  27%|██▋       | 322/1208 [09:45<26:50,  1.82s/it, loss=0.0558, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=80.00]Epoch 0:  27%|██▋       | 322/1208 [09:45<26:50,  1.82s/it, loss=0.0516, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.69e-5, train/loss_step=0.00286, global_step=80.00]Epoch 0:  27%|██▋       | 323/1208 [09:46<26:46,  1.82s/it, loss=0.0516, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.69e-5, train/loss_step=0.00286, global_step=80.00]Epoch 0:  27%|██▋       | 323/1208 [09:46<26:46,  1.82s/it, loss=0.0647, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00101, train/loss_step=0.269, global_step=80.00]    Epoch 0:  27%|██▋       | 324/1208 [09:49<26:49,  1.82s/it, loss=0.0647, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00101, train/loss_step=0.269, global_step=80.00]Epoch 0:  27%|██▋       | 324/1208 [09:49<26:49,  1.82s/it, loss=0.0766, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.000931, train/loss_step=0.247, global_step=80.00]Epoch 0:  27%|██▋       | 325/1208 [09:50<26:45,  1.82s/it, loss=0.0766, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.000931, train/loss_step=0.247, global_step=80.00]Epoch 0:  27%|██▋       | 325/1208 [09:50<26:45,  1.82s/it, loss=0.0755, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.18e-5, train/loss_step=0.00394, global_step=81.00]Epoch 0:  27%|██▋       | 326/1208 [09:51<26:41,  1.82s/it, loss=0.0755, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.18e-5, train/loss_step=0.00394, global_step=81.00]Epoch 0:  27%|██▋       | 326/1208 [09:51<26:41,  1.82s/it, loss=0.0752, v_num=0, train/loss_simple_step=0.00833, train/loss_vlb_step=4.13e-5, train/loss_step=0.00833, global_step=81.00]Epoch 0:  27%|██▋       | 327/1208 [09:52<26:37,  1.81s/it, loss=0.0752, v_num=0, train/loss_simple_step=0.00833, train/loss_vlb_step=4.13e-5, train/loss_step=0.00833, global_step=81.00]Epoch 0:  27%|██▋       | 327/1208 [09:52<26:37,  1.81s/it, loss=0.0741, v_num=0, train/loss_simple_step=0.00521, train/loss_vlb_step=2.74e-5, train/loss_step=0.00521, global_step=81.00]Epoch 0:  27%|██▋       | 328/1208 [09:56<26:39,  1.82s/it, loss=0.0741, v_num=0, train/loss_simple_step=0.00521, train/loss_vlb_step=2.74e-5, train/loss_step=0.00521, global_step=81.00]Epoch 0:  27%|██▋       | 328/1208 [09:56<26:39,  1.82s/it, loss=0.0752, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=81.00]   Epoch 0:  27%|██▋       | 329/1208 [09:57<26:35,  1.82s/it, loss=0.0752, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=81.00]Epoch 0:  27%|██▋       | 329/1208 [09:57<26:35,  1.82s/it, loss=0.0846, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.000988, train/loss_step=0.243, global_step=82.00]Epoch 0:  27%|██▋       | 330/1208 [09:58<26:32,  1.81s/it, loss=0.0846, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.000988, train/loss_step=0.243, global_step=82.00]Epoch 0:  27%|██▋       | 330/1208 [09:58<26:32,  1.81s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.0752, train/loss_vlb_step=0.000256, train/loss_step=0.0752, global_step=82.00]Epoch 0:  27%|██▋       | 331/1208 [09:59<26:28,  1.81s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.0752, train/loss_vlb_step=0.000256, train/loss_step=0.0752, global_step=82.00]Epoch 0:  27%|██▋       | 331/1208 [09:59<26:28,  1.81s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00123, train/loss_step=0.264, global_step=82.00]   Epoch 0:  27%|██▋       | 332/1208 [10:02<26:30,  1.82s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00123, train/loss_step=0.264, global_step=82.00]Epoch 0:  27%|██▋       | 332/1208 [10:02<26:30,  1.82s/it, loss=0.0881, v_num=0, train/loss_simple_step=0.00346, train/loss_vlb_step=1.98e-5, train/loss_step=0.00346, global_step=82.00]Epoch 0:  28%|██▊       | 333/1208 [10:03<26:26,  1.81s/it, loss=0.0881, v_num=0, train/loss_simple_step=0.00346, train/loss_vlb_step=1.98e-5, train/loss_step=0.00346, global_step=82.00]Epoch 0:  28%|██▊       | 333/1208 [10:03<26:26,  1.81s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000464, train/loss_step=0.141, global_step=83.00]   Epoch 0:  28%|██▊       | 334/1208 [10:04<26:22,  1.81s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000464, train/loss_step=0.141, global_step=83.00]Epoch 0:  28%|██▊       | 334/1208 [10:04<26:22,  1.81s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.064, train/loss_vlb_step=0.000217, train/loss_step=0.064, global_step=83.00]Epoch 0:  28%|██▊       | 335/1208 [10:05<26:18,  1.81s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.064, train/loss_vlb_step=0.000217, train/loss_step=0.064, global_step=83.00]Epoch 0:  28%|██▊       | 335/1208 [10:05<26:18,  1.81s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00127, train/loss_step=0.300, global_step=83.00] Epoch 0:  28%|██▊       | 336/1208 [10:09<26:20,  1.81s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00127, train/loss_step=0.300, global_step=83.00]Epoch 0:  28%|██▊       | 336/1208 [10:09<26:20,  1.81s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.000113, train/loss_step=0.0285, global_step=83.00]Epoch 0:  28%|██▊       | 337/1208 [10:10<26:16,  1.81s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.000113, train/loss_step=0.0285, global_step=83.00]Epoch 0:  28%|██▊       | 337/1208 [10:10<26:16,  1.81s/it, loss=0.116, v_num=0, train/loss_simple_step=0.419, train/loss_vlb_step=0.00259, train/loss_step=0.419, global_step=84.00]    Epoch 0:  28%|██▊       | 338/1208 [10:11<26:13,  1.81s/it, loss=0.116, v_num=0, train/loss_simple_step=0.419, train/loss_vlb_step=0.00259, train/loss_step=0.419, global_step=84.00]Epoch 0:  28%|██▊       | 338/1208 [10:11<26:13,  1.81s/it, loss=0.123, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000492, train/loss_step=0.145, global_step=84.00]Epoch 0:  28%|██▊       | 339/1208 [10:12<26:09,  1.81s/it, loss=0.123, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000492, train/loss_step=0.145, global_step=84.00]Epoch 0:  28%|██▊       | 339/1208 [10:12<26:09,  1.81s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=0.000102, train/loss_step=0.0246, global_step=84.00]Epoch 0:  28%|██▊       | 340/1208 [10:15<26:11,  1.81s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=0.000102, train/loss_step=0.0246, global_step=84.00]Epoch 0:  28%|██▊       | 340/1208 [10:15<26:11,  1.81s/it, loss=0.128, v_num=0, train/loss_simple_step=0.096, train/loss_vlb_step=0.000317, train/loss_step=0.096, global_step=84.00]  Epoch 0:  28%|██▊       | 341/1208 [10:16<26:07,  1.81s/it, loss=0.128, v_num=0, train/loss_simple_step=0.096, train/loss_vlb_step=0.000317, train/loss_step=0.096, global_step=84.00]Epoch 0:  28%|██▊       | 341/1208 [10:16<26:07,  1.81s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.000164, train/loss_step=0.0459, global_step=85.00]Epoch 0:  28%|██▊       | 342/1208 [10:17<26:04,  1.81s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.000164, train/loss_step=0.0459, global_step=85.00]Epoch 0:  28%|██▊       | 342/1208 [10:17<26:04,  1.81s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0951, train/loss_vlb_step=0.000314, train/loss_step=0.0951, global_step=85.00] Epoch 0:  28%|██▊       | 343/1208 [10:18<26:00,  1.80s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0951, train/loss_vlb_step=0.000314, train/loss_step=0.0951, global_step=85.00]Epoch 0:  28%|██▊       | 343/1208 [10:18<26:00,  1.80s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.41e-5, train/loss_step=0.0174, global_step=85.00]Epoch 0:  28%|██▊       | 344/1208 [10:21<26:02,  1.81s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.41e-5, train/loss_step=0.0174, global_step=85.00]Epoch 0:  28%|██▊       | 344/1208 [10:21<26:02,  1.81s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.28e-5, train/loss_step=0.0168, global_step=85.00]Epoch 0:  29%|██▊       | 345/1208 [10:22<25:58,  1.81s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.28e-5, train/loss_step=0.0168, global_step=85.00]Epoch 0:  29%|██▊       | 345/1208 [10:22<25:58,  1.81s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00686, train/loss_vlb_step=3.53e-5, train/loss_step=0.00686, global_step=86.00]Epoch 0:  29%|██▊       | 346/1208 [10:24<25:54,  1.80s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00686, train/loss_vlb_step=3.53e-5, train/loss_step=0.00686, global_step=86.00]Epoch 0:  29%|██▊       | 346/1208 [10:24<25:54,  1.80s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.79e-5, train/loss_step=0.0144, global_step=86.00]  Epoch 0:  29%|██▊       | 347/1208 [10:25<25:50,  1.80s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.79e-5, train/loss_step=0.0144, global_step=86.00]Epoch 0:  29%|██▊       | 347/1208 [10:25<25:50,  1.80s/it, loss=0.116, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000657, train/loss_step=0.191, global_step=86.00] Epoch 0:  29%|██▉       | 348/1208 [10:28<25:52,  1.81s/it, loss=0.116, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000657, train/loss_step=0.191, global_step=86.00]Epoch 0:  29%|██▉       | 348/1208 [10:28<25:52,  1.81s/it, loss=0.119, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000652, train/loss_step=0.185, global_step=86.00]Epoch 0:  29%|██▉       | 349/1208 [10:29<25:49,  1.80s/it, loss=0.119, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000652, train/loss_step=0.185, global_step=86.00]Epoch 0:  29%|██▉       | 349/1208 [10:29<25:49,  1.80s/it, loss=0.121, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.0012, train/loss_step=0.282, global_step=87.00]  Epoch 0:  29%|██▉       | 350/1208 [10:30<25:45,  1.80s/it, loss=0.121, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.0012, train/loss_step=0.282, global_step=87.00]Epoch 0:  29%|██▉       | 350/1208 [10:30<25:45,  1.80s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0534, train/loss_vlb_step=0.000192, train/loss_step=0.0534, global_step=87.00]Epoch 0:  29%|██▉       | 351/1208 [10:31<25:41,  1.80s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0534, train/loss_vlb_step=0.000192, train/loss_step=0.0534, global_step=87.00]Epoch 0:  29%|██▉       | 351/1208 [10:31<25:41,  1.80s/it, loss=0.119, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00107, train/loss_step=0.245, global_step=87.00]  Epoch 0:  29%|██▉       | 352/1208 [10:34<25:43,  1.80s/it, loss=0.119, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00107, train/loss_step=0.245, global_step=87.00]Epoch 0:  29%|██▉       | 352/1208 [10:34<25:43,  1.80s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.33e-5, train/loss_step=0.0118, global_step=87.00]Epoch 0:  29%|██▉       | 353/1208 [10:35<25:40,  1.80s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.33e-5, train/loss_step=0.0118, global_step=87.00]Epoch 0:  29%|██▉       | 353/1208 [10:35<25:40,  1.80s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000182, train/loss_step=0.0524, global_step=88.00]Epoch 0:  29%|██▉       | 354/1208 [10:36<25:36,  1.80s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000182, train/loss_step=0.0524, global_step=88.00]Epoch 0:  29%|██▉       | 354/1208 [10:36<25:36,  1.80s/it, loss=0.117, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=88.00]  Epoch 0:  29%|██▉       | 355/1208 [10:37<25:32,  1.80s/it, loss=0.117, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=88.00]Epoch 0:  29%|██▉       | 355/1208 [10:37<25:32,  1.80s/it, loss=0.103, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=7.21e-5, train/loss_step=0.016, global_step=88.00] Epoch 0:  29%|██▉       | 356/1208 [10:41<25:34,  1.80s/it, loss=0.103, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=7.21e-5, train/loss_step=0.016, global_step=88.00]Epoch 0:  29%|██▉       | 356/1208 [10:41<25:34,  1.80s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0495, train/loss_vlb_step=0.000179, train/loss_step=0.0495, global_step=88.00]Epoch 0:  30%|██▉       | 357/1208 [10:42<25:31,  1.80s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0495, train/loss_vlb_step=0.000179, train/loss_step=0.0495, global_step=88.00]Epoch 0:  30%|██▉       | 357/1208 [10:42<25:31,  1.80s/it, loss=0.125, v_num=0, train/loss_simple_step=0.837, train/loss_vlb_step=0.421, train/loss_step=0.837, global_step=89.00]     Epoch 0:  30%|██▉       | 358/1208 [10:43<25:27,  1.80s/it, loss=0.125, v_num=0, train/loss_simple_step=0.837, train/loss_vlb_step=0.421, train/loss_step=0.837, global_step=89.00]Epoch 0:  30%|██▉       | 358/1208 [10:43<25:27,  1.80s/it, loss=0.135, v_num=0, train/loss_simple_step=0.358, train/loss_vlb_step=0.00184, train/loss_step=0.358, global_step=89.00]Epoch 0:  30%|██▉       | 359/1208 [10:44<25:23,  1.79s/it, loss=0.135, v_num=0, train/loss_simple_step=0.358, train/loss_vlb_step=0.00184, train/loss_step=0.358, global_step=89.00]Epoch 0:  30%|██▉       | 359/1208 [10:44<25:23,  1.79s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.76e-5, train/loss_step=0.0234, global_step=89.00]Epoch 0:  30%|██▉       | 360/1208 [10:47<25:25,  1.80s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.76e-5, train/loss_step=0.0234, global_step=89.00]Epoch 0:  30%|██▉       | 360/1208 [10:47<25:25,  1.80s/it, loss=0.142, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000922, train/loss_step=0.235, global_step=89.00] Epoch 0:  30%|██▉       | 361/1208 [10:48<25:22,  1.80s/it, loss=0.142, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000922, train/loss_step=0.235, global_step=89.00]Epoch 0:  30%|██▉       | 361/1208 [10:48<25:22,  1.80s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000155, train/loss_step=0.0412, global_step=90.00]Epoch 0:  30%|██▉       | 362/1208 [10:49<25:18,  1.79s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000155, train/loss_step=0.0412, global_step=90.00]Epoch 0:  30%|██▉       | 362/1208 [10:49<25:18,  1.79s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00926, train/loss_vlb_step=4.48e-5, train/loss_step=0.00926, global_step=90.00]Epoch 0:  30%|███       | 363/1208 [10:50<25:14,  1.79s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00926, train/loss_vlb_step=4.48e-5, train/loss_step=0.00926, global_step=90.00]Epoch 0:  30%|███       | 363/1208 [10:50<25:14,  1.79s/it, loss=0.183, v_num=0, train/loss_simple_step=0.930, train/loss_vlb_step=0.468, train/loss_step=0.930, global_step=90.00]      Epoch 0:  30%|███       | 364/1208 [10:54<25:16,  1.80s/it, loss=0.183, v_num=0, train/loss_simple_step=0.930, train/loss_vlb_step=0.468, train/loss_step=0.930, global_step=90.00]Epoch 0:  30%|███       | 364/1208 [10:54<25:16,  1.80s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.000241, train/loss_step=0.0672, global_step=90.00]Epoch 0:  30%|███       | 365/1208 [10:55<25:13,  1.79s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.000241, train/loss_step=0.0672, global_step=90.00]Epoch 0:  30%|███       | 365/1208 [10:55<25:13,  1.79s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.4e-5, train/loss_step=0.0129, global_step=91.00]  Epoch 0:  30%|███       | 366/1208 [10:56<25:09,  1.79s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.4e-5, train/loss_step=0.0129, global_step=91.00]Epoch 0:  30%|███       | 366/1208 [10:56<25:09,  1.79s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00563, train/loss_vlb_step=2.92e-5, train/loss_step=0.00563, global_step=91.00]Epoch 0:  30%|███       | 367/1208 [10:57<25:06,  1.79s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00563, train/loss_vlb_step=2.92e-5, train/loss_step=0.00563, global_step=91.00]Epoch 0:  30%|███       | 367/1208 [10:57<25:06,  1.79s/it, loss=0.192, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00154, train/loss_step=0.326, global_step=91.00]    Epoch 0:  30%|███       | 368/1208 [11:00<25:07,  1.79s/it, loss=0.192, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00154, train/loss_step=0.326, global_step=91.00]Epoch 0:  30%|███       | 368/1208 [11:00<25:07,  1.79s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000121, train/loss_step=0.0306, global_step=91.00]Epoch 0:  31%|███       | 369/1208 [11:01<25:04,  1.79s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000121, train/loss_step=0.0306, global_step=91.00]Epoch 0:  31%|███       | 369/1208 [11:01<25:04,  1.79s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000135, train/loss_step=0.0345, global_step=92.00]Epoch 0:  31%|███       | 370/1208 [11:02<25:00,  1.79s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000135, train/loss_step=0.0345, global_step=92.00]Epoch 0:  31%|███       | 370/1208 [11:02<25:00,  1.79s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00444, train/loss_vlb_step=2.48e-5, train/loss_step=0.00444, global_step=92.00]Epoch 0:  31%|███       | 371/1208 [11:03<24:57,  1.79s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00444, train/loss_vlb_step=2.48e-5, train/loss_step=0.00444, global_step=92.00]Epoch 0:  31%|███       | 371/1208 [11:03<24:57,  1.79s/it, loss=0.164, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000435, train/loss_step=0.132, global_step=92.00]  Epoch 0:  31%|███       | 372/1208 [11:06<24:58,  1.79s/it, loss=0.164, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000435, train/loss_step=0.132, global_step=92.00]Epoch 0:  31%|███       | 372/1208 [11:06<24:58,  1.79s/it, loss=0.171, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000496, train/loss_step=0.147, global_step=92.00]Epoch 0:  31%|███       | 373/1208 [11:08<24:55,  1.79s/it, loss=0.171, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000496, train/loss_step=0.147, global_step=92.00]Epoch 0:  31%|███       | 373/1208 [11:08<24:55,  1.79s/it, loss=0.188, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00252, train/loss_step=0.397, global_step=93.00] Epoch 0:  31%|███       | 374/1208 [11:09<24:51,  1.79s/it, loss=0.188, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00252, train/loss_step=0.397, global_step=93.00]Epoch 0:  31%|███       | 374/1208 [11:09<24:51,  1.79s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00948, train/loss_vlb_step=4.52e-5, train/loss_step=0.00948, global_step=93.00]Epoch 0:  31%|███       | 375/1208 [11:10<24:48,  1.79s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00948, train/loss_vlb_step=4.52e-5, train/loss_step=0.00948, global_step=93.00]Epoch 0:  31%|███       | 375/1208 [11:10<24:48,  1.79s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=1.4e-5, train/loss_step=0.00242, global_step=93.00] Epoch 0:  31%|███       | 376/1208 [11:13<24:49,  1.79s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=1.4e-5, train/loss_step=0.00242, global_step=93.00]Epoch 0:  31%|███       | 376/1208 [11:13<24:49,  1.79s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00757, train/loss_vlb_step=3.57e-5, train/loss_step=0.00757, global_step=93.00]Epoch 0:  31%|███       | 377/1208 [11:14<24:46,  1.79s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00757, train/loss_vlb_step=3.57e-5, train/loss_step=0.00757, global_step=93.00]Epoch 0:  31%|███       | 377/1208 [11:14<24:46,  1.79s/it, loss=0.152, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00104, train/loss_step=0.258, global_step=94.00]    Epoch 0:  31%|███▏      | 378/1208 [11:15<24:43,  1.79s/it, loss=0.152, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00104, train/loss_step=0.258, global_step=94.00]Epoch 0:  31%|███▏      | 378/1208 [11:15<24:43,  1.79s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.9e-5, train/loss_step=0.0108, global_step=94.00]Epoch 0:  31%|███▏      | 379/1208 [11:16<24:39,  1.78s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.9e-5, train/loss_step=0.0108, global_step=94.00]Epoch 0:  31%|███▏      | 379/1208 [11:16<24:39,  1.78s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000104, train/loss_step=0.0255, global_step=94.00]Epoch 0:  31%|███▏      | 380/1208 [11:19<24:41,  1.79s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000104, train/loss_step=0.0255, global_step=94.00]Epoch 0:  31%|███▏      | 380/1208 [11:19<24:41,  1.79s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.84e-5, train/loss_step=0.00312, global_step=94.00]Epoch 0:  32%|███▏      | 381/1208 [11:20<24:37,  1.79s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.84e-5, train/loss_step=0.00312, global_step=94.00]Epoch 0:  32%|███▏      | 381/1208 [11:20<24:37,  1.79s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00903, train/loss_vlb_step=4.37e-5, train/loss_step=0.00903, global_step=95.00]Epoch 0:  32%|███▏      | 382/1208 [11:21<24:34,  1.78s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00903, train/loss_vlb_step=4.37e-5, train/loss_step=0.00903, global_step=95.00]Epoch 0:  32%|███▏      | 382/1208 [11:21<24:34,  1.78s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=8.34e-5, train/loss_step=0.0193, global_step=95.00]  Epoch 0:  32%|███▏      | 383/1208 [11:22<24:30,  1.78s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=8.34e-5, train/loss_step=0.0193, global_step=95.00]Epoch 0:  32%|███▏      | 383/1208 [11:22<24:30,  1.78s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.0022, train/loss_step=0.361, global_step=95.00]  Epoch 0:  32%|███▏      | 384/1208 [11:26<24:32,  1.79s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.0022, train/loss_step=0.361, global_step=95.00]Epoch 0:  32%|███▏      | 384/1208 [11:26<24:32,  1.79s/it, loss=0.093, v_num=0, train/loss_simple_step=0.064, train/loss_vlb_step=0.000225, train/loss_step=0.064, global_step=95.00]Epoch 0:  32%|███▏      | 385/1208 [11:27<24:29,  1.79s/it, loss=0.093, v_num=0, train/loss_simple_step=0.064, train/loss_vlb_step=0.000225, train/loss_step=0.064, global_step=95.00]Epoch 0:  32%|███▏      | 385/1208 [11:27<24:29,  1.79s/it, loss=0.104, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000867, train/loss_step=0.227, global_step=96.00]Epoch 0:  32%|███▏      | 386/1208 [11:28<24:25,  1.78s/it, loss=0.104, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000867, train/loss_step=0.227, global_step=96.00]Epoch 0:  32%|███▏      | 386/1208 [11:28<24:26,  1.78s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.97e-5, train/loss_step=0.00342, global_step=96.00]Epoch 0:  32%|███▏      | 387/1208 [11:29<24:22,  1.78s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.97e-5, train/loss_step=0.00342, global_step=96.00]Epoch 0:  32%|███▏      | 387/1208 [11:29<24:22,  1.78s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.00535, train/loss_vlb_step=2.86e-5, train/loss_step=0.00535, global_step=96.00]Epoch 0:  32%|███▏      | 388/1208 [11:32<24:24,  1.79s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.00535, train/loss_vlb_step=2.86e-5, train/loss_step=0.00535, global_step=96.00]Epoch 0:  32%|███▏      | 388/1208 [11:32<24:24,  1.79s/it, loss=0.0874, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000115, train/loss_step=0.0288, global_step=96.00] Epoch 0:  32%|███▏      | 389/1208 [11:33<24:20,  1.78s/it, loss=0.0874, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000115, train/loss_step=0.0288, global_step=96.00]Epoch 0:  32%|███▏      | 389/1208 [11:33<24:20,  1.78s/it, loss=0.13, v_num=0, train/loss_simple_step=0.889, train/loss_vlb_step=0.224, train/loss_step=0.889, global_step=97.00]       Epoch 0:  32%|███▏      | 390/1208 [11:34<24:17,  1.78s/it, loss=0.13, v_num=0, train/loss_simple_step=0.889, train/loss_vlb_step=0.224, train/loss_step=0.889, global_step=97.00]Epoch 0:  32%|███▏      | 390/1208 [11:34<24:17,  1.78s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.54e-5, train/loss_step=0.00268, global_step=97.00]Epoch 0:  32%|███▏      | 391/1208 [11:35<24:14,  1.78s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.54e-5, train/loss_step=0.00268, global_step=97.00]Epoch 0:  32%|███▏      | 391/1208 [11:35<24:14,  1.78s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0688, train/loss_vlb_step=0.000233, train/loss_step=0.0688, global_step=97.00]Epoch 0:  32%|███▏      | 392/1208 [11:39<24:15,  1.78s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0688, train/loss_vlb_step=0.000233, train/loss_step=0.0688, global_step=97.00]Epoch 0:  32%|███▏      | 392/1208 [11:39<24:15,  1.78s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.81e-5, train/loss_step=0.0032, global_step=97.00]  Epoch 0:  33%|███▎      | 393/1208 [11:40<24:12,  1.78s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.81e-5, train/loss_step=0.0032, global_step=97.00]Epoch 0:  33%|███▎      | 393/1208 [11:40<24:12,  1.78s/it, loss=0.11, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000738, train/loss_step=0.200, global_step=98.00] Epoch 0:  33%|███▎      | 394/1208 [11:41<24:08,  1.78s/it, loss=0.11, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000738, train/loss_step=0.200, global_step=98.00]Epoch 0:  33%|███▎      | 394/1208 [11:41<24:08,  1.78s/it, loss=0.115, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=98.00]Epoch 0:  33%|███▎      | 395/1208 [11:42<24:05,  1.78s/it, loss=0.115, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=98.00]Epoch 0:  33%|███▎      | 395/1208 [11:42<24:05,  1.78s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0591, train/loss_vlb_step=0.000216, train/loss_step=0.0591, global_step=98.00]Epoch 0:  33%|███▎      | 396/1208 [11:45<24:07,  1.78s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0591, train/loss_vlb_step=0.000216, train/loss_step=0.0591, global_step=98.00]Epoch 0:  33%|███▎      | 396/1208 [11:45<24:07,  1.78s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=8.38e-5, train/loss_step=0.0195, global_step=98.00] Epoch 0:  33%|███▎      | 397/1208 [11:46<24:03,  1.78s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=8.38e-5, train/loss_step=0.0195, global_step=98.00]Epoch 0:  33%|███▎      | 397/1208 [11:46<24:03,  1.78s/it, loss=0.125, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00175, train/loss_step=0.394, global_step=99.00]  Epoch 0:  33%|███▎      | 398/1208 [11:47<24:00,  1.78s/it, loss=0.125, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00175, train/loss_step=0.394, global_step=99.00]Epoch 0:  33%|███▎      | 398/1208 [11:47<24:00,  1.78s/it, loss=0.148, v_num=0, train/loss_simple_step=0.466, train/loss_vlb_step=0.00371, train/loss_step=0.466, global_step=99.00]Epoch 0:  33%|███▎      | 399/1208 [11:48<23:57,  1.78s/it, loss=0.148, v_num=0, train/loss_simple_step=0.466, train/loss_vlb_step=0.00371, train/loss_step=0.466, global_step=99.00]Epoch 0:  33%|███▎      | 399/1208 [11:48<23:57,  1.78s/it, loss=0.154, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000487, train/loss_step=0.148, global_step=99.00]Epoch 0:  33%|███▎      | 400/1208 [11:52<23:58,  1.78s/it, loss=0.154, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000487, train/loss_step=0.148, global_step=99.00]Epoch 0:  33%|███▎      | 400/1208 [11:52<23:58,  1.78s/it, loss=0.173, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00213, train/loss_step=0.393, global_step=99.00] Epoch 0:  33%|███▎      | 401/1208 [11:53<23:55,  1.78s/it, loss=0.173, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00213, train/loss_step=0.393, global_step=99.00]Epoch 0:  33%|███▎      | 401/1208 [11:53<23:55,  1.78s/it, loss=0.184, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000844, train/loss_step=0.225, global_step=100.0]Epoch 0:  33%|███▎      | 402/1208 [11:54<23:52,  1.78s/it, loss=0.184, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000844, train/loss_step=0.225, global_step=100.0]Epoch 0:  33%|███▎      | 402/1208 [11:54<23:52,  1.78s/it, loss=0.19, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000495, train/loss_step=0.145, global_step=100.0] Epoch 0:  33%|███▎      | 403/1208 [11:55<23:48,  1.78s/it, loss=0.19, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000495, train/loss_step=0.145, global_step=100.0]Epoch 0:  33%|███▎      | 403/1208 [11:55<23:48,  1.78s/it, loss=0.178, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=100.0]Epoch 0:  33%|███▎      | 404/1208 [11:58<23:50,  1.78s/it, loss=0.178, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=100.0]Epoch 0:  33%|███▎      | 404/1208 [11:58<23:50,  1.78s/it, loss=0.18, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=100.0] Epoch 0:  34%|███▎      | 405/1208 [11:59<23:46,  1.78s/it, loss=0.18, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=100.0]Epoch 0:  34%|███▎      | 405/1208 [11:59<23:46,  1.78s/it, loss=0.177, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000576, train/loss_step=0.167, global_step=101.0]Epoch 0:  34%|███▎      | 406/1208 [12:00<23:43,  1.78s/it, loss=0.177, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000576, train/loss_step=0.167, global_step=101.0]Epoch 0:  34%|███▎      | 406/1208 [12:00<23:43,  1.78s/it, loss=0.188, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.00078, train/loss_step=0.215, global_step=101.0] Epoch 0:  34%|███▎      | 407/1208 [12:01<23:40,  1.77s/it, loss=0.188, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.00078, train/loss_step=0.215, global_step=101.0]Epoch 0:  34%|███▎      | 407/1208 [12:01<23:40,  1.77s/it, loss=0.188, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.29e-5, train/loss_step=0.00409, global_step=101.0]Epoch 0:  34%|███▍      | 408/1208 [12:05<23:41,  1.78s/it, loss=0.188, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.29e-5, train/loss_step=0.00409, global_step=101.0]Epoch 0:  34%|███▍      | 408/1208 [12:05<23:41,  1.78s/it, loss=0.196, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000675, train/loss_step=0.187, global_step=101.0]   Epoch 0:  34%|███▍      | 409/1208 [12:06<23:38,  1.78s/it, loss=0.196, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000675, train/loss_step=0.187, global_step=101.0]Epoch 0:  34%|███▍      | 409/1208 [12:06<23:38,  1.78s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0618, train/loss_vlb_step=0.000206, train/loss_step=0.0618, global_step=102.0]Epoch 0:  34%|███▍      | 410/1208 [12:07<23:35,  1.77s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0618, train/loss_vlb_step=0.000206, train/loss_step=0.0618, global_step=102.0]Epoch 0:  34%|███▍      | 410/1208 [12:07<23:35,  1.77s/it, loss=0.173, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00292, train/loss_step=0.381, global_step=102.0]   Epoch 0:  34%|███▍      | 411/1208 [12:08<23:32,  1.77s/it, loss=0.173, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00292, train/loss_step=0.381, global_step=102.0]Epoch 0:  34%|███▍      | 411/1208 [12:08<23:32,  1.77s/it, loss=0.188, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00196, train/loss_step=0.359, global_step=102.0]Epoch 0:  34%|███▍      | 412/1208 [12:11<23:33,  1.78s/it, loss=0.188, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00196, train/loss_step=0.359, global_step=102.0]Epoch 0:  34%|███▍      | 412/1208 [12:11<23:33,  1.78s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000157, train/loss_step=0.0454, global_step=102.0]Epoch 0:  34%|███▍      | 413/1208 [12:12<23:30,  1.77s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000157, train/loss_step=0.0454, global_step=102.0]Epoch 0:  34%|███▍      | 413/1208 [12:12<23:30,  1.77s/it, loss=0.203, v_num=0, train/loss_simple_step=0.468, train/loss_vlb_step=0.00574, train/loss_step=0.468, global_step=103.0]  Epoch 0:  34%|███▍      | 414/1208 [12:13<23:26,  1.77s/it, loss=0.203, v_num=0, train/loss_simple_step=0.468, train/loss_vlb_step=0.00574, train/loss_step=0.468, global_step=103.0]Epoch 0:  34%|███▍      | 414/1208 [12:13<23:26,  1.77s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.35e-5, train/loss_step=0.0111, global_step=103.0]Epoch 0:  34%|███▍      | 415/1208 [12:14<23:23,  1.77s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.35e-5, train/loss_step=0.0111, global_step=103.0]Epoch 0:  34%|███▍      | 415/1208 [12:14<23:23,  1.77s/it, loss=0.215, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00172, train/loss_step=0.393, global_step=103.0]  Epoch 0:  34%|███▍      | 416/1208 [12:17<23:24,  1.77s/it, loss=0.215, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00172, train/loss_step=0.393, global_step=103.0]Epoch 0:  34%|███▍      | 416/1208 [12:17<23:24,  1.77s/it, loss=0.225, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000787, train/loss_step=0.214, global_step=103.0]Epoch 0:  35%|███▍      | 417/1208 [12:18<23:21,  1.77s/it, loss=0.225, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000787, train/loss_step=0.214, global_step=103.0]Epoch 0:  35%|███▍      | 417/1208 [12:18<23:21,  1.77s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=2.43e-5, train/loss_step=0.0046, global_step=104.0]Epoch 0:  35%|███▍      | 418/1208 [12:19<23:18,  1.77s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=2.43e-5, train/loss_step=0.0046, global_step=104.0]Epoch 0:  35%|███▍      | 418/1208 [12:19<23:18,  1.77s/it, loss=0.198, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00127, train/loss_step=0.305, global_step=104.0]  Epoch 0:  35%|███▍      | 419/1208 [12:20<23:15,  1.77s/it, loss=0.198, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00127, train/loss_step=0.305, global_step=104.0]Epoch 0:  35%|███▍      | 419/1208 [12:20<23:15,  1.77s/it, loss=0.19, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=1.32e-5, train/loss_step=0.00221, global_step=104.0]Epoch 0:  35%|███▍      | 420/1208 [12:24<23:16,  1.77s/it, loss=0.19, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=1.32e-5, train/loss_step=0.00221, global_step=104.0]Epoch 0:  35%|███▍      | 420/1208 [12:24<23:16,  1.77s/it, loss=0.179, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000561, train/loss_step=0.166, global_step=104.0]  Epoch 0:  35%|███▍      | 421/1208 [12:25<23:13,  1.77s/it, loss=0.179, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000561, train/loss_step=0.166, global_step=104.0]Epoch 0:  35%|███▍      | 421/1208 [12:25<23:13,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.69e-5, train/loss_step=0.0028, global_step=105.0]Epoch 0:  35%|███▍      | 422/1208 [12:26<23:10,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.69e-5, train/loss_step=0.0028, global_step=105.0]Epoch 0:  35%|███▍      | 422/1208 [12:26<23:10,  1.77s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0843, train/loss_vlb_step=0.000284, train/loss_step=0.0843, global_step=105.0]Epoch 0:  35%|███▌      | 423/1208 [12:27<23:07,  1.77s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0843, train/loss_vlb_step=0.000284, train/loss_step=0.0843, global_step=105.0]Epoch 0:  35%|███▌      | 423/1208 [12:27<23:07,  1.77s/it, loss=0.173, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00125, train/loss_step=0.273, global_step=105.0]   Epoch 0:  35%|███▌      | 424/1208 [12:30<23:08,  1.77s/it, loss=0.173, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00125, train/loss_step=0.273, global_step=105.0]Epoch 0:  35%|███▌      | 424/1208 [12:30<23:08,  1.77s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000152, train/loss_step=0.0438, global_step=105.0]Epoch 0:  35%|███▌      | 425/1208 [12:31<23:04,  1.77s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000152, train/loss_step=0.0438, global_step=105.0]Epoch 0:  35%|███▌      | 425/1208 [12:31<23:04,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.39e-5, train/loss_step=0.0169, global_step=106.0] Epoch 0:  35%|███▌      | 426/1208 [12:32<23:01,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.39e-5, train/loss_step=0.0169, global_step=106.0]Epoch 0:  35%|███▌      | 426/1208 [12:32<23:01,  1.77s/it, loss=0.159, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000568, train/loss_step=0.164, global_step=106.0] Epoch 0:  35%|███▌      | 427/1208 [12:33<22:58,  1.77s/it, loss=0.159, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000568, train/loss_step=0.164, global_step=106.0]Epoch 0:  35%|███▌      | 427/1208 [12:33<22:58,  1.77s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00701, train/loss_vlb_step=3.41e-5, train/loss_step=0.00701, global_step=106.0]Epoch 0:  35%|███▌      | 428/1208 [12:37<22:59,  1.77s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00701, train/loss_vlb_step=3.41e-5, train/loss_step=0.00701, global_step=106.0]Epoch 0:  35%|███▌      | 428/1208 [12:37<22:59,  1.77s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000135, train/loss_step=0.0342, global_step=106.0]Epoch 0:  36%|███▌      | 429/1208 [12:38<22:56,  1.77s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000135, train/loss_step=0.0342, global_step=106.0]Epoch 0:  36%|███▌      | 429/1208 [12:38<22:56,  1.77s/it, loss=0.158, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000617, train/loss_step=0.179, global_step=107.0]  Epoch 0:  36%|███▌      | 430/1208 [12:39<22:53,  1.77s/it, loss=0.158, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000617, train/loss_step=0.179, global_step=107.0]Epoch 0:  36%|███▌      | 430/1208 [12:39<22:53,  1.77s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.000132, train/loss_step=0.0347, global_step=107.0]Epoch 0:  36%|███▌      | 431/1208 [12:40<22:50,  1.76s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.000132, train/loss_step=0.0347, global_step=107.0]Epoch 0:  36%|███▌      | 431/1208 [12:40<22:50,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00118, train/loss_step=0.279, global_step=107.0]  Epoch 0:  36%|███▌      | 432/1208 [12:43<22:51,  1.77s/it, loss=0.136, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00118, train/loss_step=0.279, global_step=107.0]Epoch 0:  36%|███▌      | 432/1208 [12:43<22:51,  1.77s/it, loss=0.149, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00133, train/loss_step=0.289, global_step=107.0]Epoch 0:  36%|███▌      | 433/1208 [12:44<22:48,  1.77s/it, loss=0.149, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00133, train/loss_step=0.289, global_step=107.0]Epoch 0:  36%|███▌      | 433/1208 [12:44<22:48,  1.77s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0383, train/loss_vlb_step=0.000146, train/loss_step=0.0383, global_step=108.0]Epoch 0:  36%|███▌      | 434/1208 [12:45<22:45,  1.76s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0383, train/loss_vlb_step=0.000146, train/loss_step=0.0383, global_step=108.0]Epoch 0:  36%|███▌      | 434/1208 [12:45<22:45,  1.76s/it, loss=0.142, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00141, train/loss_step=0.301, global_step=108.0]   Epoch 0:  36%|███▌      | 435/1208 [12:46<22:42,  1.76s/it, loss=0.142, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00141, train/loss_step=0.301, global_step=108.0]Epoch 0:  36%|███▌      | 435/1208 [12:46<22:42,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0477, train/loss_vlb_step=0.000172, train/loss_step=0.0477, global_step=108.0]Epoch 0:  36%|███▌      | 436/1208 [12:49<22:43,  1.77s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0477, train/loss_vlb_step=0.000172, train/loss_step=0.0477, global_step=108.0]Epoch 0:  36%|███▌      | 436/1208 [12:49<22:43,  1.77s/it, loss=0.125, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.00102, train/loss_step=0.223, global_step=108.0]   Epoch 0:  36%|███▌      | 437/1208 [12:51<22:40,  1.76s/it, loss=0.125, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.00102, train/loss_step=0.223, global_step=108.0]Epoch 0:  36%|███▌      | 437/1208 [12:51<22:40,  1.76s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00675, train/loss_vlb_step=3.39e-5, train/loss_step=0.00675, global_step=109.0]Epoch 0:  36%|███▋      | 438/1208 [12:52<22:37,  1.76s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00675, train/loss_vlb_step=3.39e-5, train/loss_step=0.00675, global_step=109.0]Epoch 0:  36%|███▋      | 438/1208 [12:52<22:37,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0432, train/loss_vlb_step=0.000158, train/loss_step=0.0432, global_step=109.0] Epoch 0:  36%|███▋      | 439/1208 [12:53<22:34,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0432, train/loss_vlb_step=0.000158, train/loss_step=0.0432, global_step=109.0]Epoch 0:  36%|███▋      | 439/1208 [12:53<22:34,  1.76s/it, loss=0.121, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000639, train/loss_step=0.179, global_step=109.0]  Epoch 0:  36%|███▋      | 440/1208 [12:56<22:35,  1.76s/it, loss=0.121, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000639, train/loss_step=0.179, global_step=109.0]Epoch 0:  36%|███▋      | 440/1208 [12:56<22:35,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=1.02e-5, train/loss_step=0.00168, global_step=109.0]Epoch 0:  37%|███▋      | 441/1208 [12:57<22:32,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=1.02e-5, train/loss_step=0.00168, global_step=109.0]Epoch 0:  37%|███▋      | 441/1208 [12:57<22:32,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.001, train/loss_step=0.241, global_step=110.0]      Epoch 0:  37%|███▋      | 442/1208 [12:58<22:29,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.001, train/loss_step=0.241, global_step=110.0]Epoch 0:  37%|███▋      | 442/1208 [12:58<22:29,  1.76s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0404, train/loss_vlb_step=0.000149, train/loss_step=0.0404, global_step=110.0]Epoch 0:  37%|███▋      | 443/1208 [12:59<22:26,  1.76s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0404, train/loss_vlb_step=0.000149, train/loss_step=0.0404, global_step=110.0]Epoch 0:  37%|███▋      | 443/1208 [12:59<22:26,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.530, train/loss_vlb_step=0.00718, train/loss_step=0.530, global_step=110.0]   Epoch 0:  37%|███▋      | 444/1208 [13:02<22:27,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.530, train/loss_vlb_step=0.00718, train/loss_step=0.530, global_step=110.0]Epoch 0:  37%|███▋      | 444/1208 [13:02<22:27,  1.76s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=1.09e-5, train/loss_step=0.0018, global_step=110.0]Epoch 0:  37%|███▋      | 445/1208 [13:03<22:24,  1.76s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=1.09e-5, train/loss_step=0.0018, global_step=110.0]Epoch 0:  37%|███▋      | 445/1208 [13:03<22:24,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.000211, train/loss_step=0.0615, global_step=111.0]Epoch 0:  37%|███▋      | 446/1208 [13:05<22:21,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.000211, train/loss_step=0.0615, global_step=111.0]Epoch 0:  37%|███▋      | 446/1208 [13:05<22:21,  1.76s/it, loss=0.151, v_num=0, train/loss_simple_step=0.489, train/loss_vlb_step=0.00516, train/loss_step=0.489, global_step=111.0]   Epoch 0:  37%|███▋      | 447/1208 [13:06<22:18,  1.76s/it, loss=0.151, v_num=0, train/loss_simple_step=0.489, train/loss_vlb_step=0.00516, train/loss_step=0.489, global_step=111.0]Epoch 0:  37%|███▋      | 447/1208 [13:06<22:18,  1.76s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000134, train/loss_step=0.0337, global_step=111.0]Epoch 0:  37%|███▋      | 448/1208 [13:09<22:19,  1.76s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000134, train/loss_step=0.0337, global_step=111.0]Epoch 0:  37%|███▋      | 448/1208 [13:09<22:19,  1.76s/it, loss=0.158, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000446, train/loss_step=0.135, global_step=111.0]  Epoch 0:  37%|███▋      | 449/1208 [13:10<22:16,  1.76s/it, loss=0.158, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000446, train/loss_step=0.135, global_step=111.0]Epoch 0:  37%|███▋      | 449/1208 [13:10<22:16,  1.76s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0083, train/loss_vlb_step=3.89e-5, train/loss_step=0.0083, global_step=112.0]Epoch 0:  37%|███▋      | 450/1208 [13:11<22:13,  1.76s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0083, train/loss_vlb_step=3.89e-5, train/loss_step=0.0083, global_step=112.0]Epoch 0:  37%|███▋      | 450/1208 [13:11<22:13,  1.76s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.18e-5, train/loss_step=0.00394, global_step=112.0]Epoch 0:  37%|███▋      | 451/1208 [13:12<22:10,  1.76s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.18e-5, train/loss_step=0.00394, global_step=112.0]Epoch 0:  37%|███▋      | 451/1208 [13:12<22:10,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.22e-5, train/loss_step=0.0205, global_step=112.0]  Epoch 0:  37%|███▋      | 452/1208 [13:15<22:11,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.22e-5, train/loss_step=0.0205, global_step=112.0]Epoch 0:  37%|███▋      | 452/1208 [13:15<22:11,  1.76s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00872, train/loss_vlb_step=4.32e-5, train/loss_step=0.00872, global_step=112.0]Epoch 0:  38%|███▊      | 453/1208 [13:16<22:08,  1.76s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00872, train/loss_vlb_step=4.32e-5, train/loss_step=0.00872, global_step=112.0]Epoch 0:  38%|███▊      | 453/1208 [13:16<22:08,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00511, train/loss_vlb_step=2.7e-5, train/loss_step=0.00511, global_step=113.0] Epoch 0:  38%|███▊      | 454/1208 [13:17<22:05,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00511, train/loss_vlb_step=2.7e-5, train/loss_step=0.00511, global_step=113.0]Epoch 0:  38%|███▊      | 454/1208 [13:17<22:05,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000528, train/loss_step=0.156, global_step=113.0]  Epoch 0:  38%|███▊      | 455/1208 [13:18<22:02,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000528, train/loss_step=0.156, global_step=113.0]Epoch 0:  38%|███▊      | 455/1208 [13:18<22:02,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.000244, train/loss_step=0.0702, global_step=113.0]Epoch 0:  38%|███▊      | 456/1208 [13:22<22:03,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.000244, train/loss_step=0.0702, global_step=113.0]Epoch 0:  38%|███▊      | 456/1208 [13:22<22:03,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.669, train/loss_vlb_step=0.0235, train/loss_step=0.669, global_step=113.0]    Epoch 0:  38%|███▊      | 457/1208 [13:23<22:00,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.669, train/loss_vlb_step=0.0235, train/loss_step=0.669, global_step=113.0]Epoch 0:  38%|███▊      | 457/1208 [13:23<22:00,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.33e-5, train/loss_step=0.0022, global_step=114.0]Epoch 0:  38%|███▊      | 458/1208 [13:24<21:57,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.33e-5, train/loss_step=0.0022, global_step=114.0]Epoch 0:  38%|███▊      | 458/1208 [13:24<21:57,  1.76s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=8.02e-5, train/loss_step=0.0185, global_step=114.0]Epoch 0:  38%|███▊      | 459/1208 [13:25<21:54,  1.75s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=8.02e-5, train/loss_step=0.0185, global_step=114.0]Epoch 0:  38%|███▊      | 459/1208 [13:25<21:54,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00707, train/loss_vlb_step=3.44e-5, train/loss_step=0.00707, global_step=114.0]Epoch 0:  38%|███▊      | 460/1208 [13:28<21:55,  1.76s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00707, train/loss_vlb_step=3.44e-5, train/loss_step=0.00707, global_step=114.0]Epoch 0:  38%|███▊      | 460/1208 [13:28<21:55,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000413, train/loss_step=0.125, global_step=114.0]   Epoch 0:  38%|███▊      | 461/1208 [13:29<21:52,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000413, train/loss_step=0.125, global_step=114.0]Epoch 0:  38%|███▊      | 461/1208 [13:29<21:52,  1.76s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.000136, train/loss_step=0.0359, global_step=115.0]Epoch 0:  38%|███▊      | 462/1208 [13:30<21:49,  1.76s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.000136, train/loss_step=0.0359, global_step=115.0]Epoch 0:  38%|███▊      | 462/1208 [13:30<21:49,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=2.03e-5, train/loss_step=0.00368, global_step=115.0]Epoch 0:  38%|███▊      | 463/1208 [13:31<21:46,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=2.03e-5, train/loss_step=0.00368, global_step=115.0]Epoch 0:  38%|███▊      | 463/1208 [13:31<21:46,  1.75s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000251, train/loss_step=0.0732, global_step=115.0]Epoch 0:  38%|███▊      | 464/1208 [13:35<21:47,  1.76s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000251, train/loss_step=0.0732, global_step=115.0]Epoch 0:  38%|███▊      | 464/1208 [13:35<21:47,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.456, train/loss_vlb_step=0.004, train/loss_step=0.456, global_step=115.0]      Epoch 0:  38%|███▊      | 465/1208 [13:36<21:44,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.456, train/loss_vlb_step=0.004, train/loss_step=0.456, global_step=115.0]Epoch 0:  38%|███▊      | 465/1208 [13:36<21:44,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000694, train/loss_step=0.192, global_step=116.0]Epoch 0:  39%|███▊      | 466/1208 [13:37<21:41,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000694, train/loss_step=0.192, global_step=116.0]Epoch 0:  39%|███▊      | 466/1208 [13:37<21:41,  1.75s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.61e-5, train/loss_step=0.0143, global_step=116.0]Epoch 0:  39%|███▊      | 467/1208 [13:38<21:38,  1.75s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.61e-5, train/loss_step=0.0143, global_step=116.0]Epoch 0:  39%|███▊      | 467/1208 [13:38<21:38,  1.75s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00606, train/loss_vlb_step=3.16e-5, train/loss_step=0.00606, global_step=116.0]Epoch 0:  39%|███▊      | 468/1208 [13:41<21:39,  1.76s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00606, train/loss_vlb_step=3.16e-5, train/loss_step=0.00606, global_step=116.0]Epoch 0:  39%|███▊      | 468/1208 [13:41<21:39,  1.76s/it, loss=0.102, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000605, train/loss_step=0.173, global_step=116.0]   Epoch 0:  39%|███▉      | 469/1208 [13:42<21:36,  1.75s/it, loss=0.102, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000605, train/loss_step=0.173, global_step=116.0]Epoch 0:  39%|███▉      | 469/1208 [13:42<21:36,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.11e-5, train/loss_step=0.0144, global_step=117.0]Epoch 0:  39%|███▉      | 470/1208 [13:43<21:33,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.11e-5, train/loss_step=0.0144, global_step=117.0]Epoch 0:  39%|███▉      | 470/1208 [13:43<21:33,  1.75s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0435, train/loss_vlb_step=0.000163, train/loss_step=0.0435, global_step=117.0]Epoch 0:  39%|███▉      | 471/1208 [13:44<21:30,  1.75s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0435, train/loss_vlb_step=0.000163, train/loss_step=0.0435, global_step=117.0]Epoch 0:  39%|███▉      | 471/1208 [13:44<21:30,  1.75s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00583, train/loss_vlb_step=3.09e-5, train/loss_step=0.00583, global_step=117.0]Epoch 0:  39%|███▉      | 472/1208 [13:48<21:31,  1.75s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00583, train/loss_vlb_step=3.09e-5, train/loss_step=0.00583, global_step=117.0]Epoch 0:  39%|███▉      | 472/1208 [13:48<21:31,  1.75s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00841, train/loss_vlb_step=4.08e-5, train/loss_step=0.00841, global_step=117.0]Epoch 0:  39%|███▉      | 473/1208 [13:49<21:28,  1.75s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00841, train/loss_vlb_step=4.08e-5, train/loss_step=0.00841, global_step=117.0]Epoch 0:  39%|███▉      | 473/1208 [13:49<21:28,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000675, train/loss_step=0.191, global_step=118.0]   Epoch 0:  39%|███▉      | 474/1208 [13:50<21:25,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000675, train/loss_step=0.191, global_step=118.0]Epoch 0:  39%|███▉      | 474/1208 [13:50<21:25,  1.75s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00861, train/loss_vlb_step=3.84e-5, train/loss_step=0.00861, global_step=118.0]Epoch 0:  39%|███▉      | 475/1208 [13:51<21:22,  1.75s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00861, train/loss_vlb_step=3.84e-5, train/loss_step=0.00861, global_step=118.0]Epoch 0:  39%|███▉      | 475/1208 [13:51<21:22,  1.75s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0511, train/loss_vlb_step=0.00018, train/loss_step=0.0511, global_step=118.0]  Epoch 0:  39%|███▉      | 476/1208 [13:54<21:23,  1.75s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0511, train/loss_vlb_step=0.00018, train/loss_step=0.0511, global_step=118.0]Epoch 0:  39%|███▉      | 476/1208 [13:54<21:23,  1.75s/it, loss=0.0804, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000634, train/loss_step=0.177, global_step=118.0]Epoch 0:  39%|███▉      | 477/1208 [13:55<21:20,  1.75s/it, loss=0.0804, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000634, train/loss_step=0.177, global_step=118.0]Epoch 0:  39%|███▉      | 477/1208 [13:55<21:20,  1.75s/it, loss=0.101, v_num=0, train/loss_simple_step=0.419, train/loss_vlb_step=0.00312, train/loss_step=0.419, global_step=119.0]  Epoch 0:  40%|███▉      | 478/1208 [13:56<21:17,  1.75s/it, loss=0.101, v_num=0, train/loss_simple_step=0.419, train/loss_vlb_step=0.00312, train/loss_step=0.419, global_step=119.0]Epoch 0:  40%|███▉      | 478/1208 [13:56<21:17,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000767, train/loss_step=0.222, global_step=119.0]Epoch 0:  40%|███▉      | 479/1208 [13:57<21:14,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000767, train/loss_step=0.222, global_step=119.0]Epoch 0:  40%|███▉      | 479/1208 [13:57<21:14,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00621, train/loss_vlb_step=3.06e-5, train/loss_step=0.00621, global_step=119.0]Epoch 0:  40%|███▉      | 480/1208 [14:00<21:15,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00621, train/loss_vlb_step=3.06e-5, train/loss_step=0.00621, global_step=119.0]Epoch 0:  40%|███▉      | 480/1208 [14:00<21:15,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000545, train/loss_step=0.164, global_step=119.0]   Epoch 0:  40%|███▉      | 481/1208 [14:01<21:12,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000545, train/loss_step=0.164, global_step=119.0]Epoch 0:  40%|███▉      | 481/1208 [14:01<21:12,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00107, train/loss_step=0.255, global_step=120.0] Epoch 0:  40%|███▉      | 482/1208 [14:02<21:09,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00107, train/loss_step=0.255, global_step=120.0]Epoch 0:  40%|███▉      | 482/1208 [14:02<21:09,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0717, train/loss_vlb_step=0.000244, train/loss_step=0.0717, global_step=120.0]Epoch 0:  40%|███▉      | 483/1208 [14:04<21:06,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0717, train/loss_vlb_step=0.000244, train/loss_step=0.0717, global_step=120.0]Epoch 0:  40%|███▉      | 483/1208 [14:04<21:06,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000556, train/loss_step=0.162, global_step=120.0]  Epoch 0:  40%|████      | 484/1208 [14:07<21:07,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000556, train/loss_step=0.162, global_step=120.0]Epoch 0:  40%|████      | 484/1208 [14:07<21:07,  1.75s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=0.000101, train/loss_step=0.0246, global_step=120.0]Epoch 0:  40%|████      | 485/1208 [14:08<21:04,  1.75s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=0.000101, train/loss_step=0.0246, global_step=120.0]Epoch 0:  40%|████      | 485/1208 [14:08<21:04,  1.75s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.57e-5, train/loss_step=0.0177, global_step=121.0]Epoch 0:  40%|████      | 486/1208 [14:09<21:01,  1.75s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.57e-5, train/loss_step=0.0177, global_step=121.0]Epoch 0:  40%|████      | 486/1208 [14:09<21:01,  1.75s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0931, train/loss_vlb_step=0.000306, train/loss_step=0.0931, global_step=121.0]Epoch 0:  40%|████      | 487/1208 [14:10<20:59,  1.75s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0931, train/loss_vlb_step=0.000306, train/loss_step=0.0931, global_step=121.0]Epoch 0:  40%|████      | 487/1208 [14:10<20:59,  1.75s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.000174, train/loss_step=0.0508, global_step=121.0]Epoch 0:  40%|████      | 488/1208 [14:13<20:59,  1.75s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.000174, train/loss_step=0.0508, global_step=121.0]Epoch 0:  40%|████      | 488/1208 [14:13<20:59,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00228, train/loss_step=0.348, global_step=121.0]   Epoch 0:  40%|████      | 489/1208 [14:14<20:56,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00228, train/loss_step=0.348, global_step=121.0]Epoch 0:  40%|████      | 489/1208 [14:14<20:56,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.2e-5, train/loss_step=0.0226, global_step=122.0]Epoch 0:  41%|████      | 490/1208 [14:15<20:54,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.2e-5, train/loss_step=0.0226, global_step=122.0]Epoch 0:  41%|████      | 490/1208 [14:15<20:54,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000422, train/loss_step=0.128, global_step=122.0]Epoch 0:  41%|████      | 491/1208 [14:16<20:51,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000422, train/loss_step=0.128, global_step=122.0]Epoch 0:  41%|████      | 491/1208 [14:16<20:51,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000135, train/loss_step=0.0346, global_step=122.0]Epoch 0:  41%|████      | 492/1208 [14:20<20:51,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000135, train/loss_step=0.0346, global_step=122.0]Epoch 0:  41%|████      | 492/1208 [14:20<20:51,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000475, train/loss_step=0.144, global_step=122.0]   Epoch 0:  41%|████      | 493/1208 [14:21<20:48,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000475, train/loss_step=0.144, global_step=122.0]Epoch 0:  41%|████      | 493/1208 [14:21<20:48,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.00046, train/loss_step=0.140, global_step=123.0]Epoch 0:  41%|████      | 494/1208 [14:22<20:46,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.00046, train/loss_step=0.140, global_step=123.0]Epoch 0:  41%|████      | 494/1208 [14:22<20:46,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000355, train/loss_step=0.107, global_step=123.0]Epoch 0:  41%|████      | 495/1208 [14:23<20:43,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000355, train/loss_step=0.107, global_step=123.0]Epoch 0:  41%|████      | 495/1208 [14:23<20:43,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.76e-5, train/loss_step=0.0151, global_step=123.0]Epoch 0:  41%|████      | 496/1208 [14:26<20:43,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.76e-5, train/loss_step=0.0151, global_step=123.0]Epoch 0:  41%|████      | 496/1208 [14:26<20:43,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000127, train/loss_step=0.0332, global_step=123.0]Epoch 0:  41%|████      | 497/1208 [14:27<20:41,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000127, train/loss_step=0.0332, global_step=123.0]Epoch 0:  41%|████      | 497/1208 [14:27<20:41,  1.75s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.57e-5, train/loss_step=0.00267, global_step=124.0]Epoch 0:  41%|████      | 498/1208 [14:28<20:38,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.57e-5, train/loss_step=0.00267, global_step=124.0]Epoch 0:  41%|████      | 498/1208 [14:28<20:38,  1.74s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.25e-5, train/loss_step=0.023, global_step=124.0]   Epoch 0:  41%|████▏     | 499/1208 [14:29<20:35,  1.74s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.25e-5, train/loss_step=0.023, global_step=124.0]Epoch 0:  41%|████▏     | 499/1208 [14:29<20:35,  1.74s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.0054, train/loss_vlb_step=2.72e-5, train/loss_step=0.0054, global_step=124.0]Epoch 0:  41%|████▏     | 500/1208 [14:32<20:36,  1.75s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.0054, train/loss_vlb_step=2.72e-5, train/loss_step=0.0054, global_step=124.0]Epoch 0:  41%|████▏     | 500/1208 [14:32<20:36,  1.75s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000979, train/loss_step=0.244, global_step=124.0] Epoch 0:  41%|████▏     | 501/1208 [14:33<20:33,  1.74s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000979, train/loss_step=0.244, global_step=124.0]Epoch 0:  41%|████▏     | 501/1208 [14:33<20:33,  1.74s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.0466, train/loss_vlb_step=0.000177, train/loss_step=0.0466, global_step=125.0]Epoch 0:  42%|████▏     | 502/1208 [14:35<20:30,  1.74s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.0466, train/loss_vlb_step=0.000177, train/loss_step=0.0466, global_step=125.0]Epoch 0:  42%|████▏     | 502/1208 [14:35<20:30,  1.74s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.89e-5, train/loss_step=0.0162, global_step=125.0] Epoch 0:  42%|████▏     | 503/1208 [14:36<20:27,  1.74s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.89e-5, train/loss_step=0.0162, global_step=125.0]Epoch 0:  42%|████▏     | 503/1208 [14:36<20:27,  1.74s/it, loss=0.0755, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.42e-5, train/loss_step=0.0137, global_step=125.0]Epoch 0:  42%|████▏     | 504/1208 [14:39<20:28,  1.74s/it, loss=0.0755, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.42e-5, train/loss_step=0.0137, global_step=125.0]Epoch 0:  42%|████▏     | 504/1208 [14:39<20:28,  1.74s/it, loss=0.0771, v_num=0, train/loss_simple_step=0.0569, train/loss_vlb_step=0.000199, train/loss_step=0.0569, global_step=125.0]Epoch 0:  42%|████▏     | 505/1208 [14:40<20:25,  1.74s/it, loss=0.0771, v_num=0, train/loss_simple_step=0.0569, train/loss_vlb_step=0.000199, train/loss_step=0.0569, global_step=125.0]Epoch 0:  42%|████▏     | 505/1208 [14:40<20:25,  1.74s/it, loss=0.0831, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000449, train/loss_step=0.137, global_step=126.0]  Epoch 0:  42%|████▏     | 506/1208 [14:41<20:23,  1.74s/it, loss=0.0831, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000449, train/loss_step=0.137, global_step=126.0]Epoch 0:  42%|████▏     | 506/1208 [14:41<20:23,  1.74s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000451, train/loss_step=0.135, global_step=126.0]Epoch 0:  42%|████▏     | 507/1208 [14:42<20:20,  1.74s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000451, train/loss_step=0.135, global_step=126.0]Epoch 0:  42%|████▏     | 507/1208 [14:42<20:20,  1.74s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.24e-5, train/loss_step=0.0172, global_step=126.0]Epoch 0:  42%|████▏     | 508/1208 [14:45<20:20,  1.74s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.24e-5, train/loss_step=0.0172, global_step=126.0]Epoch 0:  42%|████▏     | 508/1208 [14:45<20:20,  1.74s/it, loss=0.0766, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000828, train/loss_step=0.212, global_step=126.0] Epoch 0:  42%|████▏     | 509/1208 [14:47<20:18,  1.74s/it, loss=0.0766, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000828, train/loss_step=0.212, global_step=126.0]Epoch 0:  42%|████▏     | 509/1208 [14:47<20:18,  1.74s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000658, train/loss_step=0.193, global_step=127.0]Epoch 0:  42%|████▏     | 510/1208 [14:48<20:15,  1.74s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000658, train/loss_step=0.193, global_step=127.0]Epoch 0:  42%|████▏     | 510/1208 [14:48<20:15,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.885, train/loss_vlb_step=0.223, train/loss_step=0.885, global_step=127.0]    Epoch 0:  42%|████▏     | 511/1208 [14:49<20:12,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.885, train/loss_vlb_step=0.223, train/loss_step=0.885, global_step=127.0]Epoch 0:  42%|████▏     | 511/1208 [14:49<20:12,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.31e-5, train/loss_step=0.0142, global_step=127.0]Epoch 0:  42%|████▏     | 512/1208 [14:52<20:13,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.31e-5, train/loss_step=0.0142, global_step=127.0]Epoch 0:  42%|████▏     | 512/1208 [14:52<20:13,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00719, train/loss_vlb_step=3.62e-5, train/loss_step=0.00719, global_step=127.0]Epoch 0:  42%|████▏     | 513/1208 [14:53<20:10,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00719, train/loss_vlb_step=3.62e-5, train/loss_step=0.00719, global_step=127.0]Epoch 0:  42%|████▏     | 513/1208 [14:53<20:10,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.87e-5, train/loss_step=0.00341, global_step=128.0]Epoch 0:  43%|████▎     | 514/1208 [14:54<20:07,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.87e-5, train/loss_step=0.00341, global_step=128.0]Epoch 0:  43%|████▎     | 514/1208 [14:54<20:07,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0431, train/loss_vlb_step=0.000147, train/loss_step=0.0431, global_step=128.0] Epoch 0:  43%|████▎     | 515/1208 [14:55<20:05,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0431, train/loss_vlb_step=0.000147, train/loss_step=0.0431, global_step=128.0]Epoch 0:  43%|████▎     | 515/1208 [14:55<20:05,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0081, train/loss_vlb_step=4.07e-5, train/loss_step=0.0081, global_step=128.0] Epoch 0:  43%|████▎     | 516/1208 [14:58<20:05,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0081, train/loss_vlb_step=4.07e-5, train/loss_step=0.0081, global_step=128.0]Epoch 0:  43%|████▎     | 516/1208 [14:58<20:05,  1.74s/it, loss=0.11, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000489, train/loss_step=0.147, global_step=128.0]  Epoch 0:  43%|████▎     | 517/1208 [14:59<20:02,  1.74s/it, loss=0.11, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000489, train/loss_step=0.147, global_step=128.0]Epoch 0:  43%|████▎     | 517/1208 [14:59<20:02,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.00078, train/loss_step=0.214, global_step=129.0]Epoch 0:  43%|████▎     | 518/1208 [15:00<20:00,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.00078, train/loss_step=0.214, global_step=129.0]Epoch 0:  43%|████▎     | 518/1208 [15:00<20:00,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.95e-5, train/loss_step=0.00557, global_step=129.0]Epoch 0:  43%|████▎     | 519/1208 [15:01<19:57,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.95e-5, train/loss_step=0.00557, global_step=129.0]Epoch 0:  43%|████▎     | 519/1208 [15:02<19:57,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.73e-5, train/loss_step=0.0145, global_step=129.0] Epoch 0:  43%|████▎     | 520/1208 [15:05<19:57,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.73e-5, train/loss_step=0.0145, global_step=129.0]Epoch 0:  43%|████▎     | 520/1208 [15:05<19:57,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00927, train/loss_vlb_step=4.36e-5, train/loss_step=0.00927, global_step=129.0]Epoch 0:  43%|████▎     | 521/1208 [15:06<19:55,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00927, train/loss_vlb_step=4.36e-5, train/loss_step=0.00927, global_step=129.0]Epoch 0:  43%|████▎     | 521/1208 [15:06<19:55,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.624, train/loss_vlb_step=0.0194, train/loss_step=0.624, global_step=130.0]     Epoch 0:  43%|████▎     | 522/1208 [15:07<19:52,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.624, train/loss_vlb_step=0.0194, train/loss_step=0.624, global_step=130.0]Epoch 0:  43%|████▎     | 522/1208 [15:07<19:52,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000527, train/loss_step=0.159, global_step=130.0]Epoch 0:  43%|████▎     | 523/1208 [15:08<19:49,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000527, train/loss_step=0.159, global_step=130.0]Epoch 0:  43%|████▎     | 523/1208 [15:08<19:49,  1.74s/it, loss=0.157, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00106, train/loss_step=0.248, global_step=130.0] Epoch 0:  43%|████▎     | 524/1208 [15:11<19:50,  1.74s/it, loss=0.157, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00106, train/loss_step=0.248, global_step=130.0]Epoch 0:  43%|████▎     | 524/1208 [15:11<19:50,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00778, train/loss_vlb_step=3.92e-5, train/loss_step=0.00778, global_step=130.0]Epoch 0:  43%|████▎     | 525/1208 [15:12<19:47,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00778, train/loss_vlb_step=3.92e-5, train/loss_step=0.00778, global_step=130.0]Epoch 0:  43%|████▎     | 525/1208 [15:12<19:47,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=131.0]   Epoch 0:  44%|████▎     | 526/1208 [15:13<19:44,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=131.0]Epoch 0:  44%|████▎     | 526/1208 [15:13<19:44,  1.74s/it, loss=0.157, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000893, train/loss_step=0.218, global_step=131.0]Epoch 0:  44%|████▎     | 527/1208 [15:14<19:42,  1.74s/it, loss=0.157, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000893, train/loss_step=0.218, global_step=131.0]Epoch 0:  44%|████▎     | 527/1208 [15:14<19:42,  1.74s/it, loss=0.161, v_num=0, train/loss_simple_step=0.089, train/loss_vlb_step=0.000293, train/loss_step=0.089, global_step=131.0]Epoch 0:  44%|████▎     | 528/1208 [15:18<19:42,  1.74s/it, loss=0.161, v_num=0, train/loss_simple_step=0.089, train/loss_vlb_step=0.000293, train/loss_step=0.089, global_step=131.0]Epoch 0:  44%|████▎     | 528/1208 [15:18<19:42,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00143, train/loss_step=0.317, global_step=131.0] Epoch 0:  44%|████▍     | 529/1208 [15:19<19:39,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00143, train/loss_step=0.317, global_step=131.0]Epoch 0:  44%|████▍     | 529/1208 [15:19<19:39,  1.74s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0752, train/loss_vlb_step=0.000257, train/loss_step=0.0752, global_step=132.0]Epoch 0:  44%|████▍     | 530/1208 [15:20<19:37,  1.74s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0752, train/loss_vlb_step=0.000257, train/loss_step=0.0752, global_step=132.0]Epoch 0:  44%|████▍     | 530/1208 [15:20<19:37,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00119, train/loss_step=0.272, global_step=132.0]   Epoch 0:  44%|████▍     | 531/1208 [15:21<19:34,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00119, train/loss_step=0.272, global_step=132.0]Epoch 0:  44%|████▍     | 531/1208 [15:21<19:34,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.57e-5, train/loss_step=0.0127, global_step=132.0]Epoch 0:  44%|████▍     | 532/1208 [15:24<19:34,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.57e-5, train/loss_step=0.0127, global_step=132.0]Epoch 0:  44%|████▍     | 532/1208 [15:24<19:34,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000878, train/loss_step=0.229, global_step=132.0]Epoch 0:  44%|████▍     | 533/1208 [15:25<19:32,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000878, train/loss_step=0.229, global_step=132.0]Epoch 0:  44%|████▍     | 533/1208 [15:25<19:32,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0633, train/loss_vlb_step=0.000219, train/loss_step=0.0633, global_step=133.0]Epoch 0:  44%|████▍     | 534/1208 [15:26<19:29,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0633, train/loss_vlb_step=0.000219, train/loss_step=0.0633, global_step=133.0]Epoch 0:  44%|████▍     | 534/1208 [15:26<19:29,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000115, train/loss_step=0.0282, global_step=133.0]Epoch 0:  44%|████▍     | 535/1208 [15:27<19:27,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000115, train/loss_step=0.0282, global_step=133.0]Epoch 0:  44%|████▍     | 535/1208 [15:27<19:27,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000945, train/loss_step=0.240, global_step=133.0]  Epoch 0:  44%|████▍     | 536/1208 [15:30<19:27,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000945, train/loss_step=0.240, global_step=133.0]Epoch 0:  44%|████▍     | 536/1208 [15:31<19:27,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00828, train/loss_vlb_step=4.04e-5, train/loss_step=0.00828, global_step=133.0]Epoch 0:  44%|████▍     | 537/1208 [15:32<19:24,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00828, train/loss_vlb_step=4.04e-5, train/loss_step=0.00828, global_step=133.0]Epoch 0:  44%|████▍     | 537/1208 [15:32<19:24,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0051, train/loss_vlb_step=2.69e-5, train/loss_step=0.0051, global_step=134.0]  Epoch 0:  45%|████▍     | 538/1208 [15:33<19:22,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0051, train/loss_vlb_step=2.69e-5, train/loss_step=0.0051, global_step=134.0]Epoch 0:  45%|████▍     | 538/1208 [15:33<19:22,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.000998, train/loss_step=0.252, global_step=134.0] Epoch 0:  45%|████▍     | 539/1208 [15:34<19:19,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.000998, train/loss_step=0.252, global_step=134.0]Epoch 0:  45%|████▍     | 539/1208 [15:34<19:19,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00202, train/loss_step=0.342, global_step=134.0] Epoch 0:  45%|████▍     | 540/1208 [15:37<19:19,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00202, train/loss_step=0.342, global_step=134.0]Epoch 0:  45%|████▍     | 540/1208 [15:37<19:19,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000614, train/loss_step=0.182, global_step=134.0]Epoch 0:  45%|████▍     | 541/1208 [15:38<19:17,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000614, train/loss_step=0.182, global_step=134.0]Epoch 0:  45%|████▍     | 541/1208 [15:38<19:17,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0561, train/loss_vlb_step=0.000198, train/loss_step=0.0561, global_step=135.0]Epoch 0:  45%|████▍     | 542/1208 [15:39<19:14,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0561, train/loss_vlb_step=0.000198, train/loss_step=0.0561, global_step=135.0]Epoch 0:  45%|████▍     | 542/1208 [15:39<19:14,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000924, train/loss_step=0.214, global_step=135.0]  Epoch 0:  45%|████▍     | 543/1208 [15:40<19:11,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000924, train/loss_step=0.214, global_step=135.0]Epoch 0:  45%|████▍     | 543/1208 [15:40<19:11,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.000123, train/loss_step=0.032, global_step=135.0]Epoch 0:  45%|████▌     | 544/1208 [15:43<19:12,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.000123, train/loss_step=0.032, global_step=135.0]Epoch 0:  45%|████▌     | 544/1208 [15:43<19:12,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00941, train/loss_vlb_step=4.66e-5, train/loss_step=0.00941, global_step=135.0]Epoch 0:  45%|████▌     | 545/1208 [15:44<19:09,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00941, train/loss_vlb_step=4.66e-5, train/loss_step=0.00941, global_step=135.0]Epoch 0:  45%|████▌     | 545/1208 [15:44<19:09,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=136.0]   Epoch 0:  45%|████▌     | 546/1208 [15:45<19:06,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=136.0]Epoch 0:  45%|████▌     | 546/1208 [15:45<19:06,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0533, train/loss_vlb_step=0.000194, train/loss_step=0.0533, global_step=136.0]Epoch 0:  45%|████▌     | 547/1208 [15:47<19:04,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0533, train/loss_vlb_step=0.000194, train/loss_step=0.0533, global_step=136.0]Epoch 0:  45%|████▌     | 547/1208 [15:47<19:04,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00678, train/loss_vlb_step=3.28e-5, train/loss_step=0.00678, global_step=136.0]Epoch 0:  45%|████▌     | 548/1208 [15:50<19:04,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00678, train/loss_vlb_step=3.28e-5, train/loss_step=0.00678, global_step=136.0]Epoch 0:  45%|████▌     | 548/1208 [15:50<19:04,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000849, train/loss_step=0.220, global_step=136.0]    Epoch 0:  45%|████▌     | 549/1208 [15:51<19:01,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000849, train/loss_step=0.220, global_step=136.0]Epoch 0:  45%|████▌     | 549/1208 [15:51<19:01,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.701, train/loss_vlb_step=0.0363, train/loss_step=0.701, global_step=137.0] Epoch 0:  46%|████▌     | 550/1208 [15:52<18:59,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.701, train/loss_vlb_step=0.0363, train/loss_step=0.701, global_step=137.0]Epoch 0:  46%|████▌     | 550/1208 [15:52<18:59,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.065, train/loss_vlb_step=0.000221, train/loss_step=0.065, global_step=137.0]Epoch 0:  46%|████▌     | 551/1208 [15:53<18:56,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.065, train/loss_vlb_step=0.000221, train/loss_step=0.065, global_step=137.0]Epoch 0:  46%|████▌     | 551/1208 [15:53<18:56,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000393, train/loss_step=0.120, global_step=137.0]Epoch 0:  46%|████▌     | 552/1208 [15:56<18:56,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000393, train/loss_step=0.120, global_step=137.0]Epoch 0:  46%|████▌     | 552/1208 [15:56<18:56,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00507, train/loss_vlb_step=2.66e-5, train/loss_step=0.00507, global_step=137.0]Epoch 0:  46%|████▌     | 553/1208 [15:57<18:54,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00507, train/loss_vlb_step=2.66e-5, train/loss_step=0.00507, global_step=137.0]Epoch 0:  46%|████▌     | 553/1208 [15:57<18:54,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000759, train/loss_step=0.216, global_step=138.0]   Epoch 0:  46%|████▌     | 554/1208 [15:58<18:51,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000759, train/loss_step=0.216, global_step=138.0]Epoch 0:  46%|████▌     | 554/1208 [15:58<18:51,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00513, train/loss_vlb_step=2.68e-5, train/loss_step=0.00513, global_step=138.0]Epoch 0:  46%|████▌     | 555/1208 [15:59<18:49,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00513, train/loss_vlb_step=2.68e-5, train/loss_step=0.00513, global_step=138.0]Epoch 0:  46%|████▌     | 555/1208 [15:59<18:49,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=138.0]   Epoch 0:  46%|████▌     | 556/1208 [16:03<18:49,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=138.0]Epoch 0:  46%|████▌     | 556/1208 [16:03<18:49,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.510, train/loss_vlb_step=0.00773, train/loss_step=0.510, global_step=138.0]  Epoch 0:  46%|████▌     | 557/1208 [16:04<18:46,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.510, train/loss_vlb_step=0.00773, train/loss_step=0.510, global_step=138.0]Epoch 0:  46%|████▌     | 557/1208 [16:04<18:46,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000113, train/loss_step=0.0281, global_step=139.0]Epoch 0:  46%|████▌     | 558/1208 [16:05<18:44,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000113, train/loss_step=0.0281, global_step=139.0]Epoch 0:  46%|████▌     | 558/1208 [16:05<18:44,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0596, train/loss_vlb_step=0.000205, train/loss_step=0.0596, global_step=139.0]Epoch 0:  46%|████▋     | 559/1208 [16:06<18:41,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0596, train/loss_vlb_step=0.000205, train/loss_step=0.0596, global_step=139.0]Epoch 0:  46%|████▋     | 559/1208 [16:06<18:41,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00639, train/loss_vlb_step=3.21e-5, train/loss_step=0.00639, global_step=139.0]Epoch 0:  46%|████▋     | 560/1208 [16:09<18:41,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00639, train/loss_vlb_step=3.21e-5, train/loss_step=0.00639, global_step=139.0]Epoch 0:  46%|████▋     | 560/1208 [16:09<18:41,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000486, train/loss_step=0.148, global_step=139.0]   Epoch 0:  46%|████▋     | 561/1208 [16:10<18:39,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000486, train/loss_step=0.148, global_step=139.0]Epoch 0:  46%|████▋     | 561/1208 [16:10<18:39,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.0012, train/loss_step=0.271, global_step=140.0]  Epoch 0:  47%|████▋     | 562/1208 [16:11<18:36,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.0012, train/loss_step=0.271, global_step=140.0]Epoch 0:  47%|████▋     | 562/1208 [16:11<18:36,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00458, train/loss_vlb_step=2.43e-5, train/loss_step=0.00458, global_step=140.0]Epoch 0:  47%|████▋     | 563/1208 [16:12<18:34,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00458, train/loss_vlb_step=2.43e-5, train/loss_step=0.00458, global_step=140.0]Epoch 0:  47%|████▋     | 563/1208 [16:12<18:34,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.9e-5, train/loss_step=0.00344, global_step=140.0] Epoch 0:  47%|████▋     | 564/1208 [16:15<18:34,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.9e-5, train/loss_step=0.00344, global_step=140.0]Epoch 0:  47%|████▋     | 564/1208 [16:15<18:34,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.8e-5, train/loss_step=0.0127, global_step=140.0]  Epoch 0:  47%|████▋     | 565/1208 [16:17<18:31,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.8e-5, train/loss_step=0.0127, global_step=140.0]Epoch 0:  47%|████▋     | 565/1208 [16:17<18:31,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00218, train/loss_step=0.350, global_step=141.0] Epoch 0:  47%|████▋     | 566/1208 [16:18<18:29,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00218, train/loss_step=0.350, global_step=141.0]Epoch 0:  47%|████▋     | 566/1208 [16:18<18:29,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000859, train/loss_step=0.219, global_step=141.0]Epoch 0:  47%|████▋     | 567/1208 [16:19<18:26,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000859, train/loss_step=0.219, global_step=141.0]Epoch 0:  47%|████▋     | 567/1208 [16:19<18:26,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=1.39e-5, train/loss_step=0.00238, global_step=141.0]Epoch 0:  47%|████▋     | 568/1208 [16:22<18:26,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=1.39e-5, train/loss_step=0.00238, global_step=141.0]Epoch 0:  47%|████▋     | 568/1208 [16:22<18:26,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000396, train/loss_step=0.120, global_step=141.0]   Epoch 0:  47%|████▋     | 569/1208 [16:23<18:24,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000396, train/loss_step=0.120, global_step=141.0]Epoch 0:  47%|████▋     | 569/1208 [16:23<18:24,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000494, train/loss_step=0.150, global_step=142.0] Epoch 0:  47%|████▋     | 570/1208 [16:24<18:21,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000494, train/loss_step=0.150, global_step=142.0]Epoch 0:  47%|████▋     | 570/1208 [16:24<18:21,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00569, train/loss_vlb_step=3e-5, train/loss_step=0.00569, global_step=142.0]Epoch 0:  47%|████▋     | 571/1208 [16:25<18:19,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00569, train/loss_vlb_step=3e-5, train/loss_step=0.00569, global_step=142.0]Epoch 0:  47%|████▋     | 571/1208 [16:25<18:19,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000133, train/loss_step=0.0344, global_step=142.0]Epoch 0:  47%|████▋     | 572/1208 [16:28<18:19,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000133, train/loss_step=0.0344, global_step=142.0]Epoch 0:  47%|████▋     | 572/1208 [16:28<18:19,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000575, train/loss_step=0.171, global_step=142.0]  Epoch 0:  47%|████▋     | 573/1208 [16:29<18:17,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000575, train/loss_step=0.171, global_step=142.0]Epoch 0:  47%|████▋     | 573/1208 [16:29<18:17,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000419, train/loss_step=0.128, global_step=143.0]Epoch 0:  48%|████▊     | 574/1208 [16:30<18:14,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000419, train/loss_step=0.128, global_step=143.0]Epoch 0:  48%|████▊     | 574/1208 [16:30<18:14,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.24e-5, train/loss_step=0.0198, global_step=143.0]Epoch 0:  48%|████▊     | 575/1208 [16:32<18:12,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.24e-5, train/loss_step=0.0198, global_step=143.0]Epoch 0:  48%|████▊     | 575/1208 [16:32<18:12,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.57e-5, train/loss_step=0.00267, global_step=143.0]Epoch 0:  48%|████▊     | 576/1208 [16:35<18:11,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.57e-5, train/loss_step=0.00267, global_step=143.0]Epoch 0:  48%|████▊     | 576/1208 [16:35<18:11,  1.73s/it, loss=0.1, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00119, train/loss_step=0.263, global_step=143.0]      Epoch 0:  48%|████▊     | 577/1208 [16:36<18:09,  1.73s/it, loss=0.1, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00119, train/loss_step=0.263, global_step=143.0]Epoch 0:  48%|████▊     | 577/1208 [16:36<18:09,  1.73s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.73e-5, train/loss_step=0.0125, global_step=144.0]Epoch 0:  48%|████▊     | 578/1208 [16:37<18:07,  1.73s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.73e-5, train/loss_step=0.0125, global_step=144.0]Epoch 0:  48%|████▊     | 578/1208 [16:37<18:07,  1.73s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.000163, train/loss_step=0.0482, global_step=144.0]Epoch 0:  48%|████▊     | 579/1208 [16:38<18:04,  1.72s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.000163, train/loss_step=0.0482, global_step=144.0]Epoch 0:  48%|████▊     | 579/1208 [16:38<18:04,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000654, train/loss_step=0.186, global_step=144.0]   Epoch 0:  48%|████▊     | 580/1208 [16:41<18:04,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000654, train/loss_step=0.186, global_step=144.0]Epoch 0:  48%|████▊     | 580/1208 [16:41<18:04,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000964, train/loss_step=0.240, global_step=144.0]Epoch 0:  48%|████▊     | 581/1208 [16:42<18:02,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000964, train/loss_step=0.240, global_step=144.0]Epoch 0:  48%|████▊     | 581/1208 [16:42<18:02,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000684, train/loss_step=0.194, global_step=145.0]Epoch 0:  48%|████▊     | 582/1208 [16:43<17:59,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000684, train/loss_step=0.194, global_step=145.0]Epoch 0:  48%|████▊     | 582/1208 [16:43<17:59,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00898, train/loss_vlb_step=4.3e-5, train/loss_step=0.00898, global_step=145.0]Epoch 0:  48%|████▊     | 583/1208 [16:44<17:57,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00898, train/loss_vlb_step=4.3e-5, train/loss_step=0.00898, global_step=145.0]Epoch 0:  48%|████▊     | 583/1208 [16:44<17:57,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.00039, train/loss_step=0.119, global_step=145.0]   Epoch 0:  48%|████▊     | 584/1208 [16:48<17:57,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.00039, train/loss_step=0.119, global_step=145.0]Epoch 0:  48%|████▊     | 584/1208 [16:48<17:57,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0842, train/loss_vlb_step=0.000279, train/loss_step=0.0842, global_step=145.0]Epoch 0:  48%|████▊     | 585/1208 [16:49<17:54,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0842, train/loss_vlb_step=0.000279, train/loss_step=0.0842, global_step=145.0]Epoch 0:  48%|████▊     | 585/1208 [16:49<17:54,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000212, train/loss_step=0.0588, global_step=146.0]Epoch 0:  49%|████▊     | 586/1208 [16:50<17:52,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000212, train/loss_step=0.0588, global_step=146.0]Epoch 0:  49%|████▊     | 586/1208 [16:50<17:52,  1.72s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.27e-5, train/loss_step=0.017, global_step=146.0]  Epoch 0:  49%|████▊     | 587/1208 [16:51<17:49,  1.72s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.27e-5, train/loss_step=0.017, global_step=146.0]Epoch 0:  49%|████▊     | 587/1208 [16:51<17:49,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.669, train/loss_vlb_step=0.0346, train/loss_step=0.669, global_step=146.0]  Epoch 0:  49%|████▊     | 588/1208 [16:54<17:49,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.669, train/loss_vlb_step=0.0346, train/loss_step=0.669, global_step=146.0]Epoch 0:  49%|████▊     | 588/1208 [16:54<17:49,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00875, train/loss_vlb_step=4.4e-5, train/loss_step=0.00875, global_step=146.0]Epoch 0:  49%|████▉     | 589/1208 [16:55<17:47,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00875, train/loss_vlb_step=4.4e-5, train/loss_step=0.00875, global_step=146.0]Epoch 0:  49%|████▉     | 589/1208 [16:55<17:47,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00731, train/loss_vlb_step=3.69e-5, train/loss_step=0.00731, global_step=147.0]Epoch 0:  49%|████▉     | 590/1208 [16:56<17:44,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00731, train/loss_vlb_step=3.69e-5, train/loss_step=0.00731, global_step=147.0]Epoch 0:  49%|████▉     | 590/1208 [16:56<17:44,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.44e-5, train/loss_step=0.014, global_step=147.0]    Epoch 0:  49%|████▉     | 591/1208 [16:57<17:42,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.44e-5, train/loss_step=0.014, global_step=147.0]Epoch 0:  49%|████▉     | 591/1208 [16:57<17:42,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000714, train/loss_step=0.203, global_step=147.0]Epoch 0:  49%|████▉     | 592/1208 [17:00<17:42,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000714, train/loss_step=0.203, global_step=147.0]Epoch 0:  49%|████▉     | 592/1208 [17:00<17:42,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.99e-5, train/loss_step=0.0107, global_step=147.0]Epoch 0:  49%|████▉     | 593/1208 [17:02<17:39,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.99e-5, train/loss_step=0.0107, global_step=147.0]Epoch 0:  49%|████▉     | 593/1208 [17:02<17:39,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.00288, train/loss_step=0.417, global_step=148.0]  Epoch 0:  49%|████▉     | 594/1208 [17:03<17:37,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.00288, train/loss_step=0.417, global_step=148.0]Epoch 0:  49%|████▉     | 594/1208 [17:03<17:37,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000361, train/loss_step=0.109, global_step=148.0]Epoch 0:  49%|████▉     | 595/1208 [17:04<17:35,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000361, train/loss_step=0.109, global_step=148.0]Epoch 0:  49%|████▉     | 595/1208 [17:04<17:35,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0055, train/loss_vlb_step=2.85e-5, train/loss_step=0.0055, global_step=148.0]Epoch 0:  49%|████▉     | 596/1208 [17:07<17:34,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0055, train/loss_vlb_step=2.85e-5, train/loss_step=0.0055, global_step=148.0]Epoch 0:  49%|████▉     | 596/1208 [17:07<17:34,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.16e-5, train/loss_step=0.0114, global_step=148.0]Epoch 0:  49%|████▉     | 597/1208 [17:08<17:32,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.16e-5, train/loss_step=0.0114, global_step=148.0]Epoch 0:  49%|████▉     | 597/1208 [17:08<17:32,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0496, train/loss_vlb_step=0.000181, train/loss_step=0.0496, global_step=149.0]Epoch 0:  50%|████▉     | 598/1208 [17:09<17:30,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0496, train/loss_vlb_step=0.000181, train/loss_step=0.0496, global_step=149.0]Epoch 0:  50%|████▉     | 598/1208 [17:09<17:30,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00172, train/loss_step=0.309, global_step=149.0]   Epoch 0:  50%|████▉     | 599/1208 [17:10<17:27,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00172, train/loss_step=0.309, global_step=149.0]Epoch 0:  50%|████▉     | 599/1208 [17:10<17:27,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00147, train/loss_step=0.293, global_step=149.0]Epoch 0:  50%|████▉     | 600/1208 [17:13<17:27,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00147, train/loss_step=0.293, global_step=149.0]Epoch 0:  50%|████▉     | 600/1208 [17:13<17:27,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.2e-5, train/loss_step=0.0134, global_step=149.0]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.72it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.76it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.73it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.74it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.74it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.76it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.81it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.76it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.76it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.76it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.76it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.76it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.76it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.80it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.80it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.78it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.79it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.75it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.77it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.78it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.78it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.75it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.78it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.75it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.78it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.78it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.78it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.78it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.75it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.77it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.78it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.75it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.78it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.75it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.78it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 0:  50%|████▉     | 601/1208 [17:44<17:55,  1.77s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.2e-5, train/loss_step=0.0134, global_step=149.0]Epoch 0:  50%|████▉     | 601/1208 [17:44<17:55,  1.77s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.81e-5, train/loss_step=0.0237, global_step=150.0]Epoch 0:  50%|████▉     | 602/1208 [17:45<17:52,  1.77s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.81e-5, train/loss_step=0.0237, global_step=150.0]Epoch 0:  50%|████▉     | 602/1208 [17:45<17:52,  1.77s/it, loss=0.147, v_num=0, train/loss_simple_step=0.515, train/loss_vlb_step=0.00657, train/loss_step=0.515, global_step=150.0]  Epoch 0:  50%|████▉     | 603/1208 [17:46<17:50,  1.77s/it, loss=0.147, v_num=0, train/loss_simple_step=0.515, train/loss_vlb_step=0.00657, train/loss_step=0.515, global_step=150.0]Epoch 0:  50%|████▉     | 603/1208 [17:46<17:50,  1.77s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=1.74e-5, train/loss_step=0.00302, global_step=150.0]Epoch 0:  50%|█████     | 604/1208 [17:50<17:50,  1.77s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=1.74e-5, train/loss_step=0.00302, global_step=150.0]Epoch 0:  50%|█████     | 604/1208 [17:50<17:50,  1.77s/it, loss=0.159, v_num=0, train/loss_simple_step=0.444, train/loss_vlb_step=0.00414, train/loss_step=0.444, global_step=150.0]    Epoch 0:  50%|█████     | 605/1208 [17:51<17:47,  1.77s/it, loss=0.159, v_num=0, train/loss_simple_step=0.444, train/loss_vlb_step=0.00414, train/loss_step=0.444, global_step=150.0]Epoch 0:  50%|█████     | 605/1208 [17:51<17:47,  1.77s/it, loss=0.17, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00116, train/loss_step=0.272, global_step=151.0] Epoch 0:  50%|█████     | 606/1208 [17:52<17:45,  1.77s/it, loss=0.17, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00116, train/loss_step=0.272, global_step=151.0]Epoch 0:  50%|█████     | 606/1208 [17:52<17:45,  1.77s/it, loss=0.176, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000463, train/loss_step=0.139, global_step=151.0]Epoch 0:  50%|█████     | 607/1208 [17:53<17:42,  1.77s/it, loss=0.176, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000463, train/loss_step=0.139, global_step=151.0]Epoch 0:  50%|█████     | 607/1208 [17:53<17:42,  1.77s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0936, train/loss_vlb_step=0.000311, train/loss_step=0.0936, global_step=151.0]Epoch 0:  50%|█████     | 608/1208 [17:56<17:42,  1.77s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0936, train/loss_vlb_step=0.000311, train/loss_step=0.0936, global_step=151.0]Epoch 0:  50%|█████     | 608/1208 [17:56<17:42,  1.77s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.49e-5, train/loss_step=0.0145, global_step=151.0] Epoch 0:  50%|█████     | 609/1208 [17:57<17:39,  1.77s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.49e-5, train/loss_step=0.0145, global_step=151.0]Epoch 0:  50%|█████     | 609/1208 [17:57<17:39,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00123, train/loss_step=0.295, global_step=152.0]  Epoch 0:  50%|█████     | 610/1208 [17:58<17:37,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00123, train/loss_step=0.295, global_step=152.0]Epoch 0:  50%|█████     | 610/1208 [17:58<17:37,  1.77s/it, loss=0.181, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00287, train/loss_step=0.403, global_step=152.0]Epoch 0:  51%|█████     | 611/1208 [17:59<17:34,  1.77s/it, loss=0.181, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00287, train/loss_step=0.403, global_step=152.0]Epoch 0:  51%|█████     | 611/1208 [17:59<17:34,  1.77s/it, loss=0.183, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00102, train/loss_step=0.243, global_step=152.0]Epoch 0:  51%|█████     | 612/1208 [18:03<17:34,  1.77s/it, loss=0.183, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00102, train/loss_step=0.243, global_step=152.0]Epoch 0:  51%|█████     | 612/1208 [18:03<17:34,  1.77s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000133, train/loss_step=0.0345, global_step=152.0]Epoch 0:  51%|█████     | 613/1208 [18:04<17:32,  1.77s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000133, train/loss_step=0.0345, global_step=152.0]Epoch 0:  51%|█████     | 613/1208 [18:04<17:32,  1.77s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00527, train/loss_vlb_step=2.82e-5, train/loss_step=0.00527, global_step=153.0]Epoch 0:  51%|█████     | 614/1208 [18:05<17:29,  1.77s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00527, train/loss_vlb_step=2.82e-5, train/loss_step=0.00527, global_step=153.0]Epoch 0:  51%|█████     | 614/1208 [18:05<17:29,  1.77s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00513, train/loss_vlb_step=2.67e-5, train/loss_step=0.00513, global_step=153.0]Epoch 0:  51%|█████     | 615/1208 [18:06<17:27,  1.77s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00513, train/loss_vlb_step=2.67e-5, train/loss_step=0.00513, global_step=153.0]Epoch 0:  51%|█████     | 615/1208 [18:06<17:27,  1.77s/it, loss=0.17, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000875, train/loss_step=0.225, global_step=153.0]    Epoch 0:  51%|█████     | 616/1208 [18:09<17:27,  1.77s/it, loss=0.17, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000875, train/loss_step=0.225, global_step=153.0]Epoch 0:  51%|█████     | 616/1208 [18:09<17:27,  1.77s/it, loss=0.183, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00124, train/loss_step=0.289, global_step=153.0]Epoch 0:  51%|█████     | 617/1208 [18:10<17:24,  1.77s/it, loss=0.183, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00124, train/loss_step=0.289, global_step=153.0]Epoch 0:  51%|█████     | 617/1208 [18:10<17:24,  1.77s/it, loss=0.188, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000505, train/loss_step=0.150, global_step=154.0]Epoch 0:  51%|█████     | 618/1208 [18:11<17:22,  1.77s/it, loss=0.188, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000505, train/loss_step=0.150, global_step=154.0]Epoch 0:  51%|█████     | 618/1208 [18:11<17:22,  1.77s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0629, train/loss_vlb_step=0.000215, train/loss_step=0.0629, global_step=154.0]Epoch 0:  51%|█████     | 619/1208 [18:12<17:19,  1.77s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0629, train/loss_vlb_step=0.000215, train/loss_step=0.0629, global_step=154.0]Epoch 0:  51%|█████     | 619/1208 [18:12<17:19,  1.77s/it, loss=0.174, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00107, train/loss_step=0.254, global_step=154.0]   Epoch 0:  51%|█████▏    | 620/1208 [18:15<17:19,  1.77s/it, loss=0.174, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00107, train/loss_step=0.254, global_step=154.0]Epoch 0:  51%|█████▏    | 620/1208 [18:15<17:19,  1.77s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.97e-5, train/loss_step=0.0184, global_step=154.0]Epoch 0:  51%|█████▏    | 621/1208 [18:17<17:16,  1.77s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.97e-5, train/loss_step=0.0184, global_step=154.0]Epoch 0:  51%|█████▏    | 621/1208 [18:17<17:16,  1.77s/it, loss=0.183, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000672, train/loss_step=0.189, global_step=155.0] Epoch 0:  51%|█████▏    | 622/1208 [18:18<17:14,  1.77s/it, loss=0.183, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000672, train/loss_step=0.189, global_step=155.0]Epoch 0:  51%|█████▏    | 622/1208 [18:18<17:14,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.092, train/loss_vlb_step=0.000304, train/loss_step=0.092, global_step=155.0]Epoch 0:  52%|█████▏    | 623/1208 [18:19<17:12,  1.76s/it, loss=0.162, v_num=0, train/loss_simple_step=0.092, train/loss_vlb_step=0.000304, train/loss_step=0.092, global_step=155.0]Epoch 0:  52%|█████▏    | 623/1208 [18:19<17:12,  1.76s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.65e-5, train/loss_step=0.0148, global_step=155.0]Epoch 0:  52%|█████▏    | 624/1208 [18:22<17:11,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.65e-5, train/loss_step=0.0148, global_step=155.0]Epoch 0:  52%|█████▏    | 624/1208 [18:22<17:11,  1.77s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00355, train/loss_vlb_step=2e-5, train/loss_step=0.00355, global_step=155.0]  Epoch 0:  52%|█████▏    | 625/1208 [18:23<17:09,  1.77s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00355, train/loss_vlb_step=2e-5, train/loss_step=0.00355, global_step=155.0]Epoch 0:  52%|█████▏    | 625/1208 [18:23<17:09,  1.77s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0611, train/loss_vlb_step=0.000207, train/loss_step=0.0611, global_step=156.0]Epoch 0:  52%|█████▏    | 626/1208 [18:24<17:06,  1.76s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0611, train/loss_vlb_step=0.000207, train/loss_step=0.0611, global_step=156.0]Epoch 0:  52%|█████▏    | 626/1208 [18:24<17:06,  1.76s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0486, train/loss_vlb_step=0.000174, train/loss_step=0.0486, global_step=156.0]Epoch 0:  52%|█████▏    | 627/1208 [18:25<17:04,  1.76s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0486, train/loss_vlb_step=0.000174, train/loss_step=0.0486, global_step=156.0]Epoch 0:  52%|█████▏    | 627/1208 [18:25<17:04,  1.76s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.5e-5, train/loss_step=0.0196, global_step=156.0]  Epoch 0:  52%|█████▏    | 628/1208 [18:28<17:04,  1.77s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.5e-5, train/loss_step=0.0196, global_step=156.0]Epoch 0:  52%|█████▏    | 628/1208 [18:28<17:04,  1.77s/it, loss=0.148, v_num=0, train/loss_simple_step=0.546, train/loss_vlb_step=0.00646, train/loss_step=0.546, global_step=156.0] Epoch 0:  52%|█████▏    | 629/1208 [18:29<17:01,  1.76s/it, loss=0.148, v_num=0, train/loss_simple_step=0.546, train/loss_vlb_step=0.00646, train/loss_step=0.546, global_step=156.0]Epoch 0:  52%|█████▏    | 629/1208 [18:29<17:01,  1.76s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.72e-5, train/loss_step=0.00288, global_step=157.0]Epoch 0:  52%|█████▏    | 630/1208 [18:31<16:59,  1.76s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.72e-5, train/loss_step=0.00288, global_step=157.0]Epoch 0:  52%|█████▏    | 630/1208 [18:31<16:59,  1.76s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.00015, train/loss_step=0.0413, global_step=157.0]  Epoch 0:  52%|█████▏    | 631/1208 [18:32<16:56,  1.76s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.00015, train/loss_step=0.0413, global_step=157.0]Epoch 0:  52%|█████▏    | 631/1208 [18:32<16:56,  1.76s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.61e-5, train/loss_step=0.0215, global_step=157.0]Epoch 0:  52%|█████▏    | 632/1208 [18:35<16:56,  1.76s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.61e-5, train/loss_step=0.0215, global_step=157.0]Epoch 0:  52%|█████▏    | 632/1208 [18:35<16:56,  1.76s/it, loss=0.127, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00511, train/loss_step=0.499, global_step=157.0]  Epoch 0:  52%|█████▏    | 633/1208 [18:36<16:54,  1.76s/it, loss=0.127, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00511, train/loss_step=0.499, global_step=157.0]Epoch 0:  52%|█████▏    | 633/1208 [18:36<16:54,  1.76s/it, loss=0.139, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000866, train/loss_step=0.237, global_step=158.0]Epoch 0:  52%|█████▏    | 634/1208 [18:37<16:51,  1.76s/it, loss=0.139, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000866, train/loss_step=0.237, global_step=158.0]Epoch 0:  52%|█████▏    | 634/1208 [18:37<16:51,  1.76s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0623, train/loss_vlb_step=0.000222, train/loss_step=0.0623, global_step=158.0]Epoch 0:  53%|█████▎    | 635/1208 [18:38<16:49,  1.76s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0623, train/loss_vlb_step=0.000222, train/loss_step=0.0623, global_step=158.0]Epoch 0:  53%|█████▎    | 635/1208 [18:38<16:49,  1.76s/it, loss=0.132, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.69e-5, train/loss_step=0.021, global_step=158.0]   Epoch 0:  53%|█████▎    | 636/1208 [18:41<16:48,  1.76s/it, loss=0.132, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.69e-5, train/loss_step=0.021, global_step=158.0]Epoch 0:  53%|█████▎    | 636/1208 [18:41<16:48,  1.76s/it, loss=0.127, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000702, train/loss_step=0.198, global_step=158.0]Epoch 0:  53%|█████▎    | 637/1208 [18:42<16:46,  1.76s/it, loss=0.127, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000702, train/loss_step=0.198, global_step=158.0]Epoch 0:  53%|█████▎    | 637/1208 [18:42<16:46,  1.76s/it, loss=0.125, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000376, train/loss_step=0.114, global_step=159.0]Epoch 0:  53%|█████▎    | 638/1208 [18:43<16:44,  1.76s/it, loss=0.125, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000376, train/loss_step=0.114, global_step=159.0]Epoch 0:  53%|█████▎    | 638/1208 [18:43<16:44,  1.76s/it, loss=0.137, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00128, train/loss_step=0.291, global_step=159.0] Epoch 0:  53%|█████▎    | 639/1208 [18:45<16:41,  1.76s/it, loss=0.137, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00128, train/loss_step=0.291, global_step=159.0]Epoch 0:  53%|█████▎    | 639/1208 [18:45<16:41,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.001, train/loss_step=0.247, global_step=159.0]  Epoch 0:  53%|█████▎    | 640/1208 [18:48<16:41,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.001, train/loss_step=0.247, global_step=159.0]Epoch 0:  53%|█████▎    | 640/1208 [18:48<16:41,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.8e-5, train/loss_step=0.0149, global_step=159.0]Epoch 0:  53%|█████▎    | 641/1208 [18:49<16:38,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.8e-5, train/loss_step=0.0149, global_step=159.0]Epoch 0:  53%|█████▎    | 641/1208 [18:49<16:39,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0772, train/loss_vlb_step=0.000273, train/loss_step=0.0772, global_step=160.0]Epoch 0:  53%|█████▎    | 642/1208 [18:50<16:36,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0772, train/loss_vlb_step=0.000273, train/loss_step=0.0772, global_step=160.0]Epoch 0:  53%|█████▎    | 642/1208 [18:50<16:36,  1.76s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.35e-5, train/loss_step=0.0168, global_step=160.0] Epoch 0:  53%|█████▎    | 643/1208 [18:51<16:34,  1.76s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.35e-5, train/loss_step=0.0168, global_step=160.0]Epoch 0:  53%|█████▎    | 643/1208 [18:51<16:34,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00676, train/loss_vlb_step=3.5e-5, train/loss_step=0.00676, global_step=160.0]Epoch 0:  53%|█████▎    | 644/1208 [18:54<16:33,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00676, train/loss_vlb_step=3.5e-5, train/loss_step=0.00676, global_step=160.0]Epoch 0:  53%|█████▎    | 644/1208 [18:54<16:33,  1.76s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000148, train/loss_step=0.0381, global_step=160.0]Epoch 0:  53%|█████▎    | 645/1208 [18:55<16:31,  1.76s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000148, train/loss_step=0.0381, global_step=160.0]Epoch 0:  53%|█████▎    | 645/1208 [18:55<16:31,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.51e-5, train/loss_step=0.0246, global_step=161.0] Epoch 0:  53%|█████▎    | 646/1208 [18:56<16:29,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.51e-5, train/loss_step=0.0246, global_step=161.0]Epoch 0:  53%|█████▎    | 646/1208 [18:56<16:29,  1.76s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000118, train/loss_step=0.0295, global_step=161.0]Epoch 0:  54%|█████▎    | 647/1208 [18:58<16:26,  1.76s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000118, train/loss_step=0.0295, global_step=161.0]Epoch 0:  54%|█████▎    | 647/1208 [18:58<16:26,  1.76s/it, loss=0.147, v_num=0, train/loss_simple_step=0.446, train/loss_vlb_step=0.00332, train/loss_step=0.446, global_step=161.0]   Epoch 0:  54%|█████▎    | 648/1208 [19:01<16:26,  1.76s/it, loss=0.147, v_num=0, train/loss_simple_step=0.446, train/loss_vlb_step=0.00332, train/loss_step=0.446, global_step=161.0]Epoch 0:  54%|█████▎    | 648/1208 [19:01<16:26,  1.76s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0618, train/loss_vlb_step=0.00022, train/loss_step=0.0618, global_step=161.0]Epoch 0:  54%|█████▎    | 649/1208 [19:02<16:23,  1.76s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0618, train/loss_vlb_step=0.00022, train/loss_step=0.0618, global_step=161.0]Epoch 0:  54%|█████▎    | 649/1208 [19:02<16:23,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0677, train/loss_vlb_step=0.000231, train/loss_step=0.0677, global_step=162.0]Epoch 0:  54%|█████▍    | 650/1208 [19:03<16:21,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0677, train/loss_vlb_step=0.000231, train/loss_step=0.0677, global_step=162.0]Epoch 0:  54%|█████▍    | 650/1208 [19:03<16:21,  1.76s/it, loss=0.132, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000621, train/loss_step=0.171, global_step=162.0]  Epoch 0:  54%|█████▍    | 651/1208 [19:04<16:19,  1.76s/it, loss=0.132, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000621, train/loss_step=0.171, global_step=162.0]Epoch 0:  54%|█████▍    | 651/1208 [19:04<16:19,  1.76s/it, loss=0.139, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000548, train/loss_step=0.162, global_step=162.0]Epoch 0:  54%|█████▍    | 652/1208 [19:07<16:18,  1.76s/it, loss=0.139, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000548, train/loss_step=0.162, global_step=162.0]Epoch 0:  54%|█████▍    | 652/1208 [19:07<16:18,  1.76s/it, loss=0.121, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000414, train/loss_step=0.126, global_step=162.0]Epoch 0:  54%|█████▍    | 653/1208 [19:08<16:16,  1.76s/it, loss=0.121, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000414, train/loss_step=0.126, global_step=162.0]Epoch 0:  54%|█████▍    | 653/1208 [19:08<16:16,  1.76s/it, loss=0.117, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000596, train/loss_step=0.171, global_step=163.0]Epoch 0:  54%|█████▍    | 654/1208 [19:09<16:14,  1.76s/it, loss=0.117, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000596, train/loss_step=0.171, global_step=163.0]Epoch 0:  54%|█████▍    | 654/1208 [19:09<16:14,  1.76s/it, loss=0.139, v_num=0, train/loss_simple_step=0.490, train/loss_vlb_step=0.00761, train/loss_step=0.490, global_step=163.0] Epoch 0:  54%|█████▍    | 655/1208 [19:10<16:11,  1.76s/it, loss=0.139, v_num=0, train/loss_simple_step=0.490, train/loss_vlb_step=0.00761, train/loss_step=0.490, global_step=163.0]Epoch 0:  54%|█████▍    | 655/1208 [19:10<16:11,  1.76s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00501, train/loss_vlb_step=2.69e-5, train/loss_step=0.00501, global_step=163.0]Epoch 0:  54%|█████▍    | 656/1208 [19:14<16:11,  1.76s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00501, train/loss_vlb_step=2.69e-5, train/loss_step=0.00501, global_step=163.0]Epoch 0:  54%|█████▍    | 656/1208 [19:14<16:11,  1.76s/it, loss=0.144, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00215, train/loss_step=0.327, global_step=163.0]    Epoch 0:  54%|█████▍    | 657/1208 [19:15<16:08,  1.76s/it, loss=0.144, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00215, train/loss_step=0.327, global_step=163.0]Epoch 0:  54%|█████▍    | 657/1208 [19:15<16:08,  1.76s/it, loss=0.144, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=164.0]Epoch 0:  54%|█████▍    | 658/1208 [19:16<16:06,  1.76s/it, loss=0.144, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=164.0]Epoch 0:  54%|█████▍    | 658/1208 [19:16<16:06,  1.76s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0518, train/loss_vlb_step=0.000179, train/loss_step=0.0518, global_step=164.0]Epoch 0:  55%|█████▍    | 659/1208 [19:17<16:04,  1.76s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0518, train/loss_vlb_step=0.000179, train/loss_step=0.0518, global_step=164.0]Epoch 0:  55%|█████▍    | 659/1208 [19:17<16:04,  1.76s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.98e-5, train/loss_step=0.00342, global_step=164.0]Epoch 0:  55%|█████▍    | 660/1208 [19:20<16:03,  1.76s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.98e-5, train/loss_step=0.00342, global_step=164.0]Epoch 0:  55%|█████▍    | 660/1208 [19:20<16:03,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000347, train/loss_step=0.105, global_step=164.0]  Epoch 0:  55%|█████▍    | 661/1208 [19:21<16:01,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000347, train/loss_step=0.105, global_step=164.0]Epoch 0:  55%|█████▍    | 661/1208 [19:21<16:01,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000789, train/loss_step=0.216, global_step=165.0]Epoch 0:  55%|█████▍    | 662/1208 [19:22<15:59,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000789, train/loss_step=0.216, global_step=165.0]Epoch 0:  55%|█████▍    | 662/1208 [19:22<15:59,  1.76s/it, loss=0.147, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00196, train/loss_step=0.341, global_step=165.0] Epoch 0:  55%|█████▍    | 663/1208 [19:23<15:56,  1.76s/it, loss=0.147, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00196, train/loss_step=0.341, global_step=165.0]Epoch 0:  55%|█████▍    | 663/1208 [19:23<15:56,  1.76s/it, loss=0.162, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00134, train/loss_step=0.301, global_step=165.0]Epoch 0:  55%|█████▍    | 664/1208 [19:27<15:56,  1.76s/it, loss=0.162, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00134, train/loss_step=0.301, global_step=165.0]Epoch 0:  55%|█████▍    | 664/1208 [19:27<15:56,  1.76s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.00012, train/loss_step=0.0311, global_step=165.0]Epoch 0:  55%|█████▌    | 665/1208 [19:28<15:53,  1.76s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.00012, train/loss_step=0.0311, global_step=165.0]Epoch 0:  55%|█████▌    | 665/1208 [19:28<15:53,  1.76s/it, loss=0.179, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00276, train/loss_step=0.361, global_step=166.0]  Epoch 0:  55%|█████▌    | 666/1208 [19:29<15:51,  1.76s/it, loss=0.179, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00276, train/loss_step=0.361, global_step=166.0]Epoch 0:  55%|█████▌    | 666/1208 [19:29<15:51,  1.76s/it, loss=0.202, v_num=0, train/loss_simple_step=0.505, train/loss_vlb_step=0.00608, train/loss_step=0.505, global_step=166.0]Epoch 0:  55%|█████▌    | 667/1208 [19:30<15:49,  1.75s/it, loss=0.202, v_num=0, train/loss_simple_step=0.505, train/loss_vlb_step=0.00608, train/loss_step=0.505, global_step=166.0]Epoch 0:  55%|█████▌    | 667/1208 [19:30<15:49,  1.75s/it, loss=0.198, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00163, train/loss_step=0.351, global_step=166.0]Epoch 0:  55%|█████▌    | 668/1208 [19:33<15:48,  1.76s/it, loss=0.198, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00163, train/loss_step=0.351, global_step=166.0]Epoch 0:  55%|█████▌    | 668/1208 [19:33<15:48,  1.76s/it, loss=0.209, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00196, train/loss_step=0.292, global_step=166.0]Epoch 0:  55%|█████▌    | 669/1208 [19:34<15:46,  1.76s/it, loss=0.209, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00196, train/loss_step=0.292, global_step=166.0]Epoch 0:  55%|█████▌    | 669/1208 [19:34<15:46,  1.76s/it, loss=0.206, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=3.39e-5, train/loss_step=0.00677, global_step=167.0]Epoch 0:  55%|█████▌    | 670/1208 [19:35<15:44,  1.75s/it, loss=0.206, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=3.39e-5, train/loss_step=0.00677, global_step=167.0]Epoch 0:  55%|█████▌    | 670/1208 [19:35<15:44,  1.75s/it, loss=0.207, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.00067, train/loss_step=0.181, global_step=167.0]    Epoch 0:  56%|█████▌    | 671/1208 [19:36<15:41,  1.75s/it, loss=0.207, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.00067, train/loss_step=0.181, global_step=167.0]Epoch 0:  56%|█████▌    | 671/1208 [19:36<15:41,  1.75s/it, loss=0.208, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000697, train/loss_step=0.199, global_step=167.0]Epoch 0:  56%|█████▌    | 672/1208 [19:39<15:41,  1.76s/it, loss=0.208, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000697, train/loss_step=0.199, global_step=167.0]Epoch 0:  56%|█████▌    | 672/1208 [19:39<15:41,  1.76s/it, loss=0.208, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000371, train/loss_step=0.112, global_step=167.0]Epoch 0:  56%|█████▌    | 673/1208 [19:40<15:38,  1.75s/it, loss=0.208, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000371, train/loss_step=0.112, global_step=167.0]Epoch 0:  56%|█████▌    | 673/1208 [19:40<15:38,  1.75s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0801, train/loss_vlb_step=0.000269, train/loss_step=0.0801, global_step=168.0]Epoch 0:  56%|█████▌    | 674/1208 [19:42<15:36,  1.75s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0801, train/loss_vlb_step=0.000269, train/loss_step=0.0801, global_step=168.0]Epoch 0:  56%|█████▌    | 674/1208 [19:42<15:36,  1.75s/it, loss=0.188, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000768, train/loss_step=0.191, global_step=168.0]  Epoch 0:  56%|█████▌    | 675/1208 [19:43<15:34,  1.75s/it, loss=0.188, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000768, train/loss_step=0.191, global_step=168.0]Epoch 0:  56%|█████▌    | 675/1208 [19:43<15:34,  1.75s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000134, train/loss_step=0.0346, global_step=168.0]Epoch 0:  56%|█████▌    | 676/1208 [19:46<15:33,  1.75s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000134, train/loss_step=0.0346, global_step=168.0]Epoch 0:  56%|█████▌    | 676/1208 [19:46<15:33,  1.75s/it, loss=0.184, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000777, train/loss_step=0.216, global_step=168.0] Epoch 0:  56%|█████▌    | 677/1208 [19:47<15:31,  1.75s/it, loss=0.184, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000777, train/loss_step=0.216, global_step=168.0]Epoch 0:  56%|█████▌    | 677/1208 [19:47<15:31,  1.75s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00536, train/loss_vlb_step=2.77e-5, train/loss_step=0.00536, global_step=169.0]Epoch 0:  56%|█████▌    | 678/1208 [19:48<15:29,  1.75s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00536, train/loss_vlb_step=2.77e-5, train/loss_step=0.00536, global_step=169.0]Epoch 0:  56%|█████▌    | 678/1208 [19:48<15:29,  1.75s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.000215, train/loss_step=0.0598, global_step=169.0]  Epoch 0:  56%|█████▌    | 679/1208 [19:49<15:26,  1.75s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.000215, train/loss_step=0.0598, global_step=169.0]Epoch 0:  56%|█████▌    | 679/1208 [19:49<15:26,  1.75s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=9.14e-5, train/loss_step=0.0223, global_step=169.0]Epoch 0:  56%|█████▋    | 680/1208 [19:52<15:26,  1.75s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=9.14e-5, train/loss_step=0.0223, global_step=169.0]Epoch 0:  56%|█████▋    | 680/1208 [19:52<15:26,  1.75s/it, loss=0.186, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000851, train/loss_step=0.218, global_step=169.0] Epoch 0:  56%|█████▋    | 681/1208 [19:53<15:23,  1.75s/it, loss=0.186, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000851, train/loss_step=0.218, global_step=169.0]Epoch 0:  56%|█████▋    | 681/1208 [19:53<15:23,  1.75s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00527, train/loss_vlb_step=2.82e-5, train/loss_step=0.00527, global_step=170.0]Epoch 0:  56%|█████▋    | 682/1208 [19:54<15:21,  1.75s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00527, train/loss_vlb_step=2.82e-5, train/loss_step=0.00527, global_step=170.0]Epoch 0:  56%|█████▋    | 682/1208 [19:54<15:21,  1.75s/it, loss=0.182, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00533, train/loss_step=0.458, global_step=170.0]    Epoch 0:  57%|█████▋    | 683/1208 [19:55<15:19,  1.75s/it, loss=0.182, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00533, train/loss_step=0.458, global_step=170.0]Epoch 0:  57%|█████▋    | 683/1208 [19:55<15:19,  1.75s/it, loss=0.176, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000729, train/loss_step=0.196, global_step=170.0]Epoch 0:  57%|█████▋    | 684/1208 [19:59<15:18,  1.75s/it, loss=0.176, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000729, train/loss_step=0.196, global_step=170.0]Epoch 0:  57%|█████▋    | 684/1208 [19:59<15:18,  1.75s/it, loss=0.196, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00369, train/loss_step=0.435, global_step=170.0] Epoch 0:  57%|█████▋    | 685/1208 [20:00<15:16,  1.75s/it, loss=0.196, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00369, train/loss_step=0.435, global_step=170.0]Epoch 0:  57%|█████▋    | 685/1208 [20:00<15:16,  1.75s/it, loss=0.184, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000344, train/loss_step=0.104, global_step=171.0]Epoch 0:  57%|█████▋    | 686/1208 [20:01<15:14,  1.75s/it, loss=0.184, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000344, train/loss_step=0.104, global_step=171.0]Epoch 0:  57%|█████▋    | 686/1208 [20:01<15:14,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0825, train/loss_vlb_step=0.000273, train/loss_step=0.0825, global_step=171.0]Epoch 0:  57%|█████▋    | 687/1208 [20:02<15:11,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0825, train/loss_vlb_step=0.000273, train/loss_step=0.0825, global_step=171.0]Epoch 0:  57%|█████▋    | 687/1208 [20:02<15:11,  1.75s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0045, train/loss_vlb_step=2.43e-5, train/loss_step=0.0045, global_step=171.0] Epoch 0:  57%|█████▋    | 688/1208 [20:05<15:11,  1.75s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0045, train/loss_vlb_step=2.43e-5, train/loss_step=0.0045, global_step=171.0]Epoch 0:  57%|█████▋    | 688/1208 [20:05<15:11,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00726, train/loss_vlb_step=3.49e-5, train/loss_step=0.00726, global_step=171.0]Epoch 0:  57%|█████▋    | 689/1208 [20:06<15:09,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00726, train/loss_vlb_step=3.49e-5, train/loss_step=0.00726, global_step=171.0]Epoch 0:  57%|█████▋    | 689/1208 [20:06<15:09,  1.75s/it, loss=0.149, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00229, train/loss_step=0.364, global_step=172.0]    Epoch 0:  57%|█████▋    | 690/1208 [20:07<15:06,  1.75s/it, loss=0.149, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00229, train/loss_step=0.364, global_step=172.0]Epoch 0:  57%|█████▋    | 690/1208 [20:07<15:06,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=1.77e-5, train/loss_step=0.00315, global_step=172.0]Epoch 0:  57%|█████▋    | 691/1208 [20:08<15:04,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=1.77e-5, train/loss_step=0.00315, global_step=172.0]Epoch 0:  57%|█████▋    | 691/1208 [20:08<15:04,  1.75s/it, loss=0.145, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00161, train/loss_step=0.305, global_step=172.0]   Epoch 0:  57%|█████▋    | 692/1208 [20:12<15:03,  1.75s/it, loss=0.145, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00161, train/loss_step=0.305, global_step=172.0]Epoch 0:  57%|█████▋    | 692/1208 [20:12<15:03,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.0012, train/loss_step=0.284, global_step=172.0] Epoch 0:  57%|█████▋    | 693/1208 [20:13<15:01,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.0012, train/loss_step=0.284, global_step=172.0]Epoch 0:  57%|█████▋    | 693/1208 [20:13<15:01,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000144, train/loss_step=0.0374, global_step=173.0]Epoch 0:  57%|█████▋    | 694/1208 [20:14<14:59,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000144, train/loss_step=0.0374, global_step=173.0]Epoch 0:  57%|█████▋    | 694/1208 [20:14<14:59,  1.75s/it, loss=0.147, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=173.0]  Epoch 0:  58%|█████▊    | 695/1208 [20:15<14:57,  1.75s/it, loss=0.147, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=173.0]Epoch 0:  58%|█████▊    | 695/1208 [20:15<14:57,  1.75s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00252, train/loss_vlb_step=1.51e-5, train/loss_step=0.00252, global_step=173.0]Epoch 0:  58%|█████▊    | 696/1208 [20:18<14:56,  1.75s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00252, train/loss_vlb_step=1.51e-5, train/loss_step=0.00252, global_step=173.0]Epoch 0:  58%|█████▊    | 696/1208 [20:18<14:56,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.030, train/loss_vlb_step=0.000115, train/loss_step=0.030, global_step=173.0]   Epoch 0:  58%|█████▊    | 697/1208 [20:19<14:54,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.030, train/loss_vlb_step=0.000115, train/loss_step=0.030, global_step=173.0]Epoch 0:  58%|█████▊    | 697/1208 [20:19<14:54,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.0015, train/loss_step=0.310, global_step=174.0]  Epoch 0:  58%|█████▊    | 698/1208 [20:20<14:51,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.0015, train/loss_step=0.310, global_step=174.0]Epoch 0:  58%|█████▊    | 698/1208 [20:20<14:51,  1.75s/it, loss=0.157, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000613, train/loss_step=0.176, global_step=174.0]Epoch 0:  58%|█████▊    | 699/1208 [20:21<14:49,  1.75s/it, loss=0.157, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000613, train/loss_step=0.176, global_step=174.0]Epoch 0:  58%|█████▊    | 699/1208 [20:21<14:49,  1.75s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=9.33e-5, train/loss_step=0.0212, global_step=174.0]Epoch 0:  58%|█████▊    | 700/1208 [20:25<14:49,  1.75s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=9.33e-5, train/loss_step=0.0212, global_step=174.0]Epoch 0:  58%|█████▊    | 700/1208 [20:25<14:49,  1.75s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00355, train/loss_vlb_step=1.95e-5, train/loss_step=0.00355, global_step=174.0]Epoch 0:  58%|█████▊    | 701/1208 [20:26<14:46,  1.75s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00355, train/loss_vlb_step=1.95e-5, train/loss_step=0.00355, global_step=174.0]Epoch 0:  58%|█████▊    | 701/1208 [20:26<14:46,  1.75s/it, loss=0.148, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000117, train/loss_step=0.029, global_step=175.0]   Epoch 0:  58%|█████▊    | 702/1208 [20:27<14:44,  1.75s/it, loss=0.148, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000117, train/loss_step=0.029, global_step=175.0]Epoch 0:  58%|█████▊    | 702/1208 [20:27<14:44,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.59e-5, train/loss_step=0.0234, global_step=175.0]Epoch 0:  58%|█████▊    | 703/1208 [20:28<14:42,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.59e-5, train/loss_step=0.0234, global_step=175.0]Epoch 0:  58%|█████▊    | 703/1208 [20:28<14:42,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.47e-5, train/loss_step=0.0144, global_step=175.0]Epoch 0:  58%|█████▊    | 704/1208 [20:31<14:41,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.47e-5, train/loss_step=0.0144, global_step=175.0]Epoch 0:  58%|█████▊    | 704/1208 [20:31<14:41,  1.75s/it, loss=0.0991, v_num=0, train/loss_simple_step=0.0792, train/loss_vlb_step=0.000261, train/loss_step=0.0792, global_step=175.0]Epoch 0:  58%|█████▊    | 705/1208 [20:32<14:39,  1.75s/it, loss=0.0991, v_num=0, train/loss_simple_step=0.0792, train/loss_vlb_step=0.000261, train/loss_step=0.0792, global_step=175.0]Epoch 0:  58%|█████▊    | 705/1208 [20:32<14:39,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.443, train/loss_vlb_step=0.00418, train/loss_step=0.443, global_step=176.0]    Epoch 0:  58%|█████▊    | 706/1208 [20:33<14:37,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.443, train/loss_vlb_step=0.00418, train/loss_step=0.443, global_step=176.0]Epoch 0:  58%|█████▊    | 706/1208 [20:33<14:37,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00119, train/loss_step=0.296, global_step=176.0]Epoch 0:  59%|█████▊    | 707/1208 [20:34<14:34,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00119, train/loss_step=0.296, global_step=176.0]Epoch 0:  59%|█████▊    | 707/1208 [20:34<14:34,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000146, train/loss_step=0.0381, global_step=176.0]Epoch 0:  59%|█████▊    | 708/1208 [20:37<14:34,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000146, train/loss_step=0.0381, global_step=176.0]Epoch 0:  59%|█████▊    | 708/1208 [20:37<14:34,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0578, train/loss_vlb_step=0.000197, train/loss_step=0.0578, global_step=176.0]Epoch 0:  59%|█████▊    | 709/1208 [20:39<14:32,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0578, train/loss_vlb_step=0.000197, train/loss_step=0.0578, global_step=176.0]Epoch 0:  59%|█████▊    | 709/1208 [20:39<14:32,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0677, train/loss_vlb_step=0.000239, train/loss_step=0.0677, global_step=177.0]Epoch 0:  59%|█████▉    | 710/1208 [20:40<14:29,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0677, train/loss_vlb_step=0.000239, train/loss_step=0.0677, global_step=177.0]Epoch 0:  59%|█████▉    | 710/1208 [20:40<14:29,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000646, train/loss_step=0.185, global_step=177.0]  Epoch 0:  59%|█████▉    | 711/1208 [20:41<14:27,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000646, train/loss_step=0.185, global_step=177.0]Epoch 0:  59%|█████▉    | 711/1208 [20:41<14:27,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0305, train/loss_vlb_step=0.000117, train/loss_step=0.0305, global_step=177.0]Epoch 0:  59%|█████▉    | 712/1208 [20:44<14:26,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0305, train/loss_vlb_step=0.000117, train/loss_step=0.0305, global_step=177.0]Epoch 0:  59%|█████▉    | 712/1208 [20:44<14:26,  1.75s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.00552, train/loss_vlb_step=2.99e-5, train/loss_step=0.00552, global_step=177.0]Epoch 0:  59%|█████▉    | 713/1208 [20:45<14:24,  1.75s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.00552, train/loss_vlb_step=2.99e-5, train/loss_step=0.00552, global_step=177.0]Epoch 0:  59%|█████▉    | 713/1208 [20:45<14:24,  1.75s/it, loss=0.096, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=2.05e-5, train/loss_step=0.00356, global_step=178.0] Epoch 0:  59%|█████▉    | 714/1208 [20:46<14:22,  1.75s/it, loss=0.096, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=2.05e-5, train/loss_step=0.00356, global_step=178.0]Epoch 0:  59%|█████▉    | 714/1208 [20:46<14:22,  1.75s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.0781, train/loss_vlb_step=0.000257, train/loss_step=0.0781, global_step=178.0]Epoch 0:  59%|█████▉    | 715/1208 [20:47<14:20,  1.74s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.0781, train/loss_vlb_step=0.000257, train/loss_step=0.0781, global_step=178.0]Epoch 0:  59%|█████▉    | 715/1208 [20:47<14:20,  1.74s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.72e-5, train/loss_step=0.0125, global_step=178.0] Epoch 0:  59%|█████▉    | 716/1208 [20:50<14:19,  1.75s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.72e-5, train/loss_step=0.0125, global_step=178.0]Epoch 0:  59%|█████▉    | 716/1208 [20:50<14:19,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.513, train/loss_vlb_step=0.00607, train/loss_step=0.513, global_step=178.0]   Epoch 0:  59%|█████▉    | 717/1208 [20:52<14:17,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.513, train/loss_vlb_step=0.00607, train/loss_step=0.513, global_step=178.0]Epoch 0:  59%|█████▉    | 717/1208 [20:52<14:17,  1.75s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00993, train/loss_vlb_step=4.61e-5, train/loss_step=0.00993, global_step=179.0]Epoch 0:  59%|█████▉    | 718/1208 [20:53<14:15,  1.75s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00993, train/loss_vlb_step=4.61e-5, train/loss_step=0.00993, global_step=179.0]Epoch 0:  59%|█████▉    | 718/1208 [20:53<14:15,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00168, train/loss_step=0.316, global_step=179.0]    Epoch 0:  60%|█████▉    | 719/1208 [20:54<14:12,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00168, train/loss_step=0.316, global_step=179.0]Epoch 0:  60%|█████▉    | 719/1208 [20:54<14:12,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000846, train/loss_step=0.228, global_step=179.0]Epoch 0:  60%|█████▉    | 720/1208 [20:57<14:12,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000846, train/loss_step=0.228, global_step=179.0]Epoch 0:  60%|█████▉    | 720/1208 [20:57<14:12,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.00015, train/loss_step=0.0401, global_step=179.0]Epoch 0:  60%|█████▉    | 721/1208 [20:58<14:10,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.00015, train/loss_step=0.0401, global_step=179.0]Epoch 0:  60%|█████▉    | 721/1208 [20:58<14:10,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00165, train/loss_step=0.348, global_step=180.0]   Epoch 0:  60%|█████▉    | 722/1208 [20:59<14:07,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00165, train/loss_step=0.348, global_step=180.0]Epoch 0:  60%|█████▉    | 722/1208 [20:59<14:07,  1.74s/it, loss=0.177, v_num=0, train/loss_simple_step=0.767, train/loss_vlb_step=0.0653, train/loss_step=0.767, global_step=180.0]Epoch 0:  60%|█████▉    | 723/1208 [21:00<14:05,  1.74s/it, loss=0.177, v_num=0, train/loss_simple_step=0.767, train/loss_vlb_step=0.0653, train/loss_step=0.767, global_step=180.0]Epoch 0:  60%|█████▉    | 723/1208 [21:00<14:05,  1.74s/it, loss=0.209, v_num=0, train/loss_simple_step=0.669, train/loss_vlb_step=0.0269, train/loss_step=0.669, global_step=180.0]Epoch 0:  60%|█████▉    | 724/1208 [21:03<14:04,  1.75s/it, loss=0.209, v_num=0, train/loss_simple_step=0.669, train/loss_vlb_step=0.0269, train/loss_step=0.669, global_step=180.0]Epoch 0:  60%|█████▉    | 724/1208 [21:03<14:04,  1.75s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.75e-5, train/loss_step=0.0246, global_step=180.0]Epoch 0:  60%|██████    | 725/1208 [21:04<14:02,  1.74s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.75e-5, train/loss_step=0.0246, global_step=180.0]Epoch 0:  60%|██████    | 725/1208 [21:04<14:02,  1.74s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00482, train/loss_vlb_step=2.59e-5, train/loss_step=0.00482, global_step=181.0]Epoch 0:  60%|██████    | 726/1208 [21:06<14:00,  1.74s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00482, train/loss_vlb_step=2.59e-5, train/loss_step=0.00482, global_step=181.0]Epoch 0:  60%|██████    | 726/1208 [21:06<14:00,  1.74s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.000174, train/loss_step=0.0489, global_step=181.0] Epoch 0:  60%|██████    | 727/1208 [21:07<13:58,  1.74s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.000174, train/loss_step=0.0489, global_step=181.0]Epoch 0:  60%|██████    | 727/1208 [21:07<13:58,  1.74s/it, loss=0.187, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00158, train/loss_step=0.320, global_step=181.0]   Epoch 0:  60%|██████    | 728/1208 [21:10<13:57,  1.74s/it, loss=0.187, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00158, train/loss_step=0.320, global_step=181.0]Epoch 0:  60%|██████    | 728/1208 [21:10<13:57,  1.74s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0695, train/loss_vlb_step=0.000232, train/loss_step=0.0695, global_step=181.0]Epoch 0:  60%|██████    | 729/1208 [21:11<13:55,  1.74s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0695, train/loss_vlb_step=0.000232, train/loss_step=0.0695, global_step=181.0]Epoch 0:  60%|██████    | 729/1208 [21:11<13:55,  1.74s/it, loss=0.186, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.000171, train/loss_step=0.048, global_step=182.0]  Epoch 0:  60%|██████    | 730/1208 [21:12<13:53,  1.74s/it, loss=0.186, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.000171, train/loss_step=0.048, global_step=182.0]Epoch 0:  60%|██████    | 730/1208 [21:12<13:53,  1.74s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0049, train/loss_vlb_step=2.63e-5, train/loss_step=0.0049, global_step=182.0]Epoch 0:  61%|██████    | 731/1208 [21:13<13:50,  1.74s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0049, train/loss_vlb_step=2.63e-5, train/loss_step=0.0049, global_step=182.0]Epoch 0:  61%|██████    | 731/1208 [21:13<13:50,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.00038, train/loss_step=0.115, global_step=182.0]  Epoch 0:  61%|██████    | 732/1208 [21:16<13:50,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.00038, train/loss_step=0.115, global_step=182.0]Epoch 0:  61%|██████    | 732/1208 [21:16<13:50,  1.74s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.87e-5, train/loss_step=0.0212, global_step=182.0]Epoch 0:  61%|██████    | 733/1208 [21:17<13:48,  1.74s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.87e-5, train/loss_step=0.0212, global_step=182.0]Epoch 0:  61%|██████    | 733/1208 [21:17<13:48,  1.74s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.000105, train/loss_step=0.0248, global_step=183.0]Epoch 0:  61%|██████    | 734/1208 [21:18<13:45,  1.74s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.000105, train/loss_step=0.0248, global_step=183.0]Epoch 0:  61%|██████    | 734/1208 [21:18<13:45,  1.74s/it, loss=0.189, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000735, train/loss_step=0.197, global_step=183.0]  Epoch 0:  61%|██████    | 735/1208 [21:20<13:43,  1.74s/it, loss=0.189, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000735, train/loss_step=0.197, global_step=183.0]Epoch 0:  61%|██████    | 735/1208 [21:20<13:43,  1.74s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00889, train/loss_vlb_step=4.34e-5, train/loss_step=0.00889, global_step=183.0]Epoch 0:  61%|██████    | 736/1208 [21:23<13:42,  1.74s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00889, train/loss_vlb_step=4.34e-5, train/loss_step=0.00889, global_step=183.0]Epoch 0:  61%|██████    | 736/1208 [21:23<13:42,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.078, train/loss_vlb_step=0.000266, train/loss_step=0.078, global_step=183.0]   Epoch 0:  61%|██████    | 737/1208 [21:24<13:40,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.078, train/loss_vlb_step=0.000266, train/loss_step=0.078, global_step=183.0]Epoch 0:  61%|██████    | 737/1208 [21:24<13:40,  1.74s/it, loss=0.186, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00267, train/loss_step=0.381, global_step=184.0] Epoch 0:  61%|██████    | 738/1208 [21:25<13:38,  1.74s/it, loss=0.186, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00267, train/loss_step=0.381, global_step=184.0]Epoch 0:  61%|██████    | 738/1208 [21:25<13:38,  1.74s/it, loss=0.184, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00112, train/loss_step=0.277, global_step=184.0]Epoch 0:  61%|██████    | 739/1208 [21:26<13:36,  1.74s/it, loss=0.184, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00112, train/loss_step=0.277, global_step=184.0]Epoch 0:  61%|██████    | 739/1208 [21:26<13:36,  1.74s/it, loss=0.199, v_num=0, train/loss_simple_step=0.537, train/loss_vlb_step=0.015, train/loss_step=0.537, global_step=184.0]  Epoch 0:  61%|██████▏   | 740/1208 [21:29<13:35,  1.74s/it, loss=0.199, v_num=0, train/loss_simple_step=0.537, train/loss_vlb_step=0.015, train/loss_step=0.537, global_step=184.0]Epoch 0:  61%|██████▏   | 740/1208 [21:29<13:35,  1.74s/it, loss=0.206, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000632, train/loss_step=0.185, global_step=184.0]Epoch 0:  61%|██████▏   | 741/1208 [21:30<13:33,  1.74s/it, loss=0.206, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000632, train/loss_step=0.185, global_step=184.0]Epoch 0:  61%|██████▏   | 741/1208 [21:30<13:33,  1.74s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.21e-5, train/loss_step=0.0146, global_step=185.0]Epoch 0:  61%|██████▏   | 742/1208 [21:31<13:31,  1.74s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.21e-5, train/loss_step=0.0146, global_step=185.0]Epoch 0:  61%|██████▏   | 742/1208 [21:31<13:31,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=1.29e-5, train/loss_step=0.00227, global_step=185.0]Epoch 0:  62%|██████▏   | 743/1208 [21:32<13:29,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=1.29e-5, train/loss_step=0.00227, global_step=185.0]Epoch 0:  62%|██████▏   | 743/1208 [21:32<13:29,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.421, train/loss_vlb_step=0.00444, train/loss_step=0.421, global_step=185.0]    Epoch 0:  62%|██████▏   | 744/1208 [21:36<13:28,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.421, train/loss_vlb_step=0.00444, train/loss_step=0.421, global_step=185.0]Epoch 0:  62%|██████▏   | 744/1208 [21:36<13:28,  1.74s/it, loss=0.151, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00121, train/loss_step=0.252, global_step=185.0]Epoch 0:  62%|██████▏   | 745/1208 [21:37<13:26,  1.74s/it, loss=0.151, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00121, train/loss_step=0.252, global_step=185.0]Epoch 0:  62%|██████▏   | 745/1208 [21:37<13:26,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000809, train/loss_step=0.234, global_step=186.0]Epoch 0:  62%|██████▏   | 746/1208 [21:38<13:24,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000809, train/loss_step=0.234, global_step=186.0]Epoch 0:  62%|██████▏   | 746/1208 [21:38<13:24,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0473, train/loss_vlb_step=0.000169, train/loss_step=0.0473, global_step=186.0]Epoch 0:  62%|██████▏   | 747/1208 [21:39<13:21,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0473, train/loss_vlb_step=0.000169, train/loss_step=0.0473, global_step=186.0]Epoch 0:  62%|██████▏   | 747/1208 [21:39<13:21,  1.74s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0832, train/loss_vlb_step=0.000275, train/loss_step=0.0832, global_step=186.0] Epoch 0:  62%|██████▏   | 748/1208 [21:42<13:21,  1.74s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0832, train/loss_vlb_step=0.000275, train/loss_step=0.0832, global_step=186.0]Epoch 0:  62%|██████▏   | 748/1208 [21:42<13:21,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=9.05e-5, train/loss_step=0.0213, global_step=186.0]Epoch 0:  62%|██████▏   | 749/1208 [21:43<13:18,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=9.05e-5, train/loss_step=0.0213, global_step=186.0]Epoch 0:  62%|██████▏   | 749/1208 [21:43<13:18,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00358, train/loss_vlb_step=2.04e-5, train/loss_step=0.00358, global_step=187.0]Epoch 0:  62%|██████▏   | 750/1208 [21:44<13:16,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00358, train/loss_vlb_step=2.04e-5, train/loss_step=0.00358, global_step=187.0]Epoch 0:  62%|██████▏   | 750/1208 [21:44<13:16,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.41e-5, train/loss_step=0.0233, global_step=187.0]  Epoch 0:  62%|██████▏   | 751/1208 [21:45<13:14,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.41e-5, train/loss_step=0.0233, global_step=187.0]Epoch 0:  62%|██████▏   | 751/1208 [21:45<13:14,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000115, train/loss_step=0.0297, global_step=187.0]Epoch 0:  62%|██████▏   | 752/1208 [21:49<13:13,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000115, train/loss_step=0.0297, global_step=187.0]Epoch 0:  62%|██████▏   | 752/1208 [21:49<13:13,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.24e-5, train/loss_step=0.00208, global_step=187.0]Epoch 0:  62%|██████▏   | 753/1208 [21:50<13:11,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.24e-5, train/loss_step=0.00208, global_step=187.0]Epoch 0:  62%|██████▏   | 753/1208 [21:50<13:11,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00122, train/loss_step=0.278, global_step=188.0]    Epoch 0:  62%|██████▏   | 754/1208 [21:51<13:09,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00122, train/loss_step=0.278, global_step=188.0]Epoch 0:  62%|██████▏   | 754/1208 [21:51<13:09,  1.74s/it, loss=0.151, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000487, train/loss_step=0.147, global_step=188.0]Epoch 0:  62%|██████▎   | 755/1208 [21:52<13:07,  1.74s/it, loss=0.151, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000487, train/loss_step=0.147, global_step=188.0]Epoch 0:  62%|██████▎   | 755/1208 [21:52<13:07,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.0015, train/loss_step=0.302, global_step=188.0]  Epoch 0:  63%|██████▎   | 756/1208 [21:55<13:06,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.0015, train/loss_step=0.302, global_step=188.0]Epoch 0:  63%|██████▎   | 756/1208 [21:55<13:06,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00962, train/loss_vlb_step=4.78e-5, train/loss_step=0.00962, global_step=188.0]Epoch 0:  63%|██████▎   | 757/1208 [21:56<13:04,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00962, train/loss_vlb_step=4.78e-5, train/loss_step=0.00962, global_step=188.0]Epoch 0:  63%|██████▎   | 757/1208 [21:56<13:04,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0584, train/loss_vlb_step=0.000201, train/loss_step=0.0584, global_step=189.0] Epoch 0:  63%|██████▎   | 758/1208 [21:57<13:02,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0584, train/loss_vlb_step=0.000201, train/loss_step=0.0584, global_step=189.0]Epoch 0:  63%|██████▎   | 758/1208 [21:57<13:02,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.65e-5, train/loss_step=0.015, global_step=189.0]   Epoch 0:  63%|██████▎   | 759/1208 [21:58<13:00,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.65e-5, train/loss_step=0.015, global_step=189.0]Epoch 0:  63%|██████▎   | 759/1208 [21:58<13:00,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0498, train/loss_vlb_step=0.000176, train/loss_step=0.0498, global_step=189.0]Epoch 0:  63%|██████▎   | 760/1208 [22:01<12:59,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0498, train/loss_vlb_step=0.000176, train/loss_step=0.0498, global_step=189.0]Epoch 0:  63%|██████▎   | 760/1208 [22:01<12:59,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.066, train/loss_vlb_step=0.000225, train/loss_step=0.066, global_step=189.0]  Epoch 0:  63%|██████▎   | 761/1208 [22:03<12:57,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.066, train/loss_vlb_step=0.000225, train/loss_step=0.066, global_step=189.0]Epoch 0:  63%|██████▎   | 761/1208 [22:03<12:57,  1.74s/it, loss=0.11, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000561, train/loss_step=0.164, global_step=190.0] Epoch 0:  63%|██████▎   | 762/1208 [22:04<12:54,  1.74s/it, loss=0.11, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000561, train/loss_step=0.164, global_step=190.0]Epoch 0:  63%|██████▎   | 762/1208 [22:04<12:54,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.66e-5, train/loss_step=0.0128, global_step=190.0]Epoch 0:  63%|██████▎   | 763/1208 [22:05<12:52,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.66e-5, train/loss_step=0.0128, global_step=190.0]Epoch 0:  63%|██████▎   | 763/1208 [22:05<12:52,  1.74s/it, loss=0.0903, v_num=0, train/loss_simple_step=0.00785, train/loss_vlb_step=3.92e-5, train/loss_step=0.00785, global_step=190.0]Epoch 0:  63%|██████▎   | 764/1208 [22:08<12:52,  1.74s/it, loss=0.0903, v_num=0, train/loss_simple_step=0.00785, train/loss_vlb_step=3.92e-5, train/loss_step=0.00785, global_step=190.0]Epoch 0:  63%|██████▎   | 764/1208 [22:08<12:52,  1.74s/it, loss=0.0779, v_num=0, train/loss_simple_step=0.00494, train/loss_vlb_step=2.7e-5, train/loss_step=0.00494, global_step=190.0] Epoch 0:  63%|██████▎   | 765/1208 [22:09<12:49,  1.74s/it, loss=0.0779, v_num=0, train/loss_simple_step=0.00494, train/loss_vlb_step=2.7e-5, train/loss_step=0.00494, global_step=190.0]Epoch 0:  63%|██████▎   | 765/1208 [22:09<12:49,  1.74s/it, loss=0.0743, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000529, train/loss_step=0.160, global_step=191.0]  Epoch 0:  63%|██████▎   | 766/1208 [22:10<12:47,  1.74s/it, loss=0.0743, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000529, train/loss_step=0.160, global_step=191.0]Epoch 0:  63%|██████▎   | 766/1208 [22:10<12:47,  1.74s/it, loss=0.0731, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.58e-5, train/loss_step=0.0229, global_step=191.0]Epoch 0:  63%|██████▎   | 767/1208 [22:11<12:45,  1.74s/it, loss=0.0731, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.58e-5, train/loss_step=0.0229, global_step=191.0]Epoch 0:  63%|██████▎   | 767/1208 [22:11<12:45,  1.74s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00122, train/loss_step=0.280, global_step=191.0]  Epoch 0:  64%|██████▎   | 768/1208 [22:14<12:44,  1.74s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00122, train/loss_step=0.280, global_step=191.0]Epoch 0:  64%|██████▎   | 768/1208 [22:14<12:44,  1.74s/it, loss=0.0894, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000508, train/loss_step=0.151, global_step=191.0]Epoch 0:  64%|██████▎   | 769/1208 [22:15<12:42,  1.74s/it, loss=0.0894, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000508, train/loss_step=0.151, global_step=191.0]Epoch 0:  64%|██████▎   | 769/1208 [22:15<12:42,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00107, train/loss_step=0.256, global_step=192.0]  Epoch 0:  64%|██████▎   | 770/1208 [22:17<12:40,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00107, train/loss_step=0.256, global_step=192.0]Epoch 0:  64%|██████▎   | 770/1208 [22:17<12:40,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=192.0]Epoch 0:  64%|██████▍   | 771/1208 [22:18<12:38,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=192.0]Epoch 0:  64%|██████▍   | 771/1208 [22:18<12:38,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000444, train/loss_step=0.133, global_step=192.0]Epoch 0:  64%|██████▍   | 772/1208 [22:21<12:37,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000444, train/loss_step=0.133, global_step=192.0]Epoch 0:  64%|██████▍   | 772/1208 [22:21<12:37,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00104, train/loss_step=0.259, global_step=192.0] Epoch 0:  64%|██████▍   | 773/1208 [22:22<12:35,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00104, train/loss_step=0.259, global_step=192.0]Epoch 0:  64%|██████▍   | 773/1208 [22:22<12:35,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.071, train/loss_vlb_step=0.000243, train/loss_step=0.071, global_step=193.0]Epoch 0:  64%|██████▍   | 774/1208 [22:23<12:33,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.071, train/loss_vlb_step=0.000243, train/loss_step=0.071, global_step=193.0]Epoch 0:  64%|██████▍   | 774/1208 [22:23<12:33,  1.74s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0655, train/loss_vlb_step=0.000231, train/loss_step=0.0655, global_step=193.0]Epoch 0:  64%|██████▍   | 775/1208 [22:24<12:31,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0655, train/loss_vlb_step=0.000231, train/loss_step=0.0655, global_step=193.0]Epoch 0:  64%|██████▍   | 775/1208 [22:24<12:31,  1.73s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0247, train/loss_vlb_step=0.000104, train/loss_step=0.0247, global_step=193.0]Epoch 0:  64%|██████▍   | 776/1208 [22:27<12:30,  1.74s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0247, train/loss_vlb_step=0.000104, train/loss_step=0.0247, global_step=193.0]Epoch 0:  64%|██████▍   | 776/1208 [22:27<12:30,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.482, train/loss_vlb_step=0.00467, train/loss_step=0.482, global_step=193.0]    Epoch 0:  64%|██████▍   | 777/1208 [22:28<12:28,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.482, train/loss_vlb_step=0.00467, train/loss_step=0.482, global_step=193.0]Epoch 0:  64%|██████▍   | 777/1208 [22:28<12:28,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000662, train/loss_step=0.182, global_step=194.0]Epoch 0:  64%|██████▍   | 778/1208 [22:29<12:26,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000662, train/loss_step=0.182, global_step=194.0]Epoch 0:  64%|██████▍   | 778/1208 [22:29<12:26,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00127, train/loss_step=0.294, global_step=194.0]  Epoch 0:  64%|██████▍   | 779/1208 [22:30<12:23,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00127, train/loss_step=0.294, global_step=194.0]Epoch 0:  64%|██████▍   | 779/1208 [22:30<12:23,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.41e-5, train/loss_step=0.017, global_step=194.0]Epoch 0:  65%|██████▍   | 780/1208 [22:34<12:23,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.41e-5, train/loss_step=0.017, global_step=194.0]Epoch 0:  65%|██████▍   | 780/1208 [22:34<12:23,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000341, train/loss_step=0.103, global_step=194.0]Epoch 0:  65%|██████▍   | 781/1208 [22:35<12:20,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000341, train/loss_step=0.103, global_step=194.0]Epoch 0:  65%|██████▍   | 781/1208 [22:35<12:20,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000136, train/loss_step=0.0349, global_step=195.0]Epoch 0:  65%|██████▍   | 782/1208 [22:36<12:18,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000136, train/loss_step=0.0349, global_step=195.0]Epoch 0:  65%|██████▍   | 782/1208 [22:36<12:18,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.758, train/loss_vlb_step=0.0488, train/loss_step=0.758, global_step=195.0]    Epoch 0:  65%|██████▍   | 783/1208 [22:37<12:16,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.758, train/loss_vlb_step=0.0488, train/loss_step=0.758, global_step=195.0]Epoch 0:  65%|██████▍   | 783/1208 [22:37<12:16,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.074, train/loss_vlb_step=0.000251, train/loss_step=0.074, global_step=195.0]Epoch 0:  65%|██████▍   | 784/1208 [22:40<12:15,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.074, train/loss_vlb_step=0.000251, train/loss_step=0.074, global_step=195.0]Epoch 0:  65%|██████▍   | 784/1208 [22:40<12:15,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000511, train/loss_step=0.150, global_step=195.0]Epoch 0:  65%|██████▍   | 785/1208 [22:41<12:13,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000511, train/loss_step=0.150, global_step=195.0]Epoch 0:  65%|██████▍   | 785/1208 [22:41<12:13,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=196.0]Epoch 0:  65%|██████▌   | 786/1208 [22:42<12:11,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=196.0]Epoch 0:  65%|██████▌   | 786/1208 [22:42<12:11,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000568, train/loss_step=0.169, global_step=196.0]Epoch 0:  65%|██████▌   | 787/1208 [22:43<12:09,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000568, train/loss_step=0.169, global_step=196.0]Epoch 0:  65%|██████▌   | 787/1208 [22:43<12:09,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.93e-5, train/loss_step=0.0134, global_step=196.0]Epoch 0:  65%|██████▌   | 788/1208 [22:47<12:08,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.93e-5, train/loss_step=0.0134, global_step=196.0]Epoch 0:  65%|██████▌   | 788/1208 [22:47<12:08,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.37e-5, train/loss_step=0.0113, global_step=196.0]Epoch 0:  65%|██████▌   | 789/1208 [22:48<12:06,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.37e-5, train/loss_step=0.0113, global_step=196.0]Epoch 0:  65%|██████▌   | 789/1208 [22:48<12:06,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00854, train/loss_vlb_step=3.99e-5, train/loss_step=0.00854, global_step=197.0]Epoch 0:  65%|██████▌   | 790/1208 [22:49<12:04,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00854, train/loss_vlb_step=3.99e-5, train/loss_step=0.00854, global_step=197.0]Epoch 0:  65%|██████▌   | 790/1208 [22:49<12:04,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000793, train/loss_step=0.213, global_step=197.0]   Epoch 0:  65%|██████▌   | 791/1208 [22:50<12:02,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000793, train/loss_step=0.213, global_step=197.0]Epoch 0:  65%|██████▌   | 791/1208 [22:50<12:02,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000681, train/loss_step=0.191, global_step=197.0]Epoch 0:  66%|██████▌   | 792/1208 [22:53<12:01,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000681, train/loss_step=0.191, global_step=197.0]Epoch 0:  66%|██████▌   | 792/1208 [22:53<12:01,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.99e-5, train/loss_step=0.00349, global_step=197.0]Epoch 0:  66%|██████▌   | 793/1208 [22:54<11:59,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.99e-5, train/loss_step=0.00349, global_step=197.0]Epoch 0:  66%|██████▌   | 793/1208 [22:54<11:59,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.097, train/loss_vlb_step=0.000323, train/loss_step=0.097, global_step=198.0]    Epoch 0:  66%|██████▌   | 794/1208 [22:55<11:57,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.097, train/loss_vlb_step=0.000323, train/loss_step=0.097, global_step=198.0]Epoch 0:  66%|██████▌   | 794/1208 [22:55<11:57,  1.73s/it, loss=0.187, v_num=0, train/loss_simple_step=0.798, train/loss_vlb_step=0.101, train/loss_step=0.798, global_step=198.0]  Epoch 0:  66%|██████▌   | 795/1208 [22:56<11:55,  1.73s/it, loss=0.187, v_num=0, train/loss_simple_step=0.798, train/loss_vlb_step=0.101, train/loss_step=0.798, global_step=198.0]Epoch 0:  66%|██████▌   | 795/1208 [22:56<11:55,  1.73s/it, loss=0.206, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00279, train/loss_step=0.420, global_step=198.0]Epoch 0:  66%|██████▌   | 796/1208 [23:00<11:54,  1.73s/it, loss=0.206, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00279, train/loss_step=0.420, global_step=198.0]Epoch 0:  66%|██████▌   | 796/1208 [23:00<11:54,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00377, train/loss_vlb_step=2.17e-5, train/loss_step=0.00377, global_step=198.0]Epoch 0:  66%|██████▌   | 797/1208 [23:01<11:52,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00377, train/loss_vlb_step=2.17e-5, train/loss_step=0.00377, global_step=198.0]Epoch 0:  66%|██████▌   | 797/1208 [23:01<11:52,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00898, train/loss_vlb_step=4.15e-5, train/loss_step=0.00898, global_step=199.0]Epoch 0:  66%|██████▌   | 798/1208 [23:02<11:50,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00898, train/loss_vlb_step=4.15e-5, train/loss_step=0.00898, global_step=199.0]Epoch 0:  66%|██████▌   | 798/1208 [23:02<11:50,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.23e-5, train/loss_step=0.0146, global_step=199.0]   Epoch 0:  66%|██████▌   | 799/1208 [23:03<11:48,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.23e-5, train/loss_step=0.0146, global_step=199.0]Epoch 0:  66%|██████▌   | 799/1208 [23:03<11:48,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0391, train/loss_vlb_step=0.000154, train/loss_step=0.0391, global_step=199.0]Epoch 0:  66%|██████▌   | 800/1208 [23:06<11:47,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0391, train/loss_vlb_step=0.000154, train/loss_step=0.0391, global_step=199.0]Epoch 0:  66%|██████▌   | 800/1208 [23:06<11:47,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=199.0]  Epoch 0:  66%|██████▋   | 801/1208 [23:07<11:45,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=199.0]Epoch 0:  66%|██████▋   | 801/1208 [23:07<11:45,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.37e-5, train/loss_step=0.00423, global_step=200.0]Epoch 0:  66%|██████▋   | 802/1208 [23:08<11:42,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.37e-5, train/loss_step=0.00423, global_step=200.0]Epoch 0:  66%|██████▋   | 802/1208 [23:08<11:42,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=1.25e-5, train/loss_step=0.00206, global_step=200.0]Epoch 0:  66%|██████▋   | 803/1208 [23:09<11:40,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=1.25e-5, train/loss_step=0.00206, global_step=200.0]Epoch 0:  66%|██████▋   | 803/1208 [23:09<11:40,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000425, train/loss_step=0.129, global_step=200.0]   Epoch 0:  67%|██████▋   | 804/1208 [23:12<11:39,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000425, train/loss_step=0.129, global_step=200.0]Epoch 0:  67%|██████▋   | 804/1208 [23:12<11:39,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0714, train/loss_vlb_step=0.000241, train/loss_step=0.0714, global_step=200.0]Epoch 0:  67%|██████▋   | 805/1208 [23:13<11:37,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0714, train/loss_vlb_step=0.000241, train/loss_step=0.0714, global_step=200.0]Epoch 0:  67%|██████▋   | 805/1208 [23:13<11:37,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000765, train/loss_step=0.207, global_step=201.0]  Epoch 0:  67%|██████▋   | 806/1208 [23:15<11:35,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000765, train/loss_step=0.207, global_step=201.0]Epoch 0:  67%|██████▋   | 806/1208 [23:15<11:35,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0729, train/loss_vlb_step=0.000242, train/loss_step=0.0729, global_step=201.0]Epoch 0:  67%|██████▋   | 807/1208 [23:16<11:33,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0729, train/loss_vlb_step=0.000242, train/loss_step=0.0729, global_step=201.0]Epoch 0:  67%|██████▋   | 807/1208 [23:16<11:33,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000511, train/loss_step=0.155, global_step=201.0]  Epoch 0:  67%|██████▋   | 808/1208 [23:19<11:32,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000511, train/loss_step=0.155, global_step=201.0]Epoch 0:  67%|██████▋   | 808/1208 [23:19<11:32,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.38e-5, train/loss_step=0.0226, global_step=201.0]Epoch 0:  67%|██████▋   | 809/1208 [23:20<11:30,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.38e-5, train/loss_step=0.0226, global_step=201.0]Epoch 0:  67%|██████▋   | 809/1208 [23:20<11:30,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=9.76e-5, train/loss_step=0.0253, global_step=202.0]Epoch 0:  67%|██████▋   | 810/1208 [23:21<11:28,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=9.76e-5, train/loss_step=0.0253, global_step=202.0]Epoch 0:  67%|██████▋   | 810/1208 [23:21<11:28,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.65e-5, train/loss_step=0.00285, global_step=202.0]Epoch 0:  67%|██████▋   | 811/1208 [23:22<11:26,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.65e-5, train/loss_step=0.00285, global_step=202.0]Epoch 0:  67%|██████▋   | 811/1208 [23:22<11:26,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.000127, train/loss_step=0.0316, global_step=202.0] Epoch 0:  67%|██████▋   | 812/1208 [23:25<11:25,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.000127, train/loss_step=0.0316, global_step=202.0]Epoch 0:  67%|██████▋   | 812/1208 [23:25<11:25,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000369, train/loss_step=0.111, global_step=202.0]  Epoch 0:  67%|██████▋   | 813/1208 [23:26<11:23,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000369, train/loss_step=0.111, global_step=202.0]Epoch 0:  67%|██████▋   | 813/1208 [23:26<11:23,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0689, train/loss_vlb_step=0.000243, train/loss_step=0.0689, global_step=203.0]Epoch 0:  67%|██████▋   | 814/1208 [23:27<11:21,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0689, train/loss_vlb_step=0.000243, train/loss_step=0.0689, global_step=203.0]Epoch 0:  67%|██████▋   | 814/1208 [23:27<11:21,  1.73s/it, loss=0.0758, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=6.99e-5, train/loss_step=0.0168, global_step=203.0]Epoch 0:  67%|██████▋   | 815/1208 [23:28<11:19,  1.73s/it, loss=0.0758, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=6.99e-5, train/loss_step=0.0168, global_step=203.0]Epoch 0:  67%|██████▋   | 815/1208 [23:28<11:19,  1.73s/it, loss=0.0551, v_num=0, train/loss_simple_step=0.00786, train/loss_vlb_step=3.89e-5, train/loss_step=0.00786, global_step=203.0]Epoch 0:  68%|██████▊   | 816/1208 [23:32<11:18,  1.73s/it, loss=0.0551, v_num=0, train/loss_simple_step=0.00786, train/loss_vlb_step=3.89e-5, train/loss_step=0.00786, global_step=203.0]Epoch 0:  68%|██████▊   | 816/1208 [23:32<11:18,  1.73s/it, loss=0.0556, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.94e-5, train/loss_step=0.0126, global_step=203.0]  Epoch 0:  68%|██████▊   | 817/1208 [23:33<11:16,  1.73s/it, loss=0.0556, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.94e-5, train/loss_step=0.0126, global_step=203.0]Epoch 0:  68%|██████▊   | 817/1208 [23:33<11:16,  1.73s/it, loss=0.056, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.64e-5, train/loss_step=0.0172, global_step=204.0] Epoch 0:  68%|██████▊   | 818/1208 [23:34<11:14,  1.73s/it, loss=0.056, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.64e-5, train/loss_step=0.0172, global_step=204.0]Epoch 0:  68%|██████▊   | 818/1208 [23:34<11:14,  1.73s/it, loss=0.0625, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000481, train/loss_step=0.145, global_step=204.0]Epoch 0:  68%|██████▊   | 819/1208 [23:35<11:12,  1.73s/it, loss=0.0625, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000481, train/loss_step=0.145, global_step=204.0]Epoch 0:  68%|██████▊   | 819/1208 [23:35<11:12,  1.73s/it, loss=0.061, v_num=0, train/loss_simple_step=0.00843, train/loss_vlb_step=4.26e-5, train/loss_step=0.00843, global_step=204.0]Epoch 0:  68%|██████▊   | 820/1208 [23:38<11:11,  1.73s/it, loss=0.061, v_num=0, train/loss_simple_step=0.00843, train/loss_vlb_step=4.26e-5, train/loss_step=0.00843, global_step=204.0]Epoch 0:  68%|██████▊   | 820/1208 [23:38<11:11,  1.73s/it, loss=0.0588, v_num=0, train/loss_simple_step=0.0632, train/loss_vlb_step=0.000221, train/loss_step=0.0632, global_step=204.0]Epoch 0:  68%|██████▊   | 821/1208 [23:39<11:09,  1.73s/it, loss=0.0588, v_num=0, train/loss_simple_step=0.0632, train/loss_vlb_step=0.000221, train/loss_step=0.0632, global_step=204.0]Epoch 0:  68%|██████▊   | 821/1208 [23:39<11:09,  1.73s/it, loss=0.0637, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.00034, train/loss_step=0.103, global_step=205.0]   Epoch 0:  68%|██████▊   | 822/1208 [23:40<11:07,  1.73s/it, loss=0.0637, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.00034, train/loss_step=0.103, global_step=205.0]Epoch 0:  68%|██████▊   | 822/1208 [23:40<11:07,  1.73s/it, loss=0.082, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00276, train/loss_step=0.368, global_step=205.0] Epoch 0:  68%|██████▊   | 823/1208 [23:41<11:05,  1.73s/it, loss=0.082, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00276, train/loss_step=0.368, global_step=205.0]Epoch 0:  68%|██████▊   | 823/1208 [23:41<11:05,  1.73s/it, loss=0.0764, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=7.1e-5, train/loss_step=0.0162, global_step=205.0]Epoch 0:  68%|██████▊   | 824/1208 [23:45<11:04,  1.73s/it, loss=0.0764, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=7.1e-5, train/loss_step=0.0162, global_step=205.0]Epoch 0:  68%|██████▊   | 824/1208 [23:45<11:04,  1.73s/it, loss=0.0759, v_num=0, train/loss_simple_step=0.0617, train/loss_vlb_step=0.000217, train/loss_step=0.0617, global_step=205.0]Epoch 0:  68%|██████▊   | 825/1208 [23:46<11:02,  1.73s/it, loss=0.0759, v_num=0, train/loss_simple_step=0.0617, train/loss_vlb_step=0.000217, train/loss_step=0.0617, global_step=205.0]Epoch 0:  68%|██████▊   | 825/1208 [23:46<11:02,  1.73s/it, loss=0.069, v_num=0, train/loss_simple_step=0.0695, train/loss_vlb_step=0.000242, train/loss_step=0.0695, global_step=206.0] Epoch 0:  68%|██████▊   | 826/1208 [23:47<11:00,  1.73s/it, loss=0.069, v_num=0, train/loss_simple_step=0.0695, train/loss_vlb_step=0.000242, train/loss_step=0.0695, global_step=206.0]Epoch 0:  68%|██████▊   | 826/1208 [23:47<11:00,  1.73s/it, loss=0.0658, v_num=0, train/loss_simple_step=0.00904, train/loss_vlb_step=4.34e-5, train/loss_step=0.00904, global_step=206.0]Epoch 0:  68%|██████▊   | 827/1208 [23:48<10:58,  1.73s/it, loss=0.0658, v_num=0, train/loss_simple_step=0.00904, train/loss_vlb_step=4.34e-5, train/loss_step=0.00904, global_step=206.0]Epoch 0:  68%|██████▊   | 827/1208 [23:48<10:58,  1.73s/it, loss=0.0672, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000626, train/loss_step=0.182, global_step=206.0]   Epoch 0:  69%|██████▊   | 828/1208 [23:51<10:56,  1.73s/it, loss=0.0672, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000626, train/loss_step=0.182, global_step=206.0]Epoch 0:  69%|██████▊   | 828/1208 [23:51<10:56,  1.73s/it, loss=0.0786, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00106, train/loss_step=0.250, global_step=206.0] Epoch 0:  69%|██████▊   | 829/1208 [23:52<10:54,  1.73s/it, loss=0.0786, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00106, train/loss_step=0.250, global_step=206.0]Epoch 0:  69%|██████▊   | 829/1208 [23:52<10:54,  1.73s/it, loss=0.0781, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.55e-5, train/loss_step=0.017, global_step=207.0]Epoch 0:  69%|██████▊   | 830/1208 [23:53<10:52,  1.73s/it, loss=0.0781, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.55e-5, train/loss_step=0.017, global_step=207.0]Epoch 0:  69%|██████▊   | 830/1208 [23:53<10:52,  1.73s/it, loss=0.0866, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000586, train/loss_step=0.172, global_step=207.0]Epoch 0:  69%|██████▉   | 831/1208 [23:54<10:50,  1.73s/it, loss=0.0866, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000586, train/loss_step=0.172, global_step=207.0]Epoch 0:  69%|██████▉   | 831/1208 [23:54<10:50,  1.73s/it, loss=0.098, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00107, train/loss_step=0.259, global_step=207.0]  Epoch 0:  69%|██████▉   | 832/1208 [23:57<10:49,  1.73s/it, loss=0.098, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00107, train/loss_step=0.259, global_step=207.0]Epoch 0:  69%|██████▉   | 832/1208 [23:57<10:49,  1.73s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.0595, train/loss_vlb_step=0.000212, train/loss_step=0.0595, global_step=207.0]Epoch 0:  69%|██████▉   | 833/1208 [23:59<10:47,  1.73s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.0595, train/loss_vlb_step=0.000212, train/loss_step=0.0595, global_step=207.0]Epoch 0:  69%|██████▉   | 833/1208 [23:59<10:47,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00147, train/loss_step=0.281, global_step=208.0]    Epoch 0:  69%|██████▉   | 834/1208 [24:00<10:45,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00147, train/loss_step=0.281, global_step=208.0]Epoch 0:  69%|██████▉   | 834/1208 [24:00<10:45,  1.73s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=2e-5, train/loss_step=0.00345, global_step=208.0]Epoch 0:  69%|██████▉   | 835/1208 [24:01<10:43,  1.73s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=2e-5, train/loss_step=0.00345, global_step=208.0]Epoch 0:  69%|██████▉   | 835/1208 [24:01<10:43,  1.73s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=1.85e-5, train/loss_step=0.0034, global_step=208.0]Epoch 0:  69%|██████▉   | 836/1208 [24:04<10:42,  1.73s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=1.85e-5, train/loss_step=0.0034, global_step=208.0]Epoch 0:  69%|██████▉   | 836/1208 [24:04<10:42,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000357, train/loss_step=0.108, global_step=208.0]  Epoch 0:  69%|██████▉   | 837/1208 [24:05<10:40,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000357, train/loss_step=0.108, global_step=208.0]Epoch 0:  69%|██████▉   | 837/1208 [24:05<10:40,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00181, train/loss_step=0.315, global_step=209.0]Epoch 0:  69%|██████▉   | 838/1208 [24:06<10:38,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00181, train/loss_step=0.315, global_step=209.0]Epoch 0:  69%|██████▉   | 838/1208 [24:06<10:38,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0947, train/loss_vlb_step=0.000311, train/loss_step=0.0947, global_step=209.0]Epoch 0:  69%|██████▉   | 839/1208 [24:07<10:36,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0947, train/loss_vlb_step=0.000311, train/loss_step=0.0947, global_step=209.0]Epoch 0:  69%|██████▉   | 839/1208 [24:07<10:36,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00576, train/loss_vlb_step=3.1e-5, train/loss_step=0.00576, global_step=209.0]Epoch 0:  70%|██████▉   | 840/1208 [24:10<10:35,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00576, train/loss_vlb_step=3.1e-5, train/loss_step=0.00576, global_step=209.0]Epoch 0:  70%|██████▉   | 840/1208 [24:10<10:35,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=209.0]  Epoch 0:  70%|██████▉   | 841/1208 [24:11<10:33,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=209.0]Epoch 0:  70%|██████▉   | 841/1208 [24:11<10:33,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00178, train/loss_step=0.321, global_step=210.0] Epoch 0:  70%|██████▉   | 842/1208 [24:13<10:31,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00178, train/loss_step=0.321, global_step=210.0]Epoch 0:  70%|██████▉   | 842/1208 [24:13<10:31,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5e-5, train/loss_step=0.0119, global_step=210.0] Epoch 0:  70%|██████▉   | 843/1208 [24:14<10:29,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5e-5, train/loss_step=0.0119, global_step=210.0]Epoch 0:  70%|██████▉   | 843/1208 [24:14<10:29,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=210.0]Epoch 0:  70%|██████▉   | 844/1208 [24:17<10:28,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=210.0]Epoch 0:  70%|██████▉   | 844/1208 [24:17<10:28,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000128, train/loss_step=0.035, global_step=210.0]Epoch 0:  70%|██████▉   | 845/1208 [24:18<10:26,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000128, train/loss_step=0.035, global_step=210.0]Epoch 0:  70%|██████▉   | 845/1208 [24:18<10:26,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00703, train/loss_vlb_step=3.54e-5, train/loss_step=0.00703, global_step=211.0]Epoch 0:  70%|███████   | 846/1208 [24:19<10:24,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00703, train/loss_vlb_step=3.54e-5, train/loss_step=0.00703, global_step=211.0]Epoch 0:  70%|███████   | 846/1208 [24:19<10:24,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00193, train/loss_vlb_step=1.18e-5, train/loss_step=0.00193, global_step=211.0]Epoch 0:  70%|███████   | 847/1208 [24:20<10:22,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00193, train/loss_vlb_step=1.18e-5, train/loss_step=0.00193, global_step=211.0]Epoch 0:  70%|███████   | 847/1208 [24:20<10:22,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0505, train/loss_vlb_step=0.000178, train/loss_step=0.0505, global_step=211.0] Epoch 0:  70%|███████   | 848/1208 [24:23<10:21,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0505, train/loss_vlb_step=0.000178, train/loss_step=0.0505, global_step=211.0]Epoch 0:  70%|███████   | 848/1208 [24:23<10:21,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.00427, train/loss_step=0.470, global_step=211.0]   Epoch 0:  70%|███████   | 849/1208 [24:25<10:19,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.00427, train/loss_step=0.470, global_step=211.0]Epoch 0:  70%|███████   | 849/1208 [24:25<10:19,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0925, train/loss_vlb_step=0.000304, train/loss_step=0.0925, global_step=212.0]Epoch 0:  70%|███████   | 850/1208 [24:26<10:17,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0925, train/loss_vlb_step=0.000304, train/loss_step=0.0925, global_step=212.0]Epoch 0:  70%|███████   | 850/1208 [24:26<10:17,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.00041, train/loss_step=0.123, global_step=212.0]   Epoch 0:  70%|███████   | 851/1208 [24:27<10:15,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.00041, train/loss_step=0.123, global_step=212.0]Epoch 0:  70%|███████   | 851/1208 [24:27<10:15,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000833, train/loss_step=0.223, global_step=212.0]Epoch 0:  71%|███████   | 852/1208 [24:30<10:14,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000833, train/loss_step=0.223, global_step=212.0]Epoch 0:  71%|███████   | 852/1208 [24:30<10:14,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00428, train/loss_vlb_step=2.37e-5, train/loss_step=0.00428, global_step=212.0]Epoch 0:  71%|███████   | 853/1208 [24:31<10:12,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00428, train/loss_vlb_step=2.37e-5, train/loss_step=0.00428, global_step=212.0]Epoch 0:  71%|███████   | 853/1208 [24:31<10:12,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.76e-5, train/loss_step=0.0124, global_step=213.0]  Epoch 0:  71%|███████   | 854/1208 [24:32<10:10,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.76e-5, train/loss_step=0.0124, global_step=213.0]Epoch 0:  71%|███████   | 854/1208 [24:32<10:10,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0731, train/loss_vlb_step=0.000245, train/loss_step=0.0731, global_step=213.0]Epoch 0:  71%|███████   | 855/1208 [24:33<10:08,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0731, train/loss_vlb_step=0.000245, train/loss_step=0.0731, global_step=213.0]Epoch 0:  71%|███████   | 855/1208 [24:33<10:08,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000158, train/loss_step=0.0405, global_step=213.0]Epoch 0:  71%|███████   | 856/1208 [24:36<10:07,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000158, train/loss_step=0.0405, global_step=213.0]Epoch 0:  71%|███████   | 856/1208 [24:36<10:07,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000477, train/loss_step=0.142, global_step=213.0]  Epoch 0:  71%|███████   | 857/1208 [24:38<10:05,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000477, train/loss_step=0.142, global_step=213.0]Epoch 0:  71%|███████   | 857/1208 [24:38<10:05,  1.72s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.00847, train/loss_vlb_step=4.11e-5, train/loss_step=0.00847, global_step=214.0]Epoch 0:  71%|███████   | 858/1208 [24:39<10:03,  1.72s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.00847, train/loss_vlb_step=4.11e-5, train/loss_step=0.00847, global_step=214.0]Epoch 0:  71%|███████   | 858/1208 [24:39<10:03,  1.72s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.47e-5, train/loss_step=0.0174, global_step=214.0]  Epoch 0:  71%|███████   | 859/1208 [24:40<10:01,  1.72s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.47e-5, train/loss_step=0.0174, global_step=214.0]Epoch 0:  71%|███████   | 859/1208 [24:40<10:01,  1.72s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.0796, train/loss_vlb_step=0.000265, train/loss_step=0.0796, global_step=214.0]Epoch 0:  71%|███████   | 860/1208 [24:43<10:00,  1.72s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.0796, train/loss_vlb_step=0.000265, train/loss_step=0.0796, global_step=214.0]Epoch 0:  71%|███████   | 860/1208 [24:43<10:00,  1.72s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.37e-5, train/loss_step=0.0197, global_step=214.0] Epoch 0:  71%|███████▏  | 861/1208 [24:44<09:58,  1.72s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.37e-5, train/loss_step=0.0197, global_step=214.0]Epoch 0:  71%|███████▏  | 861/1208 [24:44<09:58,  1.72s/it, loss=0.0815, v_num=0, train/loss_simple_step=0.0992, train/loss_vlb_step=0.000327, train/loss_step=0.0992, global_step=215.0]Epoch 0:  71%|███████▏  | 862/1208 [24:45<09:56,  1.72s/it, loss=0.0815, v_num=0, train/loss_simple_step=0.0992, train/loss_vlb_step=0.000327, train/loss_step=0.0992, global_step=215.0]Epoch 0:  71%|███████▏  | 862/1208 [24:45<09:56,  1.72s/it, loss=0.0817, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.65e-5, train/loss_step=0.017, global_step=215.0]   Epoch 0:  71%|███████▏  | 863/1208 [24:46<09:54,  1.72s/it, loss=0.0817, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.65e-5, train/loss_step=0.017, global_step=215.0]Epoch 0:  71%|███████▏  | 863/1208 [24:46<09:54,  1.72s/it, loss=0.0766, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.93e-5, train/loss_step=0.0164, global_step=215.0]Epoch 0:  72%|███████▏  | 864/1208 [24:49<09:53,  1.72s/it, loss=0.0766, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.93e-5, train/loss_step=0.0164, global_step=215.0]Epoch 0:  72%|███████▏  | 864/1208 [24:49<09:53,  1.72s/it, loss=0.0758, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.51e-5, train/loss_step=0.0182, global_step=215.0]Epoch 0:  72%|███████▏  | 865/1208 [24:51<09:51,  1.72s/it, loss=0.0758, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.51e-5, train/loss_step=0.0182, global_step=215.0]Epoch 0:  72%|███████▏  | 865/1208 [24:51<09:51,  1.72s/it, loss=0.079, v_num=0, train/loss_simple_step=0.0723, train/loss_vlb_step=0.000246, train/loss_step=0.0723, global_step=216.0]Epoch 0:  72%|███████▏  | 866/1208 [24:52<09:49,  1.72s/it, loss=0.079, v_num=0, train/loss_simple_step=0.0723, train/loss_vlb_step=0.000246, train/loss_step=0.0723, global_step=216.0]Epoch 0:  72%|███████▏  | 866/1208 [24:52<09:49,  1.72s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.0911, train/loss_vlb_step=0.0003, train/loss_step=0.0911, global_step=216.0] Epoch 0:  72%|███████▏  | 867/1208 [24:53<09:47,  1.72s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.0911, train/loss_vlb_step=0.0003, train/loss_step=0.0911, global_step=216.0]Epoch 0:  72%|███████▏  | 867/1208 [24:53<09:47,  1.72s/it, loss=0.0823, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000108, train/loss_step=0.0274, global_step=216.0]Epoch 0:  72%|███████▏  | 868/1208 [24:56<09:46,  1.72s/it, loss=0.0823, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000108, train/loss_step=0.0274, global_step=216.0]Epoch 0:  72%|███████▏  | 868/1208 [24:56<09:46,  1.72s/it, loss=0.0593, v_num=0, train/loss_simple_step=0.00911, train/loss_vlb_step=4.47e-5, train/loss_step=0.00911, global_step=216.0]Epoch 0:  72%|███████▏  | 869/1208 [24:57<09:44,  1.72s/it, loss=0.0593, v_num=0, train/loss_simple_step=0.00911, train/loss_vlb_step=4.47e-5, train/loss_step=0.00911, global_step=216.0]Epoch 0:  72%|███████▏  | 869/1208 [24:57<09:44,  1.72s/it, loss=0.055, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=3.25e-5, train/loss_step=0.00619, global_step=217.0] Epoch 0:  72%|███████▏  | 870/1208 [24:58<09:42,  1.72s/it, loss=0.055, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=3.25e-5, train/loss_step=0.00619, global_step=217.0]Epoch 0:  72%|███████▏  | 870/1208 [24:58<09:42,  1.72s/it, loss=0.0516, v_num=0, train/loss_simple_step=0.0564, train/loss_vlb_step=0.000208, train/loss_step=0.0564, global_step=217.0]Epoch 0:  72%|███████▏  | 871/1208 [24:59<09:40,  1.72s/it, loss=0.0516, v_num=0, train/loss_simple_step=0.0564, train/loss_vlb_step=0.000208, train/loss_step=0.0564, global_step=217.0]Epoch 0:  72%|███████▏  | 871/1208 [24:59<09:40,  1.72s/it, loss=0.0535, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00119, train/loss_step=0.259, global_step=217.0]   Epoch 0:  72%|███████▏  | 872/1208 [25:02<09:39,  1.72s/it, loss=0.0535, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00119, train/loss_step=0.259, global_step=217.0]Epoch 0:  72%|███████▏  | 872/1208 [25:02<09:39,  1.72s/it, loss=0.0687, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00146, train/loss_step=0.309, global_step=217.0]Epoch 0:  72%|███████▏  | 873/1208 [25:03<09:37,  1.72s/it, loss=0.0687, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00146, train/loss_step=0.309, global_step=217.0]Epoch 0:  72%|███████▏  | 873/1208 [25:03<09:37,  1.72s/it, loss=0.0799, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000937, train/loss_step=0.236, global_step=218.0]Epoch 0:  72%|███████▏  | 874/1208 [25:04<09:35,  1.72s/it, loss=0.0799, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000937, train/loss_step=0.236, global_step=218.0]Epoch 0:  72%|███████▏  | 874/1208 [25:04<09:35,  1.72s/it, loss=0.088, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000961, train/loss_step=0.234, global_step=218.0] Epoch 0:  72%|███████▏  | 875/1208 [25:05<09:33,  1.72s/it, loss=0.088, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000961, train/loss_step=0.234, global_step=218.0]Epoch 0:  72%|███████▏  | 875/1208 [25:05<09:33,  1.72s/it, loss=0.0918, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000388, train/loss_step=0.118, global_step=218.0]Epoch 0:  73%|███████▎  | 876/1208 [25:09<09:31,  1.72s/it, loss=0.0918, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000388, train/loss_step=0.118, global_step=218.0]Epoch 0:  73%|███████▎  | 876/1208 [25:09<09:31,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.533, train/loss_vlb_step=0.00808, train/loss_step=0.533, global_step=218.0]  Epoch 0:  73%|███████▎  | 877/1208 [25:10<09:30,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.533, train/loss_vlb_step=0.00808, train/loss_step=0.533, global_step=218.0]Epoch 0:  73%|███████▎  | 877/1208 [25:10<09:30,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=4.99e-5, train/loss_step=0.0109, global_step=219.0]Epoch 0:  73%|███████▎  | 878/1208 [25:11<09:28,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=4.99e-5, train/loss_step=0.0109, global_step=219.0]Epoch 0:  73%|███████▎  | 878/1208 [25:11<09:28,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=8.12e-5, train/loss_step=0.0189, global_step=219.0]Epoch 0:  73%|███████▎  | 879/1208 [25:12<09:26,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=8.12e-5, train/loss_step=0.0189, global_step=219.0]Epoch 0:  73%|███████▎  | 879/1208 [25:12<09:26,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0852, train/loss_vlb_step=0.000282, train/loss_step=0.0852, global_step=219.0]Epoch 0:  73%|███████▎  | 880/1208 [25:15<09:24,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0852, train/loss_vlb_step=0.000282, train/loss_step=0.0852, global_step=219.0]Epoch 0:  73%|███████▎  | 880/1208 [25:15<09:24,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.0008, train/loss_step=0.218, global_step=219.0]    Epoch 0:  73%|███████▎  | 881/1208 [25:16<09:22,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.0008, train/loss_step=0.218, global_step=219.0]Epoch 0:  73%|███████▎  | 881/1208 [25:16<09:22,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000417, train/loss_step=0.127, global_step=220.0]Epoch 0:  73%|███████▎  | 882/1208 [25:17<09:20,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000417, train/loss_step=0.127, global_step=220.0]Epoch 0:  73%|███████▎  | 882/1208 [25:17<09:20,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0053, train/loss_vlb_step=2.69e-5, train/loss_step=0.0053, global_step=220.0]Epoch 0:  73%|███████▎  | 883/1208 [25:18<09:19,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0053, train/loss_vlb_step=2.69e-5, train/loss_step=0.0053, global_step=220.0]Epoch 0:  73%|███████▎  | 883/1208 [25:18<09:19,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.48e-5, train/loss_step=0.0176, global_step=220.0]Epoch 0:  73%|███████▎  | 884/1208 [25:21<09:17,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.48e-5, train/loss_step=0.0176, global_step=220.0]Epoch 0:  73%|███████▎  | 884/1208 [25:21<09:17,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00426, train/loss_vlb_step=2.26e-5, train/loss_step=0.00426, global_step=220.0]Epoch 0:  73%|███████▎  | 885/1208 [25:23<09:15,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00426, train/loss_vlb_step=2.26e-5, train/loss_step=0.00426, global_step=220.0]Epoch 0:  73%|███████▎  | 885/1208 [25:23<09:15,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.000187, train/loss_step=0.0543, global_step=221.0] Epoch 0:  73%|███████▎  | 886/1208 [25:24<09:13,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.000187, train/loss_step=0.0543, global_step=221.0]Epoch 0:  73%|███████▎  | 886/1208 [25:24<09:13,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.586, train/loss_vlb_step=0.0091, train/loss_step=0.586, global_step=221.0]    Epoch 0:  73%|███████▎  | 887/1208 [25:25<09:11,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.586, train/loss_vlb_step=0.0091, train/loss_step=0.586, global_step=221.0]Epoch 0:  73%|███████▎  | 887/1208 [25:25<09:11,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0897, train/loss_vlb_step=0.000295, train/loss_step=0.0897, global_step=221.0]Epoch 0:  74%|███████▎  | 888/1208 [25:28<09:10,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0897, train/loss_vlb_step=0.000295, train/loss_step=0.0897, global_step=221.0]Epoch 0:  74%|███████▎  | 888/1208 [25:28<09:10,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00152, train/loss_step=0.314, global_step=221.0]   Epoch 0:  74%|███████▎  | 889/1208 [25:29<09:08,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00152, train/loss_step=0.314, global_step=221.0]Epoch 0:  74%|███████▎  | 889/1208 [25:29<09:08,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000783, train/loss_step=0.212, global_step=222.0]Epoch 0:  74%|███████▎  | 890/1208 [25:30<09:06,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000783, train/loss_step=0.212, global_step=222.0]Epoch 0:  74%|███████▎  | 890/1208 [25:30<09:06,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.000301, train/loss_step=0.0894, global_step=222.0]Epoch 0:  74%|███████▍  | 891/1208 [25:31<09:04,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.000301, train/loss_step=0.0894, global_step=222.0]Epoch 0:  74%|███████▍  | 891/1208 [25:31<09:04,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0542, train/loss_vlb_step=0.000189, train/loss_step=0.0542, global_step=222.0]Epoch 0:  74%|███████▍  | 892/1208 [25:34<09:03,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0542, train/loss_vlb_step=0.000189, train/loss_step=0.0542, global_step=222.0]Epoch 0:  74%|███████▍  | 892/1208 [25:34<09:03,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000459, train/loss_step=0.139, global_step=222.0]  Epoch 0:  74%|███████▍  | 893/1208 [25:35<09:01,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000459, train/loss_step=0.139, global_step=222.0]Epoch 0:  74%|███████▍  | 893/1208 [25:35<09:01,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.13e-5, train/loss_step=0.0194, global_step=223.0]Epoch 0:  74%|███████▍  | 894/1208 [25:36<08:59,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.13e-5, train/loss_step=0.0194, global_step=223.0]Epoch 0:  74%|███████▍  | 894/1208 [25:36<08:59,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000689, train/loss_step=0.194, global_step=223.0] Epoch 0:  74%|███████▍  | 895/1208 [25:37<08:57,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000689, train/loss_step=0.194, global_step=223.0]Epoch 0:  74%|███████▍  | 895/1208 [25:38<08:57,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000601, train/loss_step=0.171, global_step=223.0]Epoch 0:  74%|███████▍  | 896/1208 [25:41<08:56,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000601, train/loss_step=0.171, global_step=223.0]Epoch 0:  74%|███████▍  | 896/1208 [25:41<08:56,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00161, train/loss_step=0.311, global_step=223.0] Epoch 0:  74%|███████▍  | 897/1208 [25:42<08:54,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00161, train/loss_step=0.311, global_step=223.0]Epoch 0:  74%|███████▍  | 897/1208 [25:42<08:54,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000132, train/loss_step=0.0345, global_step=224.0]Epoch 0:  74%|███████▍  | 898/1208 [25:43<08:52,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000132, train/loss_step=0.0345, global_step=224.0]Epoch 0:  74%|███████▍  | 898/1208 [25:43<08:52,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00121, train/loss_step=0.260, global_step=224.0]   Epoch 0:  74%|███████▍  | 899/1208 [25:44<08:50,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00121, train/loss_step=0.260, global_step=224.0]Epoch 0:  74%|███████▍  | 899/1208 [25:44<08:50,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.529, train/loss_vlb_step=0.0135, train/loss_step=0.529, global_step=224.0] Epoch 0:  75%|███████▍  | 900/1208 [25:47<08:49,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.529, train/loss_vlb_step=0.0135, train/loss_step=0.529, global_step=224.0]Epoch 0:  75%|███████▍  | 900/1208 [25:47<08:49,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00347, train/loss_step=0.409, global_step=224.0]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.76it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.76it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.77it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.75it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:23,  1.74it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:23,  1.74it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.74it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.74it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.75it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.74it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.76it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.74it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.74it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.76it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.78it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.76it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.76it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.79it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.76it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.76it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.79it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.76it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 0:  75%|███████▍  | 901/1208 [26:18<08:57,  1.75s/it, loss=0.181, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00347, train/loss_step=0.409, global_step=224.0]Epoch 0:  75%|███████▍  | 901/1208 [26:18<08:57,  1.75s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=2.11e-5, train/loss_step=0.00381, global_step=225.0]Epoch 0:  75%|███████▍  | 902/1208 [26:19<08:55,  1.75s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=2.11e-5, train/loss_step=0.00381, global_step=225.0]Epoch 0:  75%|███████▍  | 902/1208 [26:19<08:55,  1.75s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=8.78e-5, train/loss_step=0.0217, global_step=225.0]  Epoch 0:  75%|███████▍  | 903/1208 [26:20<08:53,  1.75s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=8.78e-5, train/loss_step=0.0217, global_step=225.0]Epoch 0:  75%|███████▍  | 903/1208 [26:20<08:53,  1.75s/it, loss=0.189, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00133, train/loss_step=0.276, global_step=225.0]  Epoch 0:  75%|███████▍  | 904/1208 [26:23<08:52,  1.75s/it, loss=0.189, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00133, train/loss_step=0.276, global_step=225.0]Epoch 0:  75%|███████▍  | 904/1208 [26:23<08:52,  1.75s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0048, train/loss_vlb_step=2.54e-5, train/loss_step=0.0048, global_step=225.0]Epoch 0:  75%|███████▍  | 905/1208 [26:24<08:50,  1.75s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0048, train/loss_vlb_step=2.54e-5, train/loss_step=0.0048, global_step=225.0]Epoch 0:  75%|███████▍  | 905/1208 [26:24<08:50,  1.75s/it, loss=0.205, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00239, train/loss_step=0.385, global_step=226.0]  Epoch 0:  75%|███████▌  | 906/1208 [26:25<08:48,  1.75s/it, loss=0.205, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00239, train/loss_step=0.385, global_step=226.0]Epoch 0:  75%|███████▌  | 906/1208 [26:25<08:48,  1.75s/it, loss=0.189, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00127, train/loss_step=0.257, global_step=226.0]Epoch 0:  75%|███████▌  | 907/1208 [26:26<08:46,  1.75s/it, loss=0.189, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00127, train/loss_step=0.257, global_step=226.0]Epoch 0:  75%|███████▌  | 907/1208 [26:26<08:46,  1.75s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000109, train/loss_step=0.0282, global_step=226.0]Epoch 0:  75%|███████▌  | 908/1208 [26:30<08:45,  1.75s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000109, train/loss_step=0.0282, global_step=226.0]Epoch 0:  75%|███████▌  | 908/1208 [26:30<08:45,  1.75s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00596, train/loss_vlb_step=3.1e-5, train/loss_step=0.00596, global_step=226.0] Epoch 0:  75%|███████▌  | 909/1208 [26:31<08:43,  1.75s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00596, train/loss_vlb_step=3.1e-5, train/loss_step=0.00596, global_step=226.0]Epoch 0:  75%|███████▌  | 909/1208 [26:31<08:43,  1.75s/it, loss=0.171, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000872, train/loss_step=0.226, global_step=227.0] Epoch 0:  75%|███████▌  | 910/1208 [26:32<08:41,  1.75s/it, loss=0.171, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000872, train/loss_step=0.226, global_step=227.0]Epoch 0:  75%|███████▌  | 910/1208 [26:32<08:41,  1.75s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000295, train/loss_step=0.0891, global_step=227.0]Epoch 0:  75%|███████▌  | 911/1208 [26:33<08:39,  1.75s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000295, train/loss_step=0.0891, global_step=227.0]Epoch 0:  75%|███████▌  | 911/1208 [26:33<08:39,  1.75s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000117, train/loss_step=0.0319, global_step=227.0] Epoch 0:  75%|███████▌  | 912/1208 [26:36<08:38,  1.75s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000117, train/loss_step=0.0319, global_step=227.0]Epoch 0:  75%|███████▌  | 912/1208 [26:36<08:38,  1.75s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.95e-5, train/loss_step=0.0184, global_step=227.0]Epoch 0:  76%|███████▌  | 913/1208 [26:37<08:36,  1.75s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.95e-5, train/loss_step=0.0184, global_step=227.0]Epoch 0:  76%|███████▌  | 913/1208 [26:37<08:36,  1.75s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000252, train/loss_step=0.0732, global_step=228.0]Epoch 0:  76%|███████▌  | 914/1208 [26:38<08:34,  1.75s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000252, train/loss_step=0.0732, global_step=228.0]Epoch 0:  76%|███████▌  | 914/1208 [26:38<08:34,  1.75s/it, loss=0.17, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00114, train/loss_step=0.265, global_step=228.0]    Epoch 0:  76%|███████▌  | 915/1208 [26:39<08:32,  1.75s/it, loss=0.17, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00114, train/loss_step=0.265, global_step=228.0]Epoch 0:  76%|███████▌  | 915/1208 [26:39<08:32,  1.75s/it, loss=0.185, v_num=0, train/loss_simple_step=0.463, train/loss_vlb_step=0.003, train/loss_step=0.463, global_step=228.0] Epoch 0:  76%|███████▌  | 916/1208 [26:43<08:31,  1.75s/it, loss=0.185, v_num=0, train/loss_simple_step=0.463, train/loss_vlb_step=0.003, train/loss_step=0.463, global_step=228.0]Epoch 0:  76%|███████▌  | 916/1208 [26:43<08:31,  1.75s/it, loss=0.176, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000493, train/loss_step=0.148, global_step=228.0]Epoch 0:  76%|███████▌  | 917/1208 [26:44<08:29,  1.75s/it, loss=0.176, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000493, train/loss_step=0.148, global_step=228.0]Epoch 0:  76%|███████▌  | 917/1208 [26:44<08:29,  1.75s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00519, train/loss_vlb_step=2.73e-5, train/loss_step=0.00519, global_step=229.0]Epoch 0:  76%|███████▌  | 918/1208 [26:45<08:27,  1.75s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00519, train/loss_vlb_step=2.73e-5, train/loss_step=0.00519, global_step=229.0]Epoch 0:  76%|███████▌  | 918/1208 [26:45<08:27,  1.75s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.47e-5, train/loss_step=0.0117, global_step=229.0]  Epoch 0:  76%|███████▌  | 919/1208 [26:46<08:25,  1.75s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.47e-5, train/loss_step=0.0117, global_step=229.0]Epoch 0:  76%|███████▌  | 919/1208 [26:46<08:25,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0594, train/loss_vlb_step=0.000204, train/loss_step=0.0594, global_step=229.0]Epoch 0:  76%|███████▌  | 920/1208 [26:49<08:23,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0594, train/loss_vlb_step=0.000204, train/loss_step=0.0594, global_step=229.0]Epoch 0:  76%|███████▌  | 920/1208 [26:49<08:23,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00353, train/loss_vlb_step=1.99e-5, train/loss_step=0.00353, global_step=229.0]Epoch 0:  76%|███████▌  | 921/1208 [26:50<08:21,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00353, train/loss_vlb_step=1.99e-5, train/loss_step=0.00353, global_step=229.0]Epoch 0:  76%|███████▌  | 921/1208 [26:50<08:21,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=8.3e-5, train/loss_step=0.019, global_step=230.0]      Epoch 0:  76%|███████▋  | 922/1208 [26:51<08:19,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=8.3e-5, train/loss_step=0.019, global_step=230.0]Epoch 0:  76%|███████▋  | 922/1208 [26:51<08:19,  1.75s/it, loss=0.133, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00149, train/loss_step=0.286, global_step=230.0]Epoch 0:  76%|███████▋  | 923/1208 [26:52<08:17,  1.75s/it, loss=0.133, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00149, train/loss_step=0.286, global_step=230.0]Epoch 0:  76%|███████▋  | 923/1208 [26:52<08:17,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0632, train/loss_vlb_step=0.00022, train/loss_step=0.0632, global_step=230.0]Epoch 0:  76%|███████▋  | 924/1208 [26:55<08:16,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0632, train/loss_vlb_step=0.00022, train/loss_step=0.0632, global_step=230.0]Epoch 0:  76%|███████▋  | 924/1208 [26:55<08:16,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0873, train/loss_vlb_step=0.00029, train/loss_step=0.0873, global_step=230.0]Epoch 0:  77%|███████▋  | 925/1208 [26:57<08:14,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0873, train/loss_vlb_step=0.00029, train/loss_step=0.0873, global_step=230.0]Epoch 0:  77%|███████▋  | 925/1208 [26:57<08:14,  1.75s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00617, train/loss_vlb_step=3.16e-5, train/loss_step=0.00617, global_step=231.0]Epoch 0:  77%|███████▋  | 926/1208 [26:58<08:12,  1.75s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00617, train/loss_vlb_step=3.16e-5, train/loss_step=0.00617, global_step=231.0]Epoch 0:  77%|███████▋  | 926/1208 [26:58<08:12,  1.75s/it, loss=0.108, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00124, train/loss_step=0.268, global_step=231.0]    Epoch 0:  77%|███████▋  | 927/1208 [26:59<08:10,  1.75s/it, loss=0.108, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00124, train/loss_step=0.268, global_step=231.0]Epoch 0:  77%|███████▋  | 927/1208 [26:59<08:10,  1.75s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0731, train/loss_vlb_step=0.000251, train/loss_step=0.0731, global_step=231.0]Epoch 0:  77%|███████▋  | 928/1208 [27:02<08:09,  1.75s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0731, train/loss_vlb_step=0.000251, train/loss_step=0.0731, global_step=231.0]Epoch 0:  77%|███████▋  | 928/1208 [27:02<08:09,  1.75s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0731, train/loss_vlb_step=0.000248, train/loss_step=0.0731, global_step=231.0]Epoch 0:  77%|███████▋  | 929/1208 [27:03<08:07,  1.75s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0731, train/loss_vlb_step=0.000248, train/loss_step=0.0731, global_step=231.0]Epoch 0:  77%|███████▋  | 929/1208 [27:03<08:07,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00992, train/loss_vlb_step=4.67e-5, train/loss_step=0.00992, global_step=232.0]Epoch 0:  77%|███████▋  | 930/1208 [27:04<08:05,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00992, train/loss_vlb_step=4.67e-5, train/loss_step=0.00992, global_step=232.0]Epoch 0:  77%|███████▋  | 930/1208 [27:04<08:05,  1.75s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0592, train/loss_vlb_step=0.000211, train/loss_step=0.0592, global_step=232.0] Epoch 0:  77%|███████▋  | 931/1208 [27:05<08:03,  1.75s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0592, train/loss_vlb_step=0.000211, train/loss_step=0.0592, global_step=232.0]Epoch 0:  77%|███████▋  | 931/1208 [27:05<08:03,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0758, train/loss_vlb_step=0.000259, train/loss_step=0.0758, global_step=232.0]Epoch 0:  77%|███████▋  | 932/1208 [27:08<08:02,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0758, train/loss_vlb_step=0.000259, train/loss_step=0.0758, global_step=232.0]Epoch 0:  77%|███████▋  | 932/1208 [27:08<08:02,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000705, train/loss_step=0.185, global_step=232.0]  Epoch 0:  77%|███████▋  | 933/1208 [27:09<08:00,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000705, train/loss_step=0.185, global_step=232.0]Epoch 0:  77%|███████▋  | 933/1208 [27:09<08:00,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000595, train/loss_step=0.169, global_step=233.0]Epoch 0:  77%|███████▋  | 934/1208 [27:11<07:58,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000595, train/loss_step=0.169, global_step=233.0]Epoch 0:  77%|███████▋  | 934/1208 [27:11<07:58,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.14e-5, train/loss_step=0.00191, global_step=233.0]Epoch 0:  77%|███████▋  | 935/1208 [27:12<07:56,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.14e-5, train/loss_step=0.00191, global_step=233.0]Epoch 0:  77%|███████▋  | 935/1208 [27:12<07:56,  1.75s/it, loss=0.0873, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000463, train/loss_step=0.140, global_step=233.0]  Epoch 0:  77%|███████▋  | 936/1208 [27:15<07:55,  1.75s/it, loss=0.0873, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000463, train/loss_step=0.140, global_step=233.0]Epoch 0:  77%|███████▋  | 936/1208 [27:15<07:55,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.708, train/loss_vlb_step=0.0722, train/loss_step=0.708, global_step=233.0]   Epoch 0:  78%|███████▊  | 937/1208 [27:16<07:53,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.708, train/loss_vlb_step=0.0722, train/loss_step=0.708, global_step=233.0]Epoch 0:  78%|███████▊  | 937/1208 [27:16<07:53,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.56e-5, train/loss_step=0.0135, global_step=234.0]Epoch 0:  78%|███████▊  | 938/1208 [27:17<07:51,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.56e-5, train/loss_step=0.0135, global_step=234.0]Epoch 0:  78%|███████▊  | 938/1208 [27:17<07:51,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0513, train/loss_vlb_step=0.000179, train/loss_step=0.0513, global_step=234.0]Epoch 0:  78%|███████▊  | 939/1208 [27:18<07:49,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0513, train/loss_vlb_step=0.000179, train/loss_step=0.0513, global_step=234.0]Epoch 0:  78%|███████▊  | 939/1208 [27:18<07:49,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00429, train/loss_step=0.442, global_step=234.0]   Epoch 0:  78%|███████▊  | 940/1208 [27:21<07:48,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00429, train/loss_step=0.442, global_step=234.0]Epoch 0:  78%|███████▊  | 940/1208 [27:21<07:48,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000108, train/loss_step=0.0272, global_step=234.0]Epoch 0:  78%|███████▊  | 941/1208 [27:22<07:46,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000108, train/loss_step=0.0272, global_step=234.0]Epoch 0:  78%|███████▊  | 941/1208 [27:22<07:46,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0434, train/loss_vlb_step=0.000156, train/loss_step=0.0434, global_step=235.0]Epoch 0:  78%|███████▊  | 942/1208 [27:23<07:44,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0434, train/loss_vlb_step=0.000156, train/loss_step=0.0434, global_step=235.0]Epoch 0:  78%|███████▊  | 942/1208 [27:23<07:44,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00174, train/loss_step=0.354, global_step=235.0]   Epoch 0:  78%|███████▊  | 943/1208 [27:24<07:42,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00174, train/loss_step=0.354, global_step=235.0]Epoch 0:  78%|███████▊  | 943/1208 [27:24<07:42,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0366, train/loss_vlb_step=0.000139, train/loss_step=0.0366, global_step=235.0]Epoch 0:  78%|███████▊  | 944/1208 [27:28<07:40,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0366, train/loss_vlb_step=0.000139, train/loss_step=0.0366, global_step=235.0]Epoch 0:  78%|███████▊  | 944/1208 [27:28<07:40,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000142, train/loss_step=0.0374, global_step=235.0]Epoch 0:  78%|███████▊  | 945/1208 [27:29<07:38,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000142, train/loss_step=0.0374, global_step=235.0]Epoch 0:  78%|███████▊  | 945/1208 [27:29<07:38,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000157, train/loss_step=0.0407, global_step=236.0] Epoch 0:  78%|███████▊  | 946/1208 [27:30<07:37,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000157, train/loss_step=0.0407, global_step=236.0]Epoch 0:  78%|███████▊  | 946/1208 [27:30<07:37,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.00294, train/loss_step=0.417, global_step=236.0]  Epoch 0:  78%|███████▊  | 947/1208 [27:31<07:35,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.00294, train/loss_step=0.417, global_step=236.0]Epoch 0:  78%|███████▊  | 947/1208 [27:31<07:35,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=2.43e-5, train/loss_step=0.00448, global_step=236.0]Epoch 0:  78%|███████▊  | 948/1208 [27:34<07:33,  1.75s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=2.43e-5, train/loss_step=0.00448, global_step=236.0]Epoch 0:  78%|███████▊  | 948/1208 [27:34<07:33,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00982, train/loss_vlb_step=4.67e-5, train/loss_step=0.00982, global_step=236.0]Epoch 0:  79%|███████▊  | 949/1208 [27:35<07:31,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00982, train/loss_vlb_step=4.67e-5, train/loss_step=0.00982, global_step=236.0]Epoch 0:  79%|███████▊  | 949/1208 [27:35<07:31,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000991, train/loss_step=0.248, global_step=237.0]   Epoch 0:  79%|███████▊  | 950/1208 [27:36<07:29,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000991, train/loss_step=0.248, global_step=237.0]Epoch 0:  79%|███████▊  | 950/1208 [27:36<07:29,  1.74s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=2.42e-5, train/loss_step=0.00451, global_step=237.0]Epoch 0:  79%|███████▊  | 951/1208 [27:37<07:27,  1.74s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=2.42e-5, train/loss_step=0.00451, global_step=237.0]Epoch 0:  79%|███████▊  | 951/1208 [27:37<07:27,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.0017, train/loss_step=0.325, global_step=237.0]     Epoch 0:  79%|███████▉  | 952/1208 [27:41<07:26,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.0017, train/loss_step=0.325, global_step=237.0]Epoch 0:  79%|███████▉  | 952/1208 [27:41<07:26,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00753, train/loss_vlb_step=3.7e-5, train/loss_step=0.00753, global_step=237.0]Epoch 0:  79%|███████▉  | 953/1208 [27:42<07:24,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00753, train/loss_vlb_step=3.7e-5, train/loss_step=0.00753, global_step=237.0]Epoch 0:  79%|███████▉  | 953/1208 [27:42<07:24,  1.74s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000113, train/loss_step=0.0291, global_step=238.0]Epoch 0:  79%|███████▉  | 954/1208 [27:43<07:22,  1.74s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000113, train/loss_step=0.0291, global_step=238.0]Epoch 0:  79%|███████▉  | 954/1208 [27:43<07:22,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.00102, train/loss_step=0.238, global_step=238.0]   Epoch 0:  79%|███████▉  | 955/1208 [27:44<07:20,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.00102, train/loss_step=0.238, global_step=238.0]Epoch 0:  79%|███████▉  | 955/1208 [27:44<07:20,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.0041, train/loss_step=0.434, global_step=238.0] Epoch 0:  79%|███████▉  | 956/1208 [27:47<07:19,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.0041, train/loss_step=0.434, global_step=238.0]Epoch 0:  79%|███████▉  | 956/1208 [27:47<07:19,  1.74s/it, loss=0.156, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00258, train/loss_step=0.365, global_step=238.0]Epoch 0:  79%|███████▉  | 957/1208 [27:48<07:17,  1.74s/it, loss=0.156, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00258, train/loss_step=0.365, global_step=238.0]Epoch 0:  79%|███████▉  | 957/1208 [27:48<07:17,  1.74s/it, loss=0.157, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.67e-5, train/loss_step=0.017, global_step=239.0]Epoch 0:  79%|███████▉  | 958/1208 [27:49<07:15,  1.74s/it, loss=0.157, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.67e-5, train/loss_step=0.017, global_step=239.0]Epoch 0:  79%|███████▉  | 958/1208 [27:49<07:15,  1.74s/it, loss=0.173, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00198, train/loss_step=0.374, global_step=239.0]Epoch 0:  79%|███████▉  | 959/1208 [27:50<07:13,  1.74s/it, loss=0.173, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00198, train/loss_step=0.374, global_step=239.0]Epoch 0:  79%|███████▉  | 959/1208 [27:50<07:13,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000604, train/loss_step=0.177, global_step=239.0]Epoch 0:  79%|███████▉  | 960/1208 [27:53<07:12,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000604, train/loss_step=0.177, global_step=239.0]Epoch 0:  79%|███████▉  | 960/1208 [27:53<07:12,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0773, train/loss_vlb_step=0.000261, train/loss_step=0.0773, global_step=239.0]Epoch 0:  80%|███████▉  | 961/1208 [27:55<07:10,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0773, train/loss_vlb_step=0.000261, train/loss_step=0.0773, global_step=239.0]Epoch 0:  80%|███████▉  | 961/1208 [27:55<07:10,  1.74s/it, loss=0.172, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000887, train/loss_step=0.237, global_step=240.0]  Epoch 0:  80%|███████▉  | 962/1208 [27:56<07:08,  1.74s/it, loss=0.172, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000887, train/loss_step=0.237, global_step=240.0]Epoch 0:  80%|███████▉  | 962/1208 [27:56<07:08,  1.74s/it, loss=0.172, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.0022, train/loss_step=0.363, global_step=240.0]  Epoch 0:  80%|███████▉  | 963/1208 [27:57<07:06,  1.74s/it, loss=0.172, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.0022, train/loss_step=0.363, global_step=240.0]Epoch 0:  80%|███████▉  | 963/1208 [27:57<07:06,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.32e-5, train/loss_step=0.00219, global_step=240.0]Epoch 0:  80%|███████▉  | 964/1208 [28:00<07:05,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.32e-5, train/loss_step=0.00219, global_step=240.0]Epoch 0:  80%|███████▉  | 964/1208 [28:00<07:05,  1.74s/it, loss=0.175, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000456, train/loss_step=0.138, global_step=240.0]  Epoch 0:  80%|███████▉  | 965/1208 [28:01<07:03,  1.74s/it, loss=0.175, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000456, train/loss_step=0.138, global_step=240.0]Epoch 0:  80%|███████▉  | 965/1208 [28:01<07:03,  1.74s/it, loss=0.182, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.0006, train/loss_step=0.173, global_step=241.0]  Epoch 0:  80%|███████▉  | 966/1208 [28:02<07:01,  1.74s/it, loss=0.182, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.0006, train/loss_step=0.173, global_step=241.0]Epoch 0:  80%|███████▉  | 966/1208 [28:02<07:01,  1.74s/it, loss=0.187, v_num=0, train/loss_simple_step=0.518, train/loss_vlb_step=0.0101, train/loss_step=0.518, global_step=241.0]Epoch 0:  80%|████████  | 967/1208 [28:03<06:59,  1.74s/it, loss=0.187, v_num=0, train/loss_simple_step=0.518, train/loss_vlb_step=0.0101, train/loss_step=0.518, global_step=241.0]Epoch 0:  80%|████████  | 967/1208 [28:03<06:59,  1.74s/it, loss=0.188, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.14e-5, train/loss_step=0.017, global_step=241.0]Epoch 0:  80%|████████  | 968/1208 [28:06<06:58,  1.74s/it, loss=0.188, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.14e-5, train/loss_step=0.017, global_step=241.0]Epoch 0:  80%|████████  | 968/1208 [28:06<06:58,  1.74s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0941, train/loss_vlb_step=0.000313, train/loss_step=0.0941, global_step=241.0]Epoch 0:  80%|████████  | 969/1208 [28:07<06:56,  1.74s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0941, train/loss_vlb_step=0.000313, train/loss_step=0.0941, global_step=241.0]Epoch 0:  80%|████████  | 969/1208 [28:07<06:56,  1.74s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.2e-5, train/loss_step=0.0151, global_step=242.0]   Epoch 0:  80%|████████  | 970/1208 [28:08<06:54,  1.74s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.2e-5, train/loss_step=0.0151, global_step=242.0]Epoch 0:  80%|████████  | 970/1208 [28:08<06:54,  1.74s/it, loss=0.197, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00224, train/loss_step=0.340, global_step=242.0]Epoch 0:  80%|████████  | 971/1208 [28:10<06:52,  1.74s/it, loss=0.197, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00224, train/loss_step=0.340, global_step=242.0]Epoch 0:  80%|████████  | 971/1208 [28:10<06:52,  1.74s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0864, train/loss_vlb_step=0.00029, train/loss_step=0.0864, global_step=242.0]Epoch 0:  80%|████████  | 972/1208 [28:13<06:51,  1.74s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0864, train/loss_vlb_step=0.00029, train/loss_step=0.0864, global_step=242.0]Epoch 0:  80%|████████  | 972/1208 [28:13<06:51,  1.74s/it, loss=0.192, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000455, train/loss_step=0.137, global_step=242.0] Epoch 0:  81%|████████  | 973/1208 [28:14<06:49,  1.74s/it, loss=0.192, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000455, train/loss_step=0.137, global_step=242.0]Epoch 0:  81%|████████  | 973/1208 [28:14<06:49,  1.74s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0583, train/loss_vlb_step=0.000205, train/loss_step=0.0583, global_step=243.0]Epoch 0:  81%|████████  | 974/1208 [28:15<06:47,  1.74s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0583, train/loss_vlb_step=0.000205, train/loss_step=0.0583, global_step=243.0]Epoch 0:  81%|████████  | 974/1208 [28:15<06:47,  1.74s/it, loss=0.187, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=243.0]  Epoch 0:  81%|████████  | 975/1208 [28:16<06:45,  1.74s/it, loss=0.187, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=243.0]Epoch 0:  81%|████████  | 975/1208 [28:16<06:45,  1.74s/it, loss=0.193, v_num=0, train/loss_simple_step=0.555, train/loss_vlb_step=0.00862, train/loss_step=0.555, global_step=243.0] Epoch 0:  81%|████████  | 976/1208 [28:19<06:44,  1.74s/it, loss=0.193, v_num=0, train/loss_simple_step=0.555, train/loss_vlb_step=0.00862, train/loss_step=0.555, global_step=243.0]Epoch 0:  81%|████████  | 976/1208 [28:19<06:44,  1.74s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0565, train/loss_vlb_step=0.000199, train/loss_step=0.0565, global_step=243.0]Epoch 0:  81%|████████  | 977/1208 [28:20<06:42,  1.74s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0565, train/loss_vlb_step=0.000199, train/loss_step=0.0565, global_step=243.0]Epoch 0:  81%|████████  | 977/1208 [28:20<06:42,  1.74s/it, loss=0.183, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000447, train/loss_step=0.135, global_step=244.0]  Epoch 0:  81%|████████  | 978/1208 [28:21<06:40,  1.74s/it, loss=0.183, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000447, train/loss_step=0.135, global_step=244.0]Epoch 0:  81%|████████  | 978/1208 [28:21<06:40,  1.74s/it, loss=0.184, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00246, train/loss_step=0.389, global_step=244.0] Epoch 0:  81%|████████  | 979/1208 [28:22<06:38,  1.74s/it, loss=0.184, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00246, train/loss_step=0.389, global_step=244.0]Epoch 0:  81%|████████  | 979/1208 [28:22<06:38,  1.74s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.77e-5, train/loss_step=0.00303, global_step=244.0]Epoch 0:  81%|████████  | 980/1208 [28:26<06:36,  1.74s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.77e-5, train/loss_step=0.00303, global_step=244.0]Epoch 0:  81%|████████  | 980/1208 [28:26<06:36,  1.74s/it, loss=0.197, v_num=0, train/loss_simple_step=0.501, train/loss_vlb_step=0.00978, train/loss_step=0.501, global_step=244.0]    Epoch 0:  81%|████████  | 981/1208 [28:27<06:35,  1.74s/it, loss=0.197, v_num=0, train/loss_simple_step=0.501, train/loss_vlb_step=0.00978, train/loss_step=0.501, global_step=244.0]Epoch 0:  81%|████████  | 981/1208 [28:27<06:35,  1.74s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.64e-5, train/loss_step=0.0183, global_step=245.0]Epoch 0:  81%|████████▏ | 982/1208 [28:28<06:33,  1.74s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.64e-5, train/loss_step=0.0183, global_step=245.0]Epoch 0:  81%|████████▏ | 982/1208 [28:28<06:33,  1.74s/it, loss=0.176, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000526, train/loss_step=0.158, global_step=245.0] Epoch 0:  81%|████████▏ | 983/1208 [28:29<06:31,  1.74s/it, loss=0.176, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000526, train/loss_step=0.158, global_step=245.0]Epoch 0:  81%|████████▏ | 983/1208 [28:29<06:31,  1.74s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0516, train/loss_vlb_step=0.000183, train/loss_step=0.0516, global_step=245.0]Epoch 0:  81%|████████▏ | 984/1208 [28:32<06:29,  1.74s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0516, train/loss_vlb_step=0.000183, train/loss_step=0.0516, global_step=245.0]Epoch 0:  81%|████████▏ | 984/1208 [28:32<06:29,  1.74s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0745, train/loss_vlb_step=0.000254, train/loss_step=0.0745, global_step=245.0]Epoch 0:  82%|████████▏ | 985/1208 [28:33<06:27,  1.74s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0745, train/loss_vlb_step=0.000254, train/loss_step=0.0745, global_step=245.0]Epoch 0:  82%|████████▏ | 985/1208 [28:33<06:27,  1.74s/it, loss=0.18, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.0016, train/loss_step=0.277, global_step=246.0]     Epoch 0:  82%|████████▏ | 986/1208 [28:34<06:26,  1.74s/it, loss=0.18, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.0016, train/loss_step=0.277, global_step=246.0]Epoch 0:  82%|████████▏ | 986/1208 [28:34<06:26,  1.74s/it, loss=0.168, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00131, train/loss_step=0.279, global_step=246.0]Epoch 0:  82%|████████▏ | 987/1208 [28:35<06:24,  1.74s/it, loss=0.168, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00131, train/loss_step=0.279, global_step=246.0]Epoch 0:  82%|████████▏ | 987/1208 [28:35<06:24,  1.74s/it, loss=0.191, v_num=0, train/loss_simple_step=0.477, train/loss_vlb_step=0.00496, train/loss_step=0.477, global_step=246.0]Epoch 0:  82%|████████▏ | 988/1208 [28:38<06:22,  1.74s/it, loss=0.191, v_num=0, train/loss_simple_step=0.477, train/loss_vlb_step=0.00496, train/loss_step=0.477, global_step=246.0]Epoch 0:  82%|████████▏ | 988/1208 [28:38<06:22,  1.74s/it, loss=0.189, v_num=0, train/loss_simple_step=0.052, train/loss_vlb_step=0.000179, train/loss_step=0.052, global_step=246.0]Epoch 0:  82%|████████▏ | 989/1208 [28:40<06:20,  1.74s/it, loss=0.189, v_num=0, train/loss_simple_step=0.052, train/loss_vlb_step=0.000179, train/loss_step=0.052, global_step=246.0]Epoch 0:  82%|████████▏ | 989/1208 [28:40<06:20,  1.74s/it, loss=0.203, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00136, train/loss_step=0.301, global_step=247.0] Epoch 0:  82%|████████▏ | 990/1208 [28:41<06:18,  1.74s/it, loss=0.203, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00136, train/loss_step=0.301, global_step=247.0]Epoch 0:  82%|████████▏ | 990/1208 [28:41<06:18,  1.74s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=8.31e-5, train/loss_step=0.0221, global_step=247.0]Epoch 0:  82%|████████▏ | 991/1208 [28:42<06:17,  1.74s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=8.31e-5, train/loss_step=0.0221, global_step=247.0]Epoch 0:  82%|████████▏ | 991/1208 [28:42<06:17,  1.74s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000256, train/loss_step=0.0754, global_step=247.0]Epoch 0:  82%|████████▏ | 992/1208 [28:45<06:15,  1.74s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000256, train/loss_step=0.0754, global_step=247.0]Epoch 0:  82%|████████▏ | 992/1208 [28:45<06:15,  1.74s/it, loss=0.201, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00253, train/loss_step=0.412, global_step=247.0]   Epoch 0:  82%|████████▏ | 993/1208 [28:46<06:13,  1.74s/it, loss=0.201, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00253, train/loss_step=0.412, global_step=247.0]Epoch 0:  82%|████████▏ | 993/1208 [28:46<06:13,  1.74s/it, loss=0.21, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000915, train/loss_step=0.240, global_step=248.0]Epoch 0:  82%|████████▏ | 994/1208 [28:47<06:11,  1.74s/it, loss=0.21, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000915, train/loss_step=0.240, global_step=248.0]Epoch 0:  82%|████████▏ | 994/1208 [28:47<06:11,  1.74s/it, loss=0.204, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.19e-5, train/loss_step=0.00199, global_step=248.0]Epoch 0:  82%|████████▏ | 995/1208 [28:48<06:10,  1.74s/it, loss=0.204, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.19e-5, train/loss_step=0.00199, global_step=248.0]Epoch 0:  82%|████████▏ | 995/1208 [28:48<06:10,  1.74s/it, loss=0.182, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=248.0]   Epoch 0:  82%|████████▏ | 996/1208 [28:51<06:08,  1.74s/it, loss=0.182, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=248.0]Epoch 0:  82%|████████▏ | 996/1208 [28:51<06:08,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00726, train/loss_vlb_step=3.61e-5, train/loss_step=0.00726, global_step=248.0]Epoch 0:  83%|████████▎ | 997/1208 [28:52<06:06,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00726, train/loss_vlb_step=3.61e-5, train/loss_step=0.00726, global_step=248.0]Epoch 0:  83%|████████▎ | 997/1208 [28:52<06:06,  1.74s/it, loss=0.184, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000841, train/loss_step=0.221, global_step=249.0]   Epoch 0:  83%|████████▎ | 998/1208 [28:54<06:04,  1.74s/it, loss=0.184, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000841, train/loss_step=0.221, global_step=249.0]Epoch 0:  83%|████████▎ | 998/1208 [28:54<06:04,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0466, train/loss_vlb_step=0.000173, train/loss_step=0.0466, global_step=249.0]Epoch 0:  83%|████████▎ | 999/1208 [28:55<06:02,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0466, train/loss_vlb_step=0.000173, train/loss_step=0.0466, global_step=249.0]Epoch 0:  83%|████████▎ | 999/1208 [28:55<06:03,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0784, train/loss_vlb_step=0.000258, train/loss_step=0.0784, global_step=249.0] Epoch 0:  83%|████████▎ | 1000/1208 [28:58<06:01,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0784, train/loss_vlb_step=0.000258, train/loss_step=0.0784, global_step=249.0]Epoch 0:  83%|████████▎ | 1000/1208 [28:58<06:01,  1.74s/it, loss=0.156, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000915, train/loss_step=0.225, global_step=249.0] Epoch 0:  83%|████████▎ | 1001/1208 [28:59<05:59,  1.74s/it, loss=0.156, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000915, train/loss_step=0.225, global_step=249.0]Epoch 0:  83%|████████▎ | 1001/1208 [28:59<05:59,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000473, train/loss_step=0.138, global_step=250.0]Epoch 0:  83%|████████▎ | 1002/1208 [29:00<05:57,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000473, train/loss_step=0.138, global_step=250.0]Epoch 0:  83%|████████▎ | 1002/1208 [29:00<05:57,  1.74s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0436, train/loss_vlb_step=0.000159, train/loss_step=0.0436, global_step=250.0]Epoch 0:  83%|████████▎ | 1003/1208 [29:01<05:55,  1.74s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0436, train/loss_vlb_step=0.000159, train/loss_step=0.0436, global_step=250.0]Epoch 0:  83%|████████▎ | 1003/1208 [29:01<05:55,  1.74s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0573, train/loss_vlb_step=0.000197, train/loss_step=0.0573, global_step=250.0]Epoch 0:  83%|████████▎ | 1004/1208 [29:04<05:54,  1.74s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0573, train/loss_vlb_step=0.000197, train/loss_step=0.0573, global_step=250.0]Epoch 0:  83%|████████▎ | 1004/1208 [29:04<05:54,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00963, train/loss_vlb_step=4.67e-5, train/loss_step=0.00963, global_step=250.0]Epoch 0:  83%|████████▎ | 1005/1208 [29:05<05:52,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00963, train/loss_vlb_step=4.67e-5, train/loss_step=0.00963, global_step=250.0]Epoch 0:  83%|████████▎ | 1005/1208 [29:05<05:52,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000562, train/loss_step=0.161, global_step=251.0]   Epoch 0:  83%|████████▎ | 1006/1208 [29:06<05:50,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000562, train/loss_step=0.161, global_step=251.0]Epoch 0:  83%|████████▎ | 1006/1208 [29:06<05:50,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0808, train/loss_vlb_step=0.000271, train/loss_step=0.0808, global_step=251.0]Epoch 0:  83%|████████▎ | 1007/1208 [29:08<05:48,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0808, train/loss_vlb_step=0.000271, train/loss_step=0.0808, global_step=251.0]Epoch 0:  83%|████████▎ | 1007/1208 [29:08<05:48,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.097, train/loss_vlb_step=0.000319, train/loss_step=0.097, global_step=251.0]  Epoch 0:  83%|████████▎ | 1008/1208 [29:11<05:47,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.097, train/loss_vlb_step=0.000319, train/loss_step=0.097, global_step=251.0]Epoch 0:  83%|████████▎ | 1008/1208 [29:11<05:47,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.000164, train/loss_step=0.0425, global_step=251.0]Epoch 0:  84%|████████▎ | 1009/1208 [29:12<05:45,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.000164, train/loss_step=0.0425, global_step=251.0]Epoch 0:  84%|████████▎ | 1009/1208 [29:12<05:45,  1.74s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=2.03e-5, train/loss_step=0.00366, global_step=252.0]Epoch 0:  84%|████████▎ | 1010/1208 [29:13<05:43,  1.74s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=2.03e-5, train/loss_step=0.00366, global_step=252.0]Epoch 0:  84%|████████▎ | 1010/1208 [29:13<05:43,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0819, train/loss_vlb_step=0.000273, train/loss_step=0.0819, global_step=252.0] Epoch 0:  84%|████████▎ | 1011/1208 [29:14<05:41,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0819, train/loss_vlb_step=0.000273, train/loss_step=0.0819, global_step=252.0]Epoch 0:  84%|████████▎ | 1011/1208 [29:14<05:41,  1.74s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0318, train/loss_vlb_step=0.000121, train/loss_step=0.0318, global_step=252.0]Epoch 0:  84%|████████▍ | 1012/1208 [29:17<05:40,  1.74s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0318, train/loss_vlb_step=0.000121, train/loss_step=0.0318, global_step=252.0]Epoch 0:  84%|████████▍ | 1012/1208 [29:17<05:40,  1.74s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000569, train/loss_step=0.167, global_step=252.0] Epoch 0:  84%|████████▍ | 1013/1208 [29:18<05:38,  1.74s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000569, train/loss_step=0.167, global_step=252.0]Epoch 0:  84%|████████▍ | 1013/1208 [29:18<05:38,  1.74s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.066, train/loss_vlb_step=0.000225, train/loss_step=0.066, global_step=253.0]Epoch 0:  84%|████████▍ | 1014/1208 [29:19<05:36,  1.74s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.066, train/loss_vlb_step=0.000225, train/loss_step=0.066, global_step=253.0]Epoch 0:  84%|████████▍ | 1014/1208 [29:19<05:36,  1.74s/it, loss=0.0836, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.69e-5, train/loss_step=0.00288, global_step=253.0]Epoch 0:  84%|████████▍ | 1015/1208 [29:20<05:34,  1.73s/it, loss=0.0836, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.69e-5, train/loss_step=0.00288, global_step=253.0]Epoch 0:  84%|████████▍ | 1015/1208 [29:20<05:34,  1.73s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.0956, train/loss_vlb_step=0.000321, train/loss_step=0.0956, global_step=253.0] Epoch 0:  84%|████████▍ | 1016/1208 [29:24<05:33,  1.74s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.0956, train/loss_vlb_step=0.000321, train/loss_step=0.0956, global_step=253.0]Epoch 0:  84%|████████▍ | 1016/1208 [29:24<05:33,  1.74s/it, loss=0.0828, v_num=0, train/loss_simple_step=0.00533, train/loss_vlb_step=2.86e-5, train/loss_step=0.00533, global_step=253.0]Epoch 0:  84%|████████▍ | 1017/1208 [29:25<05:31,  1.74s/it, loss=0.0828, v_num=0, train/loss_simple_step=0.00533, train/loss_vlb_step=2.86e-5, train/loss_step=0.00533, global_step=253.0]Epoch 0:  84%|████████▍ | 1017/1208 [29:25<05:31,  1.74s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00412, train/loss_step=0.436, global_step=254.0]    Epoch 0:  84%|████████▍ | 1018/1208 [29:26<05:29,  1.74s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00412, train/loss_step=0.436, global_step=254.0]Epoch 0:  84%|████████▍ | 1018/1208 [29:26<05:29,  1.74s/it, loss=0.097, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=254.0]Epoch 0:  84%|████████▍ | 1019/1208 [29:27<05:27,  1.73s/it, loss=0.097, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=254.0]Epoch 0:  84%|████████▍ | 1019/1208 [29:27<05:27,  1.73s/it, loss=0.104, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000776, train/loss_step=0.217, global_step=254.0]Epoch 0:  84%|████████▍ | 1020/1208 [29:30<05:26,  1.74s/it, loss=0.104, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000776, train/loss_step=0.217, global_step=254.0]Epoch 0:  84%|████████▍ | 1020/1208 [29:30<05:26,  1.74s/it, loss=0.104, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000905, train/loss_step=0.230, global_step=254.0]Epoch 0:  85%|████████▍ | 1021/1208 [29:31<05:24,  1.74s/it, loss=0.104, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000905, train/loss_step=0.230, global_step=254.0]Epoch 0:  85%|████████▍ | 1021/1208 [29:31<05:24,  1.74s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.00863, train/loss_vlb_step=3.91e-5, train/loss_step=0.00863, global_step=255.0]Epoch 0:  85%|████████▍ | 1022/1208 [29:32<05:22,  1.73s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.00863, train/loss_vlb_step=3.91e-5, train/loss_step=0.00863, global_step=255.0]Epoch 0:  85%|████████▍ | 1022/1208 [29:32<05:22,  1.73s/it, loss=0.096, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.8e-5, train/loss_step=0.010, global_step=255.0]      Epoch 0:  85%|████████▍ | 1023/1208 [29:33<05:20,  1.73s/it, loss=0.096, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.8e-5, train/loss_step=0.010, global_step=255.0]Epoch 0:  85%|████████▍ | 1023/1208 [29:33<05:20,  1.73s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.0453, train/loss_vlb_step=0.000169, train/loss_step=0.0453, global_step=255.0]Epoch 0:  85%|████████▍ | 1024/1208 [29:37<05:19,  1.74s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.0453, train/loss_vlb_step=0.000169, train/loss_step=0.0453, global_step=255.0]Epoch 0:  85%|████████▍ | 1024/1208 [29:37<05:19,  1.74s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.33e-5, train/loss_step=0.0147, global_step=255.0] Epoch 0:  85%|████████▍ | 1025/1208 [29:38<05:17,  1.73s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.33e-5, train/loss_step=0.0147, global_step=255.0]Epoch 0:  85%|████████▍ | 1025/1208 [29:38<05:17,  1.73s/it, loss=0.0943, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000443, train/loss_step=0.133, global_step=256.0] Epoch 0:  85%|████████▍ | 1026/1208 [29:39<05:15,  1.73s/it, loss=0.0943, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000443, train/loss_step=0.133, global_step=256.0]Epoch 0:  85%|████████▍ | 1026/1208 [29:39<05:15,  1.73s/it, loss=0.0904, v_num=0, train/loss_simple_step=0.00316, train/loss_vlb_step=1.79e-5, train/loss_step=0.00316, global_step=256.0]Epoch 0:  85%|████████▌ | 1027/1208 [29:40<05:13,  1.73s/it, loss=0.0904, v_num=0, train/loss_simple_step=0.00316, train/loss_vlb_step=1.79e-5, train/loss_step=0.00316, global_step=256.0]Epoch 0:  85%|████████▌ | 1027/1208 [29:40<05:13,  1.73s/it, loss=0.091, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000358, train/loss_step=0.108, global_step=256.0]    Epoch 0:  85%|████████▌ | 1028/1208 [29:43<05:12,  1.74s/it, loss=0.091, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000358, train/loss_step=0.108, global_step=256.0]Epoch 0:  85%|████████▌ | 1028/1208 [29:43<05:12,  1.74s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.04e-5, train/loss_step=0.0163, global_step=256.0]Epoch 0:  85%|████████▌ | 1029/1208 [29:44<05:10,  1.73s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.04e-5, train/loss_step=0.0163, global_step=256.0]Epoch 0:  85%|████████▌ | 1029/1208 [29:44<05:10,  1.73s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.00941, train/loss_vlb_step=4.6e-5, train/loss_step=0.00941, global_step=257.0]Epoch 0:  85%|████████▌ | 1030/1208 [29:45<05:08,  1.73s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.00941, train/loss_vlb_step=4.6e-5, train/loss_step=0.00941, global_step=257.0]Epoch 0:  85%|████████▌ | 1030/1208 [29:45<05:08,  1.73s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000596, train/loss_step=0.171, global_step=257.0]  Epoch 0:  85%|████████▌ | 1031/1208 [29:46<05:06,  1.73s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000596, train/loss_step=0.171, global_step=257.0]Epoch 0:  85%|████████▌ | 1031/1208 [29:46<05:06,  1.73s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.00902, train/loss_vlb_step=4.46e-5, train/loss_step=0.00902, global_step=257.0]Epoch 0:  85%|████████▌ | 1032/1208 [29:50<05:05,  1.73s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.00902, train/loss_vlb_step=4.46e-5, train/loss_step=0.00902, global_step=257.0]Epoch 0:  85%|████████▌ | 1032/1208 [29:50<05:05,  1.73s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.00084, train/loss_step=0.231, global_step=257.0]    Epoch 0:  86%|████████▌ | 1033/1208 [29:51<05:03,  1.73s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.00084, train/loss_step=0.231, global_step=257.0]Epoch 0:  86%|████████▌ | 1033/1208 [29:51<05:03,  1.73s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.74e-5, train/loss_step=0.00304, global_step=258.0]Epoch 0:  86%|████████▌ | 1034/1208 [29:52<05:01,  1.73s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.74e-5, train/loss_step=0.00304, global_step=258.0]Epoch 0:  86%|████████▌ | 1034/1208 [29:52<05:01,  1.73s/it, loss=0.1, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000451, train/loss_step=0.136, global_step=258.0]      Epoch 0:  86%|████████▌ | 1035/1208 [29:53<04:59,  1.73s/it, loss=0.1, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000451, train/loss_step=0.136, global_step=258.0]Epoch 0:  86%|████████▌ | 1035/1208 [29:53<04:59,  1.73s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.38e-5, train/loss_step=0.0119, global_step=258.0]Epoch 0:  86%|████████▌ | 1036/1208 [29:56<04:58,  1.73s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.38e-5, train/loss_step=0.0119, global_step=258.0]Epoch 0:  86%|████████▌ | 1036/1208 [29:56<04:58,  1.73s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000105, train/loss_step=0.0253, global_step=258.0]Epoch 0:  86%|████████▌ | 1037/1208 [29:57<04:56,  1.73s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000105, train/loss_step=0.0253, global_step=258.0]Epoch 0:  86%|████████▌ | 1037/1208 [29:57<04:56,  1.73s/it, loss=0.0846, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000675, train/loss_step=0.193, global_step=259.0]  Epoch 0:  86%|████████▌ | 1038/1208 [29:58<04:54,  1.73s/it, loss=0.0846, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000675, train/loss_step=0.193, global_step=259.0]Epoch 0:  86%|████████▌ | 1038/1208 [29:58<04:54,  1.73s/it, loss=0.0794, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.24e-5, train/loss_step=0.0112, global_step=259.0]Epoch 0:  86%|████████▌ | 1039/1208 [29:59<04:52,  1.73s/it, loss=0.0794, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.24e-5, train/loss_step=0.0112, global_step=259.0]Epoch 0:  86%|████████▌ | 1039/1208 [29:59<04:52,  1.73s/it, loss=0.07, v_num=0, train/loss_simple_step=0.0305, train/loss_vlb_step=0.000123, train/loss_step=0.0305, global_step=259.0] Epoch 0:  86%|████████▌ | 1040/1208 [30:03<04:51,  1.73s/it, loss=0.07, v_num=0, train/loss_simple_step=0.0305, train/loss_vlb_step=0.000123, train/loss_step=0.0305, global_step=259.0]Epoch 0:  86%|████████▌ | 1040/1208 [30:03<04:51,  1.73s/it, loss=0.0595, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.93e-5, train/loss_step=0.0188, global_step=259.0]Epoch 0:  86%|████████▌ | 1041/1208 [30:04<04:49,  1.73s/it, loss=0.0595, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.93e-5, train/loss_step=0.0188, global_step=259.0]Epoch 0:  86%|████████▌ | 1041/1208 [30:04<04:49,  1.73s/it, loss=0.0667, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000507, train/loss_step=0.152, global_step=260.0] Epoch 0:  86%|████████▋ | 1042/1208 [30:05<04:47,  1.73s/it, loss=0.0667, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000507, train/loss_step=0.152, global_step=260.0]Epoch 0:  86%|████████▋ | 1042/1208 [30:05<04:47,  1.73s/it, loss=0.0663, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.65e-5, train/loss_step=0.00296, global_step=260.0]Epoch 0:  86%|████████▋ | 1043/1208 [30:06<04:45,  1.73s/it, loss=0.0663, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.65e-5, train/loss_step=0.00296, global_step=260.0]Epoch 0:  86%|████████▋ | 1043/1208 [30:06<04:45,  1.73s/it, loss=0.0686, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000298, train/loss_step=0.0901, global_step=260.0] Epoch 0:  86%|████████▋ | 1044/1208 [30:09<04:44,  1.73s/it, loss=0.0686, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000298, train/loss_step=0.0901, global_step=260.0]Epoch 0:  86%|████████▋ | 1044/1208 [30:09<04:44,  1.73s/it, loss=0.0744, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.00043, train/loss_step=0.131, global_step=260.0]   Epoch 0:  87%|████████▋ | 1045/1208 [30:10<04:42,  1.73s/it, loss=0.0744, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.00043, train/loss_step=0.131, global_step=260.0]Epoch 0:  87%|████████▋ | 1045/1208 [30:10<04:42,  1.73s/it, loss=0.0685, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.43e-5, train/loss_step=0.0149, global_step=261.0]Epoch 0:  87%|████████▋ | 1046/1208 [30:11<04:40,  1.73s/it, loss=0.0685, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.43e-5, train/loss_step=0.0149, global_step=261.0]Epoch 0:  87%|████████▋ | 1046/1208 [30:11<04:40,  1.73s/it, loss=0.0893, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00301, train/loss_step=0.420, global_step=261.0]  Epoch 0:  87%|████████▋ | 1047/1208 [30:12<04:38,  1.73s/it, loss=0.0893, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00301, train/loss_step=0.420, global_step=261.0]Epoch 0:  87%|████████▋ | 1047/1208 [30:12<04:38,  1.73s/it, loss=0.0841, v_num=0, train/loss_simple_step=0.00498, train/loss_vlb_step=2.64e-5, train/loss_step=0.00498, global_step=261.0]Epoch 0:  87%|████████▋ | 1048/1208 [30:16<04:37,  1.73s/it, loss=0.0841, v_num=0, train/loss_simple_step=0.00498, train/loss_vlb_step=2.64e-5, train/loss_step=0.00498, global_step=261.0]Epoch 0:  87%|████████▋ | 1048/1208 [30:16<04:37,  1.73s/it, loss=0.092, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000599, train/loss_step=0.174, global_step=261.0]    Epoch 0:  87%|████████▋ | 1049/1208 [30:17<04:35,  1.73s/it, loss=0.092, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000599, train/loss_step=0.174, global_step=261.0]Epoch 0:  87%|████████▋ | 1049/1208 [30:17<04:35,  1.73s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=262.0]Epoch 0:  87%|████████▋ | 1050/1208 [30:18<04:33,  1.73s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=262.0]Epoch 0:  87%|████████▋ | 1050/1208 [30:18<04:33,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.539, train/loss_vlb_step=0.0121, train/loss_step=0.539, global_step=262.0]   Epoch 0:  87%|████████▋ | 1051/1208 [30:19<04:31,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.539, train/loss_vlb_step=0.0121, train/loss_step=0.539, global_step=262.0]Epoch 0:  87%|████████▋ | 1051/1208 [30:19<04:31,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0928, train/loss_vlb_step=0.000306, train/loss_step=0.0928, global_step=262.0]Epoch 0:  87%|████████▋ | 1052/1208 [30:22<04:30,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0928, train/loss_vlb_step=0.000306, train/loss_step=0.0928, global_step=262.0]Epoch 0:  87%|████████▋ | 1052/1208 [30:22<04:30,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=1.01e-5, train/loss_step=0.00167, global_step=262.0]Epoch 0:  87%|████████▋ | 1053/1208 [30:23<04:28,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=1.01e-5, train/loss_step=0.00167, global_step=262.0]Epoch 0:  87%|████████▋ | 1053/1208 [30:23<04:28,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=9.94e-5, train/loss_step=0.0261, global_step=263.0]  Epoch 0:  87%|████████▋ | 1054/1208 [30:24<04:26,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=9.94e-5, train/loss_step=0.0261, global_step=263.0]Epoch 0:  87%|████████▋ | 1054/1208 [30:24<04:26,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.484, train/loss_vlb_step=0.00406, train/loss_step=0.484, global_step=263.0]  Epoch 0:  87%|████████▋ | 1055/1208 [30:25<04:24,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.484, train/loss_vlb_step=0.00406, train/loss_step=0.484, global_step=263.0]Epoch 0:  87%|████████▋ | 1055/1208 [30:25<04:24,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.9e-5, train/loss_step=0.0157, global_step=263.0]Epoch 0:  87%|████████▋ | 1056/1208 [30:28<04:23,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.9e-5, train/loss_step=0.0157, global_step=263.0]Epoch 0:  87%|████████▋ | 1056/1208 [30:28<04:23,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=2.2e-5, train/loss_step=0.00388, global_step=263.0]Epoch 0:  88%|████████▊ | 1057/1208 [30:29<04:21,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=2.2e-5, train/loss_step=0.00388, global_step=263.0]Epoch 0:  88%|████████▊ | 1057/1208 [30:29<04:21,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.738, train/loss_vlb_step=0.0541, train/loss_step=0.738, global_step=264.0]    Epoch 0:  88%|████████▊ | 1058/1208 [30:31<04:19,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.738, train/loss_vlb_step=0.0541, train/loss_step=0.738, global_step=264.0]Epoch 0:  88%|████████▊ | 1058/1208 [30:31<04:19,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00422, train/loss_vlb_step=2.29e-5, train/loss_step=0.00422, global_step=264.0]Epoch 0:  88%|████████▊ | 1059/1208 [30:32<04:17,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00422, train/loss_vlb_step=2.29e-5, train/loss_step=0.00422, global_step=264.0]Epoch 0:  88%|████████▊ | 1059/1208 [30:32<04:17,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00209, train/loss_step=0.329, global_step=264.0]    Epoch 0:  88%|████████▊ | 1060/1208 [30:35<04:16,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00209, train/loss_step=0.329, global_step=264.0]Epoch 0:  88%|████████▊ | 1060/1208 [30:35<04:16,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000172, train/loss_step=0.050, global_step=264.0]Epoch 0:  88%|████████▊ | 1061/1208 [30:36<04:14,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000172, train/loss_step=0.050, global_step=264.0]Epoch 0:  88%|████████▊ | 1061/1208 [30:36<04:14,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0589, train/loss_vlb_step=0.000203, train/loss_step=0.0589, global_step=265.0]Epoch 0:  88%|████████▊ | 1062/1208 [30:37<04:12,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0589, train/loss_vlb_step=0.000203, train/loss_step=0.0589, global_step=265.0]Epoch 0:  88%|████████▊ | 1062/1208 [30:37<04:12,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000416, train/loss_step=0.126, global_step=265.0]   Epoch 0:  88%|████████▊ | 1063/1208 [30:38<04:10,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000416, train/loss_step=0.126, global_step=265.0]Epoch 0:  88%|████████▊ | 1063/1208 [30:38<04:10,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=1.82e-5, train/loss_step=0.00322, global_step=265.0]Epoch 0:  88%|████████▊ | 1064/1208 [30:41<04:09,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=1.82e-5, train/loss_step=0.00322, global_step=265.0]Epoch 0:  88%|████████▊ | 1064/1208 [30:41<04:09,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.95e-5, train/loss_step=0.00349, global_step=265.0] Epoch 0:  88%|████████▊ | 1065/1208 [30:42<04:07,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.95e-5, train/loss_step=0.00349, global_step=265.0]Epoch 0:  88%|████████▊ | 1065/1208 [30:42<04:07,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000168, train/loss_step=0.0454, global_step=266.0]Epoch 0:  88%|████████▊ | 1066/1208 [30:43<04:05,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000168, train/loss_step=0.0454, global_step=266.0]Epoch 0:  88%|████████▊ | 1066/1208 [30:43<04:05,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000915, train/loss_step=0.223, global_step=266.0]  Epoch 0:  88%|████████▊ | 1067/1208 [30:45<04:03,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000915, train/loss_step=0.223, global_step=266.0]Epoch 0:  88%|████████▊ | 1067/1208 [30:45<04:03,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000152, train/loss_step=0.0399, global_step=266.0]Epoch 0:  88%|████████▊ | 1068/1208 [30:48<04:02,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000152, train/loss_step=0.0399, global_step=266.0]Epoch 0:  88%|████████▊ | 1068/1208 [30:48<04:02,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000133, train/loss_step=0.0348, global_step=266.0]Epoch 0:  88%|████████▊ | 1069/1208 [30:49<04:00,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000133, train/loss_step=0.0348, global_step=266.0]Epoch 0:  88%|████████▊ | 1069/1208 [30:49<04:00,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00137, train/loss_step=0.302, global_step=267.0]   Epoch 0:  89%|████████▊ | 1070/1208 [30:50<03:58,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00137, train/loss_step=0.302, global_step=267.0]Epoch 0:  89%|████████▊ | 1070/1208 [30:50<03:58,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000542, train/loss_step=0.159, global_step=267.0]Epoch 0:  89%|████████▊ | 1071/1208 [30:51<03:56,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000542, train/loss_step=0.159, global_step=267.0]Epoch 0:  89%|████████▊ | 1071/1208 [30:51<03:56,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.000169, train/loss_step=0.0485, global_step=267.0]Epoch 0:  89%|████████▊ | 1072/1208 [30:54<03:55,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.000169, train/loss_step=0.0485, global_step=267.0]Epoch 0:  89%|████████▊ | 1072/1208 [30:54<03:55,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.11e-5, train/loss_step=0.00186, global_step=267.0]Epoch 0:  89%|████████▉ | 1073/1208 [30:55<03:53,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.11e-5, train/loss_step=0.00186, global_step=267.0]Epoch 0:  89%|████████▉ | 1073/1208 [30:55<03:53,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.3e-5, train/loss_step=0.0227, global_step=268.0]   Epoch 0:  89%|████████▉ | 1074/1208 [30:56<03:51,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.3e-5, train/loss_step=0.0227, global_step=268.0]Epoch 0:  89%|████████▉ | 1074/1208 [30:56<03:51,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00485, train/loss_vlb_step=2.56e-5, train/loss_step=0.00485, global_step=268.0]Epoch 0:  89%|████████▉ | 1075/1208 [30:57<03:49,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00485, train/loss_vlb_step=2.56e-5, train/loss_step=0.00485, global_step=268.0]Epoch 0:  89%|████████▉ | 1075/1208 [30:57<03:49,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=268.0]   Epoch 0:  89%|████████▉ | 1076/1208 [31:01<03:48,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=268.0]Epoch 0:  89%|████████▉ | 1076/1208 [31:01<03:48,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000814, train/loss_step=0.225, global_step=268.0]Epoch 0:  89%|████████▉ | 1077/1208 [31:02<03:46,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000814, train/loss_step=0.225, global_step=268.0]Epoch 0:  89%|████████▉ | 1077/1208 [31:02<03:46,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.517, train/loss_vlb_step=0.00715, train/loss_step=0.517, global_step=269.0] Epoch 0:  89%|████████▉ | 1078/1208 [31:03<03:44,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.517, train/loss_vlb_step=0.00715, train/loss_step=0.517, global_step=269.0]Epoch 0:  89%|████████▉ | 1078/1208 [31:03<03:44,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00717, train/loss_vlb_step=3.43e-5, train/loss_step=0.00717, global_step=269.0]Epoch 0:  89%|████████▉ | 1079/1208 [31:04<03:42,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00717, train/loss_vlb_step=3.43e-5, train/loss_step=0.00717, global_step=269.0]Epoch 0:  89%|████████▉ | 1079/1208 [31:04<03:42,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0841, train/loss_vlb_step=0.000283, train/loss_step=0.0841, global_step=269.0] Epoch 0:  89%|████████▉ | 1080/1208 [31:07<03:41,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0841, train/loss_vlb_step=0.000283, train/loss_step=0.0841, global_step=269.0]Epoch 0:  89%|████████▉ | 1080/1208 [31:07<03:41,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0472, train/loss_vlb_step=0.000173, train/loss_step=0.0472, global_step=269.0]Epoch 0:  89%|████████▉ | 1081/1208 [31:08<03:39,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0472, train/loss_vlb_step=0.000173, train/loss_step=0.0472, global_step=269.0]Epoch 0:  89%|████████▉ | 1081/1208 [31:08<03:39,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000419, train/loss_step=0.125, global_step=270.0]  Epoch 0:  90%|████████▉ | 1082/1208 [31:09<03:37,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000419, train/loss_step=0.125, global_step=270.0]Epoch 0:  90%|████████▉ | 1082/1208 [31:09<03:37,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00224, train/loss_step=0.342, global_step=270.0] Epoch 0:  90%|████████▉ | 1083/1208 [31:10<03:35,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00224, train/loss_step=0.342, global_step=270.0]Epoch 0:  90%|████████▉ | 1083/1208 [31:10<03:35,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000508, train/loss_step=0.152, global_step=270.0]Epoch 0:  90%|████████▉ | 1084/1208 [31:14<03:34,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000508, train/loss_step=0.152, global_step=270.0]Epoch 0:  90%|████████▉ | 1084/1208 [31:14<03:34,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00137, train/loss_step=0.316, global_step=270.0]  Epoch 0:  90%|████████▉ | 1085/1208 [31:15<03:32,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00137, train/loss_step=0.316, global_step=270.0]Epoch 0:  90%|████████▉ | 1085/1208 [31:15<03:32,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.05e-5, train/loss_step=0.017, global_step=271.0]Epoch 0:  90%|████████▉ | 1086/1208 [31:16<03:30,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.05e-5, train/loss_step=0.017, global_step=271.0]Epoch 0:  90%|████████▉ | 1086/1208 [31:16<03:30,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00536, train/loss_vlb_step=2.79e-5, train/loss_step=0.00536, global_step=271.0]Epoch 0:  90%|████████▉ | 1087/1208 [31:17<03:28,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00536, train/loss_vlb_step=2.79e-5, train/loss_step=0.00536, global_step=271.0]Epoch 0:  90%|████████▉ | 1087/1208 [31:17<03:28,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00158, train/loss_step=0.364, global_step=271.0]    Epoch 0:  90%|█████████ | 1088/1208 [31:20<03:27,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00158, train/loss_step=0.364, global_step=271.0]Epoch 0:  90%|█████████ | 1088/1208 [31:20<03:27,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000443, train/loss_step=0.135, global_step=271.0]Epoch 0:  90%|█████████ | 1089/1208 [31:21<03:25,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000443, train/loss_step=0.135, global_step=271.0]Epoch 0:  90%|█████████ | 1089/1208 [31:21<03:25,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0343, train/loss_vlb_step=0.000133, train/loss_step=0.0343, global_step=272.0]Epoch 0:  90%|█████████ | 1090/1208 [31:22<03:23,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0343, train/loss_vlb_step=0.000133, train/loss_step=0.0343, global_step=272.0]Epoch 0:  90%|█████████ | 1090/1208 [31:22<03:23,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.621, train/loss_vlb_step=0.0158, train/loss_step=0.621, global_step=272.0]    Epoch 0:  90%|█████████ | 1091/1208 [31:23<03:22,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.621, train/loss_vlb_step=0.0158, train/loss_step=0.621, global_step=272.0]Epoch 0:  90%|█████████ | 1091/1208 [31:23<03:22,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000166, train/loss_step=0.0445, global_step=272.0]Epoch 0:  90%|█████████ | 1092/1208 [31:27<03:20,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000166, train/loss_step=0.0445, global_step=272.0]Epoch 0:  90%|█████████ | 1092/1208 [31:27<03:20,  1.73s/it, loss=0.19, v_num=0, train/loss_simple_step=0.634, train/loss_vlb_step=0.0187, train/loss_step=0.634, global_step=272.0]     Epoch 0:  90%|█████████ | 1093/1208 [31:28<03:18,  1.73s/it, loss=0.19, v_num=0, train/loss_simple_step=0.634, train/loss_vlb_step=0.0187, train/loss_step=0.634, global_step=272.0]Epoch 0:  90%|█████████ | 1093/1208 [31:28<03:18,  1.73s/it, loss=0.202, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00109, train/loss_step=0.274, global_step=273.0]Epoch 0:  91%|█████████ | 1094/1208 [31:29<03:16,  1.73s/it, loss=0.202, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00109, train/loss_step=0.274, global_step=273.0]Epoch 0:  91%|█████████ | 1094/1208 [31:29<03:16,  1.73s/it, loss=0.206, v_num=0, train/loss_simple_step=0.079, train/loss_vlb_step=0.000268, train/loss_step=0.079, global_step=273.0]Epoch 0:  91%|█████████ | 1095/1208 [31:30<03:15,  1.73s/it, loss=0.206, v_num=0, train/loss_simple_step=0.079, train/loss_vlb_step=0.000268, train/loss_step=0.079, global_step=273.0]Epoch 0:  91%|█████████ | 1095/1208 [31:30<03:15,  1.73s/it, loss=0.209, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000519, train/loss_step=0.153, global_step=273.0]Epoch 0:  91%|█████████ | 1096/1208 [31:33<03:13,  1.73s/it, loss=0.209, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000519, train/loss_step=0.153, global_step=273.0]Epoch 0:  91%|█████████ | 1096/1208 [31:33<03:13,  1.73s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00681, train/loss_vlb_step=3.45e-5, train/loss_step=0.00681, global_step=273.0]Epoch 0:  91%|█████████ | 1097/1208 [31:34<03:11,  1.73s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00681, train/loss_vlb_step=3.45e-5, train/loss_step=0.00681, global_step=273.0]Epoch 0:  91%|█████████ | 1097/1208 [31:34<03:11,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00287, train/loss_vlb_step=1.64e-5, train/loss_step=0.00287, global_step=274.0]Epoch 0:  91%|█████████ | 1098/1208 [31:35<03:09,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00287, train/loss_vlb_step=1.64e-5, train/loss_step=0.00287, global_step=274.0]Epoch 0:  91%|█████████ | 1098/1208 [31:35<03:09,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00477, train/loss_vlb_step=2.48e-5, train/loss_step=0.00477, global_step=274.0]Epoch 0:  91%|█████████ | 1099/1208 [31:36<03:08,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00477, train/loss_vlb_step=2.48e-5, train/loss_step=0.00477, global_step=274.0]Epoch 0:  91%|█████████ | 1099/1208 [31:36<03:08,  1.73s/it, loss=0.176, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000575, train/loss_step=0.168, global_step=274.0]   Epoch 0:  91%|█████████ | 1100/1208 [31:40<03:06,  1.73s/it, loss=0.176, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000575, train/loss_step=0.168, global_step=274.0]Epoch 0:  91%|█████████ | 1100/1208 [31:40<03:06,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000123, train/loss_step=0.0317, global_step=274.0]Epoch 0:  91%|█████████ | 1101/1208 [31:41<03:04,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000123, train/loss_step=0.0317, global_step=274.0]Epoch 0:  91%|█████████ | 1101/1208 [31:41<03:04,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00717, train/loss_vlb_step=3.56e-5, train/loss_step=0.00717, global_step=275.0]Epoch 0:  91%|█████████ | 1102/1208 [31:42<03:02,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00717, train/loss_vlb_step=3.56e-5, train/loss_step=0.00717, global_step=275.0]Epoch 0:  91%|█████████ | 1102/1208 [31:42<03:02,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.17e-5, train/loss_step=0.0114, global_step=275.0] Epoch 0:  91%|█████████▏| 1103/1208 [31:43<03:01,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.17e-5, train/loss_step=0.0114, global_step=275.0]Epoch 0:  91%|█████████▏| 1103/1208 [31:43<03:01,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0921, train/loss_vlb_step=0.000305, train/loss_step=0.0921, global_step=275.0]Epoch 0:  91%|█████████▏| 1104/1208 [31:46<02:59,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0921, train/loss_vlb_step=0.000305, train/loss_step=0.0921, global_step=275.0]Epoch 0:  91%|█████████▏| 1104/1208 [31:46<02:59,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00422, train/loss_vlb_step=2.29e-5, train/loss_step=0.00422, global_step=275.0]Epoch 0:  91%|█████████▏| 1105/1208 [31:47<02:57,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00422, train/loss_vlb_step=2.29e-5, train/loss_step=0.00422, global_step=275.0]Epoch 0:  91%|█████████▏| 1105/1208 [31:47<02:57,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.000227, train/loss_step=0.0672, global_step=276.0] Epoch 0:  92%|█████████▏| 1106/1208 [31:48<02:56,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.000227, train/loss_step=0.0672, global_step=276.0]Epoch 0:  92%|█████████▏| 1106/1208 [31:48<02:56,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=276.0]  Epoch 0:  92%|█████████▏| 1107/1208 [31:49<02:54,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=276.0]Epoch 0:  92%|█████████▏| 1107/1208 [31:49<02:54,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.31e-5, train/loss_step=0.0172, global_step=276.0]Epoch 0:  92%|█████████▏| 1108/1208 [31:53<02:52,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.31e-5, train/loss_step=0.0172, global_step=276.0]Epoch 0:  92%|█████████▏| 1108/1208 [31:53<02:52,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.22e-5, train/loss_step=0.0166, global_step=276.0]Epoch 0:  92%|█████████▏| 1109/1208 [31:54<02:50,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.22e-5, train/loss_step=0.0166, global_step=276.0]Epoch 0:  92%|█████████▏| 1109/1208 [31:54<02:50,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000813, train/loss_step=0.231, global_step=277.0] Epoch 0:  92%|█████████▏| 1110/1208 [31:55<02:49,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000813, train/loss_step=0.231, global_step=277.0]Epoch 0:  92%|█████████▏| 1110/1208 [31:55<02:49,  1.73s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.00652, train/loss_vlb_step=3.2e-5, train/loss_step=0.00652, global_step=277.0]Epoch 0:  92%|█████████▏| 1111/1208 [31:56<02:47,  1.72s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.00652, train/loss_vlb_step=3.2e-5, train/loss_step=0.00652, global_step=277.0]Epoch 0:  92%|█████████▏| 1111/1208 [31:56<02:47,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000361, train/loss_step=0.110, global_step=277.0]   Epoch 0:  92%|█████████▏| 1112/1208 [31:59<02:45,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000361, train/loss_step=0.110, global_step=277.0]Epoch 0:  92%|█████████▏| 1112/1208 [31:59<02:45,  1.73s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.483, train/loss_vlb_step=0.00495, train/loss_step=0.483, global_step=277.0]Epoch 0:  92%|█████████▏| 1113/1208 [32:00<02:43,  1.73s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.483, train/loss_vlb_step=0.00495, train/loss_step=0.483, global_step=277.0]Epoch 0:  92%|█████████▏| 1113/1208 [32:00<02:43,  1.73s/it, loss=0.107, v_num=0, train/loss_simple_step=0.543, train/loss_vlb_step=0.00804, train/loss_step=0.543, global_step=278.0] Epoch 0:  92%|█████████▏| 1114/1208 [32:01<02:42,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.543, train/loss_vlb_step=0.00804, train/loss_step=0.543, global_step=278.0]Epoch 0:  92%|█████████▏| 1114/1208 [32:01<02:42,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00603, train/loss_vlb_step=3.18e-5, train/loss_step=0.00603, global_step=278.0]Epoch 0:  92%|█████████▏| 1115/1208 [32:02<02:40,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00603, train/loss_vlb_step=3.18e-5, train/loss_step=0.00603, global_step=278.0]Epoch 0:  92%|█████████▏| 1115/1208 [32:02<02:40,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0999, train/loss_vlb_step=0.000329, train/loss_step=0.0999, global_step=278.0] Epoch 0:  92%|█████████▏| 1116/1208 [32:05<02:38,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0999, train/loss_vlb_step=0.000329, train/loss_step=0.0999, global_step=278.0]Epoch 0:  92%|█████████▏| 1116/1208 [32:05<02:38,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000163, train/loss_step=0.0437, global_step=278.0]Epoch 0:  92%|█████████▏| 1117/1208 [32:07<02:36,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000163, train/loss_step=0.0437, global_step=278.0]Epoch 0:  92%|█████████▏| 1117/1208 [32:07<02:36,  1.73s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0885, train/loss_vlb_step=0.000297, train/loss_step=0.0885, global_step=279.0]Epoch 0:  93%|█████████▎| 1118/1208 [32:08<02:35,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0885, train/loss_vlb_step=0.000297, train/loss_step=0.0885, global_step=279.0]Epoch 0:  93%|█████████▎| 1118/1208 [32:08<02:35,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0927, train/loss_vlb_step=0.000308, train/loss_step=0.0927, global_step=279.0]Epoch 0:  93%|█████████▎| 1119/1208 [32:09<02:33,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0927, train/loss_vlb_step=0.000308, train/loss_step=0.0927, global_step=279.0]Epoch 0:  93%|█████████▎| 1119/1208 [32:09<02:33,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000608, train/loss_step=0.176, global_step=279.0]  Epoch 0:  93%|█████████▎| 1120/1208 [32:12<02:31,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000608, train/loss_step=0.176, global_step=279.0]Epoch 0:  93%|█████████▎| 1120/1208 [32:12<02:31,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0053, train/loss_vlb_step=2.82e-5, train/loss_step=0.0053, global_step=279.0]Epoch 0:  93%|█████████▎| 1121/1208 [32:13<02:30,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0053, train/loss_vlb_step=2.82e-5, train/loss_step=0.0053, global_step=279.0]Epoch 0:  93%|█████████▎| 1121/1208 [32:13<02:30,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0586, train/loss_vlb_step=0.000198, train/loss_step=0.0586, global_step=280.0]Epoch 0:  93%|█████████▎| 1122/1208 [32:14<02:28,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0586, train/loss_vlb_step=0.000198, train/loss_step=0.0586, global_step=280.0]Epoch 0:  93%|█████████▎| 1122/1208 [32:14<02:28,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00382, train/loss_vlb_step=2.1e-5, train/loss_step=0.00382, global_step=280.0]Epoch 0:  93%|█████████▎| 1123/1208 [32:15<02:26,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00382, train/loss_vlb_step=2.1e-5, train/loss_step=0.00382, global_step=280.0]Epoch 0:  93%|█████████▎| 1123/1208 [32:15<02:26,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000499, train/loss_step=0.149, global_step=280.0]  Epoch 0:  93%|█████████▎| 1124/1208 [32:18<02:24,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000499, train/loss_step=0.149, global_step=280.0]Epoch 0:  93%|█████████▎| 1124/1208 [32:18<02:24,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0027, train/loss_vlb_step=1.57e-5, train/loss_step=0.0027, global_step=280.0]Epoch 0:  93%|█████████▎| 1125/1208 [32:19<02:23,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0027, train/loss_vlb_step=1.57e-5, train/loss_step=0.0027, global_step=280.0]Epoch 0:  93%|█████████▎| 1125/1208 [32:19<02:23,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00745, train/loss_vlb_step=3.62e-5, train/loss_step=0.00745, global_step=281.0]Epoch 0:  93%|█████████▎| 1126/1208 [32:20<02:21,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00745, train/loss_vlb_step=3.62e-5, train/loss_step=0.00745, global_step=281.0]Epoch 0:  93%|█████████▎| 1126/1208 [32:20<02:21,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000404, train/loss_step=0.123, global_step=281.0]   Epoch 0:  93%|█████████▎| 1127/1208 [32:21<02:19,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000404, train/loss_step=0.123, global_step=281.0]Epoch 0:  93%|█████████▎| 1127/1208 [32:21<02:19,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.444, train/loss_vlb_step=0.00385, train/loss_step=0.444, global_step=281.0] Epoch 0:  93%|█████████▎| 1128/1208 [32:25<02:17,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.444, train/loss_vlb_step=0.00385, train/loss_step=0.444, global_step=281.0]Epoch 0:  93%|█████████▎| 1128/1208 [32:25<02:17,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000864, train/loss_step=0.238, global_step=281.0]Epoch 0:  93%|█████████▎| 1129/1208 [32:26<02:16,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000864, train/loss_step=0.238, global_step=281.0]Epoch 0:  93%|█████████▎| 1129/1208 [32:26<02:16,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000128, train/loss_step=0.0337, global_step=282.0]Epoch 0:  94%|█████████▎| 1130/1208 [32:27<02:14,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000128, train/loss_step=0.0337, global_step=282.0]Epoch 0:  94%|█████████▎| 1130/1208 [32:27<02:14,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0996, train/loss_vlb_step=0.000327, train/loss_step=0.0996, global_step=282.0] Epoch 0:  94%|█████████▎| 1131/1208 [32:28<02:12,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0996, train/loss_vlb_step=0.000327, train/loss_step=0.0996, global_step=282.0]Epoch 0:  94%|█████████▎| 1131/1208 [32:28<02:12,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00653, train/loss_vlb_step=3.28e-5, train/loss_step=0.00653, global_step=282.0]Epoch 0:  94%|█████████▎| 1132/1208 [32:31<02:11,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00653, train/loss_vlb_step=3.28e-5, train/loss_step=0.00653, global_step=282.0]Epoch 0:  94%|█████████▎| 1132/1208 [32:31<02:11,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0511, train/loss_vlb_step=0.000182, train/loss_step=0.0511, global_step=282.0] Epoch 0:  94%|█████████▍| 1133/1208 [32:32<02:09,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0511, train/loss_vlb_step=0.000182, train/loss_step=0.0511, global_step=282.0]Epoch 0:  94%|█████████▍| 1133/1208 [32:32<02:09,  1.72s/it, loss=0.0873, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.45e-5, train/loss_step=0.0169, global_step=283.0]Epoch 0:  94%|█████████▍| 1134/1208 [32:33<02:07,  1.72s/it, loss=0.0873, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.45e-5, train/loss_step=0.0169, global_step=283.0]Epoch 0:  94%|█████████▍| 1134/1208 [32:33<02:07,  1.72s/it, loss=0.0883, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=0.000104, train/loss_step=0.0261, global_step=283.0]Epoch 0:  94%|█████████▍| 1135/1208 [32:34<02:05,  1.72s/it, loss=0.0883, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=0.000104, train/loss_step=0.0261, global_step=283.0]Epoch 0:  94%|█████████▍| 1135/1208 [32:34<02:05,  1.72s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.00702, train/loss_vlb_step=3.52e-5, train/loss_step=0.00702, global_step=283.0]Epoch 0:  94%|█████████▍| 1136/1208 [32:38<02:04,  1.72s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.00702, train/loss_vlb_step=3.52e-5, train/loss_step=0.00702, global_step=283.0]Epoch 0:  94%|█████████▍| 1136/1208 [32:38<02:04,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.760, train/loss_vlb_step=0.0774, train/loss_step=0.760, global_step=283.0]      Epoch 0:  94%|█████████▍| 1137/1208 [32:39<02:02,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.760, train/loss_vlb_step=0.0774, train/loss_step=0.760, global_step=283.0]Epoch 0:  94%|█████████▍| 1137/1208 [32:39<02:02,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00181, train/loss_step=0.350, global_step=284.0]Epoch 0:  94%|█████████▍| 1138/1208 [32:40<02:00,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00181, train/loss_step=0.350, global_step=284.0]Epoch 0:  94%|█████████▍| 1138/1208 [32:40<02:00,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.811, train/loss_vlb_step=0.205, train/loss_step=0.811, global_step=284.0]  Epoch 0:  94%|█████████▍| 1139/1208 [32:41<01:58,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.811, train/loss_vlb_step=0.205, train/loss_step=0.811, global_step=284.0]Epoch 0:  94%|█████████▍| 1139/1208 [32:41<01:58,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00907, train/loss_vlb_step=4.41e-5, train/loss_step=0.00907, global_step=284.0]Epoch 0:  94%|█████████▍| 1140/1208 [32:44<01:57,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00907, train/loss_vlb_step=4.41e-5, train/loss_step=0.00907, global_step=284.0]Epoch 0:  94%|█████████▍| 1140/1208 [32:44<01:57,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0763, train/loss_vlb_step=0.000255, train/loss_step=0.0763, global_step=284.0]Epoch 0:  94%|█████████▍| 1141/1208 [32:45<01:55,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0763, train/loss_vlb_step=0.000255, train/loss_step=0.0763, global_step=284.0]Epoch 0:  94%|█████████▍| 1141/1208 [32:45<01:55,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.0029, train/loss_step=0.396, global_step=285.0]    Epoch 0:  95%|█████████▍| 1142/1208 [32:46<01:53,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.0029, train/loss_step=0.396, global_step=285.0]Epoch 0:  95%|█████████▍| 1142/1208 [32:46<01:53,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0691, train/loss_vlb_step=0.000237, train/loss_step=0.0691, global_step=285.0]Epoch 0:  95%|█████████▍| 1143/1208 [32:47<01:51,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0691, train/loss_vlb_step=0.000237, train/loss_step=0.0691, global_step=285.0]Epoch 0:  95%|█████████▍| 1143/1208 [32:47<01:51,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.81e-5, train/loss_step=0.00341, global_step=285.0]Epoch 0:  95%|█████████▍| 1144/1208 [32:50<01:50,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.81e-5, train/loss_step=0.00341, global_step=285.0]Epoch 0:  95%|█████████▍| 1144/1208 [32:50<01:50,  1.72s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0792, train/loss_vlb_step=0.000261, train/loss_step=0.0792, global_step=285.0]  Epoch 0:  95%|█████████▍| 1145/1208 [32:52<01:48,  1.72s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0792, train/loss_vlb_step=0.000261, train/loss_step=0.0792, global_step=285.0]Epoch 0:  95%|█████████▍| 1145/1208 [32:52<01:48,  1.72s/it, loss=0.2, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00212, train/loss_step=0.393, global_step=286.0]    Epoch 0:  95%|█████████▍| 1146/1208 [32:53<01:46,  1.72s/it, loss=0.2, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00212, train/loss_step=0.393, global_step=286.0]Epoch 0:  95%|█████████▍| 1146/1208 [32:53<01:46,  1.72s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=7.8e-5, train/loss_step=0.0189, global_step=286.0]Epoch 0:  95%|█████████▍| 1147/1208 [32:54<01:44,  1.72s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=7.8e-5, train/loss_step=0.0189, global_step=286.0]Epoch 0:  95%|█████████▍| 1147/1208 [32:54<01:44,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00605, train/loss_vlb_step=2.94e-5, train/loss_step=0.00605, global_step=286.0]Epoch 0:  95%|█████████▌| 1148/1208 [32:57<01:43,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00605, train/loss_vlb_step=2.94e-5, train/loss_step=0.00605, global_step=286.0]Epoch 0:  95%|█████████▌| 1148/1208 [32:57<01:43,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.66e-5, train/loss_step=0.00273, global_step=286.0]Epoch 0:  95%|█████████▌| 1149/1208 [32:58<01:41,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.66e-5, train/loss_step=0.00273, global_step=286.0]Epoch 0:  95%|█████████▌| 1149/1208 [32:58<01:41,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000889, train/loss_step=0.229, global_step=287.0]   Epoch 0:  95%|█████████▌| 1150/1208 [32:59<01:39,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000889, train/loss_step=0.229, global_step=287.0]Epoch 0:  95%|█████████▌| 1150/1208 [32:59<01:39,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00977, train/loss_vlb_step=4.59e-5, train/loss_step=0.00977, global_step=287.0]Epoch 0:  95%|█████████▌| 1151/1208 [33:00<01:38,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00977, train/loss_vlb_step=4.59e-5, train/loss_step=0.00977, global_step=287.0]Epoch 0:  95%|█████████▌| 1151/1208 [33:00<01:38,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000996, train/loss_step=0.245, global_step=287.0]   Epoch 0:  95%|█████████▌| 1152/1208 [33:03<01:36,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000996, train/loss_step=0.245, global_step=287.0]Epoch 0:  95%|█████████▌| 1152/1208 [33:03<01:36,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000554, train/loss_step=0.165, global_step=287.0]Epoch 0:  95%|█████████▌| 1153/1208 [33:04<01:34,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000554, train/loss_step=0.165, global_step=287.0]Epoch 0:  95%|█████████▌| 1153/1208 [33:04<01:34,  1.72s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0831, train/loss_vlb_step=0.000275, train/loss_step=0.0831, global_step=288.0]Epoch 0:  96%|█████████▌| 1154/1208 [33:05<01:32,  1.72s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0831, train/loss_vlb_step=0.000275, train/loss_step=0.0831, global_step=288.0]Epoch 0:  96%|█████████▌| 1154/1208 [33:05<01:32,  1.72s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0075, train/loss_vlb_step=3.84e-5, train/loss_step=0.0075, global_step=288.0] Epoch 0:  96%|█████████▌| 1155/1208 [33:07<01:31,  1.72s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0075, train/loss_vlb_step=3.84e-5, train/loss_step=0.0075, global_step=288.0]Epoch 0:  96%|█████████▌| 1155/1208 [33:07<01:31,  1.72s/it, loss=0.225, v_num=0, train/loss_simple_step=0.785, train/loss_vlb_step=0.133, train/loss_step=0.785, global_step=288.0]    Epoch 0:  96%|█████████▌| 1156/1208 [33:10<01:29,  1.72s/it, loss=0.225, v_num=0, train/loss_simple_step=0.785, train/loss_vlb_step=0.133, train/loss_step=0.785, global_step=288.0]Epoch 0:  96%|█████████▌| 1156/1208 [33:10<01:29,  1.72s/it, loss=0.196, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000581, train/loss_step=0.171, global_step=288.0]Epoch 0:  96%|█████████▌| 1157/1208 [33:11<01:27,  1.72s/it, loss=0.196, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000581, train/loss_step=0.171, global_step=288.0]Epoch 0:  96%|█████████▌| 1157/1208 [33:11<01:27,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0581, train/loss_vlb_step=0.000204, train/loss_step=0.0581, global_step=289.0]Epoch 0:  96%|█████████▌| 1158/1208 [33:12<01:26,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0581, train/loss_vlb_step=0.000204, train/loss_step=0.0581, global_step=289.0]Epoch 0:  96%|█████████▌| 1158/1208 [33:12<01:26,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000591, train/loss_step=0.158, global_step=289.0]  Epoch 0:  96%|█████████▌| 1159/1208 [33:13<01:24,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000591, train/loss_step=0.158, global_step=289.0]Epoch 0:  96%|█████████▌| 1159/1208 [33:13<01:24,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.39e-5, train/loss_step=0.0141, global_step=289.0]Epoch 0:  96%|█████████▌| 1160/1208 [33:16<01:22,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.39e-5, train/loss_step=0.0141, global_step=289.0]Epoch 0:  96%|█████████▌| 1160/1208 [33:16<01:22,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000141, train/loss_step=0.0387, global_step=289.0]Epoch 0:  96%|█████████▌| 1161/1208 [33:17<01:20,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000141, train/loss_step=0.0387, global_step=289.0]Epoch 0:  96%|█████████▌| 1161/1208 [33:17<01:20,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000865, train/loss_step=0.229, global_step=290.0]  Epoch 0:  96%|█████████▌| 1162/1208 [33:18<01:19,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000865, train/loss_step=0.229, global_step=290.0]Epoch 0:  96%|█████████▌| 1162/1208 [33:18<01:19,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.79e-5, train/loss_step=0.0122, global_step=290.0]Epoch 0:  96%|█████████▋| 1163/1208 [33:19<01:17,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.79e-5, train/loss_step=0.0122, global_step=290.0]Epoch 0:  96%|█████████▋| 1163/1208 [33:19<01:17,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0963, train/loss_vlb_step=0.00032, train/loss_step=0.0963, global_step=290.0] Epoch 0:  96%|█████████▋| 1164/1208 [33:23<01:15,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0963, train/loss_vlb_step=0.00032, train/loss_step=0.0963, global_step=290.0]Epoch 0:  96%|█████████▋| 1164/1208 [33:23<01:15,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000334, train/loss_step=0.101, global_step=290.0]Epoch 0:  96%|█████████▋| 1165/1208 [33:24<01:13,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000334, train/loss_step=0.101, global_step=290.0]Epoch 0:  96%|█████████▋| 1165/1208 [33:24<01:13,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=291.0]Epoch 0:  97%|█████████▋| 1166/1208 [33:25<01:12,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=291.0]Epoch 0:  97%|█████████▋| 1166/1208 [33:25<01:12,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00878, train/loss_vlb_step=4.26e-5, train/loss_step=0.00878, global_step=291.0]Epoch 0:  97%|█████████▋| 1167/1208 [33:26<01:10,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00878, train/loss_vlb_step=4.26e-5, train/loss_step=0.00878, global_step=291.0]Epoch 0:  97%|█████████▋| 1167/1208 [33:26<01:10,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0652, train/loss_vlb_step=0.000219, train/loss_step=0.0652, global_step=291.0] Epoch 0:  97%|█████████▋| 1168/1208 [33:29<01:08,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0652, train/loss_vlb_step=0.000219, train/loss_step=0.0652, global_step=291.0]Epoch 0:  97%|█████████▋| 1168/1208 [33:29<01:08,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000135, train/loss_step=0.0363, global_step=291.0]Epoch 0:  97%|█████████▋| 1169/1208 [33:30<01:07,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000135, train/loss_step=0.0363, global_step=291.0]Epoch 0:  97%|█████████▋| 1169/1208 [33:30<01:07,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0479, train/loss_vlb_step=0.00017, train/loss_step=0.0479, global_step=292.0] Epoch 0:  97%|█████████▋| 1170/1208 [33:31<01:05,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0479, train/loss_vlb_step=0.00017, train/loss_step=0.0479, global_step=292.0]Epoch 0:  97%|█████████▋| 1170/1208 [33:31<01:05,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.065, train/loss_vlb_step=0.000218, train/loss_step=0.065, global_step=292.0] Epoch 0:  97%|█████████▋| 1171/1208 [33:32<01:03,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.065, train/loss_vlb_step=0.000218, train/loss_step=0.065, global_step=292.0]Epoch 0:  97%|█████████▋| 1171/1208 [33:32<01:03,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.00048, train/loss_step=0.141, global_step=292.0] Epoch 0:  97%|█████████▋| 1172/1208 [33:35<01:01,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.00048, train/loss_step=0.141, global_step=292.0]Epoch 0:  97%|█████████▋| 1172/1208 [33:35<01:01,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.0024, train/loss_step=0.374, global_step=292.0]  Epoch 0:  97%|█████████▋| 1173/1208 [33:37<01:00,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.0024, train/loss_step=0.374, global_step=292.0]Epoch 0:  97%|█████████▋| 1173/1208 [33:37<01:00,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000643, train/loss_step=0.186, global_step=293.0]Epoch 0:  97%|█████████▋| 1174/1208 [33:38<00:58,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000643, train/loss_step=0.186, global_step=293.0]Epoch 0:  97%|█████████▋| 1174/1208 [33:38<00:58,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0733, train/loss_vlb_step=0.000245, train/loss_step=0.0733, global_step=293.0]Epoch 0:  97%|█████████▋| 1175/1208 [33:39<00:56,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0733, train/loss_vlb_step=0.000245, train/loss_step=0.0733, global_step=293.0]Epoch 0:  97%|█████████▋| 1175/1208 [33:39<00:56,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0517, train/loss_vlb_step=0.000184, train/loss_step=0.0517, global_step=293.0]Epoch 0:  97%|█████████▋| 1176/1208 [33:42<00:55,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0517, train/loss_vlb_step=0.000184, train/loss_step=0.0517, global_step=293.0]Epoch 0:  97%|█████████▋| 1176/1208 [33:42<00:55,  1.72s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.0461, train/loss_vlb_step=0.000168, train/loss_step=0.0461, global_step=293.0]Epoch 0:  97%|█████████▋| 1177/1208 [33:43<00:53,  1.72s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.0461, train/loss_vlb_step=0.000168, train/loss_step=0.0461, global_step=293.0]Epoch 0:  97%|█████████▋| 1177/1208 [33:43<00:53,  1.72s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0761, train/loss_vlb_step=0.000263, train/loss_step=0.0761, global_step=294.0] Epoch 0:  98%|█████████▊| 1178/1208 [33:44<00:51,  1.72s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0761, train/loss_vlb_step=0.000263, train/loss_step=0.0761, global_step=294.0]Epoch 0:  98%|█████████▊| 1178/1208 [33:44<00:51,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00118, train/loss_step=0.279, global_step=294.0]   Epoch 0:  98%|█████████▊| 1179/1208 [33:45<00:49,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00118, train/loss_step=0.279, global_step=294.0]Epoch 0:  98%|█████████▊| 1179/1208 [33:45<00:49,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.53e-5, train/loss_step=0.00253, global_step=294.0]Epoch 0:  98%|█████████▊| 1180/1208 [33:48<00:48,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.53e-5, train/loss_step=0.00253, global_step=294.0]Epoch 0:  98%|█████████▊| 1180/1208 [33:48<00:48,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0573, train/loss_vlb_step=0.0002, train/loss_step=0.0573, global_step=294.0]   Epoch 0:  98%|█████████▊| 1181/1208 [33:49<00:46,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0573, train/loss_vlb_step=0.0002, train/loss_step=0.0573, global_step=294.0]Epoch 0:  98%|█████████▊| 1181/1208 [33:49<00:46,  1.72s/it, loss=0.093, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000146, train/loss_step=0.0399, global_step=295.0]Epoch 0:  98%|█████████▊| 1182/1208 [33:51<00:44,  1.72s/it, loss=0.093, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000146, train/loss_step=0.0399, global_step=295.0]Epoch 0:  98%|█████████▊| 1182/1208 [33:51<00:44,  1.72s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.53e-5, train/loss_step=0.00265, global_step=295.0]Epoch 0:  98%|█████████▊| 1183/1208 [33:52<00:42,  1.72s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.53e-5, train/loss_step=0.00265, global_step=295.0]Epoch 0:  98%|█████████▊| 1183/1208 [33:52<00:42,  1.72s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000376, train/loss_step=0.114, global_step=295.0]   Epoch 0:  98%|█████████▊| 1184/1208 [33:55<00:41,  1.72s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000376, train/loss_step=0.114, global_step=295.0]Epoch 0:  98%|█████████▊| 1184/1208 [33:55<00:41,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.552, train/loss_vlb_step=0.00747, train/loss_step=0.552, global_step=295.0]  Epoch 0:  98%|█████████▊| 1185/1208 [33:56<00:39,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.552, train/loss_vlb_step=0.00747, train/loss_step=0.552, global_step=295.0]Epoch 0:  98%|█████████▊| 1185/1208 [33:56<00:39,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.785, train/loss_vlb_step=0.0997, train/loss_step=0.785, global_step=296.0]  Epoch 0:  98%|█████████▊| 1186/1208 [33:57<00:37,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.785, train/loss_vlb_step=0.0997, train/loss_step=0.785, global_step=296.0]Epoch 0:  98%|█████████▊| 1186/1208 [33:57<00:37,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000525, train/loss_step=0.154, global_step=296.0]Epoch 0:  98%|█████████▊| 1187/1208 [33:58<00:36,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000525, train/loss_step=0.154, global_step=296.0]Epoch 0:  98%|█████████▊| 1187/1208 [33:58<00:36,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0771, train/loss_vlb_step=0.000257, train/loss_step=0.0771, global_step=296.0]Epoch 0:  98%|█████████▊| 1188/1208 [34:01<00:34,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0771, train/loss_vlb_step=0.000257, train/loss_step=0.0771, global_step=296.0]Epoch 0:  98%|█████████▊| 1188/1208 [34:01<00:34,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.078, train/loss_vlb_step=0.000262, train/loss_step=0.078, global_step=296.0]   Epoch 0:  98%|█████████▊| 1189/1208 [34:02<00:32,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.078, train/loss_vlb_step=0.000262, train/loss_step=0.078, global_step=296.0]Epoch 0:  98%|█████████▊| 1189/1208 [34:02<00:32,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000127, train/loss_step=0.0337, global_step=297.0]Epoch 0:  99%|█████████▊| 1190/1208 [34:03<00:30,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000127, train/loss_step=0.0337, global_step=297.0]Epoch 0:  99%|█████████▊| 1190/1208 [34:03<00:30,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00111, train/loss_step=0.262, global_step=297.0]   Epoch 0:  99%|█████████▊| 1191/1208 [34:04<00:29,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00111, train/loss_step=0.262, global_step=297.0]Epoch 0:  99%|█████████▊| 1191/1208 [34:04<00:29,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=297.0]Epoch 0:  99%|█████████▊| 1192/1208 [34:08<00:27,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=297.0]Epoch 0:  99%|█████████▊| 1192/1208 [34:08<00:27,  1.72s/it, loss=0.165, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00156, train/loss_step=0.314, global_step=297.0] Epoch 0:  99%|█████████▉| 1193/1208 [34:09<00:25,  1.72s/it, loss=0.165, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00156, train/loss_step=0.314, global_step=297.0]Epoch 0:  99%|█████████▉| 1193/1208 [34:09<00:25,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00287, train/loss_step=0.393, global_step=298.0]Epoch 0:  99%|█████████▉| 1194/1208 [34:10<00:24,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00287, train/loss_step=0.393, global_step=298.0]Epoch 0:  99%|█████████▉| 1194/1208 [34:10<00:24,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00279, train/loss_vlb_step=1.64e-5, train/loss_step=0.00279, global_step=298.0]Epoch 0:  99%|█████████▉| 1195/1208 [34:11<00:22,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00279, train/loss_vlb_step=1.64e-5, train/loss_step=0.00279, global_step=298.0]Epoch 0:  99%|█████████▉| 1195/1208 [34:11<00:22,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00102, train/loss_step=0.274, global_step=298.0]    Epoch 0:  99%|█████████▉| 1196/1208 [34:14<00:20,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00102, train/loss_step=0.274, global_step=298.0]Epoch 0:  99%|█████████▉| 1196/1208 [34:14<00:20,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00432, train/loss_vlb_step=2.37e-5, train/loss_step=0.00432, global_step=298.0]Epoch 0:  99%|█████████▉| 1197/1208 [34:15<00:18,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00432, train/loss_vlb_step=2.37e-5, train/loss_step=0.00432, global_step=298.0]Epoch 0:  99%|█████████▉| 1197/1208 [34:15<00:18,  1.72s/it, loss=0.198, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00251, train/loss_step=0.414, global_step=299.0]    Epoch 0:  99%|█████████▉| 1198/1208 [34:16<00:17,  1.72s/it, loss=0.198, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00251, train/loss_step=0.414, global_step=299.0]Epoch 0:  99%|█████████▉| 1198/1208 [34:16<00:17,  1.72s/it, loss=0.203, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00345, train/loss_step=0.393, global_step=299.0]Epoch 0:  99%|█████████▉| 1199/1208 [34:17<00:15,  1.72s/it, loss=0.203, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00345, train/loss_step=0.393, global_step=299.0]Epoch 0:  99%|█████████▉| 1199/1208 [34:17<00:15,  1.72s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.000185, train/loss_step=0.0543, global_step=299.0]Epoch 0:  99%|█████████▉| 1200/1208 [34:21<00:13,  1.72s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.000185, train/loss_step=0.0543, global_step=299.0]Epoch 0:  99%|█████████▉| 1200/1208 [34:21<00:13,  1.72s/it, loss=0.203, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.53e-5, train/loss_step=0.00267, global_step=299.0]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.74it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.75it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.73it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.75it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.75it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.76it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.78it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.78it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.78it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.78it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.78it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:14,  1.78it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:14,  1.78it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.78it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.78it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.82it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.78it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.75it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.81it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.75it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.75it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.77it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.78it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.75it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.78it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.78it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 0:  99%|█████████▉| 1201/1208 [34:51<00:12,  1.74s/it, loss=0.203, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.53e-5, train/loss_step=0.00267, global_step=299.0]Epoch 0:  99%|█████████▉| 1201/1208 [34:51<00:12,  1.74s/it, loss=0.206, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000347, train/loss_step=0.105, global_step=300.0]   Epoch 0: 100%|█████████▉| 1202/1208 [34:52<00:10,  1.74s/it, loss=0.206, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000347, train/loss_step=0.105, global_step=300.0]Epoch 0: 100%|█████████▉| 1202/1208 [34:52<00:10,  1.74s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.7e-5, train/loss_step=0.0202, global_step=300.0]Epoch 0: 100%|█████████▉| 1203/1208 [34:53<00:08,  1.74s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.7e-5, train/loss_step=0.0202, global_step=300.0]Epoch 0: 100%|█████████▉| 1203/1208 [34:53<00:08,  1.74s/it, loss=0.202, v_num=0, train/loss_simple_step=0.00387, train/loss_vlb_step=2.08e-5, train/loss_step=0.00387, global_step=300.0]Epoch 0: 100%|█████████▉| 1204/1208 [34:57<00:06,  1.74s/it, loss=0.202, v_num=0, train/loss_simple_step=0.00387, train/loss_vlb_step=2.08e-5, train/loss_step=0.00387, global_step=300.0]Epoch 0: 100%|█████████▉| 1204/1208 [34:57<00:06,  1.74s/it, loss=0.187, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.001, train/loss_step=0.255, global_step=300.0]      Epoch 0: 100%|█████████▉| 1205/1208 [34:58<00:05,  1.74s/it, loss=0.187, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.001, train/loss_step=0.255, global_step=300.0]Epoch 0: 100%|█████████▉| 1205/1208 [34:58<00:05,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=301.0]Epoch 0: 100%|█████████▉| 1206/1208 [34:59<00:03,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=301.0]Epoch 0: 100%|█████████▉| 1206/1208 [34:59<00:03,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00481, train/loss_step=0.407, global_step=301.0] Epoch 0: 100%|█████████▉| 1207/1208 [35:00<00:01,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00481, train/loss_step=0.407, global_step=301.0]Epoch 0: 100%|█████████▉| 1207/1208 [35:00<00:01,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00343, train/loss_vlb_step=2.01e-5, train/loss_step=0.00343, global_step=301.0]Epoch 0: 100%|██████████| 1208/1208 [35:04<00:00,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00343, train/loss_vlb_step=2.01e-5, train/loss_step=0.00343, global_step=301.0]Epoch 0: 100%|██████████| 1208/1208 [35:04<00:00,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=2.13e-5, train/loss_step=0.00381, global_step=301.0]
+
+
+Epoch 0:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.159, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=2.13e-5, train/loss_step=0.00381, global_step=301.0]           Epoch 1:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.159, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=2.13e-5, train/loss_step=0.00381, global_step=301.0]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][AData shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.75it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.74it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:30,  1.52it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:30,  1.52it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:31,  1.48it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:30,  1.53it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:28,  1.62it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:28,  1.62it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:28,  1.59it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:28,  1.61it/s]DDIM Sampler:  10%|█         | 5/50 [00:03<00:26,  1.68it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:03<00:26,  1.68it/s][ADDIM Sampler:  10%|█         | 5/50 [00:03<00:27,  1.65it/s]DDIM Sampler:  10%|█         | 5/50 [00:03<00:27,  1.66it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.72it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.73it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.70it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.70it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.75it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.75it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.74it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.73it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.74it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.73it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.74it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.75it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.76it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.77it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:18,  1.83it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.78it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.78it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.83it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.83it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.83it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.78it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:14,  1.81it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.78it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.78it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.83it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.78it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.83it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.83it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.84it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.78it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.84it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.83it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.83it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.83it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.78it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.83it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.83it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.83it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.82it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.78it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.83it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.82it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.78it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.83it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.82it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.77it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.82it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.83it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.78it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.78it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.79it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.78it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.78it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.78it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.78it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.78it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.82it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.83it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.83it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.83it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 1:   0%|          | 1/1208 [00:34<11:26:03, 34.10s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=2.13e-5, train/loss_step=0.00381, global_step=301.0]Epoch 1:   0%|          | 1/1208 [00:34<11:26:05, 34.11s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0507, train/loss_vlb_step=0.00019, train/loss_step=0.0507, global_step=302.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   0%|          | 2/1208 [00:35<5:53:04, 17.57s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0507, train/loss_vlb_step=0.00019, train/loss_step=0.0507, global_step=302.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:   0%|          | 2/1208 [00:35<5:53:05, 17.57s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00546, train/loss_vlb_step=2.84e-5, train/loss_step=0.00546, global_step=302.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   0%|          | 3/1208 [00:36<4:02:01, 12.05s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00546, train/loss_vlb_step=2.84e-5, train/loss_step=0.00546, global_step=302.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   0%|          | 3/1208 [00:36<4:02:02, 12.05s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0271, train/loss_vlb_step=0.00011, train/loss_step=0.0271, global_step=302.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:   0%|          | 4/1208 [00:39<3:17:02,  9.82s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0271, train/loss_vlb_step=0.00011, train/loss_step=0.0271, global_step=302.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   0%|          | 4/1208 [00:39<3:17:02,  9.82s/it, loss=0.146, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00237, train/loss_step=0.379, global_step=302.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:   0%|          | 5/1208 [00:40<2:41:47,  8.07s/it, loss=0.146, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00237, train/loss_step=0.379, global_step=302.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   0%|          | 5/1208 [00:40<2:41:47,  8.07s/it, loss=0.171, v_num=0, train/loss_simple_step=0.888, train/loss_vlb_step=0.447, train/loss_step=0.888, global_step=303.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:   0%|          | 6/1208 [00:41<2:18:10,  6.90s/it, loss=0.171, v_num=0, train/loss_simple_step=0.888, train/loss_vlb_step=0.447, train/loss_step=0.888, global_step=303.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   0%|          | 6/1208 [00:41<2:18:11,  6.90s/it, loss=0.176, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=303.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   1%|          | 7/1208 [00:42<2:01:17,  6.06s/it, loss=0.176, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=303.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   1%|          | 7/1208 [00:42<2:01:17,  6.06s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0528, train/loss_vlb_step=0.000184, train/loss_step=0.0528, global_step=303.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   1%|          | 8/1208 [00:45<1:54:09,  5.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0528, train/loss_vlb_step=0.000184, train/loss_step=0.0528, global_step=303.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   1%|          | 8/1208 [00:45<1:54:09,  5.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000139, train/loss_step=0.0378, global_step=303.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   1%|          | 9/1208 [00:46<1:43:46,  5.19s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000139, train/loss_step=0.0378, global_step=303.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   1%|          | 9/1208 [00:46<1:43:46,  5.19s/it, loss=0.154, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000513, train/loss_step=0.154, global_step=304.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:   1%|          | 10/1208 [00:47<1:35:24,  4.78s/it, loss=0.154, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000513, train/loss_step=0.154, global_step=304.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   1%|          | 10/1208 [00:47<1:35:24,  4.78s/it, loss=0.151, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00188, train/loss_step=0.333, global_step=304.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:   1%|          | 11/1208 [00:48<1:28:32,  4.44s/it, loss=0.151, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00188, train/loss_step=0.333, global_step=304.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   1%|          | 11/1208 [00:48<1:28:32,  4.44s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=8.86e-5, train/loss_step=0.0224, global_step=304.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   1%|          | 12/1208 [00:52<1:26:26,  4.34s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=8.86e-5, train/loss_step=0.0224, global_step=304.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   1%|          | 12/1208 [00:52<1:26:27,  4.34s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.000157, train/loss_step=0.0456, global_step=304.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   1%|          | 13/1208 [00:53<1:21:24,  4.09s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.000157, train/loss_step=0.0456, global_step=304.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   1%|          | 13/1208 [00:53<1:21:24,  4.09s/it, loss=0.147, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.4e-5, train/loss_step=0.012, global_step=305.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:   1%|          | 14/1208 [00:54<1:17:00,  3.87s/it, loss=0.147, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.4e-5, train/loss_step=0.012, global_step=305.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   1%|          | 14/1208 [00:54<1:17:00,  3.87s/it, loss=0.15, v_num=0, train/loss_simple_step=0.088, train/loss_vlb_step=0.000295, train/loss_step=0.088, global_step=305.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   1%|          | 15/1208 [00:55<1:13:10,  3.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.088, train/loss_vlb_step=0.000295, train/loss_step=0.088, global_step=305.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   1%|          | 15/1208 [00:55<1:13:11,  3.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.34e-5, train/loss_step=0.0227, global_step=305.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   1%|▏         | 16/1208 [00:58<1:12:33,  3.65s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.34e-5, train/loss_step=0.0227, global_step=305.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   1%|▏         | 16/1208 [00:58<1:12:33,  3.65s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00539, train/loss_vlb_step=2.79e-5, train/loss_step=0.00539, global_step=305.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   1%|▏         | 17/1208 [00:59<1:09:28,  3.50s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00539, train/loss_vlb_step=2.79e-5, train/loss_step=0.00539, global_step=305.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   1%|▏         | 17/1208 [00:59<1:09:28,  3.50s/it, loss=0.133, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.63e-5, train/loss_step=0.012, global_step=306.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:   1%|▏         | 18/1208 [01:00<1:06:43,  3.36s/it, loss=0.133, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.63e-5, train/loss_step=0.012, global_step=306.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   1%|▏         | 18/1208 [01:00<1:06:43,  3.36s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00434, train/loss_vlb_step=2.41e-5, train/loss_step=0.00434, global_step=306.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   2%|▏         | 19/1208 [01:01<1:04:15,  3.24s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00434, train/loss_vlb_step=2.41e-5, train/loss_step=0.00434, global_step=306.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   2%|▏         | 19/1208 [01:01<1:04:15,  3.24s/it, loss=0.129, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00184, train/loss_step=0.328, global_step=306.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:   2%|▏         | 20/1208 [01:04<1:04:12,  3.24s/it, loss=0.129, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00184, train/loss_step=0.328, global_step=306.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   2%|▏         | 20/1208 [01:04<1:04:12,  3.24s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0957, train/loss_vlb_step=0.000316, train/loss_step=0.0957, global_step=306.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   2%|▏         | 21/1208 [01:05<1:02:06,  3.14s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0957, train/loss_vlb_step=0.000316, train/loss_step=0.0957, global_step=306.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   2%|▏         | 21/1208 [01:05<1:02:06,  3.14s/it, loss=0.139, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000511, train/loss_step=0.152, global_step=307.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:   2%|▏         | 22/1208 [01:07<1:00:11,  3.05s/it, loss=0.139, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000511, train/loss_step=0.152, global_step=307.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   2%|▏         | 22/1208 [01:07<1:00:12,  3.05s/it, loss=0.14, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=7.93e-5, train/loss_step=0.020, global_step=307.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:   2%|▏         | 23/1208 [01:08<58:26,  2.96s/it, loss=0.14, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=7.93e-5, train/loss_step=0.020, global_step=307.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:   2%|▏         | 23/1208 [01:08<58:26,  2.96s/it, loss=0.152, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00139, train/loss_step=0.283, global_step=307.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   2%|▏         | 24/1208 [01:11<58:36,  2.97s/it, loss=0.152, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00139, train/loss_step=0.283, global_step=307.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   2%|▏         | 24/1208 [01:11<58:36,  2.97s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0997, train/loss_vlb_step=0.000328, train/loss_step=0.0997, global_step=307.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   2%|▏         | 25/1208 [01:12<57:04,  2.89s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0997, train/loss_vlb_step=0.000328, train/loss_step=0.0997, global_step=307.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   2%|▏         | 25/1208 [01:12<57:04,  2.89s/it, loss=0.095, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.86e-5, train/loss_step=0.0182, global_step=308.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:   2%|▏         | 26/1208 [01:13<55:37,  2.82s/it, loss=0.095, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.86e-5, train/loss_step=0.0182, global_step=308.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   2%|▏         | 26/1208 [01:13<55:37,  2.82s/it, loss=0.101, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000866, train/loss_step=0.232, global_step=308.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:   2%|▏         | 27/1208 [01:14<54:15,  2.76s/it, loss=0.101, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000866, train/loss_step=0.232, global_step=308.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   2%|▏         | 27/1208 [01:14<54:15,  2.76s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0835, train/loss_vlb_step=0.000283, train/loss_step=0.0835, global_step=308.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   2%|▏         | 28/1208 [01:17<54:33,  2.77s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0835, train/loss_vlb_step=0.000283, train/loss_step=0.0835, global_step=308.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   2%|▏         | 28/1208 [01:17<54:34,  2.77s/it, loss=0.106, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=308.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:   2%|▏         | 29/1208 [01:18<53:21,  2.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=308.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   2%|▏         | 29/1208 [01:18<53:21,  2.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00253, train/loss_step=0.374, global_step=309.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:   2%|▏         | 30/1208 [01:19<52:13,  2.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00253, train/loss_step=0.374, global_step=309.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   2%|▏         | 30/1208 [01:19<52:13,  2.66s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0728, train/loss_vlb_step=0.000247, train/loss_step=0.0728, global_step=309.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   3%|▎         | 31/1208 [01:20<51:09,  2.61s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0728, train/loss_vlb_step=0.000247, train/loss_step=0.0728, global_step=309.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   3%|▎         | 31/1208 [01:20<51:09,  2.61s/it, loss=0.109, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=309.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:   3%|▎         | 32/1208 [01:24<51:32,  2.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=309.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   3%|▎         | 32/1208 [01:24<51:32,  2.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=309.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   3%|▎         | 33/1208 [01:25<50:33,  2.58s/it, loss=0.113, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=309.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   3%|▎         | 33/1208 [01:25<50:33,  2.58s/it, loss=0.127, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00137, train/loss_step=0.300, global_step=310.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:   3%|▎         | 34/1208 [01:26<49:37,  2.54s/it, loss=0.127, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00137, train/loss_step=0.300, global_step=310.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   3%|▎         | 34/1208 [01:26<49:37,  2.54s/it, loss=0.128, v_num=0, train/loss_simple_step=0.099, train/loss_vlb_step=0.000332, train/loss_step=0.099, global_step=310.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   3%|▎         | 35/1208 [01:27<48:44,  2.49s/it, loss=0.128, v_num=0, train/loss_simple_step=0.099, train/loss_vlb_step=0.000332, train/loss_step=0.099, global_step=310.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   3%|▎         | 35/1208 [01:27<48:44,  2.49s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=9.12e-5, train/loss_step=0.0223, global_step=310.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   3%|▎         | 36/1208 [01:30<49:06,  2.51s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=9.12e-5, train/loss_step=0.0223, global_step=310.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   3%|▎         | 36/1208 [01:30<49:06,  2.51s/it, loss=0.14, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000971, train/loss_step=0.242, global_step=310.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:   3%|▎         | 37/1208 [01:31<48:18,  2.48s/it, loss=0.14, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000971, train/loss_step=0.242, global_step=310.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   3%|▎         | 37/1208 [01:31<48:18,  2.48s/it, loss=0.15, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000827, train/loss_step=0.221, global_step=311.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   3%|▎         | 38/1208 [01:32<47:32,  2.44s/it, loss=0.15, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000827, train/loss_step=0.221, global_step=311.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   3%|▎         | 38/1208 [01:32<47:32,  2.44s/it, loss=0.157, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000455, train/loss_step=0.137, global_step=311.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   3%|▎         | 39/1208 [01:33<46:47,  2.40s/it, loss=0.157, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000455, train/loss_step=0.137, global_step=311.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   3%|▎         | 39/1208 [01:33<46:47,  2.40s/it, loss=0.153, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000905, train/loss_step=0.246, global_step=311.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   3%|▎         | 40/1208 [01:36<47:09,  2.42s/it, loss=0.153, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000905, train/loss_step=0.246, global_step=311.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   3%|▎         | 40/1208 [01:36<47:09,  2.42s/it, loss=0.15, v_num=0, train/loss_simple_step=0.046, train/loss_vlb_step=0.000167, train/loss_step=0.046, global_step=311.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:   3%|▎         | 41/1208 [01:37<46:29,  2.39s/it, loss=0.15, v_num=0, train/loss_simple_step=0.046, train/loss_vlb_step=0.000167, train/loss_step=0.046, global_step=311.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   3%|▎         | 41/1208 [01:37<46:29,  2.39s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000144, train/loss_step=0.0372, global_step=312.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   3%|▎         | 42/1208 [01:39<45:49,  2.36s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000144, train/loss_step=0.0372, global_step=312.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   3%|▎         | 42/1208 [01:39<45:49,  2.36s/it, loss=0.161, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00254, train/loss_step=0.344, global_step=312.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:   4%|▎         | 43/1208 [01:40<45:12,  2.33s/it, loss=0.161, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00254, train/loss_step=0.344, global_step=312.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   4%|▎         | 43/1208 [01:40<45:12,  2.33s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00396, train/loss_vlb_step=2.13e-5, train/loss_step=0.00396, global_step=312.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   4%|▎         | 44/1208 [01:43<45:33,  2.35s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00396, train/loss_vlb_step=2.13e-5, train/loss_step=0.00396, global_step=312.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   4%|▎         | 44/1208 [01:43<45:33,  2.35s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00762, train/loss_vlb_step=3.75e-5, train/loss_step=0.00762, global_step=312.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   4%|▎         | 45/1208 [01:44<44:58,  2.32s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00762, train/loss_vlb_step=3.75e-5, train/loss_step=0.00762, global_step=312.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   4%|▎         | 45/1208 [01:44<44:58,  2.32s/it, loss=0.157, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00146, train/loss_step=0.312, global_step=313.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:   4%|▍         | 46/1208 [01:45<44:24,  2.29s/it, loss=0.157, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00146, train/loss_step=0.312, global_step=313.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   4%|▍         | 46/1208 [01:45<44:24,  2.29s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.02e-5, train/loss_step=0.0163, global_step=313.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   4%|▍         | 47/1208 [01:46<43:51,  2.27s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.02e-5, train/loss_step=0.0163, global_step=313.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   4%|▍         | 47/1208 [01:46<43:51,  2.27s/it, loss=0.148, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=313.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:   4%|▍         | 48/1208 [01:49<44:11,  2.29s/it, loss=0.148, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=313.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   4%|▍         | 48/1208 [01:49<44:12,  2.29s/it, loss=0.176, v_num=0, train/loss_simple_step=0.671, train/loss_vlb_step=0.0131, train/loss_step=0.671, global_step=313.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:   4%|▍         | 49/1208 [01:50<43:41,  2.26s/it, loss=0.176, v_num=0, train/loss_simple_step=0.671, train/loss_vlb_step=0.0131, train/loss_step=0.671, global_step=313.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   4%|▍         | 49/1208 [01:50<43:41,  2.26s/it, loss=0.17, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00154, train/loss_step=0.263, global_step=314.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   4%|▍         | 50/1208 [01:51<43:11,  2.24s/it, loss=0.17, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00154, train/loss_step=0.263, global_step=314.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   4%|▍         | 50/1208 [01:51<43:11,  2.24s/it, loss=0.177, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.00085, train/loss_step=0.208, global_step=314.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   4%|▍         | 51/1208 [01:52<42:41,  2.21s/it, loss=0.177, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.00085, train/loss_step=0.208, global_step=314.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   4%|▍         | 51/1208 [01:52<42:41,  2.21s/it, loss=0.202, v_num=0, train/loss_simple_step=0.634, train/loss_vlb_step=0.0197, train/loss_step=0.634, global_step=314.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:   4%|▍         | 52/1208 [01:56<43:02,  2.23s/it, loss=0.202, v_num=0, train/loss_simple_step=0.634, train/loss_vlb_step=0.0197, train/loss_step=0.634, global_step=314.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   4%|▍         | 52/1208 [01:56<43:02,  2.23s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=2.4e-5, train/loss_step=0.00416, global_step=314.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   4%|▍         | 53/1208 [01:57<42:35,  2.21s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=2.4e-5, train/loss_step=0.00416, global_step=314.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   4%|▍         | 53/1208 [01:57<42:35,  2.21s/it, loss=0.197, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00155, train/loss_step=0.306, global_step=315.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:   4%|▍         | 54/1208 [01:58<42:07,  2.19s/it, loss=0.197, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00155, train/loss_step=0.306, global_step=315.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   4%|▍         | 54/1208 [01:58<42:07,  2.19s/it, loss=0.199, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000494, train/loss_step=0.148, global_step=315.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   5%|▍         | 55/1208 [01:59<41:41,  2.17s/it, loss=0.199, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000494, train/loss_step=0.148, global_step=315.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   5%|▍         | 55/1208 [01:59<41:41,  2.17s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=7.04e-5, train/loss_step=0.0161, global_step=315.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   5%|▍         | 56/1208 [02:02<42:02,  2.19s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=7.04e-5, train/loss_step=0.0161, global_step=315.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   5%|▍         | 56/1208 [02:02<42:02,  2.19s/it, loss=0.201, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00128, train/loss_step=0.279, global_step=315.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:   5%|▍         | 57/1208 [02:03<41:37,  2.17s/it, loss=0.201, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00128, train/loss_step=0.279, global_step=315.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   5%|▍         | 57/1208 [02:03<41:37,  2.17s/it, loss=0.195, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000361, train/loss_step=0.110, global_step=316.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   5%|▍         | 58/1208 [02:04<41:13,  2.15s/it, loss=0.195, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000361, train/loss_step=0.110, global_step=316.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   5%|▍         | 58/1208 [02:04<41:13,  2.15s/it, loss=0.222, v_num=0, train/loss_simple_step=0.678, train/loss_vlb_step=0.0254, train/loss_step=0.678, global_step=316.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:   5%|▍         | 59/1208 [02:05<40:50,  2.13s/it, loss=0.222, v_num=0, train/loss_simple_step=0.678, train/loss_vlb_step=0.0254, train/loss_step=0.678, global_step=316.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   5%|▍         | 59/1208 [02:05<40:50,  2.13s/it, loss=0.231, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00412, train/loss_step=0.407, global_step=316.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   5%|▍         | 60/1208 [02:09<41:09,  2.15s/it, loss=0.231, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00412, train/loss_step=0.407, global_step=316.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   5%|▍         | 60/1208 [02:09<41:09,  2.15s/it, loss=0.265, v_num=0, train/loss_simple_step=0.738, train/loss_vlb_step=0.0541, train/loss_step=0.738, global_step=316.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:   5%|▌         | 61/1208 [02:10<40:46,  2.13s/it, loss=0.265, v_num=0, train/loss_simple_step=0.738, train/loss_vlb_step=0.0541, train/loss_step=0.738, global_step=316.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   5%|▌         | 61/1208 [02:10<40:46,  2.13s/it, loss=0.267, v_num=0, train/loss_simple_step=0.0743, train/loss_vlb_step=0.000253, train/loss_step=0.0743, global_step=317.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   5%|▌         | 62/1208 [02:11<40:24,  2.12s/it, loss=0.267, v_num=0, train/loss_simple_step=0.0743, train/loss_vlb_step=0.000253, train/loss_step=0.0743, global_step=317.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   5%|▌         | 62/1208 [02:11<40:24,  2.12s/it, loss=0.256, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000444, train/loss_step=0.133, global_step=317.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:   5%|▌         | 63/1208 [02:12<40:02,  2.10s/it, loss=0.256, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000444, train/loss_step=0.133, global_step=317.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   5%|▌         | 63/1208 [02:12<40:02,  2.10s/it, loss=0.274, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00235, train/loss_step=0.363, global_step=317.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:   5%|▌         | 64/1208 [02:15<40:22,  2.12s/it, loss=0.274, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00235, train/loss_step=0.363, global_step=317.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   5%|▌         | 64/1208 [02:15<40:22,  2.12s/it, loss=0.275, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.73e-5, train/loss_step=0.0153, global_step=317.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   5%|▌         | 65/1208 [02:16<40:01,  2.10s/it, loss=0.275, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.73e-5, train/loss_step=0.0153, global_step=317.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   5%|▌         | 65/1208 [02:16<40:01,  2.10s/it, loss=0.278, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00254, train/loss_step=0.386, global_step=318.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:   5%|▌         | 66/1208 [02:17<39:41,  2.09s/it, loss=0.278, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00254, train/loss_step=0.386, global_step=318.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   5%|▌         | 66/1208 [02:17<39:41,  2.09s/it, loss=0.282, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.000295, train/loss_step=0.0894, global_step=318.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   6%|▌         | 67/1208 [02:18<39:22,  2.07s/it, loss=0.282, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.000295, train/loss_step=0.0894, global_step=318.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   6%|▌         | 67/1208 [02:18<39:22,  2.07s/it, loss=0.314, v_num=0, train/loss_simple_step=0.748, train/loss_vlb_step=0.0353, train/loss_step=0.748, global_step=318.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:   6%|▌         | 68/1208 [02:21<39:39,  2.09s/it, loss=0.314, v_num=0, train/loss_simple_step=0.748, train/loss_vlb_step=0.0353, train/loss_step=0.748, global_step=318.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   6%|▌         | 68/1208 [02:21<39:39,  2.09s/it, loss=0.28, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.56e-5, train/loss_step=0.0026, global_step=318.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   6%|▌         | 69/1208 [02:22<39:20,  2.07s/it, loss=0.28, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.56e-5, train/loss_step=0.0026, global_step=318.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   6%|▌         | 69/1208 [02:22<39:20,  2.07s/it, loss=0.267, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=1.42e-5, train/loss_step=0.0024, global_step=319.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   6%|▌         | 70/1208 [02:24<39:01,  2.06s/it, loss=0.267, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=1.42e-5, train/loss_step=0.0024, global_step=319.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   6%|▌         | 70/1208 [02:24<39:01,  2.06s/it, loss=0.262, v_num=0, train/loss_simple_step=0.0966, train/loss_vlb_step=0.000322, train/loss_step=0.0966, global_step=319.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   6%|▌         | 71/1208 [02:25<38:43,  2.04s/it, loss=0.262, v_num=0, train/loss_simple_step=0.0966, train/loss_vlb_step=0.000322, train/loss_step=0.0966, global_step=319.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   6%|▌         | 71/1208 [02:25<38:43,  2.04s/it, loss=0.249, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00228, train/loss_step=0.386, global_step=319.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:   6%|▌         | 72/1208 [02:28<39:01,  2.06s/it, loss=0.249, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00228, train/loss_step=0.386, global_step=319.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   6%|▌         | 72/1208 [02:28<39:01,  2.06s/it, loss=0.253, v_num=0, train/loss_simple_step=0.0914, train/loss_vlb_step=0.000305, train/loss_step=0.0914, global_step=319.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   6%|▌         | 73/1208 [02:29<38:43,  2.05s/it, loss=0.253, v_num=0, train/loss_simple_step=0.0914, train/loss_vlb_step=0.000305, train/loss_step=0.0914, global_step=319.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   6%|▌         | 73/1208 [02:29<38:43,  2.05s/it, loss=0.24, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000162, train/loss_step=0.0457, global_step=320.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:   6%|▌         | 74/1208 [02:30<38:25,  2.03s/it, loss=0.24, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000162, train/loss_step=0.0457, global_step=320.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   6%|▌         | 74/1208 [02:30<38:25,  2.03s/it, loss=0.236, v_num=0, train/loss_simple_step=0.0602, train/loss_vlb_step=0.000212, train/loss_step=0.0602, global_step=320.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   6%|▌         | 75/1208 [02:31<38:08,  2.02s/it, loss=0.236, v_num=0, train/loss_simple_step=0.0602, train/loss_vlb_step=0.000212, train/loss_step=0.0602, global_step=320.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   6%|▌         | 75/1208 [02:31<38:08,  2.02s/it, loss=0.253, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00238, train/loss_step=0.350, global_step=320.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:   6%|▋         | 76/1208 [02:34<38:25,  2.04s/it, loss=0.253, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00238, train/loss_step=0.350, global_step=320.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   6%|▋         | 76/1208 [02:34<38:25,  2.04s/it, loss=0.24, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.92e-5, train/loss_step=0.0176, global_step=320.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   6%|▋         | 77/1208 [02:35<38:09,  2.02s/it, loss=0.24, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.92e-5, train/loss_step=0.0176, global_step=320.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   6%|▋         | 77/1208 [02:35<38:09,  2.02s/it, loss=0.235, v_num=0, train/loss_simple_step=0.00943, train/loss_vlb_step=4.36e-5, train/loss_step=0.00943, global_step=321.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   6%|▋         | 78/1208 [02:36<37:53,  2.01s/it, loss=0.235, v_num=0, train/loss_simple_step=0.00943, train/loss_vlb_step=4.36e-5, train/loss_step=0.00943, global_step=321.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   6%|▋         | 78/1208 [02:36<37:53,  2.01s/it, loss=0.209, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000566, train/loss_step=0.167, global_step=321.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:   7%|▋         | 79/1208 [02:37<37:37,  2.00s/it, loss=0.209, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000566, train/loss_step=0.167, global_step=321.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   7%|▋         | 79/1208 [02:37<37:37,  2.00s/it, loss=0.225, v_num=0, train/loss_simple_step=0.730, train/loss_vlb_step=0.0622, train/loss_step=0.730, global_step=321.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:   7%|▋         | 80/1208 [02:41<37:54,  2.02s/it, loss=0.225, v_num=0, train/loss_simple_step=0.730, train/loss_vlb_step=0.0622, train/loss_step=0.730, global_step=321.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   7%|▋         | 80/1208 [02:41<37:54,  2.02s/it, loss=0.195, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000436, train/loss_step=0.133, global_step=321.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   7%|▋         | 81/1208 [02:42<37:38,  2.00s/it, loss=0.195, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000436, train/loss_step=0.133, global_step=321.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   7%|▋         | 81/1208 [02:42<37:38,  2.00s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.000124, train/loss_step=0.0313, global_step=322.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   7%|▋         | 82/1208 [02:43<37:23,  1.99s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.000124, train/loss_step=0.0313, global_step=322.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   7%|▋         | 82/1208 [02:43<37:23,  1.99s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000129, train/loss_step=0.0342, global_step=322.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   7%|▋         | 83/1208 [02:44<37:08,  1.98s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000129, train/loss_step=0.0342, global_step=322.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   7%|▋         | 83/1208 [02:44<37:08,  1.98s/it, loss=0.208, v_num=0, train/loss_simple_step=0.761, train/loss_vlb_step=0.0489, train/loss_step=0.761, global_step=322.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:   7%|▋         | 84/1208 [02:47<37:24,  2.00s/it, loss=0.208, v_num=0, train/loss_simple_step=0.761, train/loss_vlb_step=0.0489, train/loss_step=0.761, global_step=322.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   7%|▋         | 84/1208 [02:47<37:24,  2.00s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=8.08e-5, train/loss_step=0.0189, global_step=322.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   7%|▋         | 85/1208 [02:48<37:10,  1.99s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=8.08e-5, train/loss_step=0.0189, global_step=322.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   7%|▋         | 85/1208 [02:48<37:10,  1.99s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0082, train/loss_vlb_step=4.01e-5, train/loss_step=0.0082, global_step=323.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   7%|▋         | 86/1208 [02:49<36:56,  1.98s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0082, train/loss_vlb_step=4.01e-5, train/loss_step=0.0082, global_step=323.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   7%|▋         | 86/1208 [02:49<36:56,  1.98s/it, loss=0.205, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00355, train/loss_step=0.414, global_step=323.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:   7%|▋         | 87/1208 [02:50<36:42,  1.96s/it, loss=0.205, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00355, train/loss_step=0.414, global_step=323.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   7%|▋         | 87/1208 [02:50<36:42,  1.96s/it, loss=0.176, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000537, train/loss_step=0.152, global_step=323.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   7%|▋         | 88/1208 [02:54<36:57,  1.98s/it, loss=0.176, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000537, train/loss_step=0.152, global_step=323.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   7%|▋         | 88/1208 [02:54<36:57,  1.98s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0793, train/loss_vlb_step=0.000267, train/loss_step=0.0793, global_step=323.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   7%|▋         | 89/1208 [02:55<36:43,  1.97s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0793, train/loss_vlb_step=0.000267, train/loss_step=0.0793, global_step=323.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   7%|▋         | 89/1208 [02:55<36:43,  1.97s/it, loss=0.184, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000355, train/loss_step=0.105, global_step=324.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:   7%|▋         | 90/1208 [02:56<36:30,  1.96s/it, loss=0.184, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000355, train/loss_step=0.105, global_step=324.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   7%|▋         | 90/1208 [02:56<36:30,  1.96s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.17e-5, train/loss_step=0.00192, global_step=324.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   8%|▊         | 91/1208 [02:57<36:17,  1.95s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.17e-5, train/loss_step=0.00192, global_step=324.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   8%|▊         | 91/1208 [02:57<36:17,  1.95s/it, loss=0.167, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000399, train/loss_step=0.121, global_step=324.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:   8%|▊         | 92/1208 [03:00<36:32,  1.96s/it, loss=0.167, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000399, train/loss_step=0.121, global_step=324.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   8%|▊         | 92/1208 [03:00<36:32,  1.96s/it, loss=0.171, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000598, train/loss_step=0.176, global_step=324.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   8%|▊         | 93/1208 [03:01<36:20,  1.96s/it, loss=0.171, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000598, train/loss_step=0.176, global_step=324.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   8%|▊         | 93/1208 [03:01<36:20,  1.96s/it, loss=0.197, v_num=0, train/loss_simple_step=0.577, train/loss_vlb_step=0.0116, train/loss_step=0.577, global_step=325.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:   8%|▊         | 94/1208 [03:02<36:07,  1.95s/it, loss=0.197, v_num=0, train/loss_simple_step=0.577, train/loss_vlb_step=0.0116, train/loss_step=0.577, global_step=325.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   8%|▊         | 94/1208 [03:02<36:07,  1.95s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000162, train/loss_step=0.0445, global_step=325.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   8%|▊         | 95/1208 [03:03<35:55,  1.94s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000162, train/loss_step=0.0445, global_step=325.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   8%|▊         | 95/1208 [03:03<35:55,  1.94s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000106, train/loss_step=0.0265, global_step=325.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:   8%|▊         | 96/1208 [03:07<36:09,  1.95s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000106, train/loss_step=0.0265, global_step=325.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   8%|▊         | 96/1208 [03:07<36:09,  1.95s/it, loss=0.211, v_num=0, train/loss_simple_step=0.624, train/loss_vlb_step=0.0219, train/loss_step=0.624, global_step=325.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:   8%|▊         | 97/1208 [03:08<35:57,  1.94s/it, loss=0.211, v_num=0, train/loss_simple_step=0.624, train/loss_vlb_step=0.0219, train/loss_step=0.624, global_step=325.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   8%|▊         | 97/1208 [03:08<35:57,  1.94s/it, loss=0.215, v_num=0, train/loss_simple_step=0.094, train/loss_vlb_step=0.000309, train/loss_step=0.094, global_step=326.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   8%|▊         | 98/1208 [03:09<35:45,  1.93s/it, loss=0.215, v_num=0, train/loss_simple_step=0.094, train/loss_vlb_step=0.000309, train/loss_step=0.094, global_step=326.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   8%|▊         | 98/1208 [03:09<35:45,  1.93s/it, loss=0.209, v_num=0, train/loss_simple_step=0.0534, train/loss_vlb_step=0.000192, train/loss_step=0.0534, global_step=326.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   8%|▊         | 99/1208 [03:10<35:33,  1.92s/it, loss=0.209, v_num=0, train/loss_simple_step=0.0534, train/loss_vlb_step=0.000192, train/loss_step=0.0534, global_step=326.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   8%|▊         | 99/1208 [03:10<35:33,  1.92s/it, loss=0.184, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000885, train/loss_step=0.225, global_step=326.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:   8%|▊         | 100/1208 [03:13<35:46,  1.94s/it, loss=0.184, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000885, train/loss_step=0.225, global_step=326.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   8%|▊         | 100/1208 [03:13<35:46,  1.94s/it, loss=0.217, v_num=0, train/loss_simple_step=0.796, train/loss_vlb_step=0.0583, train/loss_step=0.796, global_step=326.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:   8%|▊         | 101/1208 [03:14<35:35,  1.93s/it, loss=0.217, v_num=0, train/loss_simple_step=0.796, train/loss_vlb_step=0.0583, train/loss_step=0.796, global_step=326.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   8%|▊         | 101/1208 [03:14<35:35,  1.93s/it, loss=0.243, v_num=0, train/loss_simple_step=0.544, train/loss_vlb_step=0.00622, train/loss_step=0.544, global_step=327.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   8%|▊         | 102/1208 [03:15<35:24,  1.92s/it, loss=0.243, v_num=0, train/loss_simple_step=0.544, train/loss_vlb_step=0.00622, train/loss_step=0.544, global_step=327.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   8%|▊         | 102/1208 [03:15<35:24,  1.92s/it, loss=0.241, v_num=0, train/loss_simple_step=0.00279, train/loss_vlb_step=1.63e-5, train/loss_step=0.00279, global_step=327.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   9%|▊         | 103/1208 [03:16<35:12,  1.91s/it, loss=0.241, v_num=0, train/loss_simple_step=0.00279, train/loss_vlb_step=1.63e-5, train/loss_step=0.00279, global_step=327.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   9%|▊         | 103/1208 [03:16<35:12,  1.91s/it, loss=0.204, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.6e-5, train/loss_step=0.0151, global_step=327.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:   9%|▊         | 104/1208 [03:20<35:24,  1.92s/it, loss=0.204, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.6e-5, train/loss_step=0.0151, global_step=327.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   9%|▊         | 104/1208 [03:20<35:24,  1.92s/it, loss=0.203, v_num=0, train/loss_simple_step=0.00474, train/loss_vlb_step=2.63e-5, train/loss_step=0.00474, global_step=327.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   9%|▊         | 105/1208 [03:21<35:13,  1.92s/it, loss=0.203, v_num=0, train/loss_simple_step=0.00474, train/loss_vlb_step=2.63e-5, train/loss_step=0.00474, global_step=327.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   9%|▊         | 105/1208 [03:21<35:13,  1.92s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.000139, train/loss_step=0.0359, global_step=328.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:   9%|▉         | 106/1208 [03:22<35:03,  1.91s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.000139, train/loss_step=0.0359, global_step=328.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   9%|▉         | 106/1208 [03:22<35:03,  1.91s/it, loss=0.193, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000618, train/loss_step=0.181, global_step=328.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:   9%|▉         | 107/1208 [03:23<34:53,  1.90s/it, loss=0.193, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000618, train/loss_step=0.181, global_step=328.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   9%|▉         | 107/1208 [03:23<34:53,  1.90s/it, loss=0.192, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.00045, train/loss_step=0.137, global_step=328.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:   9%|▉         | 108/1208 [03:26<35:04,  1.91s/it, loss=0.192, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.00045, train/loss_step=0.137, global_step=328.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   9%|▉         | 108/1208 [03:26<35:04,  1.91s/it, loss=0.211, v_num=0, train/loss_simple_step=0.455, train/loss_vlb_step=0.00366, train/loss_step=0.455, global_step=328.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   9%|▉         | 109/1208 [03:27<34:53,  1.91s/it, loss=0.211, v_num=0, train/loss_simple_step=0.455, train/loss_vlb_step=0.00366, train/loss_step=0.455, global_step=328.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   9%|▉         | 109/1208 [03:27<34:53,  1.91s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0797, train/loss_vlb_step=0.000272, train/loss_step=0.0797, global_step=329.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   9%|▉         | 110/1208 [03:28<34:43,  1.90s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0797, train/loss_vlb_step=0.000272, train/loss_step=0.0797, global_step=329.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   9%|▉         | 110/1208 [03:28<34:43,  1.90s/it, loss=0.21, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.71e-5, train/loss_step=0.003, global_step=329.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:   9%|▉         | 111/1208 [03:29<34:33,  1.89s/it, loss=0.21, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.71e-5, train/loss_step=0.003, global_step=329.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   9%|▉         | 111/1208 [03:29<34:33,  1.89s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000102, train/loss_step=0.0258, global_step=329.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   9%|▉         | 112/1208 [03:33<34:44,  1.90s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000102, train/loss_step=0.0258, global_step=329.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   9%|▉         | 112/1208 [03:33<34:44,  1.90s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.25e-5, train/loss_step=0.0194, global_step=329.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:   9%|▉         | 113/1208 [03:34<34:34,  1.89s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.25e-5, train/loss_step=0.0194, global_step=329.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   9%|▉         | 113/1208 [03:34<34:34,  1.89s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.74e-5, train/loss_step=0.0185, global_step=330.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   9%|▉         | 114/1208 [03:35<34:24,  1.89s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.74e-5, train/loss_step=0.0185, global_step=330.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:   9%|▉         | 114/1208 [03:35<34:24,  1.89s/it, loss=0.18, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00102, train/loss_step=0.264, global_step=330.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  10%|▉         | 115/1208 [03:36<34:15,  1.88s/it, loss=0.18, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00102, train/loss_step=0.264, global_step=330.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  10%|▉         | 115/1208 [03:36<34:15,  1.88s/it, loss=0.191, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.00094, train/loss_step=0.246, global_step=330.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  10%|▉         | 116/1208 [03:39<34:26,  1.89s/it, loss=0.191, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.00094, train/loss_step=0.246, global_step=330.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  10%|▉         | 116/1208 [03:39<34:26,  1.89s/it, loss=0.175, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00129, train/loss_step=0.302, global_step=330.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  10%|▉         | 117/1208 [03:40<34:16,  1.89s/it, loss=0.175, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00129, train/loss_step=0.302, global_step=330.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  10%|▉         | 117/1208 [03:40<34:16,  1.89s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.45e-5, train/loss_step=0.0118, global_step=331.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  10%|▉         | 118/1208 [03:41<34:07,  1.88s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.45e-5, train/loss_step=0.0118, global_step=331.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  10%|▉         | 118/1208 [03:41<34:07,  1.88s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=9.99e-5, train/loss_step=0.0251, global_step=331.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  10%|▉         | 119/1208 [03:42<33:57,  1.87s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=9.99e-5, train/loss_step=0.0251, global_step=331.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  10%|▉         | 119/1208 [03:42<33:57,  1.87s/it, loss=0.175, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00175, train/loss_step=0.324, global_step=331.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  10%|▉         | 120/1208 [03:45<34:08,  1.88s/it, loss=0.175, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00175, train/loss_step=0.324, global_step=331.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  10%|▉         | 120/1208 [03:45<34:08,  1.88s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=1.14e-5, train/loss_step=0.00196, global_step=331.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  10%|█         | 121/1208 [03:47<33:59,  1.88s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=1.14e-5, train/loss_step=0.00196, global_step=331.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  10%|█         | 121/1208 [03:47<33:59,  1.88s/it, loss=0.115, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000516, train/loss_step=0.149, global_step=332.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  10%|█         | 122/1208 [03:48<33:50,  1.87s/it, loss=0.115, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000516, train/loss_step=0.149, global_step=332.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  10%|█         | 122/1208 [03:48<33:50,  1.87s/it, loss=0.124, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000573, train/loss_step=0.172, global_step=332.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  10%|█         | 123/1208 [03:49<33:41,  1.86s/it, loss=0.124, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000573, train/loss_step=0.172, global_step=332.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  10%|█         | 123/1208 [03:49<33:41,  1.86s/it, loss=0.141, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00205, train/loss_step=0.353, global_step=332.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  10%|█         | 124/1208 [03:52<33:51,  1.87s/it, loss=0.141, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00205, train/loss_step=0.353, global_step=332.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  10%|█         | 124/1208 [03:52<33:51,  1.87s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00875, train/loss_vlb_step=4.23e-5, train/loss_step=0.00875, global_step=332.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  10%|█         | 125/1208 [03:53<33:42,  1.87s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00875, train/loss_vlb_step=4.23e-5, train/loss_step=0.00875, global_step=332.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  10%|█         | 125/1208 [03:53<33:42,  1.87s/it, loss=0.147, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000558, train/loss_step=0.166, global_step=333.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  10%|█         | 126/1208 [03:54<33:33,  1.86s/it, loss=0.147, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000558, train/loss_step=0.166, global_step=333.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  10%|█         | 126/1208 [03:54<33:33,  1.86s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0868, train/loss_vlb_step=0.000294, train/loss_step=0.0868, global_step=333.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  11%|█         | 127/1208 [03:55<33:24,  1.85s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0868, train/loss_vlb_step=0.000294, train/loss_step=0.0868, global_step=333.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  11%|█         | 127/1208 [03:55<33:24,  1.85s/it, loss=0.145, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000661, train/loss_step=0.192, global_step=333.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  11%|█         | 128/1208 [03:58<33:34,  1.87s/it, loss=0.145, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000661, train/loss_step=0.192, global_step=333.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  11%|█         | 128/1208 [03:58<33:34,  1.87s/it, loss=0.125, v_num=0, train/loss_simple_step=0.055, train/loss_vlb_step=0.000195, train/loss_step=0.055, global_step=333.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  11%|█         | 129/1208 [03:59<33:26,  1.86s/it, loss=0.125, v_num=0, train/loss_simple_step=0.055, train/loss_vlb_step=0.000195, train/loss_step=0.055, global_step=333.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  11%|█         | 129/1208 [03:59<33:26,  1.86s/it, loss=0.146, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00418, train/loss_step=0.499, global_step=334.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  11%|█         | 130/1208 [04:00<33:18,  1.85s/it, loss=0.146, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00418, train/loss_step=0.499, global_step=334.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  11%|█         | 130/1208 [04:00<33:18,  1.85s/it, loss=0.166, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00274, train/loss_step=0.408, global_step=334.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  11%|█         | 131/1208 [04:01<33:09,  1.85s/it, loss=0.166, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00274, train/loss_step=0.408, global_step=334.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  11%|█         | 131/1208 [04:01<33:09,  1.85s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00918, train/loss_vlb_step=4.42e-5, train/loss_step=0.00918, global_step=334.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  11%|█         | 132/1208 [04:05<33:18,  1.86s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00918, train/loss_vlb_step=4.42e-5, train/loss_step=0.00918, global_step=334.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  11%|█         | 132/1208 [04:05<33:18,  1.86s/it, loss=0.173, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000602, train/loss_step=0.173, global_step=334.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  11%|█         | 133/1208 [04:06<33:10,  1.85s/it, loss=0.173, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000602, train/loss_step=0.173, global_step=334.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  11%|█         | 133/1208 [04:06<33:10,  1.85s/it, loss=0.179, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000443, train/loss_step=0.134, global_step=335.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  11%|█         | 134/1208 [04:07<33:02,  1.85s/it, loss=0.179, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000443, train/loss_step=0.134, global_step=335.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  11%|█         | 134/1208 [04:07<33:02,  1.85s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.84e-5, train/loss_step=0.0101, global_step=335.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  11%|█         | 135/1208 [04:08<32:53,  1.84s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.84e-5, train/loss_step=0.0101, global_step=335.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  11%|█         | 135/1208 [04:08<32:53,  1.84s/it, loss=0.163, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000647, train/loss_step=0.185, global_step=335.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  11%|█▏        | 136/1208 [04:11<33:03,  1.85s/it, loss=0.163, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000647, train/loss_step=0.185, global_step=335.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  11%|█▏        | 136/1208 [04:11<33:03,  1.85s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0883, train/loss_vlb_step=0.00029, train/loss_step=0.0883, global_step=335.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  11%|█▏        | 137/1208 [04:12<32:55,  1.84s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0883, train/loss_vlb_step=0.00029, train/loss_step=0.0883, global_step=335.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  11%|█▏        | 137/1208 [04:12<32:55,  1.84s/it, loss=0.166, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00158, train/loss_step=0.288, global_step=336.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  11%|█▏        | 138/1208 [04:13<32:47,  1.84s/it, loss=0.166, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00158, train/loss_step=0.288, global_step=336.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  11%|█▏        | 138/1208 [04:13<32:47,  1.84s/it, loss=0.171, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000363, train/loss_step=0.110, global_step=336.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  12%|█▏        | 139/1208 [04:14<32:39,  1.83s/it, loss=0.171, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000363, train/loss_step=0.110, global_step=336.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  12%|█▏        | 139/1208 [04:14<32:39,  1.83s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000128, train/loss_step=0.0333, global_step=336.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  12%|█▏        | 140/1208 [04:18<32:48,  1.84s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000128, train/loss_step=0.0333, global_step=336.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  12%|█▏        | 140/1208 [04:18<32:48,  1.84s/it, loss=0.177, v_num=0, train/loss_simple_step=0.419, train/loss_vlb_step=0.0039, train/loss_step=0.419, global_step=336.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  12%|█▏        | 141/1208 [04:19<32:40,  1.84s/it, loss=0.177, v_num=0, train/loss_simple_step=0.419, train/loss_vlb_step=0.0039, train/loss_step=0.419, global_step=336.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  12%|█▏        | 141/1208 [04:19<32:40,  1.84s/it, loss=0.176, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000466, train/loss_step=0.138, global_step=337.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  12%|█▏        | 142/1208 [04:20<32:32,  1.83s/it, loss=0.176, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000466, train/loss_step=0.138, global_step=337.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  12%|█▏        | 142/1208 [04:20<32:33,  1.83s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.32e-5, train/loss_step=0.00216, global_step=337.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  12%|█▏        | 143/1208 [04:21<32:25,  1.83s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.32e-5, train/loss_step=0.00216, global_step=337.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  12%|█▏        | 143/1208 [04:21<32:25,  1.83s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.68e-5, train/loss_step=0.0181, global_step=337.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  12%|█▏        | 144/1208 [04:24<32:33,  1.84s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.68e-5, train/loss_step=0.0181, global_step=337.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  12%|█▏        | 144/1208 [04:24<32:33,  1.84s/it, loss=0.157, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000401, train/loss_step=0.121, global_step=337.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  12%|█▏        | 145/1208 [04:25<32:26,  1.83s/it, loss=0.157, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000401, train/loss_step=0.121, global_step=337.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  12%|█▏        | 145/1208 [04:25<32:26,  1.83s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0079, train/loss_vlb_step=3.66e-5, train/loss_step=0.0079, global_step=338.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  12%|█▏        | 146/1208 [04:26<32:19,  1.83s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0079, train/loss_vlb_step=3.66e-5, train/loss_step=0.0079, global_step=338.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  12%|█▏        | 146/1208 [04:26<32:19,  1.83s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.45e-5, train/loss_step=0.0173, global_step=338.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  12%|█▏        | 147/1208 [04:27<32:11,  1.82s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.45e-5, train/loss_step=0.0173, global_step=338.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  12%|█▏        | 147/1208 [04:27<32:11,  1.82s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.000153, train/loss_step=0.0401, global_step=338.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  12%|█▏        | 148/1208 [04:30<32:20,  1.83s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.000153, train/loss_step=0.0401, global_step=338.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  12%|█▏        | 148/1208 [04:30<32:20,  1.83s/it, loss=0.142, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000484, train/loss_step=0.145, global_step=338.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  12%|█▏        | 149/1208 [04:31<32:13,  1.83s/it, loss=0.142, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000484, train/loss_step=0.145, global_step=338.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  12%|█▏        | 149/1208 [04:32<32:13,  1.83s/it, loss=0.136, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00228, train/loss_step=0.372, global_step=339.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  12%|█▏        | 150/1208 [04:33<32:05,  1.82s/it, loss=0.136, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00228, train/loss_step=0.372, global_step=339.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  12%|█▏        | 150/1208 [04:33<32:05,  1.82s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0941, train/loss_vlb_step=0.000309, train/loss_step=0.0941, global_step=339.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  12%|█▎        | 151/1208 [04:34<31:58,  1.82s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0941, train/loss_vlb_step=0.000309, train/loss_step=0.0941, global_step=339.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  12%|█▎        | 151/1208 [04:34<31:58,  1.82s/it, loss=0.14, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00226, train/loss_step=0.408, global_step=339.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  13%|█▎        | 152/1208 [04:37<32:07,  1.82s/it, loss=0.14, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00226, train/loss_step=0.408, global_step=339.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  13%|█▎        | 152/1208 [04:37<32:07,  1.82s/it, loss=0.138, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000451, train/loss_step=0.135, global_step=339.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  13%|█▎        | 153/1208 [04:38<32:00,  1.82s/it, loss=0.138, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000451, train/loss_step=0.135, global_step=339.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  13%|█▎        | 153/1208 [04:38<32:00,  1.82s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.00013, train/loss_step=0.0332, global_step=340.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  13%|█▎        | 154/1208 [04:39<31:53,  1.81s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.00013, train/loss_step=0.0332, global_step=340.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  13%|█▎        | 154/1208 [04:39<31:53,  1.82s/it, loss=0.143, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000712, train/loss_step=0.203, global_step=340.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  13%|█▎        | 155/1208 [04:40<31:45,  1.81s/it, loss=0.143, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000712, train/loss_step=0.203, global_step=340.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  13%|█▎        | 155/1208 [04:40<31:45,  1.81s/it, loss=0.165, v_num=0, train/loss_simple_step=0.634, train/loss_vlb_step=0.0222, train/loss_step=0.634, global_step=340.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  13%|█▎        | 156/1208 [04:43<31:54,  1.82s/it, loss=0.165, v_num=0, train/loss_simple_step=0.634, train/loss_vlb_step=0.0222, train/loss_step=0.634, global_step=340.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  13%|█▎        | 156/1208 [04:43<31:54,  1.82s/it, loss=0.176, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00147, train/loss_step=0.301, global_step=340.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  13%|█▎        | 157/1208 [04:45<31:47,  1.82s/it, loss=0.176, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00147, train/loss_step=0.301, global_step=340.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  13%|█▎        | 157/1208 [04:45<31:48,  1.82s/it, loss=0.179, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00191, train/loss_step=0.350, global_step=341.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  13%|█▎        | 158/1208 [04:46<31:40,  1.81s/it, loss=0.179, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00191, train/loss_step=0.350, global_step=341.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  13%|█▎        | 158/1208 [04:46<31:41,  1.81s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.000169, train/loss_step=0.0462, global_step=341.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  13%|█▎        | 159/1208 [04:47<31:34,  1.81s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.000169, train/loss_step=0.0462, global_step=341.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  13%|█▎        | 159/1208 [04:47<31:34,  1.81s/it, loss=0.186, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00087, train/loss_step=0.239, global_step=341.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  13%|█▎        | 160/1208 [04:50<31:41,  1.81s/it, loss=0.186, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00087, train/loss_step=0.239, global_step=341.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  13%|█▎        | 160/1208 [04:50<31:41,  1.81s/it, loss=0.191, v_num=0, train/loss_simple_step=0.519, train/loss_vlb_step=0.0044, train/loss_step=0.519, global_step=341.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  13%|█▎        | 161/1208 [04:51<31:35,  1.81s/it, loss=0.191, v_num=0, train/loss_simple_step=0.519, train/loss_vlb_step=0.0044, train/loss_step=0.519, global_step=341.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  13%|█▎        | 161/1208 [04:51<31:35,  1.81s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00881, train/loss_vlb_step=4.34e-5, train/loss_step=0.00881, global_step=342.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  13%|█▎        | 162/1208 [04:52<31:28,  1.81s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00881, train/loss_vlb_step=4.34e-5, train/loss_step=0.00881, global_step=342.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  13%|█▎        | 162/1208 [04:52<31:28,  1.81s/it, loss=0.197, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00104, train/loss_step=0.258, global_step=342.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  13%|█▎        | 163/1208 [04:53<31:21,  1.80s/it, loss=0.197, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00104, train/loss_step=0.258, global_step=342.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  13%|█▎        | 163/1208 [04:53<31:21,  1.80s/it, loss=0.207, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.00076, train/loss_step=0.213, global_step=342.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  14%|█▎        | 164/1208 [04:56<31:29,  1.81s/it, loss=0.207, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.00076, train/loss_step=0.213, global_step=342.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  14%|█▎        | 164/1208 [04:56<31:29,  1.81s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0073, train/loss_vlb_step=3.52e-5, train/loss_step=0.0073, global_step=342.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  14%|█▎        | 165/1208 [04:57<31:22,  1.81s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0073, train/loss_vlb_step=3.52e-5, train/loss_step=0.0073, global_step=342.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  14%|█▎        | 165/1208 [04:57<31:22,  1.81s/it, loss=0.219, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00213, train/loss_step=0.353, global_step=343.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  14%|█▎        | 166/1208 [04:58<31:16,  1.80s/it, loss=0.219, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00213, train/loss_step=0.353, global_step=343.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  14%|█▎        | 166/1208 [04:58<31:16,  1.80s/it, loss=0.219, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.54e-5, train/loss_step=0.0235, global_step=343.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  14%|█▍        | 167/1208 [04:59<31:09,  1.80s/it, loss=0.219, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.54e-5, train/loss_step=0.0235, global_step=343.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  14%|█▍        | 167/1208 [04:59<31:09,  1.80s/it, loss=0.23, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000986, train/loss_step=0.250, global_step=343.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  14%|█▍        | 168/1208 [05:03<31:17,  1.80s/it, loss=0.23, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000986, train/loss_step=0.250, global_step=343.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  14%|█▍        | 168/1208 [05:03<31:17,  1.80s/it, loss=0.223, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.39e-5, train/loss_step=0.0202, global_step=343.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  14%|█▍        | 169/1208 [05:04<31:10,  1.80s/it, loss=0.223, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.39e-5, train/loss_step=0.0202, global_step=343.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  14%|█▍        | 169/1208 [05:04<31:10,  1.80s/it, loss=0.205, v_num=0, train/loss_simple_step=0.00599, train/loss_vlb_step=3.11e-5, train/loss_step=0.00599, global_step=344.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  14%|█▍        | 170/1208 [05:05<31:04,  1.80s/it, loss=0.205, v_num=0, train/loss_simple_step=0.00599, train/loss_vlb_step=3.11e-5, train/loss_step=0.00599, global_step=344.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  14%|█▍        | 170/1208 [05:05<31:04,  1.80s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0035, train/loss_vlb_step=1.93e-5, train/loss_step=0.0035, global_step=344.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  14%|█▍        | 171/1208 [05:06<30:58,  1.79s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0035, train/loss_vlb_step=1.93e-5, train/loss_step=0.0035, global_step=344.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  14%|█▍        | 171/1208 [05:06<30:58,  1.79s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0535, train/loss_vlb_step=0.00019, train/loss_step=0.0535, global_step=344.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  14%|█▍        | 172/1208 [05:09<31:05,  1.80s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0535, train/loss_vlb_step=0.00019, train/loss_step=0.0535, global_step=344.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  14%|█▍        | 172/1208 [05:09<31:05,  1.80s/it, loss=0.193, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00225, train/loss_step=0.331, global_step=344.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  14%|█▍        | 173/1208 [05:10<30:58,  1.80s/it, loss=0.193, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00225, train/loss_step=0.331, global_step=344.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  14%|█▍        | 173/1208 [05:10<30:58,  1.80s/it, loss=0.208, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.0022, train/loss_step=0.346, global_step=345.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  14%|█▍        | 174/1208 [05:11<30:52,  1.79s/it, loss=0.208, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.0022, train/loss_step=0.346, global_step=345.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  14%|█▍        | 174/1208 [05:11<30:52,  1.79s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0592, train/loss_vlb_step=0.000201, train/loss_step=0.0592, global_step=345.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  14%|█▍        | 175/1208 [05:12<30:46,  1.79s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0592, train/loss_vlb_step=0.000201, train/loss_step=0.0592, global_step=345.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  14%|█▍        | 175/1208 [05:12<30:46,  1.79s/it, loss=0.19, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00578, train/loss_step=0.418, global_step=345.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  15%|█▍        | 176/1208 [05:16<30:53,  1.80s/it, loss=0.19, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00578, train/loss_step=0.418, global_step=345.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  15%|█▍        | 176/1208 [05:16<30:53,  1.80s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.23e-5, train/loss_step=0.0108, global_step=345.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  15%|█▍        | 177/1208 [05:17<30:47,  1.79s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.23e-5, train/loss_step=0.0108, global_step=345.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  15%|█▍        | 177/1208 [05:17<30:47,  1.79s/it, loss=0.169, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000782, train/loss_step=0.210, global_step=346.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  15%|█▍        | 178/1208 [05:18<30:41,  1.79s/it, loss=0.169, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000782, train/loss_step=0.210, global_step=346.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  15%|█▍        | 178/1208 [05:18<30:41,  1.79s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0909, train/loss_vlb_step=0.000299, train/loss_step=0.0909, global_step=346.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  15%|█▍        | 179/1208 [05:19<30:35,  1.78s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0909, train/loss_vlb_step=0.000299, train/loss_step=0.0909, global_step=346.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  15%|█▍        | 179/1208 [05:19<30:35,  1.78s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.000168, train/loss_step=0.0459, global_step=346.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  15%|█▍        | 180/1208 [05:22<30:41,  1.79s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.000168, train/loss_step=0.0459, global_step=346.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  15%|█▍        | 180/1208 [05:22<30:41,  1.79s/it, loss=0.148, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00104, train/loss_step=0.260, global_step=346.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  15%|█▍        | 181/1208 [05:23<30:35,  1.79s/it, loss=0.148, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00104, train/loss_step=0.260, global_step=346.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  15%|█▍        | 181/1208 [05:23<30:35,  1.79s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.78e-5, train/loss_step=0.0183, global_step=347.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  15%|█▌        | 182/1208 [05:24<30:29,  1.78s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.78e-5, train/loss_step=0.0183, global_step=347.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  15%|█▌        | 182/1208 [05:24<30:29,  1.78s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00532, train/loss_vlb_step=2.79e-5, train/loss_step=0.00532, global_step=347.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  15%|█▌        | 183/1208 [05:25<30:23,  1.78s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00532, train/loss_vlb_step=2.79e-5, train/loss_step=0.00532, global_step=347.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  15%|█▌        | 183/1208 [05:25<30:23,  1.78s/it, loss=0.151, v_num=0, train/loss_simple_step=0.503, train/loss_vlb_step=0.00585, train/loss_step=0.503, global_step=347.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  15%|█▌        | 184/1208 [05:28<30:30,  1.79s/it, loss=0.151, v_num=0, train/loss_simple_step=0.503, train/loss_vlb_step=0.00585, train/loss_step=0.503, global_step=347.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  15%|█▌        | 184/1208 [05:28<30:30,  1.79s/it, loss=0.168, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00196, train/loss_step=0.345, global_step=347.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  15%|█▌        | 185/1208 [05:29<30:24,  1.78s/it, loss=0.168, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00196, train/loss_step=0.345, global_step=347.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  15%|█▌        | 185/1208 [05:29<30:24,  1.78s/it, loss=0.154, v_num=0, train/loss_simple_step=0.080, train/loss_vlb_step=0.000268, train/loss_step=0.080, global_step=348.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  15%|█▌        | 186/1208 [05:31<30:18,  1.78s/it, loss=0.154, v_num=0, train/loss_simple_step=0.080, train/loss_vlb_step=0.000268, train/loss_step=0.080, global_step=348.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  15%|█▌        | 186/1208 [05:31<30:18,  1.78s/it, loss=0.171, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00203, train/loss_step=0.362, global_step=348.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  15%|█▌        | 187/1208 [05:32<30:13,  1.78s/it, loss=0.171, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00203, train/loss_step=0.362, global_step=348.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  15%|█▌        | 187/1208 [05:32<30:13,  1.78s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=2.14e-5, train/loss_step=0.00384, global_step=348.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  16%|█▌        | 188/1208 [05:35<30:19,  1.78s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=2.14e-5, train/loss_step=0.00384, global_step=348.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  16%|█▌        | 188/1208 [05:35<30:19,  1.78s/it, loss=0.16, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.00015, train/loss_step=0.042, global_step=348.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]     Epoch 1:  16%|█▌        | 189/1208 [05:36<30:13,  1.78s/it, loss=0.16, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.00015, train/loss_step=0.042, global_step=348.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  16%|█▌        | 189/1208 [05:36<30:13,  1.78s/it, loss=0.166, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000445, train/loss_step=0.134, global_step=349.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  16%|█▌        | 190/1208 [05:37<30:07,  1.78s/it, loss=0.166, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000445, train/loss_step=0.134, global_step=349.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  16%|█▌        | 190/1208 [05:37<30:07,  1.78s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0798, train/loss_vlb_step=0.000267, train/loss_step=0.0798, global_step=349.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  16%|█▌        | 191/1208 [05:38<30:02,  1.77s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0798, train/loss_vlb_step=0.000267, train/loss_step=0.0798, global_step=349.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  16%|█▌        | 191/1208 [05:38<30:02,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.83e-5, train/loss_step=0.0187, global_step=349.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  16%|█▌        | 192/1208 [05:41<30:08,  1.78s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.83e-5, train/loss_step=0.0187, global_step=349.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  16%|█▌        | 192/1208 [05:41<30:08,  1.78s/it, loss=0.158, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000449, train/loss_step=0.134, global_step=349.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  16%|█▌        | 193/1208 [05:42<30:02,  1.78s/it, loss=0.158, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000449, train/loss_step=0.134, global_step=349.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  16%|█▌        | 193/1208 [05:42<30:02,  1.78s/it, loss=0.17, v_num=0, train/loss_simple_step=0.569, train/loss_vlb_step=0.00822, train/loss_step=0.569, global_step=350.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  16%|█▌        | 194/1208 [05:43<29:57,  1.77s/it, loss=0.17, v_num=0, train/loss_simple_step=0.569, train/loss_vlb_step=0.00822, train/loss_step=0.569, global_step=350.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  16%|█▌        | 194/1208 [05:43<29:57,  1.77s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00514, train/loss_vlb_step=2.92e-5, train/loss_step=0.00514, global_step=350.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  16%|█▌        | 195/1208 [05:44<29:51,  1.77s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00514, train/loss_vlb_step=2.92e-5, train/loss_step=0.00514, global_step=350.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  16%|█▌        | 195/1208 [05:44<29:51,  1.77s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.27e-5, train/loss_step=0.0227, global_step=350.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  16%|█▌        | 196/1208 [05:48<29:57,  1.78s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.27e-5, train/loss_step=0.0227, global_step=350.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  16%|█▌        | 196/1208 [05:48<29:57,  1.78s/it, loss=0.169, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.00373, train/loss_step=0.450, global_step=350.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  16%|█▋        | 197/1208 [05:49<29:51,  1.77s/it, loss=0.169, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.00373, train/loss_step=0.450, global_step=350.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  16%|█▋        | 197/1208 [05:49<29:51,  1.77s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.14e-5, train/loss_step=0.0112, global_step=351.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  16%|█▋        | 198/1208 [05:50<29:46,  1.77s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.14e-5, train/loss_step=0.0112, global_step=351.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  16%|█▋        | 198/1208 [05:50<29:46,  1.77s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0924, train/loss_vlb_step=0.000306, train/loss_step=0.0924, global_step=351.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  16%|█▋        | 199/1208 [05:51<29:40,  1.77s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0924, train/loss_vlb_step=0.000306, train/loss_step=0.0924, global_step=351.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  16%|█▋        | 199/1208 [05:51<29:40,  1.77s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=2.51e-5, train/loss_step=0.00452, global_step=351.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  17%|█▋        | 200/1208 [05:54<29:46,  1.77s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=2.51e-5, train/loss_step=0.00452, global_step=351.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  17%|█▋        | 200/1208 [05:54<29:46,  1.77s/it, loss=0.147, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000177, train/loss_step=0.050, global_step=351.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  17%|█▋        | 201/1208 [05:55<29:41,  1.77s/it, loss=0.147, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000177, train/loss_step=0.050, global_step=351.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  17%|█▋        | 201/1208 [05:55<29:41,  1.77s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0875, train/loss_vlb_step=0.000291, train/loss_step=0.0875, global_step=352.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  17%|█▋        | 202/1208 [05:56<29:35,  1.77s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0875, train/loss_vlb_step=0.000291, train/loss_step=0.0875, global_step=352.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  17%|█▋        | 202/1208 [05:56<29:35,  1.77s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00532, train/loss_vlb_step=2.82e-5, train/loss_step=0.00532, global_step=352.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  17%|█▋        | 203/1208 [05:57<29:30,  1.76s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00532, train/loss_vlb_step=2.82e-5, train/loss_step=0.00532, global_step=352.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  17%|█▋        | 203/1208 [05:57<29:30,  1.76s/it, loss=0.142, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00173, train/loss_step=0.342, global_step=352.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  17%|█▋        | 204/1208 [06:00<29:35,  1.77s/it, loss=0.142, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00173, train/loss_step=0.342, global_step=352.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  17%|█▋        | 204/1208 [06:00<29:35,  1.77s/it, loss=0.126, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.000123, train/loss_step=0.034, global_step=352.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  17%|█▋        | 205/1208 [06:01<29:30,  1.77s/it, loss=0.126, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.000123, train/loss_step=0.034, global_step=352.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  17%|█▋        | 205/1208 [06:01<29:30,  1.77s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.87e-5, train/loss_step=0.0203, global_step=353.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  17%|█▋        | 206/1208 [06:02<29:25,  1.76s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.87e-5, train/loss_step=0.0203, global_step=353.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  17%|█▋        | 206/1208 [06:02<29:25,  1.76s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00439, train/loss_vlb_step=2.44e-5, train/loss_step=0.00439, global_step=353.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  17%|█▋        | 207/1208 [06:03<29:20,  1.76s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00439, train/loss_vlb_step=2.44e-5, train/loss_step=0.00439, global_step=353.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  17%|█▋        | 207/1208 [06:03<29:20,  1.76s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0928, train/loss_vlb_step=0.000307, train/loss_step=0.0928, global_step=353.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  17%|█▋        | 208/1208 [06:07<29:25,  1.77s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0928, train/loss_vlb_step=0.000307, train/loss_step=0.0928, global_step=353.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  17%|█▋        | 208/1208 [06:07<29:25,  1.77s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.27e-5, train/loss_step=0.0116, global_step=353.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  17%|█▋        | 209/1208 [06:08<29:20,  1.76s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.27e-5, train/loss_step=0.0116, global_step=353.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  17%|█▋        | 209/1208 [06:08<29:20,  1.76s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.73e-5, train/loss_step=0.00296, global_step=354.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  17%|█▋        | 210/1208 [06:09<29:15,  1.76s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.73e-5, train/loss_step=0.00296, global_step=354.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  17%|█▋        | 210/1208 [06:09<29:15,  1.76s/it, loss=0.108, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000698, train/loss_step=0.194, global_step=354.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  17%|█▋        | 211/1208 [06:10<29:10,  1.76s/it, loss=0.108, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000698, train/loss_step=0.194, global_step=354.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  17%|█▋        | 211/1208 [06:10<29:10,  1.76s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.75e-5, train/loss_step=0.00313, global_step=354.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  18%|█▊        | 212/1208 [06:13<29:15,  1.76s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.75e-5, train/loss_step=0.00313, global_step=354.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  18%|█▊        | 212/1208 [06:13<29:15,  1.76s/it, loss=0.106, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=354.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  18%|█▊        | 213/1208 [06:14<29:10,  1.76s/it, loss=0.106, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=354.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  18%|█▊        | 213/1208 [06:14<29:10,  1.76s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00201, train/loss_step=0.340, global_step=355.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  18%|█▊        | 214/1208 [06:15<29:05,  1.76s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00201, train/loss_step=0.340, global_step=355.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  18%|█▊        | 214/1208 [06:15<29:05,  1.76s/it, loss=0.106, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000891, train/loss_step=0.232, global_step=355.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  18%|█▊        | 215/1208 [06:16<29:00,  1.75s/it, loss=0.106, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000891, train/loss_step=0.232, global_step=355.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  18%|█▊        | 215/1208 [06:16<29:00,  1.75s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.31e-5, train/loss_step=0.0139, global_step=355.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  18%|█▊        | 216/1208 [06:20<29:06,  1.76s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.31e-5, train/loss_step=0.0139, global_step=355.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  18%|█▊        | 216/1208 [06:20<29:06,  1.76s/it, loss=0.1, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00236, train/loss_step=0.346, global_step=355.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  18%|█▊        | 217/1208 [06:21<29:01,  1.76s/it, loss=0.1, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00236, train/loss_step=0.346, global_step=355.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  18%|█▊        | 217/1208 [06:21<29:01,  1.76s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.000298, train/loss_step=0.0894, global_step=356.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  18%|█▊        | 218/1208 [06:22<28:56,  1.75s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.000298, train/loss_step=0.0894, global_step=356.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  18%|█▊        | 218/1208 [06:22<28:56,  1.75s/it, loss=0.108, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000588, train/loss_step=0.172, global_step=356.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  18%|█▊        | 219/1208 [06:23<28:51,  1.75s/it, loss=0.108, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000588, train/loss_step=0.172, global_step=356.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  18%|█▊        | 219/1208 [06:23<28:51,  1.75s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000162, train/loss_step=0.0445, global_step=356.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  18%|█▊        | 220/1208 [06:26<28:56,  1.76s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000162, train/loss_step=0.0445, global_step=356.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  18%|█▊        | 220/1208 [06:26<28:56,  1.76s/it, loss=0.115, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.00046, train/loss_step=0.137, global_step=356.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  18%|█▊        | 221/1208 [06:27<28:51,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.00046, train/loss_step=0.137, global_step=356.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  18%|█▊        | 221/1208 [06:27<28:51,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00848, train/loss_vlb_step=3.98e-5, train/loss_step=0.00848, global_step=357.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  18%|█▊        | 222/1208 [06:28<28:46,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00848, train/loss_vlb_step=3.98e-5, train/loss_step=0.00848, global_step=357.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  18%|█▊        | 222/1208 [06:28<28:46,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000102, train/loss_step=0.026, global_step=357.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  18%|█▊        | 223/1208 [06:29<28:42,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000102, train/loss_step=0.026, global_step=357.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  18%|█▊        | 223/1208 [06:29<28:42,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.481, train/loss_vlb_step=0.00651, train/loss_step=0.481, global_step=357.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  19%|█▊        | 224/1208 [06:33<28:47,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.481, train/loss_vlb_step=0.00651, train/loss_step=0.481, global_step=357.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  19%|█▊        | 224/1208 [06:33<28:47,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0408, train/loss_vlb_step=0.000153, train/loss_step=0.0408, global_step=357.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  19%|█▊        | 225/1208 [06:34<28:42,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0408, train/loss_vlb_step=0.000153, train/loss_step=0.0408, global_step=357.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  19%|█▊        | 225/1208 [06:34<28:42,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00302, train/loss_step=0.420, global_step=358.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  19%|█▊        | 226/1208 [06:35<28:37,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00302, train/loss_step=0.420, global_step=358.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  19%|█▊        | 226/1208 [06:35<28:37,  1.75s/it, loss=0.164, v_num=0, train/loss_simple_step=0.497, train/loss_vlb_step=0.00568, train/loss_step=0.497, global_step=358.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  19%|█▉        | 227/1208 [06:36<28:32,  1.75s/it, loss=0.164, v_num=0, train/loss_simple_step=0.497, train/loss_vlb_step=0.00568, train/loss_step=0.497, global_step=358.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  19%|█▉        | 227/1208 [06:36<28:32,  1.75s/it, loss=0.168, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000605, train/loss_step=0.174, global_step=358.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  19%|█▉        | 228/1208 [06:39<28:37,  1.75s/it, loss=0.168, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000605, train/loss_step=0.174, global_step=358.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  19%|█▉        | 228/1208 [06:39<28:37,  1.75s/it, loss=0.174, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000465, train/loss_step=0.142, global_step=358.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  19%|█▉        | 229/1208 [06:40<28:32,  1.75s/it, loss=0.174, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000465, train/loss_step=0.142, global_step=358.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  19%|█▉        | 229/1208 [06:40<28:32,  1.75s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=1.87e-5, train/loss_step=0.00325, global_step=359.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  19%|█▉        | 230/1208 [06:41<28:28,  1.75s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=1.87e-5, train/loss_step=0.00325, global_step=359.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  19%|█▉        | 230/1208 [06:41<28:28,  1.75s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00457, train/loss_vlb_step=2.47e-5, train/loss_step=0.00457, global_step=359.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  19%|█▉        | 231/1208 [06:42<28:23,  1.74s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00457, train/loss_vlb_step=2.47e-5, train/loss_step=0.00457, global_step=359.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  19%|█▉        | 231/1208 [06:42<28:23,  1.74s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.28e-5, train/loss_step=0.00216, global_step=359.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  19%|█▉        | 232/1208 [06:45<28:27,  1.75s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.28e-5, train/loss_step=0.00216, global_step=359.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  19%|█▉        | 232/1208 [06:45<28:27,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.057, train/loss_vlb_step=0.0002, train/loss_step=0.057, global_step=359.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]     Epoch 1:  19%|█▉        | 233/1208 [06:47<28:23,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.057, train/loss_vlb_step=0.0002, train/loss_step=0.057, global_step=359.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  19%|█▉        | 233/1208 [06:47<28:23,  1.75s/it, loss=0.147, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000153, train/loss_step=0.042, global_step=360.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  19%|█▉        | 234/1208 [06:48<28:18,  1.74s/it, loss=0.147, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000153, train/loss_step=0.042, global_step=360.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  19%|█▉        | 234/1208 [06:48<28:18,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.00075, train/loss_step=0.206, global_step=360.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  19%|█▉        | 235/1208 [06:49<28:13,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.00075, train/loss_step=0.206, global_step=360.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  19%|█▉        | 235/1208 [06:49<28:13,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.000123, train/loss_step=0.0312, global_step=360.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  20%|█▉        | 236/1208 [06:52<28:18,  1.75s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.000123, train/loss_step=0.0312, global_step=360.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  20%|█▉        | 236/1208 [06:52<28:18,  1.75s/it, loss=0.173, v_num=0, train/loss_simple_step=0.886, train/loss_vlb_step=0.224, train/loss_step=0.886, global_step=360.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]     Epoch 1:  20%|█▉        | 237/1208 [06:53<28:14,  1.74s/it, loss=0.173, v_num=0, train/loss_simple_step=0.886, train/loss_vlb_step=0.224, train/loss_step=0.886, global_step=360.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  20%|█▉        | 237/1208 [06:53<28:14,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=361.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  20%|█▉        | 238/1208 [06:54<28:09,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=361.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  20%|█▉        | 238/1208 [06:54<28:09,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000117, train/loss_step=0.0299, global_step=361.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  20%|█▉        | 239/1208 [06:55<28:04,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000117, train/loss_step=0.0299, global_step=361.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  20%|█▉        | 239/1208 [06:55<28:04,  1.74s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0572, train/loss_vlb_step=0.0002, train/loss_step=0.0572, global_step=361.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  20%|█▉        | 240/1208 [06:58<28:09,  1.75s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0572, train/loss_vlb_step=0.0002, train/loss_step=0.0572, global_step=361.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  20%|█▉        | 240/1208 [06:58<28:09,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.45e-5, train/loss_step=0.0114, global_step=361.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  20%|█▉        | 241/1208 [06:59<28:05,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.45e-5, train/loss_step=0.0114, global_step=361.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  20%|█▉        | 241/1208 [06:59<28:05,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0956, train/loss_vlb_step=0.000314, train/loss_step=0.0956, global_step=362.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  20%|██        | 242/1208 [07:01<28:00,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0956, train/loss_vlb_step=0.000314, train/loss_step=0.0956, global_step=362.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  20%|██        | 242/1208 [07:01<28:00,  1.74s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00996, train/loss_vlb_step=4.91e-5, train/loss_step=0.00996, global_step=362.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  20%|██        | 243/1208 [07:02<27:56,  1.74s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00996, train/loss_vlb_step=4.91e-5, train/loss_step=0.00996, global_step=362.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  20%|██        | 243/1208 [07:02<27:56,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000754, train/loss_step=0.213, global_step=362.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  20%|██        | 244/1208 [07:05<28:00,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000754, train/loss_step=0.213, global_step=362.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  20%|██        | 244/1208 [07:05<28:00,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00455, train/loss_step=0.476, global_step=362.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  20%|██        | 245/1208 [07:06<27:55,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00455, train/loss_step=0.476, global_step=362.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  20%|██        | 245/1208 [07:06<27:55,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0341, train/loss_vlb_step=0.000134, train/loss_step=0.0341, global_step=363.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  20%|██        | 246/1208 [07:07<27:51,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0341, train/loss_vlb_step=0.000134, train/loss_step=0.0341, global_step=363.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  20%|██        | 246/1208 [07:07<27:51,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000846, train/loss_step=0.229, global_step=363.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  20%|██        | 247/1208 [07:08<27:46,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000846, train/loss_step=0.229, global_step=363.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  20%|██        | 247/1208 [07:08<27:46,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00115, train/loss_step=0.270, global_step=363.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  21%|██        | 248/1208 [07:11<27:51,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00115, train/loss_step=0.270, global_step=363.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  21%|██        | 248/1208 [07:11<27:51,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0677, train/loss_vlb_step=0.000235, train/loss_step=0.0677, global_step=363.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  21%|██        | 249/1208 [07:12<27:46,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0677, train/loss_vlb_step=0.000235, train/loss_step=0.0677, global_step=363.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  21%|██        | 249/1208 [07:12<27:46,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0874, train/loss_vlb_step=0.000297, train/loss_step=0.0874, global_step=364.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  21%|██        | 250/1208 [07:13<27:42,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0874, train/loss_vlb_step=0.000297, train/loss_step=0.0874, global_step=364.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  21%|██        | 250/1208 [07:13<27:42,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.00041, train/loss_step=0.124, global_step=364.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  21%|██        | 251/1208 [07:14<27:37,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.00041, train/loss_step=0.124, global_step=364.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  21%|██        | 251/1208 [07:14<27:37,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000159, train/loss_step=0.0443, global_step=364.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  21%|██        | 252/1208 [07:18<27:41,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000159, train/loss_step=0.0443, global_step=364.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  21%|██        | 252/1208 [07:18<27:41,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.28e-5, train/loss_step=0.0021, global_step=364.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  21%|██        | 253/1208 [07:19<27:37,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.28e-5, train/loss_step=0.0021, global_step=364.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  21%|██        | 253/1208 [07:19<27:37,  1.74s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.2e-5, train/loss_step=0.00394, global_step=365.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  21%|██        | 254/1208 [07:20<27:33,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.2e-5, train/loss_step=0.00394, global_step=365.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  21%|██        | 254/1208 [07:20<27:33,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.0001, train/loss_step=0.0258, global_step=365.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  21%|██        | 255/1208 [07:21<27:29,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.0001, train/loss_step=0.0258, global_step=365.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  21%|██        | 255/1208 [07:21<27:29,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.000194, train/loss_step=0.0537, global_step=365.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  21%|██        | 256/1208 [07:24<27:32,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.000194, train/loss_step=0.0537, global_step=365.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  21%|██        | 256/1208 [07:24<27:32,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.539, train/loss_vlb_step=0.00523, train/loss_step=0.539, global_step=365.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  21%|██▏       | 257/1208 [07:25<27:28,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.539, train/loss_vlb_step=0.00523, train/loss_step=0.539, global_step=365.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  21%|██▏       | 257/1208 [07:25<27:28,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00455, train/loss_vlb_step=2.47e-5, train/loss_step=0.00455, global_step=366.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  21%|██▏       | 258/1208 [07:26<27:24,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00455, train/loss_vlb_step=2.47e-5, train/loss_step=0.00455, global_step=366.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  21%|██▏       | 258/1208 [07:26<27:24,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000105, train/loss_step=0.0258, global_step=366.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  21%|██▏       | 259/1208 [07:27<27:20,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000105, train/loss_step=0.0258, global_step=366.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  21%|██▏       | 259/1208 [07:27<27:20,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000178, train/loss_step=0.050, global_step=366.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  22%|██▏       | 260/1208 [07:30<27:24,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000178, train/loss_step=0.050, global_step=366.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  22%|██▏       | 260/1208 [07:30<27:24,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.09e-5, train/loss_step=0.0113, global_step=366.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  22%|██▏       | 261/1208 [07:31<27:19,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.09e-5, train/loss_step=0.0113, global_step=366.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  22%|██▏       | 261/1208 [07:31<27:19,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000543, train/loss_step=0.158, global_step=367.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  22%|██▏       | 262/1208 [07:33<27:15,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000543, train/loss_step=0.158, global_step=367.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  22%|██▏       | 262/1208 [07:33<27:15,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.88e-5, train/loss_step=0.0216, global_step=367.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  22%|██▏       | 263/1208 [07:34<27:11,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.88e-5, train/loss_step=0.0216, global_step=367.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  22%|██▏       | 263/1208 [07:34<27:11,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000967, train/loss_step=0.234, global_step=367.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  22%|██▏       | 264/1208 [07:37<27:15,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000967, train/loss_step=0.234, global_step=367.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  22%|██▏       | 264/1208 [07:37<27:15,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.762, train/loss_vlb_step=0.0558, train/loss_step=0.762, global_step=367.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  22%|██▏       | 265/1208 [07:38<27:11,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.762, train/loss_vlb_step=0.0558, train/loss_step=0.762, global_step=367.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  22%|██▏       | 265/1208 [07:38<27:11,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000122, train/loss_step=0.0306, global_step=368.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  22%|██▏       | 266/1208 [07:39<27:07,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000122, train/loss_step=0.0306, global_step=368.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  22%|██▏       | 266/1208 [07:39<27:07,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000806, train/loss_step=0.215, global_step=368.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  22%|██▏       | 267/1208 [07:40<27:03,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000806, train/loss_step=0.215, global_step=368.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  22%|██▏       | 267/1208 [07:40<27:03,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000537, train/loss_step=0.160, global_step=368.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  22%|██▏       | 268/1208 [07:43<27:06,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000537, train/loss_step=0.160, global_step=368.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  22%|██▏       | 268/1208 [07:43<27:06,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000442, train/loss_step=0.132, global_step=368.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  22%|██▏       | 269/1208 [07:44<27:02,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000442, train/loss_step=0.132, global_step=368.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  22%|██▏       | 269/1208 [07:44<27:02,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.455, train/loss_vlb_step=0.00314, train/loss_step=0.455, global_step=369.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  22%|██▏       | 270/1208 [07:45<26:58,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.455, train/loss_vlb_step=0.00314, train/loss_step=0.455, global_step=369.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  22%|██▏       | 270/1208 [07:45<26:58,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0996, train/loss_vlb_step=0.000328, train/loss_step=0.0996, global_step=369.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  22%|██▏       | 271/1208 [07:47<26:54,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0996, train/loss_vlb_step=0.000328, train/loss_step=0.0996, global_step=369.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  22%|██▏       | 271/1208 [07:47<26:54,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=369.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  23%|██▎       | 272/1208 [07:50<26:58,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=369.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  23%|██▎       | 272/1208 [07:50<26:58,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.00074, train/loss_step=0.206, global_step=369.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  23%|██▎       | 273/1208 [07:51<26:54,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.00074, train/loss_step=0.206, global_step=369.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  23%|██▎       | 273/1208 [07:51<26:54,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0781, train/loss_vlb_step=0.000266, train/loss_step=0.0781, global_step=370.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  23%|██▎       | 274/1208 [07:52<26:50,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0781, train/loss_vlb_step=0.000266, train/loss_step=0.0781, global_step=370.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  23%|██▎       | 274/1208 [07:52<26:50,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.00066, train/loss_step=0.192, global_step=370.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  23%|██▎       | 275/1208 [07:53<26:46,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.00066, train/loss_step=0.192, global_step=370.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  23%|██▎       | 275/1208 [07:53<26:46,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0528, train/loss_vlb_step=0.000185, train/loss_step=0.0528, global_step=370.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  23%|██▎       | 276/1208 [07:56<26:49,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0528, train/loss_vlb_step=0.000185, train/loss_step=0.0528, global_step=370.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  23%|██▎       | 276/1208 [07:56<26:49,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.00302, train/loss_step=0.417, global_step=370.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  23%|██▎       | 277/1208 [07:57<26:46,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.00302, train/loss_step=0.417, global_step=370.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  23%|██▎       | 277/1208 [07:57<26:46,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00105, train/loss_step=0.264, global_step=371.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  23%|██▎       | 278/1208 [07:58<26:42,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00105, train/loss_step=0.264, global_step=371.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  23%|██▎       | 278/1208 [07:58<26:42,  1.72s/it, loss=0.209, v_num=0, train/loss_simple_step=0.534, train/loss_vlb_step=0.013, train/loss_step=0.534, global_step=371.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  23%|██▎       | 279/1208 [07:59<26:38,  1.72s/it, loss=0.209, v_num=0, train/loss_simple_step=0.534, train/loss_vlb_step=0.013, train/loss_step=0.534, global_step=371.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  23%|██▎       | 279/1208 [07:59<26:38,  1.72s/it, loss=0.216, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000699, train/loss_step=0.193, global_step=371.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  23%|██▎       | 280/1208 [08:03<26:41,  1.73s/it, loss=0.216, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000699, train/loss_step=0.193, global_step=371.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  23%|██▎       | 280/1208 [08:03<26:41,  1.73s/it, loss=0.225, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000702, train/loss_step=0.195, global_step=371.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  23%|██▎       | 281/1208 [08:04<26:37,  1.72s/it, loss=0.225, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000702, train/loss_step=0.195, global_step=371.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  23%|██▎       | 281/1208 [08:04<26:37,  1.72s/it, loss=0.221, v_num=0, train/loss_simple_step=0.0693, train/loss_vlb_step=0.000239, train/loss_step=0.0693, global_step=372.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  23%|██▎       | 282/1208 [08:05<26:33,  1.72s/it, loss=0.221, v_num=0, train/loss_simple_step=0.0693, train/loss_vlb_step=0.000239, train/loss_step=0.0693, global_step=372.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  23%|██▎       | 282/1208 [08:05<26:33,  1.72s/it, loss=0.233, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00117, train/loss_step=0.272, global_step=372.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  23%|██▎       | 283/1208 [08:06<26:29,  1.72s/it, loss=0.233, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00117, train/loss_step=0.272, global_step=372.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  23%|██▎       | 283/1208 [08:06<26:29,  1.72s/it, loss=0.222, v_num=0, train/loss_simple_step=0.00978, train/loss_vlb_step=4.82e-5, train/loss_step=0.00978, global_step=372.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  24%|██▎       | 284/1208 [08:09<26:32,  1.72s/it, loss=0.222, v_num=0, train/loss_simple_step=0.00978, train/loss_vlb_step=4.82e-5, train/loss_step=0.00978, global_step=372.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  24%|██▎       | 284/1208 [08:09<26:32,  1.72s/it, loss=0.196, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.00101, train/loss_step=0.241, global_step=372.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  24%|██▎       | 285/1208 [08:10<26:28,  1.72s/it, loss=0.196, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.00101, train/loss_step=0.241, global_step=372.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  24%|██▎       | 285/1208 [08:10<26:28,  1.72s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00425, train/loss_vlb_step=2.32e-5, train/loss_step=0.00425, global_step=373.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  24%|██▎       | 286/1208 [08:11<26:24,  1.72s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00425, train/loss_vlb_step=2.32e-5, train/loss_step=0.00425, global_step=373.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  24%|██▎       | 286/1208 [08:11<26:24,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00735, train/loss_vlb_step=3.67e-5, train/loss_step=0.00735, global_step=373.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  24%|██▍       | 287/1208 [08:12<26:21,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00735, train/loss_vlb_step=3.67e-5, train/loss_step=0.00735, global_step=373.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  24%|██▍       | 287/1208 [08:12<26:21,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.24e-5, train/loss_step=0.0196, global_step=373.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  24%|██▍       | 288/1208 [08:15<26:24,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.24e-5, train/loss_step=0.0196, global_step=373.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  24%|██▍       | 288/1208 [08:15<26:24,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=373.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  24%|██▍       | 289/1208 [08:16<26:20,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=373.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  24%|██▍       | 289/1208 [08:16<26:20,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=374.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  24%|██▍       | 290/1208 [08:18<26:16,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=374.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  24%|██▍       | 290/1208 [08:18<26:16,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.603, train/loss_vlb_step=0.0104, train/loss_step=0.603, global_step=374.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  24%|██▍       | 291/1208 [08:19<26:12,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.603, train/loss_vlb_step=0.0104, train/loss_step=0.603, global_step=374.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  24%|██▍       | 291/1208 [08:19<26:12,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0643, train/loss_vlb_step=0.000213, train/loss_step=0.0643, global_step=374.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  24%|██▍       | 292/1208 [08:22<26:15,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0643, train/loss_vlb_step=0.000213, train/loss_step=0.0643, global_step=374.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  24%|██▍       | 292/1208 [08:22<26:15,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000143, train/loss_step=0.0367, global_step=374.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  24%|██▍       | 293/1208 [08:23<26:12,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000143, train/loss_step=0.0367, global_step=374.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  24%|██▍       | 293/1208 [08:23<26:12,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000747, train/loss_step=0.225, global_step=375.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  24%|██▍       | 294/1208 [08:24<26:08,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000747, train/loss_step=0.225, global_step=375.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  24%|██▍       | 294/1208 [08:24<26:08,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000691, train/loss_step=0.191, global_step=375.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  24%|██▍       | 295/1208 [08:25<26:04,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000691, train/loss_step=0.191, global_step=375.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  24%|██▍       | 295/1208 [08:25<26:04,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0772, train/loss_vlb_step=0.000258, train/loss_step=0.0772, global_step=375.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  25%|██▍       | 296/1208 [08:28<26:07,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0772, train/loss_vlb_step=0.000258, train/loss_step=0.0772, global_step=375.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  25%|██▍       | 296/1208 [08:28<26:07,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0044, train/loss_vlb_step=2.31e-5, train/loss_step=0.0044, global_step=375.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  25%|██▍       | 297/1208 [08:29<26:04,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0044, train/loss_vlb_step=2.31e-5, train/loss_step=0.0044, global_step=375.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  25%|██▍       | 297/1208 [08:29<26:04,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.00044, train/loss_step=0.133, global_step=376.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  25%|██▍       | 298/1208 [08:30<26:00,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.00044, train/loss_step=0.133, global_step=376.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  25%|██▍       | 298/1208 [08:30<26:00,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.21e-5, train/loss_step=0.014, global_step=376.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  25%|██▍       | 299/1208 [08:32<25:56,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.21e-5, train/loss_step=0.014, global_step=376.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  25%|██▍       | 299/1208 [08:32<25:56,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0655, train/loss_vlb_step=0.000222, train/loss_step=0.0655, global_step=376.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  25%|██▍       | 300/1208 [08:35<25:59,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0655, train/loss_vlb_step=0.000222, train/loss_step=0.0655, global_step=376.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  25%|██▍       | 300/1208 [08:35<25:59,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.00035, train/loss_step=0.106, global_step=376.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.74it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.80it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.75it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.76it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.76it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.76it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.76it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.76it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.76it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.76it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.76it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.77it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.79it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:08,  1.75it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.75it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.75it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.75it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.75it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.75it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.81it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.75it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 1:  25%|██▍       | 301/1208 [09:06<27:25,  1.81s/it, loss=0.118, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.00035, train/loss_step=0.106, global_step=376.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  25%|██▍       | 301/1208 [09:06<27:25,  1.81s/it, loss=0.138, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.0052, train/loss_step=0.470, global_step=377.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  25%|██▌       | 302/1208 [09:07<27:21,  1.81s/it, loss=0.138, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.0052, train/loss_step=0.470, global_step=377.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  25%|██▌       | 302/1208 [09:07<27:21,  1.81s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000116, train/loss_step=0.0296, global_step=377.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  25%|██▌       | 303/1208 [09:08<27:17,  1.81s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000116, train/loss_step=0.0296, global_step=377.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  25%|██▌       | 303/1208 [09:08<27:17,  1.81s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.69e-5, train/loss_step=0.0241, global_step=377.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  25%|██▌       | 304/1208 [09:11<27:19,  1.81s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.69e-5, train/loss_step=0.0241, global_step=377.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  25%|██▌       | 304/1208 [09:11<27:19,  1.81s/it, loss=0.126, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000884, train/loss_step=0.227, global_step=377.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  25%|██▌       | 305/1208 [09:12<27:15,  1.81s/it, loss=0.126, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000884, train/loss_step=0.227, global_step=377.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  25%|██▌       | 305/1208 [09:12<27:15,  1.81s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00729, train/loss_vlb_step=3.64e-5, train/loss_step=0.00729, global_step=378.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  25%|██▌       | 306/1208 [09:13<27:11,  1.81s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00729, train/loss_vlb_step=3.64e-5, train/loss_step=0.00729, global_step=378.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  25%|██▌       | 306/1208 [09:13<27:11,  1.81s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00893, train/loss_vlb_step=4.48e-5, train/loss_step=0.00893, global_step=378.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  25%|██▌       | 307/1208 [09:14<27:07,  1.81s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00893, train/loss_vlb_step=4.48e-5, train/loss_step=0.00893, global_step=378.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  25%|██▌       | 307/1208 [09:14<27:07,  1.81s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00693, train/loss_vlb_step=3.57e-5, train/loss_step=0.00693, global_step=378.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  25%|██▌       | 308/1208 [09:17<27:10,  1.81s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00693, train/loss_vlb_step=3.57e-5, train/loss_step=0.00693, global_step=378.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  25%|██▌       | 308/1208 [09:17<27:10,  1.81s/it, loss=0.129, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.00065, train/loss_step=0.179, global_step=378.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  26%|██▌       | 309/1208 [09:18<27:06,  1.81s/it, loss=0.129, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.00065, train/loss_step=0.179, global_step=378.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  26%|██▌       | 309/1208 [09:18<27:06,  1.81s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=9.09e-5, train/loss_step=0.0222, global_step=379.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  26%|██▌       | 310/1208 [09:19<27:02,  1.81s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=9.09e-5, train/loss_step=0.0222, global_step=379.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  26%|██▌       | 310/1208 [09:19<27:02,  1.81s/it, loss=0.111, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.0016, train/loss_step=0.334, global_step=379.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  26%|██▌       | 311/1208 [09:21<26:58,  1.80s/it, loss=0.111, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.0016, train/loss_step=0.334, global_step=379.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  26%|██▌       | 311/1208 [09:21<26:58,  1.80s/it, loss=0.123, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00141, train/loss_step=0.298, global_step=379.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  26%|██▌       | 312/1208 [09:24<27:00,  1.81s/it, loss=0.123, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00141, train/loss_step=0.298, global_step=379.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  26%|██▌       | 312/1208 [09:24<27:00,  1.81s/it, loss=0.145, v_num=0, train/loss_simple_step=0.472, train/loss_vlb_step=0.00414, train/loss_step=0.472, global_step=379.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  26%|██▌       | 313/1208 [09:25<26:56,  1.81s/it, loss=0.145, v_num=0, train/loss_simple_step=0.472, train/loss_vlb_step=0.00414, train/loss_step=0.472, global_step=379.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  26%|██▌       | 313/1208 [09:25<26:56,  1.81s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9e-5, train/loss_step=0.0224, global_step=380.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  26%|██▌       | 314/1208 [09:26<26:52,  1.80s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9e-5, train/loss_step=0.0224, global_step=380.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  26%|██▌       | 314/1208 [09:26<26:52,  1.80s/it, loss=0.13, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=380.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  26%|██▌       | 315/1208 [09:27<26:49,  1.80s/it, loss=0.13, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=380.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  26%|██▌       | 315/1208 [09:27<26:49,  1.80s/it, loss=0.132, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000357, train/loss_step=0.108, global_step=380.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  26%|██▌       | 316/1208 [09:30<26:51,  1.81s/it, loss=0.132, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000357, train/loss_step=0.108, global_step=380.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  26%|██▌       | 316/1208 [09:30<26:51,  1.81s/it, loss=0.137, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=380.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  26%|██▌       | 317/1208 [09:32<26:47,  1.80s/it, loss=0.137, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=380.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  26%|██▌       | 317/1208 [09:32<26:47,  1.80s/it, loss=0.138, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.00046, train/loss_step=0.138, global_step=381.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  26%|██▋       | 318/1208 [09:33<26:43,  1.80s/it, loss=0.138, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.00046, train/loss_step=0.138, global_step=381.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  26%|██▋       | 318/1208 [09:33<26:43,  1.80s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=1.93e-5, train/loss_step=0.00347, global_step=381.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  26%|██▋       | 319/1208 [09:34<26:40,  1.80s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=1.93e-5, train/loss_step=0.00347, global_step=381.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  26%|██▋       | 319/1208 [09:34<26:40,  1.80s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.00012, train/loss_step=0.0317, global_step=381.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  26%|██▋       | 320/1208 [09:37<26:42,  1.80s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.00012, train/loss_step=0.0317, global_step=381.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  26%|██▋       | 320/1208 [09:37<26:42,  1.80s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.57e-5, train/loss_step=0.0229, global_step=381.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  27%|██▋       | 321/1208 [09:38<26:38,  1.80s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.57e-5, train/loss_step=0.0229, global_step=381.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  27%|██▋       | 321/1208 [09:38<26:38,  1.80s/it, loss=0.118, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000804, train/loss_step=0.214, global_step=382.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  27%|██▋       | 322/1208 [09:39<26:34,  1.80s/it, loss=0.118, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000804, train/loss_step=0.214, global_step=382.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  27%|██▋       | 322/1208 [09:39<26:34,  1.80s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0427, train/loss_vlb_step=0.000156, train/loss_step=0.0427, global_step=382.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  27%|██▋       | 323/1208 [09:40<26:30,  1.80s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0427, train/loss_vlb_step=0.000156, train/loss_step=0.0427, global_step=382.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  27%|██▋       | 323/1208 [09:40<26:30,  1.80s/it, loss=0.126, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000549, train/loss_step=0.164, global_step=382.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  27%|██▋       | 324/1208 [09:43<26:33,  1.80s/it, loss=0.126, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000549, train/loss_step=0.164, global_step=382.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  27%|██▋       | 324/1208 [09:43<26:33,  1.80s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.000192, train/loss_step=0.0543, global_step=382.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  27%|██▋       | 325/1208 [09:44<26:29,  1.80s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.000192, train/loss_step=0.0543, global_step=382.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  27%|██▋       | 325/1208 [09:44<26:29,  1.80s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=9.06e-5, train/loss_step=0.0221, global_step=383.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  27%|██▋       | 326/1208 [09:45<26:25,  1.80s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=9.06e-5, train/loss_step=0.0221, global_step=383.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  27%|██▋       | 326/1208 [09:45<26:25,  1.80s/it, loss=0.133, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00137, train/loss_step=0.299, global_step=383.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  27%|██▋       | 327/1208 [09:47<26:21,  1.80s/it, loss=0.133, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00137, train/loss_step=0.299, global_step=383.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  27%|██▋       | 327/1208 [09:47<26:21,  1.80s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0305, train/loss_vlb_step=0.000114, train/loss_step=0.0305, global_step=383.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  27%|██▋       | 328/1208 [09:50<26:23,  1.80s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0305, train/loss_vlb_step=0.000114, train/loss_step=0.0305, global_step=383.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  27%|██▋       | 328/1208 [09:50<26:23,  1.80s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0614, train/loss_vlb_step=0.000212, train/loss_step=0.0614, global_step=383.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  27%|██▋       | 329/1208 [09:51<26:20,  1.80s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0614, train/loss_vlb_step=0.000212, train/loss_step=0.0614, global_step=383.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  27%|██▋       | 329/1208 [09:51<26:20,  1.80s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=1.43e-5, train/loss_step=0.0024, global_step=384.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  27%|██▋       | 330/1208 [09:52<26:16,  1.80s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=1.43e-5, train/loss_step=0.0024, global_step=384.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  27%|██▋       | 330/1208 [09:52<26:16,  1.80s/it, loss=0.122, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00103, train/loss_step=0.245, global_step=384.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  27%|██▋       | 331/1208 [09:53<26:12,  1.79s/it, loss=0.122, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00103, train/loss_step=0.245, global_step=384.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  27%|██▋       | 331/1208 [09:53<26:12,  1.79s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0536, train/loss_vlb_step=0.000197, train/loss_step=0.0536, global_step=384.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  27%|██▋       | 332/1208 [09:56<26:14,  1.80s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0536, train/loss_vlb_step=0.000197, train/loss_step=0.0536, global_step=384.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  27%|██▋       | 332/1208 [09:56<26:14,  1.80s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000463, train/loss_step=0.141, global_step=384.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  28%|██▊       | 333/1208 [09:57<26:10,  1.80s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000463, train/loss_step=0.141, global_step=384.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  28%|██▊       | 333/1208 [09:57<26:10,  1.80s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.0994, train/loss_vlb_step=0.000332, train/loss_step=0.0994, global_step=385.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  28%|██▊       | 334/1208 [09:58<26:07,  1.79s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.0994, train/loss_vlb_step=0.000332, train/loss_step=0.0994, global_step=385.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  28%|██▊       | 334/1208 [09:58<26:07,  1.79s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=8.96e-5, train/loss_step=0.022, global_step=385.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  28%|██▊       | 335/1208 [09:59<26:03,  1.79s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=8.96e-5, train/loss_step=0.022, global_step=385.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  28%|██▊       | 335/1208 [09:59<26:03,  1.79s/it, loss=0.115, v_num=0, train/loss_simple_step=0.552, train/loss_vlb_step=0.00418, train/loss_step=0.552, global_step=385.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  28%|██▊       | 336/1208 [10:03<26:05,  1.80s/it, loss=0.115, v_num=0, train/loss_simple_step=0.552, train/loss_vlb_step=0.00418, train/loss_step=0.552, global_step=385.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  28%|██▊       | 336/1208 [10:03<26:05,  1.80s/it, loss=0.121, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000749, train/loss_step=0.220, global_step=385.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  28%|██▊       | 337/1208 [10:04<26:01,  1.79s/it, loss=0.121, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000749, train/loss_step=0.220, global_step=385.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  28%|██▊       | 337/1208 [10:04<26:01,  1.79s/it, loss=0.131, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.002, train/loss_step=0.337, global_step=386.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  28%|██▊       | 338/1208 [10:05<25:57,  1.79s/it, loss=0.131, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.002, train/loss_step=0.337, global_step=386.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  28%|██▊       | 338/1208 [10:05<25:57,  1.79s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0773, train/loss_vlb_step=0.000265, train/loss_step=0.0773, global_step=386.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  28%|██▊       | 339/1208 [10:06<25:54,  1.79s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0773, train/loss_vlb_step=0.000265, train/loss_step=0.0773, global_step=386.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  28%|██▊       | 339/1208 [10:06<25:54,  1.79s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00753, train/loss_vlb_step=3.57e-5, train/loss_step=0.00753, global_step=386.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  28%|██▊       | 340/1208 [10:09<25:56,  1.79s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00753, train/loss_vlb_step=3.57e-5, train/loss_step=0.00753, global_step=386.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  28%|██▊       | 340/1208 [10:09<25:56,  1.79s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0642, train/loss_vlb_step=0.000221, train/loss_step=0.0642, global_step=386.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  28%|██▊       | 341/1208 [10:10<25:52,  1.79s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0642, train/loss_vlb_step=0.000221, train/loss_step=0.0642, global_step=386.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  28%|██▊       | 341/1208 [10:10<25:52,  1.79s/it, loss=0.134, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000637, train/loss_step=0.181, global_step=387.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  28%|██▊       | 342/1208 [10:11<25:49,  1.79s/it, loss=0.134, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000637, train/loss_step=0.181, global_step=387.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  28%|██▊       | 342/1208 [10:11<25:49,  1.79s/it, loss=0.14, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000585, train/loss_step=0.170, global_step=387.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  28%|██▊       | 343/1208 [10:12<25:45,  1.79s/it, loss=0.14, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000585, train/loss_step=0.170, global_step=387.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  28%|██▊       | 343/1208 [10:12<25:45,  1.79s/it, loss=0.161, v_num=0, train/loss_simple_step=0.587, train/loss_vlb_step=0.0083, train/loss_step=0.587, global_step=387.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  28%|██▊       | 344/1208 [10:16<25:47,  1.79s/it, loss=0.161, v_num=0, train/loss_simple_step=0.587, train/loss_vlb_step=0.0083, train/loss_step=0.587, global_step=387.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  28%|██▊       | 344/1208 [10:16<25:47,  1.79s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.76e-5, train/loss_step=0.0157, global_step=387.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  29%|██▊       | 345/1208 [10:17<25:43,  1.79s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.76e-5, train/loss_step=0.0157, global_step=387.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  29%|██▊       | 345/1208 [10:17<25:43,  1.79s/it, loss=0.175, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00174, train/loss_step=0.340, global_step=388.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  29%|██▊       | 346/1208 [10:18<25:40,  1.79s/it, loss=0.175, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00174, train/loss_step=0.340, global_step=388.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  29%|██▊       | 346/1208 [10:18<25:40,  1.79s/it, loss=0.179, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00236, train/loss_step=0.380, global_step=388.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  29%|██▊       | 347/1208 [10:19<25:36,  1.78s/it, loss=0.179, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00236, train/loss_step=0.380, global_step=388.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  29%|██▊       | 347/1208 [10:19<25:36,  1.78s/it, loss=0.183, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000348, train/loss_step=0.105, global_step=388.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  29%|██▉       | 348/1208 [10:22<25:38,  1.79s/it, loss=0.183, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000348, train/loss_step=0.105, global_step=388.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  29%|██▉       | 348/1208 [10:22<25:38,  1.79s/it, loss=0.188, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000575, train/loss_step=0.165, global_step=388.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  29%|██▉       | 349/1208 [10:23<25:35,  1.79s/it, loss=0.188, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000575, train/loss_step=0.165, global_step=388.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  29%|██▉       | 349/1208 [10:23<25:35,  1.79s/it, loss=0.204, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00149, train/loss_step=0.311, global_step=389.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  29%|██▉       | 350/1208 [10:24<25:31,  1.79s/it, loss=0.204, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00149, train/loss_step=0.311, global_step=389.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  29%|██▉       | 350/1208 [10:24<25:31,  1.79s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0569, train/loss_vlb_step=0.000201, train/loss_step=0.0569, global_step=389.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  29%|██▉       | 351/1208 [10:25<25:28,  1.78s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0569, train/loss_vlb_step=0.000201, train/loss_step=0.0569, global_step=389.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  29%|██▉       | 351/1208 [10:25<25:28,  1.78s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0446, train/loss_vlb_step=0.000166, train/loss_step=0.0446, global_step=389.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  29%|██▉       | 352/1208 [10:29<25:29,  1.79s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0446, train/loss_vlb_step=0.000166, train/loss_step=0.0446, global_step=389.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  29%|██▉       | 352/1208 [10:29<25:29,  1.79s/it, loss=0.203, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00153, train/loss_step=0.334, global_step=389.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  29%|██▉       | 353/1208 [10:30<25:26,  1.79s/it, loss=0.203, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00153, train/loss_step=0.334, global_step=389.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  29%|██▉       | 353/1208 [10:30<25:26,  1.79s/it, loss=0.206, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000463, train/loss_step=0.141, global_step=390.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  29%|██▉       | 354/1208 [10:31<25:22,  1.78s/it, loss=0.206, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000463, train/loss_step=0.141, global_step=390.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  29%|██▉       | 354/1208 [10:31<25:22,  1.78s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.42e-5, train/loss_step=0.0152, global_step=390.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  29%|██▉       | 355/1208 [10:32<25:19,  1.78s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.42e-5, train/loss_step=0.0152, global_step=390.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  29%|██▉       | 355/1208 [10:32<25:19,  1.78s/it, loss=0.2, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00407, train/loss_step=0.442, global_step=390.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  29%|██▉       | 356/1208 [10:35<25:21,  1.79s/it, loss=0.2, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00407, train/loss_step=0.442, global_step=390.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  29%|██▉       | 356/1208 [10:35<25:21,  1.79s/it, loss=0.195, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000429, train/loss_step=0.130, global_step=390.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  30%|██▉       | 357/1208 [10:36<25:17,  1.78s/it, loss=0.195, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000429, train/loss_step=0.130, global_step=390.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  30%|██▉       | 357/1208 [10:36<25:17,  1.78s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0059, train/loss_vlb_step=3.18e-5, train/loss_step=0.0059, global_step=391.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  30%|██▉       | 358/1208 [10:37<25:14,  1.78s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0059, train/loss_vlb_step=3.18e-5, train/loss_step=0.0059, global_step=391.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  30%|██▉       | 358/1208 [10:37<25:14,  1.78s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0404, train/loss_vlb_step=0.000151, train/loss_step=0.0404, global_step=391.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  30%|██▉       | 359/1208 [10:38<25:10,  1.78s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0404, train/loss_vlb_step=0.000151, train/loss_step=0.0404, global_step=391.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  30%|██▉       | 359/1208 [10:38<25:10,  1.78s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0512, train/loss_vlb_step=0.000189, train/loss_step=0.0512, global_step=391.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  30%|██▉       | 360/1208 [10:42<25:12,  1.78s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0512, train/loss_vlb_step=0.000189, train/loss_step=0.0512, global_step=391.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  30%|██▉       | 360/1208 [10:42<25:12,  1.78s/it, loss=0.189, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.000974, train/loss_step=0.257, global_step=391.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  30%|██▉       | 361/1208 [10:43<25:09,  1.78s/it, loss=0.189, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.000974, train/loss_step=0.257, global_step=391.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  30%|██▉       | 361/1208 [10:43<25:09,  1.78s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0991, train/loss_vlb_step=0.000329, train/loss_step=0.0991, global_step=392.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  30%|██▉       | 362/1208 [10:44<25:05,  1.78s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0991, train/loss_vlb_step=0.000329, train/loss_step=0.0991, global_step=392.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  30%|██▉       | 362/1208 [10:44<25:05,  1.78s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00547, train/loss_vlb_step=2.77e-5, train/loss_step=0.00547, global_step=392.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  30%|███       | 363/1208 [10:45<25:02,  1.78s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00547, train/loss_vlb_step=2.77e-5, train/loss_step=0.00547, global_step=392.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  30%|███       | 363/1208 [10:45<25:02,  1.78s/it, loss=0.156, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000652, train/loss_step=0.185, global_step=392.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  30%|███       | 364/1208 [10:48<25:03,  1.78s/it, loss=0.156, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000652, train/loss_step=0.185, global_step=392.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  30%|███       | 364/1208 [10:48<25:03,  1.78s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0913, train/loss_vlb_step=0.000302, train/loss_step=0.0913, global_step=392.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  30%|███       | 365/1208 [10:49<25:00,  1.78s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0913, train/loss_vlb_step=0.000302, train/loss_step=0.0913, global_step=392.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  30%|███       | 365/1208 [10:49<25:00,  1.78s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0659, train/loss_vlb_step=0.000226, train/loss_step=0.0659, global_step=393.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  30%|███       | 366/1208 [10:50<24:56,  1.78s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0659, train/loss_vlb_step=0.000226, train/loss_step=0.0659, global_step=393.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  30%|███       | 366/1208 [10:50<24:56,  1.78s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=1.29e-5, train/loss_step=0.00221, global_step=393.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  30%|███       | 367/1208 [10:51<24:53,  1.78s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=1.29e-5, train/loss_step=0.00221, global_step=393.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  30%|███       | 367/1208 [10:51<24:53,  1.78s/it, loss=0.147, v_num=0, train/loss_simple_step=0.490, train/loss_vlb_step=0.00624, train/loss_step=0.490, global_step=393.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  30%|███       | 368/1208 [10:54<24:55,  1.78s/it, loss=0.147, v_num=0, train/loss_simple_step=0.490, train/loss_vlb_step=0.00624, train/loss_step=0.490, global_step=393.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  30%|███       | 368/1208 [10:54<24:55,  1.78s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0777, train/loss_vlb_step=0.000263, train/loss_step=0.0777, global_step=393.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  31%|███       | 369/1208 [10:56<24:51,  1.78s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0777, train/loss_vlb_step=0.000263, train/loss_step=0.0777, global_step=393.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  31%|███       | 369/1208 [10:56<24:51,  1.78s/it, loss=0.152, v_num=0, train/loss_simple_step=0.503, train/loss_vlb_step=0.00487, train/loss_step=0.503, global_step=394.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  31%|███       | 370/1208 [10:57<24:48,  1.78s/it, loss=0.152, v_num=0, train/loss_simple_step=0.503, train/loss_vlb_step=0.00487, train/loss_step=0.503, global_step=394.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  31%|███       | 370/1208 [10:57<24:48,  1.78s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0893, train/loss_vlb_step=0.000298, train/loss_step=0.0893, global_step=394.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  31%|███       | 371/1208 [10:58<24:44,  1.77s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0893, train/loss_vlb_step=0.000298, train/loss_step=0.0893, global_step=394.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  31%|███       | 371/1208 [10:58<24:44,  1.77s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.25e-5, train/loss_step=0.00207, global_step=394.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  31%|███       | 372/1208 [11:01<24:46,  1.78s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.25e-5, train/loss_step=0.00207, global_step=394.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  31%|███       | 372/1208 [11:01<24:46,  1.78s/it, loss=0.162, v_num=0, train/loss_simple_step=0.548, train/loss_vlb_step=0.0146, train/loss_step=0.548, global_step=394.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]     Epoch 1:  31%|███       | 373/1208 [11:02<24:43,  1.78s/it, loss=0.162, v_num=0, train/loss_simple_step=0.548, train/loss_vlb_step=0.0146, train/loss_step=0.548, global_step=394.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  31%|███       | 373/1208 [11:02<24:43,  1.78s/it, loss=0.166, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000837, train/loss_step=0.229, global_step=395.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  31%|███       | 374/1208 [11:03<24:39,  1.77s/it, loss=0.166, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000837, train/loss_step=0.229, global_step=395.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  31%|███       | 374/1208 [11:03<24:39,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000149, train/loss_step=0.0405, global_step=395.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  31%|███       | 375/1208 [11:04<24:36,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000149, train/loss_step=0.0405, global_step=395.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  31%|███       | 375/1208 [11:04<24:36,  1.77s/it, loss=0.149, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.000209, train/loss_step=0.062, global_step=395.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  31%|███       | 376/1208 [11:07<24:38,  1.78s/it, loss=0.149, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.000209, train/loss_step=0.062, global_step=395.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  31%|███       | 376/1208 [11:07<24:38,  1.78s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00659, train/loss_vlb_step=3.37e-5, train/loss_step=0.00659, global_step=395.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  31%|███       | 377/1208 [11:09<24:34,  1.77s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00659, train/loss_vlb_step=3.37e-5, train/loss_step=0.00659, global_step=395.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  31%|███       | 377/1208 [11:09<24:34,  1.77s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000164, train/loss_step=0.0457, global_step=396.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  31%|███▏      | 378/1208 [11:10<24:31,  1.77s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000164, train/loss_step=0.0457, global_step=396.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  31%|███▏      | 378/1208 [11:10<24:31,  1.77s/it, loss=0.163, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.00269, train/loss_step=0.400, global_step=396.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  31%|███▏      | 379/1208 [11:11<24:28,  1.77s/it, loss=0.163, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.00269, train/loss_step=0.400, global_step=396.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  31%|███▏      | 379/1208 [11:11<24:28,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000549, train/loss_step=0.164, global_step=396.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  31%|███▏      | 380/1208 [11:14<24:29,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000549, train/loss_step=0.164, global_step=396.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  31%|███▏      | 380/1208 [11:14<24:29,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000419, train/loss_step=0.126, global_step=396.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  32%|███▏      | 381/1208 [11:15<24:26,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000419, train/loss_step=0.126, global_step=396.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  32%|███▏      | 381/1208 [11:15<24:26,  1.77s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0725, train/loss_vlb_step=0.000242, train/loss_step=0.0725, global_step=397.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  32%|███▏      | 382/1208 [11:16<24:23,  1.77s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0725, train/loss_vlb_step=0.000242, train/loss_step=0.0725, global_step=397.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  32%|███▏      | 382/1208 [11:16<24:23,  1.77s/it, loss=0.178, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.00224, train/loss_step=0.360, global_step=397.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  32%|███▏      | 383/1208 [11:17<24:19,  1.77s/it, loss=0.178, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.00224, train/loss_step=0.360, global_step=397.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  32%|███▏      | 383/1208 [11:17<24:19,  1.77s/it, loss=0.21, v_num=0, train/loss_simple_step=0.824, train/loss_vlb_step=0.139, train/loss_step=0.824, global_step=397.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  32%|███▏      | 384/1208 [11:20<24:21,  1.77s/it, loss=0.21, v_num=0, train/loss_simple_step=0.824, train/loss_vlb_step=0.139, train/loss_step=0.824, global_step=397.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  32%|███▏      | 384/1208 [11:20<24:21,  1.77s/it, loss=0.209, v_num=0, train/loss_simple_step=0.0679, train/loss_vlb_step=0.000235, train/loss_step=0.0679, global_step=397.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  32%|███▏      | 385/1208 [11:21<24:17,  1.77s/it, loss=0.209, v_num=0, train/loss_simple_step=0.0679, train/loss_vlb_step=0.000235, train/loss_step=0.0679, global_step=397.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  32%|███▏      | 385/1208 [11:21<24:17,  1.77s/it, loss=0.239, v_num=0, train/loss_simple_step=0.666, train/loss_vlb_step=0.0178, train/loss_step=0.666, global_step=398.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  32%|███▏      | 386/1208 [11:23<24:14,  1.77s/it, loss=0.239, v_num=0, train/loss_simple_step=0.666, train/loss_vlb_step=0.0178, train/loss_step=0.666, global_step=398.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  32%|███▏      | 386/1208 [11:23<24:14,  1.77s/it, loss=0.24, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.63e-5, train/loss_step=0.0241, global_step=398.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  32%|███▏      | 387/1208 [11:24<24:11,  1.77s/it, loss=0.24, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.63e-5, train/loss_step=0.0241, global_step=398.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  32%|███▏      | 387/1208 [11:24<24:11,  1.77s/it, loss=0.226, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000756, train/loss_step=0.211, global_step=398.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  32%|███▏      | 388/1208 [11:27<24:12,  1.77s/it, loss=0.226, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000756, train/loss_step=0.211, global_step=398.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  32%|███▏      | 388/1208 [11:27<24:12,  1.77s/it, loss=0.224, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000116, train/loss_step=0.0304, global_step=398.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  32%|███▏      | 389/1208 [11:28<24:09,  1.77s/it, loss=0.224, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000116, train/loss_step=0.0304, global_step=398.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  32%|███▏      | 389/1208 [11:28<24:09,  1.77s/it, loss=0.213, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00135, train/loss_step=0.299, global_step=399.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  32%|███▏      | 390/1208 [11:29<24:06,  1.77s/it, loss=0.213, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00135, train/loss_step=0.299, global_step=399.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  32%|███▏      | 390/1208 [11:29<24:06,  1.77s/it, loss=0.217, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000538, train/loss_step=0.162, global_step=399.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  32%|███▏      | 391/1208 [11:30<24:02,  1.77s/it, loss=0.217, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000538, train/loss_step=0.162, global_step=399.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  32%|███▏      | 391/1208 [11:30<24:02,  1.77s/it, loss=0.218, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000106, train/loss_step=0.0279, global_step=399.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  32%|███▏      | 392/1208 [11:33<24:04,  1.77s/it, loss=0.218, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000106, train/loss_step=0.0279, global_step=399.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  32%|███▏      | 392/1208 [11:33<24:04,  1.77s/it, loss=0.22, v_num=0, train/loss_simple_step=0.585, train/loss_vlb_step=0.0172, train/loss_step=0.585, global_step=399.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]     Epoch 1:  33%|███▎      | 393/1208 [11:34<24:01,  1.77s/it, loss=0.22, v_num=0, train/loss_simple_step=0.585, train/loss_vlb_step=0.0172, train/loss_step=0.585, global_step=399.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  33%|███▎      | 393/1208 [11:34<24:01,  1.77s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000115, train/loss_step=0.0307, global_step=400.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  33%|███▎      | 394/1208 [11:35<23:57,  1.77s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000115, train/loss_step=0.0307, global_step=400.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  33%|███▎      | 394/1208 [11:35<23:57,  1.77s/it, loss=0.22, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.000983, train/loss_step=0.243, global_step=400.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  33%|███▎      | 395/1208 [11:37<23:54,  1.76s/it, loss=0.22, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.000983, train/loss_step=0.243, global_step=400.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  33%|███▎      | 395/1208 [11:37<23:54,  1.76s/it, loss=0.229, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000988, train/loss_step=0.232, global_step=400.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  33%|███▎      | 396/1208 [11:40<23:56,  1.77s/it, loss=0.229, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000988, train/loss_step=0.232, global_step=400.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  33%|███▎      | 396/1208 [11:40<23:56,  1.77s/it, loss=0.241, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00099, train/loss_step=0.243, global_step=400.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  33%|███▎      | 397/1208 [11:41<23:53,  1.77s/it, loss=0.241, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00099, train/loss_step=0.243, global_step=400.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  33%|███▎      | 397/1208 [11:41<23:53,  1.77s/it, loss=0.247, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000605, train/loss_step=0.177, global_step=401.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  33%|███▎      | 398/1208 [11:42<23:49,  1.77s/it, loss=0.247, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000605, train/loss_step=0.177, global_step=401.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  33%|███▎      | 398/1208 [11:42<23:49,  1.77s/it, loss=0.241, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00151, train/loss_step=0.268, global_step=401.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  33%|███▎      | 399/1208 [11:43<23:46,  1.76s/it, loss=0.241, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00151, train/loss_step=0.268, global_step=401.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  33%|███▎      | 399/1208 [11:43<23:46,  1.76s/it, loss=0.242, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000717, train/loss_step=0.195, global_step=401.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  33%|███▎      | 400/1208 [11:46<23:48,  1.77s/it, loss=0.242, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000717, train/loss_step=0.195, global_step=401.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  33%|███▎      | 400/1208 [11:46<23:48,  1.77s/it, loss=0.236, v_num=0, train/loss_simple_step=0.00642, train/loss_vlb_step=3.32e-5, train/loss_step=0.00642, global_step=401.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  33%|███▎      | 401/1208 [11:48<23:44,  1.77s/it, loss=0.236, v_num=0, train/loss_simple_step=0.00642, train/loss_vlb_step=3.32e-5, train/loss_step=0.00642, global_step=401.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  33%|███▎      | 401/1208 [11:48<23:44,  1.77s/it, loss=0.255, v_num=0, train/loss_simple_step=0.456, train/loss_vlb_step=0.00378, train/loss_step=0.456, global_step=402.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  33%|███▎      | 402/1208 [11:49<23:41,  1.76s/it, loss=0.255, v_num=0, train/loss_simple_step=0.456, train/loss_vlb_step=0.00378, train/loss_step=0.456, global_step=402.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  33%|███▎      | 402/1208 [11:49<23:41,  1.76s/it, loss=0.24, v_num=0, train/loss_simple_step=0.0511, train/loss_vlb_step=0.000178, train/loss_step=0.0511, global_step=402.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  33%|███▎      | 403/1208 [11:50<23:38,  1.76s/it, loss=0.24, v_num=0, train/loss_simple_step=0.0511, train/loss_vlb_step=0.000178, train/loss_step=0.0511, global_step=402.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  33%|███▎      | 403/1208 [11:50<23:38,  1.76s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0503, train/loss_vlb_step=0.00017, train/loss_step=0.0503, global_step=402.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  33%|███▎      | 404/1208 [11:53<23:40,  1.77s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0503, train/loss_vlb_step=0.00017, train/loss_step=0.0503, global_step=402.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  33%|███▎      | 404/1208 [11:53<23:40,  1.77s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0879, train/loss_vlb_step=0.00029, train/loss_step=0.0879, global_step=402.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  34%|███▎      | 405/1208 [11:54<23:36,  1.76s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0879, train/loss_vlb_step=0.00029, train/loss_step=0.0879, global_step=402.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  34%|███▎      | 405/1208 [11:54<23:36,  1.76s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.000124, train/loss_step=0.0326, global_step=403.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  34%|███▎      | 406/1208 [11:55<23:33,  1.76s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.000124, train/loss_step=0.0326, global_step=403.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  34%|███▎      | 406/1208 [11:55<23:33,  1.76s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.58e-5, train/loss_step=0.0182, global_step=403.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  34%|███▎      | 407/1208 [11:56<23:30,  1.76s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.58e-5, train/loss_step=0.0182, global_step=403.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  34%|███▎      | 407/1208 [11:56<23:30,  1.76s/it, loss=0.182, v_num=0, train/loss_simple_step=0.444, train/loss_vlb_step=0.00442, train/loss_step=0.444, global_step=403.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  34%|███▍      | 408/1208 [12:00<23:31,  1.76s/it, loss=0.182, v_num=0, train/loss_simple_step=0.444, train/loss_vlb_step=0.00442, train/loss_step=0.444, global_step=403.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  34%|███▍      | 408/1208 [12:00<23:31,  1.76s/it, loss=0.187, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000407, train/loss_step=0.124, global_step=403.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  34%|███▍      | 409/1208 [12:01<23:28,  1.76s/it, loss=0.187, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000407, train/loss_step=0.124, global_step=403.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  34%|███▍      | 409/1208 [12:01<23:28,  1.76s/it, loss=0.184, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000982, train/loss_step=0.237, global_step=404.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  34%|███▍      | 410/1208 [12:02<23:25,  1.76s/it, loss=0.184, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000982, train/loss_step=0.237, global_step=404.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  34%|███▍      | 410/1208 [12:02<23:25,  1.76s/it, loss=0.181, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=404.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  34%|███▍      | 411/1208 [12:03<23:22,  1.76s/it, loss=0.181, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=404.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  34%|███▍      | 411/1208 [12:03<23:22,  1.76s/it, loss=0.189, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000643, train/loss_step=0.186, global_step=404.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  34%|███▍      | 412/1208 [12:06<23:23,  1.76s/it, loss=0.189, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000643, train/loss_step=0.186, global_step=404.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  34%|███▍      | 412/1208 [12:06<23:23,  1.76s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=1.46e-5, train/loss_step=0.00259, global_step=404.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  34%|███▍      | 413/1208 [12:07<23:20,  1.76s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=1.46e-5, train/loss_step=0.00259, global_step=404.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  34%|███▍      | 413/1208 [12:07<23:20,  1.76s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0999, train/loss_vlb_step=0.00033, train/loss_step=0.0999, global_step=405.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  34%|███▍      | 414/1208 [12:08<23:17,  1.76s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0999, train/loss_vlb_step=0.00033, train/loss_step=0.0999, global_step=405.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  34%|███▍      | 414/1208 [12:08<23:17,  1.76s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0831, train/loss_vlb_step=0.00028, train/loss_step=0.0831, global_step=405.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  34%|███▍      | 415/1208 [12:09<23:14,  1.76s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0831, train/loss_vlb_step=0.00028, train/loss_step=0.0831, global_step=405.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  34%|███▍      | 415/1208 [12:09<23:14,  1.76s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.42e-5, train/loss_step=0.0169, global_step=405.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  34%|███▍      | 416/1208 [12:12<23:15,  1.76s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.42e-5, train/loss_step=0.0169, global_step=405.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  34%|███▍      | 416/1208 [12:12<23:15,  1.76s/it, loss=0.156, v_num=0, train/loss_simple_step=0.477, train/loss_vlb_step=0.00527, train/loss_step=0.477, global_step=405.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  35%|███▍      | 417/1208 [12:14<23:12,  1.76s/it, loss=0.156, v_num=0, train/loss_simple_step=0.477, train/loss_vlb_step=0.00527, train/loss_step=0.477, global_step=405.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  35%|███▍      | 417/1208 [12:14<23:12,  1.76s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0458, train/loss_vlb_step=0.000167, train/loss_step=0.0458, global_step=406.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  35%|███▍      | 418/1208 [12:15<23:09,  1.76s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0458, train/loss_vlb_step=0.000167, train/loss_step=0.0458, global_step=406.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  35%|███▍      | 418/1208 [12:15<23:09,  1.76s/it, loss=0.142, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=406.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  35%|███▍      | 419/1208 [12:16<23:06,  1.76s/it, loss=0.142, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=406.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  35%|███▍      | 419/1208 [12:16<23:06,  1.76s/it, loss=0.141, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000586, train/loss_step=0.174, global_step=406.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  35%|███▍      | 420/1208 [12:19<23:07,  1.76s/it, loss=0.141, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000586, train/loss_step=0.174, global_step=406.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  35%|███▍      | 420/1208 [12:19<23:07,  1.76s/it, loss=0.147, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000442, train/loss_step=0.133, global_step=406.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  35%|███▍      | 421/1208 [12:20<23:04,  1.76s/it, loss=0.147, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000442, train/loss_step=0.133, global_step=406.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  35%|███▍      | 421/1208 [12:20<23:04,  1.76s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00396, train/loss_vlb_step=2.26e-5, train/loss_step=0.00396, global_step=407.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  35%|███▍      | 422/1208 [12:21<23:01,  1.76s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00396, train/loss_vlb_step=2.26e-5, train/loss_step=0.00396, global_step=407.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  35%|███▍      | 422/1208 [12:21<23:01,  1.76s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.17e-5, train/loss_step=0.0163, global_step=407.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  35%|███▌      | 423/1208 [12:22<22:58,  1.76s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.17e-5, train/loss_step=0.0163, global_step=407.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  35%|███▌      | 423/1208 [12:22<22:58,  1.76s/it, loss=0.13, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000634, train/loss_step=0.182, global_step=407.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  35%|███▌      | 424/1208 [12:25<22:59,  1.76s/it, loss=0.13, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000634, train/loss_step=0.182, global_step=407.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  35%|███▌      | 424/1208 [12:25<22:59,  1.76s/it, loss=0.132, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000455, train/loss_step=0.138, global_step=407.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  35%|███▌      | 425/1208 [12:26<22:56,  1.76s/it, loss=0.132, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000455, train/loss_step=0.138, global_step=407.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  35%|███▌      | 425/1208 [12:26<22:56,  1.76s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0633, train/loss_vlb_step=0.000227, train/loss_step=0.0633, global_step=408.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  35%|███▌      | 426/1208 [12:28<22:53,  1.76s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0633, train/loss_vlb_step=0.000227, train/loss_step=0.0633, global_step=408.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  35%|███▌      | 426/1208 [12:28<22:53,  1.76s/it, loss=0.14, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000491, train/loss_step=0.146, global_step=408.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  35%|███▌      | 427/1208 [12:29<22:50,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000491, train/loss_step=0.146, global_step=408.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  35%|███▌      | 427/1208 [12:29<22:50,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000396, train/loss_step=0.119, global_step=408.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  35%|███▌      | 428/1208 [12:32<22:51,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000396, train/loss_step=0.119, global_step=408.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  35%|███▌      | 428/1208 [12:32<22:51,  1.76s/it, loss=0.138, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00347, train/loss_step=0.414, global_step=408.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  36%|███▌      | 429/1208 [12:33<22:48,  1.76s/it, loss=0.138, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00347, train/loss_step=0.414, global_step=408.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  36%|███▌      | 429/1208 [12:33<22:48,  1.76s/it, loss=0.141, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.0011, train/loss_step=0.297, global_step=409.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  36%|███▌      | 430/1208 [12:34<22:45,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.0011, train/loss_step=0.297, global_step=409.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  36%|███▌      | 430/1208 [12:34<22:45,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000109, train/loss_step=0.0279, global_step=409.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  36%|███▌      | 431/1208 [12:35<22:42,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000109, train/loss_step=0.0279, global_step=409.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  36%|███▌      | 431/1208 [12:35<22:42,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.522, train/loss_vlb_step=0.00957, train/loss_step=0.522, global_step=409.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  36%|███▌      | 432/1208 [12:38<22:43,  1.76s/it, loss=0.154, v_num=0, train/loss_simple_step=0.522, train/loss_vlb_step=0.00957, train/loss_step=0.522, global_step=409.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  36%|███▌      | 432/1208 [12:38<22:43,  1.76s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=9.41e-5, train/loss_step=0.0218, global_step=409.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  36%|███▌      | 433/1208 [12:39<22:40,  1.76s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=9.41e-5, train/loss_step=0.0218, global_step=409.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  36%|███▌      | 433/1208 [12:39<22:40,  1.76s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.93e-5, train/loss_step=0.0101, global_step=410.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  36%|███▌      | 434/1208 [12:41<22:37,  1.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.93e-5, train/loss_step=0.0101, global_step=410.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  36%|███▌      | 434/1208 [12:41<22:37,  1.75s/it, loss=0.167, v_num=0, train/loss_simple_step=0.419, train/loss_vlb_step=0.00272, train/loss_step=0.419, global_step=410.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  36%|███▌      | 435/1208 [12:42<22:34,  1.75s/it, loss=0.167, v_num=0, train/loss_simple_step=0.419, train/loss_vlb_step=0.00272, train/loss_step=0.419, global_step=410.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  36%|███▌      | 435/1208 [12:42<22:34,  1.75s/it, loss=0.183, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00165, train/loss_step=0.326, global_step=410.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  36%|███▌      | 436/1208 [12:45<22:35,  1.76s/it, loss=0.183, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00165, train/loss_step=0.326, global_step=410.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  36%|███▌      | 436/1208 [12:45<22:35,  1.76s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00847, train/loss_vlb_step=4.21e-5, train/loss_step=0.00847, global_step=410.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  36%|███▌      | 437/1208 [12:46<22:32,  1.75s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00847, train/loss_vlb_step=4.21e-5, train/loss_step=0.00847, global_step=410.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  36%|███▌      | 437/1208 [12:46<22:32,  1.75s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=1.53e-5, train/loss_step=0.00263, global_step=411.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  36%|███▋      | 438/1208 [12:47<22:29,  1.75s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=1.53e-5, train/loss_step=0.00263, global_step=411.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  36%|███▋      | 438/1208 [12:47<22:29,  1.75s/it, loss=0.159, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000498, train/loss_step=0.148, global_step=411.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  36%|███▋      | 439/1208 [12:48<22:26,  1.75s/it, loss=0.159, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000498, train/loss_step=0.148, global_step=411.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  36%|███▋      | 439/1208 [12:48<22:26,  1.75s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0639, train/loss_vlb_step=0.000216, train/loss_step=0.0639, global_step=411.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  36%|███▋      | 440/1208 [12:51<22:27,  1.75s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0639, train/loss_vlb_step=0.000216, train/loss_step=0.0639, global_step=411.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  36%|███▋      | 440/1208 [12:51<22:27,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00159, train/loss_step=0.311, global_step=411.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  37%|███▋      | 441/1208 [12:52<22:24,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00159, train/loss_step=0.311, global_step=411.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  37%|███▋      | 441/1208 [12:52<22:24,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.73e-5, train/loss_step=0.0129, global_step=412.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  37%|███▋      | 442/1208 [12:53<22:21,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.73e-5, train/loss_step=0.0129, global_step=412.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  37%|███▋      | 442/1208 [12:53<22:21,  1.75s/it, loss=0.176, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00132, train/loss_step=0.295, global_step=412.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  37%|███▋      | 443/1208 [12:54<22:18,  1.75s/it, loss=0.176, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00132, train/loss_step=0.295, global_step=412.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  37%|███▋      | 443/1208 [12:54<22:18,  1.75s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0554, train/loss_vlb_step=0.000197, train/loss_step=0.0554, global_step=412.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  37%|███▋      | 444/1208 [12:58<22:19,  1.75s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0554, train/loss_vlb_step=0.000197, train/loss_step=0.0554, global_step=412.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  37%|███▋      | 444/1208 [12:58<22:19,  1.75s/it, loss=0.174, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000822, train/loss_step=0.217, global_step=412.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  37%|███▋      | 445/1208 [12:59<22:16,  1.75s/it, loss=0.174, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000822, train/loss_step=0.217, global_step=412.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  37%|███▋      | 445/1208 [12:59<22:16,  1.75s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000111, train/loss_step=0.0286, global_step=413.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  37%|███▋      | 446/1208 [13:00<22:13,  1.75s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000111, train/loss_step=0.0286, global_step=413.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  37%|███▋      | 446/1208 [13:00<22:13,  1.75s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0789, train/loss_vlb_step=0.000268, train/loss_step=0.0789, global_step=413.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  37%|███▋      | 447/1208 [13:01<22:10,  1.75s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0789, train/loss_vlb_step=0.000268, train/loss_step=0.0789, global_step=413.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  37%|███▋      | 447/1208 [13:01<22:10,  1.75s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=8.95e-5, train/loss_step=0.0225, global_step=413.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  37%|███▋      | 448/1208 [13:04<22:11,  1.75s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=8.95e-5, train/loss_step=0.0225, global_step=413.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  37%|███▋      | 448/1208 [13:04<22:11,  1.75s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00869, train/loss_vlb_step=4.25e-5, train/loss_step=0.00869, global_step=413.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  37%|███▋      | 449/1208 [13:05<22:08,  1.75s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00869, train/loss_vlb_step=4.25e-5, train/loss_step=0.00869, global_step=413.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  37%|███▋      | 449/1208 [13:05<22:08,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00531, train/loss_vlb_step=2.71e-5, train/loss_step=0.00531, global_step=414.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  37%|███▋      | 450/1208 [13:06<22:05,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00531, train/loss_vlb_step=2.71e-5, train/loss_step=0.00531, global_step=414.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  37%|███▋      | 450/1208 [13:06<22:05,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000579, train/loss_step=0.173, global_step=414.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  37%|███▋      | 451/1208 [13:07<22:02,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000579, train/loss_step=0.173, global_step=414.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  37%|███▋      | 451/1208 [13:07<22:02,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000802, train/loss_step=0.209, global_step=414.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  37%|███▋      | 452/1208 [13:11<22:03,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000802, train/loss_step=0.209, global_step=414.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  37%|███▋      | 452/1208 [13:11<22:03,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00104, train/loss_step=0.247, global_step=414.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  38%|███▊      | 453/1208 [13:12<22:00,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00104, train/loss_step=0.247, global_step=414.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  38%|███▊      | 453/1208 [13:12<22:00,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000465, train/loss_step=0.141, global_step=415.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  38%|███▊      | 454/1208 [13:13<21:57,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000465, train/loss_step=0.141, global_step=415.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  38%|███▊      | 454/1208 [13:13<21:57,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000524, train/loss_step=0.156, global_step=415.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  38%|███▊      | 455/1208 [13:14<21:54,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000524, train/loss_step=0.156, global_step=415.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  38%|███▊      | 455/1208 [13:14<21:54,  1.75s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=8.66e-5, train/loss_step=0.0204, global_step=415.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  38%|███▊      | 456/1208 [13:17<21:55,  1.75s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=8.66e-5, train/loss_step=0.0204, global_step=415.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  38%|███▊      | 456/1208 [13:17<21:55,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.0019, train/loss_step=0.331, global_step=415.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  38%|███▊      | 457/1208 [13:18<21:52,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.0019, train/loss_step=0.331, global_step=415.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  38%|███▊      | 457/1208 [13:18<21:52,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.000189, train/loss_step=0.0527, global_step=416.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  38%|███▊      | 458/1208 [13:19<21:49,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.000189, train/loss_step=0.0527, global_step=416.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  38%|███▊      | 458/1208 [13:19<21:49,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.00014, train/loss_step=0.0356, global_step=416.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  38%|███▊      | 459/1208 [13:20<21:46,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.00014, train/loss_step=0.0356, global_step=416.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  38%|███▊      | 459/1208 [13:20<21:46,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000856, train/loss_step=0.230, global_step=416.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  38%|███▊      | 460/1208 [13:23<21:47,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000856, train/loss_step=0.230, global_step=416.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  38%|███▊      | 460/1208 [13:23<21:47,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0795, train/loss_vlb_step=0.000267, train/loss_step=0.0795, global_step=416.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  38%|███▊      | 461/1208 [13:24<21:44,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0795, train/loss_vlb_step=0.000267, train/loss_step=0.0795, global_step=416.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  38%|███▊      | 461/1208 [13:24<21:44,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0371, train/loss_vlb_step=0.000142, train/loss_step=0.0371, global_step=417.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  38%|███▊      | 462/1208 [13:25<21:41,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0371, train/loss_vlb_step=0.000142, train/loss_step=0.0371, global_step=417.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  38%|███▊      | 462/1208 [13:25<21:41,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0355, train/loss_vlb_step=0.000138, train/loss_step=0.0355, global_step=417.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  38%|███▊      | 463/1208 [13:27<21:38,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0355, train/loss_vlb_step=0.000138, train/loss_step=0.0355, global_step=417.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  38%|███▊      | 463/1208 [13:27<21:38,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000909, train/loss_step=0.233, global_step=417.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  38%|███▊      | 464/1208 [13:30<21:39,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000909, train/loss_step=0.233, global_step=417.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  38%|███▊      | 464/1208 [13:30<21:39,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.729, train/loss_vlb_step=0.0316, train/loss_step=0.729, global_step=417.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  38%|███▊      | 465/1208 [13:31<21:36,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.729, train/loss_vlb_step=0.0316, train/loss_step=0.729, global_step=417.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  38%|███▊      | 465/1208 [13:31<21:36,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.000155, train/loss_step=0.043, global_step=418.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  39%|███▊      | 466/1208 [13:32<21:33,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.000155, train/loss_step=0.043, global_step=418.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  39%|███▊      | 466/1208 [13:32<21:33,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0428, train/loss_vlb_step=0.000162, train/loss_step=0.0428, global_step=418.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  39%|███▊      | 467/1208 [13:33<21:30,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0428, train/loss_vlb_step=0.000162, train/loss_step=0.0428, global_step=418.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  39%|███▊      | 467/1208 [13:33<21:30,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00113, train/loss_step=0.282, global_step=418.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  39%|███▊      | 468/1208 [13:36<21:31,  1.75s/it, loss=0.155, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00113, train/loss_step=0.282, global_step=418.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  39%|███▊      | 468/1208 [13:36<21:31,  1.75s/it, loss=0.163, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000563, train/loss_step=0.167, global_step=418.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  39%|███▉      | 469/1208 [13:37<21:28,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000563, train/loss_step=0.167, global_step=418.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  39%|███▉      | 469/1208 [13:37<21:28,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0922, train/loss_vlb_step=0.000306, train/loss_step=0.0922, global_step=419.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  39%|███▉      | 470/1208 [13:38<21:25,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0922, train/loss_vlb_step=0.000306, train/loss_step=0.0922, global_step=419.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  39%|███▉      | 470/1208 [13:38<21:25,  1.74s/it, loss=0.176, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00182, train/loss_step=0.359, global_step=419.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  39%|███▉      | 471/1208 [13:39<21:22,  1.74s/it, loss=0.176, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00182, train/loss_step=0.359, global_step=419.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  39%|███▉      | 471/1208 [13:39<21:22,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.31e-5, train/loss_step=0.0142, global_step=419.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  39%|███▉      | 472/1208 [13:43<21:23,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.31e-5, train/loss_step=0.0142, global_step=419.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  39%|███▉      | 472/1208 [13:43<21:23,  1.74s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0518, train/loss_vlb_step=0.000188, train/loss_step=0.0518, global_step=419.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  39%|███▉      | 473/1208 [13:44<21:20,  1.74s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0518, train/loss_vlb_step=0.000188, train/loss_step=0.0518, global_step=419.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  39%|███▉      | 473/1208 [13:44<21:20,  1.74s/it, loss=0.176, v_num=0, train/loss_simple_step=0.534, train/loss_vlb_step=0.00655, train/loss_step=0.534, global_step=420.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  39%|███▉      | 474/1208 [13:45<21:17,  1.74s/it, loss=0.176, v_num=0, train/loss_simple_step=0.534, train/loss_vlb_step=0.00655, train/loss_step=0.534, global_step=420.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  39%|███▉      | 474/1208 [13:45<21:17,  1.74s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.83e-5, train/loss_step=0.0032, global_step=420.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  39%|███▉      | 475/1208 [13:46<21:15,  1.74s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.83e-5, train/loss_step=0.0032, global_step=420.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  39%|███▉      | 475/1208 [13:46<21:15,  1.74s/it, loss=0.169, v_num=0, train/loss_simple_step=0.030, train/loss_vlb_step=0.000116, train/loss_step=0.030, global_step=420.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  39%|███▉      | 476/1208 [13:49<21:15,  1.74s/it, loss=0.169, v_num=0, train/loss_simple_step=0.030, train/loss_vlb_step=0.000116, train/loss_step=0.030, global_step=420.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  39%|███▉      | 476/1208 [13:49<21:15,  1.74s/it, loss=0.157, v_num=0, train/loss_simple_step=0.092, train/loss_vlb_step=0.000306, train/loss_step=0.092, global_step=420.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  39%|███▉      | 477/1208 [13:50<21:12,  1.74s/it, loss=0.157, v_num=0, train/loss_simple_step=0.092, train/loss_vlb_step=0.000306, train/loss_step=0.092, global_step=420.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  39%|███▉      | 477/1208 [13:50<21:12,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00174, train/loss_step=0.314, global_step=421.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  40%|███▉      | 478/1208 [13:51<21:10,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00174, train/loss_step=0.314, global_step=421.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  40%|███▉      | 478/1208 [13:51<21:10,  1.74s/it, loss=0.185, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00139, train/loss_step=0.333, global_step=421.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  40%|███▉      | 479/1208 [13:52<21:07,  1.74s/it, loss=0.185, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00139, train/loss_step=0.333, global_step=421.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  40%|███▉      | 479/1208 [13:52<21:07,  1.74s/it, loss=0.199, v_num=0, train/loss_simple_step=0.507, train/loss_vlb_step=0.00622, train/loss_step=0.507, global_step=421.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  40%|███▉      | 480/1208 [13:56<21:07,  1.74s/it, loss=0.199, v_num=0, train/loss_simple_step=0.507, train/loss_vlb_step=0.00622, train/loss_step=0.507, global_step=421.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  40%|███▉      | 480/1208 [13:56<21:07,  1.74s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=8e-5, train/loss_step=0.0184, global_step=421.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  40%|███▉      | 481/1208 [13:57<21:05,  1.74s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=8e-5, train/loss_step=0.0184, global_step=421.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  40%|███▉      | 481/1208 [13:57<21:05,  1.74s/it, loss=0.231, v_num=0, train/loss_simple_step=0.737, train/loss_vlb_step=0.0474, train/loss_step=0.737, global_step=422.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  40%|███▉      | 482/1208 [13:58<21:02,  1.74s/it, loss=0.231, v_num=0, train/loss_simple_step=0.737, train/loss_vlb_step=0.0474, train/loss_step=0.737, global_step=422.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  40%|███▉      | 482/1208 [13:58<21:02,  1.74s/it, loss=0.251, v_num=0, train/loss_simple_step=0.431, train/loss_vlb_step=0.00282, train/loss_step=0.431, global_step=422.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  40%|███▉      | 483/1208 [13:59<20:59,  1.74s/it, loss=0.251, v_num=0, train/loss_simple_step=0.431, train/loss_vlb_step=0.00282, train/loss_step=0.431, global_step=422.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  40%|███▉      | 483/1208 [13:59<20:59,  1.74s/it, loss=0.241, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.000124, train/loss_step=0.032, global_step=422.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  40%|████      | 484/1208 [14:02<21:00,  1.74s/it, loss=0.241, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.000124, train/loss_step=0.032, global_step=422.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  40%|████      | 484/1208 [14:02<21:00,  1.74s/it, loss=0.213, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000605, train/loss_step=0.178, global_step=422.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  40%|████      | 485/1208 [14:03<20:57,  1.74s/it, loss=0.213, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000605, train/loss_step=0.178, global_step=422.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  40%|████      | 485/1208 [14:03<20:57,  1.74s/it, loss=0.223, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.000981, train/loss_step=0.247, global_step=423.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  40%|████      | 486/1208 [14:04<20:54,  1.74s/it, loss=0.223, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.000981, train/loss_step=0.247, global_step=423.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  40%|████      | 486/1208 [14:04<20:54,  1.74s/it, loss=0.242, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.0027, train/loss_step=0.413, global_step=423.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  40%|████      | 487/1208 [14:05<20:51,  1.74s/it, loss=0.242, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.0027, train/loss_step=0.413, global_step=423.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  40%|████      | 487/1208 [14:05<20:51,  1.74s/it, loss=0.229, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000117, train/loss_step=0.0288, global_step=423.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  40%|████      | 488/1208 [14:08<20:52,  1.74s/it, loss=0.229, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000117, train/loss_step=0.0288, global_step=423.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  40%|████      | 488/1208 [14:08<20:52,  1.74s/it, loss=0.238, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00179, train/loss_step=0.334, global_step=423.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  40%|████      | 489/1208 [14:09<20:49,  1.74s/it, loss=0.238, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00179, train/loss_step=0.334, global_step=423.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  40%|████      | 489/1208 [14:09<20:49,  1.74s/it, loss=0.239, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000432, train/loss_step=0.132, global_step=424.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  41%|████      | 490/1208 [14:11<20:47,  1.74s/it, loss=0.239, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000432, train/loss_step=0.132, global_step=424.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  41%|████      | 490/1208 [14:11<20:47,  1.74s/it, loss=0.225, v_num=0, train/loss_simple_step=0.0758, train/loss_vlb_step=0.000268, train/loss_step=0.0758, global_step=424.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  41%|████      | 491/1208 [14:12<20:44,  1.74s/it, loss=0.225, v_num=0, train/loss_simple_step=0.0758, train/loss_vlb_step=0.000268, train/loss_step=0.0758, global_step=424.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  41%|████      | 491/1208 [14:12<20:44,  1.74s/it, loss=0.229, v_num=0, train/loss_simple_step=0.0887, train/loss_vlb_step=0.000294, train/loss_step=0.0887, global_step=424.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  41%|████      | 492/1208 [14:15<20:44,  1.74s/it, loss=0.229, v_num=0, train/loss_simple_step=0.0887, train/loss_vlb_step=0.000294, train/loss_step=0.0887, global_step=424.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  41%|████      | 492/1208 [14:15<20:44,  1.74s/it, loss=0.236, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000662, train/loss_step=0.185, global_step=424.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  41%|████      | 493/1208 [14:16<20:41,  1.74s/it, loss=0.236, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000662, train/loss_step=0.185, global_step=424.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  41%|████      | 493/1208 [14:16<20:41,  1.74s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.81e-5, train/loss_step=0.0236, global_step=425.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  41%|████      | 494/1208 [14:17<20:39,  1.74s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.81e-5, train/loss_step=0.0236, global_step=425.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  41%|████      | 494/1208 [14:17<20:39,  1.74s/it, loss=0.237, v_num=0, train/loss_simple_step=0.545, train/loss_vlb_step=0.00998, train/loss_step=0.545, global_step=425.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  41%|████      | 495/1208 [14:18<20:36,  1.73s/it, loss=0.237, v_num=0, train/loss_simple_step=0.545, train/loss_vlb_step=0.00998, train/loss_step=0.545, global_step=425.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  41%|████      | 495/1208 [14:18<20:36,  1.73s/it, loss=0.241, v_num=0, train/loss_simple_step=0.0989, train/loss_vlb_step=0.000325, train/loss_step=0.0989, global_step=425.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  41%|████      | 496/1208 [14:21<20:37,  1.74s/it, loss=0.241, v_num=0, train/loss_simple_step=0.0989, train/loss_vlb_step=0.000325, train/loss_step=0.0989, global_step=425.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  41%|████      | 496/1208 [14:21<20:37,  1.74s/it, loss=0.238, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.00013, train/loss_step=0.0326, global_step=425.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  41%|████      | 497/1208 [14:22<20:34,  1.74s/it, loss=0.238, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.00013, train/loss_step=0.0326, global_step=425.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  41%|████      | 497/1208 [14:22<20:34,  1.74s/it, loss=0.234, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.00104, train/loss_step=0.246, global_step=426.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  41%|████      | 498/1208 [14:23<20:31,  1.73s/it, loss=0.234, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.00104, train/loss_step=0.246, global_step=426.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  41%|████      | 498/1208 [14:23<20:31,  1.73s/it, loss=0.22, v_num=0, train/loss_simple_step=0.0442, train/loss_vlb_step=0.000157, train/loss_step=0.0442, global_step=426.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  41%|████▏     | 499/1208 [14:24<20:28,  1.73s/it, loss=0.22, v_num=0, train/loss_simple_step=0.0442, train/loss_vlb_step=0.000157, train/loss_step=0.0442, global_step=426.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  41%|████▏     | 499/1208 [14:24<20:28,  1.73s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00626, train/loss_vlb_step=3.24e-5, train/loss_step=0.00626, global_step=426.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  41%|████▏     | 500/1208 [14:28<20:29,  1.74s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00626, train/loss_vlb_step=3.24e-5, train/loss_step=0.00626, global_step=426.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  41%|████▏     | 500/1208 [14:28<20:29,  1.74s/it, loss=0.208, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00116, train/loss_step=0.276, global_step=426.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  41%|████▏     | 501/1208 [14:29<20:26,  1.74s/it, loss=0.208, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00116, train/loss_step=0.276, global_step=426.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  41%|████▏     | 501/1208 [14:29<20:26,  1.74s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00806, train/loss_vlb_step=3.87e-5, train/loss_step=0.00806, global_step=427.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  42%|████▏     | 502/1208 [14:30<20:24,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00806, train/loss_vlb_step=3.87e-5, train/loss_step=0.00806, global_step=427.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  42%|████▏     | 502/1208 [14:30<20:24,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00311, train/loss_step=0.430, global_step=427.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  42%|████▏     | 503/1208 [14:31<20:21,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00311, train/loss_step=0.430, global_step=427.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  42%|████▏     | 503/1208 [14:31<20:21,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0719, train/loss_vlb_step=0.000244, train/loss_step=0.0719, global_step=427.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  42%|████▏     | 504/1208 [14:34<20:21,  1.74s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0719, train/loss_vlb_step=0.000244, train/loss_step=0.0719, global_step=427.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  42%|████▏     | 504/1208 [14:34<20:21,  1.74s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.25e-5, train/loss_step=0.0197, global_step=427.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  42%|████▏     | 505/1208 [14:35<20:19,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.25e-5, train/loss_step=0.0197, global_step=427.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  42%|████▏     | 505/1208 [14:35<20:19,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00275, train/loss_step=0.409, global_step=428.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  42%|████▏     | 506/1208 [14:36<20:16,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00275, train/loss_step=0.409, global_step=428.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  42%|████▏     | 506/1208 [14:36<20:16,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00205, train/loss_step=0.357, global_step=428.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  42%|████▏     | 507/1208 [14:37<20:13,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00205, train/loss_step=0.357, global_step=428.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  42%|████▏     | 507/1208 [14:37<20:13,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000146, train/loss_step=0.0388, global_step=428.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  42%|████▏     | 508/1208 [14:41<20:14,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000146, train/loss_step=0.0388, global_step=428.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  42%|████▏     | 508/1208 [14:41<20:14,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000745, train/loss_step=0.215, global_step=428.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  42%|████▏     | 509/1208 [14:42<20:11,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000745, train/loss_step=0.215, global_step=428.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  42%|████▏     | 509/1208 [14:42<20:11,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0688, train/loss_vlb_step=0.000238, train/loss_step=0.0688, global_step=429.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  42%|████▏     | 510/1208 [14:43<20:08,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0688, train/loss_vlb_step=0.000238, train/loss_step=0.0688, global_step=429.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  42%|████▏     | 510/1208 [14:43<20:08,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00956, train/loss_vlb_step=4.46e-5, train/loss_step=0.00956, global_step=429.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  42%|████▏     | 511/1208 [14:44<20:06,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00956, train/loss_vlb_step=4.46e-5, train/loss_step=0.00956, global_step=429.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  42%|████▏     | 511/1208 [14:44<20:06,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00206, train/loss_step=0.379, global_step=429.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  42%|████▏     | 512/1208 [14:47<20:06,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00206, train/loss_step=0.379, global_step=429.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  42%|████▏     | 512/1208 [14:47<20:06,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0575, train/loss_vlb_step=0.000203, train/loss_step=0.0575, global_step=429.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  42%|████▏     | 513/1208 [14:48<20:03,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0575, train/loss_vlb_step=0.000203, train/loss_step=0.0575, global_step=429.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  42%|████▏     | 513/1208 [14:48<20:03,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=7.35e-5, train/loss_step=0.0162, global_step=430.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  43%|████▎     | 514/1208 [14:49<20:01,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=7.35e-5, train/loss_step=0.0162, global_step=430.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  43%|████▎     | 514/1208 [14:49<20:01,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000357, train/loss_step=0.109, global_step=430.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  43%|████▎     | 515/1208 [14:50<19:58,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000357, train/loss_step=0.109, global_step=430.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  43%|████▎     | 515/1208 [14:50<19:58,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0871, train/loss_vlb_step=0.000287, train/loss_step=0.0871, global_step=430.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  43%|████▎     | 516/1208 [14:53<19:58,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0871, train/loss_vlb_step=0.000287, train/loss_step=0.0871, global_step=430.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  43%|████▎     | 516/1208 [14:53<19:58,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.48e-5, train/loss_step=0.0118, global_step=430.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  43%|████▎     | 517/1208 [14:54<19:56,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.48e-5, train/loss_step=0.0118, global_step=430.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  43%|████▎     | 517/1208 [14:54<19:56,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00137, train/loss_step=0.320, global_step=431.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  43%|████▎     | 518/1208 [14:55<19:53,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00137, train/loss_step=0.320, global_step=431.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  43%|████▎     | 518/1208 [14:55<19:53,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00681, train/loss_vlb_step=3.49e-5, train/loss_step=0.00681, global_step=431.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  43%|████▎     | 519/1208 [14:57<19:50,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00681, train/loss_vlb_step=3.49e-5, train/loss_step=0.00681, global_step=431.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  43%|████▎     | 519/1208 [14:57<19:50,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.62e-5, train/loss_step=0.0236, global_step=431.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  43%|████▎     | 520/1208 [15:00<19:51,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.62e-5, train/loss_step=0.0236, global_step=431.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  43%|████▎     | 520/1208 [15:00<19:51,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0958, train/loss_vlb_step=0.000322, train/loss_step=0.0958, global_step=431.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  43%|████▎     | 521/1208 [15:01<19:48,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0958, train/loss_vlb_step=0.000322, train/loss_step=0.0958, global_step=431.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  43%|████▎     | 521/1208 [15:01<19:48,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0784, train/loss_vlb_step=0.000262, train/loss_step=0.0784, global_step=432.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  43%|████▎     | 522/1208 [15:02<19:46,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0784, train/loss_vlb_step=0.000262, train/loss_step=0.0784, global_step=432.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  43%|████▎     | 522/1208 [15:02<19:46,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0552, train/loss_vlb_step=0.000185, train/loss_step=0.0552, global_step=432.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  43%|████▎     | 523/1208 [15:03<19:43,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0552, train/loss_vlb_step=0.000185, train/loss_step=0.0552, global_step=432.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  43%|████▎     | 523/1208 [15:03<19:43,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00212, train/loss_step=0.362, global_step=432.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  43%|████▎     | 524/1208 [15:06<19:43,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00212, train/loss_step=0.362, global_step=432.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  43%|████▎     | 524/1208 [15:06<19:43,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00185, train/loss_step=0.363, global_step=432.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  43%|████▎     | 525/1208 [15:07<19:41,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00185, train/loss_step=0.363, global_step=432.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  43%|████▎     | 525/1208 [15:07<19:41,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000179, train/loss_step=0.0514, global_step=433.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  44%|████▎     | 526/1208 [15:08<19:38,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000179, train/loss_step=0.0514, global_step=433.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  44%|████▎     | 526/1208 [15:08<19:38,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0789, train/loss_vlb_step=0.00026, train/loss_step=0.0789, global_step=433.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  44%|████▎     | 527/1208 [15:09<19:35,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0789, train/loss_vlb_step=0.00026, train/loss_step=0.0789, global_step=433.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  44%|████▎     | 527/1208 [15:09<19:35,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.594, train/loss_vlb_step=0.0129, train/loss_step=0.594, global_step=433.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  44%|████▎     | 528/1208 [15:13<19:36,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.594, train/loss_vlb_step=0.0129, train/loss_step=0.594, global_step=433.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  44%|████▎     | 528/1208 [15:13<19:36,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.00089, train/loss_step=0.235, global_step=433.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  44%|████▍     | 529/1208 [15:14<19:33,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.00089, train/loss_step=0.235, global_step=433.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  44%|████▍     | 529/1208 [15:14<19:33,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=1.42e-5, train/loss_step=0.00238, global_step=434.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  44%|████▍     | 530/1208 [15:15<19:30,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=1.42e-5, train/loss_step=0.00238, global_step=434.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  44%|████▍     | 530/1208 [15:15<19:30,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00485, train/loss_vlb_step=2.63e-5, train/loss_step=0.00485, global_step=434.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  44%|████▍     | 531/1208 [15:16<19:28,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00485, train/loss_vlb_step=2.63e-5, train/loss_step=0.00485, global_step=434.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  44%|████▍     | 531/1208 [15:16<19:28,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00368, train/loss_step=0.385, global_step=434.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  44%|████▍     | 532/1208 [15:19<19:28,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00368, train/loss_step=0.385, global_step=434.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  44%|████▍     | 532/1208 [15:19<19:28,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.58e-5, train/loss_step=0.0174, global_step=434.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  44%|████▍     | 533/1208 [15:20<19:26,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.58e-5, train/loss_step=0.0174, global_step=434.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  44%|████▍     | 533/1208 [15:20<19:26,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.5e-5, train/loss_step=0.0238, global_step=435.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  44%|████▍     | 534/1208 [15:21<19:23,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.5e-5, train/loss_step=0.0238, global_step=435.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  44%|████▍     | 534/1208 [15:21<19:23,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000424, train/loss_step=0.128, global_step=435.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  44%|████▍     | 535/1208 [15:22<19:20,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000424, train/loss_step=0.128, global_step=435.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  44%|████▍     | 535/1208 [15:22<19:20,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=2.06e-5, train/loss_step=0.00378, global_step=435.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  44%|████▍     | 536/1208 [15:26<19:20,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=2.06e-5, train/loss_step=0.00378, global_step=435.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  44%|████▍     | 536/1208 [15:26<19:20,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00107, train/loss_step=0.253, global_step=435.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  44%|████▍     | 537/1208 [15:27<19:18,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00107, train/loss_step=0.253, global_step=435.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  44%|████▍     | 537/1208 [15:27<19:18,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000427, train/loss_step=0.129, global_step=436.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  45%|████▍     | 538/1208 [15:28<19:15,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000427, train/loss_step=0.129, global_step=436.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  45%|████▍     | 538/1208 [15:28<19:15,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000411, train/loss_step=0.125, global_step=436.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  45%|████▍     | 539/1208 [15:29<19:13,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000411, train/loss_step=0.125, global_step=436.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  45%|████▍     | 539/1208 [15:29<19:13,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.14e-5, train/loss_step=0.0163, global_step=436.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  45%|████▍     | 540/1208 [15:32<19:13,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.14e-5, train/loss_step=0.0163, global_step=436.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  45%|████▍     | 540/1208 [15:32<19:13,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.463, train/loss_vlb_step=0.00351, train/loss_step=0.463, global_step=436.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  45%|████▍     | 541/1208 [15:33<19:10,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.463, train/loss_vlb_step=0.00351, train/loss_step=0.463, global_step=436.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  45%|████▍     | 541/1208 [15:33<19:10,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000103, train/loss_step=0.0264, global_step=437.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  45%|████▍     | 542/1208 [15:34<19:08,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000103, train/loss_step=0.0264, global_step=437.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  45%|████▍     | 542/1208 [15:34<19:08,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000695, train/loss_step=0.198, global_step=437.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  45%|████▍     | 543/1208 [15:35<19:05,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000695, train/loss_step=0.198, global_step=437.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  45%|████▍     | 543/1208 [15:35<19:05,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000512, train/loss_step=0.152, global_step=437.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  45%|████▌     | 544/1208 [15:38<19:06,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000512, train/loss_step=0.152, global_step=437.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  45%|████▌     | 544/1208 [15:38<19:06,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0694, train/loss_vlb_step=0.000239, train/loss_step=0.0694, global_step=437.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  45%|████▌     | 545/1208 [15:39<19:03,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0694, train/loss_vlb_step=0.000239, train/loss_step=0.0694, global_step=437.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  45%|████▌     | 545/1208 [15:39<19:03,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.593, train/loss_vlb_step=0.0184, train/loss_step=0.593, global_step=438.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  45%|████▌     | 546/1208 [15:41<19:00,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.593, train/loss_vlb_step=0.0184, train/loss_step=0.593, global_step=438.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  45%|████▌     | 546/1208 [15:41<19:00,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000499, train/loss_step=0.151, global_step=438.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  45%|████▌     | 547/1208 [15:42<18:58,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000499, train/loss_step=0.151, global_step=438.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  45%|████▌     | 547/1208 [15:42<18:58,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.32e-5, train/loss_step=0.0137, global_step=438.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  45%|████▌     | 548/1208 [15:45<18:58,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.32e-5, train/loss_step=0.0137, global_step=438.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  45%|████▌     | 548/1208 [15:45<18:58,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00679, train/loss_vlb_step=3.35e-5, train/loss_step=0.00679, global_step=438.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  45%|████▌     | 549/1208 [15:46<18:55,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00679, train/loss_vlb_step=3.35e-5, train/loss_step=0.00679, global_step=438.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  45%|████▌     | 549/1208 [15:46<18:55,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0952, train/loss_vlb_step=0.000315, train/loss_step=0.0952, global_step=439.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  46%|████▌     | 550/1208 [15:47<18:53,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0952, train/loss_vlb_step=0.000315, train/loss_step=0.0952, global_step=439.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  46%|████▌     | 550/1208 [15:47<18:53,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7.25e-5, train/loss_step=0.0165, global_step=439.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  46%|████▌     | 551/1208 [15:48<18:50,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7.25e-5, train/loss_step=0.0165, global_step=439.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  46%|████▌     | 551/1208 [15:48<18:50,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=9.53e-5, train/loss_step=0.022, global_step=439.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  46%|████▌     | 552/1208 [15:51<18:50,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=9.53e-5, train/loss_step=0.022, global_step=439.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  46%|████▌     | 552/1208 [15:51<18:50,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.39e-5, train/loss_step=0.0208, global_step=439.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  46%|████▌     | 553/1208 [15:52<18:48,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.39e-5, train/loss_step=0.0208, global_step=439.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  46%|████▌     | 553/1208 [15:52<18:48,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000443, train/loss_step=0.134, global_step=440.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  46%|████▌     | 554/1208 [15:53<18:45,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000443, train/loss_step=0.134, global_step=440.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  46%|████▌     | 554/1208 [15:53<18:45,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000887, train/loss_step=0.241, global_step=440.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  46%|████▌     | 555/1208 [15:54<18:43,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000887, train/loss_step=0.241, global_step=440.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  46%|████▌     | 555/1208 [15:54<18:43,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0461, train/loss_vlb_step=0.000165, train/loss_step=0.0461, global_step=440.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  46%|████▌     | 556/1208 [15:58<18:43,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0461, train/loss_vlb_step=0.000165, train/loss_step=0.0461, global_step=440.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  46%|████▌     | 556/1208 [15:58<18:43,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=2.74e-5, train/loss_step=0.00545, global_step=440.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  46%|████▌     | 557/1208 [15:59<18:41,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=2.74e-5, train/loss_step=0.00545, global_step=440.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  46%|████▌     | 557/1208 [15:59<18:41,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0775, train/loss_vlb_step=0.000258, train/loss_step=0.0775, global_step=441.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  46%|████▌     | 558/1208 [16:00<18:38,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0775, train/loss_vlb_step=0.000258, train/loss_step=0.0775, global_step=441.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  46%|████▌     | 558/1208 [16:00<18:38,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=441.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  46%|████▋     | 559/1208 [16:01<18:36,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=441.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  46%|████▋     | 559/1208 [16:01<18:36,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.23e-5, train/loss_step=0.0134, global_step=441.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  46%|████▋     | 560/1208 [16:04<18:36,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.23e-5, train/loss_step=0.0134, global_step=441.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  46%|████▋     | 560/1208 [16:04<18:36,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000714, train/loss_step=0.191, global_step=441.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  46%|████▋     | 561/1208 [16:05<18:33,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000714, train/loss_step=0.191, global_step=441.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  46%|████▋     | 561/1208 [16:05<18:33,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.93e-5, train/loss_step=0.0136, global_step=442.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  47%|████▋     | 562/1208 [16:06<18:31,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.93e-5, train/loss_step=0.0136, global_step=442.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  47%|████▋     | 562/1208 [16:06<18:31,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0677, train/loss_vlb_step=0.000231, train/loss_step=0.0677, global_step=442.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  47%|████▋     | 563/1208 [16:07<18:28,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0677, train/loss_vlb_step=0.000231, train/loss_step=0.0677, global_step=442.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  47%|████▋     | 563/1208 [16:07<18:28,  1.72s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.86e-5, train/loss_step=0.0154, global_step=442.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  47%|████▋     | 564/1208 [16:11<18:28,  1.72s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.86e-5, train/loss_step=0.0154, global_step=442.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  47%|████▋     | 564/1208 [16:11<18:28,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00281, train/loss_step=0.418, global_step=442.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  47%|████▋     | 565/1208 [16:12<18:26,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00281, train/loss_step=0.418, global_step=442.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  47%|████▋     | 565/1208 [16:12<18:26,  1.72s/it, loss=0.0891, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000427, train/loss_step=0.130, global_step=443.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  47%|████▋     | 566/1208 [16:13<18:23,  1.72s/it, loss=0.0891, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000427, train/loss_step=0.130, global_step=443.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  47%|████▋     | 566/1208 [16:13<18:23,  1.72s/it, loss=0.0991, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00243, train/loss_step=0.350, global_step=443.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  47%|████▋     | 567/1208 [16:14<18:21,  1.72s/it, loss=0.0991, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00243, train/loss_step=0.350, global_step=443.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  47%|████▋     | 567/1208 [16:14<18:21,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00136, train/loss_step=0.290, global_step=443.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  47%|████▋     | 568/1208 [16:17<18:21,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00136, train/loss_step=0.290, global_step=443.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  47%|████▋     | 568/1208 [16:17<18:21,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0797, train/loss_vlb_step=0.000262, train/loss_step=0.0797, global_step=443.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  47%|████▋     | 569/1208 [16:18<18:19,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0797, train/loss_vlb_step=0.000262, train/loss_step=0.0797, global_step=443.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  47%|████▋     | 569/1208 [16:18<18:19,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0763, train/loss_vlb_step=0.000262, train/loss_step=0.0763, global_step=444.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  47%|████▋     | 570/1208 [16:19<18:16,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0763, train/loss_vlb_step=0.000262, train/loss_step=0.0763, global_step=444.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  47%|████▋     | 570/1208 [16:19<18:16,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00116, train/loss_step=0.294, global_step=444.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  47%|████▋     | 571/1208 [16:20<18:14,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00116, train/loss_step=0.294, global_step=444.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  47%|████▋     | 571/1208 [16:20<18:14,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.000177, train/loss_step=0.0471, global_step=444.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  47%|████▋     | 572/1208 [16:23<18:14,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.000177, train/loss_step=0.0471, global_step=444.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  47%|████▋     | 572/1208 [16:24<18:14,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00798, train/loss_vlb_step=3.89e-5, train/loss_step=0.00798, global_step=444.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  47%|████▋     | 573/1208 [16:25<18:11,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00798, train/loss_vlb_step=3.89e-5, train/loss_step=0.00798, global_step=444.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  47%|████▋     | 573/1208 [16:25<18:11,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=1.43e-5, train/loss_step=0.00243, global_step=445.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  48%|████▊     | 574/1208 [16:26<18:09,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=1.43e-5, train/loss_step=0.00243, global_step=445.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  48%|████▊     | 574/1208 [16:26<18:09,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000532, train/loss_step=0.157, global_step=445.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  48%|████▊     | 575/1208 [16:27<18:06,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000532, train/loss_step=0.157, global_step=445.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  48%|████▊     | 575/1208 [16:27<18:06,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00313, train/loss_step=0.413, global_step=445.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  48%|████▊     | 576/1208 [16:30<18:06,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00313, train/loss_step=0.413, global_step=445.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  48%|████▊     | 576/1208 [16:30<18:06,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0584, train/loss_vlb_step=0.000202, train/loss_step=0.0584, global_step=445.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  48%|████▊     | 577/1208 [16:31<18:04,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0584, train/loss_vlb_step=0.000202, train/loss_step=0.0584, global_step=445.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  48%|████▊     | 577/1208 [16:31<18:04,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.68e-5, train/loss_step=0.0156, global_step=446.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  48%|████▊     | 578/1208 [16:32<18:01,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.68e-5, train/loss_step=0.0156, global_step=446.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  48%|████▊     | 578/1208 [16:32<18:01,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.000934, train/loss_step=0.243, global_step=446.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  48%|████▊     | 579/1208 [16:33<17:59,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.000934, train/loss_step=0.243, global_step=446.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  48%|████▊     | 579/1208 [16:33<17:59,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.41e-5, train/loss_step=0.0228, global_step=446.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  48%|████▊     | 580/1208 [16:36<17:59,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.41e-5, train/loss_step=0.0228, global_step=446.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  48%|████▊     | 580/1208 [16:36<17:59,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00121, train/loss_step=0.307, global_step=446.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  48%|████▊     | 581/1208 [16:38<17:57,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00121, train/loss_step=0.307, global_step=446.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  48%|████▊     | 581/1208 [16:38<17:57,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00885, train/loss_vlb_step=4.45e-5, train/loss_step=0.00885, global_step=447.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  48%|████▊     | 582/1208 [16:39<17:54,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00885, train/loss_vlb_step=4.45e-5, train/loss_step=0.00885, global_step=447.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  48%|████▊     | 582/1208 [16:39<17:54,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000516, train/loss_step=0.155, global_step=447.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  48%|████▊     | 583/1208 [16:40<17:52,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000516, train/loss_step=0.155, global_step=447.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  48%|████▊     | 583/1208 [16:40<17:52,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=8.06e-5, train/loss_step=0.0188, global_step=447.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  48%|████▊     | 584/1208 [16:43<17:52,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=8.06e-5, train/loss_step=0.0188, global_step=447.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  48%|████▊     | 584/1208 [16:43<17:52,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00235, train/loss_step=0.415, global_step=447.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  48%|████▊     | 585/1208 [16:44<17:49,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00235, train/loss_step=0.415, global_step=447.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  48%|████▊     | 585/1208 [16:44<17:49,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0954, train/loss_vlb_step=0.000318, train/loss_step=0.0954, global_step=448.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  49%|████▊     | 586/1208 [16:45<17:47,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0954, train/loss_vlb_step=0.000318, train/loss_step=0.0954, global_step=448.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  49%|████▊     | 586/1208 [16:45<17:47,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=8.16e-5, train/loss_step=0.0184, global_step=448.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  49%|████▊     | 587/1208 [16:46<17:44,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=8.16e-5, train/loss_step=0.0184, global_step=448.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  49%|████▊     | 587/1208 [16:46<17:44,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00428, train/loss_vlb_step=2.3e-5, train/loss_step=0.00428, global_step=448.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  49%|████▊     | 588/1208 [16:49<17:44,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00428, train/loss_vlb_step=2.3e-5, train/loss_step=0.00428, global_step=448.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  49%|████▊     | 588/1208 [16:49<17:44,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000904, train/loss_step=0.230, global_step=448.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  49%|████▉     | 589/1208 [16:50<17:42,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000904, train/loss_step=0.230, global_step=448.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  49%|████▉     | 589/1208 [16:50<17:42,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=8.74e-5, train/loss_step=0.0225, global_step=449.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  49%|████▉     | 590/1208 [16:52<17:40,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=8.74e-5, train/loss_step=0.0225, global_step=449.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  49%|████▉     | 590/1208 [16:52<17:40,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.000239, train/loss_step=0.0672, global_step=449.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  49%|████▉     | 591/1208 [16:53<17:37,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.000239, train/loss_step=0.0672, global_step=449.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  49%|████▉     | 591/1208 [16:53<17:37,  1.71s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=0.000101, train/loss_step=0.0252, global_step=449.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  49%|████▉     | 592/1208 [16:56<17:37,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=0.000101, train/loss_step=0.0252, global_step=449.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  49%|████▉     | 592/1208 [16:56<17:37,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.39e-5, train/loss_step=0.0123, global_step=449.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  49%|████▉     | 593/1208 [16:57<17:35,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.39e-5, train/loss_step=0.0123, global_step=449.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  49%|████▉     | 593/1208 [16:57<17:35,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00125, train/loss_step=0.298, global_step=450.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  49%|████▉     | 594/1208 [16:58<17:32,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00125, train/loss_step=0.298, global_step=450.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  49%|████▉     | 594/1208 [16:58<17:32,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000787, train/loss_step=0.208, global_step=450.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  49%|████▉     | 595/1208 [16:59<17:30,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000787, train/loss_step=0.208, global_step=450.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  49%|████▉     | 595/1208 [16:59<17:30,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000499, train/loss_step=0.147, global_step=450.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  49%|████▉     | 596/1208 [17:02<17:30,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000499, train/loss_step=0.147, global_step=450.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  49%|████▉     | 596/1208 [17:02<17:30,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=2.14e-5, train/loss_step=0.00381, global_step=450.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  49%|████▉     | 597/1208 [17:03<17:27,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=2.14e-5, train/loss_step=0.00381, global_step=450.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  49%|████▉     | 597/1208 [17:03<17:27,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=1.1e-5, train/loss_step=0.0018, global_step=451.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  50%|████▉     | 598/1208 [17:04<17:25,  1.71s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=1.1e-5, train/loss_step=0.0018, global_step=451.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  50%|████▉     | 598/1208 [17:04<17:25,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000411, train/loss_step=0.124, global_step=451.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  50%|████▉     | 599/1208 [17:05<17:23,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000411, train/loss_step=0.124, global_step=451.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  50%|████▉     | 599/1208 [17:05<17:23,  1.71s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0834, train/loss_vlb_step=0.000287, train/loss_step=0.0834, global_step=451.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  50%|████▉     | 600/1208 [17:09<17:23,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0834, train/loss_vlb_step=0.000287, train/loss_step=0.0834, global_step=451.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  50%|████▉     | 600/1208 [17:09<17:23,  1.72s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.09e-5, train/loss_step=0.014, global_step=451.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.70it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.74it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.70it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.72it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.80it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.73it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.74it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.75it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.75it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.75it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.75it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.76it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.76it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.76it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.76it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.78it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.76it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.75it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.76it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.76it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.80it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.78it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.74it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 1:  50%|████▉     | 601/1208 [17:40<17:50,  1.76s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.09e-5, train/loss_step=0.014, global_step=451.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  50%|████▉     | 601/1208 [17:40<17:50,  1.76s/it, loss=0.107, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000723, train/loss_step=0.202, global_step=452.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  50%|████▉     | 602/1208 [17:41<17:48,  1.76s/it, loss=0.107, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000723, train/loss_step=0.202, global_step=452.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  50%|████▉     | 602/1208 [17:41<17:48,  1.76s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0435, train/loss_vlb_step=0.000164, train/loss_step=0.0435, global_step=452.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  50%|████▉     | 603/1208 [17:42<17:45,  1.76s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0435, train/loss_vlb_step=0.000164, train/loss_step=0.0435, global_step=452.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  50%|████▉     | 603/1208 [17:42<17:45,  1.76s/it, loss=0.108, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000447, train/loss_step=0.136, global_step=452.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  50%|█████     | 604/1208 [17:45<17:45,  1.76s/it, loss=0.108, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000447, train/loss_step=0.136, global_step=452.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  50%|█████     | 604/1208 [17:45<17:45,  1.76s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000653, train/loss_step=0.192, global_step=452.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  50%|█████     | 605/1208 [17:46<17:42,  1.76s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000653, train/loss_step=0.192, global_step=452.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  50%|█████     | 605/1208 [17:46<17:42,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.426, train/loss_vlb_step=0.00361, train/loss_step=0.426, global_step=453.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  50%|█████     | 606/1208 [17:47<17:40,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.426, train/loss_vlb_step=0.00361, train/loss_step=0.426, global_step=453.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  50%|█████     | 606/1208 [17:47<17:40,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.59e-5, train/loss_step=0.0197, global_step=453.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  50%|█████     | 607/1208 [17:48<17:37,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.59e-5, train/loss_step=0.0197, global_step=453.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  50%|█████     | 607/1208 [17:48<17:37,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.472, train/loss_vlb_step=0.00559, train/loss_step=0.472, global_step=453.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  50%|█████     | 608/1208 [17:51<17:37,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.472, train/loss_vlb_step=0.00559, train/loss_step=0.472, global_step=453.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  50%|█████     | 608/1208 [17:51<17:37,  1.76s/it, loss=0.147, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00495, train/loss_step=0.447, global_step=453.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  50%|█████     | 609/1208 [17:52<17:35,  1.76s/it, loss=0.147, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00495, train/loss_step=0.447, global_step=453.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  50%|█████     | 609/1208 [17:52<17:35,  1.76s/it, loss=0.165, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.0022, train/loss_step=0.377, global_step=454.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  50%|█████     | 610/1208 [17:53<17:32,  1.76s/it, loss=0.165, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.0022, train/loss_step=0.377, global_step=454.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  50%|█████     | 610/1208 [17:53<17:32,  1.76s/it, loss=0.171, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000698, train/loss_step=0.193, global_step=454.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  51%|█████     | 611/1208 [17:55<17:30,  1.76s/it, loss=0.171, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000698, train/loss_step=0.193, global_step=454.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  51%|█████     | 611/1208 [17:55<17:30,  1.76s/it, loss=0.175, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=454.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  51%|█████     | 612/1208 [17:58<17:30,  1.76s/it, loss=0.175, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=454.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  51%|█████     | 612/1208 [17:58<17:30,  1.76s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.59e-5, train/loss_step=0.00312, global_step=454.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  51%|█████     | 613/1208 [17:59<17:27,  1.76s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.59e-5, train/loss_step=0.00312, global_step=454.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  51%|█████     | 613/1208 [17:59<17:27,  1.76s/it, loss=0.171, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000862, train/loss_step=0.217, global_step=455.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  51%|█████     | 614/1208 [18:00<17:25,  1.76s/it, loss=0.171, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000862, train/loss_step=0.217, global_step=455.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  51%|█████     | 614/1208 [18:00<17:25,  1.76s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.88e-5, train/loss_step=0.0132, global_step=455.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  51%|█████     | 615/1208 [18:01<17:22,  1.76s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.88e-5, train/loss_step=0.0132, global_step=455.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  51%|█████     | 615/1208 [18:01<17:22,  1.76s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000134, train/loss_step=0.0333, global_step=455.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  51%|█████     | 616/1208 [18:04<17:22,  1.76s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000134, train/loss_step=0.0333, global_step=455.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  51%|█████     | 616/1208 [18:04<17:22,  1.76s/it, loss=0.159, v_num=0, train/loss_simple_step=0.082, train/loss_vlb_step=0.000276, train/loss_step=0.082, global_step=455.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  51%|█████     | 617/1208 [18:05<17:19,  1.76s/it, loss=0.159, v_num=0, train/loss_simple_step=0.082, train/loss_vlb_step=0.000276, train/loss_step=0.082, global_step=455.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  51%|█████     | 617/1208 [18:05<17:19,  1.76s/it, loss=0.167, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000503, train/loss_step=0.153, global_step=456.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  51%|█████     | 618/1208 [18:06<17:17,  1.76s/it, loss=0.167, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000503, train/loss_step=0.153, global_step=456.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  51%|█████     | 618/1208 [18:06<17:17,  1.76s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.1e-5, train/loss_step=0.0168, global_step=456.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  51%|█████     | 619/1208 [18:07<17:15,  1.76s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.1e-5, train/loss_step=0.0168, global_step=456.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  51%|█████     | 619/1208 [18:07<17:15,  1.76s/it, loss=0.169, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000943, train/loss_step=0.235, global_step=456.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  51%|█████▏    | 620/1208 [18:11<17:14,  1.76s/it, loss=0.169, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000943, train/loss_step=0.235, global_step=456.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  51%|█████▏    | 620/1208 [18:11<17:14,  1.76s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0794, train/loss_vlb_step=0.000267, train/loss_step=0.0794, global_step=456.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  51%|█████▏    | 621/1208 [18:12<17:12,  1.76s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0794, train/loss_vlb_step=0.000267, train/loss_step=0.0794, global_step=456.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  51%|█████▏    | 621/1208 [18:12<17:12,  1.76s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.29e-5, train/loss_step=0.0141, global_step=457.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  51%|█████▏    | 622/1208 [18:13<17:09,  1.76s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.29e-5, train/loss_step=0.0141, global_step=457.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  51%|█████▏    | 622/1208 [18:13<17:09,  1.76s/it, loss=0.178, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00163, train/loss_step=0.338, global_step=457.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  52%|█████▏    | 623/1208 [18:14<17:07,  1.76s/it, loss=0.178, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00163, train/loss_step=0.338, global_step=457.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  52%|█████▏    | 623/1208 [18:14<17:07,  1.76s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=2.06e-5, train/loss_step=0.00366, global_step=457.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  52%|█████▏    | 624/1208 [18:17<17:07,  1.76s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=2.06e-5, train/loss_step=0.00366, global_step=457.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  52%|█████▏    | 624/1208 [18:17<17:07,  1.76s/it, loss=0.189, v_num=0, train/loss_simple_step=0.544, train/loss_vlb_step=0.0068, train/loss_step=0.544, global_step=457.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]     Epoch 1:  52%|█████▏    | 625/1208 [18:18<17:04,  1.76s/it, loss=0.189, v_num=0, train/loss_simple_step=0.544, train/loss_vlb_step=0.0068, train/loss_step=0.544, global_step=457.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  52%|█████▏    | 625/1208 [18:18<17:04,  1.76s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=9.19e-5, train/loss_step=0.0221, global_step=458.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  52%|█████▏    | 626/1208 [18:19<17:02,  1.76s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=9.19e-5, train/loss_step=0.0221, global_step=458.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  52%|█████▏    | 626/1208 [18:19<17:02,  1.76s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0668, train/loss_vlb_step=0.000224, train/loss_step=0.0668, global_step=458.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  52%|█████▏    | 627/1208 [18:20<16:59,  1.76s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0668, train/loss_vlb_step=0.000224, train/loss_step=0.0668, global_step=458.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  52%|█████▏    | 627/1208 [18:20<16:59,  1.76s/it, loss=0.148, v_num=0, train/loss_simple_step=0.005, train/loss_vlb_step=2.65e-5, train/loss_step=0.005, global_step=458.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  52%|█████▏    | 628/1208 [18:23<16:59,  1.76s/it, loss=0.148, v_num=0, train/loss_simple_step=0.005, train/loss_vlb_step=2.65e-5, train/loss_step=0.005, global_step=458.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  52%|█████▏    | 628/1208 [18:23<16:59,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000681, train/loss_step=0.191, global_step=458.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  52%|█████▏    | 629/1208 [18:24<16:57,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000681, train/loss_step=0.191, global_step=458.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  52%|█████▏    | 629/1208 [18:24<16:57,  1.76s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000125, train/loss_step=0.0325, global_step=459.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  52%|█████▏    | 630/1208 [18:25<16:54,  1.76s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000125, train/loss_step=0.0325, global_step=459.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  52%|█████▏    | 630/1208 [18:25<16:54,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.573, train/loss_vlb_step=0.012, train/loss_step=0.573, global_step=459.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]     Epoch 1:  52%|█████▏    | 631/1208 [18:26<16:52,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.573, train/loss_vlb_step=0.012, train/loss_step=0.573, global_step=459.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  52%|█████▏    | 631/1208 [18:26<16:52,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.000111, train/loss_step=0.0276, global_step=459.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  52%|█████▏    | 632/1208 [18:30<16:51,  1.76s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.000111, train/loss_step=0.0276, global_step=459.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  52%|█████▏    | 632/1208 [18:30<16:51,  1.76s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.67e-5, train/loss_step=0.0171, global_step=459.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  52%|█████▏    | 633/1208 [18:31<16:49,  1.76s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.67e-5, train/loss_step=0.0171, global_step=459.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  52%|█████▏    | 633/1208 [18:31<16:49,  1.76s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9.12e-5, train/loss_step=0.0224, global_step=460.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  52%|█████▏    | 634/1208 [18:32<16:47,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9.12e-5, train/loss_step=0.0224, global_step=460.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  52%|█████▏    | 634/1208 [18:32<16:47,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0771, train/loss_vlb_step=0.000264, train/loss_step=0.0771, global_step=460.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  53%|█████▎    | 635/1208 [18:33<16:44,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0771, train/loss_vlb_step=0.000264, train/loss_step=0.0771, global_step=460.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  53%|█████▎    | 635/1208 [18:33<16:44,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000803, train/loss_step=0.216, global_step=460.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  53%|█████▎    | 636/1208 [18:36<16:44,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000803, train/loss_step=0.216, global_step=460.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  53%|█████▎    | 636/1208 [18:36<16:44,  1.76s/it, loss=0.137, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=460.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  53%|█████▎    | 637/1208 [18:37<16:41,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=460.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  53%|█████▎    | 637/1208 [18:37<16:41,  1.75s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0735, train/loss_vlb_step=0.000246, train/loss_step=0.0735, global_step=461.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  53%|█████▎    | 638/1208 [18:38<16:39,  1.75s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0735, train/loss_vlb_step=0.000246, train/loss_step=0.0735, global_step=461.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  53%|█████▎    | 638/1208 [18:38<16:39,  1.75s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00193, train/loss_vlb_step=1.18e-5, train/loss_step=0.00193, global_step=461.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  53%|█████▎    | 639/1208 [18:39<16:37,  1.75s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00193, train/loss_vlb_step=1.18e-5, train/loss_step=0.00193, global_step=461.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  53%|█████▎    | 639/1208 [18:39<16:37,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000145, train/loss_step=0.0396, global_step=461.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  53%|█████▎    | 640/1208 [18:43<16:36,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000145, train/loss_step=0.0396, global_step=461.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  53%|█████▎    | 640/1208 [18:43<16:36,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0653, train/loss_vlb_step=0.000233, train/loss_step=0.0653, global_step=461.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  53%|█████▎    | 641/1208 [18:44<16:34,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0653, train/loss_vlb_step=0.000233, train/loss_step=0.0653, global_step=461.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  53%|█████▎    | 641/1208 [18:44<16:34,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000509, train/loss_step=0.155, global_step=462.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  53%|█████▎    | 642/1208 [18:45<16:31,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000509, train/loss_step=0.155, global_step=462.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  53%|█████▎    | 642/1208 [18:45<16:31,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=1.3e-5, train/loss_step=0.00221, global_step=462.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  53%|█████▎    | 643/1208 [18:46<16:29,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=1.3e-5, train/loss_step=0.00221, global_step=462.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  53%|█████▎    | 643/1208 [18:46<16:29,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00323, train/loss_vlb_step=1.83e-5, train/loss_step=0.00323, global_step=462.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  53%|█████▎    | 644/1208 [18:49<16:29,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00323, train/loss_vlb_step=1.83e-5, train/loss_step=0.00323, global_step=462.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  53%|█████▎    | 644/1208 [18:49<16:29,  1.75s/it, loss=0.0866, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=0.000102, train/loss_step=0.0259, global_step=462.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  53%|█████▎    | 645/1208 [18:50<16:26,  1.75s/it, loss=0.0866, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=0.000102, train/loss_step=0.0259, global_step=462.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  53%|█████▎    | 645/1208 [18:50<16:26,  1.75s/it, loss=0.1, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00152, train/loss_step=0.296, global_step=463.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]      Epoch 1:  53%|█████▎    | 646/1208 [18:51<16:24,  1.75s/it, loss=0.1, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00152, train/loss_step=0.296, global_step=463.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  53%|█████▎    | 646/1208 [18:51<16:24,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00329, train/loss_step=0.405, global_step=463.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  54%|█████▎    | 647/1208 [18:52<16:21,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00329, train/loss_step=0.405, global_step=463.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  54%|█████▎    | 647/1208 [18:52<16:21,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00282, train/loss_step=0.396, global_step=463.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  54%|█████▎    | 648/1208 [18:55<16:21,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00282, train/loss_step=0.396, global_step=463.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  54%|█████▎    | 648/1208 [18:55<16:21,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.93e-5, train/loss_step=0.0104, global_step=463.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  54%|█████▎    | 649/1208 [18:56<16:19,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.93e-5, train/loss_step=0.0104, global_step=463.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  54%|█████▎    | 649/1208 [18:56<16:19,  1.75s/it, loss=0.133, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000443, train/loss_step=0.134, global_step=464.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  54%|█████▍    | 650/1208 [18:57<16:16,  1.75s/it, loss=0.133, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000443, train/loss_step=0.134, global_step=464.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  54%|█████▍    | 650/1208 [18:57<16:16,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000539, train/loss_step=0.163, global_step=464.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  54%|█████▍    | 651/1208 [18:58<16:14,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000539, train/loss_step=0.163, global_step=464.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  54%|█████▍    | 651/1208 [18:58<16:14,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.514, train/loss_vlb_step=0.00696, train/loss_step=0.514, global_step=464.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  54%|█████▍    | 652/1208 [19:02<16:14,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.514, train/loss_vlb_step=0.00696, train/loss_step=0.514, global_step=464.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  54%|█████▍    | 652/1208 [19:02<16:14,  1.75s/it, loss=0.157, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00574, train/loss_step=0.432, global_step=464.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  54%|█████▍    | 653/1208 [19:03<16:11,  1.75s/it, loss=0.157, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00574, train/loss_step=0.432, global_step=464.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  54%|█████▍    | 653/1208 [19:03<16:11,  1.75s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.00015, train/loss_step=0.0395, global_step=465.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  54%|█████▍    | 654/1208 [19:04<16:09,  1.75s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.00015, train/loss_step=0.0395, global_step=465.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  54%|█████▍    | 654/1208 [19:04<16:09,  1.75s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.43e-5, train/loss_step=0.00246, global_step=465.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  54%|█████▍    | 655/1208 [19:05<16:07,  1.75s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.43e-5, train/loss_step=0.00246, global_step=465.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  54%|█████▍    | 655/1208 [19:05<16:07,  1.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000428, train/loss_step=0.130, global_step=465.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  54%|█████▍    | 656/1208 [19:08<16:06,  1.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000428, train/loss_step=0.130, global_step=465.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  54%|█████▍    | 656/1208 [19:08<16:06,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000477, train/loss_step=0.145, global_step=465.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  54%|█████▍    | 657/1208 [19:09<16:04,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000477, train/loss_step=0.145, global_step=465.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  54%|█████▍    | 657/1208 [19:09<16:04,  1.75s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.66e-5, train/loss_step=0.00292, global_step=466.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  54%|█████▍    | 658/1208 [19:10<16:01,  1.75s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.66e-5, train/loss_step=0.00292, global_step=466.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  54%|█████▍    | 658/1208 [19:10<16:01,  1.75s/it, loss=0.163, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.0012, train/loss_step=0.297, global_step=466.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]     Epoch 1:  55%|█████▍    | 659/1208 [19:11<15:59,  1.75s/it, loss=0.163, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.0012, train/loss_step=0.297, global_step=466.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  55%|█████▍    | 659/1208 [19:11<15:59,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.77e-5, train/loss_step=0.0213, global_step=466.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  55%|█████▍    | 660/1208 [19:15<15:59,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.77e-5, train/loss_step=0.0213, global_step=466.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  55%|█████▍    | 660/1208 [19:15<15:59,  1.75s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=9.98e-5, train/loss_step=0.0251, global_step=466.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  55%|█████▍    | 661/1208 [19:16<15:56,  1.75s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=9.98e-5, train/loss_step=0.0251, global_step=466.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  55%|█████▍    | 661/1208 [19:16<15:56,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.000152, train/loss_step=0.041, global_step=467.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  55%|█████▍    | 662/1208 [19:17<15:54,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.000152, train/loss_step=0.041, global_step=467.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  55%|█████▍    | 662/1208 [19:17<15:54,  1.75s/it, loss=0.17, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00145, train/loss_step=0.307, global_step=467.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  55%|█████▍    | 663/1208 [19:18<15:52,  1.75s/it, loss=0.17, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00145, train/loss_step=0.307, global_step=467.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  55%|█████▍    | 663/1208 [19:18<15:52,  1.75s/it, loss=0.187, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00259, train/loss_step=0.348, global_step=467.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  55%|█████▍    | 664/1208 [19:21<15:51,  1.75s/it, loss=0.187, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00259, train/loss_step=0.348, global_step=467.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  55%|█████▍    | 664/1208 [19:21<15:51,  1.75s/it, loss=0.205, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00281, train/loss_step=0.398, global_step=467.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  55%|█████▌    | 665/1208 [19:22<15:49,  1.75s/it, loss=0.205, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00281, train/loss_step=0.398, global_step=467.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  55%|█████▌    | 665/1208 [19:22<15:49,  1.75s/it, loss=0.209, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00259, train/loss_step=0.375, global_step=468.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  55%|█████▌    | 666/1208 [19:23<15:46,  1.75s/it, loss=0.209, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00259, train/loss_step=0.375, global_step=468.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  55%|█████▌    | 666/1208 [19:23<15:46,  1.75s/it, loss=0.196, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000462, train/loss_step=0.139, global_step=468.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  55%|█████▌    | 667/1208 [19:24<15:44,  1.75s/it, loss=0.196, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000462, train/loss_step=0.139, global_step=468.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  55%|█████▌    | 667/1208 [19:24<15:44,  1.75s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000139, train/loss_step=0.0367, global_step=468.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  55%|█████▌    | 668/1208 [19:27<15:44,  1.75s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000139, train/loss_step=0.0367, global_step=468.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  55%|█████▌    | 668/1208 [19:27<15:44,  1.75s/it, loss=0.202, v_num=0, train/loss_simple_step=0.490, train/loss_vlb_step=0.00601, train/loss_step=0.490, global_step=468.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  55%|█████▌    | 669/1208 [19:28<15:41,  1.75s/it, loss=0.202, v_num=0, train/loss_simple_step=0.490, train/loss_vlb_step=0.00601, train/loss_step=0.490, global_step=468.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  55%|█████▌    | 669/1208 [19:28<15:41,  1.75s/it, loss=0.209, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00104, train/loss_step=0.262, global_step=469.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  55%|█████▌    | 670/1208 [19:30<15:39,  1.75s/it, loss=0.209, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00104, train/loss_step=0.262, global_step=469.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  55%|█████▌    | 670/1208 [19:30<15:39,  1.75s/it, loss=0.201, v_num=0, train/loss_simple_step=0.00694, train/loss_vlb_step=3.43e-5, train/loss_step=0.00694, global_step=469.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  56%|█████▌    | 671/1208 [19:31<15:37,  1.75s/it, loss=0.201, v_num=0, train/loss_simple_step=0.00694, train/loss_vlb_step=3.43e-5, train/loss_step=0.00694, global_step=469.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  56%|█████▌    | 671/1208 [19:31<15:37,  1.75s/it, loss=0.181, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=469.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  56%|█████▌    | 672/1208 [19:34<15:36,  1.75s/it, loss=0.181, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=469.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  56%|█████▌    | 672/1208 [19:34<15:36,  1.75s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=0.0001, train/loss_step=0.0232, global_step=469.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  56%|█████▌    | 673/1208 [19:35<15:34,  1.75s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=0.0001, train/loss_step=0.0232, global_step=469.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  56%|█████▌    | 673/1208 [19:35<15:34,  1.75s/it, loss=0.175, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00248, train/loss_step=0.333, global_step=470.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  56%|█████▌    | 674/1208 [19:36<15:32,  1.75s/it, loss=0.175, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00248, train/loss_step=0.333, global_step=470.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  56%|█████▌    | 674/1208 [19:36<15:32,  1.75s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00505, train/loss_vlb_step=2.64e-5, train/loss_step=0.00505, global_step=470.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  56%|█████▌    | 675/1208 [19:37<15:29,  1.74s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00505, train/loss_vlb_step=2.64e-5, train/loss_step=0.00505, global_step=470.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  56%|█████▌    | 675/1208 [19:37<15:29,  1.74s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.000179, train/loss_step=0.0499, global_step=470.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  56%|█████▌    | 676/1208 [19:40<15:29,  1.75s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.000179, train/loss_step=0.0499, global_step=470.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  56%|█████▌    | 676/1208 [19:40<15:29,  1.75s/it, loss=0.178, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.0012, train/loss_step=0.278, global_step=470.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  56%|█████▌    | 677/1208 [19:41<15:26,  1.75s/it, loss=0.178, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.0012, train/loss_step=0.278, global_step=470.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  56%|█████▌    | 677/1208 [19:41<15:26,  1.75s/it, loss=0.181, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.000174, train/loss_step=0.048, global_step=471.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  56%|█████▌    | 678/1208 [19:42<15:24,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.000174, train/loss_step=0.048, global_step=471.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  56%|█████▌    | 678/1208 [19:42<15:24,  1.74s/it, loss=0.189, v_num=0, train/loss_simple_step=0.471, train/loss_vlb_step=0.00439, train/loss_step=0.471, global_step=471.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  56%|█████▌    | 679/1208 [19:43<15:22,  1.74s/it, loss=0.189, v_num=0, train/loss_simple_step=0.471, train/loss_vlb_step=0.00439, train/loss_step=0.471, global_step=471.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  56%|█████▌    | 679/1208 [19:43<15:22,  1.74s/it, loss=0.213, v_num=0, train/loss_simple_step=0.496, train/loss_vlb_step=0.00516, train/loss_step=0.496, global_step=471.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  56%|█████▋    | 680/1208 [19:47<15:21,  1.75s/it, loss=0.213, v_num=0, train/loss_simple_step=0.496, train/loss_vlb_step=0.00516, train/loss_step=0.496, global_step=471.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  56%|█████▋    | 680/1208 [19:47<15:21,  1.75s/it, loss=0.212, v_num=0, train/loss_simple_step=0.00864, train/loss_vlb_step=4.15e-5, train/loss_step=0.00864, global_step=471.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  56%|█████▋    | 681/1208 [19:48<15:19,  1.74s/it, loss=0.212, v_num=0, train/loss_simple_step=0.00864, train/loss_vlb_step=4.15e-5, train/loss_step=0.00864, global_step=471.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  56%|█████▋    | 681/1208 [19:48<15:19,  1.74s/it, loss=0.213, v_num=0, train/loss_simple_step=0.0541, train/loss_vlb_step=0.00019, train/loss_step=0.0541, global_step=472.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  56%|█████▋    | 682/1208 [19:49<15:17,  1.74s/it, loss=0.213, v_num=0, train/loss_simple_step=0.0541, train/loss_vlb_step=0.00019, train/loss_step=0.0541, global_step=472.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  56%|█████▋    | 682/1208 [19:49<15:17,  1.74s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0776, train/loss_vlb_step=0.00026, train/loss_step=0.0776, global_step=472.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  57%|█████▋    | 683/1208 [19:50<15:14,  1.74s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0776, train/loss_vlb_step=0.00026, train/loss_step=0.0776, global_step=472.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  57%|█████▋    | 683/1208 [19:50<15:14,  1.74s/it, loss=0.196, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000923, train/loss_step=0.244, global_step=472.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  57%|█████▋    | 684/1208 [19:53<15:14,  1.74s/it, loss=0.196, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000923, train/loss_step=0.244, global_step=472.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  57%|█████▋    | 684/1208 [19:53<15:14,  1.74s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0391, train/loss_vlb_step=0.000151, train/loss_step=0.0391, global_step=472.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  57%|█████▋    | 685/1208 [19:54<15:12,  1.74s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0391, train/loss_vlb_step=0.000151, train/loss_step=0.0391, global_step=472.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  57%|█████▋    | 685/1208 [19:54<15:12,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000412, train/loss_step=0.126, global_step=473.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  57%|█████▋    | 686/1208 [19:55<15:09,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000412, train/loss_step=0.126, global_step=473.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  57%|█████▋    | 686/1208 [19:55<15:09,  1.74s/it, loss=0.172, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00113, train/loss_step=0.261, global_step=473.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  57%|█████▋    | 687/1208 [19:56<15:07,  1.74s/it, loss=0.172, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00113, train/loss_step=0.261, global_step=473.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  57%|█████▋    | 687/1208 [19:56<15:07,  1.74s/it, loss=0.207, v_num=0, train/loss_simple_step=0.742, train/loss_vlb_step=0.0477, train/loss_step=0.742, global_step=473.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  57%|█████▋    | 688/1208 [19:59<15:06,  1.74s/it, loss=0.207, v_num=0, train/loss_simple_step=0.742, train/loss_vlb_step=0.0477, train/loss_step=0.742, global_step=473.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  57%|█████▋    | 688/1208 [19:59<15:06,  1.74s/it, loss=0.213, v_num=0, train/loss_simple_step=0.607, train/loss_vlb_step=0.0155, train/loss_step=0.607, global_step=473.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  57%|█████▋    | 689/1208 [20:00<15:04,  1.74s/it, loss=0.213, v_num=0, train/loss_simple_step=0.607, train/loss_vlb_step=0.0155, train/loss_step=0.607, global_step=473.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  57%|█████▋    | 689/1208 [20:00<15:04,  1.74s/it, loss=0.2, v_num=0, train/loss_simple_step=0.00419, train/loss_vlb_step=2.24e-5, train/loss_step=0.00419, global_step=474.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  57%|█████▋    | 690/1208 [20:02<15:02,  1.74s/it, loss=0.2, v_num=0, train/loss_simple_step=0.00419, train/loss_vlb_step=2.24e-5, train/loss_step=0.00419, global_step=474.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  57%|█████▋    | 690/1208 [20:02<15:02,  1.74s/it, loss=0.2, v_num=0, train/loss_simple_step=0.00765, train/loss_vlb_step=3.78e-5, train/loss_step=0.00765, global_step=474.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  57%|█████▋    | 691/1208 [20:03<15:00,  1.74s/it, loss=0.2, v_num=0, train/loss_simple_step=0.00765, train/loss_vlb_step=3.78e-5, train/loss_step=0.00765, global_step=474.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  57%|█████▋    | 691/1208 [20:03<15:00,  1.74s/it, loss=0.221, v_num=0, train/loss_simple_step=0.535, train/loss_vlb_step=0.0131, train/loss_step=0.535, global_step=474.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  57%|█████▋    | 692/1208 [20:06<14:59,  1.74s/it, loss=0.221, v_num=0, train/loss_simple_step=0.535, train/loss_vlb_step=0.0131, train/loss_step=0.535, global_step=474.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  57%|█████▋    | 692/1208 [20:06<14:59,  1.74s/it, loss=0.223, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.000223, train/loss_step=0.0672, global_step=474.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  57%|█████▋    | 693/1208 [20:07<14:57,  1.74s/it, loss=0.223, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.000223, train/loss_step=0.0672, global_step=474.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  57%|█████▋    | 693/1208 [20:07<14:57,  1.74s/it, loss=0.206, v_num=0, train/loss_simple_step=0.00367, train/loss_vlb_step=2.06e-5, train/loss_step=0.00367, global_step=475.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  57%|█████▋    | 694/1208 [20:08<14:54,  1.74s/it, loss=0.206, v_num=0, train/loss_simple_step=0.00367, train/loss_vlb_step=2.06e-5, train/loss_step=0.00367, global_step=475.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  57%|█████▋    | 694/1208 [20:08<14:54,  1.74s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=6.09e-5, train/loss_step=0.0127, global_step=475.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  58%|█████▊    | 695/1208 [20:09<14:52,  1.74s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=6.09e-5, train/loss_step=0.0127, global_step=475.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  58%|█████▊    | 695/1208 [20:09<14:52,  1.74s/it, loss=0.215, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000797, train/loss_step=0.211, global_step=475.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  58%|█████▊    | 696/1208 [20:12<14:52,  1.74s/it, loss=0.215, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000797, train/loss_step=0.211, global_step=475.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  58%|█████▊    | 696/1208 [20:12<14:52,  1.74s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.52e-5, train/loss_step=0.0026, global_step=475.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  58%|█████▊    | 697/1208 [20:13<14:49,  1.74s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.52e-5, train/loss_step=0.0026, global_step=475.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  58%|█████▊    | 697/1208 [20:13<14:49,  1.74s/it, loss=0.204, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.00037, train/loss_step=0.112, global_step=476.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  58%|█████▊    | 698/1208 [20:14<14:47,  1.74s/it, loss=0.204, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.00037, train/loss_step=0.112, global_step=476.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  58%|█████▊    | 698/1208 [20:14<14:47,  1.74s/it, loss=0.194, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.0015, train/loss_step=0.277, global_step=476.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  58%|█████▊    | 699/1208 [20:15<14:45,  1.74s/it, loss=0.194, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.0015, train/loss_step=0.277, global_step=476.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  58%|█████▊    | 699/1208 [20:15<14:45,  1.74s/it, loss=0.183, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00115, train/loss_step=0.272, global_step=476.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  58%|█████▊    | 700/1208 [20:19<14:44,  1.74s/it, loss=0.183, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00115, train/loss_step=0.272, global_step=476.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  58%|█████▊    | 700/1208 [20:19<14:44,  1.74s/it, loss=0.191, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000547, train/loss_step=0.157, global_step=476.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  58%|█████▊    | 701/1208 [20:20<14:42,  1.74s/it, loss=0.191, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000547, train/loss_step=0.157, global_step=476.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  58%|█████▊    | 701/1208 [20:20<14:42,  1.74s/it, loss=0.205, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00196, train/loss_step=0.343, global_step=477.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  58%|█████▊    | 702/1208 [20:21<14:40,  1.74s/it, loss=0.205, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00196, train/loss_step=0.343, global_step=477.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  58%|█████▊    | 702/1208 [20:21<14:40,  1.74s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=8.03e-5, train/loss_step=0.0195, global_step=477.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  58%|█████▊    | 703/1208 [20:22<14:37,  1.74s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=8.03e-5, train/loss_step=0.0195, global_step=477.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  58%|█████▊    | 703/1208 [20:22<14:37,  1.74s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=2.02e-5, train/loss_step=0.0036, global_step=477.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  58%|█████▊    | 704/1208 [20:25<14:37,  1.74s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=2.02e-5, train/loss_step=0.0036, global_step=477.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  58%|█████▊    | 704/1208 [20:25<14:37,  1.74s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0651, train/loss_vlb_step=0.000218, train/loss_step=0.0651, global_step=477.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  58%|█████▊    | 705/1208 [20:26<14:35,  1.74s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0651, train/loss_vlb_step=0.000218, train/loss_step=0.0651, global_step=477.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  58%|█████▊    | 705/1208 [20:26<14:35,  1.74s/it, loss=0.196, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000862, train/loss_step=0.226, global_step=478.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  58%|█████▊    | 706/1208 [20:27<14:32,  1.74s/it, loss=0.196, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000862, train/loss_step=0.226, global_step=478.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  58%|█████▊    | 706/1208 [20:27<14:32,  1.74s/it, loss=0.189, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=478.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  59%|█████▊    | 707/1208 [20:28<14:30,  1.74s/it, loss=0.189, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=478.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  59%|█████▊    | 707/1208 [20:28<14:30,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0341, train/loss_vlb_step=0.000135, train/loss_step=0.0341, global_step=478.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  59%|█████▊    | 708/1208 [20:31<14:29,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0341, train/loss_vlb_step=0.000135, train/loss_step=0.0341, global_step=478.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  59%|█████▊    | 708/1208 [20:31<14:29,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=478.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  59%|█████▊    | 709/1208 [20:32<14:27,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=478.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  59%|█████▊    | 709/1208 [20:32<14:27,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.084, train/loss_vlb_step=0.00028, train/loss_step=0.084, global_step=479.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  59%|█████▉    | 710/1208 [20:33<14:25,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.084, train/loss_vlb_step=0.00028, train/loss_step=0.084, global_step=479.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  59%|█████▉    | 710/1208 [20:33<14:25,  1.74s/it, loss=0.151, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00228, train/loss_step=0.378, global_step=479.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  59%|█████▉    | 711/1208 [20:35<14:23,  1.74s/it, loss=0.151, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00228, train/loss_step=0.378, global_step=479.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  59%|█████▉    | 711/1208 [20:35<14:23,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=2.19e-5, train/loss_step=0.00402, global_step=479.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  59%|█████▉    | 712/1208 [20:38<14:22,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=2.19e-5, train/loss_step=0.00402, global_step=479.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  59%|█████▉    | 712/1208 [20:38<14:22,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0044, train/loss_vlb_step=2.31e-5, train/loss_step=0.0044, global_step=479.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  59%|█████▉    | 713/1208 [20:39<14:20,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0044, train/loss_vlb_step=2.31e-5, train/loss_step=0.0044, global_step=479.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  59%|█████▉    | 713/1208 [20:39<14:20,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00314, train/loss_vlb_step=1.75e-5, train/loss_step=0.00314, global_step=480.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  59%|█████▉    | 714/1208 [20:40<14:18,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00314, train/loss_vlb_step=1.75e-5, train/loss_step=0.00314, global_step=480.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  59%|█████▉    | 714/1208 [20:40<14:18,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0366, train/loss_vlb_step=0.000141, train/loss_step=0.0366, global_step=480.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  59%|█████▉    | 715/1208 [20:41<14:15,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0366, train/loss_vlb_step=0.000141, train/loss_step=0.0366, global_step=480.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  59%|█████▉    | 715/1208 [20:41<14:15,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00408, train/loss_vlb_step=2.12e-5, train/loss_step=0.00408, global_step=480.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  59%|█████▉    | 716/1208 [20:44<14:15,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00408, train/loss_vlb_step=2.12e-5, train/loss_step=0.00408, global_step=480.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  59%|█████▉    | 716/1208 [20:44<14:15,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.000227, train/loss_step=0.0665, global_step=480.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  59%|█████▉    | 717/1208 [20:45<14:13,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.000227, train/loss_step=0.0665, global_step=480.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  59%|█████▉    | 717/1208 [20:45<14:13,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0735, train/loss_vlb_step=0.000244, train/loss_step=0.0735, global_step=481.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  59%|█████▉    | 718/1208 [20:46<14:10,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0735, train/loss_vlb_step=0.000244, train/loss_step=0.0735, global_step=481.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  59%|█████▉    | 718/1208 [20:46<14:10,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.00016, train/loss_step=0.0425, global_step=481.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  60%|█████▉    | 719/1208 [20:47<14:08,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.00016, train/loss_step=0.0425, global_step=481.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  60%|█████▉    | 719/1208 [20:47<14:08,  1.74s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000818, train/loss_step=0.213, global_step=481.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  60%|█████▉    | 720/1208 [20:51<14:07,  1.74s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000818, train/loss_step=0.213, global_step=481.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  60%|█████▉    | 720/1208 [20:51<14:07,  1.74s/it, loss=0.0911, v_num=0, train/loss_simple_step=0.00635, train/loss_vlb_step=3.27e-5, train/loss_step=0.00635, global_step=481.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  60%|█████▉    | 721/1208 [20:52<14:05,  1.74s/it, loss=0.0911, v_num=0, train/loss_simple_step=0.00635, train/loss_vlb_step=3.27e-5, train/loss_step=0.00635, global_step=481.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  60%|█████▉    | 721/1208 [20:52<14:05,  1.74s/it, loss=0.0813, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.00049, train/loss_step=0.147, global_step=482.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  60%|█████▉    | 722/1208 [20:53<14:03,  1.74s/it, loss=0.0813, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.00049, train/loss_step=0.147, global_step=482.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  60%|█████▉    | 722/1208 [20:53<14:03,  1.74s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.00085, train/loss_step=0.222, global_step=482.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  60%|█████▉    | 723/1208 [20:54<14:01,  1.73s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.00085, train/loss_step=0.222, global_step=482.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  60%|█████▉    | 723/1208 [20:54<14:01,  1.73s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000459, train/loss_step=0.137, global_step=482.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  60%|█████▉    | 724/1208 [20:57<14:00,  1.74s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000459, train/loss_step=0.137, global_step=482.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  60%|█████▉    | 724/1208 [20:57<14:00,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00292, train/loss_step=0.447, global_step=482.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  60%|██████    | 725/1208 [20:58<13:58,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00292, train/loss_step=0.447, global_step=482.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  60%|██████    | 725/1208 [20:58<13:58,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00135, train/loss_step=0.280, global_step=483.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  60%|██████    | 726/1208 [20:59<13:56,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00135, train/loss_step=0.280, global_step=483.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  60%|██████    | 726/1208 [20:59<13:56,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.633, train/loss_vlb_step=0.0148, train/loss_step=0.633, global_step=483.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  60%|██████    | 727/1208 [21:00<13:54,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.633, train/loss_vlb_step=0.0148, train/loss_step=0.633, global_step=483.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  60%|██████    | 727/1208 [21:00<13:54,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000348, train/loss_step=0.105, global_step=483.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  60%|██████    | 728/1208 [21:04<13:53,  1.74s/it, loss=0.15, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000348, train/loss_step=0.105, global_step=483.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  60%|██████    | 728/1208 [21:04<13:53,  1.74s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0998, train/loss_vlb_step=0.000333, train/loss_step=0.0998, global_step=483.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  60%|██████    | 729/1208 [21:05<13:51,  1.74s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0998, train/loss_vlb_step=0.000333, train/loss_step=0.0998, global_step=483.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  60%|██████    | 729/1208 [21:05<13:51,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0576, train/loss_vlb_step=0.000205, train/loss_step=0.0576, global_step=484.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  60%|██████    | 730/1208 [21:06<13:49,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0576, train/loss_vlb_step=0.000205, train/loss_step=0.0576, global_step=484.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  60%|██████    | 730/1208 [21:06<13:49,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00185, train/loss_step=0.354, global_step=484.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  61%|██████    | 731/1208 [21:07<13:46,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00185, train/loss_step=0.354, global_step=484.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  61%|██████    | 731/1208 [21:07<13:46,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.00012, train/loss_step=0.0327, global_step=484.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  61%|██████    | 732/1208 [21:10<13:46,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.00012, train/loss_step=0.0327, global_step=484.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  61%|██████    | 732/1208 [21:10<13:46,  1.74s/it, loss=0.171, v_num=0, train/loss_simple_step=0.455, train/loss_vlb_step=0.00503, train/loss_step=0.455, global_step=484.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  61%|██████    | 733/1208 [21:11<13:43,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.455, train/loss_vlb_step=0.00503, train/loss_step=0.455, global_step=484.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  61%|██████    | 733/1208 [21:11<13:43,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.092, train/loss_vlb_step=0.000304, train/loss_step=0.092, global_step=485.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  61%|██████    | 734/1208 [21:12<13:41,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.092, train/loss_vlb_step=0.000304, train/loss_step=0.092, global_step=485.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  61%|██████    | 734/1208 [21:12<13:41,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000536, train/loss_step=0.159, global_step=485.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  61%|██████    | 735/1208 [21:13<13:39,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000536, train/loss_step=0.159, global_step=485.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  61%|██████    | 735/1208 [21:13<13:39,  1.73s/it, loss=0.197, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00159, train/loss_step=0.307, global_step=485.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  61%|██████    | 736/1208 [21:16<13:38,  1.73s/it, loss=0.197, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00159, train/loss_step=0.307, global_step=485.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  61%|██████    | 736/1208 [21:16<13:38,  1.73s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.46e-5, train/loss_step=0.0201, global_step=485.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  61%|██████    | 737/1208 [21:17<13:36,  1.73s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.46e-5, train/loss_step=0.0201, global_step=485.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  61%|██████    | 737/1208 [21:17<13:36,  1.73s/it, loss=0.203, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00123, train/loss_step=0.253, global_step=486.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  61%|██████    | 738/1208 [21:18<13:34,  1.73s/it, loss=0.203, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00123, train/loss_step=0.253, global_step=486.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  61%|██████    | 738/1208 [21:18<13:34,  1.73s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0444, train/loss_vlb_step=0.000162, train/loss_step=0.0444, global_step=486.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  61%|██████    | 739/1208 [21:20<13:32,  1.73s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0444, train/loss_vlb_step=0.000162, train/loss_step=0.0444, global_step=486.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  61%|██████    | 739/1208 [21:20<13:32,  1.73s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00427, train/loss_vlb_step=2.35e-5, train/loss_step=0.00427, global_step=486.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  61%|██████▏   | 740/1208 [21:23<13:31,  1.73s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00427, train/loss_vlb_step=2.35e-5, train/loss_step=0.00427, global_step=486.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  61%|██████▏   | 740/1208 [21:23<13:31,  1.73s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.42e-5, train/loss_step=0.0169, global_step=486.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  61%|██████▏   | 741/1208 [21:24<13:29,  1.73s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.42e-5, train/loss_step=0.0169, global_step=486.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  61%|██████▏   | 741/1208 [21:24<13:29,  1.73s/it, loss=0.193, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000476, train/loss_step=0.144, global_step=487.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  61%|██████▏   | 742/1208 [21:25<13:27,  1.73s/it, loss=0.193, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000476, train/loss_step=0.144, global_step=487.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  61%|██████▏   | 742/1208 [21:25<13:27,  1.73s/it, loss=0.198, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00142, train/loss_step=0.314, global_step=487.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  62%|██████▏   | 743/1208 [21:26<13:25,  1.73s/it, loss=0.198, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00142, train/loss_step=0.314, global_step=487.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  62%|██████▏   | 743/1208 [21:26<13:25,  1.73s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0519, train/loss_vlb_step=0.000186, train/loss_step=0.0519, global_step=487.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  62%|██████▏   | 744/1208 [21:29<13:24,  1.73s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0519, train/loss_vlb_step=0.000186, train/loss_step=0.0519, global_step=487.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  62%|██████▏   | 744/1208 [21:29<13:24,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.00254, train/loss_step=0.360, global_step=487.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  62%|██████▏   | 745/1208 [21:30<13:22,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.00254, train/loss_step=0.360, global_step=487.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  62%|██████▏   | 745/1208 [21:30<13:22,  1.73s/it, loss=0.202, v_num=0, train/loss_simple_step=0.538, train/loss_vlb_step=0.00536, train/loss_step=0.538, global_step=488.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  62%|██████▏   | 746/1208 [21:32<13:20,  1.73s/it, loss=0.202, v_num=0, train/loss_simple_step=0.538, train/loss_vlb_step=0.00536, train/loss_step=0.538, global_step=488.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  62%|██████▏   | 746/1208 [21:32<13:20,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.513, train/loss_vlb_step=0.00534, train/loss_step=0.513, global_step=488.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  62%|██████▏   | 747/1208 [21:33<13:18,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.513, train/loss_vlb_step=0.00534, train/loss_step=0.513, global_step=488.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  62%|██████▏   | 747/1208 [21:33<13:18,  1.73s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.54e-5, train/loss_step=0.0129, global_step=488.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  62%|██████▏   | 748/1208 [21:36<13:17,  1.73s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.54e-5, train/loss_step=0.0129, global_step=488.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  62%|██████▏   | 748/1208 [21:36<13:17,  1.73s/it, loss=0.197, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000746, train/loss_step=0.203, global_step=488.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  62%|██████▏   | 749/1208 [21:37<13:15,  1.73s/it, loss=0.197, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000746, train/loss_step=0.203, global_step=488.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  62%|██████▏   | 749/1208 [21:37<13:15,  1.73s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0984, train/loss_vlb_step=0.000324, train/loss_step=0.0984, global_step=489.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  62%|██████▏   | 750/1208 [21:38<13:12,  1.73s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0984, train/loss_vlb_step=0.000324, train/loss_step=0.0984, global_step=489.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  62%|██████▏   | 750/1208 [21:38<13:12,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000344, train/loss_step=0.102, global_step=489.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  62%|██████▏   | 751/1208 [21:39<13:10,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000344, train/loss_step=0.102, global_step=489.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  62%|██████▏   | 751/1208 [21:39<13:10,  1.73s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00327, train/loss_vlb_step=1.84e-5, train/loss_step=0.00327, global_step=489.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  62%|██████▏   | 752/1208 [21:42<13:09,  1.73s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00327, train/loss_vlb_step=1.84e-5, train/loss_step=0.00327, global_step=489.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  62%|██████▏   | 752/1208 [21:42<13:09,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.89e-5, train/loss_step=0.0179, global_step=489.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  62%|██████▏   | 753/1208 [21:43<13:07,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.89e-5, train/loss_step=0.0179, global_step=489.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  62%|██████▏   | 753/1208 [21:43<13:07,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00279, train/loss_vlb_step=1.63e-5, train/loss_step=0.00279, global_step=490.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  62%|██████▏   | 754/1208 [21:44<13:05,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00279, train/loss_vlb_step=1.63e-5, train/loss_step=0.00279, global_step=490.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  62%|██████▏   | 754/1208 [21:44<13:05,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.463, train/loss_vlb_step=0.00376, train/loss_step=0.463, global_step=490.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  62%|██████▎   | 755/1208 [21:45<13:03,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.463, train/loss_vlb_step=0.00376, train/loss_step=0.463, global_step=490.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  62%|██████▎   | 755/1208 [21:45<13:03,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000454, train/loss_step=0.138, global_step=490.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  63%|██████▎   | 756/1208 [21:49<13:02,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000454, train/loss_step=0.138, global_step=490.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  63%|██████▎   | 756/1208 [21:49<13:02,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.00051, train/loss_step=0.151, global_step=490.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  63%|██████▎   | 757/1208 [21:50<13:00,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.00051, train/loss_step=0.151, global_step=490.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  63%|██████▎   | 757/1208 [21:50<13:00,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000765, train/loss_step=0.203, global_step=491.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  63%|██████▎   | 758/1208 [21:51<12:58,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000765, train/loss_step=0.203, global_step=491.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  63%|██████▎   | 758/1208 [21:51<12:58,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.63e-5, train/loss_step=0.0124, global_step=491.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  63%|██████▎   | 759/1208 [21:52<12:56,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.63e-5, train/loss_step=0.0124, global_step=491.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  63%|██████▎   | 759/1208 [21:52<12:56,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.26e-5, train/loss_step=0.0149, global_step=491.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  63%|██████▎   | 760/1208 [21:55<12:55,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.26e-5, train/loss_step=0.0149, global_step=491.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  63%|██████▎   | 760/1208 [21:55<12:55,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00104, train/loss_step=0.268, global_step=491.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  63%|██████▎   | 761/1208 [21:56<12:53,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00104, train/loss_step=0.268, global_step=491.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  63%|██████▎   | 761/1208 [21:56<12:53,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.07e-5, train/loss_step=0.00176, global_step=492.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  63%|██████▎   | 762/1208 [21:57<12:51,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.07e-5, train/loss_step=0.00176, global_step=492.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  63%|██████▎   | 762/1208 [21:57<12:51,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000105, train/loss_step=0.0266, global_step=492.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  63%|██████▎   | 763/1208 [21:58<12:49,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000105, train/loss_step=0.0266, global_step=492.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  63%|██████▎   | 763/1208 [21:58<12:49,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=0.000102, train/loss_step=0.0239, global_step=492.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  63%|██████▎   | 764/1208 [22:02<12:48,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=0.000102, train/loss_step=0.0239, global_step=492.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  63%|██████▎   | 764/1208 [22:02<12:48,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0775, train/loss_vlb_step=0.000257, train/loss_step=0.0775, global_step=492.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  63%|██████▎   | 765/1208 [22:03<12:46,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0775, train/loss_vlb_step=0.000257, train/loss_step=0.0775, global_step=492.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  63%|██████▎   | 765/1208 [22:03<12:46,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000547, train/loss_step=0.161, global_step=493.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  63%|██████▎   | 766/1208 [22:04<12:44,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000547, train/loss_step=0.161, global_step=493.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  63%|██████▎   | 766/1208 [22:04<12:44,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00132, train/loss_step=0.278, global_step=493.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  63%|██████▎   | 767/1208 [22:05<12:42,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00132, train/loss_step=0.278, global_step=493.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  63%|██████▎   | 767/1208 [22:05<12:42,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00157, train/loss_step=0.321, global_step=493.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  64%|██████▎   | 768/1208 [22:08<12:41,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00157, train/loss_step=0.321, global_step=493.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  64%|██████▎   | 768/1208 [22:08<12:41,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000555, train/loss_step=0.165, global_step=493.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  64%|██████▎   | 769/1208 [22:09<12:39,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000555, train/loss_step=0.165, global_step=493.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  64%|██████▎   | 769/1208 [22:09<12:39,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.610, train/loss_vlb_step=0.0127, train/loss_step=0.610, global_step=494.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  64%|██████▎   | 770/1208 [22:10<12:36,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.610, train/loss_vlb_step=0.0127, train/loss_step=0.610, global_step=494.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  64%|██████▎   | 770/1208 [22:10<12:36,  1.73s/it, loss=0.188, v_num=0, train/loss_simple_step=0.813, train/loss_vlb_step=0.137, train/loss_step=0.813, global_step=494.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  64%|██████▍   | 771/1208 [22:11<12:34,  1.73s/it, loss=0.188, v_num=0, train/loss_simple_step=0.813, train/loss_vlb_step=0.137, train/loss_step=0.813, global_step=494.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  64%|██████▍   | 771/1208 [22:11<12:34,  1.73s/it, loss=0.2, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.000965, train/loss_step=0.254, global_step=494.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  64%|██████▍   | 772/1208 [22:15<12:34,  1.73s/it, loss=0.2, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.000965, train/loss_step=0.254, global_step=494.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  64%|██████▍   | 772/1208 [22:15<12:34,  1.73s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0819, train/loss_vlb_step=0.000273, train/loss_step=0.0819, global_step=494.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  64%|██████▍   | 773/1208 [22:16<12:31,  1.73s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0819, train/loss_vlb_step=0.000273, train/loss_step=0.0819, global_step=494.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  64%|██████▍   | 773/1208 [22:16<12:31,  1.73s/it, loss=0.211, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000489, train/loss_step=0.146, global_step=495.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  64%|██████▍   | 774/1208 [22:17<12:29,  1.73s/it, loss=0.211, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000489, train/loss_step=0.146, global_step=495.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  64%|██████▍   | 774/1208 [22:17<12:29,  1.73s/it, loss=0.206, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00212, train/loss_step=0.368, global_step=495.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  64%|██████▍   | 775/1208 [22:18<12:27,  1.73s/it, loss=0.206, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00212, train/loss_step=0.368, global_step=495.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  64%|██████▍   | 775/1208 [22:18<12:27,  1.73s/it, loss=0.199, v_num=0, train/loss_simple_step=0.00613, train/loss_vlb_step=3.2e-5, train/loss_step=0.00613, global_step=495.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  64%|██████▍   | 776/1208 [22:21<12:26,  1.73s/it, loss=0.199, v_num=0, train/loss_simple_step=0.00613, train/loss_vlb_step=3.2e-5, train/loss_step=0.00613, global_step=495.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  64%|██████▍   | 776/1208 [22:21<12:26,  1.73s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.8e-5, train/loss_step=0.0213, global_step=495.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  64%|██████▍   | 777/1208 [22:22<12:24,  1.73s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.8e-5, train/loss_step=0.0213, global_step=495.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  64%|██████▍   | 777/1208 [22:22<12:24,  1.73s/it, loss=0.193, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000938, train/loss_step=0.206, global_step=496.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  64%|██████▍   | 778/1208 [22:23<12:22,  1.73s/it, loss=0.193, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000938, train/loss_step=0.206, global_step=496.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  64%|██████▍   | 778/1208 [22:23<12:22,  1.73s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.89e-5, train/loss_step=0.0106, global_step=496.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  64%|██████▍   | 779/1208 [22:24<12:20,  1.73s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.89e-5, train/loss_step=0.0106, global_step=496.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  64%|██████▍   | 779/1208 [22:24<12:20,  1.73s/it, loss=0.233, v_num=0, train/loss_simple_step=0.810, train/loss_vlb_step=0.0826, train/loss_step=0.810, global_step=496.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  65%|██████▍   | 780/1208 [22:27<12:19,  1.73s/it, loss=0.233, v_num=0, train/loss_simple_step=0.810, train/loss_vlb_step=0.0826, train/loss_step=0.810, global_step=496.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  65%|██████▍   | 780/1208 [22:27<12:19,  1.73s/it, loss=0.231, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.00106, train/loss_step=0.242, global_step=496.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  65%|██████▍   | 781/1208 [22:29<12:17,  1.73s/it, loss=0.231, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.00106, train/loss_step=0.242, global_step=496.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  65%|██████▍   | 781/1208 [22:29<12:17,  1.73s/it, loss=0.245, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00126, train/loss_step=0.280, global_step=497.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  65%|██████▍   | 782/1208 [22:30<12:15,  1.73s/it, loss=0.245, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00126, train/loss_step=0.280, global_step=497.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  65%|██████▍   | 782/1208 [22:30<12:15,  1.73s/it, loss=0.249, v_num=0, train/loss_simple_step=0.0985, train/loss_vlb_step=0.000324, train/loss_step=0.0985, global_step=497.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  65%|██████▍   | 783/1208 [22:31<12:13,  1.73s/it, loss=0.249, v_num=0, train/loss_simple_step=0.0985, train/loss_vlb_step=0.000324, train/loss_step=0.0985, global_step=497.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  65%|██████▍   | 783/1208 [22:31<12:13,  1.73s/it, loss=0.26, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00112, train/loss_step=0.252, global_step=497.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  65%|██████▍   | 784/1208 [22:34<12:12,  1.73s/it, loss=0.26, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00112, train/loss_step=0.252, global_step=497.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  65%|██████▍   | 784/1208 [22:34<12:12,  1.73s/it, loss=0.261, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000333, train/loss_step=0.101, global_step=497.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  65%|██████▍   | 785/1208 [22:35<12:10,  1.73s/it, loss=0.261, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000333, train/loss_step=0.101, global_step=497.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  65%|██████▍   | 785/1208 [22:35<12:10,  1.73s/it, loss=0.253, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=2.03e-5, train/loss_step=0.00373, global_step=498.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  65%|██████▌   | 786/1208 [22:36<12:08,  1.73s/it, loss=0.253, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=2.03e-5, train/loss_step=0.00373, global_step=498.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  65%|██████▌   | 786/1208 [22:36<12:08,  1.73s/it, loss=0.24, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.72e-5, train/loss_step=0.00299, global_step=498.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  65%|██████▌   | 787/1208 [22:37<12:06,  1.73s/it, loss=0.24, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.72e-5, train/loss_step=0.00299, global_step=498.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  65%|██████▌   | 787/1208 [22:37<12:06,  1.73s/it, loss=0.227, v_num=0, train/loss_simple_step=0.0764, train/loss_vlb_step=0.000262, train/loss_step=0.0764, global_step=498.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  65%|██████▌   | 788/1208 [22:40<12:05,  1.73s/it, loss=0.227, v_num=0, train/loss_simple_step=0.0764, train/loss_vlb_step=0.000262, train/loss_step=0.0764, global_step=498.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  65%|██████▌   | 788/1208 [22:40<12:05,  1.73s/it, loss=0.219, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.68e-5, train/loss_step=0.0029, global_step=498.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  65%|██████▌   | 789/1208 [22:41<12:03,  1.73s/it, loss=0.219, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.68e-5, train/loss_step=0.0029, global_step=498.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  65%|██████▌   | 789/1208 [22:41<12:03,  1.73s/it, loss=0.194, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000371, train/loss_step=0.112, global_step=499.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  65%|██████▌   | 790/1208 [22:43<12:01,  1.73s/it, loss=0.194, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000371, train/loss_step=0.112, global_step=499.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  65%|██████▌   | 790/1208 [22:43<12:01,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.00042, train/loss_step=0.127, global_step=499.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  65%|██████▌   | 791/1208 [22:44<11:59,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.00042, train/loss_step=0.127, global_step=499.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  65%|██████▌   | 791/1208 [22:44<11:59,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.000125, train/loss_step=0.0326, global_step=499.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  66%|██████▌   | 792/1208 [22:47<11:58,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.000125, train/loss_step=0.0326, global_step=499.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  66%|██████▌   | 792/1208 [22:47<11:58,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00308, train/loss_step=0.403, global_step=499.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  66%|██████▌   | 793/1208 [22:48<11:56,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00308, train/loss_step=0.403, global_step=499.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  66%|██████▌   | 793/1208 [22:48<11:56,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00158, train/loss_step=0.344, global_step=500.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  66%|██████▌   | 794/1208 [22:49<11:54,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00158, train/loss_step=0.344, global_step=500.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  66%|██████▌   | 794/1208 [22:49<11:54,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.002, train/loss_step=0.317, global_step=500.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  66%|██████▌   | 795/1208 [22:50<11:52,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.002, train/loss_step=0.317, global_step=500.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  66%|██████▌   | 795/1208 [22:50<11:52,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000948, train/loss_step=0.235, global_step=500.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  66%|██████▌   | 796/1208 [22:53<11:51,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000948, train/loss_step=0.235, global_step=500.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  66%|██████▌   | 796/1208 [22:53<11:51,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00687, train/loss_vlb_step=3.54e-5, train/loss_step=0.00687, global_step=500.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  66%|██████▌   | 797/1208 [22:54<11:49,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00687, train/loss_vlb_step=3.54e-5, train/loss_step=0.00687, global_step=500.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  66%|██████▌   | 797/1208 [22:54<11:49,  1.73s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0646, train/loss_vlb_step=0.000223, train/loss_step=0.0646, global_step=501.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  66%|██████▌   | 798/1208 [22:55<11:46,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0646, train/loss_vlb_step=0.000223, train/loss_step=0.0646, global_step=501.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  66%|██████▌   | 798/1208 [22:55<11:46,  1.72s/it, loss=0.195, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00281, train/loss_step=0.388, global_step=501.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  66%|██████▌   | 799/1208 [22:57<11:44,  1.72s/it, loss=0.195, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00281, train/loss_step=0.388, global_step=501.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  66%|██████▌   | 799/1208 [22:57<11:44,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0054, train/loss_vlb_step=2.83e-5, train/loss_step=0.0054, global_step=501.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  66%|██████▌   | 800/1208 [23:00<11:43,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0054, train/loss_vlb_step=2.83e-5, train/loss_step=0.0054, global_step=501.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  66%|██████▌   | 800/1208 [23:00<11:43,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.64e-5, train/loss_step=0.0184, global_step=501.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  66%|██████▋   | 801/1208 [23:01<11:41,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.64e-5, train/loss_step=0.0184, global_step=501.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  66%|██████▋   | 801/1208 [23:01<11:41,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000421, train/loss_step=0.127, global_step=502.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  66%|██████▋   | 802/1208 [23:02<11:39,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000421, train/loss_step=0.127, global_step=502.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  66%|██████▋   | 802/1208 [23:02<11:39,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00711, train/loss_vlb_step=3.68e-5, train/loss_step=0.00711, global_step=502.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  66%|██████▋   | 803/1208 [23:03<11:37,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00711, train/loss_vlb_step=3.68e-5, train/loss_step=0.00711, global_step=502.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  66%|██████▋   | 803/1208 [23:03<11:37,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0641, train/loss_vlb_step=0.000226, train/loss_step=0.0641, global_step=502.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  67%|██████▋   | 804/1208 [23:06<11:36,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0641, train/loss_vlb_step=0.000226, train/loss_step=0.0641, global_step=502.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  67%|██████▋   | 804/1208 [23:06<11:36,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.00094, train/loss_step=0.214, global_step=502.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  67%|██████▋   | 805/1208 [23:07<11:34,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.00094, train/loss_step=0.214, global_step=502.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  67%|██████▋   | 805/1208 [23:07<11:34,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.75e-5, train/loss_step=0.0238, global_step=503.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  67%|██████▋   | 806/1208 [23:08<11:32,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.75e-5, train/loss_step=0.0238, global_step=503.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  67%|██████▋   | 806/1208 [23:08<11:32,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000743, train/loss_step=0.200, global_step=503.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  67%|██████▋   | 807/1208 [23:09<11:30,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000743, train/loss_step=0.200, global_step=503.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  67%|██████▋   | 807/1208 [23:09<11:30,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00715, train/loss_vlb_step=3.5e-5, train/loss_step=0.00715, global_step=503.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  67%|██████▋   | 808/1208 [23:13<11:29,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00715, train/loss_vlb_step=3.5e-5, train/loss_step=0.00715, global_step=503.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  67%|██████▋   | 808/1208 [23:13<11:29,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00223, train/loss_step=0.391, global_step=503.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  67%|██████▋   | 809/1208 [23:14<11:27,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00223, train/loss_step=0.391, global_step=503.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  67%|██████▋   | 809/1208 [23:14<11:27,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.605, train/loss_vlb_step=0.00875, train/loss_step=0.605, global_step=504.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  67%|██████▋   | 810/1208 [23:15<11:25,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.605, train/loss_vlb_step=0.00875, train/loss_step=0.605, global_step=504.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  67%|██████▋   | 810/1208 [23:15<11:25,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00121, train/loss_step=0.306, global_step=504.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  67%|██████▋   | 811/1208 [23:16<11:23,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00121, train/loss_step=0.306, global_step=504.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  67%|██████▋   | 811/1208 [23:16<11:23,  1.72s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=9.89e-6, train/loss_step=0.00162, global_step=504.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  67%|██████▋   | 812/1208 [23:19<11:22,  1.72s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=9.89e-6, train/loss_step=0.00162, global_step=504.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  67%|██████▋   | 812/1208 [23:19<11:22,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00116, train/loss_step=0.301, global_step=504.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  67%|██████▋   | 813/1208 [23:20<11:20,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00116, train/loss_step=0.301, global_step=504.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  67%|██████▋   | 813/1208 [23:20<11:20,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00141, train/loss_step=0.278, global_step=505.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  67%|██████▋   | 814/1208 [23:21<11:18,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00141, train/loss_step=0.278, global_step=505.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  67%|██████▋   | 814/1208 [23:21<11:18,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0906, train/loss_vlb_step=0.000298, train/loss_step=0.0906, global_step=505.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  67%|██████▋   | 815/1208 [23:22<11:16,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0906, train/loss_vlb_step=0.000298, train/loss_step=0.0906, global_step=505.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  67%|██████▋   | 815/1208 [23:22<11:16,  1.72s/it, loss=0.19, v_num=0, train/loss_simple_step=0.701, train/loss_vlb_step=0.0231, train/loss_step=0.701, global_step=505.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]     Epoch 1:  68%|██████▊   | 816/1208 [23:26<11:15,  1.72s/it, loss=0.19, v_num=0, train/loss_simple_step=0.701, train/loss_vlb_step=0.0231, train/loss_step=0.701, global_step=505.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  68%|██████▊   | 816/1208 [23:26<11:15,  1.72s/it, loss=0.21, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00419, train/loss_step=0.408, global_step=505.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  68%|██████▊   | 817/1208 [23:27<11:13,  1.72s/it, loss=0.21, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00419, train/loss_step=0.408, global_step=505.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  68%|██████▊   | 817/1208 [23:27<11:13,  1.72s/it, loss=0.207, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.16e-5, train/loss_step=0.00191, global_step=506.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  68%|██████▊   | 818/1208 [23:28<11:11,  1.72s/it, loss=0.207, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.16e-5, train/loss_step=0.00191, global_step=506.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  68%|██████▊   | 818/1208 [23:28<11:11,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.87e-5, train/loss_step=0.0234, global_step=506.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  68%|██████▊   | 819/1208 [23:29<11:09,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.87e-5, train/loss_step=0.0234, global_step=506.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  68%|██████▊   | 819/1208 [23:29<11:09,  1.72s/it, loss=0.194, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=506.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  68%|██████▊   | 820/1208 [23:32<11:08,  1.72s/it, loss=0.194, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=506.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  68%|██████▊   | 820/1208 [23:32<11:08,  1.72s/it, loss=0.194, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=1.94e-5, train/loss_step=0.00334, global_step=506.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  68%|██████▊   | 821/1208 [23:33<11:06,  1.72s/it, loss=0.194, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=1.94e-5, train/loss_step=0.00334, global_step=506.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  68%|██████▊   | 821/1208 [23:33<11:06,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.73e-5, train/loss_step=0.0127, global_step=507.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  68%|██████▊   | 822/1208 [23:34<11:04,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.73e-5, train/loss_step=0.0127, global_step=507.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  68%|██████▊   | 822/1208 [23:34<11:04,  1.72s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0584, train/loss_vlb_step=0.000207, train/loss_step=0.0584, global_step=507.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  68%|██████▊   | 823/1208 [23:35<11:02,  1.72s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0584, train/loss_vlb_step=0.000207, train/loss_step=0.0584, global_step=507.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  68%|██████▊   | 823/1208 [23:35<11:02,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.96e-5, train/loss_step=0.0238, global_step=507.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  68%|██████▊   | 824/1208 [23:39<11:01,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.96e-5, train/loss_step=0.0238, global_step=507.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  68%|██████▊   | 824/1208 [23:39<11:01,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0639, train/loss_vlb_step=0.000223, train/loss_step=0.0639, global_step=507.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  68%|██████▊   | 825/1208 [23:40<10:59,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0639, train/loss_vlb_step=0.000223, train/loss_step=0.0639, global_step=507.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  68%|██████▊   | 825/1208 [23:40<10:59,  1.72s/it, loss=0.192, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00111, train/loss_step=0.250, global_step=508.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  68%|██████▊   | 826/1208 [23:41<10:57,  1.72s/it, loss=0.192, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00111, train/loss_step=0.250, global_step=508.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  68%|██████▊   | 826/1208 [23:41<10:57,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000414, train/loss_step=0.126, global_step=508.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  68%|██████▊   | 827/1208 [23:42<10:55,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000414, train/loss_step=0.126, global_step=508.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  68%|██████▊   | 827/1208 [23:42<10:55,  1.72s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.000136, train/loss_step=0.0362, global_step=508.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  69%|██████▊   | 828/1208 [23:45<10:54,  1.72s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.000136, train/loss_step=0.0362, global_step=508.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  69%|██████▊   | 828/1208 [23:45<10:54,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0726, train/loss_vlb_step=0.000244, train/loss_step=0.0726, global_step=508.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  69%|██████▊   | 829/1208 [23:46<10:52,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0726, train/loss_vlb_step=0.000244, train/loss_step=0.0726, global_step=508.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  69%|██████▊   | 829/1208 [23:46<10:52,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00122, train/loss_step=0.271, global_step=509.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  69%|██████▊   | 830/1208 [23:47<10:50,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00122, train/loss_step=0.271, global_step=509.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  69%|██████▊   | 830/1208 [23:47<10:50,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.23e-5, train/loss_step=0.00409, global_step=509.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  69%|██████▉   | 831/1208 [23:48<10:48,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.23e-5, train/loss_step=0.00409, global_step=509.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  69%|██████▉   | 831/1208 [23:48<10:48,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0594, train/loss_vlb_step=0.000203, train/loss_step=0.0594, global_step=509.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  69%|██████▉   | 832/1208 [23:51<10:47,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0594, train/loss_vlb_step=0.000203, train/loss_step=0.0594, global_step=509.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  69%|██████▉   | 832/1208 [23:51<10:47,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.33e-5, train/loss_step=0.0143, global_step=509.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  69%|██████▉   | 833/1208 [23:52<10:45,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.33e-5, train/loss_step=0.0143, global_step=509.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  69%|██████▉   | 833/1208 [23:52<10:45,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00338, train/loss_step=0.399, global_step=510.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  69%|██████▉   | 834/1208 [23:54<10:43,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00338, train/loss_step=0.399, global_step=510.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  69%|██████▉   | 834/1208 [23:54<10:43,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00152, train/loss_step=0.303, global_step=510.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  69%|██████▉   | 835/1208 [23:55<10:41,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00152, train/loss_step=0.303, global_step=510.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  69%|██████▉   | 835/1208 [23:55<10:41,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0608, train/loss_vlb_step=0.000213, train/loss_step=0.0608, global_step=510.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  69%|██████▉   | 836/1208 [23:58<10:40,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0608, train/loss_vlb_step=0.000213, train/loss_step=0.0608, global_step=510.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  69%|██████▉   | 836/1208 [23:58<10:40,  1.72s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.00013, train/loss_step=0.0347, global_step=510.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  69%|██████▉   | 837/1208 [23:59<10:38,  1.72s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.00013, train/loss_step=0.0347, global_step=510.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  69%|██████▉   | 837/1208 [23:59<10:38,  1.72s/it, loss=0.098, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=9.61e-5, train/loss_step=0.025, global_step=511.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  69%|██████▉   | 838/1208 [24:00<10:36,  1.72s/it, loss=0.098, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=9.61e-5, train/loss_step=0.025, global_step=511.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  69%|██████▉   | 838/1208 [24:00<10:36,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0973, train/loss_vlb_step=0.000323, train/loss_step=0.0973, global_step=511.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  69%|██████▉   | 839/1208 [24:01<10:34,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0973, train/loss_vlb_step=0.000323, train/loss_step=0.0973, global_step=511.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  69%|██████▉   | 839/1208 [24:01<10:34,  1.72s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.53e-5, train/loss_step=0.0149, global_step=511.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  70%|██████▉   | 840/1208 [24:04<10:32,  1.72s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.53e-5, train/loss_step=0.0149, global_step=511.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  70%|██████▉   | 840/1208 [24:04<10:32,  1.72s/it, loss=0.097, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=6.26e-5, train/loss_step=0.013, global_step=511.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  70%|██████▉   | 841/1208 [24:05<10:30,  1.72s/it, loss=0.097, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=6.26e-5, train/loss_step=0.013, global_step=511.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  70%|██████▉   | 841/1208 [24:05<10:30,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000846, train/loss_step=0.226, global_step=512.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  70%|██████▉   | 842/1208 [24:06<10:28,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000846, train/loss_step=0.226, global_step=512.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  70%|██████▉   | 842/1208 [24:06<10:28,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.94e-5, train/loss_step=0.0132, global_step=512.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  70%|██████▉   | 843/1208 [24:07<10:26,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.94e-5, train/loss_step=0.0132, global_step=512.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  70%|██████▉   | 843/1208 [24:07<10:26,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0985, train/loss_vlb_step=0.000324, train/loss_step=0.0985, global_step=512.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  70%|██████▉   | 844/1208 [24:11<10:25,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0985, train/loss_vlb_step=0.000324, train/loss_step=0.0985, global_step=512.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  70%|██████▉   | 844/1208 [24:11<10:25,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0607, train/loss_vlb_step=0.000217, train/loss_step=0.0607, global_step=512.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  70%|██████▉   | 845/1208 [24:12<10:23,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0607, train/loss_vlb_step=0.000217, train/loss_step=0.0607, global_step=512.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  70%|██████▉   | 845/1208 [24:12<10:23,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00163, train/loss_step=0.339, global_step=513.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  70%|███████   | 846/1208 [24:13<10:21,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00163, train/loss_step=0.339, global_step=513.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  70%|███████   | 846/1208 [24:13<10:21,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00185, train/loss_step=0.331, global_step=513.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  70%|███████   | 847/1208 [24:14<10:19,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00185, train/loss_step=0.331, global_step=513.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  70%|███████   | 847/1208 [24:14<10:19,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00603, train/loss_vlb_step=3.17e-5, train/loss_step=0.00603, global_step=513.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  70%|███████   | 848/1208 [24:17<10:18,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00603, train/loss_vlb_step=3.17e-5, train/loss_step=0.00603, global_step=513.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  70%|███████   | 848/1208 [24:17<10:18,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.00104, train/loss_step=0.238, global_step=513.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]     Epoch 1:  70%|███████   | 849/1208 [24:18<10:16,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.00104, train/loss_step=0.238, global_step=513.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  70%|███████   | 849/1208 [24:18<10:16,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000301, train/loss_step=0.0901, global_step=514.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  70%|███████   | 850/1208 [24:19<10:14,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000301, train/loss_step=0.0901, global_step=514.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  70%|███████   | 850/1208 [24:19<10:14,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00107, train/loss_step=0.259, global_step=514.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  70%|███████   | 851/1208 [24:21<10:12,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00107, train/loss_step=0.259, global_step=514.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  70%|███████   | 851/1208 [24:21<10:12,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0565, train/loss_vlb_step=0.0002, train/loss_step=0.0565, global_step=514.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  71%|███████   | 852/1208 [24:24<10:11,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0565, train/loss_vlb_step=0.0002, train/loss_step=0.0565, global_step=514.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  71%|███████   | 852/1208 [24:24<10:11,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.54e-5, train/loss_step=0.00267, global_step=514.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  71%|███████   | 853/1208 [24:25<10:09,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.54e-5, train/loss_step=0.00267, global_step=514.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  71%|███████   | 853/1208 [24:25<10:09,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000504, train/loss_step=0.148, global_step=515.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  71%|███████   | 854/1208 [24:26<10:07,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000504, train/loss_step=0.148, global_step=515.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  71%|███████   | 854/1208 [24:26<10:07,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00878, train/loss_vlb_step=4.2e-5, train/loss_step=0.00878, global_step=515.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  71%|███████   | 855/1208 [24:27<10:05,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00878, train/loss_vlb_step=4.2e-5, train/loss_step=0.00878, global_step=515.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  71%|███████   | 855/1208 [24:27<10:05,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0695, train/loss_vlb_step=0.000233, train/loss_step=0.0695, global_step=515.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  71%|███████   | 856/1208 [24:30<10:04,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0695, train/loss_vlb_step=0.000233, train/loss_step=0.0695, global_step=515.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  71%|███████   | 856/1208 [24:30<10:04,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=0.000106, train/loss_step=0.0261, global_step=515.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  71%|███████   | 857/1208 [24:31<10:02,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=0.000106, train/loss_step=0.0261, global_step=515.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  71%|███████   | 857/1208 [24:31<10:02,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000112, train/loss_step=0.0278, global_step=516.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  71%|███████   | 858/1208 [24:32<10:00,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000112, train/loss_step=0.0278, global_step=516.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  71%|███████   | 858/1208 [24:32<10:00,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.634, train/loss_vlb_step=0.0209, train/loss_step=0.634, global_step=516.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  71%|███████   | 859/1208 [24:33<09:58,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.634, train/loss_vlb_step=0.0209, train/loss_step=0.634, global_step=516.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  71%|███████   | 859/1208 [24:33<09:58,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0965, train/loss_vlb_step=0.000319, train/loss_step=0.0965, global_step=516.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  71%|███████   | 860/1208 [24:37<09:57,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0965, train/loss_vlb_step=0.000319, train/loss_step=0.0965, global_step=516.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  71%|███████   | 860/1208 [24:37<09:57,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=516.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  71%|███████▏  | 861/1208 [24:38<09:55,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=516.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  71%|███████▏  | 861/1208 [24:38<09:55,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000719, train/loss_step=0.213, global_step=517.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  71%|███████▏  | 862/1208 [24:39<09:53,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000719, train/loss_step=0.213, global_step=517.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  71%|███████▏  | 862/1208 [24:39<09:53,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0967, train/loss_vlb_step=0.000323, train/loss_step=0.0967, global_step=517.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  71%|███████▏  | 863/1208 [24:40<09:51,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0967, train/loss_vlb_step=0.000323, train/loss_step=0.0967, global_step=517.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  71%|███████▏  | 863/1208 [24:40<09:51,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000141, train/loss_step=0.0376, global_step=517.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  72%|███████▏  | 864/1208 [24:43<09:50,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000141, train/loss_step=0.0376, global_step=517.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  72%|███████▏  | 864/1208 [24:43<09:50,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000126, train/loss_step=0.0319, global_step=517.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  72%|███████▏  | 865/1208 [24:44<09:48,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000126, train/loss_step=0.0319, global_step=517.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  72%|███████▏  | 865/1208 [24:44<09:48,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00111, train/loss_step=0.255, global_step=518.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  72%|███████▏  | 866/1208 [24:45<09:46,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00111, train/loss_step=0.255, global_step=518.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  72%|███████▏  | 866/1208 [24:45<09:46,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000716, train/loss_step=0.194, global_step=518.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  72%|███████▏  | 867/1208 [24:46<09:44,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000716, train/loss_step=0.194, global_step=518.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  72%|███████▏  | 867/1208 [24:46<09:44,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00184, train/loss_step=0.337, global_step=518.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  72%|███████▏  | 868/1208 [24:50<09:43,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00184, train/loss_step=0.337, global_step=518.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  72%|███████▏  | 868/1208 [24:50<09:43,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.77e-5, train/loss_step=0.0102, global_step=518.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  72%|███████▏  | 869/1208 [24:51<09:41,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.77e-5, train/loss_step=0.0102, global_step=518.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  72%|███████▏  | 869/1208 [24:51<09:41,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00311, train/loss_step=0.363, global_step=519.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  72%|███████▏  | 870/1208 [24:52<09:39,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00311, train/loss_step=0.363, global_step=519.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  72%|███████▏  | 870/1208 [24:52<09:39,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.000183, train/loss_step=0.0508, global_step=519.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  72%|███████▏  | 871/1208 [24:53<09:37,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.000183, train/loss_step=0.0508, global_step=519.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  72%|███████▏  | 871/1208 [24:53<09:37,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.0013, train/loss_step=0.280, global_step=519.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]     Epoch 1:  72%|███████▏  | 872/1208 [24:56<09:36,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.0013, train/loss_step=0.280, global_step=519.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  72%|███████▏  | 872/1208 [24:56<09:36,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.11e-5, train/loss_step=0.0172, global_step=519.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  72%|███████▏  | 873/1208 [24:57<09:34,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.11e-5, train/loss_step=0.0172, global_step=519.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  72%|███████▏  | 873/1208 [24:57<09:34,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0544, train/loss_vlb_step=0.000199, train/loss_step=0.0544, global_step=520.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  72%|███████▏  | 874/1208 [24:58<09:32,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0544, train/loss_vlb_step=0.000199, train/loss_step=0.0544, global_step=520.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  72%|███████▏  | 874/1208 [24:58<09:32,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000137, train/loss_step=0.0349, global_step=520.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  72%|███████▏  | 875/1208 [24:59<09:30,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000137, train/loss_step=0.0349, global_step=520.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  72%|███████▏  | 875/1208 [24:59<09:30,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000462, train/loss_step=0.140, global_step=520.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  73%|███████▎  | 876/1208 [25:03<09:29,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000462, train/loss_step=0.140, global_step=520.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  73%|███████▎  | 876/1208 [25:03<09:29,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.692, train/loss_vlb_step=0.0396, train/loss_step=0.692, global_step=520.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  73%|███████▎  | 877/1208 [25:04<09:27,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.692, train/loss_vlb_step=0.0396, train/loss_step=0.692, global_step=520.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  73%|███████▎  | 877/1208 [25:04<09:27,  1.72s/it, loss=0.195, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000906, train/loss_step=0.244, global_step=521.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  73%|███████▎  | 878/1208 [25:05<09:25,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000906, train/loss_step=0.244, global_step=521.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  73%|███████▎  | 878/1208 [25:05<09:25,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=1.59e-5, train/loss_step=0.00276, global_step=521.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  73%|███████▎  | 879/1208 [25:06<09:23,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=1.59e-5, train/loss_step=0.00276, global_step=521.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  73%|███████▎  | 879/1208 [25:06<09:23,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00269, train/loss_step=0.409, global_step=521.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  73%|███████▎  | 880/1208 [25:09<09:22,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00269, train/loss_step=0.409, global_step=521.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  73%|███████▎  | 880/1208 [25:09<09:22,  1.72s/it, loss=0.203, v_num=0, train/loss_simple_step=0.596, train/loss_vlb_step=0.0152, train/loss_step=0.596, global_step=521.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  73%|███████▎  | 881/1208 [25:10<09:20,  1.71s/it, loss=0.203, v_num=0, train/loss_simple_step=0.596, train/loss_vlb_step=0.0152, train/loss_step=0.596, global_step=521.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  73%|███████▎  | 881/1208 [25:10<09:20,  1.71s/it, loss=0.2, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000486, train/loss_step=0.146, global_step=522.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  73%|███████▎  | 882/1208 [25:11<09:18,  1.71s/it, loss=0.2, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000486, train/loss_step=0.146, global_step=522.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  73%|███████▎  | 882/1208 [25:11<09:18,  1.71s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0577, train/loss_vlb_step=0.000201, train/loss_step=0.0577, global_step=522.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  73%|███████▎  | 883/1208 [25:12<09:16,  1.71s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0577, train/loss_vlb_step=0.000201, train/loss_step=0.0577, global_step=522.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  73%|███████▎  | 883/1208 [25:12<09:16,  1.71s/it, loss=0.203, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000507, train/loss_step=0.153, global_step=522.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  73%|███████▎  | 884/1208 [25:15<09:15,  1.71s/it, loss=0.203, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000507, train/loss_step=0.153, global_step=522.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  73%|███████▎  | 884/1208 [25:15<09:15,  1.71s/it, loss=0.203, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.18e-5, train/loss_step=0.014, global_step=522.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  73%|███████▎  | 885/1208 [25:16<09:13,  1.71s/it, loss=0.203, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.18e-5, train/loss_step=0.014, global_step=522.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  73%|███████▎  | 885/1208 [25:16<09:13,  1.71s/it, loss=0.194, v_num=0, train/loss_simple_step=0.085, train/loss_vlb_step=0.000289, train/loss_step=0.085, global_step=523.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  73%|███████▎  | 886/1208 [25:18<09:11,  1.71s/it, loss=0.194, v_num=0, train/loss_simple_step=0.085, train/loss_vlb_step=0.000289, train/loss_step=0.085, global_step=523.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  73%|███████▎  | 886/1208 [25:18<09:11,  1.71s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0444, train/loss_vlb_step=0.000164, train/loss_step=0.0444, global_step=523.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  73%|███████▎  | 887/1208 [25:19<09:09,  1.71s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0444, train/loss_vlb_step=0.000164, train/loss_step=0.0444, global_step=523.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  73%|███████▎  | 887/1208 [25:19<09:09,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000607, train/loss_step=0.181, global_step=523.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  74%|███████▎  | 888/1208 [25:22<09:08,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000607, train/loss_step=0.181, global_step=523.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  74%|███████▎  | 888/1208 [25:22<09:08,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0561, train/loss_vlb_step=0.000195, train/loss_step=0.0561, global_step=523.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  74%|███████▎  | 889/1208 [25:23<09:06,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0561, train/loss_vlb_step=0.000195, train/loss_step=0.0561, global_step=523.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  74%|███████▎  | 889/1208 [25:23<09:06,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00555, train/loss_vlb_step=2.78e-5, train/loss_step=0.00555, global_step=524.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  74%|███████▎  | 890/1208 [25:24<09:04,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00555, train/loss_vlb_step=2.78e-5, train/loss_step=0.00555, global_step=524.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  74%|███████▎  | 890/1208 [25:24<09:04,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0341, train/loss_vlb_step=0.000127, train/loss_step=0.0341, global_step=524.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  74%|███████▍  | 891/1208 [25:25<09:02,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0341, train/loss_vlb_step=0.000127, train/loss_step=0.0341, global_step=524.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  74%|███████▍  | 891/1208 [25:25<09:02,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000427, train/loss_step=0.127, global_step=524.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  74%|███████▍  | 892/1208 [25:28<09:01,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000427, train/loss_step=0.127, global_step=524.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  74%|███████▍  | 892/1208 [25:28<09:01,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0659, train/loss_vlb_step=0.000223, train/loss_step=0.0659, global_step=524.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  74%|███████▍  | 893/1208 [25:29<08:59,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0659, train/loss_vlb_step=0.000223, train/loss_step=0.0659, global_step=524.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  74%|███████▍  | 893/1208 [25:29<08:59,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0912, train/loss_vlb_step=0.000309, train/loss_step=0.0912, global_step=525.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  74%|███████▍  | 894/1208 [25:30<08:57,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0912, train/loss_vlb_step=0.000309, train/loss_step=0.0912, global_step=525.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  74%|███████▍  | 894/1208 [25:30<08:57,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000761, train/loss_step=0.216, global_step=525.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  74%|███████▍  | 895/1208 [25:31<08:55,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000761, train/loss_step=0.216, global_step=525.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  74%|███████▍  | 895/1208 [25:31<08:55,  1.71s/it, loss=0.184, v_num=0, train/loss_simple_step=0.461, train/loss_vlb_step=0.00343, train/loss_step=0.461, global_step=525.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  74%|███████▍  | 896/1208 [25:35<08:54,  1.71s/it, loss=0.184, v_num=0, train/loss_simple_step=0.461, train/loss_vlb_step=0.00343, train/loss_step=0.461, global_step=525.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  74%|███████▍  | 896/1208 [25:35<08:54,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0522, train/loss_vlb_step=0.000181, train/loss_step=0.0522, global_step=525.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  74%|███████▍  | 897/1208 [25:36<08:52,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0522, train/loss_vlb_step=0.000181, train/loss_step=0.0522, global_step=525.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  74%|███████▍  | 897/1208 [25:36<08:52,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000137, train/loss_step=0.0361, global_step=526.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  74%|███████▍  | 898/1208 [25:37<08:50,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000137, train/loss_step=0.0361, global_step=526.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  74%|███████▍  | 898/1208 [25:37<08:50,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000418, train/loss_step=0.127, global_step=526.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  74%|███████▍  | 899/1208 [25:38<08:48,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000418, train/loss_step=0.127, global_step=526.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  74%|███████▍  | 899/1208 [25:38<08:48,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000761, train/loss_step=0.214, global_step=526.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  75%|███████▍  | 900/1208 [25:41<08:47,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000761, train/loss_step=0.214, global_step=526.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  75%|███████▍  | 900/1208 [25:41<08:47,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00186, train/loss_step=0.345, global_step=526.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] 
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.74it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.77it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.75it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.75it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.78it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.80it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.78it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.78it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.75it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.78it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.75it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.75it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.75it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 1:  75%|███████▍  | 901/1208 [26:12<08:55,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00186, train/loss_step=0.345, global_step=526.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  75%|███████▍  | 901/1208 [26:12<08:55,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00254, train/loss_step=0.319, global_step=527.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  75%|███████▍  | 902/1208 [26:13<08:53,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00254, train/loss_step=0.319, global_step=527.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  75%|███████▍  | 902/1208 [26:13<08:53,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=0.000104, train/loss_step=0.0261, global_step=527.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  75%|███████▍  | 903/1208 [26:14<08:51,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=0.000104, train/loss_step=0.0261, global_step=527.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  75%|███████▍  | 903/1208 [26:14<08:51,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00305, train/loss_step=0.407, global_step=527.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  75%|███████▍  | 904/1208 [26:17<08:50,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00305, train/loss_step=0.407, global_step=527.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  75%|███████▍  | 904/1208 [26:17<08:50,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00452, train/loss_step=0.428, global_step=527.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  75%|███████▍  | 905/1208 [26:18<08:48,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00452, train/loss_step=0.428, global_step=527.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  75%|███████▍  | 905/1208 [26:18<08:48,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.18e-5, train/loss_step=0.011, global_step=528.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  75%|███████▌  | 906/1208 [26:19<08:46,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.18e-5, train/loss_step=0.011, global_step=528.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  75%|███████▌  | 906/1208 [26:19<08:46,  1.74s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00658, train/loss_vlb_step=3.45e-5, train/loss_step=0.00658, global_step=528.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  75%|███████▌  | 907/1208 [26:20<08:44,  1.74s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00658, train/loss_vlb_step=3.45e-5, train/loss_step=0.00658, global_step=528.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  75%|███████▌  | 907/1208 [26:20<08:44,  1.74s/it, loss=0.158, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000442, train/loss_step=0.132, global_step=528.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  75%|███████▌  | 908/1208 [26:23<08:43,  1.74s/it, loss=0.158, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000442, train/loss_step=0.132, global_step=528.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  75%|███████▌  | 908/1208 [26:23<08:43,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0792, train/loss_vlb_step=0.000266, train/loss_step=0.0792, global_step=528.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  75%|███████▌  | 909/1208 [26:24<08:41,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0792, train/loss_vlb_step=0.000266, train/loss_step=0.0792, global_step=528.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  75%|███████▌  | 909/1208 [26:24<08:41,  1.74s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.28e-5, train/loss_step=0.0197, global_step=529.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  75%|███████▌  | 910/1208 [26:25<08:39,  1.74s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.28e-5, train/loss_step=0.0197, global_step=529.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  75%|███████▌  | 910/1208 [26:25<08:39,  1.74s/it, loss=0.171, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.0011, train/loss_step=0.256, global_step=529.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  75%|███████▌  | 911/1208 [26:26<08:37,  1.74s/it, loss=0.171, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.0011, train/loss_step=0.256, global_step=529.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  75%|███████▌  | 911/1208 [26:26<08:37,  1.74s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0763, train/loss_vlb_step=0.000256, train/loss_step=0.0763, global_step=529.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  75%|███████▌  | 912/1208 [26:30<08:36,  1.74s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0763, train/loss_vlb_step=0.000256, train/loss_step=0.0763, global_step=529.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  75%|███████▌  | 912/1208 [26:30<08:36,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0936, train/loss_vlb_step=0.000312, train/loss_step=0.0936, global_step=529.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  76%|███████▌  | 913/1208 [26:31<08:34,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0936, train/loss_vlb_step=0.000312, train/loss_step=0.0936, global_step=529.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  76%|███████▌  | 913/1208 [26:31<08:34,  1.74s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000191, train/loss_step=0.0555, global_step=530.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  76%|███████▌  | 914/1208 [26:32<08:32,  1.74s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000191, train/loss_step=0.0555, global_step=530.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  76%|███████▌  | 914/1208 [26:32<08:32,  1.74s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0661, train/loss_vlb_step=0.000228, train/loss_step=0.0661, global_step=530.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  76%|███████▌  | 915/1208 [26:33<08:30,  1.74s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0661, train/loss_vlb_step=0.000228, train/loss_step=0.0661, global_step=530.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  76%|███████▌  | 915/1208 [26:33<08:30,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.6e-5, train/loss_step=0.0122, global_step=530.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  76%|███████▌  | 916/1208 [26:36<08:28,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.6e-5, train/loss_step=0.0122, global_step=530.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  76%|███████▌  | 916/1208 [26:36<08:28,  1.74s/it, loss=0.156, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00393, train/loss_step=0.411, global_step=530.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  76%|███████▌  | 917/1208 [26:37<08:26,  1.74s/it, loss=0.156, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00393, train/loss_step=0.411, global_step=530.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  76%|███████▌  | 917/1208 [26:37<08:26,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.16e-5, train/loss_step=0.0137, global_step=531.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  76%|███████▌  | 918/1208 [26:38<08:25,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.16e-5, train/loss_step=0.0137, global_step=531.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  76%|███████▌  | 918/1208 [26:38<08:25,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0946, train/loss_vlb_step=0.00032, train/loss_step=0.0946, global_step=531.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  76%|███████▌  | 919/1208 [26:39<08:23,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0946, train/loss_vlb_step=0.00032, train/loss_step=0.0946, global_step=531.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  76%|███████▌  | 919/1208 [26:39<08:23,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00717, train/loss_vlb_step=3.63e-5, train/loss_step=0.00717, global_step=531.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  76%|███████▌  | 920/1208 [26:42<08:21,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00717, train/loss_vlb_step=3.63e-5, train/loss_step=0.00717, global_step=531.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  76%|███████▌  | 920/1208 [26:42<08:21,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000371, train/loss_step=0.113, global_step=531.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  76%|███████▌  | 921/1208 [26:44<08:19,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000371, train/loss_step=0.113, global_step=531.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  76%|███████▌  | 921/1208 [26:44<08:19,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.441, train/loss_vlb_step=0.0044, train/loss_step=0.441, global_step=532.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  76%|███████▋  | 922/1208 [26:45<08:17,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.441, train/loss_vlb_step=0.0044, train/loss_step=0.441, global_step=532.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  76%|███████▋  | 922/1208 [26:45<08:17,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00858, train/loss_vlb_step=4.13e-5, train/loss_step=0.00858, global_step=532.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  76%|███████▋  | 923/1208 [26:46<08:15,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00858, train/loss_vlb_step=4.13e-5, train/loss_step=0.00858, global_step=532.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  76%|███████▋  | 923/1208 [26:46<08:15,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.496, train/loss_vlb_step=0.00549, train/loss_step=0.496, global_step=532.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  76%|███████▋  | 924/1208 [26:49<08:14,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.496, train/loss_vlb_step=0.00549, train/loss_step=0.496, global_step=532.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  76%|███████▋  | 924/1208 [26:49<08:14,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00391, train/loss_vlb_step=2.12e-5, train/loss_step=0.00391, global_step=532.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  77%|███████▋  | 925/1208 [26:50<08:12,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00391, train/loss_vlb_step=2.12e-5, train/loss_step=0.00391, global_step=532.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  77%|███████▋  | 925/1208 [26:50<08:12,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000529, train/loss_step=0.154, global_step=533.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  77%|███████▋  | 926/1208 [26:51<08:10,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000529, train/loss_step=0.154, global_step=533.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  77%|███████▋  | 926/1208 [26:51<08:10,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000728, train/loss_step=0.197, global_step=533.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  77%|███████▋  | 927/1208 [26:52<08:08,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000728, train/loss_step=0.197, global_step=533.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  77%|███████▋  | 927/1208 [26:52<08:08,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0805, train/loss_vlb_step=0.000267, train/loss_step=0.0805, global_step=533.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  77%|███████▋  | 928/1208 [26:55<08:07,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0805, train/loss_vlb_step=0.000267, train/loss_step=0.0805, global_step=533.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  77%|███████▋  | 928/1208 [26:55<08:07,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00852, train/loss_vlb_step=4.24e-5, train/loss_step=0.00852, global_step=533.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  77%|███████▋  | 929/1208 [26:57<08:05,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00852, train/loss_vlb_step=4.24e-5, train/loss_step=0.00852, global_step=533.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  77%|███████▋  | 929/1208 [26:57<08:05,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000691, train/loss_step=0.192, global_step=534.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  77%|███████▋  | 930/1208 [26:58<08:03,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000691, train/loss_step=0.192, global_step=534.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  77%|███████▋  | 930/1208 [26:58<08:03,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.000143, train/loss_step=0.0359, global_step=534.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  77%|███████▋  | 931/1208 [26:59<08:01,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.000143, train/loss_step=0.0359, global_step=534.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  77%|███████▋  | 931/1208 [26:59<08:01,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.00011, train/loss_step=0.027, global_step=534.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  77%|███████▋  | 932/1208 [27:02<08:00,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.00011, train/loss_step=0.027, global_step=534.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  77%|███████▋  | 932/1208 [27:02<08:00,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=8.91e-5, train/loss_step=0.0223, global_step=534.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  77%|███████▋  | 933/1208 [27:03<07:58,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=8.91e-5, train/loss_step=0.0223, global_step=534.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  77%|███████▋  | 933/1208 [27:03<07:58,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00128, train/loss_step=0.312, global_step=535.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  77%|███████▋  | 934/1208 [27:04<07:56,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00128, train/loss_step=0.312, global_step=535.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  77%|███████▋  | 934/1208 [27:04<07:56,  1.74s/it, loss=0.156, v_num=0, train/loss_simple_step=0.484, train/loss_vlb_step=0.00642, train/loss_step=0.484, global_step=535.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  77%|███████▋  | 935/1208 [27:05<07:54,  1.74s/it, loss=0.156, v_num=0, train/loss_simple_step=0.484, train/loss_vlb_step=0.00642, train/loss_step=0.484, global_step=535.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  77%|███████▋  | 935/1208 [27:05<07:54,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.00108, train/loss_step=0.241, global_step=535.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  77%|███████▋  | 936/1208 [27:08<07:53,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.00108, train/loss_step=0.241, global_step=535.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  77%|███████▋  | 936/1208 [27:08<07:53,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00159, train/loss_step=0.304, global_step=535.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  78%|███████▊  | 937/1208 [27:10<07:51,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00159, train/loss_step=0.304, global_step=535.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  78%|███████▊  | 937/1208 [27:10<07:51,  1.74s/it, loss=0.173, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000859, train/loss_step=0.232, global_step=536.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  78%|███████▊  | 938/1208 [27:11<07:49,  1.74s/it, loss=0.173, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000859, train/loss_step=0.232, global_step=536.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  78%|███████▊  | 938/1208 [27:11<07:49,  1.74s/it, loss=0.175, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000435, train/loss_step=0.132, global_step=536.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  78%|███████▊  | 939/1208 [27:12<07:47,  1.74s/it, loss=0.175, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000435, train/loss_step=0.132, global_step=536.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  78%|███████▊  | 939/1208 [27:12<07:47,  1.74s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.44e-5, train/loss_step=0.0147, global_step=536.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  78%|███████▊  | 940/1208 [27:15<07:46,  1.74s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.44e-5, train/loss_step=0.0147, global_step=536.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  78%|███████▊  | 940/1208 [27:15<07:46,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000663, train/loss_step=0.191, global_step=536.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  78%|███████▊  | 941/1208 [27:16<07:44,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000663, train/loss_step=0.191, global_step=536.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  78%|███████▊  | 941/1208 [27:16<07:44,  1.74s/it, loss=0.165, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.00058, train/loss_step=0.170, global_step=537.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  78%|███████▊  | 942/1208 [27:17<07:42,  1.74s/it, loss=0.165, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.00058, train/loss_step=0.170, global_step=537.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  78%|███████▊  | 942/1208 [27:17<07:42,  1.74s/it, loss=0.171, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000438, train/loss_step=0.132, global_step=537.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  78%|███████▊  | 943/1208 [27:18<07:40,  1.74s/it, loss=0.171, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000438, train/loss_step=0.132, global_step=537.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  78%|███████▊  | 943/1208 [27:18<07:40,  1.74s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=5.19e-5, train/loss_step=0.0106, global_step=537.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  78%|███████▊  | 944/1208 [27:21<07:39,  1.74s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=5.19e-5, train/loss_step=0.0106, global_step=537.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  78%|███████▊  | 944/1208 [27:21<07:39,  1.74s/it, loss=0.16, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00105, train/loss_step=0.252, global_step=537.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  78%|███████▊  | 945/1208 [27:22<07:37,  1.74s/it, loss=0.16, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00105, train/loss_step=0.252, global_step=537.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  78%|███████▊  | 945/1208 [27:22<07:37,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.451, train/loss_vlb_step=0.00534, train/loss_step=0.451, global_step=538.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  78%|███████▊  | 946/1208 [27:23<07:35,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.451, train/loss_vlb_step=0.00534, train/loss_step=0.451, global_step=538.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  78%|███████▊  | 946/1208 [27:23<07:35,  1.74s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00414, train/loss_vlb_step=2.38e-5, train/loss_step=0.00414, global_step=538.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  78%|███████▊  | 947/1208 [27:24<07:33,  1.74s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00414, train/loss_vlb_step=2.38e-5, train/loss_step=0.00414, global_step=538.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  78%|███████▊  | 947/1208 [27:24<07:33,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00377, train/loss_step=0.405, global_step=538.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  78%|███████▊  | 948/1208 [27:28<07:32,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00377, train/loss_step=0.405, global_step=538.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  78%|███████▊  | 948/1208 [27:28<07:32,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00314, train/loss_vlb_step=1.76e-5, train/loss_step=0.00314, global_step=538.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  79%|███████▊  | 949/1208 [27:29<07:30,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00314, train/loss_vlb_step=1.76e-5, train/loss_step=0.00314, global_step=538.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  79%|███████▊  | 949/1208 [27:29<07:30,  1.74s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0708, train/loss_vlb_step=0.000252, train/loss_step=0.0708, global_step=539.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  79%|███████▊  | 950/1208 [27:30<07:28,  1.74s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0708, train/loss_vlb_step=0.000252, train/loss_step=0.0708, global_step=539.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  79%|███████▊  | 950/1208 [27:30<07:28,  1.74s/it, loss=0.197, v_num=0, train/loss_simple_step=0.475, train/loss_vlb_step=0.00509, train/loss_step=0.475, global_step=539.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  79%|███████▊  | 951/1208 [27:31<07:26,  1.74s/it, loss=0.197, v_num=0, train/loss_simple_step=0.475, train/loss_vlb_step=0.00509, train/loss_step=0.475, global_step=539.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  79%|███████▊  | 951/1208 [27:31<07:26,  1.74s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000111, train/loss_step=0.0284, global_step=539.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  79%|███████▉  | 952/1208 [27:34<07:24,  1.74s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000111, train/loss_step=0.0284, global_step=539.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  79%|███████▉  | 952/1208 [27:34<07:24,  1.74s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00332, train/loss_vlb_step=1.81e-5, train/loss_step=0.00332, global_step=539.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  79%|███████▉  | 953/1208 [27:35<07:23,  1.74s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00332, train/loss_vlb_step=1.81e-5, train/loss_step=0.00332, global_step=539.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  79%|███████▉  | 953/1208 [27:35<07:23,  1.74s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000126, train/loss_step=0.0329, global_step=540.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  79%|███████▉  | 954/1208 [27:36<07:21,  1.74s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000126, train/loss_step=0.0329, global_step=540.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  79%|███████▉  | 954/1208 [27:36<07:21,  1.74s/it, loss=0.177, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00287, train/loss_step=0.397, global_step=540.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  79%|███████▉  | 955/1208 [27:37<07:19,  1.74s/it, loss=0.177, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00287, train/loss_step=0.397, global_step=540.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  79%|███████▉  | 955/1208 [27:37<07:19,  1.74s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0809, train/loss_vlb_step=0.000269, train/loss_step=0.0809, global_step=540.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  79%|███████▉  | 956/1208 [27:41<07:17,  1.74s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0809, train/loss_vlb_step=0.000269, train/loss_step=0.0809, global_step=540.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  79%|███████▉  | 956/1208 [27:41<07:17,  1.74s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0354, train/loss_vlb_step=0.000137, train/loss_step=0.0354, global_step=540.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  79%|███████▉  | 957/1208 [27:42<07:15,  1.74s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0354, train/loss_vlb_step=0.000137, train/loss_step=0.0354, global_step=540.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  79%|███████▉  | 957/1208 [27:42<07:15,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00488, train/loss_vlb_step=2.59e-5, train/loss_step=0.00488, global_step=541.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  79%|███████▉  | 958/1208 [27:43<07:14,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00488, train/loss_vlb_step=2.59e-5, train/loss_step=0.00488, global_step=541.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  79%|███████▉  | 958/1208 [27:43<07:14,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.052, train/loss_vlb_step=0.000187, train/loss_step=0.052, global_step=541.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  79%|███████▉  | 959/1208 [27:44<07:12,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.052, train/loss_vlb_step=0.000187, train/loss_step=0.052, global_step=541.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  79%|███████▉  | 959/1208 [27:44<07:12,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0949, train/loss_vlb_step=0.000318, train/loss_step=0.0949, global_step=541.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  79%|███████▉  | 960/1208 [27:47<07:10,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0949, train/loss_vlb_step=0.000318, train/loss_step=0.0949, global_step=541.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  79%|███████▉  | 960/1208 [27:47<07:10,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00429, train/loss_vlb_step=2.34e-5, train/loss_step=0.00429, global_step=541.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  80%|███████▉  | 961/1208 [27:48<07:08,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00429, train/loss_vlb_step=2.34e-5, train/loss_step=0.00429, global_step=541.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  80%|███████▉  | 961/1208 [27:48<07:08,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000122, train/loss_step=0.0317, global_step=542.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  80%|███████▉  | 962/1208 [27:49<07:06,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000122, train/loss_step=0.0317, global_step=542.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  80%|███████▉  | 962/1208 [27:49<07:06,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.35e-5, train/loss_step=0.0174, global_step=542.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  80%|███████▉  | 963/1208 [27:50<07:05,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.35e-5, train/loss_step=0.0174, global_step=542.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  80%|███████▉  | 963/1208 [27:50<07:05,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000692, train/loss_step=0.193, global_step=542.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  80%|███████▉  | 964/1208 [27:53<07:03,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000692, train/loss_step=0.193, global_step=542.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  80%|███████▉  | 964/1208 [27:53<07:03,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000117, train/loss_step=0.0299, global_step=542.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  80%|███████▉  | 965/1208 [27:55<07:01,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000117, train/loss_step=0.0299, global_step=542.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  80%|███████▉  | 965/1208 [27:55<07:01,  1.74s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000167, train/loss_step=0.0449, global_step=543.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  80%|███████▉  | 966/1208 [27:56<06:59,  1.74s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000167, train/loss_step=0.0449, global_step=543.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  80%|███████▉  | 966/1208 [27:56<06:59,  1.74s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0718, train/loss_vlb_step=0.000241, train/loss_step=0.0718, global_step=543.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  80%|████████  | 967/1208 [27:57<06:57,  1.73s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0718, train/loss_vlb_step=0.000241, train/loss_step=0.0718, global_step=543.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  80%|████████  | 967/1208 [27:57<06:57,  1.73s/it, loss=0.0841, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=4.91e-5, train/loss_step=0.0111, global_step=543.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  80%|████████  | 968/1208 [28:00<06:56,  1.74s/it, loss=0.0841, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=4.91e-5, train/loss_step=0.0111, global_step=543.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  80%|████████  | 968/1208 [28:00<06:56,  1.74s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000891, train/loss_step=0.233, global_step=543.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  80%|████████  | 969/1208 [28:01<06:54,  1.74s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000891, train/loss_step=0.233, global_step=543.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  80%|████████  | 969/1208 [28:01<06:54,  1.74s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.15e-5, train/loss_step=0.0137, global_step=544.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  80%|████████  | 970/1208 [28:02<06:52,  1.73s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.15e-5, train/loss_step=0.0137, global_step=544.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  80%|████████  | 970/1208 [28:02<06:52,  1.73s/it, loss=0.078, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000646, train/loss_step=0.179, global_step=544.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  80%|████████  | 971/1208 [28:03<06:50,  1.73s/it, loss=0.078, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000646, train/loss_step=0.179, global_step=544.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  80%|████████  | 971/1208 [28:03<06:50,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.672, train/loss_vlb_step=0.0292, train/loss_step=0.672, global_step=544.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  80%|████████  | 972/1208 [28:06<06:49,  1.74s/it, loss=0.11, v_num=0, train/loss_simple_step=0.672, train/loss_vlb_step=0.0292, train/loss_step=0.672, global_step=544.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  80%|████████  | 972/1208 [28:06<06:49,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0411, train/loss_vlb_step=0.000148, train/loss_step=0.0411, global_step=544.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  81%|████████  | 973/1208 [28:07<06:47,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0411, train/loss_vlb_step=0.000148, train/loss_step=0.0411, global_step=544.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  81%|████████  | 973/1208 [28:07<06:47,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00209, train/loss_step=0.349, global_step=545.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  81%|████████  | 974/1208 [28:08<06:45,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00209, train/loss_step=0.349, global_step=545.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  81%|████████  | 974/1208 [28:08<06:45,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000115, train/loss_step=0.0288, global_step=545.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  81%|████████  | 975/1208 [28:09<06:43,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000115, train/loss_step=0.0288, global_step=545.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  81%|████████  | 975/1208 [28:09<06:43,  1.73s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000126, train/loss_step=0.0325, global_step=545.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  81%|████████  | 976/1208 [28:13<06:42,  1.73s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000126, train/loss_step=0.0325, global_step=545.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  81%|████████  | 976/1208 [28:13<06:42,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.567, train/loss_vlb_step=0.0101, train/loss_step=0.567, global_step=545.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  81%|████████  | 977/1208 [28:14<06:40,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.567, train/loss_vlb_step=0.0101, train/loss_step=0.567, global_step=545.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  81%|████████  | 977/1208 [28:14<06:40,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.31e-5, train/loss_step=0.0122, global_step=546.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  81%|████████  | 978/1208 [28:15<06:38,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.31e-5, train/loss_step=0.0122, global_step=546.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  81%|████████  | 978/1208 [28:15<06:38,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00333, train/loss_vlb_step=1.87e-5, train/loss_step=0.00333, global_step=546.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  81%|████████  | 979/1208 [28:16<06:36,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00333, train/loss_vlb_step=1.87e-5, train/loss_step=0.00333, global_step=546.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  81%|████████  | 979/1208 [28:16<06:36,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000433, train/loss_step=0.127, global_step=546.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  81%|████████  | 980/1208 [28:19<06:35,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000433, train/loss_step=0.127, global_step=546.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  81%|████████  | 980/1208 [28:19<06:35,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00748, train/loss_vlb_step=3.72e-5, train/loss_step=0.00748, global_step=546.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  81%|████████  | 981/1208 [28:20<06:33,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00748, train/loss_vlb_step=3.72e-5, train/loss_step=0.00748, global_step=546.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  81%|████████  | 981/1208 [28:20<06:33,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=547.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  81%|████████▏ | 982/1208 [28:21<06:31,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=547.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  81%|████████▏ | 982/1208 [28:21<06:31,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000566, train/loss_step=0.167, global_step=547.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  81%|████████▏ | 983/1208 [28:22<06:29,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000566, train/loss_step=0.167, global_step=547.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  81%|████████▏ | 983/1208 [28:22<06:29,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0315, train/loss_vlb_step=0.000125, train/loss_step=0.0315, global_step=547.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  81%|████████▏ | 984/1208 [28:26<06:28,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0315, train/loss_vlb_step=0.000125, train/loss_step=0.0315, global_step=547.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  81%|████████▏ | 984/1208 [28:26<06:28,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.542, train/loss_vlb_step=0.00766, train/loss_step=0.542, global_step=547.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  82%|████████▏ | 985/1208 [28:27<06:26,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.542, train/loss_vlb_step=0.00766, train/loss_step=0.542, global_step=547.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  82%|████████▏ | 985/1208 [28:27<06:26,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000497, train/loss_step=0.147, global_step=548.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  82%|████████▏ | 986/1208 [28:28<06:24,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000497, train/loss_step=0.147, global_step=548.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  82%|████████▏ | 986/1208 [28:28<06:24,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000123, train/loss_step=0.0304, global_step=548.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  82%|████████▏ | 987/1208 [28:29<06:22,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000123, train/loss_step=0.0304, global_step=548.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  82%|████████▏ | 987/1208 [28:29<06:22,  1.73s/it, loss=0.188, v_num=0, train/loss_simple_step=0.468, train/loss_vlb_step=0.00384, train/loss_step=0.468, global_step=548.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  82%|████████▏ | 988/1208 [28:32<06:21,  1.73s/it, loss=0.188, v_num=0, train/loss_simple_step=0.468, train/loss_vlb_step=0.00384, train/loss_step=0.468, global_step=548.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  82%|████████▏ | 988/1208 [28:32<06:21,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0905, train/loss_vlb_step=0.000303, train/loss_step=0.0905, global_step=548.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  82%|████████▏ | 989/1208 [28:33<06:19,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0905, train/loss_vlb_step=0.000303, train/loss_step=0.0905, global_step=548.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  82%|████████▏ | 989/1208 [28:33<06:19,  1.73s/it, loss=0.192, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.001, train/loss_step=0.244, global_step=549.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]     Epoch 1:  82%|████████▏ | 990/1208 [28:34<06:17,  1.73s/it, loss=0.192, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.001, train/loss_step=0.244, global_step=549.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  82%|████████▏ | 990/1208 [28:34<06:17,  1.73s/it, loss=0.195, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000882, train/loss_step=0.230, global_step=549.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  82%|████████▏ | 991/1208 [28:35<06:15,  1.73s/it, loss=0.195, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000882, train/loss_step=0.230, global_step=549.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  82%|████████▏ | 991/1208 [28:35<06:15,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00204, train/loss_step=0.372, global_step=549.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  82%|████████▏ | 992/1208 [28:38<06:14,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00204, train/loss_step=0.372, global_step=549.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  82%|████████▏ | 992/1208 [28:38<06:14,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=549.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  82%|████████▏ | 993/1208 [28:40<06:12,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=549.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  82%|████████▏ | 993/1208 [28:40<06:12,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0668, train/loss_vlb_step=0.000228, train/loss_step=0.0668, global_step=550.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  82%|████████▏ | 994/1208 [28:41<06:10,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0668, train/loss_vlb_step=0.000228, train/loss_step=0.0668, global_step=550.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  82%|████████▏ | 994/1208 [28:41<06:10,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=6e-5, train/loss_step=0.0127, global_step=550.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  82%|████████▏ | 995/1208 [28:42<06:08,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=6e-5, train/loss_step=0.0127, global_step=550.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  82%|████████▏ | 995/1208 [28:42<06:08,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00759, train/loss_vlb_step=3.81e-5, train/loss_step=0.00759, global_step=550.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  82%|████████▏ | 996/1208 [28:45<06:07,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00759, train/loss_vlb_step=3.81e-5, train/loss_step=0.00759, global_step=550.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  82%|████████▏ | 996/1208 [28:45<06:07,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.32e-5, train/loss_step=0.00222, global_step=550.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  83%|████████▎ | 997/1208 [28:46<06:05,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.32e-5, train/loss_step=0.00222, global_step=550.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  83%|████████▎ | 997/1208 [28:46<06:05,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.496, train/loss_vlb_step=0.00501, train/loss_step=0.496, global_step=551.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  83%|████████▎ | 998/1208 [28:47<06:03,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.496, train/loss_vlb_step=0.00501, train/loss_step=0.496, global_step=551.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  83%|████████▎ | 998/1208 [28:47<06:03,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00123, train/loss_step=0.282, global_step=551.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  83%|████████▎ | 999/1208 [28:48<06:01,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00123, train/loss_step=0.282, global_step=551.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  83%|████████▎ | 999/1208 [28:48<06:01,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00102, train/loss_step=0.272, global_step=551.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  83%|████████▎ | 1000/1208 [28:51<06:00,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00102, train/loss_step=0.272, global_step=551.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  83%|████████▎ | 1000/1208 [28:51<06:00,  1.73s/it, loss=0.19, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000417, train/loss_step=0.127, global_step=551.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  83%|████████▎ | 1001/1208 [28:52<05:58,  1.73s/it, loss=0.19, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000417, train/loss_step=0.127, global_step=551.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  83%|████████▎ | 1001/1208 [28:52<05:58,  1.73s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0997, train/loss_vlb_step=0.000329, train/loss_step=0.0997, global_step=552.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  83%|████████▎ | 1002/1208 [28:53<05:56,  1.73s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0997, train/loss_vlb_step=0.000329, train/loss_step=0.0997, global_step=552.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  83%|████████▎ | 1002/1208 [28:53<05:56,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=1.73e-5, train/loss_step=0.00302, global_step=552.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  83%|████████▎ | 1003/1208 [28:55<05:54,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=1.73e-5, train/loss_step=0.00302, global_step=552.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  83%|████████▎ | 1003/1208 [28:55<05:54,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0739, train/loss_vlb_step=0.00025, train/loss_step=0.0739, global_step=552.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  83%|████████▎ | 1004/1208 [28:58<05:53,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0739, train/loss_vlb_step=0.00025, train/loss_step=0.0739, global_step=552.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  83%|████████▎ | 1004/1208 [28:58<05:53,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.493, train/loss_vlb_step=0.00405, train/loss_step=0.493, global_step=552.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  83%|████████▎ | 1005/1208 [28:59<05:51,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.493, train/loss_vlb_step=0.00405, train/loss_step=0.493, global_step=552.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  83%|████████▎ | 1005/1208 [28:59<05:51,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000339, train/loss_step=0.102, global_step=553.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  83%|████████▎ | 1006/1208 [29:00<05:49,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000339, train/loss_step=0.102, global_step=553.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  83%|████████▎ | 1006/1208 [29:00<05:49,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.00033, train/loss_step=0.100, global_step=553.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  83%|████████▎ | 1007/1208 [29:01<05:47,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.00033, train/loss_step=0.100, global_step=553.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  83%|████████▎ | 1007/1208 [29:01<05:47,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0912, train/loss_vlb_step=0.0003, train/loss_step=0.0912, global_step=553.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  83%|████████▎ | 1008/1208 [29:04<05:46,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0912, train/loss_vlb_step=0.0003, train/loss_step=0.0912, global_step=553.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  83%|████████▎ | 1008/1208 [29:04<05:46,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.00429, train/loss_step=0.406, global_step=553.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  84%|████████▎ | 1009/1208 [29:05<05:44,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.00429, train/loss_step=0.406, global_step=553.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  84%|████████▎ | 1009/1208 [29:05<05:44,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00232, train/loss_step=0.384, global_step=554.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  84%|████████▎ | 1010/1208 [29:06<05:42,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00232, train/loss_step=0.384, global_step=554.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  84%|████████▎ | 1010/1208 [29:06<05:42,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=554.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  84%|████████▎ | 1011/1208 [29:07<05:40,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=554.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  84%|████████▎ | 1011/1208 [29:07<05:40,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00799, train/loss_vlb_step=3.86e-5, train/loss_step=0.00799, global_step=554.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  84%|████████▍ | 1012/1208 [29:10<05:39,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00799, train/loss_vlb_step=3.86e-5, train/loss_step=0.00799, global_step=554.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  84%|████████▍ | 1012/1208 [29:11<05:39,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00478, train/loss_vlb_step=2.42e-5, train/loss_step=0.00478, global_step=554.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  84%|████████▍ | 1013/1208 [29:12<05:37,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00478, train/loss_vlb_step=2.42e-5, train/loss_step=0.00478, global_step=554.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  84%|████████▍ | 1013/1208 [29:12<05:37,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000603, train/loss_step=0.177, global_step=555.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  84%|████████▍ | 1014/1208 [29:13<05:35,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000603, train/loss_step=0.177, global_step=555.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  84%|████████▍ | 1014/1208 [29:13<05:35,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00506, train/loss_vlb_step=2.68e-5, train/loss_step=0.00506, global_step=555.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  84%|████████▍ | 1015/1208 [29:14<05:33,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00506, train/loss_vlb_step=2.68e-5, train/loss_step=0.00506, global_step=555.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  84%|████████▍ | 1015/1208 [29:14<05:33,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00145, train/loss_step=0.301, global_step=555.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  84%|████████▍ | 1016/1208 [29:17<05:32,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00145, train/loss_step=0.301, global_step=555.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  84%|████████▍ | 1016/1208 [29:17<05:32,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.94e-5, train/loss_step=0.0128, global_step=555.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  84%|████████▍ | 1017/1208 [29:18<05:30,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.94e-5, train/loss_step=0.0128, global_step=555.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  84%|████████▍ | 1017/1208 [29:18<05:30,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6.09e-5, train/loss_step=0.0135, global_step=556.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  84%|████████▍ | 1018/1208 [29:19<05:28,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6.09e-5, train/loss_step=0.0135, global_step=556.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  84%|████████▍ | 1018/1208 [29:19<05:28,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.82e-5, train/loss_step=0.0126, global_step=556.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  84%|████████▍ | 1019/1208 [29:20<05:26,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.82e-5, train/loss_step=0.0126, global_step=556.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  84%|████████▍ | 1019/1208 [29:20<05:26,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=8.07e-5, train/loss_step=0.0187, global_step=556.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  84%|████████▍ | 1020/1208 [29:23<05:25,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=8.07e-5, train/loss_step=0.0187, global_step=556.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  84%|████████▍ | 1020/1208 [29:23<05:25,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0453, train/loss_vlb_step=0.00017, train/loss_step=0.0453, global_step=556.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  85%|████████▍ | 1021/1208 [29:24<05:23,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0453, train/loss_vlb_step=0.00017, train/loss_step=0.0453, global_step=556.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  85%|████████▍ | 1021/1208 [29:24<05:23,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.32e-5, train/loss_step=0.00219, global_step=557.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  85%|████████▍ | 1022/1208 [29:25<05:21,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.32e-5, train/loss_step=0.00219, global_step=557.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  85%|████████▍ | 1022/1208 [29:25<05:21,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00209, train/loss_step=0.332, global_step=557.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  85%|████████▍ | 1023/1208 [29:26<05:19,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00209, train/loss_step=0.332, global_step=557.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  85%|████████▍ | 1023/1208 [29:26<05:19,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=557.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  85%|████████▍ | 1024/1208 [29:30<05:18,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=557.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  85%|████████▍ | 1024/1208 [29:30<05:18,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000107, train/loss_step=0.0274, global_step=557.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  85%|████████▍ | 1025/1208 [29:31<05:16,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000107, train/loss_step=0.0274, global_step=557.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  85%|████████▍ | 1025/1208 [29:31<05:16,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000115, train/loss_step=0.0282, global_step=558.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  85%|████████▍ | 1026/1208 [29:32<05:14,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000115, train/loss_step=0.0282, global_step=558.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  85%|████████▍ | 1026/1208 [29:32<05:14,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.00097, train/loss_step=0.241, global_step=558.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  85%|████████▌ | 1027/1208 [29:33<05:12,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.00097, train/loss_step=0.241, global_step=558.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  85%|████████▌ | 1027/1208 [29:33<05:12,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000435, train/loss_step=0.131, global_step=558.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  85%|████████▌ | 1028/1208 [29:36<05:11,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000435, train/loss_step=0.131, global_step=558.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  85%|████████▌ | 1028/1208 [29:36<05:11,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000133, train/loss_step=0.0353, global_step=558.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  85%|████████▌ | 1029/1208 [29:37<05:09,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000133, train/loss_step=0.0353, global_step=558.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  85%|████████▌ | 1029/1208 [29:37<05:09,  1.73s/it, loss=0.0839, v_num=0, train/loss_simple_step=0.0506, train/loss_vlb_step=0.000181, train/loss_step=0.0506, global_step=559.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  85%|████████▌ | 1030/1208 [29:38<05:07,  1.73s/it, loss=0.0839, v_num=0, train/loss_simple_step=0.0506, train/loss_vlb_step=0.000181, train/loss_step=0.0506, global_step=559.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  85%|████████▌ | 1030/1208 [29:38<05:07,  1.73s/it, loss=0.0856, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000531, train/loss_step=0.159, global_step=559.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  85%|████████▌ | 1031/1208 [29:39<05:05,  1.73s/it, loss=0.0856, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000531, train/loss_step=0.159, global_step=559.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  85%|████████▌ | 1031/1208 [29:39<05:05,  1.73s/it, loss=0.0853, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=1.1e-5, train/loss_step=0.00181, global_step=559.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  85%|████████▌ | 1032/1208 [29:42<05:04,  1.73s/it, loss=0.0853, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=1.1e-5, train/loss_step=0.00181, global_step=559.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  85%|████████▌ | 1032/1208 [29:42<05:04,  1.73s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00118, train/loss_step=0.265, global_step=559.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  86%|████████▌ | 1033/1208 [29:44<05:02,  1.73s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00118, train/loss_step=0.265, global_step=559.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  86%|████████▌ | 1033/1208 [29:44<05:02,  1.73s/it, loss=0.097, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000511, train/loss_step=0.152, global_step=560.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  86%|████████▌ | 1034/1208 [29:45<05:00,  1.73s/it, loss=0.097, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000511, train/loss_step=0.152, global_step=560.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  86%|████████▌ | 1034/1208 [29:45<05:00,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000669, train/loss_step=0.187, global_step=560.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  86%|████████▌ | 1035/1208 [29:46<04:58,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000669, train/loss_step=0.187, global_step=560.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  86%|████████▌ | 1035/1208 [29:46<04:58,  1.73s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.00013, train/loss_step=0.0336, global_step=560.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  86%|████████▌ | 1036/1208 [29:49<04:57,  1.73s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.00013, train/loss_step=0.0336, global_step=560.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  86%|████████▌ | 1036/1208 [29:49<04:57,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000633, train/loss_step=0.176, global_step=560.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  86%|████████▌ | 1037/1208 [29:50<04:55,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000633, train/loss_step=0.176, global_step=560.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  86%|████████▌ | 1037/1208 [29:50<04:55,  1.73s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=1.51e-5, train/loss_step=0.0025, global_step=561.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  86%|████████▌ | 1038/1208 [29:51<04:53,  1.73s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=1.51e-5, train/loss_step=0.0025, global_step=561.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  86%|████████▌ | 1038/1208 [29:51<04:53,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.719, train/loss_vlb_step=0.0372, train/loss_step=0.719, global_step=561.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  86%|████████▌ | 1039/1208 [29:52<04:51,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.719, train/loss_vlb_step=0.0372, train/loss_step=0.719, global_step=561.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  86%|████████▌ | 1039/1208 [29:52<04:51,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0084, train/loss_vlb_step=4.01e-5, train/loss_step=0.0084, global_step=561.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  86%|████████▌ | 1040/1208 [29:55<04:50,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0084, train/loss_vlb_step=4.01e-5, train/loss_step=0.0084, global_step=561.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  86%|████████▌ | 1040/1208 [29:55<04:50,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.695, train/loss_vlb_step=0.0328, train/loss_step=0.695, global_step=561.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  86%|████████▌ | 1041/1208 [29:56<04:48,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.695, train/loss_vlb_step=0.0328, train/loss_step=0.695, global_step=561.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  86%|████████▌ | 1041/1208 [29:56<04:48,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0898, train/loss_vlb_step=0.000302, train/loss_step=0.0898, global_step=562.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  86%|████████▋ | 1042/1208 [29:57<04:46,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0898, train/loss_vlb_step=0.000302, train/loss_step=0.0898, global_step=562.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  86%|████████▋ | 1042/1208 [29:57<04:46,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.62e-5, train/loss_step=0.00273, global_step=562.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  86%|████████▋ | 1043/1208 [29:58<04:44,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.62e-5, train/loss_step=0.00273, global_step=562.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  86%|████████▋ | 1043/1208 [29:58<04:44,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.44e-5, train/loss_step=0.0168, global_step=562.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  86%|████████▋ | 1044/1208 [30:02<04:43,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.44e-5, train/loss_step=0.0168, global_step=562.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  86%|████████▋ | 1044/1208 [30:02<04:43,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00176, train/loss_step=0.310, global_step=562.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  87%|████████▋ | 1045/1208 [30:03<04:41,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00176, train/loss_step=0.310, global_step=562.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  87%|████████▋ | 1045/1208 [30:03<04:41,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=1.43e-5, train/loss_step=0.00242, global_step=563.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  87%|████████▋ | 1046/1208 [30:04<04:39,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=1.43e-5, train/loss_step=0.00242, global_step=563.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  87%|████████▋ | 1046/1208 [30:04<04:39,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000525, train/loss_step=0.156, global_step=563.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  87%|████████▋ | 1047/1208 [30:05<04:37,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000525, train/loss_step=0.156, global_step=563.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  87%|████████▋ | 1047/1208 [30:05<04:37,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000396, train/loss_step=0.120, global_step=563.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  87%|████████▋ | 1048/1208 [30:08<04:36,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000396, train/loss_step=0.120, global_step=563.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  87%|████████▋ | 1048/1208 [30:08<04:36,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.00081, train/loss_step=0.212, global_step=563.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  87%|████████▋ | 1049/1208 [30:09<04:34,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.00081, train/loss_step=0.212, global_step=563.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  87%|████████▋ | 1049/1208 [30:09<04:34,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0639, train/loss_vlb_step=0.000219, train/loss_step=0.0639, global_step=564.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  87%|████████▋ | 1050/1208 [30:10<04:32,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0639, train/loss_vlb_step=0.000219, train/loss_step=0.0639, global_step=564.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  87%|████████▋ | 1050/1208 [30:10<04:32,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0637, train/loss_vlb_step=0.000228, train/loss_step=0.0637, global_step=564.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  87%|████████▋ | 1051/1208 [30:11<04:30,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0637, train/loss_vlb_step=0.000228, train/loss_step=0.0637, global_step=564.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  87%|████████▋ | 1051/1208 [30:11<04:30,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00172, train/loss_step=0.343, global_step=564.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  87%|████████▋ | 1052/1208 [30:14<04:29,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00172, train/loss_step=0.343, global_step=564.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  87%|████████▋ | 1052/1208 [30:14<04:29,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0837, train/loss_vlb_step=0.000276, train/loss_step=0.0837, global_step=564.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  87%|████████▋ | 1053/1208 [30:15<04:27,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0837, train/loss_vlb_step=0.000276, train/loss_step=0.0837, global_step=564.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  87%|████████▋ | 1053/1208 [30:15<04:27,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.498, train/loss_vlb_step=0.00971, train/loss_step=0.498, global_step=565.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  87%|████████▋ | 1054/1208 [30:17<04:25,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.498, train/loss_vlb_step=0.00971, train/loss_step=0.498, global_step=565.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  87%|████████▋ | 1054/1208 [30:17<04:25,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.0007, train/loss_step=0.190, global_step=565.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  87%|████████▋ | 1055/1208 [30:18<04:23,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.0007, train/loss_step=0.190, global_step=565.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  87%|████████▋ | 1055/1208 [30:18<04:23,  1.72s/it, loss=0.197, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000673, train/loss_step=0.193, global_step=565.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  87%|████████▋ | 1056/1208 [30:21<04:22,  1.72s/it, loss=0.197, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000673, train/loss_step=0.193, global_step=565.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  87%|████████▋ | 1056/1208 [30:21<04:22,  1.72s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0977, train/loss_vlb_step=0.000321, train/loss_step=0.0977, global_step=565.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  88%|████████▊ | 1057/1208 [30:22<04:20,  1.72s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0977, train/loss_vlb_step=0.000321, train/loss_step=0.0977, global_step=565.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  88%|████████▊ | 1057/1208 [30:22<04:20,  1.72s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0502, train/loss_vlb_step=0.000184, train/loss_step=0.0502, global_step=566.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  88%|████████▊ | 1058/1208 [30:23<04:18,  1.72s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0502, train/loss_vlb_step=0.000184, train/loss_step=0.0502, global_step=566.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  88%|████████▊ | 1058/1208 [30:23<04:18,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=566.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  88%|████████▊ | 1059/1208 [30:24<04:16,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=566.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  88%|████████▊ | 1059/1208 [30:24<04:16,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000789, train/loss_step=0.205, global_step=566.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  88%|████████▊ | 1060/1208 [30:27<04:15,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000789, train/loss_step=0.205, global_step=566.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  88%|████████▊ | 1060/1208 [30:27<04:15,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00886, train/loss_vlb_step=4.28e-5, train/loss_step=0.00886, global_step=566.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  88%|████████▊ | 1061/1208 [30:28<04:13,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00886, train/loss_vlb_step=4.28e-5, train/loss_step=0.00886, global_step=566.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  88%|████████▊ | 1061/1208 [30:28<04:13,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.000146, train/loss_step=0.0393, global_step=567.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  88%|████████▊ | 1062/1208 [30:29<04:11,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.000146, train/loss_step=0.0393, global_step=567.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  88%|████████▊ | 1062/1208 [30:29<04:11,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0566, train/loss_vlb_step=0.0002, train/loss_step=0.0566, global_step=567.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  88%|████████▊ | 1063/1208 [30:30<04:09,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0566, train/loss_vlb_step=0.0002, train/loss_step=0.0566, global_step=567.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  88%|████████▊ | 1063/1208 [30:30<04:09,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0502, train/loss_vlb_step=0.000174, train/loss_step=0.0502, global_step=567.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  88%|████████▊ | 1064/1208 [30:34<04:08,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0502, train/loss_vlb_step=0.000174, train/loss_step=0.0502, global_step=567.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  88%|████████▊ | 1064/1208 [30:34<04:08,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000148, train/loss_step=0.0409, global_step=567.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  88%|████████▊ | 1065/1208 [30:35<04:06,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000148, train/loss_step=0.0409, global_step=567.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  88%|████████▊ | 1065/1208 [30:35<04:06,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000572, train/loss_step=0.170, global_step=568.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  88%|████████▊ | 1066/1208 [30:36<04:04,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000572, train/loss_step=0.170, global_step=568.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  88%|████████▊ | 1066/1208 [30:36<04:04,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00691, train/loss_vlb_step=3.54e-5, train/loss_step=0.00691, global_step=568.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  88%|████████▊ | 1067/1208 [30:37<04:02,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00691, train/loss_vlb_step=3.54e-5, train/loss_step=0.00691, global_step=568.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  88%|████████▊ | 1067/1208 [30:37<04:02,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000115, train/loss_step=0.0288, global_step=568.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  88%|████████▊ | 1068/1208 [30:40<04:01,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000115, train/loss_step=0.0288, global_step=568.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  88%|████████▊ | 1068/1208 [30:40<04:01,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.52e-5, train/loss_step=0.00253, global_step=568.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  88%|████████▊ | 1069/1208 [30:41<03:59,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.52e-5, train/loss_step=0.00253, global_step=568.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  88%|████████▊ | 1069/1208 [30:41<03:59,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00544, train/loss_vlb_step=2.82e-5, train/loss_step=0.00544, global_step=569.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  89%|████████▊ | 1070/1208 [30:42<03:57,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00544, train/loss_vlb_step=2.82e-5, train/loss_step=0.00544, global_step=569.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  89%|████████▊ | 1070/1208 [30:42<03:57,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00181, train/loss_step=0.351, global_step=569.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  89%|████████▊ | 1071/1208 [30:43<03:55,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00181, train/loss_step=0.351, global_step=569.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  89%|████████▊ | 1071/1208 [30:43<03:55,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00799, train/loss_vlb_step=4e-5, train/loss_step=0.00799, global_step=569.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  89%|████████▊ | 1072/1208 [30:47<03:54,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00799, train/loss_vlb_step=4e-5, train/loss_step=0.00799, global_step=569.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  89%|████████▊ | 1072/1208 [30:47<03:54,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00209, train/loss_step=0.362, global_step=569.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  89%|████████▉ | 1073/1208 [30:48<03:52,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00209, train/loss_step=0.362, global_step=569.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  89%|████████▉ | 1073/1208 [30:48<03:52,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0929, train/loss_vlb_step=0.00031, train/loss_step=0.0929, global_step=570.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  89%|████████▉ | 1074/1208 [30:49<03:50,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0929, train/loss_vlb_step=0.00031, train/loss_step=0.0929, global_step=570.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  89%|████████▉ | 1074/1208 [30:49<03:50,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000579, train/loss_step=0.170, global_step=570.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  89%|████████▉ | 1075/1208 [30:50<03:48,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000579, train/loss_step=0.170, global_step=570.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  89%|████████▉ | 1075/1208 [30:50<03:48,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000675, train/loss_step=0.196, global_step=570.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  89%|████████▉ | 1076/1208 [30:53<03:47,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000675, train/loss_step=0.196, global_step=570.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  89%|████████▉ | 1076/1208 [30:53<03:47,  1.72s/it, loss=0.099, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.79e-5, train/loss_step=0.0201, global_step=570.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  89%|████████▉ | 1077/1208 [30:54<03:45,  1.72s/it, loss=0.099, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.79e-5, train/loss_step=0.0201, global_step=570.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  89%|████████▉ | 1077/1208 [30:54<03:45,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000819, train/loss_step=0.218, global_step=571.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  89%|████████▉ | 1078/1208 [30:55<03:43,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000819, train/loss_step=0.218, global_step=571.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  89%|████████▉ | 1078/1208 [30:55<03:43,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00857, train/loss_vlb_step=4.26e-5, train/loss_step=0.00857, global_step=571.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  89%|████████▉ | 1079/1208 [30:56<03:41,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00857, train/loss_vlb_step=4.26e-5, train/loss_step=0.00857, global_step=571.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  89%|████████▉ | 1079/1208 [30:56<03:41,  1.72s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=1.51e-5, train/loss_step=0.00259, global_step=571.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  89%|████████▉ | 1080/1208 [30:59<03:40,  1.72s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=1.51e-5, train/loss_step=0.00259, global_step=571.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  89%|████████▉ | 1080/1208 [30:59<03:40,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000843, train/loss_step=0.225, global_step=571.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  89%|████████▉ | 1081/1208 [31:00<03:38,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000843, train/loss_step=0.225, global_step=571.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  89%|████████▉ | 1081/1208 [31:00<03:38,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000688, train/loss_step=0.201, global_step=572.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  90%|████████▉ | 1082/1208 [31:02<03:36,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000688, train/loss_step=0.201, global_step=572.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  90%|████████▉ | 1082/1208 [31:02<03:36,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00153, train/loss_step=0.316, global_step=572.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  90%|████████▉ | 1083/1208 [31:03<03:35,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00153, train/loss_step=0.316, global_step=572.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  90%|████████▉ | 1083/1208 [31:03<03:35,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000443, train/loss_step=0.134, global_step=572.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  90%|████████▉ | 1084/1208 [31:06<03:33,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000443, train/loss_step=0.134, global_step=572.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  90%|████████▉ | 1084/1208 [31:06<03:33,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.610, train/loss_vlb_step=0.0132, train/loss_step=0.610, global_step=572.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  90%|████████▉ | 1085/1208 [31:07<03:31,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.610, train/loss_vlb_step=0.0132, train/loss_step=0.610, global_step=572.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  90%|████████▉ | 1085/1208 [31:07<03:31,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00121, train/loss_step=0.256, global_step=573.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  90%|████████▉ | 1086/1208 [31:08<03:29,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00121, train/loss_step=0.256, global_step=573.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  90%|████████▉ | 1086/1208 [31:08<03:29,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000354, train/loss_step=0.107, global_step=573.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  90%|████████▉ | 1087/1208 [31:09<03:28,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000354, train/loss_step=0.107, global_step=573.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  90%|████████▉ | 1087/1208 [31:09<03:28,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000999, train/loss_step=0.237, global_step=573.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  90%|█████████ | 1088/1208 [31:12<03:26,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000999, train/loss_step=0.237, global_step=573.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  90%|█████████ | 1088/1208 [31:12<03:26,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000584, train/loss_step=0.165, global_step=573.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  90%|█████████ | 1089/1208 [31:13<03:24,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000584, train/loss_step=0.165, global_step=573.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  90%|█████████ | 1089/1208 [31:13<03:24,  1.72s/it, loss=0.191, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000438, train/loss_step=0.133, global_step=574.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  90%|█████████ | 1090/1208 [31:14<03:22,  1.72s/it, loss=0.191, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000438, train/loss_step=0.133, global_step=574.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  90%|█████████ | 1090/1208 [31:14<03:22,  1.72s/it, loss=0.18, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000439, train/loss_step=0.134, global_step=574.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  90%|█████████ | 1091/1208 [31:15<03:21,  1.72s/it, loss=0.18, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000439, train/loss_step=0.134, global_step=574.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  90%|█████████ | 1091/1208 [31:15<03:21,  1.72s/it, loss=0.195, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00139, train/loss_step=0.308, global_step=574.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  90%|█████████ | 1092/1208 [31:19<03:19,  1.72s/it, loss=0.195, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00139, train/loss_step=0.308, global_step=574.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  90%|█████████ | 1092/1208 [31:19<03:19,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0907, train/loss_vlb_step=0.000298, train/loss_step=0.0907, global_step=574.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  90%|█████████ | 1093/1208 [31:20<03:17,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0907, train/loss_vlb_step=0.000298, train/loss_step=0.0907, global_step=574.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  90%|█████████ | 1093/1208 [31:20<03:17,  1.72s/it, loss=0.185, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000582, train/loss_step=0.171, global_step=575.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  91%|█████████ | 1094/1208 [31:21<03:16,  1.72s/it, loss=0.185, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000582, train/loss_step=0.171, global_step=575.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  91%|█████████ | 1094/1208 [31:21<03:16,  1.72s/it, loss=0.201, v_num=0, train/loss_simple_step=0.478, train/loss_vlb_step=0.0049, train/loss_step=0.478, global_step=575.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  91%|█████████ | 1095/1208 [31:22<03:14,  1.72s/it, loss=0.201, v_num=0, train/loss_simple_step=0.478, train/loss_vlb_step=0.0049, train/loss_step=0.478, global_step=575.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  91%|█████████ | 1095/1208 [31:22<03:14,  1.72s/it, loss=0.217, v_num=0, train/loss_simple_step=0.517, train/loss_vlb_step=0.00582, train/loss_step=0.517, global_step=575.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  91%|█████████ | 1096/1208 [31:25<03:12,  1.72s/it, loss=0.217, v_num=0, train/loss_simple_step=0.517, train/loss_vlb_step=0.00582, train/loss_step=0.517, global_step=575.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  91%|█████████ | 1096/1208 [31:25<03:12,  1.72s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.000139, train/loss_step=0.0379, global_step=575.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  91%|█████████ | 1097/1208 [31:26<03:10,  1.72s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.000139, train/loss_step=0.0379, global_step=575.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  91%|█████████ | 1097/1208 [31:26<03:10,  1.72s/it, loss=0.207, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=3.2e-5, train/loss_step=0.00611, global_step=576.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  91%|█████████ | 1098/1208 [31:27<03:09,  1.72s/it, loss=0.207, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=3.2e-5, train/loss_step=0.00611, global_step=576.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  91%|█████████ | 1098/1208 [31:27<03:09,  1.72s/it, loss=0.222, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00157, train/loss_step=0.313, global_step=576.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  91%|█████████ | 1099/1208 [31:28<03:07,  1.72s/it, loss=0.222, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00157, train/loss_step=0.313, global_step=576.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  91%|█████████ | 1099/1208 [31:28<03:07,  1.72s/it, loss=0.226, v_num=0, train/loss_simple_step=0.0852, train/loss_vlb_step=0.000282, train/loss_step=0.0852, global_step=576.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  91%|█████████ | 1100/1208 [31:31<03:05,  1.72s/it, loss=0.226, v_num=0, train/loss_simple_step=0.0852, train/loss_vlb_step=0.000282, train/loss_step=0.0852, global_step=576.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  91%|█████████ | 1100/1208 [31:31<03:05,  1.72s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000118, train/loss_step=0.0314, global_step=576.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  91%|█████████ | 1101/1208 [31:33<03:03,  1.72s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000118, train/loss_step=0.0314, global_step=576.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  91%|█████████ | 1101/1208 [31:33<03:03,  1.72s/it, loss=0.228, v_num=0, train/loss_simple_step=0.437, train/loss_vlb_step=0.00397, train/loss_step=0.437, global_step=577.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  91%|█████████ | 1102/1208 [31:34<03:02,  1.72s/it, loss=0.228, v_num=0, train/loss_simple_step=0.437, train/loss_vlb_step=0.00397, train/loss_step=0.437, global_step=577.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  91%|█████████ | 1102/1208 [31:34<03:02,  1.72s/it, loss=0.216, v_num=0, train/loss_simple_step=0.0783, train/loss_vlb_step=0.000264, train/loss_step=0.0783, global_step=577.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  91%|█████████▏| 1103/1208 [31:35<03:00,  1.72s/it, loss=0.216, v_num=0, train/loss_simple_step=0.0783, train/loss_vlb_step=0.000264, train/loss_step=0.0783, global_step=577.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  91%|█████████▏| 1103/1208 [31:35<03:00,  1.72s/it, loss=0.224, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.0013, train/loss_step=0.280, global_step=577.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  91%|█████████▏| 1104/1208 [31:38<02:58,  1.72s/it, loss=0.224, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.0013, train/loss_step=0.280, global_step=577.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  91%|█████████▏| 1104/1208 [31:38<02:58,  1.72s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.81e-5, train/loss_step=0.0241, global_step=577.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  91%|█████████▏| 1105/1208 [31:39<02:57,  1.72s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.81e-5, train/loss_step=0.0241, global_step=577.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  91%|█████████▏| 1105/1208 [31:39<02:57,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.71e-5, train/loss_step=0.010, global_step=578.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  92%|█████████▏| 1106/1208 [31:40<02:55,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.71e-5, train/loss_step=0.010, global_step=578.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  92%|█████████▏| 1106/1208 [31:40<02:55,  1.72s/it, loss=0.196, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00263, train/loss_step=0.378, global_step=578.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  92%|█████████▏| 1107/1208 [31:41<02:53,  1.72s/it, loss=0.196, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00263, train/loss_step=0.378, global_step=578.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  92%|█████████▏| 1107/1208 [31:41<02:53,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0086, train/loss_vlb_step=4.14e-5, train/loss_step=0.0086, global_step=578.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  92%|█████████▏| 1108/1208 [31:44<02:51,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0086, train/loss_vlb_step=4.14e-5, train/loss_step=0.0086, global_step=578.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  92%|█████████▏| 1108/1208 [31:44<02:51,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.00039, train/loss_step=0.119, global_step=578.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  92%|█████████▏| 1109/1208 [31:45<02:50,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.00039, train/loss_step=0.119, global_step=578.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  92%|█████████▏| 1109/1208 [31:45<02:50,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.24e-5, train/loss_step=0.0148, global_step=579.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  92%|█████████▏| 1110/1208 [31:46<02:48,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.24e-5, train/loss_step=0.0148, global_step=579.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  92%|█████████▏| 1110/1208 [31:46<02:48,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.046, train/loss_vlb_step=0.000166, train/loss_step=0.046, global_step=579.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  92%|█████████▏| 1111/1208 [31:47<02:46,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.046, train/loss_vlb_step=0.000166, train/loss_step=0.046, global_step=579.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  92%|█████████▏| 1111/1208 [31:47<02:46,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0906, train/loss_vlb_step=0.000303, train/loss_step=0.0906, global_step=579.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  92%|█████████▏| 1112/1208 [31:51<02:44,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0906, train/loss_vlb_step=0.000303, train/loss_step=0.0906, global_step=579.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  92%|█████████▏| 1112/1208 [31:51<02:44,  1.72s/it, loss=0.165, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000615, train/loss_step=0.179, global_step=579.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  92%|█████████▏| 1113/1208 [31:52<02:43,  1.72s/it, loss=0.165, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000615, train/loss_step=0.179, global_step=579.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  92%|█████████▏| 1113/1208 [31:52<02:43,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.060, train/loss_vlb_step=0.000199, train/loss_step=0.060, global_step=580.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  92%|█████████▏| 1114/1208 [31:53<02:41,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.060, train/loss_vlb_step=0.000199, train/loss_step=0.060, global_step=580.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  92%|█████████▏| 1114/1208 [31:53<02:41,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0773, train/loss_vlb_step=0.000256, train/loss_step=0.0773, global_step=580.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  92%|█████████▏| 1115/1208 [31:54<02:39,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0773, train/loss_vlb_step=0.000256, train/loss_step=0.0773, global_step=580.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  92%|█████████▏| 1115/1208 [31:54<02:39,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000921, train/loss_step=0.237, global_step=580.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  92%|█████████▏| 1116/1208 [31:57<02:38,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000921, train/loss_step=0.237, global_step=580.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  92%|█████████▏| 1116/1208 [31:57<02:38,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0914, train/loss_vlb_step=0.000306, train/loss_step=0.0914, global_step=580.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  92%|█████████▏| 1117/1208 [31:58<02:36,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0914, train/loss_vlb_step=0.000306, train/loss_step=0.0914, global_step=580.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  92%|█████████▏| 1117/1208 [31:58<02:36,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000159, train/loss_step=0.0437, global_step=581.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  93%|█████████▎| 1118/1208 [31:59<02:34,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000159, train/loss_step=0.0437, global_step=581.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  93%|█████████▎| 1118/1208 [31:59<02:34,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00118, train/loss_step=0.250, global_step=581.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  93%|█████████▎| 1119/1208 [32:00<02:32,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00118, train/loss_step=0.250, global_step=581.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  93%|█████████▎| 1119/1208 [32:00<02:32,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.493, train/loss_vlb_step=0.00438, train/loss_step=0.493, global_step=581.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  93%|█████████▎| 1120/1208 [32:04<02:31,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.493, train/loss_vlb_step=0.00438, train/loss_step=0.493, global_step=581.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  93%|█████████▎| 1120/1208 [32:04<02:31,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0532, train/loss_vlb_step=0.000188, train/loss_step=0.0532, global_step=581.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  93%|█████████▎| 1121/1208 [32:05<02:29,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0532, train/loss_vlb_step=0.000188, train/loss_step=0.0532, global_step=581.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  93%|█████████▎| 1121/1208 [32:05<02:29,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000538, train/loss_step=0.164, global_step=582.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  93%|█████████▎| 1122/1208 [32:06<02:27,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000538, train/loss_step=0.164, global_step=582.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  93%|█████████▎| 1122/1208 [32:06<02:27,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0873, train/loss_vlb_step=0.000289, train/loss_step=0.0873, global_step=582.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  93%|█████████▎| 1123/1208 [32:07<02:25,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0873, train/loss_vlb_step=0.000289, train/loss_step=0.0873, global_step=582.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  93%|█████████▎| 1123/1208 [32:07<02:25,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000629, train/loss_step=0.186, global_step=582.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  93%|█████████▎| 1124/1208 [32:10<02:24,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000629, train/loss_step=0.186, global_step=582.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  93%|█████████▎| 1124/1208 [32:10<02:24,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.5e-5, train/loss_step=0.0245, global_step=582.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  93%|█████████▎| 1125/1208 [32:11<02:22,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.5e-5, train/loss_step=0.0245, global_step=582.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  93%|█████████▎| 1125/1208 [32:11<02:22,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000132, train/loss_step=0.0332, global_step=583.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  93%|█████████▎| 1126/1208 [32:12<02:20,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000132, train/loss_step=0.0332, global_step=583.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  93%|█████████▎| 1126/1208 [32:12<02:20,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.504, train/loss_vlb_step=0.00566, train/loss_step=0.504, global_step=583.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  93%|█████████▎| 1127/1208 [32:13<02:18,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.504, train/loss_vlb_step=0.00566, train/loss_step=0.504, global_step=583.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  93%|█████████▎| 1127/1208 [32:13<02:18,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=2.54e-5, train/loss_step=0.00469, global_step=583.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  93%|█████████▎| 1128/1208 [32:16<02:17,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=2.54e-5, train/loss_step=0.00469, global_step=583.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  93%|█████████▎| 1128/1208 [32:16<02:17,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00358, train/loss_vlb_step=1.99e-5, train/loss_step=0.00358, global_step=583.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  93%|█████████▎| 1129/1208 [32:17<02:15,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00358, train/loss_vlb_step=1.99e-5, train/loss_step=0.00358, global_step=583.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  93%|█████████▎| 1129/1208 [32:17<02:15,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000897, train/loss_step=0.235, global_step=584.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  94%|█████████▎| 1130/1208 [32:18<02:13,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000897, train/loss_step=0.235, global_step=584.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  94%|█████████▎| 1130/1208 [32:18<02:13,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00504, train/loss_vlb_step=2.79e-5, train/loss_step=0.00504, global_step=584.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  94%|█████████▎| 1131/1208 [32:20<02:12,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00504, train/loss_vlb_step=2.79e-5, train/loss_step=0.00504, global_step=584.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  94%|█████████▎| 1131/1208 [32:20<02:12,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.529, train/loss_vlb_step=0.0119, train/loss_step=0.529, global_step=584.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]     Epoch 1:  94%|█████████▎| 1132/1208 [32:23<02:10,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.529, train/loss_vlb_step=0.0119, train/loss_step=0.529, global_step=584.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  94%|█████████▎| 1132/1208 [32:23<02:10,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000454, train/loss_step=0.138, global_step=584.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  94%|█████████▍| 1133/1208 [32:24<02:08,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000454, train/loss_step=0.138, global_step=584.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  94%|█████████▍| 1133/1208 [32:24<02:08,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000153, train/loss_step=0.0407, global_step=585.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  94%|█████████▍| 1134/1208 [32:25<02:06,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000153, train/loss_step=0.0407, global_step=585.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  94%|█████████▍| 1134/1208 [32:25<02:06,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0063, train/loss_vlb_step=3.18e-5, train/loss_step=0.0063, global_step=585.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  94%|█████████▍| 1135/1208 [32:26<02:05,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0063, train/loss_vlb_step=3.18e-5, train/loss_step=0.0063, global_step=585.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  94%|█████████▍| 1135/1208 [32:26<02:05,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000652, train/loss_step=0.190, global_step=585.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  94%|█████████▍| 1136/1208 [32:29<02:03,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000652, train/loss_step=0.190, global_step=585.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  94%|█████████▍| 1136/1208 [32:29<02:03,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.642, train/loss_vlb_step=0.0225, train/loss_step=0.642, global_step=585.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  94%|█████████▍| 1137/1208 [32:30<02:01,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.642, train/loss_vlb_step=0.0225, train/loss_step=0.642, global_step=585.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  94%|█████████▍| 1137/1208 [32:30<02:01,  1.72s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.54e-5, train/loss_step=0.00266, global_step=586.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  94%|█████████▍| 1138/1208 [32:31<02:00,  1.72s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.54e-5, train/loss_step=0.00266, global_step=586.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  94%|█████████▍| 1138/1208 [32:31<02:00,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000665, train/loss_step=0.192, global_step=586.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  94%|█████████▍| 1139/1208 [32:32<01:58,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000665, train/loss_step=0.192, global_step=586.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  94%|█████████▍| 1139/1208 [32:32<01:58,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0453, train/loss_vlb_step=0.000168, train/loss_step=0.0453, global_step=586.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  94%|█████████▍| 1140/1208 [32:36<01:56,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0453, train/loss_vlb_step=0.000168, train/loss_step=0.0453, global_step=586.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  94%|█████████▍| 1140/1208 [32:36<01:56,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000802, train/loss_step=0.207, global_step=586.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  94%|█████████▍| 1141/1208 [32:37<01:54,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000802, train/loss_step=0.207, global_step=586.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  94%|█████████▍| 1141/1208 [32:37<01:54,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00696, train/loss_vlb_step=3.57e-5, train/loss_step=0.00696, global_step=587.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  95%|█████████▍| 1142/1208 [32:38<01:53,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00696, train/loss_vlb_step=3.57e-5, train/loss_step=0.00696, global_step=587.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  95%|█████████▍| 1142/1208 [32:38<01:53,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000109, train/loss_step=0.0268, global_step=587.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  95%|█████████▍| 1143/1208 [32:39<01:51,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000109, train/loss_step=0.0268, global_step=587.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  95%|█████████▍| 1143/1208 [32:39<01:51,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000418, train/loss_step=0.127, global_step=587.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  95%|█████████▍| 1144/1208 [32:42<01:49,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000418, train/loss_step=0.127, global_step=587.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  95%|█████████▍| 1144/1208 [32:42<01:49,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=587.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  95%|█████████▍| 1145/1208 [32:43<01:48,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=587.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  95%|█████████▍| 1145/1208 [32:43<01:48,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=588.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  95%|█████████▍| 1146/1208 [32:44<01:46,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=588.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  95%|█████████▍| 1146/1208 [32:44<01:46,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000786, train/loss_step=0.221, global_step=588.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  95%|█████████▍| 1147/1208 [32:45<01:44,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000786, train/loss_step=0.221, global_step=588.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  95%|█████████▍| 1147/1208 [32:45<01:44,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0063, train/loss_vlb_step=3.12e-5, train/loss_step=0.0063, global_step=588.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  95%|█████████▌| 1148/1208 [32:49<01:42,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0063, train/loss_vlb_step=3.12e-5, train/loss_step=0.0063, global_step=588.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  95%|█████████▌| 1148/1208 [32:49<01:42,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.00058, train/loss_step=0.173, global_step=588.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  95%|█████████▌| 1149/1208 [32:50<01:41,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.00058, train/loss_step=0.173, global_step=588.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  95%|█████████▌| 1149/1208 [32:50<01:41,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00456, train/loss_vlb_step=2.37e-5, train/loss_step=0.00456, global_step=589.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  95%|█████████▌| 1150/1208 [32:51<01:39,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00456, train/loss_vlb_step=2.37e-5, train/loss_step=0.00456, global_step=589.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  95%|█████████▌| 1150/1208 [32:51<01:39,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000406, train/loss_step=0.123, global_step=589.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  95%|█████████▌| 1151/1208 [32:52<01:37,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000406, train/loss_step=0.123, global_step=589.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  95%|█████████▌| 1151/1208 [32:52<01:37,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0507, train/loss_vlb_step=0.000183, train/loss_step=0.0507, global_step=589.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  95%|█████████▌| 1152/1208 [32:55<01:36,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0507, train/loss_vlb_step=0.000183, train/loss_step=0.0507, global_step=589.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  95%|█████████▌| 1152/1208 [32:55<01:36,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0718, train/loss_vlb_step=0.000247, train/loss_step=0.0718, global_step=589.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  95%|█████████▌| 1153/1208 [32:56<01:34,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0718, train/loss_vlb_step=0.000247, train/loss_step=0.0718, global_step=589.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  95%|█████████▌| 1153/1208 [32:56<01:34,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=1.66e-5, train/loss_step=0.00309, global_step=590.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  96%|█████████▌| 1154/1208 [32:57<01:32,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=1.66e-5, train/loss_step=0.00309, global_step=590.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  96%|█████████▌| 1154/1208 [32:57<01:32,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000126, train/loss_step=0.0325, global_step=590.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  96%|█████████▌| 1155/1208 [32:58<01:30,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000126, train/loss_step=0.0325, global_step=590.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  96%|█████████▌| 1155/1208 [32:58<01:30,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.000127, train/loss_step=0.033, global_step=590.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  96%|█████████▌| 1156/1208 [33:01<01:29,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.000127, train/loss_step=0.033, global_step=590.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  96%|█████████▌| 1156/1208 [33:01<01:29,  1.71s/it, loss=0.0798, v_num=0, train/loss_simple_step=0.0518, train/loss_vlb_step=0.000185, train/loss_step=0.0518, global_step=590.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  96%|█████████▌| 1157/1208 [33:03<01:27,  1.71s/it, loss=0.0798, v_num=0, train/loss_simple_step=0.0518, train/loss_vlb_step=0.000185, train/loss_step=0.0518, global_step=590.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  96%|█████████▌| 1157/1208 [33:03<01:27,  1.71s/it, loss=0.0798, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.82e-5, train/loss_step=0.0033, global_step=591.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  96%|█████████▌| 1158/1208 [33:04<01:25,  1.71s/it, loss=0.0798, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.82e-5, train/loss_step=0.0033, global_step=591.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  96%|█████████▌| 1158/1208 [33:04<01:25,  1.71s/it, loss=0.0704, v_num=0, train/loss_simple_step=0.00414, train/loss_vlb_step=2.28e-5, train/loss_step=0.00414, global_step=591.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  96%|█████████▌| 1159/1208 [33:05<01:23,  1.71s/it, loss=0.0704, v_num=0, train/loss_simple_step=0.00414, train/loss_vlb_step=2.28e-5, train/loss_step=0.00414, global_step=591.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  96%|█████████▌| 1159/1208 [33:05<01:23,  1.71s/it, loss=0.0764, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000576, train/loss_step=0.165, global_step=591.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  96%|█████████▌| 1160/1208 [33:08<01:22,  1.71s/it, loss=0.0764, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000576, train/loss_step=0.165, global_step=591.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  96%|█████████▌| 1160/1208 [33:08<01:22,  1.71s/it, loss=0.0663, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=2.11e-5, train/loss_step=0.00363, global_step=591.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  96%|█████████▌| 1161/1208 [33:09<01:20,  1.71s/it, loss=0.0663, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=2.11e-5, train/loss_step=0.00363, global_step=591.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  96%|█████████▌| 1161/1208 [33:09<01:20,  1.71s/it, loss=0.071, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=592.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1:  96%|█████████▌| 1162/1208 [33:10<01:18,  1.71s/it, loss=0.071, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=592.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  96%|█████████▌| 1162/1208 [33:10<01:18,  1.71s/it, loss=0.0703, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.27e-5, train/loss_step=0.0116, global_step=592.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  96%|█████████▋| 1163/1208 [33:11<01:17,  1.71s/it, loss=0.0703, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.27e-5, train/loss_step=0.0116, global_step=592.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  96%|█████████▋| 1163/1208 [33:11<01:17,  1.71s/it, loss=0.0659, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.000149, train/loss_step=0.0394, global_step=592.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  96%|█████████▋| 1164/1208 [33:14<01:15,  1.71s/it, loss=0.0659, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.000149, train/loss_step=0.0394, global_step=592.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  96%|█████████▋| 1164/1208 [33:14<01:15,  1.71s/it, loss=0.073, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.000962, train/loss_step=0.249, global_step=592.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  96%|█████████▋| 1165/1208 [33:15<01:13,  1.71s/it, loss=0.073, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.000962, train/loss_step=0.249, global_step=592.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  96%|█████████▋| 1165/1208 [33:15<01:13,  1.71s/it, loss=0.0688, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000105, train/loss_step=0.0264, global_step=593.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  97%|█████████▋| 1166/1208 [33:17<01:11,  1.71s/it, loss=0.0688, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000105, train/loss_step=0.0264, global_step=593.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  97%|█████████▋| 1166/1208 [33:17<01:11,  1.71s/it, loss=0.0598, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.000152, train/loss_step=0.0413, global_step=593.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  97%|█████████▋| 1167/1208 [33:18<01:10,  1.71s/it, loss=0.0598, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.000152, train/loss_step=0.0413, global_step=593.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  97%|█████████▋| 1167/1208 [33:18<01:10,  1.71s/it, loss=0.061, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000125, train/loss_step=0.0302, global_step=593.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  97%|█████████▋| 1168/1208 [33:21<01:08,  1.71s/it, loss=0.061, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000125, train/loss_step=0.0302, global_step=593.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  97%|█████████▋| 1168/1208 [33:21<01:08,  1.71s/it, loss=0.055, v_num=0, train/loss_simple_step=0.0528, train/loss_vlb_step=0.000184, train/loss_step=0.0528, global_step=593.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  97%|█████████▋| 1169/1208 [33:22<01:06,  1.71s/it, loss=0.055, v_num=0, train/loss_simple_step=0.0528, train/loss_vlb_step=0.000184, train/loss_step=0.0528, global_step=593.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  97%|█████████▋| 1169/1208 [33:22<01:06,  1.71s/it, loss=0.0574, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.000186, train/loss_step=0.0527, global_step=594.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  97%|█████████▋| 1170/1208 [33:23<01:05,  1.71s/it, loss=0.0574, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.000186, train/loss_step=0.0527, global_step=594.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  97%|█████████▋| 1170/1208 [33:23<01:05,  1.71s/it, loss=0.0536, v_num=0, train/loss_simple_step=0.0466, train/loss_vlb_step=0.000166, train/loss_step=0.0466, global_step=594.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  97%|█████████▋| 1171/1208 [33:24<01:03,  1.71s/it, loss=0.0536, v_num=0, train/loss_simple_step=0.0466, train/loss_vlb_step=0.000166, train/loss_step=0.0466, global_step=594.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  97%|█████████▋| 1171/1208 [33:24<01:03,  1.71s/it, loss=0.0621, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000865, train/loss_step=0.220, global_step=594.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  97%|█████████▋| 1172/1208 [33:27<01:01,  1.71s/it, loss=0.0621, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000865, train/loss_step=0.220, global_step=594.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  97%|█████████▋| 1172/1208 [33:27<01:01,  1.71s/it, loss=0.0602, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000129, train/loss_step=0.0339, global_step=594.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  97%|█████████▋| 1173/1208 [33:28<00:59,  1.71s/it, loss=0.0602, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000129, train/loss_step=0.0339, global_step=594.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  97%|█████████▋| 1173/1208 [33:28<00:59,  1.71s/it, loss=0.0622, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000149, train/loss_step=0.0437, global_step=595.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  97%|█████████▋| 1174/1208 [33:29<00:58,  1.71s/it, loss=0.0622, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000149, train/loss_step=0.0437, global_step=595.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  97%|█████████▋| 1174/1208 [33:29<00:58,  1.71s/it, loss=0.0612, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.82e-5, train/loss_step=0.0126, global_step=595.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  97%|█████████▋| 1175/1208 [33:30<00:56,  1.71s/it, loss=0.0612, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.82e-5, train/loss_step=0.0126, global_step=595.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  97%|█████████▋| 1175/1208 [33:30<00:56,  1.71s/it, loss=0.0669, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000485, train/loss_step=0.147, global_step=595.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  97%|█████████▋| 1176/1208 [33:34<00:54,  1.71s/it, loss=0.0669, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000485, train/loss_step=0.147, global_step=595.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  97%|█████████▋| 1176/1208 [33:34<00:54,  1.71s/it, loss=0.0708, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.00043, train/loss_step=0.131, global_step=595.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  97%|█████████▋| 1177/1208 [33:35<00:53,  1.71s/it, loss=0.0708, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.00043, train/loss_step=0.131, global_step=595.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  97%|█████████▋| 1177/1208 [33:35<00:53,  1.71s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.509, train/loss_vlb_step=0.0072, train/loss_step=0.509, global_step=596.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  98%|█████████▊| 1178/1208 [33:36<00:51,  1.71s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.509, train/loss_vlb_step=0.0072, train/loss_step=0.509, global_step=596.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  98%|█████████▊| 1178/1208 [33:36<00:51,  1.71s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.00597, train/loss_vlb_step=3.02e-5, train/loss_step=0.00597, global_step=596.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  98%|█████████▊| 1179/1208 [33:37<00:49,  1.71s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.00597, train/loss_vlb_step=3.02e-5, train/loss_step=0.00597, global_step=596.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  98%|█████████▊| 1179/1208 [33:37<00:49,  1.71s/it, loss=0.0901, v_num=0, train/loss_simple_step=0.0435, train/loss_vlb_step=0.000162, train/loss_step=0.0435, global_step=596.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  98%|█████████▊| 1180/1208 [33:40<00:47,  1.71s/it, loss=0.0901, v_num=0, train/loss_simple_step=0.0435, train/loss_vlb_step=0.000162, train/loss_step=0.0435, global_step=596.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  98%|█████████▊| 1180/1208 [33:40<00:47,  1.71s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000478, train/loss_step=0.142, global_step=596.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  98%|█████████▊| 1181/1208 [33:41<00:46,  1.71s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000478, train/loss_step=0.142, global_step=596.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  98%|█████████▊| 1181/1208 [33:41<00:46,  1.71s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.0054, train/loss_vlb_step=2.8e-5, train/loss_step=0.0054, global_step=597.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  98%|█████████▊| 1182/1208 [33:42<00:44,  1.71s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.0054, train/loss_vlb_step=2.8e-5, train/loss_step=0.0054, global_step=597.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  98%|█████████▊| 1182/1208 [33:42<00:44,  1.71s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=2.72e-5, train/loss_step=0.00518, global_step=597.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  98%|█████████▊| 1183/1208 [33:43<00:42,  1.71s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=2.72e-5, train/loss_step=0.00518, global_step=597.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  98%|█████████▊| 1183/1208 [33:43<00:42,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.697, train/loss_vlb_step=0.0399, train/loss_step=0.697, global_step=597.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]      Epoch 1:  98%|█████████▊| 1184/1208 [33:46<00:41,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.697, train/loss_vlb_step=0.0399, train/loss_step=0.697, global_step=597.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  98%|█████████▊| 1184/1208 [33:46<00:41,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00098, train/loss_step=0.258, global_step=597.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  98%|█████████▊| 1185/1208 [33:47<00:39,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00098, train/loss_step=0.258, global_step=597.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  98%|█████████▊| 1185/1208 [33:47<00:39,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000426, train/loss_step=0.129, global_step=598.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  98%|█████████▊| 1186/1208 [33:48<00:37,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000426, train/loss_step=0.129, global_step=598.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  98%|█████████▊| 1186/1208 [33:48<00:37,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=8.39e-5, train/loss_step=0.0217, global_step=598.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  98%|█████████▊| 1187/1208 [33:50<00:35,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=8.39e-5, train/loss_step=0.0217, global_step=598.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  98%|█████████▊| 1187/1208 [33:50<00:35,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00091, train/loss_step=0.244, global_step=598.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  98%|█████████▊| 1188/1208 [33:53<00:34,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00091, train/loss_step=0.244, global_step=598.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  98%|█████████▊| 1188/1208 [33:53<00:34,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000407, train/loss_step=0.123, global_step=598.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  98%|█████████▊| 1189/1208 [33:54<00:32,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000407, train/loss_step=0.123, global_step=598.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  98%|█████████▊| 1189/1208 [33:54<00:32,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000486, train/loss_step=0.148, global_step=599.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  99%|█████████▊| 1190/1208 [33:55<00:30,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000486, train/loss_step=0.148, global_step=599.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  99%|█████████▊| 1190/1208 [33:55<00:30,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00087, train/loss_step=0.239, global_step=599.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  99%|█████████▊| 1191/1208 [33:56<00:29,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00087, train/loss_step=0.239, global_step=599.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  99%|█████████▊| 1191/1208 [33:56<00:29,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=2.28e-5, train/loss_step=0.00421, global_step=599.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  99%|█████████▊| 1192/1208 [33:59<00:27,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=2.28e-5, train/loss_step=0.00421, global_step=599.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  99%|█████████▊| 1192/1208 [33:59<00:27,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00605, train/loss_vlb_step=3.12e-5, train/loss_step=0.00605, global_step=599.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  99%|█████████▉| 1193/1208 [34:00<00:25,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00605, train/loss_vlb_step=3.12e-5, train/loss_step=0.00605, global_step=599.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  99%|█████████▉| 1193/1208 [34:00<00:25,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00936, train/loss_vlb_step=4.61e-5, train/loss_step=0.00936, global_step=600.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  99%|█████████▉| 1194/1208 [34:01<00:23,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00936, train/loss_vlb_step=4.61e-5, train/loss_step=0.00936, global_step=600.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  99%|█████████▉| 1194/1208 [34:01<00:23,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0828, train/loss_vlb_step=0.000279, train/loss_step=0.0828, global_step=600.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145] Epoch 1:  99%|█████████▉| 1195/1208 [34:02<00:22,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0828, train/loss_vlb_step=0.000279, train/loss_step=0.0828, global_step=600.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  99%|█████████▉| 1195/1208 [34:02<00:22,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.000111, train/loss_step=0.0285, global_step=600.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  99%|█████████▉| 1196/1208 [34:06<00:20,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.000111, train/loss_step=0.0285, global_step=600.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  99%|█████████▉| 1196/1208 [34:06<00:20,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000599, train/loss_step=0.175, global_step=600.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1:  99%|█████████▉| 1197/1208 [34:07<00:18,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000599, train/loss_step=0.175, global_step=600.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  99%|█████████▉| 1197/1208 [34:07<00:18,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000704, train/loss_step=0.192, global_step=601.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  99%|█████████▉| 1198/1208 [34:08<00:17,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000704, train/loss_step=0.192, global_step=601.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  99%|█████████▉| 1198/1208 [34:08<00:17,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0294, train/loss_vlb_step=0.000111, train/loss_step=0.0294, global_step=601.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  99%|█████████▉| 1199/1208 [34:09<00:15,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0294, train/loss_vlb_step=0.000111, train/loss_step=0.0294, global_step=601.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  99%|█████████▉| 1199/1208 [34:09<00:15,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00173, train/loss_step=0.335, global_step=601.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]   Epoch 1:  99%|█████████▉| 1200/1208 [34:12<00:13,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00173, train/loss_step=0.335, global_step=601.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  99%|█████████▉| 1200/1208 [34:12<00:13,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00144, train/loss_step=0.294, global_step=601.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.71it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:28,  1.70it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.73it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.74it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.75it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.76it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.76it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.76it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.79it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.76it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.78it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.75it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.75it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 1:  99%|█████████▉| 1201/1208 [34:43<00:12,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00144, train/loss_step=0.294, global_step=601.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1:  99%|█████████▉| 1201/1208 [34:43<00:12,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0486, train/loss_vlb_step=0.000172, train/loss_step=0.0486, global_step=602.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1: 100%|█████████▉| 1202/1208 [34:44<00:10,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0486, train/loss_vlb_step=0.000172, train/loss_step=0.0486, global_step=602.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1: 100%|█████████▉| 1202/1208 [34:44<00:10,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.0015, train/loss_step=0.318, global_step=602.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]    Epoch 1: 100%|█████████▉| 1203/1208 [34:45<00:08,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.0015, train/loss_step=0.318, global_step=602.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1: 100%|█████████▉| 1203/1208 [34:45<00:08,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000808, train/loss_step=0.198, global_step=602.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1: 100%|█████████▉| 1204/1208 [34:48<00:06,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000808, train/loss_step=0.198, global_step=602.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1: 100%|█████████▉| 1204/1208 [34:48<00:06,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=9.47e-5, train/loss_step=0.0225, global_step=602.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1: 100%|█████████▉| 1205/1208 [34:49<00:05,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=9.47e-5, train/loss_step=0.0225, global_step=602.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1: 100%|█████████▉| 1205/1208 [34:49<00:05,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.541, train/loss_vlb_step=0.00991, train/loss_step=0.541, global_step=603.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  Epoch 1: 100%|█████████▉| 1206/1208 [34:50<00:03,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.541, train/loss_vlb_step=0.00991, train/loss_step=0.541, global_step=603.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1: 100%|█████████▉| 1206/1208 [34:50<00:03,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000299, train/loss_step=0.0891, global_step=603.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1: 100%|█████████▉| 1207/1208 [34:51<00:01,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000299, train/loss_step=0.0891, global_step=603.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1: 100%|█████████▉| 1207/1208 [34:51<00:01,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.53e-5, train/loss_step=0.00251, global_step=603.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1: 100%|██████████| 1208/1208 [34:55<00:00,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.53e-5, train/loss_step=0.00251, global_step=603.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 1: 100%|██████████| 1208/1208 [34:55<00:00,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.46e-5, train/loss_step=0.0205, global_step=603.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]  
+
+
+Epoch 1:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.139, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.46e-5, train/loss_step=0.0205, global_step=603.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]           Epoch 2:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.139, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.46e-5, train/loss_step=0.0205, global_step=603.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][AData shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.75it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.75it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.80it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.82it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.78it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.83it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.83it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.83it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.83it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.83it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.83it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.78it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.83it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.81it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.82it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.78it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.78it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.78it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.78it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.79it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.78it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]Epoch 2:   0%|          | 1/1208 [00:33<11:17:50, 33.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.46e-5, train/loss_step=0.0205, global_step=603.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00287, train/loss_epoch=0.145]Epoch 2:   0%|          | 1/1208 [00:33<11:17:52, 33.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00493, train/loss_vlb_step=2.54e-5, train/loss_step=0.00493, global_step=604.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   0%|          | 2/1208 [00:34<5:49:02, 17.37s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00493, train/loss_vlb_step=2.54e-5, train/loss_step=0.00493, global_step=604.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:   0%|          | 2/1208 [00:34<5:49:03, 17.37s/it, loss=0.131, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000895, train/loss_step=0.214, global_step=604.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:   0%|          | 3/1208 [00:35<3:59:23, 11.92s/it, loss=0.131, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000895, train/loss_step=0.214, global_step=604.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   0%|          | 3/1208 [00:35<3:59:24, 11.92s/it, loss=0.142, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.00106, train/loss_step=0.230, global_step=604.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:   0%|          | 4/1208 [00:38<3:14:58,  9.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.00106, train/loss_step=0.230, global_step=604.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   0%|          | 4/1208 [00:38<3:14:59,  9.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00229, train/loss_step=0.356, global_step=604.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:   0%|          | 5/1208 [00:39<2:40:10,  7.99s/it, loss=0.16, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00229, train/loss_step=0.356, global_step=604.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   0%|          | 5/1208 [00:39<2:40:11,  7.99s/it, loss=0.172, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00112, train/loss_step=0.248, global_step=605.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   0%|          | 6/1208 [00:40<2:16:51,  6.83s/it, loss=0.172, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00112, train/loss_step=0.248, global_step=605.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   0%|          | 6/1208 [00:40<2:16:51,  6.83s/it, loss=0.199, v_num=0, train/loss_simple_step=0.632, train/loss_vlb_step=0.0106, train/loss_step=0.632, global_step=605.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:   1%|          | 7/1208 [00:42<2:00:09,  6.00s/it, loss=0.199, v_num=0, train/loss_simple_step=0.632, train/loss_vlb_step=0.0106, train/loss_step=0.632, global_step=605.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   1%|          | 7/1208 [00:42<2:00:10,  6.00s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0435, train/loss_vlb_step=0.000158, train/loss_step=0.0435, global_step=605.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   1%|          | 8/1208 [00:45<1:53:11,  5.66s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0435, train/loss_vlb_step=0.000158, train/loss_step=0.0435, global_step=605.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   1%|          | 8/1208 [00:45<1:53:12,  5.66s/it, loss=0.205, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.0015, train/loss_step=0.283, global_step=605.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:   1%|          | 9/1208 [00:46<1:42:54,  5.15s/it, loss=0.205, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.0015, train/loss_step=0.283, global_step=605.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   1%|          | 9/1208 [00:46<1:42:54,  5.15s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00721, train/loss_vlb_step=3.62e-5, train/loss_step=0.00721, global_step=606.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   1%|          | 10/1208 [00:47<1:34:37,  4.74s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00721, train/loss_vlb_step=3.62e-5, train/loss_step=0.00721, global_step=606.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   1%|          | 10/1208 [00:47<1:34:38,  4.74s/it, loss=0.2, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000392, train/loss_step=0.118, global_step=606.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]     Epoch 2:   1%|          | 11/1208 [00:48<1:27:50,  4.40s/it, loss=0.2, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000392, train/loss_step=0.118, global_step=606.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   1%|          | 11/1208 [00:48<1:27:50,  4.40s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00745, train/loss_vlb_step=3.88e-5, train/loss_step=0.00745, global_step=606.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   1%|          | 12/1208 [00:51<1:25:55,  4.31s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00745, train/loss_vlb_step=3.88e-5, train/loss_step=0.00745, global_step=606.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   1%|          | 12/1208 [00:51<1:25:56,  4.31s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=6.92e-5, train/loss_step=0.0163, global_step=606.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:   1%|          | 13/1208 [00:52<1:20:54,  4.06s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=6.92e-5, train/loss_step=0.0163, global_step=606.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   1%|          | 13/1208 [00:52<1:20:54,  4.06s/it, loss=0.19, v_num=0, train/loss_simple_step=0.445, train/loss_vlb_step=0.00358, train/loss_step=0.445, global_step=607.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:   1%|          | 14/1208 [00:53<1:16:32,  3.85s/it, loss=0.19, v_num=0, train/loss_simple_step=0.445, train/loss_vlb_step=0.00358, train/loss_step=0.445, global_step=607.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   1%|          | 14/1208 [00:53<1:16:32,  3.85s/it, loss=0.185, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000846, train/loss_step=0.220, global_step=607.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   1%|          | 15/1208 [00:54<1:12:45,  3.66s/it, loss=0.185, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000846, train/loss_step=0.220, global_step=607.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   1%|          | 15/1208 [00:54<1:12:45,  3.66s/it, loss=0.186, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000836, train/loss_step=0.220, global_step=607.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   1%|▏         | 16/1208 [00:58<1:12:08,  3.63s/it, loss=0.186, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000836, train/loss_step=0.220, global_step=607.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   1%|▏         | 16/1208 [00:58<1:12:08,  3.63s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00693, train/loss_vlb_step=3.46e-5, train/loss_step=0.00693, global_step=607.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   1%|▏         | 17/1208 [00:59<1:09:05,  3.48s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00693, train/loss_vlb_step=3.46e-5, train/loss_step=0.00693, global_step=607.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   1%|▏         | 17/1208 [00:59<1:09:05,  3.48s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00514, train/loss_vlb_step=2.74e-5, train/loss_step=0.00514, global_step=608.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   1%|▏         | 18/1208 [01:00<1:06:20,  3.35s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00514, train/loss_vlb_step=2.74e-5, train/loss_step=0.00514, global_step=608.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   1%|▏         | 18/1208 [01:00<1:06:21,  3.35s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0548, train/loss_vlb_step=0.000186, train/loss_step=0.0548, global_step=608.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:   2%|▏         | 19/1208 [01:01<1:03:54,  3.22s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0548, train/loss_vlb_step=0.000186, train/loss_step=0.0548, global_step=608.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   2%|▏         | 19/1208 [01:01<1:03:54,  3.22s/it, loss=0.171, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00116, train/loss_step=0.285, global_step=608.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:   2%|▏         | 20/1208 [01:04<1:03:53,  3.23s/it, loss=0.171, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00116, train/loss_step=0.285, global_step=608.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   2%|▏         | 20/1208 [01:04<1:03:53,  3.23s/it, loss=0.188, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00212, train/loss_step=0.367, global_step=608.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   2%|▏         | 21/1208 [01:05<1:01:48,  3.12s/it, loss=0.188, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00212, train/loss_step=0.367, global_step=608.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   2%|▏         | 21/1208 [01:05<1:01:48,  3.12s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.35e-5, train/loss_step=0.0167, global_step=609.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   2%|▏         | 22/1208 [01:06<59:53,  3.03s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.35e-5, train/loss_step=0.0167, global_step=609.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:   2%|▏         | 22/1208 [01:06<59:53,  3.03s/it, loss=0.203, v_num=0, train/loss_simple_step=0.491, train/loss_vlb_step=0.0047, train/loss_step=0.491, global_step=609.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:   2%|▏         | 23/1208 [01:07<58:08,  2.94s/it, loss=0.203, v_num=0, train/loss_simple_step=0.491, train/loss_vlb_step=0.0047, train/loss_step=0.491, global_step=609.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   2%|▏         | 23/1208 [01:07<58:08,  2.94s/it, loss=0.214, v_num=0, train/loss_simple_step=0.448, train/loss_vlb_step=0.0034, train/loss_step=0.448, global_step=609.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   2%|▏         | 24/1208 [01:10<58:19,  2.96s/it, loss=0.214, v_num=0, train/loss_simple_step=0.448, train/loss_vlb_step=0.0034, train/loss_step=0.448, global_step=609.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   2%|▏         | 24/1208 [01:10<58:19,  2.96s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00727, train/loss_vlb_step=3.61e-5, train/loss_step=0.00727, global_step=609.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   2%|▏         | 25/1208 [01:12<56:48,  2.88s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00727, train/loss_vlb_step=3.61e-5, train/loss_step=0.00727, global_step=609.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   2%|▏         | 25/1208 [01:12<56:48,  2.88s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.83e-5, train/loss_step=0.0104, global_step=610.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:   2%|▏         | 26/1208 [01:13<55:22,  2.81s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.83e-5, train/loss_step=0.0104, global_step=610.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   2%|▏         | 26/1208 [01:13<55:22,  2.81s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00957, train/loss_vlb_step=4.56e-5, train/loss_step=0.00957, global_step=610.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   2%|▏         | 27/1208 [01:14<54:02,  2.75s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00957, train/loss_vlb_step=4.56e-5, train/loss_step=0.00957, global_step=610.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   2%|▏         | 27/1208 [01:14<54:02,  2.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.45e-5, train/loss_step=0.00247, global_step=610.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   2%|▏         | 28/1208 [01:17<54:21,  2.76s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.45e-5, train/loss_step=0.00247, global_step=610.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   2%|▏         | 28/1208 [01:17<54:21,  2.76s/it, loss=0.152, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00138, train/loss_step=0.310, global_step=610.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:   2%|▏         | 29/1208 [01:18<53:09,  2.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00138, train/loss_step=0.310, global_step=610.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   2%|▏         | 29/1208 [01:18<53:09,  2.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0807, train/loss_vlb_step=0.000265, train/loss_step=0.0807, global_step=611.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   2%|▏         | 30/1208 [01:19<52:01,  2.65s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0807, train/loss_vlb_step=0.000265, train/loss_step=0.0807, global_step=611.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   2%|▏         | 30/1208 [01:19<52:01,  2.65s/it, loss=0.175, v_num=0, train/loss_simple_step=0.506, train/loss_vlb_step=0.00987, train/loss_step=0.506, global_step=611.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:   3%|▎         | 31/1208 [01:20<50:58,  2.60s/it, loss=0.175, v_num=0, train/loss_simple_step=0.506, train/loss_vlb_step=0.00987, train/loss_step=0.506, global_step=611.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   3%|▎         | 31/1208 [01:20<50:58,  2.60s/it, loss=0.191, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00181, train/loss_step=0.312, global_step=611.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   3%|▎         | 32/1208 [01:23<51:21,  2.62s/it, loss=0.191, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00181, train/loss_step=0.312, global_step=611.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   3%|▎         | 32/1208 [01:23<51:21,  2.62s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0577, train/loss_vlb_step=0.0002, train/loss_step=0.0577, global_step=611.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   3%|▎         | 33/1208 [01:24<50:23,  2.57s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0577, train/loss_vlb_step=0.0002, train/loss_step=0.0577, global_step=611.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   3%|▎         | 33/1208 [01:24<50:23,  2.57s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0729, train/loss_vlb_step=0.000244, train/loss_step=0.0729, global_step=612.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   3%|▎         | 34/1208 [01:25<49:27,  2.53s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0729, train/loss_vlb_step=0.000244, train/loss_step=0.0729, global_step=612.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   3%|▎         | 34/1208 [01:25<49:27,  2.53s/it, loss=0.18, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00182, train/loss_step=0.332, global_step=612.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:   3%|▎         | 35/1208 [01:26<48:35,  2.49s/it, loss=0.18, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00182, train/loss_step=0.332, global_step=612.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   3%|▎         | 35/1208 [01:26<48:35,  2.49s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=2.08e-5, train/loss_step=0.00373, global_step=612.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   3%|▎         | 36/1208 [01:30<48:56,  2.51s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=2.08e-5, train/loss_step=0.00373, global_step=612.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   3%|▎         | 36/1208 [01:30<48:56,  2.51s/it, loss=0.175, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000441, train/loss_step=0.129, global_step=612.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:   3%|▎         | 37/1208 [01:31<48:08,  2.47s/it, loss=0.175, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000441, train/loss_step=0.129, global_step=612.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   3%|▎         | 37/1208 [01:31<48:08,  2.47s/it, loss=0.189, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00131, train/loss_step=0.278, global_step=613.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:   3%|▎         | 38/1208 [01:32<47:23,  2.43s/it, loss=0.189, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00131, train/loss_step=0.278, global_step=613.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   3%|▎         | 38/1208 [01:32<47:23,  2.43s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=1.81e-5, train/loss_step=0.00308, global_step=613.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   3%|▎         | 39/1208 [01:33<46:39,  2.39s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=1.81e-5, train/loss_step=0.00308, global_step=613.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   3%|▎         | 39/1208 [01:33<46:39,  2.39s/it, loss=0.185, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00114, train/loss_step=0.255, global_step=613.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:   3%|▎         | 40/1208 [01:36<47:02,  2.42s/it, loss=0.185, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00114, train/loss_step=0.255, global_step=613.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   3%|▎         | 40/1208 [01:36<47:02,  2.42s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0561, train/loss_vlb_step=0.0002, train/loss_step=0.0561, global_step=613.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   3%|▎         | 41/1208 [01:37<46:20,  2.38s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0561, train/loss_vlb_step=0.0002, train/loss_step=0.0561, global_step=613.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   3%|▎         | 41/1208 [01:37<46:21,  2.38s/it, loss=0.207, v_num=0, train/loss_simple_step=0.770, train/loss_vlb_step=0.0785, train/loss_step=0.770, global_step=614.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:   3%|▎         | 42/1208 [01:38<45:41,  2.35s/it, loss=0.207, v_num=0, train/loss_simple_step=0.770, train/loss_vlb_step=0.0785, train/loss_step=0.770, global_step=614.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   3%|▎         | 42/1208 [01:38<45:41,  2.35s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0775, train/loss_vlb_step=0.000264, train/loss_step=0.0775, global_step=614.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   4%|▎         | 43/1208 [01:39<45:03,  2.32s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0775, train/loss_vlb_step=0.000264, train/loss_step=0.0775, global_step=614.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   4%|▎         | 43/1208 [01:39<45:03,  2.32s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00599, train/loss_vlb_step=3.06e-5, train/loss_step=0.00599, global_step=614.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   4%|▎         | 44/1208 [01:43<45:26,  2.34s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00599, train/loss_vlb_step=3.06e-5, train/loss_step=0.00599, global_step=614.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   4%|▎         | 44/1208 [01:43<45:26,  2.34s/it, loss=0.172, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000595, train/loss_step=0.171, global_step=614.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:   4%|▎         | 45/1208 [01:44<44:51,  2.31s/it, loss=0.172, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000595, train/loss_step=0.171, global_step=614.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   4%|▎         | 45/1208 [01:44<44:51,  2.31s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000161, train/loss_step=0.0445, global_step=615.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   4%|▍         | 46/1208 [01:45<44:17,  2.29s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000161, train/loss_step=0.0445, global_step=615.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   4%|▍         | 46/1208 [01:45<44:17,  2.29s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0599, train/loss_vlb_step=0.00021, train/loss_step=0.0599, global_step=615.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:   4%|▍         | 47/1208 [01:46<43:44,  2.26s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0599, train/loss_vlb_step=0.00021, train/loss_step=0.0599, global_step=615.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   4%|▍         | 47/1208 [01:46<43:44,  2.26s/it, loss=0.189, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00135, train/loss_step=0.265, global_step=615.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:   4%|▍         | 48/1208 [01:49<44:05,  2.28s/it, loss=0.189, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00135, train/loss_step=0.265, global_step=615.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   4%|▍         | 48/1208 [01:49<44:05,  2.28s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.5e-5, train/loss_step=0.0239, global_step=615.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   4%|▍         | 49/1208 [01:50<43:34,  2.26s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.5e-5, train/loss_step=0.0239, global_step=615.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   4%|▍         | 49/1208 [01:50<43:34,  2.26s/it, loss=0.181, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000688, train/loss_step=0.198, global_step=616.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   4%|▍         | 50/1208 [01:51<43:03,  2.23s/it, loss=0.181, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000688, train/loss_step=0.198, global_step=616.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   4%|▍         | 50/1208 [01:51<43:03,  2.23s/it, loss=0.157, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.72e-5, train/loss_step=0.021, global_step=616.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:   4%|▍         | 51/1208 [01:52<42:34,  2.21s/it, loss=0.157, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.72e-5, train/loss_step=0.021, global_step=616.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   4%|▍         | 51/1208 [01:52<42:34,  2.21s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00929, train/loss_vlb_step=4.46e-5, train/loss_step=0.00929, global_step=616.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   4%|▍         | 52/1208 [01:55<42:56,  2.23s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00929, train/loss_vlb_step=4.46e-5, train/loss_step=0.00929, global_step=616.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   4%|▍         | 52/1208 [01:55<42:56,  2.23s/it, loss=0.146, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000484, train/loss_step=0.146, global_step=616.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:   4%|▍         | 53/1208 [01:56<42:29,  2.21s/it, loss=0.146, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000484, train/loss_step=0.146, global_step=616.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   4%|▍         | 53/1208 [01:56<42:29,  2.21s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0539, train/loss_vlb_step=0.000188, train/loss_step=0.0539, global_step=617.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   4%|▍         | 54/1208 [01:58<42:01,  2.19s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0539, train/loss_vlb_step=0.000188, train/loss_step=0.0539, global_step=617.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   4%|▍         | 54/1208 [01:58<42:01,  2.19s/it, loss=0.137, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000558, train/loss_step=0.170, global_step=617.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:   5%|▍         | 55/1208 [01:59<41:35,  2.16s/it, loss=0.137, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000558, train/loss_step=0.170, global_step=617.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   5%|▍         | 55/1208 [01:59<41:35,  2.16s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.14e-5, train/loss_step=0.00192, global_step=617.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   5%|▍         | 56/1208 [02:02<41:56,  2.18s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.14e-5, train/loss_step=0.00192, global_step=617.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   5%|▍         | 56/1208 [02:02<41:56,  2.18s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.5e-5, train/loss_step=0.0152, global_step=617.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:   5%|▍         | 57/1208 [02:03<41:31,  2.16s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.5e-5, train/loss_step=0.0152, global_step=617.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   5%|▍         | 57/1208 [02:03<41:31,  2.16s/it, loss=0.13, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00104, train/loss_step=0.253, global_step=618.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:   5%|▍         | 58/1208 [02:04<41:06,  2.15s/it, loss=0.13, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00104, train/loss_step=0.253, global_step=618.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   5%|▍         | 58/1208 [02:04<41:06,  2.15s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00934, train/loss_vlb_step=4.45e-5, train/loss_step=0.00934, global_step=618.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   5%|▍         | 59/1208 [02:05<40:43,  2.13s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00934, train/loss_vlb_step=4.45e-5, train/loss_step=0.00934, global_step=618.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   5%|▍         | 59/1208 [02:05<40:43,  2.13s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0465, train/loss_vlb_step=0.000169, train/loss_step=0.0465, global_step=618.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:   5%|▍         | 60/1208 [02:08<41:02,  2.14s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0465, train/loss_vlb_step=0.000169, train/loss_step=0.0465, global_step=618.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   5%|▍         | 60/1208 [02:08<41:02,  2.14s/it, loss=0.12, v_num=0, train/loss_simple_step=0.054, train/loss_vlb_step=0.00019, train/loss_step=0.054, global_step=618.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:   5%|▌         | 61/1208 [02:09<40:39,  2.13s/it, loss=0.12, v_num=0, train/loss_simple_step=0.054, train/loss_vlb_step=0.00019, train/loss_step=0.054, global_step=618.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   5%|▌         | 61/1208 [02:09<40:39,  2.13s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.002, train/loss_step=0.317, global_step=619.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   5%|▌         | 62/1208 [02:10<40:17,  2.11s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.002, train/loss_step=0.317, global_step=619.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   5%|▌         | 62/1208 [02:10<40:17,  2.11s/it, loss=0.097, v_num=0, train/loss_simple_step=0.0742, train/loss_vlb_step=0.000254, train/loss_step=0.0742, global_step=619.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   5%|▌         | 63/1208 [02:11<39:56,  2.09s/it, loss=0.097, v_num=0, train/loss_simple_step=0.0742, train/loss_vlb_step=0.000254, train/loss_step=0.0742, global_step=619.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   5%|▌         | 63/1208 [02:11<39:56,  2.09s/it, loss=0.103, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000454, train/loss_step=0.136, global_step=619.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:   5%|▌         | 64/1208 [02:15<40:14,  2.11s/it, loss=0.103, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000454, train/loss_step=0.136, global_step=619.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   5%|▌         | 64/1208 [02:15<40:14,  2.11s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.64e-5, train/loss_step=0.00289, global_step=619.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   5%|▌         | 65/1208 [02:16<39:54,  2.09s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.64e-5, train/loss_step=0.00289, global_step=619.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   5%|▌         | 65/1208 [02:16<39:54,  2.09s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.0595, train/loss_vlb_step=0.000209, train/loss_step=0.0595, global_step=620.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:   5%|▌         | 66/1208 [02:17<39:34,  2.08s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.0595, train/loss_vlb_step=0.000209, train/loss_step=0.0595, global_step=620.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   5%|▌         | 66/1208 [02:17<39:34,  2.08s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.00595, train/loss_vlb_step=3.17e-5, train/loss_step=0.00595, global_step=620.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   6%|▌         | 67/1208 [02:18<39:14,  2.06s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.00595, train/loss_vlb_step=3.17e-5, train/loss_step=0.00595, global_step=620.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   6%|▌         | 67/1208 [02:18<39:14,  2.06s/it, loss=0.0819, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000144, train/loss_step=0.0406, global_step=620.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:   6%|▌         | 68/1208 [02:21<39:32,  2.08s/it, loss=0.0819, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000144, train/loss_step=0.0406, global_step=620.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   6%|▌         | 68/1208 [02:21<39:32,  2.08s/it, loss=0.0813, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.42e-5, train/loss_step=0.0114, global_step=620.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:   6%|▌         | 69/1208 [02:22<39:14,  2.07s/it, loss=0.0813, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.42e-5, train/loss_step=0.0114, global_step=620.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   6%|▌         | 69/1208 [02:22<39:14,  2.07s/it, loss=0.0716, v_num=0, train/loss_simple_step=0.00426, train/loss_vlb_step=2.34e-5, train/loss_step=0.00426, global_step=621.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   6%|▌         | 70/1208 [02:23<38:55,  2.05s/it, loss=0.0716, v_num=0, train/loss_simple_step=0.00426, train/loss_vlb_step=2.34e-5, train/loss_step=0.00426, global_step=621.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   6%|▌         | 70/1208 [02:23<38:55,  2.05s/it, loss=0.0707, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=1.93e-5, train/loss_step=0.0034, global_step=621.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:   6%|▌         | 71/1208 [02:24<38:36,  2.04s/it, loss=0.0707, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=1.93e-5, train/loss_step=0.0034, global_step=621.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   6%|▌         | 71/1208 [02:24<38:36,  2.04s/it, loss=0.0744, v_num=0, train/loss_simple_step=0.0831, train/loss_vlb_step=0.000277, train/loss_step=0.0831, global_step=621.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   6%|▌         | 72/1208 [02:27<38:54,  2.05s/it, loss=0.0744, v_num=0, train/loss_simple_step=0.0831, train/loss_vlb_step=0.000277, train/loss_step=0.0831, global_step=621.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   6%|▌         | 72/1208 [02:27<38:54,  2.05s/it, loss=0.0683, v_num=0, train/loss_simple_step=0.0247, train/loss_vlb_step=0.0001, train/loss_step=0.0247, global_step=621.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:   6%|▌         | 73/1208 [02:29<38:36,  2.04s/it, loss=0.0683, v_num=0, train/loss_simple_step=0.0247, train/loss_vlb_step=0.0001, train/loss_step=0.0247, global_step=621.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   6%|▌         | 73/1208 [02:29<38:36,  2.04s/it, loss=0.0699, v_num=0, train/loss_simple_step=0.0843, train/loss_vlb_step=0.000277, train/loss_step=0.0843, global_step=622.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   6%|▌         | 74/1208 [02:30<38:19,  2.03s/it, loss=0.0699, v_num=0, train/loss_simple_step=0.0843, train/loss_vlb_step=0.000277, train/loss_step=0.0843, global_step=622.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   6%|▌         | 74/1208 [02:30<38:19,  2.03s/it, loss=0.0627, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000108, train/loss_step=0.0264, global_step=622.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   6%|▌         | 75/1208 [02:31<38:02,  2.01s/it, loss=0.0627, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000108, train/loss_step=0.0264, global_step=622.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   6%|▌         | 75/1208 [02:31<38:02,  2.01s/it, loss=0.0633, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.21e-5, train/loss_step=0.0136, global_step=622.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:   6%|▋         | 76/1208 [02:34<38:18,  2.03s/it, loss=0.0633, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.21e-5, train/loss_step=0.0136, global_step=622.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   6%|▋         | 76/1208 [02:34<38:18,  2.03s/it, loss=0.0631, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.21e-5, train/loss_step=0.0109, global_step=622.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   6%|▋         | 77/1208 [02:35<38:02,  2.02s/it, loss=0.0631, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.21e-5, train/loss_step=0.0109, global_step=622.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   6%|▋         | 77/1208 [02:35<38:02,  2.02s/it, loss=0.0538, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.000221, train/loss_step=0.067, global_step=623.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:   6%|▋         | 78/1208 [02:36<37:46,  2.01s/it, loss=0.0538, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.000221, train/loss_step=0.067, global_step=623.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   6%|▋         | 78/1208 [02:36<37:46,  2.01s/it, loss=0.0542, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.61e-5, train/loss_step=0.0175, global_step=623.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   7%|▋         | 79/1208 [02:37<37:30,  1.99s/it, loss=0.0542, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.61e-5, train/loss_step=0.0175, global_step=623.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   7%|▋         | 79/1208 [02:37<37:30,  1.99s/it, loss=0.0593, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000494, train/loss_step=0.149, global_step=623.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:   7%|▋         | 80/1208 [02:40<37:46,  2.01s/it, loss=0.0593, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000494, train/loss_step=0.149, global_step=623.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   7%|▋         | 80/1208 [02:40<37:46,  2.01s/it, loss=0.0567, v_num=0, train/loss_simple_step=0.00338, train/loss_vlb_step=1.8e-5, train/loss_step=0.00338, global_step=623.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   7%|▋         | 81/1208 [02:41<37:31,  2.00s/it, loss=0.0567, v_num=0, train/loss_simple_step=0.00338, train/loss_vlb_step=1.8e-5, train/loss_step=0.00338, global_step=623.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   7%|▋         | 81/1208 [02:41<37:31,  2.00s/it, loss=0.0415, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.67e-5, train/loss_step=0.0123, global_step=624.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:   7%|▋         | 82/1208 [02:42<37:16,  1.99s/it, loss=0.0415, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.67e-5, train/loss_step=0.0123, global_step=624.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   7%|▋         | 82/1208 [02:42<37:16,  1.99s/it, loss=0.0482, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000732, train/loss_step=0.208, global_step=624.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:   7%|▋         | 83/1208 [02:43<37:01,  1.97s/it, loss=0.0482, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000732, train/loss_step=0.208, global_step=624.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   7%|▋         | 83/1208 [02:43<37:01,  1.97s/it, loss=0.0436, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.000162, train/loss_step=0.0441, global_step=624.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   7%|▋         | 84/1208 [02:47<37:17,  1.99s/it, loss=0.0436, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.000162, train/loss_step=0.0441, global_step=624.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   7%|▋         | 84/1208 [02:47<37:17,  1.99s/it, loss=0.0439, v_num=0, train/loss_simple_step=0.00912, train/loss_vlb_step=4.5e-5, train/loss_step=0.00912, global_step=624.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   7%|▋         | 85/1208 [02:48<37:02,  1.98s/it, loss=0.0439, v_num=0, train/loss_simple_step=0.00912, train/loss_vlb_step=4.5e-5, train/loss_step=0.00912, global_step=624.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   7%|▋         | 85/1208 [02:48<37:02,  1.98s/it, loss=0.0461, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000345, train/loss_step=0.104, global_step=625.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:   7%|▋         | 86/1208 [02:49<36:48,  1.97s/it, loss=0.0461, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000345, train/loss_step=0.104, global_step=625.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   7%|▋         | 86/1208 [02:49<36:48,  1.97s/it, loss=0.0521, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000411, train/loss_step=0.125, global_step=625.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   7%|▋         | 87/1208 [02:50<36:34,  1.96s/it, loss=0.0521, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000411, train/loss_step=0.125, global_step=625.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   7%|▋         | 87/1208 [02:50<36:34,  1.96s/it, loss=0.0724, v_num=0, train/loss_simple_step=0.448, train/loss_vlb_step=0.00311, train/loss_step=0.448, global_step=625.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:   7%|▋         | 88/1208 [02:53<36:49,  1.97s/it, loss=0.0724, v_num=0, train/loss_simple_step=0.448, train/loss_vlb_step=0.00311, train/loss_step=0.448, global_step=625.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   7%|▋         | 88/1208 [02:53<36:49,  1.97s/it, loss=0.0752, v_num=0, train/loss_simple_step=0.0661, train/loss_vlb_step=0.000225, train/loss_step=0.0661, global_step=625.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   7%|▋         | 89/1208 [02:54<36:36,  1.96s/it, loss=0.0752, v_num=0, train/loss_simple_step=0.0661, train/loss_vlb_step=0.000225, train/loss_step=0.0661, global_step=625.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   7%|▋         | 89/1208 [02:54<36:36,  1.96s/it, loss=0.0751, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=1.12e-5, train/loss_step=0.00183, global_step=626.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   7%|▋         | 90/1208 [02:55<36:22,  1.95s/it, loss=0.0751, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=1.12e-5, train/loss_step=0.00183, global_step=626.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   7%|▋         | 90/1208 [02:55<36:22,  1.95s/it, loss=0.0754, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.82e-5, train/loss_step=0.0102, global_step=626.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:   8%|▊         | 91/1208 [02:56<36:09,  1.94s/it, loss=0.0754, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.82e-5, train/loss_step=0.0102, global_step=626.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   8%|▊         | 91/1208 [02:56<36:09,  1.94s/it, loss=0.093, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00365, train/loss_step=0.435, global_step=626.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:   8%|▊         | 92/1208 [03:00<36:24,  1.96s/it, loss=0.093, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00365, train/loss_step=0.435, global_step=626.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   8%|▊         | 92/1208 [03:00<36:24,  1.96s/it, loss=0.094, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.00016, train/loss_step=0.0445, global_step=626.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   8%|▊         | 93/1208 [03:01<36:11,  1.95s/it, loss=0.094, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.00016, train/loss_step=0.0445, global_step=626.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   8%|▊         | 93/1208 [03:01<36:11,  1.95s/it, loss=0.09, v_num=0, train/loss_simple_step=0.00541, train/loss_vlb_step=2.82e-5, train/loss_step=0.00541, global_step=627.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   8%|▊         | 94/1208 [03:02<35:59,  1.94s/it, loss=0.09, v_num=0, train/loss_simple_step=0.00541, train/loss_vlb_step=2.82e-5, train/loss_step=0.00541, global_step=627.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   8%|▊         | 94/1208 [03:02<35:59,  1.94s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.00087, train/loss_step=0.222, global_step=627.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:   8%|▊         | 95/1208 [03:03<35:47,  1.93s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.00087, train/loss_step=0.222, global_step=627.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   8%|▊         | 95/1208 [03:03<35:47,  1.93s/it, loss=0.0997, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.68e-5, train/loss_step=0.0104, global_step=627.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   8%|▊         | 96/1208 [03:06<35:59,  1.94s/it, loss=0.0997, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.68e-5, train/loss_step=0.0104, global_step=627.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   8%|▊         | 96/1208 [03:06<35:59,  1.94s/it, loss=0.112, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00131, train/loss_step=0.257, global_step=627.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:   8%|▊         | 97/1208 [03:07<35:47,  1.93s/it, loss=0.112, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00131, train/loss_step=0.257, global_step=627.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   8%|▊         | 97/1208 [03:07<35:47,  1.93s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.45e-5, train/loss_step=0.00244, global_step=628.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   8%|▊         | 98/1208 [03:08<35:35,  1.92s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.45e-5, train/loss_step=0.00244, global_step=628.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   8%|▊         | 98/1208 [03:08<35:35,  1.92s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0595, train/loss_vlb_step=0.000204, train/loss_step=0.0595, global_step=628.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:   8%|▊         | 99/1208 [03:09<35:24,  1.92s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0595, train/loss_vlb_step=0.000204, train/loss_step=0.0595, global_step=628.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   8%|▊         | 99/1208 [03:09<35:24,  1.92s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0331, train/loss_vlb_step=0.000131, train/loss_step=0.0331, global_step=628.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   8%|▊         | 100/1208 [03:12<35:36,  1.93s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0331, train/loss_vlb_step=0.000131, train/loss_step=0.0331, global_step=628.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   8%|▊         | 100/1208 [03:12<35:36,  1.93s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.88e-5, train/loss_step=0.0102, global_step=628.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:   8%|▊         | 101/1208 [03:13<35:25,  1.92s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.88e-5, train/loss_step=0.0102, global_step=628.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   8%|▊         | 101/1208 [03:13<35:25,  1.92s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0435, train/loss_vlb_step=0.00016, train/loss_step=0.0435, global_step=629.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   8%|▊         | 102/1208 [03:14<35:13,  1.91s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0435, train/loss_vlb_step=0.00016, train/loss_step=0.0435, global_step=629.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   8%|▊         | 102/1208 [03:14<35:13,  1.91s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000121, train/loss_step=0.0306, global_step=629.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   9%|▊         | 103/1208 [03:15<35:02,  1.90s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000121, train/loss_step=0.0306, global_step=629.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   9%|▊         | 103/1208 [03:15<35:02,  1.90s/it, loss=0.11, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00141, train/loss_step=0.282, global_step=629.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]     Epoch 2:   9%|▊         | 104/1208 [03:19<35:14,  1.92s/it, loss=0.11, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00141, train/loss_step=0.282, global_step=629.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   9%|▊         | 104/1208 [03:19<35:14,  1.92s/it, loss=0.119, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000671, train/loss_step=0.189, global_step=629.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   9%|▊         | 105/1208 [03:20<35:04,  1.91s/it, loss=0.119, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000671, train/loss_step=0.189, global_step=629.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   9%|▊         | 105/1208 [03:20<35:04,  1.91s/it, loss=0.122, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.00057, train/loss_step=0.164, global_step=630.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:   9%|▉         | 106/1208 [03:21<34:53,  1.90s/it, loss=0.122, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.00057, train/loss_step=0.164, global_step=630.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   9%|▉         | 106/1208 [03:21<34:53,  1.90s/it, loss=0.125, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000603, train/loss_step=0.176, global_step=630.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   9%|▉         | 107/1208 [03:22<34:42,  1.89s/it, loss=0.125, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000603, train/loss_step=0.176, global_step=630.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   9%|▉         | 107/1208 [03:22<34:42,  1.89s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0782, train/loss_vlb_step=0.000266, train/loss_step=0.0782, global_step=630.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   9%|▉         | 108/1208 [03:25<34:54,  1.90s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0782, train/loss_vlb_step=0.000266, train/loss_step=0.0782, global_step=630.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   9%|▉         | 108/1208 [03:25<34:54,  1.90s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0578, train/loss_vlb_step=0.000209, train/loss_step=0.0578, global_step=630.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   9%|▉         | 109/1208 [03:26<34:44,  1.90s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0578, train/loss_vlb_step=0.000209, train/loss_step=0.0578, global_step=630.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   9%|▉         | 109/1208 [03:26<34:44,  1.90s/it, loss=0.119, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00145, train/loss_step=0.268, global_step=631.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:   9%|▉         | 110/1208 [03:27<34:33,  1.89s/it, loss=0.119, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00145, train/loss_step=0.268, global_step=631.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   9%|▉         | 110/1208 [03:27<34:33,  1.89s/it, loss=0.128, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.00079, train/loss_step=0.198, global_step=631.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   9%|▉         | 111/1208 [03:28<34:23,  1.88s/it, loss=0.128, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.00079, train/loss_step=0.198, global_step=631.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   9%|▉         | 111/1208 [03:28<34:23,  1.88s/it, loss=0.124, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00194, train/loss_step=0.357, global_step=631.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   9%|▉         | 112/1208 [03:32<34:35,  1.89s/it, loss=0.124, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00194, train/loss_step=0.357, global_step=631.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   9%|▉         | 112/1208 [03:32<34:35,  1.89s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.000114, train/loss_step=0.0275, global_step=631.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   9%|▉         | 113/1208 [03:33<34:26,  1.89s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.000114, train/loss_step=0.0275, global_step=631.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   9%|▉         | 113/1208 [03:33<34:26,  1.89s/it, loss=0.13, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000423, train/loss_step=0.128, global_step=632.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:   9%|▉         | 114/1208 [03:34<34:16,  1.88s/it, loss=0.13, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000423, train/loss_step=0.128, global_step=632.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:   9%|▉         | 114/1208 [03:34<34:16,  1.88s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0083, train/loss_vlb_step=4.12e-5, train/loss_step=0.0083, global_step=632.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  10%|▉         | 115/1208 [03:35<34:06,  1.87s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0083, train/loss_vlb_step=4.12e-5, train/loss_step=0.0083, global_step=632.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  10%|▉         | 115/1208 [03:35<34:06,  1.87s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000144, train/loss_step=0.0369, global_step=632.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  10%|▉         | 116/1208 [03:38<34:17,  1.88s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000144, train/loss_step=0.0369, global_step=632.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  10%|▉         | 116/1208 [03:38<34:17,  1.88s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00424, train/loss_vlb_step=2.29e-5, train/loss_step=0.00424, global_step=632.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  10%|▉         | 117/1208 [03:39<34:08,  1.88s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00424, train/loss_vlb_step=2.29e-5, train/loss_step=0.00424, global_step=632.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  10%|▉         | 117/1208 [03:39<34:08,  1.88s/it, loss=0.137, v_num=0, train/loss_simple_step=0.581, train/loss_vlb_step=0.0148, train/loss_step=0.581, global_step=633.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]     Epoch 2:  10%|▉         | 118/1208 [03:40<33:58,  1.87s/it, loss=0.137, v_num=0, train/loss_simple_step=0.581, train/loss_vlb_step=0.0148, train/loss_step=0.581, global_step=633.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  10%|▉         | 118/1208 [03:40<33:58,  1.87s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=6.98e-5, train/loss_step=0.0165, global_step=633.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  10%|▉         | 119/1208 [03:41<33:48,  1.86s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=6.98e-5, train/loss_step=0.0165, global_step=633.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  10%|▉         | 119/1208 [03:41<33:48,  1.86s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0554, train/loss_vlb_step=0.000196, train/loss_step=0.0554, global_step=633.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  10%|▉         | 120/1208 [03:44<33:59,  1.87s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0554, train/loss_vlb_step=0.000196, train/loss_step=0.0554, global_step=633.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  10%|▉         | 120/1208 [03:44<33:59,  1.87s/it, loss=0.161, v_num=0, train/loss_simple_step=0.520, train/loss_vlb_step=0.0109, train/loss_step=0.520, global_step=633.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  10%|█         | 121/1208 [03:45<33:50,  1.87s/it, loss=0.161, v_num=0, train/loss_simple_step=0.520, train/loss_vlb_step=0.0109, train/loss_step=0.520, global_step=633.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  10%|█         | 121/1208 [03:45<33:50,  1.87s/it, loss=0.18, v_num=0, train/loss_simple_step=0.424, train/loss_vlb_step=0.00447, train/loss_step=0.424, global_step=634.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  10%|█         | 122/1208 [03:47<33:40,  1.86s/it, loss=0.18, v_num=0, train/loss_simple_step=0.424, train/loss_vlb_step=0.00447, train/loss_step=0.424, global_step=634.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  10%|█         | 122/1208 [03:47<33:40,  1.86s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00382, train/loss_vlb_step=2.15e-5, train/loss_step=0.00382, global_step=634.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  10%|█         | 123/1208 [03:48<33:31,  1.85s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00382, train/loss_vlb_step=2.15e-5, train/loss_step=0.00382, global_step=634.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  10%|█         | 123/1208 [03:48<33:31,  1.85s/it, loss=0.175, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000719, train/loss_step=0.200, global_step=634.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  10%|█         | 124/1208 [03:51<33:42,  1.87s/it, loss=0.175, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000719, train/loss_step=0.200, global_step=634.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  10%|█         | 124/1208 [03:51<33:42,  1.87s/it, loss=0.182, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00172, train/loss_step=0.340, global_step=634.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  10%|█         | 125/1208 [03:52<33:33,  1.86s/it, loss=0.182, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00172, train/loss_step=0.340, global_step=634.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  10%|█         | 125/1208 [03:52<33:33,  1.86s/it, loss=0.189, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00135, train/loss_step=0.294, global_step=635.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  10%|█         | 126/1208 [03:53<33:24,  1.85s/it, loss=0.189, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00135, train/loss_step=0.294, global_step=635.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  10%|█         | 126/1208 [03:53<33:24,  1.85s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0603, train/loss_vlb_step=0.000209, train/loss_step=0.0603, global_step=635.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  11%|█         | 127/1208 [03:54<33:15,  1.85s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0603, train/loss_vlb_step=0.000209, train/loss_step=0.0603, global_step=635.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  11%|█         | 127/1208 [03:54<33:15,  1.85s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0882, train/loss_vlb_step=0.000294, train/loss_step=0.0882, global_step=635.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  11%|█         | 128/1208 [03:57<33:25,  1.86s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0882, train/loss_vlb_step=0.000294, train/loss_step=0.0882, global_step=635.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  11%|█         | 128/1208 [03:57<33:25,  1.86s/it, loss=0.199, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00231, train/loss_step=0.378, global_step=635.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  11%|█         | 129/1208 [03:58<33:16,  1.85s/it, loss=0.199, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00231, train/loss_step=0.378, global_step=635.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  11%|█         | 129/1208 [03:58<33:16,  1.85s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.000181, train/loss_step=0.0508, global_step=636.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  11%|█         | 130/1208 [03:59<33:08,  1.84s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.000181, train/loss_step=0.0508, global_step=636.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  11%|█         | 130/1208 [03:59<33:08,  1.84s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000116, train/loss_step=0.0296, global_step=636.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  11%|█         | 131/1208 [04:00<32:59,  1.84s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000116, train/loss_step=0.0296, global_step=636.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  11%|█         | 131/1208 [04:00<32:59,  1.84s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.41e-5, train/loss_step=0.0121, global_step=636.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  11%|█         | 132/1208 [04:04<33:09,  1.85s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.41e-5, train/loss_step=0.0121, global_step=636.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  11%|█         | 132/1208 [04:04<33:09,  1.85s/it, loss=0.167, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=636.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  11%|█         | 133/1208 [04:05<33:01,  1.84s/it, loss=0.167, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=636.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  11%|█         | 133/1208 [04:05<33:01,  1.84s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.000196, train/loss_step=0.0556, global_step=637.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  11%|█         | 134/1208 [04:06<32:52,  1.84s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.000196, train/loss_step=0.0556, global_step=637.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  11%|█         | 134/1208 [04:06<32:52,  1.84s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.7e-5, train/loss_step=0.00291, global_step=637.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  11%|█         | 135/1208 [04:07<32:44,  1.83s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.7e-5, train/loss_step=0.00291, global_step=637.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  11%|█         | 135/1208 [04:07<32:44,  1.83s/it, loss=0.173, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000936, train/loss_step=0.245, global_step=637.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  11%|█▏        | 136/1208 [04:10<32:54,  1.84s/it, loss=0.173, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000936, train/loss_step=0.245, global_step=637.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  11%|█▏        | 136/1208 [04:10<32:54,  1.84s/it, loss=0.179, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000383, train/loss_step=0.117, global_step=637.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  11%|█▏        | 137/1208 [04:11<32:46,  1.84s/it, loss=0.179, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000383, train/loss_step=0.117, global_step=637.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  11%|█▏        | 137/1208 [04:11<32:46,  1.84s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.98e-5, train/loss_step=0.0188, global_step=638.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  11%|█▏        | 138/1208 [04:12<32:38,  1.83s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.98e-5, train/loss_step=0.0188, global_step=638.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  11%|█▏        | 138/1208 [04:12<32:38,  1.83s/it, loss=0.155, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.00035, train/loss_step=0.107, global_step=638.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  12%|█▏        | 139/1208 [04:13<32:30,  1.82s/it, loss=0.155, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.00035, train/loss_step=0.107, global_step=638.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  12%|█▏        | 139/1208 [04:13<32:30,  1.82s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0305, train/loss_vlb_step=0.000117, train/loss_step=0.0305, global_step=638.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  12%|█▏        | 140/1208 [04:16<32:39,  1.83s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0305, train/loss_vlb_step=0.000117, train/loss_step=0.0305, global_step=638.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  12%|█▏        | 140/1208 [04:16<32:39,  1.83s/it, loss=0.141, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.000981, train/loss_step=0.256, global_step=638.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  12%|█▏        | 141/1208 [04:17<32:31,  1.83s/it, loss=0.141, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.000981, train/loss_step=0.256, global_step=638.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  12%|█▏        | 141/1208 [04:17<32:31,  1.83s/it, loss=0.121, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.000107, train/loss_step=0.027, global_step=639.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  12%|█▏        | 142/1208 [04:18<32:24,  1.82s/it, loss=0.121, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.000107, train/loss_step=0.027, global_step=639.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  12%|█▏        | 142/1208 [04:18<32:24,  1.82s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.85e-5, train/loss_step=0.0033, global_step=639.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  12%|█▏        | 143/1208 [04:20<32:16,  1.82s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.85e-5, train/loss_step=0.0033, global_step=639.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  12%|█▏        | 143/1208 [04:20<32:16,  1.82s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0045, train/loss_vlb_step=2.38e-5, train/loss_step=0.0045, global_step=639.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  12%|█▏        | 144/1208 [04:23<32:25,  1.83s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0045, train/loss_vlb_step=2.38e-5, train/loss_step=0.0045, global_step=639.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  12%|█▏        | 144/1208 [04:23<32:25,  1.83s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.37e-5, train/loss_step=0.0227, global_step=639.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  12%|█▏        | 145/1208 [04:24<32:18,  1.82s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.37e-5, train/loss_step=0.0227, global_step=639.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  12%|█▏        | 145/1208 [04:24<32:18,  1.82s/it, loss=0.0872, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000431, train/loss_step=0.131, global_step=640.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  12%|█▏        | 146/1208 [04:25<32:11,  1.82s/it, loss=0.0872, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000431, train/loss_step=0.131, global_step=640.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  12%|█▏        | 146/1208 [04:25<32:11,  1.82s/it, loss=0.101, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00191, train/loss_step=0.341, global_step=640.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  12%|█▏        | 147/1208 [04:26<32:03,  1.81s/it, loss=0.101, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00191, train/loss_step=0.341, global_step=640.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  12%|█▏        | 147/1208 [04:26<32:03,  1.81s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0705, train/loss_vlb_step=0.000235, train/loss_step=0.0705, global_step=640.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  12%|█▏        | 148/1208 [04:29<32:09,  1.82s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0705, train/loss_vlb_step=0.000235, train/loss_step=0.0705, global_step=640.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  12%|█▏        | 148/1208 [04:29<32:09,  1.82s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.0572, train/loss_vlb_step=0.000206, train/loss_step=0.0572, global_step=640.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  12%|█▏        | 149/1208 [04:30<32:02,  1.81s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.0572, train/loss_vlb_step=0.000206, train/loss_step=0.0572, global_step=640.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  12%|█▏        | 149/1208 [04:30<32:02,  1.81s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.0602, train/loss_vlb_step=0.000209, train/loss_step=0.0602, global_step=641.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  12%|█▏        | 150/1208 [04:31<31:54,  1.81s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.0602, train/loss_vlb_step=0.000209, train/loss_step=0.0602, global_step=641.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  12%|█▏        | 150/1208 [04:31<31:54,  1.81s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.17e-5, train/loss_step=0.0196, global_step=641.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  12%|█▎        | 151/1208 [04:32<31:47,  1.80s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.17e-5, train/loss_step=0.0196, global_step=641.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  12%|█▎        | 151/1208 [04:32<31:47,  1.80s/it, loss=0.0878, v_num=0, train/loss_simple_step=0.0828, train/loss_vlb_step=0.00028, train/loss_step=0.0828, global_step=641.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  13%|█▎        | 152/1208 [04:35<31:52,  1.81s/it, loss=0.0878, v_num=0, train/loss_simple_step=0.0828, train/loss_vlb_step=0.00028, train/loss_step=0.0828, global_step=641.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  13%|█▎        | 152/1208 [04:35<31:52,  1.81s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000775, train/loss_step=0.210, global_step=641.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  13%|█▎        | 153/1208 [04:36<31:45,  1.81s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000775, train/loss_step=0.210, global_step=641.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  13%|█▎        | 153/1208 [04:36<31:45,  1.81s/it, loss=0.106, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00145, train/loss_step=0.319, global_step=642.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  13%|█▎        | 154/1208 [04:37<31:38,  1.80s/it, loss=0.106, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00145, train/loss_step=0.319, global_step=642.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  13%|█▎        | 154/1208 [04:37<31:38,  1.80s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0523, train/loss_vlb_step=0.000182, train/loss_step=0.0523, global_step=642.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  13%|█▎        | 155/1208 [04:38<31:31,  1.80s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0523, train/loss_vlb_step=0.000182, train/loss_step=0.0523, global_step=642.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  13%|█▎        | 155/1208 [04:38<31:31,  1.80s/it, loss=0.113, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00315, train/loss_step=0.333, global_step=642.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  13%|█▎        | 156/1208 [04:41<31:36,  1.80s/it, loss=0.113, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00315, train/loss_step=0.333, global_step=642.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  13%|█▎        | 156/1208 [04:41<31:36,  1.80s/it, loss=0.114, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000469, train/loss_step=0.140, global_step=642.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  13%|█▎        | 157/1208 [04:42<31:29,  1.80s/it, loss=0.114, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000469, train/loss_step=0.140, global_step=642.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  13%|█▎        | 157/1208 [04:42<31:29,  1.80s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0812, train/loss_vlb_step=0.000273, train/loss_step=0.0812, global_step=643.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  13%|█▎        | 158/1208 [04:43<31:22,  1.79s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0812, train/loss_vlb_step=0.000273, train/loss_step=0.0812, global_step=643.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  13%|█▎        | 158/1208 [04:43<31:22,  1.79s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0787, train/loss_vlb_step=0.000265, train/loss_step=0.0787, global_step=643.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  13%|█▎        | 159/1208 [04:44<31:15,  1.79s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0787, train/loss_vlb_step=0.000265, train/loss_step=0.0787, global_step=643.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  13%|█▎        | 159/1208 [04:44<31:15,  1.79s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0089, train/loss_vlb_step=4.33e-5, train/loss_step=0.0089, global_step=643.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  13%|█▎        | 160/1208 [04:47<31:21,  1.79s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0089, train/loss_vlb_step=4.33e-5, train/loss_step=0.0089, global_step=643.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  13%|█▎        | 160/1208 [04:47<31:21,  1.79s/it, loss=0.113, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000821, train/loss_step=0.219, global_step=643.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  13%|█▎        | 161/1208 [04:48<31:14,  1.79s/it, loss=0.113, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000821, train/loss_step=0.219, global_step=643.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  13%|█▎        | 161/1208 [04:48<31:14,  1.79s/it, loss=0.118, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000377, train/loss_step=0.115, global_step=644.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  13%|█▎        | 162/1208 [04:49<31:07,  1.79s/it, loss=0.118, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000377, train/loss_step=0.115, global_step=644.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  13%|█▎        | 162/1208 [04:49<31:07,  1.79s/it, loss=0.134, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00165, train/loss_step=0.330, global_step=644.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  13%|█▎        | 163/1208 [04:50<31:00,  1.78s/it, loss=0.134, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00165, train/loss_step=0.330, global_step=644.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  13%|█▎        | 163/1208 [04:50<31:00,  1.78s/it, loss=0.159, v_num=0, train/loss_simple_step=0.506, train/loss_vlb_step=0.00551, train/loss_step=0.506, global_step=644.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  14%|█▎        | 164/1208 [04:53<31:05,  1.79s/it, loss=0.159, v_num=0, train/loss_simple_step=0.506, train/loss_vlb_step=0.00551, train/loss_step=0.506, global_step=644.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  14%|█▎        | 164/1208 [04:53<31:05,  1.79s/it, loss=0.162, v_num=0, train/loss_simple_step=0.075, train/loss_vlb_step=0.000253, train/loss_step=0.075, global_step=644.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  14%|█▎        | 165/1208 [04:54<30:59,  1.78s/it, loss=0.162, v_num=0, train/loss_simple_step=0.075, train/loss_vlb_step=0.000253, train/loss_step=0.075, global_step=644.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  14%|█▎        | 165/1208 [04:54<30:59,  1.78s/it, loss=0.155, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.18e-5, train/loss_step=0.002, global_step=645.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  14%|█▎        | 166/1208 [04:55<30:52,  1.78s/it, loss=0.155, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.18e-5, train/loss_step=0.002, global_step=645.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  14%|█▎        | 166/1208 [04:55<30:52,  1.78s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0627, train/loss_vlb_step=0.000214, train/loss_step=0.0627, global_step=645.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  14%|█▍        | 167/1208 [04:56<30:46,  1.77s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0627, train/loss_vlb_step=0.000214, train/loss_step=0.0627, global_step=645.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  14%|█▍        | 167/1208 [04:56<30:46,  1.77s/it, loss=0.146, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000625, train/loss_step=0.175, global_step=645.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  14%|█▍        | 168/1208 [04:59<30:51,  1.78s/it, loss=0.146, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000625, train/loss_step=0.175, global_step=645.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  14%|█▍        | 168/1208 [04:59<30:51,  1.78s/it, loss=0.15, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000427, train/loss_step=0.130, global_step=645.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  14%|█▍        | 169/1208 [05:00<30:44,  1.78s/it, loss=0.15, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000427, train/loss_step=0.130, global_step=645.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  14%|█▍        | 169/1208 [05:00<30:44,  1.78s/it, loss=0.155, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000544, train/loss_step=0.165, global_step=646.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  14%|█▍        | 170/1208 [05:01<30:38,  1.77s/it, loss=0.155, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000544, train/loss_step=0.165, global_step=646.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  14%|█▍        | 170/1208 [05:01<30:38,  1.77s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000137, train/loss_step=0.0367, global_step=646.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  14%|█▍        | 171/1208 [05:02<30:31,  1.77s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000137, train/loss_step=0.0367, global_step=646.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  14%|█▍        | 171/1208 [05:02<30:31,  1.77s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=2.6e-5, train/loss_step=0.00495, global_step=646.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  14%|█▍        | 172/1208 [05:04<30:36,  1.77s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=2.6e-5, train/loss_step=0.00495, global_step=646.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  14%|█▍        | 172/1208 [05:04<30:36,  1.77s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=6.2e-5, train/loss_step=0.0132, global_step=646.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  14%|█▍        | 173/1208 [05:05<30:30,  1.77s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=6.2e-5, train/loss_step=0.0132, global_step=646.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  14%|█▍        | 173/1208 [05:05<30:30,  1.77s/it, loss=0.173, v_num=0, train/loss_simple_step=0.929, train/loss_vlb_step=0.468, train/loss_step=0.929, global_step=647.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  14%|█▍        | 174/1208 [05:06<30:24,  1.76s/it, loss=0.173, v_num=0, train/loss_simple_step=0.929, train/loss_vlb_step=0.468, train/loss_step=0.929, global_step=647.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  14%|█▍        | 174/1208 [05:06<30:24,  1.76s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0586, train/loss_vlb_step=0.000203, train/loss_step=0.0586, global_step=647.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  14%|█▍        | 175/1208 [05:07<30:17,  1.76s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0586, train/loss_vlb_step=0.000203, train/loss_step=0.0586, global_step=647.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  14%|█▍        | 175/1208 [05:07<30:17,  1.76s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.65e-5, train/loss_step=0.0196, global_step=647.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  15%|█▍        | 176/1208 [05:10<30:22,  1.77s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.65e-5, train/loss_step=0.0196, global_step=647.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  15%|█▍        | 176/1208 [05:10<30:23,  1.77s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00515, train/loss_vlb_step=2.78e-5, train/loss_step=0.00515, global_step=647.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  15%|█▍        | 177/1208 [05:11<30:16,  1.76s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00515, train/loss_vlb_step=2.78e-5, train/loss_step=0.00515, global_step=647.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  15%|█▍        | 177/1208 [05:11<30:16,  1.76s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.74e-5, train/loss_step=0.0146, global_step=648.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  15%|█▍        | 178/1208 [05:12<30:10,  1.76s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.74e-5, train/loss_step=0.0146, global_step=648.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  15%|█▍        | 178/1208 [05:12<30:10,  1.76s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0666, train/loss_vlb_step=0.000227, train/loss_step=0.0666, global_step=648.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  15%|█▍        | 179/1208 [05:13<30:04,  1.75s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0666, train/loss_vlb_step=0.000227, train/loss_step=0.0666, global_step=648.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  15%|█▍        | 179/1208 [05:13<30:04,  1.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000337, train/loss_step=0.102, global_step=648.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  15%|█▍        | 180/1208 [05:16<30:09,  1.76s/it, loss=0.151, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000337, train/loss_step=0.102, global_step=648.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  15%|█▍        | 180/1208 [05:16<30:09,  1.76s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0989, train/loss_vlb_step=0.000326, train/loss_step=0.0989, global_step=648.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  15%|█▍        | 181/1208 [05:17<30:03,  1.76s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0989, train/loss_vlb_step=0.000326, train/loss_step=0.0989, global_step=648.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  15%|█▍        | 181/1208 [05:17<30:03,  1.76s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000145, train/loss_step=0.0381, global_step=649.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  15%|█▌        | 182/1208 [05:18<29:57,  1.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000145, train/loss_step=0.0381, global_step=649.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  15%|█▌        | 182/1208 [05:18<29:57,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000337, train/loss_step=0.102, global_step=649.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  15%|█▌        | 183/1208 [05:19<29:51,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000337, train/loss_step=0.102, global_step=649.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  15%|█▌        | 183/1208 [05:19<29:51,  1.75s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.65e-5, train/loss_step=0.0125, global_step=649.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  15%|█▌        | 184/1208 [05:22<29:56,  1.75s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.65e-5, train/loss_step=0.0125, global_step=649.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  15%|█▌        | 184/1208 [05:22<29:56,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000577, train/loss_step=0.175, global_step=649.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  15%|█▌        | 185/1208 [05:23<29:50,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000577, train/loss_step=0.175, global_step=649.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  15%|█▌        | 185/1208 [05:23<29:50,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0858, train/loss_vlb_step=0.000287, train/loss_step=0.0858, global_step=650.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  15%|█▌        | 186/1208 [05:24<29:44,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0858, train/loss_vlb_step=0.000287, train/loss_step=0.0858, global_step=650.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  15%|█▌        | 186/1208 [05:24<29:44,  1.75s/it, loss=0.146, v_num=0, train/loss_simple_step=0.687, train/loss_vlb_step=0.0585, train/loss_step=0.687, global_step=650.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  15%|█▌        | 187/1208 [05:25<29:38,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.687, train/loss_vlb_step=0.0585, train/loss_step=0.687, global_step=650.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  15%|█▌        | 187/1208 [05:25<29:38,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000433, train/loss_step=0.128, global_step=650.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  16%|█▌        | 188/1208 [05:28<29:43,  1.75s/it, loss=0.144, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000433, train/loss_step=0.128, global_step=650.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  16%|█▌        | 188/1208 [05:28<29:43,  1.75s/it, loss=0.144, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000433, train/loss_step=0.130, global_step=650.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  16%|█▌        | 189/1208 [05:29<29:37,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000433, train/loss_step=0.130, global_step=650.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  16%|█▌        | 189/1208 [05:29<29:37,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00283, train/loss_vlb_step=1.59e-5, train/loss_step=0.00283, global_step=651.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  16%|█▌        | 190/1208 [05:30<29:31,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00283, train/loss_vlb_step=1.59e-5, train/loss_step=0.00283, global_step=651.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  16%|█▌        | 190/1208 [05:30<29:31,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0377, train/loss_vlb_step=0.000136, train/loss_step=0.0377, global_step=651.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  16%|█▌        | 191/1208 [05:31<29:26,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0377, train/loss_vlb_step=0.000136, train/loss_step=0.0377, global_step=651.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  16%|█▌        | 191/1208 [05:31<29:26,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.38e-5, train/loss_step=0.0174, global_step=651.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  16%|█▌        | 192/1208 [05:34<29:30,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.38e-5, train/loss_step=0.0174, global_step=651.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  16%|█▌        | 192/1208 [05:34<29:30,  1.74s/it, loss=0.169, v_num=0, train/loss_simple_step=0.678, train/loss_vlb_step=0.0211, train/loss_step=0.678, global_step=651.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  16%|█▌        | 193/1208 [05:35<29:24,  1.74s/it, loss=0.169, v_num=0, train/loss_simple_step=0.678, train/loss_vlb_step=0.0211, train/loss_step=0.678, global_step=651.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  16%|█▌        | 193/1208 [05:35<29:24,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.451, train/loss_vlb_step=0.00469, train/loss_step=0.451, global_step=652.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  16%|█▌        | 194/1208 [05:36<29:19,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.451, train/loss_vlb_step=0.00469, train/loss_step=0.451, global_step=652.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  16%|█▌        | 194/1208 [05:36<29:19,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=7.99e-5, train/loss_step=0.0189, global_step=652.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  16%|█▌        | 195/1208 [05:37<29:13,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=7.99e-5, train/loss_step=0.0189, global_step=652.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  16%|█▌        | 195/1208 [05:37<29:13,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.04e-5, train/loss_step=0.00173, global_step=652.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  16%|█▌        | 196/1208 [05:40<29:17,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.04e-5, train/loss_step=0.00173, global_step=652.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  16%|█▌        | 196/1208 [05:40<29:18,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00746, train/loss_vlb_step=3.64e-5, train/loss_step=0.00746, global_step=652.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  16%|█▋        | 197/1208 [05:41<29:12,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00746, train/loss_vlb_step=3.64e-5, train/loss_step=0.00746, global_step=652.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  16%|█▋        | 197/1208 [05:41<29:12,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0795, train/loss_vlb_step=0.000263, train/loss_step=0.0795, global_step=653.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  16%|█▋        | 198/1208 [05:42<29:07,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0795, train/loss_vlb_step=0.000263, train/loss_step=0.0795, global_step=653.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  16%|█▋        | 198/1208 [05:42<29:07,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=1.51e-5, train/loss_step=0.00262, global_step=653.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  16%|█▋        | 199/1208 [05:43<29:01,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=1.51e-5, train/loss_step=0.00262, global_step=653.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  16%|█▋        | 199/1208 [05:43<29:01,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.498, train/loss_vlb_step=0.00704, train/loss_step=0.498, global_step=653.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  17%|█▋        | 200/1208 [05:46<29:05,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.498, train/loss_vlb_step=0.00704, train/loss_step=0.498, global_step=653.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  17%|█▋        | 200/1208 [05:46<29:05,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0495, train/loss_vlb_step=0.000171, train/loss_step=0.0495, global_step=653.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  17%|█▋        | 201/1208 [05:47<29:00,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0495, train/loss_vlb_step=0.000171, train/loss_step=0.0495, global_step=653.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  17%|█▋        | 201/1208 [05:47<29:00,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00887, train/loss_vlb_step=4.36e-5, train/loss_step=0.00887, global_step=654.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  17%|█▋        | 202/1208 [05:48<28:55,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00887, train/loss_vlb_step=4.36e-5, train/loss_step=0.00887, global_step=654.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  17%|█▋        | 202/1208 [05:48<28:55,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.549, train/loss_vlb_step=0.0128, train/loss_step=0.549, global_step=654.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]     Epoch 2:  17%|█▋        | 203/1208 [05:49<28:50,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.549, train/loss_vlb_step=0.0128, train/loss_step=0.549, global_step=654.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  17%|█▋        | 203/1208 [05:49<28:50,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00487, train/loss_vlb_step=2.75e-5, train/loss_step=0.00487, global_step=654.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  17%|█▋        | 204/1208 [05:52<28:53,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00487, train/loss_vlb_step=2.75e-5, train/loss_step=0.00487, global_step=654.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  17%|█▋        | 204/1208 [05:52<28:53,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0662, train/loss_vlb_step=0.000228, train/loss_step=0.0662, global_step=654.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  17%|█▋        | 205/1208 [05:53<28:48,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0662, train/loss_vlb_step=0.000228, train/loss_step=0.0662, global_step=654.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  17%|█▋        | 205/1208 [05:53<28:48,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00533, train/loss_vlb_step=2.73e-5, train/loss_step=0.00533, global_step=655.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  17%|█▋        | 206/1208 [05:54<28:43,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00533, train/loss_vlb_step=2.73e-5, train/loss_step=0.00533, global_step=655.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  17%|█▋        | 206/1208 [05:54<28:43,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.72e-5, train/loss_step=0.0207, global_step=655.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  17%|█▋        | 207/1208 [05:55<28:38,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.72e-5, train/loss_step=0.0207, global_step=655.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  17%|█▋        | 207/1208 [05:55<28:38,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00813, train/loss_vlb_step=3.96e-5, train/loss_step=0.00813, global_step=655.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  17%|█▋        | 208/1208 [05:58<28:42,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00813, train/loss_vlb_step=3.96e-5, train/loss_step=0.00813, global_step=655.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  17%|█▋        | 208/1208 [05:58<28:42,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0913, train/loss_vlb_step=0.000308, train/loss_step=0.0913, global_step=655.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  17%|█▋        | 209/1208 [05:59<28:37,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0913, train/loss_vlb_step=0.000308, train/loss_step=0.0913, global_step=655.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  17%|█▋        | 209/1208 [05:59<28:37,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00487, train/loss_vlb_step=2.55e-5, train/loss_step=0.00487, global_step=656.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  17%|█▋        | 210/1208 [06:00<28:32,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00487, train/loss_vlb_step=2.55e-5, train/loss_step=0.00487, global_step=656.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  17%|█▋        | 210/1208 [06:00<28:32,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=656.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  17%|█▋        | 211/1208 [06:01<28:27,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=656.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  17%|█▋        | 211/1208 [06:01<28:27,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.056, train/loss_vlb_step=0.0002, train/loss_step=0.056, global_step=656.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  18%|█▊        | 212/1208 [06:04<28:30,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.056, train/loss_vlb_step=0.0002, train/loss_step=0.056, global_step=656.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  18%|█▊        | 212/1208 [06:04<28:30,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00157, train/loss_step=0.283, global_step=656.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  18%|█▊        | 213/1208 [06:05<28:25,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00157, train/loss_step=0.283, global_step=656.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  18%|█▊        | 213/1208 [06:05<28:25,  1.71s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0575, train/loss_vlb_step=0.000208, train/loss_step=0.0575, global_step=657.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  18%|█▊        | 214/1208 [06:06<28:20,  1.71s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0575, train/loss_vlb_step=0.000208, train/loss_step=0.0575, global_step=657.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  18%|█▊        | 214/1208 [06:06<28:20,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000709, train/loss_step=0.201, global_step=657.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  18%|█▊        | 215/1208 [06:07<28:15,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000709, train/loss_step=0.201, global_step=657.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  18%|█▊        | 215/1208 [06:07<28:15,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0523, train/loss_vlb_step=0.00019, train/loss_step=0.0523, global_step=657.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  18%|█▊        | 216/1208 [06:10<28:19,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0523, train/loss_vlb_step=0.00019, train/loss_step=0.0523, global_step=657.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  18%|█▊        | 216/1208 [06:10<28:19,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.00059, train/loss_step=0.161, global_step=657.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  18%|█▊        | 217/1208 [06:11<28:14,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.00059, train/loss_step=0.161, global_step=657.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  18%|█▊        | 217/1208 [06:11<28:14,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0818, train/loss_vlb_step=0.000271, train/loss_step=0.0818, global_step=658.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  18%|█▊        | 218/1208 [06:12<28:09,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0818, train/loss_vlb_step=0.000271, train/loss_step=0.0818, global_step=658.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  18%|█▊        | 218/1208 [06:12<28:09,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000708, train/loss_step=0.198, global_step=658.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  18%|█▊        | 219/1208 [06:13<28:04,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000708, train/loss_step=0.198, global_step=658.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  18%|█▊        | 219/1208 [06:13<28:04,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0978, train/loss_vlb_step=0.000325, train/loss_step=0.0978, global_step=658.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  18%|█▊        | 220/1208 [06:15<28:08,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0978, train/loss_vlb_step=0.000325, train/loss_step=0.0978, global_step=658.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  18%|█▊        | 220/1208 [06:15<28:08,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00654, train/loss_vlb_step=3.36e-5, train/loss_step=0.00654, global_step=658.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  18%|█▊        | 221/1208 [06:17<28:03,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00654, train/loss_vlb_step=3.36e-5, train/loss_step=0.00654, global_step=658.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  18%|█▊        | 221/1208 [06:17<28:03,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0495, train/loss_vlb_step=0.000177, train/loss_step=0.0495, global_step=659.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  18%|█▊        | 222/1208 [06:18<27:58,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0495, train/loss_vlb_step=0.000177, train/loss_step=0.0495, global_step=659.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  18%|█▊        | 222/1208 [06:18<27:58,  1.70s/it, loss=0.0786, v_num=0, train/loss_simple_step=0.00969, train/loss_vlb_step=4.43e-5, train/loss_step=0.00969, global_step=659.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  18%|█▊        | 223/1208 [06:19<27:54,  1.70s/it, loss=0.0786, v_num=0, train/loss_simple_step=0.00969, train/loss_vlb_step=4.43e-5, train/loss_step=0.00969, global_step=659.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  18%|█▊        | 223/1208 [06:19<27:54,  1.70s/it, loss=0.0787, v_num=0, train/loss_simple_step=0.00568, train/loss_vlb_step=2.97e-5, train/loss_step=0.00568, global_step=659.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  19%|█▊        | 224/1208 [06:21<27:57,  1.70s/it, loss=0.0787, v_num=0, train/loss_simple_step=0.00568, train/loss_vlb_step=2.97e-5, train/loss_step=0.00568, global_step=659.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  19%|█▊        | 224/1208 [06:21<27:57,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.870, train/loss_vlb_step=0.438, train/loss_step=0.870, global_step=659.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]       Epoch 2:  19%|█▊        | 225/1208 [06:22<27:52,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.870, train/loss_vlb_step=0.438, train/loss_step=0.870, global_step=659.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  19%|█▊        | 225/1208 [06:22<27:52,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0591, train/loss_vlb_step=0.000198, train/loss_step=0.0591, global_step=660.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  19%|█▊        | 226/1208 [06:23<27:48,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0591, train/loss_vlb_step=0.000198, train/loss_step=0.0591, global_step=660.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  19%|█▊        | 226/1208 [06:23<27:48,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=1.78e-5, train/loss_step=0.00308, global_step=660.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  19%|█▉        | 227/1208 [06:24<27:43,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=1.78e-5, train/loss_step=0.00308, global_step=660.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  19%|█▉        | 227/1208 [06:24<27:43,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.00042, train/loss_step=0.127, global_step=660.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  19%|█▉        | 228/1208 [06:27<27:46,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.00042, train/loss_step=0.127, global_step=660.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  19%|█▉        | 228/1208 [06:27<27:46,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.00249, train/loss_step=0.382, global_step=660.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  19%|█▉        | 229/1208 [06:28<27:42,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.00249, train/loss_step=0.382, global_step=660.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  19%|█▉        | 229/1208 [06:28<27:42,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=661.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  19%|█▉        | 230/1208 [06:29<27:37,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=661.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  19%|█▉        | 230/1208 [06:29<27:37,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.000202, train/loss_step=0.0556, global_step=661.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  19%|█▉        | 231/1208 [06:30<27:33,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.000202, train/loss_step=0.0556, global_step=661.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  19%|█▉        | 231/1208 [06:30<27:33,  1.69s/it, loss=0.182, v_num=0, train/loss_simple_step=0.844, train/loss_vlb_step=0.213, train/loss_step=0.844, global_step=661.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]     Epoch 2:  19%|█▉        | 232/1208 [06:33<27:36,  1.70s/it, loss=0.182, v_num=0, train/loss_simple_step=0.844, train/loss_vlb_step=0.213, train/loss_step=0.844, global_step=661.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  19%|█▉        | 232/1208 [06:33<27:36,  1.70s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=8.89e-5, train/loss_step=0.0223, global_step=661.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  19%|█▉        | 233/1208 [06:34<27:31,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=8.89e-5, train/loss_step=0.0223, global_step=661.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  19%|█▉        | 233/1208 [06:34<27:31,  1.69s/it, loss=0.173, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000458, train/loss_step=0.134, global_step=662.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  19%|█▉        | 234/1208 [06:35<27:27,  1.69s/it, loss=0.173, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000458, train/loss_step=0.134, global_step=662.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  19%|█▉        | 234/1208 [06:35<27:27,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=662.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  19%|█▉        | 235/1208 [06:36<27:22,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=662.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  19%|█▉        | 235/1208 [06:36<27:22,  1.69s/it, loss=0.172, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000398, train/loss_step=0.121, global_step=662.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  20%|█▉        | 236/1208 [06:39<27:26,  1.69s/it, loss=0.172, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000398, train/loss_step=0.121, global_step=662.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  20%|█▉        | 236/1208 [06:39<27:26,  1.69s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0791, train/loss_vlb_step=0.000265, train/loss_step=0.0791, global_step=662.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  20%|█▉        | 237/1208 [06:40<27:21,  1.69s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0791, train/loss_vlb_step=0.000265, train/loss_step=0.0791, global_step=662.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  20%|█▉        | 237/1208 [06:40<27:21,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0939, train/loss_vlb_step=0.000309, train/loss_step=0.0939, global_step=663.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  20%|█▉        | 238/1208 [06:41<27:17,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0939, train/loss_vlb_step=0.000309, train/loss_step=0.0939, global_step=663.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  20%|█▉        | 238/1208 [06:41<27:17,  1.69s/it, loss=0.172, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00121, train/loss_step=0.265, global_step=663.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  20%|█▉        | 239/1208 [06:42<27:12,  1.68s/it, loss=0.172, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00121, train/loss_step=0.265, global_step=663.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  20%|█▉        | 239/1208 [06:42<27:12,  1.68s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.7e-5, train/loss_step=0.00281, global_step=663.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  20%|█▉        | 240/1208 [06:45<27:15,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.7e-5, train/loss_step=0.00281, global_step=663.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  20%|█▉        | 240/1208 [06:45<27:15,  1.69s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000127, train/loss_step=0.0339, global_step=663.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  20%|█▉        | 241/1208 [06:46<27:11,  1.69s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000127, train/loss_step=0.0339, global_step=663.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  20%|█▉        | 241/1208 [06:46<27:11,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=6.8e-5, train/loss_step=0.0167, global_step=664.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  20%|██        | 242/1208 [06:47<27:07,  1.68s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=6.8e-5, train/loss_step=0.0167, global_step=664.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  20%|██        | 242/1208 [06:47<27:07,  1.68s/it, loss=0.172, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=664.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  20%|██        | 243/1208 [06:48<27:02,  1.68s/it, loss=0.172, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=664.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  20%|██        | 243/1208 [06:48<27:02,  1.68s/it, loss=0.187, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00174, train/loss_step=0.304, global_step=664.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  20%|██        | 244/1208 [06:51<27:05,  1.69s/it, loss=0.187, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00174, train/loss_step=0.304, global_step=664.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  20%|██        | 244/1208 [06:51<27:05,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=664.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  20%|██        | 245/1208 [06:52<27:01,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=664.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  20%|██        | 245/1208 [06:52<27:01,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000942, train/loss_step=0.238, global_step=665.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  20%|██        | 246/1208 [06:53<26:57,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000942, train/loss_step=0.238, global_step=665.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  20%|██        | 246/1208 [06:53<26:57,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=9.23e-5, train/loss_step=0.022, global_step=665.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  20%|██        | 247/1208 [06:54<26:52,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=9.23e-5, train/loss_step=0.022, global_step=665.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  20%|██        | 247/1208 [06:54<26:52,  1.68s/it, loss=0.171, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00269, train/loss_step=0.361, global_step=665.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  21%|██        | 248/1208 [06:57<26:55,  1.68s/it, loss=0.171, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00269, train/loss_step=0.361, global_step=665.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  21%|██        | 248/1208 [06:57<26:55,  1.68s/it, loss=0.17, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00269, train/loss_step=0.368, global_step=665.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  21%|██        | 249/1208 [06:58<26:51,  1.68s/it, loss=0.17, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00269, train/loss_step=0.368, global_step=665.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  21%|██        | 249/1208 [06:58<26:51,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00406, train/loss_vlb_step=2.19e-5, train/loss_step=0.00406, global_step=666.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  21%|██        | 250/1208 [06:59<26:47,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00406, train/loss_vlb_step=2.19e-5, train/loss_step=0.00406, global_step=666.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  21%|██        | 250/1208 [06:59<26:47,  1.68s/it, loss=0.179, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.0018, train/loss_step=0.324, global_step=666.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]     Epoch 2:  21%|██        | 251/1208 [07:00<26:43,  1.68s/it, loss=0.179, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.0018, train/loss_step=0.324, global_step=666.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  21%|██        | 251/1208 [07:00<26:43,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.74e-5, train/loss_step=0.0124, global_step=666.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  21%|██        | 252/1208 [07:03<26:45,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.74e-5, train/loss_step=0.0124, global_step=666.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  21%|██        | 252/1208 [07:03<26:45,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00162, train/loss_step=0.298, global_step=666.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  21%|██        | 253/1208 [07:04<26:41,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00162, train/loss_step=0.298, global_step=666.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  21%|██        | 253/1208 [07:04<26:41,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0902, train/loss_vlb_step=0.000299, train/loss_step=0.0902, global_step=667.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  21%|██        | 254/1208 [07:05<26:37,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0902, train/loss_vlb_step=0.000299, train/loss_step=0.0902, global_step=667.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  21%|██        | 254/1208 [07:05<26:37,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00112, train/loss_step=0.285, global_step=667.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  21%|██        | 255/1208 [07:06<26:33,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00112, train/loss_step=0.285, global_step=667.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  21%|██        | 255/1208 [07:06<26:33,  1.67s/it, loss=0.16, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000545, train/loss_step=0.162, global_step=667.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  21%|██        | 256/1208 [07:09<26:36,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000545, train/loss_step=0.162, global_step=667.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  21%|██        | 256/1208 [07:09<26:36,  1.68s/it, loss=0.168, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.000858, train/loss_step=0.254, global_step=667.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  21%|██▏       | 257/1208 [07:10<26:31,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.000858, train/loss_step=0.254, global_step=667.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  21%|██▏       | 257/1208 [07:10<26:31,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.77e-5, train/loss_step=0.0133, global_step=668.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  21%|██▏       | 258/1208 [07:11<26:27,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.77e-5, train/loss_step=0.0133, global_step=668.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  21%|██▏       | 258/1208 [07:11<26:27,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000893, train/loss_step=0.235, global_step=668.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  21%|██▏       | 259/1208 [07:12<26:23,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000893, train/loss_step=0.235, global_step=668.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  21%|██▏       | 259/1208 [07:12<26:23,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0064, train/loss_vlb_step=3.24e-5, train/loss_step=0.0064, global_step=668.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  22%|██▏       | 260/1208 [07:15<26:26,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0064, train/loss_vlb_step=3.24e-5, train/loss_step=0.0064, global_step=668.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  22%|██▏       | 260/1208 [07:15<26:26,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.00016, train/loss_step=0.0425, global_step=668.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  22%|██▏       | 261/1208 [07:16<26:22,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.00016, train/loss_step=0.0425, global_step=668.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  22%|██▏       | 261/1208 [07:16<26:22,  1.67s/it, loss=0.167, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000289, train/loss_step=0.087, global_step=669.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  22%|██▏       | 262/1208 [07:17<26:18,  1.67s/it, loss=0.167, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000289, train/loss_step=0.087, global_step=669.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  22%|██▏       | 262/1208 [07:17<26:18,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.58e-5, train/loss_step=0.00274, global_step=669.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  22%|██▏       | 263/1208 [07:18<26:14,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.58e-5, train/loss_step=0.00274, global_step=669.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  22%|██▏       | 263/1208 [07:18<26:14,  1.67s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000121, train/loss_step=0.0333, global_step=669.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  22%|██▏       | 264/1208 [07:21<26:16,  1.67s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000121, train/loss_step=0.0333, global_step=669.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  22%|██▏       | 264/1208 [07:21<26:16,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.38e-5, train/loss_step=0.0229, global_step=669.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  22%|██▏       | 265/1208 [07:22<26:12,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.38e-5, train/loss_step=0.0229, global_step=669.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  22%|██▏       | 265/1208 [07:22<26:12,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.060, train/loss_vlb_step=0.000201, train/loss_step=0.060, global_step=670.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  22%|██▏       | 266/1208 [07:23<26:08,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.060, train/loss_vlb_step=0.000201, train/loss_step=0.060, global_step=670.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  22%|██▏       | 266/1208 [07:23<26:08,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.64e-5, train/loss_step=0.00292, global_step=670.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  22%|██▏       | 267/1208 [07:24<26:05,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.64e-5, train/loss_step=0.00292, global_step=670.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  22%|██▏       | 267/1208 [07:24<26:05,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.901, train/loss_vlb_step=0.453, train/loss_step=0.901, global_step=670.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]       Epoch 2:  22%|██▏       | 268/1208 [07:26<26:07,  1.67s/it, loss=0.16, v_num=0, train/loss_simple_step=0.901, train/loss_vlb_step=0.453, train/loss_step=0.901, global_step=670.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  22%|██▏       | 268/1208 [07:26<26:07,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0589, train/loss_vlb_step=0.00021, train/loss_step=0.0589, global_step=670.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  22%|██▏       | 269/1208 [07:27<26:03,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0589, train/loss_vlb_step=0.00021, train/loss_step=0.0589, global_step=670.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  22%|██▏       | 269/1208 [07:27<26:03,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000542, train/loss_step=0.157, global_step=671.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  22%|██▏       | 270/1208 [07:28<25:59,  1.66s/it, loss=0.152, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000542, train/loss_step=0.157, global_step=671.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  22%|██▏       | 270/1208 [07:28<25:59,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0595, train/loss_vlb_step=0.000207, train/loss_step=0.0595, global_step=671.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  22%|██▏       | 271/1208 [07:30<25:55,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0595, train/loss_vlb_step=0.000207, train/loss_step=0.0595, global_step=671.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  22%|██▏       | 271/1208 [07:30<25:55,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.57e-5, train/loss_step=0.0143, global_step=671.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  23%|██▎       | 272/1208 [07:32<25:58,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.57e-5, train/loss_step=0.0143, global_step=671.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  23%|██▎       | 272/1208 [07:32<25:58,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00702, train/loss_vlb_step=3.55e-5, train/loss_step=0.00702, global_step=671.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  23%|██▎       | 273/1208 [07:33<25:54,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00702, train/loss_vlb_step=3.55e-5, train/loss_step=0.00702, global_step=671.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  23%|██▎       | 273/1208 [07:33<25:54,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0605, train/loss_vlb_step=0.000213, train/loss_step=0.0605, global_step=672.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  23%|██▎       | 274/1208 [07:34<25:50,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0605, train/loss_vlb_step=0.000213, train/loss_step=0.0605, global_step=672.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  23%|██▎       | 274/1208 [07:34<25:50,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000427, train/loss_step=0.127, global_step=672.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  23%|██▎       | 275/1208 [07:35<25:46,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000427, train/loss_step=0.127, global_step=672.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  23%|██▎       | 275/1208 [07:35<25:46,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000487, train/loss_step=0.146, global_step=672.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  23%|██▎       | 276/1208 [07:38<25:49,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000487, train/loss_step=0.146, global_step=672.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  23%|██▎       | 276/1208 [07:38<25:49,  1.66s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=1.69e-5, train/loss_step=0.00298, global_step=672.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  23%|██▎       | 277/1208 [07:39<25:45,  1.66s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=1.69e-5, train/loss_step=0.00298, global_step=672.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  23%|██▎       | 277/1208 [07:39<25:45,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.419, train/loss_vlb_step=0.00411, train/loss_step=0.419, global_step=673.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  23%|██▎       | 278/1208 [07:40<25:41,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.419, train/loss_vlb_step=0.00411, train/loss_step=0.419, global_step=673.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  23%|██▎       | 278/1208 [07:40<25:41,  1.66s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0492, train/loss_vlb_step=0.000174, train/loss_step=0.0492, global_step=673.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  23%|██▎       | 279/1208 [07:41<25:37,  1.66s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0492, train/loss_vlb_step=0.000174, train/loss_step=0.0492, global_step=673.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  23%|██▎       | 279/1208 [07:41<25:37,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.646, train/loss_vlb_step=0.0415, train/loss_step=0.646, global_step=673.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  23%|██▎       | 280/1208 [07:44<25:40,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.646, train/loss_vlb_step=0.0415, train/loss_step=0.646, global_step=673.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  23%|██▎       | 280/1208 [07:44<25:40,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=0.000104, train/loss_step=0.0257, global_step=673.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  23%|██▎       | 281/1208 [07:45<25:36,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=0.000104, train/loss_step=0.0257, global_step=673.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  23%|██▎       | 281/1208 [07:45<25:36,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000386, train/loss_step=0.116, global_step=674.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  23%|██▎       | 282/1208 [07:46<25:32,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000386, train/loss_step=0.116, global_step=674.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  23%|██▎       | 282/1208 [07:46<25:32,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00147, train/loss_step=0.282, global_step=674.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  23%|██▎       | 283/1208 [07:47<25:29,  1.65s/it, loss=0.16, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00147, train/loss_step=0.282, global_step=674.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  23%|██▎       | 283/1208 [07:47<25:29,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00873, train/loss_vlb_step=4.47e-5, train/loss_step=0.00873, global_step=674.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  24%|██▎       | 284/1208 [07:51<25:32,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00873, train/loss_vlb_step=4.47e-5, train/loss_step=0.00873, global_step=674.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  24%|██▎       | 284/1208 [07:51<25:32,  1.66s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000113, train/loss_step=0.0288, global_step=674.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  24%|██▎       | 285/1208 [07:52<25:29,  1.66s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000113, train/loss_step=0.0288, global_step=674.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  24%|██▎       | 285/1208 [07:52<25:29,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.000173, train/loss_step=0.0482, global_step=675.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  24%|██▎       | 286/1208 [07:53<25:25,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.000173, train/loss_step=0.0482, global_step=675.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  24%|██▎       | 286/1208 [07:53<25:25,  1.65s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.64e-5, train/loss_step=0.0184, global_step=675.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  24%|██▍       | 287/1208 [07:54<25:21,  1.65s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.64e-5, train/loss_step=0.0184, global_step=675.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  24%|██▍       | 287/1208 [07:54<25:21,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.000916, train/loss_step=0.243, global_step=675.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  24%|██▍       | 288/1208 [07:57<25:25,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.000916, train/loss_step=0.243, global_step=675.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  24%|██▍       | 288/1208 [07:57<25:25,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000129, train/loss_step=0.0344, global_step=675.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  24%|██▍       | 289/1208 [07:58<25:21,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000129, train/loss_step=0.0344, global_step=675.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  24%|██▍       | 289/1208 [07:58<25:21,  1.66s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0928, train/loss_vlb_step=0.00031, train/loss_step=0.0928, global_step=676.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  24%|██▍       | 290/1208 [07:59<25:18,  1.65s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0928, train/loss_vlb_step=0.00031, train/loss_step=0.0928, global_step=676.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  24%|██▍       | 290/1208 [07:59<25:18,  1.65s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00515, train/loss_vlb_step=2.71e-5, train/loss_step=0.00515, global_step=676.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  24%|██▍       | 291/1208 [08:00<25:14,  1.65s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00515, train/loss_vlb_step=2.71e-5, train/loss_step=0.00515, global_step=676.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  24%|██▍       | 291/1208 [08:00<25:14,  1.65s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.41e-5, train/loss_step=0.00241, global_step=676.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  24%|██▍       | 292/1208 [08:03<25:17,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.41e-5, train/loss_step=0.00241, global_step=676.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  24%|██▍       | 292/1208 [08:03<25:17,  1.66s/it, loss=0.13, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00119, train/loss_step=0.249, global_step=676.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]     Epoch 2:  24%|██▍       | 293/1208 [08:04<25:14,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00119, train/loss_step=0.249, global_step=676.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  24%|██▍       | 293/1208 [08:04<25:14,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.00011, train/loss_step=0.0275, global_step=677.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  24%|██▍       | 294/1208 [08:05<25:10,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.00011, train/loss_step=0.0275, global_step=677.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  24%|██▍       | 294/1208 [08:05<25:10,  1.65s/it, loss=0.142, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00264, train/loss_step=0.404, global_step=677.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  24%|██▍       | 295/1208 [08:06<25:07,  1.65s/it, loss=0.142, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00264, train/loss_step=0.404, global_step=677.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  24%|██▍       | 295/1208 [08:06<25:07,  1.65s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.27e-5, train/loss_step=0.00409, global_step=677.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  25%|██▍       | 296/1208 [08:10<25:10,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.27e-5, train/loss_step=0.00409, global_step=677.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  25%|██▍       | 296/1208 [08:10<25:10,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00127, train/loss_step=0.289, global_step=677.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]     Epoch 2:  25%|██▍       | 297/1208 [08:11<25:06,  1.65s/it, loss=0.15, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00127, train/loss_step=0.289, global_step=677.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  25%|██▍       | 297/1208 [08:11<25:06,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.63e-5, train/loss_step=0.00278, global_step=678.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  25%|██▍       | 298/1208 [08:12<25:03,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.63e-5, train/loss_step=0.00278, global_step=678.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  25%|██▍       | 298/1208 [08:12<25:03,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00105, train/loss_step=0.248, global_step=678.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  25%|██▍       | 299/1208 [08:13<24:59,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00105, train/loss_step=0.248, global_step=678.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  25%|██▍       | 299/1208 [08:13<24:59,  1.65s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0507, train/loss_vlb_step=0.000179, train/loss_step=0.0507, global_step=678.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  25%|██▍       | 300/1208 [08:16<25:03,  1.66s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0507, train/loss_vlb_step=0.000179, train/loss_step=0.0507, global_step=678.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  25%|██▍       | 300/1208 [08:16<25:03,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.74e-5, train/loss_step=0.0126, global_step=678.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] 
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.76it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.76it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.80it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.78it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.78it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.77it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.75it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 2:  25%|██▍       | 301/1208 [08:47<26:28,  1.75s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.74e-5, train/loss_step=0.0126, global_step=678.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  25%|██▍       | 301/1208 [08:47<26:28,  1.75s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000189, train/loss_step=0.0525, global_step=679.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  25%|██▌       | 302/1208 [08:48<26:24,  1.75s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000189, train/loss_step=0.0525, global_step=679.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  25%|██▌       | 302/1208 [08:48<26:24,  1.75s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.0711, train/loss_vlb_step=0.000244, train/loss_step=0.0711, global_step=679.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  25%|██▌       | 303/1208 [08:49<26:21,  1.75s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.0711, train/loss_vlb_step=0.000244, train/loss_step=0.0711, global_step=679.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  25%|██▌       | 303/1208 [08:49<26:21,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000595, train/loss_step=0.176, global_step=679.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  25%|██▌       | 304/1208 [08:52<26:23,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000595, train/loss_step=0.176, global_step=679.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  25%|██▌       | 304/1208 [08:52<26:23,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0375, train/loss_vlb_step=0.000149, train/loss_step=0.0375, global_step=679.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  25%|██▌       | 305/1208 [08:53<26:19,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0375, train/loss_vlb_step=0.000149, train/loss_step=0.0375, global_step=679.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  25%|██▌       | 305/1208 [08:53<26:19,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.532, train/loss_vlb_step=0.00678, train/loss_step=0.532, global_step=680.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  25%|██▌       | 306/1208 [08:54<26:15,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.532, train/loss_vlb_step=0.00678, train/loss_step=0.532, global_step=680.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  25%|██▌       | 306/1208 [08:54<26:15,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0477, train/loss_vlb_step=0.00017, train/loss_step=0.0477, global_step=680.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  25%|██▌       | 307/1208 [08:55<26:12,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0477, train/loss_vlb_step=0.00017, train/loss_step=0.0477, global_step=680.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  25%|██▌       | 307/1208 [08:55<26:12,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0857, train/loss_vlb_step=0.000283, train/loss_step=0.0857, global_step=680.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  25%|██▌       | 308/1208 [08:58<26:14,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0857, train/loss_vlb_step=0.000283, train/loss_step=0.0857, global_step=680.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  25%|██▌       | 308/1208 [08:58<26:14,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000121, train/loss_step=0.0295, global_step=680.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  26%|██▌       | 309/1208 [09:00<26:11,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000121, train/loss_step=0.0295, global_step=680.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  26%|██▌       | 309/1208 [09:00<26:11,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=1.19e-5, train/loss_step=0.00196, global_step=681.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  26%|██▌       | 310/1208 [09:01<26:07,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=1.19e-5, train/loss_step=0.00196, global_step=681.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  26%|██▌       | 310/1208 [09:01<26:07,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0664, train/loss_vlb_step=0.000232, train/loss_step=0.0664, global_step=681.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  26%|██▌       | 311/1208 [09:02<26:03,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0664, train/loss_vlb_step=0.000232, train/loss_step=0.0664, global_step=681.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  26%|██▌       | 311/1208 [09:02<26:03,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000513, train/loss_step=0.147, global_step=681.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  26%|██▌       | 312/1208 [09:05<26:06,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000513, train/loss_step=0.147, global_step=681.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  26%|██▌       | 312/1208 [09:05<26:06,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0631, train/loss_vlb_step=0.000218, train/loss_step=0.0631, global_step=681.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  26%|██▌       | 313/1208 [09:06<26:02,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0631, train/loss_vlb_step=0.000218, train/loss_step=0.0631, global_step=681.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  26%|██▌       | 313/1208 [09:06<26:02,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.91e-5, train/loss_step=0.0108, global_step=682.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  26%|██▌       | 314/1208 [09:07<25:58,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.91e-5, train/loss_step=0.0108, global_step=682.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  26%|██▌       | 314/1208 [09:07<25:58,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000751, train/loss_step=0.207, global_step=682.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  26%|██▌       | 315/1208 [09:08<25:54,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000751, train/loss_step=0.207, global_step=682.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  26%|██▌       | 315/1208 [09:08<25:54,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00891, train/loss_vlb_step=4.3e-5, train/loss_step=0.00891, global_step=682.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  26%|██▌       | 316/1208 [09:11<25:57,  1.75s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00891, train/loss_vlb_step=4.3e-5, train/loss_step=0.00891, global_step=682.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  26%|██▌       | 316/1208 [09:11<25:57,  1.75s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0792, train/loss_vlb_step=0.000267, train/loss_step=0.0792, global_step=682.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  26%|██▌       | 317/1208 [09:12<25:53,  1.74s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0792, train/loss_vlb_step=0.000267, train/loss_step=0.0792, global_step=682.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  26%|██▌       | 317/1208 [09:12<25:53,  1.74s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.0596, train/loss_vlb_step=0.000197, train/loss_step=0.0596, global_step=683.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  26%|██▋       | 318/1208 [09:13<25:49,  1.74s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.0596, train/loss_vlb_step=0.000197, train/loss_step=0.0596, global_step=683.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  26%|██▋       | 318/1208 [09:13<25:49,  1.74s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.0725, train/loss_vlb_step=0.000246, train/loss_step=0.0725, global_step=683.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  26%|██▋       | 319/1208 [09:14<25:46,  1.74s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.0725, train/loss_vlb_step=0.000246, train/loss_step=0.0725, global_step=683.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  26%|██▋       | 319/1208 [09:14<25:46,  1.74s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.00382, train/loss_vlb_step=2.16e-5, train/loss_step=0.00382, global_step=683.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  26%|██▋       | 320/1208 [09:18<25:48,  1.74s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.00382, train/loss_vlb_step=2.16e-5, train/loss_step=0.00382, global_step=683.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  26%|██▋       | 320/1208 [09:18<25:48,  1.74s/it, loss=0.0884, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.98e-5, train/loss_step=0.0153, global_step=683.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  27%|██▋       | 321/1208 [09:19<25:45,  1.74s/it, loss=0.0884, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.98e-5, train/loss_step=0.0153, global_step=683.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  27%|██▋       | 321/1208 [09:19<25:45,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00309, train/loss_step=0.404, global_step=684.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  27%|██▋       | 322/1208 [09:20<25:41,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00309, train/loss_step=0.404, global_step=684.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  27%|██▋       | 322/1208 [09:20<25:41,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00628, train/loss_vlb_step=3.15e-5, train/loss_step=0.00628, global_step=684.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  27%|██▋       | 323/1208 [09:21<25:37,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00628, train/loss_vlb_step=3.15e-5, train/loss_step=0.00628, global_step=684.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  27%|██▋       | 323/1208 [09:21<25:37,  1.74s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.0704, train/loss_vlb_step=0.000235, train/loss_step=0.0704, global_step=684.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  27%|██▋       | 324/1208 [09:24<25:39,  1.74s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.0704, train/loss_vlb_step=0.000235, train/loss_step=0.0704, global_step=684.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  27%|██▋       | 324/1208 [09:24<25:39,  1.74s/it, loss=0.096, v_num=0, train/loss_simple_step=0.00844, train/loss_vlb_step=4.02e-5, train/loss_step=0.00844, global_step=684.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  27%|██▋       | 325/1208 [09:25<25:35,  1.74s/it, loss=0.096, v_num=0, train/loss_simple_step=0.00844, train/loss_vlb_step=4.02e-5, train/loss_step=0.00844, global_step=684.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  27%|██▋       | 325/1208 [09:25<25:35,  1.74s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00195, train/loss_step=0.341, global_step=685.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  27%|██▋       | 326/1208 [09:26<25:31,  1.74s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00195, train/loss_step=0.341, global_step=685.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  27%|██▋       | 326/1208 [09:26<25:31,  1.74s/it, loss=0.0847, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.19e-5, train/loss_step=0.0112, global_step=685.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  27%|██▋       | 327/1208 [09:27<25:27,  1.73s/it, loss=0.0847, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.19e-5, train/loss_step=0.0112, global_step=685.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  27%|██▋       | 327/1208 [09:27<25:27,  1.73s/it, loss=0.0806, v_num=0, train/loss_simple_step=0.00398, train/loss_vlb_step=2.2e-5, train/loss_step=0.00398, global_step=685.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  27%|██▋       | 328/1208 [09:30<25:29,  1.74s/it, loss=0.0806, v_num=0, train/loss_simple_step=0.00398, train/loss_vlb_step=2.2e-5, train/loss_step=0.00398, global_step=685.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  27%|██▋       | 328/1208 [09:30<25:29,  1.74s/it, loss=0.0792, v_num=0, train/loss_simple_step=0.00189, train/loss_vlb_step=1.11e-5, train/loss_step=0.00189, global_step=685.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  27%|██▋       | 329/1208 [09:31<25:25,  1.74s/it, loss=0.0792, v_num=0, train/loss_simple_step=0.00189, train/loss_vlb_step=1.11e-5, train/loss_step=0.00189, global_step=685.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  27%|██▋       | 329/1208 [09:31<25:25,  1.74s/it, loss=0.0804, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=9.98e-5, train/loss_step=0.0272, global_step=686.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  27%|██▋       | 330/1208 [09:32<25:21,  1.73s/it, loss=0.0804, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=9.98e-5, train/loss_step=0.0272, global_step=686.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  27%|██▋       | 330/1208 [09:32<25:21,  1.73s/it, loss=0.078, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.34e-5, train/loss_step=0.0176, global_step=686.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  27%|██▋       | 331/1208 [09:33<25:18,  1.73s/it, loss=0.078, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.34e-5, train/loss_step=0.0176, global_step=686.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  27%|██▋       | 331/1208 [09:33<25:18,  1.73s/it, loss=0.0917, v_num=0, train/loss_simple_step=0.421, train/loss_vlb_step=0.003, train/loss_step=0.421, global_step=686.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  27%|██▋       | 332/1208 [09:35<25:19,  1.73s/it, loss=0.0917, v_num=0, train/loss_simple_step=0.421, train/loss_vlb_step=0.003, train/loss_step=0.421, global_step=686.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  27%|██▋       | 332/1208 [09:35<25:19,  1.73s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000475, train/loss_step=0.143, global_step=686.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  28%|██▊       | 333/1208 [09:36<25:16,  1.73s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000475, train/loss_step=0.143, global_step=686.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  28%|██▊       | 333/1208 [09:36<25:16,  1.73s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.0607, train/loss_vlb_step=0.000221, train/loss_step=0.0607, global_step=687.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  28%|██▊       | 334/1208 [09:37<25:12,  1.73s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.0607, train/loss_vlb_step=0.000221, train/loss_step=0.0607, global_step=687.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  28%|██▊       | 334/1208 [09:37<25:12,  1.73s/it, loss=0.095, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000479, train/loss_step=0.144, global_step=687.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  28%|██▊       | 335/1208 [09:38<25:08,  1.73s/it, loss=0.095, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000479, train/loss_step=0.144, global_step=687.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  28%|██▊       | 335/1208 [09:38<25:08,  1.73s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.48e-5, train/loss_step=0.0116, global_step=687.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  28%|██▊       | 336/1208 [09:41<25:10,  1.73s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.48e-5, train/loss_step=0.0116, global_step=687.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  28%|██▊       | 336/1208 [09:41<25:10,  1.73s/it, loss=0.0918, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=6.05e-5, train/loss_step=0.0132, global_step=687.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  28%|██▊       | 337/1208 [09:42<25:06,  1.73s/it, loss=0.0918, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=6.05e-5, train/loss_step=0.0132, global_step=687.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  28%|██▊       | 337/1208 [09:42<25:06,  1.73s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.0674, train/loss_vlb_step=0.00024, train/loss_step=0.0674, global_step=688.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  28%|██▊       | 338/1208 [09:43<25:02,  1.73s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.0674, train/loss_vlb_step=0.00024, train/loss_step=0.0674, global_step=688.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  28%|██▊       | 338/1208 [09:43<25:02,  1.73s/it, loss=0.099, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000742, train/loss_step=0.207, global_step=688.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  28%|██▊       | 339/1208 [09:44<24:59,  1.73s/it, loss=0.099, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000742, train/loss_step=0.207, global_step=688.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  28%|██▊       | 339/1208 [09:44<24:59,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0926, train/loss_vlb_step=0.000306, train/loss_step=0.0926, global_step=688.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  28%|██▊       | 340/1208 [09:47<25:00,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0926, train/loss_vlb_step=0.000306, train/loss_step=0.0926, global_step=688.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  28%|██▊       | 340/1208 [09:47<25:00,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00294, train/loss_step=0.412, global_step=688.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  28%|██▊       | 341/1208 [09:48<24:57,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00294, train/loss_step=0.412, global_step=688.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  28%|██▊       | 341/1208 [09:48<24:57,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00161, train/loss_step=0.329, global_step=689.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  28%|██▊       | 342/1208 [09:49<24:53,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00161, train/loss_step=0.329, global_step=689.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  28%|██▊       | 342/1208 [09:49<24:53,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000839, train/loss_step=0.198, global_step=689.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  28%|██▊       | 343/1208 [09:50<24:50,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000839, train/loss_step=0.198, global_step=689.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  28%|██▊       | 343/1208 [09:50<24:50,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.7e-5, train/loss_step=0.0122, global_step=689.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  28%|██▊       | 344/1208 [09:53<24:51,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.7e-5, train/loss_step=0.0122, global_step=689.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  28%|██▊       | 344/1208 [09:53<24:51,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.57e-5, train/loss_step=0.0123, global_step=689.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  29%|██▊       | 345/1208 [09:54<24:47,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.57e-5, train/loss_step=0.0123, global_step=689.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  29%|██▊       | 345/1208 [09:54<24:47,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0915, train/loss_vlb_step=0.000305, train/loss_step=0.0915, global_step=690.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  29%|██▊       | 346/1208 [09:55<24:44,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0915, train/loss_vlb_step=0.000305, train/loss_step=0.0915, global_step=690.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  29%|██▊       | 346/1208 [09:55<24:44,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000478, train/loss_step=0.140, global_step=690.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  29%|██▊       | 347/1208 [09:56<24:40,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000478, train/loss_step=0.140, global_step=690.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  29%|██▊       | 347/1208 [09:56<24:40,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00155, train/loss_step=0.322, global_step=690.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  29%|██▉       | 348/1208 [09:59<24:41,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00155, train/loss_step=0.322, global_step=690.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  29%|██▉       | 348/1208 [09:59<24:41,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00181, train/loss_step=0.325, global_step=690.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  29%|██▉       | 349/1208 [10:00<24:38,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00181, train/loss_step=0.325, global_step=690.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  29%|██▉       | 349/1208 [10:00<24:38,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00294, train/loss_step=0.395, global_step=691.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  29%|██▉       | 350/1208 [10:01<24:35,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00294, train/loss_step=0.395, global_step=691.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  29%|██▉       | 350/1208 [10:01<24:35,  1.72s/it, loss=0.193, v_num=0, train/loss_simple_step=0.463, train/loss_vlb_step=0.00336, train/loss_step=0.463, global_step=691.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  29%|██▉       | 351/1208 [10:02<24:31,  1.72s/it, loss=0.193, v_num=0, train/loss_simple_step=0.463, train/loss_vlb_step=0.00336, train/loss_step=0.463, global_step=691.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  29%|██▉       | 351/1208 [10:02<24:31,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000805, train/loss_step=0.220, global_step=691.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  29%|██▉       | 352/1208 [10:05<24:32,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000805, train/loss_step=0.220, global_step=691.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  29%|██▉       | 352/1208 [10:05<24:32,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0963, train/loss_vlb_step=0.000329, train/loss_step=0.0963, global_step=691.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  29%|██▉       | 353/1208 [10:06<24:29,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0963, train/loss_vlb_step=0.000329, train/loss_step=0.0963, global_step=691.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  29%|██▉       | 353/1208 [10:06<24:29,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000394, train/loss_step=0.120, global_step=692.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  29%|██▉       | 354/1208 [10:07<24:25,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000394, train/loss_step=0.120, global_step=692.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  29%|██▉       | 354/1208 [10:07<24:25,  1.72s/it, loss=0.205, v_num=0, train/loss_simple_step=0.571, train/loss_vlb_step=0.00789, train/loss_step=0.571, global_step=692.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  29%|██▉       | 355/1208 [10:08<24:22,  1.71s/it, loss=0.205, v_num=0, train/loss_simple_step=0.571, train/loss_vlb_step=0.00789, train/loss_step=0.571, global_step=692.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  29%|██▉       | 355/1208 [10:08<24:22,  1.71s/it, loss=0.205, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=2.47e-5, train/loss_step=0.00469, global_step=692.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  29%|██▉       | 356/1208 [10:11<24:23,  1.72s/it, loss=0.205, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=2.47e-5, train/loss_step=0.00469, global_step=692.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  29%|██▉       | 356/1208 [10:11<24:23,  1.72s/it, loss=0.213, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000599, train/loss_step=0.172, global_step=692.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  30%|██▉       | 357/1208 [10:12<24:20,  1.72s/it, loss=0.213, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000599, train/loss_step=0.172, global_step=692.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  30%|██▉       | 357/1208 [10:12<24:20,  1.72s/it, loss=0.217, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000571, train/loss_step=0.164, global_step=693.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  30%|██▉       | 358/1208 [10:13<24:16,  1.71s/it, loss=0.217, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000571, train/loss_step=0.164, global_step=693.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  30%|██▉       | 358/1208 [10:13<24:16,  1.71s/it, loss=0.222, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00143, train/loss_step=0.304, global_step=693.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  30%|██▉       | 359/1208 [10:14<24:13,  1.71s/it, loss=0.222, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00143, train/loss_step=0.304, global_step=693.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  30%|██▉       | 359/1208 [10:14<24:13,  1.71s/it, loss=0.23, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.001, train/loss_step=0.255, global_step=693.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  30%|██▉       | 360/1208 [10:17<24:14,  1.72s/it, loss=0.23, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.001, train/loss_step=0.255, global_step=693.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  30%|██▉       | 360/1208 [10:17<24:14,  1.72s/it, loss=0.212, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000148, train/loss_step=0.0392, global_step=693.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  30%|██▉       | 361/1208 [10:18<24:11,  1.71s/it, loss=0.212, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000148, train/loss_step=0.0392, global_step=693.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  30%|██▉       | 361/1208 [10:18<24:11,  1.71s/it, loss=0.215, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.0026, train/loss_step=0.398, global_step=694.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  30%|██▉       | 362/1208 [10:19<24:07,  1.71s/it, loss=0.215, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.0026, train/loss_step=0.398, global_step=694.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  30%|██▉       | 362/1208 [10:19<24:07,  1.71s/it, loss=0.205, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=1.17e-5, train/loss_step=0.00196, global_step=694.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  30%|███       | 363/1208 [10:20<24:04,  1.71s/it, loss=0.205, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=1.17e-5, train/loss_step=0.00196, global_step=694.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  30%|███       | 363/1208 [10:20<24:04,  1.71s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.17e-5, train/loss_step=0.0123, global_step=694.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  30%|███       | 364/1208 [10:23<24:05,  1.71s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.17e-5, train/loss_step=0.0123, global_step=694.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  30%|███       | 364/1208 [10:23<24:05,  1.71s/it, loss=0.226, v_num=0, train/loss_simple_step=0.416, train/loss_vlb_step=0.00313, train/loss_step=0.416, global_step=694.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  30%|███       | 365/1208 [10:24<24:02,  1.71s/it, loss=0.226, v_num=0, train/loss_simple_step=0.416, train/loss_vlb_step=0.00313, train/loss_step=0.416, global_step=694.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  30%|███       | 365/1208 [10:24<24:02,  1.71s/it, loss=0.223, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.000181, train/loss_step=0.0499, global_step=695.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  30%|███       | 366/1208 [10:25<23:58,  1.71s/it, loss=0.223, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.000181, train/loss_step=0.0499, global_step=695.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  30%|███       | 366/1208 [10:25<23:58,  1.71s/it, loss=0.217, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=2.02e-5, train/loss_step=0.00361, global_step=695.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  30%|███       | 367/1208 [10:26<23:55,  1.71s/it, loss=0.217, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=2.02e-5, train/loss_step=0.00361, global_step=695.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  30%|███       | 367/1208 [10:26<23:55,  1.71s/it, loss=0.207, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=695.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  30%|███       | 368/1208 [10:29<23:56,  1.71s/it, loss=0.207, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=695.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  30%|███       | 368/1208 [10:29<23:56,  1.71s/it, loss=0.2, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000706, train/loss_step=0.188, global_step=695.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  31%|███       | 369/1208 [10:30<23:53,  1.71s/it, loss=0.2, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000706, train/loss_step=0.188, global_step=695.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  31%|███       | 369/1208 [10:30<23:53,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.64e-5, train/loss_step=0.00281, global_step=696.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  31%|███       | 370/1208 [10:31<23:49,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.64e-5, train/loss_step=0.00281, global_step=696.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  31%|███       | 370/1208 [10:31<23:49,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.00238, train/loss_step=0.400, global_step=696.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  31%|███       | 371/1208 [10:32<23:46,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.00238, train/loss_step=0.400, global_step=696.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  31%|███       | 371/1208 [10:32<23:46,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000119, train/loss_step=0.0319, global_step=696.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  31%|███       | 372/1208 [10:35<23:48,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000119, train/loss_step=0.0319, global_step=696.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  31%|███       | 372/1208 [10:35<23:48,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.52e-5, train/loss_step=0.0122, global_step=696.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  31%|███       | 373/1208 [10:36<23:45,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.52e-5, train/loss_step=0.0122, global_step=696.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  31%|███       | 373/1208 [10:36<23:45,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000361, train/loss_step=0.110, global_step=697.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  31%|███       | 374/1208 [10:37<23:42,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000361, train/loss_step=0.110, global_step=697.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  31%|███       | 374/1208 [10:37<23:42,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00672, train/loss_vlb_step=3.27e-5, train/loss_step=0.00672, global_step=697.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  31%|███       | 375/1208 [10:38<23:38,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00672, train/loss_vlb_step=3.27e-5, train/loss_step=0.00672, global_step=697.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  31%|███       | 375/1208 [10:38<23:38,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00551, train/loss_vlb_step=2.84e-5, train/loss_step=0.00551, global_step=697.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  31%|███       | 376/1208 [10:41<23:40,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00551, train/loss_vlb_step=2.84e-5, train/loss_step=0.00551, global_step=697.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  31%|███       | 376/1208 [10:41<23:40,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000491, train/loss_step=0.148, global_step=697.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  31%|███       | 377/1208 [10:43<23:37,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000491, train/loss_step=0.148, global_step=697.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  31%|███       | 377/1208 [10:43<23:37,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0663, train/loss_vlb_step=0.000225, train/loss_step=0.0663, global_step=698.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  31%|███▏      | 378/1208 [10:44<23:34,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0663, train/loss_vlb_step=0.000225, train/loss_step=0.0663, global_step=698.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  31%|███▏      | 378/1208 [10:44<23:34,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.54e-5, train/loss_step=0.0155, global_step=698.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  31%|███▏      | 379/1208 [10:45<23:31,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.54e-5, train/loss_step=0.0155, global_step=698.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  31%|███▏      | 379/1208 [10:45<23:31,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00201, train/loss_step=0.378, global_step=698.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  31%|███▏      | 380/1208 [10:48<23:32,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00201, train/loss_step=0.378, global_step=698.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  31%|███▏      | 380/1208 [10:48<23:32,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000634, train/loss_step=0.179, global_step=698.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  32%|███▏      | 381/1208 [10:49<23:29,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000634, train/loss_step=0.179, global_step=698.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  32%|███▏      | 381/1208 [10:49<23:29,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=699.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  32%|███▏      | 382/1208 [10:50<23:26,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=699.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  32%|███▏      | 382/1208 [10:50<23:26,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.772, train/loss_vlb_step=0.031, train/loss_step=0.772, global_step=699.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  32%|███▏      | 383/1208 [10:51<23:23,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.772, train/loss_vlb_step=0.031, train/loss_step=0.772, global_step=699.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  32%|███▏      | 383/1208 [10:51<23:23,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.000135, train/loss_step=0.0352, global_step=699.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  32%|███▏      | 384/1208 [10:54<23:24,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.000135, train/loss_step=0.0352, global_step=699.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  32%|███▏      | 384/1208 [10:54<23:24,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000933, train/loss_step=0.239, global_step=699.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  32%|███▏      | 385/1208 [10:55<23:21,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000933, train/loss_step=0.239, global_step=699.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  32%|███▏      | 385/1208 [10:55<23:21,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00122, train/loss_step=0.286, global_step=700.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  32%|███▏      | 386/1208 [10:56<23:18,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00122, train/loss_step=0.286, global_step=700.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  32%|███▏      | 386/1208 [10:56<23:18,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=2.27e-5, train/loss_step=0.00413, global_step=700.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  32%|███▏      | 387/1208 [10:57<23:15,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=2.27e-5, train/loss_step=0.00413, global_step=700.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  32%|███▏      | 387/1208 [10:57<23:15,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0516, train/loss_vlb_step=0.00019, train/loss_step=0.0516, global_step=700.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  32%|███▏      | 388/1208 [11:01<23:17,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0516, train/loss_vlb_step=0.00019, train/loss_step=0.0516, global_step=700.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  32%|███▏      | 388/1208 [11:01<23:17,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.94e-5, train/loss_step=0.0156, global_step=700.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  32%|███▏      | 389/1208 [11:02<23:14,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.94e-5, train/loss_step=0.0156, global_step=700.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  32%|███▏      | 389/1208 [11:02<23:14,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000136, train/loss_step=0.0386, global_step=701.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  32%|███▏      | 390/1208 [11:03<23:11,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000136, train/loss_step=0.0386, global_step=701.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  32%|███▏      | 390/1208 [11:03<23:11,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0626, train/loss_vlb_step=0.000215, train/loss_step=0.0626, global_step=701.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  32%|███▏      | 391/1208 [11:04<23:07,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0626, train/loss_vlb_step=0.000215, train/loss_step=0.0626, global_step=701.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  32%|███▏      | 391/1208 [11:04<23:07,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000435, train/loss_step=0.131, global_step=701.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  32%|███▏      | 392/1208 [11:07<23:09,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000435, train/loss_step=0.131, global_step=701.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  32%|███▏      | 392/1208 [11:07<23:09,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000151, train/loss_step=0.0412, global_step=701.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  33%|███▎      | 393/1208 [11:08<23:06,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000151, train/loss_step=0.0412, global_step=701.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  33%|███▎      | 393/1208 [11:08<23:06,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000431, train/loss_step=0.131, global_step=702.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  33%|███▎      | 394/1208 [11:09<23:03,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000431, train/loss_step=0.131, global_step=702.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  33%|███▎      | 394/1208 [11:09<23:03,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=1.08e-5, train/loss_step=0.00179, global_step=702.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  33%|███▎      | 395/1208 [11:10<23:00,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=1.08e-5, train/loss_step=0.00179, global_step=702.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  33%|███▎      | 395/1208 [11:10<23:00,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000135, train/loss_step=0.0361, global_step=702.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  33%|███▎      | 396/1208 [11:13<23:01,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000135, train/loss_step=0.0361, global_step=702.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  33%|███▎      | 396/1208 [11:13<23:01,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.000957, train/loss_step=0.260, global_step=702.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  33%|███▎      | 397/1208 [11:14<22:58,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.000957, train/loss_step=0.260, global_step=702.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  33%|███▎      | 397/1208 [11:14<22:58,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000371, train/loss_step=0.113, global_step=703.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  33%|███▎      | 398/1208 [11:15<22:55,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000371, train/loss_step=0.113, global_step=703.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  33%|███▎      | 398/1208 [11:15<22:55,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00233, train/loss_step=0.336, global_step=703.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  33%|███▎      | 399/1208 [11:16<22:52,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00233, train/loss_step=0.336, global_step=703.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  33%|███▎      | 399/1208 [11:16<22:52,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0645, train/loss_vlb_step=0.000223, train/loss_step=0.0645, global_step=703.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  33%|███▎      | 400/1208 [11:20<22:53,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0645, train/loss_vlb_step=0.000223, train/loss_step=0.0645, global_step=703.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  33%|███▎      | 400/1208 [11:20<22:53,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000579, train/loss_step=0.173, global_step=703.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  33%|███▎      | 401/1208 [11:21<22:50,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000579, train/loss_step=0.173, global_step=703.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  33%|███▎      | 401/1208 [11:21<22:50,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000825, train/loss_step=0.211, global_step=704.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  33%|███▎      | 402/1208 [11:22<22:47,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000825, train/loss_step=0.211, global_step=704.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  33%|███▎      | 402/1208 [11:22<22:47,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000694, train/loss_step=0.190, global_step=704.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  33%|███▎      | 403/1208 [11:23<22:44,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000694, train/loss_step=0.190, global_step=704.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  33%|███▎      | 403/1208 [11:23<22:44,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0422, train/loss_vlb_step=0.000152, train/loss_step=0.0422, global_step=704.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  33%|███▎      | 404/1208 [11:26<22:46,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0422, train/loss_vlb_step=0.000152, train/loss_step=0.0422, global_step=704.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  33%|███▎      | 404/1208 [11:26<22:46,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=8.97e-5, train/loss_step=0.0217, global_step=704.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  34%|███▎      | 405/1208 [11:27<22:43,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=8.97e-5, train/loss_step=0.0217, global_step=704.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  34%|███▎      | 405/1208 [11:27<22:43,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.459, train/loss_vlb_step=0.00816, train/loss_step=0.459, global_step=705.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  34%|███▎      | 406/1208 [11:28<22:40,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.459, train/loss_vlb_step=0.00816, train/loss_step=0.459, global_step=705.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  34%|███▎      | 406/1208 [11:28<22:40,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=705.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  34%|███▎      | 407/1208 [11:29<22:37,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=705.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  34%|███▎      | 407/1208 [11:29<22:37,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.00049, train/loss_step=0.148, global_step=705.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  34%|███▍      | 408/1208 [11:32<22:38,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.00049, train/loss_step=0.148, global_step=705.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  34%|███▍      | 408/1208 [11:32<22:38,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.00108, train/loss_step=0.228, global_step=705.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  34%|███▍      | 409/1208 [11:33<22:35,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.00108, train/loss_step=0.228, global_step=705.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  34%|███▍      | 409/1208 [11:33<22:35,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00165, train/loss_step=0.307, global_step=706.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  34%|███▍      | 410/1208 [11:35<22:32,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00165, train/loss_step=0.307, global_step=706.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  34%|███▍      | 410/1208 [11:35<22:32,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00167, train/loss_step=0.311, global_step=706.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  34%|███▍      | 411/1208 [11:36<22:29,  1.69s/it, loss=0.166, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00167, train/loss_step=0.311, global_step=706.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  34%|███▍      | 411/1208 [11:36<22:29,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000702, train/loss_step=0.197, global_step=706.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  34%|███▍      | 412/1208 [11:39<22:31,  1.70s/it, loss=0.169, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000702, train/loss_step=0.197, global_step=706.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  34%|███▍      | 412/1208 [11:39<22:31,  1.70s/it, loss=0.174, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000422, train/loss_step=0.128, global_step=706.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  34%|███▍      | 413/1208 [11:40<22:28,  1.70s/it, loss=0.174, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000422, train/loss_step=0.128, global_step=706.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  34%|███▍      | 413/1208 [11:40<22:28,  1.70s/it, loss=0.174, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.00049, train/loss_step=0.146, global_step=707.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  34%|███▍      | 414/1208 [11:41<22:25,  1.69s/it, loss=0.174, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.00049, train/loss_step=0.146, global_step=707.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  34%|███▍      | 414/1208 [11:41<22:25,  1.69s/it, loss=0.176, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.000126, train/loss_step=0.032, global_step=707.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  34%|███▍      | 415/1208 [11:42<22:22,  1.69s/it, loss=0.176, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.000126, train/loss_step=0.032, global_step=707.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  34%|███▍      | 415/1208 [11:42<22:22,  1.69s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000139, train/loss_step=0.0407, global_step=707.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  34%|███▍      | 416/1208 [11:45<22:23,  1.70s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000139, train/loss_step=0.0407, global_step=707.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  34%|███▍      | 416/1208 [11:45<22:23,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00437, train/loss_vlb_step=2.36e-5, train/loss_step=0.00437, global_step=707.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  35%|███▍      | 417/1208 [11:46<22:20,  1.69s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00437, train/loss_vlb_step=2.36e-5, train/loss_step=0.00437, global_step=707.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  35%|███▍      | 417/1208 [11:46<22:20,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000146, train/loss_step=0.0399, global_step=708.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  35%|███▍      | 418/1208 [11:47<22:17,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000146, train/loss_step=0.0399, global_step=708.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  35%|███▍      | 418/1208 [11:47<22:17,  1.69s/it, loss=0.166, v_num=0, train/loss_simple_step=0.456, train/loss_vlb_step=0.00391, train/loss_step=0.456, global_step=708.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  35%|███▍      | 419/1208 [11:48<22:14,  1.69s/it, loss=0.166, v_num=0, train/loss_simple_step=0.456, train/loss_vlb_step=0.00391, train/loss_step=0.456, global_step=708.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  35%|███▍      | 419/1208 [11:48<22:14,  1.69s/it, loss=0.177, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00129, train/loss_step=0.292, global_step=708.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  35%|███▍      | 420/1208 [11:52<22:16,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00129, train/loss_step=0.292, global_step=708.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  35%|███▍      | 420/1208 [11:52<22:16,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0581, train/loss_vlb_step=0.000198, train/loss_step=0.0581, global_step=708.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  35%|███▍      | 421/1208 [11:53<22:13,  1.69s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0581, train/loss_vlb_step=0.000198, train/loss_step=0.0581, global_step=708.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  35%|███▍      | 421/1208 [11:53<22:13,  1.69s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0794, train/loss_vlb_step=0.000271, train/loss_step=0.0794, global_step=709.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  35%|███▍      | 422/1208 [11:54<22:10,  1.69s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0794, train/loss_vlb_step=0.000271, train/loss_step=0.0794, global_step=709.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  35%|███▍      | 422/1208 [11:54<22:10,  1.69s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00708, train/loss_vlb_step=3.57e-5, train/loss_step=0.00708, global_step=709.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  35%|███▌      | 423/1208 [11:55<22:07,  1.69s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00708, train/loss_vlb_step=3.57e-5, train/loss_step=0.00708, global_step=709.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  35%|███▌      | 423/1208 [11:55<22:07,  1.69s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0616, train/loss_vlb_step=0.00022, train/loss_step=0.0616, global_step=709.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  35%|███▌      | 424/1208 [11:58<22:08,  1.69s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0616, train/loss_vlb_step=0.00022, train/loss_step=0.0616, global_step=709.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  35%|███▌      | 424/1208 [11:58<22:08,  1.69s/it, loss=0.162, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000405, train/loss_step=0.123, global_step=709.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  35%|███▌      | 425/1208 [11:59<22:05,  1.69s/it, loss=0.162, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000405, train/loss_step=0.123, global_step=709.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  35%|███▌      | 425/1208 [11:59<22:05,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=1.1e-5, train/loss_step=0.0019, global_step=710.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  35%|███▌      | 426/1208 [12:00<22:02,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=1.1e-5, train/loss_step=0.0019, global_step=710.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  35%|███▌      | 426/1208 [12:00<22:02,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00538, train/loss_vlb_step=2.93e-5, train/loss_step=0.00538, global_step=710.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  35%|███▌      | 427/1208 [12:01<21:59,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00538, train/loss_vlb_step=2.93e-5, train/loss_step=0.00538, global_step=710.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  35%|███▌      | 427/1208 [12:01<21:59,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000855, train/loss_step=0.227, global_step=710.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  35%|███▌      | 428/1208 [12:04<22:01,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000855, train/loss_step=0.227, global_step=710.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  35%|███▌      | 428/1208 [12:04<22:01,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000108, train/loss_step=0.0263, global_step=710.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  36%|███▌      | 429/1208 [12:06<21:58,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000108, train/loss_step=0.0263, global_step=710.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  36%|███▌      | 429/1208 [12:06<21:58,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00105, train/loss_step=0.251, global_step=711.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  36%|███▌      | 430/1208 [12:07<21:55,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00105, train/loss_step=0.251, global_step=711.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  36%|███▌      | 430/1208 [12:07<21:55,  1.69s/it, loss=0.122, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00129, train/loss_step=0.269, global_step=711.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  36%|███▌      | 431/1208 [12:08<21:52,  1.69s/it, loss=0.122, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00129, train/loss_step=0.269, global_step=711.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  36%|███▌      | 431/1208 [12:08<21:52,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0572, train/loss_vlb_step=0.000196, train/loss_step=0.0572, global_step=711.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  36%|███▌      | 432/1208 [12:11<21:53,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0572, train/loss_vlb_step=0.000196, train/loss_step=0.0572, global_step=711.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  36%|███▌      | 432/1208 [12:11<21:53,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00229, train/loss_step=0.351, global_step=711.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  36%|███▌      | 433/1208 [12:12<21:50,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00229, train/loss_step=0.351, global_step=711.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  36%|███▌      | 433/1208 [12:12<21:50,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=8.01e-5, train/loss_step=0.0192, global_step=712.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  36%|███▌      | 434/1208 [12:13<21:47,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=8.01e-5, train/loss_step=0.0192, global_step=712.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  36%|███▌      | 434/1208 [12:13<21:47,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000103, train/loss_step=0.0274, global_step=712.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  36%|███▌      | 435/1208 [12:14<21:45,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000103, train/loss_step=0.0274, global_step=712.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  36%|███▌      | 435/1208 [12:14<21:45,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000145, train/loss_step=0.0369, global_step=712.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  36%|███▌      | 436/1208 [12:17<21:46,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000145, train/loss_step=0.0369, global_step=712.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  36%|███▌      | 436/1208 [12:17<21:46,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.84e-5, train/loss_step=0.0101, global_step=712.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  36%|███▌      | 437/1208 [12:18<21:43,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.84e-5, train/loss_step=0.0101, global_step=712.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  36%|███▌      | 437/1208 [12:18<21:43,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000469, train/loss_step=0.139, global_step=713.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  36%|███▋      | 438/1208 [12:19<21:40,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000469, train/loss_step=0.139, global_step=713.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  36%|███▋      | 438/1208 [12:19<21:40,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00103, train/loss_step=0.252, global_step=713.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  36%|███▋      | 439/1208 [12:20<21:37,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00103, train/loss_step=0.252, global_step=713.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  36%|███▋      | 439/1208 [12:20<21:37,  1.69s/it, loss=0.109, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000586, train/loss_step=0.169, global_step=713.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  36%|███▋      | 440/1208 [12:24<21:38,  1.69s/it, loss=0.109, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000586, train/loss_step=0.169, global_step=713.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  36%|███▋      | 440/1208 [12:24<21:38,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000112, train/loss_step=0.0286, global_step=713.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  37%|███▋      | 441/1208 [12:25<21:35,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000112, train/loss_step=0.0286, global_step=713.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  37%|███▋      | 441/1208 [12:25<21:35,  1.69s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.75e-5, train/loss_step=0.0155, global_step=714.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  37%|███▋      | 442/1208 [12:26<21:33,  1.69s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.75e-5, train/loss_step=0.0155, global_step=714.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  37%|███▋      | 442/1208 [12:26<21:33,  1.69s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.25e-5, train/loss_step=0.0108, global_step=714.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  37%|███▋      | 443/1208 [12:27<21:30,  1.69s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.25e-5, train/loss_step=0.0108, global_step=714.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  37%|███▋      | 443/1208 [12:27<21:30,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00115, train/loss_step=0.277, global_step=714.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  37%|███▋      | 444/1208 [12:30<21:31,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00115, train/loss_step=0.277, global_step=714.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  37%|███▋      | 444/1208 [12:30<21:31,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000843, train/loss_step=0.223, global_step=714.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  37%|███▋      | 445/1208 [12:31<21:28,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000843, train/loss_step=0.223, global_step=714.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  37%|███▋      | 445/1208 [12:31<21:28,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000843, train/loss_step=0.214, global_step=715.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  37%|███▋      | 446/1208 [12:32<21:25,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000843, train/loss_step=0.214, global_step=715.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  37%|███▋      | 446/1208 [12:32<21:25,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.000102, train/loss_step=0.0256, global_step=715.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  37%|███▋      | 447/1208 [12:33<21:23,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.000102, train/loss_step=0.0256, global_step=715.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  37%|███▋      | 447/1208 [12:33<21:23,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0666, train/loss_vlb_step=0.000226, train/loss_step=0.0666, global_step=715.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  37%|███▋      | 448/1208 [12:36<21:24,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0666, train/loss_vlb_step=0.000226, train/loss_step=0.0666, global_step=715.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  37%|███▋      | 448/1208 [12:36<21:24,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000102, train/loss_step=0.026, global_step=715.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  37%|███▋      | 449/1208 [12:37<21:21,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000102, train/loss_step=0.026, global_step=715.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  37%|███▋      | 449/1208 [12:37<21:21,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.55e-5, train/loss_step=0.013, global_step=716.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  37%|███▋      | 450/1208 [12:39<21:18,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.55e-5, train/loss_step=0.013, global_step=716.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  37%|███▋      | 450/1208 [12:39<21:18,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0743, train/loss_vlb_step=0.000246, train/loss_step=0.0743, global_step=716.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  37%|███▋      | 451/1208 [12:40<21:15,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0743, train/loss_vlb_step=0.000246, train/loss_step=0.0743, global_step=716.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  37%|███▋      | 451/1208 [12:40<21:15,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.522, train/loss_vlb_step=0.0081, train/loss_step=0.522, global_step=716.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  37%|███▋      | 452/1208 [12:43<21:16,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.522, train/loss_vlb_step=0.0081, train/loss_step=0.522, global_step=716.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  37%|███▋      | 452/1208 [12:43<21:16,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.48e-5, train/loss_step=0.0101, global_step=716.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  38%|███▊      | 453/1208 [12:44<21:13,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.48e-5, train/loss_step=0.0101, global_step=716.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  38%|███▊      | 453/1208 [12:44<21:13,  1.69s/it, loss=0.122, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.0014, train/loss_step=0.293, global_step=717.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  38%|███▊      | 454/1208 [12:45<21:11,  1.69s/it, loss=0.122, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.0014, train/loss_step=0.293, global_step=717.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  38%|███▊      | 454/1208 [12:45<21:11,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00145, train/loss_step=0.293, global_step=717.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  38%|███▊      | 455/1208 [12:46<21:08,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00145, train/loss_step=0.293, global_step=717.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  38%|███▊      | 455/1208 [12:46<21:08,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0323, train/loss_vlb_step=0.000121, train/loss_step=0.0323, global_step=717.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  38%|███▊      | 456/1208 [12:49<21:09,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0323, train/loss_vlb_step=0.000121, train/loss_step=0.0323, global_step=717.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  38%|███▊      | 456/1208 [12:49<21:09,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000922, train/loss_step=0.235, global_step=717.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  38%|███▊      | 457/1208 [12:50<21:06,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000922, train/loss_step=0.235, global_step=717.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  38%|███▊      | 457/1208 [12:50<21:06,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=7.1e-5, train/loss_step=0.0158, global_step=718.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  38%|███▊      | 458/1208 [12:51<21:03,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=7.1e-5, train/loss_step=0.0158, global_step=718.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  38%|███▊      | 458/1208 [12:51<21:03,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0323, train/loss_vlb_step=0.000124, train/loss_step=0.0323, global_step=718.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  38%|███▊      | 459/1208 [12:52<21:01,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0323, train/loss_vlb_step=0.000124, train/loss_step=0.0323, global_step=718.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  38%|███▊      | 459/1208 [12:52<21:01,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=718.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  38%|███▊      | 460/1208 [12:56<21:01,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=718.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  38%|███▊      | 460/1208 [12:56<21:01,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00138, train/loss_step=0.281, global_step=718.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  38%|███▊      | 461/1208 [12:57<20:59,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00138, train/loss_step=0.281, global_step=718.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  38%|███▊      | 461/1208 [12:57<20:59,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0404, train/loss_vlb_step=0.000147, train/loss_step=0.0404, global_step=719.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  38%|███▊      | 462/1208 [12:58<20:56,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0404, train/loss_vlb_step=0.000147, train/loss_step=0.0404, global_step=719.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  38%|███▊      | 462/1208 [12:58<20:56,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.88e-5, train/loss_step=0.0106, global_step=719.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  38%|███▊      | 463/1208 [12:59<20:53,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.88e-5, train/loss_step=0.0106, global_step=719.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  38%|███▊      | 463/1208 [12:59<20:53,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.34e-5, train/loss_step=0.0166, global_step=719.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  38%|███▊      | 464/1208 [13:02<20:54,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.34e-5, train/loss_step=0.0166, global_step=719.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  38%|███▊      | 464/1208 [13:02<20:54,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0757, train/loss_vlb_step=0.000257, train/loss_step=0.0757, global_step=719.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  38%|███▊      | 465/1208 [13:03<20:51,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0757, train/loss_vlb_step=0.000257, train/loss_step=0.0757, global_step=719.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  38%|███▊      | 465/1208 [13:03<20:51,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.070, train/loss_vlb_step=0.000237, train/loss_step=0.070, global_step=720.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  39%|███▊      | 466/1208 [13:04<20:49,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.070, train/loss_vlb_step=0.000237, train/loss_step=0.070, global_step=720.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  39%|███▊      | 466/1208 [13:04<20:49,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000903, train/loss_step=0.237, global_step=720.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  39%|███▊      | 467/1208 [13:05<20:46,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000903, train/loss_step=0.237, global_step=720.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  39%|███▊      | 467/1208 [13:05<20:46,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00347, train/loss_step=0.423, global_step=720.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  39%|███▊      | 468/1208 [13:08<20:47,  1.69s/it, loss=0.141, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00347, train/loss_step=0.423, global_step=720.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  39%|███▊      | 468/1208 [13:08<20:47,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.95e-5, train/loss_step=0.013, global_step=720.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  39%|███▉      | 469/1208 [13:09<20:44,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.95e-5, train/loss_step=0.013, global_step=720.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  39%|███▉      | 469/1208 [13:09<20:44,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00171, train/loss_step=0.343, global_step=721.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  39%|███▉      | 470/1208 [13:10<20:42,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00171, train/loss_step=0.343, global_step=721.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  39%|███▉      | 470/1208 [13:10<20:42,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.96e-5, train/loss_step=0.00342, global_step=721.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  39%|███▉      | 471/1208 [13:12<20:39,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.96e-5, train/loss_step=0.00342, global_step=721.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  39%|███▉      | 471/1208 [13:12<20:39,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00174, train/loss_step=0.317, global_step=721.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  39%|███▉      | 472/1208 [13:15<20:39,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00174, train/loss_step=0.317, global_step=721.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  39%|███▉      | 472/1208 [13:15<20:40,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=9.94e-5, train/loss_step=0.0257, global_step=721.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  39%|███▉      | 473/1208 [13:16<20:37,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=9.94e-5, train/loss_step=0.0257, global_step=721.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  39%|███▉      | 473/1208 [13:16<20:37,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.11e-5, train/loss_step=0.011, global_step=722.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  39%|███▉      | 474/1208 [13:17<20:34,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.11e-5, train/loss_step=0.011, global_step=722.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  39%|███▉      | 474/1208 [13:17<20:34,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=1.73e-5, train/loss_step=0.00302, global_step=722.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  39%|███▉      | 475/1208 [13:18<20:32,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=1.73e-5, train/loss_step=0.00302, global_step=722.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  39%|███▉      | 475/1208 [13:18<20:32,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.459, train/loss_vlb_step=0.005, train/loss_step=0.459, global_step=722.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]      Epoch 2:  39%|███▉      | 476/1208 [13:21<20:32,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.459, train/loss_vlb_step=0.005, train/loss_step=0.459, global_step=722.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  39%|███▉      | 476/1208 [13:21<20:32,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0962, train/loss_vlb_step=0.000318, train/loss_step=0.0962, global_step=722.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  39%|███▉      | 477/1208 [13:22<20:30,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0962, train/loss_vlb_step=0.000318, train/loss_step=0.0962, global_step=722.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  39%|███▉      | 477/1208 [13:22<20:30,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000342, train/loss_step=0.103, global_step=723.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  40%|███▉      | 478/1208 [13:23<20:27,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000342, train/loss_step=0.103, global_step=723.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  40%|███▉      | 478/1208 [13:23<20:27,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=1.44e-5, train/loss_step=0.0024, global_step=723.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  40%|███▉      | 479/1208 [13:24<20:24,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=1.44e-5, train/loss_step=0.0024, global_step=723.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  40%|███▉      | 479/1208 [13:24<20:24,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0966, train/loss_vlb_step=0.000318, train/loss_step=0.0966, global_step=723.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  40%|███▉      | 480/1208 [13:28<20:25,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0966, train/loss_vlb_step=0.000318, train/loss_step=0.0966, global_step=723.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  40%|███▉      | 480/1208 [13:28<20:25,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00151, train/loss_step=0.287, global_step=723.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  40%|███▉      | 481/1208 [13:29<20:22,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00151, train/loss_step=0.287, global_step=723.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  40%|███▉      | 481/1208 [13:29<20:22,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000816, train/loss_step=0.210, global_step=724.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  40%|███▉      | 482/1208 [13:30<20:20,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000816, train/loss_step=0.210, global_step=724.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  40%|███▉      | 482/1208 [13:30<20:20,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000564, train/loss_step=0.163, global_step=724.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  40%|███▉      | 483/1208 [13:31<20:17,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000564, train/loss_step=0.163, global_step=724.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  40%|███▉      | 483/1208 [13:31<20:17,  1.68s/it, loss=0.167, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.0037, train/loss_step=0.407, global_step=724.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  40%|████      | 484/1208 [13:34<20:18,  1.68s/it, loss=0.167, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.0037, train/loss_step=0.407, global_step=724.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  40%|████      | 484/1208 [13:34<20:18,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=2.46e-5, train/loss_step=0.00451, global_step=724.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  40%|████      | 485/1208 [13:35<20:15,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=2.46e-5, train/loss_step=0.00451, global_step=724.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  40%|████      | 485/1208 [13:35<20:15,  1.68s/it, loss=0.167, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000461, train/loss_step=0.140, global_step=725.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  40%|████      | 486/1208 [13:36<20:13,  1.68s/it, loss=0.167, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000461, train/loss_step=0.140, global_step=725.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  40%|████      | 486/1208 [13:36<20:13,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000507, train/loss_step=0.151, global_step=725.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  40%|████      | 487/1208 [13:37<20:10,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000507, train/loss_step=0.151, global_step=725.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  40%|████      | 487/1208 [13:37<20:10,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=9.18e-5, train/loss_step=0.022, global_step=725.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  40%|████      | 488/1208 [13:40<20:11,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=9.18e-5, train/loss_step=0.022, global_step=725.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  40%|████      | 488/1208 [13:40<20:11,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000497, train/loss_step=0.150, global_step=725.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  40%|████      | 489/1208 [13:42<20:08,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000497, train/loss_step=0.150, global_step=725.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  40%|████      | 489/1208 [13:42<20:08,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00221, train/loss_step=0.355, global_step=726.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  41%|████      | 490/1208 [13:43<20:06,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00221, train/loss_step=0.355, global_step=726.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  41%|████      | 490/1208 [13:43<20:06,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000824, train/loss_step=0.226, global_step=726.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  41%|████      | 491/1208 [13:44<20:03,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000824, train/loss_step=0.226, global_step=726.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  41%|████      | 491/1208 [13:44<20:03,  1.68s/it, loss=0.17, v_num=0, train/loss_simple_step=0.482, train/loss_vlb_step=0.00467, train/loss_step=0.482, global_step=726.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  41%|████      | 492/1208 [13:47<20:04,  1.68s/it, loss=0.17, v_num=0, train/loss_simple_step=0.482, train/loss_vlb_step=0.00467, train/loss_step=0.482, global_step=726.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  41%|████      | 492/1208 [13:47<20:04,  1.68s/it, loss=0.178, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000636, train/loss_step=0.189, global_step=726.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  41%|████      | 493/1208 [13:48<20:01,  1.68s/it, loss=0.178, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000636, train/loss_step=0.189, global_step=726.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  41%|████      | 493/1208 [13:48<20:01,  1.68s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0507, train/loss_vlb_step=0.000179, train/loss_step=0.0507, global_step=727.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  41%|████      | 494/1208 [13:49<19:58,  1.68s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0507, train/loss_vlb_step=0.000179, train/loss_step=0.0507, global_step=727.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  41%|████      | 494/1208 [13:49<19:58,  1.68s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=9.22e-5, train/loss_step=0.0218, global_step=727.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  41%|████      | 495/1208 [13:50<19:56,  1.68s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=9.22e-5, train/loss_step=0.0218, global_step=727.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  41%|████      | 495/1208 [13:50<19:56,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0079, train/loss_vlb_step=3.86e-5, train/loss_step=0.0079, global_step=727.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  41%|████      | 496/1208 [13:53<19:56,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0079, train/loss_vlb_step=3.86e-5, train/loss_step=0.0079, global_step=727.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  41%|████      | 496/1208 [13:53<19:56,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=3.7e-5, train/loss_step=0.0072, global_step=727.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  41%|████      | 497/1208 [13:54<19:54,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=3.7e-5, train/loss_step=0.0072, global_step=727.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  41%|████      | 497/1208 [13:54<19:54,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.00012, train/loss_step=0.0312, global_step=728.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  41%|████      | 498/1208 [13:55<19:51,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.00012, train/loss_step=0.0312, global_step=728.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  41%|████      | 498/1208 [13:55<19:51,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0659, train/loss_vlb_step=0.000228, train/loss_step=0.0659, global_step=728.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  41%|████▏     | 499/1208 [13:56<19:49,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0659, train/loss_vlb_step=0.000228, train/loss_step=0.0659, global_step=728.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  41%|████▏     | 499/1208 [13:56<19:49,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.000953, train/loss_step=0.253, global_step=728.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  41%|████▏     | 500/1208 [14:00<19:49,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.000953, train/loss_step=0.253, global_step=728.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  41%|████▏     | 500/1208 [14:00<19:49,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000126, train/loss_step=0.0332, global_step=728.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  41%|████▏     | 501/1208 [14:01<19:47,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000126, train/loss_step=0.0332, global_step=728.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  41%|████▏     | 501/1208 [14:01<19:47,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0729, train/loss_vlb_step=0.00025, train/loss_step=0.0729, global_step=729.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  42%|████▏     | 502/1208 [14:02<19:44,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0729, train/loss_vlb_step=0.00025, train/loss_step=0.0729, global_step=729.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  42%|████▏     | 502/1208 [14:02<19:44,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00125, train/loss_step=0.280, global_step=729.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  42%|████▏     | 503/1208 [14:03<19:42,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00125, train/loss_step=0.280, global_step=729.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  42%|████▏     | 503/1208 [14:03<19:42,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0804, train/loss_vlb_step=0.00027, train/loss_step=0.0804, global_step=729.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  42%|████▏     | 504/1208 [14:06<19:42,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0804, train/loss_vlb_step=0.00027, train/loss_step=0.0804, global_step=729.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  42%|████▏     | 504/1208 [14:06<19:42,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000624, train/loss_step=0.181, global_step=729.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  42%|████▏     | 505/1208 [14:07<19:40,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000624, train/loss_step=0.181, global_step=729.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  42%|████▏     | 505/1208 [14:07<19:40,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.38e-5, train/loss_step=0.0141, global_step=730.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  42%|████▏     | 506/1208 [14:08<19:37,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.38e-5, train/loss_step=0.0141, global_step=730.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  42%|████▏     | 506/1208 [14:08<19:37,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.81e-5, train/loss_step=0.0125, global_step=730.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  42%|████▏     | 507/1208 [14:09<19:35,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.81e-5, train/loss_step=0.0125, global_step=730.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  42%|████▏     | 507/1208 [14:09<19:35,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000606, train/loss_step=0.182, global_step=730.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  42%|████▏     | 508/1208 [14:13<19:35,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000606, train/loss_step=0.182, global_step=730.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  42%|████▏     | 508/1208 [14:13<19:35,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000515, train/loss_step=0.155, global_step=730.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  42%|████▏     | 509/1208 [14:14<19:33,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000515, train/loss_step=0.155, global_step=730.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  42%|████▏     | 509/1208 [14:14<19:33,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000401, train/loss_step=0.122, global_step=731.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  42%|████▏     | 510/1208 [14:15<19:30,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000401, train/loss_step=0.122, global_step=731.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  42%|████▏     | 510/1208 [14:15<19:30,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000575, train/loss_step=0.168, global_step=731.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  42%|████▏     | 511/1208 [14:16<19:28,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000575, train/loss_step=0.168, global_step=731.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  42%|████▏     | 511/1208 [14:16<19:28,  1.68s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.00779, train/loss_vlb_step=3.96e-5, train/loss_step=0.00779, global_step=731.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  42%|████▏     | 512/1208 [14:19<19:28,  1.68s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.00779, train/loss_vlb_step=3.96e-5, train/loss_step=0.00779, global_step=731.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  42%|████▏     | 512/1208 [14:19<19:28,  1.68s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.0705, train/loss_vlb_step=0.000248, train/loss_step=0.0705, global_step=731.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  42%|████▏     | 513/1208 [14:20<19:25,  1.68s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.0705, train/loss_vlb_step=0.000248, train/loss_step=0.0705, global_step=731.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  42%|████▏     | 513/1208 [14:20<19:25,  1.68s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000642, train/loss_step=0.187, global_step=732.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  43%|████▎     | 514/1208 [14:21<19:23,  1.68s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000642, train/loss_step=0.187, global_step=732.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  43%|████▎     | 514/1208 [14:21<19:23,  1.68s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.31e-5, train/loss_step=0.00216, global_step=732.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  43%|████▎     | 515/1208 [14:22<19:20,  1.68s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.31e-5, train/loss_step=0.00216, global_step=732.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  43%|████▎     | 515/1208 [14:22<19:20,  1.68s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.64e-5, train/loss_step=0.0179, global_step=732.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  43%|████▎     | 516/1208 [14:25<19:21,  1.68s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.64e-5, train/loss_step=0.0179, global_step=732.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  43%|████▎     | 516/1208 [14:25<19:21,  1.68s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0677, train/loss_vlb_step=0.000232, train/loss_step=0.0677, global_step=732.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  43%|████▎     | 517/1208 [14:27<19:18,  1.68s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0677, train/loss_vlb_step=0.000232, train/loss_step=0.0677, global_step=732.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  43%|████▎     | 517/1208 [14:27<19:18,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00215, train/loss_step=0.394, global_step=733.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  43%|████▎     | 518/1208 [14:28<19:16,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00215, train/loss_step=0.394, global_step=733.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  43%|████▎     | 518/1208 [14:28<19:16,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00114, train/loss_step=0.272, global_step=733.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  43%|████▎     | 519/1208 [14:29<19:13,  1.67s/it, loss=0.129, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00114, train/loss_step=0.272, global_step=733.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  43%|████▎     | 519/1208 [14:29<19:13,  1.67s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0659, train/loss_vlb_step=0.000224, train/loss_step=0.0659, global_step=733.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  43%|████▎     | 520/1208 [14:32<19:14,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0659, train/loss_vlb_step=0.000224, train/loss_step=0.0659, global_step=733.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  43%|████▎     | 520/1208 [14:32<19:14,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.000155, train/loss_step=0.0417, global_step=733.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  43%|████▎     | 521/1208 [14:33<19:11,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.000155, train/loss_step=0.0417, global_step=733.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  43%|████▎     | 521/1208 [14:33<19:11,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0791, train/loss_vlb_step=0.000265, train/loss_step=0.0791, global_step=734.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  43%|████▎     | 522/1208 [14:34<19:09,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0791, train/loss_vlb_step=0.000265, train/loss_step=0.0791, global_step=734.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  43%|████▎     | 522/1208 [14:34<19:09,  1.68s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.53e-5, train/loss_step=0.0191, global_step=734.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  43%|████▎     | 523/1208 [14:35<19:06,  1.67s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.53e-5, train/loss_step=0.0191, global_step=734.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  43%|████▎     | 523/1208 [14:35<19:06,  1.67s/it, loss=0.106, v_num=0, train/loss_simple_step=0.052, train/loss_vlb_step=0.000191, train/loss_step=0.052, global_step=734.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  43%|████▎     | 524/1208 [14:38<19:07,  1.68s/it, loss=0.106, v_num=0, train/loss_simple_step=0.052, train/loss_vlb_step=0.000191, train/loss_step=0.052, global_step=734.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  43%|████▎     | 524/1208 [14:38<19:07,  1.68s/it, loss=0.11, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00135, train/loss_step=0.276, global_step=734.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  43%|████▎     | 525/1208 [14:39<19:04,  1.68s/it, loss=0.11, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00135, train/loss_step=0.276, global_step=734.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  43%|████▎     | 525/1208 [14:39<19:04,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.552, train/loss_vlb_step=0.0129, train/loss_step=0.552, global_step=735.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  44%|████▎     | 526/1208 [14:40<19:02,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.552, train/loss_vlb_step=0.0129, train/loss_step=0.552, global_step=735.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  44%|████▎     | 526/1208 [14:40<19:02,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=735.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  44%|████▎     | 527/1208 [14:41<18:59,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=735.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  44%|████▎     | 527/1208 [14:41<18:59,  1.67s/it, loss=0.142, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000595, train/loss_step=0.168, global_step=735.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  44%|████▎     | 528/1208 [14:45<19:00,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000595, train/loss_step=0.168, global_step=735.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  44%|████▎     | 528/1208 [14:45<19:00,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00133, train/loss_step=0.253, global_step=735.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  44%|████▍     | 529/1208 [14:46<18:57,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00133, train/loss_step=0.253, global_step=735.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  44%|████▍     | 529/1208 [14:46<18:57,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0503, train/loss_vlb_step=0.000182, train/loss_step=0.0503, global_step=736.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  44%|████▍     | 530/1208 [14:47<18:55,  1.67s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0503, train/loss_vlb_step=0.000182, train/loss_step=0.0503, global_step=736.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  44%|████▍     | 530/1208 [14:47<18:55,  1.67s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00339, train/loss_vlb_step=1.92e-5, train/loss_step=0.00339, global_step=736.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  44%|████▍     | 531/1208 [14:48<18:52,  1.67s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00339, train/loss_vlb_step=1.92e-5, train/loss_step=0.00339, global_step=736.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  44%|████▍     | 531/1208 [14:48<18:52,  1.67s/it, loss=0.142, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000445, train/loss_step=0.134, global_step=736.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  44%|████▍     | 532/1208 [14:51<18:52,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000445, train/loss_step=0.134, global_step=736.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  44%|████▍     | 532/1208 [14:51<18:52,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=2.43e-5, train/loss_step=0.0046, global_step=736.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  44%|████▍     | 533/1208 [14:52<18:50,  1.67s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=2.43e-5, train/loss_step=0.0046, global_step=736.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  44%|████▍     | 533/1208 [14:52<18:50,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0539, train/loss_vlb_step=0.000192, train/loss_step=0.0539, global_step=737.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  44%|████▍     | 534/1208 [14:53<18:47,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0539, train/loss_vlb_step=0.000192, train/loss_step=0.0539, global_step=737.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  44%|████▍     | 534/1208 [14:53<18:47,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=2.19e-5, train/loss_step=0.00421, global_step=737.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  44%|████▍     | 535/1208 [14:54<18:45,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=2.19e-5, train/loss_step=0.00421, global_step=737.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  44%|████▍     | 535/1208 [14:54<18:45,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.25e-5, train/loss_step=0.0235, global_step=737.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  44%|████▍     | 536/1208 [14:58<18:45,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.25e-5, train/loss_step=0.0235, global_step=737.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  44%|████▍     | 536/1208 [14:58<18:45,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000126, train/loss_step=0.0344, global_step=737.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  44%|████▍     | 537/1208 [14:59<18:43,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000126, train/loss_step=0.0344, global_step=737.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  44%|████▍     | 537/1208 [14:59<18:43,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00179, train/loss_step=0.319, global_step=738.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  45%|████▍     | 538/1208 [15:00<18:41,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00179, train/loss_step=0.319, global_step=738.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  45%|████▍     | 538/1208 [15:00<18:41,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00164, train/loss_step=0.333, global_step=738.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  45%|████▍     | 539/1208 [15:01<18:38,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00164, train/loss_step=0.333, global_step=738.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  45%|████▍     | 539/1208 [15:01<18:38,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.5e-5, train/loss_step=0.0123, global_step=738.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  45%|████▍     | 540/1208 [15:04<18:38,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.5e-5, train/loss_step=0.0123, global_step=738.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  45%|████▍     | 540/1208 [15:04<18:38,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.000156, train/loss_step=0.043, global_step=738.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  45%|████▍     | 541/1208 [15:05<18:36,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.000156, train/loss_step=0.043, global_step=738.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  45%|████▍     | 541/1208 [15:05<18:36,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000586, train/loss_step=0.170, global_step=739.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  45%|████▍     | 542/1208 [15:06<18:34,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000586, train/loss_step=0.170, global_step=739.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  45%|████▍     | 542/1208 [15:06<18:34,  1.67s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0887, train/loss_vlb_step=0.000296, train/loss_step=0.0887, global_step=739.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  45%|████▍     | 543/1208 [15:07<18:31,  1.67s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0887, train/loss_vlb_step=0.000296, train/loss_step=0.0887, global_step=739.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  45%|████▍     | 543/1208 [15:07<18:31,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0855, train/loss_vlb_step=0.000288, train/loss_step=0.0855, global_step=739.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  45%|████▌     | 544/1208 [15:10<18:31,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0855, train/loss_vlb_step=0.000288, train/loss_step=0.0855, global_step=739.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  45%|████▌     | 544/1208 [15:10<18:31,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000551, train/loss_step=0.158, global_step=739.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  45%|████▌     | 545/1208 [15:11<18:29,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000551, train/loss_step=0.158, global_step=739.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  45%|████▌     | 545/1208 [15:11<18:29,  1.67s/it, loss=0.119, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00149, train/loss_step=0.307, global_step=740.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  45%|████▌     | 546/1208 [15:12<18:26,  1.67s/it, loss=0.119, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00149, train/loss_step=0.307, global_step=740.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  45%|████▌     | 546/1208 [15:12<18:26,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.73e-5, train/loss_step=0.00305, global_step=740.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  45%|████▌     | 547/1208 [15:14<18:24,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.73e-5, train/loss_step=0.00305, global_step=740.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  45%|████▌     | 547/1208 [15:14<18:24,  1.67s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0985, train/loss_vlb_step=0.000331, train/loss_step=0.0985, global_step=740.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  45%|████▌     | 548/1208 [15:17<18:24,  1.67s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0985, train/loss_vlb_step=0.000331, train/loss_step=0.0985, global_step=740.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  45%|████▌     | 548/1208 [15:17<18:24,  1.67s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.00376, train/loss_vlb_step=2.01e-5, train/loss_step=0.00376, global_step=740.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  45%|████▌     | 549/1208 [15:18<18:22,  1.67s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.00376, train/loss_vlb_step=2.01e-5, train/loss_step=0.00376, global_step=740.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  45%|████▌     | 549/1208 [15:18<18:22,  1.67s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.0879, train/loss_vlb_step=0.000291, train/loss_step=0.0879, global_step=741.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  46%|████▌     | 550/1208 [15:19<18:20,  1.67s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.0879, train/loss_vlb_step=0.000291, train/loss_step=0.0879, global_step=741.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  46%|████▌     | 550/1208 [15:19<18:20,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.475, train/loss_vlb_step=0.00702, train/loss_step=0.475, global_step=741.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  46%|████▌     | 551/1208 [15:20<18:17,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.475, train/loss_vlb_step=0.00702, train/loss_step=0.475, global_step=741.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  46%|████▌     | 551/1208 [15:20<18:17,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00191, train/loss_step=0.376, global_step=741.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  46%|████▌     | 552/1208 [15:23<18:17,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00191, train/loss_step=0.376, global_step=741.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  46%|████▌     | 552/1208 [15:23<18:17,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00108, train/loss_step=0.260, global_step=741.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  46%|████▌     | 553/1208 [15:24<18:15,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00108, train/loss_step=0.260, global_step=741.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  46%|████▌     | 553/1208 [15:24<18:15,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000426, train/loss_step=0.130, global_step=742.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  46%|████▌     | 554/1208 [15:25<18:12,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000426, train/loss_step=0.130, global_step=742.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  46%|████▌     | 554/1208 [15:25<18:12,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.66e-5, train/loss_step=0.018, global_step=742.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  46%|████▌     | 555/1208 [15:26<18:10,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.66e-5, train/loss_step=0.018, global_step=742.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  46%|████▌     | 555/1208 [15:26<18:10,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0377, train/loss_vlb_step=0.000141, train/loss_step=0.0377, global_step=742.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  46%|████▌     | 556/1208 [15:29<18:10,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0377, train/loss_vlb_step=0.000141, train/loss_step=0.0377, global_step=742.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  46%|████▌     | 556/1208 [15:29<18:10,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000799, train/loss_step=0.220, global_step=742.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  46%|████▌     | 557/1208 [15:30<18:07,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000799, train/loss_step=0.220, global_step=742.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  46%|████▌     | 557/1208 [15:30<18:07,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00368, train/loss_step=0.454, global_step=743.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  46%|████▌     | 558/1208 [15:31<18:05,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00368, train/loss_step=0.454, global_step=743.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  46%|████▌     | 558/1208 [15:31<18:05,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=743.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  46%|████▋     | 559/1208 [15:32<18:03,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=743.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  46%|████▋     | 559/1208 [15:32<18:03,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.000133, train/loss_step=0.0352, global_step=743.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  46%|████▋     | 560/1208 [15:36<18:03,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.000133, train/loss_step=0.0352, global_step=743.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  46%|████▋     | 560/1208 [15:36<18:03,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000159, train/loss_step=0.042, global_step=743.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  46%|████▋     | 561/1208 [15:37<18:00,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000159, train/loss_step=0.042, global_step=743.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  46%|████▋     | 561/1208 [15:37<18:00,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0515, train/loss_vlb_step=0.000173, train/loss_step=0.0515, global_step=744.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  47%|████▋     | 562/1208 [15:38<17:58,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0515, train/loss_vlb_step=0.000173, train/loss_step=0.0515, global_step=744.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  47%|████▋     | 562/1208 [15:38<17:58,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.5e-5, train/loss_step=0.0141, global_step=744.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  47%|████▋     | 563/1208 [15:39<17:55,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.5e-5, train/loss_step=0.0141, global_step=744.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  47%|████▋     | 563/1208 [15:39<17:55,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0876, train/loss_vlb_step=0.000291, train/loss_step=0.0876, global_step=744.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  47%|████▋     | 564/1208 [15:42<17:56,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0876, train/loss_vlb_step=0.000291, train/loss_step=0.0876, global_step=744.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  47%|████▋     | 564/1208 [15:42<17:56,  1.67s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000117, train/loss_step=0.0291, global_step=744.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  47%|████▋     | 565/1208 [15:43<17:53,  1.67s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000117, train/loss_step=0.0291, global_step=744.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  47%|████▋     | 565/1208 [15:43<17:53,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0876, train/loss_vlb_step=0.000296, train/loss_step=0.0876, global_step=745.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  47%|████▋     | 566/1208 [15:44<17:51,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0876, train/loss_vlb_step=0.000296, train/loss_step=0.0876, global_step=745.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  47%|████▋     | 566/1208 [15:44<17:51,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00404, train/loss_vlb_step=2.17e-5, train/loss_step=0.00404, global_step=745.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  47%|████▋     | 567/1208 [15:45<17:49,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00404, train/loss_vlb_step=2.17e-5, train/loss_step=0.00404, global_step=745.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  47%|████▋     | 567/1208 [15:45<17:49,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00463, train/loss_vlb_step=2.5e-5, train/loss_step=0.00463, global_step=745.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  47%|████▋     | 568/1208 [15:48<17:49,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00463, train/loss_vlb_step=2.5e-5, train/loss_step=0.00463, global_step=745.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  47%|████▋     | 568/1208 [15:48<17:49,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00583, train/loss_vlb_step=3.01e-5, train/loss_step=0.00583, global_step=745.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  47%|████▋     | 569/1208 [15:49<17:46,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00583, train/loss_vlb_step=3.01e-5, train/loss_step=0.00583, global_step=745.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  47%|████▋     | 569/1208 [15:49<17:46,  1.67s/it, loss=0.15, v_num=0, train/loss_simple_step=0.556, train/loss_vlb_step=0.0105, train/loss_step=0.556, global_step=746.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]      Epoch 2:  47%|████▋     | 570/1208 [15:51<17:44,  1.67s/it, loss=0.15, v_num=0, train/loss_simple_step=0.556, train/loss_vlb_step=0.0105, train/loss_step=0.556, global_step=746.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  47%|████▋     | 570/1208 [15:51<17:44,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00203, train/loss_step=0.381, global_step=746.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  47%|████▋     | 571/1208 [15:52<17:42,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00203, train/loss_step=0.381, global_step=746.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  47%|████▋     | 571/1208 [15:52<17:42,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.59e-5, train/loss_step=0.00265, global_step=746.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  47%|████▋     | 572/1208 [15:55<17:42,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.59e-5, train/loss_step=0.00265, global_step=746.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  47%|████▋     | 572/1208 [15:55<17:42,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00594, train/loss_vlb_step=2.98e-5, train/loss_step=0.00594, global_step=746.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  47%|████▋     | 573/1208 [15:56<17:39,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00594, train/loss_vlb_step=2.98e-5, train/loss_step=0.00594, global_step=746.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  47%|████▋     | 573/1208 [15:56<17:39,  1.67s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=9.62e-6, train/loss_step=0.00158, global_step=747.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  48%|████▊     | 574/1208 [15:57<17:37,  1.67s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=9.62e-6, train/loss_step=0.00158, global_step=747.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  48%|████▊     | 574/1208 [15:57<17:37,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000361, train/loss_step=0.109, global_step=747.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  48%|████▊     | 575/1208 [15:58<17:35,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000361, train/loss_step=0.109, global_step=747.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  48%|████▊     | 575/1208 [15:58<17:35,  1.67s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=1.58e-5, train/loss_step=0.00271, global_step=747.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  48%|████▊     | 576/1208 [16:01<17:35,  1.67s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=1.58e-5, train/loss_step=0.00271, global_step=747.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  48%|████▊     | 576/1208 [16:01<17:35,  1.67s/it, loss=0.116, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.0021, train/loss_step=0.336, global_step=747.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]     Epoch 2:  48%|████▊     | 577/1208 [16:02<17:32,  1.67s/it, loss=0.116, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.0021, train/loss_step=0.336, global_step=747.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  48%|████▊     | 577/1208 [16:02<17:32,  1.67s/it, loss=0.0938, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.86e-5, train/loss_step=0.0033, global_step=748.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  48%|████▊     | 578/1208 [16:03<17:30,  1.67s/it, loss=0.0938, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.86e-5, train/loss_step=0.0033, global_step=748.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  48%|████▊     | 578/1208 [16:03<17:30,  1.67s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000659, train/loss_step=0.193, global_step=748.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  48%|████▊     | 579/1208 [16:04<17:28,  1.67s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000659, train/loss_step=0.193, global_step=748.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  48%|████▊     | 579/1208 [16:04<17:28,  1.67s/it, loss=0.109, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00104, train/loss_step=0.260, global_step=748.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  48%|████▊     | 580/1208 [16:08<17:28,  1.67s/it, loss=0.109, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00104, train/loss_step=0.260, global_step=748.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  48%|████▊     | 580/1208 [16:08<17:28,  1.67s/it, loss=0.128, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.0036, train/loss_step=0.420, global_step=748.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  48%|████▊     | 581/1208 [16:09<17:25,  1.67s/it, loss=0.128, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.0036, train/loss_step=0.420, global_step=748.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  48%|████▊     | 581/1208 [16:09<17:25,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00143, train/loss_step=0.289, global_step=749.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  48%|████▊     | 582/1208 [16:10<17:23,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00143, train/loss_step=0.289, global_step=749.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  48%|████▊     | 582/1208 [16:10<17:23,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000881, train/loss_step=0.235, global_step=749.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  48%|████▊     | 583/1208 [16:11<17:21,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000881, train/loss_step=0.235, global_step=749.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  48%|████▊     | 583/1208 [16:11<17:21,  1.67s/it, loss=0.167, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.0034, train/loss_step=0.414, global_step=749.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  48%|████▊     | 584/1208 [16:14<17:21,  1.67s/it, loss=0.167, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.0034, train/loss_step=0.414, global_step=749.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  48%|████▊     | 584/1208 [16:14<17:21,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0806, train/loss_vlb_step=0.000276, train/loss_step=0.0806, global_step=749.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  48%|████▊     | 585/1208 [16:15<17:18,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0806, train/loss_vlb_step=0.000276, train/loss_step=0.0806, global_step=749.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  48%|████▊     | 585/1208 [16:15<17:18,  1.67s/it, loss=0.199, v_num=0, train/loss_simple_step=0.671, train/loss_vlb_step=0.0385, train/loss_step=0.671, global_step=750.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  49%|████▊     | 586/1208 [16:16<17:16,  1.67s/it, loss=0.199, v_num=0, train/loss_simple_step=0.671, train/loss_vlb_step=0.0385, train/loss_step=0.671, global_step=750.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  49%|████▊     | 586/1208 [16:16<17:16,  1.67s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0536, train/loss_vlb_step=0.000193, train/loss_step=0.0536, global_step=750.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  49%|████▊     | 587/1208 [16:17<17:14,  1.67s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0536, train/loss_vlb_step=0.000193, train/loss_step=0.0536, global_step=750.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  49%|████▊     | 587/1208 [16:17<17:14,  1.67s/it, loss=0.222, v_num=0, train/loss_simple_step=0.426, train/loss_vlb_step=0.00424, train/loss_step=0.426, global_step=750.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  49%|████▊     | 588/1208 [16:20<17:14,  1.67s/it, loss=0.222, v_num=0, train/loss_simple_step=0.426, train/loss_vlb_step=0.00424, train/loss_step=0.426, global_step=750.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  49%|████▊     | 588/1208 [16:20<17:14,  1.67s/it, loss=0.24, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00199, train/loss_step=0.359, global_step=750.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  49%|████▉     | 589/1208 [16:21<17:11,  1.67s/it, loss=0.24, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00199, train/loss_step=0.359, global_step=750.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  49%|████▉     | 589/1208 [16:21<17:11,  1.67s/it, loss=0.219, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000441, train/loss_step=0.134, global_step=751.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  49%|████▉     | 590/1208 [16:22<17:09,  1.67s/it, loss=0.219, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000441, train/loss_step=0.134, global_step=751.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  49%|████▉     | 590/1208 [16:22<17:09,  1.67s/it, loss=0.211, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000764, train/loss_step=0.218, global_step=751.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  49%|████▉     | 591/1208 [16:23<17:07,  1.66s/it, loss=0.211, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000764, train/loss_step=0.218, global_step=751.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  49%|████▉     | 591/1208 [16:23<17:07,  1.66s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0054, train/loss_vlb_step=2.82e-5, train/loss_step=0.0054, global_step=751.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  49%|████▉     | 592/1208 [16:27<17:07,  1.67s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0054, train/loss_vlb_step=2.82e-5, train/loss_step=0.0054, global_step=751.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  49%|████▉     | 592/1208 [16:27<17:07,  1.67s/it, loss=0.211, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.64e-5, train/loss_step=0.00286, global_step=751.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  49%|████▉     | 593/1208 [16:28<17:04,  1.67s/it, loss=0.211, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.64e-5, train/loss_step=0.00286, global_step=751.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  49%|████▉     | 593/1208 [16:28<17:04,  1.67s/it, loss=0.211, v_num=0, train/loss_simple_step=0.00597, train/loss_vlb_step=3.16e-5, train/loss_step=0.00597, global_step=752.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  49%|████▉     | 594/1208 [16:29<17:02,  1.67s/it, loss=0.211, v_num=0, train/loss_simple_step=0.00597, train/loss_vlb_step=3.16e-5, train/loss_step=0.00597, global_step=752.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  49%|████▉     | 594/1208 [16:29<17:02,  1.67s/it, loss=0.214, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000586, train/loss_step=0.178, global_step=752.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  49%|████▉     | 595/1208 [16:30<17:00,  1.66s/it, loss=0.214, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000586, train/loss_step=0.178, global_step=752.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  49%|████▉     | 595/1208 [16:30<17:00,  1.66s/it, loss=0.225, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000769, train/loss_step=0.210, global_step=752.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  49%|████▉     | 596/1208 [16:33<17:00,  1.67s/it, loss=0.225, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000769, train/loss_step=0.210, global_step=752.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  49%|████▉     | 596/1208 [16:33<17:00,  1.67s/it, loss=0.209, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.86e-5, train/loss_step=0.0164, global_step=752.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  49%|████▉     | 597/1208 [16:34<16:57,  1.67s/it, loss=0.209, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.86e-5, train/loss_step=0.0164, global_step=752.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  49%|████▉     | 597/1208 [16:34<16:57,  1.67s/it, loss=0.209, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.4e-5, train/loss_step=0.00241, global_step=753.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  50%|████▉     | 598/1208 [16:35<16:55,  1.66s/it, loss=0.209, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.4e-5, train/loss_step=0.00241, global_step=753.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  50%|████▉     | 598/1208 [16:35<16:55,  1.66s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.85e-5, train/loss_step=0.0123, global_step=753.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  50%|████▉     | 599/1208 [16:36<16:53,  1.66s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.85e-5, train/loss_step=0.0123, global_step=753.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  50%|████▉     | 599/1208 [16:36<16:53,  1.66s/it, loss=0.208, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00312, train/loss_step=0.434, global_step=753.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  50%|████▉     | 600/1208 [16:39<16:53,  1.67s/it, loss=0.208, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00312, train/loss_step=0.434, global_step=753.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  50%|████▉     | 600/1208 [16:39<16:53,  1.67s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.00015, train/loss_step=0.0401, global_step=753.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.75it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.75it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.74it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.75it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.83it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.76it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.83it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.83it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.83it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.78it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.82it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 2:  50%|████▉     | 601/1208 [17:10<17:20,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.00015, train/loss_step=0.0401, global_step=753.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  50%|████▉     | 601/1208 [17:10<17:20,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0885, train/loss_vlb_step=0.000296, train/loss_step=0.0885, global_step=754.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  50%|████▉     | 602/1208 [17:11<17:18,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0885, train/loss_vlb_step=0.000296, train/loss_step=0.0885, global_step=754.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  50%|████▉     | 602/1208 [17:11<17:18,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00117, train/loss_step=0.282, global_step=754.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  50%|████▉     | 603/1208 [17:12<17:15,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00117, train/loss_step=0.282, global_step=754.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  50%|████▉     | 603/1208 [17:12<17:15,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000211, train/loss_step=0.0588, global_step=754.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  50%|█████     | 604/1208 [17:15<17:15,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000211, train/loss_step=0.0588, global_step=754.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  50%|█████     | 604/1208 [17:15<17:15,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000723, train/loss_step=0.201, global_step=754.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  50%|█████     | 605/1208 [17:16<17:13,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000723, train/loss_step=0.201, global_step=754.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  50%|█████     | 605/1208 [17:16<17:13,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6e-5, train/loss_step=0.0134, global_step=755.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  50%|█████     | 606/1208 [17:17<17:10,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6e-5, train/loss_step=0.0134, global_step=755.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  50%|█████     | 606/1208 [17:17<17:10,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000625, train/loss_step=0.173, global_step=755.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  50%|█████     | 607/1208 [17:18<17:08,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000625, train/loss_step=0.173, global_step=755.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  50%|█████     | 607/1208 [17:18<17:08,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=755.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  50%|█████     | 608/1208 [17:22<17:08,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=755.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  50%|█████     | 608/1208 [17:22<17:08,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000545, train/loss_step=0.160, global_step=755.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  50%|█████     | 609/1208 [17:23<17:05,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000545, train/loss_step=0.160, global_step=755.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  50%|█████     | 609/1208 [17:23<17:05,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000529, train/loss_step=0.156, global_step=756.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  50%|█████     | 610/1208 [17:24<17:03,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000529, train/loss_step=0.156, global_step=756.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  50%|█████     | 610/1208 [17:24<17:03,  1.71s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0622, train/loss_vlb_step=0.000215, train/loss_step=0.0622, global_step=756.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  51%|█████     | 611/1208 [17:25<17:01,  1.71s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0622, train/loss_vlb_step=0.000215, train/loss_step=0.0622, global_step=756.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  51%|█████     | 611/1208 [17:25<17:01,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000494, train/loss_step=0.149, global_step=756.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  51%|█████     | 612/1208 [17:28<17:00,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000494, train/loss_step=0.149, global_step=756.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  51%|█████     | 612/1208 [17:28<17:00,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00636, train/loss_vlb_step=3.27e-5, train/loss_step=0.00636, global_step=756.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  51%|█████     | 613/1208 [17:29<16:58,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00636, train/loss_vlb_step=3.27e-5, train/loss_step=0.00636, global_step=756.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  51%|█████     | 613/1208 [17:29<16:58,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0831, train/loss_vlb_step=0.000276, train/loss_step=0.0831, global_step=757.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  51%|█████     | 614/1208 [17:30<16:56,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0831, train/loss_vlb_step=0.000276, train/loss_step=0.0831, global_step=757.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  51%|█████     | 614/1208 [17:30<16:56,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00318, train/loss_vlb_step=1.76e-5, train/loss_step=0.00318, global_step=757.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  51%|█████     | 615/1208 [17:31<16:53,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00318, train/loss_vlb_step=1.76e-5, train/loss_step=0.00318, global_step=757.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  51%|█████     | 615/1208 [17:31<16:53,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00141, train/loss_step=0.301, global_step=757.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  51%|█████     | 616/1208 [17:34<16:53,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00141, train/loss_step=0.301, global_step=757.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  51%|█████     | 616/1208 [17:34<16:53,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=757.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  51%|█████     | 617/1208 [17:35<16:51,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=757.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  51%|█████     | 617/1208 [17:35<16:51,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.39e-5, train/loss_step=0.00235, global_step=758.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  51%|█████     | 618/1208 [17:36<16:49,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.39e-5, train/loss_step=0.00235, global_step=758.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  51%|█████     | 618/1208 [17:36<16:49,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=1.09e-5, train/loss_step=0.00183, global_step=758.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  51%|█████     | 619/1208 [17:37<16:46,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=1.09e-5, train/loss_step=0.00183, global_step=758.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  51%|█████     | 619/1208 [17:37<16:46,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000459, train/loss_step=0.138, global_step=758.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  51%|█████▏    | 620/1208 [17:41<16:46,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000459, train/loss_step=0.138, global_step=758.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  51%|█████▏    | 620/1208 [17:41<16:46,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0879, train/loss_vlb_step=0.000296, train/loss_step=0.0879, global_step=758.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  51%|█████▏    | 621/1208 [17:42<16:44,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0879, train/loss_vlb_step=0.000296, train/loss_step=0.0879, global_step=758.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  51%|█████▏    | 621/1208 [17:42<16:44,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=1.29e-5, train/loss_step=0.00217, global_step=759.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  51%|█████▏    | 622/1208 [17:43<16:41,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=1.29e-5, train/loss_step=0.00217, global_step=759.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  51%|█████▏    | 622/1208 [17:43<16:41,  1.71s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000152, train/loss_step=0.0409, global_step=759.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  52%|█████▏    | 623/1208 [17:44<16:39,  1.71s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000152, train/loss_step=0.0409, global_step=759.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  52%|█████▏    | 623/1208 [17:44<16:39,  1.71s/it, loss=0.094, v_num=0, train/loss_simple_step=0.0816, train/loss_vlb_step=0.000274, train/loss_step=0.0816, global_step=759.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  52%|█████▏    | 624/1208 [17:47<16:38,  1.71s/it, loss=0.094, v_num=0, train/loss_simple_step=0.0816, train/loss_vlb_step=0.000274, train/loss_step=0.0816, global_step=759.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  52%|█████▏    | 624/1208 [17:47<16:38,  1.71s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=759.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  52%|█████▏    | 625/1208 [17:48<16:36,  1.71s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=759.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  52%|█████▏    | 625/1208 [17:48<16:36,  1.71s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000642, train/loss_step=0.184, global_step=760.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  52%|█████▏    | 626/1208 [17:49<16:34,  1.71s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000642, train/loss_step=0.184, global_step=760.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  52%|█████▏    | 626/1208 [17:49<16:34,  1.71s/it, loss=0.0904, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.53e-5, train/loss_step=0.0144, global_step=760.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  52%|█████▏    | 627/1208 [17:50<16:31,  1.71s/it, loss=0.0904, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.53e-5, train/loss_step=0.0144, global_step=760.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  52%|█████▏    | 627/1208 [17:50<16:31,  1.71s/it, loss=0.0878, v_num=0, train/loss_simple_step=0.0542, train/loss_vlb_step=0.000194, train/loss_step=0.0542, global_step=760.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  52%|█████▏    | 628/1208 [17:53<16:31,  1.71s/it, loss=0.0878, v_num=0, train/loss_simple_step=0.0542, train/loss_vlb_step=0.000194, train/loss_step=0.0542, global_step=760.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  52%|█████▏    | 628/1208 [17:53<16:31,  1.71s/it, loss=0.08, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=2.56e-5, train/loss_step=0.00481, global_step=760.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  52%|█████▏    | 629/1208 [17:54<16:28,  1.71s/it, loss=0.08, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=2.56e-5, train/loss_step=0.00481, global_step=760.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  52%|█████▏    | 629/1208 [17:54<16:28,  1.71s/it, loss=0.0838, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000861, train/loss_step=0.231, global_step=761.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  52%|█████▏    | 630/1208 [17:55<16:26,  1.71s/it, loss=0.0838, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000861, train/loss_step=0.231, global_step=761.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  52%|█████▏    | 630/1208 [17:55<16:26,  1.71s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000117, train/loss_step=0.0307, global_step=761.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  52%|█████▏    | 631/1208 [17:56<16:24,  1.71s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000117, train/loss_step=0.0307, global_step=761.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  52%|█████▏    | 631/1208 [17:56<16:24,  1.71s/it, loss=0.0765, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000128, train/loss_step=0.0346, global_step=761.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  52%|█████▏    | 632/1208 [17:59<16:23,  1.71s/it, loss=0.0765, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000128, train/loss_step=0.0346, global_step=761.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  52%|█████▏    | 632/1208 [17:59<16:23,  1.71s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00189, train/loss_step=0.328, global_step=761.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  52%|█████▏    | 633/1208 [18:00<16:21,  1.71s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00189, train/loss_step=0.328, global_step=761.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  52%|█████▏    | 633/1208 [18:00<16:21,  1.71s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000426, train/loss_step=0.130, global_step=762.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  52%|█████▏    | 634/1208 [18:01<16:18,  1.71s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000426, train/loss_step=0.130, global_step=762.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  52%|█████▏    | 634/1208 [18:01<16:18,  1.71s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.0816, train/loss_vlb_step=0.000274, train/loss_step=0.0816, global_step=762.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  53%|█████▎    | 635/1208 [18:02<16:16,  1.70s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.0816, train/loss_vlb_step=0.000274, train/loss_step=0.0816, global_step=762.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  53%|█████▎    | 635/1208 [18:02<16:16,  1.70s/it, loss=0.0845, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.79e-5, train/loss_step=0.0153, global_step=762.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  53%|█████▎    | 636/1208 [18:05<16:15,  1.71s/it, loss=0.0845, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.79e-5, train/loss_step=0.0153, global_step=762.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  53%|█████▎    | 636/1208 [18:05<16:15,  1.71s/it, loss=0.0801, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.84e-5, train/loss_step=0.021, global_step=762.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  53%|█████▎    | 637/1208 [18:06<16:13,  1.70s/it, loss=0.0801, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.84e-5, train/loss_step=0.021, global_step=762.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  53%|█████▎    | 637/1208 [18:06<16:13,  1.70s/it, loss=0.083, v_num=0, train/loss_simple_step=0.0599, train/loss_vlb_step=0.0002, train/loss_step=0.0599, global_step=763.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  53%|█████▎    | 638/1208 [18:07<16:11,  1.70s/it, loss=0.083, v_num=0, train/loss_simple_step=0.0599, train/loss_vlb_step=0.0002, train/loss_step=0.0599, global_step=763.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  53%|█████▎    | 638/1208 [18:07<16:11,  1.70s/it, loss=0.0849, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.000144, train/loss_step=0.0401, global_step=763.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  53%|█████▎    | 639/1208 [18:08<16:08,  1.70s/it, loss=0.0849, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.000144, train/loss_step=0.0401, global_step=763.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  53%|█████▎    | 639/1208 [18:08<16:08,  1.70s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.0829, train/loss_vlb_step=0.000277, train/loss_step=0.0829, global_step=763.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  53%|█████▎    | 640/1208 [18:10<16:08,  1.70s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.0829, train/loss_vlb_step=0.000277, train/loss_step=0.0829, global_step=763.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  53%|█████▎    | 640/1208 [18:10<16:08,  1.70s/it, loss=0.0929, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00171, train/loss_step=0.303, global_step=763.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  53%|█████▎    | 641/1208 [18:11<16:05,  1.70s/it, loss=0.0929, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00171, train/loss_step=0.303, global_step=763.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  53%|█████▎    | 641/1208 [18:11<16:05,  1.70s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.0873, train/loss_vlb_step=0.000287, train/loss_step=0.0873, global_step=764.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  53%|█████▎    | 642/1208 [18:12<16:03,  1.70s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.0873, train/loss_vlb_step=0.000287, train/loss_step=0.0873, global_step=764.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  53%|█████▎    | 642/1208 [18:12<16:03,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00194, train/loss_step=0.340, global_step=764.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  53%|█████▎    | 643/1208 [18:13<16:01,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00194, train/loss_step=0.340, global_step=764.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  53%|█████▎    | 643/1208 [18:13<16:01,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000405, train/loss_step=0.123, global_step=764.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  53%|█████▎    | 644/1208 [18:16<16:00,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000405, train/loss_step=0.123, global_step=764.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  53%|█████▎    | 644/1208 [18:16<16:00,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00158, train/loss_step=0.315, global_step=764.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  53%|█████▎    | 645/1208 [18:17<15:58,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00158, train/loss_step=0.315, global_step=764.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  53%|█████▎    | 645/1208 [18:17<15:58,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.00057, train/loss_step=0.165, global_step=765.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  53%|█████▎    | 646/1208 [18:19<15:56,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.00057, train/loss_step=0.165, global_step=765.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  53%|█████▎    | 646/1208 [18:19<15:56,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000546, train/loss_step=0.156, global_step=765.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  54%|█████▎    | 647/1208 [18:20<15:53,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000546, train/loss_step=0.156, global_step=765.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  54%|█████▎    | 647/1208 [18:20<15:53,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.00082, train/loss_step=0.220, global_step=765.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  54%|█████▎    | 648/1208 [18:23<15:53,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.00082, train/loss_step=0.220, global_step=765.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  54%|█████▎    | 648/1208 [18:23<15:53,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.506, train/loss_vlb_step=0.00658, train/loss_step=0.506, global_step=765.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  54%|█████▎    | 649/1208 [18:24<15:51,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.506, train/loss_vlb_step=0.00658, train/loss_step=0.506, global_step=765.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  54%|█████▎    | 649/1208 [18:24<15:51,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.63e-5, train/loss_step=0.0212, global_step=766.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  54%|█████▍    | 650/1208 [18:25<15:48,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.63e-5, train/loss_step=0.0212, global_step=766.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  54%|█████▍    | 650/1208 [18:25<15:48,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0341, train/loss_vlb_step=0.000131, train/loss_step=0.0341, global_step=766.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  54%|█████▍    | 651/1208 [18:26<15:46,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0341, train/loss_vlb_step=0.000131, train/loss_step=0.0341, global_step=766.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  54%|█████▍    | 651/1208 [18:26<15:46,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.65e-5, train/loss_step=0.0149, global_step=766.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  54%|█████▍    | 652/1208 [18:29<15:46,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.65e-5, train/loss_step=0.0149, global_step=766.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  54%|█████▍    | 652/1208 [18:29<15:46,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0882, train/loss_vlb_step=0.000292, train/loss_step=0.0882, global_step=766.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  54%|█████▍    | 653/1208 [18:30<15:44,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0882, train/loss_vlb_step=0.000292, train/loss_step=0.0882, global_step=766.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  54%|█████▍    | 653/1208 [18:30<15:44,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00236, train/loss_step=0.366, global_step=767.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  54%|█████▍    | 654/1208 [18:31<15:41,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00236, train/loss_step=0.366, global_step=767.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  54%|█████▍    | 654/1208 [18:31<15:41,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000167, train/loss_step=0.0448, global_step=767.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  54%|█████▍    | 655/1208 [18:32<15:39,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000167, train/loss_step=0.0448, global_step=767.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  54%|█████▍    | 655/1208 [18:32<15:39,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.0024, train/loss_step=0.378, global_step=767.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  54%|█████▍    | 656/1208 [18:36<15:39,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.0024, train/loss_step=0.378, global_step=767.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  54%|█████▍    | 656/1208 [18:36<15:39,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.29e-5, train/loss_step=0.00409, global_step=767.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  54%|█████▍    | 657/1208 [18:37<15:36,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.29e-5, train/loss_step=0.00409, global_step=767.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  54%|█████▍    | 657/1208 [18:37<15:36,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000399, train/loss_step=0.121, global_step=768.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  54%|█████▍    | 658/1208 [18:38<15:34,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000399, train/loss_step=0.121, global_step=768.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  54%|█████▍    | 658/1208 [18:38<15:34,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00179, train/loss_step=0.341, global_step=768.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  55%|█████▍    | 659/1208 [18:39<15:32,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00179, train/loss_step=0.341, global_step=768.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  55%|█████▍    | 659/1208 [18:39<15:32,  1.70s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.22e-5, train/loss_step=0.00205, global_step=768.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  55%|█████▍    | 660/1208 [18:42<15:31,  1.70s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.22e-5, train/loss_step=0.00205, global_step=768.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  55%|█████▍    | 660/1208 [18:42<15:31,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.65e-5, train/loss_step=0.0155, global_step=768.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  55%|█████▍    | 661/1208 [18:43<15:29,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.65e-5, train/loss_step=0.0155, global_step=768.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  55%|█████▍    | 661/1208 [18:43<15:29,  1.70s/it, loss=0.172, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000695, train/loss_step=0.191, global_step=769.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  55%|█████▍    | 662/1208 [18:44<15:27,  1.70s/it, loss=0.172, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000695, train/loss_step=0.191, global_step=769.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  55%|█████▍    | 662/1208 [18:44<15:27,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000591, train/loss_step=0.173, global_step=769.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  55%|█████▍    | 663/1208 [18:45<15:25,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000591, train/loss_step=0.173, global_step=769.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  55%|█████▍    | 663/1208 [18:45<15:25,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000442, train/loss_step=0.133, global_step=769.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  55%|█████▍    | 664/1208 [18:48<15:24,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000442, train/loss_step=0.133, global_step=769.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  55%|█████▍    | 664/1208 [18:48<15:24,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.37e-5, train/loss_step=0.0118, global_step=769.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  55%|█████▌    | 665/1208 [18:49<15:22,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.37e-5, train/loss_step=0.0118, global_step=769.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  55%|█████▌    | 665/1208 [18:49<15:22,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.04e-5, train/loss_step=0.0139, global_step=770.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  55%|█████▌    | 666/1208 [18:50<15:20,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.04e-5, train/loss_step=0.0139, global_step=770.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  55%|█████▌    | 666/1208 [18:50<15:20,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000902, train/loss_step=0.224, global_step=770.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  55%|█████▌    | 667/1208 [18:51<15:18,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000902, train/loss_step=0.224, global_step=770.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  55%|█████▌    | 667/1208 [18:51<15:18,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.55e-5, train/loss_step=0.015, global_step=770.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  55%|█████▌    | 668/1208 [18:55<15:17,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.55e-5, train/loss_step=0.015, global_step=770.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  55%|█████▌    | 668/1208 [18:55<15:17,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0487, train/loss_vlb_step=0.000177, train/loss_step=0.0487, global_step=770.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  55%|█████▌    | 669/1208 [18:56<15:15,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0487, train/loss_vlb_step=0.000177, train/loss_step=0.0487, global_step=770.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  55%|█████▌    | 669/1208 [18:56<15:15,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.94e-5, train/loss_step=0.0126, global_step=771.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  55%|█████▌    | 670/1208 [18:57<15:13,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.94e-5, train/loss_step=0.0126, global_step=771.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  55%|█████▌    | 670/1208 [18:57<15:13,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=771.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  56%|█████▌    | 671/1208 [18:58<15:10,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=771.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  56%|█████▌    | 671/1208 [18:58<15:10,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000832, train/loss_step=0.209, global_step=771.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  56%|█████▌    | 672/1208 [19:01<15:10,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000832, train/loss_step=0.209, global_step=771.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  56%|█████▌    | 672/1208 [19:01<15:10,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0896, train/loss_vlb_step=0.000301, train/loss_step=0.0896, global_step=771.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  56%|█████▌    | 673/1208 [19:02<15:08,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0896, train/loss_vlb_step=0.000301, train/loss_step=0.0896, global_step=771.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  56%|█████▌    | 673/1208 [19:02<15:08,  1.70s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.45e-5, train/loss_step=0.0123, global_step=772.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  56%|█████▌    | 674/1208 [19:03<15:06,  1.70s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.45e-5, train/loss_step=0.0123, global_step=772.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  56%|█████▌    | 674/1208 [19:03<15:06,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0516, train/loss_vlb_step=0.000192, train/loss_step=0.0516, global_step=772.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  56%|█████▌    | 675/1208 [19:04<15:03,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0516, train/loss_vlb_step=0.000192, train/loss_step=0.0516, global_step=772.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  56%|█████▌    | 675/1208 [19:04<15:03,  1.70s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.02e-5, train/loss_step=0.00176, global_step=772.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  56%|█████▌    | 676/1208 [19:07<15:03,  1.70s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.02e-5, train/loss_step=0.00176, global_step=772.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  56%|█████▌    | 676/1208 [19:07<15:03,  1.70s/it, loss=0.0892, v_num=0, train/loss_simple_step=0.0095, train/loss_vlb_step=4.58e-5, train/loss_step=0.0095, global_step=772.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  56%|█████▌    | 677/1208 [19:08<15:01,  1.70s/it, loss=0.0892, v_num=0, train/loss_simple_step=0.0095, train/loss_vlb_step=4.58e-5, train/loss_step=0.0095, global_step=772.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  56%|█████▌    | 677/1208 [19:08<15:01,  1.70s/it, loss=0.0833, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=2e-5, train/loss_step=0.00359, global_step=773.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  56%|█████▌    | 678/1208 [19:10<14:58,  1.70s/it, loss=0.0833, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=2e-5, train/loss_step=0.00359, global_step=773.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  56%|█████▌    | 678/1208 [19:10<14:58,  1.70s/it, loss=0.0672, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=8.01e-5, train/loss_step=0.0188, global_step=773.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  56%|█████▌    | 679/1208 [19:11<14:56,  1.70s/it, loss=0.0672, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=8.01e-5, train/loss_step=0.0188, global_step=773.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  56%|█████▌    | 679/1208 [19:11<14:56,  1.70s/it, loss=0.0689, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000133, train/loss_step=0.0358, global_step=773.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  56%|█████▋    | 680/1208 [19:14<14:56,  1.70s/it, loss=0.0689, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000133, train/loss_step=0.0358, global_step=773.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  56%|█████▋    | 680/1208 [19:14<14:56,  1.70s/it, loss=0.0689, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.7e-5, train/loss_step=0.0151, global_step=773.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  56%|█████▋    | 681/1208 [19:15<14:54,  1.70s/it, loss=0.0689, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.7e-5, train/loss_step=0.0151, global_step=773.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  56%|█████▋    | 681/1208 [19:15<14:54,  1.70s/it, loss=0.0608, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000113, train/loss_step=0.0291, global_step=774.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  56%|█████▋    | 682/1208 [19:16<14:51,  1.70s/it, loss=0.0608, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000113, train/loss_step=0.0291, global_step=774.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  56%|█████▋    | 682/1208 [19:16<14:51,  1.70s/it, loss=0.0539, v_num=0, train/loss_simple_step=0.0357, train/loss_vlb_step=0.000128, train/loss_step=0.0357, global_step=774.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  57%|█████▋    | 683/1208 [19:17<14:49,  1.69s/it, loss=0.0539, v_num=0, train/loss_simple_step=0.0357, train/loss_vlb_step=0.000128, train/loss_step=0.0357, global_step=774.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  57%|█████▋    | 683/1208 [19:17<14:49,  1.69s/it, loss=0.0482, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.57e-5, train/loss_step=0.0199, global_step=774.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  57%|█████▋    | 684/1208 [19:20<14:49,  1.70s/it, loss=0.0482, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.57e-5, train/loss_step=0.0199, global_step=774.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  57%|█████▋    | 684/1208 [19:20<14:49,  1.70s/it, loss=0.0478, v_num=0, train/loss_simple_step=0.00293, train/loss_vlb_step=1.65e-5, train/loss_step=0.00293, global_step=774.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  57%|█████▋    | 685/1208 [19:21<14:46,  1.70s/it, loss=0.0478, v_num=0, train/loss_simple_step=0.00293, train/loss_vlb_step=1.65e-5, train/loss_step=0.00293, global_step=774.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  57%|█████▋    | 685/1208 [19:21<14:46,  1.70s/it, loss=0.0497, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000181, train/loss_step=0.0514, global_step=775.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  57%|█████▋    | 686/1208 [19:22<14:44,  1.70s/it, loss=0.0497, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000181, train/loss_step=0.0514, global_step=775.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  57%|█████▋    | 686/1208 [19:22<14:44,  1.70s/it, loss=0.0421, v_num=0, train/loss_simple_step=0.0713, train/loss_vlb_step=0.000242, train/loss_step=0.0713, global_step=775.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  57%|█████▋    | 687/1208 [19:23<14:42,  1.69s/it, loss=0.0421, v_num=0, train/loss_simple_step=0.0713, train/loss_vlb_step=0.000242, train/loss_step=0.0713, global_step=775.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  57%|█████▋    | 687/1208 [19:23<14:42,  1.69s/it, loss=0.0654, v_num=0, train/loss_simple_step=0.483, train/loss_vlb_step=0.00543, train/loss_step=0.483, global_step=775.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  57%|█████▋    | 688/1208 [19:27<14:42,  1.70s/it, loss=0.0654, v_num=0, train/loss_simple_step=0.483, train/loss_vlb_step=0.00543, train/loss_step=0.483, global_step=775.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  57%|█████▋    | 688/1208 [19:27<14:42,  1.70s/it, loss=0.0657, v_num=0, train/loss_simple_step=0.0542, train/loss_vlb_step=0.000194, train/loss_step=0.0542, global_step=775.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  57%|█████▋    | 689/1208 [19:28<14:39,  1.70s/it, loss=0.0657, v_num=0, train/loss_simple_step=0.0542, train/loss_vlb_step=0.000194, train/loss_step=0.0542, global_step=775.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  57%|█████▋    | 689/1208 [19:28<14:39,  1.70s/it, loss=0.0775, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00103, train/loss_step=0.247, global_step=776.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  57%|█████▋    | 690/1208 [19:29<14:37,  1.69s/it, loss=0.0775, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00103, train/loss_step=0.247, global_step=776.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  57%|█████▋    | 690/1208 [19:29<14:37,  1.69s/it, loss=0.0735, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000117, train/loss_step=0.0296, global_step=776.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  57%|█████▋    | 691/1208 [19:30<14:35,  1.69s/it, loss=0.0735, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000117, train/loss_step=0.0296, global_step=776.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  57%|█████▋    | 691/1208 [19:30<14:35,  1.69s/it, loss=0.0654, v_num=0, train/loss_simple_step=0.0464, train/loss_vlb_step=0.000167, train/loss_step=0.0464, global_step=776.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  57%|█████▋    | 692/1208 [19:33<14:35,  1.70s/it, loss=0.0654, v_num=0, train/loss_simple_step=0.0464, train/loss_vlb_step=0.000167, train/loss_step=0.0464, global_step=776.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  57%|█████▋    | 692/1208 [19:33<14:35,  1.70s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.534, train/loss_vlb_step=0.0104, train/loss_step=0.534, global_step=776.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  57%|█████▋    | 693/1208 [19:34<14:32,  1.69s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.534, train/loss_vlb_step=0.0104, train/loss_step=0.534, global_step=776.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  57%|█████▋    | 693/1208 [19:34<14:32,  1.69s/it, loss=0.0876, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.05e-5, train/loss_step=0.0112, global_step=777.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  57%|█████▋    | 694/1208 [19:35<14:30,  1.69s/it, loss=0.0876, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.05e-5, train/loss_step=0.0112, global_step=777.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  57%|█████▋    | 694/1208 [19:35<14:30,  1.69s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.0027, train/loss_vlb_step=1.58e-5, train/loss_step=0.0027, global_step=777.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  58%|█████▊    | 695/1208 [19:36<14:28,  1.69s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.0027, train/loss_vlb_step=1.58e-5, train/loss_step=0.0027, global_step=777.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  58%|█████▊    | 695/1208 [19:36<14:28,  1.69s/it, loss=0.0878, v_num=0, train/loss_simple_step=0.054, train/loss_vlb_step=0.000185, train/loss_step=0.054, global_step=777.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  58%|█████▊    | 696/1208 [19:39<14:28,  1.70s/it, loss=0.0878, v_num=0, train/loss_simple_step=0.054, train/loss_vlb_step=0.000185, train/loss_step=0.054, global_step=777.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  58%|█████▊    | 696/1208 [19:39<14:28,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.522, train/loss_vlb_step=0.00811, train/loss_step=0.522, global_step=777.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  58%|█████▊    | 697/1208 [19:41<14:25,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.522, train/loss_vlb_step=0.00811, train/loss_step=0.522, global_step=777.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  58%|█████▊    | 697/1208 [19:41<14:25,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.514, train/loss_vlb_step=0.00971, train/loss_step=0.514, global_step=778.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  58%|█████▊    | 698/1208 [19:42<14:23,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.514, train/loss_vlb_step=0.00971, train/loss_step=0.514, global_step=778.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  58%|█████▊    | 698/1208 [19:42<14:23,  1.69s/it, loss=0.165, v_num=0, train/loss_simple_step=0.536, train/loss_vlb_step=0.00646, train/loss_step=0.536, global_step=778.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  58%|█████▊    | 699/1208 [19:43<14:21,  1.69s/it, loss=0.165, v_num=0, train/loss_simple_step=0.536, train/loss_vlb_step=0.00646, train/loss_step=0.536, global_step=778.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  58%|█████▊    | 699/1208 [19:43<14:21,  1.69s/it, loss=0.17, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000456, train/loss_step=0.134, global_step=778.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  58%|█████▊    | 700/1208 [19:46<14:20,  1.69s/it, loss=0.17, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000456, train/loss_step=0.134, global_step=778.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  58%|█████▊    | 700/1208 [19:46<14:20,  1.69s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000189, train/loss_step=0.0524, global_step=778.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  58%|█████▊    | 701/1208 [19:47<14:18,  1.69s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000189, train/loss_step=0.0524, global_step=778.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  58%|█████▊    | 701/1208 [19:47<14:18,  1.69s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=2.53e-5, train/loss_step=0.00469, global_step=779.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  58%|█████▊    | 702/1208 [19:48<14:16,  1.69s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=2.53e-5, train/loss_step=0.00469, global_step=779.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  58%|█████▊    | 702/1208 [19:48<14:16,  1.69s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0566, train/loss_vlb_step=0.000201, train/loss_step=0.0566, global_step=779.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  58%|█████▊    | 703/1208 [19:49<14:14,  1.69s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0566, train/loss_vlb_step=0.000201, train/loss_step=0.0566, global_step=779.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  58%|█████▊    | 703/1208 [19:49<14:14,  1.69s/it, loss=0.176, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=779.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  58%|█████▊    | 704/1208 [19:52<14:13,  1.69s/it, loss=0.176, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=779.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  58%|█████▊    | 704/1208 [19:52<14:13,  1.69s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0035, train/loss_vlb_step=2.04e-5, train/loss_step=0.0035, global_step=779.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  58%|█████▊    | 705/1208 [19:53<14:11,  1.69s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0035, train/loss_vlb_step=2.04e-5, train/loss_step=0.0035, global_step=779.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  58%|█████▊    | 705/1208 [19:53<14:11,  1.69s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0571, train/loss_vlb_step=0.000198, train/loss_step=0.0571, global_step=780.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  58%|█████▊    | 706/1208 [19:54<14:09,  1.69s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0571, train/loss_vlb_step=0.000198, train/loss_step=0.0571, global_step=780.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  58%|█████▊    | 706/1208 [19:54<14:09,  1.69s/it, loss=0.194, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00664, train/loss_step=0.428, global_step=780.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  59%|█████▊    | 707/1208 [19:55<14:07,  1.69s/it, loss=0.194, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00664, train/loss_step=0.428, global_step=780.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  59%|█████▊    | 707/1208 [19:55<14:07,  1.69s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0341, train/loss_vlb_step=0.00013, train/loss_step=0.0341, global_step=780.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  59%|█████▊    | 708/1208 [19:59<14:06,  1.69s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0341, train/loss_vlb_step=0.00013, train/loss_step=0.0341, global_step=780.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  59%|█████▊    | 708/1208 [19:59<14:06,  1.69s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000103, train/loss_step=0.0265, global_step=780.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  59%|█████▊    | 709/1208 [20:00<14:04,  1.69s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000103, train/loss_step=0.0265, global_step=780.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  59%|█████▊    | 709/1208 [20:00<14:04,  1.69s/it, loss=0.182, v_num=0, train/loss_simple_step=0.495, train/loss_vlb_step=0.00429, train/loss_step=0.495, global_step=781.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  59%|█████▉    | 710/1208 [20:01<14:02,  1.69s/it, loss=0.182, v_num=0, train/loss_simple_step=0.495, train/loss_vlb_step=0.00429, train/loss_step=0.495, global_step=781.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  59%|█████▉    | 710/1208 [20:01<14:02,  1.69s/it, loss=0.193, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00112, train/loss_step=0.251, global_step=781.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  59%|█████▉    | 711/1208 [20:02<14:00,  1.69s/it, loss=0.193, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00112, train/loss_step=0.251, global_step=781.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  59%|█████▉    | 711/1208 [20:02<14:00,  1.69s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0568, train/loss_vlb_step=0.000203, train/loss_step=0.0568, global_step=781.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  59%|█████▉    | 712/1208 [20:05<13:59,  1.69s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0568, train/loss_vlb_step=0.000203, train/loss_step=0.0568, global_step=781.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  59%|█████▉    | 712/1208 [20:05<13:59,  1.69s/it, loss=0.182, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00128, train/loss_step=0.291, global_step=781.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  59%|█████▉    | 713/1208 [20:06<13:57,  1.69s/it, loss=0.182, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00128, train/loss_step=0.291, global_step=781.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  59%|█████▉    | 713/1208 [20:06<13:57,  1.69s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=2.16e-5, train/loss_step=0.00392, global_step=782.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  59%|█████▉    | 714/1208 [20:07<13:55,  1.69s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=2.16e-5, train/loss_step=0.00392, global_step=782.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  59%|█████▉    | 714/1208 [20:07<13:55,  1.69s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=2.62e-5, train/loss_step=0.00495, global_step=782.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  59%|█████▉    | 715/1208 [20:08<13:53,  1.69s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=2.62e-5, train/loss_step=0.00495, global_step=782.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  59%|█████▉    | 715/1208 [20:08<13:53,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000107, train/loss_step=0.0288, global_step=782.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  59%|█████▉    | 716/1208 [20:11<13:52,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000107, train/loss_step=0.0288, global_step=782.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  59%|█████▉    | 716/1208 [20:11<13:52,  1.69s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0517, train/loss_vlb_step=0.000187, train/loss_step=0.0517, global_step=782.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  59%|█████▉    | 717/1208 [20:13<13:50,  1.69s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0517, train/loss_vlb_step=0.000187, train/loss_step=0.0517, global_step=782.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  59%|█████▉    | 717/1208 [20:13<13:50,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00685, train/loss_vlb_step=3.52e-5, train/loss_step=0.00685, global_step=783.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  59%|█████▉    | 718/1208 [20:14<13:48,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00685, train/loss_vlb_step=3.52e-5, train/loss_step=0.00685, global_step=783.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  59%|█████▉    | 718/1208 [20:14<13:48,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.00119, train/loss_step=0.242, global_step=783.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  60%|█████▉    | 719/1208 [20:15<13:46,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.00119, train/loss_step=0.242, global_step=783.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  60%|█████▉    | 719/1208 [20:15<13:46,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00177, train/loss_step=0.296, global_step=783.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  60%|█████▉    | 720/1208 [20:18<13:45,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00177, train/loss_step=0.296, global_step=783.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  60%|█████▉    | 720/1208 [20:18<13:45,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000495, train/loss_step=0.148, global_step=783.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  60%|█████▉    | 721/1208 [20:19<13:43,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000495, train/loss_step=0.148, global_step=783.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  60%|█████▉    | 721/1208 [20:19<13:43,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0993, train/loss_vlb_step=0.000326, train/loss_step=0.0993, global_step=784.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  60%|█████▉    | 722/1208 [20:20<13:41,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0993, train/loss_vlb_step=0.000326, train/loss_step=0.0993, global_step=784.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  60%|█████▉    | 722/1208 [20:20<13:41,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.15e-5, train/loss_step=0.00205, global_step=784.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  60%|█████▉    | 723/1208 [20:21<13:39,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.15e-5, train/loss_step=0.00205, global_step=784.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  60%|█████▉    | 723/1208 [20:21<13:39,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000678, train/loss_step=0.190, global_step=784.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  60%|█████▉    | 724/1208 [20:24<13:38,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000678, train/loss_step=0.190, global_step=784.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  60%|█████▉    | 724/1208 [20:24<13:38,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00564, train/loss_vlb_step=2.94e-5, train/loss_step=0.00564, global_step=784.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  60%|██████    | 725/1208 [20:25<13:36,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00564, train/loss_vlb_step=2.94e-5, train/loss_step=0.00564, global_step=784.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  60%|██████    | 725/1208 [20:25<13:36,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=2.03e-5, train/loss_step=0.00359, global_step=785.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  60%|██████    | 726/1208 [20:26<13:34,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=2.03e-5, train/loss_step=0.00359, global_step=785.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  60%|██████    | 726/1208 [20:26<13:34,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00604, train/loss_vlb_step=3.1e-5, train/loss_step=0.00604, global_step=785.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  60%|██████    | 727/1208 [20:27<13:32,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00604, train/loss_vlb_step=3.1e-5, train/loss_step=0.00604, global_step=785.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  60%|██████    | 727/1208 [20:27<13:32,  1.69s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.08e-5, train/loss_step=0.0171, global_step=785.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  60%|██████    | 728/1208 [20:31<13:31,  1.69s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.08e-5, train/loss_step=0.0171, global_step=785.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  60%|██████    | 728/1208 [20:31<13:31,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.541, train/loss_vlb_step=0.00733, train/loss_step=0.541, global_step=785.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  60%|██████    | 729/1208 [20:32<13:29,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.541, train/loss_vlb_step=0.00733, train/loss_step=0.541, global_step=785.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  60%|██████    | 729/1208 [20:32<13:29,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0919, train/loss_vlb_step=0.000303, train/loss_step=0.0919, global_step=786.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  60%|██████    | 730/1208 [20:33<13:27,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0919, train/loss_vlb_step=0.000303, train/loss_step=0.0919, global_step=786.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  60%|██████    | 730/1208 [20:33<13:27,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0675, train/loss_vlb_step=0.000227, train/loss_step=0.0675, global_step=786.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  61%|██████    | 731/1208 [20:34<13:25,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0675, train/loss_vlb_step=0.000227, train/loss_step=0.0675, global_step=786.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  61%|██████    | 731/1208 [20:34<13:25,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000717, train/loss_step=0.199, global_step=786.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  61%|██████    | 732/1208 [20:37<13:24,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000717, train/loss_step=0.199, global_step=786.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  61%|██████    | 732/1208 [20:37<13:24,  1.69s/it, loss=0.11, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000754, train/loss_step=0.201, global_step=786.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  61%|██████    | 733/1208 [20:38<13:22,  1.69s/it, loss=0.11, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000754, train/loss_step=0.201, global_step=786.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  61%|██████    | 733/1208 [20:38<13:22,  1.69s/it, loss=0.111, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000111, train/loss_step=0.026, global_step=787.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  61%|██████    | 734/1208 [20:39<13:20,  1.69s/it, loss=0.111, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000111, train/loss_step=0.026, global_step=787.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  61%|██████    | 734/1208 [20:39<13:20,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.0017, train/loss_step=0.298, global_step=787.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  61%|██████    | 735/1208 [20:40<13:18,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.0017, train/loss_step=0.298, global_step=787.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  61%|██████    | 735/1208 [20:40<13:18,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.55e-5, train/loss_step=0.0127, global_step=787.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  61%|██████    | 736/1208 [20:44<13:17,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.55e-5, train/loss_step=0.0127, global_step=787.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  61%|██████    | 736/1208 [20:44<13:17,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00113, train/loss_step=0.283, global_step=787.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  61%|██████    | 737/1208 [20:45<13:15,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00113, train/loss_step=0.283, global_step=787.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  61%|██████    | 737/1208 [20:45<13:15,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0687, train/loss_vlb_step=0.000237, train/loss_step=0.0687, global_step=788.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  61%|██████    | 738/1208 [20:46<13:13,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0687, train/loss_vlb_step=0.000237, train/loss_step=0.0687, global_step=788.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  61%|██████    | 738/1208 [20:46<13:13,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=788.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  61%|██████    | 739/1208 [20:47<13:11,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=788.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  61%|██████    | 739/1208 [20:47<13:11,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000108, train/loss_step=0.0265, global_step=788.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  61%|██████▏   | 740/1208 [20:50<13:10,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000108, train/loss_step=0.0265, global_step=788.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  61%|██████▏   | 740/1208 [20:50<13:10,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00427, train/loss_vlb_step=2.26e-5, train/loss_step=0.00427, global_step=788.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  61%|██████▏   | 741/1208 [20:51<13:08,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00427, train/loss_vlb_step=2.26e-5, train/loss_step=0.00427, global_step=788.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  61%|██████▏   | 741/1208 [20:51<13:08,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000886, train/loss_step=0.239, global_step=789.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  61%|██████▏   | 742/1208 [20:52<13:06,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000886, train/loss_step=0.239, global_step=789.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  61%|██████▏   | 742/1208 [20:52<13:06,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000598, train/loss_step=0.177, global_step=789.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  62%|██████▏   | 743/1208 [20:53<13:04,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000598, train/loss_step=0.177, global_step=789.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  62%|██████▏   | 743/1208 [20:53<13:04,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000249, train/loss_step=0.0741, global_step=789.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  62%|██████▏   | 744/1208 [20:56<13:03,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000249, train/loss_step=0.0741, global_step=789.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  62%|██████▏   | 744/1208 [20:56<13:03,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.00011, train/loss_step=0.0268, global_step=789.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  62%|██████▏   | 745/1208 [20:57<13:01,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.00011, train/loss_step=0.0268, global_step=789.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  62%|██████▏   | 745/1208 [20:57<13:01,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.567, train/loss_vlb_step=0.00723, train/loss_step=0.567, global_step=790.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  62%|██████▏   | 746/1208 [20:58<12:59,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.567, train/loss_vlb_step=0.00723, train/loss_step=0.567, global_step=790.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  62%|██████▏   | 746/1208 [20:58<12:59,  1.69s/it, loss=0.179, v_num=0, train/loss_simple_step=0.532, train/loss_vlb_step=0.00553, train/loss_step=0.532, global_step=790.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  62%|██████▏   | 747/1208 [21:00<12:57,  1.69s/it, loss=0.179, v_num=0, train/loss_simple_step=0.532, train/loss_vlb_step=0.00553, train/loss_step=0.532, global_step=790.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  62%|██████▏   | 747/1208 [21:00<12:57,  1.69s/it, loss=0.179, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.96e-5, train/loss_step=0.013, global_step=790.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  62%|██████▏   | 748/1208 [21:03<12:56,  1.69s/it, loss=0.179, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.96e-5, train/loss_step=0.013, global_step=790.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  62%|██████▏   | 748/1208 [21:03<12:56,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.5e-5, train/loss_step=0.0172, global_step=790.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  62%|██████▏   | 749/1208 [21:04<12:54,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.5e-5, train/loss_step=0.0172, global_step=790.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  62%|██████▏   | 749/1208 [21:04<12:54,  1.69s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.51e-5, train/loss_step=0.0116, global_step=791.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  62%|██████▏   | 750/1208 [21:05<12:52,  1.69s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.51e-5, train/loss_step=0.0116, global_step=791.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  62%|██████▏   | 750/1208 [21:05<12:52,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00149, train/loss_step=0.307, global_step=791.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  62%|██████▏   | 751/1208 [21:06<12:50,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00149, train/loss_step=0.307, global_step=791.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  62%|██████▏   | 751/1208 [21:06<12:50,  1.69s/it, loss=0.161, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000772, train/loss_step=0.202, global_step=791.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  62%|██████▏   | 752/1208 [21:09<12:49,  1.69s/it, loss=0.161, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000772, train/loss_step=0.202, global_step=791.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  62%|██████▏   | 752/1208 [21:09<12:49,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00666, train/loss_vlb_step=3.34e-5, train/loss_step=0.00666, global_step=791.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  62%|██████▏   | 753/1208 [21:10<12:47,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00666, train/loss_vlb_step=3.34e-5, train/loss_step=0.00666, global_step=791.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  62%|██████▏   | 753/1208 [21:10<12:47,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.76e-5, train/loss_step=0.0106, global_step=792.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  62%|██████▏   | 754/1208 [21:11<12:45,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.76e-5, train/loss_step=0.0106, global_step=792.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  62%|██████▏   | 754/1208 [21:11<12:45,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.4e-5, train/loss_step=0.0169, global_step=792.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  62%|██████▎   | 755/1208 [21:12<12:43,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.4e-5, train/loss_step=0.0169, global_step=792.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  62%|██████▎   | 755/1208 [21:12<12:43,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000111, train/loss_step=0.0281, global_step=792.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  63%|██████▎   | 756/1208 [21:16<12:42,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000111, train/loss_step=0.0281, global_step=792.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  63%|██████▎   | 756/1208 [21:16<12:42,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0748, train/loss_vlb_step=0.000248, train/loss_step=0.0748, global_step=792.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  63%|██████▎   | 757/1208 [21:17<12:40,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0748, train/loss_vlb_step=0.000248, train/loss_step=0.0748, global_step=792.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  63%|██████▎   | 757/1208 [21:17<12:40,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000466, train/loss_step=0.141, global_step=793.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  63%|██████▎   | 758/1208 [21:18<12:38,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000466, train/loss_step=0.141, global_step=793.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  63%|██████▎   | 758/1208 [21:18<12:38,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.00373, train/loss_step=0.406, global_step=793.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  63%|██████▎   | 759/1208 [21:19<12:36,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.00373, train/loss_step=0.406, global_step=793.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  63%|██████▎   | 759/1208 [21:19<12:36,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000114, train/loss_step=0.0291, global_step=793.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  63%|██████▎   | 760/1208 [21:22<12:35,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000114, train/loss_step=0.0291, global_step=793.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  63%|██████▎   | 760/1208 [21:22<12:35,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=1.93e-5, train/loss_step=0.00334, global_step=793.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  63%|██████▎   | 761/1208 [21:23<12:33,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=1.93e-5, train/loss_step=0.00334, global_step=793.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  63%|██████▎   | 761/1208 [21:23<12:33,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000498, train/loss_step=0.150, global_step=794.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  63%|██████▎   | 762/1208 [21:24<12:31,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000498, train/loss_step=0.150, global_step=794.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  63%|██████▎   | 762/1208 [21:24<12:31,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=2.82e-5, train/loss_step=0.00526, global_step=794.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  63%|██████▎   | 763/1208 [21:25<12:29,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=2.82e-5, train/loss_step=0.00526, global_step=794.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  63%|██████▎   | 763/1208 [21:25<12:29,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00139, train/loss_step=0.325, global_step=794.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  63%|██████▎   | 764/1208 [21:28<12:29,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00139, train/loss_step=0.325, global_step=794.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  63%|██████▎   | 764/1208 [21:28<12:29,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.28e-5, train/loss_step=0.0143, global_step=794.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  63%|██████▎   | 765/1208 [21:29<12:27,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.28e-5, train/loss_step=0.0143, global_step=794.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  63%|██████▎   | 765/1208 [21:29<12:27,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=795.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  63%|██████▎   | 766/1208 [21:31<12:24,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=795.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  63%|██████▎   | 766/1208 [21:31<12:24,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000507, train/loss_step=0.154, global_step=795.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  63%|██████▎   | 767/1208 [21:32<12:22,  1.68s/it, loss=0.102, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000507, train/loss_step=0.154, global_step=795.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  63%|██████▎   | 767/1208 [21:32<12:22,  1.68s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000251, train/loss_step=0.0732, global_step=795.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  64%|██████▎   | 768/1208 [21:35<12:22,  1.69s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000251, train/loss_step=0.0732, global_step=795.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  64%|██████▎   | 768/1208 [21:35<12:22,  1.69s/it, loss=0.119, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00158, train/loss_step=0.298, global_step=795.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  64%|██████▎   | 769/1208 [21:36<12:20,  1.69s/it, loss=0.119, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00158, train/loss_step=0.298, global_step=795.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  64%|██████▎   | 769/1208 [21:36<12:20,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.000208, train/loss_step=0.0598, global_step=796.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  64%|██████▎   | 770/1208 [21:37<12:18,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.000208, train/loss_step=0.0598, global_step=796.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  64%|██████▎   | 770/1208 [21:37<12:18,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000667, train/loss_step=0.177, global_step=796.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  64%|██████▍   | 771/1208 [21:38<12:15,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000667, train/loss_step=0.177, global_step=796.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  64%|██████▍   | 771/1208 [21:38<12:15,  1.68s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0674, train/loss_vlb_step=0.000229, train/loss_step=0.0674, global_step=796.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  64%|██████▍   | 772/1208 [21:41<12:15,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0674, train/loss_vlb_step=0.000229, train/loss_step=0.0674, global_step=796.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  64%|██████▍   | 772/1208 [21:41<12:15,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=7.19e-5, train/loss_step=0.016, global_step=796.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  64%|██████▍   | 773/1208 [21:42<12:13,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=7.19e-5, train/loss_step=0.016, global_step=796.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  64%|██████▍   | 773/1208 [21:42<12:13,  1.69s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0271, train/loss_vlb_step=0.000108, train/loss_step=0.0271, global_step=797.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  64%|██████▍   | 774/1208 [21:43<12:11,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0271, train/loss_vlb_step=0.000108, train/loss_step=0.0271, global_step=797.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  64%|██████▍   | 774/1208 [21:43<12:11,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00944, train/loss_vlb_step=4.19e-5, train/loss_step=0.00944, global_step=797.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  64%|██████▍   | 775/1208 [21:44<12:09,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00944, train/loss_vlb_step=4.19e-5, train/loss_step=0.00944, global_step=797.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  64%|██████▍   | 775/1208 [21:44<12:09,  1.68s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.57e-5, train/loss_step=0.0197, global_step=797.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  64%|██████▍   | 776/1208 [21:48<12:08,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.57e-5, train/loss_step=0.0197, global_step=797.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  64%|██████▍   | 776/1208 [21:48<12:08,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000722, train/loss_step=0.206, global_step=797.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  64%|██████▍   | 777/1208 [21:49<12:06,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000722, train/loss_step=0.206, global_step=797.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  64%|██████▍   | 777/1208 [21:49<12:06,  1.68s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0509, train/loss_vlb_step=0.00018, train/loss_step=0.0509, global_step=798.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  64%|██████▍   | 778/1208 [21:50<12:04,  1.68s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0509, train/loss_vlb_step=0.00018, train/loss_step=0.0509, global_step=798.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  64%|██████▍   | 778/1208 [21:50<12:04,  1.68s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000503, train/loss_step=0.150, global_step=798.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  64%|██████▍   | 779/1208 [21:51<12:02,  1.68s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000503, train/loss_step=0.150, global_step=798.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  64%|██████▍   | 779/1208 [21:51<12:02,  1.68s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.76e-5, train/loss_step=0.0149, global_step=798.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  65%|██████▍   | 780/1208 [21:54<12:01,  1.69s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.76e-5, train/loss_step=0.0149, global_step=798.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  65%|██████▍   | 780/1208 [21:54<12:01,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.00267, train/loss_step=0.400, global_step=798.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  65%|██████▍   | 781/1208 [21:55<11:59,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.00267, train/loss_step=0.400, global_step=798.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  65%|██████▍   | 781/1208 [21:55<11:59,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00487, train/loss_vlb_step=2.6e-5, train/loss_step=0.00487, global_step=799.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  65%|██████▍   | 782/1208 [21:56<11:57,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00487, train/loss_vlb_step=2.6e-5, train/loss_step=0.00487, global_step=799.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  65%|██████▍   | 782/1208 [21:56<11:57,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000843, train/loss_step=0.223, global_step=799.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  65%|██████▍   | 783/1208 [21:57<11:55,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000843, train/loss_step=0.223, global_step=799.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  65%|██████▍   | 783/1208 [21:57<11:55,  1.68s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0491, train/loss_vlb_step=0.000176, train/loss_step=0.0491, global_step=799.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  65%|██████▍   | 784/1208 [22:00<11:54,  1.68s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0491, train/loss_vlb_step=0.000176, train/loss_step=0.0491, global_step=799.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  65%|██████▍   | 784/1208 [22:00<11:54,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000771, train/loss_step=0.219, global_step=799.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  65%|██████▍   | 785/1208 [22:01<11:52,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000771, train/loss_step=0.219, global_step=799.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  65%|██████▍   | 785/1208 [22:01<11:52,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.000217, train/loss_step=0.062, global_step=800.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  65%|██████▌   | 786/1208 [22:02<11:50,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.000217, train/loss_step=0.062, global_step=800.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  65%|██████▌   | 786/1208 [22:02<11:50,  1.68s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0733, train/loss_vlb_step=0.000247, train/loss_step=0.0733, global_step=800.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  65%|██████▌   | 787/1208 [22:04<11:48,  1.68s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0733, train/loss_vlb_step=0.000247, train/loss_step=0.0733, global_step=800.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  65%|██████▌   | 787/1208 [22:04<11:48,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000543, train/loss_step=0.160, global_step=800.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  65%|██████▌   | 788/1208 [22:07<11:47,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000543, train/loss_step=0.160, global_step=800.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  65%|██████▌   | 788/1208 [22:07<11:47,  1.68s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0823, train/loss_vlb_step=0.000275, train/loss_step=0.0823, global_step=800.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  65%|██████▌   | 789/1208 [22:08<11:45,  1.68s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0823, train/loss_vlb_step=0.000275, train/loss_step=0.0823, global_step=800.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  65%|██████▌   | 789/1208 [22:08<11:45,  1.68s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00667, train/loss_vlb_step=3.32e-5, train/loss_step=0.00667, global_step=801.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  65%|██████▌   | 790/1208 [22:09<11:43,  1.68s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00667, train/loss_vlb_step=3.32e-5, train/loss_step=0.00667, global_step=801.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  65%|██████▌   | 790/1208 [22:09<11:43,  1.68s/it, loss=0.0943, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000159, train/loss_step=0.0454, global_step=801.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  65%|██████▌   | 791/1208 [22:10<11:41,  1.68s/it, loss=0.0943, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000159, train/loss_step=0.0454, global_step=801.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  65%|██████▌   | 791/1208 [22:10<11:41,  1.68s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000115, train/loss_step=0.0296, global_step=801.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  66%|██████▌   | 792/1208 [22:13<11:40,  1.68s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000115, train/loss_step=0.0296, global_step=801.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  66%|██████▌   | 792/1208 [22:13<11:40,  1.68s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.37e-5, train/loss_step=0.0197, global_step=801.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  66%|██████▌   | 793/1208 [22:14<11:38,  1.68s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.37e-5, train/loss_step=0.0197, global_step=801.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  66%|██████▌   | 793/1208 [22:14<11:38,  1.68s/it, loss=0.0923, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.52e-5, train/loss_step=0.0203, global_step=802.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  66%|██████▌   | 794/1208 [22:15<11:36,  1.68s/it, loss=0.0923, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.52e-5, train/loss_step=0.0203, global_step=802.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  66%|██████▌   | 794/1208 [22:15<11:36,  1.68s/it, loss=0.116, v_num=0, train/loss_simple_step=0.484, train/loss_vlb_step=0.00451, train/loss_step=0.484, global_step=802.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  66%|██████▌   | 795/1208 [22:16<11:34,  1.68s/it, loss=0.116, v_num=0, train/loss_simple_step=0.484, train/loss_vlb_step=0.00451, train/loss_step=0.484, global_step=802.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  66%|██████▌   | 795/1208 [22:16<11:34,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000489, train/loss_step=0.147, global_step=802.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  66%|██████▌   | 796/1208 [22:19<11:33,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000489, train/loss_step=0.147, global_step=802.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  66%|██████▌   | 796/1208 [22:19<11:33,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0973, train/loss_vlb_step=0.000327, train/loss_step=0.0973, global_step=802.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  66%|██████▌   | 797/1208 [22:21<11:31,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0973, train/loss_vlb_step=0.000327, train/loss_step=0.0973, global_step=802.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  66%|██████▌   | 797/1208 [22:21<11:31,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00393, train/loss_vlb_step=2.09e-5, train/loss_step=0.00393, global_step=803.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  66%|██████▌   | 798/1208 [22:22<11:29,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00393, train/loss_vlb_step=2.09e-5, train/loss_step=0.00393, global_step=803.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  66%|██████▌   | 798/1208 [22:22<11:29,  1.68s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0651, train/loss_vlb_step=0.000224, train/loss_step=0.0651, global_step=803.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  66%|██████▌   | 799/1208 [22:23<11:27,  1.68s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0651, train/loss_vlb_step=0.000224, train/loss_step=0.0651, global_step=803.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  66%|██████▌   | 799/1208 [22:23<11:27,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000865, train/loss_step=0.229, global_step=803.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  66%|██████▌   | 800/1208 [22:26<11:26,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000865, train/loss_step=0.229, global_step=803.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  66%|██████▌   | 800/1208 [22:26<11:26,  1.68s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=1.96e-5, train/loss_step=0.0036, global_step=803.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  66%|██████▋   | 801/1208 [22:27<11:24,  1.68s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=1.96e-5, train/loss_step=0.0036, global_step=803.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  66%|██████▋   | 801/1208 [22:27<11:24,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000506, train/loss_step=0.153, global_step=804.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  66%|██████▋   | 802/1208 [22:28<11:22,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000506, train/loss_step=0.153, global_step=804.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  66%|██████▋   | 802/1208 [22:28<11:22,  1.68s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.000114, train/loss_step=0.0276, global_step=804.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  66%|██████▋   | 803/1208 [22:29<11:20,  1.68s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.000114, train/loss_step=0.0276, global_step=804.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  66%|██████▋   | 803/1208 [22:29<11:20,  1.68s/it, loss=0.101, v_num=0, train/loss_simple_step=0.098, train/loss_vlb_step=0.000324, train/loss_step=0.098, global_step=804.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  67%|██████▋   | 804/1208 [22:32<11:19,  1.68s/it, loss=0.101, v_num=0, train/loss_simple_step=0.098, train/loss_vlb_step=0.000324, train/loss_step=0.098, global_step=804.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  67%|██████▋   | 804/1208 [22:32<11:19,  1.68s/it, loss=0.0917, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.000102, train/loss_step=0.0256, global_step=804.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  67%|██████▋   | 805/1208 [22:33<11:17,  1.68s/it, loss=0.0917, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.000102, train/loss_step=0.0256, global_step=804.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  67%|██████▋   | 805/1208 [22:33<11:17,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.517, train/loss_vlb_step=0.00523, train/loss_step=0.517, global_step=805.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  67%|██████▋   | 806/1208 [22:34<11:15,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.517, train/loss_vlb_step=0.00523, train/loss_step=0.517, global_step=805.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  67%|██████▋   | 806/1208 [22:34<11:15,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.691, train/loss_vlb_step=0.0278, train/loss_step=0.691, global_step=805.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  67%|██████▋   | 807/1208 [22:35<11:13,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.691, train/loss_vlb_step=0.0278, train/loss_step=0.691, global_step=805.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  67%|██████▋   | 807/1208 [22:35<11:13,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0735, train/loss_vlb_step=0.000244, train/loss_step=0.0735, global_step=805.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  67%|██████▋   | 808/1208 [22:39<11:12,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0735, train/loss_vlb_step=0.000244, train/loss_step=0.0735, global_step=805.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  67%|██████▋   | 808/1208 [22:39<11:12,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00261, train/loss_step=0.388, global_step=805.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  67%|██████▋   | 809/1208 [22:40<11:10,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00261, train/loss_step=0.388, global_step=805.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  67%|██████▋   | 809/1208 [22:40<11:10,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=8.16e-5, train/loss_step=0.0191, global_step=806.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  67%|██████▋   | 810/1208 [22:41<11:08,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=8.16e-5, train/loss_step=0.0191, global_step=806.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  67%|██████▋   | 810/1208 [22:41<11:08,  1.68s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00485, train/loss_vlb_step=2.61e-5, train/loss_step=0.00485, global_step=806.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  67%|██████▋   | 811/1208 [22:42<11:06,  1.68s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00485, train/loss_vlb_step=2.61e-5, train/loss_step=0.00485, global_step=806.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  67%|██████▋   | 811/1208 [22:42<11:06,  1.68s/it, loss=0.172, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00261, train/loss_step=0.376, global_step=806.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  67%|██████▋   | 812/1208 [22:45<11:05,  1.68s/it, loss=0.172, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00261, train/loss_step=0.376, global_step=806.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  67%|██████▋   | 812/1208 [22:45<11:05,  1.68s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00954, train/loss_vlb_step=4.45e-5, train/loss_step=0.00954, global_step=806.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  67%|██████▋   | 813/1208 [22:46<11:03,  1.68s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00954, train/loss_vlb_step=4.45e-5, train/loss_step=0.00954, global_step=806.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  67%|██████▋   | 813/1208 [22:46<11:03,  1.68s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000155, train/loss_step=0.0415, global_step=807.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  67%|██████▋   | 814/1208 [22:47<11:01,  1.68s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000155, train/loss_step=0.0415, global_step=807.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  67%|██████▋   | 814/1208 [22:47<11:01,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00329, train/loss_vlb_step=1.82e-5, train/loss_step=0.00329, global_step=807.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  67%|██████▋   | 815/1208 [22:48<10:59,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00329, train/loss_vlb_step=1.82e-5, train/loss_step=0.00329, global_step=807.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  67%|██████▋   | 815/1208 [22:48<10:59,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00657, train/loss_vlb_step=3.32e-5, train/loss_step=0.00657, global_step=807.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  68%|██████▊   | 816/1208 [22:51<10:58,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00657, train/loss_vlb_step=3.32e-5, train/loss_step=0.00657, global_step=807.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  68%|██████▊   | 816/1208 [22:51<10:58,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000411, train/loss_step=0.125, global_step=807.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  68%|██████▊   | 817/1208 [22:52<10:57,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000411, train/loss_step=0.125, global_step=807.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  68%|██████▊   | 817/1208 [22:52<10:57,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00662, train/loss_vlb_step=3.21e-5, train/loss_step=0.00662, global_step=808.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  68%|██████▊   | 818/1208 [22:53<10:55,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00662, train/loss_vlb_step=3.21e-5, train/loss_step=0.00662, global_step=808.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  68%|██████▊   | 818/1208 [22:53<10:55,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.73e-5, train/loss_step=0.0119, global_step=808.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  68%|██████▊   | 819/1208 [22:54<10:53,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.73e-5, train/loss_step=0.0119, global_step=808.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  68%|██████▊   | 819/1208 [22:54<10:53,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000508, train/loss_step=0.147, global_step=808.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  68%|██████▊   | 820/1208 [22:58<10:52,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000508, train/loss_step=0.147, global_step=808.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  68%|██████▊   | 820/1208 [22:58<10:52,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00318, train/loss_vlb_step=1.78e-5, train/loss_step=0.00318, global_step=808.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  68%|██████▊   | 821/1208 [22:59<10:50,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00318, train/loss_vlb_step=1.78e-5, train/loss_step=0.00318, global_step=808.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  68%|██████▊   | 821/1208 [22:59<10:50,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.0012, train/loss_step=0.292, global_step=809.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]     Epoch 2:  68%|██████▊   | 822/1208 [23:00<10:48,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.0012, train/loss_step=0.292, global_step=809.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  68%|██████▊   | 822/1208 [23:00<10:48,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00944, train/loss_vlb_step=4.53e-5, train/loss_step=0.00944, global_step=809.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  68%|██████▊   | 823/1208 [23:01<10:46,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00944, train/loss_vlb_step=4.53e-5, train/loss_step=0.00944, global_step=809.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  68%|██████▊   | 823/1208 [23:01<10:46,  1.68s/it, loss=0.166, v_num=0, train/loss_simple_step=0.559, train/loss_vlb_step=0.00827, train/loss_step=0.559, global_step=809.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  68%|██████▊   | 824/1208 [23:04<10:45,  1.68s/it, loss=0.166, v_num=0, train/loss_simple_step=0.559, train/loss_vlb_step=0.00827, train/loss_step=0.559, global_step=809.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  68%|██████▊   | 824/1208 [23:04<10:45,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.95e-5, train/loss_step=0.0233, global_step=809.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  68%|██████▊   | 825/1208 [23:05<10:43,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.95e-5, train/loss_step=0.0233, global_step=809.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  68%|██████▊   | 825/1208 [23:05<10:43,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00566, train/loss_vlb_step=2.91e-5, train/loss_step=0.00566, global_step=810.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  68%|██████▊   | 826/1208 [23:06<10:41,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00566, train/loss_vlb_step=2.91e-5, train/loss_step=0.00566, global_step=810.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  68%|██████▊   | 826/1208 [23:06<10:41,  1.68s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0093, train/loss_vlb_step=4.47e-5, train/loss_step=0.0093, global_step=810.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  68%|██████▊   | 827/1208 [23:07<10:39,  1.68s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0093, train/loss_vlb_step=4.47e-5, train/loss_step=0.0093, global_step=810.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  68%|██████▊   | 827/1208 [23:07<10:39,  1.68s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0872, train/loss_vlb_step=0.000293, train/loss_step=0.0872, global_step=810.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  69%|██████▊   | 828/1208 [23:10<10:38,  1.68s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0872, train/loss_vlb_step=0.000293, train/loss_step=0.0872, global_step=810.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  69%|██████▊   | 828/1208 [23:10<10:38,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00406, train/loss_step=0.442, global_step=810.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  69%|██████▊   | 829/1208 [23:11<10:36,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00406, train/loss_step=0.442, global_step=810.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  69%|██████▊   | 829/1208 [23:11<10:36,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00968, train/loss_vlb_step=4.71e-5, train/loss_step=0.00968, global_step=811.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  69%|██████▊   | 830/1208 [23:12<10:34,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00968, train/loss_vlb_step=4.71e-5, train/loss_step=0.00968, global_step=811.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  69%|██████▊   | 830/1208 [23:12<10:34,  1.68s/it, loss=0.111, v_num=0, train/loss_simple_step=0.046, train/loss_vlb_step=0.00016, train/loss_step=0.046, global_step=811.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  69%|██████▉   | 831/1208 [23:13<10:32,  1.68s/it, loss=0.111, v_num=0, train/loss_simple_step=0.046, train/loss_vlb_step=0.00016, train/loss_step=0.046, global_step=811.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  69%|██████▉   | 831/1208 [23:13<10:32,  1.68s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.00379, train/loss_vlb_step=2.11e-5, train/loss_step=0.00379, global_step=811.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  69%|██████▉   | 832/1208 [23:16<10:31,  1.68s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.00379, train/loss_vlb_step=2.11e-5, train/loss_step=0.00379, global_step=811.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  69%|██████▉   | 832/1208 [23:16<10:31,  1.68s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000174, train/loss_step=0.0484, global_step=811.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  69%|██████▉   | 833/1208 [23:17<10:29,  1.68s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000174, train/loss_step=0.0484, global_step=811.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  69%|██████▉   | 833/1208 [23:17<10:29,  1.68s/it, loss=0.105, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00113, train/loss_step=0.267, global_step=812.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  69%|██████▉   | 834/1208 [23:18<10:27,  1.68s/it, loss=0.105, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00113, train/loss_step=0.267, global_step=812.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  69%|██████▉   | 834/1208 [23:18<10:27,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.0014, train/loss_step=0.294, global_step=812.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  69%|██████▉   | 835/1208 [23:19<10:25,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.0014, train/loss_step=0.294, global_step=812.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  69%|██████▉   | 835/1208 [23:19<10:25,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=6.91e-5, train/loss_step=0.0166, global_step=812.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  69%|██████▉   | 836/1208 [23:23<10:24,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=6.91e-5, train/loss_step=0.0166, global_step=812.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  69%|██████▉   | 836/1208 [23:23<10:24,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00652, train/loss_vlb_step=3.27e-5, train/loss_step=0.00652, global_step=812.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  69%|██████▉   | 837/1208 [23:24<10:22,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00652, train/loss_vlb_step=3.27e-5, train/loss_step=0.00652, global_step=812.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  69%|██████▉   | 837/1208 [23:24<10:22,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000923, train/loss_step=0.242, global_step=813.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  69%|██████▉   | 838/1208 [23:25<10:20,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000923, train/loss_step=0.242, global_step=813.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  69%|██████▉   | 838/1208 [23:25<10:20,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.49e-5, train/loss_step=0.0146, global_step=813.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  69%|██████▉   | 839/1208 [23:26<10:18,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.49e-5, train/loss_step=0.0146, global_step=813.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  69%|██████▉   | 839/1208 [23:26<10:18,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.000176, train/loss_step=0.0462, global_step=813.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  70%|██████▉   | 840/1208 [23:29<10:17,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.000176, train/loss_step=0.0462, global_step=813.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  70%|██████▉   | 840/1208 [23:29<10:17,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=2.59e-5, train/loss_step=0.00495, global_step=813.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  70%|██████▉   | 841/1208 [23:30<10:15,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=2.59e-5, train/loss_step=0.00495, global_step=813.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  70%|██████▉   | 841/1208 [23:30<10:15,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000836, train/loss_step=0.214, global_step=814.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  70%|██████▉   | 842/1208 [23:31<10:13,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000836, train/loss_step=0.214, global_step=814.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  70%|██████▉   | 842/1208 [23:31<10:13,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000112, train/loss_step=0.0281, global_step=814.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  70%|██████▉   | 843/1208 [23:32<10:11,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000112, train/loss_step=0.0281, global_step=814.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  70%|██████▉   | 843/1208 [23:32<10:11,  1.68s/it, loss=0.106, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00142, train/loss_step=0.305, global_step=814.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  70%|██████▉   | 844/1208 [23:36<10:10,  1.68s/it, loss=0.106, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00142, train/loss_step=0.305, global_step=814.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  70%|██████▉   | 844/1208 [23:36<10:10,  1.68s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.95e-5, train/loss_step=0.0102, global_step=814.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  70%|██████▉   | 845/1208 [23:37<10:08,  1.68s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.95e-5, train/loss_step=0.0102, global_step=814.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  70%|██████▉   | 845/1208 [23:37<10:08,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000653, train/loss_step=0.190, global_step=815.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  70%|███████   | 846/1208 [23:38<10:06,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000653, train/loss_step=0.190, global_step=815.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  70%|███████   | 846/1208 [23:38<10:06,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=6.15e-5, train/loss_step=0.0133, global_step=815.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  70%|███████   | 847/1208 [23:39<10:04,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=6.15e-5, train/loss_step=0.0133, global_step=815.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  70%|███████   | 847/1208 [23:39<10:04,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0955, train/loss_vlb_step=0.000315, train/loss_step=0.0955, global_step=815.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  70%|███████   | 848/1208 [23:42<10:03,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0955, train/loss_vlb_step=0.000315, train/loss_step=0.0955, global_step=815.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  70%|███████   | 848/1208 [23:42<10:03,  1.68s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.00017, train/loss_step=0.0462, global_step=815.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  70%|███████   | 849/1208 [23:43<10:01,  1.68s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.00017, train/loss_step=0.0462, global_step=815.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  70%|███████   | 849/1208 [23:43<10:01,  1.68s/it, loss=0.103, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.00062, train/loss_step=0.164, global_step=816.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  70%|███████   | 850/1208 [23:44<09:59,  1.68s/it, loss=0.103, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.00062, train/loss_step=0.164, global_step=816.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  70%|███████   | 850/1208 [23:44<09:59,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000891, train/loss_step=0.228, global_step=816.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  70%|███████   | 851/1208 [23:45<09:58,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000891, train/loss_step=0.228, global_step=816.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  70%|███████   | 851/1208 [23:45<09:58,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.057, train/loss_vlb_step=0.000204, train/loss_step=0.057, global_step=816.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  71%|███████   | 852/1208 [23:48<09:57,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.057, train/loss_vlb_step=0.000204, train/loss_step=0.057, global_step=816.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  71%|███████   | 852/1208 [23:48<09:57,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=8.63e-5, train/loss_step=0.0193, global_step=816.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  71%|███████   | 853/1208 [23:49<09:55,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=8.63e-5, train/loss_step=0.0193, global_step=816.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  71%|███████   | 853/1208 [23:49<09:55,  1.68s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=1.88e-5, train/loss_step=0.00325, global_step=817.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  71%|███████   | 854/1208 [23:50<09:53,  1.68s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=1.88e-5, train/loss_step=0.00325, global_step=817.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  71%|███████   | 854/1208 [23:50<09:53,  1.68s/it, loss=0.0855, v_num=0, train/loss_simple_step=0.00648, train/loss_vlb_step=3.21e-5, train/loss_step=0.00648, global_step=817.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  71%|███████   | 855/1208 [23:51<09:51,  1.67s/it, loss=0.0855, v_num=0, train/loss_simple_step=0.00648, train/loss_vlb_step=3.21e-5, train/loss_step=0.00648, global_step=817.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  71%|███████   | 855/1208 [23:51<09:51,  1.67s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00138, train/loss_step=0.293, global_step=817.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  71%|███████   | 856/1208 [23:55<09:50,  1.68s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00138, train/loss_step=0.293, global_step=817.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  71%|███████   | 856/1208 [23:55<09:50,  1.68s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0991, train/loss_vlb_step=0.000329, train/loss_step=0.0991, global_step=817.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  71%|███████   | 857/1208 [23:56<09:48,  1.68s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0991, train/loss_vlb_step=0.000329, train/loss_step=0.0991, global_step=817.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  71%|███████   | 857/1208 [23:56<09:48,  1.68s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000531, train/loss_step=0.160, global_step=818.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  71%|███████   | 858/1208 [23:57<09:46,  1.68s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000531, train/loss_step=0.160, global_step=818.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  71%|███████   | 858/1208 [23:57<09:46,  1.68s/it, loss=0.0993, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=1.96e-5, train/loss_step=0.00357, global_step=818.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  71%|███████   | 859/1208 [23:58<09:44,  1.67s/it, loss=0.0993, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=1.96e-5, train/loss_step=0.00357, global_step=818.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  71%|███████   | 859/1208 [23:58<09:44,  1.67s/it, loss=0.105, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000577, train/loss_step=0.168, global_step=818.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  71%|███████   | 860/1208 [24:01<09:43,  1.68s/it, loss=0.105, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000577, train/loss_step=0.168, global_step=818.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  71%|███████   | 860/1208 [24:01<09:43,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00113, train/loss_step=0.279, global_step=818.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  71%|███████▏  | 861/1208 [24:02<09:41,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00113, train/loss_step=0.279, global_step=818.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  71%|███████▏  | 861/1208 [24:02<09:41,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.652, train/loss_vlb_step=0.0244, train/loss_step=0.652, global_step=819.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  71%|███████▏  | 862/1208 [24:03<09:39,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.652, train/loss_vlb_step=0.0244, train/loss_step=0.652, global_step=819.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  71%|███████▏  | 862/1208 [24:03<09:39,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.00011, train/loss_step=0.0284, global_step=819.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  71%|███████▏  | 863/1208 [24:04<09:37,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.00011, train/loss_step=0.0284, global_step=819.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  71%|███████▏  | 863/1208 [24:04<09:37,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=7.05e-5, train/loss_step=0.0159, global_step=819.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  72%|███████▏  | 864/1208 [24:08<09:36,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=7.05e-5, train/loss_step=0.0159, global_step=819.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  72%|███████▏  | 864/1208 [24:08<09:36,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.42e-5, train/loss_step=0.00253, global_step=819.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  72%|███████▏  | 865/1208 [24:09<09:34,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.42e-5, train/loss_step=0.00253, global_step=819.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  72%|███████▏  | 865/1208 [24:09<09:34,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=1.32e-5, train/loss_step=0.00227, global_step=820.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  72%|███████▏  | 866/1208 [24:10<09:32,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=1.32e-5, train/loss_step=0.00227, global_step=820.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  72%|███████▏  | 866/1208 [24:10<09:32,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=820.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  72%|███████▏  | 867/1208 [24:11<09:30,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=820.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  72%|███████▏  | 867/1208 [24:11<09:30,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0827, train/loss_vlb_step=0.000276, train/loss_step=0.0827, global_step=820.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  72%|███████▏  | 868/1208 [24:14<09:29,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0827, train/loss_vlb_step=0.000276, train/loss_step=0.0827, global_step=820.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  72%|███████▏  | 868/1208 [24:14<09:29,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00258, train/loss_step=0.363, global_step=820.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  72%|███████▏  | 869/1208 [24:15<09:27,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00258, train/loss_step=0.363, global_step=820.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  72%|███████▏  | 869/1208 [24:15<09:27,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0964, train/loss_vlb_step=0.00032, train/loss_step=0.0964, global_step=821.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  72%|███████▏  | 870/1208 [24:16<09:25,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0964, train/loss_vlb_step=0.00032, train/loss_step=0.0964, global_step=821.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  72%|███████▏  | 870/1208 [24:16<09:25,  1.67s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000102, train/loss_step=0.0253, global_step=821.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  72%|███████▏  | 871/1208 [24:17<09:23,  1.67s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000102, train/loss_step=0.0253, global_step=821.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  72%|███████▏  | 871/1208 [24:17<09:23,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00135, train/loss_step=0.306, global_step=821.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  72%|███████▏  | 872/1208 [24:20<09:22,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00135, train/loss_step=0.306, global_step=821.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  72%|███████▏  | 872/1208 [24:20<09:22,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.89e-5, train/loss_step=0.0179, global_step=821.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  72%|███████▏  | 873/1208 [24:21<09:20,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.89e-5, train/loss_step=0.0179, global_step=821.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  72%|███████▏  | 873/1208 [24:21<09:20,  1.67s/it, loss=0.146, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000797, train/loss_step=0.214, global_step=822.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  72%|███████▏  | 874/1208 [24:22<09:19,  1.67s/it, loss=0.146, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000797, train/loss_step=0.214, global_step=822.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  72%|███████▏  | 874/1208 [24:22<09:19,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.438, train/loss_vlb_step=0.00326, train/loss_step=0.438, global_step=822.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  72%|███████▏  | 875/1208 [24:23<09:17,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.438, train/loss_vlb_step=0.00326, train/loss_step=0.438, global_step=822.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  72%|███████▏  | 875/1208 [24:23<09:17,  1.67s/it, loss=0.167, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00109, train/loss_step=0.272, global_step=822.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  73%|███████▎  | 876/1208 [24:27<09:16,  1.67s/it, loss=0.167, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00109, train/loss_step=0.272, global_step=822.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  73%|███████▎  | 876/1208 [24:27<09:16,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0697, train/loss_vlb_step=0.000238, train/loss_step=0.0697, global_step=822.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  73%|███████▎  | 877/1208 [24:28<09:14,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0697, train/loss_vlb_step=0.000238, train/loss_step=0.0697, global_step=822.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  73%|███████▎  | 877/1208 [24:28<09:14,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000777, train/loss_step=0.205, global_step=823.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  73%|███████▎  | 878/1208 [24:29<09:12,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000777, train/loss_step=0.205, global_step=823.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  73%|███████▎  | 878/1208 [24:29<09:12,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00513, train/loss_vlb_step=2.74e-5, train/loss_step=0.00513, global_step=823.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  73%|███████▎  | 879/1208 [24:30<09:10,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00513, train/loss_vlb_step=2.74e-5, train/loss_step=0.00513, global_step=823.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  73%|███████▎  | 879/1208 [24:30<09:10,  1.67s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00824, train/loss_vlb_step=4.07e-5, train/loss_step=0.00824, global_step=823.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  73%|███████▎  | 880/1208 [24:33<09:09,  1.67s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00824, train/loss_vlb_step=4.07e-5, train/loss_step=0.00824, global_step=823.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  73%|███████▎  | 880/1208 [24:33<09:09,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000134, train/loss_step=0.0349, global_step=823.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  73%|███████▎  | 881/1208 [24:34<09:07,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000134, train/loss_step=0.0349, global_step=823.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  73%|███████▎  | 881/1208 [24:34<09:07,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.00042, train/loss_step=0.125, global_step=824.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  73%|███████▎  | 882/1208 [24:35<09:05,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.00042, train/loss_step=0.125, global_step=824.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  73%|███████▎  | 882/1208 [24:35<09:05,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.47e-5, train/loss_step=0.00249, global_step=824.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  73%|███████▎  | 883/1208 [24:36<09:03,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.47e-5, train/loss_step=0.00249, global_step=824.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  73%|███████▎  | 883/1208 [24:36<09:03,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00116, train/loss_step=0.270, global_step=824.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  73%|███████▎  | 884/1208 [24:40<09:02,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00116, train/loss_step=0.270, global_step=824.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  73%|███████▎  | 884/1208 [24:40<09:02,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000498, train/loss_step=0.147, global_step=824.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  73%|███████▎  | 885/1208 [24:41<09:00,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000498, train/loss_step=0.147, global_step=824.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  73%|███████▎  | 885/1208 [24:41<09:00,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.577, train/loss_vlb_step=0.00996, train/loss_step=0.577, global_step=825.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  73%|███████▎  | 886/1208 [24:42<08:58,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.577, train/loss_vlb_step=0.00996, train/loss_step=0.577, global_step=825.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  73%|███████▎  | 886/1208 [24:42<08:58,  1.67s/it, loss=0.172, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000586, train/loss_step=0.172, global_step=825.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  73%|███████▎  | 887/1208 [24:43<08:56,  1.67s/it, loss=0.172, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000586, train/loss_step=0.172, global_step=825.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  73%|███████▎  | 887/1208 [24:43<08:56,  1.67s/it, loss=0.181, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00122, train/loss_step=0.271, global_step=825.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  74%|███████▎  | 888/1208 [24:46<08:55,  1.67s/it, loss=0.181, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00122, train/loss_step=0.271, global_step=825.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  74%|███████▎  | 888/1208 [24:46<08:55,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0999, train/loss_vlb_step=0.000332, train/loss_step=0.0999, global_step=825.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  74%|███████▎  | 889/1208 [24:47<08:53,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0999, train/loss_vlb_step=0.000332, train/loss_step=0.0999, global_step=825.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  74%|███████▎  | 889/1208 [24:47<08:53,  1.67s/it, loss=0.181, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00211, train/loss_step=0.355, global_step=826.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  74%|███████▎  | 890/1208 [24:48<08:51,  1.67s/it, loss=0.181, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00211, train/loss_step=0.355, global_step=826.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  74%|███████▎  | 890/1208 [24:48<08:51,  1.67s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.21e-5, train/loss_step=0.0112, global_step=826.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  74%|███████▍  | 891/1208 [24:49<08:49,  1.67s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.21e-5, train/loss_step=0.0112, global_step=826.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  74%|███████▍  | 891/1208 [24:49<08:49,  1.67s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000136, train/loss_step=0.0372, global_step=826.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  74%|███████▍  | 892/1208 [24:52<08:48,  1.67s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000136, train/loss_step=0.0372, global_step=826.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  74%|███████▍  | 892/1208 [24:52<08:48,  1.67s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00387, train/loss_vlb_step=2.14e-5, train/loss_step=0.00387, global_step=826.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  74%|███████▍  | 893/1208 [24:53<08:46,  1.67s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00387, train/loss_vlb_step=2.14e-5, train/loss_step=0.00387, global_step=826.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  74%|███████▍  | 893/1208 [24:53<08:46,  1.67s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0928, train/loss_vlb_step=0.000309, train/loss_step=0.0928, global_step=827.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  74%|███████▍  | 894/1208 [24:54<08:45,  1.67s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0928, train/loss_vlb_step=0.000309, train/loss_step=0.0928, global_step=827.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  74%|███████▍  | 894/1208 [24:54<08:45,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=1.35e-5, train/loss_step=0.00231, global_step=827.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  74%|███████▍  | 895/1208 [24:55<08:43,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=1.35e-5, train/loss_step=0.00231, global_step=827.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  74%|███████▍  | 895/1208 [24:55<08:43,  1.67s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000105, train/loss_step=0.0262, global_step=827.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  74%|███████▍  | 896/1208 [24:58<08:41,  1.67s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000105, train/loss_step=0.0262, global_step=827.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  74%|███████▍  | 896/1208 [24:58<08:41,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00125, train/loss_step=0.279, global_step=827.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  74%|███████▍  | 897/1208 [24:59<08:40,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00125, train/loss_step=0.279, global_step=827.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  74%|███████▍  | 897/1208 [24:59<08:40,  1.67s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.6e-5, train/loss_step=0.00265, global_step=828.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  74%|███████▍  | 898/1208 [25:00<08:38,  1.67s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.6e-5, train/loss_step=0.00265, global_step=828.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  74%|███████▍  | 898/1208 [25:00<08:38,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0875, train/loss_vlb_step=0.000291, train/loss_step=0.0875, global_step=828.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  74%|███████▍  | 899/1208 [25:01<08:36,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0875, train/loss_vlb_step=0.000291, train/loss_step=0.0875, global_step=828.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  74%|███████▍  | 899/1208 [25:01<08:36,  1.67s/it, loss=0.148, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00203, train/loss_step=0.359, global_step=828.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  75%|███████▍  | 900/1208 [25:04<08:34,  1.67s/it, loss=0.148, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00203, train/loss_step=0.359, global_step=828.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  75%|███████▍  | 900/1208 [25:04<08:34,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000966, train/loss_step=0.234, global_step=828.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.76it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.75it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.80it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.75it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.79it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.80it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.75it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.76it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.81it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.75it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.76it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.76it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.76it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.76it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.76it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.80it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.76it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.76it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.76it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.76it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.76it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.75it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.75it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.75it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.75it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.82it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 2:  75%|███████▍  | 901/1208 [25:35<08:43,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000966, train/loss_step=0.234, global_step=828.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  75%|███████▍  | 901/1208 [25:35<08:43,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0583, train/loss_vlb_step=0.000201, train/loss_step=0.0583, global_step=829.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  75%|███████▍  | 902/1208 [25:36<08:41,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0583, train/loss_vlb_step=0.000201, train/loss_step=0.0583, global_step=829.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  75%|███████▍  | 902/1208 [25:36<08:41,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000589, train/loss_step=0.174, global_step=829.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  75%|███████▍  | 903/1208 [25:37<08:39,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000589, train/loss_step=0.174, global_step=829.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  75%|███████▍  | 903/1208 [25:37<08:39,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000522, train/loss_step=0.158, global_step=829.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  75%|███████▍  | 904/1208 [25:40<08:38,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000522, train/loss_step=0.158, global_step=829.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  75%|███████▍  | 904/1208 [25:40<08:38,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00942, train/loss_vlb_step=4.49e-5, train/loss_step=0.00942, global_step=829.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  75%|███████▍  | 905/1208 [25:41<08:36,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00942, train/loss_vlb_step=4.49e-5, train/loss_step=0.00942, global_step=829.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  75%|███████▍  | 905/1208 [25:41<08:36,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00103, train/loss_step=0.250, global_step=830.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  75%|███████▌  | 906/1208 [25:42<08:34,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00103, train/loss_step=0.250, global_step=830.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  75%|███████▌  | 906/1208 [25:42<08:34,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.00091, train/loss_step=0.234, global_step=830.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  75%|███████▌  | 907/1208 [25:43<08:32,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.00091, train/loss_step=0.234, global_step=830.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  75%|███████▌  | 907/1208 [25:43<08:32,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0831, train/loss_vlb_step=0.000279, train/loss_step=0.0831, global_step=830.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  75%|███████▌  | 908/1208 [25:47<08:31,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0831, train/loss_vlb_step=0.000279, train/loss_step=0.0831, global_step=830.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  75%|███████▌  | 908/1208 [25:47<08:31,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000687, train/loss_step=0.194, global_step=830.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  75%|███████▌  | 909/1208 [25:48<08:29,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000687, train/loss_step=0.194, global_step=830.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  75%|███████▌  | 909/1208 [25:48<08:29,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00194, train/loss_step=0.368, global_step=831.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  75%|███████▌  | 910/1208 [25:49<08:27,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00194, train/loss_step=0.368, global_step=831.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  75%|███████▌  | 910/1208 [25:49<08:27,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=1.99e-5, train/loss_step=0.00357, global_step=831.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  75%|███████▌  | 911/1208 [25:50<08:25,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=1.99e-5, train/loss_step=0.00357, global_step=831.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  75%|███████▌  | 911/1208 [25:50<08:25,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00196, train/loss_step=0.336, global_step=831.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  75%|███████▌  | 912/1208 [25:53<08:24,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00196, train/loss_step=0.336, global_step=831.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  75%|███████▌  | 912/1208 [25:53<08:24,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00856, train/loss_vlb_step=4.02e-5, train/loss_step=0.00856, global_step=831.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  76%|███████▌  | 913/1208 [25:54<08:22,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00856, train/loss_vlb_step=4.02e-5, train/loss_step=0.00856, global_step=831.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  76%|███████▌  | 913/1208 [25:54<08:22,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00128, train/loss_step=0.306, global_step=832.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  76%|███████▌  | 914/1208 [25:55<08:20,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00128, train/loss_step=0.306, global_step=832.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  76%|███████▌  | 914/1208 [25:55<08:20,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.441, train/loss_vlb_step=0.00624, train/loss_step=0.441, global_step=832.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  76%|███████▌  | 915/1208 [25:56<08:18,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.441, train/loss_vlb_step=0.00624, train/loss_step=0.441, global_step=832.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  76%|███████▌  | 915/1208 [25:56<08:18,  1.70s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0612, train/loss_vlb_step=0.00021, train/loss_step=0.0612, global_step=832.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  76%|███████▌  | 916/1208 [26:00<08:17,  1.70s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0612, train/loss_vlb_step=0.00021, train/loss_step=0.0612, global_step=832.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  76%|███████▌  | 916/1208 [26:00<08:17,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.000167, train/loss_step=0.0456, global_step=832.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  76%|███████▌  | 917/1208 [26:01<08:15,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.000167, train/loss_step=0.0456, global_step=832.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  76%|███████▌  | 917/1208 [26:01<08:15,  1.70s/it, loss=0.188, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00195, train/loss_step=0.354, global_step=833.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  76%|███████▌  | 918/1208 [26:02<08:13,  1.70s/it, loss=0.188, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00195, train/loss_step=0.354, global_step=833.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  76%|███████▌  | 918/1208 [26:02<08:13,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.3e-5, train/loss_step=0.0141, global_step=833.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  76%|███████▌  | 919/1208 [26:03<08:11,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.3e-5, train/loss_step=0.0141, global_step=833.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  76%|███████▌  | 919/1208 [26:03<08:11,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.00044, train/loss_step=0.132, global_step=833.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  76%|███████▌  | 920/1208 [26:06<08:10,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.00044, train/loss_step=0.132, global_step=833.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  76%|███████▌  | 920/1208 [26:06<08:10,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000139, train/loss_step=0.0346, global_step=833.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  76%|███████▌  | 921/1208 [26:07<08:08,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000139, train/loss_step=0.0346, global_step=833.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  76%|███████▌  | 921/1208 [26:07<08:08,  1.70s/it, loss=0.192, v_num=0, train/loss_simple_step=0.623, train/loss_vlb_step=0.0174, train/loss_step=0.623, global_step=834.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  76%|███████▋  | 922/1208 [26:08<08:06,  1.70s/it, loss=0.192, v_num=0, train/loss_simple_step=0.623, train/loss_vlb_step=0.0174, train/loss_step=0.623, global_step=834.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  76%|███████▋  | 922/1208 [26:08<08:06,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0519, train/loss_vlb_step=0.000185, train/loss_step=0.0519, global_step=834.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  76%|███████▋  | 923/1208 [26:09<08:04,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0519, train/loss_vlb_step=0.000185, train/loss_step=0.0519, global_step=834.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  76%|███████▋  | 923/1208 [26:09<08:04,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0082, train/loss_vlb_step=3.9e-5, train/loss_step=0.0082, global_step=834.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  76%|███████▋  | 924/1208 [26:12<08:03,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0082, train/loss_vlb_step=3.9e-5, train/loss_step=0.0082, global_step=834.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  76%|███████▋  | 924/1208 [26:12<08:03,  1.70s/it, loss=0.187, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000642, train/loss_step=0.186, global_step=834.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  77%|███████▋  | 925/1208 [26:14<08:01,  1.70s/it, loss=0.187, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000642, train/loss_step=0.186, global_step=834.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  77%|███████▋  | 925/1208 [26:14<08:01,  1.70s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00663, train/loss_vlb_step=3.58e-5, train/loss_step=0.00663, global_step=835.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  77%|███████▋  | 926/1208 [26:15<07:59,  1.70s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00663, train/loss_vlb_step=3.58e-5, train/loss_step=0.00663, global_step=835.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  77%|███████▋  | 926/1208 [26:15<07:59,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0916, train/loss_vlb_step=0.000301, train/loss_step=0.0916, global_step=835.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  77%|███████▋  | 927/1208 [26:16<07:57,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0916, train/loss_vlb_step=0.000301, train/loss_step=0.0916, global_step=835.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  77%|███████▋  | 927/1208 [26:16<07:57,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=9.01e-5, train/loss_step=0.0219, global_step=835.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  77%|███████▋  | 928/1208 [26:19<07:56,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=9.01e-5, train/loss_step=0.0219, global_step=835.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  77%|███████▋  | 928/1208 [26:19<07:56,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000758, train/loss_step=0.210, global_step=835.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  77%|███████▋  | 929/1208 [26:20<07:54,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000758, train/loss_step=0.210, global_step=835.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  77%|███████▋  | 929/1208 [26:20<07:54,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.069, train/loss_vlb_step=0.000229, train/loss_step=0.069, global_step=836.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  77%|███████▋  | 930/1208 [26:21<07:52,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.069, train/loss_vlb_step=0.000229, train/loss_step=0.069, global_step=836.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  77%|███████▋  | 930/1208 [26:21<07:52,  1.70s/it, loss=0.172, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.0073, train/loss_step=0.447, global_step=836.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  77%|███████▋  | 931/1208 [26:22<07:50,  1.70s/it, loss=0.172, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.0073, train/loss_step=0.447, global_step=836.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  77%|███████▋  | 931/1208 [26:22<07:50,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=1.43e-5, train/loss_step=0.00242, global_step=836.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  77%|███████▋  | 932/1208 [26:25<07:49,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=1.43e-5, train/loss_step=0.00242, global_step=836.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  77%|███████▋  | 932/1208 [26:25<07:49,  1.70s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.25e-5, train/loss_step=0.00211, global_step=836.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  77%|███████▋  | 933/1208 [26:26<07:47,  1.70s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.25e-5, train/loss_step=0.00211, global_step=836.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  77%|███████▋  | 933/1208 [26:26<07:47,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00649, train/loss_vlb_step=3.3e-5, train/loss_step=0.00649, global_step=837.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  77%|███████▋  | 934/1208 [26:27<07:45,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00649, train/loss_vlb_step=3.3e-5, train/loss_step=0.00649, global_step=837.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  77%|███████▋  | 934/1208 [26:27<07:45,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0726, train/loss_vlb_step=0.000249, train/loss_step=0.0726, global_step=837.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  77%|███████▋  | 935/1208 [26:28<07:43,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0726, train/loss_vlb_step=0.000249, train/loss_step=0.0726, global_step=837.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  77%|███████▋  | 935/1208 [26:28<07:43,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0679, train/loss_vlb_step=0.000239, train/loss_step=0.0679, global_step=837.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  77%|███████▋  | 936/1208 [26:32<07:42,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0679, train/loss_vlb_step=0.000239, train/loss_step=0.0679, global_step=837.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  77%|███████▋  | 936/1208 [26:32<07:42,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.74e-5, train/loss_step=0.0203, global_step=837.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  78%|███████▊  | 937/1208 [26:33<07:40,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.74e-5, train/loss_step=0.0203, global_step=837.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  78%|███████▊  | 937/1208 [26:33<07:40,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.0014, train/loss_step=0.290, global_step=838.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  78%|███████▊  | 938/1208 [26:34<07:38,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.0014, train/loss_step=0.290, global_step=838.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  78%|███████▊  | 938/1208 [26:34<07:38,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=2.17e-5, train/loss_step=0.00388, global_step=838.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  78%|███████▊  | 939/1208 [26:35<07:37,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=2.17e-5, train/loss_step=0.00388, global_step=838.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  78%|███████▊  | 939/1208 [26:35<07:37,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0914, train/loss_vlb_step=0.000302, train/loss_step=0.0914, global_step=838.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  78%|███████▊  | 940/1208 [26:38<07:35,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0914, train/loss_vlb_step=0.000302, train/loss_step=0.0914, global_step=838.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  78%|███████▊  | 940/1208 [26:38<07:35,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00653, train/loss_vlb_step=3.39e-5, train/loss_step=0.00653, global_step=838.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  78%|███████▊  | 941/1208 [26:39<07:33,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00653, train/loss_vlb_step=3.39e-5, train/loss_step=0.00653, global_step=838.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  78%|███████▊  | 941/1208 [26:39<07:33,  1.70s/it, loss=0.088, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=839.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  78%|███████▊  | 942/1208 [26:40<07:32,  1.70s/it, loss=0.088, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=839.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  78%|███████▊  | 942/1208 [26:40<07:32,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00146, train/loss_step=0.319, global_step=839.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  78%|███████▊  | 943/1208 [26:41<07:30,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00146, train/loss_step=0.319, global_step=839.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  78%|███████▊  | 943/1208 [26:41<07:30,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000823, train/loss_step=0.221, global_step=839.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  78%|███████▊  | 944/1208 [26:45<07:28,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000823, train/loss_step=0.221, global_step=839.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  78%|███████▊  | 944/1208 [26:45<07:28,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000371, train/loss_step=0.113, global_step=839.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  78%|███████▊  | 945/1208 [26:46<07:27,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000371, train/loss_step=0.113, global_step=839.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  78%|███████▊  | 945/1208 [26:46<07:27,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=840.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  78%|███████▊  | 946/1208 [26:47<07:25,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=840.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  78%|███████▊  | 946/1208 [26:47<07:25,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.0013, train/loss_step=0.300, global_step=840.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  78%|███████▊  | 947/1208 [26:48<07:23,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.0013, train/loss_step=0.300, global_step=840.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  78%|███████▊  | 947/1208 [26:48<07:23,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000699, train/loss_step=0.194, global_step=840.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  78%|███████▊  | 948/1208 [26:51<07:21,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000699, train/loss_step=0.194, global_step=840.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  78%|███████▊  | 948/1208 [26:51<07:21,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.00076, train/loss_step=0.194, global_step=840.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  79%|███████▊  | 949/1208 [26:52<07:20,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.00076, train/loss_step=0.194, global_step=840.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  79%|███████▊  | 949/1208 [26:52<07:20,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.46e-5, train/loss_step=0.0146, global_step=841.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  79%|███████▊  | 950/1208 [26:53<07:18,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.46e-5, train/loss_step=0.0146, global_step=841.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  79%|███████▊  | 950/1208 [26:53<07:18,  1.70s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=2.19e-5, train/loss_step=0.00378, global_step=841.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  79%|███████▊  | 951/1208 [26:54<07:16,  1.70s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=2.19e-5, train/loss_step=0.00378, global_step=841.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  79%|███████▊  | 951/1208 [26:54<07:16,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00138, train/loss_step=0.319, global_step=841.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  79%|███████▉  | 952/1208 [26:57<07:15,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00138, train/loss_step=0.319, global_step=841.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  79%|███████▉  | 952/1208 [26:57<07:15,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0895, train/loss_vlb_step=0.000296, train/loss_step=0.0895, global_step=841.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  79%|███████▉  | 953/1208 [26:58<07:13,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0895, train/loss_vlb_step=0.000296, train/loss_step=0.0895, global_step=841.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  79%|███████▉  | 953/1208 [26:58<07:13,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00901, train/loss_vlb_step=4.27e-5, train/loss_step=0.00901, global_step=842.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  79%|███████▉  | 954/1208 [27:00<07:11,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00901, train/loss_vlb_step=4.27e-5, train/loss_step=0.00901, global_step=842.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  79%|███████▉  | 954/1208 [27:00<07:11,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000411, train/loss_step=0.125, global_step=842.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  79%|███████▉  | 955/1208 [27:01<07:09,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000411, train/loss_step=0.125, global_step=842.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  79%|███████▉  | 955/1208 [27:01<07:09,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=6.02e-5, train/loss_step=0.0133, global_step=842.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  79%|███████▉  | 956/1208 [27:04<07:08,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=6.02e-5, train/loss_step=0.0133, global_step=842.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  79%|███████▉  | 956/1208 [27:04<07:08,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.0025, train/loss_step=0.351, global_step=842.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  79%|███████▉  | 957/1208 [27:05<07:06,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.0025, train/loss_step=0.351, global_step=842.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  79%|███████▉  | 957/1208 [27:05<07:06,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0605, train/loss_vlb_step=0.000212, train/loss_step=0.0605, global_step=843.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  79%|███████▉  | 958/1208 [27:06<07:04,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0605, train/loss_vlb_step=0.000212, train/loss_step=0.0605, global_step=843.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  79%|███████▉  | 958/1208 [27:06<07:04,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.82e-5, train/loss_step=0.0153, global_step=843.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  79%|███████▉  | 959/1208 [27:07<07:02,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.82e-5, train/loss_step=0.0153, global_step=843.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  79%|███████▉  | 959/1208 [27:07<07:02,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.0012, train/loss_step=0.291, global_step=843.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  79%|███████▉  | 960/1208 [27:10<07:01,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.0012, train/loss_step=0.291, global_step=843.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  79%|███████▉  | 960/1208 [27:10<07:01,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=843.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  80%|███████▉  | 961/1208 [27:11<06:59,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=843.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  80%|███████▉  | 961/1208 [27:11<06:59,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=2.55e-5, train/loss_step=0.00464, global_step=844.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  80%|███████▉  | 962/1208 [27:12<06:57,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=2.55e-5, train/loss_step=0.00464, global_step=844.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  80%|███████▉  | 962/1208 [27:12<06:57,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00287, train/loss_step=0.375, global_step=844.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  80%|███████▉  | 963/1208 [27:13<06:55,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00287, train/loss_step=0.375, global_step=844.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  80%|███████▉  | 963/1208 [27:13<06:55,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=1.51e-5, train/loss_step=0.00258, global_step=844.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  80%|███████▉  | 964/1208 [27:17<06:54,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=1.51e-5, train/loss_step=0.00258, global_step=844.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  80%|███████▉  | 964/1208 [27:17<06:54,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.73e-5, train/loss_step=0.0178, global_step=844.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  80%|███████▉  | 965/1208 [27:18<06:52,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.73e-5, train/loss_step=0.0178, global_step=844.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  80%|███████▉  | 965/1208 [27:18<06:52,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=8.37e-5, train/loss_step=0.019, global_step=845.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  80%|███████▉  | 966/1208 [27:19<06:50,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=8.37e-5, train/loss_step=0.019, global_step=845.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  80%|███████▉  | 966/1208 [27:19<06:50,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000773, train/loss_step=0.214, global_step=845.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  80%|████████  | 967/1208 [27:20<06:48,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000773, train/loss_step=0.214, global_step=845.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  80%|████████  | 967/1208 [27:20<06:48,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000137, train/loss_step=0.0358, global_step=845.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  80%|████████  | 968/1208 [27:23<06:47,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000137, train/loss_step=0.0358, global_step=845.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  80%|████████  | 968/1208 [27:23<06:47,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000816, train/loss_step=0.219, global_step=845.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  80%|████████  | 969/1208 [27:24<06:45,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000816, train/loss_step=0.219, global_step=845.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  80%|████████  | 969/1208 [27:24<06:45,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00149, train/loss_step=0.300, global_step=846.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  80%|████████  | 970/1208 [27:25<06:43,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00149, train/loss_step=0.300, global_step=846.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  80%|████████  | 970/1208 [27:25<06:43,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000635, train/loss_step=0.175, global_step=846.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  80%|████████  | 971/1208 [27:26<06:41,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000635, train/loss_step=0.175, global_step=846.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  80%|████████  | 971/1208 [27:26<06:41,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0798, train/loss_vlb_step=0.000262, train/loss_step=0.0798, global_step=846.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  80%|████████  | 972/1208 [27:29<06:40,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0798, train/loss_vlb_step=0.000262, train/loss_step=0.0798, global_step=846.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  80%|████████  | 972/1208 [27:29<06:40,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00657, train/loss_vlb_step=3.27e-5, train/loss_step=0.00657, global_step=846.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  81%|████████  | 973/1208 [27:30<06:38,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00657, train/loss_vlb_step=3.27e-5, train/loss_step=0.00657, global_step=846.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  81%|████████  | 973/1208 [27:30<06:38,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.61e-5, train/loss_step=0.00291, global_step=847.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  81%|████████  | 974/1208 [27:31<06:36,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.61e-5, train/loss_step=0.00291, global_step=847.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  81%|████████  | 974/1208 [27:31<06:36,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000416, train/loss_step=0.126, global_step=847.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  81%|████████  | 975/1208 [27:33<06:35,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000416, train/loss_step=0.126, global_step=847.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  81%|████████  | 975/1208 [27:33<06:35,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000493, train/loss_step=0.147, global_step=847.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  81%|████████  | 976/1208 [27:36<06:33,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000493, train/loss_step=0.147, global_step=847.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  81%|████████  | 976/1208 [27:36<06:33,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00803, train/loss_vlb_step=3.84e-5, train/loss_step=0.00803, global_step=847.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  81%|████████  | 977/1208 [27:37<06:31,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00803, train/loss_vlb_step=3.84e-5, train/loss_step=0.00803, global_step=847.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  81%|████████  | 977/1208 [27:37<06:31,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0645, train/loss_vlb_step=0.000224, train/loss_step=0.0645, global_step=848.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  81%|████████  | 978/1208 [27:38<06:30,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0645, train/loss_vlb_step=0.000224, train/loss_step=0.0645, global_step=848.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  81%|████████  | 978/1208 [27:38<06:30,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.71e-5, train/loss_step=0.0105, global_step=848.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  81%|████████  | 979/1208 [27:39<06:28,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.71e-5, train/loss_step=0.0105, global_step=848.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  81%|████████  | 979/1208 [27:39<06:28,  1.70s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.71e-5, train/loss_step=0.0188, global_step=848.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  81%|████████  | 980/1208 [27:42<06:26,  1.70s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.71e-5, train/loss_step=0.0188, global_step=848.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  81%|████████  | 980/1208 [27:42<06:26,  1.70s/it, loss=0.0952, v_num=0, train/loss_simple_step=0.0759, train/loss_vlb_step=0.000258, train/loss_step=0.0759, global_step=848.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  81%|████████  | 981/1208 [27:43<06:24,  1.70s/it, loss=0.0952, v_num=0, train/loss_simple_step=0.0759, train/loss_vlb_step=0.000258, train/loss_step=0.0759, global_step=848.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  81%|████████  | 981/1208 [27:43<06:24,  1.70s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000108, train/loss_step=0.0291, global_step=849.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  81%|████████▏ | 982/1208 [27:44<06:23,  1.70s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000108, train/loss_step=0.0291, global_step=849.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  81%|████████▏ | 982/1208 [27:44<06:23,  1.70s/it, loss=0.0805, v_num=0, train/loss_simple_step=0.0569, train/loss_vlb_step=0.000197, train/loss_step=0.0569, global_step=849.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  81%|████████▏ | 983/1208 [27:45<06:21,  1.69s/it, loss=0.0805, v_num=0, train/loss_simple_step=0.0569, train/loss_vlb_step=0.000197, train/loss_step=0.0569, global_step=849.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  81%|████████▏ | 983/1208 [27:45<06:21,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.446, train/loss_vlb_step=0.00558, train/loss_step=0.446, global_step=849.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  81%|████████▏ | 984/1208 [27:49<06:19,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.446, train/loss_vlb_step=0.00558, train/loss_step=0.446, global_step=849.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  81%|████████▏ | 984/1208 [27:49<06:19,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0825, train/loss_vlb_step=0.000271, train/loss_step=0.0825, global_step=849.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  82%|████████▏ | 985/1208 [27:50<06:18,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0825, train/loss_vlb_step=0.000271, train/loss_step=0.0825, global_step=849.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  82%|████████▏ | 985/1208 [27:50<06:18,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.587, train/loss_vlb_step=0.0064, train/loss_step=0.587, global_step=850.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  82%|████████▏ | 986/1208 [27:51<06:16,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.587, train/loss_vlb_step=0.0064, train/loss_step=0.587, global_step=850.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  82%|████████▏ | 986/1208 [27:51<06:16,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=850.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  82%|████████▏ | 987/1208 [27:52<06:14,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=850.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  82%|████████▏ | 987/1208 [27:52<06:14,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00665, train/loss_vlb_step=3.32e-5, train/loss_step=0.00665, global_step=850.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  82%|████████▏ | 988/1208 [27:55<06:13,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00665, train/loss_vlb_step=3.32e-5, train/loss_step=0.00665, global_step=850.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  82%|████████▏ | 988/1208 [27:55<06:13,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.000125, train/loss_step=0.032, global_step=850.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  82%|████████▏ | 989/1208 [27:56<06:11,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.000125, train/loss_step=0.032, global_step=850.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  82%|████████▏ | 989/1208 [27:56<06:11,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.44e-5, train/loss_step=0.0168, global_step=851.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  82%|████████▏ | 990/1208 [27:57<06:09,  1.69s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.44e-5, train/loss_step=0.0168, global_step=851.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  82%|████████▏ | 990/1208 [27:57<06:09,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000891, train/loss_step=0.236, global_step=851.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  82%|████████▏ | 991/1208 [27:58<06:07,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000891, train/loss_step=0.236, global_step=851.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  82%|████████▏ | 991/1208 [27:58<06:07,  1.69s/it, loss=0.109, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000376, train/loss_step=0.114, global_step=851.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  82%|████████▏ | 992/1208 [28:01<06:06,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000376, train/loss_step=0.114, global_step=851.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  82%|████████▏ | 992/1208 [28:01<06:06,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=7.02e-5, train/loss_step=0.0159, global_step=851.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  82%|████████▏ | 993/1208 [28:02<06:04,  1.69s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=7.02e-5, train/loss_step=0.0159, global_step=851.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  82%|████████▏ | 993/1208 [28:02<06:04,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.452, train/loss_vlb_step=0.00309, train/loss_step=0.452, global_step=852.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  82%|████████▏ | 994/1208 [28:04<06:02,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.452, train/loss_vlb_step=0.00309, train/loss_step=0.452, global_step=852.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  82%|████████▏ | 994/1208 [28:04<06:02,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=852.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  82%|████████▏ | 995/1208 [28:05<06:00,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=852.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  82%|████████▏ | 995/1208 [28:05<06:00,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0761, train/loss_vlb_step=0.000252, train/loss_step=0.0761, global_step=852.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  82%|████████▏ | 996/1208 [28:08<05:59,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0761, train/loss_vlb_step=0.000252, train/loss_step=0.0761, global_step=852.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  82%|████████▏ | 996/1208 [28:08<05:59,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00551, train/loss_vlb_step=2.96e-5, train/loss_step=0.00551, global_step=852.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  83%|████████▎ | 997/1208 [28:09<05:57,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00551, train/loss_vlb_step=2.96e-5, train/loss_step=0.00551, global_step=852.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  83%|████████▎ | 997/1208 [28:09<05:57,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000173, train/loss_step=0.0478, global_step=853.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  83%|████████▎ | 998/1208 [28:10<05:55,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000173, train/loss_step=0.0478, global_step=853.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  83%|████████▎ | 998/1208 [28:10<05:55,  1.69s/it, loss=0.165, v_num=0, train/loss_simple_step=0.788, train/loss_vlb_step=0.0671, train/loss_step=0.788, global_step=853.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  83%|████████▎ | 999/1208 [28:11<05:53,  1.69s/it, loss=0.165, v_num=0, train/loss_simple_step=0.788, train/loss_vlb_step=0.0671, train/loss_step=0.788, global_step=853.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  83%|████████▎ | 999/1208 [28:11<05:53,  1.69s/it, loss=0.171, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000512, train/loss_step=0.151, global_step=853.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  83%|████████▎ | 1000/1208 [28:14<05:52,  1.69s/it, loss=0.171, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000512, train/loss_step=0.151, global_step=853.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  83%|████████▎ | 1000/1208 [28:14<05:52,  1.69s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0742, train/loss_vlb_step=0.000251, train/loss_step=0.0742, global_step=853.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  83%|████████▎ | 1001/1208 [28:15<05:50,  1.69s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0742, train/loss_vlb_step=0.000251, train/loss_step=0.0742, global_step=853.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  83%|████████▎ | 1001/1208 [28:15<05:50,  1.69s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0819, train/loss_vlb_step=0.000273, train/loss_step=0.0819, global_step=854.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  83%|████████▎ | 1002/1208 [28:16<05:48,  1.69s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0819, train/loss_vlb_step=0.000273, train/loss_step=0.0819, global_step=854.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  83%|████████▎ | 1002/1208 [28:16<05:48,  1.69s/it, loss=0.189, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00236, train/loss_step=0.362, global_step=854.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  83%|████████▎ | 1003/1208 [28:17<05:47,  1.69s/it, loss=0.189, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00236, train/loss_step=0.362, global_step=854.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  83%|████████▎ | 1003/1208 [28:17<05:47,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00833, train/loss_vlb_step=3.87e-5, train/loss_step=0.00833, global_step=854.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  83%|████████▎ | 1004/1208 [28:21<05:45,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00833, train/loss_vlb_step=3.87e-5, train/loss_step=0.00833, global_step=854.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  83%|████████▎ | 1004/1208 [28:21<05:45,  1.69s/it, loss=0.176, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00141, train/loss_step=0.260, global_step=854.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  83%|████████▎ | 1005/1208 [28:22<05:43,  1.69s/it, loss=0.176, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00141, train/loss_step=0.260, global_step=854.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  83%|████████▎ | 1005/1208 [28:22<05:43,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00465, train/loss_vlb_step=2.54e-5, train/loss_step=0.00465, global_step=855.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  83%|████████▎ | 1006/1208 [28:23<05:41,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00465, train/loss_vlb_step=2.54e-5, train/loss_step=0.00465, global_step=855.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  83%|████████▎ | 1006/1208 [28:23<05:41,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00358, train/loss_vlb_step=1.98e-5, train/loss_step=0.00358, global_step=855.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  83%|████████▎ | 1007/1208 [28:24<05:40,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00358, train/loss_vlb_step=1.98e-5, train/loss_step=0.00358, global_step=855.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  83%|████████▎ | 1007/1208 [28:24<05:40,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.38e-5, train/loss_step=0.012, global_step=855.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  83%|████████▎ | 1008/1208 [28:27<05:38,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.38e-5, train/loss_step=0.012, global_step=855.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  83%|████████▎ | 1008/1208 [28:27<05:38,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.58e-5, train/loss_step=0.0238, global_step=855.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  84%|████████▎ | 1009/1208 [28:28<05:36,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.58e-5, train/loss_step=0.0238, global_step=855.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  84%|████████▎ | 1009/1208 [28:28<05:36,  1.69s/it, loss=0.148, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000442, train/loss_step=0.133, global_step=856.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  84%|████████▎ | 1010/1208 [28:29<05:35,  1.69s/it, loss=0.148, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000442, train/loss_step=0.133, global_step=856.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  84%|████████▎ | 1010/1208 [28:29<05:35,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000425, train/loss_step=0.129, global_step=856.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  84%|████████▎ | 1011/1208 [28:30<05:33,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000425, train/loss_step=0.129, global_step=856.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  84%|████████▎ | 1011/1208 [28:30<05:33,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=9.9e-5, train/loss_step=0.0258, global_step=856.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  84%|████████▍ | 1012/1208 [28:33<05:31,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=9.9e-5, train/loss_step=0.0258, global_step=856.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  84%|████████▍ | 1012/1208 [28:33<05:31,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.59e-5, train/loss_step=0.0234, global_step=856.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  84%|████████▍ | 1013/1208 [28:34<05:30,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.59e-5, train/loss_step=0.0234, global_step=856.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  84%|████████▍ | 1013/1208 [28:34<05:30,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.64e-5, train/loss_step=0.023, global_step=857.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  84%|████████▍ | 1014/1208 [28:35<05:28,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.64e-5, train/loss_step=0.023, global_step=857.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  84%|████████▍ | 1014/1208 [28:35<05:28,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.99e-5, train/loss_step=0.0128, global_step=857.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  84%|████████▍ | 1015/1208 [28:36<05:26,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.99e-5, train/loss_step=0.0128, global_step=857.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  84%|████████▍ | 1015/1208 [28:36<05:26,  1.69s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.1e-5, train/loss_step=0.0116, global_step=857.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  84%|████████▍ | 1016/1208 [28:40<05:25,  1.69s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.1e-5, train/loss_step=0.0116, global_step=857.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  84%|████████▍ | 1016/1208 [28:40<05:25,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000889, train/loss_step=0.242, global_step=857.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  84%|████████▍ | 1017/1208 [28:41<05:23,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000889, train/loss_step=0.242, global_step=857.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  84%|████████▍ | 1017/1208 [28:41<05:23,  1.69s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.55e-5, train/loss_step=0.00272, global_step=858.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  84%|████████▍ | 1018/1208 [28:42<05:21,  1.69s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.55e-5, train/loss_step=0.00272, global_step=858.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  84%|████████▍ | 1018/1208 [28:42<05:21,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.453, train/loss_vlb_step=0.00546, train/loss_step=0.453, global_step=858.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  84%|████████▍ | 1019/1208 [28:43<05:19,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.453, train/loss_vlb_step=0.00546, train/loss_step=0.453, global_step=858.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  84%|████████▍ | 1019/1208 [28:43<05:19,  1.69s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.0554, train/loss_vlb_step=0.000199, train/loss_step=0.0554, global_step=858.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  84%|████████▍ | 1020/1208 [28:46<05:18,  1.69s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.0554, train/loss_vlb_step=0.000199, train/loss_step=0.0554, global_step=858.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  84%|████████▍ | 1020/1208 [28:46<05:18,  1.69s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0518, train/loss_vlb_step=0.000183, train/loss_step=0.0518, global_step=858.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  85%|████████▍ | 1021/1208 [28:47<05:16,  1.69s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0518, train/loss_vlb_step=0.000183, train/loss_step=0.0518, global_step=858.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  85%|████████▍ | 1021/1208 [28:47<05:16,  1.69s/it, loss=0.092, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.38e-5, train/loss_step=0.00235, global_step=859.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  85%|████████▍ | 1022/1208 [28:48<05:14,  1.69s/it, loss=0.092, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.38e-5, train/loss_step=0.00235, global_step=859.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  85%|████████▍ | 1022/1208 [28:48<05:14,  1.69s/it, loss=0.0792, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=859.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  85%|████████▍ | 1023/1208 [28:49<05:12,  1.69s/it, loss=0.0792, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=859.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  85%|████████▍ | 1023/1208 [28:49<05:12,  1.69s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.0689, train/loss_vlb_step=0.000232, train/loss_step=0.0689, global_step=859.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  85%|████████▍ | 1024/1208 [28:53<05:11,  1.69s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.0689, train/loss_vlb_step=0.000232, train/loss_step=0.0689, global_step=859.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  85%|████████▍ | 1024/1208 [28:53<05:11,  1.69s/it, loss=0.0894, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.0027, train/loss_step=0.404, global_step=859.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  85%|████████▍ | 1025/1208 [28:54<05:09,  1.69s/it, loss=0.0894, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.0027, train/loss_step=0.404, global_step=859.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  85%|████████▍ | 1025/1208 [28:54<05:09,  1.69s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000518, train/loss_step=0.154, global_step=860.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  85%|████████▍ | 1026/1208 [28:55<05:07,  1.69s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000518, train/loss_step=0.154, global_step=860.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  85%|████████▍ | 1026/1208 [28:55<05:07,  1.69s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.0561, train/loss_vlb_step=0.000201, train/loss_step=0.0561, global_step=860.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  85%|████████▌ | 1027/1208 [28:56<05:05,  1.69s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.0561, train/loss_vlb_step=0.000201, train/loss_step=0.0561, global_step=860.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  85%|████████▌ | 1027/1208 [28:56<05:05,  1.69s/it, loss=0.111, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00107, train/loss_step=0.237, global_step=860.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  85%|████████▌ | 1028/1208 [28:59<05:04,  1.69s/it, loss=0.111, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00107, train/loss_step=0.237, global_step=860.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  85%|████████▌ | 1028/1208 [28:59<05:04,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.0023, train/loss_step=0.342, global_step=860.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  85%|████████▌ | 1029/1208 [29:00<05:02,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.0023, train/loss_step=0.342, global_step=860.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  85%|████████▌ | 1029/1208 [29:00<05:02,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000533, train/loss_step=0.156, global_step=861.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  85%|████████▌ | 1030/1208 [29:01<05:00,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000533, train/loss_step=0.156, global_step=861.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  85%|████████▌ | 1030/1208 [29:01<05:00,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000781, train/loss_step=0.215, global_step=861.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  85%|████████▌ | 1031/1208 [29:02<04:59,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000781, train/loss_step=0.215, global_step=861.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  85%|████████▌ | 1031/1208 [29:02<04:59,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000497, train/loss_step=0.150, global_step=861.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  85%|████████▌ | 1032/1208 [29:05<04:57,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000497, train/loss_step=0.150, global_step=861.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  85%|████████▌ | 1032/1208 [29:05<04:57,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.00068, train/loss_step=0.190, global_step=861.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  86%|████████▌ | 1033/1208 [29:06<04:55,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.00068, train/loss_step=0.190, global_step=861.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  86%|████████▌ | 1033/1208 [29:06<04:55,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000143, train/loss_step=0.0402, global_step=862.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  86%|████████▌ | 1034/1208 [29:07<04:54,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000143, train/loss_step=0.0402, global_step=862.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  86%|████████▌ | 1034/1208 [29:07<04:54,  1.69s/it, loss=0.148, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.38e-5, train/loss_step=0.023, global_step=862.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  86%|████████▌ | 1035/1208 [29:08<04:52,  1.69s/it, loss=0.148, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.38e-5, train/loss_step=0.023, global_step=862.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  86%|████████▌ | 1035/1208 [29:08<04:52,  1.69s/it, loss=0.158, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000753, train/loss_step=0.216, global_step=862.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  86%|████████▌ | 1036/1208 [29:12<04:50,  1.69s/it, loss=0.158, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000753, train/loss_step=0.216, global_step=862.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  86%|████████▌ | 1036/1208 [29:12<04:50,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00911, train/loss_vlb_step=4.41e-5, train/loss_step=0.00911, global_step=862.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  86%|████████▌ | 1037/1208 [29:13<04:49,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00911, train/loss_vlb_step=4.41e-5, train/loss_step=0.00911, global_step=862.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  86%|████████▌ | 1037/1208 [29:13<04:49,  1.69s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.000178, train/loss_step=0.0483, global_step=863.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  86%|████████▌ | 1038/1208 [29:14<04:47,  1.69s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.000178, train/loss_step=0.0483, global_step=863.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  86%|████████▌ | 1038/1208 [29:14<04:47,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000622, train/loss_step=0.181, global_step=863.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  86%|████████▌ | 1039/1208 [29:15<04:45,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000622, train/loss_step=0.181, global_step=863.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  86%|████████▌ | 1039/1208 [29:15<04:45,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0796, train/loss_vlb_step=0.000264, train/loss_step=0.0796, global_step=863.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  86%|████████▌ | 1040/1208 [29:18<04:44,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0796, train/loss_vlb_step=0.000264, train/loss_step=0.0796, global_step=863.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  86%|████████▌ | 1040/1208 [29:18<04:44,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00169, train/loss_step=0.323, global_step=863.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  86%|████████▌ | 1041/1208 [29:19<04:42,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00169, train/loss_step=0.323, global_step=863.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  86%|████████▌ | 1041/1208 [29:19<04:42,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00841, train/loss_vlb_step=4.08e-5, train/loss_step=0.00841, global_step=864.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  86%|████████▋ | 1042/1208 [29:20<04:40,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00841, train/loss_vlb_step=4.08e-5, train/loss_step=0.00841, global_step=864.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  86%|████████▋ | 1042/1208 [29:20<04:40,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=6.14e-5, train/loss_step=0.013, global_step=864.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  86%|████████▋ | 1043/1208 [29:21<04:38,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=6.14e-5, train/loss_step=0.013, global_step=864.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  86%|████████▋ | 1043/1208 [29:21<04:38,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.00033, train/loss_step=0.100, global_step=864.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  86%|████████▋ | 1044/1208 [29:24<04:37,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.00033, train/loss_step=0.100, global_step=864.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  86%|████████▋ | 1044/1208 [29:24<04:37,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.482, train/loss_vlb_step=0.00438, train/loss_step=0.482, global_step=864.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  87%|████████▋ | 1045/1208 [29:26<04:35,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.482, train/loss_vlb_step=0.00438, train/loss_step=0.482, global_step=864.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  87%|████████▋ | 1045/1208 [29:26<04:35,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0678, train/loss_vlb_step=0.00023, train/loss_step=0.0678, global_step=865.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  87%|████████▋ | 1046/1208 [29:27<04:33,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0678, train/loss_vlb_step=0.00023, train/loss_step=0.0678, global_step=865.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  87%|████████▋ | 1046/1208 [29:27<04:33,  1.69s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=8.14e-5, train/loss_step=0.0183, global_step=865.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  87%|████████▋ | 1047/1208 [29:28<04:31,  1.69s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=8.14e-5, train/loss_step=0.0183, global_step=865.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  87%|████████▋ | 1047/1208 [29:28<04:31,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00699, train/loss_vlb_step=3.59e-5, train/loss_step=0.00699, global_step=865.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  87%|████████▋ | 1048/1208 [29:31<04:30,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00699, train/loss_vlb_step=3.59e-5, train/loss_step=0.00699, global_step=865.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  87%|████████▋ | 1048/1208 [29:31<04:30,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=2.51e-5, train/loss_step=0.00462, global_step=865.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  87%|████████▋ | 1049/1208 [29:32<04:28,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=2.51e-5, train/loss_step=0.00462, global_step=865.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  87%|████████▋ | 1049/1208 [29:32<04:28,  1.69s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00681, train/loss_vlb_step=3.56e-5, train/loss_step=0.00681, global_step=866.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  87%|████████▋ | 1050/1208 [29:33<04:26,  1.69s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00681, train/loss_vlb_step=3.56e-5, train/loss_step=0.00681, global_step=866.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  87%|████████▋ | 1050/1208 [29:33<04:26,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000694, train/loss_step=0.196, global_step=866.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  87%|████████▋ | 1051/1208 [29:34<04:25,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000694, train/loss_step=0.196, global_step=866.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  87%|████████▋ | 1051/1208 [29:34<04:25,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000477, train/loss_step=0.138, global_step=866.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  87%|████████▋ | 1052/1208 [29:37<04:23,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000477, train/loss_step=0.138, global_step=866.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  87%|████████▋ | 1052/1208 [29:37<04:23,  1.69s/it, loss=0.114, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00166, train/loss_step=0.316, global_step=866.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  87%|████████▋ | 1053/1208 [29:38<04:21,  1.69s/it, loss=0.114, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00166, train/loss_step=0.316, global_step=866.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  87%|████████▋ | 1053/1208 [29:38<04:21,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=8.99e-5, train/loss_step=0.022, global_step=867.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  87%|████████▋ | 1054/1208 [29:39<04:20,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=8.99e-5, train/loss_step=0.022, global_step=867.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  87%|████████▋ | 1054/1208 [29:39<04:20,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.064, train/loss_vlb_step=0.000216, train/loss_step=0.064, global_step=867.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  87%|████████▋ | 1055/1208 [29:41<04:18,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.064, train/loss_vlb_step=0.000216, train/loss_step=0.064, global_step=867.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  87%|████████▋ | 1055/1208 [29:41<04:18,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000757, train/loss_step=0.209, global_step=867.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  87%|████████▋ | 1056/1208 [29:44<04:16,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000757, train/loss_step=0.209, global_step=867.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  87%|████████▋ | 1056/1208 [29:44<04:16,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00437, train/loss_step=0.439, global_step=867.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  88%|████████▊ | 1057/1208 [29:45<04:15,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00437, train/loss_step=0.439, global_step=867.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  88%|████████▊ | 1057/1208 [29:45<04:15,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.19e-5, train/loss_step=0.002, global_step=868.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  88%|████████▊ | 1058/1208 [29:46<04:13,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.19e-5, train/loss_step=0.002, global_step=868.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  88%|████████▊ | 1058/1208 [29:46<04:13,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.00071, train/loss_step=0.200, global_step=868.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  88%|████████▊ | 1059/1208 [29:47<04:11,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.00071, train/loss_step=0.200, global_step=868.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  88%|████████▊ | 1059/1208 [29:47<04:11,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000589, train/loss_step=0.171, global_step=868.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  88%|████████▊ | 1060/1208 [29:50<04:10,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000589, train/loss_step=0.171, global_step=868.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  88%|████████▊ | 1060/1208 [29:50<04:10,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0711, train/loss_vlb_step=0.000245, train/loss_step=0.0711, global_step=868.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  88%|████████▊ | 1061/1208 [29:51<04:08,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0711, train/loss_vlb_step=0.000245, train/loss_step=0.0711, global_step=868.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  88%|████████▊ | 1061/1208 [29:51<04:08,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.093, train/loss_vlb_step=0.000307, train/loss_step=0.093, global_step=869.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  88%|████████▊ | 1062/1208 [29:52<04:06,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.093, train/loss_vlb_step=0.000307, train/loss_step=0.093, global_step=869.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  88%|████████▊ | 1062/1208 [29:52<04:06,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0447, train/loss_vlb_step=0.000167, train/loss_step=0.0447, global_step=869.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  88%|████████▊ | 1063/1208 [29:53<04:04,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0447, train/loss_vlb_step=0.000167, train/loss_step=0.0447, global_step=869.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  88%|████████▊ | 1063/1208 [29:53<04:04,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00242, train/loss_step=0.386, global_step=869.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  88%|████████▊ | 1064/1208 [29:57<04:03,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00242, train/loss_step=0.386, global_step=869.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  88%|████████▊ | 1064/1208 [29:57<04:03,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.2e-5, train/loss_step=0.00203, global_step=869.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  88%|████████▊ | 1065/1208 [29:58<04:01,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.2e-5, train/loss_step=0.00203, global_step=869.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  88%|████████▊ | 1065/1208 [29:58<04:01,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00122, train/loss_step=0.273, global_step=870.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  88%|████████▊ | 1066/1208 [29:59<03:59,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00122, train/loss_step=0.273, global_step=870.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  88%|████████▊ | 1066/1208 [29:59<03:59,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=870.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  88%|████████▊ | 1067/1208 [30:00<03:57,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=870.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  88%|████████▊ | 1067/1208 [30:00<03:57,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00746, train/loss_vlb_step=3.65e-5, train/loss_step=0.00746, global_step=870.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  88%|████████▊ | 1068/1208 [30:03<03:56,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00746, train/loss_vlb_step=3.65e-5, train/loss_step=0.00746, global_step=870.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  88%|████████▊ | 1068/1208 [30:03<03:56,  1.69s/it, loss=0.149, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000856, train/loss_step=0.228, global_step=870.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  88%|████████▊ | 1069/1208 [30:04<03:54,  1.69s/it, loss=0.149, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000856, train/loss_step=0.228, global_step=870.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  88%|████████▊ | 1069/1208 [30:04<03:54,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0818, train/loss_vlb_step=0.000275, train/loss_step=0.0818, global_step=871.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  89%|████████▊ | 1070/1208 [30:05<03:52,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0818, train/loss_vlb_step=0.000275, train/loss_step=0.0818, global_step=871.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  89%|████████▊ | 1070/1208 [30:05<03:52,  1.69s/it, loss=0.156, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00112, train/loss_step=0.269, global_step=871.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  89%|████████▊ | 1071/1208 [30:06<03:51,  1.69s/it, loss=0.156, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00112, train/loss_step=0.269, global_step=871.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  89%|████████▊ | 1071/1208 [30:06<03:51,  1.69s/it, loss=0.172, v_num=0, train/loss_simple_step=0.448, train/loss_vlb_step=0.00268, train/loss_step=0.448, global_step=871.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  89%|████████▊ | 1072/1208 [30:09<03:49,  1.69s/it, loss=0.172, v_num=0, train/loss_simple_step=0.448, train/loss_vlb_step=0.00268, train/loss_step=0.448, global_step=871.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  89%|████████▊ | 1072/1208 [30:09<03:49,  1.69s/it, loss=0.161, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=871.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  89%|████████▉ | 1073/1208 [30:11<03:47,  1.69s/it, loss=0.161, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=871.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  89%|████████▉ | 1073/1208 [30:11<03:47,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000615, train/loss_step=0.174, global_step=872.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  89%|████████▉ | 1074/1208 [30:12<03:46,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000615, train/loss_step=0.174, global_step=872.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  89%|████████▉ | 1074/1208 [30:12<03:46,  1.69s/it, loss=0.203, v_num=0, train/loss_simple_step=0.747, train/loss_vlb_step=0.048, train/loss_step=0.747, global_step=872.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  89%|████████▉ | 1075/1208 [30:13<03:44,  1.69s/it, loss=0.203, v_num=0, train/loss_simple_step=0.747, train/loss_vlb_step=0.048, train/loss_step=0.747, global_step=872.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  89%|████████▉ | 1075/1208 [30:13<03:44,  1.69s/it, loss=0.197, v_num=0, train/loss_simple_step=0.078, train/loss_vlb_step=0.000271, train/loss_step=0.078, global_step=872.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  89%|████████▉ | 1076/1208 [30:16<03:42,  1.69s/it, loss=0.197, v_num=0, train/loss_simple_step=0.078, train/loss_vlb_step=0.000271, train/loss_step=0.078, global_step=872.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  89%|████████▉ | 1076/1208 [30:16<03:42,  1.69s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0528, train/loss_vlb_step=0.000181, train/loss_step=0.0528, global_step=872.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  89%|████████▉ | 1077/1208 [30:17<03:41,  1.69s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0528, train/loss_vlb_step=0.000181, train/loss_step=0.0528, global_step=872.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  89%|████████▉ | 1077/1208 [30:17<03:41,  1.69s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.09e-5, train/loss_step=0.0163, global_step=873.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  89%|████████▉ | 1078/1208 [30:18<03:39,  1.69s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.09e-5, train/loss_step=0.0163, global_step=873.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  89%|████████▉ | 1078/1208 [30:18<03:39,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=7e-5, train/loss_step=0.0155, global_step=873.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  89%|████████▉ | 1079/1208 [30:19<03:37,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=7e-5, train/loss_step=0.0155, global_step=873.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  89%|████████▉ | 1079/1208 [30:19<03:37,  1.69s/it, loss=0.162, v_num=0, train/loss_simple_step=0.039, train/loss_vlb_step=0.000141, train/loss_step=0.039, global_step=873.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  89%|████████▉ | 1080/1208 [30:22<03:36,  1.69s/it, loss=0.162, v_num=0, train/loss_simple_step=0.039, train/loss_vlb_step=0.000141, train/loss_step=0.039, global_step=873.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  89%|████████▉ | 1080/1208 [30:22<03:36,  1.69s/it, loss=0.185, v_num=0, train/loss_simple_step=0.530, train/loss_vlb_step=0.0089, train/loss_step=0.530, global_step=873.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  89%|████████▉ | 1081/1208 [30:23<03:34,  1.69s/it, loss=0.185, v_num=0, train/loss_simple_step=0.530, train/loss_vlb_step=0.0089, train/loss_step=0.530, global_step=873.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  89%|████████▉ | 1081/1208 [30:23<03:34,  1.69s/it, loss=0.193, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000971, train/loss_step=0.246, global_step=874.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  90%|████████▉ | 1082/1208 [30:24<03:32,  1.69s/it, loss=0.193, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000971, train/loss_step=0.246, global_step=874.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  90%|████████▉ | 1082/1208 [30:24<03:32,  1.69s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.74e-5, train/loss_step=0.0199, global_step=874.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  90%|████████▉ | 1083/1208 [30:25<03:30,  1.69s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.74e-5, train/loss_step=0.0199, global_step=874.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  90%|████████▉ | 1083/1208 [30:25<03:30,  1.69s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.11e-5, train/loss_step=0.0136, global_step=874.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  90%|████████▉ | 1084/1208 [30:29<03:29,  1.69s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.11e-5, train/loss_step=0.0136, global_step=874.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  90%|████████▉ | 1084/1208 [30:29<03:29,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000501, train/loss_step=0.149, global_step=874.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  90%|████████▉ | 1085/1208 [30:30<03:27,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000501, train/loss_step=0.149, global_step=874.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  90%|████████▉ | 1085/1208 [30:30<03:27,  1.69s/it, loss=0.189, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00619, train/loss_step=0.447, global_step=875.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  90%|████████▉ | 1086/1208 [30:31<03:25,  1.69s/it, loss=0.189, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00619, train/loss_step=0.447, global_step=875.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  90%|████████▉ | 1086/1208 [30:31<03:25,  1.69s/it, loss=0.191, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000531, train/loss_step=0.155, global_step=875.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  90%|████████▉ | 1087/1208 [30:32<03:23,  1.69s/it, loss=0.191, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000531, train/loss_step=0.155, global_step=875.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  90%|████████▉ | 1087/1208 [30:32<03:23,  1.69s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000111, train/loss_step=0.0293, global_step=875.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  90%|█████████ | 1088/1208 [30:35<03:22,  1.69s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000111, train/loss_step=0.0293, global_step=875.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  90%|█████████ | 1088/1208 [30:35<03:22,  1.69s/it, loss=0.196, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00162, train/loss_step=0.307, global_step=875.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  90%|█████████ | 1089/1208 [30:36<03:20,  1.69s/it, loss=0.196, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00162, train/loss_step=0.307, global_step=875.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  90%|█████████ | 1089/1208 [30:36<03:20,  1.69s/it, loss=0.211, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00244, train/loss_step=0.377, global_step=876.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  90%|█████████ | 1090/1208 [30:37<03:18,  1.69s/it, loss=0.211, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00244, train/loss_step=0.377, global_step=876.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  90%|█████████ | 1090/1208 [30:37<03:18,  1.69s/it, loss=0.202, v_num=0, train/loss_simple_step=0.093, train/loss_vlb_step=0.000307, train/loss_step=0.093, global_step=876.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  90%|█████████ | 1091/1208 [30:38<03:17,  1.69s/it, loss=0.202, v_num=0, train/loss_simple_step=0.093, train/loss_vlb_step=0.000307, train/loss_step=0.093, global_step=876.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  90%|█████████ | 1091/1208 [30:38<03:17,  1.69s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0832, train/loss_vlb_step=0.000274, train/loss_step=0.0832, global_step=876.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  90%|█████████ | 1092/1208 [30:41<03:15,  1.69s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0832, train/loss_vlb_step=0.000274, train/loss_step=0.0832, global_step=876.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  90%|█████████ | 1092/1208 [30:41<03:15,  1.69s/it, loss=0.202, v_num=0, train/loss_simple_step=0.468, train/loss_vlb_step=0.00405, train/loss_step=0.468, global_step=876.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  90%|█████████ | 1093/1208 [30:42<03:13,  1.69s/it, loss=0.202, v_num=0, train/loss_simple_step=0.468, train/loss_vlb_step=0.00405, train/loss_step=0.468, global_step=876.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  90%|█████████ | 1093/1208 [30:42<03:13,  1.69s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.27e-5, train/loss_step=0.0022, global_step=877.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  91%|█████████ | 1094/1208 [30:43<03:12,  1.69s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.27e-5, train/loss_step=0.0022, global_step=877.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  91%|█████████ | 1094/1208 [30:43<03:12,  1.69s/it, loss=0.166, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000796, train/loss_step=0.199, global_step=877.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  91%|█████████ | 1095/1208 [30:44<03:10,  1.68s/it, loss=0.166, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000796, train/loss_step=0.199, global_step=877.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  91%|█████████ | 1095/1208 [30:44<03:10,  1.68s/it, loss=0.172, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000732, train/loss_step=0.205, global_step=877.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  91%|█████████ | 1096/1208 [30:47<03:08,  1.69s/it, loss=0.172, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000732, train/loss_step=0.205, global_step=877.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  91%|█████████ | 1096/1208 [30:47<03:08,  1.69s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.9e-5, train/loss_step=0.0102, global_step=877.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  91%|█████████ | 1097/1208 [30:48<03:07,  1.69s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.9e-5, train/loss_step=0.0102, global_step=877.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  91%|█████████ | 1097/1208 [30:48<03:07,  1.69s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00832, train/loss_vlb_step=4.21e-5, train/loss_step=0.00832, global_step=878.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  91%|█████████ | 1098/1208 [30:49<03:05,  1.68s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00832, train/loss_vlb_step=4.21e-5, train/loss_step=0.00832, global_step=878.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  91%|█████████ | 1098/1208 [30:49<03:05,  1.68s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0871, train/loss_vlb_step=0.000286, train/loss_step=0.0871, global_step=878.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  91%|█████████ | 1099/1208 [30:50<03:03,  1.68s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0871, train/loss_vlb_step=0.000286, train/loss_step=0.0871, global_step=878.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  91%|█████████ | 1099/1208 [30:50<03:03,  1.68s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.9e-5, train/loss_step=0.0105, global_step=878.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  91%|█████████ | 1100/1208 [30:53<03:01,  1.69s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.9e-5, train/loss_step=0.0105, global_step=878.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  91%|█████████ | 1100/1208 [30:53<03:01,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000116, train/loss_step=0.029, global_step=878.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  91%|█████████ | 1101/1208 [30:54<03:00,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000116, train/loss_step=0.029, global_step=878.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  91%|█████████ | 1101/1208 [30:54<03:00,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000191, train/loss_step=0.0545, global_step=879.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  91%|█████████ | 1102/1208 [30:55<02:58,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000191, train/loss_step=0.0545, global_step=879.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  91%|█████████ | 1102/1208 [30:55<02:58,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000105, train/loss_step=0.0279, global_step=879.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  91%|█████████▏| 1103/1208 [30:56<02:56,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000105, train/loss_step=0.0279, global_step=879.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  91%|█████████▏| 1103/1208 [30:56<02:56,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0341, train/loss_vlb_step=0.000127, train/loss_step=0.0341, global_step=879.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  91%|█████████▏| 1104/1208 [30:59<02:55,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0341, train/loss_vlb_step=0.000127, train/loss_step=0.0341, global_step=879.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  91%|█████████▏| 1104/1208 [30:59<02:55,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000549, train/loss_step=0.165, global_step=879.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  91%|█████████▏| 1105/1208 [31:00<02:53,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000549, train/loss_step=0.165, global_step=879.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  91%|█████████▏| 1105/1208 [31:00<02:53,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.653, train/loss_vlb_step=0.042, train/loss_step=0.653, global_step=880.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  92%|█████████▏| 1106/1208 [31:01<02:51,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.653, train/loss_vlb_step=0.042, train/loss_step=0.653, global_step=880.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  92%|█████████▏| 1106/1208 [31:01<02:51,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.58e-5, train/loss_step=0.0124, global_step=880.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  92%|█████████▏| 1107/1208 [31:02<02:49,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.58e-5, train/loss_step=0.0124, global_step=880.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  92%|█████████▏| 1107/1208 [31:02<02:49,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00218, train/loss_step=0.339, global_step=880.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  92%|█████████▏| 1108/1208 [31:05<02:48,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00218, train/loss_step=0.339, global_step=880.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  92%|█████████▏| 1108/1208 [31:05<02:48,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0721, train/loss_vlb_step=0.000243, train/loss_step=0.0721, global_step=880.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  92%|█████████▏| 1109/1208 [31:06<02:46,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0721, train/loss_vlb_step=0.000243, train/loss_step=0.0721, global_step=880.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  92%|█████████▏| 1109/1208 [31:06<02:46,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00828, train/loss_vlb_step=4.03e-5, train/loss_step=0.00828, global_step=881.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  92%|█████████▏| 1110/1208 [31:07<02:44,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00828, train/loss_vlb_step=4.03e-5, train/loss_step=0.00828, global_step=881.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  92%|█████████▏| 1110/1208 [31:07<02:44,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00505, train/loss_vlb_step=2.65e-5, train/loss_step=0.00505, global_step=881.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  92%|█████████▏| 1111/1208 [31:08<02:43,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00505, train/loss_vlb_step=2.65e-5, train/loss_step=0.00505, global_step=881.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  92%|█████████▏| 1111/1208 [31:08<02:43,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.471, train/loss_vlb_step=0.00697, train/loss_step=0.471, global_step=881.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  92%|█████████▏| 1112/1208 [31:11<02:41,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.471, train/loss_vlb_step=0.00697, train/loss_step=0.471, global_step=881.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  92%|█████████▏| 1112/1208 [31:11<02:41,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.29e-5, train/loss_step=0.0113, global_step=881.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  92%|█████████▏| 1113/1208 [31:12<02:39,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.29e-5, train/loss_step=0.0113, global_step=881.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  92%|█████████▏| 1113/1208 [31:12<02:39,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.090, train/loss_vlb_step=0.000296, train/loss_step=0.090, global_step=882.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  92%|█████████▏| 1114/1208 [31:13<02:38,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.090, train/loss_vlb_step=0.000296, train/loss_step=0.090, global_step=882.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  92%|█████████▏| 1114/1208 [31:13<02:38,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00135, train/loss_step=0.291, global_step=882.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  92%|█████████▏| 1115/1208 [31:14<02:36,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00135, train/loss_step=0.291, global_step=882.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  92%|█████████▏| 1115/1208 [31:14<02:36,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=9.23e-5, train/loss_step=0.022, global_step=882.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  92%|█████████▏| 1116/1208 [31:17<02:34,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=9.23e-5, train/loss_step=0.022, global_step=882.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  92%|█████████▏| 1116/1208 [31:17<02:34,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00118, train/loss_step=0.289, global_step=882.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  92%|█████████▏| 1117/1208 [31:18<02:33,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00118, train/loss_step=0.289, global_step=882.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  92%|█████████▏| 1117/1208 [31:18<02:33,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000114, train/loss_step=0.0286, global_step=883.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  93%|█████████▎| 1118/1208 [31:19<02:31,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000114, train/loss_step=0.0286, global_step=883.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  93%|█████████▎| 1118/1208 [31:19<02:31,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000347, train/loss_step=0.106, global_step=883.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  93%|█████████▎| 1119/1208 [31:20<02:29,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000347, train/loss_step=0.106, global_step=883.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  93%|█████████▎| 1119/1208 [31:20<02:29,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0498, train/loss_vlb_step=0.000176, train/loss_step=0.0498, global_step=883.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  93%|█████████▎| 1120/1208 [31:23<02:27,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0498, train/loss_vlb_step=0.000176, train/loss_step=0.0498, global_step=883.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  93%|█████████▎| 1120/1208 [31:23<02:27,  1.68s/it, loss=0.179, v_num=0, train/loss_simple_step=0.857, train/loss_vlb_step=0.216, train/loss_step=0.857, global_step=883.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]     Epoch 2:  93%|█████████▎| 1121/1208 [31:24<02:26,  1.68s/it, loss=0.179, v_num=0, train/loss_simple_step=0.857, train/loss_vlb_step=0.216, train/loss_step=0.857, global_step=883.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  93%|█████████▎| 1121/1208 [31:24<02:26,  1.68s/it, loss=0.213, v_num=0, train/loss_simple_step=0.735, train/loss_vlb_step=0.0538, train/loss_step=0.735, global_step=884.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  93%|█████████▎| 1122/1208 [31:25<02:24,  1.68s/it, loss=0.213, v_num=0, train/loss_simple_step=0.735, train/loss_vlb_step=0.0538, train/loss_step=0.735, global_step=884.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  93%|█████████▎| 1122/1208 [31:25<02:24,  1.68s/it, loss=0.218, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000396, train/loss_step=0.121, global_step=884.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  93%|█████████▎| 1123/1208 [31:26<02:22,  1.68s/it, loss=0.218, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000396, train/loss_step=0.121, global_step=884.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  93%|█████████▎| 1123/1208 [31:26<02:22,  1.68s/it, loss=0.216, v_num=0, train/loss_simple_step=0.00449, train/loss_vlb_step=2.44e-5, train/loss_step=0.00449, global_step=884.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  93%|█████████▎| 1124/1208 [31:29<02:21,  1.68s/it, loss=0.216, v_num=0, train/loss_simple_step=0.00449, train/loss_vlb_step=2.44e-5, train/loss_step=0.00449, global_step=884.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  93%|█████████▎| 1124/1208 [31:29<02:21,  1.68s/it, loss=0.235, v_num=0, train/loss_simple_step=0.542, train/loss_vlb_step=0.0152, train/loss_step=0.542, global_step=884.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]     Epoch 2:  93%|█████████▎| 1125/1208 [31:30<02:19,  1.68s/it, loss=0.235, v_num=0, train/loss_simple_step=0.542, train/loss_vlb_step=0.0152, train/loss_step=0.542, global_step=884.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  93%|█████████▎| 1125/1208 [31:30<02:19,  1.68s/it, loss=0.222, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00305, train/loss_step=0.383, global_step=885.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  93%|█████████▎| 1126/1208 [31:31<02:17,  1.68s/it, loss=0.222, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00305, train/loss_step=0.383, global_step=885.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  93%|█████████▎| 1126/1208 [31:31<02:17,  1.68s/it, loss=0.226, v_num=0, train/loss_simple_step=0.0931, train/loss_vlb_step=0.000311, train/loss_step=0.0931, global_step=885.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  93%|█████████▎| 1127/1208 [31:32<02:16,  1.68s/it, loss=0.226, v_num=0, train/loss_simple_step=0.0931, train/loss_vlb_step=0.000311, train/loss_step=0.0931, global_step=885.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  93%|█████████▎| 1127/1208 [31:32<02:16,  1.68s/it, loss=0.209, v_num=0, train/loss_simple_step=0.00374, train/loss_vlb_step=2.11e-5, train/loss_step=0.00374, global_step=885.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  93%|█████████▎| 1128/1208 [31:35<02:14,  1.68s/it, loss=0.209, v_num=0, train/loss_simple_step=0.00374, train/loss_vlb_step=2.11e-5, train/loss_step=0.00374, global_step=885.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  93%|█████████▎| 1128/1208 [31:35<02:14,  1.68s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0535, train/loss_vlb_step=0.000183, train/loss_step=0.0535, global_step=885.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  93%|█████████▎| 1129/1208 [31:36<02:12,  1.68s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0535, train/loss_vlb_step=0.000183, train/loss_step=0.0535, global_step=885.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  93%|█████████▎| 1129/1208 [31:36<02:12,  1.68s/it, loss=0.212, v_num=0, train/loss_simple_step=0.0782, train/loss_vlb_step=0.000265, train/loss_step=0.0782, global_step=886.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  94%|█████████▎| 1130/1208 [31:37<02:10,  1.68s/it, loss=0.212, v_num=0, train/loss_simple_step=0.0782, train/loss_vlb_step=0.000265, train/loss_step=0.0782, global_step=886.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  94%|█████████▎| 1130/1208 [31:37<02:10,  1.68s/it, loss=0.23, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00223, train/loss_step=0.371, global_step=886.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  94%|█████████▎| 1131/1208 [31:38<02:09,  1.68s/it, loss=0.23, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00223, train/loss_step=0.371, global_step=886.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  94%|█████████▎| 1131/1208 [31:38<02:09,  1.68s/it, loss=0.232, v_num=0, train/loss_simple_step=0.511, train/loss_vlb_step=0.00908, train/loss_step=0.511, global_step=886.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  94%|█████████▎| 1132/1208 [31:41<02:07,  1.68s/it, loss=0.232, v_num=0, train/loss_simple_step=0.511, train/loss_vlb_step=0.00908, train/loss_step=0.511, global_step=886.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  94%|█████████▎| 1132/1208 [31:41<02:07,  1.68s/it, loss=0.239, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000502, train/loss_step=0.152, global_step=886.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  94%|█████████▍| 1133/1208 [31:42<02:05,  1.68s/it, loss=0.239, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000502, train/loss_step=0.152, global_step=886.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  94%|█████████▍| 1133/1208 [31:42<02:05,  1.68s/it, loss=0.253, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00255, train/loss_step=0.364, global_step=887.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  94%|█████████▍| 1134/1208 [31:43<02:04,  1.68s/it, loss=0.253, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00255, train/loss_step=0.364, global_step=887.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  94%|█████████▍| 1134/1208 [31:43<02:04,  1.68s/it, loss=0.249, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000833, train/loss_step=0.223, global_step=887.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  94%|█████████▍| 1135/1208 [31:44<02:02,  1.68s/it, loss=0.249, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000833, train/loss_step=0.223, global_step=887.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  94%|█████████▍| 1135/1208 [31:44<02:02,  1.68s/it, loss=0.249, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=6.23e-5, train/loss_step=0.0132, global_step=887.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  94%|█████████▍| 1136/1208 [31:47<02:00,  1.68s/it, loss=0.249, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=6.23e-5, train/loss_step=0.0132, global_step=887.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  94%|█████████▍| 1136/1208 [31:47<02:00,  1.68s/it, loss=0.235, v_num=0, train/loss_simple_step=0.00431, train/loss_vlb_step=2.39e-5, train/loss_step=0.00431, global_step=887.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  94%|█████████▍| 1137/1208 [31:48<01:59,  1.68s/it, loss=0.235, v_num=0, train/loss_simple_step=0.00431, train/loss_vlb_step=2.39e-5, train/loss_step=0.00431, global_step=887.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  94%|█████████▍| 1137/1208 [31:48<01:59,  1.68s/it, loss=0.243, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000665, train/loss_step=0.194, global_step=888.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  94%|█████████▍| 1138/1208 [31:49<01:57,  1.68s/it, loss=0.243, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000665, train/loss_step=0.194, global_step=888.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  94%|█████████▍| 1138/1208 [31:49<01:57,  1.68s/it, loss=0.239, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.97e-5, train/loss_step=0.0209, global_step=888.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  94%|█████████▍| 1139/1208 [31:50<01:55,  1.68s/it, loss=0.239, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.97e-5, train/loss_step=0.0209, global_step=888.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  94%|█████████▍| 1139/1208 [31:50<01:55,  1.68s/it, loss=0.242, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=888.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  94%|█████████▍| 1140/1208 [31:52<01:54,  1.68s/it, loss=0.242, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=888.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  94%|█████████▍| 1140/1208 [31:52<01:54,  1.68s/it, loss=0.227, v_num=0, train/loss_simple_step=0.565, train/loss_vlb_step=0.0186, train/loss_step=0.565, global_step=888.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  94%|█████████▍| 1141/1208 [31:54<01:52,  1.68s/it, loss=0.227, v_num=0, train/loss_simple_step=0.565, train/loss_vlb_step=0.0186, train/loss_step=0.565, global_step=888.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  94%|█████████▍| 1141/1208 [31:54<01:52,  1.68s/it, loss=0.191, v_num=0, train/loss_simple_step=0.00327, train/loss_vlb_step=1.82e-5, train/loss_step=0.00327, global_step=889.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  95%|█████████▍| 1142/1208 [31:55<01:50,  1.68s/it, loss=0.191, v_num=0, train/loss_simple_step=0.00327, train/loss_vlb_step=1.82e-5, train/loss_step=0.00327, global_step=889.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  95%|█████████▍| 1142/1208 [31:55<01:50,  1.68s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0366, train/loss_vlb_step=0.000143, train/loss_step=0.0366, global_step=889.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  95%|█████████▍| 1143/1208 [31:56<01:48,  1.68s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0366, train/loss_vlb_step=0.000143, train/loss_step=0.0366, global_step=889.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  95%|█████████▍| 1143/1208 [31:56<01:48,  1.68s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.000149, train/loss_step=0.0395, global_step=889.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  95%|█████████▍| 1144/1208 [31:58<01:47,  1.68s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.000149, train/loss_step=0.0395, global_step=889.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  95%|█████████▍| 1144/1208 [31:58<01:47,  1.68s/it, loss=0.172, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000883, train/loss_step=0.222, global_step=889.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  95%|█████████▍| 1145/1208 [31:59<01:45,  1.68s/it, loss=0.172, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000883, train/loss_step=0.222, global_step=889.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  95%|█████████▍| 1145/1208 [31:59<01:45,  1.68s/it, loss=0.169, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00212, train/loss_step=0.323, global_step=890.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  95%|█████████▍| 1146/1208 [32:00<01:43,  1.68s/it, loss=0.169, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00212, train/loss_step=0.323, global_step=890.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  95%|█████████▍| 1146/1208 [32:00<01:43,  1.68s/it, loss=0.173, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000544, train/loss_step=0.159, global_step=890.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  95%|█████████▍| 1147/1208 [32:01<01:42,  1.68s/it, loss=0.173, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000544, train/loss_step=0.159, global_step=890.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  95%|█████████▍| 1147/1208 [32:01<01:42,  1.68s/it, loss=0.183, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000794, train/loss_step=0.216, global_step=890.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  95%|█████████▌| 1148/1208 [32:04<01:40,  1.68s/it, loss=0.183, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000794, train/loss_step=0.216, global_step=890.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  95%|█████████▌| 1148/1208 [32:04<01:40,  1.68s/it, loss=0.184, v_num=0, train/loss_simple_step=0.073, train/loss_vlb_step=0.000246, train/loss_step=0.073, global_step=890.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  95%|█████████▌| 1149/1208 [32:05<01:38,  1.68s/it, loss=0.184, v_num=0, train/loss_simple_step=0.073, train/loss_vlb_step=0.000246, train/loss_step=0.073, global_step=890.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  95%|█████████▌| 1149/1208 [32:05<01:38,  1.68s/it, loss=0.191, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000901, train/loss_step=0.221, global_step=891.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  95%|█████████▌| 1150/1208 [32:06<01:37,  1.68s/it, loss=0.191, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000901, train/loss_step=0.221, global_step=891.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  95%|█████████▌| 1150/1208 [32:06<01:37,  1.68s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=1.1e-5, train/loss_step=0.00184, global_step=891.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  95%|█████████▌| 1151/1208 [32:07<01:35,  1.67s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=1.1e-5, train/loss_step=0.00184, global_step=891.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  95%|█████████▌| 1151/1208 [32:07<01:35,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=1.04e-5, train/loss_step=0.00171, global_step=891.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  95%|█████████▌| 1152/1208 [32:10<01:33,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=1.04e-5, train/loss_step=0.00171, global_step=891.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  95%|█████████▌| 1152/1208 [32:10<01:33,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000647, train/loss_step=0.185, global_step=891.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  95%|█████████▌| 1153/1208 [32:11<01:32,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000647, train/loss_step=0.185, global_step=891.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  95%|█████████▌| 1153/1208 [32:11<01:32,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0383, train/loss_vlb_step=0.000141, train/loss_step=0.0383, global_step=892.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  96%|█████████▌| 1154/1208 [32:12<01:30,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0383, train/loss_vlb_step=0.000141, train/loss_step=0.0383, global_step=892.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  96%|█████████▌| 1154/1208 [32:12<01:30,  1.67s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.78e-5, train/loss_step=0.0187, global_step=892.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  96%|█████████▌| 1155/1208 [32:13<01:28,  1.67s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.78e-5, train/loss_step=0.0187, global_step=892.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  96%|█████████▌| 1155/1208 [32:13<01:28,  1.67s/it, loss=0.135, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00116, train/loss_step=0.261, global_step=892.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  96%|█████████▌| 1156/1208 [32:16<01:27,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00116, train/loss_step=0.261, global_step=892.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  96%|█████████▌| 1156/1208 [32:16<01:27,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0896, train/loss_vlb_step=0.000295, train/loss_step=0.0896, global_step=892.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  96%|█████████▌| 1157/1208 [32:17<01:25,  1.67s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0896, train/loss_vlb_step=0.000295, train/loss_step=0.0896, global_step=892.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  96%|█████████▌| 1157/1208 [32:17<01:25,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0424, train/loss_vlb_step=0.000159, train/loss_step=0.0424, global_step=893.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  96%|█████████▌| 1158/1208 [32:18<01:23,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0424, train/loss_vlb_step=0.000159, train/loss_step=0.0424, global_step=893.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  96%|█████████▌| 1158/1208 [32:18<01:23,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00426, train/loss_step=0.403, global_step=893.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  96%|█████████▌| 1159/1208 [32:19<01:22,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00426, train/loss_step=0.403, global_step=893.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  96%|█████████▌| 1159/1208 [32:19<01:22,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00318, train/loss_vlb_step=1.85e-5, train/loss_step=0.00318, global_step=893.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  96%|█████████▌| 1160/1208 [32:22<01:20,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00318, train/loss_vlb_step=1.85e-5, train/loss_step=0.00318, global_step=893.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  96%|█████████▌| 1160/1208 [32:22<01:20,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.738, train/loss_vlb_step=0.0629, train/loss_step=0.738, global_step=893.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]     Epoch 2:  96%|█████████▌| 1161/1208 [32:23<01:18,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.738, train/loss_vlb_step=0.0629, train/loss_step=0.738, global_step=893.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  96%|█████████▌| 1161/1208 [32:23<01:18,  1.67s/it, loss=0.173, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00401, train/loss_step=0.385, global_step=894.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  96%|█████████▌| 1162/1208 [32:24<01:16,  1.67s/it, loss=0.173, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00401, train/loss_step=0.385, global_step=894.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  96%|█████████▌| 1162/1208 [32:24<01:16,  1.67s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00704, train/loss_vlb_step=3.37e-5, train/loss_step=0.00704, global_step=894.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  96%|█████████▋| 1163/1208 [32:25<01:15,  1.67s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00704, train/loss_vlb_step=3.37e-5, train/loss_step=0.00704, global_step=894.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  96%|█████████▋| 1163/1208 [32:25<01:15,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.66e-5, train/loss_step=0.003, global_step=894.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]     Epoch 2:  96%|█████████▋| 1164/1208 [32:28<01:13,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.66e-5, train/loss_step=0.003, global_step=894.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  96%|█████████▋| 1164/1208 [32:28<01:13,  1.67s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00745, train/loss_vlb_step=3.7e-5, train/loss_step=0.00745, global_step=894.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  96%|█████████▋| 1165/1208 [32:29<01:11,  1.67s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00745, train/loss_vlb_step=3.7e-5, train/loss_step=0.00745, global_step=894.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  96%|█████████▋| 1165/1208 [32:29<01:11,  1.67s/it, loss=0.15, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000473, train/loss_step=0.144, global_step=895.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  97%|█████████▋| 1166/1208 [32:30<01:10,  1.67s/it, loss=0.15, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000473, train/loss_step=0.144, global_step=895.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  97%|█████████▋| 1166/1208 [32:30<01:10,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=4.76e-5, train/loss_step=0.0109, global_step=895.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  97%|█████████▋| 1167/1208 [32:31<01:08,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=4.76e-5, train/loss_step=0.0109, global_step=895.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  97%|█████████▋| 1167/1208 [32:31<01:08,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.24e-5, train/loss_step=0.0111, global_step=895.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  97%|█████████▋| 1168/1208 [32:34<01:06,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.24e-5, train/loss_step=0.0111, global_step=895.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  97%|█████████▋| 1168/1208 [32:34<01:06,  1.67s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00447, train/loss_vlb_step=2.38e-5, train/loss_step=0.00447, global_step=895.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  97%|█████████▋| 1169/1208 [32:35<01:05,  1.67s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00447, train/loss_vlb_step=2.38e-5, train/loss_step=0.00447, global_step=895.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  97%|█████████▋| 1169/1208 [32:35<01:05,  1.67s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.36e-5, train/loss_step=0.0155, global_step=896.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  97%|█████████▋| 1170/1208 [32:36<01:03,  1.67s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.36e-5, train/loss_step=0.0155, global_step=896.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  97%|█████████▋| 1170/1208 [32:36<01:03,  1.67s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00458, train/loss_vlb_step=2.43e-5, train/loss_step=0.00458, global_step=896.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  97%|█████████▋| 1171/1208 [32:37<01:01,  1.67s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00458, train/loss_vlb_step=2.43e-5, train/loss_step=0.00458, global_step=896.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  97%|█████████▋| 1171/1208 [32:37<01:01,  1.67s/it, loss=0.129, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000794, train/loss_step=0.205, global_step=896.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  97%|█████████▋| 1172/1208 [32:40<01:00,  1.67s/it, loss=0.129, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000794, train/loss_step=0.205, global_step=896.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  97%|█████████▋| 1172/1208 [32:40<01:00,  1.67s/it, loss=0.142, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00364, train/loss_step=0.439, global_step=896.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  97%|█████████▋| 1173/1208 [32:41<00:58,  1.67s/it, loss=0.142, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00364, train/loss_step=0.439, global_step=896.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  97%|█████████▋| 1173/1208 [32:41<00:58,  1.67s/it, loss=0.144, v_num=0, train/loss_simple_step=0.077, train/loss_vlb_step=0.000257, train/loss_step=0.077, global_step=897.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  97%|█████████▋| 1174/1208 [32:42<00:56,  1.67s/it, loss=0.144, v_num=0, train/loss_simple_step=0.077, train/loss_vlb_step=0.000257, train/loss_step=0.077, global_step=897.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  97%|█████████▋| 1174/1208 [32:42<00:56,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00881, train/loss_vlb_step=4.34e-5, train/loss_step=0.00881, global_step=897.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  97%|█████████▋| 1175/1208 [32:43<00:55,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00881, train/loss_vlb_step=4.34e-5, train/loss_step=0.00881, global_step=897.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  97%|█████████▋| 1175/1208 [32:43<00:55,  1.67s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0977, train/loss_vlb_step=0.000323, train/loss_step=0.0977, global_step=897.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  97%|█████████▋| 1176/1208 [32:46<00:53,  1.67s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0977, train/loss_vlb_step=0.000323, train/loss_step=0.0977, global_step=897.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  97%|█████████▋| 1176/1208 [32:46<00:53,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.16e-5, train/loss_step=0.00192, global_step=897.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  97%|█████████▋| 1177/1208 [32:47<00:51,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.16e-5, train/loss_step=0.00192, global_step=897.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  97%|█████████▋| 1177/1208 [32:47<00:51,  1.67s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=1.34e-5, train/loss_step=0.0023, global_step=898.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  98%|█████████▊| 1178/1208 [32:48<00:50,  1.67s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=1.34e-5, train/loss_step=0.0023, global_step=898.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  98%|█████████▊| 1178/1208 [32:48<00:50,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.449, train/loss_vlb_step=0.00418, train/loss_step=0.449, global_step=898.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  98%|█████████▊| 1179/1208 [32:49<00:48,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.449, train/loss_vlb_step=0.00418, train/loss_step=0.449, global_step=898.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  98%|█████████▊| 1179/1208 [32:49<00:48,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000158, train/loss_step=0.0437, global_step=898.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  98%|█████████▊| 1180/1208 [32:52<00:46,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000158, train/loss_step=0.0437, global_step=898.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  98%|█████████▊| 1180/1208 [32:52<00:46,  1.67s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.0656, train/loss_vlb_step=0.00023, train/loss_step=0.0656, global_step=898.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  98%|█████████▊| 1181/1208 [32:53<00:45,  1.67s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.0656, train/loss_vlb_step=0.00023, train/loss_step=0.0656, global_step=898.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  98%|█████████▊| 1181/1208 [32:53<00:45,  1.67s/it, loss=0.0839, v_num=0, train/loss_simple_step=0.0808, train/loss_vlb_step=0.00027, train/loss_step=0.0808, global_step=899.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  98%|█████████▊| 1182/1208 [32:54<00:43,  1.67s/it, loss=0.0839, v_num=0, train/loss_simple_step=0.0808, train/loss_vlb_step=0.00027, train/loss_step=0.0808, global_step=899.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  98%|█████████▊| 1182/1208 [32:54<00:43,  1.67s/it, loss=0.0917, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000534, train/loss_step=0.162, global_step=899.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2:  98%|█████████▊| 1183/1208 [32:55<00:41,  1.67s/it, loss=0.0917, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000534, train/loss_step=0.162, global_step=899.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  98%|█████████▊| 1183/1208 [32:55<00:41,  1.67s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.24e-5, train/loss_step=0.00207, global_step=899.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  98%|█████████▊| 1184/1208 [32:58<00:40,  1.67s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.24e-5, train/loss_step=0.00207, global_step=899.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  98%|█████████▊| 1184/1208 [32:58<00:40,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.00289, train/loss_step=0.406, global_step=899.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]     Epoch 2:  98%|█████████▊| 1185/1208 [32:59<00:38,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.00289, train/loss_step=0.406, global_step=899.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  98%|█████████▊| 1185/1208 [32:59<00:38,  1.67s/it, loss=0.135, v_num=0, train/loss_simple_step=0.610, train/loss_vlb_step=0.00862, train/loss_step=0.610, global_step=900.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  98%|█████████▊| 1186/1208 [33:00<00:36,  1.67s/it, loss=0.135, v_num=0, train/loss_simple_step=0.610, train/loss_vlb_step=0.00862, train/loss_step=0.610, global_step=900.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  98%|█████████▊| 1186/1208 [33:00<00:36,  1.67s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00656, train/loss_vlb_step=3.43e-5, train/loss_step=0.00656, global_step=900.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  98%|█████████▊| 1187/1208 [33:01<00:35,  1.67s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00656, train/loss_vlb_step=3.43e-5, train/loss_step=0.00656, global_step=900.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  98%|█████████▊| 1187/1208 [33:01<00:35,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000831, train/loss_step=0.222, global_step=900.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   Epoch 2:  98%|█████████▊| 1188/1208 [33:05<00:33,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000831, train/loss_step=0.222, global_step=900.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  98%|█████████▊| 1188/1208 [33:05<00:33,  1.67s/it, loss=0.176, v_num=0, train/loss_simple_step=0.628, train/loss_vlb_step=0.0123, train/loss_step=0.628, global_step=900.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  98%|█████████▊| 1189/1208 [33:06<00:31,  1.67s/it, loss=0.176, v_num=0, train/loss_simple_step=0.628, train/loss_vlb_step=0.0123, train/loss_step=0.628, global_step=900.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  98%|█████████▊| 1189/1208 [33:06<00:31,  1.67s/it, loss=0.193, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00193, train/loss_step=0.340, global_step=901.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  99%|█████████▊| 1190/1208 [33:07<00:30,  1.67s/it, loss=0.193, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00193, train/loss_step=0.340, global_step=901.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  99%|█████████▊| 1190/1208 [33:07<00:30,  1.67s/it, loss=0.207, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00137, train/loss_step=0.290, global_step=901.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  99%|█████████▊| 1191/1208 [33:08<00:28,  1.67s/it, loss=0.207, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00137, train/loss_step=0.290, global_step=901.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  99%|█████████▊| 1191/1208 [33:08<00:28,  1.67s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00455, train/loss_vlb_step=2.57e-5, train/loss_step=0.00455, global_step=901.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  99%|█████████▊| 1192/1208 [33:11<00:26,  1.67s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00455, train/loss_vlb_step=2.57e-5, train/loss_step=0.00455, global_step=901.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  99%|█████████▊| 1192/1208 [33:11<00:26,  1.67s/it, loss=0.193, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00239, train/loss_step=0.371, global_step=901.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]    Epoch 2:  99%|█████████▉| 1193/1208 [33:12<00:25,  1.67s/it, loss=0.193, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00239, train/loss_step=0.371, global_step=901.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  99%|█████████▉| 1193/1208 [33:12<00:25,  1.67s/it, loss=0.199, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000623, train/loss_step=0.182, global_step=902.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  99%|█████████▉| 1194/1208 [33:13<00:23,  1.67s/it, loss=0.199, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000623, train/loss_step=0.182, global_step=902.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  99%|█████████▉| 1194/1208 [33:13<00:23,  1.67s/it, loss=0.205, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000456, train/loss_step=0.137, global_step=902.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  99%|█████████▉| 1195/1208 [33:14<00:21,  1.67s/it, loss=0.205, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000456, train/loss_step=0.137, global_step=902.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  99%|█████████▉| 1195/1208 [33:14<00:21,  1.67s/it, loss=0.203, v_num=0, train/loss_simple_step=0.059, train/loss_vlb_step=0.000205, train/loss_step=0.059, global_step=902.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  99%|█████████▉| 1196/1208 [33:17<00:20,  1.67s/it, loss=0.203, v_num=0, train/loss_simple_step=0.059, train/loss_vlb_step=0.000205, train/loss_step=0.059, global_step=902.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  99%|█████████▉| 1196/1208 [33:17<00:20,  1.67s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0343, train/loss_vlb_step=0.000122, train/loss_step=0.0343, global_step=902.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  99%|█████████▉| 1197/1208 [33:18<00:18,  1.67s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0343, train/loss_vlb_step=0.000122, train/loss_step=0.0343, global_step=902.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  99%|█████████▉| 1197/1208 [33:18<00:18,  1.67s/it, loss=0.205, v_num=0, train/loss_simple_step=0.00377, train/loss_vlb_step=2.1e-5, train/loss_step=0.00377, global_step=903.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  99%|█████████▉| 1198/1208 [33:19<00:16,  1.67s/it, loss=0.205, v_num=0, train/loss_simple_step=0.00377, train/loss_vlb_step=2.1e-5, train/loss_step=0.00377, global_step=903.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  99%|█████████▉| 1198/1208 [33:19<00:16,  1.67s/it, loss=0.194, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000963, train/loss_step=0.242, global_step=903.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]  Epoch 2:  99%|█████████▉| 1199/1208 [33:20<00:15,  1.67s/it, loss=0.194, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000963, train/loss_step=0.242, global_step=903.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  99%|█████████▉| 1199/1208 [33:20<00:15,  1.67s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00785, train/loss_vlb_step=3.79e-5, train/loss_step=0.00785, global_step=903.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  99%|█████████▉| 1200/1208 [33:24<00:13,  1.67s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00785, train/loss_vlb_step=3.79e-5, train/loss_step=0.00785, global_step=903.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  99%|█████████▉| 1200/1208 [33:24<00:13,  1.67s/it, loss=0.201, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000817, train/loss_step=0.227, global_step=903.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]   
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.75it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.74it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.76it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.80it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.80it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.76it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.76it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.76it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.83it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.78it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.83it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.83it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.78it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.83it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.83it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.81it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.83it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.83it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.84it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.84it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.82it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.84it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.83it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.84it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.84it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.83it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 2:  99%|█████████▉| 1201/1208 [33:54<00:11,  1.69s/it, loss=0.201, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000817, train/loss_step=0.227, global_step=903.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2:  99%|█████████▉| 1201/1208 [33:54<00:11,  1.69s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00831, train/loss_vlb_step=3.9e-5, train/loss_step=0.00831, global_step=904.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2: 100%|█████████▉| 1202/1208 [33:55<00:10,  1.69s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00831, train/loss_vlb_step=3.9e-5, train/loss_step=0.00831, global_step=904.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2: 100%|█████████▉| 1202/1208 [33:55<00:10,  1.69s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=3.67e-5, train/loss_step=0.0072, global_step=904.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2: 100%|█████████▉| 1203/1208 [33:56<00:08,  1.69s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=3.67e-5, train/loss_step=0.0072, global_step=904.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2: 100%|█████████▉| 1203/1208 [33:56<00:08,  1.69s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0027, train/loss_vlb_step=1.57e-5, train/loss_step=0.0027, global_step=904.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2: 100%|█████████▉| 1204/1208 [33:59<00:06,  1.69s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0027, train/loss_vlb_step=1.57e-5, train/loss_step=0.0027, global_step=904.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2: 100%|█████████▉| 1204/1208 [33:59<00:06,  1.69s/it, loss=0.174, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000329, train/loss_step=0.100, global_step=904.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2: 100%|█████████▉| 1205/1208 [34:00<00:05,  1.69s/it, loss=0.174, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000329, train/loss_step=0.100, global_step=904.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2: 100%|█████████▉| 1205/1208 [34:00<00:05,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=905.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147] Epoch 2: 100%|█████████▉| 1206/1208 [34:01<00:03,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=905.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2: 100%|█████████▉| 1206/1208 [34:01<00:03,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.38e-5, train/loss_step=0.0117, global_step=905.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2: 100%|█████████▉| 1207/1208 [34:02<00:01,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.38e-5, train/loss_step=0.0117, global_step=905.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2: 100%|█████████▉| 1207/1208 [34:02<00:01,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0937, train/loss_vlb_step=0.000312, train/loss_step=0.0937, global_step=905.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2: 100%|██████████| 1208/1208 [34:05<00:00,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0937, train/loss_vlb_step=0.000312, train/loss_step=0.0937, global_step=905.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 2: 100%|██████████| 1208/1208 [34:05<00:00,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0827, train/loss_vlb_step=0.000277, train/loss_step=0.0827, global_step=905.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]
+
+
+Epoch 2:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.117, v_num=0, train/loss_simple_step=0.0827, train/loss_vlb_step=0.000277, train/loss_step=0.0827, global_step=905.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]           Epoch 3:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.117, v_num=0, train/loss_simple_step=0.0827, train/loss_vlb_step=0.000277, train/loss_step=0.0827, global_step=905.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][AData shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.87it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.84it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:25,  1.86it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.84it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.86it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.84it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.85it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.84it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.85it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.84it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.83it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.85it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.85it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.83it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.85it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.86it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.85it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.86it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.85it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.86it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.85it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.86it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.85it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:20,  1.86it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.83it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.85it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.85it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:19,  1.85it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.85it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.85it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.86it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:18,  1.85it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:18,  1.86it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.86it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.85it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.85it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.85it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.85it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.85it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.85it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.85it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.85it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.85it/s][ADDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.85it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.85it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.83it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.85it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.85it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.85it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:12<00:14,  1.85it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:12<00:14,  1.85it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.85it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.85it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.85it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.83it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.85it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.85it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.83it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.85it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.83it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.85it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.85it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.83it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.85it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.85it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.83it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.85it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.85it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.83it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.85it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.85it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.83it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.85it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.85it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.83it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.85it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.85it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.83it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  70%|███████   | 35/50 [00:18<00:08,  1.85it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:18<00:08,  1.85it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.83it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.85it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.85it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.83it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:19<00:07,  1.85it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.85it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.83it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.84it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.84it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.83it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.84it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.83it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.81it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.83it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.83it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.83it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.82it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.78it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.83it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.82it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.82it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]Epoch 3:   0%|          | 1/1208 [00:31<10:32:26, 31.44s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0827, train/loss_vlb_step=0.000277, train/loss_step=0.0827, global_step=905.0, train/loss_simple_epoch=0.147, train/loss_vlb_epoch=0.00227, train/loss_epoch=0.147]Epoch 3:   0%|          | 1/1208 [00:31<10:32:28, 31.44s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00622, train/loss_vlb_step=3.28e-5, train/loss_step=0.00622, global_step=906.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:   0%|          | 2/1208 [00:32<5:26:26, 16.24s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00622, train/loss_vlb_step=3.28e-5, train/loss_step=0.00622, global_step=906.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:   0%|          | 2/1208 [00:32<5:26:27, 16.24s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000809, train/loss_step=0.203, global_step=906.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   0%|          | 3/1208 [00:33<3:44:20, 11.17s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000809, train/loss_step=0.203, global_step=906.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   0%|          | 3/1208 [00:33<3:44:21, 11.17s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.58e-5, train/loss_step=0.0245, global_step=906.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   0%|          | 4/1208 [00:36<3:04:14,  9.18s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.58e-5, train/loss_step=0.0245, global_step=906.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   0%|          | 4/1208 [00:36<3:04:15,  9.18s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000611, train/loss_step=0.179, global_step=906.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:   0%|          | 5/1208 [00:37<2:31:29,  7.56s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000611, train/loss_step=0.179, global_step=906.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   0%|          | 5/1208 [00:37<2:31:30,  7.56s/it, loss=0.0898, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.00106, train/loss_step=0.236, global_step=907.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:   0%|          | 6/1208 [00:38<2:09:37,  6.47s/it, loss=0.0898, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.00106, train/loss_step=0.236, global_step=907.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   0%|          | 6/1208 [00:38<2:09:37,  6.47s/it, loss=0.0831, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.48e-5, train/loss_step=0.00257, global_step=907.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   1%|          | 7/1208 [00:39<1:54:00,  5.70s/it, loss=0.0831, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.48e-5, train/loss_step=0.00257, global_step=907.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   1%|          | 7/1208 [00:39<1:54:01,  5.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00311, train/loss_step=0.414, global_step=907.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]     Epoch 3:   1%|          | 8/1208 [00:43<1:47:49,  5.39s/it, loss=0.101, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00311, train/loss_step=0.414, global_step=907.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   1%|          | 8/1208 [00:43<1:47:49,  5.39s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000108, train/loss_step=0.0262, global_step=907.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   1%|          | 9/1208 [00:44<1:38:06,  4.91s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000108, train/loss_step=0.0262, global_step=907.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   1%|          | 9/1208 [00:44<1:38:06,  4.91s/it, loss=0.127, v_num=0, train/loss_simple_step=0.536, train/loss_vlb_step=0.00812, train/loss_step=0.536, global_step=908.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:   1%|          | 10/1208 [00:45<1:30:16,  4.52s/it, loss=0.127, v_num=0, train/loss_simple_step=0.536, train/loss_vlb_step=0.00812, train/loss_step=0.536, global_step=908.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   1%|          | 10/1208 [00:45<1:30:17,  4.52s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0916, train/loss_vlb_step=0.000305, train/loss_step=0.0916, global_step=908.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   1%|          | 11/1208 [00:46<1:23:52,  4.20s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0916, train/loss_vlb_step=0.000305, train/loss_step=0.0916, global_step=908.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   1%|          | 11/1208 [00:46<1:23:52,  4.20s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00709, train/loss_vlb_step=3.49e-5, train/loss_step=0.00709, global_step=908.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   1%|          | 12/1208 [00:49<1:22:15,  4.13s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00709, train/loss_vlb_step=3.49e-5, train/loss_step=0.00709, global_step=908.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   1%|          | 12/1208 [00:49<1:22:15,  4.13s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0919, train/loss_vlb_step=0.000307, train/loss_step=0.0919, global_step=908.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:   1%|          | 13/1208 [00:50<1:17:31,  3.89s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0919, train/loss_vlb_step=0.000307, train/loss_step=0.0919, global_step=908.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   1%|          | 13/1208 [00:50<1:17:31,  3.89s/it, loss=0.132, v_num=0, train/loss_simple_step=0.387, train/loss_vlb_step=0.00238, train/loss_step=0.387, global_step=909.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:   1%|          | 14/1208 [00:51<1:13:24,  3.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.387, train/loss_vlb_step=0.00238, train/loss_step=0.387, global_step=909.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   1%|          | 14/1208 [00:51<1:13:24,  3.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0907, train/loss_vlb_step=0.000302, train/loss_step=0.0907, global_step=909.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   1%|          | 15/1208 [00:52<1:09:50,  3.51s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0907, train/loss_vlb_step=0.000302, train/loss_step=0.0907, global_step=909.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   1%|          | 15/1208 [00:52<1:09:50,  3.51s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=9.8e-5, train/loss_step=0.0256, global_step=909.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:   1%|▏         | 16/1208 [00:55<1:09:27,  3.50s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=9.8e-5, train/loss_step=0.0256, global_step=909.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   1%|▏         | 16/1208 [00:55<1:09:28,  3.50s/it, loss=0.147, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00156, train/loss_step=0.308, global_step=909.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:   1%|▏         | 17/1208 [00:57<1:06:33,  3.35s/it, loss=0.147, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00156, train/loss_step=0.308, global_step=909.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   1%|▏         | 17/1208 [00:57<1:06:33,  3.35s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00941, train/loss_vlb_step=4.65e-5, train/loss_step=0.00941, global_step=910.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   1%|▏         | 18/1208 [00:58<1:03:56,  3.22s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00941, train/loss_vlb_step=4.65e-5, train/loss_step=0.00941, global_step=910.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   1%|▏         | 18/1208 [00:58<1:03:56,  3.22s/it, loss=0.148, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000478, train/loss_step=0.143, global_step=910.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:   2%|▏         | 19/1208 [00:59<1:01:36,  3.11s/it, loss=0.148, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000478, train/loss_step=0.143, global_step=910.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   2%|▏         | 19/1208 [00:59<1:01:36,  3.11s/it, loss=0.151, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000557, train/loss_step=0.156, global_step=910.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   2%|▏         | 20/1208 [01:02<1:01:42,  3.12s/it, loss=0.151, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000557, train/loss_step=0.156, global_step=910.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   2%|▏         | 20/1208 [01:02<1:01:43,  3.12s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0727, train/loss_vlb_step=0.000244, train/loss_step=0.0727, global_step=910.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   2%|▏         | 21/1208 [01:03<59:45,  3.02s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0727, train/loss_vlb_step=0.000244, train/loss_step=0.0727, global_step=910.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:   2%|▏         | 21/1208 [01:03<59:45,  3.02s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0708, train/loss_vlb_step=0.000244, train/loss_step=0.0708, global_step=911.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   2%|▏         | 22/1208 [01:04<57:56,  2.93s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0708, train/loss_vlb_step=0.000244, train/loss_step=0.0708, global_step=911.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   2%|▏         | 22/1208 [01:04<57:56,  2.93s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=9.85e-5, train/loss_step=0.0249, global_step=911.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:   2%|▏         | 23/1208 [01:05<56:16,  2.85s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=9.85e-5, train/loss_step=0.0249, global_step=911.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   2%|▏         | 23/1208 [01:05<56:16,  2.85s/it, loss=0.15, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000396, train/loss_step=0.121, global_step=911.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:   2%|▏         | 24/1208 [01:08<56:30,  2.86s/it, loss=0.15, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000396, train/loss_step=0.121, global_step=911.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   2%|▏         | 24/1208 [01:08<56:30,  2.86s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000243, train/loss_step=0.0732, global_step=911.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   2%|▏         | 25/1208 [01:09<55:02,  2.79s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000243, train/loss_step=0.0732, global_step=911.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   2%|▏         | 25/1208 [01:09<55:02,  2.79s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.79e-5, train/loss_step=0.0148, global_step=912.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:   2%|▏         | 26/1208 [01:10<53:40,  2.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.79e-5, train/loss_step=0.0148, global_step=912.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   2%|▏         | 26/1208 [01:10<53:40,  2.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.57e-5, train/loss_step=0.00266, global_step=912.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   2%|▏         | 27/1208 [01:11<52:24,  2.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.57e-5, train/loss_step=0.00266, global_step=912.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   2%|▏         | 27/1208 [01:11<52:24,  2.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00253, train/loss_step=0.370, global_step=912.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:   2%|▏         | 28/1208 [01:15<52:46,  2.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00253, train/loss_step=0.370, global_step=912.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   2%|▏         | 28/1208 [01:15<52:46,  2.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.421, train/loss_vlb_step=0.00408, train/loss_step=0.421, global_step=912.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   2%|▏         | 29/1208 [01:16<51:38,  2.63s/it, loss=0.151, v_num=0, train/loss_simple_step=0.421, train/loss_vlb_step=0.00408, train/loss_step=0.421, global_step=912.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   2%|▏         | 29/1208 [01:16<51:38,  2.63s/it, loss=0.135, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000862, train/loss_step=0.217, global_step=913.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   2%|▏         | 30/1208 [01:17<50:34,  2.58s/it, loss=0.135, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000862, train/loss_step=0.217, global_step=913.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   2%|▏         | 30/1208 [01:17<50:34,  2.58s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.000152, train/loss_step=0.0401, global_step=913.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   3%|▎         | 31/1208 [01:18<49:34,  2.53s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.000152, train/loss_step=0.0401, global_step=913.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   3%|▎         | 31/1208 [01:18<49:34,  2.53s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=1.68e-5, train/loss_step=0.00295, global_step=913.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   3%|▎         | 32/1208 [01:21<50:00,  2.55s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=1.68e-5, train/loss_step=0.00295, global_step=913.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   3%|▎         | 32/1208 [01:21<50:00,  2.55s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0769, train/loss_vlb_step=0.000266, train/loss_step=0.0769, global_step=913.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:   3%|▎         | 33/1208 [01:22<49:05,  2.51s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0769, train/loss_vlb_step=0.000266, train/loss_step=0.0769, global_step=913.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   3%|▎         | 33/1208 [01:22<49:05,  2.51s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.66e-5, train/loss_step=0.00286, global_step=914.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   3%|▎         | 34/1208 [01:23<48:13,  2.46s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.66e-5, train/loss_step=0.00286, global_step=914.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   3%|▎         | 34/1208 [01:23<48:13,  2.46s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0434, train/loss_vlb_step=0.000163, train/loss_step=0.0434, global_step=914.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:   3%|▎         | 35/1208 [01:24<47:23,  2.42s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0434, train/loss_vlb_step=0.000163, train/loss_step=0.0434, global_step=914.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   3%|▎         | 35/1208 [01:24<47:23,  2.42s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0822, train/loss_vlb_step=0.000273, train/loss_step=0.0822, global_step=914.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   3%|▎         | 36/1208 [01:28<47:46,  2.45s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0822, train/loss_vlb_step=0.000273, train/loss_step=0.0822, global_step=914.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   3%|▎         | 36/1208 [01:28<47:46,  2.45s/it, loss=0.106, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000665, train/loss_step=0.182, global_step=914.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:   3%|▎         | 37/1208 [01:29<47:00,  2.41s/it, loss=0.106, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000665, train/loss_step=0.182, global_step=914.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   3%|▎         | 37/1208 [01:29<47:00,  2.41s/it, loss=0.111, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000333, train/loss_step=0.100, global_step=915.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   3%|▎         | 38/1208 [01:30<46:16,  2.37s/it, loss=0.111, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000333, train/loss_step=0.100, global_step=915.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   3%|▎         | 38/1208 [01:30<46:16,  2.37s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0654, train/loss_vlb_step=0.000221, train/loss_step=0.0654, global_step=915.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   3%|▎         | 39/1208 [01:31<45:34,  2.34s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0654, train/loss_vlb_step=0.000221, train/loss_step=0.0654, global_step=915.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   3%|▎         | 39/1208 [01:31<45:34,  2.34s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0562, train/loss_vlb_step=0.00019, train/loss_step=0.0562, global_step=915.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:   3%|▎         | 40/1208 [01:34<45:58,  2.36s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0562, train/loss_vlb_step=0.00019, train/loss_step=0.0562, global_step=915.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   3%|▎         | 40/1208 [01:34<45:58,  2.36s/it, loss=0.107, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000618, train/loss_step=0.175, global_step=915.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:   3%|▎         | 41/1208 [01:35<45:18,  2.33s/it, loss=0.107, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000618, train/loss_step=0.175, global_step=915.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   3%|▎         | 41/1208 [01:35<45:18,  2.33s/it, loss=0.122, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00209, train/loss_step=0.372, global_step=916.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:   3%|▎         | 42/1208 [01:36<44:41,  2.30s/it, loss=0.122, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00209, train/loss_step=0.372, global_step=916.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   3%|▎         | 42/1208 [01:36<44:41,  2.30s/it, loss=0.131, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000766, train/loss_step=0.205, global_step=916.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   4%|▎         | 43/1208 [01:37<44:05,  2.27s/it, loss=0.131, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000766, train/loss_step=0.205, global_step=916.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   4%|▎         | 43/1208 [01:37<44:05,  2.27s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0906, train/loss_vlb_step=0.000305, train/loss_step=0.0906, global_step=916.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   4%|▎         | 44/1208 [01:40<44:28,  2.29s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0906, train/loss_vlb_step=0.000305, train/loss_step=0.0906, global_step=916.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   4%|▎         | 44/1208 [01:40<44:28,  2.29s/it, loss=0.134, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000518, train/loss_step=0.153, global_step=916.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:   4%|▎         | 45/1208 [01:41<43:53,  2.26s/it, loss=0.134, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000518, train/loss_step=0.153, global_step=916.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   4%|▎         | 45/1208 [01:41<43:53,  2.26s/it, loss=0.14, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000478, train/loss_step=0.145, global_step=917.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:   4%|▍         | 46/1208 [01:42<43:20,  2.24s/it, loss=0.14, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000478, train/loss_step=0.145, global_step=917.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   4%|▍         | 46/1208 [01:42<43:20,  2.24s/it, loss=0.147, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000431, train/loss_step=0.130, global_step=917.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   4%|▍         | 47/1208 [01:43<42:48,  2.21s/it, loss=0.147, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000431, train/loss_step=0.130, global_step=917.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   4%|▍         | 47/1208 [01:43<42:48,  2.21s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.72e-5, train/loss_step=0.0183, global_step=917.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   4%|▍         | 48/1208 [01:47<43:11,  2.23s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.72e-5, train/loss_step=0.0183, global_step=917.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   4%|▍         | 48/1208 [01:47<43:11,  2.23s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000125, train/loss_step=0.0353, global_step=917.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   4%|▍         | 49/1208 [01:48<42:42,  2.21s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000125, train/loss_step=0.0353, global_step=917.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   4%|▍         | 49/1208 [01:48<42:42,  2.21s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.000183, train/loss_step=0.0526, global_step=918.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   4%|▍         | 50/1208 [01:49<42:13,  2.19s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.000183, train/loss_step=0.0526, global_step=918.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   4%|▍         | 50/1208 [01:49<42:13,  2.19s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=1.4e-5, train/loss_step=0.00245, global_step=918.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   4%|▍         | 51/1208 [01:50<41:44,  2.16s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=1.4e-5, train/loss_step=0.00245, global_step=918.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   4%|▍         | 51/1208 [01:50<41:44,  2.16s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0945, train/loss_vlb_step=0.000311, train/loss_step=0.0945, global_step=918.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:   4%|▍         | 52/1208 [01:53<42:05,  2.19s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0945, train/loss_vlb_step=0.000311, train/loss_step=0.0945, global_step=918.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   4%|▍         | 52/1208 [01:53<42:06,  2.19s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.000115, train/loss_step=0.0322, global_step=918.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   4%|▍         | 53/1208 [01:54<41:39,  2.16s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.000115, train/loss_step=0.0322, global_step=918.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   4%|▍         | 53/1208 [01:54<41:39,  2.16s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000112, train/loss_step=0.0307, global_step=919.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   4%|▍         | 54/1208 [01:55<41:13,  2.14s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000112, train/loss_step=0.0307, global_step=919.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   4%|▍         | 54/1208 [01:55<41:13,  2.14s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00625, train/loss_vlb_step=3.27e-5, train/loss_step=0.00625, global_step=919.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   5%|▍         | 55/1208 [01:56<40:47,  2.12s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00625, train/loss_vlb_step=3.27e-5, train/loss_step=0.00625, global_step=919.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   5%|▍         | 55/1208 [01:56<40:47,  2.12s/it, loss=0.103, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=919.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:   5%|▍         | 56/1208 [02:00<41:10,  2.14s/it, loss=0.103, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=919.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   5%|▍         | 56/1208 [02:00<41:10,  2.14s/it, loss=0.115, v_num=0, train/loss_simple_step=0.419, train/loss_vlb_step=0.0039, train/loss_step=0.419, global_step=919.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:   5%|▍         | 57/1208 [02:01<40:46,  2.13s/it, loss=0.115, v_num=0, train/loss_simple_step=0.419, train/loss_vlb_step=0.0039, train/loss_step=0.419, global_step=919.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   5%|▍         | 57/1208 [02:01<40:46,  2.13s/it, loss=0.115, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000363, train/loss_step=0.110, global_step=920.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   5%|▍         | 58/1208 [02:02<40:22,  2.11s/it, loss=0.115, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000363, train/loss_step=0.110, global_step=920.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   5%|▍         | 58/1208 [02:02<40:22,  2.11s/it, loss=0.13, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00253, train/loss_step=0.361, global_step=920.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:   5%|▍         | 59/1208 [02:03<39:59,  2.09s/it, loss=0.13, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00253, train/loss_step=0.361, global_step=920.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   5%|▍         | 59/1208 [02:03<39:59,  2.09s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.47e-5, train/loss_step=0.0229, global_step=920.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   5%|▍         | 60/1208 [02:06<40:21,  2.11s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.47e-5, train/loss_step=0.0229, global_step=920.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   5%|▍         | 60/1208 [02:06<40:21,  2.11s/it, loss=0.128, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000592, train/loss_step=0.170, global_step=920.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:   5%|▌         | 61/1208 [02:07<39:59,  2.09s/it, loss=0.128, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000592, train/loss_step=0.170, global_step=920.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   5%|▌         | 61/1208 [02:07<40:00,  2.09s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0637, train/loss_vlb_step=0.000218, train/loss_step=0.0637, global_step=921.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   5%|▌         | 62/1208 [02:08<39:38,  2.08s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0637, train/loss_vlb_step=0.000218, train/loss_step=0.0637, global_step=921.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   5%|▌         | 62/1208 [02:08<39:38,  2.08s/it, loss=0.103, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.45e-5, train/loss_step=0.020, global_step=921.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:   5%|▌         | 63/1208 [02:09<39:17,  2.06s/it, loss=0.103, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.45e-5, train/loss_step=0.020, global_step=921.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   5%|▌         | 63/1208 [02:09<39:17,  2.06s/it, loss=0.105, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000423, train/loss_step=0.129, global_step=921.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   5%|▌         | 64/1208 [02:12<39:36,  2.08s/it, loss=0.105, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000423, train/loss_step=0.129, global_step=921.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   5%|▌         | 64/1208 [02:12<39:36,  2.08s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.31e-5, train/loss_step=0.0022, global_step=921.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   5%|▌         | 65/1208 [02:14<39:16,  2.06s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.31e-5, train/loss_step=0.0022, global_step=921.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   5%|▌         | 65/1208 [02:14<39:16,  2.06s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000196, train/loss_step=0.0555, global_step=922.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   5%|▌         | 66/1208 [02:15<38:56,  2.05s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000196, train/loss_step=0.0555, global_step=922.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   5%|▌         | 66/1208 [02:15<38:56,  2.05s/it, loss=0.0873, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.84e-5, train/loss_step=0.0132, global_step=922.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:   6%|▌         | 67/1208 [02:16<38:37,  2.03s/it, loss=0.0873, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.84e-5, train/loss_step=0.0132, global_step=922.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   6%|▌         | 67/1208 [02:16<38:37,  2.03s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.96e-5, train/loss_step=0.0131, global_step=922.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   6%|▌         | 68/1208 [02:19<38:55,  2.05s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.96e-5, train/loss_step=0.0131, global_step=922.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   6%|▌         | 68/1208 [02:19<38:56,  2.05s/it, loss=0.0898, v_num=0, train/loss_simple_step=0.0905, train/loss_vlb_step=0.000301, train/loss_step=0.0905, global_step=922.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   6%|▌         | 69/1208 [02:20<38:37,  2.03s/it, loss=0.0898, v_num=0, train/loss_simple_step=0.0905, train/loss_vlb_step=0.000301, train/loss_step=0.0905, global_step=922.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   6%|▌         | 69/1208 [02:20<38:37,  2.03s/it, loss=0.0959, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000618, train/loss_step=0.174, global_step=923.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:   6%|▌         | 70/1208 [02:21<38:19,  2.02s/it, loss=0.0959, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000618, train/loss_step=0.174, global_step=923.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   6%|▌         | 70/1208 [02:21<38:19,  2.02s/it, loss=0.102, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000376, train/loss_step=0.115, global_step=923.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:   6%|▌         | 71/1208 [02:22<38:01,  2.01s/it, loss=0.102, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000376, train/loss_step=0.115, global_step=923.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   6%|▌         | 71/1208 [02:22<38:01,  2.01s/it, loss=0.106, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000677, train/loss_step=0.194, global_step=923.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   6%|▌         | 72/1208 [02:25<38:19,  2.02s/it, loss=0.106, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000677, train/loss_step=0.194, global_step=923.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   6%|▌         | 72/1208 [02:25<38:19,  2.02s/it, loss=0.113, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000536, train/loss_step=0.159, global_step=923.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   6%|▌         | 73/1208 [02:26<38:02,  2.01s/it, loss=0.113, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000536, train/loss_step=0.159, global_step=923.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   6%|▌         | 73/1208 [02:26<38:02,  2.01s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00468, train/loss_vlb_step=2.35e-5, train/loss_step=0.00468, global_step=924.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   6%|▌         | 74/1208 [02:27<37:45,  2.00s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00468, train/loss_vlb_step=2.35e-5, train/loss_step=0.00468, global_step=924.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   6%|▌         | 74/1208 [02:27<37:45,  2.00s/it, loss=0.142, v_num=0, train/loss_simple_step=0.624, train/loss_vlb_step=0.00946, train/loss_step=0.624, global_step=924.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:   6%|▌         | 75/1208 [02:28<37:28,  1.98s/it, loss=0.142, v_num=0, train/loss_simple_step=0.624, train/loss_vlb_step=0.00946, train/loss_step=0.624, global_step=924.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   6%|▌         | 75/1208 [02:28<37:28,  1.98s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00531, train/loss_vlb_step=2.72e-5, train/loss_step=0.00531, global_step=924.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   6%|▋         | 76/1208 [02:32<37:45,  2.00s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00531, train/loss_vlb_step=2.72e-5, train/loss_step=0.00531, global_step=924.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   6%|▋         | 76/1208 [02:32<37:45,  2.00s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.81e-5, train/loss_step=0.0213, global_step=924.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:   6%|▋         | 77/1208 [02:33<37:29,  1.99s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.81e-5, train/loss_step=0.0213, global_step=924.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   6%|▋         | 77/1208 [02:33<37:29,  1.99s/it, loss=0.118, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=925.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:   6%|▋         | 78/1208 [02:34<37:14,  1.98s/it, loss=0.118, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=925.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   6%|▋         | 78/1208 [02:34<37:14,  1.98s/it, loss=0.106, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000422, train/loss_step=0.128, global_step=925.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   7%|▋         | 79/1208 [02:35<36:58,  1.97s/it, loss=0.106, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000422, train/loss_step=0.128, global_step=925.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   7%|▋         | 79/1208 [02:35<36:58,  1.97s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.4e-5, train/loss_step=0.00248, global_step=925.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   7%|▋         | 80/1208 [02:38<37:15,  1.98s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.4e-5, train/loss_step=0.00248, global_step=925.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   7%|▋         | 80/1208 [02:38<37:15,  1.98s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.000121, train/loss_step=0.0316, global_step=925.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   7%|▋         | 81/1208 [02:39<37:00,  1.97s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.000121, train/loss_step=0.0316, global_step=925.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   7%|▋         | 81/1208 [02:39<37:00,  1.97s/it, loss=0.117, v_num=0, train/loss_simple_step=0.445, train/loss_vlb_step=0.00385, train/loss_step=0.445, global_step=926.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:   7%|▋         | 82/1208 [02:40<36:45,  1.96s/it, loss=0.117, v_num=0, train/loss_simple_step=0.445, train/loss_vlb_step=0.00385, train/loss_step=0.445, global_step=926.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   7%|▋         | 82/1208 [02:40<36:45,  1.96s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0523, train/loss_vlb_step=0.00019, train/loss_step=0.0523, global_step=926.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   7%|▋         | 83/1208 [02:41<36:31,  1.95s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0523, train/loss_vlb_step=0.00019, train/loss_step=0.0523, global_step=926.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   7%|▋         | 83/1208 [02:41<36:31,  1.95s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000151, train/loss_step=0.0407, global_step=926.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   7%|▋         | 84/1208 [02:44<36:47,  1.96s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000151, train/loss_step=0.0407, global_step=926.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   7%|▋         | 84/1208 [02:44<36:47,  1.96s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000205, train/loss_step=0.0588, global_step=926.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   7%|▋         | 85/1208 [02:46<36:33,  1.95s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000205, train/loss_step=0.0588, global_step=926.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   7%|▋         | 85/1208 [02:46<36:33,  1.95s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=2.5e-5, train/loss_step=0.00471, global_step=927.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   7%|▋         | 86/1208 [02:47<36:19,  1.94s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=2.5e-5, train/loss_step=0.00471, global_step=927.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   7%|▋         | 86/1208 [02:47<36:19,  1.94s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.00013, train/loss_step=0.0333, global_step=927.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:   7%|▋         | 87/1208 [02:48<36:06,  1.93s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.00013, train/loss_step=0.0333, global_step=927.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   7%|▋         | 87/1208 [02:48<36:06,  1.93s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0667, train/loss_vlb_step=0.000228, train/loss_step=0.0667, global_step=927.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   7%|▋         | 88/1208 [02:51<36:20,  1.95s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0667, train/loss_vlb_step=0.000228, train/loss_step=0.0667, global_step=927.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   7%|▋         | 88/1208 [02:51<36:20,  1.95s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=1.38e-5, train/loss_step=0.00239, global_step=927.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   7%|▋         | 89/1208 [02:52<36:08,  1.94s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=1.38e-5, train/loss_step=0.00239, global_step=927.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   7%|▋         | 89/1208 [02:52<36:08,  1.94s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00511, train/loss_vlb_step=2.59e-5, train/loss_step=0.00511, global_step=928.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   7%|▋         | 90/1208 [02:53<35:54,  1.93s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00511, train/loss_vlb_step=2.59e-5, train/loss_step=0.00511, global_step=928.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   7%|▋         | 90/1208 [02:53<35:54,  1.93s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.000166, train/loss_step=0.0483, global_step=928.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:   8%|▊         | 91/1208 [02:54<35:42,  1.92s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.000166, train/loss_step=0.0483, global_step=928.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   8%|▊         | 91/1208 [02:54<35:42,  1.92s/it, loss=0.093, v_num=0, train/loss_simple_step=0.00746, train/loss_vlb_step=3.68e-5, train/loss_step=0.00746, global_step=928.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   8%|▊         | 92/1208 [02:57<35:55,  1.93s/it, loss=0.093, v_num=0, train/loss_simple_step=0.00746, train/loss_vlb_step=3.68e-5, train/loss_step=0.00746, global_step=928.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   8%|▊         | 92/1208 [02:57<35:55,  1.93s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.00717, train/loss_vlb_step=3.55e-5, train/loss_step=0.00717, global_step=928.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   8%|▊         | 93/1208 [02:58<35:43,  1.92s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.00717, train/loss_vlb_step=3.55e-5, train/loss_step=0.00717, global_step=928.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   8%|▊         | 93/1208 [02:58<35:43,  1.92s/it, loss=0.102, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00172, train/loss_step=0.332, global_step=929.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]     Epoch 3:   8%|▊         | 94/1208 [02:59<35:31,  1.91s/it, loss=0.102, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00172, train/loss_step=0.332, global_step=929.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   8%|▊         | 94/1208 [02:59<35:31,  1.91s/it, loss=0.072, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000121, train/loss_step=0.0295, global_step=929.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   8%|▊         | 95/1208 [03:00<35:18,  1.90s/it, loss=0.072, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000121, train/loss_step=0.0295, global_step=929.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   8%|▊         | 95/1208 [03:00<35:18,  1.90s/it, loss=0.0797, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000521, train/loss_step=0.159, global_step=929.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:   8%|▊         | 96/1208 [03:04<35:32,  1.92s/it, loss=0.0797, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000521, train/loss_step=0.159, global_step=929.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   8%|▊         | 96/1208 [03:04<35:32,  1.92s/it, loss=0.0798, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.64e-5, train/loss_step=0.0233, global_step=929.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   8%|▊         | 97/1208 [03:05<35:20,  1.91s/it, loss=0.0798, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.64e-5, train/loss_step=0.0233, global_step=929.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   8%|▊         | 97/1208 [03:05<35:20,  1.91s/it, loss=0.0872, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.0011, train/loss_step=0.266, global_step=930.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:   8%|▊         | 98/1208 [03:06<35:09,  1.90s/it, loss=0.0872, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.0011, train/loss_step=0.266, global_step=930.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   8%|▊         | 98/1208 [03:06<35:09,  1.90s/it, loss=0.109, v_num=0, train/loss_simple_step=0.568, train/loss_vlb_step=0.0139, train/loss_step=0.568, global_step=930.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:   8%|▊         | 99/1208 [03:07<34:57,  1.89s/it, loss=0.109, v_num=0, train/loss_simple_step=0.568, train/loss_vlb_step=0.0139, train/loss_step=0.568, global_step=930.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   8%|▊         | 99/1208 [03:07<34:57,  1.89s/it, loss=0.126, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.0022, train/loss_step=0.339, global_step=930.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   8%|▊         | 100/1208 [03:10<35:10,  1.90s/it, loss=0.126, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.0022, train/loss_step=0.339, global_step=930.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   8%|▊         | 100/1208 [03:10<35:10,  1.90s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000166, train/loss_step=0.0443, global_step=930.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   8%|▊         | 101/1208 [03:11<34:59,  1.90s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000166, train/loss_step=0.0443, global_step=930.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   8%|▊         | 101/1208 [03:11<34:59,  1.90s/it, loss=0.117, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00119, train/loss_step=0.249, global_step=931.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:   8%|▊         | 102/1208 [03:12<34:47,  1.89s/it, loss=0.117, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00119, train/loss_step=0.249, global_step=931.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   8%|▊         | 102/1208 [03:12<34:47,  1.89s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0947, train/loss_vlb_step=0.000312, train/loss_step=0.0947, global_step=931.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   9%|▊         | 103/1208 [03:13<34:36,  1.88s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0947, train/loss_vlb_step=0.000312, train/loss_step=0.0947, global_step=931.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   9%|▊         | 103/1208 [03:13<34:36,  1.88s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00794, train/loss_vlb_step=4.04e-5, train/loss_step=0.00794, global_step=931.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   9%|▊         | 104/1208 [03:16<34:44,  1.89s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00794, train/loss_vlb_step=4.04e-5, train/loss_step=0.00794, global_step=931.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   9%|▊         | 104/1208 [03:16<34:44,  1.89s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=8.75e-5, train/loss_step=0.0217, global_step=931.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:   9%|▊         | 105/1208 [03:17<34:33,  1.88s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=8.75e-5, train/loss_step=0.0217, global_step=931.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   9%|▊         | 105/1208 [03:17<34:33,  1.88s/it, loss=0.14, v_num=0, train/loss_simple_step=0.497, train/loss_vlb_step=0.00754, train/loss_step=0.497, global_step=932.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:   9%|▉         | 106/1208 [03:18<34:22,  1.87s/it, loss=0.14, v_num=0, train/loss_simple_step=0.497, train/loss_vlb_step=0.00754, train/loss_step=0.497, global_step=932.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   9%|▉         | 106/1208 [03:18<34:22,  1.87s/it, loss=0.148, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000706, train/loss_step=0.192, global_step=932.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   9%|▉         | 107/1208 [03:19<34:12,  1.86s/it, loss=0.148, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000706, train/loss_step=0.192, global_step=932.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   9%|▉         | 107/1208 [03:19<34:12,  1.86s/it, loss=0.154, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000646, train/loss_step=0.180, global_step=932.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   9%|▉         | 108/1208 [03:22<34:20,  1.87s/it, loss=0.154, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000646, train/loss_step=0.180, global_step=932.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   9%|▉         | 108/1208 [03:22<34:20,  1.87s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000128, train/loss_step=0.0333, global_step=932.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   9%|▉         | 109/1208 [03:23<34:10,  1.87s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000128, train/loss_step=0.0333, global_step=932.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   9%|▉         | 109/1208 [03:23<34:10,  1.87s/it, loss=0.156, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.79e-5, train/loss_step=0.019, global_step=933.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:   9%|▉         | 110/1208 [03:24<33:59,  1.86s/it, loss=0.156, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.79e-5, train/loss_step=0.019, global_step=933.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   9%|▉         | 110/1208 [03:24<33:59,  1.86s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0065, train/loss_vlb_step=3.24e-5, train/loss_step=0.0065, global_step=933.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   9%|▉         | 111/1208 [03:25<33:49,  1.85s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0065, train/loss_vlb_step=3.24e-5, train/loss_step=0.0065, global_step=933.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   9%|▉         | 111/1208 [03:25<33:49,  1.85s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00652, train/loss_vlb_step=3.27e-5, train/loss_step=0.00652, global_step=933.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   9%|▉         | 112/1208 [03:28<33:57,  1.86s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00652, train/loss_vlb_step=3.27e-5, train/loss_step=0.00652, global_step=933.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   9%|▉         | 112/1208 [03:28<33:57,  1.86s/it, loss=0.16, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000466, train/loss_step=0.138, global_step=933.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:   9%|▉         | 113/1208 [03:29<33:47,  1.85s/it, loss=0.16, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000466, train/loss_step=0.138, global_step=933.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   9%|▉         | 113/1208 [03:29<33:47,  1.85s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.00015, train/loss_step=0.0407, global_step=934.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   9%|▉         | 114/1208 [03:30<33:37,  1.84s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.00015, train/loss_step=0.0407, global_step=934.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:   9%|▉         | 114/1208 [03:30<33:37,  1.84s/it, loss=0.165, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00291, train/loss_step=0.409, global_step=934.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  10%|▉         | 115/1208 [03:31<33:27,  1.84s/it, loss=0.165, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00291, train/loss_step=0.409, global_step=934.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  10%|▉         | 115/1208 [03:31<33:27,  1.84s/it, loss=0.161, v_num=0, train/loss_simple_step=0.084, train/loss_vlb_step=0.00028, train/loss_step=0.084, global_step=934.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  10%|▉         | 116/1208 [03:34<33:36,  1.85s/it, loss=0.161, v_num=0, train/loss_simple_step=0.084, train/loss_vlb_step=0.00028, train/loss_step=0.084, global_step=934.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  10%|▉         | 116/1208 [03:34<33:36,  1.85s/it, loss=0.161, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.3e-5, train/loss_step=0.017, global_step=934.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  10%|▉         | 117/1208 [03:35<33:26,  1.84s/it, loss=0.161, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.3e-5, train/loss_step=0.017, global_step=934.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  10%|▉         | 117/1208 [03:35<33:26,  1.84s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.6e-5, train/loss_step=0.00285, global_step=935.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  10%|▉         | 118/1208 [03:36<33:16,  1.83s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.6e-5, train/loss_step=0.00285, global_step=935.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  10%|▉         | 118/1208 [03:36<33:16,  1.83s/it, loss=0.132, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00107, train/loss_step=0.255, global_step=935.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  10%|▉         | 119/1208 [03:37<33:07,  1.83s/it, loss=0.132, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00107, train/loss_step=0.255, global_step=935.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  10%|▉         | 119/1208 [03:37<33:07,  1.83s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0651, train/loss_vlb_step=0.000225, train/loss_step=0.0651, global_step=935.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  10%|▉         | 120/1208 [03:40<33:15,  1.83s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0651, train/loss_vlb_step=0.000225, train/loss_step=0.0651, global_step=935.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  10%|▉         | 120/1208 [03:40<33:15,  1.83s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0038, train/loss_vlb_step=2.12e-5, train/loss_step=0.0038, global_step=935.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  10%|█         | 121/1208 [03:41<33:06,  1.83s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0038, train/loss_vlb_step=2.12e-5, train/loss_step=0.0038, global_step=935.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  10%|█         | 121/1208 [03:41<33:06,  1.83s/it, loss=0.117, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.0012, train/loss_step=0.265, global_step=936.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  10%|█         | 122/1208 [03:42<32:57,  1.82s/it, loss=0.117, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.0012, train/loss_step=0.265, global_step=936.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  10%|█         | 122/1208 [03:42<32:57,  1.82s/it, loss=0.121, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000597, train/loss_step=0.173, global_step=936.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  10%|█         | 123/1208 [03:43<32:48,  1.81s/it, loss=0.121, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000597, train/loss_step=0.173, global_step=936.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  10%|█         | 123/1208 [03:43<32:48,  1.81s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00578, train/loss_vlb_step=3.02e-5, train/loss_step=0.00578, global_step=936.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  10%|█         | 124/1208 [03:46<32:55,  1.82s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00578, train/loss_vlb_step=3.02e-5, train/loss_step=0.00578, global_step=936.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  10%|█         | 124/1208 [03:46<32:55,  1.82s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00977, train/loss_vlb_step=4.47e-5, train/loss_step=0.00977, global_step=936.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  10%|█         | 125/1208 [03:47<32:46,  1.82s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00977, train/loss_vlb_step=4.47e-5, train/loss_step=0.00977, global_step=936.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  10%|█         | 125/1208 [03:47<32:46,  1.82s/it, loss=0.106, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000773, train/loss_step=0.214, global_step=937.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  10%|█         | 126/1208 [03:48<32:38,  1.81s/it, loss=0.106, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000773, train/loss_step=0.214, global_step=937.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  10%|█         | 126/1208 [03:48<32:38,  1.81s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.0689, train/loss_vlb_step=0.000236, train/loss_step=0.0689, global_step=937.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  11%|█         | 127/1208 [03:49<32:29,  1.80s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.0689, train/loss_vlb_step=0.000236, train/loss_step=0.0689, global_step=937.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  11%|█         | 127/1208 [03:49<32:29,  1.80s/it, loss=0.0927, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000133, train/loss_step=0.0361, global_step=937.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  11%|█         | 128/1208 [03:51<32:36,  1.81s/it, loss=0.0927, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000133, train/loss_step=0.0361, global_step=937.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  11%|█         | 128/1208 [03:51<32:36,  1.81s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.00957, train/loss_vlb_step=4.57e-5, train/loss_step=0.00957, global_step=937.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  11%|█         | 129/1208 [03:52<32:28,  1.81s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.00957, train/loss_vlb_step=4.57e-5, train/loss_step=0.00957, global_step=937.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  11%|█         | 129/1208 [03:52<32:28,  1.81s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.46e-5, train/loss_step=0.0149, global_step=938.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  11%|█         | 130/1208 [03:53<32:20,  1.80s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.46e-5, train/loss_step=0.0149, global_step=938.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  11%|█         | 130/1208 [03:53<32:20,  1.80s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000162, train/loss_step=0.0457, global_step=938.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  11%|█         | 131/1208 [03:54<32:11,  1.79s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000162, train/loss_step=0.0457, global_step=938.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  11%|█         | 131/1208 [03:54<32:11,  1.79s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.0479, train/loss_vlb_step=0.000174, train/loss_step=0.0479, global_step=938.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  11%|█         | 132/1208 [03:57<32:18,  1.80s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.0479, train/loss_vlb_step=0.000174, train/loss_step=0.0479, global_step=938.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  11%|█         | 132/1208 [03:57<32:18,  1.80s/it, loss=0.0927, v_num=0, train/loss_simple_step=0.0867, train/loss_vlb_step=0.000298, train/loss_step=0.0867, global_step=938.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  11%|█         | 133/1208 [03:58<32:10,  1.80s/it, loss=0.0927, v_num=0, train/loss_simple_step=0.0867, train/loss_vlb_step=0.000298, train/loss_step=0.0867, global_step=938.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  11%|█         | 133/1208 [03:58<32:10,  1.80s/it, loss=0.101, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000758, train/loss_step=0.207, global_step=939.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  11%|█         | 134/1208 [03:59<32:02,  1.79s/it, loss=0.101, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000758, train/loss_step=0.207, global_step=939.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  11%|█         | 134/1208 [03:59<32:02,  1.79s/it, loss=0.081, v_num=0, train/loss_simple_step=0.00704, train/loss_vlb_step=3.52e-5, train/loss_step=0.00704, global_step=939.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  11%|█         | 135/1208 [04:00<31:54,  1.78s/it, loss=0.081, v_num=0, train/loss_simple_step=0.00704, train/loss_vlb_step=3.52e-5, train/loss_step=0.00704, global_step=939.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  11%|█         | 135/1208 [04:00<31:54,  1.78s/it, loss=0.0772, v_num=0, train/loss_simple_step=0.00841, train/loss_vlb_step=4.07e-5, train/loss_step=0.00841, global_step=939.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  11%|█▏        | 136/1208 [04:03<32:01,  1.79s/it, loss=0.0772, v_num=0, train/loss_simple_step=0.00841, train/loss_vlb_step=4.07e-5, train/loss_step=0.00841, global_step=939.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  11%|█▏        | 136/1208 [04:03<32:01,  1.79s/it, loss=0.0775, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.86e-5, train/loss_step=0.024, global_step=939.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  11%|█▏        | 137/1208 [04:04<31:53,  1.79s/it, loss=0.0775, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.86e-5, train/loss_step=0.024, global_step=939.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  11%|█▏        | 137/1208 [04:04<31:53,  1.79s/it, loss=0.0831, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000377, train/loss_step=0.115, global_step=940.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  11%|█▏        | 138/1208 [04:05<31:45,  1.78s/it, loss=0.0831, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000377, train/loss_step=0.115, global_step=940.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  11%|█▏        | 138/1208 [04:05<31:45,  1.78s/it, loss=0.0742, v_num=0, train/loss_simple_step=0.077, train/loss_vlb_step=0.000256, train/loss_step=0.077, global_step=940.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  12%|█▏        | 139/1208 [04:06<31:37,  1.78s/it, loss=0.0742, v_num=0, train/loss_simple_step=0.077, train/loss_vlb_step=0.000256, train/loss_step=0.077, global_step=940.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  12%|█▏        | 139/1208 [04:06<31:37,  1.78s/it, loss=0.0716, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.91e-5, train/loss_step=0.0132, global_step=940.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  12%|█▏        | 140/1208 [04:09<31:44,  1.78s/it, loss=0.0716, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.91e-5, train/loss_step=0.0132, global_step=940.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  12%|█▏        | 140/1208 [04:09<31:44,  1.78s/it, loss=0.0722, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.38e-5, train/loss_step=0.0142, global_step=940.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  12%|█▏        | 141/1208 [04:10<31:37,  1.78s/it, loss=0.0722, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.38e-5, train/loss_step=0.0142, global_step=940.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  12%|█▏        | 141/1208 [04:10<31:37,  1.78s/it, loss=0.0624, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.000238, train/loss_step=0.0702, global_step=941.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  12%|█▏        | 142/1208 [04:11<31:29,  1.77s/it, loss=0.0624, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.000238, train/loss_step=0.0702, global_step=941.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  12%|█▏        | 142/1208 [04:11<31:29,  1.77s/it, loss=0.0539, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.71e-5, train/loss_step=0.00299, global_step=941.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  12%|█▏        | 143/1208 [04:12<31:22,  1.77s/it, loss=0.0539, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.71e-5, train/loss_step=0.00299, global_step=941.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  12%|█▏        | 143/1208 [04:12<31:22,  1.77s/it, loss=0.0571, v_num=0, train/loss_simple_step=0.0699, train/loss_vlb_step=0.000241, train/loss_step=0.0699, global_step=941.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  12%|█▏        | 144/1208 [04:15<31:28,  1.77s/it, loss=0.0571, v_num=0, train/loss_simple_step=0.0699, train/loss_vlb_step=0.000241, train/loss_step=0.0699, global_step=941.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  12%|█▏        | 144/1208 [04:15<31:28,  1.77s/it, loss=0.0883, v_num=0, train/loss_simple_step=0.635, train/loss_vlb_step=0.0255, train/loss_step=0.635, global_step=941.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  12%|█▏        | 145/1208 [04:16<31:21,  1.77s/it, loss=0.0883, v_num=0, train/loss_simple_step=0.635, train/loss_vlb_step=0.0255, train/loss_step=0.635, global_step=941.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  12%|█▏        | 145/1208 [04:16<31:21,  1.77s/it, loss=0.0778, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=1.97e-5, train/loss_step=0.00356, global_step=942.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  12%|█▏        | 146/1208 [04:17<31:13,  1.76s/it, loss=0.0778, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=1.97e-5, train/loss_step=0.00356, global_step=942.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  12%|█▏        | 146/1208 [04:17<31:13,  1.76s/it, loss=0.0887, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00119, train/loss_step=0.287, global_step=942.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  12%|█▏        | 147/1208 [04:18<31:06,  1.76s/it, loss=0.0887, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00119, train/loss_step=0.287, global_step=942.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  12%|█▏        | 147/1208 [04:18<31:06,  1.76s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.00085, train/loss_step=0.236, global_step=942.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  12%|█▏        | 148/1208 [04:21<31:12,  1.77s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.00085, train/loss_step=0.236, global_step=942.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  12%|█▏        | 148/1208 [04:21<31:12,  1.77s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.22e-5, train/loss_step=0.002, global_step=942.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  12%|█▏        | 149/1208 [04:22<31:05,  1.76s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.22e-5, train/loss_step=0.002, global_step=942.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  12%|█▏        | 149/1208 [04:22<31:05,  1.76s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.33e-5, train/loss_step=0.0115, global_step=943.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  12%|█▏        | 150/1208 [04:23<30:58,  1.76s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.33e-5, train/loss_step=0.0115, global_step=943.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  12%|█▏        | 150/1208 [04:23<30:58,  1.76s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.03e-5, train/loss_step=0.0194, global_step=943.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  12%|█▎        | 151/1208 [04:24<30:51,  1.75s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.03e-5, train/loss_step=0.0194, global_step=943.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  12%|█▎        | 151/1208 [04:24<30:51,  1.75s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.081, train/loss_vlb_step=0.000271, train/loss_step=0.081, global_step=943.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  13%|█▎        | 152/1208 [04:27<30:57,  1.76s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.081, train/loss_vlb_step=0.000271, train/loss_step=0.081, global_step=943.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  13%|█▎        | 152/1208 [04:27<30:57,  1.76s/it, loss=0.0945, v_num=0, train/loss_simple_step=0.00625, train/loss_vlb_step=3.2e-5, train/loss_step=0.00625, global_step=943.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  13%|█▎        | 153/1208 [04:28<30:50,  1.75s/it, loss=0.0945, v_num=0, train/loss_simple_step=0.00625, train/loss_vlb_step=3.2e-5, train/loss_step=0.00625, global_step=943.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  13%|█▎        | 153/1208 [04:28<30:50,  1.75s/it, loss=0.0845, v_num=0, train/loss_simple_step=0.00594, train/loss_vlb_step=2.96e-5, train/loss_step=0.00594, global_step=944.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  13%|█▎        | 154/1208 [04:29<30:44,  1.75s/it, loss=0.0845, v_num=0, train/loss_simple_step=0.00594, train/loss_vlb_step=2.96e-5, train/loss_step=0.00594, global_step=944.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  13%|█▎        | 154/1208 [04:29<30:44,  1.75s/it, loss=0.0895, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=944.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  13%|█▎        | 155/1208 [04:30<30:37,  1.74s/it, loss=0.0895, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=944.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  13%|█▎        | 155/1208 [04:30<30:37,  1.74s/it, loss=0.11, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00347, train/loss_step=0.414, global_step=944.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  13%|█▎        | 156/1208 [04:33<30:43,  1.75s/it, loss=0.11, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00347, train/loss_step=0.414, global_step=944.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  13%|█▎        | 156/1208 [04:33<30:43,  1.75s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.63e-5, train/loss_step=0.0162, global_step=944.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  13%|█▎        | 157/1208 [04:34<30:36,  1.75s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.63e-5, train/loss_step=0.0162, global_step=944.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  13%|█▎        | 157/1208 [04:34<30:36,  1.75s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.72e-5, train/loss_step=0.00299, global_step=945.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  13%|█▎        | 158/1208 [04:35<30:29,  1.74s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.72e-5, train/loss_step=0.00299, global_step=945.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  13%|█▎        | 158/1208 [04:35<30:29,  1.74s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00515, train/loss_vlb_step=2.7e-5, train/loss_step=0.00515, global_step=945.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  13%|█▎        | 159/1208 [04:36<30:23,  1.74s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00515, train/loss_vlb_step=2.7e-5, train/loss_step=0.00515, global_step=945.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  13%|█▎        | 159/1208 [04:36<30:23,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000643, train/loss_step=0.185, global_step=945.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  13%|█▎        | 160/1208 [04:39<30:29,  1.75s/it, loss=0.109, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000643, train/loss_step=0.185, global_step=945.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  13%|█▎        | 160/1208 [04:39<30:29,  1.75s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.16e-5, train/loss_step=0.0138, global_step=945.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  13%|█▎        | 161/1208 [04:40<30:22,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.16e-5, train/loss_step=0.0138, global_step=945.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  13%|█▎        | 161/1208 [04:40<30:22,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00109, train/loss_step=0.252, global_step=946.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  13%|█▎        | 162/1208 [04:41<30:16,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00109, train/loss_step=0.252, global_step=946.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  13%|█▎        | 162/1208 [04:41<30:16,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00143, train/loss_step=0.294, global_step=946.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  13%|█▎        | 163/1208 [04:42<30:10,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00143, train/loss_step=0.294, global_step=946.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  13%|█▎        | 163/1208 [04:42<30:10,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.00101, train/loss_step=0.211, global_step=946.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  14%|█▎        | 164/1208 [04:45<30:15,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.00101, train/loss_step=0.211, global_step=946.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  14%|█▎        | 164/1208 [04:45<30:15,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.099, train/loss_vlb_step=0.000326, train/loss_step=0.099, global_step=946.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  14%|█▎        | 165/1208 [04:46<30:09,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.099, train/loss_vlb_step=0.000326, train/loss_step=0.099, global_step=946.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  14%|█▎        | 165/1208 [04:46<30:09,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000128, train/loss_step=0.0342, global_step=947.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  14%|█▎        | 166/1208 [04:47<30:03,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000128, train/loss_step=0.0342, global_step=947.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  14%|█▎        | 166/1208 [04:47<30:03,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000856, train/loss_step=0.223, global_step=947.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  14%|█▍        | 167/1208 [04:48<29:56,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000856, train/loss_step=0.223, global_step=947.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  14%|█▍        | 167/1208 [04:48<29:56,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.003, train/loss_step=0.361, global_step=947.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  14%|█▍        | 168/1208 [04:51<30:02,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.003, train/loss_step=0.361, global_step=947.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  14%|█▍        | 168/1208 [04:51<30:02,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000575, train/loss_step=0.162, global_step=947.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  14%|█▍        | 169/1208 [04:52<29:56,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000575, train/loss_step=0.162, global_step=947.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  14%|█▍        | 169/1208 [04:52<29:56,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00714, train/loss_vlb_step=3.5e-5, train/loss_step=0.00714, global_step=948.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  14%|█▍        | 170/1208 [04:53<29:50,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00714, train/loss_vlb_step=3.5e-5, train/loss_step=0.00714, global_step=948.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  14%|█▍        | 170/1208 [04:53<29:50,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0341, train/loss_vlb_step=0.000135, train/loss_step=0.0341, global_step=948.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  14%|█▍        | 171/1208 [04:54<29:44,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0341, train/loss_vlb_step=0.000135, train/loss_step=0.0341, global_step=948.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  14%|█▍        | 171/1208 [04:54<29:44,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.000187, train/loss_step=0.0526, global_step=948.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  14%|█▍        | 172/1208 [04:57<29:49,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.000187, train/loss_step=0.0526, global_step=948.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  14%|█▍        | 172/1208 [04:57<29:49,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.74e-5, train/loss_step=0.00303, global_step=948.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  14%|█▍        | 173/1208 [04:58<29:43,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.74e-5, train/loss_step=0.00303, global_step=948.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  14%|█▍        | 173/1208 [04:58<29:43,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.860, train/loss_vlb_step=0.217, train/loss_step=0.860, global_step=949.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]      Epoch 3:  14%|█▍        | 174/1208 [04:59<29:37,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.860, train/loss_vlb_step=0.217, train/loss_step=0.860, global_step=949.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  14%|█▍        | 174/1208 [04:59<29:37,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0096, train/loss_vlb_step=4.58e-5, train/loss_step=0.0096, global_step=949.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  14%|█▍        | 175/1208 [05:00<29:31,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0096, train/loss_vlb_step=4.58e-5, train/loss_step=0.0096, global_step=949.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  14%|█▍        | 175/1208 [05:00<29:31,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.000184, train/loss_step=0.0508, global_step=949.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  15%|█▍        | 176/1208 [05:02<29:36,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.000184, train/loss_step=0.0508, global_step=949.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  15%|█▍        | 176/1208 [05:02<29:36,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.0004, train/loss_step=0.122, global_step=949.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  15%|█▍        | 177/1208 [05:04<29:30,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.0004, train/loss_step=0.122, global_step=949.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  15%|█▍        | 177/1208 [05:04<29:30,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000974, train/loss_step=0.250, global_step=950.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  15%|█▍        | 178/1208 [05:05<29:25,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000974, train/loss_step=0.250, global_step=950.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  15%|█▍        | 178/1208 [05:05<29:25,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0656, train/loss_vlb_step=0.000229, train/loss_step=0.0656, global_step=950.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  15%|█▍        | 179/1208 [05:06<29:19,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0656, train/loss_vlb_step=0.000229, train/loss_step=0.0656, global_step=950.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  15%|█▍        | 179/1208 [05:06<29:19,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000712, train/loss_step=0.199, global_step=950.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  15%|█▍        | 180/1208 [05:08<29:24,  1.72s/it, loss=0.165, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000712, train/loss_step=0.199, global_step=950.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  15%|█▍        | 180/1208 [05:08<29:24,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0967, train/loss_vlb_step=0.000318, train/loss_step=0.0967, global_step=950.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  15%|█▍        | 181/1208 [05:09<29:18,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0967, train/loss_vlb_step=0.000318, train/loss_step=0.0967, global_step=950.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  15%|█▍        | 181/1208 [05:09<29:18,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0639, train/loss_vlb_step=0.000219, train/loss_step=0.0639, global_step=951.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  15%|█▌        | 182/1208 [05:10<29:12,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0639, train/loss_vlb_step=0.000219, train/loss_step=0.0639, global_step=951.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  15%|█▌        | 182/1208 [05:10<29:12,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.000169, train/loss_step=0.0482, global_step=951.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  15%|█▌        | 183/1208 [05:11<29:07,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.000169, train/loss_step=0.0482, global_step=951.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  15%|█▌        | 183/1208 [05:11<29:07,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.440, train/loss_vlb_step=0.00319, train/loss_step=0.440, global_step=951.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  15%|█▌        | 184/1208 [05:14<29:12,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.440, train/loss_vlb_step=0.00319, train/loss_step=0.440, global_step=951.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  15%|█▌        | 184/1208 [05:14<29:12,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.42e-5, train/loss_step=0.0174, global_step=951.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  15%|█▌        | 185/1208 [05:15<29:06,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.42e-5, train/loss_step=0.0174, global_step=951.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  15%|█▌        | 185/1208 [05:15<29:06,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000429, train/loss_step=0.129, global_step=952.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  15%|█▌        | 186/1208 [05:16<29:01,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000429, train/loss_step=0.129, global_step=952.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  15%|█▌        | 186/1208 [05:16<29:01,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0952, train/loss_vlb_step=0.000314, train/loss_step=0.0952, global_step=952.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  15%|█▌        | 187/1208 [05:17<28:55,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0952, train/loss_vlb_step=0.000314, train/loss_step=0.0952, global_step=952.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  15%|█▌        | 187/1208 [05:17<28:55,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0841, train/loss_vlb_step=0.000281, train/loss_step=0.0841, global_step=952.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  16%|█▌        | 188/1208 [05:20<29:00,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0841, train/loss_vlb_step=0.000281, train/loss_step=0.0841, global_step=952.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  16%|█▌        | 188/1208 [05:20<29:00,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0056, train/loss_vlb_step=2.86e-5, train/loss_step=0.0056, global_step=952.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  16%|█▌        | 189/1208 [05:21<28:54,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0056, train/loss_vlb_step=2.86e-5, train/loss_step=0.0056, global_step=952.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  16%|█▌        | 189/1208 [05:21<28:54,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00146, train/loss_step=0.325, global_step=953.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  16%|█▌        | 190/1208 [05:22<28:49,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00146, train/loss_step=0.325, global_step=953.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  16%|█▌        | 190/1208 [05:22<28:49,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.82e-5, train/loss_step=0.013, global_step=953.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  16%|█▌        | 191/1208 [05:23<28:44,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.82e-5, train/loss_step=0.013, global_step=953.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  16%|█▌        | 191/1208 [05:23<28:44,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.00072, train/loss_step=0.205, global_step=953.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  16%|█▌        | 192/1208 [05:26<28:48,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.00072, train/loss_step=0.205, global_step=953.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  16%|█▌        | 192/1208 [05:26<28:48,  1.70s/it, loss=0.172, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00227, train/loss_step=0.366, global_step=953.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  16%|█▌        | 193/1208 [05:27<28:43,  1.70s/it, loss=0.172, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00227, train/loss_step=0.366, global_step=953.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  16%|█▌        | 193/1208 [05:27<28:43,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0587, train/loss_vlb_step=0.000208, train/loss_step=0.0587, global_step=954.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  16%|█▌        | 194/1208 [05:28<28:38,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0587, train/loss_vlb_step=0.000208, train/loss_step=0.0587, global_step=954.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  16%|█▌        | 194/1208 [05:28<28:38,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000513, train/loss_step=0.154, global_step=954.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  16%|█▌        | 195/1208 [05:29<28:32,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000513, train/loss_step=0.154, global_step=954.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  16%|█▌        | 195/1208 [05:29<28:32,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.51e-5, train/loss_step=0.0142, global_step=954.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  16%|█▌        | 196/1208 [05:32<28:37,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.51e-5, train/loss_step=0.0142, global_step=954.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  16%|█▌        | 196/1208 [05:32<28:37,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0331, train/loss_vlb_step=0.000133, train/loss_step=0.0331, global_step=954.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  16%|█▋        | 197/1208 [05:33<28:32,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0331, train/loss_vlb_step=0.000133, train/loss_step=0.0331, global_step=954.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  16%|█▋        | 197/1208 [05:33<28:32,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00438, train/loss_vlb_step=2.32e-5, train/loss_step=0.00438, global_step=955.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  16%|█▋        | 198/1208 [05:34<28:27,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00438, train/loss_vlb_step=2.32e-5, train/loss_step=0.00438, global_step=955.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  16%|█▋        | 198/1208 [05:34<28:27,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000341, train/loss_step=0.103, global_step=955.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  16%|█▋        | 199/1208 [05:35<28:21,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000341, train/loss_step=0.103, global_step=955.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  16%|█▋        | 199/1208 [05:35<28:21,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=2.05e-5, train/loss_step=0.00362, global_step=955.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  17%|█▋        | 200/1208 [05:38<28:26,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=2.05e-5, train/loss_step=0.00362, global_step=955.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  17%|█▋        | 200/1208 [05:38<28:26,  1.69s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000101, train/loss_step=0.0267, global_step=955.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  17%|█▋        | 201/1208 [05:39<28:21,  1.69s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000101, train/loss_step=0.0267, global_step=955.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  17%|█▋        | 201/1208 [05:39<28:21,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.7e-5, train/loss_step=0.0238, global_step=956.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  17%|█▋        | 202/1208 [05:40<28:16,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.7e-5, train/loss_step=0.0238, global_step=956.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  17%|█▋        | 202/1208 [05:40<28:16,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.535, train/loss_vlb_step=0.0104, train/loss_step=0.535, global_step=956.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  17%|█▋        | 203/1208 [05:41<28:11,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.535, train/loss_vlb_step=0.0104, train/loss_step=0.535, global_step=956.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  17%|█▋        | 203/1208 [05:41<28:11,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000612, train/loss_step=0.172, global_step=956.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  17%|█▋        | 204/1208 [05:44<28:15,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000612, train/loss_step=0.172, global_step=956.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  17%|█▋        | 204/1208 [05:44<28:15,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.519, train/loss_vlb_step=0.00734, train/loss_step=0.519, global_step=956.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  17%|█▋        | 205/1208 [05:45<28:10,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.519, train/loss_vlb_step=0.00734, train/loss_step=0.519, global_step=956.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  17%|█▋        | 205/1208 [05:45<28:10,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00675, train/loss_vlb_step=3.35e-5, train/loss_step=0.00675, global_step=957.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  17%|█▋        | 206/1208 [05:46<28:05,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00675, train/loss_vlb_step=3.35e-5, train/loss_step=0.00675, global_step=957.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  17%|█▋        | 206/1208 [05:46<28:05,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000442, train/loss_step=0.132, global_step=957.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  17%|█▋        | 207/1208 [05:47<28:00,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000442, train/loss_step=0.132, global_step=957.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  17%|█▋        | 207/1208 [05:47<28:00,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.52e-5, train/loss_step=0.00282, global_step=957.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  17%|█▋        | 208/1208 [05:50<28:04,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.52e-5, train/loss_step=0.00282, global_step=957.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  17%|█▋        | 208/1208 [05:50<28:04,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.61e-5, train/loss_step=0.00266, global_step=957.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  17%|█▋        | 209/1208 [05:51<27:59,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.61e-5, train/loss_step=0.00266, global_step=957.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  17%|█▋        | 209/1208 [05:51<27:59,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0663, train/loss_vlb_step=0.000224, train/loss_step=0.0663, global_step=958.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  17%|█▋        | 210/1208 [05:52<27:54,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0663, train/loss_vlb_step=0.000224, train/loss_step=0.0663, global_step=958.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  17%|█▋        | 210/1208 [05:52<27:54,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0566, train/loss_vlb_step=0.000192, train/loss_step=0.0566, global_step=958.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  17%|█▋        | 211/1208 [05:53<27:50,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0566, train/loss_vlb_step=0.000192, train/loss_step=0.0566, global_step=958.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  17%|█▋        | 211/1208 [05:53<27:50,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.65e-5, train/loss_step=0.0149, global_step=958.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  18%|█▊        | 212/1208 [05:56<27:54,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.65e-5, train/loss_step=0.0149, global_step=958.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  18%|█▊        | 212/1208 [05:56<27:54,  1.68s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.00371, train/loss_vlb_step=2.03e-5, train/loss_step=0.00371, global_step=958.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  18%|█▊        | 213/1208 [05:57<27:49,  1.68s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.00371, train/loss_vlb_step=2.03e-5, train/loss_step=0.00371, global_step=958.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  18%|█▊        | 213/1208 [05:57<27:49,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00164, train/loss_step=0.296, global_step=959.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]     Epoch 3:  18%|█▊        | 214/1208 [05:58<27:44,  1.67s/it, loss=0.109, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00164, train/loss_step=0.296, global_step=959.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  18%|█▊        | 214/1208 [05:58<27:44,  1.67s/it, loss=0.108, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000537, train/loss_step=0.150, global_step=959.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  18%|█▊        | 215/1208 [05:59<27:39,  1.67s/it, loss=0.108, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000537, train/loss_step=0.150, global_step=959.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  18%|█▊        | 215/1208 [05:59<27:39,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0947, train/loss_vlb_step=0.000312, train/loss_step=0.0947, global_step=959.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  18%|█▊        | 216/1208 [06:02<27:43,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0947, train/loss_vlb_step=0.000312, train/loss_step=0.0947, global_step=959.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  18%|█▊        | 216/1208 [06:02<27:43,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.071, train/loss_vlb_step=0.000242, train/loss_step=0.071, global_step=959.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  18%|█▊        | 217/1208 [06:03<27:39,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.071, train/loss_vlb_step=0.000242, train/loss_step=0.071, global_step=959.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  18%|█▊        | 217/1208 [06:03<27:39,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.03e-5, train/loss_step=0.0137, global_step=960.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  18%|█▊        | 218/1208 [06:04<27:34,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.03e-5, train/loss_step=0.0137, global_step=960.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  18%|█▊        | 218/1208 [06:04<27:34,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000867, train/loss_step=0.229, global_step=960.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  18%|█▊        | 219/1208 [06:05<27:29,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000867, train/loss_step=0.229, global_step=960.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  18%|█▊        | 219/1208 [06:05<27:29,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000629, train/loss_step=0.183, global_step=960.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  18%|█▊        | 220/1208 [06:08<27:35,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000629, train/loss_step=0.183, global_step=960.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  18%|█▊        | 220/1208 [06:08<27:35,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=8e-5, train/loss_step=0.0185, global_step=960.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  18%|█▊        | 221/1208 [06:09<27:30,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=8e-5, train/loss_step=0.0185, global_step=960.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  18%|█▊        | 221/1208 [06:09<27:30,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0472, train/loss_vlb_step=0.000161, train/loss_step=0.0472, global_step=961.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  18%|█▊        | 222/1208 [06:10<27:26,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0472, train/loss_vlb_step=0.000161, train/loss_step=0.0472, global_step=961.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  18%|█▊        | 222/1208 [06:10<27:26,  1.67s/it, loss=0.119, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00155, train/loss_step=0.306, global_step=961.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  18%|█▊        | 223/1208 [06:11<27:21,  1.67s/it, loss=0.119, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00155, train/loss_step=0.306, global_step=961.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  18%|█▊        | 223/1208 [06:11<27:21,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.523, train/loss_vlb_step=0.00756, train/loss_step=0.523, global_step=961.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  19%|█▊        | 224/1208 [06:14<27:27,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.523, train/loss_vlb_step=0.00756, train/loss_step=0.523, global_step=961.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  19%|█▊        | 224/1208 [06:14<27:27,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=961.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  19%|█▊        | 225/1208 [06:15<27:22,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=961.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  19%|█▊        | 225/1208 [06:15<27:22,  1.67s/it, loss=0.125, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000684, train/loss_step=0.181, global_step=962.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  19%|█▊        | 226/1208 [06:17<27:18,  1.67s/it, loss=0.125, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000684, train/loss_step=0.181, global_step=962.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  19%|█▊        | 226/1208 [06:17<27:18,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.000189, train/loss_step=0.0527, global_step=962.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  19%|█▉        | 227/1208 [06:18<27:13,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.000189, train/loss_step=0.0527, global_step=962.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  19%|█▉        | 227/1208 [06:18<27:13,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.810, train/loss_vlb_step=0.137, train/loss_step=0.810, global_step=962.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]     Epoch 3:  19%|█▉        | 228/1208 [06:21<27:18,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.810, train/loss_vlb_step=0.137, train/loss_step=0.810, global_step=962.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  19%|█▉        | 228/1208 [06:21<27:18,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.000166, train/loss_step=0.0459, global_step=962.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  19%|█▉        | 229/1208 [06:22<27:14,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.000166, train/loss_step=0.0459, global_step=962.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  19%|█▉        | 229/1208 [06:22<27:14,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000664, train/loss_step=0.183, global_step=963.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  19%|█▉        | 230/1208 [06:23<27:10,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000664, train/loss_step=0.183, global_step=963.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  19%|█▉        | 230/1208 [06:23<27:10,  1.67s/it, loss=0.179, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000964, train/loss_step=0.241, global_step=963.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  19%|█▉        | 231/1208 [06:24<27:05,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000964, train/loss_step=0.241, global_step=963.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  19%|█▉        | 231/1208 [06:24<27:05,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=8.4e-5, train/loss_step=0.0189, global_step=963.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  19%|█▉        | 232/1208 [06:27<27:11,  1.67s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=8.4e-5, train/loss_step=0.0189, global_step=963.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  19%|█▉        | 232/1208 [06:27<27:11,  1.67s/it, loss=0.187, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000548, train/loss_step=0.159, global_step=963.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  19%|█▉        | 233/1208 [06:28<27:06,  1.67s/it, loss=0.187, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000548, train/loss_step=0.159, global_step=963.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  19%|█▉        | 233/1208 [06:28<27:06,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0599, train/loss_vlb_step=0.000206, train/loss_step=0.0599, global_step=964.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  19%|█▉        | 234/1208 [06:29<27:02,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0599, train/loss_vlb_step=0.000206, train/loss_step=0.0599, global_step=964.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  19%|█▉        | 234/1208 [06:29<27:02,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00598, train/loss_vlb_step=3.19e-5, train/loss_step=0.00598, global_step=964.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  19%|█▉        | 235/1208 [06:30<26:58,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00598, train/loss_vlb_step=3.19e-5, train/loss_step=0.00598, global_step=964.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  19%|█▉        | 235/1208 [06:30<26:58,  1.66s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00604, train/loss_vlb_step=3.11e-5, train/loss_step=0.00604, global_step=964.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  20%|█▉        | 236/1208 [06:34<27:03,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00604, train/loss_vlb_step=3.11e-5, train/loss_step=0.00604, global_step=964.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  20%|█▉        | 236/1208 [06:34<27:03,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=8.1e-5, train/loss_step=0.0188, global_step=964.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  20%|█▉        | 237/1208 [06:35<26:58,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=8.1e-5, train/loss_step=0.0188, global_step=964.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  20%|█▉        | 237/1208 [06:35<26:59,  1.67s/it, loss=0.182, v_num=0, train/loss_simple_step=0.438, train/loss_vlb_step=0.00419, train/loss_step=0.438, global_step=965.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  20%|█▉        | 238/1208 [06:36<26:54,  1.66s/it, loss=0.182, v_num=0, train/loss_simple_step=0.438, train/loss_vlb_step=0.00419, train/loss_step=0.438, global_step=965.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  20%|█▉        | 238/1208 [06:36<26:54,  1.66s/it, loss=0.184, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00115, train/loss_step=0.272, global_step=965.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  20%|█▉        | 239/1208 [06:37<26:50,  1.66s/it, loss=0.184, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00115, train/loss_step=0.272, global_step=965.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  20%|█▉        | 239/1208 [06:37<26:50,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0745, train/loss_vlb_step=0.000254, train/loss_step=0.0745, global_step=965.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  20%|█▉        | 240/1208 [06:40<26:55,  1.67s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0745, train/loss_vlb_step=0.000254, train/loss_step=0.0745, global_step=965.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  20%|█▉        | 240/1208 [06:40<26:55,  1.67s/it, loss=0.191, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00108, train/loss_step=0.252, global_step=965.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  20%|█▉        | 241/1208 [06:41<26:51,  1.67s/it, loss=0.191, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00108, train/loss_step=0.252, global_step=965.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  20%|█▉        | 241/1208 [06:41<26:51,  1.67s/it, loss=0.196, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000556, train/loss_step=0.166, global_step=966.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  20%|██        | 242/1208 [06:42<26:46,  1.66s/it, loss=0.196, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000556, train/loss_step=0.166, global_step=966.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  20%|██        | 242/1208 [06:42<26:46,  1.66s/it, loss=0.201, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00337, train/loss_step=0.398, global_step=966.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  20%|██        | 243/1208 [06:43<26:42,  1.66s/it, loss=0.201, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00337, train/loss_step=0.398, global_step=966.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  20%|██        | 243/1208 [06:43<26:42,  1.66s/it, loss=0.184, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000682, train/loss_step=0.187, global_step=966.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  20%|██        | 244/1208 [06:46<26:47,  1.67s/it, loss=0.184, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000682, train/loss_step=0.187, global_step=966.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  20%|██        | 244/1208 [06:46<26:47,  1.67s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000102, train/loss_step=0.0263, global_step=966.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  20%|██        | 245/1208 [06:47<26:43,  1.67s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000102, train/loss_step=0.0263, global_step=966.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  20%|██        | 245/1208 [06:47<26:43,  1.67s/it, loss=0.19, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00297, train/loss_step=0.389, global_step=967.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  20%|██        | 246/1208 [06:49<26:39,  1.66s/it, loss=0.19, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00297, train/loss_step=0.389, global_step=967.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  20%|██        | 246/1208 [06:49<26:39,  1.66s/it, loss=0.199, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000797, train/loss_step=0.224, global_step=967.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  20%|██        | 247/1208 [06:50<26:35,  1.66s/it, loss=0.199, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000797, train/loss_step=0.224, global_step=967.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  20%|██        | 247/1208 [06:50<26:35,  1.66s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00669, train/loss_vlb_step=3.42e-5, train/loss_step=0.00669, global_step=967.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  21%|██        | 248/1208 [06:53<26:40,  1.67s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00669, train/loss_vlb_step=3.42e-5, train/loss_step=0.00669, global_step=967.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  21%|██        | 248/1208 [06:53<26:40,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.00041, train/loss_step=0.124, global_step=967.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  21%|██        | 249/1208 [06:54<26:36,  1.66s/it, loss=0.162, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.00041, train/loss_step=0.124, global_step=967.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  21%|██        | 249/1208 [06:54<26:36,  1.66s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0772, train/loss_vlb_step=0.000265, train/loss_step=0.0772, global_step=968.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  21%|██        | 250/1208 [06:55<26:32,  1.66s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0772, train/loss_vlb_step=0.000265, train/loss_step=0.0772, global_step=968.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  21%|██        | 250/1208 [06:55<26:32,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00586, train/loss_vlb_step=3.04e-5, train/loss_step=0.00586, global_step=968.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  21%|██        | 251/1208 [06:56<26:28,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00586, train/loss_vlb_step=3.04e-5, train/loss_step=0.00586, global_step=968.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  21%|██        | 251/1208 [06:56<26:28,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000454, train/loss_step=0.137, global_step=968.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  21%|██        | 252/1208 [06:59<26:32,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000454, train/loss_step=0.137, global_step=968.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  21%|██        | 252/1208 [06:59<26:32,  1.67s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00967, train/loss_vlb_step=4.21e-5, train/loss_step=0.00967, global_step=968.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  21%|██        | 253/1208 [07:00<26:28,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00967, train/loss_vlb_step=4.21e-5, train/loss_step=0.00967, global_step=968.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  21%|██        | 253/1208 [07:00<26:28,  1.66s/it, loss=0.162, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00459, train/loss_step=0.428, global_step=969.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  21%|██        | 254/1208 [07:01<26:24,  1.66s/it, loss=0.162, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00459, train/loss_step=0.428, global_step=969.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  21%|██        | 254/1208 [07:01<26:24,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=969.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  21%|██        | 255/1208 [07:02<26:20,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=969.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  21%|██        | 255/1208 [07:02<26:20,  1.66s/it, loss=0.188, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00302, train/loss_step=0.391, global_step=969.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  21%|██        | 256/1208 [07:06<26:24,  1.66s/it, loss=0.188, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00302, train/loss_step=0.391, global_step=969.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  21%|██        | 256/1208 [07:06<26:24,  1.66s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0651, train/loss_vlb_step=0.000218, train/loss_step=0.0651, global_step=969.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  21%|██▏       | 257/1208 [07:07<26:20,  1.66s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0651, train/loss_vlb_step=0.000218, train/loss_step=0.0651, global_step=969.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  21%|██▏       | 257/1208 [07:07<26:20,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.000932, train/loss_step=0.249, global_step=970.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  21%|██▏       | 258/1208 [07:08<26:16,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.000932, train/loss_step=0.249, global_step=970.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  21%|██▏       | 258/1208 [07:08<26:16,  1.66s/it, loss=0.176, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000571, train/loss_step=0.169, global_step=970.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  21%|██▏       | 259/1208 [07:09<26:12,  1.66s/it, loss=0.176, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000571, train/loss_step=0.169, global_step=970.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  21%|██▏       | 259/1208 [07:09<26:12,  1.66s/it, loss=0.19, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.00215, train/loss_step=0.360, global_step=970.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  22%|██▏       | 260/1208 [07:12<26:16,  1.66s/it, loss=0.19, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.00215, train/loss_step=0.360, global_step=970.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  22%|██▏       | 260/1208 [07:12<26:16,  1.66s/it, loss=0.194, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00163, train/loss_step=0.339, global_step=970.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  22%|██▏       | 261/1208 [07:13<26:12,  1.66s/it, loss=0.194, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00163, train/loss_step=0.339, global_step=970.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  22%|██▏       | 261/1208 [07:13<26:12,  1.66s/it, loss=0.199, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.0012, train/loss_step=0.259, global_step=971.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  22%|██▏       | 262/1208 [07:14<26:09,  1.66s/it, loss=0.199, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.0012, train/loss_step=0.259, global_step=971.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  22%|██▏       | 262/1208 [07:14<26:09,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=2.2e-5, train/loss_step=0.00407, global_step=971.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  22%|██▏       | 263/1208 [07:15<26:05,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=2.2e-5, train/loss_step=0.00407, global_step=971.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  22%|██▏       | 263/1208 [07:15<26:05,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00343, train/loss_vlb_step=1.91e-5, train/loss_step=0.00343, global_step=971.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  22%|██▏       | 264/1208 [07:18<26:09,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00343, train/loss_vlb_step=1.91e-5, train/loss_step=0.00343, global_step=971.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  22%|██▏       | 264/1208 [07:18<26:09,  1.66s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0519, train/loss_vlb_step=0.000184, train/loss_step=0.0519, global_step=971.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  22%|██▏       | 265/1208 [07:19<26:05,  1.66s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0519, train/loss_vlb_step=0.000184, train/loss_step=0.0519, global_step=971.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  22%|██▏       | 265/1208 [07:19<26:05,  1.66s/it, loss=0.161, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000612, train/loss_step=0.186, global_step=972.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  22%|██▏       | 266/1208 [07:20<26:01,  1.66s/it, loss=0.161, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000612, train/loss_step=0.186, global_step=972.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  22%|██▏       | 266/1208 [07:20<26:01,  1.66s/it, loss=0.164, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00141, train/loss_step=0.289, global_step=972.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  22%|██▏       | 267/1208 [07:22<25:57,  1.66s/it, loss=0.164, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00141, train/loss_step=0.289, global_step=972.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  22%|██▏       | 267/1208 [07:22<25:57,  1.66s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0965, train/loss_vlb_step=0.000321, train/loss_step=0.0965, global_step=972.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  22%|██▏       | 268/1208 [07:25<26:01,  1.66s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0965, train/loss_vlb_step=0.000321, train/loss_step=0.0965, global_step=972.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  22%|██▏       | 268/1208 [07:25<26:01,  1.66s/it, loss=0.182, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00254, train/loss_step=0.395, global_step=972.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  22%|██▏       | 269/1208 [07:26<25:58,  1.66s/it, loss=0.182, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00254, train/loss_step=0.395, global_step=972.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  22%|██▏       | 269/1208 [07:26<25:58,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.49e-5, train/loss_step=0.0125, global_step=973.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  22%|██▏       | 270/1208 [07:27<25:54,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.49e-5, train/loss_step=0.0125, global_step=973.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  22%|██▏       | 270/1208 [07:27<25:54,  1.66s/it, loss=0.187, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000575, train/loss_step=0.171, global_step=973.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  22%|██▏       | 271/1208 [07:28<25:50,  1.65s/it, loss=0.187, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000575, train/loss_step=0.171, global_step=973.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  22%|██▏       | 271/1208 [07:28<25:50,  1.65s/it, loss=0.19, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000674, train/loss_step=0.188, global_step=973.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  23%|██▎       | 272/1208 [07:31<25:54,  1.66s/it, loss=0.19, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000674, train/loss_step=0.188, global_step=973.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  23%|██▎       | 272/1208 [07:31<25:54,  1.66s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000116, train/loss_step=0.0293, global_step=973.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  23%|██▎       | 273/1208 [07:32<25:50,  1.66s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000116, train/loss_step=0.0293, global_step=973.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  23%|██▎       | 273/1208 [07:32<25:50,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.00073, train/loss_step=0.193, global_step=974.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  23%|██▎       | 274/1208 [07:33<25:46,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.00073, train/loss_step=0.193, global_step=974.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  23%|██▎       | 274/1208 [07:33<25:46,  1.66s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00561, train/loss_vlb_step=2.89e-5, train/loss_step=0.00561, global_step=974.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  23%|██▎       | 275/1208 [07:34<25:43,  1.65s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00561, train/loss_vlb_step=2.89e-5, train/loss_step=0.00561, global_step=974.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  23%|██▎       | 275/1208 [07:34<25:43,  1.65s/it, loss=0.167, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00138, train/loss_step=0.280, global_step=974.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  23%|██▎       | 276/1208 [07:38<25:46,  1.66s/it, loss=0.167, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00138, train/loss_step=0.280, global_step=974.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  23%|██▎       | 276/1208 [07:38<25:46,  1.66s/it, loss=0.173, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000612, train/loss_step=0.170, global_step=974.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  23%|██▎       | 277/1208 [07:39<25:43,  1.66s/it, loss=0.173, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000612, train/loss_step=0.170, global_step=974.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  23%|██▎       | 277/1208 [07:39<25:43,  1.66s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0981, train/loss_vlb_step=0.000324, train/loss_step=0.0981, global_step=975.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  23%|██▎       | 278/1208 [07:40<25:39,  1.66s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0981, train/loss_vlb_step=0.000324, train/loss_step=0.0981, global_step=975.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  23%|██▎       | 278/1208 [07:40<25:39,  1.66s/it, loss=0.175, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00313, train/loss_step=0.373, global_step=975.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  23%|██▎       | 279/1208 [07:41<25:35,  1.65s/it, loss=0.175, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00313, train/loss_step=0.373, global_step=975.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  23%|██▎       | 279/1208 [07:41<25:35,  1.65s/it, loss=0.187, v_num=0, train/loss_simple_step=0.591, train/loss_vlb_step=0.0174, train/loss_step=0.591, global_step=975.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  23%|██▎       | 280/1208 [07:44<25:39,  1.66s/it, loss=0.187, v_num=0, train/loss_simple_step=0.591, train/loss_vlb_step=0.0174, train/loss_step=0.591, global_step=975.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  23%|██▎       | 280/1208 [07:44<25:39,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=1.86e-5, train/loss_step=0.00334, global_step=975.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  23%|██▎       | 281/1208 [07:45<25:35,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=1.86e-5, train/loss_step=0.00334, global_step=975.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  23%|██▎       | 281/1208 [07:45<25:35,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.56e-5, train/loss_step=0.0175, global_step=976.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  23%|██▎       | 282/1208 [07:46<25:32,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.56e-5, train/loss_step=0.0175, global_step=976.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  23%|██▎       | 282/1208 [07:46<25:32,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=976.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  23%|██▎       | 283/1208 [07:47<25:28,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=976.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  23%|██▎       | 283/1208 [07:47<25:28,  1.65s/it, loss=0.168, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000366, train/loss_step=0.112, global_step=976.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  24%|██▎       | 284/1208 [07:50<25:32,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000366, train/loss_step=0.112, global_step=976.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  24%|██▎       | 284/1208 [07:50<25:32,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00156, train/loss_step=0.309, global_step=976.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  24%|██▎       | 285/1208 [07:52<25:28,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00156, train/loss_step=0.309, global_step=976.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  24%|██▎       | 285/1208 [07:52<25:28,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000458, train/loss_step=0.139, global_step=977.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  24%|██▎       | 286/1208 [07:53<25:24,  1.65s/it, loss=0.179, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000458, train/loss_step=0.139, global_step=977.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  24%|██▎       | 286/1208 [07:53<25:24,  1.65s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=1.97e-5, train/loss_step=0.00361, global_step=977.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  24%|██▍       | 287/1208 [07:54<25:21,  1.65s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=1.97e-5, train/loss_step=0.00361, global_step=977.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  24%|██▍       | 287/1208 [07:54<25:21,  1.65s/it, loss=0.166, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000419, train/loss_step=0.127, global_step=977.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  24%|██▍       | 288/1208 [07:57<25:24,  1.66s/it, loss=0.166, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000419, train/loss_step=0.127, global_step=977.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  24%|██▍       | 288/1208 [07:57<25:24,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0932, train/loss_vlb_step=0.000309, train/loss_step=0.0932, global_step=977.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  24%|██▍       | 289/1208 [07:58<25:21,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0932, train/loss_vlb_step=0.000309, train/loss_step=0.0932, global_step=977.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  24%|██▍       | 289/1208 [07:58<25:21,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000711, train/loss_step=0.195, global_step=978.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  24%|██▍       | 290/1208 [07:59<25:17,  1.65s/it, loss=0.16, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000711, train/loss_step=0.195, global_step=978.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  24%|██▍       | 290/1208 [07:59<25:17,  1.65s/it, loss=0.164, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00104, train/loss_step=0.244, global_step=978.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  24%|██▍       | 291/1208 [08:00<25:14,  1.65s/it, loss=0.164, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00104, train/loss_step=0.244, global_step=978.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  24%|██▍       | 291/1208 [08:00<25:14,  1.65s/it, loss=0.166, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000958, train/loss_step=0.230, global_step=978.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  24%|██▍       | 292/1208 [08:03<25:17,  1.66s/it, loss=0.166, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000958, train/loss_step=0.230, global_step=978.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  24%|██▍       | 292/1208 [08:03<25:17,  1.66s/it, loss=0.197, v_num=0, train/loss_simple_step=0.657, train/loss_vlb_step=0.0285, train/loss_step=0.657, global_step=978.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  24%|██▍       | 293/1208 [08:04<25:13,  1.65s/it, loss=0.197, v_num=0, train/loss_simple_step=0.657, train/loss_vlb_step=0.0285, train/loss_step=0.657, global_step=978.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  24%|██▍       | 293/1208 [08:04<25:13,  1.65s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=7.14e-5, train/loss_step=0.0157, global_step=979.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  24%|██▍       | 294/1208 [08:05<25:10,  1.65s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=7.14e-5, train/loss_step=0.0157, global_step=979.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  24%|██▍       | 294/1208 [08:05<25:10,  1.65s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00834, train/loss_vlb_step=4.22e-5, train/loss_step=0.00834, global_step=979.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  24%|██▍       | 295/1208 [08:06<25:06,  1.65s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00834, train/loss_vlb_step=4.22e-5, train/loss_step=0.00834, global_step=979.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  24%|██▍       | 295/1208 [08:06<25:06,  1.65s/it, loss=0.196, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00382, train/loss_step=0.436, global_step=979.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  25%|██▍       | 296/1208 [08:10<25:09,  1.66s/it, loss=0.196, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00382, train/loss_step=0.436, global_step=979.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  25%|██▍       | 296/1208 [08:10<25:09,  1.66s/it, loss=0.194, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=979.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  25%|██▍       | 297/1208 [08:11<25:06,  1.65s/it, loss=0.194, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=979.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  25%|██▍       | 297/1208 [08:11<25:06,  1.65s/it, loss=0.202, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00113, train/loss_step=0.262, global_step=980.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  25%|██▍       | 298/1208 [08:12<25:02,  1.65s/it, loss=0.202, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00113, train/loss_step=0.262, global_step=980.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  25%|██▍       | 298/1208 [08:12<25:02,  1.65s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.81e-5, train/loss_step=0.0157, global_step=980.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  25%|██▍       | 299/1208 [08:13<24:59,  1.65s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.81e-5, train/loss_step=0.0157, global_step=980.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  25%|██▍       | 299/1208 [08:13<24:59,  1.65s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.03e-5, train/loss_step=0.0108, global_step=980.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  25%|██▍       | 300/1208 [08:16<25:02,  1.65s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.03e-5, train/loss_step=0.0108, global_step=980.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  25%|██▍       | 300/1208 [08:16<25:02,  1.65s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=0.000104, train/loss_step=0.0259, global_step=980.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.84it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:29,  1.69it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.84it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.74it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.83it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.75it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.83it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.76it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.81it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.76it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.76it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.76it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.76it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.76it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.76it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.75it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.75it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.78it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.75it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.75it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.75it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.75it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.78it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 3:  25%|██▍       | 301/1208 [08:47<26:28,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=0.000104, train/loss_step=0.0259, global_step=980.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  25%|██▍       | 301/1208 [08:47<26:28,  1.75s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0867, train/loss_vlb_step=0.000288, train/loss_step=0.0867, global_step=981.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  25%|██▌       | 302/1208 [08:48<26:24,  1.75s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0867, train/loss_vlb_step=0.000288, train/loss_step=0.0867, global_step=981.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  25%|██▌       | 302/1208 [08:48<26:24,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000113, train/loss_step=0.0287, global_step=981.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  25%|██▌       | 303/1208 [08:49<26:20,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000113, train/loss_step=0.0287, global_step=981.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  25%|██▌       | 303/1208 [08:49<26:20,  1.75s/it, loss=0.163, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00101, train/loss_step=0.257, global_step=981.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  25%|██▌       | 304/1208 [08:52<26:22,  1.75s/it, loss=0.163, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00101, train/loss_step=0.257, global_step=981.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  25%|██▌       | 304/1208 [08:52<26:22,  1.75s/it, loss=0.168, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.0038, train/loss_step=0.412, global_step=981.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  25%|██▌       | 305/1208 [08:53<26:19,  1.75s/it, loss=0.168, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.0038, train/loss_step=0.412, global_step=981.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  25%|██▌       | 305/1208 [08:53<26:19,  1.75s/it, loss=0.172, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000707, train/loss_step=0.207, global_step=982.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  25%|██▌       | 306/1208 [08:54<26:15,  1.75s/it, loss=0.172, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000707, train/loss_step=0.207, global_step=982.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  25%|██▌       | 306/1208 [08:54<26:15,  1.75s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.1e-5, train/loss_step=0.0138, global_step=982.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  25%|██▌       | 307/1208 [08:55<26:11,  1.74s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.1e-5, train/loss_step=0.0138, global_step=982.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  25%|██▌       | 307/1208 [08:55<26:11,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00648, train/loss_vlb_step=3.35e-5, train/loss_step=0.00648, global_step=982.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  25%|██▌       | 308/1208 [08:58<26:14,  1.75s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00648, train/loss_vlb_step=3.35e-5, train/loss_step=0.00648, global_step=982.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  25%|██▌       | 308/1208 [08:58<26:14,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.28e-5, train/loss_step=0.00211, global_step=982.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  26%|██▌       | 309/1208 [08:59<26:10,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.28e-5, train/loss_step=0.00211, global_step=982.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  26%|██▌       | 309/1208 [08:59<26:10,  1.75s/it, loss=0.173, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00743, train/loss_step=0.430, global_step=983.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  26%|██▌       | 310/1208 [09:00<26:06,  1.74s/it, loss=0.173, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00743, train/loss_step=0.430, global_step=983.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  26%|██▌       | 310/1208 [09:00<26:06,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00135, train/loss_step=0.260, global_step=983.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  26%|██▌       | 311/1208 [09:01<26:02,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00135, train/loss_step=0.260, global_step=983.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  26%|██▌       | 311/1208 [09:01<26:02,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0567, train/loss_vlb_step=0.000202, train/loss_step=0.0567, global_step=983.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  26%|██▌       | 312/1208 [09:05<26:05,  1.75s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0567, train/loss_vlb_step=0.000202, train/loss_step=0.0567, global_step=983.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  26%|██▌       | 312/1208 [09:05<26:05,  1.75s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.74e-5, train/loss_step=0.00311, global_step=983.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  26%|██▌       | 313/1208 [09:06<26:01,  1.75s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.74e-5, train/loss_step=0.00311, global_step=983.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  26%|██▌       | 313/1208 [09:06<26:01,  1.75s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0341, train/loss_vlb_step=0.000132, train/loss_step=0.0341, global_step=984.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  26%|██▌       | 314/1208 [09:07<25:58,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0341, train/loss_vlb_step=0.000132, train/loss_step=0.0341, global_step=984.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  26%|██▌       | 314/1208 [09:07<25:58,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000337, train/loss_step=0.103, global_step=984.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  26%|██▌       | 315/1208 [09:08<25:54,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000337, train/loss_step=0.103, global_step=984.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  26%|██▌       | 315/1208 [09:08<25:54,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0813, train/loss_vlb_step=0.000269, train/loss_step=0.0813, global_step=984.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  26%|██▌       | 316/1208 [09:11<25:56,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0813, train/loss_vlb_step=0.000269, train/loss_step=0.0813, global_step=984.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  26%|██▌       | 316/1208 [09:11<25:56,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00941, train/loss_vlb_step=4.54e-5, train/loss_step=0.00941, global_step=984.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  26%|██▌       | 317/1208 [09:12<25:53,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00941, train/loss_vlb_step=4.54e-5, train/loss_step=0.00941, global_step=984.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  26%|██▌       | 317/1208 [09:12<25:53,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000844, train/loss_step=0.233, global_step=985.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  26%|██▋       | 318/1208 [09:13<25:49,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000844, train/loss_step=0.233, global_step=985.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  26%|██▋       | 318/1208 [09:13<25:49,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000436, train/loss_step=0.133, global_step=985.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  26%|██▋       | 319/1208 [09:14<25:45,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000436, train/loss_step=0.133, global_step=985.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  26%|██▋       | 319/1208 [09:14<25:45,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000114, train/loss_step=0.0291, global_step=985.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  26%|██▋       | 320/1208 [09:17<25:48,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000114, train/loss_step=0.0291, global_step=985.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  26%|██▋       | 320/1208 [09:17<25:48,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.3e-5, train/loss_step=0.014, global_step=985.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]     Epoch 3:  27%|██▋       | 321/1208 [09:18<25:44,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.3e-5, train/loss_step=0.014, global_step=985.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  27%|██▋       | 321/1208 [09:18<25:44,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=2.11e-5, train/loss_step=0.00378, global_step=986.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  27%|██▋       | 322/1208 [09:20<25:40,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=2.11e-5, train/loss_step=0.00378, global_step=986.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  27%|██▋       | 322/1208 [09:20<25:40,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.54e-5, train/loss_step=0.0148, global_step=986.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  27%|██▋       | 323/1208 [09:21<25:37,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.54e-5, train/loss_step=0.0148, global_step=986.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  27%|██▋       | 323/1208 [09:21<25:37,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00486, train/loss_vlb_step=2.52e-5, train/loss_step=0.00486, global_step=986.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  27%|██▋       | 324/1208 [09:24<25:39,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00486, train/loss_vlb_step=2.52e-5, train/loss_step=0.00486, global_step=986.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  27%|██▋       | 324/1208 [09:24<25:39,  1.74s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.49e-5, train/loss_step=0.00255, global_step=986.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  27%|██▋       | 325/1208 [09:25<25:36,  1.74s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.49e-5, train/loss_step=0.00255, global_step=986.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  27%|██▋       | 325/1208 [09:25<25:36,  1.74s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.510, train/loss_vlb_step=0.00564, train/loss_step=0.510, global_step=987.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  27%|██▋       | 326/1208 [09:26<25:32,  1.74s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.510, train/loss_vlb_step=0.00564, train/loss_step=0.510, global_step=987.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  27%|██▋       | 326/1208 [09:26<25:32,  1.74s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=9.98e-5, train/loss_step=0.0254, global_step=987.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  27%|██▋       | 327/1208 [09:27<25:28,  1.74s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=9.98e-5, train/loss_step=0.0254, global_step=987.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  27%|██▋       | 327/1208 [09:27<25:28,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.455, train/loss_vlb_step=0.00429, train/loss_step=0.455, global_step=987.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  27%|██▋       | 328/1208 [09:30<25:31,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.455, train/loss_vlb_step=0.00429, train/loss_step=0.455, global_step=987.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  27%|██▋       | 328/1208 [09:30<25:31,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0758, train/loss_vlb_step=0.000249, train/loss_step=0.0758, global_step=987.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  27%|██▋       | 329/1208 [09:31<25:27,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0758, train/loss_vlb_step=0.000249, train/loss_step=0.0758, global_step=987.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  27%|██▋       | 329/1208 [09:31<25:27,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.619, train/loss_vlb_step=0.0182, train/loss_step=0.619, global_step=988.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  27%|██▋       | 330/1208 [09:32<25:24,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.619, train/loss_vlb_step=0.0182, train/loss_step=0.619, global_step=988.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  27%|██▋       | 330/1208 [09:32<25:24,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.61e-5, train/loss_step=0.0029, global_step=988.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  27%|██▋       | 331/1208 [09:33<25:20,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.61e-5, train/loss_step=0.0029, global_step=988.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  27%|██▋       | 331/1208 [09:33<25:20,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.39e-5, train/loss_step=0.0143, global_step=988.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  27%|██▋       | 332/1208 [09:37<25:22,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.39e-5, train/loss_step=0.0143, global_step=988.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  27%|██▋       | 332/1208 [09:37<25:22,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.00057, train/loss_step=0.165, global_step=988.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  28%|██▊       | 333/1208 [09:38<25:19,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.00057, train/loss_step=0.165, global_step=988.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  28%|██▊       | 333/1208 [09:38<25:19,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00108, train/loss_step=0.255, global_step=989.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  28%|██▊       | 334/1208 [09:39<25:15,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00108, train/loss_step=0.255, global_step=989.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  28%|██▊       | 334/1208 [09:39<25:15,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000129, train/loss_step=0.0335, global_step=989.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  28%|██▊       | 335/1208 [09:40<25:12,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000129, train/loss_step=0.0335, global_step=989.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  28%|██▊       | 335/1208 [09:40<25:12,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0933, train/loss_vlb_step=0.000308, train/loss_step=0.0933, global_step=989.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  28%|██▊       | 336/1208 [09:43<25:14,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0933, train/loss_vlb_step=0.000308, train/loss_step=0.0933, global_step=989.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  28%|██▊       | 336/1208 [09:43<25:14,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.653, train/loss_vlb_step=0.042, train/loss_step=0.653, global_step=989.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]     Epoch 3:  28%|██▊       | 337/1208 [09:44<25:11,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.653, train/loss_vlb_step=0.042, train/loss_step=0.653, global_step=989.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  28%|██▊       | 337/1208 [09:44<25:11,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00341, train/loss_step=0.454, global_step=990.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  28%|██▊       | 338/1208 [09:45<25:07,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00341, train/loss_step=0.454, global_step=990.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  28%|██▊       | 338/1208 [09:45<25:07,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00497, train/loss_vlb_step=2.8e-5, train/loss_step=0.00497, global_step=990.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  28%|██▊       | 339/1208 [09:46<25:04,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00497, train/loss_vlb_step=2.8e-5, train/loss_step=0.00497, global_step=990.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  28%|██▊       | 339/1208 [09:46<25:04,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.52e-5, train/loss_step=0.0173, global_step=990.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  28%|██▊       | 340/1208 [09:49<25:06,  1.74s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.52e-5, train/loss_step=0.0173, global_step=990.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  28%|██▊       | 340/1208 [09:49<25:06,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000729, train/loss_step=0.208, global_step=990.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  28%|██▊       | 341/1208 [09:51<25:02,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000729, train/loss_step=0.208, global_step=990.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  28%|██▊       | 341/1208 [09:51<25:02,  1.73s/it, loss=0.19, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000658, train/loss_step=0.197, global_step=991.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  28%|██▊       | 342/1208 [09:52<24:59,  1.73s/it, loss=0.19, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000658, train/loss_step=0.197, global_step=991.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  28%|██▊       | 342/1208 [09:52<24:59,  1.73s/it, loss=0.195, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=991.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  28%|██▊       | 343/1208 [09:53<24:55,  1.73s/it, loss=0.195, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=991.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  28%|██▊       | 343/1208 [09:53<24:55,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000131, train/loss_step=0.035, global_step=991.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  28%|██▊       | 344/1208 [09:56<24:57,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000131, train/loss_step=0.035, global_step=991.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  28%|██▊       | 344/1208 [09:56<24:57,  1.73s/it, loss=0.216, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00348, train/loss_step=0.402, global_step=991.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  29%|██▊       | 345/1208 [09:57<24:54,  1.73s/it, loss=0.216, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00348, train/loss_step=0.402, global_step=991.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  29%|██▊       | 345/1208 [09:57<24:54,  1.73s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.9e-5, train/loss_step=0.0033, global_step=992.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  29%|██▊       | 346/1208 [09:58<24:51,  1.73s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.9e-5, train/loss_step=0.0033, global_step=992.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  29%|██▊       | 346/1208 [09:58<24:51,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000397, train/loss_step=0.121, global_step=992.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  29%|██▊       | 347/1208 [09:59<24:47,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000397, train/loss_step=0.121, global_step=992.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  29%|██▊       | 347/1208 [09:59<24:47,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00396, train/loss_vlb_step=2.19e-5, train/loss_step=0.00396, global_step=992.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  29%|██▉       | 348/1208 [10:02<24:49,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00396, train/loss_vlb_step=2.19e-5, train/loss_step=0.00396, global_step=992.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  29%|██▉       | 348/1208 [10:02<24:49,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000245, train/loss_step=0.0732, global_step=992.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  29%|██▉       | 349/1208 [10:03<24:46,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000245, train/loss_step=0.0732, global_step=992.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  29%|██▉       | 349/1208 [10:03<24:46,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00126, train/loss_step=0.294, global_step=993.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  29%|██▉       | 350/1208 [10:04<24:42,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00126, train/loss_step=0.294, global_step=993.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  29%|██▉       | 350/1208 [10:04<24:42,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00137, train/loss_step=0.274, global_step=993.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  29%|██▉       | 351/1208 [10:05<24:39,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00137, train/loss_step=0.274, global_step=993.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  29%|██▉       | 351/1208 [10:05<24:39,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.29e-5, train/loss_step=0.0121, global_step=993.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  29%|██▉       | 352/1208 [10:09<24:41,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.29e-5, train/loss_step=0.0121, global_step=993.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  29%|██▉       | 352/1208 [10:09<24:41,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0738, train/loss_vlb_step=0.000253, train/loss_step=0.0738, global_step=993.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  29%|██▉       | 353/1208 [10:10<24:38,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0738, train/loss_vlb_step=0.000253, train/loss_step=0.0738, global_step=993.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  29%|██▉       | 353/1208 [10:10<24:38,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.000187, train/loss_step=0.0543, global_step=994.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  29%|██▉       | 354/1208 [10:11<24:34,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.000187, train/loss_step=0.0543, global_step=994.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  29%|██▉       | 354/1208 [10:11<24:34,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000391, train/loss_step=0.118, global_step=994.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  29%|██▉       | 355/1208 [10:12<24:31,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000391, train/loss_step=0.118, global_step=994.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  29%|██▉       | 355/1208 [10:12<24:31,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000687, train/loss_step=0.189, global_step=994.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  29%|██▉       | 356/1208 [10:15<24:33,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000687, train/loss_step=0.189, global_step=994.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  29%|██▉       | 356/1208 [10:15<24:33,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.00015, train/loss_step=0.0405, global_step=994.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  30%|██▉       | 357/1208 [10:16<24:30,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.00015, train/loss_step=0.0405, global_step=994.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  30%|██▉       | 357/1208 [10:16<24:30,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0701, train/loss_vlb_step=0.000246, train/loss_step=0.0701, global_step=995.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  30%|██▉       | 358/1208 [10:17<24:26,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0701, train/loss_vlb_step=0.000246, train/loss_step=0.0701, global_step=995.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  30%|██▉       | 358/1208 [10:17<24:26,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0719, train/loss_vlb_step=0.000248, train/loss_step=0.0719, global_step=995.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  30%|██▉       | 359/1208 [10:18<24:23,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0719, train/loss_vlb_step=0.000248, train/loss_step=0.0719, global_step=995.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  30%|██▉       | 359/1208 [10:18<24:23,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.8e-5, train/loss_step=0.0183, global_step=995.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  30%|██▉       | 360/1208 [10:22<24:25,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.8e-5, train/loss_step=0.0183, global_step=995.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  30%|██▉       | 360/1208 [10:22<24:25,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00898, train/loss_vlb_step=4.4e-5, train/loss_step=0.00898, global_step=995.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  30%|██▉       | 361/1208 [10:23<24:21,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00898, train/loss_vlb_step=4.4e-5, train/loss_step=0.00898, global_step=995.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  30%|██▉       | 361/1208 [10:23<24:21,  1.73s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.59e-5, train/loss_step=0.0202, global_step=996.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  30%|██▉       | 362/1208 [10:24<24:18,  1.72s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.59e-5, train/loss_step=0.0202, global_step=996.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  30%|██▉       | 362/1208 [10:24<24:18,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000898, train/loss_step=0.230, global_step=996.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  30%|███       | 363/1208 [10:25<24:15,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000898, train/loss_step=0.230, global_step=996.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  30%|███       | 363/1208 [10:25<24:15,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00164, train/loss_step=0.290, global_step=996.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  30%|███       | 364/1208 [10:28<24:17,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00164, train/loss_step=0.290, global_step=996.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  30%|███       | 364/1208 [10:28<24:17,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00137, train/loss_step=0.285, global_step=996.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  30%|███       | 365/1208 [10:29<24:13,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00137, train/loss_step=0.285, global_step=996.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  30%|███       | 365/1208 [10:29<24:13,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.55e-5, train/loss_step=0.0149, global_step=997.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  30%|███       | 366/1208 [10:30<24:10,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.55e-5, train/loss_step=0.0149, global_step=997.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  30%|███       | 366/1208 [10:30<24:10,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000693, train/loss_step=0.199, global_step=997.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  30%|███       | 367/1208 [10:31<24:07,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000693, train/loss_step=0.199, global_step=997.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  30%|███       | 367/1208 [10:31<24:07,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00553, train/loss_vlb_step=2.91e-5, train/loss_step=0.00553, global_step=997.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  30%|███       | 368/1208 [10:34<24:08,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00553, train/loss_vlb_step=2.91e-5, train/loss_step=0.00553, global_step=997.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  30%|███       | 368/1208 [10:34<24:08,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.00013, train/loss_step=0.0351, global_step=997.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  31%|███       | 369/1208 [10:35<24:05,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.00013, train/loss_step=0.0351, global_step=997.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  31%|███       | 369/1208 [10:35<24:05,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00775, train/loss_vlb_step=3.8e-5, train/loss_step=0.00775, global_step=998.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  31%|███       | 370/1208 [10:36<24:02,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00775, train/loss_vlb_step=3.8e-5, train/loss_step=0.00775, global_step=998.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  31%|███       | 370/1208 [10:36<24:02,  1.72s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.74e-5, train/loss_step=0.0183, global_step=998.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  31%|███       | 371/1208 [10:37<23:59,  1.72s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.74e-5, train/loss_step=0.0183, global_step=998.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  31%|███       | 371/1208 [10:37<23:59,  1.72s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.87e-5, train/loss_step=0.0126, global_step=998.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  31%|███       | 372/1208 [10:41<24:00,  1.72s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.87e-5, train/loss_step=0.0126, global_step=998.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  31%|███       | 372/1208 [10:41<24:00,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00203, train/loss_step=0.359, global_step=998.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  31%|███       | 373/1208 [10:42<23:57,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00203, train/loss_step=0.359, global_step=998.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  31%|███       | 373/1208 [10:42<23:57,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00202, train/loss_step=0.347, global_step=999.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  31%|███       | 374/1208 [10:43<23:54,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00202, train/loss_step=0.347, global_step=999.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  31%|███       | 374/1208 [10:43<23:54,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000185, train/loss_step=0.0514, global_step=999.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  31%|███       | 375/1208 [10:44<23:51,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000185, train/loss_step=0.0514, global_step=999.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  31%|███       | 375/1208 [10:44<23:51,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.0022, train/loss_step=0.329, global_step=999.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  31%|███       | 376/1208 [10:47<23:52,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.0022, train/loss_step=0.329, global_step=999.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  31%|███       | 376/1208 [10:47<23:52,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00197, train/loss_step=0.369, global_step=999.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  31%|███       | 377/1208 [10:48<23:49,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00197, train/loss_step=0.369, global_step=999.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  31%|███       | 377/1208 [10:48<23:49,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0523, train/loss_vlb_step=0.000184, train/loss_step=0.0523, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  31%|███▏      | 378/1208 [10:49<23:46,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0523, train/loss_vlb_step=0.000184, train/loss_step=0.0523, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  31%|███▏      | 378/1208 [10:49<23:46,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=7.05e-5, train/loss_step=0.0164, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  31%|███▏      | 379/1208 [10:50<23:43,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=7.05e-5, train/loss_step=0.0164, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  31%|███▏      | 379/1208 [10:50<23:43,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0424, train/loss_vlb_step=0.000159, train/loss_step=0.0424, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  31%|███▏      | 380/1208 [10:53<23:44,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0424, train/loss_vlb_step=0.000159, train/loss_step=0.0424, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  31%|███▏      | 380/1208 [10:53<23:44,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00976, train/loss_vlb_step=4.59e-5, train/loss_step=0.00976, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  32%|███▏      | 381/1208 [10:54<23:41,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00976, train/loss_vlb_step=4.59e-5, train/loss_step=0.00976, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  32%|███▏      | 381/1208 [10:54<23:41,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00638, train/loss_vlb_step=3.28e-5, train/loss_step=0.00638, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  32%|███▏      | 382/1208 [10:56<23:38,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00638, train/loss_vlb_step=3.28e-5, train/loss_step=0.00638, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  32%|███▏      | 382/1208 [10:56<23:38,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00117, train/loss_step=0.263, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  32%|███▏      | 383/1208 [10:57<23:35,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00117, train/loss_step=0.263, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  32%|███▏      | 383/1208 [10:57<23:35,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00589, train/loss_vlb_step=3.06e-5, train/loss_step=0.00589, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  32%|███▏      | 384/1208 [11:00<23:36,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00589, train/loss_vlb_step=3.06e-5, train/loss_step=0.00589, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  32%|███▏      | 384/1208 [11:00<23:36,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.530, train/loss_vlb_step=0.010, train/loss_step=0.530, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]      Epoch 3:  32%|███▏      | 385/1208 [11:01<23:33,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.530, train/loss_vlb_step=0.010, train/loss_step=0.530, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  32%|███▏      | 385/1208 [11:01<23:33,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000687, train/loss_step=0.190, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  32%|███▏      | 386/1208 [11:02<23:30,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000687, train/loss_step=0.190, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  32%|███▏      | 386/1208 [11:02<23:30,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000677, train/loss_step=0.195, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  32%|███▏      | 387/1208 [11:03<23:27,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000677, train/loss_step=0.195, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  32%|███▏      | 387/1208 [11:03<23:27,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000832, train/loss_step=0.210, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  32%|███▏      | 388/1208 [11:06<23:28,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000832, train/loss_step=0.210, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  32%|███▏      | 388/1208 [11:06<23:28,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.15e-5, train/loss_step=0.0233, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  32%|███▏      | 389/1208 [11:07<23:25,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.15e-5, train/loss_step=0.0233, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  32%|███▏      | 389/1208 [11:07<23:25,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.419, train/loss_vlb_step=0.0034, train/loss_step=0.419, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  32%|███▏      | 390/1208 [11:08<23:22,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.419, train/loss_vlb_step=0.0034, train/loss_step=0.419, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  32%|███▏      | 390/1208 [11:08<23:22,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000449, train/loss_step=0.134, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  32%|███▏      | 391/1208 [11:09<23:19,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000449, train/loss_step=0.134, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  32%|███▏      | 391/1208 [11:09<23:19,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0512, train/loss_vlb_step=0.000183, train/loss_step=0.0512, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  32%|███▏      | 392/1208 [11:13<23:21,  1.72s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0512, train/loss_vlb_step=0.000183, train/loss_step=0.0512, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  32%|███▏      | 392/1208 [11:13<23:21,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=0.000103, train/loss_step=0.0243, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  33%|███▎      | 393/1208 [11:14<23:18,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=0.000103, train/loss_step=0.0243, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  33%|███▎      | 393/1208 [11:14<23:18,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00473, train/loss_vlb_step=2.48e-5, train/loss_step=0.00473, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  33%|███▎      | 394/1208 [11:15<23:14,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00473, train/loss_vlb_step=2.48e-5, train/loss_step=0.00473, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  33%|███▎      | 394/1208 [11:15<23:14,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.46e-5, train/loss_step=0.0169, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  33%|███▎      | 395/1208 [11:16<23:11,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.46e-5, train/loss_step=0.0169, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  33%|███▎      | 395/1208 [11:16<23:11,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00183, train/loss_step=0.331, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  33%|███▎      | 396/1208 [11:19<23:13,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00183, train/loss_step=0.331, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  33%|███▎      | 396/1208 [11:19<23:13,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000338, train/loss_step=0.103, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  33%|███▎      | 397/1208 [11:20<23:10,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000338, train/loss_step=0.103, global_step=1e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  33%|███▎      | 397/1208 [11:20<23:10,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.00021, train/loss_step=0.0598, global_step=1005.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  33%|███▎      | 398/1208 [11:21<23:07,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.00021, train/loss_step=0.0598, global_step=1005.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  33%|███▎      | 398/1208 [11:21<23:07,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0294, train/loss_vlb_step=0.000113, train/loss_step=0.0294, global_step=1005.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  33%|███▎      | 399/1208 [11:22<23:03,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0294, train/loss_vlb_step=0.000113, train/loss_step=0.0294, global_step=1005.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  33%|███▎      | 399/1208 [11:22<23:03,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.06e-5, train/loss_step=0.0109, global_step=1005.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  33%|███▎      | 400/1208 [11:25<23:05,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.06e-5, train/loss_step=0.0109, global_step=1005.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  33%|███▎      | 400/1208 [11:25<23:05,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00186, train/loss_step=0.348, global_step=1005.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  33%|███▎      | 401/1208 [11:26<23:02,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00186, train/loss_step=0.348, global_step=1005.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  33%|███▎      | 401/1208 [11:26<23:02,  1.71s/it, loss=0.175, v_num=0, train/loss_simple_step=0.551, train/loss_vlb_step=0.0134, train/loss_step=0.551, global_step=1006.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  33%|███▎      | 402/1208 [11:27<22:59,  1.71s/it, loss=0.175, v_num=0, train/loss_simple_step=0.551, train/loss_vlb_step=0.0134, train/loss_step=0.551, global_step=1006.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  33%|███▎      | 402/1208 [11:27<22:59,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.23e-5, train/loss_step=0.0137, global_step=1006.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  33%|███▎      | 403/1208 [11:28<22:56,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.23e-5, train/loss_step=0.0137, global_step=1006.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  33%|███▎      | 403/1208 [11:28<22:56,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000731, train/loss_step=0.202, global_step=1006.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  33%|███▎      | 404/1208 [11:32<22:57,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000731, train/loss_step=0.202, global_step=1006.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  33%|███▎      | 404/1208 [11:32<22:57,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.52e-5, train/loss_step=0.012, global_step=1006.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  34%|███▎      | 405/1208 [11:33<22:54,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.52e-5, train/loss_step=0.012, global_step=1006.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  34%|███▎      | 405/1208 [11:33<22:54,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00281, train/loss_step=0.367, global_step=1007.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  34%|███▎      | 406/1208 [11:34<22:51,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00281, train/loss_step=0.367, global_step=1007.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  34%|███▎      | 406/1208 [11:34<22:51,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.0004, train/loss_step=0.122, global_step=1007.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  34%|███▎      | 407/1208 [11:35<22:48,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.0004, train/loss_step=0.122, global_step=1007.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  34%|███▎      | 407/1208 [11:35<22:48,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.000122, train/loss_step=0.0322, global_step=1007.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  34%|███▍      | 408/1208 [11:38<22:49,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.000122, train/loss_step=0.0322, global_step=1007.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  34%|███▍      | 408/1208 [11:38<22:49,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.81e-5, train/loss_step=0.0154, global_step=1007.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  34%|███▍      | 409/1208 [11:39<22:46,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.81e-5, train/loss_step=0.0154, global_step=1007.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  34%|███▍      | 409/1208 [11:39<22:46,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000635, train/loss_step=0.183, global_step=1008.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  34%|███▍      | 410/1208 [11:40<22:43,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000635, train/loss_step=0.183, global_step=1008.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  34%|███▍      | 410/1208 [11:40<22:43,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00543, train/loss_vlb_step=2.76e-5, train/loss_step=0.00543, global_step=1008.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  34%|███▍      | 411/1208 [11:41<22:40,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00543, train/loss_vlb_step=2.76e-5, train/loss_step=0.00543, global_step=1008.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  34%|███▍      | 411/1208 [11:41<22:40,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00135, train/loss_step=0.298, global_step=1008.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  34%|███▍      | 412/1208 [11:44<22:42,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00135, train/loss_step=0.298, global_step=1008.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  34%|███▍      | 412/1208 [11:44<22:42,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00107, train/loss_step=0.251, global_step=1008.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  34%|███▍      | 413/1208 [11:46<22:39,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00107, train/loss_step=0.251, global_step=1008.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  34%|███▍      | 413/1208 [11:46<22:39,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.000107, train/loss_step=0.0285, global_step=1009.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  34%|███▍      | 414/1208 [11:47<22:36,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.000107, train/loss_step=0.0285, global_step=1009.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  34%|███▍      | 414/1208 [11:47<22:36,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0776, train/loss_vlb_step=0.00026, train/loss_step=0.0776, global_step=1009.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  34%|███▍      | 415/1208 [11:48<22:33,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0776, train/loss_vlb_step=0.00026, train/loss_step=0.0776, global_step=1009.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  34%|███▍      | 415/1208 [11:48<22:33,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00318, train/loss_vlb_step=1.83e-5, train/loss_step=0.00318, global_step=1009.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  34%|███▍      | 416/1208 [11:51<22:34,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00318, train/loss_vlb_step=1.83e-5, train/loss_step=0.00318, global_step=1009.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  34%|███▍      | 416/1208 [11:51<22:34,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=1.41e-5, train/loss_step=0.00242, global_step=1009.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  35%|███▍      | 417/1208 [11:52<22:31,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=1.41e-5, train/loss_step=0.00242, global_step=1009.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  35%|███▍      | 417/1208 [11:52<22:31,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=3.66e-5, train/loss_step=0.00742, global_step=1010.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  35%|███▍      | 418/1208 [11:53<22:28,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=3.66e-5, train/loss_step=0.00742, global_step=1010.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  35%|███▍      | 418/1208 [11:53<22:28,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00337, train/loss_vlb_step=1.93e-5, train/loss_step=0.00337, global_step=1010.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  35%|███▍      | 419/1208 [11:54<22:25,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00337, train/loss_vlb_step=1.93e-5, train/loss_step=0.00337, global_step=1010.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  35%|███▍      | 419/1208 [11:54<22:25,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0547, train/loss_vlb_step=0.000196, train/loss_step=0.0547, global_step=1010.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  35%|███▍      | 420/1208 [11:57<22:26,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0547, train/loss_vlb_step=0.000196, train/loss_step=0.0547, global_step=1010.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  35%|███▍      | 420/1208 [11:57<22:26,  1.71s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0648, train/loss_vlb_step=0.000221, train/loss_step=0.0648, global_step=1010.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  35%|███▍      | 421/1208 [11:58<22:23,  1.71s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0648, train/loss_vlb_step=0.000221, train/loss_step=0.0648, global_step=1010.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  35%|███▍      | 421/1208 [11:58<22:23,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.0034, train/loss_step=0.512, global_step=1011.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  35%|███▍      | 422/1208 [11:59<22:20,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.0034, train/loss_step=0.512, global_step=1011.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  35%|███▍      | 422/1208 [11:59<22:20,  1.71s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0481, train/loss_vlb_step=0.000173, train/loss_step=0.0481, global_step=1011.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  35%|███▌      | 423/1208 [12:00<22:17,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0481, train/loss_vlb_step=0.000173, train/loss_step=0.0481, global_step=1011.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  35%|███▌      | 423/1208 [12:00<22:17,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.524, train/loss_vlb_step=0.00932, train/loss_step=0.524, global_step=1011.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  35%|███▌      | 424/1208 [12:04<22:18,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.524, train/loss_vlb_step=0.00932, train/loss_step=0.524, global_step=1011.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  35%|███▌      | 424/1208 [12:04<22:18,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000498, train/loss_step=0.151, global_step=1011.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  35%|███▌      | 425/1208 [12:05<22:16,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000498, train/loss_step=0.151, global_step=1011.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  35%|███▌      | 425/1208 [12:05<22:16,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00811, train/loss_vlb_step=4.03e-5, train/loss_step=0.00811, global_step=1012.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  35%|███▌      | 426/1208 [12:06<22:13,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00811, train/loss_vlb_step=4.03e-5, train/loss_step=0.00811, global_step=1012.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  35%|███▌      | 426/1208 [12:06<22:13,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000604, train/loss_step=0.175, global_step=1012.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  35%|███▌      | 427/1208 [12:07<22:10,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000604, train/loss_step=0.175, global_step=1012.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  35%|███▌      | 427/1208 [12:07<22:10,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00165, train/loss_step=0.310, global_step=1012.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  35%|███▌      | 428/1208 [12:10<22:11,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00165, train/loss_step=0.310, global_step=1012.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  35%|███▌      | 428/1208 [12:10<22:11,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000141, train/loss_step=0.0369, global_step=1012.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  36%|███▌      | 429/1208 [12:11<22:08,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000141, train/loss_step=0.0369, global_step=1012.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  36%|███▌      | 429/1208 [12:11<22:08,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.468, train/loss_vlb_step=0.00486, train/loss_step=0.468, global_step=1013.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  36%|███▌      | 430/1208 [12:12<22:05,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.468, train/loss_vlb_step=0.00486, train/loss_step=0.468, global_step=1013.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  36%|███▌      | 430/1208 [12:12<22:05,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000906, train/loss_step=0.248, global_step=1013.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  36%|███▌      | 431/1208 [12:13<22:02,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000906, train/loss_step=0.248, global_step=1013.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  36%|███▌      | 431/1208 [12:13<22:02,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00129, train/loss_step=0.264, global_step=1013.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  36%|███▌      | 432/1208 [12:16<22:03,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00129, train/loss_step=0.264, global_step=1013.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  36%|███▌      | 432/1208 [12:16<22:03,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00511, train/loss_vlb_step=2.67e-5, train/loss_step=0.00511, global_step=1013.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  36%|███▌      | 433/1208 [12:18<22:00,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00511, train/loss_vlb_step=2.67e-5, train/loss_step=0.00511, global_step=1013.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  36%|███▌      | 433/1208 [12:18<22:00,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.16e-5, train/loss_step=0.0239, global_step=1014.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  36%|███▌      | 434/1208 [12:19<21:58,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.16e-5, train/loss_step=0.0239, global_step=1014.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  36%|███▌      | 434/1208 [12:19<21:58,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00497, train/loss_vlb_step=2.61e-5, train/loss_step=0.00497, global_step=1014.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  36%|███▌      | 435/1208 [12:20<21:55,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00497, train/loss_vlb_step=2.61e-5, train/loss_step=0.00497, global_step=1014.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  36%|███▌      | 435/1208 [12:20<21:55,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0845, train/loss_vlb_step=0.000283, train/loss_step=0.0845, global_step=1014.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  36%|███▌      | 436/1208 [12:23<21:56,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0845, train/loss_vlb_step=0.000283, train/loss_step=0.0845, global_step=1014.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  36%|███▌      | 436/1208 [12:23<21:56,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000504, train/loss_step=0.152, global_step=1014.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  36%|███▌      | 437/1208 [12:24<21:53,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000504, train/loss_step=0.152, global_step=1014.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  36%|███▌      | 437/1208 [12:24<21:53,  1.70s/it, loss=0.198, v_num=0, train/loss_simple_step=0.813, train/loss_vlb_step=0.0595, train/loss_step=0.813, global_step=1015.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  36%|███▋      | 438/1208 [12:25<21:50,  1.70s/it, loss=0.198, v_num=0, train/loss_simple_step=0.813, train/loss_vlb_step=0.0595, train/loss_step=0.813, global_step=1015.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  36%|███▋      | 438/1208 [12:25<21:50,  1.70s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000115, train/loss_step=0.0301, global_step=1015.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  36%|███▋      | 439/1208 [12:26<21:47,  1.70s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000115, train/loss_step=0.0301, global_step=1015.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  36%|███▋      | 439/1208 [12:26<21:47,  1.70s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=5.11e-5, train/loss_step=0.0104, global_step=1015.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  36%|███▋      | 440/1208 [12:29<21:48,  1.70s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=5.11e-5, train/loss_step=0.0104, global_step=1015.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  36%|███▋      | 440/1208 [12:29<21:48,  1.70s/it, loss=0.204, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000793, train/loss_step=0.215, global_step=1015.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  37%|███▋      | 441/1208 [12:30<21:45,  1.70s/it, loss=0.204, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000793, train/loss_step=0.215, global_step=1015.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  37%|███▋      | 441/1208 [12:30<21:45,  1.70s/it, loss=0.188, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000658, train/loss_step=0.192, global_step=1016.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  37%|███▋      | 442/1208 [12:31<21:42,  1.70s/it, loss=0.188, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000658, train/loss_step=0.192, global_step=1016.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  37%|███▋      | 442/1208 [12:31<21:42,  1.70s/it, loss=0.196, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000736, train/loss_step=0.203, global_step=1016.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  37%|███▋      | 443/1208 [12:32<21:40,  1.70s/it, loss=0.196, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000736, train/loss_step=0.203, global_step=1016.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  37%|███▋      | 443/1208 [12:32<21:40,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=2.21e-5, train/loss_step=0.00405, global_step=1016.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  37%|███▋      | 444/1208 [12:36<21:40,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=2.21e-5, train/loss_step=0.00405, global_step=1016.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  37%|███▋      | 444/1208 [12:36<21:40,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00613, train/loss_vlb_step=3.18e-5, train/loss_step=0.00613, global_step=1016.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  37%|███▋      | 445/1208 [12:37<21:38,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00613, train/loss_vlb_step=3.18e-5, train/loss_step=0.00613, global_step=1016.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  37%|███▋      | 445/1208 [12:37<21:38,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.000123, train/loss_step=0.0316, global_step=1017.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  37%|███▋      | 446/1208 [12:38<21:35,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.000123, train/loss_step=0.0316, global_step=1017.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  37%|███▋      | 446/1208 [12:38<21:35,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.572, train/loss_vlb_step=0.0146, train/loss_step=0.572, global_step=1017.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  37%|███▋      | 447/1208 [12:39<21:32,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.572, train/loss_vlb_step=0.0146, train/loss_step=0.572, global_step=1017.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  37%|███▋      | 447/1208 [12:39<21:32,  1.70s/it, loss=0.199, v_num=0, train/loss_simple_step=0.611, train/loss_vlb_step=0.0156, train/loss_step=0.611, global_step=1017.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  37%|███▋      | 448/1208 [12:42<21:33,  1.70s/it, loss=0.199, v_num=0, train/loss_simple_step=0.611, train/loss_vlb_step=0.0156, train/loss_step=0.611, global_step=1017.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  37%|███▋      | 448/1208 [12:42<21:33,  1.70s/it, loss=0.203, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=1017.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  37%|███▋      | 449/1208 [12:43<21:30,  1.70s/it, loss=0.203, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=1017.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  37%|███▋      | 449/1208 [12:43<21:30,  1.70s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.41e-5, train/loss_step=0.0235, global_step=1018.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  37%|███▋      | 450/1208 [12:44<21:27,  1.70s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.41e-5, train/loss_step=0.0235, global_step=1018.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  37%|███▋      | 450/1208 [12:44<21:27,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000338, train/loss_step=0.103, global_step=1018.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  37%|███▋      | 451/1208 [12:45<21:24,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000338, train/loss_step=0.103, global_step=1018.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  37%|███▋      | 451/1208 [12:45<21:24,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.01e-5, train/loss_step=0.0109, global_step=1018.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  37%|███▋      | 452/1208 [12:48<21:25,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.01e-5, train/loss_step=0.0109, global_step=1018.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  37%|███▋      | 452/1208 [12:48<21:25,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000143, train/loss_step=0.0374, global_step=1018.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  38%|███▊      | 453/1208 [12:49<21:23,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000143, train/loss_step=0.0374, global_step=1018.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  38%|███▊      | 453/1208 [12:49<21:23,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.25e-5, train/loss_step=0.0118, global_step=1019.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  38%|███▊      | 454/1208 [12:50<21:20,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.25e-5, train/loss_step=0.0118, global_step=1019.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  38%|███▊      | 454/1208 [12:50<21:20,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000244, train/loss_step=0.0732, global_step=1019.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  38%|███▊      | 455/1208 [12:51<21:17,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000244, train/loss_step=0.0732, global_step=1019.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  38%|███▊      | 455/1208 [12:51<21:17,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00467, train/loss_vlb_step=2.49e-5, train/loss_step=0.00467, global_step=1019.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  38%|███▊      | 456/1208 [12:55<21:18,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00467, train/loss_vlb_step=2.49e-5, train/loss_step=0.00467, global_step=1019.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  38%|███▊      | 456/1208 [12:55<21:18,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.557, train/loss_vlb_step=0.0109, train/loss_step=0.557, global_step=1019.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]     Epoch 3:  38%|███▊      | 457/1208 [12:56<21:15,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.557, train/loss_vlb_step=0.0109, train/loss_step=0.557, global_step=1019.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  38%|███▊      | 457/1208 [12:56<21:15,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000405, train/loss_step=0.123, global_step=1020.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  38%|███▊      | 458/1208 [12:57<21:12,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000405, train/loss_step=0.123, global_step=1020.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  38%|███▊      | 458/1208 [12:57<21:12,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00959, train/loss_vlb_step=4.5e-5, train/loss_step=0.00959, global_step=1020.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  38%|███▊      | 459/1208 [12:58<21:10,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00959, train/loss_vlb_step=4.5e-5, train/loss_step=0.00959, global_step=1020.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  38%|███▊      | 459/1208 [12:58<21:10,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.504, train/loss_vlb_step=0.00698, train/loss_step=0.504, global_step=1020.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  38%|███▊      | 460/1208 [13:01<21:10,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.504, train/loss_vlb_step=0.00698, train/loss_step=0.504, global_step=1020.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  38%|███▊      | 460/1208 [13:01<21:10,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.54e-5, train/loss_step=0.00261, global_step=1020.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  38%|███▊      | 461/1208 [13:02<21:08,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.54e-5, train/loss_step=0.00261, global_step=1020.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  38%|███▊      | 461/1208 [13:02<21:08,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.97e-5, train/loss_step=0.0106, global_step=1021.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  38%|███▊      | 462/1208 [13:03<21:05,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.97e-5, train/loss_step=0.0106, global_step=1021.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  38%|███▊      | 462/1208 [13:03<21:05,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000658, train/loss_step=0.188, global_step=1021.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  38%|███▊      | 463/1208 [13:04<21:02,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000658, train/loss_step=0.188, global_step=1021.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  38%|███▊      | 463/1208 [13:04<21:02,  1.69s/it, loss=0.164, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00143, train/loss_step=0.292, global_step=1021.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  38%|███▊      | 464/1208 [13:07<21:03,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00143, train/loss_step=0.292, global_step=1021.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  38%|███▊      | 464/1208 [13:07<21:03,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.429, train/loss_vlb_step=0.00376, train/loss_step=0.429, global_step=1021.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  38%|███▊      | 465/1208 [13:09<21:00,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.429, train/loss_vlb_step=0.00376, train/loss_step=0.429, global_step=1021.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  38%|███▊      | 465/1208 [13:09<21:00,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00543, train/loss_vlb_step=2.77e-5, train/loss_step=0.00543, global_step=1022.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  39%|███▊      | 466/1208 [13:10<20:58,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00543, train/loss_vlb_step=2.77e-5, train/loss_step=0.00543, global_step=1022.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  39%|███▊      | 466/1208 [13:10<20:58,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000153, train/loss_step=0.0416, global_step=1022.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  39%|███▊      | 467/1208 [13:11<20:55,  1.69s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000153, train/loss_step=0.0416, global_step=1022.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  39%|███▊      | 467/1208 [13:11<20:55,  1.69s/it, loss=0.148, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.0035, train/loss_step=0.418, global_step=1022.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  39%|███▊      | 468/1208 [13:14<20:56,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.0035, train/loss_step=0.418, global_step=1022.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  39%|███▊      | 468/1208 [13:14<20:56,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00194, train/loss_step=0.341, global_step=1022.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  39%|███▉      | 469/1208 [13:15<20:53,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00194, train/loss_step=0.341, global_step=1022.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  39%|███▉      | 469/1208 [13:15<20:53,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.84e-5, train/loss_step=0.0103, global_step=1023.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  39%|███▉      | 470/1208 [13:16<20:50,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.84e-5, train/loss_step=0.0103, global_step=1023.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  39%|███▉      | 470/1208 [13:16<20:50,  1.69s/it, loss=0.165, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000913, train/loss_step=0.229, global_step=1023.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  39%|███▉      | 471/1208 [13:17<20:47,  1.69s/it, loss=0.165, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000913, train/loss_step=0.229, global_step=1023.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  39%|███▉      | 471/1208 [13:17<20:47,  1.69s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=6.03e-5, train/loss_step=0.0132, global_step=1023.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  39%|███▉      | 472/1208 [13:20<20:48,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=6.03e-5, train/loss_step=0.0132, global_step=1023.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  39%|███▉      | 472/1208 [13:20<20:48,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0534, train/loss_vlb_step=0.000187, train/loss_step=0.0534, global_step=1023.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  39%|███▉      | 473/1208 [13:21<20:45,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0534, train/loss_vlb_step=0.000187, train/loss_step=0.0534, global_step=1023.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  39%|███▉      | 473/1208 [13:21<20:45,  1.70s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0758, train/loss_vlb_step=0.000259, train/loss_step=0.0758, global_step=1024.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  39%|███▉      | 474/1208 [13:22<20:43,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0758, train/loss_vlb_step=0.000259, train/loss_step=0.0758, global_step=1024.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  39%|███▉      | 474/1208 [13:22<20:43,  1.69s/it, loss=0.2, v_num=0, train/loss_simple_step=0.687, train/loss_vlb_step=0.0168, train/loss_step=0.687, global_step=1024.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]      Epoch 3:  39%|███▉      | 475/1208 [13:23<20:40,  1.69s/it, loss=0.2, v_num=0, train/loss_simple_step=0.687, train/loss_vlb_step=0.0168, train/loss_step=0.687, global_step=1024.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  39%|███▉      | 475/1208 [13:23<20:40,  1.69s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000117, train/loss_step=0.0311, global_step=1024.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  39%|███▉      | 476/1208 [13:27<20:41,  1.70s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000117, train/loss_step=0.0311, global_step=1024.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  39%|███▉      | 476/1208 [13:27<20:41,  1.70s/it, loss=0.18, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000427, train/loss_step=0.129, global_step=1024.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  39%|███▉      | 477/1208 [13:28<20:38,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000427, train/loss_step=0.129, global_step=1024.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  39%|███▉      | 477/1208 [13:28<20:38,  1.69s/it, loss=0.185, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000821, train/loss_step=0.224, global_step=1025.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  40%|███▉      | 478/1208 [13:29<20:35,  1.69s/it, loss=0.185, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000821, train/loss_step=0.224, global_step=1025.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  40%|███▉      | 478/1208 [13:29<20:35,  1.69s/it, loss=0.19, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000347, train/loss_step=0.106, global_step=1025.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  40%|███▉      | 479/1208 [13:30<20:33,  1.69s/it, loss=0.19, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000347, train/loss_step=0.106, global_step=1025.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  40%|███▉      | 479/1208 [13:30<20:33,  1.69s/it, loss=0.175, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000842, train/loss_step=0.221, global_step=1025.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  40%|███▉      | 480/1208 [13:33<20:33,  1.69s/it, loss=0.175, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000842, train/loss_step=0.221, global_step=1025.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  40%|███▉      | 480/1208 [13:33<20:33,  1.69s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00893, train/loss_vlb_step=4.33e-5, train/loss_step=0.00893, global_step=1025.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  40%|███▉      | 481/1208 [13:34<20:31,  1.69s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00893, train/loss_vlb_step=4.33e-5, train/loss_step=0.00893, global_step=1025.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  40%|███▉      | 481/1208 [13:34<20:31,  1.69s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0713, train/loss_vlb_step=0.000243, train/loss_step=0.0713, global_step=1026.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  40%|███▉      | 482/1208 [13:35<20:28,  1.69s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0713, train/loss_vlb_step=0.000243, train/loss_step=0.0713, global_step=1026.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  40%|███▉      | 482/1208 [13:35<20:28,  1.69s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=2.28e-5, train/loss_step=0.00407, global_step=1026.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  40%|███▉      | 483/1208 [13:36<20:25,  1.69s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=2.28e-5, train/loss_step=0.00407, global_step=1026.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  40%|███▉      | 483/1208 [13:36<20:25,  1.69s/it, loss=0.162, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000491, train/loss_step=0.149, global_step=1026.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  40%|████      | 484/1208 [13:39<20:26,  1.69s/it, loss=0.162, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000491, train/loss_step=0.149, global_step=1026.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  40%|████      | 484/1208 [13:39<20:26,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0451, train/loss_vlb_step=0.000163, train/loss_step=0.0451, global_step=1026.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  40%|████      | 485/1208 [13:40<20:23,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0451, train/loss_vlb_step=0.000163, train/loss_step=0.0451, global_step=1026.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  40%|████      | 485/1208 [13:40<20:23,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000654, train/loss_step=0.177, global_step=1027.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  40%|████      | 486/1208 [13:42<20:21,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000654, train/loss_step=0.177, global_step=1027.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  40%|████      | 486/1208 [13:42<20:21,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.00015, train/loss_step=0.0405, global_step=1027.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  40%|████      | 487/1208 [13:43<20:18,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.00015, train/loss_step=0.0405, global_step=1027.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  40%|████      | 487/1208 [13:43<20:18,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0074, train/loss_vlb_step=3.69e-5, train/loss_step=0.0074, global_step=1027.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  40%|████      | 488/1208 [13:46<20:19,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0074, train/loss_vlb_step=3.69e-5, train/loss_step=0.0074, global_step=1027.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  40%|████      | 488/1208 [13:46<20:19,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00129, train/loss_step=0.245, global_step=1027.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  40%|████      | 489/1208 [13:47<20:16,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00129, train/loss_step=0.245, global_step=1027.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  40%|████      | 489/1208 [13:47<20:16,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0452, train/loss_vlb_step=0.000166, train/loss_step=0.0452, global_step=1028.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  41%|████      | 490/1208 [13:48<20:13,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0452, train/loss_vlb_step=0.000166, train/loss_step=0.0452, global_step=1028.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  41%|████      | 490/1208 [13:48<20:13,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00245, train/loss_step=0.373, global_step=1028.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  41%|████      | 491/1208 [13:49<20:11,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00245, train/loss_step=0.373, global_step=1028.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  41%|████      | 491/1208 [13:49<20:11,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.000147, train/loss_step=0.0413, global_step=1028.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  41%|████      | 492/1208 [13:52<20:11,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.000147, train/loss_step=0.0413, global_step=1028.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  41%|████      | 492/1208 [13:52<20:11,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=2.03e-5, train/loss_step=0.00368, global_step=1028.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  41%|████      | 493/1208 [13:53<20:09,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=2.03e-5, train/loss_step=0.00368, global_step=1028.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  41%|████      | 493/1208 [13:53<20:09,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00798, train/loss_vlb_step=3.89e-5, train/loss_step=0.00798, global_step=1029.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  41%|████      | 494/1208 [13:54<20:06,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00798, train/loss_vlb_step=3.89e-5, train/loss_step=0.00798, global_step=1029.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  41%|████      | 494/1208 [13:54<20:06,  1.69s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.00383, train/loss_vlb_step=2.13e-5, train/loss_step=0.00383, global_step=1029.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  41%|████      | 495/1208 [13:55<20:04,  1.69s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.00383, train/loss_vlb_step=2.13e-5, train/loss_step=0.00383, global_step=1029.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  41%|████      | 495/1208 [13:55<20:04,  1.69s/it, loss=0.116, v_num=0, train/loss_simple_step=0.421, train/loss_vlb_step=0.00328, train/loss_step=0.421, global_step=1029.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]     Epoch 3:  41%|████      | 496/1208 [13:59<20:04,  1.69s/it, loss=0.116, v_num=0, train/loss_simple_step=0.421, train/loss_vlb_step=0.00328, train/loss_step=0.421, global_step=1029.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  41%|████      | 496/1208 [13:59<20:04,  1.69s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0808, train/loss_vlb_step=0.000271, train/loss_step=0.0808, global_step=1029.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  41%|████      | 497/1208 [14:00<20:01,  1.69s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0808, train/loss_vlb_step=0.000271, train/loss_step=0.0808, global_step=1029.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  41%|████      | 497/1208 [14:00<20:01,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.13e-5, train/loss_step=0.011, global_step=1030.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  41%|████      | 498/1208 [14:01<19:59,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.13e-5, train/loss_step=0.011, global_step=1030.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  41%|████      | 498/1208 [14:01<19:59,  1.69s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.00011, train/loss_step=0.0275, global_step=1030.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  41%|████▏     | 499/1208 [14:02<19:56,  1.69s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.00011, train/loss_step=0.0275, global_step=1030.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  41%|████▏     | 499/1208 [14:02<19:56,  1.69s/it, loss=0.0886, v_num=0, train/loss_simple_step=0.00865, train/loss_vlb_step=4.2e-5, train/loss_step=0.00865, global_step=1030.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  41%|████▏     | 500/1208 [14:05<19:57,  1.69s/it, loss=0.0886, v_num=0, train/loss_simple_step=0.00865, train/loss_vlb_step=4.2e-5, train/loss_step=0.00865, global_step=1030.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  41%|████▏     | 500/1208 [14:05<19:57,  1.69s/it, loss=0.092, v_num=0, train/loss_simple_step=0.077, train/loss_vlb_step=0.000257, train/loss_step=0.077, global_step=1030.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  41%|████▏     | 501/1208 [14:06<19:54,  1.69s/it, loss=0.092, v_num=0, train/loss_simple_step=0.077, train/loss_vlb_step=0.000257, train/loss_step=0.077, global_step=1030.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  41%|████▏     | 501/1208 [14:06<19:54,  1.69s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000414, train/loss_step=0.126, global_step=1031.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  42%|████▏     | 502/1208 [14:07<19:52,  1.69s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000414, train/loss_step=0.126, global_step=1031.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  42%|████▏     | 502/1208 [14:07<19:52,  1.69s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.00646, train/loss_vlb_step=3.38e-5, train/loss_step=0.00646, global_step=1031.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  42%|████▏     | 503/1208 [14:08<19:49,  1.69s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.00646, train/loss_vlb_step=3.38e-5, train/loss_step=0.00646, global_step=1031.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  42%|████▏     | 503/1208 [14:08<19:49,  1.69s/it, loss=0.0898, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000163, train/loss_step=0.0474, global_step=1031.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  42%|████▏     | 504/1208 [14:11<19:49,  1.69s/it, loss=0.0898, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000163, train/loss_step=0.0474, global_step=1031.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  42%|████▏     | 504/1208 [14:11<19:49,  1.69s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=1.36e-5, train/loss_step=0.00229, global_step=1031.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  42%|████▏     | 505/1208 [14:12<19:47,  1.69s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=1.36e-5, train/loss_step=0.00229, global_step=1031.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  42%|████▏     | 505/1208 [14:12<19:47,  1.69s/it, loss=0.08, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.19e-5, train/loss_step=0.0236, global_step=1032.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  42%|████▏     | 506/1208 [14:14<19:44,  1.69s/it, loss=0.08, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.19e-5, train/loss_step=0.0236, global_step=1032.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  42%|████▏     | 506/1208 [14:14<19:44,  1.69s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00281, train/loss_step=0.411, global_step=1032.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  42%|████▏     | 507/1208 [14:15<19:42,  1.69s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00281, train/loss_step=0.411, global_step=1032.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  42%|████▏     | 507/1208 [14:15<19:42,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.533, train/loss_vlb_step=0.00589, train/loss_step=0.533, global_step=1032.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  42%|████▏     | 508/1208 [14:18<19:42,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.533, train/loss_vlb_step=0.00589, train/loss_step=0.533, global_step=1032.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  42%|████▏     | 508/1208 [14:18<19:42,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000752, train/loss_step=0.200, global_step=1032.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  42%|████▏     | 509/1208 [14:19<19:40,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000752, train/loss_step=0.200, global_step=1032.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  42%|████▏     | 509/1208 [14:19<19:40,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000902, train/loss_step=0.225, global_step=1033.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  42%|████▏     | 510/1208 [14:20<19:37,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000902, train/loss_step=0.225, global_step=1033.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  42%|████▏     | 510/1208 [14:20<19:37,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0383, train/loss_vlb_step=0.000146, train/loss_step=0.0383, global_step=1033.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  42%|████▏     | 511/1208 [14:21<19:35,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0383, train/loss_vlb_step=0.000146, train/loss_step=0.0383, global_step=1033.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  42%|████▏     | 511/1208 [14:21<19:35,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00506, train/loss_vlb_step=2.61e-5, train/loss_step=0.00506, global_step=1033.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  42%|████▏     | 512/1208 [14:24<19:35,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00506, train/loss_vlb_step=2.61e-5, train/loss_step=0.00506, global_step=1033.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  42%|████▏     | 512/1208 [14:24<19:35,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.625, train/loss_vlb_step=0.0167, train/loss_step=0.625, global_step=1033.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]     Epoch 3:  42%|████▏     | 513/1208 [14:25<19:32,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.625, train/loss_vlb_step=0.0167, train/loss_step=0.625, global_step=1033.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  42%|████▏     | 513/1208 [14:25<19:32,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=1.1e-5, train/loss_step=0.00181, global_step=1034.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  43%|████▎     | 514/1208 [14:26<19:30,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=1.1e-5, train/loss_step=0.00181, global_step=1034.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  43%|████▎     | 514/1208 [14:26<19:30,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000677, train/loss_step=0.193, global_step=1034.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  43%|████▎     | 515/1208 [14:27<19:27,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000677, train/loss_step=0.193, global_step=1034.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  43%|████▎     | 515/1208 [14:27<19:27,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00318, train/loss_vlb_step=1.75e-5, train/loss_step=0.00318, global_step=1034.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  43%|████▎     | 516/1208 [14:30<19:27,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00318, train/loss_vlb_step=1.75e-5, train/loss_step=0.00318, global_step=1034.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  43%|████▎     | 516/1208 [14:30<19:27,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.16e-5, train/loss_step=0.0163, global_step=1034.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  43%|████▎     | 517/1208 [14:31<19:25,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.16e-5, train/loss_step=0.0163, global_step=1034.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  43%|████▎     | 517/1208 [14:31<19:25,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0848, train/loss_vlb_step=0.000281, train/loss_step=0.0848, global_step=1035.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  43%|████▎     | 518/1208 [14:32<19:22,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0848, train/loss_vlb_step=0.000281, train/loss_step=0.0848, global_step=1035.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  43%|████▎     | 518/1208 [14:32<19:22,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.66e-5, train/loss_step=0.0177, global_step=1035.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  43%|████▎     | 519/1208 [14:33<19:20,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.66e-5, train/loss_step=0.0177, global_step=1035.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  43%|████▎     | 519/1208 [14:33<19:20,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0436, train/loss_vlb_step=0.000162, train/loss_step=0.0436, global_step=1035.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  43%|████▎     | 520/1208 [14:36<19:20,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0436, train/loss_vlb_step=0.000162, train/loss_step=0.0436, global_step=1035.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  43%|████▎     | 520/1208 [14:36<19:20,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.07e-5, train/loss_step=0.0198, global_step=1035.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  43%|████▎     | 521/1208 [14:37<19:17,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.07e-5, train/loss_step=0.0198, global_step=1035.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  43%|████▎     | 521/1208 [14:37<19:17,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=1036.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  43%|████▎     | 522/1208 [14:38<19:14,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=1036.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  43%|████▎     | 522/1208 [14:38<19:14,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00914, train/loss_vlb_step=4.47e-5, train/loss_step=0.00914, global_step=1036.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  43%|████▎     | 523/1208 [14:39<19:12,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00914, train/loss_vlb_step=4.47e-5, train/loss_step=0.00914, global_step=1036.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  43%|████▎     | 523/1208 [14:39<19:12,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.18e-5, train/loss_step=0.00409, global_step=1036.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  43%|████▎     | 524/1208 [14:42<19:12,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.18e-5, train/loss_step=0.00409, global_step=1036.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  43%|████▎     | 524/1208 [14:42<19:12,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0477, train/loss_vlb_step=0.000175, train/loss_step=0.0477, global_step=1036.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  43%|████▎     | 525/1208 [14:43<19:09,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0477, train/loss_vlb_step=0.000175, train/loss_step=0.0477, global_step=1036.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  43%|████▎     | 525/1208 [14:43<19:09,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.594, train/loss_vlb_step=0.00804, train/loss_step=0.594, global_step=1037.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  44%|████▎     | 526/1208 [14:44<19:07,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.594, train/loss_vlb_step=0.00804, train/loss_step=0.594, global_step=1037.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  44%|████▎     | 526/1208 [14:44<19:07,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00246, train/loss_step=0.371, global_step=1037.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  44%|████▎     | 527/1208 [14:45<19:04,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00246, train/loss_step=0.371, global_step=1037.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  44%|████▎     | 527/1208 [14:45<19:04,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0451, train/loss_vlb_step=0.000163, train/loss_step=0.0451, global_step=1037.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  44%|████▎     | 528/1208 [14:48<19:04,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0451, train/loss_vlb_step=0.000163, train/loss_step=0.0451, global_step=1037.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  44%|████▎     | 528/1208 [14:48<19:04,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=3.09e-5, train/loss_step=0.00615, global_step=1037.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  44%|████▍     | 529/1208 [14:49<19:01,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=3.09e-5, train/loss_step=0.00615, global_step=1037.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  44%|████▍     | 529/1208 [14:49<19:01,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0398, train/loss_vlb_step=0.000148, train/loss_step=0.0398, global_step=1038.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  44%|████▍     | 530/1208 [14:50<18:59,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0398, train/loss_vlb_step=0.000148, train/loss_step=0.0398, global_step=1038.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  44%|████▍     | 530/1208 [14:50<18:59,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=2.74e-5, train/loss_step=0.00526, global_step=1038.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  44%|████▍     | 531/1208 [14:51<18:56,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=2.74e-5, train/loss_step=0.00526, global_step=1038.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  44%|████▍     | 531/1208 [14:51<18:56,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000181, train/loss_step=0.051, global_step=1038.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  44%|████▍     | 532/1208 [14:54<18:56,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000181, train/loss_step=0.051, global_step=1038.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  44%|████▍     | 532/1208 [14:54<18:56,  1.68s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.00634, train/loss_vlb_step=3.29e-5, train/loss_step=0.00634, global_step=1038.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  44%|████▍     | 533/1208 [14:55<18:54,  1.68s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.00634, train/loss_vlb_step=3.29e-5, train/loss_step=0.00634, global_step=1038.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  44%|████▍     | 533/1208 [14:55<18:54,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.638, train/loss_vlb_step=0.0162, train/loss_step=0.638, global_step=1039.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]      Epoch 3:  44%|████▍     | 534/1208 [14:56<18:51,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.638, train/loss_vlb_step=0.0162, train/loss_step=0.638, global_step=1039.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  44%|████▍     | 534/1208 [14:56<18:51,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000536, train/loss_step=0.159, global_step=1039.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  44%|████▍     | 535/1208 [14:57<18:49,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000536, train/loss_step=0.159, global_step=1039.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  44%|████▍     | 535/1208 [14:57<18:49,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.42e-5, train/loss_step=0.0169, global_step=1039.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  44%|████▍     | 536/1208 [15:00<18:48,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.42e-5, train/loss_step=0.0169, global_step=1039.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  44%|████▍     | 536/1208 [15:00<18:48,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.000129, train/loss_step=0.0352, global_step=1039.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  44%|████▍     | 537/1208 [15:01<18:46,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.000129, train/loss_step=0.0352, global_step=1039.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  44%|████▍     | 537/1208 [15:01<18:46,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00103, train/loss_step=0.248, global_step=1040.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  45%|████▍     | 538/1208 [15:02<18:43,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00103, train/loss_step=0.248, global_step=1040.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  45%|████▍     | 538/1208 [15:02<18:43,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00168, train/loss_step=0.323, global_step=1040.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  45%|████▍     | 539/1208 [15:03<18:41,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00168, train/loss_step=0.323, global_step=1040.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  45%|████▍     | 539/1208 [15:03<18:41,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00992, train/loss_vlb_step=4.59e-5, train/loss_step=0.00992, global_step=1040.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  45%|████▍     | 540/1208 [15:06<18:41,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00992, train/loss_vlb_step=4.59e-5, train/loss_step=0.00992, global_step=1040.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  45%|████▍     | 540/1208 [15:06<18:41,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.440, train/loss_vlb_step=0.00333, train/loss_step=0.440, global_step=1040.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  45%|████▍     | 541/1208 [15:07<18:38,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.440, train/loss_vlb_step=0.00333, train/loss_step=0.440, global_step=1040.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  45%|████▍     | 541/1208 [15:07<18:38,  1.68s/it, loss=0.155, v_num=0, train/loss_simple_step=0.058, train/loss_vlb_step=0.000202, train/loss_step=0.058, global_step=1041.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  45%|████▍     | 542/1208 [15:08<18:36,  1.68s/it, loss=0.155, v_num=0, train/loss_simple_step=0.058, train/loss_vlb_step=0.000202, train/loss_step=0.058, global_step=1041.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  45%|████▍     | 542/1208 [15:08<18:36,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.044, train/loss_vlb_step=0.00016, train/loss_step=0.044, global_step=1041.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  45%|████▍     | 543/1208 [15:09<18:33,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.044, train/loss_vlb_step=0.00016, train/loss_step=0.044, global_step=1041.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  45%|████▍     | 543/1208 [15:09<18:33,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.44e-5, train/loss_step=0.0147, global_step=1041.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  45%|████▌     | 544/1208 [15:12<18:33,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.44e-5, train/loss_step=0.0147, global_step=1041.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  45%|████▌     | 544/1208 [15:12<18:33,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0557, train/loss_vlb_step=0.000194, train/loss_step=0.0557, global_step=1041.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  45%|████▌     | 545/1208 [15:13<18:30,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0557, train/loss_vlb_step=0.000194, train/loss_step=0.0557, global_step=1041.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  45%|████▌     | 545/1208 [15:13<18:30,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.55e-5, train/loss_step=0.00267, global_step=1042.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  45%|████▌     | 546/1208 [15:14<18:28,  1.67s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.55e-5, train/loss_step=0.00267, global_step=1042.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  45%|████▌     | 546/1208 [15:14<18:28,  1.67s/it, loss=0.113, v_num=0, train/loss_simple_step=0.068, train/loss_vlb_step=0.000237, train/loss_step=0.068, global_step=1042.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  45%|████▌     | 547/1208 [15:15<18:26,  1.67s/it, loss=0.113, v_num=0, train/loss_simple_step=0.068, train/loss_vlb_step=0.000237, train/loss_step=0.068, global_step=1042.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  45%|████▌     | 547/1208 [15:15<18:26,  1.67s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000131, train/loss_step=0.0365, global_step=1042.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  45%|████▌     | 548/1208 [15:18<18:25,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000131, train/loss_step=0.0365, global_step=1042.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  45%|████▌     | 548/1208 [15:18<18:25,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0917, train/loss_vlb_step=0.000306, train/loss_step=0.0917, global_step=1042.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  45%|████▌     | 549/1208 [15:19<18:23,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0917, train/loss_vlb_step=0.000306, train/loss_step=0.0917, global_step=1042.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  45%|████▌     | 549/1208 [15:19<18:23,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00284, train/loss_step=0.368, global_step=1043.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  46%|████▌     | 550/1208 [15:20<18:20,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00284, train/loss_step=0.368, global_step=1043.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  46%|████▌     | 550/1208 [15:20<18:20,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00115, train/loss_step=0.265, global_step=1043.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  46%|████▌     | 551/1208 [15:21<18:18,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00115, train/loss_step=0.265, global_step=1043.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  46%|████▌     | 551/1208 [15:21<18:18,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.18e-5, train/loss_step=0.0111, global_step=1043.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  46%|████▌     | 552/1208 [15:24<18:18,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.18e-5, train/loss_step=0.0111, global_step=1043.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  46%|████▌     | 552/1208 [15:24<18:18,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00336, train/loss_step=0.423, global_step=1043.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  46%|████▌     | 553/1208 [15:25<18:15,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00336, train/loss_step=0.423, global_step=1043.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  46%|████▌     | 553/1208 [15:25<18:15,  1.67s/it, loss=0.148, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.0013, train/loss_step=0.281, global_step=1044.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  46%|████▌     | 554/1208 [15:26<18:13,  1.67s/it, loss=0.148, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.0013, train/loss_step=0.281, global_step=1044.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  46%|████▌     | 554/1208 [15:26<18:13,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0066, train/loss_vlb_step=3.12e-5, train/loss_step=0.0066, global_step=1044.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  46%|████▌     | 555/1208 [15:27<18:10,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0066, train/loss_vlb_step=3.12e-5, train/loss_step=0.0066, global_step=1044.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  46%|████▌     | 555/1208 [15:27<18:10,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.000144, train/loss_step=0.0362, global_step=1044.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  46%|████▌     | 556/1208 [15:30<18:10,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.000144, train/loss_step=0.0362, global_step=1044.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  46%|████▌     | 556/1208 [15:30<18:10,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00243, train/loss_step=0.355, global_step=1044.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  46%|████▌     | 557/1208 [15:31<18:08,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00243, train/loss_step=0.355, global_step=1044.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  46%|████▌     | 557/1208 [15:31<18:08,  1.67s/it, loss=0.167, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00422, train/loss_step=0.447, global_step=1045.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  46%|████▌     | 558/1208 [15:32<18:05,  1.67s/it, loss=0.167, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00422, train/loss_step=0.447, global_step=1045.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  46%|████▌     | 558/1208 [15:32<18:05,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0778, train/loss_vlb_step=0.00026, train/loss_step=0.0778, global_step=1045.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  46%|████▋     | 559/1208 [15:33<18:03,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0778, train/loss_vlb_step=0.00026, train/loss_step=0.0778, global_step=1045.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  46%|████▋     | 559/1208 [15:33<18:03,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.12e-5, train/loss_step=0.0196, global_step=1045.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  46%|████▋     | 560/1208 [15:35<18:03,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.12e-5, train/loss_step=0.0196, global_step=1045.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  46%|████▋     | 560/1208 [15:35<18:03,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.446, train/loss_vlb_step=0.00591, train/loss_step=0.446, global_step=1045.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  46%|████▋     | 561/1208 [15:36<18:00,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.446, train/loss_vlb_step=0.00591, train/loss_step=0.446, global_step=1045.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  46%|████▋     | 561/1208 [15:36<18:00,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0572, train/loss_vlb_step=0.000202, train/loss_step=0.0572, global_step=1046.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  47%|████▋     | 562/1208 [15:37<17:58,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0572, train/loss_vlb_step=0.000202, train/loss_step=0.0572, global_step=1046.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  47%|████▋     | 562/1208 [15:37<17:58,  1.67s/it, loss=0.16, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000444, train/loss_step=0.133, global_step=1046.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  47%|████▋     | 563/1208 [15:38<17:55,  1.67s/it, loss=0.16, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000444, train/loss_step=0.133, global_step=1046.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  47%|████▋     | 563/1208 [15:38<17:55,  1.67s/it, loss=0.172, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.000999, train/loss_step=0.259, global_step=1046.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  47%|████▋     | 564/1208 [15:41<17:55,  1.67s/it, loss=0.172, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.000999, train/loss_step=0.259, global_step=1046.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  47%|████▋     | 564/1208 [15:41<17:55,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00952, train/loss_vlb_step=4.32e-5, train/loss_step=0.00952, global_step=1046.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  47%|████▋     | 565/1208 [15:42<17:53,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00952, train/loss_vlb_step=4.32e-5, train/loss_step=0.00952, global_step=1046.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  47%|████▋     | 565/1208 [15:42<17:53,  1.67s/it, loss=0.186, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.0017, train/loss_step=0.325, global_step=1047.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  47%|████▋     | 566/1208 [15:43<17:50,  1.67s/it, loss=0.186, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.0017, train/loss_step=0.325, global_step=1047.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  47%|████▋     | 566/1208 [15:43<17:50,  1.67s/it, loss=0.195, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000964, train/loss_step=0.244, global_step=1047.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  47%|████▋     | 567/1208 [15:44<17:48,  1.67s/it, loss=0.195, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000964, train/loss_step=0.244, global_step=1047.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  47%|████▋     | 567/1208 [15:44<17:48,  1.67s/it, loss=0.213, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00314, train/loss_step=0.403, global_step=1047.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  47%|████▋     | 568/1208 [15:47<17:47,  1.67s/it, loss=0.213, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00314, train/loss_step=0.403, global_step=1047.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  47%|████▋     | 568/1208 [15:47<17:47,  1.67s/it, loss=0.209, v_num=0, train/loss_simple_step=0.00621, train/loss_vlb_step=3.07e-5, train/loss_step=0.00621, global_step=1047.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  47%|████▋     | 569/1208 [15:48<17:45,  1.67s/it, loss=0.209, v_num=0, train/loss_simple_step=0.00621, train/loss_vlb_step=3.07e-5, train/loss_step=0.00621, global_step=1047.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  47%|████▋     | 569/1208 [15:48<17:45,  1.67s/it, loss=0.191, v_num=0, train/loss_simple_step=0.00618, train/loss_vlb_step=3.16e-5, train/loss_step=0.00618, global_step=1048.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  47%|████▋     | 570/1208 [15:49<17:43,  1.67s/it, loss=0.191, v_num=0, train/loss_simple_step=0.00618, train/loss_vlb_step=3.16e-5, train/loss_step=0.00618, global_step=1048.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  47%|████▋     | 570/1208 [15:49<17:43,  1.67s/it, loss=0.188, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000806, train/loss_step=0.219, global_step=1048.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  47%|████▋     | 571/1208 [15:50<17:40,  1.67s/it, loss=0.188, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000806, train/loss_step=0.219, global_step=1048.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  47%|████▋     | 571/1208 [15:50<17:40,  1.67s/it, loss=0.189, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=0.000103, train/loss_step=0.025, global_step=1048.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  47%|████▋     | 572/1208 [15:53<17:40,  1.67s/it, loss=0.189, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=0.000103, train/loss_step=0.025, global_step=1048.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  47%|████▋     | 572/1208 [15:53<17:40,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000466, train/loss_step=0.141, global_step=1048.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  47%|████▋     | 573/1208 [15:54<17:38,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000466, train/loss_step=0.141, global_step=1048.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  47%|████▋     | 573/1208 [15:54<17:38,  1.67s/it, loss=0.181, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.00295, train/loss_step=0.400, global_step=1049.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  48%|████▊     | 574/1208 [15:55<17:35,  1.67s/it, loss=0.181, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.00295, train/loss_step=0.400, global_step=1049.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  48%|████▊     | 574/1208 [15:55<17:35,  1.67s/it, loss=0.187, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000409, train/loss_step=0.125, global_step=1049.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  48%|████▊     | 575/1208 [15:56<17:33,  1.66s/it, loss=0.187, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000409, train/loss_step=0.125, global_step=1049.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  48%|████▊     | 575/1208 [15:56<17:33,  1.66s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0315, train/loss_vlb_step=0.00012, train/loss_step=0.0315, global_step=1049.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  48%|████▊     | 576/1208 [16:00<17:33,  1.67s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0315, train/loss_vlb_step=0.00012, train/loss_step=0.0315, global_step=1049.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  48%|████▊     | 576/1208 [16:00<17:33,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.26e-5, train/loss_step=0.0171, global_step=1049.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  48%|████▊     | 577/1208 [16:01<17:31,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.26e-5, train/loss_step=0.0171, global_step=1049.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  48%|████▊     | 577/1208 [16:01<17:31,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000118, train/loss_step=0.0298, global_step=1050.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  48%|████▊     | 578/1208 [16:02<17:28,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000118, train/loss_step=0.0298, global_step=1050.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  48%|████▊     | 578/1208 [16:02<17:28,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=6.05e-5, train/loss_step=0.0133, global_step=1050.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  48%|████▊     | 579/1208 [16:03<17:26,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=6.05e-5, train/loss_step=0.0133, global_step=1050.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  48%|████▊     | 579/1208 [16:03<17:26,  1.66s/it, loss=0.152, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000456, train/loss_step=0.139, global_step=1050.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  48%|████▊     | 580/1208 [16:06<17:26,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000456, train/loss_step=0.139, global_step=1050.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  48%|████▊     | 580/1208 [16:06<17:26,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.15e-5, train/loss_step=0.0134, global_step=1050.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  48%|████▊     | 581/1208 [16:07<17:24,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.15e-5, train/loss_step=0.0134, global_step=1050.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  48%|████▊     | 581/1208 [16:07<17:24,  1.67s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.52e-5, train/loss_step=0.0121, global_step=1051.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  48%|████▊     | 582/1208 [16:08<17:21,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.52e-5, train/loss_step=0.0121, global_step=1051.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  48%|████▊     | 582/1208 [16:08<17:21,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000114, train/loss_step=0.029, global_step=1051.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  48%|████▊     | 583/1208 [16:09<17:19,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000114, train/loss_step=0.029, global_step=1051.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  48%|████▊     | 583/1208 [16:09<17:19,  1.66s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00727, train/loss_vlb_step=3.68e-5, train/loss_step=0.00727, global_step=1051.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  48%|████▊     | 584/1208 [16:13<17:19,  1.67s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00727, train/loss_vlb_step=3.68e-5, train/loss_step=0.00727, global_step=1051.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  48%|████▊     | 584/1208 [16:13<17:19,  1.67s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00482, train/loss_vlb_step=2.54e-5, train/loss_step=0.00482, global_step=1051.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  48%|████▊     | 585/1208 [16:14<17:17,  1.67s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00482, train/loss_vlb_step=2.54e-5, train/loss_step=0.00482, global_step=1051.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  48%|████▊     | 585/1208 [16:14<17:17,  1.67s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.00432, train/loss_vlb_step=2.38e-5, train/loss_step=0.00432, global_step=1052.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  49%|████▊     | 586/1208 [16:15<17:15,  1.66s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.00432, train/loss_vlb_step=2.38e-5, train/loss_step=0.00432, global_step=1052.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  49%|████▊     | 586/1208 [16:15<17:15,  1.66s/it, loss=0.0819, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.1e-5, train/loss_step=0.0112, global_step=1052.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  49%|████▊     | 587/1208 [16:16<17:12,  1.66s/it, loss=0.0819, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.1e-5, train/loss_step=0.0112, global_step=1052.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  49%|████▊     | 587/1208 [16:16<17:12,  1.66s/it, loss=0.0638, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000151, train/loss_step=0.0406, global_step=1052.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  49%|████▊     | 588/1208 [16:19<17:12,  1.67s/it, loss=0.0638, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000151, train/loss_step=0.0406, global_step=1052.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  49%|████▊     | 588/1208 [16:19<17:12,  1.67s/it, loss=0.0781, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00134, train/loss_step=0.292, global_step=1052.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  49%|████▉     | 589/1208 [16:20<17:10,  1.66s/it, loss=0.0781, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00134, train/loss_step=0.292, global_step=1052.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  49%|████▉     | 589/1208 [16:20<17:10,  1.66s/it, loss=0.0844, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000436, train/loss_step=0.133, global_step=1053.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  49%|████▉     | 590/1208 [16:21<17:08,  1.66s/it, loss=0.0844, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000436, train/loss_step=0.133, global_step=1053.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  49%|████▉     | 590/1208 [16:21<17:08,  1.66s/it, loss=0.074, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.23e-5, train/loss_step=0.0113, global_step=1053.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  49%|████▉     | 591/1208 [16:22<17:05,  1.66s/it, loss=0.074, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.23e-5, train/loss_step=0.0113, global_step=1053.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  49%|████▉     | 591/1208 [16:22<17:05,  1.66s/it, loss=0.0729, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.98e-5, train/loss_step=0.00344, global_step=1053.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  49%|████▉     | 592/1208 [16:25<17:05,  1.67s/it, loss=0.0729, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.98e-5, train/loss_step=0.00344, global_step=1053.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  49%|████▉     | 592/1208 [16:25<17:05,  1.67s/it, loss=0.0808, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.0013, train/loss_step=0.299, global_step=1053.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]     Epoch 3:  49%|████▉     | 593/1208 [16:26<17:03,  1.66s/it, loss=0.0808, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.0013, train/loss_step=0.299, global_step=1053.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  49%|████▉     | 593/1208 [16:26<17:03,  1.66s/it, loss=0.0751, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00135, train/loss_step=0.286, global_step=1054.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  49%|████▉     | 594/1208 [16:27<17:01,  1.66s/it, loss=0.0751, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00135, train/loss_step=0.286, global_step=1054.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  49%|████▉     | 594/1208 [16:27<17:01,  1.66s/it, loss=0.0694, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.14e-5, train/loss_step=0.0113, global_step=1054.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  49%|████▉     | 595/1208 [16:28<16:58,  1.66s/it, loss=0.0694, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.14e-5, train/loss_step=0.0113, global_step=1054.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  49%|████▉     | 595/1208 [16:28<16:58,  1.66s/it, loss=0.0689, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=9.02e-5, train/loss_step=0.0217, global_step=1054.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  49%|████▉     | 596/1208 [16:32<16:58,  1.66s/it, loss=0.0689, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=9.02e-5, train/loss_step=0.0217, global_step=1054.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  49%|████▉     | 596/1208 [16:32<16:58,  1.66s/it, loss=0.0682, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.13e-5, train/loss_step=0.00186, global_step=1054.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  49%|████▉     | 597/1208 [16:33<16:56,  1.66s/it, loss=0.0682, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.13e-5, train/loss_step=0.00186, global_step=1054.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  49%|████▉     | 597/1208 [16:33<16:56,  1.66s/it, loss=0.0668, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.83e-5, train/loss_step=0.0033, global_step=1055.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  50%|████▉     | 598/1208 [16:34<16:54,  1.66s/it, loss=0.0668, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.83e-5, train/loss_step=0.0033, global_step=1055.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  50%|████▉     | 598/1208 [16:34<16:54,  1.66s/it, loss=0.0881, v_num=0, train/loss_simple_step=0.438, train/loss_vlb_step=0.00295, train/loss_step=0.438, global_step=1055.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  50%|████▉     | 599/1208 [16:35<16:51,  1.66s/it, loss=0.0881, v_num=0, train/loss_simple_step=0.438, train/loss_vlb_step=0.00295, train/loss_step=0.438, global_step=1055.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  50%|████▉     | 599/1208 [16:35<16:51,  1.66s/it, loss=0.0907, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000676, train/loss_step=0.191, global_step=1055.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  50%|████▉     | 600/1208 [16:38<16:51,  1.66s/it, loss=0.0907, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000676, train/loss_step=0.191, global_step=1055.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  50%|████▉     | 600/1208 [16:38<16:51,  1.66s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.0427, train/loss_vlb_step=0.000153, train/loss_step=0.0427, global_step=1055.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.76it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.75it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.77it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.79it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.84it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.84it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.84it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.84it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.84it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.84it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.84it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.84it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.84it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:18,  1.84it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:18,  1.84it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.85it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.84it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.84it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.84it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.85it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.84it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.84it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.84it/s][ADDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.84it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.83it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.84it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.84it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.83it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.84it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.84it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.84it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.84it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.84it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.83it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.83it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.84it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.84it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.84it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.84it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.84it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.84it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.79it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.83it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.83it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.83it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.83it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.83it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.83it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.83it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.83it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.83it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.83it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.84it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.83it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.84it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.83it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.84it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.83it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.84it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.83it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.84it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.83it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.84it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.83it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.84it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.83it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.84it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.83it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.84it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.84it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.83it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]Epoch 3:  50%|████▉     | 601/1208 [17:08<17:18,  1.71s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.0427, train/loss_vlb_step=0.000153, train/loss_step=0.0427, global_step=1055.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  50%|████▉     | 601/1208 [17:08<17:18,  1.71s/it, loss=0.0917, v_num=0, train/loss_simple_step=0.00386, train/loss_vlb_step=2.09e-5, train/loss_step=0.00386, global_step=1056.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  50%|████▉     | 602/1208 [17:09<17:15,  1.71s/it, loss=0.0917, v_num=0, train/loss_simple_step=0.00386, train/loss_vlb_step=2.09e-5, train/loss_step=0.00386, global_step=1056.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  50%|████▉     | 602/1208 [17:09<17:15,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.001, train/loss_step=0.253, global_step=1056.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]       Epoch 3:  50%|████▉     | 603/1208 [17:10<17:13,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.001, train/loss_step=0.253, global_step=1056.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  50%|████▉     | 603/1208 [17:10<17:13,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00497, train/loss_vlb_step=2.53e-5, train/loss_step=0.00497, global_step=1056.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  50%|█████     | 604/1208 [17:13<17:13,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00497, train/loss_vlb_step=2.53e-5, train/loss_step=0.00497, global_step=1056.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  50%|█████     | 604/1208 [17:13<17:13,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000449, train/loss_step=0.135, global_step=1056.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  50%|█████     | 605/1208 [17:14<17:10,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000449, train/loss_step=0.135, global_step=1056.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  50%|█████     | 605/1208 [17:14<17:10,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00581, train/loss_vlb_step=3.04e-5, train/loss_step=0.00581, global_step=1057.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  50%|█████     | 606/1208 [17:15<17:08,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00581, train/loss_vlb_step=3.04e-5, train/loss_step=0.00581, global_step=1057.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  50%|█████     | 606/1208 [17:15<17:08,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000897, train/loss_step=0.223, global_step=1057.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  50%|█████     | 607/1208 [17:16<17:05,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000897, train/loss_step=0.223, global_step=1057.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  50%|█████     | 607/1208 [17:16<17:05,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.63e-5, train/loss_step=0.0176, global_step=1057.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  50%|█████     | 608/1208 [17:19<17:05,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.63e-5, train/loss_step=0.0176, global_step=1057.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  50%|█████     | 608/1208 [17:19<17:05,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.075, train/loss_vlb_step=0.000254, train/loss_step=0.075, global_step=1057.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  50%|█████     | 609/1208 [17:20<17:03,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.075, train/loss_vlb_step=0.000254, train/loss_step=0.075, global_step=1057.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  50%|█████     | 609/1208 [17:20<17:03,  1.71s/it, loss=0.11, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000568, train/loss_step=0.166, global_step=1058.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  50%|█████     | 610/1208 [17:21<17:00,  1.71s/it, loss=0.11, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000568, train/loss_step=0.166, global_step=1058.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  50%|█████     | 610/1208 [17:21<17:00,  1.71s/it, loss=0.111, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000151, train/loss_step=0.042, global_step=1058.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  51%|█████     | 611/1208 [17:22<16:58,  1.71s/it, loss=0.111, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000151, train/loss_step=0.042, global_step=1058.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  51%|█████     | 611/1208 [17:22<16:58,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000449, train/loss_step=0.135, global_step=1058.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  51%|█████     | 612/1208 [17:25<16:57,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000449, train/loss_step=0.135, global_step=1058.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  51%|█████     | 612/1208 [17:25<16:57,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00414, train/loss_step=0.427, global_step=1058.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  51%|█████     | 613/1208 [17:26<16:55,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00414, train/loss_step=0.427, global_step=1058.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  51%|█████     | 613/1208 [17:26<16:55,  1.71s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0916, train/loss_vlb_step=0.000301, train/loss_step=0.0916, global_step=1059.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  51%|█████     | 614/1208 [17:27<16:53,  1.71s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0916, train/loss_vlb_step=0.000301, train/loss_step=0.0916, global_step=1059.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  51%|█████     | 614/1208 [17:27<16:53,  1.71s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=8.12e-5, train/loss_step=0.0188, global_step=1059.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  51%|█████     | 615/1208 [17:28<16:50,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=8.12e-5, train/loss_step=0.0188, global_step=1059.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  51%|█████     | 615/1208 [17:28<16:50,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00442, train/loss_vlb_step=2.45e-5, train/loss_step=0.00442, global_step=1059.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  51%|█████     | 616/1208 [17:30<16:50,  1.71s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00442, train/loss_vlb_step=2.45e-5, train/loss_step=0.00442, global_step=1059.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  51%|█████     | 616/1208 [17:30<16:50,  1.71s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=2.07e-5, train/loss_step=0.00373, global_step=1059.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  51%|█████     | 617/1208 [17:32<16:47,  1.71s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=2.07e-5, train/loss_step=0.00373, global_step=1059.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  51%|█████     | 617/1208 [17:32<16:47,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000286, train/loss_step=0.086, global_step=1060.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  51%|█████     | 618/1208 [17:33<16:45,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000286, train/loss_step=0.086, global_step=1060.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  51%|█████     | 618/1208 [17:33<16:45,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00114, train/loss_step=0.248, global_step=1060.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  51%|█████     | 619/1208 [17:34<16:42,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00114, train/loss_step=0.248, global_step=1060.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  51%|█████     | 619/1208 [17:34<16:42,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.548, train/loss_vlb_step=0.0104, train/loss_step=0.548, global_step=1060.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  51%|█████▏    | 620/1208 [17:36<16:42,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.548, train/loss_vlb_step=0.0104, train/loss_step=0.548, global_step=1060.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  51%|█████▏    | 620/1208 [17:36<16:42,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.000191, train/loss_step=0.0543, global_step=1060.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  51%|█████▏    | 621/1208 [17:37<16:39,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.000191, train/loss_step=0.0543, global_step=1060.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  51%|█████▏    | 621/1208 [17:37<16:39,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.055, train/loss_vlb_step=0.000188, train/loss_step=0.055, global_step=1061.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  51%|█████▏    | 622/1208 [17:38<16:37,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.055, train/loss_vlb_step=0.000188, train/loss_step=0.055, global_step=1061.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  51%|█████▏    | 622/1208 [17:38<16:37,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0052, train/loss_vlb_step=2.79e-5, train/loss_step=0.0052, global_step=1061.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  52%|█████▏    | 623/1208 [17:39<16:35,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0052, train/loss_vlb_step=2.79e-5, train/loss_step=0.0052, global_step=1061.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  52%|█████▏    | 623/1208 [17:39<16:35,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00223, train/loss_step=0.377, global_step=1061.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  52%|█████▏    | 624/1208 [17:42<16:34,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00223, train/loss_step=0.377, global_step=1061.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  52%|█████▏    | 624/1208 [17:42<16:34,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.060, train/loss_vlb_step=0.000208, train/loss_step=0.060, global_step=1061.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  52%|█████▏    | 625/1208 [17:43<16:32,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.060, train/loss_vlb_step=0.000208, train/loss_step=0.060, global_step=1061.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  52%|█████▏    | 625/1208 [17:43<16:32,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00143, train/loss_step=0.304, global_step=1062.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  52%|█████▏    | 626/1208 [17:44<16:30,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00143, train/loss_step=0.304, global_step=1062.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  52%|█████▏    | 626/1208 [17:44<16:30,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.18e-5, train/loss_step=0.0155, global_step=1062.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  52%|█████▏    | 627/1208 [17:45<16:27,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.18e-5, train/loss_step=0.0155, global_step=1062.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  52%|█████▏    | 627/1208 [17:45<16:27,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000172, train/loss_step=0.0449, global_step=1062.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  52%|█████▏    | 628/1208 [17:48<16:27,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000172, train/loss_step=0.0449, global_step=1062.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  52%|█████▏    | 628/1208 [17:48<16:27,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00348, train/loss_vlb_step=1.95e-5, train/loss_step=0.00348, global_step=1062.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  52%|█████▏    | 629/1208 [17:49<16:24,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00348, train/loss_vlb_step=1.95e-5, train/loss_step=0.00348, global_step=1062.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  52%|█████▏    | 629/1208 [17:49<16:24,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.0004, train/loss_step=0.122, global_step=1063.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]     Epoch 3:  52%|█████▏    | 630/1208 [17:50<16:22,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.0004, train/loss_step=0.122, global_step=1063.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  52%|█████▏    | 630/1208 [17:50<16:22,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000149, train/loss_step=0.0399, global_step=1063.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  52%|█████▏    | 631/1208 [17:51<16:20,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000149, train/loss_step=0.0399, global_step=1063.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  52%|█████▏    | 631/1208 [17:51<16:20,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000506, train/loss_step=0.151, global_step=1063.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  52%|█████▏    | 632/1208 [17:54<16:19,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000506, train/loss_step=0.151, global_step=1063.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  52%|█████▏    | 632/1208 [17:54<16:19,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00372, train/loss_vlb_step=2.05e-5, train/loss_step=0.00372, global_step=1063.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  52%|█████▏    | 633/1208 [17:55<16:17,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00372, train/loss_vlb_step=2.05e-5, train/loss_step=0.00372, global_step=1063.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  52%|█████▏    | 633/1208 [17:55<16:17,  1.70s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.5e-5, train/loss_step=0.00255, global_step=1064.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  52%|█████▏    | 634/1208 [17:56<16:14,  1.70s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.5e-5, train/loss_step=0.00255, global_step=1064.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  52%|█████▏    | 634/1208 [17:56<16:14,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000128, train/loss_step=0.035, global_step=1064.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  53%|█████▎    | 635/1208 [17:57<16:12,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000128, train/loss_step=0.035, global_step=1064.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  53%|█████▎    | 635/1208 [17:57<16:12,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.479, train/loss_vlb_step=0.00805, train/loss_step=0.479, global_step=1064.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  53%|█████▎    | 636/1208 [18:00<16:11,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.479, train/loss_vlb_step=0.00805, train/loss_step=0.479, global_step=1064.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  53%|█████▎    | 636/1208 [18:00<16:11,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=2.43e-5, train/loss_step=0.00452, global_step=1064.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  53%|█████▎    | 637/1208 [18:01<16:09,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=2.43e-5, train/loss_step=0.00452, global_step=1064.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  53%|█████▎    | 637/1208 [18:01<16:09,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00152, train/loss_step=0.300, global_step=1065.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  53%|█████▎    | 638/1208 [18:02<16:07,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00152, train/loss_step=0.300, global_step=1065.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  53%|█████▎    | 638/1208 [18:02<16:07,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.3e-5, train/loss_step=0.0144, global_step=1065.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  53%|█████▎    | 639/1208 [18:03<16:05,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.3e-5, train/loss_step=0.0144, global_step=1065.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  53%|█████▎    | 639/1208 [18:03<16:05,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00228, train/loss_vlb_step=1.38e-5, train/loss_step=0.00228, global_step=1065.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  53%|█████▎    | 640/1208 [18:06<16:04,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00228, train/loss_vlb_step=1.38e-5, train/loss_step=0.00228, global_step=1065.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  53%|█████▎    | 640/1208 [18:06<16:04,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00429, train/loss_vlb_step=2.3e-5, train/loss_step=0.00429, global_step=1065.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  53%|█████▎    | 641/1208 [18:07<16:02,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00429, train/loss_vlb_step=2.3e-5, train/loss_step=0.00429, global_step=1065.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  53%|█████▎    | 641/1208 [18:07<16:02,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000691, train/loss_step=0.193, global_step=1066.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  53%|█████▎    | 642/1208 [18:08<15:59,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000691, train/loss_step=0.193, global_step=1066.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  53%|█████▎    | 642/1208 [18:08<15:59,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00608, train/loss_vlb_step=3.03e-5, train/loss_step=0.00608, global_step=1066.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  53%|█████▎    | 643/1208 [18:09<15:57,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00608, train/loss_vlb_step=3.03e-5, train/loss_step=0.00608, global_step=1066.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  53%|█████▎    | 643/1208 [18:09<15:57,  1.69s/it, loss=0.091, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.000133, train/loss_step=0.034, global_step=1066.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  53%|█████▎    | 644/1208 [18:12<15:57,  1.70s/it, loss=0.091, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.000133, train/loss_step=0.034, global_step=1066.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  53%|█████▎    | 644/1208 [18:12<15:57,  1.70s/it, loss=0.09, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000142, train/loss_step=0.0402, global_step=1066.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  53%|█████▎    | 645/1208 [18:14<15:54,  1.70s/it, loss=0.09, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000142, train/loss_step=0.0402, global_step=1066.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  53%|█████▎    | 645/1208 [18:14<15:54,  1.70s/it, loss=0.0839, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.00063, train/loss_step=0.182, global_step=1067.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  53%|█████▎    | 646/1208 [18:15<15:52,  1.70s/it, loss=0.0839, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.00063, train/loss_step=0.182, global_step=1067.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  53%|█████▎    | 646/1208 [18:15<15:52,  1.70s/it, loss=0.0833, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=1.59e-5, train/loss_step=0.00276, global_step=1067.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  54%|█████▎    | 647/1208 [18:16<15:50,  1.69s/it, loss=0.0833, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=1.59e-5, train/loss_step=0.00276, global_step=1067.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  54%|█████▎    | 647/1208 [18:16<15:50,  1.69s/it, loss=0.0904, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000638, train/loss_step=0.186, global_step=1067.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  54%|█████▎    | 648/1208 [18:19<15:50,  1.70s/it, loss=0.0904, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000638, train/loss_step=0.186, global_step=1067.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  54%|█████▎    | 648/1208 [18:19<15:50,  1.70s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.089, train/loss_vlb_step=0.000294, train/loss_step=0.089, global_step=1067.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  54%|█████▎    | 649/1208 [18:20<15:47,  1.70s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.089, train/loss_vlb_step=0.000294, train/loss_step=0.089, global_step=1067.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  54%|█████▎    | 649/1208 [18:20<15:47,  1.70s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000628, train/loss_step=0.173, global_step=1068.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  54%|█████▍    | 650/1208 [18:21<15:45,  1.69s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000628, train/loss_step=0.173, global_step=1068.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  54%|█████▍    | 650/1208 [18:21<15:45,  1.69s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.00012, train/loss_step=0.0316, global_step=1068.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  54%|█████▍    | 651/1208 [18:22<15:43,  1.69s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.00012, train/loss_step=0.0316, global_step=1068.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  54%|█████▍    | 651/1208 [18:22<15:43,  1.69s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000681, train/loss_step=0.187, global_step=1068.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  54%|█████▍    | 652/1208 [18:25<15:42,  1.70s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000681, train/loss_step=0.187, global_step=1068.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  54%|█████▍    | 652/1208 [18:25<15:42,  1.70s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0382, train/loss_vlb_step=0.000146, train/loss_step=0.0382, global_step=1068.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  54%|█████▍    | 653/1208 [18:26<15:40,  1.70s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0382, train/loss_vlb_step=0.000146, train/loss_step=0.0382, global_step=1068.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  54%|█████▍    | 653/1208 [18:26<15:40,  1.70s/it, loss=0.107, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00042, train/loss_step=0.128, global_step=1069.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  54%|█████▍    | 654/1208 [18:27<15:38,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00042, train/loss_step=0.128, global_step=1069.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  54%|█████▍    | 654/1208 [18:27<15:38,  1.69s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=8.89e-6, train/loss_step=0.00147, global_step=1069.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  54%|█████▍    | 655/1208 [18:28<15:36,  1.69s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=8.89e-6, train/loss_step=0.00147, global_step=1069.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  54%|█████▍    | 655/1208 [18:28<15:36,  1.69s/it, loss=0.0812, v_num=0, train/loss_simple_step=0.00662, train/loss_vlb_step=3.32e-5, train/loss_step=0.00662, global_step=1069.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  54%|█████▍    | 656/1208 [18:32<15:35,  1.70s/it, loss=0.0812, v_num=0, train/loss_simple_step=0.00662, train/loss_vlb_step=3.32e-5, train/loss_step=0.00662, global_step=1069.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  54%|█████▍    | 656/1208 [18:32<15:35,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.474, train/loss_vlb_step=0.00508, train/loss_step=0.474, global_step=1069.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]     Epoch 3:  54%|█████▍    | 657/1208 [18:33<15:33,  1.69s/it, loss=0.105, v_num=0, train/loss_simple_step=0.474, train/loss_vlb_step=0.00508, train/loss_step=0.474, global_step=1069.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  54%|█████▍    | 657/1208 [18:33<15:33,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.767, train/loss_vlb_step=0.0653, train/loss_step=0.767, global_step=1070.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  54%|█████▍    | 658/1208 [18:34<15:31,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.767, train/loss_vlb_step=0.0653, train/loss_step=0.767, global_step=1070.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  54%|█████▍    | 658/1208 [18:34<15:31,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0469, train/loss_vlb_step=0.000173, train/loss_step=0.0469, global_step=1070.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  55%|█████▍    | 659/1208 [18:35<15:29,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0469, train/loss_vlb_step=0.000173, train/loss_step=0.0469, global_step=1070.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  55%|█████▍    | 659/1208 [18:35<15:29,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000118, train/loss_step=0.0304, global_step=1070.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  55%|█████▍    | 660/1208 [18:38<15:28,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000118, train/loss_step=0.0304, global_step=1070.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  55%|█████▍    | 660/1208 [18:38<15:28,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.21e-5, train/loss_step=0.00208, global_step=1070.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  55%|█████▍    | 661/1208 [18:39<15:26,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.21e-5, train/loss_step=0.00208, global_step=1070.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  55%|█████▍    | 661/1208 [18:39<15:26,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00163, train/loss_step=0.338, global_step=1071.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  55%|█████▍    | 662/1208 [18:40<15:24,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00163, train/loss_step=0.338, global_step=1071.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  55%|█████▍    | 662/1208 [18:40<15:24,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00669, train/loss_vlb_step=3.46e-5, train/loss_step=0.00669, global_step=1071.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  55%|█████▍    | 663/1208 [18:41<15:21,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00669, train/loss_vlb_step=3.46e-5, train/loss_step=0.00669, global_step=1071.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  55%|█████▍    | 663/1208 [18:41<15:21,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1.3e-5, train/loss_step=0.00226, global_step=1071.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  55%|█████▍    | 664/1208 [18:44<15:21,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1.3e-5, train/loss_step=0.00226, global_step=1071.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  55%|█████▍    | 664/1208 [18:44<15:21,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.94e-5, train/loss_step=0.0136, global_step=1071.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  55%|█████▌    | 665/1208 [18:45<15:19,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.94e-5, train/loss_step=0.0136, global_step=1071.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  55%|█████▌    | 665/1208 [18:45<15:19,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.468, train/loss_vlb_step=0.00393, train/loss_step=0.468, global_step=1072.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  55%|█████▌    | 666/1208 [18:46<15:16,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.468, train/loss_vlb_step=0.00393, train/loss_step=0.468, global_step=1072.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  55%|█████▌    | 666/1208 [18:46<15:16,  1.69s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0865, train/loss_vlb_step=0.000285, train/loss_step=0.0865, global_step=1072.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  55%|█████▌    | 667/1208 [18:47<15:14,  1.69s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0865, train/loss_vlb_step=0.000285, train/loss_step=0.0865, global_step=1072.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  55%|█████▌    | 667/1208 [18:47<15:14,  1.69s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00801, train/loss_vlb_step=3.66e-5, train/loss_step=0.00801, global_step=1072.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  55%|█████▌    | 668/1208 [18:50<15:14,  1.69s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00801, train/loss_vlb_step=3.66e-5, train/loss_step=0.00801, global_step=1072.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  55%|█████▌    | 668/1208 [18:50<15:14,  1.69s/it, loss=0.157, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00223, train/loss_step=0.322, global_step=1072.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  55%|█████▌    | 669/1208 [18:51<15:11,  1.69s/it, loss=0.157, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00223, train/loss_step=0.322, global_step=1072.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  55%|█████▌    | 669/1208 [18:51<15:11,  1.69s/it, loss=0.156, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000544, train/loss_step=0.161, global_step=1073.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  55%|█████▌    | 670/1208 [18:52<15:09,  1.69s/it, loss=0.156, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000544, train/loss_step=0.161, global_step=1073.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  55%|█████▌    | 670/1208 [18:52<15:09,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0946, train/loss_vlb_step=0.000314, train/loss_step=0.0946, global_step=1073.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  56%|█████▌    | 671/1208 [18:53<15:07,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0946, train/loss_vlb_step=0.000314, train/loss_step=0.0946, global_step=1073.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  56%|█████▌    | 671/1208 [18:53<15:07,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.83e-5, train/loss_step=0.0126, global_step=1073.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  56%|█████▌    | 672/1208 [18:57<15:07,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.83e-5, train/loss_step=0.0126, global_step=1073.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  56%|█████▌    | 672/1208 [18:57<15:07,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0789, train/loss_vlb_step=0.000271, train/loss_step=0.0789, global_step=1073.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  56%|█████▌    | 673/1208 [18:58<15:04,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0789, train/loss_vlb_step=0.000271, train/loss_step=0.0789, global_step=1073.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  56%|█████▌    | 673/1208 [18:58<15:04,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0842, train/loss_vlb_step=0.000278, train/loss_step=0.0842, global_step=1074.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  56%|█████▌    | 674/1208 [18:59<15:02,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0842, train/loss_vlb_step=0.000278, train/loss_step=0.0842, global_step=1074.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  56%|█████▌    | 674/1208 [18:59<15:02,  1.69s/it, loss=0.163, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.000989, train/loss_step=0.258, global_step=1074.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  56%|█████▌    | 675/1208 [19:00<15:00,  1.69s/it, loss=0.163, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.000989, train/loss_step=0.258, global_step=1074.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  56%|█████▌    | 675/1208 [19:00<15:00,  1.69s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=7.1e-5, train/loss_step=0.0159, global_step=1074.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  56%|█████▌    | 676/1208 [19:03<14:59,  1.69s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=7.1e-5, train/loss_step=0.0159, global_step=1074.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  56%|█████▌    | 676/1208 [19:03<14:59,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.00024, train/loss_step=0.0702, global_step=1074.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  56%|█████▌    | 677/1208 [19:04<14:57,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.00024, train/loss_step=0.0702, global_step=1074.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  56%|█████▌    | 677/1208 [19:04<14:57,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.42e-5, train/loss_step=0.0174, global_step=1075.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  56%|█████▌    | 678/1208 [19:05<14:55,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.42e-5, train/loss_step=0.0174, global_step=1075.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  56%|█████▌    | 678/1208 [19:05<14:55,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000146, train/loss_step=0.0412, global_step=1075.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  56%|█████▌    | 679/1208 [19:06<14:53,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000146, train/loss_step=0.0412, global_step=1075.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  56%|█████▌    | 679/1208 [19:06<14:53,  1.69s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.62e-5, train/loss_step=0.0145, global_step=1075.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  56%|█████▋    | 680/1208 [19:09<14:52,  1.69s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.62e-5, train/loss_step=0.0145, global_step=1075.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  56%|█████▋    | 680/1208 [19:09<14:52,  1.69s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=1.8e-5, train/loss_step=0.00309, global_step=1075.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  56%|█████▋    | 681/1208 [19:10<14:50,  1.69s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=1.8e-5, train/loss_step=0.00309, global_step=1075.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  56%|█████▋    | 681/1208 [19:10<14:50,  1.69s/it, loss=0.0884, v_num=0, train/loss_simple_step=0.00906, train/loss_vlb_step=4.46e-5, train/loss_step=0.00906, global_step=1076.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  56%|█████▋    | 682/1208 [19:12<14:48,  1.69s/it, loss=0.0884, v_num=0, train/loss_simple_step=0.00906, train/loss_vlb_step=4.46e-5, train/loss_step=0.00906, global_step=1076.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  56%|█████▋    | 682/1208 [19:12<14:48,  1.69s/it, loss=0.0903, v_num=0, train/loss_simple_step=0.0442, train/loss_vlb_step=0.000159, train/loss_step=0.0442, global_step=1076.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  57%|█████▋    | 683/1208 [19:13<14:46,  1.69s/it, loss=0.0903, v_num=0, train/loss_simple_step=0.0442, train/loss_vlb_step=0.000159, train/loss_step=0.0442, global_step=1076.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  57%|█████▋    | 683/1208 [19:13<14:46,  1.69s/it, loss=0.0903, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.9e-5, train/loss_step=0.00352, global_step=1076.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  57%|█████▋    | 684/1208 [19:16<14:45,  1.69s/it, loss=0.0903, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.9e-5, train/loss_step=0.00352, global_step=1076.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  57%|█████▋    | 684/1208 [19:16<14:45,  1.69s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.83e-5, train/loss_step=0.0236, global_step=1076.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  57%|█████▋    | 685/1208 [19:17<14:43,  1.69s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.83e-5, train/loss_step=0.0236, global_step=1076.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  57%|█████▋    | 685/1208 [19:17<14:43,  1.69s/it, loss=0.0798, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.0012, train/loss_step=0.248, global_step=1077.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  57%|█████▋    | 686/1208 [19:18<14:41,  1.69s/it, loss=0.0798, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.0012, train/loss_step=0.248, global_step=1077.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  57%|█████▋    | 686/1208 [19:18<14:41,  1.69s/it, loss=0.0868, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000881, train/loss_step=0.228, global_step=1077.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  57%|█████▋    | 687/1208 [19:19<14:39,  1.69s/it, loss=0.0868, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000881, train/loss_step=0.228, global_step=1077.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  57%|█████▋    | 687/1208 [19:19<14:39,  1.69s/it, loss=0.097, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000761, train/loss_step=0.211, global_step=1077.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  57%|█████▋    | 688/1208 [19:22<14:38,  1.69s/it, loss=0.097, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000761, train/loss_step=0.211, global_step=1077.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  57%|█████▋    | 688/1208 [19:22<14:38,  1.69s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00133, train/loss_step=0.278, global_step=1077.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  57%|█████▋    | 689/1208 [19:23<14:36,  1.69s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00133, train/loss_step=0.278, global_step=1077.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  57%|█████▋    | 689/1208 [19:23<14:36,  1.69s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000103, train/loss_step=0.0268, global_step=1078.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  57%|█████▋    | 690/1208 [19:24<14:34,  1.69s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000103, train/loss_step=0.0268, global_step=1078.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  57%|█████▋    | 690/1208 [19:24<14:34,  1.69s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.00501, train/loss_vlb_step=2.64e-5, train/loss_step=0.00501, global_step=1078.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  57%|█████▋    | 691/1208 [19:25<14:32,  1.69s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.00501, train/loss_vlb_step=2.64e-5, train/loss_step=0.00501, global_step=1078.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  57%|█████▋    | 691/1208 [19:25<14:32,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.486, train/loss_vlb_step=0.00355, train/loss_step=0.486, global_step=1078.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]     Epoch 3:  57%|█████▋    | 692/1208 [19:29<14:31,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.486, train/loss_vlb_step=0.00355, train/loss_step=0.486, global_step=1078.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  57%|█████▋    | 692/1208 [19:29<14:31,  1.69s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.000114, train/loss_step=0.0285, global_step=1078.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  57%|█████▋    | 693/1208 [19:30<14:29,  1.69s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.000114, train/loss_step=0.0285, global_step=1078.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  57%|█████▋    | 693/1208 [19:30<14:29,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00236, train/loss_step=0.343, global_step=1079.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  57%|█████▋    | 694/1208 [19:31<14:27,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00236, train/loss_step=0.343, global_step=1079.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  57%|█████▋    | 694/1208 [19:31<14:27,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0503, train/loss_vlb_step=0.000187, train/loss_step=0.0503, global_step=1079.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  58%|█████▊    | 695/1208 [19:32<14:25,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0503, train/loss_vlb_step=0.000187, train/loss_step=0.0503, global_step=1079.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  58%|█████▊    | 695/1208 [19:32<14:25,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00769, train/loss_vlb_step=3.66e-5, train/loss_step=0.00769, global_step=1079.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  58%|█████▊    | 696/1208 [19:35<14:24,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00769, train/loss_vlb_step=3.66e-5, train/loss_step=0.00769, global_step=1079.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  58%|█████▊    | 696/1208 [19:35<14:24,  1.69s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000142, train/loss_step=0.0367, global_step=1079.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  58%|█████▊    | 697/1208 [19:36<14:22,  1.69s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000142, train/loss_step=0.0367, global_step=1079.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  58%|█████▊    | 697/1208 [19:36<14:22,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0621, train/loss_vlb_step=0.000216, train/loss_step=0.0621, global_step=1080.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  58%|█████▊    | 698/1208 [19:37<14:20,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0621, train/loss_vlb_step=0.000216, train/loss_step=0.0621, global_step=1080.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  58%|█████▊    | 698/1208 [19:37<14:20,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0544, train/loss_vlb_step=0.000195, train/loss_step=0.0544, global_step=1080.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  58%|█████▊    | 699/1208 [19:38<14:18,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0544, train/loss_vlb_step=0.000195, train/loss_step=0.0544, global_step=1080.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  58%|█████▊    | 699/1208 [19:38<14:18,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.41e-5, train/loss_step=0.00247, global_step=1080.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  58%|█████▊    | 700/1208 [19:41<14:17,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.41e-5, train/loss_step=0.00247, global_step=1080.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  58%|█████▊    | 700/1208 [19:41<14:17,  1.69s/it, loss=0.122, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00125, train/loss_step=0.297, global_step=1080.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  58%|█████▊    | 701/1208 [19:42<14:15,  1.69s/it, loss=0.122, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00125, train/loss_step=0.297, global_step=1080.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  58%|█████▊    | 701/1208 [19:42<14:15,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000625, train/loss_step=0.177, global_step=1081.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  58%|█████▊    | 702/1208 [19:44<14:13,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000625, train/loss_step=0.177, global_step=1081.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  58%|█████▊    | 702/1208 [19:44<14:13,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000911, train/loss_step=0.239, global_step=1081.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  58%|█████▊    | 703/1208 [19:45<14:11,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000911, train/loss_step=0.239, global_step=1081.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  58%|█████▊    | 703/1208 [19:45<14:11,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0531, train/loss_vlb_step=0.000196, train/loss_step=0.0531, global_step=1081.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  58%|█████▊    | 704/1208 [19:48<14:10,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0531, train/loss_vlb_step=0.000196, train/loss_step=0.0531, global_step=1081.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  58%|█████▊    | 704/1208 [19:48<14:10,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000143, train/loss_step=0.0378, global_step=1081.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  58%|█████▊    | 705/1208 [19:49<14:08,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000143, train/loss_step=0.0378, global_step=1081.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  58%|█████▊    | 705/1208 [19:49<14:08,  1.69s/it, loss=0.164, v_num=0, train/loss_simple_step=0.663, train/loss_vlb_step=0.0266, train/loss_step=0.663, global_step=1082.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  58%|█████▊    | 706/1208 [19:50<14:06,  1.69s/it, loss=0.164, v_num=0, train/loss_simple_step=0.663, train/loss_vlb_step=0.0266, train/loss_step=0.663, global_step=1082.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  58%|█████▊    | 706/1208 [19:50<14:06,  1.69s/it, loss=0.165, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00101, train/loss_step=0.244, global_step=1082.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  59%|█████▊    | 707/1208 [19:51<14:04,  1.69s/it, loss=0.165, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00101, train/loss_step=0.244, global_step=1082.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  59%|█████▊    | 707/1208 [19:51<14:04,  1.69s/it, loss=0.182, v_num=0, train/loss_simple_step=0.553, train/loss_vlb_step=0.00984, train/loss_step=0.553, global_step=1082.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  59%|█████▊    | 708/1208 [19:54<14:03,  1.69s/it, loss=0.182, v_num=0, train/loss_simple_step=0.553, train/loss_vlb_step=0.00984, train/loss_step=0.553, global_step=1082.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  59%|█████▊    | 708/1208 [19:54<14:03,  1.69s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=9.94e-5, train/loss_step=0.0262, global_step=1082.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  59%|█████▊    | 709/1208 [19:55<14:01,  1.69s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=9.94e-5, train/loss_step=0.0262, global_step=1082.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  59%|█████▊    | 709/1208 [19:55<14:01,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00523, train/loss_vlb_step=2.78e-5, train/loss_step=0.00523, global_step=1083.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  59%|█████▉    | 710/1208 [19:56<13:59,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00523, train/loss_vlb_step=2.78e-5, train/loss_step=0.00523, global_step=1083.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  59%|█████▉    | 710/1208 [19:56<13:59,  1.69s/it, loss=0.184, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00166, train/loss_step=0.321, global_step=1083.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  59%|█████▉    | 711/1208 [19:57<13:57,  1.68s/it, loss=0.184, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00166, train/loss_step=0.321, global_step=1083.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  59%|█████▉    | 711/1208 [19:57<13:57,  1.68s/it, loss=0.169, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000654, train/loss_step=0.179, global_step=1083.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  59%|█████▉    | 712/1208 [20:01<13:56,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000654, train/loss_step=0.179, global_step=1083.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  59%|█████▉    | 712/1208 [20:01<13:56,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000125, train/loss_step=0.0328, global_step=1083.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  59%|█████▉    | 713/1208 [20:02<13:54,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000125, train/loss_step=0.0328, global_step=1083.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  59%|█████▉    | 713/1208 [20:02<13:54,  1.69s/it, loss=0.161, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000646, train/loss_step=0.182, global_step=1084.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  59%|█████▉    | 714/1208 [20:03<13:52,  1.69s/it, loss=0.161, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000646, train/loss_step=0.182, global_step=1084.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  59%|█████▉    | 714/1208 [20:03<13:52,  1.69s/it, loss=0.165, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.00044, train/loss_step=0.129, global_step=1084.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  59%|█████▉    | 715/1208 [20:04<13:50,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.00044, train/loss_step=0.129, global_step=1084.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  59%|█████▉    | 715/1208 [20:04<13:50,  1.68s/it, loss=0.181, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00182, train/loss_step=0.327, global_step=1084.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  59%|█████▉    | 716/1208 [20:07<13:49,  1.69s/it, loss=0.181, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00182, train/loss_step=0.327, global_step=1084.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  59%|█████▉    | 716/1208 [20:07<13:49,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.55e-5, train/loss_step=0.0175, global_step=1084.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  59%|█████▉    | 717/1208 [20:08<13:47,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.55e-5, train/loss_step=0.0175, global_step=1084.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  59%|█████▉    | 717/1208 [20:08<13:47,  1.69s/it, loss=0.188, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000798, train/loss_step=0.211, global_step=1085.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  59%|█████▉    | 718/1208 [20:09<13:45,  1.68s/it, loss=0.188, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000798, train/loss_step=0.211, global_step=1085.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  59%|█████▉    | 718/1208 [20:09<13:45,  1.68s/it, loss=0.202, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00177, train/loss_step=0.338, global_step=1085.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  60%|█████▉    | 719/1208 [20:10<13:43,  1.68s/it, loss=0.202, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00177, train/loss_step=0.338, global_step=1085.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  60%|█████▉    | 719/1208 [20:10<13:43,  1.68s/it, loss=0.209, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000525, train/loss_step=0.156, global_step=1085.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  60%|█████▉    | 720/1208 [20:13<13:42,  1.69s/it, loss=0.209, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000525, train/loss_step=0.156, global_step=1085.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  60%|█████▉    | 720/1208 [20:13<13:42,  1.69s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0674, train/loss_vlb_step=0.000225, train/loss_step=0.0674, global_step=1085.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  60%|█████▉    | 721/1208 [20:14<13:40,  1.68s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0674, train/loss_vlb_step=0.000225, train/loss_step=0.0674, global_step=1085.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  60%|█████▉    | 721/1208 [20:14<13:40,  1.68s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0826, train/loss_vlb_step=0.000273, train/loss_step=0.0826, global_step=1086.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  60%|█████▉    | 722/1208 [20:15<13:38,  1.68s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0826, train/loss_vlb_step=0.000273, train/loss_step=0.0826, global_step=1086.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  60%|█████▉    | 722/1208 [20:15<13:38,  1.68s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.59e-5, train/loss_step=0.0126, global_step=1086.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  60%|█████▉    | 723/1208 [20:16<13:36,  1.68s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.59e-5, train/loss_step=0.0126, global_step=1086.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  60%|█████▉    | 723/1208 [20:16<13:36,  1.68s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=9.06e-5, train/loss_step=0.0214, global_step=1086.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  60%|█████▉    | 724/1208 [20:20<13:35,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=9.06e-5, train/loss_step=0.0214, global_step=1086.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  60%|█████▉    | 724/1208 [20:20<13:35,  1.69s/it, loss=0.193, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00124, train/loss_step=0.283, global_step=1086.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  60%|██████    | 725/1208 [20:21<13:33,  1.68s/it, loss=0.193, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00124, train/loss_step=0.283, global_step=1086.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  60%|██████    | 725/1208 [20:21<13:33,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00775, train/loss_vlb_step=3.88e-5, train/loss_step=0.00775, global_step=1087.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  60%|██████    | 726/1208 [20:22<13:31,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00775, train/loss_vlb_step=3.88e-5, train/loss_step=0.00775, global_step=1087.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  60%|██████    | 726/1208 [20:22<13:31,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0705, train/loss_vlb_step=0.000247, train/loss_step=0.0705, global_step=1087.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  60%|██████    | 727/1208 [20:23<13:29,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0705, train/loss_vlb_step=0.000247, train/loss_step=0.0705, global_step=1087.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  60%|██████    | 727/1208 [20:23<13:29,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000154, train/loss_step=0.0412, global_step=1087.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  60%|██████    | 728/1208 [20:26<13:28,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000154, train/loss_step=0.0412, global_step=1087.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  60%|██████    | 728/1208 [20:26<13:28,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.13e-5, train/loss_step=0.00188, global_step=1087.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  60%|██████    | 729/1208 [20:27<13:26,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.13e-5, train/loss_step=0.00188, global_step=1087.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  60%|██████    | 729/1208 [20:27<13:26,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.00034, train/loss_step=0.103, global_step=1088.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  60%|██████    | 730/1208 [20:28<13:24,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.00034, train/loss_step=0.103, global_step=1088.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  60%|██████    | 730/1208 [20:28<13:24,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.32e-5, train/loss_step=0.0118, global_step=1088.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  61%|██████    | 731/1208 [20:29<13:22,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.32e-5, train/loss_step=0.0118, global_step=1088.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  61%|██████    | 731/1208 [20:29<13:22,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000458, train/loss_step=0.139, global_step=1088.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  61%|██████    | 732/1208 [20:32<13:21,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000458, train/loss_step=0.139, global_step=1088.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  61%|██████    | 732/1208 [20:32<13:21,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000571, train/loss_step=0.173, global_step=1088.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  61%|██████    | 733/1208 [20:33<13:19,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000571, train/loss_step=0.173, global_step=1088.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  61%|██████    | 733/1208 [20:33<13:19,  1.68s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=1.83e-5, train/loss_step=0.00326, global_step=1089.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  61%|██████    | 734/1208 [20:34<13:17,  1.68s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=1.83e-5, train/loss_step=0.00326, global_step=1089.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  61%|██████    | 734/1208 [20:34<13:17,  1.68s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0699, train/loss_vlb_step=0.000235, train/loss_step=0.0699, global_step=1089.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  61%|██████    | 735/1208 [20:35<13:15,  1.68s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0699, train/loss_vlb_step=0.000235, train/loss_step=0.0699, global_step=1089.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  61%|██████    | 735/1208 [20:35<13:15,  1.68s/it, loss=0.0912, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.48e-5, train/loss_step=0.0121, global_step=1089.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  61%|██████    | 736/1208 [20:39<13:14,  1.68s/it, loss=0.0912, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.48e-5, train/loss_step=0.0121, global_step=1089.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  61%|██████    | 736/1208 [20:39<13:14,  1.68s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000398, train/loss_step=0.121, global_step=1089.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  61%|██████    | 737/1208 [20:40<13:12,  1.68s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000398, train/loss_step=0.121, global_step=1089.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  61%|██████    | 737/1208 [20:40<13:12,  1.68s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.35e-5, train/loss_step=0.0121, global_step=1090.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  61%|██████    | 738/1208 [20:41<13:10,  1.68s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.35e-5, train/loss_step=0.0121, global_step=1090.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  61%|██████    | 738/1208 [20:41<13:10,  1.68s/it, loss=0.0774, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000526, train/loss_step=0.159, global_step=1090.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  61%|██████    | 739/1208 [20:42<13:08,  1.68s/it, loss=0.0774, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000526, train/loss_step=0.159, global_step=1090.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  61%|██████    | 739/1208 [20:42<13:08,  1.68s/it, loss=0.0702, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.62e-5, train/loss_step=0.0106, global_step=1090.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  61%|██████▏   | 740/1208 [20:45<13:07,  1.68s/it, loss=0.0702, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.62e-5, train/loss_step=0.0106, global_step=1090.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  61%|██████▏   | 740/1208 [20:45<13:07,  1.68s/it, loss=0.0907, v_num=0, train/loss_simple_step=0.478, train/loss_vlb_step=0.00576, train/loss_step=0.478, global_step=1090.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  61%|██████▏   | 741/1208 [20:46<13:05,  1.68s/it, loss=0.0907, v_num=0, train/loss_simple_step=0.478, train/loss_vlb_step=0.00576, train/loss_step=0.478, global_step=1090.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  61%|██████▏   | 741/1208 [20:46<13:05,  1.68s/it, loss=0.0879, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000103, train/loss_step=0.0264, global_step=1091.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  61%|██████▏   | 742/1208 [20:47<13:03,  1.68s/it, loss=0.0879, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000103, train/loss_step=0.0264, global_step=1091.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  61%|██████▏   | 742/1208 [20:47<13:03,  1.68s/it, loss=0.0874, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=1.37e-5, train/loss_step=0.00234, global_step=1091.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  62%|██████▏   | 743/1208 [20:48<13:01,  1.68s/it, loss=0.0874, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=1.37e-5, train/loss_step=0.00234, global_step=1091.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  62%|██████▏   | 743/1208 [20:48<13:01,  1.68s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.00043, train/loss_step=0.129, global_step=1091.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  62%|██████▏   | 744/1208 [20:52<13:00,  1.68s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.00043, train/loss_step=0.129, global_step=1091.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  62%|██████▏   | 744/1208 [20:52<13:00,  1.68s/it, loss=0.0789, v_num=0, train/loss_simple_step=0.00609, train/loss_vlb_step=3.13e-5, train/loss_step=0.00609, global_step=1091.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  62%|██████▏   | 745/1208 [20:53<12:58,  1.68s/it, loss=0.0789, v_num=0, train/loss_simple_step=0.00609, train/loss_vlb_step=3.13e-5, train/loss_step=0.00609, global_step=1091.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  62%|██████▏   | 745/1208 [20:53<12:58,  1.68s/it, loss=0.0799, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000113, train/loss_step=0.0282, global_step=1092.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  62%|██████▏   | 746/1208 [20:54<12:56,  1.68s/it, loss=0.0799, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000113, train/loss_step=0.0282, global_step=1092.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  62%|██████▏   | 746/1208 [20:54<12:56,  1.68s/it, loss=0.0765, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.26e-5, train/loss_step=0.00211, global_step=1092.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  62%|██████▏   | 747/1208 [20:55<12:54,  1.68s/it, loss=0.0765, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.26e-5, train/loss_step=0.00211, global_step=1092.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  62%|██████▏   | 747/1208 [20:55<12:54,  1.68s/it, loss=0.0803, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=1092.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  62%|██████▏   | 748/1208 [20:58<12:53,  1.68s/it, loss=0.0803, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=1092.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  62%|██████▏   | 748/1208 [20:58<12:53,  1.68s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.0997, train/loss_vlb_step=0.000329, train/loss_step=0.0997, global_step=1092.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  62%|██████▏   | 749/1208 [20:59<12:51,  1.68s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.0997, train/loss_vlb_step=0.000329, train/loss_step=0.0997, global_step=1092.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  62%|██████▏   | 749/1208 [20:59<12:51,  1.68s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00151, train/loss_step=0.324, global_step=1093.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  62%|██████▏   | 750/1208 [21:00<12:49,  1.68s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00151, train/loss_step=0.324, global_step=1093.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  62%|██████▏   | 750/1208 [21:00<12:49,  1.68s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=1.24e-5, train/loss_step=0.00206, global_step=1093.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  62%|██████▏   | 751/1208 [21:01<12:47,  1.68s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=1.24e-5, train/loss_step=0.00206, global_step=1093.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  62%|██████▏   | 751/1208 [21:01<12:47,  1.68s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000569, train/loss_step=0.170, global_step=1093.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  62%|██████▏   | 752/1208 [21:04<12:46,  1.68s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000569, train/loss_step=0.170, global_step=1093.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  62%|██████▏   | 752/1208 [21:04<12:46,  1.68s/it, loss=0.091, v_num=0, train/loss_simple_step=0.0481, train/loss_vlb_step=0.000174, train/loss_step=0.0481, global_step=1093.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  62%|██████▏   | 753/1208 [21:05<12:44,  1.68s/it, loss=0.091, v_num=0, train/loss_simple_step=0.0481, train/loss_vlb_step=0.000174, train/loss_step=0.0481, global_step=1093.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  62%|██████▏   | 753/1208 [21:05<12:44,  1.68s/it, loss=0.111, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00285, train/loss_step=0.403, global_step=1094.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  62%|██████▏   | 754/1208 [21:06<12:42,  1.68s/it, loss=0.111, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00285, train/loss_step=0.403, global_step=1094.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  62%|██████▏   | 754/1208 [21:06<12:42,  1.68s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0687, train/loss_vlb_step=0.000238, train/loss_step=0.0687, global_step=1094.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  62%|██████▎   | 755/1208 [21:07<12:40,  1.68s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0687, train/loss_vlb_step=0.000238, train/loss_step=0.0687, global_step=1094.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  62%|██████▎   | 755/1208 [21:07<12:40,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00375, train/loss_step=0.433, global_step=1094.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  63%|██████▎   | 756/1208 [21:11<12:39,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00375, train/loss_step=0.433, global_step=1094.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  63%|██████▎   | 756/1208 [21:11<12:39,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0536, train/loss_vlb_step=0.000194, train/loss_step=0.0536, global_step=1094.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  63%|██████▎   | 757/1208 [21:12<12:37,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0536, train/loss_vlb_step=0.000194, train/loss_step=0.0536, global_step=1094.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  63%|██████▎   | 757/1208 [21:12<12:37,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000441, train/loss_step=0.132, global_step=1095.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  63%|██████▎   | 758/1208 [21:13<12:35,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000441, train/loss_step=0.132, global_step=1095.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  63%|██████▎   | 758/1208 [21:13<12:35,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.054, train/loss_vlb_step=0.000194, train/loss_step=0.054, global_step=1095.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  63%|██████▎   | 759/1208 [21:14<12:33,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.054, train/loss_vlb_step=0.000194, train/loss_step=0.054, global_step=1095.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  63%|██████▎   | 759/1208 [21:14<12:33,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.0012, train/loss_step=0.268, global_step=1095.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  63%|██████▎   | 760/1208 [21:17<12:33,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.0012, train/loss_step=0.268, global_step=1095.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  63%|██████▎   | 760/1208 [21:17<12:33,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00135, train/loss_step=0.280, global_step=1095.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  63%|██████▎   | 761/1208 [21:18<12:31,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00135, train/loss_step=0.280, global_step=1095.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  63%|██████▎   | 761/1208 [21:18<12:31,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=9.89e-5, train/loss_step=0.0251, global_step=1096.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  63%|██████▎   | 762/1208 [21:19<12:28,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=9.89e-5, train/loss_step=0.0251, global_step=1096.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  63%|██████▎   | 762/1208 [21:19<12:28,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.58e-5, train/loss_step=0.023, global_step=1096.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  63%|██████▎   | 763/1208 [21:20<12:26,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.58e-5, train/loss_step=0.023, global_step=1096.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  63%|██████▎   | 763/1208 [21:20<12:26,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0789, train/loss_vlb_step=0.000268, train/loss_step=0.0789, global_step=1096.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  63%|██████▎   | 764/1208 [21:23<12:26,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0789, train/loss_vlb_step=0.000268, train/loss_step=0.0789, global_step=1096.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  63%|██████▎   | 764/1208 [21:23<12:26,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000538, train/loss_step=0.161, global_step=1096.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  63%|██████▎   | 765/1208 [21:24<12:24,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000538, train/loss_step=0.161, global_step=1096.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  63%|██████▎   | 765/1208 [21:24<12:24,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000503, train/loss_step=0.149, global_step=1097.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  63%|██████▎   | 766/1208 [21:25<12:22,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000503, train/loss_step=0.149, global_step=1097.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  63%|██████▎   | 766/1208 [21:25<12:22,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0398, train/loss_vlb_step=0.000149, train/loss_step=0.0398, global_step=1097.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  63%|██████▎   | 767/1208 [21:27<12:19,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0398, train/loss_vlb_step=0.000149, train/loss_step=0.0398, global_step=1097.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  63%|██████▎   | 767/1208 [21:27<12:19,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0583, train/loss_vlb_step=0.000201, train/loss_step=0.0583, global_step=1097.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  64%|██████▎   | 768/1208 [21:30<12:19,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0583, train/loss_vlb_step=0.000201, train/loss_step=0.0583, global_step=1097.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  64%|██████▎   | 768/1208 [21:30<12:19,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00173, train/loss_step=0.365, global_step=1097.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  64%|██████▎   | 769/1208 [21:31<12:17,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00173, train/loss_step=0.365, global_step=1097.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  64%|██████▎   | 769/1208 [21:31<12:17,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000407, train/loss_step=0.123, global_step=1098.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  64%|██████▎   | 770/1208 [21:32<12:15,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000407, train/loss_step=0.123, global_step=1098.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  64%|██████▎   | 770/1208 [21:32<12:15,  1.68s/it, loss=0.155, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000574, train/loss_step=0.172, global_step=1098.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  64%|██████▍   | 771/1208 [21:33<12:13,  1.68s/it, loss=0.155, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000574, train/loss_step=0.172, global_step=1098.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  64%|██████▍   | 771/1208 [21:33<12:13,  1.68s/it, loss=0.167, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.00256, train/loss_step=0.400, global_step=1098.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  64%|██████▍   | 772/1208 [21:36<12:12,  1.68s/it, loss=0.167, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.00256, train/loss_step=0.400, global_step=1098.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  64%|██████▍   | 772/1208 [21:36<12:12,  1.68s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0994, train/loss_vlb_step=0.000333, train/loss_step=0.0994, global_step=1098.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  64%|██████▍   | 773/1208 [21:37<12:10,  1.68s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0994, train/loss_vlb_step=0.000333, train/loss_step=0.0994, global_step=1098.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  64%|██████▍   | 773/1208 [21:37<12:10,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.92e-5, train/loss_step=0.016, global_step=1099.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  64%|██████▍   | 774/1208 [21:38<12:07,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.92e-5, train/loss_step=0.016, global_step=1099.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  64%|██████▍   | 774/1208 [21:38<12:07,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00523, train/loss_vlb_step=2.78e-5, train/loss_step=0.00523, global_step=1099.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  64%|██████▍   | 775/1208 [21:39<12:05,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00523, train/loss_vlb_step=2.78e-5, train/loss_step=0.00523, global_step=1099.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  64%|██████▍   | 775/1208 [21:39<12:05,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=6.05e-5, train/loss_step=0.0125, global_step=1099.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  64%|██████▍   | 776/1208 [21:42<12:04,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=6.05e-5, train/loss_step=0.0125, global_step=1099.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  64%|██████▍   | 776/1208 [21:42<12:04,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000443, train/loss_step=0.135, global_step=1099.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  64%|██████▍   | 777/1208 [21:43<12:02,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000443, train/loss_step=0.135, global_step=1099.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  64%|██████▍   | 777/1208 [21:43<12:02,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=0.000101, train/loss_step=0.025, global_step=1100.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  64%|██████▍   | 778/1208 [21:44<12:00,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=0.000101, train/loss_step=0.025, global_step=1100.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  64%|██████▍   | 778/1208 [21:44<12:00,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=3.08e-5, train/loss_step=0.00615, global_step=1100.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  64%|██████▍   | 779/1208 [21:45<11:58,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=3.08e-5, train/loss_step=0.00615, global_step=1100.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  64%|██████▍   | 779/1208 [21:45<11:58,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.00238, train/loss_step=0.400, global_step=1100.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  65%|██████▍   | 780/1208 [21:48<11:57,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.00238, train/loss_step=0.400, global_step=1100.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  65%|██████▍   | 780/1208 [21:48<11:57,  1.68s/it, loss=0.116, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000101, train/loss_step=0.026, global_step=1100.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  65%|██████▍   | 781/1208 [21:49<11:55,  1.68s/it, loss=0.116, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000101, train/loss_step=0.026, global_step=1100.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  65%|██████▍   | 781/1208 [21:49<11:55,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000994, train/loss_step=0.240, global_step=1101.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  65%|██████▍   | 782/1208 [21:50<11:53,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000994, train/loss_step=0.240, global_step=1101.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  65%|██████▍   | 782/1208 [21:50<11:53,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000456, train/loss_step=0.138, global_step=1101.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  65%|██████▍   | 783/1208 [21:51<11:51,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000456, train/loss_step=0.138, global_step=1101.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  65%|██████▍   | 783/1208 [21:51<11:51,  1.67s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00468, train/loss_vlb_step=2.47e-5, train/loss_step=0.00468, global_step=1101.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  65%|██████▍   | 784/1208 [21:54<11:50,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00468, train/loss_vlb_step=2.47e-5, train/loss_step=0.00468, global_step=1101.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  65%|██████▍   | 784/1208 [21:54<11:50,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.55e-5, train/loss_step=0.0113, global_step=1101.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  65%|██████▍   | 785/1208 [21:55<11:48,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.55e-5, train/loss_step=0.0113, global_step=1101.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  65%|██████▍   | 785/1208 [21:55<11:48,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.074, train/loss_vlb_step=0.000244, train/loss_step=0.074, global_step=1102.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  65%|██████▌   | 786/1208 [21:56<11:46,  1.67s/it, loss=0.118, v_num=0, train/loss_simple_step=0.074, train/loss_vlb_step=0.000244, train/loss_step=0.074, global_step=1102.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  65%|██████▌   | 786/1208 [21:56<11:46,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=7.74e-5, train/loss_step=0.0193, global_step=1102.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  65%|██████▌   | 787/1208 [21:57<11:44,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=7.74e-5, train/loss_step=0.0193, global_step=1102.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  65%|██████▌   | 787/1208 [21:57<11:44,  1.67s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0538, train/loss_vlb_step=0.000192, train/loss_step=0.0538, global_step=1102.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  65%|██████▌   | 788/1208 [21:59<11:43,  1.68s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0538, train/loss_vlb_step=0.000192, train/loss_step=0.0538, global_step=1102.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  65%|██████▌   | 788/1208 [21:59<11:43,  1.68s/it, loss=0.106, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000521, train/loss_step=0.155, global_step=1102.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  65%|██████▌   | 789/1208 [22:00<11:41,  1.67s/it, loss=0.106, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000521, train/loss_step=0.155, global_step=1102.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  65%|██████▌   | 789/1208 [22:00<11:41,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00192, train/loss_step=0.353, global_step=1103.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  65%|██████▌   | 790/1208 [22:01<11:39,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00192, train/loss_step=0.353, global_step=1103.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  65%|██████▌   | 790/1208 [22:01<11:39,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.00038, train/loss_step=0.116, global_step=1103.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  65%|██████▌   | 791/1208 [22:02<11:37,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.00038, train/loss_step=0.116, global_step=1103.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  65%|██████▌   | 791/1208 [22:02<11:37,  1.67s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.95e-5, train/loss_step=0.00344, global_step=1103.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  66%|██████▌   | 792/1208 [22:05<11:36,  1.67s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.95e-5, train/loss_step=0.00344, global_step=1103.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  66%|██████▌   | 792/1208 [22:05<11:36,  1.67s/it, loss=0.106, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00172, train/loss_step=0.329, global_step=1103.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]     Epoch 3:  66%|██████▌   | 793/1208 [22:06<11:34,  1.67s/it, loss=0.106, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00172, train/loss_step=0.329, global_step=1103.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  66%|██████▌   | 793/1208 [22:06<11:34,  1.67s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.52e-5, train/loss_step=0.00267, global_step=1104.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  66%|██████▌   | 794/1208 [22:07<11:32,  1.67s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.52e-5, train/loss_step=0.00267, global_step=1104.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  66%|██████▌   | 794/1208 [22:07<11:32,  1.67s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.18e-5, train/loss_step=0.0231, global_step=1104.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  66%|██████▌   | 795/1208 [22:08<11:30,  1.67s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.18e-5, train/loss_step=0.0231, global_step=1104.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  66%|██████▌   | 795/1208 [22:08<11:30,  1.67s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0487, train/loss_vlb_step=0.00018, train/loss_step=0.0487, global_step=1104.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  66%|██████▌   | 796/1208 [22:11<11:29,  1.67s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0487, train/loss_vlb_step=0.00018, train/loss_step=0.0487, global_step=1104.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  66%|██████▌   | 796/1208 [22:11<11:29,  1.67s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=8.35e-5, train/loss_step=0.0184, global_step=1104.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  66%|██████▌   | 797/1208 [22:12<11:27,  1.67s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=8.35e-5, train/loss_step=0.0184, global_step=1104.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  66%|██████▌   | 797/1208 [22:12<11:27,  1.67s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000101, train/loss_step=0.0253, global_step=1105.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  66%|██████▌   | 798/1208 [22:13<11:25,  1.67s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000101, train/loss_step=0.0253, global_step=1105.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  66%|██████▌   | 798/1208 [22:13<11:25,  1.67s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000102, train/loss_step=0.0253, global_step=1105.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  66%|██████▌   | 799/1208 [22:14<11:23,  1.67s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000102, train/loss_step=0.0253, global_step=1105.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  66%|██████▌   | 799/1208 [22:14<11:23,  1.67s/it, loss=0.0842, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.24e-5, train/loss_step=0.0168, global_step=1105.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  66%|██████▌   | 800/1208 [22:17<11:22,  1.67s/it, loss=0.0842, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.24e-5, train/loss_step=0.0168, global_step=1105.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  66%|██████▌   | 800/1208 [22:17<11:22,  1.67s/it, loss=0.103, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00313, train/loss_step=0.397, global_step=1105.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  66%|██████▋   | 801/1208 [22:18<11:20,  1.67s/it, loss=0.103, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00313, train/loss_step=0.397, global_step=1105.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  66%|██████▋   | 801/1208 [22:18<11:20,  1.67s/it, loss=0.0912, v_num=0, train/loss_simple_step=0.00943, train/loss_vlb_step=4.42e-5, train/loss_step=0.00943, global_step=1106.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  66%|██████▋   | 802/1208 [22:19<11:18,  1.67s/it, loss=0.0912, v_num=0, train/loss_simple_step=0.00943, train/loss_vlb_step=4.42e-5, train/loss_step=0.00943, global_step=1106.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  66%|██████▋   | 802/1208 [22:19<11:18,  1.67s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.0634, train/loss_vlb_step=0.000216, train/loss_step=0.0634, global_step=1106.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  66%|██████▋   | 803/1208 [22:20<11:16,  1.67s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.0634, train/loss_vlb_step=0.000216, train/loss_step=0.0634, global_step=1106.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  66%|██████▋   | 803/1208 [22:20<11:16,  1.67s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.0321, train/loss_vlb_step=0.00012, train/loss_step=0.0321, global_step=1106.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  67%|██████▋   | 804/1208 [22:23<11:15,  1.67s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.0321, train/loss_vlb_step=0.00012, train/loss_step=0.0321, global_step=1106.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  67%|██████▋   | 804/1208 [22:23<11:15,  1.67s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.00042, train/loss_step=0.127, global_step=1106.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  67%|██████▋   | 805/1208 [22:24<11:13,  1.67s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.00042, train/loss_step=0.127, global_step=1106.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  67%|██████▋   | 805/1208 [22:24<11:13,  1.67s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000186, train/loss_step=0.0525, global_step=1107.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  67%|██████▋   | 806/1208 [22:25<11:11,  1.67s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000186, train/loss_step=0.0525, global_step=1107.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  67%|██████▋   | 806/1208 [22:25<11:11,  1.67s/it, loss=0.1, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000495, train/loss_step=0.148, global_step=1107.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]     Epoch 3:  67%|██████▋   | 807/1208 [22:26<11:09,  1.67s/it, loss=0.1, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000495, train/loss_step=0.148, global_step=1107.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  67%|██████▋   | 807/1208 [22:26<11:09,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00144, train/loss_step=0.289, global_step=1107.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  67%|██████▋   | 808/1208 [22:29<11:08,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00144, train/loss_step=0.289, global_step=1107.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  67%|██████▋   | 808/1208 [22:29<11:08,  1.67s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.23e-5, train/loss_step=0.0194, global_step=1107.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  67%|██████▋   | 809/1208 [22:30<11:06,  1.67s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.23e-5, train/loss_step=0.0194, global_step=1107.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  67%|██████▋   | 809/1208 [22:30<11:06,  1.67s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=3.01e-5, train/loss_step=0.00619, global_step=1108.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  67%|██████▋   | 810/1208 [22:31<11:04,  1.67s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=3.01e-5, train/loss_step=0.00619, global_step=1108.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  67%|██████▋   | 810/1208 [22:31<11:04,  1.67s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000601, train/loss_step=0.174, global_step=1108.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  67%|██████▋   | 811/1208 [22:32<11:02,  1.67s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000601, train/loss_step=0.174, global_step=1108.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  67%|██████▋   | 811/1208 [22:32<11:02,  1.67s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000129, train/loss_step=0.0342, global_step=1108.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  67%|██████▋   | 812/1208 [22:35<11:01,  1.67s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000129, train/loss_step=0.0342, global_step=1108.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  67%|██████▋   | 812/1208 [22:35<11:01,  1.67s/it, loss=0.0777, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.000143, train/loss_step=0.0394, global_step=1108.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  67%|██████▋   | 813/1208 [22:36<10:59,  1.67s/it, loss=0.0777, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.000143, train/loss_step=0.0394, global_step=1108.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  67%|██████▋   | 813/1208 [22:36<10:59,  1.67s/it, loss=0.0952, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00203, train/loss_step=0.354, global_step=1109.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  67%|██████▋   | 814/1208 [22:37<10:57,  1.67s/it, loss=0.0952, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00203, train/loss_step=0.354, global_step=1109.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  67%|██████▋   | 814/1208 [22:37<10:57,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.00188, train/loss_step=0.400, global_step=1109.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  67%|██████▋   | 815/1208 [22:38<10:55,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.00188, train/loss_step=0.400, global_step=1109.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  67%|██████▋   | 815/1208 [22:38<10:55,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.25e-5, train/loss_step=0.0139, global_step=1109.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  68%|██████▊   | 816/1208 [22:41<10:54,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.25e-5, train/loss_step=0.0139, global_step=1109.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  68%|██████▊   | 816/1208 [22:41<10:54,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.97e-5, train/loss_step=0.00349, global_step=1109.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  68%|██████▊   | 817/1208 [22:42<10:52,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.97e-5, train/loss_step=0.00349, global_step=1109.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  68%|██████▊   | 817/1208 [22:42<10:52,  1.67s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.44e-5, train/loss_step=0.0115, global_step=1110.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  68%|██████▊   | 818/1208 [22:43<10:50,  1.67s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.44e-5, train/loss_step=0.0115, global_step=1110.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  68%|██████▊   | 818/1208 [22:43<10:50,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00107, train/loss_step=0.256, global_step=1110.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  68%|██████▊   | 819/1208 [22:44<10:48,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00107, train/loss_step=0.256, global_step=1110.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  68%|██████▊   | 819/1208 [22:44<10:48,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.00342, train/loss_step=0.460, global_step=1110.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  68%|██████▊   | 820/1208 [22:47<10:46,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.00342, train/loss_step=0.460, global_step=1110.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  68%|██████▊   | 820/1208 [22:47<10:46,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.448, train/loss_vlb_step=0.00753, train/loss_step=0.448, global_step=1110.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  68%|██████▊   | 821/1208 [22:48<10:45,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.448, train/loss_vlb_step=0.00753, train/loss_step=0.448, global_step=1110.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  68%|██████▊   | 821/1208 [22:48<10:45,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.32e-5, train/loss_step=0.0112, global_step=1111.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  68%|██████▊   | 822/1208 [22:49<10:43,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.32e-5, train/loss_step=0.0112, global_step=1111.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  68%|██████▊   | 822/1208 [22:49<10:43,  1.67s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=1.42e-5, train/loss_step=0.0024, global_step=1111.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  68%|██████▊   | 823/1208 [22:50<10:41,  1.67s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=1.42e-5, train/loss_step=0.0024, global_step=1111.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  68%|██████▊   | 823/1208 [22:50<10:41,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00701, train/loss_vlb_step=3.3e-5, train/loss_step=0.00701, global_step=1111.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  68%|██████▊   | 824/1208 [22:53<10:39,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00701, train/loss_vlb_step=3.3e-5, train/loss_step=0.00701, global_step=1111.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  68%|██████▊   | 824/1208 [22:53<10:39,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00708, train/loss_vlb_step=3.62e-5, train/loss_step=0.00708, global_step=1111.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  68%|██████▊   | 825/1208 [22:54<10:38,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00708, train/loss_vlb_step=3.62e-5, train/loss_step=0.00708, global_step=1111.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  68%|██████▊   | 825/1208 [22:54<10:38,  1.67s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.81e-5, train/loss_step=0.0148, global_step=1112.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  68%|██████▊   | 826/1208 [22:55<10:36,  1.67s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.81e-5, train/loss_step=0.0148, global_step=1112.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  68%|██████▊   | 826/1208 [22:55<10:36,  1.67s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6.15e-5, train/loss_step=0.0135, global_step=1112.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  68%|██████▊   | 827/1208 [22:56<10:34,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6.15e-5, train/loss_step=0.0135, global_step=1112.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  68%|██████▊   | 827/1208 [22:56<10:34,  1.66s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00317, train/loss_vlb_step=1.77e-5, train/loss_step=0.00317, global_step=1112.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  69%|██████▊   | 828/1208 [22:59<10:32,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00317, train/loss_vlb_step=1.77e-5, train/loss_step=0.00317, global_step=1112.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  69%|██████▊   | 828/1208 [22:59<10:32,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.410, train/loss_vlb_step=0.00387, train/loss_step=0.410, global_step=1112.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  69%|██████▊   | 829/1208 [23:00<10:31,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.410, train/loss_vlb_step=0.00387, train/loss_step=0.410, global_step=1112.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  69%|██████▊   | 829/1208 [23:00<10:31,  1.66s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0671, train/loss_vlb_step=0.000227, train/loss_step=0.0671, global_step=1113.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  69%|██████▊   | 830/1208 [23:01<10:29,  1.66s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0671, train/loss_vlb_step=0.000227, train/loss_step=0.0671, global_step=1113.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  69%|██████▊   | 830/1208 [23:01<10:29,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=2.44e-5, train/loss_step=0.00448, global_step=1113.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  69%|██████▉   | 831/1208 [23:02<10:27,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=2.44e-5, train/loss_step=0.00448, global_step=1113.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  69%|██████▉   | 831/1208 [23:02<10:27,  1.66s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00835, train/loss_vlb_step=4.02e-5, train/loss_step=0.00835, global_step=1113.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  69%|██████▉   | 832/1208 [23:05<10:25,  1.66s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00835, train/loss_vlb_step=4.02e-5, train/loss_step=0.00835, global_step=1113.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  69%|██████▉   | 832/1208 [23:05<10:25,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00113, train/loss_step=0.278, global_step=1113.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  69%|██████▉   | 833/1208 [23:06<10:24,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00113, train/loss_step=0.278, global_step=1113.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  69%|██████▉   | 833/1208 [23:06<10:24,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=9.85e-5, train/loss_step=0.0249, global_step=1114.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  69%|██████▉   | 834/1208 [23:07<10:22,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=9.85e-5, train/loss_step=0.0249, global_step=1114.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  69%|██████▉   | 834/1208 [23:07<10:22,  1.66s/it, loss=0.114, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000886, train/loss_step=0.238, global_step=1114.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  69%|██████▉   | 835/1208 [23:08<10:20,  1.66s/it, loss=0.114, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000886, train/loss_step=0.238, global_step=1114.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  69%|██████▉   | 835/1208 [23:08<10:20,  1.66s/it, loss=0.12, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000405, train/loss_step=0.122, global_step=1114.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  69%|██████▉   | 836/1208 [23:11<10:18,  1.66s/it, loss=0.12, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000405, train/loss_step=0.122, global_step=1114.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  69%|██████▉   | 836/1208 [23:11<10:18,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.061, train/loss_vlb_step=0.000209, train/loss_step=0.061, global_step=1114.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  69%|██████▉   | 837/1208 [23:12<10:17,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.061, train/loss_vlb_step=0.000209, train/loss_step=0.061, global_step=1114.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  69%|██████▉   | 837/1208 [23:12<10:17,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00302, train/loss_step=0.439, global_step=1115.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  69%|██████▉   | 838/1208 [23:13<10:15,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00302, train/loss_step=0.439, global_step=1115.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  69%|██████▉   | 838/1208 [23:13<10:15,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000182, train/loss_step=0.0524, global_step=1115.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  69%|██████▉   | 839/1208 [23:14<10:13,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000182, train/loss_step=0.0524, global_step=1115.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  69%|██████▉   | 839/1208 [23:14<10:13,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.702, train/loss_vlb_step=0.0196, train/loss_step=0.702, global_step=1115.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  70%|██████▉   | 840/1208 [23:16<10:12,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.702, train/loss_vlb_step=0.0196, train/loss_step=0.702, global_step=1115.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  70%|██████▉   | 840/1208 [23:17<10:12,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00157, train/loss_step=0.316, global_step=1115.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  70%|██████▉   | 841/1208 [23:18<10:10,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00157, train/loss_step=0.316, global_step=1115.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  70%|██████▉   | 841/1208 [23:18<10:10,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000476, train/loss_step=0.142, global_step=1116.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  70%|██████▉   | 842/1208 [23:19<10:08,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000476, train/loss_step=0.142, global_step=1116.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  70%|██████▉   | 842/1208 [23:19<10:08,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0922, train/loss_vlb_step=0.000308, train/loss_step=0.0922, global_step=1116.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  70%|██████▉   | 843/1208 [23:20<10:06,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0922, train/loss_vlb_step=0.000308, train/loss_step=0.0922, global_step=1116.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  70%|██████▉   | 843/1208 [23:20<10:06,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00429, train/loss_vlb_step=2.24e-5, train/loss_step=0.00429, global_step=1116.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  70%|██████▉   | 844/1208 [23:22<10:05,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00429, train/loss_vlb_step=2.24e-5, train/loss_step=0.00429, global_step=1116.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  70%|██████▉   | 844/1208 [23:22<10:05,  1.66s/it, loss=0.178, v_num=0, train/loss_simple_step=0.577, train/loss_vlb_step=0.018, train/loss_step=0.577, global_step=1116.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]     Epoch 3:  70%|██████▉   | 845/1208 [23:23<10:03,  1.66s/it, loss=0.178, v_num=0, train/loss_simple_step=0.577, train/loss_vlb_step=0.018, train/loss_step=0.577, global_step=1116.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  70%|██████▉   | 845/1208 [23:23<10:03,  1.66s/it, loss=0.178, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.2e-5, train/loss_step=0.002, global_step=1117.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  70%|███████   | 846/1208 [23:24<10:01,  1.66s/it, loss=0.178, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.2e-5, train/loss_step=0.002, global_step=1117.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  70%|███████   | 846/1208 [23:24<10:01,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0782, train/loss_vlb_step=0.000265, train/loss_step=0.0782, global_step=1117.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  70%|███████   | 847/1208 [23:25<09:59,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0782, train/loss_vlb_step=0.000265, train/loss_step=0.0782, global_step=1117.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  70%|███████   | 847/1208 [23:25<09:59,  1.66s/it, loss=0.193, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000985, train/loss_step=0.236, global_step=1117.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  70%|███████   | 848/1208 [23:28<09:58,  1.66s/it, loss=0.193, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000985, train/loss_step=0.236, global_step=1117.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  70%|███████   | 848/1208 [23:28<09:58,  1.66s/it, loss=0.185, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000983, train/loss_step=0.250, global_step=1117.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  70%|███████   | 849/1208 [23:29<09:56,  1.66s/it, loss=0.185, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000983, train/loss_step=0.250, global_step=1117.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  70%|███████   | 849/1208 [23:29<09:56,  1.66s/it, loss=0.184, v_num=0, train/loss_simple_step=0.056, train/loss_vlb_step=0.000195, train/loss_step=0.056, global_step=1118.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  70%|███████   | 850/1208 [23:30<09:54,  1.66s/it, loss=0.184, v_num=0, train/loss_simple_step=0.056, train/loss_vlb_step=0.000195, train/loss_step=0.056, global_step=1118.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  70%|███████   | 850/1208 [23:30<09:54,  1.66s/it, loss=0.199, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00156, train/loss_step=0.301, global_step=1118.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  70%|███████   | 851/1208 [23:31<09:52,  1.66s/it, loss=0.199, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00156, train/loss_step=0.301, global_step=1118.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  70%|███████   | 851/1208 [23:31<09:52,  1.66s/it, loss=0.215, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00159, train/loss_step=0.324, global_step=1118.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  71%|███████   | 852/1208 [23:34<09:51,  1.66s/it, loss=0.215, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00159, train/loss_step=0.324, global_step=1118.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  71%|███████   | 852/1208 [23:34<09:51,  1.66s/it, loss=0.204, v_num=0, train/loss_simple_step=0.0599, train/loss_vlb_step=0.00021, train/loss_step=0.0599, global_step=1118.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  71%|███████   | 853/1208 [23:35<09:49,  1.66s/it, loss=0.204, v_num=0, train/loss_simple_step=0.0599, train/loss_vlb_step=0.00021, train/loss_step=0.0599, global_step=1118.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  71%|███████   | 853/1208 [23:35<09:49,  1.66s/it, loss=0.215, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000971, train/loss_step=0.250, global_step=1119.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  71%|███████   | 854/1208 [23:36<09:47,  1.66s/it, loss=0.215, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000971, train/loss_step=0.250, global_step=1119.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  71%|███████   | 854/1208 [23:36<09:47,  1.66s/it, loss=0.209, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000371, train/loss_step=0.113, global_step=1119.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  71%|███████   | 855/1208 [23:37<09:45,  1.66s/it, loss=0.209, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000371, train/loss_step=0.113, global_step=1119.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  71%|███████   | 855/1208 [23:37<09:45,  1.66s/it, loss=0.21, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000455, train/loss_step=0.138, global_step=1119.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  71%|███████   | 856/1208 [23:41<09:44,  1.66s/it, loss=0.21, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000455, train/loss_step=0.138, global_step=1119.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  71%|███████   | 856/1208 [23:41<09:44,  1.66s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.29e-5, train/loss_step=0.0114, global_step=1119.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  71%|███████   | 857/1208 [23:42<09:42,  1.66s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.29e-5, train/loss_step=0.0114, global_step=1119.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  71%|███████   | 857/1208 [23:42<09:42,  1.66s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000148, train/loss_step=0.0388, global_step=1120.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  71%|███████   | 858/1208 [23:43<09:40,  1.66s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000148, train/loss_step=0.0388, global_step=1120.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  71%|███████   | 858/1208 [23:43<09:40,  1.66s/it, loss=0.204, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00305, train/loss_step=0.395, global_step=1120.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  71%|███████   | 859/1208 [23:44<09:38,  1.66s/it, loss=0.204, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00305, train/loss_step=0.395, global_step=1120.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  71%|███████   | 859/1208 [23:44<09:38,  1.66s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.00012, train/loss_step=0.0332, global_step=1120.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  71%|███████   | 860/1208 [23:47<09:37,  1.66s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.00012, train/loss_step=0.0332, global_step=1120.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  71%|███████   | 860/1208 [23:47<09:37,  1.66s/it, loss=0.162, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000453, train/loss_step=0.135, global_step=1120.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  71%|███████▏  | 861/1208 [23:48<09:35,  1.66s/it, loss=0.162, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000453, train/loss_step=0.135, global_step=1120.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  71%|███████▏  | 861/1208 [23:48<09:35,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00106, train/loss_step=0.269, global_step=1121.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  71%|███████▏  | 862/1208 [23:49<09:33,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00106, train/loss_step=0.269, global_step=1121.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  71%|███████▏  | 862/1208 [23:49<09:33,  1.66s/it, loss=0.173, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000754, train/loss_step=0.192, global_step=1121.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  71%|███████▏  | 863/1208 [23:50<09:31,  1.66s/it, loss=0.173, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000754, train/loss_step=0.192, global_step=1121.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  71%|███████▏  | 863/1208 [23:50<09:31,  1.66s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0532, train/loss_vlb_step=0.000188, train/loss_step=0.0532, global_step=1121.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  72%|███████▏  | 864/1208 [23:53<09:30,  1.66s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0532, train/loss_vlb_step=0.000188, train/loss_step=0.0532, global_step=1121.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  72%|███████▏  | 864/1208 [23:53<09:30,  1.66s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.17e-5, train/loss_step=0.00194, global_step=1121.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  72%|███████▏  | 865/1208 [23:54<09:28,  1.66s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.17e-5, train/loss_step=0.00194, global_step=1121.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  72%|███████▏  | 865/1208 [23:54<09:28,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000188, train/loss_step=0.0514, global_step=1122.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  72%|███████▏  | 866/1208 [23:55<09:27,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000188, train/loss_step=0.0514, global_step=1122.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  72%|███████▏  | 866/1208 [23:55<09:27,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0625, train/loss_vlb_step=0.000222, train/loss_step=0.0625, global_step=1122.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  72%|███████▏  | 867/1208 [23:56<09:25,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0625, train/loss_vlb_step=0.000222, train/loss_step=0.0625, global_step=1122.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  72%|███████▏  | 867/1208 [23:56<09:25,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00405, train/loss_step=0.423, global_step=1122.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  72%|███████▏  | 868/1208 [24:00<09:24,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00405, train/loss_step=0.423, global_step=1122.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  72%|███████▏  | 868/1208 [24:00<09:24,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0699, train/loss_vlb_step=0.00024, train/loss_step=0.0699, global_step=1122.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  72%|███████▏  | 869/1208 [24:01<09:22,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0699, train/loss_vlb_step=0.00024, train/loss_step=0.0699, global_step=1122.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  72%|███████▏  | 869/1208 [24:01<09:22,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000929, train/loss_step=0.229, global_step=1123.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  72%|███████▏  | 870/1208 [24:02<09:20,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000929, train/loss_step=0.229, global_step=1123.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  72%|███████▏  | 870/1208 [24:02<09:20,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0734, train/loss_vlb_step=0.000252, train/loss_step=0.0734, global_step=1123.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  72%|███████▏  | 871/1208 [24:03<09:18,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0734, train/loss_vlb_step=0.000252, train/loss_step=0.0734, global_step=1123.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  72%|███████▏  | 871/1208 [24:03<09:18,  1.66s/it, loss=0.137, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000449, train/loss_step=0.137, global_step=1123.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  72%|███████▏  | 872/1208 [24:06<09:17,  1.66s/it, loss=0.137, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000449, train/loss_step=0.137, global_step=1123.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  72%|███████▏  | 872/1208 [24:06<09:17,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.0015, train/loss_step=0.331, global_step=1123.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  72%|███████▏  | 873/1208 [24:07<09:15,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.0015, train/loss_step=0.331, global_step=1123.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  72%|███████▏  | 873/1208 [24:07<09:15,  1.66s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0735, train/loss_vlb_step=0.00025, train/loss_step=0.0735, global_step=1124.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  72%|███████▏  | 874/1208 [24:08<09:13,  1.66s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0735, train/loss_vlb_step=0.00025, train/loss_step=0.0735, global_step=1124.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  72%|███████▏  | 874/1208 [24:08<09:13,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000598, train/loss_step=0.177, global_step=1124.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  72%|███████▏  | 875/1208 [24:09<09:11,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000598, train/loss_step=0.177, global_step=1124.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  72%|███████▏  | 875/1208 [24:09<09:11,  1.66s/it, loss=0.171, v_num=0, train/loss_simple_step=0.656, train/loss_vlb_step=0.0264, train/loss_step=0.656, global_step=1124.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  73%|███████▎  | 876/1208 [24:13<09:10,  1.66s/it, loss=0.171, v_num=0, train/loss_simple_step=0.656, train/loss_vlb_step=0.0264, train/loss_step=0.656, global_step=1124.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  73%|███████▎  | 876/1208 [24:13<09:10,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000837, train/loss_step=0.211, global_step=1124.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  73%|███████▎  | 877/1208 [24:14<09:08,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000837, train/loss_step=0.211, global_step=1124.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  73%|███████▎  | 877/1208 [24:14<09:08,  1.66s/it, loss=0.2, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00292, train/loss_step=0.428, global_step=1125.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  73%|███████▎  | 878/1208 [24:15<09:06,  1.66s/it, loss=0.2, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00292, train/loss_step=0.428, global_step=1125.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  73%|███████▎  | 878/1208 [24:15<09:06,  1.66s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0906, train/loss_vlb_step=0.000298, train/loss_step=0.0906, global_step=1125.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  73%|███████▎  | 879/1208 [24:16<09:05,  1.66s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0906, train/loss_vlb_step=0.000298, train/loss_step=0.0906, global_step=1125.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  73%|███████▎  | 879/1208 [24:16<09:05,  1.66s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.000179, train/loss_step=0.0499, global_step=1125.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  73%|███████▎  | 880/1208 [24:19<09:03,  1.66s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.000179, train/loss_step=0.0499, global_step=1125.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  73%|███████▎  | 880/1208 [24:19<09:03,  1.66s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.47e-5, train/loss_step=0.0197, global_step=1125.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  73%|███████▎  | 881/1208 [24:20<09:02,  1.66s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.47e-5, train/loss_step=0.0197, global_step=1125.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  73%|███████▎  | 881/1208 [24:20<09:02,  1.66s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.35e-5, train/loss_step=0.00225, global_step=1126.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  73%|███████▎  | 882/1208 [24:21<09:00,  1.66s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.35e-5, train/loss_step=0.00225, global_step=1126.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  73%|███████▎  | 882/1208 [24:21<09:00,  1.66s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000137, train/loss_step=0.0363, global_step=1126.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  73%|███████▎  | 883/1208 [24:22<08:58,  1.66s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000137, train/loss_step=0.0363, global_step=1126.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  73%|███████▎  | 883/1208 [24:22<08:58,  1.66s/it, loss=0.164, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000529, train/loss_step=0.158, global_step=1126.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  73%|███████▎  | 884/1208 [24:25<08:57,  1.66s/it, loss=0.164, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000529, train/loss_step=0.158, global_step=1126.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  73%|███████▎  | 884/1208 [24:25<08:57,  1.66s/it, loss=0.197, v_num=0, train/loss_simple_step=0.664, train/loss_vlb_step=0.0206, train/loss_step=0.664, global_step=1126.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  73%|███████▎  | 885/1208 [24:26<08:55,  1.66s/it, loss=0.197, v_num=0, train/loss_simple_step=0.664, train/loss_vlb_step=0.0206, train/loss_step=0.664, global_step=1126.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  73%|███████▎  | 885/1208 [24:26<08:55,  1.66s/it, loss=0.201, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=1127.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  73%|███████▎  | 886/1208 [24:27<08:53,  1.66s/it, loss=0.201, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=1127.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  73%|███████▎  | 886/1208 [24:27<08:53,  1.66s/it, loss=0.2, v_num=0, train/loss_simple_step=0.049, train/loss_vlb_step=0.000173, train/loss_step=0.049, global_step=1127.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  73%|███████▎  | 887/1208 [24:28<08:51,  1.66s/it, loss=0.2, v_num=0, train/loss_simple_step=0.049, train/loss_vlb_step=0.000173, train/loss_step=0.049, global_step=1127.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  73%|███████▎  | 887/1208 [24:28<08:51,  1.66s/it, loss=0.186, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000472, train/loss_step=0.142, global_step=1127.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  74%|███████▎  | 888/1208 [24:32<08:50,  1.66s/it, loss=0.186, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000472, train/loss_step=0.142, global_step=1127.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  74%|███████▎  | 888/1208 [24:32<08:50,  1.66s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0874, train/loss_vlb_step=0.000296, train/loss_step=0.0874, global_step=1127.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  74%|███████▎  | 889/1208 [24:33<08:48,  1.66s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0874, train/loss_vlb_step=0.000296, train/loss_step=0.0874, global_step=1127.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  74%|███████▎  | 889/1208 [24:33<08:48,  1.66s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0939, train/loss_vlb_step=0.000316, train/loss_step=0.0939, global_step=1128.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  74%|███████▎  | 890/1208 [24:34<08:46,  1.66s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0939, train/loss_vlb_step=0.000316, train/loss_step=0.0939, global_step=1128.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  74%|███████▎  | 890/1208 [24:34<08:46,  1.66s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00831, train/loss_vlb_step=3.97e-5, train/loss_step=0.00831, global_step=1128.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  74%|███████▍  | 891/1208 [24:35<08:44,  1.66s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00831, train/loss_vlb_step=3.97e-5, train/loss_step=0.00831, global_step=1128.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  74%|███████▍  | 891/1208 [24:35<08:44,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00847, train/loss_vlb_step=4.09e-5, train/loss_step=0.00847, global_step=1128.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  74%|███████▍  | 892/1208 [24:38<08:43,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00847, train/loss_vlb_step=4.09e-5, train/loss_step=0.00847, global_step=1128.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  74%|███████▍  | 892/1208 [24:38<08:43,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00166, train/loss_step=0.322, global_step=1128.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  74%|███████▍  | 893/1208 [24:39<08:41,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00166, train/loss_step=0.322, global_step=1128.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  74%|███████▍  | 893/1208 [24:39<08:41,  1.66s/it, loss=0.189, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00383, train/loss_step=0.457, global_step=1129.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  74%|███████▍  | 894/1208 [24:40<08:40,  1.66s/it, loss=0.189, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00383, train/loss_step=0.457, global_step=1129.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  74%|███████▍  | 894/1208 [24:40<08:40,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.95e-5, train/loss_step=0.0135, global_step=1129.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  74%|███████▍  | 895/1208 [24:41<08:38,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.95e-5, train/loss_step=0.0135, global_step=1129.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  74%|███████▍  | 895/1208 [24:41<08:38,  1.66s/it, loss=0.173, v_num=0, train/loss_simple_step=0.489, train/loss_vlb_step=0.00677, train/loss_step=0.489, global_step=1129.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  74%|███████▍  | 896/1208 [24:44<08:37,  1.66s/it, loss=0.173, v_num=0, train/loss_simple_step=0.489, train/loss_vlb_step=0.00677, train/loss_step=0.489, global_step=1129.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  74%|███████▍  | 896/1208 [24:44<08:37,  1.66s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0498, train/loss_vlb_step=0.000177, train/loss_step=0.0498, global_step=1129.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  74%|███████▍  | 897/1208 [24:46<08:35,  1.66s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0498, train/loss_vlb_step=0.000177, train/loss_step=0.0498, global_step=1129.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  74%|███████▍  | 897/1208 [24:46<08:35,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.84e-5, train/loss_step=0.0239, global_step=1130.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  74%|███████▍  | 898/1208 [24:47<08:33,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.84e-5, train/loss_step=0.0239, global_step=1130.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  74%|███████▍  | 898/1208 [24:47<08:33,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000383, train/loss_step=0.117, global_step=1130.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  74%|███████▍  | 899/1208 [24:48<08:31,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000383, train/loss_step=0.117, global_step=1130.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  74%|███████▍  | 899/1208 [24:48<08:31,  1.66s/it, loss=0.171, v_num=0, train/loss_simple_step=0.550, train/loss_vlb_step=0.0111, train/loss_step=0.550, global_step=1130.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  75%|███████▍  | 900/1208 [24:51<08:30,  1.66s/it, loss=0.171, v_num=0, train/loss_simple_step=0.550, train/loss_vlb_step=0.0111, train/loss_step=0.550, global_step=1130.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  75%|███████▍  | 900/1208 [24:51<08:30,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000857, train/loss_step=0.224, global_step=1130.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.75it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.75it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.76it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.76it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.76it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.78it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.75it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.75it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.75it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.75it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.80it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.75it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 3:  75%|███████▍  | 901/1208 [25:21<08:38,  1.69s/it, loss=0.181, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000857, train/loss_step=0.224, global_step=1130.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  75%|███████▍  | 901/1208 [25:21<08:38,  1.69s/it, loss=0.191, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000748, train/loss_step=0.202, global_step=1131.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  75%|███████▍  | 902/1208 [25:22<08:36,  1.69s/it, loss=0.191, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000748, train/loss_step=0.202, global_step=1131.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  75%|███████▍  | 902/1208 [25:22<08:36,  1.69s/it, loss=0.19, v_num=0, train/loss_simple_step=0.00808, train/loss_vlb_step=4.08e-5, train/loss_step=0.00808, global_step=1131.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  75%|███████▍  | 903/1208 [25:23<08:34,  1.69s/it, loss=0.19, v_num=0, train/loss_simple_step=0.00808, train/loss_vlb_step=4.08e-5, train/loss_step=0.00808, global_step=1131.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  75%|███████▍  | 903/1208 [25:23<08:34,  1.69s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.77e-5, train/loss_step=0.0032, global_step=1131.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  75%|███████▍  | 904/1208 [25:27<08:33,  1.69s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.77e-5, train/loss_step=0.0032, global_step=1131.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  75%|███████▍  | 904/1208 [25:27<08:33,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.91e-5, train/loss_step=0.0216, global_step=1131.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  75%|███████▍  | 905/1208 [25:28<08:31,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.91e-5, train/loss_step=0.0216, global_step=1131.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  75%|███████▍  | 905/1208 [25:28<08:31,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00867, train/loss_vlb_step=4.17e-5, train/loss_step=0.00867, global_step=1132.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  75%|███████▌  | 906/1208 [25:29<08:29,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00867, train/loss_vlb_step=4.17e-5, train/loss_step=0.00867, global_step=1132.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  75%|███████▌  | 906/1208 [25:29<08:29,  1.69s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0752, train/loss_vlb_step=0.000254, train/loss_step=0.0752, global_step=1132.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  75%|███████▌  | 907/1208 [25:30<08:27,  1.69s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0752, train/loss_vlb_step=0.000254, train/loss_step=0.0752, global_step=1132.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  75%|███████▌  | 907/1208 [25:30<08:27,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000626, train/loss_step=0.180, global_step=1132.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  75%|███████▌  | 908/1208 [25:33<08:26,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000626, train/loss_step=0.180, global_step=1132.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  75%|███████▌  | 908/1208 [25:33<08:26,  1.69s/it, loss=0.164, v_num=0, train/loss_simple_step=0.416, train/loss_vlb_step=0.0042, train/loss_step=0.416, global_step=1132.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  75%|███████▌  | 909/1208 [25:34<08:24,  1.69s/it, loss=0.164, v_num=0, train/loss_simple_step=0.416, train/loss_vlb_step=0.0042, train/loss_step=0.416, global_step=1132.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  75%|███████▌  | 909/1208 [25:34<08:24,  1.69s/it, loss=0.179, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00224, train/loss_step=0.412, global_step=1133.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  75%|███████▌  | 910/1208 [25:35<08:22,  1.69s/it, loss=0.179, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00224, train/loss_step=0.412, global_step=1133.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  75%|███████▌  | 910/1208 [25:35<08:22,  1.69s/it, loss=0.186, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000481, train/loss_step=0.146, global_step=1133.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  75%|███████▌  | 911/1208 [25:36<08:20,  1.69s/it, loss=0.186, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000481, train/loss_step=0.146, global_step=1133.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  75%|███████▌  | 911/1208 [25:36<08:20,  1.69s/it, loss=0.209, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00557, train/loss_step=0.454, global_step=1133.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  75%|███████▌  | 912/1208 [25:39<08:19,  1.69s/it, loss=0.209, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00557, train/loss_step=0.454, global_step=1133.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  75%|███████▌  | 912/1208 [25:39<08:19,  1.69s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00703, train/loss_vlb_step=3.52e-5, train/loss_step=0.00703, global_step=1133.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  76%|███████▌  | 913/1208 [25:40<08:17,  1.69s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00703, train/loss_vlb_step=3.52e-5, train/loss_step=0.00703, global_step=1133.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  76%|███████▌  | 913/1208 [25:40<08:17,  1.69s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.000155, train/loss_step=0.0395, global_step=1134.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  76%|███████▌  | 914/1208 [25:41<08:15,  1.69s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.000155, train/loss_step=0.0395, global_step=1134.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  76%|███████▌  | 914/1208 [25:41<08:15,  1.69s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00671, train/loss_vlb_step=3.35e-5, train/loss_step=0.00671, global_step=1134.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  76%|███████▌  | 915/1208 [25:43<08:14,  1.69s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00671, train/loss_vlb_step=3.35e-5, train/loss_step=0.00671, global_step=1134.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  76%|███████▌  | 915/1208 [25:43<08:14,  1.69s/it, loss=0.158, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.00079, train/loss_step=0.222, global_step=1134.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  76%|███████▌  | 916/1208 [25:46<08:12,  1.69s/it, loss=0.158, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.00079, train/loss_step=0.222, global_step=1134.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  76%|███████▌  | 916/1208 [25:46<08:12,  1.69s/it, loss=0.17, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00126, train/loss_step=0.276, global_step=1134.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  76%|███████▌  | 917/1208 [25:47<08:11,  1.69s/it, loss=0.17, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00126, train/loss_step=0.276, global_step=1134.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  76%|███████▌  | 917/1208 [25:47<08:11,  1.69s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0398, train/loss_vlb_step=0.000143, train/loss_step=0.0398, global_step=1135.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  76%|███████▌  | 918/1208 [25:48<08:09,  1.69s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0398, train/loss_vlb_step=0.000143, train/loss_step=0.0398, global_step=1135.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  76%|███████▌  | 918/1208 [25:48<08:09,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000153, train/loss_step=0.0415, global_step=1135.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  76%|███████▌  | 919/1208 [25:49<08:07,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000153, train/loss_step=0.0415, global_step=1135.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  76%|███████▌  | 919/1208 [25:49<08:07,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000537, train/loss_step=0.160, global_step=1135.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  76%|███████▌  | 920/1208 [25:52<08:06,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000537, train/loss_step=0.160, global_step=1135.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  76%|███████▌  | 920/1208 [25:52<08:06,  1.69s/it, loss=0.155, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00268, train/loss_step=0.386, global_step=1135.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  76%|███████▌  | 921/1208 [25:53<08:04,  1.69s/it, loss=0.155, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00268, train/loss_step=0.386, global_step=1135.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  76%|███████▌  | 921/1208 [25:53<08:04,  1.69s/it, loss=0.175, v_num=0, train/loss_simple_step=0.594, train/loss_vlb_step=0.0112, train/loss_step=0.594, global_step=1136.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  76%|███████▋  | 922/1208 [25:54<08:02,  1.69s/it, loss=0.175, v_num=0, train/loss_simple_step=0.594, train/loss_vlb_step=0.0112, train/loss_step=0.594, global_step=1136.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  76%|███████▋  | 922/1208 [25:54<08:02,  1.69s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000126, train/loss_step=0.0327, global_step=1136.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  76%|███████▋  | 923/1208 [25:55<08:00,  1.69s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000126, train/loss_step=0.0327, global_step=1136.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  76%|███████▋  | 923/1208 [25:55<08:00,  1.69s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.17e-5, train/loss_step=0.0109, global_step=1136.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  76%|███████▋  | 924/1208 [25:58<07:59,  1.69s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.17e-5, train/loss_step=0.0109, global_step=1136.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  76%|███████▋  | 924/1208 [25:58<07:59,  1.69s/it, loss=0.195, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.0029, train/loss_step=0.382, global_step=1136.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  77%|███████▋  | 925/1208 [26:00<07:57,  1.69s/it, loss=0.195, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.0029, train/loss_step=0.382, global_step=1136.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  77%|███████▋  | 925/1208 [26:00<07:57,  1.69s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.3e-5, train/loss_step=0.0118, global_step=1137.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  77%|███████▋  | 926/1208 [26:01<07:55,  1.69s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.3e-5, train/loss_step=0.0118, global_step=1137.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  77%|███████▋  | 926/1208 [26:01<07:55,  1.69s/it, loss=0.197, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000429, train/loss_step=0.130, global_step=1137.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  77%|███████▋  | 927/1208 [26:02<07:53,  1.69s/it, loss=0.197, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000429, train/loss_step=0.130, global_step=1137.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  77%|███████▋  | 927/1208 [26:02<07:53,  1.69s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.18e-5, train/loss_step=0.0194, global_step=1137.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  77%|███████▋  | 928/1208 [26:05<07:52,  1.69s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.18e-5, train/loss_step=0.0194, global_step=1137.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  77%|███████▋  | 928/1208 [26:05<07:52,  1.69s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0595, train/loss_vlb_step=0.000209, train/loss_step=0.0595, global_step=1137.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  77%|███████▋  | 929/1208 [26:06<07:50,  1.69s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0595, train/loss_vlb_step=0.000209, train/loss_step=0.0595, global_step=1137.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  77%|███████▋  | 929/1208 [26:06<07:50,  1.69s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000182, train/loss_step=0.0524, global_step=1138.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  77%|███████▋  | 930/1208 [26:07<07:48,  1.69s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000182, train/loss_step=0.0524, global_step=1138.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  77%|███████▋  | 930/1208 [26:07<07:48,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00549, train/loss_vlb_step=2.84e-5, train/loss_step=0.00549, global_step=1138.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  77%|███████▋  | 931/1208 [26:08<07:46,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00549, train/loss_vlb_step=2.84e-5, train/loss_step=0.00549, global_step=1138.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  77%|███████▋  | 931/1208 [26:08<07:46,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00667, train/loss_vlb_step=3.47e-5, train/loss_step=0.00667, global_step=1138.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  77%|███████▋  | 932/1208 [26:11<07:45,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00667, train/loss_vlb_step=3.47e-5, train/loss_step=0.00667, global_step=1138.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  77%|███████▋  | 932/1208 [26:11<07:45,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00951, train/loss_vlb_step=4.41e-5, train/loss_step=0.00951, global_step=1138.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  77%|███████▋  | 933/1208 [26:12<07:43,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00951, train/loss_vlb_step=4.41e-5, train/loss_step=0.00951, global_step=1138.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  77%|███████▋  | 933/1208 [26:12<07:43,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.32e-5, train/loss_step=0.0121, global_step=1139.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  77%|███████▋  | 934/1208 [26:13<07:41,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.32e-5, train/loss_step=0.0121, global_step=1139.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  77%|███████▋  | 934/1208 [26:13<07:41,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.92e-5, train/loss_step=0.00344, global_step=1139.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  77%|███████▋  | 935/1208 [26:14<07:39,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.92e-5, train/loss_step=0.00344, global_step=1139.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  77%|███████▋  | 935/1208 [26:14<07:39,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.000203, train/loss_step=0.0598, global_step=1139.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  77%|███████▋  | 936/1208 [26:18<07:38,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.000203, train/loss_step=0.0598, global_step=1139.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  77%|███████▋  | 936/1208 [26:18<07:38,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000379, train/loss_step=0.113, global_step=1139.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  78%|███████▊  | 937/1208 [26:19<07:36,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000379, train/loss_step=0.113, global_step=1139.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  78%|███████▊  | 937/1208 [26:19<07:36,  1.69s/it, loss=0.111, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000406, train/loss_step=0.123, global_step=1140.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  78%|███████▊  | 938/1208 [26:20<07:34,  1.68s/it, loss=0.111, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000406, train/loss_step=0.123, global_step=1140.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  78%|███████▊  | 938/1208 [26:20<07:34,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=2.51e-5, train/loss_step=0.00451, global_step=1140.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  78%|███████▊  | 939/1208 [26:21<07:32,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=2.51e-5, train/loss_step=0.00451, global_step=1140.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  78%|███████▊  | 939/1208 [26:21<07:33,  1.68s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0496, train/loss_vlb_step=0.000182, train/loss_step=0.0496, global_step=1140.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  78%|███████▊  | 940/1208 [26:24<07:31,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0496, train/loss_vlb_step=0.000182, train/loss_step=0.0496, global_step=1140.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  78%|███████▊  | 940/1208 [26:24<07:31,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.728, train/loss_vlb_step=0.0377, train/loss_step=0.728, global_step=1140.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]     Epoch 3:  78%|███████▊  | 941/1208 [26:25<07:29,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.728, train/loss_vlb_step=0.0377, train/loss_step=0.728, global_step=1140.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  78%|███████▊  | 941/1208 [26:25<07:29,  1.68s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.00386, train/loss_vlb_step=2.21e-5, train/loss_step=0.00386, global_step=1141.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  78%|███████▊  | 942/1208 [26:26<07:28,  1.68s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.00386, train/loss_vlb_step=2.21e-5, train/loss_step=0.00386, global_step=1141.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  78%|███████▊  | 942/1208 [26:26<07:28,  1.68s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.0563, train/loss_vlb_step=0.0002, train/loss_step=0.0563, global_step=1141.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  78%|███████▊  | 943/1208 [26:27<07:26,  1.68s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.0563, train/loss_vlb_step=0.0002, train/loss_step=0.0563, global_step=1141.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  78%|███████▊  | 943/1208 [26:27<07:26,  1.68s/it, loss=0.0918, v_num=0, train/loss_simple_step=0.00458, train/loss_vlb_step=2.48e-5, train/loss_step=0.00458, global_step=1141.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  78%|███████▊  | 944/1208 [26:30<07:24,  1.69s/it, loss=0.0918, v_num=0, train/loss_simple_step=0.00458, train/loss_vlb_step=2.48e-5, train/loss_step=0.00458, global_step=1141.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  78%|███████▊  | 944/1208 [26:30<07:24,  1.69s/it, loss=0.0728, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.35e-5, train/loss_step=0.00233, global_step=1141.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  78%|███████▊  | 945/1208 [26:31<07:23,  1.68s/it, loss=0.0728, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.35e-5, train/loss_step=0.00233, global_step=1141.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  78%|███████▊  | 945/1208 [26:31<07:23,  1.68s/it, loss=0.0846, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00105, train/loss_step=0.249, global_step=1142.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  78%|███████▊  | 946/1208 [26:33<07:21,  1.68s/it, loss=0.0846, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00105, train/loss_step=0.249, global_step=1142.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  78%|███████▊  | 946/1208 [26:33<07:21,  1.68s/it, loss=0.0782, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.56e-5, train/loss_step=0.00265, global_step=1142.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  78%|███████▊  | 947/1208 [26:34<07:19,  1.68s/it, loss=0.0782, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.56e-5, train/loss_step=0.00265, global_step=1142.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  78%|███████▊  | 947/1208 [26:34<07:19,  1.68s/it, loss=0.0797, v_num=0, train/loss_simple_step=0.0487, train/loss_vlb_step=0.000176, train/loss_step=0.0487, global_step=1142.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  78%|███████▊  | 948/1208 [26:37<07:18,  1.68s/it, loss=0.0797, v_num=0, train/loss_simple_step=0.0487, train/loss_vlb_step=0.000176, train/loss_step=0.0487, global_step=1142.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  78%|███████▊  | 948/1208 [26:37<07:18,  1.68s/it, loss=0.101, v_num=0, train/loss_simple_step=0.483, train/loss_vlb_step=0.0036, train/loss_step=0.483, global_step=1142.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]     Epoch 3:  79%|███████▊  | 949/1208 [26:38<07:16,  1.68s/it, loss=0.101, v_num=0, train/loss_simple_step=0.483, train/loss_vlb_step=0.0036, train/loss_step=0.483, global_step=1142.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  79%|███████▊  | 949/1208 [26:38<07:16,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.443, train/loss_vlb_step=0.00303, train/loss_step=0.443, global_step=1143.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  79%|███████▊  | 950/1208 [26:39<07:14,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.443, train/loss_vlb_step=0.00303, train/loss_step=0.443, global_step=1143.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  79%|███████▊  | 950/1208 [26:39<07:14,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000758, train/loss_step=0.209, global_step=1143.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  79%|███████▊  | 951/1208 [26:40<07:12,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000758, train/loss_step=0.209, global_step=1143.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  79%|███████▊  | 951/1208 [26:40<07:12,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000186, train/loss_step=0.0514, global_step=1143.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  79%|███████▉  | 952/1208 [26:43<07:11,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000186, train/loss_step=0.0514, global_step=1143.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  79%|███████▉  | 952/1208 [26:43<07:11,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.51e-5, train/loss_step=0.00265, global_step=1143.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  79%|███████▉  | 953/1208 [26:44<07:09,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.51e-5, train/loss_step=0.00265, global_step=1143.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  79%|███████▉  | 953/1208 [26:44<07:09,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0414, train/loss_vlb_step=0.000153, train/loss_step=0.0414, global_step=1144.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  79%|███████▉  | 954/1208 [26:45<07:07,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0414, train/loss_vlb_step=0.000153, train/loss_step=0.0414, global_step=1144.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  79%|███████▉  | 954/1208 [26:45<07:07,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00205, train/loss_step=0.384, global_step=1144.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  79%|███████▉  | 955/1208 [26:46<07:05,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00205, train/loss_step=0.384, global_step=1144.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  79%|███████▉  | 955/1208 [26:46<07:05,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0507, train/loss_vlb_step=0.000172, train/loss_step=0.0507, global_step=1144.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  79%|███████▉  | 956/1208 [26:50<07:04,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0507, train/loss_vlb_step=0.000172, train/loss_step=0.0507, global_step=1144.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  79%|███████▉  | 956/1208 [26:50<07:04,  1.68s/it, loss=0.155, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000562, train/loss_step=0.166, global_step=1144.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  79%|███████▉  | 957/1208 [26:51<07:02,  1.68s/it, loss=0.155, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000562, train/loss_step=0.166, global_step=1144.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  79%|███████▉  | 957/1208 [26:51<07:02,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000851, train/loss_step=0.225, global_step=1145.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  79%|███████▉  | 958/1208 [26:52<07:00,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000851, train/loss_step=0.225, global_step=1145.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  79%|███████▉  | 958/1208 [26:52<07:00,  1.68s/it, loss=0.183, v_num=0, train/loss_simple_step=0.467, train/loss_vlb_step=0.0083, train/loss_step=0.467, global_step=1145.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  79%|███████▉  | 959/1208 [26:53<06:58,  1.68s/it, loss=0.183, v_num=0, train/loss_simple_step=0.467, train/loss_vlb_step=0.0083, train/loss_step=0.467, global_step=1145.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  79%|███████▉  | 959/1208 [26:53<06:58,  1.68s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.64e-5, train/loss_step=0.0119, global_step=1145.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  79%|███████▉  | 960/1208 [26:56<06:57,  1.68s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.64e-5, train/loss_step=0.0119, global_step=1145.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  79%|███████▉  | 960/1208 [26:56<06:57,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0913, train/loss_vlb_step=0.000303, train/loss_step=0.0913, global_step=1145.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  80%|███████▉  | 961/1208 [26:57<06:55,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0913, train/loss_vlb_step=0.000303, train/loss_step=0.0913, global_step=1145.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  80%|███████▉  | 961/1208 [26:57<06:55,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0466, train/loss_vlb_step=0.000175, train/loss_step=0.0466, global_step=1146.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  80%|███████▉  | 962/1208 [26:58<06:53,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0466, train/loss_vlb_step=0.000175, train/loss_step=0.0466, global_step=1146.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  80%|███████▉  | 962/1208 [26:58<06:53,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000151, train/loss_step=0.0416, global_step=1146.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  80%|███████▉  | 963/1208 [26:59<06:52,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000151, train/loss_step=0.0416, global_step=1146.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  80%|███████▉  | 963/1208 [26:59<06:52,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0623, train/loss_vlb_step=0.000214, train/loss_step=0.0623, global_step=1146.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  80%|███████▉  | 964/1208 [27:02<06:50,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0623, train/loss_vlb_step=0.000214, train/loss_step=0.0623, global_step=1146.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  80%|███████▉  | 964/1208 [27:02<06:50,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000744, train/loss_step=0.198, global_step=1146.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  80%|███████▉  | 965/1208 [27:04<06:48,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000744, train/loss_step=0.198, global_step=1146.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  80%|███████▉  | 965/1208 [27:04<06:48,  1.68s/it, loss=0.178, v_num=0, train/loss_simple_step=0.537, train/loss_vlb_step=0.0108, train/loss_step=0.537, global_step=1147.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  80%|███████▉  | 966/1208 [27:05<06:47,  1.68s/it, loss=0.178, v_num=0, train/loss_simple_step=0.537, train/loss_vlb_step=0.0108, train/loss_step=0.537, global_step=1147.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  80%|███████▉  | 966/1208 [27:05<06:47,  1.68s/it, loss=0.191, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00115, train/loss_step=0.260, global_step=1147.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  80%|████████  | 967/1208 [27:06<06:45,  1.68s/it, loss=0.191, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00115, train/loss_step=0.260, global_step=1147.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  80%|████████  | 967/1208 [27:06<06:45,  1.68s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=2.16e-5, train/loss_step=0.00402, global_step=1147.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  80%|████████  | 968/1208 [27:09<06:43,  1.68s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=2.16e-5, train/loss_step=0.00402, global_step=1147.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  80%|████████  | 968/1208 [27:09<06:43,  1.68s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0294, train/loss_vlb_step=0.000109, train/loss_step=0.0294, global_step=1147.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  80%|████████  | 969/1208 [27:10<06:42,  1.68s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0294, train/loss_vlb_step=0.000109, train/loss_step=0.0294, global_step=1147.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  80%|████████  | 969/1208 [27:10<06:42,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0938, train/loss_vlb_step=0.000313, train/loss_step=0.0938, global_step=1148.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  80%|████████  | 970/1208 [27:11<06:40,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0938, train/loss_vlb_step=0.000313, train/loss_step=0.0938, global_step=1148.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  80%|████████  | 970/1208 [27:11<06:40,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000161, train/loss_step=0.0443, global_step=1148.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  80%|████████  | 971/1208 [27:12<06:38,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000161, train/loss_step=0.0443, global_step=1148.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  80%|████████  | 971/1208 [27:12<06:38,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00144, train/loss_step=0.309, global_step=1148.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  80%|████████  | 972/1208 [27:15<06:37,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00144, train/loss_step=0.309, global_step=1148.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  80%|████████  | 972/1208 [27:15<06:37,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000906, train/loss_step=0.232, global_step=1148.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  81%|████████  | 973/1208 [27:16<06:35,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000906, train/loss_step=0.232, global_step=1148.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  81%|████████  | 973/1208 [27:16<06:35,  1.68s/it, loss=0.179, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00167, train/loss_step=0.318, global_step=1149.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  81%|████████  | 974/1208 [27:17<06:33,  1.68s/it, loss=0.179, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00167, train/loss_step=0.318, global_step=1149.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  81%|████████  | 974/1208 [27:17<06:33,  1.68s/it, loss=0.169, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000714, train/loss_step=0.199, global_step=1149.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  81%|████████  | 975/1208 [27:19<06:31,  1.68s/it, loss=0.169, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000714, train/loss_step=0.199, global_step=1149.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  81%|████████  | 975/1208 [27:19<06:31,  1.68s/it, loss=0.178, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000927, train/loss_step=0.224, global_step=1149.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  81%|████████  | 976/1208 [27:22<06:30,  1.68s/it, loss=0.178, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000927, train/loss_step=0.224, global_step=1149.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  81%|████████  | 976/1208 [27:22<06:30,  1.68s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.74e-5, train/loss_step=0.00296, global_step=1149.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  81%|████████  | 977/1208 [27:23<06:28,  1.68s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.74e-5, train/loss_step=0.00296, global_step=1149.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  81%|████████  | 977/1208 [27:23<06:28,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.000166, train/loss_step=0.0462, global_step=1150.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  81%|████████  | 978/1208 [27:24<06:26,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.000166, train/loss_step=0.0462, global_step=1150.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  81%|████████  | 978/1208 [27:24<06:26,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00472, train/loss_vlb_step=2.56e-5, train/loss_step=0.00472, global_step=1150.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  81%|████████  | 979/1208 [27:25<06:24,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00472, train/loss_vlb_step=2.56e-5, train/loss_step=0.00472, global_step=1150.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  81%|████████  | 979/1208 [27:25<06:24,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00745, train/loss_vlb_step=3.87e-5, train/loss_step=0.00745, global_step=1150.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  81%|████████  | 980/1208 [27:28<06:23,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00745, train/loss_vlb_step=3.87e-5, train/loss_step=0.00745, global_step=1150.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  81%|████████  | 980/1208 [27:28<06:23,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000347, train/loss_step=0.105, global_step=1150.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  81%|████████  | 981/1208 [27:29<06:21,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000347, train/loss_step=0.105, global_step=1150.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  81%|████████  | 981/1208 [27:29<06:21,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00902, train/loss_vlb_step=4.41e-5, train/loss_step=0.00902, global_step=1151.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  81%|████████▏ | 982/1208 [27:30<06:19,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00902, train/loss_vlb_step=4.41e-5, train/loss_step=0.00902, global_step=1151.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  81%|████████▏ | 982/1208 [27:30<06:19,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00176, train/loss_step=0.334, global_step=1151.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  81%|████████▏ | 983/1208 [27:31<06:18,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00176, train/loss_step=0.334, global_step=1151.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  81%|████████▏ | 983/1208 [27:31<06:18,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0718, train/loss_vlb_step=0.000242, train/loss_step=0.0718, global_step=1151.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  81%|████████▏ | 984/1208 [27:35<06:16,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0718, train/loss_vlb_step=0.000242, train/loss_step=0.0718, global_step=1151.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  81%|████████▏ | 984/1208 [27:35<06:16,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=2.85e-5, train/loss_step=0.00545, global_step=1151.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  82%|████████▏ | 985/1208 [27:36<06:14,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=2.85e-5, train/loss_step=0.00545, global_step=1151.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  82%|████████▏ | 985/1208 [27:36<06:14,  1.68s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.91e-5, train/loss_step=0.0155, global_step=1152.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  82%|████████▏ | 986/1208 [27:37<06:13,  1.68s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.91e-5, train/loss_step=0.0155, global_step=1152.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  82%|████████▏ | 986/1208 [27:37<06:13,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00183, train/loss_step=0.287, global_step=1152.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  82%|████████▏ | 987/1208 [27:38<06:11,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00183, train/loss_step=0.287, global_step=1152.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  82%|████████▏ | 987/1208 [27:38<06:11,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0654, train/loss_vlb_step=0.00023, train/loss_step=0.0654, global_step=1152.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  82%|████████▏ | 988/1208 [27:41<06:09,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0654, train/loss_vlb_step=0.00023, train/loss_step=0.0654, global_step=1152.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  82%|████████▏ | 988/1208 [27:41<06:09,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000662, train/loss_step=0.189, global_step=1152.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  82%|████████▏ | 989/1208 [27:42<06:08,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000662, train/loss_step=0.189, global_step=1152.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  82%|████████▏ | 989/1208 [27:42<06:08,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0886, train/loss_vlb_step=0.000291, train/loss_step=0.0886, global_step=1153.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  82%|████████▏ | 990/1208 [27:43<06:06,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0886, train/loss_vlb_step=0.000291, train/loss_step=0.0886, global_step=1153.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  82%|████████▏ | 990/1208 [27:43<06:06,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000526, train/loss_step=0.159, global_step=1153.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  82%|████████▏ | 991/1208 [27:44<06:04,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000526, train/loss_step=0.159, global_step=1153.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  82%|████████▏ | 991/1208 [27:44<06:04,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0062, train/loss_vlb_step=3.06e-5, train/loss_step=0.0062, global_step=1153.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  82%|████████▏ | 992/1208 [27:47<06:03,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0062, train/loss_vlb_step=3.06e-5, train/loss_step=0.0062, global_step=1153.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  82%|████████▏ | 992/1208 [27:47<06:03,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.487, train/loss_vlb_step=0.00376, train/loss_step=0.487, global_step=1153.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  82%|████████▏ | 993/1208 [27:48<06:01,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.487, train/loss_vlb_step=0.00376, train/loss_step=0.487, global_step=1153.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  82%|████████▏ | 993/1208 [27:48<06:01,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000174, train/loss_step=0.050, global_step=1154.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  82%|████████▏ | 994/1208 [27:49<05:59,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000174, train/loss_step=0.050, global_step=1154.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  82%|████████▏ | 994/1208 [27:49<05:59,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.9e-5, train/loss_step=0.0214, global_step=1154.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  82%|████████▏ | 995/1208 [27:50<05:57,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.9e-5, train/loss_step=0.0214, global_step=1154.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  82%|████████▏ | 995/1208 [27:50<05:57,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000856, train/loss_step=0.228, global_step=1154.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  82%|████████▏ | 996/1208 [27:53<05:56,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000856, train/loss_step=0.228, global_step=1154.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  82%|████████▏ | 996/1208 [27:53<05:56,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00177, train/loss_step=0.356, global_step=1154.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  83%|████████▎ | 997/1208 [27:54<05:54,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00177, train/loss_step=0.356, global_step=1154.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  83%|████████▎ | 997/1208 [27:54<05:54,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0885, train/loss_vlb_step=0.000297, train/loss_step=0.0885, global_step=1155.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  83%|████████▎ | 998/1208 [27:55<05:52,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0885, train/loss_vlb_step=0.000297, train/loss_step=0.0885, global_step=1155.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  83%|████████▎ | 998/1208 [27:55<05:52,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000482, train/loss_step=0.146, global_step=1155.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  83%|████████▎ | 999/1208 [27:56<05:50,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000482, train/loss_step=0.146, global_step=1155.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  83%|████████▎ | 999/1208 [27:56<05:50,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.78e-5, train/loss_step=0.0101, global_step=1155.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  83%|████████▎ | 1000/1208 [28:00<05:49,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.78e-5, train/loss_step=0.0101, global_step=1155.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  83%|████████▎ | 1000/1208 [28:00<05:49,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.504, train/loss_vlb_step=0.00452, train/loss_step=0.504, global_step=1155.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  83%|████████▎ | 1001/1208 [28:01<05:47,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.504, train/loss_vlb_step=0.00452, train/loss_step=0.504, global_step=1155.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  83%|████████▎ | 1001/1208 [28:01<05:47,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.000176, train/loss_step=0.0499, global_step=1156.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  83%|████████▎ | 1002/1208 [28:02<05:45,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.000176, train/loss_step=0.0499, global_step=1156.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  83%|████████▎ | 1002/1208 [28:02<05:45,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000757, train/loss_step=0.212, global_step=1156.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  83%|████████▎ | 1003/1208 [28:03<05:44,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000757, train/loss_step=0.212, global_step=1156.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  83%|████████▎ | 1003/1208 [28:03<05:44,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000494, train/loss_step=0.150, global_step=1156.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  83%|████████▎ | 1004/1208 [28:06<05:42,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000494, train/loss_step=0.150, global_step=1156.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  83%|████████▎ | 1004/1208 [28:06<05:42,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000104, train/loss_step=0.0253, global_step=1156.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  83%|████████▎ | 1005/1208 [28:07<05:40,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000104, train/loss_step=0.0253, global_step=1156.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  83%|████████▎ | 1005/1208 [28:07<05:40,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000481, train/loss_step=0.142, global_step=1157.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  83%|████████▎ | 1006/1208 [28:08<05:39,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000481, train/loss_step=0.142, global_step=1157.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  83%|████████▎ | 1006/1208 [28:08<05:39,  1.68s/it, loss=0.171, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.0052, train/loss_step=0.447, global_step=1157.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  83%|████████▎ | 1007/1208 [28:09<05:37,  1.68s/it, loss=0.171, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.0052, train/loss_step=0.447, global_step=1157.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  83%|████████▎ | 1007/1208 [28:09<05:37,  1.68s/it, loss=0.184, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00162, train/loss_step=0.317, global_step=1157.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  83%|████████▎ | 1008/1208 [28:13<05:35,  1.68s/it, loss=0.184, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00162, train/loss_step=0.317, global_step=1157.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  83%|████████▎ | 1008/1208 [28:13<05:35,  1.68s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.000179, train/loss_step=0.0499, global_step=1157.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  84%|████████▎ | 1009/1208 [28:14<05:34,  1.68s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.000179, train/loss_step=0.0499, global_step=1157.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  84%|████████▎ | 1009/1208 [28:14<05:34,  1.68s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=2.03e-5, train/loss_step=0.00378, global_step=1158.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  84%|████████▎ | 1010/1208 [28:15<05:32,  1.68s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=2.03e-5, train/loss_step=0.00378, global_step=1158.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  84%|████████▎ | 1010/1208 [28:15<05:32,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0052, train/loss_vlb_step=2.68e-5, train/loss_step=0.0052, global_step=1158.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  84%|████████▎ | 1011/1208 [28:16<05:30,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0052, train/loss_vlb_step=2.68e-5, train/loss_step=0.0052, global_step=1158.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  84%|████████▎ | 1011/1208 [28:16<05:30,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.74e-5, train/loss_step=0.0145, global_step=1158.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  84%|████████▍ | 1012/1208 [28:19<05:29,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.74e-5, train/loss_step=0.0145, global_step=1158.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  84%|████████▍ | 1012/1208 [28:19<05:29,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000976, train/loss_step=0.244, global_step=1158.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  84%|████████▍ | 1013/1208 [28:20<05:27,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000976, train/loss_step=0.244, global_step=1158.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  84%|████████▍ | 1013/1208 [28:20<05:27,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00112, train/loss_step=0.248, global_step=1159.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  84%|████████▍ | 1014/1208 [28:21<05:25,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00112, train/loss_step=0.248, global_step=1159.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  84%|████████▍ | 1014/1208 [28:21<05:25,  1.68s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.67e-5, train/loss_step=0.0029, global_step=1159.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  84%|████████▍ | 1015/1208 [28:22<05:23,  1.68s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.67e-5, train/loss_step=0.0029, global_step=1159.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  84%|████████▍ | 1015/1208 [28:22<05:23,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.93e-5, train/loss_step=0.0129, global_step=1159.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  84%|████████▍ | 1016/1208 [28:25<05:22,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.93e-5, train/loss_step=0.0129, global_step=1159.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  84%|████████▍ | 1016/1208 [28:25<05:22,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00362, train/loss_step=0.379, global_step=1159.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  84%|████████▍ | 1017/1208 [28:26<05:20,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00362, train/loss_step=0.379, global_step=1159.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  84%|████████▍ | 1017/1208 [28:26<05:20,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000416, train/loss_step=0.125, global_step=1160.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  84%|████████▍ | 1018/1208 [28:27<05:18,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000416, train/loss_step=0.125, global_step=1160.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  84%|████████▍ | 1018/1208 [28:27<05:18,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000135, train/loss_step=0.035, global_step=1160.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  84%|████████▍ | 1019/1208 [28:28<05:16,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000135, train/loss_step=0.035, global_step=1160.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  84%|████████▍ | 1019/1208 [28:28<05:16,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=9.27e-5, train/loss_step=0.0215, global_step=1160.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  84%|████████▍ | 1020/1208 [28:31<05:15,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=9.27e-5, train/loss_step=0.0215, global_step=1160.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  84%|████████▍ | 1020/1208 [28:31<05:15,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000876, train/loss_step=0.234, global_step=1160.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  85%|████████▍ | 1021/1208 [28:32<05:13,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000876, train/loss_step=0.234, global_step=1160.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  85%|████████▍ | 1021/1208 [28:32<05:13,  1.68s/it, loss=0.171, v_num=0, train/loss_simple_step=0.759, train/loss_vlb_step=0.0393, train/loss_step=0.759, global_step=1161.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  85%|████████▍ | 1022/1208 [28:33<05:11,  1.68s/it, loss=0.171, v_num=0, train/loss_simple_step=0.759, train/loss_vlb_step=0.0393, train/loss_step=0.759, global_step=1161.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  85%|████████▍ | 1022/1208 [28:33<05:11,  1.68s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.09e-5, train/loss_step=0.0172, global_step=1161.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  85%|████████▍ | 1023/1208 [28:34<05:10,  1.68s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.09e-5, train/loss_step=0.0172, global_step=1161.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  85%|████████▍ | 1023/1208 [28:34<05:10,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.00046, train/loss_step=0.138, global_step=1161.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  85%|████████▍ | 1024/1208 [28:38<05:08,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.00046, train/loss_step=0.138, global_step=1161.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  85%|████████▍ | 1024/1208 [28:38<05:08,  1.68s/it, loss=0.17, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000756, train/loss_step=0.205, global_step=1161.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  85%|████████▍ | 1025/1208 [28:39<05:06,  1.68s/it, loss=0.17, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000756, train/loss_step=0.205, global_step=1161.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  85%|████████▍ | 1025/1208 [28:39<05:06,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=2.56e-5, train/loss_step=0.00471, global_step=1162.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  85%|████████▍ | 1026/1208 [28:40<05:05,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=2.56e-5, train/loss_step=0.00471, global_step=1162.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  85%|████████▍ | 1026/1208 [28:40<05:05,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000428, train/loss_step=0.128, global_step=1162.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  85%|████████▌ | 1027/1208 [28:41<05:03,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000428, train/loss_step=0.128, global_step=1162.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  85%|████████▌ | 1027/1208 [28:41<05:03,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.15e-5, train/loss_step=0.0111, global_step=1162.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  85%|████████▌ | 1028/1208 [28:44<05:01,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.15e-5, train/loss_step=0.0111, global_step=1162.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  85%|████████▌ | 1028/1208 [28:44<05:01,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.484, train/loss_vlb_step=0.00451, train/loss_step=0.484, global_step=1162.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  85%|████████▌ | 1029/1208 [28:45<05:00,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.484, train/loss_vlb_step=0.00451, train/loss_step=0.484, global_step=1162.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  85%|████████▌ | 1029/1208 [28:45<05:00,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000771, train/loss_step=0.226, global_step=1163.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  85%|████████▌ | 1030/1208 [28:46<04:58,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000771, train/loss_step=0.226, global_step=1163.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  85%|████████▌ | 1030/1208 [28:46<04:58,  1.68s/it, loss=0.182, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.0019, train/loss_step=0.345, global_step=1163.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  85%|████████▌ | 1031/1208 [28:47<04:56,  1.68s/it, loss=0.182, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.0019, train/loss_step=0.345, global_step=1163.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  85%|████████▌ | 1031/1208 [28:47<04:56,  1.68s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.00011, train/loss_step=0.0277, global_step=1163.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  85%|████████▌ | 1032/1208 [28:50<04:55,  1.68s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.00011, train/loss_step=0.0277, global_step=1163.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  85%|████████▌ | 1032/1208 [28:50<04:55,  1.68s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0917, train/loss_vlb_step=0.000303, train/loss_step=0.0917, global_step=1163.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  86%|████████▌ | 1033/1208 [28:51<04:53,  1.68s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0917, train/loss_vlb_step=0.000303, train/loss_step=0.0917, global_step=1163.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  86%|████████▌ | 1033/1208 [28:51<04:53,  1.68s/it, loss=0.176, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00123, train/loss_step=0.275, global_step=1164.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  86%|████████▌ | 1034/1208 [28:52<04:51,  1.68s/it, loss=0.176, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00123, train/loss_step=0.275, global_step=1164.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  86%|████████▌ | 1034/1208 [28:52<04:51,  1.68s/it, loss=0.195, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00234, train/loss_step=0.386, global_step=1164.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  86%|████████▌ | 1035/1208 [28:54<04:49,  1.68s/it, loss=0.195, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00234, train/loss_step=0.386, global_step=1164.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  86%|████████▌ | 1035/1208 [28:54<04:49,  1.68s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000133, train/loss_step=0.0363, global_step=1164.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  86%|████████▌ | 1036/1208 [28:57<04:48,  1.68s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000133, train/loss_step=0.0363, global_step=1164.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  86%|████████▌ | 1036/1208 [28:57<04:48,  1.68s/it, loss=0.201, v_num=0, train/loss_simple_step=0.463, train/loss_vlb_step=0.00397, train/loss_step=0.463, global_step=1164.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  86%|████████▌ | 1037/1208 [28:58<04:46,  1.68s/it, loss=0.201, v_num=0, train/loss_simple_step=0.463, train/loss_vlb_step=0.00397, train/loss_step=0.463, global_step=1164.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  86%|████████▌ | 1037/1208 [28:58<04:46,  1.68s/it, loss=0.202, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000513, train/loss_step=0.152, global_step=1165.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  86%|████████▌ | 1038/1208 [28:59<04:44,  1.68s/it, loss=0.202, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000513, train/loss_step=0.152, global_step=1165.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  86%|████████▌ | 1038/1208 [28:59<04:44,  1.68s/it, loss=0.214, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.0013, train/loss_step=0.284, global_step=1165.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  86%|████████▌ | 1039/1208 [29:00<04:43,  1.67s/it, loss=0.214, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.0013, train/loss_step=0.284, global_step=1165.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  86%|████████▌ | 1039/1208 [29:00<04:43,  1.67s/it, loss=0.214, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=1.37e-5, train/loss_step=0.0023, global_step=1165.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  86%|████████▌ | 1040/1208 [29:03<04:41,  1.68s/it, loss=0.214, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=1.37e-5, train/loss_step=0.0023, global_step=1165.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  86%|████████▌ | 1040/1208 [29:03<04:41,  1.68s/it, loss=0.222, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00309, train/loss_step=0.411, global_step=1165.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  86%|████████▌ | 1041/1208 [29:04<04:39,  1.68s/it, loss=0.222, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00309, train/loss_step=0.411, global_step=1165.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  86%|████████▌ | 1041/1208 [29:04<04:39,  1.68s/it, loss=0.192, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000507, train/loss_step=0.153, global_step=1166.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  86%|████████▋ | 1042/1208 [29:05<04:38,  1.68s/it, loss=0.192, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000507, train/loss_step=0.153, global_step=1166.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  86%|████████▋ | 1042/1208 [29:05<04:38,  1.68s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000168, train/loss_step=0.0438, global_step=1166.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  86%|████████▋ | 1043/1208 [29:06<04:36,  1.67s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000168, train/loss_step=0.0438, global_step=1166.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  86%|████████▋ | 1043/1208 [29:06<04:36,  1.67s/it, loss=0.187, v_num=0, train/loss_simple_step=0.00592, train/loss_vlb_step=3e-5, train/loss_step=0.00592, global_step=1166.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  86%|████████▋ | 1044/1208 [29:09<04:34,  1.68s/it, loss=0.187, v_num=0, train/loss_simple_step=0.00592, train/loss_vlb_step=3e-5, train/loss_step=0.00592, global_step=1166.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  86%|████████▋ | 1044/1208 [29:09<04:34,  1.68s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000122, train/loss_step=0.0339, global_step=1166.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  87%|████████▋ | 1045/1208 [29:11<04:33,  1.68s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000122, train/loss_step=0.0339, global_step=1166.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  87%|████████▋ | 1045/1208 [29:11<04:33,  1.68s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.96e-5, train/loss_step=0.0104, global_step=1167.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  87%|████████▋ | 1046/1208 [29:12<04:31,  1.68s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.96e-5, train/loss_step=0.0104, global_step=1167.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  87%|████████▋ | 1046/1208 [29:12<04:31,  1.68s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00855, train/loss_vlb_step=4.03e-5, train/loss_step=0.00855, global_step=1167.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  87%|████████▋ | 1047/1208 [29:13<04:29,  1.67s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00855, train/loss_vlb_step=4.03e-5, train/loss_step=0.00855, global_step=1167.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  87%|████████▋ | 1047/1208 [29:13<04:29,  1.67s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.07e-5, train/loss_step=0.00176, global_step=1167.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  87%|████████▋ | 1048/1208 [29:16<04:28,  1.68s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.07e-5, train/loss_step=0.00176, global_step=1167.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  87%|████████▋ | 1048/1208 [29:16<04:28,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00607, train/loss_vlb_step=2.96e-5, train/loss_step=0.00607, global_step=1167.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  87%|████████▋ | 1049/1208 [29:17<04:26,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00607, train/loss_vlb_step=2.96e-5, train/loss_step=0.00607, global_step=1167.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  87%|████████▋ | 1049/1208 [29:17<04:26,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.000166, train/loss_step=0.0471, global_step=1168.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  87%|████████▋ | 1050/1208 [29:18<04:24,  1.67s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.000166, train/loss_step=0.0471, global_step=1168.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  87%|████████▋ | 1050/1208 [29:18<04:24,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0093, train/loss_vlb_step=4.17e-5, train/loss_step=0.0093, global_step=1168.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  87%|████████▋ | 1051/1208 [29:19<04:22,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0093, train/loss_vlb_step=4.17e-5, train/loss_step=0.0093, global_step=1168.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  87%|████████▋ | 1051/1208 [29:19<04:22,  1.67s/it, loss=0.124, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.000208, train/loss_step=0.062, global_step=1168.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  87%|████████▋ | 1052/1208 [29:22<04:21,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.000208, train/loss_step=0.062, global_step=1168.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  87%|████████▋ | 1052/1208 [29:22<04:21,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000815, train/loss_step=0.217, global_step=1168.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  87%|████████▋ | 1053/1208 [29:23<04:19,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000815, train/loss_step=0.217, global_step=1168.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  87%|████████▋ | 1053/1208 [29:23<04:19,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=1169.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  87%|████████▋ | 1054/1208 [29:24<04:17,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=1169.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  87%|████████▋ | 1054/1208 [29:24<04:17,  1.67s/it, loss=0.128, v_num=0, train/loss_simple_step=0.490, train/loss_vlb_step=0.00457, train/loss_step=0.490, global_step=1169.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  87%|████████▋ | 1055/1208 [29:25<04:16,  1.67s/it, loss=0.128, v_num=0, train/loss_simple_step=0.490, train/loss_vlb_step=0.00457, train/loss_step=0.490, global_step=1169.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  87%|████████▋ | 1055/1208 [29:25<04:16,  1.67s/it, loss=0.135, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000653, train/loss_step=0.181, global_step=1169.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  87%|████████▋ | 1056/1208 [29:28<04:14,  1.67s/it, loss=0.135, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000653, train/loss_step=0.181, global_step=1169.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  87%|████████▋ | 1056/1208 [29:28<04:14,  1.67s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.00011, train/loss_step=0.0282, global_step=1169.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  88%|████████▊ | 1057/1208 [29:29<04:12,  1.67s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.00011, train/loss_step=0.0282, global_step=1169.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  88%|████████▊ | 1057/1208 [29:29<04:12,  1.67s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0094, train/loss_vlb_step=4.52e-5, train/loss_step=0.0094, global_step=1170.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  88%|████████▊ | 1058/1208 [29:30<04:11,  1.67s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0094, train/loss_vlb_step=4.52e-5, train/loss_step=0.0094, global_step=1170.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  88%|████████▊ | 1058/1208 [29:30<04:11,  1.67s/it, loss=0.113, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00411, train/loss_step=0.435, global_step=1170.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  88%|████████▊ | 1059/1208 [29:31<04:09,  1.67s/it, loss=0.113, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00411, train/loss_step=0.435, global_step=1170.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  88%|████████▊ | 1059/1208 [29:31<04:09,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.36e-5, train/loss_step=0.0227, global_step=1170.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  88%|████████▊ | 1060/1208 [29:34<04:07,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.36e-5, train/loss_step=0.0227, global_step=1170.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  88%|████████▊ | 1060/1208 [29:34<04:07,  1.67s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.00511, train/loss_vlb_step=2.73e-5, train/loss_step=0.00511, global_step=1170.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  88%|████████▊ | 1061/1208 [29:35<04:05,  1.67s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.00511, train/loss_vlb_step=2.73e-5, train/loss_step=0.00511, global_step=1170.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  88%|████████▊ | 1061/1208 [29:35<04:05,  1.67s/it, loss=0.0883, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000131, train/loss_step=0.0365, global_step=1171.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  88%|████████▊ | 1062/1208 [29:36<04:04,  1.67s/it, loss=0.0883, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000131, train/loss_step=0.0365, global_step=1171.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  88%|████████▊ | 1062/1208 [29:36<04:04,  1.67s/it, loss=0.0873, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.94e-5, train/loss_step=0.0241, global_step=1171.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  88%|████████▊ | 1063/1208 [29:37<04:02,  1.67s/it, loss=0.0873, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.94e-5, train/loss_step=0.0241, global_step=1171.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  88%|████████▊ | 1063/1208 [29:37<04:02,  1.67s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.00866, train/loss_vlb_step=4.2e-5, train/loss_step=0.00866, global_step=1171.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  88%|████████▊ | 1064/1208 [29:40<04:00,  1.67s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.00866, train/loss_vlb_step=4.2e-5, train/loss_step=0.00866, global_step=1171.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  88%|████████▊ | 1064/1208 [29:40<04:00,  1.67s/it, loss=0.0859, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.25e-5, train/loss_step=0.00213, global_step=1171.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  88%|████████▊ | 1065/1208 [29:41<03:59,  1.67s/it, loss=0.0859, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.25e-5, train/loss_step=0.00213, global_step=1171.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  88%|████████▊ | 1065/1208 [29:41<03:59,  1.67s/it, loss=0.0874, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000149, train/loss_step=0.0402, global_step=1172.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  88%|████████▊ | 1066/1208 [29:42<03:57,  1.67s/it, loss=0.0874, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000149, train/loss_step=0.0402, global_step=1172.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  88%|████████▊ | 1066/1208 [29:42<03:57,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.600, train/loss_vlb_step=0.0135, train/loss_step=0.600, global_step=1172.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]     Epoch 3:  88%|████████▊ | 1067/1208 [29:43<03:55,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.600, train/loss_vlb_step=0.0135, train/loss_step=0.600, global_step=1172.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  88%|████████▊ | 1067/1208 [29:43<03:55,  1.67s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=9.89e-5, train/loss_step=0.0249, global_step=1172.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  88%|████████▊ | 1068/1208 [29:46<03:54,  1.67s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=9.89e-5, train/loss_step=0.0249, global_step=1172.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  88%|████████▊ | 1068/1208 [29:46<03:54,  1.67s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.18e-5, train/loss_step=0.0139, global_step=1172.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  88%|████████▊ | 1069/1208 [29:47<03:52,  1.67s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.18e-5, train/loss_step=0.0139, global_step=1172.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  88%|████████▊ | 1069/1208 [29:47<03:52,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.0013, train/loss_step=0.275, global_step=1173.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  89%|████████▊ | 1070/1208 [29:48<03:50,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.0013, train/loss_step=0.275, global_step=1173.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  89%|████████▊ | 1070/1208 [29:48<03:50,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=1.37e-5, train/loss_step=0.00227, global_step=1173.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  89%|████████▊ | 1071/1208 [29:49<03:48,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=1.37e-5, train/loss_step=0.00227, global_step=1173.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  89%|████████▊ | 1071/1208 [29:49<03:48,  1.67s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=9.87e-5, train/loss_step=0.0251, global_step=1173.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  89%|████████▊ | 1072/1208 [29:52<03:47,  1.67s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=9.87e-5, train/loss_step=0.0251, global_step=1173.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  89%|████████▊ | 1072/1208 [29:52<03:47,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00115, train/loss_step=0.272, global_step=1173.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  89%|████████▉ | 1073/1208 [29:53<03:45,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00115, train/loss_step=0.272, global_step=1173.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  89%|████████▉ | 1073/1208 [29:53<03:45,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000528, train/loss_step=0.157, global_step=1174.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  89%|████████▉ | 1074/1208 [29:54<03:43,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000528, train/loss_step=0.157, global_step=1174.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  89%|████████▉ | 1074/1208 [29:54<03:43,  1.67s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=2.09e-5, train/loss_step=0.00381, global_step=1174.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  89%|████████▉ | 1075/1208 [29:55<03:42,  1.67s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=2.09e-5, train/loss_step=0.00381, global_step=1174.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  89%|████████▉ | 1075/1208 [29:55<03:42,  1.67s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0634, train/loss_vlb_step=0.000212, train/loss_step=0.0634, global_step=1174.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  89%|████████▉ | 1076/1208 [29:58<03:40,  1.67s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0634, train/loss_vlb_step=0.000212, train/loss_step=0.0634, global_step=1174.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  89%|████████▉ | 1076/1208 [29:58<03:40,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00162, train/loss_step=0.328, global_step=1174.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  89%|████████▉ | 1077/1208 [29:59<03:38,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00162, train/loss_step=0.328, global_step=1174.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  89%|████████▉ | 1077/1208 [29:59<03:38,  1.67s/it, loss=0.123, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=1175.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  89%|████████▉ | 1078/1208 [30:00<03:37,  1.67s/it, loss=0.123, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=1175.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  89%|████████▉ | 1078/1208 [30:00<03:37,  1.67s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.000242, train/loss_step=0.0702, global_step=1175.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  89%|████████▉ | 1079/1208 [30:01<03:35,  1.67s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.000242, train/loss_step=0.0702, global_step=1175.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  89%|████████▉ | 1079/1208 [30:01<03:35,  1.67s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000146, train/loss_step=0.0396, global_step=1175.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  89%|████████▉ | 1080/1208 [30:03<03:33,  1.67s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000146, train/loss_step=0.0396, global_step=1175.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  89%|████████▉ | 1080/1208 [30:03<03:33,  1.67s/it, loss=0.125, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00248, train/loss_step=0.399, global_step=1175.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  89%|████████▉ | 1081/1208 [30:04<03:32,  1.67s/it, loss=0.125, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00248, train/loss_step=0.399, global_step=1175.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  89%|████████▉ | 1081/1208 [30:04<03:32,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.672, train/loss_vlb_step=0.0317, train/loss_step=0.672, global_step=1176.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  90%|████████▉ | 1082/1208 [30:06<03:30,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.672, train/loss_vlb_step=0.0317, train/loss_step=0.672, global_step=1176.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  90%|████████▉ | 1082/1208 [30:06<03:30,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00383, train/loss_vlb_step=2.15e-5, train/loss_step=0.00383, global_step=1176.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  90%|████████▉ | 1083/1208 [30:07<03:28,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00383, train/loss_vlb_step=2.15e-5, train/loss_step=0.00383, global_step=1176.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  90%|████████▉ | 1083/1208 [30:07<03:28,  1.67s/it, loss=0.16, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000342, train/loss_step=0.100, global_step=1176.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  90%|████████▉ | 1084/1208 [30:09<03:27,  1.67s/it, loss=0.16, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000342, train/loss_step=0.100, global_step=1176.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  90%|████████▉ | 1084/1208 [30:09<03:27,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.52e-5, train/loss_step=0.0228, global_step=1176.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  90%|████████▉ | 1085/1208 [30:10<03:25,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.52e-5, train/loss_step=0.0228, global_step=1176.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  90%|████████▉ | 1085/1208 [30:10<03:25,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000746, train/loss_step=0.207, global_step=1177.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  90%|████████▉ | 1086/1208 [30:11<03:23,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000746, train/loss_step=0.207, global_step=1177.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  90%|████████▉ | 1086/1208 [30:11<03:23,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00429, train/loss_vlb_step=2.36e-5, train/loss_step=0.00429, global_step=1177.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  90%|████████▉ | 1087/1208 [30:12<03:21,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00429, train/loss_vlb_step=2.36e-5, train/loss_step=0.00429, global_step=1177.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  90%|████████▉ | 1087/1208 [30:12<03:21,  1.67s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00834, train/loss_vlb_step=4.16e-5, train/loss_step=0.00834, global_step=1177.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  90%|█████████ | 1088/1208 [30:15<03:20,  1.67s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00834, train/loss_vlb_step=4.16e-5, train/loss_step=0.00834, global_step=1177.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  90%|█████████ | 1088/1208 [30:15<03:20,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0821, train/loss_vlb_step=0.000275, train/loss_step=0.0821, global_step=1177.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  90%|█████████ | 1089/1208 [30:16<03:18,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0821, train/loss_vlb_step=0.000275, train/loss_step=0.0821, global_step=1177.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  90%|█████████ | 1089/1208 [30:16<03:18,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=7.89e-5, train/loss_step=0.0192, global_step=1178.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  90%|█████████ | 1090/1208 [30:17<03:16,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=7.89e-5, train/loss_step=0.0192, global_step=1178.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  90%|█████████ | 1090/1208 [30:17<03:16,  1.67s/it, loss=0.144, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.0015, train/loss_step=0.291, global_step=1178.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  90%|█████████ | 1091/1208 [30:18<03:15,  1.67s/it, loss=0.144, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.0015, train/loss_step=0.291, global_step=1178.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  90%|█████████ | 1091/1208 [30:18<03:15,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00104, train/loss_step=0.252, global_step=1178.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  90%|█████████ | 1092/1208 [30:21<03:13,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00104, train/loss_step=0.252, global_step=1178.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  90%|█████████ | 1092/1208 [30:21<03:13,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000497, train/loss_step=0.150, global_step=1178.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  90%|█████████ | 1093/1208 [30:22<03:11,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000497, train/loss_step=0.150, global_step=1178.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  90%|█████████ | 1093/1208 [30:22<03:11,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00197, train/loss_step=0.333, global_step=1179.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  91%|█████████ | 1094/1208 [30:23<03:10,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00197, train/loss_step=0.333, global_step=1179.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  91%|█████████ | 1094/1208 [30:23<03:10,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000691, train/loss_step=0.201, global_step=1179.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  91%|█████████ | 1095/1208 [30:24<03:08,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000691, train/loss_step=0.201, global_step=1179.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  91%|█████████ | 1095/1208 [30:24<03:08,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0666, train/loss_vlb_step=0.000228, train/loss_step=0.0666, global_step=1179.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  91%|█████████ | 1096/1208 [30:27<03:06,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0666, train/loss_vlb_step=0.000228, train/loss_step=0.0666, global_step=1179.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  91%|█████████ | 1096/1208 [30:27<03:06,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0739, train/loss_vlb_step=0.000245, train/loss_step=0.0739, global_step=1179.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  91%|█████████ | 1097/1208 [30:28<03:05,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0739, train/loss_vlb_step=0.000245, train/loss_step=0.0739, global_step=1179.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  91%|█████████ | 1097/1208 [30:28<03:05,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.000183, train/loss_step=0.0526, global_step=1180.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  91%|█████████ | 1098/1208 [30:29<03:03,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.000183, train/loss_step=0.0526, global_step=1180.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  91%|█████████ | 1098/1208 [30:29<03:03,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000286, train/loss_step=0.086, global_step=1180.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  91%|█████████ | 1099/1208 [30:30<03:01,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000286, train/loss_step=0.086, global_step=1180.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  91%|█████████ | 1099/1208 [30:30<03:01,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0956, train/loss_vlb_step=0.000314, train/loss_step=0.0956, global_step=1180.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  91%|█████████ | 1100/1208 [30:33<03:00,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0956, train/loss_vlb_step=0.000314, train/loss_step=0.0956, global_step=1180.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  91%|█████████ | 1100/1208 [30:33<03:00,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00382, train/loss_vlb_step=2.1e-5, train/loss_step=0.00382, global_step=1180.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  91%|█████████ | 1101/1208 [30:34<02:58,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00382, train/loss_vlb_step=2.1e-5, train/loss_step=0.00382, global_step=1180.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  91%|█████████ | 1101/1208 [30:34<02:58,  1.67s/it, loss=0.119, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00145, train/loss_step=0.318, global_step=1181.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  91%|█████████ | 1102/1208 [30:35<02:56,  1.67s/it, loss=0.119, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00145, train/loss_step=0.318, global_step=1181.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  91%|█████████ | 1102/1208 [30:35<02:56,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.000991, train/loss_step=0.257, global_step=1181.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  91%|█████████▏| 1103/1208 [30:36<02:54,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.000991, train/loss_step=0.257, global_step=1181.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  91%|█████████▏| 1103/1208 [30:36<02:54,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.56e-5, train/loss_step=0.0121, global_step=1181.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  91%|█████████▏| 1104/1208 [30:39<02:53,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.56e-5, train/loss_step=0.0121, global_step=1181.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  91%|█████████▏| 1104/1208 [30:39<02:53,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00042, train/loss_step=0.128, global_step=1181.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  91%|█████████▏| 1105/1208 [30:40<02:51,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00042, train/loss_step=0.128, global_step=1181.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  91%|█████████▏| 1105/1208 [30:40<02:51,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00122, train/loss_step=0.282, global_step=1182.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  92%|█████████▏| 1106/1208 [30:41<02:49,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00122, train/loss_step=0.282, global_step=1182.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  92%|█████████▏| 1106/1208 [30:41<02:49,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00353, train/loss_step=0.425, global_step=1182.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  92%|█████████▏| 1107/1208 [30:42<02:48,  1.66s/it, loss=0.157, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00353, train/loss_step=0.425, global_step=1182.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  92%|█████████▏| 1107/1208 [30:42<02:48,  1.66s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.55e-5, train/loss_step=0.0121, global_step=1182.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  92%|█████████▏| 1108/1208 [30:45<02:46,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.55e-5, train/loss_step=0.0121, global_step=1182.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  92%|█████████▏| 1108/1208 [30:45<02:46,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000603, train/loss_step=0.168, global_step=1182.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  92%|█████████▏| 1109/1208 [30:46<02:44,  1.66s/it, loss=0.161, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000603, train/loss_step=0.168, global_step=1182.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  92%|█████████▏| 1109/1208 [30:46<02:44,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00124, train/loss_step=0.270, global_step=1183.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  92%|█████████▏| 1110/1208 [30:47<02:43,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00124, train/loss_step=0.270, global_step=1183.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  92%|█████████▏| 1110/1208 [30:47<02:43,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00458, train/loss_step=0.401, global_step=1183.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  92%|█████████▏| 1111/1208 [30:48<02:41,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00458, train/loss_step=0.401, global_step=1183.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  92%|█████████▏| 1111/1208 [30:48<02:41,  1.66s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.09e-5, train/loss_step=0.0134, global_step=1183.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  92%|█████████▏| 1112/1208 [30:51<02:39,  1.66s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.09e-5, train/loss_step=0.0134, global_step=1183.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  92%|█████████▏| 1112/1208 [30:51<02:39,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=2.84e-5, train/loss_step=0.00545, global_step=1183.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  92%|█████████▏| 1113/1208 [30:52<02:38,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=2.84e-5, train/loss_step=0.00545, global_step=1183.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  92%|█████████▏| 1113/1208 [30:52<02:38,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.76e-5, train/loss_step=0.0209, global_step=1184.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  92%|█████████▏| 1114/1208 [30:53<02:36,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.76e-5, train/loss_step=0.0209, global_step=1184.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  92%|█████████▏| 1114/1208 [30:53<02:36,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0089, train/loss_vlb_step=4.39e-5, train/loss_step=0.0089, global_step=1184.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  92%|█████████▏| 1115/1208 [30:54<02:34,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0089, train/loss_vlb_step=4.39e-5, train/loss_step=0.0089, global_step=1184.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  92%|█████████▏| 1115/1208 [30:54<02:34,  1.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.66e-5, train/loss_step=0.00296, global_step=1184.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  92%|█████████▏| 1116/1208 [30:57<02:33,  1.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.66e-5, train/loss_step=0.00296, global_step=1184.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  92%|█████████▏| 1116/1208 [30:57<02:33,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.38e-5, train/loss_step=0.0112, global_step=1184.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  92%|█████████▏| 1117/1208 [30:58<02:31,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.38e-5, train/loss_step=0.0112, global_step=1184.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  92%|█████████▏| 1117/1208 [30:58<02:31,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00523, train/loss_vlb_step=2.76e-5, train/loss_step=0.00523, global_step=1185.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  93%|█████████▎| 1118/1208 [30:59<02:29,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00523, train/loss_vlb_step=2.76e-5, train/loss_step=0.00523, global_step=1185.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  93%|█████████▎| 1118/1208 [30:59<02:29,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.42e-5, train/loss_step=0.00235, global_step=1185.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  93%|█████████▎| 1119/1208 [31:00<02:27,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.42e-5, train/loss_step=0.00235, global_step=1185.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  93%|█████████▎| 1119/1208 [31:00<02:27,  1.66s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0404, train/loss_vlb_step=0.000153, train/loss_step=0.0404, global_step=1185.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  93%|█████████▎| 1120/1208 [31:03<02:26,  1.66s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0404, train/loss_vlb_step=0.000153, train/loss_step=0.0404, global_step=1185.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  93%|█████████▎| 1120/1208 [31:03<02:26,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0963, train/loss_vlb_step=0.000321, train/loss_step=0.0963, global_step=1185.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  93%|█████████▎| 1121/1208 [31:04<02:24,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0963, train/loss_vlb_step=0.000321, train/loss_step=0.0963, global_step=1185.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  93%|█████████▎| 1121/1208 [31:04<02:24,  1.66s/it, loss=0.109, v_num=0, train/loss_simple_step=0.009, train/loss_vlb_step=4.44e-5, train/loss_step=0.009, global_step=1186.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  93%|█████████▎| 1122/1208 [31:05<02:22,  1.66s/it, loss=0.109, v_num=0, train/loss_simple_step=0.009, train/loss_vlb_step=4.44e-5, train/loss_step=0.009, global_step=1186.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  93%|█████████▎| 1122/1208 [31:05<02:22,  1.66s/it, loss=0.101, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000361, train/loss_step=0.109, global_step=1186.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  93%|█████████▎| 1123/1208 [31:06<02:21,  1.66s/it, loss=0.101, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000361, train/loss_step=0.109, global_step=1186.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  93%|█████████▎| 1123/1208 [31:06<02:21,  1.66s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000118, train/loss_step=0.0307, global_step=1186.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  93%|█████████▎| 1124/1208 [31:09<02:19,  1.66s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000118, train/loss_step=0.0307, global_step=1186.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  93%|█████████▎| 1124/1208 [31:09<02:19,  1.66s/it, loss=0.106, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.00076, train/loss_step=0.208, global_step=1186.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  93%|█████████▎| 1125/1208 [31:10<02:17,  1.66s/it, loss=0.106, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.00076, train/loss_step=0.208, global_step=1186.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  93%|█████████▎| 1125/1208 [31:10<02:17,  1.66s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000429, train/loss_step=0.128, global_step=1187.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  93%|█████████▎| 1126/1208 [31:11<02:16,  1.66s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000429, train/loss_step=0.128, global_step=1187.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  93%|█████████▎| 1126/1208 [31:11<02:16,  1.66s/it, loss=0.0776, v_num=0, train/loss_simple_step=0.0085, train/loss_vlb_step=4e-5, train/loss_step=0.0085, global_step=1187.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  93%|█████████▎| 1127/1208 [31:12<02:14,  1.66s/it, loss=0.0776, v_num=0, train/loss_simple_step=0.0085, train/loss_vlb_step=4e-5, train/loss_step=0.0085, global_step=1187.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  93%|█████████▎| 1127/1208 [31:12<02:14,  1.66s/it, loss=0.0775, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.33e-5, train/loss_step=0.0111, global_step=1187.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  93%|█████████▎| 1128/1208 [31:15<02:13,  1.66s/it, loss=0.0775, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.33e-5, train/loss_step=0.0111, global_step=1187.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  93%|█████████▎| 1128/1208 [31:15<02:13,  1.66s/it, loss=0.0813, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00103, train/loss_step=0.243, global_step=1187.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  93%|█████████▎| 1129/1208 [31:16<02:11,  1.66s/it, loss=0.0813, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00103, train/loss_step=0.243, global_step=1187.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  93%|█████████▎| 1129/1208 [31:16<02:11,  1.66s/it, loss=0.0679, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.51e-5, train/loss_step=0.00254, global_step=1188.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  94%|█████████▎| 1130/1208 [31:17<02:09,  1.66s/it, loss=0.0679, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.51e-5, train/loss_step=0.00254, global_step=1188.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  94%|█████████▎| 1130/1208 [31:17<02:09,  1.66s/it, loss=0.048, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=1.31e-5, train/loss_step=0.00223, global_step=1188.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  94%|█████████▎| 1131/1208 [31:18<02:07,  1.66s/it, loss=0.048, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=1.31e-5, train/loss_step=0.00223, global_step=1188.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  94%|█████████▎| 1131/1208 [31:18<02:07,  1.66s/it, loss=0.0533, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=1188.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  94%|█████████▎| 1132/1208 [31:21<02:06,  1.66s/it, loss=0.0533, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=1188.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  94%|█████████▎| 1132/1208 [31:21<02:06,  1.66s/it, loss=0.0824, v_num=0, train/loss_simple_step=0.587, train/loss_vlb_step=0.0096, train/loss_step=0.587, global_step=1188.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  94%|█████████▍| 1133/1208 [31:22<02:04,  1.66s/it, loss=0.0824, v_num=0, train/loss_simple_step=0.587, train/loss_vlb_step=0.0096, train/loss_step=0.587, global_step=1188.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  94%|█████████▍| 1133/1208 [31:22<02:04,  1.66s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.0777, train/loss_vlb_step=0.000264, train/loss_step=0.0777, global_step=1189.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  94%|█████████▍| 1134/1208 [31:23<02:02,  1.66s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.0777, train/loss_vlb_step=0.000264, train/loss_step=0.0777, global_step=1189.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  94%|█████████▍| 1134/1208 [31:23<02:02,  1.66s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000677, train/loss_step=0.189, global_step=1189.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  94%|█████████▍| 1135/1208 [31:24<02:01,  1.66s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000677, train/loss_step=0.189, global_step=1189.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  94%|█████████▍| 1135/1208 [31:24<02:01,  1.66s/it, loss=0.103, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000641, train/loss_step=0.186, global_step=1189.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  94%|█████████▍| 1136/1208 [31:28<01:59,  1.66s/it, loss=0.103, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000641, train/loss_step=0.186, global_step=1189.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  94%|█████████▍| 1136/1208 [31:28<01:59,  1.66s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.000207, train/loss_step=0.0615, global_step=1189.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  94%|█████████▍| 1137/1208 [31:29<01:57,  1.66s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.000207, train/loss_step=0.0615, global_step=1189.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  94%|█████████▍| 1137/1208 [31:29<01:57,  1.66s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.00012, train/loss_step=0.0309, global_step=1190.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  94%|█████████▍| 1138/1208 [31:30<01:56,  1.66s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.00012, train/loss_step=0.0309, global_step=1190.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  94%|█████████▍| 1138/1208 [31:30<01:56,  1.66s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0947, train/loss_vlb_step=0.000311, train/loss_step=0.0947, global_step=1190.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  94%|█████████▍| 1139/1208 [31:31<01:54,  1.66s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0947, train/loss_vlb_step=0.000311, train/loss_step=0.0947, global_step=1190.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  94%|█████████▍| 1139/1208 [31:31<01:54,  1.66s/it, loss=0.13, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00271, train/loss_step=0.399, global_step=1190.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  94%|█████████▍| 1140/1208 [31:34<01:53,  1.66s/it, loss=0.13, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00271, train/loss_step=0.399, global_step=1190.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  94%|█████████▍| 1140/1208 [31:34<01:53,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.001, train/loss_step=0.265, global_step=1190.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  94%|█████████▍| 1141/1208 [31:35<01:51,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.001, train/loss_step=0.265, global_step=1190.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  94%|█████████▍| 1141/1208 [31:35<01:51,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000385, train/loss_step=0.116, global_step=1191.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  95%|█████████▍| 1142/1208 [31:36<01:49,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000385, train/loss_step=0.116, global_step=1191.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  95%|█████████▍| 1142/1208 [31:36<01:49,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0673, train/loss_vlb_step=0.000232, train/loss_step=0.0673, global_step=1191.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  95%|█████████▍| 1143/1208 [31:37<01:47,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0673, train/loss_vlb_step=0.000232, train/loss_step=0.0673, global_step=1191.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  95%|█████████▍| 1143/1208 [31:37<01:47,  1.66s/it, loss=0.159, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00299, train/loss_step=0.383, global_step=1191.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  95%|█████████▍| 1144/1208 [31:41<01:46,  1.66s/it, loss=0.159, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00299, train/loss_step=0.383, global_step=1191.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  95%|█████████▍| 1144/1208 [31:41<01:46,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.000186, train/loss_step=0.0526, global_step=1191.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  95%|█████████▍| 1145/1208 [31:42<01:44,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.000186, train/loss_step=0.0526, global_step=1191.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  95%|█████████▍| 1145/1208 [31:42<01:44,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.6e-5, train/loss_step=0.0183, global_step=1192.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  95%|█████████▍| 1146/1208 [31:43<01:42,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.6e-5, train/loss_step=0.0183, global_step=1192.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  95%|█████████▍| 1146/1208 [31:43<01:42,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000841, train/loss_step=0.222, global_step=1192.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  95%|█████████▍| 1147/1208 [31:44<01:41,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000841, train/loss_step=0.222, global_step=1192.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  95%|█████████▍| 1147/1208 [31:44<01:41,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00439, train/loss_vlb_step=2.38e-5, train/loss_step=0.00439, global_step=1192.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  95%|█████████▌| 1148/1208 [31:47<01:39,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00439, train/loss_vlb_step=2.38e-5, train/loss_step=0.00439, global_step=1192.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  95%|█████████▌| 1148/1208 [31:47<01:39,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.27e-5, train/loss_step=0.0139, global_step=1192.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  95%|█████████▌| 1149/1208 [31:48<01:37,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.27e-5, train/loss_step=0.0139, global_step=1192.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  95%|█████████▌| 1149/1208 [31:48<01:37,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000116, train/loss_step=0.0287, global_step=1193.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  95%|█████████▌| 1150/1208 [31:49<01:36,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000116, train/loss_step=0.0287, global_step=1193.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  95%|█████████▌| 1150/1208 [31:49<01:36,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.58e-5, train/loss_step=0.00274, global_step=1193.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  95%|█████████▌| 1151/1208 [31:50<01:34,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.58e-5, train/loss_step=0.00274, global_step=1193.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  95%|█████████▌| 1151/1208 [31:50<01:34,  1.66s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000142, train/loss_step=0.0381, global_step=1193.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  95%|█████████▌| 1152/1208 [31:53<01:33,  1.66s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000142, train/loss_step=0.0381, global_step=1193.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  95%|█████████▌| 1152/1208 [31:53<01:33,  1.66s/it, loss=0.13, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00235, train/loss_step=0.346, global_step=1193.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]    Epoch 3:  95%|█████████▌| 1153/1208 [31:54<01:31,  1.66s/it, loss=0.13, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00235, train/loss_step=0.346, global_step=1193.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  95%|█████████▌| 1153/1208 [31:54<01:31,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.16e-5, train/loss_step=0.00394, global_step=1194.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  96%|█████████▌| 1154/1208 [31:55<01:29,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.16e-5, train/loss_step=0.00394, global_step=1194.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  96%|█████████▌| 1154/1208 [31:55<01:29,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000942, train/loss_step=0.234, global_step=1194.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  96%|█████████▌| 1155/1208 [31:56<01:27,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000942, train/loss_step=0.234, global_step=1194.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  96%|█████████▌| 1155/1208 [31:56<01:27,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0946, train/loss_vlb_step=0.000314, train/loss_step=0.0946, global_step=1194.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  96%|█████████▌| 1156/1208 [32:00<01:26,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0946, train/loss_vlb_step=0.000314, train/loss_step=0.0946, global_step=1194.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  96%|█████████▌| 1156/1208 [32:00<01:26,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.571, train/loss_vlb_step=0.00773, train/loss_step=0.571, global_step=1194.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  96%|█████████▌| 1157/1208 [32:01<01:24,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.571, train/loss_vlb_step=0.00773, train/loss_step=0.571, global_step=1194.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  96%|█████████▌| 1157/1208 [32:01<01:24,  1.66s/it, loss=0.175, v_num=0, train/loss_simple_step=0.551, train/loss_vlb_step=0.00815, train/loss_step=0.551, global_step=1195.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  96%|█████████▌| 1158/1208 [32:02<01:23,  1.66s/it, loss=0.175, v_num=0, train/loss_simple_step=0.551, train/loss_vlb_step=0.00815, train/loss_step=0.551, global_step=1195.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  96%|█████████▌| 1158/1208 [32:02<01:23,  1.66s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.000196, train/loss_step=0.0537, global_step=1195.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  96%|█████████▌| 1159/1208 [32:03<01:21,  1.66s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.000196, train/loss_step=0.0537, global_step=1195.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  96%|█████████▌| 1159/1208 [32:03<01:21,  1.66s/it, loss=0.159, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=1195.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  96%|█████████▌| 1160/1208 [32:06<01:19,  1.66s/it, loss=0.159, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=1195.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  96%|█████████▌| 1160/1208 [32:06<01:19,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00121, train/loss_step=0.281, global_step=1195.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  96%|█████████▌| 1161/1208 [32:07<01:18,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00121, train/loss_step=0.281, global_step=1195.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  96%|█████████▌| 1161/1208 [32:07<01:18,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=7.16e-5, train/loss_step=0.0157, global_step=1196.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  96%|█████████▌| 1162/1208 [32:08<01:16,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=7.16e-5, train/loss_step=0.0157, global_step=1196.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  96%|█████████▌| 1162/1208 [32:08<01:16,  1.66s/it, loss=0.159, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000514, train/loss_step=0.155, global_step=1196.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  96%|█████████▋| 1163/1208 [32:09<01:14,  1.66s/it, loss=0.159, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000514, train/loss_step=0.155, global_step=1196.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  96%|█████████▋| 1163/1208 [32:09<01:14,  1.66s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0661, train/loss_vlb_step=0.00023, train/loss_step=0.0661, global_step=1196.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  96%|█████████▋| 1164/1208 [32:12<01:13,  1.66s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0661, train/loss_vlb_step=0.00023, train/loss_step=0.0661, global_step=1196.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  96%|█████████▋| 1164/1208 [32:12<01:13,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.24e-5, train/loss_step=0.0021, global_step=1196.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  96%|█████████▋| 1165/1208 [32:14<01:11,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.24e-5, train/loss_step=0.0021, global_step=1196.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  96%|█████████▋| 1165/1208 [32:14<01:11,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.5e-5, train/loss_step=0.00254, global_step=1197.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  97%|█████████▋| 1166/1208 [32:15<01:09,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.5e-5, train/loss_step=0.00254, global_step=1197.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  97%|█████████▋| 1166/1208 [32:15<01:09,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0895, train/loss_vlb_step=0.000299, train/loss_step=0.0895, global_step=1197.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  97%|█████████▋| 1167/1208 [32:16<01:08,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0895, train/loss_vlb_step=0.000299, train/loss_step=0.0895, global_step=1197.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  97%|█████████▋| 1167/1208 [32:16<01:08,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000347, train/loss_step=0.105, global_step=1197.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  97%|█████████▋| 1168/1208 [32:19<01:06,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000347, train/loss_step=0.105, global_step=1197.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  97%|█████████▋| 1168/1208 [32:19<01:06,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.87e-5, train/loss_step=0.00341, global_step=1197.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  97%|█████████▋| 1169/1208 [32:20<01:04,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.87e-5, train/loss_step=0.00341, global_step=1197.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  97%|█████████▋| 1169/1208 [32:20<01:04,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0923, train/loss_vlb_step=0.000305, train/loss_step=0.0923, global_step=1198.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  97%|█████████▋| 1170/1208 [32:21<01:03,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0923, train/loss_vlb_step=0.000305, train/loss_step=0.0923, global_step=1198.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  97%|█████████▋| 1170/1208 [32:21<01:03,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000609, train/loss_step=0.176, global_step=1198.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  97%|█████████▋| 1171/1208 [32:22<01:01,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000609, train/loss_step=0.176, global_step=1198.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  97%|█████████▋| 1171/1208 [32:22<01:01,  1.66s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00339, train/loss_vlb_step=1.96e-5, train/loss_step=0.00339, global_step=1198.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  97%|█████████▋| 1172/1208 [32:25<00:59,  1.66s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00339, train/loss_vlb_step=1.96e-5, train/loss_step=0.00339, global_step=1198.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  97%|█████████▋| 1172/1208 [32:25<00:59,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.48e-5, train/loss_step=0.00255, global_step=1198.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  97%|█████████▋| 1173/1208 [32:26<00:58,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.48e-5, train/loss_step=0.00255, global_step=1198.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  97%|█████████▋| 1173/1208 [32:26<00:58,  1.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.45e-5, train/loss_step=0.0183, global_step=1199.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  97%|█████████▋| 1174/1208 [32:27<00:56,  1.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.45e-5, train/loss_step=0.0183, global_step=1199.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  97%|█████████▋| 1174/1208 [32:27<00:56,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0357, train/loss_vlb_step=0.000133, train/loss_step=0.0357, global_step=1199.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  97%|█████████▋| 1175/1208 [32:28<00:54,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0357, train/loss_vlb_step=0.000133, train/loss_step=0.0357, global_step=1199.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  97%|█████████▋| 1175/1208 [32:28<00:54,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.586, train/loss_vlb_step=0.00888, train/loss_step=0.586, global_step=1199.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  97%|█████████▋| 1176/1208 [32:32<00:53,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.586, train/loss_vlb_step=0.00888, train/loss_step=0.586, global_step=1199.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  97%|█████████▋| 1176/1208 [32:32<00:53,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0778, train/loss_vlb_step=0.000259, train/loss_step=0.0778, global_step=1199.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  97%|█████████▋| 1177/1208 [32:33<00:51,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0778, train/loss_vlb_step=0.000259, train/loss_step=0.0778, global_step=1199.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  97%|█████████▋| 1177/1208 [32:33<00:51,  1.66s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.75e-5, train/loss_step=0.00305, global_step=1200.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  98%|█████████▊| 1178/1208 [32:34<00:49,  1.66s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.75e-5, train/loss_step=0.00305, global_step=1200.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  98%|█████████▊| 1178/1208 [32:34<00:49,  1.66s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.0818, train/loss_vlb_step=0.000276, train/loss_step=0.0818, global_step=1200.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  98%|█████████▊| 1179/1208 [32:35<00:48,  1.66s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.0818, train/loss_vlb_step=0.000276, train/loss_step=0.0818, global_step=1200.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  98%|█████████▊| 1179/1208 [32:35<00:48,  1.66s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.5e-5, train/loss_step=0.0181, global_step=1200.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  98%|█████████▊| 1180/1208 [32:38<00:46,  1.66s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.5e-5, train/loss_step=0.0181, global_step=1200.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  98%|█████████▊| 1180/1208 [32:38<00:46,  1.66s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00261, train/loss_step=0.364, global_step=1200.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  98%|█████████▊| 1181/1208 [32:39<00:44,  1.66s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00261, train/loss_step=0.364, global_step=1200.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  98%|█████████▊| 1181/1208 [32:39<00:44,  1.66s/it, loss=0.103, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000585, train/loss_step=0.172, global_step=1201.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  98%|█████████▊| 1182/1208 [32:40<00:43,  1.66s/it, loss=0.103, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000585, train/loss_step=0.172, global_step=1201.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  98%|█████████▊| 1182/1208 [32:40<00:43,  1.66s/it, loss=0.11, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00127, train/loss_step=0.303, global_step=1201.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  98%|█████████▊| 1183/1208 [32:41<00:41,  1.66s/it, loss=0.11, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00127, train/loss_step=0.303, global_step=1201.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  98%|█████████▊| 1183/1208 [32:41<00:41,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=9.94e-5, train/loss_step=0.0248, global_step=1201.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  98%|█████████▊| 1184/1208 [32:44<00:39,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=9.94e-5, train/loss_step=0.0248, global_step=1201.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  98%|█████████▊| 1184/1208 [32:44<00:39,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00889, train/loss_vlb_step=4.3e-5, train/loss_step=0.00889, global_step=1201.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  98%|█████████▊| 1185/1208 [32:45<00:38,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00889, train/loss_vlb_step=4.3e-5, train/loss_step=0.00889, global_step=1201.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  98%|█████████▊| 1185/1208 [32:45<00:38,  1.66s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.17e-5, train/loss_step=0.0139, global_step=1202.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3:  98%|█████████▊| 1186/1208 [32:46<00:36,  1.66s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.17e-5, train/loss_step=0.0139, global_step=1202.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  98%|█████████▊| 1186/1208 [32:46<00:36,  1.66s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000138, train/loss_step=0.0367, global_step=1202.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  98%|█████████▊| 1187/1208 [32:48<00:34,  1.66s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000138, train/loss_step=0.0367, global_step=1202.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  98%|█████████▊| 1187/1208 [32:48<00:34,  1.66s/it, loss=0.111, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000747, train/loss_step=0.196, global_step=1202.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  98%|█████████▊| 1188/1208 [32:51<00:33,  1.66s/it, loss=0.111, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000747, train/loss_step=0.196, global_step=1202.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  98%|█████████▊| 1188/1208 [32:51<00:33,  1.66s/it, loss=0.112, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.8e-5, train/loss_step=0.018, global_step=1202.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  98%|█████████▊| 1189/1208 [32:52<00:31,  1.66s/it, loss=0.112, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.8e-5, train/loss_step=0.018, global_step=1202.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  98%|█████████▊| 1189/1208 [32:52<00:31,  1.66s/it, loss=0.114, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000439, train/loss_step=0.133, global_step=1203.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  99%|█████████▊| 1190/1208 [32:53<00:29,  1.66s/it, loss=0.114, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000439, train/loss_step=0.133, global_step=1203.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  99%|█████████▊| 1190/1208 [32:53<00:29,  1.66s/it, loss=0.114, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000715, train/loss_step=0.194, global_step=1203.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  99%|█████████▊| 1191/1208 [32:54<00:28,  1.66s/it, loss=0.114, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000715, train/loss_step=0.194, global_step=1203.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  99%|█████████▊| 1191/1208 [32:54<00:28,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0548, train/loss_vlb_step=0.000187, train/loss_step=0.0548, global_step=1203.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  99%|█████████▊| 1192/1208 [32:57<00:26,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0548, train/loss_vlb_step=0.000187, train/loss_step=0.0548, global_step=1203.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  99%|█████████▊| 1192/1208 [32:57<00:26,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00216, train/loss_step=0.349, global_step=1203.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]   Epoch 3:  99%|█████████▉| 1193/1208 [32:58<00:24,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00216, train/loss_step=0.349, global_step=1203.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  99%|█████████▉| 1193/1208 [32:58<00:24,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.61e-5, train/loss_step=0.0122, global_step=1204.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  99%|█████████▉| 1194/1208 [32:59<00:23,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.61e-5, train/loss_step=0.0122, global_step=1204.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  99%|█████████▉| 1194/1208 [32:59<00:23,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000253, train/loss_step=0.0741, global_step=1204.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  99%|█████████▉| 1195/1208 [33:00<00:21,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000253, train/loss_step=0.0741, global_step=1204.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  99%|█████████▉| 1195/1208 [33:00<00:21,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.3e-5, train/loss_step=0.0245, global_step=1204.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  99%|█████████▉| 1196/1208 [33:04<00:19,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.3e-5, train/loss_step=0.0245, global_step=1204.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  99%|█████████▉| 1196/1208 [33:04<00:19,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.0028, train/loss_step=0.406, global_step=1204.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  99%|█████████▉| 1197/1208 [33:05<00:18,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.0028, train/loss_step=0.406, global_step=1204.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  99%|█████████▉| 1197/1208 [33:05<00:18,  1.66s/it, loss=0.143, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00246, train/loss_step=0.383, global_step=1205.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  99%|█████████▉| 1198/1208 [33:06<00:16,  1.66s/it, loss=0.143, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00246, train/loss_step=0.383, global_step=1205.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  99%|█████████▉| 1198/1208 [33:06<00:16,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.692, train/loss_vlb_step=0.030, train/loss_step=0.692, global_step=1205.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3:  99%|█████████▉| 1199/1208 [33:07<00:14,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.692, train/loss_vlb_step=0.030, train/loss_step=0.692, global_step=1205.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  99%|█████████▉| 1199/1208 [33:07<00:14,  1.66s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.86e-5, train/loss_step=0.0106, global_step=1205.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  99%|█████████▉| 1200/1208 [33:10<00:13,  1.66s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.86e-5, train/loss_step=0.0106, global_step=1205.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  99%|█████████▉| 1200/1208 [33:10<00:13,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0607, train/loss_vlb_step=0.000212, train/loss_step=0.0607, global_step=1205.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.75it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.75it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.74it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.76it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.76it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.75it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.82it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.82it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.77it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.78it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.81it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 3:  99%|█████████▉| 1201/1208 [33:40<00:11,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0607, train/loss_vlb_step=0.000212, train/loss_step=0.0607, global_step=1205.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3:  99%|█████████▉| 1201/1208 [33:40<00:11,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00625, train/loss_vlb_step=3.15e-5, train/loss_step=0.00625, global_step=1206.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3: 100%|█████████▉| 1202/1208 [33:41<00:10,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00625, train/loss_vlb_step=3.15e-5, train/loss_step=0.00625, global_step=1206.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3: 100%|█████████▉| 1202/1208 [33:41<00:10,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000165, train/loss_step=0.0454, global_step=1206.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3: 100%|█████████▉| 1203/1208 [33:42<00:08,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000165, train/loss_step=0.0454, global_step=1206.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3: 100%|█████████▉| 1203/1208 [33:42<00:08,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=8.37e-5, train/loss_step=0.0192, global_step=1206.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143] Epoch 3: 100%|█████████▉| 1204/1208 [33:46<00:06,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=8.37e-5, train/loss_step=0.0192, global_step=1206.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3: 100%|█████████▉| 1204/1208 [33:46<00:06,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00232, train/loss_step=0.393, global_step=1206.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3: 100%|█████████▉| 1205/1208 [33:47<00:05,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00232, train/loss_step=0.393, global_step=1206.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3: 100%|█████████▉| 1205/1208 [33:47<00:05,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0691, train/loss_vlb_step=0.000238, train/loss_step=0.0691, global_step=1207.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3: 100%|█████████▉| 1206/1208 [33:48<00:03,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0691, train/loss_vlb_step=0.000238, train/loss_step=0.0691, global_step=1207.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3: 100%|█████████▉| 1206/1208 [33:48<00:03,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000435, train/loss_step=0.129, global_step=1207.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]  Epoch 3: 100%|█████████▉| 1207/1208 [33:49<00:01,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000435, train/loss_step=0.129, global_step=1207.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3: 100%|█████████▉| 1207/1208 [33:49<00:01,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000856, train/loss_step=0.223, global_step=1207.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3: 100%|██████████| 1208/1208 [33:53<00:00,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000856, train/loss_step=0.223, global_step=1207.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 3: 100%|██████████| 1208/1208 [33:53<00:00,  1.68s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000162, train/loss_step=0.0443, global_step=1207.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]
+
+
+Epoch 3:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.166, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000162, train/loss_step=0.0443, global_step=1207.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]           Epoch 4:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.166, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000162, train/loss_step=0.0443, global_step=1207.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][AData shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.86it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.73it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.71it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.70it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.76it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.75it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.72it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.74it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.75it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.76it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.75it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.75it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.75it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.76it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.78it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.78it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.78it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.83it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.78it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.83it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.83it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.83it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.83it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.78it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.83it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.83it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.79it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.83it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.83it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.83it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.83it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.79it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.78it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.83it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.83it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.78it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.83it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.78it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.78it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.78it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.78it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.78it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.78it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.78it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]Epoch 4:   0%|          | 1/1208 [00:33<11:06:08, 33.11s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000162, train/loss_step=0.0443, global_step=1207.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00245, train/loss_epoch=0.143]Epoch 4:   0%|          | 1/1208 [00:33<11:06:10, 33.12s/it, loss=0.172, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00113, train/loss_step=0.256, global_step=1208.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:   0%|          | 2/1208 [00:34<5:43:09, 17.07s/it, loss=0.172, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00113, train/loss_step=0.256, global_step=1208.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:   0%|          | 2/1208 [00:34<5:43:10, 17.07s/it, loss=0.163, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.19e-5, train/loss_step=0.011, global_step=1208.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   0%|          | 3/1208 [00:35<3:55:30, 11.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.19e-5, train/loss_step=0.011, global_step=1208.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   0%|          | 3/1208 [00:35<3:55:31, 11.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00151, train/loss_step=0.323, global_step=1208.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   0%|          | 4/1208 [00:38<3:11:56,  9.57s/it, loss=0.177, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00151, train/loss_step=0.323, global_step=1208.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   0%|          | 4/1208 [00:38<3:11:57,  9.57s/it, loss=0.172, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000981, train/loss_step=0.248, global_step=1208.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   0%|          | 5/1208 [00:39<2:37:42,  7.87s/it, loss=0.172, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000981, train/loss_step=0.248, global_step=1208.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   0%|          | 5/1208 [00:39<2:37:42,  7.87s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0597, train/loss_vlb_step=0.000209, train/loss_step=0.0597, global_step=1209.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   0%|          | 6/1208 [00:40<2:14:45,  6.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0597, train/loss_vlb_step=0.000209, train/loss_step=0.0597, global_step=1209.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   0%|          | 6/1208 [00:40<2:14:45,  6.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.039, train/loss_vlb_step=0.000141, train/loss_step=0.039, global_step=1209.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:   1%|          | 7/1208 [00:41<1:58:20,  5.91s/it, loss=0.172, v_num=0, train/loss_simple_step=0.039, train/loss_vlb_step=0.000141, train/loss_step=0.039, global_step=1209.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   1%|          | 7/1208 [00:41<1:58:21,  5.91s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0411, train/loss_vlb_step=0.000154, train/loss_step=0.0411, global_step=1209.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   1%|          | 8/1208 [00:44<1:51:32,  5.58s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0411, train/loss_vlb_step=0.000154, train/loss_step=0.0411, global_step=1209.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   1%|          | 8/1208 [00:44<1:51:33,  5.58s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0422, train/loss_vlb_step=0.000156, train/loss_step=0.0422, global_step=1209.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   1%|          | 9/1208 [00:45<1:41:25,  5.08s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0422, train/loss_vlb_step=0.000156, train/loss_step=0.0422, global_step=1209.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   1%|          | 9/1208 [00:45<1:41:26,  5.08s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0517, train/loss_vlb_step=0.000188, train/loss_step=0.0517, global_step=1210.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   1%|          | 10/1208 [00:46<1:33:15,  4.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0517, train/loss_vlb_step=0.000188, train/loss_step=0.0517, global_step=1210.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   1%|          | 10/1208 [00:46<1:33:16,  4.67s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=0.000106, train/loss_step=0.0259, global_step=1210.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   1%|          | 11/1208 [00:47<1:26:34,  4.34s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=0.000106, train/loss_step=0.0259, global_step=1210.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   1%|          | 11/1208 [00:47<1:26:35,  4.34s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00636, train/loss_vlb_step=3.31e-5, train/loss_step=0.00636, global_step=1210.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   1%|          | 12/1208 [00:50<1:24:42,  4.25s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00636, train/loss_vlb_step=3.31e-5, train/loss_step=0.00636, global_step=1210.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   1%|          | 12/1208 [00:50<1:24:42,  4.25s/it, loss=0.112, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000729, train/loss_step=0.209, global_step=1210.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:   1%|          | 13/1208 [00:52<1:19:45,  4.00s/it, loss=0.112, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000729, train/loss_step=0.209, global_step=1210.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   1%|          | 13/1208 [00:52<1:19:45,  4.01s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000113, train/loss_step=0.0273, global_step=1211.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   1%|          | 14/1208 [00:53<1:15:28,  3.79s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000113, train/loss_step=0.0273, global_step=1211.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   1%|          | 14/1208 [00:53<1:15:28,  3.79s/it, loss=0.126, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.0023, train/loss_step=0.298, global_step=1211.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:   1%|          | 15/1208 [00:54<1:11:45,  3.61s/it, loss=0.126, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.0023, train/loss_step=0.298, global_step=1211.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   1%|          | 15/1208 [00:54<1:11:45,  3.61s/it, loss=0.136, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000807, train/loss_step=0.215, global_step=1211.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   1%|▏         | 16/1208 [00:57<1:11:09,  3.58s/it, loss=0.136, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000807, train/loss_step=0.215, global_step=1211.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   1%|▏         | 16/1208 [00:57<1:11:09,  3.58s/it, loss=0.134, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.00248, train/loss_step=0.360, global_step=1211.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:   1%|▏         | 17/1208 [00:58<1:08:08,  3.43s/it, loss=0.134, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.00248, train/loss_step=0.360, global_step=1211.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   1%|▏         | 17/1208 [00:58<1:08:09,  3.43s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.75e-5, train/loss_step=0.0215, global_step=1212.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   1%|▏         | 18/1208 [00:59<1:05:27,  3.30s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.75e-5, train/loss_step=0.0215, global_step=1212.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   1%|▏         | 18/1208 [00:59<1:05:27,  3.30s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0058, train/loss_vlb_step=3.05e-5, train/loss_step=0.0058, global_step=1212.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   2%|▏         | 19/1208 [01:00<1:03:02,  3.18s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0058, train/loss_vlb_step=3.05e-5, train/loss_step=0.0058, global_step=1212.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   2%|▏         | 19/1208 [01:00<1:03:02,  3.18s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0767, train/loss_vlb_step=0.000258, train/loss_step=0.0767, global_step=1212.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   2%|▏         | 20/1208 [01:03<1:03:03,  3.19s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0767, train/loss_vlb_step=0.000258, train/loss_step=0.0767, global_step=1212.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   2%|▏         | 20/1208 [01:03<1:03:03,  3.19s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.28e-5, train/loss_step=0.00212, global_step=1212.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   2%|▏         | 21/1208 [01:04<1:01:00,  3.08s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.28e-5, train/loss_step=0.00212, global_step=1212.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   2%|▏         | 21/1208 [01:04<1:01:00,  3.08s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=1.04e-5, train/loss_step=0.00171, global_step=1213.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   2%|▏         | 22/1208 [01:05<59:06,  2.99s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=1.04e-5, train/loss_step=0.00171, global_step=1213.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:   2%|▏         | 22/1208 [01:05<59:06,  2.99s/it, loss=0.104, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=7.03e-5, train/loss_step=0.016, global_step=1213.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:   2%|▏         | 23/1208 [01:06<57:22,  2.91s/it, loss=0.104, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=7.03e-5, train/loss_step=0.016, global_step=1213.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   2%|▏         | 23/1208 [01:06<57:22,  2.91s/it, loss=0.0894, v_num=0, train/loss_simple_step=0.039, train/loss_vlb_step=0.000145, train/loss_step=0.039, global_step=1213.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   2%|▏         | 24/1208 [01:10<57:37,  2.92s/it, loss=0.0894, v_num=0, train/loss_simple_step=0.039, train/loss_vlb_step=0.000145, train/loss_step=0.039, global_step=1213.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   2%|▏         | 24/1208 [01:10<57:38,  2.92s/it, loss=0.0883, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000959, train/loss_step=0.227, global_step=1213.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   2%|▏         | 25/1208 [01:11<56:07,  2.85s/it, loss=0.0883, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000959, train/loss_step=0.227, global_step=1213.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   2%|▏         | 25/1208 [01:11<56:07,  2.85s/it, loss=0.0868, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000118, train/loss_step=0.0306, global_step=1214.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   2%|▏         | 26/1208 [01:12<54:43,  2.78s/it, loss=0.0868, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000118, train/loss_step=0.0306, global_step=1214.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   2%|▏         | 26/1208 [01:12<54:43,  2.78s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.000106, train/loss_step=0.027, global_step=1214.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:   2%|▏         | 27/1208 [01:13<53:23,  2.71s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.000106, train/loss_step=0.027, global_step=1214.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   2%|▏         | 27/1208 [01:13<53:24,  2.71s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000483, train/loss_step=0.146, global_step=1214.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   2%|▏         | 28/1208 [01:16<53:42,  2.73s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000483, train/loss_step=0.146, global_step=1214.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   2%|▏         | 28/1208 [01:16<53:42,  2.73s/it, loss=0.0903, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.56e-5, train/loss_step=0.018, global_step=1214.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:   2%|▏         | 29/1208 [01:17<52:31,  2.67s/it, loss=0.0903, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.56e-5, train/loss_step=0.018, global_step=1214.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   2%|▏         | 29/1208 [01:17<52:31,  2.67s/it, loss=0.0879, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=2.29e-5, train/loss_step=0.00421, global_step=1215.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   2%|▏         | 30/1208 [01:18<51:25,  2.62s/it, loss=0.0879, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=2.29e-5, train/loss_step=0.00421, global_step=1215.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   2%|▏         | 30/1208 [01:18<51:25,  2.62s/it, loss=0.089, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000174, train/loss_step=0.0474, global_step=1215.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:   3%|▎         | 31/1208 [01:19<50:22,  2.57s/it, loss=0.089, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000174, train/loss_step=0.0474, global_step=1215.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   3%|▎         | 31/1208 [01:19<50:22,  2.57s/it, loss=0.096, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000487, train/loss_step=0.148, global_step=1215.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:   3%|▎         | 32/1208 [01:22<50:44,  2.59s/it, loss=0.096, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000487, train/loss_step=0.148, global_step=1215.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   3%|▎         | 32/1208 [01:22<50:44,  2.59s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=1.55e-5, train/loss_step=0.00271, global_step=1215.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   3%|▎         | 33/1208 [01:23<49:47,  2.54s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=1.55e-5, train/loss_step=0.00271, global_step=1215.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   3%|▎         | 33/1208 [01:23<49:47,  2.54s/it, loss=0.0894, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000337, train/loss_step=0.102, global_step=1216.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:   3%|▎         | 34/1208 [01:24<48:53,  2.50s/it, loss=0.0894, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000337, train/loss_step=0.102, global_step=1216.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   3%|▎         | 34/1208 [01:24<48:53,  2.50s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000517, train/loss_step=0.154, global_step=1216.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   3%|▎         | 35/1208 [01:25<48:01,  2.46s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000517, train/loss_step=0.154, global_step=1216.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   3%|▎         | 35/1208 [01:25<48:01,  2.46s/it, loss=0.0793, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000522, train/loss_step=0.156, global_step=1216.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   3%|▎         | 36/1208 [01:29<48:26,  2.48s/it, loss=0.0793, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000522, train/loss_step=0.156, global_step=1216.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   3%|▎         | 36/1208 [01:29<48:26,  2.48s/it, loss=0.0746, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00115, train/loss_step=0.267, global_step=1216.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:   3%|▎         | 37/1208 [01:30<47:38,  2.44s/it, loss=0.0746, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00115, train/loss_step=0.267, global_step=1216.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   3%|▎         | 37/1208 [01:30<47:38,  2.44s/it, loss=0.075, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000114, train/loss_step=0.0287, global_step=1217.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   3%|▎         | 38/1208 [01:31<46:53,  2.40s/it, loss=0.075, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000114, train/loss_step=0.0287, global_step=1217.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   3%|▎         | 38/1208 [01:31<46:53,  2.40s/it, loss=0.0806, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.00039, train/loss_step=0.118, global_step=1217.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:   3%|▎         | 39/1208 [01:32<46:09,  2.37s/it, loss=0.0806, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.00039, train/loss_step=0.118, global_step=1217.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   3%|▎         | 39/1208 [01:32<46:09,  2.37s/it, loss=0.0769, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=1.38e-5, train/loss_step=0.00231, global_step=1217.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   3%|▎         | 40/1208 [01:35<46:33,  2.39s/it, loss=0.0769, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=1.38e-5, train/loss_step=0.00231, global_step=1217.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   3%|▎         | 40/1208 [01:35<46:33,  2.39s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00159, train/loss_step=0.303, global_step=1217.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:   3%|▎         | 41/1208 [01:36<45:53,  2.36s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00159, train/loss_step=0.303, global_step=1217.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   3%|▎         | 41/1208 [01:36<45:53,  2.36s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.0554, train/loss_vlb_step=0.000197, train/loss_step=0.0554, global_step=1218.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   3%|▎         | 42/1208 [01:37<45:14,  2.33s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.0554, train/loss_vlb_step=0.000197, train/loss_step=0.0554, global_step=1218.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   3%|▎         | 42/1208 [01:37<45:14,  2.33s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.74e-5, train/loss_step=0.0229, global_step=1218.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:   4%|▎         | 43/1208 [01:38<44:36,  2.30s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.74e-5, train/loss_step=0.0229, global_step=1218.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   4%|▎         | 43/1208 [01:38<44:36,  2.30s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.21e-5, train/loss_step=0.0111, global_step=1218.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   4%|▎         | 44/1208 [01:42<44:58,  2.32s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.21e-5, train/loss_step=0.0111, global_step=1218.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   4%|▎         | 44/1208 [01:42<44:58,  2.32s/it, loss=0.094, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000967, train/loss_step=0.237, global_step=1218.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:   4%|▎         | 45/1208 [01:43<44:24,  2.29s/it, loss=0.094, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000967, train/loss_step=0.237, global_step=1218.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   4%|▎         | 45/1208 [01:43<44:24,  2.29s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.0929, train/loss_vlb_step=0.000311, train/loss_step=0.0929, global_step=1219.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   4%|▍         | 46/1208 [01:44<43:50,  2.26s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.0929, train/loss_vlb_step=0.000311, train/loss_step=0.0929, global_step=1219.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   4%|▍         | 46/1208 [01:44<43:50,  2.26s/it, loss=0.0959, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=1.4e-5, train/loss_step=0.00232, global_step=1219.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   4%|▍         | 47/1208 [01:45<43:17,  2.24s/it, loss=0.0959, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=1.4e-5, train/loss_step=0.00232, global_step=1219.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   4%|▍         | 47/1208 [01:45<43:17,  2.24s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.0685, train/loss_vlb_step=0.000235, train/loss_step=0.0685, global_step=1219.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   4%|▍         | 48/1208 [01:48<43:40,  2.26s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.0685, train/loss_vlb_step=0.000235, train/loss_step=0.0685, global_step=1219.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   4%|▍         | 48/1208 [01:48<43:40,  2.26s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.29e-5, train/loss_step=0.00219, global_step=1219.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   4%|▍         | 49/1208 [01:49<43:09,  2.23s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.29e-5, train/loss_step=0.00219, global_step=1219.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   4%|▍         | 49/1208 [01:49<43:09,  2.23s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0986, train/loss_vlb_step=0.000325, train/loss_step=0.0986, global_step=1220.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:   4%|▍         | 50/1208 [01:50<42:39,  2.21s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0986, train/loss_vlb_step=0.000325, train/loss_step=0.0986, global_step=1220.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   4%|▍         | 50/1208 [01:50<42:39,  2.21s/it, loss=0.108, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00145, train/loss_step=0.293, global_step=1220.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:   4%|▍         | 51/1208 [01:51<42:10,  2.19s/it, loss=0.108, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00145, train/loss_step=0.293, global_step=1220.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   4%|▍         | 51/1208 [01:51<42:10,  2.19s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0439, train/loss_vlb_step=0.000166, train/loss_step=0.0439, global_step=1220.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   4%|▍         | 52/1208 [01:54<42:32,  2.21s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0439, train/loss_vlb_step=0.000166, train/loss_step=0.0439, global_step=1220.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   4%|▍         | 52/1208 [01:54<42:32,  2.21s/it, loss=0.115, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000902, train/loss_step=0.234, global_step=1220.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:   4%|▍         | 53/1208 [01:55<42:05,  2.19s/it, loss=0.115, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000902, train/loss_step=0.234, global_step=1220.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   4%|▍         | 53/1208 [01:55<42:05,  2.19s/it, loss=0.147, v_num=0, train/loss_simple_step=0.749, train/loss_vlb_step=0.0301, train/loss_step=0.749, global_step=1221.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:   4%|▍         | 54/1208 [01:56<41:38,  2.17s/it, loss=0.147, v_num=0, train/loss_simple_step=0.749, train/loss_vlb_step=0.0301, train/loss_step=0.749, global_step=1221.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   4%|▍         | 54/1208 [01:56<41:38,  2.17s/it, loss=0.148, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000638, train/loss_step=0.180, global_step=1221.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   5%|▍         | 55/1208 [01:57<41:12,  2.14s/it, loss=0.148, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000638, train/loss_step=0.180, global_step=1221.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   5%|▍         | 55/1208 [01:57<41:12,  2.14s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0638, train/loss_vlb_step=0.000222, train/loss_step=0.0638, global_step=1221.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   5%|▍         | 56/1208 [02:01<41:33,  2.16s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0638, train/loss_vlb_step=0.000222, train/loss_step=0.0638, global_step=1221.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   5%|▍         | 56/1208 [02:01<41:33,  2.16s/it, loss=0.148, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.0019, train/loss_step=0.356, global_step=1221.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:   5%|▍         | 57/1208 [02:02<41:08,  2.15s/it, loss=0.148, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.0019, train/loss_step=0.356, global_step=1221.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   5%|▍         | 57/1208 [02:02<41:09,  2.15s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.000163, train/loss_step=0.0456, global_step=1222.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   5%|▍         | 58/1208 [02:03<40:45,  2.13s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.000163, train/loss_step=0.0456, global_step=1222.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   5%|▍         | 58/1208 [02:03<40:45,  2.13s/it, loss=0.146, v_num=0, train/loss_simple_step=0.049, train/loss_vlb_step=0.000176, train/loss_step=0.049, global_step=1222.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:   5%|▍         | 59/1208 [02:04<40:21,  2.11s/it, loss=0.146, v_num=0, train/loss_simple_step=0.049, train/loss_vlb_step=0.000176, train/loss_step=0.049, global_step=1222.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   5%|▍         | 59/1208 [02:04<40:21,  2.11s/it, loss=0.158, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00101, train/loss_step=0.261, global_step=1222.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:   5%|▍         | 60/1208 [02:07<40:40,  2.13s/it, loss=0.158, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00101, train/loss_step=0.261, global_step=1222.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   5%|▍         | 60/1208 [02:07<40:40,  2.13s/it, loss=0.149, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=1222.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   5%|▌         | 61/1208 [02:08<40:18,  2.11s/it, loss=0.149, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=1222.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   5%|▌         | 61/1208 [02:08<40:18,  2.11s/it, loss=0.146, v_num=0, train/loss_simple_step=0.004, train/loss_vlb_step=2.18e-5, train/loss_step=0.004, global_step=1223.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:   5%|▌         | 62/1208 [02:09<39:56,  2.09s/it, loss=0.146, v_num=0, train/loss_simple_step=0.004, train/loss_vlb_step=2.18e-5, train/loss_step=0.004, global_step=1223.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   5%|▌         | 62/1208 [02:09<39:56,  2.09s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000207, train/loss_step=0.0588, global_step=1223.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   5%|▌         | 63/1208 [02:10<39:35,  2.07s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000207, train/loss_step=0.0588, global_step=1223.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   5%|▌         | 63/1208 [02:10<39:35,  2.07s/it, loss=0.162, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00144, train/loss_step=0.289, global_step=1223.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:   5%|▌         | 64/1208 [02:13<39:53,  2.09s/it, loss=0.162, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00144, train/loss_step=0.289, global_step=1223.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   5%|▌         | 64/1208 [02:13<39:53,  2.09s/it, loss=0.156, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=1223.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   5%|▌         | 65/1208 [02:14<39:33,  2.08s/it, loss=0.156, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=1223.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   5%|▌         | 65/1208 [02:14<39:33,  2.08s/it, loss=0.161, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000751, train/loss_step=0.202, global_step=1224.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   5%|▌         | 66/1208 [02:15<39:13,  2.06s/it, loss=0.161, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000751, train/loss_step=0.202, global_step=1224.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   5%|▌         | 66/1208 [02:16<39:13,  2.06s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00458, train/loss_vlb_step=2.46e-5, train/loss_step=0.00458, global_step=1224.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   6%|▌         | 67/1208 [02:17<38:53,  2.05s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00458, train/loss_vlb_step=2.46e-5, train/loss_step=0.00458, global_step=1224.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   6%|▌         | 67/1208 [02:17<38:53,  2.05s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00403, train/loss_vlb_step=2.18e-5, train/loss_step=0.00403, global_step=1224.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   6%|▌         | 68/1208 [02:20<39:11,  2.06s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00403, train/loss_vlb_step=2.18e-5, train/loss_step=0.00403, global_step=1224.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   6%|▌         | 68/1208 [02:20<39:11,  2.06s/it, loss=0.169, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000785, train/loss_step=0.217, global_step=1224.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:   6%|▌         | 69/1208 [02:21<38:52,  2.05s/it, loss=0.169, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000785, train/loss_step=0.217, global_step=1224.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   6%|▌         | 69/1208 [02:21<38:52,  2.05s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=1.01e-5, train/loss_step=0.00166, global_step=1225.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   6%|▌         | 70/1208 [02:22<38:34,  2.03s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=1.01e-5, train/loss_step=0.00166, global_step=1225.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   6%|▌         | 70/1208 [02:22<38:34,  2.03s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0868, train/loss_vlb_step=0.000289, train/loss_step=0.0868, global_step=1225.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:   6%|▌         | 71/1208 [02:23<38:16,  2.02s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0868, train/loss_vlb_step=0.000289, train/loss_step=0.0868, global_step=1225.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   6%|▌         | 71/1208 [02:23<38:16,  2.02s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0884, train/loss_vlb_step=0.000292, train/loss_step=0.0884, global_step=1225.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   6%|▌         | 72/1208 [02:26<38:33,  2.04s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0884, train/loss_vlb_step=0.000292, train/loss_step=0.0884, global_step=1225.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   6%|▌         | 72/1208 [02:26<38:33,  2.04s/it, loss=0.159, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00118, train/loss_step=0.287, global_step=1225.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:   6%|▌         | 73/1208 [02:27<38:16,  2.02s/it, loss=0.159, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00118, train/loss_step=0.287, global_step=1225.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   6%|▌         | 73/1208 [02:27<38:16,  2.02s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0724, train/loss_vlb_step=0.000244, train/loss_step=0.0724, global_step=1226.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   6%|▌         | 74/1208 [02:28<37:58,  2.01s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0724, train/loss_vlb_step=0.000244, train/loss_step=0.0724, global_step=1226.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   6%|▌         | 74/1208 [02:28<37:58,  2.01s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000118, train/loss_step=0.0314, global_step=1226.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   6%|▌         | 75/1208 [02:29<37:41,  2.00s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000118, train/loss_step=0.0314, global_step=1226.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   6%|▌         | 75/1208 [02:29<37:42,  2.00s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00864, train/loss_vlb_step=4.38e-5, train/loss_step=0.00864, global_step=1226.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   6%|▋         | 76/1208 [02:33<37:58,  2.01s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00864, train/loss_vlb_step=4.38e-5, train/loss_step=0.00864, global_step=1226.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   6%|▋         | 76/1208 [02:33<37:59,  2.01s/it, loss=0.103, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=1226.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:   6%|▋         | 77/1208 [02:34<37:42,  2.00s/it, loss=0.103, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=1226.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   6%|▋         | 77/1208 [02:34<37:42,  2.00s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0494, train/loss_vlb_step=0.000175, train/loss_step=0.0494, global_step=1227.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   6%|▋         | 78/1208 [02:35<37:26,  1.99s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0494, train/loss_vlb_step=0.000175, train/loss_step=0.0494, global_step=1227.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   6%|▋         | 78/1208 [02:35<37:26,  1.99s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.51e-5, train/loss_step=0.0198, global_step=1227.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:   7%|▋         | 79/1208 [02:36<37:11,  1.98s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.51e-5, train/loss_step=0.0198, global_step=1227.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   7%|▋         | 79/1208 [02:36<37:11,  1.98s/it, loss=0.0895, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.46e-5, train/loss_step=0.0199, global_step=1227.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   7%|▋         | 80/1208 [02:39<37:27,  1.99s/it, loss=0.0895, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.46e-5, train/loss_step=0.0199, global_step=1227.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   7%|▋         | 80/1208 [02:39<37:27,  1.99s/it, loss=0.0873, v_num=0, train/loss_simple_step=0.0654, train/loss_vlb_step=0.000226, train/loss_step=0.0654, global_step=1227.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   7%|▋         | 81/1208 [02:40<37:11,  1.98s/it, loss=0.0873, v_num=0, train/loss_simple_step=0.0654, train/loss_vlb_step=0.000226, train/loss_step=0.0654, global_step=1227.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   7%|▋         | 81/1208 [02:40<37:11,  1.98s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.00709, train/loss_vlb_step=3.55e-5, train/loss_step=0.00709, global_step=1228.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   7%|▋         | 82/1208 [02:41<36:56,  1.97s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.00709, train/loss_vlb_step=3.55e-5, train/loss_step=0.00709, global_step=1228.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   7%|▋         | 82/1208 [02:41<36:56,  1.97s/it, loss=0.0859, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000106, train/loss_step=0.0273, global_step=1228.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:   7%|▋         | 83/1208 [02:42<36:42,  1.96s/it, loss=0.0859, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000106, train/loss_step=0.0273, global_step=1228.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   7%|▋         | 83/1208 [02:42<36:42,  1.96s/it, loss=0.072, v_num=0, train/loss_simple_step=0.00987, train/loss_vlb_step=4.64e-5, train/loss_step=0.00987, global_step=1228.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   7%|▋         | 84/1208 [02:45<36:58,  1.97s/it, loss=0.072, v_num=0, train/loss_simple_step=0.00987, train/loss_vlb_step=4.64e-5, train/loss_step=0.00987, global_step=1228.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   7%|▋         | 84/1208 [02:45<36:58,  1.97s/it, loss=0.0716, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000363, train/loss_step=0.109, global_step=1228.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:   7%|▋         | 85/1208 [02:46<36:44,  1.96s/it, loss=0.0716, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000363, train/loss_step=0.109, global_step=1228.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   7%|▋         | 85/1208 [02:46<36:44,  1.96s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.495, train/loss_vlb_step=0.00515, train/loss_step=0.495, global_step=1229.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:   7%|▋         | 86/1208 [02:47<36:30,  1.95s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.495, train/loss_vlb_step=0.00515, train/loss_step=0.495, global_step=1229.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   7%|▋         | 86/1208 [02:47<36:30,  1.95s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000811, train/loss_step=0.217, global_step=1229.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   7%|▋         | 87/1208 [02:48<36:16,  1.94s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000811, train/loss_step=0.217, global_step=1229.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   7%|▋         | 87/1208 [02:48<36:16,  1.94s/it, loss=0.103, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000426, train/loss_step=0.128, global_step=1229.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:   7%|▋         | 88/1208 [02:52<36:31,  1.96s/it, loss=0.103, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000426, train/loss_step=0.128, global_step=1229.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   7%|▋         | 88/1208 [02:52<36:31,  1.96s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=1229.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   7%|▋         | 89/1208 [02:53<36:17,  1.95s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=1229.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   7%|▋         | 89/1208 [02:53<36:17,  1.95s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000103, train/loss_step=0.0269, global_step=1230.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   7%|▋         | 90/1208 [02:54<36:04,  1.94s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000103, train/loss_step=0.0269, global_step=1230.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   7%|▋         | 90/1208 [02:54<36:04,  1.94s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.26e-5, train/loss_step=0.00208, global_step=1230.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   8%|▊         | 91/1208 [02:55<35:51,  1.93s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.26e-5, train/loss_step=0.00208, global_step=1230.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   8%|▊         | 91/1208 [02:55<35:52,  1.93s/it, loss=0.107, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00214, train/loss_step=0.344, global_step=1230.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]     Epoch 4:   8%|▊         | 92/1208 [02:58<36:06,  1.94s/it, loss=0.107, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00214, train/loss_step=0.344, global_step=1230.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   8%|▊         | 92/1208 [02:58<36:06,  1.94s/it, loss=0.102, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000602, train/loss_step=0.170, global_step=1230.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   8%|▊         | 93/1208 [02:59<35:53,  1.93s/it, loss=0.102, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000602, train/loss_step=0.170, global_step=1230.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   8%|▊         | 93/1208 [02:59<35:53,  1.93s/it, loss=0.107, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000694, train/loss_step=0.182, global_step=1231.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   8%|▊         | 94/1208 [03:00<35:41,  1.92s/it, loss=0.107, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000694, train/loss_step=0.182, global_step=1231.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   8%|▊         | 94/1208 [03:00<35:41,  1.92s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000186, train/loss_step=0.0525, global_step=1231.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   8%|▊         | 95/1208 [03:01<35:29,  1.91s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000186, train/loss_step=0.0525, global_step=1231.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   8%|▊         | 95/1208 [03:01<35:29,  1.91s/it, loss=0.12, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00116, train/loss_step=0.256, global_step=1231.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:   8%|▊         | 96/1208 [03:04<35:42,  1.93s/it, loss=0.12, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00116, train/loss_step=0.256, global_step=1231.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   8%|▊         | 96/1208 [03:04<35:42,  1.93s/it, loss=0.134, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00246, train/loss_step=0.388, global_step=1231.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   8%|▊         | 97/1208 [03:06<35:31,  1.92s/it, loss=0.134, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00246, train/loss_step=0.388, global_step=1231.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   8%|▊         | 97/1208 [03:06<35:31,  1.92s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.000112, train/loss_step=0.0285, global_step=1232.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   8%|▊         | 98/1208 [03:07<35:19,  1.91s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.000112, train/loss_step=0.0285, global_step=1232.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   8%|▊         | 98/1208 [03:07<35:19,  1.91s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000108, train/loss_step=0.0254, global_step=1232.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   8%|▊         | 99/1208 [03:08<35:07,  1.90s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000108, train/loss_step=0.0254, global_step=1232.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   8%|▊         | 99/1208 [03:08<35:07,  1.90s/it, loss=0.141, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000634, train/loss_step=0.178, global_step=1232.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:   8%|▊         | 100/1208 [03:11<35:21,  1.91s/it, loss=0.141, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000634, train/loss_step=0.178, global_step=1232.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   8%|▊         | 100/1208 [03:11<35:21,  1.91s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.4e-5, train/loss_step=0.0141, global_step=1232.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   8%|▊         | 101/1208 [03:12<35:10,  1.91s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.4e-5, train/loss_step=0.0141, global_step=1232.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   8%|▊         | 101/1208 [03:12<35:10,  1.91s/it, loss=0.15, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00103, train/loss_step=0.248, global_step=1233.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:   8%|▊         | 102/1208 [03:13<34:59,  1.90s/it, loss=0.15, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00103, train/loss_step=0.248, global_step=1233.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   8%|▊         | 102/1208 [03:13<34:59,  1.90s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0383, train/loss_vlb_step=0.000142, train/loss_step=0.0383, global_step=1233.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   9%|▊         | 103/1208 [03:14<34:47,  1.89s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0383, train/loss_vlb_step=0.000142, train/loss_step=0.0383, global_step=1233.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   9%|▊         | 103/1208 [03:14<34:47,  1.89s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0856, train/loss_vlb_step=0.000285, train/loss_step=0.0856, global_step=1233.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   9%|▊         | 104/1208 [03:17<35:00,  1.90s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0856, train/loss_vlb_step=0.000285, train/loss_step=0.0856, global_step=1233.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   9%|▊         | 104/1208 [03:17<35:00,  1.90s/it, loss=0.156, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000431, train/loss_step=0.130, global_step=1233.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:   9%|▊         | 105/1208 [03:18<34:49,  1.89s/it, loss=0.156, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000431, train/loss_step=0.130, global_step=1233.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   9%|▊         | 105/1208 [03:18<34:49,  1.89s/it, loss=0.143, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000963, train/loss_step=0.231, global_step=1234.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   9%|▉         | 106/1208 [03:19<34:38,  1.89s/it, loss=0.143, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000963, train/loss_step=0.231, global_step=1234.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   9%|▉         | 106/1208 [03:19<34:38,  1.89s/it, loss=0.159, v_num=0, train/loss_simple_step=0.543, train/loss_vlb_step=0.00844, train/loss_step=0.543, global_step=1234.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:   9%|▉         | 107/1208 [03:20<34:28,  1.88s/it, loss=0.159, v_num=0, train/loss_simple_step=0.543, train/loss_vlb_step=0.00844, train/loss_step=0.543, global_step=1234.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   9%|▉         | 107/1208 [03:20<34:28,  1.88s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0962, train/loss_vlb_step=0.00032, train/loss_step=0.0962, global_step=1234.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   9%|▉         | 108/1208 [03:24<34:40,  1.89s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0962, train/loss_vlb_step=0.00032, train/loss_step=0.0962, global_step=1234.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   9%|▉         | 108/1208 [03:24<34:40,  1.89s/it, loss=0.162, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000791, train/loss_step=0.206, global_step=1234.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:   9%|▉         | 109/1208 [03:25<34:29,  1.88s/it, loss=0.162, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000791, train/loss_step=0.206, global_step=1234.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   9%|▉         | 109/1208 [03:25<34:29,  1.88s/it, loss=0.167, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000397, train/loss_step=0.121, global_step=1235.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   9%|▉         | 110/1208 [03:26<34:19,  1.88s/it, loss=0.167, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000397, train/loss_step=0.121, global_step=1235.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   9%|▉         | 110/1208 [03:26<34:19,  1.88s/it, loss=0.182, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00135, train/loss_step=0.294, global_step=1235.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:   9%|▉         | 111/1208 [03:27<34:09,  1.87s/it, loss=0.182, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00135, train/loss_step=0.294, global_step=1235.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   9%|▉         | 111/1208 [03:27<34:09,  1.87s/it, loss=0.17, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=1235.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   9%|▉         | 112/1208 [03:30<34:20,  1.88s/it, loss=0.17, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=1235.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   9%|▉         | 112/1208 [03:30<34:20,  1.88s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.67e-5, train/loss_step=0.00292, global_step=1235.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   9%|▉         | 113/1208 [03:31<34:10,  1.87s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.67e-5, train/loss_step=0.00292, global_step=1235.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   9%|▉         | 113/1208 [03:31<34:10,  1.87s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=3.51e-5, train/loss_step=0.0072, global_step=1236.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:   9%|▉         | 114/1208 [03:32<34:00,  1.87s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=3.51e-5, train/loss_step=0.0072, global_step=1236.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:   9%|▉         | 114/1208 [03:32<34:00,  1.87s/it, loss=0.179, v_num=0, train/loss_simple_step=0.568, train/loss_vlb_step=0.0111, train/loss_step=0.568, global_step=1236.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  10%|▉         | 115/1208 [03:33<33:51,  1.86s/it, loss=0.179, v_num=0, train/loss_simple_step=0.568, train/loss_vlb_step=0.0111, train/loss_step=0.568, global_step=1236.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  10%|▉         | 115/1208 [03:33<33:51,  1.86s/it, loss=0.183, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00188, train/loss_step=0.332, global_step=1236.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  10%|▉         | 116/1208 [03:37<34:03,  1.87s/it, loss=0.183, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00188, train/loss_step=0.332, global_step=1236.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  10%|▉         | 116/1208 [03:37<34:03,  1.87s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00396, train/loss_vlb_step=2.13e-5, train/loss_step=0.00396, global_step=1236.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  10%|▉         | 117/1208 [03:38<33:53,  1.86s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00396, train/loss_vlb_step=2.13e-5, train/loss_step=0.00396, global_step=1236.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  10%|▉         | 117/1208 [03:38<33:53,  1.86s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.000178, train/loss_step=0.0521, global_step=1237.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  10%|▉         | 118/1208 [03:39<33:44,  1.86s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.000178, train/loss_step=0.0521, global_step=1237.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  10%|▉         | 118/1208 [03:39<33:44,  1.86s/it, loss=0.176, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.0011, train/loss_step=0.257, global_step=1237.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  10%|▉         | 119/1208 [03:40<33:35,  1.85s/it, loss=0.176, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.0011, train/loss_step=0.257, global_step=1237.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  10%|▉         | 119/1208 [03:40<33:35,  1.85s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0424, train/loss_vlb_step=0.000157, train/loss_step=0.0424, global_step=1237.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  10%|▉         | 120/1208 [03:43<33:45,  1.86s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0424, train/loss_vlb_step=0.000157, train/loss_step=0.0424, global_step=1237.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  10%|▉         | 120/1208 [03:43<33:45,  1.86s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0577, train/loss_vlb_step=0.000204, train/loss_step=0.0577, global_step=1237.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  10%|█         | 121/1208 [03:44<33:36,  1.86s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0577, train/loss_vlb_step=0.000204, train/loss_step=0.0577, global_step=1237.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  10%|█         | 121/1208 [03:44<33:36,  1.86s/it, loss=0.172, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00112, train/loss_step=0.251, global_step=1238.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  10%|█         | 122/1208 [03:45<33:27,  1.85s/it, loss=0.172, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00112, train/loss_step=0.251, global_step=1238.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  10%|█         | 122/1208 [03:45<33:27,  1.85s/it, loss=0.17, v_num=0, train/loss_simple_step=0.006, train/loss_vlb_step=2.99e-5, train/loss_step=0.006, global_step=1238.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  10%|█         | 123/1208 [03:46<33:18,  1.84s/it, loss=0.17, v_num=0, train/loss_simple_step=0.006, train/loss_vlb_step=2.99e-5, train/loss_step=0.006, global_step=1238.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  10%|█         | 123/1208 [03:46<33:18,  1.84s/it, loss=0.186, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00307, train/loss_step=0.402, global_step=1238.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  10%|█         | 124/1208 [03:49<33:29,  1.85s/it, loss=0.186, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00307, train/loss_step=0.402, global_step=1238.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  10%|█         | 124/1208 [03:49<33:29,  1.85s/it, loss=0.188, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.00058, train/loss_step=0.171, global_step=1238.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  10%|█         | 125/1208 [03:50<33:20,  1.85s/it, loss=0.188, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.00058, train/loss_step=0.171, global_step=1238.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  10%|█         | 125/1208 [03:50<33:20,  1.85s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.62e-5, train/loss_step=0.00286, global_step=1239.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  10%|█         | 126/1208 [03:51<33:11,  1.84s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.62e-5, train/loss_step=0.00286, global_step=1239.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  10%|█         | 126/1208 [03:51<33:11,  1.84s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00583, train/loss_vlb_step=3.17e-5, train/loss_step=0.00583, global_step=1239.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  11%|█         | 127/1208 [03:53<33:03,  1.83s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00583, train/loss_vlb_step=3.17e-5, train/loss_step=0.00583, global_step=1239.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  11%|█         | 127/1208 [03:53<33:03,  1.83s/it, loss=0.16, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00166, train/loss_step=0.299, global_step=1239.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  11%|█         | 128/1208 [03:56<33:12,  1.85s/it, loss=0.16, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00166, train/loss_step=0.299, global_step=1239.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  11%|█         | 128/1208 [03:56<33:12,  1.85s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000109, train/loss_step=0.0304, global_step=1239.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  11%|█         | 129/1208 [03:57<33:04,  1.84s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000109, train/loss_step=0.0304, global_step=1239.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  11%|█         | 129/1208 [03:57<33:04,  1.84s/it, loss=0.152, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000486, train/loss_step=0.146, global_step=1240.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  11%|█         | 130/1208 [03:58<32:55,  1.83s/it, loss=0.152, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000486, train/loss_step=0.146, global_step=1240.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  11%|█         | 130/1208 [03:58<32:55,  1.83s/it, loss=0.143, v_num=0, train/loss_simple_step=0.096, train/loss_vlb_step=0.000315, train/loss_step=0.096, global_step=1240.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  11%|█         | 131/1208 [03:59<32:47,  1.83s/it, loss=0.143, v_num=0, train/loss_simple_step=0.096, train/loss_vlb_step=0.000315, train/loss_step=0.096, global_step=1240.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  11%|█         | 131/1208 [03:59<32:47,  1.83s/it, loss=0.142, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=1240.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  11%|█         | 132/1208 [04:02<32:57,  1.84s/it, loss=0.142, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=1240.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  11%|█         | 132/1208 [04:02<32:57,  1.84s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.000173, train/loss_step=0.0482, global_step=1240.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  11%|█         | 133/1208 [04:03<32:49,  1.83s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.000173, train/loss_step=0.0482, global_step=1240.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  11%|█         | 133/1208 [04:03<32:49,  1.83s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00965, train/loss_vlb_step=4.58e-5, train/loss_step=0.00965, global_step=1241.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  11%|█         | 134/1208 [04:04<32:41,  1.83s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00965, train/loss_vlb_step=4.58e-5, train/loss_step=0.00965, global_step=1241.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  11%|█         | 134/1208 [04:04<32:41,  1.83s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00508, train/loss_vlb_step=2.64e-5, train/loss_step=0.00508, global_step=1241.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  11%|█         | 135/1208 [04:05<32:33,  1.82s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00508, train/loss_vlb_step=2.64e-5, train/loss_step=0.00508, global_step=1241.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  11%|█         | 135/1208 [04:05<32:33,  1.82s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.14e-5, train/loss_step=0.0163, global_step=1241.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  11%|█▏        | 136/1208 [04:08<32:42,  1.83s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.14e-5, train/loss_step=0.0163, global_step=1241.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  11%|█▏        | 136/1208 [04:08<32:42,  1.83s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0809, train/loss_vlb_step=0.000268, train/loss_step=0.0809, global_step=1241.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  11%|█▏        | 137/1208 [04:09<32:34,  1.82s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0809, train/loss_vlb_step=0.000268, train/loss_step=0.0809, global_step=1241.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  11%|█▏        | 137/1208 [04:09<32:34,  1.82s/it, loss=0.116, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00135, train/loss_step=0.283, global_step=1242.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  11%|█▏        | 138/1208 [04:11<32:26,  1.82s/it, loss=0.116, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00135, train/loss_step=0.283, global_step=1242.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  11%|█▏        | 138/1208 [04:11<32:26,  1.82s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00508, train/loss_vlb_step=2.84e-5, train/loss_step=0.00508, global_step=1242.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  12%|█▏        | 139/1208 [04:12<32:18,  1.81s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00508, train/loss_vlb_step=2.84e-5, train/loss_step=0.00508, global_step=1242.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  12%|█▏        | 139/1208 [04:12<32:18,  1.81s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0371, train/loss_vlb_step=0.000142, train/loss_step=0.0371, global_step=1242.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  12%|█▏        | 140/1208 [04:15<32:27,  1.82s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0371, train/loss_vlb_step=0.000142, train/loss_step=0.0371, global_step=1242.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  12%|█▏        | 140/1208 [04:15<32:27,  1.82s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.38e-5, train/loss_step=0.00236, global_step=1242.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  12%|█▏        | 141/1208 [04:16<32:20,  1.82s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.38e-5, train/loss_step=0.00236, global_step=1242.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  12%|█▏        | 141/1208 [04:16<32:20,  1.82s/it, loss=0.113, v_num=0, train/loss_simple_step=0.510, train/loss_vlb_step=0.00934, train/loss_step=0.510, global_step=1243.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  12%|█▏        | 142/1208 [04:17<32:12,  1.81s/it, loss=0.113, v_num=0, train/loss_simple_step=0.510, train/loss_vlb_step=0.00934, train/loss_step=0.510, global_step=1243.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  12%|█▏        | 142/1208 [04:17<32:12,  1.81s/it, loss=0.121, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000532, train/loss_step=0.160, global_step=1243.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  12%|█▏        | 143/1208 [04:18<32:05,  1.81s/it, loss=0.121, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000532, train/loss_step=0.160, global_step=1243.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  12%|█▏        | 143/1208 [04:18<32:05,  1.81s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0737, train/loss_vlb_step=0.000251, train/loss_step=0.0737, global_step=1243.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  12%|█▏        | 144/1208 [04:21<32:13,  1.82s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0737, train/loss_vlb_step=0.000251, train/loss_step=0.0737, global_step=1243.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  12%|█▏        | 144/1208 [04:21<32:13,  1.82s/it, loss=0.11, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00143, train/loss_step=0.289, global_step=1243.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  12%|█▏        | 145/1208 [04:22<32:06,  1.81s/it, loss=0.11, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00143, train/loss_step=0.289, global_step=1243.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  12%|█▏        | 145/1208 [04:22<32:06,  1.81s/it, loss=0.121, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000877, train/loss_step=0.223, global_step=1244.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  12%|█▏        | 146/1208 [04:23<31:58,  1.81s/it, loss=0.121, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000877, train/loss_step=0.223, global_step=1244.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  12%|█▏        | 146/1208 [04:23<31:58,  1.81s/it, loss=0.127, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000387, train/loss_step=0.117, global_step=1244.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  12%|█▏        | 147/1208 [04:24<31:51,  1.80s/it, loss=0.127, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000387, train/loss_step=0.117, global_step=1244.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  12%|█▏        | 147/1208 [04:24<31:51,  1.80s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.00018, train/loss_step=0.0537, global_step=1244.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  12%|█▏        | 148/1208 [04:28<31:59,  1.81s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.00018, train/loss_step=0.0537, global_step=1244.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  12%|█▏        | 148/1208 [04:28<31:59,  1.81s/it, loss=0.125, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.00096, train/loss_step=0.226, global_step=1244.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  12%|█▏        | 149/1208 [04:29<31:52,  1.81s/it, loss=0.125, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.00096, train/loss_step=0.226, global_step=1244.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  12%|█▏        | 149/1208 [04:29<31:52,  1.81s/it, loss=0.124, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000434, train/loss_step=0.131, global_step=1245.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  12%|█▏        | 150/1208 [04:30<31:45,  1.80s/it, loss=0.124, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000434, train/loss_step=0.131, global_step=1245.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  12%|█▏        | 150/1208 [04:30<31:45,  1.80s/it, loss=0.127, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000528, train/loss_step=0.156, global_step=1245.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  12%|█▎        | 151/1208 [04:31<31:38,  1.80s/it, loss=0.127, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000528, train/loss_step=0.156, global_step=1245.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  12%|█▎        | 151/1208 [04:31<31:38,  1.80s/it, loss=0.132, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000845, train/loss_step=0.219, global_step=1245.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  13%|█▎        | 152/1208 [04:34<31:46,  1.81s/it, loss=0.132, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000845, train/loss_step=0.219, global_step=1245.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  13%|█▎        | 152/1208 [04:34<31:46,  1.81s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0804, train/loss_vlb_step=0.000267, train/loss_step=0.0804, global_step=1245.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  13%|█▎        | 153/1208 [04:35<31:39,  1.80s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0804, train/loss_vlb_step=0.000267, train/loss_step=0.0804, global_step=1245.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  13%|█▎        | 153/1208 [04:35<31:39,  1.80s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0712, train/loss_vlb_step=0.000236, train/loss_step=0.0712, global_step=1246.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  13%|█▎        | 154/1208 [04:36<31:32,  1.80s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0712, train/loss_vlb_step=0.000236, train/loss_step=0.0712, global_step=1246.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  13%|█▎        | 154/1208 [04:36<31:32,  1.80s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0855, train/loss_vlb_step=0.000283, train/loss_step=0.0855, global_step=1246.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  13%|█▎        | 155/1208 [04:37<31:25,  1.79s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0855, train/loss_vlb_step=0.000283, train/loss_step=0.0855, global_step=1246.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  13%|█▎        | 155/1208 [04:37<31:25,  1.79s/it, loss=0.158, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00237, train/loss_step=0.355, global_step=1246.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  13%|█▎        | 156/1208 [04:40<31:33,  1.80s/it, loss=0.158, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00237, train/loss_step=0.355, global_step=1246.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  13%|█▎        | 156/1208 [04:40<31:33,  1.80s/it, loss=0.168, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00129, train/loss_step=0.291, global_step=1246.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  13%|█▎        | 157/1208 [04:41<31:27,  1.80s/it, loss=0.168, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00129, train/loss_step=0.291, global_step=1246.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  13%|█▎        | 157/1208 [04:41<31:27,  1.80s/it, loss=0.162, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000532, train/loss_step=0.158, global_step=1247.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  13%|█▎        | 158/1208 [04:42<31:20,  1.79s/it, loss=0.162, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000532, train/loss_step=0.158, global_step=1247.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  13%|█▎        | 158/1208 [04:42<31:20,  1.79s/it, loss=0.174, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00102, train/loss_step=0.237, global_step=1247.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  13%|█▎        | 159/1208 [04:43<31:13,  1.79s/it, loss=0.174, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00102, train/loss_step=0.237, global_step=1247.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  13%|█▎        | 159/1208 [04:43<31:13,  1.79s/it, loss=0.18, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000524, train/loss_step=0.153, global_step=1247.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  13%|█▎        | 160/1208 [04:47<31:21,  1.80s/it, loss=0.18, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000524, train/loss_step=0.153, global_step=1247.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  13%|█▎        | 160/1208 [04:47<31:21,  1.80s/it, loss=0.184, v_num=0, train/loss_simple_step=0.081, train/loss_vlb_step=0.000267, train/loss_step=0.081, global_step=1247.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  13%|█▎        | 161/1208 [04:48<31:15,  1.79s/it, loss=0.184, v_num=0, train/loss_simple_step=0.081, train/loss_vlb_step=0.000267, train/loss_step=0.081, global_step=1247.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  13%|█▎        | 161/1208 [04:48<31:15,  1.79s/it, loss=0.172, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.0013, train/loss_step=0.286, global_step=1248.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  13%|█▎        | 162/1208 [04:49<31:08,  1.79s/it, loss=0.172, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.0013, train/loss_step=0.286, global_step=1248.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  13%|█▎        | 162/1208 [04:49<31:08,  1.79s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00656, train/loss_vlb_step=3.3e-5, train/loss_step=0.00656, global_step=1248.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  13%|█▎        | 163/1208 [04:50<31:01,  1.78s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00656, train/loss_vlb_step=3.3e-5, train/loss_step=0.00656, global_step=1248.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  13%|█▎        | 163/1208 [04:50<31:01,  1.78s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=1.72e-5, train/loss_step=0.00308, global_step=1248.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  14%|█▎        | 164/1208 [04:53<31:09,  1.79s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=1.72e-5, train/loss_step=0.00308, global_step=1248.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  14%|█▎        | 164/1208 [04:53<31:09,  1.79s/it, loss=0.154, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000471, train/loss_step=0.143, global_step=1248.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  14%|█▎        | 165/1208 [04:54<31:03,  1.79s/it, loss=0.154, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000471, train/loss_step=0.143, global_step=1248.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  14%|█▎        | 165/1208 [04:54<31:03,  1.79s/it, loss=0.168, v_num=0, train/loss_simple_step=0.513, train/loss_vlb_step=0.00412, train/loss_step=0.513, global_step=1249.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  14%|█▎        | 166/1208 [04:55<30:56,  1.78s/it, loss=0.168, v_num=0, train/loss_simple_step=0.513, train/loss_vlb_step=0.00412, train/loss_step=0.513, global_step=1249.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  14%|█▎        | 166/1208 [04:55<30:56,  1.78s/it, loss=0.193, v_num=0, train/loss_simple_step=0.604, train/loss_vlb_step=0.0118, train/loss_step=0.604, global_step=1249.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  14%|█▍        | 167/1208 [04:56<30:50,  1.78s/it, loss=0.193, v_num=0, train/loss_simple_step=0.604, train/loss_vlb_step=0.0118, train/loss_step=0.604, global_step=1249.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  14%|█▍        | 167/1208 [04:56<30:50,  1.78s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.59e-5, train/loss_step=0.0153, global_step=1249.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  14%|█▍        | 168/1208 [05:00<30:57,  1.79s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.59e-5, train/loss_step=0.0153, global_step=1249.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  14%|█▍        | 168/1208 [05:00<30:57,  1.79s/it, loss=0.19, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000859, train/loss_step=0.214, global_step=1249.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  14%|█▍        | 169/1208 [05:01<30:51,  1.78s/it, loss=0.19, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000859, train/loss_step=0.214, global_step=1249.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  14%|█▍        | 169/1208 [05:01<30:51,  1.78s/it, loss=0.189, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=1250.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  14%|█▍        | 170/1208 [05:02<30:44,  1.78s/it, loss=0.189, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=1250.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  14%|█▍        | 170/1208 [05:02<30:44,  1.78s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0964, train/loss_vlb_step=0.000318, train/loss_step=0.0964, global_step=1250.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  14%|█▍        | 171/1208 [05:03<30:38,  1.77s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0964, train/loss_vlb_step=0.000318, train/loss_step=0.0964, global_step=1250.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  14%|█▍        | 171/1208 [05:03<30:38,  1.77s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0652, train/loss_vlb_step=0.000228, train/loss_step=0.0652, global_step=1250.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  14%|█▍        | 172/1208 [05:06<30:45,  1.78s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0652, train/loss_vlb_step=0.000228, train/loss_step=0.0652, global_step=1250.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  14%|█▍        | 172/1208 [05:06<30:45,  1.78s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0791, train/loss_vlb_step=0.000267, train/loss_step=0.0791, global_step=1250.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  14%|█▍        | 173/1208 [05:07<30:39,  1.78s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0791, train/loss_vlb_step=0.000267, train/loss_step=0.0791, global_step=1250.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  14%|█▍        | 173/1208 [05:07<30:39,  1.78s/it, loss=0.183, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000606, train/loss_step=0.160, global_step=1251.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  14%|█▍        | 174/1208 [05:08<30:33,  1.77s/it, loss=0.183, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000606, train/loss_step=0.160, global_step=1251.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  14%|█▍        | 174/1208 [05:08<30:33,  1.77s/it, loss=0.184, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=1251.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  14%|█▍        | 175/1208 [05:09<30:27,  1.77s/it, loss=0.184, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=1251.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  14%|█▍        | 175/1208 [05:09<30:27,  1.77s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0931, train/loss_vlb_step=0.000311, train/loss_step=0.0931, global_step=1251.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  15%|█▍        | 176/1208 [05:12<30:33,  1.78s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0931, train/loss_vlb_step=0.000311, train/loss_step=0.0931, global_step=1251.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  15%|█▍        | 176/1208 [05:12<30:33,  1.78s/it, loss=0.168, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.00103, train/loss_step=0.242, global_step=1251.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  15%|█▍        | 177/1208 [05:13<30:28,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.00103, train/loss_step=0.242, global_step=1251.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  15%|█▍        | 177/1208 [05:13<30:28,  1.77s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00566, train/loss_vlb_step=2.9e-5, train/loss_step=0.00566, global_step=1252.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  15%|█▍        | 178/1208 [05:14<30:21,  1.77s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00566, train/loss_vlb_step=2.9e-5, train/loss_step=0.00566, global_step=1252.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  15%|█▍        | 178/1208 [05:14<30:21,  1.77s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00293, train/loss_vlb_step=1.66e-5, train/loss_step=0.00293, global_step=1252.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  15%|█▍        | 179/1208 [05:15<30:15,  1.76s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00293, train/loss_vlb_step=1.66e-5, train/loss_step=0.00293, global_step=1252.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  15%|█▍        | 179/1208 [05:15<30:15,  1.76s/it, loss=0.154, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.000986, train/loss_step=0.247, global_step=1252.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  15%|█▍        | 180/1208 [05:19<30:22,  1.77s/it, loss=0.154, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.000986, train/loss_step=0.247, global_step=1252.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  15%|█▍        | 180/1208 [05:19<30:22,  1.77s/it, loss=0.156, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000426, train/loss_step=0.130, global_step=1252.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  15%|█▍        | 181/1208 [05:20<30:16,  1.77s/it, loss=0.156, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000426, train/loss_step=0.130, global_step=1252.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  15%|█▍        | 181/1208 [05:20<30:16,  1.77s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000149, train/loss_step=0.0412, global_step=1253.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  15%|█▌        | 182/1208 [05:21<30:10,  1.77s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000149, train/loss_step=0.0412, global_step=1253.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  15%|█▌        | 182/1208 [05:21<30:10,  1.77s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.63e-5, train/loss_step=0.0174, global_step=1253.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  15%|█▌        | 183/1208 [05:22<30:05,  1.76s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.63e-5, train/loss_step=0.0174, global_step=1253.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  15%|█▌        | 183/1208 [05:22<30:05,  1.76s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00605, train/loss_vlb_step=2.93e-5, train/loss_step=0.00605, global_step=1253.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  15%|█▌        | 184/1208 [05:25<30:11,  1.77s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00605, train/loss_vlb_step=2.93e-5, train/loss_step=0.00605, global_step=1253.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  15%|█▌        | 184/1208 [05:25<30:11,  1.77s/it, loss=0.155, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00176, train/loss_step=0.342, global_step=1253.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  15%|█▌        | 185/1208 [05:26<30:05,  1.76s/it, loss=0.155, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00176, train/loss_step=0.342, global_step=1253.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  15%|█▌        | 185/1208 [05:26<30:05,  1.76s/it, loss=0.141, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000921, train/loss_step=0.240, global_step=1254.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  15%|█▌        | 186/1208 [05:27<29:59,  1.76s/it, loss=0.141, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000921, train/loss_step=0.240, global_step=1254.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  15%|█▌        | 186/1208 [05:27<29:59,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000525, train/loss_step=0.156, global_step=1254.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  15%|█▌        | 187/1208 [05:28<29:54,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000525, train/loss_step=0.156, global_step=1254.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  15%|█▌        | 187/1208 [05:28<29:54,  1.76s/it, loss=0.13, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00115, train/loss_step=0.237, global_step=1254.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  16%|█▌        | 188/1208 [05:31<30:00,  1.77s/it, loss=0.13, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00115, train/loss_step=0.237, global_step=1254.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  16%|█▌        | 188/1208 [05:31<30:00,  1.77s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.14e-5, train/loss_step=0.00186, global_step=1254.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  16%|█▌        | 189/1208 [05:32<29:54,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.14e-5, train/loss_step=0.00186, global_step=1254.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  16%|█▌        | 189/1208 [05:32<29:54,  1.76s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00942, train/loss_vlb_step=4.66e-5, train/loss_step=0.00942, global_step=1255.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  16%|█▌        | 190/1208 [05:33<29:49,  1.76s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00942, train/loss_vlb_step=4.66e-5, train/loss_step=0.00942, global_step=1255.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  16%|█▌        | 190/1208 [05:33<29:49,  1.76s/it, loss=0.116, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000439, train/loss_step=0.133, global_step=1255.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  16%|█▌        | 191/1208 [05:34<29:43,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000439, train/loss_step=0.133, global_step=1255.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  16%|█▌        | 191/1208 [05:34<29:43,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000176, train/loss_step=0.050, global_step=1255.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  16%|█▌        | 192/1208 [05:38<29:49,  1.76s/it, loss=0.115, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000176, train/loss_step=0.050, global_step=1255.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  16%|█▌        | 192/1208 [05:38<29:49,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.000105, train/loss_step=0.027, global_step=1255.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  16%|█▌        | 193/1208 [05:39<29:44,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.000105, train/loss_step=0.027, global_step=1255.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  16%|█▌        | 193/1208 [05:39<29:44,  1.76s/it, loss=0.121, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00209, train/loss_step=0.332, global_step=1256.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  16%|█▌        | 194/1208 [05:40<29:38,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00209, train/loss_step=0.332, global_step=1256.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  16%|█▌        | 194/1208 [05:40<29:38,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.00038, train/loss_step=0.116, global_step=1256.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  16%|█▌        | 195/1208 [05:41<29:33,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.00038, train/loss_step=0.116, global_step=1256.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  16%|█▌        | 195/1208 [05:41<29:33,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00631, train/loss_vlb_step=3.18e-5, train/loss_step=0.00631, global_step=1256.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  16%|█▌        | 196/1208 [05:44<29:39,  1.76s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00631, train/loss_vlb_step=3.18e-5, train/loss_step=0.00631, global_step=1256.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  16%|█▌        | 196/1208 [05:44<29:39,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00195, train/loss_step=0.425, global_step=1256.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  16%|█▋        | 197/1208 [05:45<29:34,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00195, train/loss_step=0.425, global_step=1256.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  16%|█▋        | 197/1208 [05:45<29:34,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000131, train/loss_step=0.0344, global_step=1257.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  16%|█▋        | 198/1208 [05:46<29:28,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000131, train/loss_step=0.0344, global_step=1257.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  16%|█▋        | 198/1208 [05:46<29:28,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.000109, train/loss_step=0.0275, global_step=1257.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  16%|█▋        | 199/1208 [05:47<29:23,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.000109, train/loss_step=0.0275, global_step=1257.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  16%|█▋        | 199/1208 [05:47<29:23,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000132, train/loss_step=0.0346, global_step=1257.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  17%|█▋        | 200/1208 [05:50<29:28,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000132, train/loss_step=0.0346, global_step=1257.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  17%|█▋        | 200/1208 [05:50<29:29,  1.75s/it, loss=0.146, v_num=0, train/loss_simple_step=0.683, train/loss_vlb_step=0.0439, train/loss_step=0.683, global_step=1257.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  17%|█▋        | 201/1208 [05:52<29:23,  1.75s/it, loss=0.146, v_num=0, train/loss_simple_step=0.683, train/loss_vlb_step=0.0439, train/loss_step=0.683, global_step=1257.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  17%|█▋        | 201/1208 [05:52<29:23,  1.75s/it, loss=0.169, v_num=0, train/loss_simple_step=0.498, train/loss_vlb_step=0.00814, train/loss_step=0.498, global_step=1258.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  17%|█▋        | 202/1208 [05:53<29:18,  1.75s/it, loss=0.169, v_num=0, train/loss_simple_step=0.498, train/loss_vlb_step=0.00814, train/loss_step=0.498, global_step=1258.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  17%|█▋        | 202/1208 [05:53<29:18,  1.75s/it, loss=0.189, v_num=0, train/loss_simple_step=0.426, train/loss_vlb_step=0.00505, train/loss_step=0.426, global_step=1258.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  17%|█▋        | 203/1208 [05:54<29:13,  1.74s/it, loss=0.189, v_num=0, train/loss_simple_step=0.426, train/loss_vlb_step=0.00505, train/loss_step=0.426, global_step=1258.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  17%|█▋        | 203/1208 [05:54<29:13,  1.74s/it, loss=0.207, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.0022, train/loss_step=0.351, global_step=1258.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  17%|█▋        | 204/1208 [05:57<29:18,  1.75s/it, loss=0.207, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.0022, train/loss_step=0.351, global_step=1258.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  17%|█▋        | 204/1208 [05:57<29:18,  1.75s/it, loss=0.209, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00366, train/loss_step=0.392, global_step=1258.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  17%|█▋        | 205/1208 [05:58<29:13,  1.75s/it, loss=0.209, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00366, train/loss_step=0.392, global_step=1258.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  17%|█▋        | 205/1208 [05:58<29:13,  1.75s/it, loss=0.222, v_num=0, train/loss_simple_step=0.504, train/loss_vlb_step=0.00953, train/loss_step=0.504, global_step=1259.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  17%|█▋        | 206/1208 [05:59<29:08,  1.74s/it, loss=0.222, v_num=0, train/loss_simple_step=0.504, train/loss_vlb_step=0.00953, train/loss_step=0.504, global_step=1259.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  17%|█▋        | 206/1208 [05:59<29:08,  1.74s/it, loss=0.225, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.00091, train/loss_step=0.208, global_step=1259.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  17%|█▋        | 207/1208 [06:00<29:03,  1.74s/it, loss=0.225, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.00091, train/loss_step=0.208, global_step=1259.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  17%|█▋        | 207/1208 [06:00<29:03,  1.74s/it, loss=0.232, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00267, train/loss_step=0.384, global_step=1259.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  17%|█▋        | 208/1208 [06:03<29:08,  1.75s/it, loss=0.232, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00267, train/loss_step=0.384, global_step=1259.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  17%|█▋        | 208/1208 [06:03<29:08,  1.75s/it, loss=0.233, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.93e-5, train/loss_step=0.019, global_step=1259.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  17%|█▋        | 209/1208 [06:04<29:03,  1.75s/it, loss=0.233, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.93e-5, train/loss_step=0.019, global_step=1259.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  17%|█▋        | 209/1208 [06:04<29:03,  1.75s/it, loss=0.251, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00274, train/loss_step=0.369, global_step=1260.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  17%|█▋        | 210/1208 [06:05<28:58,  1.74s/it, loss=0.251, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00274, train/loss_step=0.369, global_step=1260.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  17%|█▋        | 210/1208 [06:05<28:58,  1.74s/it, loss=0.247, v_num=0, train/loss_simple_step=0.0455, train/loss_vlb_step=0.000163, train/loss_step=0.0455, global_step=1260.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  17%|█▋        | 211/1208 [06:06<28:53,  1.74s/it, loss=0.247, v_num=0, train/loss_simple_step=0.0455, train/loss_vlb_step=0.000163, train/loss_step=0.0455, global_step=1260.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  17%|█▋        | 211/1208 [06:06<28:53,  1.74s/it, loss=0.253, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000615, train/loss_step=0.175, global_step=1260.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  18%|█▊        | 212/1208 [06:10<28:58,  1.75s/it, loss=0.253, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000615, train/loss_step=0.175, global_step=1260.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  18%|█▊        | 212/1208 [06:10<28:58,  1.75s/it, loss=0.271, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.0023, train/loss_step=0.398, global_step=1260.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  18%|█▊        | 213/1208 [06:11<28:53,  1.74s/it, loss=0.271, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.0023, train/loss_step=0.398, global_step=1260.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  18%|█▊        | 213/1208 [06:11<28:53,  1.74s/it, loss=0.255, v_num=0, train/loss_simple_step=0.00839, train/loss_vlb_step=3.89e-5, train/loss_step=0.00839, global_step=1261.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  18%|█▊        | 214/1208 [06:12<28:48,  1.74s/it, loss=0.255, v_num=0, train/loss_simple_step=0.00839, train/loss_vlb_step=3.89e-5, train/loss_step=0.00839, global_step=1261.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  18%|█▊        | 214/1208 [06:12<28:48,  1.74s/it, loss=0.279, v_num=0, train/loss_simple_step=0.599, train/loss_vlb_step=0.00866, train/loss_step=0.599, global_step=1261.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  18%|█▊        | 215/1208 [06:13<28:43,  1.74s/it, loss=0.279, v_num=0, train/loss_simple_step=0.599, train/loss_vlb_step=0.00866, train/loss_step=0.599, global_step=1261.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  18%|█▊        | 215/1208 [06:13<28:43,  1.74s/it, loss=0.282, v_num=0, train/loss_simple_step=0.058, train/loss_vlb_step=0.000199, train/loss_step=0.058, global_step=1261.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  18%|█▊        | 216/1208 [06:16<28:49,  1.74s/it, loss=0.282, v_num=0, train/loss_simple_step=0.058, train/loss_vlb_step=0.000199, train/loss_step=0.058, global_step=1261.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  18%|█▊        | 216/1208 [06:16<28:49,  1.74s/it, loss=0.273, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00102, train/loss_step=0.239, global_step=1261.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  18%|█▊        | 217/1208 [06:17<28:44,  1.74s/it, loss=0.273, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00102, train/loss_step=0.239, global_step=1261.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  18%|█▊        | 217/1208 [06:17<28:44,  1.74s/it, loss=0.271, v_num=0, train/loss_simple_step=0.00648, train/loss_vlb_step=3.24e-5, train/loss_step=0.00648, global_step=1262.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  18%|█▊        | 218/1208 [06:18<28:39,  1.74s/it, loss=0.271, v_num=0, train/loss_simple_step=0.00648, train/loss_vlb_step=3.24e-5, train/loss_step=0.00648, global_step=1262.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  18%|█▊        | 218/1208 [06:18<28:39,  1.74s/it, loss=0.274, v_num=0, train/loss_simple_step=0.0736, train/loss_vlb_step=0.000248, train/loss_step=0.0736, global_step=1262.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  18%|█▊        | 219/1208 [06:19<28:34,  1.73s/it, loss=0.274, v_num=0, train/loss_simple_step=0.0736, train/loss_vlb_step=0.000248, train/loss_step=0.0736, global_step=1262.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  18%|█▊        | 219/1208 [06:19<28:34,  1.73s/it, loss=0.277, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000347, train/loss_step=0.106, global_step=1262.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  18%|█▊        | 220/1208 [06:22<28:39,  1.74s/it, loss=0.277, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000347, train/loss_step=0.106, global_step=1262.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  18%|█▊        | 220/1208 [06:22<28:39,  1.74s/it, loss=0.245, v_num=0, train/loss_simple_step=0.0357, train/loss_vlb_step=0.00014, train/loss_step=0.0357, global_step=1262.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  18%|█▊        | 221/1208 [06:23<28:34,  1.74s/it, loss=0.245, v_num=0, train/loss_simple_step=0.0357, train/loss_vlb_step=0.00014, train/loss_step=0.0357, global_step=1262.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  18%|█▊        | 221/1208 [06:23<28:34,  1.74s/it, loss=0.223, v_num=0, train/loss_simple_step=0.053, train/loss_vlb_step=0.000185, train/loss_step=0.053, global_step=1263.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  18%|█▊        | 222/1208 [06:25<28:30,  1.73s/it, loss=0.223, v_num=0, train/loss_simple_step=0.053, train/loss_vlb_step=0.000185, train/loss_step=0.053, global_step=1263.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  18%|█▊        | 222/1208 [06:25<28:30,  1.73s/it, loss=0.225, v_num=0, train/loss_simple_step=0.482, train/loss_vlb_step=0.00767, train/loss_step=0.482, global_step=1263.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  18%|█▊        | 223/1208 [06:26<28:25,  1.73s/it, loss=0.225, v_num=0, train/loss_simple_step=0.482, train/loss_vlb_step=0.00767, train/loss_step=0.482, global_step=1263.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  18%|█▊        | 223/1208 [06:26<28:25,  1.73s/it, loss=0.225, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00161, train/loss_step=0.345, global_step=1263.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  19%|█▊        | 224/1208 [06:29<28:30,  1.74s/it, loss=0.225, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00161, train/loss_step=0.345, global_step=1263.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  19%|█▊        | 224/1208 [06:29<28:30,  1.74s/it, loss=0.224, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00193, train/loss_step=0.374, global_step=1263.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  19%|█▊        | 225/1208 [06:30<28:25,  1.73s/it, loss=0.224, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00193, train/loss_step=0.374, global_step=1263.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  19%|█▊        | 225/1208 [06:30<28:25,  1.73s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.36e-5, train/loss_step=0.0197, global_step=1264.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  19%|█▊        | 226/1208 [06:31<28:20,  1.73s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.36e-5, train/loss_step=0.0197, global_step=1264.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  19%|█▊        | 226/1208 [06:31<28:20,  1.73s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0315, train/loss_vlb_step=0.000126, train/loss_step=0.0315, global_step=1264.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  19%|█▉        | 227/1208 [06:32<28:15,  1.73s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0315, train/loss_vlb_step=0.000126, train/loss_step=0.0315, global_step=1264.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  19%|█▉        | 227/1208 [06:32<28:15,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00607, train/loss_vlb_step=3.08e-5, train/loss_step=0.00607, global_step=1264.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  19%|█▉        | 228/1208 [06:35<28:20,  1.74s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00607, train/loss_vlb_step=3.08e-5, train/loss_step=0.00607, global_step=1264.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  19%|█▉        | 228/1208 [06:35<28:20,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0595, train/loss_vlb_step=0.000204, train/loss_step=0.0595, global_step=1264.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  19%|█▉        | 229/1208 [06:36<28:16,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0595, train/loss_vlb_step=0.000204, train/loss_step=0.0595, global_step=1264.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  19%|█▉        | 229/1208 [06:36<28:16,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=1265.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  19%|█▉        | 230/1208 [06:37<28:11,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=1265.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  19%|█▉        | 230/1208 [06:37<28:11,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00774, train/loss_vlb_step=3.84e-5, train/loss_step=0.00774, global_step=1265.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  19%|█▉        | 231/1208 [06:38<28:06,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00774, train/loss_vlb_step=3.84e-5, train/loss_step=0.00774, global_step=1265.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  19%|█▉        | 231/1208 [06:38<28:06,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000519, train/loss_step=0.150, global_step=1265.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  19%|█▉        | 232/1208 [06:42<28:11,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000519, train/loss_step=0.150, global_step=1265.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  19%|█▉        | 232/1208 [06:42<28:11,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000599, train/loss_step=0.178, global_step=1265.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  19%|█▉        | 233/1208 [06:43<28:06,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000599, train/loss_step=0.178, global_step=1265.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  19%|█▉        | 233/1208 [06:43<28:06,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=1266.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  19%|█▉        | 234/1208 [06:44<28:02,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=1266.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  19%|█▉        | 234/1208 [06:44<28:02,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00742, train/loss_step=0.442, global_step=1266.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  19%|█▉        | 235/1208 [06:45<27:57,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00742, train/loss_step=0.442, global_step=1266.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  19%|█▉        | 235/1208 [06:45<27:57,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000141, train/loss_step=0.0376, global_step=1266.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  20%|█▉        | 236/1208 [06:48<28:02,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000141, train/loss_step=0.0376, global_step=1266.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  20%|█▉        | 236/1208 [06:48<28:02,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.39e-5, train/loss_step=0.0194, global_step=1266.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  20%|█▉        | 237/1208 [06:49<27:57,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.39e-5, train/loss_step=0.0194, global_step=1266.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  20%|█▉        | 237/1208 [06:49<27:57,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000456, train/loss_step=0.138, global_step=1267.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  20%|█▉        | 238/1208 [06:50<27:53,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000456, train/loss_step=0.138, global_step=1267.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  20%|█▉        | 238/1208 [06:50<27:53,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00127, train/loss_step=0.252, global_step=1267.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  20%|█▉        | 239/1208 [06:51<27:48,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00127, train/loss_step=0.252, global_step=1267.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  20%|█▉        | 239/1208 [06:51<27:48,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0321, train/loss_vlb_step=0.000119, train/loss_step=0.0321, global_step=1267.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  20%|█▉        | 240/1208 [06:54<27:53,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0321, train/loss_vlb_step=0.000119, train/loss_step=0.0321, global_step=1267.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  20%|█▉        | 240/1208 [06:54<27:53,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000487, train/loss_step=0.146, global_step=1267.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  20%|█▉        | 241/1208 [06:55<27:48,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000487, train/loss_step=0.146, global_step=1267.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  20%|█▉        | 241/1208 [06:55<27:48,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0855, train/loss_vlb_step=0.000291, train/loss_step=0.0855, global_step=1268.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  20%|██        | 242/1208 [06:56<27:44,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0855, train/loss_vlb_step=0.000291, train/loss_step=0.0855, global_step=1268.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  20%|██        | 242/1208 [06:56<27:44,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000789, train/loss_step=0.203, global_step=1268.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  20%|██        | 243/1208 [06:57<27:39,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000789, train/loss_step=0.203, global_step=1268.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  20%|██        | 243/1208 [06:57<27:39,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.67e-5, train/loss_step=0.0215, global_step=1268.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  20%|██        | 244/1208 [07:01<27:44,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.67e-5, train/loss_step=0.0215, global_step=1268.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  20%|██        | 244/1208 [07:01<27:44,  1.73s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.92e-5, train/loss_step=0.0133, global_step=1268.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  20%|██        | 245/1208 [07:02<27:39,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.92e-5, train/loss_step=0.0133, global_step=1268.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  20%|██        | 245/1208 [07:02<27:39,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.14e-5, train/loss_step=0.00191, global_step=1269.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  20%|██        | 246/1208 [07:03<27:35,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.14e-5, train/loss_step=0.00191, global_step=1269.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  20%|██        | 246/1208 [07:03<27:35,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000363, train/loss_step=0.110, global_step=1269.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  20%|██        | 247/1208 [07:04<27:30,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000363, train/loss_step=0.110, global_step=1269.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  20%|██        | 247/1208 [07:04<27:30,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000152, train/loss_step=0.0409, global_step=1269.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  21%|██        | 248/1208 [07:07<27:35,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000152, train/loss_step=0.0409, global_step=1269.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  21%|██        | 248/1208 [07:07<27:35,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00186, train/loss_step=0.351, global_step=1269.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  21%|██        | 249/1208 [07:08<27:30,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00186, train/loss_step=0.351, global_step=1269.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  21%|██        | 249/1208 [07:08<27:30,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=1270.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  21%|██        | 250/1208 [07:09<27:26,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=1270.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  21%|██        | 250/1208 [07:09<27:26,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.83e-5, train/loss_step=0.0134, global_step=1270.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  21%|██        | 251/1208 [07:10<27:22,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.83e-5, train/loss_step=0.0134, global_step=1270.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  21%|██        | 251/1208 [07:10<27:22,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00551, train/loss_vlb_step=2.82e-5, train/loss_step=0.00551, global_step=1270.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  21%|██        | 252/1208 [07:13<27:26,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00551, train/loss_vlb_step=2.82e-5, train/loss_step=0.00551, global_step=1270.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  21%|██        | 252/1208 [07:13<27:26,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00761, train/loss_vlb_step=3.72e-5, train/loss_step=0.00761, global_step=1270.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  21%|██        | 253/1208 [07:15<27:22,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00761, train/loss_vlb_step=3.72e-5, train/loss_step=0.00761, global_step=1270.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  21%|██        | 253/1208 [07:15<27:22,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0509, train/loss_vlb_step=0.000179, train/loss_step=0.0509, global_step=1271.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  21%|██        | 254/1208 [07:16<27:17,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0509, train/loss_vlb_step=0.000179, train/loss_step=0.0509, global_step=1271.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  21%|██        | 254/1208 [07:16<27:17,  1.72s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000668, train/loss_step=0.189, global_step=1271.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  21%|██        | 255/1208 [07:17<27:13,  1.71s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000668, train/loss_step=0.189, global_step=1271.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  21%|██        | 255/1208 [07:17<27:13,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00101, train/loss_step=0.258, global_step=1271.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  21%|██        | 256/1208 [07:20<27:17,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00101, train/loss_step=0.258, global_step=1271.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  21%|██        | 256/1208 [07:20<27:17,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=2.24e-5, train/loss_step=0.00407, global_step=1271.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  21%|██▏       | 257/1208 [07:21<27:13,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=2.24e-5, train/loss_step=0.00407, global_step=1271.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  21%|██▏       | 257/1208 [07:21<27:13,  1.72s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.97e-5, train/loss_step=0.0164, global_step=1272.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  21%|██▏       | 258/1208 [07:22<27:09,  1.72s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.97e-5, train/loss_step=0.0164, global_step=1272.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  21%|██▏       | 258/1208 [07:22<27:09,  1.72s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.07e-5, train/loss_step=0.0201, global_step=1272.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  21%|██▏       | 259/1208 [07:23<27:05,  1.71s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.07e-5, train/loss_step=0.0201, global_step=1272.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  21%|██▏       | 259/1208 [07:23<27:05,  1.71s/it, loss=0.0836, v_num=0, train/loss_simple_step=0.00956, train/loss_vlb_step=4.59e-5, train/loss_step=0.00956, global_step=1272.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  22%|██▏       | 260/1208 [07:26<27:09,  1.72s/it, loss=0.0836, v_num=0, train/loss_simple_step=0.00956, train/loss_vlb_step=4.59e-5, train/loss_step=0.00956, global_step=1272.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  22%|██▏       | 260/1208 [07:26<27:09,  1.72s/it, loss=0.0771, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.22e-5, train/loss_step=0.0142, global_step=1272.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  22%|██▏       | 261/1208 [07:27<27:04,  1.72s/it, loss=0.0771, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.22e-5, train/loss_step=0.0142, global_step=1272.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  22%|██▏       | 261/1208 [07:27<27:04,  1.72s/it, loss=0.0805, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000532, train/loss_step=0.153, global_step=1273.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  22%|██▏       | 262/1208 [07:28<27:00,  1.71s/it, loss=0.0805, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000532, train/loss_step=0.153, global_step=1273.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  22%|██▏       | 262/1208 [07:28<27:00,  1.71s/it, loss=0.0892, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.0025, train/loss_step=0.378, global_step=1273.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  22%|██▏       | 263/1208 [07:29<26:56,  1.71s/it, loss=0.0892, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.0025, train/loss_step=0.378, global_step=1273.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  22%|██▏       | 263/1208 [07:29<26:56,  1.71s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.0677, train/loss_vlb_step=0.000232, train/loss_step=0.0677, global_step=1273.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  22%|██▏       | 264/1208 [07:33<27:00,  1.72s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.0677, train/loss_vlb_step=0.000232, train/loss_step=0.0677, global_step=1273.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  22%|██▏       | 264/1208 [07:33<27:00,  1.72s/it, loss=0.0912, v_num=0, train/loss_simple_step=0.00692, train/loss_vlb_step=3.57e-5, train/loss_step=0.00692, global_step=1273.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  22%|██▏       | 265/1208 [07:34<26:56,  1.71s/it, loss=0.0912, v_num=0, train/loss_simple_step=0.00692, train/loss_vlb_step=3.57e-5, train/loss_step=0.00692, global_step=1273.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  22%|██▏       | 265/1208 [07:34<26:56,  1.71s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000117, train/loss_step=0.0284, global_step=1274.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  22%|██▏       | 266/1208 [07:35<26:52,  1.71s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000117, train/loss_step=0.0284, global_step=1274.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  22%|██▏       | 266/1208 [07:35<26:52,  1.71s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.48e-5, train/loss_step=0.0232, global_step=1274.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  22%|██▏       | 267/1208 [07:36<26:48,  1.71s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.48e-5, train/loss_step=0.0232, global_step=1274.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  22%|██▏       | 267/1208 [07:36<26:48,  1.71s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.55e-5, train/loss_step=0.00268, global_step=1274.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  22%|██▏       | 268/1208 [07:39<26:51,  1.71s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.55e-5, train/loss_step=0.00268, global_step=1274.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  22%|██▏       | 268/1208 [07:39<26:51,  1.71s/it, loss=0.0692, v_num=0, train/loss_simple_step=0.0094, train/loss_vlb_step=4.37e-5, train/loss_step=0.0094, global_step=1274.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  22%|██▏       | 269/1208 [07:40<26:47,  1.71s/it, loss=0.0692, v_num=0, train/loss_simple_step=0.0094, train/loss_vlb_step=4.37e-5, train/loss_step=0.0094, global_step=1274.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  22%|██▏       | 269/1208 [07:40<26:47,  1.71s/it, loss=0.0634, v_num=0, train/loss_simple_step=0.00911, train/loss_vlb_step=4.3e-5, train/loss_step=0.00911, global_step=1275.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  22%|██▏       | 270/1208 [07:41<26:43,  1.71s/it, loss=0.0634, v_num=0, train/loss_simple_step=0.00911, train/loss_vlb_step=4.3e-5, train/loss_step=0.00911, global_step=1275.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  22%|██▏       | 270/1208 [07:41<26:43,  1.71s/it, loss=0.0755, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00103, train/loss_step=0.256, global_step=1275.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  22%|██▏       | 271/1208 [07:42<26:39,  1.71s/it, loss=0.0755, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00103, train/loss_step=0.256, global_step=1275.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  22%|██▏       | 271/1208 [07:42<26:39,  1.71s/it, loss=0.0772, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000149, train/loss_step=0.0399, global_step=1275.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  23%|██▎       | 272/1208 [07:45<26:43,  1.71s/it, loss=0.0772, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000149, train/loss_step=0.0399, global_step=1275.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  23%|██▎       | 272/1208 [07:45<26:43,  1.71s/it, loss=0.0771, v_num=0, train/loss_simple_step=0.00551, train/loss_vlb_step=2.84e-5, train/loss_step=0.00551, global_step=1275.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  23%|██▎       | 273/1208 [07:46<26:39,  1.71s/it, loss=0.0771, v_num=0, train/loss_simple_step=0.00551, train/loss_vlb_step=2.84e-5, train/loss_step=0.00551, global_step=1275.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  23%|██▎       | 273/1208 [07:46<26:39,  1.71s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.00452, train/loss_step=0.485, global_step=1276.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  23%|██▎       | 274/1208 [07:48<26:35,  1.71s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.00452, train/loss_step=0.485, global_step=1276.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  23%|██▎       | 274/1208 [07:48<26:35,  1.71s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000491, train/loss_step=0.146, global_step=1276.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  23%|██▎       | 275/1208 [07:49<26:31,  1.71s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000491, train/loss_step=0.146, global_step=1276.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  23%|██▎       | 275/1208 [07:49<26:31,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.888, train/loss_vlb_step=0.447, train/loss_step=0.888, global_step=1276.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  23%|██▎       | 276/1208 [07:52<26:34,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.888, train/loss_vlb_step=0.447, train/loss_step=0.888, global_step=1276.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  23%|██▎       | 276/1208 [07:52<26:34,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.009, train/loss_vlb_step=4.23e-5, train/loss_step=0.009, global_step=1276.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  23%|██▎       | 277/1208 [07:53<26:31,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.009, train/loss_vlb_step=4.23e-5, train/loss_step=0.009, global_step=1276.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  23%|██▎       | 277/1208 [07:53<26:31,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0343, train/loss_vlb_step=0.000131, train/loss_step=0.0343, global_step=1277.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  23%|██▎       | 278/1208 [07:54<26:27,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0343, train/loss_vlb_step=0.000131, train/loss_step=0.0343, global_step=1277.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  23%|██▎       | 278/1208 [07:54<26:27,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00959, train/loss_vlb_step=4.69e-5, train/loss_step=0.00959, global_step=1277.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  23%|██▎       | 279/1208 [07:55<26:23,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00959, train/loss_vlb_step=4.69e-5, train/loss_step=0.00959, global_step=1277.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  23%|██▎       | 279/1208 [07:55<26:23,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.56e-5, train/loss_step=0.0177, global_step=1277.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  23%|██▎       | 280/1208 [07:58<26:26,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.56e-5, train/loss_step=0.0177, global_step=1277.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  23%|██▎       | 280/1208 [07:58<26:26,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0479, train/loss_vlb_step=0.000172, train/loss_step=0.0479, global_step=1277.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  23%|██▎       | 281/1208 [07:59<26:22,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0479, train/loss_vlb_step=0.000172, train/loss_step=0.0479, global_step=1277.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  23%|██▎       | 281/1208 [07:59<26:22,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0569, train/loss_vlb_step=0.000199, train/loss_step=0.0569, global_step=1278.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  23%|██▎       | 282/1208 [08:00<26:18,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0569, train/loss_vlb_step=0.000199, train/loss_step=0.0569, global_step=1278.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  23%|██▎       | 282/1208 [08:00<26:18,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.840, train/loss_vlb_step=0.054, train/loss_step=0.840, global_step=1278.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]     Epoch 4:  23%|██▎       | 283/1208 [08:01<26:15,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.840, train/loss_vlb_step=0.054, train/loss_step=0.840, global_step=1278.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  23%|██▎       | 283/1208 [08:01<26:15,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0958, train/loss_vlb_step=0.000318, train/loss_step=0.0958, global_step=1278.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  24%|██▎       | 284/1208 [08:05<26:18,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0958, train/loss_vlb_step=0.000318, train/loss_step=0.0958, global_step=1278.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  24%|██▎       | 284/1208 [08:05<26:18,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0847, train/loss_vlb_step=0.00028, train/loss_step=0.0847, global_step=1278.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  24%|██▎       | 285/1208 [08:06<26:14,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0847, train/loss_vlb_step=0.00028, train/loss_step=0.0847, global_step=1278.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  24%|██▎       | 285/1208 [08:06<26:14,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.33e-5, train/loss_step=0.0111, global_step=1279.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  24%|██▎       | 286/1208 [08:07<26:10,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.33e-5, train/loss_step=0.0111, global_step=1279.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  24%|██▎       | 286/1208 [08:07<26:10,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.84e-5, train/loss_step=0.0154, global_step=1279.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  24%|██▍       | 287/1208 [08:08<26:07,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.84e-5, train/loss_step=0.0154, global_step=1279.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  24%|██▍       | 287/1208 [08:08<26:07,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00837, train/loss_vlb_step=4.22e-5, train/loss_step=0.00837, global_step=1279.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  24%|██▍       | 288/1208 [08:11<26:10,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00837, train/loss_vlb_step=4.22e-5, train/loss_step=0.00837, global_step=1279.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  24%|██▍       | 288/1208 [08:11<26:10,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00154, train/loss_step=0.324, global_step=1279.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  24%|██▍       | 289/1208 [08:12<26:06,  1.70s/it, loss=0.169, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00154, train/loss_step=0.324, global_step=1279.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  24%|██▍       | 289/1208 [08:12<26:06,  1.70s/it, loss=0.182, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00123, train/loss_step=0.267, global_step=1280.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  24%|██▍       | 290/1208 [08:13<26:02,  1.70s/it, loss=0.182, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00123, train/loss_step=0.267, global_step=1280.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  24%|██▍       | 290/1208 [08:13<26:02,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0708, train/loss_vlb_step=0.000243, train/loss_step=0.0708, global_step=1280.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  24%|██▍       | 291/1208 [08:14<25:59,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0708, train/loss_vlb_step=0.000243, train/loss_step=0.0708, global_step=1280.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  24%|██▍       | 291/1208 [08:14<25:59,  1.70s/it, loss=0.198, v_num=0, train/loss_simple_step=0.545, train/loss_vlb_step=0.0123, train/loss_step=0.545, global_step=1280.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  24%|██▍       | 292/1208 [08:18<26:02,  1.71s/it, loss=0.198, v_num=0, train/loss_simple_step=0.545, train/loss_vlb_step=0.0123, train/loss_step=0.545, global_step=1280.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  24%|██▍       | 292/1208 [08:18<26:02,  1.71s/it, loss=0.218, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00195, train/loss_step=0.401, global_step=1280.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  24%|██▍       | 293/1208 [08:19<25:58,  1.70s/it, loss=0.218, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00195, train/loss_step=0.401, global_step=1280.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  24%|██▍       | 293/1208 [08:19<25:58,  1.70s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.61e-5, train/loss_step=0.0126, global_step=1281.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  24%|██▍       | 294/1208 [08:20<25:54,  1.70s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.61e-5, train/loss_step=0.0126, global_step=1281.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  24%|██▍       | 294/1208 [08:20<25:54,  1.70s/it, loss=0.194, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000465, train/loss_step=0.139, global_step=1281.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  24%|██▍       | 295/1208 [08:21<25:51,  1.70s/it, loss=0.194, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000465, train/loss_step=0.139, global_step=1281.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  24%|██▍       | 295/1208 [08:21<25:51,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00869, train/loss_vlb_step=4.28e-5, train/loss_step=0.00869, global_step=1281.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  25%|██▍       | 296/1208 [08:24<25:54,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00869, train/loss_vlb_step=4.28e-5, train/loss_step=0.00869, global_step=1281.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  25%|██▍       | 296/1208 [08:24<25:54,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.2e-5, train/loss_step=0.0196, global_step=1281.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  25%|██▍       | 297/1208 [08:25<25:50,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.2e-5, train/loss_step=0.0196, global_step=1281.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  25%|██▍       | 297/1208 [08:25<25:50,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000142, train/loss_step=0.0402, global_step=1282.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  25%|██▍       | 298/1208 [08:26<25:46,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000142, train/loss_step=0.0402, global_step=1282.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  25%|██▍       | 298/1208 [08:26<25:46,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.8e-5, train/loss_step=0.0206, global_step=1282.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  25%|██▍       | 299/1208 [08:27<25:43,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.8e-5, train/loss_step=0.0206, global_step=1282.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  25%|██▍       | 299/1208 [08:27<25:43,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0057, train/loss_vlb_step=2.97e-5, train/loss_step=0.0057, global_step=1282.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  25%|██▍       | 300/1208 [08:30<25:46,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0057, train/loss_vlb_step=2.97e-5, train/loss_step=0.0057, global_step=1282.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  25%|██▍       | 300/1208 [08:30<25:46,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00209, train/loss_step=0.322, global_step=1282.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.76it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.74it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.83it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.76it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.76it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.78it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:08,  1.75it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.78it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.75it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.74it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.75it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.75it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.75it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.78it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.78it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 4:  25%|██▍       | 301/1208 [09:01<27:11,  1.80s/it, loss=0.164, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00209, train/loss_step=0.322, global_step=1282.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  25%|██▍       | 301/1208 [09:01<27:11,  1.80s/it, loss=0.167, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=1283.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  25%|██▌       | 302/1208 [09:02<27:07,  1.80s/it, loss=0.167, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=1283.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  25%|██▌       | 302/1208 [09:02<27:07,  1.80s/it, loss=0.137, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000928, train/loss_step=0.233, global_step=1283.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  25%|██▌       | 303/1208 [09:03<27:03,  1.79s/it, loss=0.137, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000928, train/loss_step=0.233, global_step=1283.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  25%|██▌       | 303/1208 [09:03<27:03,  1.79s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00228, train/loss_vlb_step=1.37e-5, train/loss_step=0.00228, global_step=1283.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  25%|██▌       | 304/1208 [09:06<27:05,  1.80s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00228, train/loss_vlb_step=1.37e-5, train/loss_step=0.00228, global_step=1283.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  25%|██▌       | 304/1208 [09:06<27:05,  1.80s/it, loss=0.139, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.00091, train/loss_step=0.215, global_step=1283.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  25%|██▌       | 305/1208 [09:07<27:01,  1.80s/it, loss=0.139, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.00091, train/loss_step=0.215, global_step=1283.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  25%|██▌       | 305/1208 [09:07<27:01,  1.80s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000114, train/loss_step=0.0287, global_step=1284.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  25%|██▌       | 306/1208 [09:08<26:57,  1.79s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000114, train/loss_step=0.0287, global_step=1284.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  25%|██▌       | 306/1208 [09:08<26:57,  1.79s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000114, train/loss_step=0.0284, global_step=1284.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  25%|██▌       | 307/1208 [09:09<26:53,  1.79s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000114, train/loss_step=0.0284, global_step=1284.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  25%|██▌       | 307/1208 [09:09<26:53,  1.79s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.72e-5, train/loss_step=0.00291, global_step=1284.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  25%|██▌       | 308/1208 [09:13<26:56,  1.80s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.72e-5, train/loss_step=0.00291, global_step=1284.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  25%|██▌       | 308/1208 [09:13<26:56,  1.80s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0597, train/loss_vlb_step=0.000205, train/loss_step=0.0597, global_step=1284.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  26%|██▌       | 309/1208 [09:14<26:52,  1.79s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0597, train/loss_vlb_step=0.000205, train/loss_step=0.0597, global_step=1284.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  26%|██▌       | 309/1208 [09:14<26:52,  1.79s/it, loss=0.129, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00158, train/loss_step=0.307, global_step=1285.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  26%|██▌       | 310/1208 [09:15<26:48,  1.79s/it, loss=0.129, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00158, train/loss_step=0.307, global_step=1285.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  26%|██▌       | 310/1208 [09:15<26:48,  1.79s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.34e-5, train/loss_step=0.00225, global_step=1285.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  26%|██▌       | 311/1208 [09:16<26:44,  1.79s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.34e-5, train/loss_step=0.00225, global_step=1285.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  26%|██▌       | 311/1208 [09:16<26:44,  1.79s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0744, train/loss_vlb_step=0.000247, train/loss_step=0.0744, global_step=1285.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  26%|██▌       | 312/1208 [09:19<26:46,  1.79s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0744, train/loss_vlb_step=0.000247, train/loss_step=0.0744, global_step=1285.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  26%|██▌       | 312/1208 [09:19<26:46,  1.79s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.070, train/loss_vlb_step=0.00023, train/loss_step=0.070, global_step=1285.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  26%|██▌       | 313/1208 [09:20<26:42,  1.79s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.070, train/loss_vlb_step=0.00023, train/loss_step=0.070, global_step=1285.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  26%|██▌       | 313/1208 [09:20<26:42,  1.79s/it, loss=0.091, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000429, train/loss_step=0.129, global_step=1286.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  26%|██▌       | 314/1208 [09:21<26:39,  1.79s/it, loss=0.091, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000429, train/loss_step=0.129, global_step=1286.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  26%|██▌       | 314/1208 [09:21<26:39,  1.79s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000935, train/loss_step=0.231, global_step=1286.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  26%|██▌       | 315/1208 [09:22<26:35,  1.79s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000935, train/loss_step=0.231, global_step=1286.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  26%|██▌       | 315/1208 [09:22<26:35,  1.79s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.26e-5, train/loss_step=0.00409, global_step=1286.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  26%|██▌       | 316/1208 [09:25<26:37,  1.79s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.26e-5, train/loss_step=0.00409, global_step=1286.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  26%|██▌       | 316/1208 [09:25<26:37,  1.79s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.00731, train/loss_vlb_step=3.66e-5, train/loss_step=0.00731, global_step=1286.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  26%|██▌       | 317/1208 [09:27<26:33,  1.79s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.00731, train/loss_vlb_step=3.66e-5, train/loss_step=0.00731, global_step=1286.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  26%|██▌       | 317/1208 [09:27<26:33,  1.79s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000406, train/loss_step=0.123, global_step=1287.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  26%|██▋       | 318/1208 [09:28<26:29,  1.79s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000406, train/loss_step=0.123, global_step=1287.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  26%|██▋       | 318/1208 [09:28<26:29,  1.79s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.00558, train/loss_vlb_step=2.77e-5, train/loss_step=0.00558, global_step=1287.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  26%|██▋       | 319/1208 [09:29<26:26,  1.78s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.00558, train/loss_vlb_step=2.77e-5, train/loss_step=0.00558, global_step=1287.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  26%|██▋       | 319/1208 [09:29<26:26,  1.78s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.00536, train/loss_vlb_step=2.83e-5, train/loss_step=0.00536, global_step=1287.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  26%|██▋       | 320/1208 [09:32<26:28,  1.79s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.00536, train/loss_vlb_step=2.83e-5, train/loss_step=0.00536, global_step=1287.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  26%|██▋       | 320/1208 [09:32<26:28,  1.79s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000425, train/loss_step=0.129, global_step=1287.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  27%|██▋       | 321/1208 [09:33<26:24,  1.79s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000425, train/loss_step=0.129, global_step=1287.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  27%|██▋       | 321/1208 [09:33<26:24,  1.79s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.55e-5, train/loss_step=0.012, global_step=1288.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  27%|██▋       | 322/1208 [09:34<26:20,  1.78s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.55e-5, train/loss_step=0.012, global_step=1288.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  27%|██▋       | 322/1208 [09:34<26:20,  1.78s/it, loss=0.072, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.51e-5, train/loss_step=0.00261, global_step=1288.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  27%|██▋       | 323/1208 [09:35<26:16,  1.78s/it, loss=0.072, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.51e-5, train/loss_step=0.00261, global_step=1288.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  27%|██▋       | 323/1208 [09:35<26:16,  1.78s/it, loss=0.0774, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000367, train/loss_step=0.110, global_step=1288.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  27%|██▋       | 324/1208 [09:38<26:19,  1.79s/it, loss=0.0774, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000367, train/loss_step=0.110, global_step=1288.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  27%|██▋       | 324/1208 [09:38<26:19,  1.79s/it, loss=0.0711, v_num=0, train/loss_simple_step=0.0886, train/loss_vlb_step=0.000293, train/loss_step=0.0886, global_step=1288.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  27%|██▋       | 325/1208 [09:39<26:15,  1.78s/it, loss=0.0711, v_num=0, train/loss_simple_step=0.0886, train/loss_vlb_step=0.000293, train/loss_step=0.0886, global_step=1288.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  27%|██▋       | 325/1208 [09:39<26:15,  1.78s/it, loss=0.106, v_num=0, train/loss_simple_step=0.732, train/loss_vlb_step=0.0746, train/loss_step=0.732, global_step=1289.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]     Epoch 4:  27%|██▋       | 326/1208 [09:40<26:11,  1.78s/it, loss=0.106, v_num=0, train/loss_simple_step=0.732, train/loss_vlb_step=0.0746, train/loss_step=0.732, global_step=1289.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  27%|██▋       | 326/1208 [09:40<26:11,  1.78s/it, loss=0.115, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000851, train/loss_step=0.211, global_step=1289.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  27%|██▋       | 327/1208 [09:41<26:07,  1.78s/it, loss=0.115, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000851, train/loss_step=0.211, global_step=1289.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  27%|██▋       | 327/1208 [09:41<26:07,  1.78s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0604, train/loss_vlb_step=0.000208, train/loss_step=0.0604, global_step=1289.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  27%|██▋       | 328/1208 [09:45<26:09,  1.78s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0604, train/loss_vlb_step=0.000208, train/loss_step=0.0604, global_step=1289.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  27%|██▋       | 328/1208 [09:45<26:09,  1.78s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.000143, train/loss_step=0.0379, global_step=1289.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  27%|██▋       | 329/1208 [09:46<26:06,  1.78s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.000143, train/loss_step=0.0379, global_step=1289.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  27%|██▋       | 329/1208 [09:46<26:06,  1.78s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00437, train/loss_vlb_step=2.41e-5, train/loss_step=0.00437, global_step=1290.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  27%|██▋       | 330/1208 [09:47<26:02,  1.78s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00437, train/loss_vlb_step=2.41e-5, train/loss_step=0.00437, global_step=1290.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  27%|██▋       | 330/1208 [09:47<26:02,  1.78s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.95e-5, train/loss_step=0.0219, global_step=1290.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  27%|██▋       | 331/1208 [09:48<25:58,  1.78s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.95e-5, train/loss_step=0.0219, global_step=1290.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  27%|██▋       | 331/1208 [09:48<25:58,  1.78s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.00507, train/loss_vlb_step=2.74e-5, train/loss_step=0.00507, global_step=1290.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  27%|██▋       | 332/1208 [09:51<26:00,  1.78s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.00507, train/loss_vlb_step=2.74e-5, train/loss_step=0.00507, global_step=1290.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  27%|██▋       | 332/1208 [09:51<26:00,  1.78s/it, loss=0.0991, v_num=0, train/loss_simple_step=0.0625, train/loss_vlb_step=0.000211, train/loss_step=0.0625, global_step=1290.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  28%|██▊       | 333/1208 [09:52<25:57,  1.78s/it, loss=0.0991, v_num=0, train/loss_simple_step=0.0625, train/loss_vlb_step=0.000211, train/loss_step=0.0625, global_step=1290.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  28%|██▊       | 333/1208 [09:52<25:57,  1.78s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.68e-5, train/loss_step=0.0124, global_step=1291.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  28%|██▊       | 334/1208 [09:53<25:53,  1.78s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.68e-5, train/loss_step=0.0124, global_step=1291.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  28%|██▊       | 334/1208 [09:53<25:53,  1.78s/it, loss=0.101, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00261, train/loss_step=0.385, global_step=1291.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  28%|██▊       | 335/1208 [09:54<25:49,  1.78s/it, loss=0.101, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00261, train/loss_step=0.385, global_step=1291.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  28%|██▊       | 335/1208 [09:54<25:49,  1.78s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0966, train/loss_vlb_step=0.000319, train/loss_step=0.0966, global_step=1291.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  28%|██▊       | 336/1208 [09:57<25:51,  1.78s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0966, train/loss_vlb_step=0.000319, train/loss_step=0.0966, global_step=1291.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  28%|██▊       | 336/1208 [09:57<25:51,  1.78s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0955, train/loss_vlb_step=0.000315, train/loss_step=0.0955, global_step=1291.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  28%|██▊       | 337/1208 [09:58<25:48,  1.78s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0955, train/loss_vlb_step=0.000315, train/loss_step=0.0955, global_step=1291.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  28%|██▊       | 337/1208 [09:58<25:48,  1.78s/it, loss=0.112, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000555, train/loss_step=0.164, global_step=1292.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  28%|██▊       | 338/1208 [10:00<25:44,  1.78s/it, loss=0.112, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000555, train/loss_step=0.164, global_step=1292.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  28%|██▊       | 338/1208 [10:00<25:44,  1.78s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.85e-5, train/loss_step=0.0126, global_step=1292.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  28%|██▊       | 339/1208 [10:01<25:40,  1.77s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.85e-5, train/loss_step=0.0126, global_step=1292.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  28%|██▊       | 339/1208 [10:01<25:40,  1.77s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.47e-5, train/loss_step=0.0199, global_step=1292.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  28%|██▊       | 340/1208 [10:04<25:42,  1.78s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.47e-5, train/loss_step=0.0199, global_step=1292.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  28%|██▊       | 340/1208 [10:04<25:42,  1.78s/it, loss=0.113, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000418, train/loss_step=0.126, global_step=1292.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  28%|██▊       | 341/1208 [10:05<25:39,  1.78s/it, loss=0.113, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000418, train/loss_step=0.126, global_step=1292.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  28%|██▊       | 341/1208 [10:05<25:39,  1.78s/it, loss=0.123, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.00081, train/loss_step=0.208, global_step=1293.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  28%|██▊       | 342/1208 [10:06<25:35,  1.77s/it, loss=0.123, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.00081, train/loss_step=0.208, global_step=1293.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  28%|██▊       | 342/1208 [10:06<25:35,  1.77s/it, loss=0.148, v_num=0, train/loss_simple_step=0.497, train/loss_vlb_step=0.00421, train/loss_step=0.497, global_step=1293.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  28%|██▊       | 343/1208 [10:07<25:31,  1.77s/it, loss=0.148, v_num=0, train/loss_simple_step=0.497, train/loss_vlb_step=0.00421, train/loss_step=0.497, global_step=1293.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  28%|██▊       | 343/1208 [10:07<25:31,  1.77s/it, loss=0.15, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000521, train/loss_step=0.157, global_step=1293.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  28%|██▊       | 344/1208 [10:10<25:33,  1.78s/it, loss=0.15, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000521, train/loss_step=0.157, global_step=1293.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  28%|██▊       | 344/1208 [10:10<25:33,  1.78s/it, loss=0.152, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000461, train/loss_step=0.139, global_step=1293.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  29%|██▊       | 345/1208 [10:11<25:30,  1.77s/it, loss=0.152, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000461, train/loss_step=0.139, global_step=1293.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  29%|██▊       | 345/1208 [10:11<25:30,  1.77s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.38e-5, train/loss_step=0.0142, global_step=1294.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  29%|██▊       | 346/1208 [10:12<25:26,  1.77s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.38e-5, train/loss_step=0.0142, global_step=1294.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  29%|██▊       | 346/1208 [10:12<25:26,  1.77s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00819, train/loss_vlb_step=4.03e-5, train/loss_step=0.00819, global_step=1294.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  29%|██▊       | 347/1208 [10:13<25:23,  1.77s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00819, train/loss_vlb_step=4.03e-5, train/loss_step=0.00819, global_step=1294.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  29%|██▊       | 347/1208 [10:13<25:23,  1.77s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0074, train/loss_vlb_step=3.89e-5, train/loss_step=0.0074, global_step=1294.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  29%|██▉       | 348/1208 [10:17<25:25,  1.77s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0074, train/loss_vlb_step=3.89e-5, train/loss_step=0.0074, global_step=1294.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  29%|██▉       | 348/1208 [10:17<25:25,  1.77s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00688, train/loss_vlb_step=3.55e-5, train/loss_step=0.00688, global_step=1294.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  29%|██▉       | 349/1208 [10:18<25:21,  1.77s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00688, train/loss_vlb_step=3.55e-5, train/loss_step=0.00688, global_step=1294.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  29%|██▉       | 349/1208 [10:18<25:21,  1.77s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0423, train/loss_vlb_step=0.000157, train/loss_step=0.0423, global_step=1295.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  29%|██▉       | 350/1208 [10:19<25:17,  1.77s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0423, train/loss_vlb_step=0.000157, train/loss_step=0.0423, global_step=1295.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  29%|██▉       | 350/1208 [10:19<25:18,  1.77s/it, loss=0.111, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000543, train/loss_step=0.158, global_step=1295.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  29%|██▉       | 351/1208 [10:20<25:14,  1.77s/it, loss=0.111, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000543, train/loss_step=0.158, global_step=1295.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  29%|██▉       | 351/1208 [10:20<25:14,  1.77s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00401, train/loss_vlb_step=2.19e-5, train/loss_step=0.00401, global_step=1295.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  29%|██▉       | 352/1208 [10:23<25:16,  1.77s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00401, train/loss_vlb_step=2.19e-5, train/loss_step=0.00401, global_step=1295.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  29%|██▉       | 352/1208 [10:23<25:16,  1.77s/it, loss=0.12, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.000998, train/loss_step=0.253, global_step=1295.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  29%|██▉       | 353/1208 [10:24<25:12,  1.77s/it, loss=0.12, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.000998, train/loss_step=0.253, global_step=1295.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  29%|██▉       | 353/1208 [10:24<25:12,  1.77s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0926, train/loss_vlb_step=0.000308, train/loss_step=0.0926, global_step=1296.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  29%|██▉       | 354/1208 [10:25<25:09,  1.77s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0926, train/loss_vlb_step=0.000308, train/loss_step=0.0926, global_step=1296.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  29%|██▉       | 354/1208 [10:25<25:09,  1.77s/it, loss=0.118, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000896, train/loss_step=0.248, global_step=1296.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  29%|██▉       | 355/1208 [10:26<25:05,  1.77s/it, loss=0.118, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000896, train/loss_step=0.248, global_step=1296.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  29%|██▉       | 355/1208 [10:26<25:05,  1.77s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0414, train/loss_vlb_step=0.000154, train/loss_step=0.0414, global_step=1296.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  29%|██▉       | 356/1208 [10:29<25:07,  1.77s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0414, train/loss_vlb_step=0.000154, train/loss_step=0.0414, global_step=1296.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  29%|██▉       | 356/1208 [10:29<25:07,  1.77s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0842, train/loss_vlb_step=0.000283, train/loss_step=0.0842, global_step=1296.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  30%|██▉       | 357/1208 [10:30<25:03,  1.77s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0842, train/loss_vlb_step=0.000283, train/loss_step=0.0842, global_step=1296.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  30%|██▉       | 357/1208 [10:30<25:03,  1.77s/it, loss=0.113, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000463, train/loss_step=0.141, global_step=1297.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  30%|██▉       | 358/1208 [10:31<25:00,  1.77s/it, loss=0.113, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000463, train/loss_step=0.141, global_step=1297.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  30%|██▉       | 358/1208 [10:31<25:00,  1.77s/it, loss=0.12, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000527, train/loss_step=0.158, global_step=1297.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  30%|██▉       | 359/1208 [10:33<24:56,  1.76s/it, loss=0.12, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000527, train/loss_step=0.158, global_step=1297.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  30%|██▉       | 359/1208 [10:33<24:56,  1.76s/it, loss=0.133, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.000972, train/loss_step=0.280, global_step=1297.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  30%|██▉       | 360/1208 [10:36<24:58,  1.77s/it, loss=0.133, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.000972, train/loss_step=0.280, global_step=1297.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  30%|██▉       | 360/1208 [10:36<24:58,  1.77s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0305, train/loss_vlb_step=0.000119, train/loss_step=0.0305, global_step=1297.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  30%|██▉       | 361/1208 [10:37<24:55,  1.77s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0305, train/loss_vlb_step=0.000119, train/loss_step=0.0305, global_step=1297.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  30%|██▉       | 361/1208 [10:37<24:55,  1.77s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0645, train/loss_vlb_step=0.000224, train/loss_step=0.0645, global_step=1298.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  30%|██▉       | 362/1208 [10:38<24:51,  1.76s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0645, train/loss_vlb_step=0.000224, train/loss_step=0.0645, global_step=1298.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  30%|██▉       | 362/1208 [10:38<24:51,  1.76s/it, loss=0.105, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000588, train/loss_step=0.175, global_step=1298.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  30%|███       | 363/1208 [10:39<24:48,  1.76s/it, loss=0.105, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000588, train/loss_step=0.175, global_step=1298.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  30%|███       | 363/1208 [10:39<24:48,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00156, train/loss_step=0.311, global_step=1298.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  30%|███       | 364/1208 [10:42<24:50,  1.77s/it, loss=0.113, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00156, train/loss_step=0.311, global_step=1298.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  30%|███       | 364/1208 [10:42<24:50,  1.77s/it, loss=0.132, v_num=0, train/loss_simple_step=0.527, train/loss_vlb_step=0.00996, train/loss_step=0.527, global_step=1298.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  30%|███       | 365/1208 [10:43<24:46,  1.76s/it, loss=0.132, v_num=0, train/loss_simple_step=0.527, train/loss_vlb_step=0.00996, train/loss_step=0.527, global_step=1298.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  30%|███       | 365/1208 [10:43<24:46,  1.76s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0982, train/loss_vlb_step=0.000323, train/loss_step=0.0982, global_step=1299.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  30%|███       | 366/1208 [10:44<24:43,  1.76s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0982, train/loss_vlb_step=0.000323, train/loss_step=0.0982, global_step=1299.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  30%|███       | 366/1208 [10:44<24:43,  1.76s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0631, train/loss_vlb_step=0.000219, train/loss_step=0.0631, global_step=1299.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  30%|███       | 367/1208 [10:45<24:39,  1.76s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0631, train/loss_vlb_step=0.000219, train/loss_step=0.0631, global_step=1299.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  30%|███       | 367/1208 [10:45<24:39,  1.76s/it, loss=0.169, v_num=0, train/loss_simple_step=0.603, train/loss_vlb_step=0.0187, train/loss_step=0.603, global_step=1299.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  30%|███       | 368/1208 [10:48<24:41,  1.76s/it, loss=0.169, v_num=0, train/loss_simple_step=0.603, train/loss_vlb_step=0.0187, train/loss_step=0.603, global_step=1299.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  30%|███       | 368/1208 [10:48<24:41,  1.76s/it, loss=0.174, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000376, train/loss_step=0.114, global_step=1299.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  31%|███       | 369/1208 [10:50<24:38,  1.76s/it, loss=0.174, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000376, train/loss_step=0.114, global_step=1299.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  31%|███       | 369/1208 [10:50<24:38,  1.76s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0701, train/loss_vlb_step=0.000243, train/loss_step=0.0701, global_step=1300.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  31%|███       | 370/1208 [10:51<24:34,  1.76s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0701, train/loss_vlb_step=0.000243, train/loss_step=0.0701, global_step=1300.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  31%|███       | 370/1208 [10:51<24:34,  1.76s/it, loss=0.196, v_num=0, train/loss_simple_step=0.555, train/loss_vlb_step=0.0142, train/loss_step=0.555, global_step=1300.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  31%|███       | 371/1208 [10:52<24:31,  1.76s/it, loss=0.196, v_num=0, train/loss_simple_step=0.555, train/loss_vlb_step=0.0142, train/loss_step=0.555, global_step=1300.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  31%|███       | 371/1208 [10:52<24:31,  1.76s/it, loss=0.205, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000637, train/loss_step=0.187, global_step=1300.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  31%|███       | 372/1208 [10:55<24:32,  1.76s/it, loss=0.205, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000637, train/loss_step=0.187, global_step=1300.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  31%|███       | 372/1208 [10:55<24:32,  1.76s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.29e-5, train/loss_step=0.0121, global_step=1300.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  31%|███       | 373/1208 [10:56<24:29,  1.76s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.29e-5, train/loss_step=0.0121, global_step=1300.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  31%|███       | 373/1208 [10:56<24:29,  1.76s/it, loss=0.204, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00157, train/loss_step=0.322, global_step=1301.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  31%|███       | 374/1208 [10:57<24:26,  1.76s/it, loss=0.204, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00157, train/loss_step=0.322, global_step=1301.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  31%|███       | 374/1208 [10:57<24:26,  1.76s/it, loss=0.198, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=1301.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  31%|███       | 375/1208 [10:58<24:22,  1.76s/it, loss=0.198, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=1301.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  31%|███       | 375/1208 [10:58<24:22,  1.76s/it, loss=0.207, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000833, train/loss_step=0.229, global_step=1301.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  31%|███       | 376/1208 [11:01<24:24,  1.76s/it, loss=0.207, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000833, train/loss_step=0.229, global_step=1301.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  31%|███       | 376/1208 [11:01<24:24,  1.76s/it, loss=0.203, v_num=0, train/loss_simple_step=0.00862, train/loss_vlb_step=4.29e-5, train/loss_step=0.00862, global_step=1301.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  31%|███       | 377/1208 [11:02<24:21,  1.76s/it, loss=0.203, v_num=0, train/loss_simple_step=0.00862, train/loss_vlb_step=4.29e-5, train/loss_step=0.00862, global_step=1301.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  31%|███       | 377/1208 [11:02<24:21,  1.76s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.56e-5, train/loss_step=0.00261, global_step=1302.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  31%|███▏      | 378/1208 [11:03<24:17,  1.76s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.56e-5, train/loss_step=0.00261, global_step=1302.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  31%|███▏      | 378/1208 [11:03<24:17,  1.76s/it, loss=0.196, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000484, train/loss_step=0.144, global_step=1302.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  31%|███▏      | 379/1208 [11:04<24:14,  1.75s/it, loss=0.196, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000484, train/loss_step=0.144, global_step=1302.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  31%|███▏      | 379/1208 [11:04<24:14,  1.75s/it, loss=0.188, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=1302.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  31%|███▏      | 380/1208 [11:08<24:15,  1.76s/it, loss=0.188, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=1302.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  31%|███▏      | 380/1208 [11:08<24:15,  1.76s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0488, train/loss_vlb_step=0.000174, train/loss_step=0.0488, global_step=1302.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  32%|███▏      | 381/1208 [11:09<24:12,  1.76s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0488, train/loss_vlb_step=0.000174, train/loss_step=0.0488, global_step=1302.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  32%|███▏      | 381/1208 [11:09<24:12,  1.76s/it, loss=0.206, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00403, train/loss_step=0.404, global_step=1303.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  32%|███▏      | 382/1208 [11:10<24:09,  1.75s/it, loss=0.206, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00403, train/loss_step=0.404, global_step=1303.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  32%|███▏      | 382/1208 [11:10<24:09,  1.75s/it, loss=0.207, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000764, train/loss_step=0.204, global_step=1303.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  32%|███▏      | 383/1208 [11:11<24:05,  1.75s/it, loss=0.207, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000764, train/loss_step=0.204, global_step=1303.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  32%|███▏      | 383/1208 [11:11<24:05,  1.75s/it, loss=0.2, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000584, train/loss_step=0.172, global_step=1303.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  32%|███▏      | 384/1208 [11:14<24:07,  1.76s/it, loss=0.2, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000584, train/loss_step=0.172, global_step=1303.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  32%|███▏      | 384/1208 [11:14<24:07,  1.76s/it, loss=0.187, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.000952, train/loss_step=0.257, global_step=1303.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  32%|███▏      | 385/1208 [11:15<24:04,  1.75s/it, loss=0.187, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.000952, train/loss_step=0.257, global_step=1303.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  32%|███▏      | 385/1208 [11:15<24:04,  1.75s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.14e-5, train/loss_step=0.0194, global_step=1304.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  32%|███▏      | 386/1208 [11:16<24:00,  1.75s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.14e-5, train/loss_step=0.0194, global_step=1304.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  32%|███▏      | 386/1208 [11:16<24:00,  1.75s/it, loss=0.2, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.00311, train/loss_step=0.406, global_step=1304.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  32%|███▏      | 387/1208 [11:17<23:57,  1.75s/it, loss=0.2, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.00311, train/loss_step=0.406, global_step=1304.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  32%|███▏      | 387/1208 [11:17<23:57,  1.75s/it, loss=0.204, v_num=0, train/loss_simple_step=0.693, train/loss_vlb_step=0.0194, train/loss_step=0.693, global_step=1304.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  32%|███▏      | 388/1208 [11:20<23:58,  1.75s/it, loss=0.204, v_num=0, train/loss_simple_step=0.693, train/loss_vlb_step=0.0194, train/loss_step=0.693, global_step=1304.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  32%|███▏      | 388/1208 [11:20<23:58,  1.75s/it, loss=0.207, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000523, train/loss_step=0.158, global_step=1304.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  32%|███▏      | 389/1208 [11:21<23:55,  1.75s/it, loss=0.207, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000523, train/loss_step=0.158, global_step=1304.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  32%|███▏      | 389/1208 [11:21<23:55,  1.75s/it, loss=0.204, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.87e-5, train/loss_step=0.0103, global_step=1305.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  32%|███▏      | 390/1208 [11:22<23:52,  1.75s/it, loss=0.204, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.87e-5, train/loss_step=0.0103, global_step=1305.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  32%|███▏      | 390/1208 [11:22<23:52,  1.75s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=1.09e-5, train/loss_step=0.00183, global_step=1305.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  32%|███▏      | 391/1208 [11:24<23:49,  1.75s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=1.09e-5, train/loss_step=0.00183, global_step=1305.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  32%|███▏      | 391/1208 [11:24<23:49,  1.75s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0048, train/loss_vlb_step=2.44e-5, train/loss_step=0.0048, global_step=1305.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  32%|███▏      | 392/1208 [11:27<23:50,  1.75s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0048, train/loss_vlb_step=2.44e-5, train/loss_step=0.0048, global_step=1305.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  32%|███▏      | 392/1208 [11:27<23:50,  1.75s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.00018, train/loss_step=0.0483, global_step=1305.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  33%|███▎      | 393/1208 [11:28<23:47,  1.75s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.00018, train/loss_step=0.0483, global_step=1305.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  33%|███▎      | 393/1208 [11:28<23:47,  1.75s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.57e-5, train/loss_step=0.0182, global_step=1306.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  33%|███▎      | 394/1208 [11:29<23:44,  1.75s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.57e-5, train/loss_step=0.0182, global_step=1306.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  33%|███▎      | 394/1208 [11:29<23:44,  1.75s/it, loss=0.16, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00105, train/loss_step=0.245, global_step=1306.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  33%|███▎      | 395/1208 [11:30<23:40,  1.75s/it, loss=0.16, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00105, train/loss_step=0.245, global_step=1306.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  33%|███▎      | 395/1208 [11:30<23:40,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000529, train/loss_step=0.157, global_step=1306.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  33%|███▎      | 396/1208 [11:33<23:42,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000529, train/loss_step=0.157, global_step=1306.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  33%|███▎      | 396/1208 [11:33<23:42,  1.75s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0646, train/loss_vlb_step=0.000225, train/loss_step=0.0646, global_step=1306.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  33%|███▎      | 397/1208 [11:34<23:39,  1.75s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0646, train/loss_vlb_step=0.000225, train/loss_step=0.0646, global_step=1306.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  33%|███▎      | 397/1208 [11:34<23:39,  1.75s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7.04e-5, train/loss_step=0.0165, global_step=1307.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  33%|███▎      | 398/1208 [11:35<23:35,  1.75s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7.04e-5, train/loss_step=0.0165, global_step=1307.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  33%|███▎      | 398/1208 [11:35<23:35,  1.75s/it, loss=0.166, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00111, train/loss_step=0.262, global_step=1307.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  33%|███▎      | 399/1208 [11:36<23:32,  1.75s/it, loss=0.166, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00111, train/loss_step=0.262, global_step=1307.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  33%|███▎      | 399/1208 [11:36<23:32,  1.75s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000137, train/loss_step=0.0365, global_step=1307.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  33%|███▎      | 400/1208 [11:39<23:33,  1.75s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000137, train/loss_step=0.0365, global_step=1307.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  33%|███▎      | 400/1208 [11:39<23:33,  1.75s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00914, train/loss_vlb_step=4.09e-5, train/loss_step=0.00914, global_step=1307.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  33%|███▎      | 401/1208 [11:41<23:30,  1.75s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00914, train/loss_vlb_step=4.09e-5, train/loss_step=0.00914, global_step=1307.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  33%|███▎      | 401/1208 [11:41<23:30,  1.75s/it, loss=0.149, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000657, train/loss_step=0.193, global_step=1308.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  33%|███▎      | 402/1208 [11:42<23:27,  1.75s/it, loss=0.149, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000657, train/loss_step=0.193, global_step=1308.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  33%|███▎      | 402/1208 [11:42<23:27,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.83e-5, train/loss_step=0.00319, global_step=1308.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  33%|███▎      | 403/1208 [11:43<23:24,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.83e-5, train/loss_step=0.00319, global_step=1308.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  33%|███▎      | 403/1208 [11:43<23:24,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0848, train/loss_vlb_step=0.000282, train/loss_step=0.0848, global_step=1308.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  33%|███▎      | 404/1208 [11:46<23:25,  1.75s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0848, train/loss_vlb_step=0.000282, train/loss_step=0.0848, global_step=1308.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  33%|███▎      | 404/1208 [11:46<23:25,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00157, train/loss_step=0.305, global_step=1308.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  34%|███▎      | 405/1208 [11:47<23:22,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00157, train/loss_step=0.305, global_step=1308.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  34%|███▎      | 405/1208 [11:47<23:22,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000443, train/loss_step=0.135, global_step=1309.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  34%|███▎      | 406/1208 [11:48<23:19,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000443, train/loss_step=0.135, global_step=1309.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  34%|███▎      | 406/1208 [11:48<23:19,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00732, train/loss_vlb_step=3.69e-5, train/loss_step=0.00732, global_step=1309.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  34%|███▎      | 407/1208 [11:49<23:16,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00732, train/loss_vlb_step=3.69e-5, train/loss_step=0.00732, global_step=1309.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  34%|███▎      | 407/1208 [11:49<23:16,  1.74s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.82e-5, train/loss_step=0.0102, global_step=1309.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  34%|███▍      | 408/1208 [11:52<23:17,  1.75s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.82e-5, train/loss_step=0.0102, global_step=1309.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  34%|███▍      | 408/1208 [11:52<23:17,  1.75s/it, loss=0.0812, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.57e-5, train/loss_step=0.0123, global_step=1309.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  34%|███▍      | 409/1208 [11:53<23:14,  1.75s/it, loss=0.0812, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.57e-5, train/loss_step=0.0123, global_step=1309.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  34%|███▍      | 409/1208 [11:53<23:14,  1.75s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000764, train/loss_step=0.216, global_step=1310.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  34%|███▍      | 410/1208 [11:54<23:11,  1.74s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000764, train/loss_step=0.216, global_step=1310.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  34%|███▍      | 410/1208 [11:54<23:11,  1.74s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0915, train/loss_vlb_step=0.000301, train/loss_step=0.0915, global_step=1310.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  34%|███▍      | 411/1208 [11:55<23:08,  1.74s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0915, train/loss_vlb_step=0.000301, train/loss_step=0.0915, global_step=1310.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  34%|███▍      | 411/1208 [11:55<23:08,  1.74s/it, loss=0.096, v_num=0, train/loss_simple_step=0.00478, train/loss_vlb_step=2.5e-5, train/loss_step=0.00478, global_step=1310.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  34%|███▍      | 412/1208 [11:59<23:09,  1.75s/it, loss=0.096, v_num=0, train/loss_simple_step=0.00478, train/loss_vlb_step=2.5e-5, train/loss_step=0.00478, global_step=1310.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  34%|███▍      | 412/1208 [11:59<23:09,  1.75s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.0552, train/loss_vlb_step=0.000191, train/loss_step=0.0552, global_step=1310.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  34%|███▍      | 413/1208 [12:00<23:06,  1.74s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.0552, train/loss_vlb_step=0.000191, train/loss_step=0.0552, global_step=1310.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  34%|███▍      | 413/1208 [12:00<23:06,  1.74s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.00694, train/loss_vlb_step=3.56e-5, train/loss_step=0.00694, global_step=1311.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  34%|███▍      | 414/1208 [12:01<23:03,  1.74s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.00694, train/loss_vlb_step=3.56e-5, train/loss_step=0.00694, global_step=1311.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  34%|███▍      | 414/1208 [12:01<23:03,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.732, train/loss_vlb_step=0.042, train/loss_step=0.732, global_step=1311.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]        Epoch 4:  34%|███▍      | 415/1208 [12:02<23:00,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.732, train/loss_vlb_step=0.042, train/loss_step=0.732, global_step=1311.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  34%|███▍      | 415/1208 [12:02<23:00,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00812, train/loss_vlb_step=3.99e-5, train/loss_step=0.00812, global_step=1311.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  34%|███▍      | 416/1208 [12:05<23:01,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00812, train/loss_vlb_step=3.99e-5, train/loss_step=0.00812, global_step=1311.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  34%|███▍      | 416/1208 [12:05<23:01,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=1311.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  35%|███▍      | 417/1208 [12:06<22:58,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=1311.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  35%|███▍      | 417/1208 [12:06<22:58,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00426, train/loss_vlb_step=2.34e-5, train/loss_step=0.00426, global_step=1312.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  35%|███▍      | 418/1208 [12:07<22:55,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00426, train/loss_vlb_step=2.34e-5, train/loss_step=0.00426, global_step=1312.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  35%|███▍      | 418/1208 [12:07<22:55,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.0019, train/loss_step=0.332, global_step=1312.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]     Epoch 4:  35%|███▍      | 419/1208 [12:08<22:52,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.0019, train/loss_step=0.332, global_step=1312.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  35%|███▍      | 419/1208 [12:08<22:52,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.055, train/loss_vlb_step=0.000193, train/loss_step=0.055, global_step=1312.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  35%|███▍      | 420/1208 [12:11<22:53,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.055, train/loss_vlb_step=0.000193, train/loss_step=0.055, global_step=1312.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  35%|███▍      | 420/1208 [12:11<22:53,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0824, train/loss_vlb_step=0.000278, train/loss_step=0.0824, global_step=1312.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  35%|███▍      | 421/1208 [12:12<22:50,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0824, train/loss_vlb_step=0.000278, train/loss_step=0.0824, global_step=1312.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  35%|███▍      | 421/1208 [12:12<22:50,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00376, train/loss_vlb_step=2.08e-5, train/loss_step=0.00376, global_step=1313.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  35%|███▍      | 422/1208 [12:14<22:47,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00376, train/loss_vlb_step=2.08e-5, train/loss_step=0.00376, global_step=1313.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  35%|███▍      | 422/1208 [12:14<22:47,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.9e-5, train/loss_step=0.00342, global_step=1313.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  35%|███▌      | 423/1208 [12:15<22:44,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.9e-5, train/loss_step=0.00342, global_step=1313.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  35%|███▌      | 423/1208 [12:15<22:44,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000402, train/loss_step=0.121, global_step=1313.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  35%|███▌      | 424/1208 [12:18<22:45,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000402, train/loss_step=0.121, global_step=1313.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  35%|███▌      | 424/1208 [12:18<22:45,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000148, train/loss_step=0.0409, global_step=1313.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  35%|███▌      | 425/1208 [12:19<22:42,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000148, train/loss_step=0.0409, global_step=1313.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  35%|███▌      | 425/1208 [12:19<22:42,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00197, train/loss_step=0.340, global_step=1314.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  35%|███▌      | 426/1208 [12:20<22:39,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00197, train/loss_step=0.340, global_step=1314.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  35%|███▌      | 426/1208 [12:20<22:39,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0323, train/loss_vlb_step=0.000126, train/loss_step=0.0323, global_step=1314.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  35%|███▌      | 427/1208 [12:21<22:36,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0323, train/loss_vlb_step=0.000126, train/loss_step=0.0323, global_step=1314.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  35%|███▌      | 427/1208 [12:21<22:36,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.04e-5, train/loss_step=0.00175, global_step=1314.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  35%|███▌      | 428/1208 [12:24<22:37,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.04e-5, train/loss_step=0.00175, global_step=1314.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  35%|███▌      | 428/1208 [12:24<22:37,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.501, train/loss_vlb_step=0.00425, train/loss_step=0.501, global_step=1314.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  36%|███▌      | 429/1208 [12:25<22:34,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.501, train/loss_vlb_step=0.00425, train/loss_step=0.501, global_step=1314.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  36%|███▌      | 429/1208 [12:25<22:34,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.42e-5, train/loss_step=0.00236, global_step=1315.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  36%|███▌      | 430/1208 [12:26<22:31,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.42e-5, train/loss_step=0.00236, global_step=1315.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  36%|███▌      | 430/1208 [12:26<22:31,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000483, train/loss_step=0.145, global_step=1315.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  36%|███▌      | 431/1208 [12:27<22:28,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000483, train/loss_step=0.145, global_step=1315.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  36%|███▌      | 431/1208 [12:27<22:28,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00145, train/loss_step=0.297, global_step=1315.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  36%|███▌      | 432/1208 [12:31<22:29,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00145, train/loss_step=0.297, global_step=1315.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  36%|███▌      | 432/1208 [12:31<22:29,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.503, train/loss_vlb_step=0.00845, train/loss_step=0.503, global_step=1315.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  36%|███▌      | 433/1208 [12:32<22:26,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.503, train/loss_vlb_step=0.00845, train/loss_step=0.503, global_step=1315.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  36%|███▌      | 433/1208 [12:32<22:26,  1.74s/it, loss=0.198, v_num=0, train/loss_simple_step=0.635, train/loss_vlb_step=0.0222, train/loss_step=0.635, global_step=1316.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  36%|███▌      | 434/1208 [12:33<22:23,  1.74s/it, loss=0.198, v_num=0, train/loss_simple_step=0.635, train/loss_vlb_step=0.0222, train/loss_step=0.635, global_step=1316.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  36%|███▌      | 434/1208 [12:33<22:23,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.000918, train/loss_step=0.247, global_step=1316.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  36%|███▌      | 435/1208 [12:34<22:20,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.000918, train/loss_step=0.247, global_step=1316.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  36%|███▌      | 435/1208 [12:34<22:20,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.36e-5, train/loss_step=0.0176, global_step=1316.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  36%|███▌      | 436/1208 [12:37<22:21,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.36e-5, train/loss_step=0.0176, global_step=1316.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  36%|███▌      | 436/1208 [12:37<22:21,  1.74s/it, loss=0.173, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000286, train/loss_step=0.086, global_step=1316.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  36%|███▌      | 437/1208 [12:38<22:18,  1.74s/it, loss=0.173, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000286, train/loss_step=0.086, global_step=1316.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  36%|███▌      | 437/1208 [12:38<22:18,  1.74s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00435, train/loss_vlb_step=2.28e-5, train/loss_step=0.00435, global_step=1317.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  36%|███▋      | 438/1208 [12:39<22:15,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00435, train/loss_vlb_step=2.28e-5, train/loss_step=0.00435, global_step=1317.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  36%|███▋      | 438/1208 [12:39<22:15,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.74e-5, train/loss_step=0.0206, global_step=1317.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  36%|███▋      | 439/1208 [12:40<22:12,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.74e-5, train/loss_step=0.0206, global_step=1317.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  36%|███▋      | 439/1208 [12:40<22:12,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00891, train/loss_vlb_step=4.06e-5, train/loss_step=0.00891, global_step=1317.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  36%|███▋      | 440/1208 [12:43<22:13,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00891, train/loss_vlb_step=4.06e-5, train/loss_step=0.00891, global_step=1317.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  36%|███▋      | 440/1208 [12:43<22:13,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.000178, train/loss_step=0.0485, global_step=1317.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  37%|███▋      | 441/1208 [12:44<22:10,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.000178, train/loss_step=0.0485, global_step=1317.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  37%|███▋      | 441/1208 [12:44<22:10,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00581, train/loss_vlb_step=3e-5, train/loss_step=0.00581, global_step=1318.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  37%|███▋      | 442/1208 [12:45<22:07,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00581, train/loss_vlb_step=3e-5, train/loss_step=0.00581, global_step=1318.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  37%|███▋      | 442/1208 [12:45<22:07,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.550, train/loss_vlb_step=0.0107, train/loss_step=0.550, global_step=1318.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  37%|███▋      | 443/1208 [12:46<22:04,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.550, train/loss_vlb_step=0.0107, train/loss_step=0.550, global_step=1318.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  37%|███▋      | 443/1208 [12:46<22:04,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0432, train/loss_vlb_step=0.000155, train/loss_step=0.0432, global_step=1318.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  37%|███▋      | 444/1208 [12:50<22:05,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0432, train/loss_vlb_step=0.000155, train/loss_step=0.0432, global_step=1318.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  37%|███▋      | 444/1208 [12:50<22:05,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000633, train/loss_step=0.178, global_step=1318.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  37%|███▋      | 445/1208 [12:51<22:02,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000633, train/loss_step=0.178, global_step=1318.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  37%|███▋      | 445/1208 [12:51<22:02,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000371, train/loss_step=0.113, global_step=1319.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  37%|███▋      | 446/1208 [12:52<21:59,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000371, train/loss_step=0.113, global_step=1319.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  37%|███▋      | 446/1208 [12:52<21:59,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000492, train/loss_step=0.148, global_step=1319.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  37%|███▋      | 447/1208 [12:53<21:56,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000492, train/loss_step=0.148, global_step=1319.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  37%|███▋      | 447/1208 [12:53<21:56,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00597, train/loss_vlb_step=3.06e-5, train/loss_step=0.00597, global_step=1319.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  37%|███▋      | 448/1208 [12:56<21:57,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00597, train/loss_vlb_step=3.06e-5, train/loss_step=0.00597, global_step=1319.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  37%|███▋      | 448/1208 [12:56<21:57,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00378, train/loss_step=0.411, global_step=1319.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  37%|███▋      | 449/1208 [12:57<21:54,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00378, train/loss_step=0.411, global_step=1319.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  37%|███▋      | 449/1208 [12:57<21:54,  1.73s/it, loss=0.185, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000925, train/loss_step=0.225, global_step=1320.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  37%|███▋      | 450/1208 [12:58<21:51,  1.73s/it, loss=0.185, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000925, train/loss_step=0.225, global_step=1320.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  37%|███▋      | 450/1208 [12:58<21:51,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000163, train/loss_step=0.0438, global_step=1320.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  37%|███▋      | 451/1208 [12:59<21:48,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000163, train/loss_step=0.0438, global_step=1320.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  37%|███▋      | 451/1208 [12:59<21:48,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00108, train/loss_step=0.263, global_step=1320.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  37%|███▋      | 452/1208 [13:03<21:49,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00108, train/loss_step=0.263, global_step=1320.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  37%|███▋      | 452/1208 [13:03<21:49,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.94e-5, train/loss_step=0.0127, global_step=1320.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  38%|███▊      | 453/1208 [13:04<21:46,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.94e-5, train/loss_step=0.0127, global_step=1320.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  38%|███▊      | 453/1208 [13:04<21:46,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.00073, train/loss_step=0.210, global_step=1321.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  38%|███▊      | 454/1208 [13:05<21:43,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.00073, train/loss_step=0.210, global_step=1321.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  38%|███▊      | 454/1208 [13:05<21:43,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000292, train/loss_step=0.087, global_step=1321.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  38%|███▊      | 455/1208 [13:06<21:41,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000292, train/loss_step=0.087, global_step=1321.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  38%|███▊      | 455/1208 [13:06<21:41,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.000178, train/loss_step=0.048, global_step=1321.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  38%|███▊      | 456/1208 [13:09<21:41,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.000178, train/loss_step=0.048, global_step=1321.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  38%|███▊      | 456/1208 [13:09<21:41,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.808, train/loss_vlb_step=0.052, train/loss_step=0.808, global_step=1321.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  38%|███▊      | 457/1208 [13:10<21:39,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.808, train/loss_vlb_step=0.052, train/loss_step=0.808, global_step=1321.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  38%|███▊      | 457/1208 [13:10<21:39,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000421, train/loss_step=0.127, global_step=1322.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  38%|███▊      | 458/1208 [13:11<21:36,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000421, train/loss_step=0.127, global_step=1322.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  38%|███▊      | 458/1208 [13:11<21:36,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=0.000106, train/loss_step=0.0261, global_step=1322.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  38%|███▊      | 459/1208 [13:12<21:33,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=0.000106, train/loss_step=0.0261, global_step=1322.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  38%|███▊      | 459/1208 [13:12<21:33,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000171, train/loss_step=0.0457, global_step=1322.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  38%|███▊      | 460/1208 [13:15<21:34,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000171, train/loss_step=0.0457, global_step=1322.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  38%|███▊      | 460/1208 [13:15<21:34,  1.73s/it, loss=0.187, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00219, train/loss_step=0.380, global_step=1322.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  38%|███▊      | 461/1208 [13:16<21:31,  1.73s/it, loss=0.187, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00219, train/loss_step=0.380, global_step=1322.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  38%|███▊      | 461/1208 [13:16<21:31,  1.73s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0098, train/loss_vlb_step=4.61e-5, train/loss_step=0.0098, global_step=1323.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  38%|███▊      | 462/1208 [13:17<21:28,  1.73s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0098, train/loss_vlb_step=4.61e-5, train/loss_step=0.0098, global_step=1323.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  38%|███▊      | 462/1208 [13:17<21:28,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0867, train/loss_vlb_step=0.00029, train/loss_step=0.0867, global_step=1323.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  38%|███▊      | 463/1208 [13:18<21:25,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0867, train/loss_vlb_step=0.00029, train/loss_step=0.0867, global_step=1323.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  38%|███▊      | 463/1208 [13:18<21:25,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00436, train/loss_step=0.413, global_step=1323.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  38%|███▊      | 464/1208 [13:22<21:26,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00436, train/loss_step=0.413, global_step=1323.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  38%|███▊      | 464/1208 [13:22<21:26,  1.73s/it, loss=0.201, v_num=0, train/loss_simple_step=0.546, train/loss_vlb_step=0.0067, train/loss_step=0.546, global_step=1323.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  38%|███▊      | 465/1208 [13:23<21:23,  1.73s/it, loss=0.201, v_num=0, train/loss_simple_step=0.546, train/loss_vlb_step=0.0067, train/loss_step=0.546, global_step=1323.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  38%|███▊      | 465/1208 [13:23<21:23,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=8.04e-5, train/loss_step=0.0195, global_step=1324.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  39%|███▊      | 466/1208 [13:24<21:20,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=8.04e-5, train/loss_step=0.0195, global_step=1324.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  39%|███▊      | 466/1208 [13:24<21:20,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.38e-5, train/loss_step=0.0172, global_step=1324.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  39%|███▊      | 467/1208 [13:25<21:17,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.38e-5, train/loss_step=0.0172, global_step=1324.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  39%|███▊      | 467/1208 [13:25<21:17,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=1.13e-5, train/loss_step=0.00187, global_step=1324.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  39%|███▊      | 468/1208 [13:28<21:18,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=1.13e-5, train/loss_step=0.00187, global_step=1324.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  39%|███▊      | 468/1208 [13:28<21:18,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0576, train/loss_vlb_step=0.000203, train/loss_step=0.0576, global_step=1324.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  39%|███▉      | 469/1208 [13:29<21:15,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0576, train/loss_vlb_step=0.000203, train/loss_step=0.0576, global_step=1324.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  39%|███▉      | 469/1208 [13:29<21:15,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000109, train/loss_step=0.0265, global_step=1325.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  39%|███▉      | 470/1208 [13:30<21:12,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000109, train/loss_step=0.0265, global_step=1325.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  39%|███▉      | 470/1208 [13:30<21:12,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0549, train/loss_vlb_step=0.000187, train/loss_step=0.0549, global_step=1325.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  39%|███▉      | 471/1208 [13:31<21:10,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0549, train/loss_vlb_step=0.000187, train/loss_step=0.0549, global_step=1325.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  39%|███▉      | 471/1208 [13:31<21:10,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00751, train/loss_vlb_step=3.72e-5, train/loss_step=0.00751, global_step=1325.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  39%|███▉      | 472/1208 [13:35<21:10,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00751, train/loss_vlb_step=3.72e-5, train/loss_step=0.00751, global_step=1325.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  39%|███▉      | 472/1208 [13:35<21:10,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0458, train/loss_vlb_step=0.000166, train/loss_step=0.0458, global_step=1325.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  39%|███▉      | 473/1208 [13:36<21:08,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0458, train/loss_vlb_step=0.000166, train/loss_step=0.0458, global_step=1325.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  39%|███▉      | 473/1208 [13:36<21:08,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000394, train/loss_step=0.120, global_step=1326.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  39%|███▉      | 474/1208 [13:37<21:05,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000394, train/loss_step=0.120, global_step=1326.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  39%|███▉      | 474/1208 [13:37<21:05,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0836, train/loss_vlb_step=0.000276, train/loss_step=0.0836, global_step=1326.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  39%|███▉      | 475/1208 [13:38<21:02,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0836, train/loss_vlb_step=0.000276, train/loss_step=0.0836, global_step=1326.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  39%|███▉      | 475/1208 [13:38<21:02,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000501, train/loss_step=0.151, global_step=1326.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  39%|███▉      | 476/1208 [13:41<21:03,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000501, train/loss_step=0.151, global_step=1326.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  39%|███▉      | 476/1208 [13:41<21:03,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000575, train/loss_step=0.171, global_step=1326.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  39%|███▉      | 477/1208 [13:42<21:00,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000575, train/loss_step=0.171, global_step=1326.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  39%|███▉      | 477/1208 [13:42<21:00,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=1.08e-5, train/loss_step=0.00179, global_step=1327.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  40%|███▉      | 478/1208 [13:43<20:57,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=1.08e-5, train/loss_step=0.00179, global_step=1327.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  40%|███▉      | 478/1208 [13:43<20:57,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00176, train/loss_step=0.354, global_step=1327.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]     Epoch 4:  40%|███▉      | 479/1208 [13:44<20:54,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00176, train/loss_step=0.354, global_step=1327.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  40%|███▉      | 479/1208 [13:44<20:54,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0809, train/loss_vlb_step=0.00027, train/loss_step=0.0809, global_step=1327.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  40%|███▉      | 480/1208 [13:47<20:55,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0809, train/loss_vlb_step=0.00027, train/loss_step=0.0809, global_step=1327.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  40%|███▉      | 480/1208 [13:47<20:55,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000716, train/loss_step=0.205, global_step=1327.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  40%|███▉      | 481/1208 [13:48<20:52,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000716, train/loss_step=0.205, global_step=1327.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  40%|███▉      | 481/1208 [13:48<20:52,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00151, train/loss_step=0.335, global_step=1328.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  40%|███▉      | 482/1208 [13:49<20:49,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00151, train/loss_step=0.335, global_step=1328.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  40%|███▉      | 482/1208 [13:49<20:49,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00102, train/loss_step=0.273, global_step=1328.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  40%|███▉      | 483/1208 [13:50<20:47,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00102, train/loss_step=0.273, global_step=1328.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  40%|███▉      | 483/1208 [13:50<20:47,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.82e-5, train/loss_step=0.0107, global_step=1328.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  40%|████      | 484/1208 [13:54<20:47,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.82e-5, train/loss_step=0.0107, global_step=1328.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  40%|████      | 484/1208 [13:54<20:47,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.00044, train/loss_step=0.134, global_step=1328.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  40%|████      | 485/1208 [13:55<20:45,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.00044, train/loss_step=0.134, global_step=1328.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  40%|████      | 485/1208 [13:55<20:45,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00121, train/loss_step=0.264, global_step=1329.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  40%|████      | 486/1208 [13:56<20:42,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00121, train/loss_step=0.264, global_step=1329.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  40%|████      | 486/1208 [13:56<20:42,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00175, train/loss_step=0.310, global_step=1329.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  40%|████      | 487/1208 [13:57<20:39,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00175, train/loss_step=0.310, global_step=1329.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  40%|████      | 487/1208 [13:57<20:39,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0938, train/loss_vlb_step=0.000314, train/loss_step=0.0938, global_step=1329.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  40%|████      | 488/1208 [14:00<20:40,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0938, train/loss_vlb_step=0.000314, train/loss_step=0.0938, global_step=1329.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  40%|████      | 488/1208 [14:00<20:40,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000532, train/loss_step=0.153, global_step=1329.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  40%|████      | 489/1208 [14:01<20:37,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000532, train/loss_step=0.153, global_step=1329.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  40%|████      | 489/1208 [14:01<20:37,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00161, train/loss_step=0.311, global_step=1330.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  41%|████      | 490/1208 [14:02<20:34,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00161, train/loss_step=0.311, global_step=1330.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  41%|████      | 490/1208 [14:02<20:34,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00273, train/loss_step=0.427, global_step=1330.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  41%|████      | 491/1208 [14:03<20:32,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00273, train/loss_step=0.427, global_step=1330.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  41%|████      | 491/1208 [14:03<20:32,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=2.09e-5, train/loss_step=0.00388, global_step=1330.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  41%|████      | 492/1208 [14:06<20:32,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=2.09e-5, train/loss_step=0.00388, global_step=1330.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  41%|████      | 492/1208 [14:06<20:32,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0053, train/loss_vlb_step=2.76e-5, train/loss_step=0.0053, global_step=1330.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  41%|████      | 493/1208 [14:07<20:29,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0053, train/loss_vlb_step=2.76e-5, train/loss_step=0.0053, global_step=1330.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  41%|████      | 493/1208 [14:07<20:29,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000531, train/loss_step=0.160, global_step=1331.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  41%|████      | 494/1208 [14:08<20:27,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000531, train/loss_step=0.160, global_step=1331.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  41%|████      | 494/1208 [14:08<20:27,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.88e-5, train/loss_step=0.019, global_step=1331.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  41%|████      | 495/1208 [14:09<20:24,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.88e-5, train/loss_step=0.019, global_step=1331.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  41%|████      | 495/1208 [14:10<20:24,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0516, train/loss_vlb_step=0.000177, train/loss_step=0.0516, global_step=1331.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  41%|████      | 496/1208 [14:13<20:24,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0516, train/loss_vlb_step=0.000177, train/loss_step=0.0516, global_step=1331.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  41%|████      | 496/1208 [14:13<20:24,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000988, train/loss_step=0.250, global_step=1331.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  41%|████      | 497/1208 [14:14<20:22,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000988, train/loss_step=0.250, global_step=1331.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  41%|████      | 497/1208 [14:14<20:22,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=8.85e-5, train/loss_step=0.0211, global_step=1332.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  41%|████      | 498/1208 [14:15<20:19,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=8.85e-5, train/loss_step=0.0211, global_step=1332.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  41%|████      | 498/1208 [14:15<20:19,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00614, train/loss_vlb_step=3.03e-5, train/loss_step=0.00614, global_step=1332.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  41%|████▏     | 499/1208 [14:16<20:16,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00614, train/loss_vlb_step=3.03e-5, train/loss_step=0.00614, global_step=1332.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  41%|████▏     | 499/1208 [14:16<20:16,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0829, train/loss_vlb_step=0.000278, train/loss_step=0.0829, global_step=1332.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  41%|████▏     | 500/1208 [14:19<20:17,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0829, train/loss_vlb_step=0.000278, train/loss_step=0.0829, global_step=1332.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  41%|████▏     | 500/1208 [14:19<20:17,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000762, train/loss_step=0.189, global_step=1332.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  41%|████▏     | 501/1208 [14:20<20:14,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000762, train/loss_step=0.189, global_step=1332.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  41%|████▏     | 501/1208 [14:20<20:14,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.564, train/loss_vlb_step=0.00973, train/loss_step=0.564, global_step=1333.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  42%|████▏     | 502/1208 [14:21<20:11,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.564, train/loss_vlb_step=0.00973, train/loss_step=0.564, global_step=1333.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  42%|████▏     | 502/1208 [14:21<20:11,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.77e-5, train/loss_step=0.0219, global_step=1333.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  42%|████▏     | 503/1208 [14:22<20:09,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.77e-5, train/loss_step=0.0219, global_step=1333.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  42%|████▏     | 503/1208 [14:22<20:09,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00179, train/loss_step=0.322, global_step=1333.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  42%|████▏     | 504/1208 [14:26<20:09,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00179, train/loss_step=0.322, global_step=1333.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  42%|████▏     | 504/1208 [14:26<20:09,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00798, train/loss_vlb_step=3.81e-5, train/loss_step=0.00798, global_step=1333.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  42%|████▏     | 505/1208 [14:27<20:07,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00798, train/loss_vlb_step=3.81e-5, train/loss_step=0.00798, global_step=1333.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  42%|████▏     | 505/1208 [14:27<20:07,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.00074, train/loss_step=0.200, global_step=1334.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]     Epoch 4:  42%|████▏     | 506/1208 [14:28<20:04,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.00074, train/loss_step=0.200, global_step=1334.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  42%|████▏     | 506/1208 [14:28<20:04,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00427, train/loss_step=0.434, global_step=1334.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  42%|████▏     | 507/1208 [14:29<20:01,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00427, train/loss_step=0.434, global_step=1334.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  42%|████▏     | 507/1208 [14:29<20:01,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.58e-5, train/loss_step=0.0238, global_step=1334.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  42%|████▏     | 508/1208 [14:32<20:02,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.58e-5, train/loss_step=0.0238, global_step=1334.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  42%|████▏     | 508/1208 [14:32<20:02,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000873, train/loss_step=0.222, global_step=1334.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  42%|████▏     | 509/1208 [14:33<19:59,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000873, train/loss_step=0.222, global_step=1334.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  42%|████▏     | 509/1208 [14:33<19:59,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0834, train/loss_vlb_step=0.000278, train/loss_step=0.0834, global_step=1335.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  42%|████▏     | 510/1208 [14:34<19:56,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0834, train/loss_vlb_step=0.000278, train/loss_step=0.0834, global_step=1335.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  42%|████▏     | 510/1208 [14:34<19:56,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.31e-5, train/loss_step=0.0196, global_step=1335.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  42%|████▏     | 511/1208 [14:35<19:54,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.31e-5, train/loss_step=0.0196, global_step=1335.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  42%|████▏     | 511/1208 [14:35<19:54,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000103, train/loss_step=0.0262, global_step=1335.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  42%|████▏     | 512/1208 [14:38<19:54,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000103, train/loss_step=0.0262, global_step=1335.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  42%|████▏     | 512/1208 [14:38<19:54,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000918, train/loss_step=0.229, global_step=1335.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  42%|████▏     | 513/1208 [14:39<19:51,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000918, train/loss_step=0.229, global_step=1335.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  42%|████▏     | 513/1208 [14:39<19:51,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0404, train/loss_vlb_step=0.000148, train/loss_step=0.0404, global_step=1336.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  43%|████▎     | 514/1208 [14:40<19:49,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0404, train/loss_vlb_step=0.000148, train/loss_step=0.0404, global_step=1336.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  43%|████▎     | 514/1208 [14:40<19:49,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.15e-5, train/loss_step=0.0199, global_step=1336.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  43%|████▎     | 515/1208 [14:41<19:46,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.15e-5, train/loss_step=0.0199, global_step=1336.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  43%|████▎     | 515/1208 [14:41<19:46,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00198, train/loss_step=0.303, global_step=1336.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  43%|████▎     | 516/1208 [14:45<19:47,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00198, train/loss_step=0.303, global_step=1336.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  43%|████▎     | 516/1208 [14:45<19:47,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.504, train/loss_vlb_step=0.00558, train/loss_step=0.504, global_step=1336.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  43%|████▎     | 517/1208 [14:46<19:44,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.504, train/loss_vlb_step=0.00558, train/loss_step=0.504, global_step=1336.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  43%|████▎     | 517/1208 [14:46<19:44,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00102, train/loss_step=0.258, global_step=1337.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  43%|████▎     | 518/1208 [14:47<19:41,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00102, train/loss_step=0.258, global_step=1337.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  43%|████▎     | 518/1208 [14:47<19:41,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00577, train/loss_vlb_step=3.06e-5, train/loss_step=0.00577, global_step=1337.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  43%|████▎     | 519/1208 [14:48<19:39,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00577, train/loss_vlb_step=3.06e-5, train/loss_step=0.00577, global_step=1337.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  43%|████▎     | 519/1208 [14:48<19:39,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00552, train/loss_vlb_step=2.86e-5, train/loss_step=0.00552, global_step=1337.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  43%|████▎     | 520/1208 [14:51<19:39,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00552, train/loss_vlb_step=2.86e-5, train/loss_step=0.00552, global_step=1337.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  43%|████▎     | 520/1208 [14:51<19:39,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=0.000101, train/loss_step=0.0251, global_step=1337.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  43%|████▎     | 521/1208 [14:52<19:37,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=0.000101, train/loss_step=0.0251, global_step=1337.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  43%|████▎     | 521/1208 [14:52<19:37,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000473, train/loss_step=0.143, global_step=1338.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  43%|████▎     | 522/1208 [14:53<19:34,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000473, train/loss_step=0.143, global_step=1338.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  43%|████▎     | 522/1208 [14:53<19:34,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00565, train/loss_vlb_step=2.87e-5, train/loss_step=0.00565, global_step=1338.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  43%|████▎     | 523/1208 [14:54<19:31,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00565, train/loss_vlb_step=2.87e-5, train/loss_step=0.00565, global_step=1338.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  43%|████▎     | 523/1208 [14:54<19:31,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00122, train/loss_step=0.274, global_step=1338.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  43%|████▎     | 524/1208 [14:58<19:32,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00122, train/loss_step=0.274, global_step=1338.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  43%|████▎     | 524/1208 [14:58<19:32,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000151, train/loss_step=0.042, global_step=1338.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  43%|████▎     | 525/1208 [14:59<19:29,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000151, train/loss_step=0.042, global_step=1338.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  43%|████▎     | 525/1208 [14:59<19:29,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000871, train/loss_step=0.238, global_step=1339.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  44%|████▎     | 526/1208 [15:00<19:27,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000871, train/loss_step=0.238, global_step=1339.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  44%|████▎     | 526/1208 [15:00<19:27,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.000131, train/loss_step=0.0351, global_step=1339.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  44%|████▎     | 527/1208 [15:01<19:24,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.000131, train/loss_step=0.0351, global_step=1339.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  44%|████▎     | 527/1208 [15:01<19:24,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00103, train/loss_step=0.255, global_step=1339.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  44%|████▎     | 528/1208 [15:04<19:24,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00103, train/loss_step=0.255, global_step=1339.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  44%|████▎     | 528/1208 [15:04<19:24,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.24e-5, train/loss_step=0.0171, global_step=1339.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  44%|████▍     | 529/1208 [15:05<19:22,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.24e-5, train/loss_step=0.0171, global_step=1339.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  44%|████▍     | 529/1208 [15:05<19:22,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000629, train/loss_step=0.181, global_step=1340.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  44%|████▍     | 530/1208 [15:06<19:19,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000629, train/loss_step=0.181, global_step=1340.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  44%|████▍     | 530/1208 [15:06<19:19,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00112, train/loss_step=0.253, global_step=1340.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  44%|████▍     | 531/1208 [15:07<19:17,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00112, train/loss_step=0.253, global_step=1340.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  44%|████▍     | 531/1208 [15:07<19:17,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000952, train/loss_step=0.242, global_step=1340.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  44%|████▍     | 532/1208 [15:10<19:17,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000952, train/loss_step=0.242, global_step=1340.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  44%|████▍     | 532/1208 [15:10<19:17,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.630, train/loss_vlb_step=0.010, train/loss_step=0.630, global_step=1340.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  44%|████▍     | 533/1208 [15:11<19:14,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.630, train/loss_vlb_step=0.010, train/loss_step=0.630, global_step=1340.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  44%|████▍     | 533/1208 [15:11<19:14,  1.71s/it, loss=0.193, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00328, train/loss_step=0.413, global_step=1341.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  44%|████▍     | 534/1208 [15:12<19:12,  1.71s/it, loss=0.193, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00328, train/loss_step=0.413, global_step=1341.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  44%|████▍     | 534/1208 [15:12<19:12,  1.71s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.28e-5, train/loss_step=0.0229, global_step=1341.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  44%|████▍     | 535/1208 [15:13<19:09,  1.71s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.28e-5, train/loss_step=0.0229, global_step=1341.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  44%|████▍     | 535/1208 [15:13<19:09,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.89e-5, train/loss_step=0.0124, global_step=1341.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  44%|████▍     | 536/1208 [15:17<19:09,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.89e-5, train/loss_step=0.0124, global_step=1341.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  44%|████▍     | 536/1208 [15:17<19:09,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00167, train/loss_step=0.327, global_step=1341.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  44%|████▍     | 537/1208 [15:18<19:07,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00167, train/loss_step=0.327, global_step=1341.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  44%|████▍     | 537/1208 [15:18<19:07,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000926, train/loss_step=0.240, global_step=1342.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  45%|████▍     | 538/1208 [15:19<19:04,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000926, train/loss_step=0.240, global_step=1342.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  45%|████▍     | 538/1208 [15:19<19:04,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0701, train/loss_vlb_step=0.000238, train/loss_step=0.0701, global_step=1342.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  45%|████▍     | 539/1208 [15:20<19:02,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0701, train/loss_vlb_step=0.000238, train/loss_step=0.0701, global_step=1342.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  45%|████▍     | 539/1208 [15:20<19:02,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=2e-5, train/loss_step=0.00362, global_step=1342.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  45%|████▍     | 540/1208 [15:23<19:02,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=2e-5, train/loss_step=0.00362, global_step=1342.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  45%|████▍     | 540/1208 [15:23<19:02,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.9e-5, train/loss_step=0.00331, global_step=1342.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  45%|████▍     | 541/1208 [15:24<18:59,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.9e-5, train/loss_step=0.00331, global_step=1342.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  45%|████▍     | 541/1208 [15:24<18:59,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0536, train/loss_vlb_step=0.000189, train/loss_step=0.0536, global_step=1343.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  45%|████▍     | 542/1208 [15:25<18:57,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0536, train/loss_vlb_step=0.000189, train/loss_step=0.0536, global_step=1343.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  45%|████▍     | 542/1208 [15:25<18:57,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000157, train/loss_step=0.0416, global_step=1343.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  45%|████▍     | 543/1208 [15:26<18:54,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000157, train/loss_step=0.0416, global_step=1343.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  45%|████▍     | 543/1208 [15:26<18:54,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.31e-5, train/loss_step=0.0147, global_step=1343.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  45%|████▌     | 544/1208 [15:29<18:55,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.31e-5, train/loss_step=0.0147, global_step=1343.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  45%|████▌     | 544/1208 [15:29<18:55,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.0011, train/loss_step=0.250, global_step=1343.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  45%|████▌     | 545/1208 [15:30<18:52,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.0011, train/loss_step=0.250, global_step=1343.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  45%|████▌     | 545/1208 [15:30<18:52,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.416, train/loss_vlb_step=0.00313, train/loss_step=0.416, global_step=1344.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  45%|████▌     | 546/1208 [15:31<18:49,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.416, train/loss_vlb_step=0.00313, train/loss_step=0.416, global_step=1344.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  45%|████▌     | 546/1208 [15:31<18:49,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00219, train/loss_step=0.385, global_step=1344.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  45%|████▌     | 547/1208 [15:32<18:47,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00219, train/loss_step=0.385, global_step=1344.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  45%|████▌     | 547/1208 [15:32<18:47,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000112, train/loss_step=0.0297, global_step=1344.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  45%|████▌     | 548/1208 [15:36<18:47,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000112, train/loss_step=0.0297, global_step=1344.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  45%|████▌     | 548/1208 [15:36<18:47,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00134, train/loss_step=0.248, global_step=1344.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  45%|████▌     | 549/1208 [15:37<18:45,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00134, train/loss_step=0.248, global_step=1344.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  45%|████▌     | 549/1208 [15:37<18:45,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.59e-5, train/loss_step=0.00268, global_step=1345.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  46%|████▌     | 550/1208 [15:38<18:42,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.59e-5, train/loss_step=0.00268, global_step=1345.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  46%|████▌     | 550/1208 [15:38<18:42,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.073, train/loss_vlb_step=0.000247, train/loss_step=0.073, global_step=1345.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  46%|████▌     | 551/1208 [15:39<18:40,  1.70s/it, loss=0.174, v_num=0, train/loss_simple_step=0.073, train/loss_vlb_step=0.000247, train/loss_step=0.073, global_step=1345.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  46%|████▌     | 551/1208 [15:39<18:40,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.00034, train/loss_step=0.102, global_step=1345.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  46%|████▌     | 552/1208 [15:42<18:40,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.00034, train/loss_step=0.102, global_step=1345.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  46%|████▌     | 552/1208 [15:42<18:40,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.25e-5, train/loss_step=0.0163, global_step=1345.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  46%|████▌     | 553/1208 [15:43<18:37,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.25e-5, train/loss_step=0.0163, global_step=1345.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  46%|████▌     | 553/1208 [15:43<18:37,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000696, train/loss_step=0.187, global_step=1346.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  46%|████▌     | 554/1208 [15:44<18:35,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000696, train/loss_step=0.187, global_step=1346.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  46%|████▌     | 554/1208 [15:44<18:35,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00265, train/loss_step=0.376, global_step=1346.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  46%|████▌     | 555/1208 [15:45<18:32,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00265, train/loss_step=0.376, global_step=1346.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  46%|████▌     | 555/1208 [15:45<18:32,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.72e-5, train/loss_step=0.00305, global_step=1346.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  46%|████▌     | 556/1208 [15:48<18:32,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.72e-5, train/loss_step=0.00305, global_step=1346.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  46%|████▌     | 556/1208 [15:48<18:32,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000483, train/loss_step=0.147, global_step=1346.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  46%|████▌     | 557/1208 [15:49<18:30,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000483, train/loss_step=0.147, global_step=1346.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  46%|████▌     | 557/1208 [15:49<18:30,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.000973, train/loss_step=0.258, global_step=1347.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  46%|████▌     | 558/1208 [15:51<18:27,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.000973, train/loss_step=0.258, global_step=1347.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  46%|████▌     | 558/1208 [15:51<18:27,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000494, train/loss_step=0.149, global_step=1347.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  46%|████▋     | 559/1208 [15:52<18:25,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000494, train/loss_step=0.149, global_step=1347.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  46%|████▋     | 559/1208 [15:52<18:25,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6.08e-5, train/loss_step=0.0135, global_step=1347.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  46%|████▋     | 560/1208 [15:55<18:25,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6.08e-5, train/loss_step=0.0135, global_step=1347.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  46%|████▋     | 560/1208 [15:55<18:25,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.55e-5, train/loss_step=0.0124, global_step=1347.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  46%|████▋     | 561/1208 [15:56<18:22,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.55e-5, train/loss_step=0.0124, global_step=1347.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  46%|████▋     | 561/1208 [15:56<18:22,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000421, train/loss_step=0.127, global_step=1348.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  47%|████▋     | 562/1208 [15:57<18:20,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000421, train/loss_step=0.127, global_step=1348.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  47%|████▋     | 562/1208 [15:57<18:20,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000669, train/loss_step=0.190, global_step=1348.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  47%|████▋     | 563/1208 [15:58<18:18,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000669, train/loss_step=0.190, global_step=1348.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  47%|████▋     | 563/1208 [15:58<18:18,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.040, train/loss_vlb_step=0.000149, train/loss_step=0.040, global_step=1348.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  47%|████▋     | 564/1208 [16:01<18:18,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.040, train/loss_vlb_step=0.000149, train/loss_step=0.040, global_step=1348.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  47%|████▋     | 564/1208 [16:01<18:18,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.0011, train/loss_step=0.262, global_step=1348.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  47%|████▋     | 565/1208 [16:02<18:15,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.0011, train/loss_step=0.262, global_step=1348.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  47%|████▋     | 565/1208 [16:02<18:15,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00127, train/loss_step=0.291, global_step=1349.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  47%|████▋     | 566/1208 [16:03<18:13,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00127, train/loss_step=0.291, global_step=1349.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  47%|████▋     | 566/1208 [16:03<18:13,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000682, train/loss_step=0.190, global_step=1349.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  47%|████▋     | 567/1208 [16:04<18:10,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000682, train/loss_step=0.190, global_step=1349.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  47%|████▋     | 567/1208 [16:04<18:10,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000111, train/loss_step=0.0297, global_step=1349.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  47%|████▋     | 568/1208 [16:08<18:10,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000111, train/loss_step=0.0297, global_step=1349.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  47%|████▋     | 568/1208 [16:08<18:10,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.75e-5, train/loss_step=0.0213, global_step=1349.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  47%|████▋     | 569/1208 [16:09<18:08,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.75e-5, train/loss_step=0.0213, global_step=1349.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  47%|████▋     | 569/1208 [16:09<18:08,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.410, train/loss_vlb_step=0.00295, train/loss_step=0.410, global_step=1350.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  47%|████▋     | 570/1208 [16:10<18:05,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.410, train/loss_vlb_step=0.00295, train/loss_step=0.410, global_step=1350.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  47%|████▋     | 570/1208 [16:10<18:05,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.068, train/loss_vlb_step=0.000224, train/loss_step=0.068, global_step=1350.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  47%|████▋     | 571/1208 [16:11<18:03,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.068, train/loss_vlb_step=0.000224, train/loss_step=0.068, global_step=1350.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  47%|████▋     | 571/1208 [16:11<18:03,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.000129, train/loss_step=0.0326, global_step=1350.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  47%|████▋     | 572/1208 [16:14<18:03,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.000129, train/loss_step=0.0326, global_step=1350.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  47%|████▋     | 572/1208 [16:14<18:03,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000171, train/loss_step=0.0478, global_step=1350.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  47%|████▋     | 573/1208 [16:15<18:01,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000171, train/loss_step=0.0478, global_step=1350.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  47%|████▋     | 573/1208 [16:15<18:01,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.2e-5, train/loss_step=0.0108, global_step=1351.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  48%|████▊     | 574/1208 [16:16<17:58,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.2e-5, train/loss_step=0.0108, global_step=1351.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  48%|████▊     | 574/1208 [16:16<17:58,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7.51e-5, train/loss_step=0.0165, global_step=1351.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  48%|████▊     | 575/1208 [16:17<17:56,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7.51e-5, train/loss_step=0.0165, global_step=1351.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  48%|████▊     | 575/1208 [16:17<17:56,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00225, train/loss_step=0.384, global_step=1351.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  48%|████▊     | 576/1208 [16:20<17:56,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00225, train/loss_step=0.384, global_step=1351.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  48%|████▊     | 576/1208 [16:20<17:56,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0586, train/loss_vlb_step=0.000205, train/loss_step=0.0586, global_step=1351.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  48%|████▊     | 577/1208 [16:21<17:53,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0586, train/loss_vlb_step=0.000205, train/loss_step=0.0586, global_step=1351.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  48%|████▊     | 577/1208 [16:21<17:53,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0541, train/loss_vlb_step=0.000191, train/loss_step=0.0541, global_step=1352.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  48%|████▊     | 578/1208 [16:22<17:51,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0541, train/loss_vlb_step=0.000191, train/loss_step=0.0541, global_step=1352.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  48%|████▊     | 578/1208 [16:22<17:51,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000814, train/loss_step=0.216, global_step=1352.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  48%|████▊     | 579/1208 [16:23<17:48,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000814, train/loss_step=0.216, global_step=1352.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  48%|████▊     | 579/1208 [16:23<17:48,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000454, train/loss_step=0.138, global_step=1352.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  48%|████▊     | 580/1208 [16:27<17:48,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000454, train/loss_step=0.138, global_step=1352.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  48%|████▊     | 580/1208 [16:27<17:48,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0506, train/loss_vlb_step=0.000183, train/loss_step=0.0506, global_step=1352.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  48%|████▊     | 581/1208 [16:28<17:46,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0506, train/loss_vlb_step=0.000183, train/loss_step=0.0506, global_step=1352.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  48%|████▊     | 581/1208 [16:28<17:46,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000188, train/loss_step=0.0524, global_step=1353.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  48%|████▊     | 582/1208 [16:29<17:44,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000188, train/loss_step=0.0524, global_step=1353.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  48%|████▊     | 582/1208 [16:29<17:44,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00589, train/loss_vlb_step=3.04e-5, train/loss_step=0.00589, global_step=1353.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  48%|████▊     | 583/1208 [16:30<17:41,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00589, train/loss_vlb_step=3.04e-5, train/loss_step=0.00589, global_step=1353.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  48%|████▊     | 583/1208 [16:30<17:41,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00241, train/loss_step=0.370, global_step=1353.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  48%|████▊     | 584/1208 [16:33<17:41,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00241, train/loss_step=0.370, global_step=1353.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  48%|████▊     | 584/1208 [16:33<17:41,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000794, train/loss_step=0.208, global_step=1353.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  48%|████▊     | 585/1208 [16:34<17:39,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000794, train/loss_step=0.208, global_step=1353.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  48%|████▊     | 585/1208 [16:34<17:39,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.00071, train/loss_step=0.194, global_step=1354.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  49%|████▊     | 586/1208 [16:35<17:36,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.00071, train/loss_step=0.194, global_step=1354.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  49%|████▊     | 586/1208 [16:35<17:36,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0807, train/loss_vlb_step=0.000265, train/loss_step=0.0807, global_step=1354.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  49%|████▊     | 587/1208 [16:36<17:34,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0807, train/loss_vlb_step=0.000265, train/loss_step=0.0807, global_step=1354.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  49%|████▊     | 587/1208 [16:36<17:34,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.448, train/loss_vlb_step=0.00512, train/loss_step=0.448, global_step=1354.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  49%|████▊     | 588/1208 [16:39<17:34,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.448, train/loss_vlb_step=0.00512, train/loss_step=0.448, global_step=1354.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  49%|████▊     | 588/1208 [16:39<17:34,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0518, train/loss_vlb_step=0.000189, train/loss_step=0.0518, global_step=1354.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  49%|████▉     | 589/1208 [16:41<17:32,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0518, train/loss_vlb_step=0.000189, train/loss_step=0.0518, global_step=1354.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  49%|████▉     | 589/1208 [16:41<17:32,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0096, train/loss_vlb_step=4.83e-5, train/loss_step=0.0096, global_step=1355.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  49%|████▉     | 590/1208 [16:42<17:29,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0096, train/loss_vlb_step=4.83e-5, train/loss_step=0.0096, global_step=1355.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  49%|████▉     | 590/1208 [16:42<17:29,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000712, train/loss_step=0.195, global_step=1355.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  49%|████▉     | 591/1208 [16:43<17:27,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000712, train/loss_step=0.195, global_step=1355.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  49%|████▉     | 591/1208 [16:43<17:27,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.00036, train/loss_step=0.109, global_step=1355.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  49%|████▉     | 592/1208 [16:46<17:27,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.00036, train/loss_step=0.109, global_step=1355.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  49%|████▉     | 592/1208 [16:46<17:27,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00132, train/loss_step=0.303, global_step=1355.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  49%|████▉     | 593/1208 [16:47<17:24,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00132, train/loss_step=0.303, global_step=1355.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  49%|████▉     | 593/1208 [16:47<17:24,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0725, train/loss_vlb_step=0.000239, train/loss_step=0.0725, global_step=1356.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  49%|████▉     | 594/1208 [16:48<17:22,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0725, train/loss_vlb_step=0.000239, train/loss_step=0.0725, global_step=1356.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  49%|████▉     | 594/1208 [16:48<17:22,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00665, train/loss_vlb_step=3.37e-5, train/loss_step=0.00665, global_step=1356.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  49%|████▉     | 595/1208 [16:49<17:20,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00665, train/loss_vlb_step=3.37e-5, train/loss_step=0.00665, global_step=1356.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  49%|████▉     | 595/1208 [16:49<17:20,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000115, train/loss_step=0.0297, global_step=1356.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  49%|████▉     | 596/1208 [16:52<17:19,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000115, train/loss_step=0.0297, global_step=1356.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  49%|████▉     | 596/1208 [16:52<17:19,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0561, train/loss_vlb_step=0.000192, train/loss_step=0.0561, global_step=1356.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  49%|████▉     | 597/1208 [16:53<17:17,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0561, train/loss_vlb_step=0.000192, train/loss_step=0.0561, global_step=1356.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  49%|████▉     | 597/1208 [16:53<17:17,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00105, train/loss_step=0.270, global_step=1357.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  50%|████▉     | 598/1208 [16:54<17:15,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00105, train/loss_step=0.270, global_step=1357.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  50%|████▉     | 598/1208 [16:54<17:15,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000507, train/loss_step=0.151, global_step=1357.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  50%|████▉     | 599/1208 [16:55<17:12,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000507, train/loss_step=0.151, global_step=1357.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  50%|████▉     | 599/1208 [16:55<17:12,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=1357.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  50%|████▉     | 600/1208 [16:59<17:12,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=1357.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  50%|████▉     | 600/1208 [16:59<17:12,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000467, train/loss_step=0.137, global_step=1357.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.73it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.74it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.75it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.75it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.75it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.76it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.76it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.76it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.76it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.76it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.77it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.75it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.75it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.75it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.75it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.75it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.75it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 4:  50%|████▉     | 601/1208 [17:29<17:40,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000467, train/loss_step=0.137, global_step=1357.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  50%|████▉     | 601/1208 [17:29<17:40,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.3e-5, train/loss_step=0.00218, global_step=1358.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  50%|████▉     | 602/1208 [17:30<17:37,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.3e-5, train/loss_step=0.00218, global_step=1358.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  50%|████▉     | 602/1208 [17:30<17:37,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00661, train/loss_vlb_step=3.28e-5, train/loss_step=0.00661, global_step=1358.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  50%|████▉     | 603/1208 [17:31<17:35,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00661, train/loss_vlb_step=3.28e-5, train/loss_step=0.00661, global_step=1358.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  50%|████▉     | 603/1208 [17:31<17:35,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0743, train/loss_vlb_step=0.000252, train/loss_step=0.0743, global_step=1358.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  50%|█████     | 604/1208 [17:34<17:34,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0743, train/loss_vlb_step=0.000252, train/loss_step=0.0743, global_step=1358.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  50%|█████     | 604/1208 [17:34<17:34,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00383, train/loss_vlb_step=2.18e-5, train/loss_step=0.00383, global_step=1358.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  50%|█████     | 605/1208 [17:35<17:32,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00383, train/loss_vlb_step=2.18e-5, train/loss_step=0.00383, global_step=1358.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  50%|█████     | 605/1208 [17:35<17:32,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000794, train/loss_step=0.221, global_step=1359.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  50%|█████     | 606/1208 [17:37<17:30,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000794, train/loss_step=0.221, global_step=1359.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  50%|█████     | 606/1208 [17:37<17:30,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.387, train/loss_vlb_step=0.0023, train/loss_step=0.387, global_step=1359.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  50%|█████     | 607/1208 [17:38<17:27,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.387, train/loss_vlb_step=0.0023, train/loss_step=0.387, global_step=1359.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  50%|█████     | 607/1208 [17:38<17:27,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0905, train/loss_vlb_step=0.000304, train/loss_step=0.0905, global_step=1359.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  50%|█████     | 608/1208 [17:41<17:27,  1.75s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0905, train/loss_vlb_step=0.000304, train/loss_step=0.0905, global_step=1359.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  50%|█████     | 608/1208 [17:41<17:27,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00113, train/loss_step=0.269, global_step=1359.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  50%|█████     | 609/1208 [17:42<17:24,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00113, train/loss_step=0.269, global_step=1359.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  50%|█████     | 609/1208 [17:42<17:24,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.558, train/loss_vlb_step=0.00964, train/loss_step=0.558, global_step=1360.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  50%|█████     | 610/1208 [17:43<17:22,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.558, train/loss_vlb_step=0.00964, train/loss_step=0.558, global_step=1360.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  50%|█████     | 610/1208 [17:43<17:22,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.000147, train/loss_step=0.0393, global_step=1360.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  51%|█████     | 611/1208 [17:44<17:20,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.000147, train/loss_step=0.0393, global_step=1360.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  51%|█████     | 611/1208 [17:44<17:20,  1.74s/it, loss=0.173, v_num=0, train/loss_simple_step=0.686, train/loss_vlb_step=0.0183, train/loss_step=0.686, global_step=1360.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  51%|█████     | 612/1208 [17:47<17:19,  1.74s/it, loss=0.173, v_num=0, train/loss_simple_step=0.686, train/loss_vlb_step=0.0183, train/loss_step=0.686, global_step=1360.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  51%|█████     | 612/1208 [17:47<17:19,  1.74s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.000136, train/loss_step=0.0356, global_step=1360.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  51%|█████     | 613/1208 [17:48<17:17,  1.74s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.000136, train/loss_step=0.0356, global_step=1360.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  51%|█████     | 613/1208 [17:48<17:17,  1.74s/it, loss=0.165, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000611, train/loss_step=0.176, global_step=1361.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  51%|█████     | 614/1208 [17:49<17:14,  1.74s/it, loss=0.165, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000611, train/loss_step=0.176, global_step=1361.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  51%|█████     | 614/1208 [17:49<17:14,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000136, train/loss_step=0.0361, global_step=1361.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  51%|█████     | 615/1208 [17:50<17:12,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000136, train/loss_step=0.0361, global_step=1361.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  51%|█████     | 615/1208 [17:50<17:12,  1.74s/it, loss=0.18, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00117, train/loss_step=0.294, global_step=1361.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  51%|█████     | 616/1208 [17:54<17:12,  1.74s/it, loss=0.18, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00117, train/loss_step=0.294, global_step=1361.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  51%|█████     | 616/1208 [17:54<17:12,  1.74s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.73e-5, train/loss_step=0.0101, global_step=1361.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  51%|█████     | 617/1208 [17:55<17:09,  1.74s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.73e-5, train/loss_step=0.0101, global_step=1361.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  51%|█████     | 617/1208 [17:55<17:09,  1.74s/it, loss=0.177, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00125, train/loss_step=0.270, global_step=1362.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  51%|█████     | 618/1208 [17:56<17:07,  1.74s/it, loss=0.177, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00125, train/loss_step=0.270, global_step=1362.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  51%|█████     | 618/1208 [17:56<17:07,  1.74s/it, loss=0.182, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000923, train/loss_step=0.235, global_step=1362.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  51%|█████     | 619/1208 [17:57<17:05,  1.74s/it, loss=0.182, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000923, train/loss_step=0.235, global_step=1362.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  51%|█████     | 619/1208 [17:57<17:05,  1.74s/it, loss=0.194, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00164, train/loss_step=0.340, global_step=1362.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  51%|█████▏    | 620/1208 [18:00<17:04,  1.74s/it, loss=0.194, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00164, train/loss_step=0.340, global_step=1362.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  51%|█████▏    | 620/1208 [18:00<17:04,  1.74s/it, loss=0.226, v_num=0, train/loss_simple_step=0.787, train/loss_vlb_step=0.0295, train/loss_step=0.787, global_step=1362.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  51%|█████▏    | 621/1208 [18:01<17:02,  1.74s/it, loss=0.226, v_num=0, train/loss_simple_step=0.787, train/loss_vlb_step=0.0295, train/loss_step=0.787, global_step=1362.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  51%|█████▏    | 621/1208 [18:01<17:02,  1.74s/it, loss=0.226, v_num=0, train/loss_simple_step=0.00812, train/loss_vlb_step=3.69e-5, train/loss_step=0.00812, global_step=1363.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  51%|█████▏    | 622/1208 [18:02<16:59,  1.74s/it, loss=0.226, v_num=0, train/loss_simple_step=0.00812, train/loss_vlb_step=3.69e-5, train/loss_step=0.00812, global_step=1363.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  51%|█████▏    | 622/1208 [18:02<16:59,  1.74s/it, loss=0.243, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00206, train/loss_step=0.336, global_step=1363.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  52%|█████▏    | 623/1208 [18:03<16:57,  1.74s/it, loss=0.243, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00206, train/loss_step=0.336, global_step=1363.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  52%|█████▏    | 623/1208 [18:03<16:57,  1.74s/it, loss=0.241, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000171, train/loss_step=0.0449, global_step=1363.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  52%|█████▏    | 624/1208 [18:06<16:57,  1.74s/it, loss=0.241, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000171, train/loss_step=0.0449, global_step=1363.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  52%|█████▏    | 624/1208 [18:06<16:57,  1.74s/it, loss=0.255, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00139, train/loss_step=0.281, global_step=1363.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  52%|█████▏    | 625/1208 [18:07<16:54,  1.74s/it, loss=0.255, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00139, train/loss_step=0.281, global_step=1363.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  52%|█████▏    | 625/1208 [18:07<16:54,  1.74s/it, loss=0.244, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.62e-5, train/loss_step=0.00274, global_step=1364.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  52%|█████▏    | 626/1208 [18:08<16:52,  1.74s/it, loss=0.244, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.62e-5, train/loss_step=0.00274, global_step=1364.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  52%|█████▏    | 626/1208 [18:08<16:52,  1.74s/it, loss=0.24, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00142, train/loss_step=0.302, global_step=1364.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]     Epoch 4:  52%|█████▏    | 627/1208 [18:09<16:49,  1.74s/it, loss=0.24, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00142, train/loss_step=0.302, global_step=1364.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  52%|█████▏    | 627/1208 [18:09<16:49,  1.74s/it, loss=0.237, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.54e-5, train/loss_step=0.0203, global_step=1364.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  52%|█████▏    | 628/1208 [18:13<16:49,  1.74s/it, loss=0.237, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.54e-5, train/loss_step=0.0203, global_step=1364.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  52%|█████▏    | 628/1208 [18:13<16:49,  1.74s/it, loss=0.228, v_num=0, train/loss_simple_step=0.0972, train/loss_vlb_step=0.00032, train/loss_step=0.0972, global_step=1364.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  52%|█████▏    | 629/1208 [18:14<16:47,  1.74s/it, loss=0.228, v_num=0, train/loss_simple_step=0.0972, train/loss_vlb_step=0.00032, train/loss_step=0.0972, global_step=1364.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  52%|█████▏    | 629/1208 [18:14<16:47,  1.74s/it, loss=0.21, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000701, train/loss_step=0.190, global_step=1365.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  52%|█████▏    | 630/1208 [18:15<16:44,  1.74s/it, loss=0.21, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000701, train/loss_step=0.190, global_step=1365.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  52%|█████▏    | 630/1208 [18:15<16:44,  1.74s/it, loss=0.211, v_num=0, train/loss_simple_step=0.063, train/loss_vlb_step=0.000214, train/loss_step=0.063, global_step=1365.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  52%|█████▏    | 631/1208 [18:16<16:42,  1.74s/it, loss=0.211, v_num=0, train/loss_simple_step=0.063, train/loss_vlb_step=0.000214, train/loss_step=0.063, global_step=1365.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  52%|█████▏    | 631/1208 [18:16<16:42,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000339, train/loss_step=0.100, global_step=1365.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  52%|█████▏    | 632/1208 [18:19<16:42,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000339, train/loss_step=0.100, global_step=1365.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  52%|█████▏    | 632/1208 [18:19<16:42,  1.74s/it, loss=0.191, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000898, train/loss_step=0.230, global_step=1365.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  52%|█████▏    | 633/1208 [18:20<16:39,  1.74s/it, loss=0.191, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000898, train/loss_step=0.230, global_step=1365.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  52%|█████▏    | 633/1208 [18:20<16:39,  1.74s/it, loss=0.205, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.00399, train/loss_step=0.450, global_step=1366.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  52%|█████▏    | 634/1208 [18:21<16:37,  1.74s/it, loss=0.205, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.00399, train/loss_step=0.450, global_step=1366.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  52%|█████▏    | 634/1208 [18:21<16:37,  1.74s/it, loss=0.214, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000894, train/loss_step=0.210, global_step=1366.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  53%|█████▎    | 635/1208 [18:22<16:34,  1.74s/it, loss=0.214, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000894, train/loss_step=0.210, global_step=1366.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  53%|█████▎    | 635/1208 [18:22<16:34,  1.74s/it, loss=0.211, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000943, train/loss_step=0.239, global_step=1366.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  53%|█████▎    | 636/1208 [18:25<16:34,  1.74s/it, loss=0.211, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000943, train/loss_step=0.239, global_step=1366.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  53%|█████▎    | 636/1208 [18:25<16:34,  1.74s/it, loss=0.22, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000686, train/loss_step=0.184, global_step=1366.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  53%|█████▎    | 637/1208 [18:26<16:32,  1.74s/it, loss=0.22, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000686, train/loss_step=0.184, global_step=1366.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  53%|█████▎    | 637/1208 [18:26<16:32,  1.74s/it, loss=0.211, v_num=0, train/loss_simple_step=0.089, train/loss_vlb_step=0.000296, train/loss_step=0.089, global_step=1367.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  53%|█████▎    | 638/1208 [18:27<16:29,  1.74s/it, loss=0.211, v_num=0, train/loss_simple_step=0.089, train/loss_vlb_step=0.000296, train/loss_step=0.089, global_step=1367.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  53%|█████▎    | 638/1208 [18:27<16:29,  1.74s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0789, train/loss_vlb_step=0.00026, train/loss_step=0.0789, global_step=1367.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  53%|█████▎    | 639/1208 [18:29<16:27,  1.74s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0789, train/loss_vlb_step=0.00026, train/loss_step=0.0789, global_step=1367.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  53%|█████▎    | 639/1208 [18:29<16:27,  1.74s/it, loss=0.194, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000591, train/loss_step=0.171, global_step=1367.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  53%|█████▎    | 640/1208 [18:32<16:27,  1.74s/it, loss=0.194, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000591, train/loss_step=0.171, global_step=1367.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  53%|█████▎    | 640/1208 [18:32<16:27,  1.74s/it, loss=0.161, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000409, train/loss_step=0.124, global_step=1367.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  53%|█████▎    | 641/1208 [18:33<16:24,  1.74s/it, loss=0.161, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000409, train/loss_step=0.124, global_step=1367.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  53%|█████▎    | 641/1208 [18:33<16:24,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.000152, train/loss_step=0.0413, global_step=1368.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  53%|█████▎    | 642/1208 [18:34<16:22,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.000152, train/loss_step=0.0413, global_step=1368.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  53%|█████▎    | 642/1208 [18:34<16:22,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0458, train/loss_vlb_step=0.000169, train/loss_step=0.0458, global_step=1368.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  53%|█████▎    | 643/1208 [18:35<16:20,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0458, train/loss_vlb_step=0.000169, train/loss_step=0.0458, global_step=1368.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  53%|█████▎    | 643/1208 [18:35<16:20,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.513, train/loss_vlb_step=0.0115, train/loss_step=0.513, global_step=1368.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  53%|█████▎    | 644/1208 [18:38<16:19,  1.74s/it, loss=0.172, v_num=0, train/loss_simple_step=0.513, train/loss_vlb_step=0.0115, train/loss_step=0.513, global_step=1368.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  53%|█████▎    | 644/1208 [18:38<16:19,  1.74s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0597, train/loss_vlb_step=0.000215, train/loss_step=0.0597, global_step=1368.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  53%|█████▎    | 645/1208 [18:39<16:17,  1.74s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0597, train/loss_vlb_step=0.000215, train/loss_step=0.0597, global_step=1368.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  53%|█████▎    | 645/1208 [18:39<16:17,  1.74s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.5e-5, train/loss_step=0.0126, global_step=1369.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  53%|█████▎    | 646/1208 [18:40<16:14,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.5e-5, train/loss_step=0.0126, global_step=1369.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  53%|█████▎    | 646/1208 [18:40<16:14,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000341, train/loss_step=0.103, global_step=1369.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  54%|█████▎    | 647/1208 [18:41<16:12,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000341, train/loss_step=0.103, global_step=1369.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  54%|█████▎    | 647/1208 [18:41<16:12,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000582, train/loss_step=0.171, global_step=1369.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  54%|█████▎    | 648/1208 [18:44<16:12,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000582, train/loss_step=0.171, global_step=1369.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  54%|█████▎    | 648/1208 [18:44<16:12,  1.74s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0642, train/loss_vlb_step=0.000222, train/loss_step=0.0642, global_step=1369.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  54%|█████▎    | 649/1208 [18:46<16:09,  1.74s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0642, train/loss_vlb_step=0.000222, train/loss_step=0.0642, global_step=1369.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  54%|█████▎    | 649/1208 [18:46<16:09,  1.74s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000162, train/loss_step=0.0457, global_step=1370.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  54%|█████▍    | 650/1208 [18:47<16:07,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000162, train/loss_step=0.0457, global_step=1370.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  54%|█████▍    | 650/1208 [18:47<16:07,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000135, train/loss_step=0.0364, global_step=1370.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  54%|█████▍    | 651/1208 [18:48<16:05,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000135, train/loss_step=0.0364, global_step=1370.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  54%|█████▍    | 651/1208 [18:48<16:05,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000168, train/loss_step=0.0449, global_step=1370.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  54%|█████▍    | 652/1208 [18:51<16:04,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000168, train/loss_step=0.0449, global_step=1370.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  54%|█████▍    | 652/1208 [18:51<16:04,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.000125, train/loss_step=0.0326, global_step=1370.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  54%|█████▍    | 653/1208 [18:52<16:02,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.000125, train/loss_step=0.0326, global_step=1370.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  54%|█████▍    | 653/1208 [18:52<16:02,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.1e-5, train/loss_step=0.00182, global_step=1371.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  54%|█████▍    | 654/1208 [18:53<16:00,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.1e-5, train/loss_step=0.00182, global_step=1371.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  54%|█████▍    | 654/1208 [18:53<16:00,  1.73s/it, loss=0.104, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.41e-5, train/loss_step=0.018, global_step=1371.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  54%|█████▍    | 655/1208 [18:54<15:57,  1.73s/it, loss=0.104, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.41e-5, train/loss_step=0.018, global_step=1371.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  54%|█████▍    | 655/1208 [18:54<15:57,  1.73s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.00659, train/loss_vlb_step=3.32e-5, train/loss_step=0.00659, global_step=1371.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  54%|█████▍    | 656/1208 [18:57<15:57,  1.73s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.00659, train/loss_vlb_step=3.32e-5, train/loss_step=0.00659, global_step=1371.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  54%|█████▍    | 656/1208 [18:57<15:57,  1.73s/it, loss=0.102, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00227, train/loss_step=0.384, global_step=1371.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]     Epoch 4:  54%|█████▍    | 657/1208 [18:58<15:55,  1.73s/it, loss=0.102, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00227, train/loss_step=0.384, global_step=1371.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  54%|█████▍    | 657/1208 [18:58<15:55,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000607, train/loss_step=0.164, global_step=1372.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  54%|█████▍    | 658/1208 [18:59<15:52,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000607, train/loss_step=0.164, global_step=1372.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  54%|█████▍    | 658/1208 [18:59<15:52,  1.73s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0674, train/loss_vlb_step=0.000233, train/loss_step=0.0674, global_step=1372.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  55%|█████▍    | 659/1208 [19:00<15:50,  1.73s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0674, train/loss_vlb_step=0.000233, train/loss_step=0.0674, global_step=1372.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  55%|█████▍    | 659/1208 [19:00<15:50,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000715, train/loss_step=0.188, global_step=1372.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  55%|█████▍    | 660/1208 [19:04<15:50,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000715, train/loss_step=0.188, global_step=1372.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  55%|█████▍    | 660/1208 [19:04<15:50,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00174, train/loss_step=0.336, global_step=1372.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  55%|█████▍    | 661/1208 [19:05<15:47,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00174, train/loss_step=0.336, global_step=1372.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  55%|█████▍    | 661/1208 [19:05<15:47,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=2.23e-5, train/loss_step=0.00395, global_step=1373.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  55%|█████▍    | 662/1208 [19:06<15:45,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=2.23e-5, train/loss_step=0.00395, global_step=1373.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  55%|█████▍    | 662/1208 [19:06<15:45,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0671, train/loss_vlb_step=0.000227, train/loss_step=0.0671, global_step=1373.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  55%|█████▍    | 663/1208 [19:07<15:43,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0671, train/loss_vlb_step=0.000227, train/loss_step=0.0671, global_step=1373.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  55%|█████▍    | 663/1208 [19:07<15:43,  1.73s/it, loss=0.093, v_num=0, train/loss_simple_step=0.0528, train/loss_vlb_step=0.000185, train/loss_step=0.0528, global_step=1373.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  55%|█████▍    | 664/1208 [19:10<15:42,  1.73s/it, loss=0.093, v_num=0, train/loss_simple_step=0.0528, train/loss_vlb_step=0.000185, train/loss_step=0.0528, global_step=1373.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  55%|█████▍    | 664/1208 [19:10<15:42,  1.73s/it, loss=0.0923, v_num=0, train/loss_simple_step=0.0452, train/loss_vlb_step=0.00016, train/loss_step=0.0452, global_step=1373.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  55%|█████▌    | 665/1208 [19:11<15:40,  1.73s/it, loss=0.0923, v_num=0, train/loss_simple_step=0.0452, train/loss_vlb_step=0.00016, train/loss_step=0.0452, global_step=1373.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  55%|█████▌    | 665/1208 [19:11<15:40,  1.73s/it, loss=0.1, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000586, train/loss_step=0.169, global_step=1374.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  55%|█████▌    | 666/1208 [19:12<15:38,  1.73s/it, loss=0.1, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000586, train/loss_step=0.169, global_step=1374.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  55%|█████▌    | 666/1208 [19:12<15:38,  1.73s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.0911, train/loss_vlb_step=0.000303, train/loss_step=0.0911, global_step=1374.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  55%|█████▌    | 667/1208 [19:13<15:35,  1.73s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.0911, train/loss_vlb_step=0.000303, train/loss_step=0.0911, global_step=1374.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  55%|█████▌    | 667/1208 [19:13<15:35,  1.73s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.0435, train/loss_vlb_step=0.000157, train/loss_step=0.0435, global_step=1374.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  55%|█████▌    | 668/1208 [19:16<15:35,  1.73s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.0435, train/loss_vlb_step=0.000157, train/loss_step=0.0435, global_step=1374.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  55%|█████▌    | 668/1208 [19:16<15:35,  1.73s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00042, train/loss_step=0.128, global_step=1374.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  55%|█████▌    | 669/1208 [19:18<15:33,  1.73s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00042, train/loss_step=0.128, global_step=1374.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  55%|█████▌    | 669/1208 [19:18<15:33,  1.73s/it, loss=0.0993, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000348, train/loss_step=0.106, global_step=1375.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  55%|█████▌    | 670/1208 [19:19<15:30,  1.73s/it, loss=0.0993, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000348, train/loss_step=0.106, global_step=1375.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  55%|█████▌    | 670/1208 [19:19<15:30,  1.73s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.0377, train/loss_vlb_step=0.000141, train/loss_step=0.0377, global_step=1375.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  56%|█████▌    | 671/1208 [19:20<15:28,  1.73s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.0377, train/loss_vlb_step=0.000141, train/loss_step=0.0377, global_step=1375.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  56%|█████▌    | 671/1208 [19:20<15:28,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00379, train/loss_step=0.401, global_step=1375.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  56%|█████▌    | 672/1208 [19:23<15:27,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00379, train/loss_step=0.401, global_step=1375.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  56%|█████▌    | 672/1208 [19:23<15:27,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00125, train/loss_step=0.282, global_step=1375.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  56%|█████▌    | 673/1208 [19:24<15:25,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00125, train/loss_step=0.282, global_step=1375.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  56%|█████▌    | 673/1208 [19:24<15:25,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000335, train/loss_step=0.101, global_step=1376.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  56%|█████▌    | 674/1208 [19:25<15:23,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000335, train/loss_step=0.101, global_step=1376.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  56%|█████▌    | 674/1208 [19:25<15:23,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0827, train/loss_vlb_step=0.000274, train/loss_step=0.0827, global_step=1376.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  56%|█████▌    | 675/1208 [19:26<15:21,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0827, train/loss_vlb_step=0.000274, train/loss_step=0.0827, global_step=1376.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  56%|█████▌    | 675/1208 [19:26<15:21,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000623, train/loss_step=0.181, global_step=1376.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  56%|█████▌    | 676/1208 [19:29<15:20,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000623, train/loss_step=0.181, global_step=1376.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  56%|█████▌    | 676/1208 [19:29<15:20,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00712, train/loss_vlb_step=3.64e-5, train/loss_step=0.00712, global_step=1376.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  56%|█████▌    | 677/1208 [19:30<15:18,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00712, train/loss_vlb_step=3.64e-5, train/loss_step=0.00712, global_step=1376.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  56%|█████▌    | 677/1208 [19:30<15:18,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00377, train/loss_step=0.435, global_step=1377.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  56%|█████▌    | 678/1208 [19:31<15:16,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00377, train/loss_step=0.435, global_step=1377.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  56%|█████▌    | 678/1208 [19:31<15:16,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000252, train/loss_step=0.0754, global_step=1377.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  56%|█████▌    | 679/1208 [19:32<15:13,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000252, train/loss_step=0.0754, global_step=1377.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  56%|█████▌    | 679/1208 [19:32<15:13,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0862, train/loss_vlb_step=0.000288, train/loss_step=0.0862, global_step=1377.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  56%|█████▋    | 680/1208 [19:36<15:13,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0862, train/loss_vlb_step=0.000288, train/loss_step=0.0862, global_step=1377.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  56%|█████▋    | 680/1208 [19:36<15:13,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000488, train/loss_step=0.144, global_step=1377.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  56%|█████▋    | 681/1208 [19:37<15:10,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000488, train/loss_step=0.144, global_step=1377.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  56%|█████▋    | 681/1208 [19:37<15:10,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.002, train/loss_step=0.322, global_step=1378.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  56%|█████▋    | 682/1208 [19:38<15:08,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.002, train/loss_step=0.322, global_step=1378.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  56%|█████▋    | 682/1208 [19:38<15:08,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=9.2e-5, train/loss_step=0.0223, global_step=1378.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  57%|█████▋    | 683/1208 [19:39<15:06,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=9.2e-5, train/loss_step=0.0223, global_step=1378.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  57%|█████▋    | 683/1208 [19:39<15:06,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.500, train/loss_vlb_step=0.00505, train/loss_step=0.500, global_step=1378.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  57%|█████▋    | 684/1208 [19:42<15:05,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.500, train/loss_vlb_step=0.00505, train/loss_step=0.500, global_step=1378.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  57%|█████▋    | 684/1208 [19:42<15:05,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=1378.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  57%|█████▋    | 685/1208 [19:43<15:03,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=1378.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  57%|█████▋    | 685/1208 [19:43<15:03,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000405, train/loss_step=0.122, global_step=1379.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  57%|█████▋    | 686/1208 [19:44<15:01,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000405, train/loss_step=0.122, global_step=1379.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  57%|█████▋    | 686/1208 [19:44<15:01,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00237, train/loss_step=0.389, global_step=1379.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  57%|█████▋    | 687/1208 [19:45<14:59,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00237, train/loss_step=0.389, global_step=1379.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  57%|█████▋    | 687/1208 [19:45<14:59,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0461, train/loss_vlb_step=0.000164, train/loss_step=0.0461, global_step=1379.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  57%|█████▋    | 688/1208 [19:48<14:58,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0461, train/loss_vlb_step=0.000164, train/loss_step=0.0461, global_step=1379.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  57%|█████▋    | 688/1208 [19:48<14:58,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.000939, train/loss_step=0.255, global_step=1379.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  57%|█████▋    | 689/1208 [19:49<14:56,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.000939, train/loss_step=0.255, global_step=1379.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  57%|█████▋    | 689/1208 [19:49<14:56,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=8.74e-5, train/loss_step=0.0218, global_step=1380.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  57%|█████▋    | 690/1208 [19:50<14:54,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=8.74e-5, train/loss_step=0.0218, global_step=1380.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  57%|█████▋    | 690/1208 [19:50<14:54,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.7e-5, train/loss_step=0.0241, global_step=1380.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  57%|█████▋    | 691/1208 [19:52<14:51,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.7e-5, train/loss_step=0.0241, global_step=1380.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  57%|█████▋    | 691/1208 [19:52<14:51,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.503, train/loss_vlb_step=0.00642, train/loss_step=0.503, global_step=1380.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  57%|█████▋    | 692/1208 [19:55<14:51,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.503, train/loss_vlb_step=0.00642, train/loss_step=0.503, global_step=1380.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  57%|█████▋    | 692/1208 [19:55<14:51,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000104, train/loss_step=0.0262, global_step=1380.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  57%|█████▋    | 693/1208 [19:56<14:49,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000104, train/loss_step=0.0262, global_step=1380.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  57%|█████▋    | 693/1208 [19:56<14:49,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00152, train/loss_step=0.315, global_step=1381.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  57%|█████▋    | 694/1208 [19:57<14:46,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00152, train/loss_step=0.315, global_step=1381.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  57%|█████▋    | 694/1208 [19:57<14:46,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=9.14e-5, train/loss_step=0.0216, global_step=1381.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  58%|█████▊    | 695/1208 [19:58<14:44,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=9.14e-5, train/loss_step=0.0216, global_step=1381.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  58%|█████▊    | 695/1208 [19:58<14:44,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.00072, train/loss_step=0.203, global_step=1381.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  58%|█████▊    | 696/1208 [20:01<14:43,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.00072, train/loss_step=0.203, global_step=1381.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  58%|█████▊    | 696/1208 [20:01<14:43,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000146, train/loss_step=0.0392, global_step=1381.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  58%|█████▊    | 697/1208 [20:02<14:41,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000146, train/loss_step=0.0392, global_step=1381.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  58%|█████▊    | 697/1208 [20:02<14:41,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=1.25e-5, train/loss_step=0.00214, global_step=1382.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  58%|█████▊    | 698/1208 [20:03<14:39,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=1.25e-5, train/loss_step=0.00214, global_step=1382.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  58%|█████▊    | 698/1208 [20:03<14:39,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.86e-5, train/loss_step=0.0129, global_step=1382.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  58%|█████▊    | 699/1208 [20:04<14:37,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.86e-5, train/loss_step=0.0129, global_step=1382.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  58%|█████▊    | 699/1208 [20:04<14:37,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.000162, train/loss_step=0.045, global_step=1382.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  58%|█████▊    | 700/1208 [20:08<14:36,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.000162, train/loss_step=0.045, global_step=1382.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  58%|█████▊    | 700/1208 [20:08<14:36,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=7.34e-5, train/loss_step=0.0164, global_step=1382.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  58%|█████▊    | 701/1208 [20:09<14:34,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=7.34e-5, train/loss_step=0.0164, global_step=1382.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  58%|█████▊    | 701/1208 [20:09<14:34,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00118, train/loss_step=0.254, global_step=1383.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  58%|█████▊    | 702/1208 [20:10<14:32,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00118, train/loss_step=0.254, global_step=1383.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  58%|█████▊    | 702/1208 [20:10<14:32,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0059, train/loss_vlb_step=3.02e-5, train/loss_step=0.0059, global_step=1383.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  58%|█████▊    | 703/1208 [20:11<14:30,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0059, train/loss_vlb_step=3.02e-5, train/loss_step=0.0059, global_step=1383.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  58%|█████▊    | 703/1208 [20:11<14:30,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00261, train/loss_step=0.414, global_step=1383.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  58%|█████▊    | 704/1208 [20:14<14:29,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00261, train/loss_step=0.414, global_step=1383.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  58%|█████▊    | 704/1208 [20:14<14:29,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.697, train/loss_vlb_step=0.0217, train/loss_step=0.697, global_step=1383.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  58%|█████▊    | 705/1208 [20:15<14:27,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.697, train/loss_vlb_step=0.0217, train/loss_step=0.697, global_step=1383.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  58%|█████▊    | 705/1208 [20:15<14:27,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.00038, train/loss_step=0.115, global_step=1384.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  58%|█████▊    | 706/1208 [20:16<14:24,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.00038, train/loss_step=0.115, global_step=1384.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  58%|█████▊    | 706/1208 [20:16<14:24,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00959, train/loss_vlb_step=4.52e-5, train/loss_step=0.00959, global_step=1384.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  59%|█████▊    | 707/1208 [20:17<14:22,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00959, train/loss_vlb_step=4.52e-5, train/loss_step=0.00959, global_step=1384.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  59%|█████▊    | 707/1208 [20:17<14:22,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000117, train/loss_step=0.0288, global_step=1384.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  59%|█████▊    | 708/1208 [20:20<14:22,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000117, train/loss_step=0.0288, global_step=1384.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  59%|█████▊    | 708/1208 [20:20<14:22,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000399, train/loss_step=0.120, global_step=1384.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  59%|█████▊    | 709/1208 [20:21<14:19,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000399, train/loss_step=0.120, global_step=1384.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  59%|█████▊    | 709/1208 [20:21<14:19,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00986, train/loss_vlb_step=4.63e-5, train/loss_step=0.00986, global_step=1385.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  59%|█████▉    | 710/1208 [20:22<14:17,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00986, train/loss_vlb_step=4.63e-5, train/loss_step=0.00986, global_step=1385.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  59%|█████▉    | 710/1208 [20:22<14:17,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=6.14e-5, train/loss_step=0.0133, global_step=1385.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  59%|█████▉    | 711/1208 [20:23<14:15,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=6.14e-5, train/loss_step=0.0133, global_step=1385.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  59%|█████▉    | 711/1208 [20:23<14:15,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.000211, train/loss_step=0.0598, global_step=1385.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  59%|█████▉    | 712/1208 [20:27<14:14,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.000211, train/loss_step=0.0598, global_step=1385.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  59%|█████▉    | 712/1208 [20:27<14:14,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00338, train/loss_vlb_step=1.89e-5, train/loss_step=0.00338, global_step=1385.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  59%|█████▉    | 713/1208 [20:28<14:12,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00338, train/loss_vlb_step=1.89e-5, train/loss_step=0.00338, global_step=1385.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  59%|█████▉    | 713/1208 [20:28<14:12,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000542, train/loss_step=0.159, global_step=1386.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  59%|█████▉    | 714/1208 [20:29<14:10,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000542, train/loss_step=0.159, global_step=1386.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  59%|█████▉    | 714/1208 [20:29<14:10,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.00045, train/loss_step=0.137, global_step=1386.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  59%|█████▉    | 715/1208 [20:30<14:08,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.00045, train/loss_step=0.137, global_step=1386.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  59%|█████▉    | 715/1208 [20:30<14:08,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00192, train/loss_step=0.344, global_step=1386.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  59%|█████▉    | 716/1208 [20:33<14:07,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00192, train/loss_step=0.344, global_step=1386.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  59%|█████▉    | 716/1208 [20:33<14:07,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00367, train/loss_step=0.428, global_step=1386.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  59%|█████▉    | 717/1208 [20:34<14:05,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00367, train/loss_step=0.428, global_step=1386.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  59%|█████▉    | 717/1208 [20:34<14:05,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.000129, train/loss_step=0.034, global_step=1387.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  59%|█████▉    | 718/1208 [20:35<14:03,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.000129, train/loss_step=0.034, global_step=1387.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  59%|█████▉    | 718/1208 [20:35<14:03,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.483, train/loss_vlb_step=0.00543, train/loss_step=0.483, global_step=1387.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  60%|█████▉    | 719/1208 [20:36<14:01,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.483, train/loss_vlb_step=0.00543, train/loss_step=0.483, global_step=1387.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  60%|█████▉    | 719/1208 [20:36<14:01,  1.72s/it, loss=0.194, v_num=0, train/loss_simple_step=0.542, train/loss_vlb_step=0.00963, train/loss_step=0.542, global_step=1387.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  60%|█████▉    | 720/1208 [20:39<14:00,  1.72s/it, loss=0.194, v_num=0, train/loss_simple_step=0.542, train/loss_vlb_step=0.00963, train/loss_step=0.542, global_step=1387.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  60%|█████▉    | 720/1208 [20:39<14:00,  1.72s/it, loss=0.202, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.00063, train/loss_step=0.184, global_step=1387.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  60%|█████▉    | 721/1208 [20:40<13:58,  1.72s/it, loss=0.202, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.00063, train/loss_step=0.184, global_step=1387.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  60%|█████▉    | 721/1208 [20:40<13:58,  1.72s/it, loss=0.222, v_num=0, train/loss_simple_step=0.652, train/loss_vlb_step=0.0203, train/loss_step=0.652, global_step=1388.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  60%|█████▉    | 722/1208 [20:42<13:56,  1.72s/it, loss=0.222, v_num=0, train/loss_simple_step=0.652, train/loss_vlb_step=0.0203, train/loss_step=0.652, global_step=1388.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  60%|█████▉    | 722/1208 [20:42<13:56,  1.72s/it, loss=0.226, v_num=0, train/loss_simple_step=0.0773, train/loss_vlb_step=0.000263, train/loss_step=0.0773, global_step=1388.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  60%|█████▉    | 723/1208 [20:43<13:53,  1.72s/it, loss=0.226, v_num=0, train/loss_simple_step=0.0773, train/loss_vlb_step=0.000263, train/loss_step=0.0773, global_step=1388.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  60%|█████▉    | 723/1208 [20:43<13:53,  1.72s/it, loss=0.209, v_num=0, train/loss_simple_step=0.0791, train/loss_vlb_step=0.000272, train/loss_step=0.0791, global_step=1388.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  60%|█████▉    | 724/1208 [20:46<13:53,  1.72s/it, loss=0.209, v_num=0, train/loss_simple_step=0.0791, train/loss_vlb_step=0.000272, train/loss_step=0.0791, global_step=1388.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  60%|█████▉    | 724/1208 [20:46<13:53,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0687, train/loss_vlb_step=0.000237, train/loss_step=0.0687, global_step=1388.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  60%|██████    | 725/1208 [20:47<13:50,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0687, train/loss_vlb_step=0.000237, train/loss_step=0.0687, global_step=1388.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  60%|██████    | 725/1208 [20:47<13:50,  1.72s/it, loss=0.206, v_num=0, train/loss_simple_step=0.680, train/loss_vlb_step=0.0254, train/loss_step=0.680, global_step=1389.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  60%|██████    | 726/1208 [20:48<13:48,  1.72s/it, loss=0.206, v_num=0, train/loss_simple_step=0.680, train/loss_vlb_step=0.0254, train/loss_step=0.680, global_step=1389.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  60%|██████    | 726/1208 [20:48<13:48,  1.72s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000183, train/loss_step=0.0525, global_step=1389.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  60%|██████    | 727/1208 [20:49<13:46,  1.72s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000183, train/loss_step=0.0525, global_step=1389.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  60%|██████    | 727/1208 [20:49<13:46,  1.72s/it, loss=0.207, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.38e-5, train/loss_step=0.013, global_step=1389.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  60%|██████    | 728/1208 [20:52<13:45,  1.72s/it, loss=0.207, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.38e-5, train/loss_step=0.013, global_step=1389.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  60%|██████    | 728/1208 [20:52<13:45,  1.72s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.000158, train/loss_step=0.0417, global_step=1389.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  60%|██████    | 729/1208 [20:53<13:43,  1.72s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.000158, train/loss_step=0.0417, global_step=1389.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  60%|██████    | 729/1208 [20:53<13:43,  1.72s/it, loss=0.223, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.0023, train/loss_step=0.411, global_step=1390.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  60%|██████    | 730/1208 [20:54<13:41,  1.72s/it, loss=0.223, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.0023, train/loss_step=0.411, global_step=1390.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  60%|██████    | 730/1208 [20:54<13:41,  1.72s/it, loss=0.255, v_num=0, train/loss_simple_step=0.658, train/loss_vlb_step=0.0124, train/loss_step=0.658, global_step=1390.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  61%|██████    | 731/1208 [20:55<13:39,  1.72s/it, loss=0.255, v_num=0, train/loss_simple_step=0.658, train/loss_vlb_step=0.0124, train/loss_step=0.658, global_step=1390.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  61%|██████    | 731/1208 [20:55<13:39,  1.72s/it, loss=0.265, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00102, train/loss_step=0.252, global_step=1390.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  61%|██████    | 732/1208 [20:58<13:38,  1.72s/it, loss=0.265, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00102, train/loss_step=0.252, global_step=1390.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  61%|██████    | 732/1208 [20:58<13:38,  1.72s/it, loss=0.276, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000832, train/loss_step=0.231, global_step=1390.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  61%|██████    | 733/1208 [21:00<13:36,  1.72s/it, loss=0.276, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000832, train/loss_step=0.231, global_step=1390.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  61%|██████    | 733/1208 [21:00<13:36,  1.72s/it, loss=0.277, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000583, train/loss_step=0.171, global_step=1391.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  61%|██████    | 734/1208 [21:01<13:34,  1.72s/it, loss=0.277, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000583, train/loss_step=0.171, global_step=1391.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  61%|██████    | 734/1208 [21:01<13:34,  1.72s/it, loss=0.27, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=1.68e-5, train/loss_step=0.00298, global_step=1391.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  61%|██████    | 735/1208 [21:02<13:32,  1.72s/it, loss=0.27, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=1.68e-5, train/loss_step=0.00298, global_step=1391.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  61%|██████    | 735/1208 [21:02<13:32,  1.72s/it, loss=0.256, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000186, train/loss_step=0.051, global_step=1391.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  61%|██████    | 736/1208 [21:05<13:31,  1.72s/it, loss=0.256, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000186, train/loss_step=0.051, global_step=1391.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  61%|██████    | 736/1208 [21:05<13:31,  1.72s/it, loss=0.236, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000145, train/loss_step=0.0399, global_step=1391.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  61%|██████    | 737/1208 [21:06<13:29,  1.72s/it, loss=0.236, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000145, train/loss_step=0.0399, global_step=1391.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  61%|██████    | 737/1208 [21:06<13:29,  1.72s/it, loss=0.235, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.04e-5, train/loss_step=0.0175, global_step=1392.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  61%|██████    | 738/1208 [21:07<13:27,  1.72s/it, loss=0.235, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.04e-5, train/loss_step=0.0175, global_step=1392.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  61%|██████    | 738/1208 [21:07<13:27,  1.72s/it, loss=0.229, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00185, train/loss_step=0.354, global_step=1392.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  61%|██████    | 739/1208 [21:08<13:25,  1.72s/it, loss=0.229, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00185, train/loss_step=0.354, global_step=1392.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  61%|██████    | 739/1208 [21:08<13:25,  1.72s/it, loss=0.245, v_num=0, train/loss_simple_step=0.867, train/loss_vlb_step=0.219, train/loss_step=0.867, global_step=1392.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  61%|██████▏   | 740/1208 [21:11<13:24,  1.72s/it, loss=0.245, v_num=0, train/loss_simple_step=0.867, train/loss_vlb_step=0.219, train/loss_step=0.867, global_step=1392.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  61%|██████▏   | 740/1208 [21:11<13:24,  1.72s/it, loss=0.239, v_num=0, train/loss_simple_step=0.0642, train/loss_vlb_step=0.000223, train/loss_step=0.0642, global_step=1392.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  61%|██████▏   | 741/1208 [21:12<13:22,  1.72s/it, loss=0.239, v_num=0, train/loss_simple_step=0.0642, train/loss_vlb_step=0.000223, train/loss_step=0.0642, global_step=1392.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  61%|██████▏   | 741/1208 [21:12<13:22,  1.72s/it, loss=0.207, v_num=0, train/loss_simple_step=0.00809, train/loss_vlb_step=4.02e-5, train/loss_step=0.00809, global_step=1393.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  61%|██████▏   | 742/1208 [21:13<13:20,  1.72s/it, loss=0.207, v_num=0, train/loss_simple_step=0.00809, train/loss_vlb_step=4.02e-5, train/loss_step=0.00809, global_step=1393.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  61%|██████▏   | 742/1208 [21:13<13:20,  1.72s/it, loss=0.219, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00148, train/loss_step=0.314, global_step=1393.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  62%|██████▏   | 743/1208 [21:14<13:17,  1.72s/it, loss=0.219, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00148, train/loss_step=0.314, global_step=1393.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  62%|██████▏   | 743/1208 [21:14<13:17,  1.72s/it, loss=0.22, v_num=0, train/loss_simple_step=0.0973, train/loss_vlb_step=0.000326, train/loss_step=0.0973, global_step=1393.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  62%|██████▏   | 744/1208 [21:18<13:17,  1.72s/it, loss=0.22, v_num=0, train/loss_simple_step=0.0973, train/loss_vlb_step=0.000326, train/loss_step=0.0973, global_step=1393.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  62%|██████▏   | 744/1208 [21:18<13:17,  1.72s/it, loss=0.223, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000414, train/loss_step=0.126, global_step=1393.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  62%|██████▏   | 745/1208 [21:19<13:15,  1.72s/it, loss=0.223, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000414, train/loss_step=0.126, global_step=1393.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  62%|██████▏   | 745/1208 [21:19<13:15,  1.72s/it, loss=0.206, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.0014, train/loss_step=0.340, global_step=1394.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  62%|██████▏   | 746/1208 [21:20<13:12,  1.72s/it, loss=0.206, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.0014, train/loss_step=0.340, global_step=1394.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  62%|██████▏   | 746/1208 [21:20<13:12,  1.72s/it, loss=0.209, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000417, train/loss_step=0.127, global_step=1394.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  62%|██████▏   | 747/1208 [21:21<13:10,  1.72s/it, loss=0.209, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000417, train/loss_step=0.127, global_step=1394.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  62%|██████▏   | 747/1208 [21:21<13:10,  1.72s/it, loss=0.224, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00162, train/loss_step=0.303, global_step=1394.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  62%|██████▏   | 748/1208 [21:24<13:09,  1.72s/it, loss=0.224, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00162, train/loss_step=0.303, global_step=1394.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  62%|██████▏   | 748/1208 [21:24<13:09,  1.72s/it, loss=0.224, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000152, train/loss_step=0.0416, global_step=1394.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  62%|██████▏   | 749/1208 [21:25<13:07,  1.72s/it, loss=0.224, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000152, train/loss_step=0.0416, global_step=1394.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  62%|██████▏   | 749/1208 [21:25<13:07,  1.72s/it, loss=0.203, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.57e-5, train/loss_step=0.00268, global_step=1395.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  62%|██████▏   | 750/1208 [21:26<13:05,  1.72s/it, loss=0.203, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.57e-5, train/loss_step=0.00268, global_step=1395.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  62%|██████▏   | 750/1208 [21:26<13:05,  1.72s/it, loss=0.186, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00167, train/loss_step=0.301, global_step=1395.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  62%|██████▏   | 751/1208 [21:27<13:03,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00167, train/loss_step=0.301, global_step=1395.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  62%|██████▏   | 751/1208 [21:27<13:03,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000635, train/loss_step=0.178, global_step=1395.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  62%|██████▏   | 752/1208 [21:30<13:02,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000635, train/loss_step=0.178, global_step=1395.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  62%|██████▏   | 752/1208 [21:30<13:02,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000788, train/loss_step=0.224, global_step=1395.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  62%|██████▏   | 753/1208 [21:32<13:00,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000788, train/loss_step=0.224, global_step=1395.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  62%|██████▏   | 753/1208 [21:32<13:00,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00579, train/loss_vlb_step=3.02e-5, train/loss_step=0.00579, global_step=1396.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  62%|██████▏   | 754/1208 [21:33<12:58,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00579, train/loss_vlb_step=3.02e-5, train/loss_step=0.00579, global_step=1396.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  62%|██████▏   | 754/1208 [21:33<12:58,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.00103, train/loss_step=0.236, global_step=1396.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  62%|██████▎   | 755/1208 [21:34<12:56,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.00103, train/loss_step=0.236, global_step=1396.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  62%|██████▎   | 755/1208 [21:34<12:56,  1.71s/it, loss=0.201, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00221, train/loss_step=0.370, global_step=1396.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  63%|██████▎   | 756/1208 [21:37<12:55,  1.72s/it, loss=0.201, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00221, train/loss_step=0.370, global_step=1396.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  63%|██████▎   | 756/1208 [21:37<12:55,  1.72s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0812, train/loss_vlb_step=0.00027, train/loss_step=0.0812, global_step=1396.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  63%|██████▎   | 757/1208 [21:38<12:53,  1.72s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0812, train/loss_vlb_step=0.00027, train/loss_step=0.0812, global_step=1396.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  63%|██████▎   | 757/1208 [21:38<12:53,  1.72s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.8e-5, train/loss_step=0.0152, global_step=1397.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  63%|██████▎   | 758/1208 [21:39<12:51,  1.71s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.8e-5, train/loss_step=0.0152, global_step=1397.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  63%|██████▎   | 758/1208 [21:39<12:51,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000453, train/loss_step=0.136, global_step=1397.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  63%|██████▎   | 759/1208 [21:40<12:49,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000453, train/loss_step=0.136, global_step=1397.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  63%|██████▎   | 759/1208 [21:40<12:49,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000559, train/loss_step=0.163, global_step=1397.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  63%|██████▎   | 760/1208 [21:43<12:48,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000559, train/loss_step=0.163, global_step=1397.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  63%|██████▎   | 760/1208 [21:43<12:48,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.73e-5, train/loss_step=0.00303, global_step=1397.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  63%|██████▎   | 761/1208 [21:44<12:46,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.73e-5, train/loss_step=0.00303, global_step=1397.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  63%|██████▎   | 761/1208 [21:44<12:46,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00243, train/loss_step=0.396, global_step=1398.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  63%|██████▎   | 762/1208 [21:45<12:44,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00243, train/loss_step=0.396, global_step=1398.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  63%|██████▎   | 762/1208 [21:45<12:44,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0563, train/loss_vlb_step=0.000191, train/loss_step=0.0563, global_step=1398.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  63%|██████▎   | 763/1208 [21:46<12:42,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0563, train/loss_vlb_step=0.000191, train/loss_step=0.0563, global_step=1398.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  63%|██████▎   | 763/1208 [21:46<12:42,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000535, train/loss_step=0.158, global_step=1398.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  63%|██████▎   | 764/1208 [21:50<12:41,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000535, train/loss_step=0.158, global_step=1398.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  63%|██████▎   | 764/1208 [21:50<12:41,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.054, train/loss_vlb_step=0.000189, train/loss_step=0.054, global_step=1398.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  63%|██████▎   | 765/1208 [21:51<12:39,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.054, train/loss_vlb_step=0.000189, train/loss_step=0.054, global_step=1398.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  63%|██████▎   | 765/1208 [21:51<12:39,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.000166, train/loss_step=0.0462, global_step=1399.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  63%|██████▎   | 766/1208 [21:52<12:37,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.000166, train/loss_step=0.0462, global_step=1399.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  63%|██████▎   | 766/1208 [21:52<12:37,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00128, train/loss_step=0.272, global_step=1399.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  63%|██████▎   | 767/1208 [21:53<12:35,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00128, train/loss_step=0.272, global_step=1399.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  63%|██████▎   | 767/1208 [21:53<12:35,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00645, train/loss_vlb_step=3.3e-5, train/loss_step=0.00645, global_step=1399.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  64%|██████▎   | 768/1208 [21:56<12:34,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00645, train/loss_vlb_step=3.3e-5, train/loss_step=0.00645, global_step=1399.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  64%|██████▎   | 768/1208 [21:56<12:34,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000132, train/loss_step=0.0335, global_step=1399.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  64%|██████▎   | 769/1208 [21:57<12:32,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000132, train/loss_step=0.0335, global_step=1399.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  64%|██████▎   | 769/1208 [21:57<12:32,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.065, train/loss_vlb_step=0.000228, train/loss_step=0.065, global_step=1400.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  64%|██████▎   | 770/1208 [21:58<12:30,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.065, train/loss_vlb_step=0.000228, train/loss_step=0.065, global_step=1400.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  64%|██████▎   | 770/1208 [21:58<12:30,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.00014, train/loss_step=0.0361, global_step=1400.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  64%|██████▍   | 771/1208 [21:59<12:27,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.00014, train/loss_step=0.0361, global_step=1400.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  64%|██████▍   | 771/1208 [21:59<12:27,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.96e-5, train/loss_step=0.00352, global_step=1400.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  64%|██████▍   | 772/1208 [22:02<12:27,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.96e-5, train/loss_step=0.00352, global_step=1400.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  64%|██████▍   | 772/1208 [22:02<12:27,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=1400.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  64%|██████▍   | 773/1208 [22:03<12:25,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=1400.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  64%|██████▍   | 773/1208 [22:03<12:25,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00949, train/loss_vlb_step=4.57e-5, train/loss_step=0.00949, global_step=1401.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  64%|██████▍   | 774/1208 [22:05<12:22,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00949, train/loss_vlb_step=4.57e-5, train/loss_step=0.00949, global_step=1401.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  64%|██████▍   | 774/1208 [22:05<12:22,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.8e-5, train/loss_step=0.0129, global_step=1401.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  64%|██████▍   | 775/1208 [22:06<12:20,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.8e-5, train/loss_step=0.0129, global_step=1401.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  64%|██████▍   | 775/1208 [22:06<12:20,  1.71s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.0608, train/loss_vlb_step=0.000207, train/loss_step=0.0608, global_step=1401.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  64%|██████▍   | 776/1208 [22:09<12:19,  1.71s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.0608, train/loss_vlb_step=0.000207, train/loss_step=0.0608, global_step=1401.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  64%|██████▍   | 776/1208 [22:09<12:19,  1.71s/it, loss=0.0825, v_num=0, train/loss_simple_step=0.00582, train/loss_vlb_step=3.23e-5, train/loss_step=0.00582, global_step=1401.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  64%|██████▍   | 777/1208 [22:10<12:17,  1.71s/it, loss=0.0825, v_num=0, train/loss_simple_step=0.00582, train/loss_vlb_step=3.23e-5, train/loss_step=0.00582, global_step=1401.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  64%|██████▍   | 777/1208 [22:10<12:17,  1.71s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000788, train/loss_step=0.214, global_step=1402.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  64%|██████▍   | 778/1208 [22:11<12:15,  1.71s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000788, train/loss_step=0.214, global_step=1402.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  64%|██████▍   | 778/1208 [22:11<12:15,  1.71s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.23e-5, train/loss_step=0.0113, global_step=1402.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  64%|██████▍   | 779/1208 [22:12<12:13,  1.71s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.23e-5, train/loss_step=0.0113, global_step=1402.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  64%|██████▍   | 779/1208 [22:12<12:13,  1.71s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000942, train/loss_step=0.235, global_step=1402.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  65%|██████▍   | 780/1208 [22:15<12:12,  1.71s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000942, train/loss_step=0.235, global_step=1402.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  65%|██████▍   | 780/1208 [22:15<12:12,  1.71s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000541, train/loss_step=0.162, global_step=1402.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  65%|██████▍   | 781/1208 [22:16<12:10,  1.71s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000541, train/loss_step=0.162, global_step=1402.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  65%|██████▍   | 781/1208 [22:16<12:10,  1.71s/it, loss=0.0781, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.86e-5, train/loss_step=0.00341, global_step=1403.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  65%|██████▍   | 782/1208 [22:17<12:08,  1.71s/it, loss=0.0781, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.86e-5, train/loss_step=0.00341, global_step=1403.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  65%|██████▍   | 782/1208 [22:17<12:08,  1.71s/it, loss=0.0754, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=1.71e-5, train/loss_step=0.00302, global_step=1403.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  65%|██████▍   | 783/1208 [22:18<12:06,  1.71s/it, loss=0.0754, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=1.71e-5, train/loss_step=0.00302, global_step=1403.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  65%|██████▍   | 783/1208 [22:18<12:06,  1.71s/it, loss=0.0751, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000507, train/loss_step=0.152, global_step=1403.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  65%|██████▍   | 784/1208 [22:22<12:05,  1.71s/it, loss=0.0751, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000507, train/loss_step=0.152, global_step=1403.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  65%|██████▍   | 784/1208 [22:22<12:05,  1.71s/it, loss=0.0787, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000418, train/loss_step=0.127, global_step=1403.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  65%|██████▍   | 785/1208 [22:23<12:03,  1.71s/it, loss=0.0787, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000418, train/loss_step=0.127, global_step=1403.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  65%|██████▍   | 785/1208 [22:23<12:03,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.511, train/loss_vlb_step=0.00651, train/loss_step=0.511, global_step=1404.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  65%|██████▌   | 786/1208 [22:24<12:01,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.511, train/loss_vlb_step=0.00651, train/loss_step=0.511, global_step=1404.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  65%|██████▌   | 786/1208 [22:24<12:01,  1.71s/it, loss=0.0895, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=8.95e-5, train/loss_step=0.0222, global_step=1404.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  65%|██████▌   | 787/1208 [22:25<11:59,  1.71s/it, loss=0.0895, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=8.95e-5, train/loss_step=0.0222, global_step=1404.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  65%|██████▌   | 787/1208 [22:25<11:59,  1.71s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.0684, train/loss_vlb_step=0.000235, train/loss_step=0.0684, global_step=1404.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  65%|██████▌   | 788/1208 [22:28<11:58,  1.71s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.0684, train/loss_vlb_step=0.000235, train/loss_step=0.0684, global_step=1404.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  65%|██████▌   | 788/1208 [22:28<11:58,  1.71s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.00846, train/loss_vlb_step=4.07e-5, train/loss_step=0.00846, global_step=1404.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  65%|██████▌   | 789/1208 [22:29<11:56,  1.71s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.00846, train/loss_vlb_step=4.07e-5, train/loss_step=0.00846, global_step=1404.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  65%|██████▌   | 789/1208 [22:29<11:56,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00107, train/loss_step=0.270, global_step=1405.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]     Epoch 4:  65%|██████▌   | 790/1208 [22:30<11:54,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00107, train/loss_step=0.270, global_step=1405.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  65%|██████▌   | 790/1208 [22:30<11:54,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.00053, train/loss_step=0.160, global_step=1405.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  65%|██████▌   | 791/1208 [22:31<11:52,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.00053, train/loss_step=0.160, global_step=1405.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  65%|██████▌   | 791/1208 [22:31<11:52,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=8.2e-5, train/loss_step=0.0184, global_step=1405.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  66%|██████▌   | 792/1208 [22:34<11:51,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=8.2e-5, train/loss_step=0.0184, global_step=1405.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  66%|██████▌   | 792/1208 [22:34<11:51,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000131, train/loss_step=0.0337, global_step=1405.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  66%|██████▌   | 793/1208 [22:35<11:49,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000131, train/loss_step=0.0337, global_step=1405.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  66%|██████▌   | 793/1208 [22:35<11:49,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.000171, train/loss_step=0.0489, global_step=1406.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  66%|██████▌   | 794/1208 [22:37<11:47,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.000171, train/loss_step=0.0489, global_step=1406.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  66%|██████▌   | 794/1208 [22:37<11:47,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0703, train/loss_vlb_step=0.000232, train/loss_step=0.0703, global_step=1406.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  66%|██████▌   | 795/1208 [22:38<11:45,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0703, train/loss_vlb_step=0.000232, train/loss_step=0.0703, global_step=1406.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  66%|██████▌   | 795/1208 [22:38<11:45,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.725, train/loss_vlb_step=0.0315, train/loss_step=0.725, global_step=1406.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  66%|██████▌   | 796/1208 [22:41<11:44,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.725, train/loss_vlb_step=0.0315, train/loss_step=0.725, global_step=1406.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  66%|██████▌   | 796/1208 [22:41<11:44,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000646, train/loss_step=0.188, global_step=1406.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  66%|██████▌   | 797/1208 [22:42<11:42,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000646, train/loss_step=0.188, global_step=1406.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  66%|██████▌   | 797/1208 [22:42<11:42,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0847, train/loss_vlb_step=0.000282, train/loss_step=0.0847, global_step=1407.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  66%|██████▌   | 798/1208 [22:43<11:40,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0847, train/loss_vlb_step=0.000282, train/loss_step=0.0847, global_step=1407.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  66%|██████▌   | 798/1208 [22:43<11:40,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.17e-5, train/loss_step=0.0114, global_step=1407.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  66%|██████▌   | 799/1208 [22:44<11:38,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.17e-5, train/loss_step=0.0114, global_step=1407.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  66%|██████▌   | 799/1208 [22:44<11:38,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.01e-5, train/loss_step=0.0202, global_step=1407.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  66%|██████▌   | 800/1208 [22:47<11:37,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.01e-5, train/loss_step=0.0202, global_step=1407.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  66%|██████▌   | 800/1208 [22:47<11:37,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.78e-5, train/loss_step=0.00335, global_step=1407.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  66%|██████▋   | 801/1208 [22:48<11:35,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.78e-5, train/loss_step=0.00335, global_step=1407.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  66%|██████▋   | 801/1208 [22:48<11:35,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000106, train/loss_step=0.0272, global_step=1408.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  66%|██████▋   | 802/1208 [22:49<11:33,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000106, train/loss_step=0.0272, global_step=1408.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  66%|██████▋   | 802/1208 [22:49<11:33,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0644, train/loss_vlb_step=0.000228, train/loss_step=0.0644, global_step=1408.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  66%|██████▋   | 803/1208 [22:50<11:31,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0644, train/loss_vlb_step=0.000228, train/loss_step=0.0644, global_step=1408.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  66%|██████▋   | 803/1208 [22:50<11:31,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000123, train/loss_step=0.0334, global_step=1408.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  67%|██████▋   | 804/1208 [22:54<11:30,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000123, train/loss_step=0.0334, global_step=1408.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  67%|██████▋   | 804/1208 [22:54<11:30,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00328, train/loss_vlb_step=1.83e-5, train/loss_step=0.00328, global_step=1408.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  67%|██████▋   | 805/1208 [22:55<11:28,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00328, train/loss_vlb_step=1.83e-5, train/loss_step=0.00328, global_step=1408.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  67%|██████▋   | 805/1208 [22:55<11:28,  1.71s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.2e-5, train/loss_step=0.002, global_step=1409.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  67%|██████▋   | 806/1208 [22:56<11:26,  1.71s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.2e-5, train/loss_step=0.002, global_step=1409.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  67%|██████▋   | 806/1208 [22:56<11:26,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000607, train/loss_step=0.177, global_step=1409.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  67%|██████▋   | 807/1208 [22:57<11:24,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000607, train/loss_step=0.177, global_step=1409.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  67%|██████▋   | 807/1208 [22:57<11:24,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.387, train/loss_vlb_step=0.00386, train/loss_step=0.387, global_step=1409.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  67%|██████▋   | 808/1208 [23:00<11:23,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.387, train/loss_vlb_step=0.00386, train/loss_step=0.387, global_step=1409.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  67%|██████▋   | 808/1208 [23:00<11:23,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=1.57e-5, train/loss_step=0.00276, global_step=1409.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  67%|██████▋   | 809/1208 [23:01<11:21,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=1.57e-5, train/loss_step=0.00276, global_step=1409.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  67%|██████▋   | 809/1208 [23:01<11:21,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00261, train/loss_step=0.367, global_step=1410.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  67%|██████▋   | 810/1208 [23:02<11:19,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00261, train/loss_step=0.367, global_step=1410.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  67%|██████▋   | 810/1208 [23:02<11:19,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.00044, train/loss_step=0.134, global_step=1410.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  67%|██████▋   | 811/1208 [23:03<11:17,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.00044, train/loss_step=0.134, global_step=1410.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  67%|██████▋   | 811/1208 [23:03<11:17,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=8.5e-5, train/loss_step=0.0211, global_step=1410.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  67%|██████▋   | 812/1208 [23:06<11:16,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=8.5e-5, train/loss_step=0.0211, global_step=1410.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  67%|██████▋   | 812/1208 [23:06<11:16,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00751, train/loss_vlb_step=3.68e-5, train/loss_step=0.00751, global_step=1410.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  67%|██████▋   | 813/1208 [23:07<11:14,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00751, train/loss_vlb_step=3.68e-5, train/loss_step=0.00751, global_step=1410.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  67%|██████▋   | 813/1208 [23:07<11:14,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=2.09e-5, train/loss_step=0.00365, global_step=1411.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  67%|██████▋   | 814/1208 [23:08<11:12,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=2.09e-5, train/loss_step=0.00365, global_step=1411.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  67%|██████▋   | 814/1208 [23:08<11:12,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000436, train/loss_step=0.133, global_step=1411.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  67%|██████▋   | 815/1208 [23:09<11:10,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000436, train/loss_step=0.133, global_step=1411.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  67%|██████▋   | 815/1208 [23:09<11:10,  1.71s/it, loss=0.0866, v_num=0, train/loss_simple_step=0.0623, train/loss_vlb_step=0.00022, train/loss_step=0.0623, global_step=1411.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  68%|██████▊   | 816/1208 [23:13<11:09,  1.71s/it, loss=0.0866, v_num=0, train/loss_simple_step=0.0623, train/loss_vlb_step=0.00022, train/loss_step=0.0623, global_step=1411.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  68%|██████▊   | 816/1208 [23:13<11:09,  1.71s/it, loss=0.0859, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000577, train/loss_step=0.174, global_step=1411.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  68%|██████▊   | 817/1208 [23:14<11:07,  1.71s/it, loss=0.0859, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000577, train/loss_step=0.174, global_step=1411.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  68%|██████▊   | 817/1208 [23:14<11:07,  1.71s/it, loss=0.0819, v_num=0, train/loss_simple_step=0.00437, train/loss_vlb_step=2.35e-5, train/loss_step=0.00437, global_step=1412.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  68%|██████▊   | 818/1208 [23:15<11:05,  1.71s/it, loss=0.0819, v_num=0, train/loss_simple_step=0.00437, train/loss_vlb_step=2.35e-5, train/loss_step=0.00437, global_step=1412.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  68%|██████▊   | 818/1208 [23:15<11:05,  1.71s/it, loss=0.0869, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000371, train/loss_step=0.112, global_step=1412.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  68%|██████▊   | 819/1208 [23:16<11:03,  1.70s/it, loss=0.0869, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000371, train/loss_step=0.112, global_step=1412.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  68%|██████▊   | 819/1208 [23:16<11:03,  1.70s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.59e-5, train/loss_step=0.00274, global_step=1412.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  68%|██████▊   | 820/1208 [23:19<11:02,  1.71s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.59e-5, train/loss_step=0.00274, global_step=1412.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  68%|██████▊   | 820/1208 [23:19<11:02,  1.71s/it, loss=0.086, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.12e-5, train/loss_step=0.00188, global_step=1412.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  68%|██████▊   | 821/1208 [23:20<11:00,  1.71s/it, loss=0.086, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.12e-5, train/loss_step=0.00188, global_step=1412.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  68%|██████▊   | 821/1208 [23:20<11:00,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00415, train/loss_step=0.439, global_step=1413.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  68%|██████▊   | 822/1208 [23:21<10:58,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00415, train/loss_step=0.439, global_step=1413.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  68%|██████▊   | 822/1208 [23:21<10:58,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.9e-5, train/loss_step=0.0154, global_step=1413.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  68%|██████▊   | 823/1208 [23:22<10:56,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.9e-5, train/loss_step=0.0154, global_step=1413.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  68%|██████▊   | 823/1208 [23:22<10:56,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0735, train/loss_vlb_step=0.000245, train/loss_step=0.0735, global_step=1413.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  68%|██████▊   | 824/1208 [23:26<10:55,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0735, train/loss_vlb_step=0.000245, train/loss_step=0.0735, global_step=1413.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  68%|██████▊   | 824/1208 [23:26<10:55,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000509, train/loss_step=0.150, global_step=1413.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  68%|██████▊   | 825/1208 [23:27<10:53,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000509, train/loss_step=0.150, global_step=1413.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  68%|██████▊   | 825/1208 [23:27<10:53,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00132, train/loss_step=0.286, global_step=1414.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  68%|██████▊   | 826/1208 [23:28<10:51,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00132, train/loss_step=0.286, global_step=1414.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  68%|██████▊   | 826/1208 [23:28<10:51,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.00083, train/loss_step=0.232, global_step=1414.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  68%|██████▊   | 827/1208 [23:29<10:49,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.00083, train/loss_step=0.232, global_step=1414.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  68%|██████▊   | 827/1208 [23:29<10:49,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000351, train/loss_step=0.106, global_step=1414.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  69%|██████▊   | 828/1208 [23:32<10:48,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000351, train/loss_step=0.106, global_step=1414.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  69%|██████▊   | 828/1208 [23:32<10:48,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.15e-5, train/loss_step=0.0117, global_step=1414.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  69%|██████▊   | 829/1208 [23:33<10:46,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.15e-5, train/loss_step=0.0117, global_step=1414.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  69%|██████▊   | 829/1208 [23:33<10:46,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00167, train/loss_step=0.321, global_step=1415.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  69%|██████▊   | 830/1208 [23:34<10:44,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00167, train/loss_step=0.321, global_step=1415.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  69%|██████▊   | 830/1208 [23:34<10:44,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000628, train/loss_step=0.181, global_step=1415.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  69%|██████▉   | 831/1208 [23:35<10:42,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000628, train/loss_step=0.181, global_step=1415.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  69%|██████▉   | 831/1208 [23:35<10:42,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00252, train/loss_step=0.369, global_step=1415.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  69%|██████▉   | 832/1208 [23:38<10:41,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00252, train/loss_step=0.369, global_step=1415.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  69%|██████▉   | 832/1208 [23:38<10:41,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00539, train/loss_vlb_step=2.76e-5, train/loss_step=0.00539, global_step=1415.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  69%|██████▉   | 833/1208 [23:39<10:39,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00539, train/loss_vlb_step=2.76e-5, train/loss_step=0.00539, global_step=1415.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  69%|██████▉   | 833/1208 [23:39<10:39,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=1.28e-5, train/loss_step=0.00214, global_step=1416.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  69%|██████▉   | 834/1208 [23:40<10:37,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=1.28e-5, train/loss_step=0.00214, global_step=1416.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  69%|██████▉   | 834/1208 [23:40<10:37,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00333, train/loss_vlb_step=1.94e-5, train/loss_step=0.00333, global_step=1416.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  69%|██████▉   | 835/1208 [23:41<10:35,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00333, train/loss_vlb_step=1.94e-5, train/loss_step=0.00333, global_step=1416.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  69%|██████▉   | 835/1208 [23:41<10:35,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00122, train/loss_step=0.259, global_step=1416.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  69%|██████▉   | 836/1208 [23:45<10:34,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00122, train/loss_step=0.259, global_step=1416.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  69%|██████▉   | 836/1208 [23:45<10:34,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000373, train/loss_step=0.113, global_step=1416.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  69%|██████▉   | 837/1208 [23:46<10:32,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000373, train/loss_step=0.113, global_step=1416.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  69%|██████▉   | 837/1208 [23:46<10:32,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00125, train/loss_step=0.283, global_step=1417.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  69%|██████▉   | 838/1208 [23:47<10:30,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00125, train/loss_step=0.283, global_step=1417.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  69%|██████▉   | 838/1208 [23:47<10:30,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.00014, train/loss_step=0.0373, global_step=1417.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  69%|██████▉   | 839/1208 [23:48<10:28,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.00014, train/loss_step=0.0373, global_step=1417.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  69%|██████▉   | 839/1208 [23:48<10:28,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0433, train/loss_vlb_step=0.00016, train/loss_step=0.0433, global_step=1417.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  70%|██████▉   | 840/1208 [23:51<10:27,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0433, train/loss_vlb_step=0.00016, train/loss_step=0.0433, global_step=1417.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  70%|██████▉   | 840/1208 [23:51<10:27,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00102, train/loss_step=0.252, global_step=1417.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  70%|██████▉   | 841/1208 [23:52<10:25,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00102, train/loss_step=0.252, global_step=1417.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  70%|██████▉   | 841/1208 [23:52<10:25,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=2.07e-5, train/loss_step=0.00362, global_step=1418.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  70%|██████▉   | 842/1208 [23:53<10:23,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=2.07e-5, train/loss_step=0.00362, global_step=1418.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  70%|██████▉   | 842/1208 [23:53<10:23,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000142, train/loss_step=0.0381, global_step=1418.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  70%|██████▉   | 843/1208 [23:54<10:21,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000142, train/loss_step=0.0381, global_step=1418.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  70%|██████▉   | 843/1208 [23:54<10:21,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00221, train/loss_step=0.355, global_step=1418.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  70%|██████▉   | 844/1208 [23:57<10:20,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00221, train/loss_step=0.355, global_step=1418.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  70%|██████▉   | 844/1208 [23:57<10:20,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000994, train/loss_step=0.245, global_step=1418.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  70%|██████▉   | 845/1208 [23:58<10:18,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000994, train/loss_step=0.245, global_step=1418.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  70%|██████▉   | 845/1208 [23:58<10:18,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000353, train/loss_step=0.106, global_step=1419.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  70%|███████   | 846/1208 [23:59<10:16,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000353, train/loss_step=0.106, global_step=1419.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  70%|███████   | 846/1208 [23:59<10:16,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=5.04e-5, train/loss_step=0.0105, global_step=1419.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  70%|███████   | 847/1208 [24:00<10:14,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=5.04e-5, train/loss_step=0.0105, global_step=1419.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  70%|███████   | 847/1208 [24:00<10:14,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000337, train/loss_step=0.102, global_step=1419.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  70%|███████   | 848/1208 [24:04<10:13,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000337, train/loss_step=0.102, global_step=1419.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  70%|███████   | 848/1208 [24:04<10:13,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.14e-5, train/loss_step=0.0143, global_step=1419.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  70%|███████   | 849/1208 [24:05<10:11,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.14e-5, train/loss_step=0.0143, global_step=1419.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  70%|███████   | 849/1208 [24:05<10:11,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0488, train/loss_vlb_step=0.000172, train/loss_step=0.0488, global_step=1420.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  70%|███████   | 850/1208 [24:06<10:09,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0488, train/loss_vlb_step=0.000172, train/loss_step=0.0488, global_step=1420.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  70%|███████   | 850/1208 [24:06<10:09,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000124, train/loss_step=0.031, global_step=1420.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  70%|███████   | 851/1208 [24:07<10:07,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000124, train/loss_step=0.031, global_step=1420.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  70%|███████   | 851/1208 [24:07<10:07,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.00057, train/loss_step=0.167, global_step=1420.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  71%|███████   | 852/1208 [24:10<10:06,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.00057, train/loss_step=0.167, global_step=1420.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  71%|███████   | 852/1208 [24:10<10:06,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.28e-5, train/loss_step=0.00218, global_step=1420.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  71%|███████   | 853/1208 [24:11<10:04,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.28e-5, train/loss_step=0.00218, global_step=1420.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  71%|███████   | 853/1208 [24:11<10:04,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00236, train/loss_step=0.402, global_step=1421.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  71%|███████   | 854/1208 [24:12<10:02,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00236, train/loss_step=0.402, global_step=1421.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  71%|███████   | 854/1208 [24:12<10:02,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.65e-5, train/loss_step=0.019, global_step=1421.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  71%|███████   | 855/1208 [24:13<10:00,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.65e-5, train/loss_step=0.019, global_step=1421.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  71%|███████   | 855/1208 [24:13<10:00,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.00041, train/loss_step=0.124, global_step=1421.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  71%|███████   | 856/1208 [24:16<09:59,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.00041, train/loss_step=0.124, global_step=1421.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  71%|███████   | 856/1208 [24:16<09:59,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00211, train/loss_step=0.348, global_step=1421.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  71%|███████   | 857/1208 [24:18<09:57,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00211, train/loss_step=0.348, global_step=1421.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  71%|███████   | 857/1208 [24:18<09:57,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000447, train/loss_step=0.134, global_step=1422.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  71%|███████   | 858/1208 [24:19<09:55,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000447, train/loss_step=0.134, global_step=1422.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  71%|███████   | 858/1208 [24:19<09:55,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00095, train/loss_step=0.256, global_step=1422.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  71%|███████   | 859/1208 [24:20<09:53,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00095, train/loss_step=0.256, global_step=1422.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  71%|███████   | 859/1208 [24:20<09:53,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0538, train/loss_vlb_step=0.000189, train/loss_step=0.0538, global_step=1422.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  71%|███████   | 860/1208 [24:23<09:52,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0538, train/loss_vlb_step=0.000189, train/loss_step=0.0538, global_step=1422.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  71%|███████   | 860/1208 [24:23<09:52,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000727, train/loss_step=0.202, global_step=1422.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  71%|███████▏  | 861/1208 [24:24<09:50,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000727, train/loss_step=0.202, global_step=1422.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  71%|███████▏  | 861/1208 [24:24<09:50,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.75e-5, train/loss_step=0.0228, global_step=1423.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  71%|███████▏  | 862/1208 [24:25<09:48,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.75e-5, train/loss_step=0.0228, global_step=1423.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  71%|███████▏  | 862/1208 [24:25<09:48,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000339, train/loss_step=0.102, global_step=1423.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  71%|███████▏  | 863/1208 [24:26<09:46,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000339, train/loss_step=0.102, global_step=1423.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  71%|███████▏  | 863/1208 [24:26<09:46,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.00086, train/loss_step=0.206, global_step=1423.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  72%|███████▏  | 864/1208 [24:29<09:45,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.00086, train/loss_step=0.206, global_step=1423.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  72%|███████▏  | 864/1208 [24:29<09:45,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.95e-5, train/loss_step=0.0107, global_step=1423.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  72%|███████▏  | 865/1208 [24:30<09:43,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.95e-5, train/loss_step=0.0107, global_step=1423.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  72%|███████▏  | 865/1208 [24:30<09:43,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0784, train/loss_vlb_step=0.000259, train/loss_step=0.0784, global_step=1424.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  72%|███████▏  | 866/1208 [24:31<09:41,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0784, train/loss_vlb_step=0.000259, train/loss_step=0.0784, global_step=1424.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  72%|███████▏  | 866/1208 [24:31<09:41,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0087, train/loss_vlb_step=4.34e-5, train/loss_step=0.0087, global_step=1424.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  72%|███████▏  | 867/1208 [24:32<09:39,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0087, train/loss_vlb_step=4.34e-5, train/loss_step=0.0087, global_step=1424.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  72%|███████▏  | 867/1208 [24:32<09:39,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000633, train/loss_step=0.180, global_step=1424.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  72%|███████▏  | 868/1208 [24:36<09:38,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000633, train/loss_step=0.180, global_step=1424.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  72%|███████▏  | 868/1208 [24:36<09:38,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.000122, train/loss_step=0.0313, global_step=1424.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  72%|███████▏  | 869/1208 [24:37<09:36,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.000122, train/loss_step=0.0313, global_step=1424.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  72%|███████▏  | 869/1208 [24:37<09:36,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=1.87e-5, train/loss_step=0.00356, global_step=1425.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  72%|███████▏  | 870/1208 [24:38<09:34,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=1.87e-5, train/loss_step=0.00356, global_step=1425.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  72%|███████▏  | 870/1208 [24:38<09:34,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0877, train/loss_vlb_step=0.000292, train/loss_step=0.0877, global_step=1425.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  72%|███████▏  | 871/1208 [24:39<09:32,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0877, train/loss_vlb_step=0.000292, train/loss_step=0.0877, global_step=1425.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  72%|███████▏  | 871/1208 [24:39<09:32,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0684, train/loss_vlb_step=0.000242, train/loss_step=0.0684, global_step=1425.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  72%|███████▏  | 872/1208 [24:42<09:31,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0684, train/loss_vlb_step=0.000242, train/loss_step=0.0684, global_step=1425.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  72%|███████▏  | 872/1208 [24:42<09:31,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000145, train/loss_step=0.0387, global_step=1425.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  72%|███████▏  | 873/1208 [24:43<09:29,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000145, train/loss_step=0.0387, global_step=1425.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  72%|███████▏  | 873/1208 [24:43<09:29,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.585, train/loss_vlb_step=0.00909, train/loss_step=0.585, global_step=1426.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  72%|███████▏  | 874/1208 [24:44<09:27,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.585, train/loss_vlb_step=0.00909, train/loss_step=0.585, global_step=1426.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  72%|███████▏  | 874/1208 [24:44<09:27,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.000107, train/loss_step=0.0249, global_step=1426.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  72%|███████▏  | 875/1208 [24:45<09:25,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.000107, train/loss_step=0.0249, global_step=1426.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  72%|███████▏  | 875/1208 [24:45<09:25,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000417, train/loss_step=0.124, global_step=1426.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  73%|███████▎  | 876/1208 [24:48<09:24,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000417, train/loss_step=0.124, global_step=1426.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  73%|███████▎  | 876/1208 [24:48<09:24,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.88e-5, train/loss_step=0.0104, global_step=1426.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  73%|███████▎  | 877/1208 [24:49<09:22,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.88e-5, train/loss_step=0.0104, global_step=1426.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  73%|███████▎  | 877/1208 [24:49<09:22,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.1e-5, train/loss_step=0.011, global_step=1427.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  73%|███████▎  | 878/1208 [24:50<09:20,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.1e-5, train/loss_step=0.011, global_step=1427.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  73%|███████▎  | 878/1208 [24:50<09:20,  1.70s/it, loss=0.102, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000681, train/loss_step=0.196, global_step=1427.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  73%|███████▎  | 879/1208 [24:51<09:18,  1.70s/it, loss=0.102, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000681, train/loss_step=0.196, global_step=1427.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  73%|███████▎  | 879/1208 [24:51<09:18,  1.70s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.19e-5, train/loss_step=0.0136, global_step=1427.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  73%|███████▎  | 880/1208 [24:55<09:17,  1.70s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.19e-5, train/loss_step=0.0136, global_step=1427.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  73%|███████▎  | 880/1208 [24:55<09:17,  1.70s/it, loss=0.0929, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.000195, train/loss_step=0.0543, global_step=1427.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  73%|███████▎  | 881/1208 [24:56<09:15,  1.70s/it, loss=0.0929, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.000195, train/loss_step=0.0543, global_step=1427.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  73%|███████▎  | 881/1208 [24:56<09:15,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00473, train/loss_step=0.414, global_step=1428.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  73%|███████▎  | 882/1208 [24:57<09:13,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00473, train/loss_step=0.414, global_step=1428.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  73%|███████▎  | 882/1208 [24:57<09:13,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00886, train/loss_vlb_step=4.3e-5, train/loss_step=0.00886, global_step=1428.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  73%|███████▎  | 883/1208 [24:58<09:11,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00886, train/loss_vlb_step=4.3e-5, train/loss_step=0.00886, global_step=1428.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  73%|███████▎  | 883/1208 [24:58<09:11,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00323, train/loss_step=0.418, global_step=1428.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  73%|███████▎  | 884/1208 [25:01<09:10,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00323, train/loss_step=0.418, global_step=1428.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  73%|███████▎  | 884/1208 [25:01<09:10,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0697, train/loss_vlb_step=0.000231, train/loss_step=0.0697, global_step=1428.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  73%|███████▎  | 885/1208 [25:02<09:08,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0697, train/loss_vlb_step=0.000231, train/loss_step=0.0697, global_step=1428.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  73%|███████▎  | 885/1208 [25:02<09:08,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.65e-5, train/loss_step=0.00281, global_step=1429.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  73%|███████▎  | 886/1208 [25:03<09:06,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.65e-5, train/loss_step=0.00281, global_step=1429.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  73%|███████▎  | 886/1208 [25:03<09:06,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.079, train/loss_vlb_step=0.000265, train/loss_step=0.079, global_step=1429.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  73%|███████▎  | 887/1208 [25:04<09:04,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.079, train/loss_vlb_step=0.000265, train/loss_step=0.079, global_step=1429.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  73%|███████▎  | 887/1208 [25:04<09:04,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.490, train/loss_vlb_step=0.00602, train/loss_step=0.490, global_step=1429.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  74%|███████▎  | 888/1208 [25:07<09:03,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.490, train/loss_vlb_step=0.00602, train/loss_step=0.490, global_step=1429.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  74%|███████▎  | 888/1208 [25:07<09:03,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000104, train/loss_step=0.0266, global_step=1429.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  74%|███████▎  | 889/1208 [25:08<09:01,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000104, train/loss_step=0.0266, global_step=1429.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  74%|███████▎  | 889/1208 [25:08<09:01,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=1430.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  74%|███████▎  | 890/1208 [25:10<08:59,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=1430.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  74%|███████▎  | 890/1208 [25:10<08:59,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000849, train/loss_step=0.223, global_step=1430.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  74%|███████▍  | 891/1208 [25:11<08:57,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000849, train/loss_step=0.223, global_step=1430.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  74%|███████▍  | 891/1208 [25:11<08:57,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=9.01e-5, train/loss_step=0.0225, global_step=1430.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  74%|███████▍  | 892/1208 [25:14<08:56,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=9.01e-5, train/loss_step=0.0225, global_step=1430.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  74%|███████▍  | 892/1208 [25:14<08:56,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00453, train/loss_vlb_step=2.41e-5, train/loss_step=0.00453, global_step=1430.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  74%|███████▍  | 893/1208 [25:15<08:54,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00453, train/loss_vlb_step=2.41e-5, train/loss_step=0.00453, global_step=1430.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  74%|███████▍  | 893/1208 [25:15<08:54,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.495, train/loss_vlb_step=0.0067, train/loss_step=0.495, global_step=1431.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]      Epoch 4:  74%|███████▍  | 894/1208 [25:16<08:52,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.495, train/loss_vlb_step=0.0067, train/loss_step=0.495, global_step=1431.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  74%|███████▍  | 894/1208 [25:16<08:52,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=5.87e-5, train/loss_step=0.0141, global_step=1431.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  74%|███████▍  | 895/1208 [25:17<08:50,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=5.87e-5, train/loss_step=0.0141, global_step=1431.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  74%|███████▍  | 895/1208 [25:17<08:50,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00511, train/loss_vlb_step=2.74e-5, train/loss_step=0.00511, global_step=1431.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  74%|███████▍  | 896/1208 [25:20<08:49,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00511, train/loss_vlb_step=2.74e-5, train/loss_step=0.00511, global_step=1431.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  74%|███████▍  | 896/1208 [25:20<08:49,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.45e-5, train/loss_step=0.0119, global_step=1431.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  74%|███████▍  | 897/1208 [25:21<08:47,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.45e-5, train/loss_step=0.0119, global_step=1431.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  74%|███████▍  | 897/1208 [25:21<08:47,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.000136, train/loss_step=0.034, global_step=1432.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  74%|███████▍  | 898/1208 [25:22<08:45,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.000136, train/loss_step=0.034, global_step=1432.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  74%|███████▍  | 898/1208 [25:22<08:45,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00534, train/loss_vlb_step=2.77e-5, train/loss_step=0.00534, global_step=1432.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  74%|███████▍  | 899/1208 [25:23<08:43,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00534, train/loss_vlb_step=2.77e-5, train/loss_step=0.00534, global_step=1432.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  74%|███████▍  | 899/1208 [25:23<08:43,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00256, train/loss_step=0.359, global_step=1432.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  75%|███████▍  | 900/1208 [25:26<08:42,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00256, train/loss_step=0.359, global_step=1432.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  75%|███████▍  | 900/1208 [25:26<08:42,  1.70s/it, loss=0.175, v_num=0, train/loss_simple_step=0.707, train/loss_vlb_step=0.0284, train/loss_step=0.707, global_step=1432.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] 
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.73it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.75it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.75it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.76it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.78it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.80it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.80it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.75it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.75it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.75it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.75it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.75it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 4:  75%|███████▍  | 901/1208 [25:57<08:50,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.707, train/loss_vlb_step=0.0284, train/loss_step=0.707, global_step=1432.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  75%|███████▍  | 901/1208 [25:57<08:50,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.00015, train/loss_step=0.0402, global_step=1433.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  75%|███████▍  | 902/1208 [25:58<08:48,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.00015, train/loss_step=0.0402, global_step=1433.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  75%|███████▍  | 902/1208 [25:58<08:48,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0967, train/loss_vlb_step=0.000319, train/loss_step=0.0967, global_step=1433.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  75%|███████▍  | 903/1208 [25:59<08:46,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0967, train/loss_vlb_step=0.000319, train/loss_step=0.0967, global_step=1433.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  75%|███████▍  | 903/1208 [25:59<08:46,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000431, train/loss_step=0.131, global_step=1433.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  75%|███████▍  | 904/1208 [26:02<08:45,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000431, train/loss_step=0.131, global_step=1433.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  75%|███████▍  | 904/1208 [26:02<08:45,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0061, train/loss_vlb_step=3.12e-5, train/loss_step=0.0061, global_step=1433.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  75%|███████▍  | 905/1208 [26:03<08:43,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0061, train/loss_vlb_step=3.12e-5, train/loss_step=0.0061, global_step=1433.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  75%|███████▍  | 905/1208 [26:03<08:43,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0572, train/loss_vlb_step=0.000201, train/loss_step=0.0572, global_step=1434.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  75%|███████▌  | 906/1208 [26:04<08:41,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0572, train/loss_vlb_step=0.000201, train/loss_step=0.0572, global_step=1434.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  75%|███████▌  | 906/1208 [26:04<08:41,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00302, train/loss_step=0.376, global_step=1434.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  75%|███████▌  | 907/1208 [26:06<08:39,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00302, train/loss_step=0.376, global_step=1434.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  75%|███████▌  | 907/1208 [26:06<08:39,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=9.97e-5, train/loss_step=0.0248, global_step=1434.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  75%|███████▌  | 908/1208 [26:09<08:38,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=9.97e-5, train/loss_step=0.0248, global_step=1434.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  75%|███████▌  | 908/1208 [26:09<08:38,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.00063, train/loss_step=0.180, global_step=1434.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  75%|███████▌  | 909/1208 [26:10<08:36,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.00063, train/loss_step=0.180, global_step=1434.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  75%|███████▌  | 909/1208 [26:10<08:36,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.9e-5, train/loss_step=0.00344, global_step=1435.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  75%|███████▌  | 910/1208 [26:11<08:34,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.9e-5, train/loss_step=0.00344, global_step=1435.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  75%|███████▌  | 910/1208 [26:11<08:34,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00838, train/loss_vlb_step=3.88e-5, train/loss_step=0.00838, global_step=1435.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  75%|███████▌  | 911/1208 [26:12<08:32,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00838, train/loss_vlb_step=3.88e-5, train/loss_step=0.00838, global_step=1435.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  75%|███████▌  | 911/1208 [26:12<08:32,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0375, train/loss_vlb_step=0.000136, train/loss_step=0.0375, global_step=1435.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  75%|███████▌  | 912/1208 [26:15<08:31,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0375, train/loss_vlb_step=0.000136, train/loss_step=0.0375, global_step=1435.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  75%|███████▌  | 912/1208 [26:15<08:31,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00916, train/loss_vlb_step=4.36e-5, train/loss_step=0.00916, global_step=1435.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  76%|███████▌  | 913/1208 [26:16<08:29,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00916, train/loss_vlb_step=4.36e-5, train/loss_step=0.00916, global_step=1435.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  76%|███████▌  | 913/1208 [26:16<08:29,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000711, train/loss_step=0.199, global_step=1436.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  76%|███████▌  | 914/1208 [26:17<08:27,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000711, train/loss_step=0.199, global_step=1436.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  76%|███████▌  | 914/1208 [26:17<08:27,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000943, train/loss_step=0.232, global_step=1436.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  76%|███████▌  | 915/1208 [26:18<08:25,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000943, train/loss_step=0.232, global_step=1436.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  76%|███████▌  | 915/1208 [26:18<08:25,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.696, train/loss_vlb_step=0.0593, train/loss_step=0.696, global_step=1436.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  76%|███████▌  | 916/1208 [26:22<08:24,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.696, train/loss_vlb_step=0.0593, train/loss_step=0.696, global_step=1436.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  76%|███████▌  | 916/1208 [26:22<08:24,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0614, train/loss_vlb_step=0.000209, train/loss_step=0.0614, global_step=1436.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  76%|███████▌  | 917/1208 [26:23<08:22,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0614, train/loss_vlb_step=0.000209, train/loss_step=0.0614, global_step=1436.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  76%|███████▌  | 917/1208 [26:23<08:22,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00544, train/loss_vlb_step=2.79e-5, train/loss_step=0.00544, global_step=1437.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  76%|███████▌  | 918/1208 [26:24<08:20,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00544, train/loss_vlb_step=2.79e-5, train/loss_step=0.00544, global_step=1437.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  76%|███████▌  | 918/1208 [26:24<08:20,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000128, train/loss_step=0.0346, global_step=1437.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  76%|███████▌  | 919/1208 [26:25<08:18,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000128, train/loss_step=0.0346, global_step=1437.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  76%|███████▌  | 919/1208 [26:25<08:18,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000124, train/loss_step=0.0314, global_step=1437.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  76%|███████▌  | 920/1208 [26:28<08:17,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000124, train/loss_step=0.0314, global_step=1437.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  76%|███████▌  | 920/1208 [26:28<08:17,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000684, train/loss_step=0.178, global_step=1437.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  76%|███████▌  | 921/1208 [26:29<08:15,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000684, train/loss_step=0.178, global_step=1437.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  76%|███████▌  | 921/1208 [26:29<08:15,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00112, train/loss_step=0.271, global_step=1438.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  76%|███████▋  | 922/1208 [26:30<08:13,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00112, train/loss_step=0.271, global_step=1438.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  76%|███████▋  | 922/1208 [26:30<08:13,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=8.06e-5, train/loss_step=0.0193, global_step=1438.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  76%|███████▋  | 923/1208 [26:31<08:11,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=8.06e-5, train/loss_step=0.0193, global_step=1438.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  76%|███████▋  | 923/1208 [26:31<08:11,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=2.74e-5, train/loss_step=0.00518, global_step=1438.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  76%|███████▋  | 924/1208 [26:34<08:10,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=2.74e-5, train/loss_step=0.00518, global_step=1438.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  76%|███████▋  | 924/1208 [26:34<08:10,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000737, train/loss_step=0.207, global_step=1438.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  77%|███████▋  | 925/1208 [26:36<08:08,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000737, train/loss_step=0.207, global_step=1438.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  77%|███████▋  | 925/1208 [26:36<08:08,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.568, train/loss_vlb_step=0.00981, train/loss_step=0.568, global_step=1439.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  77%|███████▋  | 926/1208 [26:37<08:06,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.568, train/loss_vlb_step=0.00981, train/loss_step=0.568, global_step=1439.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  77%|███████▋  | 926/1208 [26:37<08:06,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=0.000104, train/loss_step=0.0261, global_step=1439.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  77%|███████▋  | 927/1208 [26:38<08:04,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=0.000104, train/loss_step=0.0261, global_step=1439.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  77%|███████▋  | 927/1208 [26:38<08:04,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.21e-5, train/loss_step=0.00409, global_step=1439.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  77%|███████▋  | 928/1208 [26:41<08:03,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.21e-5, train/loss_step=0.00409, global_step=1439.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  77%|███████▋  | 928/1208 [26:41<08:03,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00243, train/loss_step=0.364, global_step=1439.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  77%|███████▋  | 929/1208 [26:42<08:01,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00243, train/loss_step=0.364, global_step=1439.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  77%|███████▋  | 929/1208 [26:42<08:01,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0821, train/loss_vlb_step=0.000276, train/loss_step=0.0821, global_step=1440.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  77%|███████▋  | 930/1208 [26:43<07:59,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0821, train/loss_vlb_step=0.000276, train/loss_step=0.0821, global_step=1440.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  77%|███████▋  | 930/1208 [26:43<07:59,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000678, train/loss_step=0.197, global_step=1440.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  77%|███████▋  | 931/1208 [26:44<07:57,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000678, train/loss_step=0.197, global_step=1440.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  77%|███████▋  | 931/1208 [26:44<07:57,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=1.54e-5, train/loss_step=0.00271, global_step=1440.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  77%|███████▋  | 932/1208 [26:47<07:56,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=1.54e-5, train/loss_step=0.00271, global_step=1440.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  77%|███████▋  | 932/1208 [26:47<07:56,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.11e-5, train/loss_step=0.0115, global_step=1440.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  77%|███████▋  | 933/1208 [26:48<07:54,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.11e-5, train/loss_step=0.0115, global_step=1440.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  77%|███████▋  | 933/1208 [26:48<07:54,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=1.91e-5, train/loss_step=0.0034, global_step=1441.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  77%|███████▋  | 934/1208 [26:49<07:52,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=1.91e-5, train/loss_step=0.0034, global_step=1441.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  77%|███████▋  | 934/1208 [26:49<07:52,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=1.79e-5, train/loss_step=0.00315, global_step=1441.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  77%|███████▋  | 935/1208 [26:50<07:50,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=1.79e-5, train/loss_step=0.00315, global_step=1441.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  77%|███████▋  | 935/1208 [26:50<07:50,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00123, train/loss_step=0.283, global_step=1441.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  77%|███████▋  | 936/1208 [26:54<07:49,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00123, train/loss_step=0.283, global_step=1441.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  77%|███████▋  | 936/1208 [26:54<07:49,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=2.26e-5, train/loss_step=0.00413, global_step=1441.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  78%|███████▊  | 937/1208 [26:55<07:47,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=2.26e-5, train/loss_step=0.00413, global_step=1441.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  78%|███████▊  | 937/1208 [26:55<07:47,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000485, train/loss_step=0.142, global_step=1442.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  78%|███████▊  | 938/1208 [26:56<07:45,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000485, train/loss_step=0.142, global_step=1442.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  78%|███████▊  | 938/1208 [26:56<07:45,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000619, train/loss_step=0.178, global_step=1442.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  78%|███████▊  | 939/1208 [26:57<07:43,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000619, train/loss_step=0.178, global_step=1442.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  78%|███████▊  | 939/1208 [26:57<07:43,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0835, train/loss_vlb_step=0.000275, train/loss_step=0.0835, global_step=1442.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  78%|███████▊  | 940/1208 [27:00<07:42,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0835, train/loss_vlb_step=0.000275, train/loss_step=0.0835, global_step=1442.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  78%|███████▊  | 940/1208 [27:00<07:42,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=7.83e-5, train/loss_step=0.0199, global_step=1442.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  78%|███████▊  | 941/1208 [27:01<07:40,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=7.83e-5, train/loss_step=0.0199, global_step=1442.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  78%|███████▊  | 941/1208 [27:01<07:40,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000105, train/loss_step=0.0258, global_step=1443.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  78%|███████▊  | 942/1208 [27:02<07:38,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000105, train/loss_step=0.0258, global_step=1443.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  78%|███████▊  | 942/1208 [27:02<07:38,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000705, train/loss_step=0.192, global_step=1443.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  78%|███████▊  | 943/1208 [27:03<07:36,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000705, train/loss_step=0.192, global_step=1443.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  78%|███████▊  | 943/1208 [27:03<07:36,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=1.85e-5, train/loss_step=0.00325, global_step=1443.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  78%|███████▊  | 944/1208 [27:06<07:34,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=1.85e-5, train/loss_step=0.00325, global_step=1443.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  78%|███████▊  | 944/1208 [27:06<07:34,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00993, train/loss_vlb_step=4.81e-5, train/loss_step=0.00993, global_step=1443.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  78%|███████▊  | 945/1208 [27:07<07:33,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00993, train/loss_vlb_step=4.81e-5, train/loss_step=0.00993, global_step=1443.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  78%|███████▊  | 945/1208 [27:07<07:33,  1.72s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000708, train/loss_step=0.196, global_step=1444.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  78%|███████▊  | 946/1208 [27:08<07:31,  1.72s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000708, train/loss_step=0.196, global_step=1444.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  78%|███████▊  | 946/1208 [27:08<07:31,  1.72s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.73e-5, train/loss_step=0.024, global_step=1444.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  78%|███████▊  | 947/1208 [27:10<07:29,  1.72s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.73e-5, train/loss_step=0.024, global_step=1444.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  78%|███████▊  | 947/1208 [27:10<07:29,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00228, train/loss_step=0.359, global_step=1444.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  78%|███████▊  | 948/1208 [27:13<07:27,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00228, train/loss_step=0.359, global_step=1444.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  78%|███████▊  | 948/1208 [27:13<07:27,  1.72s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000429, train/loss_step=0.130, global_step=1444.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  79%|███████▊  | 949/1208 [27:14<07:26,  1.72s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000429, train/loss_step=0.130, global_step=1444.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  79%|███████▊  | 949/1208 [27:14<07:26,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000543, train/loss_step=0.157, global_step=1445.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  79%|███████▊  | 950/1208 [27:15<07:24,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000543, train/loss_step=0.157, global_step=1445.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  79%|███████▊  | 950/1208 [27:15<07:24,  1.72s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.2e-5, train/loss_step=0.00394, global_step=1445.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  79%|███████▊  | 951/1208 [27:16<07:22,  1.72s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.2e-5, train/loss_step=0.00394, global_step=1445.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  79%|███████▊  | 951/1208 [27:16<07:22,  1.72s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000151, train/loss_step=0.0406, global_step=1445.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  79%|███████▉  | 952/1208 [27:19<07:20,  1.72s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000151, train/loss_step=0.0406, global_step=1445.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  79%|███████▉  | 952/1208 [27:19<07:20,  1.72s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000414, train/loss_step=0.126, global_step=1445.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  79%|███████▉  | 953/1208 [27:20<07:19,  1.72s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000414, train/loss_step=0.126, global_step=1445.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  79%|███████▉  | 953/1208 [27:20<07:19,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.091, train/loss_vlb_step=0.000302, train/loss_step=0.091, global_step=1446.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  79%|███████▉  | 954/1208 [27:21<07:17,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.091, train/loss_vlb_step=0.000302, train/loss_step=0.091, global_step=1446.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  79%|███████▉  | 954/1208 [27:21<07:17,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00157, train/loss_step=0.292, global_step=1446.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  79%|███████▉  | 955/1208 [27:22<07:15,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00157, train/loss_step=0.292, global_step=1446.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  79%|███████▉  | 955/1208 [27:22<07:15,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.000155, train/loss_step=0.0425, global_step=1446.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  79%|███████▉  | 956/1208 [27:26<07:13,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.000155, train/loss_step=0.0425, global_step=1446.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  79%|███████▉  | 956/1208 [27:26<07:13,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.94e-5, train/loss_step=0.00331, global_step=1446.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  79%|███████▉  | 957/1208 [27:27<07:12,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.94e-5, train/loss_step=0.00331, global_step=1446.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  79%|███████▉  | 957/1208 [27:27<07:12,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00269, train/loss_step=0.381, global_step=1447.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  79%|███████▉  | 958/1208 [27:28<07:10,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00269, train/loss_step=0.381, global_step=1447.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  79%|███████▉  | 958/1208 [27:28<07:10,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.99e-5, train/loss_step=0.0135, global_step=1447.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  79%|███████▉  | 959/1208 [27:29<07:08,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.99e-5, train/loss_step=0.0135, global_step=1447.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  79%|███████▉  | 959/1208 [27:29<07:08,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000715, train/loss_step=0.206, global_step=1447.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  79%|███████▉  | 960/1208 [27:32<07:06,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000715, train/loss_step=0.206, global_step=1447.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  79%|███████▉  | 960/1208 [27:32<07:06,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000609, train/loss_step=0.174, global_step=1447.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  80%|███████▉  | 961/1208 [27:33<07:04,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000609, train/loss_step=0.174, global_step=1447.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  80%|███████▉  | 961/1208 [27:33<07:04,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00835, train/loss_vlb_step=4.12e-5, train/loss_step=0.00835, global_step=1448.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  80%|███████▉  | 962/1208 [27:34<07:03,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00835, train/loss_vlb_step=4.12e-5, train/loss_step=0.00835, global_step=1448.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  80%|███████▉  | 962/1208 [27:34<07:03,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0821, train/loss_vlb_step=0.000273, train/loss_step=0.0821, global_step=1448.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  80%|███████▉  | 963/1208 [27:35<07:01,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0821, train/loss_vlb_step=0.000273, train/loss_step=0.0821, global_step=1448.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  80%|███████▉  | 963/1208 [27:35<07:01,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=9.93e-6, train/loss_step=0.00166, global_step=1448.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  80%|███████▉  | 964/1208 [27:38<06:59,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=9.93e-6, train/loss_step=0.00166, global_step=1448.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  80%|███████▉  | 964/1208 [27:38<06:59,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=7.21e-5, train/loss_step=0.0156, global_step=1448.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  80%|███████▉  | 965/1208 [27:39<06:57,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=7.21e-5, train/loss_step=0.0156, global_step=1448.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  80%|███████▉  | 965/1208 [27:39<06:57,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.29e-5, train/loss_step=0.0167, global_step=1449.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  80%|███████▉  | 966/1208 [27:40<06:56,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.29e-5, train/loss_step=0.0167, global_step=1449.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  80%|███████▉  | 966/1208 [27:40<06:56,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000547, train/loss_step=0.165, global_step=1449.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  80%|████████  | 967/1208 [27:41<06:54,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000547, train/loss_step=0.165, global_step=1449.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  80%|████████  | 967/1208 [27:41<06:54,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.00103, train/loss_step=0.241, global_step=1449.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  80%|████████  | 968/1208 [27:45<06:52,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.00103, train/loss_step=0.241, global_step=1449.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  80%|████████  | 968/1208 [27:45<06:52,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.57e-5, train/loss_step=0.0026, global_step=1449.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  80%|████████  | 969/1208 [27:46<06:50,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.57e-5, train/loss_step=0.0026, global_step=1449.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  80%|████████  | 969/1208 [27:46<06:50,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.000963, train/loss_step=0.253, global_step=1450.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  80%|████████  | 970/1208 [27:47<06:49,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.000963, train/loss_step=0.253, global_step=1450.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  80%|████████  | 970/1208 [27:47<06:49,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7.64e-5, train/loss_step=0.0165, global_step=1450.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  80%|████████  | 971/1208 [27:48<06:47,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7.64e-5, train/loss_step=0.0165, global_step=1450.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  80%|████████  | 971/1208 [27:48<06:47,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.00013, train/loss_step=0.0332, global_step=1450.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  80%|████████  | 972/1208 [27:51<06:45,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.00013, train/loss_step=0.0332, global_step=1450.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  80%|████████  | 972/1208 [27:51<06:45,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00106, train/loss_step=0.266, global_step=1450.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  81%|████████  | 973/1208 [27:52<06:43,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00106, train/loss_step=0.266, global_step=1450.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  81%|████████  | 973/1208 [27:52<06:43,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.72e-5, train/loss_step=0.0191, global_step=1451.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  81%|████████  | 974/1208 [27:53<06:42,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.72e-5, train/loss_step=0.0191, global_step=1451.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  81%|████████  | 974/1208 [27:53<06:42,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000692, train/loss_step=0.192, global_step=1451.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  81%|████████  | 975/1208 [27:54<06:40,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000692, train/loss_step=0.192, global_step=1451.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  81%|████████  | 975/1208 [27:54<06:40,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000131, train/loss_step=0.0346, global_step=1451.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  81%|████████  | 976/1208 [27:57<06:38,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000131, train/loss_step=0.0346, global_step=1451.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  81%|████████  | 976/1208 [27:58<06:38,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.464, train/loss_vlb_step=0.00369, train/loss_step=0.464, global_step=1451.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  81%|████████  | 977/1208 [27:59<06:36,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.464, train/loss_vlb_step=0.00369, train/loss_step=0.464, global_step=1451.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  81%|████████  | 977/1208 [27:59<06:36,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.595, train/loss_vlb_step=0.0145, train/loss_step=0.595, global_step=1452.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  81%|████████  | 978/1208 [28:00<06:35,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.595, train/loss_vlb_step=0.0145, train/loss_step=0.595, global_step=1452.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  81%|████████  | 978/1208 [28:00<06:35,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00197, train/loss_step=0.369, global_step=1452.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  81%|████████  | 979/1208 [28:01<06:33,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00197, train/loss_step=0.369, global_step=1452.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  81%|████████  | 979/1208 [28:01<06:33,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000126, train/loss_step=0.0335, global_step=1452.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  81%|████████  | 980/1208 [28:04<06:31,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000126, train/loss_step=0.0335, global_step=1452.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  81%|████████  | 980/1208 [28:04<06:31,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.45e-5, train/loss_step=0.0119, global_step=1452.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  81%|████████  | 981/1208 [28:05<06:29,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.45e-5, train/loss_step=0.0119, global_step=1452.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  81%|████████  | 981/1208 [28:05<06:29,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000107, train/loss_step=0.0269, global_step=1453.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  81%|████████▏ | 982/1208 [28:06<06:28,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000107, train/loss_step=0.0269, global_step=1453.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  81%|████████▏ | 982/1208 [28:06<06:28,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00559, train/loss_step=0.447, global_step=1453.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  81%|████████▏ | 983/1208 [28:07<06:26,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00559, train/loss_step=0.447, global_step=1453.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  81%|████████▏ | 983/1208 [28:07<06:26,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000858, train/loss_step=0.228, global_step=1453.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  81%|████████▏ | 984/1208 [28:10<06:24,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000858, train/loss_step=0.228, global_step=1453.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  81%|████████▏ | 984/1208 [28:10<06:24,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.16e-5, train/loss_step=0.00191, global_step=1453.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  82%|████████▏ | 985/1208 [28:11<06:23,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.16e-5, train/loss_step=0.00191, global_step=1453.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  82%|████████▏ | 985/1208 [28:11<06:23,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00821, train/loss_vlb_step=3.99e-5, train/loss_step=0.00821, global_step=1454.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  82%|████████▏ | 986/1208 [28:12<06:21,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00821, train/loss_vlb_step=3.99e-5, train/loss_step=0.00821, global_step=1454.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  82%|████████▏ | 986/1208 [28:12<06:21,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00175, train/loss_step=0.341, global_step=1454.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  82%|████████▏ | 987/1208 [28:13<06:19,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00175, train/loss_step=0.341, global_step=1454.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  82%|████████▏ | 987/1208 [28:13<06:19,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000812, train/loss_step=0.202, global_step=1454.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  82%|████████▏ | 988/1208 [28:17<06:17,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000812, train/loss_step=0.202, global_step=1454.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  82%|████████▏ | 988/1208 [28:17<06:17,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.51e-5, train/loss_step=0.00265, global_step=1454.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  82%|████████▏ | 989/1208 [28:18<06:16,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.51e-5, train/loss_step=0.00265, global_step=1454.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  82%|████████▏ | 989/1208 [28:18<06:16,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000401, train/loss_step=0.121, global_step=1455.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  82%|████████▏ | 990/1208 [28:19<06:14,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000401, train/loss_step=0.121, global_step=1455.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  82%|████████▏ | 990/1208 [28:19<06:14,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000527, train/loss_step=0.156, global_step=1455.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  82%|████████▏ | 991/1208 [28:20<06:12,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000527, train/loss_step=0.156, global_step=1455.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  82%|████████▏ | 991/1208 [28:20<06:12,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.47e-5, train/loss_step=0.00246, global_step=1455.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  82%|████████▏ | 992/1208 [28:23<06:10,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.47e-5, train/loss_step=0.00246, global_step=1455.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  82%|████████▏ | 992/1208 [28:23<06:10,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.00044, train/loss_step=0.134, global_step=1455.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]     Epoch 4:  82%|████████▏ | 993/1208 [28:24<06:09,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.00044, train/loss_step=0.134, global_step=1455.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  82%|████████▏ | 993/1208 [28:24<06:09,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0637, train/loss_vlb_step=0.000221, train/loss_step=0.0637, global_step=1456.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  82%|████████▏ | 994/1208 [28:25<06:07,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0637, train/loss_vlb_step=0.000221, train/loss_step=0.0637, global_step=1456.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  82%|████████▏ | 994/1208 [28:25<06:07,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.99e-5, train/loss_step=0.0185, global_step=1456.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  82%|████████▏ | 995/1208 [28:26<06:05,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.99e-5, train/loss_step=0.0185, global_step=1456.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  82%|████████▏ | 995/1208 [28:26<06:05,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0871, train/loss_vlb_step=0.000297, train/loss_step=0.0871, global_step=1456.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  82%|████████▏ | 996/1208 [28:29<06:03,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0871, train/loss_vlb_step=0.000297, train/loss_step=0.0871, global_step=1456.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  82%|████████▏ | 996/1208 [28:29<06:03,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=2.14e-5, train/loss_step=0.00378, global_step=1456.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  83%|████████▎ | 997/1208 [28:31<06:02,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=2.14e-5, train/loss_step=0.00378, global_step=1456.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  83%|████████▎ | 997/1208 [28:31<06:02,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0753, train/loss_vlb_step=0.000259, train/loss_step=0.0753, global_step=1457.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  83%|████████▎ | 998/1208 [28:32<06:00,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0753, train/loss_vlb_step=0.000259, train/loss_step=0.0753, global_step=1457.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  83%|████████▎ | 998/1208 [28:32<06:00,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.00088, train/loss_step=0.232, global_step=1457.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  83%|████████▎ | 999/1208 [28:33<05:58,  1.71s/it, loss=0.11, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.00088, train/loss_step=0.232, global_step=1457.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  83%|████████▎ | 999/1208 [28:33<05:58,  1.71s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000115, train/loss_step=0.0288, global_step=1457.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  83%|████████▎ | 1000/1208 [28:36<05:56,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000115, train/loss_step=0.0288, global_step=1457.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  83%|████████▎ | 1000/1208 [28:36<05:56,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.628, train/loss_vlb_step=0.0207, train/loss_step=0.628, global_step=1457.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  83%|████████▎ | 1001/1208 [28:37<05:55,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.628, train/loss_vlb_step=0.0207, train/loss_step=0.628, global_step=1457.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  83%|████████▎ | 1001/1208 [28:37<05:55,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=7.1e-5, train/loss_step=0.0158, global_step=1458.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  83%|████████▎ | 1002/1208 [28:38<05:53,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=7.1e-5, train/loss_step=0.0158, global_step=1458.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  83%|████████▎ | 1002/1208 [28:38<05:53,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000115, train/loss_step=0.029, global_step=1458.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  83%|████████▎ | 1003/1208 [28:39<05:51,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000115, train/loss_step=0.029, global_step=1458.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  83%|████████▎ | 1003/1208 [28:39<05:51,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.97e-5, train/loss_step=0.0245, global_step=1458.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  83%|████████▎ | 1004/1208 [28:42<05:50,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.97e-5, train/loss_step=0.0245, global_step=1458.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  83%|████████▎ | 1004/1208 [28:42<05:50,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.0022, train/loss_step=0.352, global_step=1458.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  83%|████████▎ | 1005/1208 [28:43<05:48,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.0022, train/loss_step=0.352, global_step=1458.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  83%|████████▎ | 1005/1208 [28:43<05:48,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0771, train/loss_vlb_step=0.000258, train/loss_step=0.0771, global_step=1459.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  83%|████████▎ | 1006/1208 [28:44<05:46,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0771, train/loss_vlb_step=0.000258, train/loss_step=0.0771, global_step=1459.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  83%|████████▎ | 1006/1208 [28:44<05:46,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.0034, train/loss_step=0.378, global_step=1459.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  83%|████████▎ | 1007/1208 [28:45<05:44,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.0034, train/loss_step=0.378, global_step=1459.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  83%|████████▎ | 1007/1208 [28:45<05:44,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00331, train/loss_step=0.420, global_step=1459.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  83%|████████▎ | 1008/1208 [28:49<05:43,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00331, train/loss_step=0.420, global_step=1459.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  83%|████████▎ | 1008/1208 [28:49<05:43,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0693, train/loss_vlb_step=0.000238, train/loss_step=0.0693, global_step=1459.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  84%|████████▎ | 1009/1208 [28:50<05:41,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0693, train/loss_vlb_step=0.000238, train/loss_step=0.0693, global_step=1459.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  84%|████████▎ | 1009/1208 [28:50<05:41,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00583, train/loss_vlb_step=3.06e-5, train/loss_step=0.00583, global_step=1460.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  84%|████████▎ | 1010/1208 [28:51<05:39,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00583, train/loss_vlb_step=3.06e-5, train/loss_step=0.00583, global_step=1460.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  84%|████████▎ | 1010/1208 [28:51<05:39,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000584, train/loss_step=0.167, global_step=1460.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  84%|████████▎ | 1011/1208 [28:52<05:37,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000584, train/loss_step=0.167, global_step=1460.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  84%|████████▎ | 1011/1208 [28:52<05:37,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=2.28e-5, train/loss_step=0.00421, global_step=1460.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  84%|████████▍ | 1012/1208 [28:55<05:36,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=2.28e-5, train/loss_step=0.00421, global_step=1460.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  84%|████████▍ | 1012/1208 [28:55<05:36,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00139, train/loss_step=0.300, global_step=1460.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  84%|████████▍ | 1013/1208 [28:56<05:34,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00139, train/loss_step=0.300, global_step=1460.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  84%|████████▍ | 1013/1208 [28:56<05:34,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.06e-5, train/loss_step=0.018, global_step=1461.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  84%|████████▍ | 1014/1208 [28:57<05:32,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.06e-5, train/loss_step=0.018, global_step=1461.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  84%|████████▍ | 1014/1208 [28:57<05:32,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.66e-5, train/loss_step=0.00324, global_step=1461.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  84%|████████▍ | 1015/1208 [28:58<05:30,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.66e-5, train/loss_step=0.00324, global_step=1461.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  84%|████████▍ | 1015/1208 [28:58<05:30,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.552, train/loss_vlb_step=0.0154, train/loss_step=0.552, global_step=1461.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]     Epoch 4:  84%|████████▍ | 1016/1208 [29:01<05:29,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.552, train/loss_vlb_step=0.0154, train/loss_step=0.552, global_step=1461.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  84%|████████▍ | 1016/1208 [29:01<05:29,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0289, train/loss_vlb_step=0.000114, train/loss_step=0.0289, global_step=1461.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  84%|████████▍ | 1017/1208 [29:02<05:27,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0289, train/loss_vlb_step=0.000114, train/loss_step=0.0289, global_step=1461.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  84%|████████▍ | 1017/1208 [29:02<05:27,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=2.21e-5, train/loss_step=0.00388, global_step=1462.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  84%|████████▍ | 1018/1208 [29:03<05:25,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=2.21e-5, train/loss_step=0.00388, global_step=1462.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  84%|████████▍ | 1018/1208 [29:03<05:25,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.00051, train/loss_step=0.155, global_step=1462.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  84%|████████▍ | 1019/1208 [29:05<05:23,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.00051, train/loss_step=0.155, global_step=1462.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  84%|████████▍ | 1019/1208 [29:05<05:23,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.6e-5, train/loss_step=0.0028, global_step=1462.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  84%|████████▍ | 1020/1208 [29:08<05:22,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.6e-5, train/loss_step=0.0028, global_step=1462.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  84%|████████▍ | 1020/1208 [29:08<05:22,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00803, train/loss_vlb_step=4.06e-5, train/loss_step=0.00803, global_step=1462.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  85%|████████▍ | 1021/1208 [29:09<05:20,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00803, train/loss_vlb_step=4.06e-5, train/loss_step=0.00803, global_step=1462.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  85%|████████▍ | 1021/1208 [29:09<05:20,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.32e-5, train/loss_step=0.0114, global_step=1463.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  85%|████████▍ | 1022/1208 [29:10<05:18,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.32e-5, train/loss_step=0.0114, global_step=1463.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  85%|████████▍ | 1022/1208 [29:10<05:18,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.59e-5, train/loss_step=0.0142, global_step=1463.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  85%|████████▍ | 1023/1208 [29:11<05:16,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.59e-5, train/loss_step=0.0142, global_step=1463.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  85%|████████▍ | 1023/1208 [29:11<05:16,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000452, train/loss_step=0.134, global_step=1463.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  85%|████████▍ | 1024/1208 [29:14<05:15,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000452, train/loss_step=0.134, global_step=1463.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  85%|████████▍ | 1024/1208 [29:14<05:15,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.82e-5, train/loss_step=0.0105, global_step=1463.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  85%|████████▍ | 1025/1208 [29:15<05:13,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.82e-5, train/loss_step=0.0105, global_step=1463.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  85%|████████▍ | 1025/1208 [29:15<05:13,  1.71s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00306, train/loss_vlb_step=1.77e-5, train/loss_step=0.00306, global_step=1464.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  85%|████████▍ | 1026/1208 [29:16<05:11,  1.71s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00306, train/loss_vlb_step=1.77e-5, train/loss_step=0.00306, global_step=1464.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  85%|████████▍ | 1026/1208 [29:16<05:11,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.00046, train/loss_step=0.136, global_step=1464.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  85%|████████▌ | 1027/1208 [29:17<05:09,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.00046, train/loss_step=0.136, global_step=1464.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  85%|████████▌ | 1027/1208 [29:17<05:09,  1.71s/it, loss=0.0842, v_num=0, train/loss_simple_step=0.057, train/loss_vlb_step=0.000191, train/loss_step=0.057, global_step=1464.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  85%|████████▌ | 1028/1208 [29:21<05:08,  1.71s/it, loss=0.0842, v_num=0, train/loss_simple_step=0.057, train/loss_vlb_step=0.000191, train/loss_step=0.057, global_step=1464.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  85%|████████▌ | 1028/1208 [29:21<05:08,  1.71s/it, loss=0.0859, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=1464.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  85%|████████▌ | 1029/1208 [29:22<05:06,  1.71s/it, loss=0.0859, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=1464.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  85%|████████▌ | 1029/1208 [29:22<05:06,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00187, train/loss_step=0.320, global_step=1465.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  85%|████████▌ | 1030/1208 [29:23<05:04,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00187, train/loss_step=0.320, global_step=1465.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  85%|████████▌ | 1030/1208 [29:23<05:04,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000713, train/loss_step=0.202, global_step=1465.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  85%|████████▌ | 1031/1208 [29:24<05:02,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000713, train/loss_step=0.202, global_step=1465.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  85%|████████▌ | 1031/1208 [29:24<05:02,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000337, train/loss_step=0.103, global_step=1465.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  85%|████████▌ | 1032/1208 [29:27<05:01,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000337, train/loss_step=0.103, global_step=1465.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  85%|████████▌ | 1032/1208 [29:27<05:01,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00151, train/loss_step=0.309, global_step=1465.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  86%|████████▌ | 1033/1208 [29:28<04:59,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00151, train/loss_step=0.309, global_step=1465.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  86%|████████▌ | 1033/1208 [29:28<04:59,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=5.05e-5, train/loss_step=0.0106, global_step=1466.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  86%|████████▌ | 1034/1208 [29:29<04:57,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=5.05e-5, train/loss_step=0.0106, global_step=1466.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  86%|████████▌ | 1034/1208 [29:29<04:57,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00231, train/loss_step=0.389, global_step=1466.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  86%|████████▌ | 1035/1208 [29:30<04:55,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00231, train/loss_step=0.389, global_step=1466.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  86%|████████▌ | 1035/1208 [29:30<04:55,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000604, train/loss_step=0.177, global_step=1466.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  86%|████████▌ | 1036/1208 [29:33<04:54,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000604, train/loss_step=0.177, global_step=1466.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  86%|████████▌ | 1036/1208 [29:33<04:54,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00162, train/loss_step=0.333, global_step=1466.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  86%|████████▌ | 1037/1208 [29:34<04:52,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00162, train/loss_step=0.333, global_step=1466.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  86%|████████▌ | 1037/1208 [29:34<04:52,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000878, train/loss_step=0.225, global_step=1467.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  86%|████████▌ | 1038/1208 [29:35<04:50,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000878, train/loss_step=0.225, global_step=1467.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  86%|████████▌ | 1038/1208 [29:35<04:50,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.000166, train/loss_step=0.0476, global_step=1467.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  86%|████████▌ | 1039/1208 [29:36<04:49,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.000166, train/loss_step=0.0476, global_step=1467.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  86%|████████▌ | 1039/1208 [29:36<04:49,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=1.83e-5, train/loss_step=0.00322, global_step=1467.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  86%|████████▌ | 1040/1208 [29:40<04:47,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=1.83e-5, train/loss_step=0.00322, global_step=1467.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  86%|████████▌ | 1040/1208 [29:40<04:47,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.2e-5, train/loss_step=0.00199, global_step=1467.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  86%|████████▌ | 1041/1208 [29:41<04:45,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.2e-5, train/loss_step=0.00199, global_step=1467.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  86%|████████▌ | 1041/1208 [29:41<04:45,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000857, train/loss_step=0.216, global_step=1468.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  86%|████████▋ | 1042/1208 [29:42<04:43,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000857, train/loss_step=0.216, global_step=1468.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  86%|████████▋ | 1042/1208 [29:42<04:43,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00206, train/loss_step=0.374, global_step=1468.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  86%|████████▋ | 1043/1208 [29:43<04:42,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00206, train/loss_step=0.374, global_step=1468.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  86%|████████▋ | 1043/1208 [29:43<04:42,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.000925, train/loss_step=0.255, global_step=1468.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  86%|████████▋ | 1044/1208 [29:46<04:40,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.000925, train/loss_step=0.255, global_step=1468.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  86%|████████▋ | 1044/1208 [29:46<04:40,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0069, train/loss_vlb_step=3.48e-5, train/loss_step=0.0069, global_step=1468.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  87%|████████▋ | 1045/1208 [29:47<04:38,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0069, train/loss_vlb_step=3.48e-5, train/loss_step=0.0069, global_step=1468.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  87%|████████▋ | 1045/1208 [29:47<04:38,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000588, train/loss_step=0.174, global_step=1469.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  87%|████████▋ | 1046/1208 [29:48<04:36,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000588, train/loss_step=0.174, global_step=1469.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  87%|████████▋ | 1046/1208 [29:48<04:36,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0509, train/loss_vlb_step=0.000183, train/loss_step=0.0509, global_step=1469.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  87%|████████▋ | 1047/1208 [29:49<04:35,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0509, train/loss_vlb_step=0.000183, train/loss_step=0.0509, global_step=1469.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  87%|████████▋ | 1047/1208 [29:49<04:35,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000611, train/loss_step=0.175, global_step=1469.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  87%|████████▋ | 1048/1208 [29:52<04:33,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000611, train/loss_step=0.175, global_step=1469.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  87%|████████▋ | 1048/1208 [29:52<04:33,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00818, train/loss_vlb_step=3.94e-5, train/loss_step=0.00818, global_step=1469.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  87%|████████▋ | 1049/1208 [29:53<04:31,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00818, train/loss_vlb_step=3.94e-5, train/loss_step=0.00818, global_step=1469.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  87%|████████▋ | 1049/1208 [29:53<04:31,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000538, train/loss_step=0.152, global_step=1470.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  87%|████████▋ | 1050/1208 [29:54<04:30,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000538, train/loss_step=0.152, global_step=1470.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  87%|████████▋ | 1050/1208 [29:54<04:30,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=1470.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  87%|████████▋ | 1051/1208 [29:55<04:28,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=1470.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  87%|████████▋ | 1051/1208 [29:55<04:28,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0632, train/loss_vlb_step=0.000219, train/loss_step=0.0632, global_step=1470.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  87%|████████▋ | 1052/1208 [29:59<04:26,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0632, train/loss_vlb_step=0.000219, train/loss_step=0.0632, global_step=1470.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  87%|████████▋ | 1052/1208 [29:59<04:26,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000123, train/loss_step=0.0314, global_step=1470.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  87%|████████▋ | 1053/1208 [30:00<04:24,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000123, train/loss_step=0.0314, global_step=1470.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  87%|████████▋ | 1053/1208 [30:00<04:24,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.449, train/loss_vlb_step=0.00435, train/loss_step=0.449, global_step=1471.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  87%|████████▋ | 1054/1208 [30:01<04:23,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.449, train/loss_vlb_step=0.00435, train/loss_step=0.449, global_step=1471.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  87%|████████▋ | 1054/1208 [30:01<04:23,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=7.35e-5, train/loss_step=0.0162, global_step=1471.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  87%|████████▋ | 1055/1208 [30:02<04:21,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=7.35e-5, train/loss_step=0.0162, global_step=1471.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  87%|████████▋ | 1055/1208 [30:02<04:21,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.478, train/loss_vlb_step=0.00849, train/loss_step=0.478, global_step=1471.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  87%|████████▋ | 1056/1208 [30:05<04:19,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.478, train/loss_vlb_step=0.00849, train/loss_step=0.478, global_step=1471.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  87%|████████▋ | 1056/1208 [30:05<04:19,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0939, train/loss_vlb_step=0.000313, train/loss_step=0.0939, global_step=1471.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  88%|████████▊ | 1057/1208 [30:06<04:18,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0939, train/loss_vlb_step=0.000313, train/loss_step=0.0939, global_step=1471.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  88%|████████▊ | 1057/1208 [30:06<04:18,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00525, train/loss_vlb_step=2.75e-5, train/loss_step=0.00525, global_step=1472.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  88%|████████▊ | 1058/1208 [30:07<04:16,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00525, train/loss_vlb_step=2.75e-5, train/loss_step=0.00525, global_step=1472.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  88%|████████▊ | 1058/1208 [30:07<04:16,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0757, train/loss_vlb_step=0.000263, train/loss_step=0.0757, global_step=1472.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  88%|████████▊ | 1059/1208 [30:08<04:14,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0757, train/loss_vlb_step=0.000263, train/loss_step=0.0757, global_step=1472.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  88%|████████▊ | 1059/1208 [30:08<04:14,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000605, train/loss_step=0.170, global_step=1472.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  88%|████████▊ | 1060/1208 [30:11<04:12,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000605, train/loss_step=0.170, global_step=1472.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  88%|████████▊ | 1060/1208 [30:11<04:12,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=6.84e-5, train/loss_step=0.0163, global_step=1472.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  88%|████████▊ | 1061/1208 [30:12<04:11,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=6.84e-5, train/loss_step=0.0163, global_step=1472.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  88%|████████▊ | 1061/1208 [30:12<04:11,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.00078, train/loss_step=0.211, global_step=1473.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  88%|████████▊ | 1062/1208 [30:13<04:09,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.00078, train/loss_step=0.211, global_step=1473.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  88%|████████▊ | 1062/1208 [30:13<04:09,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.084, train/loss_vlb_step=0.000283, train/loss_step=0.084, global_step=1473.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  88%|████████▊ | 1063/1208 [30:14<04:07,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.084, train/loss_vlb_step=0.000283, train/loss_step=0.084, global_step=1473.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  88%|████████▊ | 1063/1208 [30:14<04:07,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.48e-5, train/loss_step=0.0202, global_step=1473.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  88%|████████▊ | 1064/1208 [30:18<04:06,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.48e-5, train/loss_step=0.0202, global_step=1473.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  88%|████████▊ | 1064/1208 [30:18<04:06,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00127, train/loss_step=0.260, global_step=1473.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  88%|████████▊ | 1065/1208 [30:19<04:04,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00127, train/loss_step=0.260, global_step=1473.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  88%|████████▊ | 1065/1208 [30:19<04:04,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000518, train/loss_step=0.150, global_step=1474.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  88%|████████▊ | 1066/1208 [30:20<04:02,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000518, train/loss_step=0.150, global_step=1474.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  88%|████████▊ | 1066/1208 [30:20<04:02,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00127, train/loss_step=0.286, global_step=1474.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  88%|████████▊ | 1067/1208 [30:21<04:00,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00127, train/loss_step=0.286, global_step=1474.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  88%|████████▊ | 1067/1208 [30:21<04:00,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000828, train/loss_step=0.212, global_step=1474.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  88%|████████▊ | 1068/1208 [30:24<03:59,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000828, train/loss_step=0.212, global_step=1474.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  88%|████████▊ | 1068/1208 [30:24<03:59,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0355, train/loss_vlb_step=0.00014, train/loss_step=0.0355, global_step=1474.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  88%|████████▊ | 1069/1208 [30:25<03:57,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0355, train/loss_vlb_step=0.00014, train/loss_step=0.0355, global_step=1474.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  88%|████████▊ | 1069/1208 [30:25<03:57,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00214, train/loss_step=0.336, global_step=1475.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  89%|████████▊ | 1070/1208 [30:26<03:55,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00214, train/loss_step=0.336, global_step=1475.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  89%|████████▊ | 1070/1208 [30:26<03:55,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=8.94e-5, train/loss_step=0.0229, global_step=1475.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  89%|████████▊ | 1071/1208 [30:27<03:53,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=8.94e-5, train/loss_step=0.0229, global_step=1475.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  89%|████████▊ | 1071/1208 [30:27<03:53,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=1475.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  89%|████████▊ | 1072/1208 [30:30<03:52,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=1475.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  89%|████████▊ | 1072/1208 [30:30<03:52,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00274, train/loss_step=0.423, global_step=1475.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  89%|████████▉ | 1073/1208 [30:32<03:50,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00274, train/loss_step=0.423, global_step=1475.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  89%|████████▉ | 1073/1208 [30:32<03:50,  1.71s/it, loss=0.171, v_num=0, train/loss_simple_step=0.410, train/loss_vlb_step=0.00241, train/loss_step=0.410, global_step=1476.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  89%|████████▉ | 1074/1208 [30:33<03:48,  1.71s/it, loss=0.171, v_num=0, train/loss_simple_step=0.410, train/loss_vlb_step=0.00241, train/loss_step=0.410, global_step=1476.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  89%|████████▉ | 1074/1208 [30:33<03:48,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0601, train/loss_vlb_step=0.000218, train/loss_step=0.0601, global_step=1476.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  89%|████████▉ | 1075/1208 [30:34<03:46,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0601, train/loss_vlb_step=0.000218, train/loss_step=0.0601, global_step=1476.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  89%|████████▉ | 1075/1208 [30:34<03:46,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0841, train/loss_vlb_step=0.000277, train/loss_step=0.0841, global_step=1476.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  89%|████████▉ | 1076/1208 [30:37<03:45,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0841, train/loss_vlb_step=0.000277, train/loss_step=0.0841, global_step=1476.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  89%|████████▉ | 1076/1208 [30:37<03:45,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0724, train/loss_vlb_step=0.000245, train/loss_step=0.0724, global_step=1476.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  89%|████████▉ | 1077/1208 [30:38<03:43,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0724, train/loss_vlb_step=0.000245, train/loss_step=0.0724, global_step=1476.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  89%|████████▉ | 1077/1208 [30:38<03:43,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.45e-5, train/loss_step=0.00475, global_step=1477.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  89%|████████▉ | 1078/1208 [30:39<03:41,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.45e-5, train/loss_step=0.00475, global_step=1477.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  89%|████████▉ | 1078/1208 [30:39<03:41,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000618, train/loss_step=0.177, global_step=1477.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  89%|████████▉ | 1079/1208 [30:40<03:40,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000618, train/loss_step=0.177, global_step=1477.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  89%|████████▉ | 1079/1208 [30:40<03:40,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000561, train/loss_step=0.165, global_step=1477.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  89%|████████▉ | 1080/1208 [30:43<03:38,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000561, train/loss_step=0.165, global_step=1477.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  89%|████████▉ | 1080/1208 [30:43<03:38,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.71e-5, train/loss_step=0.0101, global_step=1477.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  89%|████████▉ | 1081/1208 [30:44<03:36,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.71e-5, train/loss_step=0.0101, global_step=1477.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  89%|████████▉ | 1081/1208 [30:44<03:36,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00918, train/loss_vlb_step=4.41e-5, train/loss_step=0.00918, global_step=1478.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  90%|████████▉ | 1082/1208 [30:45<03:34,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00918, train/loss_vlb_step=4.41e-5, train/loss_step=0.00918, global_step=1478.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  90%|████████▉ | 1082/1208 [30:45<03:34,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.78e-5, train/loss_step=0.0203, global_step=1478.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  90%|████████▉ | 1083/1208 [30:46<03:33,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.78e-5, train/loss_step=0.0203, global_step=1478.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  90%|████████▉ | 1083/1208 [30:46<03:33,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00141, train/loss_step=0.301, global_step=1478.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  90%|████████▉ | 1084/1208 [30:50<03:31,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00141, train/loss_step=0.301, global_step=1478.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  90%|████████▉ | 1084/1208 [30:50<03:31,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=1478.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  90%|████████▉ | 1085/1208 [30:51<03:29,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=1478.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  90%|████████▉ | 1085/1208 [30:51<03:29,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00144, train/loss_step=0.312, global_step=1479.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  90%|████████▉ | 1086/1208 [30:52<03:28,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00144, train/loss_step=0.312, global_step=1479.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  90%|████████▉ | 1086/1208 [30:52<03:28,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.00044, train/loss_step=0.134, global_step=1479.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  90%|████████▉ | 1087/1208 [30:53<03:26,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.00044, train/loss_step=0.134, global_step=1479.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  90%|████████▉ | 1087/1208 [30:53<03:26,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0978, train/loss_vlb_step=0.000321, train/loss_step=0.0978, global_step=1479.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  90%|█████████ | 1088/1208 [30:56<03:24,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0978, train/loss_vlb_step=0.000321, train/loss_step=0.0978, global_step=1479.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  90%|█████████ | 1088/1208 [30:56<03:24,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00737, train/loss_vlb_step=3.88e-5, train/loss_step=0.00737, global_step=1479.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  90%|█████████ | 1089/1208 [30:57<03:22,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00737, train/loss_vlb_step=3.88e-5, train/loss_step=0.00737, global_step=1479.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  90%|█████████ | 1089/1208 [30:57<03:22,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000613, train/loss_step=0.174, global_step=1480.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  90%|█████████ | 1090/1208 [30:58<03:21,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000613, train/loss_step=0.174, global_step=1480.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  90%|█████████ | 1090/1208 [30:58<03:21,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.00033, train/loss_step=0.100, global_step=1480.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  90%|█████████ | 1091/1208 [30:59<03:19,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.00033, train/loss_step=0.100, global_step=1480.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  90%|█████████ | 1091/1208 [30:59<03:19,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0895, train/loss_vlb_step=0.000298, train/loss_step=0.0895, global_step=1480.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  90%|█████████ | 1092/1208 [31:02<03:17,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0895, train/loss_vlb_step=0.000298, train/loss_step=0.0895, global_step=1480.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  90%|█████████ | 1092/1208 [31:02<03:17,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000645, train/loss_step=0.187, global_step=1480.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  90%|█████████ | 1093/1208 [31:03<03:16,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000645, train/loss_step=0.187, global_step=1480.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  90%|█████████ | 1093/1208 [31:03<03:16,  1.71s/it, loss=0.115, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000589, train/loss_step=0.174, global_step=1481.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  91%|█████████ | 1094/1208 [31:04<03:14,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000589, train/loss_step=0.174, global_step=1481.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  91%|█████████ | 1094/1208 [31:04<03:14,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0981, train/loss_vlb_step=0.000327, train/loss_step=0.0981, global_step=1481.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  91%|█████████ | 1095/1208 [31:05<03:12,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0981, train/loss_vlb_step=0.000327, train/loss_step=0.0981, global_step=1481.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  91%|█████████ | 1095/1208 [31:05<03:12,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000981, train/loss_step=0.240, global_step=1481.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  91%|█████████ | 1096/1208 [31:09<03:11,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000981, train/loss_step=0.240, global_step=1481.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  91%|█████████ | 1096/1208 [31:09<03:11,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0939, train/loss_vlb_step=0.000311, train/loss_step=0.0939, global_step=1481.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  91%|█████████ | 1097/1208 [31:10<03:09,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0939, train/loss_vlb_step=0.000311, train/loss_step=0.0939, global_step=1481.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  91%|█████████ | 1097/1208 [31:10<03:09,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.58e-5, train/loss_step=0.00267, global_step=1482.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  91%|█████████ | 1098/1208 [31:11<03:07,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.58e-5, train/loss_step=0.00267, global_step=1482.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  91%|█████████ | 1098/1208 [31:11<03:07,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000795, train/loss_step=0.213, global_step=1482.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  91%|█████████ | 1099/1208 [31:12<03:05,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000795, train/loss_step=0.213, global_step=1482.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  91%|█████████ | 1099/1208 [31:12<03:05,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00424, train/loss_vlb_step=2.19e-5, train/loss_step=0.00424, global_step=1482.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  91%|█████████ | 1100/1208 [31:15<03:04,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00424, train/loss_vlb_step=2.19e-5, train/loss_step=0.00424, global_step=1482.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  91%|█████████ | 1100/1208 [31:15<03:04,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000119, train/loss_step=0.0307, global_step=1482.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  91%|█████████ | 1101/1208 [31:16<03:02,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000119, train/loss_step=0.0307, global_step=1482.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  91%|█████████ | 1101/1208 [31:16<03:02,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.55e-5, train/loss_step=0.0176, global_step=1483.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  91%|█████████ | 1102/1208 [31:17<03:00,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.55e-5, train/loss_step=0.0176, global_step=1483.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  91%|█████████ | 1102/1208 [31:17<03:00,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0589, train/loss_vlb_step=0.00021, train/loss_step=0.0589, global_step=1483.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  91%|█████████▏| 1103/1208 [31:18<02:58,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0589, train/loss_vlb_step=0.00021, train/loss_step=0.0589, global_step=1483.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  91%|█████████▏| 1103/1208 [31:18<02:58,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.000234, train/loss_step=0.0702, global_step=1483.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  91%|█████████▏| 1104/1208 [31:21<02:57,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.000234, train/loss_step=0.0702, global_step=1483.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  91%|█████████▏| 1104/1208 [31:21<02:57,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=1483.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  91%|█████████▏| 1105/1208 [31:23<02:55,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=1483.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  91%|█████████▏| 1105/1208 [31:23<02:55,  1.70s/it, loss=0.1, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=1484.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  92%|█████████▏| 1106/1208 [31:24<02:53,  1.70s/it, loss=0.1, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=1484.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  92%|█████████▏| 1106/1208 [31:24<02:53,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00183, train/loss_step=0.315, global_step=1484.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  92%|█████████▏| 1107/1208 [31:25<02:51,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00183, train/loss_step=0.315, global_step=1484.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  92%|█████████▏| 1107/1208 [31:25<02:51,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000585, train/loss_step=0.172, global_step=1484.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  92%|█████████▏| 1108/1208 [31:28<02:50,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000585, train/loss_step=0.172, global_step=1484.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  92%|█████████▏| 1108/1208 [31:28<02:50,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00781, train/loss_vlb_step=3.87e-5, train/loss_step=0.00781, global_step=1484.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  92%|█████████▏| 1109/1208 [31:29<02:48,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00781, train/loss_vlb_step=3.87e-5, train/loss_step=0.00781, global_step=1484.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  92%|█████████▏| 1109/1208 [31:29<02:48,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000107, train/loss_step=0.0264, global_step=1485.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  92%|█████████▏| 1110/1208 [31:30<02:46,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000107, train/loss_step=0.0264, global_step=1485.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  92%|█████████▏| 1110/1208 [31:30<02:46,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=1485.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  92%|█████████▏| 1111/1208 [31:31<02:45,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=1485.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  92%|█████████▏| 1111/1208 [31:31<02:45,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000155, train/loss_step=0.0437, global_step=1485.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  92%|█████████▏| 1112/1208 [31:34<02:43,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000155, train/loss_step=0.0437, global_step=1485.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  92%|█████████▏| 1112/1208 [31:34<02:43,  1.70s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.64e-5, train/loss_step=0.00286, global_step=1485.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  92%|█████████▏| 1113/1208 [31:35<02:41,  1.70s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.64e-5, train/loss_step=0.00286, global_step=1485.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  92%|█████████▏| 1113/1208 [31:35<02:41,  1.70s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000777, train/loss_step=0.212, global_step=1486.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  92%|█████████▏| 1114/1208 [31:36<02:40,  1.70s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000777, train/loss_step=0.212, global_step=1486.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  92%|█████████▏| 1114/1208 [31:36<02:40,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00118, train/loss_step=0.268, global_step=1486.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  92%|█████████▏| 1115/1208 [31:37<02:38,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00118, train/loss_step=0.268, global_step=1486.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  92%|█████████▏| 1115/1208 [31:37<02:38,  1.70s/it, loss=0.094, v_num=0, train/loss_simple_step=0.0289, train/loss_vlb_step=0.000112, train/loss_step=0.0289, global_step=1486.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  92%|█████████▏| 1116/1208 [31:41<02:36,  1.70s/it, loss=0.094, v_num=0, train/loss_simple_step=0.0289, train/loss_vlb_step=0.000112, train/loss_step=0.0289, global_step=1486.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  92%|█████████▏| 1116/1208 [31:41<02:36,  1.70s/it, loss=0.0895, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=2.04e-5, train/loss_step=0.00368, global_step=1486.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  92%|█████████▏| 1117/1208 [31:42<02:34,  1.70s/it, loss=0.0895, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=2.04e-5, train/loss_step=0.00368, global_step=1486.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  92%|█████████▏| 1117/1208 [31:42<02:34,  1.70s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.00646, train/loss_vlb_step=3.36e-5, train/loss_step=0.00646, global_step=1487.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  93%|█████████▎| 1118/1208 [31:43<02:33,  1.70s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.00646, train/loss_vlb_step=3.36e-5, train/loss_step=0.00646, global_step=1487.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  93%|█████████▎| 1118/1208 [31:43<02:33,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.519, train/loss_vlb_step=0.00718, train/loss_step=0.519, global_step=1487.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]     Epoch 4:  93%|█████████▎| 1119/1208 [31:44<02:31,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.519, train/loss_vlb_step=0.00718, train/loss_step=0.519, global_step=1487.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  93%|█████████▎| 1119/1208 [31:44<02:31,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00817, train/loss_vlb_step=4.04e-5, train/loss_step=0.00817, global_step=1487.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  93%|█████████▎| 1120/1208 [31:47<02:29,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00817, train/loss_vlb_step=4.04e-5, train/loss_step=0.00817, global_step=1487.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  93%|█████████▎| 1120/1208 [31:47<02:29,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00709, train/loss_vlb_step=3.5e-5, train/loss_step=0.00709, global_step=1487.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  93%|█████████▎| 1121/1208 [31:48<02:28,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00709, train/loss_vlb_step=3.5e-5, train/loss_step=0.00709, global_step=1487.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  93%|█████████▎| 1121/1208 [31:48<02:28,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.55e-5, train/loss_step=0.00274, global_step=1488.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  93%|█████████▎| 1122/1208 [31:49<02:26,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.55e-5, train/loss_step=0.00274, global_step=1488.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  93%|█████████▎| 1122/1208 [31:49<02:26,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000607, train/loss_step=0.175, global_step=1488.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  93%|█████████▎| 1123/1208 [31:50<02:24,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000607, train/loss_step=0.175, global_step=1488.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  93%|█████████▎| 1123/1208 [31:50<02:24,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00922, train/loss_vlb_step=4.35e-5, train/loss_step=0.00922, global_step=1488.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  93%|█████████▎| 1124/1208 [31:53<02:23,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00922, train/loss_vlb_step=4.35e-5, train/loss_step=0.00922, global_step=1488.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  93%|█████████▎| 1124/1208 [31:53<02:23,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=1488.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  93%|█████████▎| 1125/1208 [31:55<02:21,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=1488.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  93%|█████████▎| 1125/1208 [31:55<02:21,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0833, train/loss_vlb_step=0.000283, train/loss_step=0.0833, global_step=1489.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  93%|█████████▎| 1126/1208 [31:56<02:19,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0833, train/loss_vlb_step=0.000283, train/loss_step=0.0833, global_step=1489.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  93%|█████████▎| 1126/1208 [31:56<02:19,  1.70s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.0921, train/loss_vlb_step=0.000312, train/loss_step=0.0921, global_step=1489.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  93%|█████████▎| 1127/1208 [31:57<02:17,  1.70s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.0921, train/loss_vlb_step=0.000312, train/loss_step=0.0921, global_step=1489.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  93%|█████████▎| 1127/1208 [31:57<02:17,  1.70s/it, loss=0.094, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000635, train/loss_step=0.179, global_step=1489.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  93%|█████████▎| 1128/1208 [32:00<02:16,  1.70s/it, loss=0.094, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000635, train/loss_step=0.179, global_step=1489.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  93%|█████████▎| 1128/1208 [32:00<02:16,  1.70s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.0707, train/loss_vlb_step=0.000243, train/loss_step=0.0707, global_step=1489.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  93%|█████████▎| 1129/1208 [32:01<02:14,  1.70s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.0707, train/loss_vlb_step=0.000243, train/loss_step=0.0707, global_step=1489.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  93%|█████████▎| 1129/1208 [32:01<02:14,  1.70s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=8.68e-5, train/loss_step=0.0218, global_step=1490.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  94%|█████████▎| 1130/1208 [32:02<02:12,  1.70s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=8.68e-5, train/loss_step=0.0218, global_step=1490.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  94%|█████████▎| 1130/1208 [32:02<02:12,  1.70s/it, loss=0.0923, v_num=0, train/loss_simple_step=0.00799, train/loss_vlb_step=3.93e-5, train/loss_step=0.00799, global_step=1490.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  94%|█████████▎| 1131/1208 [32:03<02:10,  1.70s/it, loss=0.0923, v_num=0, train/loss_simple_step=0.00799, train/loss_vlb_step=3.93e-5, train/loss_step=0.00799, global_step=1490.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  94%|█████████▎| 1131/1208 [32:03<02:10,  1.70s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.00756, train/loss_vlb_step=3.61e-5, train/loss_step=0.00756, global_step=1490.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  94%|█████████▎| 1132/1208 [32:06<02:09,  1.70s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.00756, train/loss_vlb_step=3.61e-5, train/loss_step=0.00756, global_step=1490.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  94%|█████████▎| 1132/1208 [32:06<02:09,  1.70s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=1.79e-5, train/loss_step=0.00315, global_step=1490.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  94%|█████████▍| 1133/1208 [32:07<02:07,  1.70s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=1.79e-5, train/loss_step=0.00315, global_step=1490.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  94%|█████████▍| 1133/1208 [32:07<02:07,  1.70s/it, loss=0.0813, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000111, train/loss_step=0.0273, global_step=1491.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  94%|█████████▍| 1134/1208 [32:08<02:05,  1.70s/it, loss=0.0813, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000111, train/loss_step=0.0273, global_step=1491.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  94%|█████████▍| 1134/1208 [32:08<02:05,  1.70s/it, loss=0.07, v_num=0, train/loss_simple_step=0.0424, train/loss_vlb_step=0.000158, train/loss_step=0.0424, global_step=1491.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  94%|█████████▍| 1135/1208 [32:09<02:04,  1.70s/it, loss=0.07, v_num=0, train/loss_simple_step=0.0424, train/loss_vlb_step=0.000158, train/loss_step=0.0424, global_step=1491.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  94%|█████████▍| 1135/1208 [32:09<02:04,  1.70s/it, loss=0.0689, v_num=0, train/loss_simple_step=0.00708, train/loss_vlb_step=3.56e-5, train/loss_step=0.00708, global_step=1491.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  94%|█████████▍| 1136/1208 [32:13<02:02,  1.70s/it, loss=0.0689, v_num=0, train/loss_simple_step=0.00708, train/loss_vlb_step=3.56e-5, train/loss_step=0.00708, global_step=1491.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  94%|█████████▍| 1136/1208 [32:13<02:02,  1.70s/it, loss=0.0725, v_num=0, train/loss_simple_step=0.0749, train/loss_vlb_step=0.000252, train/loss_step=0.0749, global_step=1491.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  94%|█████████▍| 1137/1208 [32:14<02:00,  1.70s/it, loss=0.0725, v_num=0, train/loss_simple_step=0.0749, train/loss_vlb_step=0.000252, train/loss_step=0.0749, global_step=1491.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  94%|█████████▍| 1137/1208 [32:14<02:00,  1.70s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00219, train/loss_step=0.310, global_step=1492.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  94%|█████████▍| 1138/1208 [32:15<01:59,  1.70s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00219, train/loss_step=0.310, global_step=1492.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  94%|█████████▍| 1138/1208 [32:15<01:59,  1.70s/it, loss=0.0625, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=7.23e-5, train/loss_step=0.0164, global_step=1492.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  94%|█████████▍| 1139/1208 [32:16<01:57,  1.70s/it, loss=0.0625, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=7.23e-5, train/loss_step=0.0164, global_step=1492.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  94%|█████████▍| 1139/1208 [32:16<01:57,  1.70s/it, loss=0.0622, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=1.31e-5, train/loss_step=0.00227, global_step=1492.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  94%|█████████▍| 1140/1208 [32:19<01:55,  1.70s/it, loss=0.0622, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=1.31e-5, train/loss_step=0.00227, global_step=1492.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  94%|█████████▍| 1140/1208 [32:19<01:55,  1.70s/it, loss=0.0745, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00114, train/loss_step=0.254, global_step=1492.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  94%|█████████▍| 1141/1208 [32:20<01:53,  1.70s/it, loss=0.0745, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00114, train/loss_step=0.254, global_step=1492.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  94%|█████████▍| 1141/1208 [32:20<01:53,  1.70s/it, loss=0.0785, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.00027, train/loss_step=0.0815, global_step=1493.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  95%|█████████▍| 1142/1208 [32:21<01:52,  1.70s/it, loss=0.0785, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.00027, train/loss_step=0.0815, global_step=1493.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  95%|█████████▍| 1142/1208 [32:21<01:52,  1.70s/it, loss=0.091, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00339, train/loss_step=0.427, global_step=1493.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  95%|█████████▍| 1143/1208 [32:22<01:50,  1.70s/it, loss=0.091, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00339, train/loss_step=0.427, global_step=1493.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  95%|█████████▍| 1143/1208 [32:22<01:50,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000998, train/loss_step=0.246, global_step=1493.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  95%|█████████▍| 1144/1208 [32:25<01:48,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000998, train/loss_step=0.246, global_step=1493.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  95%|█████████▍| 1144/1208 [32:25<01:48,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.566, train/loss_vlb_step=0.0104, train/loss_step=0.566, global_step=1493.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  95%|█████████▍| 1145/1208 [32:26<01:47,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.566, train/loss_vlb_step=0.0104, train/loss_step=0.566, global_step=1493.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  95%|█████████▍| 1145/1208 [32:26<01:47,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=1.09e-5, train/loss_step=0.00179, global_step=1494.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  95%|█████████▍| 1146/1208 [32:28<01:45,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=1.09e-5, train/loss_step=0.00179, global_step=1494.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  95%|█████████▍| 1146/1208 [32:28<01:45,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00694, train/loss_vlb_step=3.41e-5, train/loss_step=0.00694, global_step=1494.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  95%|█████████▍| 1147/1208 [32:29<01:43,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00694, train/loss_vlb_step=3.41e-5, train/loss_step=0.00694, global_step=1494.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  95%|█████████▍| 1147/1208 [32:29<01:43,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.54e-5, train/loss_step=0.0242, global_step=1494.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  95%|█████████▌| 1148/1208 [32:32<01:42,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.54e-5, train/loss_step=0.0242, global_step=1494.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  95%|█████████▌| 1148/1208 [32:32<01:42,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00122, train/loss_step=0.278, global_step=1494.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  95%|█████████▌| 1149/1208 [32:33<01:40,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00122, train/loss_step=0.278, global_step=1494.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  95%|█████████▌| 1149/1208 [32:33<01:40,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.57e-5, train/loss_step=0.0207, global_step=1495.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  95%|█████████▌| 1150/1208 [32:34<01:38,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.57e-5, train/loss_step=0.0207, global_step=1495.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  95%|█████████▌| 1150/1208 [32:34<01:38,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.57e-5, train/loss_step=0.00273, global_step=1495.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  95%|█████████▌| 1151/1208 [32:35<01:36,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.57e-5, train/loss_step=0.00273, global_step=1495.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  95%|█████████▌| 1151/1208 [32:35<01:36,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=3.55e-5, train/loss_step=0.0072, global_step=1495.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  95%|█████████▌| 1152/1208 [32:38<01:35,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=3.55e-5, train/loss_step=0.0072, global_step=1495.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  95%|█████████▌| 1152/1208 [32:38<01:35,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000247, train/loss_step=0.0732, global_step=1495.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  95%|█████████▌| 1153/1208 [32:39<01:33,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000247, train/loss_step=0.0732, global_step=1495.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  95%|█████████▌| 1153/1208 [32:39<01:33,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.07e-5, train/loss_step=0.0145, global_step=1496.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  96%|█████████▌| 1154/1208 [32:40<01:31,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.07e-5, train/loss_step=0.0145, global_step=1496.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  96%|█████████▌| 1154/1208 [32:40<01:31,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00305, train/loss_step=0.432, global_step=1496.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  96%|█████████▌| 1155/1208 [32:41<01:30,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00305, train/loss_step=0.432, global_step=1496.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  96%|█████████▌| 1155/1208 [32:41<01:30,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00391, train/loss_vlb_step=2.1e-5, train/loss_step=0.00391, global_step=1496.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  96%|█████████▌| 1156/1208 [32:45<01:28,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00391, train/loss_vlb_step=2.1e-5, train/loss_step=0.00391, global_step=1496.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  96%|█████████▌| 1156/1208 [32:45<01:28,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000136, train/loss_step=0.0358, global_step=1496.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  96%|█████████▌| 1157/1208 [32:46<01:26,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000136, train/loss_step=0.0358, global_step=1496.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  96%|█████████▌| 1157/1208 [32:46<01:26,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.94e-5, train/loss_step=0.0106, global_step=1497.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  96%|█████████▌| 1158/1208 [32:47<01:24,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.94e-5, train/loss_step=0.0106, global_step=1497.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  96%|█████████▌| 1158/1208 [32:47<01:24,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00443, train/loss_step=0.476, global_step=1497.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  96%|█████████▌| 1159/1208 [32:48<01:23,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00443, train/loss_step=0.476, global_step=1497.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  96%|█████████▌| 1159/1208 [32:48<01:23,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=5.07e-5, train/loss_step=0.0107, global_step=1497.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  96%|█████████▌| 1160/1208 [32:51<01:21,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=5.07e-5, train/loss_step=0.0107, global_step=1497.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  96%|█████████▌| 1160/1208 [32:51<01:21,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0368, train/loss_vlb_step=0.000138, train/loss_step=0.0368, global_step=1497.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  96%|█████████▌| 1161/1208 [32:52<01:19,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0368, train/loss_vlb_step=0.000138, train/loss_step=0.0368, global_step=1497.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  96%|█████████▌| 1161/1208 [32:52<01:19,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000535, train/loss_step=0.157, global_step=1498.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  96%|█████████▌| 1162/1208 [32:53<01:18,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000535, train/loss_step=0.157, global_step=1498.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  96%|█████████▌| 1162/1208 [32:53<01:18,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000525, train/loss_step=0.159, global_step=1498.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  96%|█████████▋| 1163/1208 [32:54<01:16,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000525, train/loss_step=0.159, global_step=1498.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  96%|█████████▋| 1163/1208 [32:54<01:16,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0693, train/loss_vlb_step=0.000238, train/loss_step=0.0693, global_step=1498.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  96%|█████████▋| 1164/1208 [32:57<01:14,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0693, train/loss_vlb_step=0.000238, train/loss_step=0.0693, global_step=1498.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  96%|█████████▋| 1164/1208 [32:57<01:14,  1.70s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000391, train/loss_step=0.118, global_step=1498.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  96%|█████████▋| 1165/1208 [32:58<01:13,  1.70s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000391, train/loss_step=0.118, global_step=1498.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  96%|█████████▋| 1165/1208 [32:58<01:13,  1.70s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=9.1e-5, train/loss_step=0.0222, global_step=1499.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  97%|█████████▋| 1166/1208 [32:59<01:11,  1.70s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=9.1e-5, train/loss_step=0.0222, global_step=1499.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  97%|█████████▋| 1166/1208 [32:59<01:11,  1.70s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=9.03e-5, train/loss_step=0.0209, global_step=1499.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  97%|█████████▋| 1167/1208 [33:00<01:09,  1.70s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=9.03e-5, train/loss_step=0.0209, global_step=1499.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  97%|█████████▋| 1167/1208 [33:00<01:09,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00162, train/loss_step=0.327, global_step=1499.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  97%|█████████▋| 1168/1208 [33:04<01:07,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00162, train/loss_step=0.327, global_step=1499.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  97%|█████████▋| 1168/1208 [33:04<01:07,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00109, train/loss_step=0.271, global_step=1499.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  97%|█████████▋| 1169/1208 [33:05<01:06,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00109, train/loss_step=0.271, global_step=1499.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  97%|█████████▋| 1169/1208 [33:05<01:06,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0849, train/loss_vlb_step=0.000285, train/loss_step=0.0849, global_step=1500.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  97%|█████████▋| 1170/1208 [33:06<01:04,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0849, train/loss_vlb_step=0.000285, train/loss_step=0.0849, global_step=1500.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  97%|█████████▋| 1170/1208 [33:06<01:04,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000967, train/loss_step=0.237, global_step=1500.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  97%|█████████▋| 1171/1208 [33:07<01:02,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000967, train/loss_step=0.237, global_step=1500.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  97%|█████████▋| 1171/1208 [33:07<01:02,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000152, train/loss_step=0.0412, global_step=1500.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  97%|█████████▋| 1172/1208 [33:10<01:01,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000152, train/loss_step=0.0412, global_step=1500.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  97%|█████████▋| 1172/1208 [33:10<01:01,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.45e-5, train/loss_step=0.0113, global_step=1500.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  97%|█████████▋| 1173/1208 [33:11<00:59,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.45e-5, train/loss_step=0.0113, global_step=1500.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  97%|█████████▋| 1173/1208 [33:11<00:59,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=1501.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  97%|█████████▋| 1174/1208 [33:12<00:57,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=1501.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  97%|█████████▋| 1174/1208 [33:12<00:57,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000405, train/loss_step=0.123, global_step=1501.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  97%|█████████▋| 1175/1208 [33:13<00:55,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000405, train/loss_step=0.123, global_step=1501.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  97%|█████████▋| 1175/1208 [33:13<00:55,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00393, train/loss_vlb_step=2.2e-5, train/loss_step=0.00393, global_step=1501.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  97%|█████████▋| 1176/1208 [33:16<00:54,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00393, train/loss_vlb_step=2.2e-5, train/loss_step=0.00393, global_step=1501.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  97%|█████████▋| 1176/1208 [33:16<00:54,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=8.8e-5, train/loss_step=0.0223, global_step=1501.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  97%|█████████▋| 1177/1208 [33:17<00:52,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=8.8e-5, train/loss_step=0.0223, global_step=1501.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  97%|█████████▋| 1177/1208 [33:17<00:52,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000795, train/loss_step=0.223, global_step=1502.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  98%|█████████▊| 1178/1208 [33:19<00:50,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000795, train/loss_step=0.223, global_step=1502.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  98%|█████████▊| 1178/1208 [33:19<00:50,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00217, train/loss_step=0.365, global_step=1502.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  98%|█████████▊| 1179/1208 [33:20<00:49,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00217, train/loss_step=0.365, global_step=1502.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  98%|█████████▊| 1179/1208 [33:20<00:49,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000129, train/loss_step=0.0337, global_step=1502.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  98%|█████████▊| 1180/1208 [33:23<00:47,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000129, train/loss_step=0.0337, global_step=1502.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  98%|█████████▊| 1180/1208 [33:23<00:47,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.79e-5, train/loss_step=0.00312, global_step=1502.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  98%|█████████▊| 1181/1208 [33:24<00:45,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.79e-5, train/loss_step=0.00312, global_step=1502.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  98%|█████████▊| 1181/1208 [33:24<00:45,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000373, train/loss_step=0.114, global_step=1503.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  98%|█████████▊| 1182/1208 [33:25<00:44,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000373, train/loss_step=0.114, global_step=1503.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  98%|█████████▊| 1182/1208 [33:25<00:44,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.98e-5, train/loss_step=0.00352, global_step=1503.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  98%|█████████▊| 1183/1208 [33:26<00:42,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.98e-5, train/loss_step=0.00352, global_step=1503.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  98%|█████████▊| 1183/1208 [33:26<00:42,  1.70s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00307, train/loss_vlb_step=1.78e-5, train/loss_step=0.00307, global_step=1503.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  98%|█████████▊| 1184/1208 [33:29<00:40,  1.70s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00307, train/loss_vlb_step=1.78e-5, train/loss_step=0.00307, global_step=1503.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  98%|█████████▊| 1184/1208 [33:29<00:40,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.0017, train/loss_step=0.322, global_step=1503.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]     Epoch 4:  98%|█████████▊| 1185/1208 [33:30<00:39,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.0017, train/loss_step=0.322, global_step=1503.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  98%|█████████▊| 1185/1208 [33:30<00:39,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0341, train/loss_vlb_step=0.000134, train/loss_step=0.0341, global_step=1504.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  98%|█████████▊| 1186/1208 [33:31<00:37,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0341, train/loss_vlb_step=0.000134, train/loss_step=0.0341, global_step=1504.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  98%|█████████▊| 1186/1208 [33:31<00:37,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00256, train/loss_step=0.369, global_step=1504.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  98%|█████████▊| 1187/1208 [33:32<00:35,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00256, train/loss_step=0.369, global_step=1504.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  98%|█████████▊| 1187/1208 [33:32<00:35,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.692, train/loss_vlb_step=0.0397, train/loss_step=0.692, global_step=1504.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] Epoch 4:  98%|█████████▊| 1188/1208 [33:36<00:33,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.692, train/loss_vlb_step=0.0397, train/loss_step=0.692, global_step=1504.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  98%|█████████▊| 1188/1208 [33:36<00:33,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000688, train/loss_step=0.192, global_step=1504.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  98%|█████████▊| 1189/1208 [33:37<00:32,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000688, train/loss_step=0.192, global_step=1504.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  98%|█████████▊| 1189/1208 [33:37<00:32,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=1.42e-5, train/loss_step=0.0024, global_step=1505.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  99%|█████████▊| 1190/1208 [33:38<00:30,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=1.42e-5, train/loss_step=0.0024, global_step=1505.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  99%|█████████▊| 1190/1208 [33:38<00:30,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00293, train/loss_vlb_step=1.66e-5, train/loss_step=0.00293, global_step=1505.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  99%|█████████▊| 1191/1208 [33:39<00:28,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00293, train/loss_vlb_step=1.66e-5, train/loss_step=0.00293, global_step=1505.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  99%|█████████▊| 1191/1208 [33:39<00:28,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000462, train/loss_step=0.138, global_step=1505.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4:  99%|█████████▊| 1192/1208 [33:42<00:27,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000462, train/loss_step=0.138, global_step=1505.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  99%|█████████▊| 1192/1208 [33:42<00:27,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00679, train/loss_vlb_step=3.43e-5, train/loss_step=0.00679, global_step=1505.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  99%|█████████▉| 1193/1208 [33:43<00:25,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00679, train/loss_vlb_step=3.43e-5, train/loss_step=0.00679, global_step=1505.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  99%|█████████▉| 1193/1208 [33:43<00:25,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.78e-5, train/loss_step=0.019, global_step=1506.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  99%|█████████▉| 1194/1208 [33:44<00:23,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.78e-5, train/loss_step=0.019, global_step=1506.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  99%|█████████▉| 1194/1208 [33:44<00:23,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=9.04e-5, train/loss_step=0.022, global_step=1506.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  99%|█████████▉| 1195/1208 [33:45<00:22,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=9.04e-5, train/loss_step=0.022, global_step=1506.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  99%|█████████▉| 1195/1208 [33:45<00:22,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000137, train/loss_step=0.0367, global_step=1506.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  99%|█████████▉| 1196/1208 [33:49<00:20,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000137, train/loss_step=0.0367, global_step=1506.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  99%|█████████▉| 1196/1208 [33:49<00:20,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000119, train/loss_step=0.0304, global_step=1506.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  99%|█████████▉| 1197/1208 [33:50<00:18,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000119, train/loss_step=0.0304, global_step=1506.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  99%|█████████▉| 1197/1208 [33:50<00:18,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.495, train/loss_vlb_step=0.0081, train/loss_step=0.495, global_step=1507.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4:  99%|█████████▉| 1198/1208 [33:51<00:16,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.495, train/loss_vlb_step=0.0081, train/loss_step=0.495, global_step=1507.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  99%|█████████▉| 1198/1208 [33:51<00:16,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.47e-5, train/loss_step=0.0176, global_step=1507.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  99%|█████████▉| 1199/1208 [33:52<00:15,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.47e-5, train/loss_step=0.0176, global_step=1507.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  99%|█████████▉| 1199/1208 [33:52<00:15,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.514, train/loss_vlb_step=0.00456, train/loss_step=0.514, global_step=1507.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4:  99%|█████████▉| 1200/1208 [33:55<00:13,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.514, train/loss_vlb_step=0.00456, train/loss_step=0.514, global_step=1507.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  99%|█████████▉| 1200/1208 [33:55<00:13,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00933, train/loss_vlb_step=4.42e-5, train/loss_step=0.00933, global_step=1507.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.72it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.73it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.77it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.80it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.75it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.75it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.80it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.76it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.76it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.76it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.76it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.76it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.76it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.76it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.76it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.76it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.76it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.75it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.75it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.75it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.82it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 4:  99%|█████████▉| 1201/1208 [34:26<00:12,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00933, train/loss_vlb_step=4.42e-5, train/loss_step=0.00933, global_step=1507.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4:  99%|█████████▉| 1201/1208 [34:26<00:12,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000553, train/loss_step=0.154, global_step=1508.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]   Epoch 4: 100%|█████████▉| 1202/1208 [34:27<00:10,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000553, train/loss_step=0.154, global_step=1508.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4: 100%|█████████▉| 1202/1208 [34:27<00:10,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.52e-5, train/loss_step=0.0123, global_step=1508.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4: 100%|█████████▉| 1203/1208 [34:28<00:08,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.52e-5, train/loss_step=0.0123, global_step=1508.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4: 100%|█████████▉| 1203/1208 [34:28<00:08,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.602, train/loss_vlb_step=0.00913, train/loss_step=0.602, global_step=1508.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]  Epoch 4: 100%|█████████▉| 1204/1208 [34:31<00:06,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.602, train/loss_vlb_step=0.00913, train/loss_step=0.602, global_step=1508.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4: 100%|█████████▉| 1204/1208 [34:31<00:06,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0786, train/loss_vlb_step=0.000267, train/loss_step=0.0786, global_step=1508.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4: 100%|█████████▉| 1205/1208 [34:32<00:05,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0786, train/loss_vlb_step=0.000267, train/loss_step=0.0786, global_step=1508.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4: 100%|█████████▉| 1205/1208 [34:32<00:05,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.0033, train/loss_step=0.368, global_step=1509.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]    Epoch 4: 100%|█████████▉| 1206/1208 [34:33<00:03,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.0033, train/loss_step=0.368, global_step=1509.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4: 100%|█████████▉| 1206/1208 [34:33<00:03,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=1.99e-5, train/loss_step=0.00361, global_step=1509.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4: 100%|█████████▉| 1207/1208 [34:34<00:01,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=1.99e-5, train/loss_step=0.00361, global_step=1509.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4: 100%|█████████▉| 1207/1208 [34:34<00:01,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00998, train/loss_vlb_step=4.4e-5, train/loss_step=0.00998, global_step=1509.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4: 100%|██████████| 1208/1208 [34:39<00:00,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00998, train/loss_vlb_step=4.4e-5, train/loss_step=0.00998, global_step=1509.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 4: 100%|██████████| 1208/1208 [34:39<00:00,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=8.31e-5, train/loss_step=0.0192, global_step=1509.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140] 
+
+
+Epoch 4:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.127, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=8.31e-5, train/loss_step=0.0192, global_step=1509.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]           Epoch 5:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.127, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=8.31e-5, train/loss_step=0.0192, global_step=1509.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.83it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.83it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.80it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.83it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:23,  1.73it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.83it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.76it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.80it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.80it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.83it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.83it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.84it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.84it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.78it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.83it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.83it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.78it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.83it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.83it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.83it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.82it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.83it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.83it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.83it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.78it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.81it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.77it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.83it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.75it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.77it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.77it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.78it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]Epoch 5:   0%|          | 1/1208 [00:33<11:07:55, 33.20s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=8.31e-5, train/loss_step=0.0192, global_step=1509.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00205, train/loss_epoch=0.140]Epoch 5:   0%|          | 1/1208 [00:33<11:07:57, 33.20s/it, loss=0.142, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00149, train/loss_step=0.306, global_step=1510.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:   0%|          | 2/1208 [00:34<5:43:59, 17.11s/it, loss=0.142, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00149, train/loss_step=0.306, global_step=1510.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:   0%|          | 2/1208 [00:34<5:44:00, 17.11s/it, loss=0.151, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000588, train/loss_step=0.173, global_step=1510.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   0%|          | 3/1208 [00:35<3:56:00, 11.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000588, train/loss_step=0.173, global_step=1510.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   0%|          | 3/1208 [00:35<3:56:01, 11.75s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.00023, train/loss_step=0.0665, global_step=1510.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   0%|          | 4/1208 [00:38<3:12:20,  9.59s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.00023, train/loss_step=0.0665, global_step=1510.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   0%|          | 4/1208 [00:38<3:12:21,  9.59s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00628, train/loss_vlb_step=3.15e-5, train/loss_step=0.00628, global_step=1510.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   0%|          | 5/1208 [00:39<2:37:59,  7.88s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00628, train/loss_vlb_step=3.15e-5, train/loss_step=0.00628, global_step=1510.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   0%|          | 5/1208 [00:39<2:38:00,  7.88s/it, loss=0.156, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000704, train/loss_step=0.190, global_step=1511.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:   0%|          | 6/1208 [00:40<2:15:00,  6.74s/it, loss=0.156, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000704, train/loss_step=0.190, global_step=1511.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   0%|          | 6/1208 [00:40<2:15:00,  6.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000575, train/loss_step=0.170, global_step=1511.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   1%|          | 7/1208 [00:41<1:58:34,  5.92s/it, loss=0.163, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000575, train/loss_step=0.170, global_step=1511.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   1%|          | 7/1208 [00:41<1:58:34,  5.92s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0833, train/loss_vlb_step=0.000275, train/loss_step=0.0833, global_step=1511.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   1%|          | 8/1208 [00:44<1:51:51,  5.59s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0833, train/loss_vlb_step=0.000275, train/loss_step=0.0833, global_step=1511.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   1%|          | 8/1208 [00:44<1:51:51,  5.59s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0924, train/loss_vlb_step=0.000305, train/loss_step=0.0924, global_step=1511.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   1%|          | 9/1208 [00:45<1:41:43,  5.09s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0924, train/loss_vlb_step=0.000305, train/loss_step=0.0924, global_step=1511.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   1%|          | 9/1208 [00:45<1:41:43,  5.09s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.56e-5, train/loss_step=0.00255, global_step=1512.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   1%|          | 10/1208 [00:46<1:33:32,  4.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.56e-5, train/loss_step=0.00255, global_step=1512.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   1%|          | 10/1208 [00:46<1:33:33,  4.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00727, train/loss_vlb_step=3.73e-5, train/loss_step=0.00727, global_step=1512.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   1%|          | 11/1208 [00:47<1:26:52,  4.35s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00727, train/loss_vlb_step=3.73e-5, train/loss_step=0.00727, global_step=1512.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   1%|          | 11/1208 [00:47<1:26:52,  4.35s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0802, train/loss_vlb_step=0.000272, train/loss_step=0.0802, global_step=1512.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:   1%|          | 12/1208 [00:51<1:24:52,  4.26s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0802, train/loss_vlb_step=0.000272, train/loss_step=0.0802, global_step=1512.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   1%|          | 12/1208 [00:51<1:24:53,  4.26s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.31e-5, train/loss_step=0.0134, global_step=1512.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:   1%|          | 13/1208 [00:52<1:19:55,  4.01s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.31e-5, train/loss_step=0.0134, global_step=1512.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   1%|          | 13/1208 [00:52<1:19:55,  4.01s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0469, train/loss_vlb_step=0.000172, train/loss_step=0.0469, global_step=1513.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   1%|          | 14/1208 [00:53<1:15:37,  3.80s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0469, train/loss_vlb_step=0.000172, train/loss_step=0.0469, global_step=1513.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   1%|          | 14/1208 [00:53<1:15:37,  3.80s/it, loss=0.123, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000473, train/loss_step=0.144, global_step=1513.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:   1%|          | 15/1208 [00:54<1:11:54,  3.62s/it, loss=0.123, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000473, train/loss_step=0.144, global_step=1513.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   1%|          | 15/1208 [00:54<1:11:54,  3.62s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.0631, train/loss_vlb_step=0.000223, train/loss_step=0.0631, global_step=1513.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   1%|▏         | 16/1208 [00:57<1:11:20,  3.59s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.0631, train/loss_vlb_step=0.000223, train/loss_step=0.0631, global_step=1513.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   1%|▏         | 16/1208 [00:57<1:11:20,  3.59s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.0657, train/loss_vlb_step=0.000226, train/loss_step=0.0657, global_step=1513.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   1%|▏         | 17/1208 [00:58<1:08:19,  3.44s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.0657, train/loss_vlb_step=0.000226, train/loss_step=0.0657, global_step=1513.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   1%|▏         | 17/1208 [00:58<1:08:19,  3.44s/it, loss=0.0776, v_num=0, train/loss_simple_step=0.00836, train/loss_vlb_step=3.76e-5, train/loss_step=0.00836, global_step=1514.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   1%|▏         | 18/1208 [00:59<1:05:38,  3.31s/it, loss=0.0776, v_num=0, train/loss_simple_step=0.00836, train/loss_vlb_step=3.76e-5, train/loss_step=0.00836, global_step=1514.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   1%|▏         | 18/1208 [00:59<1:05:38,  3.31s/it, loss=0.0791, v_num=0, train/loss_simple_step=0.0341, train/loss_vlb_step=0.000128, train/loss_step=0.0341, global_step=1514.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:   2%|▏         | 19/1208 [01:00<1:03:12,  3.19s/it, loss=0.0791, v_num=0, train/loss_simple_step=0.0341, train/loss_vlb_step=0.000128, train/loss_step=0.0341, global_step=1514.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   2%|▏         | 19/1208 [01:00<1:03:12,  3.19s/it, loss=0.0824, v_num=0, train/loss_simple_step=0.0756, train/loss_vlb_step=0.000258, train/loss_step=0.0756, global_step=1514.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   2%|▏         | 20/1208 [01:03<1:03:11,  3.19s/it, loss=0.0824, v_num=0, train/loss_simple_step=0.0756, train/loss_vlb_step=0.000258, train/loss_step=0.0756, global_step=1514.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   2%|▏         | 20/1208 [01:03<1:03:11,  3.19s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000331, train/loss_step=0.100, global_step=1514.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:   2%|▏         | 21/1208 [01:04<1:01:08,  3.09s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000331, train/loss_step=0.100, global_step=1514.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   2%|▏         | 21/1208 [01:04<1:01:08,  3.09s/it, loss=0.0724, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000102, train/loss_step=0.0254, global_step=1515.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   2%|▏         | 22/1208 [01:05<59:14,  3.00s/it, loss=0.0724, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000102, train/loss_step=0.0254, global_step=1515.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:   2%|▏         | 22/1208 [01:05<59:14,  3.00s/it, loss=0.0718, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.00055, train/loss_step=0.162, global_step=1515.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:   2%|▏         | 23/1208 [01:06<57:30,  2.91s/it, loss=0.0718, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.00055, train/loss_step=0.162, global_step=1515.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   2%|▏         | 23/1208 [01:06<57:30,  2.91s/it, loss=0.0708, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000161, train/loss_step=0.0448, global_step=1515.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   2%|▏         | 24/1208 [01:10<57:45,  2.93s/it, loss=0.0708, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000161, train/loss_step=0.0448, global_step=1515.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   2%|▏         | 24/1208 [01:10<57:46,  2.93s/it, loss=0.0713, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.5e-5, train/loss_step=0.0163, global_step=1515.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:   2%|▏         | 25/1208 [01:11<56:13,  2.85s/it, loss=0.0713, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.5e-5, train/loss_step=0.0163, global_step=1515.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   2%|▏         | 25/1208 [01:11<56:14,  2.85s/it, loss=0.0641, v_num=0, train/loss_simple_step=0.0473, train/loss_vlb_step=0.00017, train/loss_step=0.0473, global_step=1516.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   2%|▏         | 26/1208 [01:12<54:48,  2.78s/it, loss=0.0641, v_num=0, train/loss_simple_step=0.0473, train/loss_vlb_step=0.00017, train/loss_step=0.0473, global_step=1516.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   2%|▏         | 26/1208 [01:12<54:48,  2.78s/it, loss=0.0612, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=1516.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:   2%|▏         | 27/1208 [01:13<53:29,  2.72s/it, loss=0.0612, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=1516.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   2%|▏         | 27/1208 [01:13<53:29,  2.72s/it, loss=0.0611, v_num=0, train/loss_simple_step=0.0824, train/loss_vlb_step=0.000272, train/loss_step=0.0824, global_step=1516.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   2%|▏         | 28/1208 [01:16<53:49,  2.74s/it, loss=0.0611, v_num=0, train/loss_simple_step=0.0824, train/loss_vlb_step=0.000272, train/loss_step=0.0824, global_step=1516.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   2%|▏         | 28/1208 [01:16<53:50,  2.74s/it, loss=0.0566, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.15e-5, train/loss_step=0.00191, global_step=1516.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   2%|▏         | 29/1208 [01:17<52:39,  2.68s/it, loss=0.0566, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.15e-5, train/loss_step=0.00191, global_step=1516.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   2%|▏         | 29/1208 [01:17<52:39,  2.68s/it, loss=0.0567, v_num=0, train/loss_simple_step=0.00547, train/loss_vlb_step=2.85e-5, train/loss_step=0.00547, global_step=1517.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   2%|▏         | 30/1208 [01:18<51:32,  2.63s/it, loss=0.0567, v_num=0, train/loss_simple_step=0.00547, train/loss_vlb_step=2.85e-5, train/loss_step=0.00547, global_step=1517.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   2%|▏         | 30/1208 [01:18<51:32,  2.63s/it, loss=0.0568, v_num=0, train/loss_simple_step=0.00924, train/loss_vlb_step=4.48e-5, train/loss_step=0.00924, global_step=1517.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   3%|▎         | 31/1208 [01:19<50:29,  2.57s/it, loss=0.0568, v_num=0, train/loss_simple_step=0.00924, train/loss_vlb_step=4.48e-5, train/loss_step=0.00924, global_step=1517.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   3%|▎         | 31/1208 [01:19<50:29,  2.57s/it, loss=0.0611, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000561, train/loss_step=0.166, global_step=1517.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:   3%|▎         | 32/1208 [01:23<50:51,  2.60s/it, loss=0.0611, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000561, train/loss_step=0.166, global_step=1517.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   3%|▎         | 32/1208 [01:23<50:51,  2.60s/it, loss=0.0702, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000713, train/loss_step=0.196, global_step=1517.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   3%|▎         | 33/1208 [01:24<49:55,  2.55s/it, loss=0.0702, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000713, train/loss_step=0.196, global_step=1517.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   3%|▎         | 33/1208 [01:24<49:55,  2.55s/it, loss=0.0681, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.74e-5, train/loss_step=0.00319, global_step=1518.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   3%|▎         | 34/1208 [01:25<49:00,  2.50s/it, loss=0.0681, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.74e-5, train/loss_step=0.00319, global_step=1518.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   3%|▎         | 34/1208 [01:25<49:00,  2.50s/it, loss=0.0625, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000123, train/loss_step=0.0333, global_step=1518.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:   3%|▎         | 35/1208 [01:26<48:09,  2.46s/it, loss=0.0625, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000123, train/loss_step=0.0333, global_step=1518.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   3%|▎         | 35/1208 [01:26<48:09,  2.46s/it, loss=0.0595, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.24e-5, train/loss_step=0.00208, global_step=1518.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   3%|▎         | 36/1208 [01:29<48:32,  2.48s/it, loss=0.0595, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.24e-5, train/loss_step=0.00208, global_step=1518.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   3%|▎         | 36/1208 [01:29<48:32,  2.49s/it, loss=0.0627, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000433, train/loss_step=0.131, global_step=1518.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:   3%|▎         | 37/1208 [01:30<47:44,  2.45s/it, loss=0.0627, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000433, train/loss_step=0.131, global_step=1518.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   3%|▎         | 37/1208 [01:30<47:44,  2.45s/it, loss=0.0737, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000846, train/loss_step=0.226, global_step=1519.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   3%|▎         | 38/1208 [01:31<46:58,  2.41s/it, loss=0.0737, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000846, train/loss_step=0.226, global_step=1519.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   3%|▎         | 38/1208 [01:31<46:59,  2.41s/it, loss=0.0778, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000387, train/loss_step=0.117, global_step=1519.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   3%|▎         | 39/1208 [01:32<46:15,  2.37s/it, loss=0.0778, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000387, train/loss_step=0.117, global_step=1519.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   3%|▎         | 39/1208 [01:32<46:15,  2.37s/it, loss=0.0819, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000529, train/loss_step=0.158, global_step=1519.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   3%|▎         | 40/1208 [01:35<46:39,  2.40s/it, loss=0.0819, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000529, train/loss_step=0.158, global_step=1519.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   3%|▎         | 40/1208 [01:35<46:39,  2.40s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00107, train/loss_step=0.259, global_step=1519.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:   3%|▎         | 41/1208 [01:36<45:59,  2.36s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00107, train/loss_step=0.259, global_step=1519.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   3%|▎         | 41/1208 [01:36<45:59,  2.36s/it, loss=0.09, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.000108, train/loss_step=0.0276, global_step=1520.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   3%|▎         | 42/1208 [01:37<45:19,  2.33s/it, loss=0.09, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.000108, train/loss_step=0.0276, global_step=1520.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   3%|▎         | 42/1208 [01:37<45:19,  2.33s/it, loss=0.0824, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.15e-5, train/loss_step=0.0109, global_step=1520.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   4%|▎         | 43/1208 [01:39<44:42,  2.30s/it, loss=0.0824, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.15e-5, train/loss_step=0.0109, global_step=1520.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   4%|▎         | 43/1208 [01:39<44:42,  2.30s/it, loss=0.114, v_num=0, train/loss_simple_step=0.676, train/loss_vlb_step=0.0388, train/loss_step=0.676, global_step=1520.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:   4%|▎         | 44/1208 [01:42<45:04,  2.32s/it, loss=0.114, v_num=0, train/loss_simple_step=0.676, train/loss_vlb_step=0.0388, train/loss_step=0.676, global_step=1520.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   4%|▎         | 44/1208 [01:42<45:04,  2.32s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=4.11e-5, train/loss_step=0.00783, global_step=1520.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   4%|▎         | 45/1208 [01:43<44:29,  2.30s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=4.11e-5, train/loss_step=0.00783, global_step=1520.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   4%|▎         | 45/1208 [01:43<44:29,  2.30s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000296, train/loss_step=0.0901, global_step=1521.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:   4%|▍         | 46/1208 [01:44<43:55,  2.27s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000296, train/loss_step=0.0901, global_step=1521.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   4%|▍         | 46/1208 [01:44<43:55,  2.27s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000131, train/loss_step=0.0348, global_step=1521.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   4%|▍         | 47/1208 [01:45<43:22,  2.24s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000131, train/loss_step=0.0348, global_step=1521.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   4%|▍         | 47/1208 [01:45<43:22,  2.24s/it, loss=0.112, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.00029, train/loss_step=0.087, global_step=1521.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:   4%|▍         | 48/1208 [01:48<43:45,  2.26s/it, loss=0.112, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.00029, train/loss_step=0.087, global_step=1521.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   4%|▍         | 48/1208 [01:48<43:45,  2.26s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00803, train/loss_vlb_step=3.99e-5, train/loss_step=0.00803, global_step=1521.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   4%|▍         | 49/1208 [01:49<43:15,  2.24s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00803, train/loss_vlb_step=3.99e-5, train/loss_step=0.00803, global_step=1521.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   4%|▍         | 49/1208 [01:49<43:15,  2.24s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=7.03e-5, train/loss_step=0.0164, global_step=1522.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:   4%|▍         | 50/1208 [01:50<42:45,  2.22s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=7.03e-5, train/loss_step=0.0164, global_step=1522.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   4%|▍         | 50/1208 [01:50<42:45,  2.22s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.05e-5, train/loss_step=0.00174, global_step=1522.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   4%|▍         | 51/1208 [01:51<42:16,  2.19s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.05e-5, train/loss_step=0.00174, global_step=1522.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   4%|▍         | 51/1208 [01:51<42:16,  2.19s/it, loss=0.111, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000455, train/loss_step=0.137, global_step=1522.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:   4%|▍         | 52/1208 [01:55<42:37,  2.21s/it, loss=0.111, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000455, train/loss_step=0.137, global_step=1522.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   4%|▍         | 52/1208 [01:55<42:37,  2.21s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000121, train/loss_step=0.0317, global_step=1522.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   4%|▍         | 53/1208 [01:56<42:10,  2.19s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000121, train/loss_step=0.0317, global_step=1522.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   4%|▍         | 53/1208 [01:56<42:10,  2.19s/it, loss=0.112, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000591, train/loss_step=0.178, global_step=1523.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:   4%|▍         | 54/1208 [01:57<41:43,  2.17s/it, loss=0.112, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000591, train/loss_step=0.178, global_step=1523.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   4%|▍         | 54/1208 [01:57<41:43,  2.17s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0324, train/loss_vlb_step=0.000127, train/loss_step=0.0324, global_step=1523.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   5%|▍         | 55/1208 [01:58<41:17,  2.15s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0324, train/loss_vlb_step=0.000127, train/loss_step=0.0324, global_step=1523.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   5%|▍         | 55/1208 [01:58<41:17,  2.15s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.000148, train/loss_step=0.0417, global_step=1523.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   5%|▍         | 56/1208 [02:01<41:37,  2.17s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.000148, train/loss_step=0.0417, global_step=1523.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   5%|▍         | 56/1208 [02:01<41:37,  2.17s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.64e-5, train/loss_step=0.0121, global_step=1523.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:   5%|▍         | 57/1208 [02:02<41:12,  2.15s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.64e-5, train/loss_step=0.0121, global_step=1523.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   5%|▍         | 57/1208 [02:02<41:12,  2.15s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.8e-5, train/loss_step=0.0149, global_step=1524.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   5%|▍         | 58/1208 [02:03<40:48,  2.13s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.8e-5, train/loss_step=0.0149, global_step=1524.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   5%|▍         | 58/1208 [02:03<40:48,  2.13s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000101, train/loss_step=0.0254, global_step=1524.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   5%|▍         | 59/1208 [02:04<40:25,  2.11s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000101, train/loss_step=0.0254, global_step=1524.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   5%|▍         | 59/1208 [02:04<40:25,  2.11s/it, loss=0.0863, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000121, train/loss_step=0.0328, global_step=1524.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   5%|▍         | 60/1208 [02:07<40:46,  2.13s/it, loss=0.0863, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000121, train/loss_step=0.0328, global_step=1524.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   5%|▍         | 60/1208 [02:07<40:46,  2.13s/it, loss=0.107, v_num=0, train/loss_simple_step=0.668, train/loss_vlb_step=0.0346, train/loss_step=0.668, global_step=1524.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]     Epoch 5:   5%|▌         | 61/1208 [02:08<40:24,  2.11s/it, loss=0.107, v_num=0, train/loss_simple_step=0.668, train/loss_vlb_step=0.0346, train/loss_step=0.668, global_step=1524.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   5%|▌         | 61/1208 [02:08<40:24,  2.11s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00501, train/loss_vlb_step=2.67e-5, train/loss_step=0.00501, global_step=1525.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   5%|▌         | 62/1208 [02:10<40:03,  2.10s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00501, train/loss_vlb_step=2.67e-5, train/loss_step=0.00501, global_step=1525.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   5%|▌         | 62/1208 [02:10<40:03,  2.10s/it, loss=0.106, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.87e-5, train/loss_step=0.021, global_step=1525.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:   5%|▌         | 63/1208 [02:11<39:41,  2.08s/it, loss=0.106, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.87e-5, train/loss_step=0.021, global_step=1525.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   5%|▌         | 63/1208 [02:11<39:41,  2.08s/it, loss=0.0735, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.85e-5, train/loss_step=0.0238, global_step=1525.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   5%|▌         | 64/1208 [02:14<40:00,  2.10s/it, loss=0.0735, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.85e-5, train/loss_step=0.0238, global_step=1525.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   5%|▌         | 64/1208 [02:14<40:00,  2.10s/it, loss=0.074, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=8.21e-5, train/loss_step=0.0187, global_step=1525.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:   5%|▌         | 65/1208 [02:15<39:39,  2.08s/it, loss=0.074, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=8.21e-5, train/loss_step=0.0187, global_step=1525.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   5%|▌         | 65/1208 [02:15<39:39,  2.08s/it, loss=0.0698, v_num=0, train/loss_simple_step=0.00482, train/loss_vlb_step=2.58e-5, train/loss_step=0.00482, global_step=1526.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   5%|▌         | 66/1208 [02:16<39:19,  2.07s/it, loss=0.0698, v_num=0, train/loss_simple_step=0.00482, train/loss_vlb_step=2.58e-5, train/loss_step=0.00482, global_step=1526.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   5%|▌         | 66/1208 [02:16<39:19,  2.07s/it, loss=0.0797, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000959, train/loss_step=0.234, global_step=1526.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:   6%|▌         | 67/1208 [02:17<39:00,  2.05s/it, loss=0.0797, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000959, train/loss_step=0.234, global_step=1526.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   6%|▌         | 67/1208 [02:17<39:00,  2.05s/it, loss=0.0758, v_num=0, train/loss_simple_step=0.00857, train/loss_vlb_step=4.34e-5, train/loss_step=0.00857, global_step=1526.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   6%|▌         | 68/1208 [02:20<39:17,  2.07s/it, loss=0.0758, v_num=0, train/loss_simple_step=0.00857, train/loss_vlb_step=4.34e-5, train/loss_step=0.00857, global_step=1526.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   6%|▌         | 68/1208 [02:20<39:17,  2.07s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000751, train/loss_step=0.200, global_step=1526.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:   6%|▌         | 69/1208 [02:21<38:59,  2.05s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000751, train/loss_step=0.200, global_step=1526.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   6%|▌         | 69/1208 [02:21<38:59,  2.05s/it, loss=0.0952, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000765, train/loss_step=0.213, global_step=1527.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   6%|▌         | 70/1208 [02:22<38:40,  2.04s/it, loss=0.0952, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000765, train/loss_step=0.213, global_step=1527.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   6%|▌         | 70/1208 [02:22<38:40,  2.04s/it, loss=0.104, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000643, train/loss_step=0.175, global_step=1527.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:   6%|▌         | 71/1208 [02:23<38:22,  2.03s/it, loss=0.104, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000643, train/loss_step=0.175, global_step=1527.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   6%|▌         | 71/1208 [02:23<38:22,  2.03s/it, loss=0.107, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000726, train/loss_step=0.209, global_step=1527.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   6%|▌         | 72/1208 [02:26<38:39,  2.04s/it, loss=0.107, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000726, train/loss_step=0.209, global_step=1527.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   6%|▌         | 72/1208 [02:26<38:39,  2.04s/it, loss=0.121, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00153, train/loss_step=0.301, global_step=1527.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:   6%|▌         | 73/1208 [02:28<38:21,  2.03s/it, loss=0.121, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00153, train/loss_step=0.301, global_step=1527.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   6%|▌         | 73/1208 [02:28<38:22,  2.03s/it, loss=0.122, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000769, train/loss_step=0.209, global_step=1528.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   6%|▌         | 74/1208 [02:29<38:05,  2.02s/it, loss=0.122, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000769, train/loss_step=0.209, global_step=1528.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   6%|▌         | 74/1208 [02:29<38:05,  2.02s/it, loss=0.134, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00108, train/loss_step=0.256, global_step=1528.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:   6%|▌         | 75/1208 [02:30<37:48,  2.00s/it, loss=0.134, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00108, train/loss_step=0.256, global_step=1528.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   6%|▌         | 75/1208 [02:30<37:48,  2.00s/it, loss=0.158, v_num=0, train/loss_simple_step=0.522, train/loss_vlb_step=0.00506, train/loss_step=0.522, global_step=1528.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   6%|▋         | 76/1208 [02:33<38:04,  2.02s/it, loss=0.158, v_num=0, train/loss_simple_step=0.522, train/loss_vlb_step=0.00506, train/loss_step=0.522, global_step=1528.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   6%|▋         | 76/1208 [02:33<38:04,  2.02s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00934, train/loss_vlb_step=4.4e-5, train/loss_step=0.00934, global_step=1528.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   6%|▋         | 77/1208 [02:34<37:48,  2.01s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00934, train/loss_vlb_step=4.4e-5, train/loss_step=0.00934, global_step=1528.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   6%|▋         | 77/1208 [02:34<37:48,  2.01s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.94e-5, train/loss_step=0.0245, global_step=1529.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:   6%|▋         | 78/1208 [02:35<37:32,  1.99s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.94e-5, train/loss_step=0.0245, global_step=1529.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   6%|▋         | 78/1208 [02:35<37:32,  1.99s/it, loss=0.171, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00145, train/loss_step=0.288, global_step=1529.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:   7%|▋         | 79/1208 [02:36<37:17,  1.98s/it, loss=0.171, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00145, train/loss_step=0.288, global_step=1529.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   7%|▋         | 79/1208 [02:36<37:17,  1.98s/it, loss=0.187, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.0022, train/loss_step=0.356, global_step=1529.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:   7%|▋         | 80/1208 [02:39<37:33,  2.00s/it, loss=0.187, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.0022, train/loss_step=0.356, global_step=1529.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   7%|▋         | 80/1208 [02:39<37:33,  2.00s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0704, train/loss_vlb_step=0.000236, train/loss_step=0.0704, global_step=1529.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   7%|▋         | 81/1208 [02:40<37:18,  1.99s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0704, train/loss_vlb_step=0.000236, train/loss_step=0.0704, global_step=1529.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   7%|▋         | 81/1208 [02:40<37:18,  1.99s/it, loss=0.163, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000357, train/loss_step=0.108, global_step=1530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:   7%|▋         | 82/1208 [02:41<37:03,  1.97s/it, loss=0.163, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000357, train/loss_step=0.108, global_step=1530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   7%|▋         | 82/1208 [02:41<37:03,  1.97s/it, loss=0.167, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=1530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   7%|▋         | 83/1208 [02:42<36:48,  1.96s/it, loss=0.167, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=1530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   7%|▋         | 83/1208 [02:42<36:48,  1.96s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.000172, train/loss_step=0.0471, global_step=1530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   7%|▋         | 84/1208 [02:46<37:04,  1.98s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.000172, train/loss_step=0.0471, global_step=1530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   7%|▋         | 84/1208 [02:46<37:04,  1.98s/it, loss=0.183, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00177, train/loss_step=0.315, global_step=1530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:   7%|▋         | 85/1208 [02:47<36:50,  1.97s/it, loss=0.183, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00177, train/loss_step=0.315, global_step=1530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   7%|▋         | 85/1208 [02:47<36:50,  1.97s/it, loss=0.201, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00207, train/loss_step=0.375, global_step=1531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   7%|▋         | 86/1208 [02:48<36:36,  1.96s/it, loss=0.201, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00207, train/loss_step=0.375, global_step=1531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   7%|▋         | 86/1208 [02:48<36:36,  1.96s/it, loss=0.201, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000937, train/loss_step=0.236, global_step=1531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   7%|▋         | 87/1208 [02:49<36:22,  1.95s/it, loss=0.201, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000937, train/loss_step=0.236, global_step=1531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   7%|▋         | 87/1208 [02:49<36:22,  1.95s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0975, train/loss_vlb_step=0.000323, train/loss_step=0.0975, global_step=1531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   7%|▋         | 88/1208 [02:52<36:36,  1.96s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0975, train/loss_vlb_step=0.000323, train/loss_step=0.0975, global_step=1531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   7%|▋         | 88/1208 [02:52<36:36,  1.96s/it, loss=0.212, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00146, train/loss_step=0.334, global_step=1531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:   7%|▋         | 89/1208 [02:53<36:23,  1.95s/it, loss=0.212, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00146, train/loss_step=0.334, global_step=1531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   7%|▋         | 89/1208 [02:53<36:23,  1.95s/it, loss=0.216, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00131, train/loss_step=0.284, global_step=1532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   7%|▋         | 90/1208 [02:54<36:09,  1.94s/it, loss=0.216, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00131, train/loss_step=0.284, global_step=1532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   7%|▋         | 90/1208 [02:54<36:10,  1.94s/it, loss=0.208, v_num=0, train/loss_simple_step=0.00884, train/loss_vlb_step=4.16e-5, train/loss_step=0.00884, global_step=1532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   8%|▊         | 91/1208 [02:55<35:57,  1.93s/it, loss=0.208, v_num=0, train/loss_simple_step=0.00884, train/loss_vlb_step=4.16e-5, train/loss_step=0.00884, global_step=1532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   8%|▊         | 91/1208 [02:55<35:57,  1.93s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0708, train/loss_vlb_step=0.000244, train/loss_step=0.0708, global_step=1532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:   8%|▊         | 92/1208 [02:58<36:10,  1.95s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0708, train/loss_vlb_step=0.000244, train/loss_step=0.0708, global_step=1532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   8%|▊         | 92/1208 [02:58<36:10,  1.95s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000158, train/loss_step=0.0454, global_step=1532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   8%|▊         | 93/1208 [03:00<35:58,  1.94s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000158, train/loss_step=0.0454, global_step=1532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   8%|▊         | 93/1208 [03:00<35:58,  1.94s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000115, train/loss_step=0.0319, global_step=1533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   8%|▊         | 94/1208 [03:01<35:45,  1.93s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000115, train/loss_step=0.0319, global_step=1533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   8%|▊         | 94/1208 [03:01<35:45,  1.93s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.14e-5, train/loss_step=0.0142, global_step=1533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:   8%|▊         | 95/1208 [03:02<35:33,  1.92s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.14e-5, train/loss_step=0.0142, global_step=1533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   8%|▊         | 95/1208 [03:02<35:33,  1.92s/it, loss=0.164, v_num=0, train/loss_simple_step=0.461, train/loss_vlb_step=0.00419, train/loss_step=0.461, global_step=1533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:   8%|▊         | 96/1208 [03:05<35:46,  1.93s/it, loss=0.164, v_num=0, train/loss_simple_step=0.461, train/loss_vlb_step=0.00419, train/loss_step=0.461, global_step=1533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   8%|▊         | 96/1208 [03:05<35:46,  1.93s/it, loss=0.17, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000437, train/loss_step=0.133, global_step=1533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   8%|▊         | 97/1208 [03:06<35:35,  1.92s/it, loss=0.17, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000437, train/loss_step=0.133, global_step=1533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   8%|▊         | 97/1208 [03:06<35:35,  1.92s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00922, train/loss_vlb_step=4.38e-5, train/loss_step=0.00922, global_step=1534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   8%|▊         | 98/1208 [03:07<35:23,  1.91s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00922, train/loss_vlb_step=4.38e-5, train/loss_step=0.00922, global_step=1534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   8%|▊         | 98/1208 [03:07<35:23,  1.91s/it, loss=0.161, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.0004, train/loss_step=0.122, global_step=1534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]     Epoch 5:   8%|▊         | 99/1208 [03:08<35:11,  1.90s/it, loss=0.161, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.0004, train/loss_step=0.122, global_step=1534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   8%|▊         | 99/1208 [03:08<35:11,  1.90s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0539, train/loss_vlb_step=0.000189, train/loss_step=0.0539, global_step=1534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   8%|▊         | 100/1208 [03:11<35:24,  1.92s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0539, train/loss_vlb_step=0.000189, train/loss_step=0.0539, global_step=1534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   8%|▊         | 100/1208 [03:11<35:24,  1.92s/it, loss=0.157, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00126, train/loss_step=0.291, global_step=1534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:   8%|▊         | 101/1208 [03:12<35:13,  1.91s/it, loss=0.157, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00126, train/loss_step=0.291, global_step=1534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   8%|▊         | 101/1208 [03:12<35:13,  1.91s/it, loss=0.161, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000772, train/loss_step=0.195, global_step=1535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   8%|▊         | 102/1208 [03:13<35:01,  1.90s/it, loss=0.161, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000772, train/loss_step=0.195, global_step=1535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   8%|▊         | 102/1208 [03:13<35:01,  1.90s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0853, train/loss_vlb_step=0.000284, train/loss_step=0.0853, global_step=1535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   9%|▊         | 103/1208 [03:14<34:50,  1.89s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0853, train/loss_vlb_step=0.000284, train/loss_step=0.0853, global_step=1535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   9%|▊         | 103/1208 [03:14<34:50,  1.89s/it, loss=0.164, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000391, train/loss_step=0.118, global_step=1535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:   9%|▊         | 104/1208 [03:18<35:03,  1.91s/it, loss=0.164, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000391, train/loss_step=0.118, global_step=1535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   9%|▊         | 104/1208 [03:18<35:03,  1.91s/it, loss=0.165, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00262, train/loss_step=0.343, global_step=1535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:   9%|▊         | 105/1208 [03:19<34:52,  1.90s/it, loss=0.165, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00262, train/loss_step=0.343, global_step=1535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   9%|▊         | 105/1208 [03:19<34:52,  1.90s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00849, train/loss_vlb_step=4.02e-5, train/loss_step=0.00849, global_step=1536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   9%|▉         | 106/1208 [03:20<34:42,  1.89s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00849, train/loss_vlb_step=4.02e-5, train/loss_step=0.00849, global_step=1536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   9%|▉         | 106/1208 [03:20<34:42,  1.89s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000202, train/loss_step=0.0555, global_step=1536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:   9%|▉         | 107/1208 [03:21<34:31,  1.88s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000202, train/loss_step=0.0555, global_step=1536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   9%|▉         | 107/1208 [03:21<34:31,  1.88s/it, loss=0.141, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000534, train/loss_step=0.159, global_step=1536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:   9%|▉         | 108/1208 [03:24<34:43,  1.89s/it, loss=0.141, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000534, train/loss_step=0.159, global_step=1536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   9%|▉         | 108/1208 [03:24<34:43,  1.89s/it, loss=0.135, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000834, train/loss_step=0.219, global_step=1536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   9%|▉         | 109/1208 [03:25<34:33,  1.89s/it, loss=0.135, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000834, train/loss_step=0.219, global_step=1536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   9%|▉         | 109/1208 [03:25<34:33,  1.89s/it, loss=0.135, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00112, train/loss_step=0.267, global_step=1537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:   9%|▉         | 110/1208 [03:26<34:23,  1.88s/it, loss=0.135, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00112, train/loss_step=0.267, global_step=1537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   9%|▉         | 110/1208 [03:26<34:23,  1.88s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0971, train/loss_vlb_step=0.000321, train/loss_step=0.0971, global_step=1537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   9%|▉         | 111/1208 [03:27<34:13,  1.87s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0971, train/loss_vlb_step=0.000321, train/loss_step=0.0971, global_step=1537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   9%|▉         | 111/1208 [03:27<34:13,  1.87s/it, loss=0.152, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00187, train/loss_step=0.322, global_step=1537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:   9%|▉         | 112/1208 [03:30<34:24,  1.88s/it, loss=0.152, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00187, train/loss_step=0.322, global_step=1537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   9%|▉         | 112/1208 [03:30<34:24,  1.88s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.25e-5, train/loss_step=0.0116, global_step=1537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   9%|▉         | 113/1208 [03:32<34:14,  1.88s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.25e-5, train/loss_step=0.0116, global_step=1537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   9%|▉         | 113/1208 [03:32<34:14,  1.88s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.25e-5, train/loss_step=0.00209, global_step=1538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   9%|▉         | 114/1208 [03:33<34:05,  1.87s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.25e-5, train/loss_step=0.00209, global_step=1538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:   9%|▉         | 114/1208 [03:33<34:05,  1.87s/it, loss=0.162, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.0014, train/loss_step=0.287, global_step=1538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]     Epoch 5:  10%|▉         | 115/1208 [03:34<33:55,  1.86s/it, loss=0.162, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.0014, train/loss_step=0.287, global_step=1538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  10%|▉         | 115/1208 [03:34<33:55,  1.86s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.16e-5, train/loss_step=0.0138, global_step=1538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  10%|▉         | 116/1208 [03:37<34:06,  1.87s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.16e-5, train/loss_step=0.0138, global_step=1538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  10%|▉         | 116/1208 [03:37<34:06,  1.87s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0813, train/loss_vlb_step=0.000267, train/loss_step=0.0813, global_step=1538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  10%|▉         | 117/1208 [03:38<33:56,  1.87s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0813, train/loss_vlb_step=0.000267, train/loss_step=0.0813, global_step=1538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  10%|▉         | 117/1208 [03:38<33:57,  1.87s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000138, train/loss_step=0.0367, global_step=1539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  10%|▉         | 118/1208 [03:39<33:47,  1.86s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000138, train/loss_step=0.0367, global_step=1539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  10%|▉         | 118/1208 [03:39<33:47,  1.86s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0509, train/loss_vlb_step=0.000179, train/loss_step=0.0509, global_step=1539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  10%|▉         | 119/1208 [03:40<33:38,  1.85s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0509, train/loss_vlb_step=0.000179, train/loss_step=0.0509, global_step=1539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  10%|▉         | 119/1208 [03:40<33:38,  1.85s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00957, train/loss_vlb_step=4.59e-5, train/loss_step=0.00957, global_step=1539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  10%|▉         | 120/1208 [03:43<33:49,  1.86s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00957, train/loss_vlb_step=4.59e-5, train/loss_step=0.00957, global_step=1539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  10%|▉         | 120/1208 [03:43<33:49,  1.86s/it, loss=0.124, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=1539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  10%|█         | 121/1208 [03:44<33:39,  1.86s/it, loss=0.124, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=1539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  10%|█         | 121/1208 [03:44<33:39,  1.86s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0816, train/loss_vlb_step=0.000274, train/loss_step=0.0816, global_step=1540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  10%|█         | 122/1208 [03:45<33:30,  1.85s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0816, train/loss_vlb_step=0.000274, train/loss_step=0.0816, global_step=1540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  10%|█         | 122/1208 [03:45<33:30,  1.85s/it, loss=0.123, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000653, train/loss_step=0.182, global_step=1540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  10%|█         | 123/1208 [03:46<33:21,  1.84s/it, loss=0.123, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000653, train/loss_step=0.182, global_step=1540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  10%|█         | 123/1208 [03:46<33:21,  1.84s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00591, train/loss_vlb_step=3.09e-5, train/loss_step=0.00591, global_step=1540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  10%|█         | 124/1208 [03:50<33:32,  1.86s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00591, train/loss_vlb_step=3.09e-5, train/loss_step=0.00591, global_step=1540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  10%|█         | 124/1208 [03:50<33:32,  1.86s/it, loss=0.113, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00111, train/loss_step=0.261, global_step=1540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  10%|█         | 125/1208 [03:51<33:23,  1.85s/it, loss=0.113, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00111, train/loss_step=0.261, global_step=1540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  10%|█         | 125/1208 [03:51<33:23,  1.85s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00617, train/loss_vlb_step=3.25e-5, train/loss_step=0.00617, global_step=1541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  10%|█         | 126/1208 [03:52<33:14,  1.84s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00617, train/loss_vlb_step=3.25e-5, train/loss_step=0.00617, global_step=1541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  10%|█         | 126/1208 [03:52<33:14,  1.84s/it, loss=0.13, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00331, train/loss_step=0.403, global_step=1541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]     Epoch 5:  11%|█         | 127/1208 [03:53<33:05,  1.84s/it, loss=0.13, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00331, train/loss_step=0.403, global_step=1541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  11%|█         | 127/1208 [03:53<33:05,  1.84s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.54e-5, train/loss_step=0.00267, global_step=1541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  11%|█         | 128/1208 [03:56<33:15,  1.85s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.54e-5, train/loss_step=0.00267, global_step=1541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  11%|█         | 128/1208 [03:56<33:15,  1.85s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=2.22e-5, train/loss_step=0.00405, global_step=1541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  11%|█         | 129/1208 [03:57<33:07,  1.84s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=2.22e-5, train/loss_step=0.00405, global_step=1541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  11%|█         | 129/1208 [03:57<33:07,  1.84s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=7.09e-5, train/loss_step=0.0159, global_step=1542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  11%|█         | 130/1208 [03:58<32:58,  1.84s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=7.09e-5, train/loss_step=0.0159, global_step=1542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  11%|█         | 130/1208 [03:58<32:58,  1.84s/it, loss=0.127, v_num=0, train/loss_simple_step=0.657, train/loss_vlb_step=0.0194, train/loss_step=0.657, global_step=1542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  11%|█         | 131/1208 [03:59<32:50,  1.83s/it, loss=0.127, v_num=0, train/loss_simple_step=0.657, train/loss_vlb_step=0.0194, train/loss_step=0.657, global_step=1542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  11%|█         | 131/1208 [03:59<32:50,  1.83s/it, loss=0.122, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000818, train/loss_step=0.214, global_step=1542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  11%|█         | 132/1208 [04:02<32:59,  1.84s/it, loss=0.122, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000818, train/loss_step=0.214, global_step=1542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  11%|█         | 132/1208 [04:02<32:59,  1.84s/it, loss=0.122, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.61e-5, train/loss_step=0.021, global_step=1542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  11%|█         | 133/1208 [04:03<32:51,  1.83s/it, loss=0.122, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.61e-5, train/loss_step=0.021, global_step=1542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  11%|█         | 133/1208 [04:03<32:51,  1.83s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.17e-5, train/loss_step=0.00192, global_step=1543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  11%|█         | 134/1208 [04:05<32:43,  1.83s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.17e-5, train/loss_step=0.00192, global_step=1543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  11%|█         | 134/1208 [04:05<32:43,  1.83s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=1.31e-5, train/loss_step=0.00214, global_step=1543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  11%|█         | 135/1208 [04:06<32:35,  1.82s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=1.31e-5, train/loss_step=0.00214, global_step=1543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  11%|█         | 135/1208 [04:06<32:35,  1.82s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0289, train/loss_vlb_step=0.000105, train/loss_step=0.0289, global_step=1543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  11%|█▏        | 136/1208 [04:09<32:45,  1.83s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0289, train/loss_vlb_step=0.000105, train/loss_step=0.0289, global_step=1543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  11%|█▏        | 136/1208 [04:09<32:45,  1.83s/it, loss=0.105, v_num=0, train/loss_simple_step=0.007, train/loss_vlb_step=3.54e-5, train/loss_step=0.007, global_step=1543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  11%|█▏        | 137/1208 [04:10<32:37,  1.83s/it, loss=0.105, v_num=0, train/loss_simple_step=0.007, train/loss_vlb_step=3.54e-5, train/loss_step=0.007, global_step=1543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  11%|█▏        | 137/1208 [04:10<32:37,  1.83s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0083, train/loss_vlb_step=4.01e-5, train/loss_step=0.0083, global_step=1544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  11%|█▏        | 138/1208 [04:11<32:29,  1.82s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0083, train/loss_vlb_step=4.01e-5, train/loss_step=0.0083, global_step=1544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  11%|█▏        | 138/1208 [04:11<32:29,  1.82s/it, loss=0.113, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.00104, train/loss_step=0.238, global_step=1544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  12%|█▏        | 139/1208 [04:12<32:21,  1.82s/it, loss=0.113, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.00104, train/loss_step=0.238, global_step=1544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  12%|█▏        | 139/1208 [04:12<32:21,  1.82s/it, loss=0.124, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.00096, train/loss_step=0.233, global_step=1544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  12%|█▏        | 140/1208 [04:15<32:30,  1.83s/it, loss=0.124, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.00096, train/loss_step=0.233, global_step=1544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  12%|█▏        | 140/1208 [04:15<32:31,  1.83s/it, loss=0.134, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00144, train/loss_step=0.298, global_step=1544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  12%|█▏        | 141/1208 [04:16<32:23,  1.82s/it, loss=0.134, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00144, train/loss_step=0.298, global_step=1544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  12%|█▏        | 141/1208 [04:16<32:23,  1.82s/it, loss=0.135, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=1545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  12%|█▏        | 142/1208 [04:17<32:15,  1.82s/it, loss=0.135, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=1545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  12%|█▏        | 142/1208 [04:17<32:15,  1.82s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.39e-5, train/loss_step=0.0199, global_step=1545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  12%|█▏        | 143/1208 [04:18<32:07,  1.81s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.39e-5, train/loss_step=0.0199, global_step=1545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  12%|█▏        | 143/1208 [04:18<32:07,  1.81s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=2.03e-5, train/loss_step=0.0036, global_step=1545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  12%|█▏        | 144/1208 [04:22<32:17,  1.82s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=2.03e-5, train/loss_step=0.0036, global_step=1545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  12%|█▏        | 144/1208 [04:22<32:17,  1.82s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000137, train/loss_step=0.0348, global_step=1545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  12%|█▏        | 145/1208 [04:23<32:10,  1.82s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000137, train/loss_step=0.0348, global_step=1545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  12%|█▏        | 145/1208 [04:23<32:10,  1.82s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.65e-5, train/loss_step=0.0181, global_step=1546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  12%|█▏        | 146/1208 [04:24<32:02,  1.81s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.65e-5, train/loss_step=0.0181, global_step=1546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  12%|█▏        | 146/1208 [04:24<32:02,  1.81s/it, loss=0.107, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000743, train/loss_step=0.210, global_step=1546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  12%|█▏        | 147/1208 [04:25<31:55,  1.80s/it, loss=0.107, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000743, train/loss_step=0.210, global_step=1546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  12%|█▏        | 147/1208 [04:25<31:55,  1.81s/it, loss=0.113, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000456, train/loss_step=0.138, global_step=1546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  12%|█▏        | 148/1208 [04:28<32:03,  1.81s/it, loss=0.113, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000456, train/loss_step=0.138, global_step=1546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  12%|█▏        | 148/1208 [04:28<32:03,  1.81s/it, loss=0.116, v_num=0, train/loss_simple_step=0.049, train/loss_vlb_step=0.00018, train/loss_step=0.049, global_step=1546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  12%|█▏        | 149/1208 [04:29<31:56,  1.81s/it, loss=0.116, v_num=0, train/loss_simple_step=0.049, train/loss_vlb_step=0.00018, train/loss_step=0.049, global_step=1546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  12%|█▏        | 149/1208 [04:29<31:56,  1.81s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00269, train/loss_vlb_step=1.59e-5, train/loss_step=0.00269, global_step=1547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  12%|█▏        | 150/1208 [04:30<31:49,  1.80s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00269, train/loss_vlb_step=1.59e-5, train/loss_step=0.00269, global_step=1547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  12%|█▏        | 150/1208 [04:30<31:49,  1.80s/it, loss=0.0831, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=9.08e-5, train/loss_step=0.0211, global_step=1547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  12%|█▎        | 151/1208 [04:31<31:42,  1.80s/it, loss=0.0831, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=9.08e-5, train/loss_step=0.0211, global_step=1547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  12%|█▎        | 151/1208 [04:31<31:42,  1.80s/it, loss=0.0738, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000107, train/loss_step=0.0269, global_step=1547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  13%|█▎        | 152/1208 [04:35<31:50,  1.81s/it, loss=0.0738, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000107, train/loss_step=0.0269, global_step=1547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  13%|█▎        | 152/1208 [04:35<31:50,  1.81s/it, loss=0.0798, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000467, train/loss_step=0.142, global_step=1547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  13%|█▎        | 153/1208 [04:36<31:43,  1.80s/it, loss=0.0798, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000467, train/loss_step=0.142, global_step=1547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  13%|█▎        | 153/1208 [04:36<31:43,  1.80s/it, loss=0.0804, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.38e-5, train/loss_step=0.0142, global_step=1548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  13%|█▎        | 154/1208 [04:37<31:36,  1.80s/it, loss=0.0804, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.38e-5, train/loss_step=0.0142, global_step=1548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  13%|█▎        | 154/1208 [04:37<31:36,  1.80s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.0017, train/loss_step=0.309, global_step=1548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  13%|█▎        | 155/1208 [04:38<31:29,  1.79s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.0017, train/loss_step=0.309, global_step=1548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  13%|█▎        | 155/1208 [04:38<31:29,  1.79s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.47e-5, train/loss_step=0.0233, global_step=1548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  13%|█▎        | 156/1208 [04:41<31:37,  1.80s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.47e-5, train/loss_step=0.0233, global_step=1548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  13%|█▎        | 156/1208 [04:41<31:37,  1.80s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=2.39e-5, train/loss_step=0.00448, global_step=1548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  13%|█▎        | 157/1208 [04:42<31:30,  1.80s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=2.39e-5, train/loss_step=0.00448, global_step=1548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  13%|█▎        | 157/1208 [04:42<31:30,  1.80s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000182, train/loss_step=0.051, global_step=1549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  13%|█▎        | 158/1208 [04:43<31:24,  1.79s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000182, train/loss_step=0.051, global_step=1549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  13%|█▎        | 158/1208 [04:43<31:24,  1.79s/it, loss=0.111, v_num=0, train/loss_simple_step=0.500, train/loss_vlb_step=0.0041, train/loss_step=0.500, global_step=1549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  13%|█▎        | 159/1208 [04:44<31:17,  1.79s/it, loss=0.111, v_num=0, train/loss_simple_step=0.500, train/loss_vlb_step=0.0041, train/loss_step=0.500, global_step=1549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  13%|█▎        | 159/1208 [04:44<31:17,  1.79s/it, loss=0.109, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000694, train/loss_step=0.195, global_step=1549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  13%|█▎        | 160/1208 [04:47<31:24,  1.80s/it, loss=0.109, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000694, train/loss_step=0.195, global_step=1549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  13%|█▎        | 160/1208 [04:47<31:24,  1.80s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.057, train/loss_vlb_step=0.000197, train/loss_step=0.057, global_step=1549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  13%|█▎        | 161/1208 [04:48<31:18,  1.79s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.057, train/loss_vlb_step=0.000197, train/loss_step=0.057, global_step=1549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  13%|█▎        | 161/1208 [04:48<31:18,  1.79s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.000178, train/loss_step=0.0489, global_step=1550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  13%|█▎        | 162/1208 [04:49<31:11,  1.79s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.000178, train/loss_step=0.0489, global_step=1550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  13%|█▎        | 162/1208 [04:49<31:11,  1.79s/it, loss=0.102, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000696, train/loss_step=0.187, global_step=1550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  13%|█▎        | 163/1208 [04:50<31:04,  1.78s/it, loss=0.102, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000696, train/loss_step=0.187, global_step=1550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  13%|█▎        | 163/1208 [04:50<31:04,  1.78s/it, loss=0.115, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.0011, train/loss_step=0.265, global_step=1550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  14%|█▎        | 164/1208 [04:54<31:12,  1.79s/it, loss=0.115, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.0011, train/loss_step=0.265, global_step=1550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  14%|█▎        | 164/1208 [04:54<31:12,  1.79s/it, loss=0.129, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00148, train/loss_step=0.316, global_step=1550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  14%|█▎        | 165/1208 [04:55<31:06,  1.79s/it, loss=0.129, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00148, train/loss_step=0.316, global_step=1550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  14%|█▎        | 165/1208 [04:55<31:06,  1.79s/it, loss=0.156, v_num=0, train/loss_simple_step=0.567, train/loss_vlb_step=0.0159, train/loss_step=0.567, global_step=1551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  14%|█▎        | 166/1208 [04:56<30:59,  1.78s/it, loss=0.156, v_num=0, train/loss_simple_step=0.567, train/loss_vlb_step=0.0159, train/loss_step=0.567, global_step=1551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  14%|█▎        | 166/1208 [04:56<30:59,  1.78s/it, loss=0.158, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00118, train/loss_step=0.251, global_step=1551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  14%|█▍        | 167/1208 [04:57<30:53,  1.78s/it, loss=0.158, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00118, train/loss_step=0.251, global_step=1551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  14%|█▍        | 167/1208 [04:57<30:53,  1.78s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.25e-5, train/loss_step=0.0134, global_step=1551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  14%|█▍        | 168/1208 [05:00<31:00,  1.79s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.25e-5, train/loss_step=0.0134, global_step=1551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  14%|█▍        | 168/1208 [05:00<31:00,  1.79s/it, loss=0.171, v_num=0, train/loss_simple_step=0.431, train/loss_vlb_step=0.00315, train/loss_step=0.431, global_step=1551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  14%|█▍        | 169/1208 [05:01<30:54,  1.78s/it, loss=0.171, v_num=0, train/loss_simple_step=0.431, train/loss_vlb_step=0.00315, train/loss_step=0.431, global_step=1551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  14%|█▍        | 169/1208 [05:01<30:54,  1.78s/it, loss=0.173, v_num=0, train/loss_simple_step=0.036, train/loss_vlb_step=0.00014, train/loss_step=0.036, global_step=1552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  14%|█▍        | 170/1208 [05:02<30:47,  1.78s/it, loss=0.173, v_num=0, train/loss_simple_step=0.036, train/loss_vlb_step=0.00014, train/loss_step=0.036, global_step=1552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  14%|█▍        | 170/1208 [05:02<30:47,  1.78s/it, loss=0.183, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000861, train/loss_step=0.221, global_step=1552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  14%|█▍        | 171/1208 [05:03<30:41,  1.78s/it, loss=0.183, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000861, train/loss_step=0.221, global_step=1552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  14%|█▍        | 171/1208 [05:03<30:41,  1.78s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.42e-5, train/loss_step=0.0117, global_step=1552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  14%|█▍        | 172/1208 [05:06<30:48,  1.78s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.42e-5, train/loss_step=0.0117, global_step=1552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  14%|█▍        | 172/1208 [05:06<30:48,  1.78s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.18e-5, train/loss_step=0.00198, global_step=1552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  14%|█▍        | 173/1208 [05:08<30:42,  1.78s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.18e-5, train/loss_step=0.00198, global_step=1552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  14%|█▍        | 173/1208 [05:08<30:42,  1.78s/it, loss=0.195, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00441, train/loss_step=0.418, global_step=1553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  14%|█▍        | 174/1208 [05:09<30:36,  1.78s/it, loss=0.195, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00441, train/loss_step=0.418, global_step=1553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  14%|█▍        | 174/1208 [05:09<30:36,  1.78s/it, loss=0.199, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00244, train/loss_step=0.379, global_step=1553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  14%|█▍        | 175/1208 [05:10<30:30,  1.77s/it, loss=0.199, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00244, train/loss_step=0.379, global_step=1553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  14%|█▍        | 175/1208 [05:10<30:30,  1.77s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0964, train/loss_vlb_step=0.000318, train/loss_step=0.0964, global_step=1553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  15%|█▍        | 176/1208 [05:13<30:37,  1.78s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0964, train/loss_vlb_step=0.000318, train/loss_step=0.0964, global_step=1553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  15%|█▍        | 176/1208 [05:13<30:37,  1.78s/it, loss=0.203, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.95e-5, train/loss_step=0.016, global_step=1553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  15%|█▍        | 177/1208 [05:14<30:31,  1.78s/it, loss=0.203, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.95e-5, train/loss_step=0.016, global_step=1553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  15%|█▍        | 177/1208 [05:14<30:31,  1.78s/it, loss=0.217, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00151, train/loss_step=0.320, global_step=1554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  15%|█▍        | 178/1208 [05:15<30:25,  1.77s/it, loss=0.217, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00151, train/loss_step=0.320, global_step=1554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  15%|█▍        | 178/1208 [05:15<30:25,  1.77s/it, loss=0.203, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000889, train/loss_step=0.223, global_step=1554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  15%|█▍        | 179/1208 [05:16<30:19,  1.77s/it, loss=0.203, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000889, train/loss_step=0.223, global_step=1554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  15%|█▍        | 179/1208 [05:16<30:19,  1.77s/it, loss=0.212, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00197, train/loss_step=0.389, global_step=1554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  15%|█▍        | 180/1208 [05:19<30:25,  1.78s/it, loss=0.212, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00197, train/loss_step=0.389, global_step=1554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  15%|█▍        | 180/1208 [05:19<30:25,  1.78s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=8.08e-5, train/loss_step=0.0185, global_step=1554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  15%|█▍        | 181/1208 [05:20<30:19,  1.77s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=8.08e-5, train/loss_step=0.0185, global_step=1554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  15%|█▍        | 181/1208 [05:20<30:19,  1.77s/it, loss=0.22, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000822, train/loss_step=0.231, global_step=1555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  15%|█▌        | 182/1208 [05:21<30:13,  1.77s/it, loss=0.22, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000822, train/loss_step=0.231, global_step=1555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  15%|█▌        | 182/1208 [05:21<30:14,  1.77s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.91e-5, train/loss_step=0.0236, global_step=1555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  15%|█▌        | 183/1208 [05:22<30:08,  1.76s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.91e-5, train/loss_step=0.0236, global_step=1555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  15%|█▌        | 183/1208 [05:22<30:08,  1.76s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=9.82e-6, train/loss_step=0.00162, global_step=1555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  15%|█▌        | 184/1208 [05:26<30:14,  1.77s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=9.82e-6, train/loss_step=0.00162, global_step=1555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  15%|█▌        | 184/1208 [05:26<30:14,  1.77s/it, loss=0.183, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.63e-5, train/loss_step=0.021, global_step=1555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  15%|█▌        | 185/1208 [05:27<30:08,  1.77s/it, loss=0.183, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.63e-5, train/loss_step=0.021, global_step=1555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  15%|█▌        | 185/1208 [05:27<30:08,  1.77s/it, loss=0.158, v_num=0, train/loss_simple_step=0.056, train/loss_vlb_step=0.000207, train/loss_step=0.056, global_step=1556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  15%|█▌        | 186/1208 [05:28<30:02,  1.76s/it, loss=0.158, v_num=0, train/loss_simple_step=0.056, train/loss_vlb_step=0.000207, train/loss_step=0.056, global_step=1556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  15%|█▌        | 186/1208 [05:28<30:02,  1.76s/it, loss=0.152, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000455, train/loss_step=0.136, global_step=1556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  15%|█▌        | 187/1208 [05:29<29:57,  1.76s/it, loss=0.152, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000455, train/loss_step=0.136, global_step=1556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  15%|█▌        | 187/1208 [05:29<29:57,  1.76s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0725, train/loss_vlb_step=0.000241, train/loss_step=0.0725, global_step=1556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  16%|█▌        | 188/1208 [05:32<30:03,  1.77s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0725, train/loss_vlb_step=0.000241, train/loss_step=0.0725, global_step=1556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  16%|█▌        | 188/1208 [05:32<30:03,  1.77s/it, loss=0.152, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00173, train/loss_step=0.359, global_step=1556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  16%|█▌        | 189/1208 [05:33<29:57,  1.76s/it, loss=0.152, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00173, train/loss_step=0.359, global_step=1556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  16%|█▌        | 189/1208 [05:33<29:57,  1.76s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0811, train/loss_vlb_step=0.00028, train/loss_step=0.0811, global_step=1557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  16%|█▌        | 190/1208 [05:34<29:52,  1.76s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0811, train/loss_vlb_step=0.00028, train/loss_step=0.0811, global_step=1557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  16%|█▌        | 190/1208 [05:34<29:52,  1.76s/it, loss=0.149, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=1557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  16%|█▌        | 191/1208 [05:35<29:46,  1.76s/it, loss=0.149, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=1557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  16%|█▌        | 191/1208 [05:35<29:46,  1.76s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.31e-5, train/loss_step=0.0112, global_step=1557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  16%|█▌        | 192/1208 [05:38<29:52,  1.76s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.31e-5, train/loss_step=0.0112, global_step=1557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  16%|█▌        | 192/1208 [05:38<29:52,  1.76s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.000112, train/loss_step=0.0292, global_step=1557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  16%|█▌        | 193/1208 [05:39<29:47,  1.76s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.000112, train/loss_step=0.0292, global_step=1557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  16%|█▌        | 193/1208 [05:39<29:47,  1.76s/it, loss=0.13, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.46e-5, train/loss_step=0.017, global_step=1558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  16%|█▌        | 194/1208 [05:40<29:41,  1.76s/it, loss=0.13, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.46e-5, train/loss_step=0.017, global_step=1558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  16%|█▌        | 194/1208 [05:40<29:41,  1.76s/it, loss=0.13, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00291, train/loss_step=0.384, global_step=1558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  16%|█▌        | 195/1208 [05:41<29:36,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00291, train/loss_step=0.384, global_step=1558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  16%|█▌        | 195/1208 [05:41<29:36,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00962, train/loss_vlb_step=4.52e-5, train/loss_step=0.00962, global_step=1558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  16%|█▌        | 196/1208 [05:45<29:41,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00962, train/loss_vlb_step=4.52e-5, train/loss_step=0.00962, global_step=1558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  16%|█▌        | 196/1208 [05:45<29:41,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000807, train/loss_step=0.216, global_step=1558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  16%|█▋        | 197/1208 [05:46<29:36,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000807, train/loss_step=0.216, global_step=1558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  16%|█▋        | 197/1208 [05:46<29:36,  1.76s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00585, train/loss_vlb_step=3.11e-5, train/loss_step=0.00585, global_step=1559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  16%|█▋        | 198/1208 [05:47<29:31,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00585, train/loss_vlb_step=3.11e-5, train/loss_step=0.00585, global_step=1559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  16%|█▋        | 198/1208 [05:47<29:31,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000844, train/loss_step=0.217, global_step=1559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  16%|█▋        | 199/1208 [05:48<29:25,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000844, train/loss_step=0.217, global_step=1559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  16%|█▋        | 199/1208 [05:48<29:25,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.506, train/loss_vlb_step=0.00477, train/loss_step=0.506, global_step=1559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  17%|█▋        | 200/1208 [05:51<29:31,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.506, train/loss_vlb_step=0.00477, train/loss_step=0.506, global_step=1559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  17%|█▋        | 200/1208 [05:51<29:31,  1.76s/it, loss=0.128, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.000221, train/loss_step=0.062, global_step=1559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  17%|█▋        | 201/1208 [05:52<29:26,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.000221, train/loss_step=0.062, global_step=1559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  17%|█▋        | 201/1208 [05:52<29:26,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.000133, train/loss_step=0.0351, global_step=1560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  17%|█▋        | 202/1208 [05:53<29:21,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.000133, train/loss_step=0.0351, global_step=1560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  17%|█▋        | 202/1208 [05:53<29:21,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00542, train/loss_vlb_step=2.8e-5, train/loss_step=0.00542, global_step=1560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  17%|█▋        | 203/1208 [05:54<29:15,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00542, train/loss_vlb_step=2.8e-5, train/loss_step=0.00542, global_step=1560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  17%|█▋        | 203/1208 [05:54<29:15,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00479, train/loss_vlb_step=2.59e-5, train/loss_step=0.00479, global_step=1560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  17%|█▋        | 204/1208 [05:57<29:21,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00479, train/loss_vlb_step=2.59e-5, train/loss_step=0.00479, global_step=1560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  17%|█▋        | 204/1208 [05:57<29:21,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00101, train/loss_step=0.258, global_step=1560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]     Epoch 5:  17%|█▋        | 205/1208 [05:58<29:16,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00101, train/loss_step=0.258, global_step=1560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  17%|█▋        | 205/1208 [05:58<29:16,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.55e-5, train/loss_step=0.0129, global_step=1561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  17%|█▋        | 206/1208 [06:00<29:11,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.55e-5, train/loss_step=0.0129, global_step=1561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  17%|█▋        | 206/1208 [06:00<29:11,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00154, train/loss_step=0.323, global_step=1561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  17%|█▋        | 207/1208 [06:01<29:06,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00154, train/loss_step=0.323, global_step=1561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  17%|█▋        | 207/1208 [06:01<29:06,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00593, train/loss_vlb_step=3.08e-5, train/loss_step=0.00593, global_step=1561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  17%|█▋        | 208/1208 [06:04<29:11,  1.75s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00593, train/loss_vlb_step=3.08e-5, train/loss_step=0.00593, global_step=1561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  17%|█▋        | 208/1208 [06:04<29:11,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=1.29e-5, train/loss_step=0.00217, global_step=1561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  17%|█▋        | 209/1208 [06:05<29:06,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=1.29e-5, train/loss_step=0.00217, global_step=1561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  17%|█▋        | 209/1208 [06:05<29:06,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.45e-5, train/loss_step=0.0148, global_step=1562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  17%|█▋        | 210/1208 [06:06<29:01,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.45e-5, train/loss_step=0.0148, global_step=1562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  17%|█▋        | 210/1208 [06:06<29:01,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00157, train/loss_step=0.302, global_step=1562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  17%|█▋        | 211/1208 [06:07<28:56,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00157, train/loss_step=0.302, global_step=1562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  17%|█▋        | 211/1208 [06:07<28:56,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.73e-5, train/loss_step=0.00288, global_step=1562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  18%|█▊        | 212/1208 [06:10<29:01,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.73e-5, train/loss_step=0.00288, global_step=1562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  18%|█▊        | 212/1208 [06:10<29:01,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0664, train/loss_vlb_step=0.000231, train/loss_step=0.0664, global_step=1562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  18%|█▊        | 213/1208 [06:11<28:56,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0664, train/loss_vlb_step=0.000231, train/loss_step=0.0664, global_step=1562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  18%|█▊        | 213/1208 [06:11<28:56,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000517, train/loss_step=0.150, global_step=1563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  18%|█▊        | 214/1208 [06:12<28:51,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000517, train/loss_step=0.150, global_step=1563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  18%|█▊        | 214/1208 [06:12<28:51,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000851, train/loss_step=0.233, global_step=1563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  18%|█▊        | 215/1208 [06:13<28:46,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000851, train/loss_step=0.233, global_step=1563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  18%|█▊        | 215/1208 [06:13<28:46,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00191, train/loss_step=0.342, global_step=1563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  18%|█▊        | 216/1208 [06:17<28:51,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00191, train/loss_step=0.342, global_step=1563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  18%|█▊        | 216/1208 [06:17<28:51,  1.75s/it, loss=0.133, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000383, train/loss_step=0.116, global_step=1563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  18%|█▊        | 217/1208 [06:18<28:47,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000383, train/loss_step=0.116, global_step=1563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  18%|█▊        | 217/1208 [06:18<28:47,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0957, train/loss_vlb_step=0.000317, train/loss_step=0.0957, global_step=1564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  18%|█▊        | 218/1208 [06:19<28:42,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0957, train/loss_vlb_step=0.000317, train/loss_step=0.0957, global_step=1564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  18%|█▊        | 218/1208 [06:19<28:42,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=1.29e-5, train/loss_step=0.00214, global_step=1564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  18%|█▊        | 219/1208 [06:20<28:37,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=1.29e-5, train/loss_step=0.00214, global_step=1564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  18%|█▊        | 219/1208 [06:20<28:37,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=1.53e-5, train/loss_step=0.00259, global_step=1564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  18%|█▊        | 220/1208 [06:23<28:42,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=1.53e-5, train/loss_step=0.00259, global_step=1564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  18%|█▊        | 220/1208 [06:23<28:42,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00162, train/loss_step=0.323, global_step=1564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  18%|█▊        | 221/1208 [06:24<28:37,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00162, train/loss_step=0.323, global_step=1564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  18%|█▊        | 221/1208 [06:24<28:37,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00339, train/loss_vlb_step=1.88e-5, train/loss_step=0.00339, global_step=1565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  18%|█▊        | 222/1208 [06:25<28:32,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00339, train/loss_vlb_step=1.88e-5, train/loss_step=0.00339, global_step=1565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  18%|█▊        | 222/1208 [06:25<28:32,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=1.01e-5, train/loss_step=0.00168, global_step=1565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  18%|█▊        | 223/1208 [06:26<28:27,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=1.01e-5, train/loss_step=0.00168, global_step=1565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  18%|█▊        | 223/1208 [06:26<28:27,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.35e-5, train/loss_step=0.0207, global_step=1565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  19%|█▊        | 224/1208 [06:29<28:32,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.35e-5, train/loss_step=0.0207, global_step=1565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  19%|█▊        | 224/1208 [06:29<28:32,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.36e-5, train/loss_step=0.0118, global_step=1565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  19%|█▊        | 225/1208 [06:30<28:27,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.36e-5, train/loss_step=0.0118, global_step=1565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  19%|█▊        | 225/1208 [06:30<28:27,  1.74s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00629, train/loss_vlb_step=3.19e-5, train/loss_step=0.00629, global_step=1566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  19%|█▊        | 226/1208 [06:31<28:22,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00629, train/loss_vlb_step=3.19e-5, train/loss_step=0.00629, global_step=1566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  19%|█▊        | 226/1208 [06:31<28:22,  1.73s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00141, train/loss_step=0.290, global_step=1566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  19%|█▉        | 227/1208 [06:32<28:18,  1.73s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00141, train/loss_step=0.290, global_step=1566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  19%|█▉        | 227/1208 [06:32<28:18,  1.73s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.2e-5, train/loss_step=0.00211, global_step=1566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  19%|█▉        | 228/1208 [06:36<28:22,  1.74s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.2e-5, train/loss_step=0.00211, global_step=1566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  19%|█▉        | 228/1208 [06:36<28:23,  1.74s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.0051, train/loss_vlb_step=2.67e-5, train/loss_step=0.0051, global_step=1566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  19%|█▉        | 229/1208 [06:37<28:18,  1.73s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.0051, train/loss_vlb_step=2.67e-5, train/loss_step=0.0051, global_step=1566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  19%|█▉        | 229/1208 [06:37<28:18,  1.73s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.45e-5, train/loss_step=0.0236, global_step=1567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  19%|█▉        | 230/1208 [06:38<28:13,  1.73s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.45e-5, train/loss_step=0.0236, global_step=1567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  19%|█▉        | 230/1208 [06:38<28:13,  1.73s/it, loss=0.0911, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.00041, train/loss_step=0.124, global_step=1567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  19%|█▉        | 231/1208 [06:39<28:08,  1.73s/it, loss=0.0911, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.00041, train/loss_step=0.124, global_step=1567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  19%|█▉        | 231/1208 [06:39<28:08,  1.73s/it, loss=0.0911, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=2e-5, train/loss_step=0.00356, global_step=1567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  19%|█▉        | 232/1208 [06:42<28:13,  1.74s/it, loss=0.0911, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=2e-5, train/loss_step=0.00356, global_step=1567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  19%|█▉        | 232/1208 [06:42<28:13,  1.74s/it, loss=0.101, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00113, train/loss_step=0.257, global_step=1567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  19%|█▉        | 233/1208 [06:43<28:09,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00113, train/loss_step=0.257, global_step=1567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  19%|█▉        | 233/1208 [06:43<28:09,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00172, train/loss_step=0.296, global_step=1568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  19%|█▉        | 234/1208 [06:44<28:04,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00172, train/loss_step=0.296, global_step=1568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  19%|█▉        | 234/1208 [06:44<28:04,  1.73s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.00818, train/loss_vlb_step=3.93e-5, train/loss_step=0.00818, global_step=1568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  19%|█▉        | 235/1208 [06:45<27:59,  1.73s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.00818, train/loss_vlb_step=3.93e-5, train/loss_step=0.00818, global_step=1568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  19%|█▉        | 235/1208 [06:45<27:59,  1.73s/it, loss=0.084, v_num=0, train/loss_simple_step=0.0864, train/loss_vlb_step=0.000288, train/loss_step=0.0864, global_step=1568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  20%|█▉        | 236/1208 [06:49<28:04,  1.73s/it, loss=0.084, v_num=0, train/loss_simple_step=0.0864, train/loss_vlb_step=0.000288, train/loss_step=0.0864, global_step=1568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  20%|█▉        | 236/1208 [06:49<28:04,  1.73s/it, loss=0.0787, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.05e-5, train/loss_step=0.0108, global_step=1568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  20%|█▉        | 237/1208 [06:50<28:00,  1.73s/it, loss=0.0787, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.05e-5, train/loss_step=0.0108, global_step=1568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  20%|█▉        | 237/1208 [06:50<28:00,  1.73s/it, loss=0.0751, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.86e-5, train/loss_step=0.0239, global_step=1569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  20%|█▉        | 238/1208 [06:51<27:55,  1.73s/it, loss=0.0751, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.86e-5, train/loss_step=0.0239, global_step=1569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  20%|█▉        | 238/1208 [06:51<27:55,  1.73s/it, loss=0.0891, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00128, train/loss_step=0.282, global_step=1569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  20%|█▉        | 239/1208 [06:52<27:51,  1.72s/it, loss=0.0891, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00128, train/loss_step=0.282, global_step=1569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  20%|█▉        | 239/1208 [06:52<27:51,  1.72s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=1569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  20%|█▉        | 240/1208 [06:55<27:55,  1.73s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=1569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  20%|█▉        | 240/1208 [06:55<27:55,  1.73s/it, loss=0.0801, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000121, train/loss_step=0.0327, global_step=1569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  20%|█▉        | 241/1208 [06:56<27:50,  1.73s/it, loss=0.0801, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000121, train/loss_step=0.0327, global_step=1569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  20%|█▉        | 241/1208 [06:56<27:50,  1.73s/it, loss=0.0807, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.35e-5, train/loss_step=0.0147, global_step=1570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  20%|██        | 242/1208 [06:57<27:46,  1.73s/it, loss=0.0807, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.35e-5, train/loss_step=0.0147, global_step=1570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  20%|██        | 242/1208 [06:57<27:46,  1.73s/it, loss=0.0808, v_num=0, train/loss_simple_step=0.00343, train/loss_vlb_step=1.88e-5, train/loss_step=0.00343, global_step=1570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  20%|██        | 243/1208 [06:58<27:41,  1.72s/it, loss=0.0808, v_num=0, train/loss_simple_step=0.00343, train/loss_vlb_step=1.88e-5, train/loss_step=0.00343, global_step=1570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  20%|██        | 243/1208 [06:58<27:41,  1.72s/it, loss=0.0823, v_num=0, train/loss_simple_step=0.0506, train/loss_vlb_step=0.000174, train/loss_step=0.0506, global_step=1570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  20%|██        | 244/1208 [07:01<27:46,  1.73s/it, loss=0.0823, v_num=0, train/loss_simple_step=0.0506, train/loss_vlb_step=0.000174, train/loss_step=0.0506, global_step=1570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  20%|██        | 244/1208 [07:01<27:46,  1.73s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00193, train/loss_step=0.331, global_step=1570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  20%|██        | 245/1208 [07:02<27:41,  1.73s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00193, train/loss_step=0.331, global_step=1570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  20%|██        | 245/1208 [07:02<27:41,  1.73s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.000182, train/loss_step=0.0499, global_step=1571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  20%|██        | 246/1208 [07:03<27:37,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.000182, train/loss_step=0.0499, global_step=1571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  20%|██        | 246/1208 [07:03<27:37,  1.72s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00102, train/loss_step=0.254, global_step=1571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  20%|██        | 247/1208 [07:04<27:33,  1.72s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00102, train/loss_step=0.254, global_step=1571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  20%|██        | 247/1208 [07:04<27:33,  1.72s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=1.32e-5, train/loss_step=0.00223, global_step=1571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  21%|██        | 248/1208 [07:08<27:37,  1.73s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=1.32e-5, train/loss_step=0.00223, global_step=1571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  21%|██        | 248/1208 [07:08<27:37,  1.73s/it, loss=0.107, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000575, train/loss_step=0.171, global_step=1571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  21%|██        | 249/1208 [07:09<27:33,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000575, train/loss_step=0.171, global_step=1571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  21%|██        | 249/1208 [07:09<27:33,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000753, train/loss_step=0.207, global_step=1572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  21%|██        | 250/1208 [07:10<27:28,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000753, train/loss_step=0.207, global_step=1572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  21%|██        | 250/1208 [07:10<27:28,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.647, train/loss_vlb_step=0.0112, train/loss_step=0.647, global_step=1572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  21%|██        | 251/1208 [07:11<27:24,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.647, train/loss_vlb_step=0.0112, train/loss_step=0.647, global_step=1572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  21%|██        | 251/1208 [07:11<27:24,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000714, train/loss_step=0.214, global_step=1572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  21%|██        | 252/1208 [07:14<27:28,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000714, train/loss_step=0.214, global_step=1572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  21%|██        | 252/1208 [07:14<27:28,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00133, train/loss_step=0.286, global_step=1572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  21%|██        | 253/1208 [07:15<27:24,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00133, train/loss_step=0.286, global_step=1572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  21%|██        | 253/1208 [07:15<27:24,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.79e-5, train/loss_step=0.0235, global_step=1573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  21%|██        | 254/1208 [07:16<27:20,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.79e-5, train/loss_step=0.0235, global_step=1573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  21%|██        | 254/1208 [07:16<27:20,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0796, train/loss_vlb_step=0.000267, train/loss_step=0.0796, global_step=1573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  21%|██        | 255/1208 [07:17<27:15,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0796, train/loss_vlb_step=0.000267, train/loss_step=0.0796, global_step=1573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  21%|██        | 255/1208 [07:17<27:15,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.000106, train/loss_step=0.0275, global_step=1573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  21%|██        | 256/1208 [07:20<27:19,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.000106, train/loss_step=0.0275, global_step=1573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  21%|██        | 256/1208 [07:20<27:19,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.4e-5, train/loss_step=0.0118, global_step=1573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  21%|██▏       | 257/1208 [07:22<27:15,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.4e-5, train/loss_step=0.0118, global_step=1573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  21%|██▏       | 257/1208 [07:22<27:15,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00901, train/loss_vlb_step=4.29e-5, train/loss_step=0.00901, global_step=1574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  21%|██▏       | 258/1208 [07:23<27:11,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00901, train/loss_vlb_step=4.29e-5, train/loss_step=0.00901, global_step=1574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  21%|██▏       | 258/1208 [07:23<27:11,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000109, train/loss_step=0.0277, global_step=1574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  21%|██▏       | 259/1208 [07:24<27:07,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000109, train/loss_step=0.0277, global_step=1574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  21%|██▏       | 259/1208 [07:24<27:07,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000723, train/loss_step=0.198, global_step=1574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  22%|██▏       | 260/1208 [07:27<27:11,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000723, train/loss_step=0.198, global_step=1574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  22%|██▏       | 260/1208 [07:27<27:11,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000512, train/loss_step=0.154, global_step=1574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  22%|██▏       | 261/1208 [07:28<27:07,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000512, train/loss_step=0.154, global_step=1574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  22%|██▏       | 261/1208 [07:28<27:07,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.98e-5, train/loss_step=0.0159, global_step=1575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  22%|██▏       | 262/1208 [07:29<27:03,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.98e-5, train/loss_step=0.0159, global_step=1575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  22%|██▏       | 262/1208 [07:29<27:03,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00506, train/loss_vlb_step=2.64e-5, train/loss_step=0.00506, global_step=1575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  22%|██▏       | 263/1208 [07:30<26:58,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00506, train/loss_vlb_step=2.64e-5, train/loss_step=0.00506, global_step=1575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  22%|██▏       | 263/1208 [07:30<26:58,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0433, train/loss_vlb_step=0.000158, train/loss_step=0.0433, global_step=1575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  22%|██▏       | 264/1208 [07:33<27:02,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0433, train/loss_vlb_step=0.000158, train/loss_step=0.0433, global_step=1575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  22%|██▏       | 264/1208 [07:33<27:02,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.91e-5, train/loss_step=0.0102, global_step=1575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  22%|██▏       | 265/1208 [07:34<26:58,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.91e-5, train/loss_step=0.0102, global_step=1575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  22%|██▏       | 265/1208 [07:34<26:58,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.43e-5, train/loss_step=0.023, global_step=1576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  22%|██▏       | 266/1208 [07:35<26:54,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.43e-5, train/loss_step=0.023, global_step=1576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  22%|██▏       | 266/1208 [07:35<26:54,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00116, train/loss_step=0.275, global_step=1576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  22%|██▏       | 267/1208 [07:36<26:50,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00116, train/loss_step=0.275, global_step=1576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  22%|██▏       | 267/1208 [07:36<26:50,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.92e-5, train/loss_step=0.0178, global_step=1576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  22%|██▏       | 268/1208 [07:40<26:54,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.92e-5, train/loss_step=0.0178, global_step=1576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  22%|██▏       | 268/1208 [07:40<26:54,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.00047, train/loss_step=0.142, global_step=1576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  22%|██▏       | 269/1208 [07:41<26:50,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.00047, train/loss_step=0.142, global_step=1576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  22%|██▏       | 269/1208 [07:41<26:50,  1.71s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.08e-5, train/loss_step=0.0171, global_step=1577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  22%|██▏       | 270/1208 [07:42<26:46,  1.71s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.08e-5, train/loss_step=0.0171, global_step=1577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  22%|██▏       | 270/1208 [07:42<26:46,  1.71s/it, loss=0.0903, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000898, train/loss_step=0.226, global_step=1577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  22%|██▏       | 271/1208 [07:43<26:41,  1.71s/it, loss=0.0903, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000898, train/loss_step=0.226, global_step=1577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  22%|██▏       | 271/1208 [07:43<26:41,  1.71s/it, loss=0.0815, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000144, train/loss_step=0.0373, global_step=1577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  23%|██▎       | 272/1208 [07:46<26:45,  1.72s/it, loss=0.0815, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000144, train/loss_step=0.0373, global_step=1577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  23%|██▎       | 272/1208 [07:46<26:45,  1.72s/it, loss=0.0686, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.00011, train/loss_step=0.0275, global_step=1577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  23%|██▎       | 273/1208 [07:47<26:41,  1.71s/it, loss=0.0686, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.00011, train/loss_step=0.0275, global_step=1577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  23%|██▎       | 273/1208 [07:47<26:41,  1.71s/it, loss=0.0883, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00336, train/loss_step=0.418, global_step=1578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  23%|██▎       | 274/1208 [07:48<26:37,  1.71s/it, loss=0.0883, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00336, train/loss_step=0.418, global_step=1578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  23%|██▎       | 274/1208 [07:48<26:37,  1.71s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000104, train/loss_step=0.0265, global_step=1578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  23%|██▎       | 275/1208 [07:49<26:33,  1.71s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000104, train/loss_step=0.0265, global_step=1578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  23%|██▎       | 275/1208 [07:49<26:33,  1.71s/it, loss=0.0952, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000795, train/loss_step=0.218, global_step=1578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  23%|██▎       | 276/1208 [07:52<26:37,  1.71s/it, loss=0.0952, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000795, train/loss_step=0.218, global_step=1578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  23%|██▎       | 276/1208 [07:52<26:37,  1.71s/it, loss=0.1, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=1578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  23%|██▎       | 277/1208 [07:54<26:33,  1.71s/it, loss=0.1, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=1578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  23%|██▎       | 277/1208 [07:54<26:33,  1.71s/it, loss=0.115, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.0015, train/loss_step=0.309, global_step=1579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  23%|██▎       | 278/1208 [07:55<26:29,  1.71s/it, loss=0.115, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.0015, train/loss_step=0.309, global_step=1579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  23%|██▎       | 278/1208 [07:55<26:29,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0763, train/loss_vlb_step=0.000251, train/loss_step=0.0763, global_step=1579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  23%|██▎       | 279/1208 [07:56<26:25,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0763, train/loss_vlb_step=0.000251, train/loss_step=0.0763, global_step=1579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  23%|██▎       | 279/1208 [07:56<26:25,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00537, train/loss_vlb_step=2.87e-5, train/loss_step=0.00537, global_step=1579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  23%|██▎       | 280/1208 [07:59<26:28,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00537, train/loss_vlb_step=2.87e-5, train/loss_step=0.00537, global_step=1579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  23%|██▎       | 280/1208 [07:59<26:28,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0451, train/loss_vlb_step=0.000163, train/loss_step=0.0451, global_step=1579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  23%|██▎       | 281/1208 [08:00<26:24,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0451, train/loss_vlb_step=0.000163, train/loss_step=0.0451, global_step=1579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  23%|██▎       | 281/1208 [08:00<26:24,  1.71s/it, loss=0.114, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00108, train/loss_step=0.252, global_step=1580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  23%|██▎       | 282/1208 [08:01<26:20,  1.71s/it, loss=0.114, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00108, train/loss_step=0.252, global_step=1580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  23%|██▎       | 282/1208 [08:01<26:21,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000552, train/loss_step=0.168, global_step=1580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  23%|██▎       | 283/1208 [08:02<26:17,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000552, train/loss_step=0.168, global_step=1580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  23%|██▎       | 283/1208 [08:02<26:17,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0578, train/loss_vlb_step=0.0002, train/loss_step=0.0578, global_step=1580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  24%|██▎       | 284/1208 [08:05<26:20,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0578, train/loss_vlb_step=0.0002, train/loss_step=0.0578, global_step=1580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  24%|██▎       | 284/1208 [08:05<26:20,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.808, train/loss_vlb_step=0.136, train/loss_step=0.808, global_step=1580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  24%|██▎       | 285/1208 [08:06<26:16,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.808, train/loss_vlb_step=0.136, train/loss_step=0.808, global_step=1580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  24%|██▎       | 285/1208 [08:06<26:16,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00328, train/loss_vlb_step=1.85e-5, train/loss_step=0.00328, global_step=1581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  24%|██▎       | 286/1208 [08:07<26:12,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00328, train/loss_vlb_step=1.85e-5, train/loss_step=0.00328, global_step=1581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  24%|██▎       | 286/1208 [08:07<26:12,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00589, train/loss_vlb_step=3.2e-5, train/loss_step=0.00589, global_step=1581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  24%|██▍       | 287/1208 [08:08<26:08,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00589, train/loss_vlb_step=3.2e-5, train/loss_step=0.00589, global_step=1581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  24%|██▍       | 287/1208 [08:08<26:08,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000289, train/loss_step=0.087, global_step=1581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  24%|██▍       | 288/1208 [08:12<26:12,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000289, train/loss_step=0.087, global_step=1581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  24%|██▍       | 288/1208 [08:12<26:12,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000708, train/loss_step=0.200, global_step=1581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  24%|██▍       | 289/1208 [08:13<26:08,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000708, train/loss_step=0.200, global_step=1581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  24%|██▍       | 289/1208 [08:13<26:08,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.5e-5, train/loss_step=0.0203, global_step=1582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  24%|██▍       | 290/1208 [08:14<26:04,  1.70s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.5e-5, train/loss_step=0.0203, global_step=1582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  24%|██▍       | 290/1208 [08:14<26:04,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00709, train/loss_vlb_step=3.48e-5, train/loss_step=0.00709, global_step=1582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  24%|██▍       | 291/1208 [08:15<26:00,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00709, train/loss_vlb_step=3.48e-5, train/loss_step=0.00709, global_step=1582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  24%|██▍       | 291/1208 [08:15<26:00,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000433, train/loss_step=0.131, global_step=1582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  24%|██▍       | 292/1208 [08:18<26:03,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000433, train/loss_step=0.131, global_step=1582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  24%|██▍       | 292/1208 [08:18<26:03,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0097, train/loss_vlb_step=4.63e-5, train/loss_step=0.0097, global_step=1582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  24%|██▍       | 293/1208 [08:19<26:00,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0097, train/loss_vlb_step=4.63e-5, train/loss_step=0.0097, global_step=1582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  24%|██▍       | 293/1208 [08:19<26:00,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0519, train/loss_vlb_step=0.000188, train/loss_step=0.0519, global_step=1583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  24%|██▍       | 294/1208 [08:20<25:56,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0519, train/loss_vlb_step=0.000188, train/loss_step=0.0519, global_step=1583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  24%|██▍       | 294/1208 [08:20<25:56,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.00077, train/loss_step=0.219, global_step=1583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  24%|██▍       | 295/1208 [08:21<25:52,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.00077, train/loss_step=0.219, global_step=1583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  24%|██▍       | 295/1208 [08:21<25:52,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.79e-5, train/loss_step=0.0154, global_step=1583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  25%|██▍       | 296/1208 [08:24<25:55,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.79e-5, train/loss_step=0.0154, global_step=1583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  25%|██▍       | 296/1208 [08:24<25:55,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000934, train/loss_step=0.229, global_step=1583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  25%|██▍       | 297/1208 [08:25<25:51,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000934, train/loss_step=0.229, global_step=1583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  25%|██▍       | 297/1208 [08:25<25:51,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.38e-5, train/loss_step=0.0238, global_step=1584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  25%|██▍       | 298/1208 [08:26<25:48,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.38e-5, train/loss_step=0.0238, global_step=1584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  25%|██▍       | 298/1208 [08:26<25:48,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00789, train/loss_vlb_step=3.74e-5, train/loss_step=0.00789, global_step=1584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  25%|██▍       | 299/1208 [08:27<25:44,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00789, train/loss_vlb_step=3.74e-5, train/loss_step=0.00789, global_step=1584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  25%|██▍       | 299/1208 [08:27<25:44,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.000147, train/loss_step=0.0394, global_step=1584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  25%|██▍       | 300/1208 [08:31<25:47,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.000147, train/loss_step=0.0394, global_step=1584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  25%|██▍       | 300/1208 [08:31<25:47,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.000131, train/loss_step=0.0362, global_step=1584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.74it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.76it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.76it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.80it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.80it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.80it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.76it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.76it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.80it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.76it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.76it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.76it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.79it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.79it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.78it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.75it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.75it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.75it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.75it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.74it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.74it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.75it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.75it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 5:  25%|██▍       | 301/1208 [09:01<27:13,  1.80s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.000131, train/loss_step=0.0362, global_step=1584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  25%|██▍       | 301/1208 [09:01<27:13,  1.80s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.00015, train/loss_step=0.0395, global_step=1585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  25%|██▌       | 302/1208 [09:02<27:08,  1.80s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.00015, train/loss_step=0.0395, global_step=1585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  25%|██▌       | 302/1208 [09:02<27:08,  1.80s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.000187, train/loss_step=0.0556, global_step=1585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  25%|██▌       | 303/1208 [09:04<27:04,  1.80s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.000187, train/loss_step=0.0556, global_step=1585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  25%|██▌       | 303/1208 [09:04<27:04,  1.80s/it, loss=0.103, v_num=0, train/loss_simple_step=0.071, train/loss_vlb_step=0.000242, train/loss_step=0.071, global_step=1585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  25%|██▌       | 304/1208 [09:07<27:07,  1.80s/it, loss=0.103, v_num=0, train/loss_simple_step=0.071, train/loss_vlb_step=0.000242, train/loss_step=0.071, global_step=1585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  25%|██▌       | 304/1208 [09:07<27:07,  1.80s/it, loss=0.0643, v_num=0, train/loss_simple_step=0.0323, train/loss_vlb_step=0.000126, train/loss_step=0.0323, global_step=1585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  25%|██▌       | 305/1208 [09:08<27:03,  1.80s/it, loss=0.0643, v_num=0, train/loss_simple_step=0.0323, train/loss_vlb_step=0.000126, train/loss_step=0.0323, global_step=1585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  25%|██▌       | 305/1208 [09:08<27:03,  1.80s/it, loss=0.079, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00151, train/loss_step=0.298, global_step=1586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  25%|██▌       | 306/1208 [09:09<26:59,  1.80s/it, loss=0.079, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00151, train/loss_step=0.298, global_step=1586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  25%|██▌       | 306/1208 [09:09<26:59,  1.80s/it, loss=0.0888, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000729, train/loss_step=0.202, global_step=1586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  25%|██▌       | 307/1208 [09:10<26:55,  1.79s/it, loss=0.0888, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000729, train/loss_step=0.202, global_step=1586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  25%|██▌       | 307/1208 [09:10<26:55,  1.79s/it, loss=0.12, v_num=0, train/loss_simple_step=0.705, train/loss_vlb_step=0.0453, train/loss_step=0.705, global_step=1586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  25%|██▌       | 308/1208 [09:13<26:57,  1.80s/it, loss=0.12, v_num=0, train/loss_simple_step=0.705, train/loss_vlb_step=0.0453, train/loss_step=0.705, global_step=1586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  25%|██▌       | 308/1208 [09:13<26:57,  1.80s/it, loss=0.114, v_num=0, train/loss_simple_step=0.077, train/loss_vlb_step=0.00026, train/loss_step=0.077, global_step=1586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  26%|██▌       | 309/1208 [09:14<26:53,  1.79s/it, loss=0.114, v_num=0, train/loss_simple_step=0.077, train/loss_vlb_step=0.00026, train/loss_step=0.077, global_step=1586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  26%|██▌       | 309/1208 [09:14<26:53,  1.79s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000145, train/loss_step=0.0407, global_step=1587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  26%|██▌       | 310/1208 [09:15<26:49,  1.79s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000145, train/loss_step=0.0407, global_step=1587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  26%|██▌       | 310/1208 [09:15<26:49,  1.79s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.1e-5, train/loss_step=0.0116, global_step=1587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  26%|██▌       | 311/1208 [09:16<26:45,  1.79s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.1e-5, train/loss_step=0.0116, global_step=1587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  26%|██▌       | 311/1208 [09:16<26:45,  1.79s/it, loss=0.115, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000458, train/loss_step=0.135, global_step=1587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  26%|██▌       | 312/1208 [09:19<26:48,  1.79s/it, loss=0.115, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000458, train/loss_step=0.135, global_step=1587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  26%|██▌       | 312/1208 [09:19<26:48,  1.79s/it, loss=0.121, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000409, train/loss_step=0.125, global_step=1587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  26%|██▌       | 313/1208 [09:21<26:44,  1.79s/it, loss=0.121, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000409, train/loss_step=0.125, global_step=1587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  26%|██▌       | 313/1208 [09:21<26:44,  1.79s/it, loss=0.122, v_num=0, train/loss_simple_step=0.082, train/loss_vlb_step=0.000273, train/loss_step=0.082, global_step=1588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  26%|██▌       | 314/1208 [09:22<26:40,  1.79s/it, loss=0.122, v_num=0, train/loss_simple_step=0.082, train/loss_vlb_step=0.000273, train/loss_step=0.082, global_step=1588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  26%|██▌       | 314/1208 [09:22<26:40,  1.79s/it, loss=0.114, v_num=0, train/loss_simple_step=0.046, train/loss_vlb_step=0.000164, train/loss_step=0.046, global_step=1588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  26%|██▌       | 315/1208 [09:23<26:36,  1.79s/it, loss=0.114, v_num=0, train/loss_simple_step=0.046, train/loss_vlb_step=0.000164, train/loss_step=0.046, global_step=1588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  26%|██▌       | 315/1208 [09:23<26:36,  1.79s/it, loss=0.123, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.00077, train/loss_step=0.200, global_step=1588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  26%|██▌       | 316/1208 [09:26<26:38,  1.79s/it, loss=0.123, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.00077, train/loss_step=0.200, global_step=1588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  26%|██▌       | 316/1208 [09:26<26:38,  1.79s/it, loss=0.118, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000425, train/loss_step=0.127, global_step=1588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  26%|██▌       | 317/1208 [09:27<26:34,  1.79s/it, loss=0.118, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000425, train/loss_step=0.127, global_step=1588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  26%|██▌       | 317/1208 [09:27<26:34,  1.79s/it, loss=0.141, v_num=0, train/loss_simple_step=0.482, train/loss_vlb_step=0.0118, train/loss_step=0.482, global_step=1589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  26%|██▋       | 318/1208 [09:28<26:30,  1.79s/it, loss=0.141, v_num=0, train/loss_simple_step=0.482, train/loss_vlb_step=0.0118, train/loss_step=0.482, global_step=1589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  26%|██▋       | 318/1208 [09:28<26:30,  1.79s/it, loss=0.146, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000384, train/loss_step=0.116, global_step=1589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  26%|██▋       | 319/1208 [09:29<26:27,  1.79s/it, loss=0.146, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000384, train/loss_step=0.116, global_step=1589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  26%|██▋       | 319/1208 [09:29<26:27,  1.79s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0973, train/loss_vlb_step=0.000323, train/loss_step=0.0973, global_step=1589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  26%|██▋       | 320/1208 [09:32<26:29,  1.79s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0973, train/loss_vlb_step=0.000323, train/loss_step=0.0973, global_step=1589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  26%|██▋       | 320/1208 [09:32<26:29,  1.79s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0912, train/loss_vlb_step=0.000301, train/loss_step=0.0912, global_step=1589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  27%|██▋       | 321/1208 [09:33<26:25,  1.79s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0912, train/loss_vlb_step=0.000301, train/loss_step=0.0912, global_step=1589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  27%|██▋       | 321/1208 [09:33<26:25,  1.79s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00287, train/loss_vlb_step=1.65e-5, train/loss_step=0.00287, global_step=1590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  27%|██▋       | 322/1208 [09:34<26:21,  1.79s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00287, train/loss_vlb_step=1.65e-5, train/loss_step=0.00287, global_step=1590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  27%|██▋       | 322/1208 [09:34<26:21,  1.79s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000102, train/loss_step=0.0255, global_step=1590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  27%|██▋       | 323/1208 [09:35<26:17,  1.78s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000102, train/loss_step=0.0255, global_step=1590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  27%|██▋       | 323/1208 [09:35<26:17,  1.78s/it, loss=0.15, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=1590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  27%|██▋       | 324/1208 [09:39<26:20,  1.79s/it, loss=0.15, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=1590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  27%|██▋       | 324/1208 [09:39<26:20,  1.79s/it, loss=0.15, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=9.02e-5, train/loss_step=0.022, global_step=1590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  27%|██▋       | 325/1208 [09:40<26:16,  1.79s/it, loss=0.15, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=9.02e-5, train/loss_step=0.022, global_step=1590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  27%|██▋       | 325/1208 [09:40<26:16,  1.79s/it, loss=0.145, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000912, train/loss_step=0.207, global_step=1591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  27%|██▋       | 326/1208 [09:41<26:12,  1.78s/it, loss=0.145, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000912, train/loss_step=0.207, global_step=1591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  27%|██▋       | 326/1208 [09:41<26:12,  1.78s/it, loss=0.143, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000548, train/loss_step=0.162, global_step=1591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  27%|██▋       | 327/1208 [09:42<26:08,  1.78s/it, loss=0.143, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000548, train/loss_step=0.162, global_step=1591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  27%|██▋       | 327/1208 [09:42<26:08,  1.78s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0434, train/loss_vlb_step=0.000157, train/loss_step=0.0434, global_step=1591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  27%|██▋       | 328/1208 [09:45<26:10,  1.79s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0434, train/loss_vlb_step=0.000157, train/loss_step=0.0434, global_step=1591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  27%|██▋       | 328/1208 [09:45<26:10,  1.79s/it, loss=0.112, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.00039, train/loss_step=0.118, global_step=1591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  27%|██▋       | 329/1208 [09:46<26:07,  1.78s/it, loss=0.112, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.00039, train/loss_step=0.118, global_step=1591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  27%|██▋       | 329/1208 [09:46<26:07,  1.78s/it, loss=0.116, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.00039, train/loss_step=0.118, global_step=1592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  27%|██▋       | 330/1208 [09:47<26:03,  1.78s/it, loss=0.116, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.00039, train/loss_step=0.118, global_step=1592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  27%|██▋       | 330/1208 [09:47<26:03,  1.78s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0529, train/loss_vlb_step=0.000188, train/loss_step=0.0529, global_step=1592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  27%|██▋       | 331/1208 [09:48<25:59,  1.78s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0529, train/loss_vlb_step=0.000188, train/loss_step=0.0529, global_step=1592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  27%|██▋       | 331/1208 [09:48<25:59,  1.78s/it, loss=0.131, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00311, train/loss_step=0.395, global_step=1592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  27%|██▋       | 332/1208 [09:51<26:01,  1.78s/it, loss=0.131, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00311, train/loss_step=0.395, global_step=1592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  27%|██▋       | 332/1208 [09:51<26:01,  1.78s/it, loss=0.155, v_num=0, train/loss_simple_step=0.598, train/loss_vlb_step=0.00846, train/loss_step=0.598, global_step=1592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  28%|██▊       | 333/1208 [09:52<25:58,  1.78s/it, loss=0.155, v_num=0, train/loss_simple_step=0.598, train/loss_vlb_step=0.00846, train/loss_step=0.598, global_step=1592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  28%|██▊       | 333/1208 [09:52<25:58,  1.78s/it, loss=0.16, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000685, train/loss_step=0.182, global_step=1593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  28%|██▊       | 334/1208 [09:54<25:54,  1.78s/it, loss=0.16, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000685, train/loss_step=0.182, global_step=1593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  28%|██▊       | 334/1208 [09:54<25:54,  1.78s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.67e-5, train/loss_step=0.0131, global_step=1593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  28%|██▊       | 335/1208 [09:55<25:50,  1.78s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.67e-5, train/loss_step=0.0131, global_step=1593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  28%|██▊       | 335/1208 [09:55<25:50,  1.78s/it, loss=0.158, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000747, train/loss_step=0.208, global_step=1593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  28%|██▊       | 336/1208 [09:58<25:52,  1.78s/it, loss=0.158, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000747, train/loss_step=0.208, global_step=1593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  28%|██▊       | 336/1208 [09:58<25:52,  1.78s/it, loss=0.168, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00161, train/loss_step=0.321, global_step=1593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  28%|██▊       | 337/1208 [09:59<25:49,  1.78s/it, loss=0.168, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00161, train/loss_step=0.321, global_step=1593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  28%|██▊       | 337/1208 [09:59<25:49,  1.78s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.76e-5, train/loss_step=0.00311, global_step=1594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  28%|██▊       | 338/1208 [10:00<25:45,  1.78s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.76e-5, train/loss_step=0.00311, global_step=1594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  28%|██▊       | 338/1208 [10:00<25:45,  1.78s/it, loss=0.142, v_num=0, train/loss_simple_step=0.069, train/loss_vlb_step=0.000234, train/loss_step=0.069, global_step=1594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  28%|██▊       | 339/1208 [10:01<25:41,  1.77s/it, loss=0.142, v_num=0, train/loss_simple_step=0.069, train/loss_vlb_step=0.000234, train/loss_step=0.069, global_step=1594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  28%|██▊       | 339/1208 [10:01<25:41,  1.77s/it, loss=0.144, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000467, train/loss_step=0.142, global_step=1594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  28%|██▊       | 340/1208 [10:04<25:43,  1.78s/it, loss=0.144, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000467, train/loss_step=0.142, global_step=1594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  28%|██▊       | 340/1208 [10:04<25:43,  1.78s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0818, train/loss_vlb_step=0.000273, train/loss_step=0.0818, global_step=1594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  28%|██▊       | 341/1208 [10:05<25:40,  1.78s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0818, train/loss_vlb_step=0.000273, train/loss_step=0.0818, global_step=1594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  28%|██▊       | 341/1208 [10:05<25:40,  1.78s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0504, train/loss_vlb_step=0.000177, train/loss_step=0.0504, global_step=1595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  28%|██▊       | 342/1208 [10:06<25:36,  1.77s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0504, train/loss_vlb_step=0.000177, train/loss_step=0.0504, global_step=1595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  28%|██▊       | 342/1208 [10:06<25:36,  1.77s/it, loss=0.151, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=1595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  28%|██▊       | 343/1208 [10:07<25:32,  1.77s/it, loss=0.151, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=1595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  28%|██▊       | 343/1208 [10:07<25:32,  1.77s/it, loss=0.154, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000577, train/loss_step=0.172, global_step=1595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  28%|██▊       | 344/1208 [10:11<25:34,  1.78s/it, loss=0.154, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000577, train/loss_step=0.172, global_step=1595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  28%|██▊       | 344/1208 [10:11<25:34,  1.78s/it, loss=0.16, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000484, train/loss_step=0.146, global_step=1595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  29%|██▊       | 345/1208 [10:12<25:31,  1.77s/it, loss=0.16, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000484, train/loss_step=0.146, global_step=1595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  29%|██▊       | 345/1208 [10:12<25:31,  1.77s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0647, train/loss_vlb_step=0.00022, train/loss_step=0.0647, global_step=1596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  29%|██▊       | 346/1208 [10:13<25:27,  1.77s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0647, train/loss_vlb_step=0.00022, train/loss_step=0.0647, global_step=1596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  29%|██▊       | 346/1208 [10:13<25:27,  1.77s/it, loss=0.148, v_num=0, train/loss_simple_step=0.060, train/loss_vlb_step=0.000208, train/loss_step=0.060, global_step=1596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  29%|██▊       | 347/1208 [10:14<25:23,  1.77s/it, loss=0.148, v_num=0, train/loss_simple_step=0.060, train/loss_vlb_step=0.000208, train/loss_step=0.060, global_step=1596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  29%|██▊       | 347/1208 [10:14<25:23,  1.77s/it, loss=0.161, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00126, train/loss_step=0.292, global_step=1596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  29%|██▉       | 348/1208 [10:17<25:25,  1.77s/it, loss=0.161, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00126, train/loss_step=0.292, global_step=1596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  29%|██▉       | 348/1208 [10:17<25:25,  1.77s/it, loss=0.164, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000743, train/loss_step=0.196, global_step=1596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  29%|██▉       | 349/1208 [10:18<25:22,  1.77s/it, loss=0.164, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000743, train/loss_step=0.196, global_step=1596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  29%|██▉       | 349/1208 [10:18<25:22,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000643, train/loss_step=0.183, global_step=1597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  29%|██▉       | 350/1208 [10:19<25:18,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000643, train/loss_step=0.183, global_step=1597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  29%|██▉       | 350/1208 [10:19<25:18,  1.77s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00314, train/loss_vlb_step=1.75e-5, train/loss_step=0.00314, global_step=1597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  29%|██▉       | 351/1208 [10:20<25:15,  1.77s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00314, train/loss_vlb_step=1.75e-5, train/loss_step=0.00314, global_step=1597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  29%|██▉       | 351/1208 [10:20<25:15,  1.77s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=1.14e-5, train/loss_step=0.0019, global_step=1597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  29%|██▉       | 352/1208 [10:23<25:16,  1.77s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=1.14e-5, train/loss_step=0.0019, global_step=1597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  29%|██▉       | 352/1208 [10:23<25:16,  1.77s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.35e-5, train/loss_step=0.0167, global_step=1597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  29%|██▉       | 353/1208 [10:24<25:13,  1.77s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.35e-5, train/loss_step=0.0167, global_step=1597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  29%|██▉       | 353/1208 [10:24<25:13,  1.77s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0684, train/loss_vlb_step=0.000243, train/loss_step=0.0684, global_step=1598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  29%|██▉       | 354/1208 [10:25<25:09,  1.77s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0684, train/loss_vlb_step=0.000243, train/loss_step=0.0684, global_step=1598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  29%|██▉       | 354/1208 [10:25<25:09,  1.77s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.17e-5, train/loss_step=0.00394, global_step=1598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  29%|██▉       | 355/1208 [10:26<25:06,  1.77s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.17e-5, train/loss_step=0.00394, global_step=1598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  29%|██▉       | 355/1208 [10:26<25:06,  1.77s/it, loss=0.113, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00132, train/loss_step=0.271, global_step=1598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  29%|██▉       | 356/1208 [10:30<25:08,  1.77s/it, loss=0.113, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00132, train/loss_step=0.271, global_step=1598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  29%|██▉       | 356/1208 [10:30<25:08,  1.77s/it, loss=0.098, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.67e-5, train/loss_step=0.0128, global_step=1598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  30%|██▉       | 357/1208 [10:31<25:04,  1.77s/it, loss=0.098, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.67e-5, train/loss_step=0.0128, global_step=1598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  30%|██▉       | 357/1208 [10:31<25:04,  1.77s/it, loss=0.098, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.83e-5, train/loss_step=0.0033, global_step=1599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  30%|██▉       | 358/1208 [10:32<25:01,  1.77s/it, loss=0.098, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.83e-5, train/loss_step=0.0033, global_step=1599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  30%|██▉       | 358/1208 [10:32<25:01,  1.77s/it, loss=0.095, v_num=0, train/loss_simple_step=0.00819, train/loss_vlb_step=4.11e-5, train/loss_step=0.00819, global_step=1599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  30%|██▉       | 359/1208 [10:33<24:57,  1.76s/it, loss=0.095, v_num=0, train/loss_simple_step=0.00819, train/loss_vlb_step=4.11e-5, train/loss_step=0.00819, global_step=1599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  30%|██▉       | 359/1208 [10:33<24:57,  1.76s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000935, train/loss_step=0.239, global_step=1599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  30%|██▉       | 360/1208 [10:36<24:59,  1.77s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000935, train/loss_step=0.239, global_step=1599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  30%|██▉       | 360/1208 [10:36<24:59,  1.77s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.0534, train/loss_vlb_step=0.000182, train/loss_step=0.0534, global_step=1599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  30%|██▉       | 361/1208 [10:37<24:56,  1.77s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.0534, train/loss_vlb_step=0.000182, train/loss_step=0.0534, global_step=1599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  30%|██▉       | 361/1208 [10:37<24:56,  1.77s/it, loss=0.109, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00103, train/loss_step=0.262, global_step=1600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  30%|██▉       | 362/1208 [10:38<24:52,  1.76s/it, loss=0.109, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00103, train/loss_step=0.262, global_step=1600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  30%|██▉       | 362/1208 [10:38<24:52,  1.76s/it, loss=0.109, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000421, train/loss_step=0.128, global_step=1600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  30%|███       | 363/1208 [10:39<24:49,  1.76s/it, loss=0.109, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000421, train/loss_step=0.128, global_step=1600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  30%|███       | 363/1208 [10:39<24:49,  1.76s/it, loss=0.13, v_num=0, train/loss_simple_step=0.582, train/loss_vlb_step=0.00728, train/loss_step=0.582, global_step=1600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  30%|███       | 364/1208 [10:42<24:50,  1.77s/it, loss=0.13, v_num=0, train/loss_simple_step=0.582, train/loss_vlb_step=0.00728, train/loss_step=0.582, global_step=1600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  30%|███       | 364/1208 [10:42<24:50,  1.77s/it, loss=0.131, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000541, train/loss_step=0.164, global_step=1600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  30%|███       | 365/1208 [10:44<24:47,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000541, train/loss_step=0.164, global_step=1600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  30%|███       | 365/1208 [10:44<24:47,  1.76s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.22e-5, train/loss_step=0.0226, global_step=1601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  30%|███       | 366/1208 [10:45<24:43,  1.76s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.22e-5, train/loss_step=0.0226, global_step=1601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  30%|███       | 366/1208 [10:45<24:43,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00778, train/loss_vlb_step=3.88e-5, train/loss_step=0.00778, global_step=1601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  30%|███       | 367/1208 [10:46<24:40,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00778, train/loss_vlb_step=3.88e-5, train/loss_step=0.00778, global_step=1601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  30%|███       | 367/1208 [10:46<24:40,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.8e-5, train/loss_step=0.0212, global_step=1601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  30%|███       | 368/1208 [10:49<24:42,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.8e-5, train/loss_step=0.0212, global_step=1601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  30%|███       | 368/1208 [10:49<24:42,  1.76s/it, loss=0.108, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000347, train/loss_step=0.106, global_step=1601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  31%|███       | 369/1208 [10:50<24:38,  1.76s/it, loss=0.108, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000347, train/loss_step=0.106, global_step=1601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  31%|███       | 369/1208 [10:50<24:38,  1.76s/it, loss=0.105, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=1602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  31%|███       | 370/1208 [10:51<24:35,  1.76s/it, loss=0.105, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=1602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  31%|███       | 370/1208 [10:51<24:35,  1.76s/it, loss=0.121, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00168, train/loss_step=0.323, global_step=1602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  31%|███       | 371/1208 [10:52<24:32,  1.76s/it, loss=0.121, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00168, train/loss_step=0.323, global_step=1602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  31%|███       | 371/1208 [10:52<24:32,  1.76s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=8.06e-5, train/loss_step=0.0192, global_step=1602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  31%|███       | 372/1208 [10:55<24:33,  1.76s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=8.06e-5, train/loss_step=0.0192, global_step=1602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  31%|███       | 372/1208 [10:55<24:33,  1.76s/it, loss=0.147, v_num=0, train/loss_simple_step=0.520, train/loss_vlb_step=0.00704, train/loss_step=0.520, global_step=1602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  31%|███       | 373/1208 [10:56<24:30,  1.76s/it, loss=0.147, v_num=0, train/loss_simple_step=0.520, train/loss_vlb_step=0.00704, train/loss_step=0.520, global_step=1602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  31%|███       | 373/1208 [10:56<24:30,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0579, train/loss_vlb_step=0.000204, train/loss_step=0.0579, global_step=1603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  31%|███       | 374/1208 [10:57<24:26,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0579, train/loss_vlb_step=0.000204, train/loss_step=0.0579, global_step=1603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  31%|███       | 374/1208 [10:57<24:26,  1.76s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0915, train/loss_vlb_step=0.000314, train/loss_step=0.0915, global_step=1603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  31%|███       | 375/1208 [10:58<24:23,  1.76s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0915, train/loss_vlb_step=0.000314, train/loss_step=0.0915, global_step=1603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  31%|███       | 375/1208 [10:58<24:23,  1.76s/it, loss=0.143, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000436, train/loss_step=0.128, global_step=1603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  31%|███       | 376/1208 [11:02<24:25,  1.76s/it, loss=0.143, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000436, train/loss_step=0.128, global_step=1603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  31%|███       | 376/1208 [11:02<24:25,  1.76s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.27e-5, train/loss_step=0.0231, global_step=1603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  31%|███       | 377/1208 [11:03<24:21,  1.76s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.27e-5, train/loss_step=0.0231, global_step=1603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  31%|███       | 377/1208 [11:03<24:21,  1.76s/it, loss=0.149, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000338, train/loss_step=0.103, global_step=1604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  31%|███▏      | 378/1208 [11:04<24:18,  1.76s/it, loss=0.149, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000338, train/loss_step=0.103, global_step=1604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  31%|███▏      | 378/1208 [11:04<24:18,  1.76s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.42e-5, train/loss_step=0.00248, global_step=1604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  31%|███▏      | 379/1208 [11:05<24:15,  1.76s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.42e-5, train/loss_step=0.00248, global_step=1604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  31%|███▏      | 379/1208 [11:05<24:15,  1.76s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0458, train/loss_vlb_step=0.000171, train/loss_step=0.0458, global_step=1604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  31%|███▏      | 380/1208 [11:08<24:16,  1.76s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0458, train/loss_vlb_step=0.000171, train/loss_step=0.0458, global_step=1604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  31%|███▏      | 380/1208 [11:08<24:16,  1.76s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0562, train/loss_vlb_step=0.000198, train/loss_step=0.0562, global_step=1604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  32%|███▏      | 381/1208 [11:09<24:13,  1.76s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0562, train/loss_vlb_step=0.000198, train/loss_step=0.0562, global_step=1604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  32%|███▏      | 381/1208 [11:09<24:13,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=5.01e-5, train/loss_step=0.0104, global_step=1605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  32%|███▏      | 382/1208 [11:10<24:09,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=5.01e-5, train/loss_step=0.0104, global_step=1605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  32%|███▏      | 382/1208 [11:10<24:09,  1.76s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.66e-5, train/loss_step=0.0158, global_step=1605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  32%|███▏      | 383/1208 [11:11<24:06,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.66e-5, train/loss_step=0.0158, global_step=1605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  32%|███▏      | 383/1208 [11:11<24:06,  1.75s/it, loss=0.106, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00123, train/loss_step=0.282, global_step=1605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  32%|███▏      | 384/1208 [11:14<24:07,  1.76s/it, loss=0.106, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00123, train/loss_step=0.282, global_step=1605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  32%|███▏      | 384/1208 [11:14<24:07,  1.76s/it, loss=0.106, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000539, train/loss_step=0.161, global_step=1605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  32%|███▏      | 385/1208 [11:15<24:04,  1.76s/it, loss=0.106, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000539, train/loss_step=0.161, global_step=1605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  32%|███▏      | 385/1208 [11:15<24:04,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000521, train/loss_step=0.153, global_step=1606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  32%|███▏      | 386/1208 [11:16<24:01,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000521, train/loss_step=0.153, global_step=1606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  32%|███▏      | 386/1208 [11:16<24:01,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.42e-5, train/loss_step=0.0145, global_step=1606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  32%|███▏      | 387/1208 [11:17<23:58,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.42e-5, train/loss_step=0.0145, global_step=1606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  32%|███▏      | 387/1208 [11:17<23:58,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000112, train/loss_step=0.0284, global_step=1606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  32%|███▏      | 388/1208 [11:21<23:59,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000112, train/loss_step=0.0284, global_step=1606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  32%|███▏      | 388/1208 [11:21<23:59,  1.76s/it, loss=0.114, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000418, train/loss_step=0.125, global_step=1606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  32%|███▏      | 389/1208 [11:22<23:56,  1.75s/it, loss=0.114, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000418, train/loss_step=0.125, global_step=1606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  32%|███▏      | 389/1208 [11:22<23:56,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000482, train/loss_step=0.143, global_step=1607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  32%|███▏      | 390/1208 [11:23<23:53,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000482, train/loss_step=0.143, global_step=1607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  32%|███▏      | 390/1208 [11:23<23:53,  1.75s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.37e-5, train/loss_step=0.0167, global_step=1607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  32%|███▏      | 391/1208 [11:24<23:49,  1.75s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.37e-5, train/loss_step=0.0167, global_step=1607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  32%|███▏      | 391/1208 [11:24<23:49,  1.75s/it, loss=0.1, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.59e-5, train/loss_step=0.023, global_step=1607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]     Epoch 5:  32%|███▏      | 392/1208 [11:27<23:51,  1.75s/it, loss=0.1, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.59e-5, train/loss_step=0.023, global_step=1607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  32%|███▏      | 392/1208 [11:27<23:51,  1.75s/it, loss=0.0775, v_num=0, train/loss_simple_step=0.0696, train/loss_vlb_step=0.000235, train/loss_step=0.0696, global_step=1607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  33%|███▎      | 393/1208 [11:28<23:48,  1.75s/it, loss=0.0775, v_num=0, train/loss_simple_step=0.0696, train/loss_vlb_step=0.000235, train/loss_step=0.0696, global_step=1607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  33%|███▎      | 393/1208 [11:28<23:48,  1.75s/it, loss=0.0747, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.61e-5, train/loss_step=0.00278, global_step=1608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  33%|███▎      | 394/1208 [11:29<23:44,  1.75s/it, loss=0.0747, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.61e-5, train/loss_step=0.00278, global_step=1608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  33%|███▎      | 394/1208 [11:29<23:44,  1.75s/it, loss=0.0726, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.000177, train/loss_step=0.0489, global_step=1608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  33%|███▎      | 395/1208 [11:30<23:41,  1.75s/it, loss=0.0726, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.000177, train/loss_step=0.0489, global_step=1608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  33%|███▎      | 395/1208 [11:30<23:41,  1.75s/it, loss=0.0675, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=0.000104, train/loss_step=0.0251, global_step=1608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  33%|███▎      | 396/1208 [11:33<23:42,  1.75s/it, loss=0.0675, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=0.000104, train/loss_step=0.0251, global_step=1608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  33%|███▎      | 396/1208 [11:33<23:42,  1.75s/it, loss=0.0768, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000793, train/loss_step=0.210, global_step=1608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  33%|███▎      | 397/1208 [11:34<23:39,  1.75s/it, loss=0.0768, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000793, train/loss_step=0.210, global_step=1608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  33%|███▎      | 397/1208 [11:34<23:39,  1.75s/it, loss=0.0725, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.25e-5, train/loss_step=0.0169, global_step=1609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  33%|███▎      | 398/1208 [11:36<23:36,  1.75s/it, loss=0.0725, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.25e-5, train/loss_step=0.0169, global_step=1609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  33%|███▎      | 398/1208 [11:36<23:36,  1.75s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.422, train/loss_vlb_step=0.0035, train/loss_step=0.422, global_step=1609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  33%|███▎      | 399/1208 [11:37<23:33,  1.75s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.422, train/loss_vlb_step=0.0035, train/loss_step=0.422, global_step=1609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  33%|███▎      | 399/1208 [11:37<23:33,  1.75s/it, loss=0.0917, v_num=0, train/loss_simple_step=0.00976, train/loss_vlb_step=4.85e-5, train/loss_step=0.00976, global_step=1609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  33%|███▎      | 400/1208 [11:40<23:34,  1.75s/it, loss=0.0917, v_num=0, train/loss_simple_step=0.00976, train/loss_vlb_step=4.85e-5, train/loss_step=0.00976, global_step=1609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  33%|███▎      | 400/1208 [11:40<23:34,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.721, train/loss_vlb_step=0.0614, train/loss_step=0.721, global_step=1609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]      Epoch 5:  33%|███▎      | 401/1208 [11:41<23:31,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.721, train/loss_vlb_step=0.0614, train/loss_step=0.721, global_step=1609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  33%|███▎      | 401/1208 [11:41<23:31,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0488, train/loss_vlb_step=0.000175, train/loss_step=0.0488, global_step=1610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  33%|███▎      | 402/1208 [11:42<23:28,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0488, train/loss_vlb_step=0.000175, train/loss_step=0.0488, global_step=1610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  33%|███▎      | 402/1208 [11:42<23:28,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0825, train/loss_vlb_step=0.000276, train/loss_step=0.0825, global_step=1610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  33%|███▎      | 403/1208 [11:43<23:25,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0825, train/loss_vlb_step=0.000276, train/loss_step=0.0825, global_step=1610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  33%|███▎      | 403/1208 [11:43<23:25,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.94e-5, train/loss_step=0.0129, global_step=1610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  33%|███▎      | 404/1208 [11:46<23:26,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.94e-5, train/loss_step=0.0129, global_step=1610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  33%|███▎      | 404/1208 [11:46<23:26,  1.75s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00528, train/loss_vlb_step=2.85e-5, train/loss_step=0.00528, global_step=1610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  34%|███▎      | 405/1208 [11:47<23:23,  1.75s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00528, train/loss_vlb_step=2.85e-5, train/loss_step=0.00528, global_step=1610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  34%|███▎      | 405/1208 [11:47<23:23,  1.75s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0957, train/loss_vlb_step=0.000315, train/loss_step=0.0957, global_step=1611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  34%|███▎      | 406/1208 [11:48<23:19,  1.75s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0957, train/loss_vlb_step=0.000315, train/loss_step=0.0957, global_step=1611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  34%|███▎      | 406/1208 [11:48<23:19,  1.75s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00787, train/loss_vlb_step=4.01e-5, train/loss_step=0.00787, global_step=1611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  34%|███▎      | 407/1208 [11:49<23:16,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00787, train/loss_vlb_step=4.01e-5, train/loss_step=0.00787, global_step=1611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  34%|███▎      | 407/1208 [11:49<23:16,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.687, train/loss_vlb_step=0.0276, train/loss_step=0.687, global_step=1611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]     Epoch 5:  34%|███▍      | 408/1208 [11:52<23:18,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.687, train/loss_vlb_step=0.0276, train/loss_step=0.687, global_step=1611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  34%|███▍      | 408/1208 [11:52<23:18,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000424, train/loss_step=0.129, global_step=1611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  34%|███▍      | 409/1208 [11:54<23:14,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000424, train/loss_step=0.129, global_step=1611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  34%|███▍      | 409/1208 [11:54<23:14,  1.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000723, train/loss_step=0.203, global_step=1612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  34%|███▍      | 410/1208 [11:55<23:11,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000723, train/loss_step=0.203, global_step=1612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  34%|███▍      | 410/1208 [11:55<23:11,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000481, train/loss_step=0.145, global_step=1612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  34%|███▍      | 411/1208 [11:56<23:08,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000481, train/loss_step=0.145, global_step=1612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  34%|███▍      | 411/1208 [11:56<23:08,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00132, train/loss_step=0.292, global_step=1612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  34%|███▍      | 412/1208 [11:59<23:09,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00132, train/loss_step=0.292, global_step=1612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  34%|███▍      | 412/1208 [11:59<23:09,  1.75s/it, loss=0.185, v_num=0, train/loss_simple_step=0.534, train/loss_vlb_step=0.00694, train/loss_step=0.534, global_step=1612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  34%|███▍      | 413/1208 [12:00<23:06,  1.74s/it, loss=0.185, v_num=0, train/loss_simple_step=0.534, train/loss_vlb_step=0.00694, train/loss_step=0.534, global_step=1612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  34%|███▍      | 413/1208 [12:00<23:06,  1.74s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000136, train/loss_step=0.0358, global_step=1613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  34%|███▍      | 414/1208 [12:01<23:03,  1.74s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000136, train/loss_step=0.0358, global_step=1613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  34%|███▍      | 414/1208 [12:01<23:03,  1.74s/it, loss=0.192, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000562, train/loss_step=0.162, global_step=1613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  34%|███▍      | 415/1208 [12:02<23:00,  1.74s/it, loss=0.192, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000562, train/loss_step=0.162, global_step=1613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  34%|███▍      | 415/1208 [12:02<23:00,  1.74s/it, loss=0.192, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.59e-5, train/loss_step=0.018, global_step=1613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  34%|███▍      | 416/1208 [12:05<23:01,  1.74s/it, loss=0.192, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.59e-5, train/loss_step=0.018, global_step=1613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  34%|███▍      | 416/1208 [12:05<23:01,  1.74s/it, loss=0.2, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00222, train/loss_step=0.366, global_step=1613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  35%|███▍      | 417/1208 [12:06<22:58,  1.74s/it, loss=0.2, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00222, train/loss_step=0.366, global_step=1613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  35%|███▍      | 417/1208 [12:06<22:58,  1.74s/it, loss=0.226, v_num=0, train/loss_simple_step=0.535, train/loss_vlb_step=0.00574, train/loss_step=0.535, global_step=1614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  35%|███▍      | 418/1208 [12:07<22:55,  1.74s/it, loss=0.226, v_num=0, train/loss_simple_step=0.535, train/loss_vlb_step=0.00574, train/loss_step=0.535, global_step=1614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  35%|███▍      | 418/1208 [12:07<22:55,  1.74s/it, loss=0.205, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.14e-5, train/loss_step=0.00191, global_step=1614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  35%|███▍      | 419/1208 [12:08<22:52,  1.74s/it, loss=0.205, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.14e-5, train/loss_step=0.00191, global_step=1614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  35%|███▍      | 419/1208 [12:08<22:52,  1.74s/it, loss=0.204, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=2.88e-5, train/loss_step=0.00545, global_step=1614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  35%|███▍      | 420/1208 [12:12<22:53,  1.74s/it, loss=0.204, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=2.88e-5, train/loss_step=0.00545, global_step=1614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  35%|███▍      | 420/1208 [12:12<22:53,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.0012, train/loss_step=0.256, global_step=1614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]     Epoch 5:  35%|███▍      | 421/1208 [12:13<22:50,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.0012, train/loss_step=0.256, global_step=1614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  35%|███▍      | 421/1208 [12:13<22:50,  1.74s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0889, train/loss_vlb_step=0.000296, train/loss_step=0.0889, global_step=1615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  35%|███▍      | 422/1208 [12:14<22:47,  1.74s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0889, train/loss_vlb_step=0.000296, train/loss_step=0.0889, global_step=1615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  35%|███▍      | 422/1208 [12:14<22:47,  1.74s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000113, train/loss_step=0.0278, global_step=1615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  35%|███▌      | 423/1208 [12:15<22:44,  1.74s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000113, train/loss_step=0.0278, global_step=1615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  35%|███▌      | 423/1208 [12:15<22:44,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.9e-5, train/loss_step=0.0191, global_step=1615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  35%|███▌      | 424/1208 [12:18<22:45,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.9e-5, train/loss_step=0.0191, global_step=1615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  35%|███▌      | 424/1208 [12:18<22:45,  1.74s/it, loss=0.21, v_num=0, train/loss_simple_step=0.594, train/loss_vlb_step=0.0159, train/loss_step=0.594, global_step=1615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  35%|███▌      | 425/1208 [12:19<22:42,  1.74s/it, loss=0.21, v_num=0, train/loss_simple_step=0.594, train/loss_vlb_step=0.0159, train/loss_step=0.594, global_step=1615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  35%|███▌      | 425/1208 [12:19<22:42,  1.74s/it, loss=0.206, v_num=0, train/loss_simple_step=0.00645, train/loss_vlb_step=3.33e-5, train/loss_step=0.00645, global_step=1616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  35%|███▌      | 426/1208 [12:20<22:39,  1.74s/it, loss=0.206, v_num=0, train/loss_simple_step=0.00645, train/loss_vlb_step=3.33e-5, train/loss_step=0.00645, global_step=1616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  35%|███▌      | 426/1208 [12:20<22:39,  1.74s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.61e-5, train/loss_step=0.0151, global_step=1616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  35%|███▌      | 427/1208 [12:21<22:36,  1.74s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.61e-5, train/loss_step=0.0151, global_step=1616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  35%|███▌      | 427/1208 [12:21<22:36,  1.74s/it, loss=0.186, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00131, train/loss_step=0.294, global_step=1616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  35%|███▌      | 428/1208 [12:25<22:37,  1.74s/it, loss=0.186, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00131, train/loss_step=0.294, global_step=1616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  35%|███▌      | 428/1208 [12:25<22:37,  1.74s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=2.01e-5, train/loss_step=0.00368, global_step=1616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  36%|███▌      | 429/1208 [12:26<22:34,  1.74s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=2.01e-5, train/loss_step=0.00368, global_step=1616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  36%|███▌      | 429/1208 [12:26<22:34,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0895, train/loss_vlb_step=0.000303, train/loss_step=0.0895, global_step=1617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  36%|███▌      | 430/1208 [12:27<22:31,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0895, train/loss_vlb_step=0.000303, train/loss_step=0.0895, global_step=1617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  36%|███▌      | 430/1208 [12:27<22:31,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.67e-5, train/loss_step=0.00285, global_step=1617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  36%|███▌      | 431/1208 [12:28<22:28,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.67e-5, train/loss_step=0.00285, global_step=1617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  36%|███▌      | 431/1208 [12:28<22:28,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00825, train/loss_vlb_step=3.98e-5, train/loss_step=0.00825, global_step=1617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  36%|███▌      | 432/1208 [12:31<22:29,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00825, train/loss_vlb_step=3.98e-5, train/loss_step=0.00825, global_step=1617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  36%|███▌      | 432/1208 [12:31<22:29,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.550, train/loss_vlb_step=0.0124, train/loss_step=0.550, global_step=1617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]     Epoch 5:  36%|███▌      | 433/1208 [12:32<22:26,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.550, train/loss_vlb_step=0.0124, train/loss_step=0.550, global_step=1617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  36%|███▌      | 433/1208 [12:32<22:26,  1.74s/it, loss=0.161, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000567, train/loss_step=0.168, global_step=1618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  36%|███▌      | 434/1208 [12:33<22:23,  1.74s/it, loss=0.161, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000567, train/loss_step=0.168, global_step=1618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  36%|███▌      | 434/1208 [12:33<22:23,  1.74s/it, loss=0.165, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.000932, train/loss_step=0.247, global_step=1618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  36%|███▌      | 435/1208 [12:34<22:20,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.000932, train/loss_step=0.247, global_step=1618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  36%|███▌      | 435/1208 [12:34<22:20,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.23e-5, train/loss_step=0.00205, global_step=1618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  36%|███▌      | 436/1208 [12:37<22:21,  1.74s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.23e-5, train/loss_step=0.00205, global_step=1618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  36%|███▌      | 436/1208 [12:37<22:21,  1.74s/it, loss=0.151, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000338, train/loss_step=0.102, global_step=1618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  36%|███▌      | 437/1208 [12:38<22:18,  1.74s/it, loss=0.151, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000338, train/loss_step=0.102, global_step=1618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  36%|███▌      | 437/1208 [12:38<22:18,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=1.66e-5, train/loss_step=0.00294, global_step=1619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  36%|███▋      | 438/1208 [12:39<22:15,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=1.66e-5, train/loss_step=0.00294, global_step=1619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  36%|███▋      | 438/1208 [12:39<22:15,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000603, train/loss_step=0.175, global_step=1619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  36%|███▋      | 439/1208 [12:40<22:12,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000603, train/loss_step=0.175, global_step=1619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  36%|███▋      | 439/1208 [12:40<22:12,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.085, train/loss_vlb_step=0.000289, train/loss_step=0.085, global_step=1619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  36%|███▋      | 440/1208 [12:44<22:13,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.085, train/loss_vlb_step=0.000289, train/loss_step=0.085, global_step=1619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  36%|███▋      | 440/1208 [12:44<22:13,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0355, train/loss_vlb_step=0.000129, train/loss_step=0.0355, global_step=1619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  37%|███▋      | 441/1208 [12:45<22:11,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0355, train/loss_vlb_step=0.000129, train/loss_step=0.0355, global_step=1619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  37%|███▋      | 441/1208 [12:45<22:11,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000157, train/loss_step=0.042, global_step=1620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  37%|███▋      | 442/1208 [12:46<22:08,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000157, train/loss_step=0.042, global_step=1620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  37%|███▋      | 442/1208 [12:46<22:08,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000361, train/loss_step=0.110, global_step=1620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  37%|███▋      | 443/1208 [12:47<22:05,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000361, train/loss_step=0.110, global_step=1620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  37%|███▋      | 443/1208 [12:47<22:05,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00113, train/loss_step=0.278, global_step=1620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  37%|███▋      | 444/1208 [12:50<22:06,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00113, train/loss_step=0.278, global_step=1620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  37%|███▋      | 444/1208 [12:50<22:06,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000139, train/loss_step=0.0386, global_step=1620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  37%|███▋      | 445/1208 [12:51<22:03,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000139, train/loss_step=0.0386, global_step=1620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  37%|███▋      | 445/1208 [12:51<22:03,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.09e-5, train/loss_step=0.0139, global_step=1621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  37%|███▋      | 446/1208 [12:52<22:00,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.09e-5, train/loss_step=0.0139, global_step=1621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  37%|███▋      | 446/1208 [12:52<22:00,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000545, train/loss_step=0.160, global_step=1621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  37%|███▋      | 447/1208 [12:53<21:57,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000545, train/loss_step=0.160, global_step=1621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  37%|███▋      | 447/1208 [12:53<21:57,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0614, train/loss_vlb_step=0.000218, train/loss_step=0.0614, global_step=1621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  37%|███▋      | 448/1208 [12:57<21:58,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0614, train/loss_vlb_step=0.000218, train/loss_step=0.0614, global_step=1621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  37%|███▋      | 448/1208 [12:57<21:58,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.707, train/loss_vlb_step=0.0366, train/loss_step=0.707, global_step=1621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  37%|███▋      | 449/1208 [12:58<21:55,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.707, train/loss_vlb_step=0.0366, train/loss_step=0.707, global_step=1621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  37%|███▋      | 449/1208 [12:58<21:55,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.00078, train/loss_step=0.206, global_step=1622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  37%|███▋      | 450/1208 [12:59<21:52,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.00078, train/loss_step=0.206, global_step=1622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  37%|███▋      | 450/1208 [12:59<21:52,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0584, train/loss_vlb_step=0.000198, train/loss_step=0.0584, global_step=1622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  37%|███▋      | 451/1208 [13:00<21:49,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0584, train/loss_vlb_step=0.000198, train/loss_step=0.0584, global_step=1622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  37%|███▋      | 451/1208 [13:00<21:49,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0692, train/loss_vlb_step=0.000236, train/loss_step=0.0692, global_step=1622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  37%|███▋      | 452/1208 [13:03<21:50,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0692, train/loss_vlb_step=0.000236, train/loss_step=0.0692, global_step=1622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  37%|███▋      | 452/1208 [13:03<21:50,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00177, train/loss_step=0.313, global_step=1622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  38%|███▊      | 453/1208 [13:04<21:47,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00177, train/loss_step=0.313, global_step=1622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  38%|███▊      | 453/1208 [13:04<21:47,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.17e-5, train/loss_step=0.00394, global_step=1623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  38%|███▊      | 454/1208 [13:05<21:44,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.17e-5, train/loss_step=0.00394, global_step=1623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  38%|███▊      | 454/1208 [13:05<21:44,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.83e-5, train/loss_step=0.0158, global_step=1623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  38%|███▊      | 455/1208 [13:06<21:41,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.83e-5, train/loss_step=0.0158, global_step=1623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  38%|███▊      | 455/1208 [13:06<21:41,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.502, train/loss_vlb_step=0.00412, train/loss_step=0.502, global_step=1623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  38%|███▊      | 456/1208 [13:09<21:42,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.502, train/loss_vlb_step=0.00412, train/loss_step=0.502, global_step=1623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  38%|███▊      | 456/1208 [13:09<21:42,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.0014, train/loss_step=0.307, global_step=1623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  38%|███▊      | 457/1208 [13:10<21:39,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.0014, train/loss_step=0.307, global_step=1623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  38%|███▊      | 457/1208 [13:10<21:39,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=6.03e-5, train/loss_step=0.0131, global_step=1624.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  38%|███▊      | 458/1208 [13:11<21:36,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=6.03e-5, train/loss_step=0.0131, global_step=1624.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  38%|███▊      | 458/1208 [13:11<21:36,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.036, train/loss_vlb_step=0.000139, train/loss_step=0.036, global_step=1624.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  38%|███▊      | 459/1208 [13:13<21:34,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.036, train/loss_vlb_step=0.000139, train/loss_step=0.036, global_step=1624.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  38%|███▊      | 459/1208 [13:13<21:34,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.57e-5, train/loss_step=0.0209, global_step=1624.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  38%|███▊      | 460/1208 [13:16<21:34,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.57e-5, train/loss_step=0.0209, global_step=1624.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  38%|███▊      | 460/1208 [13:16<21:34,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000121, train/loss_step=0.031, global_step=1624.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  38%|███▊      | 461/1208 [13:17<21:31,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000121, train/loss_step=0.031, global_step=1624.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  38%|███▊      | 461/1208 [13:17<21:31,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000949, train/loss_step=0.236, global_step=1625.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  38%|███▊      | 462/1208 [13:18<21:29,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000949, train/loss_step=0.236, global_step=1625.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  38%|███▊      | 462/1208 [13:18<21:29,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00728, train/loss_vlb_step=3.62e-5, train/loss_step=0.00728, global_step=1625.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  38%|███▊      | 463/1208 [13:19<21:26,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00728, train/loss_vlb_step=3.62e-5, train/loss_step=0.00728, global_step=1625.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  38%|███▊      | 463/1208 [13:19<21:26,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.586, train/loss_vlb_step=0.00828, train/loss_step=0.586, global_step=1625.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  38%|███▊      | 464/1208 [13:22<21:26,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.586, train/loss_vlb_step=0.00828, train/loss_step=0.586, global_step=1625.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  38%|███▊      | 464/1208 [13:22<21:26,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0802, train/loss_vlb_step=0.000269, train/loss_step=0.0802, global_step=1625.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  38%|███▊      | 465/1208 [13:23<21:24,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0802, train/loss_vlb_step=0.000269, train/loss_step=0.0802, global_step=1625.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  38%|███▊      | 465/1208 [13:23<21:24,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.89e-5, train/loss_step=0.0103, global_step=1626.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  39%|███▊      | 466/1208 [13:24<21:21,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.89e-5, train/loss_step=0.0103, global_step=1626.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  39%|███▊      | 466/1208 [13:24<21:21,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00916, train/loss_vlb_step=4.59e-5, train/loss_step=0.00916, global_step=1626.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  39%|███▊      | 467/1208 [13:25<21:18,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00916, train/loss_vlb_step=4.59e-5, train/loss_step=0.00916, global_step=1626.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  39%|███▊      | 467/1208 [13:25<21:18,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00983, train/loss_vlb_step=4.51e-5, train/loss_step=0.00983, global_step=1626.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  39%|███▊      | 468/1208 [13:28<21:19,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00983, train/loss_vlb_step=4.51e-5, train/loss_step=0.00983, global_step=1626.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  39%|███▊      | 468/1208 [13:28<21:19,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000132, train/loss_step=0.0353, global_step=1626.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  39%|███▉      | 469/1208 [13:30<21:16,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000132, train/loss_step=0.0353, global_step=1626.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  39%|███▉      | 469/1208 [13:30<21:16,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0377, train/loss_vlb_step=0.000136, train/loss_step=0.0377, global_step=1627.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  39%|███▉      | 470/1208 [13:31<21:13,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0377, train/loss_vlb_step=0.000136, train/loss_step=0.0377, global_step=1627.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  39%|███▉      | 470/1208 [13:31<21:13,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00148, train/loss_step=0.310, global_step=1627.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  39%|███▉      | 471/1208 [13:32<21:10,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00148, train/loss_step=0.310, global_step=1627.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  39%|███▉      | 471/1208 [13:32<21:10,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.58e-5, train/loss_step=0.0125, global_step=1627.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  39%|███▉      | 472/1208 [13:35<21:11,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.58e-5, train/loss_step=0.0125, global_step=1627.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  39%|███▉      | 472/1208 [13:35<21:11,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.13e-5, train/loss_step=0.015, global_step=1627.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  39%|███▉      | 473/1208 [13:36<21:08,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.13e-5, train/loss_step=0.015, global_step=1627.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  39%|███▉      | 473/1208 [13:36<21:08,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=1628.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  39%|███▉      | 474/1208 [13:37<21:05,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=1628.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  39%|███▉      | 474/1208 [13:37<21:05,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00387, train/loss_step=0.394, global_step=1628.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  39%|███▉      | 475/1208 [13:38<21:03,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00387, train/loss_step=0.394, global_step=1628.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  39%|███▉      | 475/1208 [13:38<21:03,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.7e-5, train/loss_step=0.00305, global_step=1628.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  39%|███▉      | 476/1208 [13:41<21:03,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.7e-5, train/loss_step=0.00305, global_step=1628.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  39%|███▉      | 476/1208 [13:41<21:03,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00294, train/loss_step=0.423, global_step=1628.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  39%|███▉      | 477/1208 [13:42<21:00,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00294, train/loss_step=0.423, global_step=1628.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  39%|███▉      | 477/1208 [13:42<21:00,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0371, train/loss_vlb_step=0.000138, train/loss_step=0.0371, global_step=1629.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  40%|███▉      | 478/1208 [13:43<20:58,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0371, train/loss_vlb_step=0.000138, train/loss_step=0.0371, global_step=1629.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  40%|███▉      | 478/1208 [13:43<20:58,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000107, train/loss_step=0.0293, global_step=1629.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  40%|███▉      | 479/1208 [13:44<20:55,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000107, train/loss_step=0.0293, global_step=1629.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  40%|███▉      | 479/1208 [13:44<20:55,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000416, train/loss_step=0.127, global_step=1629.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  40%|███▉      | 480/1208 [13:48<20:55,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000416, train/loss_step=0.127, global_step=1629.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  40%|███▉      | 480/1208 [13:48<20:55,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.00091, train/loss_step=0.222, global_step=1629.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  40%|███▉      | 481/1208 [13:49<20:53,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.00091, train/loss_step=0.222, global_step=1629.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  40%|███▉      | 481/1208 [13:49<20:53,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000125, train/loss_step=0.0329, global_step=1630.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  40%|███▉      | 482/1208 [13:50<20:50,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000125, train/loss_step=0.0329, global_step=1630.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  40%|███▉      | 482/1208 [13:50<20:50,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.56e-5, train/loss_step=0.00284, global_step=1630.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  40%|███▉      | 483/1208 [13:51<20:47,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.56e-5, train/loss_step=0.00284, global_step=1630.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  40%|███▉      | 483/1208 [13:51<20:47,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000749, train/loss_step=0.204, global_step=1630.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  40%|████      | 484/1208 [13:54<20:48,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000749, train/loss_step=0.204, global_step=1630.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  40%|████      | 484/1208 [13:54<20:48,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000586, train/loss_step=0.169, global_step=1630.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  40%|████      | 485/1208 [13:55<20:45,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000586, train/loss_step=0.169, global_step=1630.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  40%|████      | 485/1208 [13:55<20:45,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000891, train/loss_step=0.220, global_step=1631.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  40%|████      | 486/1208 [13:56<20:42,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000891, train/loss_step=0.220, global_step=1631.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  40%|████      | 486/1208 [13:56<20:42,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000636, train/loss_step=0.179, global_step=1631.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  40%|████      | 487/1208 [13:57<20:40,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000636, train/loss_step=0.179, global_step=1631.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  40%|████      | 487/1208 [13:57<20:40,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000478, train/loss_step=0.143, global_step=1631.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  40%|████      | 488/1208 [14:00<20:40,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000478, train/loss_step=0.143, global_step=1631.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  40%|████      | 488/1208 [14:00<20:40,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000111, train/loss_step=0.0279, global_step=1631.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  40%|████      | 489/1208 [14:02<20:38,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000111, train/loss_step=0.0279, global_step=1631.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  40%|████      | 489/1208 [14:02<20:38,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000992, train/loss_step=0.237, global_step=1632.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  41%|████      | 490/1208 [14:03<20:35,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000992, train/loss_step=0.237, global_step=1632.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  41%|████      | 490/1208 [14:03<20:35,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=1632.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  41%|████      | 491/1208 [14:04<20:32,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=1632.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  41%|████      | 491/1208 [14:04<20:32,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.068, train/loss_vlb_step=0.000231, train/loss_step=0.068, global_step=1632.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  41%|████      | 492/1208 [14:07<20:33,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.068, train/loss_vlb_step=0.000231, train/loss_step=0.068, global_step=1632.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  41%|████      | 492/1208 [14:07<20:33,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0923, train/loss_vlb_step=0.000306, train/loss_step=0.0923, global_step=1632.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  41%|████      | 493/1208 [14:08<20:30,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0923, train/loss_vlb_step=0.000306, train/loss_step=0.0923, global_step=1632.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  41%|████      | 493/1208 [14:08<20:30,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00267, train/loss_step=0.375, global_step=1633.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  41%|████      | 494/1208 [14:09<20:27,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00267, train/loss_step=0.375, global_step=1633.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  41%|████      | 494/1208 [14:09<20:27,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.8e-5, train/loss_step=0.0103, global_step=1633.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  41%|████      | 495/1208 [14:10<20:25,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.8e-5, train/loss_step=0.0103, global_step=1633.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  41%|████      | 495/1208 [14:10<20:25,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000582, train/loss_step=0.173, global_step=1633.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  41%|████      | 496/1208 [14:13<20:25,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000582, train/loss_step=0.173, global_step=1633.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  41%|████      | 496/1208 [14:13<20:25,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=5.01e-5, train/loss_step=0.0105, global_step=1633.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  41%|████      | 497/1208 [14:14<20:22,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=5.01e-5, train/loss_step=0.0105, global_step=1633.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  41%|████      | 497/1208 [14:14<20:22,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=1634.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  41%|████      | 498/1208 [14:15<20:20,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=1634.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  41%|████      | 498/1208 [14:15<20:20,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.74e-5, train/loss_step=0.0239, global_step=1634.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  41%|████▏     | 499/1208 [14:16<20:17,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.74e-5, train/loss_step=0.0239, global_step=1634.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  41%|████▏     | 499/1208 [14:16<20:17,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.73e-5, train/loss_step=0.0237, global_step=1634.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  41%|████▏     | 500/1208 [14:20<20:17,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.73e-5, train/loss_step=0.0237, global_step=1634.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  41%|████▏     | 500/1208 [14:20<20:17,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=1.18e-5, train/loss_step=0.00196, global_step=1634.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  41%|████▏     | 501/1208 [14:21<20:15,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=1.18e-5, train/loss_step=0.00196, global_step=1634.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  41%|████▏     | 501/1208 [14:21<20:15,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00967, train/loss_vlb_step=4.69e-5, train/loss_step=0.00967, global_step=1635.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  42%|████▏     | 502/1208 [14:22<20:12,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00967, train/loss_vlb_step=4.69e-5, train/loss_step=0.00967, global_step=1635.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  42%|████▏     | 502/1208 [14:22<20:12,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00141, train/loss_step=0.276, global_step=1635.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  42%|████▏     | 503/1208 [14:23<20:09,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00141, train/loss_step=0.276, global_step=1635.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  42%|████▏     | 503/1208 [14:23<20:09,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00507, train/loss_vlb_step=2.61e-5, train/loss_step=0.00507, global_step=1635.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  42%|████▏     | 504/1208 [14:26<20:10,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00507, train/loss_vlb_step=2.61e-5, train/loss_step=0.00507, global_step=1635.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  42%|████▏     | 504/1208 [14:26<20:10,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000445, train/loss_step=0.136, global_step=1635.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  42%|████▏     | 505/1208 [14:27<20:07,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000445, train/loss_step=0.136, global_step=1635.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  42%|████▏     | 505/1208 [14:27<20:07,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.21e-5, train/loss_step=0.00207, global_step=1636.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  42%|████▏     | 506/1208 [14:28<20:05,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.21e-5, train/loss_step=0.00207, global_step=1636.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  42%|████▏     | 506/1208 [14:28<20:05,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00144, train/loss_step=0.311, global_step=1636.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  42%|████▏     | 507/1208 [14:29<20:02,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00144, train/loss_step=0.311, global_step=1636.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  42%|████▏     | 507/1208 [14:29<20:02,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.000124, train/loss_step=0.032, global_step=1636.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  42%|████▏     | 508/1208 [14:32<20:02,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.000124, train/loss_step=0.032, global_step=1636.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  42%|████▏     | 508/1208 [14:32<20:02,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00501, train/loss_vlb_step=2.65e-5, train/loss_step=0.00501, global_step=1636.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  42%|████▏     | 509/1208 [14:34<20:00,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00501, train/loss_vlb_step=2.65e-5, train/loss_step=0.00501, global_step=1636.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  42%|████▏     | 509/1208 [14:34<20:00,  1.72s/it, loss=0.091, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.96e-5, train/loss_step=0.0201, global_step=1637.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  42%|████▏     | 510/1208 [14:35<19:57,  1.72s/it, loss=0.091, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.96e-5, train/loss_step=0.0201, global_step=1637.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  42%|████▏     | 510/1208 [14:35<19:57,  1.72s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00106, train/loss_step=0.266, global_step=1637.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  42%|████▏     | 511/1208 [14:36<19:55,  1.71s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00106, train/loss_step=0.266, global_step=1637.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  42%|████▏     | 511/1208 [14:36<19:55,  1.71s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.00455, train/loss_vlb_step=2.43e-5, train/loss_step=0.00455, global_step=1637.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  42%|████▏     | 512/1208 [14:39<19:55,  1.72s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.00455, train/loss_vlb_step=2.43e-5, train/loss_step=0.00455, global_step=1637.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  42%|████▏     | 512/1208 [14:39<19:55,  1.72s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=1.76e-5, train/loss_step=0.00308, global_step=1637.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  42%|████▏     | 513/1208 [14:40<19:52,  1.72s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=1.76e-5, train/loss_step=0.00308, global_step=1637.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  42%|████▏     | 513/1208 [14:40<19:52,  1.72s/it, loss=0.072, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=2.5e-5, train/loss_step=0.00471, global_step=1638.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  43%|████▎     | 514/1208 [14:41<19:50,  1.71s/it, loss=0.072, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=2.5e-5, train/loss_step=0.00471, global_step=1638.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  43%|████▎     | 514/1208 [14:41<19:50,  1.71s/it, loss=0.0788, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000493, train/loss_step=0.147, global_step=1638.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  43%|████▎     | 515/1208 [14:42<19:47,  1.71s/it, loss=0.0788, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000493, train/loss_step=0.147, global_step=1638.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  43%|████▎     | 515/1208 [14:42<19:47,  1.71s/it, loss=0.071, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.59e-5, train/loss_step=0.0169, global_step=1638.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  43%|████▎     | 516/1208 [14:45<19:47,  1.72s/it, loss=0.071, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.59e-5, train/loss_step=0.0169, global_step=1638.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  43%|████▎     | 516/1208 [14:45<19:47,  1.72s/it, loss=0.0781, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000504, train/loss_step=0.153, global_step=1638.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  43%|████▎     | 517/1208 [14:46<19:45,  1.72s/it, loss=0.0781, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000504, train/loss_step=0.153, global_step=1638.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  43%|████▎     | 517/1208 [14:46<19:45,  1.72s/it, loss=0.0752, v_num=0, train/loss_simple_step=0.0629, train/loss_vlb_step=0.000213, train/loss_step=0.0629, global_step=1639.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  43%|████▎     | 518/1208 [14:47<19:42,  1.71s/it, loss=0.0752, v_num=0, train/loss_simple_step=0.0629, train/loss_vlb_step=0.000213, train/loss_step=0.0629, global_step=1639.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  43%|████▎     | 518/1208 [14:47<19:42,  1.71s/it, loss=0.0748, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.45e-5, train/loss_step=0.0148, global_step=1639.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  43%|████▎     | 519/1208 [14:48<19:40,  1.71s/it, loss=0.0748, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.45e-5, train/loss_step=0.0148, global_step=1639.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  43%|████▎     | 519/1208 [14:48<19:40,  1.71s/it, loss=0.0792, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.00037, train/loss_step=0.112, global_step=1639.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  43%|████▎     | 520/1208 [14:52<19:40,  1.72s/it, loss=0.0792, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.00037, train/loss_step=0.112, global_step=1639.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  43%|████▎     | 520/1208 [14:52<19:40,  1.72s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000397, train/loss_step=0.121, global_step=1639.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  43%|████▎     | 521/1208 [14:53<19:37,  1.71s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000397, train/loss_step=0.121, global_step=1639.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  43%|████▎     | 521/1208 [14:53<19:37,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.469, train/loss_vlb_step=0.00565, train/loss_step=0.469, global_step=1640.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  43%|████▎     | 522/1208 [14:54<19:35,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.469, train/loss_vlb_step=0.00565, train/loss_step=0.469, global_step=1640.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  43%|████▎     | 522/1208 [14:54<19:35,  1.71s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.0589, train/loss_vlb_step=0.000209, train/loss_step=0.0589, global_step=1640.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  43%|████▎     | 523/1208 [14:55<19:32,  1.71s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.0589, train/loss_vlb_step=0.000209, train/loss_step=0.0589, global_step=1640.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  43%|████▎     | 523/1208 [14:55<19:32,  1.71s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.55e-5, train/loss_step=0.0175, global_step=1640.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  43%|████▎     | 524/1208 [14:58<19:32,  1.71s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.55e-5, train/loss_step=0.0175, global_step=1640.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  43%|████▎     | 524/1208 [14:58<19:32,  1.71s/it, loss=0.0911, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=9.05e-6, train/loss_step=0.0015, global_step=1640.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  43%|████▎     | 525/1208 [14:59<19:30,  1.71s/it, loss=0.0911, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=9.05e-6, train/loss_step=0.0015, global_step=1640.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  43%|████▎     | 525/1208 [14:59<19:30,  1.71s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.00674, train/loss_vlb_step=3.45e-5, train/loss_step=0.00674, global_step=1641.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  44%|████▎     | 526/1208 [15:00<19:27,  1.71s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.00674, train/loss_vlb_step=3.45e-5, train/loss_step=0.00674, global_step=1641.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  44%|████▎     | 526/1208 [15:00<19:27,  1.71s/it, loss=0.0763, v_num=0, train/loss_simple_step=0.00978, train/loss_vlb_step=4.8e-5, train/loss_step=0.00978, global_step=1641.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  44%|████▎     | 527/1208 [15:01<19:25,  1.71s/it, loss=0.0763, v_num=0, train/loss_simple_step=0.00978, train/loss_vlb_step=4.8e-5, train/loss_step=0.00978, global_step=1641.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  44%|████▎     | 527/1208 [15:01<19:25,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.633, train/loss_vlb_step=0.0222, train/loss_step=0.633, global_step=1641.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]     Epoch 5:  44%|████▎     | 528/1208 [15:04<19:25,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.633, train/loss_vlb_step=0.0222, train/loss_step=0.633, global_step=1641.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  44%|████▎     | 528/1208 [15:04<19:25,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00151, train/loss_step=0.308, global_step=1641.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  44%|████▍     | 529/1208 [15:05<19:22,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00151, train/loss_step=0.308, global_step=1641.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  44%|████▍     | 529/1208 [15:05<19:22,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000415, train/loss_step=0.126, global_step=1642.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  44%|████▍     | 530/1208 [15:06<19:20,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000415, train/loss_step=0.126, global_step=1642.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  44%|████▍     | 530/1208 [15:06<19:20,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000467, train/loss_step=0.141, global_step=1642.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  44%|████▍     | 531/1208 [15:08<19:17,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000467, train/loss_step=0.141, global_step=1642.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  44%|████▍     | 531/1208 [15:08<19:17,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00116, train/loss_step=0.273, global_step=1642.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  44%|████▍     | 532/1208 [15:11<19:17,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00116, train/loss_step=0.273, global_step=1642.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  44%|████▍     | 532/1208 [15:11<19:17,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000131, train/loss_step=0.0348, global_step=1642.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  44%|████▍     | 533/1208 [15:12<19:15,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000131, train/loss_step=0.0348, global_step=1642.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  44%|████▍     | 533/1208 [15:12<19:15,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000182, train/loss_step=0.0525, global_step=1643.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  44%|████▍     | 534/1208 [15:13<19:12,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000182, train/loss_step=0.0525, global_step=1643.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  44%|████▍     | 534/1208 [15:13<19:12,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00598, train/loss_vlb_step=3.04e-5, train/loss_step=0.00598, global_step=1643.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  44%|████▍     | 535/1208 [15:14<19:10,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00598, train/loss_vlb_step=3.04e-5, train/loss_step=0.00598, global_step=1643.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  44%|████▍     | 535/1208 [15:14<19:10,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.502, train/loss_vlb_step=0.0071, train/loss_step=0.502, global_step=1643.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]     Epoch 5:  44%|████▍     | 536/1208 [15:17<19:10,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.502, train/loss_vlb_step=0.0071, train/loss_step=0.502, global_step=1643.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  44%|████▍     | 536/1208 [15:17<19:10,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00126, train/loss_step=0.285, global_step=1643.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  44%|████▍     | 537/1208 [15:18<19:07,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00126, train/loss_step=0.285, global_step=1643.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  44%|████▍     | 537/1208 [15:18<19:07,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00198, train/loss_step=0.383, global_step=1644.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  45%|████▍     | 538/1208 [15:19<19:05,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00198, train/loss_step=0.383, global_step=1644.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  45%|████▍     | 538/1208 [15:19<19:05,  1.71s/it, loss=0.196, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00279, train/loss_step=0.388, global_step=1644.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  45%|████▍     | 539/1208 [15:20<19:02,  1.71s/it, loss=0.196, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00279, train/loss_step=0.388, global_step=1644.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  45%|████▍     | 539/1208 [15:20<19:02,  1.71s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.42e-5, train/loss_step=0.0119, global_step=1644.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  45%|████▍     | 540/1208 [15:23<19:02,  1.71s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.42e-5, train/loss_step=0.0119, global_step=1644.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  45%|████▍     | 540/1208 [15:23<19:02,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.06e-5, train/loss_step=0.0108, global_step=1644.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  45%|████▍     | 541/1208 [15:25<19:00,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.06e-5, train/loss_step=0.0108, global_step=1644.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  45%|████▍     | 541/1208 [15:25<19:00,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000485, train/loss_step=0.147, global_step=1645.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  45%|████▍     | 542/1208 [15:26<18:57,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000485, train/loss_step=0.147, global_step=1645.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  45%|████▍     | 542/1208 [15:26<18:57,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.0012, train/loss_step=0.262, global_step=1645.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  45%|████▍     | 543/1208 [15:27<18:55,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.0012, train/loss_step=0.262, global_step=1645.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  45%|████▍     | 543/1208 [15:27<18:55,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.00041, train/loss_step=0.124, global_step=1645.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  45%|████▌     | 544/1208 [15:30<18:55,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.00041, train/loss_step=0.124, global_step=1645.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  45%|████▌     | 544/1208 [15:30<18:55,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.046, train/loss_vlb_step=0.000171, train/loss_step=0.046, global_step=1645.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  45%|████▌     | 545/1208 [15:31<18:53,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.046, train/loss_vlb_step=0.000171, train/loss_step=0.046, global_step=1645.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  45%|████▌     | 545/1208 [15:31<18:53,  1.71s/it, loss=0.197, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000736, train/loss_step=0.202, global_step=1646.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  45%|████▌     | 546/1208 [15:32<18:50,  1.71s/it, loss=0.197, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000736, train/loss_step=0.202, global_step=1646.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  45%|████▌     | 546/1208 [15:32<18:50,  1.71s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0742, train/loss_vlb_step=0.000258, train/loss_step=0.0742, global_step=1646.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  45%|████▌     | 547/1208 [15:33<18:48,  1.71s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0742, train/loss_vlb_step=0.000258, train/loss_step=0.0742, global_step=1646.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  45%|████▌     | 547/1208 [15:33<18:48,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0805, train/loss_vlb_step=0.000278, train/loss_step=0.0805, global_step=1646.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  45%|████▌     | 548/1208 [15:36<18:48,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0805, train/loss_vlb_step=0.000278, train/loss_step=0.0805, global_step=1646.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  45%|████▌     | 548/1208 [15:36<18:48,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00226, train/loss_step=0.396, global_step=1646.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  45%|████▌     | 549/1208 [15:37<18:45,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00226, train/loss_step=0.396, global_step=1646.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  45%|████▌     | 549/1208 [15:37<18:45,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00169, train/loss_step=0.309, global_step=1647.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  46%|████▌     | 550/1208 [15:38<18:43,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00169, train/loss_step=0.309, global_step=1647.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  46%|████▌     | 550/1208 [15:38<18:43,  1.71s/it, loss=0.2, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.00357, train/loss_step=0.417, global_step=1647.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  46%|████▌     | 551/1208 [15:39<18:40,  1.71s/it, loss=0.2, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.00357, train/loss_step=0.417, global_step=1647.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  46%|████▌     | 551/1208 [15:39<18:40,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.000133, train/loss_step=0.0351, global_step=1647.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  46%|████▌     | 552/1208 [15:43<18:40,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.000133, train/loss_step=0.0351, global_step=1647.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  46%|████▌     | 552/1208 [15:43<18:40,  1.71s/it, loss=0.208, v_num=0, train/loss_simple_step=0.429, train/loss_vlb_step=0.0041, train/loss_step=0.429, global_step=1647.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  46%|████▌     | 553/1208 [15:44<18:38,  1.71s/it, loss=0.208, v_num=0, train/loss_simple_step=0.429, train/loss_vlb_step=0.0041, train/loss_step=0.429, global_step=1647.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  46%|████▌     | 553/1208 [15:44<18:38,  1.71s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.51e-5, train/loss_step=0.0144, global_step=1648.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  46%|████▌     | 554/1208 [15:45<18:35,  1.71s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.51e-5, train/loss_step=0.0144, global_step=1648.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  46%|████▌     | 554/1208 [15:45<18:35,  1.71s/it, loss=0.223, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00219, train/loss_step=0.335, global_step=1648.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  46%|████▌     | 555/1208 [15:46<18:33,  1.71s/it, loss=0.223, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00219, train/loss_step=0.335, global_step=1648.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  46%|████▌     | 555/1208 [15:46<18:33,  1.71s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.000138, train/loss_step=0.0379, global_step=1648.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  46%|████▌     | 556/1208 [15:49<18:33,  1.71s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.000138, train/loss_step=0.0379, global_step=1648.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  46%|████▌     | 556/1208 [15:49<18:33,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00935, train/loss_vlb_step=4.27e-5, train/loss_step=0.00935, global_step=1648.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  46%|████▌     | 557/1208 [15:50<18:31,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00935, train/loss_vlb_step=4.27e-5, train/loss_step=0.00935, global_step=1648.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  46%|████▌     | 557/1208 [15:50<18:31,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.047, train/loss_vlb_step=0.000171, train/loss_step=0.047, global_step=1649.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  46%|████▌     | 558/1208 [15:51<18:28,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.047, train/loss_vlb_step=0.000171, train/loss_step=0.047, global_step=1649.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  46%|████▌     | 558/1208 [15:51<18:28,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00218, train/loss_step=0.341, global_step=1649.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  46%|████▋     | 559/1208 [15:52<18:26,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00218, train/loss_step=0.341, global_step=1649.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  46%|████▋     | 559/1208 [15:52<18:26,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.34e-5, train/loss_step=0.00222, global_step=1649.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  46%|████▋     | 560/1208 [15:55<18:26,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.34e-5, train/loss_step=0.00222, global_step=1649.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  46%|████▋     | 560/1208 [15:55<18:26,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00172, train/loss_step=0.329, global_step=1649.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  46%|████▋     | 561/1208 [15:56<18:23,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00172, train/loss_step=0.329, global_step=1649.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  46%|████▋     | 561/1208 [15:56<18:23,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00215, train/loss_step=0.350, global_step=1650.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  47%|████▋     | 562/1208 [15:58<18:21,  1.70s/it, loss=0.192, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00215, train/loss_step=0.350, global_step=1650.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  47%|████▋     | 562/1208 [15:58<18:21,  1.70s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=9.01e-5, train/loss_step=0.0222, global_step=1650.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  47%|████▋     | 563/1208 [15:59<18:18,  1.70s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=9.01e-5, train/loss_step=0.0222, global_step=1650.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  47%|████▋     | 563/1208 [15:59<18:18,  1.70s/it, loss=0.197, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00619, train/loss_step=0.457, global_step=1650.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  47%|████▋     | 564/1208 [16:02<18:18,  1.71s/it, loss=0.197, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00619, train/loss_step=0.457, global_step=1650.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  47%|████▋     | 564/1208 [16:02<18:18,  1.71s/it, loss=0.209, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00132, train/loss_step=0.286, global_step=1650.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  47%|████▋     | 565/1208 [16:03<18:16,  1.71s/it, loss=0.209, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00132, train/loss_step=0.286, global_step=1650.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  47%|████▋     | 565/1208 [16:03<18:16,  1.71s/it, loss=0.217, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00239, train/loss_step=0.368, global_step=1651.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  47%|████▋     | 566/1208 [16:04<18:13,  1.70s/it, loss=0.217, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00239, train/loss_step=0.368, global_step=1651.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  47%|████▋     | 566/1208 [16:04<18:13,  1.70s/it, loss=0.213, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=1.1e-5, train/loss_step=0.00181, global_step=1651.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  47%|████▋     | 567/1208 [16:05<18:11,  1.70s/it, loss=0.213, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=1.1e-5, train/loss_step=0.00181, global_step=1651.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  47%|████▋     | 567/1208 [16:05<18:11,  1.70s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.87e-5, train/loss_step=0.0156, global_step=1651.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  47%|████▋     | 568/1208 [16:08<18:11,  1.71s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.87e-5, train/loss_step=0.0156, global_step=1651.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  47%|████▋     | 568/1208 [16:08<18:11,  1.71s/it, loss=0.191, v_num=0, train/loss_simple_step=0.006, train/loss_vlb_step=3.16e-5, train/loss_step=0.006, global_step=1651.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  47%|████▋     | 569/1208 [16:09<18:09,  1.70s/it, loss=0.191, v_num=0, train/loss_simple_step=0.006, train/loss_vlb_step=3.16e-5, train/loss_step=0.006, global_step=1651.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  47%|████▋     | 569/1208 [16:09<18:09,  1.70s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0848, train/loss_vlb_step=0.000279, train/loss_step=0.0848, global_step=1652.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  47%|████▋     | 570/1208 [16:10<18:06,  1.70s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0848, train/loss_vlb_step=0.000279, train/loss_step=0.0848, global_step=1652.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  47%|████▋     | 570/1208 [16:10<18:06,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.65e-5, train/loss_step=0.0208, global_step=1652.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  47%|████▋     | 571/1208 [16:11<18:04,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.65e-5, train/loss_step=0.0208, global_step=1652.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  47%|████▋     | 571/1208 [16:11<18:04,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.548, train/loss_vlb_step=0.0083, train/loss_step=0.548, global_step=1652.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  47%|████▋     | 572/1208 [16:15<18:04,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.548, train/loss_vlb_step=0.0083, train/loss_step=0.548, global_step=1652.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  47%|████▋     | 572/1208 [16:15<18:04,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.47e-5, train/loss_step=0.0241, global_step=1652.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  47%|████▋     | 573/1208 [16:16<18:01,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.47e-5, train/loss_step=0.0241, global_step=1652.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  47%|████▋     | 573/1208 [16:16<18:01,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.0013, train/loss_step=0.269, global_step=1653.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  48%|████▊     | 574/1208 [16:17<17:59,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.0013, train/loss_step=0.269, global_step=1653.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  48%|████▊     | 574/1208 [16:17<17:59,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000729, train/loss_step=0.203, global_step=1653.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  48%|████▊     | 575/1208 [16:18<17:56,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000729, train/loss_step=0.203, global_step=1653.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  48%|████▊     | 575/1208 [16:18<17:56,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000104, train/loss_step=0.0263, global_step=1653.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  48%|████▊     | 576/1208 [16:21<17:56,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000104, train/loss_step=0.0263, global_step=1653.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  48%|████▊     | 576/1208 [16:21<17:56,  1.70s/it, loss=0.198, v_num=0, train/loss_simple_step=0.547, train/loss_vlb_step=0.00538, train/loss_step=0.547, global_step=1653.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  48%|████▊     | 577/1208 [16:22<17:54,  1.70s/it, loss=0.198, v_num=0, train/loss_simple_step=0.547, train/loss_vlb_step=0.00538, train/loss_step=0.547, global_step=1653.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  48%|████▊     | 577/1208 [16:22<17:54,  1.70s/it, loss=0.197, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.000149, train/loss_step=0.041, global_step=1654.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  48%|████▊     | 578/1208 [16:23<17:52,  1.70s/it, loss=0.197, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.000149, train/loss_step=0.041, global_step=1654.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  48%|████▊     | 578/1208 [16:23<17:52,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.093, train/loss_vlb_step=0.000309, train/loss_step=0.093, global_step=1654.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  48%|████▊     | 579/1208 [16:24<17:49,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.093, train/loss_vlb_step=0.000309, train/loss_step=0.093, global_step=1654.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  48%|████▊     | 579/1208 [16:24<17:49,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00652, train/loss_vlb_step=3.33e-5, train/loss_step=0.00652, global_step=1654.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  48%|████▊     | 580/1208 [16:27<17:49,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00652, train/loss_vlb_step=3.33e-5, train/loss_step=0.00652, global_step=1654.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  48%|████▊     | 580/1208 [16:27<17:49,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000579, train/loss_step=0.160, global_step=1654.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  48%|████▊     | 581/1208 [16:28<17:47,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000579, train/loss_step=0.160, global_step=1654.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  48%|████▊     | 581/1208 [16:28<17:47,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=1655.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  48%|████▊     | 582/1208 [16:29<17:44,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=1655.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  48%|████▊     | 582/1208 [16:29<17:44,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0768, train/loss_vlb_step=0.000262, train/loss_step=0.0768, global_step=1655.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  48%|████▊     | 583/1208 [16:30<17:42,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0768, train/loss_vlb_step=0.000262, train/loss_step=0.0768, global_step=1655.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  48%|████▊     | 583/1208 [16:30<17:42,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=2.02e-5, train/loss_step=0.00366, global_step=1655.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  48%|████▊     | 584/1208 [16:34<17:42,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=2.02e-5, train/loss_step=0.00366, global_step=1655.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  48%|████▊     | 584/1208 [16:34<17:42,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00858, train/loss_vlb_step=4.15e-5, train/loss_step=0.00858, global_step=1655.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  48%|████▊     | 585/1208 [16:35<17:39,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00858, train/loss_vlb_step=4.15e-5, train/loss_step=0.00858, global_step=1655.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  48%|████▊     | 585/1208 [16:35<17:39,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000508, train/loss_step=0.152, global_step=1656.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  49%|████▊     | 586/1208 [16:36<17:37,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000508, train/loss_step=0.152, global_step=1656.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  49%|████▊     | 586/1208 [16:36<17:37,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00133, train/loss_step=0.299, global_step=1656.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  49%|████▊     | 587/1208 [16:37<17:35,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00133, train/loss_step=0.299, global_step=1656.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  49%|████▊     | 587/1208 [16:37<17:35,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000915, train/loss_step=0.233, global_step=1656.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  49%|████▊     | 588/1208 [16:40<17:34,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000915, train/loss_step=0.233, global_step=1656.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  49%|████▊     | 588/1208 [16:40<17:34,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000462, train/loss_step=0.140, global_step=1656.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  49%|████▉     | 589/1208 [16:41<17:32,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000462, train/loss_step=0.140, global_step=1656.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  49%|████▉     | 589/1208 [16:41<17:32,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00785, train/loss_vlb_step=4.02e-5, train/loss_step=0.00785, global_step=1657.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  49%|████▉     | 590/1208 [16:42<17:30,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00785, train/loss_vlb_step=4.02e-5, train/loss_step=0.00785, global_step=1657.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  49%|████▉     | 590/1208 [16:42<17:30,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00665, train/loss_vlb_step=3.33e-5, train/loss_step=0.00665, global_step=1657.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  49%|████▉     | 591/1208 [16:43<17:27,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00665, train/loss_vlb_step=3.33e-5, train/loss_step=0.00665, global_step=1657.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  49%|████▉     | 591/1208 [16:43<17:27,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000418, train/loss_step=0.127, global_step=1657.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  49%|████▉     | 592/1208 [16:46<17:27,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000418, train/loss_step=0.127, global_step=1657.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  49%|████▉     | 592/1208 [16:46<17:27,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000586, train/loss_step=0.166, global_step=1657.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  49%|████▉     | 593/1208 [16:47<17:25,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000586, train/loss_step=0.166, global_step=1657.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  49%|████▉     | 593/1208 [16:47<17:25,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0436, train/loss_vlb_step=0.00016, train/loss_step=0.0436, global_step=1658.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  49%|████▉     | 594/1208 [16:48<17:22,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0436, train/loss_vlb_step=0.00016, train/loss_step=0.0436, global_step=1658.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  49%|████▉     | 594/1208 [16:48<17:22,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000113, train/loss_step=0.0293, global_step=1658.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  49%|████▉     | 595/1208 [16:50<17:20,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000113, train/loss_step=0.0293, global_step=1658.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  49%|████▉     | 595/1208 [16:50<17:20,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000108, train/loss_step=0.0267, global_step=1658.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  49%|████▉     | 596/1208 [16:53<17:20,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000108, train/loss_step=0.0267, global_step=1658.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  49%|████▉     | 596/1208 [16:53<17:20,  1.70s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00105, train/loss_step=0.256, global_step=1658.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  49%|████▉     | 597/1208 [16:54<17:18,  1.70s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00105, train/loss_step=0.256, global_step=1658.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  49%|████▉     | 597/1208 [16:54<17:18,  1.70s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0859, train/loss_vlb_step=0.000287, train/loss_step=0.0859, global_step=1659.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  50%|████▉     | 598/1208 [16:55<17:15,  1.70s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0859, train/loss_vlb_step=0.000287, train/loss_step=0.0859, global_step=1659.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  50%|████▉     | 598/1208 [16:55<17:15,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000783, train/loss_step=0.220, global_step=1659.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  50%|████▉     | 599/1208 [16:56<17:13,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000783, train/loss_step=0.220, global_step=1659.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  50%|████▉     | 599/1208 [16:56<17:13,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.75e-5, train/loss_step=0.0209, global_step=1659.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  50%|████▉     | 600/1208 [16:59<17:13,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.75e-5, train/loss_step=0.0209, global_step=1659.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  50%|████▉     | 600/1208 [16:59<17:13,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00124, train/loss_step=0.247, global_step=1659.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.76it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.76it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.80it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.76it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.76it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.74it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.75it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.75it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.74it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.75it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.78it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.82it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 5:  50%|████▉     | 601/1208 [17:30<17:40,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00124, train/loss_step=0.247, global_step=1659.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  50%|████▉     | 601/1208 [17:30<17:40,  1.75s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000141, train/loss_step=0.0402, global_step=1660.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  50%|████▉     | 602/1208 [17:31<17:38,  1.75s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000141, train/loss_step=0.0402, global_step=1660.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  50%|████▉     | 602/1208 [17:31<17:38,  1.75s/it, loss=0.106, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.21e-5, train/loss_step=0.014, global_step=1660.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  50%|████▉     | 603/1208 [17:32<17:35,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.21e-5, train/loss_step=0.014, global_step=1660.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  50%|████▉     | 603/1208 [17:32<17:35,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000388, train/loss_step=0.118, global_step=1660.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  50%|█████     | 604/1208 [17:35<17:35,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000388, train/loss_step=0.118, global_step=1660.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  50%|█████     | 604/1208 [17:35<17:35,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0743, train/loss_vlb_step=0.000246, train/loss_step=0.0743, global_step=1660.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  50%|█████     | 605/1208 [17:36<17:32,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0743, train/loss_vlb_step=0.000246, train/loss_step=0.0743, global_step=1660.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  50%|█████     | 605/1208 [17:36<17:32,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000194, train/loss_step=0.0555, global_step=1661.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  50%|█████     | 606/1208 [17:37<17:30,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000194, train/loss_step=0.0555, global_step=1661.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  50%|█████     | 606/1208 [17:37<17:30,  1.74s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.00439, train/loss_vlb_step=2.38e-5, train/loss_step=0.00439, global_step=1661.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  50%|█████     | 607/1208 [17:38<17:27,  1.74s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.00439, train/loss_vlb_step=2.38e-5, train/loss_step=0.00439, global_step=1661.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  50%|█████     | 607/1208 [17:38<17:27,  1.74s/it, loss=0.0853, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.45e-5, train/loss_step=0.0233, global_step=1661.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  50%|█████     | 608/1208 [17:41<17:27,  1.75s/it, loss=0.0853, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.45e-5, train/loss_step=0.0233, global_step=1661.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  50%|█████     | 608/1208 [17:41<17:27,  1.75s/it, loss=0.081, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.000187, train/loss_step=0.0537, global_step=1661.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  50%|█████     | 609/1208 [17:42<17:25,  1.75s/it, loss=0.081, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.000187, train/loss_step=0.0537, global_step=1661.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  50%|█████     | 609/1208 [17:42<17:25,  1.75s/it, loss=0.0886, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.00054, train/loss_step=0.160, global_step=1662.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  50%|█████     | 610/1208 [17:43<17:22,  1.74s/it, loss=0.0886, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.00054, train/loss_step=0.160, global_step=1662.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  50%|█████     | 610/1208 [17:43<17:22,  1.74s/it, loss=0.0894, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=9.23e-5, train/loss_step=0.0225, global_step=1662.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  51%|█████     | 611/1208 [17:44<17:20,  1.74s/it, loss=0.0894, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=9.23e-5, train/loss_step=0.0225, global_step=1662.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  51%|█████     | 611/1208 [17:44<17:20,  1.74s/it, loss=0.0839, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.66e-5, train/loss_step=0.0173, global_step=1662.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  51%|█████     | 612/1208 [17:48<17:20,  1.75s/it, loss=0.0839, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.66e-5, train/loss_step=0.0173, global_step=1662.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  51%|█████     | 612/1208 [17:48<17:20,  1.75s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00291, train/loss_step=0.425, global_step=1662.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  51%|█████     | 613/1208 [17:49<17:17,  1.74s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00291, train/loss_step=0.425, global_step=1662.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  51%|█████     | 613/1208 [17:49<17:17,  1.74s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.00829, train/loss_vlb_step=3.81e-5, train/loss_step=0.00829, global_step=1663.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  51%|█████     | 614/1208 [17:50<17:15,  1.74s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.00829, train/loss_vlb_step=3.81e-5, train/loss_step=0.00829, global_step=1663.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  51%|█████     | 614/1208 [17:50<17:15,  1.74s/it, loss=0.0938, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.23e-5, train/loss_step=0.00394, global_step=1663.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  51%|█████     | 615/1208 [17:51<17:12,  1.74s/it, loss=0.0938, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.23e-5, train/loss_step=0.00394, global_step=1663.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  51%|█████     | 615/1208 [17:51<17:12,  1.74s/it, loss=0.1, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000509, train/loss_step=0.149, global_step=1663.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]      Epoch 5:  51%|█████     | 616/1208 [17:54<17:12,  1.74s/it, loss=0.1, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000509, train/loss_step=0.149, global_step=1663.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  51%|█████     | 616/1208 [17:54<17:12,  1.74s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000984, train/loss_step=0.246, global_step=1663.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  51%|█████     | 617/1208 [17:55<17:10,  1.74s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000984, train/loss_step=0.246, global_step=1663.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  51%|█████     | 617/1208 [17:55<17:10,  1.74s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.0583, train/loss_vlb_step=0.000209, train/loss_step=0.0583, global_step=1664.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  51%|█████     | 618/1208 [17:56<17:07,  1.74s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.0583, train/loss_vlb_step=0.000209, train/loss_step=0.0583, global_step=1664.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  51%|█████     | 618/1208 [17:56<17:07,  1.74s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000334, train/loss_step=0.101, global_step=1664.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  51%|█████     | 619/1208 [17:57<17:05,  1.74s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000334, train/loss_step=0.101, global_step=1664.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  51%|█████     | 619/1208 [17:57<17:05,  1.74s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000448, train/loss_step=0.131, global_step=1664.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  51%|█████▏    | 620/1208 [18:00<17:04,  1.74s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000448, train/loss_step=0.131, global_step=1664.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  51%|█████▏    | 620/1208 [18:00<17:04,  1.74s/it, loss=0.0918, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000426, train/loss_step=0.129, global_step=1664.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  51%|█████▏    | 621/1208 [18:01<17:02,  1.74s/it, loss=0.0918, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000426, train/loss_step=0.129, global_step=1664.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  51%|█████▏    | 621/1208 [18:01<17:02,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.547, train/loss_vlb_step=0.0079, train/loss_step=0.547, global_step=1665.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  51%|█████▏    | 622/1208 [18:02<17:00,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.547, train/loss_vlb_step=0.0079, train/loss_step=0.547, global_step=1665.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  51%|█████▏    | 622/1208 [18:02<17:00,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000538, train/loss_step=0.163, global_step=1665.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  52%|█████▏    | 623/1208 [18:03<16:57,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000538, train/loss_step=0.163, global_step=1665.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  52%|█████▏    | 623/1208 [18:03<16:57,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=1665.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  52%|█████▏    | 624/1208 [18:07<16:57,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=1665.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  52%|█████▏    | 624/1208 [18:07<16:57,  1.74s/it, loss=0.15, v_num=0, train/loss_simple_step=0.592, train/loss_vlb_step=0.007, train/loss_step=0.592, global_step=1665.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  52%|█████▏    | 625/1208 [18:08<16:55,  1.74s/it, loss=0.15, v_num=0, train/loss_simple_step=0.592, train/loss_vlb_step=0.007, train/loss_step=0.592, global_step=1665.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  52%|█████▏    | 625/1208 [18:08<16:55,  1.74s/it, loss=0.158, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000722, train/loss_step=0.218, global_step=1666.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  52%|█████▏    | 626/1208 [18:09<16:52,  1.74s/it, loss=0.158, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000722, train/loss_step=0.218, global_step=1666.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  52%|█████▏    | 626/1208 [18:09<16:52,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000629, train/loss_step=0.180, global_step=1666.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  52%|█████▏    | 627/1208 [18:10<16:50,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000629, train/loss_step=0.180, global_step=1666.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  52%|█████▏    | 627/1208 [18:10<16:50,  1.74s/it, loss=0.173, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000466, train/loss_step=0.142, global_step=1666.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  52%|█████▏    | 628/1208 [18:13<16:49,  1.74s/it, loss=0.173, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000466, train/loss_step=0.142, global_step=1666.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  52%|█████▏    | 628/1208 [18:13<16:49,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00275, train/loss_vlb_step=1.58e-5, train/loss_step=0.00275, global_step=1666.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  52%|█████▏    | 629/1208 [18:14<16:47,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00275, train/loss_vlb_step=1.58e-5, train/loss_step=0.00275, global_step=1666.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  52%|█████▏    | 629/1208 [18:14<16:47,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=0.000102, train/loss_step=0.0237, global_step=1667.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  52%|█████▏    | 630/1208 [18:15<16:45,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=0.000102, train/loss_step=0.0237, global_step=1667.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  52%|█████▏    | 630/1208 [18:15<16:45,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00602, train/loss_vlb_step=3.07e-5, train/loss_step=0.00602, global_step=1667.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  52%|█████▏    | 631/1208 [18:16<16:42,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00602, train/loss_vlb_step=3.07e-5, train/loss_step=0.00602, global_step=1667.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  52%|█████▏    | 631/1208 [18:16<16:42,  1.74s/it, loss=0.168, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=1667.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  52%|█████▏    | 632/1208 [18:19<16:42,  1.74s/it, loss=0.168, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=1667.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  52%|█████▏    | 632/1208 [18:19<16:42,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0354, train/loss_vlb_step=0.000137, train/loss_step=0.0354, global_step=1667.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  52%|█████▏    | 633/1208 [18:20<16:40,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0354, train/loss_vlb_step=0.000137, train/loss_step=0.0354, global_step=1667.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  52%|█████▏    | 633/1208 [18:20<16:40,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=2.01e-5, train/loss_step=0.00375, global_step=1668.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  52%|█████▏    | 634/1208 [18:21<16:37,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=2.01e-5, train/loss_step=0.00375, global_step=1668.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  52%|█████▏    | 634/1208 [18:21<16:37,  1.74s/it, loss=0.16, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000909, train/loss_step=0.236, global_step=1668.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  53%|█████▎    | 635/1208 [18:23<16:35,  1.74s/it, loss=0.16, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000909, train/loss_step=0.236, global_step=1668.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  53%|█████▎    | 635/1208 [18:23<16:35,  1.74s/it, loss=0.169, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00173, train/loss_step=0.337, global_step=1668.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  53%|█████▎    | 636/1208 [18:26<16:34,  1.74s/it, loss=0.169, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00173, train/loss_step=0.337, global_step=1668.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  53%|█████▎    | 636/1208 [18:26<16:34,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.00043, train/loss_step=0.130, global_step=1668.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  53%|█████▎    | 637/1208 [18:27<16:32,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.00043, train/loss_step=0.130, global_step=1668.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  53%|█████▎    | 637/1208 [18:27<16:32,  1.74s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00336, train/loss_vlb_step=1.9e-5, train/loss_step=0.00336, global_step=1669.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  53%|█████▎    | 638/1208 [18:28<16:30,  1.74s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00336, train/loss_vlb_step=1.9e-5, train/loss_step=0.00336, global_step=1669.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  53%|█████▎    | 638/1208 [18:28<16:30,  1.74s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00422, train/loss_vlb_step=2.33e-5, train/loss_step=0.00422, global_step=1669.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  53%|█████▎    | 639/1208 [18:29<16:27,  1.74s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00422, train/loss_vlb_step=2.33e-5, train/loss_step=0.00422, global_step=1669.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  53%|█████▎    | 639/1208 [18:29<16:27,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00258, train/loss_step=0.412, global_step=1669.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]     Epoch 5:  53%|█████▎    | 640/1208 [18:32<16:27,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00258, train/loss_step=0.412, global_step=1669.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  53%|█████▎    | 640/1208 [18:32<16:27,  1.74s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0972, train/loss_vlb_step=0.00032, train/loss_step=0.0972, global_step=1669.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  53%|█████▎    | 641/1208 [18:33<16:25,  1.74s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0972, train/loss_vlb_step=0.00032, train/loss_step=0.0972, global_step=1669.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  53%|█████▎    | 641/1208 [18:33<16:25,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.08e-5, train/loss_step=0.0115, global_step=1670.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  53%|█████▎    | 642/1208 [18:34<16:22,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.08e-5, train/loss_step=0.0115, global_step=1670.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  53%|█████▎    | 642/1208 [18:34<16:22,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000464, train/loss_step=0.138, global_step=1670.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  53%|█████▎    | 643/1208 [18:35<16:20,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000464, train/loss_step=0.138, global_step=1670.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  53%|█████▎    | 643/1208 [18:35<16:20,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000937, train/loss_step=0.224, global_step=1670.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  53%|█████▎    | 644/1208 [18:39<16:20,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000937, train/loss_step=0.224, global_step=1670.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  53%|█████▎    | 644/1208 [18:39<16:20,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0885, train/loss_vlb_step=0.000292, train/loss_step=0.0885, global_step=1670.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  53%|█████▎    | 645/1208 [18:40<16:17,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0885, train/loss_vlb_step=0.000292, train/loss_step=0.0885, global_step=1670.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  53%|█████▎    | 645/1208 [18:40<16:17,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.63e-5, train/loss_step=0.0152, global_step=1671.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  53%|█████▎    | 646/1208 [18:41<16:15,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.63e-5, train/loss_step=0.0152, global_step=1671.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  53%|█████▎    | 646/1208 [18:41<16:15,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0618, train/loss_vlb_step=0.000212, train/loss_step=0.0618, global_step=1671.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  54%|█████▎    | 647/1208 [18:42<16:13,  1.73s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0618, train/loss_vlb_step=0.000212, train/loss_step=0.0618, global_step=1671.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  54%|█████▎    | 647/1208 [18:42<16:13,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.570, train/loss_vlb_step=0.0101, train/loss_step=0.570, global_step=1671.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  54%|█████▎    | 648/1208 [18:45<16:12,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.570, train/loss_vlb_step=0.0101, train/loss_step=0.570, global_step=1671.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  54%|█████▎    | 648/1208 [18:45<16:12,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.000179, train/loss_step=0.0508, global_step=1671.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  54%|█████▎    | 649/1208 [18:46<16:10,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.000179, train/loss_step=0.0508, global_step=1671.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  54%|█████▎    | 649/1208 [18:46<16:10,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000337, train/loss_step=0.103, global_step=1672.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  54%|█████▍    | 650/1208 [18:47<16:08,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000337, train/loss_step=0.103, global_step=1672.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  54%|█████▍    | 650/1208 [18:47<16:08,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.00035, train/loss_step=0.106, global_step=1672.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  54%|█████▍    | 651/1208 [18:48<16:05,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.00035, train/loss_step=0.106, global_step=1672.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  54%|█████▍    | 651/1208 [18:48<16:05,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000161, train/loss_step=0.0438, global_step=1672.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  54%|█████▍    | 652/1208 [18:51<16:05,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000161, train/loss_step=0.0438, global_step=1672.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  54%|█████▍    | 652/1208 [18:51<16:05,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000873, train/loss_step=0.220, global_step=1672.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  54%|█████▍    | 653/1208 [18:53<16:02,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000873, train/loss_step=0.220, global_step=1672.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  54%|█████▍    | 653/1208 [18:53<16:02,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.53e-5, train/loss_step=0.0125, global_step=1673.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  54%|█████▍    | 654/1208 [18:54<16:00,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.53e-5, train/loss_step=0.0125, global_step=1673.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  54%|█████▍    | 654/1208 [18:54<16:00,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0593, train/loss_vlb_step=0.000208, train/loss_step=0.0593, global_step=1673.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  54%|█████▍    | 655/1208 [18:55<15:58,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0593, train/loss_vlb_step=0.000208, train/loss_step=0.0593, global_step=1673.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  54%|█████▍    | 655/1208 [18:55<15:58,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.00013, train/loss_step=0.0345, global_step=1673.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  54%|█████▍    | 656/1208 [18:58<15:57,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.00013, train/loss_step=0.0345, global_step=1673.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  54%|█████▍    | 656/1208 [18:58<15:57,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.21e-5, train/loss_step=0.00199, global_step=1673.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  54%|█████▍    | 657/1208 [18:59<15:55,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.21e-5, train/loss_step=0.00199, global_step=1673.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  54%|█████▍    | 657/1208 [18:59<15:55,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000908, train/loss_step=0.235, global_step=1674.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  54%|█████▍    | 658/1208 [19:00<15:53,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000908, train/loss_step=0.235, global_step=1674.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  54%|█████▍    | 658/1208 [19:00<15:53,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.49e-5, train/loss_step=0.0116, global_step=1674.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  55%|█████▍    | 659/1208 [19:01<15:50,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.49e-5, train/loss_step=0.0116, global_step=1674.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  55%|█████▍    | 659/1208 [19:01<15:50,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0429, train/loss_vlb_step=0.00016, train/loss_step=0.0429, global_step=1674.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  55%|█████▍    | 660/1208 [19:04<15:50,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0429, train/loss_vlb_step=0.00016, train/loss_step=0.0429, global_step=1674.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  55%|█████▍    | 660/1208 [19:04<15:50,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0886, train/loss_vlb_step=0.0003, train/loss_step=0.0886, global_step=1674.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  55%|█████▍    | 661/1208 [19:05<15:48,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0886, train/loss_vlb_step=0.0003, train/loss_step=0.0886, global_step=1674.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  55%|█████▍    | 661/1208 [19:05<15:48,  1.73s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.83e-5, train/loss_step=0.00324, global_step=1675.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  55%|█████▍    | 662/1208 [19:06<15:45,  1.73s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.83e-5, train/loss_step=0.00324, global_step=1675.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  55%|█████▍    | 662/1208 [19:06<15:45,  1.73s/it, loss=0.104, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=1675.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  55%|█████▍    | 663/1208 [19:07<15:43,  1.73s/it, loss=0.104, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=1675.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  55%|█████▍    | 663/1208 [19:07<15:43,  1.73s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.00442, train/loss_vlb_step=2.33e-5, train/loss_step=0.00442, global_step=1675.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  55%|█████▍    | 664/1208 [19:11<15:43,  1.73s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.00442, train/loss_vlb_step=2.33e-5, train/loss_step=0.00442, global_step=1675.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  55%|█████▍    | 664/1208 [19:11<15:43,  1.73s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.000155, train/loss_step=0.0413, global_step=1675.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  55%|█████▌    | 665/1208 [19:12<15:40,  1.73s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.000155, train/loss_step=0.0413, global_step=1675.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  55%|█████▌    | 665/1208 [19:12<15:40,  1.73s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000719, train/loss_step=0.195, global_step=1676.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  55%|█████▌    | 666/1208 [19:13<15:38,  1.73s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000719, train/loss_step=0.195, global_step=1676.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  55%|█████▌    | 666/1208 [19:13<15:38,  1.73s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=6.21e-5, train/loss_step=0.0128, global_step=1676.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  55%|█████▌    | 667/1208 [19:14<15:36,  1.73s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=6.21e-5, train/loss_step=0.0128, global_step=1676.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  55%|█████▌    | 667/1208 [19:14<15:36,  1.73s/it, loss=0.0717, v_num=0, train/loss_simple_step=0.057, train/loss_vlb_step=0.000195, train/loss_step=0.057, global_step=1676.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  55%|█████▌    | 668/1208 [19:17<15:35,  1.73s/it, loss=0.0717, v_num=0, train/loss_simple_step=0.057, train/loss_vlb_step=0.000195, train/loss_step=0.057, global_step=1676.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  55%|█████▌    | 668/1208 [19:17<15:35,  1.73s/it, loss=0.0707, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000114, train/loss_step=0.0306, global_step=1676.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  55%|█████▌    | 669/1208 [19:18<15:33,  1.73s/it, loss=0.0707, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000114, train/loss_step=0.0306, global_step=1676.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  55%|█████▌    | 669/1208 [19:18<15:33,  1.73s/it, loss=0.082, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00156, train/loss_step=0.328, global_step=1677.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  55%|█████▌    | 670/1208 [19:19<15:31,  1.73s/it, loss=0.082, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00156, train/loss_step=0.328, global_step=1677.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  55%|█████▌    | 670/1208 [19:19<15:31,  1.73s/it, loss=0.0769, v_num=0, train/loss_simple_step=0.00458, train/loss_vlb_step=2.4e-5, train/loss_step=0.00458, global_step=1677.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  56%|█████▌    | 671/1208 [19:20<15:28,  1.73s/it, loss=0.0769, v_num=0, train/loss_simple_step=0.00458, train/loss_vlb_step=2.4e-5, train/loss_step=0.00458, global_step=1677.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  56%|█████▌    | 671/1208 [19:20<15:28,  1.73s/it, loss=0.0893, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00122, train/loss_step=0.291, global_step=1677.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  56%|█████▌    | 672/1208 [19:23<15:28,  1.73s/it, loss=0.0893, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00122, train/loss_step=0.291, global_step=1677.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  56%|█████▌    | 672/1208 [19:23<15:28,  1.73s/it, loss=0.081, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000194, train/loss_step=0.0545, global_step=1677.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  56%|█████▌    | 673/1208 [19:24<15:26,  1.73s/it, loss=0.081, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000194, train/loss_step=0.0545, global_step=1677.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  56%|█████▌    | 673/1208 [19:24<15:26,  1.73s/it, loss=0.0807, v_num=0, train/loss_simple_step=0.00622, train/loss_vlb_step=3.14e-5, train/loss_step=0.00622, global_step=1678.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  56%|█████▌    | 674/1208 [19:25<15:23,  1.73s/it, loss=0.0807, v_num=0, train/loss_simple_step=0.00622, train/loss_vlb_step=3.14e-5, train/loss_step=0.00622, global_step=1678.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  56%|█████▌    | 674/1208 [19:25<15:23,  1.73s/it, loss=0.0853, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000504, train/loss_step=0.151, global_step=1678.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  56%|█████▌    | 675/1208 [19:26<15:21,  1.73s/it, loss=0.0853, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000504, train/loss_step=0.151, global_step=1678.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  56%|█████▌    | 675/1208 [19:26<15:21,  1.73s/it, loss=0.0845, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.33e-5, train/loss_step=0.0188, global_step=1678.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  56%|█████▌    | 676/1208 [19:30<15:20,  1.73s/it, loss=0.0845, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.33e-5, train/loss_step=0.0188, global_step=1678.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  56%|█████▌    | 676/1208 [19:30<15:20,  1.73s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.000137, train/loss_step=0.0359, global_step=1678.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  56%|█████▌    | 677/1208 [19:31<15:18,  1.73s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.000137, train/loss_step=0.0359, global_step=1678.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  56%|█████▌    | 677/1208 [19:31<15:18,  1.73s/it, loss=0.075, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.25e-5, train/loss_step=0.0112, global_step=1679.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  56%|█████▌    | 678/1208 [19:32<15:16,  1.73s/it, loss=0.075, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.25e-5, train/loss_step=0.0112, global_step=1679.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  56%|█████▌    | 678/1208 [19:32<15:16,  1.73s/it, loss=0.076, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000125, train/loss_step=0.0311, global_step=1679.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  56%|█████▌    | 679/1208 [19:33<15:14,  1.73s/it, loss=0.076, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000125, train/loss_step=0.0311, global_step=1679.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  56%|█████▌    | 679/1208 [19:33<15:14,  1.73s/it, loss=0.0993, v_num=0, train/loss_simple_step=0.509, train/loss_vlb_step=0.00736, train/loss_step=0.509, global_step=1679.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  56%|█████▋    | 680/1208 [19:36<15:13,  1.73s/it, loss=0.0993, v_num=0, train/loss_simple_step=0.509, train/loss_vlb_step=0.00736, train/loss_step=0.509, global_step=1679.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  56%|█████▋    | 680/1208 [19:36<15:13,  1.73s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.00033, train/loss_step=0.100, global_step=1679.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  56%|█████▋    | 681/1208 [19:37<15:11,  1.73s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.00033, train/loss_step=0.100, global_step=1679.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  56%|█████▋    | 681/1208 [19:37<15:11,  1.73s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00889, train/loss_vlb_step=4.32e-5, train/loss_step=0.00889, global_step=1680.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  56%|█████▋    | 682/1208 [19:38<15:09,  1.73s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00889, train/loss_vlb_step=4.32e-5, train/loss_step=0.00889, global_step=1680.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  56%|█████▋    | 682/1208 [19:38<15:09,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00127, train/loss_step=0.276, global_step=1680.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  57%|█████▋    | 683/1208 [19:39<15:06,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00127, train/loss_step=0.276, global_step=1680.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  57%|█████▋    | 683/1208 [19:39<15:06,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0641, train/loss_vlb_step=0.000223, train/loss_step=0.0641, global_step=1680.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  57%|█████▋    | 684/1208 [19:43<15:06,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0641, train/loss_vlb_step=0.000223, train/loss_step=0.0641, global_step=1680.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  57%|█████▋    | 684/1208 [19:43<15:06,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.00432, train/loss_step=0.470, global_step=1680.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  57%|█████▋    | 685/1208 [19:44<15:04,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.00432, train/loss_step=0.470, global_step=1680.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  57%|█████▋    | 685/1208 [19:44<15:04,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.001, train/loss_step=0.265, global_step=1681.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  57%|█████▋    | 686/1208 [19:45<15:01,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.001, train/loss_step=0.265, global_step=1681.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  57%|█████▋    | 686/1208 [19:45<15:01,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0892, train/loss_vlb_step=0.000297, train/loss_step=0.0892, global_step=1681.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  57%|█████▋    | 687/1208 [19:46<14:59,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0892, train/loss_vlb_step=0.000297, train/loss_step=0.0892, global_step=1681.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  57%|█████▋    | 687/1208 [19:46<14:59,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00247, train/loss_step=0.367, global_step=1681.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  57%|█████▋    | 688/1208 [19:49<14:59,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00247, train/loss_step=0.367, global_step=1681.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  57%|█████▋    | 688/1208 [19:49<14:59,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0982, train/loss_vlb_step=0.000323, train/loss_step=0.0982, global_step=1681.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  57%|█████▋    | 689/1208 [19:50<14:56,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0982, train/loss_vlb_step=0.000323, train/loss_step=0.0982, global_step=1681.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  57%|█████▋    | 689/1208 [19:50<14:56,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0748, train/loss_vlb_step=0.000247, train/loss_step=0.0748, global_step=1682.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  57%|█████▋    | 690/1208 [19:51<14:54,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0748, train/loss_vlb_step=0.000247, train/loss_step=0.0748, global_step=1682.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  57%|█████▋    | 690/1208 [19:51<14:54,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000703, train/loss_step=0.179, global_step=1682.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  57%|█████▋    | 691/1208 [19:52<14:52,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000703, train/loss_step=0.179, global_step=1682.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  57%|█████▋    | 691/1208 [19:52<14:52,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00973, train/loss_vlb_step=4.75e-5, train/loss_step=0.00973, global_step=1682.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  57%|█████▋    | 692/1208 [19:55<14:51,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00973, train/loss_vlb_step=4.75e-5, train/loss_step=0.00973, global_step=1682.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  57%|█████▋    | 692/1208 [19:55<14:51,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000111, train/loss_step=0.0286, global_step=1682.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  57%|█████▋    | 693/1208 [19:56<14:49,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000111, train/loss_step=0.0286, global_step=1682.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  57%|█████▋    | 693/1208 [19:56<14:49,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000748, train/loss_step=0.192, global_step=1683.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  57%|█████▋    | 694/1208 [19:57<14:47,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000748, train/loss_step=0.192, global_step=1683.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  57%|█████▋    | 694/1208 [19:57<14:47,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00107, train/loss_step=0.259, global_step=1683.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  58%|█████▊    | 695/1208 [19:58<14:45,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00107, train/loss_step=0.259, global_step=1683.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  58%|█████▊    | 695/1208 [19:58<14:45,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.19e-5, train/loss_step=0.0116, global_step=1683.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  58%|█████▊    | 696/1208 [20:02<14:44,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.19e-5, train/loss_step=0.0116, global_step=1683.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  58%|█████▊    | 696/1208 [20:02<14:44,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0343, train/loss_vlb_step=0.000131, train/loss_step=0.0343, global_step=1683.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  58%|█████▊    | 697/1208 [20:03<14:42,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0343, train/loss_vlb_step=0.000131, train/loss_step=0.0343, global_step=1683.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  58%|█████▊    | 697/1208 [20:03<14:42,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000903, train/loss_step=0.224, global_step=1684.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  58%|█████▊    | 698/1208 [20:04<14:39,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000903, train/loss_step=0.224, global_step=1684.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  58%|█████▊    | 698/1208 [20:04<14:39,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000965, train/loss_step=0.237, global_step=1684.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  58%|█████▊    | 699/1208 [20:05<14:37,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000965, train/loss_step=0.237, global_step=1684.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  58%|█████▊    | 699/1208 [20:05<14:37,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000674, train/loss_step=0.188, global_step=1684.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  58%|█████▊    | 700/1208 [20:08<14:37,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000674, train/loss_step=0.188, global_step=1684.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  58%|█████▊    | 700/1208 [20:08<14:37,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0341, train/loss_vlb_step=0.000133, train/loss_step=0.0341, global_step=1684.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  58%|█████▊    | 701/1208 [20:09<14:34,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0341, train/loss_vlb_step=0.000133, train/loss_step=0.0341, global_step=1684.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  58%|█████▊    | 701/1208 [20:09<14:34,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00169, train/loss_step=0.305, global_step=1685.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  58%|█████▊    | 702/1208 [20:10<14:32,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00169, train/loss_step=0.305, global_step=1685.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  58%|█████▊    | 702/1208 [20:10<14:32,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000742, train/loss_step=0.204, global_step=1685.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  58%|█████▊    | 703/1208 [20:11<14:30,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000742, train/loss_step=0.204, global_step=1685.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  58%|█████▊    | 703/1208 [20:11<14:30,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0069, train/loss_vlb_step=3.46e-5, train/loss_step=0.0069, global_step=1685.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  58%|█████▊    | 704/1208 [20:14<14:29,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0069, train/loss_vlb_step=3.46e-5, train/loss_step=0.0069, global_step=1685.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  58%|█████▊    | 704/1208 [20:15<14:29,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=6.05e-5, train/loss_step=0.013, global_step=1685.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  58%|█████▊    | 705/1208 [20:16<14:27,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=6.05e-5, train/loss_step=0.013, global_step=1685.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  58%|█████▊    | 705/1208 [20:16<14:27,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000553, train/loss_step=0.162, global_step=1686.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  58%|█████▊    | 706/1208 [20:17<14:25,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000553, train/loss_step=0.162, global_step=1686.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  58%|█████▊    | 706/1208 [20:17<14:25,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=1686.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  59%|█████▊    | 707/1208 [20:18<14:23,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=1686.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  59%|█████▊    | 707/1208 [20:18<14:23,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000145, train/loss_step=0.0374, global_step=1686.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  59%|█████▊    | 708/1208 [20:21<14:22,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000145, train/loss_step=0.0374, global_step=1686.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  59%|█████▊    | 708/1208 [20:21<14:22,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00364, train/loss_vlb_step=2e-5, train/loss_step=0.00364, global_step=1686.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  59%|█████▊    | 709/1208 [20:22<14:20,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00364, train/loss_vlb_step=2e-5, train/loss_step=0.00364, global_step=1686.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  59%|█████▊    | 709/1208 [20:22<14:20,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.416, train/loss_vlb_step=0.00369, train/loss_step=0.416, global_step=1687.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  59%|█████▉    | 710/1208 [20:23<14:18,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.416, train/loss_vlb_step=0.00369, train/loss_step=0.416, global_step=1687.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  59%|█████▉    | 710/1208 [20:23<14:18,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00114, train/loss_step=0.264, global_step=1687.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  59%|█████▉    | 711/1208 [20:24<14:15,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00114, train/loss_step=0.264, global_step=1687.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  59%|█████▉    | 711/1208 [20:24<14:15,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.46e-5, train/loss_step=0.00247, global_step=1687.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  59%|█████▉    | 712/1208 [20:27<14:15,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.46e-5, train/loss_step=0.00247, global_step=1687.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  59%|█████▉    | 712/1208 [20:27<14:15,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000654, train/loss_step=0.191, global_step=1687.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  59%|█████▉    | 713/1208 [20:28<14:13,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000654, train/loss_step=0.191, global_step=1687.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  59%|█████▉    | 713/1208 [20:28<14:13,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.00045, train/loss_step=0.134, global_step=1688.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  59%|█████▉    | 714/1208 [20:29<14:10,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.00045, train/loss_step=0.134, global_step=1688.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  59%|█████▉    | 714/1208 [20:29<14:10,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00608, train/loss_vlb_step=3.05e-5, train/loss_step=0.00608, global_step=1688.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  59%|█████▉    | 715/1208 [20:30<14:08,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00608, train/loss_vlb_step=3.05e-5, train/loss_step=0.00608, global_step=1688.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  59%|█████▉    | 715/1208 [20:30<14:08,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000255, train/loss_step=0.0732, global_step=1688.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  59%|█████▉    | 716/1208 [20:34<14:08,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000255, train/loss_step=0.0732, global_step=1688.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  59%|█████▉    | 716/1208 [20:34<14:08,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00831, train/loss_vlb_step=4.11e-5, train/loss_step=0.00831, global_step=1688.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  59%|█████▉    | 717/1208 [20:35<14:05,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00831, train/loss_vlb_step=4.11e-5, train/loss_step=0.00831, global_step=1688.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  59%|█████▉    | 717/1208 [20:35<14:05,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=1689.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  59%|█████▉    | 718/1208 [20:36<14:03,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=1689.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  59%|█████▉    | 718/1208 [20:36<14:03,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00118, train/loss_step=0.273, global_step=1689.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  60%|█████▉    | 719/1208 [20:37<14:01,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00118, train/loss_step=0.273, global_step=1689.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  60%|█████▉    | 719/1208 [20:37<14:01,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00176, train/loss_step=0.352, global_step=1689.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  60%|█████▉    | 720/1208 [20:40<14:00,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00176, train/loss_step=0.352, global_step=1689.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  60%|█████▉    | 720/1208 [20:40<14:00,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0492, train/loss_vlb_step=0.00017, train/loss_step=0.0492, global_step=1689.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  60%|█████▉    | 721/1208 [20:41<13:58,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0492, train/loss_vlb_step=0.00017, train/loss_step=0.0492, global_step=1689.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  60%|█████▉    | 721/1208 [20:41<13:58,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000161, train/loss_step=0.0445, global_step=1690.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  60%|█████▉    | 722/1208 [20:42<13:56,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000161, train/loss_step=0.0445, global_step=1690.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  60%|█████▉    | 722/1208 [20:42<13:56,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0076, train/loss_vlb_step=3.86e-5, train/loss_step=0.0076, global_step=1690.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  60%|█████▉    | 723/1208 [20:43<13:54,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0076, train/loss_vlb_step=3.86e-5, train/loss_step=0.0076, global_step=1690.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  60%|█████▉    | 723/1208 [20:43<13:54,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.59e-5, train/loss_step=0.0119, global_step=1690.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  60%|█████▉    | 724/1208 [20:46<13:53,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.59e-5, train/loss_step=0.0119, global_step=1690.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  60%|█████▉    | 724/1208 [20:46<13:53,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.834, train/loss_vlb_step=0.211, train/loss_step=0.834, global_step=1690.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  60%|██████    | 725/1208 [20:47<13:51,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.834, train/loss_vlb_step=0.211, train/loss_step=0.834, global_step=1690.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  60%|██████    | 725/1208 [20:47<13:51,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000762, train/loss_step=0.207, global_step=1691.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  60%|██████    | 726/1208 [20:49<13:49,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000762, train/loss_step=0.207, global_step=1691.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  60%|██████    | 726/1208 [20:49<13:49,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.4e-5, train/loss_step=0.0173, global_step=1691.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  60%|██████    | 727/1208 [20:50<13:47,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.4e-5, train/loss_step=0.0173, global_step=1691.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  60%|██████    | 727/1208 [20:50<13:47,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000503, train/loss_step=0.151, global_step=1691.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  60%|██████    | 728/1208 [20:53<13:46,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000503, train/loss_step=0.151, global_step=1691.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  60%|██████    | 728/1208 [20:53<13:46,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=1.42e-5, train/loss_step=0.00238, global_step=1691.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  60%|██████    | 729/1208 [20:54<13:44,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=1.42e-5, train/loss_step=0.00238, global_step=1691.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  60%|██████    | 729/1208 [20:54<13:44,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0709, train/loss_vlb_step=0.000244, train/loss_step=0.0709, global_step=1692.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  60%|██████    | 730/1208 [20:55<13:42,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0709, train/loss_vlb_step=0.000244, train/loss_step=0.0709, global_step=1692.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  60%|██████    | 730/1208 [20:55<13:42,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000398, train/loss_step=0.121, global_step=1692.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  61%|██████    | 731/1208 [20:56<13:39,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000398, train/loss_step=0.121, global_step=1692.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  61%|██████    | 731/1208 [20:56<13:39,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0625, train/loss_vlb_step=0.000212, train/loss_step=0.0625, global_step=1692.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  61%|██████    | 732/1208 [20:59<13:39,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0625, train/loss_vlb_step=0.000212, train/loss_step=0.0625, global_step=1692.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  61%|██████    | 732/1208 [20:59<13:39,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.98e-5, train/loss_step=0.0184, global_step=1692.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  61%|██████    | 733/1208 [21:00<13:36,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.98e-5, train/loss_step=0.0184, global_step=1692.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  61%|██████    | 733/1208 [21:00<13:36,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000902, train/loss_step=0.231, global_step=1693.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  61%|██████    | 734/1208 [21:01<13:34,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000902, train/loss_step=0.231, global_step=1693.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  61%|██████    | 734/1208 [21:01<13:34,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000635, train/loss_step=0.183, global_step=1693.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  61%|██████    | 735/1208 [21:02<13:32,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000635, train/loss_step=0.183, global_step=1693.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  61%|██████    | 735/1208 [21:02<13:32,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.000179, train/loss_step=0.0482, global_step=1693.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  61%|██████    | 736/1208 [21:06<13:31,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.000179, train/loss_step=0.0482, global_step=1693.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  61%|██████    | 736/1208 [21:06<13:31,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00241, train/loss_step=0.318, global_step=1693.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  61%|██████    | 737/1208 [21:07<13:29,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00241, train/loss_step=0.318, global_step=1693.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  61%|██████    | 737/1208 [21:07<13:29,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0784, train/loss_vlb_step=0.000266, train/loss_step=0.0784, global_step=1694.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  61%|██████    | 738/1208 [21:08<13:27,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0784, train/loss_vlb_step=0.000266, train/loss_step=0.0784, global_step=1694.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  61%|██████    | 738/1208 [21:08<13:27,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.00047, train/loss_step=0.142, global_step=1694.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  61%|██████    | 739/1208 [21:09<13:25,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.00047, train/loss_step=0.142, global_step=1694.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  61%|██████    | 739/1208 [21:09<13:25,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00109, train/loss_step=0.257, global_step=1694.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  61%|██████▏   | 740/1208 [21:12<13:24,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00109, train/loss_step=0.257, global_step=1694.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  61%|██████▏   | 740/1208 [21:12<13:24,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00161, train/loss_step=0.329, global_step=1694.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  61%|██████▏   | 741/1208 [21:13<13:22,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00161, train/loss_step=0.329, global_step=1694.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  61%|██████▏   | 741/1208 [21:13<13:22,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00246, train/loss_step=0.391, global_step=1695.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  61%|██████▏   | 742/1208 [21:14<13:20,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00246, train/loss_step=0.391, global_step=1695.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  61%|██████▏   | 742/1208 [21:14<13:20,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00131, train/loss_step=0.280, global_step=1695.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  62%|██████▏   | 743/1208 [21:15<13:18,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00131, train/loss_step=0.280, global_step=1695.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  62%|██████▏   | 743/1208 [21:15<13:18,  1.72s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0937, train/loss_vlb_step=0.000308, train/loss_step=0.0937, global_step=1695.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  62%|██████▏   | 744/1208 [21:18<13:17,  1.72s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0937, train/loss_vlb_step=0.000308, train/loss_step=0.0937, global_step=1695.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  62%|██████▏   | 744/1208 [21:18<13:17,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00123, train/loss_step=0.279, global_step=1695.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  62%|██████▏   | 745/1208 [21:19<13:15,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00123, train/loss_step=0.279, global_step=1695.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  62%|██████▏   | 745/1208 [21:19<13:15,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0338, train/loss_vlb_step=0.000128, train/loss_step=0.0338, global_step=1696.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  62%|██████▏   | 746/1208 [21:20<13:13,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0338, train/loss_vlb_step=0.000128, train/loss_step=0.0338, global_step=1696.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  62%|██████▏   | 746/1208 [21:20<13:13,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00789, train/loss_vlb_step=3.9e-5, train/loss_step=0.00789, global_step=1696.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  62%|██████▏   | 747/1208 [21:21<13:11,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00789, train/loss_vlb_step=3.9e-5, train/loss_step=0.00789, global_step=1696.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  62%|██████▏   | 747/1208 [21:21<13:11,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000651, train/loss_step=0.191, global_step=1696.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  62%|██████▏   | 748/1208 [21:25<13:10,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000651, train/loss_step=0.191, global_step=1696.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  62%|██████▏   | 748/1208 [21:25<13:10,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000907, train/loss_step=0.214, global_step=1696.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  62%|██████▏   | 749/1208 [21:26<13:08,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000907, train/loss_step=0.214, global_step=1696.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  62%|██████▏   | 749/1208 [21:26<13:08,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000576, train/loss_step=0.166, global_step=1697.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  62%|██████▏   | 750/1208 [21:27<13:06,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000576, train/loss_step=0.166, global_step=1697.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  62%|██████▏   | 750/1208 [21:27<13:06,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00234, train/loss_step=0.326, global_step=1697.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  62%|██████▏   | 751/1208 [21:28<13:03,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00234, train/loss_step=0.326, global_step=1697.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  62%|██████▏   | 751/1208 [21:28<13:03,  1.72s/it, loss=0.193, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.0013, train/loss_step=0.278, global_step=1697.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  62%|██████▏   | 752/1208 [21:31<13:03,  1.72s/it, loss=0.193, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.0013, train/loss_step=0.278, global_step=1697.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  62%|██████▏   | 752/1208 [21:31<13:03,  1.72s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.19e-5, train/loss_step=0.0177, global_step=1697.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  62%|██████▏   | 753/1208 [21:32<13:01,  1.72s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.19e-5, train/loss_step=0.0177, global_step=1697.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  62%|██████▏   | 753/1208 [21:32<13:01,  1.72s/it, loss=0.187, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000377, train/loss_step=0.113, global_step=1698.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  62%|██████▏   | 754/1208 [21:33<12:58,  1.72s/it, loss=0.187, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000377, train/loss_step=0.113, global_step=1698.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  62%|██████▏   | 754/1208 [21:33<12:58,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0923, train/loss_vlb_step=0.000303, train/loss_step=0.0923, global_step=1698.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  62%|██████▎   | 755/1208 [21:34<12:56,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0923, train/loss_vlb_step=0.000303, train/loss_step=0.0923, global_step=1698.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  62%|██████▎   | 755/1208 [21:34<12:56,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000403, train/loss_step=0.122, global_step=1698.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  63%|██████▎   | 756/1208 [21:37<12:56,  1.72s/it, loss=0.186, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000403, train/loss_step=0.122, global_step=1698.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  63%|██████▎   | 756/1208 [21:37<12:56,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0896, train/loss_vlb_step=0.000298, train/loss_step=0.0896, global_step=1698.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  63%|██████▎   | 757/1208 [21:38<12:53,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0896, train/loss_vlb_step=0.000298, train/loss_step=0.0896, global_step=1698.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  63%|██████▎   | 757/1208 [21:39<12:53,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00176, train/loss_step=0.362, global_step=1699.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  63%|██████▎   | 758/1208 [21:40<12:51,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00176, train/loss_step=0.362, global_step=1699.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  63%|██████▎   | 758/1208 [21:40<12:51,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000491, train/loss_step=0.146, global_step=1699.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  63%|██████▎   | 759/1208 [21:41<12:49,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000491, train/loss_step=0.146, global_step=1699.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  63%|██████▎   | 759/1208 [21:41<12:49,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000121, train/loss_step=0.0319, global_step=1699.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  63%|██████▎   | 760/1208 [21:44<12:48,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000121, train/loss_step=0.0319, global_step=1699.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  63%|██████▎   | 760/1208 [21:44<12:48,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=1.98e-5, train/loss_step=0.00357, global_step=1699.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  63%|██████▎   | 761/1208 [21:45<12:46,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=1.98e-5, train/loss_step=0.00357, global_step=1699.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  63%|██████▎   | 761/1208 [21:45<12:46,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000405, train/loss_step=0.123, global_step=1700.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  63%|██████▎   | 762/1208 [21:46<12:44,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000405, train/loss_step=0.123, global_step=1700.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  63%|██████▎   | 762/1208 [21:46<12:44,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.06e-5, train/loss_step=0.0175, global_step=1700.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  63%|██████▎   | 763/1208 [21:47<12:42,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.06e-5, train/loss_step=0.0175, global_step=1700.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  63%|██████▎   | 763/1208 [21:47<12:42,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000438, train/loss_step=0.132, global_step=1700.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  63%|██████▎   | 764/1208 [21:50<12:41,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000438, train/loss_step=0.132, global_step=1700.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  63%|██████▎   | 764/1208 [21:50<12:41,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=0.000107, train/loss_step=0.0261, global_step=1700.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  63%|██████▎   | 765/1208 [21:51<12:39,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=0.000107, train/loss_step=0.0261, global_step=1700.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  63%|██████▎   | 765/1208 [21:51<12:39,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0627, train/loss_vlb_step=0.000212, train/loss_step=0.0627, global_step=1701.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  63%|██████▎   | 766/1208 [21:52<12:37,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0627, train/loss_vlb_step=0.000212, train/loss_step=0.0627, global_step=1701.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  63%|██████▎   | 766/1208 [21:52<12:37,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=1.49e-5, train/loss_step=0.00256, global_step=1701.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  63%|██████▎   | 767/1208 [21:53<12:35,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=1.49e-5, train/loss_step=0.00256, global_step=1701.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  63%|██████▎   | 767/1208 [21:53<12:35,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.42e-5, train/loss_step=0.00235, global_step=1701.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  64%|██████▎   | 768/1208 [21:57<12:34,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.42e-5, train/loss_step=0.00235, global_step=1701.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  64%|██████▎   | 768/1208 [21:57<12:34,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00179, train/loss_step=0.318, global_step=1701.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  64%|██████▎   | 769/1208 [21:58<12:32,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00179, train/loss_step=0.318, global_step=1701.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  64%|██████▎   | 769/1208 [21:58<12:32,  1.71s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00454, train/loss_vlb_step=2.41e-5, train/loss_step=0.00454, global_step=1702.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  64%|██████▎   | 770/1208 [21:59<12:30,  1.71s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00454, train/loss_vlb_step=2.41e-5, train/loss_step=0.00454, global_step=1702.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  64%|██████▎   | 770/1208 [21:59<12:30,  1.71s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.00695, train/loss_vlb_step=3.41e-5, train/loss_step=0.00695, global_step=1702.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  64%|██████▍   | 771/1208 [22:00<12:28,  1.71s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.00695, train/loss_vlb_step=3.41e-5, train/loss_step=0.00695, global_step=1702.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  64%|██████▍   | 771/1208 [22:00<12:28,  1.71s/it, loss=0.084, v_num=0, train/loss_simple_step=0.006, train/loss_vlb_step=3.06e-5, train/loss_step=0.006, global_step=1702.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]     Epoch 5:  64%|██████▍   | 772/1208 [22:03<12:27,  1.71s/it, loss=0.084, v_num=0, train/loss_simple_step=0.006, train/loss_vlb_step=3.06e-5, train/loss_step=0.006, global_step=1702.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  64%|██████▍   | 772/1208 [22:03<12:27,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.841, train/loss_vlb_step=0.142, train/loss_step=0.841, global_step=1702.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  64%|██████▍   | 773/1208 [22:04<12:25,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.841, train/loss_vlb_step=0.142, train/loss_step=0.841, global_step=1702.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  64%|██████▍   | 773/1208 [22:04<12:25,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.475, train/loss_vlb_step=0.00703, train/loss_step=0.475, global_step=1703.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  64%|██████▍   | 774/1208 [22:05<12:23,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.475, train/loss_vlb_step=0.00703, train/loss_step=0.475, global_step=1703.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  64%|██████▍   | 774/1208 [22:05<12:23,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.000131, train/loss_step=0.0351, global_step=1703.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  64%|██████▍   | 775/1208 [22:06<12:21,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.000131, train/loss_step=0.0351, global_step=1703.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  64%|██████▍   | 775/1208 [22:06<12:21,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00113, train/loss_step=0.274, global_step=1703.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  64%|██████▍   | 776/1208 [22:09<12:20,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00113, train/loss_step=0.274, global_step=1703.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  64%|██████▍   | 776/1208 [22:09<12:20,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0318, train/loss_vlb_step=0.000122, train/loss_step=0.0318, global_step=1703.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  64%|██████▍   | 777/1208 [22:10<12:18,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0318, train/loss_vlb_step=0.000122, train/loss_step=0.0318, global_step=1703.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  64%|██████▍   | 777/1208 [22:10<12:18,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0338, train/loss_vlb_step=0.00013, train/loss_step=0.0338, global_step=1704.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  64%|██████▍   | 778/1208 [22:11<12:16,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0338, train/loss_vlb_step=0.00013, train/loss_step=0.0338, global_step=1704.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  64%|██████▍   | 778/1208 [22:11<12:16,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.036, train/loss_vlb_step=0.000138, train/loss_step=0.036, global_step=1704.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  64%|██████▍   | 779/1208 [22:12<12:14,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.036, train/loss_vlb_step=0.000138, train/loss_step=0.036, global_step=1704.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  64%|██████▍   | 779/1208 [22:12<12:14,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.00708, train/loss_step=0.512, global_step=1704.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  65%|██████▍   | 780/1208 [22:16<12:13,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.00708, train/loss_step=0.512, global_step=1704.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  65%|██████▍   | 780/1208 [22:16<12:13,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00169, train/loss_step=0.334, global_step=1704.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  65%|██████▍   | 781/1208 [22:17<12:11,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00169, train/loss_step=0.334, global_step=1704.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  65%|██████▍   | 781/1208 [22:17<12:11,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.31e-5, train/loss_step=0.0143, global_step=1705.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  65%|██████▍   | 782/1208 [22:18<12:09,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.31e-5, train/loss_step=0.0143, global_step=1705.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  65%|██████▍   | 782/1208 [22:18<12:09,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.00045, train/loss_step=0.136, global_step=1705.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  65%|██████▍   | 783/1208 [22:19<12:07,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.00045, train/loss_step=0.136, global_step=1705.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  65%|██████▍   | 783/1208 [22:19<12:07,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00278, train/loss_step=0.401, global_step=1705.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  65%|██████▍   | 784/1208 [22:22<12:06,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00278, train/loss_step=0.401, global_step=1705.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  65%|██████▍   | 784/1208 [22:22<12:06,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00654, train/loss_vlb_step=3.32e-5, train/loss_step=0.00654, global_step=1705.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  65%|██████▍   | 785/1208 [22:23<12:04,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00654, train/loss_vlb_step=3.32e-5, train/loss_step=0.00654, global_step=1705.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  65%|██████▍   | 785/1208 [22:23<12:04,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0491, train/loss_vlb_step=0.000171, train/loss_step=0.0491, global_step=1706.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  65%|██████▌   | 786/1208 [22:24<12:02,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0491, train/loss_vlb_step=0.000171, train/loss_step=0.0491, global_step=1706.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  65%|██████▌   | 786/1208 [22:24<12:02,  1.71s/it, loss=0.215, v_num=0, train/loss_simple_step=0.777, train/loss_vlb_step=0.131, train/loss_step=0.777, global_step=1706.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]     Epoch 5:  65%|██████▌   | 787/1208 [22:25<11:59,  1.71s/it, loss=0.215, v_num=0, train/loss_simple_step=0.777, train/loss_vlb_step=0.131, train/loss_step=0.777, global_step=1706.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  65%|██████▌   | 787/1208 [22:25<11:59,  1.71s/it, loss=0.222, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000502, train/loss_step=0.146, global_step=1706.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  65%|██████▌   | 788/1208 [22:29<11:59,  1.71s/it, loss=0.222, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000502, train/loss_step=0.146, global_step=1706.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  65%|██████▌   | 788/1208 [22:29<11:59,  1.71s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000245, train/loss_step=0.0732, global_step=1706.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  65%|██████▌   | 789/1208 [22:30<11:57,  1.71s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000245, train/loss_step=0.0732, global_step=1706.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  65%|██████▌   | 789/1208 [22:30<11:57,  1.71s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.84e-5, train/loss_step=0.0102, global_step=1707.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  65%|██████▌   | 790/1208 [22:31<11:54,  1.71s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.84e-5, train/loss_step=0.0102, global_step=1707.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  65%|██████▌   | 790/1208 [22:31<11:54,  1.71s/it, loss=0.213, v_num=0, train/loss_simple_step=0.0619, train/loss_vlb_step=0.000209, train/loss_step=0.0619, global_step=1707.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  65%|██████▌   | 791/1208 [22:32<11:52,  1.71s/it, loss=0.213, v_num=0, train/loss_simple_step=0.0619, train/loss_vlb_step=0.000209, train/loss_step=0.0619, global_step=1707.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  65%|██████▌   | 791/1208 [22:32<11:52,  1.71s/it, loss=0.228, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00146, train/loss_step=0.310, global_step=1707.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  66%|██████▌   | 792/1208 [22:35<11:51,  1.71s/it, loss=0.228, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00146, train/loss_step=0.310, global_step=1707.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  66%|██████▌   | 792/1208 [22:35<11:51,  1.71s/it, loss=0.187, v_num=0, train/loss_simple_step=0.028, train/loss_vlb_step=0.000109, train/loss_step=0.028, global_step=1707.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  66%|██████▌   | 793/1208 [22:36<11:49,  1.71s/it, loss=0.187, v_num=0, train/loss_simple_step=0.028, train/loss_vlb_step=0.000109, train/loss_step=0.028, global_step=1707.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  66%|██████▌   | 793/1208 [22:36<11:49,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000114, train/loss_step=0.0291, global_step=1708.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  66%|██████▌   | 794/1208 [22:37<11:47,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000114, train/loss_step=0.0291, global_step=1708.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  66%|██████▌   | 794/1208 [22:37<11:47,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0725, train/loss_vlb_step=0.000247, train/loss_step=0.0725, global_step=1708.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  66%|██████▌   | 795/1208 [22:38<11:45,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0725, train/loss_vlb_step=0.000247, train/loss_step=0.0725, global_step=1708.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  66%|██████▌   | 795/1208 [22:38<11:45,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000118, train/loss_step=0.0307, global_step=1708.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  66%|██████▌   | 796/1208 [22:41<11:44,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000118, train/loss_step=0.0307, global_step=1708.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  66%|██████▌   | 796/1208 [22:41<11:44,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0757, train/loss_vlb_step=0.000252, train/loss_step=0.0757, global_step=1708.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  66%|██████▌   | 797/1208 [22:42<11:42,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0757, train/loss_vlb_step=0.000252, train/loss_step=0.0757, global_step=1708.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  66%|██████▌   | 797/1208 [22:42<11:42,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000138, train/loss_step=0.0349, global_step=1709.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  66%|██████▌   | 798/1208 [22:43<11:40,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000138, train/loss_step=0.0349, global_step=1709.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  66%|██████▌   | 798/1208 [22:43<11:40,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.000172, train/loss_step=0.0459, global_step=1709.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  66%|██████▌   | 799/1208 [22:44<11:38,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.000172, train/loss_step=0.0459, global_step=1709.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  66%|██████▌   | 799/1208 [22:44<11:38,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0084, train/loss_vlb_step=4.25e-5, train/loss_step=0.0084, global_step=1709.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  66%|██████▌   | 800/1208 [22:48<11:37,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0084, train/loss_vlb_step=4.25e-5, train/loss_step=0.0084, global_step=1709.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  66%|██████▌   | 800/1208 [22:48<11:37,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.14e-5, train/loss_step=0.0112, global_step=1709.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  66%|██████▋   | 801/1208 [22:49<11:35,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.14e-5, train/loss_step=0.0112, global_step=1709.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  66%|██████▋   | 801/1208 [22:49<11:35,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.000169, train/loss_step=0.0489, global_step=1710.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  66%|██████▋   | 802/1208 [22:50<11:33,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.000169, train/loss_step=0.0489, global_step=1710.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  66%|██████▋   | 802/1208 [22:50<11:33,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000913, train/loss_step=0.240, global_step=1710.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  66%|██████▋   | 803/1208 [22:51<11:31,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000913, train/loss_step=0.240, global_step=1710.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  66%|██████▋   | 803/1208 [22:51<11:31,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000122, train/loss_step=0.0319, global_step=1710.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  67%|██████▋   | 804/1208 [22:54<11:30,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000122, train/loss_step=0.0319, global_step=1710.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  67%|██████▋   | 804/1208 [22:54<11:30,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.93e-5, train/loss_step=0.0178, global_step=1710.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  67%|██████▋   | 805/1208 [22:55<11:28,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.93e-5, train/loss_step=0.0178, global_step=1710.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  67%|██████▋   | 805/1208 [22:55<11:28,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000423, train/loss_step=0.129, global_step=1711.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  67%|██████▋   | 806/1208 [22:56<11:26,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000423, train/loss_step=0.129, global_step=1711.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  67%|██████▋   | 806/1208 [22:56<11:26,  1.71s/it, loss=0.0705, v_num=0, train/loss_simple_step=0.00529, train/loss_vlb_step=2.71e-5, train/loss_step=0.00529, global_step=1711.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  67%|██████▋   | 807/1208 [22:57<11:24,  1.71s/it, loss=0.0705, v_num=0, train/loss_simple_step=0.00529, train/loss_vlb_step=2.71e-5, train/loss_step=0.00529, global_step=1711.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  67%|██████▋   | 807/1208 [22:57<11:24,  1.71s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.440, train/loss_vlb_step=0.00487, train/loss_step=0.440, global_step=1711.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  67%|██████▋   | 808/1208 [23:01<11:23,  1.71s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.440, train/loss_vlb_step=0.00487, train/loss_step=0.440, global_step=1711.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  67%|██████▋   | 808/1208 [23:01<11:23,  1.71s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.000978, train/loss_step=0.252, global_step=1711.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  67%|██████▋   | 809/1208 [23:02<11:21,  1.71s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.000978, train/loss_step=0.252, global_step=1711.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  67%|██████▋   | 809/1208 [23:02<11:21,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000497, train/loss_step=0.150, global_step=1712.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  67%|██████▋   | 810/1208 [23:03<11:19,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000497, train/loss_step=0.150, global_step=1712.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  67%|██████▋   | 810/1208 [23:03<11:19,  1.71s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.21e-5, train/loss_step=0.0174, global_step=1712.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  67%|██████▋   | 811/1208 [23:04<11:17,  1.71s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.21e-5, train/loss_step=0.0174, global_step=1712.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  67%|██████▋   | 811/1208 [23:04<11:17,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00402, train/loss_step=0.409, global_step=1712.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  67%|██████▋   | 812/1208 [23:07<11:16,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00402, train/loss_step=0.409, global_step=1712.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  67%|██████▋   | 812/1208 [23:07<11:16,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0464, train/loss_vlb_step=0.000174, train/loss_step=0.0464, global_step=1712.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  67%|██████▋   | 813/1208 [23:08<11:14,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0464, train/loss_vlb_step=0.000174, train/loss_step=0.0464, global_step=1712.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  67%|██████▋   | 813/1208 [23:08<11:14,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0689, train/loss_vlb_step=0.000233, train/loss_step=0.0689, global_step=1713.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  67%|██████▋   | 814/1208 [23:09<11:12,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0689, train/loss_vlb_step=0.000233, train/loss_step=0.0689, global_step=1713.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  67%|██████▋   | 814/1208 [23:09<11:12,  1.71s/it, loss=0.111, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000529, train/loss_step=0.158, global_step=1713.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  67%|██████▋   | 815/1208 [23:10<11:10,  1.71s/it, loss=0.111, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000529, train/loss_step=0.158, global_step=1713.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  67%|██████▋   | 815/1208 [23:10<11:10,  1.71s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.23e-5, train/loss_step=0.0196, global_step=1713.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  68%|██████▊   | 816/1208 [23:13<11:09,  1.71s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.23e-5, train/loss_step=0.0196, global_step=1713.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  68%|██████▊   | 816/1208 [23:13<11:09,  1.71s/it, loss=0.11, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.00021, train/loss_step=0.062, global_step=1713.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  68%|██████▊   | 817/1208 [23:14<11:07,  1.71s/it, loss=0.11, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.00021, train/loss_step=0.062, global_step=1713.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  68%|██████▊   | 817/1208 [23:14<11:07,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.66e-5, train/loss_step=0.0153, global_step=1714.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  68%|██████▊   | 818/1208 [23:15<11:05,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.66e-5, train/loss_step=0.0153, global_step=1714.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  68%|██████▊   | 818/1208 [23:15<11:05,  1.71s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000278, train/loss_step=0.0815, global_step=1714.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  68%|██████▊   | 819/1208 [23:17<11:03,  1.71s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000278, train/loss_step=0.0815, global_step=1714.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  68%|██████▊   | 819/1208 [23:17<11:03,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.0028, train/loss_step=0.396, global_step=1714.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]     Epoch 5:  68%|██████▊   | 820/1208 [23:20<11:02,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.0028, train/loss_step=0.396, global_step=1714.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  68%|██████▊   | 820/1208 [23:20<11:02,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=2.56e-5, train/loss_step=0.00462, global_step=1714.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  68%|██████▊   | 821/1208 [23:21<11:00,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=2.56e-5, train/loss_step=0.00462, global_step=1714.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  68%|██████▊   | 821/1208 [23:21<11:00,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000803, train/loss_step=0.222, global_step=1715.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  68%|██████▊   | 822/1208 [23:22<10:58,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000803, train/loss_step=0.222, global_step=1715.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  68%|██████▊   | 822/1208 [23:22<10:58,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.7e-5, train/loss_step=0.0219, global_step=1715.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  68%|██████▊   | 823/1208 [23:23<10:56,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.7e-5, train/loss_step=0.0219, global_step=1715.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  68%|██████▊   | 823/1208 [23:23<10:56,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00232, train/loss_step=0.379, global_step=1715.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  68%|██████▊   | 824/1208 [23:26<10:55,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00232, train/loss_step=0.379, global_step=1715.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  68%|██████▊   | 824/1208 [23:26<10:55,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000622, train/loss_step=0.179, global_step=1715.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  68%|██████▊   | 825/1208 [23:27<10:53,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000622, train/loss_step=0.179, global_step=1715.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  68%|██████▊   | 825/1208 [23:27<10:53,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000856, train/loss_step=0.230, global_step=1716.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  68%|██████▊   | 826/1208 [23:28<10:51,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000856, train/loss_step=0.230, global_step=1716.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  68%|██████▊   | 826/1208 [23:28<10:51,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000445, train/loss_step=0.130, global_step=1716.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  68%|██████▊   | 827/1208 [23:29<10:49,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000445, train/loss_step=0.130, global_step=1716.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  68%|██████▊   | 827/1208 [23:29<10:49,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.05e-5, train/loss_step=0.00173, global_step=1716.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  69%|██████▊   | 828/1208 [23:33<10:48,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.05e-5, train/loss_step=0.00173, global_step=1716.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  69%|██████▊   | 828/1208 [23:33<10:48,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.0012, train/loss_step=0.263, global_step=1716.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]     Epoch 5:  69%|██████▊   | 829/1208 [23:34<10:46,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.0012, train/loss_step=0.263, global_step=1716.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  69%|██████▊   | 829/1208 [23:34<10:46,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.92e-5, train/loss_step=0.013, global_step=1717.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  69%|██████▊   | 830/1208 [23:35<10:44,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.92e-5, train/loss_step=0.013, global_step=1717.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  69%|██████▊   | 830/1208 [23:35<10:44,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=1717.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  69%|██████▉   | 831/1208 [23:36<10:42,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=1717.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  69%|██████▉   | 831/1208 [23:36<10:42,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.0045, train/loss_step=0.407, global_step=1717.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  69%|██████▉   | 832/1208 [23:39<10:41,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.0045, train/loss_step=0.407, global_step=1717.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  69%|██████▉   | 832/1208 [23:39<10:41,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00396, train/loss_vlb_step=2.13e-5, train/loss_step=0.00396, global_step=1717.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  69%|██████▉   | 833/1208 [23:40<10:39,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00396, train/loss_vlb_step=2.13e-5, train/loss_step=0.00396, global_step=1717.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  69%|██████▉   | 833/1208 [23:40<10:39,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000143, train/loss_step=0.0376, global_step=1718.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  69%|██████▉   | 834/1208 [23:41<10:37,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000143, train/loss_step=0.0376, global_step=1718.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  69%|██████▉   | 834/1208 [23:41<10:37,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.46e-5, train/loss_step=0.0203, global_step=1718.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  69%|██████▉   | 835/1208 [23:42<10:35,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.46e-5, train/loss_step=0.0203, global_step=1718.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  69%|██████▉   | 835/1208 [23:42<10:35,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000348, train/loss_step=0.106, global_step=1718.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  69%|██████▉   | 836/1208 [23:45<10:34,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000348, train/loss_step=0.106, global_step=1718.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  69%|██████▉   | 836/1208 [23:45<10:34,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.00061, train/loss_step=0.179, global_step=1718.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  69%|██████▉   | 837/1208 [23:46<10:32,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.00061, train/loss_step=0.179, global_step=1718.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  69%|██████▉   | 837/1208 [23:46<10:32,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000449, train/loss_step=0.135, global_step=1719.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  69%|██████▉   | 838/1208 [23:48<10:30,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000449, train/loss_step=0.135, global_step=1719.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  69%|██████▉   | 838/1208 [23:48<10:30,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000114, train/loss_step=0.029, global_step=1719.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  69%|██████▉   | 839/1208 [23:49<10:28,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000114, train/loss_step=0.029, global_step=1719.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  69%|██████▉   | 839/1208 [23:49<10:28,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.13e-5, train/loss_step=0.0121, global_step=1719.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  70%|██████▉   | 840/1208 [23:52<10:27,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.13e-5, train/loss_step=0.0121, global_step=1719.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  70%|██████▉   | 840/1208 [23:52<10:27,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00815, train/loss_vlb_step=4.16e-5, train/loss_step=0.00815, global_step=1719.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  70%|██████▉   | 841/1208 [23:53<10:25,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00815, train/loss_vlb_step=4.16e-5, train/loss_step=0.00815, global_step=1719.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  70%|██████▉   | 841/1208 [23:53<10:25,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00603, train/loss_vlb_step=3.06e-5, train/loss_step=0.00603, global_step=1720.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  70%|██████▉   | 842/1208 [23:54<10:23,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00603, train/loss_vlb_step=3.06e-5, train/loss_step=0.00603, global_step=1720.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  70%|██████▉   | 842/1208 [23:54<10:23,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.84e-5, train/loss_step=0.0122, global_step=1720.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  70%|██████▉   | 843/1208 [23:55<10:21,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.84e-5, train/loss_step=0.0122, global_step=1720.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  70%|██████▉   | 843/1208 [23:55<10:21,  1.70s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.83e-5, train/loss_step=0.0105, global_step=1720.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  70%|██████▉   | 844/1208 [23:58<10:20,  1.70s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.83e-5, train/loss_step=0.0105, global_step=1720.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  70%|██████▉   | 844/1208 [23:58<10:20,  1.70s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.056, train/loss_vlb_step=0.000195, train/loss_step=0.056, global_step=1720.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  70%|██████▉   | 845/1208 [23:59<10:18,  1.70s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.056, train/loss_vlb_step=0.000195, train/loss_step=0.056, global_step=1720.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  70%|██████▉   | 845/1208 [23:59<10:18,  1.70s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.00046, train/loss_step=0.136, global_step=1721.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  70%|███████   | 846/1208 [24:00<10:16,  1.70s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.00046, train/loss_step=0.136, global_step=1721.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  70%|███████   | 846/1208 [24:00<10:16,  1.70s/it, loss=0.0776, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.1e-5, train/loss_step=0.0116, global_step=1721.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  70%|███████   | 847/1208 [24:01<10:14,  1.70s/it, loss=0.0776, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.1e-5, train/loss_step=0.0116, global_step=1721.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  70%|███████   | 847/1208 [24:01<10:14,  1.70s/it, loss=0.0804, v_num=0, train/loss_simple_step=0.0583, train/loss_vlb_step=0.000202, train/loss_step=0.0583, global_step=1721.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  70%|███████   | 848/1208 [24:05<10:13,  1.70s/it, loss=0.0804, v_num=0, train/loss_simple_step=0.0583, train/loss_vlb_step=0.000202, train/loss_step=0.0583, global_step=1721.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  70%|███████   | 848/1208 [24:05<10:13,  1.70s/it, loss=0.0683, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.71e-5, train/loss_step=0.0212, global_step=1721.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  70%|███████   | 849/1208 [24:06<10:11,  1.70s/it, loss=0.0683, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.71e-5, train/loss_step=0.0212, global_step=1721.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  70%|███████   | 849/1208 [24:06<10:11,  1.70s/it, loss=0.0683, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.52e-5, train/loss_step=0.0121, global_step=1722.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  70%|███████   | 850/1208 [24:07<10:09,  1.70s/it, loss=0.0683, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.52e-5, train/loss_step=0.0121, global_step=1722.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  70%|███████   | 850/1208 [24:07<10:09,  1.70s/it, loss=0.0664, v_num=0, train/loss_simple_step=0.0677, train/loss_vlb_step=0.000236, train/loss_step=0.0677, global_step=1722.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  70%|███████   | 851/1208 [24:08<10:07,  1.70s/it, loss=0.0664, v_num=0, train/loss_simple_step=0.0677, train/loss_vlb_step=0.000236, train/loss_step=0.0677, global_step=1722.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  70%|███████   | 851/1208 [24:08<10:07,  1.70s/it, loss=0.0464, v_num=0, train/loss_simple_step=0.00496, train/loss_vlb_step=2.69e-5, train/loss_step=0.00496, global_step=1722.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  71%|███████   | 852/1208 [24:11<10:06,  1.70s/it, loss=0.0464, v_num=0, train/loss_simple_step=0.00496, train/loss_vlb_step=2.69e-5, train/loss_step=0.00496, global_step=1722.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  71%|███████   | 852/1208 [24:11<10:06,  1.70s/it, loss=0.0645, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00173, train/loss_step=0.367, global_step=1722.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  71%|███████   | 853/1208 [24:12<10:04,  1.70s/it, loss=0.0645, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00173, train/loss_step=0.367, global_step=1722.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  71%|███████   | 853/1208 [24:12<10:04,  1.70s/it, loss=0.0634, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=6.99e-5, train/loss_step=0.0165, global_step=1723.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  71%|███████   | 854/1208 [24:13<10:02,  1.70s/it, loss=0.0634, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=6.99e-5, train/loss_step=0.0165, global_step=1723.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  71%|███████   | 854/1208 [24:13<10:02,  1.70s/it, loss=0.0656, v_num=0, train/loss_simple_step=0.063, train/loss_vlb_step=0.00022, train/loss_step=0.063, global_step=1723.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  71%|███████   | 855/1208 [24:14<10:00,  1.70s/it, loss=0.0656, v_num=0, train/loss_simple_step=0.063, train/loss_vlb_step=0.00022, train/loss_step=0.063, global_step=1723.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  71%|███████   | 855/1208 [24:14<10:00,  1.70s/it, loss=0.077, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00191, train/loss_step=0.334, global_step=1723.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  71%|███████   | 856/1208 [24:17<09:59,  1.70s/it, loss=0.077, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00191, train/loss_step=0.334, global_step=1723.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  71%|███████   | 856/1208 [24:17<09:59,  1.70s/it, loss=0.071, v_num=0, train/loss_simple_step=0.060, train/loss_vlb_step=0.000218, train/loss_step=0.060, global_step=1723.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  71%|███████   | 857/1208 [24:18<09:57,  1.70s/it, loss=0.071, v_num=0, train/loss_simple_step=0.060, train/loss_vlb_step=0.000218, train/loss_step=0.060, global_step=1723.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  71%|███████   | 857/1208 [24:18<09:57,  1.70s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.585, train/loss_vlb_step=0.00865, train/loss_step=0.585, global_step=1724.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  71%|███████   | 858/1208 [24:19<09:55,  1.70s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.585, train/loss_vlb_step=0.00865, train/loss_step=0.585, global_step=1724.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  71%|███████   | 858/1208 [24:19<09:55,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.696, train/loss_vlb_step=0.017, train/loss_step=0.696, global_step=1724.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  71%|███████   | 859/1208 [24:20<09:53,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.696, train/loss_vlb_step=0.017, train/loss_step=0.696, global_step=1724.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  71%|███████   | 859/1208 [24:20<09:53,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00735, train/loss_vlb_step=3.8e-5, train/loss_step=0.00735, global_step=1724.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  71%|███████   | 860/1208 [24:24<09:52,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00735, train/loss_vlb_step=3.8e-5, train/loss_step=0.00735, global_step=1724.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  71%|███████   | 860/1208 [24:24<09:52,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=9.55e-6, train/loss_step=0.00158, global_step=1724.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  71%|███████▏  | 861/1208 [24:25<09:50,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=9.55e-6, train/loss_step=0.00158, global_step=1724.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  71%|███████▏  | 861/1208 [24:25<09:50,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00433, train/loss_vlb_step=2.44e-5, train/loss_step=0.00433, global_step=1725.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  71%|███████▏  | 862/1208 [24:26<09:48,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00433, train/loss_vlb_step=2.44e-5, train/loss_step=0.00433, global_step=1725.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  71%|███████▏  | 862/1208 [24:26<09:48,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.7e-5, train/loss_step=0.0206, global_step=1725.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  71%|███████▏  | 863/1208 [24:27<09:46,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.7e-5, train/loss_step=0.0206, global_step=1725.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  71%|███████▏  | 863/1208 [24:27<09:46,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.0018, train/loss_step=0.360, global_step=1725.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  72%|███████▏  | 864/1208 [24:30<09:45,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.0018, train/loss_step=0.360, global_step=1725.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  72%|███████▏  | 864/1208 [24:30<09:45,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00098, train/loss_step=0.264, global_step=1725.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  72%|███████▏  | 865/1208 [24:31<09:43,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00098, train/loss_step=0.264, global_step=1725.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  72%|███████▏  | 865/1208 [24:31<09:43,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00164, train/loss_step=0.320, global_step=1726.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  72%|███████▏  | 866/1208 [24:32<09:41,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00164, train/loss_step=0.320, global_step=1726.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  72%|███████▏  | 866/1208 [24:32<09:41,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00142, train/loss_step=0.303, global_step=1726.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  72%|███████▏  | 867/1208 [24:33<09:39,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00142, train/loss_step=0.303, global_step=1726.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  72%|███████▏  | 867/1208 [24:33<09:39,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.65e-5, train/loss_step=0.0245, global_step=1726.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  72%|███████▏  | 868/1208 [24:37<09:38,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.65e-5, train/loss_step=0.0245, global_step=1726.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  72%|███████▏  | 868/1208 [24:37<09:38,  1.70s/it, loss=0.196, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00332, train/loss_step=0.409, global_step=1726.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  72%|███████▏  | 869/1208 [24:38<09:36,  1.70s/it, loss=0.196, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00332, train/loss_step=0.409, global_step=1726.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  72%|███████▏  | 869/1208 [24:38<09:36,  1.70s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0475, train/loss_vlb_step=0.000169, train/loss_step=0.0475, global_step=1727.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  72%|███████▏  | 870/1208 [24:39<09:34,  1.70s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0475, train/loss_vlb_step=0.000169, train/loss_step=0.0475, global_step=1727.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  72%|███████▏  | 870/1208 [24:39<09:34,  1.70s/it, loss=0.209, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00125, train/loss_step=0.295, global_step=1727.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  72%|███████▏  | 871/1208 [24:40<09:32,  1.70s/it, loss=0.209, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00125, train/loss_step=0.295, global_step=1727.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  72%|███████▏  | 871/1208 [24:40<09:32,  1.70s/it, loss=0.246, v_num=0, train/loss_simple_step=0.739, train/loss_vlb_step=0.0321, train/loss_step=0.739, global_step=1727.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  72%|███████▏  | 872/1208 [24:43<09:31,  1.70s/it, loss=0.246, v_num=0, train/loss_simple_step=0.739, train/loss_vlb_step=0.0321, train/loss_step=0.739, global_step=1727.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  72%|███████▏  | 872/1208 [24:43<09:31,  1.70s/it, loss=0.229, v_num=0, train/loss_simple_step=0.0289, train/loss_vlb_step=0.000114, train/loss_step=0.0289, global_step=1727.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  72%|███████▏  | 873/1208 [24:44<09:29,  1.70s/it, loss=0.229, v_num=0, train/loss_simple_step=0.0289, train/loss_vlb_step=0.000114, train/loss_step=0.0289, global_step=1727.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  72%|███████▏  | 873/1208 [24:44<09:29,  1.70s/it, loss=0.246, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00213, train/loss_step=0.353, global_step=1728.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  72%|███████▏  | 874/1208 [24:45<09:27,  1.70s/it, loss=0.246, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00213, train/loss_step=0.353, global_step=1728.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  72%|███████▏  | 874/1208 [24:45<09:27,  1.70s/it, loss=0.247, v_num=0, train/loss_simple_step=0.0915, train/loss_vlb_step=0.000303, train/loss_step=0.0915, global_step=1728.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  72%|███████▏  | 875/1208 [24:46<09:25,  1.70s/it, loss=0.247, v_num=0, train/loss_simple_step=0.0915, train/loss_vlb_step=0.000303, train/loss_step=0.0915, global_step=1728.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  72%|███████▏  | 875/1208 [24:46<09:25,  1.70s/it, loss=0.232, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000107, train/loss_step=0.0272, global_step=1728.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  73%|███████▎  | 876/1208 [24:49<09:24,  1.70s/it, loss=0.232, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000107, train/loss_step=0.0272, global_step=1728.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  73%|███████▎  | 876/1208 [24:49<09:24,  1.70s/it, loss=0.229, v_num=0, train/loss_simple_step=0.00792, train/loss_vlb_step=3.68e-5, train/loss_step=0.00792, global_step=1728.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  73%|███████▎  | 877/1208 [24:50<09:22,  1.70s/it, loss=0.229, v_num=0, train/loss_simple_step=0.00792, train/loss_vlb_step=3.68e-5, train/loss_step=0.00792, global_step=1728.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  73%|███████▎  | 877/1208 [24:50<09:22,  1.70s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0098, train/loss_vlb_step=4.52e-5, train/loss_step=0.0098, global_step=1729.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  73%|███████▎  | 878/1208 [24:51<09:20,  1.70s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0098, train/loss_vlb_step=4.52e-5, train/loss_step=0.0098, global_step=1729.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  73%|███████▎  | 878/1208 [24:51<09:20,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.00038, train/loss_step=0.116, global_step=1729.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  73%|███████▎  | 879/1208 [24:53<09:18,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.00038, train/loss_step=0.116, global_step=1729.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  73%|███████▎  | 879/1208 [24:53<09:18,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.69e-5, train/loss_step=0.00291, global_step=1729.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  73%|███████▎  | 880/1208 [24:56<09:17,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.69e-5, train/loss_step=0.00291, global_step=1729.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  73%|███████▎  | 880/1208 [24:56<09:17,  1.70s/it, loss=0.183, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000902, train/loss_step=0.244, global_step=1729.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  73%|███████▎  | 881/1208 [24:57<09:15,  1.70s/it, loss=0.183, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000902, train/loss_step=0.244, global_step=1729.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  73%|███████▎  | 881/1208 [24:57<09:15,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000171, train/loss_step=0.0478, global_step=1730.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  73%|███████▎  | 882/1208 [24:58<09:13,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000171, train/loss_step=0.0478, global_step=1730.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  73%|███████▎  | 882/1208 [24:58<09:13,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00364, train/loss_vlb_step=2.06e-5, train/loss_step=0.00364, global_step=1730.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  73%|███████▎  | 883/1208 [24:59<09:11,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00364, train/loss_vlb_step=2.06e-5, train/loss_step=0.00364, global_step=1730.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  73%|███████▎  | 883/1208 [24:59<09:11,  1.70s/it, loss=0.179, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00114, train/loss_step=0.256, global_step=1730.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  73%|███████▎  | 884/1208 [25:02<09:10,  1.70s/it, loss=0.179, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00114, train/loss_step=0.256, global_step=1730.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  73%|███████▎  | 884/1208 [25:02<09:10,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000436, train/loss_step=0.132, global_step=1730.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  73%|███████▎  | 885/1208 [25:03<09:08,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000436, train/loss_step=0.132, global_step=1730.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  73%|███████▎  | 885/1208 [25:03<09:08,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.98e-5, train/loss_step=0.019, global_step=1731.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  73%|███████▎  | 886/1208 [25:04<09:06,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.98e-5, train/loss_step=0.019, global_step=1731.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  73%|███████▎  | 886/1208 [25:04<09:06,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0596, train/loss_vlb_step=0.000206, train/loss_step=0.0596, global_step=1731.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  73%|███████▎  | 887/1208 [25:05<09:04,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0596, train/loss_vlb_step=0.000206, train/loss_step=0.0596, global_step=1731.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  73%|███████▎  | 887/1208 [25:05<09:04,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0472, train/loss_vlb_step=0.000171, train/loss_step=0.0472, global_step=1731.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  74%|███████▎  | 888/1208 [25:09<09:03,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0472, train/loss_vlb_step=0.000171, train/loss_step=0.0472, global_step=1731.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  74%|███████▎  | 888/1208 [25:09<09:03,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.00018, train/loss_step=0.0524, global_step=1731.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  74%|███████▎  | 889/1208 [25:10<09:01,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.00018, train/loss_step=0.0524, global_step=1731.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  74%|███████▎  | 889/1208 [25:10<09:01,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.582, train/loss_vlb_step=0.0163, train/loss_step=0.582, global_step=1732.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  74%|███████▎  | 890/1208 [25:11<08:59,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.582, train/loss_vlb_step=0.0163, train/loss_step=0.582, global_step=1732.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  74%|███████▎  | 890/1208 [25:11<08:59,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=1.49e-5, train/loss_step=0.00256, global_step=1732.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  74%|███████▍  | 891/1208 [25:12<08:58,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=1.49e-5, train/loss_step=0.00256, global_step=1732.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  74%|███████▍  | 891/1208 [25:12<08:58,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000468, train/loss_step=0.142, global_step=1732.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  74%|███████▍  | 892/1208 [25:15<08:56,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000468, train/loss_step=0.142, global_step=1732.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  74%|███████▍  | 892/1208 [25:15<08:56,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000794, train/loss_step=0.217, global_step=1732.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  74%|███████▍  | 893/1208 [25:16<08:54,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000794, train/loss_step=0.217, global_step=1732.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  74%|███████▍  | 893/1208 [25:16<08:54,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0509, train/loss_vlb_step=0.000181, train/loss_step=0.0509, global_step=1733.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  74%|███████▍  | 894/1208 [25:17<08:53,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0509, train/loss_vlb_step=0.000181, train/loss_step=0.0509, global_step=1733.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  74%|███████▍  | 894/1208 [25:17<08:53,  1.70s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.36e-5, train/loss_step=0.0207, global_step=1733.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  74%|███████▍  | 895/1208 [25:18<08:51,  1.70s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.36e-5, train/loss_step=0.0207, global_step=1733.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  74%|███████▍  | 895/1208 [25:18<08:51,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00389, train/loss_vlb_step=2.09e-5, train/loss_step=0.00389, global_step=1733.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  74%|███████▍  | 896/1208 [25:21<08:49,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00389, train/loss_vlb_step=2.09e-5, train/loss_step=0.00389, global_step=1733.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  74%|███████▍  | 896/1208 [25:21<08:49,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=4.88e-5, train/loss_step=0.0111, global_step=1733.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  74%|███████▍  | 897/1208 [25:22<08:48,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=4.88e-5, train/loss_step=0.0111, global_step=1733.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  74%|███████▍  | 897/1208 [25:22<08:48,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=1734.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  74%|███████▍  | 898/1208 [25:23<08:46,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=1734.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  74%|███████▍  | 898/1208 [25:23<08:46,  1.70s/it, loss=0.107, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000397, train/loss_step=0.119, global_step=1734.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  74%|███████▍  | 899/1208 [25:25<08:44,  1.70s/it, loss=0.107, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000397, train/loss_step=0.119, global_step=1734.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  74%|███████▍  | 899/1208 [25:25<08:44,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=1734.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  75%|███████▍  | 900/1208 [25:28<08:43,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=1734.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  75%|███████▍  | 900/1208 [25:28<08:43,  1.70s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.00337, train/loss_vlb_step=1.9e-5, train/loss_step=0.00337, global_step=1734.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.74it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.75it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.74it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.75it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.76it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.76it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.83it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.76it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.83it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.75it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.75it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.75it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 5:  75%|███████▍  | 901/1208 [25:58<08:51,  1.73s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.00337, train/loss_vlb_step=1.9e-5, train/loss_step=0.00337, global_step=1734.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  75%|███████▍  | 901/1208 [25:58<08:51,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000647, train/loss_step=0.184, global_step=1735.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  75%|███████▍  | 902/1208 [25:59<08:49,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000647, train/loss_step=0.184, global_step=1735.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  75%|███████▍  | 902/1208 [25:59<08:49,  1.73s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.81e-5, train/loss_step=0.0156, global_step=1735.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  75%|███████▍  | 903/1208 [26:00<08:47,  1.73s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.81e-5, train/loss_step=0.0156, global_step=1735.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  75%|███████▍  | 903/1208 [26:00<08:47,  1.73s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.0814, train/loss_vlb_step=0.000272, train/loss_step=0.0814, global_step=1735.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  75%|███████▍  | 904/1208 [26:04<08:45,  1.73s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.0814, train/loss_vlb_step=0.000272, train/loss_step=0.0814, global_step=1735.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  75%|███████▍  | 904/1208 [26:04<08:45,  1.73s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000472, train/loss_step=0.140, global_step=1735.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  75%|███████▍  | 905/1208 [26:05<08:44,  1.73s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000472, train/loss_step=0.140, global_step=1735.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  75%|███████▍  | 905/1208 [26:05<08:44,  1.73s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.57e-5, train/loss_step=0.0125, global_step=1736.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  75%|███████▌  | 906/1208 [26:06<08:42,  1.73s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.57e-5, train/loss_step=0.0125, global_step=1736.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  75%|███████▌  | 906/1208 [26:06<08:42,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=1736.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  75%|███████▌  | 907/1208 [26:07<08:40,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=1736.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  75%|███████▌  | 907/1208 [26:07<08:40,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.681, train/loss_vlb_step=0.0201, train/loss_step=0.681, global_step=1736.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  75%|███████▌  | 908/1208 [26:10<08:38,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.681, train/loss_vlb_step=0.0201, train/loss_step=0.681, global_step=1736.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  75%|███████▌  | 908/1208 [26:10<08:38,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.0018, train/loss_step=0.313, global_step=1736.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  75%|███████▌  | 909/1208 [26:11<08:36,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.0018, train/loss_step=0.313, global_step=1736.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  75%|███████▌  | 909/1208 [26:11<08:36,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0686, train/loss_vlb_step=0.000232, train/loss_step=0.0686, global_step=1737.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  75%|███████▌  | 910/1208 [26:12<08:35,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0686, train/loss_vlb_step=0.000232, train/loss_step=0.0686, global_step=1737.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  75%|███████▌  | 910/1208 [26:12<08:35,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000422, train/loss_step=0.128, global_step=1737.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  75%|███████▌  | 911/1208 [26:13<08:33,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000422, train/loss_step=0.128, global_step=1737.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  75%|███████▌  | 911/1208 [26:13<08:33,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.099, train/loss_vlb_step=0.00033, train/loss_step=0.099, global_step=1737.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  75%|███████▌  | 912/1208 [26:16<08:31,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.099, train/loss_vlb_step=0.00033, train/loss_step=0.099, global_step=1737.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  75%|███████▌  | 912/1208 [26:16<08:31,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.536, train/loss_vlb_step=0.0067, train/loss_step=0.536, global_step=1737.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  76%|███████▌  | 913/1208 [26:17<08:29,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.536, train/loss_vlb_step=0.0067, train/loss_step=0.536, global_step=1737.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  76%|███████▌  | 913/1208 [26:17<08:29,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000658, train/loss_step=0.188, global_step=1738.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  76%|███████▌  | 914/1208 [26:19<08:27,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000658, train/loss_step=0.188, global_step=1738.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  76%|███████▌  | 914/1208 [26:19<08:27,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=9.34e-5, train/loss_step=0.0244, global_step=1738.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  76%|███████▌  | 915/1208 [26:20<08:25,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=9.34e-5, train/loss_step=0.0244, global_step=1738.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  76%|███████▌  | 915/1208 [26:20<08:25,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=2.47e-5, train/loss_step=0.00448, global_step=1738.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  76%|███████▌  | 916/1208 [26:23<08:24,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=2.47e-5, train/loss_step=0.00448, global_step=1738.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  76%|███████▌  | 916/1208 [26:23<08:24,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000449, train/loss_step=0.134, global_step=1738.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  76%|███████▌  | 917/1208 [26:24<08:22,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000449, train/loss_step=0.134, global_step=1738.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  76%|███████▌  | 917/1208 [26:24<08:22,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0611, train/loss_vlb_step=0.000214, train/loss_step=0.0611, global_step=1739.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  76%|███████▌  | 918/1208 [26:25<08:20,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0611, train/loss_vlb_step=0.000214, train/loss_step=0.0611, global_step=1739.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  76%|███████▌  | 918/1208 [26:25<08:20,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000741, train/loss_step=0.189, global_step=1739.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  76%|███████▌  | 919/1208 [26:26<08:18,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000741, train/loss_step=0.189, global_step=1739.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  76%|███████▌  | 919/1208 [26:26<08:18,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0652, train/loss_vlb_step=0.000222, train/loss_step=0.0652, global_step=1739.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  76%|███████▌  | 920/1208 [26:29<08:17,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0652, train/loss_vlb_step=0.000222, train/loss_step=0.0652, global_step=1739.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  76%|███████▌  | 920/1208 [26:29<08:17,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.67e-5, train/loss_step=0.0232, global_step=1739.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  76%|███████▌  | 921/1208 [26:30<08:15,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.67e-5, train/loss_step=0.0232, global_step=1739.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  76%|███████▌  | 921/1208 [26:30<08:15,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0094, train/loss_vlb_step=4.51e-5, train/loss_step=0.0094, global_step=1740.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  76%|███████▋  | 922/1208 [26:31<08:13,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0094, train/loss_vlb_step=4.51e-5, train/loss_step=0.0094, global_step=1740.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  76%|███████▋  | 922/1208 [26:31<08:13,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.000168, train/loss_step=0.0462, global_step=1740.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  76%|███████▋  | 923/1208 [26:32<08:11,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.000168, train/loss_step=0.0462, global_step=1740.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  76%|███████▋  | 923/1208 [26:32<08:11,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000403, train/loss_step=0.123, global_step=1740.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  76%|███████▋  | 924/1208 [26:36<08:10,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000403, train/loss_step=0.123, global_step=1740.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  76%|███████▋  | 924/1208 [26:36<08:10,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000132, train/loss_step=0.0346, global_step=1740.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  77%|███████▋  | 925/1208 [26:37<08:08,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000132, train/loss_step=0.0346, global_step=1740.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  77%|███████▋  | 925/1208 [26:37<08:08,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=7e-5, train/loss_step=0.0156, global_step=1741.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  77%|███████▋  | 926/1208 [26:38<08:06,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=7e-5, train/loss_step=0.0156, global_step=1741.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  77%|███████▋  | 926/1208 [26:38<08:06,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0465, train/loss_vlb_step=0.00016, train/loss_step=0.0465, global_step=1741.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  77%|███████▋  | 927/1208 [26:39<08:04,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0465, train/loss_vlb_step=0.00016, train/loss_step=0.0465, global_step=1741.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  77%|███████▋  | 927/1208 [26:39<08:04,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=8.06e-5, train/loss_step=0.0188, global_step=1741.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  77%|███████▋  | 928/1208 [26:42<08:03,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=8.06e-5, train/loss_step=0.0188, global_step=1741.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  77%|███████▋  | 928/1208 [26:42<08:03,  1.73s/it, loss=0.107, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00189, train/loss_step=0.328, global_step=1741.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  77%|███████▋  | 929/1208 [26:43<08:01,  1.73s/it, loss=0.107, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00189, train/loss_step=0.328, global_step=1741.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  77%|███████▋  | 929/1208 [26:43<08:01,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000589, train/loss_step=0.175, global_step=1742.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  77%|███████▋  | 930/1208 [26:44<07:59,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000589, train/loss_step=0.175, global_step=1742.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  77%|███████▋  | 930/1208 [26:44<07:59,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0846, train/loss_vlb_step=0.00028, train/loss_step=0.0846, global_step=1742.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  77%|███████▋  | 931/1208 [26:45<07:57,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0846, train/loss_vlb_step=0.00028, train/loss_step=0.0846, global_step=1742.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  77%|███████▋  | 931/1208 [26:45<07:57,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.590, train/loss_vlb_step=0.00799, train/loss_step=0.590, global_step=1742.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  77%|███████▋  | 932/1208 [26:48<07:56,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.590, train/loss_vlb_step=0.00799, train/loss_step=0.590, global_step=1742.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  77%|███████▋  | 932/1208 [26:48<07:56,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00114, train/loss_step=0.260, global_step=1742.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  77%|███████▋  | 933/1208 [26:49<07:54,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00114, train/loss_step=0.260, global_step=1742.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  77%|███████▋  | 933/1208 [26:49<07:54,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000885, train/loss_step=0.232, global_step=1743.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  77%|███████▋  | 934/1208 [26:50<07:52,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000885, train/loss_step=0.232, global_step=1743.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  77%|███████▋  | 934/1208 [26:50<07:52,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00107, train/loss_step=0.263, global_step=1743.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  77%|███████▋  | 935/1208 [26:51<07:50,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00107, train/loss_step=0.263, global_step=1743.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  77%|███████▋  | 935/1208 [26:51<07:50,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0429, train/loss_vlb_step=0.000159, train/loss_step=0.0429, global_step=1743.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  77%|███████▋  | 936/1208 [26:55<07:49,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0429, train/loss_vlb_step=0.000159, train/loss_step=0.0429, global_step=1743.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  77%|███████▋  | 936/1208 [26:55<07:49,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000697, train/loss_step=0.194, global_step=1743.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  78%|███████▊  | 937/1208 [26:56<07:47,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000697, train/loss_step=0.194, global_step=1743.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  78%|███████▊  | 937/1208 [26:56<07:47,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=2.62e-5, train/loss_step=0.00495, global_step=1744.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  78%|███████▊  | 938/1208 [26:57<07:45,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=2.62e-5, train/loss_step=0.00495, global_step=1744.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  78%|███████▊  | 938/1208 [26:57<07:45,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.455, train/loss_vlb_step=0.00707, train/loss_step=0.455, global_step=1744.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  78%|███████▊  | 939/1208 [26:58<07:43,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.455, train/loss_vlb_step=0.00707, train/loss_step=0.455, global_step=1744.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  78%|███████▊  | 939/1208 [26:58<07:43,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000544, train/loss_step=0.160, global_step=1744.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  78%|███████▊  | 940/1208 [27:01<07:42,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000544, train/loss_step=0.160, global_step=1744.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  78%|███████▊  | 940/1208 [27:01<07:42,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0845, train/loss_vlb_step=0.00028, train/loss_step=0.0845, global_step=1744.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  78%|███████▊  | 941/1208 [27:02<07:40,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0845, train/loss_vlb_step=0.00028, train/loss_step=0.0845, global_step=1744.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  78%|███████▊  | 941/1208 [27:02<07:40,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.421, train/loss_vlb_step=0.00293, train/loss_step=0.421, global_step=1745.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  78%|███████▊  | 942/1208 [27:03<07:38,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.421, train/loss_vlb_step=0.00293, train/loss_step=0.421, global_step=1745.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  78%|███████▊  | 942/1208 [27:03<07:38,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0774, train/loss_vlb_step=0.000254, train/loss_step=0.0774, global_step=1745.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  78%|███████▊  | 943/1208 [27:04<07:36,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0774, train/loss_vlb_step=0.000254, train/loss_step=0.0774, global_step=1745.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  78%|███████▊  | 943/1208 [27:04<07:36,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=1.53e-5, train/loss_step=0.00262, global_step=1745.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  78%|███████▊  | 944/1208 [27:08<07:35,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=1.53e-5, train/loss_step=0.00262, global_step=1745.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  78%|███████▊  | 944/1208 [27:08<07:35,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000593, train/loss_step=0.174, global_step=1745.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  78%|███████▊  | 945/1208 [27:09<07:33,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000593, train/loss_step=0.174, global_step=1745.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  78%|███████▊  | 945/1208 [27:09<07:33,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00535, train/loss_vlb_step=2.84e-5, train/loss_step=0.00535, global_step=1746.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  78%|███████▊  | 946/1208 [27:10<07:31,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00535, train/loss_vlb_step=2.84e-5, train/loss_step=0.00535, global_step=1746.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  78%|███████▊  | 946/1208 [27:10<07:31,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000666, train/loss_step=0.181, global_step=1746.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  78%|███████▊  | 947/1208 [27:11<07:29,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000666, train/loss_step=0.181, global_step=1746.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  78%|███████▊  | 947/1208 [27:11<07:29,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.00011, train/loss_step=0.0292, global_step=1746.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  78%|███████▊  | 948/1208 [27:14<07:28,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.00011, train/loss_step=0.0292, global_step=1746.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  78%|███████▊  | 948/1208 [27:14<07:28,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000117, train/loss_step=0.0299, global_step=1746.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  79%|███████▊  | 949/1208 [27:15<07:26,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000117, train/loss_step=0.0299, global_step=1746.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  79%|███████▊  | 949/1208 [27:15<07:26,  1.72s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.34e-5, train/loss_step=0.00233, global_step=1747.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  79%|███████▊  | 950/1208 [27:16<07:24,  1.72s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.34e-5, train/loss_step=0.00233, global_step=1747.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  79%|███████▊  | 950/1208 [27:16<07:24,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=7.9e-5, train/loss_step=0.0192, global_step=1747.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  79%|███████▊  | 951/1208 [27:17<07:22,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=7.9e-5, train/loss_step=0.0192, global_step=1747.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  79%|███████▊  | 951/1208 [27:17<07:22,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.52e-5, train/loss_step=0.0114, global_step=1747.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  79%|███████▉  | 952/1208 [27:20<07:21,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.52e-5, train/loss_step=0.0114, global_step=1747.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  79%|███████▉  | 952/1208 [27:20<07:21,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000682, train/loss_step=0.197, global_step=1747.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  79%|███████▉  | 953/1208 [27:21<07:19,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000682, train/loss_step=0.197, global_step=1747.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  79%|███████▉  | 953/1208 [27:21<07:19,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=8.11e-5, train/loss_step=0.0192, global_step=1748.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  79%|███████▉  | 954/1208 [27:22<07:17,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=8.11e-5, train/loss_step=0.0192, global_step=1748.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  79%|███████▉  | 954/1208 [27:22<07:17,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00173, train/loss_step=0.312, global_step=1748.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  79%|███████▉  | 955/1208 [27:24<07:15,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00173, train/loss_step=0.312, global_step=1748.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  79%|███████▉  | 955/1208 [27:24<07:15,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0583, train/loss_vlb_step=0.000207, train/loss_step=0.0583, global_step=1748.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  79%|███████▉  | 956/1208 [27:27<07:14,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0583, train/loss_vlb_step=0.000207, train/loss_step=0.0583, global_step=1748.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  79%|███████▉  | 956/1208 [27:27<07:14,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000372, train/loss_step=0.112, global_step=1748.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  79%|███████▉  | 957/1208 [27:28<07:12,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000372, train/loss_step=0.112, global_step=1748.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  79%|███████▉  | 957/1208 [27:28<07:12,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000495, train/loss_step=0.148, global_step=1749.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  79%|███████▉  | 958/1208 [27:29<07:10,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000495, train/loss_step=0.148, global_step=1749.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  79%|███████▉  | 958/1208 [27:29<07:10,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.66e-5, train/loss_step=0.016, global_step=1749.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  79%|███████▉  | 959/1208 [27:30<07:08,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.66e-5, train/loss_step=0.016, global_step=1749.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  79%|███████▉  | 959/1208 [27:30<07:08,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.0018, train/loss_step=0.334, global_step=1749.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  79%|███████▉  | 960/1208 [27:33<07:07,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.0018, train/loss_step=0.334, global_step=1749.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  79%|███████▉  | 960/1208 [27:33<07:07,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.74e-5, train/loss_step=0.0155, global_step=1749.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  80%|███████▉  | 961/1208 [27:34<07:05,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.74e-5, train/loss_step=0.0155, global_step=1749.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  80%|███████▉  | 961/1208 [27:34<07:05,  1.72s/it, loss=0.0879, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.74e-5, train/loss_step=0.0132, global_step=1750.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  80%|███████▉  | 962/1208 [27:35<07:03,  1.72s/it, loss=0.0879, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.74e-5, train/loss_step=0.0132, global_step=1750.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  80%|███████▉  | 962/1208 [27:35<07:03,  1.72s/it, loss=0.0842, v_num=0, train/loss_simple_step=0.00318, train/loss_vlb_step=1.78e-5, train/loss_step=0.00318, global_step=1750.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  80%|███████▉  | 963/1208 [27:36<07:01,  1.72s/it, loss=0.0842, v_num=0, train/loss_simple_step=0.00318, train/loss_vlb_step=1.78e-5, train/loss_step=0.00318, global_step=1750.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  80%|███████▉  | 963/1208 [27:36<07:01,  1.72s/it, loss=0.0845, v_num=0, train/loss_simple_step=0.00772, train/loss_vlb_step=3.79e-5, train/loss_step=0.00772, global_step=1750.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  80%|███████▉  | 964/1208 [27:40<07:00,  1.72s/it, loss=0.0845, v_num=0, train/loss_simple_step=0.00772, train/loss_vlb_step=3.79e-5, train/loss_step=0.00772, global_step=1750.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  80%|███████▉  | 964/1208 [27:40<07:00,  1.72s/it, loss=0.076, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=2.47e-5, train/loss_step=0.00471, global_step=1750.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  80%|███████▉  | 965/1208 [27:41<06:58,  1.72s/it, loss=0.076, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=2.47e-5, train/loss_step=0.00471, global_step=1750.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  80%|███████▉  | 965/1208 [27:41<06:58,  1.72s/it, loss=0.0806, v_num=0, train/loss_simple_step=0.0971, train/loss_vlb_step=0.000319, train/loss_step=0.0971, global_step=1751.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  80%|███████▉  | 966/1208 [27:42<06:56,  1.72s/it, loss=0.0806, v_num=0, train/loss_simple_step=0.0971, train/loss_vlb_step=0.000319, train/loss_step=0.0971, global_step=1751.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  80%|███████▉  | 966/1208 [27:42<06:56,  1.72s/it, loss=0.0731, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.000121, train/loss_step=0.0312, global_step=1751.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  80%|████████  | 967/1208 [27:43<06:54,  1.72s/it, loss=0.0731, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.000121, train/loss_step=0.0312, global_step=1751.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  80%|████████  | 967/1208 [27:43<06:54,  1.72s/it, loss=0.0912, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00361, train/loss_step=0.392, global_step=1751.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  80%|████████  | 968/1208 [27:46<06:53,  1.72s/it, loss=0.0912, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00361, train/loss_step=0.392, global_step=1751.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  80%|████████  | 968/1208 [27:46<06:53,  1.72s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.0247, train/loss_vlb_step=0.000101, train/loss_step=0.0247, global_step=1751.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  80%|████████  | 969/1208 [27:47<06:51,  1.72s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.0247, train/loss_vlb_step=0.000101, train/loss_step=0.0247, global_step=1751.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  80%|████████  | 969/1208 [27:47<06:51,  1.72s/it, loss=0.091, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.72e-5, train/loss_step=0.00299, global_step=1752.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  80%|████████  | 970/1208 [27:48<06:49,  1.72s/it, loss=0.091, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.72e-5, train/loss_step=0.00299, global_step=1752.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  80%|████████  | 970/1208 [27:48<06:49,  1.72s/it, loss=0.0901, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=1.57e-5, train/loss_step=0.00262, global_step=1752.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  80%|████████  | 971/1208 [27:49<06:47,  1.72s/it, loss=0.0901, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=1.57e-5, train/loss_step=0.00262, global_step=1752.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  80%|████████  | 971/1208 [27:49<06:47,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00454, train/loss_step=0.404, global_step=1752.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]      Epoch 5:  80%|████████  | 972/1208 [27:52<06:46,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00454, train/loss_step=0.404, global_step=1752.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  80%|████████  | 972/1208 [27:52<06:46,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.00011, train/loss_step=0.0284, global_step=1752.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  81%|████████  | 973/1208 [27:53<06:44,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.00011, train/loss_step=0.0284, global_step=1752.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  81%|████████  | 973/1208 [27:53<06:44,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00322, train/loss_step=0.425, global_step=1753.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  81%|████████  | 974/1208 [27:54<06:42,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00322, train/loss_step=0.425, global_step=1753.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  81%|████████  | 974/1208 [27:54<06:42,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=2.09e-5, train/loss_step=0.00388, global_step=1753.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  81%|████████  | 975/1208 [27:55<06:40,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=2.09e-5, train/loss_step=0.00388, global_step=1753.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  81%|████████  | 975/1208 [27:55<06:40,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=1753.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  81%|████████  | 976/1208 [27:59<06:39,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=1753.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  81%|████████  | 976/1208 [27:59<06:39,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00143, train/loss_step=0.295, global_step=1753.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  81%|████████  | 977/1208 [28:00<06:37,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00143, train/loss_step=0.295, global_step=1753.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  81%|████████  | 977/1208 [28:00<06:37,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=8.12e-5, train/loss_step=0.0189, global_step=1754.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  81%|████████  | 978/1208 [28:01<06:35,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=8.12e-5, train/loss_step=0.0189, global_step=1754.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  81%|████████  | 978/1208 [28:01<06:35,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000865, train/loss_step=0.209, global_step=1754.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  81%|████████  | 979/1208 [28:02<06:33,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000865, train/loss_step=0.209, global_step=1754.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  81%|████████  | 979/1208 [28:02<06:33,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=6.07e-5, train/loss_step=0.013, global_step=1754.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  81%|████████  | 980/1208 [28:05<06:32,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=6.07e-5, train/loss_step=0.013, global_step=1754.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  81%|████████  | 980/1208 [28:05<06:32,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.061, train/loss_vlb_step=0.00021, train/loss_step=0.061, global_step=1754.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  81%|████████  | 981/1208 [28:06<06:30,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.061, train/loss_vlb_step=0.00021, train/loss_step=0.061, global_step=1754.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  81%|████████  | 981/1208 [28:06<06:30,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.41e-5, train/loss_step=0.00236, global_step=1755.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  81%|████████▏ | 982/1208 [28:07<06:28,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.41e-5, train/loss_step=0.00236, global_step=1755.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  81%|████████▏ | 982/1208 [28:07<06:28,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00219, train/loss_step=0.342, global_step=1755.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  81%|████████▏ | 983/1208 [28:08<06:26,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00219, train/loss_step=0.342, global_step=1755.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  81%|████████▏ | 983/1208 [28:08<06:26,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.099, train/loss_vlb_step=0.000327, train/loss_step=0.099, global_step=1755.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  81%|████████▏ | 984/1208 [28:11<06:25,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.099, train/loss_vlb_step=0.000327, train/loss_step=0.099, global_step=1755.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  81%|████████▏ | 984/1208 [28:11<06:25,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.609, train/loss_vlb_step=0.0132, train/loss_step=0.609, global_step=1755.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  82%|████████▏ | 985/1208 [28:13<06:23,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.609, train/loss_vlb_step=0.0132, train/loss_step=0.609, global_step=1755.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  82%|████████▏ | 985/1208 [28:13<06:23,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0703, train/loss_vlb_step=0.00024, train/loss_step=0.0703, global_step=1756.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  82%|████████▏ | 986/1208 [28:14<06:21,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0703, train/loss_vlb_step=0.00024, train/loss_step=0.0703, global_step=1756.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  82%|████████▏ | 986/1208 [28:14<06:21,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000124, train/loss_step=0.031, global_step=1756.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  82%|████████▏ | 987/1208 [28:15<06:19,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000124, train/loss_step=0.031, global_step=1756.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  82%|████████▏ | 987/1208 [28:15<06:19,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00262, train/loss_step=0.368, global_step=1756.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  82%|████████▏ | 988/1208 [28:18<06:18,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00262, train/loss_step=0.368, global_step=1756.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  82%|████████▏ | 988/1208 [28:18<06:18,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=2.11e-5, train/loss_step=0.00381, global_step=1756.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  82%|████████▏ | 989/1208 [28:19<06:16,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=2.11e-5, train/loss_step=0.00381, global_step=1756.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  82%|████████▏ | 989/1208 [28:19<06:16,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.94e-5, train/loss_step=0.0131, global_step=1757.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  82%|████████▏ | 990/1208 [28:20<06:14,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.94e-5, train/loss_step=0.0131, global_step=1757.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  82%|████████▏ | 990/1208 [28:20<06:14,  1.72s/it, loss=0.18, v_num=0, train/loss_simple_step=0.497, train/loss_vlb_step=0.00835, train/loss_step=0.497, global_step=1757.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  82%|████████▏ | 991/1208 [28:21<06:12,  1.72s/it, loss=0.18, v_num=0, train/loss_simple_step=0.497, train/loss_vlb_step=0.00835, train/loss_step=0.497, global_step=1757.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  82%|████████▏ | 991/1208 [28:21<06:12,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00612, train/loss_vlb_step=3.22e-5, train/loss_step=0.00612, global_step=1757.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  82%|████████▏ | 992/1208 [28:24<06:11,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00612, train/loss_vlb_step=3.22e-5, train/loss_step=0.00612, global_step=1757.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  82%|████████▏ | 992/1208 [28:24<06:11,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00273, train/loss_step=0.442, global_step=1757.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  82%|████████▏ | 993/1208 [28:25<06:09,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00273, train/loss_step=0.442, global_step=1757.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  82%|████████▏ | 993/1208 [28:25<06:09,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=1758.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  82%|████████▏ | 994/1208 [28:26<06:07,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=1758.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  82%|████████▏ | 994/1208 [28:26<06:07,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000495, train/loss_step=0.146, global_step=1758.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  82%|████████▏ | 995/1208 [28:27<06:05,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000495, train/loss_step=0.146, global_step=1758.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  82%|████████▏ | 995/1208 [28:27<06:05,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=7.5e-5, train/loss_step=0.0195, global_step=1758.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  82%|████████▏ | 996/1208 [28:31<06:04,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=7.5e-5, train/loss_step=0.0195, global_step=1758.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  82%|████████▏ | 996/1208 [28:31<06:04,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0789, train/loss_vlb_step=0.000263, train/loss_step=0.0789, global_step=1758.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  83%|████████▎ | 997/1208 [28:32<06:02,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0789, train/loss_vlb_step=0.000263, train/loss_step=0.0789, global_step=1758.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  83%|████████▎ | 997/1208 [28:32<06:02,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=0.000106, train/loss_step=0.0259, global_step=1759.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  83%|████████▎ | 998/1208 [28:33<06:00,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=0.000106, train/loss_step=0.0259, global_step=1759.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  83%|████████▎ | 998/1208 [28:33<06:00,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0981, train/loss_vlb_step=0.000325, train/loss_step=0.0981, global_step=1759.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  83%|████████▎ | 999/1208 [28:34<05:58,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0981, train/loss_vlb_step=0.000325, train/loss_step=0.0981, global_step=1759.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  83%|████████▎ | 999/1208 [28:34<05:58,  1.72s/it, loss=0.165, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00121, train/loss_step=0.269, global_step=1759.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  83%|████████▎ | 1000/1208 [28:37<05:57,  1.72s/it, loss=0.165, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00121, train/loss_step=0.269, global_step=1759.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  83%|████████▎ | 1000/1208 [28:37<05:57,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0247, train/loss_vlb_step=0.000102, train/loss_step=0.0247, global_step=1759.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  83%|████████▎ | 1001/1208 [28:38<05:55,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0247, train/loss_vlb_step=0.000102, train/loss_step=0.0247, global_step=1759.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  83%|████████▎ | 1001/1208 [28:38<05:55,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.91e-5, train/loss_step=0.0127, global_step=1760.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  83%|████████▎ | 1002/1208 [28:39<05:53,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.91e-5, train/loss_step=0.0127, global_step=1760.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  83%|████████▎ | 1002/1208 [28:39<05:53,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=1.35e-5, train/loss_step=0.00223, global_step=1760.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  83%|████████▎ | 1003/1208 [28:40<05:51,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=1.35e-5, train/loss_step=0.00223, global_step=1760.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  83%|████████▎ | 1003/1208 [28:40<05:51,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00729, train/loss_vlb_step=3.56e-5, train/loss_step=0.00729, global_step=1760.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  83%|████████▎ | 1004/1208 [28:43<05:50,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00729, train/loss_vlb_step=3.56e-5, train/loss_step=0.00729, global_step=1760.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  83%|████████▎ | 1004/1208 [28:43<05:50,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.00075, train/loss_step=0.205, global_step=1760.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  83%|████████▎ | 1005/1208 [28:44<05:48,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.00075, train/loss_step=0.205, global_step=1760.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  83%|████████▎ | 1005/1208 [28:44<05:48,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.99e-5, train/loss_step=0.0136, global_step=1761.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  83%|████████▎ | 1006/1208 [28:46<05:46,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.99e-5, train/loss_step=0.0136, global_step=1761.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  83%|████████▎ | 1006/1208 [28:46<05:46,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0398, train/loss_vlb_step=0.000147, train/loss_step=0.0398, global_step=1761.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  83%|████████▎ | 1007/1208 [28:47<05:44,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0398, train/loss_vlb_step=0.000147, train/loss_step=0.0398, global_step=1761.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  83%|████████▎ | 1007/1208 [28:47<05:44,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=6.18e-5, train/loss_step=0.0133, global_step=1761.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  83%|████████▎ | 1008/1208 [28:50<05:43,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=6.18e-5, train/loss_step=0.0133, global_step=1761.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  83%|████████▎ | 1008/1208 [28:50<05:43,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000717, train/loss_step=0.201, global_step=1761.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  84%|████████▎ | 1009/1208 [28:51<05:41,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000717, train/loss_step=0.201, global_step=1761.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  84%|████████▎ | 1009/1208 [28:51<05:41,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00301, train/loss_vlb_step=1.68e-5, train/loss_step=0.00301, global_step=1762.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  84%|████████▎ | 1010/1208 [28:52<05:39,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00301, train/loss_vlb_step=1.68e-5, train/loss_step=0.00301, global_step=1762.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  84%|████████▎ | 1010/1208 [28:52<05:39,  1.72s/it, loss=0.0912, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.000297, train/loss_step=0.0894, global_step=1762.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  84%|████████▎ | 1011/1208 [28:53<05:37,  1.71s/it, loss=0.0912, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.000297, train/loss_step=0.0894, global_step=1762.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  84%|████████▎ | 1011/1208 [28:53<05:37,  1.71s/it, loss=0.0911, v_num=0, train/loss_simple_step=0.00556, train/loss_vlb_step=2.88e-5, train/loss_step=0.00556, global_step=1762.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  84%|████████▍ | 1012/1208 [28:56<05:36,  1.72s/it, loss=0.0911, v_num=0, train/loss_simple_step=0.00556, train/loss_vlb_step=2.88e-5, train/loss_step=0.00556, global_step=1762.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  84%|████████▍ | 1012/1208 [28:56<05:36,  1.72s/it, loss=0.0694, v_num=0, train/loss_simple_step=0.00726, train/loss_vlb_step=3.68e-5, train/loss_step=0.00726, global_step=1762.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  84%|████████▍ | 1013/1208 [28:57<05:34,  1.72s/it, loss=0.0694, v_num=0, train/loss_simple_step=0.00726, train/loss_vlb_step=3.68e-5, train/loss_step=0.00726, global_step=1762.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  84%|████████▍ | 1013/1208 [28:57<05:34,  1.72s/it, loss=0.0634, v_num=0, train/loss_simple_step=0.00519, train/loss_vlb_step=2.82e-5, train/loss_step=0.00519, global_step=1763.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  84%|████████▍ | 1014/1208 [28:58<05:32,  1.71s/it, loss=0.0634, v_num=0, train/loss_simple_step=0.00519, train/loss_vlb_step=2.82e-5, train/loss_step=0.00519, global_step=1763.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  84%|████████▍ | 1014/1208 [28:58<05:32,  1.71s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.586, train/loss_vlb_step=0.0276, train/loss_step=0.586, global_step=1763.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]     Epoch 5:  84%|████████▍ | 1015/1208 [28:59<05:30,  1.71s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.586, train/loss_vlb_step=0.0276, train/loss_step=0.586, global_step=1763.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  84%|████████▍ | 1015/1208 [28:59<05:30,  1.71s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=7.85e-5, train/loss_step=0.0197, global_step=1763.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  84%|████████▍ | 1016/1208 [29:03<05:29,  1.72s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=7.85e-5, train/loss_step=0.0197, global_step=1763.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  84%|████████▍ | 1016/1208 [29:03<05:29,  1.72s/it, loss=0.0841, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.000186, train/loss_step=0.0537, global_step=1763.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  84%|████████▍ | 1017/1208 [29:04<05:27,  1.72s/it, loss=0.0841, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.000186, train/loss_step=0.0537, global_step=1763.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  84%|████████▍ | 1017/1208 [29:04<05:27,  1.72s/it, loss=0.083, v_num=0, train/loss_simple_step=0.004, train/loss_vlb_step=2.18e-5, train/loss_step=0.004, global_step=1764.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  84%|████████▍ | 1018/1208 [29:05<05:25,  1.71s/it, loss=0.083, v_num=0, train/loss_simple_step=0.004, train/loss_vlb_step=2.18e-5, train/loss_step=0.004, global_step=1764.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  84%|████████▍ | 1018/1208 [29:05<05:25,  1.71s/it, loss=0.0785, v_num=0, train/loss_simple_step=0.00676, train/loss_vlb_step=3.42e-5, train/loss_step=0.00676, global_step=1764.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  84%|████████▍ | 1019/1208 [29:06<05:23,  1.71s/it, loss=0.0785, v_num=0, train/loss_simple_step=0.00676, train/loss_vlb_step=3.42e-5, train/loss_step=0.00676, global_step=1764.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  84%|████████▍ | 1019/1208 [29:06<05:23,  1.71s/it, loss=0.0678, v_num=0, train/loss_simple_step=0.0561, train/loss_vlb_step=0.000197, train/loss_step=0.0561, global_step=1764.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  84%|████████▍ | 1020/1208 [29:09<05:22,  1.72s/it, loss=0.0678, v_num=0, train/loss_simple_step=0.0561, train/loss_vlb_step=0.000197, train/loss_step=0.0561, global_step=1764.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  84%|████████▍ | 1020/1208 [29:09<05:22,  1.72s/it, loss=0.0805, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00119, train/loss_step=0.279, global_step=1764.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  85%|████████▍ | 1021/1208 [29:10<05:20,  1.71s/it, loss=0.0805, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00119, train/loss_step=0.279, global_step=1764.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  85%|████████▍ | 1021/1208 [29:10<05:20,  1.71s/it, loss=0.0818, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.000141, train/loss_step=0.0395, global_step=1765.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  85%|████████▍ | 1022/1208 [29:11<05:18,  1.71s/it, loss=0.0818, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.000141, train/loss_step=0.0395, global_step=1765.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  85%|████████▍ | 1022/1208 [29:11<05:18,  1.71s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00159, train/loss_step=0.333, global_step=1765.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  85%|████████▍ | 1023/1208 [29:12<05:16,  1.71s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00159, train/loss_step=0.333, global_step=1765.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  85%|████████▍ | 1023/1208 [29:12<05:16,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00131, train/loss_step=0.299, global_step=1765.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  85%|████████▍ | 1024/1208 [29:15<05:15,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00131, train/loss_step=0.299, global_step=1765.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  85%|████████▍ | 1024/1208 [29:15<05:15,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0881, train/loss_vlb_step=0.000291, train/loss_step=0.0881, global_step=1765.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  85%|████████▍ | 1025/1208 [29:16<05:13,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0881, train/loss_vlb_step=0.000291, train/loss_step=0.0881, global_step=1765.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  85%|████████▍ | 1025/1208 [29:16<05:13,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.34e-5, train/loss_step=0.0114, global_step=1766.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  85%|████████▍ | 1026/1208 [29:18<05:11,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.34e-5, train/loss_step=0.0114, global_step=1766.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  85%|████████▍ | 1026/1208 [29:18<05:11,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000152, train/loss_step=0.0415, global_step=1766.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  85%|████████▌ | 1027/1208 [29:19<05:10,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000152, train/loss_step=0.0415, global_step=1766.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  85%|████████▌ | 1027/1208 [29:19<05:10,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00206, train/loss_step=0.345, global_step=1766.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  85%|████████▌ | 1028/1208 [29:22<05:08,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00206, train/loss_step=0.345, global_step=1766.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  85%|████████▌ | 1028/1208 [29:22<05:08,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00176, train/loss_step=0.313, global_step=1766.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  85%|████████▌ | 1029/1208 [29:23<05:06,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00176, train/loss_step=0.313, global_step=1766.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  85%|████████▌ | 1029/1208 [29:23<05:06,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00102, train/loss_step=0.237, global_step=1767.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  85%|████████▌ | 1030/1208 [29:24<05:04,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00102, train/loss_step=0.237, global_step=1767.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  85%|████████▌ | 1030/1208 [29:24<05:04,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00104, train/loss_step=0.267, global_step=1767.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  85%|████████▌ | 1031/1208 [29:25<05:03,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00104, train/loss_step=0.267, global_step=1767.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  85%|████████▌ | 1031/1208 [29:25<05:03,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=9.77e-5, train/loss_step=0.0253, global_step=1767.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  85%|████████▌ | 1032/1208 [29:28<05:01,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=9.77e-5, train/loss_step=0.0253, global_step=1767.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  85%|████████▌ | 1032/1208 [29:28<05:01,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00226, train/loss_step=0.346, global_step=1767.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  86%|████████▌ | 1033/1208 [29:29<04:59,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00226, train/loss_step=0.346, global_step=1767.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  86%|████████▌ | 1033/1208 [29:29<04:59,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00246, train/loss_step=0.363, global_step=1768.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  86%|████████▌ | 1034/1208 [29:30<04:57,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00246, train/loss_step=0.363, global_step=1768.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  86%|████████▌ | 1034/1208 [29:30<04:57,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000753, train/loss_step=0.200, global_step=1768.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  86%|████████▌ | 1035/1208 [29:31<04:56,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000753, train/loss_step=0.200, global_step=1768.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  86%|████████▌ | 1035/1208 [29:31<04:56,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000483, train/loss_step=0.142, global_step=1768.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  86%|████████▌ | 1036/1208 [29:35<04:54,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000483, train/loss_step=0.142, global_step=1768.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  86%|████████▌ | 1036/1208 [29:35<04:54,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00273, train/loss_step=0.374, global_step=1768.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  86%|████████▌ | 1037/1208 [29:36<04:52,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00273, train/loss_step=0.374, global_step=1768.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  86%|████████▌ | 1037/1208 [29:36<04:52,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.080, train/loss_vlb_step=0.000266, train/loss_step=0.080, global_step=1769.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  86%|████████▌ | 1038/1208 [29:37<04:51,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.080, train/loss_vlb_step=0.000266, train/loss_step=0.080, global_step=1769.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  86%|████████▌ | 1038/1208 [29:37<04:51,  1.71s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0798, train/loss_vlb_step=0.000263, train/loss_step=0.0798, global_step=1769.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  86%|████████▌ | 1039/1208 [29:38<04:49,  1.71s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0798, train/loss_vlb_step=0.000263, train/loss_step=0.0798, global_step=1769.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  86%|████████▌ | 1039/1208 [29:38<04:49,  1.71s/it, loss=0.205, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000917, train/loss_step=0.230, global_step=1769.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  86%|████████▌ | 1040/1208 [29:41<04:47,  1.71s/it, loss=0.205, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000917, train/loss_step=0.230, global_step=1769.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  86%|████████▌ | 1040/1208 [29:41<04:47,  1.71s/it, loss=0.216, v_num=0, train/loss_simple_step=0.498, train/loss_vlb_step=0.00381, train/loss_step=0.498, global_step=1769.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  86%|████████▌ | 1041/1208 [29:42<04:45,  1.71s/it, loss=0.216, v_num=0, train/loss_simple_step=0.498, train/loss_vlb_step=0.00381, train/loss_step=0.498, global_step=1769.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  86%|████████▌ | 1041/1208 [29:42<04:45,  1.71s/it, loss=0.225, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000836, train/loss_step=0.220, global_step=1770.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  86%|████████▋ | 1042/1208 [29:43<04:44,  1.71s/it, loss=0.225, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000836, train/loss_step=0.220, global_step=1770.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  86%|████████▋ | 1042/1208 [29:43<04:44,  1.71s/it, loss=0.214, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000423, train/loss_step=0.129, global_step=1770.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  86%|████████▋ | 1043/1208 [29:44<04:42,  1.71s/it, loss=0.214, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000423, train/loss_step=0.129, global_step=1770.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  86%|████████▋ | 1043/1208 [29:44<04:42,  1.71s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000116, train/loss_step=0.0308, global_step=1770.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  86%|████████▋ | 1044/1208 [29:47<04:40,  1.71s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000116, train/loss_step=0.0308, global_step=1770.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  86%|████████▋ | 1044/1208 [29:47<04:40,  1.71s/it, loss=0.214, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00237, train/loss_step=0.352, global_step=1770.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  87%|████████▋ | 1045/1208 [29:49<04:39,  1.71s/it, loss=0.214, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00237, train/loss_step=0.352, global_step=1770.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  87%|████████▋ | 1045/1208 [29:49<04:39,  1.71s/it, loss=0.221, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000493, train/loss_step=0.150, global_step=1771.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  87%|████████▋ | 1046/1208 [29:50<04:37,  1.71s/it, loss=0.221, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000493, train/loss_step=0.150, global_step=1771.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  87%|████████▋ | 1046/1208 [29:50<04:37,  1.71s/it, loss=0.219, v_num=0, train/loss_simple_step=0.00439, train/loss_vlb_step=2.37e-5, train/loss_step=0.00439, global_step=1771.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  87%|████████▋ | 1047/1208 [29:51<04:35,  1.71s/it, loss=0.219, v_num=0, train/loss_simple_step=0.00439, train/loss_vlb_step=2.37e-5, train/loss_step=0.00439, global_step=1771.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  87%|████████▋ | 1047/1208 [29:51<04:35,  1.71s/it, loss=0.202, v_num=0, train/loss_simple_step=0.00897, train/loss_vlb_step=4.04e-5, train/loss_step=0.00897, global_step=1771.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  87%|████████▋ | 1048/1208 [29:54<04:33,  1.71s/it, loss=0.202, v_num=0, train/loss_simple_step=0.00897, train/loss_vlb_step=4.04e-5, train/loss_step=0.00897, global_step=1771.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  87%|████████▋ | 1048/1208 [29:54<04:33,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000573, train/loss_step=0.163, global_step=1771.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  87%|████████▋ | 1049/1208 [29:55<04:32,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000573, train/loss_step=0.163, global_step=1771.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  87%|████████▋ | 1049/1208 [29:55<04:32,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000485, train/loss_step=0.146, global_step=1772.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  87%|████████▋ | 1050/1208 [29:56<04:30,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000485, train/loss_step=0.146, global_step=1772.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  87%|████████▋ | 1050/1208 [29:56<04:30,  1.71s/it, loss=0.193, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00152, train/loss_step=0.312, global_step=1772.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  87%|████████▋ | 1051/1208 [29:57<04:28,  1.71s/it, loss=0.193, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00152, train/loss_step=0.312, global_step=1772.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  87%|████████▋ | 1051/1208 [29:57<04:28,  1.71s/it, loss=0.209, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.00212, train/loss_step=0.360, global_step=1772.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  87%|████████▋ | 1052/1208 [30:00<04:27,  1.71s/it, loss=0.209, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.00212, train/loss_step=0.360, global_step=1772.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  87%|████████▋ | 1052/1208 [30:00<04:27,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.2e-5, train/loss_step=0.002, global_step=1772.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  87%|████████▋ | 1053/1208 [30:01<04:25,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.2e-5, train/loss_step=0.002, global_step=1772.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  87%|████████▋ | 1053/1208 [30:01<04:25,  1.71s/it, loss=0.196, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00414, train/loss_step=0.427, global_step=1773.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  87%|████████▋ | 1054/1208 [30:02<04:23,  1.71s/it, loss=0.196, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00414, train/loss_step=0.427, global_step=1773.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  87%|████████▋ | 1054/1208 [30:02<04:23,  1.71s/it, loss=0.191, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=1773.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  87%|████████▋ | 1055/1208 [30:03<04:21,  1.71s/it, loss=0.191, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=1773.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  87%|████████▋ | 1055/1208 [30:03<04:21,  1.71s/it, loss=0.204, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.0027, train/loss_step=0.404, global_step=1773.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  87%|████████▋ | 1056/1208 [30:07<04:20,  1.71s/it, loss=0.204, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.0027, train/loss_step=0.404, global_step=1773.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  87%|████████▋ | 1056/1208 [30:07<04:20,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000172, train/loss_step=0.0484, global_step=1773.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  88%|████████▊ | 1057/1208 [30:08<04:18,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000172, train/loss_step=0.0484, global_step=1773.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  88%|████████▊ | 1057/1208 [30:08<04:18,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.00108, train/loss_step=0.228, global_step=1774.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  88%|████████▊ | 1058/1208 [30:09<04:16,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.00108, train/loss_step=0.228, global_step=1774.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  88%|████████▊ | 1058/1208 [30:09<04:16,  1.71s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0531, train/loss_vlb_step=0.000194, train/loss_step=0.0531, global_step=1774.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  88%|████████▊ | 1059/1208 [30:10<04:14,  1.71s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0531, train/loss_vlb_step=0.000194, train/loss_step=0.0531, global_step=1774.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  88%|████████▊ | 1059/1208 [30:10<04:14,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00687, train/loss_vlb_step=3.31e-5, train/loss_step=0.00687, global_step=1774.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  88%|████████▊ | 1060/1208 [30:13<04:13,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00687, train/loss_vlb_step=3.31e-5, train/loss_step=0.00687, global_step=1774.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  88%|████████▊ | 1060/1208 [30:13<04:13,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.000113, train/loss_step=0.0292, global_step=1774.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  88%|████████▊ | 1061/1208 [30:14<04:11,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.000113, train/loss_step=0.0292, global_step=1774.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  88%|████████▊ | 1061/1208 [30:14<04:11,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6.21e-5, train/loss_step=0.0135, global_step=1775.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  88%|████████▊ | 1062/1208 [30:15<04:09,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6.21e-5, train/loss_step=0.0135, global_step=1775.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  88%|████████▊ | 1062/1208 [30:15<04:09,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000114, train/loss_step=0.0295, global_step=1775.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  88%|████████▊ | 1063/1208 [30:16<04:07,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000114, train/loss_step=0.0295, global_step=1775.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  88%|████████▊ | 1063/1208 [30:16<04:07,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0785, train/loss_vlb_step=0.000261, train/loss_step=0.0785, global_step=1775.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  88%|████████▊ | 1064/1208 [30:20<04:06,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0785, train/loss_vlb_step=0.000261, train/loss_step=0.0785, global_step=1775.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  88%|████████▊ | 1064/1208 [30:20<04:06,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0912, train/loss_vlb_step=0.000302, train/loss_step=0.0912, global_step=1775.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  88%|████████▊ | 1065/1208 [30:21<04:04,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0912, train/loss_vlb_step=0.000302, train/loss_step=0.0912, global_step=1775.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  88%|████████▊ | 1065/1208 [30:21<04:04,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00307, train/loss_step=0.439, global_step=1776.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  88%|████████▊ | 1066/1208 [30:22<04:02,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00307, train/loss_step=0.439, global_step=1776.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  88%|████████▊ | 1066/1208 [30:22<04:02,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=2.26e-5, train/loss_step=0.00448, global_step=1776.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  88%|████████▊ | 1067/1208 [30:23<04:00,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=2.26e-5, train/loss_step=0.00448, global_step=1776.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  88%|████████▊ | 1067/1208 [30:23<04:00,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00622, train/loss_vlb_step=3.34e-5, train/loss_step=0.00622, global_step=1776.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  88%|████████▊ | 1068/1208 [30:26<03:59,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00622, train/loss_vlb_step=3.34e-5, train/loss_step=0.00622, global_step=1776.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  88%|████████▊ | 1068/1208 [30:26<03:59,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000943, train/loss_step=0.234, global_step=1776.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  88%|████████▊ | 1069/1208 [30:27<03:57,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000943, train/loss_step=0.234, global_step=1776.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  88%|████████▊ | 1069/1208 [30:27<03:57,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.23e-5, train/loss_step=0.00204, global_step=1777.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  89%|████████▊ | 1070/1208 [30:28<03:55,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.23e-5, train/loss_step=0.00204, global_step=1777.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  89%|████████▊ | 1070/1208 [30:28<03:55,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.88e-5, train/loss_step=0.0102, global_step=1777.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  89%|████████▊ | 1071/1208 [30:29<03:54,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.88e-5, train/loss_step=0.0102, global_step=1777.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  89%|████████▊ | 1071/1208 [30:29<03:54,  1.71s/it, loss=0.112, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000101, train/loss_step=0.026, global_step=1777.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  89%|████████▊ | 1072/1208 [30:32<03:52,  1.71s/it, loss=0.112, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000101, train/loss_step=0.026, global_step=1777.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  89%|████████▊ | 1072/1208 [30:32<03:52,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=1777.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  89%|████████▉ | 1073/1208 [30:33<03:50,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=1777.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  89%|████████▉ | 1073/1208 [30:33<03:50,  1.71s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0757, train/loss_vlb_step=0.000254, train/loss_step=0.0757, global_step=1778.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  89%|████████▉ | 1074/1208 [30:34<03:48,  1.71s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0757, train/loss_vlb_step=0.000254, train/loss_step=0.0757, global_step=1778.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  89%|████████▉ | 1074/1208 [30:34<03:48,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000468, train/loss_step=0.140, global_step=1778.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  89%|████████▉ | 1075/1208 [30:35<03:47,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000468, train/loss_step=0.140, global_step=1778.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  89%|████████▉ | 1075/1208 [30:35<03:47,  1.71s/it, loss=0.099, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00214, train/loss_step=0.347, global_step=1778.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  89%|████████▉ | 1076/1208 [30:39<03:45,  1.71s/it, loss=0.099, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00214, train/loss_step=0.347, global_step=1778.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  89%|████████▉ | 1076/1208 [30:39<03:45,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000507, train/loss_step=0.154, global_step=1778.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  89%|████████▉ | 1077/1208 [30:40<03:43,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000507, train/loss_step=0.154, global_step=1778.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  89%|████████▉ | 1077/1208 [30:40<03:43,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00135, train/loss_step=0.280, global_step=1779.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  89%|████████▉ | 1078/1208 [30:41<03:42,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00135, train/loss_step=0.280, global_step=1779.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  89%|████████▉ | 1078/1208 [30:41<03:42,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00196, train/loss_step=0.354, global_step=1779.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  89%|████████▉ | 1079/1208 [30:42<03:40,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00196, train/loss_step=0.354, global_step=1779.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  89%|████████▉ | 1079/1208 [30:42<03:40,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00143, train/loss_step=0.284, global_step=1779.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  89%|████████▉ | 1080/1208 [30:45<03:38,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00143, train/loss_step=0.284, global_step=1779.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  89%|████████▉ | 1080/1208 [30:45<03:38,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0375, train/loss_vlb_step=0.000139, train/loss_step=0.0375, global_step=1779.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  89%|████████▉ | 1081/1208 [30:46<03:36,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0375, train/loss_vlb_step=0.000139, train/loss_step=0.0375, global_step=1779.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  89%|████████▉ | 1081/1208 [30:46<03:36,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00347, train/loss_step=0.348, global_step=1780.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  90%|████████▉ | 1082/1208 [30:47<03:35,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00347, train/loss_step=0.348, global_step=1780.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  90%|████████▉ | 1082/1208 [30:47<03:35,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00364, train/loss_step=0.435, global_step=1780.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  90%|████████▉ | 1083/1208 [30:48<03:33,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00364, train/loss_step=0.435, global_step=1780.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  90%|████████▉ | 1083/1208 [30:48<03:33,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.82e-5, train/loss_step=0.0184, global_step=1780.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  90%|████████▉ | 1084/1208 [30:51<03:31,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.82e-5, train/loss_step=0.0184, global_step=1780.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  90%|████████▉ | 1084/1208 [30:51<03:31,  1.71s/it, loss=0.175, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000718, train/loss_step=0.198, global_step=1780.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  90%|████████▉ | 1085/1208 [30:53<03:30,  1.71s/it, loss=0.175, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000718, train/loss_step=0.198, global_step=1780.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  90%|████████▉ | 1085/1208 [30:53<03:30,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0895, train/loss_vlb_step=0.000296, train/loss_step=0.0895, global_step=1781.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  90%|████████▉ | 1086/1208 [30:54<03:28,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0895, train/loss_vlb_step=0.000296, train/loss_step=0.0895, global_step=1781.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  90%|████████▉ | 1086/1208 [30:54<03:28,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.86e-5, train/loss_step=0.0104, global_step=1781.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  90%|████████▉ | 1087/1208 [30:55<03:26,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.86e-5, train/loss_step=0.0104, global_step=1781.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  90%|████████▉ | 1087/1208 [30:55<03:26,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0653, train/loss_vlb_step=0.000223, train/loss_step=0.0653, global_step=1781.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  90%|█████████ | 1088/1208 [30:58<03:24,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0653, train/loss_vlb_step=0.000223, train/loss_step=0.0653, global_step=1781.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  90%|█████████ | 1088/1208 [30:58<03:24,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=1.53e-5, train/loss_step=0.00263, global_step=1781.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  90%|█████████ | 1089/1208 [30:59<03:23,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=1.53e-5, train/loss_step=0.00263, global_step=1781.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  90%|█████████ | 1089/1208 [30:59<03:23,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000279, train/loss_step=0.0815, global_step=1782.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  90%|█████████ | 1090/1208 [31:00<03:21,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000279, train/loss_step=0.0815, global_step=1782.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  90%|█████████ | 1090/1208 [31:00<03:21,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00226, train/loss_step=0.383, global_step=1782.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  90%|█████████ | 1091/1208 [31:01<03:19,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00226, train/loss_step=0.383, global_step=1782.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  90%|█████████ | 1091/1208 [31:01<03:19,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.8e-5, train/loss_step=0.0233, global_step=1782.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  90%|█████████ | 1092/1208 [31:04<03:18,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.8e-5, train/loss_step=0.0233, global_step=1782.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  90%|█████████ | 1092/1208 [31:04<03:18,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000531, train/loss_step=0.157, global_step=1782.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  90%|█████████ | 1093/1208 [31:05<03:16,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000531, train/loss_step=0.157, global_step=1782.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  90%|█████████ | 1093/1208 [31:05<03:16,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=1783.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  91%|█████████ | 1094/1208 [31:06<03:14,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=1783.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  91%|█████████ | 1094/1208 [31:06<03:14,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0664, train/loss_vlb_step=0.000228, train/loss_step=0.0664, global_step=1783.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  91%|█████████ | 1095/1208 [31:07<03:12,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0664, train/loss_vlb_step=0.000228, train/loss_step=0.0664, global_step=1783.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  91%|█████████ | 1095/1208 [31:07<03:12,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.0048, train/loss_step=0.434, global_step=1783.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  91%|█████████ | 1096/1208 [31:11<03:11,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.0048, train/loss_step=0.434, global_step=1783.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  91%|█████████ | 1096/1208 [31:11<03:11,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000315, train/loss_step=0.095, global_step=1783.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  91%|█████████ | 1097/1208 [31:12<03:09,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000315, train/loss_step=0.095, global_step=1783.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  91%|█████████ | 1097/1208 [31:12<03:09,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0433, train/loss_vlb_step=0.000154, train/loss_step=0.0433, global_step=1784.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  91%|█████████ | 1098/1208 [31:13<03:07,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0433, train/loss_vlb_step=0.000154, train/loss_step=0.0433, global_step=1784.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  91%|█████████ | 1098/1208 [31:13<03:07,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00122, train/loss_step=0.276, global_step=1784.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  91%|█████████ | 1099/1208 [31:14<03:05,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00122, train/loss_step=0.276, global_step=1784.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  91%|█████████ | 1099/1208 [31:14<03:05,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000386, train/loss_step=0.118, global_step=1784.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  91%|█████████ | 1100/1208 [31:17<03:04,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000386, train/loss_step=0.118, global_step=1784.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  91%|█████████ | 1100/1208 [31:17<03:04,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000815, train/loss_step=0.221, global_step=1784.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  91%|█████████ | 1101/1208 [31:18<03:02,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000815, train/loss_step=0.221, global_step=1784.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  91%|█████████ | 1101/1208 [31:18<03:02,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.0018, train/loss_step=0.343, global_step=1785.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  91%|█████████ | 1102/1208 [31:19<03:00,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.0018, train/loss_step=0.343, global_step=1785.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  91%|█████████ | 1102/1208 [31:19<03:00,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00105, train/loss_step=0.253, global_step=1785.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  91%|█████████▏| 1103/1208 [31:20<02:59,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00105, train/loss_step=0.253, global_step=1785.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  91%|█████████▏| 1103/1208 [31:20<02:59,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.73e-5, train/loss_step=0.0182, global_step=1785.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  91%|█████████▏| 1104/1208 [31:23<02:57,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.73e-5, train/loss_step=0.0182, global_step=1785.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  91%|█████████▏| 1104/1208 [31:23<02:57,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.59e-5, train/loss_step=0.0132, global_step=1785.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  91%|█████████▏| 1105/1208 [31:25<02:55,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.59e-5, train/loss_step=0.0132, global_step=1785.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  91%|█████████▏| 1105/1208 [31:25<02:55,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000103, train/loss_step=0.0253, global_step=1786.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  92%|█████████▏| 1106/1208 [31:26<02:53,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000103, train/loss_step=0.0253, global_step=1786.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  92%|█████████▏| 1106/1208 [31:26<02:53,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00308, train/loss_step=0.447, global_step=1786.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  92%|█████████▏| 1107/1208 [31:27<02:52,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00308, train/loss_step=0.447, global_step=1786.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  92%|█████████▏| 1107/1208 [31:27<02:52,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0773, train/loss_vlb_step=0.000272, train/loss_step=0.0773, global_step=1786.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  92%|█████████▏| 1108/1208 [31:30<02:50,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0773, train/loss_vlb_step=0.000272, train/loss_step=0.0773, global_step=1786.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  92%|█████████▏| 1108/1208 [31:30<02:50,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00197, train/loss_step=0.362, global_step=1786.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  92%|█████████▏| 1109/1208 [31:31<02:48,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00197, train/loss_step=0.362, global_step=1786.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  92%|█████████▏| 1109/1208 [31:31<02:48,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=1787.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  92%|█████████▏| 1110/1208 [31:32<02:47,  1.70s/it, loss=0.179, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=1787.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  92%|█████████▏| 1110/1208 [31:32<02:47,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0785, train/loss_vlb_step=0.000261, train/loss_step=0.0785, global_step=1787.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  92%|█████████▏| 1111/1208 [31:33<02:45,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0785, train/loss_vlb_step=0.000261, train/loss_step=0.0785, global_step=1787.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  92%|█████████▏| 1111/1208 [31:33<02:45,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00415, train/loss_vlb_step=2.08e-5, train/loss_step=0.00415, global_step=1787.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  92%|█████████▏| 1112/1208 [31:36<02:43,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00415, train/loss_vlb_step=2.08e-5, train/loss_step=0.00415, global_step=1787.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  92%|█████████▏| 1112/1208 [31:36<02:43,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.563, train/loss_vlb_step=0.0144, train/loss_step=0.563, global_step=1787.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]     Epoch 5:  92%|█████████▏| 1113/1208 [31:37<02:41,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.563, train/loss_vlb_step=0.0144, train/loss_step=0.563, global_step=1787.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  92%|█████████▏| 1113/1208 [31:37<02:41,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000164, train/loss_step=0.0437, global_step=1788.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  92%|█████████▏| 1114/1208 [31:38<02:40,  1.70s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000164, train/loss_step=0.0437, global_step=1788.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  92%|█████████▏| 1114/1208 [31:38<02:40,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00505, train/loss_vlb_step=2.69e-5, train/loss_step=0.00505, global_step=1788.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  92%|█████████▏| 1115/1208 [31:39<02:38,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00505, train/loss_vlb_step=2.69e-5, train/loss_step=0.00505, global_step=1788.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  92%|█████████▏| 1115/1208 [31:39<02:38,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=0.000102, train/loss_step=0.0251, global_step=1788.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  92%|█████████▏| 1116/1208 [31:43<02:36,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=0.000102, train/loss_step=0.0251, global_step=1788.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  92%|█████████▏| 1116/1208 [31:43<02:36,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0429, train/loss_vlb_step=0.000153, train/loss_step=0.0429, global_step=1788.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  92%|█████████▏| 1117/1208 [31:44<02:35,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0429, train/loss_vlb_step=0.000153, train/loss_step=0.0429, global_step=1788.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  92%|█████████▏| 1117/1208 [31:44<02:35,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0863, train/loss_vlb_step=0.000286, train/loss_step=0.0863, global_step=1789.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  93%|█████████▎| 1118/1208 [31:45<02:33,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0863, train/loss_vlb_step=0.000286, train/loss_step=0.0863, global_step=1789.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  93%|█████████▎| 1118/1208 [31:45<02:33,  1.70s/it, loss=0.155, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00103, train/loss_step=0.253, global_step=1789.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  93%|█████████▎| 1119/1208 [31:46<02:31,  1.70s/it, loss=0.155, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00103, train/loss_step=0.253, global_step=1789.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  93%|█████████▎| 1119/1208 [31:46<02:31,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0929, train/loss_vlb_step=0.000307, train/loss_step=0.0929, global_step=1789.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  93%|█████████▎| 1120/1208 [31:49<02:30,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0929, train/loss_vlb_step=0.000307, train/loss_step=0.0929, global_step=1789.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  93%|█████████▎| 1120/1208 [31:49<02:30,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00477, train/loss_vlb_step=2.6e-5, train/loss_step=0.00477, global_step=1789.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  93%|█████████▎| 1121/1208 [31:50<02:28,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00477, train/loss_vlb_step=2.6e-5, train/loss_step=0.00477, global_step=1789.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  93%|█████████▎| 1121/1208 [31:50<02:28,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.44e-5, train/loss_step=0.00246, global_step=1790.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  93%|█████████▎| 1122/1208 [31:51<02:26,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.44e-5, train/loss_step=0.00246, global_step=1790.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  93%|█████████▎| 1122/1208 [31:51<02:26,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000141, train/loss_step=0.0381, global_step=1790.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  93%|█████████▎| 1123/1208 [31:52<02:24,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000141, train/loss_step=0.0381, global_step=1790.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  93%|█████████▎| 1123/1208 [31:52<02:24,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000659, train/loss_step=0.185, global_step=1790.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  93%|█████████▎| 1124/1208 [31:55<02:23,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000659, train/loss_step=0.185, global_step=1790.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  93%|█████████▎| 1124/1208 [31:55<02:23,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00148, train/loss_step=0.289, global_step=1790.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  93%|█████████▎| 1125/1208 [31:57<02:21,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00148, train/loss_step=0.289, global_step=1790.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  93%|█████████▎| 1125/1208 [31:57<02:21,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.468, train/loss_vlb_step=0.00392, train/loss_step=0.468, global_step=1791.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  93%|█████████▎| 1126/1208 [31:58<02:19,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.468, train/loss_vlb_step=0.00392, train/loss_step=0.468, global_step=1791.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  93%|█████████▎| 1126/1208 [31:58<02:19,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.455, train/loss_vlb_step=0.00616, train/loss_step=0.455, global_step=1791.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  93%|█████████▎| 1127/1208 [31:59<02:17,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.455, train/loss_vlb_step=0.00616, train/loss_step=0.455, global_step=1791.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  93%|█████████▎| 1127/1208 [31:59<02:17,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000477, train/loss_step=0.141, global_step=1791.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  93%|█████████▎| 1128/1208 [32:02<02:16,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000477, train/loss_step=0.141, global_step=1791.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  93%|█████████▎| 1128/1208 [32:02<02:16,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6.11e-5, train/loss_step=0.0135, global_step=1791.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  93%|█████████▎| 1129/1208 [32:03<02:14,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6.11e-5, train/loss_step=0.0135, global_step=1791.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  93%|█████████▎| 1129/1208 [32:03<02:14,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00735, train/loss_vlb_step=3.33e-5, train/loss_step=0.00735, global_step=1792.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  94%|█████████▎| 1130/1208 [32:04<02:12,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00735, train/loss_vlb_step=3.33e-5, train/loss_step=0.00735, global_step=1792.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  94%|█████████▎| 1130/1208 [32:04<02:12,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00042, train/loss_step=0.128, global_step=1792.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  94%|█████████▎| 1131/1208 [32:05<02:11,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00042, train/loss_step=0.128, global_step=1792.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  94%|█████████▎| 1131/1208 [32:05<02:11,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00253, train/loss_step=0.367, global_step=1792.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  94%|█████████▎| 1132/1208 [32:08<02:09,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00253, train/loss_step=0.367, global_step=1792.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  94%|█████████▎| 1132/1208 [32:08<02:09,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.33e-5, train/loss_step=0.0241, global_step=1792.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  94%|█████████▍| 1133/1208 [32:09<02:07,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.33e-5, train/loss_step=0.0241, global_step=1792.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  94%|█████████▍| 1133/1208 [32:09<02:07,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00188, train/loss_step=0.397, global_step=1793.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  94%|█████████▍| 1134/1208 [32:10<02:05,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00188, train/loss_step=0.397, global_step=1793.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  94%|█████████▍| 1134/1208 [32:10<02:05,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0055, train/loss_vlb_step=2.93e-5, train/loss_step=0.0055, global_step=1793.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  94%|█████████▍| 1135/1208 [32:11<02:04,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0055, train/loss_vlb_step=2.93e-5, train/loss_step=0.0055, global_step=1793.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  94%|█████████▍| 1135/1208 [32:11<02:04,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.00015, train/loss_step=0.0417, global_step=1793.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  94%|█████████▍| 1136/1208 [32:15<02:02,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.00015, train/loss_step=0.0417, global_step=1793.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  94%|█████████▍| 1136/1208 [32:15<02:02,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0366, train/loss_vlb_step=0.00014, train/loss_step=0.0366, global_step=1793.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  94%|█████████▍| 1137/1208 [32:16<02:00,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0366, train/loss_vlb_step=0.00014, train/loss_step=0.0366, global_step=1793.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  94%|█████████▍| 1137/1208 [32:16<02:00,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=9.05e-5, train/loss_step=0.0217, global_step=1794.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  94%|█████████▍| 1138/1208 [32:17<01:59,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=9.05e-5, train/loss_step=0.0217, global_step=1794.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  94%|█████████▍| 1138/1208 [32:17<01:59,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0619, train/loss_vlb_step=0.000218, train/loss_step=0.0619, global_step=1794.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  94%|█████████▍| 1139/1208 [32:18<01:57,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0619, train/loss_vlb_step=0.000218, train/loss_step=0.0619, global_step=1794.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  94%|█████████▍| 1139/1208 [32:18<01:57,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00232, train/loss_step=0.378, global_step=1794.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  94%|█████████▍| 1140/1208 [32:21<01:55,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00232, train/loss_step=0.378, global_step=1794.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  94%|█████████▍| 1140/1208 [32:21<01:55,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00408, train/loss_vlb_step=2.21e-5, train/loss_step=0.00408, global_step=1794.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  94%|█████████▍| 1141/1208 [32:22<01:54,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00408, train/loss_vlb_step=2.21e-5, train/loss_step=0.00408, global_step=1794.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  94%|█████████▍| 1141/1208 [32:22<01:54,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00504, train/loss_vlb_step=2.65e-5, train/loss_step=0.00504, global_step=1795.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  95%|█████████▍| 1142/1208 [32:23<01:52,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00504, train/loss_vlb_step=2.65e-5, train/loss_step=0.00504, global_step=1795.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  95%|█████████▍| 1142/1208 [32:23<01:52,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0042, train/loss_vlb_step=2.25e-5, train/loss_step=0.0042, global_step=1795.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  95%|█████████▍| 1143/1208 [32:24<01:50,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0042, train/loss_vlb_step=2.25e-5, train/loss_step=0.0042, global_step=1795.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  95%|█████████▍| 1143/1208 [32:24<01:50,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000547, train/loss_step=0.164, global_step=1795.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  95%|█████████▍| 1144/1208 [32:27<01:48,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000547, train/loss_step=0.164, global_step=1795.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  95%|█████████▍| 1144/1208 [32:27<01:48,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0746, train/loss_vlb_step=0.000251, train/loss_step=0.0746, global_step=1795.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  95%|█████████▍| 1145/1208 [32:29<01:47,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0746, train/loss_vlb_step=0.000251, train/loss_step=0.0746, global_step=1795.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  95%|█████████▍| 1145/1208 [32:29<01:47,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0739, train/loss_vlb_step=0.000245, train/loss_step=0.0739, global_step=1796.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  95%|█████████▍| 1146/1208 [32:30<01:45,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0739, train/loss_vlb_step=0.000245, train/loss_step=0.0739, global_step=1796.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  95%|█████████▍| 1146/1208 [32:30<01:45,  1.70s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.00466, train/loss_vlb_step=2.47e-5, train/loss_step=0.00466, global_step=1796.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  95%|█████████▍| 1147/1208 [32:31<01:43,  1.70s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.00466, train/loss_vlb_step=2.47e-5, train/loss_step=0.00466, global_step=1796.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  95%|█████████▍| 1147/1208 [32:31<01:43,  1.70s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.0045, train/loss_vlb_step=2.39e-5, train/loss_step=0.0045, global_step=1796.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  95%|█████████▌| 1148/1208 [32:34<01:42,  1.70s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.0045, train/loss_vlb_step=2.39e-5, train/loss_step=0.0045, global_step=1796.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  95%|█████████▌| 1148/1208 [32:34<01:42,  1.70s/it, loss=0.0939, v_num=0, train/loss_simple_step=0.074, train/loss_vlb_step=0.000251, train/loss_step=0.074, global_step=1796.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  95%|█████████▌| 1149/1208 [32:35<01:40,  1.70s/it, loss=0.0939, v_num=0, train/loss_simple_step=0.074, train/loss_vlb_step=0.000251, train/loss_step=0.074, global_step=1796.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  95%|█████████▌| 1149/1208 [32:35<01:40,  1.70s/it, loss=0.0945, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.13e-5, train/loss_step=0.0194, global_step=1797.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  95%|█████████▌| 1150/1208 [32:36<01:38,  1.70s/it, loss=0.0945, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.13e-5, train/loss_step=0.0194, global_step=1797.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  95%|█████████▌| 1150/1208 [32:36<01:38,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.813, train/loss_vlb_step=0.0692, train/loss_step=0.813, global_step=1797.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  95%|█████████▌| 1151/1208 [32:37<01:36,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.813, train/loss_vlb_step=0.0692, train/loss_step=0.813, global_step=1797.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  95%|█████████▌| 1151/1208 [32:37<01:36,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.16e-5, train/loss_step=0.0199, global_step=1797.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  95%|█████████▌| 1152/1208 [32:40<01:35,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.16e-5, train/loss_step=0.0199, global_step=1797.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  95%|█████████▌| 1152/1208 [32:40<01:35,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.000899, train/loss_step=0.264, global_step=1797.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  95%|█████████▌| 1153/1208 [32:41<01:33,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.000899, train/loss_step=0.264, global_step=1797.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  95%|█████████▌| 1153/1208 [32:41<01:33,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=1798.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  96%|█████████▌| 1154/1208 [32:42<01:31,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=1798.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  96%|█████████▌| 1154/1208 [32:42<01:31,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.000101, train/loss_step=0.0248, global_step=1798.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  96%|█████████▌| 1155/1208 [32:43<01:30,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.000101, train/loss_step=0.0248, global_step=1798.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  96%|█████████▌| 1155/1208 [32:43<01:30,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00288, train/loss_step=0.390, global_step=1798.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  96%|█████████▌| 1156/1208 [32:47<01:28,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00288, train/loss_step=0.390, global_step=1798.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  96%|█████████▌| 1156/1208 [32:47<01:28,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.00227, train/loss_step=0.382, global_step=1798.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  96%|█████████▌| 1157/1208 [32:48<01:26,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.00227, train/loss_step=0.382, global_step=1798.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  96%|█████████▌| 1157/1208 [32:48<01:26,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000526, train/loss_step=0.159, global_step=1799.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  96%|█████████▌| 1158/1208 [32:49<01:25,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000526, train/loss_step=0.159, global_step=1799.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  96%|█████████▌| 1158/1208 [32:49<01:25,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00175, train/loss_step=0.300, global_step=1799.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  96%|█████████▌| 1159/1208 [32:50<01:23,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00175, train/loss_step=0.300, global_step=1799.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  96%|█████████▌| 1159/1208 [32:50<01:23,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00101, train/loss_step=0.260, global_step=1799.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  96%|█████████▌| 1160/1208 [32:53<01:21,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00101, train/loss_step=0.260, global_step=1799.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  96%|█████████▌| 1160/1208 [32:53<01:21,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000143, train/loss_step=0.0369, global_step=1799.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  96%|█████████▌| 1161/1208 [32:54<01:19,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000143, train/loss_step=0.0369, global_step=1799.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  96%|█████████▌| 1161/1208 [32:54<01:19,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0951, train/loss_vlb_step=0.000312, train/loss_step=0.0951, global_step=1800.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  96%|█████████▌| 1162/1208 [32:55<01:18,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0951, train/loss_vlb_step=0.000312, train/loss_step=0.0951, global_step=1800.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  96%|█████████▌| 1162/1208 [32:55<01:18,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.61e-5, train/loss_step=0.0214, global_step=1800.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  96%|█████████▋| 1163/1208 [32:56<01:16,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.61e-5, train/loss_step=0.0214, global_step=1800.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  96%|█████████▋| 1163/1208 [32:56<01:16,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=2.06e-5, train/loss_step=0.00373, global_step=1800.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  96%|█████████▋| 1164/1208 [32:59<01:14,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=2.06e-5, train/loss_step=0.00373, global_step=1800.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  96%|█████████▋| 1164/1208 [32:59<01:14,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0939, train/loss_vlb_step=0.000313, train/loss_step=0.0939, global_step=1800.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  96%|█████████▋| 1165/1208 [33:00<01:13,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0939, train/loss_vlb_step=0.000313, train/loss_step=0.0939, global_step=1800.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  96%|█████████▋| 1165/1208 [33:00<01:13,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000439, train/loss_step=0.133, global_step=1801.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  97%|█████████▋| 1166/1208 [33:01<01:11,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000439, train/loss_step=0.133, global_step=1801.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  97%|█████████▋| 1166/1208 [33:01<01:11,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.000144, train/loss_step=0.0401, global_step=1801.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  97%|█████████▋| 1167/1208 [33:02<01:09,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.000144, train/loss_step=0.0401, global_step=1801.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  97%|█████████▋| 1167/1208 [33:02<01:09,  1.70s/it, loss=0.169, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.00043, train/loss_step=0.131, global_step=1801.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5:  97%|█████████▋| 1168/1208 [33:06<01:08,  1.70s/it, loss=0.169, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.00043, train/loss_step=0.131, global_step=1801.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  97%|█████████▋| 1168/1208 [33:06<01:08,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8e-5, train/loss_step=0.0196, global_step=1801.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  97%|█████████▋| 1169/1208 [33:07<01:06,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8e-5, train/loss_step=0.0196, global_step=1801.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  97%|█████████▋| 1169/1208 [33:07<01:06,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000135, train/loss_step=0.0369, global_step=1802.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  97%|█████████▋| 1170/1208 [33:08<01:04,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000135, train/loss_step=0.0369, global_step=1802.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  97%|█████████▋| 1170/1208 [33:08<01:04,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.94e-5, train/loss_step=0.0106, global_step=1802.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  97%|█████████▋| 1171/1208 [33:09<01:02,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.94e-5, train/loss_step=0.0106, global_step=1802.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  97%|█████████▋| 1171/1208 [33:09<01:02,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00253, train/loss_step=0.413, global_step=1802.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  97%|█████████▋| 1172/1208 [33:12<01:01,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00253, train/loss_step=0.413, global_step=1802.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  97%|█████████▋| 1172/1208 [33:12<01:01,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00522, train/loss_step=0.457, global_step=1802.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  97%|█████████▋| 1173/1208 [33:13<00:59,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00522, train/loss_step=0.457, global_step=1802.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  97%|█████████▋| 1173/1208 [33:13<00:59,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0682, train/loss_vlb_step=0.000225, train/loss_step=0.0682, global_step=1803.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  97%|█████████▋| 1174/1208 [33:14<00:57,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0682, train/loss_vlb_step=0.000225, train/loss_step=0.0682, global_step=1803.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  97%|█████████▋| 1174/1208 [33:14<00:57,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000748, train/loss_step=0.199, global_step=1803.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  97%|█████████▋| 1175/1208 [33:15<00:56,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000748, train/loss_step=0.199, global_step=1803.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  97%|█████████▋| 1175/1208 [33:15<00:56,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000329, train/loss_step=0.100, global_step=1803.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  97%|█████████▋| 1176/1208 [33:19<00:54,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000329, train/loss_step=0.100, global_step=1803.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  97%|█████████▋| 1176/1208 [33:19<00:54,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=2e-5, train/loss_step=0.00352, global_step=1803.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  97%|█████████▋| 1177/1208 [33:20<00:52,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=2e-5, train/loss_step=0.00352, global_step=1803.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  97%|█████████▋| 1177/1208 [33:20<00:52,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000162, train/loss_step=0.0454, global_step=1804.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  98%|█████████▊| 1178/1208 [33:21<00:50,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000162, train/loss_step=0.0454, global_step=1804.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  98%|█████████▊| 1178/1208 [33:21<00:50,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.7e-5, train/loss_step=0.0124, global_step=1804.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  98%|█████████▊| 1179/1208 [33:22<00:49,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.7e-5, train/loss_step=0.0124, global_step=1804.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  98%|█████████▊| 1179/1208 [33:22<00:49,  1.70s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.99e-5, train/loss_step=0.0162, global_step=1804.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  98%|█████████▊| 1180/1208 [33:25<00:47,  1.70s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.99e-5, train/loss_step=0.0162, global_step=1804.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  98%|█████████▊| 1180/1208 [33:25<00:47,  1.70s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.0538, train/loss_vlb_step=0.00019, train/loss_step=0.0538, global_step=1804.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  98%|█████████▊| 1181/1208 [33:26<00:45,  1.70s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.0538, train/loss_vlb_step=0.00019, train/loss_step=0.0538, global_step=1804.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  98%|█████████▊| 1181/1208 [33:26<00:45,  1.70s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.61e-5, train/loss_step=0.00289, global_step=1805.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  98%|█████████▊| 1182/1208 [33:27<00:44,  1.70s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.61e-5, train/loss_step=0.00289, global_step=1805.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  98%|█████████▊| 1182/1208 [33:27<00:44,  1.70s/it, loss=0.102, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000749, train/loss_step=0.209, global_step=1805.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5:  98%|█████████▊| 1183/1208 [33:28<00:42,  1.70s/it, loss=0.102, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000749, train/loss_step=0.209, global_step=1805.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  98%|█████████▊| 1183/1208 [33:28<00:42,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00386, train/loss_step=0.430, global_step=1805.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  98%|█████████▊| 1184/1208 [33:31<00:40,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00386, train/loss_step=0.430, global_step=1805.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  98%|█████████▊| 1184/1208 [33:31<00:40,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=9.82e-5, train/loss_step=0.0258, global_step=1805.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  98%|█████████▊| 1185/1208 [33:32<00:39,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=9.82e-5, train/loss_step=0.0258, global_step=1805.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  98%|█████████▊| 1185/1208 [33:32<00:39,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000659, train/loss_step=0.192, global_step=1806.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  98%|█████████▊| 1186/1208 [33:33<00:37,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000659, train/loss_step=0.192, global_step=1806.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  98%|█████████▊| 1186/1208 [33:33<00:37,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000619, train/loss_step=0.176, global_step=1806.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  98%|█████████▊| 1187/1208 [33:34<00:35,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000619, train/loss_step=0.176, global_step=1806.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  98%|█████████▊| 1187/1208 [33:34<00:35,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.61e-5, train/loss_step=0.0201, global_step=1806.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  98%|█████████▊| 1188/1208 [33:38<00:33,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.61e-5, train/loss_step=0.0201, global_step=1806.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  98%|█████████▊| 1188/1208 [33:38<00:33,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00617, train/loss_vlb_step=3.09e-5, train/loss_step=0.00617, global_step=1806.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  98%|█████████▊| 1189/1208 [33:39<00:32,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00617, train/loss_vlb_step=3.09e-5, train/loss_step=0.00617, global_step=1806.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  98%|█████████▊| 1189/1208 [33:39<00:32,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=2.67e-5, train/loss_step=0.00526, global_step=1807.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  99%|█████████▊| 1190/1208 [33:40<00:30,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=2.67e-5, train/loss_step=0.00526, global_step=1807.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  99%|█████████▊| 1190/1208 [33:40<00:30,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0889, train/loss_vlb_step=0.000292, train/loss_step=0.0889, global_step=1807.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  99%|█████████▊| 1191/1208 [33:41<00:28,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0889, train/loss_vlb_step=0.000292, train/loss_step=0.0889, global_step=1807.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  99%|█████████▊| 1191/1208 [33:41<00:28,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000741, train/loss_step=0.204, global_step=1807.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5:  99%|█████████▊| 1192/1208 [33:44<00:27,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000741, train/loss_step=0.204, global_step=1807.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  99%|█████████▊| 1192/1208 [33:44<00:27,  1.70s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.62e-5, train/loss_step=0.00281, global_step=1807.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  99%|█████████▉| 1193/1208 [33:45<00:25,  1.70s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.62e-5, train/loss_step=0.00281, global_step=1807.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  99%|█████████▉| 1193/1208 [33:45<00:25,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.744, train/loss_vlb_step=0.0299, train/loss_step=0.744, global_step=1808.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]      Epoch 5:  99%|█████████▉| 1194/1208 [33:46<00:23,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.744, train/loss_vlb_step=0.0299, train/loss_step=0.744, global_step=1808.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  99%|█████████▉| 1194/1208 [33:46<00:23,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00242, train/loss_step=0.366, global_step=1808.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  99%|█████████▉| 1195/1208 [33:47<00:22,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00242, train/loss_step=0.366, global_step=1808.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  99%|█████████▉| 1195/1208 [33:47<00:22,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000828, train/loss_step=0.223, global_step=1808.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  99%|█████████▉| 1196/1208 [33:50<00:20,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000828, train/loss_step=0.223, global_step=1808.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  99%|█████████▉| 1196/1208 [33:50<00:20,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000848, train/loss_step=0.226, global_step=1808.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  99%|█████████▉| 1197/1208 [33:52<00:18,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000848, train/loss_step=0.226, global_step=1808.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  99%|█████████▉| 1197/1208 [33:52<00:18,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.00104, train/loss_step=0.242, global_step=1809.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] Epoch 5:  99%|█████████▉| 1198/1208 [33:53<00:16,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.00104, train/loss_step=0.242, global_step=1809.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  99%|█████████▉| 1198/1208 [33:53<00:16,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=1.43e-5, train/loss_step=0.0025, global_step=1809.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  99%|█████████▉| 1199/1208 [33:54<00:15,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=1.43e-5, train/loss_step=0.0025, global_step=1809.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  99%|█████████▉| 1199/1208 [33:54<00:15,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0608, train/loss_vlb_step=0.000211, train/loss_step=0.0608, global_step=1809.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  99%|█████████▉| 1200/1208 [33:57<00:13,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0608, train/loss_vlb_step=0.000211, train/loss_step=0.0608, global_step=1809.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  99%|█████████▉| 1200/1208 [33:57<00:13,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000119, train/loss_step=0.0298, global_step=1809.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.73it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.75it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.77it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.80it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.76it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.76it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.76it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.76it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.76it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.76it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.76it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.76it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.76it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.75it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.78it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 5:  99%|█████████▉| 1201/1208 [34:28<00:12,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000119, train/loss_step=0.0298, global_step=1809.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5:  99%|█████████▉| 1201/1208 [34:28<00:12,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.75e-5, train/loss_step=0.010, global_step=1810.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]   Epoch 5: 100%|█████████▉| 1202/1208 [34:29<00:10,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.75e-5, train/loss_step=0.010, global_step=1810.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5: 100%|█████████▉| 1202/1208 [34:29<00:10,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=1.56e-5, train/loss_step=0.00271, global_step=1810.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5: 100%|█████████▉| 1203/1208 [34:30<00:08,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=1.56e-5, train/loss_step=0.00271, global_step=1810.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5: 100%|█████████▉| 1203/1208 [34:30<00:08,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.00055, train/loss_step=0.161, global_step=1810.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]    Epoch 5: 100%|█████████▉| 1204/1208 [34:33<00:06,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.00055, train/loss_step=0.161, global_step=1810.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5: 100%|█████████▉| 1204/1208 [34:33<00:06,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000128, train/loss_step=0.0353, global_step=1810.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5: 100%|█████████▉| 1205/1208 [34:34<00:05,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000128, train/loss_step=0.0353, global_step=1810.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5: 100%|█████████▉| 1205/1208 [34:34<00:05,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0385, train/loss_vlb_step=0.000149, train/loss_step=0.0385, global_step=1811.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5: 100%|█████████▉| 1206/1208 [34:35<00:03,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0385, train/loss_vlb_step=0.000149, train/loss_step=0.0385, global_step=1811.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5: 100%|█████████▉| 1206/1208 [34:35<00:03,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.000166, train/loss_step=0.043, global_step=1811.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]  Epoch 5: 100%|█████████▉| 1207/1208 [34:36<00:01,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.000166, train/loss_step=0.043, global_step=1811.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5: 100%|█████████▉| 1207/1208 [34:36<00:01,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000744, train/loss_step=0.196, global_step=1811.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5: 100%|██████████| 1208/1208 [34:41<00:00,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000744, train/loss_step=0.196, global_step=1811.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 5: 100%|██████████| 1208/1208 [34:41<00:00,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00186, train/loss_step=0.331, global_step=1811.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141] 
+
+
+Epoch 5:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.151, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00186, train/loss_step=0.331, global_step=1811.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]           Epoch 6:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.151, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00186, train/loss_step=0.331, global_step=1811.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.84it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.84it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.75it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.77it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.80it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.80it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.81it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.80it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.80it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.82it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.78it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.80it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.83it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.83it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.83it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.78it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.83it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.83it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.83it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.83it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.78it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.83it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.83it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.83it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.83it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.82it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.83it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.83it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.83it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.78it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.78it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.78it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.77it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]Epoch 6:   0%|          | 1/1208 [00:33<11:05:59, 33.11s/it, loss=0.151, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00186, train/loss_step=0.331, global_step=1811.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.0028, train/loss_epoch=0.141]Epoch 6:   0%|          | 1/1208 [00:33<11:06:01, 33.11s/it, loss=0.16, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000635, train/loss_step=0.184, global_step=1812.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   0%|          | 2/1208 [00:34<5:43:06, 17.07s/it, loss=0.16, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000635, train/loss_step=0.184, global_step=1812.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:   0%|          | 2/1208 [00:34<5:43:07, 17.07s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.79e-5, train/loss_step=0.0237, global_step=1812.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   0%|          | 3/1208 [00:35<3:55:28, 11.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.79e-5, train/loss_step=0.0237, global_step=1812.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   0%|          | 3/1208 [00:35<3:55:29, 11.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.610, train/loss_vlb_step=0.0108, train/loss_step=0.610, global_step=1812.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:   0%|          | 4/1208 [00:38<3:12:18,  9.58s/it, loss=0.177, v_num=0, train/loss_simple_step=0.610, train/loss_vlb_step=0.0108, train/loss_step=0.610, global_step=1812.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   0%|          | 4/1208 [00:38<3:12:18,  9.58s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.26e-5, train/loss_step=0.0167, global_step=1812.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   0%|          | 5/1208 [00:39<2:38:02,  7.88s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.26e-5, train/loss_step=0.0167, global_step=1812.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   0%|          | 5/1208 [00:39<2:38:02,  7.88s/it, loss=0.148, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000515, train/loss_step=0.156, global_step=1813.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:   0%|          | 6/1208 [00:40<2:15:02,  6.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000515, train/loss_step=0.156, global_step=1813.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   0%|          | 6/1208 [00:40<2:15:02,  6.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.456, train/loss_vlb_step=0.00425, train/loss_step=0.456, global_step=1813.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:   1%|          | 7/1208 [00:41<1:58:36,  5.93s/it, loss=0.152, v_num=0, train/loss_simple_step=0.456, train/loss_vlb_step=0.00425, train/loss_step=0.456, global_step=1813.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   1%|          | 7/1208 [00:41<1:58:36,  5.93s/it, loss=0.154, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.0011, train/loss_step=0.250, global_step=1813.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:   1%|          | 8/1208 [00:44<1:51:44,  5.59s/it, loss=0.154, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.0011, train/loss_step=0.250, global_step=1813.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   1%|          | 8/1208 [00:44<1:51:44,  5.59s/it, loss=0.149, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000421, train/loss_step=0.128, global_step=1813.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   1%|          | 9/1208 [00:45<1:41:37,  5.09s/it, loss=0.149, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000421, train/loss_step=0.128, global_step=1813.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   1%|          | 9/1208 [00:45<1:41:37,  5.09s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0591, train/loss_vlb_step=0.000208, train/loss_step=0.0591, global_step=1814.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   1%|          | 10/1208 [00:46<1:33:29,  4.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0591, train/loss_vlb_step=0.000208, train/loss_step=0.0591, global_step=1814.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   1%|          | 10/1208 [00:46<1:33:29,  4.68s/it, loss=0.171, v_num=0, train/loss_simple_step=0.637, train/loss_vlb_step=0.0223, train/loss_step=0.637, global_step=1814.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:   1%|          | 11/1208 [00:47<1:26:49,  4.35s/it, loss=0.171, v_num=0, train/loss_simple_step=0.637, train/loss_vlb_step=0.0223, train/loss_step=0.637, global_step=1814.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   1%|          | 11/1208 [00:47<1:26:49,  4.35s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0828, train/loss_vlb_step=0.000286, train/loss_step=0.0828, global_step=1814.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   1%|          | 12/1208 [00:51<1:24:47,  4.25s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0828, train/loss_vlb_step=0.000286, train/loss_step=0.0828, global_step=1814.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   1%|          | 12/1208 [00:51<1:24:48,  4.25s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000131, train/loss_step=0.0329, global_step=1814.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   1%|          | 13/1208 [00:52<1:19:52,  4.01s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000131, train/loss_step=0.0329, global_step=1814.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   1%|          | 13/1208 [00:52<1:19:52,  4.01s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.000152, train/loss_step=0.0403, global_step=1815.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   1%|          | 14/1208 [00:53<1:15:34,  3.80s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.000152, train/loss_step=0.0403, global_step=1815.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   1%|          | 14/1208 [00:53<1:15:34,  3.80s/it, loss=0.18, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000388, train/loss_step=0.117, global_step=1815.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:   1%|          | 15/1208 [00:54<1:11:50,  3.61s/it, loss=0.18, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000388, train/loss_step=0.117, global_step=1815.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   1%|          | 15/1208 [00:54<1:11:50,  3.61s/it, loss=0.182, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000717, train/loss_step=0.202, global_step=1815.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   1%|▏         | 16/1208 [00:57<1:11:18,  3.59s/it, loss=0.182, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000717, train/loss_step=0.202, global_step=1815.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   1%|▏         | 16/1208 [00:57<1:11:18,  3.59s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0984, train/loss_vlb_step=0.000323, train/loss_step=0.0984, global_step=1815.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   1%|▏         | 17/1208 [00:58<1:08:16,  3.44s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0984, train/loss_vlb_step=0.000323, train/loss_step=0.0984, global_step=1815.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   1%|▏         | 17/1208 [00:58<1:08:16,  3.44s/it, loss=0.211, v_num=0, train/loss_simple_step=0.562, train/loss_vlb_step=0.0226, train/loss_step=0.562, global_step=1816.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:   1%|▏         | 18/1208 [00:59<1:05:34,  3.31s/it, loss=0.211, v_num=0, train/loss_simple_step=0.562, train/loss_vlb_step=0.0226, train/loss_step=0.562, global_step=1816.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   1%|▏         | 18/1208 [00:59<1:05:34,  3.31s/it, loss=0.209, v_num=0, train/loss_simple_step=0.00597, train/loss_vlb_step=3.15e-5, train/loss_step=0.00597, global_step=1816.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   2%|▏         | 19/1208 [01:00<1:03:09,  3.19s/it, loss=0.209, v_num=0, train/loss_simple_step=0.00597, train/loss_vlb_step=3.15e-5, train/loss_step=0.00597, global_step=1816.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   2%|▏         | 19/1208 [01:00<1:03:09,  3.19s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0565, train/loss_vlb_step=0.000195, train/loss_step=0.0565, global_step=1816.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:   2%|▏         | 20/1208 [01:03<1:03:10,  3.19s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0565, train/loss_vlb_step=0.000195, train/loss_step=0.0565, global_step=1816.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   2%|▏         | 20/1208 [01:03<1:03:10,  3.19s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000109, train/loss_step=0.0279, global_step=1816.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   2%|▏         | 21/1208 [01:04<1:01:07,  3.09s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000109, train/loss_step=0.0279, global_step=1816.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   2%|▏         | 21/1208 [01:04<1:01:08,  3.09s/it, loss=0.191, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00117, train/loss_step=0.265, global_step=1817.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:   2%|▏         | 22/1208 [01:05<59:16,  3.00s/it, loss=0.191, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00117, train/loss_step=0.265, global_step=1817.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:   2%|▏         | 22/1208 [01:05<59:16,  3.00s/it, loss=0.21, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00287, train/loss_step=0.396, global_step=1817.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:   2%|▏         | 23/1208 [01:07<57:31,  2.91s/it, loss=0.21, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00287, train/loss_step=0.396, global_step=1817.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   2%|▏         | 23/1208 [01:07<57:32,  2.91s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00702, train/loss_vlb_step=3.57e-5, train/loss_step=0.00702, global_step=1817.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   2%|▏         | 24/1208 [01:10<57:44,  2.93s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00702, train/loss_vlb_step=3.57e-5, train/loss_step=0.00702, global_step=1817.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   2%|▏         | 24/1208 [01:10<57:44,  2.93s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.000212, train/loss_step=0.0598, global_step=1817.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   2%|▏         | 25/1208 [01:11<56:13,  2.85s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.000212, train/loss_step=0.0598, global_step=1817.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   2%|▏         | 25/1208 [01:11<56:13,  2.85s/it, loss=0.18, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000384, train/loss_step=0.116, global_step=1818.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:   2%|▏         | 26/1208 [01:12<54:49,  2.78s/it, loss=0.18, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000384, train/loss_step=0.116, global_step=1818.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   2%|▏         | 26/1208 [01:12<54:49,  2.78s/it, loss=0.17, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00104, train/loss_step=0.253, global_step=1818.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:   2%|▏         | 27/1208 [01:13<53:29,  2.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00104, train/loss_step=0.253, global_step=1818.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   2%|▏         | 27/1208 [01:13<53:29,  2.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000622, train/loss_step=0.184, global_step=1818.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   2%|▏         | 28/1208 [01:16<53:48,  2.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000622, train/loss_step=0.184, global_step=1818.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   2%|▏         | 28/1208 [01:16<53:48,  2.74s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.3e-5, train/loss_step=0.0114, global_step=1818.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   2%|▏         | 29/1208 [01:17<52:37,  2.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.3e-5, train/loss_step=0.0114, global_step=1818.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   2%|▏         | 29/1208 [01:17<52:37,  2.68s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0912, train/loss_vlb_step=0.0003, train/loss_step=0.0912, global_step=1819.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   2%|▏         | 30/1208 [01:18<51:30,  2.62s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0912, train/loss_vlb_step=0.0003, train/loss_step=0.0912, global_step=1819.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   2%|▏         | 30/1208 [01:18<51:30,  2.62s/it, loss=0.142, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000806, train/loss_step=0.225, global_step=1819.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   3%|▎         | 31/1208 [01:19<50:27,  2.57s/it, loss=0.142, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000806, train/loss_step=0.225, global_step=1819.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   3%|▎         | 31/1208 [01:19<50:28,  2.57s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00535, train/loss_vlb_step=2.77e-5, train/loss_step=0.00535, global_step=1819.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   3%|▎         | 32/1208 [01:22<50:50,  2.59s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00535, train/loss_vlb_step=2.77e-5, train/loss_step=0.00535, global_step=1819.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   3%|▎         | 32/1208 [01:22<50:50,  2.59s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.47e-5, train/loss_step=0.0144, global_step=1819.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:   3%|▎         | 33/1208 [01:24<49:52,  2.55s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.47e-5, train/loss_step=0.0144, global_step=1819.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   3%|▎         | 33/1208 [01:24<49:52,  2.55s/it, loss=0.147, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000924, train/loss_step=0.236, global_step=1820.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:   3%|▎         | 34/1208 [01:25<48:58,  2.50s/it, loss=0.147, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000924, train/loss_step=0.236, global_step=1820.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   3%|▎         | 34/1208 [01:25<48:58,  2.50s/it, loss=0.147, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000408, train/loss_step=0.123, global_step=1820.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   3%|▎         | 35/1208 [01:26<48:06,  2.46s/it, loss=0.147, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000408, train/loss_step=0.123, global_step=1820.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   3%|▎         | 35/1208 [01:26<48:06,  2.46s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=1.95e-5, train/loss_step=0.00357, global_step=1820.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   3%|▎         | 36/1208 [01:29<48:29,  2.48s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=1.95e-5, train/loss_step=0.00357, global_step=1820.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   3%|▎         | 36/1208 [01:29<48:29,  2.48s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0518, train/loss_vlb_step=0.000179, train/loss_step=0.0518, global_step=1820.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:   3%|▎         | 37/1208 [01:30<47:42,  2.44s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0518, train/loss_vlb_step=0.000179, train/loss_step=0.0518, global_step=1820.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   3%|▎         | 37/1208 [01:30<47:42,  2.44s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000161, train/loss_step=0.0445, global_step=1821.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   3%|▎         | 38/1208 [01:31<46:56,  2.41s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000161, train/loss_step=0.0445, global_step=1821.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   3%|▎         | 38/1208 [01:31<46:56,  2.41s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.44e-5, train/loss_step=0.0172, global_step=1821.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:   3%|▎         | 39/1208 [01:32<46:13,  2.37s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.44e-5, train/loss_step=0.0172, global_step=1821.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   3%|▎         | 39/1208 [01:32<46:13,  2.37s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0505, train/loss_vlb_step=0.000172, train/loss_step=0.0505, global_step=1821.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   3%|▎         | 40/1208 [01:35<46:36,  2.39s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0505, train/loss_vlb_step=0.000172, train/loss_step=0.0505, global_step=1821.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   3%|▎         | 40/1208 [01:35<46:36,  2.39s/it, loss=0.119, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000944, train/loss_step=0.226, global_step=1821.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:   3%|▎         | 41/1208 [01:36<45:56,  2.36s/it, loss=0.119, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000944, train/loss_step=0.226, global_step=1821.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   3%|▎         | 41/1208 [01:36<45:56,  2.36s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0767, train/loss_vlb_step=0.000255, train/loss_step=0.0767, global_step=1822.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   3%|▎         | 42/1208 [01:37<45:17,  2.33s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0767, train/loss_vlb_step=0.000255, train/loss_step=0.0767, global_step=1822.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   3%|▎         | 42/1208 [01:37<45:17,  2.33s/it, loss=0.105, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00148, train/loss_step=0.306, global_step=1822.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:   4%|▎         | 43/1208 [01:38<44:40,  2.30s/it, loss=0.105, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00148, train/loss_step=0.306, global_step=1822.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   4%|▎         | 43/1208 [01:38<44:40,  2.30s/it, loss=0.114, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000691, train/loss_step=0.196, global_step=1822.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   4%|▎         | 44/1208 [01:42<45:02,  2.32s/it, loss=0.114, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000691, train/loss_step=0.196, global_step=1822.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   4%|▎         | 44/1208 [01:42<45:02,  2.32s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0419, train/loss_vlb_step=0.00015, train/loss_step=0.0419, global_step=1822.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   4%|▎         | 45/1208 [01:43<44:27,  2.29s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0419, train/loss_vlb_step=0.00015, train/loss_step=0.0419, global_step=1822.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   4%|▎         | 45/1208 [01:43<44:28,  2.29s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0803, train/loss_vlb_step=0.000274, train/loss_step=0.0803, global_step=1823.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   4%|▍         | 46/1208 [01:44<43:53,  2.27s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0803, train/loss_vlb_step=0.000274, train/loss_step=0.0803, global_step=1823.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   4%|▍         | 46/1208 [01:44<43:53,  2.27s/it, loss=0.105, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.00036, train/loss_step=0.108, global_step=1823.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:   4%|▍         | 47/1208 [01:45<43:21,  2.24s/it, loss=0.105, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.00036, train/loss_step=0.108, global_step=1823.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   4%|▍         | 47/1208 [01:45<43:21,  2.24s/it, loss=0.111, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00142, train/loss_step=0.303, global_step=1823.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   4%|▍         | 48/1208 [01:48<43:43,  2.26s/it, loss=0.111, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00142, train/loss_step=0.303, global_step=1823.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   4%|▍         | 48/1208 [01:48<43:43,  2.26s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00463, train/loss_vlb_step=2.4e-5, train/loss_step=0.00463, global_step=1823.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   4%|▍         | 49/1208 [01:49<43:13,  2.24s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00463, train/loss_vlb_step=2.4e-5, train/loss_step=0.00463, global_step=1823.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   4%|▍         | 49/1208 [01:49<43:13,  2.24s/it, loss=0.123, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00169, train/loss_step=0.350, global_step=1824.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:   4%|▍         | 50/1208 [01:50<42:43,  2.21s/it, loss=0.123, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00169, train/loss_step=0.350, global_step=1824.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   4%|▍         | 50/1208 [01:50<42:43,  2.21s/it, loss=0.125, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00111, train/loss_step=0.264, global_step=1824.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   4%|▍         | 51/1208 [01:51<42:14,  2.19s/it, loss=0.125, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00111, train/loss_step=0.264, global_step=1824.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   4%|▍         | 51/1208 [01:51<42:14,  2.19s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0985, train/loss_vlb_step=0.000324, train/loss_step=0.0985, global_step=1824.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   4%|▍         | 52/1208 [01:54<42:35,  2.21s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0985, train/loss_vlb_step=0.000324, train/loss_step=0.0985, global_step=1824.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   4%|▍         | 52/1208 [01:54<42:36,  2.21s/it, loss=0.157, v_num=0, train/loss_simple_step=0.564, train/loss_vlb_step=0.00781, train/loss_step=0.564, global_step=1824.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:   4%|▍         | 53/1208 [01:56<42:09,  2.19s/it, loss=0.157, v_num=0, train/loss_simple_step=0.564, train/loss_vlb_step=0.00781, train/loss_step=0.564, global_step=1824.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   4%|▍         | 53/1208 [01:56<42:09,  2.19s/it, loss=0.157, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000801, train/loss_step=0.222, global_step=1825.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   4%|▍         | 54/1208 [01:57<41:42,  2.17s/it, loss=0.157, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000801, train/loss_step=0.222, global_step=1825.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   4%|▍         | 54/1208 [01:57<41:42,  2.17s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.51e-5, train/loss_step=0.00257, global_step=1825.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   5%|▍         | 55/1208 [01:58<41:16,  2.15s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.51e-5, train/loss_step=0.00257, global_step=1825.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   5%|▍         | 55/1208 [01:58<41:16,  2.15s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00709, train/loss_vlb_step=3.55e-5, train/loss_step=0.00709, global_step=1825.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   5%|▍         | 56/1208 [02:01<41:36,  2.17s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00709, train/loss_vlb_step=3.55e-5, train/loss_step=0.00709, global_step=1825.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   5%|▍         | 56/1208 [02:01<41:36,  2.17s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0628, train/loss_vlb_step=0.000221, train/loss_step=0.0628, global_step=1825.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:   5%|▍         | 57/1208 [02:02<41:12,  2.15s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0628, train/loss_vlb_step=0.000221, train/loss_step=0.0628, global_step=1825.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   5%|▍         | 57/1208 [02:02<41:12,  2.15s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00718, train/loss_vlb_step=3.47e-5, train/loss_step=0.00718, global_step=1826.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   5%|▍         | 58/1208 [02:03<40:47,  2.13s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00718, train/loss_vlb_step=3.47e-5, train/loss_step=0.00718, global_step=1826.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   5%|▍         | 58/1208 [02:03<40:48,  2.13s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000111, train/loss_step=0.0287, global_step=1826.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:   5%|▍         | 59/1208 [02:04<40:24,  2.11s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000111, train/loss_step=0.0287, global_step=1826.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   5%|▍         | 59/1208 [02:04<40:24,  2.11s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000109, train/loss_step=0.0273, global_step=1826.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   5%|▍         | 60/1208 [02:07<40:44,  2.13s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000109, train/loss_step=0.0273, global_step=1826.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   5%|▍         | 60/1208 [02:07<40:44,  2.13s/it, loss=0.143, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=1826.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:   5%|▌         | 61/1208 [02:08<40:23,  2.11s/it, loss=0.143, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=1826.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   5%|▌         | 61/1208 [02:08<40:23,  2.11s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.52e-5, train/loss_step=0.0118, global_step=1827.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   5%|▌         | 62/1208 [02:09<40:01,  2.10s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.52e-5, train/loss_step=0.0118, global_step=1827.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   5%|▌         | 62/1208 [02:09<40:01,  2.10s/it, loss=0.131, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=1827.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   5%|▌         | 63/1208 [02:10<39:39,  2.08s/it, loss=0.131, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=1827.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   5%|▌         | 63/1208 [02:10<39:39,  2.08s/it, loss=0.122, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.17e-5, train/loss_step=0.020, global_step=1827.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:   5%|▌         | 64/1208 [02:14<39:57,  2.10s/it, loss=0.122, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.17e-5, train/loss_step=0.020, global_step=1827.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   5%|▌         | 64/1208 [02:14<39:57,  2.10s/it, loss=0.133, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.000933, train/loss_step=0.253, global_step=1827.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   5%|▌         | 65/1208 [02:15<39:37,  2.08s/it, loss=0.133, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.000933, train/loss_step=0.253, global_step=1827.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   5%|▌         | 65/1208 [02:15<39:37,  2.08s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000107, train/loss_step=0.0268, global_step=1828.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   5%|▌         | 66/1208 [02:16<39:17,  2.06s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000107, train/loss_step=0.0268, global_step=1828.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   5%|▌         | 66/1208 [02:16<39:17,  2.06s/it, loss=0.136, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000915, train/loss_step=0.239, global_step=1828.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:   6%|▌         | 67/1208 [02:17<38:58,  2.05s/it, loss=0.136, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000915, train/loss_step=0.239, global_step=1828.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   6%|▌         | 67/1208 [02:17<38:58,  2.05s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=1.32e-5, train/loss_step=0.00217, global_step=1828.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   6%|▌         | 68/1208 [02:20<39:15,  2.07s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=1.32e-5, train/loss_step=0.00217, global_step=1828.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   6%|▌         | 68/1208 [02:20<39:15,  2.07s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.00014, train/loss_step=0.0359, global_step=1828.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:   6%|▌         | 69/1208 [02:21<38:57,  2.05s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.00014, train/loss_step=0.0359, global_step=1828.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   6%|▌         | 69/1208 [02:21<38:57,  2.05s/it, loss=0.107, v_num=0, train/loss_simple_step=0.030, train/loss_vlb_step=0.000121, train/loss_step=0.030, global_step=1829.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:   6%|▌         | 70/1208 [02:22<38:38,  2.04s/it, loss=0.107, v_num=0, train/loss_simple_step=0.030, train/loss_vlb_step=0.000121, train/loss_step=0.030, global_step=1829.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   6%|▌         | 70/1208 [02:22<38:38,  2.04s/it, loss=0.116, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00742, train/loss_step=0.454, global_step=1829.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:   6%|▌         | 71/1208 [02:23<38:20,  2.02s/it, loss=0.116, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00742, train/loss_step=0.454, global_step=1829.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   6%|▌         | 71/1208 [02:23<38:20,  2.02s/it, loss=0.121, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000685, train/loss_step=0.194, global_step=1829.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   6%|▌         | 72/1208 [02:26<38:37,  2.04s/it, loss=0.121, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000685, train/loss_step=0.194, global_step=1829.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   6%|▌         | 72/1208 [02:26<38:37,  2.04s/it, loss=0.106, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.000977, train/loss_step=0.253, global_step=1829.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   6%|▌         | 73/1208 [02:27<38:20,  2.03s/it, loss=0.106, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.000977, train/loss_step=0.253, global_step=1829.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   6%|▌         | 73/1208 [02:27<38:20,  2.03s/it, loss=0.126, v_num=0, train/loss_simple_step=0.635, train/loss_vlb_step=0.0222, train/loss_step=0.635, global_step=1830.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:   6%|▌         | 74/1208 [02:28<38:03,  2.01s/it, loss=0.126, v_num=0, train/loss_simple_step=0.635, train/loss_vlb_step=0.0222, train/loss_step=0.635, global_step=1830.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   6%|▌         | 74/1208 [02:28<38:03,  2.01s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0569, train/loss_vlb_step=0.0002, train/loss_step=0.0569, global_step=1830.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   6%|▌         | 75/1208 [02:30<37:46,  2.00s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0569, train/loss_vlb_step=0.0002, train/loss_step=0.0569, global_step=1830.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   6%|▌         | 75/1208 [02:30<37:46,  2.00s/it, loss=0.146, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00224, train/loss_step=0.338, global_step=1830.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:   6%|▋         | 76/1208 [02:33<38:03,  2.02s/it, loss=0.146, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00224, train/loss_step=0.338, global_step=1830.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   6%|▋         | 76/1208 [02:33<38:03,  2.02s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.00015, train/loss_step=0.0394, global_step=1830.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   6%|▋         | 77/1208 [02:34<37:47,  2.00s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.00015, train/loss_step=0.0394, global_step=1830.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   6%|▋         | 77/1208 [02:34<37:47,  2.00s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0876, train/loss_vlb_step=0.000294, train/loss_step=0.0876, global_step=1831.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   6%|▋         | 78/1208 [02:35<37:31,  1.99s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0876, train/loss_vlb_step=0.000294, train/loss_step=0.0876, global_step=1831.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   6%|▋         | 78/1208 [02:35<37:31,  1.99s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.33e-5, train/loss_step=0.0115, global_step=1831.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:   7%|▋         | 79/1208 [02:36<37:16,  1.98s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.33e-5, train/loss_step=0.0115, global_step=1831.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   7%|▋         | 79/1208 [02:36<37:16,  1.98s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0408, train/loss_vlb_step=0.000152, train/loss_step=0.0408, global_step=1831.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   7%|▋         | 80/1208 [02:39<37:31,  2.00s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0408, train/loss_vlb_step=0.000152, train/loss_step=0.0408, global_step=1831.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   7%|▋         | 80/1208 [02:39<37:31,  2.00s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0695, train/loss_vlb_step=0.000243, train/loss_step=0.0695, global_step=1831.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   7%|▋         | 81/1208 [02:40<37:17,  1.99s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0695, train/loss_vlb_step=0.000243, train/loss_step=0.0695, global_step=1831.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   7%|▋         | 81/1208 [02:40<37:17,  1.99s/it, loss=0.16, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00176, train/loss_step=0.291, global_step=1832.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:   7%|▋         | 82/1208 [02:41<37:02,  1.97s/it, loss=0.16, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00176, train/loss_step=0.291, global_step=1832.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   7%|▋         | 82/1208 [02:41<37:02,  1.97s/it, loss=0.185, v_num=0, train/loss_simple_step=0.623, train/loss_vlb_step=0.013, train/loss_step=0.623, global_step=1832.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:   7%|▋         | 83/1208 [02:42<36:47,  1.96s/it, loss=0.185, v_num=0, train/loss_simple_step=0.623, train/loss_vlb_step=0.013, train/loss_step=0.623, global_step=1832.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   7%|▋         | 83/1208 [02:42<36:47,  1.96s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0559, train/loss_vlb_step=0.0002, train/loss_step=0.0559, global_step=1832.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   7%|▋         | 84/1208 [02:46<37:02,  1.98s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0559, train/loss_vlb_step=0.0002, train/loss_step=0.0559, global_step=1832.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   7%|▋         | 84/1208 [02:46<37:02,  1.98s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=1.81e-5, train/loss_step=0.00322, global_step=1832.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   7%|▋         | 85/1208 [02:47<36:48,  1.97s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=1.81e-5, train/loss_step=0.00322, global_step=1832.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   7%|▋         | 85/1208 [02:47<36:48,  1.97s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.74e-5, train/loss_step=0.0126, global_step=1833.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:   7%|▋         | 86/1208 [02:48<36:34,  1.96s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.74e-5, train/loss_step=0.0126, global_step=1833.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   7%|▋         | 86/1208 [02:48<36:34,  1.96s/it, loss=0.183, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00328, train/loss_step=0.428, global_step=1833.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:   7%|▋         | 87/1208 [02:49<36:21,  1.95s/it, loss=0.183, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00328, train/loss_step=0.428, global_step=1833.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   7%|▋         | 87/1208 [02:49<36:21,  1.95s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0711, train/loss_vlb_step=0.000239, train/loss_step=0.0711, global_step=1833.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   7%|▋         | 88/1208 [02:52<36:35,  1.96s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0711, train/loss_vlb_step=0.000239, train/loss_step=0.0711, global_step=1833.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   7%|▋         | 88/1208 [02:52<36:35,  1.96s/it, loss=0.21, v_num=0, train/loss_simple_step=0.505, train/loss_vlb_step=0.00714, train/loss_step=0.505, global_step=1833.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:   7%|▋         | 89/1208 [02:53<36:22,  1.95s/it, loss=0.21, v_num=0, train/loss_simple_step=0.505, train/loss_vlb_step=0.00714, train/loss_step=0.505, global_step=1833.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   7%|▋         | 89/1208 [02:53<36:22,  1.95s/it, loss=0.219, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000804, train/loss_step=0.212, global_step=1834.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   7%|▋         | 90/1208 [02:54<36:09,  1.94s/it, loss=0.219, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000804, train/loss_step=0.212, global_step=1834.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   7%|▋         | 90/1208 [02:54<36:09,  1.94s/it, loss=0.202, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=1834.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   8%|▊         | 91/1208 [02:55<35:56,  1.93s/it, loss=0.202, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=1834.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   8%|▊         | 91/1208 [02:55<35:56,  1.93s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.56e-5, train/loss_step=0.00267, global_step=1834.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   8%|▊         | 92/1208 [02:58<36:10,  1.94s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.56e-5, train/loss_step=0.00267, global_step=1834.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   8%|▊         | 92/1208 [02:58<36:10,  1.94s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00704, train/loss_vlb_step=3.41e-5, train/loss_step=0.00704, global_step=1834.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:   8%|▊         | 93/1208 [02:59<35:57,  1.94s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00704, train/loss_vlb_step=3.41e-5, train/loss_step=0.00704, global_step=1834.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   8%|▊         | 93/1208 [02:59<35:57,  1.94s/it, loss=0.156, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000505, train/loss_step=0.150, global_step=1835.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:   8%|▊         | 94/1208 [03:01<35:45,  1.93s/it, loss=0.156, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000505, train/loss_step=0.150, global_step=1835.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   8%|▊         | 94/1208 [03:01<35:45,  1.93s/it, loss=0.18, v_num=0, train/loss_simple_step=0.544, train/loss_vlb_step=0.00867, train/loss_step=0.544, global_step=1835.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:   8%|▊         | 95/1208 [03:02<35:33,  1.92s/it, loss=0.18, v_num=0, train/loss_simple_step=0.544, train/loss_vlb_step=0.00867, train/loss_step=0.544, global_step=1835.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   8%|▊         | 95/1208 [03:02<35:33,  1.92s/it, loss=0.169, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000409, train/loss_step=0.124, global_step=1835.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   8%|▊         | 96/1208 [03:05<35:46,  1.93s/it, loss=0.169, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000409, train/loss_step=0.124, global_step=1835.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   8%|▊         | 96/1208 [03:05<35:46,  1.93s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00499, train/loss_vlb_step=2.64e-5, train/loss_step=0.00499, global_step=1835.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   8%|▊         | 97/1208 [03:06<35:34,  1.92s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00499, train/loss_vlb_step=2.64e-5, train/loss_step=0.00499, global_step=1835.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   8%|▊         | 97/1208 [03:06<35:34,  1.92s/it, loss=0.187, v_num=0, train/loss_simple_step=0.473, train/loss_vlb_step=0.00452, train/loss_step=0.473, global_step=1836.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:   8%|▊         | 98/1208 [03:07<35:22,  1.91s/it, loss=0.187, v_num=0, train/loss_simple_step=0.473, train/loss_vlb_step=0.00452, train/loss_step=0.473, global_step=1836.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   8%|▊         | 98/1208 [03:07<35:22,  1.91s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.95e-5, train/loss_step=0.0239, global_step=1836.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   8%|▊         | 99/1208 [03:08<35:11,  1.90s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.95e-5, train/loss_step=0.0239, global_step=1836.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   8%|▊         | 99/1208 [03:08<35:11,  1.90s/it, loss=0.191, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000374, train/loss_step=0.114, global_step=1836.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:   8%|▊         | 100/1208 [03:11<35:24,  1.92s/it, loss=0.191, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000374, train/loss_step=0.114, global_step=1836.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   8%|▊         | 100/1208 [03:11<35:24,  1.92s/it, loss=0.209, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00299, train/loss_step=0.423, global_step=1836.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:   8%|▊         | 101/1208 [03:12<35:12,  1.91s/it, loss=0.209, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00299, train/loss_step=0.423, global_step=1836.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   8%|▊         | 101/1208 [03:12<35:12,  1.91s/it, loss=0.225, v_num=0, train/loss_simple_step=0.608, train/loss_vlb_step=0.0142, train/loss_step=0.608, global_step=1837.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:   8%|▊         | 102/1208 [03:13<35:01,  1.90s/it, loss=0.225, v_num=0, train/loss_simple_step=0.608, train/loss_vlb_step=0.0142, train/loss_step=0.608, global_step=1837.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   8%|▊         | 102/1208 [03:13<35:01,  1.90s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.00016, train/loss_step=0.0454, global_step=1837.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   9%|▊         | 103/1208 [03:14<34:50,  1.89s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.00016, train/loss_step=0.0454, global_step=1837.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   9%|▊         | 103/1208 [03:14<34:50,  1.89s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000127, train/loss_step=0.0361, global_step=1837.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   9%|▊         | 104/1208 [03:18<35:02,  1.90s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000127, train/loss_step=0.0361, global_step=1837.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   9%|▊         | 104/1208 [03:18<35:02,  1.90s/it, loss=0.211, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00152, train/loss_step=0.323, global_step=1837.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:   9%|▊         | 105/1208 [03:19<34:52,  1.90s/it, loss=0.211, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00152, train/loss_step=0.323, global_step=1837.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   9%|▊         | 105/1208 [03:19<34:52,  1.90s/it, loss=0.212, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.000133, train/loss_step=0.0352, global_step=1838.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   9%|▉         | 106/1208 [03:20<34:41,  1.89s/it, loss=0.212, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.000133, train/loss_step=0.0352, global_step=1838.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   9%|▉         | 106/1208 [03:20<34:41,  1.89s/it, loss=0.216, v_num=0, train/loss_simple_step=0.518, train/loss_vlb_step=0.00483, train/loss_step=0.518, global_step=1838.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:   9%|▉         | 107/1208 [03:21<34:30,  1.88s/it, loss=0.216, v_num=0, train/loss_simple_step=0.518, train/loss_vlb_step=0.00483, train/loss_step=0.518, global_step=1838.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   9%|▉         | 107/1208 [03:21<34:30,  1.88s/it, loss=0.213, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.74e-5, train/loss_step=0.00311, global_step=1838.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   9%|▉         | 108/1208 [03:24<34:42,  1.89s/it, loss=0.213, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.74e-5, train/loss_step=0.00311, global_step=1838.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   9%|▉         | 108/1208 [03:24<34:42,  1.89s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0078, train/loss_vlb_step=3.89e-5, train/loss_step=0.0078, global_step=1838.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:   9%|▉         | 109/1208 [03:25<34:32,  1.89s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0078, train/loss_vlb_step=3.89e-5, train/loss_step=0.0078, global_step=1838.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   9%|▉         | 109/1208 [03:25<34:32,  1.89s/it, loss=0.21, v_num=0, train/loss_simple_step=0.644, train/loss_vlb_step=0.0369, train/loss_step=0.644, global_step=1839.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:   9%|▉         | 110/1208 [03:26<34:21,  1.88s/it, loss=0.21, v_num=0, train/loss_simple_step=0.644, train/loss_vlb_step=0.0369, train/loss_step=0.644, global_step=1839.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   9%|▉         | 110/1208 [03:26<34:21,  1.88s/it, loss=0.205, v_num=0, train/loss_simple_step=0.00515, train/loss_vlb_step=2.79e-5, train/loss_step=0.00515, global_step=1839.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   9%|▉         | 111/1208 [03:27<34:11,  1.87s/it, loss=0.205, v_num=0, train/loss_simple_step=0.00515, train/loss_vlb_step=2.79e-5, train/loss_step=0.00515, global_step=1839.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   9%|▉         | 111/1208 [03:27<34:11,  1.87s/it, loss=0.216, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.001, train/loss_step=0.230, global_step=1839.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]      Epoch 6:   9%|▉         | 112/1208 [03:30<34:23,  1.88s/it, loss=0.216, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.001, train/loss_step=0.230, global_step=1839.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   9%|▉         | 112/1208 [03:30<34:23,  1.88s/it, loss=0.224, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000607, train/loss_step=0.175, global_step=1839.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   9%|▉         | 113/1208 [03:31<34:13,  1.88s/it, loss=0.224, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000607, train/loss_step=0.175, global_step=1839.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   9%|▉         | 113/1208 [03:31<34:13,  1.88s/it, loss=0.225, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000566, train/loss_step=0.170, global_step=1840.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   9%|▉         | 114/1208 [03:32<34:03,  1.87s/it, loss=0.225, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000566, train/loss_step=0.170, global_step=1840.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:   9%|▉         | 114/1208 [03:32<34:03,  1.87s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0763, train/loss_vlb_step=0.000258, train/loss_step=0.0763, global_step=1840.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  10%|▉         | 115/1208 [03:33<33:53,  1.86s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0763, train/loss_vlb_step=0.000258, train/loss_step=0.0763, global_step=1840.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  10%|▉         | 115/1208 [03:33<33:53,  1.86s/it, loss=0.216, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00432, train/loss_step=0.397, global_step=1840.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  10%|▉         | 116/1208 [03:37<34:04,  1.87s/it, loss=0.216, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00432, train/loss_step=0.397, global_step=1840.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  10%|▉         | 116/1208 [03:37<34:04,  1.87s/it, loss=0.253, v_num=0, train/loss_simple_step=0.748, train/loss_vlb_step=0.0638, train/loss_step=0.748, global_step=1840.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  10%|▉         | 117/1208 [03:38<33:55,  1.87s/it, loss=0.253, v_num=0, train/loss_simple_step=0.748, train/loss_vlb_step=0.0638, train/loss_step=0.748, global_step=1840.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  10%|▉         | 117/1208 [03:38<33:55,  1.87s/it, loss=0.237, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000527, train/loss_step=0.159, global_step=1841.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  10%|▉         | 118/1208 [03:39<33:46,  1.86s/it, loss=0.237, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000527, train/loss_step=0.159, global_step=1841.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  10%|▉         | 118/1208 [03:39<33:46,  1.86s/it, loss=0.258, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00296, train/loss_step=0.436, global_step=1841.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  10%|▉         | 119/1208 [03:40<33:36,  1.85s/it, loss=0.258, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00296, train/loss_step=0.436, global_step=1841.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  10%|▉         | 119/1208 [03:40<33:36,  1.85s/it, loss=0.252, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=2.18e-5, train/loss_step=0.00388, global_step=1841.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  10%|▉         | 120/1208 [03:43<33:47,  1.86s/it, loss=0.252, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=2.18e-5, train/loss_step=0.00388, global_step=1841.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  10%|▉         | 120/1208 [03:43<33:47,  1.86s/it, loss=0.26, v_num=0, train/loss_simple_step=0.589, train/loss_vlb_step=0.0183, train/loss_step=0.589, global_step=1841.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]      Epoch 6:  10%|█         | 121/1208 [03:44<33:38,  1.86s/it, loss=0.26, v_num=0, train/loss_simple_step=0.589, train/loss_vlb_step=0.0183, train/loss_step=0.589, global_step=1841.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  10%|█         | 121/1208 [03:44<33:38,  1.86s/it, loss=0.257, v_num=0, train/loss_simple_step=0.539, train/loss_vlb_step=0.0137, train/loss_step=0.539, global_step=1842.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  10%|█         | 122/1208 [03:45<33:29,  1.85s/it, loss=0.257, v_num=0, train/loss_simple_step=0.539, train/loss_vlb_step=0.0137, train/loss_step=0.539, global_step=1842.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  10%|█         | 122/1208 [03:45<33:29,  1.85s/it, loss=0.278, v_num=0, train/loss_simple_step=0.466, train/loss_vlb_step=0.00471, train/loss_step=0.466, global_step=1842.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  10%|█         | 123/1208 [03:46<33:20,  1.84s/it, loss=0.278, v_num=0, train/loss_simple_step=0.466, train/loss_vlb_step=0.00471, train/loss_step=0.466, global_step=1842.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  10%|█         | 123/1208 [03:46<33:20,  1.84s/it, loss=0.276, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.58e-5, train/loss_step=0.00266, global_step=1842.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  10%|█         | 124/1208 [03:50<33:30,  1.86s/it, loss=0.276, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.58e-5, train/loss_step=0.00266, global_step=1842.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  10%|█         | 124/1208 [03:50<33:30,  1.86s/it, loss=0.265, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000335, train/loss_step=0.101, global_step=1842.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  10%|█         | 125/1208 [03:51<33:22,  1.85s/it, loss=0.265, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000335, train/loss_step=0.101, global_step=1842.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  10%|█         | 125/1208 [03:51<33:22,  1.85s/it, loss=0.292, v_num=0, train/loss_simple_step=0.574, train/loss_vlb_step=0.0124, train/loss_step=0.574, global_step=1843.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  10%|█         | 126/1208 [03:52<33:13,  1.84s/it, loss=0.292, v_num=0, train/loss_simple_step=0.574, train/loss_vlb_step=0.0124, train/loss_step=0.574, global_step=1843.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  10%|█         | 126/1208 [03:52<33:13,  1.84s/it, loss=0.271, v_num=0, train/loss_simple_step=0.0832, train/loss_vlb_step=0.00028, train/loss_step=0.0832, global_step=1843.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  11%|█         | 127/1208 [03:53<33:04,  1.84s/it, loss=0.271, v_num=0, train/loss_simple_step=0.0832, train/loss_vlb_step=0.00028, train/loss_step=0.0832, global_step=1843.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  11%|█         | 127/1208 [03:53<33:04,  1.84s/it, loss=0.272, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.000152, train/loss_step=0.0417, global_step=1843.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  11%|█         | 128/1208 [03:56<33:15,  1.85s/it, loss=0.272, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.000152, train/loss_step=0.0417, global_step=1843.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  11%|█         | 128/1208 [03:56<33:15,  1.85s/it, loss=0.276, v_num=0, train/loss_simple_step=0.0848, train/loss_vlb_step=0.00028, train/loss_step=0.0848, global_step=1843.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  11%|█         | 129/1208 [03:57<33:07,  1.84s/it, loss=0.276, v_num=0, train/loss_simple_step=0.0848, train/loss_vlb_step=0.00028, train/loss_step=0.0848, global_step=1843.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  11%|█         | 129/1208 [03:57<33:07,  1.84s/it, loss=0.254, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000714, train/loss_step=0.200, global_step=1844.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  11%|█         | 130/1208 [03:58<32:58,  1.84s/it, loss=0.254, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000714, train/loss_step=0.200, global_step=1844.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  11%|█         | 130/1208 [03:58<32:58,  1.84s/it, loss=0.282, v_num=0, train/loss_simple_step=0.557, train/loss_vlb_step=0.0149, train/loss_step=0.557, global_step=1844.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  11%|█         | 131/1208 [03:59<32:50,  1.83s/it, loss=0.282, v_num=0, train/loss_simple_step=0.557, train/loss_vlb_step=0.0149, train/loss_step=0.557, global_step=1844.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  11%|█         | 131/1208 [03:59<32:50,  1.83s/it, loss=0.281, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000827, train/loss_step=0.219, global_step=1844.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  11%|█         | 132/1208 [04:02<33:00,  1.84s/it, loss=0.281, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000827, train/loss_step=0.219, global_step=1844.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  11%|█         | 132/1208 [04:02<33:00,  1.84s/it, loss=0.295, v_num=0, train/loss_simple_step=0.461, train/loss_vlb_step=0.00453, train/loss_step=0.461, global_step=1844.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  11%|█         | 133/1208 [04:03<32:52,  1.83s/it, loss=0.295, v_num=0, train/loss_simple_step=0.461, train/loss_vlb_step=0.00453, train/loss_step=0.461, global_step=1844.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  11%|█         | 133/1208 [04:03<32:52,  1.83s/it, loss=0.288, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.32e-5, train/loss_step=0.0168, global_step=1845.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  11%|█         | 134/1208 [04:05<32:43,  1.83s/it, loss=0.288, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.32e-5, train/loss_step=0.0168, global_step=1845.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  11%|█         | 134/1208 [04:05<32:43,  1.83s/it, loss=0.287, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000186, train/loss_step=0.0524, global_step=1845.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  11%|█         | 135/1208 [04:06<32:35,  1.82s/it, loss=0.287, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000186, train/loss_step=0.0524, global_step=1845.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  11%|█         | 135/1208 [04:06<32:35,  1.82s/it, loss=0.277, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000824, train/loss_step=0.209, global_step=1845.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  11%|█▏        | 136/1208 [04:09<32:45,  1.83s/it, loss=0.277, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000824, train/loss_step=0.209, global_step=1845.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  11%|█▏        | 136/1208 [04:09<32:45,  1.83s/it, loss=0.241, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.9e-5, train/loss_step=0.0162, global_step=1845.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  11%|█▏        | 137/1208 [04:10<32:37,  1.83s/it, loss=0.241, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.9e-5, train/loss_step=0.0162, global_step=1845.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  11%|█▏        | 137/1208 [04:10<32:37,  1.83s/it, loss=0.234, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000103, train/loss_step=0.0258, global_step=1846.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  11%|█▏        | 138/1208 [04:11<32:29,  1.82s/it, loss=0.234, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000103, train/loss_step=0.0258, global_step=1846.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  11%|█▏        | 138/1208 [04:11<32:29,  1.82s/it, loss=0.237, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00497, train/loss_step=0.499, global_step=1846.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  12%|█▏        | 139/1208 [04:12<32:21,  1.82s/it, loss=0.237, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00497, train/loss_step=0.499, global_step=1846.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  12%|█▏        | 139/1208 [04:12<32:21,  1.82s/it, loss=0.237, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.13e-5, train/loss_step=0.00394, global_step=1846.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  12%|█▏        | 140/1208 [04:15<32:30,  1.83s/it, loss=0.237, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.13e-5, train/loss_step=0.00394, global_step=1846.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  12%|█▏        | 140/1208 [04:15<32:30,  1.83s/it, loss=0.208, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=3.65e-5, train/loss_step=0.00783, global_step=1846.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  12%|█▏        | 141/1208 [04:16<32:23,  1.82s/it, loss=0.208, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=3.65e-5, train/loss_step=0.00783, global_step=1846.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  12%|█▏        | 141/1208 [04:16<32:23,  1.82s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=8.92e-5, train/loss_step=0.0211, global_step=1847.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  12%|█▏        | 142/1208 [04:17<32:15,  1.82s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=8.92e-5, train/loss_step=0.0211, global_step=1847.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  12%|█▏        | 142/1208 [04:17<32:15,  1.82s/it, loss=0.178, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00257, train/loss_step=0.388, global_step=1847.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  12%|█▏        | 143/1208 [04:18<32:08,  1.81s/it, loss=0.178, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00257, train/loss_step=0.388, global_step=1847.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  12%|█▏        | 143/1208 [04:18<32:08,  1.81s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00944, train/loss_vlb_step=4.49e-5, train/loss_step=0.00944, global_step=1847.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  12%|█▏        | 144/1208 [04:22<32:16,  1.82s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00944, train/loss_vlb_step=4.49e-5, train/loss_step=0.00944, global_step=1847.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  12%|█▏        | 144/1208 [04:22<32:16,  1.82s/it, loss=0.189, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00146, train/loss_step=0.301, global_step=1847.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  12%|█▏        | 145/1208 [04:23<32:08,  1.81s/it, loss=0.189, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00146, train/loss_step=0.301, global_step=1847.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  12%|█▏        | 145/1208 [04:23<32:08,  1.81s/it, loss=0.166, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000429, train/loss_step=0.129, global_step=1848.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  12%|█▏        | 146/1208 [04:24<32:01,  1.81s/it, loss=0.166, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000429, train/loss_step=0.129, global_step=1848.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  12%|█▏        | 146/1208 [04:24<32:01,  1.81s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.47e-5, train/loss_step=0.0201, global_step=1848.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  12%|█▏        | 147/1208 [04:25<31:53,  1.80s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.47e-5, train/loss_step=0.0201, global_step=1848.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  12%|█▏        | 147/1208 [04:25<31:53,  1.80s/it, loss=0.172, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000806, train/loss_step=0.211, global_step=1848.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  12%|█▏        | 148/1208 [04:28<32:01,  1.81s/it, loss=0.172, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000806, train/loss_step=0.211, global_step=1848.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  12%|█▏        | 148/1208 [04:28<32:01,  1.81s/it, loss=0.191, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00564, train/loss_step=0.476, global_step=1848.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  12%|█▏        | 149/1208 [04:29<31:54,  1.81s/it, loss=0.191, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00564, train/loss_step=0.476, global_step=1848.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  12%|█▏        | 149/1208 [04:29<31:54,  1.81s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00795, train/loss_vlb_step=4e-5, train/loss_step=0.00795, global_step=1849.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  12%|█▏        | 150/1208 [04:30<31:47,  1.80s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00795, train/loss_vlb_step=4e-5, train/loss_step=0.00795, global_step=1849.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  12%|█▏        | 150/1208 [04:30<31:47,  1.80s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.71e-5, train/loss_step=0.00296, global_step=1849.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  12%|█▎        | 151/1208 [04:31<31:40,  1.80s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.71e-5, train/loss_step=0.00296, global_step=1849.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  12%|█▎        | 151/1208 [04:31<31:40,  1.80s/it, loss=0.151, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000561, train/loss_step=0.159, global_step=1849.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  13%|█▎        | 152/1208 [04:34<31:48,  1.81s/it, loss=0.151, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000561, train/loss_step=0.159, global_step=1849.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  13%|█▎        | 152/1208 [04:34<31:48,  1.81s/it, loss=0.13, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000174, train/loss_step=0.050, global_step=1849.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  13%|█▎        | 153/1208 [04:35<31:41,  1.80s/it, loss=0.13, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000174, train/loss_step=0.050, global_step=1849.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  13%|█▎        | 153/1208 [04:35<31:41,  1.80s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00396, train/loss_vlb_step=2.22e-5, train/loss_step=0.00396, global_step=1850.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  13%|█▎        | 154/1208 [04:36<31:34,  1.80s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00396, train/loss_vlb_step=2.22e-5, train/loss_step=0.00396, global_step=1850.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  13%|█▎        | 154/1208 [04:36<31:34,  1.80s/it, loss=0.139, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00114, train/loss_step=0.247, global_step=1850.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  13%|█▎        | 155/1208 [04:37<31:27,  1.79s/it, loss=0.139, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00114, train/loss_step=0.247, global_step=1850.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  13%|█▎        | 155/1208 [04:37<31:27,  1.79s/it, loss=0.136, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.00046, train/loss_step=0.138, global_step=1850.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  13%|█▎        | 156/1208 [04:41<31:35,  1.80s/it, loss=0.136, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.00046, train/loss_step=0.138, global_step=1850.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  13%|█▎        | 156/1208 [04:41<31:35,  1.80s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0752, train/loss_vlb_step=0.000252, train/loss_step=0.0752, global_step=1850.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  13%|█▎        | 157/1208 [04:42<31:28,  1.80s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0752, train/loss_vlb_step=0.000252, train/loss_step=0.0752, global_step=1850.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  13%|█▎        | 157/1208 [04:42<31:28,  1.80s/it, loss=0.167, v_num=0, train/loss_simple_step=0.589, train/loss_vlb_step=0.0133, train/loss_step=0.589, global_step=1851.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  13%|█▎        | 158/1208 [04:43<31:21,  1.79s/it, loss=0.167, v_num=0, train/loss_simple_step=0.589, train/loss_vlb_step=0.0133, train/loss_step=0.589, global_step=1851.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  13%|█▎        | 158/1208 [04:43<31:21,  1.79s/it, loss=0.174, v_num=0, train/loss_simple_step=0.646, train/loss_vlb_step=0.0305, train/loss_step=0.646, global_step=1851.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  13%|█▎        | 159/1208 [04:44<31:14,  1.79s/it, loss=0.174, v_num=0, train/loss_simple_step=0.646, train/loss_vlb_step=0.0305, train/loss_step=0.646, global_step=1851.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  13%|█▎        | 159/1208 [04:44<31:14,  1.79s/it, loss=0.183, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000622, train/loss_step=0.179, global_step=1851.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  13%|█▎        | 160/1208 [04:47<31:22,  1.80s/it, loss=0.183, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000622, train/loss_step=0.179, global_step=1851.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  13%|█▎        | 160/1208 [04:47<31:22,  1.80s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0455, train/loss_vlb_step=0.00016, train/loss_step=0.0455, global_step=1851.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  13%|█▎        | 161/1208 [04:48<31:16,  1.79s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0455, train/loss_vlb_step=0.00016, train/loss_step=0.0455, global_step=1851.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  13%|█▎        | 161/1208 [04:48<31:16,  1.79s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0902, train/loss_vlb_step=0.000301, train/loss_step=0.0902, global_step=1852.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  13%|█▎        | 162/1208 [04:49<31:09,  1.79s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0902, train/loss_vlb_step=0.000301, train/loss_step=0.0902, global_step=1852.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  13%|█▎        | 162/1208 [04:49<31:09,  1.79s/it, loss=0.192, v_num=0, train/loss_simple_step=0.469, train/loss_vlb_step=0.00575, train/loss_step=0.469, global_step=1852.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  13%|█▎        | 163/1208 [04:50<31:02,  1.78s/it, loss=0.192, v_num=0, train/loss_simple_step=0.469, train/loss_vlb_step=0.00575, train/loss_step=0.469, global_step=1852.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  13%|█▎        | 163/1208 [04:50<31:02,  1.78s/it, loss=0.194, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000154, train/loss_step=0.042, global_step=1852.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  14%|█▎        | 164/1208 [04:53<31:10,  1.79s/it, loss=0.194, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000154, train/loss_step=0.042, global_step=1852.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  14%|█▎        | 164/1208 [04:53<31:10,  1.79s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0768, train/loss_vlb_step=0.000262, train/loss_step=0.0768, global_step=1852.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  14%|█▎        | 165/1208 [04:54<31:04,  1.79s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0768, train/loss_vlb_step=0.000262, train/loss_step=0.0768, global_step=1852.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  14%|█▎        | 165/1208 [04:54<31:04,  1.79s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00863, train/loss_vlb_step=4.19e-5, train/loss_step=0.00863, global_step=1853.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  14%|█▎        | 166/1208 [04:55<30:57,  1.78s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00863, train/loss_vlb_step=4.19e-5, train/loss_step=0.00863, global_step=1853.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  14%|█▎        | 166/1208 [04:55<30:57,  1.78s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000112, train/loss_step=0.0284, global_step=1853.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  14%|█▍        | 167/1208 [04:56<30:51,  1.78s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000112, train/loss_step=0.0284, global_step=1853.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  14%|█▍        | 167/1208 [04:56<30:51,  1.78s/it, loss=0.173, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.00044, train/loss_step=0.132, global_step=1853.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  14%|█▍        | 168/1208 [05:00<30:58,  1.79s/it, loss=0.173, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.00044, train/loss_step=0.132, global_step=1853.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  14%|█▍        | 168/1208 [05:00<30:58,  1.79s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0475, train/loss_vlb_step=0.000167, train/loss_step=0.0475, global_step=1853.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  14%|█▍        | 169/1208 [05:01<30:52,  1.78s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0475, train/loss_vlb_step=0.000167, train/loss_step=0.0475, global_step=1853.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  14%|█▍        | 169/1208 [05:01<30:52,  1.78s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0997, train/loss_vlb_step=0.00033, train/loss_step=0.0997, global_step=1854.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  14%|█▍        | 170/1208 [05:02<30:46,  1.78s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0997, train/loss_vlb_step=0.00033, train/loss_step=0.0997, global_step=1854.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  14%|█▍        | 170/1208 [05:02<30:46,  1.78s/it, loss=0.166, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000727, train/loss_step=0.199, global_step=1854.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  14%|█▍        | 171/1208 [05:03<30:39,  1.77s/it, loss=0.166, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000727, train/loss_step=0.199, global_step=1854.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  14%|█▍        | 171/1208 [05:03<30:39,  1.77s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00293, train/loss_vlb_step=1.67e-5, train/loss_step=0.00293, global_step=1854.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  14%|█▍        | 172/1208 [05:06<30:47,  1.78s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00293, train/loss_vlb_step=1.67e-5, train/loss_step=0.00293, global_step=1854.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  14%|█▍        | 172/1208 [05:06<30:47,  1.78s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.51e-5, train/loss_step=0.0132, global_step=1854.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  14%|█▍        | 173/1208 [05:07<30:41,  1.78s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.51e-5, train/loss_step=0.0132, global_step=1854.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  14%|█▍        | 173/1208 [05:07<30:41,  1.78s/it, loss=0.162, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=1855.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  14%|█▍        | 174/1208 [05:08<30:35,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=1855.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  14%|█▍        | 174/1208 [05:08<30:35,  1.77s/it, loss=0.157, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000487, train/loss_step=0.148, global_step=1855.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  14%|█▍        | 175/1208 [05:09<30:28,  1.77s/it, loss=0.157, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000487, train/loss_step=0.148, global_step=1855.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  14%|█▍        | 175/1208 [05:09<30:28,  1.77s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.07e-5, train/loss_step=0.0166, global_step=1855.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  15%|█▍        | 176/1208 [05:13<30:35,  1.78s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.07e-5, train/loss_step=0.0166, global_step=1855.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  15%|█▍        | 176/1208 [05:13<30:35,  1.78s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.15e-5, train/loss_step=0.00192, global_step=1855.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  15%|█▍        | 177/1208 [05:14<30:29,  1.77s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.15e-5, train/loss_step=0.00192, global_step=1855.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  15%|█▍        | 177/1208 [05:14<30:29,  1.77s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.69e-5, train/loss_step=0.0128, global_step=1856.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  15%|█▍        | 178/1208 [05:15<30:23,  1.77s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.69e-5, train/loss_step=0.0128, global_step=1856.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  15%|█▍        | 178/1208 [05:15<30:23,  1.77s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000653, train/loss_step=0.188, global_step=1856.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  15%|█▍        | 179/1208 [05:16<30:17,  1.77s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000653, train/loss_step=0.188, global_step=1856.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  15%|█▍        | 179/1208 [05:16<30:17,  1.77s/it, loss=0.0907, v_num=0, train/loss_simple_step=0.0835, train/loss_vlb_step=0.000291, train/loss_step=0.0835, global_step=1856.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  15%|█▍        | 180/1208 [05:19<30:24,  1.77s/it, loss=0.0907, v_num=0, train/loss_simple_step=0.0835, train/loss_vlb_step=0.000291, train/loss_step=0.0835, global_step=1856.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  15%|█▍        | 180/1208 [05:19<30:24,  1.77s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.00038, train/loss_step=0.114, global_step=1856.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  15%|█▍        | 181/1208 [05:20<30:18,  1.77s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.00038, train/loss_step=0.114, global_step=1856.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  15%|█▍        | 181/1208 [05:20<30:18,  1.77s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.09e-5, train/loss_step=0.00182, global_step=1857.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  15%|█▌        | 182/1208 [05:21<30:12,  1.77s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.09e-5, train/loss_step=0.00182, global_step=1857.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  15%|█▌        | 182/1208 [05:21<30:12,  1.77s/it, loss=0.0683, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000148, train/loss_step=0.0396, global_step=1857.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  15%|█▌        | 183/1208 [05:22<30:06,  1.76s/it, loss=0.0683, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000148, train/loss_step=0.0396, global_step=1857.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  15%|█▌        | 183/1208 [05:22<30:06,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.926, train/loss_vlb_step=0.466, train/loss_step=0.926, global_step=1857.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]      Epoch 6:  15%|█▌        | 184/1208 [05:25<30:13,  1.77s/it, loss=0.112, v_num=0, train/loss_simple_step=0.926, train/loss_vlb_step=0.466, train/loss_step=0.926, global_step=1857.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  15%|█▌        | 184/1208 [05:25<30:13,  1.77s/it, loss=0.118, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000701, train/loss_step=0.193, global_step=1857.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  15%|█▌        | 185/1208 [05:26<30:07,  1.77s/it, loss=0.118, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000701, train/loss_step=0.193, global_step=1857.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  15%|█▌        | 185/1208 [05:26<30:07,  1.77s/it, loss=0.123, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=1858.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  15%|█▌        | 186/1208 [05:27<30:02,  1.76s/it, loss=0.123, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=1858.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  15%|█▌        | 186/1208 [05:27<30:02,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000133, train/loss_step=0.0376, global_step=1858.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  15%|█▌        | 187/1208 [05:28<29:56,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000133, train/loss_step=0.0376, global_step=1858.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  15%|█▌        | 187/1208 [05:29<29:56,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000463, train/loss_step=0.140, global_step=1858.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  16%|█▌        | 188/1208 [05:32<30:02,  1.77s/it, loss=0.124, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000463, train/loss_step=0.140, global_step=1858.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  16%|█▌        | 188/1208 [05:32<30:02,  1.77s/it, loss=0.132, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000672, train/loss_step=0.197, global_step=1858.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  16%|█▌        | 189/1208 [05:33<29:57,  1.76s/it, loss=0.132, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000672, train/loss_step=0.197, global_step=1858.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  16%|█▌        | 189/1208 [05:33<29:57,  1.76s/it, loss=0.15, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00562, train/loss_step=0.458, global_step=1859.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  16%|█▌        | 190/1208 [05:34<29:51,  1.76s/it, loss=0.15, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00562, train/loss_step=0.458, global_step=1859.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  16%|█▌        | 190/1208 [05:34<29:51,  1.76s/it, loss=0.155, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00157, train/loss_step=0.313, global_step=1859.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  16%|█▌        | 191/1208 [05:35<29:46,  1.76s/it, loss=0.155, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00157, train/loss_step=0.313, global_step=1859.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  16%|█▌        | 191/1208 [05:35<29:46,  1.76s/it, loss=0.163, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000529, train/loss_step=0.158, global_step=1859.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  16%|█▌        | 192/1208 [05:38<29:52,  1.76s/it, loss=0.163, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000529, train/loss_step=0.158, global_step=1859.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  16%|█▌        | 192/1208 [05:38<29:52,  1.76s/it, loss=0.163, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.54e-5, train/loss_step=0.017, global_step=1859.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  16%|█▌        | 193/1208 [05:39<29:46,  1.76s/it, loss=0.163, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.54e-5, train/loss_step=0.017, global_step=1859.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  16%|█▌        | 193/1208 [05:39<29:46,  1.76s/it, loss=0.167, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000599, train/loss_step=0.173, global_step=1860.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  16%|█▌        | 194/1208 [05:40<29:41,  1.76s/it, loss=0.167, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000599, train/loss_step=0.173, global_step=1860.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  16%|█▌        | 194/1208 [05:40<29:41,  1.76s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0666, train/loss_vlb_step=0.000222, train/loss_step=0.0666, global_step=1860.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  16%|█▌        | 195/1208 [05:41<29:35,  1.75s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0666, train/loss_vlb_step=0.000222, train/loss_step=0.0666, global_step=1860.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  16%|█▌        | 195/1208 [05:41<29:35,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=2.47e-5, train/loss_step=0.00464, global_step=1860.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  16%|█▌        | 196/1208 [05:45<29:41,  1.76s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=2.47e-5, train/loss_step=0.00464, global_step=1860.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  16%|█▌        | 196/1208 [05:45<29:41,  1.76s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0511, train/loss_vlb_step=0.00018, train/loss_step=0.0511, global_step=1860.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  16%|█▋        | 197/1208 [05:46<29:36,  1.76s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0511, train/loss_vlb_step=0.00018, train/loss_step=0.0511, global_step=1860.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  16%|█▋        | 197/1208 [05:46<29:36,  1.76s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00701, train/loss_vlb_step=3.55e-5, train/loss_step=0.00701, global_step=1861.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  16%|█▋        | 198/1208 [05:47<29:30,  1.75s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00701, train/loss_vlb_step=3.55e-5, train/loss_step=0.00701, global_step=1861.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  16%|█▋        | 198/1208 [05:47<29:30,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=8.07e-5, train/loss_step=0.0193, global_step=1861.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  16%|█▋        | 199/1208 [05:48<29:25,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=8.07e-5, train/loss_step=0.0193, global_step=1861.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  16%|█▋        | 199/1208 [05:48<29:25,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00379, train/loss_vlb_step=2.13e-5, train/loss_step=0.00379, global_step=1861.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  17%|█▋        | 200/1208 [05:51<29:31,  1.76s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00379, train/loss_vlb_step=2.13e-5, train/loss_step=0.00379, global_step=1861.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  17%|█▋        | 200/1208 [05:51<29:31,  1.76s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000111, train/loss_step=0.0284, global_step=1861.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  17%|█▋        | 201/1208 [05:52<29:26,  1.75s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000111, train/loss_step=0.0284, global_step=1861.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  17%|█▋        | 201/1208 [05:52<29:26,  1.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0802, train/loss_vlb_step=0.000267, train/loss_step=0.0802, global_step=1862.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  17%|█▋        | 202/1208 [05:53<29:20,  1.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0802, train/loss_vlb_step=0.000267, train/loss_step=0.0802, global_step=1862.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  17%|█▋        | 202/1208 [05:53<29:20,  1.75s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=1.42e-5, train/loss_step=0.00234, global_step=1862.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  17%|█▋        | 203/1208 [05:54<29:15,  1.75s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=1.42e-5, train/loss_step=0.00234, global_step=1862.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  17%|█▋        | 203/1208 [05:54<29:15,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.564, train/loss_vlb_step=0.010, train/loss_step=0.564, global_step=1862.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]      Epoch 6:  17%|█▋        | 204/1208 [05:57<29:21,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.564, train/loss_vlb_step=0.010, train/loss_step=0.564, global_step=1862.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  17%|█▋        | 204/1208 [05:57<29:21,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00539, train/loss_vlb_step=2.85e-5, train/loss_step=0.00539, global_step=1862.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  17%|█▋        | 205/1208 [05:58<29:16,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00539, train/loss_vlb_step=2.85e-5, train/loss_step=0.00539, global_step=1862.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  17%|█▋        | 205/1208 [05:58<29:16,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.00474, train/loss_step=0.470, global_step=1863.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]     Epoch 6:  17%|█▋        | 206/1208 [05:59<29:10,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.00474, train/loss_step=0.470, global_step=1863.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  17%|█▋        | 206/1208 [05:59<29:10,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00443, train/loss_vlb_step=2.44e-5, train/loss_step=0.00443, global_step=1863.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  17%|█▋        | 207/1208 [06:01<29:05,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00443, train/loss_vlb_step=2.44e-5, train/loss_step=0.00443, global_step=1863.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  17%|█▋        | 207/1208 [06:01<29:05,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000116, train/loss_step=0.0293, global_step=1863.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  17%|█▋        | 208/1208 [06:04<29:11,  1.75s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000116, train/loss_step=0.0293, global_step=1863.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  17%|█▋        | 208/1208 [06:04<29:11,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.79e-5, train/loss_step=0.0185, global_step=1863.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  17%|█▋        | 209/1208 [06:05<29:06,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.79e-5, train/loss_step=0.0185, global_step=1863.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  17%|█▋        | 209/1208 [06:05<29:06,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00193, train/loss_step=0.353, global_step=1864.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  17%|█▋        | 210/1208 [06:06<29:00,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00193, train/loss_step=0.353, global_step=1864.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  17%|█▋        | 210/1208 [06:06<29:01,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.000976, train/loss_step=0.251, global_step=1864.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  17%|█▋        | 211/1208 [06:07<28:55,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.000976, train/loss_step=0.251, global_step=1864.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  17%|█▋        | 211/1208 [06:07<28:55,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.039, train/loss_vlb_step=0.000147, train/loss_step=0.039, global_step=1864.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  18%|█▊        | 212/1208 [06:10<29:01,  1.75s/it, loss=0.109, v_num=0, train/loss_simple_step=0.039, train/loss_vlb_step=0.000147, train/loss_step=0.039, global_step=1864.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  18%|█▊        | 212/1208 [06:10<29:01,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0937, train/loss_vlb_step=0.000308, train/loss_step=0.0937, global_step=1864.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  18%|█▊        | 213/1208 [06:11<28:56,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0937, train/loss_vlb_step=0.000308, train/loss_step=0.0937, global_step=1864.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  18%|█▊        | 213/1208 [06:11<28:56,  1.75s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00693, train/loss_vlb_step=3.6e-5, train/loss_step=0.00693, global_step=1865.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  18%|█▊        | 214/1208 [06:12<28:51,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00693, train/loss_vlb_step=3.6e-5, train/loss_step=0.00693, global_step=1865.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  18%|█▊        | 214/1208 [06:12<28:51,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000634, train/loss_step=0.187, global_step=1865.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  18%|█▊        | 215/1208 [06:13<28:46,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000634, train/loss_step=0.187, global_step=1865.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  18%|█▊        | 215/1208 [06:13<28:46,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.28e-5, train/loss_step=0.00212, global_step=1865.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  18%|█▊        | 216/1208 [06:16<28:49,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.28e-5, train/loss_step=0.00212, global_step=1865.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  18%|█▊        | 216/1208 [06:16<28:49,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000648, train/loss_step=0.189, global_step=1865.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  18%|█▊        | 217/1208 [06:17<28:44,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000648, train/loss_step=0.189, global_step=1865.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  18%|█▊        | 217/1208 [06:17<28:44,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000534, train/loss_step=0.161, global_step=1866.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  18%|█▊        | 218/1208 [06:18<28:39,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000534, train/loss_step=0.161, global_step=1866.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  18%|█▊        | 218/1208 [06:18<28:39,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.560, train/loss_vlb_step=0.00995, train/loss_step=0.560, global_step=1866.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  18%|█▊        | 219/1208 [06:19<28:34,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.560, train/loss_vlb_step=0.00995, train/loss_step=0.560, global_step=1866.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  18%|█▊        | 219/1208 [06:19<28:34,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000103, train/loss_step=0.0263, global_step=1866.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  18%|█▊        | 220/1208 [06:22<28:38,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000103, train/loss_step=0.0263, global_step=1866.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  18%|█▊        | 220/1208 [06:22<28:38,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00133, train/loss_step=0.299, global_step=1866.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  18%|█▊        | 221/1208 [06:23<28:33,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00133, train/loss_step=0.299, global_step=1866.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  18%|█▊        | 221/1208 [06:23<28:33,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00623, train/loss_vlb_step=3.16e-5, train/loss_step=0.00623, global_step=1867.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  18%|█▊        | 222/1208 [06:24<28:28,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00623, train/loss_vlb_step=3.16e-5, train/loss_step=0.00623, global_step=1867.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  18%|█▊        | 222/1208 [06:24<28:28,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000542, train/loss_step=0.163, global_step=1867.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  18%|█▊        | 223/1208 [06:25<28:23,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000542, train/loss_step=0.163, global_step=1867.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  18%|█▊        | 223/1208 [06:25<28:23,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.69e-5, train/loss_step=0.0157, global_step=1867.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  19%|█▊        | 224/1208 [06:28<28:26,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.69e-5, train/loss_step=0.0157, global_step=1867.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  19%|█▊        | 224/1208 [06:28<28:26,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.87e-5, train/loss_step=0.0106, global_step=1867.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  19%|█▊        | 225/1208 [06:29<28:21,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.87e-5, train/loss_step=0.0106, global_step=1867.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  19%|█▊        | 225/1208 [06:29<28:21,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00633, train/loss_vlb_step=3.21e-5, train/loss_step=0.00633, global_step=1868.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  19%|█▊        | 226/1208 [06:30<28:16,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00633, train/loss_vlb_step=3.21e-5, train/loss_step=0.00633, global_step=1868.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  19%|█▊        | 226/1208 [06:30<28:16,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00805, train/loss_vlb_step=3.88e-5, train/loss_step=0.00805, global_step=1868.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  19%|█▉        | 227/1208 [06:31<28:11,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00805, train/loss_vlb_step=3.88e-5, train/loss_step=0.00805, global_step=1868.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  19%|█▉        | 227/1208 [06:31<28:11,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00461, train/loss_vlb_step=2.56e-5, train/loss_step=0.00461, global_step=1868.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  19%|█▉        | 228/1208 [06:34<28:15,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00461, train/loss_vlb_step=2.56e-5, train/loss_step=0.00461, global_step=1868.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  19%|█▉        | 228/1208 [06:34<28:15,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.900, train/loss_vlb_step=0.453, train/loss_step=0.900, global_step=1868.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]     Epoch 6:  19%|█▉        | 229/1208 [06:35<28:10,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.900, train/loss_vlb_step=0.453, train/loss_step=0.900, global_step=1868.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  19%|█▉        | 229/1208 [06:35<28:10,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.519, train/loss_vlb_step=0.00524, train/loss_step=0.519, global_step=1869.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  19%|█▉        | 230/1208 [06:36<28:05,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.519, train/loss_vlb_step=0.00524, train/loss_step=0.519, global_step=1869.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  19%|█▉        | 230/1208 [06:36<28:05,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000596, train/loss_step=0.174, global_step=1869.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  19%|█▉        | 231/1208 [06:37<28:00,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000596, train/loss_step=0.174, global_step=1869.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  19%|█▉        | 231/1208 [06:37<28:00,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00264, train/loss_vlb_step=1.56e-5, train/loss_step=0.00264, global_step=1869.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  19%|█▉        | 232/1208 [06:40<28:04,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00264, train/loss_vlb_step=1.56e-5, train/loss_step=0.00264, global_step=1869.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  19%|█▉        | 232/1208 [06:40<28:04,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.00116, train/loss_step=0.238, global_step=1869.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  19%|█▉        | 233/1208 [06:41<27:59,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.00116, train/loss_step=0.238, global_step=1869.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  19%|█▉        | 233/1208 [06:41<27:59,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.28e-5, train/loss_step=0.00215, global_step=1870.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  19%|█▉        | 234/1208 [06:42<27:54,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.28e-5, train/loss_step=0.00215, global_step=1870.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  19%|█▉        | 234/1208 [06:42<27:54,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0608, train/loss_vlb_step=0.000213, train/loss_step=0.0608, global_step=1870.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  19%|█▉        | 235/1208 [06:43<27:50,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0608, train/loss_vlb_step=0.000213, train/loss_step=0.0608, global_step=1870.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  19%|█▉        | 235/1208 [06:43<27:50,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.0028, train/loss_step=0.406, global_step=1870.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  20%|█▉        | 236/1208 [06:46<27:53,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.0028, train/loss_step=0.406, global_step=1870.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  20%|█▉        | 236/1208 [06:46<27:53,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000297, train/loss_step=0.0901, global_step=1870.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  20%|█▉        | 237/1208 [06:47<27:48,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000297, train/loss_step=0.0901, global_step=1870.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  20%|█▉        | 237/1208 [06:47<27:48,  1.72s/it, loss=0.185, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.00075, train/loss_step=0.214, global_step=1871.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  20%|█▉        | 238/1208 [06:48<27:43,  1.72s/it, loss=0.185, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.00075, train/loss_step=0.214, global_step=1871.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  20%|█▉        | 238/1208 [06:48<27:43,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000754, train/loss_step=0.200, global_step=1871.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  20%|█▉        | 239/1208 [06:49<27:39,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000754, train/loss_step=0.200, global_step=1871.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  20%|█▉        | 239/1208 [06:49<27:39,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00208, train/loss_step=0.346, global_step=1871.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  20%|█▉        | 240/1208 [06:52<27:42,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00208, train/loss_step=0.346, global_step=1871.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  20%|█▉        | 240/1208 [06:52<27:42,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000374, train/loss_step=0.114, global_step=1871.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  20%|█▉        | 241/1208 [06:53<27:37,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000374, train/loss_step=0.114, global_step=1871.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  20%|█▉        | 241/1208 [06:53<27:37,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.000147, train/loss_step=0.043, global_step=1872.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  20%|██        | 242/1208 [06:54<27:33,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.000147, train/loss_step=0.043, global_step=1872.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  20%|██        | 242/1208 [06:54<27:33,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000802, train/loss_step=0.212, global_step=1872.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  20%|██        | 243/1208 [06:55<27:28,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000802, train/loss_step=0.212, global_step=1872.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  20%|██        | 243/1208 [06:55<27:28,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.14e-5, train/loss_step=0.00188, global_step=1872.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  20%|██        | 244/1208 [06:58<27:31,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.14e-5, train/loss_step=0.00188, global_step=1872.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  20%|██        | 244/1208 [06:58<27:31,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000139, train/loss_step=0.0363, global_step=1872.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  20%|██        | 245/1208 [06:59<27:27,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000139, train/loss_step=0.0363, global_step=1872.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  20%|██        | 245/1208 [06:59<27:27,  1.71s/it, loss=0.197, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00257, train/loss_step=0.373, global_step=1873.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  20%|██        | 246/1208 [07:00<27:22,  1.71s/it, loss=0.197, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00257, train/loss_step=0.373, global_step=1873.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  20%|██        | 246/1208 [07:00<27:22,  1.71s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.00011, train/loss_step=0.0298, global_step=1873.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  20%|██        | 247/1208 [07:01<27:18,  1.70s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.00011, train/loss_step=0.0298, global_step=1873.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  20%|██        | 247/1208 [07:01<27:18,  1.70s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0822, train/loss_vlb_step=0.000275, train/loss_step=0.0822, global_step=1873.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  21%|██        | 248/1208 [07:04<27:21,  1.71s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0822, train/loss_vlb_step=0.000275, train/loss_step=0.0822, global_step=1873.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  21%|██        | 248/1208 [07:04<27:21,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00364, train/loss_step=0.415, global_step=1873.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  21%|██        | 249/1208 [07:05<27:16,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00364, train/loss_step=0.415, global_step=1873.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  21%|██        | 249/1208 [07:05<27:16,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000636, train/loss_step=0.183, global_step=1874.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  21%|██        | 250/1208 [07:06<27:12,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000636, train/loss_step=0.183, global_step=1874.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  21%|██        | 250/1208 [07:06<27:12,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00665, train/loss_vlb_step=3.25e-5, train/loss_step=0.00665, global_step=1874.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  21%|██        | 251/1208 [07:07<27:08,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00665, train/loss_vlb_step=3.25e-5, train/loss_step=0.00665, global_step=1874.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  21%|██        | 251/1208 [07:07<27:08,  1.70s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.000171, train/loss_step=0.0489, global_step=1874.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  21%|██        | 252/1208 [07:09<27:11,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.000171, train/loss_step=0.0489, global_step=1874.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  21%|██        | 252/1208 [07:09<27:11,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00367, train/loss_vlb_step=2.04e-5, train/loss_step=0.00367, global_step=1874.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  21%|██        | 253/1208 [07:10<27:06,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00367, train/loss_vlb_step=2.04e-5, train/loss_step=0.00367, global_step=1874.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  21%|██        | 253/1208 [07:10<27:06,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000433, train/loss_step=0.132, global_step=1875.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  21%|██        | 254/1208 [07:11<27:02,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000433, train/loss_step=0.132, global_step=1875.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  21%|██        | 254/1208 [07:11<27:02,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0634, train/loss_vlb_step=0.00022, train/loss_step=0.0634, global_step=1875.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  21%|██        | 255/1208 [07:12<26:58,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0634, train/loss_vlb_step=0.00022, train/loss_step=0.0634, global_step=1875.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  21%|██        | 255/1208 [07:12<26:58,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.000158, train/loss_step=0.0425, global_step=1875.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  21%|██        | 256/1208 [07:15<27:01,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.000158, train/loss_step=0.0425, global_step=1875.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  21%|██        | 256/1208 [07:15<27:01,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.000195, train/loss_step=0.0543, global_step=1875.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  21%|██▏       | 257/1208 [07:16<26:56,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.000195, train/loss_step=0.0543, global_step=1875.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  21%|██▏       | 257/1208 [07:16<26:56,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0746, train/loss_vlb_step=0.000255, train/loss_step=0.0746, global_step=1876.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  21%|██▏       | 258/1208 [07:17<26:52,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0746, train/loss_vlb_step=0.000255, train/loss_step=0.0746, global_step=1876.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  21%|██▏       | 258/1208 [07:17<26:52,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0914, train/loss_vlb_step=0.000307, train/loss_step=0.0914, global_step=1876.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  21%|██▏       | 259/1208 [07:18<26:48,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0914, train/loss_vlb_step=0.000307, train/loss_step=0.0914, global_step=1876.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  21%|██▏       | 259/1208 [07:18<26:48,  1.69s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.77e-5, train/loss_step=0.0126, global_step=1876.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  22%|██▏       | 260/1208 [07:21<26:51,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.77e-5, train/loss_step=0.0126, global_step=1876.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  22%|██▏       | 260/1208 [07:21<26:51,  1.70s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.00793, train/loss_vlb_step=3.89e-5, train/loss_step=0.00793, global_step=1876.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  22%|██▏       | 261/1208 [07:22<26:46,  1.70s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.00793, train/loss_vlb_step=3.89e-5, train/loss_step=0.00793, global_step=1876.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  22%|██▏       | 261/1208 [07:22<26:46,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000674, train/loss_step=0.196, global_step=1877.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  22%|██▏       | 262/1208 [07:23<26:42,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000674, train/loss_step=0.196, global_step=1877.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  22%|██▏       | 262/1208 [07:23<26:42,  1.69s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=1.34e-5, train/loss_step=0.00232, global_step=1877.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  22%|██▏       | 263/1208 [07:24<26:38,  1.69s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=1.34e-5, train/loss_step=0.00232, global_step=1877.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  22%|██▏       | 263/1208 [07:24<26:38,  1.69s/it, loss=0.098, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000347, train/loss_step=0.106, global_step=1877.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  22%|██▏       | 264/1208 [07:27<26:41,  1.70s/it, loss=0.098, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000347, train/loss_step=0.106, global_step=1877.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  22%|██▏       | 264/1208 [07:27<26:41,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000444, train/loss_step=0.135, global_step=1877.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  22%|██▏       | 265/1208 [07:28<26:36,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000444, train/loss_step=0.135, global_step=1877.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  22%|██▏       | 265/1208 [07:28<26:36,  1.69s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=1878.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  22%|██▏       | 266/1208 [07:29<26:32,  1.69s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=1878.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  22%|██▏       | 266/1208 [07:29<26:32,  1.69s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000338, train/loss_step=0.102, global_step=1878.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  22%|██▏       | 267/1208 [07:30<26:28,  1.69s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000338, train/loss_step=0.102, global_step=1878.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  22%|██▏       | 267/1208 [07:30<26:28,  1.69s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.0906, train/loss_vlb_step=0.000301, train/loss_step=0.0906, global_step=1878.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  22%|██▏       | 268/1208 [07:33<26:31,  1.69s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.0906, train/loss_vlb_step=0.000301, train/loss_step=0.0906, global_step=1878.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  22%|██▏       | 268/1208 [07:33<26:31,  1.69s/it, loss=0.0802, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000423, train/loss_step=0.127, global_step=1878.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  22%|██▏       | 269/1208 [07:34<26:27,  1.69s/it, loss=0.0802, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000423, train/loss_step=0.127, global_step=1878.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  22%|██▏       | 269/1208 [07:34<26:27,  1.69s/it, loss=0.0718, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.53e-5, train/loss_step=0.0146, global_step=1879.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  22%|██▏       | 270/1208 [07:35<26:23,  1.69s/it, loss=0.0718, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.53e-5, train/loss_step=0.0146, global_step=1879.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  22%|██▏       | 270/1208 [07:35<26:23,  1.69s/it, loss=0.0718, v_num=0, train/loss_simple_step=0.00685, train/loss_vlb_step=3.41e-5, train/loss_step=0.00685, global_step=1879.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  22%|██▏       | 271/1208 [07:36<26:19,  1.69s/it, loss=0.0718, v_num=0, train/loss_simple_step=0.00685, train/loss_vlb_step=3.41e-5, train/loss_step=0.00685, global_step=1879.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  22%|██▏       | 271/1208 [07:36<26:19,  1.69s/it, loss=0.077, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000519, train/loss_step=0.153, global_step=1879.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  23%|██▎       | 272/1208 [07:39<26:21,  1.69s/it, loss=0.077, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000519, train/loss_step=0.153, global_step=1879.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  23%|██▎       | 272/1208 [07:39<26:21,  1.69s/it, loss=0.0791, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.000155, train/loss_step=0.045, global_step=1879.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  23%|██▎       | 273/1208 [07:40<26:17,  1.69s/it, loss=0.0791, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.000155, train/loss_step=0.045, global_step=1879.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  23%|██▎       | 273/1208 [07:40<26:17,  1.69s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.421, train/loss_vlb_step=0.00319, train/loss_step=0.421, global_step=1880.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  23%|██▎       | 274/1208 [07:41<26:13,  1.68s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.421, train/loss_vlb_step=0.00319, train/loss_step=0.421, global_step=1880.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  23%|██▎       | 274/1208 [07:41<26:13,  1.68s/it, loss=0.102, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000804, train/loss_step=0.225, global_step=1880.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  23%|██▎       | 275/1208 [07:42<26:09,  1.68s/it, loss=0.102, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000804, train/loss_step=0.225, global_step=1880.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  23%|██▎       | 275/1208 [07:42<26:09,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.0017, train/loss_step=0.306, global_step=1880.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  23%|██▎       | 276/1208 [07:45<26:12,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.0017, train/loss_step=0.306, global_step=1880.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  23%|██▎       | 276/1208 [07:45<26:12,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00644, train/loss_vlb_step=3.13e-5, train/loss_step=0.00644, global_step=1880.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  23%|██▎       | 277/1208 [07:46<26:08,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00644, train/loss_vlb_step=3.13e-5, train/loss_step=0.00644, global_step=1880.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  23%|██▎       | 277/1208 [07:46<26:08,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.0114, train/loss_step=0.485, global_step=1881.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]     Epoch 6:  23%|██▎       | 278/1208 [07:47<26:04,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.0114, train/loss_step=0.485, global_step=1881.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  23%|██▎       | 278/1208 [07:47<26:04,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00496, train/loss_step=0.427, global_step=1881.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  23%|██▎       | 279/1208 [07:48<26:00,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00496, train/loss_step=0.427, global_step=1881.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  23%|██▎       | 279/1208 [07:48<26:00,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00647, train/loss_vlb_step=3.42e-5, train/loss_step=0.00647, global_step=1881.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  23%|██▎       | 280/1208 [07:51<26:02,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00647, train/loss_vlb_step=3.42e-5, train/loss_step=0.00647, global_step=1881.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  23%|██▎       | 280/1208 [07:51<26:02,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00165, train/loss_step=0.280, global_step=1881.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  23%|██▎       | 281/1208 [07:52<25:58,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00165, train/loss_step=0.280, global_step=1881.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  23%|██▎       | 281/1208 [07:52<25:58,  1.68s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000119, train/loss_step=0.0304, global_step=1882.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  23%|██▎       | 282/1208 [07:53<25:54,  1.68s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000119, train/loss_step=0.0304, global_step=1882.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  23%|██▎       | 282/1208 [07:53<25:54,  1.68s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00725, train/loss_vlb_step=3.6e-5, train/loss_step=0.00725, global_step=1882.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  23%|██▎       | 283/1208 [07:54<25:51,  1.68s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00725, train/loss_vlb_step=3.6e-5, train/loss_step=0.00725, global_step=1882.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  23%|██▎       | 283/1208 [07:54<25:51,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00225, train/loss_step=0.313, global_step=1882.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  24%|██▎       | 284/1208 [07:57<25:53,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00225, train/loss_step=0.313, global_step=1882.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  24%|██▎       | 284/1208 [07:57<25:53,  1.68s/it, loss=0.17, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000943, train/loss_step=0.237, global_step=1882.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  24%|██▎       | 285/1208 [07:58<25:49,  1.68s/it, loss=0.17, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000943, train/loss_step=0.237, global_step=1882.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  24%|██▎       | 285/1208 [07:58<25:49,  1.68s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000294, train/loss_step=0.0891, global_step=1883.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  24%|██▎       | 286/1208 [07:59<25:45,  1.68s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000294, train/loss_step=0.0891, global_step=1883.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  24%|██▎       | 286/1208 [07:59<25:45,  1.68s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.00018, train/loss_step=0.0499, global_step=1883.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  24%|██▍       | 287/1208 [08:00<25:41,  1.67s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.00018, train/loss_step=0.0499, global_step=1883.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  24%|██▍       | 287/1208 [08:00<25:41,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=1.86e-5, train/loss_step=0.00325, global_step=1883.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  24%|██▍       | 288/1208 [08:03<25:44,  1.68s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=1.86e-5, train/loss_step=0.00325, global_step=1883.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  24%|██▍       | 288/1208 [08:03<25:44,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0679, train/loss_vlb_step=0.000232, train/loss_step=0.0679, global_step=1883.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  24%|██▍       | 289/1208 [08:04<25:40,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0679, train/loss_vlb_step=0.000232, train/loss_step=0.0679, global_step=1883.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  24%|██▍       | 289/1208 [08:04<25:40,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.47e-5, train/loss_step=0.0215, global_step=1884.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  24%|██▍       | 290/1208 [08:05<25:36,  1.67s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.47e-5, train/loss_step=0.0215, global_step=1884.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  24%|██▍       | 290/1208 [08:05<25:36,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000677, train/loss_step=0.191, global_step=1884.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  24%|██▍       | 291/1208 [08:06<25:32,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000677, train/loss_step=0.191, global_step=1884.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  24%|██▍       | 291/1208 [08:06<25:32,  1.67s/it, loss=0.179, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00294, train/loss_step=0.362, global_step=1884.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  24%|██▍       | 292/1208 [08:09<25:34,  1.68s/it, loss=0.179, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00294, train/loss_step=0.362, global_step=1884.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  24%|██▍       | 292/1208 [08:09<25:34,  1.68s/it, loss=0.192, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00177, train/loss_step=0.316, global_step=1884.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  24%|██▍       | 293/1208 [08:10<25:31,  1.67s/it, loss=0.192, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00177, train/loss_step=0.316, global_step=1884.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  24%|██▍       | 293/1208 [08:10<25:31,  1.67s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=8.12e-5, train/loss_step=0.0193, global_step=1885.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  24%|██▍       | 294/1208 [08:11<25:27,  1.67s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=8.12e-5, train/loss_step=0.0193, global_step=1885.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  24%|██▍       | 294/1208 [08:11<25:27,  1.67s/it, loss=0.202, v_num=0, train/loss_simple_step=0.830, train/loss_vlb_step=0.0708, train/loss_step=0.830, global_step=1885.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  24%|██▍       | 295/1208 [08:12<25:23,  1.67s/it, loss=0.202, v_num=0, train/loss_simple_step=0.830, train/loss_vlb_step=0.0708, train/loss_step=0.830, global_step=1885.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  24%|██▍       | 295/1208 [08:12<25:23,  1.67s/it, loss=0.202, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00132, train/loss_step=0.295, global_step=1885.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  25%|██▍       | 296/1208 [08:15<25:25,  1.67s/it, loss=0.202, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00132, train/loss_step=0.295, global_step=1885.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  25%|██▍       | 296/1208 [08:15<25:25,  1.67s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000121, train/loss_step=0.0298, global_step=1885.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  25%|██▍       | 297/1208 [08:16<25:22,  1.67s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000121, train/loss_step=0.0298, global_step=1885.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  25%|██▍       | 297/1208 [08:16<25:22,  1.67s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.67e-5, train/loss_step=0.0151, global_step=1886.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  25%|██▍       | 298/1208 [08:17<25:18,  1.67s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.67e-5, train/loss_step=0.0151, global_step=1886.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  25%|██▍       | 298/1208 [08:17<25:18,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=1886.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  25%|██▍       | 299/1208 [08:18<25:14,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=1886.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  25%|██▍       | 299/1208 [08:18<25:14,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00466, train/loss_vlb_step=2.5e-5, train/loss_step=0.00466, global_step=1886.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  25%|██▍       | 300/1208 [08:21<25:16,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00466, train/loss_vlb_step=2.5e-5, train/loss_step=0.00466, global_step=1886.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  25%|██▍       | 300/1208 [08:21<25:16,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000441, train/loss_step=0.134, global_step=1886.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.85it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.85it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:25,  1.85it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.84it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.85it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.85it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.85it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.84it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.85it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.84it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.85it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.84it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.85it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.84it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.84it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.84it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.84it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.85it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.85it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.84it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.85it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.84it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.85it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.85it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.85it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:18,  1.84it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:18,  1.84it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.85it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.85it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.85it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.84it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.84it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.84it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.85it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.84it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.85it/s][ADDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.84it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.84it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.83it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.84it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.84it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.84it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.84it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.84it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:12,  1.85it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.85it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.84it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.84it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.84it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.84it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.84it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:18<00:08,  1.84it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.84it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.84it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.84it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.84it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.84it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.84it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.83it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.84it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.83it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.84it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.82it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.84it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.84it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.84it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.83it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.78it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.84it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.83it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.84it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.83it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.78it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.84it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.83it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.78it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:24<00:02,  1.84it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.83it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.78it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.83it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.83it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.78it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.83it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.83it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.83it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.83it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.83it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]Epoch 6:  25%|██▍       | 301/1208 [08:50<26:38,  1.76s/it, loss=0.157, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000441, train/loss_step=0.134, global_step=1886.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  25%|██▍       | 301/1208 [08:50<26:38,  1.76s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.88e-5, train/loss_step=0.0156, global_step=1887.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  25%|██▌       | 302/1208 [08:51<26:34,  1.76s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.88e-5, train/loss_step=0.0156, global_step=1887.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  25%|██▌       | 302/1208 [08:51<26:34,  1.76s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=0.000103, train/loss_step=0.0236, global_step=1887.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  25%|██▌       | 303/1208 [08:52<26:30,  1.76s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=0.000103, train/loss_step=0.0236, global_step=1887.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  25%|██▌       | 303/1208 [08:52<26:30,  1.76s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.83e-5, train/loss_step=0.0104, global_step=1887.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  25%|██▌       | 304/1208 [08:55<26:32,  1.76s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.83e-5, train/loss_step=0.0104, global_step=1887.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  25%|██▌       | 304/1208 [08:55<26:32,  1.76s/it, loss=0.155, v_num=0, train/loss_simple_step=0.514, train/loss_vlb_step=0.00779, train/loss_step=0.514, global_step=1887.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  25%|██▌       | 305/1208 [08:56<26:29,  1.76s/it, loss=0.155, v_num=0, train/loss_simple_step=0.514, train/loss_vlb_step=0.00779, train/loss_step=0.514, global_step=1887.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  25%|██▌       | 305/1208 [08:56<26:29,  1.76s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0877, train/loss_vlb_step=0.000292, train/loss_step=0.0877, global_step=1888.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  25%|██▌       | 306/1208 [08:57<26:25,  1.76s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0877, train/loss_vlb_step=0.000292, train/loss_step=0.0877, global_step=1888.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  25%|██▌       | 306/1208 [08:57<26:25,  1.76s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000115, train/loss_step=0.0282, global_step=1888.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  25%|██▌       | 307/1208 [08:58<26:21,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000115, train/loss_step=0.0282, global_step=1888.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  25%|██▌       | 307/1208 [08:58<26:21,  1.75s/it, loss=0.161, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000444, train/loss_step=0.135, global_step=1888.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  25%|██▌       | 308/1208 [09:01<26:22,  1.76s/it, loss=0.161, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000444, train/loss_step=0.135, global_step=1888.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  25%|██▌       | 308/1208 [09:01<26:22,  1.76s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0998, train/loss_vlb_step=0.000331, train/loss_step=0.0998, global_step=1888.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  26%|██▌       | 309/1208 [09:02<26:18,  1.76s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0998, train/loss_vlb_step=0.000331, train/loss_step=0.0998, global_step=1888.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  26%|██▌       | 309/1208 [09:02<26:18,  1.76s/it, loss=0.178, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00195, train/loss_step=0.339, global_step=1889.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  26%|██▌       | 310/1208 [09:03<26:14,  1.75s/it, loss=0.178, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00195, train/loss_step=0.339, global_step=1889.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  26%|██▌       | 310/1208 [09:03<26:14,  1.75s/it, loss=0.182, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00116, train/loss_step=0.263, global_step=1889.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  26%|██▌       | 311/1208 [09:04<26:11,  1.75s/it, loss=0.182, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00116, train/loss_step=0.263, global_step=1889.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  26%|██▌       | 311/1208 [09:04<26:11,  1.75s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.00019, train/loss_step=0.0521, global_step=1889.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  26%|██▌       | 312/1208 [09:07<26:12,  1.76s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.00019, train/loss_step=0.0521, global_step=1889.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  26%|██▌       | 312/1208 [09:07<26:12,  1.76s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00436, train/loss_vlb_step=2.37e-5, train/loss_step=0.00436, global_step=1889.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  26%|██▌       | 313/1208 [09:08<26:08,  1.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00436, train/loss_vlb_step=2.37e-5, train/loss_step=0.00436, global_step=1889.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  26%|██▌       | 313/1208 [09:08<26:08,  1.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.39e-5, train/loss_step=0.00247, global_step=1890.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  26%|██▌       | 314/1208 [09:09<26:04,  1.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.39e-5, train/loss_step=0.00247, global_step=1890.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  26%|██▌       | 314/1208 [09:09<26:04,  1.75s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.48e-5, train/loss_step=0.00247, global_step=1890.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  26%|██▌       | 315/1208 [09:10<26:01,  1.75s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.48e-5, train/loss_step=0.00247, global_step=1890.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  26%|██▌       | 315/1208 [09:10<26:01,  1.75s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.0733, train/loss_vlb_step=0.00025, train/loss_step=0.0733, global_step=1890.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  26%|██▌       | 316/1208 [09:13<26:02,  1.75s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.0733, train/loss_vlb_step=0.00025, train/loss_step=0.0733, global_step=1890.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  26%|██▌       | 316/1208 [09:13<26:02,  1.75s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000111, train/loss_step=0.0274, global_step=1890.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  26%|██▌       | 317/1208 [09:14<25:58,  1.75s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000111, train/loss_step=0.0274, global_step=1890.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  26%|██▌       | 317/1208 [09:14<25:58,  1.75s/it, loss=0.108, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000798, train/loss_step=0.220, global_step=1891.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  26%|██▋       | 318/1208 [09:15<25:54,  1.75s/it, loss=0.108, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000798, train/loss_step=0.220, global_step=1891.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  26%|██▋       | 318/1208 [09:15<25:54,  1.75s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.42e-5, train/loss_step=0.00244, global_step=1891.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  26%|██▋       | 319/1208 [09:16<25:51,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.42e-5, train/loss_step=0.00244, global_step=1891.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  26%|██▋       | 319/1208 [09:16<25:51,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00147, train/loss_step=0.302, global_step=1891.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  26%|██▋       | 320/1208 [09:19<25:52,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00147, train/loss_step=0.302, global_step=1891.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  26%|██▋       | 320/1208 [09:19<25:52,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000295, train/loss_step=0.087, global_step=1891.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  27%|██▋       | 321/1208 [09:20<25:48,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000295, train/loss_step=0.087, global_step=1891.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  27%|██▋       | 321/1208 [09:20<25:48,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00151, train/loss_step=0.316, global_step=1892.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  27%|██▋       | 322/1208 [09:21<25:44,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00151, train/loss_step=0.316, global_step=1892.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  27%|██▋       | 322/1208 [09:21<25:44,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000498, train/loss_step=0.145, global_step=1892.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  27%|██▋       | 323/1208 [09:22<25:41,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000498, train/loss_step=0.145, global_step=1892.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  27%|██▋       | 323/1208 [09:22<25:41,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.00035, train/loss_step=0.106, global_step=1892.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  27%|██▋       | 324/1208 [09:25<25:42,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.00035, train/loss_step=0.106, global_step=1892.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  27%|██▋       | 324/1208 [09:25<25:42,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0099, train/loss_vlb_step=4.78e-5, train/loss_step=0.0099, global_step=1892.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  27%|██▋       | 325/1208 [09:26<25:38,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0099, train/loss_vlb_step=4.78e-5, train/loss_step=0.0099, global_step=1892.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  27%|██▋       | 325/1208 [09:26<25:38,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0492, train/loss_vlb_step=0.000176, train/loss_step=0.0492, global_step=1893.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  27%|██▋       | 326/1208 [09:27<25:35,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0492, train/loss_vlb_step=0.000176, train/loss_step=0.0492, global_step=1893.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  27%|██▋       | 326/1208 [09:27<25:35,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000465, train/loss_step=0.140, global_step=1893.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  27%|██▋       | 327/1208 [09:28<25:31,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000465, train/loss_step=0.140, global_step=1893.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  27%|██▋       | 327/1208 [09:28<25:31,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.0017, train/loss_step=0.354, global_step=1893.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  27%|██▋       | 328/1208 [09:31<25:32,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.0017, train/loss_step=0.354, global_step=1893.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  27%|██▋       | 328/1208 [09:31<25:32,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0678, train/loss_vlb_step=0.000233, train/loss_step=0.0678, global_step=1893.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  27%|██▋       | 329/1208 [09:32<25:29,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0678, train/loss_vlb_step=0.000233, train/loss_step=0.0678, global_step=1893.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  27%|██▋       | 329/1208 [09:32<25:29,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=1894.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  27%|██▋       | 330/1208 [09:33<25:25,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=1894.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  27%|██▋       | 330/1208 [09:33<25:25,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00102, train/loss_step=0.251, global_step=1894.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  27%|██▋       | 331/1208 [09:34<25:21,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00102, train/loss_step=0.251, global_step=1894.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  27%|██▋       | 331/1208 [09:34<25:21,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000692, train/loss_step=0.191, global_step=1894.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  27%|██▋       | 332/1208 [09:37<25:22,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000692, train/loss_step=0.191, global_step=1894.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  27%|██▋       | 332/1208 [09:37<25:22,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.56e-5, train/loss_step=0.0206, global_step=1894.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  28%|██▊       | 333/1208 [09:38<25:19,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.56e-5, train/loss_step=0.0206, global_step=1894.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  28%|██▊       | 333/1208 [09:38<25:19,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000503, train/loss_step=0.150, global_step=1895.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  28%|██▊       | 334/1208 [09:39<25:15,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000503, train/loss_step=0.150, global_step=1895.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  28%|██▊       | 334/1208 [09:39<25:15,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000123, train/loss_step=0.0328, global_step=1895.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  28%|██▊       | 335/1208 [09:40<25:12,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000123, train/loss_step=0.0328, global_step=1895.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  28%|██▊       | 335/1208 [09:40<25:12,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00646, train/loss_vlb_step=3.28e-5, train/loss_step=0.00646, global_step=1895.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  28%|██▊       | 336/1208 [09:43<25:13,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00646, train/loss_vlb_step=3.28e-5, train/loss_step=0.00646, global_step=1895.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  28%|██▊       | 336/1208 [09:43<25:13,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.496, train/loss_vlb_step=0.00576, train/loss_step=0.496, global_step=1895.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  28%|██▊       | 337/1208 [09:44<25:09,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.496, train/loss_vlb_step=0.00576, train/loss_step=0.496, global_step=1895.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  28%|██▊       | 337/1208 [09:44<25:09,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.25e-5, train/loss_step=0.00209, global_step=1896.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  28%|██▊       | 338/1208 [09:45<25:06,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.25e-5, train/loss_step=0.00209, global_step=1896.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  28%|██▊       | 338/1208 [09:45<25:06,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00142, train/loss_step=0.323, global_step=1896.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  28%|██▊       | 339/1208 [09:46<25:02,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00142, train/loss_step=0.323, global_step=1896.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  28%|██▊       | 339/1208 [09:46<25:02,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000509, train/loss_step=0.153, global_step=1896.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  28%|██▊       | 340/1208 [09:49<25:03,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000509, train/loss_step=0.153, global_step=1896.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  28%|██▊       | 340/1208 [09:49<25:03,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0289, train/loss_vlb_step=0.000104, train/loss_step=0.0289, global_step=1896.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  28%|██▊       | 341/1208 [09:50<25:00,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0289, train/loss_vlb_step=0.000104, train/loss_step=0.0289, global_step=1896.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  28%|██▊       | 341/1208 [09:50<25:00,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.358, train/loss_vlb_step=0.00226, train/loss_step=0.358, global_step=1897.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  28%|██▊       | 342/1208 [09:51<24:56,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.358, train/loss_vlb_step=0.00226, train/loss_step=0.358, global_step=1897.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  28%|██▊       | 342/1208 [09:51<24:56,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.574, train/loss_vlb_step=0.0134, train/loss_step=0.574, global_step=1897.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  28%|██▊       | 343/1208 [09:52<24:53,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.574, train/loss_vlb_step=0.0134, train/loss_step=0.574, global_step=1897.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  28%|██▊       | 343/1208 [09:52<24:53,  1.73s/it, loss=0.193, v_num=0, train/loss_simple_step=0.540, train/loss_vlb_step=0.0099, train/loss_step=0.540, global_step=1897.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  28%|██▊       | 344/1208 [09:54<24:54,  1.73s/it, loss=0.193, v_num=0, train/loss_simple_step=0.540, train/loss_vlb_step=0.0099, train/loss_step=0.540, global_step=1897.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  28%|██▊       | 344/1208 [09:54<24:54,  1.73s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.43e-5, train/loss_step=0.0207, global_step=1897.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  29%|██▊       | 345/1208 [09:55<24:50,  1.73s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.43e-5, train/loss_step=0.0207, global_step=1897.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  29%|██▊       | 345/1208 [09:55<24:50,  1.73s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.7e-5, train/loss_step=0.0149, global_step=1898.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  29%|██▊       | 346/1208 [09:56<24:47,  1.73s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.7e-5, train/loss_step=0.0149, global_step=1898.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  29%|██▊       | 346/1208 [09:56<24:47,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0905, train/loss_vlb_step=0.000298, train/loss_step=0.0905, global_step=1898.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  29%|██▊       | 347/1208 [09:57<24:43,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0905, train/loss_vlb_step=0.000298, train/loss_step=0.0905, global_step=1898.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  29%|██▊       | 347/1208 [09:57<24:43,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=6.16e-5, train/loss_step=0.0132, global_step=1898.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  29%|██▉       | 348/1208 [10:00<24:44,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=6.16e-5, train/loss_step=0.0132, global_step=1898.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  29%|██▉       | 348/1208 [10:00<24:44,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=7.12e-5, train/loss_step=0.0158, global_step=1898.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  29%|██▉       | 349/1208 [10:01<24:41,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=7.12e-5, train/loss_step=0.0158, global_step=1898.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  29%|██▉       | 349/1208 [10:01<24:41,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000618, train/loss_step=0.183, global_step=1899.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  29%|██▉       | 350/1208 [10:02<24:37,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000618, train/loss_step=0.183, global_step=1899.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  29%|██▉       | 350/1208 [10:02<24:37,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.87e-5, train/loss_step=0.0105, global_step=1899.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  29%|██▉       | 351/1208 [10:03<24:34,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.87e-5, train/loss_step=0.0105, global_step=1899.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  29%|██▉       | 351/1208 [10:03<24:34,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00682, train/loss_vlb_step=3.43e-5, train/loss_step=0.00682, global_step=1899.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  29%|██▉       | 352/1208 [10:06<24:35,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00682, train/loss_vlb_step=3.43e-5, train/loss_step=0.00682, global_step=1899.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  29%|██▉       | 352/1208 [10:06<24:35,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=7.73e-5, train/loss_step=0.0192, global_step=1899.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  29%|██▉       | 353/1208 [10:07<24:32,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=7.73e-5, train/loss_step=0.0192, global_step=1899.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  29%|██▉       | 353/1208 [10:07<24:32,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000107, train/loss_step=0.0266, global_step=1900.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  29%|██▉       | 354/1208 [10:08<24:28,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000107, train/loss_step=0.0266, global_step=1900.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  29%|██▉       | 354/1208 [10:08<24:28,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000425, train/loss_step=0.128, global_step=1900.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  29%|██▉       | 355/1208 [10:09<24:25,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000425, train/loss_step=0.128, global_step=1900.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  29%|██▉       | 355/1208 [10:09<24:25,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000459, train/loss_step=0.133, global_step=1900.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  29%|██▉       | 356/1208 [10:12<24:26,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000459, train/loss_step=0.133, global_step=1900.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  29%|██▉       | 356/1208 [10:12<24:26,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000115, train/loss_step=0.029, global_step=1900.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  30%|██▉       | 357/1208 [10:13<24:22,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000115, train/loss_step=0.029, global_step=1900.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  30%|██▉       | 357/1208 [10:13<24:22,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000125, train/loss_step=0.0342, global_step=1901.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  30%|██▉       | 358/1208 [10:14<24:19,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000125, train/loss_step=0.0342, global_step=1901.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  30%|██▉       | 358/1208 [10:14<24:19,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.477, train/loss_vlb_step=0.00365, train/loss_step=0.477, global_step=1901.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  30%|██▉       | 359/1208 [10:15<24:16,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.477, train/loss_vlb_step=0.00365, train/loss_step=0.477, global_step=1901.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  30%|██▉       | 359/1208 [10:15<24:16,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.42e-5, train/loss_step=0.0144, global_step=1901.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  30%|██▉       | 360/1208 [10:18<24:17,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.42e-5, train/loss_step=0.0144, global_step=1901.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  30%|██▉       | 360/1208 [10:18<24:17,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.000105, train/loss_step=0.0276, global_step=1901.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  30%|██▉       | 361/1208 [10:19<24:13,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.000105, train/loss_step=0.0276, global_step=1901.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  30%|██▉       | 361/1208 [10:19<24:13,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000689, train/loss_step=0.195, global_step=1902.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  30%|██▉       | 362/1208 [10:20<24:10,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000689, train/loss_step=0.195, global_step=1902.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  30%|██▉       | 362/1208 [10:20<24:10,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0752, train/loss_vlb_step=0.000261, train/loss_step=0.0752, global_step=1902.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  30%|███       | 363/1208 [10:21<24:07,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0752, train/loss_vlb_step=0.000261, train/loss_step=0.0752, global_step=1902.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  30%|███       | 363/1208 [10:21<24:07,  1.71s/it, loss=0.0767, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.22e-5, train/loss_step=0.0197, global_step=1902.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  30%|███       | 364/1208 [10:24<24:08,  1.72s/it, loss=0.0767, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.22e-5, train/loss_step=0.0197, global_step=1902.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  30%|███       | 364/1208 [10:24<24:08,  1.72s/it, loss=0.0801, v_num=0, train/loss_simple_step=0.0873, train/loss_vlb_step=0.000287, train/loss_step=0.0873, global_step=1902.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  30%|███       | 365/1208 [10:25<24:04,  1.71s/it, loss=0.0801, v_num=0, train/loss_simple_step=0.0873, train/loss_vlb_step=0.000287, train/loss_step=0.0873, global_step=1902.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  30%|███       | 365/1208 [10:25<24:04,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.730, train/loss_vlb_step=0.0744, train/loss_step=0.730, global_step=1903.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]     Epoch 6:  30%|███       | 366/1208 [10:26<24:01,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.730, train/loss_vlb_step=0.0744, train/loss_step=0.730, global_step=1903.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  30%|███       | 366/1208 [10:26<24:01,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00154, train/loss_step=0.298, global_step=1903.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  30%|███       | 367/1208 [10:27<23:58,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00154, train/loss_step=0.298, global_step=1903.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  30%|███       | 367/1208 [10:27<23:58,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.39e-5, train/loss_step=0.0116, global_step=1903.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  30%|███       | 368/1208 [10:30<23:59,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.39e-5, train/loss_step=0.0116, global_step=1903.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  30%|███       | 368/1208 [10:30<23:59,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=1903.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  31%|███       | 369/1208 [10:31<23:55,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=1903.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  31%|███       | 369/1208 [10:31<23:55,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=1.57e-5, train/loss_step=0.00262, global_step=1904.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  31%|███       | 370/1208 [10:32<23:52,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=1.57e-5, train/loss_step=0.00262, global_step=1904.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  31%|███       | 370/1208 [10:32<23:52,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.34e-5, train/loss_step=0.0116, global_step=1904.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  31%|███       | 371/1208 [10:33<23:49,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.34e-5, train/loss_step=0.0116, global_step=1904.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  31%|███       | 371/1208 [10:33<23:49,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000577, train/loss_step=0.172, global_step=1904.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  31%|███       | 372/1208 [10:36<23:50,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000577, train/loss_step=0.172, global_step=1904.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  31%|███       | 372/1208 [10:36<23:50,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00265, train/loss_step=0.428, global_step=1904.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  31%|███       | 373/1208 [10:37<23:46,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00265, train/loss_step=0.428, global_step=1904.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  31%|███       | 373/1208 [10:37<23:46,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00106, train/loss_step=0.244, global_step=1905.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  31%|███       | 374/1208 [10:38<23:43,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00106, train/loss_step=0.244, global_step=1905.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  31%|███       | 374/1208 [10:38<23:43,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00165, train/loss_step=0.298, global_step=1905.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  31%|███       | 375/1208 [10:39<23:40,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00165, train/loss_step=0.298, global_step=1905.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  31%|███       | 375/1208 [10:39<23:40,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.82e-5, train/loss_step=0.0158, global_step=1905.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  31%|███       | 376/1208 [10:42<23:41,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.82e-5, train/loss_step=0.0158, global_step=1905.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  31%|███       | 376/1208 [10:42<23:41,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.467, train/loss_vlb_step=0.00552, train/loss_step=0.467, global_step=1905.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  31%|███       | 377/1208 [10:43<23:38,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.467, train/loss_vlb_step=0.00552, train/loss_step=0.467, global_step=1905.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  31%|███       | 377/1208 [10:43<23:38,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=5.28e-5, train/loss_step=0.0103, global_step=1906.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  31%|███▏      | 378/1208 [10:44<23:34,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=5.28e-5, train/loss_step=0.0103, global_step=1906.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  31%|███▏      | 378/1208 [10:44<23:34,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0991, train/loss_vlb_step=0.000327, train/loss_step=0.0991, global_step=1906.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  31%|███▏      | 379/1208 [10:45<23:31,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0991, train/loss_vlb_step=0.000327, train/loss_step=0.0991, global_step=1906.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  31%|███▏      | 379/1208 [10:45<23:31,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0063, train/loss_vlb_step=3.21e-5, train/loss_step=0.0063, global_step=1906.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  31%|███▏      | 380/1208 [10:48<23:32,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0063, train/loss_vlb_step=3.21e-5, train/loss_step=0.0063, global_step=1906.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  31%|███▏      | 380/1208 [10:48<23:32,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.000274, train/loss_step=0.0817, global_step=1906.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  32%|███▏      | 381/1208 [10:49<23:29,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.000274, train/loss_step=0.0817, global_step=1906.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  32%|███▏      | 381/1208 [10:49<23:29,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0075, train/loss_vlb_step=3.75e-5, train/loss_step=0.0075, global_step=1907.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  32%|███▏      | 382/1208 [10:50<23:26,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0075, train/loss_vlb_step=3.75e-5, train/loss_step=0.0075, global_step=1907.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  32%|███▏      | 382/1208 [10:50<23:26,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=2.05e-5, train/loss_step=0.00375, global_step=1907.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  32%|███▏      | 383/1208 [10:51<23:23,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=2.05e-5, train/loss_step=0.00375, global_step=1907.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  32%|███▏      | 383/1208 [10:51<23:23,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000132, train/loss_step=0.0344, global_step=1907.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  32%|███▏      | 384/1208 [10:54<23:23,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000132, train/loss_step=0.0344, global_step=1907.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  32%|███▏      | 384/1208 [10:54<23:23,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00454, train/loss_vlb_step=2.47e-5, train/loss_step=0.00454, global_step=1907.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  32%|███▏      | 385/1208 [10:55<23:20,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00454, train/loss_vlb_step=2.47e-5, train/loss_step=0.00454, global_step=1907.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  32%|███▏      | 385/1208 [10:55<23:20,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0893, train/loss_vlb_step=0.000295, train/loss_step=0.0893, global_step=1908.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  32%|███▏      | 386/1208 [10:56<23:17,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0893, train/loss_vlb_step=0.000295, train/loss_step=0.0893, global_step=1908.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  32%|███▏      | 386/1208 [10:56<23:17,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000422, train/loss_step=0.128, global_step=1908.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  32%|███▏      | 387/1208 [10:57<23:14,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000422, train/loss_step=0.128, global_step=1908.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  32%|███▏      | 387/1208 [10:57<23:14,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00763, train/loss_vlb_step=3.77e-5, train/loss_step=0.00763, global_step=1908.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  32%|███▏      | 388/1208 [11:00<23:15,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00763, train/loss_vlb_step=3.77e-5, train/loss_step=0.00763, global_step=1908.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  32%|███▏      | 388/1208 [11:00<23:15,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=7.02e-5, train/loss_step=0.0162, global_step=1908.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  32%|███▏      | 389/1208 [11:01<23:12,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=7.02e-5, train/loss_step=0.0162, global_step=1908.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  32%|███▏      | 389/1208 [11:01<23:12,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.572, train/loss_vlb_step=0.00911, train/loss_step=0.572, global_step=1909.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  32%|███▏      | 390/1208 [11:02<23:08,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.572, train/loss_vlb_step=0.00911, train/loss_step=0.572, global_step=1909.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  32%|███▏      | 390/1208 [11:02<23:08,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.555, train/loss_vlb_step=0.0084, train/loss_step=0.555, global_step=1909.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  32%|███▏      | 391/1208 [11:03<23:05,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.555, train/loss_vlb_step=0.0084, train/loss_step=0.555, global_step=1909.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  32%|███▏      | 391/1208 [11:03<23:05,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00121, train/loss_step=0.277, global_step=1909.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  32%|███▏      | 392/1208 [11:06<23:06,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00121, train/loss_step=0.277, global_step=1909.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  32%|███▏      | 392/1208 [11:06<23:06,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0546, train/loss_vlb_step=0.000194, train/loss_step=0.0546, global_step=1909.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  33%|███▎      | 393/1208 [11:07<23:03,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0546, train/loss_vlb_step=0.000194, train/loss_step=0.0546, global_step=1909.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  33%|███▎      | 393/1208 [11:07<23:03,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=1.16e-5, train/loss_step=0.00196, global_step=1910.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  33%|███▎      | 394/1208 [11:08<23:00,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=1.16e-5, train/loss_step=0.00196, global_step=1910.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  33%|███▎      | 394/1208 [11:08<23:00,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.0025, train/loss_step=0.385, global_step=1910.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]     Epoch 6:  33%|███▎      | 395/1208 [11:09<22:57,  1.69s/it, loss=0.141, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.0025, train/loss_step=0.385, global_step=1910.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  33%|███▎      | 395/1208 [11:09<22:57,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000403, train/loss_step=0.120, global_step=1910.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  33%|███▎      | 396/1208 [11:12<22:57,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000403, train/loss_step=0.120, global_step=1910.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  33%|███▎      | 396/1208 [11:12<22:57,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00116, train/loss_step=0.259, global_step=1910.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  33%|███▎      | 397/1208 [11:13<22:54,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00116, train/loss_step=0.259, global_step=1910.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  33%|███▎      | 397/1208 [11:13<22:54,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.93e-5, train/loss_step=0.0186, global_step=1911.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  33%|███▎      | 398/1208 [11:14<22:51,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.93e-5, train/loss_step=0.0186, global_step=1911.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  33%|███▎      | 398/1208 [11:14<22:51,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000442, train/loss_step=0.134, global_step=1911.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  33%|███▎      | 399/1208 [11:15<22:48,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000442, train/loss_step=0.134, global_step=1911.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  33%|███▎      | 399/1208 [11:15<22:48,  1.69s/it, loss=0.145, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000537, train/loss_step=0.158, global_step=1911.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  33%|███▎      | 400/1208 [11:17<22:49,  1.69s/it, loss=0.145, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000537, train/loss_step=0.158, global_step=1911.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  33%|███▎      | 400/1208 [11:17<22:49,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00802, train/loss_vlb_step=3.93e-5, train/loss_step=0.00802, global_step=1911.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  33%|███▎      | 401/1208 [11:18<22:46,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00802, train/loss_vlb_step=3.93e-5, train/loss_step=0.00802, global_step=1911.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  33%|███▎      | 401/1208 [11:18<22:46,  1.69s/it, loss=0.148, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000458, train/loss_step=0.139, global_step=1912.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  33%|███▎      | 402/1208 [11:19<22:43,  1.69s/it, loss=0.148, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000458, train/loss_step=0.139, global_step=1912.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  33%|███▎      | 402/1208 [11:19<22:43,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=1912.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  33%|███▎      | 403/1208 [11:20<22:40,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=1912.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  33%|███▎      | 403/1208 [11:20<22:40,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.51e-5, train/loss_step=0.00251, global_step=1912.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  33%|███▎      | 404/1208 [11:23<22:40,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.51e-5, train/loss_step=0.00251, global_step=1912.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  33%|███▎      | 404/1208 [11:23<22:40,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=1.34e-5, train/loss_step=0.0024, global_step=1912.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  34%|███▎      | 405/1208 [11:24<22:37,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=1.34e-5, train/loss_step=0.0024, global_step=1912.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  34%|███▎      | 405/1208 [11:24<22:37,  1.69s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.25e-5, train/loss_step=0.0198, global_step=1913.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  34%|███▎      | 406/1208 [11:25<22:34,  1.69s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.25e-5, train/loss_step=0.0198, global_step=1913.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  34%|███▎      | 406/1208 [11:25<22:34,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000667, train/loss_step=0.191, global_step=1913.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  34%|███▎      | 407/1208 [11:26<22:31,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000667, train/loss_step=0.191, global_step=1913.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  34%|███▎      | 407/1208 [11:26<22:31,  1.69s/it, loss=0.17, v_num=0, train/loss_simple_step=0.387, train/loss_vlb_step=0.00381, train/loss_step=0.387, global_step=1913.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  34%|███▍      | 408/1208 [11:29<22:32,  1.69s/it, loss=0.17, v_num=0, train/loss_simple_step=0.387, train/loss_vlb_step=0.00381, train/loss_step=0.387, global_step=1913.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  34%|███▍      | 408/1208 [11:29<22:32,  1.69s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0698, train/loss_vlb_step=0.000238, train/loss_step=0.0698, global_step=1913.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  34%|███▍      | 409/1208 [11:30<22:29,  1.69s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0698, train/loss_vlb_step=0.000238, train/loss_step=0.0698, global_step=1913.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  34%|███▍      | 409/1208 [11:30<22:29,  1.69s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0721, train/loss_vlb_step=0.000247, train/loss_step=0.0721, global_step=1914.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  34%|███▍      | 410/1208 [11:31<22:26,  1.69s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0721, train/loss_vlb_step=0.000247, train/loss_step=0.0721, global_step=1914.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  34%|███▍      | 410/1208 [11:31<22:26,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000839, train/loss_step=0.218, global_step=1914.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  34%|███▍      | 411/1208 [11:32<22:23,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000839, train/loss_step=0.218, global_step=1914.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  34%|███▍      | 411/1208 [11:32<22:23,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000102, train/loss_step=0.0255, global_step=1914.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  34%|███▍      | 412/1208 [11:35<22:24,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000102, train/loss_step=0.0255, global_step=1914.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  34%|███▍      | 412/1208 [11:35<22:24,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000718, train/loss_step=0.209, global_step=1914.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  34%|███▍      | 413/1208 [11:37<22:21,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000718, train/loss_step=0.209, global_step=1914.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  34%|███▍      | 413/1208 [11:37<22:21,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000192, train/loss_step=0.0514, global_step=1915.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  34%|███▍      | 414/1208 [11:38<22:18,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000192, train/loss_step=0.0514, global_step=1915.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  34%|███▍      | 414/1208 [11:38<22:18,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00108, train/loss_step=0.267, global_step=1915.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  34%|███▍      | 415/1208 [11:39<22:15,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00108, train/loss_step=0.267, global_step=1915.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  34%|███▍      | 415/1208 [11:39<22:15,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0078, train/loss_vlb_step=3.76e-5, train/loss_step=0.0078, global_step=1915.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  34%|███▍      | 416/1208 [11:42<22:17,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0078, train/loss_vlb_step=3.76e-5, train/loss_step=0.0078, global_step=1915.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  34%|███▍      | 416/1208 [11:42<22:17,  1.69s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00601, train/loss_vlb_step=3.03e-5, train/loss_step=0.00601, global_step=1915.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  35%|███▍      | 417/1208 [11:43<22:14,  1.69s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00601, train/loss_vlb_step=3.03e-5, train/loss_step=0.00601, global_step=1915.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  35%|███▍      | 417/1208 [11:43<22:14,  1.69s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.34e-5, train/loss_step=0.0228, global_step=1916.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  35%|███▍      | 418/1208 [11:44<22:11,  1.69s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.34e-5, train/loss_step=0.0228, global_step=1916.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  35%|███▍      | 418/1208 [11:44<22:11,  1.69s/it, loss=0.109, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000856, train/loss_step=0.220, global_step=1916.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  35%|███▍      | 419/1208 [11:45<22:08,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000856, train/loss_step=0.220, global_step=1916.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  35%|███▍      | 419/1208 [11:45<22:08,  1.68s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0518, train/loss_vlb_step=0.000186, train/loss_step=0.0518, global_step=1916.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  35%|███▍      | 420/1208 [11:48<22:09,  1.69s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0518, train/loss_vlb_step=0.000186, train/loss_step=0.0518, global_step=1916.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  35%|███▍      | 420/1208 [11:48<22:09,  1.69s/it, loss=0.122, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00334, train/loss_step=0.376, global_step=1916.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  35%|███▍      | 421/1208 [11:49<22:06,  1.69s/it, loss=0.122, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00334, train/loss_step=0.376, global_step=1916.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  35%|███▍      | 421/1208 [11:49<22:06,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00819, train/loss_vlb_step=3.95e-5, train/loss_step=0.00819, global_step=1917.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  35%|███▍      | 422/1208 [11:50<22:04,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00819, train/loss_vlb_step=3.95e-5, train/loss_step=0.00819, global_step=1917.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  35%|███▍      | 422/1208 [11:50<22:04,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.00086, train/loss_step=0.227, global_step=1917.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  35%|███▌      | 423/1208 [11:51<22:01,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.00086, train/loss_step=0.227, global_step=1917.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  35%|███▌      | 423/1208 [11:51<22:01,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00323, train/loss_step=0.369, global_step=1917.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  35%|███▌      | 424/1208 [11:55<22:02,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00323, train/loss_step=0.369, global_step=1917.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  35%|███▌      | 424/1208 [11:55<22:02,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0682, train/loss_vlb_step=0.000232, train/loss_step=0.0682, global_step=1917.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  35%|███▌      | 425/1208 [11:56<21:59,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0682, train/loss_vlb_step=0.000232, train/loss_step=0.0682, global_step=1917.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  35%|███▌      | 425/1208 [11:56<21:59,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0044, train/loss_vlb_step=2.34e-5, train/loss_step=0.0044, global_step=1918.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  35%|███▌      | 426/1208 [11:57<21:56,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0044, train/loss_vlb_step=2.34e-5, train/loss_step=0.0044, global_step=1918.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  35%|███▌      | 426/1208 [11:57<21:56,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00115, train/loss_step=0.258, global_step=1918.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  35%|███▌      | 427/1208 [11:58<21:53,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00115, train/loss_step=0.258, global_step=1918.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  35%|███▌      | 427/1208 [11:58<21:53,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00109, train/loss_step=0.264, global_step=1918.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  35%|███▌      | 428/1208 [12:01<21:54,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00109, train/loss_step=0.264, global_step=1918.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  35%|███▌      | 428/1208 [12:01<21:54,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000129, train/loss_step=0.0337, global_step=1918.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  36%|███▌      | 429/1208 [12:02<21:51,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000129, train/loss_step=0.0337, global_step=1918.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  36%|███▌      | 429/1208 [12:02<21:51,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0303, train/loss_vlb_step=0.000118, train/loss_step=0.0303, global_step=1919.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  36%|███▌      | 430/1208 [12:03<21:49,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0303, train/loss_vlb_step=0.000118, train/loss_step=0.0303, global_step=1919.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  36%|███▌      | 430/1208 [12:03<21:49,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.530, train/loss_vlb_step=0.00482, train/loss_step=0.530, global_step=1919.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  36%|███▌      | 431/1208 [12:04<21:46,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.530, train/loss_vlb_step=0.00482, train/loss_step=0.530, global_step=1919.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  36%|███▌      | 431/1208 [12:04<21:46,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000103, train/loss_step=0.0254, global_step=1919.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  36%|███▌      | 432/1208 [12:07<21:47,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000103, train/loss_step=0.0254, global_step=1919.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  36%|███▌      | 432/1208 [12:07<21:47,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.05e-5, train/loss_step=0.00175, global_step=1919.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  36%|███▌      | 433/1208 [12:08<21:44,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.05e-5, train/loss_step=0.00175, global_step=1919.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  36%|███▌      | 433/1208 [12:08<21:44,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0745, train/loss_vlb_step=0.000256, train/loss_step=0.0745, global_step=1920.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  36%|███▌      | 434/1208 [12:10<21:41,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0745, train/loss_vlb_step=0.000256, train/loss_step=0.0745, global_step=1920.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  36%|███▌      | 434/1208 [12:10<21:41,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00834, train/loss_vlb_step=4.05e-5, train/loss_step=0.00834, global_step=1920.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  36%|███▌      | 435/1208 [12:11<21:39,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00834, train/loss_vlb_step=4.05e-5, train/loss_step=0.00834, global_step=1920.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  36%|███▌      | 435/1208 [12:11<21:39,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0848, train/loss_vlb_step=0.00028, train/loss_step=0.0848, global_step=1920.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  36%|███▌      | 436/1208 [12:14<21:40,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0848, train/loss_vlb_step=0.00028, train/loss_step=0.0848, global_step=1920.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  36%|███▌      | 436/1208 [12:14<21:40,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000384, train/loss_step=0.117, global_step=1920.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  36%|███▌      | 437/1208 [12:15<21:37,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000384, train/loss_step=0.117, global_step=1920.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  36%|███▌      | 437/1208 [12:15<21:37,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0654, train/loss_vlb_step=0.000229, train/loss_step=0.0654, global_step=1921.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  36%|███▋      | 438/1208 [12:16<21:34,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0654, train/loss_vlb_step=0.000229, train/loss_step=0.0654, global_step=1921.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  36%|███▋      | 438/1208 [12:16<21:34,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00307, train/loss_vlb_step=1.77e-5, train/loss_step=0.00307, global_step=1921.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  36%|███▋      | 439/1208 [12:17<21:31,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00307, train/loss_vlb_step=1.77e-5, train/loss_step=0.00307, global_step=1921.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  36%|███▋      | 439/1208 [12:17<21:31,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000115, train/loss_step=0.0293, global_step=1921.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  36%|███▋      | 440/1208 [12:20<21:32,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000115, train/loss_step=0.0293, global_step=1921.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  36%|███▋      | 440/1208 [12:20<21:32,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00109, train/loss_step=0.253, global_step=1921.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  37%|███▋      | 441/1208 [12:21<21:29,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00109, train/loss_step=0.253, global_step=1921.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  37%|███▋      | 441/1208 [12:21<21:29,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=1922.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  37%|███▋      | 442/1208 [12:22<21:27,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=1922.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  37%|███▋      | 442/1208 [12:22<21:27,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0559, train/loss_vlb_step=0.000208, train/loss_step=0.0559, global_step=1922.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  37%|███▋      | 443/1208 [12:23<21:24,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0559, train/loss_vlb_step=0.000208, train/loss_step=0.0559, global_step=1922.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  37%|███▋      | 443/1208 [12:23<21:24,  1.68s/it, loss=0.108, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000516, train/loss_step=0.152, global_step=1922.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  37%|███▋      | 444/1208 [12:27<21:25,  1.68s/it, loss=0.108, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000516, train/loss_step=0.152, global_step=1922.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  37%|███▋      | 444/1208 [12:27<21:25,  1.68s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000139, train/loss_step=0.0369, global_step=1922.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  37%|███▋      | 445/1208 [12:28<21:22,  1.68s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000139, train/loss_step=0.0369, global_step=1922.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  37%|███▋      | 445/1208 [12:28<21:22,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000441, train/loss_step=0.133, global_step=1923.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  37%|███▋      | 446/1208 [12:29<21:19,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000441, train/loss_step=0.133, global_step=1923.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  37%|███▋      | 446/1208 [12:29<21:19,  1.68s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0869, train/loss_vlb_step=0.000291, train/loss_step=0.0869, global_step=1923.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  37%|███▋      | 447/1208 [12:30<21:17,  1.68s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0869, train/loss_vlb_step=0.000291, train/loss_step=0.0869, global_step=1923.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  37%|███▋      | 447/1208 [12:30<21:17,  1.68s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.64e-5, train/loss_step=0.0147, global_step=1923.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  37%|███▋      | 448/1208 [12:33<21:18,  1.68s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.64e-5, train/loss_step=0.0147, global_step=1923.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  37%|███▋      | 448/1208 [12:33<21:18,  1.68s/it, loss=0.105, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00132, train/loss_step=0.292, global_step=1923.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  37%|███▋      | 449/1208 [12:34<21:15,  1.68s/it, loss=0.105, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00132, train/loss_step=0.292, global_step=1923.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  37%|███▋      | 449/1208 [12:34<21:15,  1.68s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0728, train/loss_vlb_step=0.000247, train/loss_step=0.0728, global_step=1924.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  37%|███▋      | 450/1208 [12:35<21:12,  1.68s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0728, train/loss_vlb_step=0.000247, train/loss_step=0.0728, global_step=1924.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  37%|███▋      | 450/1208 [12:35<21:12,  1.68s/it, loss=0.0863, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.00037, train/loss_step=0.112, global_step=1924.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  37%|███▋      | 451/1208 [12:36<21:09,  1.68s/it, loss=0.0863, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.00037, train/loss_step=0.112, global_step=1924.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  37%|███▋      | 451/1208 [12:36<21:09,  1.68s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.87e-5, train/loss_step=0.0242, global_step=1924.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  37%|███▋      | 452/1208 [12:39<21:10,  1.68s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.87e-5, train/loss_step=0.0242, global_step=1924.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  37%|███▋      | 452/1208 [12:39<21:10,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.544, train/loss_vlb_step=0.00866, train/loss_step=0.544, global_step=1924.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  38%|███▊      | 453/1208 [12:40<21:08,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.544, train/loss_vlb_step=0.00866, train/loss_step=0.544, global_step=1924.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  38%|███▊      | 453/1208 [12:40<21:08,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000735, train/loss_step=0.194, global_step=1925.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  38%|███▊      | 454/1208 [12:41<21:05,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000735, train/loss_step=0.194, global_step=1925.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  38%|███▊      | 454/1208 [12:41<21:05,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.082, train/loss_vlb_step=0.000277, train/loss_step=0.082, global_step=1925.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  38%|███▊      | 455/1208 [12:43<21:02,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.082, train/loss_vlb_step=0.000277, train/loss_step=0.082, global_step=1925.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  38%|███▊      | 455/1208 [12:43<21:02,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.000163, train/loss_step=0.043, global_step=1925.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  38%|███▊      | 456/1208 [12:46<21:03,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.000163, train/loss_step=0.043, global_step=1925.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  38%|███▊      | 456/1208 [12:46<21:03,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000155, train/loss_step=0.042, global_step=1925.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  38%|███▊      | 457/1208 [12:47<21:00,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000155, train/loss_step=0.042, global_step=1925.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  38%|███▊      | 457/1208 [12:47<21:00,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.00061, train/loss_step=0.171, global_step=1926.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  38%|███▊      | 458/1208 [12:48<20:58,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.00061, train/loss_step=0.171, global_step=1926.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  38%|███▊      | 458/1208 [12:48<20:58,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.84e-5, train/loss_step=0.010, global_step=1926.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  38%|███▊      | 459/1208 [12:49<20:55,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.84e-5, train/loss_step=0.010, global_step=1926.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  38%|███▊      | 459/1208 [12:49<20:55,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000104, train/loss_step=0.0264, global_step=1926.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  38%|███▊      | 460/1208 [12:52<20:56,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000104, train/loss_step=0.0264, global_step=1926.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  38%|███▊      | 460/1208 [12:52<20:56,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000562, train/loss_step=0.165, global_step=1926.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  38%|███▊      | 461/1208 [12:53<20:53,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000562, train/loss_step=0.165, global_step=1926.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  38%|███▊      | 461/1208 [12:53<20:53,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000146, train/loss_step=0.0369, global_step=1927.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  38%|███▊      | 462/1208 [12:54<20:51,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000146, train/loss_step=0.0369, global_step=1927.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  38%|███▊      | 462/1208 [12:54<20:51,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000844, train/loss_step=0.221, global_step=1927.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  38%|███▊      | 463/1208 [12:55<20:48,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000844, train/loss_step=0.221, global_step=1927.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  38%|███▊      | 463/1208 [12:55<20:48,  1.68s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.68e-5, train/loss_step=0.0105, global_step=1927.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  38%|███▊      | 464/1208 [12:59<20:49,  1.68s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.68e-5, train/loss_step=0.0105, global_step=1927.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  38%|███▊      | 464/1208 [12:59<20:49,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00585, train/loss_vlb_step=2.99e-5, train/loss_step=0.00585, global_step=1927.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  38%|███▊      | 465/1208 [13:00<20:46,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00585, train/loss_vlb_step=2.99e-5, train/loss_step=0.00585, global_step=1927.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  38%|███▊      | 465/1208 [13:00<20:46,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000659, train/loss_step=0.187, global_step=1928.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  39%|███▊      | 466/1208 [13:01<20:43,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000659, train/loss_step=0.187, global_step=1928.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  39%|███▊      | 466/1208 [13:01<20:43,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.27e-5, train/loss_step=0.0196, global_step=1928.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  39%|███▊      | 467/1208 [13:02<20:41,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.27e-5, train/loss_step=0.0196, global_step=1928.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  39%|███▊      | 467/1208 [13:02<20:41,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.00356, train/loss_step=0.470, global_step=1928.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  39%|███▊      | 468/1208 [13:05<20:41,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.00356, train/loss_step=0.470, global_step=1928.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  39%|███▊      | 468/1208 [13:05<20:41,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00857, train/loss_vlb_step=4.44e-5, train/loss_step=0.00857, global_step=1928.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  39%|███▉      | 469/1208 [13:06<20:39,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00857, train/loss_vlb_step=4.44e-5, train/loss_step=0.00857, global_step=1928.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  39%|███▉      | 469/1208 [13:06<20:39,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00121, train/loss_step=0.282, global_step=1929.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  39%|███▉      | 470/1208 [13:07<20:36,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00121, train/loss_step=0.282, global_step=1929.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  39%|███▉      | 470/1208 [13:07<20:36,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.26e-5, train/loss_step=0.00213, global_step=1929.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  39%|███▉      | 471/1208 [13:08<20:33,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.26e-5, train/loss_step=0.00213, global_step=1929.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  39%|███▉      | 471/1208 [13:08<20:33,  1.67s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000111, train/loss_step=0.0296, global_step=1929.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  39%|███▉      | 472/1208 [13:11<20:34,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000111, train/loss_step=0.0296, global_step=1929.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  39%|███▉      | 472/1208 [13:11<20:34,  1.68s/it, loss=0.102, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.000121, train/loss_step=0.032, global_step=1929.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  39%|███▉      | 473/1208 [13:12<20:32,  1.68s/it, loss=0.102, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.000121, train/loss_step=0.032, global_step=1929.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  39%|███▉      | 473/1208 [13:12<20:32,  1.68s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.00643, train/loss_vlb_step=3.25e-5, train/loss_step=0.00643, global_step=1930.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  39%|███▉      | 474/1208 [13:13<20:29,  1.67s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.00643, train/loss_vlb_step=3.25e-5, train/loss_step=0.00643, global_step=1930.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  39%|███▉      | 474/1208 [13:13<20:29,  1.67s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000858, train/loss_step=0.226, global_step=1930.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  39%|███▉      | 475/1208 [13:14<20:26,  1.67s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000858, train/loss_step=0.226, global_step=1930.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  39%|███▉      | 475/1208 [13:14<20:26,  1.67s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0836, train/loss_vlb_step=0.000286, train/loss_step=0.0836, global_step=1930.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  39%|███▉      | 476/1208 [13:18<20:27,  1.68s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0836, train/loss_vlb_step=0.000286, train/loss_step=0.0836, global_step=1930.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  39%|███▉      | 476/1208 [13:18<20:27,  1.68s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000104, train/loss_step=0.0266, global_step=1930.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  39%|███▉      | 477/1208 [13:19<20:24,  1.68s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000104, train/loss_step=0.0266, global_step=1930.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  39%|███▉      | 477/1208 [13:19<20:24,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.555, train/loss_vlb_step=0.0102, train/loss_step=0.555, global_step=1931.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]     Epoch 6:  40%|███▉      | 478/1208 [13:20<20:22,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.555, train/loss_vlb_step=0.0102, train/loss_step=0.555, global_step=1931.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  40%|███▉      | 478/1208 [13:20<20:22,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.36e-5, train/loss_step=0.0213, global_step=1931.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  40%|███▉      | 479/1208 [13:21<20:19,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.36e-5, train/loss_step=0.0213, global_step=1931.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  40%|███▉      | 479/1208 [13:21<20:19,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00102, train/loss_step=0.248, global_step=1931.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  40%|███▉      | 480/1208 [13:24<20:20,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00102, train/loss_step=0.248, global_step=1931.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  40%|███▉      | 480/1208 [13:24<20:20,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.449, train/loss_vlb_step=0.00354, train/loss_step=0.449, global_step=1931.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  40%|███▉      | 481/1208 [13:25<20:17,  1.67s/it, loss=0.146, v_num=0, train/loss_simple_step=0.449, train/loss_vlb_step=0.00354, train/loss_step=0.449, global_step=1931.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  40%|███▉      | 481/1208 [13:25<20:17,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000965, train/loss_step=0.230, global_step=1932.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  40%|███▉      | 482/1208 [13:26<20:14,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000965, train/loss_step=0.230, global_step=1932.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  40%|███▉      | 482/1208 [13:26<20:14,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.089, train/loss_vlb_step=0.000295, train/loss_step=0.089, global_step=1932.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  40%|███▉      | 483/1208 [13:27<20:12,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.089, train/loss_vlb_step=0.000295, train/loss_step=0.089, global_step=1932.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  40%|███▉      | 483/1208 [13:27<20:12,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00122, train/loss_step=0.279, global_step=1932.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  40%|████      | 484/1208 [13:30<20:12,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00122, train/loss_step=0.279, global_step=1932.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  40%|████      | 484/1208 [13:30<20:12,  1.68s/it, loss=0.195, v_num=0, train/loss_simple_step=0.654, train/loss_vlb_step=0.0338, train/loss_step=0.654, global_step=1932.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  40%|████      | 485/1208 [13:31<20:10,  1.67s/it, loss=0.195, v_num=0, train/loss_simple_step=0.654, train/loss_vlb_step=0.0338, train/loss_step=0.654, global_step=1932.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  40%|████      | 485/1208 [13:31<20:10,  1.67s/it, loss=0.191, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000333, train/loss_step=0.101, global_step=1933.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  40%|████      | 486/1208 [13:32<20:07,  1.67s/it, loss=0.191, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000333, train/loss_step=0.101, global_step=1933.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  40%|████      | 486/1208 [13:32<20:07,  1.67s/it, loss=0.206, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00194, train/loss_step=0.337, global_step=1933.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  40%|████      | 487/1208 [13:34<20:05,  1.67s/it, loss=0.206, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00194, train/loss_step=0.337, global_step=1933.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  40%|████      | 487/1208 [13:34<20:05,  1.67s/it, loss=0.188, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=1933.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  40%|████      | 488/1208 [13:37<20:05,  1.67s/it, loss=0.188, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=1933.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  40%|████      | 488/1208 [13:37<20:05,  1.67s/it, loss=0.217, v_num=0, train/loss_simple_step=0.580, train/loss_vlb_step=0.0131, train/loss_step=0.580, global_step=1933.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  40%|████      | 489/1208 [13:38<20:03,  1.67s/it, loss=0.217, v_num=0, train/loss_simple_step=0.580, train/loss_vlb_step=0.0131, train/loss_step=0.580, global_step=1933.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  40%|████      | 489/1208 [13:38<20:03,  1.67s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0805, train/loss_vlb_step=0.000267, train/loss_step=0.0805, global_step=1934.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  41%|████      | 490/1208 [13:39<20:00,  1.67s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0805, train/loss_vlb_step=0.000267, train/loss_step=0.0805, global_step=1934.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  41%|████      | 490/1208 [13:39<20:00,  1.67s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0711, train/loss_vlb_step=0.00024, train/loss_step=0.0711, global_step=1934.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  41%|████      | 491/1208 [13:40<19:58,  1.67s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0711, train/loss_vlb_step=0.00024, train/loss_step=0.0711, global_step=1934.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  41%|████      | 491/1208 [13:40<19:58,  1.67s/it, loss=0.216, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.0005, train/loss_step=0.148, global_step=1934.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  41%|████      | 492/1208 [13:43<19:58,  1.67s/it, loss=0.216, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.0005, train/loss_step=0.148, global_step=1934.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  41%|████      | 492/1208 [13:43<19:58,  1.67s/it, loss=0.226, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000925, train/loss_step=0.244, global_step=1934.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  41%|████      | 493/1208 [13:44<19:56,  1.67s/it, loss=0.226, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000925, train/loss_step=0.244, global_step=1934.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  41%|████      | 493/1208 [13:44<19:56,  1.67s/it, loss=0.24, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00122, train/loss_step=0.277, global_step=1935.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  41%|████      | 494/1208 [13:45<19:53,  1.67s/it, loss=0.24, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00122, train/loss_step=0.277, global_step=1935.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  41%|████      | 494/1208 [13:45<19:53,  1.67s/it, loss=0.23, v_num=0, train/loss_simple_step=0.0247, train/loss_vlb_step=0.000102, train/loss_step=0.0247, global_step=1935.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  41%|████      | 495/1208 [13:46<19:50,  1.67s/it, loss=0.23, v_num=0, train/loss_simple_step=0.0247, train/loss_vlb_step=0.000102, train/loss_step=0.0247, global_step=1935.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  41%|████      | 495/1208 [13:46<19:50,  1.67s/it, loss=0.23, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.0003, train/loss_step=0.0894, global_step=1935.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  41%|████      | 496/1208 [13:49<19:51,  1.67s/it, loss=0.23, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.0003, train/loss_step=0.0894, global_step=1935.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  41%|████      | 496/1208 [13:49<19:51,  1.67s/it, loss=0.23, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.88e-5, train/loss_step=0.0233, global_step=1935.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  41%|████      | 497/1208 [13:51<19:48,  1.67s/it, loss=0.23, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.88e-5, train/loss_step=0.0233, global_step=1935.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  41%|████      | 497/1208 [13:51<19:48,  1.67s/it, loss=0.212, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.00073, train/loss_step=0.200, global_step=1936.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  41%|████      | 498/1208 [13:52<19:46,  1.67s/it, loss=0.212, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.00073, train/loss_step=0.200, global_step=1936.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  41%|████      | 498/1208 [13:52<19:46,  1.67s/it, loss=0.214, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.000173, train/loss_step=0.0468, global_step=1936.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  41%|████▏     | 499/1208 [13:53<19:43,  1.67s/it, loss=0.214, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.000173, train/loss_step=0.0468, global_step=1936.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  41%|████▏     | 499/1208 [13:53<19:43,  1.67s/it, loss=0.201, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.19e-5, train/loss_step=0.002, global_step=1936.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  41%|████▏     | 500/1208 [13:55<19:43,  1.67s/it, loss=0.201, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.19e-5, train/loss_step=0.002, global_step=1936.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  41%|████▏     | 500/1208 [13:55<19:43,  1.67s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8e-5, train/loss_step=0.0203, global_step=1936.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  41%|████▏     | 501/1208 [13:56<19:41,  1.67s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8e-5, train/loss_step=0.0203, global_step=1936.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  41%|████▏     | 501/1208 [13:56<19:41,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=9.35e-6, train/loss_step=0.00156, global_step=1937.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  42%|████▏     | 502/1208 [13:57<19:38,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=9.35e-6, train/loss_step=0.00156, global_step=1937.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  42%|████▏     | 502/1208 [13:57<19:38,  1.67s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.000133, train/loss_step=0.0352, global_step=1937.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  42%|████▏     | 503/1208 [13:59<19:35,  1.67s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.000133, train/loss_step=0.0352, global_step=1937.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  42%|████▏     | 503/1208 [13:59<19:35,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000764, train/loss_step=0.208, global_step=1937.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  42%|████▏     | 504/1208 [14:01<19:35,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000764, train/loss_step=0.208, global_step=1937.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  42%|████▏     | 504/1208 [14:01<19:35,  1.67s/it, loss=0.135, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=1937.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  42%|████▏     | 505/1208 [14:02<19:33,  1.67s/it, loss=0.135, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=1937.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  42%|████▏     | 505/1208 [14:02<19:33,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000763, train/loss_step=0.194, global_step=1938.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  42%|████▏     | 506/1208 [14:03<19:30,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000763, train/loss_step=0.194, global_step=1938.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  42%|████▏     | 506/1208 [14:03<19:30,  1.67s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.85e-5, train/loss_step=0.0126, global_step=1938.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  42%|████▏     | 507/1208 [14:04<19:28,  1.67s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.85e-5, train/loss_step=0.0126, global_step=1938.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  42%|████▏     | 507/1208 [14:04<19:28,  1.67s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.98e-5, train/loss_step=0.0127, global_step=1938.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  42%|████▏     | 508/1208 [14:07<19:28,  1.67s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.98e-5, train/loss_step=0.0127, global_step=1938.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  42%|████▏     | 508/1208 [14:07<19:28,  1.67s/it, loss=0.102, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000903, train/loss_step=0.229, global_step=1938.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  42%|████▏     | 509/1208 [14:08<19:25,  1.67s/it, loss=0.102, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000903, train/loss_step=0.229, global_step=1938.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  42%|████▏     | 509/1208 [14:08<19:25,  1.67s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.97e-5, train/loss_step=0.0134, global_step=1939.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  42%|████▏     | 510/1208 [14:09<19:23,  1.67s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.97e-5, train/loss_step=0.0134, global_step=1939.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  42%|████▏     | 510/1208 [14:09<19:23,  1.67s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.41e-5, train/loss_step=0.0243, global_step=1939.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  42%|████▏     | 511/1208 [14:10<19:20,  1.67s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.41e-5, train/loss_step=0.0243, global_step=1939.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  42%|████▏     | 511/1208 [14:10<19:20,  1.67s/it, loss=0.094, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=1939.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  42%|████▏     | 512/1208 [14:13<19:20,  1.67s/it, loss=0.094, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=1939.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  42%|████▏     | 512/1208 [14:13<19:20,  1.67s/it, loss=0.0869, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=1939.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  42%|████▏     | 513/1208 [14:14<19:17,  1.67s/it, loss=0.0869, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=1939.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  42%|████▏     | 513/1208 [14:14<19:17,  1.67s/it, loss=0.0734, v_num=0, train/loss_simple_step=0.00685, train/loss_vlb_step=3.36e-5, train/loss_step=0.00685, global_step=1940.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  43%|████▎     | 514/1208 [14:15<19:15,  1.66s/it, loss=0.0734, v_num=0, train/loss_simple_step=0.00685, train/loss_vlb_step=3.36e-5, train/loss_step=0.00685, global_step=1940.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  43%|████▎     | 514/1208 [14:15<19:15,  1.66s/it, loss=0.0737, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000125, train/loss_step=0.0306, global_step=1940.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  43%|████▎     | 515/1208 [14:16<19:12,  1.66s/it, loss=0.0737, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000125, train/loss_step=0.0306, global_step=1940.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  43%|████▎     | 515/1208 [14:16<19:12,  1.66s/it, loss=0.0702, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.75e-5, train/loss_step=0.0186, global_step=1940.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  43%|████▎     | 516/1208 [14:19<19:12,  1.67s/it, loss=0.0702, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.75e-5, train/loss_step=0.0186, global_step=1940.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  43%|████▎     | 516/1208 [14:19<19:12,  1.67s/it, loss=0.0699, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.85e-5, train/loss_step=0.0184, global_step=1940.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  43%|████▎     | 517/1208 [14:20<19:10,  1.66s/it, loss=0.0699, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.85e-5, train/loss_step=0.0184, global_step=1940.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  43%|████▎     | 517/1208 [14:20<19:10,  1.66s/it, loss=0.0606, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.69e-5, train/loss_step=0.0143, global_step=1941.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  43%|████▎     | 518/1208 [14:21<19:07,  1.66s/it, loss=0.0606, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.69e-5, train/loss_step=0.0143, global_step=1941.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  43%|████▎     | 518/1208 [14:21<19:07,  1.66s/it, loss=0.0584, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=1.49e-5, train/loss_step=0.00258, global_step=1941.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  43%|████▎     | 519/1208 [14:22<19:05,  1.66s/it, loss=0.0584, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=1.49e-5, train/loss_step=0.00258, global_step=1941.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  43%|████▎     | 519/1208 [14:22<19:05,  1.66s/it, loss=0.0636, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000347, train/loss_step=0.106, global_step=1941.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  43%|████▎     | 520/1208 [14:25<19:05,  1.66s/it, loss=0.0636, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000347, train/loss_step=0.106, global_step=1941.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  43%|████▎     | 520/1208 [14:25<19:05,  1.66s/it, loss=0.0747, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.000954, train/loss_step=0.243, global_step=1941.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  43%|████▎     | 521/1208 [14:26<19:02,  1.66s/it, loss=0.0747, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.000954, train/loss_step=0.243, global_step=1941.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  43%|████▎     | 521/1208 [14:26<19:02,  1.66s/it, loss=0.0747, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=9.06e-6, train/loss_step=0.00158, global_step=1942.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  43%|████▎     | 522/1208 [14:27<19:00,  1.66s/it, loss=0.0747, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=9.06e-6, train/loss_step=0.00158, global_step=1942.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  43%|████▎     | 522/1208 [14:27<19:00,  1.66s/it, loss=0.0868, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00117, train/loss_step=0.276, global_step=1942.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  43%|████▎     | 523/1208 [14:28<18:57,  1.66s/it, loss=0.0868, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00117, train/loss_step=0.276, global_step=1942.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  43%|████▎     | 523/1208 [14:28<18:57,  1.66s/it, loss=0.083, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.00044, train/loss_step=0.133, global_step=1942.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  43%|████▎     | 524/1208 [14:32<18:58,  1.66s/it, loss=0.083, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.00044, train/loss_step=0.133, global_step=1942.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  43%|████▎     | 524/1208 [14:32<18:58,  1.66s/it, loss=0.0808, v_num=0, train/loss_simple_step=0.0742, train/loss_vlb_step=0.000252, train/loss_step=0.0742, global_step=1942.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  43%|████▎     | 525/1208 [14:33<18:55,  1.66s/it, loss=0.0808, v_num=0, train/loss_simple_step=0.0742, train/loss_vlb_step=0.000252, train/loss_step=0.0742, global_step=1942.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  43%|████▎     | 525/1208 [14:33<18:55,  1.66s/it, loss=0.0717, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.75e-5, train/loss_step=0.0119, global_step=1943.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  44%|████▎     | 526/1208 [14:34<18:53,  1.66s/it, loss=0.0717, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.75e-5, train/loss_step=0.0119, global_step=1943.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  44%|████▎     | 526/1208 [14:34<18:53,  1.66s/it, loss=0.0795, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000577, train/loss_step=0.167, global_step=1943.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  44%|████▎     | 527/1208 [14:35<18:51,  1.66s/it, loss=0.0795, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000577, train/loss_step=0.167, global_step=1943.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  44%|████▎     | 527/1208 [14:35<18:51,  1.66s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00144, train/loss_step=0.298, global_step=1943.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  44%|████▎     | 528/1208 [14:38<18:51,  1.66s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00144, train/loss_step=0.298, global_step=1943.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  44%|████▎     | 528/1208 [14:38<18:51,  1.66s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.00056, train/loss_step=0.169, global_step=1943.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  44%|████▍     | 529/1208 [14:39<18:49,  1.66s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.00056, train/loss_step=0.169, global_step=1943.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  44%|████▍     | 529/1208 [14:39<18:49,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00221, train/loss_step=0.353, global_step=1944.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  44%|████▍     | 530/1208 [14:40<18:46,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00221, train/loss_step=0.353, global_step=1944.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  44%|████▍     | 530/1208 [14:40<18:46,  1.66s/it, loss=0.116, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000667, train/loss_step=0.183, global_step=1944.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  44%|████▍     | 531/1208 [14:41<18:44,  1.66s/it, loss=0.116, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000667, train/loss_step=0.183, global_step=1944.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  44%|████▍     | 531/1208 [14:41<18:44,  1.66s/it, loss=0.112, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.68e-5, train/loss_step=0.021, global_step=1944.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  44%|████▍     | 532/1208 [14:44<18:44,  1.66s/it, loss=0.112, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.68e-5, train/loss_step=0.021, global_step=1944.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  44%|████▍     | 532/1208 [14:44<18:44,  1.66s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0807, train/loss_vlb_step=0.000278, train/loss_step=0.0807, global_step=1944.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  44%|████▍     | 533/1208 [14:46<18:42,  1.66s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0807, train/loss_vlb_step=0.000278, train/loss_step=0.0807, global_step=1944.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  44%|████▍     | 533/1208 [14:46<18:42,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00111, train/loss_step=0.270, global_step=1945.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  44%|████▍     | 534/1208 [14:47<18:39,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00111, train/loss_step=0.270, global_step=1945.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  44%|████▍     | 534/1208 [14:47<18:39,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0695, train/loss_vlb_step=0.000237, train/loss_step=0.0695, global_step=1945.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  44%|████▍     | 535/1208 [14:48<18:37,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0695, train/loss_vlb_step=0.000237, train/loss_step=0.0695, global_step=1945.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  44%|████▍     | 535/1208 [14:48<18:37,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00322, train/loss_step=0.393, global_step=1945.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  44%|████▍     | 536/1208 [14:51<18:37,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00322, train/loss_step=0.393, global_step=1945.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  44%|████▍     | 536/1208 [14:51<18:37,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.056, train/loss_vlb_step=0.000191, train/loss_step=0.056, global_step=1945.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  44%|████▍     | 537/1208 [14:52<18:35,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.056, train/loss_vlb_step=0.000191, train/loss_step=0.056, global_step=1945.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  44%|████▍     | 537/1208 [14:52<18:35,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.00064, train/loss_step=0.185, global_step=1946.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  45%|████▍     | 538/1208 [14:53<18:32,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.00064, train/loss_step=0.185, global_step=1946.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  45%|████▍     | 538/1208 [14:53<18:32,  1.66s/it, loss=0.164, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000617, train/loss_step=0.183, global_step=1946.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  45%|████▍     | 539/1208 [14:54<18:30,  1.66s/it, loss=0.164, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000617, train/loss_step=0.183, global_step=1946.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  45%|████▍     | 539/1208 [14:54<18:30,  1.66s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=1.18e-5, train/loss_step=0.00196, global_step=1946.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  45%|████▍     | 540/1208 [14:57<18:30,  1.66s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=1.18e-5, train/loss_step=0.00196, global_step=1946.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  45%|████▍     | 540/1208 [14:57<18:30,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.000186, train/loss_step=0.0526, global_step=1946.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  45%|████▍     | 541/1208 [14:58<18:28,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.000186, train/loss_step=0.0526, global_step=1946.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  45%|████▍     | 541/1208 [14:58<18:28,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.602, train/loss_vlb_step=0.0141, train/loss_step=0.602, global_step=1947.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  45%|████▍     | 542/1208 [14:59<18:25,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.602, train/loss_vlb_step=0.0141, train/loss_step=0.602, global_step=1947.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  45%|████▍     | 542/1208 [14:59<18:25,  1.66s/it, loss=0.171, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000394, train/loss_step=0.119, global_step=1947.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  45%|████▍     | 543/1208 [15:00<18:23,  1.66s/it, loss=0.171, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000394, train/loss_step=0.119, global_step=1947.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  45%|████▍     | 543/1208 [15:00<18:23,  1.66s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0434, train/loss_vlb_step=0.000161, train/loss_step=0.0434, global_step=1947.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  45%|████▌     | 544/1208 [15:04<18:23,  1.66s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0434, train/loss_vlb_step=0.000161, train/loss_step=0.0434, global_step=1947.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  45%|████▌     | 544/1208 [15:04<18:23,  1.66s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0597, train/loss_vlb_step=0.000216, train/loss_step=0.0597, global_step=1947.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  45%|████▌     | 545/1208 [15:05<18:21,  1.66s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0597, train/loss_vlb_step=0.000216, train/loss_step=0.0597, global_step=1947.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  45%|████▌     | 545/1208 [15:05<18:21,  1.66s/it, loss=0.176, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000793, train/loss_step=0.221, global_step=1948.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  45%|████▌     | 546/1208 [15:06<18:18,  1.66s/it, loss=0.176, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000793, train/loss_step=0.221, global_step=1948.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  45%|████▌     | 546/1208 [15:06<18:18,  1.66s/it, loss=0.176, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000542, train/loss_step=0.161, global_step=1948.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  45%|████▌     | 547/1208 [15:07<18:16,  1.66s/it, loss=0.176, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000542, train/loss_step=0.161, global_step=1948.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  45%|████▌     | 547/1208 [15:07<18:16,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000677, train/loss_step=0.166, global_step=1948.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  45%|████▌     | 548/1208 [15:10<18:16,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000677, train/loss_step=0.166, global_step=1948.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  45%|████▌     | 548/1208 [15:10<18:16,  1.66s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0869, train/loss_vlb_step=0.000291, train/loss_step=0.0869, global_step=1948.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  45%|████▌     | 549/1208 [15:11<18:14,  1.66s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0869, train/loss_vlb_step=0.000291, train/loss_step=0.0869, global_step=1948.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  45%|████▌     | 549/1208 [15:11<18:14,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.000184, train/loss_step=0.0537, global_step=1949.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  46%|████▌     | 550/1208 [15:12<18:11,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.000184, train/loss_step=0.0537, global_step=1949.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  46%|████▌     | 550/1208 [15:12<18:11,  1.66s/it, loss=0.147, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000357, train/loss_step=0.109, global_step=1949.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  46%|████▌     | 551/1208 [15:13<18:09,  1.66s/it, loss=0.147, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000357, train/loss_step=0.109, global_step=1949.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  46%|████▌     | 551/1208 [15:13<18:09,  1.66s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000136, train/loss_step=0.0353, global_step=1949.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  46%|████▌     | 552/1208 [15:16<18:09,  1.66s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000136, train/loss_step=0.0353, global_step=1949.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  46%|████▌     | 552/1208 [15:16<18:09,  1.66s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0823, train/loss_vlb_step=0.000277, train/loss_step=0.0823, global_step=1949.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  46%|████▌     | 553/1208 [15:17<18:07,  1.66s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0823, train/loss_vlb_step=0.000277, train/loss_step=0.0823, global_step=1949.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  46%|████▌     | 553/1208 [15:17<18:07,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=1.49e-5, train/loss_step=0.00262, global_step=1950.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  46%|████▌     | 554/1208 [15:18<18:04,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=1.49e-5, train/loss_step=0.00262, global_step=1950.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  46%|████▌     | 554/1208 [15:18<18:04,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.71e-5, train/loss_step=0.0152, global_step=1950.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  46%|████▌     | 555/1208 [15:19<18:02,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.71e-5, train/loss_step=0.0152, global_step=1950.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  46%|████▌     | 555/1208 [15:19<18:02,  1.66s/it, loss=0.127, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00128, train/loss_step=0.297, global_step=1950.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  46%|████▌     | 556/1208 [15:22<18:02,  1.66s/it, loss=0.127, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00128, train/loss_step=0.297, global_step=1950.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  46%|████▌     | 556/1208 [15:22<18:02,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000592, train/loss_step=0.177, global_step=1950.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  46%|████▌     | 557/1208 [15:23<17:59,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000592, train/loss_step=0.177, global_step=1950.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  46%|████▌     | 557/1208 [15:23<17:59,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.13e-5, train/loss_step=0.00188, global_step=1951.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  46%|████▌     | 558/1208 [15:24<17:57,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.13e-5, train/loss_step=0.00188, global_step=1951.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  46%|████▌     | 558/1208 [15:24<17:57,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000855, train/loss_step=0.231, global_step=1951.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  46%|████▋     | 559/1208 [15:25<17:55,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000855, train/loss_step=0.231, global_step=1951.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  46%|████▋     | 559/1208 [15:25<17:55,  1.66s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0787, train/loss_vlb_step=0.000265, train/loss_step=0.0787, global_step=1951.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  46%|████▋     | 560/1208 [15:29<17:55,  1.66s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0787, train/loss_vlb_step=0.000265, train/loss_step=0.0787, global_step=1951.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  46%|████▋     | 560/1208 [15:29<17:55,  1.66s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00411, train/loss_vlb_step=2.18e-5, train/loss_step=0.00411, global_step=1951.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  46%|████▋     | 561/1208 [15:30<17:52,  1.66s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00411, train/loss_vlb_step=2.18e-5, train/loss_step=0.00411, global_step=1951.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  46%|████▋     | 561/1208 [15:30<17:52,  1.66s/it, loss=0.105, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000562, train/loss_step=0.164, global_step=1952.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  47%|████▋     | 562/1208 [15:31<17:50,  1.66s/it, loss=0.105, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000562, train/loss_step=0.164, global_step=1952.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  47%|████▋     | 562/1208 [15:31<17:50,  1.66s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.000193, train/loss_step=0.0556, global_step=1952.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  47%|████▋     | 563/1208 [15:32<17:48,  1.66s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.000193, train/loss_step=0.0556, global_step=1952.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  47%|████▋     | 563/1208 [15:32<17:48,  1.66s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.57e-5, train/loss_step=0.00277, global_step=1952.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  47%|████▋     | 564/1208 [15:35<17:48,  1.66s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.57e-5, train/loss_step=0.00277, global_step=1952.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  47%|████▋     | 564/1208 [15:35<17:48,  1.66s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0978, train/loss_vlb_step=0.000323, train/loss_step=0.0978, global_step=1952.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  47%|████▋     | 565/1208 [15:36<17:46,  1.66s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0978, train/loss_vlb_step=0.000323, train/loss_step=0.0978, global_step=1952.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  47%|████▋     | 565/1208 [15:36<17:46,  1.66s/it, loss=0.0943, v_num=0, train/loss_simple_step=0.065, train/loss_vlb_step=0.000227, train/loss_step=0.065, global_step=1953.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  47%|████▋     | 566/1208 [15:37<17:43,  1.66s/it, loss=0.0943, v_num=0, train/loss_simple_step=0.065, train/loss_vlb_step=0.000227, train/loss_step=0.065, global_step=1953.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  47%|████▋     | 566/1208 [15:37<17:43,  1.66s/it, loss=0.1, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00119, train/loss_step=0.275, global_step=1953.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  47%|████▋     | 567/1208 [15:38<17:41,  1.66s/it, loss=0.1, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00119, train/loss_step=0.275, global_step=1953.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  47%|████▋     | 567/1208 [15:38<17:41,  1.66s/it, loss=0.0923, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5e-5, train/loss_step=0.0113, global_step=1953.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  47%|████▋     | 568/1208 [15:42<17:41,  1.66s/it, loss=0.0923, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5e-5, train/loss_step=0.0113, global_step=1953.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  47%|████▋     | 568/1208 [15:42<17:41,  1.66s/it, loss=0.104, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00263, train/loss_step=0.330, global_step=1953.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  47%|████▋     | 569/1208 [15:43<17:39,  1.66s/it, loss=0.104, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00263, train/loss_step=0.330, global_step=1953.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  47%|████▋     | 569/1208 [15:43<17:39,  1.66s/it, loss=0.103, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.00013, train/loss_step=0.034, global_step=1954.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  47%|████▋     | 570/1208 [15:44<17:36,  1.66s/it, loss=0.103, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.00013, train/loss_step=0.034, global_step=1954.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  47%|████▋     | 570/1208 [15:44<17:36,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.601, train/loss_vlb_step=0.0121, train/loss_step=0.601, global_step=1954.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  47%|████▋     | 571/1208 [15:45<17:34,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.601, train/loss_vlb_step=0.0121, train/loss_step=0.601, global_step=1954.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  47%|████▋     | 571/1208 [15:45<17:34,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000105, train/loss_step=0.0266, global_step=1954.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  47%|████▋     | 572/1208 [15:48<17:34,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000105, train/loss_step=0.0266, global_step=1954.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  47%|████▋     | 572/1208 [15:48<17:34,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.000124, train/loss_step=0.0356, global_step=1954.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  47%|████▋     | 573/1208 [15:49<17:32,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.000124, train/loss_step=0.0356, global_step=1954.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  47%|████▋     | 573/1208 [15:49<17:32,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00123, train/loss_step=0.290, global_step=1955.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  48%|████▊     | 574/1208 [15:50<17:29,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00123, train/loss_step=0.290, global_step=1955.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  48%|████▊     | 574/1208 [15:50<17:29,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.59e-5, train/loss_step=0.0138, global_step=1955.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  48%|████▊     | 575/1208 [15:51<17:27,  1.65s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.59e-5, train/loss_step=0.0138, global_step=1955.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  48%|████▊     | 575/1208 [15:51<17:27,  1.65s/it, loss=0.132, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000453, train/loss_step=0.135, global_step=1955.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  48%|████▊     | 576/1208 [15:54<17:27,  1.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000453, train/loss_step=0.135, global_step=1955.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  48%|████▊     | 576/1208 [15:54<17:27,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.25e-5, train/loss_step=0.0139, global_step=1955.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  48%|████▊     | 577/1208 [15:55<17:25,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.25e-5, train/loss_step=0.0139, global_step=1955.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  48%|████▊     | 577/1208 [15:55<17:25,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.00041, train/loss_step=0.125, global_step=1956.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  48%|████▊     | 578/1208 [15:56<17:22,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.00041, train/loss_step=0.125, global_step=1956.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  48%|████▊     | 578/1208 [15:56<17:22,  1.66s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0535, train/loss_vlb_step=0.000189, train/loss_step=0.0535, global_step=1956.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  48%|████▊     | 579/1208 [15:57<17:20,  1.65s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0535, train/loss_vlb_step=0.000189, train/loss_step=0.0535, global_step=1956.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  48%|████▊     | 579/1208 [15:57<17:20,  1.65s/it, loss=0.125, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000557, train/loss_step=0.168, global_step=1956.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  48%|████▊     | 580/1208 [16:01<17:20,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000557, train/loss_step=0.168, global_step=1956.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  48%|████▊     | 580/1208 [16:01<17:20,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00318, train/loss_vlb_step=1.87e-5, train/loss_step=0.00318, global_step=1956.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  48%|████▊     | 581/1208 [16:02<17:18,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00318, train/loss_vlb_step=1.87e-5, train/loss_step=0.00318, global_step=1956.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  48%|████▊     | 581/1208 [16:02<17:18,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.04e-5, train/loss_step=0.0136, global_step=1957.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  48%|████▊     | 582/1208 [16:03<17:16,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.04e-5, train/loss_step=0.0136, global_step=1957.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  48%|████▊     | 582/1208 [16:03<17:16,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00466, train/loss_vlb_step=2.51e-5, train/loss_step=0.00466, global_step=1957.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  48%|████▊     | 583/1208 [16:04<17:13,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00466, train/loss_vlb_step=2.51e-5, train/loss_step=0.00466, global_step=1957.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  48%|████▊     | 583/1208 [16:04<17:13,  1.65s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.29e-5, train/loss_step=0.0143, global_step=1957.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  48%|████▊     | 584/1208 [16:07<17:13,  1.66s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.29e-5, train/loss_step=0.0143, global_step=1957.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  48%|████▊     | 584/1208 [16:07<17:13,  1.66s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00634, train/loss_vlb_step=3.39e-5, train/loss_step=0.00634, global_step=1957.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  48%|████▊     | 585/1208 [16:08<17:11,  1.66s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00634, train/loss_vlb_step=3.39e-5, train/loss_step=0.00634, global_step=1957.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  48%|████▊     | 585/1208 [16:08<17:11,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00662, train/loss_step=0.499, global_step=1958.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  49%|████▊     | 586/1208 [16:09<17:09,  1.65s/it, loss=0.133, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00662, train/loss_step=0.499, global_step=1958.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  49%|████▊     | 586/1208 [16:09<17:09,  1.65s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00499, train/loss_vlb_step=2.65e-5, train/loss_step=0.00499, global_step=1958.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  49%|████▊     | 587/1208 [16:10<17:07,  1.65s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00499, train/loss_vlb_step=2.65e-5, train/loss_step=0.00499, global_step=1958.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  49%|████▊     | 587/1208 [16:10<17:07,  1.65s/it, loss=0.133, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00183, train/loss_step=0.294, global_step=1958.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  49%|████▊     | 588/1208 [16:14<17:07,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00183, train/loss_step=0.294, global_step=1958.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  49%|████▊     | 588/1208 [16:14<17:07,  1.66s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0382, train/loss_vlb_step=0.000149, train/loss_step=0.0382, global_step=1958.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  49%|████▉     | 589/1208 [16:15<17:04,  1.66s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0382, train/loss_vlb_step=0.000149, train/loss_step=0.0382, global_step=1958.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  49%|████▉     | 589/1208 [16:15<17:04,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00162, train/loss_step=0.323, global_step=1959.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  49%|████▉     | 590/1208 [16:16<17:02,  1.65s/it, loss=0.133, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00162, train/loss_step=0.323, global_step=1959.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  49%|████▉     | 590/1208 [16:16<17:02,  1.65s/it, loss=0.105, v_num=0, train/loss_simple_step=0.044, train/loss_vlb_step=0.000159, train/loss_step=0.044, global_step=1959.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  49%|████▉     | 591/1208 [16:17<17:00,  1.65s/it, loss=0.105, v_num=0, train/loss_simple_step=0.044, train/loss_vlb_step=0.000159, train/loss_step=0.044, global_step=1959.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  49%|████▉     | 591/1208 [16:17<17:00,  1.65s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0467, train/loss_vlb_step=0.000165, train/loss_step=0.0467, global_step=1959.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  49%|████▉     | 592/1208 [16:20<17:00,  1.66s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0467, train/loss_vlb_step=0.000165, train/loss_step=0.0467, global_step=1959.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  49%|████▉     | 592/1208 [16:20<17:00,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.639, train/loss_vlb_step=0.0257, train/loss_step=0.639, global_step=1959.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  49%|████▉     | 593/1208 [16:21<16:57,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.639, train/loss_vlb_step=0.0257, train/loss_step=0.639, global_step=1959.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  49%|████▉     | 593/1208 [16:21<16:57,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00127, train/loss_step=0.285, global_step=1960.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  49%|████▉     | 594/1208 [16:22<16:55,  1.65s/it, loss=0.136, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00127, train/loss_step=0.285, global_step=1960.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  49%|████▉     | 594/1208 [16:22<16:55,  1.65s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.73e-5, train/loss_step=0.0124, global_step=1960.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  49%|████▉     | 595/1208 [16:23<16:53,  1.65s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.73e-5, train/loss_step=0.0124, global_step=1960.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  49%|████▉     | 595/1208 [16:23<16:53,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00669, train/loss_vlb_step=3.46e-5, train/loss_step=0.00669, global_step=1960.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  49%|████▉     | 596/1208 [16:26<16:53,  1.66s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00669, train/loss_vlb_step=3.46e-5, train/loss_step=0.00669, global_step=1960.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  49%|████▉     | 596/1208 [16:26<16:53,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000614, train/loss_step=0.178, global_step=1960.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  49%|████▉     | 597/1208 [16:27<16:51,  1.65s/it, loss=0.138, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000614, train/loss_step=0.178, global_step=1960.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  49%|████▉     | 597/1208 [16:27<16:51,  1.65s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000107, train/loss_step=0.0272, global_step=1961.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  50%|████▉     | 598/1208 [16:29<16:48,  1.65s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000107, train/loss_step=0.0272, global_step=1961.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  50%|████▉     | 598/1208 [16:29<16:48,  1.65s/it, loss=0.138, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000525, train/loss_step=0.153, global_step=1961.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  50%|████▉     | 599/1208 [16:30<16:46,  1.65s/it, loss=0.138, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000525, train/loss_step=0.153, global_step=1961.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  50%|████▉     | 599/1208 [16:30<16:46,  1.65s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0572, train/loss_vlb_step=0.000204, train/loss_step=0.0572, global_step=1961.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  50%|████▉     | 600/1208 [16:33<16:46,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0572, train/loss_vlb_step=0.000204, train/loss_step=0.0572, global_step=1961.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  50%|████▉     | 600/1208 [16:33<16:46,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.00381, train/loss_step=0.450, global_step=1961.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.76it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.80it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.80it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.80it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.76it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.82it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.77it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.75it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 6:  50%|████▉     | 601/1208 [17:04<17:14,  1.70s/it, loss=0.155, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.00381, train/loss_step=0.450, global_step=1961.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  50%|████▉     | 601/1208 [17:04<17:14,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000181, train/loss_step=0.0514, global_step=1962.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  50%|████▉     | 602/1208 [17:05<17:11,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000181, train/loss_step=0.0514, global_step=1962.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  50%|████▉     | 602/1208 [17:05<17:11,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00292, train/loss_step=0.414, global_step=1962.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  50%|████▉     | 603/1208 [17:06<17:09,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00292, train/loss_step=0.414, global_step=1962.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  50%|████▉     | 603/1208 [17:06<17:09,  1.70s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0772, train/loss_vlb_step=0.000259, train/loss_step=0.0772, global_step=1962.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  50%|█████     | 604/1208 [17:09<17:09,  1.70s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0772, train/loss_vlb_step=0.000259, train/loss_step=0.0772, global_step=1962.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  50%|█████     | 604/1208 [17:09<17:09,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000419, train/loss_step=0.128, global_step=1962.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  50%|█████     | 605/1208 [17:10<17:06,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000419, train/loss_step=0.128, global_step=1962.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  50%|█████     | 605/1208 [17:10<17:06,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00554, train/loss_vlb_step=2.82e-5, train/loss_step=0.00554, global_step=1963.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  50%|█████     | 606/1208 [17:11<17:04,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00554, train/loss_vlb_step=2.82e-5, train/loss_step=0.00554, global_step=1963.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  50%|█████     | 606/1208 [17:11<17:04,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=1.36e-5, train/loss_step=0.00224, global_step=1963.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  50%|█████     | 607/1208 [17:12<17:02,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=1.36e-5, train/loss_step=0.00224, global_step=1963.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  50%|█████     | 607/1208 [17:12<17:02,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=1963.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  50%|█████     | 608/1208 [17:15<17:02,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=1963.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  50%|█████     | 608/1208 [17:15<17:02,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000629, train/loss_step=0.178, global_step=1963.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  50%|█████     | 609/1208 [17:16<16:59,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000629, train/loss_step=0.178, global_step=1963.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  50%|█████     | 609/1208 [17:16<16:59,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000401, train/loss_step=0.122, global_step=1964.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  50%|█████     | 610/1208 [17:17<16:57,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000401, train/loss_step=0.122, global_step=1964.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  50%|█████     | 610/1208 [17:17<16:57,  1.70s/it, loss=0.194, v_num=0, train/loss_simple_step=0.918, train/loss_vlb_step=0.462, train/loss_step=0.918, global_step=1964.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  51%|█████     | 611/1208 [17:18<16:55,  1.70s/it, loss=0.194, v_num=0, train/loss_simple_step=0.918, train/loss_vlb_step=0.462, train/loss_step=0.918, global_step=1964.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  51%|█████     | 611/1208 [17:18<16:55,  1.70s/it, loss=0.207, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00131, train/loss_step=0.303, global_step=1964.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  51%|█████     | 612/1208 [17:22<16:54,  1.70s/it, loss=0.207, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00131, train/loss_step=0.303, global_step=1964.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  51%|█████     | 612/1208 [17:22<16:54,  1.70s/it, loss=0.191, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00183, train/loss_step=0.318, global_step=1964.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  51%|█████     | 613/1208 [17:23<16:52,  1.70s/it, loss=0.191, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00183, train/loss_step=0.318, global_step=1964.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  51%|█████     | 613/1208 [17:23<16:52,  1.70s/it, loss=0.179, v_num=0, train/loss_simple_step=0.063, train/loss_vlb_step=0.000221, train/loss_step=0.063, global_step=1965.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  51%|█████     | 614/1208 [17:24<16:50,  1.70s/it, loss=0.179, v_num=0, train/loss_simple_step=0.063, train/loss_vlb_step=0.000221, train/loss_step=0.063, global_step=1965.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  51%|█████     | 614/1208 [17:24<16:50,  1.70s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00621, train/loss_vlb_step=3.28e-5, train/loss_step=0.00621, global_step=1965.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  51%|█████     | 615/1208 [17:25<16:47,  1.70s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00621, train/loss_vlb_step=3.28e-5, train/loss_step=0.00621, global_step=1965.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  51%|█████     | 615/1208 [17:25<16:47,  1.70s/it, loss=0.189, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000669, train/loss_step=0.202, global_step=1965.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  51%|█████     | 616/1208 [17:28<16:47,  1.70s/it, loss=0.189, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000669, train/loss_step=0.202, global_step=1965.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  51%|█████     | 616/1208 [17:28<16:47,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000414, train/loss_step=0.126, global_step=1965.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  51%|█████     | 617/1208 [17:29<16:45,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000414, train/loss_step=0.126, global_step=1965.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  51%|█████     | 617/1208 [17:29<16:45,  1.70s/it, loss=0.194, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000615, train/loss_step=0.181, global_step=1966.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  51%|█████     | 618/1208 [17:30<16:43,  1.70s/it, loss=0.194, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000615, train/loss_step=0.181, global_step=1966.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  51%|█████     | 618/1208 [17:30<16:43,  1.70s/it, loss=0.217, v_num=0, train/loss_simple_step=0.617, train/loss_vlb_step=0.0139, train/loss_step=0.617, global_step=1966.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  51%|█████     | 619/1208 [17:31<16:40,  1.70s/it, loss=0.217, v_num=0, train/loss_simple_step=0.617, train/loss_vlb_step=0.0139, train/loss_step=0.617, global_step=1966.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  51%|█████     | 619/1208 [17:31<16:40,  1.70s/it, loss=0.227, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.0011, train/loss_step=0.263, global_step=1966.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  51%|█████▏    | 620/1208 [17:35<16:40,  1.70s/it, loss=0.227, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.0011, train/loss_step=0.263, global_step=1966.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  51%|█████▏    | 620/1208 [17:35<16:40,  1.70s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0634, train/loss_vlb_step=0.000218, train/loss_step=0.0634, global_step=1966.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  51%|█████▏    | 621/1208 [17:36<16:38,  1.70s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0634, train/loss_vlb_step=0.000218, train/loss_step=0.0634, global_step=1966.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  51%|█████▏    | 621/1208 [17:36<16:38,  1.70s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.00013, train/loss_step=0.0342, global_step=1967.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  51%|█████▏    | 622/1208 [17:37<16:35,  1.70s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.00013, train/loss_step=0.0342, global_step=1967.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  51%|█████▏    | 622/1208 [17:37<16:35,  1.70s/it, loss=0.187, v_num=0, train/loss_simple_step=0.00348, train/loss_vlb_step=1.9e-5, train/loss_step=0.00348, global_step=1967.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  52%|█████▏    | 623/1208 [17:38<16:33,  1.70s/it, loss=0.187, v_num=0, train/loss_simple_step=0.00348, train/loss_vlb_step=1.9e-5, train/loss_step=0.00348, global_step=1967.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  52%|█████▏    | 623/1208 [17:38<16:33,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.000131, train/loss_step=0.034, global_step=1967.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  52%|█████▏    | 624/1208 [17:41<16:33,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.000131, train/loss_step=0.034, global_step=1967.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  52%|█████▏    | 624/1208 [17:41<16:33,  1.70s/it, loss=0.194, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00163, train/loss_step=0.307, global_step=1967.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  52%|█████▏    | 625/1208 [17:42<16:31,  1.70s/it, loss=0.194, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00163, train/loss_step=0.307, global_step=1967.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  52%|█████▏    | 625/1208 [17:42<16:31,  1.70s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.58e-5, train/loss_step=0.00273, global_step=1968.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  52%|█████▏    | 626/1208 [17:43<16:28,  1.70s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.58e-5, train/loss_step=0.00273, global_step=1968.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  52%|█████▏    | 626/1208 [17:43<16:28,  1.70s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0985, train/loss_vlb_step=0.000325, train/loss_step=0.0985, global_step=1968.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  52%|█████▏    | 627/1208 [17:44<16:26,  1.70s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0985, train/loss_vlb_step=0.000325, train/loss_step=0.0985, global_step=1968.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  52%|█████▏    | 627/1208 [17:44<16:26,  1.70s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00941, train/loss_vlb_step=4.52e-5, train/loss_step=0.00941, global_step=1968.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  52%|█████▏    | 628/1208 [17:47<16:26,  1.70s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00941, train/loss_vlb_step=4.52e-5, train/loss_step=0.00941, global_step=1968.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  52%|█████▏    | 628/1208 [17:47<16:26,  1.70s/it, loss=0.199, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00135, train/loss_step=0.314, global_step=1968.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  52%|█████▏    | 629/1208 [17:48<16:23,  1.70s/it, loss=0.199, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00135, train/loss_step=0.314, global_step=1968.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  52%|█████▏    | 629/1208 [17:48<16:23,  1.70s/it, loss=0.194, v_num=0, train/loss_simple_step=0.00926, train/loss_vlb_step=4.12e-5, train/loss_step=0.00926, global_step=1969.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  52%|█████▏    | 630/1208 [17:49<16:21,  1.70s/it, loss=0.194, v_num=0, train/loss_simple_step=0.00926, train/loss_vlb_step=4.12e-5, train/loss_step=0.00926, global_step=1969.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  52%|█████▏    | 630/1208 [17:49<16:21,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.82e-5, train/loss_step=0.0105, global_step=1969.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  52%|█████▏    | 631/1208 [17:51<16:19,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.82e-5, train/loss_step=0.0105, global_step=1969.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  52%|█████▏    | 631/1208 [17:51<16:19,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=1.86e-5, train/loss_step=0.00326, global_step=1969.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  52%|█████▏    | 632/1208 [17:54<16:19,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=1.86e-5, train/loss_step=0.00326, global_step=1969.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  52%|█████▏    | 632/1208 [17:54<16:19,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00187, train/loss_step=0.364, global_step=1969.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  52%|█████▏    | 633/1208 [17:55<16:16,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00187, train/loss_step=0.364, global_step=1969.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  52%|█████▏    | 633/1208 [17:55<16:16,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00423, train/loss_step=0.425, global_step=1970.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  52%|█████▏    | 634/1208 [17:56<16:14,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00423, train/loss_step=0.425, global_step=1970.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  52%|█████▏    | 634/1208 [17:56<16:14,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=1.1e-5, train/loss_step=0.00184, global_step=1970.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  53%|█████▎    | 635/1208 [17:57<16:12,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=1.1e-5, train/loss_step=0.00184, global_step=1970.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  53%|█████▎    | 635/1208 [17:57<16:12,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000654, train/loss_step=0.185, global_step=1970.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  53%|█████▎    | 636/1208 [18:00<16:12,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000654, train/loss_step=0.185, global_step=1970.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  53%|█████▎    | 636/1208 [18:00<16:12,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0829, train/loss_vlb_step=0.000276, train/loss_step=0.0829, global_step=1970.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  53%|█████▎    | 637/1208 [18:01<16:09,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0829, train/loss_vlb_step=0.000276, train/loss_step=0.0829, global_step=1970.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  53%|█████▎    | 637/1208 [18:01<16:09,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.075, train/loss_vlb_step=0.000251, train/loss_step=0.075, global_step=1971.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  53%|█████▎    | 638/1208 [18:02<16:07,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.075, train/loss_vlb_step=0.000251, train/loss_step=0.075, global_step=1971.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  53%|█████▎    | 638/1208 [18:02<16:07,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.508, train/loss_vlb_step=0.00809, train/loss_step=0.508, global_step=1971.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  53%|█████▎    | 639/1208 [18:03<16:05,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.508, train/loss_vlb_step=0.00809, train/loss_step=0.508, global_step=1971.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  53%|█████▎    | 639/1208 [18:03<16:05,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.000153, train/loss_step=0.0413, global_step=1971.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  53%|█████▎    | 640/1208 [18:07<16:04,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.000153, train/loss_step=0.0413, global_step=1971.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  53%|█████▎    | 640/1208 [18:07<16:04,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00779, train/loss_vlb_step=3.49e-5, train/loss_step=0.00779, global_step=1971.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  53%|█████▎    | 641/1208 [18:08<16:02,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00779, train/loss_vlb_step=3.49e-5, train/loss_step=0.00779, global_step=1971.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  53%|█████▎    | 641/1208 [18:08<16:02,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0585, train/loss_vlb_step=0.000202, train/loss_step=0.0585, global_step=1972.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  53%|█████▎    | 642/1208 [18:09<16:00,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0585, train/loss_vlb_step=0.000202, train/loss_step=0.0585, global_step=1972.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  53%|█████▎    | 642/1208 [18:09<16:00,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000139, train/loss_step=0.0376, global_step=1972.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  53%|█████▎    | 643/1208 [18:10<15:58,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000139, train/loss_step=0.0376, global_step=1972.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  53%|█████▎    | 643/1208 [18:10<15:58,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000572, train/loss_step=0.170, global_step=1972.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  53%|█████▎    | 644/1208 [18:13<15:57,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000572, train/loss_step=0.170, global_step=1972.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  53%|█████▎    | 644/1208 [18:13<15:57,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.410, train/loss_vlb_step=0.00251, train/loss_step=0.410, global_step=1972.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  53%|█████▎    | 645/1208 [18:14<15:55,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.410, train/loss_vlb_step=0.00251, train/loss_step=0.410, global_step=1972.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  53%|█████▎    | 645/1208 [18:14<15:55,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.00035, train/loss_step=0.106, global_step=1973.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  53%|█████▎    | 646/1208 [18:15<15:53,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.00035, train/loss_step=0.106, global_step=1973.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  53%|█████▎    | 646/1208 [18:15<15:53,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.473, train/loss_vlb_step=0.0115, train/loss_step=0.473, global_step=1973.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  54%|█████▎    | 647/1208 [18:16<15:50,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.473, train/loss_vlb_step=0.0115, train/loss_step=0.473, global_step=1973.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  54%|█████▎    | 647/1208 [18:16<15:50,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000648, train/loss_step=0.185, global_step=1973.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  54%|█████▎    | 648/1208 [18:19<15:50,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000648, train/loss_step=0.185, global_step=1973.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  54%|█████▎    | 648/1208 [18:19<15:50,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0455, train/loss_vlb_step=0.000167, train/loss_step=0.0455, global_step=1973.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  54%|█████▎    | 649/1208 [18:21<15:48,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0455, train/loss_vlb_step=0.000167, train/loss_step=0.0455, global_step=1973.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  54%|█████▎    | 649/1208 [18:21<15:48,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00307, train/loss_vlb_step=1.73e-5, train/loss_step=0.00307, global_step=1974.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  54%|█████▍    | 650/1208 [18:22<15:46,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00307, train/loss_vlb_step=1.73e-5, train/loss_step=0.00307, global_step=1974.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  54%|█████▍    | 650/1208 [18:22<15:46,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000111, train/loss_step=0.0268, global_step=1974.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  54%|█████▍    | 651/1208 [18:23<15:43,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000111, train/loss_step=0.0268, global_step=1974.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  54%|█████▍    | 651/1208 [18:23<15:43,  1.69s/it, loss=0.168, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000529, train/loss_step=0.156, global_step=1974.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  54%|█████▍    | 652/1208 [18:26<15:43,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000529, train/loss_step=0.156, global_step=1974.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  54%|█████▍    | 652/1208 [18:26<15:43,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.99e-5, train/loss_step=0.0106, global_step=1974.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  54%|█████▍    | 653/1208 [18:27<15:41,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.99e-5, train/loss_step=0.0106, global_step=1974.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  54%|█████▍    | 653/1208 [18:27<15:41,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00322, train/loss_step=0.409, global_step=1975.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  54%|█████▍    | 654/1208 [18:28<15:39,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00322, train/loss_step=0.409, global_step=1975.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  54%|█████▍    | 654/1208 [18:28<15:39,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.65e-5, train/loss_step=0.00291, global_step=1975.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  54%|█████▍    | 655/1208 [18:29<15:36,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.65e-5, train/loss_step=0.00291, global_step=1975.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  54%|█████▍    | 655/1208 [18:29<15:36,  1.69s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00564, train/loss_vlb_step=2.96e-5, train/loss_step=0.00564, global_step=1975.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  54%|█████▍    | 656/1208 [18:32<15:36,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00564, train/loss_vlb_step=2.96e-5, train/loss_step=0.00564, global_step=1975.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  54%|█████▍    | 656/1208 [18:32<15:36,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000388, train/loss_step=0.118, global_step=1975.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  54%|█████▍    | 657/1208 [18:33<15:34,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000388, train/loss_step=0.118, global_step=1975.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  54%|█████▍    | 657/1208 [18:33<15:34,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00621, train/loss_vlb_step=3.23e-5, train/loss_step=0.00621, global_step=1976.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  54%|█████▍    | 658/1208 [18:34<15:31,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00621, train/loss_vlb_step=3.23e-5, train/loss_step=0.00621, global_step=1976.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  54%|█████▍    | 658/1208 [18:34<15:31,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00144, train/loss_step=0.281, global_step=1976.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  55%|█████▍    | 659/1208 [18:35<15:29,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00144, train/loss_step=0.281, global_step=1976.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  55%|█████▍    | 659/1208 [18:35<15:29,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0408, train/loss_vlb_step=0.00015, train/loss_step=0.0408, global_step=1976.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  55%|█████▍    | 660/1208 [18:39<15:29,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0408, train/loss_vlb_step=0.00015, train/loss_step=0.0408, global_step=1976.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  55%|█████▍    | 660/1208 [18:39<15:29,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000108, train/loss_step=0.0288, global_step=1976.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  55%|█████▍    | 661/1208 [18:40<15:27,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000108, train/loss_step=0.0288, global_step=1976.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  55%|█████▍    | 661/1208 [18:40<15:27,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=1.51e-5, train/loss_step=0.00263, global_step=1977.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  55%|█████▍    | 662/1208 [18:41<15:24,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=1.51e-5, train/loss_step=0.00263, global_step=1977.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  55%|█████▍    | 662/1208 [18:41<15:24,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00758, train/loss_vlb_step=3.7e-5, train/loss_step=0.00758, global_step=1977.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  55%|█████▍    | 663/1208 [18:42<15:22,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00758, train/loss_vlb_step=3.7e-5, train/loss_step=0.00758, global_step=1977.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  55%|█████▍    | 663/1208 [18:42<15:22,  1.69s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.17e-5, train/loss_step=0.0108, global_step=1977.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  55%|█████▍    | 664/1208 [18:45<15:22,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.17e-5, train/loss_step=0.0108, global_step=1977.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  55%|█████▍    | 664/1208 [18:45<15:22,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00113, train/loss_step=0.273, global_step=1977.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  55%|█████▌    | 665/1208 [18:46<15:19,  1.69s/it, loss=0.11, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00113, train/loss_step=0.273, global_step=1977.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  55%|█████▌    | 665/1208 [18:46<15:19,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000144, train/loss_step=0.0378, global_step=1978.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  55%|█████▌    | 666/1208 [18:47<15:17,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000144, train/loss_step=0.0378, global_step=1978.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  55%|█████▌    | 666/1208 [18:47<15:17,  1.69s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000815, train/loss_step=0.210, global_step=1978.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  55%|█████▌    | 667/1208 [18:48<15:15,  1.69s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000815, train/loss_step=0.210, global_step=1978.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  55%|█████▌    | 667/1208 [18:48<15:15,  1.69s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000719, train/loss_step=0.192, global_step=1978.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  55%|█████▌    | 668/1208 [18:52<15:15,  1.69s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000719, train/loss_step=0.192, global_step=1978.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  55%|█████▌    | 668/1208 [18:52<15:15,  1.69s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=2.63e-5, train/loss_step=0.00481, global_step=1978.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  55%|█████▌    | 669/1208 [18:53<15:12,  1.69s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=2.63e-5, train/loss_step=0.00481, global_step=1978.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  55%|█████▌    | 669/1208 [18:53<15:12,  1.69s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.0315, train/loss_vlb_step=0.000123, train/loss_step=0.0315, global_step=1979.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  55%|█████▌    | 670/1208 [18:54<15:10,  1.69s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.0315, train/loss_vlb_step=0.000123, train/loss_step=0.0315, global_step=1979.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  55%|█████▌    | 670/1208 [18:54<15:10,  1.69s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.00821, train/loss_vlb_step=4.16e-5, train/loss_step=0.00821, global_step=1979.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  56%|█████▌    | 671/1208 [18:55<15:08,  1.69s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.00821, train/loss_vlb_step=4.16e-5, train/loss_step=0.00821, global_step=1979.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  56%|█████▌    | 671/1208 [18:55<15:08,  1.69s/it, loss=0.098, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00125, train/loss_step=0.278, global_step=1979.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]     Epoch 6:  56%|█████▌    | 672/1208 [18:58<15:08,  1.69s/it, loss=0.098, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00125, train/loss_step=0.278, global_step=1979.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  56%|█████▌    | 672/1208 [18:58<15:08,  1.69s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0504, train/loss_vlb_step=0.000181, train/loss_step=0.0504, global_step=1979.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  56%|█████▌    | 673/1208 [18:59<15:05,  1.69s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0504, train/loss_vlb_step=0.000181, train/loss_step=0.0504, global_step=1979.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  56%|█████▌    | 673/1208 [18:59<15:05,  1.69s/it, loss=0.0816, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.00015, train/loss_step=0.041, global_step=1980.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  56%|█████▌    | 674/1208 [19:00<15:03,  1.69s/it, loss=0.0816, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.00015, train/loss_step=0.041, global_step=1980.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  56%|█████▌    | 674/1208 [19:00<15:03,  1.69s/it, loss=0.0816, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=2.03e-5, train/loss_step=0.00366, global_step=1980.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  56%|█████▌    | 675/1208 [19:01<15:01,  1.69s/it, loss=0.0816, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=2.03e-5, train/loss_step=0.00366, global_step=1980.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  56%|█████▌    | 675/1208 [19:01<15:01,  1.69s/it, loss=0.1, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00269, train/loss_step=0.375, global_step=1980.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]       Epoch 6:  56%|█████▌    | 676/1208 [19:04<15:00,  1.69s/it, loss=0.1, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00269, train/loss_step=0.375, global_step=1980.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  56%|█████▌    | 676/1208 [19:04<15:00,  1.69s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.0432, train/loss_vlb_step=0.00016, train/loss_step=0.0432, global_step=1980.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  56%|█████▌    | 677/1208 [19:05<14:58,  1.69s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.0432, train/loss_vlb_step=0.00016, train/loss_step=0.0432, global_step=1980.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  56%|█████▌    | 677/1208 [19:05<14:58,  1.69s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.37e-5, train/loss_step=0.0145, global_step=1981.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  56%|█████▌    | 678/1208 [19:06<14:56,  1.69s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.37e-5, train/loss_step=0.0145, global_step=1981.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  56%|█████▌    | 678/1208 [19:06<14:56,  1.69s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=1981.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  56%|█████▌    | 679/1208 [19:07<14:54,  1.69s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=1981.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  56%|█████▌    | 679/1208 [19:07<14:54,  1.69s/it, loss=0.0859, v_num=0, train/loss_simple_step=0.00336, train/loss_vlb_step=1.87e-5, train/loss_step=0.00336, global_step=1981.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  56%|█████▋    | 680/1208 [19:11<14:53,  1.69s/it, loss=0.0859, v_num=0, train/loss_simple_step=0.00336, train/loss_vlb_step=1.87e-5, train/loss_step=0.00336, global_step=1981.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  56%|█████▋    | 680/1208 [19:11<14:53,  1.69s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.0748, train/loss_vlb_step=0.000252, train/loss_step=0.0748, global_step=1981.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  56%|█████▋    | 681/1208 [19:12<14:51,  1.69s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.0748, train/loss_vlb_step=0.000252, train/loss_step=0.0748, global_step=1981.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  56%|█████▋    | 681/1208 [19:12<14:51,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00273, train/loss_step=0.390, global_step=1982.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  56%|█████▋    | 682/1208 [19:13<14:49,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00273, train/loss_step=0.390, global_step=1982.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  56%|█████▋    | 682/1208 [19:13<14:49,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00108, train/loss_step=0.266, global_step=1982.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  57%|█████▋    | 683/1208 [19:14<14:47,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00108, train/loss_step=0.266, global_step=1982.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  57%|█████▋    | 683/1208 [19:14<14:47,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.001, train/loss_step=0.243, global_step=1982.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  57%|█████▋    | 684/1208 [19:17<14:46,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.001, train/loss_step=0.243, global_step=1982.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  57%|█████▋    | 684/1208 [19:17<14:46,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00162, train/loss_step=0.293, global_step=1982.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  57%|█████▋    | 685/1208 [19:18<14:44,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00162, train/loss_step=0.293, global_step=1982.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  57%|█████▋    | 685/1208 [19:18<14:44,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.2e-5, train/loss_step=0.0194, global_step=1983.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  57%|█████▋    | 686/1208 [19:19<14:42,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.2e-5, train/loss_step=0.0194, global_step=1983.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  57%|█████▋    | 686/1208 [19:19<14:42,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000437, train/loss_step=0.132, global_step=1983.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  57%|█████▋    | 687/1208 [19:20<14:40,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000437, train/loss_step=0.132, global_step=1983.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  57%|█████▋    | 687/1208 [19:20<14:40,  1.69s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.71e-5, train/loss_step=0.0181, global_step=1983.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  57%|█████▋    | 688/1208 [19:24<14:39,  1.69s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.71e-5, train/loss_step=0.0181, global_step=1983.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  57%|█████▋    | 688/1208 [19:24<14:39,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0979, train/loss_vlb_step=0.000325, train/loss_step=0.0979, global_step=1983.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  57%|█████▋    | 689/1208 [19:25<14:37,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0979, train/loss_vlb_step=0.000325, train/loss_step=0.0979, global_step=1983.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  57%|█████▋    | 689/1208 [19:25<14:37,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0488, train/loss_vlb_step=0.000173, train/loss_step=0.0488, global_step=1984.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  57%|█████▋    | 690/1208 [19:26<14:35,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0488, train/loss_vlb_step=0.000173, train/loss_step=0.0488, global_step=1984.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  57%|█████▋    | 690/1208 [19:26<14:35,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=9.9e-5, train/loss_step=0.0244, global_step=1984.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  57%|█████▋    | 691/1208 [19:27<14:33,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=9.9e-5, train/loss_step=0.0244, global_step=1984.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  57%|█████▋    | 691/1208 [19:27<14:33,  1.69s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0487, train/loss_vlb_step=0.000178, train/loss_step=0.0487, global_step=1984.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  57%|█████▋    | 692/1208 [19:30<14:32,  1.69s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0487, train/loss_vlb_step=0.000178, train/loss_step=0.0487, global_step=1984.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  57%|█████▋    | 692/1208 [19:30<14:32,  1.69s/it, loss=0.119, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.00052, train/loss_step=0.144, global_step=1984.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  57%|█████▋    | 693/1208 [19:31<14:30,  1.69s/it, loss=0.119, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.00052, train/loss_step=0.144, global_step=1984.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  57%|█████▋    | 693/1208 [19:31<14:30,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0899, train/loss_vlb_step=0.000298, train/loss_step=0.0899, global_step=1985.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  57%|█████▋    | 694/1208 [19:32<14:28,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0899, train/loss_vlb_step=0.000298, train/loss_step=0.0899, global_step=1985.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  57%|█████▋    | 694/1208 [19:32<14:28,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.069, train/loss_vlb_step=0.000233, train/loss_step=0.069, global_step=1985.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  58%|█████▊    | 695/1208 [19:33<14:26,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.069, train/loss_vlb_step=0.000233, train/loss_step=0.069, global_step=1985.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  58%|█████▊    | 695/1208 [19:33<14:26,  1.69s/it, loss=0.116, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000731, train/loss_step=0.204, global_step=1985.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  58%|█████▊    | 696/1208 [19:36<14:25,  1.69s/it, loss=0.116, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000731, train/loss_step=0.204, global_step=1985.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  58%|█████▊    | 696/1208 [19:36<14:25,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00143, train/loss_step=0.309, global_step=1985.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  58%|█████▊    | 697/1208 [19:37<14:23,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00143, train/loss_step=0.309, global_step=1985.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  58%|█████▊    | 697/1208 [19:37<14:23,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000363, train/loss_step=0.110, global_step=1986.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  58%|█████▊    | 698/1208 [19:38<14:21,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000363, train/loss_step=0.110, global_step=1986.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  58%|█████▊    | 698/1208 [19:38<14:21,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.416, train/loss_vlb_step=0.00289, train/loss_step=0.416, global_step=1986.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  58%|█████▊    | 699/1208 [19:40<14:19,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.416, train/loss_vlb_step=0.00289, train/loss_step=0.416, global_step=1986.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  58%|█████▊    | 699/1208 [19:40<14:19,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=8.86e-5, train/loss_step=0.0221, global_step=1986.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  58%|█████▊    | 700/1208 [19:43<14:18,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=8.86e-5, train/loss_step=0.0221, global_step=1986.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  58%|█████▊    | 700/1208 [19:43<14:18,  1.69s/it, loss=0.154, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000422, train/loss_step=0.128, global_step=1986.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  58%|█████▊    | 701/1208 [19:44<14:16,  1.69s/it, loss=0.154, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000422, train/loss_step=0.128, global_step=1986.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  58%|█████▊    | 701/1208 [19:44<14:16,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000531, train/loss_step=0.160, global_step=1987.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  58%|█████▊    | 702/1208 [19:45<14:14,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000531, train/loss_step=0.160, global_step=1987.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  58%|█████▊    | 702/1208 [19:45<14:14,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0625, train/loss_vlb_step=0.000218, train/loss_step=0.0625, global_step=1987.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  58%|█████▊    | 703/1208 [19:46<14:12,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0625, train/loss_vlb_step=0.000218, train/loss_step=0.0625, global_step=1987.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  58%|█████▊    | 703/1208 [19:46<14:12,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000707, train/loss_step=0.204, global_step=1987.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  58%|█████▊    | 704/1208 [19:49<14:11,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000707, train/loss_step=0.204, global_step=1987.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  58%|█████▊    | 704/1208 [19:49<14:11,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000782, train/loss_step=0.211, global_step=1987.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  58%|█████▊    | 705/1208 [19:50<14:09,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000782, train/loss_step=0.211, global_step=1987.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  58%|█████▊    | 705/1208 [19:50<14:09,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.35e-5, train/loss_step=0.0229, global_step=1988.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  58%|█████▊    | 706/1208 [19:51<14:07,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.35e-5, train/loss_step=0.0229, global_step=1988.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  58%|█████▊    | 706/1208 [19:51<14:07,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000606, train/loss_step=0.174, global_step=1988.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  59%|█████▊    | 707/1208 [19:52<14:05,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000606, train/loss_step=0.174, global_step=1988.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  59%|█████▊    | 707/1208 [19:52<14:05,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.00078, train/loss_step=0.201, global_step=1988.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  59%|█████▊    | 708/1208 [19:56<14:04,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.00078, train/loss_step=0.201, global_step=1988.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  59%|█████▊    | 708/1208 [19:56<14:04,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.000174, train/loss_step=0.0508, global_step=1988.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  59%|█████▊    | 709/1208 [19:57<14:02,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.000174, train/loss_step=0.0508, global_step=1988.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  59%|█████▊    | 709/1208 [19:57<14:02,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000337, train/loss_step=0.101, global_step=1989.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  59%|█████▉    | 710/1208 [19:58<14:00,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000337, train/loss_step=0.101, global_step=1989.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  59%|█████▉    | 710/1208 [19:58<14:00,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000546, train/loss_step=0.160, global_step=1989.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  59%|█████▉    | 711/1208 [19:59<13:58,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000546, train/loss_step=0.160, global_step=1989.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  59%|█████▉    | 711/1208 [19:59<13:58,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000542, train/loss_step=0.162, global_step=1989.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  59%|█████▉    | 712/1208 [20:02<13:57,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000542, train/loss_step=0.162, global_step=1989.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  59%|█████▉    | 712/1208 [20:02<13:57,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.13e-5, train/loss_step=0.0111, global_step=1989.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  59%|█████▉    | 713/1208 [20:03<13:55,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.13e-5, train/loss_step=0.0111, global_step=1989.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  59%|█████▉    | 713/1208 [20:03<13:55,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00981, train/loss_vlb_step=4.75e-5, train/loss_step=0.00981, global_step=1990.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  59%|█████▉    | 714/1208 [20:04<13:53,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00981, train/loss_vlb_step=4.75e-5, train/loss_step=0.00981, global_step=1990.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  59%|█████▉    | 714/1208 [20:04<13:53,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.5e-5, train/loss_step=0.0241, global_step=1990.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  59%|█████▉    | 715/1208 [20:05<13:51,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.5e-5, train/loss_step=0.0241, global_step=1990.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  59%|█████▉    | 715/1208 [20:05<13:51,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0843, train/loss_vlb_step=0.000282, train/loss_step=0.0843, global_step=1990.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  59%|█████▉    | 716/1208 [20:08<13:50,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0843, train/loss_vlb_step=0.000282, train/loss_step=0.0843, global_step=1990.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  59%|█████▉    | 716/1208 [20:08<13:50,  1.69s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.7e-5, train/loss_step=0.00288, global_step=1990.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  59%|█████▉    | 717/1208 [20:09<13:48,  1.69s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.7e-5, train/loss_step=0.00288, global_step=1990.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  59%|█████▉    | 717/1208 [20:09<13:48,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00246, train/loss_step=0.402, global_step=1991.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  59%|█████▉    | 718/1208 [20:11<13:46,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00246, train/loss_step=0.402, global_step=1991.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  59%|█████▉    | 718/1208 [20:11<13:46,  1.69s/it, loss=0.116, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=1991.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  60%|█████▉    | 719/1208 [20:12<13:44,  1.69s/it, loss=0.116, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=1991.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  60%|█████▉    | 719/1208 [20:12<13:44,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00459, train/loss_vlb_step=2.55e-5, train/loss_step=0.00459, global_step=1991.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  60%|█████▉    | 720/1208 [20:15<13:43,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00459, train/loss_vlb_step=2.55e-5, train/loss_step=0.00459, global_step=1991.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  60%|█████▉    | 720/1208 [20:15<13:43,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0657, train/loss_vlb_step=0.000226, train/loss_step=0.0657, global_step=1991.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  60%|█████▉    | 721/1208 [20:16<13:41,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0657, train/loss_vlb_step=0.000226, train/loss_step=0.0657, global_step=1991.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  60%|█████▉    | 721/1208 [20:16<13:41,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0733, train/loss_vlb_step=0.000242, train/loss_step=0.0733, global_step=1992.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  60%|█████▉    | 722/1208 [20:17<13:39,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0733, train/loss_vlb_step=0.000242, train/loss_step=0.0733, global_step=1992.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  60%|█████▉    | 722/1208 [20:17<13:39,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000593, train/loss_step=0.169, global_step=1992.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  60%|█████▉    | 723/1208 [20:18<13:37,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000593, train/loss_step=0.169, global_step=1992.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  60%|█████▉    | 723/1208 [20:18<13:37,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000686, train/loss_step=0.199, global_step=1992.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  60%|█████▉    | 724/1208 [20:21<13:36,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000686, train/loss_step=0.199, global_step=1992.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  60%|█████▉    | 724/1208 [20:21<13:36,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.00012, train/loss_step=0.032, global_step=1992.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  60%|██████    | 725/1208 [20:22<13:34,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.00012, train/loss_step=0.032, global_step=1992.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  60%|██████    | 725/1208 [20:22<13:34,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.88e-5, train/loss_step=0.0212, global_step=1993.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  60%|██████    | 726/1208 [20:23<13:32,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.88e-5, train/loss_step=0.0212, global_step=1993.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  60%|██████    | 726/1208 [20:23<13:32,  1.69s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.29e-5, train/loss_step=0.00213, global_step=1993.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  60%|██████    | 727/1208 [20:24<13:30,  1.68s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.29e-5, train/loss_step=0.00213, global_step=1993.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  60%|██████    | 727/1208 [20:24<13:30,  1.68s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000719, train/loss_step=0.180, global_step=1993.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  60%|██████    | 728/1208 [20:28<13:29,  1.69s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000719, train/loss_step=0.180, global_step=1993.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  60%|██████    | 728/1208 [20:28<13:29,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.859, train/loss_vlb_step=0.0876, train/loss_step=0.859, global_step=1993.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  60%|██████    | 729/1208 [20:29<13:27,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.859, train/loss_vlb_step=0.0876, train/loss_step=0.859, global_step=1993.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  60%|██████    | 729/1208 [20:29<13:27,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.037, train/loss_vlb_step=0.000136, train/loss_step=0.037, global_step=1994.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  60%|██████    | 730/1208 [20:30<13:25,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.037, train/loss_vlb_step=0.000136, train/loss_step=0.037, global_step=1994.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  60%|██████    | 730/1208 [20:30<13:25,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0713, train/loss_vlb_step=0.000236, train/loss_step=0.0713, global_step=1994.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  61%|██████    | 731/1208 [20:31<13:23,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0713, train/loss_vlb_step=0.000236, train/loss_step=0.0713, global_step=1994.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  61%|██████    | 731/1208 [20:31<13:23,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.000946, train/loss_step=0.257, global_step=1994.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  61%|██████    | 732/1208 [20:34<13:22,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.000946, train/loss_step=0.257, global_step=1994.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  61%|██████    | 732/1208 [20:34<13:22,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.6e-5, train/loss_step=0.0151, global_step=1994.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  61%|██████    | 733/1208 [20:35<13:20,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.6e-5, train/loss_step=0.0151, global_step=1994.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  61%|██████    | 733/1208 [20:35<13:20,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0852, train/loss_vlb_step=0.000287, train/loss_step=0.0852, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  61%|██████    | 734/1208 [20:36<13:18,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0852, train/loss_vlb_step=0.000287, train/loss_step=0.0852, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  61%|██████    | 734/1208 [20:36<13:18,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=2.05e-5, train/loss_step=0.00375, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  61%|██████    | 735/1208 [20:37<13:16,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=2.05e-5, train/loss_step=0.00375, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  61%|██████    | 735/1208 [20:37<13:16,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000972, train/loss_step=0.237, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  61%|██████    | 736/1208 [20:40<13:15,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000972, train/loss_step=0.237, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  61%|██████    | 736/1208 [20:40<13:15,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00333, train/loss_vlb_step=1.88e-5, train/loss_step=0.00333, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  61%|██████    | 737/1208 [20:41<13:13,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00333, train/loss_vlb_step=1.88e-5, train/loss_step=0.00333, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  61%|██████    | 737/1208 [20:41<13:13,  1.69s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.13e-5, train/loss_step=0.00188, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  61%|██████    | 738/1208 [20:43<13:11,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.13e-5, train/loss_step=0.00188, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  61%|██████    | 738/1208 [20:43<13:11,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0953, train/loss_vlb_step=0.000317, train/loss_step=0.0953, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  61%|██████    | 739/1208 [20:44<13:09,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0953, train/loss_vlb_step=0.000317, train/loss_step=0.0953, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  61%|██████    | 739/1208 [20:44<13:09,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0764, train/loss_vlb_step=0.000264, train/loss_step=0.0764, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  61%|██████▏   | 740/1208 [20:47<13:08,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0764, train/loss_vlb_step=0.000264, train/loss_step=0.0764, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  61%|██████▏   | 740/1208 [20:47<13:08,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00766, train/loss_vlb_step=3.79e-5, train/loss_step=0.00766, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  61%|██████▏   | 741/1208 [20:48<13:06,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00766, train/loss_vlb_step=3.79e-5, train/loss_step=0.00766, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  61%|██████▏   | 741/1208 [20:48<13:06,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.000144, train/loss_step=0.0379, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  61%|██████▏   | 742/1208 [20:49<13:04,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.000144, train/loss_step=0.0379, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  61%|██████▏   | 742/1208 [20:49<13:04,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00187, train/loss_step=0.326, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  62%|██████▏   | 743/1208 [20:50<13:02,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00187, train/loss_step=0.326, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  62%|██████▏   | 743/1208 [20:50<13:02,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00548, train/loss_vlb_step=2.87e-5, train/loss_step=0.00548, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  62%|██████▏   | 744/1208 [20:53<13:01,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00548, train/loss_vlb_step=2.87e-5, train/loss_step=0.00548, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  62%|██████▏   | 744/1208 [20:53<13:01,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0427, train/loss_vlb_step=0.000166, train/loss_step=0.0427, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  62%|██████▏   | 745/1208 [20:54<12:59,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0427, train/loss_vlb_step=0.000166, train/loss_step=0.0427, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  62%|██████▏   | 745/1208 [20:54<12:59,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0692, train/loss_vlb_step=0.00024, train/loss_step=0.0692, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  62%|██████▏   | 746/1208 [20:55<12:57,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0692, train/loss_vlb_step=0.00024, train/loss_step=0.0692, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  62%|██████▏   | 746/1208 [20:55<12:57,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.65e-5, train/loss_step=0.0126, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  62%|██████▏   | 747/1208 [20:56<12:55,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.65e-5, train/loss_step=0.0126, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  62%|██████▏   | 747/1208 [20:56<12:55,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.2e-5, train/loss_step=0.0113, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  62%|██████▏   | 748/1208 [21:00<12:54,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.2e-5, train/loss_step=0.0113, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  62%|██████▏   | 748/1208 [21:00<12:54,  1.68s/it, loss=0.0741, v_num=0, train/loss_simple_step=0.0845, train/loss_vlb_step=0.000282, train/loss_step=0.0845, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  62%|██████▏   | 749/1208 [21:01<12:52,  1.68s/it, loss=0.0741, v_num=0, train/loss_simple_step=0.0845, train/loss_vlb_step=0.000282, train/loss_step=0.0845, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  62%|██████▏   | 749/1208 [21:01<12:52,  1.68s/it, loss=0.0778, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000367, train/loss_step=0.111, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  62%|██████▏   | 750/1208 [21:02<12:50,  1.68s/it, loss=0.0778, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000367, train/loss_step=0.111, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  62%|██████▏   | 750/1208 [21:02<12:50,  1.68s/it, loss=0.0762, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.00014, train/loss_step=0.0386, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  62%|██████▏   | 751/1208 [21:03<12:48,  1.68s/it, loss=0.0762, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.00014, train/loss_step=0.0386, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  62%|██████▏   | 751/1208 [21:03<12:48,  1.68s/it, loss=0.0703, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000463, train/loss_step=0.139, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  62%|██████▏   | 752/1208 [21:06<12:48,  1.68s/it, loss=0.0703, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000463, train/loss_step=0.139, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  62%|██████▏   | 752/1208 [21:06<12:48,  1.68s/it, loss=0.0699, v_num=0, train/loss_simple_step=0.00813, train/loss_vlb_step=3.76e-5, train/loss_step=0.00813, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  62%|██████▏   | 753/1208 [21:07<12:45,  1.68s/it, loss=0.0699, v_num=0, train/loss_simple_step=0.00813, train/loss_vlb_step=3.76e-5, train/loss_step=0.00813, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  62%|██████▏   | 753/1208 [21:07<12:45,  1.68s/it, loss=0.0731, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.00051, train/loss_step=0.149, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  62%|██████▏   | 754/1208 [21:08<12:43,  1.68s/it, loss=0.0731, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.00051, train/loss_step=0.149, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  62%|██████▏   | 754/1208 [21:08<12:43,  1.68s/it, loss=0.0736, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.65e-5, train/loss_step=0.0132, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  62%|██████▎   | 755/1208 [21:09<12:41,  1.68s/it, loss=0.0736, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.65e-5, train/loss_step=0.0132, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  62%|██████▎   | 755/1208 [21:09<12:41,  1.68s/it, loss=0.062, v_num=0, train/loss_simple_step=0.00489, train/loss_vlb_step=2.78e-5, train/loss_step=0.00489, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  63%|██████▎   | 756/1208 [21:12<12:41,  1.68s/it, loss=0.062, v_num=0, train/loss_simple_step=0.00489, train/loss_vlb_step=2.78e-5, train/loss_step=0.00489, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  63%|██████▎   | 756/1208 [21:12<12:41,  1.68s/it, loss=0.062, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=2.09e-5, train/loss_step=0.00373, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  63%|██████▎   | 757/1208 [21:14<12:39,  1.68s/it, loss=0.062, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=2.09e-5, train/loss_step=0.00373, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  63%|██████▎   | 757/1208 [21:14<12:39,  1.68s/it, loss=0.0799, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.00201, train/loss_step=0.360, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  63%|██████▎   | 758/1208 [21:15<12:36,  1.68s/it, loss=0.0799, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.00201, train/loss_step=0.360, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  63%|██████▎   | 758/1208 [21:15<12:36,  1.68s/it, loss=0.105, v_num=0, train/loss_simple_step=0.588, train/loss_vlb_step=0.00796, train/loss_step=0.588, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  63%|██████▎   | 759/1208 [21:16<12:34,  1.68s/it, loss=0.105, v_num=0, train/loss_simple_step=0.588, train/loss_vlb_step=0.00796, train/loss_step=0.588, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  63%|██████▎   | 759/1208 [21:16<12:34,  1.68s/it, loss=0.107, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000418, train/loss_step=0.127, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  63%|██████▎   | 760/1208 [21:19<12:34,  1.68s/it, loss=0.107, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000418, train/loss_step=0.127, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  63%|██████▎   | 760/1208 [21:19<12:34,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.462, train/loss_vlb_step=0.00481, train/loss_step=0.462, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  63%|██████▎   | 761/1208 [21:20<12:32,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.462, train/loss_vlb_step=0.00481, train/loss_step=0.462, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  63%|██████▎   | 761/1208 [21:20<12:32,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00507, train/loss_vlb_step=2.69e-5, train/loss_step=0.00507, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  63%|██████▎   | 762/1208 [21:21<12:30,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00507, train/loss_vlb_step=2.69e-5, train/loss_step=0.00507, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  63%|██████▎   | 762/1208 [21:21<12:30,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00139, train/loss_step=0.309, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  63%|██████▎   | 763/1208 [21:22<12:27,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00139, train/loss_step=0.309, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  63%|██████▎   | 763/1208 [21:22<12:27,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000515, train/loss_step=0.154, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  63%|██████▎   | 764/1208 [21:25<12:27,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000515, train/loss_step=0.154, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  63%|██████▎   | 764/1208 [21:25<12:27,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000484, train/loss_step=0.145, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  63%|██████▎   | 765/1208 [21:26<12:25,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000484, train/loss_step=0.145, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  63%|██████▎   | 765/1208 [21:26<12:25,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0839, train/loss_vlb_step=0.00028, train/loss_step=0.0839, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  63%|██████▎   | 766/1208 [21:27<12:23,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0839, train/loss_vlb_step=0.00028, train/loss_step=0.0839, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  63%|██████▎   | 766/1208 [21:27<12:23,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0846, train/loss_vlb_step=0.000281, train/loss_step=0.0846, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  63%|██████▎   | 767/1208 [21:28<12:21,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0846, train/loss_vlb_step=0.000281, train/loss_step=0.0846, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  63%|██████▎   | 767/1208 [21:28<12:21,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.56e-5, train/loss_step=0.0174, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  64%|██████▎   | 768/1208 [21:32<12:20,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.56e-5, train/loss_step=0.0174, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  64%|██████▎   | 768/1208 [21:32<12:20,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00194, train/loss_step=0.333, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  64%|██████▎   | 769/1208 [21:33<12:18,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00194, train/loss_step=0.333, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  64%|██████▎   | 769/1208 [21:33<12:18,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.62e-5, train/loss_step=0.00267, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  64%|██████▎   | 770/1208 [21:34<12:16,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.62e-5, train/loss_step=0.00267, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  64%|██████▎   | 770/1208 [21:34<12:16,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0531, train/loss_vlb_step=0.000186, train/loss_step=0.0531, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  64%|██████▍   | 771/1208 [21:35<12:14,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0531, train/loss_vlb_step=0.000186, train/loss_step=0.0531, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  64%|██████▍   | 771/1208 [21:35<12:14,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.00016, train/loss_step=0.0445, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  64%|██████▍   | 772/1208 [21:38<12:13,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.00016, train/loss_step=0.0445, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  64%|██████▍   | 772/1208 [21:38<12:13,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00113, train/loss_step=0.264, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  64%|██████▍   | 773/1208 [21:39<12:11,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00113, train/loss_step=0.264, global_step=2e+3, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  64%|██████▍   | 773/1208 [21:39<12:11,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000621, train/loss_step=0.173, global_step=2005.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  64%|██████▍   | 774/1208 [21:40<12:09,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000621, train/loss_step=0.173, global_step=2005.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  64%|██████▍   | 774/1208 [21:40<12:09,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00426, train/loss_vlb_step=2.22e-5, train/loss_step=0.00426, global_step=2005.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  64%|██████▍   | 775/1208 [21:41<12:07,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00426, train/loss_vlb_step=2.22e-5, train/loss_step=0.00426, global_step=2005.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  64%|██████▍   | 775/1208 [21:41<12:07,  1.68s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=7.95e-5, train/loss_step=0.0197, global_step=2005.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  64%|██████▍   | 776/1208 [21:44<12:06,  1.68s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=7.95e-5, train/loss_step=0.0197, global_step=2005.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  64%|██████▍   | 776/1208 [21:44<12:06,  1.68s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00807, train/loss_vlb_step=4.02e-5, train/loss_step=0.00807, global_step=2005.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  64%|██████▍   | 777/1208 [21:45<12:04,  1.68s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00807, train/loss_vlb_step=4.02e-5, train/loss_step=0.00807, global_step=2005.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  64%|██████▍   | 777/1208 [21:45<12:04,  1.68s/it, loss=0.171, v_num=0, train/loss_simple_step=0.538, train/loss_vlb_step=0.00928, train/loss_step=0.538, global_step=2006.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  64%|██████▍   | 778/1208 [21:47<12:02,  1.68s/it, loss=0.171, v_num=0, train/loss_simple_step=0.538, train/loss_vlb_step=0.00928, train/loss_step=0.538, global_step=2006.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  64%|██████▍   | 778/1208 [21:47<12:02,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00595, train/loss_vlb_step=3.2e-5, train/loss_step=0.00595, global_step=2006.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  64%|██████▍   | 779/1208 [21:48<12:00,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00595, train/loss_vlb_step=3.2e-5, train/loss_step=0.00595, global_step=2006.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  64%|██████▍   | 779/1208 [21:48<12:00,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0551, train/loss_vlb_step=0.000191, train/loss_step=0.0551, global_step=2006.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  65%|██████▍   | 780/1208 [21:51<11:59,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0551, train/loss_vlb_step=0.000191, train/loss_step=0.0551, global_step=2006.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  65%|██████▍   | 780/1208 [21:51<11:59,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.24e-5, train/loss_step=0.00211, global_step=2006.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  65%|██████▍   | 781/1208 [21:52<11:57,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.24e-5, train/loss_step=0.00211, global_step=2006.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  65%|██████▍   | 781/1208 [21:52<11:57,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.522, train/loss_vlb_step=0.0113, train/loss_step=0.522, global_step=2007.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]     Epoch 6:  65%|██████▍   | 782/1208 [21:53<11:55,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.522, train/loss_vlb_step=0.0113, train/loss_step=0.522, global_step=2007.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  65%|██████▍   | 782/1208 [21:53<11:55,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00172, train/loss_step=0.318, global_step=2007.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  65%|██████▍   | 783/1208 [21:54<11:53,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00172, train/loss_step=0.318, global_step=2007.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  65%|██████▍   | 783/1208 [21:54<11:53,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=0.0001, train/loss_step=0.0251, global_step=2007.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  65%|██████▍   | 784/1208 [21:57<11:52,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=0.0001, train/loss_step=0.0251, global_step=2007.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  65%|██████▍   | 784/1208 [21:57<11:52,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.000134, train/loss_step=0.0347, global_step=2007.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  65%|██████▍   | 785/1208 [21:58<11:50,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.000134, train/loss_step=0.0347, global_step=2007.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  65%|██████▍   | 785/1208 [21:58<11:50,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000131, train/loss_step=0.0348, global_step=2008.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  65%|██████▌   | 786/1208 [21:59<11:48,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000131, train/loss_step=0.0348, global_step=2008.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  65%|██████▌   | 786/1208 [21:59<11:48,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.672, train/loss_vlb_step=0.0235, train/loss_step=0.672, global_step=2008.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  65%|██████▌   | 787/1208 [22:00<11:46,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.672, train/loss_vlb_step=0.0235, train/loss_step=0.672, global_step=2008.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  65%|██████▌   | 787/1208 [22:00<11:46,  1.68s/it, loss=0.181, v_num=0, train/loss_simple_step=0.513, train/loss_vlb_step=0.0107, train/loss_step=0.513, global_step=2008.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  65%|██████▌   | 788/1208 [22:04<11:45,  1.68s/it, loss=0.181, v_num=0, train/loss_simple_step=0.513, train/loss_vlb_step=0.0107, train/loss_step=0.513, global_step=2008.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  65%|██████▌   | 788/1208 [22:04<11:45,  1.68s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0898, train/loss_vlb_step=0.000296, train/loss_step=0.0898, global_step=2008.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  65%|██████▌   | 789/1208 [22:05<11:43,  1.68s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0898, train/loss_vlb_step=0.000296, train/loss_step=0.0898, global_step=2008.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  65%|██████▌   | 789/1208 [22:05<11:43,  1.68s/it, loss=0.178, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000614, train/loss_step=0.181, global_step=2009.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  65%|██████▌   | 790/1208 [22:06<11:41,  1.68s/it, loss=0.178, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000614, train/loss_step=0.181, global_step=2009.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  65%|██████▌   | 790/1208 [22:06<11:41,  1.68s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00599, train/loss_vlb_step=3.04e-5, train/loss_step=0.00599, global_step=2009.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  65%|██████▌   | 791/1208 [22:07<11:39,  1.68s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00599, train/loss_vlb_step=3.04e-5, train/loss_step=0.00599, global_step=2009.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  65%|██████▌   | 791/1208 [22:07<11:39,  1.68s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00346, train/loss_vlb_step=1.96e-5, train/loss_step=0.00346, global_step=2009.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  66%|██████▌   | 792/1208 [22:10<11:38,  1.68s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00346, train/loss_vlb_step=1.96e-5, train/loss_step=0.00346, global_step=2009.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  66%|██████▌   | 792/1208 [22:10<11:38,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.72e-5, train/loss_step=0.0206, global_step=2009.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  66%|██████▌   | 793/1208 [22:11<11:36,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.72e-5, train/loss_step=0.0206, global_step=2009.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  66%|██████▌   | 793/1208 [22:11<11:36,  1.68s/it, loss=0.166, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00116, train/loss_step=0.263, global_step=2010.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  66%|██████▌   | 794/1208 [22:12<11:34,  1.68s/it, loss=0.166, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00116, train/loss_step=0.263, global_step=2010.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  66%|██████▌   | 794/1208 [22:12<11:34,  1.68s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000128, train/loss_step=0.0342, global_step=2010.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  66%|██████▌   | 795/1208 [22:13<11:32,  1.68s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000128, train/loss_step=0.0342, global_step=2010.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  66%|██████▌   | 795/1208 [22:13<11:32,  1.68s/it, loss=0.174, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000477, train/loss_step=0.145, global_step=2010.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  66%|██████▌   | 796/1208 [22:16<11:31,  1.68s/it, loss=0.174, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000477, train/loss_step=0.145, global_step=2010.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  66%|██████▌   | 796/1208 [22:16<11:31,  1.68s/it, loss=0.188, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00134, train/loss_step=0.296, global_step=2010.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  66%|██████▌   | 797/1208 [22:18<11:29,  1.68s/it, loss=0.188, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00134, train/loss_step=0.296, global_step=2010.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  66%|██████▌   | 797/1208 [22:18<11:29,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0825, train/loss_vlb_step=0.000276, train/loss_step=0.0825, global_step=2011.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  66%|██████▌   | 798/1208 [22:19<11:27,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0825, train/loss_vlb_step=0.000276, train/loss_step=0.0825, global_step=2011.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  66%|██████▌   | 798/1208 [22:19<11:27,  1.68s/it, loss=0.179, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00109, train/loss_step=0.275, global_step=2011.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  66%|██████▌   | 799/1208 [22:20<11:25,  1.68s/it, loss=0.179, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00109, train/loss_step=0.275, global_step=2011.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  66%|██████▌   | 799/1208 [22:20<11:25,  1.68s/it, loss=0.186, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000674, train/loss_step=0.196, global_step=2011.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  66%|██████▌   | 800/1208 [22:23<11:25,  1.68s/it, loss=0.186, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000674, train/loss_step=0.196, global_step=2011.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  66%|██████▌   | 800/1208 [22:23<11:25,  1.68s/it, loss=0.199, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00107, train/loss_step=0.269, global_step=2011.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  66%|██████▋   | 801/1208 [22:24<11:23,  1.68s/it, loss=0.199, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00107, train/loss_step=0.269, global_step=2011.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  66%|██████▋   | 801/1208 [22:24<11:23,  1.68s/it, loss=0.18, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000477, train/loss_step=0.145, global_step=2012.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  66%|██████▋   | 802/1208 [22:25<11:21,  1.68s/it, loss=0.18, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000477, train/loss_step=0.145, global_step=2012.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  66%|██████▋   | 802/1208 [22:25<11:21,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.68e-5, train/loss_step=0.0029, global_step=2012.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  66%|██████▋   | 803/1208 [22:26<11:19,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.68e-5, train/loss_step=0.0029, global_step=2012.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  66%|██████▋   | 803/1208 [22:26<11:19,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0318, train/loss_vlb_step=0.000118, train/loss_step=0.0318, global_step=2012.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  67%|██████▋   | 804/1208 [22:29<11:18,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0318, train/loss_vlb_step=0.000118, train/loss_step=0.0318, global_step=2012.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  67%|██████▋   | 804/1208 [22:29<11:18,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.32e-5, train/loss_step=0.0171, global_step=2012.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  67%|██████▋   | 805/1208 [22:30<11:16,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.32e-5, train/loss_step=0.0171, global_step=2012.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  67%|██████▋   | 805/1208 [22:30<11:16,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=5.13e-5, train/loss_step=0.0107, global_step=2013.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  67%|██████▋   | 806/1208 [22:31<11:14,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=5.13e-5, train/loss_step=0.0107, global_step=2013.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  67%|██████▋   | 806/1208 [22:31<11:14,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=2013.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  67%|██████▋   | 807/1208 [22:32<11:12,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=2013.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  67%|██████▋   | 807/1208 [22:32<11:12,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000863, train/loss_step=0.226, global_step=2013.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  67%|██████▋   | 808/1208 [22:36<11:11,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000863, train/loss_step=0.226, global_step=2013.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  67%|██████▋   | 808/1208 [22:36<11:11,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=6.09e-5, train/loss_step=0.0129, global_step=2013.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  67%|██████▋   | 809/1208 [22:37<11:09,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=6.09e-5, train/loss_step=0.0129, global_step=2013.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  67%|██████▋   | 809/1208 [22:37<11:09,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0826, train/loss_vlb_step=0.000279, train/loss_step=0.0826, global_step=2014.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  67%|██████▋   | 810/1208 [22:38<11:07,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0826, train/loss_vlb_step=0.000279, train/loss_step=0.0826, global_step=2014.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  67%|██████▋   | 810/1208 [22:38<11:07,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.000152, train/loss_step=0.0418, global_step=2014.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  67%|██████▋   | 811/1208 [22:39<11:05,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.000152, train/loss_step=0.0418, global_step=2014.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  67%|██████▋   | 811/1208 [22:39<11:05,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000409, train/loss_step=0.124, global_step=2014.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  67%|██████▋   | 812/1208 [22:42<11:04,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000409, train/loss_step=0.124, global_step=2014.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  67%|██████▋   | 812/1208 [22:42<11:04,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0067, train/loss_vlb_step=3.59e-5, train/loss_step=0.0067, global_step=2014.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  67%|██████▋   | 813/1208 [22:43<11:02,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0067, train/loss_vlb_step=3.59e-5, train/loss_step=0.0067, global_step=2014.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  67%|██████▋   | 813/1208 [22:43<11:02,  1.68s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=5.82e-5, train/loss_step=0.0139, global_step=2015.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  67%|██████▋   | 814/1208 [22:44<11:00,  1.68s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=5.82e-5, train/loss_step=0.0139, global_step=2015.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  67%|██████▋   | 814/1208 [22:44<11:00,  1.68s/it, loss=0.111, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000386, train/loss_step=0.118, global_step=2015.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  67%|██████▋   | 815/1208 [22:45<10:58,  1.68s/it, loss=0.111, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000386, train/loss_step=0.118, global_step=2015.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  67%|██████▋   | 815/1208 [22:45<10:58,  1.68s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000127, train/loss_step=0.0329, global_step=2015.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  68%|██████▊   | 816/1208 [22:49<10:57,  1.68s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000127, train/loss_step=0.0329, global_step=2015.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  68%|██████▊   | 816/1208 [22:49<10:57,  1.68s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.0847, train/loss_vlb_step=0.000283, train/loss_step=0.0847, global_step=2015.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  68%|██████▊   | 817/1208 [22:50<10:55,  1.68s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.0847, train/loss_vlb_step=0.000283, train/loss_step=0.0847, global_step=2015.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  68%|██████▊   | 817/1208 [22:50<10:55,  1.68s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.00591, train/loss_vlb_step=3e-5, train/loss_step=0.00591, global_step=2016.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  68%|██████▊   | 818/1208 [22:51<10:53,  1.68s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.00591, train/loss_vlb_step=3e-5, train/loss_step=0.00591, global_step=2016.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  68%|██████▊   | 818/1208 [22:51<10:53,  1.68s/it, loss=0.0771, v_num=0, train/loss_simple_step=0.00502, train/loss_vlb_step=2.63e-5, train/loss_step=0.00502, global_step=2016.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  68%|██████▊   | 819/1208 [22:52<10:51,  1.68s/it, loss=0.0771, v_num=0, train/loss_simple_step=0.00502, train/loss_vlb_step=2.63e-5, train/loss_step=0.00502, global_step=2016.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  68%|██████▊   | 819/1208 [22:52<10:51,  1.68s/it, loss=0.0686, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.00011, train/loss_step=0.0268, global_step=2016.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  68%|██████▊   | 820/1208 [22:55<10:50,  1.68s/it, loss=0.0686, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.00011, train/loss_step=0.0268, global_step=2016.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  68%|██████▊   | 820/1208 [22:55<10:50,  1.68s/it, loss=0.0587, v_num=0, train/loss_simple_step=0.0715, train/loss_vlb_step=0.000241, train/loss_step=0.0715, global_step=2016.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  68%|██████▊   | 821/1208 [22:56<10:48,  1.68s/it, loss=0.0587, v_num=0, train/loss_simple_step=0.0715, train/loss_vlb_step=0.000241, train/loss_step=0.0715, global_step=2016.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  68%|██████▊   | 821/1208 [22:56<10:48,  1.68s/it, loss=0.0527, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=0.000103, train/loss_step=0.0242, global_step=2017.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  68%|██████▊   | 822/1208 [22:57<10:46,  1.68s/it, loss=0.0527, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=0.000103, train/loss_step=0.0242, global_step=2017.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  68%|██████▊   | 822/1208 [22:57<10:46,  1.68s/it, loss=0.0547, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000147, train/loss_step=0.042, global_step=2017.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  68%|██████▊   | 823/1208 [22:58<10:44,  1.67s/it, loss=0.0547, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000147, train/loss_step=0.042, global_step=2017.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  68%|██████▊   | 823/1208 [22:58<10:44,  1.67s/it, loss=0.054, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=7.82e-5, train/loss_step=0.0193, global_step=2017.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  68%|██████▊   | 824/1208 [23:01<10:43,  1.68s/it, loss=0.054, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=7.82e-5, train/loss_step=0.0193, global_step=2017.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  68%|██████▊   | 824/1208 [23:01<10:43,  1.68s/it, loss=0.0595, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000414, train/loss_step=0.126, global_step=2017.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  68%|██████▊   | 825/1208 [23:02<10:41,  1.68s/it, loss=0.0595, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000414, train/loss_step=0.126, global_step=2017.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  68%|██████▊   | 825/1208 [23:02<10:41,  1.68s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.634, train/loss_vlb_step=0.0275, train/loss_step=0.634, global_step=2018.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  68%|██████▊   | 826/1208 [23:03<10:39,  1.68s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.634, train/loss_vlb_step=0.0275, train/loss_step=0.634, global_step=2018.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  68%|██████▊   | 826/1208 [23:03<10:40,  1.68s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.0729, train/loss_vlb_step=0.000248, train/loss_step=0.0729, global_step=2018.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  68%|██████▊   | 827/1208 [23:04<10:38,  1.67s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.0729, train/loss_vlb_step=0.000248, train/loss_step=0.0729, global_step=2018.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  68%|██████▊   | 827/1208 [23:04<10:38,  1.67s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00347, train/loss_step=0.368, global_step=2018.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  69%|██████▊   | 828/1208 [23:08<10:37,  1.68s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00347, train/loss_step=0.368, global_step=2018.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  69%|██████▊   | 828/1208 [23:08<10:37,  1.68s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000145, train/loss_step=0.0378, global_step=2018.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  69%|██████▊   | 829/1208 [23:09<10:35,  1.68s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000145, train/loss_step=0.0378, global_step=2018.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  69%|██████▊   | 829/1208 [23:09<10:35,  1.68s/it, loss=0.104, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000848, train/loss_step=0.230, global_step=2019.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  69%|██████▊   | 830/1208 [23:10<10:33,  1.68s/it, loss=0.104, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000848, train/loss_step=0.230, global_step=2019.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  69%|██████▊   | 830/1208 [23:10<10:33,  1.68s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.82e-5, train/loss_step=0.00319, global_step=2019.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  69%|██████▉   | 831/1208 [23:11<10:31,  1.67s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.82e-5, train/loss_step=0.00319, global_step=2019.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  69%|██████▉   | 831/1208 [23:11<10:31,  1.67s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.63e-5, train/loss_step=0.00278, global_step=2019.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  69%|██████▉   | 832/1208 [23:14<10:30,  1.68s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.63e-5, train/loss_step=0.00278, global_step=2019.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  69%|██████▉   | 832/1208 [23:14<10:30,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.448, train/loss_vlb_step=0.00281, train/loss_step=0.448, global_step=2019.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]     Epoch 6:  69%|██████▉   | 833/1208 [23:15<10:28,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.448, train/loss_vlb_step=0.00281, train/loss_step=0.448, global_step=2019.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  69%|██████▉   | 833/1208 [23:15<10:28,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.635, train/loss_vlb_step=0.0124, train/loss_step=0.635, global_step=2020.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  69%|██████▉   | 834/1208 [23:16<10:26,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.635, train/loss_vlb_step=0.0124, train/loss_step=0.635, global_step=2020.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  69%|██████▉   | 834/1208 [23:16<10:26,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000117, train/loss_step=0.0306, global_step=2020.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  69%|██████▉   | 835/1208 [23:17<10:24,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000117, train/loss_step=0.0306, global_step=2020.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  69%|██████▉   | 835/1208 [23:17<10:24,  1.67s/it, loss=0.178, v_num=0, train/loss_simple_step=0.683, train/loss_vlb_step=0.0174, train/loss_step=0.683, global_step=2020.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  69%|██████▉   | 836/1208 [23:20<10:23,  1.68s/it, loss=0.178, v_num=0, train/loss_simple_step=0.683, train/loss_vlb_step=0.0174, train/loss_step=0.683, global_step=2020.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  69%|██████▉   | 836/1208 [23:20<10:23,  1.68s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.84e-5, train/loss_step=0.0105, global_step=2020.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  69%|██████▉   | 837/1208 [23:21<10:21,  1.68s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.84e-5, train/loss_step=0.0105, global_step=2020.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  69%|██████▉   | 837/1208 [23:21<10:21,  1.68s/it, loss=0.198, v_num=0, train/loss_simple_step=0.492, train/loss_vlb_step=0.00875, train/loss_step=0.492, global_step=2021.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  69%|██████▉   | 838/1208 [23:23<10:19,  1.67s/it, loss=0.198, v_num=0, train/loss_simple_step=0.492, train/loss_vlb_step=0.00875, train/loss_step=0.492, global_step=2021.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  69%|██████▉   | 838/1208 [23:23<10:19,  1.67s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00372, train/loss_vlb_step=2.12e-5, train/loss_step=0.00372, global_step=2021.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  69%|██████▉   | 839/1208 [23:24<10:17,  1.67s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00372, train/loss_vlb_step=2.12e-5, train/loss_step=0.00372, global_step=2021.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  69%|██████▉   | 839/1208 [23:24<10:17,  1.67s/it, loss=0.2, v_num=0, train/loss_simple_step=0.059, train/loss_vlb_step=0.000204, train/loss_step=0.059, global_step=2021.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]     Epoch 6:  70%|██████▉   | 840/1208 [23:27<10:16,  1.68s/it, loss=0.2, v_num=0, train/loss_simple_step=0.059, train/loss_vlb_step=0.000204, train/loss_step=0.059, global_step=2021.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  70%|██████▉   | 840/1208 [23:27<10:16,  1.68s/it, loss=0.209, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.000985, train/loss_step=0.255, global_step=2021.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  70%|██████▉   | 841/1208 [23:28<10:14,  1.67s/it, loss=0.209, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.000985, train/loss_step=0.255, global_step=2021.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  70%|██████▉   | 841/1208 [23:28<10:14,  1.67s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0434, train/loss_vlb_step=0.000159, train/loss_step=0.0434, global_step=2022.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  70%|██████▉   | 842/1208 [23:29<10:12,  1.67s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0434, train/loss_vlb_step=0.000159, train/loss_step=0.0434, global_step=2022.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  70%|██████▉   | 842/1208 [23:29<10:12,  1.67s/it, loss=0.215, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000463, train/loss_step=0.139, global_step=2022.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  70%|██████▉   | 843/1208 [23:30<10:10,  1.67s/it, loss=0.215, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000463, train/loss_step=0.139, global_step=2022.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  70%|██████▉   | 843/1208 [23:30<10:10,  1.67s/it, loss=0.214, v_num=0, train/loss_simple_step=0.00474, train/loss_vlb_step=2.48e-5, train/loss_step=0.00474, global_step=2022.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  70%|██████▉   | 844/1208 [23:33<10:09,  1.68s/it, loss=0.214, v_num=0, train/loss_simple_step=0.00474, train/loss_vlb_step=2.48e-5, train/loss_step=0.00474, global_step=2022.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  70%|██████▉   | 844/1208 [23:33<10:09,  1.68s/it, loss=0.226, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00266, train/loss_step=0.374, global_step=2022.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  70%|██████▉   | 845/1208 [23:34<10:07,  1.67s/it, loss=0.226, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00266, train/loss_step=0.374, global_step=2022.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  70%|██████▉   | 845/1208 [23:34<10:07,  1.67s/it, loss=0.205, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000722, train/loss_step=0.201, global_step=2023.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  70%|███████   | 846/1208 [23:35<10:05,  1.67s/it, loss=0.205, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000722, train/loss_step=0.201, global_step=2023.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  70%|███████   | 846/1208 [23:35<10:05,  1.67s/it, loss=0.211, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000783, train/loss_step=0.205, global_step=2023.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  70%|███████   | 847/1208 [23:36<10:03,  1.67s/it, loss=0.211, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000783, train/loss_step=0.205, global_step=2023.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  70%|███████   | 847/1208 [23:36<10:03,  1.67s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000123, train/loss_step=0.0327, global_step=2023.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  70%|███████   | 848/1208 [23:40<10:02,  1.67s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000123, train/loss_step=0.0327, global_step=2023.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  70%|███████   | 848/1208 [23:40<10:02,  1.67s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0795, train/loss_vlb_step=0.000262, train/loss_step=0.0795, global_step=2023.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  70%|███████   | 849/1208 [23:41<10:00,  1.67s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0795, train/loss_vlb_step=0.000262, train/loss_step=0.0795, global_step=2023.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  70%|███████   | 849/1208 [23:41<10:00,  1.67s/it, loss=0.207, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.0045, train/loss_step=0.433, global_step=2024.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  70%|███████   | 850/1208 [23:42<09:59,  1.67s/it, loss=0.207, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.0045, train/loss_step=0.433, global_step=2024.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  70%|███████   | 850/1208 [23:42<09:59,  1.67s/it, loss=0.224, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00257, train/loss_step=0.339, global_step=2024.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  70%|███████   | 851/1208 [23:43<09:57,  1.67s/it, loss=0.224, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00257, train/loss_step=0.339, global_step=2024.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  70%|███████   | 851/1208 [23:43<09:57,  1.67s/it, loss=0.224, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.5e-5, train/loss_step=0.00257, global_step=2024.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  71%|███████   | 852/1208 [23:46<09:56,  1.67s/it, loss=0.224, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.5e-5, train/loss_step=0.00257, global_step=2024.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  71%|███████   | 852/1208 [23:46<09:56,  1.67s/it, loss=0.207, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000401, train/loss_step=0.122, global_step=2024.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  71%|███████   | 853/1208 [23:47<09:54,  1.67s/it, loss=0.207, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000401, train/loss_step=0.122, global_step=2024.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  71%|███████   | 853/1208 [23:47<09:54,  1.67s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.43e-5, train/loss_step=0.0233, global_step=2025.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  71%|███████   | 854/1208 [23:48<09:52,  1.67s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.43e-5, train/loss_step=0.0233, global_step=2025.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  71%|███████   | 854/1208 [23:48<09:52,  1.67s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.65e-5, train/loss_step=0.0126, global_step=2025.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  71%|███████   | 855/1208 [23:49<09:50,  1.67s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.65e-5, train/loss_step=0.0126, global_step=2025.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  71%|███████   | 855/1208 [23:49<09:50,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00109, train/loss_step=0.252, global_step=2025.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  71%|███████   | 856/1208 [23:52<09:49,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00109, train/loss_step=0.252, global_step=2025.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  71%|███████   | 856/1208 [23:52<09:49,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=9.06e-5, train/loss_step=0.0223, global_step=2025.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  71%|███████   | 857/1208 [23:53<09:47,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=9.06e-5, train/loss_step=0.0223, global_step=2025.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  71%|███████   | 857/1208 [23:53<09:47,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0052, train/loss_vlb_step=2.69e-5, train/loss_step=0.0052, global_step=2026.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  71%|███████   | 858/1208 [23:54<09:45,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0052, train/loss_vlb_step=2.69e-5, train/loss_step=0.0052, global_step=2026.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  71%|███████   | 858/1208 [23:54<09:45,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000466, train/loss_step=0.139, global_step=2026.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  71%|███████   | 859/1208 [23:56<09:43,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000466, train/loss_step=0.139, global_step=2026.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  71%|███████   | 859/1208 [23:56<09:43,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00138, train/loss_step=0.292, global_step=2026.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  71%|███████   | 860/1208 [23:59<09:42,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00138, train/loss_step=0.292, global_step=2026.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  71%|███████   | 860/1208 [23:59<09:42,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00336, train/loss_vlb_step=1.77e-5, train/loss_step=0.00336, global_step=2026.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  71%|███████▏  | 861/1208 [24:00<09:40,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00336, train/loss_vlb_step=1.77e-5, train/loss_step=0.00336, global_step=2026.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  71%|███████▏  | 861/1208 [24:00<09:40,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.549, train/loss_vlb_step=0.0115, train/loss_step=0.549, global_step=2027.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]     Epoch 6:  71%|███████▏  | 862/1208 [24:01<09:38,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.549, train/loss_vlb_step=0.0115, train/loss_step=0.549, global_step=2027.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  71%|███████▏  | 862/1208 [24:01<09:38,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=7.04e-5, train/loss_step=0.016, global_step=2027.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  71%|███████▏  | 863/1208 [24:02<09:36,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=7.04e-5, train/loss_step=0.016, global_step=2027.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  71%|███████▏  | 863/1208 [24:02<09:36,  1.67s/it, loss=0.181, v_num=0, train/loss_simple_step=0.511, train/loss_vlb_step=0.00438, train/loss_step=0.511, global_step=2027.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  72%|███████▏  | 864/1208 [24:05<09:35,  1.67s/it, loss=0.181, v_num=0, train/loss_simple_step=0.511, train/loss_vlb_step=0.00438, train/loss_step=0.511, global_step=2027.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  72%|███████▏  | 864/1208 [24:05<09:35,  1.67s/it, loss=0.169, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000433, train/loss_step=0.132, global_step=2027.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  72%|███████▏  | 865/1208 [24:06<09:33,  1.67s/it, loss=0.169, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000433, train/loss_step=0.132, global_step=2027.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  72%|███████▏  | 865/1208 [24:06<09:33,  1.67s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000117, train/loss_step=0.0329, global_step=2028.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  72%|███████▏  | 866/1208 [24:07<09:31,  1.67s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000117, train/loss_step=0.0329, global_step=2028.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  72%|███████▏  | 866/1208 [24:07<09:31,  1.67s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=2.38e-5, train/loss_step=0.00421, global_step=2028.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  72%|███████▏  | 867/1208 [24:08<09:29,  1.67s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=2.38e-5, train/loss_step=0.00421, global_step=2028.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  72%|███████▏  | 867/1208 [24:08<09:29,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.54e-5, train/loss_step=0.00267, global_step=2028.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  72%|███████▏  | 868/1208 [24:12<09:28,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.54e-5, train/loss_step=0.00267, global_step=2028.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  72%|███████▏  | 868/1208 [24:12<09:28,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00205, train/loss_step=0.324, global_step=2028.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  72%|███████▏  | 869/1208 [24:13<09:26,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00205, train/loss_step=0.324, global_step=2028.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  72%|███████▏  | 869/1208 [24:13<09:26,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00115, train/loss_step=0.278, global_step=2029.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  72%|███████▏  | 870/1208 [24:14<09:24,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00115, train/loss_step=0.278, global_step=2029.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  72%|███████▏  | 870/1208 [24:14<09:24,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.86e-5, train/loss_step=0.0153, global_step=2029.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  72%|███████▏  | 871/1208 [24:15<09:23,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.86e-5, train/loss_step=0.0153, global_step=2029.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  72%|███████▏  | 871/1208 [24:15<09:23,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00884, train/loss_vlb_step=4.25e-5, train/loss_step=0.00884, global_step=2029.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  72%|███████▏  | 872/1208 [24:18<09:21,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00884, train/loss_vlb_step=4.25e-5, train/loss_step=0.00884, global_step=2029.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  72%|███████▏  | 872/1208 [24:18<09:21,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.16e-5, train/loss_step=0.0167, global_step=2029.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  72%|███████▏  | 873/1208 [24:19<09:20,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.16e-5, train/loss_step=0.0167, global_step=2029.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  72%|███████▏  | 873/1208 [24:19<09:20,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.00041, train/loss_step=0.124, global_step=2030.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  72%|███████▏  | 874/1208 [24:20<09:18,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.00041, train/loss_step=0.124, global_step=2030.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  72%|███████▏  | 874/1208 [24:20<09:18,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000799, train/loss_step=0.204, global_step=2030.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  72%|███████▏  | 875/1208 [24:21<09:16,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000799, train/loss_step=0.204, global_step=2030.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  72%|███████▏  | 875/1208 [24:21<09:16,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.000235, train/loss_step=0.0702, global_step=2030.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  73%|███████▎  | 876/1208 [24:24<09:15,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.000235, train/loss_step=0.0702, global_step=2030.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  73%|███████▎  | 876/1208 [24:24<09:15,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.77e-5, train/loss_step=0.0122, global_step=2030.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  73%|███████▎  | 877/1208 [24:25<09:13,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.77e-5, train/loss_step=0.0122, global_step=2030.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  73%|███████▎  | 877/1208 [24:25<09:13,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.769, train/loss_vlb_step=0.194, train/loss_step=0.769, global_step=2031.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  73%|███████▎  | 878/1208 [24:27<09:11,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.769, train/loss_vlb_step=0.194, train/loss_step=0.769, global_step=2031.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  73%|███████▎  | 878/1208 [24:27<09:11,  1.67s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00661, train/loss_vlb_step=3.41e-5, train/loss_step=0.00661, global_step=2031.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  73%|███████▎  | 879/1208 [24:28<09:09,  1.67s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00661, train/loss_vlb_step=3.41e-5, train/loss_step=0.00661, global_step=2031.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  73%|███████▎  | 879/1208 [24:28<09:09,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000462, train/loss_step=0.140, global_step=2031.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  73%|███████▎  | 880/1208 [24:31<09:08,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000462, train/loss_step=0.140, global_step=2031.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  73%|███████▎  | 880/1208 [24:31<09:08,  1.67s/it, loss=0.177, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00187, train/loss_step=0.314, global_step=2031.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  73%|███████▎  | 881/1208 [24:32<09:06,  1.67s/it, loss=0.177, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00187, train/loss_step=0.314, global_step=2031.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  73%|███████▎  | 881/1208 [24:32<09:06,  1.67s/it, loss=0.193, v_num=0, train/loss_simple_step=0.888, train/loss_vlb_step=0.447, train/loss_step=0.888, global_step=2032.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  73%|███████▎  | 882/1208 [24:33<09:04,  1.67s/it, loss=0.193, v_num=0, train/loss_simple_step=0.888, train/loss_vlb_step=0.447, train/loss_step=0.888, global_step=2032.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  73%|███████▎  | 882/1208 [24:33<09:04,  1.67s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.36e-5, train/loss_step=0.0196, global_step=2032.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  73%|███████▎  | 883/1208 [24:34<09:02,  1.67s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.36e-5, train/loss_step=0.0196, global_step=2032.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  73%|███████▎  | 883/1208 [24:34<09:02,  1.67s/it, loss=0.179, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000878, train/loss_step=0.224, global_step=2032.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  73%|███████▎  | 884/1208 [24:37<09:01,  1.67s/it, loss=0.179, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000878, train/loss_step=0.224, global_step=2032.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  73%|███████▎  | 884/1208 [24:37<09:01,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000148, train/loss_step=0.0402, global_step=2032.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  73%|███████▎  | 885/1208 [24:38<08:59,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000148, train/loss_step=0.0402, global_step=2032.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  73%|███████▎  | 885/1208 [24:38<08:59,  1.67s/it, loss=0.208, v_num=0, train/loss_simple_step=0.688, train/loss_vlb_step=0.0504, train/loss_step=0.688, global_step=2033.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  73%|███████▎  | 886/1208 [24:39<08:57,  1.67s/it, loss=0.208, v_num=0, train/loss_simple_step=0.688, train/loss_vlb_step=0.0504, train/loss_step=0.688, global_step=2033.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  73%|███████▎  | 886/1208 [24:39<08:57,  1.67s/it, loss=0.218, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000767, train/loss_step=0.211, global_step=2033.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  73%|███████▎  | 887/1208 [24:40<08:55,  1.67s/it, loss=0.218, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000767, train/loss_step=0.211, global_step=2033.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  73%|███████▎  | 887/1208 [24:40<08:55,  1.67s/it, loss=0.239, v_num=0, train/loss_simple_step=0.431, train/loss_vlb_step=0.0056, train/loss_step=0.431, global_step=2033.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  74%|███████▎  | 888/1208 [24:44<08:54,  1.67s/it, loss=0.239, v_num=0, train/loss_simple_step=0.431, train/loss_vlb_step=0.0056, train/loss_step=0.431, global_step=2033.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  74%|███████▎  | 888/1208 [24:44<08:54,  1.67s/it, loss=0.223, v_num=0, train/loss_simple_step=0.00568, train/loss_vlb_step=2.98e-5, train/loss_step=0.00568, global_step=2033.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  74%|███████▎  | 889/1208 [24:45<08:52,  1.67s/it, loss=0.223, v_num=0, train/loss_simple_step=0.00568, train/loss_vlb_step=2.98e-5, train/loss_step=0.00568, global_step=2033.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  74%|███████▎  | 889/1208 [24:45<08:52,  1.67s/it, loss=0.21, v_num=0, train/loss_simple_step=0.00844, train/loss_vlb_step=4.18e-5, train/loss_step=0.00844, global_step=2034.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  74%|███████▎  | 890/1208 [24:46<08:51,  1.67s/it, loss=0.21, v_num=0, train/loss_simple_step=0.00844, train/loss_vlb_step=4.18e-5, train/loss_step=0.00844, global_step=2034.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  74%|███████▎  | 890/1208 [24:46<08:51,  1.67s/it, loss=0.224, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00156, train/loss_step=0.296, global_step=2034.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  74%|███████▍  | 891/1208 [24:47<08:49,  1.67s/it, loss=0.224, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00156, train/loss_step=0.296, global_step=2034.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  74%|███████▍  | 891/1208 [24:47<08:49,  1.67s/it, loss=0.225, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=9.2e-5, train/loss_step=0.0215, global_step=2034.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  74%|███████▍  | 892/1208 [24:50<08:48,  1.67s/it, loss=0.225, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=9.2e-5, train/loss_step=0.0215, global_step=2034.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  74%|███████▍  | 892/1208 [24:50<08:48,  1.67s/it, loss=0.231, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000462, train/loss_step=0.140, global_step=2034.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  74%|███████▍  | 893/1208 [24:51<08:46,  1.67s/it, loss=0.231, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000462, train/loss_step=0.140, global_step=2034.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  74%|███████▍  | 893/1208 [24:51<08:46,  1.67s/it, loss=0.225, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=3.23e-5, train/loss_step=0.00619, global_step=2035.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  74%|███████▍  | 894/1208 [24:52<08:44,  1.67s/it, loss=0.225, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=3.23e-5, train/loss_step=0.00619, global_step=2035.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  74%|███████▍  | 894/1208 [24:52<08:44,  1.67s/it, loss=0.227, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000974, train/loss_step=0.245, global_step=2035.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  74%|███████▍  | 895/1208 [24:53<08:42,  1.67s/it, loss=0.227, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000974, train/loss_step=0.245, global_step=2035.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  74%|███████▍  | 895/1208 [24:53<08:42,  1.67s/it, loss=0.23, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000434, train/loss_step=0.131, global_step=2035.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  74%|███████▍  | 896/1208 [24:56<08:41,  1.67s/it, loss=0.23, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000434, train/loss_step=0.131, global_step=2035.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  74%|███████▍  | 896/1208 [24:56<08:41,  1.67s/it, loss=0.251, v_num=0, train/loss_simple_step=0.426, train/loss_vlb_step=0.00311, train/loss_step=0.426, global_step=2035.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  74%|███████▍  | 897/1208 [24:57<08:39,  1.67s/it, loss=0.251, v_num=0, train/loss_simple_step=0.426, train/loss_vlb_step=0.00311, train/loss_step=0.426, global_step=2035.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  74%|███████▍  | 897/1208 [24:57<08:39,  1.67s/it, loss=0.212, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=3.39e-5, train/loss_step=0.00677, global_step=2036.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  74%|███████▍  | 898/1208 [24:59<08:37,  1.67s/it, loss=0.212, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=3.39e-5, train/loss_step=0.00677, global_step=2036.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  74%|███████▍  | 898/1208 [24:59<08:37,  1.67s/it, loss=0.219, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000464, train/loss_step=0.139, global_step=2036.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  74%|███████▍  | 899/1208 [25:00<08:35,  1.67s/it, loss=0.219, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000464, train/loss_step=0.139, global_step=2036.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  74%|███████▍  | 899/1208 [25:00<08:35,  1.67s/it, loss=0.223, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.00078, train/loss_step=0.208, global_step=2036.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  75%|███████▍  | 900/1208 [25:03<08:34,  1.67s/it, loss=0.223, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.00078, train/loss_step=0.208, global_step=2036.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  75%|███████▍  | 900/1208 [25:03<08:34,  1.67s/it, loss=0.207, v_num=0, train/loss_simple_step=0.00701, train/loss_vlb_step=3.56e-5, train/loss_step=0.00701, global_step=2036.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.76it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.77it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.76it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.76it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.76it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.82it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.76it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.78it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.78it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 6:  75%|███████▍  | 901/1208 [25:33<08:42,  1.70s/it, loss=0.207, v_num=0, train/loss_simple_step=0.00701, train/loss_vlb_step=3.56e-5, train/loss_step=0.00701, global_step=2036.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  75%|███████▍  | 901/1208 [25:33<08:42,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=9.98e-5, train/loss_step=0.0275, global_step=2037.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  75%|███████▍  | 902/1208 [25:34<08:40,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=9.98e-5, train/loss_step=0.0275, global_step=2037.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  75%|███████▍  | 902/1208 [25:34<08:40,  1.70s/it, loss=0.198, v_num=0, train/loss_simple_step=0.688, train/loss_vlb_step=0.0276, train/loss_step=0.688, global_step=2037.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  75%|███████▍  | 903/1208 [25:35<08:38,  1.70s/it, loss=0.198, v_num=0, train/loss_simple_step=0.688, train/loss_vlb_step=0.0276, train/loss_step=0.688, global_step=2037.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  75%|███████▍  | 903/1208 [25:35<08:38,  1.70s/it, loss=0.201, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00151, train/loss_step=0.299, global_step=2037.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  75%|███████▍  | 904/1208 [25:39<08:37,  1.70s/it, loss=0.201, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00151, train/loss_step=0.299, global_step=2037.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  75%|███████▍  | 904/1208 [25:39<08:37,  1.70s/it, loss=0.21, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000754, train/loss_step=0.214, global_step=2037.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  75%|███████▍  | 905/1208 [25:40<08:35,  1.70s/it, loss=0.21, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000754, train/loss_step=0.214, global_step=2037.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  75%|███████▍  | 905/1208 [25:40<08:35,  1.70s/it, loss=0.182, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00042, train/loss_step=0.128, global_step=2038.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  75%|███████▌  | 906/1208 [25:41<08:33,  1.70s/it, loss=0.182, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00042, train/loss_step=0.128, global_step=2038.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  75%|███████▌  | 906/1208 [25:41<08:33,  1.70s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.18e-5, train/loss_step=0.0138, global_step=2038.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  75%|███████▌  | 907/1208 [25:42<08:31,  1.70s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.18e-5, train/loss_step=0.0138, global_step=2038.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  75%|███████▌  | 907/1208 [25:42<08:31,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0503, train/loss_vlb_step=0.000175, train/loss_step=0.0503, global_step=2038.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  75%|███████▌  | 908/1208 [25:45<08:30,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0503, train/loss_vlb_step=0.000175, train/loss_step=0.0503, global_step=2038.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  75%|███████▌  | 908/1208 [25:45<08:30,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.33e-5, train/loss_step=0.0145, global_step=2038.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  75%|███████▌  | 909/1208 [25:46<08:28,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.33e-5, train/loss_step=0.0145, global_step=2038.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  75%|███████▌  | 909/1208 [25:46<08:28,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0795, train/loss_vlb_step=0.000266, train/loss_step=0.0795, global_step=2039.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  75%|███████▌  | 910/1208 [25:47<08:26,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0795, train/loss_vlb_step=0.000266, train/loss_step=0.0795, global_step=2039.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  75%|███████▌  | 910/1208 [25:47<08:26,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00256, train/loss_step=0.380, global_step=2039.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  75%|███████▌  | 911/1208 [25:48<08:24,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00256, train/loss_step=0.380, global_step=2039.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  75%|███████▌  | 911/1208 [25:48<08:24,  1.70s/it, loss=0.179, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00176, train/loss_step=0.367, global_step=2039.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  75%|███████▌  | 912/1208 [25:51<08:23,  1.70s/it, loss=0.179, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00176, train/loss_step=0.367, global_step=2039.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  75%|███████▌  | 912/1208 [25:51<08:23,  1.70s/it, loss=0.204, v_num=0, train/loss_simple_step=0.654, train/loss_vlb_step=0.0229, train/loss_step=0.654, global_step=2039.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  76%|███████▌  | 913/1208 [25:52<08:21,  1.70s/it, loss=0.204, v_num=0, train/loss_simple_step=0.654, train/loss_vlb_step=0.0229, train/loss_step=0.654, global_step=2039.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  76%|███████▌  | 913/1208 [25:52<08:21,  1.70s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=9.03e-5, train/loss_step=0.0208, global_step=2040.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  76%|███████▌  | 914/1208 [25:54<08:19,  1.70s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=9.03e-5, train/loss_step=0.0208, global_step=2040.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  76%|███████▌  | 914/1208 [25:54<08:19,  1.70s/it, loss=0.199, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=2040.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  76%|███████▌  | 915/1208 [25:55<08:17,  1.70s/it, loss=0.199, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=2040.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  76%|███████▌  | 915/1208 [25:55<08:17,  1.70s/it, loss=0.212, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.003, train/loss_step=0.399, global_step=2040.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  76%|███████▌  | 916/1208 [25:58<08:16,  1.70s/it, loss=0.212, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.003, train/loss_step=0.399, global_step=2040.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  76%|███████▌  | 916/1208 [25:58<08:16,  1.70s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000109, train/loss_step=0.0273, global_step=2040.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  76%|███████▌  | 917/1208 [25:59<08:14,  1.70s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000109, train/loss_step=0.0273, global_step=2040.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  76%|███████▌  | 917/1208 [25:59<08:14,  1.70s/it, loss=0.208, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00178, train/loss_step=0.335, global_step=2041.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  76%|███████▌  | 918/1208 [26:00<08:12,  1.70s/it, loss=0.208, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00178, train/loss_step=0.335, global_step=2041.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  76%|███████▌  | 918/1208 [26:00<08:12,  1.70s/it, loss=0.202, v_num=0, train/loss_simple_step=0.00293, train/loss_vlb_step=1.71e-5, train/loss_step=0.00293, global_step=2041.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  76%|███████▌  | 919/1208 [26:01<08:11,  1.70s/it, loss=0.202, v_num=0, train/loss_simple_step=0.00293, train/loss_vlb_step=1.71e-5, train/loss_step=0.00293, global_step=2041.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  76%|███████▌  | 919/1208 [26:01<08:11,  1.70s/it, loss=0.196, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000331, train/loss_step=0.100, global_step=2041.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  76%|███████▌  | 920/1208 [26:04<08:09,  1.70s/it, loss=0.196, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000331, train/loss_step=0.100, global_step=2041.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  76%|███████▌  | 920/1208 [26:04<08:09,  1.70s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0428, train/loss_vlb_step=0.000163, train/loss_step=0.0428, global_step=2041.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  76%|███████▌  | 921/1208 [26:05<08:07,  1.70s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0428, train/loss_vlb_step=0.000163, train/loss_step=0.0428, global_step=2041.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  76%|███████▌  | 921/1208 [26:05<08:07,  1.70s/it, loss=0.218, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00358, train/loss_step=0.418, global_step=2042.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  76%|███████▋  | 922/1208 [26:06<08:06,  1.70s/it, loss=0.218, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00358, train/loss_step=0.418, global_step=2042.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  76%|███████▋  | 922/1208 [26:06<08:06,  1.70s/it, loss=0.198, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00112, train/loss_step=0.301, global_step=2042.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  76%|███████▋  | 923/1208 [26:07<08:04,  1.70s/it, loss=0.198, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00112, train/loss_step=0.301, global_step=2042.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  76%|███████▋  | 923/1208 [26:07<08:04,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000104, train/loss_step=0.0264, global_step=2042.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  76%|███████▋  | 924/1208 [26:11<08:02,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000104, train/loss_step=0.0264, global_step=2042.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  76%|███████▋  | 924/1208 [26:11<08:02,  1.70s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00832, train/loss_vlb_step=3.88e-5, train/loss_step=0.00832, global_step=2042.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  77%|███████▋  | 925/1208 [26:12<08:01,  1.70s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00832, train/loss_vlb_step=3.88e-5, train/loss_step=0.00832, global_step=2042.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  77%|███████▋  | 925/1208 [26:12<08:01,  1.70s/it, loss=0.197, v_num=0, train/loss_simple_step=0.591, train/loss_vlb_step=0.00835, train/loss_step=0.591, global_step=2043.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  77%|███████▋  | 926/1208 [26:13<07:59,  1.70s/it, loss=0.197, v_num=0, train/loss_simple_step=0.591, train/loss_vlb_step=0.00835, train/loss_step=0.591, global_step=2043.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  77%|███████▋  | 926/1208 [26:13<07:59,  1.70s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.29e-5, train/loss_step=0.00218, global_step=2043.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  77%|███████▋  | 927/1208 [26:14<07:57,  1.70s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.29e-5, train/loss_step=0.00218, global_step=2043.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  77%|███████▋  | 927/1208 [26:14<07:57,  1.70s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.76e-5, train/loss_step=0.0205, global_step=2043.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  77%|███████▋  | 928/1208 [26:17<07:56,  1.70s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.76e-5, train/loss_step=0.0205, global_step=2043.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  77%|███████▋  | 928/1208 [26:17<07:56,  1.70s/it, loss=0.202, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000464, train/loss_step=0.140, global_step=2043.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  77%|███████▋  | 929/1208 [26:18<07:54,  1.70s/it, loss=0.202, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000464, train/loss_step=0.140, global_step=2043.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  77%|███████▋  | 929/1208 [26:18<07:54,  1.70s/it, loss=0.229, v_num=0, train/loss_simple_step=0.632, train/loss_vlb_step=0.0254, train/loss_step=0.632, global_step=2044.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  77%|███████▋  | 930/1208 [26:19<07:52,  1.70s/it, loss=0.229, v_num=0, train/loss_simple_step=0.632, train/loss_vlb_step=0.0254, train/loss_step=0.632, global_step=2044.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  77%|███████▋  | 930/1208 [26:19<07:52,  1.70s/it, loss=0.217, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000442, train/loss_step=0.134, global_step=2044.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  77%|███████▋  | 931/1208 [26:20<07:50,  1.70s/it, loss=0.217, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000442, train/loss_step=0.134, global_step=2044.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  77%|███████▋  | 931/1208 [26:20<07:50,  1.70s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0962, train/loss_vlb_step=0.000316, train/loss_step=0.0962, global_step=2044.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  77%|███████▋  | 932/1208 [26:24<07:49,  1.70s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0962, train/loss_vlb_step=0.000316, train/loss_step=0.0962, global_step=2044.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  77%|███████▋  | 932/1208 [26:24<07:49,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0497, train/loss_vlb_step=0.000177, train/loss_step=0.0497, global_step=2044.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  77%|███████▋  | 933/1208 [26:25<07:47,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0497, train/loss_vlb_step=0.000177, train/loss_step=0.0497, global_step=2044.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  77%|███████▋  | 933/1208 [26:25<07:47,  1.70s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00653, train/loss_vlb_step=3.4e-5, train/loss_step=0.00653, global_step=2045.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  77%|███████▋  | 934/1208 [26:26<07:45,  1.70s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00653, train/loss_vlb_step=3.4e-5, train/loss_step=0.00653, global_step=2045.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  77%|███████▋  | 934/1208 [26:26<07:45,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000118, train/loss_step=0.0325, global_step=2045.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  77%|███████▋  | 935/1208 [26:27<07:43,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000118, train/loss_step=0.0325, global_step=2045.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  77%|███████▋  | 935/1208 [26:27<07:43,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0866, train/loss_vlb_step=0.000284, train/loss_step=0.0866, global_step=2045.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  77%|███████▋  | 936/1208 [26:30<07:42,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0866, train/loss_vlb_step=0.000284, train/loss_step=0.0866, global_step=2045.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  77%|███████▋  | 936/1208 [26:30<07:42,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00331, train/loss_step=0.433, global_step=2045.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  78%|███████▊  | 937/1208 [26:31<07:40,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00331, train/loss_step=0.433, global_step=2045.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  78%|███████▊  | 937/1208 [26:31<07:40,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00484, train/loss_vlb_step=2.58e-5, train/loss_step=0.00484, global_step=2046.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  78%|███████▊  | 938/1208 [26:32<07:38,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00484, train/loss_vlb_step=2.58e-5, train/loss_step=0.00484, global_step=2046.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  78%|███████▊  | 938/1208 [26:32<07:38,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.24e-5, train/loss_step=0.0228, global_step=2046.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  78%|███████▊  | 939/1208 [26:33<07:36,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.24e-5, train/loss_step=0.0228, global_step=2046.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  78%|███████▊  | 939/1208 [26:33<07:36,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000134, train/loss_step=0.0346, global_step=2046.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  78%|███████▊  | 940/1208 [26:36<07:35,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000134, train/loss_step=0.0346, global_step=2046.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  78%|███████▊  | 940/1208 [26:36<07:35,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.688, train/loss_vlb_step=0.0102, train/loss_step=0.688, global_step=2046.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  78%|███████▊  | 941/1208 [26:37<07:33,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.688, train/loss_vlb_step=0.0102, train/loss_step=0.688, global_step=2046.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  78%|███████▊  | 941/1208 [26:37<07:33,  1.70s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0619, train/loss_vlb_step=0.000212, train/loss_step=0.0619, global_step=2047.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  78%|███████▊  | 942/1208 [26:39<07:31,  1.70s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0619, train/loss_vlb_step=0.000212, train/loss_step=0.0619, global_step=2047.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  78%|███████▊  | 942/1208 [26:39<07:31,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=4.93e-5, train/loss_step=0.0114, global_step=2047.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  78%|███████▊  | 943/1208 [26:40<07:29,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=4.93e-5, train/loss_step=0.0114, global_step=2047.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  78%|███████▊  | 943/1208 [26:40<07:29,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00412, train/loss_vlb_step=2.22e-5, train/loss_step=0.00412, global_step=2047.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  78%|███████▊  | 944/1208 [26:43<07:28,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00412, train/loss_vlb_step=2.22e-5, train/loss_step=0.00412, global_step=2047.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  78%|███████▊  | 944/1208 [26:43<07:28,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000338, train/loss_step=0.103, global_step=2047.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  78%|███████▊  | 945/1208 [26:44<07:26,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000338, train/loss_step=0.103, global_step=2047.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  78%|███████▊  | 945/1208 [26:44<07:26,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=2048.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  78%|███████▊  | 946/1208 [26:45<07:24,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=2048.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  78%|███████▊  | 946/1208 [26:45<07:24,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.26e-5, train/loss_step=0.0115, global_step=2048.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  78%|███████▊  | 947/1208 [26:46<07:22,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.26e-5, train/loss_step=0.0115, global_step=2048.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  78%|███████▊  | 947/1208 [26:46<07:22,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.584, train/loss_vlb_step=0.0122, train/loss_step=0.584, global_step=2048.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  78%|███████▊  | 948/1208 [26:49<07:21,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.584, train/loss_vlb_step=0.0122, train/loss_step=0.584, global_step=2048.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  78%|███████▊  | 948/1208 [26:49<07:21,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000764, train/loss_step=0.222, global_step=2048.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  79%|███████▊  | 949/1208 [26:50<07:19,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000764, train/loss_step=0.222, global_step=2048.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  79%|███████▊  | 949/1208 [26:50<07:19,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000587, train/loss_step=0.169, global_step=2049.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  79%|███████▊  | 950/1208 [26:51<07:17,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000587, train/loss_step=0.169, global_step=2049.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  79%|███████▊  | 950/1208 [26:51<07:17,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.84e-5, train/loss_step=0.0103, global_step=2049.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  79%|███████▊  | 951/1208 [26:52<07:15,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.84e-5, train/loss_step=0.0103, global_step=2049.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  79%|███████▊  | 951/1208 [26:52<07:15,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00996, train/loss_vlb_step=4.63e-5, train/loss_step=0.00996, global_step=2049.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  79%|███████▉  | 952/1208 [26:56<07:14,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00996, train/loss_vlb_step=4.63e-5, train/loss_step=0.00996, global_step=2049.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  79%|███████▉  | 952/1208 [26:56<07:14,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.611, train/loss_vlb_step=0.0163, train/loss_step=0.611, global_step=2049.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]      Epoch 6:  79%|███████▉  | 953/1208 [26:57<07:12,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.611, train/loss_vlb_step=0.0163, train/loss_step=0.611, global_step=2049.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  79%|███████▉  | 953/1208 [26:57<07:12,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000129, train/loss_step=0.0335, global_step=2050.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  79%|███████▉  | 954/1208 [26:58<07:10,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000129, train/loss_step=0.0335, global_step=2050.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  79%|███████▉  | 954/1208 [26:58<07:10,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0647, train/loss_vlb_step=0.00022, train/loss_step=0.0647, global_step=2050.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  79%|███████▉  | 955/1208 [26:59<07:08,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0647, train/loss_vlb_step=0.00022, train/loss_step=0.0647, global_step=2050.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  79%|███████▉  | 955/1208 [26:59<07:08,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0501, train/loss_vlb_step=0.000169, train/loss_step=0.0501, global_step=2050.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  79%|███████▉  | 956/1208 [27:02<07:07,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0501, train/loss_vlb_step=0.000169, train/loss_step=0.0501, global_step=2050.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  79%|███████▉  | 956/1208 [27:02<07:07,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00544, train/loss_step=0.427, global_step=2050.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  79%|███████▉  | 957/1208 [27:03<07:05,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00544, train/loss_step=0.427, global_step=2050.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  79%|███████▉  | 957/1208 [27:03<07:05,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00632, train/loss_vlb_step=2.91e-5, train/loss_step=0.00632, global_step=2051.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  79%|███████▉  | 958/1208 [27:04<07:03,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00632, train/loss_vlb_step=2.91e-5, train/loss_step=0.00632, global_step=2051.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  79%|███████▉  | 958/1208 [27:04<07:03,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=2051.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  79%|███████▉  | 959/1208 [27:05<07:02,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=2051.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  79%|███████▉  | 959/1208 [27:05<07:02,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0582, train/loss_vlb_step=0.000194, train/loss_step=0.0582, global_step=2051.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  79%|███████▉  | 960/1208 [27:09<07:00,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0582, train/loss_vlb_step=0.000194, train/loss_step=0.0582, global_step=2051.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  79%|███████▉  | 960/1208 [27:09<07:00,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.000124, train/loss_step=0.0322, global_step=2051.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  80%|███████▉  | 961/1208 [27:10<06:58,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.000124, train/loss_step=0.0322, global_step=2051.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  80%|███████▉  | 961/1208 [27:10<06:58,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000151, train/loss_step=0.0438, global_step=2052.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  80%|███████▉  | 962/1208 [27:11<06:57,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000151, train/loss_step=0.0438, global_step=2052.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  80%|███████▉  | 962/1208 [27:11<06:57,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.00043, train/loss_step=0.130, global_step=2052.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  80%|███████▉  | 963/1208 [27:12<06:55,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.00043, train/loss_step=0.130, global_step=2052.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  80%|███████▉  | 963/1208 [27:12<06:55,  1.69s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.38e-5, train/loss_step=0.0229, global_step=2052.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  80%|███████▉  | 964/1208 [27:15<06:53,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.38e-5, train/loss_step=0.0229, global_step=2052.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  80%|███████▉  | 964/1208 [27:15<06:53,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000461, train/loss_step=0.139, global_step=2052.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  80%|███████▉  | 965/1208 [27:16<06:52,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000461, train/loss_step=0.139, global_step=2052.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  80%|███████▉  | 965/1208 [27:16<06:52,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00151, train/loss_step=0.311, global_step=2053.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  80%|███████▉  | 966/1208 [27:17<06:50,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00151, train/loss_step=0.311, global_step=2053.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  80%|███████▉  | 966/1208 [27:17<06:50,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0059, train/loss_vlb_step=3.08e-5, train/loss_step=0.0059, global_step=2053.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  80%|████████  | 967/1208 [27:18<06:48,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0059, train/loss_vlb_step=3.08e-5, train/loss_step=0.0059, global_step=2053.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  80%|████████  | 967/1208 [27:18<06:48,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=2.06e-5, train/loss_step=0.00368, global_step=2053.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  80%|████████  | 968/1208 [27:21<06:47,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=2.06e-5, train/loss_step=0.00368, global_step=2053.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  80%|████████  | 968/1208 [27:21<06:47,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.17e-5, train/loss_step=0.00198, global_step=2053.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  80%|████████  | 969/1208 [27:22<06:45,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.17e-5, train/loss_step=0.00198, global_step=2053.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  80%|████████  | 969/1208 [27:22<06:45,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.492, train/loss_vlb_step=0.00615, train/loss_step=0.492, global_step=2054.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  80%|████████  | 970/1208 [27:23<06:43,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.492, train/loss_vlb_step=0.00615, train/loss_step=0.492, global_step=2054.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  80%|████████  | 970/1208 [27:23<06:43,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000599, train/loss_step=0.167, global_step=2054.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  80%|████████  | 971/1208 [27:24<06:41,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000599, train/loss_step=0.167, global_step=2054.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  80%|████████  | 971/1208 [27:24<06:41,  1.69s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0902, train/loss_vlb_step=0.000297, train/loss_step=0.0902, global_step=2054.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  80%|████████  | 972/1208 [27:28<06:40,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0902, train/loss_vlb_step=0.000297, train/loss_step=0.0902, global_step=2054.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  80%|████████  | 972/1208 [27:28<06:40,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000995, train/loss_step=0.248, global_step=2054.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  81%|████████  | 973/1208 [27:29<06:38,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000995, train/loss_step=0.248, global_step=2054.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  81%|████████  | 973/1208 [27:29<06:38,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0531, train/loss_vlb_step=0.000183, train/loss_step=0.0531, global_step=2055.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  81%|████████  | 974/1208 [27:30<06:36,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0531, train/loss_vlb_step=0.000183, train/loss_step=0.0531, global_step=2055.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  81%|████████  | 974/1208 [27:30<06:36,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.000275, train/loss_step=0.0817, global_step=2055.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  81%|████████  | 975/1208 [27:31<06:34,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.000275, train/loss_step=0.0817, global_step=2055.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  81%|████████  | 975/1208 [27:31<06:34,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.000113, train/loss_step=0.0275, global_step=2055.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  81%|████████  | 976/1208 [27:34<06:33,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.000113, train/loss_step=0.0275, global_step=2055.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  81%|████████  | 976/1208 [27:34<06:33,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000603, train/loss_step=0.177, global_step=2055.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  81%|████████  | 977/1208 [27:35<06:31,  1.69s/it, loss=0.111, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000603, train/loss_step=0.177, global_step=2055.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  81%|████████  | 977/1208 [27:35<06:31,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.505, train/loss_vlb_step=0.00747, train/loss_step=0.505, global_step=2056.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  81%|████████  | 978/1208 [27:36<06:29,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.505, train/loss_vlb_step=0.00747, train/loss_step=0.505, global_step=2056.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  81%|████████  | 978/1208 [27:36<06:29,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000724, train/loss_step=0.199, global_step=2056.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  81%|████████  | 979/1208 [27:37<06:27,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000724, train/loss_step=0.199, global_step=2056.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  81%|████████  | 979/1208 [27:37<06:27,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.478, train/loss_vlb_step=0.00504, train/loss_step=0.478, global_step=2056.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  81%|████████  | 980/1208 [27:41<06:26,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.478, train/loss_vlb_step=0.00504, train/loss_step=0.478, global_step=2056.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  81%|████████  | 980/1208 [27:41<06:26,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000528, train/loss_step=0.160, global_step=2056.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  81%|████████  | 981/1208 [27:42<06:24,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000528, train/loss_step=0.160, global_step=2056.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  81%|████████  | 981/1208 [27:42<06:24,  1.69s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.26e-5, train/loss_step=0.0171, global_step=2057.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  81%|████████▏ | 982/1208 [27:43<06:22,  1.69s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.26e-5, train/loss_step=0.0171, global_step=2057.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  81%|████████▏ | 982/1208 [27:43<06:22,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=7.9e-5, train/loss_step=0.0195, global_step=2057.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  81%|████████▏ | 983/1208 [27:44<06:20,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=7.9e-5, train/loss_step=0.0195, global_step=2057.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  81%|████████▏ | 983/1208 [27:44<06:20,  1.69s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0791, train/loss_vlb_step=0.000262, train/loss_step=0.0791, global_step=2057.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  81%|████████▏ | 984/1208 [27:47<06:19,  1.69s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0791, train/loss_vlb_step=0.000262, train/loss_step=0.0791, global_step=2057.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  81%|████████▏ | 984/1208 [27:47<06:19,  1.69s/it, loss=0.175, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00287, train/loss_step=0.379, global_step=2057.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  82%|████████▏ | 985/1208 [27:48<06:17,  1.69s/it, loss=0.175, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00287, train/loss_step=0.379, global_step=2057.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  82%|████████▏ | 985/1208 [27:48<06:17,  1.69s/it, loss=0.171, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.000905, train/loss_step=0.243, global_step=2058.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  82%|████████▏ | 986/1208 [27:49<06:15,  1.69s/it, loss=0.171, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.000905, train/loss_step=0.243, global_step=2058.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  82%|████████▏ | 986/1208 [27:49<06:15,  1.69s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.83e-5, train/loss_step=0.0185, global_step=2058.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  82%|████████▏ | 987/1208 [27:50<06:14,  1.69s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.83e-5, train/loss_step=0.0185, global_step=2058.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  82%|████████▏ | 987/1208 [27:50<06:14,  1.69s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0458, train/loss_vlb_step=0.000157, train/loss_step=0.0458, global_step=2058.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  82%|████████▏ | 988/1208 [27:53<06:12,  1.69s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0458, train/loss_vlb_step=0.000157, train/loss_step=0.0458, global_step=2058.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  82%|████████▏ | 988/1208 [27:53<06:12,  1.69s/it, loss=0.197, v_num=0, train/loss_simple_step=0.466, train/loss_vlb_step=0.00291, train/loss_step=0.466, global_step=2058.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  82%|████████▏ | 989/1208 [27:54<06:10,  1.69s/it, loss=0.197, v_num=0, train/loss_simple_step=0.466, train/loss_vlb_step=0.00291, train/loss_step=0.466, global_step=2058.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  82%|████████▏ | 989/1208 [27:54<06:10,  1.69s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0549, train/loss_vlb_step=0.000192, train/loss_step=0.0549, global_step=2059.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  82%|████████▏ | 990/1208 [27:56<06:09,  1.69s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0549, train/loss_vlb_step=0.000192, train/loss_step=0.0549, global_step=2059.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  82%|████████▏ | 990/1208 [27:56<06:09,  1.69s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=8.39e-5, train/loss_step=0.0195, global_step=2059.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  82%|████████▏ | 991/1208 [27:57<06:07,  1.69s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=8.39e-5, train/loss_step=0.0195, global_step=2059.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  82%|████████▏ | 991/1208 [27:57<06:07,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0604, train/loss_vlb_step=0.000213, train/loss_step=0.0604, global_step=2059.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  82%|████████▏ | 992/1208 [28:00<06:05,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0604, train/loss_vlb_step=0.000213, train/loss_step=0.0604, global_step=2059.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  82%|████████▏ | 992/1208 [28:00<06:05,  1.69s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.92e-5, train/loss_step=0.0106, global_step=2059.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  82%|████████▏ | 993/1208 [28:01<06:04,  1.69s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.92e-5, train/loss_step=0.0106, global_step=2059.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  82%|████████▏ | 993/1208 [28:01<06:04,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0057, train/loss_vlb_step=2.8e-5, train/loss_step=0.0057, global_step=2060.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  82%|████████▏ | 994/1208 [28:02<06:02,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0057, train/loss_vlb_step=2.8e-5, train/loss_step=0.0057, global_step=2060.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  82%|████████▏ | 994/1208 [28:02<06:02,  1.69s/it, loss=0.149, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.84e-5, train/loss_step=0.015, global_step=2060.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  82%|████████▏ | 995/1208 [28:03<06:00,  1.69s/it, loss=0.149, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.84e-5, train/loss_step=0.015, global_step=2060.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  82%|████████▏ | 995/1208 [28:03<06:00,  1.69s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00705, train/loss_vlb_step=3.51e-5, train/loss_step=0.00705, global_step=2060.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  82%|████████▏ | 996/1208 [28:06<05:59,  1.69s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00705, train/loss_vlb_step=3.51e-5, train/loss_step=0.00705, global_step=2060.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  82%|████████▏ | 996/1208 [28:06<05:59,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.00011, train/loss_step=0.0279, global_step=2060.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  83%|████████▎ | 997/1208 [28:07<05:57,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.00011, train/loss_step=0.0279, global_step=2060.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  83%|████████▎ | 997/1208 [28:07<05:57,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.001, train/loss_step=0.236, global_step=2061.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  83%|████████▎ | 998/1208 [28:08<05:55,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.001, train/loss_step=0.236, global_step=2061.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  83%|████████▎ | 998/1208 [28:08<05:55,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000491, train/loss_step=0.148, global_step=2061.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  83%|████████▎ | 999/1208 [28:09<05:53,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000491, train/loss_step=0.148, global_step=2061.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  83%|████████▎ | 999/1208 [28:09<05:53,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0458, train/loss_vlb_step=0.000171, train/loss_step=0.0458, global_step=2061.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  83%|████████▎ | 1000/1208 [28:13<05:52,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0458, train/loss_vlb_step=0.000171, train/loss_step=0.0458, global_step=2061.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  83%|████████▎ | 1000/1208 [28:13<05:52,  1.69s/it, loss=0.104, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000669, train/loss_step=0.185, global_step=2061.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  83%|████████▎ | 1001/1208 [28:14<05:50,  1.69s/it, loss=0.104, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000669, train/loss_step=0.185, global_step=2061.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  83%|████████▎ | 1001/1208 [28:14<05:50,  1.69s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00944, train/loss_vlb_step=4.45e-5, train/loss_step=0.00944, global_step=2062.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  83%|████████▎ | 1002/1208 [28:15<05:48,  1.69s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00944, train/loss_vlb_step=4.45e-5, train/loss_step=0.00944, global_step=2062.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  83%|████████▎ | 1002/1208 [28:15<05:48,  1.69s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.41e-5, train/loss_step=0.0232, global_step=2062.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  83%|████████▎ | 1003/1208 [28:16<05:46,  1.69s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.41e-5, train/loss_step=0.0232, global_step=2062.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  83%|████████▎ | 1003/1208 [28:16<05:46,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0368, train/loss_vlb_step=0.000135, train/loss_step=0.0368, global_step=2062.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  83%|████████▎ | 1004/1208 [28:19<05:45,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0368, train/loss_vlb_step=0.000135, train/loss_step=0.0368, global_step=2062.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  83%|████████▎ | 1004/1208 [28:19<05:45,  1.69s/it, loss=0.086, v_num=0, train/loss_simple_step=0.0623, train/loss_vlb_step=0.000213, train/loss_step=0.0623, global_step=2062.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  83%|████████▎ | 1005/1208 [28:20<05:43,  1.69s/it, loss=0.086, v_num=0, train/loss_simple_step=0.0623, train/loss_vlb_step=0.000213, train/loss_step=0.0623, global_step=2062.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  83%|████████▎ | 1005/1208 [28:20<05:43,  1.69s/it, loss=0.074, v_num=0, train/loss_simple_step=0.00316, train/loss_vlb_step=1.73e-5, train/loss_step=0.00316, global_step=2063.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  83%|████████▎ | 1006/1208 [28:21<05:41,  1.69s/it, loss=0.074, v_num=0, train/loss_simple_step=0.00316, train/loss_vlb_step=1.73e-5, train/loss_step=0.00316, global_step=2063.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  83%|████████▎ | 1006/1208 [28:21<05:41,  1.69s/it, loss=0.0761, v_num=0, train/loss_simple_step=0.060, train/loss_vlb_step=0.000205, train/loss_step=0.060, global_step=2063.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  83%|████████▎ | 1007/1208 [28:22<05:39,  1.69s/it, loss=0.0761, v_num=0, train/loss_simple_step=0.060, train/loss_vlb_step=0.000205, train/loss_step=0.060, global_step=2063.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  83%|████████▎ | 1007/1208 [28:22<05:39,  1.69s/it, loss=0.0767, v_num=0, train/loss_simple_step=0.0577, train/loss_vlb_step=0.000201, train/loss_step=0.0577, global_step=2063.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  83%|████████▎ | 1008/1208 [28:25<05:38,  1.69s/it, loss=0.0767, v_num=0, train/loss_simple_step=0.0577, train/loss_vlb_step=0.000201, train/loss_step=0.0577, global_step=2063.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  83%|████████▎ | 1008/1208 [28:25<05:38,  1.69s/it, loss=0.0611, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000517, train/loss_step=0.153, global_step=2063.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  84%|████████▎ | 1009/1208 [28:26<05:36,  1.69s/it, loss=0.0611, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000517, train/loss_step=0.153, global_step=2063.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  84%|████████▎ | 1009/1208 [28:26<05:36,  1.69s/it, loss=0.0717, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00118, train/loss_step=0.267, global_step=2064.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  84%|████████▎ | 1010/1208 [28:27<05:34,  1.69s/it, loss=0.0717, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00118, train/loss_step=0.267, global_step=2064.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  84%|████████▎ | 1010/1208 [28:27<05:34,  1.69s/it, loss=0.0712, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.62e-5, train/loss_step=0.0101, global_step=2064.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  84%|████████▎ | 1011/1208 [28:28<05:33,  1.69s/it, loss=0.0712, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.62e-5, train/loss_step=0.0101, global_step=2064.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  84%|████████▎ | 1011/1208 [28:28<05:33,  1.69s/it, loss=0.0702, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.000146, train/loss_step=0.0395, global_step=2064.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  84%|████████▍ | 1012/1208 [28:32<05:31,  1.69s/it, loss=0.0702, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.000146, train/loss_step=0.0395, global_step=2064.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  84%|████████▍ | 1012/1208 [28:32<05:31,  1.69s/it, loss=0.0697, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.11e-5, train/loss_step=0.00188, global_step=2064.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  84%|████████▍ | 1013/1208 [28:33<05:29,  1.69s/it, loss=0.0697, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.11e-5, train/loss_step=0.00188, global_step=2064.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  84%|████████▍ | 1013/1208 [28:33<05:29,  1.69s/it, loss=0.0696, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.71e-5, train/loss_step=0.00285, global_step=2065.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  84%|████████▍ | 1014/1208 [28:34<05:27,  1.69s/it, loss=0.0696, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.71e-5, train/loss_step=0.00285, global_step=2065.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  84%|████████▍ | 1014/1208 [28:34<05:27,  1.69s/it, loss=0.0708, v_num=0, train/loss_simple_step=0.0397, train/loss_vlb_step=0.000146, train/loss_step=0.0397, global_step=2065.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  84%|████████▍ | 1015/1208 [28:35<05:26,  1.69s/it, loss=0.0708, v_num=0, train/loss_simple_step=0.0397, train/loss_vlb_step=0.000146, train/loss_step=0.0397, global_step=2065.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  84%|████████▍ | 1015/1208 [28:35<05:26,  1.69s/it, loss=0.0772, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000451, train/loss_step=0.135, global_step=2065.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  84%|████████▍ | 1016/1208 [28:38<05:24,  1.69s/it, loss=0.0772, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000451, train/loss_step=0.135, global_step=2065.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  84%|████████▍ | 1016/1208 [28:38<05:24,  1.69s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000599, train/loss_step=0.169, global_step=2065.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  84%|████████▍ | 1017/1208 [28:39<05:22,  1.69s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000599, train/loss_step=0.169, global_step=2065.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  84%|████████▍ | 1017/1208 [28:39<05:22,  1.69s/it, loss=0.0726, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=1.12e-5, train/loss_step=0.00185, global_step=2066.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  84%|████████▍ | 1018/1208 [28:40<05:21,  1.69s/it, loss=0.0726, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=1.12e-5, train/loss_step=0.00185, global_step=2066.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  84%|████████▍ | 1018/1208 [28:40<05:21,  1.69s/it, loss=0.0744, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000613, train/loss_step=0.185, global_step=2066.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  84%|████████▍ | 1019/1208 [28:41<05:19,  1.69s/it, loss=0.0744, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000613, train/loss_step=0.185, global_step=2066.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  84%|████████▍ | 1019/1208 [28:41<05:19,  1.69s/it, loss=0.0758, v_num=0, train/loss_simple_step=0.0728, train/loss_vlb_step=0.000245, train/loss_step=0.0728, global_step=2066.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  84%|████████▍ | 1020/1208 [28:45<05:17,  1.69s/it, loss=0.0758, v_num=0, train/loss_simple_step=0.0728, train/loss_vlb_step=0.000245, train/loss_step=0.0728, global_step=2066.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  84%|████████▍ | 1020/1208 [28:45<05:17,  1.69s/it, loss=0.0686, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000146, train/loss_step=0.0405, global_step=2066.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  85%|████████▍ | 1021/1208 [28:46<05:16,  1.69s/it, loss=0.0686, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000146, train/loss_step=0.0405, global_step=2066.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  85%|████████▍ | 1021/1208 [28:46<05:16,  1.69s/it, loss=0.069, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=8.03e-5, train/loss_step=0.0185, global_step=2067.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  85%|████████▍ | 1022/1208 [28:47<05:14,  1.69s/it, loss=0.069, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=8.03e-5, train/loss_step=0.0185, global_step=2067.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  85%|████████▍ | 1022/1208 [28:47<05:14,  1.69s/it, loss=0.0682, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=3.21e-5, train/loss_step=0.00619, global_step=2067.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  85%|████████▍ | 1023/1208 [28:48<05:12,  1.69s/it, loss=0.0682, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=3.21e-5, train/loss_step=0.00619, global_step=2067.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  85%|████████▍ | 1023/1208 [28:48<05:12,  1.69s/it, loss=0.0665, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=1.6e-5, train/loss_step=0.00276, global_step=2067.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  85%|████████▍ | 1024/1208 [28:51<05:11,  1.69s/it, loss=0.0665, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=1.6e-5, train/loss_step=0.00276, global_step=2067.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  85%|████████▍ | 1024/1208 [28:51<05:11,  1.69s/it, loss=0.0657, v_num=0, train/loss_simple_step=0.0472, train/loss_vlb_step=0.000169, train/loss_step=0.0472, global_step=2067.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  85%|████████▍ | 1025/1208 [28:52<05:09,  1.69s/it, loss=0.0657, v_num=0, train/loss_simple_step=0.0472, train/loss_vlb_step=0.000169, train/loss_step=0.0472, global_step=2067.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  85%|████████▍ | 1025/1208 [28:52<05:09,  1.69s/it, loss=0.083, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00228, train/loss_step=0.349, global_step=2068.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  85%|████████▍ | 1026/1208 [28:53<05:07,  1.69s/it, loss=0.083, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00228, train/loss_step=0.349, global_step=2068.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  85%|████████▍ | 1026/1208 [28:53<05:07,  1.69s/it, loss=0.0858, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=2068.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  85%|████████▌ | 1027/1208 [28:54<05:05,  1.69s/it, loss=0.0858, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=2068.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  85%|████████▌ | 1027/1208 [28:54<05:05,  1.69s/it, loss=0.0833, v_num=0, train/loss_simple_step=0.0085, train/loss_vlb_step=4.12e-5, train/loss_step=0.0085, global_step=2068.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  85%|████████▌ | 1028/1208 [28:57<05:04,  1.69s/it, loss=0.0833, v_num=0, train/loss_simple_step=0.0085, train/loss_vlb_step=4.12e-5, train/loss_step=0.0085, global_step=2068.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  85%|████████▌ | 1028/1208 [28:57<05:04,  1.69s/it, loss=0.0796, v_num=0, train/loss_simple_step=0.0797, train/loss_vlb_step=0.00027, train/loss_step=0.0797, global_step=2068.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  85%|████████▌ | 1029/1208 [28:58<05:02,  1.69s/it, loss=0.0796, v_num=0, train/loss_simple_step=0.0797, train/loss_vlb_step=0.00027, train/loss_step=0.0797, global_step=2068.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  85%|████████▌ | 1029/1208 [28:58<05:02,  1.69s/it, loss=0.0694, v_num=0, train/loss_simple_step=0.0624, train/loss_vlb_step=0.000217, train/loss_step=0.0624, global_step=2069.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  85%|████████▌ | 1030/1208 [28:59<05:00,  1.69s/it, loss=0.0694, v_num=0, train/loss_simple_step=0.0624, train/loss_vlb_step=0.000217, train/loss_step=0.0624, global_step=2069.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  85%|████████▌ | 1030/1208 [28:59<05:00,  1.69s/it, loss=0.0714, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.000179, train/loss_step=0.0499, global_step=2069.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  85%|████████▌ | 1031/1208 [29:00<04:58,  1.69s/it, loss=0.0714, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.000179, train/loss_step=0.0499, global_step=2069.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  85%|████████▌ | 1031/1208 [29:00<04:58,  1.69s/it, loss=0.093, v_num=0, train/loss_simple_step=0.471, train/loss_vlb_step=0.00666, train/loss_step=0.471, global_step=2069.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  85%|████████▌ | 1032/1208 [29:04<04:57,  1.69s/it, loss=0.093, v_num=0, train/loss_simple_step=0.471, train/loss_vlb_step=0.00666, train/loss_step=0.471, global_step=2069.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  85%|████████▌ | 1032/1208 [29:04<04:57,  1.69s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.00576, train/loss_vlb_step=3.07e-5, train/loss_step=0.00576, global_step=2069.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  86%|████████▌ | 1033/1208 [29:05<04:55,  1.69s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.00576, train/loss_vlb_step=3.07e-5, train/loss_step=0.00576, global_step=2069.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  86%|████████▌ | 1033/1208 [29:05<04:55,  1.69s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.00913, train/loss_vlb_step=4.45e-5, train/loss_step=0.00913, global_step=2070.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  86%|████████▌ | 1034/1208 [29:06<04:53,  1.69s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.00913, train/loss_vlb_step=4.45e-5, train/loss_step=0.00913, global_step=2070.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  86%|████████▌ | 1034/1208 [29:06<04:53,  1.69s/it, loss=0.094, v_num=0, train/loss_simple_step=0.0493, train/loss_vlb_step=0.000179, train/loss_step=0.0493, global_step=2070.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  86%|████████▌ | 1035/1208 [29:07<04:52,  1.69s/it, loss=0.094, v_num=0, train/loss_simple_step=0.0493, train/loss_vlb_step=0.000179, train/loss_step=0.0493, global_step=2070.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  86%|████████▌ | 1035/1208 [29:07<04:52,  1.69s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000347, train/loss_step=0.105, global_step=2070.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  86%|████████▌ | 1036/1208 [29:10<04:50,  1.69s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000347, train/loss_step=0.105, global_step=2070.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  86%|████████▌ | 1036/1208 [29:10<04:50,  1.69s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000671, train/loss_step=0.187, global_step=2070.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  86%|████████▌ | 1037/1208 [29:11<04:48,  1.69s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000671, train/loss_step=0.187, global_step=2070.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  86%|████████▌ | 1037/1208 [29:11<04:48,  1.69s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.036, train/loss_vlb_step=0.000139, train/loss_step=0.036, global_step=2071.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  86%|████████▌ | 1038/1208 [29:12<04:47,  1.69s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.036, train/loss_vlb_step=0.000139, train/loss_step=0.036, global_step=2071.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  86%|████████▌ | 1038/1208 [29:12<04:47,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00313, train/loss_step=0.428, global_step=2071.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  86%|████████▌ | 1039/1208 [29:13<04:45,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00313, train/loss_step=0.428, global_step=2071.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  86%|████████▌ | 1039/1208 [29:13<04:45,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000945, train/loss_step=0.235, global_step=2071.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  86%|████████▌ | 1040/1208 [29:16<04:43,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000945, train/loss_step=0.235, global_step=2071.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  86%|████████▌ | 1040/1208 [29:16<04:43,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00152, train/loss_step=0.273, global_step=2071.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  86%|████████▌ | 1041/1208 [29:18<04:42,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00152, train/loss_step=0.273, global_step=2071.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  86%|████████▌ | 1041/1208 [29:18<04:42,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.673, train/loss_vlb_step=0.0146, train/loss_step=0.673, global_step=2072.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  86%|████████▋ | 1042/1208 [29:19<04:40,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.673, train/loss_vlb_step=0.0146, train/loss_step=0.673, global_step=2072.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  86%|████████▋ | 1042/1208 [29:19<04:40,  1.69s/it, loss=0.168, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000563, train/loss_step=0.163, global_step=2072.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  86%|████████▋ | 1043/1208 [29:20<04:38,  1.69s/it, loss=0.168, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000563, train/loss_step=0.163, global_step=2072.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  86%|████████▋ | 1043/1208 [29:20<04:38,  1.69s/it, loss=0.178, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000725, train/loss_step=0.210, global_step=2072.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  86%|████████▋ | 1044/1208 [29:23<04:36,  1.69s/it, loss=0.178, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000725, train/loss_step=0.210, global_step=2072.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  86%|████████▋ | 1044/1208 [29:23<04:36,  1.69s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0991, train/loss_vlb_step=0.000326, train/loss_step=0.0991, global_step=2072.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  87%|████████▋ | 1045/1208 [29:24<04:35,  1.69s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0991, train/loss_vlb_step=0.000326, train/loss_step=0.0991, global_step=2072.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  87%|████████▋ | 1045/1208 [29:24<04:35,  1.69s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00666, train/loss_vlb_step=3.27e-5, train/loss_step=0.00666, global_step=2073.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  87%|████████▋ | 1046/1208 [29:25<04:33,  1.69s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00666, train/loss_vlb_step=3.27e-5, train/loss_step=0.00666, global_step=2073.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  87%|████████▋ | 1046/1208 [29:25<04:33,  1.69s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0745, train/loss_vlb_step=0.000257, train/loss_step=0.0745, global_step=2073.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  87%|████████▋ | 1047/1208 [29:26<04:31,  1.69s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0745, train/loss_vlb_step=0.000257, train/loss_step=0.0745, global_step=2073.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  87%|████████▋ | 1047/1208 [29:26<04:31,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000539, train/loss_step=0.160, global_step=2073.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  87%|████████▋ | 1048/1208 [29:29<04:30,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000539, train/loss_step=0.160, global_step=2073.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  87%|████████▋ | 1048/1208 [29:29<04:30,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000183, train/loss_step=0.051, global_step=2073.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  87%|████████▋ | 1049/1208 [29:30<04:28,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000183, train/loss_step=0.051, global_step=2073.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  87%|████████▋ | 1049/1208 [29:30<04:28,  1.69s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.88e-5, train/loss_step=0.0105, global_step=2074.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  87%|████████▋ | 1050/1208 [29:31<04:26,  1.69s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.88e-5, train/loss_step=0.0105, global_step=2074.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  87%|████████▋ | 1050/1208 [29:31<04:26,  1.69s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=2.99e-5, train/loss_step=0.00572, global_step=2074.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  87%|████████▋ | 1051/1208 [29:32<04:24,  1.69s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=2.99e-5, train/loss_step=0.00572, global_step=2074.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  87%|████████▋ | 1051/1208 [29:32<04:24,  1.69s/it, loss=0.158, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00232, train/loss_step=0.376, global_step=2074.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  87%|████████▋ | 1052/1208 [29:36<04:23,  1.69s/it, loss=0.158, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00232, train/loss_step=0.376, global_step=2074.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  87%|████████▋ | 1052/1208 [29:36<04:23,  1.69s/it, loss=0.165, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000501, train/loss_step=0.150, global_step=2074.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  87%|████████▋ | 1053/1208 [29:37<04:21,  1.69s/it, loss=0.165, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000501, train/loss_step=0.150, global_step=2074.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  87%|████████▋ | 1053/1208 [29:37<04:21,  1.69s/it, loss=0.186, v_num=0, train/loss_simple_step=0.422, train/loss_vlb_step=0.00284, train/loss_step=0.422, global_step=2075.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  87%|████████▋ | 1054/1208 [29:38<04:19,  1.69s/it, loss=0.186, v_num=0, train/loss_simple_step=0.422, train/loss_vlb_step=0.00284, train/loss_step=0.422, global_step=2075.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  87%|████████▋ | 1054/1208 [29:38<04:19,  1.69s/it, loss=0.19, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=2075.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  87%|████████▋ | 1055/1208 [29:39<04:18,  1.69s/it, loss=0.19, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=2075.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  87%|████████▋ | 1055/1208 [29:39<04:18,  1.69s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.46e-5, train/loss_step=0.0172, global_step=2075.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  87%|████████▋ | 1056/1208 [29:42<04:16,  1.69s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.46e-5, train/loss_step=0.0172, global_step=2075.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  87%|████████▋ | 1056/1208 [29:42<04:16,  1.69s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0475, train/loss_vlb_step=0.000172, train/loss_step=0.0475, global_step=2075.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  88%|████████▊ | 1057/1208 [29:43<04:14,  1.69s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0475, train/loss_vlb_step=0.000172, train/loss_step=0.0475, global_step=2075.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  88%|████████▊ | 1057/1208 [29:43<04:14,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0668, train/loss_vlb_step=0.000226, train/loss_step=0.0668, global_step=2076.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  88%|████████▊ | 1058/1208 [29:44<04:13,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0668, train/loss_vlb_step=0.000226, train/loss_step=0.0668, global_step=2076.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  88%|████████▊ | 1058/1208 [29:44<04:13,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.14e-5, train/loss_step=0.0167, global_step=2076.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  88%|████████▊ | 1059/1208 [29:45<04:11,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.14e-5, train/loss_step=0.0167, global_step=2076.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  88%|████████▊ | 1059/1208 [29:45<04:11,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000157, train/loss_step=0.0416, global_step=2076.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  88%|████████▊ | 1060/1208 [29:48<04:09,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000157, train/loss_step=0.0416, global_step=2076.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  88%|████████▊ | 1060/1208 [29:48<04:09,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0687, train/loss_vlb_step=0.000232, train/loss_step=0.0687, global_step=2076.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  88%|████████▊ | 1061/1208 [29:49<04:07,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0687, train/loss_vlb_step=0.000232, train/loss_step=0.0687, global_step=2076.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  88%|████████▊ | 1061/1208 [29:49<04:07,  1.69s/it, loss=0.119, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00106, train/loss_step=0.260, global_step=2077.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  88%|████████▊ | 1062/1208 [29:50<04:06,  1.69s/it, loss=0.119, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00106, train/loss_step=0.260, global_step=2077.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  88%|████████▊ | 1062/1208 [29:50<04:06,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000933, train/loss_step=0.250, global_step=2077.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  88%|████████▊ | 1063/1208 [29:52<04:04,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000933, train/loss_step=0.250, global_step=2077.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  88%|████████▊ | 1063/1208 [29:52<04:04,  1.69s/it, loss=0.119, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.00043, train/loss_step=0.130, global_step=2077.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  88%|████████▊ | 1064/1208 [29:55<04:02,  1.69s/it, loss=0.119, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.00043, train/loss_step=0.130, global_step=2077.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  88%|████████▊ | 1064/1208 [29:55<04:02,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000641, train/loss_step=0.187, global_step=2077.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  88%|████████▊ | 1065/1208 [29:56<04:01,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000641, train/loss_step=0.187, global_step=2077.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  88%|████████▊ | 1065/1208 [29:56<04:01,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=7.97e-5, train/loss_step=0.0189, global_step=2078.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  88%|████████▊ | 1066/1208 [29:57<03:59,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=7.97e-5, train/loss_step=0.0189, global_step=2078.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  88%|████████▊ | 1066/1208 [29:57<03:59,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.29e-5, train/loss_step=0.0115, global_step=2078.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  88%|████████▊ | 1067/1208 [29:58<03:57,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.29e-5, train/loss_step=0.0115, global_step=2078.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  88%|████████▊ | 1067/1208 [29:58<03:57,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=1.49e-5, train/loss_step=0.00256, global_step=2078.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  88%|████████▊ | 1068/1208 [30:01<03:56,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=1.49e-5, train/loss_step=0.00256, global_step=2078.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  88%|████████▊ | 1068/1208 [30:01<03:56,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.45e-5, train/loss_step=0.0235, global_step=2078.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  88%|████████▊ | 1069/1208 [30:02<03:54,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.45e-5, train/loss_step=0.0235, global_step=2078.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  88%|████████▊ | 1069/1208 [30:02<03:54,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.9e-5, train/loss_step=0.0215, global_step=2079.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  89%|████████▊ | 1070/1208 [30:03<03:52,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.9e-5, train/loss_step=0.0215, global_step=2079.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  89%|████████▊ | 1070/1208 [30:03<03:52,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00273, train/loss_step=0.409, global_step=2079.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  89%|████████▊ | 1071/1208 [30:04<03:50,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00273, train/loss_step=0.409, global_step=2079.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  89%|████████▊ | 1071/1208 [30:04<03:50,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0597, train/loss_vlb_step=0.00021, train/loss_step=0.0597, global_step=2079.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  89%|████████▊ | 1072/1208 [30:08<03:49,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0597, train/loss_vlb_step=0.00021, train/loss_step=0.0597, global_step=2079.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  89%|████████▊ | 1072/1208 [30:08<03:49,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00224, train/loss_step=0.364, global_step=2079.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  89%|████████▉ | 1073/1208 [30:09<03:47,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00224, train/loss_step=0.364, global_step=2079.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  89%|████████▉ | 1073/1208 [30:09<03:47,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.44e-5, train/loss_step=0.0143, global_step=2080.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  89%|████████▉ | 1074/1208 [30:10<03:45,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.44e-5, train/loss_step=0.0143, global_step=2080.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  89%|████████▉ | 1074/1208 [30:10<03:45,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0507, train/loss_vlb_step=0.00018, train/loss_step=0.0507, global_step=2080.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  89%|████████▉ | 1075/1208 [30:11<03:44,  1.68s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0507, train/loss_vlb_step=0.00018, train/loss_step=0.0507, global_step=2080.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  89%|████████▉ | 1075/1208 [30:11<03:44,  1.68s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.66e-5, train/loss_step=0.00281, global_step=2080.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  89%|████████▉ | 1076/1208 [30:14<03:42,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.66e-5, train/loss_step=0.00281, global_step=2080.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  89%|████████▉ | 1076/1208 [30:14<03:42,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0684, train/loss_vlb_step=0.000233, train/loss_step=0.0684, global_step=2080.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  89%|████████▉ | 1077/1208 [30:15<03:40,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0684, train/loss_vlb_step=0.000233, train/loss_step=0.0684, global_step=2080.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  89%|████████▉ | 1077/1208 [30:15<03:40,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000145, train/loss_step=0.0396, global_step=2081.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  89%|████████▉ | 1078/1208 [30:16<03:39,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000145, train/loss_step=0.0396, global_step=2081.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  89%|████████▉ | 1078/1208 [30:16<03:39,  1.69s/it, loss=0.104, v_num=0, train/loss_simple_step=0.046, train/loss_vlb_step=0.000167, train/loss_step=0.046, global_step=2081.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  89%|████████▉ | 1079/1208 [30:17<03:37,  1.68s/it, loss=0.104, v_num=0, train/loss_simple_step=0.046, train/loss_vlb_step=0.000167, train/loss_step=0.046, global_step=2081.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  89%|████████▉ | 1079/1208 [30:17<03:37,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00367, train/loss_step=0.399, global_step=2081.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  89%|████████▉ | 1080/1208 [30:20<03:35,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00367, train/loss_step=0.399, global_step=2081.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  89%|████████▉ | 1080/1208 [30:20<03:35,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00794, train/loss_vlb_step=3.88e-5, train/loss_step=0.00794, global_step=2081.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  89%|████████▉ | 1081/1208 [30:21<03:34,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00794, train/loss_vlb_step=3.88e-5, train/loss_step=0.00794, global_step=2081.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  89%|████████▉ | 1081/1208 [30:21<03:34,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00792, train/loss_vlb_step=4.05e-5, train/loss_step=0.00792, global_step=2082.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  90%|████████▉ | 1082/1208 [30:22<03:32,  1.68s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00792, train/loss_vlb_step=4.05e-5, train/loss_step=0.00792, global_step=2082.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  90%|████████▉ | 1082/1208 [30:22<03:32,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00153, train/loss_step=0.317, global_step=2082.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  90%|████████▉ | 1083/1208 [30:23<03:30,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00153, train/loss_step=0.317, global_step=2082.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  90%|████████▉ | 1083/1208 [30:23<03:30,  1.68s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=9.36e-5, train/loss_step=0.0222, global_step=2082.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  90%|████████▉ | 1084/1208 [30:27<03:29,  1.69s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=9.36e-5, train/loss_step=0.0222, global_step=2082.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  90%|████████▉ | 1084/1208 [30:27<03:29,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00214, train/loss_step=0.357, global_step=2082.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  90%|████████▉ | 1085/1208 [30:28<03:27,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00214, train/loss_step=0.357, global_step=2082.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  90%|████████▉ | 1085/1208 [30:28<03:27,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.34e-5, train/loss_step=0.0163, global_step=2083.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  90%|████████▉ | 1086/1208 [30:29<03:25,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.34e-5, train/loss_step=0.0163, global_step=2083.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  90%|████████▉ | 1086/1208 [30:29<03:25,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00711, train/loss_vlb_step=3.55e-5, train/loss_step=0.00711, global_step=2083.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  90%|████████▉ | 1087/1208 [30:30<03:23,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00711, train/loss_vlb_step=3.55e-5, train/loss_step=0.00711, global_step=2083.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  90%|████████▉ | 1087/1208 [30:30<03:23,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.096, train/loss_vlb_step=0.000316, train/loss_step=0.096, global_step=2083.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  90%|█████████ | 1088/1208 [30:33<03:22,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.096, train/loss_vlb_step=0.000316, train/loss_step=0.096, global_step=2083.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  90%|█████████ | 1088/1208 [30:33<03:22,  1.69s/it, loss=0.122, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000462, train/loss_step=0.137, global_step=2083.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  90%|█████████ | 1089/1208 [30:34<03:20,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000462, train/loss_step=0.137, global_step=2083.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  90%|█████████ | 1089/1208 [30:34<03:20,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00158, train/loss_step=0.315, global_step=2084.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  90%|█████████ | 1090/1208 [30:35<03:18,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00158, train/loss_step=0.315, global_step=2084.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  90%|█████████ | 1090/1208 [30:35<03:18,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000989, train/loss_step=0.235, global_step=2084.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  90%|█████████ | 1091/1208 [30:36<03:16,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000989, train/loss_step=0.235, global_step=2084.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  90%|█████████ | 1091/1208 [30:36<03:16,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.26e-5, train/loss_step=0.00409, global_step=2084.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  90%|█████████ | 1092/1208 [30:39<03:15,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.26e-5, train/loss_step=0.00409, global_step=2084.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  90%|█████████ | 1092/1208 [30:39<03:15,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.030, train/loss_vlb_step=0.000111, train/loss_step=0.030, global_step=2084.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  90%|█████████ | 1093/1208 [30:41<03:13,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.030, train/loss_vlb_step=0.000111, train/loss_step=0.030, global_step=2084.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  90%|█████████ | 1093/1208 [30:41<03:13,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000344, train/loss_step=0.104, global_step=2085.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  91%|█████████ | 1094/1208 [30:42<03:11,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000344, train/loss_step=0.104, global_step=2085.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  91%|█████████ | 1094/1208 [30:42<03:11,  1.68s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00476, train/loss_vlb_step=2.54e-5, train/loss_step=0.00476, global_step=2085.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  91%|█████████ | 1095/1208 [30:43<03:10,  1.68s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00476, train/loss_vlb_step=2.54e-5, train/loss_step=0.00476, global_step=2085.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  91%|█████████ | 1095/1208 [30:43<03:10,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=6.99e-5, train/loss_step=0.0163, global_step=2085.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  91%|█████████ | 1096/1208 [30:46<03:08,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=6.99e-5, train/loss_step=0.0163, global_step=2085.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  91%|█████████ | 1096/1208 [30:46<03:08,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0893, train/loss_vlb_step=0.000293, train/loss_step=0.0893, global_step=2085.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  91%|█████████ | 1097/1208 [30:47<03:06,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0893, train/loss_vlb_step=0.000293, train/loss_step=0.0893, global_step=2085.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  91%|█████████ | 1097/1208 [30:47<03:06,  1.68s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.88e-5, train/loss_step=0.0164, global_step=2086.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  91%|█████████ | 1098/1208 [30:48<03:05,  1.68s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.88e-5, train/loss_step=0.0164, global_step=2086.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  91%|█████████ | 1098/1208 [30:48<03:05,  1.68s/it, loss=0.11, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.18e-5, train/loss_step=0.023, global_step=2086.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  91%|█████████ | 1099/1208 [30:49<03:03,  1.68s/it, loss=0.11, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.18e-5, train/loss_step=0.023, global_step=2086.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  91%|█████████ | 1099/1208 [30:49<03:03,  1.68s/it, loss=0.0991, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000615, train/loss_step=0.175, global_step=2086.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  91%|█████████ | 1100/1208 [30:52<03:01,  1.68s/it, loss=0.0991, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000615, train/loss_step=0.175, global_step=2086.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  91%|█████████ | 1100/1208 [30:52<03:01,  1.68s/it, loss=0.0991, v_num=0, train/loss_simple_step=0.00774, train/loss_vlb_step=3.81e-5, train/loss_step=0.00774, global_step=2086.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  91%|█████████ | 1101/1208 [30:53<03:00,  1.68s/it, loss=0.0991, v_num=0, train/loss_simple_step=0.00774, train/loss_vlb_step=3.81e-5, train/loss_step=0.00774, global_step=2086.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  91%|█████████ | 1101/1208 [30:53<03:00,  1.68s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000124, train/loss_step=0.0317, global_step=2087.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  91%|█████████ | 1102/1208 [30:54<02:58,  1.68s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000124, train/loss_step=0.0317, global_step=2087.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  91%|█████████ | 1102/1208 [30:54<02:58,  1.68s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000942, train/loss_step=0.242, global_step=2087.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  91%|█████████▏| 1103/1208 [30:55<02:56,  1.68s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000942, train/loss_step=0.242, global_step=2087.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  91%|█████████▏| 1103/1208 [30:55<02:56,  1.68s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.00498, train/loss_vlb_step=2.61e-5, train/loss_step=0.00498, global_step=2087.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  91%|█████████▏| 1104/1208 [30:59<02:55,  1.68s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.00498, train/loss_vlb_step=2.61e-5, train/loss_step=0.00498, global_step=2087.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  91%|█████████▏| 1104/1208 [30:59<02:55,  1.68s/it, loss=0.0792, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000113, train/loss_step=0.0281, global_step=2087.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  91%|█████████▏| 1105/1208 [31:00<02:53,  1.68s/it, loss=0.0792, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000113, train/loss_step=0.0281, global_step=2087.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  91%|█████████▏| 1105/1208 [31:00<02:53,  1.68s/it, loss=0.0893, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000869, train/loss_step=0.218, global_step=2088.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  92%|█████████▏| 1106/1208 [31:01<02:51,  1.68s/it, loss=0.0893, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000869, train/loss_step=0.218, global_step=2088.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  92%|█████████▏| 1106/1208 [31:01<02:51,  1.68s/it, loss=0.0898, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=6.73e-5, train/loss_step=0.0169, global_step=2088.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  92%|█████████▏| 1107/1208 [31:02<02:49,  1.68s/it, loss=0.0898, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=6.73e-5, train/loss_step=0.0169, global_step=2088.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  92%|█████████▏| 1107/1208 [31:02<02:49,  1.68s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000909, train/loss_step=0.225, global_step=2088.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  92%|█████████▏| 1108/1208 [31:05<02:48,  1.68s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000909, train/loss_step=0.225, global_step=2088.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  92%|█████████▏| 1108/1208 [31:05<02:48,  1.68s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.00997, train/loss_vlb_step=4.45e-5, train/loss_step=0.00997, global_step=2088.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  92%|█████████▏| 1109/1208 [31:06<02:46,  1.68s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.00997, train/loss_vlb_step=4.45e-5, train/loss_step=0.00997, global_step=2088.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  92%|█████████▏| 1109/1208 [31:06<02:46,  1.68s/it, loss=0.0781, v_num=0, train/loss_simple_step=0.0786, train/loss_vlb_step=0.000267, train/loss_step=0.0786, global_step=2089.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  92%|█████████▏| 1110/1208 [31:07<02:44,  1.68s/it, loss=0.0781, v_num=0, train/loss_simple_step=0.0786, train/loss_vlb_step=0.000267, train/loss_step=0.0786, global_step=2089.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  92%|█████████▏| 1110/1208 [31:07<02:44,  1.68s/it, loss=0.0677, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000112, train/loss_step=0.0288, global_step=2089.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  92%|█████████▏| 1111/1208 [31:08<02:43,  1.68s/it, loss=0.0677, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000112, train/loss_step=0.0288, global_step=2089.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  92%|█████████▏| 1111/1208 [31:08<02:43,  1.68s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00219, train/loss_step=0.371, global_step=2089.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  92%|█████████▏| 1112/1208 [31:11<02:41,  1.68s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00219, train/loss_step=0.371, global_step=2089.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  92%|█████████▏| 1112/1208 [31:11<02:41,  1.68s/it, loss=0.086, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000106, train/loss_step=0.0279, global_step=2089.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  92%|█████████▏| 1113/1208 [31:12<02:39,  1.68s/it, loss=0.086, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000106, train/loss_step=0.0279, global_step=2089.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  92%|█████████▏| 1113/1208 [31:12<02:39,  1.68s/it, loss=0.098, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00186, train/loss_step=0.346, global_step=2090.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  92%|█████████▏| 1114/1208 [31:13<02:38,  1.68s/it, loss=0.098, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00186, train/loss_step=0.346, global_step=2090.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  92%|█████████▏| 1114/1208 [31:13<02:38,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.785, train/loss_vlb_step=0.080, train/loss_step=0.785, global_step=2090.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  92%|█████████▏| 1115/1208 [31:15<02:36,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.785, train/loss_vlb_step=0.080, train/loss_step=0.785, global_step=2090.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  92%|█████████▏| 1115/1208 [31:15<02:36,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000384, train/loss_step=0.117, global_step=2090.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  92%|█████████▏| 1116/1208 [31:18<02:34,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000384, train/loss_step=0.117, global_step=2090.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  92%|█████████▏| 1116/1208 [31:18<02:34,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00109, train/loss_step=0.244, global_step=2090.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  92%|█████████▏| 1117/1208 [31:19<02:33,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00109, train/loss_step=0.244, global_step=2090.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  92%|█████████▏| 1117/1208 [31:19<02:33,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00137, train/loss_step=0.280, global_step=2091.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  93%|█████████▎| 1118/1208 [31:20<02:31,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00137, train/loss_step=0.280, global_step=2091.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  93%|█████████▎| 1118/1208 [31:20<02:31,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0645, train/loss_vlb_step=0.00022, train/loss_step=0.0645, global_step=2091.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  93%|█████████▎| 1119/1208 [31:21<02:29,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0645, train/loss_vlb_step=0.00022, train/loss_step=0.0645, global_step=2091.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  93%|█████████▎| 1119/1208 [31:21<02:29,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0421, train/loss_vlb_step=0.000153, train/loss_step=0.0421, global_step=2091.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  93%|█████████▎| 1120/1208 [31:24<02:28,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0421, train/loss_vlb_step=0.000153, train/loss_step=0.0421, global_step=2091.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  93%|█████████▎| 1120/1208 [31:24<02:28,  1.68s/it, loss=0.176, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00148, train/loss_step=0.351, global_step=2091.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  93%|█████████▎| 1121/1208 [31:25<02:26,  1.68s/it, loss=0.176, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00148, train/loss_step=0.351, global_step=2091.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  93%|█████████▎| 1121/1208 [31:25<02:26,  1.68s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=9.89e-5, train/loss_step=0.0256, global_step=2092.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  93%|█████████▎| 1122/1208 [31:26<02:24,  1.68s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=9.89e-5, train/loss_step=0.0256, global_step=2092.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  93%|█████████▎| 1122/1208 [31:26<02:24,  1.68s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0973, train/loss_vlb_step=0.000325, train/loss_step=0.0973, global_step=2092.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  93%|█████████▎| 1123/1208 [31:27<02:22,  1.68s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0973, train/loss_vlb_step=0.000325, train/loss_step=0.0973, global_step=2092.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  93%|█████████▎| 1123/1208 [31:27<02:22,  1.68s/it, loss=0.175, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000457, train/loss_step=0.139, global_step=2092.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  93%|█████████▎| 1124/1208 [31:31<02:21,  1.68s/it, loss=0.175, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000457, train/loss_step=0.139, global_step=2092.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  93%|█████████▎| 1124/1208 [31:31<02:21,  1.68s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000128, train/loss_step=0.0344, global_step=2092.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  93%|█████████▎| 1125/1208 [31:32<02:19,  1.68s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000128, train/loss_step=0.0344, global_step=2092.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  93%|█████████▎| 1125/1208 [31:32<02:19,  1.68s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0836, train/loss_vlb_step=0.000276, train/loss_step=0.0836, global_step=2093.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  93%|█████████▎| 1126/1208 [31:33<02:17,  1.68s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0836, train/loss_vlb_step=0.000276, train/loss_step=0.0836, global_step=2093.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  93%|█████████▎| 1126/1208 [31:33<02:17,  1.68s/it, loss=0.191, v_num=0, train/loss_simple_step=0.464, train/loss_vlb_step=0.00362, train/loss_step=0.464, global_step=2093.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  93%|█████████▎| 1127/1208 [31:34<02:16,  1.68s/it, loss=0.191, v_num=0, train/loss_simple_step=0.464, train/loss_vlb_step=0.00362, train/loss_step=0.464, global_step=2093.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  93%|█████████▎| 1127/1208 [31:34<02:16,  1.68s/it, loss=0.185, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000337, train/loss_step=0.103, global_step=2093.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  93%|█████████▎| 1128/1208 [31:37<02:14,  1.68s/it, loss=0.185, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000337, train/loss_step=0.103, global_step=2093.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  93%|█████████▎| 1128/1208 [31:37<02:14,  1.68s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=2.31e-5, train/loss_step=0.00413, global_step=2093.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  93%|█████████▎| 1129/1208 [31:38<02:12,  1.68s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=2.31e-5, train/loss_step=0.00413, global_step=2093.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  93%|█████████▎| 1129/1208 [31:38<02:12,  1.68s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0027, train/loss_vlb_step=1.61e-5, train/loss_step=0.0027, global_step=2094.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  94%|█████████▎| 1130/1208 [31:39<02:11,  1.68s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0027, train/loss_vlb_step=1.61e-5, train/loss_step=0.0027, global_step=2094.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  94%|█████████▎| 1130/1208 [31:39<02:11,  1.68s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0767, train/loss_vlb_step=0.000264, train/loss_step=0.0767, global_step=2094.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  94%|█████████▎| 1131/1208 [31:40<02:09,  1.68s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0767, train/loss_vlb_step=0.000264, train/loss_step=0.0767, global_step=2094.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  94%|█████████▎| 1131/1208 [31:40<02:09,  1.68s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.000202, train/loss_step=0.0598, global_step=2094.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  94%|█████████▎| 1132/1208 [31:43<02:07,  1.68s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.000202, train/loss_step=0.0598, global_step=2094.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  94%|█████████▎| 1132/1208 [31:43<02:07,  1.68s/it, loss=0.196, v_num=0, train/loss_simple_step=0.603, train/loss_vlb_step=0.0199, train/loss_step=0.603, global_step=2094.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  94%|█████████▍| 1133/1208 [31:44<02:06,  1.68s/it, loss=0.196, v_num=0, train/loss_simple_step=0.603, train/loss_vlb_step=0.0199, train/loss_step=0.603, global_step=2094.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  94%|█████████▍| 1133/1208 [31:44<02:06,  1.68s/it, loss=0.197, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00225, train/loss_step=0.354, global_step=2095.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  94%|█████████▍| 1134/1208 [31:45<02:04,  1.68s/it, loss=0.197, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00225, train/loss_step=0.354, global_step=2095.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  94%|█████████▍| 1134/1208 [31:45<02:04,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00371, train/loss_vlb_step=2.01e-5, train/loss_step=0.00371, global_step=2095.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  94%|█████████▍| 1135/1208 [31:46<02:02,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00371, train/loss_vlb_step=2.01e-5, train/loss_step=0.00371, global_step=2095.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  94%|█████████▍| 1135/1208 [31:46<02:02,  1.68s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0629, train/loss_vlb_step=0.000213, train/loss_step=0.0629, global_step=2095.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  94%|█████████▍| 1136/1208 [31:50<02:01,  1.68s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0629, train/loss_vlb_step=0.000213, train/loss_step=0.0629, global_step=2095.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  94%|█████████▍| 1136/1208 [31:50<02:01,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000347, train/loss_step=0.105, global_step=2095.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  94%|█████████▍| 1137/1208 [31:51<01:59,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000347, train/loss_step=0.105, global_step=2095.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  94%|█████████▍| 1137/1208 [31:51<01:59,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=2096.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  94%|█████████▍| 1138/1208 [31:52<01:57,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=2096.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  94%|█████████▍| 1138/1208 [31:52<01:57,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.0012, train/loss_step=0.285, global_step=2096.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  94%|█████████▍| 1139/1208 [31:53<01:55,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.0012, train/loss_step=0.285, global_step=2096.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  94%|█████████▍| 1139/1208 [31:53<01:55,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000131, train/loss_step=0.0353, global_step=2096.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  94%|█████████▍| 1140/1208 [31:56<01:54,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000131, train/loss_step=0.0353, global_step=2096.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  94%|█████████▍| 1140/1208 [31:56<01:54,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=2096.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  94%|█████████▍| 1141/1208 [31:57<01:52,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=2096.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  94%|█████████▍| 1141/1208 [31:57<01:52,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000642, train/loss_step=0.183, global_step=2097.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  95%|█████████▍| 1142/1208 [31:58<01:50,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000642, train/loss_step=0.183, global_step=2097.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  95%|█████████▍| 1142/1208 [31:58<01:50,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.48e-5, train/loss_step=0.0243, global_step=2097.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  95%|█████████▍| 1143/1208 [31:59<01:49,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.48e-5, train/loss_step=0.0243, global_step=2097.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  95%|█████████▍| 1143/1208 [31:59<01:49,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0852, train/loss_vlb_step=0.000287, train/loss_step=0.0852, global_step=2097.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  95%|█████████▍| 1144/1208 [32:03<01:47,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0852, train/loss_vlb_step=0.000287, train/loss_step=0.0852, global_step=2097.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  95%|█████████▍| 1144/1208 [32:03<01:47,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00722, train/loss_vlb_step=3.67e-5, train/loss_step=0.00722, global_step=2097.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  95%|█████████▍| 1145/1208 [32:04<01:45,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00722, train/loss_vlb_step=3.67e-5, train/loss_step=0.00722, global_step=2097.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  95%|█████████▍| 1145/1208 [32:04<01:45,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0692, train/loss_vlb_step=0.000237, train/loss_step=0.0692, global_step=2098.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  95%|█████████▍| 1146/1208 [32:05<01:44,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0692, train/loss_vlb_step=0.000237, train/loss_step=0.0692, global_step=2098.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  95%|█████████▍| 1146/1208 [32:05<01:44,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0375, train/loss_vlb_step=0.000145, train/loss_step=0.0375, global_step=2098.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  95%|█████████▍| 1147/1208 [32:06<01:42,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0375, train/loss_vlb_step=0.000145, train/loss_step=0.0375, global_step=2098.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  95%|█████████▍| 1147/1208 [32:06<01:42,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00714, train/loss_vlb_step=3.45e-5, train/loss_step=0.00714, global_step=2098.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  95%|█████████▌| 1148/1208 [32:09<01:40,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00714, train/loss_vlb_step=3.45e-5, train/loss_step=0.00714, global_step=2098.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  95%|█████████▌| 1148/1208 [32:09<01:40,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.477, train/loss_vlb_step=0.00646, train/loss_step=0.477, global_step=2098.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  95%|█████████▌| 1149/1208 [32:10<01:39,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.477, train/loss_vlb_step=0.00646, train/loss_step=0.477, global_step=2098.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  95%|█████████▌| 1149/1208 [32:10<01:39,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00121, train/loss_step=0.253, global_step=2099.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  95%|█████████▌| 1150/1208 [32:11<01:37,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00121, train/loss_step=0.253, global_step=2099.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  95%|█████████▌| 1150/1208 [32:11<01:37,  1.68s/it, loss=0.155, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000946, train/loss_step=0.229, global_step=2099.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  95%|█████████▌| 1151/1208 [32:12<01:35,  1.68s/it, loss=0.155, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000946, train/loss_step=0.229, global_step=2099.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  95%|█████████▌| 1151/1208 [32:12<01:35,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0041, train/loss_vlb_step=2.24e-5, train/loss_step=0.0041, global_step=2099.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  95%|█████████▌| 1152/1208 [32:15<01:34,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0041, train/loss_vlb_step=2.24e-5, train/loss_step=0.0041, global_step=2099.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  95%|█████████▌| 1152/1208 [32:15<01:34,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00125, train/loss_step=0.258, global_step=2099.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  95%|█████████▌| 1153/1208 [32:16<01:32,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00125, train/loss_step=0.258, global_step=2099.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  95%|█████████▌| 1153/1208 [32:16<01:32,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0818, train/loss_vlb_step=0.000272, train/loss_step=0.0818, global_step=2100.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  96%|█████████▌| 1154/1208 [32:18<01:30,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0818, train/loss_vlb_step=0.000272, train/loss_step=0.0818, global_step=2100.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  96%|█████████▌| 1154/1208 [32:18<01:30,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=2100.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  96%|█████████▌| 1155/1208 [32:19<01:28,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=2100.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  96%|█████████▌| 1155/1208 [32:19<01:28,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000361, train/loss_step=0.110, global_step=2100.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  96%|█████████▌| 1156/1208 [32:22<01:27,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000361, train/loss_step=0.110, global_step=2100.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  96%|█████████▌| 1156/1208 [32:22<01:27,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00335, train/loss_step=0.433, global_step=2100.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  96%|█████████▌| 1157/1208 [32:23<01:25,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00335, train/loss_step=0.433, global_step=2100.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  96%|█████████▌| 1157/1208 [32:23<01:25,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.000155, train/loss_step=0.0418, global_step=2101.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  96%|█████████▌| 1158/1208 [32:24<01:23,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.000155, train/loss_step=0.0418, global_step=2101.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  96%|█████████▌| 1158/1208 [32:24<01:23,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000113, train/loss_step=0.0274, global_step=2101.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  96%|█████████▌| 1159/1208 [32:25<01:22,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000113, train/loss_step=0.0274, global_step=2101.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  96%|█████████▌| 1159/1208 [32:25<01:22,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00426, train/loss_vlb_step=2.29e-5, train/loss_step=0.00426, global_step=2101.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  96%|█████████▌| 1160/1208 [32:28<01:20,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00426, train/loss_vlb_step=2.29e-5, train/loss_step=0.00426, global_step=2101.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  96%|█████████▌| 1160/1208 [32:28<01:20,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.00037, train/loss_step=0.113, global_step=2101.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  96%|█████████▌| 1161/1208 [32:29<01:18,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.00037, train/loss_step=0.113, global_step=2101.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  96%|█████████▌| 1161/1208 [32:29<01:18,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000109, train/loss_step=0.0284, global_step=2102.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  96%|█████████▌| 1162/1208 [32:30<01:17,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000109, train/loss_step=0.0284, global_step=2102.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  96%|█████████▌| 1162/1208 [32:30<01:17,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.13e-5, train/loss_step=0.0197, global_step=2102.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  96%|█████████▋| 1163/1208 [32:31<01:15,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.13e-5, train/loss_step=0.0197, global_step=2102.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  96%|█████████▋| 1163/1208 [32:31<01:15,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0704, train/loss_vlb_step=0.000234, train/loss_step=0.0704, global_step=2102.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  96%|█████████▋| 1164/1208 [32:35<01:13,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0704, train/loss_vlb_step=0.000234, train/loss_step=0.0704, global_step=2102.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  96%|█████████▋| 1164/1208 [32:35<01:13,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.78e-5, train/loss_step=0.00304, global_step=2102.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  96%|█████████▋| 1165/1208 [32:36<01:12,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.78e-5, train/loss_step=0.00304, global_step=2102.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  96%|█████████▋| 1165/1208 [32:36<01:12,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.483, train/loss_vlb_step=0.00641, train/loss_step=0.483, global_step=2103.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]     Epoch 6:  97%|█████████▋| 1166/1208 [32:37<01:10,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.483, train/loss_vlb_step=0.00641, train/loss_step=0.483, global_step=2103.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  97%|█████████▋| 1166/1208 [32:37<01:10,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.76e-5, train/loss_step=0.0126, global_step=2103.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  97%|█████████▋| 1167/1208 [32:38<01:08,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.76e-5, train/loss_step=0.0126, global_step=2103.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  97%|█████████▋| 1167/1208 [32:38<01:08,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00795, train/loss_vlb_step=3.92e-5, train/loss_step=0.00795, global_step=2103.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  97%|█████████▋| 1168/1208 [32:41<01:07,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00795, train/loss_vlb_step=3.92e-5, train/loss_step=0.00795, global_step=2103.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  97%|█████████▋| 1168/1208 [32:41<01:07,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00785, train/loss_vlb_step=3.95e-5, train/loss_step=0.00785, global_step=2103.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  97%|█████████▋| 1169/1208 [32:42<01:05,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00785, train/loss_vlb_step=3.95e-5, train/loss_step=0.00785, global_step=2103.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  97%|█████████▋| 1169/1208 [32:42<01:05,  1.68s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=1.23e-5, train/loss_step=0.00206, global_step=2104.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  97%|█████████▋| 1170/1208 [32:43<01:03,  1.68s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=1.23e-5, train/loss_step=0.00206, global_step=2104.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  97%|█████████▋| 1170/1208 [32:43<01:03,  1.68s/it, loss=0.0938, v_num=0, train/loss_simple_step=0.0577, train/loss_vlb_step=0.000212, train/loss_step=0.0577, global_step=2104.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  97%|█████████▋| 1171/1208 [32:44<01:02,  1.68s/it, loss=0.0938, v_num=0, train/loss_simple_step=0.0577, train/loss_vlb_step=0.000212, train/loss_step=0.0577, global_step=2104.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  97%|█████████▋| 1171/1208 [32:44<01:02,  1.68s/it, loss=0.1, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000427, train/loss_step=0.130, global_step=2104.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]     Epoch 6:  97%|█████████▋| 1172/1208 [32:47<01:00,  1.68s/it, loss=0.1, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000427, train/loss_step=0.130, global_step=2104.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  97%|█████████▋| 1172/1208 [32:47<01:00,  1.68s/it, loss=0.091, v_num=0, train/loss_simple_step=0.0761, train/loss_vlb_step=0.000269, train/loss_step=0.0761, global_step=2104.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  97%|█████████▋| 1173/1208 [32:49<00:58,  1.68s/it, loss=0.091, v_num=0, train/loss_simple_step=0.0761, train/loss_vlb_step=0.000269, train/loss_step=0.0761, global_step=2104.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  97%|█████████▋| 1173/1208 [32:49<00:58,  1.68s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.0738, train/loss_vlb_step=0.000252, train/loss_step=0.0738, global_step=2105.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  97%|█████████▋| 1174/1208 [32:50<00:57,  1.68s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.0738, train/loss_vlb_step=0.000252, train/loss_step=0.0738, global_step=2105.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  97%|█████████▋| 1174/1208 [32:50<00:57,  1.68s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000852, train/loss_step=0.228, global_step=2105.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  97%|█████████▋| 1175/1208 [32:51<00:55,  1.68s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000852, train/loss_step=0.228, global_step=2105.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  97%|█████████▋| 1175/1208 [32:51<00:55,  1.68s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000515, train/loss_step=0.153, global_step=2105.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  97%|█████████▋| 1176/1208 [32:54<00:53,  1.68s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000515, train/loss_step=0.153, global_step=2105.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  97%|█████████▋| 1176/1208 [32:54<00:53,  1.68s/it, loss=0.0791, v_num=0, train/loss_simple_step=0.0431, train/loss_vlb_step=0.000159, train/loss_step=0.0431, global_step=2105.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  97%|█████████▋| 1177/1208 [32:55<00:52,  1.68s/it, loss=0.0791, v_num=0, train/loss_simple_step=0.0431, train/loss_vlb_step=0.000159, train/loss_step=0.0431, global_step=2105.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  97%|█████████▋| 1177/1208 [32:55<00:52,  1.68s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00269, train/loss_step=0.384, global_step=2106.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  98%|█████████▊| 1178/1208 [32:56<00:50,  1.68s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00269, train/loss_step=0.384, global_step=2106.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  98%|█████████▊| 1178/1208 [32:56<00:50,  1.68s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.074, train/loss_vlb_step=0.000255, train/loss_step=0.074, global_step=2106.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  98%|█████████▊| 1179/1208 [32:57<00:48,  1.68s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.074, train/loss_vlb_step=0.000255, train/loss_step=0.074, global_step=2106.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  98%|█████████▊| 1179/1208 [32:57<00:48,  1.68s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0875, train/loss_vlb_step=0.000294, train/loss_step=0.0875, global_step=2106.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  98%|█████████▊| 1180/1208 [33:00<00:47,  1.68s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0875, train/loss_vlb_step=0.000294, train/loss_step=0.0875, global_step=2106.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  98%|█████████▊| 1180/1208 [33:00<00:47,  1.68s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000128, train/loss_step=0.0339, global_step=2106.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  98%|█████████▊| 1181/1208 [33:01<00:45,  1.68s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000128, train/loss_step=0.0339, global_step=2106.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  98%|█████████▊| 1181/1208 [33:01<00:45,  1.68s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000254, train/loss_step=0.0754, global_step=2107.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  98%|█████████▊| 1182/1208 [33:02<00:43,  1.68s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000254, train/loss_step=0.0754, global_step=2107.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  98%|█████████▊| 1182/1208 [33:02<00:43,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.690, train/loss_vlb_step=0.0443, train/loss_step=0.690, global_step=2107.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]    Epoch 6:  98%|█████████▊| 1183/1208 [33:03<00:41,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.690, train/loss_vlb_step=0.0443, train/loss_step=0.690, global_step=2107.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  98%|█████████▊| 1183/1208 [33:03<00:41,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00175, train/loss_step=0.326, global_step=2107.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  98%|█████████▊| 1184/1208 [33:07<00:40,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00175, train/loss_step=0.326, global_step=2107.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  98%|█████████▊| 1184/1208 [33:07<00:40,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0698, train/loss_vlb_step=0.000237, train/loss_step=0.0698, global_step=2107.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  98%|█████████▊| 1185/1208 [33:08<00:38,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0698, train/loss_vlb_step=0.000237, train/loss_step=0.0698, global_step=2107.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  98%|█████████▊| 1185/1208 [33:08<00:38,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.46e-5, train/loss_step=0.0174, global_step=2108.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  98%|█████████▊| 1186/1208 [33:09<00:36,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.46e-5, train/loss_step=0.0174, global_step=2108.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  98%|█████████▊| 1186/1208 [33:09<00:36,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00287, train/loss_vlb_step=1.69e-5, train/loss_step=0.00287, global_step=2108.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  98%|█████████▊| 1187/1208 [33:10<00:35,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00287, train/loss_vlb_step=1.69e-5, train/loss_step=0.00287, global_step=2108.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  98%|█████████▊| 1187/1208 [33:10<00:35,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00702, train/loss_vlb_step=3.5e-5, train/loss_step=0.00702, global_step=2108.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  98%|█████████▊| 1188/1208 [33:13<00:33,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00702, train/loss_vlb_step=3.5e-5, train/loss_step=0.00702, global_step=2108.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  98%|█████████▊| 1188/1208 [33:13<00:33,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000459, train/loss_step=0.139, global_step=2108.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6:  98%|█████████▊| 1189/1208 [33:14<00:31,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000459, train/loss_step=0.139, global_step=2108.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  98%|█████████▊| 1189/1208 [33:14<00:31,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000845, train/loss_step=0.233, global_step=2109.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  99%|█████████▊| 1190/1208 [33:15<00:30,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000845, train/loss_step=0.233, global_step=2109.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  99%|█████████▊| 1190/1208 [33:15<00:30,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.12e-5, train/loss_step=0.00192, global_step=2109.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  99%|█████████▊| 1191/1208 [33:16<00:28,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.12e-5, train/loss_step=0.00192, global_step=2109.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  99%|█████████▊| 1191/1208 [33:16<00:28,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.000992, train/loss_step=0.255, global_step=2109.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  99%|█████████▊| 1192/1208 [33:20<00:26,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.000992, train/loss_step=0.255, global_step=2109.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  99%|█████████▊| 1192/1208 [33:20<00:26,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=7.8e-5, train/loss_step=0.0194, global_step=2109.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  99%|█████████▉| 1193/1208 [33:21<00:25,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=7.8e-5, train/loss_step=0.0194, global_step=2109.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  99%|█████████▉| 1193/1208 [33:21<00:25,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00165, train/loss_step=0.312, global_step=2110.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6:  99%|█████████▉| 1194/1208 [33:22<00:23,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00165, train/loss_step=0.312, global_step=2110.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  99%|█████████▉| 1194/1208 [33:22<00:23,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0908, train/loss_vlb_step=0.0003, train/loss_step=0.0908, global_step=2110.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  99%|█████████▉| 1195/1208 [33:23<00:21,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0908, train/loss_vlb_step=0.0003, train/loss_step=0.0908, global_step=2110.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  99%|█████████▉| 1195/1208 [33:23<00:21,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=2110.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  99%|█████████▉| 1196/1208 [33:26<00:20,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=2110.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  99%|█████████▉| 1196/1208 [33:26<00:20,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.00018, train/loss_step=0.0508, global_step=2110.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  99%|█████████▉| 1197/1208 [33:27<00:18,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.00018, train/loss_step=0.0508, global_step=2110.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  99%|█████████▉| 1197/1208 [33:27<00:18,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00419, train/loss_step=0.409, global_step=2111.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6:  99%|█████████▉| 1198/1208 [33:28<00:16,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00419, train/loss_step=0.409, global_step=2111.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  99%|█████████▉| 1198/1208 [33:28<00:16,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000616, train/loss_step=0.177, global_step=2111.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  99%|█████████▉| 1199/1208 [33:29<00:15,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000616, train/loss_step=0.177, global_step=2111.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  99%|█████████▉| 1199/1208 [33:29<00:15,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00446, train/loss_vlb_step=2.49e-5, train/loss_step=0.00446, global_step=2111.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  99%|█████████▉| 1200/1208 [33:32<00:13,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00446, train/loss_vlb_step=2.49e-5, train/loss_step=0.00446, global_step=2111.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  99%|█████████▉| 1200/1208 [33:32<00:13,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=1.72e-5, train/loss_step=0.00308, global_step=2111.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] 
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.76it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.76it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.78it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.75it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.75it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.75it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.75it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 6:  99%|█████████▉| 1201/1208 [34:03<00:11,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=1.72e-5, train/loss_step=0.00308, global_step=2111.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6:  99%|█████████▉| 1201/1208 [34:03<00:11,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000671, train/loss_step=0.191, global_step=2112.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]  Epoch 6: 100%|█████████▉| 1202/1208 [34:04<00:10,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000671, train/loss_step=0.191, global_step=2112.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6: 100%|█████████▉| 1202/1208 [34:04<00:10,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.000275, train/loss_step=0.0817, global_step=2112.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6: 100%|█████████▉| 1203/1208 [34:05<00:08,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.000275, train/loss_step=0.0817, global_step=2112.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6: 100%|█████████▉| 1203/1208 [34:05<00:08,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00156, train/loss_step=0.368, global_step=2112.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6: 100%|█████████▉| 1204/1208 [34:08<00:06,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00156, train/loss_step=0.368, global_step=2112.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6: 100%|█████████▉| 1204/1208 [34:08<00:06,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.39e-5, train/loss_step=0.0127, global_step=2112.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6: 100%|█████████▉| 1205/1208 [34:09<00:05,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.39e-5, train/loss_step=0.0127, global_step=2112.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6: 100%|█████████▉| 1205/1208 [34:09<00:05,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.83e-5, train/loss_step=0.00324, global_step=2113.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6: 100%|█████████▉| 1206/1208 [34:10<00:03,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.83e-5, train/loss_step=0.00324, global_step=2113.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6: 100%|█████████▉| 1206/1208 [34:10<00:03,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00965, train/loss_vlb_step=4.7e-5, train/loss_step=0.00965, global_step=2113.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143] Epoch 6: 100%|█████████▉| 1207/1208 [34:11<00:01,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00965, train/loss_vlb_step=4.7e-5, train/loss_step=0.00965, global_step=2113.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6: 100%|█████████▉| 1207/1208 [34:11<00:01,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00203, train/loss_step=0.348, global_step=2113.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]   Epoch 6: 100%|██████████| 1208/1208 [34:16<00:00,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00203, train/loss_step=0.348, global_step=2113.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 6: 100%|██████████| 1208/1208 [34:16<00:00,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000587, train/loss_step=0.172, global_step=2113.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]
+
+
+Epoch 6:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.143, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000587, train/loss_step=0.172, global_step=2113.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]           Epoch 7:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.143, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000587, train/loss_step=0.172, global_step=2113.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.84it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.76it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.85it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.84it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.74it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:25,  1.85it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.84it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.85it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.77it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.84it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.83it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.84it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.83it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.83it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.84it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.84it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.84it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.84it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.84it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.84it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.83it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.84it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.84it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.84it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.84it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.78it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.78it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s][ADDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.83it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.83it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.83it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:14,  1.78it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.78it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.83it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.78it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.83it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.83it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.83it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.82it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.78it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.81it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.83it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:04,  1.72it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.70it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.73it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.78it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.75it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.77it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.78it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.78it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 7:   0%|          | 1/1208 [00:33<11:12:51, 33.45s/it, loss=0.143, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000587, train/loss_step=0.172, global_step=2113.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.143]Epoch 7:   0%|          | 1/1208 [00:33<11:12:53, 33.45s/it, loss=0.138, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.00047, train/loss_step=0.140, global_step=2114.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:   0%|          | 2/1208 [00:34<5:46:42, 17.25s/it, loss=0.138, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.00047, train/loss_step=0.140, global_step=2114.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:   0%|          | 2/1208 [00:34<5:46:43, 17.25s/it, loss=0.152, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00114, train/loss_step=0.268, global_step=2114.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   0%|          | 3/1208 [00:35<3:57:51, 11.84s/it, loss=0.152, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00114, train/loss_step=0.268, global_step=2114.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   0%|          | 3/1208 [00:35<3:57:51, 11.84s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0587, train/loss_vlb_step=0.000205, train/loss_step=0.0587, global_step=2114.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   0%|          | 4/1208 [00:38<3:13:58,  9.67s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0587, train/loss_vlb_step=0.000205, train/loss_step=0.0587, global_step=2114.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   0%|          | 4/1208 [00:38<3:13:59,  9.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00118, train/loss_step=0.256, global_step=2114.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:   0%|          | 5/1208 [00:39<2:39:16,  7.94s/it, loss=0.154, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00118, train/loss_step=0.256, global_step=2114.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   0%|          | 5/1208 [00:39<2:39:16,  7.94s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000146, train/loss_step=0.0405, global_step=2115.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   0%|          | 6/1208 [00:40<2:16:03,  6.79s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000146, train/loss_step=0.0405, global_step=2115.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   0%|          | 6/1208 [00:40<2:16:04,  6.79s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00941, train/loss_vlb_step=4.49e-5, train/loss_step=0.00941, global_step=2115.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   1%|          | 7/1208 [00:41<1:59:28,  5.97s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00941, train/loss_vlb_step=4.49e-5, train/loss_step=0.00941, global_step=2115.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   1%|          | 7/1208 [00:41<1:59:28,  5.97s/it, loss=0.146, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00138, train/loss_step=0.308, global_step=2115.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:   1%|          | 8/1208 [00:45<1:52:40,  5.63s/it, loss=0.146, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00138, train/loss_step=0.308, global_step=2115.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   1%|          | 8/1208 [00:45<1:52:40,  5.63s/it, loss=0.155, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000849, train/loss_step=0.233, global_step=2115.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   1%|          | 9/1208 [00:46<1:42:27,  5.13s/it, loss=0.155, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000849, train/loss_step=0.233, global_step=2115.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   1%|          | 9/1208 [00:46<1:42:27,  5.13s/it, loss=0.145, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000805, train/loss_step=0.217, global_step=2116.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   1%|          | 10/1208 [00:47<1:34:10,  4.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000805, train/loss_step=0.217, global_step=2116.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   1%|          | 10/1208 [00:47<1:34:10,  4.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.00101, train/loss_step=0.233, global_step=2116.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:   1%|          | 11/1208 [00:48<1:27:24,  4.38s/it, loss=0.148, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.00101, train/loss_step=0.233, global_step=2116.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   1%|          | 11/1208 [00:48<1:27:24,  4.38s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000145, train/loss_step=0.0402, global_step=2116.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   1%|          | 12/1208 [00:51<1:25:24,  4.29s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000145, train/loss_step=0.0402, global_step=2116.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   1%|          | 12/1208 [00:51<1:25:25,  4.29s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00367, train/loss_vlb_step=1.99e-5, train/loss_step=0.00367, global_step=2116.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   1%|          | 13/1208 [00:52<1:20:24,  4.04s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00367, train/loss_vlb_step=1.99e-5, train/loss_step=0.00367, global_step=2116.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   1%|          | 13/1208 [00:52<1:20:24,  4.04s/it, loss=0.168, v_num=0, train/loss_simple_step=0.559, train/loss_vlb_step=0.00994, train/loss_step=0.559, global_step=2117.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:   1%|          | 14/1208 [00:53<1:16:05,  3.82s/it, loss=0.168, v_num=0, train/loss_simple_step=0.559, train/loss_vlb_step=0.00994, train/loss_step=0.559, global_step=2117.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   1%|          | 14/1208 [00:53<1:16:05,  3.82s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.59e-5, train/loss_step=0.00273, global_step=2117.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   1%|          | 15/1208 [00:54<1:12:19,  3.64s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.59e-5, train/loss_step=0.00273, global_step=2117.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   1%|          | 15/1208 [00:54<1:12:19,  3.64s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0323, train/loss_vlb_step=0.000124, train/loss_step=0.0323, global_step=2117.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:   1%|▏         | 16/1208 [00:57<1:11:42,  3.61s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0323, train/loss_vlb_step=0.000124, train/loss_step=0.0323, global_step=2117.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   1%|▏         | 16/1208 [00:57<1:11:42,  3.61s/it, loss=0.148, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.57e-5, train/loss_step=0.021, global_step=2117.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:   1%|▏         | 17/1208 [00:58<1:08:39,  3.46s/it, loss=0.148, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.57e-5, train/loss_step=0.021, global_step=2117.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   1%|▏         | 17/1208 [00:58<1:08:39,  3.46s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0505, train/loss_vlb_step=0.000181, train/loss_step=0.0505, global_step=2118.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   1%|▏         | 18/1208 [00:59<1:05:55,  3.32s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0505, train/loss_vlb_step=0.000181, train/loss_step=0.0505, global_step=2118.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   1%|▏         | 18/1208 [00:59<1:05:55,  3.32s/it, loss=0.163, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.0012, train/loss_step=0.270, global_step=2118.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:   2%|▏         | 19/1208 [01:00<1:03:29,  3.20s/it, loss=0.163, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.0012, train/loss_step=0.270, global_step=2118.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   2%|▏         | 19/1208 [01:00<1:03:29,  3.20s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6.11e-5, train/loss_step=0.0135, global_step=2118.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   2%|▏         | 20/1208 [01:04<1:03:28,  3.21s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6.11e-5, train/loss_step=0.0135, global_step=2118.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   2%|▏         | 20/1208 [01:04<1:03:28,  3.21s/it, loss=0.157, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.00226, train/loss_step=0.382, global_step=2118.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:   2%|▏         | 21/1208 [01:05<1:01:24,  3.10s/it, loss=0.157, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.00226, train/loss_step=0.382, global_step=2118.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   2%|▏         | 21/1208 [01:05<1:01:24,  3.10s/it, loss=0.158, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000544, train/loss_step=0.160, global_step=2119.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   2%|▏         | 22/1208 [01:06<59:30,  3.01s/it, loss=0.158, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000544, train/loss_step=0.160, global_step=2119.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:   2%|▏         | 22/1208 [01:06<59:30,  3.01s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.96e-5, train/loss_step=0.0133, global_step=2119.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   2%|▏         | 23/1208 [01:07<57:45,  2.92s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.96e-5, train/loss_step=0.0133, global_step=2119.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   2%|▏         | 23/1208 [01:07<57:45,  2.92s/it, loss=0.151, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000611, train/loss_step=0.173, global_step=2119.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:   2%|▏         | 24/1208 [01:10<57:57,  2.94s/it, loss=0.151, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000611, train/loss_step=0.173, global_step=2119.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   2%|▏         | 24/1208 [01:10<57:57,  2.94s/it, loss=0.147, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000637, train/loss_step=0.185, global_step=2119.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   2%|▏         | 25/1208 [01:11<56:27,  2.86s/it, loss=0.147, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000637, train/loss_step=0.185, global_step=2119.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   2%|▏         | 25/1208 [01:11<56:27,  2.86s/it, loss=0.166, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.0026, train/loss_step=0.412, global_step=2120.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:   2%|▏         | 26/1208 [01:12<55:02,  2.79s/it, loss=0.166, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.0026, train/loss_step=0.412, global_step=2120.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   2%|▏         | 26/1208 [01:12<55:02,  2.79s/it, loss=0.171, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000386, train/loss_step=0.118, global_step=2120.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   2%|▏         | 27/1208 [01:13<53:42,  2.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000386, train/loss_step=0.118, global_step=2120.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   2%|▏         | 27/1208 [01:13<53:42,  2.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0765, train/loss_vlb_step=0.000261, train/loss_step=0.0765, global_step=2120.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   2%|▏         | 28/1208 [01:16<53:59,  2.75s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0765, train/loss_vlb_step=0.000261, train/loss_step=0.0765, global_step=2120.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   2%|▏         | 28/1208 [01:16<53:59,  2.75s/it, loss=0.18, v_num=0, train/loss_simple_step=0.634, train/loss_vlb_step=0.011, train/loss_step=0.634, global_step=2120.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]     Epoch 7:   2%|▏         | 29/1208 [01:17<52:48,  2.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.634, train/loss_vlb_step=0.011, train/loss_step=0.634, global_step=2120.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   2%|▏         | 29/1208 [01:17<52:48,  2.69s/it, loss=0.173, v_num=0, train/loss_simple_step=0.079, train/loss_vlb_step=0.000265, train/loss_step=0.079, global_step=2121.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   2%|▏         | 30/1208 [01:18<51:41,  2.63s/it, loss=0.173, v_num=0, train/loss_simple_step=0.079, train/loss_vlb_step=0.000265, train/loss_step=0.079, global_step=2121.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   2%|▏         | 30/1208 [01:18<51:41,  2.63s/it, loss=0.209, v_num=0, train/loss_simple_step=0.944, train/loss_vlb_step=0.475, train/loss_step=0.944, global_step=2121.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:   3%|▎         | 31/1208 [01:20<50:37,  2.58s/it, loss=0.209, v_num=0, train/loss_simple_step=0.944, train/loss_vlb_step=0.475, train/loss_step=0.944, global_step=2121.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   3%|▎         | 31/1208 [01:20<50:37,  2.58s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.29e-5, train/loss_step=0.0022, global_step=2121.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   3%|▎         | 32/1208 [01:23<50:58,  2.60s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.29e-5, train/loss_step=0.0022, global_step=2121.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   3%|▎         | 32/1208 [01:23<50:58,  2.60s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.8e-5, train/loss_step=0.0157, global_step=2121.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:   3%|▎         | 33/1208 [01:24<50:00,  2.55s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.8e-5, train/loss_step=0.0157, global_step=2121.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   3%|▎         | 33/1208 [01:24<50:00,  2.55s/it, loss=0.193, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00125, train/loss_step=0.266, global_step=2122.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:   3%|▎         | 34/1208 [01:25<49:05,  2.51s/it, loss=0.193, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00125, train/loss_step=0.266, global_step=2122.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   3%|▎         | 34/1208 [01:25<49:05,  2.51s/it, loss=0.22, v_num=0, train/loss_simple_step=0.546, train/loss_vlb_step=0.0123, train/loss_step=0.546, global_step=2122.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:   3%|▎         | 35/1208 [01:26<48:13,  2.47s/it, loss=0.22, v_num=0, train/loss_simple_step=0.546, train/loss_vlb_step=0.0123, train/loss_step=0.546, global_step=2122.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   3%|▎         | 35/1208 [01:26<48:13,  2.47s/it, loss=0.223, v_num=0, train/loss_simple_step=0.0893, train/loss_vlb_step=0.000295, train/loss_step=0.0893, global_step=2122.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   3%|▎         | 36/1208 [01:29<48:37,  2.49s/it, loss=0.223, v_num=0, train/loss_simple_step=0.0893, train/loss_vlb_step=0.000295, train/loss_step=0.0893, global_step=2122.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   3%|▎         | 36/1208 [01:29<48:37,  2.49s/it, loss=0.23, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000584, train/loss_step=0.171, global_step=2122.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:   3%|▎         | 37/1208 [01:30<47:49,  2.45s/it, loss=0.23, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000584, train/loss_step=0.171, global_step=2122.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   3%|▎         | 37/1208 [01:30<47:49,  2.45s/it, loss=0.229, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.45e-5, train/loss_step=0.0213, global_step=2123.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   3%|▎         | 38/1208 [01:31<47:03,  2.41s/it, loss=0.229, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.45e-5, train/loss_step=0.0213, global_step=2123.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   3%|▎         | 38/1208 [01:31<47:03,  2.41s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.00013, train/loss_step=0.0349, global_step=2123.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   3%|▎         | 39/1208 [01:32<46:19,  2.38s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.00013, train/loss_step=0.0349, global_step=2123.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   3%|▎         | 39/1208 [01:32<46:19,  2.38s/it, loss=0.227, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000771, train/loss_step=0.211, global_step=2123.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:   3%|▎         | 40/1208 [01:35<46:42,  2.40s/it, loss=0.227, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000771, train/loss_step=0.211, global_step=2123.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   3%|▎         | 40/1208 [01:35<46:42,  2.40s/it, loss=0.218, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000891, train/loss_step=0.210, global_step=2123.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   3%|▎         | 41/1208 [01:37<46:02,  2.37s/it, loss=0.218, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000891, train/loss_step=0.210, global_step=2123.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   3%|▎         | 41/1208 [01:37<46:02,  2.37s/it, loss=0.217, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000459, train/loss_step=0.139, global_step=2124.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   3%|▎         | 42/1208 [01:38<45:23,  2.34s/it, loss=0.217, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000459, train/loss_step=0.139, global_step=2124.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   3%|▎         | 42/1208 [01:38<45:23,  2.34s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.01e-5, train/loss_step=0.0136, global_step=2124.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   4%|▎         | 43/1208 [01:39<44:46,  2.31s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.01e-5, train/loss_step=0.0136, global_step=2124.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   4%|▎         | 43/1208 [01:39<44:46,  2.31s/it, loss=0.213, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000329, train/loss_step=0.100, global_step=2124.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:   4%|▎         | 44/1208 [01:42<45:08,  2.33s/it, loss=0.213, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000329, train/loss_step=0.100, global_step=2124.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   4%|▎         | 44/1208 [01:42<45:08,  2.33s/it, loss=0.204, v_num=0, train/loss_simple_step=0.00458, train/loss_vlb_step=2.44e-5, train/loss_step=0.00458, global_step=2124.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   4%|▎         | 45/1208 [01:43<44:32,  2.30s/it, loss=0.204, v_num=0, train/loss_simple_step=0.00458, train/loss_vlb_step=2.44e-5, train/loss_step=0.00458, global_step=2124.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   4%|▎         | 45/1208 [01:43<44:32,  2.30s/it, loss=0.19, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000398, train/loss_step=0.121, global_step=2125.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:   4%|▍         | 46/1208 [01:44<43:58,  2.27s/it, loss=0.19, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000398, train/loss_step=0.121, global_step=2125.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   4%|▍         | 46/1208 [01:44<43:58,  2.27s/it, loss=0.19, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=2125.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   4%|▍         | 47/1208 [01:45<43:25,  2.24s/it, loss=0.19, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=2125.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   4%|▍         | 47/1208 [01:45<43:25,  2.24s/it, loss=0.196, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000683, train/loss_step=0.195, global_step=2125.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   4%|▍         | 48/1208 [01:48<43:49,  2.27s/it, loss=0.196, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000683, train/loss_step=0.195, global_step=2125.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   4%|▍         | 48/1208 [01:48<43:49,  2.27s/it, loss=0.175, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000789, train/loss_step=0.222, global_step=2125.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   4%|▍         | 49/1208 [01:49<43:19,  2.24s/it, loss=0.175, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000789, train/loss_step=0.222, global_step=2125.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   4%|▍         | 49/1208 [01:49<43:19,  2.24s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00699, train/loss_vlb_step=3.57e-5, train/loss_step=0.00699, global_step=2126.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   4%|▍         | 50/1208 [01:50<42:49,  2.22s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00699, train/loss_vlb_step=3.57e-5, train/loss_step=0.00699, global_step=2126.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   4%|▍         | 50/1208 [01:50<42:49,  2.22s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=6.08e-5, train/loss_step=0.0131, global_step=2126.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:   4%|▍         | 51/1208 [01:51<42:19,  2.20s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=6.08e-5, train/loss_step=0.0131, global_step=2126.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   4%|▍         | 51/1208 [01:51<42:19,  2.20s/it, loss=0.138, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00116, train/loss_step=0.269, global_step=2126.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:   4%|▍         | 52/1208 [01:55<42:41,  2.22s/it, loss=0.138, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00116, train/loss_step=0.269, global_step=2126.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   4%|▍         | 52/1208 [01:55<42:41,  2.22s/it, loss=0.154, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00198, train/loss_step=0.325, global_step=2126.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   4%|▍         | 53/1208 [01:56<42:14,  2.19s/it, loss=0.154, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00198, train/loss_step=0.325, global_step=2126.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   4%|▍         | 53/1208 [01:56<42:14,  2.19s/it, loss=0.179, v_num=0, train/loss_simple_step=0.761, train/loss_vlb_step=0.0558, train/loss_step=0.761, global_step=2127.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:   4%|▍         | 54/1208 [01:57<41:47,  2.17s/it, loss=0.179, v_num=0, train/loss_simple_step=0.761, train/loss_vlb_step=0.0558, train/loss_step=0.761, global_step=2127.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   4%|▍         | 54/1208 [01:57<41:47,  2.17s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0027, train/loss_vlb_step=1.53e-5, train/loss_step=0.0027, global_step=2127.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   5%|▍         | 55/1208 [01:58<41:21,  2.15s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0027, train/loss_vlb_step=1.53e-5, train/loss_step=0.0027, global_step=2127.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   5%|▍         | 55/1208 [01:58<41:21,  2.15s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000109, train/loss_step=0.0284, global_step=2127.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   5%|▍         | 56/1208 [02:01<41:39,  2.17s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000109, train/loss_step=0.0284, global_step=2127.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   5%|▍         | 56/1208 [02:01<41:39,  2.17s/it, loss=0.146, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000404, train/loss_step=0.122, global_step=2127.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:   5%|▍         | 57/1208 [02:02<41:15,  2.15s/it, loss=0.146, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000404, train/loss_step=0.122, global_step=2127.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   5%|▍         | 57/1208 [02:02<41:15,  2.15s/it, loss=0.159, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00126, train/loss_step=0.282, global_step=2128.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:   5%|▍         | 58/1208 [02:03<40:51,  2.13s/it, loss=0.159, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00126, train/loss_step=0.282, global_step=2128.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   5%|▍         | 58/1208 [02:03<40:51,  2.13s/it, loss=0.158, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.88e-5, train/loss_step=0.011, global_step=2128.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   5%|▍         | 59/1208 [02:04<40:27,  2.11s/it, loss=0.158, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.88e-5, train/loss_step=0.011, global_step=2128.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   5%|▍         | 59/1208 [02:04<40:27,  2.11s/it, loss=0.182, v_num=0, train/loss_simple_step=0.702, train/loss_vlb_step=0.0164, train/loss_step=0.702, global_step=2128.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:   5%|▍         | 60/1208 [02:07<40:45,  2.13s/it, loss=0.182, v_num=0, train/loss_simple_step=0.702, train/loss_vlb_step=0.0164, train/loss_step=0.702, global_step=2128.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   5%|▍         | 60/1208 [02:07<40:45,  2.13s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0687, train/loss_vlb_step=0.000234, train/loss_step=0.0687, global_step=2128.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   5%|▌         | 61/1208 [02:08<40:23,  2.11s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0687, train/loss_vlb_step=0.000234, train/loss_step=0.0687, global_step=2128.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   5%|▌         | 61/1208 [02:08<40:23,  2.11s/it, loss=0.174, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000361, train/loss_step=0.109, global_step=2129.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:   5%|▌         | 62/1208 [02:09<40:01,  2.10s/it, loss=0.174, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000361, train/loss_step=0.109, global_step=2129.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   5%|▌         | 62/1208 [02:09<40:01,  2.10s/it, loss=0.178, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=2129.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   5%|▌         | 63/1208 [02:10<39:39,  2.08s/it, loss=0.178, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=2129.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   5%|▌         | 63/1208 [02:10<39:39,  2.08s/it, loss=0.197, v_num=0, train/loss_simple_step=0.480, train/loss_vlb_step=0.00578, train/loss_step=0.480, global_step=2129.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:   5%|▌         | 64/1208 [02:14<39:59,  2.10s/it, loss=0.197, v_num=0, train/loss_simple_step=0.480, train/loss_vlb_step=0.00578, train/loss_step=0.480, global_step=2129.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   5%|▌         | 64/1208 [02:14<39:59,  2.10s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0762, train/loss_vlb_step=0.000253, train/loss_step=0.0762, global_step=2129.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   5%|▌         | 65/1208 [02:15<39:38,  2.08s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0762, train/loss_vlb_step=0.000253, train/loss_step=0.0762, global_step=2129.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   5%|▌         | 65/1208 [02:15<39:39,  2.08s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0938, train/loss_vlb_step=0.000309, train/loss_step=0.0938, global_step=2130.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:   5%|▌         | 66/1208 [02:16<39:18,  2.07s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0938, train/loss_vlb_step=0.000309, train/loss_step=0.0938, global_step=2130.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   5%|▌         | 66/1208 [02:16<39:18,  2.07s/it, loss=0.212, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00248, train/loss_step=0.363, global_step=2130.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:   6%|▌         | 67/1208 [02:17<38:59,  2.05s/it, loss=0.212, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00248, train/loss_step=0.363, global_step=2130.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   6%|▌         | 67/1208 [02:17<38:59,  2.05s/it, loss=0.215, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.0013, train/loss_step=0.249, global_step=2130.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:   6%|▌         | 68/1208 [02:20<39:17,  2.07s/it, loss=0.215, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.0013, train/loss_step=0.249, global_step=2130.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   6%|▌         | 68/1208 [02:20<39:17,  2.07s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000142, train/loss_step=0.0412, global_step=2130.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   6%|▌         | 69/1208 [02:21<38:58,  2.05s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000142, train/loss_step=0.0412, global_step=2130.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   6%|▌         | 69/1208 [02:21<38:58,  2.05s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000107, train/loss_step=0.0265, global_step=2131.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   6%|▌         | 70/1208 [02:22<38:40,  2.04s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000107, train/loss_step=0.0265, global_step=2131.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   6%|▌         | 70/1208 [02:22<38:40,  2.04s/it, loss=0.227, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00312, train/loss_step=0.415, global_step=2131.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:   6%|▌         | 71/1208 [02:23<38:22,  2.02s/it, loss=0.227, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00312, train/loss_step=0.415, global_step=2131.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   6%|▌         | 71/1208 [02:23<38:22,  2.02s/it, loss=0.214, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.42e-5, train/loss_step=0.0146, global_step=2131.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   6%|▌         | 72/1208 [02:26<38:34,  2.04s/it, loss=0.214, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.42e-5, train/loss_step=0.0146, global_step=2131.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   6%|▌         | 72/1208 [02:26<38:34,  2.04s/it, loss=0.216, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00228, train/loss_step=0.359, global_step=2131.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:   6%|▌         | 73/1208 [02:27<38:16,  2.02s/it, loss=0.216, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00228, train/loss_step=0.359, global_step=2131.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   6%|▌         | 73/1208 [02:27<38:16,  2.02s/it, loss=0.195, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00175, train/loss_step=0.344, global_step=2132.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   6%|▌         | 74/1208 [02:28<37:58,  2.01s/it, loss=0.195, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00175, train/loss_step=0.344, global_step=2132.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   6%|▌         | 74/1208 [02:28<37:58,  2.01s/it, loss=0.196, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.46e-5, train/loss_step=0.020, global_step=2132.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   6%|▌         | 75/1208 [02:29<37:41,  2.00s/it, loss=0.196, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.46e-5, train/loss_step=0.020, global_step=2132.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   6%|▌         | 75/1208 [02:29<37:41,  2.00s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.06e-5, train/loss_step=0.0111, global_step=2132.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   6%|▋         | 76/1208 [02:32<37:52,  2.01s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.06e-5, train/loss_step=0.0111, global_step=2132.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   6%|▋         | 76/1208 [02:32<37:52,  2.01s/it, loss=0.195, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000417, train/loss_step=0.126, global_step=2132.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:   6%|▋         | 77/1208 [02:33<37:36,  1.99s/it, loss=0.195, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000417, train/loss_step=0.126, global_step=2132.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   6%|▋         | 77/1208 [02:33<37:36,  1.99s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000113, train/loss_step=0.0291, global_step=2133.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   6%|▋         | 78/1208 [02:34<37:19,  1.98s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000113, train/loss_step=0.0291, global_step=2133.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   6%|▋         | 78/1208 [02:34<37:20,  1.98s/it, loss=0.198, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00188, train/loss_step=0.328, global_step=2133.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:   7%|▋         | 79/1208 [02:35<37:04,  1.97s/it, loss=0.198, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00188, train/loss_step=0.328, global_step=2133.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   7%|▋         | 79/1208 [02:35<37:04,  1.97s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00849, train/loss_vlb_step=4.18e-5, train/loss_step=0.00849, global_step=2133.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   7%|▋         | 80/1208 [02:38<37:14,  1.98s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00849, train/loss_vlb_step=4.18e-5, train/loss_step=0.00849, global_step=2133.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   7%|▋         | 80/1208 [02:38<37:14,  1.98s/it, loss=0.183, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00468, train/loss_step=0.457, global_step=2133.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:   7%|▋         | 81/1208 [02:39<36:59,  1.97s/it, loss=0.183, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00468, train/loss_step=0.457, global_step=2133.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   7%|▋         | 81/1208 [02:39<36:59,  1.97s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0785, train/loss_vlb_step=0.00026, train/loss_step=0.0785, global_step=2134.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   7%|▋         | 82/1208 [02:40<36:44,  1.96s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0785, train/loss_vlb_step=0.00026, train/loss_step=0.0785, global_step=2134.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   7%|▋         | 82/1208 [02:40<36:44,  1.96s/it, loss=0.185, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000678, train/loss_step=0.187, global_step=2134.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:   7%|▋         | 83/1208 [02:41<36:29,  1.95s/it, loss=0.185, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000678, train/loss_step=0.187, global_step=2134.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   7%|▋         | 83/1208 [02:41<36:29,  1.95s/it, loss=0.17, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000661, train/loss_step=0.172, global_step=2134.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:   7%|▋         | 84/1208 [02:44<36:39,  1.96s/it, loss=0.17, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000661, train/loss_step=0.172, global_step=2134.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   7%|▋         | 84/1208 [02:44<36:39,  1.96s/it, loss=0.195, v_num=0, train/loss_simple_step=0.582, train/loss_vlb_step=0.0107, train/loss_step=0.582, global_step=2134.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:   7%|▋         | 85/1208 [02:45<36:25,  1.95s/it, loss=0.195, v_num=0, train/loss_simple_step=0.582, train/loss_vlb_step=0.0107, train/loss_step=0.582, global_step=2134.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   7%|▋         | 85/1208 [02:45<36:25,  1.95s/it, loss=0.203, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.000947, train/loss_step=0.255, global_step=2135.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   7%|▋         | 86/1208 [02:46<36:11,  1.94s/it, loss=0.203, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.000947, train/loss_step=0.255, global_step=2135.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   7%|▋         | 86/1208 [02:46<36:11,  1.94s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.55e-5, train/loss_step=0.00475, global_step=2135.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   7%|▋         | 87/1208 [02:47<35:57,  1.92s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.55e-5, train/loss_step=0.00475, global_step=2135.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   7%|▋         | 87/1208 [02:47<35:57,  1.92s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0723, train/loss_vlb_step=0.000251, train/loss_step=0.0723, global_step=2135.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:   7%|▋         | 88/1208 [02:50<36:07,  1.94s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0723, train/loss_vlb_step=0.000251, train/loss_step=0.0723, global_step=2135.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   7%|▋         | 88/1208 [02:50<36:07,  1.94s/it, loss=0.182, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.00048, train/loss_step=0.146, global_step=2135.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:   7%|▋         | 89/1208 [02:51<35:54,  1.93s/it, loss=0.182, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.00048, train/loss_step=0.146, global_step=2135.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   7%|▋         | 89/1208 [02:51<35:54,  1.93s/it, loss=0.191, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000821, train/loss_step=0.215, global_step=2136.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   7%|▋         | 90/1208 [02:52<35:40,  1.91s/it, loss=0.191, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000821, train/loss_step=0.215, global_step=2136.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   7%|▋         | 90/1208 [02:52<35:40,  1.92s/it, loss=0.189, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00239, train/loss_step=0.368, global_step=2136.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:   8%|▊         | 91/1208 [02:53<35:27,  1.91s/it, loss=0.189, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00239, train/loss_step=0.368, global_step=2136.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   8%|▊         | 91/1208 [02:53<35:27,  1.91s/it, loss=0.2, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000851, train/loss_step=0.228, global_step=2136.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:   8%|▊         | 92/1208 [02:56<35:37,  1.92s/it, loss=0.2, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000851, train/loss_step=0.228, global_step=2136.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   8%|▊         | 92/1208 [02:56<35:37,  1.92s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.000123, train/loss_step=0.0312, global_step=2136.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   8%|▊         | 93/1208 [02:57<35:25,  1.91s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.000123, train/loss_step=0.0312, global_step=2136.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   8%|▊         | 93/1208 [02:57<35:25,  1.91s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00645, train/loss_vlb_step=3.28e-5, train/loss_step=0.00645, global_step=2137.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   8%|▊         | 94/1208 [02:58<35:12,  1.90s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00645, train/loss_vlb_step=3.28e-5, train/loss_step=0.00645, global_step=2137.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   8%|▊         | 94/1208 [02:58<35:12,  1.90s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=8.25e-5, train/loss_step=0.0188, global_step=2137.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:   8%|▊         | 95/1208 [02:59<35:00,  1.89s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=8.25e-5, train/loss_step=0.0188, global_step=2137.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   8%|▊         | 95/1208 [02:59<35:00,  1.89s/it, loss=0.193, v_num=0, train/loss_simple_step=0.554, train/loss_vlb_step=0.0116, train/loss_step=0.554, global_step=2137.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:   8%|▊         | 96/1208 [03:02<35:10,  1.90s/it, loss=0.193, v_num=0, train/loss_simple_step=0.554, train/loss_vlb_step=0.0116, train/loss_step=0.554, global_step=2137.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   8%|▊         | 96/1208 [03:02<35:10,  1.90s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0504, train/loss_vlb_step=0.00018, train/loss_step=0.0504, global_step=2137.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   8%|▊         | 97/1208 [03:03<34:58,  1.89s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0504, train/loss_vlb_step=0.00018, train/loss_step=0.0504, global_step=2137.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   8%|▊         | 97/1208 [03:03<34:58,  1.89s/it, loss=0.211, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00326, train/loss_step=0.457, global_step=2138.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:   8%|▊         | 98/1208 [03:04<34:46,  1.88s/it, loss=0.211, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00326, train/loss_step=0.457, global_step=2138.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   8%|▊         | 98/1208 [03:04<34:46,  1.88s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.65e-5, train/loss_step=0.0121, global_step=2138.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   8%|▊         | 99/1208 [03:05<34:34,  1.87s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.65e-5, train/loss_step=0.0121, global_step=2138.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   8%|▊         | 99/1208 [03:05<34:34,  1.87s/it, loss=0.203, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.00056, train/loss_step=0.167, global_step=2138.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:   8%|▊         | 100/1208 [03:08<34:43,  1.88s/it, loss=0.203, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.00056, train/loss_step=0.167, global_step=2138.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   8%|▊         | 100/1208 [03:08<34:43,  1.88s/it, loss=0.181, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.35e-5, train/loss_step=0.020, global_step=2138.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   8%|▊         | 101/1208 [03:09<34:32,  1.87s/it, loss=0.181, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.35e-5, train/loss_step=0.020, global_step=2138.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   8%|▊         | 101/1208 [03:09<34:32,  1.87s/it, loss=0.184, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000472, train/loss_step=0.142, global_step=2139.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   8%|▊         | 102/1208 [03:10<34:21,  1.86s/it, loss=0.184, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000472, train/loss_step=0.142, global_step=2139.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   8%|▊         | 102/1208 [03:10<34:21,  1.86s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=1.25e-5, train/loss_step=0.00214, global_step=2139.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   9%|▊         | 103/1208 [03:11<34:10,  1.86s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=1.25e-5, train/loss_step=0.00214, global_step=2139.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   9%|▊         | 103/1208 [03:11<34:10,  1.86s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00679, train/loss_vlb_step=3.48e-5, train/loss_step=0.00679, global_step=2139.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   9%|▊         | 104/1208 [03:13<34:19,  1.87s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00679, train/loss_vlb_step=3.48e-5, train/loss_step=0.00679, global_step=2139.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   9%|▊         | 104/1208 [03:13<34:19,  1.87s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000127, train/loss_step=0.0334, global_step=2139.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:   9%|▊         | 105/1208 [03:14<34:08,  1.86s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000127, train/loss_step=0.0334, global_step=2139.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   9%|▊         | 105/1208 [03:14<34:08,  1.86s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.35e-5, train/loss_step=0.00233, global_step=2140.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   9%|▉         | 106/1208 [03:15<33:57,  1.85s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.35e-5, train/loss_step=0.00233, global_step=2140.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   9%|▉         | 106/1208 [03:15<33:57,  1.85s/it, loss=0.132, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000357, train/loss_step=0.107, global_step=2140.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:   9%|▉         | 107/1208 [03:16<33:46,  1.84s/it, loss=0.132, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000357, train/loss_step=0.107, global_step=2140.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   9%|▉         | 107/1208 [03:16<33:47,  1.84s/it, loss=0.157, v_num=0, train/loss_simple_step=0.571, train/loss_vlb_step=0.00621, train/loss_step=0.571, global_step=2140.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:   9%|▉         | 108/1208 [03:19<33:55,  1.85s/it, loss=0.157, v_num=0, train/loss_simple_step=0.571, train/loss_vlb_step=0.00621, train/loss_step=0.571, global_step=2140.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   9%|▉         | 108/1208 [03:19<33:55,  1.85s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.65e-5, train/loss_step=0.0206, global_step=2140.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   9%|▉         | 109/1208 [03:20<33:45,  1.84s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.65e-5, train/loss_step=0.0206, global_step=2140.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   9%|▉         | 109/1208 [03:20<33:45,  1.84s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0863, train/loss_vlb_step=0.000285, train/loss_step=0.0863, global_step=2141.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   9%|▉         | 110/1208 [03:21<33:35,  1.84s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0863, train/loss_vlb_step=0.000285, train/loss_step=0.0863, global_step=2141.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   9%|▉         | 110/1208 [03:21<33:35,  1.84s/it, loss=0.134, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000556, train/loss_step=0.164, global_step=2141.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:   9%|▉         | 111/1208 [03:22<33:25,  1.83s/it, loss=0.134, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000556, train/loss_step=0.164, global_step=2141.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   9%|▉         | 111/1208 [03:22<33:25,  1.83s/it, loss=0.15, v_num=0, train/loss_simple_step=0.550, train/loss_vlb_step=0.0111, train/loss_step=0.550, global_step=2141.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:   9%|▉         | 112/1208 [03:25<33:33,  1.84s/it, loss=0.15, v_num=0, train/loss_simple_step=0.550, train/loss_vlb_step=0.0111, train/loss_step=0.550, global_step=2141.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   9%|▉         | 112/1208 [03:25<33:33,  1.84s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.99e-5, train/loss_step=0.0155, global_step=2141.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   9%|▉         | 113/1208 [03:26<33:24,  1.83s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.99e-5, train/loss_step=0.0155, global_step=2141.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   9%|▉         | 113/1208 [03:26<33:24,  1.83s/it, loss=0.164, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00137, train/loss_step=0.290, global_step=2142.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:   9%|▉         | 114/1208 [03:27<33:14,  1.82s/it, loss=0.164, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00137, train/loss_step=0.290, global_step=2142.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:   9%|▉         | 114/1208 [03:27<33:14,  1.82s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0497, train/loss_vlb_step=0.000182, train/loss_step=0.0497, global_step=2142.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  10%|▉         | 115/1208 [03:28<33:04,  1.82s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0497, train/loss_vlb_step=0.000182, train/loss_step=0.0497, global_step=2142.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  10%|▉         | 115/1208 [03:28<33:04,  1.82s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0703, train/loss_vlb_step=0.000231, train/loss_step=0.0703, global_step=2142.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  10%|▉         | 116/1208 [03:31<33:12,  1.83s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0703, train/loss_vlb_step=0.000231, train/loss_step=0.0703, global_step=2142.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  10%|▉         | 116/1208 [03:31<33:12,  1.83s/it, loss=0.174, v_num=0, train/loss_simple_step=0.713, train/loss_vlb_step=0.0458, train/loss_step=0.713, global_step=2142.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  10%|▉         | 117/1208 [03:32<33:03,  1.82s/it, loss=0.174, v_num=0, train/loss_simple_step=0.713, train/loss_vlb_step=0.0458, train/loss_step=0.713, global_step=2142.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  10%|▉         | 117/1208 [03:32<33:03,  1.82s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0726, train/loss_vlb_step=0.000241, train/loss_step=0.0726, global_step=2143.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  10%|▉         | 118/1208 [03:33<32:54,  1.81s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0726, train/loss_vlb_step=0.000241, train/loss_step=0.0726, global_step=2143.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  10%|▉         | 118/1208 [03:33<32:54,  1.81s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.47e-5, train/loss_step=0.0147, global_step=2143.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  10%|▉         | 119/1208 [03:34<32:45,  1.80s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.47e-5, train/loss_step=0.0147, global_step=2143.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  10%|▉         | 119/1208 [03:34<32:45,  1.80s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.77e-5, train/loss_step=0.0146, global_step=2143.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  10%|▉         | 120/1208 [03:37<32:53,  1.81s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.77e-5, train/loss_step=0.0146, global_step=2143.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  10%|▉         | 120/1208 [03:37<32:53,  1.81s/it, loss=0.161, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00166, train/loss_step=0.290, global_step=2143.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  10%|█         | 121/1208 [03:38<32:44,  1.81s/it, loss=0.161, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00166, train/loss_step=0.290, global_step=2143.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  10%|█         | 121/1208 [03:38<32:44,  1.81s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00353, train/loss_vlb_step=1.96e-5, train/loss_step=0.00353, global_step=2144.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  10%|█         | 122/1208 [03:39<32:35,  1.80s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00353, train/loss_vlb_step=1.96e-5, train/loss_step=0.00353, global_step=2144.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  10%|█         | 122/1208 [03:39<32:35,  1.80s/it, loss=0.166, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000935, train/loss_step=0.244, global_step=2144.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  10%|█         | 123/1208 [03:40<32:26,  1.79s/it, loss=0.166, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000935, train/loss_step=0.244, global_step=2144.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  10%|█         | 123/1208 [03:40<32:26,  1.79s/it, loss=0.176, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000847, train/loss_step=0.217, global_step=2144.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  10%|█         | 124/1208 [03:43<32:34,  1.80s/it, loss=0.176, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000847, train/loss_step=0.217, global_step=2144.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  10%|█         | 124/1208 [03:43<32:34,  1.80s/it, loss=0.181, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=2144.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  10%|█         | 125/1208 [03:44<32:25,  1.80s/it, loss=0.181, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=2144.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  10%|█         | 125/1208 [03:44<32:25,  1.80s/it, loss=0.201, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00303, train/loss_step=0.397, global_step=2145.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  10%|█         | 126/1208 [03:45<32:17,  1.79s/it, loss=0.201, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00303, train/loss_step=0.397, global_step=2145.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  10%|█         | 126/1208 [03:45<32:17,  1.79s/it, loss=0.214, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00266, train/loss_step=0.373, global_step=2145.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  11%|█         | 127/1208 [03:46<32:08,  1.78s/it, loss=0.214, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00266, train/loss_step=0.373, global_step=2145.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  11%|█         | 127/1208 [03:46<32:08,  1.78s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0913, train/loss_vlb_step=0.000303, train/loss_step=0.0913, global_step=2145.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  11%|█         | 128/1208 [03:49<32:16,  1.79s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0913, train/loss_vlb_step=0.000303, train/loss_step=0.0913, global_step=2145.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  11%|█         | 128/1208 [03:49<32:16,  1.79s/it, loss=0.202, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00127, train/loss_step=0.267, global_step=2145.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  11%|█         | 129/1208 [03:50<32:08,  1.79s/it, loss=0.202, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00127, train/loss_step=0.267, global_step=2145.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  11%|█         | 129/1208 [03:50<32:08,  1.79s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00522, train/loss_vlb_step=2.8e-5, train/loss_step=0.00522, global_step=2146.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  11%|█         | 130/1208 [03:51<31:59,  1.78s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00522, train/loss_vlb_step=2.8e-5, train/loss_step=0.00522, global_step=2146.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  11%|█         | 130/1208 [03:51<31:59,  1.78s/it, loss=0.19, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.22e-5, train/loss_step=0.00207, global_step=2146.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  11%|█         | 131/1208 [03:52<31:51,  1.78s/it, loss=0.19, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.22e-5, train/loss_step=0.00207, global_step=2146.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  11%|█         | 131/1208 [03:52<31:51,  1.78s/it, loss=0.181, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00229, train/loss_step=0.361, global_step=2146.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  11%|█         | 132/1208 [03:55<31:59,  1.78s/it, loss=0.181, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00229, train/loss_step=0.361, global_step=2146.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  11%|█         | 132/1208 [03:55<31:59,  1.78s/it, loss=0.196, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00153, train/loss_step=0.321, global_step=2146.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  11%|█         | 133/1208 [03:56<31:51,  1.78s/it, loss=0.196, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00153, train/loss_step=0.321, global_step=2146.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  11%|█         | 133/1208 [03:56<31:51,  1.78s/it, loss=0.187, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000334, train/loss_step=0.101, global_step=2147.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  11%|█         | 134/1208 [03:57<31:43,  1.77s/it, loss=0.187, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000334, train/loss_step=0.101, global_step=2147.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  11%|█         | 134/1208 [03:57<31:43,  1.77s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.35e-5, train/loss_step=0.0155, global_step=2147.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  11%|█         | 135/1208 [03:58<31:35,  1.77s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.35e-5, train/loss_step=0.0155, global_step=2147.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  11%|█         | 135/1208 [03:58<31:35,  1.77s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=8.02e-5, train/loss_step=0.0185, global_step=2147.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  11%|█▏        | 136/1208 [04:01<31:42,  1.77s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=8.02e-5, train/loss_step=0.0185, global_step=2147.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  11%|█▏        | 136/1208 [04:01<31:42,  1.77s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=9.52e-5, train/loss_step=0.0248, global_step=2147.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  11%|█▏        | 137/1208 [04:02<31:34,  1.77s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=9.52e-5, train/loss_step=0.0248, global_step=2147.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  11%|█▏        | 137/1208 [04:02<31:34,  1.77s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0533, train/loss_vlb_step=0.000191, train/loss_step=0.0533, global_step=2148.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  11%|█▏        | 138/1208 [04:03<31:27,  1.76s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0533, train/loss_vlb_step=0.000191, train/loss_step=0.0533, global_step=2148.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  11%|█▏        | 138/1208 [04:03<31:27,  1.76s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0935, train/loss_vlb_step=0.000309, train/loss_step=0.0935, global_step=2148.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  12%|█▏        | 139/1208 [04:04<31:19,  1.76s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0935, train/loss_vlb_step=0.000309, train/loss_step=0.0935, global_step=2148.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  12%|█▏        | 139/1208 [04:04<31:19,  1.76s/it, loss=0.157, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.00043, train/loss_step=0.126, global_step=2148.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  12%|█▏        | 140/1208 [04:07<31:26,  1.77s/it, loss=0.157, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.00043, train/loss_step=0.126, global_step=2148.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  12%|█▏        | 140/1208 [04:07<31:26,  1.77s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.13e-5, train/loss_step=0.00191, global_step=2148.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  12%|█▏        | 141/1208 [04:08<31:18,  1.76s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.13e-5, train/loss_step=0.00191, global_step=2148.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  12%|█▏        | 141/1208 [04:08<31:18,  1.76s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.18e-5, train/loss_step=0.00394, global_step=2149.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  12%|█▏        | 142/1208 [04:09<31:11,  1.76s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.18e-5, train/loss_step=0.00394, global_step=2149.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  12%|█▏        | 142/1208 [04:09<31:11,  1.76s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00666, train/loss_vlb_step=3.48e-5, train/loss_step=0.00666, global_step=2149.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  12%|█▏        | 143/1208 [04:10<31:04,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00666, train/loss_vlb_step=3.48e-5, train/loss_step=0.00666, global_step=2149.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  12%|█▏        | 143/1208 [04:10<31:04,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00412, train/loss_step=0.408, global_step=2149.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  12%|█▏        | 144/1208 [04:13<31:10,  1.76s/it, loss=0.14, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00412, train/loss_step=0.408, global_step=2149.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  12%|█▏        | 144/1208 [04:13<31:10,  1.76s/it, loss=0.155, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00392, train/loss_step=0.436, global_step=2149.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  12%|█▏        | 145/1208 [04:14<31:03,  1.75s/it, loss=0.155, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00392, train/loss_step=0.436, global_step=2149.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  12%|█▏        | 145/1208 [04:14<31:03,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0936, train/loss_vlb_step=0.000311, train/loss_step=0.0936, global_step=2150.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  12%|█▏        | 146/1208 [04:15<30:56,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0936, train/loss_vlb_step=0.000311, train/loss_step=0.0936, global_step=2150.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  12%|█▏        | 146/1208 [04:15<30:56,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00852, train/loss_vlb_step=4.19e-5, train/loss_step=0.00852, global_step=2150.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  12%|█▏        | 147/1208 [04:16<30:49,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00852, train/loss_vlb_step=4.19e-5, train/loss_step=0.00852, global_step=2150.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  12%|█▏        | 147/1208 [04:16<30:49,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000153, train/loss_step=0.0407, global_step=2150.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  12%|█▏        | 148/1208 [04:19<30:55,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000153, train/loss_step=0.0407, global_step=2150.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  12%|█▏        | 148/1208 [04:19<30:55,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000449, train/loss_step=0.133, global_step=2150.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  12%|█▏        | 149/1208 [04:20<30:48,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000449, train/loss_step=0.133, global_step=2150.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  12%|█▏        | 149/1208 [04:20<30:48,  1.75s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0385, train/loss_vlb_step=0.000144, train/loss_step=0.0385, global_step=2151.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  12%|█▏        | 150/1208 [04:21<30:41,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0385, train/loss_vlb_step=0.000144, train/loss_step=0.0385, global_step=2151.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  12%|█▏        | 150/1208 [04:21<30:41,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000556, train/loss_step=0.162, global_step=2151.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  12%|█▎        | 151/1208 [04:22<30:34,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000556, train/loss_step=0.162, global_step=2151.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  12%|█▎        | 151/1208 [04:22<30:34,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.077, train/loss_vlb_step=0.000256, train/loss_step=0.077, global_step=2151.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  13%|█▎        | 152/1208 [04:25<30:41,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.077, train/loss_vlb_step=0.000256, train/loss_step=0.077, global_step=2151.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  13%|█▎        | 152/1208 [04:25<30:41,  1.74s/it, loss=0.0959, v_num=0, train/loss_simple_step=0.0743, train/loss_vlb_step=0.000255, train/loss_step=0.0743, global_step=2151.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  13%|█▎        | 153/1208 [04:26<30:34,  1.74s/it, loss=0.0959, v_num=0, train/loss_simple_step=0.0743, train/loss_vlb_step=0.000255, train/loss_step=0.0743, global_step=2151.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  13%|█▎        | 153/1208 [04:26<30:34,  1.74s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.000186, train/loss_step=0.0521, global_step=2152.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  13%|█▎        | 154/1208 [04:27<30:27,  1.73s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.000186, train/loss_step=0.0521, global_step=2152.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  13%|█▎        | 154/1208 [04:27<30:27,  1.73s/it, loss=0.0929, v_num=0, train/loss_simple_step=0.00525, train/loss_vlb_step=2.9e-5, train/loss_step=0.00525, global_step=2152.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  13%|█▎        | 155/1208 [04:28<30:21,  1.73s/it, loss=0.0929, v_num=0, train/loss_simple_step=0.00525, train/loss_vlb_step=2.9e-5, train/loss_step=0.00525, global_step=2152.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  13%|█▎        | 155/1208 [04:28<30:21,  1.73s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.0835, train/loss_vlb_step=0.00028, train/loss_step=0.0835, global_step=2152.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  13%|█▎        | 156/1208 [04:30<30:27,  1.74s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.0835, train/loss_vlb_step=0.00028, train/loss_step=0.0835, global_step=2152.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  13%|█▎        | 156/1208 [04:30<30:27,  1.74s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.00939, train/loss_vlb_step=4.41e-5, train/loss_step=0.00939, global_step=2152.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  13%|█▎        | 157/1208 [04:31<30:20,  1.73s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.00939, train/loss_vlb_step=4.41e-5, train/loss_step=0.00939, global_step=2152.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  13%|█▎        | 157/1208 [04:31<30:20,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000756, train/loss_step=0.202, global_step=2153.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  13%|█▎        | 158/1208 [04:32<30:13,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000756, train/loss_step=0.202, global_step=2153.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  13%|█▎        | 158/1208 [04:32<30:13,  1.73s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.00393, train/loss_vlb_step=2.11e-5, train/loss_step=0.00393, global_step=2153.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  13%|█▎        | 159/1208 [04:33<30:07,  1.72s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.00393, train/loss_vlb_step=2.11e-5, train/loss_step=0.00393, global_step=2153.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  13%|█▎        | 159/1208 [04:33<30:07,  1.72s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=2153.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  13%|█▎        | 160/1208 [04:36<30:13,  1.73s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=2153.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  13%|█▎        | 160/1208 [04:36<30:13,  1.73s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.29e-5, train/loss_step=0.0124, global_step=2153.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  13%|█▎        | 161/1208 [04:37<30:06,  1.73s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.29e-5, train/loss_step=0.0124, global_step=2153.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  13%|█▎        | 161/1208 [04:37<30:06,  1.73s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.00569, train/loss_vlb_step=2.9e-5, train/loss_step=0.00569, global_step=2154.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  13%|█▎        | 162/1208 [04:38<30:00,  1.72s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.00569, train/loss_vlb_step=2.9e-5, train/loss_step=0.00569, global_step=2154.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  13%|█▎        | 162/1208 [04:38<30:00,  1.72s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=5.26e-5, train/loss_step=0.0103, global_step=2154.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  13%|█▎        | 163/1208 [04:39<29:54,  1.72s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=5.26e-5, train/loss_step=0.0103, global_step=2154.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  13%|█▎        | 163/1208 [04:39<29:54,  1.72s/it, loss=0.099, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.0039, train/loss_step=0.408, global_step=2154.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  14%|█▎        | 164/1208 [04:43<30:02,  1.73s/it, loss=0.099, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.0039, train/loss_step=0.408, global_step=2154.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  14%|█▎        | 164/1208 [04:43<30:02,  1.73s/it, loss=0.0779, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=7.12e-5, train/loss_step=0.0161, global_step=2154.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  14%|█▎        | 165/1208 [04:44<29:56,  1.72s/it, loss=0.0779, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=7.12e-5, train/loss_step=0.0161, global_step=2154.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  14%|█▎        | 165/1208 [04:44<29:56,  1.72s/it, loss=0.0756, v_num=0, train/loss_simple_step=0.0466, train/loss_vlb_step=0.000176, train/loss_step=0.0466, global_step=2155.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  14%|█▎        | 166/1208 [04:45<29:50,  1.72s/it, loss=0.0756, v_num=0, train/loss_simple_step=0.0466, train/loss_vlb_step=0.000176, train/loss_step=0.0466, global_step=2155.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  14%|█▎        | 166/1208 [04:45<29:51,  1.72s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000712, train/loss_step=0.201, global_step=2155.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  14%|█▍        | 167/1208 [04:46<29:45,  1.71s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000712, train/loss_step=0.201, global_step=2155.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  14%|█▍        | 167/1208 [04:46<29:45,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.764, train/loss_vlb_step=0.0491, train/loss_step=0.764, global_step=2155.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  14%|█▍        | 168/1208 [04:49<29:52,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.764, train/loss_vlb_step=0.0491, train/loss_step=0.764, global_step=2155.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  14%|█▍        | 168/1208 [04:49<29:52,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.001, train/loss_step=0.230, global_step=2155.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  14%|█▍        | 169/1208 [04:50<29:46,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.001, train/loss_step=0.230, global_step=2155.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  14%|█▍        | 169/1208 [04:50<29:46,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.96e-5, train/loss_step=0.0129, global_step=2156.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  14%|█▍        | 170/1208 [04:51<29:41,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.96e-5, train/loss_step=0.0129, global_step=2156.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  14%|█▍        | 170/1208 [04:51<29:41,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000438, train/loss_step=0.133, global_step=2156.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  14%|█▍        | 171/1208 [04:52<29:35,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000438, train/loss_step=0.133, global_step=2156.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  14%|█▍        | 171/1208 [04:52<29:35,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00672, train/loss_vlb_step=3.37e-5, train/loss_step=0.00672, global_step=2156.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  14%|█▍        | 172/1208 [04:55<29:42,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00672, train/loss_vlb_step=3.37e-5, train/loss_step=0.00672, global_step=2156.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  14%|█▍        | 172/1208 [04:55<29:42,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000582, train/loss_step=0.172, global_step=2156.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  14%|█▍        | 173/1208 [04:57<29:36,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000582, train/loss_step=0.172, global_step=2156.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  14%|█▍        | 173/1208 [04:57<29:36,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0453, train/loss_vlb_step=0.000162, train/loss_step=0.0453, global_step=2157.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  14%|█▍        | 174/1208 [04:58<29:31,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0453, train/loss_vlb_step=0.000162, train/loss_step=0.0453, global_step=2157.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  14%|█▍        | 174/1208 [04:58<29:31,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00121, train/loss_step=0.245, global_step=2157.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  14%|█▍        | 175/1208 [04:59<29:25,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00121, train/loss_step=0.245, global_step=2157.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  14%|█▍        | 175/1208 [04:59<29:25,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.477, train/loss_vlb_step=0.00383, train/loss_step=0.477, global_step=2157.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  15%|█▍        | 176/1208 [05:02<29:32,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.477, train/loss_vlb_step=0.00383, train/loss_step=0.477, global_step=2157.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  15%|█▍        | 176/1208 [05:02<29:32,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000404, train/loss_step=0.123, global_step=2157.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  15%|█▍        | 177/1208 [05:03<29:27,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000404, train/loss_step=0.123, global_step=2157.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  15%|█▍        | 177/1208 [05:03<29:27,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000127, train/loss_step=0.035, global_step=2158.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  15%|█▍        | 178/1208 [05:04<29:21,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000127, train/loss_step=0.035, global_step=2158.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  15%|█▍        | 178/1208 [05:04<29:21,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.0009, train/loss_step=0.229, global_step=2158.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  15%|█▍        | 179/1208 [05:05<29:15,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.0009, train/loss_step=0.229, global_step=2158.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  15%|█▍        | 179/1208 [05:05<29:15,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000535, train/loss_step=0.152, global_step=2158.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  15%|█▍        | 180/1208 [05:08<29:23,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000535, train/loss_step=0.152, global_step=2158.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  15%|█▍        | 180/1208 [05:08<29:23,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00824, train/loss_vlb_step=3.89e-5, train/loss_step=0.00824, global_step=2158.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  15%|█▍        | 181/1208 [05:09<29:17,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00824, train/loss_vlb_step=3.89e-5, train/loss_step=0.00824, global_step=2158.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  15%|█▍        | 181/1208 [05:09<29:17,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000117, train/loss_step=0.0299, global_step=2159.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  15%|█▌        | 182/1208 [05:10<29:12,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000117, train/loss_step=0.0299, global_step=2159.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  15%|█▌        | 182/1208 [05:10<29:12,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0576, train/loss_vlb_step=0.000203, train/loss_step=0.0576, global_step=2159.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  15%|█▌        | 183/1208 [05:11<29:06,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0576, train/loss_vlb_step=0.000203, train/loss_step=0.0576, global_step=2159.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  15%|█▌        | 183/1208 [05:11<29:06,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0809, train/loss_vlb_step=0.00027, train/loss_step=0.0809, global_step=2159.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  15%|█▌        | 184/1208 [05:15<29:13,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0809, train/loss_vlb_step=0.00027, train/loss_step=0.0809, global_step=2159.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  15%|█▌        | 184/1208 [05:15<29:13,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.582, train/loss_vlb_step=0.0136, train/loss_step=0.582, global_step=2159.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  15%|█▌        | 185/1208 [05:16<29:08,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.582, train/loss_vlb_step=0.0136, train/loss_step=0.582, global_step=2159.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  15%|█▌        | 185/1208 [05:16<29:08,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00774, train/loss_vlb_step=3.79e-5, train/loss_step=0.00774, global_step=2160.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  15%|█▌        | 186/1208 [05:17<29:02,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00774, train/loss_vlb_step=3.79e-5, train/loss_step=0.00774, global_step=2160.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  15%|█▌        | 186/1208 [05:17<29:02,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000694, train/loss_step=0.202, global_step=2160.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  15%|█▌        | 187/1208 [05:18<28:57,  1.70s/it, loss=0.18, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000694, train/loss_step=0.202, global_step=2160.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  15%|█▌        | 187/1208 [05:18<28:57,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.00537, train/loss_step=0.470, global_step=2160.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  16%|█▌        | 188/1208 [05:21<29:04,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.00537, train/loss_step=0.470, global_step=2160.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  16%|█▌        | 188/1208 [05:21<29:04,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000429, train/loss_step=0.130, global_step=2160.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  16%|█▌        | 189/1208 [05:22<28:58,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000429, train/loss_step=0.130, global_step=2160.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  16%|█▌        | 189/1208 [05:22<28:58,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0911, train/loss_vlb_step=0.0003, train/loss_step=0.0911, global_step=2161.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  16%|█▌        | 190/1208 [05:23<28:53,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0911, train/loss_vlb_step=0.0003, train/loss_step=0.0911, global_step=2161.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  16%|█▌        | 190/1208 [05:23<28:53,  1.70s/it, loss=0.169, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000961, train/loss_step=0.240, global_step=2161.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  16%|█▌        | 191/1208 [05:24<28:48,  1.70s/it, loss=0.169, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000961, train/loss_step=0.240, global_step=2161.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  16%|█▌        | 191/1208 [05:24<28:48,  1.70s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0673, train/loss_vlb_step=0.000229, train/loss_step=0.0673, global_step=2161.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  16%|█▌        | 192/1208 [05:27<28:54,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0673, train/loss_vlb_step=0.000229, train/loss_step=0.0673, global_step=2161.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  16%|█▌        | 192/1208 [05:27<28:54,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00126, train/loss_step=0.277, global_step=2161.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  16%|█▌        | 193/1208 [05:28<28:49,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00126, train/loss_step=0.277, global_step=2161.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  16%|█▌        | 193/1208 [05:28<28:49,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000657, train/loss_step=0.185, global_step=2162.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  16%|█▌        | 194/1208 [05:29<28:44,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000657, train/loss_step=0.185, global_step=2162.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  16%|█▌        | 194/1208 [05:29<28:44,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00534, train/loss_vlb_step=2.86e-5, train/loss_step=0.00534, global_step=2162.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  16%|█▌        | 195/1208 [05:31<28:39,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00534, train/loss_vlb_step=2.86e-5, train/loss_step=0.00534, global_step=2162.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  16%|█▌        | 195/1208 [05:31<28:39,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0505, train/loss_vlb_step=0.000181, train/loss_step=0.0505, global_step=2162.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  16%|█▌        | 196/1208 [05:34<28:45,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0505, train/loss_vlb_step=0.000181, train/loss_step=0.0505, global_step=2162.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  16%|█▌        | 196/1208 [05:34<28:45,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00418, train/loss_vlb_step=2.26e-5, train/loss_step=0.00418, global_step=2162.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  16%|█▋        | 197/1208 [05:35<28:40,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00418, train/loss_vlb_step=2.26e-5, train/loss_step=0.00418, global_step=2162.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  16%|█▋        | 197/1208 [05:35<28:40,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0968, train/loss_vlb_step=0.000318, train/loss_step=0.0968, global_step=2163.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  16%|█▋        | 198/1208 [05:36<28:35,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0968, train/loss_vlb_step=0.000318, train/loss_step=0.0968, global_step=2163.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  16%|█▋        | 198/1208 [05:36<28:35,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00137, train/loss_step=0.280, global_step=2163.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  16%|█▋        | 199/1208 [05:37<28:29,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00137, train/loss_step=0.280, global_step=2163.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  16%|█▋        | 199/1208 [05:37<28:29,  1.69s/it, loss=0.162, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00225, train/loss_step=0.376, global_step=2163.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  17%|█▋        | 200/1208 [05:40<28:34,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00225, train/loss_step=0.376, global_step=2163.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  17%|█▋        | 200/1208 [05:40<28:34,  1.70s/it, loss=0.175, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00119, train/loss_step=0.270, global_step=2163.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  17%|█▋        | 201/1208 [05:41<28:29,  1.70s/it, loss=0.175, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00119, train/loss_step=0.270, global_step=2163.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  17%|█▋        | 201/1208 [05:41<28:29,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0941, train/loss_vlb_step=0.000309, train/loss_step=0.0941, global_step=2164.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  17%|█▋        | 202/1208 [05:42<28:23,  1.69s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0941, train/loss_vlb_step=0.000309, train/loss_step=0.0941, global_step=2164.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  17%|█▋        | 202/1208 [05:42<28:23,  1.69s/it, loss=0.193, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00211, train/loss_step=0.357, global_step=2164.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  17%|█▋        | 203/1208 [05:43<28:18,  1.69s/it, loss=0.193, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00211, train/loss_step=0.357, global_step=2164.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  17%|█▋        | 203/1208 [05:43<28:18,  1.69s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0594, train/loss_vlb_step=0.000203, train/loss_step=0.0594, global_step=2164.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  17%|█▋        | 204/1208 [05:46<28:23,  1.70s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0594, train/loss_vlb_step=0.000203, train/loss_step=0.0594, global_step=2164.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  17%|█▋        | 204/1208 [05:46<28:23,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.82e-5, train/loss_step=0.0103, global_step=2164.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  17%|█▋        | 205/1208 [05:47<28:18,  1.69s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.82e-5, train/loss_step=0.0103, global_step=2164.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  17%|█▋        | 205/1208 [05:47<28:18,  1.69s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0882, train/loss_vlb_step=0.000294, train/loss_step=0.0882, global_step=2165.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  17%|█▋        | 206/1208 [05:48<28:13,  1.69s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0882, train/loss_vlb_step=0.000294, train/loss_step=0.0882, global_step=2165.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  17%|█▋        | 206/1208 [05:48<28:13,  1.69s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0767, train/loss_vlb_step=0.000254, train/loss_step=0.0767, global_step=2165.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  17%|█▋        | 207/1208 [05:49<28:08,  1.69s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0767, train/loss_vlb_step=0.000254, train/loss_step=0.0767, global_step=2165.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  17%|█▋        | 207/1208 [05:49<28:08,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0943, train/loss_vlb_step=0.000311, train/loss_step=0.0943, global_step=2165.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  17%|█▋        | 208/1208 [05:51<28:12,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0943, train/loss_vlb_step=0.000311, train/loss_step=0.0943, global_step=2165.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  17%|█▋        | 208/1208 [05:51<28:12,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0603, train/loss_vlb_step=0.000213, train/loss_step=0.0603, global_step=2165.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  17%|█▋        | 209/1208 [05:53<28:07,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0603, train/loss_vlb_step=0.000213, train/loss_step=0.0603, global_step=2165.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  17%|█▋        | 209/1208 [05:53<28:07,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000555, train/loss_step=0.165, global_step=2166.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  17%|█▋        | 210/1208 [05:54<28:02,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000555, train/loss_step=0.165, global_step=2166.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  17%|█▋        | 210/1208 [05:54<28:02,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00357, train/loss_step=0.398, global_step=2166.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  17%|█▋        | 211/1208 [05:55<27:57,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00357, train/loss_step=0.398, global_step=2166.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  17%|█▋        | 211/1208 [05:55<27:57,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00307, train/loss_vlb_step=1.75e-5, train/loss_step=0.00307, global_step=2166.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  18%|█▊        | 212/1208 [05:57<28:01,  1.69s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00307, train/loss_vlb_step=1.75e-5, train/loss_step=0.00307, global_step=2166.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  18%|█▊        | 212/1208 [05:57<28:01,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000189, train/loss_step=0.050, global_step=2166.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  18%|█▊        | 213/1208 [05:58<27:56,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000189, train/loss_step=0.050, global_step=2166.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  18%|█▊        | 213/1208 [05:58<27:56,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000751, train/loss_step=0.205, global_step=2167.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  18%|█▊        | 214/1208 [05:59<27:52,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000751, train/loss_step=0.205, global_step=2167.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  18%|█▊        | 214/1208 [05:59<27:52,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0683, train/loss_vlb_step=0.000237, train/loss_step=0.0683, global_step=2167.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  18%|█▊        | 215/1208 [06:00<27:47,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0683, train/loss_vlb_step=0.000237, train/loss_step=0.0683, global_step=2167.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  18%|█▊        | 215/1208 [06:00<27:47,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.28e-5, train/loss_step=0.0233, global_step=2167.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  18%|█▊        | 216/1208 [06:03<27:51,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.28e-5, train/loss_step=0.0233, global_step=2167.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  18%|█▊        | 216/1208 [06:03<27:51,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00801, train/loss_vlb_step=4.03e-5, train/loss_step=0.00801, global_step=2167.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  18%|█▊        | 217/1208 [06:04<27:46,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00801, train/loss_vlb_step=4.03e-5, train/loss_step=0.00801, global_step=2167.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  18%|█▊        | 217/1208 [06:04<27:46,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000118, train/loss_step=0.0286, global_step=2168.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  18%|█▊        | 218/1208 [06:05<27:41,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000118, train/loss_step=0.0286, global_step=2168.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  18%|█▊        | 218/1208 [06:05<27:41,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=3.1e-5, train/loss_step=0.00615, global_step=2168.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  18%|█▊        | 219/1208 [06:06<27:37,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=3.1e-5, train/loss_step=0.00615, global_step=2168.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  18%|█▊        | 219/1208 [06:06<27:37,  1.68s/it, loss=0.111, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000534, train/loss_step=0.156, global_step=2168.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  18%|█▊        | 220/1208 [06:09<27:40,  1.68s/it, loss=0.111, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000534, train/loss_step=0.156, global_step=2168.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  18%|█▊        | 220/1208 [06:09<27:40,  1.68s/it, loss=0.101, v_num=0, train/loss_simple_step=0.076, train/loss_vlb_step=0.000257, train/loss_step=0.076, global_step=2168.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  18%|█▊        | 221/1208 [06:10<27:36,  1.68s/it, loss=0.101, v_num=0, train/loss_simple_step=0.076, train/loss_vlb_step=0.000257, train/loss_step=0.076, global_step=2168.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  18%|█▊        | 221/1208 [06:10<27:36,  1.68s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=8.91e-5, train/loss_step=0.0228, global_step=2169.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  18%|█▊        | 222/1208 [06:11<27:31,  1.67s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=8.91e-5, train/loss_step=0.0228, global_step=2169.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  18%|█▊        | 222/1208 [06:11<27:31,  1.67s/it, loss=0.0803, v_num=0, train/loss_simple_step=0.00695, train/loss_vlb_step=3.22e-5, train/loss_step=0.00695, global_step=2169.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  18%|█▊        | 223/1208 [06:12<27:26,  1.67s/it, loss=0.0803, v_num=0, train/loss_simple_step=0.00695, train/loss_vlb_step=3.22e-5, train/loss_step=0.00695, global_step=2169.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  18%|█▊        | 223/1208 [06:12<27:26,  1.67s/it, loss=0.0777, v_num=0, train/loss_simple_step=0.0064, train/loss_vlb_step=3.21e-5, train/loss_step=0.0064, global_step=2169.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  19%|█▊        | 224/1208 [06:15<27:30,  1.68s/it, loss=0.0777, v_num=0, train/loss_simple_step=0.0064, train/loss_vlb_step=3.21e-5, train/loss_step=0.0064, global_step=2169.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  19%|█▊        | 224/1208 [06:15<27:30,  1.68s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00102, train/loss_step=0.249, global_step=2169.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  19%|█▊        | 225/1208 [06:16<27:25,  1.67s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00102, train/loss_step=0.249, global_step=2169.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  19%|█▊        | 225/1208 [06:16<27:25,  1.67s/it, loss=0.0866, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.000109, train/loss_step=0.0275, global_step=2170.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  19%|█▊        | 226/1208 [06:17<27:21,  1.67s/it, loss=0.0866, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.000109, train/loss_step=0.0275, global_step=2170.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  19%|█▊        | 226/1208 [06:17<27:21,  1.67s/it, loss=0.0832, v_num=0, train/loss_simple_step=0.00962, train/loss_vlb_step=4.49e-5, train/loss_step=0.00962, global_step=2170.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  19%|█▉        | 227/1208 [06:18<27:16,  1.67s/it, loss=0.0832, v_num=0, train/loss_simple_step=0.00962, train/loss_vlb_step=4.49e-5, train/loss_step=0.00962, global_step=2170.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  19%|█▉        | 227/1208 [06:18<27:16,  1.67s/it, loss=0.0806, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000153, train/loss_step=0.0415, global_step=2170.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  19%|█▉        | 228/1208 [06:21<27:20,  1.67s/it, loss=0.0806, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000153, train/loss_step=0.0415, global_step=2170.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  19%|█▉        | 228/1208 [06:21<27:20,  1.67s/it, loss=0.0808, v_num=0, train/loss_simple_step=0.0651, train/loss_vlb_step=0.000221, train/loss_step=0.0651, global_step=2170.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  19%|█▉        | 229/1208 [06:22<27:15,  1.67s/it, loss=0.0808, v_num=0, train/loss_simple_step=0.0651, train/loss_vlb_step=0.000221, train/loss_step=0.0651, global_step=2170.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  19%|█▉        | 229/1208 [06:22<27:15,  1.67s/it, loss=0.0738, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.37e-5, train/loss_step=0.024, global_step=2171.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  19%|█▉        | 230/1208 [06:23<27:11,  1.67s/it, loss=0.0738, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.37e-5, train/loss_step=0.024, global_step=2171.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  19%|█▉        | 230/1208 [06:23<27:11,  1.67s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.665, train/loss_vlb_step=0.0344, train/loss_step=0.665, global_step=2171.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  19%|█▉        | 231/1208 [06:24<27:06,  1.67s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.665, train/loss_vlb_step=0.0344, train/loss_step=0.665, global_step=2171.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  19%|█▉        | 231/1208 [06:24<27:06,  1.67s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.0987, train/loss_vlb_step=0.000327, train/loss_step=0.0987, global_step=2171.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  19%|█▉        | 232/1208 [06:27<27:10,  1.67s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.0987, train/loss_vlb_step=0.000327, train/loss_step=0.0987, global_step=2171.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  19%|█▉        | 232/1208 [06:27<27:10,  1.67s/it, loss=0.093, v_num=0, train/loss_simple_step=0.0716, train/loss_vlb_step=0.000245, train/loss_step=0.0716, global_step=2171.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  19%|█▉        | 233/1208 [06:28<27:06,  1.67s/it, loss=0.093, v_num=0, train/loss_simple_step=0.0716, train/loss_vlb_step=0.000245, train/loss_step=0.0716, global_step=2171.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  19%|█▉        | 233/1208 [06:28<27:06,  1.67s/it, loss=0.0836, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.69e-5, train/loss_step=0.0177, global_step=2172.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  19%|█▉        | 234/1208 [06:29<27:01,  1.66s/it, loss=0.0836, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.69e-5, train/loss_step=0.0177, global_step=2172.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  19%|█▉        | 234/1208 [06:29<27:01,  1.66s/it, loss=0.0831, v_num=0, train/loss_simple_step=0.057, train/loss_vlb_step=0.000203, train/loss_step=0.057, global_step=2172.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  19%|█▉        | 235/1208 [06:30<26:57,  1.66s/it, loss=0.0831, v_num=0, train/loss_simple_step=0.057, train/loss_vlb_step=0.000203, train/loss_step=0.057, global_step=2172.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  19%|█▉        | 235/1208 [06:30<26:57,  1.66s/it, loss=0.0826, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.58e-5, train/loss_step=0.0147, global_step=2172.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  20%|█▉        | 236/1208 [06:33<27:00,  1.67s/it, loss=0.0826, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.58e-5, train/loss_step=0.0147, global_step=2172.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  20%|█▉        | 236/1208 [06:33<27:00,  1.67s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00143, train/loss_step=0.292, global_step=2172.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  20%|█▉        | 237/1208 [06:34<26:56,  1.66s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00143, train/loss_step=0.292, global_step=2172.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  20%|█▉        | 237/1208 [06:34<26:56,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.443, train/loss_vlb_step=0.00313, train/loss_step=0.443, global_step=2173.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  20%|█▉        | 238/1208 [06:35<26:51,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.443, train/loss_vlb_step=0.00313, train/loss_step=0.443, global_step=2173.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  20%|█▉        | 238/1208 [06:35<26:51,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.471, train/loss_vlb_step=0.00327, train/loss_step=0.471, global_step=2173.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  20%|█▉        | 239/1208 [06:36<26:47,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.471, train/loss_vlb_step=0.00327, train/loss_step=0.471, global_step=2173.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  20%|█▉        | 239/1208 [06:36<26:47,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.46e-5, train/loss_step=0.0187, global_step=2173.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  20%|█▉        | 240/1208 [06:39<26:50,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.46e-5, train/loss_step=0.0187, global_step=2173.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  20%|█▉        | 240/1208 [06:39<26:50,  1.66s/it, loss=0.137, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000466, train/loss_step=0.136, global_step=2173.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  20%|█▉        | 241/1208 [06:40<26:46,  1.66s/it, loss=0.137, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000466, train/loss_step=0.136, global_step=2173.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  20%|█▉        | 241/1208 [06:40<26:46,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=1.19e-5, train/loss_step=0.00196, global_step=2174.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  20%|██        | 242/1208 [06:41<26:42,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=1.19e-5, train/loss_step=0.00196, global_step=2174.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  20%|██        | 242/1208 [06:41<26:42,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.486, train/loss_vlb_step=0.00478, train/loss_step=0.486, global_step=2174.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]     Epoch 7:  20%|██        | 243/1208 [06:42<26:38,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.486, train/loss_vlb_step=0.00478, train/loss_step=0.486, global_step=2174.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  20%|██        | 243/1208 [06:42<26:38,  1.66s/it, loss=0.171, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000943, train/loss_step=0.231, global_step=2174.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  20%|██        | 244/1208 [06:45<26:41,  1.66s/it, loss=0.171, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000943, train/loss_step=0.231, global_step=2174.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  20%|██        | 244/1208 [06:45<26:41,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.11e-5, train/loss_step=0.0198, global_step=2174.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  20%|██        | 245/1208 [06:46<26:37,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.11e-5, train/loss_step=0.0198, global_step=2174.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  20%|██        | 245/1208 [06:46<26:37,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=1.04e-5, train/loss_step=0.00171, global_step=2175.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  20%|██        | 246/1208 [06:47<26:32,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=1.04e-5, train/loss_step=0.00171, global_step=2175.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  20%|██        | 246/1208 [06:47<26:32,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000945, train/loss_step=0.212, global_step=2175.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  20%|██        | 247/1208 [06:48<26:28,  1.65s/it, loss=0.168, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000945, train/loss_step=0.212, global_step=2175.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  20%|██        | 247/1208 [06:48<26:28,  1.65s/it, loss=0.175, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000543, train/loss_step=0.164, global_step=2175.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  21%|██        | 248/1208 [06:51<26:32,  1.66s/it, loss=0.175, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000543, train/loss_step=0.164, global_step=2175.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  21%|██        | 248/1208 [06:51<26:32,  1.66s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.68e-5, train/loss_step=0.0153, global_step=2175.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  21%|██        | 249/1208 [06:52<26:28,  1.66s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.68e-5, train/loss_step=0.0153, global_step=2175.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  21%|██        | 249/1208 [06:52<26:28,  1.66s/it, loss=0.188, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00211, train/loss_step=0.352, global_step=2176.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  21%|██        | 250/1208 [06:53<26:24,  1.65s/it, loss=0.188, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00211, train/loss_step=0.352, global_step=2176.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  21%|██        | 250/1208 [06:53<26:24,  1.65s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.75e-5, train/loss_step=0.0103, global_step=2176.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  21%|██        | 251/1208 [06:54<26:20,  1.65s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.75e-5, train/loss_step=0.0103, global_step=2176.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  21%|██        | 251/1208 [06:54<26:20,  1.65s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0986, train/loss_vlb_step=0.000326, train/loss_step=0.0986, global_step=2176.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  21%|██        | 252/1208 [06:57<26:24,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0986, train/loss_vlb_step=0.000326, train/loss_step=0.0986, global_step=2176.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  21%|██        | 252/1208 [06:57<26:24,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.00018, train/loss_step=0.0499, global_step=2176.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  21%|██        | 253/1208 [06:58<26:20,  1.65s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.00018, train/loss_step=0.0499, global_step=2176.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  21%|██        | 253/1208 [06:58<26:20,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000567, train/loss_step=0.169, global_step=2177.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  21%|██        | 254/1208 [06:59<26:16,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000567, train/loss_step=0.169, global_step=2177.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  21%|██        | 254/1208 [06:59<26:16,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0323, train/loss_vlb_step=0.000124, train/loss_step=0.0323, global_step=2177.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  21%|██        | 255/1208 [07:00<26:12,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0323, train/loss_vlb_step=0.000124, train/loss_step=0.0323, global_step=2177.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  21%|██        | 255/1208 [07:00<26:12,  1.65s/it, loss=0.167, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000459, train/loss_step=0.140, global_step=2177.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  21%|██        | 256/1208 [07:04<26:16,  1.66s/it, loss=0.167, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000459, train/loss_step=0.140, global_step=2177.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  21%|██        | 256/1208 [07:04<26:16,  1.66s/it, loss=0.161, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000547, train/loss_step=0.165, global_step=2177.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  21%|██▏       | 257/1208 [07:05<26:13,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000547, train/loss_step=0.165, global_step=2177.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  21%|██▏       | 257/1208 [07:05<26:13,  1.65s/it, loss=0.14, v_num=0, train/loss_simple_step=0.030, train/loss_vlb_step=0.000113, train/loss_step=0.030, global_step=2178.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  21%|██▏       | 258/1208 [07:06<26:09,  1.65s/it, loss=0.14, v_num=0, train/loss_simple_step=0.030, train/loss_vlb_step=0.000113, train/loss_step=0.030, global_step=2178.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  21%|██▏       | 258/1208 [07:06<26:09,  1.65s/it, loss=0.131, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00125, train/loss_step=0.289, global_step=2178.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  21%|██▏       | 259/1208 [07:07<26:05,  1.65s/it, loss=0.131, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00125, train/loss_step=0.289, global_step=2178.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  21%|██▏       | 259/1208 [07:07<26:05,  1.65s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.07e-5, train/loss_step=0.0172, global_step=2178.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  22%|██▏       | 260/1208 [07:10<26:09,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.07e-5, train/loss_step=0.0172, global_step=2178.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  22%|██▏       | 260/1208 [07:10<26:09,  1.66s/it, loss=0.137, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000993, train/loss_step=0.246, global_step=2178.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  22%|██▏       | 261/1208 [07:11<26:05,  1.65s/it, loss=0.137, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000993, train/loss_step=0.246, global_step=2178.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  22%|██▏       | 261/1208 [07:11<26:05,  1.65s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0936, train/loss_vlb_step=0.000308, train/loss_step=0.0936, global_step=2179.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  22%|██▏       | 262/1208 [07:12<26:01,  1.65s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0936, train/loss_vlb_step=0.000308, train/loss_step=0.0936, global_step=2179.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  22%|██▏       | 262/1208 [07:12<26:01,  1.65s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000166, train/loss_step=0.0454, global_step=2179.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  22%|██▏       | 263/1208 [07:13<25:57,  1.65s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000166, train/loss_step=0.0454, global_step=2179.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  22%|██▏       | 263/1208 [07:13<25:57,  1.65s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.000158, train/loss_step=0.0425, global_step=2179.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  22%|██▏       | 264/1208 [07:16<26:01,  1.65s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.000158, train/loss_step=0.0425, global_step=2179.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  22%|██▏       | 264/1208 [07:16<26:01,  1.65s/it, loss=0.116, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000479, train/loss_step=0.140, global_step=2179.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  22%|██▏       | 265/1208 [07:17<25:58,  1.65s/it, loss=0.116, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000479, train/loss_step=0.140, global_step=2179.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  22%|██▏       | 265/1208 [07:17<25:58,  1.65s/it, loss=0.127, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.00093, train/loss_step=0.221, global_step=2180.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  22%|██▏       | 266/1208 [07:18<25:54,  1.65s/it, loss=0.127, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.00093, train/loss_step=0.221, global_step=2180.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  22%|██▏       | 266/1208 [07:18<25:54,  1.65s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00387, train/loss_vlb_step=2.13e-5, train/loss_step=0.00387, global_step=2180.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  22%|██▏       | 267/1208 [07:19<25:50,  1.65s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00387, train/loss_vlb_step=2.13e-5, train/loss_step=0.00387, global_step=2180.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  22%|██▏       | 267/1208 [07:19<25:50,  1.65s/it, loss=0.113, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=2180.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  22%|██▏       | 268/1208 [07:23<25:54,  1.65s/it, loss=0.113, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=2180.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  22%|██▏       | 268/1208 [07:23<25:54,  1.65s/it, loss=0.128, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00155, train/loss_step=0.312, global_step=2180.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  22%|██▏       | 269/1208 [07:24<25:50,  1.65s/it, loss=0.128, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00155, train/loss_step=0.312, global_step=2180.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  22%|██▏       | 269/1208 [07:24<25:50,  1.65s/it, loss=0.117, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000432, train/loss_step=0.130, global_step=2181.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  22%|██▏       | 270/1208 [07:25<25:46,  1.65s/it, loss=0.117, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000432, train/loss_step=0.130, global_step=2181.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  22%|██▏       | 270/1208 [07:25<25:46,  1.65s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.98e-5, train/loss_step=0.0209, global_step=2181.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  22%|██▏       | 271/1208 [07:26<25:43,  1.65s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.98e-5, train/loss_step=0.0209, global_step=2181.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  22%|██▏       | 271/1208 [07:26<25:43,  1.65s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0068, train/loss_vlb_step=3.55e-5, train/loss_step=0.0068, global_step=2181.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  23%|██▎       | 272/1208 [07:29<25:46,  1.65s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0068, train/loss_vlb_step=3.55e-5, train/loss_step=0.0068, global_step=2181.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  23%|██▎       | 272/1208 [07:29<25:46,  1.65s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0576, train/loss_vlb_step=0.000198, train/loss_step=0.0576, global_step=2181.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  23%|██▎       | 273/1208 [07:30<25:43,  1.65s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0576, train/loss_vlb_step=0.000198, train/loss_step=0.0576, global_step=2181.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  23%|██▎       | 273/1208 [07:30<25:43,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000714, train/loss_step=0.199, global_step=2182.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  23%|██▎       | 274/1208 [07:31<25:39,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000714, train/loss_step=0.199, global_step=2182.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  23%|██▎       | 274/1208 [07:31<25:39,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000111, train/loss_step=0.0284, global_step=2182.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  23%|██▎       | 275/1208 [07:32<25:35,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000111, train/loss_step=0.0284, global_step=2182.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  23%|██▎       | 275/1208 [07:32<25:35,  1.65s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00293, train/loss_vlb_step=1.7e-5, train/loss_step=0.00293, global_step=2182.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  23%|██▎       | 276/1208 [07:35<25:39,  1.65s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00293, train/loss_vlb_step=1.7e-5, train/loss_step=0.00293, global_step=2182.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  23%|██▎       | 276/1208 [07:35<25:39,  1.65s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0622, train/loss_vlb_step=0.000205, train/loss_step=0.0622, global_step=2182.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  23%|██▎       | 277/1208 [07:36<25:35,  1.65s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0622, train/loss_vlb_step=0.000205, train/loss_step=0.0622, global_step=2182.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  23%|██▎       | 277/1208 [07:36<25:35,  1.65s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.00017, train/loss_step=0.0485, global_step=2183.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  23%|██▎       | 278/1208 [07:38<25:32,  1.65s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.00017, train/loss_step=0.0485, global_step=2183.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  23%|██▎       | 278/1208 [07:38<25:32,  1.65s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000725, train/loss_step=0.204, global_step=2183.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  23%|██▎       | 279/1208 [07:39<25:28,  1.65s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000725, train/loss_step=0.204, global_step=2183.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  23%|██▎       | 279/1208 [07:39<25:28,  1.65s/it, loss=0.0991, v_num=0, train/loss_simple_step=0.00882, train/loss_vlb_step=4.12e-5, train/loss_step=0.00882, global_step=2183.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  23%|██▎       | 280/1208 [07:42<25:32,  1.65s/it, loss=0.0991, v_num=0, train/loss_simple_step=0.00882, train/loss_vlb_step=4.12e-5, train/loss_step=0.00882, global_step=2183.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  23%|██▎       | 280/1208 [07:42<25:32,  1.65s/it, loss=0.108, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00374, train/loss_step=0.427, global_step=2183.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]     Epoch 7:  23%|██▎       | 281/1208 [07:43<25:28,  1.65s/it, loss=0.108, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00374, train/loss_step=0.427, global_step=2183.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  23%|██▎       | 281/1208 [07:43<25:28,  1.65s/it, loss=0.122, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00298, train/loss_step=0.375, global_step=2184.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  23%|██▎       | 282/1208 [07:44<25:24,  1.65s/it, loss=0.122, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00298, train/loss_step=0.375, global_step=2184.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  23%|██▎       | 282/1208 [07:44<25:24,  1.65s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.81e-5, train/loss_step=0.00319, global_step=2184.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  23%|██▎       | 283/1208 [07:45<25:21,  1.64s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.81e-5, train/loss_step=0.00319, global_step=2184.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  23%|██▎       | 283/1208 [07:45<25:21,  1.64s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0097, train/loss_vlb_step=4.56e-5, train/loss_step=0.0097, global_step=2184.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  24%|██▎       | 284/1208 [07:48<25:24,  1.65s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0097, train/loss_vlb_step=4.56e-5, train/loss_step=0.0097, global_step=2184.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  24%|██▎       | 284/1208 [07:48<25:24,  1.65s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000129, train/loss_step=0.0334, global_step=2184.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  24%|██▎       | 285/1208 [07:49<25:21,  1.65s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000129, train/loss_step=0.0334, global_step=2184.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  24%|██▎       | 285/1208 [07:49<25:21,  1.65s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00578, train/loss_vlb_step=2.99e-5, train/loss_step=0.00578, global_step=2185.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  24%|██▎       | 286/1208 [07:50<25:17,  1.65s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00578, train/loss_vlb_step=2.99e-5, train/loss_step=0.00578, global_step=2185.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  24%|██▎       | 286/1208 [07:50<25:17,  1.65s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00802, train/loss_vlb_step=4.05e-5, train/loss_step=0.00802, global_step=2185.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  24%|██▍       | 287/1208 [07:51<25:14,  1.64s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00802, train/loss_vlb_step=4.05e-5, train/loss_step=0.00802, global_step=2185.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  24%|██▍       | 287/1208 [07:51<25:14,  1.64s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.00945, train/loss_vlb_step=4.44e-5, train/loss_step=0.00945, global_step=2185.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  24%|██▍       | 288/1208 [07:55<25:17,  1.65s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.00945, train/loss_vlb_step=4.44e-5, train/loss_step=0.00945, global_step=2185.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  24%|██▍       | 288/1208 [07:55<25:17,  1.65s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00184, train/loss_step=0.330, global_step=2185.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  24%|██▍       | 289/1208 [07:56<25:14,  1.65s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00184, train/loss_step=0.330, global_step=2185.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  24%|██▍       | 289/1208 [07:56<25:14,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.753, train/loss_vlb_step=0.039, train/loss_step=0.753, global_step=2186.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  24%|██▍       | 290/1208 [07:57<25:10,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.753, train/loss_vlb_step=0.039, train/loss_step=0.753, global_step=2186.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  24%|██▍       | 290/1208 [07:57<25:10,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.67e-5, train/loss_step=0.0234, global_step=2186.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  24%|██▍       | 291/1208 [07:58<25:06,  1.64s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.67e-5, train/loss_step=0.0234, global_step=2186.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  24%|██▍       | 291/1208 [07:58<25:06,  1.64s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=2.28e-5, train/loss_step=0.00402, global_step=2186.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  24%|██▍       | 292/1208 [08:01<25:10,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=2.28e-5, train/loss_step=0.00402, global_step=2186.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  24%|██▍       | 292/1208 [08:01<25:10,  1.65s/it, loss=0.136, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000691, train/loss_step=0.187, global_step=2186.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  24%|██▍       | 293/1208 [08:02<25:06,  1.65s/it, loss=0.136, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000691, train/loss_step=0.187, global_step=2186.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  24%|██▍       | 293/1208 [08:02<25:06,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0051, train/loss_vlb_step=2.5e-5, train/loss_step=0.0051, global_step=2187.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  24%|██▍       | 294/1208 [08:03<25:03,  1.64s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0051, train/loss_vlb_step=2.5e-5, train/loss_step=0.0051, global_step=2187.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  24%|██▍       | 294/1208 [08:03<25:03,  1.64s/it, loss=0.128, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.00021, train/loss_step=0.062, global_step=2187.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  24%|██▍       | 295/1208 [08:04<24:59,  1.64s/it, loss=0.128, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.00021, train/loss_step=0.062, global_step=2187.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  24%|██▍       | 295/1208 [08:04<24:59,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0829, train/loss_vlb_step=0.000279, train/loss_step=0.0829, global_step=2187.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  25%|██▍       | 296/1208 [08:07<25:02,  1.65s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0829, train/loss_vlb_step=0.000279, train/loss_step=0.0829, global_step=2187.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  25%|██▍       | 296/1208 [08:07<25:02,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000664, train/loss_step=0.191, global_step=2187.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  25%|██▍       | 297/1208 [08:08<24:59,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000664, train/loss_step=0.191, global_step=2187.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  25%|██▍       | 297/1208 [08:08<24:59,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000574, train/loss_step=0.165, global_step=2188.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  25%|██▍       | 298/1208 [08:09<24:56,  1.64s/it, loss=0.144, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000574, train/loss_step=0.165, global_step=2188.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  25%|██▍       | 298/1208 [08:09<24:56,  1.64s/it, loss=0.141, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.00045, train/loss_step=0.137, global_step=2188.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  25%|██▍       | 299/1208 [08:10<24:52,  1.64s/it, loss=0.141, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.00045, train/loss_step=0.137, global_step=2188.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  25%|██▍       | 299/1208 [08:10<24:52,  1.64s/it, loss=0.148, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000499, train/loss_step=0.150, global_step=2188.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  25%|██▍       | 300/1208 [08:14<24:55,  1.65s/it, loss=0.148, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000499, train/loss_step=0.150, global_step=2188.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  25%|██▍       | 300/1208 [08:14<24:55,  1.65s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00467, train/loss_vlb_step=2.32e-5, train/loss_step=0.00467, global_step=2188.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.75it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.77it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.76it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.75it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.75it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.82it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 7:  25%|██▍       | 301/1208 [08:44<26:21,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00467, train/loss_vlb_step=2.32e-5, train/loss_step=0.00467, global_step=2188.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  25%|██▍       | 301/1208 [08:44<26:21,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000859, train/loss_step=0.236, global_step=2189.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  25%|██▌       | 302/1208 [08:45<26:17,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000859, train/loss_step=0.236, global_step=2189.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  25%|██▌       | 302/1208 [08:45<26:17,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00562, train/loss_vlb_step=3.03e-5, train/loss_step=0.00562, global_step=2189.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  25%|██▌       | 303/1208 [08:46<26:13,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00562, train/loss_vlb_step=3.03e-5, train/loss_step=0.00562, global_step=2189.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  25%|██▌       | 303/1208 [08:46<26:13,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000541, train/loss_step=0.160, global_step=2189.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  25%|██▌       | 304/1208 [08:49<26:15,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000541, train/loss_step=0.160, global_step=2189.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  25%|██▌       | 304/1208 [08:49<26:15,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000186, train/loss_step=0.0524, global_step=2189.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  25%|██▌       | 305/1208 [08:50<26:11,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000186, train/loss_step=0.0524, global_step=2189.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  25%|██▌       | 305/1208 [08:50<26:11,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00951, train/loss_vlb_step=4.56e-5, train/loss_step=0.00951, global_step=2190.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  25%|██▌       | 306/1208 [08:51<26:07,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00951, train/loss_vlb_step=4.56e-5, train/loss_step=0.00951, global_step=2190.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  25%|██▌       | 306/1208 [08:51<26:07,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0876, train/loss_vlb_step=0.000288, train/loss_step=0.0876, global_step=2190.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  25%|██▌       | 307/1208 [08:52<26:04,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0876, train/loss_vlb_step=0.000288, train/loss_step=0.0876, global_step=2190.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  25%|██▌       | 307/1208 [08:52<26:04,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00846, train/loss_vlb_step=4.03e-5, train/loss_step=0.00846, global_step=2190.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  25%|██▌       | 308/1208 [08:56<26:06,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00846, train/loss_vlb_step=4.03e-5, train/loss_step=0.00846, global_step=2190.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  25%|██▌       | 308/1208 [08:56<26:06,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0479, train/loss_vlb_step=0.000179, train/loss_step=0.0479, global_step=2190.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  26%|██▌       | 309/1208 [08:57<26:03,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0479, train/loss_vlb_step=0.000179, train/loss_step=0.0479, global_step=2190.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  26%|██▌       | 309/1208 [08:57<26:03,  1.74s/it, loss=0.0816, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.34e-5, train/loss_step=0.0114, global_step=2191.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  26%|██▌       | 310/1208 [08:58<25:59,  1.74s/it, loss=0.0816, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.34e-5, train/loss_step=0.0114, global_step=2191.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  26%|██▌       | 310/1208 [08:58<25:59,  1.74s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00241, train/loss_step=0.361, global_step=2191.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  26%|██▌       | 311/1208 [08:59<25:55,  1.73s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00241, train/loss_step=0.361, global_step=2191.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  26%|██▌       | 311/1208 [08:59<25:55,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000732, train/loss_step=0.205, global_step=2191.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  26%|██▌       | 312/1208 [09:02<25:58,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000732, train/loss_step=0.205, global_step=2191.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  26%|██▌       | 312/1208 [09:02<25:58,  1.74s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.0051, train/loss_vlb_step=2.68e-5, train/loss_step=0.0051, global_step=2191.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  26%|██▌       | 313/1208 [09:03<25:54,  1.74s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.0051, train/loss_vlb_step=2.68e-5, train/loss_step=0.0051, global_step=2191.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  26%|██▌       | 313/1208 [09:03<25:54,  1.74s/it, loss=0.104, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=2192.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  26%|██▌       | 314/1208 [09:04<25:50,  1.73s/it, loss=0.104, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=2192.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  26%|██▌       | 314/1208 [09:04<25:50,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000124, train/loss_step=0.0314, global_step=2192.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  26%|██▌       | 315/1208 [09:05<25:47,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000124, train/loss_step=0.0314, global_step=2192.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  26%|██▌       | 315/1208 [09:05<25:47,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00214, train/loss_step=0.339, global_step=2192.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  26%|██▌       | 316/1208 [09:09<25:50,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00214, train/loss_step=0.339, global_step=2192.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  26%|██▌       | 316/1208 [09:09<25:50,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.00072, train/loss_step=0.201, global_step=2192.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  26%|██▌       | 317/1208 [09:10<25:46,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.00072, train/loss_step=0.201, global_step=2192.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  26%|██▌       | 317/1208 [09:10<25:46,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.74e-5, train/loss_step=0.00292, global_step=2193.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  26%|██▋       | 318/1208 [09:11<25:42,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.74e-5, train/loss_step=0.00292, global_step=2193.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  26%|██▋       | 318/1208 [09:11<25:42,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00127, train/loss_step=0.287, global_step=2193.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  26%|██▋       | 319/1208 [09:12<25:39,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00127, train/loss_step=0.287, global_step=2193.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  26%|██▋       | 319/1208 [09:12<25:39,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.000235, train/loss_step=0.0665, global_step=2193.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  26%|██▋       | 320/1208 [09:15<25:41,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.000235, train/loss_step=0.0665, global_step=2193.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  26%|██▋       | 320/1208 [09:15<25:41,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.52e-5, train/loss_step=0.0121, global_step=2193.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  27%|██▋       | 321/1208 [09:16<25:37,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.52e-5, train/loss_step=0.0121, global_step=2193.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  27%|██▋       | 321/1208 [09:16<25:37,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00135, train/loss_step=0.248, global_step=2194.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  27%|██▋       | 322/1208 [09:17<25:34,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00135, train/loss_step=0.248, global_step=2194.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  27%|██▋       | 322/1208 [09:17<25:34,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.467, train/loss_vlb_step=0.00357, train/loss_step=0.467, global_step=2194.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  27%|██▋       | 323/1208 [09:18<25:30,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.467, train/loss_vlb_step=0.00357, train/loss_step=0.467, global_step=2194.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  27%|██▋       | 323/1208 [09:18<25:30,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.76e-5, train/loss_step=0.0237, global_step=2194.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  27%|██▋       | 324/1208 [09:21<25:33,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.76e-5, train/loss_step=0.0237, global_step=2194.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  27%|██▋       | 324/1208 [09:21<25:33,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000129, train/loss_step=0.0335, global_step=2194.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  27%|██▋       | 325/1208 [09:22<25:29,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000129, train/loss_step=0.0335, global_step=2194.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  27%|██▋       | 325/1208 [09:22<25:29,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000341, train/loss_step=0.103, global_step=2195.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  27%|██▋       | 326/1208 [09:24<25:25,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000341, train/loss_step=0.103, global_step=2195.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  27%|██▋       | 326/1208 [09:24<25:26,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0842, train/loss_vlb_step=0.000282, train/loss_step=0.0842, global_step=2195.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  27%|██▋       | 327/1208 [09:25<25:22,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0842, train/loss_vlb_step=0.000282, train/loss_step=0.0842, global_step=2195.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  27%|██▋       | 327/1208 [09:25<25:22,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000519, train/loss_step=0.154, global_step=2195.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  27%|██▋       | 328/1208 [09:28<25:24,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000519, train/loss_step=0.154, global_step=2195.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  27%|██▋       | 328/1208 [09:28<25:24,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0595, train/loss_vlb_step=0.000205, train/loss_step=0.0595, global_step=2195.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  27%|██▋       | 329/1208 [09:29<25:21,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0595, train/loss_vlb_step=0.000205, train/loss_step=0.0595, global_step=2195.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  27%|██▋       | 329/1208 [09:29<25:21,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.548, train/loss_vlb_step=0.014, train/loss_step=0.548, global_step=2196.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  27%|██▋       | 330/1208 [09:30<25:17,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.548, train/loss_vlb_step=0.014, train/loss_step=0.548, global_step=2196.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  27%|██▋       | 330/1208 [09:30<25:17,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000111, train/loss_step=0.0288, global_step=2196.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  27%|██▋       | 331/1208 [09:31<25:14,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000111, train/loss_step=0.0288, global_step=2196.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  27%|██▋       | 331/1208 [09:31<25:14,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000374, train/loss_step=0.114, global_step=2196.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  27%|██▋       | 332/1208 [09:34<25:16,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000374, train/loss_step=0.114, global_step=2196.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  27%|██▋       | 332/1208 [09:34<25:16,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.587, train/loss_vlb_step=0.0101, train/loss_step=0.587, global_step=2196.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  28%|██▊       | 333/1208 [09:35<25:13,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.587, train/loss_vlb_step=0.0101, train/loss_step=0.587, global_step=2196.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  28%|██▊       | 333/1208 [09:35<25:13,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00528, train/loss_vlb_step=2.68e-5, train/loss_step=0.00528, global_step=2197.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  28%|██▊       | 334/1208 [09:36<25:09,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00528, train/loss_vlb_step=2.68e-5, train/loss_step=0.00528, global_step=2197.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  28%|██▊       | 334/1208 [09:36<25:09,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0674, train/loss_vlb_step=0.000236, train/loss_step=0.0674, global_step=2197.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  28%|██▊       | 335/1208 [09:37<25:06,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0674, train/loss_vlb_step=0.000236, train/loss_step=0.0674, global_step=2197.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  28%|██▊       | 335/1208 [09:37<25:06,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.000148, train/loss_step=0.0394, global_step=2197.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  28%|██▊       | 336/1208 [09:41<25:08,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.000148, train/loss_step=0.0394, global_step=2197.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  28%|██▊       | 336/1208 [09:41<25:08,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.00323, train/loss_step=0.512, global_step=2197.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  28%|██▊       | 337/1208 [09:42<25:04,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.00323, train/loss_step=0.512, global_step=2197.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  28%|██▊       | 337/1208 [09:42<25:04,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000835, train/loss_step=0.230, global_step=2198.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  28%|██▊       | 338/1208 [09:43<25:01,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000835, train/loss_step=0.230, global_step=2198.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  28%|██▊       | 338/1208 [09:43<25:01,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00142, train/loss_step=0.299, global_step=2198.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  28%|██▊       | 339/1208 [09:44<24:57,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00142, train/loss_step=0.299, global_step=2198.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  28%|██▊       | 339/1208 [09:44<24:57,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0742, train/loss_vlb_step=0.00025, train/loss_step=0.0742, global_step=2198.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  28%|██▊       | 340/1208 [09:47<25:00,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0742, train/loss_vlb_step=0.00025, train/loss_step=0.0742, global_step=2198.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  28%|██▊       | 340/1208 [09:47<25:00,  1.73s/it, loss=0.193, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000608, train/loss_step=0.175, global_step=2198.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  28%|██▊       | 341/1208 [09:48<24:56,  1.73s/it, loss=0.193, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000608, train/loss_step=0.175, global_step=2198.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  28%|██▊       | 341/1208 [09:48<24:56,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.23e-5, train/loss_step=0.0227, global_step=2199.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  28%|██▊       | 342/1208 [09:49<24:53,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.23e-5, train/loss_step=0.0227, global_step=2199.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  28%|██▊       | 342/1208 [09:49<24:53,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000843, train/loss_step=0.222, global_step=2199.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  28%|██▊       | 343/1208 [09:50<24:49,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000843, train/loss_step=0.222, global_step=2199.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  28%|██▊       | 343/1208 [09:50<24:49,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.82e-5, train/loss_step=0.0157, global_step=2199.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  28%|██▊       | 344/1208 [09:53<24:51,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.82e-5, train/loss_step=0.0157, global_step=2199.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  28%|██▊       | 344/1208 [09:53<24:51,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00115, train/loss_step=0.261, global_step=2199.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  29%|██▊       | 345/1208 [09:55<24:48,  1.72s/it, loss=0.18, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00115, train/loss_step=0.261, global_step=2199.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  29%|██▊       | 345/1208 [09:55<24:48,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0488, train/loss_vlb_step=0.000167, train/loss_step=0.0488, global_step=2200.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  29%|██▊       | 346/1208 [09:56<24:45,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0488, train/loss_vlb_step=0.000167, train/loss_step=0.0488, global_step=2200.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  29%|██▊       | 346/1208 [09:56<24:45,  1.72s/it, loss=0.217, v_num=0, train/loss_simple_step=0.886, train/loss_vlb_step=0.446, train/loss_step=0.886, global_step=2200.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]     Epoch 7:  29%|██▊       | 347/1208 [09:57<24:41,  1.72s/it, loss=0.217, v_num=0, train/loss_simple_step=0.886, train/loss_vlb_step=0.446, train/loss_step=0.886, global_step=2200.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  29%|██▊       | 347/1208 [09:57<24:41,  1.72s/it, loss=0.213, v_num=0, train/loss_simple_step=0.0618, train/loss_vlb_step=0.000214, train/loss_step=0.0618, global_step=2200.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  29%|██▉       | 348/1208 [10:00<24:43,  1.73s/it, loss=0.213, v_num=0, train/loss_simple_step=0.0618, train/loss_vlb_step=0.000214, train/loss_step=0.0618, global_step=2200.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  29%|██▉       | 348/1208 [10:00<24:43,  1.73s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.61e-5, train/loss_step=0.0161, global_step=2200.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  29%|██▉       | 349/1208 [10:01<24:40,  1.72s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.61e-5, train/loss_step=0.0161, global_step=2200.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  29%|██▉       | 349/1208 [10:01<24:40,  1.72s/it, loss=0.192, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000667, train/loss_step=0.181, global_step=2201.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  29%|██▉       | 350/1208 [10:02<24:36,  1.72s/it, loss=0.192, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000667, train/loss_step=0.181, global_step=2201.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  29%|██▉       | 350/1208 [10:02<24:36,  1.72s/it, loss=0.191, v_num=0, train/loss_simple_step=0.00541, train/loss_vlb_step=2.84e-5, train/loss_step=0.00541, global_step=2201.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  29%|██▉       | 351/1208 [10:03<24:33,  1.72s/it, loss=0.191, v_num=0, train/loss_simple_step=0.00541, train/loss_vlb_step=2.84e-5, train/loss_step=0.00541, global_step=2201.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  29%|██▉       | 351/1208 [10:03<24:33,  1.72s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00252, train/loss_vlb_step=1.42e-5, train/loss_step=0.00252, global_step=2201.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  29%|██▉       | 352/1208 [10:06<24:35,  1.72s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00252, train/loss_vlb_step=1.42e-5, train/loss_step=0.00252, global_step=2201.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  29%|██▉       | 352/1208 [10:06<24:35,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000102, train/loss_step=0.0254, global_step=2201.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  29%|██▉       | 353/1208 [10:07<24:32,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000102, train/loss_step=0.0254, global_step=2201.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  29%|██▉       | 353/1208 [10:07<24:32,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000575, train/loss_step=0.172, global_step=2202.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  29%|██▉       | 354/1208 [10:08<24:28,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000575, train/loss_step=0.172, global_step=2202.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  29%|██▉       | 354/1208 [10:08<24:28,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.94e-5, train/loss_step=0.00557, global_step=2202.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  29%|██▉       | 355/1208 [10:09<24:25,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.94e-5, train/loss_step=0.00557, global_step=2202.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  29%|██▉       | 355/1208 [10:09<24:25,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.11e-5, train/loss_step=0.0137, global_step=2202.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  29%|██▉       | 356/1208 [10:13<24:27,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.11e-5, train/loss_step=0.0137, global_step=2202.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  29%|██▉       | 356/1208 [10:13<24:27,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000966, train/loss_step=0.248, global_step=2202.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  30%|██▉       | 357/1208 [10:14<24:24,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000966, train/loss_step=0.248, global_step=2202.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  30%|██▉       | 357/1208 [10:14<24:24,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.0019, train/loss_step=0.339, global_step=2203.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  30%|██▉       | 358/1208 [10:15<24:20,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.0019, train/loss_step=0.339, global_step=2203.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  30%|██▉       | 358/1208 [10:15<24:20,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00103, train/loss_step=0.253, global_step=2203.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  30%|██▉       | 359/1208 [10:16<24:17,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00103, train/loss_step=0.253, global_step=2203.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  30%|██▉       | 359/1208 [10:16<24:17,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000417, train/loss_step=0.124, global_step=2203.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  30%|██▉       | 360/1208 [10:19<24:19,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000417, train/loss_step=0.124, global_step=2203.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  30%|██▉       | 360/1208 [10:19<24:19,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00884, train/loss_vlb_step=4.29e-5, train/loss_step=0.00884, global_step=2203.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  30%|██▉       | 361/1208 [10:20<24:15,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00884, train/loss_vlb_step=4.29e-5, train/loss_step=0.00884, global_step=2203.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  30%|██▉       | 361/1208 [10:20<24:15,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.88e-5, train/loss_step=0.0129, global_step=2204.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  30%|██▉       | 362/1208 [10:21<24:12,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.88e-5, train/loss_step=0.0129, global_step=2204.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  30%|██▉       | 362/1208 [10:21<24:12,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=9.86e-5, train/loss_step=0.0259, global_step=2204.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  30%|███       | 363/1208 [10:22<24:09,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=9.86e-5, train/loss_step=0.0259, global_step=2204.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  30%|███       | 363/1208 [10:22<24:09,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.57e-5, train/loss_step=0.0208, global_step=2204.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  30%|███       | 364/1208 [10:25<24:11,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.57e-5, train/loss_step=0.0208, global_step=2204.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  30%|███       | 364/1208 [10:25<24:11,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000666, train/loss_step=0.194, global_step=2204.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  30%|███       | 365/1208 [10:26<24:08,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000666, train/loss_step=0.194, global_step=2204.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  30%|███       | 365/1208 [10:26<24:08,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.66e-5, train/loss_step=0.0127, global_step=2205.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  30%|███       | 366/1208 [10:28<24:04,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.66e-5, train/loss_step=0.0127, global_step=2205.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  30%|███       | 366/1208 [10:28<24:04,  1.72s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=9.14e-6, train/loss_step=0.00153, global_step=2205.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  30%|███       | 367/1208 [10:29<24:01,  1.71s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=9.14e-6, train/loss_step=0.00153, global_step=2205.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  30%|███       | 367/1208 [10:29<24:01,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.429, train/loss_vlb_step=0.0038, train/loss_step=0.429, global_step=2205.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]      Epoch 7:  30%|███       | 368/1208 [10:32<24:03,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.429, train/loss_vlb_step=0.0038, train/loss_step=0.429, global_step=2205.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  30%|███       | 368/1208 [10:32<24:03,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.79e-5, train/loss_step=0.0159, global_step=2205.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  31%|███       | 369/1208 [10:33<23:59,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.79e-5, train/loss_step=0.0159, global_step=2205.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  31%|███       | 369/1208 [10:33<23:59,  1.72s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.0436, train/loss_vlb_step=0.00016, train/loss_step=0.0436, global_step=2206.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  31%|███       | 370/1208 [10:34<23:56,  1.71s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.0436, train/loss_vlb_step=0.00016, train/loss_step=0.0436, global_step=2206.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  31%|███       | 370/1208 [10:34<23:56,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000425, train/loss_step=0.127, global_step=2206.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  31%|███       | 371/1208 [10:35<23:53,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000425, train/loss_step=0.127, global_step=2206.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  31%|███       | 371/1208 [10:35<23:53,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.34e-5, train/loss_step=0.00225, global_step=2206.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  31%|███       | 372/1208 [10:38<23:55,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.34e-5, train/loss_step=0.00225, global_step=2206.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  31%|███       | 372/1208 [10:38<23:55,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.00039, train/loss_step=0.117, global_step=2206.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  31%|███       | 373/1208 [10:39<23:52,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.00039, train/loss_step=0.117, global_step=2206.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  31%|███       | 373/1208 [10:39<23:52,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00138, train/loss_step=0.273, global_step=2207.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  31%|███       | 374/1208 [10:40<23:48,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00138, train/loss_step=0.273, global_step=2207.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  31%|███       | 374/1208 [10:40<23:48,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.451, train/loss_vlb_step=0.00374, train/loss_step=0.451, global_step=2207.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  31%|███       | 375/1208 [10:41<23:45,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.451, train/loss_vlb_step=0.00374, train/loss_step=0.451, global_step=2207.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  31%|███       | 375/1208 [10:41<23:45,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.888, train/loss_vlb_step=0.224, train/loss_step=0.888, global_step=2207.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  31%|███       | 376/1208 [10:45<23:47,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.888, train/loss_vlb_step=0.224, train/loss_step=0.888, global_step=2207.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  31%|███       | 376/1208 [10:45<23:47,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00165, train/loss_step=0.329, global_step=2207.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  31%|███       | 377/1208 [10:46<23:44,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00165, train/loss_step=0.329, global_step=2207.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  31%|███       | 377/1208 [10:46<23:44,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000117, train/loss_step=0.0297, global_step=2208.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  31%|███▏      | 378/1208 [10:47<23:40,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000117, train/loss_step=0.0297, global_step=2208.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  31%|███▏      | 378/1208 [10:47<23:40,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0624, train/loss_vlb_step=0.000212, train/loss_step=0.0624, global_step=2208.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  31%|███▏      | 379/1208 [10:48<23:37,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0624, train/loss_vlb_step=0.000212, train/loss_step=0.0624, global_step=2208.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  31%|███▏      | 379/1208 [10:48<23:37,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0781, train/loss_vlb_step=0.000262, train/loss_step=0.0781, global_step=2208.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  31%|███▏      | 380/1208 [10:51<23:39,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0781, train/loss_vlb_step=0.000262, train/loss_step=0.0781, global_step=2208.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  31%|███▏      | 380/1208 [10:51<23:39,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.22e-5, train/loss_step=0.00204, global_step=2208.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  32%|███▏      | 381/1208 [10:52<23:36,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.22e-5, train/loss_step=0.00204, global_step=2208.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  32%|███▏      | 381/1208 [10:52<23:36,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.667, train/loss_vlb_step=0.0315, train/loss_step=0.667, global_step=2209.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]     Epoch 7:  32%|███▏      | 382/1208 [10:53<23:33,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.667, train/loss_vlb_step=0.0315, train/loss_step=0.667, global_step=2209.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  32%|███▏      | 382/1208 [10:53<23:33,  1.71s/it, loss=0.191, v_num=0, train/loss_simple_step=0.070, train/loss_vlb_step=0.000244, train/loss_step=0.070, global_step=2209.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  32%|███▏      | 383/1208 [10:54<23:29,  1.71s/it, loss=0.191, v_num=0, train/loss_simple_step=0.070, train/loss_vlb_step=0.000244, train/loss_step=0.070, global_step=2209.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  32%|███▏      | 383/1208 [10:54<23:29,  1.71s/it, loss=0.204, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00131, train/loss_step=0.281, global_step=2209.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  32%|███▏      | 384/1208 [10:57<23:31,  1.71s/it, loss=0.204, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00131, train/loss_step=0.281, global_step=2209.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  32%|███▏      | 384/1208 [10:57<23:31,  1.71s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000251, train/loss_step=0.0741, global_step=2209.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  32%|███▏      | 385/1208 [10:58<23:28,  1.71s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000251, train/loss_step=0.0741, global_step=2209.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  32%|███▏      | 385/1208 [10:58<23:28,  1.71s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00524, train/loss_vlb_step=2.71e-5, train/loss_step=0.00524, global_step=2210.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  32%|███▏      | 386/1208 [10:59<23:25,  1.71s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00524, train/loss_vlb_step=2.71e-5, train/loss_step=0.00524, global_step=2210.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  32%|███▏      | 386/1208 [10:59<23:25,  1.71s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000128, train/loss_step=0.0336, global_step=2210.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  32%|███▏      | 387/1208 [11:01<23:22,  1.71s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000128, train/loss_step=0.0336, global_step=2210.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  32%|███▏      | 387/1208 [11:01<23:22,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=2.66e-5, train/loss_step=0.00518, global_step=2210.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  32%|███▏      | 388/1208 [11:04<23:23,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=2.66e-5, train/loss_step=0.00518, global_step=2210.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  32%|███▏      | 388/1208 [11:04<23:23,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000195, train/loss_step=0.0555, global_step=2210.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  32%|███▏      | 389/1208 [11:05<23:20,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000195, train/loss_step=0.0555, global_step=2210.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  32%|███▏      | 389/1208 [11:05<23:20,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.05e-5, train/loss_step=0.0143, global_step=2211.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  32%|███▏      | 390/1208 [11:06<23:17,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.05e-5, train/loss_step=0.0143, global_step=2211.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  32%|███▏      | 390/1208 [11:06<23:17,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.00554, train/loss_step=0.460, global_step=2211.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  32%|███▏      | 391/1208 [11:07<23:14,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.00554, train/loss_step=0.460, global_step=2211.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  32%|███▏      | 391/1208 [11:07<23:14,  1.71s/it, loss=0.209, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00126, train/loss_step=0.286, global_step=2211.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  32%|███▏      | 392/1208 [11:10<23:16,  1.71s/it, loss=0.209, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00126, train/loss_step=0.286, global_step=2211.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  32%|███▏      | 392/1208 [11:10<23:16,  1.71s/it, loss=0.203, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=1.72e-5, train/loss_step=0.00308, global_step=2211.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  33%|███▎      | 393/1208 [11:11<23:13,  1.71s/it, loss=0.203, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=1.72e-5, train/loss_step=0.00308, global_step=2211.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  33%|███▎      | 393/1208 [11:11<23:13,  1.71s/it, loss=0.206, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.0015, train/loss_step=0.318, global_step=2212.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]     Epoch 7:  33%|███▎      | 394/1208 [11:12<23:10,  1.71s/it, loss=0.206, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.0015, train/loss_step=0.318, global_step=2212.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  33%|███▎      | 394/1208 [11:12<23:10,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000925, train/loss_step=0.229, global_step=2212.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  33%|███▎      | 395/1208 [11:13<23:07,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000925, train/loss_step=0.229, global_step=2212.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  33%|███▎      | 395/1208 [11:13<23:07,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.23e-5, train/loss_step=0.0021, global_step=2212.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  33%|███▎      | 396/1208 [11:17<23:08,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.23e-5, train/loss_step=0.0021, global_step=2212.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  33%|███▎      | 396/1208 [11:17<23:08,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0592, train/loss_vlb_step=0.000209, train/loss_step=0.0592, global_step=2212.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  33%|███▎      | 397/1208 [11:18<23:05,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0592, train/loss_vlb_step=0.000209, train/loss_step=0.0592, global_step=2212.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  33%|███▎      | 397/1208 [11:18<23:05,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=9.9e-6, train/loss_step=0.00165, global_step=2213.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  33%|███▎      | 398/1208 [11:19<23:02,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=9.9e-6, train/loss_step=0.00165, global_step=2213.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  33%|███▎      | 398/1208 [11:19<23:02,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00184, train/loss_step=0.317, global_step=2213.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  33%|███▎      | 399/1208 [11:20<22:59,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00184, train/loss_step=0.317, global_step=2213.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  33%|███▎      | 399/1208 [11:20<22:59,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0744, train/loss_vlb_step=0.000248, train/loss_step=0.0744, global_step=2213.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  33%|███▎      | 400/1208 [11:23<23:00,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0744, train/loss_vlb_step=0.000248, train/loss_step=0.0744, global_step=2213.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  33%|███▎      | 400/1208 [11:23<23:00,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.521, train/loss_vlb_step=0.00875, train/loss_step=0.521, global_step=2213.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  33%|███▎      | 401/1208 [11:24<22:57,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.521, train/loss_vlb_step=0.00875, train/loss_step=0.521, global_step=2213.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  33%|███▎      | 401/1208 [11:24<22:57,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.00091, train/loss_step=0.232, global_step=2214.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  33%|███▎      | 402/1208 [11:25<22:54,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.00091, train/loss_step=0.232, global_step=2214.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  33%|███▎      | 402/1208 [11:25<22:54,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00692, train/loss_vlb_step=3.54e-5, train/loss_step=0.00692, global_step=2214.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  33%|███▎      | 403/1208 [11:26<22:51,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00692, train/loss_vlb_step=3.54e-5, train/loss_step=0.00692, global_step=2214.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  33%|███▎      | 403/1208 [11:26<22:51,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00286, train/loss_step=0.373, global_step=2214.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  33%|███▎      | 404/1208 [11:29<22:53,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00286, train/loss_step=0.373, global_step=2214.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  33%|███▎      | 404/1208 [11:29<22:53,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.75e-5, train/loss_step=0.0241, global_step=2214.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  34%|███▎      | 405/1208 [11:31<22:50,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.75e-5, train/loss_step=0.0241, global_step=2214.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  34%|███▎      | 405/1208 [11:31<22:50,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.00181, train/loss_step=0.360, global_step=2215.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  34%|███▎      | 406/1208 [11:32<22:47,  1.70s/it, loss=0.169, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.00181, train/loss_step=0.360, global_step=2215.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  34%|███▎      | 406/1208 [11:32<22:47,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.06e-5, train/loss_step=0.0201, global_step=2215.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  34%|███▎      | 407/1208 [11:33<22:44,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.06e-5, train/loss_step=0.0201, global_step=2215.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  34%|███▎      | 407/1208 [11:33<22:44,  1.70s/it, loss=0.179, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.00086, train/loss_step=0.215, global_step=2215.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  34%|███▍      | 408/1208 [11:36<22:45,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.00086, train/loss_step=0.215, global_step=2215.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  34%|███▍      | 408/1208 [11:36<22:45,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000601, train/loss_step=0.173, global_step=2215.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  34%|███▍      | 409/1208 [11:37<22:42,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000601, train/loss_step=0.173, global_step=2215.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  34%|███▍      | 409/1208 [11:37<22:42,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000126, train/loss_step=0.0333, global_step=2216.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  34%|███▍      | 410/1208 [11:38<22:39,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000126, train/loss_step=0.0333, global_step=2216.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  34%|███▍      | 410/1208 [11:38<22:39,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.000145, train/loss_step=0.0359, global_step=2216.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  34%|███▍      | 411/1208 [11:39<22:36,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.000145, train/loss_step=0.0359, global_step=2216.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  34%|███▍      | 411/1208 [11:39<22:36,  1.70s/it, loss=0.188, v_num=0, train/loss_simple_step=0.766, train/loss_vlb_step=0.0493, train/loss_step=0.766, global_step=2216.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  34%|███▍      | 412/1208 [11:42<22:37,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.766, train/loss_vlb_step=0.0493, train/loss_step=0.766, global_step=2216.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  34%|███▍      | 412/1208 [11:42<22:37,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000111, train/loss_step=0.0302, global_step=2216.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  34%|███▍      | 413/1208 [11:43<22:34,  1.70s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000111, train/loss_step=0.0302, global_step=2216.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  34%|███▍      | 413/1208 [11:43<22:34,  1.70s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.88e-5, train/loss_step=0.00331, global_step=2217.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  34%|███▍      | 414/1208 [11:44<22:31,  1.70s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.88e-5, train/loss_step=0.00331, global_step=2217.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  34%|███▍      | 414/1208 [11:44<22:31,  1.70s/it, loss=0.174, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000971, train/loss_step=0.234, global_step=2217.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  34%|███▍      | 415/1208 [11:45<22:28,  1.70s/it, loss=0.174, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000971, train/loss_step=0.234, global_step=2217.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  34%|███▍      | 415/1208 [11:45<22:28,  1.70s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=0.000103, train/loss_step=0.0244, global_step=2217.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  34%|███▍      | 416/1208 [11:49<22:30,  1.70s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=0.000103, train/loss_step=0.0244, global_step=2217.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  34%|███▍      | 416/1208 [11:49<22:30,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000875, train/loss_step=0.232, global_step=2217.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  35%|███▍      | 417/1208 [11:50<22:27,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000875, train/loss_step=0.232, global_step=2217.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  35%|███▍      | 417/1208 [11:50<22:27,  1.70s/it, loss=0.193, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000658, train/loss_step=0.181, global_step=2218.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  35%|███▍      | 418/1208 [11:51<22:24,  1.70s/it, loss=0.193, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000658, train/loss_step=0.181, global_step=2218.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  35%|███▍      | 418/1208 [11:51<22:24,  1.70s/it, loss=0.183, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000373, train/loss_step=0.114, global_step=2218.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  35%|███▍      | 419/1208 [11:52<22:21,  1.70s/it, loss=0.183, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000373, train/loss_step=0.114, global_step=2218.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  35%|███▍      | 419/1208 [11:52<22:21,  1.70s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0685, train/loss_vlb_step=0.000234, train/loss_step=0.0685, global_step=2218.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  35%|███▍      | 420/1208 [11:55<22:22,  1.70s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0685, train/loss_vlb_step=0.000234, train/loss_step=0.0685, global_step=2218.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  35%|███▍      | 420/1208 [11:55<22:22,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00133, train/loss_step=0.285, global_step=2218.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  35%|███▍      | 421/1208 [11:56<22:19,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00133, train/loss_step=0.285, global_step=2218.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  35%|███▍      | 421/1208 [11:56<22:19,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00431, train/loss_vlb_step=2.32e-5, train/loss_step=0.00431, global_step=2219.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  35%|███▍      | 422/1208 [11:57<22:16,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00431, train/loss_vlb_step=2.32e-5, train/loss_step=0.00431, global_step=2219.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  35%|███▍      | 422/1208 [11:57<22:16,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000107, train/loss_step=0.0278, global_step=2219.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  35%|███▌      | 423/1208 [11:58<22:13,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000107, train/loss_step=0.0278, global_step=2219.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  35%|███▌      | 423/1208 [11:58<22:13,  1.70s/it, loss=0.155, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00125, train/loss_step=0.266, global_step=2219.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  35%|███▌      | 424/1208 [12:01<22:14,  1.70s/it, loss=0.155, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00125, train/loss_step=0.266, global_step=2219.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  35%|███▌      | 424/1208 [12:01<22:14,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000536, train/loss_step=0.156, global_step=2219.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  35%|███▌      | 425/1208 [12:02<22:12,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000536, train/loss_step=0.156, global_step=2219.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  35%|███▌      | 425/1208 [12:02<22:12,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000104, train/loss_step=0.0255, global_step=2220.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  35%|███▌      | 426/1208 [12:04<22:09,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000104, train/loss_step=0.0255, global_step=2220.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  35%|███▌      | 426/1208 [12:04<22:09,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000462, train/loss_step=0.139, global_step=2220.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  35%|███▌      | 427/1208 [12:05<22:06,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000462, train/loss_step=0.139, global_step=2220.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  35%|███▌      | 427/1208 [12:05<22:06,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000118, train/loss_step=0.0309, global_step=2220.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  35%|███▌      | 428/1208 [12:08<22:07,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000118, train/loss_step=0.0309, global_step=2220.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  35%|███▌      | 428/1208 [12:08<22:07,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0404, train/loss_vlb_step=0.000147, train/loss_step=0.0404, global_step=2220.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  36%|███▌      | 429/1208 [12:09<22:04,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0404, train/loss_vlb_step=0.000147, train/loss_step=0.0404, global_step=2220.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  36%|███▌      | 429/1208 [12:09<22:04,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00825, train/loss_vlb_step=4.09e-5, train/loss_step=0.00825, global_step=2221.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  36%|███▌      | 430/1208 [12:10<22:01,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00825, train/loss_vlb_step=4.09e-5, train/loss_step=0.00825, global_step=2221.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  36%|███▌      | 430/1208 [12:10<22:01,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00654, train/loss_vlb_step=3.36e-5, train/loss_step=0.00654, global_step=2221.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  36%|███▌      | 431/1208 [12:11<21:58,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00654, train/loss_vlb_step=3.36e-5, train/loss_step=0.00654, global_step=2221.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  36%|███▌      | 431/1208 [12:11<21:58,  1.70s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.91e-5, train/loss_step=0.0131, global_step=2221.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  36%|███▌      | 432/1208 [12:14<21:59,  1.70s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.91e-5, train/loss_step=0.0131, global_step=2221.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  36%|███▌      | 432/1208 [12:14<21:59,  1.70s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.88e-5, train/loss_step=0.0033, global_step=2221.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  36%|███▌      | 433/1208 [12:15<21:56,  1.70s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.88e-5, train/loss_step=0.0033, global_step=2221.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  36%|███▌      | 433/1208 [12:15<21:56,  1.70s/it, loss=0.102, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000621, train/loss_step=0.187, global_step=2222.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  36%|███▌      | 434/1208 [12:16<21:53,  1.70s/it, loss=0.102, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000621, train/loss_step=0.187, global_step=2222.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  36%|███▌      | 434/1208 [12:16<21:53,  1.70s/it, loss=0.1, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000673, train/loss_step=0.190, global_step=2222.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  36%|███▌      | 435/1208 [12:17<21:51,  1.70s/it, loss=0.1, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000673, train/loss_step=0.190, global_step=2222.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  36%|███▌      | 435/1208 [12:17<21:51,  1.70s/it, loss=0.0991, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=1.13e-5, train/loss_step=0.00187, global_step=2222.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  36%|███▌      | 436/1208 [12:21<21:52,  1.70s/it, loss=0.0991, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=1.13e-5, train/loss_step=0.00187, global_step=2222.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  36%|███▌      | 436/1208 [12:21<21:52,  1.70s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.0048, train/loss_vlb_step=2.53e-5, train/loss_step=0.0048, global_step=2222.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  36%|███▌      | 437/1208 [12:22<21:49,  1.70s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.0048, train/loss_vlb_step=2.53e-5, train/loss_step=0.0048, global_step=2222.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  36%|███▌      | 437/1208 [12:22<21:49,  1.70s/it, loss=0.0874, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000602, train/loss_step=0.176, global_step=2223.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  36%|███▋      | 438/1208 [12:23<21:46,  1.70s/it, loss=0.0874, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000602, train/loss_step=0.176, global_step=2223.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  36%|███▋      | 438/1208 [12:23<21:46,  1.70s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.0796, train/loss_vlb_step=0.000268, train/loss_step=0.0796, global_step=2223.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  36%|███▋      | 439/1208 [12:24<21:43,  1.70s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.0796, train/loss_vlb_step=0.000268, train/loss_step=0.0796, global_step=2223.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  36%|███▋      | 439/1208 [12:24<21:43,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00274, train/loss_step=0.378, global_step=2223.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  36%|███▋      | 440/1208 [12:27<21:44,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00274, train/loss_step=0.378, global_step=2223.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  36%|███▋      | 440/1208 [12:27<21:44,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00226, train/loss_step=0.383, global_step=2223.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  37%|███▋      | 441/1208 [12:28<21:41,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00226, train/loss_step=0.383, global_step=2223.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  37%|███▋      | 441/1208 [12:28<21:41,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000635, train/loss_step=0.178, global_step=2224.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  37%|███▋      | 442/1208 [12:29<21:38,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000635, train/loss_step=0.178, global_step=2224.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  37%|███▋      | 442/1208 [12:29<21:38,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000436, train/loss_step=0.132, global_step=2224.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  37%|███▋      | 443/1208 [12:30<21:36,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000436, train/loss_step=0.132, global_step=2224.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  37%|███▋      | 443/1208 [12:30<21:36,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.598, train/loss_vlb_step=0.00695, train/loss_step=0.598, global_step=2224.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  37%|███▋      | 444/1208 [12:33<21:37,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.598, train/loss_vlb_step=0.00695, train/loss_step=0.598, global_step=2224.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  37%|███▋      | 444/1208 [12:33<21:37,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000711, train/loss_step=0.202, global_step=2224.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  37%|███▋      | 445/1208 [12:34<21:34,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000711, train/loss_step=0.202, global_step=2224.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  37%|███▋      | 445/1208 [12:34<21:34,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000113, train/loss_step=0.0295, global_step=2225.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  37%|███▋      | 446/1208 [12:35<21:31,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000113, train/loss_step=0.0295, global_step=2225.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  37%|███▋      | 446/1208 [12:35<21:31,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.004, train/loss_vlb_step=2.19e-5, train/loss_step=0.004, global_step=2225.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  37%|███▋      | 447/1208 [12:36<21:28,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.004, train/loss_vlb_step=2.19e-5, train/loss_step=0.004, global_step=2225.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  37%|███▋      | 447/1208 [12:36<21:28,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000153, train/loss_step=0.0409, global_step=2225.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  37%|███▋      | 448/1208 [12:40<21:29,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000153, train/loss_step=0.0409, global_step=2225.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  37%|███▋      | 448/1208 [12:40<21:29,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00282, train/loss_step=0.415, global_step=2225.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  37%|███▋      | 449/1208 [12:41<21:26,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00282, train/loss_step=0.415, global_step=2225.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  37%|███▋      | 449/1208 [12:41<21:26,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.0018, train/loss_step=0.322, global_step=2226.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  37%|███▋      | 450/1208 [12:42<21:24,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.0018, train/loss_step=0.322, global_step=2226.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  37%|███▋      | 450/1208 [12:42<21:24,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.47e-5, train/loss_step=0.00248, global_step=2226.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  37%|███▋      | 451/1208 [12:43<21:21,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.47e-5, train/loss_step=0.00248, global_step=2226.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  37%|███▋      | 451/1208 [12:43<21:21,  1.69s/it, loss=0.183, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00159, train/loss_step=0.329, global_step=2226.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  37%|███▋      | 452/1208 [12:46<21:22,  1.70s/it, loss=0.183, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00159, train/loss_step=0.329, global_step=2226.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  37%|███▋      | 452/1208 [12:46<21:22,  1.70s/it, loss=0.194, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000828, train/loss_step=0.222, global_step=2226.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  38%|███▊      | 453/1208 [12:47<21:19,  1.69s/it, loss=0.194, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000828, train/loss_step=0.222, global_step=2226.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  38%|███▊      | 453/1208 [12:47<21:19,  1.69s/it, loss=0.193, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000538, train/loss_step=0.162, global_step=2227.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  38%|███▊      | 454/1208 [12:48<21:16,  1.69s/it, loss=0.193, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000538, train/loss_step=0.162, global_step=2227.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  38%|███▊      | 454/1208 [12:48<21:16,  1.69s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.4e-5, train/loss_step=0.0227, global_step=2227.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  38%|███▊      | 455/1208 [12:49<21:13,  1.69s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.4e-5, train/loss_step=0.0227, global_step=2227.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  38%|███▊      | 455/1208 [12:49<21:13,  1.69s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000101, train/loss_step=0.0255, global_step=2227.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  38%|███▊      | 456/1208 [12:53<21:14,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000101, train/loss_step=0.0255, global_step=2227.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  38%|███▊      | 456/1208 [12:53<21:14,  1.70s/it, loss=0.19, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000335, train/loss_step=0.101, global_step=2227.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  38%|███▊      | 457/1208 [12:54<21:12,  1.69s/it, loss=0.19, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000335, train/loss_step=0.101, global_step=2227.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  38%|███▊      | 457/1208 [12:54<21:12,  1.69s/it, loss=0.193, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000851, train/loss_step=0.228, global_step=2228.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  38%|███▊      | 458/1208 [12:55<21:09,  1.69s/it, loss=0.193, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000851, train/loss_step=0.228, global_step=2228.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  38%|███▊      | 458/1208 [12:55<21:09,  1.69s/it, loss=0.214, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.00758, train/loss_step=0.512, global_step=2228.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  38%|███▊      | 459/1208 [12:56<21:06,  1.69s/it, loss=0.214, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.00758, train/loss_step=0.512, global_step=2228.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  38%|███▊      | 459/1208 [12:56<21:06,  1.69s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000176, train/loss_step=0.0514, global_step=2228.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  38%|███▊      | 460/1208 [12:59<21:07,  1.69s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000176, train/loss_step=0.0514, global_step=2228.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  38%|███▊      | 460/1208 [12:59<21:07,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.36e-5, train/loss_step=0.0151, global_step=2228.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  38%|███▊      | 461/1208 [13:00<21:04,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.36e-5, train/loss_step=0.0151, global_step=2228.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  38%|███▊      | 461/1208 [13:00<21:04,  1.69s/it, loss=0.193, v_num=0, train/loss_simple_step=0.446, train/loss_vlb_step=0.00405, train/loss_step=0.446, global_step=2229.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  38%|███▊      | 462/1208 [13:01<21:02,  1.69s/it, loss=0.193, v_num=0, train/loss_simple_step=0.446, train/loss_vlb_step=0.00405, train/loss_step=0.446, global_step=2229.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  38%|███▊      | 462/1208 [13:01<21:02,  1.69s/it, loss=0.192, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000347, train/loss_step=0.106, global_step=2229.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  38%|███▊      | 463/1208 [13:02<20:59,  1.69s/it, loss=0.192, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000347, train/loss_step=0.106, global_step=2229.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  38%|███▊      | 463/1208 [13:02<20:59,  1.69s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.16e-5, train/loss_step=0.00198, global_step=2229.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  38%|███▊      | 464/1208 [13:05<21:00,  1.69s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.16e-5, train/loss_step=0.00198, global_step=2229.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  38%|███▊      | 464/1208 [13:05<21:00,  1.69s/it, loss=0.163, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000889, train/loss_step=0.223, global_step=2229.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  38%|███▊      | 465/1208 [13:06<20:57,  1.69s/it, loss=0.163, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000889, train/loss_step=0.223, global_step=2229.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  38%|███▊      | 465/1208 [13:06<20:57,  1.69s/it, loss=0.175, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00124, train/loss_step=0.277, global_step=2230.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  39%|███▊      | 466/1208 [13:08<20:54,  1.69s/it, loss=0.175, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00124, train/loss_step=0.277, global_step=2230.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  39%|███▊      | 466/1208 [13:08<20:54,  1.69s/it, loss=0.179, v_num=0, train/loss_simple_step=0.069, train/loss_vlb_step=0.000238, train/loss_step=0.069, global_step=2230.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  39%|███▊      | 467/1208 [13:09<20:51,  1.69s/it, loss=0.179, v_num=0, train/loss_simple_step=0.069, train/loss_vlb_step=0.000238, train/loss_step=0.069, global_step=2230.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  39%|███▊      | 467/1208 [13:09<20:52,  1.69s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00396, train/loss_vlb_step=2.01e-5, train/loss_step=0.00396, global_step=2230.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  39%|███▊      | 468/1208 [13:12<20:52,  1.69s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00396, train/loss_vlb_step=2.01e-5, train/loss_step=0.00396, global_step=2230.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  39%|███▊      | 468/1208 [13:12<20:52,  1.69s/it, loss=0.164, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.00055, train/loss_step=0.157, global_step=2230.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  39%|███▉      | 469/1208 [13:13<20:50,  1.69s/it, loss=0.164, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.00055, train/loss_step=0.157, global_step=2230.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  39%|███▉      | 469/1208 [13:13<20:50,  1.69s/it, loss=0.164, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00157, train/loss_step=0.320, global_step=2231.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  39%|███▉      | 470/1208 [13:14<20:47,  1.69s/it, loss=0.164, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00157, train/loss_step=0.320, global_step=2231.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  39%|███▉      | 470/1208 [13:14<20:47,  1.69s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.29e-5, train/loss_step=0.0232, global_step=2231.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  39%|███▉      | 471/1208 [13:15<20:44,  1.69s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.29e-5, train/loss_step=0.0232, global_step=2231.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  39%|███▉      | 471/1208 [13:15<20:44,  1.69s/it, loss=0.158, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000664, train/loss_step=0.194, global_step=2231.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  39%|███▉      | 472/1208 [13:18<20:45,  1.69s/it, loss=0.158, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000664, train/loss_step=0.194, global_step=2231.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  39%|███▉      | 472/1208 [13:18<20:45,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000376, train/loss_step=0.114, global_step=2231.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  39%|███▉      | 473/1208 [13:19<20:42,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000376, train/loss_step=0.114, global_step=2231.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  39%|███▉      | 473/1208 [13:19<20:42,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00149, train/loss_step=0.296, global_step=2232.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  39%|███▉      | 474/1208 [13:20<20:40,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00149, train/loss_step=0.296, global_step=2232.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  39%|███▉      | 474/1208 [13:20<20:40,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.25e-5, train/loss_step=0.0227, global_step=2232.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  39%|███▉      | 475/1208 [13:21<20:37,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.25e-5, train/loss_step=0.0227, global_step=2232.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  39%|███▉      | 475/1208 [13:21<20:37,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.34e-5, train/loss_step=0.019, global_step=2232.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  39%|███▉      | 476/1208 [13:25<20:38,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.34e-5, train/loss_step=0.019, global_step=2232.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  39%|███▉      | 476/1208 [13:25<20:38,  1.69s/it, loss=0.171, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00213, train/loss_step=0.350, global_step=2232.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  39%|███▉      | 477/1208 [13:26<20:35,  1.69s/it, loss=0.171, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00213, train/loss_step=0.350, global_step=2232.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  39%|███▉      | 477/1208 [13:26<20:35,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00689, train/loss_vlb_step=3.58e-5, train/loss_step=0.00689, global_step=2233.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  40%|███▉      | 478/1208 [13:27<20:32,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00689, train/loss_vlb_step=3.58e-5, train/loss_step=0.00689, global_step=2233.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  40%|███▉      | 478/1208 [13:27<20:32,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=2.2e-5, train/loss_step=0.00392, global_step=2233.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  40%|███▉      | 479/1208 [13:28<20:30,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=2.2e-5, train/loss_step=0.00392, global_step=2233.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  40%|███▉      | 479/1208 [13:28<20:30,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0582, train/loss_vlb_step=0.000201, train/loss_step=0.0582, global_step=2233.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  40%|███▉      | 480/1208 [13:31<20:30,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0582, train/loss_vlb_step=0.000201, train/loss_step=0.0582, global_step=2233.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  40%|███▉      | 480/1208 [13:31<20:30,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000114, train/loss_step=0.0306, global_step=2233.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  40%|███▉      | 481/1208 [13:32<20:28,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000114, train/loss_step=0.0306, global_step=2233.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  40%|███▉      | 481/1208 [13:32<20:28,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000105, train/loss_step=0.0262, global_step=2234.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  40%|███▉      | 482/1208 [13:33<20:25,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000105, train/loss_step=0.0262, global_step=2234.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  40%|███▉      | 482/1208 [13:33<20:25,  1.69s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=9.84e-6, train/loss_step=0.00162, global_step=2234.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  40%|███▉      | 483/1208 [13:34<20:22,  1.69s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=9.84e-6, train/loss_step=0.00162, global_step=2234.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  40%|███▉      | 483/1208 [13:34<20:22,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000351, train/loss_step=0.106, global_step=2234.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  40%|████      | 484/1208 [13:37<20:23,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000351, train/loss_step=0.106, global_step=2234.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  40%|████      | 484/1208 [13:37<20:23,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000665, train/loss_step=0.190, global_step=2234.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  40%|████      | 485/1208 [13:38<20:20,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000665, train/loss_step=0.190, global_step=2234.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  40%|████      | 485/1208 [13:38<20:20,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0442, train/loss_vlb_step=0.000165, train/loss_step=0.0442, global_step=2235.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  40%|████      | 486/1208 [13:39<20:18,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0442, train/loss_vlb_step=0.000165, train/loss_step=0.0442, global_step=2235.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  40%|████      | 486/1208 [13:39<20:18,  1.69s/it, loss=0.109, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000766, train/loss_step=0.212, global_step=2235.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  40%|████      | 487/1208 [13:40<20:15,  1.69s/it, loss=0.109, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000766, train/loss_step=0.212, global_step=2235.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  40%|████      | 487/1208 [13:40<20:15,  1.69s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000119, train/loss_step=0.0293, global_step=2235.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  40%|████      | 488/1208 [13:44<20:16,  1.69s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000119, train/loss_step=0.0293, global_step=2235.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  40%|████      | 488/1208 [13:44<20:16,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00257, train/loss_step=0.425, global_step=2235.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  40%|████      | 489/1208 [13:45<20:13,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00257, train/loss_step=0.425, global_step=2235.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  40%|████      | 489/1208 [13:45<20:13,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00106, train/loss_step=0.243, global_step=2236.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  41%|████      | 490/1208 [13:46<20:10,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00106, train/loss_step=0.243, global_step=2236.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  41%|████      | 490/1208 [13:46<20:10,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0458, train/loss_vlb_step=0.000168, train/loss_step=0.0458, global_step=2236.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  41%|████      | 491/1208 [13:47<20:08,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0458, train/loss_vlb_step=0.000168, train/loss_step=0.0458, global_step=2236.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  41%|████      | 491/1208 [13:47<20:08,  1.69s/it, loss=0.122, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000858, train/loss_step=0.213, global_step=2236.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  41%|████      | 492/1208 [13:50<20:08,  1.69s/it, loss=0.122, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000858, train/loss_step=0.213, global_step=2236.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  41%|████      | 492/1208 [13:50<20:08,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.32e-5, train/loss_step=0.0113, global_step=2236.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  41%|████      | 493/1208 [13:51<20:06,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.32e-5, train/loss_step=0.0113, global_step=2236.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  41%|████      | 493/1208 [13:51<20:06,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.13e-5, train/loss_step=0.00188, global_step=2237.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  41%|████      | 494/1208 [13:52<20:03,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.13e-5, train/loss_step=0.00188, global_step=2237.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  41%|████      | 494/1208 [13:52<20:03,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00209, train/loss_step=0.340, global_step=2237.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  41%|████      | 495/1208 [13:53<20:00,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00209, train/loss_step=0.340, global_step=2237.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  41%|████      | 495/1208 [13:53<20:00,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.496, train/loss_vlb_step=0.00633, train/loss_step=0.496, global_step=2237.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  41%|████      | 496/1208 [13:56<20:01,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.496, train/loss_vlb_step=0.00633, train/loss_step=0.496, global_step=2237.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  41%|████      | 496/1208 [13:56<20:01,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00127, train/loss_step=0.283, global_step=2237.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  41%|████      | 497/1208 [13:58<19:58,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00127, train/loss_step=0.283, global_step=2237.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  41%|████      | 497/1208 [13:58<19:58,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=2238.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  41%|████      | 498/1208 [13:59<19:56,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=2238.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  41%|████      | 498/1208 [13:59<19:56,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000638, train/loss_step=0.182, global_step=2238.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  41%|████▏     | 499/1208 [14:00<19:53,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000638, train/loss_step=0.182, global_step=2238.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  41%|████▏     | 499/1208 [14:00<19:53,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00754, train/loss_vlb_step=3.68e-5, train/loss_step=0.00754, global_step=2238.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  41%|████▏     | 500/1208 [14:03<19:54,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00754, train/loss_vlb_step=3.68e-5, train/loss_step=0.00754, global_step=2238.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  41%|████▏     | 500/1208 [14:03<19:54,  1.69s/it, loss=0.164, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00162, train/loss_step=0.307, global_step=2238.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  41%|████▏     | 501/1208 [14:04<19:51,  1.69s/it, loss=0.164, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00162, train/loss_step=0.307, global_step=2238.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  41%|████▏     | 501/1208 [14:04<19:51,  1.69s/it, loss=0.179, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00156, train/loss_step=0.332, global_step=2239.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  42%|████▏     | 502/1208 [14:05<19:48,  1.68s/it, loss=0.179, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00156, train/loss_step=0.332, global_step=2239.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  42%|████▏     | 502/1208 [14:05<19:48,  1.68s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=2.53e-5, train/loss_step=0.00464, global_step=2239.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  42%|████▏     | 503/1208 [14:06<19:46,  1.68s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=2.53e-5, train/loss_step=0.00464, global_step=2239.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  42%|████▏     | 503/1208 [14:06<19:46,  1.68s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=9.34e-5, train/loss_step=0.0218, global_step=2239.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  42%|████▏     | 504/1208 [14:09<19:46,  1.69s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=9.34e-5, train/loss_step=0.0218, global_step=2239.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  42%|████▏     | 504/1208 [14:09<19:46,  1.69s/it, loss=0.178, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000989, train/loss_step=0.242, global_step=2239.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  42%|████▏     | 505/1208 [14:10<19:44,  1.68s/it, loss=0.178, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000989, train/loss_step=0.242, global_step=2239.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  42%|████▏     | 505/1208 [14:10<19:44,  1.68s/it, loss=0.194, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00295, train/loss_step=0.371, global_step=2240.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  42%|████▏     | 506/1208 [14:11<19:41,  1.68s/it, loss=0.194, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00295, train/loss_step=0.371, global_step=2240.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  42%|████▏     | 506/1208 [14:11<19:41,  1.68s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000127, train/loss_step=0.0329, global_step=2240.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  42%|████▏     | 507/1208 [14:12<19:39,  1.68s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000127, train/loss_step=0.0329, global_step=2240.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  42%|████▏     | 507/1208 [14:12<19:39,  1.68s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.71e-5, train/loss_step=0.0104, global_step=2240.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  42%|████▏     | 508/1208 [14:16<19:39,  1.69s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.71e-5, train/loss_step=0.0104, global_step=2240.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  42%|████▏     | 508/1208 [14:16<19:39,  1.69s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=1.55e-5, train/loss_step=0.00258, global_step=2240.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  42%|████▏     | 509/1208 [14:17<19:37,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=1.55e-5, train/loss_step=0.00258, global_step=2240.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  42%|████▏     | 509/1208 [14:17<19:37,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000144, train/loss_step=0.0367, global_step=2241.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  42%|████▏     | 510/1208 [14:18<19:34,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000144, train/loss_step=0.0367, global_step=2241.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  42%|████▏     | 510/1208 [14:18<19:34,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00374, train/loss_vlb_step=2.07e-5, train/loss_step=0.00374, global_step=2241.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  42%|████▏     | 511/1208 [14:19<19:31,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00374, train/loss_vlb_step=2.07e-5, train/loss_step=0.00374, global_step=2241.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  42%|████▏     | 511/1208 [14:19<19:31,  1.68s/it, loss=0.155, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00129, train/loss_step=0.311, global_step=2241.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  42%|████▏     | 512/1208 [14:22<19:32,  1.68s/it, loss=0.155, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00129, train/loss_step=0.311, global_step=2241.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  42%|████▏     | 512/1208 [14:22<19:32,  1.68s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=4.98e-5, train/loss_step=0.0109, global_step=2241.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  42%|████▏     | 513/1208 [14:23<19:29,  1.68s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=4.98e-5, train/loss_step=0.0109, global_step=2241.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  42%|████▏     | 513/1208 [14:23<19:29,  1.68s/it, loss=0.184, v_num=0, train/loss_simple_step=0.579, train/loss_vlb_step=0.018, train/loss_step=0.579, global_step=2242.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  43%|████▎     | 514/1208 [14:24<19:27,  1.68s/it, loss=0.184, v_num=0, train/loss_simple_step=0.579, train/loss_vlb_step=0.018, train/loss_step=0.579, global_step=2242.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  43%|████▎     | 514/1208 [14:24<19:27,  1.68s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=1.33e-5, train/loss_step=0.00231, global_step=2242.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  43%|████▎     | 515/1208 [14:25<19:24,  1.68s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=1.33e-5, train/loss_step=0.00231, global_step=2242.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  43%|████▎     | 515/1208 [14:25<19:24,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.000131, train/loss_step=0.0351, global_step=2242.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  43%|████▎     | 516/1208 [14:28<19:25,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.000131, train/loss_step=0.0351, global_step=2242.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  43%|████▎     | 516/1208 [14:28<19:25,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.96e-5, train/loss_step=0.0128, global_step=2242.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  43%|████▎     | 517/1208 [14:29<19:22,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.96e-5, train/loss_step=0.0128, global_step=2242.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  43%|████▎     | 517/1208 [14:29<19:22,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0532, train/loss_vlb_step=0.00019, train/loss_step=0.0532, global_step=2243.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  43%|████▎     | 518/1208 [14:30<19:20,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0532, train/loss_vlb_step=0.00019, train/loss_step=0.0532, global_step=2243.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  43%|████▎     | 518/1208 [14:30<19:20,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000656, train/loss_step=0.173, global_step=2243.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  43%|████▎     | 519/1208 [14:31<19:17,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000656, train/loss_step=0.173, global_step=2243.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  43%|████▎     | 519/1208 [14:31<19:17,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00142, train/loss_step=0.295, global_step=2243.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  43%|████▎     | 520/1208 [14:35<19:17,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00142, train/loss_step=0.295, global_step=2243.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  43%|████▎     | 520/1208 [14:35<19:17,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00916, train/loss_vlb_step=4.29e-5, train/loss_step=0.00916, global_step=2243.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  43%|████▎     | 521/1208 [14:36<19:15,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00916, train/loss_vlb_step=4.29e-5, train/loss_step=0.00916, global_step=2243.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  43%|████▎     | 521/1208 [14:36<19:15,  1.68s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00592, train/loss_vlb_step=3.08e-5, train/loss_step=0.00592, global_step=2244.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  43%|████▎     | 522/1208 [14:37<19:12,  1.68s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00592, train/loss_vlb_step=3.08e-5, train/loss_step=0.00592, global_step=2244.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  43%|████▎     | 522/1208 [14:37<19:12,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.00013, train/loss_step=0.0335, global_step=2244.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  43%|████▎     | 523/1208 [14:38<19:10,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.00013, train/loss_step=0.0335, global_step=2244.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  43%|████▎     | 523/1208 [14:38<19:10,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0494, train/loss_vlb_step=0.000186, train/loss_step=0.0494, global_step=2244.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  43%|████▎     | 524/1208 [14:41<19:10,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0494, train/loss_vlb_step=0.000186, train/loss_step=0.0494, global_step=2244.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  43%|████▎     | 524/1208 [14:41<19:10,  1.68s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0649, train/loss_vlb_step=0.000225, train/loss_step=0.0649, global_step=2244.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  43%|████▎     | 525/1208 [14:42<19:08,  1.68s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0649, train/loss_vlb_step=0.000225, train/loss_step=0.0649, global_step=2244.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  43%|████▎     | 525/1208 [14:42<19:08,  1.68s/it, loss=0.0884, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.000169, train/loss_step=0.0459, global_step=2245.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  44%|████▎     | 526/1208 [14:43<19:05,  1.68s/it, loss=0.0884, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.000169, train/loss_step=0.0459, global_step=2245.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  44%|████▎     | 526/1208 [14:43<19:05,  1.68s/it, loss=0.0881, v_num=0, train/loss_simple_step=0.028, train/loss_vlb_step=0.000106, train/loss_step=0.028, global_step=2245.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  44%|████▎     | 527/1208 [14:44<19:03,  1.68s/it, loss=0.0881, v_num=0, train/loss_simple_step=0.028, train/loss_vlb_step=0.000106, train/loss_step=0.028, global_step=2245.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  44%|████▎     | 527/1208 [14:44<19:03,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.736, train/loss_vlb_step=0.0347, train/loss_step=0.736, global_step=2245.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  44%|████▎     | 528/1208 [14:47<19:03,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.736, train/loss_vlb_step=0.0347, train/loss_step=0.736, global_step=2245.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  44%|████▎     | 528/1208 [14:47<19:03,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000141, train/loss_step=0.0387, global_step=2245.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  44%|████▍     | 529/1208 [14:49<19:01,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000141, train/loss_step=0.0387, global_step=2245.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  44%|████▍     | 529/1208 [14:49<19:01,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.0011, train/loss_step=0.263, global_step=2246.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  44%|████▍     | 530/1208 [14:50<18:58,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.0011, train/loss_step=0.263, global_step=2246.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  44%|████▍     | 530/1208 [14:50<18:58,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00436, train/loss_vlb_step=2.31e-5, train/loss_step=0.00436, global_step=2246.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  44%|████▍     | 531/1208 [14:51<18:56,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00436, train/loss_vlb_step=2.31e-5, train/loss_step=0.00436, global_step=2246.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  44%|████▍     | 531/1208 [14:51<18:56,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=2246.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  44%|████▍     | 532/1208 [14:54<18:56,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=2246.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  44%|████▍     | 532/1208 [14:54<18:56,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.528, train/loss_vlb_step=0.00782, train/loss_step=0.528, global_step=2246.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  44%|████▍     | 533/1208 [14:55<18:54,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.528, train/loss_vlb_step=0.00782, train/loss_step=0.528, global_step=2246.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  44%|████▍     | 533/1208 [14:55<18:54,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00434, train/loss_vlb_step=2.34e-5, train/loss_step=0.00434, global_step=2247.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  44%|████▍     | 534/1208 [14:56<18:51,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00434, train/loss_vlb_step=2.34e-5, train/loss_step=0.00434, global_step=2247.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  44%|████▍     | 534/1208 [14:56<18:51,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000108, train/loss_step=0.0272, global_step=2247.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  44%|████▍     | 535/1208 [14:57<18:49,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000108, train/loss_step=0.0272, global_step=2247.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  44%|████▍     | 535/1208 [14:57<18:49,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.735, train/loss_vlb_step=0.0242, train/loss_step=0.735, global_step=2247.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  44%|████▍     | 536/1208 [15:00<18:49,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.735, train/loss_vlb_step=0.0242, train/loss_step=0.735, global_step=2247.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  44%|████▍     | 536/1208 [15:00<18:49,  1.68s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000113, train/loss_step=0.0293, global_step=2247.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  44%|████▍     | 537/1208 [15:01<18:46,  1.68s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000113, train/loss_step=0.0293, global_step=2247.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  44%|████▍     | 537/1208 [15:01<18:46,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=9.18e-5, train/loss_step=0.0218, global_step=2248.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  45%|████▍     | 538/1208 [15:02<18:44,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=9.18e-5, train/loss_step=0.0218, global_step=2248.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  45%|████▍     | 538/1208 [15:02<18:44,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00666, train/loss_vlb_step=3.45e-5, train/loss_step=0.00666, global_step=2248.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  45%|████▍     | 539/1208 [15:03<18:41,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00666, train/loss_vlb_step=3.45e-5, train/loss_step=0.00666, global_step=2248.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  45%|████▍     | 539/1208 [15:03<18:41,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.62e-5, train/loss_step=0.00282, global_step=2248.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  45%|████▍     | 540/1208 [15:07<18:42,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.62e-5, train/loss_step=0.00282, global_step=2248.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  45%|████▍     | 540/1208 [15:07<18:42,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00804, train/loss_vlb_step=3.88e-5, train/loss_step=0.00804, global_step=2248.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  45%|████▍     | 541/1208 [15:08<18:39,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00804, train/loss_vlb_step=3.88e-5, train/loss_step=0.00804, global_step=2248.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  45%|████▍     | 541/1208 [15:08<18:39,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=1.39e-5, train/loss_step=0.0023, global_step=2249.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  45%|████▍     | 542/1208 [15:09<18:37,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=1.39e-5, train/loss_step=0.0023, global_step=2249.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  45%|████▍     | 542/1208 [15:09<18:37,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000425, train/loss_step=0.129, global_step=2249.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  45%|████▍     | 543/1208 [15:10<18:34,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000425, train/loss_step=0.129, global_step=2249.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  45%|████▍     | 543/1208 [15:10<18:34,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0877, train/loss_vlb_step=0.000297, train/loss_step=0.0877, global_step=2249.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  45%|████▌     | 544/1208 [15:13<18:35,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0877, train/loss_vlb_step=0.000297, train/loss_step=0.0877, global_step=2249.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  45%|████▌     | 544/1208 [15:13<18:35,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.03e-5, train/loss_step=0.0111, global_step=2249.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  45%|████▌     | 545/1208 [15:14<18:32,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.03e-5, train/loss_step=0.0111, global_step=2249.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  45%|████▌     | 545/1208 [15:14<18:32,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00466, train/loss_vlb_step=2.54e-5, train/loss_step=0.00466, global_step=2250.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  45%|████▌     | 546/1208 [15:15<18:30,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00466, train/loss_vlb_step=2.54e-5, train/loss_step=0.00466, global_step=2250.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  45%|████▌     | 546/1208 [15:15<18:30,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00142, train/loss_step=0.319, global_step=2250.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  45%|████▌     | 547/1208 [15:16<18:27,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00142, train/loss_step=0.319, global_step=2250.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  45%|████▌     | 547/1208 [15:16<18:27,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00805, train/loss_vlb_step=3.79e-5, train/loss_step=0.00805, global_step=2250.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  45%|████▌     | 548/1208 [15:19<18:27,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00805, train/loss_vlb_step=3.79e-5, train/loss_step=0.00805, global_step=2250.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  45%|████▌     | 548/1208 [15:19<18:27,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000527, train/loss_step=0.155, global_step=2250.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  45%|████▌     | 549/1208 [15:20<18:25,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000527, train/loss_step=0.155, global_step=2250.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  45%|████▌     | 549/1208 [15:20<18:25,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0621, train/loss_vlb_step=0.000222, train/loss_step=0.0621, global_step=2251.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  46%|████▌     | 550/1208 [15:22<18:23,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0621, train/loss_vlb_step=0.000222, train/loss_step=0.0621, global_step=2251.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  46%|████▌     | 550/1208 [15:22<18:23,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.00101, train/loss_step=0.233, global_step=2251.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  46%|████▌     | 551/1208 [15:23<18:20,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.00101, train/loss_step=0.233, global_step=2251.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  46%|████▌     | 551/1208 [15:23<18:20,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000165, train/loss_step=0.0449, global_step=2251.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  46%|████▌     | 552/1208 [15:26<18:20,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000165, train/loss_step=0.0449, global_step=2251.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  46%|████▌     | 552/1208 [15:26<18:20,  1.68s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.000156, train/loss_step=0.0418, global_step=2251.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  46%|████▌     | 553/1208 [15:27<18:18,  1.68s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.000156, train/loss_step=0.0418, global_step=2251.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  46%|████▌     | 553/1208 [15:27<18:18,  1.68s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.47e-5, train/loss_step=0.00244, global_step=2252.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  46%|████▌     | 554/1208 [15:28<18:15,  1.68s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.47e-5, train/loss_step=0.00244, global_step=2252.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  46%|████▌     | 554/1208 [15:28<18:16,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00499, train/loss_step=0.458, global_step=2252.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]     Epoch 7:  46%|████▌     | 555/1208 [15:29<18:13,  1.67s/it, loss=0.118, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00499, train/loss_step=0.458, global_step=2252.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  46%|████▌     | 555/1208 [15:29<18:13,  1.67s/it, loss=0.0894, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000566, train/loss_step=0.160, global_step=2252.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  46%|████▌     | 556/1208 [15:32<18:13,  1.68s/it, loss=0.0894, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000566, train/loss_step=0.160, global_step=2252.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  46%|████▌     | 556/1208 [15:32<18:13,  1.68s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.00449, train/loss_vlb_step=2.42e-5, train/loss_step=0.00449, global_step=2252.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  46%|████▌     | 557/1208 [15:33<18:11,  1.68s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.00449, train/loss_vlb_step=2.42e-5, train/loss_step=0.00449, global_step=2252.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  46%|████▌     | 557/1208 [15:33<18:11,  1.68s/it, loss=0.0878, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.24e-5, train/loss_step=0.0141, global_step=2253.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  46%|████▌     | 558/1208 [15:34<18:08,  1.68s/it, loss=0.0878, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.24e-5, train/loss_step=0.0141, global_step=2253.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  46%|████▌     | 558/1208 [15:34<18:08,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.607, train/loss_vlb_step=0.0155, train/loss_step=0.607, global_step=2253.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  46%|████▋     | 559/1208 [15:35<18:06,  1.67s/it, loss=0.118, v_num=0, train/loss_simple_step=0.607, train/loss_vlb_step=0.0155, train/loss_step=0.607, global_step=2253.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  46%|████▋     | 559/1208 [15:35<18:06,  1.67s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.65e-5, train/loss_step=0.0237, global_step=2253.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  46%|████▋     | 560/1208 [15:39<18:06,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.65e-5, train/loss_step=0.0237, global_step=2253.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  46%|████▋     | 560/1208 [15:39<18:06,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.639, train/loss_vlb_step=0.0138, train/loss_step=0.639, global_step=2253.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  46%|████▋     | 561/1208 [15:40<18:04,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.639, train/loss_vlb_step=0.0138, train/loss_step=0.639, global_step=2253.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  46%|████▋     | 561/1208 [15:40<18:04,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000843, train/loss_step=0.222, global_step=2254.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  47%|████▋     | 562/1208 [15:41<18:01,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000843, train/loss_step=0.222, global_step=2254.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  47%|████▋     | 562/1208 [15:41<18:01,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000412, train/loss_step=0.126, global_step=2254.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  47%|████▋     | 563/1208 [15:42<17:59,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000412, train/loss_step=0.126, global_step=2254.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  47%|████▋     | 563/1208 [15:42<17:59,  1.67s/it, loss=0.169, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000986, train/loss_step=0.237, global_step=2254.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  47%|████▋     | 564/1208 [15:45<17:59,  1.68s/it, loss=0.169, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000986, train/loss_step=0.237, global_step=2254.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  47%|████▋     | 564/1208 [15:45<17:59,  1.68s/it, loss=0.18, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.00106, train/loss_step=0.246, global_step=2254.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  47%|████▋     | 565/1208 [15:46<17:57,  1.68s/it, loss=0.18, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.00106, train/loss_step=0.246, global_step=2254.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  47%|████▋     | 565/1208 [15:46<17:57,  1.68s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00817, train/loss_vlb_step=4e-5, train/loss_step=0.00817, global_step=2255.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  47%|████▋     | 566/1208 [15:47<17:54,  1.67s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00817, train/loss_vlb_step=4e-5, train/loss_step=0.00817, global_step=2255.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  47%|████▋     | 566/1208 [15:47<17:54,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00732, train/loss_vlb_step=3.78e-5, train/loss_step=0.00732, global_step=2255.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  47%|████▋     | 567/1208 [15:48<17:52,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00732, train/loss_vlb_step=3.78e-5, train/loss_step=0.00732, global_step=2255.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  47%|████▋     | 567/1208 [15:48<17:52,  1.67s/it, loss=0.179, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00135, train/loss_step=0.286, global_step=2255.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  47%|████▋     | 568/1208 [15:51<17:52,  1.68s/it, loss=0.179, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00135, train/loss_step=0.286, global_step=2255.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  47%|████▋     | 568/1208 [15:51<17:52,  1.68s/it, loss=0.176, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000313, train/loss_step=0.095, global_step=2255.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  47%|████▋     | 569/1208 [15:52<17:50,  1.67s/it, loss=0.176, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000313, train/loss_step=0.095, global_step=2255.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  47%|████▋     | 569/1208 [15:52<17:50,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0375, train/loss_vlb_step=0.000133, train/loss_step=0.0375, global_step=2256.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  47%|████▋     | 570/1208 [15:53<17:47,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0375, train/loss_vlb_step=0.000133, train/loss_step=0.0375, global_step=2256.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  47%|████▋     | 570/1208 [15:53<17:47,  1.67s/it, loss=0.178, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00146, train/loss_step=0.301, global_step=2256.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  47%|████▋     | 571/1208 [15:54<17:45,  1.67s/it, loss=0.178, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00146, train/loss_step=0.301, global_step=2256.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  47%|████▋     | 571/1208 [15:54<17:45,  1.67s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0554, train/loss_vlb_step=0.000198, train/loss_step=0.0554, global_step=2256.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  47%|████▋     | 572/1208 [15:58<17:45,  1.68s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0554, train/loss_vlb_step=0.000198, train/loss_step=0.0554, global_step=2256.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  47%|████▋     | 572/1208 [15:58<17:45,  1.68s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0442, train/loss_vlb_step=0.000156, train/loss_step=0.0442, global_step=2256.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  47%|████▋     | 573/1208 [15:59<17:43,  1.67s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0442, train/loss_vlb_step=0.000156, train/loss_step=0.0442, global_step=2256.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  47%|████▋     | 573/1208 [15:59<17:43,  1.67s/it, loss=0.191, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000933, train/loss_step=0.241, global_step=2257.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  48%|████▊     | 574/1208 [16:00<17:40,  1.67s/it, loss=0.191, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000933, train/loss_step=0.241, global_step=2257.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  48%|████▊     | 574/1208 [16:00<17:40,  1.67s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0568, train/loss_vlb_step=0.000194, train/loss_step=0.0568, global_step=2257.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  48%|████▊     | 575/1208 [16:01<17:38,  1.67s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0568, train/loss_vlb_step=0.000194, train/loss_step=0.0568, global_step=2257.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  48%|████▊     | 575/1208 [16:01<17:38,  1.67s/it, loss=0.174, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.00087, train/loss_step=0.225, global_step=2257.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  48%|████▊     | 576/1208 [16:04<17:38,  1.67s/it, loss=0.174, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.00087, train/loss_step=0.225, global_step=2257.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  48%|████▊     | 576/1208 [16:04<17:38,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000121, train/loss_step=0.0306, global_step=2257.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  48%|████▊     | 577/1208 [16:05<17:35,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000121, train/loss_step=0.0306, global_step=2257.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  48%|████▊     | 577/1208 [16:05<17:35,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00479, train/loss_vlb_step=2.51e-5, train/loss_step=0.00479, global_step=2258.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  48%|████▊     | 578/1208 [16:06<17:33,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00479, train/loss_vlb_step=2.51e-5, train/loss_step=0.00479, global_step=2258.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  48%|████▊     | 578/1208 [16:06<17:33,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.472, train/loss_vlb_step=0.00372, train/loss_step=0.472, global_step=2258.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  48%|████▊     | 579/1208 [16:07<17:31,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.472, train/loss_vlb_step=0.00372, train/loss_step=0.472, global_step=2258.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  48%|████▊     | 579/1208 [16:07<17:31,  1.67s/it, loss=0.178, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000755, train/loss_step=0.222, global_step=2258.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  48%|████▊     | 580/1208 [16:10<17:31,  1.67s/it, loss=0.178, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000755, train/loss_step=0.222, global_step=2258.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  48%|████▊     | 580/1208 [16:10<17:31,  1.67s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.8e-5, train/loss_step=0.0103, global_step=2258.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  48%|████▊     | 581/1208 [16:12<17:28,  1.67s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.8e-5, train/loss_step=0.0103, global_step=2258.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  48%|████▊     | 581/1208 [16:12<17:28,  1.67s/it, loss=0.167, v_num=0, train/loss_simple_step=0.631, train/loss_vlb_step=0.0142, train/loss_step=0.631, global_step=2259.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  48%|████▊     | 582/1208 [16:13<17:26,  1.67s/it, loss=0.167, v_num=0, train/loss_simple_step=0.631, train/loss_vlb_step=0.0142, train/loss_step=0.631, global_step=2259.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  48%|████▊     | 582/1208 [16:13<17:26,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0542, train/loss_vlb_step=0.000191, train/loss_step=0.0542, global_step=2259.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  48%|████▊     | 583/1208 [16:14<17:24,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0542, train/loss_vlb_step=0.000191, train/loss_step=0.0542, global_step=2259.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  48%|████▊     | 583/1208 [16:14<17:24,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.000121, train/loss_step=0.0313, global_step=2259.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  48%|████▊     | 584/1208 [16:17<17:24,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.000121, train/loss_step=0.0313, global_step=2259.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  48%|████▊     | 584/1208 [16:17<17:24,  1.67s/it, loss=0.146, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000344, train/loss_step=0.104, global_step=2259.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  48%|████▊     | 585/1208 [16:18<17:22,  1.67s/it, loss=0.146, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000344, train/loss_step=0.104, global_step=2259.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  48%|████▊     | 585/1208 [16:18<17:22,  1.67s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0522, train/loss_vlb_step=0.000187, train/loss_step=0.0522, global_step=2260.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  49%|████▊     | 586/1208 [16:19<17:19,  1.67s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0522, train/loss_vlb_step=0.000187, train/loss_step=0.0522, global_step=2260.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  49%|████▊     | 586/1208 [16:19<17:19,  1.67s/it, loss=0.169, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00334, train/loss_step=0.432, global_step=2260.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  49%|████▊     | 587/1208 [16:20<17:17,  1.67s/it, loss=0.169, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00334, train/loss_step=0.432, global_step=2260.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  49%|████▊     | 587/1208 [16:20<17:17,  1.67s/it, loss=0.169, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.0012, train/loss_step=0.279, global_step=2260.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  49%|████▊     | 588/1208 [16:23<17:17,  1.67s/it, loss=0.169, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.0012, train/loss_step=0.279, global_step=2260.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  49%|████▊     | 588/1208 [16:23<17:17,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0713, train/loss_vlb_step=0.000244, train/loss_step=0.0713, global_step=2260.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  49%|████▉     | 589/1208 [16:24<17:15,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0713, train/loss_vlb_step=0.000244, train/loss_step=0.0713, global_step=2260.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  49%|████▉     | 589/1208 [16:24<17:15,  1.67s/it, loss=0.181, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00155, train/loss_step=0.293, global_step=2261.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  49%|████▉     | 590/1208 [16:25<17:12,  1.67s/it, loss=0.181, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00155, train/loss_step=0.293, global_step=2261.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  49%|████▉     | 590/1208 [16:25<17:12,  1.67s/it, loss=0.195, v_num=0, train/loss_simple_step=0.582, train/loss_vlb_step=0.00564, train/loss_step=0.582, global_step=2261.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  49%|████▉     | 591/1208 [16:26<17:10,  1.67s/it, loss=0.195, v_num=0, train/loss_simple_step=0.582, train/loss_vlb_step=0.00564, train/loss_step=0.582, global_step=2261.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  49%|████▉     | 591/1208 [16:26<17:10,  1.67s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.38e-5, train/loss_step=0.0203, global_step=2261.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  49%|████▉     | 592/1208 [16:30<17:10,  1.67s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.38e-5, train/loss_step=0.0203, global_step=2261.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  49%|████▉     | 592/1208 [16:30<17:10,  1.67s/it, loss=0.205, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.0014, train/loss_step=0.292, global_step=2261.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  49%|████▉     | 593/1208 [16:31<17:08,  1.67s/it, loss=0.205, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.0014, train/loss_step=0.292, global_step=2261.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  49%|████▉     | 593/1208 [16:31<17:08,  1.67s/it, loss=0.202, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000649, train/loss_step=0.182, global_step=2262.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  49%|████▉     | 594/1208 [16:32<17:05,  1.67s/it, loss=0.202, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000649, train/loss_step=0.182, global_step=2262.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  49%|████▉     | 594/1208 [16:32<17:05,  1.67s/it, loss=0.2, v_num=0, train/loss_simple_step=0.00685, train/loss_vlb_step=3.48e-5, train/loss_step=0.00685, global_step=2262.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  49%|████▉     | 595/1208 [16:33<17:03,  1.67s/it, loss=0.2, v_num=0, train/loss_simple_step=0.00685, train/loss_vlb_step=3.48e-5, train/loss_step=0.00685, global_step=2262.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  49%|████▉     | 595/1208 [16:33<17:03,  1.67s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0713, train/loss_vlb_step=0.000245, train/loss_step=0.0713, global_step=2262.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  49%|████▉     | 596/1208 [16:36<17:03,  1.67s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0713, train/loss_vlb_step=0.000245, train/loss_step=0.0713, global_step=2262.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  49%|████▉     | 596/1208 [16:36<17:03,  1.67s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000141, train/loss_step=0.0392, global_step=2262.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  49%|████▉     | 597/1208 [16:37<17:01,  1.67s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000141, train/loss_step=0.0392, global_step=2262.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  49%|████▉     | 597/1208 [16:37<17:01,  1.67s/it, loss=0.203, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000778, train/loss_step=0.215, global_step=2263.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  50%|████▉     | 598/1208 [16:38<16:58,  1.67s/it, loss=0.203, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000778, train/loss_step=0.215, global_step=2263.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  50%|████▉     | 598/1208 [16:38<16:58,  1.67s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00728, train/loss_vlb_step=3.63e-5, train/loss_step=0.00728, global_step=2263.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  50%|████▉     | 599/1208 [16:39<16:56,  1.67s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00728, train/loss_vlb_step=3.63e-5, train/loss_step=0.00728, global_step=2263.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  50%|████▉     | 599/1208 [16:39<16:56,  1.67s/it, loss=0.174, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=2263.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  50%|████▉     | 600/1208 [16:43<16:56,  1.67s/it, loss=0.174, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=2263.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  50%|████▉     | 600/1208 [16:43<16:56,  1.67s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=2e-5, train/loss_step=0.00357, global_step=2263.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.72it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.76it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.76it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.76it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.76it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.78it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.75it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.75it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 7:  50%|████▉     | 601/1208 [17:13<17:24,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=2e-5, train/loss_step=0.00357, global_step=2263.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  50%|████▉     | 601/1208 [17:13<17:24,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.24e-5, train/loss_step=0.00409, global_step=2264.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  50%|████▉     | 602/1208 [17:14<17:21,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.24e-5, train/loss_step=0.00409, global_step=2264.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  50%|████▉     | 602/1208 [17:14<17:21,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00881, train/loss_vlb_step=4.39e-5, train/loss_step=0.00881, global_step=2264.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  50%|████▉     | 603/1208 [17:15<17:19,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00881, train/loss_vlb_step=4.39e-5, train/loss_step=0.00881, global_step=2264.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  50%|████▉     | 603/1208 [17:15<17:19,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.37e-5, train/loss_step=0.0139, global_step=2264.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  50%|█████     | 604/1208 [17:19<17:19,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.37e-5, train/loss_step=0.0139, global_step=2264.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  50%|█████     | 604/1208 [17:19<17:19,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000312, train/loss_step=0.095, global_step=2264.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  50%|█████     | 605/1208 [17:20<17:16,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000312, train/loss_step=0.095, global_step=2264.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  50%|█████     | 605/1208 [17:20<17:16,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.12e-5, train/loss_step=0.00188, global_step=2265.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  50%|█████     | 606/1208 [17:21<17:14,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.12e-5, train/loss_step=0.00188, global_step=2265.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  50%|█████     | 606/1208 [17:21<17:14,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0426, train/loss_vlb_step=0.000152, train/loss_step=0.0426, global_step=2265.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  50%|█████     | 607/1208 [17:22<17:11,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0426, train/loss_vlb_step=0.000152, train/loss_step=0.0426, global_step=2265.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  50%|█████     | 607/1208 [17:22<17:11,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00668, train/loss_vlb_step=3.33e-5, train/loss_step=0.00668, global_step=2265.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  50%|█████     | 608/1208 [17:25<17:11,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00668, train/loss_vlb_step=3.33e-5, train/loss_step=0.00668, global_step=2265.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  50%|█████     | 608/1208 [17:25<17:11,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0642, train/loss_vlb_step=0.000225, train/loss_step=0.0642, global_step=2265.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  50%|█████     | 609/1208 [17:26<17:09,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0642, train/loss_vlb_step=0.000225, train/loss_step=0.0642, global_step=2265.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  50%|█████     | 609/1208 [17:26<17:09,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.664, train/loss_vlb_step=0.0267, train/loss_step=0.664, global_step=2266.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  50%|█████     | 610/1208 [17:27<17:07,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.664, train/loss_vlb_step=0.0267, train/loss_step=0.664, global_step=2266.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  50%|█████     | 610/1208 [17:27<17:07,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000547, train/loss_step=0.165, global_step=2266.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  51%|█████     | 611/1208 [17:28<17:04,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000547, train/loss_step=0.165, global_step=2266.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  51%|█████     | 611/1208 [17:28<17:04,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000638, train/loss_step=0.185, global_step=2266.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  51%|█████     | 612/1208 [17:31<17:04,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000638, train/loss_step=0.185, global_step=2266.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  51%|█████     | 612/1208 [17:31<17:04,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000591, train/loss_step=0.171, global_step=2266.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  51%|█████     | 613/1208 [17:33<17:02,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000591, train/loss_step=0.171, global_step=2266.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  51%|█████     | 613/1208 [17:33<17:02,  1.72s/it, loss=0.0943, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.56e-5, train/loss_step=0.0176, global_step=2267.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  51%|█████     | 614/1208 [17:34<16:59,  1.72s/it, loss=0.0943, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.56e-5, train/loss_step=0.0176, global_step=2267.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  51%|█████     | 614/1208 [17:34<16:59,  1.72s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.0044, train/loss_vlb_step=2.39e-5, train/loss_step=0.0044, global_step=2267.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  51%|█████     | 615/1208 [17:35<16:57,  1.72s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.0044, train/loss_vlb_step=2.39e-5, train/loss_step=0.0044, global_step=2267.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  51%|█████     | 615/1208 [17:35<16:57,  1.72s/it, loss=0.096, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=2267.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  51%|█████     | 616/1208 [17:38<16:57,  1.72s/it, loss=0.096, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=2267.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  51%|█████     | 616/1208 [17:38<16:57,  1.72s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.0578, train/loss_vlb_step=0.000209, train/loss_step=0.0578, global_step=2267.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  51%|█████     | 617/1208 [17:39<16:54,  1.72s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.0578, train/loss_vlb_step=0.000209, train/loss_step=0.0578, global_step=2267.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  51%|█████     | 617/1208 [17:39<16:54,  1.72s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.0303, train/loss_vlb_step=0.000117, train/loss_step=0.0303, global_step=2268.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  51%|█████     | 618/1208 [17:40<16:52,  1.72s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.0303, train/loss_vlb_step=0.000117, train/loss_step=0.0303, global_step=2268.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  51%|█████     | 618/1208 [17:40<16:52,  1.72s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000183, train/loss_step=0.0514, global_step=2268.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  51%|█████     | 619/1208 [17:41<16:50,  1.71s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000183, train/loss_step=0.0514, global_step=2268.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  51%|█████     | 619/1208 [17:41<16:50,  1.71s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=1.36e-5, train/loss_step=0.00227, global_step=2268.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  51%|█████▏    | 620/1208 [17:44<16:49,  1.72s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=1.36e-5, train/loss_step=0.00227, global_step=2268.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  51%|█████▏    | 620/1208 [17:44<16:49,  1.72s/it, loss=0.096, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.00101, train/loss_step=0.227, global_step=2268.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]     Epoch 7:  51%|█████▏    | 621/1208 [17:45<16:47,  1.72s/it, loss=0.096, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.00101, train/loss_step=0.227, global_step=2268.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  51%|█████▏    | 621/1208 [17:45<16:47,  1.72s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.67e-5, train/loss_step=0.0101, global_step=2269.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  51%|█████▏    | 622/1208 [17:46<16:45,  1.72s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.67e-5, train/loss_step=0.0101, global_step=2269.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  51%|█████▏    | 622/1208 [17:46<16:45,  1.72s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.22e-5, train/loss_step=0.011, global_step=2269.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  52%|█████▏    | 623/1208 [17:47<16:42,  1.71s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.22e-5, train/loss_step=0.011, global_step=2269.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  52%|█████▏    | 623/1208 [17:47<16:42,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.00606, train/loss_step=0.485, global_step=2269.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  52%|█████▏    | 624/1208 [17:51<16:42,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.00606, train/loss_step=0.485, global_step=2269.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  52%|█████▏    | 624/1208 [17:51<16:42,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.46e-5, train/loss_step=0.00261, global_step=2269.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  52%|█████▏    | 625/1208 [17:52<16:40,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.46e-5, train/loss_step=0.00261, global_step=2269.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  52%|█████▏    | 625/1208 [17:52<16:40,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.41e-5, train/loss_step=0.00251, global_step=2270.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  52%|█████▏    | 626/1208 [17:53<16:37,  1.71s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.41e-5, train/loss_step=0.00251, global_step=2270.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  52%|█████▏    | 626/1208 [17:53<16:37,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000588, train/loss_step=0.171, global_step=2270.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  52%|█████▏    | 627/1208 [17:54<16:35,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000588, train/loss_step=0.171, global_step=2270.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  52%|█████▏    | 627/1208 [17:54<16:35,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00277, train/loss_step=0.409, global_step=2270.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  52%|█████▏    | 628/1208 [17:57<16:35,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00277, train/loss_step=0.409, global_step=2270.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  52%|█████▏    | 628/1208 [17:57<16:35,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=3.1e-5, train/loss_step=0.00611, global_step=2270.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  52%|█████▏    | 629/1208 [17:58<16:32,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=3.1e-5, train/loss_step=0.00611, global_step=2270.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  52%|█████▏    | 629/1208 [17:58<16:32,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=1.09e-5, train/loss_step=0.0018, global_step=2271.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  52%|█████▏    | 630/1208 [17:59<16:30,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=1.09e-5, train/loss_step=0.0018, global_step=2271.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  52%|█████▏    | 630/1208 [17:59<16:30,  1.71s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.58e-5, train/loss_step=0.0124, global_step=2271.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  52%|█████▏    | 631/1208 [18:00<16:28,  1.71s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.58e-5, train/loss_step=0.0124, global_step=2271.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  52%|█████▏    | 631/1208 [18:00<16:28,  1.71s/it, loss=0.091, v_num=0, train/loss_simple_step=0.0383, train/loss_vlb_step=0.000141, train/loss_step=0.0383, global_step=2271.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  52%|█████▏    | 632/1208 [18:03<16:27,  1.72s/it, loss=0.091, v_num=0, train/loss_simple_step=0.0383, train/loss_vlb_step=0.000141, train/loss_step=0.0383, global_step=2271.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  52%|█████▏    | 632/1208 [18:03<16:27,  1.72s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000976, train/loss_step=0.240, global_step=2271.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  52%|█████▏    | 633/1208 [18:05<16:25,  1.71s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000976, train/loss_step=0.240, global_step=2271.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  52%|█████▏    | 633/1208 [18:05<16:25,  1.71s/it, loss=0.0938, v_num=0, train/loss_simple_step=0.00529, train/loss_vlb_step=2.78e-5, train/loss_step=0.00529, global_step=2272.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  52%|█████▏    | 634/1208 [18:06<16:23,  1.71s/it, loss=0.0938, v_num=0, train/loss_simple_step=0.00529, train/loss_vlb_step=2.78e-5, train/loss_step=0.00529, global_step=2272.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  52%|█████▏    | 634/1208 [18:06<16:23,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.545, train/loss_vlb_step=0.00594, train/loss_step=0.545, global_step=2272.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]     Epoch 7:  53%|█████▎    | 635/1208 [18:07<16:20,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.545, train/loss_vlb_step=0.00594, train/loss_step=0.545, global_step=2272.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  53%|█████▎    | 635/1208 [18:07<16:20,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=9.19e-5, train/loss_step=0.0225, global_step=2272.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  53%|█████▎    | 636/1208 [18:10<16:20,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=9.19e-5, train/loss_step=0.0225, global_step=2272.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  53%|█████▎    | 636/1208 [18:10<16:20,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.0008, train/loss_step=0.219, global_step=2272.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  53%|█████▎    | 637/1208 [18:11<16:18,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.0008, train/loss_step=0.219, global_step=2272.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  53%|█████▎    | 637/1208 [18:11<16:18,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00137, train/loss_step=0.291, global_step=2273.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  53%|█████▎    | 638/1208 [18:12<16:16,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00137, train/loss_step=0.291, global_step=2273.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  53%|█████▎    | 638/1208 [18:12<16:16,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=1.25e-5, train/loss_step=0.00206, global_step=2273.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  53%|█████▎    | 639/1208 [18:13<16:13,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=1.25e-5, train/loss_step=0.00206, global_step=2273.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  53%|█████▎    | 639/1208 [18:13<16:13,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.11e-5, train/loss_step=0.0171, global_step=2273.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  53%|█████▎    | 640/1208 [18:16<16:13,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.11e-5, train/loss_step=0.0171, global_step=2273.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  53%|█████▎    | 640/1208 [18:16<16:13,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=2273.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  53%|█████▎    | 641/1208 [18:17<16:11,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=2273.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  53%|█████▎    | 641/1208 [18:17<16:11,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0397, train/loss_vlb_step=0.000147, train/loss_step=0.0397, global_step=2274.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  53%|█████▎    | 642/1208 [18:18<16:08,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0397, train/loss_vlb_step=0.000147, train/loss_step=0.0397, global_step=2274.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  53%|█████▎    | 642/1208 [18:18<16:08,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=2274.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  53%|█████▎    | 643/1208 [18:19<16:06,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=2274.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  53%|█████▎    | 643/1208 [18:19<16:06,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00188, train/loss_step=0.357, global_step=2274.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  53%|█████▎    | 644/1208 [18:23<16:06,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00188, train/loss_step=0.357, global_step=2274.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  53%|█████▎    | 644/1208 [18:23<16:06,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0866, train/loss_vlb_step=0.000289, train/loss_step=0.0866, global_step=2274.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  53%|█████▎    | 645/1208 [18:24<16:03,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0866, train/loss_vlb_step=0.000289, train/loss_step=0.0866, global_step=2274.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  53%|█████▎    | 645/1208 [18:24<16:03,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.000142, train/loss_step=0.0393, global_step=2275.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  53%|█████▎    | 646/1208 [18:25<16:01,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.000142, train/loss_step=0.0393, global_step=2275.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  53%|█████▎    | 646/1208 [18:25<16:01,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.6e-5, train/loss_step=0.0235, global_step=2275.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  54%|█████▎    | 647/1208 [18:26<15:59,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.6e-5, train/loss_step=0.0235, global_step=2275.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  54%|█████▎    | 647/1208 [18:26<15:59,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.098, train/loss_vlb_step=0.000323, train/loss_step=0.098, global_step=2275.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  54%|█████▎    | 648/1208 [18:29<15:58,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.098, train/loss_vlb_step=0.000323, train/loss_step=0.098, global_step=2275.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  54%|█████▎    | 648/1208 [18:29<15:58,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000777, train/loss_step=0.221, global_step=2275.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  54%|█████▎    | 649/1208 [18:30<15:56,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000777, train/loss_step=0.221, global_step=2275.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  54%|█████▎    | 649/1208 [18:30<15:56,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.31e-5, train/loss_step=0.0113, global_step=2276.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  54%|█████▍    | 650/1208 [18:31<15:54,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.31e-5, train/loss_step=0.0113, global_step=2276.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  54%|█████▍    | 650/1208 [18:31<15:54,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000507, train/loss_step=0.150, global_step=2276.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  54%|█████▍    | 651/1208 [18:32<15:52,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000507, train/loss_step=0.150, global_step=2276.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  54%|█████▍    | 651/1208 [18:32<15:52,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.581, train/loss_vlb_step=0.00951, train/loss_step=0.581, global_step=2276.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  54%|█████▍    | 652/1208 [18:35<15:51,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.581, train/loss_vlb_step=0.00951, train/loss_step=0.581, global_step=2276.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  54%|█████▍    | 652/1208 [18:35<15:51,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00336, train/loss_vlb_step=1.87e-5, train/loss_step=0.00336, global_step=2276.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  54%|█████▍    | 653/1208 [18:36<15:49,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00336, train/loss_vlb_step=1.87e-5, train/loss_step=0.00336, global_step=2276.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  54%|█████▍    | 653/1208 [18:36<15:49,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.45e-5, train/loss_step=0.00244, global_step=2277.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  54%|█████▍    | 654/1208 [18:38<15:47,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.45e-5, train/loss_step=0.00244, global_step=2277.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  54%|█████▍    | 654/1208 [18:38<15:47,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=1.17e-5, train/loss_step=0.00196, global_step=2277.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  54%|█████▍    | 655/1208 [18:39<15:44,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=1.17e-5, train/loss_step=0.00196, global_step=2277.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  54%|█████▍    | 655/1208 [18:39<15:44,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00438, train/loss_step=0.377, global_step=2277.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  54%|█████▍    | 656/1208 [18:42<15:44,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00438, train/loss_step=0.377, global_step=2277.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  54%|█████▍    | 656/1208 [18:42<15:44,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00414, train/loss_vlb_step=2.21e-5, train/loss_step=0.00414, global_step=2277.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  54%|█████▍    | 657/1208 [18:43<15:42,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00414, train/loss_vlb_step=2.21e-5, train/loss_step=0.00414, global_step=2277.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  54%|█████▍    | 657/1208 [18:43<15:42,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00214, train/loss_step=0.394, global_step=2278.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  54%|█████▍    | 658/1208 [18:44<15:39,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00214, train/loss_step=0.394, global_step=2278.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  54%|█████▍    | 658/1208 [18:44<15:39,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=8.33e-5, train/loss_step=0.0204, global_step=2278.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  55%|█████▍    | 659/1208 [18:45<15:37,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=8.33e-5, train/loss_step=0.0204, global_step=2278.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  55%|█████▍    | 659/1208 [18:45<15:37,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000594, train/loss_step=0.166, global_step=2278.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  55%|█████▍    | 660/1208 [18:48<15:37,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000594, train/loss_step=0.166, global_step=2278.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  55%|█████▍    | 660/1208 [18:48<15:37,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00233, train/loss_step=0.379, global_step=2278.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  55%|█████▍    | 661/1208 [18:49<15:34,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00233, train/loss_step=0.379, global_step=2278.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  55%|█████▍    | 661/1208 [18:49<15:34,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00595, train/loss_vlb_step=3.01e-5, train/loss_step=0.00595, global_step=2279.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  55%|█████▍    | 662/1208 [18:50<15:32,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00595, train/loss_vlb_step=3.01e-5, train/loss_step=0.00595, global_step=2279.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  55%|█████▍    | 662/1208 [18:50<15:32,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00667, train/loss_vlb_step=3.36e-5, train/loss_step=0.00667, global_step=2279.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  55%|█████▍    | 663/1208 [18:51<15:30,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00667, train/loss_vlb_step=3.36e-5, train/loss_step=0.00667, global_step=2279.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  55%|█████▍    | 663/1208 [18:51<15:30,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.00329, train/loss_step=0.450, global_step=2279.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  55%|█████▍    | 664/1208 [18:55<15:29,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.00329, train/loss_step=0.450, global_step=2279.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  55%|█████▍    | 664/1208 [18:55<15:29,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00109, train/loss_step=0.265, global_step=2279.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  55%|█████▌    | 665/1208 [18:56<15:27,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00109, train/loss_step=0.265, global_step=2279.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  55%|█████▌    | 665/1208 [18:56<15:27,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00201, train/loss_step=0.354, global_step=2280.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  55%|█████▌    | 666/1208 [18:57<15:25,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00201, train/loss_step=0.354, global_step=2280.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  55%|█████▌    | 666/1208 [18:57<15:25,  1.71s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00662, train/loss_vlb_step=3.42e-5, train/loss_step=0.00662, global_step=2280.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  55%|█████▌    | 667/1208 [18:58<15:23,  1.71s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00662, train/loss_vlb_step=3.42e-5, train/loss_step=0.00662, global_step=2280.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  55%|█████▌    | 667/1208 [18:58<15:23,  1.71s/it, loss=0.184, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00145, train/loss_step=0.289, global_step=2280.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  55%|█████▌    | 668/1208 [19:01<15:22,  1.71s/it, loss=0.184, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00145, train/loss_step=0.289, global_step=2280.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  55%|█████▌    | 668/1208 [19:01<15:22,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00103, train/loss_step=0.245, global_step=2280.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  55%|█████▌    | 669/1208 [19:02<15:20,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00103, train/loss_step=0.245, global_step=2280.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  55%|█████▌    | 669/1208 [19:02<15:20,  1.71s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0355, train/loss_vlb_step=0.000133, train/loss_step=0.0355, global_step=2281.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  55%|█████▌    | 670/1208 [19:03<15:18,  1.71s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0355, train/loss_vlb_step=0.000133, train/loss_step=0.0355, global_step=2281.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  55%|█████▌    | 670/1208 [19:03<15:18,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000123, train/loss_step=0.031, global_step=2281.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  56%|█████▌    | 671/1208 [19:04<15:16,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000123, train/loss_step=0.031, global_step=2281.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  56%|█████▌    | 671/1208 [19:04<15:16,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0052, train/loss_vlb_step=2.86e-5, train/loss_step=0.0052, global_step=2281.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  56%|█████▌    | 672/1208 [19:07<15:15,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0052, train/loss_vlb_step=2.86e-5, train/loss_step=0.0052, global_step=2281.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  56%|█████▌    | 672/1208 [19:07<15:15,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.81e-5, train/loss_step=0.0184, global_step=2281.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  56%|█████▌    | 673/1208 [19:08<15:13,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.81e-5, train/loss_step=0.0184, global_step=2281.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  56%|█████▌    | 673/1208 [19:08<15:13,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000146, train/loss_step=0.0399, global_step=2282.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  56%|█████▌    | 674/1208 [19:09<15:11,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000146, train/loss_step=0.0399, global_step=2282.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  56%|█████▌    | 674/1208 [19:09<15:11,  1.71s/it, loss=0.171, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.0018, train/loss_step=0.322, global_step=2282.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  56%|█████▌    | 675/1208 [19:11<15:08,  1.71s/it, loss=0.171, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.0018, train/loss_step=0.322, global_step=2282.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  56%|█████▌    | 675/1208 [19:11<15:08,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000727, train/loss_step=0.202, global_step=2282.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  56%|█████▌    | 676/1208 [19:14<15:08,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000727, train/loss_step=0.202, global_step=2282.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  56%|█████▌    | 676/1208 [19:14<15:08,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=2282.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  56%|█████▌    | 677/1208 [19:15<15:06,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=2282.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  56%|█████▌    | 677/1208 [19:15<15:06,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.27e-5, train/loss_step=0.0114, global_step=2283.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  56%|█████▌    | 678/1208 [19:16<15:04,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.27e-5, train/loss_step=0.0114, global_step=2283.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  56%|█████▌    | 678/1208 [19:16<15:04,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00181, train/loss_step=0.344, global_step=2283.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  56%|█████▌    | 679/1208 [19:17<15:01,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00181, train/loss_step=0.344, global_step=2283.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  56%|█████▌    | 679/1208 [19:17<15:01,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00761, train/loss_vlb_step=3.7e-5, train/loss_step=0.00761, global_step=2283.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  56%|█████▋    | 680/1208 [19:20<15:01,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00761, train/loss_vlb_step=3.7e-5, train/loss_step=0.00761, global_step=2283.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  56%|█████▋    | 680/1208 [19:20<15:01,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00114, train/loss_step=0.258, global_step=2283.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  56%|█████▋    | 681/1208 [19:21<14:59,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00114, train/loss_step=0.258, global_step=2283.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  56%|█████▋    | 681/1208 [19:21<14:59,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.59e-5, train/loss_step=0.0118, global_step=2284.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  56%|█████▋    | 682/1208 [19:22<14:56,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.59e-5, train/loss_step=0.0118, global_step=2284.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  56%|█████▋    | 682/1208 [19:22<14:56,  1.70s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0937, train/loss_vlb_step=0.000315, train/loss_step=0.0937, global_step=2284.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  57%|█████▋    | 683/1208 [19:23<14:54,  1.70s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0937, train/loss_vlb_step=0.000315, train/loss_step=0.0937, global_step=2284.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  57%|█████▋    | 683/1208 [19:23<14:54,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.33e-5, train/loss_step=0.0113, global_step=2284.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  57%|█████▋    | 684/1208 [19:27<14:54,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.33e-5, train/loss_step=0.0113, global_step=2284.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  57%|█████▋    | 684/1208 [19:27<14:54,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0869, train/loss_vlb_step=0.000287, train/loss_step=0.0869, global_step=2284.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  57%|█████▋    | 685/1208 [19:28<14:51,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0869, train/loss_vlb_step=0.000287, train/loss_step=0.0869, global_step=2284.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  57%|█████▋    | 685/1208 [19:28<14:51,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.000146, train/loss_step=0.0393, global_step=2285.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  57%|█████▋    | 686/1208 [19:29<14:49,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.000146, train/loss_step=0.0393, global_step=2285.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  57%|█████▋    | 686/1208 [19:29<14:49,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000799, train/loss_step=0.214, global_step=2285.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  57%|█████▋    | 687/1208 [19:30<14:47,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000799, train/loss_step=0.214, global_step=2285.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  57%|█████▋    | 687/1208 [19:30<14:47,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00556, train/loss_vlb_step=2.92e-5, train/loss_step=0.00556, global_step=2285.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  57%|█████▋    | 688/1208 [19:33<14:46,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00556, train/loss_vlb_step=2.92e-5, train/loss_step=0.00556, global_step=2285.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  57%|█████▋    | 688/1208 [19:33<14:46,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000611, train/loss_step=0.179, global_step=2285.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  57%|█████▋    | 689/1208 [19:34<14:44,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000611, train/loss_step=0.179, global_step=2285.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  57%|█████▋    | 689/1208 [19:34<14:44,  1.70s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.64e-5, train/loss_step=0.0154, global_step=2286.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  57%|█████▋    | 690/1208 [19:35<14:42,  1.70s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.64e-5, train/loss_step=0.0154, global_step=2286.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  57%|█████▋    | 690/1208 [19:35<14:42,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000514, train/loss_step=0.156, global_step=2286.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  57%|█████▋    | 691/1208 [19:36<14:40,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000514, train/loss_step=0.156, global_step=2286.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  57%|█████▋    | 691/1208 [19:36<14:40,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.00087, train/loss_step=0.228, global_step=2286.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  57%|█████▋    | 692/1208 [19:39<14:39,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.00087, train/loss_step=0.228, global_step=2286.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  57%|█████▋    | 692/1208 [19:39<14:39,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000748, train/loss_step=0.201, global_step=2286.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  57%|█████▋    | 693/1208 [19:40<14:37,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000748, train/loss_step=0.201, global_step=2286.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  57%|█████▋    | 693/1208 [19:40<14:37,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000554, train/loss_step=0.165, global_step=2287.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  57%|█████▋    | 694/1208 [19:41<14:35,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000554, train/loss_step=0.165, global_step=2287.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  57%|█████▋    | 694/1208 [19:41<14:35,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00355, train/loss_step=0.428, global_step=2287.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  58%|█████▊    | 695/1208 [19:42<14:33,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00355, train/loss_step=0.428, global_step=2287.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  58%|█████▊    | 695/1208 [19:42<14:33,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.575, train/loss_vlb_step=0.00916, train/loss_step=0.575, global_step=2287.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  58%|█████▊    | 696/1208 [19:46<14:32,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.575, train/loss_vlb_step=0.00916, train/loss_step=0.575, global_step=2287.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  58%|█████▊    | 696/1208 [19:46<14:32,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000121, train/loss_step=0.031, global_step=2287.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  58%|█████▊    | 697/1208 [19:47<14:30,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000121, train/loss_step=0.031, global_step=2287.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  58%|█████▊    | 697/1208 [19:47<14:30,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000135, train/loss_step=0.0361, global_step=2288.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  58%|█████▊    | 698/1208 [19:48<14:28,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000135, train/loss_step=0.0361, global_step=2288.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  58%|█████▊    | 698/1208 [19:48<14:28,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0642, train/loss_vlb_step=0.000222, train/loss_step=0.0642, global_step=2288.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  58%|█████▊    | 699/1208 [19:49<14:26,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0642, train/loss_vlb_step=0.000222, train/loss_step=0.0642, global_step=2288.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  58%|█████▊    | 699/1208 [19:49<14:26,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000291, train/loss_step=0.086, global_step=2288.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  58%|█████▊    | 700/1208 [19:52<14:25,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000291, train/loss_step=0.086, global_step=2288.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  58%|█████▊    | 700/1208 [19:52<14:25,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.522, train/loss_vlb_step=0.0048, train/loss_step=0.522, global_step=2288.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  58%|█████▊    | 701/1208 [19:53<14:23,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.522, train/loss_vlb_step=0.0048, train/loss_step=0.522, global_step=2288.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  58%|█████▊    | 701/1208 [19:53<14:23,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.00053, train/loss_step=0.158, global_step=2289.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  58%|█████▊    | 702/1208 [19:54<14:21,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.00053, train/loss_step=0.158, global_step=2289.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  58%|█████▊    | 702/1208 [19:54<14:21,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.63e-5, train/loss_step=0.00282, global_step=2289.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  58%|█████▊    | 703/1208 [19:55<14:18,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.63e-5, train/loss_step=0.00282, global_step=2289.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  58%|█████▊    | 703/1208 [19:55<14:18,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.1e-5, train/loss_step=0.00182, global_step=2289.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  58%|█████▊    | 704/1208 [19:58<14:18,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.1e-5, train/loss_step=0.00182, global_step=2289.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  58%|█████▊    | 704/1208 [19:58<14:18,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0565, train/loss_vlb_step=0.000199, train/loss_step=0.0565, global_step=2289.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  58%|█████▊    | 705/1208 [19:59<14:16,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0565, train/loss_vlb_step=0.000199, train/loss_step=0.0565, global_step=2289.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  58%|█████▊    | 705/1208 [19:59<14:16,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00273, train/loss_step=0.409, global_step=2290.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  58%|█████▊    | 706/1208 [20:01<14:13,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00273, train/loss_step=0.409, global_step=2290.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  58%|█████▊    | 706/1208 [20:01<14:13,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=1.54e-5, train/loss_step=0.00263, global_step=2290.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  59%|█████▊    | 707/1208 [20:02<14:11,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=1.54e-5, train/loss_step=0.00263, global_step=2290.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  59%|█████▊    | 707/1208 [20:02<14:11,  1.70s/it, loss=0.179, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00115, train/loss_step=0.268, global_step=2290.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  59%|█████▊    | 708/1208 [20:05<14:11,  1.70s/it, loss=0.179, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00115, train/loss_step=0.268, global_step=2290.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  59%|█████▊    | 708/1208 [20:05<14:11,  1.70s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.000146, train/loss_step=0.0394, global_step=2290.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  59%|█████▊    | 709/1208 [20:06<14:09,  1.70s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.000146, train/loss_step=0.0394, global_step=2290.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  59%|█████▊    | 709/1208 [20:06<14:09,  1.70s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00316, train/loss_vlb_step=1.76e-5, train/loss_step=0.00316, global_step=2291.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  59%|█████▉    | 710/1208 [20:07<14:06,  1.70s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00316, train/loss_vlb_step=1.76e-5, train/loss_step=0.00316, global_step=2291.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  59%|█████▉    | 710/1208 [20:07<14:06,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=1.29e-5, train/loss_step=0.00223, global_step=2291.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  59%|█████▉    | 711/1208 [20:08<14:04,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=1.29e-5, train/loss_step=0.00223, global_step=2291.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  59%|█████▉    | 711/1208 [20:08<14:04,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0866, train/loss_vlb_step=0.000285, train/loss_step=0.0866, global_step=2291.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  59%|█████▉    | 712/1208 [20:11<14:04,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0866, train/loss_vlb_step=0.000285, train/loss_step=0.0866, global_step=2291.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  59%|█████▉    | 712/1208 [20:11<14:04,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.000129, train/loss_step=0.033, global_step=2291.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  59%|█████▉    | 713/1208 [20:12<14:01,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.000129, train/loss_step=0.033, global_step=2291.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  59%|█████▉    | 713/1208 [20:12<14:01,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0814, train/loss_vlb_step=0.000271, train/loss_step=0.0814, global_step=2292.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  59%|█████▉    | 714/1208 [20:13<13:59,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0814, train/loss_vlb_step=0.000271, train/loss_step=0.0814, global_step=2292.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  59%|█████▉    | 714/1208 [20:13<13:59,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00248, train/loss_step=0.396, global_step=2292.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  59%|█████▉    | 715/1208 [20:14<13:57,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00248, train/loss_step=0.396, global_step=2292.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  59%|█████▉    | 715/1208 [20:14<13:57,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00248, train/loss_step=0.409, global_step=2292.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  59%|█████▉    | 716/1208 [20:18<13:56,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00248, train/loss_step=0.409, global_step=2292.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  59%|█████▉    | 716/1208 [20:18<13:56,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.6e-5, train/loss_step=0.0176, global_step=2292.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  59%|█████▉    | 717/1208 [20:19<13:54,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.6e-5, train/loss_step=0.0176, global_step=2292.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  59%|█████▉    | 717/1208 [20:19<13:54,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0667, train/loss_vlb_step=0.000236, train/loss_step=0.0667, global_step=2293.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  59%|█████▉    | 718/1208 [20:20<13:52,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0667, train/loss_vlb_step=0.000236, train/loss_step=0.0667, global_step=2293.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  59%|█████▉    | 718/1208 [20:20<13:52,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00131, train/loss_step=0.268, global_step=2293.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  60%|█████▉    | 719/1208 [20:21<13:50,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00131, train/loss_step=0.268, global_step=2293.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  60%|█████▉    | 719/1208 [20:21<13:50,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000815, train/loss_step=0.230, global_step=2293.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  60%|█████▉    | 720/1208 [20:24<13:49,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000815, train/loss_step=0.230, global_step=2293.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  60%|█████▉    | 720/1208 [20:24<13:49,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.000164, train/loss_step=0.043, global_step=2293.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  60%|█████▉    | 721/1208 [20:25<13:47,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.000164, train/loss_step=0.043, global_step=2293.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  60%|█████▉    | 721/1208 [20:25<13:47,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000403, train/loss_step=0.123, global_step=2294.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  60%|█████▉    | 722/1208 [20:26<13:45,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000403, train/loss_step=0.123, global_step=2294.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  60%|█████▉    | 722/1208 [20:26<13:45,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0644, train/loss_vlb_step=0.000217, train/loss_step=0.0644, global_step=2294.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  60%|█████▉    | 723/1208 [20:27<13:43,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0644, train/loss_vlb_step=0.000217, train/loss_step=0.0644, global_step=2294.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  60%|█████▉    | 723/1208 [20:27<13:43,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000434, train/loss_step=0.131, global_step=2294.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  60%|█████▉    | 724/1208 [20:30<13:42,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000434, train/loss_step=0.131, global_step=2294.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  60%|█████▉    | 724/1208 [20:30<13:42,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6.1e-5, train/loss_step=0.0135, global_step=2294.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  60%|██████    | 725/1208 [20:31<13:40,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6.1e-5, train/loss_step=0.0135, global_step=2294.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  60%|██████    | 725/1208 [20:31<13:40,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000169, train/loss_step=0.0474, global_step=2295.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  60%|██████    | 726/1208 [20:32<13:38,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000169, train/loss_step=0.0474, global_step=2295.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  60%|██████    | 726/1208 [20:32<13:38,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.0005, train/loss_step=0.151, global_step=2295.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  60%|██████    | 727/1208 [20:33<13:36,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.0005, train/loss_step=0.151, global_step=2295.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  60%|██████    | 727/1208 [20:33<13:36,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=2.28e-5, train/loss_step=0.00452, global_step=2295.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  60%|██████    | 728/1208 [20:37<13:35,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=2.28e-5, train/loss_step=0.00452, global_step=2295.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  60%|██████    | 728/1208 [20:37<13:35,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000754, train/loss_step=0.190, global_step=2295.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  60%|██████    | 729/1208 [20:38<13:33,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000754, train/loss_step=0.190, global_step=2295.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  60%|██████    | 729/1208 [20:38<13:33,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=8.1e-5, train/loss_step=0.0188, global_step=2296.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  60%|██████    | 730/1208 [20:39<13:31,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=8.1e-5, train/loss_step=0.0188, global_step=2296.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  60%|██████    | 730/1208 [20:39<13:31,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.000134, train/loss_step=0.033, global_step=2296.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  61%|██████    | 731/1208 [20:40<13:29,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.000134, train/loss_step=0.033, global_step=2296.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  61%|██████    | 731/1208 [20:40<13:29,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000138, train/loss_step=0.0388, global_step=2296.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  61%|██████    | 732/1208 [20:43<13:28,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000138, train/loss_step=0.0388, global_step=2296.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  61%|██████    | 732/1208 [20:43<13:28,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0954, train/loss_vlb_step=0.000315, train/loss_step=0.0954, global_step=2296.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  61%|██████    | 733/1208 [20:44<13:26,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0954, train/loss_vlb_step=0.000315, train/loss_step=0.0954, global_step=2296.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  61%|██████    | 733/1208 [20:44<13:26,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=6.16e-5, train/loss_step=0.0127, global_step=2297.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  61%|██████    | 734/1208 [20:45<13:24,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=6.16e-5, train/loss_step=0.0127, global_step=2297.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  61%|██████    | 734/1208 [20:45<13:24,  1.70s/it, loss=0.098, v_num=0, train/loss_simple_step=0.00393, train/loss_vlb_step=2.15e-5, train/loss_step=0.00393, global_step=2297.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  61%|██████    | 735/1208 [20:46<13:22,  1.70s/it, loss=0.098, v_num=0, train/loss_simple_step=0.00393, train/loss_vlb_step=2.15e-5, train/loss_step=0.00393, global_step=2297.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  61%|██████    | 735/1208 [20:46<13:22,  1.70s/it, loss=0.0816, v_num=0, train/loss_simple_step=0.0799, train/loss_vlb_step=0.000268, train/loss_step=0.0799, global_step=2297.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  61%|██████    | 736/1208 [20:50<13:21,  1.70s/it, loss=0.0816, v_num=0, train/loss_simple_step=0.0799, train/loss_vlb_step=0.000268, train/loss_step=0.0799, global_step=2297.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  61%|██████    | 736/1208 [20:50<13:21,  1.70s/it, loss=0.0847, v_num=0, train/loss_simple_step=0.0808, train/loss_vlb_step=0.000266, train/loss_step=0.0808, global_step=2297.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  61%|██████    | 737/1208 [20:51<13:19,  1.70s/it, loss=0.0847, v_num=0, train/loss_simple_step=0.0808, train/loss_vlb_step=0.000266, train/loss_step=0.0808, global_step=2297.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  61%|██████    | 737/1208 [20:51<13:19,  1.70s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.000168, train/loss_step=0.0456, global_step=2298.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  61%|██████    | 738/1208 [20:52<13:17,  1.70s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.000168, train/loss_step=0.0456, global_step=2298.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  61%|██████    | 738/1208 [20:52<13:17,  1.70s/it, loss=0.072, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000132, train/loss_step=0.0348, global_step=2298.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  61%|██████    | 739/1208 [20:53<13:15,  1.70s/it, loss=0.072, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000132, train/loss_step=0.0348, global_step=2298.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  61%|██████    | 739/1208 [20:53<13:15,  1.70s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.687, train/loss_vlb_step=0.0276, train/loss_step=0.687, global_step=2298.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  61%|██████▏   | 740/1208 [20:56<13:14,  1.70s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.687, train/loss_vlb_step=0.0276, train/loss_step=0.687, global_step=2298.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  61%|██████▏   | 740/1208 [20:56<13:14,  1.70s/it, loss=0.093, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=2.19e-5, train/loss_step=0.00413, global_step=2298.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  61%|██████▏   | 741/1208 [20:57<13:12,  1.70s/it, loss=0.093, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=2.19e-5, train/loss_step=0.00413, global_step=2298.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  61%|██████▏   | 741/1208 [20:57<13:12,  1.70s/it, loss=0.0883, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000119, train/loss_step=0.0295, global_step=2299.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  61%|██████▏   | 742/1208 [20:58<13:10,  1.70s/it, loss=0.0883, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000119, train/loss_step=0.0295, global_step=2299.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  61%|██████▏   | 742/1208 [20:58<13:10,  1.70s/it, loss=0.0895, v_num=0, train/loss_simple_step=0.0876, train/loss_vlb_step=0.000292, train/loss_step=0.0876, global_step=2299.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  62%|██████▏   | 743/1208 [20:59<13:08,  1.70s/it, loss=0.0895, v_num=0, train/loss_simple_step=0.0876, train/loss_vlb_step=0.000292, train/loss_step=0.0876, global_step=2299.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  62%|██████▏   | 743/1208 [20:59<13:08,  1.70s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000103, train/loss_step=0.0266, global_step=2299.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  62%|██████▏   | 744/1208 [21:02<13:07,  1.70s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000103, train/loss_step=0.0266, global_step=2299.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  62%|██████▏   | 744/1208 [21:02<13:07,  1.70s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000647, train/loss_step=0.193, global_step=2299.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  62%|██████▏   | 745/1208 [21:03<13:05,  1.70s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000647, train/loss_step=0.193, global_step=2299.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  62%|██████▏   | 745/1208 [21:03<13:05,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000832, train/loss_step=0.210, global_step=2300.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  62%|██████▏   | 746/1208 [21:05<13:03,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000832, train/loss_step=0.210, global_step=2300.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  62%|██████▏   | 746/1208 [21:05<13:03,  1.70s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.000126, train/loss_step=0.0313, global_step=2300.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  62%|██████▏   | 747/1208 [21:06<13:01,  1.69s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.000126, train/loss_step=0.0313, global_step=2300.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  62%|██████▏   | 747/1208 [21:06<13:01,  1.69s/it, loss=0.11, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00166, train/loss_step=0.290, global_step=2300.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]     Epoch 7:  62%|██████▏   | 748/1208 [21:09<13:00,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00166, train/loss_step=0.290, global_step=2300.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  62%|██████▏   | 748/1208 [21:09<13:00,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00153, train/loss_step=0.295, global_step=2300.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  62%|██████▏   | 749/1208 [21:10<12:58,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00153, train/loss_step=0.295, global_step=2300.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  62%|██████▏   | 749/1208 [21:10<12:58,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000461, train/loss_step=0.135, global_step=2301.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  62%|██████▏   | 750/1208 [21:11<12:56,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000461, train/loss_step=0.135, global_step=2301.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  62%|██████▏   | 750/1208 [21:11<12:56,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.487, train/loss_vlb_step=0.00362, train/loss_step=0.487, global_step=2301.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  62%|██████▏   | 751/1208 [21:12<12:54,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.487, train/loss_vlb_step=0.00362, train/loss_step=0.487, global_step=2301.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  62%|██████▏   | 751/1208 [21:12<12:54,  1.69s/it, loss=0.157, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.0018, train/loss_step=0.301, global_step=2301.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  62%|██████▏   | 752/1208 [21:15<12:53,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.0018, train/loss_step=0.301, global_step=2301.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  62%|██████▏   | 752/1208 [21:15<12:53,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.95e-5, train/loss_step=0.0102, global_step=2301.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  62%|██████▏   | 753/1208 [21:16<12:51,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.95e-5, train/loss_step=0.0102, global_step=2301.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  62%|██████▏   | 753/1208 [21:16<12:51,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.00049, train/loss_step=0.146, global_step=2302.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  62%|██████▏   | 754/1208 [21:17<12:49,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.00049, train/loss_step=0.146, global_step=2302.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  62%|██████▏   | 754/1208 [21:17<12:49,  1.69s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0684, train/loss_vlb_step=0.000228, train/loss_step=0.0684, global_step=2302.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  62%|██████▎   | 755/1208 [21:18<12:47,  1.69s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0684, train/loss_vlb_step=0.000228, train/loss_step=0.0684, global_step=2302.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  62%|██████▎   | 755/1208 [21:18<12:47,  1.69s/it, loss=0.183, v_num=0, train/loss_simple_step=0.497, train/loss_vlb_step=0.00376, train/loss_step=0.497, global_step=2302.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  63%|██████▎   | 756/1208 [21:22<12:46,  1.70s/it, loss=0.183, v_num=0, train/loss_simple_step=0.497, train/loss_vlb_step=0.00376, train/loss_step=0.497, global_step=2302.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  63%|██████▎   | 756/1208 [21:22<12:46,  1.70s/it, loss=0.201, v_num=0, train/loss_simple_step=0.438, train/loss_vlb_step=0.00363, train/loss_step=0.438, global_step=2302.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  63%|██████▎   | 757/1208 [21:23<12:44,  1.69s/it, loss=0.201, v_num=0, train/loss_simple_step=0.438, train/loss_vlb_step=0.00363, train/loss_step=0.438, global_step=2302.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  63%|██████▎   | 757/1208 [21:23<12:44,  1.69s/it, loss=0.234, v_num=0, train/loss_simple_step=0.708, train/loss_vlb_step=0.0406, train/loss_step=0.708, global_step=2303.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  63%|██████▎   | 758/1208 [21:24<12:42,  1.69s/it, loss=0.234, v_num=0, train/loss_simple_step=0.708, train/loss_vlb_step=0.0406, train/loss_step=0.708, global_step=2303.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  63%|██████▎   | 758/1208 [21:24<12:42,  1.69s/it, loss=0.242, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000643, train/loss_step=0.186, global_step=2303.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  63%|██████▎   | 759/1208 [21:25<12:40,  1.69s/it, loss=0.242, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000643, train/loss_step=0.186, global_step=2303.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  63%|██████▎   | 759/1208 [21:25<12:40,  1.69s/it, loss=0.209, v_num=0, train/loss_simple_step=0.0375, train/loss_vlb_step=0.000135, train/loss_step=0.0375, global_step=2303.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  63%|██████▎   | 760/1208 [21:28<12:39,  1.70s/it, loss=0.209, v_num=0, train/loss_simple_step=0.0375, train/loss_vlb_step=0.000135, train/loss_step=0.0375, global_step=2303.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  63%|██████▎   | 760/1208 [21:28<12:39,  1.70s/it, loss=0.213, v_num=0, train/loss_simple_step=0.0876, train/loss_vlb_step=0.00029, train/loss_step=0.0876, global_step=2303.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  63%|██████▎   | 761/1208 [21:29<12:37,  1.69s/it, loss=0.213, v_num=0, train/loss_simple_step=0.0876, train/loss_vlb_step=0.00029, train/loss_step=0.0876, global_step=2303.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  63%|██████▎   | 761/1208 [21:29<12:37,  1.69s/it, loss=0.214, v_num=0, train/loss_simple_step=0.0506, train/loss_vlb_step=0.000188, train/loss_step=0.0506, global_step=2304.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  63%|██████▎   | 762/1208 [21:30<12:35,  1.69s/it, loss=0.214, v_num=0, train/loss_simple_step=0.0506, train/loss_vlb_step=0.000188, train/loss_step=0.0506, global_step=2304.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  63%|██████▎   | 762/1208 [21:30<12:35,  1.69s/it, loss=0.241, v_num=0, train/loss_simple_step=0.617, train/loss_vlb_step=0.0134, train/loss_step=0.617, global_step=2304.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  63%|██████▎   | 763/1208 [21:31<12:33,  1.69s/it, loss=0.241, v_num=0, train/loss_simple_step=0.617, train/loss_vlb_step=0.0134, train/loss_step=0.617, global_step=2304.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  63%|██████▎   | 763/1208 [21:31<12:33,  1.69s/it, loss=0.241, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000116, train/loss_step=0.0309, global_step=2304.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  63%|██████▎   | 764/1208 [21:34<12:32,  1.69s/it, loss=0.241, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000116, train/loss_step=0.0309, global_step=2304.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  63%|██████▎   | 764/1208 [21:34<12:32,  1.69s/it, loss=0.233, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.000158, train/loss_step=0.041, global_step=2304.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  63%|██████▎   | 765/1208 [21:35<12:30,  1.69s/it, loss=0.233, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.000158, train/loss_step=0.041, global_step=2304.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  63%|██████▎   | 765/1208 [21:35<12:30,  1.69s/it, loss=0.225, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000159, train/loss_step=0.0445, global_step=2305.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  63%|██████▎   | 766/1208 [21:36<12:28,  1.69s/it, loss=0.225, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000159, train/loss_step=0.0445, global_step=2305.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  63%|██████▎   | 766/1208 [21:36<12:28,  1.69s/it, loss=0.225, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.85e-5, train/loss_step=0.0245, global_step=2305.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  63%|██████▎   | 767/1208 [21:37<12:26,  1.69s/it, loss=0.225, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.85e-5, train/loss_step=0.0245, global_step=2305.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  63%|██████▎   | 767/1208 [21:37<12:26,  1.69s/it, loss=0.222, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000846, train/loss_step=0.228, global_step=2305.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  64%|██████▎   | 768/1208 [21:41<12:25,  1.69s/it, loss=0.222, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000846, train/loss_step=0.228, global_step=2305.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  64%|██████▎   | 768/1208 [21:41<12:25,  1.69s/it, loss=0.232, v_num=0, train/loss_simple_step=0.505, train/loss_vlb_step=0.00533, train/loss_step=0.505, global_step=2305.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  64%|██████▎   | 769/1208 [21:42<12:23,  1.69s/it, loss=0.232, v_num=0, train/loss_simple_step=0.505, train/loss_vlb_step=0.00533, train/loss_step=0.505, global_step=2305.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  64%|██████▎   | 769/1208 [21:42<12:23,  1.69s/it, loss=0.232, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000463, train/loss_step=0.141, global_step=2306.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  64%|██████▎   | 770/1208 [21:43<12:21,  1.69s/it, loss=0.232, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000463, train/loss_step=0.141, global_step=2306.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  64%|██████▎   | 770/1208 [21:43<12:21,  1.69s/it, loss=0.218, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000685, train/loss_step=0.195, global_step=2306.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  64%|██████▍   | 771/1208 [21:44<12:19,  1.69s/it, loss=0.218, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000685, train/loss_step=0.195, global_step=2306.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  64%|██████▍   | 771/1208 [21:44<12:19,  1.69s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0941, train/loss_vlb_step=0.00031, train/loss_step=0.0941, global_step=2306.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  64%|██████▍   | 772/1208 [21:47<12:18,  1.69s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0941, train/loss_vlb_step=0.00031, train/loss_step=0.0941, global_step=2306.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  64%|██████▍   | 772/1208 [21:47<12:18,  1.69s/it, loss=0.218, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.00081, train/loss_step=0.220, global_step=2306.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  64%|██████▍   | 773/1208 [21:48<12:16,  1.69s/it, loss=0.218, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.00081, train/loss_step=0.220, global_step=2306.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  64%|██████▍   | 773/1208 [21:48<12:16,  1.69s/it, loss=0.215, v_num=0, train/loss_simple_step=0.0959, train/loss_vlb_step=0.000316, train/loss_step=0.0959, global_step=2307.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  64%|██████▍   | 774/1208 [21:49<12:14,  1.69s/it, loss=0.215, v_num=0, train/loss_simple_step=0.0959, train/loss_vlb_step=0.000316, train/loss_step=0.0959, global_step=2307.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  64%|██████▍   | 774/1208 [21:49<12:14,  1.69s/it, loss=0.213, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000108, train/loss_step=0.0262, global_step=2307.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  64%|██████▍   | 775/1208 [21:50<12:12,  1.69s/it, loss=0.213, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000108, train/loss_step=0.0262, global_step=2307.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  64%|██████▍   | 775/1208 [21:50<12:12,  1.69s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0343, train/loss_vlb_step=0.000133, train/loss_step=0.0343, global_step=2307.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  64%|██████▍   | 776/1208 [21:53<12:11,  1.69s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0343, train/loss_vlb_step=0.000133, train/loss_step=0.0343, global_step=2307.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  64%|██████▍   | 776/1208 [21:53<12:11,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000916, train/loss_step=0.228, global_step=2307.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  64%|██████▍   | 777/1208 [21:55<12:09,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000916, train/loss_step=0.228, global_step=2307.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  64%|██████▍   | 777/1208 [21:55<12:09,  1.69s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.000278, train/loss_step=0.0817, global_step=2308.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  64%|██████▍   | 778/1208 [21:56<12:07,  1.69s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.000278, train/loss_step=0.0817, global_step=2308.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  64%|██████▍   | 778/1208 [21:56<12:07,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0859, train/loss_vlb_step=0.000286, train/loss_step=0.0859, global_step=2308.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  64%|██████▍   | 779/1208 [21:57<12:05,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0859, train/loss_vlb_step=0.000286, train/loss_step=0.0859, global_step=2308.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  64%|██████▍   | 779/1208 [21:57<12:05,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.00037, train/loss_step=0.113, global_step=2308.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  65%|██████▍   | 780/1208 [22:00<12:04,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.00037, train/loss_step=0.113, global_step=2308.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  65%|██████▍   | 780/1208 [22:00<12:04,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000313, train/loss_step=0.095, global_step=2308.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  65%|██████▍   | 781/1208 [22:01<12:02,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000313, train/loss_step=0.095, global_step=2308.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  65%|██████▍   | 781/1208 [22:01<12:02,  1.69s/it, loss=0.173, v_num=0, train/loss_simple_step=0.571, train/loss_vlb_step=0.00807, train/loss_step=0.571, global_step=2309.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  65%|██████▍   | 782/1208 [22:02<12:00,  1.69s/it, loss=0.173, v_num=0, train/loss_simple_step=0.571, train/loss_vlb_step=0.00807, train/loss_step=0.571, global_step=2309.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  65%|██████▍   | 782/1208 [22:02<12:00,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000685, train/loss_step=0.197, global_step=2309.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  65%|██████▍   | 783/1208 [22:03<11:58,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000685, train/loss_step=0.197, global_step=2309.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  65%|██████▍   | 783/1208 [22:03<11:58,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000512, train/loss_step=0.155, global_step=2309.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  65%|██████▍   | 784/1208 [22:06<11:57,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000512, train/loss_step=0.155, global_step=2309.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  65%|██████▍   | 784/1208 [22:06<11:57,  1.69s/it, loss=0.186, v_num=0, train/loss_simple_step=0.597, train/loss_vlb_step=0.0106, train/loss_step=0.597, global_step=2309.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  65%|██████▍   | 785/1208 [22:07<11:55,  1.69s/it, loss=0.186, v_num=0, train/loss_simple_step=0.597, train/loss_vlb_step=0.0106, train/loss_step=0.597, global_step=2309.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  65%|██████▍   | 785/1208 [22:07<11:55,  1.69s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000149, train/loss_step=0.0412, global_step=2310.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  65%|██████▌   | 786/1208 [22:08<11:53,  1.69s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000149, train/loss_step=0.0412, global_step=2310.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  65%|██████▌   | 786/1208 [22:08<11:53,  1.69s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=1.27e-5, train/loss_step=0.00217, global_step=2310.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  65%|██████▌   | 787/1208 [22:09<11:51,  1.69s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=1.27e-5, train/loss_step=0.00217, global_step=2310.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  65%|██████▌   | 787/1208 [22:09<11:51,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=2310.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  65%|██████▌   | 788/1208 [22:13<11:50,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=2310.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  65%|██████▌   | 788/1208 [22:13<11:50,  1.69s/it, loss=0.157, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.00011, train/loss_step=0.029, global_step=2310.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  65%|██████▌   | 789/1208 [22:14<11:48,  1.69s/it, loss=0.157, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.00011, train/loss_step=0.029, global_step=2310.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  65%|██████▌   | 789/1208 [22:14<11:48,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00674, train/loss_vlb_step=3.38e-5, train/loss_step=0.00674, global_step=2311.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  65%|██████▌   | 790/1208 [22:15<11:46,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00674, train/loss_vlb_step=3.38e-5, train/loss_step=0.00674, global_step=2311.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  65%|██████▌   | 790/1208 [22:15<11:46,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.00019, train/loss_step=0.0524, global_step=2311.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  65%|██████▌   | 791/1208 [22:16<11:44,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.00019, train/loss_step=0.0524, global_step=2311.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  65%|██████▌   | 791/1208 [22:16<11:44,  1.69s/it, loss=0.145, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000451, train/loss_step=0.134, global_step=2311.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  66%|██████▌   | 792/1208 [22:19<11:43,  1.69s/it, loss=0.145, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000451, train/loss_step=0.134, global_step=2311.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  66%|██████▌   | 792/1208 [22:19<11:43,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00217, train/loss_step=0.344, global_step=2311.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  66%|██████▌   | 793/1208 [22:20<11:41,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00217, train/loss_step=0.344, global_step=2311.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  66%|██████▌   | 793/1208 [22:20<11:41,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000453, train/loss_step=0.138, global_step=2312.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  66%|██████▌   | 794/1208 [22:21<11:39,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000453, train/loss_step=0.138, global_step=2312.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  66%|██████▌   | 794/1208 [22:21<11:39,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00502, train/loss_vlb_step=2.69e-5, train/loss_step=0.00502, global_step=2312.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  66%|██████▌   | 795/1208 [22:22<11:37,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00502, train/loss_vlb_step=2.69e-5, train/loss_step=0.00502, global_step=2312.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  66%|██████▌   | 795/1208 [22:22<11:37,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.12e-5, train/loss_step=0.00186, global_step=2312.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  66%|██████▌   | 796/1208 [22:25<11:36,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.12e-5, train/loss_step=0.00186, global_step=2312.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  66%|██████▌   | 796/1208 [22:25<11:36,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000888, train/loss_step=0.237, global_step=2312.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  66%|██████▌   | 797/1208 [22:26<11:34,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000888, train/loss_step=0.237, global_step=2312.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  66%|██████▌   | 797/1208 [22:26<11:34,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.66e-5, train/loss_step=0.0104, global_step=2313.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  66%|██████▌   | 798/1208 [22:28<11:32,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.66e-5, train/loss_step=0.0104, global_step=2313.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  66%|██████▌   | 798/1208 [22:28<11:32,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=7.04e-5, train/loss_step=0.0162, global_step=2313.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  66%|██████▌   | 799/1208 [22:29<11:30,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=7.04e-5, train/loss_step=0.0162, global_step=2313.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  66%|██████▌   | 799/1208 [22:29<11:30,  1.69s/it, loss=0.145, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000454, train/loss_step=0.138, global_step=2313.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  66%|██████▌   | 800/1208 [22:32<11:29,  1.69s/it, loss=0.145, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000454, train/loss_step=0.138, global_step=2313.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  66%|██████▌   | 800/1208 [22:32<11:29,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000162, train/loss_step=0.0463, global_step=2313.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  66%|██████▋   | 801/1208 [22:33<11:27,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000162, train/loss_step=0.0463, global_step=2313.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  66%|██████▋   | 801/1208 [22:33<11:27,  1.69s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0027, train/loss_vlb_step=1.51e-5, train/loss_step=0.0027, global_step=2314.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  66%|██████▋   | 802/1208 [22:34<11:25,  1.69s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0027, train/loss_vlb_step=1.51e-5, train/loss_step=0.0027, global_step=2314.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  66%|██████▋   | 802/1208 [22:34<11:25,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.490, train/loss_vlb_step=0.00425, train/loss_step=0.490, global_step=2314.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  66%|██████▋   | 803/1208 [22:35<11:23,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.490, train/loss_vlb_step=0.00425, train/loss_step=0.490, global_step=2314.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  66%|██████▋   | 803/1208 [22:35<11:23,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=1.86e-5, train/loss_step=0.00326, global_step=2314.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  67%|██████▋   | 804/1208 [22:38<11:22,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=1.86e-5, train/loss_step=0.00326, global_step=2314.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  67%|██████▋   | 804/1208 [22:38<11:22,  1.69s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=2314.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  67%|██████▋   | 805/1208 [22:39<11:20,  1.69s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=2314.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  67%|██████▋   | 805/1208 [22:39<11:20,  1.69s/it, loss=0.111, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00148, train/loss_step=0.318, global_step=2315.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  67%|██████▋   | 806/1208 [22:40<11:18,  1.69s/it, loss=0.111, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00148, train/loss_step=0.318, global_step=2315.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  67%|██████▋   | 806/1208 [22:40<11:18,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0728, train/loss_vlb_step=0.000241, train/loss_step=0.0728, global_step=2315.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  67%|██████▋   | 807/1208 [22:41<11:16,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0728, train/loss_vlb_step=0.000241, train/loss_step=0.0728, global_step=2315.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  67%|██████▋   | 807/1208 [22:41<11:16,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00367, train/loss_vlb_step=1.97e-5, train/loss_step=0.00367, global_step=2315.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  67%|██████▋   | 808/1208 [22:44<11:15,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00367, train/loss_vlb_step=1.97e-5, train/loss_step=0.00367, global_step=2315.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  67%|██████▋   | 808/1208 [22:44<11:15,  1.69s/it, loss=0.111, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000289, train/loss_step=0.086, global_step=2315.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  67%|██████▋   | 809/1208 [22:46<11:13,  1.69s/it, loss=0.111, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000289, train/loss_step=0.086, global_step=2315.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  67%|██████▋   | 809/1208 [22:46<11:13,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00138, train/loss_step=0.289, global_step=2316.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  67%|██████▋   | 810/1208 [22:47<11:11,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00138, train/loss_step=0.289, global_step=2316.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  67%|██████▋   | 810/1208 [22:47<11:11,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.0011, train/loss_step=0.264, global_step=2316.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  67%|██████▋   | 811/1208 [22:48<11:09,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.0011, train/loss_step=0.264, global_step=2316.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  67%|██████▋   | 811/1208 [22:48<11:09,  1.69s/it, loss=0.157, v_num=0, train/loss_simple_step=0.551, train/loss_vlb_step=0.0104, train/loss_step=0.551, global_step=2316.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  67%|██████▋   | 812/1208 [22:51<11:08,  1.69s/it, loss=0.157, v_num=0, train/loss_simple_step=0.551, train/loss_vlb_step=0.0104, train/loss_step=0.551, global_step=2316.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  67%|██████▋   | 812/1208 [22:51<11:08,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.812, train/loss_vlb_step=0.0522, train/loss_step=0.812, global_step=2316.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  67%|██████▋   | 813/1208 [22:52<11:06,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.812, train/loss_vlb_step=0.0522, train/loss_step=0.812, global_step=2316.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  67%|██████▋   | 813/1208 [22:52<11:06,  1.69s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00947, train/loss_vlb_step=4.6e-5, train/loss_step=0.00947, global_step=2317.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  67%|██████▋   | 814/1208 [22:53<11:04,  1.69s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00947, train/loss_vlb_step=4.6e-5, train/loss_step=0.00947, global_step=2317.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  67%|██████▋   | 814/1208 [22:53<11:04,  1.69s/it, loss=0.178, v_num=0, train/loss_simple_step=0.090, train/loss_vlb_step=0.000296, train/loss_step=0.090, global_step=2317.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  67%|██████▋   | 815/1208 [22:54<11:02,  1.69s/it, loss=0.178, v_num=0, train/loss_simple_step=0.090, train/loss_vlb_step=0.000296, train/loss_step=0.090, global_step=2317.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  67%|██████▋   | 815/1208 [22:54<11:02,  1.69s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.27e-5, train/loss_step=0.0216, global_step=2317.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  68%|██████▊   | 816/1208 [22:57<11:01,  1.69s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.27e-5, train/loss_step=0.0216, global_step=2317.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  68%|██████▊   | 816/1208 [22:57<11:01,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=2.74e-5, train/loss_step=0.00518, global_step=2317.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  68%|██████▊   | 817/1208 [22:58<10:59,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=2.74e-5, train/loss_step=0.00518, global_step=2317.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  68%|██████▊   | 817/1208 [22:58<10:59,  1.69s/it, loss=0.177, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000711, train/loss_step=0.203, global_step=2318.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  68%|██████▊   | 818/1208 [22:59<10:57,  1.69s/it, loss=0.177, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000711, train/loss_step=0.203, global_step=2318.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  68%|██████▊   | 818/1208 [22:59<10:57,  1.69s/it, loss=0.194, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00144, train/loss_step=0.349, global_step=2318.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  68%|██████▊   | 819/1208 [23:00<10:55,  1.69s/it, loss=0.194, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00144, train/loss_step=0.349, global_step=2318.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  68%|██████▊   | 819/1208 [23:00<10:55,  1.69s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0582, train/loss_vlb_step=0.000204, train/loss_step=0.0582, global_step=2318.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  68%|██████▊   | 820/1208 [23:04<10:54,  1.69s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0582, train/loss_vlb_step=0.000204, train/loss_step=0.0582, global_step=2318.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  68%|██████▊   | 820/1208 [23:04<10:54,  1.69s/it, loss=0.197, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000735, train/loss_step=0.200, global_step=2318.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  68%|██████▊   | 821/1208 [23:05<10:52,  1.69s/it, loss=0.197, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000735, train/loss_step=0.200, global_step=2318.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  68%|██████▊   | 821/1208 [23:05<10:52,  1.69s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0992, train/loss_vlb_step=0.000326, train/loss_step=0.0992, global_step=2319.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  68%|██████▊   | 822/1208 [23:06<10:50,  1.69s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0992, train/loss_vlb_step=0.000326, train/loss_step=0.0992, global_step=2319.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  68%|██████▊   | 822/1208 [23:06<10:50,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0436, train/loss_vlb_step=0.00015, train/loss_step=0.0436, global_step=2319.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  68%|██████▊   | 823/1208 [23:07<10:48,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0436, train/loss_vlb_step=0.00015, train/loss_step=0.0436, global_step=2319.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  68%|██████▊   | 823/1208 [23:07<10:48,  1.69s/it, loss=0.189, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000615, train/loss_step=0.177, global_step=2319.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  68%|██████▊   | 824/1208 [23:10<10:47,  1.69s/it, loss=0.189, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000615, train/loss_step=0.177, global_step=2319.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  68%|██████▊   | 824/1208 [23:10<10:47,  1.69s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.94e-5, train/loss_step=0.0135, global_step=2319.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  68%|██████▊   | 825/1208 [23:11<10:46,  1.69s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.94e-5, train/loss_step=0.0135, global_step=2319.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  68%|██████▊   | 825/1208 [23:11<10:46,  1.69s/it, loss=0.182, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00133, train/loss_step=0.292, global_step=2320.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  68%|██████▊   | 826/1208 [23:12<10:44,  1.69s/it, loss=0.182, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00133, train/loss_step=0.292, global_step=2320.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  68%|██████▊   | 826/1208 [23:12<10:44,  1.69s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0808, train/loss_vlb_step=0.00027, train/loss_step=0.0808, global_step=2320.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  68%|██████▊   | 827/1208 [23:13<10:42,  1.69s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0808, train/loss_vlb_step=0.00027, train/loss_step=0.0808, global_step=2320.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  68%|██████▊   | 827/1208 [23:13<10:42,  1.69s/it, loss=0.205, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.00735, train/loss_step=0.450, global_step=2320.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  69%|██████▊   | 828/1208 [23:16<10:41,  1.69s/it, loss=0.205, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.00735, train/loss_step=0.450, global_step=2320.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  69%|██████▊   | 828/1208 [23:16<10:41,  1.69s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0391, train/loss_vlb_step=0.000149, train/loss_step=0.0391, global_step=2320.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  69%|██████▊   | 829/1208 [23:17<10:39,  1.69s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0391, train/loss_vlb_step=0.000149, train/loss_step=0.0391, global_step=2320.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  69%|██████▊   | 829/1208 [23:17<10:39,  1.69s/it, loss=0.233, v_num=0, train/loss_simple_step=0.910, train/loss_vlb_step=0.458, train/loss_step=0.910, global_step=2321.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]     Epoch 7:  69%|██████▊   | 830/1208 [23:18<10:37,  1.69s/it, loss=0.233, v_num=0, train/loss_simple_step=0.910, train/loss_vlb_step=0.458, train/loss_step=0.910, global_step=2321.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  69%|██████▊   | 830/1208 [23:18<10:37,  1.69s/it, loss=0.221, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.13e-5, train/loss_step=0.0112, global_step=2321.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  69%|██████▉   | 831/1208 [23:20<10:35,  1.68s/it, loss=0.221, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.13e-5, train/loss_step=0.0112, global_step=2321.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  69%|██████▉   | 831/1208 [23:20<10:35,  1.68s/it, loss=0.2, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000449, train/loss_step=0.133, global_step=2321.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  69%|██████▉   | 832/1208 [23:23<10:34,  1.69s/it, loss=0.2, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000449, train/loss_step=0.133, global_step=2321.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  69%|██████▉   | 832/1208 [23:23<10:34,  1.69s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0535, train/loss_vlb_step=0.000186, train/loss_step=0.0535, global_step=2321.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  69%|██████▉   | 833/1208 [23:24<10:32,  1.69s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0535, train/loss_vlb_step=0.000186, train/loss_step=0.0535, global_step=2321.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  69%|██████▉   | 833/1208 [23:24<10:32,  1.69s/it, loss=0.168, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000403, train/loss_step=0.122, global_step=2322.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  69%|██████▉   | 834/1208 [23:25<10:30,  1.69s/it, loss=0.168, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000403, train/loss_step=0.122, global_step=2322.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  69%|██████▉   | 834/1208 [23:25<10:30,  1.69s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=6.94e-5, train/loss_step=0.0163, global_step=2322.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  69%|██████▉   | 835/1208 [23:26<10:28,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=6.94e-5, train/loss_step=0.0163, global_step=2322.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  69%|██████▉   | 835/1208 [23:26<10:28,  1.68s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0819, train/loss_vlb_step=0.000277, train/loss_step=0.0819, global_step=2322.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  69%|██████▉   | 836/1208 [23:29<10:27,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0819, train/loss_vlb_step=0.000277, train/loss_step=0.0819, global_step=2322.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  69%|██████▉   | 836/1208 [23:29<10:27,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.77e-5, train/loss_step=0.00313, global_step=2322.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  69%|██████▉   | 837/1208 [23:30<10:25,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.77e-5, train/loss_step=0.00313, global_step=2322.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  69%|██████▉   | 837/1208 [23:30<10:25,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.000998, train/loss_step=0.247, global_step=2323.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  69%|██████▉   | 838/1208 [23:31<10:23,  1.68s/it, loss=0.169, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.000998, train/loss_step=0.247, global_step=2323.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  69%|██████▉   | 838/1208 [23:31<10:23,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.2e-5, train/loss_step=0.00197, global_step=2323.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  69%|██████▉   | 839/1208 [23:32<10:21,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.2e-5, train/loss_step=0.00197, global_step=2323.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  69%|██████▉   | 839/1208 [23:32<10:21,  1.68s/it, loss=0.173, v_num=0, train/loss_simple_step=0.478, train/loss_vlb_step=0.00388, train/loss_step=0.478, global_step=2323.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  70%|██████▉   | 840/1208 [23:35<10:20,  1.69s/it, loss=0.173, v_num=0, train/loss_simple_step=0.478, train/loss_vlb_step=0.00388, train/loss_step=0.478, global_step=2323.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  70%|██████▉   | 840/1208 [23:35<10:20,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0923, train/loss_vlb_step=0.000304, train/loss_step=0.0923, global_step=2323.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  70%|██████▉   | 841/1208 [23:36<10:18,  1.68s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0923, train/loss_vlb_step=0.000304, train/loss_step=0.0923, global_step=2323.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  70%|██████▉   | 841/1208 [23:36<10:18,  1.68s/it, loss=0.179, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00235, train/loss_step=0.330, global_step=2324.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  70%|██████▉   | 842/1208 [23:38<10:16,  1.68s/it, loss=0.179, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00235, train/loss_step=0.330, global_step=2324.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  70%|██████▉   | 842/1208 [23:38<10:16,  1.68s/it, loss=0.183, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000394, train/loss_step=0.120, global_step=2324.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  70%|██████▉   | 843/1208 [23:39<10:14,  1.68s/it, loss=0.183, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000394, train/loss_step=0.120, global_step=2324.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  70%|██████▉   | 843/1208 [23:39<10:14,  1.68s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00848, train/loss_vlb_step=4.05e-5, train/loss_step=0.00848, global_step=2324.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  70%|██████▉   | 844/1208 [23:42<10:13,  1.69s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00848, train/loss_vlb_step=4.05e-5, train/loss_step=0.00848, global_step=2324.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  70%|██████▉   | 844/1208 [23:42<10:13,  1.69s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0548, train/loss_vlb_step=0.000186, train/loss_step=0.0548, global_step=2324.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  70%|██████▉   | 845/1208 [23:43<10:11,  1.68s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0548, train/loss_vlb_step=0.000186, train/loss_step=0.0548, global_step=2324.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  70%|██████▉   | 845/1208 [23:43<10:11,  1.68s/it, loss=0.173, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000751, train/loss_step=0.217, global_step=2325.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  70%|███████   | 846/1208 [23:44<10:09,  1.68s/it, loss=0.173, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000751, train/loss_step=0.217, global_step=2325.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  70%|███████   | 846/1208 [23:44<10:09,  1.68s/it, loss=0.181, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000945, train/loss_step=0.245, global_step=2325.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  70%|███████   | 847/1208 [23:45<10:07,  1.68s/it, loss=0.181, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000945, train/loss_step=0.245, global_step=2325.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  70%|███████   | 847/1208 [23:45<10:07,  1.68s/it, loss=0.185, v_num=0, train/loss_simple_step=0.538, train/loss_vlb_step=0.00543, train/loss_step=0.538, global_step=2325.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  70%|███████   | 848/1208 [23:48<10:06,  1.68s/it, loss=0.185, v_num=0, train/loss_simple_step=0.538, train/loss_vlb_step=0.00543, train/loss_step=0.538, global_step=2325.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  70%|███████   | 848/1208 [23:48<10:06,  1.68s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00941, train/loss_vlb_step=4.54e-5, train/loss_step=0.00941, global_step=2325.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  70%|███████   | 849/1208 [23:49<10:04,  1.68s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00941, train/loss_vlb_step=4.54e-5, train/loss_step=0.00941, global_step=2325.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  70%|███████   | 849/1208 [23:49<10:04,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00151, train/loss_step=0.311, global_step=2326.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  70%|███████   | 850/1208 [23:50<10:02,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00151, train/loss_step=0.311, global_step=2326.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  70%|███████   | 850/1208 [23:50<10:02,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.32e-5, train/loss_step=0.0143, global_step=2326.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  70%|███████   | 851/1208 [23:51<10:00,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.32e-5, train/loss_step=0.0143, global_step=2326.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  70%|███████   | 851/1208 [23:51<10:00,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.58e-5, train/loss_step=0.00274, global_step=2326.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  71%|███████   | 852/1208 [23:55<09:59,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.58e-5, train/loss_step=0.00274, global_step=2326.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  71%|███████   | 852/1208 [23:55<09:59,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000629, train/loss_step=0.176, global_step=2326.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  71%|███████   | 853/1208 [23:56<09:57,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000629, train/loss_step=0.176, global_step=2326.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  71%|███████   | 853/1208 [23:56<09:57,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=2327.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  71%|███████   | 854/1208 [23:57<09:55,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=2327.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  71%|███████   | 854/1208 [23:57<09:55,  1.68s/it, loss=0.155, v_num=0, train/loss_simple_step=0.072, train/loss_vlb_step=0.00025, train/loss_step=0.072, global_step=2327.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  71%|███████   | 855/1208 [23:58<09:53,  1.68s/it, loss=0.155, v_num=0, train/loss_simple_step=0.072, train/loss_vlb_step=0.00025, train/loss_step=0.072, global_step=2327.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  71%|███████   | 855/1208 [23:58<09:53,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0833, train/loss_vlb_step=0.000278, train/loss_step=0.0833, global_step=2327.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  71%|███████   | 856/1208 [24:01<09:52,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0833, train/loss_vlb_step=0.000278, train/loss_step=0.0833, global_step=2327.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  71%|███████   | 856/1208 [24:01<09:52,  1.68s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.18e-5, train/loss_step=0.00197, global_step=2327.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  71%|███████   | 857/1208 [24:02<09:50,  1.68s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.18e-5, train/loss_step=0.00197, global_step=2327.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  71%|███████   | 857/1208 [24:02<09:50,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.26e-5, train/loss_step=0.00212, global_step=2328.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  71%|███████   | 858/1208 [24:03<09:48,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.26e-5, train/loss_step=0.00212, global_step=2328.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  71%|███████   | 858/1208 [24:03<09:48,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.96e-5, train/loss_step=0.0124, global_step=2328.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  71%|███████   | 859/1208 [24:04<09:46,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.96e-5, train/loss_step=0.0124, global_step=2328.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  71%|███████   | 859/1208 [24:04<09:46,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.464, train/loss_vlb_step=0.00345, train/loss_step=0.464, global_step=2328.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  71%|███████   | 860/1208 [24:07<09:45,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.464, train/loss_vlb_step=0.00345, train/loss_step=0.464, global_step=2328.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  71%|███████   | 860/1208 [24:07<09:45,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.73e-5, train/loss_step=0.0156, global_step=2328.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  71%|███████▏  | 861/1208 [24:09<09:43,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.73e-5, train/loss_step=0.0156, global_step=2328.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  71%|███████▏  | 861/1208 [24:09<09:43,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.085, train/loss_vlb_step=0.000285, train/loss_step=0.085, global_step=2329.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  71%|███████▏  | 862/1208 [24:10<09:42,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.085, train/loss_vlb_step=0.000285, train/loss_step=0.085, global_step=2329.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  71%|███████▏  | 862/1208 [24:10<09:42,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=1.24e-5, train/loss_step=0.00206, global_step=2329.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  71%|███████▏  | 863/1208 [24:11<09:40,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=1.24e-5, train/loss_step=0.00206, global_step=2329.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  71%|███████▏  | 863/1208 [24:11<09:40,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.0017, train/loss_step=0.368, global_step=2329.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]     Epoch 7:  72%|███████▏  | 864/1208 [24:14<09:39,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.0017, train/loss_step=0.368, global_step=2329.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  72%|███████▏  | 864/1208 [24:14<09:39,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00318, train/loss_vlb_step=1.81e-5, train/loss_step=0.00318, global_step=2329.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  72%|███████▏  | 865/1208 [24:15<09:37,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00318, train/loss_vlb_step=1.81e-5, train/loss_step=0.00318, global_step=2329.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  72%|███████▏  | 865/1208 [24:15<09:37,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.87e-5, train/loss_step=0.024, global_step=2330.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  72%|███████▏  | 866/1208 [24:16<09:35,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.87e-5, train/loss_step=0.024, global_step=2330.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  72%|███████▏  | 866/1208 [24:16<09:35,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00181, train/loss_step=0.335, global_step=2330.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  72%|███████▏  | 867/1208 [24:17<09:33,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00181, train/loss_step=0.335, global_step=2330.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  72%|███████▏  | 867/1208 [24:17<09:33,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.0016, train/loss_step=0.320, global_step=2330.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  72%|███████▏  | 868/1208 [24:20<09:32,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.0016, train/loss_step=0.320, global_step=2330.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  72%|███████▏  | 868/1208 [24:20<09:32,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000287, train/loss_step=0.086, global_step=2330.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  72%|███████▏  | 869/1208 [24:21<09:30,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000287, train/loss_step=0.086, global_step=2330.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  72%|███████▏  | 869/1208 [24:21<09:30,  1.68s/it, loss=0.116, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000463, train/loss_step=0.140, global_step=2331.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  72%|███████▏  | 870/1208 [24:22<09:28,  1.68s/it, loss=0.116, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000463, train/loss_step=0.140, global_step=2331.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  72%|███████▏  | 870/1208 [24:22<09:28,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000404, train/loss_step=0.122, global_step=2331.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  72%|███████▏  | 871/1208 [24:23<09:26,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000404, train/loss_step=0.122, global_step=2331.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  72%|███████▏  | 871/1208 [24:23<09:26,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.5e-5, train/loss_step=0.0234, global_step=2331.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  72%|███████▏  | 872/1208 [24:27<09:25,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.5e-5, train/loss_step=0.0234, global_step=2331.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  72%|███████▏  | 872/1208 [24:27<09:25,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=0.000102, train/loss_step=0.025, global_step=2331.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  72%|███████▏  | 873/1208 [24:28<09:23,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=0.000102, train/loss_step=0.025, global_step=2331.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  72%|███████▏  | 873/1208 [24:28<09:23,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000647, train/loss_step=0.182, global_step=2332.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  72%|███████▏  | 874/1208 [24:29<09:21,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000647, train/loss_step=0.182, global_step=2332.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  72%|███████▏  | 874/1208 [24:29<09:21,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0354, train/loss_vlb_step=0.000137, train/loss_step=0.0354, global_step=2332.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  72%|███████▏  | 875/1208 [24:30<09:19,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0354, train/loss_vlb_step=0.000137, train/loss_step=0.0354, global_step=2332.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  72%|███████▏  | 875/1208 [24:30<09:19,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.00058, train/loss_step=0.171, global_step=2332.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  73%|███████▎  | 876/1208 [24:33<09:18,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.00058, train/loss_step=0.171, global_step=2332.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  73%|███████▎  | 876/1208 [24:33<09:18,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0921, train/loss_vlb_step=0.000305, train/loss_step=0.0921, global_step=2332.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  73%|███████▎  | 877/1208 [24:34<09:16,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0921, train/loss_vlb_step=0.000305, train/loss_step=0.0921, global_step=2332.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  73%|███████▎  | 877/1208 [24:34<09:16,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000352, train/loss_step=0.106, global_step=2333.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  73%|███████▎  | 878/1208 [24:35<09:14,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000352, train/loss_step=0.106, global_step=2333.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  73%|███████▎  | 878/1208 [24:35<09:14,  1.68s/it, loss=0.162, v_num=0, train/loss_simple_step=0.638, train/loss_vlb_step=0.021, train/loss_step=0.638, global_step=2333.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  73%|███████▎  | 879/1208 [24:36<09:12,  1.68s/it, loss=0.162, v_num=0, train/loss_simple_step=0.638, train/loss_vlb_step=0.021, train/loss_step=0.638, global_step=2333.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  73%|███████▎  | 879/1208 [24:36<09:12,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000106, train/loss_step=0.0293, global_step=2333.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  73%|███████▎  | 880/1208 [24:39<09:11,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000106, train/loss_step=0.0293, global_step=2333.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  73%|███████▎  | 880/1208 [24:39<09:11,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=2333.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  73%|███████▎  | 881/1208 [24:41<09:09,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=2333.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  73%|███████▎  | 881/1208 [24:41<09:09,  1.68s/it, loss=0.181, v_num=0, train/loss_simple_step=0.811, train/loss_vlb_step=0.0826, train/loss_step=0.811, global_step=2334.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  73%|███████▎  | 882/1208 [24:42<09:07,  1.68s/it, loss=0.181, v_num=0, train/loss_simple_step=0.811, train/loss_vlb_step=0.0826, train/loss_step=0.811, global_step=2334.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  73%|███████▎  | 882/1208 [24:42<09:07,  1.68s/it, loss=0.184, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.000165, train/loss_step=0.045, global_step=2334.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  73%|███████▎  | 883/1208 [24:43<09:05,  1.68s/it, loss=0.184, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.000165, train/loss_step=0.045, global_step=2334.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  73%|███████▎  | 883/1208 [24:43<09:05,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=9.24e-6, train/loss_step=0.00151, global_step=2334.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  73%|███████▎  | 884/1208 [24:46<09:04,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=9.24e-6, train/loss_step=0.00151, global_step=2334.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  73%|███████▎  | 884/1208 [24:46<09:04,  1.68s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000114, train/loss_step=0.0297, global_step=2334.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  73%|███████▎  | 885/1208 [24:47<09:02,  1.68s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000114, train/loss_step=0.0297, global_step=2334.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  73%|███████▎  | 885/1208 [24:47<09:02,  1.68s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0761, train/loss_vlb_step=0.000257, train/loss_step=0.0761, global_step=2335.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  73%|███████▎  | 886/1208 [24:48<09:00,  1.68s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0761, train/loss_vlb_step=0.000257, train/loss_step=0.0761, global_step=2335.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  73%|███████▎  | 886/1208 [24:48<09:00,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0787, train/loss_vlb_step=0.000265, train/loss_step=0.0787, global_step=2335.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  73%|███████▎  | 887/1208 [24:49<08:59,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0787, train/loss_vlb_step=0.000265, train/loss_step=0.0787, global_step=2335.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  73%|███████▎  | 887/1208 [24:49<08:59,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000576, train/loss_step=0.164, global_step=2335.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  74%|███████▎  | 888/1208 [24:52<08:57,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000576, train/loss_step=0.164, global_step=2335.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  74%|███████▎  | 888/1208 [24:52<08:57,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6e-5, train/loss_step=0.014, global_step=2335.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  74%|███████▎  | 889/1208 [24:53<08:56,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6e-5, train/loss_step=0.014, global_step=2335.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  74%|███████▎  | 889/1208 [24:53<08:56,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000536, train/loss_step=0.158, global_step=2336.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  74%|███████▎  | 890/1208 [24:54<08:54,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000536, train/loss_step=0.158, global_step=2336.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  74%|███████▎  | 890/1208 [24:54<08:54,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00379, train/loss_vlb_step=2.12e-5, train/loss_step=0.00379, global_step=2336.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  74%|███████▍  | 891/1208 [24:55<08:52,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00379, train/loss_vlb_step=2.12e-5, train/loss_step=0.00379, global_step=2336.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  74%|███████▍  | 891/1208 [24:55<08:52,  1.68s/it, loss=0.155, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00173, train/loss_step=0.320, global_step=2336.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  74%|███████▍  | 892/1208 [24:59<08:51,  1.68s/it, loss=0.155, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00173, train/loss_step=0.320, global_step=2336.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  74%|███████▍  | 892/1208 [24:59<08:51,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00687, train/loss_vlb_step=3.56e-5, train/loss_step=0.00687, global_step=2336.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  74%|███████▍  | 893/1208 [25:00<08:49,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00687, train/loss_vlb_step=3.56e-5, train/loss_step=0.00687, global_step=2336.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  74%|███████▍  | 893/1208 [25:00<08:49,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.49e-5, train/loss_step=0.0158, global_step=2337.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  74%|███████▍  | 894/1208 [25:01<08:47,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.49e-5, train/loss_step=0.0158, global_step=2337.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  74%|███████▍  | 894/1208 [25:01<08:47,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=9.11e-5, train/loss_step=0.0221, global_step=2337.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  74%|███████▍  | 895/1208 [25:02<08:45,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=9.11e-5, train/loss_step=0.0221, global_step=2337.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  74%|███████▍  | 895/1208 [25:02<08:45,  1.68s/it, loss=0.168, v_num=0, train/loss_simple_step=0.631, train/loss_vlb_step=0.0177, train/loss_step=0.631, global_step=2337.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  74%|███████▍  | 896/1208 [25:05<08:44,  1.68s/it, loss=0.168, v_num=0, train/loss_simple_step=0.631, train/loss_vlb_step=0.0177, train/loss_step=0.631, global_step=2337.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  74%|███████▍  | 896/1208 [25:05<08:44,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00778, train/loss_vlb_step=3.78e-5, train/loss_step=0.00778, global_step=2337.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  74%|███████▍  | 897/1208 [25:06<08:42,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00778, train/loss_vlb_step=3.78e-5, train/loss_step=0.00778, global_step=2337.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  74%|███████▍  | 897/1208 [25:06<08:42,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.44e-5, train/loss_step=0.0235, global_step=2338.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  74%|███████▍  | 898/1208 [25:07<08:40,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.44e-5, train/loss_step=0.0235, global_step=2338.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  74%|███████▍  | 898/1208 [25:07<08:40,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=2.08e-5, train/loss_step=0.00378, global_step=2338.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  74%|███████▍  | 899/1208 [25:08<08:38,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=2.08e-5, train/loss_step=0.00378, global_step=2338.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  74%|███████▍  | 899/1208 [25:08<08:38,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0652, train/loss_vlb_step=0.000221, train/loss_step=0.0652, global_step=2338.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  75%|███████▍  | 900/1208 [25:11<08:37,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0652, train/loss_vlb_step=0.000221, train/loss_step=0.0652, global_step=2338.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  75%|███████▍  | 900/1208 [25:11<08:37,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000462, train/loss_step=0.140, global_step=2338.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] 
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.76it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.75it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.79it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.78it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.78it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.77it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.75it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.75it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 7:  75%|███████▍  | 901/1208 [25:42<08:45,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000462, train/loss_step=0.140, global_step=2338.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  75%|███████▍  | 901/1208 [25:42<08:45,  1.71s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000496, train/loss_step=0.143, global_step=2339.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  75%|███████▍  | 902/1208 [25:43<08:43,  1.71s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000496, train/loss_step=0.143, global_step=2339.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  75%|███████▍  | 902/1208 [25:43<08:43,  1.71s/it, loss=0.099, v_num=0, train/loss_simple_step=0.0772, train/loss_vlb_step=0.000266, train/loss_step=0.0772, global_step=2339.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  75%|███████▍  | 903/1208 [25:44<08:41,  1.71s/it, loss=0.099, v_num=0, train/loss_simple_step=0.0772, train/loss_vlb_step=0.000266, train/loss_step=0.0772, global_step=2339.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  75%|███████▍  | 903/1208 [25:44<08:41,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.517, train/loss_vlb_step=0.00353, train/loss_step=0.517, global_step=2339.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  75%|███████▍  | 904/1208 [25:47<08:40,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.517, train/loss_vlb_step=0.00353, train/loss_step=0.517, global_step=2339.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  75%|███████▍  | 904/1208 [25:47<08:40,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00254, train/loss_step=0.368, global_step=2339.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  75%|███████▍  | 905/1208 [25:48<08:38,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00254, train/loss_step=0.368, global_step=2339.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  75%|███████▍  | 905/1208 [25:48<08:38,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.04e-5, train/loss_step=0.0163, global_step=2340.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  75%|███████▌  | 906/1208 [25:49<08:36,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.04e-5, train/loss_step=0.0163, global_step=2340.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  75%|███████▌  | 906/1208 [25:49<08:36,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000566, train/loss_step=0.168, global_step=2340.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  75%|███████▌  | 907/1208 [25:50<08:34,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000566, train/loss_step=0.168, global_step=2340.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  75%|███████▌  | 907/1208 [25:50<08:34,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00674, train/loss_vlb_step=3.36e-5, train/loss_step=0.00674, global_step=2340.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  75%|███████▌  | 908/1208 [25:53<08:33,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00674, train/loss_vlb_step=3.36e-5, train/loss_step=0.00674, global_step=2340.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  75%|███████▌  | 908/1208 [25:53<08:33,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00134, train/loss_step=0.276, global_step=2340.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  75%|███████▌  | 909/1208 [25:55<08:31,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00134, train/loss_step=0.276, global_step=2340.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  75%|███████▌  | 909/1208 [25:55<08:31,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0593, train/loss_vlb_step=0.000206, train/loss_step=0.0593, global_step=2341.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  75%|███████▌  | 910/1208 [25:56<08:29,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0593, train/loss_vlb_step=0.000206, train/loss_step=0.0593, global_step=2341.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  75%|███████▌  | 910/1208 [25:56<08:29,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00119, train/loss_step=0.265, global_step=2341.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  75%|███████▌  | 911/1208 [25:57<08:27,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00119, train/loss_step=0.265, global_step=2341.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  75%|███████▌  | 911/1208 [25:57<08:27,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=1.09e-5, train/loss_step=0.00179, global_step=2341.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  75%|███████▌  | 912/1208 [26:00<08:26,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=1.09e-5, train/loss_step=0.00179, global_step=2341.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  75%|███████▌  | 912/1208 [26:00<08:26,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00253, train/loss_step=0.393, global_step=2341.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]     Epoch 7:  76%|███████▌  | 913/1208 [26:01<08:24,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00253, train/loss_step=0.393, global_step=2341.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  76%|███████▌  | 913/1208 [26:01<08:24,  1.71s/it, loss=0.171, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000987, train/loss_step=0.240, global_step=2342.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  76%|███████▌  | 914/1208 [26:02<08:22,  1.71s/it, loss=0.171, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000987, train/loss_step=0.240, global_step=2342.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  76%|███████▌  | 914/1208 [26:02<08:22,  1.71s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0899, train/loss_vlb_step=0.000303, train/loss_step=0.0899, global_step=2342.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  76%|███████▌  | 915/1208 [26:03<08:20,  1.71s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0899, train/loss_vlb_step=0.000303, train/loss_step=0.0899, global_step=2342.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  76%|███████▌  | 915/1208 [26:03<08:20,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.00011, train/loss_step=0.0273, global_step=2342.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  76%|███████▌  | 916/1208 [26:06<08:19,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.00011, train/loss_step=0.0273, global_step=2342.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  76%|███████▌  | 916/1208 [26:06<08:19,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0506, train/loss_vlb_step=0.000177, train/loss_step=0.0506, global_step=2342.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  76%|███████▌  | 917/1208 [26:07<08:17,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0506, train/loss_vlb_step=0.000177, train/loss_step=0.0506, global_step=2342.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  76%|███████▌  | 917/1208 [26:07<08:17,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.636, train/loss_vlb_step=0.0238, train/loss_step=0.636, global_step=2343.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  76%|███████▌  | 918/1208 [26:08<08:15,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.636, train/loss_vlb_step=0.0238, train/loss_step=0.636, global_step=2343.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  76%|███████▌  | 918/1208 [26:08<08:15,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00114, train/loss_step=0.263, global_step=2343.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  76%|███████▌  | 919/1208 [26:09<08:13,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00114, train/loss_step=0.263, global_step=2343.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  76%|███████▌  | 919/1208 [26:09<08:13,  1.71s/it, loss=0.193, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00042, train/loss_step=0.128, global_step=2343.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  76%|███████▌  | 920/1208 [26:13<08:12,  1.71s/it, loss=0.193, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00042, train/loss_step=0.128, global_step=2343.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  76%|███████▌  | 920/1208 [26:13<08:12,  1.71s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.01e-5, train/loss_step=0.0144, global_step=2343.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  76%|███████▌  | 921/1208 [26:14<08:10,  1.71s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.01e-5, train/loss_step=0.0144, global_step=2343.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  76%|███████▌  | 921/1208 [26:14<08:10,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000131, train/loss_step=0.0348, global_step=2344.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  76%|███████▋  | 922/1208 [26:15<08:08,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000131, train/loss_step=0.0348, global_step=2344.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  76%|███████▋  | 922/1208 [26:15<08:08,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0605, train/loss_vlb_step=0.00021, train/loss_step=0.0605, global_step=2344.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  76%|███████▋  | 923/1208 [26:16<08:06,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0605, train/loss_vlb_step=0.00021, train/loss_step=0.0605, global_step=2344.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  76%|███████▋  | 923/1208 [26:16<08:06,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0539, train/loss_vlb_step=0.000187, train/loss_step=0.0539, global_step=2344.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  76%|███████▋  | 924/1208 [26:19<08:05,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0539, train/loss_vlb_step=0.000187, train/loss_step=0.0539, global_step=2344.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  76%|███████▋  | 924/1208 [26:19<08:05,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000529, train/loss_step=0.156, global_step=2344.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  77%|███████▋  | 925/1208 [26:20<08:03,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000529, train/loss_step=0.156, global_step=2344.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  77%|███████▋  | 925/1208 [26:20<08:03,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0041, train/loss_vlb_step=2.32e-5, train/loss_step=0.0041, global_step=2345.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  77%|███████▋  | 926/1208 [26:21<08:01,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0041, train/loss_vlb_step=2.32e-5, train/loss_step=0.0041, global_step=2345.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  77%|███████▋  | 926/1208 [26:21<08:01,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0999, train/loss_vlb_step=0.000329, train/loss_step=0.0999, global_step=2345.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  77%|███████▋  | 927/1208 [26:22<07:59,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0999, train/loss_vlb_step=0.000329, train/loss_step=0.0999, global_step=2345.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  77%|███████▋  | 927/1208 [26:22<07:59,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00332, train/loss_vlb_step=1.88e-5, train/loss_step=0.00332, global_step=2345.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  77%|███████▋  | 928/1208 [26:25<07:58,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00332, train/loss_vlb_step=1.88e-5, train/loss_step=0.00332, global_step=2345.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  77%|███████▋  | 928/1208 [26:25<07:58,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=1.66e-5, train/loss_step=0.00294, global_step=2345.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  77%|███████▋  | 929/1208 [26:27<07:56,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=1.66e-5, train/loss_step=0.00294, global_step=2345.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  77%|███████▋  | 929/1208 [26:27<07:56,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000731, train/loss_step=0.205, global_step=2346.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  77%|███████▋  | 930/1208 [26:28<07:54,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000731, train/loss_step=0.205, global_step=2346.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  77%|███████▋  | 930/1208 [26:28<07:54,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000645, train/loss_step=0.191, global_step=2346.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  77%|███████▋  | 931/1208 [26:29<07:52,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000645, train/loss_step=0.191, global_step=2346.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  77%|███████▋  | 931/1208 [26:29<07:52,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.19e-5, train/loss_step=0.0136, global_step=2346.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  77%|███████▋  | 932/1208 [26:32<07:51,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.19e-5, train/loss_step=0.0136, global_step=2346.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  77%|███████▋  | 932/1208 [26:32<07:51,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000798, train/loss_step=0.226, global_step=2346.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  77%|███████▋  | 933/1208 [26:33<07:49,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000798, train/loss_step=0.226, global_step=2346.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  77%|███████▋  | 933/1208 [26:33<07:49,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000726, train/loss_step=0.194, global_step=2347.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  77%|███████▋  | 934/1208 [26:34<07:47,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000726, train/loss_step=0.194, global_step=2347.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  77%|███████▋  | 934/1208 [26:34<07:47,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00216, train/loss_step=0.336, global_step=2347.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  77%|███████▋  | 935/1208 [26:35<07:45,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00216, train/loss_step=0.336, global_step=2347.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  77%|███████▋  | 935/1208 [26:35<07:45,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000655, train/loss_step=0.185, global_step=2347.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  77%|███████▋  | 936/1208 [26:38<07:44,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000655, train/loss_step=0.185, global_step=2347.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  77%|███████▋  | 936/1208 [26:38<07:44,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.99e-5, train/loss_step=0.0136, global_step=2347.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  78%|███████▊  | 937/1208 [26:39<07:42,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.99e-5, train/loss_step=0.0136, global_step=2347.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  78%|███████▊  | 937/1208 [26:39<07:42,  1.71s/it, loss=0.114, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=2348.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  78%|███████▊  | 938/1208 [26:40<07:40,  1.71s/it, loss=0.114, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=2348.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  78%|███████▊  | 938/1208 [26:40<07:40,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.68e-5, train/loss_step=0.0235, global_step=2348.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  78%|███████▊  | 939/1208 [26:41<07:38,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.68e-5, train/loss_step=0.0235, global_step=2348.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  78%|███████▊  | 939/1208 [26:41<07:38,  1.71s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.00543, train/loss_vlb_step=2.82e-5, train/loss_step=0.00543, global_step=2348.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  78%|███████▊  | 940/1208 [26:45<07:37,  1.71s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.00543, train/loss_vlb_step=2.82e-5, train/loss_step=0.00543, global_step=2348.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  78%|███████▊  | 940/1208 [26:45<07:37,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000965, train/loss_step=0.248, global_step=2348.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  78%|███████▊  | 941/1208 [26:46<07:35,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000965, train/loss_step=0.248, global_step=2348.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  78%|███████▊  | 941/1208 [26:46<07:35,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0053, train/loss_vlb_step=2.71e-5, train/loss_step=0.0053, global_step=2349.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  78%|███████▊  | 942/1208 [26:47<07:33,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0053, train/loss_vlb_step=2.71e-5, train/loss_step=0.0053, global_step=2349.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  78%|███████▊  | 942/1208 [26:47<07:33,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00121, train/loss_step=0.279, global_step=2349.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  78%|███████▊  | 943/1208 [26:48<07:31,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00121, train/loss_step=0.279, global_step=2349.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  78%|███████▊  | 943/1208 [26:48<07:31,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000709, train/loss_step=0.201, global_step=2349.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  78%|███████▊  | 944/1208 [26:51<07:30,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000709, train/loss_step=0.201, global_step=2349.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  78%|███████▊  | 944/1208 [26:51<07:30,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.2e-5, train/loss_step=0.0171, global_step=2349.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  78%|███████▊  | 945/1208 [26:52<07:28,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.2e-5, train/loss_step=0.0171, global_step=2349.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  78%|███████▊  | 945/1208 [26:52<07:28,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7.23e-5, train/loss_step=0.0165, global_step=2350.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  78%|███████▊  | 946/1208 [26:53<07:26,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7.23e-5, train/loss_step=0.0165, global_step=2350.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  78%|███████▊  | 946/1208 [26:53<07:26,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.07e-5, train/loss_step=0.00176, global_step=2350.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  78%|███████▊  | 947/1208 [26:54<07:25,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.07e-5, train/loss_step=0.00176, global_step=2350.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  78%|███████▊  | 947/1208 [26:54<07:25,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=2.13e-5, train/loss_step=0.00381, global_step=2350.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  78%|███████▊  | 948/1208 [26:57<07:23,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=2.13e-5, train/loss_step=0.00381, global_step=2350.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  78%|███████▊  | 948/1208 [26:57<07:23,  1.71s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000136, train/loss_step=0.0348, global_step=2350.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  79%|███████▊  | 949/1208 [26:59<07:21,  1.71s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000136, train/loss_step=0.0348, global_step=2350.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  79%|███████▊  | 949/1208 [26:59<07:21,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.6e-5, train/loss_step=0.0128, global_step=2351.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  79%|███████▊  | 950/1208 [27:00<07:19,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.6e-5, train/loss_step=0.0128, global_step=2351.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  79%|███████▊  | 950/1208 [27:00<07:19,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=2351.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  79%|███████▊  | 951/1208 [27:01<07:18,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=2351.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  79%|███████▊  | 951/1208 [27:01<07:18,  1.70s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000101, train/loss_step=0.0263, global_step=2351.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  79%|███████▉  | 952/1208 [27:04<07:16,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000101, train/loss_step=0.0263, global_step=2351.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  79%|███████▉  | 952/1208 [27:04<07:16,  1.71s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.00876, train/loss_vlb_step=4.05e-5, train/loss_step=0.00876, global_step=2351.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  79%|███████▉  | 953/1208 [27:05<07:14,  1.71s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.00876, train/loss_vlb_step=4.05e-5, train/loss_step=0.00876, global_step=2351.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  79%|███████▉  | 953/1208 [27:05<07:14,  1.71s/it, loss=0.0828, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000119, train/loss_step=0.0311, global_step=2352.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  79%|███████▉  | 954/1208 [27:06<07:13,  1.70s/it, loss=0.0828, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000119, train/loss_step=0.0311, global_step=2352.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  79%|███████▉  | 954/1208 [27:06<07:13,  1.70s/it, loss=0.0664, v_num=0, train/loss_simple_step=0.00822, train/loss_vlb_step=4.11e-5, train/loss_step=0.00822, global_step=2352.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  79%|███████▉  | 955/1208 [27:07<07:11,  1.70s/it, loss=0.0664, v_num=0, train/loss_simple_step=0.00822, train/loss_vlb_step=4.11e-5, train/loss_step=0.00822, global_step=2352.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  79%|███████▉  | 955/1208 [27:07<07:11,  1.70s/it, loss=0.0596, v_num=0, train/loss_simple_step=0.0481, train/loss_vlb_step=0.000162, train/loss_step=0.0481, global_step=2352.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  79%|███████▉  | 956/1208 [27:10<07:09,  1.71s/it, loss=0.0596, v_num=0, train/loss_simple_step=0.0481, train/loss_vlb_step=0.000162, train/loss_step=0.0481, global_step=2352.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  79%|███████▉  | 956/1208 [27:10<07:09,  1.71s/it, loss=0.0603, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000109, train/loss_step=0.0284, global_step=2352.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  79%|███████▉  | 957/1208 [27:11<07:08,  1.71s/it, loss=0.0603, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000109, train/loss_step=0.0284, global_step=2352.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  79%|███████▉  | 957/1208 [27:11<07:08,  1.71s/it, loss=0.0564, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.14e-5, train/loss_step=0.0226, global_step=2353.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  79%|███████▉  | 958/1208 [27:12<07:06,  1.70s/it, loss=0.0564, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.14e-5, train/loss_step=0.0226, global_step=2353.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  79%|███████▉  | 958/1208 [27:12<07:06,  1.70s/it, loss=0.0654, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000716, train/loss_step=0.205, global_step=2353.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  79%|███████▉  | 959/1208 [27:13<07:04,  1.70s/it, loss=0.0654, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000716, train/loss_step=0.205, global_step=2353.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  79%|███████▉  | 959/1208 [27:13<07:04,  1.70s/it, loss=0.069, v_num=0, train/loss_simple_step=0.0771, train/loss_vlb_step=0.000255, train/loss_step=0.0771, global_step=2353.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  79%|███████▉  | 960/1208 [27:17<07:02,  1.71s/it, loss=0.069, v_num=0, train/loss_simple_step=0.0771, train/loss_vlb_step=0.000255, train/loss_step=0.0771, global_step=2353.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  79%|███████▉  | 960/1208 [27:17<07:02,  1.71s/it, loss=0.0649, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000553, train/loss_step=0.165, global_step=2353.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  80%|███████▉  | 961/1208 [27:18<07:01,  1.70s/it, loss=0.0649, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000553, train/loss_step=0.165, global_step=2353.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  80%|███████▉  | 961/1208 [27:18<07:01,  1.70s/it, loss=0.0793, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00159, train/loss_step=0.294, global_step=2354.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  80%|███████▉  | 962/1208 [27:19<06:59,  1.70s/it, loss=0.0793, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00159, train/loss_step=0.294, global_step=2354.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  80%|███████▉  | 962/1208 [27:19<06:59,  1.70s/it, loss=0.0684, v_num=0, train/loss_simple_step=0.0613, train/loss_vlb_step=0.000207, train/loss_step=0.0613, global_step=2354.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  80%|███████▉  | 963/1208 [27:20<06:57,  1.70s/it, loss=0.0684, v_num=0, train/loss_simple_step=0.0613, train/loss_vlb_step=0.000207, train/loss_step=0.0613, global_step=2354.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  80%|███████▉  | 963/1208 [27:20<06:57,  1.70s/it, loss=0.0613, v_num=0, train/loss_simple_step=0.0596, train/loss_vlb_step=0.000204, train/loss_step=0.0596, global_step=2354.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  80%|███████▉  | 964/1208 [27:23<06:56,  1.70s/it, loss=0.0613, v_num=0, train/loss_simple_step=0.0596, train/loss_vlb_step=0.000204, train/loss_step=0.0596, global_step=2354.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  80%|███████▉  | 964/1208 [27:23<06:56,  1.70s/it, loss=0.0772, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00235, train/loss_step=0.335, global_step=2354.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  80%|███████▉  | 965/1208 [27:24<06:54,  1.70s/it, loss=0.0772, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00235, train/loss_step=0.335, global_step=2354.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  80%|███████▉  | 965/1208 [27:24<06:54,  1.70s/it, loss=0.0786, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.000165, train/loss_step=0.045, global_step=2355.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  80%|███████▉  | 966/1208 [27:25<06:52,  1.70s/it, loss=0.0786, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.000165, train/loss_step=0.045, global_step=2355.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  80%|███████▉  | 966/1208 [27:25<06:52,  1.70s/it, loss=0.0812, v_num=0, train/loss_simple_step=0.0534, train/loss_vlb_step=0.000179, train/loss_step=0.0534, global_step=2355.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  80%|████████  | 967/1208 [27:26<06:50,  1.70s/it, loss=0.0812, v_num=0, train/loss_simple_step=0.0534, train/loss_vlb_step=0.000179, train/loss_step=0.0534, global_step=2355.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  80%|████████  | 967/1208 [27:26<06:50,  1.70s/it, loss=0.084, v_num=0, train/loss_simple_step=0.0589, train/loss_vlb_step=0.000206, train/loss_step=0.0589, global_step=2355.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  80%|████████  | 968/1208 [27:30<06:49,  1.70s/it, loss=0.084, v_num=0, train/loss_simple_step=0.0589, train/loss_vlb_step=0.000206, train/loss_step=0.0589, global_step=2355.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  80%|████████  | 968/1208 [27:30<06:49,  1.70s/it, loss=0.0828, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.73e-5, train/loss_step=0.0123, global_step=2355.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  80%|████████  | 969/1208 [27:31<06:47,  1.70s/it, loss=0.0828, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.73e-5, train/loss_step=0.0123, global_step=2355.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  80%|████████  | 969/1208 [27:31<06:47,  1.70s/it, loss=0.0825, v_num=0, train/loss_simple_step=0.00637, train/loss_vlb_step=3.29e-5, train/loss_step=0.00637, global_step=2356.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  80%|████████  | 970/1208 [27:32<06:45,  1.70s/it, loss=0.0825, v_num=0, train/loss_simple_step=0.00637, train/loss_vlb_step=3.29e-5, train/loss_step=0.00637, global_step=2356.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  80%|████████  | 970/1208 [27:32<06:45,  1.70s/it, loss=0.0789, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.000121, train/loss_step=0.0316, global_step=2356.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  80%|████████  | 971/1208 [27:33<06:43,  1.70s/it, loss=0.0789, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.000121, train/loss_step=0.0316, global_step=2356.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  80%|████████  | 971/1208 [27:33<06:43,  1.70s/it, loss=0.0783, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.21e-5, train/loss_step=0.0151, global_step=2356.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  80%|████████  | 972/1208 [27:36<06:42,  1.70s/it, loss=0.0783, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.21e-5, train/loss_step=0.0151, global_step=2356.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  80%|████████  | 972/1208 [27:36<06:42,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.559, train/loss_vlb_step=0.00549, train/loss_step=0.559, global_step=2356.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  81%|████████  | 973/1208 [27:37<06:40,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.559, train/loss_vlb_step=0.00549, train/loss_step=0.559, global_step=2356.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  81%|████████  | 973/1208 [27:37<06:40,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000501, train/loss_step=0.151, global_step=2357.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  81%|████████  | 974/1208 [27:38<06:38,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000501, train/loss_step=0.151, global_step=2357.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  81%|████████  | 974/1208 [27:38<06:38,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.000129, train/loss_step=0.0352, global_step=2357.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  81%|████████  | 975/1208 [27:39<06:36,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.000129, train/loss_step=0.0352, global_step=2357.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  81%|████████  | 975/1208 [27:39<06:36,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.18e-5, train/loss_step=0.0111, global_step=2357.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  81%|████████  | 976/1208 [27:42<06:35,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.18e-5, train/loss_step=0.0111, global_step=2357.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  81%|████████  | 976/1208 [27:42<06:35,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00153, train/loss_step=0.282, global_step=2357.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  81%|████████  | 977/1208 [27:43<06:33,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00153, train/loss_step=0.282, global_step=2357.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  81%|████████  | 977/1208 [27:43<06:33,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000373, train/loss_step=0.113, global_step=2358.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  81%|████████  | 978/1208 [27:44<06:31,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000373, train/loss_step=0.113, global_step=2358.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  81%|████████  | 978/1208 [27:44<06:31,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=2358.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  81%|████████  | 979/1208 [27:45<06:29,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=2358.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  81%|████████  | 979/1208 [27:45<06:29,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000601, train/loss_step=0.172, global_step=2358.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  81%|████████  | 980/1208 [27:49<06:28,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000601, train/loss_step=0.172, global_step=2358.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  81%|████████  | 980/1208 [27:49<06:28,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000132, train/loss_step=0.0353, global_step=2358.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  81%|████████  | 981/1208 [27:50<06:26,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000132, train/loss_step=0.0353, global_step=2358.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  81%|████████  | 981/1208 [27:50<06:26,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=2359.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  81%|████████▏ | 982/1208 [27:51<06:24,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=2359.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  81%|████████▏ | 982/1208 [27:51<06:24,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=1.38e-5, train/loss_step=0.00239, global_step=2359.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  81%|████████▏ | 983/1208 [27:52<06:22,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=1.38e-5, train/loss_step=0.00239, global_step=2359.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  81%|████████▏ | 983/1208 [27:52<06:22,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000532, train/loss_step=0.153, global_step=2359.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  81%|████████▏ | 984/1208 [27:55<06:21,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000532, train/loss_step=0.153, global_step=2359.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  81%|████████▏ | 984/1208 [27:55<06:21,  1.70s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.81e-5, train/loss_step=0.0126, global_step=2359.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  82%|████████▏ | 985/1208 [27:56<06:19,  1.70s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.81e-5, train/loss_step=0.0126, global_step=2359.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  82%|████████▏ | 985/1208 [27:56<06:19,  1.70s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.00484, train/loss_vlb_step=2.59e-5, train/loss_step=0.00484, global_step=2360.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  82%|████████▏ | 986/1208 [27:57<06:17,  1.70s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.00484, train/loss_vlb_step=2.59e-5, train/loss_step=0.00484, global_step=2360.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  82%|████████▏ | 986/1208 [27:57<06:17,  1.70s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.0573, train/loss_vlb_step=0.000194, train/loss_step=0.0573, global_step=2360.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  82%|████████▏ | 987/1208 [27:58<06:15,  1.70s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.0573, train/loss_vlb_step=0.000194, train/loss_step=0.0573, global_step=2360.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  82%|████████▏ | 987/1208 [27:58<06:15,  1.70s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.0782, train/loss_vlb_step=0.000264, train/loss_step=0.0782, global_step=2360.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  82%|████████▏ | 988/1208 [28:01<06:14,  1.70s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.0782, train/loss_vlb_step=0.000264, train/loss_step=0.0782, global_step=2360.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  82%|████████▏ | 988/1208 [28:01<06:14,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.065, train/loss_vlb_step=0.00022, train/loss_step=0.065, global_step=2360.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  82%|████████▏ | 989/1208 [28:02<06:12,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.065, train/loss_vlb_step=0.00022, train/loss_step=0.065, global_step=2360.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  82%|████████▏ | 989/1208 [28:02<06:12,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.0005, train/loss_step=0.150, global_step=2361.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  82%|████████▏ | 990/1208 [28:03<06:10,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.0005, train/loss_step=0.150, global_step=2361.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  82%|████████▏ | 990/1208 [28:03<06:10,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0433, train/loss_vlb_step=0.000157, train/loss_step=0.0433, global_step=2361.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  82%|████████▏ | 991/1208 [28:04<06:08,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0433, train/loss_vlb_step=0.000157, train/loss_step=0.0433, global_step=2361.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  82%|████████▏ | 991/1208 [28:04<06:08,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=1.44e-5, train/loss_step=0.00259, global_step=2361.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  82%|████████▏ | 992/1208 [28:07<06:07,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=1.44e-5, train/loss_step=0.00259, global_step=2361.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  82%|████████▏ | 992/1208 [28:07<06:07,  1.70s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.0753, train/loss_vlb_step=0.00025, train/loss_step=0.0753, global_step=2361.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  82%|████████▏ | 993/1208 [28:08<06:05,  1.70s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.0753, train/loss_vlb_step=0.00025, train/loss_step=0.0753, global_step=2361.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  82%|████████▏ | 993/1208 [28:08<06:05,  1.70s/it, loss=0.0771, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.8e-5, train/loss_step=0.0237, global_step=2362.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  82%|████████▏ | 994/1208 [28:09<06:03,  1.70s/it, loss=0.0771, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.8e-5, train/loss_step=0.0237, global_step=2362.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  82%|████████▏ | 994/1208 [28:09<06:03,  1.70s/it, loss=0.0959, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00283, train/loss_step=0.411, global_step=2362.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  82%|████████▏ | 995/1208 [28:10<06:01,  1.70s/it, loss=0.0959, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00283, train/loss_step=0.411, global_step=2362.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  82%|████████▏ | 995/1208 [28:10<06:01,  1.70s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.00544, train/loss_vlb_step=2.8e-5, train/loss_step=0.00544, global_step=2362.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  82%|████████▏ | 996/1208 [28:14<06:00,  1.70s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.00544, train/loss_vlb_step=2.8e-5, train/loss_step=0.00544, global_step=2362.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  82%|████████▏ | 996/1208 [28:14<06:00,  1.70s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.36e-5, train/loss_step=0.0141, global_step=2362.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  83%|████████▎ | 997/1208 [28:15<05:58,  1.70s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.36e-5, train/loss_step=0.0141, global_step=2362.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  83%|████████▎ | 997/1208 [28:15<05:58,  1.70s/it, loss=0.0846, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.00056, train/loss_step=0.162, global_step=2363.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  83%|████████▎ | 998/1208 [28:16<05:56,  1.70s/it, loss=0.0846, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.00056, train/loss_step=0.162, global_step=2363.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  83%|████████▎ | 998/1208 [28:16<05:56,  1.70s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.00104, train/loss_step=0.226, global_step=2363.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  83%|████████▎ | 999/1208 [28:17<05:55,  1.70s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.00104, train/loss_step=0.226, global_step=2363.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  83%|████████▎ | 999/1208 [28:17<05:55,  1.70s/it, loss=0.0819, v_num=0, train/loss_simple_step=0.00516, train/loss_vlb_step=2.65e-5, train/loss_step=0.00516, global_step=2363.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  83%|████████▎ | 1000/1208 [28:20<05:53,  1.70s/it, loss=0.0819, v_num=0, train/loss_simple_step=0.00516, train/loss_vlb_step=2.65e-5, train/loss_step=0.00516, global_step=2363.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  83%|████████▎ | 1000/1208 [28:20<05:53,  1.70s/it, loss=0.0804, v_num=0, train/loss_simple_step=0.00635, train/loss_vlb_step=3.18e-5, train/loss_step=0.00635, global_step=2363.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  83%|████████▎ | 1001/1208 [28:21<05:51,  1.70s/it, loss=0.0804, v_num=0, train/loss_simple_step=0.00635, train/loss_vlb_step=3.18e-5, train/loss_step=0.00635, global_step=2363.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  83%|████████▎ | 1001/1208 [28:21<05:51,  1.70s/it, loss=0.0758, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.24e-5, train/loss_step=0.0175, global_step=2364.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  83%|████████▎ | 1002/1208 [28:22<05:50,  1.70s/it, loss=0.0758, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.24e-5, train/loss_step=0.0175, global_step=2364.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  83%|████████▎ | 1002/1208 [28:22<05:50,  1.70s/it, loss=0.0794, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000247, train/loss_step=0.0741, global_step=2364.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  83%|████████▎ | 1003/1208 [28:23<05:48,  1.70s/it, loss=0.0794, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000247, train/loss_step=0.0741, global_step=2364.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  83%|████████▎ | 1003/1208 [28:23<05:48,  1.70s/it, loss=0.0728, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.54e-5, train/loss_step=0.0206, global_step=2364.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  83%|████████▎ | 1004/1208 [28:26<05:46,  1.70s/it, loss=0.0728, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.54e-5, train/loss_step=0.0206, global_step=2364.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  83%|████████▎ | 1004/1208 [28:26<05:46,  1.70s/it, loss=0.0769, v_num=0, train/loss_simple_step=0.0957, train/loss_vlb_step=0.000317, train/loss_step=0.0957, global_step=2364.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  83%|████████▎ | 1005/1208 [28:27<05:44,  1.70s/it, loss=0.0769, v_num=0, train/loss_simple_step=0.0957, train/loss_vlb_step=0.000317, train/loss_step=0.0957, global_step=2364.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  83%|████████▎ | 1005/1208 [28:27<05:44,  1.70s/it, loss=0.092, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00174, train/loss_step=0.306, global_step=2365.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  83%|████████▎ | 1006/1208 [28:29<05:43,  1.70s/it, loss=0.092, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00174, train/loss_step=0.306, global_step=2365.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  83%|████████▎ | 1006/1208 [28:29<05:43,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00237, train/loss_step=0.397, global_step=2365.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  83%|████████▎ | 1007/1208 [28:30<05:41,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00237, train/loss_step=0.397, global_step=2365.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  83%|████████▎ | 1007/1208 [28:30<05:41,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0709, train/loss_vlb_step=0.000236, train/loss_step=0.0709, global_step=2365.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  83%|████████▎ | 1008/1208 [28:33<05:39,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0709, train/loss_vlb_step=0.000236, train/loss_step=0.0709, global_step=2365.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  83%|████████▎ | 1008/1208 [28:33<05:39,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0627, train/loss_vlb_step=0.000213, train/loss_step=0.0627, global_step=2365.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  84%|████████▎ | 1009/1208 [28:34<05:38,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0627, train/loss_vlb_step=0.000213, train/loss_step=0.0627, global_step=2365.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  84%|████████▎ | 1009/1208 [28:34<05:38,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00224, train/loss_step=0.379, global_step=2366.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  84%|████████▎ | 1010/1208 [28:35<05:36,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00224, train/loss_step=0.379, global_step=2366.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  84%|████████▎ | 1010/1208 [28:35<05:36,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=5.02e-5, train/loss_step=0.0106, global_step=2366.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  84%|████████▎ | 1011/1208 [28:36<05:34,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=5.02e-5, train/loss_step=0.0106, global_step=2366.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  84%|████████▎ | 1011/1208 [28:36<05:34,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.783, train/loss_vlb_step=0.0667, train/loss_step=0.783, global_step=2366.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  84%|████████▍ | 1012/1208 [28:39<05:33,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.783, train/loss_vlb_step=0.0667, train/loss_step=0.783, global_step=2366.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  84%|████████▍ | 1012/1208 [28:39<05:33,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.67e-5, train/loss_step=0.0173, global_step=2366.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  84%|████████▍ | 1013/1208 [28:40<05:31,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.67e-5, train/loss_step=0.0173, global_step=2366.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  84%|████████▍ | 1013/1208 [28:40<05:31,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00427, train/loss_vlb_step=2.31e-5, train/loss_step=0.00427, global_step=2367.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  84%|████████▍ | 1014/1208 [28:41<05:29,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00427, train/loss_vlb_step=2.31e-5, train/loss_step=0.00427, global_step=2367.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  84%|████████▍ | 1014/1208 [28:41<05:29,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000371, train/loss_step=0.113, global_step=2367.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  84%|████████▍ | 1015/1208 [28:42<05:27,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000371, train/loss_step=0.113, global_step=2367.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  84%|████████▍ | 1015/1208 [28:42<05:27,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000609, train/loss_step=0.177, global_step=2367.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  84%|████████▍ | 1016/1208 [28:45<05:26,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000609, train/loss_step=0.177, global_step=2367.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  84%|████████▍ | 1016/1208 [28:45<05:26,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000851, train/loss_step=0.215, global_step=2367.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  84%|████████▍ | 1017/1208 [28:46<05:24,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000851, train/loss_step=0.215, global_step=2367.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  84%|████████▍ | 1017/1208 [28:46<05:24,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.410, train/loss_vlb_step=0.00317, train/loss_step=0.410, global_step=2368.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  84%|████████▍ | 1018/1208 [28:47<05:22,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.410, train/loss_vlb_step=0.00317, train/loss_step=0.410, global_step=2368.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  84%|████████▍ | 1018/1208 [28:47<05:22,  1.70s/it, loss=0.176, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00247, train/loss_step=0.347, global_step=2368.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  84%|████████▍ | 1019/1208 [28:48<05:20,  1.70s/it, loss=0.176, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00247, train/loss_step=0.347, global_step=2368.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  84%|████████▍ | 1019/1208 [28:48<05:20,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0603, train/loss_vlb_step=0.000211, train/loss_step=0.0603, global_step=2368.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  84%|████████▍ | 1020/1208 [28:51<05:19,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0603, train/loss_vlb_step=0.000211, train/loss_step=0.0603, global_step=2368.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  84%|████████▍ | 1020/1208 [28:51<05:19,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00301, train/loss_vlb_step=1.73e-5, train/loss_step=0.00301, global_step=2368.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  85%|████████▍ | 1021/1208 [28:53<05:17,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00301, train/loss_vlb_step=1.73e-5, train/loss_step=0.00301, global_step=2368.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  85%|████████▍ | 1021/1208 [28:53<05:17,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000431, train/loss_step=0.131, global_step=2369.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  85%|████████▍ | 1022/1208 [28:54<05:15,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000431, train/loss_step=0.131, global_step=2369.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  85%|████████▍ | 1022/1208 [28:54<05:15,  1.70s/it, loss=0.187, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000494, train/loss_step=0.145, global_step=2369.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  85%|████████▍ | 1023/1208 [28:55<05:13,  1.70s/it, loss=0.187, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000494, train/loss_step=0.145, global_step=2369.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  85%|████████▍ | 1023/1208 [28:55<05:13,  1.70s/it, loss=0.2, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00112, train/loss_step=0.269, global_step=2369.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  85%|████████▍ | 1024/1208 [28:58<05:12,  1.70s/it, loss=0.2, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00112, train/loss_step=0.269, global_step=2369.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  85%|████████▍ | 1024/1208 [28:58<05:12,  1.70s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.86e-5, train/loss_step=0.0158, global_step=2369.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  85%|████████▍ | 1025/1208 [28:59<05:10,  1.70s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.86e-5, train/loss_step=0.0158, global_step=2369.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  85%|████████▍ | 1025/1208 [28:59<05:10,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00864, train/loss_vlb_step=4.18e-5, train/loss_step=0.00864, global_step=2370.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  85%|████████▍ | 1026/1208 [29:00<05:08,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00864, train/loss_vlb_step=4.18e-5, train/loss_step=0.00864, global_step=2370.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  85%|████████▍ | 1026/1208 [29:00<05:08,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.27e-5, train/loss_step=0.0116, global_step=2370.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  85%|████████▌ | 1027/1208 [29:01<05:06,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.27e-5, train/loss_step=0.0116, global_step=2370.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  85%|████████▌ | 1027/1208 [29:01<05:06,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0621, train/loss_vlb_step=0.000212, train/loss_step=0.0621, global_step=2370.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  85%|████████▌ | 1028/1208 [29:04<05:05,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0621, train/loss_vlb_step=0.000212, train/loss_step=0.0621, global_step=2370.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  85%|████████▌ | 1028/1208 [29:04<05:05,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000515, train/loss_step=0.151, global_step=2370.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  85%|████████▌ | 1029/1208 [29:05<05:03,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000515, train/loss_step=0.151, global_step=2370.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  85%|████████▌ | 1029/1208 [29:05<05:03,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.38e-5, train/loss_step=0.00236, global_step=2371.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  85%|████████▌ | 1030/1208 [29:06<05:01,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.38e-5, train/loss_step=0.00236, global_step=2371.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  85%|████████▌ | 1030/1208 [29:06<05:01,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000547, train/loss_step=0.159, global_step=2371.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  85%|████████▌ | 1031/1208 [29:07<05:00,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000547, train/loss_step=0.159, global_step=2371.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  85%|████████▌ | 1031/1208 [29:07<05:00,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.74e-5, train/loss_step=0.0123, global_step=2371.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  85%|████████▌ | 1032/1208 [29:11<04:58,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.74e-5, train/loss_step=0.0123, global_step=2371.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  85%|████████▌ | 1032/1208 [29:11<04:58,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.000133, train/loss_step=0.0393, global_step=2371.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  86%|████████▌ | 1033/1208 [29:12<04:56,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.000133, train/loss_step=0.0393, global_step=2371.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  86%|████████▌ | 1033/1208 [29:12<04:56,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000775, train/loss_step=0.218, global_step=2372.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  86%|████████▌ | 1034/1208 [29:13<04:55,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000775, train/loss_step=0.218, global_step=2372.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  86%|████████▌ | 1034/1208 [29:13<04:55,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00105, train/loss_step=0.259, global_step=2372.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  86%|████████▌ | 1035/1208 [29:14<04:53,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00105, train/loss_step=0.259, global_step=2372.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  86%|████████▌ | 1035/1208 [29:14<04:53,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0708, train/loss_vlb_step=0.000236, train/loss_step=0.0708, global_step=2372.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  86%|████████▌ | 1036/1208 [29:17<04:51,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0708, train/loss_vlb_step=0.000236, train/loss_step=0.0708, global_step=2372.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  86%|████████▌ | 1036/1208 [29:17<04:51,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.000153, train/loss_step=0.0413, global_step=2372.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  86%|████████▌ | 1037/1208 [29:18<04:49,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.000153, train/loss_step=0.0413, global_step=2372.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  86%|████████▌ | 1037/1208 [29:18<04:49,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0877, train/loss_vlb_step=0.000294, train/loss_step=0.0877, global_step=2373.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  86%|████████▌ | 1038/1208 [29:19<04:48,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0877, train/loss_vlb_step=0.000294, train/loss_step=0.0877, global_step=2373.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  86%|████████▌ | 1038/1208 [29:19<04:48,  1.70s/it, loss=0.0901, v_num=0, train/loss_simple_step=0.054, train/loss_vlb_step=0.000194, train/loss_step=0.054, global_step=2373.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  86%|████████▌ | 1039/1208 [29:20<04:46,  1.69s/it, loss=0.0901, v_num=0, train/loss_simple_step=0.054, train/loss_vlb_step=0.000194, train/loss_step=0.054, global_step=2373.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  86%|████████▌ | 1039/1208 [29:20<04:46,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.564, train/loss_vlb_step=0.00898, train/loss_step=0.564, global_step=2373.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  86%|████████▌ | 1040/1208 [29:23<04:44,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.564, train/loss_vlb_step=0.00898, train/loss_step=0.564, global_step=2373.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  86%|████████▌ | 1040/1208 [29:23<04:44,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000568, train/loss_step=0.166, global_step=2373.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  86%|████████▌ | 1041/1208 [29:24<04:43,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000568, train/loss_step=0.166, global_step=2373.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  86%|████████▌ | 1041/1208 [29:24<04:43,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00649, train/loss_vlb_step=3.34e-5, train/loss_step=0.00649, global_step=2374.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  86%|████████▋ | 1042/1208 [29:26<04:41,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00649, train/loss_vlb_step=3.34e-5, train/loss_step=0.00649, global_step=2374.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  86%|████████▋ | 1042/1208 [29:26<04:41,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00202, train/loss_step=0.347, global_step=2374.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  86%|████████▋ | 1043/1208 [29:27<04:39,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00202, train/loss_step=0.347, global_step=2374.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  86%|████████▋ | 1043/1208 [29:27<04:39,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0822, train/loss_vlb_step=0.000274, train/loss_step=0.0822, global_step=2374.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  86%|████████▋ | 1044/1208 [29:30<04:38,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0822, train/loss_vlb_step=0.000274, train/loss_step=0.0822, global_step=2374.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  86%|████████▋ | 1044/1208 [29:30<04:38,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0709, train/loss_vlb_step=0.000247, train/loss_step=0.0709, global_step=2374.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  87%|████████▋ | 1045/1208 [29:31<04:36,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0709, train/loss_vlb_step=0.000247, train/loss_step=0.0709, global_step=2374.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  87%|████████▋ | 1045/1208 [29:31<04:36,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.00039, train/loss_step=0.119, global_step=2375.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  87%|████████▋ | 1046/1208 [29:32<04:34,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.00039, train/loss_step=0.119, global_step=2375.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  87%|████████▋ | 1046/1208 [29:32<04:34,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00187, train/loss_step=0.335, global_step=2375.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  87%|████████▋ | 1047/1208 [29:33<04:32,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00187, train/loss_step=0.335, global_step=2375.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  87%|████████▋ | 1047/1208 [29:33<04:32,  1.69s/it, loss=0.161, v_num=0, train/loss_simple_step=0.431, train/loss_vlb_step=0.0033, train/loss_step=0.431, global_step=2375.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  87%|████████▋ | 1048/1208 [29:36<04:31,  1.69s/it, loss=0.161, v_num=0, train/loss_simple_step=0.431, train/loss_vlb_step=0.0033, train/loss_step=0.431, global_step=2375.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  87%|████████▋ | 1048/1208 [29:36<04:31,  1.69s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=9.01e-5, train/loss_step=0.0214, global_step=2375.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  87%|████████▋ | 1049/1208 [29:37<04:29,  1.69s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=9.01e-5, train/loss_step=0.0214, global_step=2375.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  87%|████████▋ | 1049/1208 [29:37<04:29,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.00041, train/loss_step=0.124, global_step=2376.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  87%|████████▋ | 1050/1208 [29:38<04:27,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.00041, train/loss_step=0.124, global_step=2376.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  87%|████████▋ | 1050/1208 [29:38<04:27,  1.69s/it, loss=0.155, v_num=0, train/loss_simple_step=0.057, train/loss_vlb_step=0.000203, train/loss_step=0.057, global_step=2376.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  87%|████████▋ | 1051/1208 [29:39<04:25,  1.69s/it, loss=0.155, v_num=0, train/loss_simple_step=0.057, train/loss_vlb_step=0.000203, train/loss_step=0.057, global_step=2376.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  87%|████████▋ | 1051/1208 [29:39<04:25,  1.69s/it, loss=0.184, v_num=0, train/loss_simple_step=0.586, train/loss_vlb_step=0.0114, train/loss_step=0.586, global_step=2376.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  87%|████████▋ | 1052/1208 [29:42<04:24,  1.69s/it, loss=0.184, v_num=0, train/loss_simple_step=0.586, train/loss_vlb_step=0.0114, train/loss_step=0.586, global_step=2376.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  87%|████████▋ | 1052/1208 [29:42<04:24,  1.69s/it, loss=0.195, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.000975, train/loss_step=0.268, global_step=2376.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  87%|████████▋ | 1053/1208 [29:43<04:22,  1.69s/it, loss=0.195, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.000975, train/loss_step=0.268, global_step=2376.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  87%|████████▋ | 1053/1208 [29:43<04:22,  1.69s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.88e-5, train/loss_step=0.00344, global_step=2377.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  87%|████████▋ | 1054/1208 [29:44<04:20,  1.69s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.88e-5, train/loss_step=0.00344, global_step=2377.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  87%|████████▋ | 1054/1208 [29:44<04:20,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000578, train/loss_step=0.171, global_step=2377.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  87%|████████▋ | 1055/1208 [29:45<04:18,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000578, train/loss_step=0.171, global_step=2377.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  87%|████████▋ | 1055/1208 [29:45<04:18,  1.69s/it, loss=0.186, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000589, train/loss_step=0.179, global_step=2377.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  87%|████████▋ | 1056/1208 [29:48<04:17,  1.69s/it, loss=0.186, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000589, train/loss_step=0.179, global_step=2377.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  87%|████████▋ | 1056/1208 [29:48<04:17,  1.69s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.54e-5, train/loss_step=0.00266, global_step=2377.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  88%|████████▊ | 1057/1208 [29:49<04:15,  1.69s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.54e-5, train/loss_step=0.00266, global_step=2377.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  88%|████████▊ | 1057/1208 [29:49<04:15,  1.69s/it, loss=0.179, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.21e-5, train/loss_step=0.002, global_step=2378.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  88%|████████▊ | 1058/1208 [29:51<04:13,  1.69s/it, loss=0.179, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.21e-5, train/loss_step=0.002, global_step=2378.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  88%|████████▊ | 1058/1208 [29:51<04:13,  1.69s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00435, train/loss_vlb_step=2.27e-5, train/loss_step=0.00435, global_step=2378.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  88%|████████▊ | 1059/1208 [29:52<04:12,  1.69s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00435, train/loss_vlb_step=2.27e-5, train/loss_step=0.00435, global_step=2378.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  88%|████████▊ | 1059/1208 [29:52<04:12,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0429, train/loss_vlb_step=0.000153, train/loss_step=0.0429, global_step=2378.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  88%|████████▊ | 1060/1208 [29:55<04:10,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0429, train/loss_vlb_step=0.000153, train/loss_step=0.0429, global_step=2378.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  88%|████████▊ | 1060/1208 [29:55<04:10,  1.69s/it, loss=0.155, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000937, train/loss_step=0.239, global_step=2378.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  88%|████████▊ | 1061/1208 [29:56<04:08,  1.69s/it, loss=0.155, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000937, train/loss_step=0.239, global_step=2378.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  88%|████████▊ | 1061/1208 [29:56<04:08,  1.69s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000113, train/loss_step=0.0298, global_step=2379.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  88%|████████▊ | 1062/1208 [29:57<04:07,  1.69s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000113, train/loss_step=0.0298, global_step=2379.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  88%|████████▊ | 1062/1208 [29:57<04:07,  1.69s/it, loss=0.148, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000635, train/loss_step=0.182, global_step=2379.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  88%|████████▊ | 1063/1208 [29:58<04:05,  1.69s/it, loss=0.148, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000635, train/loss_step=0.182, global_step=2379.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  88%|████████▊ | 1063/1208 [29:58<04:05,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000436, train/loss_step=0.132, global_step=2379.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  88%|████████▊ | 1064/1208 [30:01<04:03,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000436, train/loss_step=0.132, global_step=2379.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  88%|████████▊ | 1064/1208 [30:01<04:03,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.76e-5, train/loss_step=0.0126, global_step=2379.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  88%|████████▊ | 1065/1208 [30:02<04:02,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.76e-5, train/loss_step=0.0126, global_step=2379.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  88%|████████▊ | 1065/1208 [30:02<04:02,  1.69s/it, loss=0.154, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00106, train/loss_step=0.252, global_step=2380.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  88%|████████▊ | 1066/1208 [30:03<04:00,  1.69s/it, loss=0.154, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00106, train/loss_step=0.252, global_step=2380.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  88%|████████▊ | 1066/1208 [30:03<04:00,  1.69s/it, loss=0.156, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00225, train/loss_step=0.385, global_step=2380.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  88%|████████▊ | 1067/1208 [30:04<03:58,  1.69s/it, loss=0.156, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00225, train/loss_step=0.385, global_step=2380.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  88%|████████▊ | 1067/1208 [30:04<03:58,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0059, train/loss_vlb_step=3.12e-5, train/loss_step=0.0059, global_step=2380.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  88%|████████▊ | 1068/1208 [30:08<03:57,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0059, train/loss_vlb_step=3.12e-5, train/loss_step=0.0059, global_step=2380.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  88%|████████▊ | 1068/1208 [30:08<03:57,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.28e-5, train/loss_step=0.00209, global_step=2380.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  88%|████████▊ | 1069/1208 [30:09<03:55,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.28e-5, train/loss_step=0.00209, global_step=2380.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  88%|████████▊ | 1069/1208 [30:09<03:55,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000408, train/loss_step=0.123, global_step=2381.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  89%|████████▊ | 1070/1208 [30:10<03:53,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000408, train/loss_step=0.123, global_step=2381.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  89%|████████▊ | 1070/1208 [30:10<03:53,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000529, train/loss_step=0.158, global_step=2381.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  89%|████████▊ | 1071/1208 [30:11<03:51,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000529, train/loss_step=0.158, global_step=2381.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  89%|████████▊ | 1071/1208 [30:11<03:51,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00121, train/loss_step=0.287, global_step=2381.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  89%|████████▊ | 1072/1208 [30:14<03:50,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00121, train/loss_step=0.287, global_step=2381.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  89%|████████▊ | 1072/1208 [30:14<03:50,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0807, train/loss_vlb_step=0.000268, train/loss_step=0.0807, global_step=2381.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  89%|████████▉ | 1073/1208 [30:15<03:48,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0807, train/loss_vlb_step=0.000268, train/loss_step=0.0807, global_step=2381.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  89%|████████▉ | 1073/1208 [30:15<03:48,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.63e-5, train/loss_step=0.00289, global_step=2382.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  89%|████████▉ | 1074/1208 [30:16<03:46,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.63e-5, train/loss_step=0.00289, global_step=2382.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  89%|████████▉ | 1074/1208 [30:16<03:46,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00206, train/loss_step=0.333, global_step=2382.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  89%|████████▉ | 1075/1208 [30:17<03:44,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00206, train/loss_step=0.333, global_step=2382.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  89%|████████▉ | 1075/1208 [30:17<03:44,  1.69s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000142, train/loss_step=0.0378, global_step=2382.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  89%|████████▉ | 1076/1208 [30:20<03:43,  1.69s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000142, train/loss_step=0.0378, global_step=2382.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  89%|████████▉ | 1076/1208 [30:20<03:43,  1.69s/it, loss=0.122, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000448, train/loss_step=0.136, global_step=2382.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  89%|████████▉ | 1077/1208 [30:21<03:41,  1.69s/it, loss=0.122, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000448, train/loss_step=0.136, global_step=2382.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  89%|████████▉ | 1077/1208 [30:21<03:41,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000444, train/loss_step=0.134, global_step=2383.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  89%|████████▉ | 1078/1208 [30:22<03:39,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000444, train/loss_step=0.134, global_step=2383.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  89%|████████▉ | 1078/1208 [30:22<03:39,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000134, train/loss_step=0.0345, global_step=2383.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  89%|████████▉ | 1079/1208 [30:23<03:38,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000134, train/loss_step=0.0345, global_step=2383.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  89%|████████▉ | 1079/1208 [30:23<03:38,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0323, train/loss_vlb_step=0.000123, train/loss_step=0.0323, global_step=2383.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  89%|████████▉ | 1080/1208 [30:27<03:36,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0323, train/loss_vlb_step=0.000123, train/loss_step=0.0323, global_step=2383.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  89%|████████▉ | 1080/1208 [30:27<03:36,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000664, train/loss_step=0.182, global_step=2383.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  89%|████████▉ | 1081/1208 [30:28<03:34,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000664, train/loss_step=0.182, global_step=2383.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  89%|████████▉ | 1081/1208 [30:28<03:34,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000836, train/loss_step=0.223, global_step=2384.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  90%|████████▉ | 1082/1208 [30:29<03:33,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000836, train/loss_step=0.223, global_step=2384.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  90%|████████▉ | 1082/1208 [30:29<03:33,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000418, train/loss_step=0.127, global_step=2384.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  90%|████████▉ | 1083/1208 [30:30<03:31,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000418, train/loss_step=0.127, global_step=2384.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  90%|████████▉ | 1083/1208 [30:30<03:31,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00565, train/loss_vlb_step=3.03e-5, train/loss_step=0.00565, global_step=2384.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  90%|████████▉ | 1084/1208 [30:33<03:29,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00565, train/loss_vlb_step=3.03e-5, train/loss_step=0.00565, global_step=2384.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  90%|████████▉ | 1084/1208 [30:33<03:29,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.71e-5, train/loss_step=0.012, global_step=2384.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  90%|████████▉ | 1085/1208 [30:34<03:27,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.71e-5, train/loss_step=0.012, global_step=2384.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  90%|████████▉ | 1085/1208 [30:34<03:27,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0061, train/loss_vlb_step=3.14e-5, train/loss_step=0.0061, global_step=2385.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  90%|████████▉ | 1086/1208 [30:35<03:26,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0061, train/loss_vlb_step=3.14e-5, train/loss_step=0.0061, global_step=2385.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  90%|████████▉ | 1086/1208 [30:35<03:26,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000416, train/loss_step=0.127, global_step=2385.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  90%|████████▉ | 1087/1208 [30:36<03:24,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000416, train/loss_step=0.127, global_step=2385.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  90%|████████▉ | 1087/1208 [30:36<03:24,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000669, train/loss_step=0.189, global_step=2385.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  90%|█████████ | 1088/1208 [30:39<03:22,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000669, train/loss_step=0.189, global_step=2385.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  90%|█████████ | 1088/1208 [30:39<03:22,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.0018, train/loss_step=0.361, global_step=2385.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  90%|█████████ | 1089/1208 [30:41<03:21,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.0018, train/loss_step=0.361, global_step=2385.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  90%|█████████ | 1089/1208 [30:41<03:21,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000434, train/loss_step=0.132, global_step=2386.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  90%|█████████ | 1090/1208 [30:42<03:19,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000434, train/loss_step=0.132, global_step=2386.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  90%|█████████ | 1090/1208 [30:42<03:19,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.06e-5, train/loss_step=0.0109, global_step=2386.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  90%|█████████ | 1091/1208 [30:43<03:17,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.06e-5, train/loss_step=0.0109, global_step=2386.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  90%|█████████ | 1091/1208 [30:43<03:17,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.000992, train/loss_step=0.261, global_step=2386.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  90%|█████████ | 1092/1208 [30:46<03:16,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.000992, train/loss_step=0.261, global_step=2386.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  90%|█████████ | 1092/1208 [30:46<03:16,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=2386.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  90%|█████████ | 1093/1208 [30:47<03:14,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=2386.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  90%|█████████ | 1093/1208 [30:47<03:14,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=9.84e-5, train/loss_step=0.0256, global_step=2387.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  91%|█████████ | 1094/1208 [30:48<03:12,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=9.84e-5, train/loss_step=0.0256, global_step=2387.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  91%|█████████ | 1094/1208 [30:48<03:12,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000854, train/loss_step=0.229, global_step=2387.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  91%|█████████ | 1095/1208 [30:49<03:10,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000854, train/loss_step=0.229, global_step=2387.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  91%|█████████ | 1095/1208 [30:49<03:10,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00741, train/loss_vlb_step=3.65e-5, train/loss_step=0.00741, global_step=2387.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  91%|█████████ | 1096/1208 [30:52<03:09,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00741, train/loss_vlb_step=3.65e-5, train/loss_step=0.00741, global_step=2387.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  91%|█████████ | 1096/1208 [30:52<03:09,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00296, train/loss_step=0.405, global_step=2387.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]     Epoch 7:  91%|█████████ | 1097/1208 [30:53<03:07,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00296, train/loss_step=0.405, global_step=2387.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  91%|█████████ | 1097/1208 [30:53<03:07,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000687, train/loss_step=0.186, global_step=2388.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  91%|█████████ | 1098/1208 [30:54<03:05,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000687, train/loss_step=0.186, global_step=2388.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  91%|█████████ | 1098/1208 [30:54<03:05,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=7.49e-5, train/loss_step=0.0194, global_step=2388.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  91%|█████████ | 1099/1208 [30:55<03:04,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=7.49e-5, train/loss_step=0.0194, global_step=2388.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  91%|█████████ | 1099/1208 [30:55<03:04,  1.69s/it, loss=0.145, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00127, train/loss_step=0.278, global_step=2388.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  91%|█████████ | 1100/1208 [30:59<03:02,  1.69s/it, loss=0.145, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00127, train/loss_step=0.278, global_step=2388.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  91%|█████████ | 1100/1208 [30:59<03:02,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.95e-5, train/loss_step=0.0219, global_step=2388.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  91%|█████████ | 1101/1208 [31:00<03:00,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.95e-5, train/loss_step=0.0219, global_step=2388.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  91%|█████████ | 1101/1208 [31:00<03:00,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000105, train/loss_step=0.0253, global_step=2389.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  91%|█████████ | 1102/1208 [31:01<02:59,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000105, train/loss_step=0.0253, global_step=2389.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  91%|█████████ | 1102/1208 [31:01<02:59,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9.23e-5, train/loss_step=0.0224, global_step=2389.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  91%|█████████▏| 1103/1208 [31:02<02:57,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9.23e-5, train/loss_step=0.0224, global_step=2389.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  91%|█████████▏| 1103/1208 [31:02<02:57,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000346, train/loss_step=0.104, global_step=2389.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  91%|█████████▏| 1104/1208 [31:05<02:55,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000346, train/loss_step=0.104, global_step=2389.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  91%|█████████▏| 1104/1208 [31:05<02:55,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0644, train/loss_vlb_step=0.000217, train/loss_step=0.0644, global_step=2389.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  91%|█████████▏| 1105/1208 [31:06<02:53,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0644, train/loss_vlb_step=0.000217, train/loss_step=0.0644, global_step=2389.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  91%|█████████▏| 1105/1208 [31:06<02:53,  1.69s/it, loss=0.149, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00298, train/loss_step=0.411, global_step=2390.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  92%|█████████▏| 1106/1208 [31:07<02:52,  1.69s/it, loss=0.149, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00298, train/loss_step=0.411, global_step=2390.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  92%|█████████▏| 1106/1208 [31:07<02:52,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0853, train/loss_vlb_step=0.000283, train/loss_step=0.0853, global_step=2390.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  92%|█████████▏| 1107/1208 [31:08<02:50,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0853, train/loss_vlb_step=0.000283, train/loss_step=0.0853, global_step=2390.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  92%|█████████▏| 1107/1208 [31:08<02:50,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=6.1e-5, train/loss_step=0.0133, global_step=2390.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  92%|█████████▏| 1108/1208 [31:11<02:48,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=6.1e-5, train/loss_step=0.0133, global_step=2390.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  92%|█████████▏| 1108/1208 [31:11<02:48,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.53e-5, train/loss_step=0.00273, global_step=2390.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  92%|█████████▏| 1109/1208 [31:13<02:47,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.53e-5, train/loss_step=0.00273, global_step=2390.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  92%|█████████▏| 1109/1208 [31:13<02:47,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000676, train/loss_step=0.179, global_step=2391.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  92%|█████████▏| 1110/1208 [31:14<02:45,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000676, train/loss_step=0.179, global_step=2391.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  92%|█████████▏| 1110/1208 [31:14<02:45,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00224, train/loss_step=0.345, global_step=2391.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  92%|█████████▏| 1111/1208 [31:15<02:43,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00224, train/loss_step=0.345, global_step=2391.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  92%|█████████▏| 1111/1208 [31:15<02:43,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000371, train/loss_step=0.113, global_step=2391.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  92%|█████████▏| 1112/1208 [31:18<02:42,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000371, train/loss_step=0.113, global_step=2391.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  92%|█████████▏| 1112/1208 [31:18<02:42,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.000102, train/loss_step=0.0249, global_step=2391.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  92%|█████████▏| 1113/1208 [31:19<02:40,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.000102, train/loss_step=0.0249, global_step=2391.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  92%|█████████▏| 1113/1208 [31:19<02:40,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0512, train/loss_vlb_step=0.000179, train/loss_step=0.0512, global_step=2392.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  92%|█████████▏| 1114/1208 [31:20<02:38,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0512, train/loss_vlb_step=0.000179, train/loss_step=0.0512, global_step=2392.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  92%|█████████▏| 1114/1208 [31:20<02:38,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00174, train/loss_step=0.332, global_step=2392.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  92%|█████████▏| 1115/1208 [31:21<02:36,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00174, train/loss_step=0.332, global_step=2392.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  92%|█████████▏| 1115/1208 [31:21<02:36,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00261, train/loss_step=0.345, global_step=2392.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  92%|█████████▏| 1116/1208 [31:24<02:35,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00261, train/loss_step=0.345, global_step=2392.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  92%|█████████▏| 1116/1208 [31:24<02:35,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0641, train/loss_vlb_step=0.000221, train/loss_step=0.0641, global_step=2392.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  92%|█████████▏| 1117/1208 [31:25<02:33,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0641, train/loss_vlb_step=0.000221, train/loss_step=0.0641, global_step=2392.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  92%|█████████▏| 1117/1208 [31:25<02:33,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000484, train/loss_step=0.142, global_step=2393.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  93%|█████████▎| 1118/1208 [31:26<02:31,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000484, train/loss_step=0.142, global_step=2393.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  93%|█████████▎| 1118/1208 [31:26<02:31,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.25e-5, train/loss_step=0.00212, global_step=2393.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  93%|█████████▎| 1119/1208 [31:27<02:30,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.25e-5, train/loss_step=0.00212, global_step=2393.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  93%|█████████▎| 1119/1208 [31:27<02:30,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0636, train/loss_vlb_step=0.000218, train/loss_step=0.0636, global_step=2393.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  93%|█████████▎| 1120/1208 [31:31<02:28,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0636, train/loss_vlb_step=0.000218, train/loss_step=0.0636, global_step=2393.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  93%|█████████▎| 1120/1208 [31:31<02:28,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000405, train/loss_step=0.123, global_step=2393.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  93%|█████████▎| 1121/1208 [31:32<02:26,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000405, train/loss_step=0.123, global_step=2393.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  93%|█████████▎| 1121/1208 [31:32<02:26,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000646, train/loss_step=0.186, global_step=2394.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  93%|█████████▎| 1122/1208 [31:33<02:25,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000646, train/loss_step=0.186, global_step=2394.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  93%|█████████▎| 1122/1208 [31:33<02:25,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.000152, train/loss_step=0.0413, global_step=2394.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  93%|█████████▎| 1123/1208 [31:34<02:23,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.000152, train/loss_step=0.0413, global_step=2394.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  93%|█████████▎| 1123/1208 [31:34<02:23,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00367, train/loss_vlb_step=2.03e-5, train/loss_step=0.00367, global_step=2394.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  93%|█████████▎| 1124/1208 [31:37<02:21,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00367, train/loss_vlb_step=2.03e-5, train/loss_step=0.00367, global_step=2394.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  93%|█████████▎| 1124/1208 [31:37<02:21,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000584, train/loss_step=0.162, global_step=2394.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  93%|█████████▎| 1125/1208 [31:38<02:20,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000584, train/loss_step=0.162, global_step=2394.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  93%|█████████▎| 1125/1208 [31:38<02:20,  1.69s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0988, train/loss_vlb_step=0.000325, train/loss_step=0.0988, global_step=2395.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  93%|█████████▎| 1126/1208 [31:39<02:18,  1.69s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0988, train/loss_vlb_step=0.000325, train/loss_step=0.0988, global_step=2395.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  93%|█████████▎| 1126/1208 [31:39<02:18,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00165, train/loss_step=0.292, global_step=2395.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  93%|█████████▎| 1127/1208 [31:40<02:16,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00165, train/loss_step=0.292, global_step=2395.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  93%|█████████▎| 1127/1208 [31:40<02:16,  1.69s/it, loss=0.141, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000956, train/loss_step=0.250, global_step=2395.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  93%|█████████▎| 1128/1208 [31:43<02:14,  1.69s/it, loss=0.141, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000956, train/loss_step=0.250, global_step=2395.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  93%|█████████▎| 1128/1208 [31:43<02:14,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000936, train/loss_step=0.234, global_step=2395.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  93%|█████████▎| 1129/1208 [31:44<02:13,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000936, train/loss_step=0.234, global_step=2395.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  93%|█████████▎| 1129/1208 [31:44<02:13,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=1.82e-5, train/loss_step=0.00325, global_step=2396.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  94%|█████████▎| 1130/1208 [31:45<02:11,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=1.82e-5, train/loss_step=0.00325, global_step=2396.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  94%|█████████▎| 1130/1208 [31:45<02:11,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000655, train/loss_step=0.191, global_step=2396.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  94%|█████████▎| 1131/1208 [31:46<02:09,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000655, train/loss_step=0.191, global_step=2396.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  94%|█████████▎| 1131/1208 [31:46<02:09,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0419, train/loss_vlb_step=0.000163, train/loss_step=0.0419, global_step=2396.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  94%|█████████▎| 1132/1208 [31:48<02:08,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0419, train/loss_vlb_step=0.000163, train/loss_step=0.0419, global_step=2396.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  94%|█████████▎| 1132/1208 [31:48<02:08,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.29e-5, train/loss_step=0.00423, global_step=2396.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  94%|█████████▍| 1133/1208 [31:49<02:06,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.29e-5, train/loss_step=0.00423, global_step=2396.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  94%|█████████▍| 1133/1208 [31:49<02:06,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.00086, train/loss_step=0.225, global_step=2397.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]     Epoch 7:  94%|█████████▍| 1134/1208 [31:51<02:04,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.00086, train/loss_step=0.225, global_step=2397.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  94%|█████████▍| 1134/1208 [31:51<02:04,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000102, train/loss_step=0.0254, global_step=2397.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  94%|█████████▍| 1135/1208 [31:52<02:02,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000102, train/loss_step=0.0254, global_step=2397.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  94%|█████████▍| 1135/1208 [31:52<02:02,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=9.98e-5, train/loss_step=0.0258, global_step=2397.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  94%|█████████▍| 1136/1208 [31:54<02:01,  1.69s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=9.98e-5, train/loss_step=0.0258, global_step=2397.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  94%|█████████▍| 1136/1208 [31:54<02:01,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00251, train/loss_step=0.398, global_step=2397.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  94%|█████████▍| 1137/1208 [31:55<01:59,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00251, train/loss_step=0.398, global_step=2397.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  94%|█████████▍| 1137/1208 [31:55<01:59,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000583, train/loss_step=0.166, global_step=2398.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  94%|█████████▍| 1138/1208 [31:56<01:57,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000583, train/loss_step=0.166, global_step=2398.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  94%|█████████▍| 1138/1208 [31:56<01:57,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000718, train/loss_step=0.202, global_step=2398.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  94%|█████████▍| 1139/1208 [31:57<01:56,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000718, train/loss_step=0.202, global_step=2398.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  94%|█████████▍| 1139/1208 [31:57<01:56,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00113, train/loss_step=0.264, global_step=2398.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  94%|█████████▍| 1140/1208 [32:00<01:54,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00113, train/loss_step=0.264, global_step=2398.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  94%|█████████▍| 1140/1208 [32:00<01:54,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.86e-5, train/loss_step=0.0209, global_step=2398.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  94%|█████████▍| 1141/1208 [32:01<01:52,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.86e-5, train/loss_step=0.0209, global_step=2398.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  94%|█████████▍| 1141/1208 [32:01<01:52,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.38e-5, train/loss_step=0.0176, global_step=2399.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  95%|█████████▍| 1142/1208 [32:02<01:51,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.38e-5, train/loss_step=0.0176, global_step=2399.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  95%|█████████▍| 1142/1208 [32:02<01:51,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000527, train/loss_step=0.157, global_step=2399.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  95%|█████████▍| 1143/1208 [32:03<01:49,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000527, train/loss_step=0.157, global_step=2399.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  95%|█████████▍| 1143/1208 [32:03<01:49,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000603, train/loss_step=0.177, global_step=2399.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  95%|█████████▍| 1144/1208 [32:06<01:47,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000603, train/loss_step=0.177, global_step=2399.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  95%|█████████▍| 1144/1208 [32:06<01:47,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000755, train/loss_step=0.207, global_step=2399.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  95%|█████████▍| 1145/1208 [32:07<01:46,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000755, train/loss_step=0.207, global_step=2399.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  95%|█████████▍| 1145/1208 [32:07<01:46,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.32e-5, train/loss_step=0.0143, global_step=2400.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  95%|█████████▍| 1146/1208 [32:08<01:44,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.32e-5, train/loss_step=0.0143, global_step=2400.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  95%|█████████▍| 1146/1208 [32:08<01:44,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00729, train/loss_vlb_step=3.38e-5, train/loss_step=0.00729, global_step=2400.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  95%|█████████▍| 1147/1208 [32:09<01:42,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00729, train/loss_vlb_step=3.38e-5, train/loss_step=0.00729, global_step=2400.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  95%|█████████▍| 1147/1208 [32:09<01:42,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0781, train/loss_vlb_step=0.000259, train/loss_step=0.0781, global_step=2400.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  95%|█████████▌| 1148/1208 [32:12<01:41,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0781, train/loss_vlb_step=0.000259, train/loss_step=0.0781, global_step=2400.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  95%|█████████▌| 1148/1208 [32:12<01:41,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000501, train/loss_step=0.152, global_step=2400.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  95%|█████████▌| 1149/1208 [32:13<01:39,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000501, train/loss_step=0.152, global_step=2400.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  95%|█████████▌| 1149/1208 [32:13<01:39,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00685, train/loss_vlb_step=3.51e-5, train/loss_step=0.00685, global_step=2401.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  95%|█████████▌| 1150/1208 [32:14<01:37,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00685, train/loss_vlb_step=3.51e-5, train/loss_step=0.00685, global_step=2401.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  95%|█████████▌| 1150/1208 [32:14<01:37,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.0006, train/loss_step=0.174, global_step=2401.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]     Epoch 7:  95%|█████████▌| 1151/1208 [32:15<01:35,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.0006, train/loss_step=0.174, global_step=2401.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  95%|█████████▌| 1151/1208 [32:15<01:35,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0637, train/loss_vlb_step=0.000222, train/loss_step=0.0637, global_step=2401.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  95%|█████████▌| 1152/1208 [32:18<01:34,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0637, train/loss_vlb_step=0.000222, train/loss_step=0.0637, global_step=2401.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  95%|█████████▌| 1152/1208 [32:18<01:34,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000446, train/loss_step=0.135, global_step=2401.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  95%|█████████▌| 1153/1208 [32:19<01:32,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000446, train/loss_step=0.135, global_step=2401.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  95%|█████████▌| 1153/1208 [32:19<01:32,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000577, train/loss_step=0.169, global_step=2402.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  96%|█████████▌| 1154/1208 [32:20<01:30,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000577, train/loss_step=0.169, global_step=2402.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  96%|█████████▌| 1154/1208 [32:20<01:30,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00926, train/loss_vlb_step=4.4e-5, train/loss_step=0.00926, global_step=2402.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  96%|█████████▌| 1155/1208 [32:21<01:29,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00926, train/loss_vlb_step=4.4e-5, train/loss_step=0.00926, global_step=2402.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  96%|█████████▌| 1155/1208 [32:21<01:29,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.000142, train/loss_step=0.038, global_step=2402.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  96%|█████████▌| 1156/1208 [32:24<01:27,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.000142, train/loss_step=0.038, global_step=2402.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  96%|█████████▌| 1156/1208 [32:24<01:27,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.00354, train/loss_step=0.417, global_step=2402.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  96%|█████████▌| 1157/1208 [32:25<01:25,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.00354, train/loss_step=0.417, global_step=2402.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  96%|█████████▌| 1157/1208 [32:25<01:25,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0895, train/loss_vlb_step=0.000296, train/loss_step=0.0895, global_step=2403.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  96%|█████████▌| 1158/1208 [32:26<01:24,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0895, train/loss_vlb_step=0.000296, train/loss_step=0.0895, global_step=2403.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  96%|█████████▌| 1158/1208 [32:26<01:24,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00414, train/loss_step=0.398, global_step=2403.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  96%|█████████▌| 1159/1208 [32:27<01:22,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00414, train/loss_step=0.398, global_step=2403.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  96%|█████████▌| 1159/1208 [32:27<01:22,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.65e-5, train/loss_step=0.0214, global_step=2403.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  96%|█████████▌| 1160/1208 [32:30<01:20,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.65e-5, train/loss_step=0.0214, global_step=2403.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  96%|█████████▌| 1160/1208 [32:30<01:20,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.00044, train/loss_step=0.131, global_step=2403.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  96%|█████████▌| 1161/1208 [32:31<01:18,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.00044, train/loss_step=0.131, global_step=2403.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  96%|█████████▌| 1161/1208 [32:31<01:18,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000112, train/loss_step=0.0284, global_step=2404.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  96%|█████████▌| 1162/1208 [32:32<01:17,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000112, train/loss_step=0.0284, global_step=2404.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  96%|█████████▌| 1162/1208 [32:32<01:17,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0706, train/loss_vlb_step=0.000238, train/loss_step=0.0706, global_step=2404.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  96%|█████████▋| 1163/1208 [32:33<01:15,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0706, train/loss_vlb_step=0.000238, train/loss_step=0.0706, global_step=2404.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  96%|█████████▋| 1163/1208 [32:33<01:15,  1.68s/it, loss=0.116, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=2404.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  96%|█████████▋| 1164/1208 [32:36<01:13,  1.68s/it, loss=0.116, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=2404.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  96%|█████████▋| 1164/1208 [32:36<01:13,  1.68s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.86e-5, train/loss_step=0.0032, global_step=2404.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  96%|█████████▋| 1165/1208 [32:37<01:12,  1.68s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.86e-5, train/loss_step=0.0032, global_step=2404.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  96%|█████████▋| 1165/1208 [32:37<01:12,  1.68s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00698, train/loss_vlb_step=3.47e-5, train/loss_step=0.00698, global_step=2405.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  97%|█████████▋| 1166/1208 [32:38<01:10,  1.68s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00698, train/loss_vlb_step=3.47e-5, train/loss_step=0.00698, global_step=2405.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  97%|█████████▋| 1166/1208 [32:38<01:10,  1.68s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0398, train/loss_vlb_step=0.000147, train/loss_step=0.0398, global_step=2405.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  97%|█████████▋| 1167/1208 [32:39<01:08,  1.68s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0398, train/loss_vlb_step=0.000147, train/loss_step=0.0398, global_step=2405.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  97%|█████████▋| 1167/1208 [32:39<01:08,  1.68s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00652, train/loss_vlb_step=3.32e-5, train/loss_step=0.00652, global_step=2405.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  97%|█████████▋| 1168/1208 [32:42<01:07,  1.68s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00652, train/loss_vlb_step=3.32e-5, train/loss_step=0.00652, global_step=2405.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  97%|█████████▋| 1168/1208 [32:42<01:07,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00108, train/loss_step=0.251, global_step=2405.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  97%|█████████▋| 1169/1208 [32:43<01:05,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00108, train/loss_step=0.251, global_step=2405.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  97%|█████████▋| 1169/1208 [32:43<01:05,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000337, train/loss_step=0.103, global_step=2406.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  97%|█████████▋| 1170/1208 [32:44<01:03,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000337, train/loss_step=0.103, global_step=2406.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  97%|█████████▋| 1170/1208 [32:44<01:03,  1.68s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=0.000103, train/loss_step=0.0242, global_step=2406.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  97%|█████████▋| 1171/1208 [32:45<01:02,  1.68s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=0.000103, train/loss_step=0.0242, global_step=2406.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  97%|█████████▋| 1171/1208 [32:45<01:02,  1.68s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000105, train/loss_step=0.0258, global_step=2406.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  97%|█████████▋| 1172/1208 [32:48<01:00,  1.68s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000105, train/loss_step=0.0258, global_step=2406.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  97%|█████████▋| 1172/1208 [32:48<01:00,  1.68s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=2.71e-5, train/loss_step=0.00518, global_step=2406.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  97%|█████████▋| 1173/1208 [32:49<00:58,  1.68s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=2.71e-5, train/loss_step=0.00518, global_step=2406.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  97%|█████████▋| 1173/1208 [32:49<00:58,  1.68s/it, loss=0.098, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000662, train/loss_step=0.180, global_step=2407.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  97%|█████████▋| 1174/1208 [32:50<00:57,  1.68s/it, loss=0.098, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000662, train/loss_step=0.180, global_step=2407.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  97%|█████████▋| 1174/1208 [32:50<00:57,  1.68s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000172, train/loss_step=0.0478, global_step=2407.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  97%|█████████▋| 1175/1208 [32:51<00:55,  1.68s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000172, train/loss_step=0.0478, global_step=2407.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  97%|█████████▋| 1175/1208 [32:51<00:55,  1.68s/it, loss=0.102, v_num=0, train/loss_simple_step=0.073, train/loss_vlb_step=0.000245, train/loss_step=0.073, global_step=2407.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  97%|█████████▋| 1176/1208 [32:54<00:53,  1.68s/it, loss=0.102, v_num=0, train/loss_simple_step=0.073, train/loss_vlb_step=0.000245, train/loss_step=0.073, global_step=2407.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  97%|█████████▋| 1176/1208 [32:54<00:53,  1.68s/it, loss=0.103, v_num=0, train/loss_simple_step=0.453, train/loss_vlb_step=0.00501, train/loss_step=0.453, global_step=2407.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  97%|█████████▋| 1177/1208 [32:55<00:52,  1.68s/it, loss=0.103, v_num=0, train/loss_simple_step=0.453, train/loss_vlb_step=0.00501, train/loss_step=0.453, global_step=2407.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  97%|█████████▋| 1177/1208 [32:55<00:52,  1.68s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.000187, train/loss_step=0.0508, global_step=2408.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  98%|█████████▊| 1178/1208 [32:56<00:50,  1.68s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.000187, train/loss_step=0.0508, global_step=2408.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  98%|█████████▊| 1178/1208 [32:56<00:50,  1.68s/it, loss=0.0823, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.75e-5, train/loss_step=0.0126, global_step=2408.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  98%|█████████▊| 1179/1208 [32:57<00:48,  1.68s/it, loss=0.0823, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.75e-5, train/loss_step=0.0126, global_step=2408.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  98%|█████████▊| 1179/1208 [32:57<00:48,  1.68s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00148, train/loss_step=0.293, global_step=2408.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  98%|█████████▊| 1180/1208 [33:00<00:46,  1.68s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00148, train/loss_step=0.293, global_step=2408.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  98%|█████████▊| 1180/1208 [33:00<00:46,  1.68s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000121, train/loss_step=0.0332, global_step=2408.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  98%|█████████▊| 1181/1208 [33:01<00:45,  1.68s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000121, train/loss_step=0.0332, global_step=2408.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  98%|█████████▊| 1181/1208 [33:01<00:45,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.474, train/loss_vlb_step=0.00719, train/loss_step=0.474, global_step=2409.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  98%|█████████▊| 1182/1208 [33:02<00:43,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.474, train/loss_vlb_step=0.00719, train/loss_step=0.474, global_step=2409.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  98%|█████████▊| 1182/1208 [33:02<00:43,  1.68s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.58e-5, train/loss_step=0.0114, global_step=2409.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  98%|█████████▊| 1183/1208 [33:03<00:41,  1.68s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.58e-5, train/loss_step=0.0114, global_step=2409.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  98%|█████████▊| 1183/1208 [33:03<00:41,  1.68s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00519, train/loss_vlb_step=2.77e-5, train/loss_step=0.00519, global_step=2409.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  98%|█████████▊| 1184/1208 [33:05<00:40,  1.68s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00519, train/loss_vlb_step=2.77e-5, train/loss_step=0.00519, global_step=2409.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  98%|█████████▊| 1184/1208 [33:05<00:40,  1.68s/it, loss=0.106, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.22e-5, train/loss_step=0.017, global_step=2409.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  98%|█████████▊| 1185/1208 [33:06<00:38,  1.68s/it, loss=0.106, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.22e-5, train/loss_step=0.017, global_step=2409.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  98%|█████████▊| 1185/1208 [33:06<00:38,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00209, train/loss_step=0.338, global_step=2410.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  98%|█████████▊| 1186/1208 [33:07<00:36,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00209, train/loss_step=0.338, global_step=2410.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  98%|█████████▊| 1186/1208 [33:07<00:36,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000804, train/loss_step=0.205, global_step=2410.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  98%|█████████▊| 1187/1208 [33:09<00:35,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000804, train/loss_step=0.205, global_step=2410.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  98%|█████████▊| 1187/1208 [33:09<00:35,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.78e-5, train/loss_step=0.0101, global_step=2410.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  98%|█████████▊| 1188/1208 [33:11<00:33,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.78e-5, train/loss_step=0.0101, global_step=2410.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  98%|█████████▊| 1188/1208 [33:11<00:33,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0631, train/loss_vlb_step=0.000223, train/loss_step=0.0631, global_step=2410.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  98%|█████████▊| 1189/1208 [33:12<00:31,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0631, train/loss_vlb_step=0.000223, train/loss_step=0.0631, global_step=2410.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  98%|█████████▊| 1189/1208 [33:12<00:31,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00249, train/loss_step=0.376, global_step=2411.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]   Epoch 7:  99%|█████████▊| 1190/1208 [33:13<00:30,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00249, train/loss_step=0.376, global_step=2411.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  99%|█████████▊| 1190/1208 [33:13<00:30,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0079, train/loss_vlb_step=3.88e-5, train/loss_step=0.0079, global_step=2411.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  99%|█████████▊| 1191/1208 [33:14<00:28,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0079, train/loss_vlb_step=3.88e-5, train/loss_step=0.0079, global_step=2411.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  99%|█████████▊| 1191/1208 [33:14<00:28,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.479, train/loss_vlb_step=0.00805, train/loss_step=0.479, global_step=2411.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7:  99%|█████████▊| 1192/1208 [33:17<00:26,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.479, train/loss_vlb_step=0.00805, train/loss_step=0.479, global_step=2411.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  99%|█████████▊| 1192/1208 [33:17<00:26,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00613, train/loss_vlb_step=3.24e-5, train/loss_step=0.00613, global_step=2411.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  99%|█████████▉| 1193/1208 [33:18<00:25,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00613, train/loss_vlb_step=3.24e-5, train/loss_step=0.00613, global_step=2411.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  99%|█████████▉| 1193/1208 [33:18<00:25,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00501, train/loss_vlb_step=2.65e-5, train/loss_step=0.00501, global_step=2412.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  99%|█████████▉| 1194/1208 [33:19<00:23,  1.67s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00501, train/loss_vlb_step=2.65e-5, train/loss_step=0.00501, global_step=2412.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  99%|█████████▉| 1194/1208 [33:19<00:23,  1.67s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=2.2e-5, train/loss_step=0.00407, global_step=2412.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7:  99%|█████████▉| 1195/1208 [33:20<00:21,  1.67s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=2.2e-5, train/loss_step=0.00407, global_step=2412.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  99%|█████████▉| 1195/1208 [33:20<00:21,  1.67s/it, loss=0.181, v_num=0, train/loss_simple_step=0.782, train/loss_vlb_step=0.0503, train/loss_step=0.782, global_step=2412.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  99%|█████████▉| 1196/1208 [33:23<00:20,  1.68s/it, loss=0.181, v_num=0, train/loss_simple_step=0.782, train/loss_vlb_step=0.0503, train/loss_step=0.782, global_step=2412.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  99%|█████████▉| 1196/1208 [33:23<00:20,  1.68s/it, loss=0.176, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00179, train/loss_step=0.349, global_step=2412.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  99%|█████████▉| 1197/1208 [33:24<00:18,  1.67s/it, loss=0.176, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00179, train/loss_step=0.349, global_step=2412.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  99%|█████████▉| 1197/1208 [33:24<00:18,  1.67s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00527, train/loss_vlb_step=2.69e-5, train/loss_step=0.00527, global_step=2413.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  99%|█████████▉| 1198/1208 [33:25<00:16,  1.67s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00527, train/loss_vlb_step=2.69e-5, train/loss_step=0.00527, global_step=2413.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  99%|█████████▉| 1198/1208 [33:25<00:16,  1.67s/it, loss=0.196, v_num=0, train/loss_simple_step=0.445, train/loss_vlb_step=0.00477, train/loss_step=0.445, global_step=2413.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]    Epoch 7:  99%|█████████▉| 1199/1208 [33:26<00:15,  1.67s/it, loss=0.196, v_num=0, train/loss_simple_step=0.445, train/loss_vlb_step=0.00477, train/loss_step=0.445, global_step=2413.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  99%|█████████▉| 1199/1208 [33:26<00:15,  1.67s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=8.88e-5, train/loss_step=0.0221, global_step=2413.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  99%|█████████▉| 1200/1208 [33:29<00:13,  1.67s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=8.88e-5, train/loss_step=0.0221, global_step=2413.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  99%|█████████▉| 1200/1208 [33:29<00:13,  1.67s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0651, train/loss_vlb_step=0.000218, train/loss_step=0.0651, global_step=2413.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.86it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.84it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:25,  1.86it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.84it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.85it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.84it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.85it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.85it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.85it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.85it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.83it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.85it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.84it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.83it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.85it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.84it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.85it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.84it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.85it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.86it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.84it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.85it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.83it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.85it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:19,  1.85it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.85it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:18,  1.84it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.84it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.85it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.84it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.85it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.85it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.85it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.85it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.85it/s][ADDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.84it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.85it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.84it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.83it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.85it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.84it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.85it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:12<00:14,  1.85it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.84it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.85it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.85it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.83it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.85it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.83it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.84it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.84it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.84it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.84it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.84it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.84it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:18<00:08,  1.83it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.84it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.83it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.84it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.84it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.84it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.84it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.84it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.84it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.84it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.82it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.84it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.84it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.85it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.84it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.84it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.84it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.83it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.84it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.83it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.83it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.84it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.84it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:24<00:02,  1.84it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:24<00:02,  1.84it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.83it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.84it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.84it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.83it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.84it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.84it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.83it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.84it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.84it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.83it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]Epoch 7:  99%|█████████▉| 1201/1208 [33:59<00:11,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0651, train/loss_vlb_step=0.000218, train/loss_step=0.0651, global_step=2413.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7:  99%|█████████▉| 1201/1208 [33:59<00:11,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.75e-5, train/loss_step=0.0162, global_step=2414.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7: 100%|█████████▉| 1202/1208 [34:00<00:10,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.75e-5, train/loss_step=0.0162, global_step=2414.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7: 100%|█████████▉| 1202/1208 [34:00<00:10,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000505, train/loss_step=0.150, global_step=2414.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7: 100%|█████████▉| 1203/1208 [34:01<00:08,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000505, train/loss_step=0.150, global_step=2414.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7: 100%|█████████▉| 1203/1208 [34:01<00:08,  1.70s/it, loss=0.199, v_num=0, train/loss_simple_step=0.626, train/loss_vlb_step=0.0195, train/loss_step=0.626, global_step=2414.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]  Epoch 7: 100%|█████████▉| 1204/1208 [34:04<00:06,  1.70s/it, loss=0.199, v_num=0, train/loss_simple_step=0.626, train/loss_vlb_step=0.0195, train/loss_step=0.626, global_step=2414.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7: 100%|█████████▉| 1204/1208 [34:04<00:06,  1.70s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=2.04e-5, train/loss_step=0.00365, global_step=2414.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7: 100%|█████████▉| 1205/1208 [34:05<00:05,  1.70s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=2.04e-5, train/loss_step=0.00365, global_step=2414.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7: 100%|█████████▉| 1205/1208 [34:05<00:05,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0604, train/loss_vlb_step=0.000209, train/loss_step=0.0604, global_step=2415.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7: 100%|█████████▉| 1206/1208 [34:06<00:03,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0604, train/loss_vlb_step=0.000209, train/loss_step=0.0604, global_step=2415.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7: 100%|█████████▉| 1206/1208 [34:06<00:03,  1.70s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00484, train/loss_vlb_step=2.53e-5, train/loss_step=0.00484, global_step=2415.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7: 100%|█████████▉| 1207/1208 [34:07<00:01,  1.70s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00484, train/loss_vlb_step=2.53e-5, train/loss_step=0.00484, global_step=2415.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7: 100%|█████████▉| 1207/1208 [34:07<00:01,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0793, train/loss_vlb_step=0.000271, train/loss_step=0.0793, global_step=2415.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144] Epoch 7: 100%|██████████| 1208/1208 [34:11<00:00,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0793, train/loss_vlb_step=0.000271, train/loss_step=0.0793, global_step=2415.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 7: 100%|██████████| 1208/1208 [34:11<00:00,  1.70s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000123, train/loss_step=0.0348, global_step=2415.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]
+
+
+Epoch 7:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.176, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000123, train/loss_step=0.0348, global_step=2415.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]           Epoch 8:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.176, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000123, train/loss_step=0.0348, global_step=2415.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][AData shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.84it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.86it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.84it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.84it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.85it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.84it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.84it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.84it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.84it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.84it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.84it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.83it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.84it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.85it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.83it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.84it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.84it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.84it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.84it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.85it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.85it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.86it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.85it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.83it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.86it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.84it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:19,  1.86it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.84it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.86it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.85it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:18,  1.85it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.85it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.85it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.85it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.85it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.85it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.85it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.85it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.85it/s][ADDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.85it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.85it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.85it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.83it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.85it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.85it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.85it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.85it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:12<00:14,  1.85it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.84it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.86it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.84it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:12,  1.86it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:12,  1.85it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.85it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.85it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.83it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.85it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.83it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.85it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.85it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.83it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.85it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.85it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.83it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.86it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.85it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.83it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.86it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.85it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.83it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.86it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.85it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.83it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.86it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.85it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.83it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:18<00:08,  1.86it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:18<00:08,  1.86it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.85it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.86it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:19<00:07,  1.85it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.85it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.83it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.85it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.86it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.83it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.81it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.85it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.85it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.83it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.85it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.85it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.83it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.85it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.85it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.85it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.85it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.82it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.85it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.85it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.83it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.84it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.85it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.84it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.85it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:24<00:02,  1.85it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:24<00:02,  1.85it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.85it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.85it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:25<00:01,  1.85it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:25<00:01,  1.85it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.85it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.85it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.85it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.85it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.85it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.85it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.83it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]Epoch 8:   0%|          | 1/1208 [00:30<10:18:47, 30.76s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000123, train/loss_step=0.0348, global_step=2415.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.0036, train/loss_epoch=0.144]Epoch 8:   0%|          | 1/1208 [00:30<10:18:48, 30.76s/it, loss=0.167, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000677, train/loss_step=0.188, global_step=2416.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:   0%|          | 2/1208 [00:31<5:19:12, 15.88s/it, loss=0.167, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000677, train/loss_step=0.188, global_step=2416.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:   0%|          | 2/1208 [00:31<5:19:13, 15.88s/it, loss=0.184, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00205, train/loss_step=0.347, global_step=2416.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:   0%|          | 3/1208 [00:32<3:39:25, 10.93s/it, loss=0.184, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00205, train/loss_step=0.347, global_step=2416.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   0%|          | 3/1208 [00:32<3:39:25, 10.93s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000106, train/loss_step=0.0273, global_step=2416.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   0%|          | 4/1208 [00:35<2:58:48,  8.91s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000106, train/loss_step=0.0273, global_step=2416.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   0%|          | 4/1208 [00:35<2:58:49,  8.91s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00727, train/loss_vlb_step=3.65e-5, train/loss_step=0.00727, global_step=2416.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   0%|          | 5/1208 [00:36<2:27:00,  7.33s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00727, train/loss_vlb_step=3.65e-5, train/loss_step=0.00727, global_step=2416.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   0%|          | 5/1208 [00:36<2:27:00,  7.33s/it, loss=0.167, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000394, train/loss_step=0.119, global_step=2417.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:   0%|          | 6/1208 [00:37<2:05:45,  6.28s/it, loss=0.167, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000394, train/loss_step=0.119, global_step=2417.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   0%|          | 6/1208 [00:37<2:05:45,  6.28s/it, loss=0.191, v_num=0, train/loss_simple_step=0.494, train/loss_vlb_step=0.00409, train/loss_step=0.494, global_step=2417.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:   1%|          | 7/1208 [00:38<1:50:35,  5.52s/it, loss=0.191, v_num=0, train/loss_simple_step=0.494, train/loss_vlb_step=0.00409, train/loss_step=0.494, global_step=2417.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   1%|          | 7/1208 [00:38<1:50:35,  5.53s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00496, train/loss_vlb_step=2.62e-5, train/loss_step=0.00496, global_step=2417.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   1%|          | 8/1208 [00:41<1:43:51,  5.19s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00496, train/loss_vlb_step=2.62e-5, train/loss_step=0.00496, global_step=2417.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   1%|          | 8/1208 [00:41<1:43:52,  5.19s/it, loss=0.144, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000599, train/loss_step=0.179, global_step=2417.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:   1%|          | 9/1208 [00:42<1:34:29,  4.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000599, train/loss_step=0.179, global_step=2417.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   1%|          | 9/1208 [00:42<1:34:29,  4.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.72e-5, train/loss_step=0.0152, global_step=2418.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   1%|          | 10/1208 [00:43<1:26:59,  4.36s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.72e-5, train/loss_step=0.0152, global_step=2418.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   1%|          | 10/1208 [00:43<1:26:59,  4.36s/it, loss=0.139, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.0017, train/loss_step=0.331, global_step=2418.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:   1%|          | 11/1208 [00:44<1:20:50,  4.05s/it, loss=0.139, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.0017, train/loss_step=0.331, global_step=2418.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   1%|          | 11/1208 [00:44<1:20:50,  4.05s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0736, train/loss_vlb_step=0.00025, train/loss_step=0.0736, global_step=2418.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   1%|          | 12/1208 [00:47<1:18:50,  3.96s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0736, train/loss_vlb_step=0.00025, train/loss_step=0.0736, global_step=2418.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   1%|          | 12/1208 [00:47<1:18:50,  3.96s/it, loss=0.154, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00141, train/loss_step=0.321, global_step=2418.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:   1%|          | 13/1208 [00:48<1:14:16,  3.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00141, train/loss_step=0.321, global_step=2418.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   1%|          | 13/1208 [00:48<1:14:16,  3.73s/it, loss=0.176, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00662, train/loss_step=0.458, global_step=2419.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   1%|          | 14/1208 [00:49<1:10:19,  3.53s/it, loss=0.176, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00662, train/loss_step=0.458, global_step=2419.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   1%|          | 14/1208 [00:49<1:10:19,  3.53s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000115, train/loss_step=0.0298, global_step=2419.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   1%|          | 15/1208 [00:50<1:06:55,  3.37s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000115, train/loss_step=0.0298, global_step=2419.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   1%|          | 15/1208 [00:50<1:06:55,  3.37s/it, loss=0.16, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00325, train/loss_step=0.413, global_step=2419.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:   1%|▏         | 16/1208 [00:53<1:06:17,  3.34s/it, loss=0.16, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00325, train/loss_step=0.413, global_step=2419.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   1%|▏         | 16/1208 [00:53<1:06:17,  3.34s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0411, train/loss_vlb_step=0.000153, train/loss_step=0.0411, global_step=2419.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   1%|▏         | 17/1208 [00:54<1:03:30,  3.20s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0411, train/loss_vlb_step=0.000153, train/loss_step=0.0411, global_step=2419.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   1%|▏         | 17/1208 [00:54<1:03:30,  3.20s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0717, train/loss_vlb_step=0.000253, train/loss_step=0.0717, global_step=2420.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   1%|▏         | 18/1208 [00:55<1:01:02,  3.08s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0717, train/loss_vlb_step=0.000253, train/loss_step=0.0717, global_step=2420.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   1%|▏         | 18/1208 [00:55<1:01:02,  3.08s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.3e-5, train/loss_step=0.0113, global_step=2420.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:   2%|▏         | 19/1208 [00:56<58:49,  2.97s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.3e-5, train/loss_step=0.0113, global_step=2420.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:   2%|▏         | 19/1208 [00:56<58:49,  2.97s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0066, train/loss_vlb_step=3.45e-5, train/loss_step=0.0066, global_step=2420.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   2%|▏         | 20/1208 [00:59<58:41,  2.96s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0066, train/loss_vlb_step=3.45e-5, train/loss_step=0.0066, global_step=2420.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   2%|▏         | 20/1208 [00:59<58:42,  2.96s/it, loss=0.166, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000616, train/loss_step=0.176, global_step=2420.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:   2%|▏         | 21/1208 [01:00<56:48,  2.87s/it, loss=0.166, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000616, train/loss_step=0.176, global_step=2420.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   2%|▏         | 21/1208 [01:00<56:49,  2.87s/it, loss=0.169, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00123, train/loss_step=0.249, global_step=2421.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:   2%|▏         | 22/1208 [01:01<55:05,  2.79s/it, loss=0.169, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00123, train/loss_step=0.249, global_step=2421.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   2%|▏         | 22/1208 [01:01<55:05,  2.79s/it, loss=0.158, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000439, train/loss_step=0.134, global_step=2421.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   2%|▏         | 23/1208 [01:02<53:30,  2.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000439, train/loss_step=0.134, global_step=2421.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   2%|▏         | 23/1208 [01:02<53:30,  2.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=5e-5, train/loss_step=0.0105, global_step=2421.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:   2%|▏         | 24/1208 [01:05<53:36,  2.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=5e-5, train/loss_step=0.0105, global_step=2421.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   2%|▏         | 24/1208 [01:05<53:37,  2.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00217, train/loss_step=0.385, global_step=2421.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   2%|▏         | 25/1208 [01:06<52:13,  2.65s/it, loss=0.176, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00217, train/loss_step=0.385, global_step=2421.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   2%|▏         | 25/1208 [01:06<52:13,  2.65s/it, loss=0.18, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000743, train/loss_step=0.200, global_step=2422.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   2%|▏         | 26/1208 [01:07<50:56,  2.59s/it, loss=0.18, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000743, train/loss_step=0.200, global_step=2422.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   2%|▏         | 26/1208 [01:07<50:56,  2.59s/it, loss=0.158, v_num=0, train/loss_simple_step=0.061, train/loss_vlb_step=0.000212, train/loss_step=0.061, global_step=2422.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   2%|▏         | 27/1208 [01:08<49:44,  2.53s/it, loss=0.158, v_num=0, train/loss_simple_step=0.061, train/loss_vlb_step=0.000212, train/loss_step=0.061, global_step=2422.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   2%|▏         | 27/1208 [01:08<49:44,  2.53s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0433, train/loss_vlb_step=0.000156, train/loss_step=0.0433, global_step=2422.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   2%|▏         | 28/1208 [01:11<49:57,  2.54s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0433, train/loss_vlb_step=0.000156, train/loss_step=0.0433, global_step=2422.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   2%|▏         | 28/1208 [01:11<49:57,  2.54s/it, loss=0.157, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000357, train/loss_step=0.108, global_step=2422.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:   2%|▏         | 29/1208 [01:12<48:53,  2.49s/it, loss=0.157, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000357, train/loss_step=0.108, global_step=2422.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   2%|▏         | 29/1208 [01:12<48:53,  2.49s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00598, train/loss_vlb_step=2.97e-5, train/loss_step=0.00598, global_step=2423.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   2%|▏         | 30/1208 [01:13<47:53,  2.44s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00598, train/loss_vlb_step=2.97e-5, train/loss_step=0.00598, global_step=2423.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   2%|▏         | 30/1208 [01:13<47:53,  2.44s/it, loss=0.156, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00128, train/loss_step=0.322, global_step=2423.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:   3%|▎         | 31/1208 [01:14<46:56,  2.39s/it, loss=0.156, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00128, train/loss_step=0.322, global_step=2423.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   3%|▎         | 31/1208 [01:14<46:56,  2.39s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.18e-5, train/loss_step=0.00195, global_step=2423.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   3%|▎         | 32/1208 [01:17<47:12,  2.41s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.18e-5, train/loss_step=0.00195, global_step=2423.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   3%|▎         | 32/1208 [01:17<47:12,  2.41s/it, loss=0.159, v_num=0, train/loss_simple_step=0.462, train/loss_vlb_step=0.00338, train/loss_step=0.462, global_step=2423.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:   3%|▎         | 33/1208 [01:18<46:19,  2.37s/it, loss=0.159, v_num=0, train/loss_simple_step=0.462, train/loss_vlb_step=0.00338, train/loss_step=0.462, global_step=2423.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   3%|▎         | 33/1208 [01:18<46:19,  2.37s/it, loss=0.143, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000398, train/loss_step=0.121, global_step=2424.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   3%|▎         | 34/1208 [01:19<45:30,  2.33s/it, loss=0.143, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000398, train/loss_step=0.121, global_step=2424.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   3%|▎         | 34/1208 [01:19<45:30,  2.33s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0354, train/loss_vlb_step=0.000134, train/loss_step=0.0354, global_step=2424.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   3%|▎         | 35/1208 [01:20<44:44,  2.29s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0354, train/loss_vlb_step=0.000134, train/loss_step=0.0354, global_step=2424.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   3%|▎         | 35/1208 [01:20<44:44,  2.29s/it, loss=0.131, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000648, train/loss_step=0.182, global_step=2424.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:   3%|▎         | 36/1208 [01:22<45:01,  2.30s/it, loss=0.131, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000648, train/loss_step=0.182, global_step=2424.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   3%|▎         | 36/1208 [01:22<45:01,  2.30s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.25e-5, train/loss_step=0.0146, global_step=2424.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   3%|▎         | 37/1208 [01:23<44:18,  2.27s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.25e-5, train/loss_step=0.0146, global_step=2424.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   3%|▎         | 37/1208 [01:23<44:18,  2.27s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0683, train/loss_vlb_step=0.000228, train/loss_step=0.0683, global_step=2425.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   3%|▎         | 38/1208 [01:24<43:36,  2.24s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0683, train/loss_vlb_step=0.000228, train/loss_step=0.0683, global_step=2425.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   3%|▎         | 38/1208 [01:24<43:36,  2.24s/it, loss=0.147, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00247, train/loss_step=0.361, global_step=2425.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:   3%|▎         | 39/1208 [01:25<42:57,  2.21s/it, loss=0.147, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00247, train/loss_step=0.361, global_step=2425.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   3%|▎         | 39/1208 [01:25<42:57,  2.21s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.74e-5, train/loss_step=0.0128, global_step=2425.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   3%|▎         | 40/1208 [01:29<43:24,  2.23s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.74e-5, train/loss_step=0.0128, global_step=2425.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   3%|▎         | 40/1208 [01:29<43:24,  2.23s/it, loss=0.143, v_num=0, train/loss_simple_step=0.074, train/loss_vlb_step=0.000252, train/loss_step=0.074, global_step=2425.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:   3%|▎         | 41/1208 [01:30<42:48,  2.20s/it, loss=0.143, v_num=0, train/loss_simple_step=0.074, train/loss_vlb_step=0.000252, train/loss_step=0.074, global_step=2425.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   3%|▎         | 41/1208 [01:30<42:48,  2.20s/it, loss=0.131, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.88e-5, train/loss_step=0.019, global_step=2426.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:   3%|▎         | 42/1208 [01:31<42:14,  2.17s/it, loss=0.131, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.88e-5, train/loss_step=0.019, global_step=2426.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   3%|▎         | 42/1208 [01:31<42:14,  2.17s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00571, train/loss_vlb_step=3.04e-5, train/loss_step=0.00571, global_step=2426.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   4%|▎         | 43/1208 [01:32<41:40,  2.15s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00571, train/loss_vlb_step=3.04e-5, train/loss_step=0.00571, global_step=2426.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   4%|▎         | 43/1208 [01:32<41:41,  2.15s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.34e-5, train/loss_step=0.0197, global_step=2426.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:   4%|▎         | 44/1208 [01:35<42:07,  2.17s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.34e-5, train/loss_step=0.0197, global_step=2426.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   4%|▎         | 44/1208 [01:35<42:07,  2.17s/it, loss=0.117, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000954, train/loss_step=0.223, global_step=2426.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:   4%|▎         | 45/1208 [01:36<41:36,  2.15s/it, loss=0.117, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000954, train/loss_step=0.223, global_step=2426.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   4%|▎         | 45/1208 [01:36<41:36,  2.15s/it, loss=0.117, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000735, train/loss_step=0.205, global_step=2427.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   4%|▍         | 46/1208 [01:37<41:06,  2.12s/it, loss=0.117, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000735, train/loss_step=0.205, global_step=2427.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   4%|▍         | 46/1208 [01:37<41:06,  2.12s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0652, train/loss_vlb_step=0.000225, train/loss_step=0.0652, global_step=2427.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   4%|▍         | 47/1208 [01:38<40:37,  2.10s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0652, train/loss_vlb_step=0.000225, train/loss_step=0.0652, global_step=2427.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   4%|▍         | 47/1208 [01:38<40:37,  2.10s/it, loss=0.143, v_num=0, train/loss_simple_step=0.545, train/loss_vlb_step=0.00576, train/loss_step=0.545, global_step=2427.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:   4%|▍         | 48/1208 [01:41<41:02,  2.12s/it, loss=0.143, v_num=0, train/loss_simple_step=0.545, train/loss_vlb_step=0.00576, train/loss_step=0.545, global_step=2427.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   4%|▍         | 48/1208 [01:41<41:03,  2.12s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.9e-5, train/loss_step=0.0246, global_step=2427.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   4%|▍         | 49/1208 [01:42<40:35,  2.10s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.9e-5, train/loss_step=0.0246, global_step=2427.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   4%|▍         | 49/1208 [01:42<40:35,  2.10s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0571, train/loss_vlb_step=0.0002, train/loss_step=0.0571, global_step=2428.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   4%|▍         | 50/1208 [01:44<40:08,  2.08s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0571, train/loss_vlb_step=0.0002, train/loss_step=0.0571, global_step=2428.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   4%|▍         | 50/1208 [01:44<40:08,  2.08s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00711, train/loss_vlb_step=3.3e-5, train/loss_step=0.00711, global_step=2428.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   4%|▍         | 51/1208 [01:45<39:42,  2.06s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00711, train/loss_vlb_step=3.3e-5, train/loss_step=0.00711, global_step=2428.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   4%|▍         | 51/1208 [01:45<39:43,  2.06s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=7.13e-5, train/loss_step=0.0164, global_step=2428.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:   4%|▍         | 52/1208 [01:48<40:07,  2.08s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=7.13e-5, train/loss_step=0.0164, global_step=2428.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   4%|▍         | 52/1208 [01:48<40:07,  2.08s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0896, train/loss_vlb_step=0.000301, train/loss_step=0.0896, global_step=2428.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   4%|▍         | 53/1208 [01:49<39:43,  2.06s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0896, train/loss_vlb_step=0.000301, train/loss_step=0.0896, global_step=2428.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   4%|▍         | 53/1208 [01:49<39:43,  2.06s/it, loss=0.111, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.00071, train/loss_step=0.195, global_step=2429.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:   4%|▍         | 54/1208 [01:50<39:19,  2.04s/it, loss=0.111, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.00071, train/loss_step=0.195, global_step=2429.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   4%|▍         | 54/1208 [01:50<39:19,  2.04s/it, loss=0.111, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.000123, train/loss_step=0.032, global_step=2429.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   5%|▍         | 55/1208 [01:51<38:56,  2.03s/it, loss=0.111, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.000123, train/loss_step=0.032, global_step=2429.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   5%|▍         | 55/1208 [01:51<38:56,  2.03s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00393, train/loss_vlb_step=2.14e-5, train/loss_step=0.00393, global_step=2429.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   5%|▍         | 56/1208 [01:54<39:19,  2.05s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00393, train/loss_vlb_step=2.14e-5, train/loss_step=0.00393, global_step=2429.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   5%|▍         | 56/1208 [01:54<39:19,  2.05s/it, loss=0.112, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000754, train/loss_step=0.208, global_step=2429.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:   5%|▍         | 57/1208 [01:55<38:57,  2.03s/it, loss=0.112, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000754, train/loss_step=0.208, global_step=2429.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   5%|▍         | 57/1208 [01:55<38:57,  2.03s/it, loss=0.119, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000881, train/loss_step=0.226, global_step=2430.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   5%|▍         | 58/1208 [01:56<38:35,  2.01s/it, loss=0.119, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000881, train/loss_step=0.226, global_step=2430.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   5%|▍         | 58/1208 [01:56<38:36,  2.01s/it, loss=0.105, v_num=0, train/loss_simple_step=0.064, train/loss_vlb_step=0.000221, train/loss_step=0.064, global_step=2430.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   5%|▍         | 59/1208 [01:57<38:15,  2.00s/it, loss=0.105, v_num=0, train/loss_simple_step=0.064, train/loss_vlb_step=0.000221, train/loss_step=0.064, global_step=2430.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   5%|▍         | 59/1208 [01:57<38:15,  2.00s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=1.22e-5, train/loss_step=0.00206, global_step=2430.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   5%|▍         | 60/1208 [02:01<38:37,  2.02s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=1.22e-5, train/loss_step=0.00206, global_step=2430.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   5%|▍         | 60/1208 [02:01<38:37,  2.02s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00414, train/loss_vlb_step=2.32e-5, train/loss_step=0.00414, global_step=2430.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   5%|▌         | 61/1208 [02:02<38:17,  2.00s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00414, train/loss_vlb_step=2.32e-5, train/loss_step=0.00414, global_step=2430.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   5%|▌         | 61/1208 [02:02<38:17,  2.00s/it, loss=0.109, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.0006, train/loss_step=0.178, global_step=2431.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]     Epoch 8:   5%|▌         | 62/1208 [02:03<37:57,  1.99s/it, loss=0.109, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.0006, train/loss_step=0.178, global_step=2431.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   5%|▌         | 62/1208 [02:03<37:57,  1.99s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.61e-5, train/loss_step=0.0174, global_step=2431.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   5%|▌         | 63/1208 [02:04<37:38,  1.97s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.61e-5, train/loss_step=0.0174, global_step=2431.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   5%|▌         | 63/1208 [02:04<37:38,  1.97s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0717, train/loss_vlb_step=0.000243, train/loss_step=0.0717, global_step=2431.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   5%|▌         | 64/1208 [02:07<37:59,  1.99s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0717, train/loss_vlb_step=0.000243, train/loss_step=0.0717, global_step=2431.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   5%|▌         | 64/1208 [02:07<37:59,  1.99s/it, loss=0.111, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000747, train/loss_step=0.210, global_step=2431.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:   5%|▌         | 65/1208 [02:08<37:40,  1.98s/it, loss=0.111, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000747, train/loss_step=0.210, global_step=2431.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   5%|▌         | 65/1208 [02:08<37:40,  1.98s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=1.39e-5, train/loss_step=0.0025, global_step=2432.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   5%|▌         | 66/1208 [02:09<37:22,  1.96s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=1.39e-5, train/loss_step=0.0025, global_step=2432.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   5%|▌         | 66/1208 [02:09<37:22,  1.96s/it, loss=0.114, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00189, train/loss_step=0.333, global_step=2432.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:   6%|▌         | 67/1208 [02:10<37:05,  1.95s/it, loss=0.114, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00189, train/loss_step=0.333, global_step=2432.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   6%|▌         | 67/1208 [02:10<37:05,  1.95s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000793, train/loss_step=0.215, global_step=2432.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   6%|▌         | 68/1208 [02:13<37:24,  1.97s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000793, train/loss_step=0.215, global_step=2432.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   6%|▌         | 68/1208 [02:13<37:24,  1.97s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.87e-5, train/loss_step=0.0219, global_step=2432.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   6%|▌         | 69/1208 [02:14<37:06,  1.96s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.87e-5, train/loss_step=0.0219, global_step=2432.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   6%|▌         | 69/1208 [02:14<37:06,  1.96s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.00553, train/loss_vlb_step=2.87e-5, train/loss_step=0.00553, global_step=2433.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   6%|▌         | 70/1208 [02:15<36:49,  1.94s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.00553, train/loss_vlb_step=2.87e-5, train/loss_step=0.00553, global_step=2433.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   6%|▌         | 70/1208 [02:15<36:49,  1.94s/it, loss=0.11, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00134, train/loss_step=0.304, global_step=2433.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]      Epoch 8:   6%|▌         | 71/1208 [02:16<36:33,  1.93s/it, loss=0.11, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00134, train/loss_step=0.304, global_step=2433.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   6%|▌         | 71/1208 [02:16<36:33,  1.93s/it, loss=0.133, v_num=0, train/loss_simple_step=0.467, train/loss_vlb_step=0.00764, train/loss_step=0.467, global_step=2433.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   6%|▌         | 72/1208 [02:20<36:52,  1.95s/it, loss=0.133, v_num=0, train/loss_simple_step=0.467, train/loss_vlb_step=0.00764, train/loss_step=0.467, global_step=2433.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   6%|▌         | 72/1208 [02:20<36:52,  1.95s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0775, train/loss_vlb_step=0.000261, train/loss_step=0.0775, global_step=2433.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   6%|▌         | 73/1208 [02:21<36:36,  1.94s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0775, train/loss_vlb_step=0.000261, train/loss_step=0.0775, global_step=2433.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   6%|▌         | 73/1208 [02:21<36:36,  1.94s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000144, train/loss_step=0.0381, global_step=2434.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   6%|▌         | 74/1208 [02:22<36:20,  1.92s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000144, train/loss_step=0.0381, global_step=2434.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   6%|▌         | 74/1208 [02:22<36:20,  1.92s/it, loss=0.133, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000796, train/loss_step=0.217, global_step=2434.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:   6%|▌         | 75/1208 [02:23<36:05,  1.91s/it, loss=0.133, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000796, train/loss_step=0.217, global_step=2434.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   6%|▌         | 75/1208 [02:23<36:05,  1.91s/it, loss=0.143, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000741, train/loss_step=0.196, global_step=2434.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   6%|▋         | 76/1208 [02:26<36:24,  1.93s/it, loss=0.143, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000741, train/loss_step=0.196, global_step=2434.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   6%|▋         | 76/1208 [02:26<36:24,  1.93s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0957, train/loss_vlb_step=0.000316, train/loss_step=0.0957, global_step=2434.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   6%|▋         | 77/1208 [02:27<36:09,  1.92s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0957, train/loss_vlb_step=0.000316, train/loss_step=0.0957, global_step=2434.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   6%|▋         | 77/1208 [02:27<36:09,  1.92s/it, loss=0.134, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000509, train/loss_step=0.152, global_step=2435.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:   6%|▋         | 78/1208 [02:28<35:55,  1.91s/it, loss=0.134, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000509, train/loss_step=0.152, global_step=2435.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   6%|▋         | 78/1208 [02:28<35:55,  1.91s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000113, train/loss_step=0.0282, global_step=2435.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   7%|▋         | 79/1208 [02:29<35:40,  1.90s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000113, train/loss_step=0.0282, global_step=2435.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   7%|▋         | 79/1208 [02:29<35:40,  1.90s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00794, train/loss_vlb_step=4e-5, train/loss_step=0.00794, global_step=2435.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:   7%|▋         | 80/1208 [02:33<35:58,  1.91s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00794, train/loss_vlb_step=4e-5, train/loss_step=0.00794, global_step=2435.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   7%|▋         | 80/1208 [02:33<35:58,  1.91s/it, loss=0.15, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00231, train/loss_step=0.354, global_step=2435.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:   7%|▋         | 81/1208 [02:34<35:44,  1.90s/it, loss=0.15, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00231, train/loss_step=0.354, global_step=2435.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   7%|▋         | 81/1208 [02:34<35:44,  1.90s/it, loss=0.177, v_num=0, train/loss_simple_step=0.733, train/loss_vlb_step=0.042, train/loss_step=0.733, global_step=2436.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:   7%|▋         | 82/1208 [02:35<35:31,  1.89s/it, loss=0.177, v_num=0, train/loss_simple_step=0.733, train/loss_vlb_step=0.042, train/loss_step=0.733, global_step=2436.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   7%|▋         | 82/1208 [02:35<35:31,  1.89s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000109, train/loss_step=0.0279, global_step=2436.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   7%|▋         | 83/1208 [02:36<35:17,  1.88s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000109, train/loss_step=0.0279, global_step=2436.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   7%|▋         | 83/1208 [02:36<35:17,  1.88s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.79e-5, train/loss_step=0.00313, global_step=2436.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   7%|▋         | 84/1208 [02:39<35:33,  1.90s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.79e-5, train/loss_step=0.00313, global_step=2436.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   7%|▋         | 84/1208 [02:39<35:33,  1.90s/it, loss=0.18, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00152, train/loss_step=0.323, global_step=2436.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]     Epoch 8:   7%|▋         | 85/1208 [02:40<35:20,  1.89s/it, loss=0.18, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00152, train/loss_step=0.323, global_step=2436.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   7%|▋         | 85/1208 [02:40<35:20,  1.89s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.57e-5, train/loss_step=0.00266, global_step=2437.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   7%|▋         | 86/1208 [02:41<35:07,  1.88s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.57e-5, train/loss_step=0.00266, global_step=2437.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   7%|▋         | 86/1208 [02:41<35:07,  1.88s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00581, train/loss_vlb_step=2.92e-5, train/loss_step=0.00581, global_step=2437.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   7%|▋         | 87/1208 [02:42<34:55,  1.87s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00581, train/loss_vlb_step=2.92e-5, train/loss_step=0.00581, global_step=2437.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   7%|▋         | 87/1208 [02:42<34:55,  1.87s/it, loss=0.183, v_num=0, train/loss_simple_step=0.605, train/loss_vlb_step=0.0131, train/loss_step=0.605, global_step=2437.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]     Epoch 8:   7%|▋         | 88/1208 [02:45<35:11,  1.89s/it, loss=0.183, v_num=0, train/loss_simple_step=0.605, train/loss_vlb_step=0.0131, train/loss_step=0.605, global_step=2437.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   7%|▋         | 88/1208 [02:45<35:11,  1.89s/it, loss=0.191, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000578, train/loss_step=0.168, global_step=2437.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   7%|▋         | 89/1208 [02:46<34:58,  1.88s/it, loss=0.191, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000578, train/loss_step=0.168, global_step=2437.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   7%|▋         | 89/1208 [02:46<34:58,  1.88s/it, loss=0.197, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000441, train/loss_step=0.134, global_step=2438.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   7%|▋         | 90/1208 [02:47<34:46,  1.87s/it, loss=0.197, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000441, train/loss_step=0.134, global_step=2438.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   7%|▋         | 90/1208 [02:47<34:46,  1.87s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=7.04e-5, train/loss_step=0.0161, global_step=2438.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   8%|▊         | 91/1208 [02:48<34:34,  1.86s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=7.04e-5, train/loss_step=0.0161, global_step=2438.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   8%|▊         | 91/1208 [02:48<34:34,  1.86s/it, loss=0.174, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00126, train/loss_step=0.290, global_step=2438.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:   8%|▊         | 92/1208 [02:52<34:50,  1.87s/it, loss=0.174, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00126, train/loss_step=0.290, global_step=2438.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   8%|▊         | 92/1208 [02:52<34:50,  1.87s/it, loss=0.178, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000555, train/loss_step=0.159, global_step=2438.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   8%|▊         | 93/1208 [02:53<34:38,  1.86s/it, loss=0.178, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000555, train/loss_step=0.159, global_step=2438.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   8%|▊         | 93/1208 [02:53<34:38,  1.86s/it, loss=0.182, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000435, train/loss_step=0.131, global_step=2439.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   8%|▊         | 94/1208 [02:54<34:27,  1.86s/it, loss=0.182, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000435, train/loss_step=0.131, global_step=2439.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   8%|▊         | 94/1208 [02:54<34:27,  1.86s/it, loss=0.198, v_num=0, train/loss_simple_step=0.537, train/loss_vlb_step=0.00834, train/loss_step=0.537, global_step=2439.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:   8%|▊         | 95/1208 [02:55<34:15,  1.85s/it, loss=0.198, v_num=0, train/loss_simple_step=0.537, train/loss_vlb_step=0.00834, train/loss_step=0.537, global_step=2439.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   8%|▊         | 95/1208 [02:55<34:15,  1.85s/it, loss=0.223, v_num=0, train/loss_simple_step=0.678, train/loss_vlb_step=0.0147, train/loss_step=0.678, global_step=2439.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:   8%|▊         | 96/1208 [02:58<34:31,  1.86s/it, loss=0.223, v_num=0, train/loss_simple_step=0.678, train/loss_vlb_step=0.0147, train/loss_step=0.678, global_step=2439.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   8%|▊         | 96/1208 [02:58<34:31,  1.86s/it, loss=0.218, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=9.15e-6, train/loss_step=0.00151, global_step=2439.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   8%|▊         | 97/1208 [02:59<34:20,  1.85s/it, loss=0.218, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=9.15e-6, train/loss_step=0.00151, global_step=2439.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   8%|▊         | 97/1208 [02:59<34:20,  1.85s/it, loss=0.257, v_num=0, train/loss_simple_step=0.933, train/loss_vlb_step=0.470, train/loss_step=0.933, global_step=2440.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]      Epoch 8:   8%|▊         | 98/1208 [03:00<34:09,  1.85s/it, loss=0.257, v_num=0, train/loss_simple_step=0.933, train/loss_vlb_step=0.470, train/loss_step=0.933, global_step=2440.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   8%|▊         | 98/1208 [03:00<34:09,  1.85s/it, loss=0.256, v_num=0, train/loss_simple_step=0.00441, train/loss_vlb_step=2.27e-5, train/loss_step=0.00441, global_step=2440.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   8%|▊         | 99/1208 [03:01<33:58,  1.84s/it, loss=0.256, v_num=0, train/loss_simple_step=0.00441, train/loss_vlb_step=2.27e-5, train/loss_step=0.00441, global_step=2440.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   8%|▊         | 99/1208 [03:01<33:58,  1.84s/it, loss=0.259, v_num=0, train/loss_simple_step=0.069, train/loss_vlb_step=0.000231, train/loss_step=0.069, global_step=2440.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:   8%|▊         | 100/1208 [03:05<34:12,  1.85s/it, loss=0.259, v_num=0, train/loss_simple_step=0.069, train/loss_vlb_step=0.000231, train/loss_step=0.069, global_step=2440.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   8%|▊         | 100/1208 [03:05<34:12,  1.85s/it, loss=0.248, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000459, train/loss_step=0.136, global_step=2440.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   8%|▊         | 101/1208 [03:06<34:02,  1.84s/it, loss=0.248, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000459, train/loss_step=0.136, global_step=2440.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   8%|▊         | 101/1208 [03:06<34:02,  1.84s/it, loss=0.212, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.65e-5, train/loss_step=0.0175, global_step=2441.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   8%|▊         | 102/1208 [03:07<33:51,  1.84s/it, loss=0.212, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.65e-5, train/loss_step=0.0175, global_step=2441.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   8%|▊         | 102/1208 [03:07<33:51,  1.84s/it, loss=0.222, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000838, train/loss_step=0.224, global_step=2441.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:   9%|▊         | 103/1208 [03:08<33:41,  1.83s/it, loss=0.222, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000838, train/loss_step=0.224, global_step=2441.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   9%|▊         | 103/1208 [03:08<33:41,  1.83s/it, loss=0.226, v_num=0, train/loss_simple_step=0.0946, train/loss_vlb_step=0.000312, train/loss_step=0.0946, global_step=2441.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   9%|▊         | 104/1208 [03:11<33:54,  1.84s/it, loss=0.226, v_num=0, train/loss_simple_step=0.0946, train/loss_vlb_step=0.000312, train/loss_step=0.0946, global_step=2441.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   9%|▊         | 104/1208 [03:11<33:54,  1.84s/it, loss=0.211, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=1.71e-5, train/loss_step=0.00295, global_step=2441.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   9%|▊         | 105/1208 [03:12<33:44,  1.84s/it, loss=0.211, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=1.71e-5, train/loss_step=0.00295, global_step=2441.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   9%|▊         | 105/1208 [03:12<33:44,  1.84s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6e-5, train/loss_step=0.0135, global_step=2442.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]     Epoch 8:   9%|▉         | 106/1208 [03:13<33:34,  1.83s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6e-5, train/loss_step=0.0135, global_step=2442.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   9%|▉         | 106/1208 [03:13<33:34,  1.83s/it, loss=0.22, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000663, train/loss_step=0.189, global_step=2442.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   9%|▉         | 107/1208 [03:14<33:24,  1.82s/it, loss=0.22, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000663, train/loss_step=0.189, global_step=2442.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   9%|▉         | 107/1208 [03:14<33:24,  1.82s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0682, train/loss_vlb_step=0.000236, train/loss_step=0.0682, global_step=2442.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   9%|▉         | 108/1208 [03:18<33:36,  1.83s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0682, train/loss_vlb_step=0.000236, train/loss_step=0.0682, global_step=2442.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   9%|▉         | 108/1208 [03:18<33:37,  1.83s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.13e-5, train/loss_step=0.0196, global_step=2442.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:   9%|▉         | 109/1208 [03:19<33:27,  1.83s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.13e-5, train/loss_step=0.0196, global_step=2442.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   9%|▉         | 109/1208 [03:19<33:27,  1.83s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000148, train/loss_step=0.0407, global_step=2443.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   9%|▉         | 110/1208 [03:20<33:17,  1.82s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000148, train/loss_step=0.0407, global_step=2443.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   9%|▉         | 110/1208 [03:20<33:17,  1.82s/it, loss=0.198, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00233, train/loss_step=0.359, global_step=2443.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:   9%|▉         | 111/1208 [03:21<33:08,  1.81s/it, loss=0.198, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00233, train/loss_step=0.359, global_step=2443.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   9%|▉         | 111/1208 [03:21<33:08,  1.81s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00527, train/loss_vlb_step=2.66e-5, train/loss_step=0.00527, global_step=2443.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   9%|▉         | 112/1208 [03:24<33:20,  1.82s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00527, train/loss_vlb_step=2.66e-5, train/loss_step=0.00527, global_step=2443.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   9%|▉         | 112/1208 [03:24<33:20,  1.82s/it, loss=0.185, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000652, train/loss_step=0.184, global_step=2443.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:   9%|▉         | 113/1208 [03:25<33:10,  1.82s/it, loss=0.185, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000652, train/loss_step=0.184, global_step=2443.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   9%|▉         | 113/1208 [03:25<33:10,  1.82s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.94e-5, train/loss_step=0.0106, global_step=2444.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   9%|▉         | 114/1208 [03:26<33:01,  1.81s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.94e-5, train/loss_step=0.0106, global_step=2444.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:   9%|▉         | 114/1208 [03:26<33:01,  1.81s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00842, train/loss_vlb_step=4.01e-5, train/loss_step=0.00842, global_step=2444.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  10%|▉         | 115/1208 [03:27<32:52,  1.80s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00842, train/loss_vlb_step=4.01e-5, train/loss_step=0.00842, global_step=2444.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  10%|▉         | 115/1208 [03:27<32:52,  1.80s/it, loss=0.132, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00128, train/loss_step=0.266, global_step=2444.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  10%|▉         | 116/1208 [03:30<33:03,  1.82s/it, loss=0.132, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00128, train/loss_step=0.266, global_step=2444.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  10%|▉         | 116/1208 [03:30<33:03,  1.82s/it, loss=0.139, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000453, train/loss_step=0.137, global_step=2444.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  10%|▉         | 117/1208 [03:31<32:55,  1.81s/it, loss=0.139, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000453, train/loss_step=0.137, global_step=2444.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  10%|▉         | 117/1208 [03:31<32:55,  1.81s/it, loss=0.12, v_num=0, train/loss_simple_step=0.555, train/loss_vlb_step=0.0112, train/loss_step=0.555, global_step=2445.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  10%|▉         | 118/1208 [03:32<32:46,  1.80s/it, loss=0.12, v_num=0, train/loss_simple_step=0.555, train/loss_vlb_step=0.0112, train/loss_step=0.555, global_step=2445.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  10%|▉         | 118/1208 [03:32<32:46,  1.80s/it, loss=0.128, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000516, train/loss_step=0.156, global_step=2445.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  10%|▉         | 119/1208 [03:33<32:37,  1.80s/it, loss=0.128, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000516, train/loss_step=0.156, global_step=2445.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  10%|▉         | 119/1208 [03:33<32:37,  1.80s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00455, train/loss_vlb_step=2.37e-5, train/loss_step=0.00455, global_step=2445.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  10%|▉         | 120/1208 [03:37<32:48,  1.81s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00455, train/loss_vlb_step=2.37e-5, train/loss_step=0.00455, global_step=2445.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  10%|▉         | 120/1208 [03:37<32:48,  1.81s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.5e-5, train/loss_step=0.0123, global_step=2445.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  10%|█         | 121/1208 [03:38<32:40,  1.80s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.5e-5, train/loss_step=0.0123, global_step=2445.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  10%|█         | 121/1208 [03:38<32:40,  1.80s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00716, train/loss_vlb_step=3.73e-5, train/loss_step=0.00716, global_step=2446.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  10%|█         | 122/1208 [03:39<32:31,  1.80s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00716, train/loss_vlb_step=3.73e-5, train/loss_step=0.00716, global_step=2446.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  10%|█         | 122/1208 [03:39<32:31,  1.80s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00908, train/loss_vlb_step=4.18e-5, train/loss_step=0.00908, global_step=2446.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  10%|█         | 123/1208 [03:40<32:23,  1.79s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00908, train/loss_vlb_step=4.18e-5, train/loss_step=0.00908, global_step=2446.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  10%|█         | 123/1208 [03:40<32:23,  1.79s/it, loss=0.115, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00102, train/loss_step=0.255, global_step=2446.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  10%|█         | 124/1208 [03:43<32:33,  1.80s/it, loss=0.115, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00102, train/loss_step=0.255, global_step=2446.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  10%|█         | 124/1208 [03:43<32:34,  1.80s/it, loss=0.13, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00151, train/loss_step=0.307, global_step=2446.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  10%|█         | 125/1208 [03:44<32:25,  1.80s/it, loss=0.13, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00151, train/loss_step=0.307, global_step=2446.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  10%|█         | 125/1208 [03:44<32:25,  1.80s/it, loss=0.153, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.00366, train/loss_step=0.460, global_step=2447.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  10%|█         | 126/1208 [03:45<32:17,  1.79s/it, loss=0.153, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.00366, train/loss_step=0.460, global_step=2447.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  10%|█         | 126/1208 [03:45<32:17,  1.79s/it, loss=0.173, v_num=0, train/loss_simple_step=0.590, train/loss_vlb_step=0.0111, train/loss_step=0.590, global_step=2447.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  11%|█         | 127/1208 [03:46<32:08,  1.78s/it, loss=0.173, v_num=0, train/loss_simple_step=0.590, train/loss_vlb_step=0.0111, train/loss_step=0.590, global_step=2447.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  11%|█         | 127/1208 [03:46<32:09,  1.78s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000199, train/loss_step=0.0555, global_step=2447.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  11%|█         | 128/1208 [03:49<32:19,  1.80s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000199, train/loss_step=0.0555, global_step=2447.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  11%|█         | 128/1208 [03:49<32:19,  1.80s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=1.11e-5, train/loss_step=0.0019, global_step=2447.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  11%|█         | 129/1208 [03:50<32:11,  1.79s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=1.11e-5, train/loss_step=0.0019, global_step=2447.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  11%|█         | 129/1208 [03:50<32:12,  1.79s/it, loss=0.179, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000708, train/loss_step=0.196, global_step=2448.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  11%|█         | 130/1208 [03:52<32:03,  1.78s/it, loss=0.179, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000708, train/loss_step=0.196, global_step=2448.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  11%|█         | 130/1208 [03:52<32:03,  1.78s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.89e-5, train/loss_step=0.0101, global_step=2448.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  11%|█         | 131/1208 [03:53<31:55,  1.78s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.89e-5, train/loss_step=0.0101, global_step=2448.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  11%|█         | 131/1208 [03:53<31:55,  1.78s/it, loss=0.166, v_num=0, train/loss_simple_step=0.091, train/loss_vlb_step=0.000302, train/loss_step=0.091, global_step=2448.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  11%|█         | 132/1208 [03:56<32:05,  1.79s/it, loss=0.166, v_num=0, train/loss_simple_step=0.091, train/loss_vlb_step=0.000302, train/loss_step=0.091, global_step=2448.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  11%|█         | 132/1208 [03:56<32:05,  1.79s/it, loss=0.177, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00205, train/loss_step=0.412, global_step=2448.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  11%|█         | 133/1208 [03:57<31:58,  1.78s/it, loss=0.177, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00205, train/loss_step=0.412, global_step=2448.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  11%|█         | 133/1208 [03:57<31:58,  1.78s/it, loss=0.191, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00136, train/loss_step=0.297, global_step=2449.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  11%|█         | 134/1208 [03:58<31:50,  1.78s/it, loss=0.191, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00136, train/loss_step=0.297, global_step=2449.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  11%|█         | 134/1208 [03:58<31:50,  1.78s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0729, train/loss_vlb_step=0.000247, train/loss_step=0.0729, global_step=2449.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  11%|█         | 135/1208 [03:59<31:42,  1.77s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0729, train/loss_vlb_step=0.000247, train/loss_step=0.0729, global_step=2449.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  11%|█         | 135/1208 [03:59<31:42,  1.77s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.32e-5, train/loss_step=0.0143, global_step=2449.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  11%|█▏        | 136/1208 [04:02<31:52,  1.78s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.32e-5, train/loss_step=0.0143, global_step=2449.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  11%|█▏        | 136/1208 [04:02<31:52,  1.78s/it, loss=0.189, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00147, train/loss_step=0.281, global_step=2449.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  11%|█▏        | 137/1208 [04:03<31:45,  1.78s/it, loss=0.189, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00147, train/loss_step=0.281, global_step=2449.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  11%|█▏        | 137/1208 [04:03<31:45,  1.78s/it, loss=0.177, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00208, train/loss_step=0.313, global_step=2450.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  11%|█▏        | 138/1208 [04:04<31:38,  1.77s/it, loss=0.177, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00208, train/loss_step=0.313, global_step=2450.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  11%|█▏        | 138/1208 [04:04<31:38,  1.77s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00425, train/loss_vlb_step=2.3e-5, train/loss_step=0.00425, global_step=2450.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  12%|█▏        | 139/1208 [04:05<31:30,  1.77s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00425, train/loss_vlb_step=2.3e-5, train/loss_step=0.00425, global_step=2450.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  12%|█▏        | 139/1208 [04:05<31:30,  1.77s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000297, train/loss_step=0.0901, global_step=2450.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  12%|█▏        | 140/1208 [04:09<31:40,  1.78s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000297, train/loss_step=0.0901, global_step=2450.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  12%|█▏        | 140/1208 [04:09<31:40,  1.78s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00301, train/loss_vlb_step=1.71e-5, train/loss_step=0.00301, global_step=2450.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  12%|█▏        | 141/1208 [04:10<31:32,  1.77s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00301, train/loss_vlb_step=1.71e-5, train/loss_step=0.00301, global_step=2450.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  12%|█▏        | 141/1208 [04:10<31:33,  1.77s/it, loss=0.185, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00117, train/loss_step=0.239, global_step=2451.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  12%|█▏        | 142/1208 [04:11<31:25,  1.77s/it, loss=0.185, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00117, train/loss_step=0.239, global_step=2451.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  12%|█▏        | 142/1208 [04:11<31:25,  1.77s/it, loss=0.189, v_num=0, train/loss_simple_step=0.079, train/loss_vlb_step=0.000269, train/loss_step=0.079, global_step=2451.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  12%|█▏        | 143/1208 [04:12<31:18,  1.76s/it, loss=0.189, v_num=0, train/loss_simple_step=0.079, train/loss_vlb_step=0.000269, train/loss_step=0.079, global_step=2451.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  12%|█▏        | 143/1208 [04:12<31:18,  1.76s/it, loss=0.187, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000755, train/loss_step=0.216, global_step=2451.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  12%|█▏        | 144/1208 [04:15<31:27,  1.77s/it, loss=0.187, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000755, train/loss_step=0.216, global_step=2451.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  12%|█▏        | 144/1208 [04:15<31:27,  1.77s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00455, train/loss_vlb_step=2.42e-5, train/loss_step=0.00455, global_step=2451.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  12%|█▏        | 145/1208 [04:16<31:20,  1.77s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00455, train/loss_vlb_step=2.42e-5, train/loss_step=0.00455, global_step=2451.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  12%|█▏        | 145/1208 [04:16<31:20,  1.77s/it, loss=0.155, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000416, train/loss_step=0.125, global_step=2452.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  12%|█▏        | 146/1208 [04:17<31:13,  1.76s/it, loss=0.155, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000416, train/loss_step=0.125, global_step=2452.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  12%|█▏        | 146/1208 [04:17<31:13,  1.76s/it, loss=0.143, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00171, train/loss_step=0.345, global_step=2452.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  12%|█▏        | 147/1208 [04:18<31:06,  1.76s/it, loss=0.143, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00171, train/loss_step=0.345, global_step=2452.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  12%|█▏        | 147/1208 [04:18<31:06,  1.76s/it, loss=0.163, v_num=0, train/loss_simple_step=0.467, train/loss_vlb_step=0.00516, train/loss_step=0.467, global_step=2452.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  12%|█▏        | 148/1208 [04:21<31:15,  1.77s/it, loss=0.163, v_num=0, train/loss_simple_step=0.467, train/loss_vlb_step=0.00516, train/loss_step=0.467, global_step=2452.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  12%|█▏        | 148/1208 [04:21<31:15,  1.77s/it, loss=0.175, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00102, train/loss_step=0.245, global_step=2452.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  12%|█▏        | 149/1208 [04:22<31:08,  1.76s/it, loss=0.175, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00102, train/loss_step=0.245, global_step=2452.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  12%|█▏        | 149/1208 [04:22<31:08,  1.76s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.85e-5, train/loss_step=0.0102, global_step=2453.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  12%|█▏        | 150/1208 [04:23<31:01,  1.76s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.85e-5, train/loss_step=0.0102, global_step=2453.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  12%|█▏        | 150/1208 [04:23<31:01,  1.76s/it, loss=0.187, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00239, train/loss_step=0.428, global_step=2453.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  12%|█▎        | 151/1208 [04:24<30:54,  1.75s/it, loss=0.187, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00239, train/loss_step=0.428, global_step=2453.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  12%|█▎        | 151/1208 [04:24<30:54,  1.75s/it, loss=0.194, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.00103, train/loss_step=0.230, global_step=2453.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  13%|█▎        | 152/1208 [04:28<31:03,  1.76s/it, loss=0.194, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.00103, train/loss_step=0.230, global_step=2453.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  13%|█▎        | 152/1208 [04:28<31:03,  1.76s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0867, train/loss_vlb_step=0.000287, train/loss_step=0.0867, global_step=2453.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  13%|█▎        | 153/1208 [04:29<30:56,  1.76s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0867, train/loss_vlb_step=0.000287, train/loss_step=0.0867, global_step=2453.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  13%|█▎        | 153/1208 [04:29<30:56,  1.76s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00764, train/loss_vlb_step=3.71e-5, train/loss_step=0.00764, global_step=2454.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  13%|█▎        | 154/1208 [04:30<30:50,  1.76s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00764, train/loss_vlb_step=3.71e-5, train/loss_step=0.00764, global_step=2454.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  13%|█▎        | 154/1208 [04:30<30:50,  1.76s/it, loss=0.17, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000734, train/loss_step=0.210, global_step=2454.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  13%|█▎        | 155/1208 [04:31<30:43,  1.75s/it, loss=0.17, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000734, train/loss_step=0.210, global_step=2454.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  13%|█▎        | 155/1208 [04:31<30:43,  1.75s/it, loss=0.182, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00117, train/loss_step=0.258, global_step=2454.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  13%|█▎        | 156/1208 [04:34<30:52,  1.76s/it, loss=0.182, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00117, train/loss_step=0.258, global_step=2454.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  13%|█▎        | 156/1208 [04:34<30:52,  1.76s/it, loss=0.188, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.0031, train/loss_step=0.394, global_step=2454.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  13%|█▎        | 157/1208 [04:35<30:46,  1.76s/it, loss=0.188, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.0031, train/loss_step=0.394, global_step=2454.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  13%|█▎        | 157/1208 [04:35<30:46,  1.76s/it, loss=0.179, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000463, train/loss_step=0.138, global_step=2455.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  13%|█▎        | 158/1208 [04:36<30:39,  1.75s/it, loss=0.179, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000463, train/loss_step=0.138, global_step=2455.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  13%|█▎        | 158/1208 [04:36<30:39,  1.75s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.4e-5, train/loss_step=0.0147, global_step=2455.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  13%|█▎        | 159/1208 [04:37<30:33,  1.75s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.4e-5, train/loss_step=0.0147, global_step=2455.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  13%|█▎        | 159/1208 [04:37<30:33,  1.75s/it, loss=0.189, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00125, train/loss_step=0.274, global_step=2455.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  13%|█▎        | 160/1208 [04:41<30:41,  1.76s/it, loss=0.189, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00125, train/loss_step=0.274, global_step=2455.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  13%|█▎        | 160/1208 [04:41<30:41,  1.76s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00391, train/loss_vlb_step=2.11e-5, train/loss_step=0.00391, global_step=2455.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  13%|█▎        | 161/1208 [04:42<30:35,  1.75s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00391, train/loss_vlb_step=2.11e-5, train/loss_step=0.00391, global_step=2455.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  13%|█▎        | 161/1208 [04:42<30:35,  1.75s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.68e-5, train/loss_step=0.0126, global_step=2456.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  13%|█▎        | 162/1208 [04:43<30:28,  1.75s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.68e-5, train/loss_step=0.0126, global_step=2456.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  13%|█▎        | 162/1208 [04:43<30:28,  1.75s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000206, train/loss_step=0.0588, global_step=2456.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  13%|█▎        | 163/1208 [04:44<30:22,  1.74s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000206, train/loss_step=0.0588, global_step=2456.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  13%|█▎        | 163/1208 [04:44<30:22,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0879, train/loss_vlb_step=0.000295, train/loss_step=0.0879, global_step=2456.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  14%|█▎        | 164/1208 [04:47<30:30,  1.75s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0879, train/loss_vlb_step=0.000295, train/loss_step=0.0879, global_step=2456.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  14%|█▎        | 164/1208 [04:47<30:30,  1.75s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=2.11e-5, train/loss_step=0.00388, global_step=2456.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  14%|█▎        | 165/1208 [04:48<30:24,  1.75s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=2.11e-5, train/loss_step=0.00388, global_step=2456.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  14%|█▎        | 165/1208 [04:48<30:24,  1.75s/it, loss=0.176, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00101, train/loss_step=0.243, global_step=2457.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  14%|█▎        | 166/1208 [04:49<30:17,  1.74s/it, loss=0.176, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00101, train/loss_step=0.243, global_step=2457.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  14%|█▎        | 166/1208 [04:49<30:17,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00163, train/loss_vlb_step=9.91e-6, train/loss_step=0.00163, global_step=2457.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  14%|█▍        | 167/1208 [04:50<30:11,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00163, train/loss_vlb_step=9.91e-6, train/loss_step=0.00163, global_step=2457.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  14%|█▍        | 167/1208 [04:50<30:11,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.42e-5, train/loss_step=0.0203, global_step=2457.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  14%|█▍        | 168/1208 [04:53<30:19,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.42e-5, train/loss_step=0.0203, global_step=2457.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  14%|█▍        | 168/1208 [04:53<30:19,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000422, train/loss_step=0.127, global_step=2457.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  14%|█▍        | 169/1208 [04:54<30:13,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000422, train/loss_step=0.127, global_step=2457.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  14%|█▍        | 169/1208 [04:54<30:13,  1.75s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0918, train/loss_vlb_step=0.000304, train/loss_step=0.0918, global_step=2458.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  14%|█▍        | 170/1208 [04:56<30:07,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0918, train/loss_vlb_step=0.000304, train/loss_step=0.0918, global_step=2458.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  14%|█▍        | 170/1208 [04:56<30:07,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000675, train/loss_step=0.193, global_step=2458.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  14%|█▍        | 171/1208 [04:57<30:01,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000675, train/loss_step=0.193, global_step=2458.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  14%|█▍        | 171/1208 [04:57<30:01,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.07e-5, train/loss_step=0.020, global_step=2458.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  14%|█▍        | 172/1208 [05:00<30:08,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.07e-5, train/loss_step=0.020, global_step=2458.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  14%|█▍        | 172/1208 [05:00<30:08,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.0019, train/loss_step=0.307, global_step=2458.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  14%|█▍        | 173/1208 [05:01<30:03,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.0019, train/loss_step=0.307, global_step=2458.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  14%|█▍        | 173/1208 [05:01<30:03,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000554, train/loss_step=0.166, global_step=2459.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  14%|█▍        | 174/1208 [05:02<29:57,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000554, train/loss_step=0.166, global_step=2459.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  14%|█▍        | 174/1208 [05:02<29:57,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=1.12e-5, train/loss_step=0.00185, global_step=2459.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  14%|█▍        | 175/1208 [05:03<29:51,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=1.12e-5, train/loss_step=0.00185, global_step=2459.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  14%|█▍        | 175/1208 [05:03<29:51,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.19e-5, train/loss_step=0.00197, global_step=2459.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  15%|█▍        | 176/1208 [05:06<29:58,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.19e-5, train/loss_step=0.00197, global_step=2459.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  15%|█▍        | 176/1208 [05:06<29:58,  1.74s/it, loss=0.0893, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.27e-5, train/loss_step=0.0198, global_step=2459.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  15%|█▍        | 177/1208 [05:07<29:52,  1.74s/it, loss=0.0893, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.27e-5, train/loss_step=0.0198, global_step=2459.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  15%|█▍        | 177/1208 [05:07<29:52,  1.74s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00177, train/loss_step=0.318, global_step=2460.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  15%|█▍        | 178/1208 [05:08<29:47,  1.73s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00177, train/loss_step=0.318, global_step=2460.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  15%|█▍        | 178/1208 [05:08<29:47,  1.73s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=0.000105, train/loss_step=0.0257, global_step=2460.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  15%|█▍        | 179/1208 [05:09<29:41,  1.73s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=0.000105, train/loss_step=0.0257, global_step=2460.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  15%|█▍        | 179/1208 [05:09<29:41,  1.73s/it, loss=0.0886, v_num=0, train/loss_simple_step=0.0681, train/loss_vlb_step=0.00023, train/loss_step=0.0681, global_step=2460.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  15%|█▍        | 180/1208 [05:13<29:48,  1.74s/it, loss=0.0886, v_num=0, train/loss_simple_step=0.0681, train/loss_vlb_step=0.00023, train/loss_step=0.0681, global_step=2460.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  15%|█▍        | 180/1208 [05:13<29:48,  1.74s/it, loss=0.0911, v_num=0, train/loss_simple_step=0.0549, train/loss_vlb_step=0.000192, train/loss_step=0.0549, global_step=2460.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  15%|█▍        | 181/1208 [05:14<29:42,  1.74s/it, loss=0.0911, v_num=0, train/loss_simple_step=0.0549, train/loss_vlb_step=0.000192, train/loss_step=0.0549, global_step=2460.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  15%|█▍        | 181/1208 [05:14<29:42,  1.74s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.0563, train/loss_vlb_step=0.000199, train/loss_step=0.0563, global_step=2461.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  15%|█▌        | 182/1208 [05:15<29:36,  1.73s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.0563, train/loss_vlb_step=0.000199, train/loss_step=0.0563, global_step=2461.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  15%|█▌        | 182/1208 [05:15<29:36,  1.73s/it, loss=0.102, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000901, train/loss_step=0.232, global_step=2461.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  15%|█▌        | 183/1208 [05:16<29:31,  1.73s/it, loss=0.102, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000901, train/loss_step=0.232, global_step=2461.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  15%|█▌        | 183/1208 [05:16<29:31,  1.73s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0837, train/loss_vlb_step=0.000284, train/loss_step=0.0837, global_step=2461.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  15%|█▌        | 184/1208 [05:19<29:38,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0837, train/loss_vlb_step=0.000284, train/loss_step=0.0837, global_step=2461.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  15%|█▌        | 184/1208 [05:19<29:38,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.00214, train/loss_step=0.360, global_step=2461.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  15%|█▌        | 185/1208 [05:20<29:32,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.00214, train/loss_step=0.360, global_step=2461.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  15%|█▌        | 185/1208 [05:20<29:32,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00948, train/loss_vlb_step=4.43e-5, train/loss_step=0.00948, global_step=2462.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  15%|█▌        | 186/1208 [05:21<29:27,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00948, train/loss_vlb_step=4.43e-5, train/loss_step=0.00948, global_step=2462.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  15%|█▌        | 186/1208 [05:21<29:27,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00213, train/loss_step=0.335, global_step=2462.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  15%|█▌        | 187/1208 [05:22<29:21,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00213, train/loss_step=0.335, global_step=2462.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  15%|█▌        | 187/1208 [05:22<29:21,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000121, train/loss_step=0.0309, global_step=2462.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  16%|█▌        | 188/1208 [05:25<29:28,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000121, train/loss_step=0.0309, global_step=2462.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  16%|█▌        | 188/1208 [05:25<29:28,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0517, train/loss_vlb_step=0.000185, train/loss_step=0.0517, global_step=2462.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  16%|█▌        | 189/1208 [05:26<29:22,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0517, train/loss_vlb_step=0.000185, train/loss_step=0.0517, global_step=2462.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  16%|█▌        | 189/1208 [05:26<29:22,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00493, train/loss_vlb_step=2.59e-5, train/loss_step=0.00493, global_step=2463.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  16%|█▌        | 190/1208 [05:28<29:17,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00493, train/loss_vlb_step=2.59e-5, train/loss_step=0.00493, global_step=2463.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  16%|█▌        | 190/1208 [05:28<29:17,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00227, train/loss_step=0.377, global_step=2463.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  16%|█▌        | 191/1208 [05:29<29:12,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00227, train/loss_step=0.377, global_step=2463.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  16%|█▌        | 191/1208 [05:29<29:12,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.58e-5, train/loss_step=0.0149, global_step=2463.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  16%|█▌        | 192/1208 [05:32<29:18,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.58e-5, train/loss_step=0.0149, global_step=2463.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  16%|█▌        | 192/1208 [05:32<29:18,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.74e-5, train/loss_step=0.0188, global_step=2463.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  16%|█▌        | 193/1208 [05:33<29:13,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.74e-5, train/loss_step=0.0188, global_step=2463.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  16%|█▌        | 193/1208 [05:33<29:13,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.00065, train/loss_step=0.188, global_step=2464.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  16%|█▌        | 194/1208 [05:34<29:08,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.00065, train/loss_step=0.188, global_step=2464.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  16%|█▌        | 194/1208 [05:34<29:08,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.0011, train/loss_step=0.277, global_step=2464.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  16%|█▌        | 195/1208 [05:35<29:02,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.0011, train/loss_step=0.277, global_step=2464.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  16%|█▌        | 195/1208 [05:35<29:02,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00192, train/loss_step=0.306, global_step=2464.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  16%|█▌        | 196/1208 [05:38<29:08,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00192, train/loss_step=0.306, global_step=2464.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  16%|█▌        | 196/1208 [05:38<29:08,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000464, train/loss_step=0.139, global_step=2464.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  16%|█▋        | 197/1208 [05:39<29:03,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000464, train/loss_step=0.139, global_step=2464.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  16%|█▋        | 197/1208 [05:39<29:03,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.46e-5, train/loss_step=0.00247, global_step=2465.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  16%|█▋        | 198/1208 [05:40<28:58,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.46e-5, train/loss_step=0.00247, global_step=2465.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  16%|█▋        | 198/1208 [05:40<28:58,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0646, train/loss_vlb_step=0.000226, train/loss_step=0.0646, global_step=2465.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  16%|█▋        | 199/1208 [05:41<28:53,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0646, train/loss_vlb_step=0.000226, train/loss_step=0.0646, global_step=2465.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  16%|█▋        | 199/1208 [05:41<28:53,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.517, train/loss_vlb_step=0.00515, train/loss_step=0.517, global_step=2465.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  17%|█▋        | 200/1208 [05:45<28:59,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.517, train/loss_vlb_step=0.00515, train/loss_step=0.517, global_step=2465.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  17%|█▋        | 200/1208 [05:45<28:59,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000466, train/loss_step=0.141, global_step=2465.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  17%|█▋        | 201/1208 [05:46<28:54,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000466, train/loss_step=0.141, global_step=2465.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  17%|█▋        | 201/1208 [05:46<28:54,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000104, train/loss_step=0.0273, global_step=2466.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  17%|█▋        | 202/1208 [05:47<28:49,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000104, train/loss_step=0.0273, global_step=2466.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  17%|█▋        | 202/1208 [05:47<28:49,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000616, train/loss_step=0.172, global_step=2466.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  17%|█▋        | 203/1208 [05:48<28:43,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000616, train/loss_step=0.172, global_step=2466.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  17%|█▋        | 203/1208 [05:48<28:43,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000702, train/loss_step=0.198, global_step=2466.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  17%|█▋        | 204/1208 [05:51<28:49,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000702, train/loss_step=0.198, global_step=2466.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  17%|█▋        | 204/1208 [05:51<28:49,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000743, train/loss_step=0.198, global_step=2466.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  17%|█▋        | 205/1208 [05:52<28:44,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000743, train/loss_step=0.198, global_step=2466.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  17%|█▋        | 205/1208 [05:52<28:44,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9.55e-5, train/loss_step=0.0224, global_step=2467.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  17%|█▋        | 206/1208 [05:53<28:39,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9.55e-5, train/loss_step=0.0224, global_step=2467.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  17%|█▋        | 206/1208 [05:53<28:39,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.32e-5, train/loss_step=0.00218, global_step=2467.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  17%|█▋        | 207/1208 [05:54<28:34,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.32e-5, train/loss_step=0.00218, global_step=2467.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  17%|█▋        | 207/1208 [05:54<28:34,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.67e-5, train/loss_step=0.0122, global_step=2467.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  17%|█▋        | 208/1208 [05:57<28:40,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.67e-5, train/loss_step=0.0122, global_step=2467.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  17%|█▋        | 208/1208 [05:57<28:40,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00581, train/loss_vlb_step=3.03e-5, train/loss_step=0.00581, global_step=2467.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  17%|█▋        | 209/1208 [05:58<28:35,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00581, train/loss_vlb_step=3.03e-5, train/loss_step=0.00581, global_step=2467.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  17%|█▋        | 209/1208 [05:58<28:35,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000192, train/loss_step=0.0555, global_step=2468.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  17%|█▋        | 210/1208 [05:59<28:30,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000192, train/loss_step=0.0555, global_step=2468.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  17%|█▋        | 210/1208 [05:59<28:30,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000519, train/loss_step=0.156, global_step=2468.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  17%|█▋        | 211/1208 [06:00<28:25,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000519, train/loss_step=0.156, global_step=2468.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  17%|█▋        | 211/1208 [06:00<28:25,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=1.21e-5, train/loss_step=0.00201, global_step=2468.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  18%|█▊        | 212/1208 [06:04<28:31,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=1.21e-5, train/loss_step=0.00201, global_step=2468.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  18%|█▊        | 212/1208 [06:04<28:31,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.0011, train/loss_step=0.263, global_step=2468.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]     Epoch 8:  18%|█▊        | 213/1208 [06:05<28:26,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.0011, train/loss_step=0.263, global_step=2468.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  18%|█▊        | 213/1208 [06:05<28:26,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0338, train/loss_vlb_step=0.000132, train/loss_step=0.0338, global_step=2469.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  18%|█▊        | 214/1208 [06:06<28:21,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0338, train/loss_vlb_step=0.000132, train/loss_step=0.0338, global_step=2469.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  18%|█▊        | 214/1208 [06:06<28:21,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.64e-5, train/loss_step=0.0134, global_step=2469.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  18%|█▊        | 215/1208 [06:07<28:16,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.64e-5, train/loss_step=0.0134, global_step=2469.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  18%|█▊        | 215/1208 [06:07<28:16,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=2469.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  18%|█▊        | 216/1208 [06:10<28:22,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=2469.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  18%|█▊        | 216/1208 [06:10<28:22,  1.72s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.0027, train/loss_vlb_step=1.58e-5, train/loss_step=0.0027, global_step=2469.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  18%|█▊        | 217/1208 [06:11<28:17,  1.71s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.0027, train/loss_vlb_step=1.58e-5, train/loss_step=0.0027, global_step=2469.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  18%|█▊        | 217/1208 [06:11<28:17,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.567, train/loss_vlb_step=0.00952, train/loss_step=0.567, global_step=2470.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  18%|█▊        | 218/1208 [06:12<28:12,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.567, train/loss_vlb_step=0.00952, train/loss_step=0.567, global_step=2470.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  18%|█▊        | 218/1208 [06:12<28:12,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000445, train/loss_step=0.135, global_step=2470.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  18%|█▊        | 219/1208 [06:13<28:07,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000445, train/loss_step=0.135, global_step=2470.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  18%|█▊        | 219/1208 [06:13<28:08,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00602, train/loss_vlb_step=3.15e-5, train/loss_step=0.00602, global_step=2470.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  18%|█▊        | 220/1208 [06:16<28:13,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00602, train/loss_vlb_step=3.15e-5, train/loss_step=0.00602, global_step=2470.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  18%|█▊        | 220/1208 [06:16<28:13,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0341, train/loss_vlb_step=0.00013, train/loss_step=0.0341, global_step=2470.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  18%|█▊        | 221/1208 [06:18<28:08,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0341, train/loss_vlb_step=0.00013, train/loss_step=0.0341, global_step=2470.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  18%|█▊        | 221/1208 [06:18<28:08,  1.71s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.00752, train/loss_vlb_step=3.78e-5, train/loss_step=0.00752, global_step=2471.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  18%|█▊        | 222/1208 [06:19<28:03,  1.71s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.00752, train/loss_vlb_step=3.78e-5, train/loss_step=0.00752, global_step=2471.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  18%|█▊        | 222/1208 [06:19<28:03,  1.71s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.00689, train/loss_vlb_step=3.41e-5, train/loss_step=0.00689, global_step=2471.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  18%|█▊        | 223/1208 [06:20<27:58,  1.70s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.00689, train/loss_vlb_step=3.41e-5, train/loss_step=0.00689, global_step=2471.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  18%|█▊        | 223/1208 [06:20<27:58,  1.70s/it, loss=0.087, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=2471.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  19%|█▊        | 224/1208 [06:23<28:04,  1.71s/it, loss=0.087, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=2471.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  19%|█▊        | 224/1208 [06:23<28:04,  1.71s/it, loss=0.08, v_num=0, train/loss_simple_step=0.0568, train/loss_vlb_step=0.000191, train/loss_step=0.0568, global_step=2471.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  19%|█▊        | 225/1208 [06:24<27:59,  1.71s/it, loss=0.08, v_num=0, train/loss_simple_step=0.0568, train/loss_vlb_step=0.000191, train/loss_step=0.0568, global_step=2471.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  19%|█▊        | 225/1208 [06:24<27:59,  1.71s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000409, train/loss_step=0.124, global_step=2472.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  19%|█▊        | 226/1208 [06:25<27:55,  1.71s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000409, train/loss_step=0.124, global_step=2472.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  19%|█▊        | 226/1208 [06:25<27:55,  1.71s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.0944, train/loss_vlb_step=0.000312, train/loss_step=0.0944, global_step=2472.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  19%|█▉        | 227/1208 [06:26<27:50,  1.70s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.0944, train/loss_vlb_step=0.000312, train/loss_step=0.0944, global_step=2472.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  19%|█▉        | 227/1208 [06:26<27:50,  1.70s/it, loss=0.102, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00108, train/loss_step=0.253, global_step=2472.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  19%|█▉        | 228/1208 [06:29<27:55,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00108, train/loss_step=0.253, global_step=2472.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  19%|█▉        | 228/1208 [06:29<27:55,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00855, train/loss_vlb_step=3.97e-5, train/loss_step=0.00855, global_step=2472.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  19%|█▉        | 229/1208 [06:30<27:51,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00855, train/loss_vlb_step=3.97e-5, train/loss_step=0.00855, global_step=2472.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  19%|█▉        | 229/1208 [06:30<27:51,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0962, train/loss_vlb_step=0.000322, train/loss_step=0.0962, global_step=2473.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  19%|█▉        | 230/1208 [06:31<27:46,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0962, train/loss_vlb_step=0.000322, train/loss_step=0.0962, global_step=2473.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  19%|█▉        | 230/1208 [06:31<27:46,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00111, train/loss_step=0.264, global_step=2473.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  19%|█▉        | 231/1208 [06:32<27:42,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00111, train/loss_step=0.264, global_step=2473.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  19%|█▉        | 231/1208 [06:32<27:42,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000439, train/loss_step=0.132, global_step=2473.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  19%|█▉        | 232/1208 [06:36<27:47,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000439, train/loss_step=0.132, global_step=2473.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  19%|█▉        | 232/1208 [06:36<27:47,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.83e-5, train/loss_step=0.0131, global_step=2473.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  19%|█▉        | 233/1208 [06:37<27:42,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.83e-5, train/loss_step=0.0131, global_step=2473.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  19%|█▉        | 233/1208 [06:37<27:42,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00415, train/loss_vlb_step=2.31e-5, train/loss_step=0.00415, global_step=2474.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  19%|█▉        | 234/1208 [06:38<27:38,  1.70s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00415, train/loss_vlb_step=2.31e-5, train/loss_step=0.00415, global_step=2474.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  19%|█▉        | 234/1208 [06:38<27:38,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0331, train/loss_vlb_step=0.000128, train/loss_step=0.0331, global_step=2474.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  19%|█▉        | 235/1208 [06:39<27:33,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0331, train/loss_vlb_step=0.000128, train/loss_step=0.0331, global_step=2474.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  19%|█▉        | 235/1208 [06:39<27:33,  1.70s/it, loss=0.102, v_num=0, train/loss_simple_step=0.094, train/loss_vlb_step=0.000309, train/loss_step=0.094, global_step=2474.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  20%|█▉        | 236/1208 [06:42<27:38,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.094, train/loss_vlb_step=0.000309, train/loss_step=0.094, global_step=2474.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  20%|█▉        | 236/1208 [06:42<27:38,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0968, train/loss_vlb_step=0.000319, train/loss_step=0.0968, global_step=2474.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  20%|█▉        | 237/1208 [06:43<27:34,  1.70s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0968, train/loss_vlb_step=0.000319, train/loss_step=0.0968, global_step=2474.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  20%|█▉        | 237/1208 [06:43<27:34,  1.70s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000944, train/loss_step=0.244, global_step=2475.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  20%|█▉        | 238/1208 [06:44<27:29,  1.70s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000944, train/loss_step=0.244, global_step=2475.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  20%|█▉        | 238/1208 [06:44<27:29,  1.70s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00156, train/loss_step=0.294, global_step=2475.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  20%|█▉        | 239/1208 [06:45<27:25,  1.70s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00156, train/loss_step=0.294, global_step=2475.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  20%|█▉        | 239/1208 [06:45<27:25,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00134, train/loss_step=0.274, global_step=2475.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  20%|█▉        | 240/1208 [06:49<27:30,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00134, train/loss_step=0.274, global_step=2475.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  20%|█▉        | 240/1208 [06:49<27:30,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00509, train/loss_vlb_step=2.61e-5, train/loss_step=0.00509, global_step=2475.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  20%|█▉        | 241/1208 [06:50<27:25,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00509, train/loss_vlb_step=2.61e-5, train/loss_step=0.00509, global_step=2475.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  20%|█▉        | 241/1208 [06:50<27:25,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0819, train/loss_vlb_step=0.000275, train/loss_step=0.0819, global_step=2476.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  20%|██        | 242/1208 [06:51<27:21,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0819, train/loss_vlb_step=0.000275, train/loss_step=0.0819, global_step=2476.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  20%|██        | 242/1208 [06:51<27:21,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0971, train/loss_vlb_step=0.000319, train/loss_step=0.0971, global_step=2476.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  20%|██        | 243/1208 [06:52<27:17,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0971, train/loss_vlb_step=0.000319, train/loss_step=0.0971, global_step=2476.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  20%|██        | 243/1208 [06:52<27:17,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000603, train/loss_step=0.170, global_step=2476.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  20%|██        | 244/1208 [06:55<27:21,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000603, train/loss_step=0.170, global_step=2476.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  20%|██        | 244/1208 [06:55<27:21,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.000129, train/loss_step=0.034, global_step=2476.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  20%|██        | 245/1208 [06:56<27:17,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.000129, train/loss_step=0.034, global_step=2476.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  20%|██        | 245/1208 [06:56<27:17,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000698, train/loss_step=0.188, global_step=2477.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  20%|██        | 246/1208 [06:57<27:13,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000698, train/loss_step=0.188, global_step=2477.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  20%|██        | 246/1208 [06:57<27:13,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.47e-5, train/loss_step=0.0185, global_step=2477.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  20%|██        | 247/1208 [06:58<27:08,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.47e-5, train/loss_step=0.0185, global_step=2477.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  20%|██        | 247/1208 [06:58<27:08,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00179, train/loss_step=0.349, global_step=2477.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  21%|██        | 248/1208 [07:01<27:13,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00179, train/loss_step=0.349, global_step=2477.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  21%|██        | 248/1208 [07:01<27:13,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.22e-5, train/loss_step=0.0137, global_step=2477.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  21%|██        | 249/1208 [07:02<27:09,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.22e-5, train/loss_step=0.0137, global_step=2477.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  21%|██        | 249/1208 [07:02<27:09,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000586, train/loss_step=0.171, global_step=2478.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  21%|██        | 250/1208 [07:03<27:04,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000586, train/loss_step=0.171, global_step=2478.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  21%|██        | 250/1208 [07:03<27:04,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.490, train/loss_vlb_step=0.00872, train/loss_step=0.490, global_step=2478.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  21%|██        | 251/1208 [07:05<27:00,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.490, train/loss_vlb_step=0.00872, train/loss_step=0.490, global_step=2478.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  21%|██        | 251/1208 [07:05<27:00,  1.69s/it, loss=0.148, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00103, train/loss_step=0.292, global_step=2478.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  21%|██        | 252/1208 [07:08<27:04,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00103, train/loss_step=0.292, global_step=2478.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  21%|██        | 252/1208 [07:08<27:04,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00314, train/loss_step=0.418, global_step=2478.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  21%|██        | 253/1208 [07:09<27:00,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00314, train/loss_step=0.418, global_step=2478.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  21%|██        | 253/1208 [07:09<27:00,  1.70s/it, loss=0.19, v_num=0, train/loss_simple_step=0.438, train/loss_vlb_step=0.00425, train/loss_step=0.438, global_step=2479.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  21%|██        | 254/1208 [07:10<26:56,  1.69s/it, loss=0.19, v_num=0, train/loss_simple_step=0.438, train/loss_vlb_step=0.00425, train/loss_step=0.438, global_step=2479.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  21%|██        | 254/1208 [07:10<26:56,  1.69s/it, loss=0.198, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000627, train/loss_step=0.182, global_step=2479.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  21%|██        | 255/1208 [07:11<26:52,  1.69s/it, loss=0.198, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000627, train/loss_step=0.182, global_step=2479.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  21%|██        | 255/1208 [07:11<26:52,  1.69s/it, loss=0.203, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000702, train/loss_step=0.196, global_step=2479.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  21%|██        | 256/1208 [07:14<26:56,  1.70s/it, loss=0.203, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000702, train/loss_step=0.196, global_step=2479.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  21%|██        | 256/1208 [07:14<26:56,  1.70s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.47e-5, train/loss_step=0.0213, global_step=2479.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  21%|██▏       | 257/1208 [07:15<26:52,  1.70s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.47e-5, train/loss_step=0.0213, global_step=2479.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  21%|██▏       | 257/1208 [07:15<26:52,  1.70s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0742, train/loss_vlb_step=0.00026, train/loss_step=0.0742, global_step=2480.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  21%|██▏       | 258/1208 [07:16<26:48,  1.69s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0742, train/loss_vlb_step=0.00026, train/loss_step=0.0742, global_step=2480.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  21%|██▏       | 258/1208 [07:16<26:48,  1.69s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00847, train/loss_vlb_step=4.15e-5, train/loss_step=0.00847, global_step=2480.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  21%|██▏       | 259/1208 [07:17<26:44,  1.69s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00847, train/loss_vlb_step=4.15e-5, train/loss_step=0.00847, global_step=2480.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  21%|██▏       | 259/1208 [07:17<26:44,  1.69s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.000156, train/loss_step=0.0418, global_step=2480.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  22%|██▏       | 260/1208 [07:21<26:48,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.000156, train/loss_step=0.0418, global_step=2480.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  22%|██▏       | 260/1208 [07:21<26:48,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000147, train/loss_step=0.0396, global_step=2480.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  22%|██▏       | 261/1208 [07:22<26:44,  1.69s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000147, train/loss_step=0.0396, global_step=2480.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  22%|██▏       | 261/1208 [07:22<26:44,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00189, train/loss_step=0.352, global_step=2481.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  22%|██▏       | 262/1208 [07:23<26:40,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00189, train/loss_step=0.352, global_step=2481.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  22%|██▏       | 262/1208 [07:23<26:40,  1.69s/it, loss=0.184, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000623, train/loss_step=0.173, global_step=2481.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  22%|██▏       | 263/1208 [07:24<26:36,  1.69s/it, loss=0.184, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000623, train/loss_step=0.173, global_step=2481.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  22%|██▏       | 263/1208 [07:24<26:36,  1.69s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00433, train/loss_vlb_step=2.32e-5, train/loss_step=0.00433, global_step=2481.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  22%|██▏       | 264/1208 [07:27<26:40,  1.70s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00433, train/loss_vlb_step=2.32e-5, train/loss_step=0.00433, global_step=2481.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  22%|██▏       | 264/1208 [07:27<26:40,  1.70s/it, loss=0.188, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00142, train/loss_step=0.284, global_step=2481.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  22%|██▏       | 265/1208 [07:28<26:36,  1.69s/it, loss=0.188, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00142, train/loss_step=0.284, global_step=2481.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  22%|██▏       | 265/1208 [07:28<26:36,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.000105, train/loss_step=0.027, global_step=2482.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  22%|██▏       | 266/1208 [07:29<26:32,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.000105, train/loss_step=0.027, global_step=2482.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  22%|██▏       | 266/1208 [07:29<26:32,  1.69s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000167, train/loss_step=0.0454, global_step=2482.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  22%|██▏       | 267/1208 [07:30<26:28,  1.69s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000167, train/loss_step=0.0454, global_step=2482.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  22%|██▏       | 267/1208 [07:30<26:28,  1.69s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00524, train/loss_vlb_step=2.77e-5, train/loss_step=0.00524, global_step=2482.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  22%|██▏       | 268/1208 [07:33<26:32,  1.69s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00524, train/loss_vlb_step=2.77e-5, train/loss_step=0.00524, global_step=2482.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  22%|██▏       | 268/1208 [07:33<26:32,  1.69s/it, loss=0.172, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000671, train/loss_step=0.186, global_step=2482.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  22%|██▏       | 269/1208 [07:34<26:28,  1.69s/it, loss=0.172, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000671, train/loss_step=0.186, global_step=2482.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  22%|██▏       | 269/1208 [07:34<26:28,  1.69s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.33e-5, train/loss_step=0.00222, global_step=2483.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  22%|██▏       | 270/1208 [07:36<26:24,  1.69s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.33e-5, train/loss_step=0.00222, global_step=2483.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  22%|██▏       | 270/1208 [07:36<26:24,  1.69s/it, loss=0.166, v_num=0, train/loss_simple_step=0.536, train/loss_vlb_step=0.00742, train/loss_step=0.536, global_step=2483.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  22%|██▏       | 271/1208 [07:37<26:20,  1.69s/it, loss=0.166, v_num=0, train/loss_simple_step=0.536, train/loss_vlb_step=0.00742, train/loss_step=0.536, global_step=2483.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  22%|██▏       | 271/1208 [07:37<26:20,  1.69s/it, loss=0.157, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000361, train/loss_step=0.110, global_step=2483.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  23%|██▎       | 272/1208 [07:40<26:24,  1.69s/it, loss=0.157, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000361, train/loss_step=0.110, global_step=2483.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  23%|██▎       | 272/1208 [07:40<26:24,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.62e-5, train/loss_step=0.018, global_step=2483.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  23%|██▎       | 273/1208 [07:41<26:20,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.62e-5, train/loss_step=0.018, global_step=2483.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  23%|██▎       | 273/1208 [07:41<26:20,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000115, train/loss_step=0.031, global_step=2484.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  23%|██▎       | 274/1208 [07:42<26:16,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000115, train/loss_step=0.031, global_step=2484.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  23%|██▎       | 274/1208 [07:42<26:16,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000806, train/loss_step=0.201, global_step=2484.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  23%|██▎       | 275/1208 [07:43<26:12,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000806, train/loss_step=0.201, global_step=2484.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  23%|██▎       | 275/1208 [07:43<26:12,  1.69s/it, loss=0.116, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000524, train/loss_step=0.151, global_step=2484.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  23%|██▎       | 276/1208 [07:46<26:16,  1.69s/it, loss=0.116, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000524, train/loss_step=0.151, global_step=2484.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  23%|██▎       | 276/1208 [07:46<26:16,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00163, train/loss_step=0.315, global_step=2484.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  23%|██▎       | 277/1208 [07:47<26:12,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00163, train/loss_step=0.315, global_step=2484.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  23%|██▎       | 277/1208 [07:47<26:12,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000812, train/loss_step=0.215, global_step=2485.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  23%|██▎       | 278/1208 [07:48<26:08,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000812, train/loss_step=0.215, global_step=2485.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  23%|██▎       | 278/1208 [07:48<26:08,  1.69s/it, loss=0.162, v_num=0, train/loss_simple_step=0.503, train/loss_vlb_step=0.00556, train/loss_step=0.503, global_step=2485.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  23%|██▎       | 279/1208 [07:49<26:04,  1.68s/it, loss=0.162, v_num=0, train/loss_simple_step=0.503, train/loss_vlb_step=0.00556, train/loss_step=0.503, global_step=2485.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  23%|██▎       | 279/1208 [07:49<26:04,  1.68s/it, loss=0.187, v_num=0, train/loss_simple_step=0.547, train/loss_vlb_step=0.00605, train/loss_step=0.547, global_step=2485.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  23%|██▎       | 280/1208 [07:53<26:08,  1.69s/it, loss=0.187, v_num=0, train/loss_simple_step=0.547, train/loss_vlb_step=0.00605, train/loss_step=0.547, global_step=2485.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  23%|██▎       | 280/1208 [07:53<26:08,  1.69s/it, loss=0.196, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.00083, train/loss_step=0.219, global_step=2485.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  23%|██▎       | 281/1208 [07:54<26:04,  1.69s/it, loss=0.196, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.00083, train/loss_step=0.219, global_step=2485.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  23%|██▎       | 281/1208 [07:54<26:04,  1.69s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=2.56e-5, train/loss_step=0.00492, global_step=2486.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  23%|██▎       | 282/1208 [07:55<26:00,  1.69s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=2.56e-5, train/loss_step=0.00492, global_step=2486.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  23%|██▎       | 282/1208 [07:55<26:00,  1.69s/it, loss=0.187, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00155, train/loss_step=0.343, global_step=2486.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  23%|██▎       | 283/1208 [07:56<25:56,  1.68s/it, loss=0.187, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00155, train/loss_step=0.343, global_step=2486.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  23%|██▎       | 283/1208 [07:56<25:56,  1.68s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.16e-5, train/loss_step=0.0166, global_step=2486.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  24%|██▎       | 284/1208 [07:59<26:00,  1.69s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.16e-5, train/loss_step=0.0166, global_step=2486.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  24%|██▎       | 284/1208 [07:59<26:00,  1.69s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00442, train/loss_vlb_step=2.38e-5, train/loss_step=0.00442, global_step=2486.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  24%|██▎       | 285/1208 [08:00<25:56,  1.69s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00442, train/loss_vlb_step=2.38e-5, train/loss_step=0.00442, global_step=2486.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  24%|██▎       | 285/1208 [08:00<25:56,  1.69s/it, loss=0.196, v_num=0, train/loss_simple_step=0.466, train/loss_vlb_step=0.00659, train/loss_step=0.466, global_step=2487.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  24%|██▎       | 286/1208 [08:01<25:52,  1.68s/it, loss=0.196, v_num=0, train/loss_simple_step=0.466, train/loss_vlb_step=0.00659, train/loss_step=0.466, global_step=2487.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  24%|██▎       | 286/1208 [08:01<25:52,  1.68s/it, loss=0.21, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00197, train/loss_step=0.328, global_step=2487.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  24%|██▍       | 287/1208 [08:02<25:49,  1.68s/it, loss=0.21, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00197, train/loss_step=0.328, global_step=2487.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  24%|██▍       | 287/1208 [08:02<25:49,  1.68s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=7.06e-5, train/loss_step=0.0164, global_step=2487.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  24%|██▍       | 288/1208 [08:06<25:52,  1.69s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=7.06e-5, train/loss_step=0.0164, global_step=2487.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  24%|██▍       | 288/1208 [08:06<25:52,  1.69s/it, loss=0.216, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00119, train/loss_step=0.296, global_step=2487.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  24%|██▍       | 289/1208 [08:07<25:49,  1.69s/it, loss=0.216, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00119, train/loss_step=0.296, global_step=2487.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  24%|██▍       | 289/1208 [08:07<25:49,  1.69s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.27e-5, train/loss_step=0.0118, global_step=2488.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  24%|██▍       | 290/1208 [08:08<25:45,  1.68s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.27e-5, train/loss_step=0.0118, global_step=2488.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  24%|██▍       | 290/1208 [08:08<25:45,  1.68s/it, loss=0.2, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000824, train/loss_step=0.195, global_step=2488.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  24%|██▍       | 291/1208 [08:09<25:41,  1.68s/it, loss=0.2, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000824, train/loss_step=0.195, global_step=2488.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  24%|██▍       | 291/1208 [08:09<25:41,  1.68s/it, loss=0.2, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000373, train/loss_step=0.114, global_step=2488.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  24%|██▍       | 292/1208 [08:12<25:44,  1.69s/it, loss=0.2, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000373, train/loss_step=0.114, global_step=2488.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  24%|██▍       | 292/1208 [08:12<25:44,  1.69s/it, loss=0.206, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000436, train/loss_step=0.132, global_step=2488.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  24%|██▍       | 293/1208 [08:13<25:41,  1.68s/it, loss=0.206, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000436, train/loss_step=0.132, global_step=2488.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  24%|██▍       | 293/1208 [08:13<25:41,  1.68s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.26e-5, train/loss_step=0.0202, global_step=2489.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  24%|██▍       | 294/1208 [08:14<25:37,  1.68s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.26e-5, train/loss_step=0.0202, global_step=2489.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  24%|██▍       | 294/1208 [08:14<25:37,  1.68s/it, loss=0.206, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000948, train/loss_step=0.226, global_step=2489.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  24%|██▍       | 295/1208 [08:15<25:33,  1.68s/it, loss=0.206, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000948, train/loss_step=0.226, global_step=2489.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  24%|██▍       | 295/1208 [08:15<25:33,  1.68s/it, loss=0.213, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00127, train/loss_step=0.288, global_step=2489.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  25%|██▍       | 296/1208 [08:18<25:37,  1.69s/it, loss=0.213, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00127, train/loss_step=0.288, global_step=2489.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  25%|██▍       | 296/1208 [08:18<25:37,  1.69s/it, loss=0.206, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000551, train/loss_step=0.166, global_step=2489.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  25%|██▍       | 297/1208 [08:19<25:33,  1.68s/it, loss=0.206, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000551, train/loss_step=0.166, global_step=2489.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  25%|██▍       | 297/1208 [08:19<25:33,  1.68s/it, loss=0.208, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00111, train/loss_step=0.272, global_step=2490.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  25%|██▍       | 298/1208 [08:20<25:29,  1.68s/it, loss=0.208, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00111, train/loss_step=0.272, global_step=2490.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  25%|██▍       | 298/1208 [08:20<25:29,  1.68s/it, loss=0.192, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000588, train/loss_step=0.165, global_step=2490.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  25%|██▍       | 299/1208 [08:22<25:26,  1.68s/it, loss=0.192, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000588, train/loss_step=0.165, global_step=2490.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  25%|██▍       | 299/1208 [08:22<25:26,  1.68s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0937, train/loss_vlb_step=0.000309, train/loss_step=0.0937, global_step=2490.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  25%|██▍       | 300/1208 [08:25<25:29,  1.68s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0937, train/loss_vlb_step=0.000309, train/loss_step=0.0937, global_step=2490.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  25%|██▍       | 300/1208 [08:25<25:29,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.044, train/loss_vlb_step=0.000159, train/loss_step=0.044, global_step=2490.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.76it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.80it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.80it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.80it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.82it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.75it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.75it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.80it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 8:  25%|██▍       | 301/1208 [08:56<26:55,  1.78s/it, loss=0.16, v_num=0, train/loss_simple_step=0.044, train/loss_vlb_step=0.000159, train/loss_step=0.044, global_step=2490.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  25%|██▍       | 301/1208 [08:56<26:55,  1.78s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0533, train/loss_vlb_step=0.000181, train/loss_step=0.0533, global_step=2491.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  25%|██▌       | 302/1208 [08:57<26:51,  1.78s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0533, train/loss_vlb_step=0.000181, train/loss_step=0.0533, global_step=2491.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  25%|██▌       | 302/1208 [08:57<26:51,  1.78s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.32e-5, train/loss_step=0.0169, global_step=2491.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  25%|██▌       | 303/1208 [08:58<26:47,  1.78s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.32e-5, train/loss_step=0.0169, global_step=2491.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  25%|██▌       | 303/1208 [08:58<26:47,  1.78s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00584, train/loss_vlb_step=3.09e-5, train/loss_step=0.00584, global_step=2491.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  25%|██▌       | 304/1208 [09:01<26:49,  1.78s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00584, train/loss_vlb_step=3.09e-5, train/loss_step=0.00584, global_step=2491.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  25%|██▌       | 304/1208 [09:01<26:49,  1.78s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00932, train/loss_vlb_step=4.44e-5, train/loss_step=0.00932, global_step=2491.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  25%|██▌       | 305/1208 [09:02<26:45,  1.78s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00932, train/loss_vlb_step=4.44e-5, train/loss_step=0.00932, global_step=2491.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  25%|██▌       | 305/1208 [09:02<26:45,  1.78s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0683, train/loss_vlb_step=0.000229, train/loss_step=0.0683, global_step=2492.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  25%|██▌       | 306/1208 [09:03<26:41,  1.78s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0683, train/loss_vlb_step=0.000229, train/loss_step=0.0683, global_step=2492.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  25%|██▌       | 306/1208 [09:03<26:41,  1.78s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000113, train/loss_step=0.0278, global_step=2492.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  25%|██▌       | 307/1208 [09:04<26:37,  1.77s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000113, train/loss_step=0.0278, global_step=2492.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  25%|██▌       | 307/1208 [09:04<26:37,  1.77s/it, loss=0.117, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000427, train/loss_step=0.129, global_step=2492.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  25%|██▌       | 308/1208 [09:07<26:40,  1.78s/it, loss=0.117, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000427, train/loss_step=0.129, global_step=2492.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  25%|██▌       | 308/1208 [09:07<26:40,  1.78s/it, loss=0.111, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000651, train/loss_step=0.185, global_step=2492.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  26%|██▌       | 309/1208 [09:08<26:36,  1.78s/it, loss=0.111, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000651, train/loss_step=0.185, global_step=2492.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  26%|██▌       | 309/1208 [09:08<26:36,  1.78s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.000104, train/loss_step=0.0256, global_step=2493.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  26%|██▌       | 310/1208 [09:09<26:32,  1.77s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.000104, train/loss_step=0.0256, global_step=2493.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  26%|██▌       | 310/1208 [09:09<26:32,  1.77s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0708, train/loss_vlb_step=0.000238, train/loss_step=0.0708, global_step=2493.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  26%|██▌       | 311/1208 [09:10<26:28,  1.77s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0708, train/loss_vlb_step=0.000238, train/loss_step=0.0708, global_step=2493.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  26%|██▌       | 311/1208 [09:10<26:28,  1.77s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.66e-5, train/loss_step=0.0128, global_step=2493.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  26%|██▌       | 312/1208 [09:13<26:30,  1.78s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.66e-5, train/loss_step=0.0128, global_step=2493.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  26%|██▌       | 312/1208 [09:13<26:30,  1.78s/it, loss=0.101, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000468, train/loss_step=0.136, global_step=2493.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  26%|██▌       | 313/1208 [09:15<26:27,  1.77s/it, loss=0.101, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000468, train/loss_step=0.136, global_step=2493.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  26%|██▌       | 313/1208 [09:15<26:27,  1.77s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.93e-5, train/loss_step=0.00351, global_step=2494.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  26%|██▌       | 314/1208 [09:16<26:23,  1.77s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.93e-5, train/loss_step=0.00351, global_step=2494.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  26%|██▌       | 314/1208 [09:16<26:23,  1.77s/it, loss=0.089, v_num=0, train/loss_simple_step=0.00541, train/loss_vlb_step=2.86e-5, train/loss_step=0.00541, global_step=2494.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  26%|██▌       | 315/1208 [09:17<26:19,  1.77s/it, loss=0.089, v_num=0, train/loss_simple_step=0.00541, train/loss_vlb_step=2.86e-5, train/loss_step=0.00541, global_step=2494.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  26%|██▌       | 315/1208 [09:17<26:19,  1.77s/it, loss=0.0778, v_num=0, train/loss_simple_step=0.0651, train/loss_vlb_step=0.000222, train/loss_step=0.0651, global_step=2494.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  26%|██▌       | 316/1208 [09:20<26:21,  1.77s/it, loss=0.0778, v_num=0, train/loss_simple_step=0.0651, train/loss_vlb_step=0.000222, train/loss_step=0.0651, global_step=2494.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  26%|██▌       | 316/1208 [09:20<26:21,  1.77s/it, loss=0.0707, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.52e-5, train/loss_step=0.0232, global_step=2494.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  26%|██▌       | 317/1208 [09:21<26:18,  1.77s/it, loss=0.0707, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.52e-5, train/loss_step=0.0232, global_step=2494.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  26%|██▌       | 317/1208 [09:21<26:18,  1.77s/it, loss=0.0622, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=2495.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  26%|██▋       | 318/1208 [09:22<26:14,  1.77s/it, loss=0.0622, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=2495.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  26%|██▋       | 318/1208 [09:22<26:14,  1.77s/it, loss=0.0672, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00111, train/loss_step=0.265, global_step=2495.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  26%|██▋       | 319/1208 [09:23<26:10,  1.77s/it, loss=0.0672, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00111, train/loss_step=0.265, global_step=2495.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  26%|██▋       | 319/1208 [09:23<26:10,  1.77s/it, loss=0.0644, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000143, train/loss_step=0.0378, global_step=2495.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  26%|██▋       | 320/1208 [09:26<26:13,  1.77s/it, loss=0.0644, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000143, train/loss_step=0.0378, global_step=2495.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  26%|██▋       | 320/1208 [09:26<26:13,  1.77s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.461, train/loss_vlb_step=0.00536, train/loss_step=0.461, global_step=2495.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  27%|██▋       | 321/1208 [09:27<26:09,  1.77s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.461, train/loss_vlb_step=0.00536, train/loss_step=0.461, global_step=2495.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  27%|██▋       | 321/1208 [09:27<26:09,  1.77s/it, loss=0.098, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00143, train/loss_step=0.309, global_step=2496.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  27%|██▋       | 322/1208 [09:29<26:05,  1.77s/it, loss=0.098, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00143, train/loss_step=0.309, global_step=2496.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  27%|██▋       | 322/1208 [09:29<26:05,  1.77s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0907, train/loss_vlb_step=0.0003, train/loss_step=0.0907, global_step=2496.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  27%|██▋       | 323/1208 [09:30<26:01,  1.76s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0907, train/loss_vlb_step=0.0003, train/loss_step=0.0907, global_step=2496.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  27%|██▋       | 323/1208 [09:30<26:01,  1.76s/it, loss=0.11, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000621, train/loss_step=0.179, global_step=2496.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  27%|██▋       | 324/1208 [09:33<26:04,  1.77s/it, loss=0.11, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000621, train/loss_step=0.179, global_step=2496.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  27%|██▋       | 324/1208 [09:33<26:04,  1.77s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0829, train/loss_vlb_step=0.000282, train/loss_step=0.0829, global_step=2496.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  27%|██▋       | 325/1208 [09:34<26:00,  1.77s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0829, train/loss_vlb_step=0.000282, train/loss_step=0.0829, global_step=2496.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  27%|██▋       | 325/1208 [09:34<26:00,  1.77s/it, loss=0.122, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.00106, train/loss_step=0.230, global_step=2497.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  27%|██▋       | 326/1208 [09:35<25:56,  1.77s/it, loss=0.122, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.00106, train/loss_step=0.230, global_step=2497.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  27%|██▋       | 326/1208 [09:35<25:56,  1.77s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=8.48e-5, train/loss_step=0.0211, global_step=2497.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  27%|██▋       | 327/1208 [09:36<25:53,  1.76s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=8.48e-5, train/loss_step=0.0211, global_step=2497.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  27%|██▋       | 327/1208 [09:36<25:53,  1.76s/it, loss=0.117, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.00013, train/loss_step=0.032, global_step=2497.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  27%|██▋       | 328/1208 [09:39<25:55,  1.77s/it, loss=0.117, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.00013, train/loss_step=0.032, global_step=2497.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  27%|██▋       | 328/1208 [09:39<25:55,  1.77s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.9e-5, train/loss_step=0.0209, global_step=2497.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  27%|██▋       | 329/1208 [09:40<25:51,  1.77s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.9e-5, train/loss_step=0.0209, global_step=2497.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  27%|██▋       | 329/1208 [09:40<25:51,  1.77s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0331, train/loss_vlb_step=0.000126, train/loss_step=0.0331, global_step=2498.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  27%|██▋       | 330/1208 [09:41<25:48,  1.76s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0331, train/loss_vlb_step=0.000126, train/loss_step=0.0331, global_step=2498.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  27%|██▋       | 330/1208 [09:41<25:48,  1.76s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000167, train/loss_step=0.0463, global_step=2498.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  27%|██▋       | 331/1208 [09:42<25:44,  1.76s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000167, train/loss_step=0.0463, global_step=2498.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  27%|██▋       | 331/1208 [09:42<25:44,  1.76s/it, loss=0.134, v_num=0, train/loss_simple_step=0.537, train/loss_vlb_step=0.0105, train/loss_step=0.537, global_step=2498.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  27%|██▋       | 332/1208 [09:46<25:46,  1.77s/it, loss=0.134, v_num=0, train/loss_simple_step=0.537, train/loss_vlb_step=0.0105, train/loss_step=0.537, global_step=2498.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  27%|██▋       | 332/1208 [09:46<25:46,  1.77s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.1e-5, train/loss_step=0.0234, global_step=2498.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  28%|██▊       | 333/1208 [09:47<25:43,  1.76s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.1e-5, train/loss_step=0.0234, global_step=2498.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  28%|██▊       | 333/1208 [09:47<25:43,  1.76s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.37e-5, train/loss_step=0.0138, global_step=2499.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  28%|██▊       | 334/1208 [09:48<25:39,  1.76s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.37e-5, train/loss_step=0.0138, global_step=2499.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  28%|██▊       | 334/1208 [09:48<25:39,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000462, train/loss_step=0.139, global_step=2499.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  28%|██▊       | 335/1208 [09:49<25:35,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000462, train/loss_step=0.139, global_step=2499.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  28%|██▊       | 335/1208 [09:49<25:35,  1.76s/it, loss=0.138, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.00034, train/loss_step=0.103, global_step=2499.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  28%|██▊       | 336/1208 [09:52<25:37,  1.76s/it, loss=0.138, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.00034, train/loss_step=0.103, global_step=2499.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  28%|██▊       | 336/1208 [09:52<25:37,  1.76s/it, loss=0.143, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.00047, train/loss_step=0.142, global_step=2499.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  28%|██▊       | 337/1208 [09:53<25:34,  1.76s/it, loss=0.143, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.00047, train/loss_step=0.142, global_step=2499.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  28%|██▊       | 337/1208 [09:53<25:34,  1.76s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0597, train/loss_vlb_step=0.0002, train/loss_step=0.0597, global_step=2500.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  28%|██▊       | 338/1208 [09:54<25:30,  1.76s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0597, train/loss_vlb_step=0.0002, train/loss_step=0.0597, global_step=2500.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  28%|██▊       | 338/1208 [09:54<25:30,  1.76s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0776, train/loss_vlb_step=0.000268, train/loss_step=0.0776, global_step=2500.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  28%|██▊       | 339/1208 [09:55<25:27,  1.76s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0776, train/loss_vlb_step=0.000268, train/loss_step=0.0776, global_step=2500.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  28%|██▊       | 339/1208 [09:55<25:27,  1.76s/it, loss=0.159, v_num=0, train/loss_simple_step=0.577, train/loss_vlb_step=0.0116, train/loss_step=0.577, global_step=2500.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  28%|██▊       | 340/1208 [09:58<25:29,  1.76s/it, loss=0.159, v_num=0, train/loss_simple_step=0.577, train/loss_vlb_step=0.0116, train/loss_step=0.577, global_step=2500.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  28%|██▊       | 340/1208 [09:58<25:29,  1.76s/it, loss=0.147, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000879, train/loss_step=0.212, global_step=2500.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  28%|██▊       | 341/1208 [10:00<25:25,  1.76s/it, loss=0.147, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000879, train/loss_step=0.212, global_step=2500.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  28%|██▊       | 341/1208 [10:00<25:25,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.29e-5, train/loss_step=0.00213, global_step=2501.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  28%|██▊       | 342/1208 [10:01<25:22,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.29e-5, train/loss_step=0.00213, global_step=2501.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  28%|██▊       | 342/1208 [10:01<25:22,  1.76s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00689, train/loss_vlb_step=3.56e-5, train/loss_step=0.00689, global_step=2501.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  28%|██▊       | 343/1208 [10:02<25:18,  1.76s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00689, train/loss_vlb_step=3.56e-5, train/loss_step=0.00689, global_step=2501.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  28%|██▊       | 343/1208 [10:02<25:18,  1.76s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00346, train/loss_vlb_step=1.94e-5, train/loss_step=0.00346, global_step=2501.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  28%|██▊       | 344/1208 [10:05<25:20,  1.76s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00346, train/loss_vlb_step=1.94e-5, train/loss_step=0.00346, global_step=2501.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  28%|██▊       | 344/1208 [10:05<25:20,  1.76s/it, loss=0.134, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00304, train/loss_step=0.408, global_step=2501.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  29%|██▊       | 345/1208 [10:06<25:17,  1.76s/it, loss=0.134, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00304, train/loss_step=0.408, global_step=2501.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  29%|██▊       | 345/1208 [10:06<25:17,  1.76s/it, loss=0.129, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=2502.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  29%|██▊       | 346/1208 [10:07<25:13,  1.76s/it, loss=0.129, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=2502.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  29%|██▊       | 346/1208 [10:07<25:13,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0731, train/loss_vlb_step=0.000244, train/loss_step=0.0731, global_step=2502.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  29%|██▊       | 347/1208 [10:08<25:10,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0731, train/loss_vlb_step=0.000244, train/loss_step=0.0731, global_step=2502.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  29%|██▊       | 347/1208 [10:08<25:10,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000826, train/loss_step=0.215, global_step=2502.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  29%|██▉       | 348/1208 [10:11<25:12,  1.76s/it, loss=0.14, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000826, train/loss_step=0.215, global_step=2502.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  29%|██▉       | 348/1208 [10:11<25:12,  1.76s/it, loss=0.153, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00118, train/loss_step=0.274, global_step=2502.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  29%|██▉       | 349/1208 [10:12<25:08,  1.76s/it, loss=0.153, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00118, train/loss_step=0.274, global_step=2502.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  29%|██▉       | 349/1208 [10:12<25:08,  1.76s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0611, train/loss_vlb_step=0.000208, train/loss_step=0.0611, global_step=2503.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  29%|██▉       | 350/1208 [10:13<25:05,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0611, train/loss_vlb_step=0.000208, train/loss_step=0.0611, global_step=2503.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  29%|██▉       | 350/1208 [10:13<25:05,  1.75s/it, loss=0.153, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=8.03e-5, train/loss_step=0.019, global_step=2503.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  29%|██▉       | 351/1208 [10:15<25:01,  1.75s/it, loss=0.153, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=8.03e-5, train/loss_step=0.019, global_step=2503.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  29%|██▉       | 351/1208 [10:15<25:01,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00569, train/loss_vlb_step=2.99e-5, train/loss_step=0.00569, global_step=2503.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  29%|██▉       | 352/1208 [10:18<25:03,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00569, train/loss_vlb_step=2.99e-5, train/loss_step=0.00569, global_step=2503.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  29%|██▉       | 352/1208 [10:18<25:03,  1.76s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0955, train/loss_vlb_step=0.000321, train/loss_step=0.0955, global_step=2503.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  29%|██▉       | 353/1208 [10:19<25:00,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0955, train/loss_vlb_step=0.000321, train/loss_step=0.0955, global_step=2503.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  29%|██▉       | 353/1208 [10:19<25:00,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=0.000104, train/loss_step=0.0259, global_step=2504.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  29%|██▉       | 354/1208 [10:20<24:56,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=0.000104, train/loss_step=0.0259, global_step=2504.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  29%|██▉       | 354/1208 [10:20<24:56,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0684, train/loss_vlb_step=0.000234, train/loss_step=0.0684, global_step=2504.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  29%|██▉       | 355/1208 [10:21<24:53,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0684, train/loss_vlb_step=0.000234, train/loss_step=0.0684, global_step=2504.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  29%|██▉       | 355/1208 [10:21<24:53,  1.75s/it, loss=0.135, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00109, train/loss_step=0.268, global_step=2504.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  29%|██▉       | 356/1208 [10:24<24:55,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00109, train/loss_step=0.268, global_step=2504.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  29%|██▉       | 356/1208 [10:24<24:55,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0469, train/loss_vlb_step=0.000173, train/loss_step=0.0469, global_step=2504.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  30%|██▉       | 357/1208 [10:25<24:51,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0469, train/loss_vlb_step=0.000173, train/loss_step=0.0469, global_step=2504.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  30%|██▉       | 357/1208 [10:25<24:51,  1.75s/it, loss=0.148, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00329, train/loss_step=0.401, global_step=2505.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  30%|██▉       | 358/1208 [10:26<24:48,  1.75s/it, loss=0.148, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00329, train/loss_step=0.401, global_step=2505.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  30%|██▉       | 358/1208 [10:26<24:48,  1.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000479, train/loss_step=0.145, global_step=2505.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  30%|██▉       | 359/1208 [10:27<24:44,  1.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000479, train/loss_step=0.145, global_step=2505.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  30%|██▉       | 359/1208 [10:27<24:44,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.47e-5, train/loss_step=0.00257, global_step=2505.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  30%|██▉       | 360/1208 [10:31<24:46,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.47e-5, train/loss_step=0.00257, global_step=2505.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  30%|██▉       | 360/1208 [10:31<24:46,  1.75s/it, loss=0.135, v_num=0, train/loss_simple_step=0.471, train/loss_vlb_step=0.00428, train/loss_step=0.471, global_step=2505.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  30%|██▉       | 361/1208 [10:32<24:43,  1.75s/it, loss=0.135, v_num=0, train/loss_simple_step=0.471, train/loss_vlb_step=0.00428, train/loss_step=0.471, global_step=2505.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  30%|██▉       | 361/1208 [10:32<24:43,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0411, train/loss_vlb_step=0.000146, train/loss_step=0.0411, global_step=2506.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  30%|██▉       | 362/1208 [10:33<24:39,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0411, train/loss_vlb_step=0.000146, train/loss_step=0.0411, global_step=2506.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  30%|██▉       | 362/1208 [10:33<24:39,  1.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000366, train/loss_step=0.112, global_step=2506.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  30%|███       | 363/1208 [10:34<24:36,  1.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000366, train/loss_step=0.112, global_step=2506.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  30%|███       | 363/1208 [10:34<24:36,  1.75s/it, loss=0.165, v_num=0, train/loss_simple_step=0.451, train/loss_vlb_step=0.00395, train/loss_step=0.451, global_step=2506.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  30%|███       | 364/1208 [10:37<24:38,  1.75s/it, loss=0.165, v_num=0, train/loss_simple_step=0.451, train/loss_vlb_step=0.00395, train/loss_step=0.451, global_step=2506.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  30%|███       | 364/1208 [10:37<24:38,  1.75s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.77e-5, train/loss_step=0.0178, global_step=2506.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  30%|███       | 365/1208 [10:38<24:35,  1.75s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.77e-5, train/loss_step=0.0178, global_step=2506.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  30%|███       | 365/1208 [10:38<24:35,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.93e-5, train/loss_step=0.0219, global_step=2507.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  30%|███       | 366/1208 [10:39<24:31,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.93e-5, train/loss_step=0.0219, global_step=2507.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  30%|███       | 366/1208 [10:39<24:31,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00761, train/loss_vlb_step=3.82e-5, train/loss_step=0.00761, global_step=2507.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  30%|███       | 367/1208 [10:40<24:28,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00761, train/loss_vlb_step=3.82e-5, train/loss_step=0.00761, global_step=2507.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  30%|███       | 367/1208 [10:40<24:28,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.070, train/loss_vlb_step=0.000235, train/loss_step=0.070, global_step=2507.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  30%|███       | 368/1208 [10:43<24:29,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.070, train/loss_vlb_step=0.000235, train/loss_step=0.070, global_step=2507.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  30%|███       | 368/1208 [10:43<24:29,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00262, train/loss_step=0.380, global_step=2507.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  31%|███       | 369/1208 [10:45<24:26,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00262, train/loss_step=0.380, global_step=2507.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  31%|███       | 369/1208 [10:45<24:26,  1.75s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.77e-5, train/loss_step=0.0129, global_step=2508.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  31%|███       | 370/1208 [10:46<24:23,  1.75s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.77e-5, train/loss_step=0.0129, global_step=2508.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  31%|███       | 370/1208 [10:46<24:23,  1.75s/it, loss=0.146, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00131, train/loss_step=0.282, global_step=2508.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  31%|███       | 371/1208 [10:47<24:19,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00131, train/loss_step=0.282, global_step=2508.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  31%|███       | 371/1208 [10:47<24:19,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000434, train/loss_step=0.131, global_step=2508.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  31%|███       | 372/1208 [10:50<24:21,  1.75s/it, loss=0.153, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000434, train/loss_step=0.131, global_step=2508.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  31%|███       | 372/1208 [10:50<24:21,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.0004, train/loss_step=0.120, global_step=2508.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  31%|███       | 373/1208 [10:51<24:18,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.0004, train/loss_step=0.120, global_step=2508.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  31%|███       | 373/1208 [10:51<24:18,  1.75s/it, loss=0.172, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00338, train/loss_step=0.385, global_step=2509.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  31%|███       | 374/1208 [10:52<24:15,  1.74s/it, loss=0.172, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00338, train/loss_step=0.385, global_step=2509.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  31%|███       | 374/1208 [10:52<24:15,  1.74s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0601, train/loss_vlb_step=0.000204, train/loss_step=0.0601, global_step=2509.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  31%|███       | 375/1208 [10:53<24:11,  1.74s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0601, train/loss_vlb_step=0.000204, train/loss_step=0.0601, global_step=2509.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  31%|███       | 375/1208 [10:53<24:11,  1.74s/it, loss=0.164, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=2509.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  31%|███       | 376/1208 [10:56<24:13,  1.75s/it, loss=0.164, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=2509.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  31%|███       | 376/1208 [10:56<24:13,  1.75s/it, loss=0.17, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000654, train/loss_step=0.184, global_step=2509.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  31%|███       | 377/1208 [10:57<24:10,  1.75s/it, loss=0.17, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000654, train/loss_step=0.184, global_step=2509.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  31%|███       | 377/1208 [10:57<24:10,  1.75s/it, loss=0.16, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000656, train/loss_step=0.186, global_step=2510.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  31%|███▏      | 378/1208 [10:58<24:06,  1.74s/it, loss=0.16, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000656, train/loss_step=0.186, global_step=2510.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  31%|███▏      | 378/1208 [10:58<24:06,  1.74s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0648, train/loss_vlb_step=0.000221, train/loss_step=0.0648, global_step=2510.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  31%|███▏      | 379/1208 [10:59<24:03,  1.74s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0648, train/loss_vlb_step=0.000221, train/loss_step=0.0648, global_step=2510.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  31%|███▏      | 379/1208 [10:59<24:03,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000538, train/loss_step=0.158, global_step=2510.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  31%|███▏      | 380/1208 [11:03<24:05,  1.75s/it, loss=0.163, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000538, train/loss_step=0.158, global_step=2510.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  31%|███▏      | 380/1208 [11:03<24:05,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=5e-5, train/loss_step=0.0107, global_step=2510.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  32%|███▏      | 381/1208 [11:04<24:02,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=5e-5, train/loss_step=0.0107, global_step=2510.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  32%|███▏      | 381/1208 [11:04<24:02,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000349, train/loss_step=0.105, global_step=2511.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  32%|███▏      | 382/1208 [11:05<23:58,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000349, train/loss_step=0.105, global_step=2511.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  32%|███▏      | 382/1208 [11:05<23:58,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00128, train/loss_step=0.290, global_step=2511.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  32%|███▏      | 383/1208 [11:06<23:55,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00128, train/loss_step=0.290, global_step=2511.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  32%|███▏      | 383/1208 [11:06<23:55,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.59e-5, train/loss_step=0.0146, global_step=2511.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  32%|███▏      | 384/1208 [11:09<23:57,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.59e-5, train/loss_step=0.0146, global_step=2511.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  32%|███▏      | 384/1208 [11:09<23:57,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000761, train/loss_step=0.201, global_step=2511.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  32%|███▏      | 385/1208 [11:10<23:53,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000761, train/loss_step=0.201, global_step=2511.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  32%|███▏      | 385/1208 [11:10<23:53,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000377, train/loss_step=0.115, global_step=2512.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  32%|███▏      | 386/1208 [11:11<23:50,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000377, train/loss_step=0.115, global_step=2512.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  32%|███▏      | 386/1208 [11:11<23:50,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000105, train/loss_step=0.0263, global_step=2512.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  32%|███▏      | 387/1208 [11:12<23:47,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000105, train/loss_step=0.0263, global_step=2512.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  32%|███▏      | 387/1208 [11:12<23:47,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00261, train/loss_step=0.411, global_step=2512.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  32%|███▏      | 388/1208 [11:16<23:48,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00261, train/loss_step=0.411, global_step=2512.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  32%|███▏      | 388/1208 [11:16<23:48,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000138, train/loss_step=0.0363, global_step=2512.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  32%|███▏      | 389/1208 [11:17<23:45,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000138, train/loss_step=0.0363, global_step=2512.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  32%|███▏      | 389/1208 [11:17<23:45,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.00051, train/loss_step=0.153, global_step=2513.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  32%|███▏      | 390/1208 [11:18<23:42,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.00051, train/loss_step=0.153, global_step=2513.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  32%|███▏      | 390/1208 [11:18<23:42,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0477, train/loss_vlb_step=0.000169, train/loss_step=0.0477, global_step=2513.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  32%|███▏      | 391/1208 [11:19<23:39,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0477, train/loss_vlb_step=0.000169, train/loss_step=0.0477, global_step=2513.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  32%|███▏      | 391/1208 [11:19<23:39,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000463, train/loss_step=0.136, global_step=2513.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  32%|███▏      | 392/1208 [11:22<23:40,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000463, train/loss_step=0.136, global_step=2513.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  32%|███▏      | 392/1208 [11:22<23:40,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.5e-5, train/loss_step=0.00253, global_step=2513.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  33%|███▎      | 393/1208 [11:23<23:37,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.5e-5, train/loss_step=0.00253, global_step=2513.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  33%|███▎      | 393/1208 [11:23<23:37,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.868, train/loss_vlb_step=0.146, train/loss_step=0.868, global_step=2514.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]     Epoch 8:  33%|███▎      | 394/1208 [11:24<23:34,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.868, train/loss_vlb_step=0.146, train/loss_step=0.868, global_step=2514.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  33%|███▎      | 394/1208 [11:24<23:34,  1.74s/it, loss=0.175, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00234, train/loss_step=0.373, global_step=2514.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  33%|███▎      | 395/1208 [11:25<23:31,  1.74s/it, loss=0.175, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00234, train/loss_step=0.373, global_step=2514.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  33%|███▎      | 395/1208 [11:25<23:31,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.51e-5, train/loss_step=0.0115, global_step=2514.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  33%|███▎      | 396/1208 [11:28<23:32,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.51e-5, train/loss_step=0.0115, global_step=2514.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  33%|███▎      | 396/1208 [11:28<23:32,  1.74s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0729, train/loss_vlb_step=0.000246, train/loss_step=0.0729, global_step=2514.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  33%|███▎      | 397/1208 [11:30<23:29,  1.74s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0729, train/loss_vlb_step=0.000246, train/loss_step=0.0729, global_step=2514.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  33%|███▎      | 397/1208 [11:30<23:29,  1.74s/it, loss=0.164, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000604, train/loss_step=0.175, global_step=2515.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  33%|███▎      | 398/1208 [11:31<23:26,  1.74s/it, loss=0.164, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000604, train/loss_step=0.175, global_step=2515.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  33%|███▎      | 398/1208 [11:31<23:26,  1.74s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.42e-5, train/loss_step=0.0167, global_step=2515.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  33%|███▎      | 399/1208 [11:32<23:23,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.42e-5, train/loss_step=0.0167, global_step=2515.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  33%|███▎      | 399/1208 [11:32<23:23,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000932, train/loss_step=0.236, global_step=2515.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  33%|███▎      | 400/1208 [11:35<23:24,  1.74s/it, loss=0.165, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000932, train/loss_step=0.236, global_step=2515.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  33%|███▎      | 400/1208 [11:35<23:24,  1.74s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00722, train/loss_vlb_step=3.63e-5, train/loss_step=0.00722, global_step=2515.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  33%|███▎      | 401/1208 [11:36<23:21,  1.74s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00722, train/loss_vlb_step=3.63e-5, train/loss_step=0.00722, global_step=2515.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  33%|███▎      | 401/1208 [11:36<23:21,  1.74s/it, loss=0.178, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00246, train/loss_step=0.377, global_step=2516.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  33%|███▎      | 402/1208 [11:37<23:18,  1.74s/it, loss=0.178, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00246, train/loss_step=0.377, global_step=2516.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  33%|███▎      | 402/1208 [11:37<23:18,  1.74s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=9.1e-5, train/loss_step=0.0217, global_step=2516.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  33%|███▎      | 403/1208 [11:38<23:15,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=9.1e-5, train/loss_step=0.0217, global_step=2516.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  33%|███▎      | 403/1208 [11:38<23:15,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.72e-5, train/loss_step=0.021, global_step=2516.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  33%|███▎      | 404/1208 [11:41<23:16,  1.74s/it, loss=0.165, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.72e-5, train/loss_step=0.021, global_step=2516.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  33%|███▎      | 404/1208 [11:41<23:16,  1.74s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0825, train/loss_vlb_step=0.000271, train/loss_step=0.0825, global_step=2516.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  34%|███▎      | 405/1208 [11:42<23:13,  1.74s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0825, train/loss_vlb_step=0.000271, train/loss_step=0.0825, global_step=2516.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  34%|███▎      | 405/1208 [11:42<23:13,  1.74s/it, loss=0.189, v_num=0, train/loss_simple_step=0.707, train/loss_vlb_step=0.0233, train/loss_step=0.707, global_step=2517.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  34%|███▎      | 406/1208 [11:43<23:10,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.707, train/loss_vlb_step=0.0233, train/loss_step=0.707, global_step=2517.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  34%|███▎      | 406/1208 [11:43<23:10,  1.73s/it, loss=0.197, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000796, train/loss_step=0.193, global_step=2517.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  34%|███▎      | 407/1208 [11:44<23:07,  1.73s/it, loss=0.197, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000796, train/loss_step=0.193, global_step=2517.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  34%|███▎      | 407/1208 [11:44<23:07,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.22e-5, train/loss_step=0.00203, global_step=2517.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  34%|███▍      | 408/1208 [11:48<23:08,  1.74s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.22e-5, train/loss_step=0.00203, global_step=2517.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  34%|███▍      | 408/1208 [11:48<23:08,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=2517.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  34%|███▍      | 409/1208 [11:49<23:05,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=2517.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  34%|███▍      | 409/1208 [11:49<23:05,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=1.54e-5, train/loss_step=0.00262, global_step=2518.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  34%|███▍      | 410/1208 [11:50<23:02,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=1.54e-5, train/loss_step=0.00262, global_step=2518.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  34%|███▍      | 410/1208 [11:50<23:02,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0713, train/loss_vlb_step=0.000242, train/loss_step=0.0713, global_step=2518.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  34%|███▍      | 411/1208 [11:51<22:59,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0713, train/loss_vlb_step=0.000242, train/loss_step=0.0713, global_step=2518.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  34%|███▍      | 411/1208 [11:51<22:59,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.51e-5, train/loss_step=0.016, global_step=2518.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  34%|███▍      | 412/1208 [11:54<23:00,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.51e-5, train/loss_step=0.016, global_step=2518.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  34%|███▍      | 412/1208 [11:54<23:00,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000109, train/loss_step=0.0266, global_step=2518.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  34%|███▍      | 413/1208 [11:55<22:57,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000109, train/loss_step=0.0266, global_step=2518.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  34%|███▍      | 413/1208 [11:55<22:57,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0909, train/loss_vlb_step=0.000307, train/loss_step=0.0909, global_step=2519.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  34%|███▍      | 414/1208 [11:56<22:54,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0909, train/loss_vlb_step=0.000307, train/loss_step=0.0909, global_step=2519.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  34%|███▍      | 414/1208 [11:56<22:54,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000958, train/loss_step=0.245, global_step=2519.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  34%|███▍      | 415/1208 [11:57<22:51,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000958, train/loss_step=0.245, global_step=2519.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  34%|███▍      | 415/1208 [11:57<22:51,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.001, train/loss_step=0.250, global_step=2519.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  34%|███▍      | 416/1208 [12:01<22:52,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.001, train/loss_step=0.250, global_step=2519.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  34%|███▍      | 416/1208 [12:01<22:52,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.26e-5, train/loss_step=0.0117, global_step=2519.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  35%|███▍      | 417/1208 [12:02<22:49,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.26e-5, train/loss_step=0.0117, global_step=2519.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  35%|███▍      | 417/1208 [12:02<22:49,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00107, train/loss_step=0.251, global_step=2520.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  35%|███▍      | 418/1208 [12:03<22:46,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00107, train/loss_step=0.251, global_step=2520.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  35%|███▍      | 418/1208 [12:03<22:46,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=6.72e-5, train/loss_step=0.0167, global_step=2520.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  35%|███▍      | 419/1208 [12:04<22:43,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=6.72e-5, train/loss_step=0.0167, global_step=2520.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  35%|███▍      | 419/1208 [12:04<22:43,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0664, train/loss_vlb_step=0.000228, train/loss_step=0.0664, global_step=2520.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  35%|███▍      | 420/1208 [12:07<22:45,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0664, train/loss_vlb_step=0.000228, train/loss_step=0.0664, global_step=2520.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  35%|███▍      | 420/1208 [12:07<22:45,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0824, train/loss_vlb_step=0.000275, train/loss_step=0.0824, global_step=2520.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  35%|███▍      | 421/1208 [12:08<22:42,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0824, train/loss_vlb_step=0.000275, train/loss_step=0.0824, global_step=2520.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  35%|███▍      | 421/1208 [12:08<22:42,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=2521.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  35%|███▍      | 422/1208 [12:09<22:39,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=2521.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  35%|███▍      | 422/1208 [12:09<22:39,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0765, train/loss_vlb_step=0.000256, train/loss_step=0.0765, global_step=2521.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  35%|███▌      | 423/1208 [12:10<22:35,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0765, train/loss_vlb_step=0.000256, train/loss_step=0.0765, global_step=2521.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  35%|███▌      | 423/1208 [12:10<22:35,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00192, train/loss_step=0.332, global_step=2521.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  35%|███▌      | 424/1208 [12:13<22:37,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00192, train/loss_step=0.332, global_step=2521.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  35%|███▌      | 424/1208 [12:13<22:37,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00427, train/loss_step=0.423, global_step=2521.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  35%|███▌      | 425/1208 [12:14<22:34,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00427, train/loss_step=0.423, global_step=2521.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  35%|███▌      | 425/1208 [12:14<22:34,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.78e-5, train/loss_step=0.0245, global_step=2522.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  35%|███▌      | 426/1208 [12:15<22:31,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.78e-5, train/loss_step=0.0245, global_step=2522.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  35%|███▌      | 426/1208 [12:15<22:31,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=3.64e-5, train/loss_step=0.0072, global_step=2522.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  35%|███▌      | 427/1208 [12:17<22:28,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=3.64e-5, train/loss_step=0.0072, global_step=2522.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  35%|███▌      | 427/1208 [12:17<22:28,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000549, train/loss_step=0.163, global_step=2522.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  35%|███▌      | 428/1208 [12:20<22:29,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000549, train/loss_step=0.163, global_step=2522.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  35%|███▌      | 428/1208 [12:20<22:29,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00307, train/loss_vlb_step=1.72e-5, train/loss_step=0.00307, global_step=2522.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  36%|███▌      | 429/1208 [12:21<22:26,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00307, train/loss_vlb_step=1.72e-5, train/loss_step=0.00307, global_step=2522.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  36%|███▌      | 429/1208 [12:21<22:26,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000361, train/loss_step=0.109, global_step=2523.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  36%|███▌      | 430/1208 [12:22<22:23,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000361, train/loss_step=0.109, global_step=2523.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  36%|███▌      | 430/1208 [12:22<22:23,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.55e-5, train/loss_step=0.0208, global_step=2523.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  36%|███▌      | 431/1208 [12:23<22:20,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.55e-5, train/loss_step=0.0208, global_step=2523.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  36%|███▌      | 431/1208 [12:23<22:20,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.8e-5, train/loss_step=0.0101, global_step=2523.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  36%|███▌      | 432/1208 [12:26<22:21,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.8e-5, train/loss_step=0.0101, global_step=2523.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  36%|███▌      | 432/1208 [12:26<22:21,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00371, train/loss_step=0.413, global_step=2523.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  36%|███▌      | 433/1208 [12:27<22:18,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00371, train/loss_step=0.413, global_step=2523.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  36%|███▌      | 433/1208 [12:27<22:18,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000853, train/loss_step=0.223, global_step=2524.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  36%|███▌      | 434/1208 [12:28<22:15,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000853, train/loss_step=0.223, global_step=2524.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  36%|███▌      | 434/1208 [12:28<22:15,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0584, train/loss_vlb_step=0.000204, train/loss_step=0.0584, global_step=2524.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  36%|███▌      | 435/1208 [12:29<22:12,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0584, train/loss_vlb_step=0.000204, train/loss_step=0.0584, global_step=2524.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  36%|███▌      | 435/1208 [12:29<22:12,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0048, train/loss_vlb_step=2.6e-5, train/loss_step=0.0048, global_step=2524.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  36%|███▌      | 436/1208 [12:33<22:13,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0048, train/loss_vlb_step=2.6e-5, train/loss_step=0.0048, global_step=2524.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  36%|███▌      | 436/1208 [12:33<22:13,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00766, train/loss_vlb_step=3.67e-5, train/loss_step=0.00766, global_step=2524.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  36%|███▌      | 437/1208 [12:34<22:10,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00766, train/loss_vlb_step=3.67e-5, train/loss_step=0.00766, global_step=2524.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  36%|███▌      | 437/1208 [12:34<22:10,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.25e-5, train/loss_step=0.00205, global_step=2525.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  36%|███▋      | 438/1208 [12:35<22:07,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.25e-5, train/loss_step=0.00205, global_step=2525.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  36%|███▋      | 438/1208 [12:35<22:07,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000149, train/loss_step=0.0405, global_step=2525.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  36%|███▋      | 439/1208 [12:36<22:04,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000149, train/loss_step=0.0405, global_step=2525.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  36%|███▋      | 439/1208 [12:36<22:04,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=1.08e-5, train/loss_step=0.0018, global_step=2525.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  36%|███▋      | 440/1208 [12:39<22:05,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=1.08e-5, train/loss_step=0.0018, global_step=2525.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  36%|███▋      | 440/1208 [12:39<22:05,  1.73s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.97e-5, train/loss_step=0.0135, global_step=2525.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  37%|███▋      | 441/1208 [12:40<22:03,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.97e-5, train/loss_step=0.0135, global_step=2525.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  37%|███▋      | 441/1208 [12:40<22:03,  1.72s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.75e-5, train/loss_step=0.0029, global_step=2526.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  37%|███▋      | 442/1208 [12:41<22:00,  1.72s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.75e-5, train/loss_step=0.0029, global_step=2526.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  37%|███▋      | 442/1208 [12:41<22:00,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.571, train/loss_vlb_step=0.00887, train/loss_step=0.571, global_step=2526.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  37%|███▋      | 443/1208 [12:42<21:57,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.571, train/loss_vlb_step=0.00887, train/loss_step=0.571, global_step=2526.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  37%|███▋      | 443/1208 [12:42<21:57,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00358, train/loss_vlb_step=1.97e-5, train/loss_step=0.00358, global_step=2526.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  37%|███▋      | 444/1208 [12:45<21:57,  1.73s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00358, train/loss_vlb_step=1.97e-5, train/loss_step=0.00358, global_step=2526.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  37%|███▋      | 444/1208 [12:45<21:57,  1.73s/it, loss=0.0872, v_num=0, train/loss_simple_step=0.0651, train/loss_vlb_step=0.000227, train/loss_step=0.0651, global_step=2526.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  37%|███▋      | 445/1208 [12:46<21:55,  1.72s/it, loss=0.0872, v_num=0, train/loss_simple_step=0.0651, train/loss_vlb_step=0.000227, train/loss_step=0.0651, global_step=2526.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  37%|███▋      | 445/1208 [12:47<21:55,  1.72s/it, loss=0.0876, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.00012, train/loss_step=0.0317, global_step=2527.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  37%|███▋      | 446/1208 [12:48<21:52,  1.72s/it, loss=0.0876, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.00012, train/loss_step=0.0317, global_step=2527.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  37%|███▋      | 446/1208 [12:48<21:52,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00388, train/loss_step=0.432, global_step=2527.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  37%|███▋      | 447/1208 [12:49<21:49,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00388, train/loss_step=0.432, global_step=2527.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  37%|███▋      | 447/1208 [12:49<21:49,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000117, train/loss_step=0.0288, global_step=2527.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  37%|███▋      | 448/1208 [12:52<21:50,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000117, train/loss_step=0.0288, global_step=2527.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  37%|███▋      | 448/1208 [12:52<21:50,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00623, train/loss_vlb_step=3.16e-5, train/loss_step=0.00623, global_step=2527.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  37%|███▋      | 449/1208 [12:53<21:47,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00623, train/loss_vlb_step=3.16e-5, train/loss_step=0.00623, global_step=2527.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  37%|███▋      | 449/1208 [12:53<21:47,  1.72s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.000171, train/loss_step=0.0471, global_step=2528.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  37%|███▋      | 450/1208 [12:54<21:44,  1.72s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.000171, train/loss_step=0.0471, global_step=2528.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  37%|███▋      | 450/1208 [12:54<21:44,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000756, train/loss_step=0.204, global_step=2528.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  37%|███▋      | 451/1208 [12:55<21:41,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000756, train/loss_step=0.204, global_step=2528.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  37%|███▋      | 451/1208 [12:55<21:41,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.15e-5, train/loss_step=0.0226, global_step=2528.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  37%|███▋      | 452/1208 [12:58<21:42,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.15e-5, train/loss_step=0.0226, global_step=2528.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  37%|███▋      | 452/1208 [12:58<21:42,  1.72s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=1.52e-5, train/loss_step=0.00258, global_step=2528.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  38%|███▊      | 453/1208 [12:59<21:39,  1.72s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=1.52e-5, train/loss_step=0.00258, global_step=2528.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  38%|███▊      | 453/1208 [12:59<21:39,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.725, train/loss_vlb_step=0.0617, train/loss_step=0.725, global_step=2529.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]      Epoch 8:  38%|███▊      | 454/1208 [13:00<21:36,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.725, train/loss_vlb_step=0.0617, train/loss_step=0.725, global_step=2529.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  38%|███▊      | 454/1208 [13:00<21:36,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0805, train/loss_vlb_step=0.000272, train/loss_step=0.0805, global_step=2529.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  38%|███▊      | 455/1208 [13:01<21:34,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0805, train/loss_vlb_step=0.000272, train/loss_step=0.0805, global_step=2529.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  38%|███▊      | 455/1208 [13:01<21:34,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.000174, train/loss_step=0.0459, global_step=2529.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  38%|███▊      | 456/1208 [13:05<21:34,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.000174, train/loss_step=0.0459, global_step=2529.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  38%|███▊      | 456/1208 [13:05<21:34,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000304, train/loss_step=0.0891, global_step=2529.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  38%|███▊      | 457/1208 [13:06<21:32,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000304, train/loss_step=0.0891, global_step=2529.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  38%|███▊      | 457/1208 [13:06<21:32,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00803, train/loss_vlb_step=3.88e-5, train/loss_step=0.00803, global_step=2530.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  38%|███▊      | 458/1208 [13:07<21:29,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00803, train/loss_vlb_step=3.88e-5, train/loss_step=0.00803, global_step=2530.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  38%|███▊      | 458/1208 [13:07<21:29,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0421, train/loss_vlb_step=0.000152, train/loss_step=0.0421, global_step=2530.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  38%|███▊      | 459/1208 [13:08<21:26,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0421, train/loss_vlb_step=0.000152, train/loss_step=0.0421, global_step=2530.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  38%|███▊      | 459/1208 [13:08<21:26,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00162, train/loss_step=0.307, global_step=2530.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  38%|███▊      | 460/1208 [13:11<21:27,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00162, train/loss_step=0.307, global_step=2530.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  38%|███▊      | 460/1208 [13:11<21:27,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000712, train/loss_step=0.198, global_step=2530.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  38%|███▊      | 461/1208 [13:12<21:24,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000712, train/loss_step=0.198, global_step=2530.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  38%|███▊      | 461/1208 [13:12<21:24,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.542, train/loss_vlb_step=0.00519, train/loss_step=0.542, global_step=2531.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  38%|███▊      | 462/1208 [13:13<21:21,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.542, train/loss_vlb_step=0.00519, train/loss_step=0.542, global_step=2531.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  38%|███▊      | 462/1208 [13:13<21:21,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000148, train/loss_step=0.0386, global_step=2531.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  38%|███▊      | 463/1208 [13:14<21:18,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000148, train/loss_step=0.0386, global_step=2531.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  38%|███▊      | 463/1208 [13:14<21:18,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000834, train/loss_step=0.214, global_step=2531.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  38%|███▊      | 464/1208 [13:17<21:19,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000834, train/loss_step=0.214, global_step=2531.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  38%|███▊      | 464/1208 [13:17<21:19,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00176, train/loss_step=0.337, global_step=2531.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  38%|███▊      | 465/1208 [13:19<21:16,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00176, train/loss_step=0.337, global_step=2531.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  38%|███▊      | 465/1208 [13:19<21:16,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0992, train/loss_vlb_step=0.000326, train/loss_step=0.0992, global_step=2532.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  39%|███▊      | 466/1208 [13:20<21:13,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0992, train/loss_vlb_step=0.000326, train/loss_step=0.0992, global_step=2532.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  39%|███▊      | 466/1208 [13:20<21:13,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.39e-5, train/loss_step=0.0201, global_step=2532.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  39%|███▊      | 467/1208 [13:21<21:11,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.39e-5, train/loss_step=0.0201, global_step=2532.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  39%|███▊      | 467/1208 [13:21<21:11,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000343, train/loss_step=0.101, global_step=2532.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  39%|███▊      | 468/1208 [13:24<21:11,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000343, train/loss_step=0.101, global_step=2532.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  39%|███▊      | 468/1208 [13:24<21:11,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0902, train/loss_vlb_step=0.000296, train/loss_step=0.0902, global_step=2532.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  39%|███▉      | 469/1208 [13:25<21:09,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0902, train/loss_vlb_step=0.000296, train/loss_step=0.0902, global_step=2532.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  39%|███▉      | 469/1208 [13:25<21:09,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00259, train/loss_step=0.328, global_step=2533.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  39%|███▉      | 470/1208 [13:26<21:06,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00259, train/loss_step=0.328, global_step=2533.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  39%|███▉      | 470/1208 [13:26<21:06,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.00094, train/loss_step=0.241, global_step=2533.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  39%|███▉      | 471/1208 [13:27<21:03,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.00094, train/loss_step=0.241, global_step=2533.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  39%|███▉      | 471/1208 [13:27<21:03,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000404, train/loss_step=0.123, global_step=2533.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  39%|███▉      | 472/1208 [13:30<21:04,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000404, train/loss_step=0.123, global_step=2533.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  39%|███▉      | 472/1208 [13:30<21:04,  1.72s/it, loss=0.185, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.000226, train/loss_step=0.067, global_step=2533.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  39%|███▉      | 473/1208 [13:31<21:01,  1.72s/it, loss=0.185, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.000226, train/loss_step=0.067, global_step=2533.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  39%|███▉      | 473/1208 [13:31<21:01,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=3.33e-5, train/loss_step=0.00615, global_step=2534.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  39%|███▉      | 474/1208 [13:32<20:58,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=3.33e-5, train/loss_step=0.00615, global_step=2534.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  39%|███▉      | 474/1208 [13:32<20:58,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.16e-5, train/loss_step=0.00194, global_step=2534.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  39%|███▉      | 475/1208 [13:33<20:56,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.16e-5, train/loss_step=0.00194, global_step=2534.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  39%|███▉      | 475/1208 [13:33<20:56,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000146, train/loss_step=0.0396, global_step=2534.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  39%|███▉      | 476/1208 [13:37<20:56,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000146, train/loss_step=0.0396, global_step=2534.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  39%|███▉      | 476/1208 [13:37<20:56,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.00039, train/loss_step=0.118, global_step=2534.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  39%|███▉      | 477/1208 [13:38<20:54,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.00039, train/loss_step=0.118, global_step=2534.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  39%|███▉      | 477/1208 [13:38<20:54,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.000962, train/loss_step=0.251, global_step=2535.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  40%|███▉      | 478/1208 [13:39<20:51,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.000962, train/loss_step=0.251, global_step=2535.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  40%|███▉      | 478/1208 [13:39<20:51,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000874, train/loss_step=0.234, global_step=2535.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  40%|███▉      | 479/1208 [13:40<20:48,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000874, train/loss_step=0.234, global_step=2535.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  40%|███▉      | 479/1208 [13:40<20:48,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000514, train/loss_step=0.154, global_step=2535.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  40%|███▉      | 480/1208 [13:43<20:49,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000514, train/loss_step=0.154, global_step=2535.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  40%|███▉      | 480/1208 [13:43<20:49,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000508, train/loss_step=0.154, global_step=2535.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  40%|███▉      | 481/1208 [13:44<20:46,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000508, train/loss_step=0.154, global_step=2535.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  40%|███▉      | 481/1208 [13:44<20:46,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00304, train/loss_step=0.390, global_step=2536.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  40%|███▉      | 482/1208 [13:45<20:43,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00304, train/loss_step=0.390, global_step=2536.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  40%|███▉      | 482/1208 [13:45<20:43,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00115, train/loss_step=0.250, global_step=2536.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  40%|███▉      | 483/1208 [13:46<20:41,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00115, train/loss_step=0.250, global_step=2536.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  40%|███▉      | 483/1208 [13:46<20:41,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.8e-5, train/loss_step=0.0219, global_step=2536.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  40%|████      | 484/1208 [13:50<20:41,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.8e-5, train/loss_step=0.0219, global_step=2536.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  40%|████      | 484/1208 [13:50<20:41,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=1.23e-5, train/loss_step=0.00206, global_step=2536.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  40%|████      | 485/1208 [13:51<20:38,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=1.23e-5, train/loss_step=0.00206, global_step=2536.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  40%|████      | 485/1208 [13:51<20:38,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.456, train/loss_vlb_step=0.00521, train/loss_step=0.456, global_step=2537.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  40%|████      | 486/1208 [13:52<20:36,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.456, train/loss_vlb_step=0.00521, train/loss_step=0.456, global_step=2537.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  40%|████      | 486/1208 [13:52<20:36,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0885, train/loss_vlb_step=0.000296, train/loss_step=0.0885, global_step=2537.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  40%|████      | 487/1208 [13:53<20:33,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0885, train/loss_vlb_step=0.000296, train/loss_step=0.0885, global_step=2537.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  40%|████      | 487/1208 [13:53<20:33,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000635, train/loss_step=0.179, global_step=2537.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  40%|████      | 488/1208 [13:56<20:34,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000635, train/loss_step=0.179, global_step=2537.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  40%|████      | 488/1208 [13:56<20:34,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000439, train/loss_step=0.133, global_step=2537.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  40%|████      | 489/1208 [13:57<20:31,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000439, train/loss_step=0.133, global_step=2537.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  40%|████      | 489/1208 [13:57<20:31,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.000193, train/loss_step=0.0543, global_step=2538.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  41%|████      | 490/1208 [13:58<20:28,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.000193, train/loss_step=0.0543, global_step=2538.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  41%|████      | 490/1208 [13:58<20:28,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0467, train/loss_vlb_step=0.000164, train/loss_step=0.0467, global_step=2538.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  41%|████      | 491/1208 [13:59<20:26,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0467, train/loss_vlb_step=0.000164, train/loss_step=0.0467, global_step=2538.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  41%|████      | 491/1208 [13:59<20:26,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=2.07e-5, train/loss_step=0.00378, global_step=2538.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  41%|████      | 492/1208 [14:02<20:26,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=2.07e-5, train/loss_step=0.00378, global_step=2538.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  41%|████      | 492/1208 [14:02<20:26,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.593, train/loss_vlb_step=0.0208, train/loss_step=0.593, global_step=2538.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]     Epoch 8:  41%|████      | 493/1208 [14:03<20:23,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.593, train/loss_vlb_step=0.0208, train/loss_step=0.593, global_step=2538.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  41%|████      | 493/1208 [14:03<20:23,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.00071, train/loss_step=0.195, global_step=2539.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  41%|████      | 494/1208 [14:04<20:21,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.00071, train/loss_step=0.195, global_step=2539.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  41%|████      | 494/1208 [14:04<20:21,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000125, train/loss_step=0.0335, global_step=2539.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  41%|████      | 495/1208 [14:05<20:18,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000125, train/loss_step=0.0335, global_step=2539.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  41%|████      | 495/1208 [14:05<20:18,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00438, train/loss_step=0.415, global_step=2539.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  41%|████      | 496/1208 [14:09<20:19,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00438, train/loss_step=0.415, global_step=2539.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  41%|████      | 496/1208 [14:09<20:19,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.00065, train/loss_step=0.187, global_step=2539.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  41%|████      | 497/1208 [14:10<20:16,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.00065, train/loss_step=0.187, global_step=2539.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  41%|████      | 497/1208 [14:10<20:16,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000417, train/loss_step=0.127, global_step=2540.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  41%|████      | 498/1208 [14:11<20:13,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000417, train/loss_step=0.127, global_step=2540.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  41%|████      | 498/1208 [14:11<20:13,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000149, train/loss_step=0.0386, global_step=2540.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  41%|████▏     | 499/1208 [14:12<20:11,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000149, train/loss_step=0.0386, global_step=2540.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  41%|████▏     | 499/1208 [14:12<20:11,  1.71s/it, loss=0.191, v_num=0, train/loss_simple_step=0.456, train/loss_vlb_step=0.00467, train/loss_step=0.456, global_step=2540.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  41%|████▏     | 500/1208 [14:15<20:11,  1.71s/it, loss=0.191, v_num=0, train/loss_simple_step=0.456, train/loss_vlb_step=0.00467, train/loss_step=0.456, global_step=2540.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  41%|████▏     | 500/1208 [14:15<20:11,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000107, train/loss_step=0.0253, global_step=2540.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  41%|████▏     | 501/1208 [14:16<20:09,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000107, train/loss_step=0.0253, global_step=2540.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  41%|████▏     | 501/1208 [14:16<20:09,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00194, train/loss_step=0.392, global_step=2541.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  42%|████▏     | 502/1208 [14:17<20:06,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00194, train/loss_step=0.392, global_step=2541.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  42%|████▏     | 502/1208 [14:17<20:06,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.25e-5, train/loss_step=0.00215, global_step=2541.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  42%|████▏     | 503/1208 [14:18<20:03,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.25e-5, train/loss_step=0.00215, global_step=2541.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  42%|████▏     | 503/1208 [14:18<20:03,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0892, train/loss_vlb_step=0.000294, train/loss_step=0.0892, global_step=2541.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  42%|████▏     | 504/1208 [14:22<20:04,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0892, train/loss_vlb_step=0.000294, train/loss_step=0.0892, global_step=2541.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  42%|████▏     | 504/1208 [14:22<20:04,  1.71s/it, loss=0.184, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000555, train/loss_step=0.168, global_step=2541.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  42%|████▏     | 505/1208 [14:23<20:01,  1.71s/it, loss=0.184, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000555, train/loss_step=0.168, global_step=2541.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  42%|████▏     | 505/1208 [14:23<20:01,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0552, train/loss_vlb_step=0.000192, train/loss_step=0.0552, global_step=2542.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  42%|████▏     | 506/1208 [14:24<19:59,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0552, train/loss_vlb_step=0.000192, train/loss_step=0.0552, global_step=2542.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  42%|████▏     | 506/1208 [14:24<19:59,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00433, train/loss_vlb_step=2.28e-5, train/loss_step=0.00433, global_step=2542.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  42%|████▏     | 507/1208 [14:25<19:56,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00433, train/loss_vlb_step=2.28e-5, train/loss_step=0.00433, global_step=2542.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  42%|████▏     | 507/1208 [14:25<19:56,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00118, train/loss_step=0.253, global_step=2542.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  42%|████▏     | 508/1208 [14:28<19:56,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00118, train/loss_step=0.253, global_step=2542.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  42%|████▏     | 508/1208 [14:28<19:56,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.000209, train/loss_step=0.0598, global_step=2542.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  42%|████▏     | 509/1208 [14:29<19:54,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.000209, train/loss_step=0.0598, global_step=2542.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  42%|████▏     | 509/1208 [14:29<19:54,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00363, train/loss_step=0.379, global_step=2543.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  42%|████▏     | 510/1208 [14:30<19:51,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00363, train/loss_step=0.379, global_step=2543.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  42%|████▏     | 510/1208 [14:30<19:51,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000974, train/loss_step=0.242, global_step=2543.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  42%|████▏     | 511/1208 [14:31<19:48,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000974, train/loss_step=0.242, global_step=2543.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  42%|████▏     | 511/1208 [14:31<19:48,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000701, train/loss_step=0.197, global_step=2543.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  42%|████▏     | 512/1208 [14:34<19:49,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000701, train/loss_step=0.197, global_step=2543.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  42%|████▏     | 512/1208 [14:34<19:49,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000547, train/loss_step=0.165, global_step=2543.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  42%|████▏     | 513/1208 [14:36<19:46,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000547, train/loss_step=0.165, global_step=2543.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  42%|████▏     | 513/1208 [14:36<19:46,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000416, train/loss_step=0.121, global_step=2544.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  43%|████▎     | 514/1208 [14:37<19:44,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000416, train/loss_step=0.121, global_step=2544.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  43%|████▎     | 514/1208 [14:37<19:44,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0862, train/loss_vlb_step=0.000286, train/loss_step=0.0862, global_step=2544.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  43%|████▎     | 515/1208 [14:38<19:41,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0862, train/loss_vlb_step=0.000286, train/loss_step=0.0862, global_step=2544.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  43%|████▎     | 515/1208 [14:38<19:41,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000122, train/loss_step=0.0332, global_step=2544.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  43%|████▎     | 516/1208 [14:41<19:41,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000122, train/loss_step=0.0332, global_step=2544.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  43%|████▎     | 516/1208 [14:41<19:41,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00987, train/loss_vlb_step=4.24e-5, train/loss_step=0.00987, global_step=2544.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  43%|████▎     | 517/1208 [14:42<19:39,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00987, train/loss_vlb_step=4.24e-5, train/loss_step=0.00987, global_step=2544.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  43%|████▎     | 517/1208 [14:42<19:39,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000115, train/loss_step=0.0304, global_step=2545.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  43%|████▎     | 518/1208 [14:43<19:36,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000115, train/loss_step=0.0304, global_step=2545.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  43%|████▎     | 518/1208 [14:43<19:36,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0563, train/loss_vlb_step=0.000201, train/loss_step=0.0563, global_step=2545.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  43%|████▎     | 519/1208 [14:44<19:34,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0563, train/loss_vlb_step=0.000201, train/loss_step=0.0563, global_step=2545.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  43%|████▎     | 519/1208 [14:44<19:34,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000129, train/loss_step=0.0339, global_step=2545.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  43%|████▎     | 520/1208 [14:47<19:34,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000129, train/loss_step=0.0339, global_step=2545.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  43%|████▎     | 520/1208 [14:47<19:34,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0886, train/loss_vlb_step=0.000293, train/loss_step=0.0886, global_step=2545.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  43%|████▎     | 521/1208 [14:48<19:32,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0886, train/loss_vlb_step=0.000293, train/loss_step=0.0886, global_step=2545.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  43%|████▎     | 521/1208 [14:48<19:32,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00122, train/loss_step=0.273, global_step=2546.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  43%|████▎     | 522/1208 [14:49<19:29,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00122, train/loss_step=0.273, global_step=2546.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  43%|████▎     | 522/1208 [14:49<19:29,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000578, train/loss_step=0.164, global_step=2546.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  43%|████▎     | 523/1208 [14:50<19:26,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000578, train/loss_step=0.164, global_step=2546.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  43%|████▎     | 523/1208 [14:50<19:26,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=6e-5, train/loss_step=0.0133, global_step=2546.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  43%|████▎     | 524/1208 [14:54<19:27,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=6e-5, train/loss_step=0.0133, global_step=2546.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  43%|████▎     | 524/1208 [14:54<19:27,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000533, train/loss_step=0.162, global_step=2546.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  43%|████▎     | 525/1208 [14:55<19:24,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000533, train/loss_step=0.162, global_step=2546.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  43%|████▎     | 525/1208 [14:55<19:24,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00101, train/loss_step=0.257, global_step=2547.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  44%|████▎     | 526/1208 [14:56<19:22,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00101, train/loss_step=0.257, global_step=2547.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  44%|████▎     | 526/1208 [14:56<19:22,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0039, train/loss_vlb_step=2.16e-5, train/loss_step=0.0039, global_step=2547.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  44%|████▎     | 527/1208 [14:57<19:19,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0039, train/loss_vlb_step=2.16e-5, train/loss_step=0.0039, global_step=2547.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  44%|████▎     | 527/1208 [14:57<19:19,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000186, train/loss_step=0.0525, global_step=2547.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  44%|████▎     | 528/1208 [15:00<19:19,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000186, train/loss_step=0.0525, global_step=2547.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  44%|████▎     | 528/1208 [15:00<19:19,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00171, train/loss_step=0.320, global_step=2547.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  44%|████▍     | 529/1208 [15:01<19:17,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00171, train/loss_step=0.320, global_step=2547.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  44%|████▍     | 529/1208 [15:01<19:17,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.56e-5, train/loss_step=0.010, global_step=2548.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  44%|████▍     | 530/1208 [15:02<19:14,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.56e-5, train/loss_step=0.010, global_step=2548.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  44%|████▍     | 530/1208 [15:02<19:14,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000679, train/loss_step=0.185, global_step=2548.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  44%|████▍     | 531/1208 [15:03<19:12,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000679, train/loss_step=0.185, global_step=2548.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  44%|████▍     | 531/1208 [15:03<19:12,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000566, train/loss_step=0.169, global_step=2548.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  44%|████▍     | 532/1208 [15:06<19:12,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000566, train/loss_step=0.169, global_step=2548.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  44%|████▍     | 532/1208 [15:06<19:12,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.51e-5, train/loss_step=0.0123, global_step=2548.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  44%|████▍     | 533/1208 [15:08<19:09,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.51e-5, train/loss_step=0.0123, global_step=2548.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  44%|████▍     | 533/1208 [15:08<19:09,  1.70s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.00595, train/loss_vlb_step=2.97e-5, train/loss_step=0.00595, global_step=2549.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  44%|████▍     | 534/1208 [15:09<19:07,  1.70s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.00595, train/loss_vlb_step=2.97e-5, train/loss_step=0.00595, global_step=2549.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  44%|████▍     | 534/1208 [15:09<19:07,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00122, train/loss_step=0.273, global_step=2549.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]     Epoch 8:  44%|████▍     | 535/1208 [15:10<19:04,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00122, train/loss_step=0.273, global_step=2549.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  44%|████▍     | 535/1208 [15:10<19:04,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0429, train/loss_vlb_step=0.000159, train/loss_step=0.0429, global_step=2549.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  44%|████▍     | 536/1208 [15:13<19:05,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0429, train/loss_vlb_step=0.000159, train/loss_step=0.0429, global_step=2549.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  44%|████▍     | 536/1208 [15:13<19:05,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0433, train/loss_vlb_step=0.000157, train/loss_step=0.0433, global_step=2549.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  44%|████▍     | 537/1208 [15:14<19:02,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0433, train/loss_vlb_step=0.000157, train/loss_step=0.0433, global_step=2549.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  44%|████▍     | 537/1208 [15:14<19:02,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000944, train/loss_step=0.248, global_step=2550.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  45%|████▍     | 538/1208 [15:15<19:00,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000944, train/loss_step=0.248, global_step=2550.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  45%|████▍     | 538/1208 [15:15<19:00,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00133, train/loss_step=0.276, global_step=2550.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  45%|████▍     | 539/1208 [15:16<18:57,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00133, train/loss_step=0.276, global_step=2550.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  45%|████▍     | 539/1208 [15:16<18:57,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.00039, train/loss_step=0.119, global_step=2550.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  45%|████▍     | 540/1208 [15:19<18:57,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.00039, train/loss_step=0.119, global_step=2550.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  45%|████▍     | 540/1208 [15:19<18:57,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.82e-5, train/loss_step=0.024, global_step=2550.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  45%|████▍     | 541/1208 [15:20<18:55,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.82e-5, train/loss_step=0.024, global_step=2550.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  45%|████▍     | 541/1208 [15:20<18:55,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0743, train/loss_vlb_step=0.000249, train/loss_step=0.0743, global_step=2551.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  45%|████▍     | 542/1208 [15:21<18:52,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0743, train/loss_vlb_step=0.000249, train/loss_step=0.0743, global_step=2551.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  45%|████▍     | 542/1208 [15:21<18:52,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000121, train/loss_step=0.0319, global_step=2551.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  45%|████▍     | 543/1208 [15:22<18:50,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000121, train/loss_step=0.0319, global_step=2551.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  45%|████▍     | 543/1208 [15:22<18:50,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0428, train/loss_vlb_step=0.000161, train/loss_step=0.0428, global_step=2551.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  45%|████▌     | 544/1208 [15:26<18:50,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0428, train/loss_vlb_step=0.000161, train/loss_step=0.0428, global_step=2551.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  45%|████▌     | 544/1208 [15:26<18:50,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0534, train/loss_vlb_step=0.000195, train/loss_step=0.0534, global_step=2551.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  45%|████▌     | 545/1208 [15:27<18:47,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0534, train/loss_vlb_step=0.000195, train/loss_step=0.0534, global_step=2551.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  45%|████▌     | 545/1208 [15:27<18:47,  1.70s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.25e-5, train/loss_step=0.0203, global_step=2552.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  45%|████▌     | 546/1208 [15:28<18:45,  1.70s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.25e-5, train/loss_step=0.0203, global_step=2552.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  45%|████▌     | 546/1208 [15:28<18:45,  1.70s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00477, train/loss_vlb_step=2.5e-5, train/loss_step=0.00477, global_step=2552.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  45%|████▌     | 547/1208 [15:29<18:42,  1.70s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00477, train/loss_vlb_step=2.5e-5, train/loss_step=0.00477, global_step=2552.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  45%|████▌     | 547/1208 [15:29<18:42,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.063, train/loss_vlb_step=0.000221, train/loss_step=0.063, global_step=2552.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  45%|████▌     | 548/1208 [15:32<18:43,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.063, train/loss_vlb_step=0.000221, train/loss_step=0.063, global_step=2552.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  45%|████▌     | 548/1208 [15:32<18:43,  1.70s/it, loss=0.0859, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.07e-5, train/loss_step=0.0202, global_step=2552.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  45%|████▌     | 549/1208 [15:33<18:40,  1.70s/it, loss=0.0859, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.07e-5, train/loss_step=0.0202, global_step=2552.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  45%|████▌     | 549/1208 [15:33<18:40,  1.70s/it, loss=0.086, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.5e-5, train/loss_step=0.0117, global_step=2553.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  46%|████▌     | 550/1208 [15:34<18:38,  1.70s/it, loss=0.086, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.5e-5, train/loss_step=0.0117, global_step=2553.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  46%|████▌     | 550/1208 [15:34<18:38,  1.70s/it, loss=0.0777, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.93e-5, train/loss_step=0.0188, global_step=2553.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  46%|████▌     | 551/1208 [15:35<18:35,  1.70s/it, loss=0.0777, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.93e-5, train/loss_step=0.0188, global_step=2553.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  46%|████▌     | 551/1208 [15:35<18:35,  1.70s/it, loss=0.0694, v_num=0, train/loss_simple_step=0.00346, train/loss_vlb_step=1.95e-5, train/loss_step=0.00346, global_step=2553.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  46%|████▌     | 552/1208 [15:38<18:35,  1.70s/it, loss=0.0694, v_num=0, train/loss_simple_step=0.00346, train/loss_vlb_step=1.95e-5, train/loss_step=0.00346, global_step=2553.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  46%|████▌     | 552/1208 [15:38<18:35,  1.70s/it, loss=0.069, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.54e-5, train/loss_step=0.00272, global_step=2553.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  46%|████▌     | 553/1208 [15:40<18:33,  1.70s/it, loss=0.069, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.54e-5, train/loss_step=0.00272, global_step=2553.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  46%|████▌     | 553/1208 [15:40<18:33,  1.70s/it, loss=0.0752, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000431, train/loss_step=0.131, global_step=2554.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  46%|████▌     | 554/1208 [15:41<18:30,  1.70s/it, loss=0.0752, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000431, train/loss_step=0.131, global_step=2554.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  46%|████▌     | 554/1208 [15:41<18:30,  1.70s/it, loss=0.0723, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000815, train/loss_step=0.215, global_step=2554.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  46%|████▌     | 555/1208 [15:42<18:28,  1.70s/it, loss=0.0723, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000815, train/loss_step=0.215, global_step=2554.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  46%|████▌     | 555/1208 [15:42<18:28,  1.70s/it, loss=0.0704, v_num=0, train/loss_simple_step=0.00547, train/loss_vlb_step=2.85e-5, train/loss_step=0.00547, global_step=2554.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  46%|████▌     | 556/1208 [15:45<18:28,  1.70s/it, loss=0.0704, v_num=0, train/loss_simple_step=0.00547, train/loss_vlb_step=2.85e-5, train/loss_step=0.00547, global_step=2554.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  46%|████▌     | 556/1208 [15:45<18:28,  1.70s/it, loss=0.069, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.59e-5, train/loss_step=0.015, global_step=2554.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]     Epoch 8:  46%|████▌     | 557/1208 [15:46<18:26,  1.70s/it, loss=0.069, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.59e-5, train/loss_step=0.015, global_step=2554.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  46%|████▌     | 557/1208 [15:46<18:26,  1.70s/it, loss=0.0597, v_num=0, train/loss_simple_step=0.0607, train/loss_vlb_step=0.000221, train/loss_step=0.0607, global_step=2555.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  46%|████▌     | 558/1208 [15:47<18:23,  1.70s/it, loss=0.0597, v_num=0, train/loss_simple_step=0.0607, train/loss_vlb_step=0.000221, train/loss_step=0.0607, global_step=2555.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  46%|████▌     | 558/1208 [15:47<18:23,  1.70s/it, loss=0.0497, v_num=0, train/loss_simple_step=0.0774, train/loss_vlb_step=0.000255, train/loss_step=0.0774, global_step=2555.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  46%|████▋     | 559/1208 [15:48<18:21,  1.70s/it, loss=0.0497, v_num=0, train/loss_simple_step=0.0774, train/loss_vlb_step=0.000255, train/loss_step=0.0774, global_step=2555.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  46%|████▋     | 559/1208 [15:48<18:21,  1.70s/it, loss=0.0723, v_num=0, train/loss_simple_step=0.570, train/loss_vlb_step=0.00958, train/loss_step=0.570, global_step=2555.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  46%|████▋     | 560/1208 [15:51<18:21,  1.70s/it, loss=0.0723, v_num=0, train/loss_simple_step=0.570, train/loss_vlb_step=0.00958, train/loss_step=0.570, global_step=2555.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  46%|████▋     | 560/1208 [15:51<18:21,  1.70s/it, loss=0.0742, v_num=0, train/loss_simple_step=0.0625, train/loss_vlb_step=0.000215, train/loss_step=0.0625, global_step=2555.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  46%|████▋     | 561/1208 [15:52<18:18,  1.70s/it, loss=0.0742, v_num=0, train/loss_simple_step=0.0625, train/loss_vlb_step=0.000215, train/loss_step=0.0625, global_step=2555.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  46%|████▋     | 561/1208 [15:52<18:18,  1.70s/it, loss=0.0799, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.00068, train/loss_step=0.187, global_step=2556.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  47%|████▋     | 562/1208 [15:53<18:16,  1.70s/it, loss=0.0799, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.00068, train/loss_step=0.187, global_step=2556.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  47%|████▋     | 562/1208 [15:53<18:16,  1.70s/it, loss=0.0816, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.000226, train/loss_step=0.067, global_step=2556.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  47%|████▋     | 563/1208 [15:54<18:14,  1.70s/it, loss=0.0816, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.000226, train/loss_step=0.067, global_step=2556.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  47%|████▋     | 563/1208 [15:54<18:14,  1.70s/it, loss=0.0796, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.13e-5, train/loss_step=0.00188, global_step=2556.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  47%|████▋     | 564/1208 [15:58<18:14,  1.70s/it, loss=0.0796, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.13e-5, train/loss_step=0.00188, global_step=2556.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  47%|████▋     | 564/1208 [15:58<18:14,  1.70s/it, loss=0.0782, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.84e-5, train/loss_step=0.0246, global_step=2556.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  47%|████▋     | 565/1208 [15:59<18:11,  1.70s/it, loss=0.0782, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.84e-5, train/loss_step=0.0246, global_step=2556.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  47%|████▋     | 565/1208 [15:59<18:11,  1.70s/it, loss=0.0795, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.00017, train/loss_step=0.0468, global_step=2557.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  47%|████▋     | 566/1208 [16:00<18:09,  1.70s/it, loss=0.0795, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.00017, train/loss_step=0.0468, global_step=2557.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  47%|████▋     | 566/1208 [16:00<18:09,  1.70s/it, loss=0.0927, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00129, train/loss_step=0.268, global_step=2557.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  47%|████▋     | 567/1208 [16:01<18:06,  1.70s/it, loss=0.0927, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00129, train/loss_step=0.268, global_step=2557.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  47%|████▋     | 567/1208 [16:01<18:06,  1.70s/it, loss=0.0907, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.48e-5, train/loss_step=0.0236, global_step=2557.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  47%|████▋     | 568/1208 [16:04<18:06,  1.70s/it, loss=0.0907, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.48e-5, train/loss_step=0.0236, global_step=2557.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  47%|████▋     | 568/1208 [16:04<18:06,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.0015, train/loss_step=0.295, global_step=2557.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  47%|████▋     | 569/1208 [16:05<18:04,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.0015, train/loss_step=0.295, global_step=2557.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  47%|████▋     | 569/1208 [16:05<18:04,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00663, train/loss_vlb_step=3.39e-5, train/loss_step=0.00663, global_step=2558.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  47%|████▋     | 570/1208 [16:06<18:02,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00663, train/loss_vlb_step=3.39e-5, train/loss_step=0.00663, global_step=2558.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  47%|████▋     | 570/1208 [16:06<18:02,  1.70s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0803, train/loss_vlb_step=0.000271, train/loss_step=0.0803, global_step=2558.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  47%|████▋     | 571/1208 [16:07<17:59,  1.70s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0803, train/loss_vlb_step=0.000271, train/loss_step=0.0803, global_step=2558.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  47%|████▋     | 571/1208 [16:07<17:59,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0494, train/loss_vlb_step=0.000179, train/loss_step=0.0494, global_step=2558.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  47%|████▋     | 572/1208 [16:11<17:59,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0494, train/loss_vlb_step=0.000179, train/loss_step=0.0494, global_step=2558.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  47%|████▋     | 572/1208 [16:11<17:59,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.755, train/loss_vlb_step=0.0553, train/loss_step=0.755, global_step=2558.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  47%|████▋     | 573/1208 [16:12<17:57,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.755, train/loss_vlb_step=0.0553, train/loss_step=0.755, global_step=2558.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  47%|████▋     | 573/1208 [16:12<17:57,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000163, train/loss_step=0.0448, global_step=2559.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  48%|████▊     | 574/1208 [16:13<17:54,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000163, train/loss_step=0.0448, global_step=2559.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  48%|████▊     | 574/1208 [16:13<17:54,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.523, train/loss_vlb_step=0.0093, train/loss_step=0.523, global_step=2559.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  48%|████▊     | 575/1208 [16:14<17:52,  1.69s/it, loss=0.158, v_num=0, train/loss_simple_step=0.523, train/loss_vlb_step=0.0093, train/loss_step=0.523, global_step=2559.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  48%|████▊     | 575/1208 [16:14<17:52,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.72e-5, train/loss_step=0.0146, global_step=2559.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  48%|████▊     | 576/1208 [16:17<17:52,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.72e-5, train/loss_step=0.0146, global_step=2559.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  48%|████▊     | 576/1208 [16:17<17:52,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000115, train/loss_step=0.0284, global_step=2559.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  48%|████▊     | 577/1208 [16:18<17:50,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000115, train/loss_step=0.0284, global_step=2559.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  48%|████▊     | 577/1208 [16:18<17:50,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000528, train/loss_step=0.154, global_step=2560.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  48%|████▊     | 578/1208 [16:19<17:47,  1.69s/it, loss=0.164, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000528, train/loss_step=0.154, global_step=2560.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  48%|████▊     | 578/1208 [16:19<17:47,  1.69s/it, loss=0.172, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000877, train/loss_step=0.239, global_step=2560.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  48%|████▊     | 579/1208 [16:20<17:45,  1.69s/it, loss=0.172, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000877, train/loss_step=0.239, global_step=2560.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  48%|████▊     | 579/1208 [16:20<17:45,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.000164, train/loss_step=0.0441, global_step=2560.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  48%|████▊     | 580/1208 [16:23<17:45,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.000164, train/loss_step=0.0441, global_step=2560.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  48%|████▊     | 580/1208 [16:23<17:45,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=3.11e-5, train/loss_step=0.00611, global_step=2560.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  48%|████▊     | 581/1208 [16:24<17:42,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=3.11e-5, train/loss_step=0.00611, global_step=2560.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  48%|████▊     | 581/1208 [16:24<17:42,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.49e-5, train/loss_step=0.0152, global_step=2561.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  48%|████▊     | 582/1208 [16:25<17:40,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.49e-5, train/loss_step=0.0152, global_step=2561.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  48%|████▊     | 582/1208 [16:25<17:40,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.00063, train/loss_step=0.169, global_step=2561.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  48%|████▊     | 583/1208 [16:27<17:38,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.00063, train/loss_step=0.169, global_step=2561.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  48%|████▊     | 583/1208 [16:27<17:38,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0776, train/loss_vlb_step=0.000264, train/loss_step=0.0776, global_step=2561.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  48%|████▊     | 584/1208 [16:30<17:38,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0776, train/loss_vlb_step=0.000264, train/loss_step=0.0776, global_step=2561.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  48%|████▊     | 584/1208 [16:30<17:38,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=1.33e-5, train/loss_step=0.00223, global_step=2561.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  48%|████▊     | 585/1208 [16:31<17:35,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=1.33e-5, train/loss_step=0.00223, global_step=2561.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  48%|████▊     | 585/1208 [16:31<17:35,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.000195, train/loss_step=0.0556, global_step=2562.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  49%|████▊     | 586/1208 [16:32<17:33,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.000195, train/loss_step=0.0556, global_step=2562.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  49%|████▊     | 586/1208 [16:32<17:33,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00102, train/loss_step=0.258, global_step=2562.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  49%|████▊     | 587/1208 [16:33<17:30,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00102, train/loss_step=0.258, global_step=2562.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  49%|████▊     | 587/1208 [16:33<17:30,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000163, train/loss_step=0.0437, global_step=2562.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  49%|████▊     | 588/1208 [16:36<17:30,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000163, train/loss_step=0.0437, global_step=2562.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  49%|████▊     | 588/1208 [16:36<17:30,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000113, train/loss_step=0.0298, global_step=2562.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  49%|████▉     | 589/1208 [16:37<17:28,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000113, train/loss_step=0.0298, global_step=2562.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  49%|████▉     | 589/1208 [16:37<17:28,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0423, train/loss_vlb_step=0.000156, train/loss_step=0.0423, global_step=2563.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  49%|████▉     | 590/1208 [16:38<17:26,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0423, train/loss_vlb_step=0.000156, train/loss_step=0.0423, global_step=2563.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  49%|████▉     | 590/1208 [16:38<17:26,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0896, train/loss_vlb_step=0.000296, train/loss_step=0.0896, global_step=2563.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  49%|████▉     | 591/1208 [16:39<17:23,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0896, train/loss_vlb_step=0.000296, train/loss_step=0.0896, global_step=2563.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  49%|████▉     | 591/1208 [16:39<17:23,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=2563.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  49%|████▉     | 592/1208 [16:43<17:23,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=2563.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  49%|████▉     | 592/1208 [16:43<17:23,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000573, train/loss_step=0.170, global_step=2563.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  49%|████▉     | 593/1208 [16:44<17:21,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000573, train/loss_step=0.170, global_step=2563.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  49%|████▉     | 593/1208 [16:44<17:21,  1.69s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0068, train/loss_vlb_step=3.52e-5, train/loss_step=0.0068, global_step=2564.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  49%|████▉     | 594/1208 [16:45<17:19,  1.69s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0068, train/loss_vlb_step=3.52e-5, train/loss_step=0.0068, global_step=2564.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  49%|████▉     | 594/1208 [16:45<17:19,  1.69s/it, loss=0.0805, v_num=0, train/loss_simple_step=0.0602, train/loss_vlb_step=0.000212, train/loss_step=0.0602, global_step=2564.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  49%|████▉     | 595/1208 [16:46<17:16,  1.69s/it, loss=0.0805, v_num=0, train/loss_simple_step=0.0602, train/loss_vlb_step=0.000212, train/loss_step=0.0602, global_step=2564.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  49%|████▉     | 595/1208 [16:46<17:16,  1.69s/it, loss=0.0825, v_num=0, train/loss_simple_step=0.0548, train/loss_vlb_step=0.000192, train/loss_step=0.0548, global_step=2564.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  49%|████▉     | 596/1208 [16:49<17:16,  1.69s/it, loss=0.0825, v_num=0, train/loss_simple_step=0.0548, train/loss_vlb_step=0.000192, train/loss_step=0.0548, global_step=2564.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  49%|████▉     | 596/1208 [16:49<17:16,  1.69s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00157, train/loss_step=0.313, global_step=2564.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  49%|████▉     | 597/1208 [16:50<17:14,  1.69s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00157, train/loss_step=0.313, global_step=2564.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  49%|████▉     | 597/1208 [16:50<17:14,  1.69s/it, loss=0.093, v_num=0, train/loss_simple_step=0.0793, train/loss_vlb_step=0.000267, train/loss_step=0.0793, global_step=2565.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  50%|████▉     | 598/1208 [16:51<17:11,  1.69s/it, loss=0.093, v_num=0, train/loss_simple_step=0.0793, train/loss_vlb_step=0.000267, train/loss_step=0.0793, global_step=2565.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  50%|████▉     | 598/1208 [16:51<17:11,  1.69s/it, loss=0.0892, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000569, train/loss_step=0.163, global_step=2565.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  50%|████▉     | 599/1208 [16:52<17:09,  1.69s/it, loss=0.0892, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000569, train/loss_step=0.163, global_step=2565.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  50%|████▉     | 599/1208 [16:52<17:09,  1.69s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000458, train/loss_step=0.132, global_step=2565.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  50%|████▉     | 600/1208 [16:55<17:09,  1.69s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000458, train/loss_step=0.132, global_step=2565.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  50%|████▉     | 600/1208 [16:55<17:09,  1.69s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.0496, train/loss_vlb_step=0.000179, train/loss_step=0.0496, global_step=2565.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.75it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.76it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.76it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.77it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.75it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.76it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.82it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.76it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.76it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.76it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.76it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.76it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.76it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.76it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.80it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.74it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.75it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.75it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.75it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.75it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.75it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.79it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.75it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.78it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:08,  1.74it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.73it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.75it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.74it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.76it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.75it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.75it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.78it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.75it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.78it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.75it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.78it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.78it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.81it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.75it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.75it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 8:  50%|████▉     | 601/1208 [17:26<17:36,  1.74s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.0496, train/loss_vlb_step=0.000179, train/loss_step=0.0496, global_step=2565.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  50%|████▉     | 601/1208 [17:26<17:36,  1.74s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.34e-5, train/loss_step=0.0123, global_step=2566.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  50%|████▉     | 602/1208 [17:27<17:34,  1.74s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.34e-5, train/loss_step=0.0123, global_step=2566.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  50%|████▉     | 602/1208 [17:27<17:34,  1.74s/it, loss=0.0876, v_num=0, train/loss_simple_step=0.00785, train/loss_vlb_step=4.01e-5, train/loss_step=0.00785, global_step=2566.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  50%|████▉     | 603/1208 [17:28<17:32,  1.74s/it, loss=0.0876, v_num=0, train/loss_simple_step=0.00785, train/loss_vlb_step=4.01e-5, train/loss_step=0.00785, global_step=2566.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  50%|████▉     | 603/1208 [17:28<17:32,  1.74s/it, loss=0.0904, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000447, train/loss_step=0.133, global_step=2566.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  50%|█████     | 604/1208 [17:31<17:31,  1.74s/it, loss=0.0904, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000447, train/loss_step=0.133, global_step=2566.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  50%|█████     | 604/1208 [17:31<17:31,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.482, train/loss_vlb_step=0.0064, train/loss_step=0.482, global_step=2566.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  50%|█████     | 605/1208 [17:32<17:29,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.482, train/loss_vlb_step=0.0064, train/loss_step=0.482, global_step=2566.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  50%|█████     | 605/1208 [17:32<17:29,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.21e-5, train/loss_step=0.0234, global_step=2567.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  50%|█████     | 606/1208 [17:33<17:26,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.21e-5, train/loss_step=0.0234, global_step=2567.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  50%|█████     | 606/1208 [17:33<17:26,  1.74s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00825, train/loss_vlb_step=4.03e-5, train/loss_step=0.00825, global_step=2567.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  50%|█████     | 607/1208 [17:34<17:24,  1.74s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00825, train/loss_vlb_step=4.03e-5, train/loss_step=0.00825, global_step=2567.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  50%|█████     | 607/1208 [17:34<17:24,  1.74s/it, loss=0.099, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.5e-5, train/loss_step=0.0179, global_step=2567.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  50%|█████     | 608/1208 [17:38<17:24,  1.74s/it, loss=0.099, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.5e-5, train/loss_step=0.0179, global_step=2567.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  50%|█████     | 608/1208 [17:38<17:24,  1.74s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.00414, train/loss_vlb_step=2.3e-5, train/loss_step=0.00414, global_step=2567.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  50%|█████     | 609/1208 [17:39<17:21,  1.74s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.00414, train/loss_vlb_step=2.3e-5, train/loss_step=0.00414, global_step=2567.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  50%|█████     | 609/1208 [17:39<17:21,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000571, train/loss_step=0.155, global_step=2568.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  50%|█████     | 610/1208 [17:40<17:19,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000571, train/loss_step=0.155, global_step=2568.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  50%|█████     | 610/1208 [17:40<17:19,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.588, train/loss_vlb_step=0.0115, train/loss_step=0.588, global_step=2568.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  51%|█████     | 611/1208 [17:41<17:16,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.588, train/loss_vlb_step=0.0115, train/loss_step=0.588, global_step=2568.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  51%|█████     | 611/1208 [17:41<17:16,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00162, train/loss_step=0.305, global_step=2568.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  51%|█████     | 612/1208 [17:44<17:16,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00162, train/loss_step=0.305, global_step=2568.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  51%|█████     | 612/1208 [17:44<17:16,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00127, train/loss_step=0.259, global_step=2568.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  51%|█████     | 613/1208 [17:45<17:14,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00127, train/loss_step=0.259, global_step=2568.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  51%|█████     | 613/1208 [17:45<17:14,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000158, train/loss_step=0.0437, global_step=2569.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  51%|█████     | 614/1208 [17:46<17:11,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000158, train/loss_step=0.0437, global_step=2569.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  51%|█████     | 614/1208 [17:46<17:11,  1.74s/it, loss=0.147, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000337, train/loss_step=0.102, global_step=2569.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  51%|█████     | 615/1208 [17:47<17:09,  1.74s/it, loss=0.147, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000337, train/loss_step=0.102, global_step=2569.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  51%|█████     | 615/1208 [17:47<17:09,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.93e-5, train/loss_step=0.0105, global_step=2569.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  51%|█████     | 616/1208 [17:50<17:09,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.93e-5, train/loss_step=0.0105, global_step=2569.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  51%|█████     | 616/1208 [17:50<17:09,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.000102, train/loss_step=0.0249, global_step=2569.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  51%|█████     | 617/1208 [17:51<17:06,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.000102, train/loss_step=0.0249, global_step=2569.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  51%|█████     | 617/1208 [17:51<17:06,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.574, train/loss_vlb_step=0.00691, train/loss_step=0.574, global_step=2570.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  51%|█████     | 618/1208 [17:52<17:04,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.574, train/loss_vlb_step=0.00691, train/loss_step=0.574, global_step=2570.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  51%|█████     | 618/1208 [17:52<17:04,  1.74s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=1.09e-5, train/loss_step=0.00185, global_step=2570.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  51%|█████     | 619/1208 [17:53<17:01,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=1.09e-5, train/loss_step=0.00185, global_step=2570.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  51%|█████     | 619/1208 [17:53<17:01,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00126, train/loss_step=0.265, global_step=2570.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  51%|█████▏    | 620/1208 [17:57<17:01,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00126, train/loss_step=0.265, global_step=2570.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  51%|█████▏    | 620/1208 [17:57<17:01,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000848, train/loss_step=0.222, global_step=2570.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  51%|█████▏    | 621/1208 [17:58<16:59,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000848, train/loss_step=0.222, global_step=2570.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  51%|█████▏    | 621/1208 [17:58<16:59,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.8e-5, train/loss_step=0.0107, global_step=2571.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  51%|█████▏    | 622/1208 [17:59<16:56,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.8e-5, train/loss_step=0.0107, global_step=2571.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  51%|█████▏    | 622/1208 [17:59<16:56,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.67e-5, train/loss_step=0.00299, global_step=2571.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  52%|█████▏    | 623/1208 [18:00<16:54,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.67e-5, train/loss_step=0.00299, global_step=2571.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  52%|█████▏    | 623/1208 [18:00<16:54,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000718, train/loss_step=0.199, global_step=2571.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  52%|█████▏    | 624/1208 [18:03<16:54,  1.74s/it, loss=0.165, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000718, train/loss_step=0.199, global_step=2571.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  52%|█████▏    | 624/1208 [18:03<16:54,  1.74s/it, loss=0.175, v_num=0, train/loss_simple_step=0.685, train/loss_vlb_step=0.044, train/loss_step=0.685, global_step=2571.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  52%|█████▏    | 625/1208 [18:04<16:51,  1.74s/it, loss=0.175, v_num=0, train/loss_simple_step=0.685, train/loss_vlb_step=0.044, train/loss_step=0.685, global_step=2571.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  52%|█████▏    | 625/1208 [18:04<16:51,  1.74s/it, loss=0.189, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00165, train/loss_step=0.303, global_step=2572.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  52%|█████▏    | 626/1208 [18:05<16:49,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00165, train/loss_step=0.303, global_step=2572.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  52%|█████▏    | 626/1208 [18:05<16:49,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00957, train/loss_vlb_step=4.67e-5, train/loss_step=0.00957, global_step=2572.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  52%|█████▏    | 627/1208 [18:06<16:47,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00957, train/loss_vlb_step=4.67e-5, train/loss_step=0.00957, global_step=2572.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  52%|█████▏    | 627/1208 [18:06<16:47,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.42e-5, train/loss_step=0.0216, global_step=2572.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  52%|█████▏    | 628/1208 [18:09<16:46,  1.74s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.42e-5, train/loss_step=0.0216, global_step=2572.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  52%|█████▏    | 628/1208 [18:09<16:46,  1.74s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000146, train/loss_step=0.0396, global_step=2572.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  52%|█████▏    | 629/1208 [18:11<16:44,  1.73s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000146, train/loss_step=0.0396, global_step=2572.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  52%|█████▏    | 629/1208 [18:11<16:44,  1.73s/it, loss=0.191, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000517, train/loss_step=0.153, global_step=2573.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  52%|█████▏    | 630/1208 [18:12<16:41,  1.73s/it, loss=0.191, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000517, train/loss_step=0.153, global_step=2573.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  52%|█████▏    | 630/1208 [18:12<16:41,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00243, train/loss_step=0.396, global_step=2573.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  52%|█████▏    | 631/1208 [18:13<16:39,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00243, train/loss_step=0.396, global_step=2573.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  52%|█████▏    | 631/1208 [18:13<16:39,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0608, train/loss_vlb_step=0.000219, train/loss_step=0.0608, global_step=2573.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  52%|█████▏    | 632/1208 [18:16<16:39,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0608, train/loss_vlb_step=0.000219, train/loss_step=0.0608, global_step=2573.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  52%|█████▏    | 632/1208 [18:16<16:39,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00136, train/loss_step=0.283, global_step=2573.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  52%|█████▏    | 633/1208 [18:17<16:36,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00136, train/loss_step=0.283, global_step=2573.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  52%|█████▏    | 633/1208 [18:17<16:36,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.52e-5, train/loss_step=0.0121, global_step=2574.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  52%|█████▏    | 634/1208 [18:18<16:34,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.52e-5, train/loss_step=0.0121, global_step=2574.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  52%|█████▏    | 634/1208 [18:18<16:34,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=9.87e-5, train/loss_step=0.0253, global_step=2574.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  53%|█████▎    | 635/1208 [18:19<16:32,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=9.87e-5, train/loss_step=0.0253, global_step=2574.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  53%|█████▎    | 635/1208 [18:19<16:32,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00869, train/loss_vlb_step=4.15e-5, train/loss_step=0.00869, global_step=2574.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  53%|█████▎    | 636/1208 [18:22<16:31,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00869, train/loss_vlb_step=4.15e-5, train/loss_step=0.00869, global_step=2574.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  53%|█████▎    | 636/1208 [18:22<16:31,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=7.96e-5, train/loss_step=0.0198, global_step=2574.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  53%|█████▎    | 637/1208 [18:23<16:29,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=7.96e-5, train/loss_step=0.0198, global_step=2574.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  53%|█████▎    | 637/1208 [18:23<16:29,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.635, train/loss_vlb_step=0.0113, train/loss_step=0.635, global_step=2575.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  53%|█████▎    | 638/1208 [18:24<16:27,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.635, train/loss_vlb_step=0.0113, train/loss_step=0.635, global_step=2575.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  53%|█████▎    | 638/1208 [18:24<16:27,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00293, train/loss_vlb_step=1.73e-5, train/loss_step=0.00293, global_step=2575.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  53%|█████▎    | 639/1208 [18:25<16:24,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00293, train/loss_vlb_step=1.73e-5, train/loss_step=0.00293, global_step=2575.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  53%|█████▎    | 639/1208 [18:25<16:24,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00112, train/loss_step=0.274, global_step=2575.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  53%|█████▎    | 640/1208 [18:29<16:24,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00112, train/loss_step=0.274, global_step=2575.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  53%|█████▎    | 640/1208 [18:29<16:24,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0561, train/loss_vlb_step=0.000203, train/loss_step=0.0561, global_step=2575.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  53%|█████▎    | 641/1208 [18:30<16:22,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0561, train/loss_vlb_step=0.000203, train/loss_step=0.0561, global_step=2575.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  53%|█████▎    | 641/1208 [18:30<16:22,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000667, train/loss_step=0.194, global_step=2576.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  53%|█████▎    | 642/1208 [18:31<16:19,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000667, train/loss_step=0.194, global_step=2576.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  53%|█████▎    | 642/1208 [18:31<16:19,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00123, train/loss_step=0.277, global_step=2576.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  53%|█████▎    | 643/1208 [18:32<16:17,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00123, train/loss_step=0.277, global_step=2576.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  53%|█████▎    | 643/1208 [18:32<16:17,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000114, train/loss_step=0.0288, global_step=2576.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  53%|█████▎    | 644/1208 [18:35<16:16,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000114, train/loss_step=0.0288, global_step=2576.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  53%|█████▎    | 644/1208 [18:35<16:16,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00943, train/loss_vlb_step=4.6e-5, train/loss_step=0.00943, global_step=2576.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  53%|█████▎    | 645/1208 [18:36<16:14,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00943, train/loss_vlb_step=4.6e-5, train/loss_step=0.00943, global_step=2576.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  53%|█████▎    | 645/1208 [18:36<16:14,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.078, train/loss_vlb_step=0.000268, train/loss_step=0.078, global_step=2577.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  53%|█████▎    | 646/1208 [18:37<16:12,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.078, train/loss_vlb_step=0.000268, train/loss_step=0.078, global_step=2577.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  53%|█████▎    | 646/1208 [18:37<16:12,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000348, train/loss_step=0.105, global_step=2577.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  54%|█████▎    | 647/1208 [18:38<16:09,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000348, train/loss_step=0.105, global_step=2577.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  54%|█████▎    | 647/1208 [18:38<16:09,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000682, train/loss_step=0.189, global_step=2577.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  54%|█████▎    | 648/1208 [18:41<16:09,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000682, train/loss_step=0.189, global_step=2577.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  54%|█████▎    | 648/1208 [18:41<16:09,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000127, train/loss_step=0.0314, global_step=2577.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  54%|█████▎    | 649/1208 [18:42<16:07,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000127, train/loss_step=0.0314, global_step=2577.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  54%|█████▎    | 649/1208 [18:42<16:07,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0432, train/loss_vlb_step=0.000157, train/loss_step=0.0432, global_step=2578.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  54%|█████▍    | 650/1208 [18:43<16:04,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0432, train/loss_vlb_step=0.000157, train/loss_step=0.0432, global_step=2578.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  54%|█████▍    | 650/1208 [18:43<16:04,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00139, train/loss_step=0.301, global_step=2578.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  54%|█████▍    | 651/1208 [18:45<16:02,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00139, train/loss_step=0.301, global_step=2578.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  54%|█████▍    | 651/1208 [18:45<16:02,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.747, train/loss_vlb_step=0.028, train/loss_step=0.747, global_step=2578.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  54%|█████▍    | 652/1208 [18:48<16:02,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.747, train/loss_vlb_step=0.028, train/loss_step=0.747, global_step=2578.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  54%|█████▍    | 652/1208 [18:48<16:02,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000655, train/loss_step=0.188, global_step=2578.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  54%|█████▍    | 653/1208 [18:49<15:59,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000655, train/loss_step=0.188, global_step=2578.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  54%|█████▍    | 653/1208 [18:49<15:59,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.63e-5, train/loss_step=0.0188, global_step=2579.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  54%|█████▍    | 654/1208 [18:50<15:57,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.63e-5, train/loss_step=0.0188, global_step=2579.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  54%|█████▍    | 654/1208 [18:50<15:57,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00346, train/loss_vlb_step=1.89e-5, train/loss_step=0.00346, global_step=2579.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  54%|█████▍    | 655/1208 [18:51<15:55,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00346, train/loss_vlb_step=1.89e-5, train/loss_step=0.00346, global_step=2579.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  54%|█████▍    | 655/1208 [18:51<15:55,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.479, train/loss_vlb_step=0.00458, train/loss_step=0.479, global_step=2579.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  54%|█████▍    | 656/1208 [18:54<15:54,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.479, train/loss_vlb_step=0.00458, train/loss_step=0.479, global_step=2579.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  54%|█████▍    | 656/1208 [18:54<15:54,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0546, train/loss_vlb_step=0.00019, train/loss_step=0.0546, global_step=2579.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  54%|█████▍    | 657/1208 [18:55<15:52,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0546, train/loss_vlb_step=0.00019, train/loss_step=0.0546, global_step=2579.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  54%|█████▍    | 657/1208 [18:55<15:52,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.03e-5, train/loss_step=0.0109, global_step=2580.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  54%|█████▍    | 658/1208 [18:56<15:50,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.03e-5, train/loss_step=0.0109, global_step=2580.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  54%|█████▍    | 658/1208 [18:56<15:50,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000403, train/loss_step=0.123, global_step=2580.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  55%|█████▍    | 659/1208 [18:57<15:47,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000403, train/loss_step=0.123, global_step=2580.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  55%|█████▍    | 659/1208 [18:57<15:47,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000805, train/loss_step=0.222, global_step=2580.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  55%|█████▍    | 660/1208 [19:01<15:47,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000805, train/loss_step=0.222, global_step=2580.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  55%|█████▍    | 660/1208 [19:01<15:47,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0645, train/loss_vlb_step=0.000225, train/loss_step=0.0645, global_step=2580.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  55%|█████▍    | 661/1208 [19:02<15:45,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0645, train/loss_vlb_step=0.000225, train/loss_step=0.0645, global_step=2580.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  55%|█████▍    | 661/1208 [19:02<15:45,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0841, train/loss_vlb_step=0.000277, train/loss_step=0.0841, global_step=2581.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  55%|█████▍    | 662/1208 [19:03<15:42,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0841, train/loss_vlb_step=0.000277, train/loss_step=0.0841, global_step=2581.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  55%|█████▍    | 662/1208 [19:03<15:42,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.21e-5, train/loss_step=0.0117, global_step=2581.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  55%|█████▍    | 663/1208 [19:04<15:40,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.21e-5, train/loss_step=0.0117, global_step=2581.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  55%|█████▍    | 663/1208 [19:04<15:40,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00143, train/loss_step=0.277, global_step=2581.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  55%|█████▍    | 664/1208 [19:07<15:40,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00143, train/loss_step=0.277, global_step=2581.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  55%|█████▍    | 664/1208 [19:07<15:40,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.2e-5, train/loss_step=0.002, global_step=2581.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  55%|█████▌    | 665/1208 [19:08<15:37,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.2e-5, train/loss_step=0.002, global_step=2581.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  55%|█████▌    | 665/1208 [19:08<15:37,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00314, train/loss_vlb_step=1.78e-5, train/loss_step=0.00314, global_step=2582.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  55%|█████▌    | 666/1208 [19:09<15:35,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00314, train/loss_vlb_step=1.78e-5, train/loss_step=0.00314, global_step=2582.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  55%|█████▌    | 666/1208 [19:09<15:35,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00158, train/loss_step=0.313, global_step=2582.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  55%|█████▌    | 667/1208 [19:10<15:33,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00158, train/loss_step=0.313, global_step=2582.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  55%|█████▌    | 667/1208 [19:10<15:33,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00693, train/loss_vlb_step=3.49e-5, train/loss_step=0.00693, global_step=2582.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  55%|█████▌    | 668/1208 [19:13<15:32,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00693, train/loss_vlb_step=3.49e-5, train/loss_step=0.00693, global_step=2582.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  55%|█████▌    | 668/1208 [19:13<15:32,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0051, train/loss_vlb_step=2.66e-5, train/loss_step=0.0051, global_step=2582.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  55%|█████▌    | 669/1208 [19:14<15:30,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0051, train/loss_vlb_step=2.66e-5, train/loss_step=0.0051, global_step=2582.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  55%|█████▌    | 669/1208 [19:14<15:30,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00151, train/loss_step=0.300, global_step=2583.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  55%|█████▌    | 670/1208 [19:16<15:28,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00151, train/loss_step=0.300, global_step=2583.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  55%|█████▌    | 670/1208 [19:16<15:28,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000764, train/loss_step=0.206, global_step=2583.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  56%|█████▌    | 671/1208 [19:17<15:25,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000764, train/loss_step=0.206, global_step=2583.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  56%|█████▌    | 671/1208 [19:17<15:25,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00162, train/loss_step=0.308, global_step=2583.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  56%|█████▌    | 672/1208 [19:20<15:25,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00162, train/loss_step=0.308, global_step=2583.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  56%|█████▌    | 672/1208 [19:20<15:25,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.7e-5, train/loss_step=0.0246, global_step=2583.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  56%|█████▌    | 673/1208 [19:21<15:23,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.7e-5, train/loss_step=0.0246, global_step=2583.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  56%|█████▌    | 673/1208 [19:21<15:23,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.00051, train/loss_step=0.152, global_step=2584.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  56%|█████▌    | 674/1208 [19:22<15:20,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.00051, train/loss_step=0.152, global_step=2584.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  56%|█████▌    | 674/1208 [19:22<15:20,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00993, train/loss_vlb_step=4.86e-5, train/loss_step=0.00993, global_step=2584.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  56%|█████▌    | 675/1208 [19:23<15:18,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00993, train/loss_vlb_step=4.86e-5, train/loss_step=0.00993, global_step=2584.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  56%|█████▌    | 675/1208 [19:23<15:18,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0531, train/loss_vlb_step=0.000191, train/loss_step=0.0531, global_step=2584.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  56%|█████▌    | 676/1208 [19:26<15:18,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0531, train/loss_vlb_step=0.000191, train/loss_step=0.0531, global_step=2584.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  56%|█████▌    | 676/1208 [19:26<15:18,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.99e-5, train/loss_step=0.011, global_step=2584.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  56%|█████▌    | 677/1208 [19:27<15:15,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.99e-5, train/loss_step=0.011, global_step=2584.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  56%|█████▌    | 677/1208 [19:27<15:15,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0481, train/loss_vlb_step=0.000175, train/loss_step=0.0481, global_step=2585.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  56%|█████▌    | 678/1208 [19:28<15:13,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0481, train/loss_vlb_step=0.000175, train/loss_step=0.0481, global_step=2585.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  56%|█████▌    | 678/1208 [19:28<15:13,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.058, train/loss_vlb_step=0.000203, train/loss_step=0.058, global_step=2585.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  56%|█████▌    | 679/1208 [19:29<15:11,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.058, train/loss_vlb_step=0.000203, train/loss_step=0.058, global_step=2585.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  56%|█████▌    | 679/1208 [19:29<15:11,  1.72s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000109, train/loss_step=0.0263, global_step=2585.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  56%|█████▋    | 680/1208 [19:33<15:10,  1.73s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000109, train/loss_step=0.0263, global_step=2585.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  56%|█████▋    | 680/1208 [19:33<15:10,  1.73s/it, loss=0.1, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=2585.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]     Epoch 8:  56%|█████▋    | 681/1208 [19:34<15:08,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=2585.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  56%|█████▋    | 681/1208 [19:34<15:08,  1.72s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.66e-5, train/loss_step=0.00289, global_step=2586.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  56%|█████▋    | 682/1208 [19:35<15:06,  1.72s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.66e-5, train/loss_step=0.00289, global_step=2586.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  56%|█████▋    | 682/1208 [19:35<15:06,  1.72s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.0774, train/loss_vlb_step=0.000256, train/loss_step=0.0774, global_step=2586.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  57%|█████▋    | 683/1208 [19:36<15:04,  1.72s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.0774, train/loss_vlb_step=0.000256, train/loss_step=0.0774, global_step=2586.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  57%|█████▋    | 683/1208 [19:36<15:04,  1.72s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000428, train/loss_step=0.127, global_step=2586.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  57%|█████▋    | 684/1208 [19:39<15:03,  1.72s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000428, train/loss_step=0.127, global_step=2586.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  57%|█████▋    | 684/1208 [19:39<15:03,  1.72s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.47e-5, train/loss_step=0.00248, global_step=2586.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  57%|█████▋    | 685/1208 [19:40<15:01,  1.72s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.47e-5, train/loss_step=0.00248, global_step=2586.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  57%|█████▋    | 685/1208 [19:40<15:01,  1.72s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000472, train/loss_step=0.144, global_step=2587.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  57%|█████▋    | 686/1208 [19:41<14:59,  1.72s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000472, train/loss_step=0.144, global_step=2587.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  57%|█████▋    | 686/1208 [19:41<14:59,  1.72s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.0597, train/loss_vlb_step=0.00021, train/loss_step=0.0597, global_step=2587.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  57%|█████▋    | 687/1208 [19:42<14:56,  1.72s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.0597, train/loss_vlb_step=0.00021, train/loss_step=0.0597, global_step=2587.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  57%|█████▋    | 687/1208 [19:42<14:56,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00122, train/loss_step=0.285, global_step=2587.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]     Epoch 8:  57%|█████▋    | 688/1208 [19:45<14:56,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00122, train/loss_step=0.285, global_step=2587.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  57%|█████▋    | 688/1208 [19:45<14:56,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.00084, train/loss_step=0.223, global_step=2587.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  57%|█████▋    | 689/1208 [19:46<14:54,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.00084, train/loss_step=0.223, global_step=2587.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  57%|█████▋    | 689/1208 [19:46<14:54,  1.72s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.036, train/loss_vlb_step=0.000136, train/loss_step=0.036, global_step=2588.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  57%|█████▋    | 690/1208 [19:47<14:51,  1.72s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.036, train/loss_vlb_step=0.000136, train/loss_step=0.036, global_step=2588.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  57%|█████▋    | 690/1208 [19:47<14:51,  1.72s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000493, train/loss_step=0.148, global_step=2588.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  57%|█████▋    | 691/1208 [19:48<14:49,  1.72s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000493, train/loss_step=0.148, global_step=2588.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  57%|█████▋    | 691/1208 [19:48<14:49,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00519, train/loss_step=0.476, global_step=2588.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  57%|█████▋    | 692/1208 [19:52<14:48,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00519, train/loss_step=0.476, global_step=2588.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  57%|█████▋    | 692/1208 [19:52<14:48,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000132, train/loss_step=0.0378, global_step=2588.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  57%|█████▋    | 693/1208 [19:53<14:46,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000132, train/loss_step=0.0378, global_step=2588.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  57%|█████▋    | 693/1208 [19:53<14:46,  1.72s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.0303, train/loss_vlb_step=0.000116, train/loss_step=0.0303, global_step=2589.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  57%|█████▋    | 694/1208 [19:54<14:44,  1.72s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.0303, train/loss_vlb_step=0.000116, train/loss_step=0.0303, global_step=2589.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  57%|█████▋    | 694/1208 [19:54<14:44,  1.72s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.96e-5, train/loss_step=0.00557, global_step=2589.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  58%|█████▊    | 695/1208 [19:55<14:42,  1.72s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.96e-5, train/loss_step=0.00557, global_step=2589.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  58%|█████▊    | 695/1208 [19:55<14:42,  1.72s/it, loss=0.0952, v_num=0, train/loss_simple_step=0.00509, train/loss_vlb_step=2.72e-5, train/loss_step=0.00509, global_step=2589.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  58%|█████▊    | 696/1208 [19:58<14:41,  1.72s/it, loss=0.0952, v_num=0, train/loss_simple_step=0.00509, train/loss_vlb_step=2.72e-5, train/loss_step=0.00509, global_step=2589.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  58%|█████▊    | 696/1208 [19:58<14:41,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000382, train/loss_step=0.114, global_step=2589.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]      Epoch 8:  58%|█████▊    | 697/1208 [19:59<14:39,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000382, train/loss_step=0.114, global_step=2589.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  58%|█████▊    | 697/1208 [19:59<14:39,  1.72s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.16e-5, train/loss_step=0.00191, global_step=2590.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  58%|█████▊    | 698/1208 [20:00<14:37,  1.72s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.16e-5, train/loss_step=0.00191, global_step=2590.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  58%|█████▊    | 698/1208 [20:00<14:37,  1.72s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.000215, train/loss_step=0.062, global_step=2590.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  58%|█████▊    | 699/1208 [20:01<14:35,  1.72s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.000215, train/loss_step=0.062, global_step=2590.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  58%|█████▊    | 699/1208 [20:01<14:35,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000991, train/loss_step=0.232, global_step=2590.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  58%|█████▊    | 700/1208 [20:04<14:34,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000991, train/loss_step=0.232, global_step=2590.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  58%|█████▊    | 700/1208 [20:04<14:34,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0877, train/loss_vlb_step=0.00029, train/loss_step=0.0877, global_step=2590.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  58%|█████▊    | 701/1208 [20:06<14:32,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0877, train/loss_vlb_step=0.00029, train/loss_step=0.0877, global_step=2590.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  58%|█████▊    | 701/1208 [20:06<14:32,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00673, train/loss_vlb_step=3.39e-5, train/loss_step=0.00673, global_step=2591.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  58%|█████▊    | 702/1208 [20:07<14:30,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00673, train/loss_vlb_step=3.39e-5, train/loss_step=0.00673, global_step=2591.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  58%|█████▊    | 702/1208 [20:07<14:30,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00516, train/loss_vlb_step=2.77e-5, train/loss_step=0.00516, global_step=2591.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  58%|█████▊    | 703/1208 [20:08<14:27,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00516, train/loss_vlb_step=2.77e-5, train/loss_step=0.00516, global_step=2591.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  58%|█████▊    | 703/1208 [20:08<14:27,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00186, train/loss_step=0.310, global_step=2591.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  58%|█████▊    | 704/1208 [20:11<14:27,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00186, train/loss_step=0.310, global_step=2591.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  58%|█████▊    | 704/1208 [20:11<14:27,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00232, train/loss_step=0.392, global_step=2591.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  58%|█████▊    | 705/1208 [20:12<14:25,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00232, train/loss_step=0.392, global_step=2591.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  58%|█████▊    | 705/1208 [20:12<14:25,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.566, train/loss_vlb_step=0.0118, train/loss_step=0.566, global_step=2592.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  58%|█████▊    | 706/1208 [20:13<14:22,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.566, train/loss_vlb_step=0.0118, train/loss_step=0.566, global_step=2592.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  58%|█████▊    | 706/1208 [20:13<14:22,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0937, train/loss_vlb_step=0.000308, train/loss_step=0.0937, global_step=2592.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  59%|█████▊    | 707/1208 [20:14<14:20,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0937, train/loss_vlb_step=0.000308, train/loss_step=0.0937, global_step=2592.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  59%|█████▊    | 707/1208 [20:14<14:20,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.00057, train/loss_step=0.166, global_step=2592.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  59%|█████▊    | 708/1208 [20:17<14:19,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.00057, train/loss_step=0.166, global_step=2592.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  59%|█████▊    | 708/1208 [20:17<14:20,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00121, train/loss_step=0.298, global_step=2592.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  59%|█████▊    | 709/1208 [20:18<14:17,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00121, train/loss_step=0.298, global_step=2592.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  59%|█████▊    | 709/1208 [20:18<14:17,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0318, train/loss_vlb_step=0.000126, train/loss_step=0.0318, global_step=2593.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  59%|█████▉    | 710/1208 [20:19<14:15,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0318, train/loss_vlb_step=0.000126, train/loss_step=0.0318, global_step=2593.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  59%|█████▉    | 710/1208 [20:19<14:15,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0091, train/loss_vlb_step=4.22e-5, train/loss_step=0.0091, global_step=2593.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  59%|█████▉    | 711/1208 [20:20<14:13,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0091, train/loss_vlb_step=4.22e-5, train/loss_step=0.0091, global_step=2593.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  59%|█████▉    | 711/1208 [20:20<14:13,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00178, train/loss_step=0.319, global_step=2593.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  59%|█████▉    | 712/1208 [20:24<14:12,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00178, train/loss_step=0.319, global_step=2593.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  59%|█████▉    | 712/1208 [20:24<14:12,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.38e-5, train/loss_step=0.0116, global_step=2593.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  59%|█████▉    | 713/1208 [20:25<14:10,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.38e-5, train/loss_step=0.0116, global_step=2593.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  59%|█████▉    | 713/1208 [20:25<14:10,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.00052, train/loss_step=0.154, global_step=2594.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  59%|█████▉    | 714/1208 [20:26<14:08,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.00052, train/loss_step=0.154, global_step=2594.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  59%|█████▉    | 714/1208 [20:26<14:08,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.48e-5, train/loss_step=0.0233, global_step=2594.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  59%|█████▉    | 715/1208 [20:27<14:06,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.48e-5, train/loss_step=0.0233, global_step=2594.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  59%|█████▉    | 715/1208 [20:27<14:06,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.00814, train/loss_step=0.485, global_step=2594.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  59%|█████▉    | 716/1208 [20:30<14:05,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.00814, train/loss_step=0.485, global_step=2594.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  59%|█████▉    | 716/1208 [20:30<14:05,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000419, train/loss_step=0.128, global_step=2594.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  59%|█████▉    | 717/1208 [20:31<14:03,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000419, train/loss_step=0.128, global_step=2594.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  59%|█████▉    | 717/1208 [20:31<14:03,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000489, train/loss_step=0.148, global_step=2595.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  59%|█████▉    | 718/1208 [20:32<14:01,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000489, train/loss_step=0.148, global_step=2595.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  59%|█████▉    | 718/1208 [20:32<14:01,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.000115, train/loss_step=0.0292, global_step=2595.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  60%|█████▉    | 719/1208 [20:33<13:59,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.000115, train/loss_step=0.0292, global_step=2595.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  60%|█████▉    | 719/1208 [20:33<13:59,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.85e-5, train/loss_step=0.0104, global_step=2595.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  60%|█████▉    | 720/1208 [20:36<13:58,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.85e-5, train/loss_step=0.0104, global_step=2595.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  60%|█████▉    | 720/1208 [20:36<13:58,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.88e-5, train/loss_step=0.0164, global_step=2595.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  60%|█████▉    | 721/1208 [20:38<13:56,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.88e-5, train/loss_step=0.0164, global_step=2595.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  60%|█████▉    | 721/1208 [20:38<13:56,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.000107, train/loss_step=0.0256, global_step=2596.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  60%|█████▉    | 722/1208 [20:39<13:54,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.000107, train/loss_step=0.0256, global_step=2596.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  60%|█████▉    | 722/1208 [20:39<13:54,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000567, train/loss_step=0.163, global_step=2596.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  60%|█████▉    | 723/1208 [20:40<13:51,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000567, train/loss_step=0.163, global_step=2596.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  60%|█████▉    | 723/1208 [20:40<13:51,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.24e-5, train/loss_step=0.00209, global_step=2596.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  60%|█████▉    | 724/1208 [20:43<13:51,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.24e-5, train/loss_step=0.00209, global_step=2596.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  60%|█████▉    | 724/1208 [20:43<13:51,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000406, train/loss_step=0.123, global_step=2596.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  60%|██████    | 725/1208 [20:44<13:49,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000406, train/loss_step=0.123, global_step=2596.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  60%|██████    | 725/1208 [20:44<13:49,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.00064, train/loss_step=0.181, global_step=2597.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  60%|██████    | 726/1208 [20:45<13:46,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.00064, train/loss_step=0.181, global_step=2597.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  60%|██████    | 726/1208 [20:45<13:46,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00873, train/loss_vlb_step=4.28e-5, train/loss_step=0.00873, global_step=2597.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  60%|██████    | 727/1208 [20:46<13:44,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00873, train/loss_vlb_step=4.28e-5, train/loss_step=0.00873, global_step=2597.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  60%|██████    | 727/1208 [20:46<13:44,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000656, train/loss_step=0.181, global_step=2597.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  60%|██████    | 728/1208 [20:49<13:43,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000656, train/loss_step=0.181, global_step=2597.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  60%|██████    | 728/1208 [20:49<13:43,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00533, train/loss_vlb_step=2.79e-5, train/loss_step=0.00533, global_step=2597.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  60%|██████    | 729/1208 [20:50<13:41,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00533, train/loss_vlb_step=2.79e-5, train/loss_step=0.00533, global_step=2597.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  60%|██████    | 729/1208 [20:50<13:41,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000105, train/loss_step=0.0258, global_step=2598.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  60%|██████    | 730/1208 [20:51<13:39,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000105, train/loss_step=0.0258, global_step=2598.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  60%|██████    | 730/1208 [20:51<13:39,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0574, train/loss_vlb_step=0.000203, train/loss_step=0.0574, global_step=2598.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  61%|██████    | 731/1208 [20:52<13:37,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0574, train/loss_vlb_step=0.000203, train/loss_step=0.0574, global_step=2598.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  61%|██████    | 731/1208 [20:52<13:37,  1.71s/it, loss=0.09, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=8.7e-5, train/loss_step=0.022, global_step=2598.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]     Epoch 8:  61%|██████    | 732/1208 [20:56<13:36,  1.72s/it, loss=0.09, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=8.7e-5, train/loss_step=0.022, global_step=2598.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  61%|██████    | 732/1208 [20:56<13:36,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00115, train/loss_step=0.300, global_step=2598.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  61%|██████    | 733/1208 [20:57<13:34,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00115, train/loss_step=0.300, global_step=2598.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  61%|██████    | 733/1208 [20:57<13:34,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00388, train/loss_step=0.411, global_step=2599.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  61%|██████    | 734/1208 [20:58<13:32,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00388, train/loss_step=0.411, global_step=2599.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  61%|██████    | 734/1208 [20:58<13:32,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0995, train/loss_vlb_step=0.000327, train/loss_step=0.0995, global_step=2599.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  61%|██████    | 735/1208 [20:59<13:30,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0995, train/loss_vlb_step=0.000327, train/loss_step=0.0995, global_step=2599.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  61%|██████    | 735/1208 [20:59<13:30,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.587, train/loss_vlb_step=0.00795, train/loss_step=0.587, global_step=2599.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  61%|██████    | 736/1208 [21:02<13:29,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.587, train/loss_vlb_step=0.00795, train/loss_step=0.587, global_step=2599.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  61%|██████    | 736/1208 [21:02<13:29,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000445, train/loss_step=0.135, global_step=2599.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  61%|██████    | 737/1208 [21:03<13:27,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000445, train/loss_step=0.135, global_step=2599.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  61%|██████    | 737/1208 [21:03<13:27,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.63e-5, train/loss_step=0.0213, global_step=2600.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  61%|██████    | 738/1208 [21:04<13:25,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.63e-5, train/loss_step=0.0213, global_step=2600.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  61%|██████    | 738/1208 [21:04<13:25,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000962, train/loss_step=0.246, global_step=2600.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  61%|██████    | 739/1208 [21:05<13:23,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000962, train/loss_step=0.246, global_step=2600.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  61%|██████    | 739/1208 [21:05<13:23,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00167, train/loss_step=0.322, global_step=2600.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  61%|██████▏   | 740/1208 [21:08<13:22,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00167, train/loss_step=0.322, global_step=2600.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  61%|██████▏   | 740/1208 [21:08<13:22,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=2600.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  61%|██████▏   | 741/1208 [21:09<13:20,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=2600.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  61%|██████▏   | 741/1208 [21:09<13:20,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000704, train/loss_step=0.201, global_step=2601.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  61%|██████▏   | 742/1208 [21:10<13:18,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000704, train/loss_step=0.201, global_step=2601.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  61%|██████▏   | 742/1208 [21:10<13:18,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000619, train/loss_step=0.172, global_step=2601.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  62%|██████▏   | 743/1208 [21:12<13:16,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000619, train/loss_step=0.172, global_step=2601.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  62%|██████▏   | 743/1208 [21:12<13:16,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0847, train/loss_vlb_step=0.000282, train/loss_step=0.0847, global_step=2601.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  62%|██████▏   | 744/1208 [21:15<13:15,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0847, train/loss_vlb_step=0.000282, train/loss_step=0.0847, global_step=2601.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  62%|██████▏   | 744/1208 [21:15<13:15,  1.71s/it, loss=0.175, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00143, train/loss_step=0.302, global_step=2601.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  62%|██████▏   | 745/1208 [21:16<13:13,  1.71s/it, loss=0.175, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00143, train/loss_step=0.302, global_step=2601.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  62%|██████▏   | 745/1208 [21:16<13:13,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000535, train/loss_step=0.159, global_step=2602.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  62%|██████▏   | 746/1208 [21:17<13:11,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000535, train/loss_step=0.159, global_step=2602.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  62%|██████▏   | 746/1208 [21:17<13:11,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.86e-5, train/loss_step=0.00335, global_step=2602.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  62%|██████▏   | 747/1208 [21:18<13:08,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.86e-5, train/loss_step=0.00335, global_step=2602.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  62%|██████▏   | 747/1208 [21:18<13:08,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00602, train/loss_vlb_step=3.11e-5, train/loss_step=0.00602, global_step=2602.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  62%|██████▏   | 748/1208 [21:21<13:08,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00602, train/loss_vlb_step=3.11e-5, train/loss_step=0.00602, global_step=2602.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  62%|██████▏   | 748/1208 [21:21<13:08,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.69e-5, train/loss_step=0.0029, global_step=2602.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  62%|██████▏   | 749/1208 [21:22<13:06,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.69e-5, train/loss_step=0.0029, global_step=2602.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  62%|██████▏   | 749/1208 [21:22<13:06,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000737, train/loss_step=0.207, global_step=2603.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  62%|██████▏   | 750/1208 [21:23<13:03,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000737, train/loss_step=0.207, global_step=2603.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  62%|██████▏   | 750/1208 [21:23<13:03,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=2603.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  62%|██████▏   | 751/1208 [21:24<13:01,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=2603.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  62%|██████▏   | 751/1208 [21:24<13:01,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.000177, train/loss_step=0.0508, global_step=2603.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  62%|██████▏   | 752/1208 [21:27<13:01,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.000177, train/loss_step=0.0508, global_step=2603.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  62%|██████▏   | 752/1208 [21:27<13:01,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000134, train/loss_step=0.0365, global_step=2603.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  62%|██████▏   | 753/1208 [21:29<12:58,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000134, train/loss_step=0.0365, global_step=2603.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  62%|██████▏   | 753/1208 [21:29<12:58,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000574, train/loss_step=0.163, global_step=2604.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  62%|██████▏   | 754/1208 [21:30<12:56,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000574, train/loss_step=0.163, global_step=2604.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  62%|██████▏   | 754/1208 [21:30<12:56,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000596, train/loss_step=0.174, global_step=2604.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  62%|██████▎   | 755/1208 [21:31<12:54,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000596, train/loss_step=0.174, global_step=2604.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  62%|██████▎   | 755/1208 [21:31<12:54,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00447, train/loss_vlb_step=2.39e-5, train/loss_step=0.00447, global_step=2604.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  63%|██████▎   | 756/1208 [21:34<12:53,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00447, train/loss_vlb_step=2.39e-5, train/loss_step=0.00447, global_step=2604.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  63%|██████▎   | 756/1208 [21:34<12:53,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000412, train/loss_step=0.126, global_step=2604.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  63%|██████▎   | 757/1208 [21:35<12:51,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000412, train/loss_step=0.126, global_step=2604.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  63%|██████▎   | 757/1208 [21:35<12:51,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000774, train/loss_step=0.205, global_step=2605.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  63%|██████▎   | 758/1208 [21:36<12:49,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000774, train/loss_step=0.205, global_step=2605.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  63%|██████▎   | 758/1208 [21:36<12:49,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.86e-5, train/loss_step=0.0185, global_step=2605.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  63%|██████▎   | 759/1208 [21:37<12:47,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.86e-5, train/loss_step=0.0185, global_step=2605.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  63%|██████▎   | 759/1208 [21:37<12:47,  1.71s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0432, train/loss_vlb_step=0.00016, train/loss_step=0.0432, global_step=2605.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  63%|██████▎   | 760/1208 [21:40<12:46,  1.71s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0432, train/loss_vlb_step=0.00016, train/loss_step=0.0432, global_step=2605.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  63%|██████▎   | 760/1208 [21:40<12:46,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00101, train/loss_step=0.264, global_step=2605.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  63%|██████▎   | 761/1208 [21:41<12:44,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00101, train/loss_step=0.264, global_step=2605.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  63%|██████▎   | 761/1208 [21:41<12:44,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00967, train/loss_vlb_step=4.75e-5, train/loss_step=0.00967, global_step=2606.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  63%|██████▎   | 762/1208 [21:42<12:42,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00967, train/loss_vlb_step=4.75e-5, train/loss_step=0.00967, global_step=2606.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  63%|██████▎   | 762/1208 [21:42<12:42,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00349, train/loss_step=0.434, global_step=2606.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]     Epoch 8:  63%|██████▎   | 763/1208 [21:43<12:40,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00349, train/loss_step=0.434, global_step=2606.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  63%|██████▎   | 763/1208 [21:43<12:40,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00125, train/loss_step=0.252, global_step=2606.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  63%|██████▎   | 764/1208 [21:47<12:39,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00125, train/loss_step=0.252, global_step=2606.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  63%|██████▎   | 764/1208 [21:47<12:39,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000172, train/loss_step=0.0463, global_step=2606.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  63%|██████▎   | 765/1208 [21:48<12:37,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000172, train/loss_step=0.0463, global_step=2606.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  63%|██████▎   | 765/1208 [21:48<12:37,  1.71s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0823, train/loss_vlb_step=0.000277, train/loss_step=0.0823, global_step=2607.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  63%|██████▎   | 766/1208 [21:49<12:35,  1.71s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0823, train/loss_vlb_step=0.000277, train/loss_step=0.0823, global_step=2607.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  63%|██████▎   | 766/1208 [21:49<12:35,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=2607.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  63%|██████▎   | 767/1208 [21:50<12:33,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=2607.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  63%|██████▎   | 767/1208 [21:50<12:33,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00319, train/loss_step=0.385, global_step=2607.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  64%|██████▎   | 768/1208 [21:53<12:32,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00319, train/loss_step=0.385, global_step=2607.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  64%|██████▎   | 768/1208 [21:53<12:32,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00122, train/loss_step=0.267, global_step=2607.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  64%|██████▎   | 769/1208 [21:54<12:30,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00122, train/loss_step=0.267, global_step=2607.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  64%|██████▎   | 769/1208 [21:54<12:30,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=2608.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  64%|██████▎   | 770/1208 [21:55<12:28,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=2608.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  64%|██████▎   | 770/1208 [21:55<12:28,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00103, train/loss_step=0.252, global_step=2608.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  64%|██████▍   | 771/1208 [21:56<12:26,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00103, train/loss_step=0.252, global_step=2608.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  64%|██████▍   | 771/1208 [21:56<12:26,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000766, train/loss_step=0.214, global_step=2608.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  64%|██████▍   | 772/1208 [21:59<12:25,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000766, train/loss_step=0.214, global_step=2608.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  64%|██████▍   | 772/1208 [21:59<12:25,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.000146, train/loss_step=0.0417, global_step=2608.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  64%|██████▍   | 773/1208 [22:00<12:23,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.000146, train/loss_step=0.0417, global_step=2608.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  64%|██████▍   | 773/1208 [22:00<12:23,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000541, train/loss_step=0.155, global_step=2609.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  64%|██████▍   | 774/1208 [22:01<12:21,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000541, train/loss_step=0.155, global_step=2609.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  64%|██████▍   | 774/1208 [22:01<12:21,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000547, train/loss_step=0.159, global_step=2609.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  64%|██████▍   | 775/1208 [22:03<12:19,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000547, train/loss_step=0.159, global_step=2609.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  64%|██████▍   | 775/1208 [22:03<12:19,  1.71s/it, loss=0.175, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.0015, train/loss_step=0.320, global_step=2609.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  64%|██████▍   | 776/1208 [22:06<12:18,  1.71s/it, loss=0.175, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.0015, train/loss_step=0.320, global_step=2609.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  64%|██████▍   | 776/1208 [22:06<12:18,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.25e-5, train/loss_step=0.0173, global_step=2609.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  64%|██████▍   | 777/1208 [22:07<12:16,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.25e-5, train/loss_step=0.0173, global_step=2609.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  64%|██████▍   | 777/1208 [22:07<12:16,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00721, train/loss_vlb_step=3.72e-5, train/loss_step=0.00721, global_step=2610.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  64%|██████▍   | 778/1208 [22:08<12:14,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00721, train/loss_vlb_step=3.72e-5, train/loss_step=0.00721, global_step=2610.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  64%|██████▍   | 778/1208 [22:08<12:14,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.93e-5, train/loss_step=0.0179, global_step=2610.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  64%|██████▍   | 779/1208 [22:09<12:12,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.93e-5, train/loss_step=0.0179, global_step=2610.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  64%|██████▍   | 779/1208 [22:09<12:12,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000394, train/loss_step=0.120, global_step=2610.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  65%|██████▍   | 780/1208 [22:12<12:11,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000394, train/loss_step=0.120, global_step=2610.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  65%|██████▍   | 780/1208 [22:12<12:11,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.24e-5, train/loss_step=0.00208, global_step=2610.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  65%|██████▍   | 781/1208 [22:13<12:09,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.24e-5, train/loss_step=0.00208, global_step=2610.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  65%|██████▍   | 781/1208 [22:13<12:09,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.000116, train/loss_step=0.0312, global_step=2611.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  65%|██████▍   | 782/1208 [22:14<12:07,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.000116, train/loss_step=0.0312, global_step=2611.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  65%|██████▍   | 782/1208 [22:14<12:07,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.94e-5, train/loss_step=0.0177, global_step=2611.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  65%|██████▍   | 783/1208 [22:15<12:05,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.94e-5, train/loss_step=0.0177, global_step=2611.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  65%|██████▍   | 783/1208 [22:15<12:05,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0586, train/loss_vlb_step=0.0002, train/loss_step=0.0586, global_step=2611.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  65%|██████▍   | 784/1208 [22:19<12:04,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0586, train/loss_vlb_step=0.0002, train/loss_step=0.0586, global_step=2611.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  65%|██████▍   | 784/1208 [22:19<12:04,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000481, train/loss_step=0.142, global_step=2611.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  65%|██████▍   | 785/1208 [22:20<12:02,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000481, train/loss_step=0.142, global_step=2611.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  65%|██████▍   | 785/1208 [22:20<12:02,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.25e-5, train/loss_step=0.0141, global_step=2612.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  65%|██████▌   | 786/1208 [22:21<12:00,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.25e-5, train/loss_step=0.0141, global_step=2612.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  65%|██████▌   | 786/1208 [22:21<12:00,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.00017, train/loss_step=0.0468, global_step=2612.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  65%|██████▌   | 787/1208 [22:22<11:58,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.00017, train/loss_step=0.0468, global_step=2612.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  65%|██████▌   | 787/1208 [22:22<11:58,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.83e-5, train/loss_step=0.0155, global_step=2612.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  65%|██████▌   | 788/1208 [22:25<11:57,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.83e-5, train/loss_step=0.0155, global_step=2612.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  65%|██████▌   | 788/1208 [22:25<11:57,  1.71s/it, loss=0.092, v_num=0, train/loss_simple_step=0.0937, train/loss_vlb_step=0.000309, train/loss_step=0.0937, global_step=2612.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  65%|██████▌   | 789/1208 [22:26<11:55,  1.71s/it, loss=0.092, v_num=0, train/loss_simple_step=0.0937, train/loss_vlb_step=0.000309, train/loss_step=0.0937, global_step=2612.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  65%|██████▌   | 789/1208 [22:26<11:55,  1.71s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.19e-5, train/loss_step=0.00199, global_step=2613.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  65%|██████▌   | 790/1208 [22:27<11:53,  1.71s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.19e-5, train/loss_step=0.00199, global_step=2613.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  65%|██████▌   | 790/1208 [22:27<11:53,  1.71s/it, loss=0.0826, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000596, train/loss_step=0.176, global_step=2613.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  65%|██████▌   | 791/1208 [22:28<11:50,  1.70s/it, loss=0.0826, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000596, train/loss_step=0.176, global_step=2613.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  65%|██████▌   | 791/1208 [22:28<11:50,  1.70s/it, loss=0.0734, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.00011, train/loss_step=0.0297, global_step=2613.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  66%|██████▌   | 792/1208 [22:31<11:50,  1.71s/it, loss=0.0734, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.00011, train/loss_step=0.0297, global_step=2613.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  66%|██████▌   | 792/1208 [22:31<11:50,  1.71s/it, loss=0.074, v_num=0, train/loss_simple_step=0.0535, train/loss_vlb_step=0.000187, train/loss_step=0.0535, global_step=2613.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  66%|██████▌   | 793/1208 [22:32<11:48,  1.71s/it, loss=0.074, v_num=0, train/loss_simple_step=0.0535, train/loss_vlb_step=0.000187, train/loss_step=0.0535, global_step=2613.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  66%|██████▌   | 793/1208 [22:32<11:48,  1.71s/it, loss=0.0754, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000632, train/loss_step=0.184, global_step=2614.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  66%|██████▌   | 794/1208 [22:33<11:45,  1.71s/it, loss=0.0754, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000632, train/loss_step=0.184, global_step=2614.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  66%|██████▌   | 794/1208 [22:33<11:45,  1.71s/it, loss=0.0677, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=2.51e-5, train/loss_step=0.00448, global_step=2614.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  66%|██████▌   | 795/1208 [22:34<11:43,  1.70s/it, loss=0.0677, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=2.51e-5, train/loss_step=0.00448, global_step=2614.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  66%|██████▌   | 795/1208 [22:34<11:43,  1.70s/it, loss=0.0542, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000175, train/loss_step=0.050, global_step=2614.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  66%|██████▌   | 796/1208 [22:38<11:43,  1.71s/it, loss=0.0542, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000175, train/loss_step=0.050, global_step=2614.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  66%|██████▌   | 796/1208 [22:38<11:43,  1.71s/it, loss=0.0537, v_num=0, train/loss_simple_step=0.00717, train/loss_vlb_step=3.48e-5, train/loss_step=0.00717, global_step=2614.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  66%|██████▌   | 797/1208 [22:39<11:41,  1.71s/it, loss=0.0537, v_num=0, train/loss_simple_step=0.00717, train/loss_vlb_step=3.48e-5, train/loss_step=0.00717, global_step=2614.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  66%|██████▌   | 797/1208 [22:39<11:41,  1.71s/it, loss=0.0544, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=9.05e-5, train/loss_step=0.0212, global_step=2615.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  66%|██████▌   | 798/1208 [22:40<11:38,  1.70s/it, loss=0.0544, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=9.05e-5, train/loss_step=0.0212, global_step=2615.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  66%|██████▌   | 798/1208 [22:40<11:38,  1.70s/it, loss=0.0553, v_num=0, train/loss_simple_step=0.0371, train/loss_vlb_step=0.000144, train/loss_step=0.0371, global_step=2615.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  66%|██████▌   | 799/1208 [22:41<11:36,  1.70s/it, loss=0.0553, v_num=0, train/loss_simple_step=0.0371, train/loss_vlb_step=0.000144, train/loss_step=0.0371, global_step=2615.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  66%|██████▌   | 799/1208 [22:41<11:36,  1.70s/it, loss=0.0577, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000567, train/loss_step=0.168, global_step=2615.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  66%|██████▌   | 800/1208 [22:44<11:35,  1.71s/it, loss=0.0577, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000567, train/loss_step=0.168, global_step=2615.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  66%|██████▌   | 800/1208 [22:44<11:35,  1.71s/it, loss=0.059, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000108, train/loss_step=0.0262, global_step=2615.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  66%|██████▋   | 801/1208 [22:45<11:33,  1.70s/it, loss=0.059, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000108, train/loss_step=0.0262, global_step=2615.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  66%|██████▋   | 801/1208 [22:45<11:33,  1.70s/it, loss=0.0576, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.92e-5, train/loss_step=0.00344, global_step=2616.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  66%|██████▋   | 802/1208 [22:46<11:31,  1.70s/it, loss=0.0576, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.92e-5, train/loss_step=0.00344, global_step=2616.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  66%|██████▋   | 802/1208 [22:46<11:31,  1.70s/it, loss=0.0572, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.22e-5, train/loss_step=0.011, global_step=2616.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  66%|██████▋   | 803/1208 [22:47<11:29,  1.70s/it, loss=0.0572, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.22e-5, train/loss_step=0.011, global_step=2616.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  66%|██████▋   | 803/1208 [22:47<11:29,  1.70s/it, loss=0.0781, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00391, train/loss_step=0.476, global_step=2616.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  67%|██████▋   | 804/1208 [22:51<11:28,  1.71s/it, loss=0.0781, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00391, train/loss_step=0.476, global_step=2616.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  67%|██████▋   | 804/1208 [22:51<11:28,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.591, train/loss_vlb_step=0.0115, train/loss_step=0.591, global_step=2616.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  67%|██████▋   | 805/1208 [22:52<11:26,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.591, train/loss_vlb_step=0.0115, train/loss_step=0.591, global_step=2616.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  67%|██████▋   | 805/1208 [22:52<11:26,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0814, train/loss_vlb_step=0.000273, train/loss_step=0.0814, global_step=2617.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  67%|██████▋   | 806/1208 [22:53<11:24,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0814, train/loss_vlb_step=0.000273, train/loss_step=0.0814, global_step=2617.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  67%|██████▋   | 806/1208 [22:53<11:24,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000414, train/loss_step=0.125, global_step=2617.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  67%|██████▋   | 807/1208 [22:54<11:22,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000414, train/loss_step=0.125, global_step=2617.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  67%|██████▋   | 807/1208 [22:54<11:22,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000441, train/loss_step=0.132, global_step=2617.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  67%|██████▋   | 808/1208 [22:57<11:21,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000441, train/loss_step=0.132, global_step=2617.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  67%|██████▋   | 808/1208 [22:57<11:21,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000543, train/loss_step=0.160, global_step=2617.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  67%|██████▋   | 809/1208 [22:58<11:19,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000543, train/loss_step=0.160, global_step=2617.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  67%|██████▋   | 809/1208 [22:58<11:19,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00406, train/loss_vlb_step=2.16e-5, train/loss_step=0.00406, global_step=2618.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  67%|██████▋   | 810/1208 [22:59<11:17,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00406, train/loss_vlb_step=2.16e-5, train/loss_step=0.00406, global_step=2618.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  67%|██████▋   | 810/1208 [22:59<11:17,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000552, train/loss_step=0.167, global_step=2618.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  67%|██████▋   | 811/1208 [23:00<11:15,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000552, train/loss_step=0.167, global_step=2618.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  67%|██████▋   | 811/1208 [23:00<11:15,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00133, train/loss_step=0.285, global_step=2618.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  67%|██████▋   | 812/1208 [23:03<11:14,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00133, train/loss_step=0.285, global_step=2618.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  67%|██████▋   | 812/1208 [23:03<11:14,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000493, train/loss_step=0.147, global_step=2618.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  67%|██████▋   | 813/1208 [23:04<11:12,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000493, train/loss_step=0.147, global_step=2618.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  67%|██████▋   | 813/1208 [23:04<11:12,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00147, train/loss_step=0.276, global_step=2619.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  67%|██████▋   | 814/1208 [23:05<11:10,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00147, train/loss_step=0.276, global_step=2619.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  67%|██████▋   | 814/1208 [23:05<11:10,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.55e-5, train/loss_step=0.0238, global_step=2619.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  67%|██████▋   | 815/1208 [23:07<11:08,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.55e-5, train/loss_step=0.0238, global_step=2619.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  67%|██████▋   | 815/1208 [23:07<11:08,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000825, train/loss_step=0.219, global_step=2619.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  68%|██████▊   | 816/1208 [23:10<11:07,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000825, train/loss_step=0.219, global_step=2619.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  68%|██████▊   | 816/1208 [23:10<11:07,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000114, train/loss_step=0.0296, global_step=2619.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  68%|██████▊   | 817/1208 [23:11<11:05,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000114, train/loss_step=0.0296, global_step=2619.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  68%|██████▊   | 817/1208 [23:11<11:05,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=2620.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  68%|██████▊   | 818/1208 [23:12<11:03,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=2620.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  68%|██████▊   | 818/1208 [23:12<11:03,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000404, train/loss_step=0.123, global_step=2620.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  68%|██████▊   | 819/1208 [23:13<11:01,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000404, train/loss_step=0.123, global_step=2620.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  68%|██████▊   | 819/1208 [23:13<11:01,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00427, train/loss_vlb_step=2.3e-5, train/loss_step=0.00427, global_step=2620.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  68%|██████▊   | 820/1208 [23:16<11:00,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00427, train/loss_vlb_step=2.3e-5, train/loss_step=0.00427, global_step=2620.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  68%|██████▊   | 820/1208 [23:16<11:00,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0618, train/loss_vlb_step=0.000212, train/loss_step=0.0618, global_step=2620.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  68%|██████▊   | 821/1208 [23:17<10:58,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0618, train/loss_vlb_step=0.000212, train/loss_step=0.0618, global_step=2620.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  68%|██████▊   | 821/1208 [23:17<10:58,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00994, train/loss_vlb_step=4.74e-5, train/loss_step=0.00994, global_step=2621.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  68%|██████▊   | 822/1208 [23:18<10:56,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00994, train/loss_vlb_step=4.74e-5, train/loss_step=0.00994, global_step=2621.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  68%|██████▊   | 822/1208 [23:18<10:56,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0929, train/loss_vlb_step=0.000308, train/loss_step=0.0929, global_step=2621.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  68%|██████▊   | 823/1208 [23:19<10:54,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0929, train/loss_vlb_step=0.000308, train/loss_step=0.0929, global_step=2621.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  68%|██████▊   | 823/1208 [23:19<10:54,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000349, train/loss_step=0.104, global_step=2621.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  68%|██████▊   | 824/1208 [23:23<10:53,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000349, train/loss_step=0.104, global_step=2621.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  68%|██████▊   | 824/1208 [23:23<10:53,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00103, train/loss_step=0.254, global_step=2621.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  68%|██████▊   | 825/1208 [23:24<10:51,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00103, train/loss_step=0.254, global_step=2621.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  68%|██████▊   | 825/1208 [23:24<10:51,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000783, train/loss_step=0.218, global_step=2622.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  68%|██████▊   | 826/1208 [23:25<10:49,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000783, train/loss_step=0.218, global_step=2622.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  68%|██████▊   | 826/1208 [23:25<10:49,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000631, train/loss_step=0.183, global_step=2622.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  68%|██████▊   | 827/1208 [23:26<10:47,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000631, train/loss_step=0.183, global_step=2622.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  68%|██████▊   | 827/1208 [23:26<10:47,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000908, train/loss_step=0.233, global_step=2622.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  69%|██████▊   | 828/1208 [23:29<10:46,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000908, train/loss_step=0.233, global_step=2622.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  69%|██████▊   | 828/1208 [23:29<10:46,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00108, train/loss_step=0.257, global_step=2622.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  69%|██████▊   | 829/1208 [23:30<10:44,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00108, train/loss_step=0.257, global_step=2622.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  69%|██████▊   | 829/1208 [23:30<10:44,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0055, train/loss_vlb_step=2.87e-5, train/loss_step=0.0055, global_step=2623.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  69%|██████▊   | 830/1208 [23:31<10:42,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0055, train/loss_vlb_step=2.87e-5, train/loss_step=0.0055, global_step=2623.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  69%|██████▊   | 830/1208 [23:31<10:42,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000716, train/loss_step=0.206, global_step=2623.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  69%|██████▉   | 831/1208 [23:32<10:40,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000716, train/loss_step=0.206, global_step=2623.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  69%|██████▉   | 831/1208 [23:32<10:40,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00168, train/loss_step=0.331, global_step=2623.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  69%|██████▉   | 832/1208 [23:35<10:39,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00168, train/loss_step=0.331, global_step=2623.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  69%|██████▉   | 832/1208 [23:35<10:39,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.63e-5, train/loss_step=0.0182, global_step=2623.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  69%|██████▉   | 833/1208 [23:36<10:37,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.63e-5, train/loss_step=0.0182, global_step=2623.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  69%|██████▉   | 833/1208 [23:36<10:37,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00432, train/loss_vlb_step=2.3e-5, train/loss_step=0.00432, global_step=2624.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  69%|██████▉   | 834/1208 [23:37<10:35,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00432, train/loss_vlb_step=2.3e-5, train/loss_step=0.00432, global_step=2624.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  69%|██████▉   | 834/1208 [23:37<10:35,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00109, train/loss_step=0.248, global_step=2624.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  69%|██████▉   | 835/1208 [23:38<10:33,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00109, train/loss_step=0.248, global_step=2624.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  69%|██████▉   | 835/1208 [23:38<10:33,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00203, train/loss_step=0.327, global_step=2624.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  69%|██████▉   | 836/1208 [23:42<10:32,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00203, train/loss_step=0.327, global_step=2624.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  69%|██████▉   | 836/1208 [23:42<10:32,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.47e-5, train/loss_step=0.0126, global_step=2624.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  69%|██████▉   | 837/1208 [23:43<10:30,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.47e-5, train/loss_step=0.0126, global_step=2624.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  69%|██████▉   | 837/1208 [23:43<10:30,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0453, train/loss_vlb_step=0.000167, train/loss_step=0.0453, global_step=2625.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  69%|██████▉   | 838/1208 [23:44<10:28,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0453, train/loss_vlb_step=0.000167, train/loss_step=0.0453, global_step=2625.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  69%|██████▉   | 838/1208 [23:44<10:28,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00131, train/loss_step=0.270, global_step=2625.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  69%|██████▉   | 839/1208 [23:45<10:26,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00131, train/loss_step=0.270, global_step=2625.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  69%|██████▉   | 839/1208 [23:45<10:26,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000108, train/loss_step=0.0283, global_step=2625.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  70%|██████▉   | 840/1208 [23:48<10:25,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000108, train/loss_step=0.0283, global_step=2625.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  70%|██████▉   | 840/1208 [23:48<10:25,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0797, train/loss_vlb_step=0.000265, train/loss_step=0.0797, global_step=2625.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  70%|██████▉   | 841/1208 [23:49<10:23,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0797, train/loss_vlb_step=0.000265, train/loss_step=0.0797, global_step=2625.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  70%|██████▉   | 841/1208 [23:49<10:23,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=9.27e-5, train/loss_step=0.0223, global_step=2626.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  70%|██████▉   | 842/1208 [23:50<10:21,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=9.27e-5, train/loss_step=0.0223, global_step=2626.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  70%|██████▉   | 842/1208 [23:50<10:21,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.453, train/loss_vlb_step=0.00397, train/loss_step=0.453, global_step=2626.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  70%|██████▉   | 843/1208 [23:51<10:19,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.453, train/loss_vlb_step=0.00397, train/loss_step=0.453, global_step=2626.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  70%|██████▉   | 843/1208 [23:51<10:19,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000866, train/loss_step=0.230, global_step=2626.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  70%|██████▉   | 844/1208 [23:55<10:18,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000866, train/loss_step=0.230, global_step=2626.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  70%|██████▉   | 844/1208 [23:55<10:18,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.06e-5, train/loss_step=0.0237, global_step=2626.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  70%|██████▉   | 845/1208 [23:56<10:16,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.06e-5, train/loss_step=0.0237, global_step=2626.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  70%|██████▉   | 845/1208 [23:56<10:16,  1.70s/it, loss=0.19, v_num=0, train/loss_simple_step=0.829, train/loss_vlb_step=0.0607, train/loss_step=0.829, global_step=2627.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  70%|███████   | 846/1208 [23:57<10:14,  1.70s/it, loss=0.19, v_num=0, train/loss_simple_step=0.829, train/loss_vlb_step=0.0607, train/loss_step=0.829, global_step=2627.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  70%|███████   | 846/1208 [23:57<10:14,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00374, train/loss_vlb_step=2.06e-5, train/loss_step=0.00374, global_step=2627.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  70%|███████   | 847/1208 [23:58<10:12,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00374, train/loss_vlb_step=2.06e-5, train/loss_step=0.00374, global_step=2627.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  70%|███████   | 847/1208 [23:58<10:12,  1.70s/it, loss=0.189, v_num=0, train/loss_simple_step=0.387, train/loss_vlb_step=0.00244, train/loss_step=0.387, global_step=2627.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  70%|███████   | 848/1208 [24:01<10:11,  1.70s/it, loss=0.189, v_num=0, train/loss_simple_step=0.387, train/loss_vlb_step=0.00244, train/loss_step=0.387, global_step=2627.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  70%|███████   | 848/1208 [24:01<10:11,  1.70s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=2.41e-5, train/loss_step=0.0046, global_step=2627.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  70%|███████   | 849/1208 [24:02<10:09,  1.70s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=2.41e-5, train/loss_step=0.0046, global_step=2627.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  70%|███████   | 849/1208 [24:02<10:09,  1.70s/it, loss=0.18, v_num=0, train/loss_simple_step=0.079, train/loss_vlb_step=0.000266, train/loss_step=0.079, global_step=2628.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  70%|███████   | 850/1208 [24:03<10:07,  1.70s/it, loss=0.18, v_num=0, train/loss_simple_step=0.079, train/loss_vlb_step=0.000266, train/loss_step=0.079, global_step=2628.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  70%|███████   | 850/1208 [24:03<10:07,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.64e-5, train/loss_step=0.0212, global_step=2628.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  70%|███████   | 851/1208 [24:04<10:05,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.64e-5, train/loss_step=0.0212, global_step=2628.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  70%|███████   | 851/1208 [24:04<10:05,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000479, train/loss_step=0.143, global_step=2628.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  71%|███████   | 852/1208 [24:07<10:04,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000479, train/loss_step=0.143, global_step=2628.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  71%|███████   | 852/1208 [24:07<10:04,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000419, train/loss_step=0.127, global_step=2628.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  71%|███████   | 853/1208 [24:08<10:02,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000419, train/loss_step=0.127, global_step=2628.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  71%|███████   | 853/1208 [24:08<10:02,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=1.99e-5, train/loss_step=0.00357, global_step=2629.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  71%|███████   | 854/1208 [24:09<10:00,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=1.99e-5, train/loss_step=0.00357, global_step=2629.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  71%|███████   | 854/1208 [24:09<10:00,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0716, train/loss_vlb_step=0.00024, train/loss_step=0.0716, global_step=2629.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  71%|███████   | 855/1208 [24:10<09:59,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0716, train/loss_vlb_step=0.00024, train/loss_step=0.0716, global_step=2629.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  71%|███████   | 855/1208 [24:10<09:59,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.000235, train/loss_step=0.0702, global_step=2629.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  71%|███████   | 856/1208 [24:14<09:57,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.000235, train/loss_step=0.0702, global_step=2629.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  71%|███████   | 856/1208 [24:14<09:57,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0096, train/loss_vlb_step=4.51e-5, train/loss_step=0.0096, global_step=2629.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  71%|███████   | 857/1208 [24:15<09:55,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0096, train/loss_vlb_step=4.51e-5, train/loss_step=0.0096, global_step=2629.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  71%|███████   | 857/1208 [24:15<09:55,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00107, train/loss_step=0.255, global_step=2630.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  71%|███████   | 858/1208 [24:16<09:54,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00107, train/loss_step=0.255, global_step=2630.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  71%|███████   | 858/1208 [24:16<09:54,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0828, train/loss_vlb_step=0.000275, train/loss_step=0.0828, global_step=2630.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  71%|███████   | 859/1208 [24:17<09:52,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0828, train/loss_vlb_step=0.000275, train/loss_step=0.0828, global_step=2630.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  71%|███████   | 859/1208 [24:17<09:52,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0535, train/loss_vlb_step=0.000199, train/loss_step=0.0535, global_step=2630.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  71%|███████   | 860/1208 [24:20<09:50,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0535, train/loss_vlb_step=0.000199, train/loss_step=0.0535, global_step=2630.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  71%|███████   | 860/1208 [24:20<09:50,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0978, train/loss_vlb_step=0.000326, train/loss_step=0.0978, global_step=2630.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  71%|███████▏  | 861/1208 [24:21<09:49,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0978, train/loss_vlb_step=0.000326, train/loss_step=0.0978, global_step=2630.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  71%|███████▏  | 861/1208 [24:21<09:49,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=2631.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  71%|███████▏  | 862/1208 [24:22<09:47,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=2631.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  71%|███████▏  | 862/1208 [24:22<09:47,  1.70s/it, loss=0.172, v_num=0, train/loss_simple_step=0.846, train/loss_vlb_step=0.214, train/loss_step=0.846, global_step=2631.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  71%|███████▏  | 863/1208 [24:23<09:45,  1.70s/it, loss=0.172, v_num=0, train/loss_simple_step=0.846, train/loss_vlb_step=0.214, train/loss_step=0.846, global_step=2631.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  71%|███████▏  | 863/1208 [24:23<09:45,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.44e-5, train/loss_step=0.0172, global_step=2631.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  72%|███████▏  | 864/1208 [24:26<09:44,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.44e-5, train/loss_step=0.0172, global_step=2631.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  72%|███████▏  | 864/1208 [24:26<09:44,  1.70s/it, loss=0.169, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000646, train/loss_step=0.172, global_step=2631.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  72%|███████▏  | 865/1208 [24:27<09:42,  1.70s/it, loss=0.169, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000646, train/loss_step=0.172, global_step=2631.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  72%|███████▏  | 865/1208 [24:27<09:42,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000145, train/loss_step=0.0392, global_step=2632.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  72%|███████▏  | 866/1208 [24:28<09:40,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000145, train/loss_step=0.0392, global_step=2632.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  72%|███████▏  | 866/1208 [24:28<09:40,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000789, train/loss_step=0.205, global_step=2632.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  72%|███████▏  | 867/1208 [24:29<09:38,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000789, train/loss_step=0.205, global_step=2632.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  72%|███████▏  | 867/1208 [24:29<09:38,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00137, train/loss_step=0.301, global_step=2632.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  72%|███████▏  | 868/1208 [24:33<09:37,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00137, train/loss_step=0.301, global_step=2632.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  72%|███████▏  | 868/1208 [24:33<09:37,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00723, train/loss_vlb_step=3.39e-5, train/loss_step=0.00723, global_step=2632.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  72%|███████▏  | 869/1208 [24:34<09:35,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00723, train/loss_vlb_step=3.39e-5, train/loss_step=0.00723, global_step=2632.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  72%|███████▏  | 869/1208 [24:34<09:35,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.24e-5, train/loss_step=0.0166, global_step=2633.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  72%|███████▏  | 870/1208 [24:35<09:33,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.24e-5, train/loss_step=0.0166, global_step=2633.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  72%|███████▏  | 870/1208 [24:35<09:33,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.47e-5, train/loss_step=0.015, global_step=2633.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  72%|███████▏  | 871/1208 [24:36<09:31,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.47e-5, train/loss_step=0.015, global_step=2633.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  72%|███████▏  | 871/1208 [24:36<09:31,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0492, train/loss_vlb_step=0.000178, train/loss_step=0.0492, global_step=2633.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  72%|███████▏  | 872/1208 [24:39<09:30,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0492, train/loss_vlb_step=0.000178, train/loss_step=0.0492, global_step=2633.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  72%|███████▏  | 872/1208 [24:39<09:30,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.00014, train/loss_step=0.038, global_step=2633.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  72%|███████▏  | 873/1208 [24:40<09:28,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.00014, train/loss_step=0.038, global_step=2633.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  72%|███████▏  | 873/1208 [24:40<09:28,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000577, train/loss_step=0.161, global_step=2634.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  72%|███████▏  | 874/1208 [24:41<09:26,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000577, train/loss_step=0.161, global_step=2634.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  72%|███████▏  | 874/1208 [24:41<09:26,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000561, train/loss_step=0.157, global_step=2634.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  72%|███████▏  | 875/1208 [24:42<09:24,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000561, train/loss_step=0.157, global_step=2634.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  72%|███████▏  | 875/1208 [24:42<09:24,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000384, train/loss_step=0.117, global_step=2634.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  73%|███████▎  | 876/1208 [24:46<09:23,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000384, train/loss_step=0.117, global_step=2634.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  73%|███████▎  | 876/1208 [24:46<09:23,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.89e-5, train/loss_step=0.00341, global_step=2634.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  73%|███████▎  | 877/1208 [24:47<09:21,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.89e-5, train/loss_step=0.00341, global_step=2634.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  73%|███████▎  | 877/1208 [24:47<09:21,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0698, train/loss_vlb_step=0.000238, train/loss_step=0.0698, global_step=2635.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  73%|███████▎  | 878/1208 [24:48<09:19,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0698, train/loss_vlb_step=0.000238, train/loss_step=0.0698, global_step=2635.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  73%|███████▎  | 878/1208 [24:48<09:19,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.68e-5, train/loss_step=0.0029, global_step=2635.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  73%|███████▎  | 879/1208 [24:49<09:17,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.68e-5, train/loss_step=0.0029, global_step=2635.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  73%|███████▎  | 879/1208 [24:49<09:17,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=2635.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  73%|███████▎  | 880/1208 [24:52<09:16,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=2635.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  73%|███████▎  | 880/1208 [24:52<09:16,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=2635.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  73%|███████▎  | 881/1208 [24:53<09:14,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=2635.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  73%|███████▎  | 881/1208 [24:53<09:14,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000456, train/loss_step=0.136, global_step=2636.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  73%|███████▎  | 882/1208 [24:54<09:12,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000456, train/loss_step=0.136, global_step=2636.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  73%|███████▎  | 882/1208 [24:54<09:12,  1.69s/it, loss=0.0917, v_num=0, train/loss_simple_step=0.0987, train/loss_vlb_step=0.000326, train/loss_step=0.0987, global_step=2636.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  73%|███████▎  | 883/1208 [24:55<09:10,  1.69s/it, loss=0.0917, v_num=0, train/loss_simple_step=0.0987, train/loss_vlb_step=0.000326, train/loss_step=0.0987, global_step=2636.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  73%|███████▎  | 883/1208 [24:55<09:10,  1.69s/it, loss=0.114, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00367, train/loss_step=0.457, global_step=2636.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  73%|███████▎  | 884/1208 [24:58<09:09,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00367, train/loss_step=0.457, global_step=2636.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  73%|███████▎  | 884/1208 [24:58<09:09,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000673, train/loss_step=0.191, global_step=2636.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  73%|███████▎  | 885/1208 [24:59<09:07,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000673, train/loss_step=0.191, global_step=2636.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  73%|███████▎  | 885/1208 [24:59<09:07,  1.69s/it, loss=0.122, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000641, train/loss_step=0.183, global_step=2637.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  73%|███████▎  | 886/1208 [25:00<09:05,  1.69s/it, loss=0.122, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000641, train/loss_step=0.183, global_step=2637.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  73%|███████▎  | 886/1208 [25:00<09:05,  1.69s/it, loss=0.119, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.00053, train/loss_step=0.155, global_step=2637.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  73%|███████▎  | 887/1208 [25:02<09:03,  1.69s/it, loss=0.119, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.00053, train/loss_step=0.155, global_step=2637.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  73%|███████▎  | 887/1208 [25:02<09:03,  1.69s/it, loss=0.109, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=2637.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  74%|███████▎  | 888/1208 [25:05<09:02,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=2637.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  74%|███████▎  | 888/1208 [25:05<09:02,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0957, train/loss_vlb_step=0.000315, train/loss_step=0.0957, global_step=2637.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  74%|███████▎  | 889/1208 [25:06<09:00,  1.69s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0957, train/loss_vlb_step=0.000315, train/loss_step=0.0957, global_step=2637.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  74%|███████▎  | 889/1208 [25:06<09:00,  1.69s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.000215, train/loss_step=0.0598, global_step=2638.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  74%|███████▎  | 890/1208 [25:07<08:58,  1.69s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.000215, train/loss_step=0.0598, global_step=2638.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  74%|███████▎  | 890/1208 [25:07<08:58,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0642, train/loss_vlb_step=0.000216, train/loss_step=0.0642, global_step=2638.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  74%|███████▍  | 891/1208 [25:08<08:56,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0642, train/loss_vlb_step=0.000216, train/loss_step=0.0642, global_step=2638.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  74%|███████▍  | 891/1208 [25:08<08:56,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00307, train/loss_step=0.354, global_step=2638.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  74%|███████▍  | 892/1208 [25:11<08:55,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00307, train/loss_step=0.354, global_step=2638.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  74%|███████▍  | 892/1208 [25:11<08:55,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00642, train/loss_vlb_step=3.21e-5, train/loss_step=0.00642, global_step=2638.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  74%|███████▍  | 893/1208 [25:12<08:53,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00642, train/loss_vlb_step=3.21e-5, train/loss_step=0.00642, global_step=2638.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  74%|███████▍  | 893/1208 [25:12<08:53,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00966, train/loss_vlb_step=4.66e-5, train/loss_step=0.00966, global_step=2639.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  74%|███████▍  | 894/1208 [25:13<08:51,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00966, train/loss_vlb_step=4.66e-5, train/loss_step=0.00966, global_step=2639.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  74%|███████▍  | 894/1208 [25:13<08:51,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00151, train/loss_step=0.320, global_step=2639.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  74%|███████▍  | 895/1208 [25:14<08:49,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00151, train/loss_step=0.320, global_step=2639.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  74%|███████▍  | 895/1208 [25:14<08:49,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.18e-5, train/loss_step=0.0112, global_step=2639.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  74%|███████▍  | 896/1208 [25:17<08:48,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.18e-5, train/loss_step=0.0112, global_step=2639.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  74%|███████▍  | 896/1208 [25:17<08:48,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00178, train/loss_step=0.339, global_step=2639.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  74%|███████▍  | 897/1208 [25:19<08:46,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00178, train/loss_step=0.339, global_step=2639.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  74%|███████▍  | 897/1208 [25:19<08:46,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0745, train/loss_vlb_step=0.000253, train/loss_step=0.0745, global_step=2640.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  74%|███████▍  | 898/1208 [25:20<08:44,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0745, train/loss_vlb_step=0.000253, train/loss_step=0.0745, global_step=2640.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  74%|███████▍  | 898/1208 [25:20<08:44,  1.69s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=7.16e-5, train/loss_step=0.0158, global_step=2640.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  74%|███████▍  | 899/1208 [25:21<08:42,  1.69s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=7.16e-5, train/loss_step=0.0158, global_step=2640.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  74%|███████▍  | 899/1208 [25:21<08:42,  1.69s/it, loss=0.149, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000678, train/loss_step=0.190, global_step=2640.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  75%|███████▍  | 900/1208 [25:24<08:41,  1.69s/it, loss=0.149, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000678, train/loss_step=0.190, global_step=2640.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  75%|███████▍  | 900/1208 [25:24<08:41,  1.69s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0884, train/loss_vlb_step=0.000297, train/loss_step=0.0884, global_step=2640.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.76it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.81it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.76it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.76it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.76it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.76it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.76it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.76it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.80it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.78it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.78it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.74it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.75it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.75it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.75it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.78it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.80it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.75it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 8:  75%|███████▍  | 901/1208 [25:55<08:49,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0884, train/loss_vlb_step=0.000297, train/loss_step=0.0884, global_step=2640.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  75%|███████▍  | 901/1208 [25:55<08:49,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.02e-5, train/loss_step=0.0111, global_step=2641.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  75%|███████▍  | 902/1208 [25:56<08:47,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.02e-5, train/loss_step=0.0111, global_step=2641.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  75%|███████▍  | 902/1208 [25:56<08:47,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000648, train/loss_step=0.184, global_step=2641.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  75%|███████▍  | 903/1208 [25:57<08:45,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000648, train/loss_step=0.184, global_step=2641.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  75%|███████▍  | 903/1208 [25:57<08:45,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0419, train/loss_vlb_step=0.000153, train/loss_step=0.0419, global_step=2641.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  75%|███████▍  | 904/1208 [26:00<08:44,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0419, train/loss_vlb_step=0.000153, train/loss_step=0.0419, global_step=2641.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  75%|███████▍  | 904/1208 [26:00<08:44,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.516, train/loss_vlb_step=0.00645, train/loss_step=0.516, global_step=2641.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  75%|███████▍  | 905/1208 [26:01<08:42,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.516, train/loss_vlb_step=0.00645, train/loss_step=0.516, global_step=2641.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  75%|███████▍  | 905/1208 [26:01<08:42,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.00337, train/loss_step=0.406, global_step=2642.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  75%|███████▌  | 906/1208 [26:02<08:40,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.00337, train/loss_step=0.406, global_step=2642.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  75%|███████▌  | 906/1208 [26:02<08:40,  1.72s/it, loss=0.165, v_num=0, train/loss_simple_step=0.421, train/loss_vlb_step=0.00201, train/loss_step=0.421, global_step=2642.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  75%|███████▌  | 907/1208 [26:03<08:38,  1.72s/it, loss=0.165, v_num=0, train/loss_simple_step=0.421, train/loss_vlb_step=0.00201, train/loss_step=0.421, global_step=2642.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  75%|███████▌  | 907/1208 [26:03<08:38,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.29e-5, train/loss_step=0.00213, global_step=2642.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  75%|███████▌  | 908/1208 [26:06<08:37,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.29e-5, train/loss_step=0.00213, global_step=2642.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  75%|███████▌  | 908/1208 [26:06<08:37,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00423, train/loss_step=0.430, global_step=2642.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  75%|███████▌  | 909/1208 [26:07<08:35,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00423, train/loss_step=0.430, global_step=2642.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  75%|███████▌  | 909/1208 [26:07<08:35,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.9e-5, train/loss_step=0.00331, global_step=2643.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  75%|███████▌  | 910/1208 [26:08<08:33,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.9e-5, train/loss_step=0.00331, global_step=2643.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  75%|███████▌  | 910/1208 [26:08<08:33,  1.72s/it, loss=0.191, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00302, train/loss_step=0.402, global_step=2643.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  75%|███████▌  | 911/1208 [26:09<08:31,  1.72s/it, loss=0.191, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00302, train/loss_step=0.402, global_step=2643.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  75%|███████▌  | 911/1208 [26:09<08:31,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000692, train/loss_step=0.196, global_step=2643.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  75%|███████▌  | 912/1208 [26:12<08:30,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000692, train/loss_step=0.196, global_step=2643.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  75%|███████▌  | 912/1208 [26:12<08:30,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00143, train/loss_vlb_step=8.63e-6, train/loss_step=0.00143, global_step=2643.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  76%|███████▌  | 913/1208 [26:13<08:28,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00143, train/loss_vlb_step=8.63e-6, train/loss_step=0.00143, global_step=2643.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  76%|███████▌  | 913/1208 [26:13<08:28,  1.72s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0435, train/loss_vlb_step=0.000163, train/loss_step=0.0435, global_step=2644.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  76%|███████▌  | 914/1208 [26:14<08:26,  1.72s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0435, train/loss_vlb_step=0.000163, train/loss_step=0.0435, global_step=2644.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  76%|███████▌  | 914/1208 [26:14<08:26,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000798, train/loss_step=0.210, global_step=2644.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  76%|███████▌  | 915/1208 [26:15<08:24,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000798, train/loss_step=0.210, global_step=2644.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  76%|███████▌  | 915/1208 [26:15<08:24,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0714, train/loss_vlb_step=0.000241, train/loss_step=0.0714, global_step=2644.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  76%|███████▌  | 916/1208 [26:18<08:23,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0714, train/loss_vlb_step=0.000241, train/loss_step=0.0714, global_step=2644.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  76%|███████▌  | 916/1208 [26:18<08:23,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.47e-5, train/loss_step=0.00257, global_step=2644.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  76%|███████▌  | 917/1208 [26:19<08:21,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.47e-5, train/loss_step=0.00257, global_step=2644.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  76%|███████▌  | 917/1208 [26:19<08:21,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.00052, train/loss_step=0.155, global_step=2645.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]     Epoch 8:  76%|███████▌  | 918/1208 [26:20<08:19,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.00052, train/loss_step=0.155, global_step=2645.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  76%|███████▌  | 918/1208 [26:20<08:19,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000334, train/loss_step=0.101, global_step=2645.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  76%|███████▌  | 919/1208 [26:21<08:17,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000334, train/loss_step=0.101, global_step=2645.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  76%|███████▌  | 919/1208 [26:21<08:17,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.69e-5, train/loss_step=0.00305, global_step=2645.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  76%|███████▌  | 920/1208 [26:24<08:16,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.69e-5, train/loss_step=0.00305, global_step=2645.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  76%|███████▌  | 920/1208 [26:24<08:16,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000671, train/loss_step=0.181, global_step=2645.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  76%|███████▌  | 921/1208 [26:25<08:14,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000671, train/loss_step=0.181, global_step=2645.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  76%|███████▌  | 921/1208 [26:25<08:14,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.3e-5, train/loss_step=0.00423, global_step=2646.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  76%|███████▋  | 922/1208 [26:26<08:12,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.3e-5, train/loss_step=0.00423, global_step=2646.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  76%|███████▋  | 922/1208 [26:26<08:12,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0907, train/loss_vlb_step=0.000304, train/loss_step=0.0907, global_step=2646.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  76%|███████▋  | 923/1208 [26:27<08:10,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0907, train/loss_vlb_step=0.000304, train/loss_step=0.0907, global_step=2646.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  76%|███████▋  | 923/1208 [26:27<08:10,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00164, train/loss_step=0.331, global_step=2646.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  76%|███████▋  | 924/1208 [26:30<08:08,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00164, train/loss_step=0.331, global_step=2646.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  76%|███████▋  | 924/1208 [26:30<08:08,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.36e-5, train/loss_step=0.0119, global_step=2646.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  77%|███████▋  | 925/1208 [26:31<08:06,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.36e-5, train/loss_step=0.0119, global_step=2646.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  77%|███████▋  | 925/1208 [26:31<08:06,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000136, train/loss_step=0.0367, global_step=2647.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  77%|███████▋  | 926/1208 [26:32<08:04,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000136, train/loss_step=0.0367, global_step=2647.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  77%|███████▋  | 926/1208 [26:32<08:04,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00146, train/loss_step=0.294, global_step=2647.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  77%|███████▋  | 927/1208 [26:33<08:03,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00146, train/loss_step=0.294, global_step=2647.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  77%|███████▋  | 927/1208 [26:33<08:03,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00201, train/loss_step=0.324, global_step=2647.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  77%|███████▋  | 928/1208 [26:36<08:01,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00201, train/loss_step=0.324, global_step=2647.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  77%|███████▋  | 928/1208 [26:36<08:01,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.00061, train/loss_step=0.182, global_step=2647.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  77%|███████▋  | 929/1208 [26:37<07:59,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.00061, train/loss_step=0.182, global_step=2647.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  77%|███████▋  | 929/1208 [26:37<07:59,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.2e-5, train/loss_step=0.00198, global_step=2648.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  77%|███████▋  | 930/1208 [26:38<07:57,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.2e-5, train/loss_step=0.00198, global_step=2648.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  77%|███████▋  | 930/1208 [26:38<07:57,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.0023, train/loss_step=0.321, global_step=2648.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  77%|███████▋  | 931/1208 [26:39<07:55,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.0023, train/loss_step=0.321, global_step=2648.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  77%|███████▋  | 931/1208 [26:39<07:55,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000415, train/loss_step=0.126, global_step=2648.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  77%|███████▋  | 932/1208 [26:42<07:54,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000415, train/loss_step=0.126, global_step=2648.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  77%|███████▋  | 932/1208 [26:42<07:54,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00258, train/loss_step=0.386, global_step=2648.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  77%|███████▋  | 933/1208 [26:43<07:52,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00258, train/loss_step=0.386, global_step=2648.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  77%|███████▋  | 933/1208 [26:43<07:52,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=2649.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  77%|███████▋  | 934/1208 [26:44<07:50,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=2649.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  77%|███████▋  | 934/1208 [26:44<07:50,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000636, train/loss_step=0.188, global_step=2649.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  77%|███████▋  | 935/1208 [26:45<07:48,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000636, train/loss_step=0.188, global_step=2649.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  77%|███████▋  | 935/1208 [26:45<07:48,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000886, train/loss_step=0.241, global_step=2649.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  77%|███████▋  | 936/1208 [26:48<07:47,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000886, train/loss_step=0.241, global_step=2649.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  77%|███████▋  | 936/1208 [26:48<07:47,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=0.000105, train/loss_step=0.0261, global_step=2649.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  78%|███████▊  | 937/1208 [26:49<07:45,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=0.000105, train/loss_step=0.0261, global_step=2649.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  78%|███████▊  | 937/1208 [26:49<07:45,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.565, train/loss_vlb_step=0.0151, train/loss_step=0.565, global_step=2650.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  78%|███████▊  | 938/1208 [26:50<07:43,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.565, train/loss_vlb_step=0.0151, train/loss_step=0.565, global_step=2650.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  78%|███████▊  | 938/1208 [26:50<07:43,  1.72s/it, loss=0.186, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00133, train/loss_step=0.307, global_step=2650.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  78%|███████▊  | 939/1208 [26:51<07:41,  1.72s/it, loss=0.186, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00133, train/loss_step=0.307, global_step=2650.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  78%|███████▊  | 939/1208 [26:51<07:41,  1.72s/it, loss=0.201, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00125, train/loss_step=0.299, global_step=2650.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  78%|███████▊  | 940/1208 [26:54<07:40,  1.72s/it, loss=0.201, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00125, train/loss_step=0.299, global_step=2650.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  78%|███████▊  | 940/1208 [26:54<07:40,  1.72s/it, loss=0.197, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.00035, train/loss_step=0.106, global_step=2650.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  78%|███████▊  | 941/1208 [26:55<07:38,  1.72s/it, loss=0.197, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.00035, train/loss_step=0.106, global_step=2650.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  78%|███████▊  | 941/1208 [26:55<07:38,  1.72s/it, loss=0.2, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.00017, train/loss_step=0.048, global_step=2651.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  78%|███████▊  | 942/1208 [26:56<07:36,  1.72s/it, loss=0.2, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.00017, train/loss_step=0.048, global_step=2651.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  78%|███████▊  | 942/1208 [26:56<07:36,  1.72s/it, loss=0.202, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000457, train/loss_step=0.139, global_step=2651.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  78%|███████▊  | 943/1208 [26:57<07:34,  1.71s/it, loss=0.202, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000457, train/loss_step=0.139, global_step=2651.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  78%|███████▊  | 943/1208 [26:57<07:34,  1.71s/it, loss=0.191, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000396, train/loss_step=0.120, global_step=2651.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  78%|███████▊  | 944/1208 [27:00<07:33,  1.72s/it, loss=0.191, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000396, train/loss_step=0.120, global_step=2651.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  78%|███████▊  | 944/1208 [27:00<07:33,  1.72s/it, loss=0.213, v_num=0, train/loss_simple_step=0.438, train/loss_vlb_step=0.00443, train/loss_step=0.438, global_step=2651.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  78%|███████▊  | 945/1208 [27:01<07:31,  1.72s/it, loss=0.213, v_num=0, train/loss_simple_step=0.438, train/loss_vlb_step=0.00443, train/loss_step=0.438, global_step=2651.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  78%|███████▊  | 945/1208 [27:01<07:31,  1.72s/it, loss=0.234, v_num=0, train/loss_simple_step=0.464, train/loss_vlb_step=0.0045, train/loss_step=0.464, global_step=2652.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  78%|███████▊  | 946/1208 [27:02<07:29,  1.71s/it, loss=0.234, v_num=0, train/loss_simple_step=0.464, train/loss_vlb_step=0.0045, train/loss_step=0.464, global_step=2652.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  78%|███████▊  | 946/1208 [27:02<07:29,  1.71s/it, loss=0.23, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000756, train/loss_step=0.202, global_step=2652.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  78%|███████▊  | 947/1208 [27:03<07:27,  1.71s/it, loss=0.23, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000756, train/loss_step=0.202, global_step=2652.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  78%|███████▊  | 947/1208 [27:03<07:27,  1.71s/it, loss=0.222, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000566, train/loss_step=0.168, global_step=2652.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  78%|███████▊  | 948/1208 [27:06<07:25,  1.72s/it, loss=0.222, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000566, train/loss_step=0.168, global_step=2652.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  78%|███████▊  | 948/1208 [27:06<07:25,  1.72s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0854, train/loss_vlb_step=0.000283, train/loss_step=0.0854, global_step=2652.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  79%|███████▊  | 949/1208 [27:07<07:24,  1.71s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0854, train/loss_vlb_step=0.000283, train/loss_step=0.0854, global_step=2652.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  79%|███████▊  | 949/1208 [27:07<07:24,  1.71s/it, loss=0.218, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000109, train/loss_step=0.0277, global_step=2653.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  79%|███████▊  | 950/1208 [27:08<07:22,  1.71s/it, loss=0.218, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000109, train/loss_step=0.0277, global_step=2653.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  79%|███████▊  | 950/1208 [27:08<07:22,  1.71s/it, loss=0.229, v_num=0, train/loss_simple_step=0.545, train/loss_vlb_step=0.0103, train/loss_step=0.545, global_step=2653.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  79%|███████▊  | 951/1208 [27:09<07:20,  1.71s/it, loss=0.229, v_num=0, train/loss_simple_step=0.545, train/loss_vlb_step=0.0103, train/loss_step=0.545, global_step=2653.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  79%|███████▊  | 951/1208 [27:09<07:20,  1.71s/it, loss=0.224, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=7.98e-5, train/loss_step=0.0212, global_step=2653.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  79%|███████▉  | 952/1208 [27:11<07:18,  1.71s/it, loss=0.224, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=7.98e-5, train/loss_step=0.0212, global_step=2653.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  79%|███████▉  | 952/1208 [27:11<07:18,  1.71s/it, loss=0.214, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000602, train/loss_step=0.177, global_step=2653.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  79%|███████▉  | 953/1208 [27:12<07:16,  1.71s/it, loss=0.214, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000602, train/loss_step=0.177, global_step=2653.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  79%|███████▉  | 953/1208 [27:12<07:16,  1.71s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000119, train/loss_step=0.0295, global_step=2654.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  79%|███████▉  | 954/1208 [27:13<07:15,  1.71s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000119, train/loss_step=0.0295, global_step=2654.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  79%|███████▉  | 954/1208 [27:13<07:15,  1.71s/it, loss=0.201, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=2.76e-5, train/loss_step=0.00526, global_step=2654.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  79%|███████▉  | 955/1208 [27:14<07:13,  1.71s/it, loss=0.201, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=2.76e-5, train/loss_step=0.00526, global_step=2654.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  79%|███████▉  | 955/1208 [27:14<07:13,  1.71s/it, loss=0.202, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00106, train/loss_step=0.260, global_step=2654.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  79%|███████▉  | 956/1208 [27:17<07:11,  1.71s/it, loss=0.202, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00106, train/loss_step=0.260, global_step=2654.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  79%|███████▉  | 956/1208 [27:17<07:11,  1.71s/it, loss=0.208, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000499, train/loss_step=0.151, global_step=2654.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  79%|███████▉  | 957/1208 [27:18<07:09,  1.71s/it, loss=0.208, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000499, train/loss_step=0.151, global_step=2654.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  79%|███████▉  | 957/1208 [27:18<07:09,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.37e-5, train/loss_step=0.0145, global_step=2655.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  79%|███████▉  | 958/1208 [27:19<07:07,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.37e-5, train/loss_step=0.0145, global_step=2655.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  79%|███████▉  | 958/1208 [27:19<07:07,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000489, train/loss_step=0.147, global_step=2655.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  79%|███████▉  | 959/1208 [27:20<07:06,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000489, train/loss_step=0.147, global_step=2655.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  79%|███████▉  | 959/1208 [27:20<07:06,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.0013, train/loss_step=0.298, global_step=2655.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  79%|███████▉  | 960/1208 [27:23<07:04,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.0013, train/loss_step=0.298, global_step=2655.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  79%|███████▉  | 960/1208 [27:23<07:04,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.51e-5, train/loss_step=0.00265, global_step=2655.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  80%|███████▉  | 961/1208 [27:24<07:02,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.51e-5, train/loss_step=0.00265, global_step=2655.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  80%|███████▉  | 961/1208 [27:24<07:02,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00114, train/loss_step=0.280, global_step=2656.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  80%|███████▉  | 962/1208 [27:25<07:00,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00114, train/loss_step=0.280, global_step=2656.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  80%|███████▉  | 962/1208 [27:25<07:00,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000374, train/loss_step=0.114, global_step=2656.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  80%|███████▉  | 963/1208 [27:26<06:58,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000374, train/loss_step=0.114, global_step=2656.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  80%|███████▉  | 963/1208 [27:26<06:58,  1.71s/it, loss=0.194, v_num=0, train/loss_simple_step=0.441, train/loss_vlb_step=0.00422, train/loss_step=0.441, global_step=2656.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  80%|███████▉  | 964/1208 [27:29<06:57,  1.71s/it, loss=0.194, v_num=0, train/loss_simple_step=0.441, train/loss_vlb_step=0.00422, train/loss_step=0.441, global_step=2656.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  80%|███████▉  | 964/1208 [27:29<06:57,  1.71s/it, loss=0.184, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.000996, train/loss_step=0.252, global_step=2656.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  80%|███████▉  | 965/1208 [27:30<06:55,  1.71s/it, loss=0.184, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.000996, train/loss_step=0.252, global_step=2656.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  80%|███████▉  | 965/1208 [27:30<06:55,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.505, train/loss_vlb_step=0.00826, train/loss_step=0.505, global_step=2657.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  80%|███████▉  | 966/1208 [27:31<06:53,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.505, train/loss_vlb_step=0.00826, train/loss_step=0.505, global_step=2657.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  80%|███████▉  | 966/1208 [27:31<06:53,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000682, train/loss_step=0.190, global_step=2657.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  80%|████████  | 967/1208 [27:32<06:51,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000682, train/loss_step=0.190, global_step=2657.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  80%|████████  | 967/1208 [27:32<06:51,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000654, train/loss_step=0.177, global_step=2657.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  80%|████████  | 968/1208 [27:35<06:50,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000654, train/loss_step=0.177, global_step=2657.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  80%|████████  | 968/1208 [27:35<06:50,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00117, train/loss_step=0.257, global_step=2657.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  80%|████████  | 969/1208 [27:36<06:48,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00117, train/loss_step=0.257, global_step=2657.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  80%|████████  | 969/1208 [27:36<06:48,  1.71s/it, loss=0.194, v_num=0, train/loss_simple_step=0.00596, train/loss_vlb_step=3.07e-5, train/loss_step=0.00596, global_step=2658.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  80%|████████  | 970/1208 [27:37<06:46,  1.71s/it, loss=0.194, v_num=0, train/loss_simple_step=0.00596, train/loss_vlb_step=3.07e-5, train/loss_step=0.00596, global_step=2658.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  80%|████████  | 970/1208 [27:37<06:46,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000643, train/loss_step=0.184, global_step=2658.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  80%|████████  | 971/1208 [27:38<06:44,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000643, train/loss_step=0.184, global_step=2658.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  80%|████████  | 971/1208 [27:38<06:44,  1.71s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0043, train/loss_vlb_step=2.31e-5, train/loss_step=0.0043, global_step=2658.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  80%|████████  | 972/1208 [27:41<06:43,  1.71s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0043, train/loss_vlb_step=2.31e-5, train/loss_step=0.0043, global_step=2658.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  80%|████████  | 972/1208 [27:41<06:43,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=1.57e-5, train/loss_step=0.00276, global_step=2658.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  81%|████████  | 973/1208 [27:42<06:41,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=1.57e-5, train/loss_step=0.00276, global_step=2658.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  81%|████████  | 973/1208 [27:42<06:41,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0954, train/loss_vlb_step=0.000314, train/loss_step=0.0954, global_step=2659.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  81%|████████  | 974/1208 [27:43<06:39,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0954, train/loss_vlb_step=0.000314, train/loss_step=0.0954, global_step=2659.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  81%|████████  | 974/1208 [27:43<06:39,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.00046, train/loss_step=0.139, global_step=2659.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  81%|████████  | 975/1208 [27:44<06:37,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.00046, train/loss_step=0.139, global_step=2659.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  81%|████████  | 975/1208 [27:44<06:37,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00208, train/loss_step=0.373, global_step=2659.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  81%|████████  | 976/1208 [27:47<06:36,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00208, train/loss_step=0.373, global_step=2659.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  81%|████████  | 976/1208 [27:47<06:36,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000606, train/loss_step=0.170, global_step=2659.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  81%|████████  | 977/1208 [27:48<06:34,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000606, train/loss_step=0.170, global_step=2659.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  81%|████████  | 977/1208 [27:48<06:34,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00701, train/loss_vlb_step=3.53e-5, train/loss_step=0.00701, global_step=2660.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  81%|████████  | 978/1208 [27:49<06:32,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00701, train/loss_vlb_step=3.53e-5, train/loss_step=0.00701, global_step=2660.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  81%|████████  | 978/1208 [27:49<06:32,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000559, train/loss_step=0.162, global_step=2660.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  81%|████████  | 979/1208 [27:50<06:30,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000559, train/loss_step=0.162, global_step=2660.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  81%|████████  | 979/1208 [27:50<06:30,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000807, train/loss_step=0.207, global_step=2660.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  81%|████████  | 980/1208 [27:53<06:29,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000807, train/loss_step=0.207, global_step=2660.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  81%|████████  | 980/1208 [27:53<06:29,  1.71s/it, loss=0.187, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000631, train/loss_step=0.180, global_step=2660.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  81%|████████  | 981/1208 [27:54<06:27,  1.71s/it, loss=0.187, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000631, train/loss_step=0.180, global_step=2660.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  81%|████████  | 981/1208 [27:54<06:27,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000428, train/loss_step=0.130, global_step=2661.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  81%|████████▏ | 982/1208 [27:55<06:25,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000428, train/loss_step=0.130, global_step=2661.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  81%|████████▏ | 982/1208 [27:55<06:25,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.00011, train/loss_step=0.0275, global_step=2661.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  81%|████████▏ | 983/1208 [27:56<06:23,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.00011, train/loss_step=0.0275, global_step=2661.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  81%|████████▏ | 983/1208 [27:56<06:23,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=2661.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  81%|████████▏ | 984/1208 [27:59<06:22,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=2661.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  81%|████████▏ | 984/1208 [27:59<06:22,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000961, train/loss_step=0.238, global_step=2661.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  82%|████████▏ | 985/1208 [28:00<06:20,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000961, train/loss_step=0.238, global_step=2661.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  82%|████████▏ | 985/1208 [28:00<06:20,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00949, train/loss_vlb_step=4.51e-5, train/loss_step=0.00949, global_step=2662.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  82%|████████▏ | 986/1208 [28:01<06:18,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00949, train/loss_vlb_step=4.51e-5, train/loss_step=0.00949, global_step=2662.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  82%|████████▏ | 986/1208 [28:01<06:18,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00803, train/loss_vlb_step=3.97e-5, train/loss_step=0.00803, global_step=2662.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  82%|████████▏ | 987/1208 [28:02<06:16,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00803, train/loss_vlb_step=3.97e-5, train/loss_step=0.00803, global_step=2662.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  82%|████████▏ | 987/1208 [28:02<06:16,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.003, train/loss_step=0.385, global_step=2662.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]      Epoch 8:  82%|████████▏ | 988/1208 [28:05<06:15,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.003, train/loss_step=0.385, global_step=2662.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  82%|████████▏ | 988/1208 [28:05<06:15,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00203, train/loss_step=0.376, global_step=2662.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  82%|████████▏ | 989/1208 [28:06<06:13,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00203, train/loss_step=0.376, global_step=2662.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  82%|████████▏ | 989/1208 [28:06<06:13,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.57e-5, train/loss_step=0.0142, global_step=2663.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  82%|████████▏ | 990/1208 [28:07<06:11,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.57e-5, train/loss_step=0.0142, global_step=2663.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  82%|████████▏ | 990/1208 [28:07<06:11,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0045, train/loss_vlb_step=2.43e-5, train/loss_step=0.0045, global_step=2663.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  82%|████████▏ | 991/1208 [28:08<06:09,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0045, train/loss_vlb_step=2.43e-5, train/loss_step=0.0045, global_step=2663.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  82%|████████▏ | 991/1208 [28:08<06:09,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000474, train/loss_step=0.143, global_step=2663.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  82%|████████▏ | 992/1208 [28:11<06:08,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000474, train/loss_step=0.143, global_step=2663.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  82%|████████▏ | 992/1208 [28:11<06:08,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00181, train/loss_step=0.355, global_step=2663.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  82%|████████▏ | 993/1208 [28:12<06:06,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00181, train/loss_step=0.355, global_step=2663.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  82%|████████▏ | 993/1208 [28:12<06:06,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000481, train/loss_step=0.145, global_step=2664.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  82%|████████▏ | 994/1208 [28:13<06:04,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000481, train/loss_step=0.145, global_step=2664.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  82%|████████▏ | 994/1208 [28:13<06:04,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000842, train/loss_step=0.224, global_step=2664.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  82%|████████▏ | 995/1208 [28:14<06:02,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000842, train/loss_step=0.224, global_step=2664.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  82%|████████▏ | 995/1208 [28:14<06:02,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00206, train/loss_step=0.380, global_step=2664.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  82%|████████▏ | 996/1208 [28:17<06:01,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00206, train/loss_step=0.380, global_step=2664.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  82%|████████▏ | 996/1208 [28:17<06:01,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0661, train/loss_vlb_step=0.000227, train/loss_step=0.0661, global_step=2664.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  83%|████████▎ | 997/1208 [28:18<05:59,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0661, train/loss_vlb_step=0.000227, train/loss_step=0.0661, global_step=2664.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  83%|████████▎ | 997/1208 [28:18<05:59,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.000182, train/loss_step=0.0489, global_step=2665.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  83%|████████▎ | 998/1208 [28:19<05:57,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.000182, train/loss_step=0.0489, global_step=2665.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  83%|████████▎ | 998/1208 [28:19<05:57,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000759, train/loss_step=0.206, global_step=2665.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  83%|████████▎ | 999/1208 [28:20<05:55,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000759, train/loss_step=0.206, global_step=2665.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  83%|████████▎ | 999/1208 [28:20<05:55,  1.70s/it, loss=0.179, v_num=0, train/loss_simple_step=0.544, train/loss_vlb_step=0.00939, train/loss_step=0.544, global_step=2665.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  83%|████████▎ | 1000/1208 [28:23<05:54,  1.70s/it, loss=0.179, v_num=0, train/loss_simple_step=0.544, train/loss_vlb_step=0.00939, train/loss_step=0.544, global_step=2665.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  83%|████████▎ | 1000/1208 [28:23<05:54,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000407, train/loss_step=0.124, global_step=2665.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  83%|████████▎ | 1001/1208 [28:24<05:52,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000407, train/loss_step=0.124, global_step=2665.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  83%|████████▎ | 1001/1208 [28:24<05:52,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.16e-5, train/loss_step=0.0231, global_step=2666.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  83%|████████▎ | 1002/1208 [28:25<05:50,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.16e-5, train/loss_step=0.0231, global_step=2666.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  83%|████████▎ | 1002/1208 [28:25<05:50,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.51e-5, train/loss_step=0.00272, global_step=2666.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  83%|████████▎ | 1003/1208 [28:26<05:48,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.51e-5, train/loss_step=0.00272, global_step=2666.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  83%|████████▎ | 1003/1208 [28:26<05:48,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000111, train/loss_step=0.0286, global_step=2666.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  83%|████████▎ | 1004/1208 [28:28<05:47,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000111, train/loss_step=0.0286, global_step=2666.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  83%|████████▎ | 1004/1208 [28:28<05:47,  1.70s/it, loss=0.175, v_num=0, train/loss_simple_step=0.422, train/loss_vlb_step=0.00286, train/loss_step=0.422, global_step=2666.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  83%|████████▎ | 1005/1208 [28:29<05:45,  1.70s/it, loss=0.175, v_num=0, train/loss_simple_step=0.422, train/loss_vlb_step=0.00286, train/loss_step=0.422, global_step=2666.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  83%|████████▎ | 1005/1208 [28:29<05:45,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=2667.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  83%|████████▎ | 1006/1208 [28:30<05:43,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=2667.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  83%|████████▎ | 1006/1208 [28:30<05:43,  1.70s/it, loss=0.19, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000659, train/loss_step=0.191, global_step=2667.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  83%|████████▎ | 1007/1208 [28:31<05:41,  1.70s/it, loss=0.19, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000659, train/loss_step=0.191, global_step=2667.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  83%|████████▎ | 1007/1208 [28:31<05:41,  1.70s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.6e-5, train/loss_step=0.0214, global_step=2667.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  83%|████████▎ | 1008/1208 [28:34<05:40,  1.70s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.6e-5, train/loss_step=0.0214, global_step=2667.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  83%|████████▎ | 1008/1208 [28:34<05:40,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0554, train/loss_vlb_step=0.000186, train/loss_step=0.0554, global_step=2667.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  84%|████████▎ | 1009/1208 [28:35<05:38,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0554, train/loss_vlb_step=0.000186, train/loss_step=0.0554, global_step=2667.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  84%|████████▎ | 1009/1208 [28:35<05:38,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000686, train/loss_step=0.184, global_step=2668.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  84%|████████▎ | 1010/1208 [28:36<05:36,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000686, train/loss_step=0.184, global_step=2668.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  84%|████████▎ | 1010/1208 [28:36<05:36,  1.70s/it, loss=0.206, v_num=0, train/loss_simple_step=0.823, train/loss_vlb_step=0.0839, train/loss_step=0.823, global_step=2668.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  84%|████████▎ | 1011/1208 [28:37<05:34,  1.70s/it, loss=0.206, v_num=0, train/loss_simple_step=0.823, train/loss_vlb_step=0.0839, train/loss_step=0.823, global_step=2668.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  84%|████████▎ | 1011/1208 [28:37<05:34,  1.70s/it, loss=0.21, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.00102, train/loss_step=0.234, global_step=2668.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  84%|████████▍ | 1012/1208 [28:40<05:33,  1.70s/it, loss=0.21, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.00102, train/loss_step=0.234, global_step=2668.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  84%|████████▍ | 1012/1208 [28:40<05:33,  1.70s/it, loss=0.201, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000644, train/loss_step=0.174, global_step=2668.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  84%|████████▍ | 1013/1208 [28:41<05:31,  1.70s/it, loss=0.201, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000644, train/loss_step=0.174, global_step=2668.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  84%|████████▍ | 1013/1208 [28:41<05:31,  1.70s/it, loss=0.208, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00127, train/loss_step=0.290, global_step=2669.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  84%|████████▍ | 1014/1208 [28:42<05:29,  1.70s/it, loss=0.208, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00127, train/loss_step=0.290, global_step=2669.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  84%|████████▍ | 1014/1208 [28:42<05:29,  1.70s/it, loss=0.205, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000547, train/loss_step=0.162, global_step=2669.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  84%|████████▍ | 1015/1208 [28:43<05:27,  1.70s/it, loss=0.205, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000547, train/loss_step=0.162, global_step=2669.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  84%|████████▍ | 1015/1208 [28:43<05:27,  1.70s/it, loss=0.206, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00437, train/loss_step=0.395, global_step=2669.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  84%|████████▍ | 1016/1208 [28:46<05:26,  1.70s/it, loss=0.206, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00437, train/loss_step=0.395, global_step=2669.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  84%|████████▍ | 1016/1208 [28:46<05:26,  1.70s/it, loss=0.203, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.19e-5, train/loss_step=0.00199, global_step=2669.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  84%|████████▍ | 1017/1208 [28:47<05:24,  1.70s/it, loss=0.203, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.19e-5, train/loss_step=0.00199, global_step=2669.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  84%|████████▍ | 1017/1208 [28:47<05:24,  1.70s/it, loss=0.21, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000714, train/loss_step=0.193, global_step=2670.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  84%|████████▍ | 1018/1208 [28:48<05:22,  1.70s/it, loss=0.21, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000714, train/loss_step=0.193, global_step=2670.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  84%|████████▍ | 1018/1208 [28:48<05:22,  1.70s/it, loss=0.21, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000762, train/loss_step=0.203, global_step=2670.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  84%|████████▍ | 1019/1208 [28:49<05:20,  1.70s/it, loss=0.21, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000762, train/loss_step=0.203, global_step=2670.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  84%|████████▍ | 1019/1208 [28:49<05:20,  1.70s/it, loss=0.208, v_num=0, train/loss_simple_step=0.513, train/loss_vlb_step=0.00478, train/loss_step=0.513, global_step=2670.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  84%|████████▍ | 1020/1208 [28:52<05:19,  1.70s/it, loss=0.208, v_num=0, train/loss_simple_step=0.513, train/loss_vlb_step=0.00478, train/loss_step=0.513, global_step=2670.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  84%|████████▍ | 1020/1208 [28:52<05:19,  1.70s/it, loss=0.208, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000417, train/loss_step=0.126, global_step=2670.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  85%|████████▍ | 1021/1208 [28:53<05:17,  1.70s/it, loss=0.208, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000417, train/loss_step=0.126, global_step=2670.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  85%|████████▍ | 1021/1208 [28:53<05:17,  1.70s/it, loss=0.213, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000401, train/loss_step=0.122, global_step=2671.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  85%|████████▍ | 1022/1208 [28:54<05:15,  1.70s/it, loss=0.213, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000401, train/loss_step=0.122, global_step=2671.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  85%|████████▍ | 1022/1208 [28:54<05:15,  1.70s/it, loss=0.215, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000145, train/loss_step=0.0388, global_step=2671.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  85%|████████▍ | 1023/1208 [28:55<05:13,  1.70s/it, loss=0.215, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000145, train/loss_step=0.0388, global_step=2671.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  85%|████████▍ | 1023/1208 [28:55<05:13,  1.70s/it, loss=0.228, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.0013, train/loss_step=0.286, global_step=2671.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  85%|████████▍ | 1024/1208 [28:58<05:12,  1.70s/it, loss=0.228, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.0013, train/loss_step=0.286, global_step=2671.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  85%|████████▍ | 1024/1208 [28:58<05:12,  1.70s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.73e-5, train/loss_step=0.0242, global_step=2671.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  85%|████████▍ | 1025/1208 [28:59<05:10,  1.70s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.73e-5, train/loss_step=0.0242, global_step=2671.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  85%|████████▍ | 1025/1208 [28:59<05:10,  1.70s/it, loss=0.223, v_num=0, train/loss_simple_step=0.426, train/loss_vlb_step=0.00397, train/loss_step=0.426, global_step=2672.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  85%|████████▍ | 1026/1208 [29:00<05:08,  1.70s/it, loss=0.223, v_num=0, train/loss_simple_step=0.426, train/loss_vlb_step=0.00397, train/loss_step=0.426, global_step=2672.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  85%|████████▍ | 1026/1208 [29:00<05:08,  1.70s/it, loss=0.232, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00355, train/loss_step=0.376, global_step=2672.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  85%|████████▌ | 1027/1208 [29:01<05:06,  1.70s/it, loss=0.232, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00355, train/loss_step=0.376, global_step=2672.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  85%|████████▌ | 1027/1208 [29:01<05:06,  1.70s/it, loss=0.232, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.34e-5, train/loss_step=0.0115, global_step=2672.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  85%|████████▌ | 1028/1208 [29:04<05:05,  1.70s/it, loss=0.232, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.34e-5, train/loss_step=0.0115, global_step=2672.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  85%|████████▌ | 1028/1208 [29:04<05:05,  1.70s/it, loss=0.23, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=9.03e-5, train/loss_step=0.0214, global_step=2672.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  85%|████████▌ | 1029/1208 [29:05<05:03,  1.70s/it, loss=0.23, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=9.03e-5, train/loss_step=0.0214, global_step=2672.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  85%|████████▌ | 1029/1208 [29:05<05:03,  1.70s/it, loss=0.225, v_num=0, train/loss_simple_step=0.0819, train/loss_vlb_step=0.000274, train/loss_step=0.0819, global_step=2673.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  85%|████████▌ | 1030/1208 [29:06<05:01,  1.70s/it, loss=0.225, v_num=0, train/loss_simple_step=0.0819, train/loss_vlb_step=0.000274, train/loss_step=0.0819, global_step=2673.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  85%|████████▌ | 1030/1208 [29:06<05:01,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=8.89e-5, train/loss_step=0.0222, global_step=2673.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  85%|████████▌ | 1031/1208 [29:07<05:00,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=8.89e-5, train/loss_step=0.0222, global_step=2673.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  85%|████████▌ | 1031/1208 [29:07<05:00,  1.70s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00851, train/loss_vlb_step=4.12e-5, train/loss_step=0.00851, global_step=2673.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  85%|████████▌ | 1032/1208 [29:10<04:58,  1.70s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00851, train/loss_vlb_step=4.12e-5, train/loss_step=0.00851, global_step=2673.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  85%|████████▌ | 1032/1208 [29:10<04:58,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00204, train/loss_step=0.372, global_step=2673.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  86%|████████▌ | 1033/1208 [29:11<04:56,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00204, train/loss_step=0.372, global_step=2673.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  86%|████████▌ | 1033/1208 [29:11<04:56,  1.70s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.43e-5, train/loss_step=0.00249, global_step=2674.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  86%|████████▌ | 1034/1208 [29:12<04:54,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.43e-5, train/loss_step=0.00249, global_step=2674.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  86%|████████▌ | 1034/1208 [29:12<04:54,  1.69s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=8.05e-5, train/loss_step=0.0185, global_step=2674.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  86%|████████▌ | 1035/1208 [29:13<04:53,  1.69s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=8.05e-5, train/loss_step=0.0185, global_step=2674.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  86%|████████▌ | 1035/1208 [29:13<04:53,  1.69s/it, loss=0.154, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000926, train/loss_step=0.242, global_step=2674.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  86%|████████▌ | 1036/1208 [29:16<04:51,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000926, train/loss_step=0.242, global_step=2674.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  86%|████████▌ | 1036/1208 [29:16<04:51,  1.70s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.36e-5, train/loss_step=0.0166, global_step=2674.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  86%|████████▌ | 1037/1208 [29:17<04:49,  1.69s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.36e-5, train/loss_step=0.0166, global_step=2674.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  86%|████████▌ | 1037/1208 [29:17<04:49,  1.69s/it, loss=0.156, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000811, train/loss_step=0.218, global_step=2675.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  86%|████████▌ | 1038/1208 [29:18<04:47,  1.69s/it, loss=0.156, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000811, train/loss_step=0.218, global_step=2675.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  86%|████████▌ | 1038/1208 [29:18<04:47,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0921, train/loss_vlb_step=0.000303, train/loss_step=0.0921, global_step=2675.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  86%|████████▌ | 1039/1208 [29:19<04:46,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0921, train/loss_vlb_step=0.000303, train/loss_step=0.0921, global_step=2675.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  86%|████████▌ | 1039/1208 [29:19<04:46,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.00047, train/loss_step=0.142, global_step=2675.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  86%|████████▌ | 1040/1208 [29:22<04:44,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.00047, train/loss_step=0.142, global_step=2675.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  86%|████████▌ | 1040/1208 [29:22<04:44,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0539, train/loss_vlb_step=0.000184, train/loss_step=0.0539, global_step=2675.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  86%|████████▌ | 1041/1208 [29:23<04:42,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0539, train/loss_vlb_step=0.000184, train/loss_step=0.0539, global_step=2675.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  86%|████████▌ | 1041/1208 [29:23<04:42,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=2676.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  86%|████████▋ | 1042/1208 [29:24<04:41,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=2676.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  86%|████████▋ | 1042/1208 [29:24<04:41,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000458, train/loss_step=0.139, global_step=2676.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  86%|████████▋ | 1043/1208 [29:25<04:39,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000458, train/loss_step=0.139, global_step=2676.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  86%|████████▋ | 1043/1208 [29:25<04:39,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.00036, train/loss_step=0.109, global_step=2676.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  86%|████████▋ | 1044/1208 [29:28<04:37,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.00036, train/loss_step=0.109, global_step=2676.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  86%|████████▋ | 1044/1208 [29:28<04:37,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00097, train/loss_step=0.243, global_step=2676.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  87%|████████▋ | 1045/1208 [29:29<04:35,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00097, train/loss_step=0.243, global_step=2676.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  87%|████████▋ | 1045/1208 [29:29<04:35,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000377, train/loss_step=0.115, global_step=2677.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  87%|████████▋ | 1046/1208 [29:30<04:34,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000377, train/loss_step=0.115, global_step=2677.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  87%|████████▋ | 1046/1208 [29:30<04:34,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0872, train/loss_vlb_step=0.000289, train/loss_step=0.0872, global_step=2677.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  87%|████████▋ | 1047/1208 [29:31<04:32,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0872, train/loss_vlb_step=0.000289, train/loss_step=0.0872, global_step=2677.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  87%|████████▋ | 1047/1208 [29:31<04:32,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00823, train/loss_vlb_step=4.08e-5, train/loss_step=0.00823, global_step=2677.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  87%|████████▋ | 1048/1208 [29:34<04:30,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00823, train/loss_vlb_step=4.08e-5, train/loss_step=0.00823, global_step=2677.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  87%|████████▋ | 1048/1208 [29:34<04:30,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.00014, train/loss_step=0.0345, global_step=2677.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  87%|████████▋ | 1049/1208 [29:35<04:29,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.00014, train/loss_step=0.0345, global_step=2677.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  87%|████████▋ | 1049/1208 [29:35<04:29,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.72e-5, train/loss_step=0.0174, global_step=2678.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  87%|████████▋ | 1050/1208 [29:36<04:27,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.72e-5, train/loss_step=0.0174, global_step=2678.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  87%|████████▋ | 1050/1208 [29:36<04:27,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000884, train/loss_step=0.216, global_step=2678.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  87%|████████▋ | 1051/1208 [29:37<04:25,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000884, train/loss_step=0.216, global_step=2678.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  87%|████████▋ | 1051/1208 [29:37<04:25,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.41e-5, train/loss_step=0.0144, global_step=2678.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  87%|████████▋ | 1052/1208 [29:40<04:23,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.41e-5, train/loss_step=0.0144, global_step=2678.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  87%|████████▋ | 1052/1208 [29:40<04:23,  1.69s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.54e-5, train/loss_step=0.00265, global_step=2678.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  87%|████████▋ | 1053/1208 [29:41<04:22,  1.69s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.54e-5, train/loss_step=0.00265, global_step=2678.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  87%|████████▋ | 1053/1208 [29:41<04:22,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.480, train/loss_vlb_step=0.00523, train/loss_step=0.480, global_step=2679.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]     Epoch 8:  87%|████████▋ | 1054/1208 [29:42<04:20,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.480, train/loss_vlb_step=0.00523, train/loss_step=0.480, global_step=2679.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  87%|████████▋ | 1054/1208 [29:42<04:20,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00865, train/loss_vlb_step=4.08e-5, train/loss_step=0.00865, global_step=2679.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  87%|████████▋ | 1055/1208 [29:43<04:18,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00865, train/loss_vlb_step=4.08e-5, train/loss_step=0.00865, global_step=2679.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  87%|████████▋ | 1055/1208 [29:43<04:18,  1.69s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0549, train/loss_vlb_step=0.000198, train/loss_step=0.0549, global_step=2679.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  87%|████████▋ | 1056/1208 [29:45<04:17,  1.69s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0549, train/loss_vlb_step=0.000198, train/loss_step=0.0549, global_step=2679.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  87%|████████▋ | 1056/1208 [29:45<04:17,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.21e-5, train/loss_step=0.00208, global_step=2679.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  88%|████████▊ | 1057/1208 [29:46<04:15,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.21e-5, train/loss_step=0.00208, global_step=2679.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  88%|████████▊ | 1057/1208 [29:46<04:15,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00337, train/loss_step=0.457, global_step=2680.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]     Epoch 8:  88%|████████▊ | 1058/1208 [29:47<04:13,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00337, train/loss_step=0.457, global_step=2680.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  88%|████████▊ | 1058/1208 [29:47<04:13,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00185, train/loss_step=0.342, global_step=2680.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  88%|████████▊ | 1059/1208 [29:48<04:11,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00185, train/loss_step=0.342, global_step=2680.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  88%|████████▊ | 1059/1208 [29:48<04:11,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=2680.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  88%|████████▊ | 1060/1208 [29:51<04:10,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=2680.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  88%|████████▊ | 1060/1208 [29:51<04:10,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000461, train/loss_step=0.136, global_step=2680.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  88%|████████▊ | 1061/1208 [29:52<04:08,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000461, train/loss_step=0.136, global_step=2680.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  88%|████████▊ | 1061/1208 [29:52<04:08,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.00012, train/loss_step=0.031, global_step=2681.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  88%|████████▊ | 1062/1208 [29:53<04:06,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.00012, train/loss_step=0.031, global_step=2681.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  88%|████████▊ | 1062/1208 [29:53<04:06,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000846, train/loss_step=0.229, global_step=2681.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  88%|████████▊ | 1063/1208 [29:54<04:04,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000846, train/loss_step=0.229, global_step=2681.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  88%|████████▊ | 1063/1208 [29:54<04:04,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0559, train/loss_vlb_step=0.000194, train/loss_step=0.0559, global_step=2681.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  88%|████████▊ | 1064/1208 [29:57<04:03,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0559, train/loss_vlb_step=0.000194, train/loss_step=0.0559, global_step=2681.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  88%|████████▊ | 1064/1208 [29:57<04:03,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.17e-5, train/loss_step=0.0112, global_step=2681.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  88%|████████▊ | 1065/1208 [29:58<04:01,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.17e-5, train/loss_step=0.0112, global_step=2681.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  88%|████████▊ | 1065/1208 [29:58<04:01,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000976, train/loss_step=0.234, global_step=2682.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  88%|████████▊ | 1066/1208 [29:59<03:59,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000976, train/loss_step=0.234, global_step=2682.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  88%|████████▊ | 1066/1208 [29:59<03:59,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0512, train/loss_vlb_step=0.000181, train/loss_step=0.0512, global_step=2682.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  88%|████████▊ | 1067/1208 [30:00<03:57,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0512, train/loss_vlb_step=0.000181, train/loss_step=0.0512, global_step=2682.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  88%|████████▊ | 1067/1208 [30:00<03:57,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00752, train/loss_vlb_step=3.66e-5, train/loss_step=0.00752, global_step=2682.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  88%|████████▊ | 1068/1208 [30:03<03:56,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00752, train/loss_vlb_step=3.66e-5, train/loss_step=0.00752, global_step=2682.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  88%|████████▊ | 1068/1208 [30:03<03:56,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00422, train/loss_vlb_step=2.26e-5, train/loss_step=0.00422, global_step=2682.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  88%|████████▊ | 1069/1208 [30:04<03:54,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00422, train/loss_vlb_step=2.26e-5, train/loss_step=0.00422, global_step=2682.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  88%|████████▊ | 1069/1208 [30:04<03:54,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000694, train/loss_step=0.197, global_step=2683.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  89%|████████▊ | 1070/1208 [30:05<03:52,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000694, train/loss_step=0.197, global_step=2683.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  89%|████████▊ | 1070/1208 [30:05<03:52,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0576, train/loss_vlb_step=0.000207, train/loss_step=0.0576, global_step=2683.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  89%|████████▊ | 1071/1208 [30:06<03:51,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0576, train/loss_vlb_step=0.000207, train/loss_step=0.0576, global_step=2683.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  89%|████████▊ | 1071/1208 [30:06<03:51,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000411, train/loss_step=0.124, global_step=2683.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  89%|████████▊ | 1072/1208 [30:09<03:49,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000411, train/loss_step=0.124, global_step=2683.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  89%|████████▊ | 1072/1208 [30:09<03:49,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=2683.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  89%|████████▉ | 1073/1208 [30:10<03:47,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=2683.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  89%|████████▉ | 1073/1208 [30:10<03:47,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00172, train/loss_step=0.340, global_step=2684.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  89%|████████▉ | 1074/1208 [30:11<03:46,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00172, train/loss_step=0.340, global_step=2684.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  89%|████████▉ | 1074/1208 [30:11<03:46,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=1.13e-5, train/loss_step=0.00187, global_step=2684.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  89%|████████▉ | 1075/1208 [30:12<03:44,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=1.13e-5, train/loss_step=0.00187, global_step=2684.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  89%|████████▉ | 1075/1208 [30:12<03:44,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000753, train/loss_step=0.213, global_step=2684.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  89%|████████▉ | 1076/1208 [30:15<03:42,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000753, train/loss_step=0.213, global_step=2684.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  89%|████████▉ | 1076/1208 [30:15<03:42,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0559, train/loss_vlb_step=0.000198, train/loss_step=0.0559, global_step=2684.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  89%|████████▉ | 1077/1208 [30:16<03:40,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0559, train/loss_vlb_step=0.000198, train/loss_step=0.0559, global_step=2684.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  89%|████████▉ | 1077/1208 [30:16<03:40,  1.69s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00723, train/loss_vlb_step=3.8e-5, train/loss_step=0.00723, global_step=2685.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  89%|████████▉ | 1078/1208 [30:17<03:39,  1.69s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00723, train/loss_vlb_step=3.8e-5, train/loss_step=0.00723, global_step=2685.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  89%|████████▉ | 1078/1208 [30:17<03:39,  1.69s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.61e-5, train/loss_step=0.0125, global_step=2685.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  89%|████████▉ | 1079/1208 [30:18<03:37,  1.69s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.61e-5, train/loss_step=0.0125, global_step=2685.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  89%|████████▉ | 1079/1208 [30:18<03:37,  1.69s/it, loss=0.098, v_num=0, train/loss_simple_step=0.0837, train/loss_vlb_step=0.000283, train/loss_step=0.0837, global_step=2685.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  89%|████████▉ | 1080/1208 [30:21<03:35,  1.69s/it, loss=0.098, v_num=0, train/loss_simple_step=0.0837, train/loss_vlb_step=0.000283, train/loss_step=0.0837, global_step=2685.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  89%|████████▉ | 1080/1208 [30:21<03:35,  1.69s/it, loss=0.11, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.0024, train/loss_step=0.383, global_step=2685.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]     Epoch 8:  89%|████████▉ | 1081/1208 [30:22<03:34,  1.69s/it, loss=0.11, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.0024, train/loss_step=0.383, global_step=2685.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  89%|████████▉ | 1081/1208 [30:22<03:34,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0863, train/loss_vlb_step=0.000289, train/loss_step=0.0863, global_step=2686.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  90%|████████▉ | 1082/1208 [30:23<03:32,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0863, train/loss_vlb_step=0.000289, train/loss_step=0.0863, global_step=2686.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  90%|████████▉ | 1082/1208 [30:23<03:32,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=1.68e-5, train/loss_step=0.00309, global_step=2686.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  90%|████████▉ | 1083/1208 [30:24<03:30,  1.68s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=1.68e-5, train/loss_step=0.00309, global_step=2686.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  90%|████████▉ | 1083/1208 [30:24<03:30,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00115, train/loss_step=0.255, global_step=2686.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  90%|████████▉ | 1084/1208 [30:27<03:29,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00115, train/loss_step=0.255, global_step=2686.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  90%|████████▉ | 1084/1208 [30:27<03:29,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.551, train/loss_vlb_step=0.00902, train/loss_step=0.551, global_step=2686.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  90%|████████▉ | 1085/1208 [30:28<03:27,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.551, train/loss_vlb_step=0.00902, train/loss_step=0.551, global_step=2686.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  90%|████████▉ | 1085/1208 [30:28<03:27,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.47e-5, train/loss_step=0.0214, global_step=2687.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  90%|████████▉ | 1086/1208 [30:29<03:25,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.47e-5, train/loss_step=0.0214, global_step=2687.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  90%|████████▉ | 1086/1208 [30:29<03:25,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00124, train/loss_step=0.267, global_step=2687.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  90%|████████▉ | 1087/1208 [30:30<03:23,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00124, train/loss_step=0.267, global_step=2687.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  90%|████████▉ | 1087/1208 [30:30<03:23,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0696, train/loss_vlb_step=0.000237, train/loss_step=0.0696, global_step=2687.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  90%|█████████ | 1088/1208 [30:33<03:22,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0696, train/loss_vlb_step=0.000237, train/loss_step=0.0696, global_step=2687.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  90%|█████████ | 1088/1208 [30:33<03:22,  1.68s/it, loss=0.171, v_num=0, train/loss_simple_step=0.584, train/loss_vlb_step=0.0122, train/loss_step=0.584, global_step=2687.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  90%|█████████ | 1089/1208 [30:34<03:20,  1.68s/it, loss=0.171, v_num=0, train/loss_simple_step=0.584, train/loss_vlb_step=0.0122, train/loss_step=0.584, global_step=2687.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  90%|█████████ | 1089/1208 [30:34<03:20,  1.68s/it, loss=0.168, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000456, train/loss_step=0.136, global_step=2688.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  90%|█████████ | 1090/1208 [30:35<03:18,  1.68s/it, loss=0.168, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000456, train/loss_step=0.136, global_step=2688.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  90%|█████████ | 1090/1208 [30:35<03:18,  1.68s/it, loss=0.172, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000484, train/loss_step=0.146, global_step=2688.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  90%|█████████ | 1091/1208 [30:36<03:16,  1.68s/it, loss=0.172, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000484, train/loss_step=0.146, global_step=2688.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  90%|█████████ | 1091/1208 [30:36<03:16,  1.68s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0677, train/loss_vlb_step=0.000233, train/loss_step=0.0677, global_step=2688.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  90%|█████████ | 1092/1208 [30:39<03:15,  1.68s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0677, train/loss_vlb_step=0.000233, train/loss_step=0.0677, global_step=2688.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  90%|█████████ | 1092/1208 [30:39<03:15,  1.68s/it, loss=0.179, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00156, train/loss_step=0.296, global_step=2688.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  90%|█████████ | 1093/1208 [30:40<03:13,  1.68s/it, loss=0.179, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00156, train/loss_step=0.296, global_step=2688.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  90%|█████████ | 1093/1208 [30:40<03:13,  1.68s/it, loss=0.169, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000579, train/loss_step=0.150, global_step=2689.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  91%|█████████ | 1094/1208 [30:41<03:11,  1.68s/it, loss=0.169, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000579, train/loss_step=0.150, global_step=2689.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  91%|█████████ | 1094/1208 [30:41<03:11,  1.68s/it, loss=0.18, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.00079, train/loss_step=0.212, global_step=2689.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  91%|█████████ | 1095/1208 [30:42<03:10,  1.68s/it, loss=0.18, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.00079, train/loss_step=0.212, global_step=2689.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  91%|█████████ | 1095/1208 [30:42<03:10,  1.68s/it, loss=0.18, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000772, train/loss_step=0.216, global_step=2689.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  91%|█████████ | 1096/1208 [30:45<03:08,  1.68s/it, loss=0.18, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000772, train/loss_step=0.216, global_step=2689.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  91%|█████████ | 1096/1208 [30:45<03:08,  1.68s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000117, train/loss_step=0.0291, global_step=2689.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  91%|█████████ | 1097/1208 [30:46<03:06,  1.68s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000117, train/loss_step=0.0291, global_step=2689.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  91%|█████████ | 1097/1208 [30:46<03:06,  1.68s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.5e-5, train/loss_step=0.0234, global_step=2690.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  91%|█████████ | 1098/1208 [30:47<03:05,  1.68s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.5e-5, train/loss_step=0.0234, global_step=2690.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  91%|█████████ | 1098/1208 [30:47<03:05,  1.68s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0793, train/loss_vlb_step=0.000266, train/loss_step=0.0793, global_step=2690.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  91%|█████████ | 1099/1208 [30:48<03:03,  1.68s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0793, train/loss_vlb_step=0.000266, train/loss_step=0.0793, global_step=2690.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  91%|█████████ | 1099/1208 [30:48<03:03,  1.68s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=1.31e-5, train/loss_step=0.00223, global_step=2690.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  91%|█████████ | 1100/1208 [30:51<03:01,  1.68s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=1.31e-5, train/loss_step=0.00223, global_step=2690.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  91%|█████████ | 1100/1208 [30:51<03:01,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.26e-5, train/loss_step=0.00215, global_step=2690.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  91%|█████████ | 1101/1208 [30:52<02:59,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.26e-5, train/loss_step=0.00215, global_step=2690.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  91%|█████████ | 1101/1208 [30:52<02:59,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.72e-5, train/loss_step=0.0151, global_step=2691.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  91%|█████████ | 1102/1208 [30:53<02:58,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.72e-5, train/loss_step=0.0151, global_step=2691.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  91%|█████████ | 1102/1208 [30:53<02:58,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.71e-5, train/loss_step=0.0122, global_step=2691.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  91%|█████████▏| 1103/1208 [30:54<02:56,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.71e-5, train/loss_step=0.0122, global_step=2691.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  91%|█████████▏| 1103/1208 [30:54<02:56,  1.68s/it, loss=0.155, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000857, train/loss_step=0.213, global_step=2691.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  91%|█████████▏| 1104/1208 [30:56<02:54,  1.68s/it, loss=0.155, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000857, train/loss_step=0.213, global_step=2691.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  91%|█████████▏| 1104/1208 [30:56<02:54,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000959, train/loss_step=0.241, global_step=2691.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  91%|█████████▏| 1105/1208 [30:57<02:53,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000959, train/loss_step=0.241, global_step=2691.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  91%|█████████▏| 1105/1208 [30:57<02:53,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00657, train/loss_vlb_step=3.35e-5, train/loss_step=0.00657, global_step=2692.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  92%|█████████▏| 1106/1208 [30:58<02:51,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00657, train/loss_vlb_step=3.35e-5, train/loss_step=0.00657, global_step=2692.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  92%|█████████▏| 1106/1208 [30:58<02:51,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000584, train/loss_step=0.169, global_step=2692.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  92%|█████████▏| 1107/1208 [30:59<02:49,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000584, train/loss_step=0.169, global_step=2692.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  92%|█████████▏| 1107/1208 [30:59<02:49,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.426, train/loss_vlb_step=0.00437, train/loss_step=0.426, global_step=2692.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  92%|█████████▏| 1108/1208 [31:02<02:48,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.426, train/loss_vlb_step=0.00437, train/loss_step=0.426, global_step=2692.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  92%|█████████▏| 1108/1208 [31:02<02:48,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0919, train/loss_vlb_step=0.000302, train/loss_step=0.0919, global_step=2692.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  92%|█████████▏| 1109/1208 [31:03<02:46,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0919, train/loss_vlb_step=0.000302, train/loss_step=0.0919, global_step=2692.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  92%|█████████▏| 1109/1208 [31:03<02:46,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00113, train/loss_step=0.260, global_step=2693.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  92%|█████████▏| 1110/1208 [31:04<02:44,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00113, train/loss_step=0.260, global_step=2693.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  92%|█████████▏| 1110/1208 [31:04<02:44,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000679, train/loss_step=0.181, global_step=2693.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  92%|█████████▏| 1111/1208 [31:05<02:42,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000679, train/loss_step=0.181, global_step=2693.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  92%|█████████▏| 1111/1208 [31:05<02:42,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.000993, train/loss_step=0.268, global_step=2693.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  92%|█████████▏| 1112/1208 [31:08<02:41,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.000993, train/loss_step=0.268, global_step=2693.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  92%|█████████▏| 1112/1208 [31:08<02:41,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000666, train/loss_step=0.190, global_step=2693.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  92%|█████████▏| 1113/1208 [31:09<02:39,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000666, train/loss_step=0.190, global_step=2693.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  92%|█████████▏| 1113/1208 [31:09<02:39,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.642, train/loss_vlb_step=0.0303, train/loss_step=0.642, global_step=2694.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  92%|█████████▏| 1114/1208 [31:10<02:37,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.642, train/loss_vlb_step=0.0303, train/loss_step=0.642, global_step=2694.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  92%|█████████▏| 1114/1208 [31:10<02:37,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000425, train/loss_step=0.129, global_step=2694.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  92%|█████████▏| 1115/1208 [31:11<02:36,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000425, train/loss_step=0.129, global_step=2694.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  92%|█████████▏| 1115/1208 [31:11<02:36,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00573, train/loss_vlb_step=2.93e-5, train/loss_step=0.00573, global_step=2694.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  92%|█████████▏| 1116/1208 [31:14<02:34,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00573, train/loss_vlb_step=2.93e-5, train/loss_step=0.00573, global_step=2694.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  92%|█████████▏| 1116/1208 [31:14<02:34,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0391, train/loss_vlb_step=0.000143, train/loss_step=0.0391, global_step=2694.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  92%|█████████▏| 1117/1208 [31:15<02:32,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0391, train/loss_vlb_step=0.000143, train/loss_step=0.0391, global_step=2694.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  92%|█████████▏| 1117/1208 [31:15<02:32,  1.68s/it, loss=0.166, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00174, train/loss_step=0.339, global_step=2695.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  93%|█████████▎| 1118/1208 [31:16<02:31,  1.68s/it, loss=0.166, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00174, train/loss_step=0.339, global_step=2695.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  93%|█████████▎| 1118/1208 [31:16<02:31,  1.68s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.1e-5, train/loss_step=0.0113, global_step=2695.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  93%|█████████▎| 1119/1208 [31:17<02:29,  1.68s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.1e-5, train/loss_step=0.0113, global_step=2695.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  93%|█████████▎| 1119/1208 [31:17<02:29,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.82e-5, train/loss_step=0.013, global_step=2695.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  93%|█████████▎| 1120/1208 [31:20<02:27,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.82e-5, train/loss_step=0.013, global_step=2695.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  93%|█████████▎| 1120/1208 [31:20<02:27,  1.68s/it, loss=0.169, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000414, train/loss_step=0.125, global_step=2695.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  93%|█████████▎| 1121/1208 [31:21<02:26,  1.68s/it, loss=0.169, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000414, train/loss_step=0.125, global_step=2695.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  93%|█████████▎| 1121/1208 [31:21<02:26,  1.68s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000159, train/loss_step=0.0438, global_step=2696.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  93%|█████████▎| 1122/1208 [31:22<02:24,  1.68s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000159, train/loss_step=0.0438, global_step=2696.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  93%|█████████▎| 1122/1208 [31:22<02:24,  1.68s/it, loss=0.175, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000351, train/loss_step=0.107, global_step=2696.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  93%|█████████▎| 1123/1208 [31:23<02:22,  1.68s/it, loss=0.175, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000351, train/loss_step=0.107, global_step=2696.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  93%|█████████▎| 1123/1208 [31:23<02:22,  1.68s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.000151, train/loss_step=0.0403, global_step=2696.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  93%|█████████▎| 1124/1208 [31:26<02:20,  1.68s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.000151, train/loss_step=0.0403, global_step=2696.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  93%|█████████▎| 1124/1208 [31:26<02:20,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.00011, train/loss_step=0.0265, global_step=2696.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  93%|█████████▎| 1125/1208 [31:27<02:19,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.00011, train/loss_step=0.0265, global_step=2696.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  93%|█████████▎| 1125/1208 [31:27<02:19,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00479, train/loss_vlb_step=2.52e-5, train/loss_step=0.00479, global_step=2697.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  93%|█████████▎| 1126/1208 [31:28<02:17,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00479, train/loss_vlb_step=2.52e-5, train/loss_step=0.00479, global_step=2697.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  93%|█████████▎| 1126/1208 [31:28<02:17,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000377, train/loss_step=0.114, global_step=2697.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  93%|█████████▎| 1127/1208 [31:29<02:15,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000377, train/loss_step=0.114, global_step=2697.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  93%|█████████▎| 1127/1208 [31:29<02:15,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=1.39e-5, train/loss_step=0.00243, global_step=2697.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  93%|█████████▎| 1128/1208 [31:32<02:14,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=1.39e-5, train/loss_step=0.00243, global_step=2697.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  93%|█████████▎| 1128/1208 [31:32<02:14,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00105, train/loss_step=0.267, global_step=2697.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  93%|█████████▎| 1129/1208 [31:33<02:12,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00105, train/loss_step=0.267, global_step=2697.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  93%|█████████▎| 1129/1208 [31:33<02:12,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.64e-5, train/loss_step=0.0174, global_step=2698.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  94%|█████████▎| 1130/1208 [31:34<02:10,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.64e-5, train/loss_step=0.0174, global_step=2698.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  94%|█████████▎| 1130/1208 [31:34<02:10,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=2698.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  94%|█████████▎| 1131/1208 [31:35<02:09,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=2698.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  94%|█████████▎| 1131/1208 [31:35<02:09,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000175, train/loss_step=0.051, global_step=2698.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  94%|█████████▎| 1132/1208 [31:38<02:07,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000175, train/loss_step=0.051, global_step=2698.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  94%|█████████▎| 1132/1208 [31:38<02:07,  1.68s/it, loss=0.105, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.46e-5, train/loss_step=0.017, global_step=2698.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  94%|█████████▍| 1133/1208 [31:39<02:05,  1.68s/it, loss=0.105, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.46e-5, train/loss_step=0.017, global_step=2698.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  94%|█████████▍| 1133/1208 [31:39<02:05,  1.68s/it, loss=0.0785, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.00035, train/loss_step=0.104, global_step=2699.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  94%|█████████▍| 1134/1208 [31:40<02:04,  1.68s/it, loss=0.0785, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.00035, train/loss_step=0.104, global_step=2699.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  94%|█████████▍| 1134/1208 [31:40<02:04,  1.68s/it, loss=0.0731, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=9.19e-5, train/loss_step=0.0217, global_step=2699.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  94%|█████████▍| 1135/1208 [31:41<02:02,  1.68s/it, loss=0.0731, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=9.19e-5, train/loss_step=0.0217, global_step=2699.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  94%|█████████▍| 1135/1208 [31:41<02:02,  1.68s/it, loss=0.073, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=2.06e-5, train/loss_step=0.00384, global_step=2699.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  94%|█████████▍| 1136/1208 [31:44<02:00,  1.68s/it, loss=0.073, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=2.06e-5, train/loss_step=0.00384, global_step=2699.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  94%|█████████▍| 1136/1208 [31:44<02:00,  1.68s/it, loss=0.0895, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.0022, train/loss_step=0.368, global_step=2699.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  94%|█████████▍| 1137/1208 [31:45<01:58,  1.68s/it, loss=0.0895, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.0022, train/loss_step=0.368, global_step=2699.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  94%|█████████▍| 1137/1208 [31:45<01:58,  1.68s/it, loss=0.088, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00141, train/loss_step=0.309, global_step=2700.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  94%|█████████▍| 1138/1208 [31:46<01:57,  1.68s/it, loss=0.088, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00141, train/loss_step=0.309, global_step=2700.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  94%|█████████▍| 1138/1208 [31:46<01:57,  1.68s/it, loss=0.093, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000367, train/loss_step=0.112, global_step=2700.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  94%|█████████▍| 1139/1208 [31:47<01:55,  1.67s/it, loss=0.093, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000367, train/loss_step=0.112, global_step=2700.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  94%|█████████▍| 1139/1208 [31:47<01:55,  1.67s/it, loss=0.0997, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000495, train/loss_step=0.146, global_step=2700.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  94%|█████████▍| 1140/1208 [31:50<01:53,  1.68s/it, loss=0.0997, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000495, train/loss_step=0.146, global_step=2700.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  94%|█████████▍| 1140/1208 [31:50<01:53,  1.68s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.0697, train/loss_vlb_step=0.000239, train/loss_step=0.0697, global_step=2700.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  94%|█████████▍| 1141/1208 [31:51<01:52,  1.68s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.0697, train/loss_vlb_step=0.000239, train/loss_step=0.0697, global_step=2700.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  94%|█████████▍| 1141/1208 [31:52<01:52,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00569, train/loss_step=0.411, global_step=2701.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  95%|█████████▍| 1142/1208 [31:53<01:50,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00569, train/loss_step=0.411, global_step=2701.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  95%|█████████▍| 1142/1208 [31:53<01:50,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.000171, train/loss_step=0.0456, global_step=2701.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  95%|█████████▍| 1143/1208 [31:54<01:48,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.000171, train/loss_step=0.0456, global_step=2701.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  95%|█████████▍| 1143/1208 [31:54<01:48,  1.67s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=1.36e-5, train/loss_step=0.00229, global_step=2701.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  95%|█████████▍| 1144/1208 [31:57<01:47,  1.68s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=1.36e-5, train/loss_step=0.00229, global_step=2701.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  95%|█████████▍| 1144/1208 [31:57<01:47,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0506, train/loss_vlb_step=0.000185, train/loss_step=0.0506, global_step=2701.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  95%|█████████▍| 1145/1208 [31:58<01:45,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0506, train/loss_vlb_step=0.000185, train/loss_step=0.0506, global_step=2701.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  95%|█████████▍| 1145/1208 [31:58<01:45,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.9e-5, train/loss_step=0.0156, global_step=2702.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  95%|█████████▍| 1146/1208 [31:59<01:43,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.9e-5, train/loss_step=0.0156, global_step=2702.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  95%|█████████▍| 1146/1208 [31:59<01:43,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000397, train/loss_step=0.120, global_step=2702.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  95%|█████████▍| 1147/1208 [32:00<01:42,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000397, train/loss_step=0.120, global_step=2702.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  95%|█████████▍| 1147/1208 [32:00<01:42,  1.67s/it, loss=0.124, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000885, train/loss_step=0.235, global_step=2702.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  95%|█████████▌| 1148/1208 [32:03<01:40,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000885, train/loss_step=0.235, global_step=2702.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  95%|█████████▌| 1148/1208 [32:03<01:40,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000709, train/loss_step=0.194, global_step=2702.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  95%|█████████▌| 1149/1208 [32:04<01:38,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000709, train/loss_step=0.194, global_step=2702.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  95%|█████████▌| 1149/1208 [32:04<01:38,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00314, train/loss_vlb_step=1.79e-5, train/loss_step=0.00314, global_step=2703.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  95%|█████████▌| 1150/1208 [32:05<01:37,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00314, train/loss_vlb_step=1.79e-5, train/loss_step=0.00314, global_step=2703.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  95%|█████████▌| 1150/1208 [32:05<01:37,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0558, train/loss_vlb_step=0.000208, train/loss_step=0.0558, global_step=2703.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  95%|█████████▌| 1151/1208 [32:06<01:35,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0558, train/loss_vlb_step=0.000208, train/loss_step=0.0558, global_step=2703.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  95%|█████████▌| 1151/1208 [32:06<01:35,  1.67s/it, loss=0.123, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000584, train/loss_step=0.177, global_step=2703.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  95%|█████████▌| 1152/1208 [32:10<01:33,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000584, train/loss_step=0.177, global_step=2703.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  95%|█████████▌| 1152/1208 [32:10<01:33,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.003, train/loss_step=0.389, global_step=2703.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  95%|█████████▌| 1153/1208 [32:11<01:32,  1.67s/it, loss=0.142, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.003, train/loss_step=0.389, global_step=2703.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  95%|█████████▌| 1153/1208 [32:11<01:32,  1.67s/it, loss=0.142, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000388, train/loss_step=0.118, global_step=2704.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  96%|█████████▌| 1154/1208 [32:12<01:30,  1.67s/it, loss=0.142, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000388, train/loss_step=0.118, global_step=2704.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  96%|█████████▌| 1154/1208 [32:12<01:30,  1.67s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0053, train/loss_vlb_step=2.67e-5, train/loss_step=0.0053, global_step=2704.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  96%|█████████▌| 1155/1208 [32:13<01:28,  1.67s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0053, train/loss_vlb_step=2.67e-5, train/loss_step=0.0053, global_step=2704.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  96%|█████████▌| 1155/1208 [32:13<01:28,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000367, train/loss_step=0.112, global_step=2704.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  96%|█████████▌| 1156/1208 [32:16<01:27,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000367, train/loss_step=0.112, global_step=2704.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  96%|█████████▌| 1156/1208 [32:16<01:27,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0983, train/loss_vlb_step=0.000323, train/loss_step=0.0983, global_step=2704.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  96%|█████████▌| 1157/1208 [32:17<01:25,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0983, train/loss_vlb_step=0.000323, train/loss_step=0.0983, global_step=2704.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  96%|█████████▌| 1157/1208 [32:17<01:25,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000125, train/loss_step=0.0333, global_step=2705.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  96%|█████████▌| 1158/1208 [32:18<01:23,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000125, train/loss_step=0.0333, global_step=2705.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  96%|█████████▌| 1158/1208 [32:18<01:23,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00185, train/loss_step=0.348, global_step=2705.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  96%|█████████▌| 1159/1208 [32:19<01:22,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00185, train/loss_step=0.348, global_step=2705.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  96%|█████████▌| 1159/1208 [32:19<01:22,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.00076, train/loss_step=0.201, global_step=2705.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  96%|█████████▌| 1160/1208 [32:22<01:20,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.00076, train/loss_step=0.201, global_step=2705.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  96%|█████████▌| 1160/1208 [32:22<01:20,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.000136, train/loss_step=0.0356, global_step=2705.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  96%|█████████▌| 1161/1208 [32:23<01:18,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.000136, train/loss_step=0.0356, global_step=2705.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  96%|█████████▌| 1161/1208 [32:23<01:18,  1.67s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0825, train/loss_vlb_step=0.000273, train/loss_step=0.0825, global_step=2706.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  96%|█████████▌| 1162/1208 [32:24<01:16,  1.67s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0825, train/loss_vlb_step=0.000273, train/loss_step=0.0825, global_step=2706.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  96%|█████████▌| 1162/1208 [32:25<01:16,  1.67s/it, loss=0.142, v_num=0, train/loss_simple_step=0.561, train/loss_vlb_step=0.0157, train/loss_step=0.561, global_step=2706.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  96%|█████████▋| 1163/1208 [32:26<01:15,  1.67s/it, loss=0.142, v_num=0, train/loss_simple_step=0.561, train/loss_vlb_step=0.0157, train/loss_step=0.561, global_step=2706.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  96%|█████████▋| 1163/1208 [32:26<01:15,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=2706.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  96%|█████████▋| 1164/1208 [32:29<01:13,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=2706.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  96%|█████████▋| 1164/1208 [32:29<01:13,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00218, train/loss_step=0.350, global_step=2706.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  96%|█████████▋| 1165/1208 [32:30<01:11,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00218, train/loss_step=0.350, global_step=2706.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  96%|█████████▋| 1165/1208 [32:30<01:11,  1.67s/it, loss=0.189, v_num=0, train/loss_simple_step=0.554, train/loss_vlb_step=0.00464, train/loss_step=0.554, global_step=2707.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  97%|█████████▋| 1166/1208 [32:31<01:10,  1.67s/it, loss=0.189, v_num=0, train/loss_simple_step=0.554, train/loss_vlb_step=0.00464, train/loss_step=0.554, global_step=2707.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  97%|█████████▋| 1166/1208 [32:31<01:10,  1.67s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00943, train/loss_vlb_step=4.37e-5, train/loss_step=0.00943, global_step=2707.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  97%|█████████▋| 1167/1208 [32:32<01:08,  1.67s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00943, train/loss_vlb_step=4.37e-5, train/loss_step=0.00943, global_step=2707.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  97%|█████████▋| 1167/1208 [32:32<01:08,  1.67s/it, loss=0.181, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000678, train/loss_step=0.184, global_step=2707.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  97%|█████████▋| 1168/1208 [32:35<01:06,  1.67s/it, loss=0.181, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000678, train/loss_step=0.184, global_step=2707.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  97%|█████████▋| 1168/1208 [32:35<01:06,  1.67s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=8.04e-5, train/loss_step=0.0182, global_step=2707.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  97%|█████████▋| 1169/1208 [32:36<01:05,  1.67s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=8.04e-5, train/loss_step=0.0182, global_step=2707.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  97%|█████████▋| 1169/1208 [32:36<01:05,  1.67s/it, loss=0.184, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000943, train/loss_step=0.228, global_step=2708.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  97%|█████████▋| 1170/1208 [32:37<01:03,  1.67s/it, loss=0.184, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000943, train/loss_step=0.228, global_step=2708.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  97%|█████████▋| 1170/1208 [32:37<01:03,  1.67s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=1.43e-5, train/loss_step=0.0024, global_step=2708.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  97%|█████████▋| 1171/1208 [32:38<01:01,  1.67s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=1.43e-5, train/loss_step=0.0024, global_step=2708.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  97%|█████████▋| 1171/1208 [32:38<01:01,  1.67s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000121, train/loss_step=0.0332, global_step=2708.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  97%|█████████▋| 1172/1208 [32:41<01:00,  1.67s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000121, train/loss_step=0.0332, global_step=2708.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  97%|█████████▋| 1172/1208 [32:41<01:00,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000148, train/loss_step=0.0399, global_step=2708.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  97%|█████████▋| 1173/1208 [32:42<00:58,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000148, train/loss_step=0.0399, global_step=2708.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  97%|█████████▋| 1173/1208 [32:42<00:58,  1.67s/it, loss=0.174, v_num=0, train/loss_simple_step=0.466, train/loss_vlb_step=0.00429, train/loss_step=0.466, global_step=2709.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  97%|█████████▋| 1174/1208 [32:43<00:56,  1.67s/it, loss=0.174, v_num=0, train/loss_simple_step=0.466, train/loss_vlb_step=0.00429, train/loss_step=0.466, global_step=2709.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  97%|█████████▋| 1174/1208 [32:43<00:56,  1.67s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0935, train/loss_vlb_step=0.000314, train/loss_step=0.0935, global_step=2709.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  97%|█████████▋| 1175/1208 [32:44<00:55,  1.67s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0935, train/loss_vlb_step=0.000314, train/loss_step=0.0935, global_step=2709.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  97%|█████████▋| 1175/1208 [32:44<00:55,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000173, train/loss_step=0.0474, global_step=2709.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  97%|█████████▋| 1176/1208 [32:47<00:53,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000173, train/loss_step=0.0474, global_step=2709.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  97%|█████████▋| 1176/1208 [32:47<00:53,  1.67s/it, loss=0.195, v_num=0, train/loss_simple_step=0.505, train/loss_vlb_step=0.00954, train/loss_step=0.505, global_step=2709.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8:  97%|█████████▋| 1177/1208 [32:48<00:51,  1.67s/it, loss=0.195, v_num=0, train/loss_simple_step=0.505, train/loss_vlb_step=0.00954, train/loss_step=0.505, global_step=2709.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  97%|█████████▋| 1177/1208 [32:48<00:51,  1.67s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=0.000101, train/loss_step=0.0241, global_step=2710.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  98%|█████████▊| 1178/1208 [32:49<00:50,  1.67s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=0.000101, train/loss_step=0.0241, global_step=2710.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  98%|█████████▊| 1178/1208 [32:49<00:50,  1.67s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.69e-5, train/loss_step=0.0178, global_step=2710.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  98%|█████████▊| 1179/1208 [32:50<00:48,  1.67s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.69e-5, train/loss_step=0.0178, global_step=2710.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  98%|█████████▊| 1179/1208 [32:50<00:48,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000424, train/loss_step=0.128, global_step=2710.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  98%|█████████▊| 1180/1208 [32:53<00:46,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000424, train/loss_step=0.128, global_step=2710.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  98%|█████████▊| 1180/1208 [32:53<00:46,  1.67s/it, loss=0.189, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00181, train/loss_step=0.316, global_step=2710.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  98%|█████████▊| 1181/1208 [32:54<00:45,  1.67s/it, loss=0.189, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00181, train/loss_step=0.316, global_step=2710.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  98%|█████████▊| 1181/1208 [32:54<00:45,  1.67s/it, loss=0.209, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.00512, train/loss_step=0.485, global_step=2711.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  98%|█████████▊| 1182/1208 [32:55<00:43,  1.67s/it, loss=0.209, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.00512, train/loss_step=0.485, global_step=2711.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  98%|█████████▊| 1182/1208 [32:55<00:43,  1.67s/it, loss=0.191, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000828, train/loss_step=0.210, global_step=2711.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  98%|█████████▊| 1183/1208 [32:56<00:41,  1.67s/it, loss=0.191, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000828, train/loss_step=0.210, global_step=2711.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  98%|█████████▊| 1183/1208 [32:56<00:41,  1.67s/it, loss=0.207, v_num=0, train/loss_simple_step=0.437, train/loss_vlb_step=0.00328, train/loss_step=0.437, global_step=2711.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  98%|█████████▊| 1184/1208 [32:59<00:40,  1.67s/it, loss=0.207, v_num=0, train/loss_simple_step=0.437, train/loss_vlb_step=0.00328, train/loss_step=0.437, global_step=2711.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  98%|█████████▊| 1184/1208 [32:59<00:40,  1.67s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0371, train/loss_vlb_step=0.000139, train/loss_step=0.0371, global_step=2711.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  98%|█████████▊| 1185/1208 [33:00<00:38,  1.67s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0371, train/loss_vlb_step=0.000139, train/loss_step=0.0371, global_step=2711.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  98%|█████████▊| 1185/1208 [33:00<00:38,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.61e-5, train/loss_step=0.00284, global_step=2712.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  98%|█████████▊| 1186/1208 [33:01<00:36,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.61e-5, train/loss_step=0.00284, global_step=2712.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  98%|█████████▊| 1186/1208 [33:01<00:36,  1.67s/it, loss=0.183, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00236, train/loss_step=0.391, global_step=2712.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]    Epoch 8:  98%|█████████▊| 1187/1208 [33:02<00:35,  1.67s/it, loss=0.183, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00236, train/loss_step=0.391, global_step=2712.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  98%|█████████▊| 1187/1208 [33:02<00:35,  1.67s/it, loss=0.184, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000668, train/loss_step=0.194, global_step=2712.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  98%|█████████▊| 1188/1208 [33:05<00:33,  1.67s/it, loss=0.184, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000668, train/loss_step=0.194, global_step=2712.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  98%|█████████▊| 1188/1208 [33:05<00:33,  1.67s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.43e-5, train/loss_step=0.0117, global_step=2712.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  98%|█████████▊| 1189/1208 [33:06<00:31,  1.67s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.43e-5, train/loss_step=0.0117, global_step=2712.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  98%|█████████▊| 1189/1208 [33:06<00:31,  1.67s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.31e-5, train/loss_step=0.00225, global_step=2713.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  99%|█████████▊| 1190/1208 [33:07<00:30,  1.67s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.31e-5, train/loss_step=0.00225, global_step=2713.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  99%|█████████▊| 1190/1208 [33:07<00:30,  1.67s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000296, train/loss_step=0.0891, global_step=2713.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  99%|█████████▊| 1191/1208 [33:08<00:28,  1.67s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000296, train/loss_step=0.0891, global_step=2713.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  99%|█████████▊| 1191/1208 [33:08<00:28,  1.67s/it, loss=0.185, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000697, train/loss_step=0.199, global_step=2713.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  99%|█████████▊| 1192/1208 [33:11<00:26,  1.67s/it, loss=0.185, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000697, train/loss_step=0.199, global_step=2713.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  99%|█████████▊| 1192/1208 [33:11<00:26,  1.67s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00478, train/loss_vlb_step=2.44e-5, train/loss_step=0.00478, global_step=2713.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  99%|█████████▉| 1193/1208 [33:12<00:25,  1.67s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00478, train/loss_vlb_step=2.44e-5, train/loss_step=0.00478, global_step=2713.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  99%|█████████▉| 1193/1208 [33:12<00:25,  1.67s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.38e-5, train/loss_step=0.00236, global_step=2714.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  99%|█████████▉| 1194/1208 [33:13<00:23,  1.67s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.38e-5, train/loss_step=0.00236, global_step=2714.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  99%|█████████▉| 1194/1208 [33:13<00:23,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00491, train/loss_vlb_step=2.6e-5, train/loss_step=0.00491, global_step=2714.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  99%|█████████▉| 1195/1208 [33:15<00:21,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00491, train/loss_vlb_step=2.6e-5, train/loss_step=0.00491, global_step=2714.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  99%|█████████▉| 1195/1208 [33:15<00:21,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0866, train/loss_vlb_step=0.000291, train/loss_step=0.0866, global_step=2714.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  99%|█████████▉| 1196/1208 [33:18<00:20,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0866, train/loss_vlb_step=0.000291, train/loss_step=0.0866, global_step=2714.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  99%|█████████▉| 1196/1208 [33:18<00:20,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00476, train/loss_vlb_step=2.51e-5, train/loss_step=0.00476, global_step=2714.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  99%|█████████▉| 1197/1208 [33:19<00:18,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00476, train/loss_vlb_step=2.51e-5, train/loss_step=0.00476, global_step=2714.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  99%|█████████▉| 1197/1208 [33:19<00:18,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0431, train/loss_vlb_step=0.000161, train/loss_step=0.0431, global_step=2715.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8:  99%|█████████▉| 1198/1208 [33:20<00:16,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0431, train/loss_vlb_step=0.000161, train/loss_step=0.0431, global_step=2715.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  99%|█████████▉| 1198/1208 [33:20<00:16,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=2715.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]  Epoch 8:  99%|█████████▉| 1199/1208 [33:21<00:15,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=2715.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  99%|█████████▉| 1199/1208 [33:21<00:15,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00585, train/loss_vlb_step=3e-5, train/loss_step=0.00585, global_step=2715.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  99%|█████████▉| 1200/1208 [33:24<00:13,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00585, train/loss_vlb_step=3e-5, train/loss_step=0.00585, global_step=2715.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  99%|█████████▉| 1200/1208 [33:24<00:13,  1.67s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.53e-5, train/loss_step=0.00267, global_step=2715.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.75it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.81it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.75it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.75it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.80it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.80it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.77it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.82it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 8:  99%|█████████▉| 1201/1208 [33:55<00:11,  1.69s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.53e-5, train/loss_step=0.00267, global_step=2715.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8:  99%|█████████▉| 1201/1208 [33:55<00:11,  1.69s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.00535, train/loss_vlb_step=2.72e-5, train/loss_step=0.00535, global_step=2716.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8: 100%|█████████▉| 1202/1208 [33:56<00:10,  1.69s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.00535, train/loss_vlb_step=2.72e-5, train/loss_step=0.00535, global_step=2716.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8: 100%|█████████▉| 1202/1208 [33:56<00:10,  1.69s/it, loss=0.101, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.0025, train/loss_step=0.389, global_step=2716.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]      Epoch 8: 100%|█████████▉| 1203/1208 [33:57<00:08,  1.69s/it, loss=0.101, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.0025, train/loss_step=0.389, global_step=2716.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8: 100%|█████████▉| 1203/1208 [33:57<00:08,  1.69s/it, loss=0.087, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000533, train/loss_step=0.156, global_step=2716.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8: 100%|█████████▉| 1204/1208 [34:00<00:06,  1.69s/it, loss=0.087, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000533, train/loss_step=0.156, global_step=2716.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8: 100%|█████████▉| 1204/1208 [34:00<00:06,  1.69s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.4e-5, train/loss_step=0.00235, global_step=2716.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8: 100%|█████████▉| 1205/1208 [34:01<00:05,  1.69s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.4e-5, train/loss_step=0.00235, global_step=2716.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8: 100%|█████████▉| 1205/1208 [34:01<00:05,  1.69s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00126, train/loss_step=0.270, global_step=2717.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]   Epoch 8: 100%|█████████▉| 1206/1208 [34:02<00:03,  1.69s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00126, train/loss_step=0.270, global_step=2717.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8: 100%|█████████▉| 1206/1208 [34:02<00:03,  1.69s/it, loss=0.0873, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000559, train/loss_step=0.166, global_step=2717.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8: 100%|█████████▉| 1207/1208 [34:03<00:01,  1.69s/it, loss=0.0873, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000559, train/loss_step=0.166, global_step=2717.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8: 100%|█████████▉| 1207/1208 [34:03<00:01,  1.69s/it, loss=0.0863, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.00061, train/loss_step=0.174, global_step=2717.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144] Epoch 8: 100%|██████████| 1208/1208 [34:08<00:00,  1.70s/it, loss=0.0863, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.00061, train/loss_step=0.174, global_step=2717.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 8: 100%|██████████| 1208/1208 [34:08<00:00,  1.70s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.0964, train/loss_vlb_step=0.000317, train/loss_step=0.0964, global_step=2717.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]
+
+
+Epoch 8:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.0905, v_num=0, train/loss_simple_step=0.0964, train/loss_vlb_step=0.000317, train/loss_step=0.0964, global_step=2717.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]           Epoch 9:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.0905, v_num=0, train/loss_simple_step=0.0964, train/loss_vlb_step=0.000317, train/loss_step=0.0964, global_step=2717.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.73it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.74it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.74it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.84it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.74it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.77it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.84it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.83it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.83it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.79it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.79it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.78it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.78it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.78it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.78it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.78it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]Epoch 9:   0%|          | 1/1208 [00:32<11:01:30, 32.88s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.0964, train/loss_vlb_step=0.000317, train/loss_step=0.0964, global_step=2717.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00256, train/loss_epoch=0.144]Epoch 9:   0%|          | 1/1208 [00:32<11:03:34, 32.99s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.0664, train/loss_vlb_step=0.00023, train/loss_step=0.0664, global_step=2718.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:   0%|          | 2/1208 [00:34<5:41:52, 17.01s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.0664, train/loss_vlb_step=0.00023, train/loss_step=0.0664, global_step=2718.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:   0%|          | 2/1208 [00:34<5:41:53, 17.01s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.00775, train/loss_vlb_step=3.77e-5, train/loss_step=0.00775, global_step=2718.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   0%|          | 3/1208 [00:35<3:54:35, 11.68s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.00775, train/loss_vlb_step=3.77e-5, train/loss_step=0.00775, global_step=2718.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   0%|          | 3/1208 [00:35<3:54:36, 11.68s/it, loss=0.0802, v_num=0, train/loss_simple_step=0.00978, train/loss_vlb_step=4.48e-5, train/loss_step=0.00978, global_step=2718.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   0%|          | 4/1208 [00:38<3:11:18,  9.53s/it, loss=0.0802, v_num=0, train/loss_simple_step=0.00978, train/loss_vlb_step=4.48e-5, train/loss_step=0.00978, global_step=2718.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   0%|          | 4/1208 [00:38<3:11:18,  9.53s/it, loss=0.0812, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000101, train/loss_step=0.0254, global_step=2718.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:   0%|          | 5/1208 [00:39<2:37:14,  7.84s/it, loss=0.0812, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000101, train/loss_step=0.0254, global_step=2718.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   0%|          | 5/1208 [00:39<2:37:14,  7.84s/it, loss=0.0816, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.81e-5, train/loss_step=0.0104, global_step=2719.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:   0%|          | 6/1208 [00:40<2:14:22,  6.71s/it, loss=0.0816, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.81e-5, train/loss_step=0.0104, global_step=2719.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   0%|          | 6/1208 [00:40<2:14:23,  6.71s/it, loss=0.0815, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=1.56e-5, train/loss_step=0.00276, global_step=2719.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   1%|          | 7/1208 [00:41<1:58:02,  5.90s/it, loss=0.0815, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=1.56e-5, train/loss_step=0.00276, global_step=2719.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   1%|          | 7/1208 [00:41<1:58:02,  5.90s/it, loss=0.0773, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=1.3e-5, train/loss_step=0.00227, global_step=2719.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:   1%|          | 8/1208 [00:44<1:51:09,  5.56s/it, loss=0.0773, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=1.3e-5, train/loss_step=0.00227, global_step=2719.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   1%|          | 8/1208 [00:44<1:51:09,  5.56s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00344, train/loss_step=0.383, global_step=2719.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:   1%|          | 9/1208 [00:45<1:41:05,  5.06s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00344, train/loss_step=0.383, global_step=2719.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   1%|          | 9/1208 [00:45<1:41:05,  5.06s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.00017, train/loss_step=0.0489, global_step=2720.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   1%|          | 10/1208 [00:46<1:32:59,  4.66s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.00017, train/loss_step=0.0489, global_step=2720.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   1%|          | 10/1208 [00:46<1:32:59,  4.66s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.0852, train/loss_vlb_step=0.000287, train/loss_step=0.0852, global_step=2720.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   1%|          | 11/1208 [00:47<1:26:22,  4.33s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.0852, train/loss_vlb_step=0.000287, train/loss_step=0.0852, global_step=2720.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   1%|          | 11/1208 [00:47<1:26:22,  4.33s/it, loss=0.105, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000674, train/loss_step=0.187, global_step=2720.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:   1%|          | 12/1208 [00:50<1:24:27,  4.24s/it, loss=0.105, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000674, train/loss_step=0.187, global_step=2720.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   1%|          | 12/1208 [00:50<1:24:27,  4.24s/it, loss=0.131, v_num=0, train/loss_simple_step=0.540, train/loss_vlb_step=0.00838, train/loss_step=0.540, global_step=2720.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:   1%|          | 13/1208 [00:51<1:19:31,  3.99s/it, loss=0.131, v_num=0, train/loss_simple_step=0.540, train/loss_vlb_step=0.00838, train/loss_step=0.540, global_step=2720.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   1%|          | 13/1208 [00:51<1:19:31,  3.99s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00957, train/loss_vlb_step=4.42e-5, train/loss_step=0.00957, global_step=2721.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   1%|          | 14/1208 [00:52<1:15:14,  3.78s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00957, train/loss_vlb_step=4.42e-5, train/loss_step=0.00957, global_step=2721.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   1%|          | 14/1208 [00:52<1:15:14,  3.78s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00769, train/loss_vlb_step=3.84e-5, train/loss_step=0.00769, global_step=2721.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   1%|          | 15/1208 [00:53<1:11:31,  3.60s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00769, train/loss_vlb_step=3.84e-5, train/loss_step=0.00769, global_step=2721.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   1%|          | 15/1208 [00:53<1:11:31,  3.60s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.69e-5, train/loss_step=0.00299, global_step=2721.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   1%|▏         | 16/1208 [00:57<1:11:03,  3.58s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.69e-5, train/loss_step=0.00299, global_step=2721.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   1%|▏         | 16/1208 [00:57<1:11:03,  3.58s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00314, train/loss_vlb_step=1.74e-5, train/loss_step=0.00314, global_step=2721.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   1%|▏         | 17/1208 [00:58<1:08:05,  3.43s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00314, train/loss_vlb_step=1.74e-5, train/loss_step=0.00314, global_step=2721.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   1%|▏         | 17/1208 [00:58<1:08:05,  3.43s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=5.98e-5, train/loss_step=0.0137, global_step=2722.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:   1%|▏         | 18/1208 [00:59<1:05:23,  3.30s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=5.98e-5, train/loss_step=0.0137, global_step=2722.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   1%|▏         | 18/1208 [00:59<1:05:23,  3.30s/it, loss=0.084, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.86e-5, train/loss_step=0.00324, global_step=2722.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   2%|▏         | 19/1208 [01:00<1:02:58,  3.18s/it, loss=0.084, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.86e-5, train/loss_step=0.00324, global_step=2722.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   2%|▏         | 19/1208 [01:00<1:02:58,  3.18s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.00051, train/loss_step=0.153, global_step=2722.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:   2%|▏         | 20/1208 [01:03<1:03:00,  3.18s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.00051, train/loss_step=0.153, global_step=2722.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   2%|▏         | 20/1208 [01:03<1:03:00,  3.18s/it, loss=0.0794, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=0.000104, train/loss_step=0.0252, global_step=2722.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   2%|▏         | 21/1208 [01:04<1:00:57,  3.08s/it, loss=0.0794, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=0.000104, train/loss_step=0.0252, global_step=2722.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   2%|▏         | 21/1208 [01:04<1:00:57,  3.08s/it, loss=0.0765, v_num=0, train/loss_simple_step=0.00853, train/loss_vlb_step=4.19e-5, train/loss_step=0.00853, global_step=2723.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   2%|▏         | 22/1208 [01:05<59:04,  2.99s/it, loss=0.0765, v_num=0, train/loss_simple_step=0.00853, train/loss_vlb_step=4.19e-5, train/loss_step=0.00853, global_step=2723.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:   2%|▏         | 22/1208 [01:05<59:04,  2.99s/it, loss=0.0797, v_num=0, train/loss_simple_step=0.0711, train/loss_vlb_step=0.000235, train/loss_step=0.0711, global_step=2723.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:   2%|▏         | 23/1208 [01:06<57:21,  2.90s/it, loss=0.0797, v_num=0, train/loss_simple_step=0.0711, train/loss_vlb_step=0.000235, train/loss_step=0.0711, global_step=2723.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   2%|▏         | 23/1208 [01:06<57:21,  2.90s/it, loss=0.0808, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.000126, train/loss_step=0.033, global_step=2723.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:   2%|▏         | 24/1208 [01:10<57:36,  2.92s/it, loss=0.0808, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.000126, train/loss_step=0.033, global_step=2723.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   2%|▏         | 24/1208 [01:10<57:36,  2.92s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00123, train/loss_step=0.258, global_step=2723.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:   2%|▏         | 25/1208 [01:11<56:04,  2.84s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00123, train/loss_step=0.258, global_step=2723.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   2%|▏         | 25/1208 [01:11<56:04,  2.84s/it, loss=0.113, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00318, train/loss_step=0.412, global_step=2724.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:   2%|▏         | 26/1208 [01:12<54:39,  2.77s/it, loss=0.113, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00318, train/loss_step=0.412, global_step=2724.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   2%|▏         | 26/1208 [01:12<54:39,  2.77s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0874, train/loss_vlb_step=0.000291, train/loss_step=0.0874, global_step=2724.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   2%|▏         | 27/1208 [01:13<53:20,  2.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0874, train/loss_vlb_step=0.000291, train/loss_step=0.0874, global_step=2724.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   2%|▏         | 27/1208 [01:13<53:20,  2.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.34e-5, train/loss_step=0.0197, global_step=2724.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:   2%|▏         | 28/1208 [01:16<53:42,  2.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.34e-5, train/loss_step=0.0197, global_step=2724.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   2%|▏         | 28/1208 [01:16<53:42,  2.73s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.3e-5, train/loss_step=0.0197, global_step=2724.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   2%|▏         | 29/1208 [01:17<52:32,  2.67s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.3e-5, train/loss_step=0.0197, global_step=2724.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   2%|▏         | 29/1208 [01:17<52:32,  2.67s/it, loss=0.106, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000663, train/loss_step=0.185, global_step=2725.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:   2%|▏         | 30/1208 [01:18<51:25,  2.62s/it, loss=0.106, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000663, train/loss_step=0.185, global_step=2725.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   2%|▏         | 30/1208 [01:18<51:25,  2.62s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0492, train/loss_vlb_step=0.000176, train/loss_step=0.0492, global_step=2725.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   3%|▎         | 31/1208 [01:19<50:22,  2.57s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0492, train/loss_vlb_step=0.000176, train/loss_step=0.0492, global_step=2725.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   3%|▎         | 31/1208 [01:19<50:22,  2.57s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=9.96e-5, train/loss_step=0.0272, global_step=2725.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   3%|▎         | 32/1208 [01:22<50:46,  2.59s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=9.96e-5, train/loss_step=0.0272, global_step=2725.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   3%|▎         | 32/1208 [01:22<50:46,  2.59s/it, loss=0.0723, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.000203, train/loss_step=0.0556, global_step=2725.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   3%|▎         | 33/1208 [01:23<49:49,  2.54s/it, loss=0.0723, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.000203, train/loss_step=0.0556, global_step=2725.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   3%|▎         | 33/1208 [01:23<49:49,  2.54s/it, loss=0.0727, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.37e-5, train/loss_step=0.0173, global_step=2726.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:   3%|▎         | 34/1208 [01:25<48:55,  2.50s/it, loss=0.0727, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.37e-5, train/loss_step=0.0173, global_step=2726.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   3%|▎         | 34/1208 [01:25<48:55,  2.50s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00258, train/loss_step=0.347, global_step=2726.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:   3%|▎         | 35/1208 [01:26<48:03,  2.46s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00258, train/loss_step=0.347, global_step=2726.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   3%|▎         | 35/1208 [01:26<48:04,  2.46s/it, loss=0.103, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00101, train/loss_step=0.264, global_step=2726.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:   3%|▎         | 36/1208 [01:29<48:28,  2.48s/it, loss=0.103, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00101, train/loss_step=0.264, global_step=2726.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   3%|▎         | 36/1208 [01:29<48:28,  2.48s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000175, train/loss_step=0.0484, global_step=2726.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   3%|▎         | 37/1208 [01:30<47:41,  2.44s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000175, train/loss_step=0.0484, global_step=2726.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   3%|▎         | 37/1208 [01:30<47:41,  2.44s/it, loss=0.12, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00172, train/loss_step=0.323, global_step=2727.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:   3%|▎         | 38/1208 [01:31<46:55,  2.41s/it, loss=0.12, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00172, train/loss_step=0.323, global_step=2727.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   3%|▎         | 38/1208 [01:31<46:55,  2.41s/it, loss=0.129, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000601, train/loss_step=0.178, global_step=2727.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   3%|▎         | 39/1208 [01:32<46:11,  2.37s/it, loss=0.129, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000601, train/loss_step=0.178, global_step=2727.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   3%|▎         | 39/1208 [01:32<46:11,  2.37s/it, loss=0.133, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000942, train/loss_step=0.225, global_step=2727.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   3%|▎         | 40/1208 [01:35<46:33,  2.39s/it, loss=0.133, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000942, train/loss_step=0.225, global_step=2727.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   3%|▎         | 40/1208 [01:35<46:33,  2.39s/it, loss=0.135, v_num=0, train/loss_simple_step=0.079, train/loss_vlb_step=0.000264, train/loss_step=0.079, global_step=2727.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   3%|▎         | 41/1208 [01:36<45:53,  2.36s/it, loss=0.135, v_num=0, train/loss_simple_step=0.079, train/loss_vlb_step=0.000264, train/loss_step=0.079, global_step=2727.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   3%|▎         | 41/1208 [01:36<45:53,  2.36s/it, loss=0.146, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000903, train/loss_step=0.218, global_step=2728.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   3%|▎         | 42/1208 [01:37<45:14,  2.33s/it, loss=0.146, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000903, train/loss_step=0.218, global_step=2728.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   3%|▎         | 42/1208 [01:37<45:14,  2.33s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.58e-5, train/loss_step=0.0182, global_step=2728.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   4%|▎         | 43/1208 [01:38<44:37,  2.30s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.58e-5, train/loss_step=0.0182, global_step=2728.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   4%|▎         | 43/1208 [01:38<44:37,  2.30s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.33e-5, train/loss_step=0.00219, global_step=2728.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   4%|▎         | 44/1208 [01:42<45:00,  2.32s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.33e-5, train/loss_step=0.00219, global_step=2728.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   4%|▎         | 44/1208 [01:42<45:00,  2.32s/it, loss=0.141, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00106, train/loss_step=0.253, global_step=2728.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:   4%|▎         | 45/1208 [01:43<44:25,  2.29s/it, loss=0.141, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00106, train/loss_step=0.253, global_step=2728.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   4%|▎         | 45/1208 [01:43<44:25,  2.29s/it, loss=0.161, v_num=0, train/loss_simple_step=0.794, train/loss_vlb_step=0.101, train/loss_step=0.794, global_step=2729.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:   4%|▍         | 46/1208 [01:44<43:51,  2.26s/it, loss=0.161, v_num=0, train/loss_simple_step=0.794, train/loss_vlb_step=0.101, train/loss_step=0.794, global_step=2729.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   4%|▍         | 46/1208 [01:44<43:51,  2.26s/it, loss=0.17, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00124, train/loss_step=0.278, global_step=2729.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   4%|▍         | 47/1208 [01:45<43:18,  2.24s/it, loss=0.17, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00124, train/loss_step=0.278, global_step=2729.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   4%|▍         | 47/1208 [01:45<43:18,  2.24s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00937, train/loss_vlb_step=4.43e-5, train/loss_step=0.00937, global_step=2729.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   4%|▍         | 48/1208 [01:48<43:40,  2.26s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00937, train/loss_vlb_step=4.43e-5, train/loss_step=0.00937, global_step=2729.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   4%|▍         | 48/1208 [01:48<43:40,  2.26s/it, loss=0.185, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00138, train/loss_step=0.322, global_step=2729.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:   4%|▍         | 49/1208 [01:49<43:10,  2.24s/it, loss=0.185, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00138, train/loss_step=0.322, global_step=2729.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   4%|▍         | 49/1208 [01:49<43:10,  2.24s/it, loss=0.184, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000588, train/loss_step=0.174, global_step=2730.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   4%|▍         | 50/1208 [01:50<42:40,  2.21s/it, loss=0.184, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000588, train/loss_step=0.174, global_step=2730.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   4%|▍         | 50/1208 [01:50<42:40,  2.21s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000129, train/loss_step=0.0344, global_step=2730.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   4%|▍         | 51/1208 [01:51<42:11,  2.19s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000129, train/loss_step=0.0344, global_step=2730.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   4%|▍         | 51/1208 [01:51<42:11,  2.19s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.38e-5, train/loss_step=0.0197, global_step=2730.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:   4%|▍         | 52/1208 [01:54<42:33,  2.21s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.38e-5, train/loss_step=0.0197, global_step=2730.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   4%|▍         | 52/1208 [01:54<42:33,  2.21s/it, loss=0.197, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00153, train/loss_step=0.326, global_step=2730.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:   4%|▍         | 53/1208 [01:55<42:06,  2.19s/it, loss=0.197, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00153, train/loss_step=0.326, global_step=2730.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   4%|▍         | 53/1208 [01:55<42:06,  2.19s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=8.81e-5, train/loss_step=0.0211, global_step=2731.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   4%|▍         | 54/1208 [01:56<41:39,  2.17s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=8.81e-5, train/loss_step=0.0211, global_step=2731.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   4%|▍         | 54/1208 [01:56<41:39,  2.17s/it, loss=0.19, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.00083, train/loss_step=0.219, global_step=2731.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:   5%|▍         | 55/1208 [01:58<41:13,  2.15s/it, loss=0.19, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.00083, train/loss_step=0.219, global_step=2731.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   5%|▍         | 55/1208 [01:58<41:13,  2.15s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0632, train/loss_vlb_step=0.000215, train/loss_step=0.0632, global_step=2731.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   5%|▍         | 56/1208 [02:01<41:35,  2.17s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0632, train/loss_vlb_step=0.000215, train/loss_step=0.0632, global_step=2731.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   5%|▍         | 56/1208 [02:01<41:35,  2.17s/it, loss=0.185, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000463, train/loss_step=0.138, global_step=2731.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:   5%|▍         | 57/1208 [02:02<41:11,  2.15s/it, loss=0.185, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000463, train/loss_step=0.138, global_step=2731.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   5%|▍         | 57/1208 [02:02<41:11,  2.15s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.73e-5, train/loss_step=0.0184, global_step=2732.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   5%|▍         | 58/1208 [02:03<40:46,  2.13s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.73e-5, train/loss_step=0.0184, global_step=2732.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   5%|▍         | 58/1208 [02:03<40:46,  2.13s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.88e-5, train/loss_step=0.0123, global_step=2732.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   5%|▍         | 59/1208 [02:04<40:23,  2.11s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.88e-5, train/loss_step=0.0123, global_step=2732.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   5%|▍         | 59/1208 [02:04<40:23,  2.11s/it, loss=0.157, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000491, train/loss_step=0.147, global_step=2732.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:   5%|▍         | 60/1208 [02:07<40:43,  2.13s/it, loss=0.157, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000491, train/loss_step=0.147, global_step=2732.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   5%|▍         | 60/1208 [02:07<40:43,  2.13s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0846, train/loss_vlb_step=0.000286, train/loss_step=0.0846, global_step=2732.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   5%|▌         | 61/1208 [02:08<40:21,  2.11s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0846, train/loss_vlb_step=0.000286, train/loss_step=0.0846, global_step=2732.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   5%|▌         | 61/1208 [02:08<40:21,  2.11s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=1.36e-5, train/loss_step=0.00234, global_step=2733.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   5%|▌         | 62/1208 [02:09<39:59,  2.09s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=1.36e-5, train/loss_step=0.00234, global_step=2733.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   5%|▌         | 62/1208 [02:09<39:59,  2.09s/it, loss=0.156, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000889, train/loss_step=0.210, global_step=2733.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:   5%|▌         | 63/1208 [02:10<39:38,  2.08s/it, loss=0.156, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000889, train/loss_step=0.210, global_step=2733.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   5%|▌         | 63/1208 [02:10<39:38,  2.08s/it, loss=0.158, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.85e-5, train/loss_step=0.024, global_step=2733.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:   5%|▌         | 64/1208 [02:14<39:57,  2.10s/it, loss=0.158, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.85e-5, train/loss_step=0.024, global_step=2733.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   5%|▌         | 64/1208 [02:14<39:57,  2.10s/it, loss=0.16, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.0014, train/loss_step=0.301, global_step=2733.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:   5%|▌         | 65/1208 [02:15<39:37,  2.08s/it, loss=0.16, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.0014, train/loss_step=0.301, global_step=2733.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   5%|▌         | 65/1208 [02:15<39:37,  2.08s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0037, train/loss_vlb_step=2.03e-5, train/loss_step=0.0037, global_step=2734.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   5%|▌         | 66/1208 [02:16<39:17,  2.06s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0037, train/loss_vlb_step=2.03e-5, train/loss_step=0.0037, global_step=2734.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   5%|▌         | 66/1208 [02:16<39:17,  2.06s/it, loss=0.107, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.73e-5, train/loss_step=0.003, global_step=2734.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:   6%|▌         | 67/1208 [02:17<38:57,  2.05s/it, loss=0.107, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.73e-5, train/loss_step=0.003, global_step=2734.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   6%|▌         | 67/1208 [02:17<38:57,  2.05s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0652, train/loss_vlb_step=0.000223, train/loss_step=0.0652, global_step=2734.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   6%|▌         | 68/1208 [02:20<39:15,  2.07s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0652, train/loss_vlb_step=0.000223, train/loss_step=0.0652, global_step=2734.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   6%|▌         | 68/1208 [02:20<39:15,  2.07s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000427, train/loss_step=0.130, global_step=2734.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:   6%|▌         | 69/1208 [02:21<38:57,  2.05s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000427, train/loss_step=0.130, global_step=2734.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   6%|▌         | 69/1208 [02:21<38:57,  2.05s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000111, train/loss_step=0.0291, global_step=2735.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   6%|▌         | 70/1208 [02:22<38:38,  2.04s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000111, train/loss_step=0.0291, global_step=2735.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   6%|▌         | 70/1208 [02:22<38:38,  2.04s/it, loss=0.103, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00106, train/loss_step=0.249, global_step=2735.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:   6%|▌         | 71/1208 [02:23<38:20,  2.02s/it, loss=0.103, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00106, train/loss_step=0.249, global_step=2735.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   6%|▌         | 71/1208 [02:23<38:20,  2.02s/it, loss=0.103, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.11e-5, train/loss_step=0.011, global_step=2735.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   6%|▌         | 72/1208 [02:26<38:37,  2.04s/it, loss=0.103, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.11e-5, train/loss_step=0.011, global_step=2735.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   6%|▌         | 72/1208 [02:26<38:37,  2.04s/it, loss=0.0917, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.00034, train/loss_step=0.102, global_step=2735.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   6%|▌         | 73/1208 [02:27<38:20,  2.03s/it, loss=0.0917, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.00034, train/loss_step=0.102, global_step=2735.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   6%|▌         | 73/1208 [02:27<38:20,  2.03s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.0495, train/loss_vlb_step=0.000184, train/loss_step=0.0495, global_step=2736.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   6%|▌         | 74/1208 [02:29<38:03,  2.01s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.0495, train/loss_vlb_step=0.000184, train/loss_step=0.0495, global_step=2736.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   6%|▌         | 74/1208 [02:29<38:03,  2.01s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.0813, train/loss_vlb_step=0.00027, train/loss_step=0.0813, global_step=2736.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:   6%|▌         | 75/1208 [02:30<37:46,  2.00s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.0813, train/loss_vlb_step=0.00027, train/loss_step=0.0813, global_step=2736.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   6%|▌         | 75/1208 [02:30<37:46,  2.00s/it, loss=0.101, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00219, train/loss_step=0.366, global_step=2736.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:   6%|▋         | 76/1208 [02:33<38:03,  2.02s/it, loss=0.101, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00219, train/loss_step=0.366, global_step=2736.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   6%|▋         | 76/1208 [02:33<38:03,  2.02s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000119, train/loss_step=0.0302, global_step=2736.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   6%|▋         | 77/1208 [02:34<37:48,  2.01s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000119, train/loss_step=0.0302, global_step=2736.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   6%|▋         | 77/1208 [02:34<37:48,  2.01s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=2.55e-5, train/loss_step=0.00526, global_step=2737.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   6%|▋         | 78/1208 [02:35<37:32,  1.99s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=2.55e-5, train/loss_step=0.00526, global_step=2737.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   6%|▋         | 78/1208 [02:35<37:32,  1.99s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=6.97e-5, train/loss_step=0.0163, global_step=2737.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:   7%|▋         | 79/1208 [02:36<37:16,  1.98s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=6.97e-5, train/loss_step=0.0163, global_step=2737.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   7%|▋         | 79/1208 [02:36<37:16,  1.98s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000632, train/loss_step=0.182, global_step=2737.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:   7%|▋         | 80/1208 [02:39<37:33,  2.00s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000632, train/loss_step=0.182, global_step=2737.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   7%|▋         | 80/1208 [02:39<37:33,  2.00s/it, loss=0.0943, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000102, train/loss_step=0.0255, global_step=2737.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   7%|▋         | 81/1208 [02:40<37:17,  1.99s/it, loss=0.0943, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000102, train/loss_step=0.0255, global_step=2737.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   7%|▋         | 81/1208 [02:40<37:18,  1.99s/it, loss=0.106, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.00084, train/loss_step=0.233, global_step=2738.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:   7%|▋         | 82/1208 [02:41<37:02,  1.97s/it, loss=0.106, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.00084, train/loss_step=0.233, global_step=2738.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   7%|▋         | 82/1208 [02:41<37:02,  1.97s/it, loss=0.0997, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000292, train/loss_step=0.087, global_step=2738.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   7%|▋         | 83/1208 [02:42<36:48,  1.96s/it, loss=0.0997, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000292, train/loss_step=0.087, global_step=2738.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   7%|▋         | 83/1208 [02:42<36:48,  1.96s/it, loss=0.105, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000421, train/loss_step=0.128, global_step=2738.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:   7%|▋         | 84/1208 [02:46<37:04,  1.98s/it, loss=0.105, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000421, train/loss_step=0.128, global_step=2738.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   7%|▋         | 84/1208 [02:46<37:04,  1.98s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.0738, train/loss_vlb_step=0.00025, train/loss_step=0.0738, global_step=2738.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   7%|▋         | 85/1208 [02:47<36:50,  1.97s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.0738, train/loss_vlb_step=0.00025, train/loss_step=0.0738, global_step=2738.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   7%|▋         | 85/1208 [02:47<36:50,  1.97s/it, loss=0.112, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.0031, train/loss_step=0.378, global_step=2739.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:   7%|▋         | 86/1208 [02:48<36:35,  1.96s/it, loss=0.112, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.0031, train/loss_step=0.378, global_step=2739.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   7%|▋         | 86/1208 [02:48<36:35,  1.96s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.13e-5, train/loss_step=0.0194, global_step=2739.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   7%|▋         | 87/1208 [02:49<36:21,  1.95s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.13e-5, train/loss_step=0.0194, global_step=2739.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   7%|▋         | 87/1208 [02:49<36:21,  1.95s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0431, train/loss_vlb_step=0.000161, train/loss_step=0.0431, global_step=2739.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   7%|▋         | 88/1208 [02:52<36:37,  1.96s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0431, train/loss_vlb_step=0.000161, train/loss_step=0.0431, global_step=2739.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   7%|▋         | 88/1208 [02:52<36:37,  1.96s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00411, train/loss_vlb_step=2.19e-5, train/loss_step=0.00411, global_step=2739.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   7%|▋         | 89/1208 [02:53<36:23,  1.95s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00411, train/loss_vlb_step=2.19e-5, train/loss_step=0.00411, global_step=2739.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   7%|▋         | 89/1208 [02:53<36:23,  1.95s/it, loss=0.118, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00118, train/loss_step=0.275, global_step=2740.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:   7%|▋         | 90/1208 [02:54<36:10,  1.94s/it, loss=0.118, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00118, train/loss_step=0.275, global_step=2740.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   7%|▋         | 90/1208 [02:54<36:10,  1.94s/it, loss=0.115, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000642, train/loss_step=0.183, global_step=2740.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   8%|▊         | 91/1208 [02:55<35:57,  1.93s/it, loss=0.115, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000642, train/loss_step=0.183, global_step=2740.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   8%|▊         | 91/1208 [02:55<35:57,  1.93s/it, loss=0.119, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000331, train/loss_step=0.100, global_step=2740.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   8%|▊         | 92/1208 [02:59<36:11,  1.95s/it, loss=0.119, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000331, train/loss_step=0.100, global_step=2740.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   8%|▊         | 92/1208 [02:59<36:11,  1.95s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0657, train/loss_vlb_step=0.000223, train/loss_step=0.0657, global_step=2740.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   8%|▊         | 93/1208 [03:00<35:58,  1.94s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0657, train/loss_vlb_step=0.000223, train/loss_step=0.0657, global_step=2740.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   8%|▊         | 93/1208 [03:00<35:59,  1.94s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.17e-5, train/loss_step=0.0112, global_step=2741.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:   8%|▊         | 94/1208 [03:01<35:46,  1.93s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.17e-5, train/loss_step=0.0112, global_step=2741.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   8%|▊         | 94/1208 [03:01<35:46,  1.93s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00762, train/loss_vlb_step=3.82e-5, train/loss_step=0.00762, global_step=2741.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   8%|▊         | 95/1208 [03:02<35:34,  1.92s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00762, train/loss_vlb_step=3.82e-5, train/loss_step=0.00762, global_step=2741.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   8%|▊         | 95/1208 [03:02<35:34,  1.92s/it, loss=0.101, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000527, train/loss_step=0.159, global_step=2741.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:   8%|▊         | 96/1208 [03:05<35:48,  1.93s/it, loss=0.101, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000527, train/loss_step=0.159, global_step=2741.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   8%|▊         | 96/1208 [03:05<35:48,  1.93s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000157, train/loss_step=0.0437, global_step=2741.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   8%|▊         | 97/1208 [03:06<35:36,  1.92s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000157, train/loss_step=0.0437, global_step=2741.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   8%|▊         | 97/1208 [03:06<35:36,  1.92s/it, loss=0.122, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00526, train/loss_step=0.413, global_step=2742.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:   8%|▊         | 98/1208 [03:07<35:24,  1.91s/it, loss=0.122, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00526, train/loss_step=0.413, global_step=2742.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   8%|▊         | 98/1208 [03:07<35:24,  1.91s/it, loss=0.135, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00122, train/loss_step=0.275, global_step=2742.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   8%|▊         | 99/1208 [03:08<35:13,  1.91s/it, loss=0.135, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00122, train/loss_step=0.275, global_step=2742.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   8%|▊         | 99/1208 [03:08<35:13,  1.91s/it, loss=0.138, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000981, train/loss_step=0.234, global_step=2742.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   8%|▊         | 100/1208 [03:11<35:26,  1.92s/it, loss=0.138, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000981, train/loss_step=0.234, global_step=2742.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   8%|▊         | 100/1208 [03:11<35:26,  1.92s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.1e-5, train/loss_step=0.0196, global_step=2742.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   8%|▊         | 101/1208 [03:13<35:15,  1.91s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.1e-5, train/loss_step=0.0196, global_step=2742.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   8%|▊         | 101/1208 [03:13<35:15,  1.91s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.000172, train/loss_step=0.0471, global_step=2743.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   8%|▊         | 102/1208 [03:14<35:04,  1.90s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.000172, train/loss_step=0.0471, global_step=2743.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   8%|▊         | 102/1208 [03:14<35:04,  1.90s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.37e-5, train/loss_step=0.0227, global_step=2743.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:   9%|▊         | 103/1208 [03:15<34:53,  1.89s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.37e-5, train/loss_step=0.0227, global_step=2743.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   9%|▊         | 103/1208 [03:15<34:53,  1.89s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00459, train/loss_vlb_step=2.45e-5, train/loss_step=0.00459, global_step=2743.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   9%|▊         | 104/1208 [03:18<35:05,  1.91s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00459, train/loss_vlb_step=2.45e-5, train/loss_step=0.00459, global_step=2743.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   9%|▊         | 104/1208 [03:18<35:05,  1.91s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000138, train/loss_step=0.0374, global_step=2743.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:   9%|▊         | 105/1208 [03:19<34:54,  1.90s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000138, train/loss_step=0.0374, global_step=2743.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   9%|▊         | 105/1208 [03:19<34:54,  1.90s/it, loss=0.103, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000348, train/loss_step=0.106, global_step=2744.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:   9%|▉         | 106/1208 [03:20<34:44,  1.89s/it, loss=0.103, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000348, train/loss_step=0.106, global_step=2744.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   9%|▉         | 106/1208 [03:20<34:44,  1.89s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0481, train/loss_vlb_step=0.000169, train/loss_step=0.0481, global_step=2744.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   9%|▉         | 107/1208 [03:21<34:33,  1.88s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0481, train/loss_vlb_step=0.000169, train/loss_step=0.0481, global_step=2744.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   9%|▉         | 107/1208 [03:21<34:33,  1.88s/it, loss=0.133, v_num=0, train/loss_simple_step=0.596, train/loss_vlb_step=0.0066, train/loss_step=0.596, global_step=2744.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:   9%|▉         | 108/1208 [03:24<34:45,  1.90s/it, loss=0.133, v_num=0, train/loss_simple_step=0.596, train/loss_vlb_step=0.0066, train/loss_step=0.596, global_step=2744.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   9%|▉         | 108/1208 [03:24<34:45,  1.90s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.000183, train/loss_step=0.0527, global_step=2744.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   9%|▉         | 109/1208 [03:25<34:35,  1.89s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.000183, train/loss_step=0.0527, global_step=2744.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   9%|▉         | 109/1208 [03:25<34:35,  1.89s/it, loss=0.134, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.000979, train/loss_step=0.249, global_step=2745.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:   9%|▉         | 110/1208 [03:26<34:24,  1.88s/it, loss=0.134, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.000979, train/loss_step=0.249, global_step=2745.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   9%|▉         | 110/1208 [03:26<34:24,  1.88s/it, loss=0.125, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.23e-5, train/loss_step=0.011, global_step=2745.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:   9%|▉         | 111/1208 [03:27<34:14,  1.87s/it, loss=0.125, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.23e-5, train/loss_step=0.011, global_step=2745.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   9%|▉         | 111/1208 [03:27<34:14,  1.87s/it, loss=0.132, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.0009, train/loss_step=0.228, global_step=2745.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:   9%|▉         | 112/1208 [03:31<34:26,  1.89s/it, loss=0.132, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.0009, train/loss_step=0.228, global_step=2745.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   9%|▉         | 112/1208 [03:31<34:26,  1.89s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.46e-5, train/loss_step=0.00254, global_step=2745.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   9%|▉         | 113/1208 [03:32<34:16,  1.88s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.46e-5, train/loss_step=0.00254, global_step=2745.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   9%|▉         | 113/1208 [03:32<34:16,  1.88s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000136, train/loss_step=0.0353, global_step=2746.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:   9%|▉         | 114/1208 [03:33<34:06,  1.87s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000136, train/loss_step=0.0353, global_step=2746.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:   9%|▉         | 114/1208 [03:33<34:06,  1.87s/it, loss=0.135, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=2746.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  10%|▉         | 115/1208 [03:34<33:56,  1.86s/it, loss=0.135, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=2746.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  10%|▉         | 115/1208 [03:34<33:57,  1.86s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.2e-5, train/loss_step=0.0123, global_step=2746.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  10%|▉         | 116/1208 [03:37<34:08,  1.88s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.2e-5, train/loss_step=0.0123, global_step=2746.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  10%|▉         | 116/1208 [03:37<34:08,  1.88s/it, loss=0.131, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=2746.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  10%|▉         | 117/1208 [03:38<33:59,  1.87s/it, loss=0.131, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=2746.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  10%|▉         | 117/1208 [03:38<33:59,  1.87s/it, loss=0.127, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.0016, train/loss_step=0.336, global_step=2747.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  10%|▉         | 118/1208 [03:39<33:49,  1.86s/it, loss=0.127, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.0016, train/loss_step=0.336, global_step=2747.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  10%|▉         | 118/1208 [03:39<33:49,  1.86s/it, loss=0.123, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000655, train/loss_step=0.188, global_step=2747.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  10%|▉         | 119/1208 [03:40<33:40,  1.85s/it, loss=0.123, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000655, train/loss_step=0.188, global_step=2747.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  10%|▉         | 119/1208 [03:40<33:40,  1.85s/it, loss=0.12, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000612, train/loss_step=0.173, global_step=2747.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  10%|▉         | 120/1208 [03:44<33:51,  1.87s/it, loss=0.12, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000612, train/loss_step=0.173, global_step=2747.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  10%|▉         | 120/1208 [03:44<33:51,  1.87s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0063, train/loss_vlb_step=3.23e-5, train/loss_step=0.0063, global_step=2747.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  10%|█         | 121/1208 [03:45<33:42,  1.86s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0063, train/loss_vlb_step=3.23e-5, train/loss_step=0.0063, global_step=2747.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  10%|█         | 121/1208 [03:45<33:42,  1.86s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0782, train/loss_vlb_step=0.000262, train/loss_step=0.0782, global_step=2748.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  10%|█         | 122/1208 [03:46<33:32,  1.85s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0782, train/loss_vlb_step=0.000262, train/loss_step=0.0782, global_step=2748.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  10%|█         | 122/1208 [03:46<33:32,  1.85s/it, loss=0.13, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000847, train/loss_step=0.205, global_step=2748.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  10%|█         | 123/1208 [03:47<33:23,  1.85s/it, loss=0.13, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000847, train/loss_step=0.205, global_step=2748.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  10%|█         | 123/1208 [03:47<33:23,  1.85s/it, loss=0.139, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.00074, train/loss_step=0.197, global_step=2748.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  10%|█         | 124/1208 [03:50<33:34,  1.86s/it, loss=0.139, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.00074, train/loss_step=0.197, global_step=2748.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  10%|█         | 124/1208 [03:50<33:34,  1.86s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0435, train/loss_vlb_step=0.000156, train/loss_step=0.0435, global_step=2748.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  10%|█         | 125/1208 [03:51<33:25,  1.85s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0435, train/loss_vlb_step=0.000156, train/loss_step=0.0435, global_step=2748.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  10%|█         | 125/1208 [03:51<33:25,  1.85s/it, loss=0.166, v_num=0, train/loss_simple_step=0.623, train/loss_vlb_step=0.0152, train/loss_step=0.623, global_step=2749.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  10%|█         | 126/1208 [03:52<33:16,  1.85s/it, loss=0.166, v_num=0, train/loss_simple_step=0.623, train/loss_vlb_step=0.0152, train/loss_step=0.623, global_step=2749.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  10%|█         | 126/1208 [03:52<33:16,  1.85s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5e-5, train/loss_step=0.0108, global_step=2749.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  11%|█         | 127/1208 [03:53<33:08,  1.84s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5e-5, train/loss_step=0.0108, global_step=2749.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  11%|█         | 127/1208 [03:53<33:08,  1.84s/it, loss=0.15, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00176, train/loss_step=0.328, global_step=2749.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  11%|█         | 128/1208 [03:56<33:18,  1.85s/it, loss=0.15, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00176, train/loss_step=0.328, global_step=2749.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  11%|█         | 128/1208 [03:56<33:18,  1.85s/it, loss=0.172, v_num=0, train/loss_simple_step=0.491, train/loss_vlb_step=0.00825, train/loss_step=0.491, global_step=2749.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  11%|█         | 129/1208 [03:57<33:10,  1.84s/it, loss=0.172, v_num=0, train/loss_simple_step=0.491, train/loss_vlb_step=0.00825, train/loss_step=0.491, global_step=2749.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  11%|█         | 129/1208 [03:57<33:10,  1.84s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=5.18e-5, train/loss_step=0.0106, global_step=2750.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  11%|█         | 130/1208 [03:58<33:01,  1.84s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=5.18e-5, train/loss_step=0.0106, global_step=2750.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  11%|█         | 130/1208 [03:58<33:01,  1.84s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0933, train/loss_vlb_step=0.000309, train/loss_step=0.0933, global_step=2750.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  11%|█         | 131/1208 [04:00<32:53,  1.83s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0933, train/loss_vlb_step=0.000309, train/loss_step=0.0933, global_step=2750.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  11%|█         | 131/1208 [04:00<32:53,  1.83s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.15e-5, train/loss_step=0.0226, global_step=2750.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  11%|█         | 132/1208 [04:03<33:03,  1.84s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.15e-5, train/loss_step=0.0226, global_step=2750.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  11%|█         | 132/1208 [04:03<33:03,  1.84s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00559, train/loss_vlb_step=2.86e-5, train/loss_step=0.00559, global_step=2750.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  11%|█         | 133/1208 [04:04<32:54,  1.84s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00559, train/loss_vlb_step=2.86e-5, train/loss_step=0.00559, global_step=2750.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  11%|█         | 133/1208 [04:04<32:54,  1.84s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.46e-5, train/loss_step=0.0151, global_step=2751.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  11%|█         | 134/1208 [04:05<32:46,  1.83s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.46e-5, train/loss_step=0.0151, global_step=2751.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  11%|█         | 134/1208 [04:05<32:46,  1.83s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0785, train/loss_vlb_step=0.000267, train/loss_step=0.0785, global_step=2751.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  11%|█         | 135/1208 [04:06<32:38,  1.83s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0785, train/loss_vlb_step=0.000267, train/loss_step=0.0785, global_step=2751.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  11%|█         | 135/1208 [04:06<32:38,  1.83s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000112, train/loss_step=0.0284, global_step=2751.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  11%|█▏        | 136/1208 [04:09<32:48,  1.84s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000112, train/loss_step=0.0284, global_step=2751.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  11%|█▏        | 136/1208 [04:09<32:48,  1.84s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.9e-5, train/loss_step=0.0159, global_step=2751.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  11%|█▏        | 137/1208 [04:10<32:40,  1.83s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.9e-5, train/loss_step=0.0159, global_step=2751.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  11%|█▏        | 137/1208 [04:10<32:40,  1.83s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00467, train/loss_vlb_step=2.49e-5, train/loss_step=0.00467, global_step=2752.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  11%|█▏        | 138/1208 [04:11<32:32,  1.82s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00467, train/loss_vlb_step=2.49e-5, train/loss_step=0.00467, global_step=2752.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  11%|█▏        | 138/1208 [04:11<32:32,  1.82s/it, loss=0.134, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00097, train/loss_step=0.253, global_step=2752.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  12%|█▏        | 139/1208 [04:12<32:24,  1.82s/it, loss=0.134, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00097, train/loss_step=0.253, global_step=2752.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  12%|█▏        | 139/1208 [04:12<32:24,  1.82s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00829, train/loss_vlb_step=3.98e-5, train/loss_step=0.00829, global_step=2752.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  12%|█▏        | 140/1208 [04:16<32:34,  1.83s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00829, train/loss_vlb_step=3.98e-5, train/loss_step=0.00829, global_step=2752.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  12%|█▏        | 140/1208 [04:16<32:34,  1.83s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000198, train/loss_step=0.0545, global_step=2752.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  12%|█▏        | 141/1208 [04:17<32:26,  1.82s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000198, train/loss_step=0.0545, global_step=2752.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  12%|█▏        | 141/1208 [04:17<32:26,  1.82s/it, loss=0.132, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.00048, train/loss_step=0.146, global_step=2753.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  12%|█▏        | 142/1208 [04:18<32:18,  1.82s/it, loss=0.132, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.00048, train/loss_step=0.146, global_step=2753.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  12%|█▏        | 142/1208 [04:18<32:18,  1.82s/it, loss=0.134, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000948, train/loss_step=0.245, global_step=2753.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  12%|█▏        | 143/1208 [04:19<32:11,  1.81s/it, loss=0.134, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000948, train/loss_step=0.245, global_step=2753.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  12%|█▏        | 143/1208 [04:19<32:11,  1.81s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.59e-5, train/loss_step=0.0156, global_step=2753.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  12%|█▏        | 144/1208 [04:22<32:19,  1.82s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.59e-5, train/loss_step=0.0156, global_step=2753.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  12%|█▏        | 144/1208 [04:22<32:19,  1.82s/it, loss=0.141, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00283, train/loss_step=0.362, global_step=2753.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  12%|█▏        | 145/1208 [04:23<32:12,  1.82s/it, loss=0.141, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00283, train/loss_step=0.362, global_step=2753.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  12%|█▏        | 145/1208 [04:23<32:12,  1.82s/it, loss=0.12, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000777, train/loss_step=0.214, global_step=2754.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  12%|█▏        | 146/1208 [04:24<32:04,  1.81s/it, loss=0.12, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000777, train/loss_step=0.214, global_step=2754.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  12%|█▏        | 146/1208 [04:24<32:04,  1.81s/it, loss=0.12, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.47e-5, train/loss_step=0.012, global_step=2754.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  12%|█▏        | 147/1208 [04:25<31:57,  1.81s/it, loss=0.12, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.47e-5, train/loss_step=0.012, global_step=2754.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  12%|█▏        | 147/1208 [04:25<31:57,  1.81s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.000189, train/loss_step=0.0543, global_step=2754.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  12%|█▏        | 148/1208 [04:28<32:06,  1.82s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.000189, train/loss_step=0.0543, global_step=2754.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  12%|█▏        | 148/1208 [04:28<32:06,  1.82s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000125, train/loss_step=0.031, global_step=2754.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  12%|█▏        | 149/1208 [04:30<31:59,  1.81s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000125, train/loss_step=0.031, global_step=2754.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  12%|█▏        | 149/1208 [04:30<31:59,  1.81s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000974, train/loss_step=0.232, global_step=2755.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  12%|█▏        | 150/1208 [04:31<31:51,  1.81s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000974, train/loss_step=0.232, global_step=2755.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  12%|█▏        | 150/1208 [04:31<31:51,  1.81s/it, loss=0.106, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.002, train/loss_step=0.332, global_step=2755.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  12%|█▎        | 151/1208 [04:32<31:44,  1.80s/it, loss=0.106, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.002, train/loss_step=0.332, global_step=2755.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  12%|█▎        | 151/1208 [04:32<31:44,  1.80s/it, loss=0.116, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000785, train/loss_step=0.207, global_step=2755.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  13%|█▎        | 152/1208 [04:35<31:52,  1.81s/it, loss=0.116, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000785, train/loss_step=0.207, global_step=2755.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  13%|█▎        | 152/1208 [04:35<31:53,  1.81s/it, loss=0.124, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.00057, train/loss_step=0.162, global_step=2755.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  13%|█▎        | 153/1208 [04:36<31:45,  1.81s/it, loss=0.124, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.00057, train/loss_step=0.162, global_step=2755.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  13%|█▎        | 153/1208 [04:36<31:45,  1.81s/it, loss=0.14, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.0019, train/loss_step=0.352, global_step=2756.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  13%|█▎        | 154/1208 [04:37<31:38,  1.80s/it, loss=0.14, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.0019, train/loss_step=0.352, global_step=2756.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  13%|█▎        | 154/1208 [04:37<31:38,  1.80s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.45e-5, train/loss_step=0.00248, global_step=2756.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  13%|█▎        | 155/1208 [04:38<31:31,  1.80s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.45e-5, train/loss_step=0.00248, global_step=2756.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  13%|█▎        | 155/1208 [04:38<31:31,  1.80s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0996, train/loss_vlb_step=0.000329, train/loss_step=0.0996, global_step=2756.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  13%|█▎        | 156/1208 [04:41<31:40,  1.81s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0996, train/loss_vlb_step=0.000329, train/loss_step=0.0996, global_step=2756.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  13%|█▎        | 156/1208 [04:41<31:40,  1.81s/it, loss=0.145, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.00036, train/loss_step=0.109, global_step=2756.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  13%|█▎        | 157/1208 [04:42<31:33,  1.80s/it, loss=0.145, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.00036, train/loss_step=0.109, global_step=2756.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  13%|█▎        | 157/1208 [04:42<31:33,  1.80s/it, loss=0.155, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000719, train/loss_step=0.205, global_step=2757.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  13%|█▎        | 158/1208 [04:43<31:26,  1.80s/it, loss=0.155, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000719, train/loss_step=0.205, global_step=2757.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  13%|█▎        | 158/1208 [04:43<31:26,  1.80s/it, loss=0.16, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00319, train/loss_step=0.347, global_step=2757.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  13%|█▎        | 159/1208 [04:44<31:19,  1.79s/it, loss=0.16, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00319, train/loss_step=0.347, global_step=2757.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  13%|█▎        | 159/1208 [04:44<31:19,  1.79s/it, loss=0.177, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00187, train/loss_step=0.365, global_step=2757.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  13%|█▎        | 160/1208 [04:48<31:27,  1.80s/it, loss=0.177, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00187, train/loss_step=0.365, global_step=2757.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  13%|█▎        | 160/1208 [04:48<31:27,  1.80s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0673, train/loss_vlb_step=0.000225, train/loss_step=0.0673, global_step=2757.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  13%|█▎        | 161/1208 [04:49<31:21,  1.80s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0673, train/loss_vlb_step=0.000225, train/loss_step=0.0673, global_step=2757.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  13%|█▎        | 161/1208 [04:49<31:21,  1.80s/it, loss=0.176, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=2758.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  13%|█▎        | 162/1208 [04:50<31:14,  1.79s/it, loss=0.176, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=2758.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  13%|█▎        | 162/1208 [04:50<31:14,  1.79s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00802, train/loss_vlb_step=4.02e-5, train/loss_step=0.00802, global_step=2758.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  13%|█▎        | 163/1208 [04:51<31:07,  1.79s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00802, train/loss_vlb_step=4.02e-5, train/loss_step=0.00802, global_step=2758.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  13%|█▎        | 163/1208 [04:51<31:07,  1.79s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0434, train/loss_vlb_step=0.000164, train/loss_step=0.0434, global_step=2758.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  14%|█▎        | 164/1208 [04:54<31:15,  1.80s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0434, train/loss_vlb_step=0.000164, train/loss_step=0.0434, global_step=2758.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  14%|█▎        | 164/1208 [04:54<31:15,  1.80s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00505, train/loss_vlb_step=2.68e-5, train/loss_step=0.00505, global_step=2758.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  14%|█▎        | 165/1208 [04:55<31:08,  1.79s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00505, train/loss_vlb_step=2.68e-5, train/loss_step=0.00505, global_step=2758.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  14%|█▎        | 165/1208 [04:55<31:08,  1.79s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000117, train/loss_step=0.0304, global_step=2759.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  14%|█▎        | 166/1208 [04:56<31:02,  1.79s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000117, train/loss_step=0.0304, global_step=2759.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  14%|█▎        | 166/1208 [04:56<31:02,  1.79s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0887, train/loss_vlb_step=0.000295, train/loss_step=0.0887, global_step=2759.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  14%|█▍        | 167/1208 [04:57<30:56,  1.78s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0887, train/loss_vlb_step=0.000295, train/loss_step=0.0887, global_step=2759.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  14%|█▍        | 167/1208 [04:57<30:56,  1.78s/it, loss=0.145, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=2759.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  14%|█▍        | 168/1208 [05:01<31:03,  1.79s/it, loss=0.145, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=2759.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  14%|█▍        | 168/1208 [05:01<31:03,  1.79s/it, loss=0.162, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00265, train/loss_step=0.381, global_step=2759.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  14%|█▍        | 169/1208 [05:02<30:57,  1.79s/it, loss=0.162, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00265, train/loss_step=0.381, global_step=2759.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  14%|█▍        | 169/1208 [05:02<30:57,  1.79s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.0001, train/loss_step=0.0254, global_step=2760.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  14%|█▍        | 170/1208 [05:03<30:51,  1.78s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.0001, train/loss_step=0.0254, global_step=2760.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  14%|█▍        | 170/1208 [05:03<30:51,  1.78s/it, loss=0.146, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000852, train/loss_step=0.215, global_step=2760.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  14%|█▍        | 171/1208 [05:04<30:44,  1.78s/it, loss=0.146, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000852, train/loss_step=0.215, global_step=2760.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  14%|█▍        | 171/1208 [05:04<30:44,  1.78s/it, loss=0.141, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=2760.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  14%|█▍        | 172/1208 [05:07<30:51,  1.79s/it, loss=0.141, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=2760.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  14%|█▍        | 172/1208 [05:07<30:51,  1.79s/it, loss=0.141, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000556, train/loss_step=0.165, global_step=2760.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  14%|█▍        | 173/1208 [05:08<30:45,  1.78s/it, loss=0.141, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000556, train/loss_step=0.165, global_step=2760.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  14%|█▍        | 173/1208 [05:08<30:45,  1.78s/it, loss=0.145, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00428, train/loss_step=0.442, global_step=2761.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  14%|█▍        | 174/1208 [05:09<30:39,  1.78s/it, loss=0.145, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00428, train/loss_step=0.442, global_step=2761.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  14%|█▍        | 174/1208 [05:09<30:39,  1.78s/it, loss=0.164, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00203, train/loss_step=0.374, global_step=2761.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  14%|█▍        | 175/1208 [05:10<30:33,  1.77s/it, loss=0.164, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00203, train/loss_step=0.374, global_step=2761.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  14%|█▍        | 175/1208 [05:10<30:33,  1.77s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.44e-5, train/loss_step=0.0119, global_step=2761.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  15%|█▍        | 176/1208 [05:13<30:40,  1.78s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.44e-5, train/loss_step=0.0119, global_step=2761.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  15%|█▍        | 176/1208 [05:13<30:40,  1.78s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0809, train/loss_vlb_step=0.000275, train/loss_step=0.0809, global_step=2761.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  15%|█▍        | 177/1208 [05:14<30:34,  1.78s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0809, train/loss_vlb_step=0.000275, train/loss_step=0.0809, global_step=2761.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  15%|█▍        | 177/1208 [05:14<30:34,  1.78s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00681, train/loss_vlb_step=3.58e-5, train/loss_step=0.00681, global_step=2762.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  15%|█▍        | 178/1208 [05:15<30:28,  1.77s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00681, train/loss_vlb_step=3.58e-5, train/loss_step=0.00681, global_step=2762.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  15%|█▍        | 178/1208 [05:15<30:28,  1.77s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000121, train/loss_step=0.0297, global_step=2762.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  15%|█▍        | 179/1208 [05:17<30:22,  1.77s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000121, train/loss_step=0.0297, global_step=2762.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  15%|█▍        | 179/1208 [05:17<30:22,  1.77s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0603, train/loss_vlb_step=0.000207, train/loss_step=0.0603, global_step=2762.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  15%|█▍        | 180/1208 [05:20<30:28,  1.78s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0603, train/loss_vlb_step=0.000207, train/loss_step=0.0603, global_step=2762.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  15%|█▍        | 180/1208 [05:20<30:28,  1.78s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0822, train/loss_vlb_step=0.000276, train/loss_step=0.0822, global_step=2762.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  15%|█▍        | 181/1208 [05:21<30:23,  1.78s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0822, train/loss_vlb_step=0.000276, train/loss_step=0.0822, global_step=2762.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  15%|█▍        | 181/1208 [05:21<30:23,  1.78s/it, loss=0.123, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000735, train/loss_step=0.205, global_step=2763.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  15%|█▌        | 182/1208 [05:22<30:17,  1.77s/it, loss=0.123, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000735, train/loss_step=0.205, global_step=2763.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  15%|█▌        | 182/1208 [05:22<30:17,  1.77s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0552, train/loss_vlb_step=0.000193, train/loss_step=0.0552, global_step=2763.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  15%|█▌        | 183/1208 [05:23<30:11,  1.77s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0552, train/loss_vlb_step=0.000193, train/loss_step=0.0552, global_step=2763.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  15%|█▌        | 183/1208 [05:23<30:11,  1.77s/it, loss=0.131, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000518, train/loss_step=0.155, global_step=2763.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  15%|█▌        | 184/1208 [05:26<30:18,  1.78s/it, loss=0.131, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000518, train/loss_step=0.155, global_step=2763.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  15%|█▌        | 184/1208 [05:26<30:18,  1.78s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0357, train/loss_vlb_step=0.000134, train/loss_step=0.0357, global_step=2763.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  15%|█▌        | 185/1208 [05:27<30:12,  1.77s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0357, train/loss_vlb_step=0.000134, train/loss_step=0.0357, global_step=2763.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  15%|█▌        | 185/1208 [05:27<30:12,  1.77s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0447, train/loss_vlb_step=0.000158, train/loss_step=0.0447, global_step=2764.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  15%|█▌        | 186/1208 [05:28<30:06,  1.77s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0447, train/loss_vlb_step=0.000158, train/loss_step=0.0447, global_step=2764.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  15%|█▌        | 186/1208 [05:28<30:06,  1.77s/it, loss=0.136, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000512, train/loss_step=0.151, global_step=2764.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  15%|█▌        | 187/1208 [05:29<30:00,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000512, train/loss_step=0.151, global_step=2764.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  15%|█▌        | 187/1208 [05:29<30:00,  1.76s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.65e-5, train/loss_step=0.0233, global_step=2764.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  16%|█▌        | 188/1208 [05:33<30:07,  1.77s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.65e-5, train/loss_step=0.0233, global_step=2764.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  16%|█▌        | 188/1208 [05:33<30:07,  1.77s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0683, train/loss_vlb_step=0.000231, train/loss_step=0.0683, global_step=2764.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  16%|█▌        | 189/1208 [05:34<30:02,  1.77s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0683, train/loss_vlb_step=0.000231, train/loss_step=0.0683, global_step=2764.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  16%|█▌        | 189/1208 [05:34<30:02,  1.77s/it, loss=0.116, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.75e-5, train/loss_step=0.013, global_step=2765.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  16%|█▌        | 190/1208 [05:35<29:56,  1.76s/it, loss=0.116, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.75e-5, train/loss_step=0.013, global_step=2765.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  16%|█▌        | 190/1208 [05:35<29:56,  1.76s/it, loss=0.111, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000384, train/loss_step=0.117, global_step=2765.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  16%|█▌        | 191/1208 [05:36<29:50,  1.76s/it, loss=0.111, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000384, train/loss_step=0.117, global_step=2765.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  16%|█▌        | 191/1208 [05:36<29:50,  1.76s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00939, train/loss_vlb_step=4.64e-5, train/loss_step=0.00939, global_step=2765.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  16%|█▌        | 192/1208 [05:39<29:57,  1.77s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00939, train/loss_vlb_step=4.64e-5, train/loss_step=0.00939, global_step=2765.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  16%|█▌        | 192/1208 [05:39<29:57,  1.77s/it, loss=0.127, v_num=0, train/loss_simple_step=0.570, train/loss_vlb_step=0.0152, train/loss_step=0.570, global_step=2765.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]     Epoch 9:  16%|█▌        | 193/1208 [05:40<29:51,  1.77s/it, loss=0.127, v_num=0, train/loss_simple_step=0.570, train/loss_vlb_step=0.0152, train/loss_step=0.570, global_step=2765.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  16%|█▌        | 193/1208 [05:40<29:51,  1.77s/it, loss=0.121, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00182, train/loss_step=0.321, global_step=2766.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  16%|█▌        | 194/1208 [05:41<29:46,  1.76s/it, loss=0.121, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00182, train/loss_step=0.321, global_step=2766.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  16%|█▌        | 194/1208 [05:41<29:46,  1.76s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.26e-5, train/loss_step=0.00215, global_step=2766.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  16%|█▌        | 195/1208 [05:42<29:40,  1.76s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.26e-5, train/loss_step=0.00215, global_step=2766.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  16%|█▌        | 195/1208 [05:42<29:40,  1.76s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.74e-5, train/loss_step=0.0175, global_step=2766.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  16%|█▌        | 196/1208 [05:46<29:46,  1.77s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.74e-5, train/loss_step=0.0175, global_step=2766.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  16%|█▌        | 196/1208 [05:46<29:46,  1.77s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0422, train/loss_vlb_step=0.000157, train/loss_step=0.0422, global_step=2766.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  16%|█▋        | 197/1208 [05:47<29:41,  1.76s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0422, train/loss_vlb_step=0.000157, train/loss_step=0.0422, global_step=2766.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  16%|█▋        | 197/1208 [05:47<29:41,  1.76s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=8.27e-5, train/loss_step=0.0188, global_step=2767.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  16%|█▋        | 198/1208 [05:48<29:35,  1.76s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=8.27e-5, train/loss_step=0.0188, global_step=2767.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  16%|█▋        | 198/1208 [05:48<29:35,  1.76s/it, loss=0.105, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000347, train/loss_step=0.106, global_step=2767.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  16%|█▋        | 199/1208 [05:49<29:30,  1.75s/it, loss=0.105, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000347, train/loss_step=0.106, global_step=2767.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  16%|█▋        | 199/1208 [05:49<29:30,  1.75s/it, loss=0.108, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00042, train/loss_step=0.128, global_step=2767.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  17%|█▋        | 200/1208 [05:52<29:36,  1.76s/it, loss=0.108, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00042, train/loss_step=0.128, global_step=2767.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  17%|█▋        | 200/1208 [05:52<29:36,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000629, train/loss_step=0.179, global_step=2767.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  17%|█▋        | 201/1208 [05:53<29:30,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000629, train/loss_step=0.179, global_step=2767.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  17%|█▋        | 201/1208 [05:53<29:30,  1.76s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00654, train/loss_vlb_step=3.34e-5, train/loss_step=0.00654, global_step=2768.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  17%|█▋        | 202/1208 [05:54<29:25,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00654, train/loss_vlb_step=3.34e-5, train/loss_step=0.00654, global_step=2768.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  17%|█▋        | 202/1208 [05:54<29:25,  1.75s/it, loss=0.108, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000542, train/loss_step=0.155, global_step=2768.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  17%|█▋        | 203/1208 [05:55<29:20,  1.75s/it, loss=0.108, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000542, train/loss_step=0.155, global_step=2768.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  17%|█▋        | 203/1208 [05:55<29:20,  1.75s/it, loss=0.108, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000525, train/loss_step=0.156, global_step=2768.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  17%|█▋        | 204/1208 [05:58<29:25,  1.76s/it, loss=0.108, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000525, train/loss_step=0.156, global_step=2768.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  17%|█▋        | 204/1208 [05:58<29:25,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000469, train/loss_step=0.138, global_step=2768.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  17%|█▋        | 205/1208 [05:59<29:20,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000469, train/loss_step=0.138, global_step=2768.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  17%|█▋        | 205/1208 [05:59<29:20,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.000163, train/loss_step=0.0441, global_step=2769.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  17%|█▋        | 206/1208 [06:00<29:15,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.000163, train/loss_step=0.0441, global_step=2769.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  17%|█▋        | 206/1208 [06:00<29:15,  1.75s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.000176, train/loss_step=0.0459, global_step=2769.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  17%|█▋        | 207/1208 [06:01<29:10,  1.75s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.000176, train/loss_step=0.0459, global_step=2769.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  17%|█▋        | 207/1208 [06:01<29:10,  1.75s/it, loss=0.109, v_num=0, train/loss_simple_step=0.052, train/loss_vlb_step=0.000182, train/loss_step=0.052, global_step=2769.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  17%|█▋        | 208/1208 [06:05<29:15,  1.76s/it, loss=0.109, v_num=0, train/loss_simple_step=0.052, train/loss_vlb_step=0.000182, train/loss_step=0.052, global_step=2769.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  17%|█▋        | 208/1208 [06:05<29:15,  1.76s/it, loss=0.118, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.000977, train/loss_step=0.243, global_step=2769.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  17%|█▋        | 209/1208 [06:06<29:10,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.000977, train/loss_step=0.243, global_step=2769.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  17%|█▋        | 209/1208 [06:06<29:10,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.00063, train/loss_step=0.178, global_step=2770.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  17%|█▋        | 210/1208 [06:07<29:05,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.00063, train/loss_step=0.178, global_step=2770.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  17%|█▋        | 210/1208 [06:07<29:05,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0943, train/loss_vlb_step=0.000314, train/loss_step=0.0943, global_step=2770.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  17%|█▋        | 211/1208 [06:08<29:00,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0943, train/loss_vlb_step=0.000314, train/loss_step=0.0943, global_step=2770.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  17%|█▋        | 211/1208 [06:08<29:00,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0795, train/loss_vlb_step=0.00027, train/loss_step=0.0795, global_step=2770.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  18%|█▊        | 212/1208 [06:11<29:05,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0795, train/loss_vlb_step=0.00027, train/loss_step=0.0795, global_step=2770.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  18%|█▊        | 212/1208 [06:11<29:05,  1.75s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=1.31e-5, train/loss_step=0.00223, global_step=2770.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  18%|█▊        | 213/1208 [06:12<29:00,  1.75s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=1.31e-5, train/loss_step=0.00223, global_step=2770.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  18%|█▊        | 213/1208 [06:12<29:00,  1.75s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00107, train/loss_step=0.249, global_step=2771.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  18%|█▊        | 214/1208 [06:13<28:55,  1.75s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00107, train/loss_step=0.249, global_step=2771.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  18%|█▊        | 214/1208 [06:13<28:55,  1.75s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.000141, train/loss_step=0.0395, global_step=2771.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  18%|█▊        | 215/1208 [06:14<28:50,  1.74s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.000141, train/loss_step=0.0395, global_step=2771.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  18%|█▊        | 215/1208 [06:14<28:50,  1.74s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.00898, train/loss_vlb_step=4.1e-5, train/loss_step=0.00898, global_step=2771.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  18%|█▊        | 216/1208 [06:17<28:55,  1.75s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.00898, train/loss_vlb_step=4.1e-5, train/loss_step=0.00898, global_step=2771.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  18%|█▊        | 216/1208 [06:17<28:55,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.663, train/loss_vlb_step=0.0343, train/loss_step=0.663, global_step=2771.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]     Epoch 9:  18%|█▊        | 217/1208 [06:19<28:51,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.663, train/loss_vlb_step=0.0343, train/loss_step=0.663, global_step=2771.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  18%|█▊        | 217/1208 [06:19<28:51,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0464, train/loss_vlb_step=0.000171, train/loss_step=0.0464, global_step=2772.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  18%|█▊        | 218/1208 [06:20<28:46,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0464, train/loss_vlb_step=0.000171, train/loss_step=0.0464, global_step=2772.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  18%|█▊        | 218/1208 [06:20<28:46,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00128, train/loss_step=0.264, global_step=2772.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  18%|█▊        | 219/1208 [06:21<28:41,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00128, train/loss_step=0.264, global_step=2772.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  18%|█▊        | 219/1208 [06:21<28:41,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.00352, train/loss_step=0.406, global_step=2772.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  18%|█▊        | 220/1208 [06:24<28:46,  1.75s/it, loss=0.153, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.00352, train/loss_step=0.406, global_step=2772.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  18%|█▊        | 220/1208 [06:24<28:46,  1.75s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.59e-5, train/loss_step=0.00277, global_step=2772.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  18%|█▊        | 221/1208 [06:25<28:41,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.59e-5, train/loss_step=0.00277, global_step=2772.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  18%|█▊        | 221/1208 [06:25<28:41,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.6e-5, train/loss_step=0.0176, global_step=2773.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  18%|█▊        | 222/1208 [06:26<28:36,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.6e-5, train/loss_step=0.0176, global_step=2773.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  18%|█▊        | 222/1208 [06:26<28:36,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000519, train/loss_step=0.153, global_step=2773.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  18%|█▊        | 223/1208 [06:27<28:31,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000519, train/loss_step=0.153, global_step=2773.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  18%|█▊        | 223/1208 [06:27<28:31,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000117, train/loss_step=0.0317, global_step=2773.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  19%|█▊        | 224/1208 [06:30<28:36,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000117, train/loss_step=0.0317, global_step=2773.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  19%|█▊        | 224/1208 [06:30<28:36,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.99e-5, train/loss_step=0.0103, global_step=2773.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  19%|█▊        | 225/1208 [06:31<28:31,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.99e-5, train/loss_step=0.0103, global_step=2773.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  19%|█▊        | 225/1208 [06:31<28:31,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00954, train/loss_vlb_step=4.56e-5, train/loss_step=0.00954, global_step=2774.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  19%|█▊        | 226/1208 [06:32<28:26,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00954, train/loss_vlb_step=4.56e-5, train/loss_step=0.00954, global_step=2774.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  19%|█▊        | 226/1208 [06:32<28:26,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00141, train/loss_step=0.289, global_step=2774.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  19%|█▉        | 227/1208 [06:33<28:22,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00141, train/loss_step=0.289, global_step=2774.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  19%|█▉        | 227/1208 [06:33<28:22,  1.74s/it, loss=0.158, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00251, train/loss_step=0.373, global_step=2774.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  19%|█▉        | 228/1208 [06:37<28:26,  1.74s/it, loss=0.158, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00251, train/loss_step=0.373, global_step=2774.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  19%|█▉        | 228/1208 [06:37<28:26,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.61e-5, train/loss_step=0.00285, global_step=2774.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  19%|█▉        | 229/1208 [06:38<28:22,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.61e-5, train/loss_step=0.00285, global_step=2774.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  19%|█▉        | 229/1208 [06:38<28:22,  1.74s/it, loss=0.164, v_num=0, train/loss_simple_step=0.529, train/loss_vlb_step=0.0048, train/loss_step=0.529, global_step=2775.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]     Epoch 9:  19%|█▉        | 230/1208 [06:39<28:17,  1.74s/it, loss=0.164, v_num=0, train/loss_simple_step=0.529, train/loss_vlb_step=0.0048, train/loss_step=0.529, global_step=2775.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  19%|█▉        | 230/1208 [06:39<28:17,  1.74s/it, loss=0.176, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00207, train/loss_step=0.347, global_step=2775.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  19%|█▉        | 231/1208 [06:40<28:12,  1.73s/it, loss=0.176, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00207, train/loss_step=0.347, global_step=2775.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  19%|█▉        | 231/1208 [06:40<28:12,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=2775.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  19%|█▉        | 232/1208 [06:43<28:17,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=2775.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  19%|█▉        | 232/1208 [06:43<28:17,  1.74s/it, loss=0.184, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=2775.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  19%|█▉        | 233/1208 [06:44<28:12,  1.74s/it, loss=0.184, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=2775.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  19%|█▉        | 233/1208 [06:44<28:12,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000496, train/loss_step=0.149, global_step=2776.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  19%|█▉        | 234/1208 [06:45<28:08,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000496, train/loss_step=0.149, global_step=2776.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  19%|█▉        | 234/1208 [06:45<28:08,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00577, train/loss_vlb_step=2.94e-5, train/loss_step=0.00577, global_step=2776.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  19%|█▉        | 235/1208 [06:46<28:03,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00577, train/loss_vlb_step=2.94e-5, train/loss_step=0.00577, global_step=2776.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  19%|█▉        | 235/1208 [06:46<28:03,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.00058, train/loss_step=0.170, global_step=2776.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  20%|█▉        | 236/1208 [06:49<28:08,  1.74s/it, loss=0.186, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.00058, train/loss_step=0.170, global_step=2776.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  20%|█▉        | 236/1208 [06:49<28:08,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0099, train/loss_vlb_step=4.76e-5, train/loss_step=0.0099, global_step=2776.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  20%|█▉        | 237/1208 [06:50<28:03,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0099, train/loss_vlb_step=4.76e-5, train/loss_step=0.0099, global_step=2776.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  20%|█▉        | 237/1208 [06:50<28:03,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0617, train/loss_vlb_step=0.00021, train/loss_step=0.0617, global_step=2777.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  20%|█▉        | 238/1208 [06:51<27:59,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0617, train/loss_vlb_step=0.00021, train/loss_step=0.0617, global_step=2777.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  20%|█▉        | 238/1208 [06:51<27:59,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000527, train/loss_step=0.151, global_step=2777.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  20%|█▉        | 239/1208 [06:53<27:54,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000527, train/loss_step=0.151, global_step=2777.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  20%|█▉        | 239/1208 [06:53<27:54,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0802, train/loss_vlb_step=0.000267, train/loss_step=0.0802, global_step=2777.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  20%|█▉        | 240/1208 [06:56<27:59,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0802, train/loss_vlb_step=0.000267, train/loss_step=0.0802, global_step=2777.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  20%|█▉        | 240/1208 [06:56<27:59,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=1.37e-5, train/loss_step=0.00238, global_step=2777.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  20%|█▉        | 241/1208 [06:57<27:54,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=1.37e-5, train/loss_step=0.00238, global_step=2777.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  20%|█▉        | 241/1208 [06:57<27:54,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000643, train/loss_step=0.176, global_step=2778.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  20%|██        | 242/1208 [06:58<27:50,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000643, train/loss_step=0.176, global_step=2778.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  20%|██        | 242/1208 [06:58<27:50,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.57e-5, train/loss_step=0.00266, global_step=2778.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  20%|██        | 243/1208 [06:59<27:45,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.57e-5, train/loss_step=0.00266, global_step=2778.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  20%|██        | 243/1208 [06:59<27:45,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000572, train/loss_step=0.166, global_step=2778.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  20%|██        | 244/1208 [07:02<27:50,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000572, train/loss_step=0.166, global_step=2778.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  20%|██        | 244/1208 [07:02<27:50,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.31e-5, train/loss_step=0.0122, global_step=2778.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  20%|██        | 245/1208 [07:03<27:45,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.31e-5, train/loss_step=0.0122, global_step=2778.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  20%|██        | 245/1208 [07:03<27:45,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=7.52e-5, train/loss_step=0.0164, global_step=2779.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  20%|██        | 246/1208 [07:04<27:41,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=7.52e-5, train/loss_step=0.0164, global_step=2779.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  20%|██        | 246/1208 [07:04<27:41,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00764, train/loss_vlb_step=3.7e-5, train/loss_step=0.00764, global_step=2779.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  20%|██        | 247/1208 [07:05<27:36,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00764, train/loss_vlb_step=3.7e-5, train/loss_step=0.00764, global_step=2779.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  20%|██        | 247/1208 [07:05<27:36,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=2779.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  21%|██        | 248/1208 [07:09<27:41,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=2779.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  21%|██        | 248/1208 [07:09<27:41,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.650, train/loss_vlb_step=0.0307, train/loss_step=0.650, global_step=2779.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  21%|██        | 249/1208 [07:10<27:37,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.650, train/loss_vlb_step=0.0307, train/loss_step=0.650, global_step=2779.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  21%|██        | 249/1208 [07:10<27:37,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0832, train/loss_vlb_step=0.000274, train/loss_step=0.0832, global_step=2780.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  21%|██        | 250/1208 [07:11<27:32,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0832, train/loss_vlb_step=0.000274, train/loss_step=0.0832, global_step=2780.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  21%|██        | 250/1208 [07:11<27:32,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.84e-5, train/loss_step=0.0157, global_step=2780.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  21%|██        | 251/1208 [07:12<27:28,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.84e-5, train/loss_step=0.0157, global_step=2780.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  21%|██        | 251/1208 [07:12<27:28,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0759, train/loss_vlb_step=0.000254, train/loss_step=0.0759, global_step=2780.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  21%|██        | 252/1208 [07:15<27:32,  1.73s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0759, train/loss_vlb_step=0.000254, train/loss_step=0.0759, global_step=2780.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  21%|██        | 252/1208 [07:15<27:32,  1.73s/it, loss=0.104, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00042, train/loss_step=0.128, global_step=2780.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  21%|██        | 253/1208 [07:16<27:28,  1.73s/it, loss=0.104, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00042, train/loss_step=0.128, global_step=2780.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  21%|██        | 253/1208 [07:16<27:28,  1.73s/it, loss=0.102, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=2781.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  21%|██        | 254/1208 [07:17<27:23,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=2781.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  21%|██        | 254/1208 [07:17<27:23,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.38e-5, train/loss_step=0.00236, global_step=2781.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  21%|██        | 255/1208 [07:18<27:19,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.38e-5, train/loss_step=0.00236, global_step=2781.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  21%|██        | 255/1208 [07:18<27:19,  1.72s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.46e-5, train/loss_step=0.0234, global_step=2781.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  21%|██        | 256/1208 [07:21<27:23,  1.73s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.46e-5, train/loss_step=0.0234, global_step=2781.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  21%|██        | 256/1208 [07:21<27:23,  1.73s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.82e-5, train/loss_step=0.0133, global_step=2781.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  21%|██▏       | 257/1208 [07:23<27:19,  1.72s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.82e-5, train/loss_step=0.0133, global_step=2781.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  21%|██▏       | 257/1208 [07:23<27:19,  1.72s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.0795, train/loss_vlb_step=0.000265, train/loss_step=0.0795, global_step=2782.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  21%|██▏       | 258/1208 [07:24<27:15,  1.72s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.0795, train/loss_vlb_step=0.000265, train/loss_step=0.0795, global_step=2782.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  21%|██▏       | 258/1208 [07:24<27:15,  1.72s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000924, train/loss_step=0.233, global_step=2782.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  21%|██▏       | 259/1208 [07:25<27:10,  1.72s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000924, train/loss_step=0.233, global_step=2782.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  21%|██▏       | 259/1208 [07:25<27:10,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000669, train/loss_step=0.186, global_step=2782.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  22%|██▏       | 260/1208 [07:28<27:14,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000669, train/loss_step=0.186, global_step=2782.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  22%|██▏       | 260/1208 [07:28<27:14,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.8e-5, train/loss_step=0.0126, global_step=2782.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  22%|██▏       | 261/1208 [07:29<27:10,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.8e-5, train/loss_step=0.0126, global_step=2782.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  22%|██▏       | 261/1208 [07:29<27:10,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000451, train/loss_step=0.136, global_step=2783.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  22%|██▏       | 262/1208 [07:30<27:06,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000451, train/loss_step=0.136, global_step=2783.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  22%|██▏       | 262/1208 [07:30<27:06,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.00012, train/loss_step=0.0312, global_step=2783.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  22%|██▏       | 263/1208 [07:31<27:02,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.00012, train/loss_step=0.0312, global_step=2783.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  22%|██▏       | 263/1208 [07:31<27:02,  1.72s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=2.75e-5, train/loss_step=0.00518, global_step=2783.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  22%|██▏       | 264/1208 [07:34<27:06,  1.72s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=2.75e-5, train/loss_step=0.00518, global_step=2783.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  22%|██▏       | 264/1208 [07:34<27:06,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.557, train/loss_vlb_step=0.00911, train/loss_step=0.557, global_step=2783.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]     Epoch 9:  22%|██▏       | 265/1208 [07:35<27:02,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.557, train/loss_vlb_step=0.00911, train/loss_step=0.557, global_step=2783.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  22%|██▏       | 265/1208 [07:35<27:02,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.28e-5, train/loss_step=0.0119, global_step=2784.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  22%|██▏       | 266/1208 [07:36<26:57,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.28e-5, train/loss_step=0.0119, global_step=2784.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  22%|██▏       | 266/1208 [07:36<26:57,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000442, train/loss_step=0.132, global_step=2784.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  22%|██▏       | 267/1208 [07:37<26:53,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000442, train/loss_step=0.132, global_step=2784.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  22%|██▏       | 267/1208 [07:37<26:53,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00477, train/loss_vlb_step=2.49e-5, train/loss_step=0.00477, global_step=2784.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  22%|██▏       | 268/1208 [07:41<26:57,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00477, train/loss_vlb_step=2.49e-5, train/loss_step=0.00477, global_step=2784.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  22%|██▏       | 268/1208 [07:41<26:57,  1.72s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000357, train/loss_step=0.108, global_step=2784.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  22%|██▏       | 269/1208 [07:42<26:53,  1.72s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000357, train/loss_step=0.108, global_step=2784.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  22%|██▏       | 269/1208 [07:42<26:53,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00119, train/loss_step=0.282, global_step=2785.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  22%|██▏       | 270/1208 [07:43<26:49,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00119, train/loss_step=0.282, global_step=2785.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  22%|██▏       | 270/1208 [07:43<26:49,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000624, train/loss_step=0.179, global_step=2785.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  22%|██▏       | 271/1208 [07:44<26:45,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000624, train/loss_step=0.179, global_step=2785.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  22%|██▏       | 271/1208 [07:44<26:45,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00095, train/loss_step=0.252, global_step=2785.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  23%|██▎       | 272/1208 [07:47<26:48,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00095, train/loss_step=0.252, global_step=2785.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  23%|██▎       | 272/1208 [07:47<26:48,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00171, train/loss_step=0.355, global_step=2785.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  23%|██▎       | 273/1208 [07:48<26:44,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00171, train/loss_step=0.355, global_step=2785.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  23%|██▎       | 273/1208 [07:48<26:44,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.00015, train/loss_step=0.0406, global_step=2786.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  23%|██▎       | 274/1208 [07:49<26:40,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.00015, train/loss_step=0.0406, global_step=2786.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  23%|██▎       | 274/1208 [07:49<26:40,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0517, train/loss_vlb_step=0.000177, train/loss_step=0.0517, global_step=2786.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  23%|██▎       | 275/1208 [07:50<26:36,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0517, train/loss_vlb_step=0.000177, train/loss_step=0.0517, global_step=2786.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  23%|██▎       | 275/1208 [07:50<26:36,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.0015, train/loss_step=0.337, global_step=2786.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]     Epoch 9:  23%|██▎       | 276/1208 [07:53<26:40,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.0015, train/loss_step=0.337, global_step=2786.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  23%|██▎       | 276/1208 [07:53<26:40,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000889, train/loss_step=0.234, global_step=2786.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  23%|██▎       | 277/1208 [07:54<26:36,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000889, train/loss_step=0.234, global_step=2786.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  23%|██▎       | 277/1208 [07:54<26:36,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.93e-5, train/loss_step=0.0157, global_step=2787.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  23%|██▎       | 278/1208 [07:55<26:32,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.93e-5, train/loss_step=0.0157, global_step=2787.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  23%|██▎       | 278/1208 [07:55<26:32,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.667, train/loss_vlb_step=0.029, train/loss_step=0.667, global_step=2787.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]     Epoch 9:  23%|██▎       | 279/1208 [07:57<26:28,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.667, train/loss_vlb_step=0.029, train/loss_step=0.667, global_step=2787.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  23%|██▎       | 279/1208 [07:57<26:28,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.000147, train/loss_step=0.0393, global_step=2787.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  23%|██▎       | 280/1208 [08:00<26:31,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.000147, train/loss_step=0.0393, global_step=2787.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  23%|██▎       | 280/1208 [08:00<26:31,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0989, train/loss_vlb_step=0.000333, train/loss_step=0.0989, global_step=2787.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  23%|██▎       | 281/1208 [08:01<26:27,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0989, train/loss_vlb_step=0.000333, train/loss_step=0.0989, global_step=2787.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  23%|██▎       | 281/1208 [08:01<26:27,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000931, train/loss_step=0.239, global_step=2788.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  23%|██▎       | 282/1208 [08:02<26:23,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000931, train/loss_step=0.239, global_step=2788.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  23%|██▎       | 282/1208 [08:02<26:23,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000554, train/loss_step=0.164, global_step=2788.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  23%|██▎       | 283/1208 [08:03<26:20,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000554, train/loss_step=0.164, global_step=2788.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  23%|██▎       | 283/1208 [08:03<26:20,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.00021, train/loss_step=0.0615, global_step=2788.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  24%|██▎       | 284/1208 [08:06<26:23,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.00021, train/loss_step=0.0615, global_step=2788.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  24%|██▎       | 284/1208 [08:06<26:23,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0431, train/loss_vlb_step=0.00016, train/loss_step=0.0431, global_step=2788.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  24%|██▎       | 285/1208 [08:07<26:19,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0431, train/loss_vlb_step=0.00016, train/loss_step=0.0431, global_step=2788.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  24%|██▎       | 285/1208 [08:07<26:19,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000338, train/loss_step=0.102, global_step=2789.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  24%|██▎       | 286/1208 [08:08<26:15,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000338, train/loss_step=0.102, global_step=2789.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  24%|██▎       | 286/1208 [08:08<26:15,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000445, train/loss_step=0.134, global_step=2789.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  24%|██▍       | 287/1208 [08:09<26:11,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000445, train/loss_step=0.134, global_step=2789.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  24%|██▍       | 287/1208 [08:09<26:11,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.2e-5, train/loss_step=0.002, global_step=2789.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  24%|██▍       | 288/1208 [08:13<26:14,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.2e-5, train/loss_step=0.002, global_step=2789.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  24%|██▍       | 288/1208 [08:13<26:14,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00426, train/loss_step=0.397, global_step=2789.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  24%|██▍       | 289/1208 [08:14<26:11,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00426, train/loss_step=0.397, global_step=2789.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  24%|██▍       | 289/1208 [08:14<26:11,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0657, train/loss_vlb_step=0.000229, train/loss_step=0.0657, global_step=2790.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  24%|██▍       | 290/1208 [08:15<26:07,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0657, train/loss_vlb_step=0.000229, train/loss_step=0.0657, global_step=2790.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  24%|██▍       | 290/1208 [08:15<26:07,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.3e-5, train/loss_step=0.00423, global_step=2790.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  24%|██▍       | 291/1208 [08:16<26:03,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.3e-5, train/loss_step=0.00423, global_step=2790.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  24%|██▍       | 291/1208 [08:16<26:03,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=9e-5, train/loss_step=0.0225, global_step=2790.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  24%|██▍       | 292/1208 [08:19<26:06,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=9e-5, train/loss_step=0.0225, global_step=2790.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  24%|██▍       | 292/1208 [08:19<26:06,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00586, train/loss_vlb_step=2.9e-5, train/loss_step=0.00586, global_step=2790.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  24%|██▍       | 293/1208 [08:20<26:02,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00586, train/loss_vlb_step=2.9e-5, train/loss_step=0.00586, global_step=2790.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  24%|██▍       | 293/1208 [08:20<26:02,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7e-5, train/loss_step=0.0165, global_step=2791.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  24%|██▍       | 294/1208 [08:21<25:59,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7e-5, train/loss_step=0.0165, global_step=2791.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  24%|██▍       | 294/1208 [08:21<25:59,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000769, train/loss_step=0.204, global_step=2791.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  24%|██▍       | 295/1208 [08:22<25:55,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000769, train/loss_step=0.204, global_step=2791.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  24%|██▍       | 295/1208 [08:22<25:55,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.77e-5, train/loss_step=0.0158, global_step=2791.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  25%|██▍       | 296/1208 [08:25<25:58,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.77e-5, train/loss_step=0.0158, global_step=2791.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  25%|██▍       | 296/1208 [08:25<25:58,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000579, train/loss_step=0.170, global_step=2791.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  25%|██▍       | 297/1208 [08:26<25:54,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000579, train/loss_step=0.170, global_step=2791.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  25%|██▍       | 297/1208 [08:26<25:54,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.47e-5, train/loss_step=0.0119, global_step=2792.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  25%|██▍       | 298/1208 [08:27<25:50,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.47e-5, train/loss_step=0.0119, global_step=2792.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  25%|██▍       | 298/1208 [08:27<25:50,  1.70s/it, loss=0.1, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000757, train/loss_step=0.207, global_step=2792.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  25%|██▍       | 299/1208 [08:28<25:47,  1.70s/it, loss=0.1, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000757, train/loss_step=0.207, global_step=2792.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  25%|██▍       | 299/1208 [08:28<25:47,  1.70s/it, loss=0.099, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.75e-5, train/loss_step=0.0134, global_step=2792.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  25%|██▍       | 300/1208 [08:32<25:50,  1.71s/it, loss=0.099, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.75e-5, train/loss_step=0.0134, global_step=2792.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  25%|██▍       | 300/1208 [08:32<25:50,  1.71s/it, loss=0.112, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00271, train/loss_step=0.367, global_step=2792.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.71it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.72it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.75it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.73it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.75it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.76it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.76it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:14,  1.78it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.83it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.81it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.78it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 9:  25%|██▍       | 301/1208 [09:03<27:16,  1.80s/it, loss=0.112, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00271, train/loss_step=0.367, global_step=2792.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  25%|██▍       | 301/1208 [09:03<27:16,  1.80s/it, loss=0.114, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.0012, train/loss_step=0.281, global_step=2793.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  25%|██▌       | 302/1208 [09:04<27:12,  1.80s/it, loss=0.114, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.0012, train/loss_step=0.281, global_step=2793.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  25%|██▌       | 302/1208 [09:04<27:12,  1.80s/it, loss=0.121, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00142, train/loss_step=0.298, global_step=2793.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  25%|██▌       | 303/1208 [09:05<27:08,  1.80s/it, loss=0.121, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00142, train/loss_step=0.298, global_step=2793.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  25%|██▌       | 303/1208 [09:05<27:08,  1.80s/it, loss=0.155, v_num=0, train/loss_simple_step=0.740, train/loss_vlb_step=0.0542, train/loss_step=0.740, global_step=2793.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  25%|██▌       | 304/1208 [09:08<27:10,  1.80s/it, loss=0.155, v_num=0, train/loss_simple_step=0.740, train/loss_vlb_step=0.0542, train/loss_step=0.740, global_step=2793.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  25%|██▌       | 304/1208 [09:08<27:10,  1.80s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0943, train/loss_vlb_step=0.00031, train/loss_step=0.0943, global_step=2793.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  25%|██▌       | 305/1208 [09:09<27:06,  1.80s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0943, train/loss_vlb_step=0.00031, train/loss_step=0.0943, global_step=2793.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  25%|██▌       | 305/1208 [09:09<27:06,  1.80s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0837, train/loss_vlb_step=0.000279, train/loss_step=0.0837, global_step=2794.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  25%|██▌       | 306/1208 [09:10<27:02,  1.80s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0837, train/loss_vlb_step=0.000279, train/loss_step=0.0837, global_step=2794.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  25%|██▌       | 306/1208 [09:10<27:02,  1.80s/it, loss=0.175, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.0049, train/loss_step=0.499, global_step=2794.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  25%|██▌       | 307/1208 [09:11<26:58,  1.80s/it, loss=0.175, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.0049, train/loss_step=0.499, global_step=2794.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  25%|██▌       | 307/1208 [09:11<26:58,  1.80s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0646, train/loss_vlb_step=0.000216, train/loss_step=0.0646, global_step=2794.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  25%|██▌       | 308/1208 [09:14<27:00,  1.80s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0646, train/loss_vlb_step=0.000216, train/loss_step=0.0646, global_step=2794.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  25%|██▌       | 308/1208 [09:14<27:00,  1.80s/it, loss=0.16, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.00012, train/loss_step=0.031, global_step=2794.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  26%|██▌       | 309/1208 [09:15<26:57,  1.80s/it, loss=0.16, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.00012, train/loss_step=0.031, global_step=2794.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  26%|██▌       | 309/1208 [09:15<26:57,  1.80s/it, loss=0.2, v_num=0, train/loss_simple_step=0.877, train/loss_vlb_step=0.441, train/loss_step=0.877, global_step=2795.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  26%|██▌       | 310/1208 [09:16<26:53,  1.80s/it, loss=0.2, v_num=0, train/loss_simple_step=0.877, train/loss_vlb_step=0.441, train/loss_step=0.877, global_step=2795.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  26%|██▌       | 310/1208 [09:16<26:53,  1.80s/it, loss=0.201, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=9.95e-5, train/loss_step=0.025, global_step=2795.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  26%|██▌       | 311/1208 [09:17<26:49,  1.79s/it, loss=0.201, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=9.95e-5, train/loss_step=0.025, global_step=2795.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  26%|██▌       | 311/1208 [09:17<26:49,  1.79s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0569, train/loss_vlb_step=0.000199, train/loss_step=0.0569, global_step=2795.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  26%|██▌       | 312/1208 [09:21<26:51,  1.80s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0569, train/loss_vlb_step=0.000199, train/loss_step=0.0569, global_step=2795.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  26%|██▌       | 312/1208 [09:21<26:51,  1.80s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=5.06e-5, train/loss_step=0.0101, global_step=2795.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  26%|██▌       | 313/1208 [09:22<26:47,  1.80s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=5.06e-5, train/loss_step=0.0101, global_step=2795.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  26%|██▌       | 313/1208 [09:22<26:47,  1.80s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0636, train/loss_vlb_step=0.000221, train/loss_step=0.0636, global_step=2796.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  26%|██▌       | 314/1208 [09:23<26:43,  1.79s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0636, train/loss_vlb_step=0.000221, train/loss_step=0.0636, global_step=2796.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  26%|██▌       | 314/1208 [09:23<26:43,  1.79s/it, loss=0.204, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000551, train/loss_step=0.166, global_step=2796.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  26%|██▌       | 315/1208 [09:24<26:39,  1.79s/it, loss=0.204, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000551, train/loss_step=0.166, global_step=2796.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  26%|██▌       | 315/1208 [09:24<26:39,  1.79s/it, loss=0.214, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000826, train/loss_step=0.220, global_step=2796.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  26%|██▌       | 316/1208 [09:27<26:42,  1.80s/it, loss=0.214, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000826, train/loss_step=0.220, global_step=2796.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  26%|██▌       | 316/1208 [09:27<26:42,  1.80s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000137, train/loss_step=0.0369, global_step=2796.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  26%|██▌       | 317/1208 [09:28<26:38,  1.79s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000137, train/loss_step=0.0369, global_step=2796.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  26%|██▌       | 317/1208 [09:28<26:38,  1.79s/it, loss=0.214, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000452, train/loss_step=0.137, global_step=2797.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  26%|██▋       | 318/1208 [09:29<26:34,  1.79s/it, loss=0.214, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000452, train/loss_step=0.137, global_step=2797.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  26%|██▋       | 318/1208 [09:29<26:34,  1.79s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0603, train/loss_vlb_step=0.00021, train/loss_step=0.0603, global_step=2797.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  26%|██▋       | 319/1208 [09:30<26:30,  1.79s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0603, train/loss_vlb_step=0.00021, train/loss_step=0.0603, global_step=2797.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  26%|██▋       | 319/1208 [09:30<26:30,  1.79s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0993, train/loss_vlb_step=0.000331, train/loss_step=0.0993, global_step=2797.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  26%|██▋       | 320/1208 [09:34<26:32,  1.79s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0993, train/loss_vlb_step=0.000331, train/loss_step=0.0993, global_step=2797.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  26%|██▋       | 320/1208 [09:34<26:32,  1.79s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00869, train/loss_vlb_step=4.18e-5, train/loss_step=0.00869, global_step=2797.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  27%|██▋       | 321/1208 [09:35<26:29,  1.79s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00869, train/loss_vlb_step=4.18e-5, train/loss_step=0.00869, global_step=2797.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  27%|██▋       | 321/1208 [09:35<26:29,  1.79s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000113, train/loss_step=0.0277, global_step=2798.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  27%|██▋       | 322/1208 [09:36<26:25,  1.79s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000113, train/loss_step=0.0277, global_step=2798.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  27%|██▋       | 322/1208 [09:36<26:25,  1.79s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=1.91e-5, train/loss_step=0.0034, global_step=2798.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  27%|██▋       | 323/1208 [09:37<26:21,  1.79s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=1.91e-5, train/loss_step=0.0034, global_step=2798.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  27%|██▋       | 323/1208 [09:37<26:21,  1.79s/it, loss=0.143, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00145, train/loss_step=0.288, global_step=2798.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  27%|██▋       | 324/1208 [09:40<26:23,  1.79s/it, loss=0.143, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00145, train/loss_step=0.288, global_step=2798.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  27%|██▋       | 324/1208 [09:40<26:23,  1.79s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.41e-5, train/loss_step=0.00244, global_step=2798.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  27%|██▋       | 325/1208 [09:41<26:19,  1.79s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.41e-5, train/loss_step=0.00244, global_step=2798.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  27%|██▋       | 325/1208 [09:41<26:19,  1.79s/it, loss=0.139, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000333, train/loss_step=0.100, global_step=2799.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  27%|██▋       | 326/1208 [09:42<26:16,  1.79s/it, loss=0.139, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000333, train/loss_step=0.100, global_step=2799.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  27%|██▋       | 326/1208 [09:42<26:16,  1.79s/it, loss=0.129, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00142, train/loss_step=0.300, global_step=2799.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  27%|██▋       | 327/1208 [09:43<26:12,  1.78s/it, loss=0.129, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00142, train/loss_step=0.300, global_step=2799.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  27%|██▋       | 327/1208 [09:43<26:12,  1.78s/it, loss=0.136, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.00075, train/loss_step=0.207, global_step=2799.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  27%|██▋       | 328/1208 [09:46<26:14,  1.79s/it, loss=0.136, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.00075, train/loss_step=0.207, global_step=2799.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  27%|██▋       | 328/1208 [09:46<26:14,  1.79s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0599, train/loss_vlb_step=0.000206, train/loss_step=0.0599, global_step=2799.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  27%|██▋       | 329/1208 [09:47<26:10,  1.79s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0599, train/loss_vlb_step=0.000206, train/loss_step=0.0599, global_step=2799.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  27%|██▋       | 329/1208 [09:47<26:10,  1.79s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=8.14e-5, train/loss_step=0.0189, global_step=2800.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  27%|██▋       | 330/1208 [09:48<26:07,  1.78s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=8.14e-5, train/loss_step=0.0189, global_step=2800.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  27%|██▋       | 330/1208 [09:48<26:07,  1.78s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.37e-5, train/loss_step=0.0232, global_step=2800.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  27%|██▋       | 331/1208 [09:50<26:03,  1.78s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.37e-5, train/loss_step=0.0232, global_step=2800.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  27%|██▋       | 331/1208 [09:50<26:03,  1.78s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.058, train/loss_vlb_step=0.000205, train/loss_step=0.058, global_step=2800.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  27%|██▋       | 332/1208 [09:53<26:05,  1.79s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.058, train/loss_vlb_step=0.000205, train/loss_step=0.058, global_step=2800.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  27%|██▋       | 332/1208 [09:53<26:05,  1.79s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.00657, train/loss_vlb_step=3.24e-5, train/loss_step=0.00657, global_step=2800.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  28%|██▊       | 333/1208 [09:54<26:01,  1.78s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.00657, train/loss_vlb_step=3.24e-5, train/loss_step=0.00657, global_step=2800.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  28%|██▊       | 333/1208 [09:54<26:01,  1.78s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.0465, train/loss_vlb_step=0.000166, train/loss_step=0.0465, global_step=2801.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  28%|██▊       | 334/1208 [09:55<25:58,  1.78s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.0465, train/loss_vlb_step=0.000166, train/loss_step=0.0465, global_step=2801.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  28%|██▊       | 334/1208 [09:55<25:58,  1.78s/it, loss=0.11, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.00497, train/loss_step=0.485, global_step=2801.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]     Epoch 9:  28%|██▊       | 335/1208 [09:56<25:54,  1.78s/it, loss=0.11, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.00497, train/loss_step=0.485, global_step=2801.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  28%|██▊       | 335/1208 [09:56<25:54,  1.78s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000115, train/loss_step=0.0308, global_step=2801.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  28%|██▊       | 336/1208 [09:59<25:56,  1.78s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000115, train/loss_step=0.0308, global_step=2801.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  28%|██▊       | 336/1208 [09:59<25:56,  1.78s/it, loss=0.127, v_num=0, train/loss_simple_step=0.572, train/loss_vlb_step=0.0115, train/loss_step=0.572, global_step=2801.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  28%|██▊       | 337/1208 [10:00<25:52,  1.78s/it, loss=0.127, v_num=0, train/loss_simple_step=0.572, train/loss_vlb_step=0.0115, train/loss_step=0.572, global_step=2801.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  28%|██▊       | 337/1208 [10:00<25:52,  1.78s/it, loss=0.157, v_num=0, train/loss_simple_step=0.736, train/loss_vlb_step=0.0627, train/loss_step=0.736, global_step=2802.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  28%|██▊       | 338/1208 [10:01<25:49,  1.78s/it, loss=0.157, v_num=0, train/loss_simple_step=0.736, train/loss_vlb_step=0.0627, train/loss_step=0.736, global_step=2802.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  28%|██▊       | 338/1208 [10:01<25:49,  1.78s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00689, train/loss_vlb_step=3.44e-5, train/loss_step=0.00689, global_step=2802.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  28%|██▊       | 339/1208 [10:02<25:45,  1.78s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00689, train/loss_vlb_step=3.44e-5, train/loss_step=0.00689, global_step=2802.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  28%|██▊       | 339/1208 [10:02<25:45,  1.78s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.44e-5, train/loss_step=0.0118, global_step=2802.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  28%|██▊       | 340/1208 [10:06<25:47,  1.78s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.44e-5, train/loss_step=0.0118, global_step=2802.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  28%|██▊       | 340/1208 [10:06<25:47,  1.78s/it, loss=0.158, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000576, train/loss_step=0.169, global_step=2802.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  28%|██▊       | 341/1208 [10:07<25:43,  1.78s/it, loss=0.158, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000576, train/loss_step=0.169, global_step=2802.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  28%|██▊       | 341/1208 [10:07<25:43,  1.78s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000168, train/loss_step=0.0457, global_step=2803.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  28%|██▊       | 342/1208 [10:08<25:40,  1.78s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000168, train/loss_step=0.0457, global_step=2803.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  28%|██▊       | 342/1208 [10:08<25:40,  1.78s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00539, train/loss_vlb_step=2.82e-5, train/loss_step=0.00539, global_step=2803.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  28%|██▊       | 343/1208 [10:09<25:36,  1.78s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00539, train/loss_vlb_step=2.82e-5, train/loss_step=0.00539, global_step=2803.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  28%|██▊       | 343/1208 [10:09<25:36,  1.78s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.2e-5, train/loss_step=0.00205, global_step=2803.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  28%|██▊       | 344/1208 [10:12<25:38,  1.78s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.2e-5, train/loss_step=0.00205, global_step=2803.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  28%|██▊       | 344/1208 [10:12<25:38,  1.78s/it, loss=0.153, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000586, train/loss_step=0.169, global_step=2803.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  29%|██▊       | 345/1208 [10:13<25:34,  1.78s/it, loss=0.153, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000586, train/loss_step=0.169, global_step=2803.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  29%|██▊       | 345/1208 [10:13<25:34,  1.78s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=1.77e-5, train/loss_step=0.00302, global_step=2804.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  29%|██▊       | 346/1208 [10:14<25:31,  1.78s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=1.77e-5, train/loss_step=0.00302, global_step=2804.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  29%|██▊       | 346/1208 [10:14<25:31,  1.78s/it, loss=0.146, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00116, train/loss_step=0.272, global_step=2804.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  29%|██▊       | 347/1208 [10:15<25:27,  1.77s/it, loss=0.146, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00116, train/loss_step=0.272, global_step=2804.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  29%|██▊       | 347/1208 [10:15<25:27,  1.77s/it, loss=0.148, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.000927, train/loss_step=0.243, global_step=2804.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  29%|██▉       | 348/1208 [10:18<25:29,  1.78s/it, loss=0.148, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.000927, train/loss_step=0.243, global_step=2804.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  29%|██▉       | 348/1208 [10:18<25:29,  1.78s/it, loss=0.154, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000565, train/loss_step=0.166, global_step=2804.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  29%|██▉       | 349/1208 [10:20<25:26,  1.78s/it, loss=0.154, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000565, train/loss_step=0.166, global_step=2804.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  29%|██▉       | 349/1208 [10:20<25:26,  1.78s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.93e-5, train/loss_step=0.0214, global_step=2805.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  29%|██▉       | 350/1208 [10:21<25:22,  1.77s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.93e-5, train/loss_step=0.0214, global_step=2805.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  29%|██▉       | 350/1208 [10:21<25:22,  1.77s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.000233, train/loss_step=0.0672, global_step=2805.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  29%|██▉       | 351/1208 [10:22<25:19,  1.77s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.000233, train/loss_step=0.0672, global_step=2805.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  29%|██▉       | 351/1208 [10:22<25:19,  1.77s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.26e-5, train/loss_step=0.00212, global_step=2805.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  29%|██▉       | 352/1208 [10:25<25:20,  1.78s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.26e-5, train/loss_step=0.00212, global_step=2805.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  29%|██▉       | 352/1208 [10:25<25:20,  1.78s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.17e-5, train/loss_step=0.00194, global_step=2805.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  29%|██▉       | 353/1208 [10:26<25:17,  1.77s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.17e-5, train/loss_step=0.00194, global_step=2805.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  29%|██▉       | 353/1208 [10:26<25:17,  1.77s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.18e-5, train/loss_step=0.0143, global_step=2806.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  29%|██▉       | 354/1208 [10:27<25:13,  1.77s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.18e-5, train/loss_step=0.0143, global_step=2806.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  29%|██▉       | 354/1208 [10:27<25:13,  1.77s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00401, train/loss_vlb_step=2.23e-5, train/loss_step=0.00401, global_step=2806.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  29%|██▉       | 355/1208 [10:28<25:10,  1.77s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00401, train/loss_vlb_step=2.23e-5, train/loss_step=0.00401, global_step=2806.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  29%|██▉       | 355/1208 [10:28<25:10,  1.77s/it, loss=0.148, v_num=0, train/loss_simple_step=0.453, train/loss_vlb_step=0.00384, train/loss_step=0.453, global_step=2806.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  29%|██▉       | 356/1208 [10:31<25:12,  1.77s/it, loss=0.148, v_num=0, train/loss_simple_step=0.453, train/loss_vlb_step=0.00384, train/loss_step=0.453, global_step=2806.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  29%|██▉       | 356/1208 [10:31<25:12,  1.77s/it, loss=0.131, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.00083, train/loss_step=0.218, global_step=2806.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  30%|██▉       | 357/1208 [10:32<25:08,  1.77s/it, loss=0.131, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.00083, train/loss_step=0.218, global_step=2806.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  30%|██▉       | 357/1208 [10:32<25:08,  1.77s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.7e-5, train/loss_step=0.0176, global_step=2807.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  30%|██▉       | 358/1208 [10:33<25:05,  1.77s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.7e-5, train/loss_step=0.0176, global_step=2807.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  30%|██▉       | 358/1208 [10:33<25:05,  1.77s/it, loss=0.105, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000811, train/loss_step=0.217, global_step=2807.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  30%|██▉       | 359/1208 [10:34<25:01,  1.77s/it, loss=0.105, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000811, train/loss_step=0.217, global_step=2807.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  30%|██▉       | 359/1208 [10:34<25:01,  1.77s/it, loss=0.112, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000515, train/loss_step=0.156, global_step=2807.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  30%|██▉       | 360/1208 [10:38<25:03,  1.77s/it, loss=0.112, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000515, train/loss_step=0.156, global_step=2807.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  30%|██▉       | 360/1208 [10:38<25:03,  1.77s/it, loss=0.116, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000852, train/loss_step=0.238, global_step=2807.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  30%|██▉       | 361/1208 [10:39<25:00,  1.77s/it, loss=0.116, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000852, train/loss_step=0.238, global_step=2807.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  30%|██▉       | 361/1208 [10:39<25:00,  1.77s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0614, train/loss_vlb_step=0.000212, train/loss_step=0.0614, global_step=2808.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  30%|██▉       | 362/1208 [10:40<24:56,  1.77s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0614, train/loss_vlb_step=0.000212, train/loss_step=0.0614, global_step=2808.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  30%|██▉       | 362/1208 [10:40<24:56,  1.77s/it, loss=0.144, v_num=0, train/loss_simple_step=0.547, train/loss_vlb_step=0.00578, train/loss_step=0.547, global_step=2808.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  30%|███       | 363/1208 [10:41<24:53,  1.77s/it, loss=0.144, v_num=0, train/loss_simple_step=0.547, train/loss_vlb_step=0.00578, train/loss_step=0.547, global_step=2808.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  30%|███       | 363/1208 [10:41<24:53,  1.77s/it, loss=0.145, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000116, train/loss_step=0.031, global_step=2808.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  30%|███       | 364/1208 [10:44<24:54,  1.77s/it, loss=0.145, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000116, train/loss_step=0.031, global_step=2808.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  30%|███       | 364/1208 [10:44<24:54,  1.77s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.95e-5, train/loss_step=0.00344, global_step=2808.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  30%|███       | 365/1208 [10:45<24:51,  1.77s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.95e-5, train/loss_step=0.00344, global_step=2808.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  30%|███       | 365/1208 [10:45<24:51,  1.77s/it, loss=0.153, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00165, train/loss_step=0.330, global_step=2809.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  30%|███       | 366/1208 [10:46<24:47,  1.77s/it, loss=0.153, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00165, train/loss_step=0.330, global_step=2809.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  30%|███       | 366/1208 [10:46<24:47,  1.77s/it, loss=0.141, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000115, train/loss_step=0.029, global_step=2809.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  30%|███       | 367/1208 [10:47<24:44,  1.77s/it, loss=0.141, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000115, train/loss_step=0.029, global_step=2809.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  30%|███       | 367/1208 [10:47<24:44,  1.77s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=0.000105, train/loss_step=0.0251, global_step=2809.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  30%|███       | 368/1208 [10:51<24:46,  1.77s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=0.000105, train/loss_step=0.0251, global_step=2809.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  30%|███       | 368/1208 [10:51<24:46,  1.77s/it, loss=0.137, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00134, train/loss_step=0.309, global_step=2809.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  31%|███       | 369/1208 [10:52<24:42,  1.77s/it, loss=0.137, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00134, train/loss_step=0.309, global_step=2809.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  31%|███       | 369/1208 [10:52<24:42,  1.77s/it, loss=0.143, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000468, train/loss_step=0.141, global_step=2810.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  31%|███       | 370/1208 [10:53<24:39,  1.77s/it, loss=0.143, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000468, train/loss_step=0.141, global_step=2810.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  31%|███       | 370/1208 [10:53<24:39,  1.77s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.36e-5, train/loss_step=0.0173, global_step=2810.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  31%|███       | 371/1208 [10:54<24:36,  1.76s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.36e-5, train/loss_step=0.0173, global_step=2810.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  31%|███       | 371/1208 [10:54<24:36,  1.76s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00546, train/loss_vlb_step=2.73e-5, train/loss_step=0.00546, global_step=2810.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  31%|███       | 372/1208 [10:57<24:37,  1.77s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00546, train/loss_vlb_step=2.73e-5, train/loss_step=0.00546, global_step=2810.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  31%|███       | 372/1208 [10:57<24:37,  1.77s/it, loss=0.148, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000446, train/loss_step=0.134, global_step=2810.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  31%|███       | 373/1208 [10:58<24:34,  1.77s/it, loss=0.148, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000446, train/loss_step=0.134, global_step=2810.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  31%|███       | 373/1208 [10:58<24:34,  1.77s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00743, train/loss_vlb_step=3.61e-5, train/loss_step=0.00743, global_step=2811.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  31%|███       | 374/1208 [10:59<24:31,  1.76s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00743, train/loss_vlb_step=3.61e-5, train/loss_step=0.00743, global_step=2811.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  31%|███       | 374/1208 [10:59<24:31,  1.76s/it, loss=0.158, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000824, train/loss_step=0.212, global_step=2811.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  31%|███       | 375/1208 [11:00<24:27,  1.76s/it, loss=0.158, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000824, train/loss_step=0.212, global_step=2811.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  31%|███       | 375/1208 [11:00<24:27,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00436, train/loss_vlb_step=2.36e-5, train/loss_step=0.00436, global_step=2811.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  31%|███       | 376/1208 [11:04<24:29,  1.77s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00436, train/loss_vlb_step=2.36e-5, train/loss_step=0.00436, global_step=2811.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  31%|███       | 376/1208 [11:04<24:29,  1.77s/it, loss=0.144, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00352, train/loss_step=0.392, global_step=2811.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  31%|███       | 377/1208 [11:05<24:26,  1.76s/it, loss=0.144, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00352, train/loss_step=0.392, global_step=2811.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  31%|███       | 377/1208 [11:05<24:26,  1.76s/it, loss=0.156, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.000955, train/loss_step=0.249, global_step=2812.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  31%|███▏      | 378/1208 [11:06<24:22,  1.76s/it, loss=0.156, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.000955, train/loss_step=0.249, global_step=2812.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  31%|███▏      | 378/1208 [11:06<24:22,  1.76s/it, loss=0.161, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00169, train/loss_step=0.327, global_step=2812.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  31%|███▏      | 379/1208 [11:07<24:19,  1.76s/it, loss=0.161, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00169, train/loss_step=0.327, global_step=2812.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  31%|███▏      | 379/1208 [11:07<24:19,  1.76s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=1.03e-5, train/loss_step=0.0017, global_step=2812.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  31%|███▏      | 380/1208 [11:10<24:20,  1.76s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=1.03e-5, train/loss_step=0.0017, global_step=2812.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  31%|███▏      | 380/1208 [11:10<24:20,  1.76s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=2.77e-5, train/loss_step=0.00545, global_step=2812.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  32%|███▏      | 381/1208 [11:11<24:17,  1.76s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=2.77e-5, train/loss_step=0.00545, global_step=2812.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  32%|███▏      | 381/1208 [11:11<24:17,  1.76s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0582, train/loss_vlb_step=0.000206, train/loss_step=0.0582, global_step=2813.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  32%|███▏      | 382/1208 [11:12<24:14,  1.76s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0582, train/loss_vlb_step=0.000206, train/loss_step=0.0582, global_step=2813.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  32%|███▏      | 382/1208 [11:12<24:14,  1.76s/it, loss=0.13, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.0014, train/loss_step=0.321, global_step=2813.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]     Epoch 9:  32%|███▏      | 383/1208 [11:13<24:10,  1.76s/it, loss=0.13, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.0014, train/loss_step=0.321, global_step=2813.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  32%|███▏      | 383/1208 [11:13<24:10,  1.76s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.55e-5, train/loss_step=0.00267, global_step=2813.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  32%|███▏      | 384/1208 [11:16<24:12,  1.76s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.55e-5, train/loss_step=0.00267, global_step=2813.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  32%|███▏      | 384/1208 [11:16<24:12,  1.76s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.76e-5, train/loss_step=0.0033, global_step=2813.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  32%|███▏      | 385/1208 [11:17<24:09,  1.76s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.76e-5, train/loss_step=0.0033, global_step=2813.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  32%|███▏      | 385/1208 [11:17<24:09,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0092, train/loss_vlb_step=4.29e-5, train/loss_step=0.0092, global_step=2814.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  32%|███▏      | 386/1208 [11:19<24:05,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0092, train/loss_vlb_step=4.29e-5, train/loss_step=0.0092, global_step=2814.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  32%|███▏      | 386/1208 [11:19<24:05,  1.76s/it, loss=0.117, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=2814.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  32%|███▏      | 387/1208 [11:20<24:02,  1.76s/it, loss=0.117, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=2814.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  32%|███▏      | 387/1208 [11:20<24:02,  1.76s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=1.31e-5, train/loss_step=0.00223, global_step=2814.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  32%|███▏      | 388/1208 [11:23<24:04,  1.76s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=1.31e-5, train/loss_step=0.00223, global_step=2814.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  32%|███▏      | 388/1208 [11:23<24:04,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.000933, train/loss_step=0.247, global_step=2814.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  32%|███▏      | 389/1208 [11:24<24:00,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.000933, train/loss_step=0.247, global_step=2814.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  32%|███▏      | 389/1208 [11:24<24:00,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000427, train/loss_step=0.129, global_step=2815.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  32%|███▏      | 390/1208 [11:25<23:57,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000427, train/loss_step=0.129, global_step=2815.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  32%|███▏      | 390/1208 [11:25<23:57,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.000999, train/loss_step=0.251, global_step=2815.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  32%|███▏      | 391/1208 [11:26<23:54,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.000999, train/loss_step=0.251, global_step=2815.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  32%|███▏      | 391/1208 [11:26<23:54,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000504, train/loss_step=0.152, global_step=2815.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  32%|███▏      | 392/1208 [11:29<23:55,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000504, train/loss_step=0.152, global_step=2815.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  32%|███▏      | 392/1208 [11:29<23:55,  1.76s/it, loss=0.153, v_num=0, train/loss_simple_step=0.564, train/loss_vlb_step=0.00835, train/loss_step=0.564, global_step=2815.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  33%|███▎      | 393/1208 [11:30<23:52,  1.76s/it, loss=0.153, v_num=0, train/loss_simple_step=0.564, train/loss_vlb_step=0.00835, train/loss_step=0.564, global_step=2815.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  33%|███▎      | 393/1208 [11:30<23:52,  1.76s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0656, train/loss_vlb_step=0.000225, train/loss_step=0.0656, global_step=2816.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  33%|███▎      | 394/1208 [11:31<23:49,  1.76s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0656, train/loss_vlb_step=0.000225, train/loss_step=0.0656, global_step=2816.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  33%|███▎      | 394/1208 [11:31<23:49,  1.76s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0922, train/loss_vlb_step=0.000314, train/loss_step=0.0922, global_step=2816.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  33%|███▎      | 395/1208 [11:32<23:46,  1.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0922, train/loss_vlb_step=0.000314, train/loss_step=0.0922, global_step=2816.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  33%|███▎      | 395/1208 [11:32<23:46,  1.75s/it, loss=0.167, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00241, train/loss_step=0.341, global_step=2816.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  33%|███▎      | 396/1208 [11:36<23:47,  1.76s/it, loss=0.167, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00241, train/loss_step=0.341, global_step=2816.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  33%|███▎      | 396/1208 [11:36<23:47,  1.76s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=9.32e-5, train/loss_step=0.0223, global_step=2816.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  33%|███▎      | 397/1208 [11:37<23:44,  1.76s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=9.32e-5, train/loss_step=0.0223, global_step=2816.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  33%|███▎      | 397/1208 [11:37<23:44,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=1.35e-5, train/loss_step=0.00229, global_step=2817.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  33%|███▎      | 398/1208 [11:38<23:40,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=1.35e-5, train/loss_step=0.00229, global_step=2817.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  33%|███▎      | 398/1208 [11:38<23:41,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.00054, train/loss_step=0.158, global_step=2817.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  33%|███▎      | 399/1208 [11:39<23:37,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.00054, train/loss_step=0.158, global_step=2817.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  33%|███▎      | 399/1208 [11:39<23:37,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000109, train/loss_step=0.0272, global_step=2817.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  33%|███▎      | 400/1208 [11:42<23:39,  1.76s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000109, train/loss_step=0.0272, global_step=2817.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  33%|███▎      | 400/1208 [11:42<23:39,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.00052, train/loss_step=0.148, global_step=2817.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  33%|███▎      | 401/1208 [11:43<23:36,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.00052, train/loss_step=0.148, global_step=2817.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  33%|███▎      | 401/1208 [11:43<23:36,  1.75s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000122, train/loss_step=0.0311, global_step=2818.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  33%|███▎      | 402/1208 [11:44<23:32,  1.75s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000122, train/loss_step=0.0311, global_step=2818.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  33%|███▎      | 402/1208 [11:44<23:32,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0777, train/loss_vlb_step=0.000257, train/loss_step=0.0777, global_step=2818.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  33%|███▎      | 403/1208 [11:45<23:29,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0777, train/loss_vlb_step=0.000257, train/loss_step=0.0777, global_step=2818.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  33%|███▎      | 403/1208 [11:45<23:29,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.48e-5, train/loss_step=0.0205, global_step=2818.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  33%|███▎      | 404/1208 [11:49<23:31,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.48e-5, train/loss_step=0.0205, global_step=2818.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  33%|███▎      | 404/1208 [11:49<23:31,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.56e-5, train/loss_step=0.00274, global_step=2818.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  34%|███▎      | 405/1208 [11:50<23:27,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.56e-5, train/loss_step=0.00274, global_step=2818.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  34%|███▎      | 405/1208 [11:50<23:27,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.00045, train/loss_step=0.137, global_step=2819.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  34%|███▎      | 406/1208 [11:51<23:24,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.00045, train/loss_step=0.137, global_step=2819.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  34%|███▎      | 406/1208 [11:51<23:24,  1.75s/it, loss=0.153, v_num=0, train/loss_simple_step=0.592, train/loss_vlb_step=0.0115, train/loss_step=0.592, global_step=2819.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  34%|███▎      | 407/1208 [11:52<23:21,  1.75s/it, loss=0.153, v_num=0, train/loss_simple_step=0.592, train/loss_vlb_step=0.0115, train/loss_step=0.592, global_step=2819.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  34%|███▎      | 407/1208 [11:52<23:21,  1.75s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.38e-5, train/loss_step=0.00236, global_step=2819.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  34%|███▍      | 408/1208 [11:55<23:22,  1.75s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.38e-5, train/loss_step=0.00236, global_step=2819.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  34%|███▍      | 408/1208 [11:55<23:22,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.1e-5, train/loss_step=0.00182, global_step=2819.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  34%|███▍      | 409/1208 [11:56<23:19,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.1e-5, train/loss_step=0.00182, global_step=2819.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  34%|███▍      | 409/1208 [11:56<23:19,  1.75s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=1.29e-5, train/loss_step=0.00214, global_step=2820.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  34%|███▍      | 410/1208 [11:57<23:16,  1.75s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=1.29e-5, train/loss_step=0.00214, global_step=2820.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  34%|███▍      | 410/1208 [11:57<23:16,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0315, train/loss_vlb_step=0.000123, train/loss_step=0.0315, global_step=2820.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  34%|███▍      | 411/1208 [11:58<23:13,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0315, train/loss_vlb_step=0.000123, train/loss_step=0.0315, global_step=2820.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  34%|███▍      | 411/1208 [11:58<23:13,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.000997, train/loss_step=0.251, global_step=2820.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  34%|███▍      | 412/1208 [12:01<23:14,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.000997, train/loss_step=0.251, global_step=2820.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  34%|███▍      | 412/1208 [12:01<23:14,  1.75s/it, loss=0.109, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000773, train/loss_step=0.174, global_step=2820.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  34%|███▍      | 413/1208 [12:02<23:11,  1.75s/it, loss=0.109, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000773, train/loss_step=0.174, global_step=2820.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  34%|███▍      | 413/1208 [12:02<23:11,  1.75s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=8.97e-5, train/loss_step=0.0223, global_step=2821.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  34%|███▍      | 414/1208 [12:03<23:08,  1.75s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=8.97e-5, train/loss_step=0.0223, global_step=2821.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  34%|███▍      | 414/1208 [12:03<23:08,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=7.04e-5, train/loss_step=0.016, global_step=2821.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  34%|███▍      | 415/1208 [12:04<23:05,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=7.04e-5, train/loss_step=0.016, global_step=2821.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  34%|███▍      | 415/1208 [12:04<23:05,  1.75s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000409, train/loss_step=0.124, global_step=2821.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  34%|███▍      | 416/1208 [12:08<23:06,  1.75s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000409, train/loss_step=0.124, global_step=2821.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  34%|███▍      | 416/1208 [12:08<23:06,  1.75s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.00868, train/loss_vlb_step=4.22e-5, train/loss_step=0.00868, global_step=2821.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  35%|███▍      | 417/1208 [12:09<23:03,  1.75s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.00868, train/loss_vlb_step=4.22e-5, train/loss_step=0.00868, global_step=2821.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  35%|███▍      | 417/1208 [12:09<23:03,  1.75s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.6e-5, train/loss_step=0.00284, global_step=2822.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  35%|███▍      | 418/1208 [12:10<23:00,  1.75s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.6e-5, train/loss_step=0.00284, global_step=2822.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  35%|███▍      | 418/1208 [12:10<23:00,  1.75s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000442, train/loss_step=0.132, global_step=2822.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  35%|███▍      | 419/1208 [12:11<22:57,  1.75s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000442, train/loss_step=0.132, global_step=2822.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  35%|███▍      | 419/1208 [12:11<22:57,  1.75s/it, loss=0.0901, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.77e-5, train/loss_step=0.0246, global_step=2822.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  35%|███▍      | 420/1208 [12:14<22:58,  1.75s/it, loss=0.0901, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.77e-5, train/loss_step=0.0246, global_step=2822.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  35%|███▍      | 420/1208 [12:14<22:58,  1.75s/it, loss=0.104, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00429, train/loss_step=0.430, global_step=2822.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  35%|███▍      | 421/1208 [12:15<22:55,  1.75s/it, loss=0.104, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00429, train/loss_step=0.430, global_step=2822.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  35%|███▍      | 421/1208 [12:15<22:55,  1.75s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000112, train/loss_step=0.0282, global_step=2823.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  35%|███▍      | 422/1208 [12:16<22:52,  1.75s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000112, train/loss_step=0.0282, global_step=2823.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  35%|███▍      | 422/1208 [12:16<22:52,  1.75s/it, loss=0.108, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000575, train/loss_step=0.166, global_step=2823.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  35%|███▌      | 423/1208 [12:17<22:49,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000575, train/loss_step=0.166, global_step=2823.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  35%|███▌      | 423/1208 [12:17<22:49,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.097, train/loss_vlb_step=0.000319, train/loss_step=0.097, global_step=2823.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  35%|███▌      | 424/1208 [12:21<22:50,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.097, train/loss_vlb_step=0.000319, train/loss_step=0.097, global_step=2823.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  35%|███▌      | 424/1208 [12:21<22:50,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=8.14e-5, train/loss_step=0.0183, global_step=2823.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  35%|███▌      | 425/1208 [12:22<22:47,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=8.14e-5, train/loss_step=0.0183, global_step=2823.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  35%|███▌      | 425/1208 [12:22<22:47,  1.75s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00646, train/loss_vlb_step=3.22e-5, train/loss_step=0.00646, global_step=2824.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  35%|███▌      | 426/1208 [12:23<22:44,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00646, train/loss_vlb_step=3.22e-5, train/loss_step=0.00646, global_step=2824.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  35%|███▌      | 426/1208 [12:23<22:44,  1.74s/it, loss=0.0784, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000108, train/loss_step=0.0279, global_step=2824.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  35%|███▌      | 427/1208 [12:24<22:41,  1.74s/it, loss=0.0784, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000108, train/loss_step=0.0279, global_step=2824.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  35%|███▌      | 427/1208 [12:24<22:41,  1.74s/it, loss=0.0794, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.96e-5, train/loss_step=0.0237, global_step=2824.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  35%|███▌      | 428/1208 [12:27<22:42,  1.75s/it, loss=0.0794, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.96e-5, train/loss_step=0.0237, global_step=2824.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  35%|███▌      | 428/1208 [12:27<22:42,  1.75s/it, loss=0.0815, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.000153, train/loss_step=0.0418, global_step=2824.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  36%|███▌      | 429/1208 [12:28<22:39,  1.74s/it, loss=0.0815, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.000153, train/loss_step=0.0418, global_step=2824.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  36%|███▌      | 429/1208 [12:28<22:39,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.633, train/loss_vlb_step=0.0154, train/loss_step=0.633, global_step=2825.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]     Epoch 9:  36%|███▌      | 430/1208 [12:29<22:36,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.633, train/loss_vlb_step=0.0154, train/loss_step=0.633, global_step=2825.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  36%|███▌      | 430/1208 [12:29<22:36,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=7.94e-5, train/loss_step=0.0194, global_step=2825.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  36%|███▌      | 431/1208 [12:30<22:33,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=7.94e-5, train/loss_step=0.0194, global_step=2825.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  36%|███▌      | 431/1208 [12:30<22:33,  1.74s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0734, train/loss_vlb_step=0.000249, train/loss_step=0.0734, global_step=2825.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  36%|███▌      | 432/1208 [12:33<22:34,  1.75s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0734, train/loss_vlb_step=0.000249, train/loss_step=0.0734, global_step=2825.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  36%|███▌      | 432/1208 [12:33<22:34,  1.75s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.0968, train/loss_vlb_step=0.000319, train/loss_step=0.0968, global_step=2825.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  36%|███▌      | 433/1208 [12:34<22:31,  1.74s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.0968, train/loss_vlb_step=0.000319, train/loss_step=0.0968, global_step=2825.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  36%|███▌      | 433/1208 [12:34<22:31,  1.74s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0516, train/loss_vlb_step=0.000185, train/loss_step=0.0516, global_step=2826.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  36%|███▌      | 434/1208 [12:35<22:28,  1.74s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0516, train/loss_vlb_step=0.000185, train/loss_step=0.0516, global_step=2826.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  36%|███▌      | 434/1208 [12:35<22:28,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0976, train/loss_vlb_step=0.000325, train/loss_step=0.0976, global_step=2826.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  36%|███▌      | 435/1208 [12:36<22:25,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0976, train/loss_vlb_step=0.000325, train/loss_step=0.0976, global_step=2826.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  36%|███▌      | 435/1208 [12:36<22:25,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00168, train/loss_step=0.314, global_step=2826.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  36%|███▌      | 436/1208 [12:40<22:26,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00168, train/loss_step=0.314, global_step=2826.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  36%|███▌      | 436/1208 [12:40<22:26,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.2e-5, train/loss_step=0.0115, global_step=2826.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  36%|███▌      | 437/1208 [12:41<22:23,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.2e-5, train/loss_step=0.0115, global_step=2826.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  36%|███▌      | 437/1208 [12:41<22:23,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0637, train/loss_vlb_step=0.000215, train/loss_step=0.0637, global_step=2827.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  36%|███▋      | 438/1208 [12:42<22:20,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0637, train/loss_vlb_step=0.000215, train/loss_step=0.0637, global_step=2827.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  36%|███▋      | 438/1208 [12:42<22:20,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00348, train/loss_vlb_step=2.06e-5, train/loss_step=0.00348, global_step=2827.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  36%|███▋      | 439/1208 [12:43<22:17,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00348, train/loss_vlb_step=2.06e-5, train/loss_step=0.00348, global_step=2827.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  36%|███▋      | 439/1208 [12:43<22:17,  1.74s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.29e-5, train/loss_step=0.00225, global_step=2827.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  36%|███▋      | 440/1208 [12:46<22:18,  1.74s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.29e-5, train/loss_step=0.00225, global_step=2827.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  36%|███▋      | 440/1208 [12:46<22:18,  1.74s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.0912, train/loss_vlb_step=0.000305, train/loss_step=0.0912, global_step=2827.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  37%|███▋      | 441/1208 [12:47<22:15,  1.74s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.0912, train/loss_vlb_step=0.000305, train/loss_step=0.0912, global_step=2827.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  37%|███▋      | 441/1208 [12:47<22:15,  1.74s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.0504, train/loss_vlb_step=0.000184, train/loss_step=0.0504, global_step=2828.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  37%|███▋      | 442/1208 [12:48<22:12,  1.74s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.0504, train/loss_vlb_step=0.000184, train/loss_step=0.0504, global_step=2828.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  37%|███▋      | 442/1208 [12:48<22:12,  1.74s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.00015, train/loss_step=0.0416, global_step=2828.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  37%|███▋      | 443/1208 [12:49<22:09,  1.74s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.00015, train/loss_step=0.0416, global_step=2828.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  37%|███▋      | 443/1208 [12:49<22:09,  1.74s/it, loss=0.0845, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=8.89e-5, train/loss_step=0.0225, global_step=2828.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  37%|███▋      | 444/1208 [12:52<22:10,  1.74s/it, loss=0.0845, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=8.89e-5, train/loss_step=0.0225, global_step=2828.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  37%|███▋      | 444/1208 [12:52<22:10,  1.74s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00153, train/loss_step=0.312, global_step=2828.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  37%|███▋      | 445/1208 [12:54<22:07,  1.74s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00153, train/loss_step=0.312, global_step=2828.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  37%|███▋      | 445/1208 [12:54<22:07,  1.74s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=5e-5, train/loss_step=0.0103, global_step=2829.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  37%|███▋      | 446/1208 [12:55<22:04,  1.74s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=5e-5, train/loss_step=0.0103, global_step=2829.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  37%|███▋      | 446/1208 [12:55<22:04,  1.74s/it, loss=0.1, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.000156, train/loss_step=0.043, global_step=2829.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  37%|███▋      | 447/1208 [12:56<22:01,  1.74s/it, loss=0.1, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.000156, train/loss_step=0.043, global_step=2829.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  37%|███▋      | 447/1208 [12:56<22:01,  1.74s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.81e-5, train/loss_step=0.0237, global_step=2829.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  37%|███▋      | 448/1208 [12:59<22:02,  1.74s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.81e-5, train/loss_step=0.0237, global_step=2829.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  37%|███▋      | 448/1208 [12:59<22:02,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000771, train/loss_step=0.214, global_step=2829.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  37%|███▋      | 449/1208 [13:00<21:59,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000771, train/loss_step=0.214, global_step=2829.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  37%|███▋      | 449/1208 [13:00<21:59,  1.74s/it, loss=0.0787, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000129, train/loss_step=0.0332, global_step=2830.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  37%|███▋      | 450/1208 [13:01<21:56,  1.74s/it, loss=0.0787, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000129, train/loss_step=0.0332, global_step=2830.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  37%|███▋      | 450/1208 [13:01<21:56,  1.74s/it, loss=0.0812, v_num=0, train/loss_simple_step=0.0694, train/loss_vlb_step=0.000237, train/loss_step=0.0694, global_step=2830.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  37%|███▋      | 451/1208 [13:02<21:53,  1.74s/it, loss=0.0812, v_num=0, train/loss_simple_step=0.0694, train/loss_vlb_step=0.000237, train/loss_step=0.0694, global_step=2830.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  37%|███▋      | 451/1208 [13:02<21:53,  1.74s/it, loss=0.085, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000509, train/loss_step=0.148, global_step=2830.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  37%|███▋      | 452/1208 [13:05<21:54,  1.74s/it, loss=0.085, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000509, train/loss_step=0.148, global_step=2830.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  37%|███▋      | 452/1208 [13:05<21:54,  1.74s/it, loss=0.0802, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=1.33e-5, train/loss_step=0.00234, global_step=2830.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  38%|███▊      | 453/1208 [13:06<21:51,  1.74s/it, loss=0.0802, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=1.33e-5, train/loss_step=0.00234, global_step=2830.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  38%|███▊      | 453/1208 [13:06<21:51,  1.74s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000858, train/loss_step=0.217, global_step=2831.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  38%|███▊      | 454/1208 [13:07<21:48,  1.74s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000858, train/loss_step=0.217, global_step=2831.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  38%|███▊      | 454/1208 [13:07<21:48,  1.74s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.26e-5, train/loss_step=0.0134, global_step=2831.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  38%|███▊      | 455/1208 [13:08<21:45,  1.73s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.26e-5, train/loss_step=0.0134, global_step=2831.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  38%|███▊      | 455/1208 [13:08<21:45,  1.73s/it, loss=0.0697, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.71e-5, train/loss_step=0.0213, global_step=2831.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  38%|███▊      | 456/1208 [13:12<21:46,  1.74s/it, loss=0.0697, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.71e-5, train/loss_step=0.0213, global_step=2831.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  38%|███▊      | 456/1208 [13:12<21:46,  1.74s/it, loss=0.0725, v_num=0, train/loss_simple_step=0.0678, train/loss_vlb_step=0.000235, train/loss_step=0.0678, global_step=2831.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  38%|███▊      | 457/1208 [13:13<21:43,  1.74s/it, loss=0.0725, v_num=0, train/loss_simple_step=0.0678, train/loss_vlb_step=0.000235, train/loss_step=0.0678, global_step=2831.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  38%|███▊      | 457/1208 [13:13<21:43,  1.74s/it, loss=0.071, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000128, train/loss_step=0.0329, global_step=2832.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  38%|███▊      | 458/1208 [13:14<21:40,  1.73s/it, loss=0.071, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000128, train/loss_step=0.0329, global_step=2832.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  38%|███▊      | 458/1208 [13:14<21:40,  1.73s/it, loss=0.0725, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.00012, train/loss_step=0.0329, global_step=2832.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  38%|███▊      | 459/1208 [13:15<21:37,  1.73s/it, loss=0.0725, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.00012, train/loss_step=0.0329, global_step=2832.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  38%|███▊      | 459/1208 [13:15<21:37,  1.73s/it, loss=0.0787, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000421, train/loss_step=0.128, global_step=2832.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  38%|███▊      | 460/1208 [13:18<21:38,  1.74s/it, loss=0.0787, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000421, train/loss_step=0.128, global_step=2832.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  38%|███▊      | 460/1208 [13:18<21:38,  1.74s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000942, train/loss_step=0.238, global_step=2832.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  38%|███▊      | 461/1208 [13:19<21:35,  1.73s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000942, train/loss_step=0.238, global_step=2832.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  38%|███▊      | 461/1208 [13:19<21:35,  1.73s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.58e-5, train/loss_step=0.0028, global_step=2833.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  38%|███▊      | 462/1208 [13:20<21:32,  1.73s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.58e-5, train/loss_step=0.0028, global_step=2833.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  38%|███▊      | 462/1208 [13:20<21:32,  1.73s/it, loss=0.086, v_num=0, train/loss_simple_step=0.0886, train/loss_vlb_step=0.000291, train/loss_step=0.0886, global_step=2833.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  38%|███▊      | 463/1208 [13:21<21:29,  1.73s/it, loss=0.086, v_num=0, train/loss_simple_step=0.0886, train/loss_vlb_step=0.000291, train/loss_step=0.0886, global_step=2833.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  38%|███▊      | 463/1208 [13:21<21:29,  1.73s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.000124, train/loss_step=0.0313, global_step=2833.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  38%|███▊      | 464/1208 [13:24<21:30,  1.73s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.000124, train/loss_step=0.0313, global_step=2833.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  38%|███▊      | 464/1208 [13:24<21:30,  1.73s/it, loss=0.0814, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000796, train/loss_step=0.210, global_step=2833.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  38%|███▊      | 465/1208 [13:25<21:27,  1.73s/it, loss=0.0814, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000796, train/loss_step=0.210, global_step=2833.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  38%|███▊      | 465/1208 [13:25<21:27,  1.73s/it, loss=0.0812, v_num=0, train/loss_simple_step=0.00667, train/loss_vlb_step=3.33e-5, train/loss_step=0.00667, global_step=2834.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  39%|███▊      | 466/1208 [13:27<21:24,  1.73s/it, loss=0.0812, v_num=0, train/loss_simple_step=0.00667, train/loss_vlb_step=3.33e-5, train/loss_step=0.00667, global_step=2834.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  39%|███▊      | 466/1208 [13:27<21:24,  1.73s/it, loss=0.0895, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000748, train/loss_step=0.209, global_step=2834.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  39%|███▊      | 467/1208 [13:28<21:22,  1.73s/it, loss=0.0895, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000748, train/loss_step=0.209, global_step=2834.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  39%|███▊      | 467/1208 [13:28<21:22,  1.73s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.24e-5, train/loss_step=0.0111, global_step=2834.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  39%|███▊      | 468/1208 [13:31<21:22,  1.73s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.24e-5, train/loss_step=0.0111, global_step=2834.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  39%|███▊      | 468/1208 [13:31<21:22,  1.73s/it, loss=0.086, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000543, train/loss_step=0.156, global_step=2834.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  39%|███▉      | 469/1208 [13:32<21:20,  1.73s/it, loss=0.086, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000543, train/loss_step=0.156, global_step=2834.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  39%|███▉      | 469/1208 [13:32<21:20,  1.73s/it, loss=0.0845, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.54e-5, train/loss_step=0.00282, global_step=2835.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  39%|███▉      | 470/1208 [13:33<21:17,  1.73s/it, loss=0.0845, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.54e-5, train/loss_step=0.00282, global_step=2835.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  39%|███▉      | 470/1208 [13:33<21:17,  1.73s/it, loss=0.0812, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=2.31e-5, train/loss_step=0.00421, global_step=2835.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  39%|███▉      | 471/1208 [13:34<21:14,  1.73s/it, loss=0.0812, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=2.31e-5, train/loss_step=0.00421, global_step=2835.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  39%|███▉      | 471/1208 [13:34<21:14,  1.73s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000774, train/loss_step=0.209, global_step=2835.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  39%|███▉      | 472/1208 [13:37<21:15,  1.73s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000774, train/loss_step=0.209, global_step=2835.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  39%|███▉      | 472/1208 [13:37<21:15,  1.73s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.00055, train/loss_step=0.165, global_step=2835.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  39%|███▉      | 473/1208 [13:38<21:12,  1.73s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.00055, train/loss_step=0.165, global_step=2835.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  39%|███▉      | 473/1208 [13:38<21:12,  1.73s/it, loss=0.0888, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000482, train/loss_step=0.145, global_step=2836.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  39%|███▉      | 474/1208 [13:39<21:09,  1.73s/it, loss=0.0888, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000482, train/loss_step=0.145, global_step=2836.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  39%|███▉      | 474/1208 [13:39<21:09,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00145, train/loss_step=0.306, global_step=2836.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  39%|███▉      | 475/1208 [13:40<21:06,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00145, train/loss_step=0.306, global_step=2836.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  39%|███▉      | 475/1208 [13:40<21:06,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.62e-5, train/loss_step=0.0209, global_step=2836.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  39%|███▉      | 476/1208 [13:44<21:07,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.62e-5, train/loss_step=0.0209, global_step=2836.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  39%|███▉      | 476/1208 [13:44<21:07,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000689, train/loss_step=0.193, global_step=2836.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  39%|███▉      | 477/1208 [13:45<21:04,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000689, train/loss_step=0.193, global_step=2836.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  39%|███▉      | 477/1208 [13:45<21:04,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.000178, train/loss_step=0.0483, global_step=2837.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  40%|███▉      | 478/1208 [13:46<21:01,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.000178, train/loss_step=0.0483, global_step=2837.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  40%|███▉      | 478/1208 [13:46<21:01,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.756, train/loss_vlb_step=0.0357, train/loss_step=0.756, global_step=2837.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  40%|███▉      | 479/1208 [13:47<20:58,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.756, train/loss_vlb_step=0.0357, train/loss_step=0.756, global_step=2837.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  40%|███▉      | 479/1208 [13:47<20:58,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=1.41e-5, train/loss_step=0.00242, global_step=2837.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  40%|███▉      | 480/1208 [13:50<20:59,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=1.41e-5, train/loss_step=0.00242, global_step=2837.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  40%|███▉      | 480/1208 [13:50<20:59,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0856, train/loss_vlb_step=0.000281, train/loss_step=0.0856, global_step=2837.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  40%|███▉      | 481/1208 [13:51<20:56,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0856, train/loss_vlb_step=0.000281, train/loss_step=0.0856, global_step=2837.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  40%|███▉      | 481/1208 [13:51<20:56,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.51e-5, train/loss_step=0.0207, global_step=2838.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  40%|███▉      | 482/1208 [13:52<20:54,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.51e-5, train/loss_step=0.0207, global_step=2838.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  40%|███▉      | 482/1208 [13:52<20:54,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00242, train/loss_step=0.376, global_step=2838.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  40%|███▉      | 483/1208 [13:53<20:51,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00242, train/loss_step=0.376, global_step=2838.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  40%|███▉      | 483/1208 [13:53<20:51,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.56e-5, train/loss_step=0.0148, global_step=2838.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  40%|████      | 484/1208 [13:56<20:51,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.56e-5, train/loss_step=0.0148, global_step=2838.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  40%|████      | 484/1208 [13:56<20:51,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.000192, train/loss_step=0.0526, global_step=2838.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  40%|████      | 485/1208 [13:57<20:49,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.000192, train/loss_step=0.0526, global_step=2838.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  40%|████      | 485/1208 [13:57<20:49,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000874, train/loss_step=0.228, global_step=2839.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  40%|████      | 486/1208 [13:58<20:46,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000874, train/loss_step=0.228, global_step=2839.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  40%|████      | 486/1208 [13:58<20:46,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.483, train/loss_vlb_step=0.00698, train/loss_step=0.483, global_step=2839.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  40%|████      | 487/1208 [13:59<20:43,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.483, train/loss_vlb_step=0.00698, train/loss_step=0.483, global_step=2839.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  40%|████      | 487/1208 [13:59<20:43,  1.72s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.000133, train/loss_step=0.0356, global_step=2839.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  40%|████      | 488/1208 [14:03<20:44,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.000133, train/loss_step=0.0356, global_step=2839.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  40%|████      | 488/1208 [14:03<20:44,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0616, train/loss_vlb_step=0.000214, train/loss_step=0.0616, global_step=2839.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  40%|████      | 489/1208 [14:04<20:41,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0616, train/loss_vlb_step=0.000214, train/loss_step=0.0616, global_step=2839.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  40%|████      | 489/1208 [14:04<20:41,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00129, train/loss_step=0.295, global_step=2840.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  41%|████      | 490/1208 [14:05<20:38,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00129, train/loss_step=0.295, global_step=2840.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  41%|████      | 490/1208 [14:05<20:38,  1.73s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.53e-5, train/loss_step=0.0121, global_step=2840.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  41%|████      | 491/1208 [14:06<20:35,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.53e-5, train/loss_step=0.0121, global_step=2840.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  41%|████      | 491/1208 [14:06<20:35,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00129, train/loss_step=0.277, global_step=2840.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  41%|████      | 492/1208 [14:09<20:36,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00129, train/loss_step=0.277, global_step=2840.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  41%|████      | 492/1208 [14:09<20:36,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0047, train/loss_vlb_step=2.45e-5, train/loss_step=0.0047, global_step=2840.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  41%|████      | 493/1208 [14:10<20:33,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0047, train/loss_vlb_step=2.45e-5, train/loss_step=0.0047, global_step=2840.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  41%|████      | 493/1208 [14:10<20:33,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=1.94e-5, train/loss_step=0.00361, global_step=2841.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  41%|████      | 494/1208 [14:11<20:31,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=1.94e-5, train/loss_step=0.00361, global_step=2841.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  41%|████      | 494/1208 [14:11<20:31,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000634, train/loss_step=0.179, global_step=2841.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  41%|████      | 495/1208 [14:12<20:28,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000634, train/loss_step=0.179, global_step=2841.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  41%|████      | 495/1208 [14:12<20:28,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.21e-5, train/loss_step=0.0233, global_step=2841.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  41%|████      | 496/1208 [14:16<20:28,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.21e-5, train/loss_step=0.0233, global_step=2841.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  41%|████      | 496/1208 [14:16<20:28,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00534, train/loss_vlb_step=2.74e-5, train/loss_step=0.00534, global_step=2841.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  41%|████      | 497/1208 [14:17<20:26,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00534, train/loss_vlb_step=2.74e-5, train/loss_step=0.00534, global_step=2841.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  41%|████      | 497/1208 [14:17<20:26,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.00434, train/loss_step=0.460, global_step=2842.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  41%|████      | 498/1208 [14:18<20:23,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.00434, train/loss_step=0.460, global_step=2842.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  41%|████      | 498/1208 [14:18<20:23,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000621, train/loss_step=0.178, global_step=2842.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  41%|████▏     | 499/1208 [14:19<20:20,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000621, train/loss_step=0.178, global_step=2842.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  41%|████▏     | 499/1208 [14:19<20:20,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00117, train/loss_step=0.255, global_step=2842.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  41%|████▏     | 500/1208 [14:22<20:21,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00117, train/loss_step=0.255, global_step=2842.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  41%|████▏     | 500/1208 [14:22<20:21,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.551, train/loss_vlb_step=0.00979, train/loss_step=0.551, global_step=2842.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  41%|████▏     | 501/1208 [14:23<20:18,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.551, train/loss_vlb_step=0.00979, train/loss_step=0.551, global_step=2842.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  41%|████▏     | 501/1208 [14:23<20:18,  1.72s/it, loss=0.187, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000896, train/loss_step=0.236, global_step=2843.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  42%|████▏     | 502/1208 [14:24<20:15,  1.72s/it, loss=0.187, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000896, train/loss_step=0.236, global_step=2843.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  42%|████▏     | 502/1208 [14:24<20:15,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000855, train/loss_step=0.224, global_step=2843.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  42%|████▏     | 503/1208 [14:25<20:13,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000855, train/loss_step=0.224, global_step=2843.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  42%|████▏     | 503/1208 [14:25<20:13,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00485, train/loss_vlb_step=2.54e-5, train/loss_step=0.00485, global_step=2843.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  42%|████▏     | 504/1208 [14:28<20:13,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00485, train/loss_vlb_step=2.54e-5, train/loss_step=0.00485, global_step=2843.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  42%|████▏     | 504/1208 [14:28<20:13,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.74e-5, train/loss_step=0.0156, global_step=2843.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  42%|████▏     | 505/1208 [14:29<20:10,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.74e-5, train/loss_step=0.0156, global_step=2843.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  42%|████▏     | 505/1208 [14:29<20:10,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00887, train/loss_vlb_step=4.39e-5, train/loss_step=0.00887, global_step=2844.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  42%|████▏     | 506/1208 [14:30<20:08,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00887, train/loss_vlb_step=4.39e-5, train/loss_step=0.00887, global_step=2844.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  42%|████▏     | 506/1208 [14:30<20:08,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=2844.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  42%|████▏     | 507/1208 [14:31<20:05,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=2844.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  42%|████▏     | 507/1208 [14:31<20:05,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0592, train/loss_vlb_step=0.000206, train/loss_step=0.0592, global_step=2844.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  42%|████▏     | 508/1208 [14:35<20:06,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0592, train/loss_vlb_step=0.000206, train/loss_step=0.0592, global_step=2844.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  42%|████▏     | 508/1208 [14:35<20:06,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.00069, train/loss_step=0.194, global_step=2844.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  42%|████▏     | 509/1208 [14:36<20:03,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.00069, train/loss_step=0.194, global_step=2844.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  42%|████▏     | 509/1208 [14:36<20:03,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0647, train/loss_vlb_step=0.00022, train/loss_step=0.0647, global_step=2845.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  42%|████▏     | 510/1208 [14:37<20:00,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0647, train/loss_vlb_step=0.00022, train/loss_step=0.0647, global_step=2845.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  42%|████▏     | 510/1208 [14:37<20:00,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00193, train/loss_step=0.362, global_step=2845.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  42%|████▏     | 511/1208 [14:38<19:58,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00193, train/loss_step=0.362, global_step=2845.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  42%|████▏     | 511/1208 [14:38<19:58,  1.72s/it, loss=0.165, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00157, train/loss_step=0.349, global_step=2845.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  42%|████▏     | 512/1208 [14:41<19:58,  1.72s/it, loss=0.165, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00157, train/loss_step=0.349, global_step=2845.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  42%|████▏     | 512/1208 [14:41<19:58,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.000146, train/loss_step=0.038, global_step=2845.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  42%|████▏     | 513/1208 [14:42<19:55,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.000146, train/loss_step=0.038, global_step=2845.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  42%|████▏     | 513/1208 [14:42<19:55,  1.72s/it, loss=0.186, v_num=0, train/loss_simple_step=0.387, train/loss_vlb_step=0.00246, train/loss_step=0.387, global_step=2846.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  43%|████▎     | 514/1208 [14:43<19:53,  1.72s/it, loss=0.186, v_num=0, train/loss_simple_step=0.387, train/loss_vlb_step=0.00246, train/loss_step=0.387, global_step=2846.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  43%|████▎     | 514/1208 [14:43<19:53,  1.72s/it, loss=0.199, v_num=0, train/loss_simple_step=0.449, train/loss_vlb_step=0.00293, train/loss_step=0.449, global_step=2846.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  43%|████▎     | 515/1208 [14:44<19:50,  1.72s/it, loss=0.199, v_num=0, train/loss_simple_step=0.449, train/loss_vlb_step=0.00293, train/loss_step=0.449, global_step=2846.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  43%|████▎     | 515/1208 [14:44<19:50,  1.72s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000142, train/loss_step=0.0373, global_step=2846.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  43%|████▎     | 516/1208 [14:48<19:50,  1.72s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000142, train/loss_step=0.0373, global_step=2846.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  43%|████▎     | 516/1208 [14:48<19:50,  1.72s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000113, train/loss_step=0.0274, global_step=2846.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  43%|████▎     | 517/1208 [14:49<19:48,  1.72s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000113, train/loss_step=0.0274, global_step=2846.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  43%|████▎     | 517/1208 [14:49<19:48,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=7.96e-5, train/loss_step=0.0198, global_step=2847.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  43%|████▎     | 518/1208 [14:50<19:45,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=7.96e-5, train/loss_step=0.0198, global_step=2847.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  43%|████▎     | 518/1208 [14:50<19:45,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.48e-5, train/loss_step=0.020, global_step=2847.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  43%|████▎     | 519/1208 [14:51<19:43,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.48e-5, train/loss_step=0.020, global_step=2847.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  43%|████▎     | 519/1208 [14:51<19:43,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.16e-5, train/loss_step=0.00195, global_step=2847.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  43%|████▎     | 520/1208 [14:54<19:43,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.16e-5, train/loss_step=0.00195, global_step=2847.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  43%|████▎     | 520/1208 [14:54<19:43,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000638, train/loss_step=0.181, global_step=2847.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  43%|████▎     | 521/1208 [14:55<19:40,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000638, train/loss_step=0.181, global_step=2847.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  43%|████▎     | 521/1208 [14:55<19:40,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0466, train/loss_vlb_step=0.00017, train/loss_step=0.0466, global_step=2848.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  43%|████▎     | 522/1208 [14:56<19:38,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0466, train/loss_vlb_step=0.00017, train/loss_step=0.0466, global_step=2848.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  43%|████▎     | 522/1208 [14:56<19:38,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.29e-5, train/loss_step=0.0167, global_step=2848.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  43%|████▎     | 523/1208 [14:57<19:35,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.29e-5, train/loss_step=0.0167, global_step=2848.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  43%|████▎     | 523/1208 [14:57<19:35,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.19e-5, train/loss_step=0.0115, global_step=2848.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  43%|████▎     | 524/1208 [15:00<19:35,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.19e-5, train/loss_step=0.0115, global_step=2848.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  43%|████▎     | 524/1208 [15:00<19:35,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00913, train/loss_vlb_step=4.35e-5, train/loss_step=0.00913, global_step=2848.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  43%|████▎     | 525/1208 [15:01<19:33,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00913, train/loss_vlb_step=4.35e-5, train/loss_step=0.00913, global_step=2848.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  43%|████▎     | 525/1208 [15:01<19:33,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00377, train/loss_vlb_step=2.13e-5, train/loss_step=0.00377, global_step=2849.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  44%|████▎     | 526/1208 [15:02<19:30,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00377, train/loss_vlb_step=2.13e-5, train/loss_step=0.00377, global_step=2849.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  44%|████▎     | 526/1208 [15:02<19:30,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=2849.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  44%|████▎     | 527/1208 [15:04<19:28,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=2849.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  44%|████▎     | 527/1208 [15:04<19:28,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.38e-5, train/loss_step=0.0143, global_step=2849.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  44%|████▎     | 528/1208 [15:07<19:28,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.38e-5, train/loss_step=0.0143, global_step=2849.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  44%|████▎     | 528/1208 [15:07<19:28,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0945, train/loss_vlb_step=0.000311, train/loss_step=0.0945, global_step=2849.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  44%|████▍     | 529/1208 [15:08<19:25,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0945, train/loss_vlb_step=0.000311, train/loss_step=0.0945, global_step=2849.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  44%|████▍     | 529/1208 [15:08<19:25,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000402, train/loss_step=0.118, global_step=2850.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  44%|████▍     | 530/1208 [15:09<19:23,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000402, train/loss_step=0.118, global_step=2850.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  44%|████▍     | 530/1208 [15:09<19:23,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000729, train/loss_step=0.205, global_step=2850.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  44%|████▍     | 531/1208 [15:10<19:20,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000729, train/loss_step=0.205, global_step=2850.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  44%|████▍     | 531/1208 [15:10<19:20,  1.71s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.00888, train/loss_vlb_step=4.26e-5, train/loss_step=0.00888, global_step=2850.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  44%|████▍     | 532/1208 [15:13<19:20,  1.72s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.00888, train/loss_vlb_step=4.26e-5, train/loss_step=0.00888, global_step=2850.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  44%|████▍     | 532/1208 [15:13<19:20,  1.72s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000644, train/loss_step=0.180, global_step=2850.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  44%|████▍     | 533/1208 [15:14<19:18,  1.72s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000644, train/loss_step=0.180, global_step=2850.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  44%|████▍     | 533/1208 [15:14<19:18,  1.72s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00273, train/loss_step=0.415, global_step=2851.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  44%|████▍     | 534/1208 [15:15<19:15,  1.71s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00273, train/loss_step=0.415, global_step=2851.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  44%|████▍     | 534/1208 [15:15<19:15,  1.71s/it, loss=0.0866, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000793, train/loss_step=0.206, global_step=2851.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  44%|████▍     | 535/1208 [15:16<19:13,  1.71s/it, loss=0.0866, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000793, train/loss_step=0.206, global_step=2851.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  44%|████▍     | 535/1208 [15:16<19:13,  1.71s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00147, train/loss_step=0.290, global_step=2851.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  44%|████▍     | 536/1208 [15:20<19:13,  1.72s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00147, train/loss_step=0.290, global_step=2851.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  44%|████▍     | 536/1208 [15:20<19:13,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000432, train/loss_step=0.128, global_step=2851.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  44%|████▍     | 537/1208 [15:21<19:10,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000432, train/loss_step=0.128, global_step=2851.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  44%|████▍     | 537/1208 [15:21<19:10,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.0013, train/loss_step=0.273, global_step=2852.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  45%|████▍     | 538/1208 [15:22<19:08,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.0013, train/loss_step=0.273, global_step=2852.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  45%|████▍     | 538/1208 [15:22<19:08,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00116, train/loss_step=0.277, global_step=2852.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  45%|████▍     | 539/1208 [15:23<19:05,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00116, train/loss_step=0.277, global_step=2852.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  45%|████▍     | 539/1208 [15:23<19:05,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0769, train/loss_vlb_step=0.000255, train/loss_step=0.0769, global_step=2852.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  45%|████▍     | 540/1208 [15:26<19:06,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0769, train/loss_vlb_step=0.000255, train/loss_step=0.0769, global_step=2852.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  45%|████▍     | 540/1208 [15:26<19:06,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=9.14e-5, train/loss_step=0.0222, global_step=2852.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  45%|████▍     | 541/1208 [15:27<19:03,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=9.14e-5, train/loss_step=0.0222, global_step=2852.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  45%|████▍     | 541/1208 [15:27<19:03,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.00265, train/loss_step=0.382, global_step=2853.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  45%|████▍     | 542/1208 [15:28<19:00,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.00265, train/loss_step=0.382, global_step=2853.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  45%|████▍     | 542/1208 [15:28<19:00,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.93e-5, train/loss_step=0.011, global_step=2853.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  45%|████▍     | 543/1208 [15:29<18:58,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.93e-5, train/loss_step=0.011, global_step=2853.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  45%|████▍     | 543/1208 [15:29<18:58,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.602, train/loss_vlb_step=0.0104, train/loss_step=0.602, global_step=2853.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  45%|████▌     | 544/1208 [15:32<18:58,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.602, train/loss_vlb_step=0.0104, train/loss_step=0.602, global_step=2853.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  45%|████▌     | 544/1208 [15:32<18:58,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=6.04e-5, train/loss_step=0.0133, global_step=2853.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  45%|████▌     | 545/1208 [15:33<18:56,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=6.04e-5, train/loss_step=0.0133, global_step=2853.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  45%|████▌     | 545/1208 [15:33<18:56,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000751, train/loss_step=0.214, global_step=2854.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  45%|████▌     | 546/1208 [15:34<18:53,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000751, train/loss_step=0.214, global_step=2854.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  45%|████▌     | 546/1208 [15:34<18:53,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000661, train/loss_step=0.185, global_step=2854.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  45%|████▌     | 547/1208 [15:36<18:51,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000661, train/loss_step=0.185, global_step=2854.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  45%|████▌     | 547/1208 [15:36<18:51,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.000103, train/loss_step=0.0256, global_step=2854.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  45%|████▌     | 548/1208 [15:39<18:51,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.000103, train/loss_step=0.0256, global_step=2854.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  45%|████▌     | 548/1208 [15:39<18:51,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.2e-5, train/loss_step=0.0112, global_step=2854.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  45%|████▌     | 549/1208 [15:40<18:48,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.2e-5, train/loss_step=0.0112, global_step=2854.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  45%|████▌     | 549/1208 [15:40<18:48,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.0013, train/loss_step=0.324, global_step=2855.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  46%|████▌     | 550/1208 [15:41<18:46,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.0013, train/loss_step=0.324, global_step=2855.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  46%|████▌     | 550/1208 [15:41<18:46,  1.71s/it, loss=0.199, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00245, train/loss_step=0.336, global_step=2855.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  46%|████▌     | 551/1208 [15:42<18:43,  1.71s/it, loss=0.199, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00245, train/loss_step=0.336, global_step=2855.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  46%|████▌     | 551/1208 [15:42<18:43,  1.71s/it, loss=0.208, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000668, train/loss_step=0.185, global_step=2855.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  46%|████▌     | 552/1208 [15:45<18:43,  1.71s/it, loss=0.208, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000668, train/loss_step=0.185, global_step=2855.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  46%|████▌     | 552/1208 [15:45<18:43,  1.71s/it, loss=0.211, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.00109, train/loss_step=0.246, global_step=2855.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  46%|████▌     | 553/1208 [15:46<18:41,  1.71s/it, loss=0.211, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.00109, train/loss_step=0.246, global_step=2855.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  46%|████▌     | 553/1208 [15:46<18:41,  1.71s/it, loss=0.196, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000363, train/loss_step=0.110, global_step=2856.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  46%|████▌     | 554/1208 [15:47<18:38,  1.71s/it, loss=0.196, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000363, train/loss_step=0.110, global_step=2856.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  46%|████▌     | 554/1208 [15:47<18:38,  1.71s/it, loss=0.212, v_num=0, train/loss_simple_step=0.529, train/loss_vlb_step=0.0065, train/loss_step=0.529, global_step=2856.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  46%|████▌     | 555/1208 [15:48<18:36,  1.71s/it, loss=0.212, v_num=0, train/loss_simple_step=0.529, train/loss_vlb_step=0.0065, train/loss_step=0.529, global_step=2856.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  46%|████▌     | 555/1208 [15:48<18:36,  1.71s/it, loss=0.205, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000523, train/loss_step=0.154, global_step=2856.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  46%|████▌     | 556/1208 [15:52<18:36,  1.71s/it, loss=0.205, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000523, train/loss_step=0.154, global_step=2856.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  46%|████▌     | 556/1208 [15:52<18:36,  1.71s/it, loss=0.199, v_num=0, train/loss_simple_step=0.00418, train/loss_vlb_step=2.22e-5, train/loss_step=0.00418, global_step=2856.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  46%|████▌     | 557/1208 [15:53<18:34,  1.71s/it, loss=0.199, v_num=0, train/loss_simple_step=0.00418, train/loss_vlb_step=2.22e-5, train/loss_step=0.00418, global_step=2856.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  46%|████▌     | 557/1208 [15:53<18:34,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0863, train/loss_vlb_step=0.000287, train/loss_step=0.0863, global_step=2857.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  46%|████▌     | 558/1208 [15:54<18:31,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0863, train/loss_vlb_step=0.000287, train/loss_step=0.0863, global_step=2857.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  46%|████▌     | 558/1208 [15:54<18:31,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.23e-5, train/loss_step=0.017, global_step=2857.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  46%|████▋     | 559/1208 [15:55<18:29,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.23e-5, train/loss_step=0.017, global_step=2857.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  46%|████▋     | 559/1208 [15:55<18:29,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000917, train/loss_step=0.237, global_step=2857.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  46%|████▋     | 560/1208 [15:58<18:29,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000917, train/loss_step=0.237, global_step=2857.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  46%|████▋     | 560/1208 [15:58<18:29,  1.71s/it, loss=0.196, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000891, train/loss_step=0.238, global_step=2857.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  46%|████▋     | 561/1208 [15:59<18:26,  1.71s/it, loss=0.196, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000891, train/loss_step=0.238, global_step=2857.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  46%|████▋     | 561/1208 [15:59<18:26,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=6.05e-5, train/loss_step=0.013, global_step=2858.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  47%|████▋     | 562/1208 [16:00<18:24,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=6.05e-5, train/loss_step=0.013, global_step=2858.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  47%|████▋     | 562/1208 [16:00<18:24,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000108, train/loss_step=0.0274, global_step=2858.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  47%|████▋     | 563/1208 [16:01<18:21,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000108, train/loss_step=0.0274, global_step=2858.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  47%|████▋     | 563/1208 [16:01<18:21,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000831, train/loss_step=0.227, global_step=2858.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  47%|████▋     | 564/1208 [16:04<18:21,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000831, train/loss_step=0.227, global_step=2858.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  47%|████▋     | 564/1208 [16:04<18:21,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.582, train/loss_vlb_step=0.010, train/loss_step=0.582, global_step=2858.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  47%|████▋     | 565/1208 [16:06<18:19,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.582, train/loss_vlb_step=0.010, train/loss_step=0.582, global_step=2858.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  47%|████▋     | 565/1208 [16:06<18:19,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.000131, train/loss_step=0.034, global_step=2859.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  47%|████▋     | 566/1208 [16:07<18:16,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.000131, train/loss_step=0.034, global_step=2859.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  47%|████▋     | 566/1208 [16:07<18:16,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0608, train/loss_vlb_step=0.000211, train/loss_step=0.0608, global_step=2859.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  47%|████▋     | 567/1208 [16:08<18:14,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0608, train/loss_vlb_step=0.000211, train/loss_step=0.0608, global_step=2859.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  47%|████▋     | 567/1208 [16:08<18:14,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.475, train/loss_vlb_step=0.0046, train/loss_step=0.475, global_step=2859.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  47%|████▋     | 568/1208 [16:11<18:14,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.475, train/loss_vlb_step=0.0046, train/loss_step=0.475, global_step=2859.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  47%|████▋     | 568/1208 [16:11<18:14,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00681, train/loss_vlb_step=3.44e-5, train/loss_step=0.00681, global_step=2859.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  47%|████▋     | 569/1208 [16:12<18:12,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00681, train/loss_vlb_step=3.44e-5, train/loss_step=0.00681, global_step=2859.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  47%|████▋     | 569/1208 [16:12<18:12,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000454, train/loss_step=0.137, global_step=2860.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  47%|████▋     | 570/1208 [16:13<18:09,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000454, train/loss_step=0.137, global_step=2860.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  47%|████▋     | 570/1208 [16:13<18:09,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000838, train/loss_step=0.224, global_step=2860.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  47%|████▋     | 571/1208 [16:14<18:07,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000838, train/loss_step=0.224, global_step=2860.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  47%|████▋     | 571/1208 [16:14<18:07,  1.71s/it, loss=0.208, v_num=0, train/loss_simple_step=0.760, train/loss_vlb_step=0.0557, train/loss_step=0.760, global_step=2860.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  47%|████▋     | 572/1208 [16:17<18:07,  1.71s/it, loss=0.208, v_num=0, train/loss_simple_step=0.760, train/loss_vlb_step=0.0557, train/loss_step=0.760, global_step=2860.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  47%|████▋     | 572/1208 [16:17<18:07,  1.71s/it, loss=0.208, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.00108, train/loss_step=0.232, global_step=2860.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  47%|████▋     | 573/1208 [16:18<18:04,  1.71s/it, loss=0.208, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.00108, train/loss_step=0.232, global_step=2860.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  47%|████▋     | 573/1208 [16:18<18:04,  1.71s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.75e-5, train/loss_step=0.0235, global_step=2861.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  48%|████▊     | 574/1208 [16:19<18:02,  1.71s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.75e-5, train/loss_step=0.0235, global_step=2861.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  48%|████▊     | 574/1208 [16:19<18:02,  1.71s/it, loss=0.198, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00284, train/loss_step=0.413, global_step=2861.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  48%|████▊     | 575/1208 [16:20<17:59,  1.71s/it, loss=0.198, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00284, train/loss_step=0.413, global_step=2861.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  48%|████▊     | 575/1208 [16:20<17:59,  1.71s/it, loss=0.226, v_num=0, train/loss_simple_step=0.721, train/loss_vlb_step=0.0224, train/loss_step=0.721, global_step=2861.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  48%|████▊     | 576/1208 [16:24<17:59,  1.71s/it, loss=0.226, v_num=0, train/loss_simple_step=0.721, train/loss_vlb_step=0.0224, train/loss_step=0.721, global_step=2861.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  48%|████▊     | 576/1208 [16:24<17:59,  1.71s/it, loss=0.226, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.89e-5, train/loss_step=0.00351, global_step=2861.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  48%|████▊     | 577/1208 [16:25<17:57,  1.71s/it, loss=0.226, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.89e-5, train/loss_step=0.00351, global_step=2861.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  48%|████▊     | 577/1208 [16:25<17:57,  1.71s/it, loss=0.233, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000919, train/loss_step=0.237, global_step=2862.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  48%|████▊     | 578/1208 [16:26<17:55,  1.71s/it, loss=0.233, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000919, train/loss_step=0.237, global_step=2862.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  48%|████▊     | 578/1208 [16:26<17:55,  1.71s/it, loss=0.233, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7e-5, train/loss_step=0.0175, global_step=2862.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  48%|████▊     | 579/1208 [16:27<17:52,  1.71s/it, loss=0.233, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7e-5, train/loss_step=0.0175, global_step=2862.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  48%|████▊     | 579/1208 [16:27<17:52,  1.71s/it, loss=0.241, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00313, train/loss_step=0.398, global_step=2862.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  48%|████▊     | 580/1208 [16:30<17:52,  1.71s/it, loss=0.241, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00313, train/loss_step=0.398, global_step=2862.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  48%|████▊     | 580/1208 [16:30<17:52,  1.71s/it, loss=0.23, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.21e-5, train/loss_step=0.0172, global_step=2862.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  48%|████▊     | 581/1208 [16:31<17:50,  1.71s/it, loss=0.23, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.21e-5, train/loss_step=0.0172, global_step=2862.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  48%|████▊     | 581/1208 [16:31<17:50,  1.71s/it, loss=0.261, v_num=0, train/loss_simple_step=0.634, train/loss_vlb_step=0.0155, train/loss_step=0.634, global_step=2863.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  48%|████▊     | 582/1208 [16:32<17:47,  1.71s/it, loss=0.261, v_num=0, train/loss_simple_step=0.634, train/loss_vlb_step=0.0155, train/loss_step=0.634, global_step=2863.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  48%|████▊     | 582/1208 [16:32<17:47,  1.71s/it, loss=0.26, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.27e-5, train/loss_step=0.00215, global_step=2863.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  48%|████▊     | 583/1208 [16:33<17:45,  1.70s/it, loss=0.26, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.27e-5, train/loss_step=0.00215, global_step=2863.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  48%|████▊     | 583/1208 [16:33<17:45,  1.70s/it, loss=0.257, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000524, train/loss_step=0.156, global_step=2863.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  48%|████▊     | 584/1208 [16:37<17:45,  1.71s/it, loss=0.257, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000524, train/loss_step=0.156, global_step=2863.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  48%|████▊     | 584/1208 [16:37<17:45,  1.71s/it, loss=0.228, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.77e-5, train/loss_step=0.0128, global_step=2863.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  48%|████▊     | 585/1208 [16:38<17:42,  1.71s/it, loss=0.228, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.77e-5, train/loss_step=0.0128, global_step=2863.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  48%|████▊     | 585/1208 [16:38<17:42,  1.71s/it, loss=0.231, v_num=0, train/loss_simple_step=0.0879, train/loss_vlb_step=0.000297, train/loss_step=0.0879, global_step=2864.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  49%|████▊     | 586/1208 [16:39<17:40,  1.70s/it, loss=0.231, v_num=0, train/loss_simple_step=0.0879, train/loss_vlb_step=0.000297, train/loss_step=0.0879, global_step=2864.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  49%|████▊     | 586/1208 [16:39<17:40,  1.70s/it, loss=0.24, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00103, train/loss_step=0.247, global_step=2864.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  49%|████▊     | 587/1208 [16:40<17:38,  1.70s/it, loss=0.24, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00103, train/loss_step=0.247, global_step=2864.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  49%|████▊     | 587/1208 [16:40<17:38,  1.70s/it, loss=0.236, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00244, train/loss_step=0.389, global_step=2864.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  49%|████▊     | 588/1208 [16:43<17:38,  1.71s/it, loss=0.236, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00244, train/loss_step=0.389, global_step=2864.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  49%|████▊     | 588/1208 [16:43<17:38,  1.71s/it, loss=0.236, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.03e-5, train/loss_step=0.00174, global_step=2864.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  49%|████▉     | 589/1208 [16:44<17:35,  1.71s/it, loss=0.236, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.03e-5, train/loss_step=0.00174, global_step=2864.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  49%|████▉     | 589/1208 [16:44<17:35,  1.71s/it, loss=0.232, v_num=0, train/loss_simple_step=0.0707, train/loss_vlb_step=0.000241, train/loss_step=0.0707, global_step=2865.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  49%|████▉     | 590/1208 [16:45<17:33,  1.70s/it, loss=0.232, v_num=0, train/loss_simple_step=0.0707, train/loss_vlb_step=0.000241, train/loss_step=0.0707, global_step=2865.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  49%|████▉     | 590/1208 [16:45<17:33,  1.70s/it, loss=0.224, v_num=0, train/loss_simple_step=0.0635, train/loss_vlb_step=0.000219, train/loss_step=0.0635, global_step=2865.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  49%|████▉     | 591/1208 [16:46<17:30,  1.70s/it, loss=0.224, v_num=0, train/loss_simple_step=0.0635, train/loss_vlb_step=0.000219, train/loss_step=0.0635, global_step=2865.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  49%|████▉     | 591/1208 [16:46<17:30,  1.70s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.000146, train/loss_step=0.0394, global_step=2865.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  49%|████▉     | 592/1208 [16:49<17:30,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.000146, train/loss_step=0.0394, global_step=2865.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  49%|████▉     | 592/1208 [16:49<17:30,  1.71s/it, loss=0.202, v_num=0, train/loss_simple_step=0.497, train/loss_vlb_step=0.0055, train/loss_step=0.497, global_step=2865.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  49%|████▉     | 593/1208 [16:50<17:28,  1.70s/it, loss=0.202, v_num=0, train/loss_simple_step=0.497, train/loss_vlb_step=0.0055, train/loss_step=0.497, global_step=2865.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  49%|████▉     | 593/1208 [16:50<17:28,  1.70s/it, loss=0.207, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000427, train/loss_step=0.129, global_step=2866.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  49%|████▉     | 594/1208 [16:51<17:26,  1.70s/it, loss=0.207, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000427, train/loss_step=0.129, global_step=2866.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  49%|████▉     | 594/1208 [16:51<17:26,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00327, train/loss_vlb_step=1.79e-5, train/loss_step=0.00327, global_step=2866.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  49%|████▉     | 595/1208 [16:53<17:23,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00327, train/loss_vlb_step=1.79e-5, train/loss_step=0.00327, global_step=2866.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  49%|████▉     | 595/1208 [16:53<17:23,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.68e-5, train/loss_step=0.0183, global_step=2866.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  49%|████▉     | 596/1208 [16:56<17:23,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.68e-5, train/loss_step=0.0183, global_step=2866.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  49%|████▉     | 596/1208 [16:56<17:23,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=2.24e-5, train/loss_step=0.00407, global_step=2866.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  49%|████▉     | 597/1208 [16:57<17:21,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=2.24e-5, train/loss_step=0.00407, global_step=2866.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  49%|████▉     | 597/1208 [16:57<17:21,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000598, train/loss_step=0.175, global_step=2867.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  50%|████▉     | 598/1208 [16:58<17:18,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000598, train/loss_step=0.175, global_step=2867.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  50%|████▉     | 598/1208 [16:58<17:18,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000644, train/loss_step=0.179, global_step=2867.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  50%|████▉     | 599/1208 [16:59<17:16,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000644, train/loss_step=0.179, global_step=2867.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  50%|████▉     | 599/1208 [16:59<17:16,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=2867.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  50%|████▉     | 600/1208 [17:02<17:16,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=2867.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  50%|████▉     | 600/1208 [17:02<17:16,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00189, train/loss_step=0.338, global_step=2867.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] 
+
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][ADDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.76it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.75it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.75it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.76it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.76it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.78it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.77it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.75it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 9:  50%|████▉     | 601/1208 [17:33<17:43,  1.75s/it, loss=0.158, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00189, train/loss_step=0.338, global_step=2867.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  50%|████▉     | 601/1208 [17:33<17:43,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00126, train/loss_step=0.303, global_step=2868.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  50%|████▉     | 602/1208 [17:34<17:41,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00126, train/loss_step=0.303, global_step=2868.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  50%|████▉     | 602/1208 [17:34<17:41,  1.75s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0902, train/loss_vlb_step=0.000299, train/loss_step=0.0902, global_step=2868.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  50%|████▉     | 603/1208 [17:35<17:38,  1.75s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0902, train/loss_vlb_step=0.000299, train/loss_step=0.0902, global_step=2868.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  50%|████▉     | 603/1208 [17:35<17:38,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.58e-5, train/loss_step=0.0028, global_step=2868.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  50%|█████     | 604/1208 [17:38<17:38,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.58e-5, train/loss_step=0.0028, global_step=2868.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  50%|█████     | 604/1208 [17:38<17:38,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.501, train/loss_vlb_step=0.00652, train/loss_step=0.501, global_step=2868.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  50%|█████     | 605/1208 [17:39<17:36,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.501, train/loss_vlb_step=0.00652, train/loss_step=0.501, global_step=2868.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  50%|█████     | 605/1208 [17:39<17:36,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000268, train/loss_step=0.0815, global_step=2869.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  50%|█████     | 606/1208 [17:40<17:33,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000268, train/loss_step=0.0815, global_step=2869.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  50%|█████     | 606/1208 [17:40<17:33,  1.75s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0953, train/loss_vlb_step=0.000314, train/loss_step=0.0953, global_step=2869.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  50%|█████     | 607/1208 [17:41<17:31,  1.75s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0953, train/loss_vlb_step=0.000314, train/loss_step=0.0953, global_step=2869.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  50%|█████     | 607/1208 [17:41<17:31,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.000226, train/loss_step=0.0672, global_step=2869.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  50%|█████     | 608/1208 [17:44<17:30,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.000226, train/loss_step=0.0672, global_step=2869.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  50%|█████     | 608/1208 [17:44<17:30,  1.75s/it, loss=0.144, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000393, train/loss_step=0.119, global_step=2869.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  50%|█████     | 609/1208 [17:45<17:28,  1.75s/it, loss=0.144, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000393, train/loss_step=0.119, global_step=2869.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  50%|█████     | 609/1208 [17:45<17:28,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00584, train/loss_vlb_step=3.1e-5, train/loss_step=0.00584, global_step=2870.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  50%|█████     | 610/1208 [17:47<17:26,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00584, train/loss_vlb_step=3.1e-5, train/loss_step=0.00584, global_step=2870.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  50%|█████     | 610/1208 [17:47<17:26,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00132, train/loss_step=0.274, global_step=2870.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  51%|█████     | 611/1208 [17:48<17:23,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00132, train/loss_step=0.274, global_step=2870.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  51%|█████     | 611/1208 [17:48<17:23,  1.75s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0622, train/loss_vlb_step=0.000215, train/loss_step=0.0622, global_step=2870.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  51%|█████     | 612/1208 [17:51<17:23,  1.75s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0622, train/loss_vlb_step=0.000215, train/loss_step=0.0622, global_step=2870.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  51%|█████     | 612/1208 [17:51<17:23,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=8.88e-5, train/loss_step=0.0225, global_step=2870.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  51%|█████     | 613/1208 [17:52<17:20,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=8.88e-5, train/loss_step=0.0225, global_step=2870.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  51%|█████     | 613/1208 [17:52<17:20,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00165, train/loss_step=0.279, global_step=2871.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  51%|█████     | 614/1208 [17:53<17:18,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00165, train/loss_step=0.279, global_step=2871.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  51%|█████     | 614/1208 [17:53<17:18,  1.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00126, train/loss_step=0.272, global_step=2871.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  51%|█████     | 615/1208 [17:54<17:16,  1.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00126, train/loss_step=0.272, global_step=2871.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  51%|█████     | 615/1208 [17:54<17:16,  1.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000148, train/loss_step=0.0402, global_step=2871.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  51%|█████     | 616/1208 [17:57<17:15,  1.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000148, train/loss_step=0.0402, global_step=2871.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  51%|█████     | 616/1208 [17:57<17:15,  1.75s/it, loss=0.172, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00275, train/loss_step=0.412, global_step=2871.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  51%|█████     | 617/1208 [17:58<17:13,  1.75s/it, loss=0.172, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00275, train/loss_step=0.412, global_step=2871.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  51%|█████     | 617/1208 [17:58<17:13,  1.75s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.5e-5, train/loss_step=0.0126, global_step=2872.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  51%|█████     | 618/1208 [17:59<17:10,  1.75s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.5e-5, train/loss_step=0.0126, global_step=2872.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  51%|█████     | 618/1208 [17:59<17:10,  1.75s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0705, train/loss_vlb_step=0.000236, train/loss_step=0.0705, global_step=2872.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  51%|█████     | 619/1208 [18:00<17:08,  1.75s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0705, train/loss_vlb_step=0.000236, train/loss_step=0.0705, global_step=2872.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  51%|█████     | 619/1208 [18:00<17:08,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000107, train/loss_step=0.0272, global_step=2872.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  51%|█████▏    | 620/1208 [18:04<17:08,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000107, train/loss_step=0.0272, global_step=2872.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  51%|█████▏    | 620/1208 [18:04<17:08,  1.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00131, train/loss_step=0.264, global_step=2872.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  51%|█████▏    | 621/1208 [18:05<17:05,  1.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00131, train/loss_step=0.264, global_step=2872.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  51%|█████▏    | 621/1208 [18:05<17:05,  1.75s/it, loss=0.157, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.003, train/loss_step=0.435, global_step=2873.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  51%|█████▏    | 622/1208 [18:06<17:03,  1.75s/it, loss=0.157, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.003, train/loss_step=0.435, global_step=2873.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  51%|█████▏    | 622/1208 [18:06<17:03,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.62e-5, train/loss_step=0.00291, global_step=2873.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  52%|█████▏    | 623/1208 [18:07<17:00,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.62e-5, train/loss_step=0.00291, global_step=2873.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  52%|█████▏    | 623/1208 [18:07<17:00,  1.75s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.74e-5, train/loss_step=0.0101, global_step=2873.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  52%|█████▏    | 624/1208 [18:10<17:00,  1.75s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.74e-5, train/loss_step=0.0101, global_step=2873.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  52%|█████▏    | 624/1208 [18:10<17:00,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.24e-5, train/loss_step=0.0194, global_step=2873.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  52%|█████▏    | 625/1208 [18:11<16:58,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.24e-5, train/loss_step=0.0194, global_step=2873.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  52%|█████▏    | 625/1208 [18:11<16:58,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00193, train/loss_step=0.326, global_step=2874.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  52%|█████▏    | 626/1208 [18:12<16:55,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00193, train/loss_step=0.326, global_step=2874.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  52%|█████▏    | 626/1208 [18:12<16:55,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000152, train/loss_step=0.0406, global_step=2874.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  52%|█████▏    | 627/1208 [18:13<16:53,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000152, train/loss_step=0.0406, global_step=2874.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  52%|█████▏    | 627/1208 [18:13<16:53,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=9.38e-6, train/loss_step=0.00154, global_step=2874.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  52%|█████▏    | 628/1208 [18:16<16:53,  1.75s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=9.38e-6, train/loss_step=0.00154, global_step=2874.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  52%|█████▏    | 628/1208 [18:16<16:53,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000454, train/loss_step=0.137, global_step=2874.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  52%|█████▏    | 629/1208 [18:18<16:50,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000454, train/loss_step=0.137, global_step=2874.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  52%|█████▏    | 629/1208 [18:18<16:50,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00553, train/loss_vlb_step=2.8e-5, train/loss_step=0.00553, global_step=2875.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  52%|█████▏    | 630/1208 [18:19<16:48,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00553, train/loss_vlb_step=2.8e-5, train/loss_step=0.00553, global_step=2875.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  52%|█████▏    | 630/1208 [18:19<16:48,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0084, train/loss_vlb_step=4e-5, train/loss_step=0.0084, global_step=2875.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  52%|█████▏    | 631/1208 [18:20<16:46,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0084, train/loss_vlb_step=4e-5, train/loss_step=0.0084, global_step=2875.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  52%|█████▏    | 631/1208 [18:20<16:46,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0699, train/loss_vlb_step=0.00024, train/loss_step=0.0699, global_step=2875.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  52%|█████▏    | 632/1208 [18:23<16:45,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0699, train/loss_vlb_step=0.00024, train/loss_step=0.0699, global_step=2875.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  52%|█████▏    | 632/1208 [18:23<16:45,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.12e-5, train/loss_step=0.0136, global_step=2875.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  52%|█████▏    | 633/1208 [18:24<16:43,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.12e-5, train/loss_step=0.0136, global_step=2875.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  52%|█████▏    | 633/1208 [18:24<16:43,  1.74s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.00014, train/loss_step=0.0376, global_step=2876.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  52%|█████▏    | 634/1208 [18:25<16:40,  1.74s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.00014, train/loss_step=0.0376, global_step=2876.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  52%|█████▏    | 634/1208 [18:25<16:40,  1.74s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.0575, train/loss_vlb_step=0.000204, train/loss_step=0.0575, global_step=2876.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  53%|█████▎    | 635/1208 [18:26<16:38,  1.74s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.0575, train/loss_vlb_step=0.000204, train/loss_step=0.0575, global_step=2876.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  53%|█████▎    | 635/1208 [18:26<16:38,  1.74s/it, loss=0.098, v_num=0, train/loss_simple_step=0.00939, train/loss_vlb_step=4.55e-5, train/loss_step=0.00939, global_step=2876.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  53%|█████▎    | 636/1208 [18:29<16:38,  1.75s/it, loss=0.098, v_num=0, train/loss_simple_step=0.00939, train/loss_vlb_step=4.55e-5, train/loss_step=0.00939, global_step=2876.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  53%|█████▎    | 636/1208 [18:29<16:38,  1.75s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00234, train/loss_step=0.381, global_step=2876.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  53%|█████▎    | 637/1208 [18:30<16:35,  1.74s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00234, train/loss_step=0.381, global_step=2876.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  53%|█████▎    | 637/1208 [18:30<16:35,  1.74s/it, loss=0.104, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000569, train/loss_step=0.167, global_step=2877.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  53%|█████▎    | 638/1208 [18:31<16:33,  1.74s/it, loss=0.104, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000569, train/loss_step=0.167, global_step=2877.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  53%|█████▎    | 638/1208 [18:31<16:33,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=2877.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  53%|█████▎    | 639/1208 [18:33<16:31,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=2877.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  53%|█████▎    | 639/1208 [18:33<16:31,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000462, train/loss_step=0.138, global_step=2877.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  53%|█████▎    | 640/1208 [18:36<16:30,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000462, train/loss_step=0.138, global_step=2877.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  53%|█████▎    | 640/1208 [18:36<16:30,  1.74s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000105, train/loss_step=0.0264, global_step=2877.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  53%|█████▎    | 641/1208 [18:37<16:28,  1.74s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000105, train/loss_step=0.0264, global_step=2877.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  53%|█████▎    | 641/1208 [18:37<16:28,  1.74s/it, loss=0.0782, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.64e-5, train/loss_step=0.0103, global_step=2878.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  53%|█████▎    | 642/1208 [18:38<16:25,  1.74s/it, loss=0.0782, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.64e-5, train/loss_step=0.0103, global_step=2878.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  53%|█████▎    | 642/1208 [18:38<16:25,  1.74s/it, loss=0.0782, v_num=0, train/loss_simple_step=0.00329, train/loss_vlb_step=1.85e-5, train/loss_step=0.00329, global_step=2878.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  53%|█████▎    | 643/1208 [18:39<16:23,  1.74s/it, loss=0.0782, v_num=0, train/loss_simple_step=0.00329, train/loss_vlb_step=1.85e-5, train/loss_step=0.00329, global_step=2878.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  53%|█████▎    | 643/1208 [18:39<16:23,  1.74s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00205, train/loss_step=0.374, global_step=2878.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  53%|█████▎    | 644/1208 [18:42<16:23,  1.74s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00205, train/loss_step=0.374, global_step=2878.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  53%|█████▎    | 644/1208 [18:42<16:23,  1.74s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.0343, train/loss_vlb_step=0.000134, train/loss_step=0.0343, global_step=2878.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  53%|█████▎    | 645/1208 [18:43<16:20,  1.74s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.0343, train/loss_vlb_step=0.000134, train/loss_step=0.0343, global_step=2878.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  53%|█████▎    | 645/1208 [18:43<16:20,  1.74s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.0881, train/loss_vlb_step=0.000294, train/loss_step=0.0881, global_step=2879.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  53%|█████▎    | 646/1208 [18:44<16:18,  1.74s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.0881, train/loss_vlb_step=0.000294, train/loss_step=0.0881, global_step=2879.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  53%|█████▎    | 646/1208 [18:44<16:18,  1.74s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.00035, train/loss_step=0.107, global_step=2879.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  54%|█████▎    | 647/1208 [18:45<16:16,  1.74s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.00035, train/loss_step=0.107, global_step=2879.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  54%|█████▎    | 647/1208 [18:45<16:16,  1.74s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000415, train/loss_step=0.126, global_step=2879.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  54%|█████▎    | 648/1208 [18:49<16:15,  1.74s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000415, train/loss_step=0.126, global_step=2879.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  54%|█████▎    | 648/1208 [18:49<16:15,  1.74s/it, loss=0.101, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00108, train/loss_step=0.252, global_step=2879.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  54%|█████▎    | 649/1208 [18:50<16:13,  1.74s/it, loss=0.101, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00108, train/loss_step=0.252, global_step=2879.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  54%|█████▎    | 649/1208 [18:50<16:13,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000157, train/loss_step=0.0438, global_step=2880.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  54%|█████▍    | 650/1208 [18:51<16:11,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000157, train/loss_step=0.0438, global_step=2880.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  54%|█████▍    | 650/1208 [18:51<16:11,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.092, train/loss_vlb_step=0.000303, train/loss_step=0.092, global_step=2880.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  54%|█████▍    | 651/1208 [18:52<16:08,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.092, train/loss_vlb_step=0.000303, train/loss_step=0.092, global_step=2880.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  54%|█████▍    | 651/1208 [18:52<16:08,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.583, train/loss_vlb_step=0.00929, train/loss_step=0.583, global_step=2880.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  54%|█████▍    | 652/1208 [18:55<16:08,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.583, train/loss_vlb_step=0.00929, train/loss_step=0.583, global_step=2880.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  54%|█████▍    | 652/1208 [18:55<16:08,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.06e-5, train/loss_step=0.00178, global_step=2880.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  54%|█████▍    | 653/1208 [18:56<16:05,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.06e-5, train/loss_step=0.00178, global_step=2880.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  54%|█████▍    | 653/1208 [18:56<16:05,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=8.17e-5, train/loss_step=0.0189, global_step=2881.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  54%|█████▍    | 654/1208 [18:57<16:03,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=8.17e-5, train/loss_step=0.0189, global_step=2881.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  54%|█████▍    | 654/1208 [18:57<16:03,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000784, train/loss_step=0.210, global_step=2881.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  54%|█████▍    | 655/1208 [18:58<16:01,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000784, train/loss_step=0.210, global_step=2881.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  54%|█████▍    | 655/1208 [18:58<16:01,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000335, train/loss_step=0.101, global_step=2881.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  54%|█████▍    | 656/1208 [19:01<16:00,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000335, train/loss_step=0.101, global_step=2881.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  54%|█████▍    | 656/1208 [19:01<16:00,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000998, train/loss_step=0.246, global_step=2881.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  54%|█████▍    | 657/1208 [19:02<15:58,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000998, train/loss_step=0.246, global_step=2881.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  54%|█████▍    | 657/1208 [19:02<15:58,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.76e-5, train/loss_step=0.0155, global_step=2882.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  54%|█████▍    | 658/1208 [19:03<15:56,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.76e-5, train/loss_step=0.0155, global_step=2882.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  54%|█████▍    | 658/1208 [19:03<15:56,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0687, train/loss_vlb_step=0.000228, train/loss_step=0.0687, global_step=2882.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  55%|█████▍    | 659/1208 [19:04<15:53,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0687, train/loss_vlb_step=0.000228, train/loss_step=0.0687, global_step=2882.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  55%|█████▍    | 659/1208 [19:04<15:53,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.072, train/loss_vlb_step=0.000247, train/loss_step=0.072, global_step=2882.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  55%|█████▍    | 660/1208 [19:08<15:53,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.072, train/loss_vlb_step=0.000247, train/loss_step=0.072, global_step=2882.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  55%|█████▍    | 660/1208 [19:08<15:53,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000585, train/loss_step=0.174, global_step=2882.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  55%|█████▍    | 661/1208 [19:09<15:51,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000585, train/loss_step=0.174, global_step=2882.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  55%|█████▍    | 661/1208 [19:09<15:51,  1.74s/it, loss=0.151, v_num=0, train/loss_simple_step=0.416, train/loss_vlb_step=0.00576, train/loss_step=0.416, global_step=2883.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  55%|█████▍    | 662/1208 [19:10<15:48,  1.74s/it, loss=0.151, v_num=0, train/loss_simple_step=0.416, train/loss_vlb_step=0.00576, train/loss_step=0.416, global_step=2883.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  55%|█████▍    | 662/1208 [19:10<15:48,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000147, train/loss_step=0.0392, global_step=2883.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  55%|█████▍    | 663/1208 [19:11<15:46,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000147, train/loss_step=0.0392, global_step=2883.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  55%|█████▍    | 663/1208 [19:11<15:46,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000482, train/loss_step=0.145, global_step=2883.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  55%|█████▍    | 664/1208 [19:14<15:45,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000482, train/loss_step=0.145, global_step=2883.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  55%|█████▍    | 664/1208 [19:14<15:45,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.5e-5, train/loss_step=0.0174, global_step=2883.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  55%|█████▌    | 665/1208 [19:15<15:43,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.5e-5, train/loss_step=0.0174, global_step=2883.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  55%|█████▌    | 665/1208 [19:15<15:43,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.14e-5, train/loss_step=0.0108, global_step=2884.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  55%|█████▌    | 666/1208 [19:16<15:41,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.14e-5, train/loss_step=0.0108, global_step=2884.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  55%|█████▌    | 666/1208 [19:16<15:41,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000872, train/loss_step=0.221, global_step=2884.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  55%|█████▌    | 667/1208 [19:17<15:39,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000872, train/loss_step=0.221, global_step=2884.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  55%|█████▌    | 667/1208 [19:17<15:39,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.94e-5, train/loss_step=0.0106, global_step=2884.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  55%|█████▌    | 668/1208 [19:21<15:38,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.94e-5, train/loss_step=0.0106, global_step=2884.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  55%|█████▌    | 668/1208 [19:21<15:38,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.72e-5, train/loss_step=0.0201, global_step=2884.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  55%|█████▌    | 669/1208 [19:22<15:36,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.72e-5, train/loss_step=0.0201, global_step=2884.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  55%|█████▌    | 669/1208 [19:22<15:36,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.00049, train/loss_step=0.147, global_step=2885.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  55%|█████▌    | 670/1208 [19:23<15:33,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.00049, train/loss_step=0.147, global_step=2885.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  55%|█████▌    | 670/1208 [19:23<15:33,  1.74s/it, loss=0.149, v_num=0, train/loss_simple_step=0.466, train/loss_vlb_step=0.00357, train/loss_step=0.466, global_step=2885.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  56%|█████▌    | 671/1208 [19:24<15:31,  1.74s/it, loss=0.149, v_num=0, train/loss_simple_step=0.466, train/loss_vlb_step=0.00357, train/loss_step=0.466, global_step=2885.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  56%|█████▌    | 671/1208 [19:24<15:31,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.053, train/loss_vlb_step=0.000193, train/loss_step=0.053, global_step=2885.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  56%|█████▌    | 672/1208 [19:27<15:31,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.053, train/loss_vlb_step=0.000193, train/loss_step=0.053, global_step=2885.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  56%|█████▌    | 672/1208 [19:27<15:31,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0534, train/loss_vlb_step=0.000192, train/loss_step=0.0534, global_step=2885.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  56%|█████▌    | 673/1208 [19:28<15:28,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0534, train/loss_vlb_step=0.000192, train/loss_step=0.0534, global_step=2885.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  56%|█████▌    | 673/1208 [19:28<15:28,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.55e-5, train/loss_step=0.015, global_step=2886.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  56%|█████▌    | 674/1208 [19:29<15:26,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.55e-5, train/loss_step=0.015, global_step=2886.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  56%|█████▌    | 674/1208 [19:29<15:26,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00306, train/loss_vlb_step=1.71e-5, train/loss_step=0.00306, global_step=2886.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  56%|█████▌    | 675/1208 [19:30<15:24,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00306, train/loss_vlb_step=1.71e-5, train/loss_step=0.00306, global_step=2886.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  56%|█████▌    | 675/1208 [19:30<15:24,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0548, train/loss_vlb_step=0.000192, train/loss_step=0.0548, global_step=2886.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  56%|█████▌    | 676/1208 [19:33<15:23,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0548, train/loss_vlb_step=0.000192, train/loss_step=0.0548, global_step=2886.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  56%|█████▌    | 676/1208 [19:33<15:23,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.00087, train/loss_step=0.233, global_step=2886.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  56%|█████▌    | 677/1208 [19:34<15:21,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.00087, train/loss_step=0.233, global_step=2886.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  56%|█████▌    | 677/1208 [19:34<15:21,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.15e-5, train/loss_step=0.014, global_step=2887.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  56%|█████▌    | 678/1208 [19:35<15:19,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.15e-5, train/loss_step=0.014, global_step=2887.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  56%|█████▌    | 678/1208 [19:35<15:19,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00813, train/loss_vlb_step=3.91e-5, train/loss_step=0.00813, global_step=2887.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  56%|█████▌    | 679/1208 [19:37<15:17,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00813, train/loss_vlb_step=3.91e-5, train/loss_step=0.00813, global_step=2887.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  56%|█████▌    | 679/1208 [19:37<15:17,  1.73s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00376, train/loss_vlb_step=2.02e-5, train/loss_step=0.00376, global_step=2887.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  56%|█████▋    | 680/1208 [19:40<15:16,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00376, train/loss_vlb_step=2.02e-5, train/loss_step=0.00376, global_step=2887.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  56%|█████▋    | 680/1208 [19:40<15:16,  1.74s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.59e-5, train/loss_step=0.00273, global_step=2887.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  56%|█████▋    | 681/1208 [19:41<15:14,  1.73s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.59e-5, train/loss_step=0.00273, global_step=2887.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  56%|█████▋    | 681/1208 [19:41<15:14,  1.73s/it, loss=0.0791, v_num=0, train/loss_simple_step=0.0627, train/loss_vlb_step=0.00022, train/loss_step=0.0627, global_step=2888.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  56%|█████▋    | 682/1208 [19:42<15:11,  1.73s/it, loss=0.0791, v_num=0, train/loss_simple_step=0.0627, train/loss_vlb_step=0.00022, train/loss_step=0.0627, global_step=2888.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  56%|█████▋    | 682/1208 [19:42<15:11,  1.73s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000757, train/loss_step=0.201, global_step=2888.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  57%|█████▋    | 683/1208 [19:43<15:09,  1.73s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000757, train/loss_step=0.201, global_step=2888.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  57%|█████▋    | 683/1208 [19:43<15:09,  1.73s/it, loss=0.0801, v_num=0, train/loss_simple_step=0.00473, train/loss_vlb_step=2.55e-5, train/loss_step=0.00473, global_step=2888.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  57%|█████▋    | 684/1208 [19:46<15:09,  1.73s/it, loss=0.0801, v_num=0, train/loss_simple_step=0.00473, train/loss_vlb_step=2.55e-5, train/loss_step=0.00473, global_step=2888.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  57%|█████▋    | 684/1208 [19:46<15:09,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.655, train/loss_vlb_step=0.0142, train/loss_step=0.655, global_step=2888.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]      Epoch 9:  57%|█████▋    | 685/1208 [19:47<15:06,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.655, train/loss_vlb_step=0.0142, train/loss_step=0.655, global_step=2888.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  57%|█████▋    | 685/1208 [19:47<15:06,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000919, train/loss_step=0.245, global_step=2889.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  57%|█████▋    | 686/1208 [19:48<15:04,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000919, train/loss_step=0.245, global_step=2889.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  57%|█████▋    | 686/1208 [19:48<15:04,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00217, train/loss_step=0.364, global_step=2889.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  57%|█████▋    | 687/1208 [19:49<15:02,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00217, train/loss_step=0.364, global_step=2889.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  57%|█████▋    | 687/1208 [19:49<15:02,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.77e-5, train/loss_step=0.0133, global_step=2889.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  57%|█████▋    | 688/1208 [19:53<15:01,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.77e-5, train/loss_step=0.0133, global_step=2889.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  57%|█████▋    | 688/1208 [19:53<15:01,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0896, train/loss_vlb_step=0.000301, train/loss_step=0.0896, global_step=2889.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  57%|█████▋    | 689/1208 [19:54<14:59,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0896, train/loss_vlb_step=0.000301, train/loss_step=0.0896, global_step=2889.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  57%|█████▋    | 689/1208 [19:54<14:59,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00182, train/loss_step=0.300, global_step=2890.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  57%|█████▋    | 690/1208 [19:55<14:57,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00182, train/loss_step=0.300, global_step=2890.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  57%|█████▋    | 690/1208 [19:55<14:57,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00816, train/loss_step=0.499, global_step=2890.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  57%|█████▋    | 691/1208 [19:56<14:54,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00816, train/loss_step=0.499, global_step=2890.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  57%|█████▋    | 691/1208 [19:56<14:54,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000855, train/loss_step=0.221, global_step=2890.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  57%|█████▋    | 692/1208 [19:59<14:54,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000855, train/loss_step=0.221, global_step=2890.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  57%|█████▋    | 692/1208 [19:59<14:54,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.9e-5, train/loss_step=0.0101, global_step=2890.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  57%|█████▋    | 693/1208 [20:00<14:52,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.9e-5, train/loss_step=0.0101, global_step=2890.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  57%|█████▋    | 693/1208 [20:00<14:52,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=3.3e-5, train/loss_step=0.00611, global_step=2891.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  57%|█████▋    | 694/1208 [20:01<14:49,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=3.3e-5, train/loss_step=0.00611, global_step=2891.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  57%|█████▋    | 694/1208 [20:01<14:49,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.000141, train/loss_step=0.0356, global_step=2891.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  58%|█████▊    | 695/1208 [20:02<14:47,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.000141, train/loss_step=0.0356, global_step=2891.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  58%|█████▊    | 695/1208 [20:02<14:47,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000313, train/loss_step=0.095, global_step=2891.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  58%|█████▊    | 696/1208 [20:05<14:47,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000313, train/loss_step=0.095, global_step=2891.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  58%|█████▊    | 696/1208 [20:05<14:47,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0375, train/loss_vlb_step=0.00015, train/loss_step=0.0375, global_step=2891.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  58%|█████▊    | 697/1208 [20:06<14:44,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0375, train/loss_vlb_step=0.00015, train/loss_step=0.0375, global_step=2891.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  58%|█████▊    | 697/1208 [20:06<14:44,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00354, train/loss_step=0.418, global_step=2892.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  58%|█████▊    | 698/1208 [20:07<14:42,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00354, train/loss_step=0.418, global_step=2892.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  58%|█████▊    | 698/1208 [20:07<14:42,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000152, train/loss_step=0.0415, global_step=2892.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  58%|█████▊    | 699/1208 [20:08<14:40,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000152, train/loss_step=0.0415, global_step=2892.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  58%|█████▊    | 699/1208 [20:08<14:40,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000163, train/loss_step=0.0463, global_step=2892.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  58%|█████▊    | 700/1208 [20:12<14:39,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000163, train/loss_step=0.0463, global_step=2892.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  58%|█████▊    | 700/1208 [20:12<14:39,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=1.9e-5, train/loss_step=0.00345, global_step=2892.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  58%|█████▊    | 701/1208 [20:13<14:37,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=1.9e-5, train/loss_step=0.00345, global_step=2892.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  58%|█████▊    | 701/1208 [20:13<14:37,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000283, train/loss_step=0.086, global_step=2893.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  58%|█████▊    | 702/1208 [20:14<14:35,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000283, train/loss_step=0.086, global_step=2893.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  58%|█████▊    | 702/1208 [20:14<14:35,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.000147, train/loss_step=0.038, global_step=2893.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  58%|█████▊    | 703/1208 [20:15<14:33,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.000147, train/loss_step=0.038, global_step=2893.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  58%|█████▊    | 703/1208 [20:15<14:33,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.0001, train/loss_step=0.0267, global_step=2893.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  58%|█████▊    | 704/1208 [20:18<14:32,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.0001, train/loss_step=0.0267, global_step=2893.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  58%|█████▊    | 704/1208 [20:18<14:32,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=2.28e-5, train/loss_step=0.00416, global_step=2893.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  58%|█████▊    | 705/1208 [20:19<14:30,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=2.28e-5, train/loss_step=0.00416, global_step=2893.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  58%|█████▊    | 705/1208 [20:19<14:30,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000441, train/loss_step=0.133, global_step=2894.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  58%|█████▊    | 706/1208 [20:20<14:27,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000441, train/loss_step=0.133, global_step=2894.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  58%|█████▊    | 706/1208 [20:20<14:27,  1.73s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.85e-5, train/loss_step=0.00335, global_step=2894.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  59%|█████▊    | 707/1208 [20:21<14:25,  1.73s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.85e-5, train/loss_step=0.00335, global_step=2894.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  59%|█████▊    | 707/1208 [20:21<14:25,  1.73s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.69e-5, train/loss_step=0.0128, global_step=2894.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  59%|█████▊    | 708/1208 [20:24<14:25,  1.73s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.69e-5, train/loss_step=0.0128, global_step=2894.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  59%|█████▊    | 708/1208 [20:25<14:25,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00597, train/loss_vlb_step=2.97e-5, train/loss_step=0.00597, global_step=2894.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  59%|█████▊    | 709/1208 [20:26<14:22,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00597, train/loss_vlb_step=2.97e-5, train/loss_step=0.00597, global_step=2894.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  59%|█████▊    | 709/1208 [20:26<14:22,  1.73s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000485, train/loss_step=0.147, global_step=2895.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  59%|█████▉    | 710/1208 [20:27<14:20,  1.73s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000485, train/loss_step=0.147, global_step=2895.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  59%|█████▉    | 710/1208 [20:27<14:20,  1.73s/it, loss=0.0692, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.93e-5, train/loss_step=0.0134, global_step=2895.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  59%|█████▉    | 711/1208 [20:28<14:18,  1.73s/it, loss=0.0692, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.93e-5, train/loss_step=0.0134, global_step=2895.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  59%|█████▉    | 711/1208 [20:28<14:18,  1.73s/it, loss=0.0666, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000582, train/loss_step=0.169, global_step=2895.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  59%|█████▉    | 712/1208 [20:31<14:17,  1.73s/it, loss=0.0666, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000582, train/loss_step=0.169, global_step=2895.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  59%|█████▉    | 712/1208 [20:31<14:17,  1.73s/it, loss=0.0718, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000379, train/loss_step=0.112, global_step=2895.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  59%|█████▉    | 713/1208 [20:32<14:15,  1.73s/it, loss=0.0718, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000379, train/loss_step=0.112, global_step=2895.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  59%|█████▉    | 713/1208 [20:32<14:15,  1.73s/it, loss=0.0789, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000498, train/loss_step=0.149, global_step=2896.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  59%|█████▉    | 714/1208 [20:33<14:13,  1.73s/it, loss=0.0789, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000498, train/loss_step=0.149, global_step=2896.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  59%|█████▉    | 714/1208 [20:33<14:13,  1.73s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000431, train/loss_step=0.131, global_step=2896.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  59%|█████▉    | 715/1208 [20:34<14:11,  1.73s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000431, train/loss_step=0.131, global_step=2896.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  59%|█████▉    | 715/1208 [20:34<14:11,  1.73s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00327, train/loss_step=0.415, global_step=2896.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  59%|█████▉    | 716/1208 [20:37<14:10,  1.73s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00327, train/loss_step=0.415, global_step=2896.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  59%|█████▉    | 716/1208 [20:37<14:10,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.002, train/loss_step=0.348, global_step=2896.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  59%|█████▉    | 717/1208 [20:38<14:08,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.002, train/loss_step=0.348, global_step=2896.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  59%|█████▉    | 717/1208 [20:38<14:08,  1.73s/it, loss=0.104, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000713, train/loss_step=0.194, global_step=2897.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  59%|█████▉    | 718/1208 [20:39<14:06,  1.73s/it, loss=0.104, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000713, train/loss_step=0.194, global_step=2897.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  59%|█████▉    | 718/1208 [20:39<14:06,  1.73s/it, loss=0.102, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.07e-5, train/loss_step=0.011, global_step=2897.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  60%|█████▉    | 719/1208 [20:40<14:03,  1.73s/it, loss=0.102, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.07e-5, train/loss_step=0.011, global_step=2897.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  60%|█████▉    | 719/1208 [20:40<14:03,  1.73s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.21e-5, train/loss_step=0.00211, global_step=2897.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  60%|█████▉    | 720/1208 [20:44<14:03,  1.73s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.21e-5, train/loss_step=0.00211, global_step=2897.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  60%|█████▉    | 720/1208 [20:44<14:03,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00854, train/loss_vlb_step=4.15e-5, train/loss_step=0.00854, global_step=2897.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  60%|█████▉    | 721/1208 [20:45<14:01,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00854, train/loss_vlb_step=4.15e-5, train/loss_step=0.00854, global_step=2897.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  60%|█████▉    | 721/1208 [20:45<14:01,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0977, train/loss_vlb_step=0.000323, train/loss_step=0.0977, global_step=2898.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  60%|█████▉    | 722/1208 [20:46<13:58,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0977, train/loss_vlb_step=0.000323, train/loss_step=0.0977, global_step=2898.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  60%|█████▉    | 722/1208 [20:46<13:58,  1.73s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.00483, train/loss_vlb_step=2.5e-5, train/loss_step=0.00483, global_step=2898.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  60%|█████▉    | 723/1208 [20:47<13:56,  1.73s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.00483, train/loss_vlb_step=2.5e-5, train/loss_step=0.00483, global_step=2898.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  60%|█████▉    | 723/1208 [20:47<13:56,  1.73s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.00665, train/loss_vlb_step=3.33e-5, train/loss_step=0.00665, global_step=2898.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  60%|█████▉    | 724/1208 [20:50<13:56,  1.73s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.00665, train/loss_vlb_step=3.33e-5, train/loss_step=0.00665, global_step=2898.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  60%|█████▉    | 724/1208 [20:50<13:56,  1.73s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.75e-5, train/loss_step=0.0126, global_step=2898.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  60%|██████    | 725/1208 [20:51<13:53,  1.73s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.75e-5, train/loss_step=0.0126, global_step=2898.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  60%|██████    | 725/1208 [20:51<13:53,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.672, train/loss_vlb_step=0.0188, train/loss_step=0.672, global_step=2899.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  60%|██████    | 726/1208 [20:52<13:51,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.672, train/loss_vlb_step=0.0188, train/loss_step=0.672, global_step=2899.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  60%|██████    | 726/1208 [20:52<13:51,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=2899.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  60%|██████    | 727/1208 [20:53<13:49,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=2899.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  60%|██████    | 727/1208 [20:53<13:49,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00358, train/loss_vlb_step=1.94e-5, train/loss_step=0.00358, global_step=2899.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  60%|██████    | 728/1208 [20:56<13:48,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00358, train/loss_vlb_step=1.94e-5, train/loss_step=0.00358, global_step=2899.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  60%|██████    | 728/1208 [20:56<13:48,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0937, train/loss_vlb_step=0.000308, train/loss_step=0.0937, global_step=2899.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  60%|██████    | 729/1208 [20:57<13:46,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0937, train/loss_vlb_step=0.000308, train/loss_step=0.0937, global_step=2899.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  60%|██████    | 729/1208 [20:57<13:46,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.94e-5, train/loss_step=0.0215, global_step=2900.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  60%|██████    | 730/1208 [20:59<13:44,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.94e-5, train/loss_step=0.0215, global_step=2900.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  60%|██████    | 730/1208 [20:59<13:44,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.000214, train/loss_step=0.0615, global_step=2900.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  61%|██████    | 731/1208 [21:00<13:42,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.000214, train/loss_step=0.0615, global_step=2900.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  61%|██████    | 731/1208 [21:00<13:42,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000133, train/loss_step=0.0367, global_step=2900.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  61%|██████    | 732/1208 [21:03<13:41,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000133, train/loss_step=0.0367, global_step=2900.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  61%|██████    | 732/1208 [21:03<13:41,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00848, train/loss_vlb_step=4.21e-5, train/loss_step=0.00848, global_step=2900.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  61%|██████    | 733/1208 [21:04<13:39,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00848, train/loss_vlb_step=4.21e-5, train/loss_step=0.00848, global_step=2900.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  61%|██████    | 733/1208 [21:04<13:39,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000829, train/loss_step=0.196, global_step=2901.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  61%|██████    | 734/1208 [21:05<13:37,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000829, train/loss_step=0.196, global_step=2901.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  61%|██████    | 734/1208 [21:05<13:37,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.509, train/loss_vlb_step=0.00582, train/loss_step=0.509, global_step=2901.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  61%|██████    | 735/1208 [21:06<13:34,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.509, train/loss_vlb_step=0.00582, train/loss_step=0.509, global_step=2901.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  61%|██████    | 735/1208 [21:06<13:34,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000753, train/loss_step=0.200, global_step=2901.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  61%|██████    | 736/1208 [21:09<13:34,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000753, train/loss_step=0.200, global_step=2901.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  61%|██████    | 736/1208 [21:09<13:34,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.16e-5, train/loss_step=0.0232, global_step=2901.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  61%|██████    | 737/1208 [21:10<13:31,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.16e-5, train/loss_step=0.0232, global_step=2901.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  61%|██████    | 737/1208 [21:10<13:31,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0793, train/loss_vlb_step=0.000269, train/loss_step=0.0793, global_step=2902.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  61%|██████    | 738/1208 [21:11<13:29,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0793, train/loss_vlb_step=0.000269, train/loss_step=0.0793, global_step=2902.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  61%|██████    | 738/1208 [21:11<13:29,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.003, train/loss_step=0.403, global_step=2902.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]     Epoch 9:  61%|██████    | 739/1208 [21:12<13:27,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.003, train/loss_step=0.403, global_step=2902.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  61%|██████    | 739/1208 [21:12<13:27,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.093, train/loss_vlb_step=0.000308, train/loss_step=0.093, global_step=2902.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  61%|██████▏   | 740/1208 [21:15<13:26,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.093, train/loss_vlb_step=0.000308, train/loss_step=0.093, global_step=2902.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  61%|██████▏   | 740/1208 [21:15<13:26,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00466, train/loss_vlb_step=2.49e-5, train/loss_step=0.00466, global_step=2902.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  61%|██████▏   | 741/1208 [21:16<13:24,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00466, train/loss_vlb_step=2.49e-5, train/loss_step=0.00466, global_step=2902.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  61%|██████▏   | 741/1208 [21:16<13:24,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.000153, train/loss_step=0.0413, global_step=2903.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  61%|██████▏   | 742/1208 [21:17<13:22,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.000153, train/loss_step=0.0413, global_step=2903.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  61%|██████▏   | 742/1208 [21:17<13:22,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=3.18e-5, train/loss_step=0.00619, global_step=2903.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  62%|██████▏   | 743/1208 [21:18<13:20,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=3.18e-5, train/loss_step=0.00619, global_step=2903.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  62%|██████▏   | 743/1208 [21:18<13:20,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000918, train/loss_step=0.244, global_step=2903.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  62%|██████▏   | 744/1208 [21:21<13:19,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000918, train/loss_step=0.244, global_step=2903.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  62%|██████▏   | 744/1208 [21:21<13:19,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00259, train/loss_step=0.396, global_step=2903.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  62%|██████▏   | 745/1208 [21:22<13:16,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00259, train/loss_step=0.396, global_step=2903.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  62%|██████▏   | 745/1208 [21:22<13:16,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=1.51e-5, train/loss_step=0.00256, global_step=2904.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  62%|██████▏   | 746/1208 [21:23<13:14,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=1.51e-5, train/loss_step=0.00256, global_step=2904.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  62%|██████▏   | 746/1208 [21:23<13:14,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000121, train/loss_step=0.0306, global_step=2904.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  62%|██████▏   | 747/1208 [21:24<13:12,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000121, train/loss_step=0.0306, global_step=2904.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  62%|██████▏   | 747/1208 [21:24<13:12,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000106, train/loss_step=0.0283, global_step=2904.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  62%|██████▏   | 748/1208 [21:27<13:11,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000106, train/loss_step=0.0283, global_step=2904.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  62%|██████▏   | 748/1208 [21:27<13:11,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0667, train/loss_vlb_step=0.000227, train/loss_step=0.0667, global_step=2904.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  62%|██████▏   | 749/1208 [21:28<13:09,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0667, train/loss_vlb_step=0.000227, train/loss_step=0.0667, global_step=2904.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  62%|██████▏   | 749/1208 [21:28<13:09,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.528, train/loss_vlb_step=0.0124, train/loss_step=0.528, global_step=2905.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  62%|██████▏   | 750/1208 [21:29<13:07,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.528, train/loss_vlb_step=0.0124, train/loss_step=0.528, global_step=2905.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  62%|██████▏   | 750/1208 [21:29<13:07,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.030, train/loss_vlb_step=0.000116, train/loss_step=0.030, global_step=2905.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  62%|██████▏   | 751/1208 [21:30<13:05,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.030, train/loss_vlb_step=0.000116, train/loss_step=0.030, global_step=2905.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  62%|██████▏   | 751/1208 [21:30<13:05,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00172, train/loss_step=0.269, global_step=2905.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  62%|██████▏   | 752/1208 [21:33<13:04,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00172, train/loss_step=0.269, global_step=2905.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  62%|██████▏   | 752/1208 [21:33<13:04,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0747, train/loss_vlb_step=0.000252, train/loss_step=0.0747, global_step=2905.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  62%|██████▏   | 753/1208 [21:34<13:01,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0747, train/loss_vlb_step=0.000252, train/loss_step=0.0747, global_step=2905.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  62%|██████▏   | 753/1208 [21:34<13:01,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=2906.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  62%|██████▏   | 754/1208 [21:35<12:59,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=2906.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  62%|██████▏   | 754/1208 [21:35<12:59,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00124, train/loss_step=0.277, global_step=2906.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  62%|██████▎   | 755/1208 [21:36<12:57,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00124, train/loss_step=0.277, global_step=2906.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  62%|██████▎   | 755/1208 [21:36<12:57,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=2.04e-5, train/loss_step=0.00359, global_step=2906.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  63%|██████▎   | 756/1208 [21:39<12:56,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=2.04e-5, train/loss_step=0.00359, global_step=2906.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  63%|██████▎   | 756/1208 [21:39<12:56,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.00488, train/loss_step=0.470, global_step=2906.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  63%|██████▎   | 757/1208 [21:40<12:54,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.00488, train/loss_step=0.470, global_step=2906.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  63%|██████▎   | 757/1208 [21:40<12:54,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00131, train/loss_step=0.288, global_step=2907.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  63%|██████▎   | 758/1208 [21:41<12:52,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00131, train/loss_step=0.288, global_step=2907.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  63%|██████▎   | 758/1208 [21:41<12:52,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.0015, train/loss_step=0.316, global_step=2907.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  63%|██████▎   | 759/1208 [21:42<12:50,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.0015, train/loss_step=0.316, global_step=2907.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  63%|██████▎   | 759/1208 [21:42<12:50,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0572, train/loss_vlb_step=0.000201, train/loss_step=0.0572, global_step=2907.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  63%|██████▎   | 760/1208 [21:44<12:49,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0572, train/loss_vlb_step=0.000201, train/loss_step=0.0572, global_step=2907.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  63%|██████▎   | 760/1208 [21:44<12:49,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.89e-5, train/loss_step=0.0033, global_step=2907.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  63%|██████▎   | 761/1208 [21:45<12:47,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.89e-5, train/loss_step=0.0033, global_step=2907.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  63%|██████▎   | 761/1208 [21:45<12:47,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00485, train/loss_vlb_step=2.65e-5, train/loss_step=0.00485, global_step=2908.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  63%|██████▎   | 762/1208 [21:46<12:44,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00485, train/loss_vlb_step=2.65e-5, train/loss_step=0.00485, global_step=2908.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  63%|██████▎   | 762/1208 [21:46<12:44,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=1.83e-5, train/loss_step=0.00326, global_step=2908.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  63%|██████▎   | 763/1208 [21:48<12:42,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=1.83e-5, train/loss_step=0.00326, global_step=2908.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  63%|██████▎   | 763/1208 [21:48<12:42,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000119, train/loss_step=0.0297, global_step=2908.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  63%|██████▎   | 764/1208 [21:50<12:41,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000119, train/loss_step=0.0297, global_step=2908.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  63%|██████▎   | 764/1208 [21:50<12:41,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.00109, train/loss_step=0.238, global_step=2908.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  63%|██████▎   | 765/1208 [21:51<12:39,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.00109, train/loss_step=0.238, global_step=2908.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  63%|██████▎   | 765/1208 [21:51<12:39,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000126, train/loss_step=0.0334, global_step=2909.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  63%|██████▎   | 766/1208 [21:52<12:37,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000126, train/loss_step=0.0334, global_step=2909.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  63%|██████▎   | 766/1208 [21:52<12:37,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00297, train/loss_step=0.414, global_step=2909.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  63%|██████▎   | 767/1208 [21:53<12:35,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00297, train/loss_step=0.414, global_step=2909.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  63%|██████▎   | 767/1208 [21:53<12:35,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=1.02e-5, train/loss_step=0.00171, global_step=2909.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  64%|██████▎   | 768/1208 [21:56<12:34,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=1.02e-5, train/loss_step=0.00171, global_step=2909.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  64%|██████▎   | 768/1208 [21:56<12:34,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.89e-5, train/loss_step=0.0202, global_step=2909.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  64%|██████▎   | 769/1208 [21:57<12:32,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.89e-5, train/loss_step=0.0202, global_step=2909.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  64%|██████▎   | 769/1208 [21:57<12:32,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.565, train/loss_vlb_step=0.00749, train/loss_step=0.565, global_step=2910.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  64%|██████▎   | 770/1208 [21:58<12:30,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.565, train/loss_vlb_step=0.00749, train/loss_step=0.565, global_step=2910.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  64%|██████▎   | 770/1208 [21:58<12:30,  1.71s/it, loss=0.175, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.0022, train/loss_step=0.319, global_step=2910.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  64%|██████▍   | 771/1208 [21:59<12:28,  1.71s/it, loss=0.175, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.0022, train/loss_step=0.319, global_step=2910.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  64%|██████▍   | 771/1208 [21:59<12:28,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.32e-5, train/loss_step=0.0194, global_step=2910.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  64%|██████▍   | 772/1208 [22:02<12:27,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.32e-5, train/loss_step=0.0194, global_step=2910.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  64%|██████▍   | 772/1208 [22:02<12:27,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000112, train/loss_step=0.0284, global_step=2910.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  64%|██████▍   | 773/1208 [22:03<12:24,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000112, train/loss_step=0.0284, global_step=2910.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  64%|██████▍   | 773/1208 [22:03<12:24,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.000188, train/loss_step=0.0543, global_step=2911.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  64%|██████▍   | 774/1208 [22:04<12:22,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.000188, train/loss_step=0.0543, global_step=2911.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  64%|██████▍   | 774/1208 [22:04<12:22,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.05e-5, train/loss_step=0.0163, global_step=2911.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  64%|██████▍   | 775/1208 [22:05<12:20,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.05e-5, train/loss_step=0.0163, global_step=2911.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  64%|██████▍   | 775/1208 [22:05<12:20,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=6.98e-5, train/loss_step=0.0168, global_step=2911.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  64%|██████▍   | 776/1208 [22:08<12:19,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=6.98e-5, train/loss_step=0.0168, global_step=2911.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  64%|██████▍   | 776/1208 [22:08<12:19,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000769, train/loss_step=0.207, global_step=2911.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  64%|██████▍   | 777/1208 [22:09<12:17,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000769, train/loss_step=0.207, global_step=2911.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  64%|██████▍   | 777/1208 [22:09<12:17,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=2.24e-5, train/loss_step=0.00413, global_step=2912.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  64%|██████▍   | 778/1208 [22:10<12:15,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=2.24e-5, train/loss_step=0.00413, global_step=2912.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  64%|██████▍   | 778/1208 [22:10<12:15,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00173, train/loss_step=0.320, global_step=2912.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  64%|██████▍   | 779/1208 [22:11<12:13,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00173, train/loss_step=0.320, global_step=2912.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  64%|██████▍   | 779/1208 [22:11<12:13,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000956, train/loss_step=0.215, global_step=2912.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  65%|██████▍   | 780/1208 [22:14<12:12,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000956, train/loss_step=0.215, global_step=2912.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  65%|██████▍   | 780/1208 [22:14<12:12,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00158, train/loss_step=0.332, global_step=2912.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  65%|██████▍   | 781/1208 [22:15<12:10,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00158, train/loss_step=0.332, global_step=2912.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  65%|██████▍   | 781/1208 [22:15<12:10,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000451, train/loss_step=0.137, global_step=2913.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  65%|██████▍   | 782/1208 [22:16<12:08,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000451, train/loss_step=0.137, global_step=2913.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  65%|██████▍   | 782/1208 [22:16<12:08,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.358, train/loss_vlb_step=0.00206, train/loss_step=0.358, global_step=2913.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  65%|██████▍   | 783/1208 [22:17<12:06,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.358, train/loss_vlb_step=0.00206, train/loss_step=0.358, global_step=2913.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  65%|██████▍   | 783/1208 [22:17<12:06,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00535, train/loss_vlb_step=2.82e-5, train/loss_step=0.00535, global_step=2913.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  65%|██████▍   | 784/1208 [22:20<12:04,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00535, train/loss_vlb_step=2.82e-5, train/loss_step=0.00535, global_step=2913.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  65%|██████▍   | 784/1208 [22:20<12:04,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000458, train/loss_step=0.139, global_step=2913.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  65%|██████▍   | 785/1208 [22:21<12:02,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000458, train/loss_step=0.139, global_step=2913.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  65%|██████▍   | 785/1208 [22:21<12:02,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.481, train/loss_vlb_step=0.00569, train/loss_step=0.481, global_step=2914.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  65%|██████▌   | 786/1208 [22:22<12:00,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.481, train/loss_vlb_step=0.00569, train/loss_step=0.481, global_step=2914.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  65%|██████▌   | 786/1208 [22:22<12:00,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=2914.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  65%|██████▌   | 787/1208 [22:23<11:58,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=2914.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  65%|██████▌   | 787/1208 [22:23<11:58,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.29e-5, train/loss_step=0.00218, global_step=2914.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  65%|██████▌   | 788/1208 [22:26<11:57,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.29e-5, train/loss_step=0.00218, global_step=2914.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  65%|██████▌   | 788/1208 [22:26<11:57,  1.71s/it, loss=0.175, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000549, train/loss_step=0.163, global_step=2914.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  65%|██████▌   | 789/1208 [22:27<11:55,  1.71s/it, loss=0.175, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000549, train/loss_step=0.163, global_step=2914.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  65%|██████▌   | 789/1208 [22:27<11:55,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.505, train/loss_vlb_step=0.00534, train/loss_step=0.505, global_step=2915.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  65%|██████▌   | 790/1208 [22:28<11:53,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.505, train/loss_vlb_step=0.00534, train/loss_step=0.505, global_step=2915.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  65%|██████▌   | 790/1208 [22:28<11:53,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000554, train/loss_step=0.163, global_step=2915.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  65%|██████▌   | 791/1208 [22:29<11:51,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000554, train/loss_step=0.163, global_step=2915.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  65%|██████▌   | 791/1208 [22:29<11:51,  1.71s/it, loss=0.202, v_num=0, train/loss_simple_step=0.769, train/loss_vlb_step=0.0976, train/loss_step=0.769, global_step=2915.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  66%|██████▌   | 792/1208 [22:32<11:50,  1.71s/it, loss=0.202, v_num=0, train/loss_simple_step=0.769, train/loss_vlb_step=0.0976, train/loss_step=0.769, global_step=2915.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  66%|██████▌   | 792/1208 [22:32<11:50,  1.71s/it, loss=0.213, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00102, train/loss_step=0.248, global_step=2915.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  66%|██████▌   | 793/1208 [22:33<11:48,  1.71s/it, loss=0.213, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00102, train/loss_step=0.248, global_step=2915.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  66%|██████▌   | 793/1208 [22:33<11:48,  1.71s/it, loss=0.241, v_num=0, train/loss_simple_step=0.621, train/loss_vlb_step=0.0174, train/loss_step=0.621, global_step=2916.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  66%|██████▌   | 794/1208 [22:34<11:46,  1.71s/it, loss=0.241, v_num=0, train/loss_simple_step=0.621, train/loss_vlb_step=0.0174, train/loss_step=0.621, global_step=2916.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  66%|██████▌   | 794/1208 [22:34<11:46,  1.71s/it, loss=0.243, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.000172, train/loss_step=0.0489, global_step=2916.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  66%|██████▌   | 795/1208 [22:35<11:44,  1.70s/it, loss=0.243, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.000172, train/loss_step=0.0489, global_step=2916.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  66%|██████▌   | 795/1208 [22:35<11:44,  1.70s/it, loss=0.261, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00275, train/loss_step=0.379, global_step=2916.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  66%|██████▌   | 796/1208 [22:38<11:43,  1.71s/it, loss=0.261, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00275, train/loss_step=0.379, global_step=2916.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  66%|██████▌   | 796/1208 [22:38<11:43,  1.71s/it, loss=0.252, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000104, train/loss_step=0.0255, global_step=2916.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  66%|██████▌   | 797/1208 [22:39<11:40,  1.71s/it, loss=0.252, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000104, train/loss_step=0.0255, global_step=2916.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  66%|██████▌   | 797/1208 [22:39<11:40,  1.71s/it, loss=0.254, v_num=0, train/loss_simple_step=0.0421, train/loss_vlb_step=0.000155, train/loss_step=0.0421, global_step=2917.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  66%|██████▌   | 798/1208 [22:40<11:38,  1.70s/it, loss=0.254, v_num=0, train/loss_simple_step=0.0421, train/loss_vlb_step=0.000155, train/loss_step=0.0421, global_step=2917.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  66%|██████▌   | 798/1208 [22:40<11:38,  1.70s/it, loss=0.238, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.59e-5, train/loss_step=0.0152, global_step=2917.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  66%|██████▌   | 799/1208 [22:41<11:36,  1.70s/it, loss=0.238, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.59e-5, train/loss_step=0.0152, global_step=2917.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  66%|██████▌   | 799/1208 [22:41<11:36,  1.70s/it, loss=0.245, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00175, train/loss_step=0.353, global_step=2917.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  66%|██████▌   | 800/1208 [22:44<11:35,  1.71s/it, loss=0.245, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00175, train/loss_step=0.353, global_step=2917.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  66%|██████▌   | 800/1208 [22:44<11:35,  1.71s/it, loss=0.23, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.00013, train/loss_step=0.0345, global_step=2917.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  66%|██████▋   | 801/1208 [22:45<11:33,  1.70s/it, loss=0.23, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.00013, train/loss_step=0.0345, global_step=2917.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  66%|██████▋   | 801/1208 [22:45<11:33,  1.70s/it, loss=0.224, v_num=0, train/loss_simple_step=0.0037, train/loss_vlb_step=1.97e-5, train/loss_step=0.0037, global_step=2918.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  66%|██████▋   | 802/1208 [22:46<11:31,  1.70s/it, loss=0.224, v_num=0, train/loss_simple_step=0.0037, train/loss_vlb_step=1.97e-5, train/loss_step=0.0037, global_step=2918.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  66%|██████▋   | 802/1208 [22:46<11:31,  1.70s/it, loss=0.206, v_num=0, train/loss_simple_step=0.00508, train/loss_vlb_step=2.7e-5, train/loss_step=0.00508, global_step=2918.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  66%|██████▋   | 803/1208 [22:47<11:29,  1.70s/it, loss=0.206, v_num=0, train/loss_simple_step=0.00508, train/loss_vlb_step=2.7e-5, train/loss_step=0.00508, global_step=2918.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  66%|██████▋   | 803/1208 [22:47<11:29,  1.70s/it, loss=0.209, v_num=0, train/loss_simple_step=0.0687, train/loss_vlb_step=0.000237, train/loss_step=0.0687, global_step=2918.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  67%|██████▋   | 804/1208 [22:50<11:28,  1.70s/it, loss=0.209, v_num=0, train/loss_simple_step=0.0687, train/loss_vlb_step=0.000237, train/loss_step=0.0687, global_step=2918.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  67%|██████▋   | 804/1208 [22:50<11:28,  1.70s/it, loss=0.211, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000607, train/loss_step=0.174, global_step=2918.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  67%|██████▋   | 805/1208 [22:51<11:26,  1.70s/it, loss=0.211, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000607, train/loss_step=0.174, global_step=2918.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  67%|██████▋   | 805/1208 [22:51<11:26,  1.70s/it, loss=0.206, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00213, train/loss_step=0.374, global_step=2919.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  67%|██████▋   | 806/1208 [22:52<11:24,  1.70s/it, loss=0.206, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00213, train/loss_step=0.374, global_step=2919.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  67%|██████▋   | 806/1208 [22:52<11:24,  1.70s/it, loss=0.22, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.00278, train/loss_step=0.400, global_step=2919.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  67%|██████▋   | 807/1208 [22:53<11:22,  1.70s/it, loss=0.22, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.00278, train/loss_step=0.400, global_step=2919.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  67%|██████▋   | 807/1208 [22:53<11:22,  1.70s/it, loss=0.227, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000483, train/loss_step=0.146, global_step=2919.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  67%|██████▋   | 808/1208 [22:56<11:21,  1.70s/it, loss=0.227, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000483, train/loss_step=0.146, global_step=2919.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  67%|██████▋   | 808/1208 [22:56<11:21,  1.70s/it, loss=0.25, v_num=0, train/loss_simple_step=0.623, train/loss_vlb_step=0.013, train/loss_step=0.623, global_step=2919.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  67%|██████▋   | 809/1208 [22:57<11:19,  1.70s/it, loss=0.25, v_num=0, train/loss_simple_step=0.623, train/loss_vlb_step=0.013, train/loss_step=0.623, global_step=2919.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  67%|██████▋   | 809/1208 [22:57<11:19,  1.70s/it, loss=0.23, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=2920.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  67%|██████▋   | 810/1208 [22:58<11:17,  1.70s/it, loss=0.23, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=2920.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  67%|██████▋   | 810/1208 [22:58<11:17,  1.70s/it, loss=0.229, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000502, train/loss_step=0.147, global_step=2920.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  67%|██████▋   | 811/1208 [22:59<11:15,  1.70s/it, loss=0.229, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000502, train/loss_step=0.147, global_step=2920.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  67%|██████▋   | 811/1208 [22:59<11:15,  1.70s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0585, train/loss_vlb_step=0.000198, train/loss_step=0.0585, global_step=2920.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  67%|██████▋   | 812/1208 [23:01<11:13,  1.70s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0585, train/loss_vlb_step=0.000198, train/loss_step=0.0585, global_step=2920.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  67%|██████▋   | 812/1208 [23:01<11:13,  1.70s/it, loss=0.198, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00169, train/loss_step=0.323, global_step=2920.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  67%|██████▋   | 813/1208 [23:02<11:11,  1.70s/it, loss=0.198, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00169, train/loss_step=0.323, global_step=2920.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  67%|██████▋   | 813/1208 [23:02<11:11,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.75e-5, train/loss_step=0.0178, global_step=2921.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  67%|██████▋   | 814/1208 [23:03<11:09,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.75e-5, train/loss_step=0.0178, global_step=2921.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  67%|██████▋   | 814/1208 [23:03<11:09,  1.70s/it, loss=0.175, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.00067, train/loss_step=0.196, global_step=2921.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  67%|██████▋   | 815/1208 [23:05<11:07,  1.70s/it, loss=0.175, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.00067, train/loss_step=0.196, global_step=2921.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  67%|██████▋   | 815/1208 [23:05<11:07,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.426, train/loss_vlb_step=0.00392, train/loss_step=0.426, global_step=2921.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  68%|██████▊   | 816/1208 [23:07<11:06,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.426, train/loss_vlb_step=0.00392, train/loss_step=0.426, global_step=2921.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  68%|██████▊   | 816/1208 [23:07<11:06,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000667, train/loss_step=0.190, global_step=2921.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  68%|██████▊   | 817/1208 [23:08<11:04,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000667, train/loss_step=0.190, global_step=2921.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  68%|██████▊   | 817/1208 [23:08<11:04,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0609, train/loss_vlb_step=0.00021, train/loss_step=0.0609, global_step=2922.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  68%|██████▊   | 818/1208 [23:09<11:02,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0609, train/loss_vlb_step=0.00021, train/loss_step=0.0609, global_step=2922.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  68%|██████▊   | 818/1208 [23:09<11:02,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.89e-5, train/loss_step=0.00335, global_step=2922.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  68%|██████▊   | 819/1208 [23:10<11:00,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.89e-5, train/loss_step=0.00335, global_step=2922.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  68%|██████▊   | 819/1208 [23:10<11:00,  1.70s/it, loss=0.175, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00042, train/loss_step=0.128, global_step=2922.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  68%|██████▊   | 820/1208 [23:13<10:59,  1.70s/it, loss=0.175, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00042, train/loss_step=0.128, global_step=2922.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  68%|██████▊   | 820/1208 [23:13<10:59,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000924, train/loss_step=0.228, global_step=2922.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  68%|██████▊   | 821/1208 [23:14<10:57,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000924, train/loss_step=0.228, global_step=2922.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  68%|██████▊   | 821/1208 [23:14<10:57,  1.70s/it, loss=0.196, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000955, train/loss_step=0.245, global_step=2923.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  68%|██████▊   | 822/1208 [23:15<10:55,  1.70s/it, loss=0.196, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000955, train/loss_step=0.245, global_step=2923.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  68%|██████▊   | 822/1208 [23:15<10:55,  1.70s/it, loss=0.205, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000667, train/loss_step=0.178, global_step=2923.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  68%|██████▊   | 823/1208 [23:16<10:53,  1.70s/it, loss=0.205, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000667, train/loss_step=0.178, global_step=2923.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  68%|██████▊   | 823/1208 [23:16<10:53,  1.70s/it, loss=0.202, v_num=0, train/loss_simple_step=0.00332, train/loss_vlb_step=1.86e-5, train/loss_step=0.00332, global_step=2923.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  68%|██████▊   | 824/1208 [23:19<10:52,  1.70s/it, loss=0.202, v_num=0, train/loss_simple_step=0.00332, train/loss_vlb_step=1.86e-5, train/loss_step=0.00332, global_step=2923.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  68%|██████▊   | 824/1208 [23:19<10:52,  1.70s/it, loss=0.205, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.00102, train/loss_step=0.240, global_step=2923.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  68%|██████▊   | 825/1208 [23:20<10:50,  1.70s/it, loss=0.205, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.00102, train/loss_step=0.240, global_step=2923.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  68%|██████▊   | 825/1208 [23:20<10:50,  1.70s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0706, train/loss_vlb_step=0.000239, train/loss_step=0.0706, global_step=2924.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  68%|██████▊   | 826/1208 [23:21<10:48,  1.70s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0706, train/loss_vlb_step=0.000239, train/loss_step=0.0706, global_step=2924.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  68%|██████▊   | 826/1208 [23:21<10:48,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00858, train/loss_vlb_step=4.19e-5, train/loss_step=0.00858, global_step=2924.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  68%|██████▊   | 827/1208 [23:22<10:46,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00858, train/loss_vlb_step=4.19e-5, train/loss_step=0.00858, global_step=2924.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  68%|██████▊   | 827/1208 [23:22<10:46,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000552, train/loss_step=0.166, global_step=2924.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  69%|██████▊   | 828/1208 [23:25<10:45,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000552, train/loss_step=0.166, global_step=2924.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  69%|██████▊   | 828/1208 [23:25<10:45,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.055, train/loss_vlb_step=0.0002, train/loss_step=0.055, global_step=2924.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  69%|██████▊   | 829/1208 [23:26<10:43,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.055, train/loss_vlb_step=0.0002, train/loss_step=0.055, global_step=2924.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  69%|██████▊   | 829/1208 [23:26<10:43,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000348, train/loss_step=0.106, global_step=2925.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  69%|██████▊   | 830/1208 [23:27<10:41,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000348, train/loss_step=0.106, global_step=2925.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  69%|██████▊   | 830/1208 [23:27<10:41,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0928, train/loss_vlb_step=0.000307, train/loss_step=0.0928, global_step=2925.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  69%|██████▉   | 831/1208 [23:28<10:39,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0928, train/loss_vlb_step=0.000307, train/loss_step=0.0928, global_step=2925.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  69%|██████▉   | 831/1208 [23:28<10:39,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00966, train/loss_vlb_step=4.56e-5, train/loss_step=0.00966, global_step=2925.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  69%|██████▉   | 832/1208 [23:31<10:37,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00966, train/loss_vlb_step=4.56e-5, train/loss_step=0.00966, global_step=2925.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  69%|██████▉   | 832/1208 [23:31<10:37,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.1e-5, train/loss_step=0.0108, global_step=2925.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  69%|██████▉   | 833/1208 [23:32<10:35,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.1e-5, train/loss_step=0.0108, global_step=2925.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  69%|██████▉   | 833/1208 [23:32<10:35,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.62e-5, train/loss_step=0.0209, global_step=2926.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  69%|██████▉   | 834/1208 [23:33<10:33,  1.69s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.62e-5, train/loss_step=0.0209, global_step=2926.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  69%|██████▉   | 834/1208 [23:33<10:33,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=1.38e-5, train/loss_step=0.00227, global_step=2926.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  69%|██████▉   | 835/1208 [23:34<10:31,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=1.38e-5, train/loss_step=0.00227, global_step=2926.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  69%|██████▉   | 835/1208 [23:34<10:31,  1.69s/it, loss=0.092, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.62e-5, train/loss_step=0.0213, global_step=2926.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  69%|██████▉   | 836/1208 [23:37<10:30,  1.70s/it, loss=0.092, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.62e-5, train/loss_step=0.0213, global_step=2926.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  69%|██████▉   | 836/1208 [23:37<10:30,  1.70s/it, loss=0.0879, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=2926.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  69%|██████▉   | 837/1208 [23:38<10:28,  1.69s/it, loss=0.0879, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=2926.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  69%|██████▉   | 837/1208 [23:38<10:28,  1.69s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000905, train/loss_step=0.240, global_step=2927.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  69%|██████▉   | 838/1208 [23:39<10:26,  1.69s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000905, train/loss_step=0.240, global_step=2927.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  69%|██████▉   | 838/1208 [23:39<10:26,  1.69s/it, loss=0.097, v_num=0, train/loss_simple_step=0.00591, train/loss_vlb_step=3.04e-5, train/loss_step=0.00591, global_step=2927.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  69%|██████▉   | 839/1208 [23:40<10:24,  1.69s/it, loss=0.097, v_num=0, train/loss_simple_step=0.00591, train/loss_vlb_step=3.04e-5, train/loss_step=0.00591, global_step=2927.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  69%|██████▉   | 839/1208 [23:40<10:24,  1.69s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.29e-5, train/loss_step=0.0201, global_step=2927.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  70%|██████▉   | 840/1208 [23:43<10:23,  1.69s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.29e-5, train/loss_step=0.0201, global_step=2927.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  70%|██████▉   | 840/1208 [23:43<10:23,  1.69s/it, loss=0.0816, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000109, train/loss_step=0.0273, global_step=2927.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  70%|██████▉   | 841/1208 [23:44<10:21,  1.69s/it, loss=0.0816, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000109, train/loss_step=0.0273, global_step=2927.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  70%|██████▉   | 841/1208 [23:44<10:21,  1.69s/it, loss=0.0712, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.000142, train/loss_step=0.0379, global_step=2928.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  70%|██████▉   | 842/1208 [23:45<10:19,  1.69s/it, loss=0.0712, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.000142, train/loss_step=0.0379, global_step=2928.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  70%|██████▉   | 842/1208 [23:45<10:19,  1.69s/it, loss=0.0657, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.000229, train/loss_step=0.067, global_step=2928.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  70%|██████▉   | 843/1208 [23:46<10:17,  1.69s/it, loss=0.0657, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.000229, train/loss_step=0.067, global_step=2928.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  70%|██████▉   | 843/1208 [23:46<10:17,  1.69s/it, loss=0.0702, v_num=0, train/loss_simple_step=0.0942, train/loss_vlb_step=0.000312, train/loss_step=0.0942, global_step=2928.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  70%|██████▉   | 844/1208 [23:49<10:16,  1.69s/it, loss=0.0702, v_num=0, train/loss_simple_step=0.0942, train/loss_vlb_step=0.000312, train/loss_step=0.0942, global_step=2928.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  70%|██████▉   | 844/1208 [23:49<10:16,  1.69s/it, loss=0.0695, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.00089, train/loss_step=0.224, global_step=2928.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  70%|██████▉   | 845/1208 [23:50<10:14,  1.69s/it, loss=0.0695, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.00089, train/loss_step=0.224, global_step=2928.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  70%|██████▉   | 845/1208 [23:50<10:14,  1.69s/it, loss=0.0683, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.000162, train/loss_step=0.0476, global_step=2929.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  70%|███████   | 846/1208 [23:51<10:12,  1.69s/it, loss=0.0683, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.000162, train/loss_step=0.0476, global_step=2929.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  70%|███████   | 846/1208 [23:51<10:12,  1.69s/it, loss=0.0683, v_num=0, train/loss_simple_step=0.00856, train/loss_vlb_step=4.17e-5, train/loss_step=0.00856, global_step=2929.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  70%|███████   | 847/1208 [23:52<10:10,  1.69s/it, loss=0.0683, v_num=0, train/loss_simple_step=0.00856, train/loss_vlb_step=4.17e-5, train/loss_step=0.00856, global_step=2929.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  70%|███████   | 847/1208 [23:52<10:10,  1.69s/it, loss=0.0827, v_num=0, train/loss_simple_step=0.452, train/loss_vlb_step=0.00526, train/loss_step=0.452, global_step=2929.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  70%|███████   | 848/1208 [23:55<10:09,  1.69s/it, loss=0.0827, v_num=0, train/loss_simple_step=0.452, train/loss_vlb_step=0.00526, train/loss_step=0.452, global_step=2929.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  70%|███████   | 848/1208 [23:55<10:09,  1.69s/it, loss=0.0808, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.52e-5, train/loss_step=0.0174, global_step=2929.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  70%|███████   | 849/1208 [23:56<10:07,  1.69s/it, loss=0.0808, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.52e-5, train/loss_step=0.0174, global_step=2929.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  70%|███████   | 849/1208 [23:56<10:07,  1.69s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.0012, train/loss_step=0.261, global_step=2930.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  70%|███████   | 850/1208 [23:57<10:05,  1.69s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.0012, train/loss_step=0.261, global_step=2930.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  70%|███████   | 850/1208 [23:57<10:05,  1.69s/it, loss=0.0917, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000522, train/loss_step=0.156, global_step=2930.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  70%|███████   | 851/1208 [23:58<10:03,  1.69s/it, loss=0.0917, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000522, train/loss_step=0.156, global_step=2930.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  70%|███████   | 851/1208 [23:58<10:03,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.537, train/loss_vlb_step=0.00814, train/loss_step=0.537, global_step=2930.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  71%|███████   | 852/1208 [24:01<10:02,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.537, train/loss_vlb_step=0.00814, train/loss_step=0.537, global_step=2930.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  71%|███████   | 852/1208 [24:01<10:02,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000516, train/loss_step=0.156, global_step=2930.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  71%|███████   | 853/1208 [24:02<10:00,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000516, train/loss_step=0.156, global_step=2930.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  71%|███████   | 853/1208 [24:02<10:00,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00712, train/loss_vlb_step=3.37e-5, train/loss_step=0.00712, global_step=2931.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  71%|███████   | 854/1208 [24:03<09:58,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00712, train/loss_vlb_step=3.37e-5, train/loss_step=0.00712, global_step=2931.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  71%|███████   | 854/1208 [24:03<09:58,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00538, train/loss_vlb_step=2.73e-5, train/loss_step=0.00538, global_step=2931.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  71%|███████   | 855/1208 [24:04<09:56,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00538, train/loss_vlb_step=2.73e-5, train/loss_step=0.00538, global_step=2931.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  71%|███████   | 855/1208 [24:04<09:56,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=2931.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  71%|███████   | 856/1208 [24:07<09:55,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=2931.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  71%|███████   | 856/1208 [24:07<09:55,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=9.78e-5, train/loss_step=0.025, global_step=2931.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  71%|███████   | 857/1208 [24:08<09:53,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=9.78e-5, train/loss_step=0.025, global_step=2931.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  71%|███████   | 857/1208 [24:08<09:53,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0854, train/loss_vlb_step=0.000285, train/loss_step=0.0854, global_step=2932.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  71%|███████   | 858/1208 [24:09<09:51,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0854, train/loss_vlb_step=0.000285, train/loss_step=0.0854, global_step=2932.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  71%|███████   | 858/1208 [24:09<09:51,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000117, train/loss_step=0.0297, global_step=2932.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  71%|███████   | 859/1208 [24:10<09:49,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000117, train/loss_step=0.0297, global_step=2932.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  71%|███████   | 859/1208 [24:10<09:49,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.8e-5, train/loss_step=0.0152, global_step=2932.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  71%|███████   | 860/1208 [24:13<09:47,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.8e-5, train/loss_step=0.0152, global_step=2932.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  71%|███████   | 860/1208 [24:13<09:47,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00477, train/loss_vlb_step=2.59e-5, train/loss_step=0.00477, global_step=2932.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  71%|███████▏  | 861/1208 [24:14<09:46,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00477, train/loss_vlb_step=2.59e-5, train/loss_step=0.00477, global_step=2932.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  71%|███████▏  | 861/1208 [24:14<09:46,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.694, train/loss_vlb_step=0.0204, train/loss_step=0.694, global_step=2933.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]      Epoch 9:  71%|███████▏  | 862/1208 [24:15<09:44,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.694, train/loss_vlb_step=0.0204, train/loss_step=0.694, global_step=2933.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  71%|███████▏  | 862/1208 [24:15<09:44,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000367, train/loss_step=0.112, global_step=2933.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  71%|███████▏  | 863/1208 [24:16<09:42,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000367, train/loss_step=0.112, global_step=2933.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  71%|███████▏  | 863/1208 [24:16<09:42,  1.69s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.59e-5, train/loss_step=0.0212, global_step=2933.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  72%|███████▏  | 864/1208 [24:18<09:40,  1.69s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.59e-5, train/loss_step=0.0212, global_step=2933.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  72%|███████▏  | 864/1208 [24:18<09:40,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00872, train/loss_vlb_step=4.15e-5, train/loss_step=0.00872, global_step=2933.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  72%|███████▏  | 865/1208 [24:19<09:38,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00872, train/loss_vlb_step=4.15e-5, train/loss_step=0.00872, global_step=2933.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  72%|███████▏  | 865/1208 [24:19<09:38,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00198, train/loss_step=0.349, global_step=2934.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  72%|███████▏  | 866/1208 [24:20<09:36,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00198, train/loss_step=0.349, global_step=2934.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  72%|███████▏  | 866/1208 [24:20<09:36,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00607, train/loss_vlb_step=3.05e-5, train/loss_step=0.00607, global_step=2934.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  72%|███████▏  | 867/1208 [24:21<09:35,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00607, train/loss_vlb_step=3.05e-5, train/loss_step=0.00607, global_step=2934.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  72%|███████▏  | 867/1208 [24:21<09:35,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00174, train/loss_step=0.317, global_step=2934.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  72%|███████▏  | 868/1208 [24:24<09:33,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00174, train/loss_step=0.317, global_step=2934.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  72%|███████▏  | 868/1208 [24:24<09:33,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00162, train/loss_step=0.304, global_step=2934.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  72%|███████▏  | 869/1208 [24:25<09:31,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00162, train/loss_step=0.304, global_step=2934.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  72%|███████▏  | 869/1208 [24:25<09:31,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.18e-5, train/loss_step=0.00197, global_step=2935.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  72%|███████▏  | 870/1208 [24:26<09:29,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.18e-5, train/loss_step=0.00197, global_step=2935.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  72%|███████▏  | 870/1208 [24:26<09:29,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000287, train/loss_step=0.086, global_step=2935.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  72%|███████▏  | 871/1208 [24:27<09:27,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000287, train/loss_step=0.086, global_step=2935.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  72%|███████▏  | 871/1208 [24:27<09:27,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00699, train/loss_vlb_step=3.4e-5, train/loss_step=0.00699, global_step=2935.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  72%|███████▏  | 872/1208 [24:30<09:26,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00699, train/loss_vlb_step=3.4e-5, train/loss_step=0.00699, global_step=2935.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  72%|███████▏  | 872/1208 [24:30<09:26,  1.69s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.19e-5, train/loss_step=0.00198, global_step=2935.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  72%|███████▏  | 873/1208 [24:31<09:24,  1.69s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.19e-5, train/loss_step=0.00198, global_step=2935.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  72%|███████▏  | 873/1208 [24:31<09:24,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0856, train/loss_vlb_step=0.000283, train/loss_step=0.0856, global_step=2936.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  72%|███████▏  | 874/1208 [24:32<09:22,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0856, train/loss_vlb_step=0.000283, train/loss_step=0.0856, global_step=2936.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  72%|███████▏  | 874/1208 [24:32<09:22,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00298, train/loss_step=0.415, global_step=2936.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  72%|███████▏  | 875/1208 [24:33<09:20,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00298, train/loss_step=0.415, global_step=2936.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  72%|███████▏  | 875/1208 [24:33<09:20,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000112, train/loss_step=0.0284, global_step=2936.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  73%|███████▎  | 876/1208 [24:36<09:19,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000112, train/loss_step=0.0284, global_step=2936.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  73%|███████▎  | 876/1208 [24:36<09:19,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0557, train/loss_vlb_step=0.000189, train/loss_step=0.0557, global_step=2936.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  73%|███████▎  | 877/1208 [24:37<09:17,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0557, train/loss_vlb_step=0.000189, train/loss_step=0.0557, global_step=2936.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  73%|███████▎  | 877/1208 [24:37<09:17,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.00256, train/loss_step=0.400, global_step=2937.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  73%|███████▎  | 878/1208 [24:38<09:15,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.00256, train/loss_step=0.400, global_step=2937.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  73%|███████▎  | 878/1208 [24:38<09:15,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.64e-5, train/loss_step=0.0226, global_step=2937.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  73%|███████▎  | 879/1208 [24:39<09:13,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.64e-5, train/loss_step=0.0226, global_step=2937.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  73%|███████▎  | 879/1208 [24:39<09:13,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00108, train/loss_step=0.244, global_step=2937.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  73%|███████▎  | 880/1208 [24:42<09:12,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00108, train/loss_step=0.244, global_step=2937.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  73%|███████▎  | 880/1208 [24:42<09:12,  1.68s/it, loss=0.18, v_num=0, train/loss_simple_step=0.440, train/loss_vlb_step=0.00511, train/loss_step=0.440, global_step=2937.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  73%|███████▎  | 881/1208 [24:43<09:10,  1.68s/it, loss=0.18, v_num=0, train/loss_simple_step=0.440, train/loss_vlb_step=0.00511, train/loss_step=0.440, global_step=2937.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  73%|███████▎  | 881/1208 [24:43<09:10,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.4e-5, train/loss_step=0.0197, global_step=2938.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  73%|███████▎  | 882/1208 [24:44<09:08,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.4e-5, train/loss_step=0.0197, global_step=2938.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  73%|███████▎  | 882/1208 [24:44<09:08,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00191, train/loss_step=0.362, global_step=2938.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  73%|███████▎  | 883/1208 [24:45<09:06,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00191, train/loss_step=0.362, global_step=2938.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  73%|███████▎  | 883/1208 [24:45<09:06,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.000229, train/loss_step=0.0665, global_step=2938.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  73%|███████▎  | 884/1208 [24:48<09:05,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.000229, train/loss_step=0.0665, global_step=2938.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  73%|███████▎  | 884/1208 [24:48<09:05,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00781, train/loss_vlb_step=3.78e-5, train/loss_step=0.00781, global_step=2938.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  73%|███████▎  | 885/1208 [24:49<09:03,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00781, train/loss_vlb_step=3.78e-5, train/loss_step=0.00781, global_step=2938.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  73%|███████▎  | 885/1208 [24:49<09:03,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000249, train/loss_step=0.0741, global_step=2939.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  73%|███████▎  | 886/1208 [24:50<09:01,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000249, train/loss_step=0.0741, global_step=2939.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  73%|███████▎  | 886/1208 [24:50<09:01,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0505, train/loss_vlb_step=0.000182, train/loss_step=0.0505, global_step=2939.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  73%|███████▎  | 887/1208 [24:51<08:59,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0505, train/loss_vlb_step=0.000182, train/loss_step=0.0505, global_step=2939.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  73%|███████▎  | 887/1208 [24:51<08:59,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000157, train/loss_step=0.0415, global_step=2939.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  74%|███████▎  | 888/1208 [24:54<08:58,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000157, train/loss_step=0.0415, global_step=2939.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  74%|███████▎  | 888/1208 [24:54<08:58,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00363, train/loss_step=0.423, global_step=2939.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  74%|███████▎  | 889/1208 [24:55<08:56,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00363, train/loss_step=0.423, global_step=2939.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  74%|███████▎  | 889/1208 [24:55<08:56,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.00044, train/loss_step=0.133, global_step=2940.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  74%|███████▎  | 890/1208 [24:56<08:54,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.00044, train/loss_step=0.133, global_step=2940.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  74%|███████▎  | 890/1208 [24:56<08:54,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000108, train/loss_step=0.0273, global_step=2940.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  74%|███████▍  | 891/1208 [24:57<08:52,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000108, train/loss_step=0.0273, global_step=2940.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  74%|███████▍  | 891/1208 [24:57<08:52,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00203, train/loss_step=0.394, global_step=2940.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  74%|███████▍  | 892/1208 [25:00<08:51,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00203, train/loss_step=0.394, global_step=2940.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  74%|███████▍  | 892/1208 [25:00<08:51,  1.68s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0638, train/loss_vlb_step=0.000218, train/loss_step=0.0638, global_step=2940.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  74%|███████▍  | 893/1208 [25:01<08:49,  1.68s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0638, train/loss_vlb_step=0.000218, train/loss_step=0.0638, global_step=2940.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  74%|███████▍  | 893/1208 [25:01<08:49,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.6e-5, train/loss_step=0.0101, global_step=2941.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  74%|███████▍  | 894/1208 [25:02<08:47,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.6e-5, train/loss_step=0.0101, global_step=2941.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  74%|███████▍  | 894/1208 [25:02<08:47,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000122, train/loss_step=0.0345, global_step=2941.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  74%|███████▍  | 895/1208 [25:03<08:45,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000122, train/loss_step=0.0345, global_step=2941.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  74%|███████▍  | 895/1208 [25:03<08:45,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000198, train/loss_step=0.0545, global_step=2941.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  74%|███████▍  | 896/1208 [25:06<08:44,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000198, train/loss_step=0.0545, global_step=2941.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  74%|███████▍  | 896/1208 [25:06<08:44,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=8.15e-5, train/loss_step=0.019, global_step=2941.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  74%|███████▍  | 897/1208 [25:07<08:42,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=8.15e-5, train/loss_step=0.019, global_step=2941.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  74%|███████▍  | 897/1208 [25:07<08:42,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.65e-5, train/loss_step=0.00286, global_step=2942.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  74%|███████▍  | 898/1208 [25:08<08:40,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.65e-5, train/loss_step=0.00286, global_step=2942.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  74%|███████▍  | 898/1208 [25:08<08:40,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00966, train/loss_vlb_step=4.56e-5, train/loss_step=0.00966, global_step=2942.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  74%|███████▍  | 899/1208 [25:09<08:38,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00966, train/loss_vlb_step=4.56e-5, train/loss_step=0.00966, global_step=2942.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  74%|███████▍  | 899/1208 [25:09<08:38,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00335, train/loss_step=0.378, global_step=2942.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  75%|███████▍  | 900/1208 [25:12<08:37,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00335, train/loss_step=0.378, global_step=2942.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  75%|███████▍  | 900/1208 [25:12<08:37,  1.68s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000117, train/loss_step=0.0304, global_step=2942.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.86it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:25,  1.85it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.84it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.85it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.84it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.85it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.84it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.85it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.85it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.85it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.84it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.83it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.85it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.84it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.85it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.84it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.83it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.85it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.85it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.80it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.84it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.85it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.84it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.85it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.83it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.84it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.85it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:19,  1.85it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.85it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.85it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.80it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:18,  1.85it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.84it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.85it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.84it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.84it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.84it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.80it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.85it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.84it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.82it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.85it/s][ADDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.84it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.85it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.84it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.84it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.84it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.85it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:12<00:14,  1.85it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.85it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.85it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.84it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.83it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.85it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.85it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.83it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.85it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.85it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.84it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.84it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.84it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.84it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.84it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:18<00:08,  1.84it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.84it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.84it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.84it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.84it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.84it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.83it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.85it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.83it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.83it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.85it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.83it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.85it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.83it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.82it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.84it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.83it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.85it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.83it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.85it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.84it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.84it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.84it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.84it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.84it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:24<00:02,  1.84it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:24<00:02,  1.84it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.83it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.85it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.84it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.84it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.84it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.85it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.84it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.85it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.85it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]Epoch 9:  75%|███████▍  | 901/1208 [25:41<08:45,  1.71s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000117, train/loss_step=0.0304, global_step=2942.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  75%|███████▍  | 901/1208 [25:41<08:45,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0718, train/loss_vlb_step=0.000243, train/loss_step=0.0718, global_step=2943.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  75%|███████▍  | 902/1208 [25:42<08:43,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0718, train/loss_vlb_step=0.000243, train/loss_step=0.0718, global_step=2943.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  75%|███████▍  | 902/1208 [25:42<08:43,  1.71s/it, loss=0.095, v_num=0, train/loss_simple_step=0.00905, train/loss_vlb_step=4.38e-5, train/loss_step=0.00905, global_step=2943.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  75%|███████▍  | 903/1208 [25:43<08:41,  1.71s/it, loss=0.095, v_num=0, train/loss_simple_step=0.00905, train/loss_vlb_step=4.38e-5, train/loss_step=0.00905, global_step=2943.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  75%|███████▍  | 903/1208 [25:43<08:41,  1.71s/it, loss=0.0929, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=0.000101, train/loss_step=0.024, global_step=2943.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  75%|███████▍  | 904/1208 [25:46<08:40,  1.71s/it, loss=0.0929, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=0.000101, train/loss_step=0.024, global_step=2943.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  75%|███████▍  | 904/1208 [25:46<08:40,  1.71s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.000166, train/loss_step=0.0468, global_step=2943.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  75%|███████▍  | 905/1208 [25:47<08:38,  1.71s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.000166, train/loss_step=0.0468, global_step=2943.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  75%|███████▍  | 905/1208 [25:47<08:38,  1.71s/it, loss=0.0943, v_num=0, train/loss_simple_step=0.0629, train/loss_vlb_step=0.00022, train/loss_step=0.0629, global_step=2944.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  75%|███████▌  | 906/1208 [25:48<08:36,  1.71s/it, loss=0.0943, v_num=0, train/loss_simple_step=0.0629, train/loss_vlb_step=0.00022, train/loss_step=0.0629, global_step=2944.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  75%|███████▌  | 906/1208 [25:48<08:36,  1.71s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=1.47e-5, train/loss_step=0.00259, global_step=2944.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  75%|███████▌  | 907/1208 [25:49<08:34,  1.71s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=1.47e-5, train/loss_step=0.00259, global_step=2944.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  75%|███████▌  | 907/1208 [25:49<08:34,  1.71s/it, loss=0.0907, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.68e-5, train/loss_step=0.017, global_step=2944.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  75%|███████▌  | 908/1208 [25:52<08:33,  1.71s/it, loss=0.0907, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.68e-5, train/loss_step=0.017, global_step=2944.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  75%|███████▌  | 908/1208 [25:52<08:33,  1.71s/it, loss=0.0786, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000648, train/loss_step=0.181, global_step=2944.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  75%|███████▌  | 909/1208 [25:53<08:31,  1.71s/it, loss=0.0786, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000648, train/loss_step=0.181, global_step=2944.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  75%|███████▌  | 909/1208 [25:53<08:31,  1.71s/it, loss=0.0725, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.22e-5, train/loss_step=0.0113, global_step=2945.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  75%|███████▌  | 910/1208 [25:54<08:29,  1.71s/it, loss=0.0725, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.22e-5, train/loss_step=0.0113, global_step=2945.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  75%|███████▌  | 910/1208 [25:54<08:29,  1.71s/it, loss=0.0836, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00102, train/loss_step=0.249, global_step=2945.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  75%|███████▌  | 911/1208 [25:55<08:27,  1.71s/it, loss=0.0836, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00102, train/loss_step=0.249, global_step=2945.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  75%|███████▌  | 911/1208 [25:55<08:27,  1.71s/it, loss=0.0833, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00223, train/loss_step=0.388, global_step=2945.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  75%|███████▌  | 912/1208 [25:58<08:25,  1.71s/it, loss=0.0833, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00223, train/loss_step=0.388, global_step=2945.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  75%|███████▌  | 912/1208 [25:58<08:25,  1.71s/it, loss=0.0841, v_num=0, train/loss_simple_step=0.0792, train/loss_vlb_step=0.000271, train/loss_step=0.0792, global_step=2945.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  76%|███████▌  | 913/1208 [25:59<08:23,  1.71s/it, loss=0.0841, v_num=0, train/loss_simple_step=0.0792, train/loss_vlb_step=0.000271, train/loss_step=0.0792, global_step=2945.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  76%|███████▌  | 913/1208 [25:59<08:23,  1.71s/it, loss=0.0838, v_num=0, train/loss_simple_step=0.00436, train/loss_vlb_step=2.34e-5, train/loss_step=0.00436, global_step=2946.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  76%|███████▌  | 914/1208 [26:00<08:22,  1.71s/it, loss=0.0838, v_num=0, train/loss_simple_step=0.00436, train/loss_vlb_step=2.34e-5, train/loss_step=0.00436, global_step=2946.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  76%|███████▌  | 914/1208 [26:00<08:22,  1.71s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00228, train/loss_step=0.348, global_step=2946.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  76%|███████▌  | 915/1208 [26:01<08:20,  1.71s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00228, train/loss_step=0.348, global_step=2946.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  76%|███████▌  | 915/1208 [26:01<08:20,  1.71s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.000173, train/loss_step=0.0482, global_step=2946.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  76%|███████▌  | 916/1208 [26:04<08:18,  1.71s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.000173, train/loss_step=0.0482, global_step=2946.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  76%|███████▌  | 916/1208 [26:04<08:18,  1.71s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.58e-5, train/loss_step=0.0127, global_step=2946.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  76%|███████▌  | 917/1208 [26:05<08:16,  1.71s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.58e-5, train/loss_step=0.0127, global_step=2946.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  76%|███████▌  | 917/1208 [26:05<08:16,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000585, train/loss_step=0.171, global_step=2947.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  76%|███████▌  | 918/1208 [26:06<08:14,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000585, train/loss_step=0.171, global_step=2947.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  76%|███████▌  | 918/1208 [26:06<08:14,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000696, train/loss_step=0.195, global_step=2947.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  76%|███████▌  | 919/1208 [26:07<08:12,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000696, train/loss_step=0.195, global_step=2947.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  76%|███████▌  | 919/1208 [26:07<08:12,  1.71s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0554, train/loss_vlb_step=0.000189, train/loss_step=0.0554, global_step=2947.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  76%|███████▌  | 920/1208 [26:10<08:11,  1.71s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0554, train/loss_vlb_step=0.000189, train/loss_step=0.0554, global_step=2947.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  76%|███████▌  | 920/1208 [26:10<08:11,  1.71s/it, loss=0.099, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=1.37e-5, train/loss_step=0.00231, global_step=2947.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  76%|███████▌  | 921/1208 [26:11<08:09,  1.71s/it, loss=0.099, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=1.37e-5, train/loss_step=0.00231, global_step=2947.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  76%|███████▌  | 921/1208 [26:11<08:09,  1.71s/it, loss=0.11, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00142, train/loss_step=0.287, global_step=2948.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]     Epoch 9:  76%|███████▋  | 922/1208 [26:12<08:07,  1.71s/it, loss=0.11, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00142, train/loss_step=0.287, global_step=2948.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  76%|███████▋  | 922/1208 [26:12<08:07,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000686, train/loss_step=0.195, global_step=2948.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  76%|███████▋  | 923/1208 [26:13<08:05,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000686, train/loss_step=0.195, global_step=2948.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  76%|███████▋  | 923/1208 [26:13<08:05,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00131, train/loss_step=0.321, global_step=2948.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  76%|███████▋  | 924/1208 [26:16<08:04,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00131, train/loss_step=0.321, global_step=2948.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  76%|███████▋  | 924/1208 [26:16<08:04,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00165, train/loss_step=0.341, global_step=2948.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  77%|███████▋  | 925/1208 [26:17<08:02,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00165, train/loss_step=0.341, global_step=2948.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  77%|███████▋  | 925/1208 [26:17<08:02,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0993, train/loss_vlb_step=0.000327, train/loss_step=0.0993, global_step=2949.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  77%|███████▋  | 926/1208 [26:18<08:00,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0993, train/loss_vlb_step=0.000327, train/loss_step=0.0993, global_step=2949.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  77%|███████▋  | 926/1208 [26:18<08:00,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.14e-5, train/loss_step=0.011, global_step=2949.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  77%|███████▋  | 927/1208 [26:19<07:58,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.14e-5, train/loss_step=0.011, global_step=2949.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  77%|███████▋  | 927/1208 [26:19<07:58,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0738, train/loss_vlb_step=0.00025, train/loss_step=0.0738, global_step=2949.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  77%|███████▋  | 928/1208 [26:23<07:57,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0738, train/loss_vlb_step=0.00025, train/loss_step=0.0738, global_step=2949.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  77%|███████▋  | 928/1208 [26:23<07:57,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0923, train/loss_vlb_step=0.000307, train/loss_step=0.0923, global_step=2949.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  77%|███████▋  | 929/1208 [26:24<07:55,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0923, train/loss_vlb_step=0.000307, train/loss_step=0.0923, global_step=2949.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  77%|███████▋  | 929/1208 [26:24<07:55,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00219, train/loss_step=0.346, global_step=2950.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  77%|███████▋  | 930/1208 [26:25<07:53,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00219, train/loss_step=0.346, global_step=2950.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  77%|███████▋  | 930/1208 [26:25<07:53,  1.70s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000103, train/loss_step=0.0269, global_step=2950.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  77%|███████▋  | 931/1208 [26:26<07:51,  1.70s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000103, train/loss_step=0.0269, global_step=2950.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  77%|███████▋  | 931/1208 [26:26<07:51,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0426, train/loss_vlb_step=0.000152, train/loss_step=0.0426, global_step=2950.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  77%|███████▋  | 932/1208 [26:29<07:50,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0426, train/loss_vlb_step=0.000152, train/loss_step=0.0426, global_step=2950.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  77%|███████▋  | 932/1208 [26:29<07:50,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000416, train/loss_step=0.126, global_step=2950.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  77%|███████▋  | 933/1208 [26:30<07:48,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000416, train/loss_step=0.126, global_step=2950.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  77%|███████▋  | 933/1208 [26:30<07:48,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000638, train/loss_step=0.180, global_step=2951.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  77%|███████▋  | 934/1208 [26:31<07:46,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000638, train/loss_step=0.180, global_step=2951.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  77%|███████▋  | 934/1208 [26:31<07:46,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000373, train/loss_step=0.113, global_step=2951.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  77%|███████▋  | 935/1208 [26:32<07:45,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000373, train/loss_step=0.113, global_step=2951.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  77%|███████▋  | 935/1208 [26:32<07:45,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00116, train/loss_step=0.281, global_step=2951.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  77%|███████▋  | 936/1208 [26:35<07:43,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00116, train/loss_step=0.281, global_step=2951.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  77%|███████▋  | 936/1208 [26:35<07:43,  1.70s/it, loss=0.18, v_num=0, train/loss_simple_step=0.632, train/loss_vlb_step=0.0222, train/loss_step=0.632, global_step=2951.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  78%|███████▊  | 937/1208 [26:36<07:41,  1.70s/it, loss=0.18, v_num=0, train/loss_simple_step=0.632, train/loss_vlb_step=0.0222, train/loss_step=0.632, global_step=2951.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  78%|███████▊  | 937/1208 [26:36<07:41,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000706, train/loss_step=0.191, global_step=2952.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  78%|███████▊  | 938/1208 [26:37<07:39,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000706, train/loss_step=0.191, global_step=2952.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  78%|███████▊  | 938/1208 [26:37<07:39,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000748, train/loss_step=0.207, global_step=2952.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  78%|███████▊  | 939/1208 [26:39<07:38,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000748, train/loss_step=0.207, global_step=2952.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  78%|███████▊  | 939/1208 [26:39<07:38,  1.70s/it, loss=0.201, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00417, train/loss_step=0.447, global_step=2952.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  78%|███████▊  | 940/1208 [26:42<07:36,  1.70s/it, loss=0.201, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00417, train/loss_step=0.447, global_step=2952.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  78%|███████▊  | 940/1208 [26:42<07:36,  1.70s/it, loss=0.204, v_num=0, train/loss_simple_step=0.0673, train/loss_vlb_step=0.000224, train/loss_step=0.0673, global_step=2952.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  78%|███████▊  | 941/1208 [26:43<07:34,  1.70s/it, loss=0.204, v_num=0, train/loss_simple_step=0.0673, train/loss_vlb_step=0.000224, train/loss_step=0.0673, global_step=2952.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  78%|███████▊  | 941/1208 [26:43<07:34,  1.70s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0961, train/loss_vlb_step=0.000316, train/loss_step=0.0961, global_step=2953.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  78%|███████▊  | 942/1208 [26:44<07:33,  1.70s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0961, train/loss_vlb_step=0.000316, train/loss_step=0.0961, global_step=2953.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  78%|███████▊  | 942/1208 [26:44<07:33,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00465, train/loss_vlb_step=2.55e-5, train/loss_step=0.00465, global_step=2953.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  78%|███████▊  | 943/1208 [26:45<07:31,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00465, train/loss_vlb_step=2.55e-5, train/loss_step=0.00465, global_step=2953.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  78%|███████▊  | 943/1208 [26:45<07:31,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000117, train/loss_step=0.0332, global_step=2953.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  78%|███████▊  | 944/1208 [26:48<07:29,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000117, train/loss_step=0.0332, global_step=2953.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  78%|███████▊  | 944/1208 [26:48<07:29,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000453, train/loss_step=0.135, global_step=2953.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  78%|███████▊  | 945/1208 [26:49<07:28,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000453, train/loss_step=0.135, global_step=2953.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  78%|███████▊  | 945/1208 [26:49<07:28,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00142, train/loss_step=0.284, global_step=2954.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  78%|███████▊  | 946/1208 [26:50<07:26,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00142, train/loss_step=0.284, global_step=2954.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  78%|███████▊  | 946/1208 [26:50<07:26,  1.70s/it, loss=0.187, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00235, train/loss_step=0.363, global_step=2954.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  78%|███████▊  | 947/1208 [26:51<07:24,  1.70s/it, loss=0.187, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00235, train/loss_step=0.363, global_step=2954.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  78%|███████▊  | 947/1208 [26:51<07:24,  1.70s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0802, train/loss_vlb_step=0.000267, train/loss_step=0.0802, global_step=2954.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  78%|███████▊  | 948/1208 [26:55<07:22,  1.70s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0802, train/loss_vlb_step=0.000267, train/loss_step=0.0802, global_step=2954.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  78%|███████▊  | 948/1208 [26:55<07:22,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.000169, train/loss_step=0.0471, global_step=2954.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  79%|███████▊  | 949/1208 [26:56<07:21,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.000169, train/loss_step=0.0471, global_step=2954.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  79%|███████▊  | 949/1208 [26:56<07:21,  1.70s/it, loss=0.175, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000475, train/loss_step=0.143, global_step=2955.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  79%|███████▊  | 950/1208 [26:57<07:19,  1.70s/it, loss=0.175, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000475, train/loss_step=0.143, global_step=2955.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  79%|███████▊  | 950/1208 [26:57<07:19,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000749, train/loss_step=0.199, global_step=2955.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  79%|███████▊  | 951/1208 [26:58<07:17,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000749, train/loss_step=0.199, global_step=2955.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  79%|███████▊  | 951/1208 [26:58<07:17,  1.70s/it, loss=0.187, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=2955.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  79%|███████▉  | 952/1208 [27:01<07:16,  1.70s/it, loss=0.187, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=2955.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  79%|███████▉  | 952/1208 [27:01<07:16,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0975, train/loss_vlb_step=0.000326, train/loss_step=0.0975, global_step=2955.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  79%|███████▉  | 953/1208 [27:02<07:14,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0975, train/loss_vlb_step=0.000326, train/loss_step=0.0975, global_step=2955.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  79%|███████▉  | 953/1208 [27:02<07:14,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0813, train/loss_vlb_step=0.00027, train/loss_step=0.0813, global_step=2956.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  79%|███████▉  | 954/1208 [27:03<07:12,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0813, train/loss_vlb_step=0.00027, train/loss_step=0.0813, global_step=2956.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  79%|███████▉  | 954/1208 [27:03<07:12,  1.70s/it, loss=0.183, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000511, train/loss_step=0.154, global_step=2956.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  79%|███████▉  | 955/1208 [27:04<07:10,  1.70s/it, loss=0.183, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000511, train/loss_step=0.154, global_step=2956.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  79%|███████▉  | 955/1208 [27:04<07:10,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.002, train/loss_step=0.347, global_step=2956.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  79%|███████▉  | 956/1208 [27:07<07:09,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.002, train/loss_step=0.347, global_step=2956.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  79%|███████▉  | 956/1208 [27:07<07:09,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000524, train/loss_step=0.158, global_step=2956.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  79%|███████▉  | 957/1208 [27:08<07:07,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000524, train/loss_step=0.158, global_step=2956.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  79%|███████▉  | 957/1208 [27:08<07:07,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.000109, train/loss_step=0.0275, global_step=2957.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  79%|███████▉  | 958/1208 [27:09<07:05,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.000109, train/loss_step=0.0275, global_step=2957.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  79%|███████▉  | 958/1208 [27:09<07:05,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000556, train/loss_step=0.166, global_step=2957.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  79%|███████▉  | 959/1208 [27:10<07:03,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000556, train/loss_step=0.166, global_step=2957.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  79%|███████▉  | 959/1208 [27:10<07:03,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000106, train/loss_step=0.0265, global_step=2957.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  79%|███████▉  | 960/1208 [27:13<07:02,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000106, train/loss_step=0.0265, global_step=2957.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  79%|███████▉  | 960/1208 [27:13<07:02,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0687, train/loss_vlb_step=0.000233, train/loss_step=0.0687, global_step=2957.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  80%|███████▉  | 961/1208 [27:14<07:00,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0687, train/loss_vlb_step=0.000233, train/loss_step=0.0687, global_step=2957.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  80%|███████▉  | 961/1208 [27:14<07:00,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000603, train/loss_step=0.172, global_step=2958.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  80%|███████▉  | 962/1208 [27:15<06:58,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000603, train/loss_step=0.172, global_step=2958.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  80%|███████▉  | 962/1208 [27:15<06:58,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00645, train/loss_vlb_step=3.22e-5, train/loss_step=0.00645, global_step=2958.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  80%|███████▉  | 963/1208 [27:16<06:56,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00645, train/loss_vlb_step=3.22e-5, train/loss_step=0.00645, global_step=2958.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  80%|███████▉  | 963/1208 [27:16<06:56,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.00056, train/loss_step=0.165, global_step=2958.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  80%|███████▉  | 964/1208 [27:19<06:55,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.00056, train/loss_step=0.165, global_step=2958.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  80%|███████▉  | 964/1208 [27:19<06:55,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.573, train/loss_vlb_step=0.0102, train/loss_step=0.573, global_step=2958.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  80%|███████▉  | 965/1208 [27:20<06:53,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.573, train/loss_vlb_step=0.0102, train/loss_step=0.573, global_step=2958.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  80%|███████▉  | 965/1208 [27:20<06:53,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.0015, train/loss_step=0.293, global_step=2959.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  80%|███████▉  | 966/1208 [27:21<06:51,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.0015, train/loss_step=0.293, global_step=2959.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  80%|███████▉  | 966/1208 [27:21<06:51,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.36e-5, train/loss_step=0.0123, global_step=2959.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  80%|████████  | 967/1208 [27:22<06:49,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.36e-5, train/loss_step=0.0123, global_step=2959.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  80%|████████  | 967/1208 [27:22<06:49,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000435, train/loss_step=0.132, global_step=2959.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  80%|████████  | 968/1208 [27:25<06:47,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000435, train/loss_step=0.132, global_step=2959.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  80%|████████  | 968/1208 [27:25<06:47,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=2959.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  80%|████████  | 969/1208 [27:26<06:46,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=2959.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  80%|████████  | 969/1208 [27:26<06:46,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000558, train/loss_step=0.162, global_step=2960.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  80%|████████  | 970/1208 [27:27<06:44,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000558, train/loss_step=0.162, global_step=2960.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  80%|████████  | 970/1208 [27:27<06:44,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0906, train/loss_vlb_step=0.0003, train/loss_step=0.0906, global_step=2960.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  80%|████████  | 971/1208 [27:28<06:42,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0906, train/loss_vlb_step=0.0003, train/loss_step=0.0906, global_step=2960.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  80%|████████  | 971/1208 [27:28<06:42,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.42e-5, train/loss_step=0.00246, global_step=2960.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  80%|████████  | 972/1208 [27:31<06:40,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.42e-5, train/loss_step=0.00246, global_step=2960.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  80%|████████  | 972/1208 [27:31<06:40,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0504, train/loss_vlb_step=0.000177, train/loss_step=0.0504, global_step=2960.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  81%|████████  | 973/1208 [27:32<06:39,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0504, train/loss_vlb_step=0.000177, train/loss_step=0.0504, global_step=2960.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  81%|████████  | 973/1208 [27:32<06:39,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00608, train/loss_vlb_step=3.09e-5, train/loss_step=0.00608, global_step=2961.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  81%|████████  | 974/1208 [27:33<06:37,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00608, train/loss_vlb_step=3.09e-5, train/loss_step=0.00608, global_step=2961.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  81%|████████  | 974/1208 [27:33<06:37,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0515, train/loss_vlb_step=0.000182, train/loss_step=0.0515, global_step=2961.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  81%|████████  | 975/1208 [27:34<06:35,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0515, train/loss_vlb_step=0.000182, train/loss_step=0.0515, global_step=2961.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  81%|████████  | 975/1208 [27:34<06:35,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0966, train/loss_vlb_step=0.00032, train/loss_step=0.0966, global_step=2961.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  81%|████████  | 976/1208 [27:37<06:33,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0966, train/loss_vlb_step=0.00032, train/loss_step=0.0966, global_step=2961.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  81%|████████  | 976/1208 [27:37<06:33,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.000204, train/loss_step=0.0615, global_step=2961.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  81%|████████  | 977/1208 [27:38<06:32,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.000204, train/loss_step=0.0615, global_step=2961.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  81%|████████  | 977/1208 [27:38<06:32,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000713, train/loss_step=0.190, global_step=2962.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  81%|████████  | 978/1208 [27:39<06:30,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000713, train/loss_step=0.190, global_step=2962.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  81%|████████  | 978/1208 [27:39<06:30,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0522, train/loss_vlb_step=0.000186, train/loss_step=0.0522, global_step=2962.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  81%|████████  | 979/1208 [27:40<06:28,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0522, train/loss_vlb_step=0.000186, train/loss_step=0.0522, global_step=2962.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  81%|████████  | 979/1208 [27:40<06:28,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000116, train/loss_step=0.0299, global_step=2962.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  81%|████████  | 980/1208 [27:43<06:27,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000116, train/loss_step=0.0299, global_step=2962.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  81%|████████  | 980/1208 [27:43<06:27,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0585, train/loss_vlb_step=0.000204, train/loss_step=0.0585, global_step=2962.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  81%|████████  | 981/1208 [27:44<06:25,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0585, train/loss_vlb_step=0.000204, train/loss_step=0.0585, global_step=2962.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  81%|████████  | 981/1208 [27:44<06:25,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0515, train/loss_vlb_step=0.00018, train/loss_step=0.0515, global_step=2963.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  81%|████████▏ | 982/1208 [27:45<06:23,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0515, train/loss_vlb_step=0.00018, train/loss_step=0.0515, global_step=2963.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  81%|████████▏ | 982/1208 [27:45<06:23,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000792, train/loss_step=0.208, global_step=2963.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  81%|████████▏ | 983/1208 [27:46<06:21,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000792, train/loss_step=0.208, global_step=2963.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  81%|████████▏ | 983/1208 [27:46<06:21,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.448, train/loss_vlb_step=0.00423, train/loss_step=0.448, global_step=2963.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  81%|████████▏ | 984/1208 [27:50<06:20,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.448, train/loss_vlb_step=0.00423, train/loss_step=0.448, global_step=2963.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  81%|████████▏ | 984/1208 [27:50<06:20,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.084, train/loss_vlb_step=0.000277, train/loss_step=0.084, global_step=2963.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  82%|████████▏ | 985/1208 [27:51<06:18,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.084, train/loss_vlb_step=0.000277, train/loss_step=0.084, global_step=2963.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  82%|████████▏ | 985/1208 [27:51<06:18,  1.70s/it, loss=0.107, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000906, train/loss_step=0.235, global_step=2964.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  82%|████████▏ | 986/1208 [27:52<06:16,  1.70s/it, loss=0.107, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000906, train/loss_step=0.235, global_step=2964.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  82%|████████▏ | 986/1208 [27:52<06:16,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.482, train/loss_vlb_step=0.00487, train/loss_step=0.482, global_step=2964.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  82%|████████▏ | 987/1208 [27:53<06:14,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.482, train/loss_vlb_step=0.00487, train/loss_step=0.482, global_step=2964.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  82%|████████▏ | 987/1208 [27:53<06:14,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00184, train/loss_step=0.319, global_step=2964.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  82%|████████▏ | 988/1208 [27:56<06:13,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00184, train/loss_step=0.319, global_step=2964.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  82%|████████▏ | 988/1208 [27:56<06:13,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.535, train/loss_vlb_step=0.00434, train/loss_step=0.535, global_step=2964.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  82%|████████▏ | 989/1208 [27:57<06:11,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.535, train/loss_vlb_step=0.00434, train/loss_step=0.535, global_step=2964.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  82%|████████▏ | 989/1208 [27:57<06:11,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00316, train/loss_vlb_step=1.77e-5, train/loss_step=0.00316, global_step=2965.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  82%|████████▏ | 990/1208 [27:58<06:09,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00316, train/loss_vlb_step=1.77e-5, train/loss_step=0.00316, global_step=2965.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  82%|████████▏ | 990/1208 [27:58<06:09,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000402, train/loss_step=0.120, global_step=2965.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  82%|████████▏ | 991/1208 [27:59<06:07,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000402, train/loss_step=0.120, global_step=2965.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  82%|████████▏ | 991/1208 [27:59<06:07,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.456, train/loss_vlb_step=0.00605, train/loss_step=0.456, global_step=2965.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  82%|████████▏ | 992/1208 [28:02<06:06,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.456, train/loss_vlb_step=0.00605, train/loss_step=0.456, global_step=2965.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  82%|████████▏ | 992/1208 [28:02<06:06,  1.70s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000137, train/loss_step=0.0373, global_step=2965.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  82%|████████▏ | 993/1208 [28:04<06:04,  1.70s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000137, train/loss_step=0.0373, global_step=2965.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  82%|████████▏ | 993/1208 [28:04<06:04,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0421, train/loss_vlb_step=0.000156, train/loss_step=0.0421, global_step=2966.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  82%|████████▏ | 994/1208 [28:05<06:02,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0421, train/loss_vlb_step=0.000156, train/loss_step=0.0421, global_step=2966.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  82%|████████▏ | 994/1208 [28:05<06:02,  1.70s/it, loss=0.199, v_num=0, train/loss_simple_step=0.471, train/loss_vlb_step=0.00361, train/loss_step=0.471, global_step=2966.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  82%|████████▏ | 995/1208 [28:06<06:00,  1.69s/it, loss=0.199, v_num=0, train/loss_simple_step=0.471, train/loss_vlb_step=0.00361, train/loss_step=0.471, global_step=2966.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  82%|████████▏ | 995/1208 [28:06<06:00,  1.69s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0941, train/loss_vlb_step=0.000311, train/loss_step=0.0941, global_step=2966.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  82%|████████▏ | 996/1208 [28:09<05:59,  1.70s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0941, train/loss_vlb_step=0.000311, train/loss_step=0.0941, global_step=2966.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  82%|████████▏ | 996/1208 [28:09<05:59,  1.70s/it, loss=0.21, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00126, train/loss_step=0.274, global_step=2966.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  83%|████████▎ | 997/1208 [28:10<05:57,  1.70s/it, loss=0.21, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00126, train/loss_step=0.274, global_step=2966.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  83%|████████▎ | 997/1208 [28:10<05:57,  1.70s/it, loss=0.2, v_num=0, train/loss_simple_step=0.00812, train/loss_vlb_step=3.99e-5, train/loss_step=0.00812, global_step=2967.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  83%|████████▎ | 998/1208 [28:11<05:55,  1.69s/it, loss=0.2, v_num=0, train/loss_simple_step=0.00812, train/loss_vlb_step=3.99e-5, train/loss_step=0.00812, global_step=2967.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  83%|████████▎ | 998/1208 [28:11<05:55,  1.69s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0852, train/loss_vlb_step=0.000283, train/loss_step=0.0852, global_step=2967.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  83%|████████▎ | 999/1208 [28:12<05:54,  1.69s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0852, train/loss_vlb_step=0.000283, train/loss_step=0.0852, global_step=2967.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  83%|████████▎ | 999/1208 [28:12<05:54,  1.69s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.51e-5, train/loss_step=0.0122, global_step=2967.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  83%|████████▎ | 1000/1208 [28:15<05:52,  1.70s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.51e-5, train/loss_step=0.0122, global_step=2967.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  83%|████████▎ | 1000/1208 [28:15<05:52,  1.70s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.26e-5, train/loss_step=0.00215, global_step=2967.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  83%|████████▎ | 1001/1208 [28:16<05:50,  1.70s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.26e-5, train/loss_step=0.00215, global_step=2967.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  83%|████████▎ | 1001/1208 [28:16<05:50,  1.70s/it, loss=0.215, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00222, train/loss_step=0.374, global_step=2968.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  83%|████████▎ | 1002/1208 [28:17<05:49,  1.69s/it, loss=0.215, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00222, train/loss_step=0.374, global_step=2968.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  83%|████████▎ | 1002/1208 [28:17<05:49,  1.69s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000137, train/loss_step=0.0381, global_step=2968.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  83%|████████▎ | 1003/1208 [28:18<05:47,  1.69s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000137, train/loss_step=0.0381, global_step=2968.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  83%|████████▎ | 1003/1208 [28:18<05:47,  1.69s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.42e-5, train/loss_step=0.0235, global_step=2968.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  83%|████████▎ | 1004/1208 [28:22<05:45,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.42e-5, train/loss_step=0.0235, global_step=2968.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  83%|████████▎ | 1004/1208 [28:22<05:45,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00332, train/loss_vlb_step=1.94e-5, train/loss_step=0.00332, global_step=2968.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  83%|████████▎ | 1005/1208 [28:23<05:44,  1.69s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00332, train/loss_vlb_step=1.94e-5, train/loss_step=0.00332, global_step=2968.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  83%|████████▎ | 1005/1208 [28:23<05:44,  1.69s/it, loss=0.185, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00157, train/loss_step=0.328, global_step=2969.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  83%|████████▎ | 1006/1208 [28:24<05:42,  1.69s/it, loss=0.185, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00157, train/loss_step=0.328, global_step=2969.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  83%|████████▎ | 1006/1208 [28:24<05:42,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=2969.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  83%|████████▎ | 1007/1208 [28:25<05:40,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=2969.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  83%|████████▎ | 1007/1208 [28:25<05:40,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000116, train/loss_step=0.031, global_step=2969.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  83%|████████▎ | 1008/1208 [28:28<05:38,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000116, train/loss_step=0.031, global_step=2969.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  83%|████████▎ | 1008/1208 [28:28<05:38,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.0007, train/loss_step=0.186, global_step=2969.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  84%|████████▎ | 1009/1208 [28:29<05:37,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.0007, train/loss_step=0.186, global_step=2969.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  84%|████████▎ | 1009/1208 [28:29<05:37,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0916, train/loss_vlb_step=0.000307, train/loss_step=0.0916, global_step=2970.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  84%|████████▎ | 1010/1208 [28:30<05:35,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0916, train/loss_vlb_step=0.000307, train/loss_step=0.0916, global_step=2970.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  84%|████████▎ | 1010/1208 [28:30<05:35,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=8.83e-5, train/loss_step=0.0221, global_step=2970.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  84%|████████▎ | 1011/1208 [28:31<05:33,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=8.83e-5, train/loss_step=0.0221, global_step=2970.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  84%|████████▎ | 1011/1208 [28:31<05:33,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.92e-5, train/loss_step=0.0152, global_step=2970.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  84%|████████▍ | 1012/1208 [28:34<05:32,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.92e-5, train/loss_step=0.0152, global_step=2970.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  84%|████████▍ | 1012/1208 [28:34<05:32,  1.69s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00449, train/loss_vlb_step=2.45e-5, train/loss_step=0.00449, global_step=2970.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  84%|████████▍ | 1013/1208 [28:36<05:30,  1.69s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00449, train/loss_vlb_step=2.45e-5, train/loss_step=0.00449, global_step=2970.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  84%|████████▍ | 1013/1208 [28:36<05:30,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0777, train/loss_vlb_step=0.000258, train/loss_step=0.0777, global_step=2971.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  84%|████████▍ | 1014/1208 [28:37<05:28,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0777, train/loss_vlb_step=0.000258, train/loss_step=0.0777, global_step=2971.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  84%|████████▍ | 1014/1208 [28:37<05:28,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.0012, train/loss_step=0.274, global_step=2971.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  84%|████████▍ | 1015/1208 [28:38<05:26,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.0012, train/loss_step=0.274, global_step=2971.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  84%|████████▍ | 1015/1208 [28:38<05:26,  1.69s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.55e-5, train/loss_step=0.0123, global_step=2971.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  84%|████████▍ | 1016/1208 [28:41<05:25,  1.69s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.55e-5, train/loss_step=0.0123, global_step=2971.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  84%|████████▍ | 1016/1208 [28:41<05:25,  1.69s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000811, train/loss_step=0.208, global_step=2971.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  84%|████████▍ | 1017/1208 [28:42<05:23,  1.69s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000811, train/loss_step=0.208, global_step=2971.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  84%|████████▍ | 1017/1208 [28:42<05:23,  1.69s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.36e-5, train/loss_step=0.00423, global_step=2972.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  84%|████████▍ | 1018/1208 [28:43<05:21,  1.69s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.36e-5, train/loss_step=0.00423, global_step=2972.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  84%|████████▍ | 1018/1208 [28:43<05:21,  1.69s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.06e-5, train/loss_step=0.00174, global_step=2972.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  84%|████████▍ | 1019/1208 [28:44<05:19,  1.69s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.06e-5, train/loss_step=0.00174, global_step=2972.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  84%|████████▍ | 1019/1208 [28:44<05:19,  1.69s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000538, train/loss_step=0.161, global_step=2972.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  84%|████████▍ | 1020/1208 [28:47<05:18,  1.69s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000538, train/loss_step=0.161, global_step=2972.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  84%|████████▍ | 1020/1208 [28:47<05:18,  1.69s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000154, train/loss_step=0.0416, global_step=2972.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  85%|████████▍ | 1021/1208 [28:48<05:16,  1.69s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000154, train/loss_step=0.0416, global_step=2972.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  85%|████████▍ | 1021/1208 [28:48<05:16,  1.69s/it, loss=0.0818, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=1.35e-5, train/loss_step=0.00232, global_step=2973.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  85%|████████▍ | 1022/1208 [28:49<05:14,  1.69s/it, loss=0.0818, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=1.35e-5, train/loss_step=0.00232, global_step=2973.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  85%|████████▍ | 1022/1208 [28:49<05:14,  1.69s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00118, train/loss_step=0.266, global_step=2973.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  85%|████████▍ | 1023/1208 [28:50<05:13,  1.69s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00118, train/loss_step=0.266, global_step=2973.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  85%|████████▍ | 1023/1208 [28:50<05:13,  1.69s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=1.97e-5, train/loss_step=0.00356, global_step=2973.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  85%|████████▍ | 1024/1208 [28:54<05:11,  1.69s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=1.97e-5, train/loss_step=0.00356, global_step=2973.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  85%|████████▍ | 1024/1208 [28:54<05:11,  1.69s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0807, train/loss_vlb_step=0.000267, train/loss_step=0.0807, global_step=2973.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  85%|████████▍ | 1025/1208 [28:55<05:09,  1.69s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0807, train/loss_vlb_step=0.000267, train/loss_step=0.0807, global_step=2973.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  85%|████████▍ | 1025/1208 [28:55<05:09,  1.69s/it, loss=0.0806, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=7.85e-5, train/loss_step=0.0198, global_step=2974.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  85%|████████▍ | 1026/1208 [28:56<05:08,  1.69s/it, loss=0.0806, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=7.85e-5, train/loss_step=0.0198, global_step=2974.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  85%|████████▍ | 1026/1208 [28:56<05:08,  1.69s/it, loss=0.077, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.000131, train/loss_step=0.0352, global_step=2974.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  85%|████████▌ | 1027/1208 [28:57<05:06,  1.69s/it, loss=0.077, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.000131, train/loss_step=0.0352, global_step=2974.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  85%|████████▌ | 1027/1208 [28:57<05:06,  1.69s/it, loss=0.076, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=4.97e-5, train/loss_step=0.0112, global_step=2974.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  85%|████████▌ | 1028/1208 [29:00<05:04,  1.69s/it, loss=0.076, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=4.97e-5, train/loss_step=0.0112, global_step=2974.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  85%|████████▌ | 1028/1208 [29:00<05:04,  1.69s/it, loss=0.078, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000939, train/loss_step=0.227, global_step=2974.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  85%|████████▌ | 1029/1208 [29:01<05:02,  1.69s/it, loss=0.078, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000939, train/loss_step=0.227, global_step=2974.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  85%|████████▌ | 1029/1208 [29:01<05:02,  1.69s/it, loss=0.0818, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000574, train/loss_step=0.168, global_step=2975.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  85%|████████▌ | 1030/1208 [29:02<05:01,  1.69s/it, loss=0.0818, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000574, train/loss_step=0.168, global_step=2975.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  85%|████████▌ | 1030/1208 [29:02<05:01,  1.69s/it, loss=0.0809, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.47e-5, train/loss_step=0.00268, global_step=2975.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  85%|████████▌ | 1031/1208 [29:03<04:59,  1.69s/it, loss=0.0809, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.47e-5, train/loss_step=0.00268, global_step=2975.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  85%|████████▌ | 1031/1208 [29:03<04:59,  1.69s/it, loss=0.0881, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000527, train/loss_step=0.159, global_step=2975.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  85%|████████▌ | 1032/1208 [29:06<04:57,  1.69s/it, loss=0.0881, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000527, train/loss_step=0.159, global_step=2975.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  85%|████████▌ | 1032/1208 [29:06<04:57,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00275, train/loss_step=0.377, global_step=2975.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  86%|████████▌ | 1033/1208 [29:07<04:56,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00275, train/loss_step=0.377, global_step=2975.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  86%|████████▌ | 1033/1208 [29:07<04:56,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.000977, train/loss_step=0.251, global_step=2976.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  86%|████████▌ | 1034/1208 [29:08<04:54,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.000977, train/loss_step=0.251, global_step=2976.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  86%|████████▌ | 1034/1208 [29:08<04:54,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00161, train/loss_step=0.297, global_step=2976.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  86%|████████▌ | 1035/1208 [29:09<04:52,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00161, train/loss_step=0.297, global_step=2976.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  86%|████████▌ | 1035/1208 [29:09<04:52,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00269, train/loss_step=0.402, global_step=2976.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  86%|████████▌ | 1036/1208 [29:12<04:50,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00269, train/loss_step=0.402, global_step=2976.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  86%|████████▌ | 1036/1208 [29:12<04:50,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0842, train/loss_vlb_step=0.000283, train/loss_step=0.0842, global_step=2976.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  86%|████████▌ | 1037/1208 [29:13<04:49,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0842, train/loss_vlb_step=0.000283, train/loss_step=0.0842, global_step=2976.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  86%|████████▌ | 1037/1208 [29:13<04:49,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00461, train/loss_vlb_step=2.36e-5, train/loss_step=0.00461, global_step=2977.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  86%|████████▌ | 1038/1208 [29:14<04:47,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00461, train/loss_vlb_step=2.36e-5, train/loss_step=0.00461, global_step=2977.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  86%|████████▌ | 1038/1208 [29:14<04:47,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.000183, train/loss_step=0.0526, global_step=2977.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  86%|████████▌ | 1039/1208 [29:15<04:45,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.000183, train/loss_step=0.0526, global_step=2977.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  86%|████████▌ | 1039/1208 [29:15<04:45,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.4e-5, train/loss_step=0.0146, global_step=2977.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  86%|████████▌ | 1040/1208 [29:18<04:44,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.4e-5, train/loss_step=0.0146, global_step=2977.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  86%|████████▌ | 1040/1208 [29:18<04:44,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.89e-5, train/loss_step=0.0164, global_step=2977.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  86%|████████▌ | 1041/1208 [29:19<04:42,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.89e-5, train/loss_step=0.0164, global_step=2977.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  86%|████████▌ | 1041/1208 [29:19<04:42,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000385, train/loss_step=0.116, global_step=2978.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  86%|████████▋ | 1042/1208 [29:20<04:40,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000385, train/loss_step=0.116, global_step=2978.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  86%|████████▋ | 1042/1208 [29:20<04:40,  1.69s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=1.01e-5, train/loss_step=0.00167, global_step=2978.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  86%|████████▋ | 1043/1208 [29:21<04:38,  1.69s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=1.01e-5, train/loss_step=0.00167, global_step=2978.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  86%|████████▋ | 1043/1208 [29:21<04:38,  1.69s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.08e-5, train/loss_step=0.00182, global_step=2978.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  86%|████████▋ | 1044/1208 [29:24<04:37,  1.69s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.08e-5, train/loss_step=0.00182, global_step=2978.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  86%|████████▋ | 1044/1208 [29:24<04:37,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00137, train/loss_step=0.285, global_step=2978.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  87%|████████▋ | 1045/1208 [29:25<04:35,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00137, train/loss_step=0.285, global_step=2978.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  87%|████████▋ | 1045/1208 [29:25<04:35,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000639, train/loss_step=0.183, global_step=2979.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  87%|████████▋ | 1046/1208 [29:26<04:33,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000639, train/loss_step=0.183, global_step=2979.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  87%|████████▋ | 1046/1208 [29:26<04:33,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000745, train/loss_step=0.203, global_step=2979.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  87%|████████▋ | 1047/1208 [29:27<04:31,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000745, train/loss_step=0.203, global_step=2979.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  87%|████████▋ | 1047/1208 [29:27<04:31,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.00033, train/loss_step=0.100, global_step=2979.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  87%|████████▋ | 1048/1208 [29:30<04:30,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.00033, train/loss_step=0.100, global_step=2979.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  87%|████████▋ | 1048/1208 [29:30<04:30,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000131, train/loss_step=0.0353, global_step=2979.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  87%|████████▋ | 1049/1208 [29:31<04:28,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000131, train/loss_step=0.0353, global_step=2979.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  87%|████████▋ | 1049/1208 [29:31<04:28,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00138, train/loss_step=0.324, global_step=2980.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  87%|████████▋ | 1050/1208 [29:32<04:26,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00138, train/loss_step=0.324, global_step=2980.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  87%|████████▋ | 1050/1208 [29:32<04:26,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00624, train/loss_vlb_step=3.2e-5, train/loss_step=0.00624, global_step=2980.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  87%|████████▋ | 1051/1208 [29:33<04:24,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00624, train/loss_vlb_step=3.2e-5, train/loss_step=0.00624, global_step=2980.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  87%|████████▋ | 1051/1208 [29:33<04:24,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.000137, train/loss_step=0.0395, global_step=2980.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  87%|████████▋ | 1052/1208 [29:36<04:23,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.000137, train/loss_step=0.0395, global_step=2980.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  87%|████████▋ | 1052/1208 [29:36<04:23,  1.69s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.64e-5, train/loss_step=0.0129, global_step=2980.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  87%|████████▋ | 1053/1208 [29:37<04:21,  1.69s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.64e-5, train/loss_step=0.0129, global_step=2980.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  87%|████████▋ | 1053/1208 [29:37<04:21,  1.69s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00605, train/loss_vlb_step=3.11e-5, train/loss_step=0.00605, global_step=2981.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  87%|████████▋ | 1054/1208 [29:38<04:19,  1.69s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00605, train/loss_vlb_step=3.11e-5, train/loss_step=0.00605, global_step=2981.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  87%|████████▋ | 1054/1208 [29:38<04:19,  1.69s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.000142, train/loss_step=0.0379, global_step=2981.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  87%|████████▋ | 1055/1208 [29:39<04:18,  1.69s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.000142, train/loss_step=0.0379, global_step=2981.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  87%|████████▋ | 1055/1208 [29:39<04:18,  1.69s/it, loss=0.081, v_num=0, train/loss_simple_step=0.0945, train/loss_vlb_step=0.00031, train/loss_step=0.0945, global_step=2981.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  87%|████████▋ | 1056/1208 [29:43<04:16,  1.69s/it, loss=0.081, v_num=0, train/loss_simple_step=0.0945, train/loss_vlb_step=0.00031, train/loss_step=0.0945, global_step=2981.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  87%|████████▋ | 1056/1208 [29:43<04:16,  1.69s/it, loss=0.0772, v_num=0, train/loss_simple_step=0.00789, train/loss_vlb_step=3.81e-5, train/loss_step=0.00789, global_step=2981.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  88%|████████▊ | 1057/1208 [29:44<04:14,  1.69s/it, loss=0.0772, v_num=0, train/loss_simple_step=0.00789, train/loss_vlb_step=3.81e-5, train/loss_step=0.00789, global_step=2981.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  88%|████████▊ | 1057/1208 [29:44<04:14,  1.69s/it, loss=0.0771, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.5e-5, train/loss_step=0.00257, global_step=2982.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  88%|████████▊ | 1058/1208 [29:45<04:13,  1.69s/it, loss=0.0771, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.5e-5, train/loss_step=0.00257, global_step=2982.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  88%|████████▊ | 1058/1208 [29:45<04:13,  1.69s/it, loss=0.0757, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000101, train/loss_step=0.0255, global_step=2982.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  88%|████████▊ | 1059/1208 [29:46<04:11,  1.69s/it, loss=0.0757, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000101, train/loss_step=0.0255, global_step=2982.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  88%|████████▊ | 1059/1208 [29:46<04:11,  1.69s/it, loss=0.0818, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.00045, train/loss_step=0.135, global_step=2982.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  88%|████████▊ | 1060/1208 [29:49<04:09,  1.69s/it, loss=0.0818, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.00045, train/loss_step=0.135, global_step=2982.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  88%|████████▊ | 1060/1208 [29:49<04:09,  1.69s/it, loss=0.089, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000563, train/loss_step=0.160, global_step=2982.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  88%|████████▊ | 1061/1208 [29:50<04:08,  1.69s/it, loss=0.089, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000563, train/loss_step=0.160, global_step=2982.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  88%|████████▊ | 1061/1208 [29:50<04:08,  1.69s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000786, train/loss_step=0.207, global_step=2983.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  88%|████████▊ | 1062/1208 [29:51<04:06,  1.69s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000786, train/loss_step=0.207, global_step=2983.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  88%|████████▊ | 1062/1208 [29:51<04:06,  1.69s/it, loss=0.114, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00356, train/loss_step=0.402, global_step=2983.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  88%|████████▊ | 1063/1208 [29:52<04:04,  1.69s/it, loss=0.114, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00356, train/loss_step=0.402, global_step=2983.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  88%|████████▊ | 1063/1208 [29:52<04:04,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000521, train/loss_step=0.155, global_step=2983.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  88%|████████▊ | 1064/1208 [29:55<04:03,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000521, train/loss_step=0.155, global_step=2983.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  88%|████████▊ | 1064/1208 [29:55<04:03,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.611, train/loss_vlb_step=0.00711, train/loss_step=0.611, global_step=2983.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  88%|████████▊ | 1065/1208 [29:56<04:01,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.611, train/loss_vlb_step=0.00711, train/loss_step=0.611, global_step=2983.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  88%|████████▊ | 1065/1208 [29:56<04:01,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000933, train/loss_step=0.229, global_step=2984.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  88%|████████▊ | 1066/1208 [29:57<03:59,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000933, train/loss_step=0.229, global_step=2984.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  88%|████████▊ | 1066/1208 [29:57<03:59,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00128, train/loss_step=0.288, global_step=2984.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  88%|████████▊ | 1067/1208 [29:59<03:57,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00128, train/loss_step=0.288, global_step=2984.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  88%|████████▊ | 1067/1208 [29:59<03:57,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.00106, train/loss_step=0.233, global_step=2984.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  88%|████████▊ | 1068/1208 [30:02<03:56,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.00106, train/loss_step=0.233, global_step=2984.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  88%|████████▊ | 1068/1208 [30:02<03:56,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000806, train/loss_step=0.212, global_step=2984.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  88%|████████▊ | 1069/1208 [30:03<03:54,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000806, train/loss_step=0.212, global_step=2984.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  88%|████████▊ | 1069/1208 [30:03<03:54,  1.69s/it, loss=0.168, v_num=0, train/loss_simple_step=0.495, train/loss_vlb_step=0.00855, train/loss_step=0.495, global_step=2985.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  89%|████████▊ | 1070/1208 [30:04<03:52,  1.69s/it, loss=0.168, v_num=0, train/loss_simple_step=0.495, train/loss_vlb_step=0.00855, train/loss_step=0.495, global_step=2985.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  89%|████████▊ | 1070/1208 [30:04<03:52,  1.69s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.14e-5, train/loss_step=0.0111, global_step=2985.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  89%|████████▊ | 1071/1208 [30:05<03:50,  1.69s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.14e-5, train/loss_step=0.0111, global_step=2985.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  89%|████████▊ | 1071/1208 [30:05<03:50,  1.69s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000148, train/loss_step=0.0364, global_step=2985.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  89%|████████▊ | 1072/1208 [30:08<03:49,  1.69s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000148, train/loss_step=0.0364, global_step=2985.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  89%|████████▊ | 1072/1208 [30:08<03:49,  1.69s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.31e-5, train/loss_step=0.0196, global_step=2985.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  89%|████████▉ | 1073/1208 [30:09<03:47,  1.69s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.31e-5, train/loss_step=0.0196, global_step=2985.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  89%|████████▉ | 1073/1208 [30:09<03:47,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.76e-5, train/loss_step=0.0216, global_step=2986.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  89%|████████▉ | 1074/1208 [30:10<03:45,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.76e-5, train/loss_step=0.0216, global_step=2986.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  89%|████████▉ | 1074/1208 [30:10<03:45,  1.69s/it, loss=0.175, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000537, train/loss_step=0.156, global_step=2986.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  89%|████████▉ | 1075/1208 [30:11<03:44,  1.69s/it, loss=0.175, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000537, train/loss_step=0.156, global_step=2986.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  89%|████████▉ | 1075/1208 [30:11<03:44,  1.69s/it, loss=0.181, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000911, train/loss_step=0.220, global_step=2986.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  89%|████████▉ | 1076/1208 [30:15<03:42,  1.69s/it, loss=0.181, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000911, train/loss_step=0.220, global_step=2986.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  89%|████████▉ | 1076/1208 [30:15<03:42,  1.69s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=8.32e-5, train/loss_step=0.0195, global_step=2986.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  89%|████████▉ | 1077/1208 [30:16<03:40,  1.69s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=8.32e-5, train/loss_step=0.0195, global_step=2986.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  89%|████████▉ | 1077/1208 [30:16<03:40,  1.69s/it, loss=0.189, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000456, train/loss_step=0.139, global_step=2987.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  89%|████████▉ | 1078/1208 [30:17<03:39,  1.69s/it, loss=0.189, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000456, train/loss_step=0.139, global_step=2987.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  89%|████████▉ | 1078/1208 [30:17<03:39,  1.69s/it, loss=0.195, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000508, train/loss_step=0.152, global_step=2987.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  89%|████████▉ | 1079/1208 [30:18<03:37,  1.69s/it, loss=0.195, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000508, train/loss_step=0.152, global_step=2987.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  89%|████████▉ | 1079/1208 [30:18<03:37,  1.69s/it, loss=0.194, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000343, train/loss_step=0.105, global_step=2987.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  89%|████████▉ | 1080/1208 [30:21<03:35,  1.69s/it, loss=0.194, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000343, train/loss_step=0.105, global_step=2987.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  89%|████████▉ | 1080/1208 [30:21<03:35,  1.69s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00652, train/loss_vlb_step=3.33e-5, train/loss_step=0.00652, global_step=2987.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  89%|████████▉ | 1081/1208 [30:22<03:34,  1.69s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00652, train/loss_vlb_step=3.33e-5, train/loss_step=0.00652, global_step=2987.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  89%|████████▉ | 1081/1208 [30:22<03:34,  1.69s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.06e-5, train/loss_step=0.0113, global_step=2988.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  90%|████████▉ | 1082/1208 [30:23<03:32,  1.69s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.06e-5, train/loss_step=0.0113, global_step=2988.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  90%|████████▉ | 1082/1208 [30:23<03:32,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000927, train/loss_step=0.217, global_step=2988.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  90%|████████▉ | 1083/1208 [30:24<03:30,  1.68s/it, loss=0.167, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000927, train/loss_step=0.217, global_step=2988.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  90%|████████▉ | 1083/1208 [30:24<03:30,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00719, train/loss_vlb_step=3.48e-5, train/loss_step=0.00719, global_step=2988.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  90%|████████▉ | 1084/1208 [30:28<03:29,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00719, train/loss_vlb_step=3.48e-5, train/loss_step=0.00719, global_step=2988.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  90%|████████▉ | 1084/1208 [30:28<03:29,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00146, train/loss_step=0.309, global_step=2988.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  90%|████████▉ | 1085/1208 [30:29<03:27,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00146, train/loss_step=0.309, global_step=2988.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  90%|████████▉ | 1085/1208 [30:29<03:27,  1.69s/it, loss=0.156, v_num=0, train/loss_simple_step=0.461, train/loss_vlb_step=0.00453, train/loss_step=0.461, global_step=2989.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  90%|████████▉ | 1086/1208 [30:30<03:25,  1.69s/it, loss=0.156, v_num=0, train/loss_simple_step=0.461, train/loss_vlb_step=0.00453, train/loss_step=0.461, global_step=2989.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  90%|████████▉ | 1086/1208 [30:30<03:25,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00329, train/loss_vlb_step=1.85e-5, train/loss_step=0.00329, global_step=2989.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  90%|████████▉ | 1087/1208 [30:31<03:23,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00329, train/loss_vlb_step=1.85e-5, train/loss_step=0.00329, global_step=2989.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  90%|████████▉ | 1087/1208 [30:31<03:23,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.085, train/loss_vlb_step=0.000281, train/loss_step=0.085, global_step=2989.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  90%|█████████ | 1088/1208 [30:34<03:22,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.085, train/loss_vlb_step=0.000281, train/loss_step=0.085, global_step=2989.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  90%|█████████ | 1088/1208 [30:34<03:22,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00151, train/loss_step=0.287, global_step=2989.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  90%|█████████ | 1089/1208 [30:35<03:20,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00151, train/loss_step=0.287, global_step=2989.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  90%|█████████ | 1089/1208 [30:35<03:20,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00197, train/loss_step=0.343, global_step=2990.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  90%|█████████ | 1090/1208 [30:36<03:18,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00197, train/loss_step=0.343, global_step=2990.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  90%|█████████ | 1090/1208 [30:36<03:18,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=1.8e-5, train/loss_step=0.00325, global_step=2990.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  90%|█████████ | 1091/1208 [30:37<03:17,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=1.8e-5, train/loss_step=0.00325, global_step=2990.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  90%|█████████ | 1091/1208 [30:37<03:17,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0908, train/loss_vlb_step=0.0003, train/loss_step=0.0908, global_step=2990.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  90%|█████████ | 1092/1208 [30:40<03:15,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0908, train/loss_vlb_step=0.0003, train/loss_step=0.0908, global_step=2990.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  90%|█████████ | 1092/1208 [30:40<03:15,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=1.34e-5, train/loss_step=0.00224, global_step=2990.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  90%|█████████ | 1093/1208 [30:42<03:13,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=1.34e-5, train/loss_step=0.00224, global_step=2990.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  90%|█████████ | 1093/1208 [30:42<03:13,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.05e-5, train/loss_step=0.0136, global_step=2991.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  91%|█████████ | 1094/1208 [30:43<03:12,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.05e-5, train/loss_step=0.0136, global_step=2991.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  91%|█████████ | 1094/1208 [30:43<03:12,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0624, train/loss_vlb_step=0.000221, train/loss_step=0.0624, global_step=2991.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  91%|█████████ | 1095/1208 [30:44<03:10,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0624, train/loss_vlb_step=0.000221, train/loss_step=0.0624, global_step=2991.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  91%|█████████ | 1095/1208 [30:44<03:10,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00208, train/loss_step=0.365, global_step=2991.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  91%|█████████ | 1096/1208 [30:47<03:08,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00208, train/loss_step=0.365, global_step=2991.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  91%|█████████ | 1096/1208 [30:47<03:08,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.56e-5, train/loss_step=0.0148, global_step=2991.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  91%|█████████ | 1097/1208 [30:48<03:07,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.56e-5, train/loss_step=0.0148, global_step=2991.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  91%|█████████ | 1097/1208 [30:48<03:07,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.75e-5, train/loss_step=0.0156, global_step=2992.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  91%|█████████ | 1098/1208 [30:49<03:05,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.75e-5, train/loss_step=0.0156, global_step=2992.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  91%|█████████ | 1098/1208 [30:49<03:05,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00857, train/loss_vlb_step=4.06e-5, train/loss_step=0.00857, global_step=2992.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  91%|█████████ | 1099/1208 [30:50<03:03,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00857, train/loss_vlb_step=4.06e-5, train/loss_step=0.00857, global_step=2992.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  91%|█████████ | 1099/1208 [30:50<03:03,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.069, train/loss_vlb_step=0.000234, train/loss_step=0.069, global_step=2992.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  91%|█████████ | 1100/1208 [30:53<03:02,  1.69s/it, loss=0.119, v_num=0, train/loss_simple_step=0.069, train/loss_vlb_step=0.000234, train/loss_step=0.069, global_step=2992.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  91%|█████████ | 1100/1208 [30:53<03:02,  1.69s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00762, train/loss_vlb_step=3.8e-5, train/loss_step=0.00762, global_step=2992.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  91%|█████████ | 1101/1208 [30:54<03:00,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00762, train/loss_vlb_step=3.8e-5, train/loss_step=0.00762, global_step=2992.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  91%|█████████ | 1101/1208 [30:54<03:00,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=2e-5, train/loss_step=0.00363, global_step=2993.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  91%|█████████ | 1102/1208 [30:55<02:58,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=2e-5, train/loss_step=0.00363, global_step=2993.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  91%|█████████ | 1102/1208 [30:55<02:58,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0321, train/loss_vlb_step=0.000119, train/loss_step=0.0321, global_step=2993.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  91%|█████████▏| 1103/1208 [30:56<02:56,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0321, train/loss_vlb_step=0.000119, train/loss_step=0.0321, global_step=2993.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  91%|█████████▏| 1103/1208 [30:56<02:56,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.5e-5, train/loss_step=0.00257, global_step=2993.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  91%|█████████▏| 1104/1208 [31:00<02:55,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.5e-5, train/loss_step=0.00257, global_step=2993.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  91%|█████████▏| 1104/1208 [31:00<02:55,  1.68s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.0938, train/loss_vlb_step=0.000308, train/loss_step=0.0938, global_step=2993.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  91%|█████████▏| 1105/1208 [31:01<02:53,  1.68s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.0938, train/loss_vlb_step=0.000308, train/loss_step=0.0938, global_step=2993.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  91%|█████████▏| 1105/1208 [31:01<02:53,  1.68s/it, loss=0.1, v_num=0, train/loss_simple_step=0.500, train/loss_vlb_step=0.00818, train/loss_step=0.500, global_step=2994.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]      Epoch 9:  92%|█████████▏| 1106/1208 [31:02<02:51,  1.68s/it, loss=0.1, v_num=0, train/loss_simple_step=0.500, train/loss_vlb_step=0.00818, train/loss_step=0.500, global_step=2994.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  92%|█████████▏| 1106/1208 [31:02<02:51,  1.68s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0764, train/loss_vlb_step=0.000253, train/loss_step=0.0764, global_step=2994.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  92%|█████████▏| 1107/1208 [31:03<02:50,  1.68s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0764, train/loss_vlb_step=0.000253, train/loss_step=0.0764, global_step=2994.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  92%|█████████▏| 1107/1208 [31:03<02:50,  1.68s/it, loss=0.116, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00203, train/loss_step=0.334, global_step=2994.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  92%|█████████▏| 1108/1208 [31:06<02:48,  1.68s/it, loss=0.116, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00203, train/loss_step=0.334, global_step=2994.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  92%|█████████▏| 1108/1208 [31:06<02:48,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.471, train/loss_vlb_step=0.00423, train/loss_step=0.471, global_step=2994.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  92%|█████████▏| 1109/1208 [31:07<02:46,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.471, train/loss_vlb_step=0.00423, train/loss_step=0.471, global_step=2994.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  92%|█████████▏| 1109/1208 [31:07<02:46,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0778, train/loss_vlb_step=0.000266, train/loss_step=0.0778, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  92%|█████████▏| 1110/1208 [31:08<02:44,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0778, train/loss_vlb_step=0.000266, train/loss_step=0.0778, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  92%|█████████▏| 1110/1208 [31:08<02:44,  1.68s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0718, train/loss_vlb_step=0.000236, train/loss_step=0.0718, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  92%|█████████▏| 1111/1208 [31:09<02:43,  1.68s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0718, train/loss_vlb_step=0.000236, train/loss_step=0.0718, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  92%|█████████▏| 1111/1208 [31:09<02:43,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00123, train/loss_step=0.266, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  92%|█████████▏| 1112/1208 [31:13<02:41,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00123, train/loss_step=0.266, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  92%|█████████▏| 1112/1208 [31:13<02:41,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00108, train/loss_step=0.263, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  92%|█████████▏| 1113/1208 [31:14<02:39,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00108, train/loss_step=0.263, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  92%|█████████▏| 1113/1208 [31:14<02:39,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.82e-5, train/loss_step=0.0182, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  92%|█████████▏| 1114/1208 [31:15<02:38,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.82e-5, train/loss_step=0.0182, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  92%|█████████▏| 1114/1208 [31:15<02:38,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000502, train/loss_step=0.152, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  92%|█████████▏| 1115/1208 [31:16<02:36,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000502, train/loss_step=0.152, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  92%|█████████▏| 1115/1208 [31:16<02:36,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.000114, train/loss_step=0.0313, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  92%|█████████▏| 1116/1208 [31:19<02:34,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.000114, train/loss_step=0.0313, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  92%|█████████▏| 1116/1208 [31:19<02:34,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0368, train/loss_vlb_step=0.000139, train/loss_step=0.0368, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  92%|█████████▏| 1117/1208 [31:20<02:33,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0368, train/loss_vlb_step=0.000139, train/loss_step=0.0368, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  92%|█████████▏| 1117/1208 [31:20<02:33,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0562, train/loss_vlb_step=0.000196, train/loss_step=0.0562, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  93%|█████████▎| 1118/1208 [31:21<02:31,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0562, train/loss_vlb_step=0.000196, train/loss_step=0.0562, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  93%|█████████▎| 1118/1208 [31:21<02:31,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000334, train/loss_step=0.101, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  93%|█████████▎| 1119/1208 [31:22<02:29,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000334, train/loss_step=0.101, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  93%|█████████▎| 1119/1208 [31:22<02:29,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00151, train/loss_step=0.330, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  93%|█████████▎| 1120/1208 [31:25<02:28,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00151, train/loss_step=0.330, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  93%|█████████▎| 1120/1208 [31:25<02:28,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000786, train/loss_step=0.222, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  93%|█████████▎| 1121/1208 [31:26<02:26,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000786, train/loss_step=0.222, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  93%|█████████▎| 1121/1208 [31:26<02:26,  1.68s/it, loss=0.166, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.00062, train/loss_step=0.176, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  93%|█████████▎| 1122/1208 [31:28<02:24,  1.68s/it, loss=0.166, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.00062, train/loss_step=0.176, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  93%|█████████▎| 1122/1208 [31:28<02:24,  1.68s/it, loss=0.171, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000437, train/loss_step=0.133, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  93%|█████████▎| 1123/1208 [31:29<02:22,  1.68s/it, loss=0.171, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000437, train/loss_step=0.133, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  93%|█████████▎| 1123/1208 [31:29<02:22,  1.68s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.25e-5, train/loss_step=0.00212, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  93%|█████████▎| 1124/1208 [31:32<02:21,  1.68s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.25e-5, train/loss_step=0.00212, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  93%|█████████▎| 1124/1208 [31:32<02:21,  1.68s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0554, train/loss_vlb_step=0.000194, train/loss_step=0.0554, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  93%|█████████▎| 1125/1208 [31:33<02:19,  1.68s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0554, train/loss_vlb_step=0.000194, train/loss_step=0.0554, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  93%|█████████▎| 1125/1208 [31:33<02:19,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00143, train/loss_step=0.290, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  93%|█████████▎| 1126/1208 [31:34<02:17,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00143, train/loss_step=0.290, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  93%|█████████▎| 1126/1208 [31:34<02:17,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000342, train/loss_step=0.103, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  93%|█████████▎| 1127/1208 [31:35<02:16,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000342, train/loss_step=0.103, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  93%|█████████▎| 1127/1208 [31:35<02:16,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00978, train/loss_vlb_step=4.59e-5, train/loss_step=0.00978, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  93%|█████████▎| 1128/1208 [31:38<02:14,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00978, train/loss_vlb_step=4.59e-5, train/loss_step=0.00978, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  93%|█████████▎| 1128/1208 [31:38<02:14,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00153, train/loss_step=0.341, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  93%|█████████▎| 1129/1208 [31:39<02:12,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00153, train/loss_step=0.341, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  93%|█████████▎| 1129/1208 [31:39<02:12,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00228, train/loss_vlb_step=1.33e-5, train/loss_step=0.00228, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  94%|█████████▎| 1130/1208 [31:40<02:11,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00228, train/loss_vlb_step=1.33e-5, train/loss_step=0.00228, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  94%|█████████▎| 1130/1208 [31:40<02:11,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.46e-5, train/loss_step=0.00475, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  94%|█████████▎| 1131/1208 [31:41<02:09,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.46e-5, train/loss_step=0.00475, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  94%|█████████▎| 1131/1208 [31:41<02:09,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.00023, train/loss_step=0.0665, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  94%|█████████▎| 1132/1208 [31:45<02:07,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.00023, train/loss_step=0.0665, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  94%|█████████▎| 1132/1208 [31:45<02:07,  1.68s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00523, train/loss_vlb_step=2.74e-5, train/loss_step=0.00523, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  94%|█████████▍| 1133/1208 [31:46<02:06,  1.68s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00523, train/loss_vlb_step=2.74e-5, train/loss_step=0.00523, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  94%|█████████▍| 1133/1208 [31:46<02:06,  1.68s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.15e-5, train/loss_step=0.0117, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  94%|█████████▍| 1134/1208 [31:47<02:04,  1.68s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.15e-5, train/loss_step=0.0117, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  94%|█████████▍| 1134/1208 [31:47<02:04,  1.68s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.00522, train/loss_vlb_step=2.61e-5, train/loss_step=0.00522, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  94%|█████████▍| 1135/1208 [31:48<02:02,  1.68s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.00522, train/loss_vlb_step=2.61e-5, train/loss_step=0.00522, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  94%|█████████▍| 1135/1208 [31:48<02:02,  1.68s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=7.68e-5, train/loss_step=0.0196, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  94%|█████████▍| 1136/1208 [31:51<02:01,  1.68s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=7.68e-5, train/loss_step=0.0196, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  94%|█████████▍| 1136/1208 [31:51<02:01,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00132, train/loss_step=0.296, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  94%|█████████▍| 1137/1208 [31:52<01:59,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00132, train/loss_step=0.296, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  94%|█████████▍| 1137/1208 [31:52<01:59,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00305, train/loss_step=0.388, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  94%|█████████▍| 1138/1208 [31:53<01:57,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00305, train/loss_step=0.388, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  94%|█████████▍| 1138/1208 [31:53<01:57,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.463, train/loss_vlb_step=0.00351, train/loss_step=0.463, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  94%|█████████▍| 1139/1208 [31:54<01:56,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.463, train/loss_vlb_step=0.00351, train/loss_step=0.463, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  94%|█████████▍| 1139/1208 [31:54<01:56,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.59e-5, train/loss_step=0.0209, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  94%|█████████▍| 1140/1208 [31:58<01:54,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.59e-5, train/loss_step=0.0209, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  94%|█████████▍| 1140/1208 [31:58<01:54,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000568, train/loss_step=0.163, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  94%|█████████▍| 1141/1208 [31:59<01:52,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000568, train/loss_step=0.163, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  94%|█████████▍| 1141/1208 [31:59<01:52,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00532, train/loss_vlb_step=2.66e-5, train/loss_step=0.00532, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  95%|█████████▍| 1142/1208 [32:00<01:50,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00532, train/loss_vlb_step=2.66e-5, train/loss_step=0.00532, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  95%|█████████▍| 1142/1208 [32:00<01:50,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00506, train/loss_vlb_step=2.83e-5, train/loss_step=0.00506, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  95%|█████████▍| 1143/1208 [32:01<01:49,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00506, train/loss_vlb_step=2.83e-5, train/loss_step=0.00506, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  95%|█████████▍| 1143/1208 [32:01<01:49,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.73e-5, train/loss_step=0.0185, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  95%|█████████▍| 1144/1208 [32:04<01:47,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.73e-5, train/loss_step=0.0185, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  95%|█████████▍| 1144/1208 [32:04<01:47,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.18e-5, train/loss_step=0.0114, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  95%|█████████▍| 1145/1208 [32:05<01:45,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.18e-5, train/loss_step=0.0114, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  95%|█████████▍| 1145/1208 [32:05<01:45,  1.68s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=9.14e-5, train/loss_step=0.022, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  95%|█████████▍| 1146/1208 [32:06<01:44,  1.68s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=9.14e-5, train/loss_step=0.022, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  95%|█████████▍| 1146/1208 [32:06<01:44,  1.68s/it, loss=0.1, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000463, train/loss_step=0.141, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  95%|█████████▍| 1147/1208 [32:07<01:42,  1.68s/it, loss=0.1, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000463, train/loss_step=0.141, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  95%|█████████▍| 1147/1208 [32:07<01:42,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00203, train/loss_step=0.385, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  95%|█████████▌| 1148/1208 [32:10<01:40,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00203, train/loss_step=0.385, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  95%|█████████▌| 1148/1208 [32:10<01:40,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00175, train/loss_step=0.338, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  95%|█████████▌| 1149/1208 [32:12<01:39,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00175, train/loss_step=0.338, global_step=3e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  95%|█████████▌| 1149/1208 [32:12<01:39,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0822, train/loss_vlb_step=0.000277, train/loss_step=0.0822, global_step=3005.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  95%|█████████▌| 1150/1208 [32:13<01:37,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0822, train/loss_vlb_step=0.000277, train/loss_step=0.0822, global_step=3005.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  95%|█████████▌| 1150/1208 [32:13<01:37,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=1.12e-5, train/loss_step=0.0019, global_step=3005.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  95%|█████████▌| 1151/1208 [32:14<01:35,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=1.12e-5, train/loss_step=0.0019, global_step=3005.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  95%|█████████▌| 1151/1208 [32:14<01:35,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00499, train/loss_vlb_step=2.69e-5, train/loss_step=0.00499, global_step=3005.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  95%|█████████▌| 1152/1208 [32:17<01:34,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00499, train/loss_vlb_step=2.69e-5, train/loss_step=0.00499, global_step=3005.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  95%|█████████▌| 1152/1208 [32:17<01:34,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00112, train/loss_step=0.266, global_step=3005.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  95%|█████████▌| 1153/1208 [32:18<01:32,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00112, train/loss_step=0.266, global_step=3005.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  95%|█████████▌| 1153/1208 [32:18<01:32,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.9e-5, train/loss_step=0.0133, global_step=3006.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  96%|█████████▌| 1154/1208 [32:19<01:30,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.9e-5, train/loss_step=0.0133, global_step=3006.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  96%|█████████▌| 1154/1208 [32:19<01:30,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00275, train/loss_step=0.430, global_step=3006.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  96%|█████████▌| 1155/1208 [32:20<01:29,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00275, train/loss_step=0.430, global_step=3006.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  96%|█████████▌| 1155/1208 [32:20<01:29,  1.68s/it, loss=0.182, v_num=0, train/loss_simple_step=0.590, train/loss_vlb_step=0.00564, train/loss_step=0.590, global_step=3006.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  96%|█████████▌| 1156/1208 [32:23<01:27,  1.68s/it, loss=0.182, v_num=0, train/loss_simple_step=0.590, train/loss_vlb_step=0.00564, train/loss_step=0.590, global_step=3006.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  96%|█████████▌| 1156/1208 [32:23<01:27,  1.68s/it, loss=0.176, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000596, train/loss_step=0.174, global_step=3006.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  96%|█████████▌| 1157/1208 [32:24<01:25,  1.68s/it, loss=0.176, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000596, train/loss_step=0.174, global_step=3006.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  96%|█████████▌| 1157/1208 [32:24<01:25,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=9.71e-5, train/loss_step=0.025, global_step=3007.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  96%|█████████▌| 1158/1208 [32:25<01:24,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=9.71e-5, train/loss_step=0.025, global_step=3007.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  96%|█████████▌| 1158/1208 [32:25<01:24,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.5e-5, train/loss_step=0.0026, global_step=3007.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  96%|█████████▌| 1159/1208 [32:26<01:22,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.5e-5, train/loss_step=0.0026, global_step=3007.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  96%|█████████▌| 1159/1208 [32:26<01:22,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00108, train/loss_step=0.265, global_step=3007.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  96%|█████████▌| 1160/1208 [32:30<01:20,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00108, train/loss_step=0.265, global_step=3007.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  96%|█████████▌| 1160/1208 [32:30<01:20,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=1.99e-5, train/loss_step=0.00363, global_step=3007.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  96%|█████████▌| 1161/1208 [32:31<01:18,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=1.99e-5, train/loss_step=0.00363, global_step=3007.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  96%|█████████▌| 1161/1208 [32:31<01:18,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0919, train/loss_vlb_step=0.000303, train/loss_step=0.0919, global_step=3008.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  96%|█████████▌| 1162/1208 [32:32<01:17,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0919, train/loss_vlb_step=0.000303, train/loss_step=0.0919, global_step=3008.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  96%|█████████▌| 1162/1208 [32:32<01:17,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0681, train/loss_vlb_step=0.000228, train/loss_step=0.0681, global_step=3008.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  96%|█████████▋| 1163/1208 [32:33<01:15,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0681, train/loss_vlb_step=0.000228, train/loss_step=0.0681, global_step=3008.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  96%|█████████▋| 1163/1208 [32:33<01:15,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.00013, train/loss_step=0.0344, global_step=3008.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  96%|█████████▋| 1164/1208 [32:36<01:13,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.00013, train/loss_step=0.0344, global_step=3008.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  96%|█████████▋| 1164/1208 [32:36<01:13,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00571, train/loss_vlb_step=2.96e-5, train/loss_step=0.00571, global_step=3008.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  96%|█████████▋| 1165/1208 [32:37<01:12,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00571, train/loss_vlb_step=2.96e-5, train/loss_step=0.00571, global_step=3008.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  96%|█████████▋| 1165/1208 [32:37<01:12,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.72e-5, train/loss_step=0.0103, global_step=3009.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  97%|█████████▋| 1166/1208 [32:38<01:10,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.72e-5, train/loss_step=0.0103, global_step=3009.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  97%|█████████▋| 1166/1208 [32:38<01:10,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000373, train/loss_step=0.113, global_step=3009.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  97%|█████████▋| 1167/1208 [32:39<01:08,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000373, train/loss_step=0.113, global_step=3009.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  97%|█████████▋| 1167/1208 [32:39<01:08,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000463, train/loss_step=0.140, global_step=3009.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  97%|█████████▋| 1168/1208 [32:42<01:07,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000463, train/loss_step=0.140, global_step=3009.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  97%|█████████▋| 1168/1208 [32:42<01:07,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=3009.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  97%|█████████▋| 1169/1208 [32:44<01:05,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=3009.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  97%|█████████▋| 1169/1208 [32:44<01:05,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.495, train/loss_vlb_step=0.00473, train/loss_step=0.495, global_step=3010.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  97%|█████████▋| 1170/1208 [32:45<01:03,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.495, train/loss_vlb_step=0.00473, train/loss_step=0.495, global_step=3010.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  97%|█████████▋| 1170/1208 [32:45<01:03,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.0045, train/loss_step=0.407, global_step=3010.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  97%|█████████▋| 1171/1208 [32:46<01:02,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.0045, train/loss_step=0.407, global_step=3010.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  97%|█████████▋| 1171/1208 [32:46<01:02,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=0.000102, train/loss_step=0.025, global_step=3010.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  97%|█████████▋| 1172/1208 [32:49<01:00,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=0.000102, train/loss_step=0.025, global_step=3010.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  97%|█████████▋| 1172/1208 [32:49<01:00,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000523, train/loss_step=0.156, global_step=3010.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  97%|█████████▋| 1173/1208 [32:50<00:58,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000523, train/loss_step=0.156, global_step=3010.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  97%|█████████▋| 1173/1208 [32:50<00:58,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000104, train/loss_step=0.026, global_step=3011.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  97%|█████████▋| 1174/1208 [32:51<00:57,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000104, train/loss_step=0.026, global_step=3011.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  97%|█████████▋| 1174/1208 [32:51<00:57,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000837, train/loss_step=0.230, global_step=3011.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  97%|█████████▋| 1175/1208 [32:52<00:55,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000837, train/loss_step=0.230, global_step=3011.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  97%|█████████▋| 1175/1208 [32:52<00:55,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.000149, train/loss_step=0.0403, global_step=3011.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  97%|█████████▋| 1176/1208 [32:55<00:53,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.000149, train/loss_step=0.0403, global_step=3011.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  97%|█████████▋| 1176/1208 [32:55<00:53,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.594, train/loss_vlb_step=0.00922, train/loss_step=0.594, global_step=3011.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  97%|█████████▋| 1177/1208 [32:56<00:52,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.594, train/loss_vlb_step=0.00922, train/loss_step=0.594, global_step=3011.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  97%|█████████▋| 1177/1208 [32:56<00:52,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=9.01e-6, train/loss_step=0.00148, global_step=3012.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  98%|█████████▊| 1178/1208 [32:57<00:50,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=9.01e-6, train/loss_step=0.00148, global_step=3012.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  98%|█████████▊| 1178/1208 [32:57<00:50,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0667, train/loss_vlb_step=0.000235, train/loss_step=0.0667, global_step=3012.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  98%|█████████▊| 1179/1208 [32:58<00:48,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0667, train/loss_vlb_step=0.000235, train/loss_step=0.0667, global_step=3012.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  98%|█████████▊| 1179/1208 [32:58<00:48,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=8.32e-5, train/loss_step=0.0192, global_step=3012.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  98%|█████████▊| 1180/1208 [33:02<00:47,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=8.32e-5, train/loss_step=0.0192, global_step=3012.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  98%|█████████▊| 1180/1208 [33:02<00:47,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0423, train/loss_vlb_step=0.000148, train/loss_step=0.0423, global_step=3012.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  98%|█████████▊| 1181/1208 [33:03<00:45,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0423, train/loss_vlb_step=0.000148, train/loss_step=0.0423, global_step=3012.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  98%|█████████▊| 1181/1208 [33:03<00:45,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0271, train/loss_vlb_step=0.000106, train/loss_step=0.0271, global_step=3013.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  98%|█████████▊| 1182/1208 [33:04<00:43,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0271, train/loss_vlb_step=0.000106, train/loss_step=0.0271, global_step=3013.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  98%|█████████▊| 1182/1208 [33:04<00:43,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000957, train/loss_step=0.220, global_step=3013.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  98%|█████████▊| 1183/1208 [33:05<00:41,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000957, train/loss_step=0.220, global_step=3013.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  98%|█████████▊| 1183/1208 [33:05<00:41,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00213, train/loss_step=0.314, global_step=3013.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  98%|█████████▊| 1184/1208 [33:08<00:40,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00213, train/loss_step=0.314, global_step=3013.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  98%|█████████▊| 1184/1208 [33:08<00:40,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.38e-5, train/loss_step=0.0124, global_step=3013.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  98%|█████████▊| 1185/1208 [33:09<00:38,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.38e-5, train/loss_step=0.0124, global_step=3013.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  98%|█████████▊| 1185/1208 [33:09<00:38,  1.68s/it, loss=0.179, v_num=0, train/loss_simple_step=0.538, train/loss_vlb_step=0.00495, train/loss_step=0.538, global_step=3014.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  98%|█████████▊| 1186/1208 [33:10<00:36,  1.68s/it, loss=0.179, v_num=0, train/loss_simple_step=0.538, train/loss_vlb_step=0.00495, train/loss_step=0.538, global_step=3014.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  98%|█████████▊| 1186/1208 [33:10<00:36,  1.68s/it, loss=0.185, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000874, train/loss_step=0.228, global_step=3014.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  98%|█████████▊| 1187/1208 [33:11<00:35,  1.68s/it, loss=0.185, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000874, train/loss_step=0.228, global_step=3014.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  98%|█████████▊| 1187/1208 [33:11<00:35,  1.68s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0558, train/loss_vlb_step=0.000188, train/loss_step=0.0558, global_step=3014.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  98%|█████████▊| 1188/1208 [33:14<00:33,  1.68s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0558, train/loss_vlb_step=0.000188, train/loss_step=0.0558, global_step=3014.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  98%|█████████▊| 1188/1208 [33:14<00:33,  1.68s/it, loss=0.184, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000616, train/loss_step=0.180, global_step=3014.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  98%|█████████▊| 1189/1208 [33:15<00:31,  1.68s/it, loss=0.184, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000616, train/loss_step=0.180, global_step=3014.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  98%|█████████▊| 1189/1208 [33:15<00:31,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=2.93e-5, train/loss_step=0.00572, global_step=3015.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  99%|█████████▊| 1190/1208 [33:16<00:30,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=2.93e-5, train/loss_step=0.00572, global_step=3015.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  99%|█████████▊| 1190/1208 [33:16<00:30,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.0004, train/loss_step=0.122, global_step=3015.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]     Epoch 9:  99%|█████████▊| 1191/1208 [33:18<00:28,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.0004, train/loss_step=0.122, global_step=3015.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  99%|█████████▊| 1191/1208 [33:18<00:28,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00122, train/loss_step=0.299, global_step=3015.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  99%|█████████▊| 1192/1208 [33:21<00:26,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00122, train/loss_step=0.299, global_step=3015.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  99%|█████████▊| 1192/1208 [33:21<00:26,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.44e-5, train/loss_step=0.00253, global_step=3015.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  99%|█████████▉| 1193/1208 [33:22<00:25,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.44e-5, train/loss_step=0.00253, global_step=3015.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  99%|█████████▉| 1193/1208 [33:22<00:25,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00461, train/loss_vlb_step=2.47e-5, train/loss_step=0.00461, global_step=3016.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140] Epoch 9:  99%|█████████▉| 1194/1208 [33:23<00:23,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00461, train/loss_vlb_step=2.47e-5, train/loss_step=0.00461, global_step=3016.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  99%|█████████▉| 1194/1208 [33:23<00:23,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.6e-5, train/loss_step=0.0028, global_step=3016.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9:  99%|█████████▉| 1195/1208 [33:24<00:21,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.6e-5, train/loss_step=0.0028, global_step=3016.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  99%|█████████▉| 1195/1208 [33:24<00:21,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.91e-5, train/loss_step=0.00335, global_step=3016.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  99%|█████████▉| 1196/1208 [33:27<00:20,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.91e-5, train/loss_step=0.00335, global_step=3016.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  99%|█████████▉| 1196/1208 [33:27<00:20,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00147, train/loss_step=0.290, global_step=3016.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]    Epoch 9:  99%|█████████▉| 1197/1208 [33:28<00:18,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00147, train/loss_step=0.290, global_step=3016.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  99%|█████████▉| 1197/1208 [33:28<00:18,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000462, train/loss_step=0.139, global_step=3017.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  99%|█████████▉| 1198/1208 [33:29<00:16,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000462, train/loss_step=0.139, global_step=3017.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  99%|█████████▉| 1198/1208 [33:29<00:16,  1.68s/it, loss=0.166, v_num=0, train/loss_simple_step=0.824, train/loss_vlb_step=0.208, train/loss_step=0.824, global_step=3017.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9:  99%|█████████▉| 1199/1208 [33:30<00:15,  1.68s/it, loss=0.166, v_num=0, train/loss_simple_step=0.824, train/loss_vlb_step=0.208, train/loss_step=0.824, global_step=3017.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  99%|█████████▉| 1199/1208 [33:30<00:15,  1.68s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00834, train/loss_vlb_step=4e-5, train/loss_step=0.00834, global_step=3017.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  99%|█████████▉| 1200/1208 [33:34<00:13,  1.68s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00834, train/loss_vlb_step=4e-5, train/loss_step=0.00834, global_step=3017.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  99%|█████████▉| 1200/1208 [33:34<00:13,  1.68s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0773, train/loss_vlb_step=0.000256, train/loss_step=0.0773, global_step=3017.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.76it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.75it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.76it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.80it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.76it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.75it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.75it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 9:  99%|█████████▉| 1201/1208 [34:04<00:11,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0773, train/loss_vlb_step=0.000256, train/loss_step=0.0773, global_step=3017.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9:  99%|█████████▉| 1201/1208 [34:04<00:11,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0836, train/loss_vlb_step=0.000281, train/loss_step=0.0836, global_step=3018.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9: 100%|█████████▉| 1202/1208 [34:05<00:10,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0836, train/loss_vlb_step=0.000281, train/loss_step=0.0836, global_step=3018.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9: 100%|█████████▉| 1202/1208 [34:05<00:10,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0856, train/loss_vlb_step=0.000285, train/loss_step=0.0856, global_step=3018.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9: 100%|█████████▉| 1203/1208 [34:06<00:08,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0856, train/loss_vlb_step=0.000285, train/loss_step=0.0856, global_step=3018.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9: 100%|█████████▉| 1203/1208 [34:06<00:08,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00389, train/loss_vlb_step=2.07e-5, train/loss_step=0.00389, global_step=3018.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9: 100%|█████████▉| 1204/1208 [34:09<00:06,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00389, train/loss_vlb_step=2.07e-5, train/loss_step=0.00389, global_step=3018.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9: 100%|█████████▉| 1204/1208 [34:09<00:06,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000638, train/loss_step=0.185, global_step=3018.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]   Epoch 9: 100%|█████████▉| 1205/1208 [34:11<00:05,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000638, train/loss_step=0.185, global_step=3018.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9: 100%|█████████▉| 1205/1208 [34:11<00:05,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0959, train/loss_vlb_step=0.000315, train/loss_step=0.0959, global_step=3019.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9: 100%|█████████▉| 1206/1208 [34:12<00:03,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0959, train/loss_vlb_step=0.000315, train/loss_step=0.0959, global_step=3019.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9: 100%|█████████▉| 1206/1208 [34:12<00:03,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000347, train/loss_step=0.106, global_step=3019.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]  Epoch 9: 100%|█████████▉| 1207/1208 [34:13<00:01,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000347, train/loss_step=0.106, global_step=3019.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9: 100%|█████████▉| 1207/1208 [34:13<00:01,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000444, train/loss_step=0.130, global_step=3019.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9: 100%|██████████| 1208/1208 [34:18<00:00,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000444, train/loss_step=0.130, global_step=3019.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 9: 100%|██████████| 1208/1208 [34:18<00:00,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000617, train/loss_step=0.180, global_step=3019.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]
+
+
+Epoch 9:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.132, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000617, train/loss_step=0.180, global_step=3019.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]           Epoch 10:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.132, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000617, train/loss_step=0.180, global_step=3019.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][AData shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.83it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.78it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.84it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.84it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.78it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.84it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.83it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.83it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.78it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:13,  1.79it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.83it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.83it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.83it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.83it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.83it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.78it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.75it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.83it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.78it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.78it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.78it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.78it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.83it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.73it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.78it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.75it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.78it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.78it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.78it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.78it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.78it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.78it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.78it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.78it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.80it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]Epoch 10:   0%|          | 1/1208 [00:33<11:07:10, 33.17s/it, loss=0.132, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000617, train/loss_step=0.180, global_step=3019.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00276, train/loss_epoch=0.140]Epoch 10:   0%|          | 1/1208 [00:33<11:07:13, 33.17s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00863, train/loss_vlb_step=4.12e-5, train/loss_step=0.00863, global_step=3020.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   0%|          | 2/1208 [00:34<5:43:46, 17.10s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00863, train/loss_vlb_step=4.12e-5, train/loss_step=0.00863, global_step=3020.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:   0%|          | 2/1208 [00:34<5:43:47, 17.10s/it, loss=0.145, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00294, train/loss_step=0.362, global_step=3020.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:   0%|          | 3/1208 [00:35<3:55:55, 11.75s/it, loss=0.145, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00294, train/loss_step=0.362, global_step=3020.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   0%|          | 3/1208 [00:35<3:55:56, 11.75s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0867, train/loss_vlb_step=0.000285, train/loss_step=0.0867, global_step=3020.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   0%|          | 4/1208 [00:38<3:12:30,  9.59s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0867, train/loss_vlb_step=0.000285, train/loss_step=0.0867, global_step=3020.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   0%|          | 4/1208 [00:38<3:12:30,  9.59s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0048, train/loss_vlb_step=2.54e-5, train/loss_step=0.0048, global_step=3020.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:   0%|          | 5/1208 [00:39<2:38:08,  7.89s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0048, train/loss_vlb_step=2.54e-5, train/loss_step=0.0048, global_step=3020.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   0%|          | 5/1208 [00:39<2:38:08,  7.89s/it, loss=0.142, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000533, train/loss_step=0.161, global_step=3021.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:   0%|          | 6/1208 [00:40<2:15:10,  6.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000533, train/loss_step=0.161, global_step=3021.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   0%|          | 6/1208 [00:40<2:15:10,  6.75s/it, loss=0.147, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000376, train/loss_step=0.114, global_step=3021.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   1%|          | 7/1208 [00:41<1:58:46,  5.93s/it, loss=0.147, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000376, train/loss_step=0.114, global_step=3021.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   1%|          | 7/1208 [00:41<1:58:46,  5.93s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=1.69e-5, train/loss_step=0.00309, global_step=3021.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   1%|          | 8/1208 [00:44<1:52:00,  5.60s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=1.69e-5, train/loss_step=0.00309, global_step=3021.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   1%|          | 8/1208 [00:44<1:52:01,  5.60s/it, loss=0.157, v_num=0, train/loss_simple_step=0.479, train/loss_vlb_step=0.00588, train/loss_step=0.479, global_step=3021.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:   1%|          | 9/1208 [00:45<1:41:51,  5.10s/it, loss=0.157, v_num=0, train/loss_simple_step=0.479, train/loss_vlb_step=0.00588, train/loss_step=0.479, global_step=3021.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   1%|          | 9/1208 [00:45<1:41:52,  5.10s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000131, train/loss_step=0.0349, global_step=3022.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   1%|          | 10/1208 [00:46<1:33:40,  4.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000131, train/loss_step=0.0349, global_step=3022.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   1%|          | 10/1208 [00:46<1:33:40,  4.69s/it, loss=0.119, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000594, train/loss_step=0.172, global_step=3022.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:   1%|          | 11/1208 [00:47<1:26:56,  4.36s/it, loss=0.119, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000594, train/loss_step=0.172, global_step=3022.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   1%|          | 11/1208 [00:47<1:26:56,  4.36s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.46e-5, train/loss_step=0.0182, global_step=3022.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   1%|          | 12/1208 [00:51<1:25:06,  4.27s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.46e-5, train/loss_step=0.0182, global_step=3022.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   1%|          | 12/1208 [00:51<1:25:06,  4.27s/it, loss=0.127, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000835, train/loss_step=0.231, global_step=3022.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   1%|          | 13/1208 [00:52<1:20:09,  4.02s/it, loss=0.127, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000835, train/loss_step=0.231, global_step=3022.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   1%|          | 13/1208 [00:52<1:20:09,  4.02s/it, loss=0.144, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.0042, train/loss_step=0.428, global_step=3023.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:   1%|          | 14/1208 [00:53<1:15:51,  3.81s/it, loss=0.144, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.0042, train/loss_step=0.428, global_step=3023.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   1%|          | 14/1208 [00:53<1:15:52,  3.81s/it, loss=0.166, v_num=0, train/loss_simple_step=0.523, train/loss_vlb_step=0.00833, train/loss_step=0.523, global_step=3023.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   1%|          | 15/1208 [00:54<1:12:06,  3.63s/it, loss=0.166, v_num=0, train/loss_simple_step=0.523, train/loss_vlb_step=0.00833, train/loss_step=0.523, global_step=3023.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   1%|          | 15/1208 [00:54<1:12:06,  3.63s/it, loss=0.184, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00206, train/loss_step=0.356, global_step=3023.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   1%|▏         | 16/1208 [00:57<1:11:37,  3.61s/it, loss=0.184, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00206, train/loss_step=0.356, global_step=3023.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   1%|▏         | 16/1208 [00:57<1:11:38,  3.61s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00959, train/loss_vlb_step=4.42e-5, train/loss_step=0.00959, global_step=3023.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   1%|▏         | 17/1208 [00:58<1:08:37,  3.46s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00959, train/loss_vlb_step=4.42e-5, train/loss_step=0.00959, global_step=3023.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   1%|▏         | 17/1208 [00:58<1:08:37,  3.46s/it, loss=0.179, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000585, train/loss_step=0.166, global_step=3024.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:   1%|▏         | 18/1208 [00:59<1:05:55,  3.32s/it, loss=0.179, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000585, train/loss_step=0.166, global_step=3024.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   1%|▏         | 18/1208 [00:59<1:05:55,  3.32s/it, loss=0.174, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.69e-5, train/loss_step=0.018, global_step=3024.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:   2%|▏         | 19/1208 [01:00<1:03:28,  3.20s/it, loss=0.174, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.69e-5, train/loss_step=0.018, global_step=3024.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   2%|▏         | 19/1208 [01:00<1:03:28,  3.20s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00587, train/loss_vlb_step=2.9e-5, train/loss_step=0.00587, global_step=3024.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   2%|▏         | 20/1208 [01:04<1:03:29,  3.21s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00587, train/loss_vlb_step=2.9e-5, train/loss_step=0.00587, global_step=3024.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   2%|▏         | 20/1208 [01:04<1:03:29,  3.21s/it, loss=0.17, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000911, train/loss_step=0.225, global_step=3024.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:   2%|▏         | 21/1208 [01:05<1:01:25,  3.10s/it, loss=0.17, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000911, train/loss_step=0.225, global_step=3024.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   2%|▏         | 21/1208 [01:05<1:01:25,  3.10s/it, loss=0.202, v_num=0, train/loss_simple_step=0.634, train/loss_vlb_step=0.0109, train/loss_step=0.634, global_step=3025.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:   2%|▏         | 22/1208 [01:06<59:31,  3.01s/it, loss=0.202, v_num=0, train/loss_simple_step=0.634, train/loss_vlb_step=0.0109, train/loss_step=0.634, global_step=3025.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:   2%|▏         | 22/1208 [01:06<59:32,  3.01s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000149, train/loss_step=0.0402, global_step=3025.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   2%|▏         | 23/1208 [01:07<57:47,  2.93s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000149, train/loss_step=0.0402, global_step=3025.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   2%|▏         | 23/1208 [01:07<57:47,  2.93s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=1.08e-5, train/loss_step=0.00181, global_step=3025.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   2%|▏         | 24/1208 [01:10<57:59,  2.94s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=1.08e-5, train/loss_step=0.00181, global_step=3025.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   2%|▏         | 24/1208 [01:10<57:59,  2.94s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00969, train/loss_vlb_step=4.28e-5, train/loss_step=0.00969, global_step=3025.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   2%|▏         | 25/1208 [01:11<56:27,  2.86s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00969, train/loss_vlb_step=4.28e-5, train/loss_step=0.00969, global_step=3025.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   2%|▏         | 25/1208 [01:11<56:27,  2.86s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000119, train/loss_step=0.0306, global_step=3026.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:   2%|▏         | 26/1208 [01:12<55:00,  2.79s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000119, train/loss_step=0.0306, global_step=3026.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   2%|▏         | 26/1208 [01:12<55:00,  2.79s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=2.1e-5, train/loss_step=0.00384, global_step=3026.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:   2%|▏         | 27/1208 [01:13<53:40,  2.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=2.1e-5, train/loss_step=0.00384, global_step=3026.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   2%|▏         | 27/1208 [01:13<53:40,  2.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0529, train/loss_vlb_step=0.000188, train/loss_step=0.0529, global_step=3026.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   2%|▏         | 28/1208 [01:16<54:04,  2.75s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0529, train/loss_vlb_step=0.000188, train/loss_step=0.0529, global_step=3026.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   2%|▏         | 28/1208 [01:16<54:04,  2.75s/it, loss=0.173, v_num=0, train/loss_simple_step=0.493, train/loss_vlb_step=0.00453, train/loss_step=0.493, global_step=3026.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:   2%|▏         | 29/1208 [01:18<52:53,  2.69s/it, loss=0.173, v_num=0, train/loss_simple_step=0.493, train/loss_vlb_step=0.00453, train/loss_step=0.493, global_step=3026.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   2%|▏         | 29/1208 [01:18<52:53,  2.69s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.2e-5, train/loss_step=0.00205, global_step=3027.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   2%|▏         | 30/1208 [01:19<51:46,  2.64s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.2e-5, train/loss_step=0.00205, global_step=3027.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   2%|▏         | 30/1208 [01:19<51:46,  2.64s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.09e-5, train/loss_step=0.0137, global_step=3027.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:   3%|▎         | 31/1208 [01:20<50:43,  2.59s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.09e-5, train/loss_step=0.0137, global_step=3027.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   3%|▎         | 31/1208 [01:20<50:43,  2.59s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.000183, train/loss_step=0.0499, global_step=3027.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   3%|▎         | 32/1208 [01:23<51:06,  2.61s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.000183, train/loss_step=0.0499, global_step=3027.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   3%|▎         | 32/1208 [01:23<51:06,  2.61s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000149, train/loss_step=0.0399, global_step=3027.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   3%|▎         | 33/1208 [01:24<50:09,  2.56s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000149, train/loss_step=0.0399, global_step=3027.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   3%|▎         | 33/1208 [01:24<50:09,  2.56s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.48e-5, train/loss_step=0.0113, global_step=3028.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:   3%|▎         | 34/1208 [01:25<49:14,  2.52s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.48e-5, train/loss_step=0.0113, global_step=3028.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   3%|▎         | 34/1208 [01:25<49:14,  2.52s/it, loss=0.12, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000991, train/loss_step=0.244, global_step=3028.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:   3%|▎         | 35/1208 [01:26<48:22,  2.47s/it, loss=0.12, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000991, train/loss_step=0.244, global_step=3028.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   3%|▎         | 35/1208 [01:26<48:22,  2.47s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0631, train/loss_vlb_step=0.000225, train/loss_step=0.0631, global_step=3028.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   3%|▎         | 36/1208 [01:29<48:46,  2.50s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0631, train/loss_vlb_step=0.000225, train/loss_step=0.0631, global_step=3028.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   3%|▎         | 36/1208 [01:29<48:46,  2.50s/it, loss=0.108, v_num=0, train/loss_simple_step=0.056, train/loss_vlb_step=0.000199, train/loss_step=0.056, global_step=3028.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:   3%|▎         | 37/1208 [01:30<47:58,  2.46s/it, loss=0.108, v_num=0, train/loss_simple_step=0.056, train/loss_vlb_step=0.000199, train/loss_step=0.056, global_step=3028.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   3%|▎         | 37/1208 [01:30<47:58,  2.46s/it, loss=0.11, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000853, train/loss_step=0.210, global_step=3029.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:   3%|▎         | 38/1208 [01:31<47:12,  2.42s/it, loss=0.11, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000853, train/loss_step=0.210, global_step=3029.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   3%|▎         | 38/1208 [01:31<47:12,  2.42s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=6.99e-5, train/loss_step=0.0172, global_step=3029.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   3%|▎         | 39/1208 [01:33<46:28,  2.39s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=6.99e-5, train/loss_step=0.0172, global_step=3029.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   3%|▎         | 39/1208 [01:33<46:28,  2.39s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00861, train/loss_vlb_step=4.15e-5, train/loss_step=0.00861, global_step=3029.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   3%|▎         | 40/1208 [01:36<46:52,  2.41s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00861, train/loss_vlb_step=4.15e-5, train/loss_step=0.00861, global_step=3029.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   3%|▎         | 40/1208 [01:36<46:52,  2.41s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0414, train/loss_vlb_step=0.000143, train/loss_step=0.0414, global_step=3029.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   3%|▎         | 41/1208 [01:37<46:11,  2.37s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0414, train/loss_vlb_step=0.000143, train/loss_step=0.0414, global_step=3029.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   3%|▎         | 41/1208 [01:37<46:11,  2.37s/it, loss=0.0704, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.47e-5, train/loss_step=0.0198, global_step=3030.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   3%|▎         | 42/1208 [01:38<45:31,  2.34s/it, loss=0.0704, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.47e-5, train/loss_step=0.0198, global_step=3030.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   3%|▎         | 42/1208 [01:38<45:31,  2.34s/it, loss=0.0762, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000545, train/loss_step=0.155, global_step=3030.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:   4%|▎         | 43/1208 [01:39<44:53,  2.31s/it, loss=0.0762, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000545, train/loss_step=0.155, global_step=3030.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   4%|▎         | 43/1208 [01:39<44:54,  2.31s/it, loss=0.0767, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.5e-5, train/loss_step=0.0122, global_step=3030.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   4%|▎         | 44/1208 [01:42<45:17,  2.33s/it, loss=0.0767, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.5e-5, train/loss_step=0.0122, global_step=3030.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   4%|▎         | 44/1208 [01:42<45:17,  2.33s/it, loss=0.0827, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000428, train/loss_step=0.130, global_step=3030.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   4%|▎         | 45/1208 [01:43<44:42,  2.31s/it, loss=0.0827, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000428, train/loss_step=0.130, global_step=3030.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   4%|▎         | 45/1208 [01:43<44:42,  2.31s/it, loss=0.108, v_num=0, train/loss_simple_step=0.536, train/loss_vlb_step=0.0108, train/loss_step=0.536, global_step=3031.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:   4%|▍         | 46/1208 [01:44<44:07,  2.28s/it, loss=0.108, v_num=0, train/loss_simple_step=0.536, train/loss_vlb_step=0.0108, train/loss_step=0.536, global_step=3031.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   4%|▍         | 46/1208 [01:44<44:07,  2.28s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0047, train/loss_vlb_step=2.52e-5, train/loss_step=0.0047, global_step=3031.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   4%|▍         | 47/1208 [01:45<43:34,  2.25s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0047, train/loss_vlb_step=2.52e-5, train/loss_step=0.0047, global_step=3031.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   4%|▍         | 47/1208 [01:45<43:34,  2.25s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000104, train/loss_step=0.0266, global_step=3031.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   4%|▍         | 48/1208 [01:49<43:57,  2.27s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000104, train/loss_step=0.0266, global_step=3031.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   4%|▍         | 48/1208 [01:49<43:57,  2.27s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.36e-5, train/loss_step=0.0172, global_step=3031.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   4%|▍         | 49/1208 [01:50<43:26,  2.25s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.36e-5, train/loss_step=0.0172, global_step=3031.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   4%|▍         | 49/1208 [01:50<43:26,  2.25s/it, loss=0.0836, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.6e-5, train/loss_step=0.0147, global_step=3032.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:   4%|▍         | 50/1208 [01:51<42:56,  2.23s/it, loss=0.0836, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.6e-5, train/loss_step=0.0147, global_step=3032.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   4%|▍         | 50/1208 [01:51<42:56,  2.23s/it, loss=0.113, v_num=0, train/loss_simple_step=0.594, train/loss_vlb_step=0.0124, train/loss_step=0.594, global_step=3032.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:   4%|▍         | 51/1208 [01:52<42:27,  2.20s/it, loss=0.113, v_num=0, train/loss_simple_step=0.594, train/loss_vlb_step=0.0124, train/loss_step=0.594, global_step=3032.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   4%|▍         | 51/1208 [01:52<42:27,  2.20s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=1.99e-5, train/loss_step=0.00357, global_step=3032.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   4%|▍         | 52/1208 [01:55<42:49,  2.22s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=1.99e-5, train/loss_step=0.00357, global_step=3032.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   4%|▍         | 52/1208 [01:55<42:49,  2.22s/it, loss=0.124, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00158, train/loss_step=0.314, global_step=3032.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:   4%|▍         | 53/1208 [01:56<42:21,  2.20s/it, loss=0.124, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00158, train/loss_step=0.314, global_step=3032.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   4%|▍         | 53/1208 [01:56<42:21,  2.20s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.41e-5, train/loss_step=0.0229, global_step=3033.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   4%|▍         | 54/1208 [01:57<41:54,  2.18s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.41e-5, train/loss_step=0.0229, global_step=3033.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   4%|▍         | 54/1208 [01:57<41:54,  2.18s/it, loss=0.118, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000406, train/loss_step=0.123, global_step=3033.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:   5%|▍         | 55/1208 [01:58<41:28,  2.16s/it, loss=0.118, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000406, train/loss_step=0.123, global_step=3033.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   5%|▍         | 55/1208 [01:58<41:28,  2.16s/it, loss=0.127, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000907, train/loss_step=0.237, global_step=3033.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   5%|▍         | 56/1208 [02:01<41:49,  2.18s/it, loss=0.127, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000907, train/loss_step=0.237, global_step=3033.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   5%|▍         | 56/1208 [02:01<41:49,  2.18s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=2.02e-5, train/loss_step=0.00363, global_step=3033.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   5%|▍         | 57/1208 [02:03<41:24,  2.16s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=2.02e-5, train/loss_step=0.00363, global_step=3033.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   5%|▍         | 57/1208 [02:03<41:24,  2.16s/it, loss=0.114, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.15e-5, train/loss_step=0.002, global_step=3034.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:   5%|▍         | 58/1208 [02:04<41:00,  2.14s/it, loss=0.114, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.15e-5, train/loss_step=0.002, global_step=3034.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   5%|▍         | 58/1208 [02:04<41:00,  2.14s/it, loss=0.125, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00107, train/loss_step=0.244, global_step=3034.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   5%|▍         | 59/1208 [02:05<40:36,  2.12s/it, loss=0.125, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00107, train/loss_step=0.244, global_step=3034.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   5%|▍         | 59/1208 [02:05<40:36,  2.12s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0491, train/loss_vlb_step=0.000174, train/loss_step=0.0491, global_step=3034.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   5%|▍         | 60/1208 [02:08<40:56,  2.14s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0491, train/loss_vlb_step=0.000174, train/loss_step=0.0491, global_step=3034.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   5%|▍         | 60/1208 [02:08<40:56,  2.14s/it, loss=0.137, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.001, train/loss_step=0.229, global_step=3034.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 10:   5%|▌         | 61/1208 [02:09<40:34,  2.12s/it, loss=0.137, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.001, train/loss_step=0.229, global_step=3034.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   5%|▌         | 61/1208 [02:09<40:34,  2.12s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0905, train/loss_vlb_step=0.000297, train/loss_step=0.0905, global_step=3035.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   5%|▌         | 62/1208 [02:10<40:12,  2.10s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0905, train/loss_vlb_step=0.000297, train/loss_step=0.0905, global_step=3035.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   5%|▌         | 62/1208 [02:10<40:12,  2.10s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.08e-5, train/loss_step=0.0166, global_step=3035.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   5%|▌         | 63/1208 [02:11<39:50,  2.09s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.08e-5, train/loss_step=0.0166, global_step=3035.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   5%|▌         | 63/1208 [02:11<39:50,  2.09s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0814, train/loss_vlb_step=0.000268, train/loss_step=0.0814, global_step=3035.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   5%|▌         | 64/1208 [02:14<40:09,  2.11s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0814, train/loss_vlb_step=0.000268, train/loss_step=0.0814, global_step=3035.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   5%|▌         | 64/1208 [02:14<40:09,  2.11s/it, loss=0.173, v_num=0, train/loss_simple_step=0.841, train/loss_vlb_step=0.142, train/loss_step=0.841, global_step=3035.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 10:   5%|▌         | 65/1208 [02:15<39:48,  2.09s/it, loss=0.173, v_num=0, train/loss_simple_step=0.841, train/loss_vlb_step=0.142, train/loss_step=0.841, global_step=3035.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   5%|▌         | 65/1208 [02:15<39:48,  2.09s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000172, train/loss_step=0.0478, global_step=3036.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   5%|▌         | 66/1208 [02:16<39:28,  2.07s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000172, train/loss_step=0.0478, global_step=3036.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   5%|▌         | 66/1208 [02:16<39:28,  2.07s/it, loss=0.149, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.41e-5, train/loss_step=0.020, global_step=3036.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:   6%|▌         | 67/1208 [02:17<39:08,  2.06s/it, loss=0.149, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.41e-5, train/loss_step=0.020, global_step=3036.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   6%|▌         | 67/1208 [02:17<39:08,  2.06s/it, loss=0.156, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000614, train/loss_step=0.171, global_step=3036.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   6%|▌         | 68/1208 [02:21<39:26,  2.08s/it, loss=0.156, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000614, train/loss_step=0.171, global_step=3036.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   6%|▌         | 68/1208 [02:21<39:26,  2.08s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00569, train/loss_vlb_step=2.88e-5, train/loss_step=0.00569, global_step=3036.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   6%|▌         | 69/1208 [02:22<39:07,  2.06s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00569, train/loss_vlb_step=2.88e-5, train/loss_step=0.00569, global_step=3036.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   6%|▌         | 69/1208 [02:22<39:07,  2.06s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00445, train/loss_vlb_step=2.34e-5, train/loss_step=0.00445, global_step=3037.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   6%|▌         | 70/1208 [02:23<38:49,  2.05s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00445, train/loss_vlb_step=2.34e-5, train/loss_step=0.00445, global_step=3037.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   6%|▌         | 70/1208 [02:23<38:49,  2.05s/it, loss=0.141, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00134, train/loss_step=0.305, global_step=3037.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:   6%|▌         | 71/1208 [02:24<38:31,  2.03s/it, loss=0.141, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00134, train/loss_step=0.305, global_step=3037.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   6%|▌         | 71/1208 [02:24<38:31,  2.03s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=2.66e-5, train/loss_step=0.00495, global_step=3037.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   6%|▌         | 72/1208 [02:27<38:48,  2.05s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=2.66e-5, train/loss_step=0.00495, global_step=3037.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   6%|▌         | 72/1208 [02:27<38:48,  2.05s/it, loss=0.135, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000686, train/loss_step=0.193, global_step=3037.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:   6%|▌         | 73/1208 [02:28<38:30,  2.04s/it, loss=0.135, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000686, train/loss_step=0.193, global_step=3037.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   6%|▌         | 73/1208 [02:28<38:31,  2.04s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000138, train/loss_step=0.0381, global_step=3038.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   6%|▌         | 74/1208 [02:29<38:13,  2.02s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000138, train/loss_step=0.0381, global_step=3038.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   6%|▌         | 74/1208 [02:29<38:13,  2.02s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0956, train/loss_vlb_step=0.000315, train/loss_step=0.0956, global_step=3038.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   6%|▌         | 75/1208 [02:30<37:56,  2.01s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0956, train/loss_vlb_step=0.000315, train/loss_step=0.0956, global_step=3038.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   6%|▌         | 75/1208 [02:30<37:56,  2.01s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00403, train/loss_vlb_step=2.12e-5, train/loss_step=0.00403, global_step=3038.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   6%|▋         | 76/1208 [02:34<38:14,  2.03s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00403, train/loss_vlb_step=2.12e-5, train/loss_step=0.00403, global_step=3038.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   6%|▋         | 76/1208 [02:34<38:14,  2.03s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.000168, train/loss_step=0.0456, global_step=3038.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:   6%|▋         | 77/1208 [02:35<37:57,  2.01s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.000168, train/loss_step=0.0456, global_step=3038.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   6%|▋         | 77/1208 [02:35<37:57,  2.01s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00997, train/loss_vlb_step=4.63e-5, train/loss_step=0.00997, global_step=3039.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   6%|▋         | 78/1208 [02:36<37:41,  2.00s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00997, train/loss_vlb_step=4.63e-5, train/loss_step=0.00997, global_step=3039.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   6%|▋         | 78/1208 [02:36<37:41,  2.00s/it, loss=0.128, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.0014, train/loss_step=0.301, global_step=3039.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 10:   7%|▋         | 79/1208 [02:37<37:25,  1.99s/it, loss=0.128, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.0014, train/loss_step=0.301, global_step=3039.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   7%|▋         | 79/1208 [02:37<37:25,  1.99s/it, loss=0.146, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00374, train/loss_step=0.407, global_step=3039.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   7%|▋         | 80/1208 [02:40<37:41,  2.00s/it, loss=0.146, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00374, train/loss_step=0.407, global_step=3039.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   7%|▋         | 80/1208 [02:40<37:41,  2.00s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.25e-5, train/loss_step=0.00207, global_step=3039.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   7%|▋         | 81/1208 [02:41<37:26,  1.99s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.25e-5, train/loss_step=0.00207, global_step=3039.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   7%|▋         | 81/1208 [02:41<37:26,  1.99s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0707, train/loss_vlb_step=0.000238, train/loss_step=0.0707, global_step=3040.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:   7%|▋         | 82/1208 [02:42<37:10,  1.98s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0707, train/loss_vlb_step=0.000238, train/loss_step=0.0707, global_step=3040.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   7%|▋         | 82/1208 [02:42<37:10,  1.98s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.9e-5, train/loss_step=0.0101, global_step=3040.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:   7%|▋         | 83/1208 [02:43<36:56,  1.97s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.9e-5, train/loss_step=0.0101, global_step=3040.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   7%|▋         | 83/1208 [02:43<36:56,  1.97s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=8.38e-6, train/loss_step=0.00137, global_step=3040.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   7%|▋         | 84/1208 [02:46<37:11,  1.99s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=8.38e-6, train/loss_step=0.00137, global_step=3040.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   7%|▋         | 84/1208 [02:46<37:11,  1.99s/it, loss=0.113, v_num=0, train/loss_simple_step=0.526, train/loss_vlb_step=0.00713, train/loss_step=0.526, global_step=3040.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:   7%|▋         | 85/1208 [02:47<36:57,  1.97s/it, loss=0.113, v_num=0, train/loss_simple_step=0.526, train/loss_vlb_step=0.00713, train/loss_step=0.526, global_step=3040.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   7%|▋         | 85/1208 [02:47<36:57,  1.97s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0947, train/loss_vlb_step=0.000312, train/loss_step=0.0947, global_step=3041.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   7%|▋         | 86/1208 [02:48<36:42,  1.96s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0947, train/loss_vlb_step=0.000312, train/loss_step=0.0947, global_step=3041.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   7%|▋         | 86/1208 [02:48<36:43,  1.96s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.88e-5, train/loss_step=0.0216, global_step=3041.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:   7%|▋         | 87/1208 [02:49<36:29,  1.95s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.88e-5, train/loss_step=0.0216, global_step=3041.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   7%|▋         | 87/1208 [02:49<36:29,  1.95s/it, loss=0.113, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=3041.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:   7%|▋         | 88/1208 [02:53<36:44,  1.97s/it, loss=0.113, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=3041.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   7%|▋         | 88/1208 [02:53<36:44,  1.97s/it, loss=0.118, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=3041.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   7%|▋         | 89/1208 [02:54<36:30,  1.96s/it, loss=0.118, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=3041.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   7%|▋         | 89/1208 [02:54<36:30,  1.96s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=0.000104, train/loss_step=0.0257, global_step=3042.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   7%|▋         | 90/1208 [02:55<36:17,  1.95s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=0.000104, train/loss_step=0.0257, global_step=3042.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   7%|▋         | 90/1208 [02:55<36:17,  1.95s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.23e-5, train/loss_step=0.00409, global_step=3042.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   8%|▊         | 91/1208 [02:56<36:04,  1.94s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.23e-5, train/loss_step=0.00409, global_step=3042.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   8%|▊         | 91/1208 [02:56<36:04,  1.94s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0704, train/loss_vlb_step=0.000244, train/loss_step=0.0704, global_step=3042.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:   8%|▊         | 92/1208 [02:59<36:18,  1.95s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0704, train/loss_vlb_step=0.000244, train/loss_step=0.0704, global_step=3042.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   8%|▊         | 92/1208 [02:59<36:18,  1.95s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.6e-5, train/loss_step=0.0151, global_step=3042.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:   8%|▊         | 93/1208 [03:00<36:06,  1.94s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.6e-5, train/loss_step=0.0151, global_step=3042.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   8%|▊         | 93/1208 [03:00<36:06,  1.94s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0713, train/loss_vlb_step=0.000249, train/loss_step=0.0713, global_step=3043.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:   8%|▊         | 94/1208 [03:01<35:53,  1.93s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0713, train/loss_vlb_step=0.000249, train/loss_step=0.0713, global_step=3043.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   8%|▊         | 94/1208 [03:01<35:53,  1.93s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.72e-5, train/loss_step=0.0199, global_step=3043.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   8%|▊         | 95/1208 [03:02<35:41,  1.92s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.72e-5, train/loss_step=0.0199, global_step=3043.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   8%|▊         | 95/1208 [03:02<35:41,  1.92s/it, loss=0.102, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=3043.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:   8%|▊         | 96/1208 [03:06<35:55,  1.94s/it, loss=0.102, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=3043.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   8%|▊         | 96/1208 [03:06<35:55,  1.94s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00556, train/loss_vlb_step=3.01e-5, train/loss_step=0.00556, global_step=3043.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   8%|▊         | 97/1208 [03:07<35:43,  1.93s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00556, train/loss_vlb_step=3.01e-5, train/loss_step=0.00556, global_step=3043.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   8%|▊         | 97/1208 [03:07<35:43,  1.93s/it, loss=0.113, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00109, train/loss_step=0.260, global_step=3044.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:   8%|▊         | 98/1208 [03:08<35:31,  1.92s/it, loss=0.113, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00109, train/loss_step=0.260, global_step=3044.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   8%|▊         | 98/1208 [03:08<35:31,  1.92s/it, loss=0.104, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000404, train/loss_step=0.121, global_step=3044.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   8%|▊         | 99/1208 [03:09<35:19,  1.91s/it, loss=0.104, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000404, train/loss_step=0.121, global_step=3044.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   8%|▊         | 99/1208 [03:09<35:19,  1.91s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000409, train/loss_step=0.124, global_step=3044.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   8%|▊         | 100/1208 [03:12<35:32,  1.93s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000409, train/loss_step=0.124, global_step=3044.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   8%|▊         | 100/1208 [03:12<35:32,  1.93s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.68e-5, train/loss_step=0.00304, global_step=3044.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   8%|▊         | 101/1208 [03:13<35:21,  1.92s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.68e-5, train/loss_step=0.00304, global_step=3044.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   8%|▊         | 101/1208 [03:13<35:21,  1.92s/it, loss=0.0868, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.2e-5, train/loss_step=0.014, global_step=3045.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 10:   8%|▊         | 102/1208 [03:14<35:10,  1.91s/it, loss=0.0868, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.2e-5, train/loss_step=0.014, global_step=3045.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   8%|▊         | 102/1208 [03:14<35:10,  1.91s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000585, train/loss_step=0.175, global_step=3045.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   9%|▊         | 103/1208 [03:15<34:58,  1.90s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000585, train/loss_step=0.175, global_step=3045.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   9%|▊         | 103/1208 [03:15<34:58,  1.90s/it, loss=0.1, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000357, train/loss_step=0.109, global_step=3045.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:   9%|▊         | 104/1208 [03:18<35:11,  1.91s/it, loss=0.1, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000357, train/loss_step=0.109, global_step=3045.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   9%|▊         | 104/1208 [03:18<35:11,  1.91s/it, loss=0.0912, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00197, train/loss_step=0.342, global_step=3045.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   9%|▊         | 105/1208 [03:19<35:00,  1.90s/it, loss=0.0912, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00197, train/loss_step=0.342, global_step=3045.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   9%|▊         | 105/1208 [03:19<35:00,  1.90s/it, loss=0.0872, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.38e-5, train/loss_step=0.0148, global_step=3046.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   9%|▉         | 106/1208 [03:21<34:49,  1.90s/it, loss=0.0872, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.38e-5, train/loss_step=0.0148, global_step=3046.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   9%|▉         | 106/1208 [03:21<34:49,  1.90s/it, loss=0.096, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000734, train/loss_step=0.198, global_step=3046.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:   9%|▉         | 107/1208 [03:22<34:38,  1.89s/it, loss=0.096, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000734, train/loss_step=0.198, global_step=3046.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   9%|▉         | 107/1208 [03:22<34:39,  1.89s/it, loss=0.111, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00277, train/loss_step=0.420, global_step=3046.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:   9%|▉         | 108/1208 [03:25<34:51,  1.90s/it, loss=0.111, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00277, train/loss_step=0.420, global_step=3046.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   9%|▉         | 108/1208 [03:25<34:51,  1.90s/it, loss=0.111, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=3046.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   9%|▉         | 109/1208 [03:26<34:41,  1.89s/it, loss=0.111, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=3046.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   9%|▉         | 109/1208 [03:26<34:41,  1.89s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0516, train/loss_vlb_step=0.00019, train/loss_step=0.0516, global_step=3047.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   9%|▉         | 110/1208 [03:27<34:30,  1.89s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0516, train/loss_vlb_step=0.00019, train/loss_step=0.0516, global_step=3047.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   9%|▉         | 110/1208 [03:27<34:30,  1.89s/it, loss=0.132, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00265, train/loss_step=0.403, global_step=3047.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:   9%|▉         | 111/1208 [03:28<34:20,  1.88s/it, loss=0.132, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00265, train/loss_step=0.403, global_step=3047.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   9%|▉         | 111/1208 [03:28<34:20,  1.88s/it, loss=0.137, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000609, train/loss_step=0.180, global_step=3047.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   9%|▉         | 112/1208 [03:31<34:32,  1.89s/it, loss=0.137, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000609, train/loss_step=0.180, global_step=3047.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   9%|▉         | 112/1208 [03:31<34:32,  1.89s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000126, train/loss_step=0.0329, global_step=3047.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   9%|▉         | 113/1208 [03:32<34:22,  1.88s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000126, train/loss_step=0.0329, global_step=3047.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   9%|▉         | 113/1208 [03:32<34:22,  1.88s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0517, train/loss_vlb_step=0.000181, train/loss_step=0.0517, global_step=3048.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   9%|▉         | 114/1208 [03:33<34:12,  1.88s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0517, train/loss_vlb_step=0.000181, train/loss_step=0.0517, global_step=3048.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:   9%|▉         | 114/1208 [03:33<34:12,  1.88s/it, loss=0.162, v_num=0, train/loss_simple_step=0.522, train/loss_vlb_step=0.00679, train/loss_step=0.522, global_step=3048.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  10%|▉         | 115/1208 [03:34<34:02,  1.87s/it, loss=0.162, v_num=0, train/loss_simple_step=0.522, train/loss_vlb_step=0.00679, train/loss_step=0.522, global_step=3048.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  10%|▉         | 115/1208 [03:34<34:02,  1.87s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.72e-5, train/loss_step=0.0151, global_step=3048.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  10%|▉         | 116/1208 [03:38<34:13,  1.88s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.72e-5, train/loss_step=0.0151, global_step=3048.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  10%|▉         | 116/1208 [03:38<34:13,  1.88s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=8.03e-5, train/loss_step=0.0185, global_step=3048.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  10%|▉         | 117/1208 [03:39<34:04,  1.87s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=8.03e-5, train/loss_step=0.0185, global_step=3048.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  10%|▉         | 117/1208 [03:39<34:04,  1.87s/it, loss=0.158, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00104, train/loss_step=0.264, global_step=3049.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  10%|▉         | 118/1208 [03:40<33:54,  1.87s/it, loss=0.158, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00104, train/loss_step=0.264, global_step=3049.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  10%|▉         | 118/1208 [03:40<33:54,  1.87s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.000143, train/loss_step=0.0379, global_step=3049.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  10%|▉         | 119/1208 [03:41<33:45,  1.86s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.000143, train/loss_step=0.0379, global_step=3049.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  10%|▉         | 119/1208 [03:41<33:45,  1.86s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.000121, train/loss_step=0.0326, global_step=3049.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  10%|▉         | 120/1208 [03:44<33:56,  1.87s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.000121, train/loss_step=0.0326, global_step=3049.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  10%|▉         | 120/1208 [03:44<33:56,  1.87s/it, loss=0.164, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00131, train/loss_step=0.286, global_step=3049.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  10%|█         | 121/1208 [03:45<33:47,  1.87s/it, loss=0.164, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00131, train/loss_step=0.286, global_step=3049.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  10%|█         | 121/1208 [03:45<33:47,  1.87s/it, loss=0.197, v_num=0, train/loss_simple_step=0.674, train/loss_vlb_step=0.021, train/loss_step=0.674, global_step=3050.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  10%|█         | 122/1208 [03:46<33:38,  1.86s/it, loss=0.197, v_num=0, train/loss_simple_step=0.674, train/loss_vlb_step=0.021, train/loss_step=0.674, global_step=3050.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  10%|█         | 122/1208 [03:46<33:38,  1.86s/it, loss=0.2, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.0011, train/loss_step=0.241, global_step=3050.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  10%|█         | 123/1208 [03:47<33:28,  1.85s/it, loss=0.2, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.0011, train/loss_step=0.241, global_step=3050.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  10%|█         | 123/1208 [03:47<33:28,  1.85s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.000189, train/loss_step=0.0543, global_step=3050.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  10%|█         | 124/1208 [03:50<33:38,  1.86s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.000189, train/loss_step=0.0543, global_step=3050.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  10%|█         | 124/1208 [03:50<33:38,  1.86s/it, loss=0.191, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.00089, train/loss_step=0.220, global_step=3050.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  10%|█         | 125/1208 [03:52<33:30,  1.86s/it, loss=0.191, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.00089, train/loss_step=0.220, global_step=3050.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  10%|█         | 125/1208 [03:52<33:30,  1.86s/it, loss=0.202, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000905, train/loss_step=0.240, global_step=3051.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  10%|█         | 126/1208 [03:53<33:21,  1.85s/it, loss=0.202, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000905, train/loss_step=0.240, global_step=3051.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  10%|█         | 126/1208 [03:53<33:21,  1.85s/it, loss=0.204, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000837, train/loss_step=0.231, global_step=3051.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  11%|█         | 127/1208 [03:54<33:12,  1.84s/it, loss=0.204, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000837, train/loss_step=0.231, global_step=3051.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  11%|█         | 127/1208 [03:54<33:12,  1.84s/it, loss=0.2, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00179, train/loss_step=0.339, global_step=3051.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  11%|█         | 128/1208 [03:57<33:22,  1.85s/it, loss=0.2, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00179, train/loss_step=0.339, global_step=3051.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  11%|█         | 128/1208 [03:57<33:22,  1.85s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000119, train/loss_step=0.0306, global_step=3051.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  11%|█         | 129/1208 [03:58<33:14,  1.85s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000119, train/loss_step=0.0306, global_step=3051.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  11%|█         | 129/1208 [03:58<33:14,  1.85s/it, loss=0.229, v_num=0, train/loss_simple_step=0.707, train/loss_vlb_step=0.0334, train/loss_step=0.707, global_step=3052.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  11%|█         | 130/1208 [03:59<33:05,  1.84s/it, loss=0.229, v_num=0, train/loss_simple_step=0.707, train/loss_vlb_step=0.0334, train/loss_step=0.707, global_step=3052.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  11%|█         | 130/1208 [03:59<33:05,  1.84s/it, loss=0.239, v_num=0, train/loss_simple_step=0.611, train/loss_vlb_step=0.0163, train/loss_step=0.611, global_step=3052.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  11%|█         | 131/1208 [04:00<32:56,  1.84s/it, loss=0.239, v_num=0, train/loss_simple_step=0.611, train/loss_vlb_step=0.0163, train/loss_step=0.611, global_step=3052.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  11%|█         | 131/1208 [04:00<32:56,  1.84s/it, loss=0.232, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.00012, train/loss_step=0.0314, global_step=3052.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  11%|█         | 132/1208 [04:03<33:06,  1.85s/it, loss=0.232, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.00012, train/loss_step=0.0314, global_step=3052.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  11%|█         | 132/1208 [04:03<33:06,  1.85s/it, loss=0.248, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.0023, train/loss_step=0.345, global_step=3052.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  11%|█         | 133/1208 [04:04<32:58,  1.84s/it, loss=0.248, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.0023, train/loss_step=0.345, global_step=3052.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  11%|█         | 133/1208 [04:04<32:58,  1.84s/it, loss=0.249, v_num=0, train/loss_simple_step=0.0904, train/loss_vlb_step=0.000305, train/loss_step=0.0904, global_step=3053.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  11%|█         | 134/1208 [04:05<32:50,  1.83s/it, loss=0.249, v_num=0, train/loss_simple_step=0.0904, train/loss_vlb_step=0.000305, train/loss_step=0.0904, global_step=3053.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  11%|█         | 134/1208 [04:05<32:50,  1.83s/it, loss=0.237, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00185, train/loss_step=0.282, global_step=3053.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  11%|█         | 135/1208 [04:06<32:42,  1.83s/it, loss=0.237, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00185, train/loss_step=0.282, global_step=3053.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  11%|█         | 135/1208 [04:06<32:42,  1.83s/it, loss=0.252, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00156, train/loss_step=0.307, global_step=3053.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  11%|█▏        | 136/1208 [04:10<32:51,  1.84s/it, loss=0.252, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00156, train/loss_step=0.307, global_step=3053.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  11%|█▏        | 136/1208 [04:10<32:51,  1.84s/it, loss=0.256, v_num=0, train/loss_simple_step=0.0979, train/loss_vlb_step=0.000322, train/loss_step=0.0979, global_step=3053.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  11%|█▏        | 137/1208 [04:11<32:43,  1.83s/it, loss=0.256, v_num=0, train/loss_simple_step=0.0979, train/loss_vlb_step=0.000322, train/loss_step=0.0979, global_step=3053.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  11%|█▏        | 137/1208 [04:11<32:43,  1.83s/it, loss=0.243, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.44e-5, train/loss_step=0.00251, global_step=3054.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  11%|█▏        | 138/1208 [04:12<32:35,  1.83s/it, loss=0.243, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.44e-5, train/loss_step=0.00251, global_step=3054.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  11%|█▏        | 138/1208 [04:12<32:35,  1.83s/it, loss=0.241, v_num=0, train/loss_simple_step=0.00541, train/loss_vlb_step=2.85e-5, train/loss_step=0.00541, global_step=3054.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  12%|█▏        | 139/1208 [04:13<32:28,  1.82s/it, loss=0.241, v_num=0, train/loss_simple_step=0.00541, train/loss_vlb_step=2.85e-5, train/loss_step=0.00541, global_step=3054.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  12%|█▏        | 139/1208 [04:13<32:28,  1.82s/it, loss=0.241, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.57e-5, train/loss_step=0.0176, global_step=3054.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  12%|█▏        | 140/1208 [04:16<32:36,  1.83s/it, loss=0.241, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.57e-5, train/loss_step=0.0176, global_step=3054.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  12%|█▏        | 140/1208 [04:16<32:36,  1.83s/it, loss=0.227, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=5.65e-5, train/loss_step=0.0141, global_step=3054.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  12%|█▏        | 141/1208 [04:17<32:29,  1.83s/it, loss=0.227, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=5.65e-5, train/loss_step=0.0141, global_step=3054.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  12%|█▏        | 141/1208 [04:17<32:29,  1.83s/it, loss=0.203, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000797, train/loss_step=0.203, global_step=3055.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  12%|█▏        | 142/1208 [04:18<32:21,  1.82s/it, loss=0.203, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000797, train/loss_step=0.203, global_step=3055.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  12%|█▏        | 142/1208 [04:18<32:21,  1.82s/it, loss=0.208, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00216, train/loss_step=0.340, global_step=3055.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  12%|█▏        | 143/1208 [04:19<32:13,  1.82s/it, loss=0.208, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00216, train/loss_step=0.340, global_step=3055.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  12%|█▏        | 143/1208 [04:19<32:13,  1.82s/it, loss=0.206, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=2.42e-5, train/loss_step=0.00462, global_step=3055.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  12%|█▏        | 144/1208 [04:22<32:22,  1.83s/it, loss=0.206, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=2.42e-5, train/loss_step=0.00462, global_step=3055.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  12%|█▏        | 144/1208 [04:22<32:22,  1.83s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000143, train/loss_step=0.0415, global_step=3055.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  12%|█▏        | 145/1208 [04:23<32:15,  1.82s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000143, train/loss_step=0.0415, global_step=3055.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  12%|█▏        | 145/1208 [04:23<32:15,  1.82s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0992, train/loss_vlb_step=0.000326, train/loss_step=0.0992, global_step=3056.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  12%|█▏        | 146/1208 [04:24<32:07,  1.82s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0992, train/loss_vlb_step=0.000326, train/loss_step=0.0992, global_step=3056.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  12%|█▏        | 146/1208 [04:24<32:07,  1.82s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00788, train/loss_vlb_step=3.91e-5, train/loss_step=0.00788, global_step=3056.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  12%|█▏        | 147/1208 [04:26<32:00,  1.81s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00788, train/loss_vlb_step=3.91e-5, train/loss_step=0.00788, global_step=3056.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  12%|█▏        | 147/1208 [04:26<32:00,  1.81s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00297, train/loss_vlb_step=1.69e-5, train/loss_step=0.00297, global_step=3056.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  12%|█▏        | 148/1208 [04:29<32:08,  1.82s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00297, train/loss_vlb_step=1.69e-5, train/loss_step=0.00297, global_step=3056.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  12%|█▏        | 148/1208 [04:29<32:08,  1.82s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00803, train/loss_vlb_step=4.03e-5, train/loss_step=0.00803, global_step=3056.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  12%|█▏        | 149/1208 [04:30<32:01,  1.81s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00803, train/loss_vlb_step=4.03e-5, train/loss_step=0.00803, global_step=3056.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  12%|█▏        | 149/1208 [04:30<32:01,  1.81s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00978, train/loss_vlb_step=4.63e-5, train/loss_step=0.00978, global_step=3057.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  12%|█▏        | 150/1208 [04:31<31:54,  1.81s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00978, train/loss_vlb_step=4.63e-5, train/loss_step=0.00978, global_step=3057.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  12%|█▏        | 150/1208 [04:31<31:54,  1.81s/it, loss=0.103, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000502, train/loss_step=0.149, global_step=3057.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  12%|█▎        | 151/1208 [04:32<31:47,  1.80s/it, loss=0.103, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000502, train/loss_step=0.149, global_step=3057.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  12%|█▎        | 151/1208 [04:32<31:47,  1.80s/it, loss=0.108, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000432, train/loss_step=0.126, global_step=3057.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  13%|█▎        | 152/1208 [04:35<31:55,  1.81s/it, loss=0.108, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000432, train/loss_step=0.126, global_step=3057.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  13%|█▎        | 152/1208 [04:35<31:55,  1.81s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000405, train/loss_step=0.123, global_step=3057.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  13%|█▎        | 153/1208 [04:36<31:48,  1.81s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000405, train/loss_step=0.123, global_step=3057.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  13%|█▎        | 153/1208 [04:36<31:48,  1.81s/it, loss=0.129, v_num=0, train/loss_simple_step=0.744, train/loss_vlb_step=0.0634, train/loss_step=0.744, global_step=3058.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  13%|█▎        | 154/1208 [04:37<31:41,  1.80s/it, loss=0.129, v_num=0, train/loss_simple_step=0.744, train/loss_vlb_step=0.0634, train/loss_step=0.744, global_step=3058.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  13%|█▎        | 154/1208 [04:37<31:41,  1.80s/it, loss=0.128, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00102, train/loss_step=0.254, global_step=3058.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  13%|█▎        | 155/1208 [04:38<31:34,  1.80s/it, loss=0.128, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00102, train/loss_step=0.254, global_step=3058.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  13%|█▎        | 155/1208 [04:38<31:34,  1.80s/it, loss=0.121, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000559, train/loss_step=0.163, global_step=3058.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  13%|█▎        | 156/1208 [04:42<31:42,  1.81s/it, loss=0.121, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000559, train/loss_step=0.163, global_step=3058.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  13%|█▎        | 156/1208 [04:42<31:42,  1.81s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00602, train/loss_vlb_step=3.05e-5, train/loss_step=0.00602, global_step=3058.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  13%|█▎        | 157/1208 [04:43<31:36,  1.80s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00602, train/loss_vlb_step=3.05e-5, train/loss_step=0.00602, global_step=3058.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  13%|█▎        | 157/1208 [04:43<31:36,  1.80s/it, loss=0.134, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00208, train/loss_step=0.357, global_step=3059.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  13%|█▎        | 158/1208 [04:44<31:29,  1.80s/it, loss=0.134, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00208, train/loss_step=0.357, global_step=3059.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  13%|█▎        | 158/1208 [04:44<31:29,  1.80s/it, loss=0.141, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000512, train/loss_step=0.154, global_step=3059.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  13%|█▎        | 159/1208 [04:45<31:22,  1.79s/it, loss=0.141, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000512, train/loss_step=0.154, global_step=3059.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  13%|█▎        | 159/1208 [04:45<31:22,  1.79s/it, loss=0.157, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00145, train/loss_step=0.330, global_step=3059.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  13%|█▎        | 160/1208 [04:48<31:30,  1.80s/it, loss=0.157, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00145, train/loss_step=0.330, global_step=3059.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  13%|█▎        | 160/1208 [04:48<31:30,  1.80s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.32e-5, train/loss_step=0.0228, global_step=3059.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  13%|█▎        | 161/1208 [04:49<31:23,  1.80s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.32e-5, train/loss_step=0.0228, global_step=3059.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  13%|█▎        | 161/1208 [04:49<31:23,  1.80s/it, loss=0.17, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00443, train/loss_step=0.457, global_step=3060.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  13%|█▎        | 162/1208 [04:50<31:16,  1.79s/it, loss=0.17, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00443, train/loss_step=0.457, global_step=3060.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  13%|█▎        | 162/1208 [04:50<31:16,  1.79s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0626, train/loss_vlb_step=0.000215, train/loss_step=0.0626, global_step=3060.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  13%|█▎        | 163/1208 [04:51<31:10,  1.79s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0626, train/loss_vlb_step=0.000215, train/loss_step=0.0626, global_step=3060.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  13%|█▎        | 163/1208 [04:51<31:10,  1.79s/it, loss=0.167, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000797, train/loss_step=0.212, global_step=3060.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  14%|█▎        | 164/1208 [04:55<31:17,  1.80s/it, loss=0.167, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000797, train/loss_step=0.212, global_step=3060.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  14%|█▎        | 164/1208 [04:55<31:17,  1.80s/it, loss=0.172, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000493, train/loss_step=0.146, global_step=3060.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  14%|█▎        | 165/1208 [04:56<31:11,  1.79s/it, loss=0.172, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000493, train/loss_step=0.146, global_step=3060.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  14%|█▎        | 165/1208 [04:56<31:11,  1.79s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.73e-5, train/loss_step=0.0172, global_step=3061.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  14%|█▎        | 166/1208 [04:57<31:04,  1.79s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.73e-5, train/loss_step=0.0172, global_step=3061.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  14%|█▎        | 166/1208 [04:57<31:04,  1.79s/it, loss=0.181, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.000966, train/loss_step=0.271, global_step=3061.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  14%|█▍        | 167/1208 [04:58<30:58,  1.79s/it, loss=0.181, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.000966, train/loss_step=0.271, global_step=3061.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  14%|█▍        | 167/1208 [04:58<30:58,  1.79s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=1.12e-5, train/loss_step=0.00185, global_step=3061.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  14%|█▍        | 168/1208 [05:01<31:05,  1.79s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=1.12e-5, train/loss_step=0.00185, global_step=3061.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  14%|█▍        | 168/1208 [05:01<31:05,  1.79s/it, loss=0.189, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000552, train/loss_step=0.164, global_step=3061.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  14%|█▍        | 169/1208 [05:02<30:59,  1.79s/it, loss=0.189, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000552, train/loss_step=0.164, global_step=3061.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  14%|█▍        | 169/1208 [05:02<30:59,  1.79s/it, loss=0.225, v_num=0, train/loss_simple_step=0.730, train/loss_vlb_step=0.0622, train/loss_step=0.730, global_step=3062.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  14%|█▍        | 170/1208 [05:03<30:53,  1.79s/it, loss=0.225, v_num=0, train/loss_simple_step=0.730, train/loss_vlb_step=0.0622, train/loss_step=0.730, global_step=3062.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  14%|█▍        | 170/1208 [05:03<30:53,  1.79s/it, loss=0.229, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000887, train/loss_step=0.230, global_step=3062.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  14%|█▍        | 171/1208 [05:04<30:46,  1.78s/it, loss=0.229, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000887, train/loss_step=0.230, global_step=3062.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  14%|█▍        | 171/1208 [05:04<30:46,  1.78s/it, loss=0.234, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000901, train/loss_step=0.244, global_step=3062.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  14%|█▍        | 172/1208 [05:07<30:53,  1.79s/it, loss=0.234, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000901, train/loss_step=0.244, global_step=3062.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  14%|█▍        | 172/1208 [05:07<30:54,  1.79s/it, loss=0.232, v_num=0, train/loss_simple_step=0.0789, train/loss_vlb_step=0.000265, train/loss_step=0.0789, global_step=3062.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  14%|█▍        | 173/1208 [05:08<30:47,  1.79s/it, loss=0.232, v_num=0, train/loss_simple_step=0.0789, train/loss_vlb_step=0.000265, train/loss_step=0.0789, global_step=3062.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  14%|█▍        | 173/1208 [05:08<30:47,  1.79s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0782, train/loss_vlb_step=0.000262, train/loss_step=0.0782, global_step=3063.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  14%|█▍        | 174/1208 [05:09<30:41,  1.78s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0782, train/loss_vlb_step=0.000262, train/loss_step=0.0782, global_step=3063.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  14%|█▍        | 174/1208 [05:09<30:41,  1.78s/it, loss=0.195, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000577, train/loss_step=0.170, global_step=3063.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  14%|█▍        | 175/1208 [05:10<30:35,  1.78s/it, loss=0.195, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000577, train/loss_step=0.170, global_step=3063.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  14%|█▍        | 175/1208 [05:10<30:35,  1.78s/it, loss=0.201, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00136, train/loss_step=0.284, global_step=3063.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  15%|█▍        | 176/1208 [05:14<30:42,  1.79s/it, loss=0.201, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00136, train/loss_step=0.284, global_step=3063.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  15%|█▍        | 176/1208 [05:14<30:42,  1.79s/it, loss=0.201, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.74e-5, train/loss_step=0.00313, global_step=3063.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  15%|█▍        | 177/1208 [05:15<30:36,  1.78s/it, loss=0.201, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.74e-5, train/loss_step=0.00313, global_step=3063.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  15%|█▍        | 177/1208 [05:15<30:36,  1.78s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0498, train/loss_vlb_step=0.000174, train/loss_step=0.0498, global_step=3064.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  15%|█▍        | 178/1208 [05:16<30:30,  1.78s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0498, train/loss_vlb_step=0.000174, train/loss_step=0.0498, global_step=3064.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  15%|█▍        | 178/1208 [05:16<30:30,  1.78s/it, loss=0.197, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00226, train/loss_step=0.389, global_step=3064.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  15%|█▍        | 179/1208 [05:17<30:24,  1.77s/it, loss=0.197, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00226, train/loss_step=0.389, global_step=3064.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  15%|█▍        | 179/1208 [05:17<30:24,  1.77s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0559, train/loss_vlb_step=0.00019, train/loss_step=0.0559, global_step=3064.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  15%|█▍        | 180/1208 [05:20<30:30,  1.78s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0559, train/loss_vlb_step=0.00019, train/loss_step=0.0559, global_step=3064.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  15%|█▍        | 180/1208 [05:20<30:30,  1.78s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00517, train/loss_vlb_step=2.54e-5, train/loss_step=0.00517, global_step=3064.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  15%|█▍        | 181/1208 [05:21<30:24,  1.78s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00517, train/loss_vlb_step=2.54e-5, train/loss_step=0.00517, global_step=3064.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  15%|█▍        | 181/1208 [05:21<30:25,  1.78s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00809, train/loss_vlb_step=3.84e-5, train/loss_step=0.00809, global_step=3065.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  15%|█▌        | 182/1208 [05:22<30:19,  1.77s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00809, train/loss_vlb_step=3.84e-5, train/loss_step=0.00809, global_step=3065.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  15%|█▌        | 182/1208 [05:22<30:19,  1.77s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00513, train/loss_vlb_step=2.76e-5, train/loss_step=0.00513, global_step=3065.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  15%|█▌        | 183/1208 [05:23<30:13,  1.77s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00513, train/loss_vlb_step=2.76e-5, train/loss_step=0.00513, global_step=3065.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  15%|█▌        | 183/1208 [05:23<30:13,  1.77s/it, loss=0.154, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000477, train/loss_step=0.144, global_step=3065.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  15%|█▌        | 184/1208 [05:27<30:19,  1.78s/it, loss=0.154, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000477, train/loss_step=0.144, global_step=3065.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  15%|█▌        | 184/1208 [05:27<30:19,  1.78s/it, loss=0.161, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00117, train/loss_step=0.284, global_step=3065.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  15%|█▌        | 185/1208 [05:28<30:14,  1.77s/it, loss=0.161, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00117, train/loss_step=0.284, global_step=3065.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  15%|█▌        | 185/1208 [05:28<30:14,  1.77s/it, loss=0.181, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00364, train/loss_step=0.420, global_step=3066.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  15%|█▌        | 186/1208 [05:29<30:08,  1.77s/it, loss=0.181, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00364, train/loss_step=0.420, global_step=3066.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  15%|█▌        | 186/1208 [05:29<30:08,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.58e-5, train/loss_step=0.0149, global_step=3066.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  15%|█▌        | 187/1208 [05:30<30:02,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.58e-5, train/loss_step=0.0149, global_step=3066.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  15%|█▌        | 187/1208 [05:30<30:02,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.76e-5, train/loss_step=0.003, global_step=3066.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  16%|█▌        | 188/1208 [05:33<30:09,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.76e-5, train/loss_step=0.003, global_step=3066.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  16%|█▌        | 188/1208 [05:33<30:09,  1.77s/it, loss=0.167, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000464, train/loss_step=0.140, global_step=3066.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  16%|█▌        | 189/1208 [05:34<30:03,  1.77s/it, loss=0.167, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000464, train/loss_step=0.140, global_step=3066.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  16%|█▌        | 189/1208 [05:34<30:03,  1.77s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.000182, train/loss_step=0.0521, global_step=3067.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  16%|█▌        | 190/1208 [05:35<29:57,  1.77s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.000182, train/loss_step=0.0521, global_step=3067.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  16%|█▌        | 190/1208 [05:35<29:57,  1.77s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000125, train/loss_step=0.0336, global_step=3067.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  16%|█▌        | 191/1208 [05:36<29:52,  1.76s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000125, train/loss_step=0.0336, global_step=3067.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  16%|█▌        | 191/1208 [05:36<29:52,  1.76s/it, loss=0.134, v_num=0, train/loss_simple_step=0.459, train/loss_vlb_step=0.00394, train/loss_step=0.459, global_step=3067.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  16%|█▌        | 192/1208 [05:39<29:58,  1.77s/it, loss=0.134, v_num=0, train/loss_simple_step=0.459, train/loss_vlb_step=0.00394, train/loss_step=0.459, global_step=3067.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  16%|█▌        | 192/1208 [05:39<29:58,  1.77s/it, loss=0.136, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=3067.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  16%|█▌        | 193/1208 [05:40<29:52,  1.77s/it, loss=0.136, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=3067.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  16%|█▌        | 193/1208 [05:40<29:52,  1.77s/it, loss=0.133, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.000127, train/loss_step=0.033, global_step=3068.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  16%|█▌        | 194/1208 [05:41<29:47,  1.76s/it, loss=0.133, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.000127, train/loss_step=0.033, global_step=3068.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  16%|█▌        | 194/1208 [05:41<29:47,  1.76s/it, loss=0.127, v_num=0, train/loss_simple_step=0.037, train/loss_vlb_step=0.000137, train/loss_step=0.037, global_step=3068.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  16%|█▌        | 195/1208 [05:43<29:41,  1.76s/it, loss=0.127, v_num=0, train/loss_simple_step=0.037, train/loss_vlb_step=0.000137, train/loss_step=0.037, global_step=3068.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  16%|█▌        | 195/1208 [05:43<29:41,  1.76s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.000155, train/loss_step=0.0425, global_step=3068.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  16%|█▌        | 196/1208 [05:46<29:47,  1.77s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.000155, train/loss_step=0.0425, global_step=3068.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  16%|█▌        | 196/1208 [05:46<29:47,  1.77s/it, loss=0.129, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00124, train/loss_step=0.286, global_step=3068.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  16%|█▋        | 197/1208 [05:47<29:42,  1.76s/it, loss=0.129, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00124, train/loss_step=0.286, global_step=3068.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  16%|█▋        | 197/1208 [05:47<29:42,  1.76s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.000194, train/loss_step=0.0526, global_step=3069.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  16%|█▋        | 198/1208 [05:48<29:36,  1.76s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.000194, train/loss_step=0.0526, global_step=3069.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  16%|█▋        | 198/1208 [05:48<29:36,  1.76s/it, loss=0.122, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00111, train/loss_step=0.253, global_step=3069.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  16%|█▋        | 199/1208 [05:49<29:31,  1.76s/it, loss=0.122, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00111, train/loss_step=0.253, global_step=3069.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  16%|█▋        | 199/1208 [05:49<29:31,  1.76s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00507, train/loss_vlb_step=2.6e-5, train/loss_step=0.00507, global_step=3069.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  17%|█▋        | 200/1208 [05:52<29:36,  1.76s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00507, train/loss_vlb_step=2.6e-5, train/loss_step=0.00507, global_step=3069.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  17%|█▋        | 200/1208 [05:52<29:37,  1.76s/it, loss=0.123, v_num=0, train/loss_simple_step=0.076, train/loss_vlb_step=0.000256, train/loss_step=0.076, global_step=3069.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  17%|█▋        | 201/1208 [05:53<29:31,  1.76s/it, loss=0.123, v_num=0, train/loss_simple_step=0.076, train/loss_vlb_step=0.000256, train/loss_step=0.076, global_step=3069.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  17%|█▋        | 201/1208 [05:53<29:31,  1.76s/it, loss=0.154, v_num=0, train/loss_simple_step=0.626, train/loss_vlb_step=0.0146, train/loss_step=0.626, global_step=3070.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  17%|█▋        | 202/1208 [05:54<29:26,  1.76s/it, loss=0.154, v_num=0, train/loss_simple_step=0.626, train/loss_vlb_step=0.0146, train/loss_step=0.626, global_step=3070.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  17%|█▋        | 202/1208 [05:54<29:26,  1.76s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.01e-5, train/loss_step=0.0194, global_step=3070.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  17%|█▋        | 203/1208 [05:55<29:21,  1.75s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.01e-5, train/loss_step=0.0194, global_step=3070.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  17%|█▋        | 203/1208 [05:55<29:21,  1.75s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000134, train/loss_step=0.0358, global_step=3070.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  17%|█▋        | 204/1208 [05:58<29:26,  1.76s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000134, train/loss_step=0.0358, global_step=3070.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  17%|█▋        | 204/1208 [05:58<29:26,  1.76s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.000187, train/loss_step=0.0527, global_step=3070.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  17%|█▋        | 205/1208 [06:00<29:21,  1.76s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.000187, train/loss_step=0.0527, global_step=3070.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  17%|█▋        | 205/1208 [06:00<29:21,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000169, train/loss_step=0.0484, global_step=3071.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  17%|█▋        | 206/1208 [06:01<29:16,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000169, train/loss_step=0.0484, global_step=3071.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  17%|█▋        | 206/1208 [06:01<29:16,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00243, train/loss_step=0.393, global_step=3071.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  17%|█▋        | 207/1208 [06:02<29:10,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00243, train/loss_step=0.393, global_step=3071.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  17%|█▋        | 207/1208 [06:02<29:10,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000134, train/loss_step=0.0335, global_step=3071.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  17%|█▋        | 208/1208 [06:05<29:16,  1.76s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000134, train/loss_step=0.0335, global_step=3071.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  17%|█▋        | 208/1208 [06:05<29:16,  1.76s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000112, train/loss_step=0.0278, global_step=3071.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  17%|█▋        | 209/1208 [06:06<29:11,  1.75s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000112, train/loss_step=0.0278, global_step=3071.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  17%|█▋        | 209/1208 [06:06<29:11,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0959, train/loss_vlb_step=0.000318, train/loss_step=0.0959, global_step=3072.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  17%|█▋        | 210/1208 [06:07<29:06,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0959, train/loss_vlb_step=0.000318, train/loss_step=0.0959, global_step=3072.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  17%|█▋        | 210/1208 [06:07<29:06,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0912, train/loss_vlb_step=0.0003, train/loss_step=0.0912, global_step=3072.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  17%|█▋        | 211/1208 [06:08<29:01,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0912, train/loss_vlb_step=0.0003, train/loss_step=0.0912, global_step=3072.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  17%|█▋        | 211/1208 [06:08<29:01,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.81e-5, train/loss_step=0.0156, global_step=3072.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  18%|█▊        | 212/1208 [06:11<29:06,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.81e-5, train/loss_step=0.0156, global_step=3072.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  18%|█▊        | 212/1208 [06:11<29:06,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00996, train/loss_vlb_step=4.72e-5, train/loss_step=0.00996, global_step=3072.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  18%|█▊        | 213/1208 [06:12<29:01,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00996, train/loss_vlb_step=4.72e-5, train/loss_step=0.00996, global_step=3072.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  18%|█▊        | 213/1208 [06:12<29:01,  1.75s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00555, train/loss_vlb_step=2.9e-5, train/loss_step=0.00555, global_step=3073.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  18%|█▊        | 214/1208 [06:13<28:56,  1.75s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00555, train/loss_vlb_step=2.9e-5, train/loss_step=0.00555, global_step=3073.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  18%|█▊        | 214/1208 [06:13<28:56,  1.75s/it, loss=0.114, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=3073.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  18%|█▊        | 215/1208 [06:14<28:51,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=3073.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  18%|█▊        | 215/1208 [06:14<28:51,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000564, train/loss_step=0.160, global_step=3073.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  18%|█▊        | 216/1208 [06:18<28:57,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000564, train/loss_step=0.160, global_step=3073.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  18%|█▊        | 216/1208 [06:18<28:57,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000864, train/loss_step=0.206, global_step=3073.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  18%|█▊        | 217/1208 [06:19<28:52,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000864, train/loss_step=0.206, global_step=3073.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  18%|█▊        | 217/1208 [06:19<28:52,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=1.91e-5, train/loss_step=0.0034, global_step=3074.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  18%|█▊        | 218/1208 [06:20<28:47,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=1.91e-5, train/loss_step=0.0034, global_step=3074.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  18%|█▊        | 218/1208 [06:20<28:47,  1.74s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.2e-5, train/loss_step=0.0137, global_step=3074.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  18%|█▊        | 219/1208 [06:21<28:42,  1.74s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.2e-5, train/loss_step=0.0137, global_step=3074.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  18%|█▊        | 219/1208 [06:21<28:42,  1.74s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1.29e-5, train/loss_step=0.00226, global_step=3074.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  18%|█▊        | 220/1208 [06:24<28:47,  1.75s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1.29e-5, train/loss_step=0.00226, global_step=3074.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  18%|█▊        | 220/1208 [06:24<28:47,  1.75s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=9.69e-5, train/loss_step=0.0254, global_step=3074.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  18%|█▊        | 221/1208 [06:25<28:42,  1.75s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=9.69e-5, train/loss_step=0.0254, global_step=3074.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  18%|█▊        | 221/1208 [06:25<28:42,  1.75s/it, loss=0.0721, v_num=0, train/loss_simple_step=0.0945, train/loss_vlb_step=0.000313, train/loss_step=0.0945, global_step=3075.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  18%|█▊        | 222/1208 [06:26<28:37,  1.74s/it, loss=0.0721, v_num=0, train/loss_simple_step=0.0945, train/loss_vlb_step=0.000313, train/loss_step=0.0945, global_step=3075.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  18%|█▊        | 222/1208 [06:26<28:37,  1.74s/it, loss=0.0719, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=5.88e-5, train/loss_step=0.0139, global_step=3075.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  18%|█▊        | 223/1208 [06:27<28:32,  1.74s/it, loss=0.0719, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=5.88e-5, train/loss_step=0.0139, global_step=3075.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  18%|█▊        | 223/1208 [06:27<28:32,  1.74s/it, loss=0.077, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000489, train/loss_step=0.139, global_step=3075.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  19%|█▊        | 224/1208 [06:31<28:37,  1.75s/it, loss=0.077, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000489, train/loss_step=0.139, global_step=3075.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  19%|█▊        | 224/1208 [06:31<28:37,  1.75s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00199, train/loss_step=0.337, global_step=3075.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  19%|█▊        | 225/1208 [06:32<28:32,  1.74s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00199, train/loss_step=0.337, global_step=3075.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  19%|█▊        | 225/1208 [06:32<28:32,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.0015, train/loss_step=0.320, global_step=3076.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  19%|█▊        | 226/1208 [06:33<28:28,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.0015, train/loss_step=0.320, global_step=3076.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  19%|█▊        | 226/1208 [06:33<28:28,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00247, train/loss_step=0.402, global_step=3076.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  19%|█▉        | 227/1208 [06:34<28:23,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00247, train/loss_step=0.402, global_step=3076.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  19%|█▉        | 227/1208 [06:34<28:23,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00208, train/loss_step=0.353, global_step=3076.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  19%|█▉        | 228/1208 [06:37<28:28,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00208, train/loss_step=0.353, global_step=3076.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  19%|█▉        | 228/1208 [06:37<28:28,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.646, train/loss_vlb_step=0.0165, train/loss_step=0.646, global_step=3076.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  19%|█▉        | 229/1208 [06:38<28:23,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.646, train/loss_vlb_step=0.0165, train/loss_step=0.646, global_step=3076.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  19%|█▉        | 229/1208 [06:38<28:23,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.84e-5, train/loss_step=0.0158, global_step=3077.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  19%|█▉        | 230/1208 [06:39<28:18,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.84e-5, train/loss_step=0.0158, global_step=3077.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  19%|█▉        | 230/1208 [06:39<28:18,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00566, train/loss_vlb_step=2.94e-5, train/loss_step=0.00566, global_step=3077.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  19%|█▉        | 231/1208 [06:40<28:14,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00566, train/loss_vlb_step=2.94e-5, train/loss_step=0.00566, global_step=3077.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  19%|█▉        | 231/1208 [06:40<28:14,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00168, train/loss_step=0.328, global_step=3077.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  19%|█▉        | 232/1208 [06:43<28:18,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00168, train/loss_step=0.328, global_step=3077.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  19%|█▉        | 232/1208 [06:43<28:18,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000902, train/loss_step=0.229, global_step=3077.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  19%|█▉        | 233/1208 [06:44<28:14,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000902, train/loss_step=0.229, global_step=3077.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  19%|█▉        | 233/1208 [06:44<28:14,  1.74s/it, loss=0.175, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=3078.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  19%|█▉        | 234/1208 [06:45<28:09,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=3078.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  19%|█▉        | 234/1208 [06:45<28:09,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000475, train/loss_step=0.144, global_step=3078.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  19%|█▉        | 235/1208 [06:46<28:05,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000475, train/loss_step=0.144, global_step=3078.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  19%|█▉        | 235/1208 [06:46<28:05,  1.73s/it, loss=0.176, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000451, train/loss_step=0.136, global_step=3078.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  20%|█▉        | 236/1208 [06:50<28:09,  1.74s/it, loss=0.176, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000451, train/loss_step=0.136, global_step=3078.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  20%|█▉        | 236/1208 [06:50<28:09,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=0.000103, train/loss_step=0.025, global_step=3078.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  20%|█▉        | 237/1208 [06:51<28:04,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=0.000103, train/loss_step=0.025, global_step=3078.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  20%|█▉        | 237/1208 [06:51<28:04,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.21e-5, train/loss_step=0.0117, global_step=3079.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  20%|█▉        | 238/1208 [06:52<28:00,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.21e-5, train/loss_step=0.0117, global_step=3079.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  20%|█▉        | 238/1208 [06:52<28:00,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000247, train/loss_step=0.0741, global_step=3079.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  20%|█▉        | 239/1208 [06:53<27:55,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000247, train/loss_step=0.0741, global_step=3079.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  20%|█▉        | 239/1208 [06:53<27:55,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000513, train/loss_step=0.153, global_step=3079.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  20%|█▉        | 240/1208 [06:56<28:00,  1.74s/it, loss=0.178, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000513, train/loss_step=0.153, global_step=3079.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  20%|█▉        | 240/1208 [06:56<28:00,  1.74s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.11e-5, train/loss_step=0.00186, global_step=3079.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  20%|█▉        | 241/1208 [06:57<27:55,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.11e-5, train/loss_step=0.00186, global_step=3079.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  20%|█▉        | 241/1208 [06:57<27:55,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000497, train/loss_step=0.150, global_step=3080.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  20%|██        | 242/1208 [06:58<27:51,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000497, train/loss_step=0.150, global_step=3080.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  20%|██        | 242/1208 [06:58<27:51,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.92e-5, train/loss_step=0.018, global_step=3080.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  20%|██        | 243/1208 [06:59<27:46,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.92e-5, train/loss_step=0.018, global_step=3080.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  20%|██        | 243/1208 [06:59<27:46,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.00049, train/loss_step=0.144, global_step=3080.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  20%|██        | 244/1208 [07:02<27:51,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.00049, train/loss_step=0.144, global_step=3080.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  20%|██        | 244/1208 [07:03<27:51,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000116, train/loss_step=0.0306, global_step=3080.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  20%|██        | 245/1208 [07:04<27:46,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000116, train/loss_step=0.0306, global_step=3080.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  20%|██        | 245/1208 [07:04<27:46,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00102, train/loss_step=0.262, global_step=3081.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  20%|██        | 246/1208 [07:05<27:42,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00102, train/loss_step=0.262, global_step=3081.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  20%|██        | 246/1208 [07:05<27:42,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0746, train/loss_vlb_step=0.000251, train/loss_step=0.0746, global_step=3081.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  20%|██        | 247/1208 [07:06<27:38,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0746, train/loss_vlb_step=0.000251, train/loss_step=0.0746, global_step=3081.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  20%|██        | 247/1208 [07:06<27:38,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.000146, train/loss_step=0.0394, global_step=3081.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  21%|██        | 248/1208 [07:09<27:42,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.000146, train/loss_step=0.0394, global_step=3081.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  21%|██        | 248/1208 [07:09<27:42,  1.73s/it, loss=0.0991, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.00013, train/loss_step=0.0349, global_step=3081.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  21%|██        | 249/1208 [07:10<27:37,  1.73s/it, loss=0.0991, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.00013, train/loss_step=0.0349, global_step=3081.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  21%|██        | 249/1208 [07:10<27:37,  1.73s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.23e-5, train/loss_step=0.0232, global_step=3082.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  21%|██        | 250/1208 [07:11<27:33,  1.73s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.23e-5, train/loss_step=0.0232, global_step=3082.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  21%|██        | 250/1208 [07:11<27:33,  1.73s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0881, train/loss_vlb_step=0.00029, train/loss_step=0.0881, global_step=3082.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  21%|██        | 251/1208 [07:12<27:29,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0881, train/loss_vlb_step=0.00029, train/loss_step=0.0881, global_step=3082.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  21%|██        | 251/1208 [07:12<27:29,  1.72s/it, loss=0.0874, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=1.73e-5, train/loss_step=0.00309, global_step=3082.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  21%|██        | 252/1208 [07:15<27:33,  1.73s/it, loss=0.0874, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=1.73e-5, train/loss_step=0.00309, global_step=3082.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  21%|██        | 252/1208 [07:15<27:33,  1.73s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00106, train/loss_step=0.260, global_step=3082.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  21%|██        | 253/1208 [07:16<27:29,  1.73s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00106, train/loss_step=0.260, global_step=3082.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  21%|██        | 253/1208 [07:16<27:29,  1.73s/it, loss=0.0838, v_num=0, train/loss_simple_step=0.00264, train/loss_vlb_step=1.51e-5, train/loss_step=0.00264, global_step=3083.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  21%|██        | 254/1208 [07:17<27:24,  1.72s/it, loss=0.0838, v_num=0, train/loss_simple_step=0.00264, train/loss_vlb_step=1.51e-5, train/loss_step=0.00264, global_step=3083.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  21%|██        | 254/1208 [07:17<27:24,  1.72s/it, loss=0.085, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.0006, train/loss_step=0.167, global_step=3083.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]      Epoch 10:  21%|██        | 255/1208 [07:18<27:20,  1.72s/it, loss=0.085, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.0006, train/loss_step=0.167, global_step=3083.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  21%|██        | 255/1208 [07:19<27:20,  1.72s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000919, train/loss_step=0.230, global_step=3083.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  21%|██        | 256/1208 [07:22<27:24,  1.73s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000919, train/loss_step=0.230, global_step=3083.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  21%|██        | 256/1208 [07:22<27:24,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.538, train/loss_vlb_step=0.00559, train/loss_step=0.538, global_step=3083.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  21%|██▏       | 257/1208 [07:23<27:20,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.538, train/loss_vlb_step=0.00559, train/loss_step=0.538, global_step=3083.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  21%|██▏       | 257/1208 [07:23<27:20,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.64e-5, train/loss_step=0.0128, global_step=3084.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  21%|██▏       | 258/1208 [07:24<27:16,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.64e-5, train/loss_step=0.0128, global_step=3084.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  21%|██▏       | 258/1208 [07:24<27:16,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00124, train/loss_step=0.300, global_step=3084.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  21%|██▏       | 259/1208 [07:25<27:12,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00124, train/loss_step=0.300, global_step=3084.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  21%|██▏       | 259/1208 [07:25<27:12,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000598, train/loss_step=0.170, global_step=3084.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  22%|██▏       | 260/1208 [07:28<27:16,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000598, train/loss_step=0.170, global_step=3084.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  22%|██▏       | 260/1208 [07:28<27:16,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000513, train/loss_step=0.152, global_step=3084.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  22%|██▏       | 261/1208 [07:29<27:12,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000513, train/loss_step=0.152, global_step=3084.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  22%|██▏       | 261/1208 [07:29<27:12,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.076, train/loss_vlb_step=0.000257, train/loss_step=0.076, global_step=3085.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  22%|██▏       | 262/1208 [07:30<27:07,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.076, train/loss_vlb_step=0.000257, train/loss_step=0.076, global_step=3085.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  22%|██▏       | 262/1208 [07:30<27:07,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00108, train/loss_step=0.254, global_step=3085.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  22%|██▏       | 263/1208 [07:31<27:03,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00108, train/loss_step=0.254, global_step=3085.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  22%|██▏       | 263/1208 [07:31<27:03,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000978, train/loss_step=0.235, global_step=3085.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  22%|██▏       | 264/1208 [07:35<27:07,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000978, train/loss_step=0.235, global_step=3085.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  22%|██▏       | 264/1208 [07:35<27:07,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00668, train/loss_vlb_step=3.45e-5, train/loss_step=0.00668, global_step=3085.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  22%|██▏       | 265/1208 [07:36<27:03,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00668, train/loss_vlb_step=3.45e-5, train/loss_step=0.00668, global_step=3085.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  22%|██▏       | 265/1208 [07:36<27:03,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.00094, train/loss_step=0.226, global_step=3086.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  22%|██▏       | 266/1208 [07:37<26:59,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.00094, train/loss_step=0.226, global_step=3086.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  22%|██▏       | 266/1208 [07:37<26:59,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0938, train/loss_vlb_step=0.000309, train/loss_step=0.0938, global_step=3086.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  22%|██▏       | 267/1208 [07:38<26:54,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0938, train/loss_vlb_step=0.000309, train/loss_step=0.0938, global_step=3086.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  22%|██▏       | 267/1208 [07:38<26:54,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000453, train/loss_step=0.138, global_step=3086.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  22%|██▏       | 268/1208 [07:41<26:58,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000453, train/loss_step=0.138, global_step=3086.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  22%|██▏       | 268/1208 [07:41<26:58,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0928, train/loss_vlb_step=0.000307, train/loss_step=0.0928, global_step=3086.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  22%|██▏       | 269/1208 [07:42<26:54,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0928, train/loss_vlb_step=0.000307, train/loss_step=0.0928, global_step=3086.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  22%|██▏       | 269/1208 [07:42<26:54,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.639, train/loss_vlb_step=0.0156, train/loss_step=0.639, global_step=3087.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  22%|██▏       | 270/1208 [07:43<26:50,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.639, train/loss_vlb_step=0.0156, train/loss_step=0.639, global_step=3087.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  22%|██▏       | 270/1208 [07:43<26:50,  1.72s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.67e-5, train/loss_step=0.0125, global_step=3087.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  22%|██▏       | 271/1208 [07:44<26:46,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.67e-5, train/loss_step=0.0125, global_step=3087.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  22%|██▏       | 271/1208 [07:44<26:46,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.27e-5, train/loss_step=0.0199, global_step=3087.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  23%|██▎       | 272/1208 [07:47<26:50,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.27e-5, train/loss_step=0.0199, global_step=3087.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  23%|██▎       | 272/1208 [07:47<26:50,  1.72s/it, loss=0.185, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00196, train/loss_step=0.331, global_step=3087.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  23%|██▎       | 273/1208 [07:48<26:46,  1.72s/it, loss=0.185, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00196, train/loss_step=0.331, global_step=3087.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  23%|██▎       | 273/1208 [07:48<26:46,  1.72s/it, loss=0.211, v_num=0, train/loss_simple_step=0.526, train/loss_vlb_step=0.00623, train/loss_step=0.526, global_step=3088.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  23%|██▎       | 274/1208 [07:50<26:42,  1.72s/it, loss=0.211, v_num=0, train/loss_simple_step=0.526, train/loss_vlb_step=0.00623, train/loss_step=0.526, global_step=3088.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  23%|██▎       | 274/1208 [07:50<26:42,  1.72s/it, loss=0.204, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=7.46e-5, train/loss_step=0.0161, global_step=3088.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  23%|██▎       | 275/1208 [07:51<26:38,  1.71s/it, loss=0.204, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=7.46e-5, train/loss_step=0.0161, global_step=3088.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  23%|██▎       | 275/1208 [07:51<26:38,  1.71s/it, loss=0.204, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000978, train/loss_step=0.235, global_step=3088.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  23%|██▎       | 276/1208 [07:54<26:42,  1.72s/it, loss=0.204, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000978, train/loss_step=0.235, global_step=3088.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  23%|██▎       | 276/1208 [07:54<26:42,  1.72s/it, loss=0.194, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00161, train/loss_step=0.347, global_step=3088.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  23%|██▎       | 277/1208 [07:55<26:38,  1.72s/it, loss=0.194, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00161, train/loss_step=0.347, global_step=3088.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  23%|██▎       | 277/1208 [07:55<26:38,  1.72s/it, loss=0.206, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000954, train/loss_step=0.244, global_step=3089.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  23%|██▎       | 278/1208 [07:56<26:34,  1.71s/it, loss=0.206, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000954, train/loss_step=0.244, global_step=3089.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  23%|██▎       | 278/1208 [07:56<26:34,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=9.6e-5, train/loss_step=0.025, global_step=3089.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  23%|██▎       | 279/1208 [07:57<26:30,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=9.6e-5, train/loss_step=0.025, global_step=3089.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  23%|██▎       | 279/1208 [07:57<26:30,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000117, train/loss_step=0.0304, global_step=3089.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  23%|██▎       | 280/1208 [08:00<26:33,  1.72s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000117, train/loss_step=0.0304, global_step=3089.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  23%|██▎       | 280/1208 [08:00<26:33,  1.72s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0547, train/loss_vlb_step=0.000189, train/loss_step=0.0547, global_step=3089.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  23%|██▎       | 281/1208 [08:01<26:29,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0547, train/loss_vlb_step=0.000189, train/loss_step=0.0547, global_step=3089.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  23%|██▎       | 281/1208 [08:01<26:29,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000862, train/loss_step=0.225, global_step=3090.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  23%|██▎       | 282/1208 [08:02<26:25,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000862, train/loss_step=0.225, global_step=3090.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  23%|██▎       | 282/1208 [08:02<26:25,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00142, train/loss_step=0.297, global_step=3090.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  23%|██▎       | 283/1208 [08:03<26:21,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00142, train/loss_step=0.297, global_step=3090.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  23%|██▎       | 283/1208 [08:03<26:21,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00814, train/loss_vlb_step=3.98e-5, train/loss_step=0.00814, global_step=3090.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  24%|██▎       | 284/1208 [08:07<26:25,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00814, train/loss_vlb_step=3.98e-5, train/loss_step=0.00814, global_step=3090.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  24%|██▎       | 284/1208 [08:07<26:25,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00487, train/loss_vlb_step=2.58e-5, train/loss_step=0.00487, global_step=3090.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  24%|██▎       | 285/1208 [08:08<26:21,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00487, train/loss_vlb_step=2.58e-5, train/loss_step=0.00487, global_step=3090.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  24%|██▎       | 285/1208 [08:08<26:21,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=3091.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  24%|██▎       | 286/1208 [08:09<26:17,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=3091.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  24%|██▎       | 286/1208 [08:09<26:17,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.00062, train/loss_step=0.178, global_step=3091.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  24%|██▍       | 287/1208 [08:10<26:13,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.00062, train/loss_step=0.178, global_step=3091.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  24%|██▍       | 287/1208 [08:10<26:13,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000522, train/loss_step=0.154, global_step=3091.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  24%|██▍       | 288/1208 [08:13<26:17,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000522, train/loss_step=0.154, global_step=3091.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  24%|██▍       | 288/1208 [08:13<26:17,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.92e-5, train/loss_step=0.0131, global_step=3091.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  24%|██▍       | 289/1208 [08:14<26:13,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.92e-5, train/loss_step=0.0131, global_step=3091.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  24%|██▍       | 289/1208 [08:14<26:13,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000459, train/loss_step=0.138, global_step=3092.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  24%|██▍       | 290/1208 [08:15<26:09,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000459, train/loss_step=0.138, global_step=3092.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  24%|██▍       | 290/1208 [08:15<26:09,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0465, train/loss_vlb_step=0.000163, train/loss_step=0.0465, global_step=3092.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  24%|██▍       | 291/1208 [08:16<26:05,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0465, train/loss_vlb_step=0.000163, train/loss_step=0.0465, global_step=3092.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  24%|██▍       | 291/1208 [08:16<26:05,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.24e-5, train/loss_step=0.00207, global_step=3092.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  24%|██▍       | 292/1208 [08:20<26:08,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.24e-5, train/loss_step=0.00207, global_step=3092.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  24%|██▍       | 292/1208 [08:20<26:08,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0828, train/loss_vlb_step=0.000274, train/loss_step=0.0828, global_step=3092.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  24%|██▍       | 293/1208 [08:21<26:04,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0828, train/loss_vlb_step=0.000274, train/loss_step=0.0828, global_step=3092.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  24%|██▍       | 293/1208 [08:21<26:04,  1.71s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.000101, train/loss_step=0.0249, global_step=3093.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  24%|██▍       | 294/1208 [08:22<26:01,  1.71s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.000101, train/loss_step=0.0249, global_step=3093.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  24%|██▍       | 294/1208 [08:22<26:01,  1.71s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0627, train/loss_vlb_step=0.000222, train/loss_step=0.0627, global_step=3093.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  24%|██▍       | 295/1208 [08:23<25:57,  1.71s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0627, train/loss_vlb_step=0.000222, train/loss_step=0.0627, global_step=3093.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  24%|██▍       | 295/1208 [08:23<25:57,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00212, train/loss_step=0.361, global_step=3093.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  25%|██▍       | 296/1208 [08:26<26:00,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00212, train/loss_step=0.361, global_step=3093.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  25%|██▍       | 296/1208 [08:26<26:00,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.00015, train/loss_step=0.042, global_step=3093.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  25%|██▍       | 297/1208 [08:27<25:56,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.00015, train/loss_step=0.042, global_step=3093.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  25%|██▍       | 297/1208 [08:27<25:56,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000992, train/loss_step=0.245, global_step=3094.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  25%|██▍       | 298/1208 [08:28<25:53,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000992, train/loss_step=0.245, global_step=3094.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  25%|██▍       | 298/1208 [08:28<25:53,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=0.000108, train/loss_step=0.0261, global_step=3094.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  25%|██▍       | 299/1208 [08:29<25:49,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=0.000108, train/loss_step=0.0261, global_step=3094.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  25%|██▍       | 299/1208 [08:29<25:49,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.09e-5, train/loss_step=0.00182, global_step=3094.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  25%|██▍       | 300/1208 [08:32<25:52,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.09e-5, train/loss_step=0.00182, global_step=3094.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  25%|██▍       | 300/1208 [08:32<25:52,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000493, train/loss_step=0.143, global_step=3094.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.76it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.74it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.74it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.83it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.78it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.78it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.76it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.80it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.75it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.75it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.79it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.75it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.80it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 10:  25%|██▍       | 301/1208 [09:03<27:18,  1.81s/it, loss=0.108, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000493, train/loss_step=0.143, global_step=3094.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  25%|██▍       | 301/1208 [09:03<27:18,  1.81s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=1.96e-5, train/loss_step=0.00363, global_step=3095.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  25%|██▌       | 302/1208 [09:04<27:14,  1.80s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=1.96e-5, train/loss_step=0.00363, global_step=3095.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  25%|██▌       | 302/1208 [09:04<27:14,  1.80s/it, loss=0.104, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.0028, train/loss_step=0.442, global_step=3095.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]      Epoch 10:  25%|██▌       | 303/1208 [09:05<27:10,  1.80s/it, loss=0.104, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.0028, train/loss_step=0.442, global_step=3095.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  25%|██▌       | 303/1208 [09:05<27:10,  1.80s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.39e-5, train/loss_step=0.00235, global_step=3095.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  25%|██▌       | 304/1208 [09:08<27:12,  1.81s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.39e-5, train/loss_step=0.00235, global_step=3095.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  25%|██▌       | 304/1208 [09:08<27:12,  1.81s/it, loss=0.113, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000636, train/loss_step=0.183, global_step=3095.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  25%|██▌       | 305/1208 [09:10<27:08,  1.80s/it, loss=0.113, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000636, train/loss_step=0.183, global_step=3095.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  25%|██▌       | 305/1208 [09:10<27:08,  1.80s/it, loss=0.114, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000441, train/loss_step=0.131, global_step=3096.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  25%|██▌       | 306/1208 [09:11<27:04,  1.80s/it, loss=0.114, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000441, train/loss_step=0.131, global_step=3096.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  25%|██▌       | 306/1208 [09:11<27:04,  1.80s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0989, train/loss_vlb_step=0.000325, train/loss_step=0.0989, global_step=3096.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  25%|██▌       | 307/1208 [09:12<27:00,  1.80s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0989, train/loss_vlb_step=0.000325, train/loss_step=0.0989, global_step=3096.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  25%|██▌       | 307/1208 [09:12<27:00,  1.80s/it, loss=0.134, v_num=0, train/loss_simple_step=0.631, train/loss_vlb_step=0.0298, train/loss_step=0.631, global_step=3096.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  25%|██▌       | 308/1208 [09:15<27:03,  1.80s/it, loss=0.134, v_num=0, train/loss_simple_step=0.631, train/loss_vlb_step=0.0298, train/loss_step=0.631, global_step=3096.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  25%|██▌       | 308/1208 [09:15<27:03,  1.80s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.87e-5, train/loss_step=0.0158, global_step=3096.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  26%|██▌       | 309/1208 [09:16<26:59,  1.80s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.87e-5, train/loss_step=0.0158, global_step=3096.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  26%|██▌       | 309/1208 [09:16<26:59,  1.80s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.73e-5, train/loss_step=0.0105, global_step=3097.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  26%|██▌       | 310/1208 [09:17<26:55,  1.80s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.73e-5, train/loss_step=0.0105, global_step=3097.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  26%|██▌       | 310/1208 [09:17<26:55,  1.80s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0991, train/loss_vlb_step=0.000329, train/loss_step=0.0991, global_step=3097.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  26%|██▌       | 311/1208 [09:18<26:51,  1.80s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0991, train/loss_vlb_step=0.000329, train/loss_step=0.0991, global_step=3097.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  26%|██▌       | 311/1208 [09:18<26:51,  1.80s/it, loss=0.136, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000391, train/loss_step=0.118, global_step=3097.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  26%|██▌       | 312/1208 [09:21<26:53,  1.80s/it, loss=0.136, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000391, train/loss_step=0.118, global_step=3097.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  26%|██▌       | 312/1208 [09:21<26:53,  1.80s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.000165, train/loss_step=0.0459, global_step=3097.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  26%|██▌       | 313/1208 [09:22<26:49,  1.80s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.000165, train/loss_step=0.0459, global_step=3097.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  26%|██▌       | 313/1208 [09:22<26:49,  1.80s/it, loss=0.149, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00197, train/loss_step=0.321, global_step=3098.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  26%|██▌       | 314/1208 [09:23<26:45,  1.80s/it, loss=0.149, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00197, train/loss_step=0.321, global_step=3098.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  26%|██▌       | 314/1208 [09:23<26:45,  1.80s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000134, train/loss_step=0.0365, global_step=3098.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  26%|██▌       | 315/1208 [09:25<26:41,  1.79s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000134, train/loss_step=0.0365, global_step=3098.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  26%|██▌       | 315/1208 [09:25<26:41,  1.79s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.91e-5, train/loss_step=0.0191, global_step=3098.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  26%|██▌       | 316/1208 [09:28<26:44,  1.80s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.91e-5, train/loss_step=0.0191, global_step=3098.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  26%|██▌       | 316/1208 [09:28<26:44,  1.80s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000165, train/loss_step=0.0448, global_step=3098.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  26%|██▌       | 317/1208 [09:29<26:40,  1.80s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000165, train/loss_step=0.0448, global_step=3098.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  26%|██▌       | 317/1208 [09:29<26:40,  1.80s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00477, train/loss_vlb_step=2.51e-5, train/loss_step=0.00477, global_step=3099.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  26%|██▋       | 318/1208 [09:30<26:36,  1.79s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00477, train/loss_vlb_step=2.51e-5, train/loss_step=0.00477, global_step=3099.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  26%|██▋       | 318/1208 [09:30<26:36,  1.79s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000117, train/loss_step=0.0304, global_step=3099.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  26%|██▋       | 319/1208 [09:31<26:32,  1.79s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000117, train/loss_step=0.0304, global_step=3099.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  26%|██▋       | 319/1208 [09:31<26:32,  1.79s/it, loss=0.131, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000908, train/loss_step=0.241, global_step=3099.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  26%|██▋       | 320/1208 [09:34<26:35,  1.80s/it, loss=0.131, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000908, train/loss_step=0.241, global_step=3099.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  26%|██▋       | 320/1208 [09:34<26:35,  1.80s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.59e-5, train/loss_step=0.0231, global_step=3099.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  27%|██▋       | 321/1208 [09:35<26:31,  1.79s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.59e-5, train/loss_step=0.0231, global_step=3099.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  27%|██▋       | 321/1208 [09:35<26:31,  1.79s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0771, train/loss_vlb_step=0.000258, train/loss_step=0.0771, global_step=3100.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  27%|██▋       | 322/1208 [09:36<26:27,  1.79s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0771, train/loss_vlb_step=0.000258, train/loss_step=0.0771, global_step=3100.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  27%|██▋       | 322/1208 [09:36<26:27,  1.79s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00741, train/loss_vlb_step=3.58e-5, train/loss_step=0.00741, global_step=3100.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  27%|██▋       | 323/1208 [09:37<26:23,  1.79s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00741, train/loss_vlb_step=3.58e-5, train/loss_step=0.00741, global_step=3100.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  27%|██▋       | 323/1208 [09:37<26:23,  1.79s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=7.37e-5, train/loss_step=0.0162, global_step=3100.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  27%|██▋       | 324/1208 [09:41<26:25,  1.79s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=7.37e-5, train/loss_step=0.0162, global_step=3100.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  27%|██▋       | 324/1208 [09:41<26:25,  1.79s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0757, train/loss_vlb_step=0.000257, train/loss_step=0.0757, global_step=3100.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  27%|██▋       | 325/1208 [09:42<26:22,  1.79s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0757, train/loss_vlb_step=0.000257, train/loss_step=0.0757, global_step=3100.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  27%|██▋       | 325/1208 [09:42<26:22,  1.79s/it, loss=0.104, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000538, train/loss_step=0.157, global_step=3101.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  27%|██▋       | 326/1208 [09:43<26:18,  1.79s/it, loss=0.104, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000538, train/loss_step=0.157, global_step=3101.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  27%|██▋       | 326/1208 [09:43<26:18,  1.79s/it, loss=0.113, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00122, train/loss_step=0.279, global_step=3101.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  27%|██▋       | 327/1208 [09:44<26:14,  1.79s/it, loss=0.113, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00122, train/loss_step=0.279, global_step=3101.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  27%|██▋       | 327/1208 [09:44<26:14,  1.79s/it, loss=0.0844, v_num=0, train/loss_simple_step=0.066, train/loss_vlb_step=0.000229, train/loss_step=0.066, global_step=3101.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  27%|██▋       | 328/1208 [09:47<26:16,  1.79s/it, loss=0.0844, v_num=0, train/loss_simple_step=0.066, train/loss_vlb_step=0.000229, train/loss_step=0.066, global_step=3101.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  27%|██▋       | 328/1208 [09:47<26:16,  1.79s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.67e-5, train/loss_step=0.0122, global_step=3101.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  27%|██▋       | 329/1208 [09:48<26:12,  1.79s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.67e-5, train/loss_step=0.0122, global_step=3101.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  27%|██▋       | 329/1208 [09:48<26:12,  1.79s/it, loss=0.118, v_num=0, train/loss_simple_step=0.690, train/loss_vlb_step=0.0277, train/loss_step=0.690, global_step=3102.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  27%|██▋       | 330/1208 [09:49<26:09,  1.79s/it, loss=0.118, v_num=0, train/loss_simple_step=0.690, train/loss_vlb_step=0.0277, train/loss_step=0.690, global_step=3102.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  27%|██▋       | 330/1208 [09:49<26:09,  1.79s/it, loss=0.125, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.00124, train/loss_step=0.226, global_step=3102.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  27%|██▋       | 331/1208 [09:50<26:05,  1.78s/it, loss=0.125, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.00124, train/loss_step=0.226, global_step=3102.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  27%|██▋       | 331/1208 [09:50<26:05,  1.78s/it, loss=0.124, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000363, train/loss_step=0.110, global_step=3102.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  27%|██▋       | 332/1208 [09:54<26:07,  1.79s/it, loss=0.124, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000363, train/loss_step=0.110, global_step=3102.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  27%|██▋       | 332/1208 [09:54<26:07,  1.79s/it, loss=0.147, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00612, train/loss_step=0.499, global_step=3102.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  28%|██▊       | 333/1208 [09:55<26:03,  1.79s/it, loss=0.147, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00612, train/loss_step=0.499, global_step=3102.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  28%|██▊       | 333/1208 [09:55<26:03,  1.79s/it, loss=0.138, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000506, train/loss_step=0.153, global_step=3103.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  28%|██▊       | 334/1208 [09:56<25:59,  1.78s/it, loss=0.138, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000506, train/loss_step=0.153, global_step=3103.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  28%|██▊       | 334/1208 [09:56<25:59,  1.78s/it, loss=0.137, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.24e-5, train/loss_step=0.017, global_step=3103.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  28%|██▊       | 335/1208 [09:57<25:56,  1.78s/it, loss=0.137, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.24e-5, train/loss_step=0.017, global_step=3103.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  28%|██▊       | 335/1208 [09:57<25:56,  1.78s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0737, train/loss_vlb_step=0.000247, train/loss_step=0.0737, global_step=3103.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  28%|██▊       | 336/1208 [10:00<25:58,  1.79s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0737, train/loss_vlb_step=0.000247, train/loss_step=0.0737, global_step=3103.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  28%|██▊       | 336/1208 [10:00<25:58,  1.79s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=8.06e-5, train/loss_step=0.0176, global_step=3103.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  28%|██▊       | 337/1208 [10:01<25:54,  1.78s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=8.06e-5, train/loss_step=0.0176, global_step=3103.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  28%|██▊       | 337/1208 [10:01<25:54,  1.78s/it, loss=0.149, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000855, train/loss_step=0.213, global_step=3104.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  28%|██▊       | 338/1208 [10:02<25:50,  1.78s/it, loss=0.149, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000855, train/loss_step=0.213, global_step=3104.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  28%|██▊       | 338/1208 [10:02<25:50,  1.78s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00618, train/loss_vlb_step=3.21e-5, train/loss_step=0.00618, global_step=3104.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  28%|██▊       | 339/1208 [10:03<25:47,  1.78s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00618, train/loss_vlb_step=3.21e-5, train/loss_step=0.00618, global_step=3104.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  28%|██▊       | 339/1208 [10:03<25:47,  1.78s/it, loss=0.148, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.000984, train/loss_step=0.251, global_step=3104.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  28%|██▊       | 340/1208 [10:06<25:49,  1.78s/it, loss=0.148, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.000984, train/loss_step=0.251, global_step=3104.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  28%|██▊       | 340/1208 [10:06<25:49,  1.78s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000106, train/loss_step=0.0278, global_step=3104.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  28%|██▊       | 341/1208 [10:07<25:45,  1.78s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000106, train/loss_step=0.0278, global_step=3104.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  28%|██▊       | 341/1208 [10:07<25:45,  1.78s/it, loss=0.146, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000106, train/loss_step=0.026, global_step=3105.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  28%|██▊       | 342/1208 [10:08<25:41,  1.78s/it, loss=0.146, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000106, train/loss_step=0.026, global_step=3105.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  28%|██▊       | 342/1208 [10:08<25:41,  1.78s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.2e-5, train/loss_step=0.00198, global_step=3105.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  28%|██▊       | 343/1208 [10:09<25:38,  1.78s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.2e-5, train/loss_step=0.00198, global_step=3105.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  28%|██▊       | 343/1208 [10:09<25:38,  1.78s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0632, train/loss_vlb_step=0.000213, train/loss_step=0.0632, global_step=3105.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  28%|██▊       | 344/1208 [10:13<25:40,  1.78s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0632, train/loss_vlb_step=0.000213, train/loss_step=0.0632, global_step=3105.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  28%|██▊       | 344/1208 [10:13<25:40,  1.78s/it, loss=0.157, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00104, train/loss_step=0.255, global_step=3105.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  29%|██▊       | 345/1208 [10:14<25:36,  1.78s/it, loss=0.157, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00104, train/loss_step=0.255, global_step=3105.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  29%|██▊       | 345/1208 [10:14<25:36,  1.78s/it, loss=0.157, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000536, train/loss_step=0.160, global_step=3106.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  29%|██▊       | 346/1208 [10:15<25:33,  1.78s/it, loss=0.157, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000536, train/loss_step=0.160, global_step=3106.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  29%|██▊       | 346/1208 [10:15<25:33,  1.78s/it, loss=0.16, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00207, train/loss_step=0.324, global_step=3106.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  29%|██▊       | 347/1208 [10:16<25:29,  1.78s/it, loss=0.16, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00207, train/loss_step=0.324, global_step=3106.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  29%|██▊       | 347/1208 [10:16<25:29,  1.78s/it, loss=0.198, v_num=0, train/loss_simple_step=0.842, train/loss_vlb_step=0.142, train/loss_step=0.842, global_step=3106.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  29%|██▉       | 348/1208 [10:19<25:31,  1.78s/it, loss=0.198, v_num=0, train/loss_simple_step=0.842, train/loss_vlb_step=0.142, train/loss_step=0.842, global_step=3106.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  29%|██▉       | 348/1208 [10:19<25:31,  1.78s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0933, train/loss_vlb_step=0.000312, train/loss_step=0.0933, global_step=3106.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  29%|██▉       | 349/1208 [10:20<25:27,  1.78s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0933, train/loss_vlb_step=0.000312, train/loss_step=0.0933, global_step=3106.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  29%|██▉       | 349/1208 [10:20<25:27,  1.78s/it, loss=0.18, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000929, train/loss_step=0.232, global_step=3107.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  29%|██▉       | 350/1208 [10:21<25:24,  1.78s/it, loss=0.18, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000929, train/loss_step=0.232, global_step=3107.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  29%|██▉       | 350/1208 [10:21<25:24,  1.78s/it, loss=0.177, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000618, train/loss_step=0.176, global_step=3107.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  29%|██▉       | 351/1208 [10:22<25:20,  1.77s/it, loss=0.177, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000618, train/loss_step=0.176, global_step=3107.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  29%|██▉       | 351/1208 [10:22<25:20,  1.77s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.24e-5, train/loss_step=0.0148, global_step=3107.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  29%|██▉       | 352/1208 [10:26<25:22,  1.78s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.24e-5, train/loss_step=0.0148, global_step=3107.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  29%|██▉       | 352/1208 [10:26<25:22,  1.78s/it, loss=0.171, v_num=0, train/loss_simple_step=0.467, train/loss_vlb_step=0.00368, train/loss_step=0.467, global_step=3107.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  29%|██▉       | 353/1208 [10:27<25:18,  1.78s/it, loss=0.171, v_num=0, train/loss_simple_step=0.467, train/loss_vlb_step=0.00368, train/loss_step=0.467, global_step=3107.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  29%|██▉       | 353/1208 [10:27<25:18,  1.78s/it, loss=0.171, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000527, train/loss_step=0.155, global_step=3108.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  29%|██▉       | 354/1208 [10:28<25:15,  1.77s/it, loss=0.171, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000527, train/loss_step=0.155, global_step=3108.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  29%|██▉       | 354/1208 [10:28<25:15,  1.77s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000294, train/loss_step=0.0891, global_step=3108.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  29%|██▉       | 355/1208 [10:29<25:11,  1.77s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000294, train/loss_step=0.0891, global_step=3108.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  29%|██▉       | 355/1208 [10:29<25:11,  1.77s/it, loss=0.18, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000706, train/loss_step=0.188, global_step=3108.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  29%|██▉       | 356/1208 [10:32<25:13,  1.78s/it, loss=0.18, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000706, train/loss_step=0.188, global_step=3108.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  29%|██▉       | 356/1208 [10:32<25:13,  1.78s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0573, train/loss_vlb_step=0.000201, train/loss_step=0.0573, global_step=3108.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  30%|██▉       | 357/1208 [10:33<25:10,  1.77s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0573, train/loss_vlb_step=0.000201, train/loss_step=0.0573, global_step=3108.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  30%|██▉       | 357/1208 [10:33<25:10,  1.77s/it, loss=0.177, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=3109.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  30%|██▉       | 358/1208 [10:34<25:06,  1.77s/it, loss=0.177, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=3109.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  30%|██▉       | 358/1208 [10:34<25:06,  1.77s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.51e-5, train/loss_step=0.00255, global_step=3109.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  30%|██▉       | 359/1208 [10:35<25:03,  1.77s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.51e-5, train/loss_step=0.00255, global_step=3109.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  30%|██▉       | 359/1208 [10:35<25:03,  1.77s/it, loss=0.169, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000365, train/loss_step=0.110, global_step=3109.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  30%|██▉       | 360/1208 [10:38<25:04,  1.77s/it, loss=0.169, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000365, train/loss_step=0.110, global_step=3109.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  30%|██▉       | 360/1208 [10:38<25:04,  1.77s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.68e-5, train/loss_step=0.0213, global_step=3109.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  30%|██▉       | 361/1208 [10:39<25:01,  1.77s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.68e-5, train/loss_step=0.0213, global_step=3109.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  30%|██▉       | 361/1208 [10:39<25:01,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00978, train/loss_vlb_step=4.61e-5, train/loss_step=0.00978, global_step=3110.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  30%|██▉       | 362/1208 [10:40<24:57,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00978, train/loss_vlb_step=4.61e-5, train/loss_step=0.00978, global_step=3110.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  30%|██▉       | 362/1208 [10:40<24:57,  1.77s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.61e-5, train/loss_step=0.0151, global_step=3110.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  30%|███       | 363/1208 [10:42<24:54,  1.77s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.61e-5, train/loss_step=0.0151, global_step=3110.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  30%|███       | 363/1208 [10:42<24:54,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0486, train/loss_vlb_step=0.000175, train/loss_step=0.0486, global_step=3110.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  30%|███       | 364/1208 [10:45<24:56,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0486, train/loss_vlb_step=0.000175, train/loss_step=0.0486, global_step=3110.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  30%|███       | 364/1208 [10:45<24:56,  1.77s/it, loss=0.161, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000371, train/loss_step=0.113, global_step=3110.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  30%|███       | 365/1208 [10:46<24:52,  1.77s/it, loss=0.161, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000371, train/loss_step=0.113, global_step=3110.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  30%|███       | 365/1208 [10:46<24:52,  1.77s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=5.85e-5, train/loss_step=0.0147, global_step=3111.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  30%|███       | 366/1208 [10:47<24:49,  1.77s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=5.85e-5, train/loss_step=0.0147, global_step=3111.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  30%|███       | 366/1208 [10:47<24:49,  1.77s/it, loss=0.15, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00103, train/loss_step=0.248, global_step=3111.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  30%|███       | 367/1208 [10:48<24:45,  1.77s/it, loss=0.15, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00103, train/loss_step=0.248, global_step=3111.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  30%|███       | 367/1208 [10:48<24:45,  1.77s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.02e-5, train/loss_step=0.0167, global_step=3111.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  30%|███       | 368/1208 [10:51<24:47,  1.77s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.02e-5, train/loss_step=0.0167, global_step=3111.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  30%|███       | 368/1208 [10:51<24:47,  1.77s/it, loss=0.106, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.000129, train/loss_step=0.034, global_step=3111.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  31%|███       | 369/1208 [10:52<24:44,  1.77s/it, loss=0.106, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.000129, train/loss_step=0.034, global_step=3111.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  31%|███       | 369/1208 [10:52<24:44,  1.77s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.79e-5, train/loss_step=0.0132, global_step=3112.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  31%|███       | 370/1208 [10:53<24:40,  1.77s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.79e-5, train/loss_step=0.0132, global_step=3112.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  31%|███       | 370/1208 [10:53<24:40,  1.77s/it, loss=0.0863, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=2.19e-5, train/loss_step=0.00416, global_step=3112.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  31%|███       | 371/1208 [10:54<24:37,  1.77s/it, loss=0.0863, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=2.19e-5, train/loss_step=0.00416, global_step=3112.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  31%|███       | 371/1208 [10:54<24:37,  1.77s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.0879, train/loss_vlb_step=0.000293, train/loss_step=0.0879, global_step=3112.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  31%|███       | 372/1208 [10:58<24:39,  1.77s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.0879, train/loss_vlb_step=0.000293, train/loss_step=0.0879, global_step=3112.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  31%|███       | 372/1208 [10:58<24:39,  1.77s/it, loss=0.0777, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000919, train/loss_step=0.223, global_step=3112.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  31%|███       | 373/1208 [10:59<24:35,  1.77s/it, loss=0.0777, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000919, train/loss_step=0.223, global_step=3112.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  31%|███       | 373/1208 [10:59<24:35,  1.77s/it, loss=0.0831, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00121, train/loss_step=0.262, global_step=3113.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  31%|███       | 374/1208 [11:00<24:32,  1.77s/it, loss=0.0831, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00121, train/loss_step=0.262, global_step=3113.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  31%|███       | 374/1208 [11:00<24:32,  1.77s/it, loss=0.085, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000417, train/loss_step=0.127, global_step=3113.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  31%|███       | 375/1208 [11:01<24:28,  1.76s/it, loss=0.085, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000417, train/loss_step=0.127, global_step=3113.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  31%|███       | 375/1208 [11:01<24:28,  1.76s/it, loss=0.0759, v_num=0, train/loss_simple_step=0.00612, train/loss_vlb_step=2.93e-5, train/loss_step=0.00612, global_step=3113.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  31%|███       | 376/1208 [11:04<24:30,  1.77s/it, loss=0.0759, v_num=0, train/loss_simple_step=0.00612, train/loss_vlb_step=2.93e-5, train/loss_step=0.00612, global_step=3113.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  31%|███       | 376/1208 [11:04<24:30,  1.77s/it, loss=0.0802, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000472, train/loss_step=0.142, global_step=3113.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  31%|███       | 377/1208 [11:05<24:27,  1.77s/it, loss=0.0802, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000472, train/loss_step=0.142, global_step=3113.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  31%|███       | 377/1208 [11:05<24:27,  1.77s/it, loss=0.0761, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=8.9e-5, train/loss_step=0.0217, global_step=3114.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  31%|███▏      | 378/1208 [11:06<24:23,  1.76s/it, loss=0.0761, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=8.9e-5, train/loss_step=0.0217, global_step=3114.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  31%|███▏      | 378/1208 [11:06<24:23,  1.76s/it, loss=0.0798, v_num=0, train/loss_simple_step=0.0772, train/loss_vlb_step=0.000259, train/loss_step=0.0772, global_step=3114.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  31%|███▏      | 379/1208 [11:07<24:20,  1.76s/it, loss=0.0798, v_num=0, train/loss_simple_step=0.0772, train/loss_vlb_step=0.000259, train/loss_step=0.0772, global_step=3114.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  31%|███▏      | 379/1208 [11:07<24:20,  1.76s/it, loss=0.0789, v_num=0, train/loss_simple_step=0.092, train/loss_vlb_step=0.000308, train/loss_step=0.092, global_step=3114.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  31%|███▏      | 380/1208 [11:11<24:22,  1.77s/it, loss=0.0789, v_num=0, train/loss_simple_step=0.092, train/loss_vlb_step=0.000308, train/loss_step=0.092, global_step=3114.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  31%|███▏      | 380/1208 [11:11<24:22,  1.77s/it, loss=0.0789, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=9.23e-5, train/loss_step=0.022, global_step=3114.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  32%|███▏      | 381/1208 [11:12<24:19,  1.76s/it, loss=0.0789, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=9.23e-5, train/loss_step=0.022, global_step=3114.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  32%|███▏      | 381/1208 [11:12<24:19,  1.76s/it, loss=0.0786, v_num=0, train/loss_simple_step=0.00348, train/loss_vlb_step=1.82e-5, train/loss_step=0.00348, global_step=3115.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  32%|███▏      | 382/1208 [11:13<24:15,  1.76s/it, loss=0.0786, v_num=0, train/loss_simple_step=0.00348, train/loss_vlb_step=1.82e-5, train/loss_step=0.00348, global_step=3115.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  32%|███▏      | 382/1208 [11:13<24:15,  1.76s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00191, train/loss_step=0.350, global_step=3115.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  32%|███▏      | 383/1208 [11:14<24:12,  1.76s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00191, train/loss_step=0.350, global_step=3115.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  32%|███▏      | 383/1208 [11:14<24:12,  1.76s/it, loss=0.101, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000507, train/loss_step=0.152, global_step=3115.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  32%|███▏      | 384/1208 [11:17<24:13,  1.76s/it, loss=0.101, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000507, train/loss_step=0.152, global_step=3115.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  32%|███▏      | 384/1208 [11:17<24:13,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00245, train/loss_step=0.364, global_step=3115.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  32%|███▏      | 385/1208 [11:18<24:10,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00245, train/loss_step=0.364, global_step=3115.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  32%|███▏      | 385/1208 [11:18<24:10,  1.76s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.000269, train/loss_step=0.0817, global_step=3116.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  32%|███▏      | 386/1208 [11:19<24:07,  1.76s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.000269, train/loss_step=0.0817, global_step=3116.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  32%|███▏      | 386/1208 [11:19<24:07,  1.76s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0411, train/loss_vlb_step=0.000152, train/loss_step=0.0411, global_step=3116.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  32%|███▏      | 387/1208 [11:20<24:03,  1.76s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0411, train/loss_vlb_step=0.000152, train/loss_step=0.0411, global_step=3116.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  32%|███▏      | 387/1208 [11:20<24:03,  1.76s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.49e-5, train/loss_step=0.0122, global_step=3116.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  32%|███▏      | 388/1208 [11:23<24:05,  1.76s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.49e-5, train/loss_step=0.0122, global_step=3116.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  32%|███▏      | 388/1208 [11:23<24:05,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000582, train/loss_step=0.160, global_step=3116.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  32%|███▏      | 389/1208 [11:24<24:02,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000582, train/loss_step=0.160, global_step=3116.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  32%|███▏      | 389/1208 [11:24<24:02,  1.76s/it, loss=0.117, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000376, train/loss_step=0.114, global_step=3117.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  32%|███▏      | 390/1208 [11:26<23:58,  1.76s/it, loss=0.117, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000376, train/loss_step=0.114, global_step=3117.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  32%|███▏      | 390/1208 [11:26<23:58,  1.76s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000107, train/loss_step=0.0272, global_step=3117.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  32%|███▏      | 391/1208 [11:27<23:55,  1.76s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000107, train/loss_step=0.0272, global_step=3117.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  32%|███▏      | 391/1208 [11:27<23:55,  1.76s/it, loss=0.12, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000384, train/loss_step=0.117, global_step=3117.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  32%|███▏      | 392/1208 [11:30<23:56,  1.76s/it, loss=0.12, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000384, train/loss_step=0.117, global_step=3117.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  32%|███▏      | 392/1208 [11:30<23:56,  1.76s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000154, train/loss_step=0.0416, global_step=3117.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  33%|███▎      | 393/1208 [11:31<23:53,  1.76s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000154, train/loss_step=0.0416, global_step=3117.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  33%|███▎      | 393/1208 [11:31<23:53,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00176, train/loss_step=0.306, global_step=3118.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  33%|███▎      | 394/1208 [11:32<23:50,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00176, train/loss_step=0.306, global_step=3118.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  33%|███▎      | 394/1208 [11:32<23:50,  1.76s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.31e-5, train/loss_step=0.0167, global_step=3118.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  33%|███▎      | 395/1208 [11:33<23:47,  1.76s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.31e-5, train/loss_step=0.0167, global_step=3118.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  33%|███▎      | 395/1208 [11:33<23:47,  1.76s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=5.02e-5, train/loss_step=0.0105, global_step=3118.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  33%|███▎      | 396/1208 [11:36<23:48,  1.76s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=5.02e-5, train/loss_step=0.0105, global_step=3118.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  33%|███▎      | 396/1208 [11:36<23:48,  1.76s/it, loss=0.104, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.000213, train/loss_step=0.062, global_step=3118.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  33%|███▎      | 397/1208 [11:37<23:45,  1.76s/it, loss=0.104, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.000213, train/loss_step=0.062, global_step=3118.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  33%|███▎      | 397/1208 [11:37<23:45,  1.76s/it, loss=0.121, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00254, train/loss_step=0.377, global_step=3119.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  33%|███▎      | 398/1208 [11:38<23:42,  1.76s/it, loss=0.121, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00254, train/loss_step=0.377, global_step=3119.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  33%|███▎      | 398/1208 [11:38<23:42,  1.76s/it, loss=0.125, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000479, train/loss_step=0.144, global_step=3119.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  33%|███▎      | 399/1208 [11:39<23:38,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000479, train/loss_step=0.144, global_step=3119.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  33%|███▎      | 399/1208 [11:39<23:38,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0391, train/loss_vlb_step=0.000145, train/loss_step=0.0391, global_step=3119.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  33%|███▎      | 400/1208 [11:43<23:40,  1.76s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0391, train/loss_vlb_step=0.000145, train/loss_step=0.0391, global_step=3119.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  33%|███▎      | 400/1208 [11:43<23:40,  1.76s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00237, train/loss_vlb_step=1.37e-5, train/loss_step=0.00237, global_step=3119.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  33%|███▎      | 401/1208 [11:44<23:37,  1.76s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00237, train/loss_vlb_step=1.37e-5, train/loss_step=0.00237, global_step=3119.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  33%|███▎      | 401/1208 [11:44<23:37,  1.76s/it, loss=0.127, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000424, train/loss_step=0.129, global_step=3120.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  33%|███▎      | 402/1208 [11:45<23:33,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000424, train/loss_step=0.129, global_step=3120.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  33%|███▎      | 402/1208 [11:45<23:33,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.09e-5, train/loss_step=0.0197, global_step=3120.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  33%|███▎      | 403/1208 [11:46<23:30,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.09e-5, train/loss_step=0.0197, global_step=3120.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  33%|███▎      | 403/1208 [11:46<23:30,  1.75s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.1e-5, train/loss_step=0.0137, global_step=3120.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  33%|███▎      | 404/1208 [11:49<23:31,  1.76s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.1e-5, train/loss_step=0.0137, global_step=3120.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  33%|███▎      | 404/1208 [11:49<23:31,  1.76s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000384, train/loss_step=0.115, global_step=3120.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  34%|███▎      | 405/1208 [11:50<23:28,  1.75s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000384, train/loss_step=0.115, global_step=3120.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  34%|███▎      | 405/1208 [11:50<23:28,  1.75s/it, loss=0.101, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00115, train/loss_step=0.278, global_step=3121.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  34%|███▎      | 406/1208 [11:51<23:25,  1.75s/it, loss=0.101, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00115, train/loss_step=0.278, global_step=3121.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  34%|███▎      | 406/1208 [11:51<23:25,  1.75s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.08e-5, train/loss_step=0.0117, global_step=3121.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  34%|███▎      | 407/1208 [11:52<23:22,  1.75s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.08e-5, train/loss_step=0.0117, global_step=3121.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  34%|███▎      | 407/1208 [11:52<23:22,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00243, train/loss_step=0.388, global_step=3121.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  34%|███▍      | 408/1208 [11:55<23:23,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00243, train/loss_step=0.388, global_step=3121.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  34%|███▍      | 408/1208 [11:55<23:23,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0864, train/loss_vlb_step=0.000285, train/loss_step=0.0864, global_step=3121.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  34%|███▍      | 409/1208 [11:56<23:20,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0864, train/loss_vlb_step=0.000285, train/loss_step=0.0864, global_step=3121.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  34%|███▍      | 409/1208 [11:56<23:20,  1.75s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=5.02e-5, train/loss_step=0.0103, global_step=3122.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  34%|███▍      | 410/1208 [11:57<23:17,  1.75s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=5.02e-5, train/loss_step=0.0103, global_step=3122.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  34%|███▍      | 410/1208 [11:57<23:17,  1.75s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000117, train/loss_step=0.0304, global_step=3122.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  34%|███▍      | 411/1208 [11:58<23:14,  1.75s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000117, train/loss_step=0.0304, global_step=3122.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  34%|███▍      | 411/1208 [11:58<23:14,  1.75s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0324, train/loss_vlb_step=0.000128, train/loss_step=0.0324, global_step=3122.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  34%|███▍      | 412/1208 [12:02<23:15,  1.75s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0324, train/loss_vlb_step=0.000128, train/loss_step=0.0324, global_step=3122.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  34%|███▍      | 412/1208 [12:02<23:15,  1.75s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.000109, train/loss_step=0.0276, global_step=3122.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  34%|███▍      | 413/1208 [12:03<23:12,  1.75s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.000109, train/loss_step=0.0276, global_step=3122.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  34%|███▍      | 413/1208 [12:03<23:12,  1.75s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.88e-5, train/loss_step=0.0156, global_step=3123.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  34%|███▍      | 414/1208 [12:04<23:09,  1.75s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.88e-5, train/loss_step=0.0156, global_step=3123.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  34%|███▍      | 414/1208 [12:04<23:09,  1.75s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000691, train/loss_step=0.197, global_step=3123.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  34%|███▍      | 415/1208 [12:05<23:06,  1.75s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000691, train/loss_step=0.197, global_step=3123.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  34%|███▍      | 415/1208 [12:05<23:06,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.544, train/loss_vlb_step=0.00668, train/loss_step=0.544, global_step=3123.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  34%|███▍      | 416/1208 [12:08<23:07,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.544, train/loss_vlb_step=0.00668, train/loss_step=0.544, global_step=3123.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  34%|███▍      | 416/1208 [12:08<23:07,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0506, train/loss_vlb_step=0.00018, train/loss_step=0.0506, global_step=3123.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  35%|███▍      | 417/1208 [12:09<23:04,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0506, train/loss_vlb_step=0.00018, train/loss_step=0.0506, global_step=3123.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  35%|███▍      | 417/1208 [12:09<23:04,  1.75s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000116, train/loss_step=0.0302, global_step=3124.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  35%|███▍      | 418/1208 [12:10<23:01,  1.75s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000116, train/loss_step=0.0302, global_step=3124.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  35%|███▍      | 418/1208 [12:10<23:01,  1.75s/it, loss=0.114, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.0011, train/loss_step=0.260, global_step=3124.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  35%|███▍      | 419/1208 [12:11<22:58,  1.75s/it, loss=0.114, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.0011, train/loss_step=0.260, global_step=3124.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  35%|███▍      | 419/1208 [12:11<22:58,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000489, train/loss_step=0.147, global_step=3124.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  35%|███▍      | 420/1208 [12:15<22:59,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000489, train/loss_step=0.147, global_step=3124.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  35%|███▍      | 420/1208 [12:15<22:59,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=8.94e-5, train/loss_step=0.0226, global_step=3124.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  35%|███▍      | 421/1208 [12:16<22:56,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=8.94e-5, train/loss_step=0.0226, global_step=3124.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  35%|███▍      | 421/1208 [12:16<22:56,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.14e-5, train/loss_step=0.0111, global_step=3125.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  35%|███▍      | 422/1208 [12:17<22:53,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.14e-5, train/loss_step=0.0111, global_step=3125.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  35%|███▍      | 422/1208 [12:17<22:53,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.95e-5, train/loss_step=0.0243, global_step=3125.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  35%|███▌      | 423/1208 [12:18<22:49,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.95e-5, train/loss_step=0.0243, global_step=3125.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  35%|███▌      | 423/1208 [12:18<22:50,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0648, train/loss_vlb_step=0.000224, train/loss_step=0.0648, global_step=3125.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  35%|███▌      | 424/1208 [12:21<22:50,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0648, train/loss_vlb_step=0.000224, train/loss_step=0.0648, global_step=3125.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  35%|███▌      | 424/1208 [12:21<22:50,  1.75s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0464, train/loss_vlb_step=0.00017, train/loss_step=0.0464, global_step=3125.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  35%|███▌      | 425/1208 [12:22<22:47,  1.75s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0464, train/loss_vlb_step=0.00017, train/loss_step=0.0464, global_step=3125.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  35%|███▌      | 425/1208 [12:22<22:47,  1.75s/it, loss=0.108, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000569, train/loss_step=0.167, global_step=3126.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  35%|███▌      | 426/1208 [12:23<22:44,  1.75s/it, loss=0.108, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000569, train/loss_step=0.167, global_step=3126.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  35%|███▌      | 426/1208 [12:23<22:44,  1.75s/it, loss=0.114, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000402, train/loss_step=0.119, global_step=3126.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  35%|███▌      | 427/1208 [12:24<22:41,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000402, train/loss_step=0.119, global_step=3126.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  35%|███▌      | 427/1208 [12:24<22:41,  1.74s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0442, train/loss_vlb_step=0.000151, train/loss_step=0.0442, global_step=3126.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  35%|███▌      | 428/1208 [12:27<22:42,  1.75s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0442, train/loss_vlb_step=0.000151, train/loss_step=0.0442, global_step=3126.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  35%|███▌      | 428/1208 [12:27<22:42,  1.75s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.00283, train/loss_vlb_step=1.64e-5, train/loss_step=0.00283, global_step=3126.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  36%|███▌      | 429/1208 [12:28<22:39,  1.75s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.00283, train/loss_vlb_step=1.64e-5, train/loss_step=0.00283, global_step=3126.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  36%|███▌      | 429/1208 [12:28<22:39,  1.75s/it, loss=0.102, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000688, train/loss_step=0.200, global_step=3127.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  36%|███▌      | 430/1208 [12:29<22:36,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000688, train/loss_step=0.200, global_step=3127.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  36%|███▌      | 430/1208 [12:29<22:36,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0979, train/loss_vlb_step=0.000322, train/loss_step=0.0979, global_step=3127.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  36%|███▌      | 431/1208 [12:30<22:33,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0979, train/loss_vlb_step=0.000322, train/loss_step=0.0979, global_step=3127.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  36%|███▌      | 431/1208 [12:30<22:33,  1.74s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.24e-5, train/loss_step=0.00211, global_step=3127.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  36%|███▌      | 432/1208 [12:34<22:34,  1.75s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.24e-5, train/loss_step=0.00211, global_step=3127.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  36%|███▌      | 432/1208 [12:34<22:34,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00181, train/loss_step=0.289, global_step=3127.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  36%|███▌      | 433/1208 [12:35<22:31,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00181, train/loss_step=0.289, global_step=3127.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  36%|███▌      | 433/1208 [12:35<22:31,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0442, train/loss_vlb_step=0.000162, train/loss_step=0.0442, global_step=3128.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  36%|███▌      | 434/1208 [12:36<22:28,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0442, train/loss_vlb_step=0.000162, train/loss_step=0.0442, global_step=3128.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  36%|███▌      | 434/1208 [12:36<22:28,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=8.21e-5, train/loss_step=0.019, global_step=3128.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  36%|███▌      | 435/1208 [12:37<22:25,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=8.21e-5, train/loss_step=0.019, global_step=3128.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  36%|███▌      | 435/1208 [12:37<22:25,  1.74s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000934, train/loss_step=0.228, global_step=3128.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  36%|███▌      | 436/1208 [12:40<22:26,  1.74s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000934, train/loss_step=0.228, global_step=3128.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  36%|███▌      | 436/1208 [12:40<22:26,  1.74s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.0961, train/loss_vlb_step=0.000316, train/loss_step=0.0961, global_step=3128.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  36%|███▌      | 437/1208 [12:41<22:23,  1.74s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.0961, train/loss_vlb_step=0.000316, train/loss_step=0.0961, global_step=3128.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  36%|███▌      | 437/1208 [12:41<22:23,  1.74s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0338, train/loss_vlb_step=0.000133, train/loss_step=0.0338, global_step=3129.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  36%|███▋      | 438/1208 [12:42<22:20,  1.74s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0338, train/loss_vlb_step=0.000133, train/loss_step=0.0338, global_step=3129.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  36%|███▋      | 438/1208 [12:42<22:20,  1.74s/it, loss=0.0895, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000436, train/loss_step=0.132, global_step=3129.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  36%|███▋      | 439/1208 [12:43<22:17,  1.74s/it, loss=0.0895, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000436, train/loss_step=0.132, global_step=3129.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  36%|███▋      | 439/1208 [12:43<22:17,  1.74s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000397, train/loss_step=0.119, global_step=3129.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  36%|███▋      | 440/1208 [12:47<22:18,  1.74s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000397, train/loss_step=0.119, global_step=3129.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  36%|███▋      | 440/1208 [12:47<22:18,  1.74s/it, loss=0.088, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.13e-5, train/loss_step=0.0199, global_step=3129.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  37%|███▋      | 441/1208 [12:48<22:15,  1.74s/it, loss=0.088, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.13e-5, train/loss_step=0.0199, global_step=3129.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  37%|███▋      | 441/1208 [12:48<22:15,  1.74s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000808, train/loss_step=0.222, global_step=3130.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  37%|███▋      | 442/1208 [12:49<22:12,  1.74s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000808, train/loss_step=0.222, global_step=3130.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  37%|███▋      | 442/1208 [12:49<22:12,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000334, train/loss_step=0.102, global_step=3130.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  37%|███▋      | 443/1208 [12:50<22:10,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000334, train/loss_step=0.102, global_step=3130.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  37%|███▋      | 443/1208 [12:50<22:10,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000896, train/loss_step=0.233, global_step=3130.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  37%|███▋      | 444/1208 [12:53<22:10,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000896, train/loss_step=0.233, global_step=3130.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  37%|███▋      | 444/1208 [12:53<22:10,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0686, train/loss_vlb_step=0.000233, train/loss_step=0.0686, global_step=3130.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  37%|███▋      | 445/1208 [12:54<22:08,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0686, train/loss_vlb_step=0.000233, train/loss_step=0.0686, global_step=3130.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  37%|███▋      | 445/1208 [12:54<22:08,  1.74s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.91e-5, train/loss_step=0.0159, global_step=3131.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  37%|███▋      | 446/1208 [12:55<22:05,  1.74s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.91e-5, train/loss_step=0.0159, global_step=3131.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  37%|███▋      | 446/1208 [12:55<22:05,  1.74s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.00664, train/loss_vlb_step=3.4e-5, train/loss_step=0.00664, global_step=3131.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  37%|███▋      | 447/1208 [12:56<22:02,  1.74s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.00664, train/loss_vlb_step=3.4e-5, train/loss_step=0.00664, global_step=3131.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  37%|███▋      | 447/1208 [12:56<22:02,  1.74s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=1.93e-5, train/loss_step=0.00325, global_step=3131.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  37%|███▋      | 448/1208 [12:59<22:02,  1.74s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=1.93e-5, train/loss_step=0.00325, global_step=3131.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  37%|███▋      | 448/1208 [12:59<22:02,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000978, train/loss_step=0.239, global_step=3131.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  37%|███▋      | 449/1208 [13:00<22:00,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000978, train/loss_step=0.239, global_step=3131.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  37%|███▋      | 449/1208 [13:00<22:00,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.0019, train/loss_step=0.291, global_step=3132.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  37%|███▋      | 450/1208 [13:01<21:57,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.0019, train/loss_step=0.291, global_step=3132.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  37%|███▋      | 450/1208 [13:01<21:57,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00142, train/loss_step=0.303, global_step=3132.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  37%|███▋      | 451/1208 [13:02<21:54,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00142, train/loss_step=0.303, global_step=3132.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  37%|███▋      | 451/1208 [13:02<21:54,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00808, train/loss_vlb_step=3.92e-5, train/loss_step=0.00808, global_step=3132.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  37%|███▋      | 452/1208 [13:06<21:55,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00808, train/loss_vlb_step=3.92e-5, train/loss_step=0.00808, global_step=3132.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  37%|███▋      | 452/1208 [13:06<21:55,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00177, train/loss_step=0.316, global_step=3132.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  38%|███▊      | 453/1208 [13:07<21:52,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00177, train/loss_step=0.316, global_step=3132.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  38%|███▊      | 453/1208 [13:07<21:52,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000575, train/loss_step=0.166, global_step=3133.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  38%|███▊      | 454/1208 [13:08<21:49,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000575, train/loss_step=0.166, global_step=3133.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  38%|███▊      | 454/1208 [13:08<21:49,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=6.07e-5, train/loss_step=0.013, global_step=3133.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  38%|███▊      | 455/1208 [13:09<21:46,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=6.07e-5, train/loss_step=0.013, global_step=3133.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  38%|███▊      | 455/1208 [13:09<21:46,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000644, train/loss_step=0.185, global_step=3133.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  38%|███▊      | 456/1208 [13:12<21:47,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000644, train/loss_step=0.185, global_step=3133.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  38%|███▊      | 456/1208 [13:12<21:47,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000513, train/loss_step=0.154, global_step=3133.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  38%|███▊      | 457/1208 [13:13<21:44,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000513, train/loss_step=0.154, global_step=3133.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  38%|███▊      | 457/1208 [13:13<21:44,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0762, train/loss_vlb_step=0.000259, train/loss_step=0.0762, global_step=3134.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  38%|███▊      | 458/1208 [13:14<21:41,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0762, train/loss_vlb_step=0.000259, train/loss_step=0.0762, global_step=3134.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  38%|███▊      | 458/1208 [13:14<21:41,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.049, train/loss_vlb_step=0.000172, train/loss_step=0.049, global_step=3134.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  38%|███▊      | 459/1208 [13:15<21:38,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.049, train/loss_vlb_step=0.000172, train/loss_step=0.049, global_step=3134.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  38%|███▊      | 459/1208 [13:15<21:38,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000501, train/loss_step=0.150, global_step=3134.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  38%|███▊      | 460/1208 [13:19<21:39,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000501, train/loss_step=0.150, global_step=3134.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  38%|███▊      | 460/1208 [13:19<21:39,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000937, train/loss_step=0.231, global_step=3134.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  38%|███▊      | 461/1208 [13:20<21:36,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000937, train/loss_step=0.231, global_step=3134.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  38%|███▊      | 461/1208 [13:20<21:36,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.642, train/loss_vlb_step=0.047, train/loss_step=0.642, global_step=3135.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  38%|███▊      | 462/1208 [13:21<21:33,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.642, train/loss_vlb_step=0.047, train/loss_step=0.642, global_step=3135.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  38%|███▊      | 462/1208 [13:21<21:33,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000133, train/loss_step=0.0358, global_step=3135.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  38%|███▊      | 463/1208 [13:22<21:30,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000133, train/loss_step=0.0358, global_step=3135.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  38%|███▊      | 463/1208 [13:22<21:30,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.69e-5, train/loss_step=0.0157, global_step=3135.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  38%|███▊      | 464/1208 [13:25<21:31,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.69e-5, train/loss_step=0.0157, global_step=3135.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  38%|███▊      | 464/1208 [13:25<21:31,  1.74s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000142, train/loss_step=0.0369, global_step=3135.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  38%|███▊      | 465/1208 [13:26<21:28,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000142, train/loss_step=0.0369, global_step=3135.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  38%|███▊      | 465/1208 [13:26<21:28,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.531, train/loss_vlb_step=0.00544, train/loss_step=0.531, global_step=3136.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  39%|███▊      | 466/1208 [13:27<21:25,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.531, train/loss_vlb_step=0.00544, train/loss_step=0.531, global_step=3136.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  39%|███▊      | 466/1208 [13:27<21:25,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0519, train/loss_vlb_step=0.000184, train/loss_step=0.0519, global_step=3136.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  39%|███▊      | 467/1208 [13:28<21:22,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0519, train/loss_vlb_step=0.000184, train/loss_step=0.0519, global_step=3136.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  39%|███▊      | 467/1208 [13:28<21:22,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0691, train/loss_vlb_step=0.000234, train/loss_step=0.0691, global_step=3136.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  39%|███▊      | 468/1208 [13:31<21:23,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0691, train/loss_vlb_step=0.000234, train/loss_step=0.0691, global_step=3136.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  39%|███▊      | 468/1208 [13:31<21:23,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00948, train/loss_vlb_step=4.41e-5, train/loss_step=0.00948, global_step=3136.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  39%|███▉      | 469/1208 [13:32<21:20,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00948, train/loss_vlb_step=4.41e-5, train/loss_step=0.00948, global_step=3136.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  39%|███▉      | 469/1208 [13:32<21:20,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=9e-5, train/loss_step=0.0218, global_step=3137.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 10:  39%|███▉      | 470/1208 [13:33<21:17,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=9e-5, train/loss_step=0.0218, global_step=3137.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  39%|███▉      | 470/1208 [13:33<21:18,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0898, train/loss_vlb_step=0.000298, train/loss_step=0.0898, global_step=3137.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  39%|███▉      | 471/1208 [13:34<21:15,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0898, train/loss_vlb_step=0.000298, train/loss_step=0.0898, global_step=3137.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  39%|███▉      | 471/1208 [13:34<21:15,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.00015, train/loss_step=0.0393, global_step=3137.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  39%|███▉      | 472/1208 [13:38<21:15,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.00015, train/loss_step=0.0393, global_step=3137.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  39%|███▉      | 472/1208 [13:38<21:15,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=8.18e-5, train/loss_step=0.0185, global_step=3137.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  39%|███▉      | 473/1208 [13:39<21:13,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=8.18e-5, train/loss_step=0.0185, global_step=3137.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  39%|███▉      | 473/1208 [13:39<21:13,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000544, train/loss_step=0.161, global_step=3138.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  39%|███▉      | 474/1208 [13:40<21:10,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000544, train/loss_step=0.161, global_step=3138.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  39%|███▉      | 474/1208 [13:40<21:10,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0491, train/loss_vlb_step=0.000171, train/loss_step=0.0491, global_step=3138.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  39%|███▉      | 475/1208 [13:41<21:07,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0491, train/loss_vlb_step=0.000171, train/loss_step=0.0491, global_step=3138.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  39%|███▉      | 475/1208 [13:41<21:07,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.72e-5, train/loss_step=0.00299, global_step=3138.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  39%|███▉      | 476/1208 [13:44<21:08,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.72e-5, train/loss_step=0.00299, global_step=3138.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  39%|███▉      | 476/1208 [13:44<21:08,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000756, train/loss_step=0.214, global_step=3138.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  39%|███▉      | 477/1208 [13:45<21:05,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000756, train/loss_step=0.214, global_step=3138.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  39%|███▉      | 477/1208 [13:45<21:05,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.87e-5, train/loss_step=0.0156, global_step=3139.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  40%|███▉      | 478/1208 [13:46<21:02,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.87e-5, train/loss_step=0.0156, global_step=3139.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  40%|███▉      | 478/1208 [13:46<21:02,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00955, train/loss_vlb_step=4.48e-5, train/loss_step=0.00955, global_step=3139.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  40%|███▉      | 479/1208 [13:47<20:59,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00955, train/loss_vlb_step=4.48e-5, train/loss_step=0.00955, global_step=3139.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  40%|███▉      | 479/1208 [13:47<20:59,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0829, train/loss_vlb_step=0.000277, train/loss_step=0.0829, global_step=3139.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  40%|███▉      | 480/1208 [13:50<21:00,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0829, train/loss_vlb_step=0.000277, train/loss_step=0.0829, global_step=3139.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  40%|███▉      | 480/1208 [13:50<21:00,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.416, train/loss_vlb_step=0.00273, train/loss_step=0.416, global_step=3139.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  40%|███▉      | 481/1208 [13:52<20:57,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.416, train/loss_vlb_step=0.00273, train/loss_step=0.416, global_step=3139.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  40%|███▉      | 481/1208 [13:52<20:57,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.00081, train/loss_step=0.198, global_step=3140.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  40%|███▉      | 482/1208 [13:53<20:54,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.00081, train/loss_step=0.198, global_step=3140.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  40%|███▉      | 482/1208 [13:53<20:54,  1.73s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0636, train/loss_vlb_step=0.000221, train/loss_step=0.0636, global_step=3140.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  40%|███▉      | 483/1208 [13:54<20:52,  1.73s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0636, train/loss_vlb_step=0.000221, train/loss_step=0.0636, global_step=3140.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  40%|███▉      | 483/1208 [13:54<20:52,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000333, train/loss_step=0.101, global_step=3140.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  40%|████      | 484/1208 [13:57<20:52,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000333, train/loss_step=0.101, global_step=3140.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  40%|████      | 484/1208 [13:57<20:52,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0808, train/loss_vlb_step=0.000266, train/loss_step=0.0808, global_step=3140.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  40%|████      | 485/1208 [13:58<20:49,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0808, train/loss_vlb_step=0.000266, train/loss_step=0.0808, global_step=3140.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  40%|████      | 485/1208 [13:58<20:49,  1.73s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.0608, train/loss_vlb_step=0.000211, train/loss_step=0.0608, global_step=3141.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  40%|████      | 486/1208 [13:59<20:47,  1.73s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.0608, train/loss_vlb_step=0.000211, train/loss_step=0.0608, global_step=3141.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  40%|████      | 486/1208 [13:59<20:47,  1.73s/it, loss=0.0858, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.69e-5, train/loss_step=0.0132, global_step=3141.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  40%|████      | 487/1208 [14:00<20:44,  1.73s/it, loss=0.0858, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.69e-5, train/loss_step=0.0132, global_step=3141.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  40%|████      | 487/1208 [14:00<20:44,  1.73s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00198, train/loss_step=0.305, global_step=3141.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  40%|████      | 488/1208 [14:03<20:44,  1.73s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00198, train/loss_step=0.305, global_step=3141.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  40%|████      | 488/1208 [14:03<20:44,  1.73s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.000145, train/loss_step=0.041, global_step=3141.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  40%|████      | 489/1208 [14:04<20:42,  1.73s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.000145, train/loss_step=0.041, global_step=3141.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  40%|████      | 489/1208 [14:04<20:42,  1.73s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.41e-5, train/loss_step=0.0166, global_step=3142.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  41%|████      | 490/1208 [14:05<20:39,  1.73s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.41e-5, train/loss_step=0.0166, global_step=3142.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  41%|████      | 490/1208 [14:05<20:39,  1.73s/it, loss=0.098, v_num=0, train/loss_simple_step=0.0706, train/loss_vlb_step=0.000237, train/loss_step=0.0706, global_step=3142.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  41%|████      | 491/1208 [14:06<20:36,  1.72s/it, loss=0.098, v_num=0, train/loss_simple_step=0.0706, train/loss_vlb_step=0.000237, train/loss_step=0.0706, global_step=3142.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  41%|████      | 491/1208 [14:06<20:36,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00167, train/loss_step=0.322, global_step=3142.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  41%|████      | 492/1208 [14:10<20:37,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00167, train/loss_step=0.322, global_step=3142.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  41%|████      | 492/1208 [14:10<20:37,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000525, train/loss_step=0.155, global_step=3142.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  41%|████      | 493/1208 [14:11<20:34,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000525, train/loss_step=0.155, global_step=3142.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  41%|████      | 493/1208 [14:11<20:34,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0997, train/loss_vlb_step=0.000329, train/loss_step=0.0997, global_step=3143.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  41%|████      | 494/1208 [14:12<20:31,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0997, train/loss_vlb_step=0.000329, train/loss_step=0.0997, global_step=3143.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  41%|████      | 494/1208 [14:12<20:31,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000775, train/loss_step=0.196, global_step=3143.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  41%|████      | 495/1208 [14:13<20:29,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000775, train/loss_step=0.196, global_step=3143.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  41%|████      | 495/1208 [14:13<20:29,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000614, train/loss_step=0.180, global_step=3143.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  41%|████      | 496/1208 [14:16<20:29,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000614, train/loss_step=0.180, global_step=3143.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  41%|████      | 496/1208 [14:16<20:29,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=9.89e-6, train/loss_step=0.00165, global_step=3143.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  41%|████      | 497/1208 [14:17<20:27,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=9.89e-6, train/loss_step=0.00165, global_step=3143.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  41%|████      | 497/1208 [14:17<20:27,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00454, train/loss_vlb_step=2.43e-5, train/loss_step=0.00454, global_step=3144.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  41%|████      | 498/1208 [14:18<20:24,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00454, train/loss_vlb_step=2.43e-5, train/loss_step=0.00454, global_step=3144.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  41%|████      | 498/1208 [14:18<20:24,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.599, train/loss_vlb_step=0.00811, train/loss_step=0.599, global_step=3144.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 10:  41%|████▏     | 499/1208 [14:19<20:21,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.599, train/loss_vlb_step=0.00811, train/loss_step=0.599, global_step=3144.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  41%|████▏     | 499/1208 [14:19<20:21,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00628, train/loss_vlb_step=3.19e-5, train/loss_step=0.00628, global_step=3144.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  41%|████▏     | 500/1208 [14:23<20:22,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00628, train/loss_vlb_step=3.19e-5, train/loss_step=0.00628, global_step=3144.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  41%|████▏     | 500/1208 [14:23<20:22,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00197, train/loss_step=0.336, global_step=3144.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  41%|████▏     | 501/1208 [14:24<20:19,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00197, train/loss_step=0.336, global_step=3144.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  41%|████▏     | 501/1208 [14:24<20:19,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00191, train/loss_step=0.323, global_step=3145.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  42%|████▏     | 502/1208 [14:25<20:16,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00191, train/loss_step=0.323, global_step=3145.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  42%|████▏     | 502/1208 [14:25<20:16,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000141, train/loss_step=0.0381, global_step=3145.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  42%|████▏     | 503/1208 [14:26<20:14,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000141, train/loss_step=0.0381, global_step=3145.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  42%|████▏     | 503/1208 [14:26<20:14,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.17e-5, train/loss_step=0.00202, global_step=3145.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  42%|████▏     | 504/1208 [14:29<20:14,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.17e-5, train/loss_step=0.00202, global_step=3145.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  42%|████▏     | 504/1208 [14:29<20:14,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=2.47e-5, train/loss_step=0.00464, global_step=3145.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  42%|████▏     | 505/1208 [14:30<20:11,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=2.47e-5, train/loss_step=0.00464, global_step=3145.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  42%|████▏     | 505/1208 [14:30<20:11,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00103, train/loss_step=0.251, global_step=3146.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  42%|████▏     | 506/1208 [14:31<20:09,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00103, train/loss_step=0.251, global_step=3146.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  42%|████▏     | 506/1208 [14:31<20:09,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.00381, train/loss_step=0.382, global_step=3146.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  42%|████▏     | 507/1208 [14:32<20:06,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.00381, train/loss_step=0.382, global_step=3146.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  42%|████▏     | 507/1208 [14:32<20:06,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=3146.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  42%|████▏     | 508/1208 [14:35<20:06,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=3146.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  42%|████▏     | 508/1208 [14:35<20:06,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.93e-5, train/loss_step=0.0164, global_step=3146.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  42%|████▏     | 509/1208 [14:36<20:04,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.93e-5, train/loss_step=0.0164, global_step=3146.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  42%|████▏     | 509/1208 [14:36<20:04,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.52e-5, train/loss_step=0.0154, global_step=3147.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  42%|████▏     | 510/1208 [14:38<20:01,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.52e-5, train/loss_step=0.0154, global_step=3147.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  42%|████▏     | 510/1208 [14:38<20:01,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0886, train/loss_vlb_step=0.000295, train/loss_step=0.0886, global_step=3147.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  42%|████▏     | 511/1208 [14:39<19:58,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0886, train/loss_vlb_step=0.000295, train/loss_step=0.0886, global_step=3147.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  42%|████▏     | 511/1208 [14:39<19:58,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.0019, train/loss_step=0.314, global_step=3147.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  42%|████▏     | 512/1208 [14:42<19:59,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.0019, train/loss_step=0.314, global_step=3147.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  42%|████▏     | 512/1208 [14:42<19:59,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=3147.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  42%|████▏     | 513/1208 [14:43<19:56,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=3147.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  42%|████▏     | 513/1208 [14:43<19:56,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000598, train/loss_step=0.169, global_step=3148.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  43%|████▎     | 514/1208 [14:44<19:54,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000598, train/loss_step=0.169, global_step=3148.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  43%|████▎     | 514/1208 [14:44<19:54,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00159, train/loss_step=0.296, global_step=3148.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  43%|████▎     | 515/1208 [14:45<19:51,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00159, train/loss_step=0.296, global_step=3148.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  43%|████▎     | 515/1208 [14:45<19:51,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.92e-5, train/loss_step=0.00342, global_step=3148.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  43%|████▎     | 516/1208 [14:48<19:51,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.92e-5, train/loss_step=0.00342, global_step=3148.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  43%|████▎     | 516/1208 [14:48<19:51,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=7.28e-5, train/loss_step=0.0161, global_step=3148.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  43%|████▎     | 517/1208 [14:49<19:49,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=7.28e-5, train/loss_step=0.0161, global_step=3148.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  43%|████▎     | 517/1208 [14:49<19:49,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.92e-5, train/loss_step=0.0127, global_step=3149.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  43%|████▎     | 518/1208 [14:50<19:46,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.92e-5, train/loss_step=0.0127, global_step=3149.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  43%|████▎     | 518/1208 [14:50<19:46,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00902, train/loss_vlb_step=4.38e-5, train/loss_step=0.00902, global_step=3149.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  43%|████▎     | 519/1208 [14:51<19:44,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00902, train/loss_vlb_step=4.38e-5, train/loss_step=0.00902, global_step=3149.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  43%|████▎     | 519/1208 [14:51<19:44,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00156, train/loss_step=0.326, global_step=3149.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  43%|████▎     | 520/1208 [14:55<19:44,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00156, train/loss_step=0.326, global_step=3149.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  43%|████▎     | 520/1208 [14:55<19:44,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0626, train/loss_vlb_step=0.000216, train/loss_step=0.0626, global_step=3149.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  43%|████▎     | 521/1208 [14:56<19:41,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0626, train/loss_vlb_step=0.000216, train/loss_step=0.0626, global_step=3149.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  43%|████▎     | 521/1208 [14:56<19:41,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.00044, train/loss_step=0.132, global_step=3150.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  43%|████▎     | 522/1208 [14:57<19:39,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.00044, train/loss_step=0.132, global_step=3150.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  43%|████▎     | 522/1208 [14:57<19:39,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00152, train/loss_step=0.316, global_step=3150.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  43%|████▎     | 523/1208 [14:58<19:36,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00152, train/loss_step=0.316, global_step=3150.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  43%|████▎     | 523/1208 [14:58<19:36,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000547, train/loss_step=0.157, global_step=3150.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  43%|████▎     | 524/1208 [15:01<19:36,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000547, train/loss_step=0.157, global_step=3150.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  43%|████▎     | 524/1208 [15:01<19:36,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.000119, train/loss_step=0.0313, global_step=3150.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  43%|████▎     | 525/1208 [15:02<19:34,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.000119, train/loss_step=0.0313, global_step=3150.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  43%|████▎     | 525/1208 [15:02<19:34,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000351, train/loss_step=0.106, global_step=3151.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  44%|████▎     | 526/1208 [15:03<19:31,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000351, train/loss_step=0.106, global_step=3151.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  44%|████▎     | 526/1208 [15:03<19:31,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0684, train/loss_vlb_step=0.000234, train/loss_step=0.0684, global_step=3151.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  44%|████▎     | 527/1208 [15:04<19:29,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0684, train/loss_vlb_step=0.000234, train/loss_step=0.0684, global_step=3151.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  44%|████▎     | 527/1208 [15:04<19:29,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0424, train/loss_vlb_step=0.000159, train/loss_step=0.0424, global_step=3151.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  44%|████▎     | 528/1208 [15:07<19:29,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0424, train/loss_vlb_step=0.000159, train/loss_step=0.0424, global_step=3151.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  44%|████▎     | 528/1208 [15:07<19:29,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.000142, train/loss_step=0.0403, global_step=3151.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  44%|████▍     | 529/1208 [15:08<19:26,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.000142, train/loss_step=0.0403, global_step=3151.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  44%|████▍     | 529/1208 [15:08<19:26,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00429, train/loss_vlb_step=2.35e-5, train/loss_step=0.00429, global_step=3152.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  44%|████▍     | 530/1208 [15:10<19:24,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00429, train/loss_vlb_step=2.35e-5, train/loss_step=0.00429, global_step=3152.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  44%|████▍     | 530/1208 [15:10<19:24,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0384, train/loss_vlb_step=0.000149, train/loss_step=0.0384, global_step=3152.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  44%|████▍     | 531/1208 [15:11<19:21,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0384, train/loss_vlb_step=0.000149, train/loss_step=0.0384, global_step=3152.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  44%|████▍     | 531/1208 [15:11<19:21,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000338, train/loss_step=0.103, global_step=3152.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  44%|████▍     | 532/1208 [15:14<19:21,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000338, train/loss_step=0.103, global_step=3152.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  44%|████▍     | 532/1208 [15:14<19:21,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0703, train/loss_vlb_step=0.000238, train/loss_step=0.0703, global_step=3152.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  44%|████▍     | 533/1208 [15:15<19:19,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0703, train/loss_vlb_step=0.000238, train/loss_step=0.0703, global_step=3152.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  44%|████▍     | 533/1208 [15:15<19:19,  1.72s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=1.96e-5, train/loss_step=0.00362, global_step=3153.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  44%|████▍     | 534/1208 [15:16<19:16,  1.72s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=1.96e-5, train/loss_step=0.00362, global_step=3153.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  44%|████▍     | 534/1208 [15:16<19:16,  1.72s/it, loss=0.0795, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000185, train/loss_step=0.0478, global_step=3153.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  44%|████▍     | 535/1208 [15:17<19:14,  1.71s/it, loss=0.0795, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000185, train/loss_step=0.0478, global_step=3153.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  44%|████▍     | 535/1208 [15:17<19:14,  1.71s/it, loss=0.0795, v_num=0, train/loss_simple_step=0.00493, train/loss_vlb_step=2.71e-5, train/loss_step=0.00493, global_step=3153.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  44%|████▍     | 536/1208 [15:20<19:14,  1.72s/it, loss=0.0795, v_num=0, train/loss_simple_step=0.00493, train/loss_vlb_step=2.71e-5, train/loss_step=0.00493, global_step=3153.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  44%|████▍     | 536/1208 [15:20<19:14,  1.72s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00116, train/loss_step=0.273, global_step=3153.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  44%|████▍     | 537/1208 [15:21<19:11,  1.72s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00116, train/loss_step=0.273, global_step=3153.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  44%|████▍     | 537/1208 [15:21<19:11,  1.72s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.0534, train/loss_vlb_step=0.000188, train/loss_step=0.0534, global_step=3154.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  45%|████▍     | 538/1208 [15:22<19:09,  1.72s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.0534, train/loss_vlb_step=0.000188, train/loss_step=0.0534, global_step=3154.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  45%|████▍     | 538/1208 [15:22<19:09,  1.72s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=3154.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  45%|████▍     | 539/1208 [15:23<19:06,  1.71s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=3154.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  45%|████▍     | 539/1208 [15:23<19:06,  1.71s/it, loss=0.0878, v_num=0, train/loss_simple_step=0.0992, train/loss_vlb_step=0.000326, train/loss_step=0.0992, global_step=3154.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  45%|████▍     | 540/1208 [15:27<19:06,  1.72s/it, loss=0.0878, v_num=0, train/loss_simple_step=0.0992, train/loss_vlb_step=0.000326, train/loss_step=0.0992, global_step=3154.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  45%|████▍     | 540/1208 [15:27<19:06,  1.72s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.00036, train/loss_step=0.110, global_step=3154.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  45%|████▍     | 541/1208 [15:28<19:04,  1.72s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.00036, train/loss_step=0.110, global_step=3154.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  45%|████▍     | 541/1208 [15:28<19:04,  1.72s/it, loss=0.0893, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000384, train/loss_step=0.115, global_step=3155.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  45%|████▍     | 542/1208 [15:29<19:01,  1.71s/it, loss=0.0893, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000384, train/loss_step=0.115, global_step=3155.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  45%|████▍     | 542/1208 [15:29<19:01,  1.71s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.0022, train/loss_step=0.344, global_step=3155.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  45%|████▍     | 543/1208 [15:30<18:59,  1.71s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.0022, train/loss_step=0.344, global_step=3155.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  45%|████▍     | 543/1208 [15:30<18:59,  1.71s/it, loss=0.085, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000154, train/loss_step=0.0415, global_step=3155.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  45%|████▌     | 544/1208 [15:33<18:59,  1.72s/it, loss=0.085, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000154, train/loss_step=0.0415, global_step=3155.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  45%|████▌     | 544/1208 [15:33<18:59,  1.72s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.43e-5, train/loss_step=0.00241, global_step=3155.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  45%|████▌     | 545/1208 [15:34<18:56,  1.71s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.43e-5, train/loss_step=0.00241, global_step=3155.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  45%|████▌     | 545/1208 [15:34<18:56,  1.71s/it, loss=0.0786, v_num=0, train/loss_simple_step=0.0067, train/loss_vlb_step=3.46e-5, train/loss_step=0.0067, global_step=3156.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  45%|████▌     | 546/1208 [15:35<18:54,  1.71s/it, loss=0.0786, v_num=0, train/loss_simple_step=0.0067, train/loss_vlb_step=3.46e-5, train/loss_step=0.0067, global_step=3156.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  45%|████▌     | 546/1208 [15:35<18:54,  1.71s/it, loss=0.0763, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.2e-5, train/loss_step=0.0227, global_step=3156.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  45%|████▌     | 547/1208 [15:36<18:51,  1.71s/it, loss=0.0763, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.2e-5, train/loss_step=0.0227, global_step=3156.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  45%|████▌     | 547/1208 [15:36<18:51,  1.71s/it, loss=0.0757, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000113, train/loss_step=0.0296, global_step=3156.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  45%|████▌     | 548/1208 [15:39<18:52,  1.72s/it, loss=0.0757, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000113, train/loss_step=0.0296, global_step=3156.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  45%|████▌     | 548/1208 [15:39<18:52,  1.72s/it, loss=0.081, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000487, train/loss_step=0.147, global_step=3156.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  45%|████▌     | 549/1208 [15:41<18:49,  1.71s/it, loss=0.081, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000487, train/loss_step=0.147, global_step=3156.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  45%|████▌     | 549/1208 [15:41<18:49,  1.71s/it, loss=0.083, v_num=0, train/loss_simple_step=0.0451, train/loss_vlb_step=0.000171, train/loss_step=0.0451, global_step=3157.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  46%|████▌     | 550/1208 [15:42<18:47,  1.71s/it, loss=0.083, v_num=0, train/loss_simple_step=0.0451, train/loss_vlb_step=0.000171, train/loss_step=0.0451, global_step=3157.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  46%|████▌     | 550/1208 [15:42<18:47,  1.71s/it, loss=0.0893, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000566, train/loss_step=0.163, global_step=3157.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  46%|████▌     | 551/1208 [15:43<18:44,  1.71s/it, loss=0.0893, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000566, train/loss_step=0.163, global_step=3157.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  46%|████▌     | 551/1208 [15:43<18:44,  1.71s/it, loss=0.0844, v_num=0, train/loss_simple_step=0.00628, train/loss_vlb_step=3.15e-5, train/loss_step=0.00628, global_step=3157.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  46%|████▌     | 552/1208 [15:46<18:44,  1.71s/it, loss=0.0844, v_num=0, train/loss_simple_step=0.00628, train/loss_vlb_step=3.15e-5, train/loss_step=0.00628, global_step=3157.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  46%|████▌     | 552/1208 [15:46<18:44,  1.71s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000724, train/loss_step=0.207, global_step=3157.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  46%|████▌     | 553/1208 [15:47<18:42,  1.71s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000724, train/loss_step=0.207, global_step=3157.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  46%|████▌     | 553/1208 [15:47<18:42,  1.71s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.28e-5, train/loss_step=0.0199, global_step=3158.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  46%|████▌     | 554/1208 [15:48<18:39,  1.71s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.28e-5, train/loss_step=0.0199, global_step=3158.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  46%|████▌     | 554/1208 [15:48<18:39,  1.71s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.00989, train/loss_vlb_step=4.58e-5, train/loss_step=0.00989, global_step=3158.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  46%|████▌     | 555/1208 [15:49<18:37,  1.71s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.00989, train/loss_vlb_step=4.58e-5, train/loss_step=0.00989, global_step=3158.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  46%|████▌     | 555/1208 [15:49<18:37,  1.71s/it, loss=0.09, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=1.01e-5, train/loss_step=0.00168, global_step=3158.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  46%|████▌     | 556/1208 [15:52<18:37,  1.71s/it, loss=0.09, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=1.01e-5, train/loss_step=0.00168, global_step=3158.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  46%|████▌     | 556/1208 [15:52<18:37,  1.71s/it, loss=0.0765, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=1.02e-5, train/loss_step=0.00168, global_step=3158.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  46%|████▌     | 557/1208 [15:53<18:34,  1.71s/it, loss=0.0765, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=1.02e-5, train/loss_step=0.00168, global_step=3158.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  46%|████▌     | 557/1208 [15:53<18:34,  1.71s/it, loss=0.0745, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.45e-5, train/loss_step=0.0136, global_step=3159.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  46%|████▌     | 558/1208 [15:54<18:32,  1.71s/it, loss=0.0745, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.45e-5, train/loss_step=0.0136, global_step=3159.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  46%|████▌     | 558/1208 [15:54<18:32,  1.71s/it, loss=0.0713, v_num=0, train/loss_simple_step=0.040, train/loss_vlb_step=0.000144, train/loss_step=0.040, global_step=3159.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  46%|████▋     | 559/1208 [15:55<18:29,  1.71s/it, loss=0.0713, v_num=0, train/loss_simple_step=0.040, train/loss_vlb_step=0.000144, train/loss_step=0.040, global_step=3159.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  46%|████▋     | 559/1208 [15:55<18:29,  1.71s/it, loss=0.0872, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00367, train/loss_step=0.418, global_step=3159.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  46%|████▋     | 560/1208 [15:59<18:29,  1.71s/it, loss=0.0872, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00367, train/loss_step=0.418, global_step=3159.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  46%|████▋     | 560/1208 [15:59<18:29,  1.71s/it, loss=0.0819, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1.35e-5, train/loss_step=0.00226, global_step=3159.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  46%|████▋     | 561/1208 [16:00<18:27,  1.71s/it, loss=0.0819, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1.35e-5, train/loss_step=0.00226, global_step=3159.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  46%|████▋     | 561/1208 [16:00<18:27,  1.71s/it, loss=0.0769, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.5e-5, train/loss_step=0.0148, global_step=3160.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  47%|████▋     | 562/1208 [16:01<18:24,  1.71s/it, loss=0.0769, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.5e-5, train/loss_step=0.0148, global_step=3160.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  47%|████▋     | 562/1208 [16:01<18:24,  1.71s/it, loss=0.0605, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.23e-5, train/loss_step=0.0166, global_step=3160.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  47%|████▋     | 563/1208 [16:02<18:22,  1.71s/it, loss=0.0605, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.23e-5, train/loss_step=0.0166, global_step=3160.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  47%|████▋     | 563/1208 [16:02<18:22,  1.71s/it, loss=0.0588, v_num=0, train/loss_simple_step=0.00745, train/loss_vlb_step=3.69e-5, train/loss_step=0.00745, global_step=3160.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  47%|████▋     | 564/1208 [16:05<18:22,  1.71s/it, loss=0.0588, v_num=0, train/loss_simple_step=0.00745, train/loss_vlb_step=3.69e-5, train/loss_step=0.00745, global_step=3160.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  47%|████▋     | 564/1208 [16:05<18:22,  1.71s/it, loss=0.0629, v_num=0, train/loss_simple_step=0.0852, train/loss_vlb_step=0.000284, train/loss_step=0.0852, global_step=3160.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  47%|████▋     | 565/1208 [16:06<18:20,  1.71s/it, loss=0.0629, v_num=0, train/loss_simple_step=0.0852, train/loss_vlb_step=0.000284, train/loss_step=0.0852, global_step=3160.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  47%|████▋     | 565/1208 [16:06<18:20,  1.71s/it, loss=0.0748, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.000969, train/loss_step=0.243, global_step=3161.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  47%|████▋     | 566/1208 [16:07<18:17,  1.71s/it, loss=0.0748, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.000969, train/loss_step=0.243, global_step=3161.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  47%|████▋     | 566/1208 [16:07<18:17,  1.71s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000844, train/loss_step=0.223, global_step=3161.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  47%|████▋     | 567/1208 [16:08<18:15,  1.71s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000844, train/loss_step=0.223, global_step=3161.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  47%|████▋     | 567/1208 [16:08<18:15,  1.71s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000115, train/loss_step=0.0297, global_step=3161.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  47%|████▋     | 568/1208 [16:12<18:15,  1.71s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000115, train/loss_step=0.0297, global_step=3161.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  47%|████▋     | 568/1208 [16:12<18:15,  1.71s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.0017, train/loss_step=0.339, global_step=3161.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  47%|████▋     | 569/1208 [16:13<18:12,  1.71s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.0017, train/loss_step=0.339, global_step=3161.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  47%|████▋     | 569/1208 [16:13<18:12,  1.71s/it, loss=0.111, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00217, train/loss_step=0.377, global_step=3162.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  47%|████▋     | 570/1208 [16:14<18:10,  1.71s/it, loss=0.111, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00217, train/loss_step=0.377, global_step=3162.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  47%|████▋     | 570/1208 [16:14<18:10,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00262, train/loss_step=0.383, global_step=3162.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  47%|████▋     | 571/1208 [16:15<18:07,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00262, train/loss_step=0.383, global_step=3162.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  47%|████▋     | 571/1208 [16:15<18:07,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.39e-5, train/loss_step=0.0149, global_step=3162.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  47%|████▋     | 572/1208 [16:18<18:07,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.39e-5, train/loss_step=0.0149, global_step=3162.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  47%|████▋     | 572/1208 [16:18<18:07,  1.71s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00317, train/loss_vlb_step=1.77e-5, train/loss_step=0.00317, global_step=3162.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  47%|████▋     | 573/1208 [16:19<18:05,  1.71s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00317, train/loss_vlb_step=1.77e-5, train/loss_step=0.00317, global_step=3162.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  47%|████▋     | 573/1208 [16:19<18:05,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00207, train/loss_step=0.346, global_step=3163.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  48%|████▊     | 574/1208 [16:20<18:03,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00207, train/loss_step=0.346, global_step=3163.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  48%|████▊     | 574/1208 [16:20<18:03,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000752, train/loss_step=0.216, global_step=3163.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  48%|████▊     | 575/1208 [16:21<18:00,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000752, train/loss_step=0.216, global_step=3163.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  48%|████▊     | 575/1208 [16:21<18:00,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0799, train/loss_vlb_step=0.000266, train/loss_step=0.0799, global_step=3163.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  48%|████▊     | 576/1208 [16:24<18:00,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0799, train/loss_vlb_step=0.000266, train/loss_step=0.0799, global_step=3163.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  48%|████▊     | 576/1208 [16:24<18:00,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00093, train/loss_step=0.247, global_step=3163.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  48%|████▊     | 577/1208 [16:25<17:58,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00093, train/loss_step=0.247, global_step=3163.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  48%|████▊     | 577/1208 [16:25<17:58,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0779, train/loss_vlb_step=0.000264, train/loss_step=0.0779, global_step=3164.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  48%|████▊     | 578/1208 [16:27<17:55,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0779, train/loss_vlb_step=0.000264, train/loss_step=0.0779, global_step=3164.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  48%|████▊     | 578/1208 [16:27<17:55,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00565, train/loss_vlb_step=2.93e-5, train/loss_step=0.00565, global_step=3164.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  48%|████▊     | 579/1208 [16:28<17:53,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00565, train/loss_vlb_step=2.93e-5, train/loss_step=0.00565, global_step=3164.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  48%|████▊     | 579/1208 [16:28<17:53,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000133, train/loss_step=0.0361, global_step=3164.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  48%|████▊     | 580/1208 [16:31<17:53,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000133, train/loss_step=0.0361, global_step=3164.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  48%|████▊     | 580/1208 [16:31<17:53,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0865, train/loss_vlb_step=0.000288, train/loss_step=0.0865, global_step=3164.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  48%|████▊     | 581/1208 [16:32<17:50,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0865, train/loss_vlb_step=0.000288, train/loss_step=0.0865, global_step=3164.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  48%|████▊     | 581/1208 [16:32<17:50,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0774, train/loss_vlb_step=0.000261, train/loss_step=0.0774, global_step=3165.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  48%|████▊     | 582/1208 [16:33<17:48,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0774, train/loss_vlb_step=0.000261, train/loss_step=0.0774, global_step=3165.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  48%|████▊     | 582/1208 [16:33<17:48,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000387, train/loss_step=0.117, global_step=3165.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  48%|████▊     | 583/1208 [16:34<17:46,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000387, train/loss_step=0.117, global_step=3165.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  48%|████▊     | 583/1208 [16:34<17:46,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.22e-5, train/loss_step=0.0173, global_step=3165.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  48%|████▊     | 584/1208 [16:37<17:45,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.22e-5, train/loss_step=0.0173, global_step=3165.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  48%|████▊     | 584/1208 [16:37<17:45,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00593, train/loss_vlb_step=3.01e-5, train/loss_step=0.00593, global_step=3165.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  48%|████▊     | 585/1208 [16:38<17:43,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00593, train/loss_vlb_step=3.01e-5, train/loss_step=0.00593, global_step=3165.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  48%|████▊     | 585/1208 [16:38<17:43,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.5e-5, train/loss_step=0.00475, global_step=3166.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  49%|████▊     | 586/1208 [16:39<17:41,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.5e-5, train/loss_step=0.00475, global_step=3166.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  49%|████▊     | 586/1208 [16:39<17:41,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000425, train/loss_step=0.128, global_step=3166.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  49%|████▊     | 587/1208 [16:40<17:38,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000425, train/loss_step=0.128, global_step=3166.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  49%|████▊     | 587/1208 [16:40<17:38,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00138, train/loss_step=0.291, global_step=3166.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  49%|████▊     | 588/1208 [16:43<17:38,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00138, train/loss_step=0.291, global_step=3166.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  49%|████▊     | 588/1208 [16:43<17:38,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000793, train/loss_step=0.216, global_step=3166.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  49%|████▉     | 589/1208 [16:45<17:36,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000793, train/loss_step=0.216, global_step=3166.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  49%|████▉     | 589/1208 [16:45<17:36,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.61e-5, train/loss_step=0.00284, global_step=3167.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  49%|████▉     | 590/1208 [16:46<17:33,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.61e-5, train/loss_step=0.00284, global_step=3167.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  49%|████▉     | 590/1208 [16:46<17:33,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000802, train/loss_step=0.213, global_step=3167.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  49%|████▉     | 591/1208 [16:47<17:31,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000802, train/loss_step=0.213, global_step=3167.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  49%|████▉     | 591/1208 [16:47<17:31,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.000189, train/loss_step=0.0537, global_step=3167.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  49%|████▉     | 592/1208 [16:50<17:31,  1.71s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.000189, train/loss_step=0.0537, global_step=3167.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  49%|████▉     | 592/1208 [16:50<17:31,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0884, train/loss_vlb_step=0.000293, train/loss_step=0.0884, global_step=3167.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  49%|████▉     | 593/1208 [16:51<17:28,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0884, train/loss_vlb_step=0.000293, train/loss_step=0.0884, global_step=3167.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  49%|████▉     | 593/1208 [16:51<17:28,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0487, train/loss_vlb_step=0.000172, train/loss_step=0.0487, global_step=3168.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  49%|████▉     | 594/1208 [16:52<17:26,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0487, train/loss_vlb_step=0.000172, train/loss_step=0.0487, global_step=3168.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  49%|████▉     | 594/1208 [16:52<17:26,  1.70s/it, loss=0.0904, v_num=0, train/loss_simple_step=0.00912, train/loss_vlb_step=4.45e-5, train/loss_step=0.00912, global_step=3168.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  49%|████▉     | 595/1208 [16:53<17:24,  1.70s/it, loss=0.0904, v_num=0, train/loss_simple_step=0.00912, train/loss_vlb_step=4.45e-5, train/loss_step=0.00912, global_step=3168.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  49%|████▉     | 595/1208 [16:53<17:24,  1.70s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.0424, train/loss_vlb_step=0.000159, train/loss_step=0.0424, global_step=3168.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  49%|████▉     | 596/1208 [16:56<17:24,  1.71s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.0424, train/loss_vlb_step=0.000159, train/loss_step=0.0424, global_step=3168.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  49%|████▉     | 596/1208 [16:56<17:24,  1.71s/it, loss=0.0763, v_num=0, train/loss_simple_step=0.00432, train/loss_vlb_step=2.31e-5, train/loss_step=0.00432, global_step=3168.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  49%|████▉     | 597/1208 [16:57<17:21,  1.70s/it, loss=0.0763, v_num=0, train/loss_simple_step=0.00432, train/loss_vlb_step=2.31e-5, train/loss_step=0.00432, global_step=3168.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  49%|████▉     | 597/1208 [16:57<17:21,  1.70s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00301, train/loss_step=0.401, global_step=3169.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  50%|████▉     | 598/1208 [16:58<17:19,  1.70s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00301, train/loss_step=0.401, global_step=3169.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  50%|████▉     | 598/1208 [16:58<17:19,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00197, train/loss_step=0.338, global_step=3169.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  50%|████▉     | 599/1208 [16:59<17:16,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00197, train/loss_step=0.338, global_step=3169.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  50%|████▉     | 599/1208 [16:59<17:16,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.655, train/loss_vlb_step=0.0263, train/loss_step=0.655, global_step=3169.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  50%|████▉     | 600/1208 [17:03<17:16,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.655, train/loss_vlb_step=0.0263, train/loss_step=0.655, global_step=3169.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  50%|████▉     | 600/1208 [17:03<17:16,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00859, train/loss_vlb_step=4.29e-5, train/loss_step=0.00859, global_step=3169.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.81it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.80it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.83it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.80it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.80it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.75it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.75it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.78it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.74it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.75it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.75it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 10:  50%|████▉     | 601/1208 [17:33<17:44,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00859, train/loss_vlb_step=4.29e-5, train/loss_step=0.00859, global_step=3169.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  50%|████▉     | 601/1208 [17:33<17:44,  1.75s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.000177, train/loss_step=0.0508, global_step=3170.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  50%|████▉     | 602/1208 [17:34<17:42,  1.75s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.000177, train/loss_step=0.0508, global_step=3170.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  50%|████▉     | 602/1208 [17:34<17:42,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00772, train/loss_vlb_step=3.76e-5, train/loss_step=0.00772, global_step=3170.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  50%|████▉     | 603/1208 [17:36<17:39,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00772, train/loss_vlb_step=3.76e-5, train/loss_step=0.00772, global_step=3170.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  50%|████▉     | 603/1208 [17:36<17:39,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000591, train/loss_step=0.163, global_step=3170.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  50%|█████     | 604/1208 [17:39<17:39,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000591, train/loss_step=0.163, global_step=3170.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  50%|█████     | 604/1208 [17:39<17:39,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000115, train/loss_step=0.0302, global_step=3170.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  50%|█████     | 605/1208 [17:40<17:36,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000115, train/loss_step=0.0302, global_step=3170.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  50%|█████     | 605/1208 [17:40<17:36,  1.75s/it, loss=0.147, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000621, train/loss_step=0.179, global_step=3171.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  50%|█████     | 606/1208 [17:41<17:34,  1.75s/it, loss=0.147, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000621, train/loss_step=0.179, global_step=3171.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  50%|█████     | 606/1208 [17:41<17:34,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00819, train/loss_vlb_step=3.99e-5, train/loss_step=0.00819, global_step=3171.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  50%|█████     | 607/1208 [17:42<17:31,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00819, train/loss_vlb_step=3.99e-5, train/loss_step=0.00819, global_step=3171.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  50%|█████     | 607/1208 [17:42<17:31,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00321, train/loss_vlb_step=1.78e-5, train/loss_step=0.00321, global_step=3171.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  50%|█████     | 608/1208 [17:45<17:31,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00321, train/loss_vlb_step=1.78e-5, train/loss_step=0.00321, global_step=3171.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  50%|█████     | 608/1208 [17:45<17:31,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.71e-5, train/loss_step=0.0206, global_step=3171.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  50%|█████     | 609/1208 [17:46<17:29,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.71e-5, train/loss_step=0.0206, global_step=3171.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  50%|█████     | 609/1208 [17:46<17:29,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=3172.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  50%|█████     | 610/1208 [17:47<17:26,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=3172.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  50%|█████     | 610/1208 [17:47<17:26,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00457, train/loss_vlb_step=2.47e-5, train/loss_step=0.00457, global_step=3172.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  51%|█████     | 611/1208 [17:48<17:24,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00457, train/loss_vlb_step=2.47e-5, train/loss_step=0.00457, global_step=3172.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  51%|█████     | 611/1208 [17:48<17:24,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.622, train/loss_vlb_step=0.0152, train/loss_step=0.622, global_step=3172.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 10:  51%|█████     | 612/1208 [17:52<17:24,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.622, train/loss_vlb_step=0.0152, train/loss_step=0.622, global_step=3172.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  51%|█████     | 612/1208 [17:52<17:24,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000517, train/loss_step=0.156, global_step=3172.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  51%|█████     | 613/1208 [17:53<17:21,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000517, train/loss_step=0.156, global_step=3172.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  51%|█████     | 613/1208 [17:53<17:21,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=7.06e-5, train/loss_step=0.0164, global_step=3173.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  51%|█████     | 614/1208 [17:54<17:19,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=7.06e-5, train/loss_step=0.0164, global_step=3173.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  51%|█████     | 614/1208 [17:54<17:19,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.002, train/loss_step=0.308, global_step=3173.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  51%|█████     | 615/1208 [17:55<17:16,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.002, train/loss_step=0.308, global_step=3173.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  51%|█████     | 615/1208 [17:55<17:16,  1.75s/it, loss=0.187, v_num=0, train/loss_simple_step=0.654, train/loss_vlb_step=0.0284, train/loss_step=0.654, global_step=3173.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  51%|█████     | 616/1208 [17:58<17:16,  1.75s/it, loss=0.187, v_num=0, train/loss_simple_step=0.654, train/loss_vlb_step=0.0284, train/loss_step=0.654, global_step=3173.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  51%|█████     | 616/1208 [17:58<17:16,  1.75s/it, loss=0.197, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000847, train/loss_step=0.214, global_step=3173.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  51%|█████     | 617/1208 [17:59<17:14,  1.75s/it, loss=0.197, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000847, train/loss_step=0.214, global_step=3173.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  51%|█████     | 617/1208 [17:59<17:14,  1.75s/it, loss=0.182, v_num=0, train/loss_simple_step=0.099, train/loss_vlb_step=0.000326, train/loss_step=0.099, global_step=3174.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  51%|█████     | 618/1208 [18:00<17:11,  1.75s/it, loss=0.182, v_num=0, train/loss_simple_step=0.099, train/loss_vlb_step=0.000326, train/loss_step=0.099, global_step=3174.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  51%|█████     | 618/1208 [18:00<17:11,  1.75s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0783, train/loss_vlb_step=0.000261, train/loss_step=0.0783, global_step=3174.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  51%|█████     | 619/1208 [18:01<17:09,  1.75s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0783, train/loss_vlb_step=0.000261, train/loss_step=0.0783, global_step=3174.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  51%|█████     | 619/1208 [18:01<17:09,  1.75s/it, loss=0.146, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.00071, train/loss_step=0.191, global_step=3174.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  51%|█████▏    | 620/1208 [18:04<17:08,  1.75s/it, loss=0.146, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.00071, train/loss_step=0.191, global_step=3174.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  51%|█████▏    | 620/1208 [18:04<17:08,  1.75s/it, loss=0.149, v_num=0, train/loss_simple_step=0.073, train/loss_vlb_step=0.000245, train/loss_step=0.073, global_step=3174.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  51%|█████▏    | 621/1208 [18:05<17:06,  1.75s/it, loss=0.149, v_num=0, train/loss_simple_step=0.073, train/loss_vlb_step=0.000245, train/loss_step=0.073, global_step=3174.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  51%|█████▏    | 621/1208 [18:05<17:06,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.00046, train/loss_step=0.139, global_step=3175.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  51%|█████▏    | 622/1208 [18:06<17:04,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.00046, train/loss_step=0.139, global_step=3175.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  51%|█████▏    | 622/1208 [18:06<17:04,  1.75s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00371, train/loss_vlb_step=2.06e-5, train/loss_step=0.00371, global_step=3175.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  52%|█████▏    | 623/1208 [18:08<17:01,  1.75s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00371, train/loss_vlb_step=2.06e-5, train/loss_step=0.00371, global_step=3175.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  52%|█████▏    | 623/1208 [18:08<17:01,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.00048, train/loss_step=0.144, global_step=3175.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  52%|█████▏    | 624/1208 [18:11<17:01,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.00048, train/loss_step=0.144, global_step=3175.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  52%|█████▏    | 624/1208 [18:11<17:01,  1.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00581, train/loss_vlb_step=3.01e-5, train/loss_step=0.00581, global_step=3175.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  52%|█████▏    | 625/1208 [18:12<16:58,  1.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00581, train/loss_vlb_step=3.01e-5, train/loss_step=0.00581, global_step=3175.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  52%|█████▏    | 625/1208 [18:12<16:58,  1.75s/it, loss=0.155, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000966, train/loss_step=0.245, global_step=3176.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  52%|█████▏    | 626/1208 [18:13<16:56,  1.75s/it, loss=0.155, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000966, train/loss_step=0.245, global_step=3176.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  52%|█████▏    | 626/1208 [18:13<16:56,  1.75s/it, loss=0.16, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000413, train/loss_step=0.125, global_step=3176.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  52%|█████▏    | 627/1208 [18:14<16:54,  1.75s/it, loss=0.16, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000413, train/loss_step=0.125, global_step=3176.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  52%|█████▏    | 627/1208 [18:14<16:54,  1.75s/it, loss=0.172, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00107, train/loss_step=0.237, global_step=3176.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  52%|█████▏    | 628/1208 [18:17<16:53,  1.75s/it, loss=0.172, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00107, train/loss_step=0.237, global_step=3176.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  52%|█████▏    | 628/1208 [18:17<16:53,  1.75s/it, loss=0.184, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00125, train/loss_step=0.267, global_step=3176.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  52%|█████▏    | 629/1208 [18:18<16:51,  1.75s/it, loss=0.184, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00125, train/loss_step=0.267, global_step=3176.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  52%|█████▏    | 629/1208 [18:18<16:51,  1.75s/it, loss=0.191, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000905, train/loss_step=0.246, global_step=3177.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  52%|█████▏    | 630/1208 [18:19<16:49,  1.75s/it, loss=0.191, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000905, train/loss_step=0.246, global_step=3177.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  52%|█████▏    | 630/1208 [18:19<16:49,  1.75s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.7e-5, train/loss_step=0.0108, global_step=3177.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  52%|█████▏    | 631/1208 [18:20<16:46,  1.74s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.7e-5, train/loss_step=0.0108, global_step=3177.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  52%|█████▏    | 631/1208 [18:20<16:46,  1.74s/it, loss=0.18, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00244, train/loss_step=0.395, global_step=3177.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  52%|█████▏    | 632/1208 [18:24<16:46,  1.75s/it, loss=0.18, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00244, train/loss_step=0.395, global_step=3177.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  52%|█████▏    | 632/1208 [18:24<16:46,  1.75s/it, loss=0.186, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00107, train/loss_step=0.266, global_step=3177.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  52%|█████▏    | 633/1208 [18:25<16:43,  1.75s/it, loss=0.186, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00107, train/loss_step=0.266, global_step=3177.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  52%|█████▏    | 633/1208 [18:25<16:43,  1.75s/it, loss=0.19, v_num=0, train/loss_simple_step=0.088, train/loss_vlb_step=0.000297, train/loss_step=0.088, global_step=3178.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  52%|█████▏    | 634/1208 [18:26<16:41,  1.74s/it, loss=0.19, v_num=0, train/loss_simple_step=0.088, train/loss_vlb_step=0.000297, train/loss_step=0.088, global_step=3178.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  52%|█████▏    | 634/1208 [18:26<16:41,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0984, train/loss_vlb_step=0.000324, train/loss_step=0.0984, global_step=3178.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  53%|█████▎    | 635/1208 [18:27<16:39,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0984, train/loss_vlb_step=0.000324, train/loss_step=0.0984, global_step=3178.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  53%|█████▎    | 635/1208 [18:27<16:39,  1.74s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00444, train/loss_vlb_step=2.38e-5, train/loss_step=0.00444, global_step=3178.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  53%|█████▎    | 636/1208 [18:30<16:38,  1.75s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00444, train/loss_vlb_step=2.38e-5, train/loss_step=0.00444, global_step=3178.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  53%|█████▎    | 636/1208 [18:30<16:38,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0491, train/loss_vlb_step=0.000174, train/loss_step=0.0491, global_step=3178.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  53%|█████▎    | 637/1208 [18:31<16:36,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0491, train/loss_vlb_step=0.000174, train/loss_step=0.0491, global_step=3178.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  53%|█████▎    | 637/1208 [18:31<16:36,  1.75s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.09e-5, train/loss_step=0.0113, global_step=3179.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  53%|█████▎    | 638/1208 [18:32<16:34,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.09e-5, train/loss_step=0.0113, global_step=3179.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  53%|█████▎    | 638/1208 [18:32<16:34,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.62e-5, train/loss_step=0.00277, global_step=3179.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  53%|█████▎    | 639/1208 [18:33<16:31,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.62e-5, train/loss_step=0.00277, global_step=3179.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  53%|█████▎    | 639/1208 [18:33<16:31,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=3.06e-5, train/loss_step=0.00619, global_step=3179.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  53%|█████▎    | 640/1208 [18:36<16:31,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=3.06e-5, train/loss_step=0.00619, global_step=3179.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  53%|█████▎    | 640/1208 [18:36<16:31,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.25e-5, train/loss_step=0.0176, global_step=3179.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  53%|█████▎    | 641/1208 [18:37<16:28,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.25e-5, train/loss_step=0.0176, global_step=3179.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  53%|█████▎    | 641/1208 [18:37<16:28,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.06e-5, train/loss_step=0.00176, global_step=3180.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  53%|█████▎    | 642/1208 [18:39<16:26,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.06e-5, train/loss_step=0.00176, global_step=3180.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  53%|█████▎    | 642/1208 [18:39<16:26,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=3180.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  53%|█████▎    | 643/1208 [18:40<16:24,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=3180.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  53%|█████▎    | 643/1208 [18:40<16:24,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.73e-5, train/loss_step=0.0241, global_step=3180.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  53%|█████▎    | 644/1208 [18:43<16:23,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.73e-5, train/loss_step=0.0241, global_step=3180.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  53%|█████▎    | 644/1208 [18:43<16:23,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000541, train/loss_step=0.160, global_step=3180.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  53%|█████▎    | 645/1208 [18:44<16:21,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000541, train/loss_step=0.160, global_step=3180.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  53%|█████▎    | 645/1208 [18:44<16:21,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.43e-5, train/loss_step=0.0125, global_step=3181.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  53%|█████▎    | 646/1208 [18:45<16:19,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.43e-5, train/loss_step=0.0125, global_step=3181.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  53%|█████▎    | 646/1208 [18:45<16:19,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0498, train/loss_vlb_step=0.000174, train/loss_step=0.0498, global_step=3181.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  54%|█████▎    | 647/1208 [18:46<16:16,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0498, train/loss_vlb_step=0.000174, train/loss_step=0.0498, global_step=3181.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  54%|█████▎    | 647/1208 [18:46<16:16,  1.74s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.00586, train/loss_vlb_step=2.9e-5, train/loss_step=0.00586, global_step=3181.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  54%|█████▎    | 648/1208 [18:49<16:16,  1.74s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.00586, train/loss_vlb_step=2.9e-5, train/loss_step=0.00586, global_step=3181.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  54%|█████▎    | 648/1208 [18:49<16:16,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.569, train/loss_vlb_step=0.00955, train/loss_step=0.569, global_step=3181.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  54%|█████▎    | 649/1208 [18:50<16:13,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.569, train/loss_vlb_step=0.00955, train/loss_step=0.569, global_step=3181.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  54%|█████▎    | 649/1208 [18:50<16:13,  1.74s/it, loss=0.0945, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.11e-5, train/loss_step=0.00188, global_step=3182.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  54%|█████▍    | 650/1208 [18:51<16:11,  1.74s/it, loss=0.0945, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.11e-5, train/loss_step=0.00188, global_step=3182.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  54%|█████▍    | 650/1208 [18:51<16:11,  1.74s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.81e-5, train/loss_step=0.0124, global_step=3182.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  54%|█████▍    | 651/1208 [18:52<16:09,  1.74s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.81e-5, train/loss_step=0.0124, global_step=3182.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  54%|█████▍    | 651/1208 [18:52<16:09,  1.74s/it, loss=0.0779, v_num=0, train/loss_simple_step=0.0613, train/loss_vlb_step=0.000208, train/loss_step=0.0613, global_step=3182.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  54%|█████▍    | 652/1208 [18:56<16:08,  1.74s/it, loss=0.0779, v_num=0, train/loss_simple_step=0.0613, train/loss_vlb_step=0.000208, train/loss_step=0.0613, global_step=3182.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  54%|█████▍    | 652/1208 [18:56<16:08,  1.74s/it, loss=0.0648, v_num=0, train/loss_simple_step=0.00372, train/loss_vlb_step=2.08e-5, train/loss_step=0.00372, global_step=3182.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  54%|█████▍    | 653/1208 [18:57<16:06,  1.74s/it, loss=0.0648, v_num=0, train/loss_simple_step=0.00372, train/loss_vlb_step=2.08e-5, train/loss_step=0.00372, global_step=3182.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  54%|█████▍    | 653/1208 [18:57<16:06,  1.74s/it, loss=0.0708, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000741, train/loss_step=0.209, global_step=3183.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  54%|█████▍    | 654/1208 [18:58<16:04,  1.74s/it, loss=0.0708, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000741, train/loss_step=0.209, global_step=3183.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  54%|█████▍    | 654/1208 [18:58<16:04,  1.74s/it, loss=0.0678, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000141, train/loss_step=0.0374, global_step=3183.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  54%|█████▍    | 655/1208 [18:59<16:01,  1.74s/it, loss=0.0678, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000141, train/loss_step=0.0374, global_step=3183.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  54%|█████▍    | 655/1208 [18:59<16:01,  1.74s/it, loss=0.0788, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000959, train/loss_step=0.225, global_step=3183.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  54%|█████▍    | 656/1208 [19:02<16:01,  1.74s/it, loss=0.0788, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000959, train/loss_step=0.225, global_step=3183.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  54%|█████▍    | 656/1208 [19:02<16:01,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.505, train/loss_vlb_step=0.00517, train/loss_step=0.505, global_step=3183.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  54%|█████▍    | 657/1208 [19:03<15:59,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.505, train/loss_vlb_step=0.00517, train/loss_step=0.505, global_step=3183.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  54%|█████▍    | 657/1208 [19:03<15:59,  1.74s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.17e-5, train/loss_step=0.00195, global_step=3184.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  54%|█████▍    | 658/1208 [19:04<15:56,  1.74s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.17e-5, train/loss_step=0.00195, global_step=3184.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  54%|█████▍    | 658/1208 [19:04<15:56,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000594, train/loss_step=0.167, global_step=3184.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  55%|█████▍    | 659/1208 [19:05<15:54,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000594, train/loss_step=0.167, global_step=3184.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  55%|█████▍    | 659/1208 [19:05<15:54,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000407, train/loss_step=0.124, global_step=3184.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  55%|█████▍    | 660/1208 [19:09<15:54,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000407, train/loss_step=0.124, global_step=3184.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  55%|█████▍    | 660/1208 [19:09<15:54,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000464, train/loss_step=0.139, global_step=3184.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  55%|█████▍    | 661/1208 [19:10<15:51,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000464, train/loss_step=0.139, global_step=3184.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  55%|█████▍    | 661/1208 [19:10<15:51,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000544, train/loss_step=0.156, global_step=3185.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  55%|█████▍    | 662/1208 [19:11<15:49,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000544, train/loss_step=0.156, global_step=3185.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  55%|█████▍    | 662/1208 [19:11<15:49,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00125, train/loss_step=0.273, global_step=3185.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  55%|█████▍    | 663/1208 [19:12<15:47,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00125, train/loss_step=0.273, global_step=3185.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  55%|█████▍    | 663/1208 [19:12<15:47,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.000107, train/loss_step=0.0256, global_step=3185.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  55%|█████▍    | 664/1208 [19:15<15:46,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.000107, train/loss_step=0.0256, global_step=3185.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  55%|█████▍    | 664/1208 [19:15<15:46,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00584, train/loss_step=0.458, global_step=3185.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  55%|█████▌    | 665/1208 [19:16<15:44,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00584, train/loss_step=0.458, global_step=3185.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  55%|█████▌    | 665/1208 [19:16<15:44,  1.74s/it, loss=0.171, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00269, train/loss_step=0.393, global_step=3186.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  55%|█████▌    | 666/1208 [19:17<15:42,  1.74s/it, loss=0.171, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00269, train/loss_step=0.393, global_step=3186.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  55%|█████▌    | 666/1208 [19:17<15:42,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000685, train/loss_step=0.206, global_step=3186.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  55%|█████▌    | 667/1208 [19:18<15:39,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000685, train/loss_step=0.206, global_step=3186.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  55%|█████▌    | 667/1208 [19:18<15:39,  1.74s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000127, train/loss_step=0.0334, global_step=3186.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  55%|█████▌    | 668/1208 [19:21<15:39,  1.74s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000127, train/loss_step=0.0334, global_step=3186.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  55%|█████▌    | 668/1208 [19:21<15:39,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.00048, train/loss_step=0.141, global_step=3186.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  55%|█████▌    | 669/1208 [19:22<15:36,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.00048, train/loss_step=0.141, global_step=3186.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  55%|█████▌    | 669/1208 [19:22<15:36,  1.74s/it, loss=0.182, v_num=0, train/loss_simple_step=0.464, train/loss_vlb_step=0.00433, train/loss_step=0.464, global_step=3187.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  55%|█████▌    | 670/1208 [19:23<15:34,  1.74s/it, loss=0.182, v_num=0, train/loss_simple_step=0.464, train/loss_vlb_step=0.00433, train/loss_step=0.464, global_step=3187.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  55%|█████▌    | 670/1208 [19:23<15:34,  1.74s/it, loss=0.188, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000471, train/loss_step=0.143, global_step=3187.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  56%|█████▌    | 671/1208 [19:25<15:32,  1.74s/it, loss=0.188, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000471, train/loss_step=0.143, global_step=3187.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  56%|█████▌    | 671/1208 [19:25<15:32,  1.74s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0618, train/loss_vlb_step=0.000208, train/loss_step=0.0618, global_step=3187.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  56%|█████▌    | 672/1208 [19:28<15:31,  1.74s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0618, train/loss_vlb_step=0.000208, train/loss_step=0.0618, global_step=3187.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  56%|█████▌    | 672/1208 [19:28<15:31,  1.74s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000128, train/loss_step=0.0348, global_step=3187.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  56%|█████▌    | 673/1208 [19:29<15:29,  1.74s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000128, train/loss_step=0.0348, global_step=3187.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  56%|█████▌    | 673/1208 [19:29<15:29,  1.74s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00538, train/loss_vlb_step=2.82e-5, train/loss_step=0.00538, global_step=3188.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  56%|█████▌    | 674/1208 [19:30<15:27,  1.74s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00538, train/loss_vlb_step=2.82e-5, train/loss_step=0.00538, global_step=3188.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  56%|█████▌    | 674/1208 [19:30<15:27,  1.74s/it, loss=0.183, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000373, train/loss_step=0.113, global_step=3188.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  56%|█████▌    | 675/1208 [19:31<15:24,  1.74s/it, loss=0.183, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000373, train/loss_step=0.113, global_step=3188.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  56%|█████▌    | 675/1208 [19:31<15:24,  1.74s/it, loss=0.177, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000339, train/loss_step=0.102, global_step=3188.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  56%|█████▌    | 676/1208 [19:34<15:24,  1.74s/it, loss=0.177, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000339, train/loss_step=0.102, global_step=3188.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  56%|█████▌    | 676/1208 [19:34<15:24,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=2.79e-5, train/loss_step=0.00526, global_step=3188.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  56%|█████▌    | 677/1208 [19:35<15:22,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=2.79e-5, train/loss_step=0.00526, global_step=3188.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  56%|█████▌    | 677/1208 [19:35<15:22,  1.74s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0829, train/loss_vlb_step=0.000277, train/loss_step=0.0829, global_step=3189.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  56%|█████▌    | 678/1208 [19:36<15:19,  1.74s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0829, train/loss_vlb_step=0.000277, train/loss_step=0.0829, global_step=3189.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  56%|█████▌    | 678/1208 [19:36<15:19,  1.74s/it, loss=0.182, v_num=0, train/loss_simple_step=0.676, train/loss_vlb_step=0.0435, train/loss_step=0.676, global_step=3189.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  56%|█████▌    | 679/1208 [19:37<15:17,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.676, train/loss_vlb_step=0.0435, train/loss_step=0.676, global_step=3189.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  56%|█████▌    | 679/1208 [19:37<15:17,  1.73s/it, loss=0.185, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000653, train/loss_step=0.185, global_step=3189.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  56%|█████▋    | 680/1208 [19:41<15:17,  1.74s/it, loss=0.185, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000653, train/loss_step=0.185, global_step=3189.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  56%|█████▋    | 680/1208 [19:41<15:17,  1.74s/it, loss=0.186, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000543, train/loss_step=0.157, global_step=3189.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  56%|█████▋    | 681/1208 [19:42<15:14,  1.74s/it, loss=0.186, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000543, train/loss_step=0.157, global_step=3189.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  56%|█████▋    | 681/1208 [19:42<15:14,  1.74s/it, loss=0.202, v_num=0, train/loss_simple_step=0.469, train/loss_vlb_step=0.00329, train/loss_step=0.469, global_step=3190.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  56%|█████▋    | 682/1208 [19:43<15:12,  1.73s/it, loss=0.202, v_num=0, train/loss_simple_step=0.469, train/loss_vlb_step=0.00329, train/loss_step=0.469, global_step=3190.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  56%|█████▋    | 682/1208 [19:43<15:12,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.37e-5, train/loss_step=0.0171, global_step=3190.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  57%|█████▋    | 683/1208 [19:44<15:10,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.37e-5, train/loss_step=0.0171, global_step=3190.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  57%|█████▋    | 683/1208 [19:44<15:10,  1.73s/it, loss=0.205, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00188, train/loss_step=0.354, global_step=3190.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  57%|█████▋    | 684/1208 [19:47<15:09,  1.74s/it, loss=0.205, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00188, train/loss_step=0.354, global_step=3190.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  57%|█████▋    | 684/1208 [19:47<15:09,  1.74s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0507, train/loss_vlb_step=0.000177, train/loss_step=0.0507, global_step=3190.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  57%|█████▋    | 685/1208 [19:48<15:07,  1.74s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0507, train/loss_vlb_step=0.000177, train/loss_step=0.0507, global_step=3190.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  57%|█████▋    | 685/1208 [19:48<15:07,  1.74s/it, loss=0.18, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00115, train/loss_step=0.290, global_step=3191.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  57%|█████▋    | 686/1208 [19:49<15:05,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00115, train/loss_step=0.290, global_step=3191.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  57%|█████▋    | 686/1208 [19:49<15:05,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0639, train/loss_vlb_step=0.000215, train/loss_step=0.0639, global_step=3191.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  57%|█████▋    | 687/1208 [19:50<15:02,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0639, train/loss_vlb_step=0.000215, train/loss_step=0.0639, global_step=3191.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  57%|█████▋    | 687/1208 [19:50<15:02,  1.73s/it, loss=0.201, v_num=0, train/loss_simple_step=0.598, train/loss_vlb_step=0.0186, train/loss_step=0.598, global_step=3191.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  57%|█████▋    | 688/1208 [19:53<15:02,  1.74s/it, loss=0.201, v_num=0, train/loss_simple_step=0.598, train/loss_vlb_step=0.0186, train/loss_step=0.598, global_step=3191.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  57%|█████▋    | 688/1208 [19:53<15:02,  1.74s/it, loss=0.194, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=3.23e-5, train/loss_step=0.00611, global_step=3191.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  57%|█████▋    | 689/1208 [19:54<15:00,  1.73s/it, loss=0.194, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=3.23e-5, train/loss_step=0.00611, global_step=3191.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  57%|█████▋    | 689/1208 [19:54<15:00,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000103, train/loss_step=0.0264, global_step=3192.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  57%|█████▋    | 690/1208 [19:56<14:57,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000103, train/loss_step=0.0264, global_step=3192.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  57%|█████▋    | 690/1208 [19:56<14:57,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000519, train/loss_step=0.154, global_step=3192.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  57%|█████▋    | 691/1208 [19:57<14:55,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000519, train/loss_step=0.154, global_step=3192.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  57%|█████▋    | 691/1208 [19:57<14:55,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0893, train/loss_vlb_step=0.000299, train/loss_step=0.0893, global_step=3192.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  57%|█████▋    | 692/1208 [20:00<14:55,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0893, train/loss_vlb_step=0.000299, train/loss_step=0.0893, global_step=3192.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  57%|█████▋    | 692/1208 [20:00<14:55,  1.73s/it, loss=0.215, v_num=0, train/loss_simple_step=0.853, train/loss_vlb_step=0.144, train/loss_step=0.853, global_step=3192.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 10:  57%|█████▋    | 693/1208 [20:01<14:52,  1.73s/it, loss=0.215, v_num=0, train/loss_simple_step=0.853, train/loss_vlb_step=0.144, train/loss_step=0.853, global_step=3192.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  57%|█████▋    | 693/1208 [20:01<14:52,  1.73s/it, loss=0.215, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.75e-5, train/loss_step=0.0127, global_step=3193.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  57%|█████▋    | 694/1208 [20:02<14:50,  1.73s/it, loss=0.215, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.75e-5, train/loss_step=0.0127, global_step=3193.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  57%|█████▋    | 694/1208 [20:02<14:50,  1.73s/it, loss=0.216, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000399, train/loss_step=0.121, global_step=3193.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  58%|█████▊    | 695/1208 [20:03<14:48,  1.73s/it, loss=0.216, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000399, train/loss_step=0.121, global_step=3193.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  58%|█████▊    | 695/1208 [20:03<14:48,  1.73s/it, loss=0.212, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000104, train/loss_step=0.0272, global_step=3193.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  58%|█████▊    | 696/1208 [20:06<14:47,  1.73s/it, loss=0.212, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000104, train/loss_step=0.0272, global_step=3193.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  58%|█████▊    | 696/1208 [20:06<14:47,  1.73s/it, loss=0.249, v_num=0, train/loss_simple_step=0.747, train/loss_vlb_step=0.0636, train/loss_step=0.747, global_step=3193.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  58%|█████▊    | 697/1208 [20:07<14:45,  1.73s/it, loss=0.249, v_num=0, train/loss_simple_step=0.747, train/loss_vlb_step=0.0636, train/loss_step=0.747, global_step=3193.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  58%|█████▊    | 697/1208 [20:07<14:45,  1.73s/it, loss=0.245, v_num=0, train/loss_simple_step=0.0037, train/loss_vlb_step=2.02e-5, train/loss_step=0.0037, global_step=3194.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  58%|█████▊    | 698/1208 [20:08<14:43,  1.73s/it, loss=0.245, v_num=0, train/loss_simple_step=0.0037, train/loss_vlb_step=2.02e-5, train/loss_step=0.0037, global_step=3194.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  58%|█████▊    | 698/1208 [20:08<14:43,  1.73s/it, loss=0.214, v_num=0, train/loss_simple_step=0.0496, train/loss_vlb_step=0.00017, train/loss_step=0.0496, global_step=3194.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  58%|█████▊    | 699/1208 [20:09<14:41,  1.73s/it, loss=0.214, v_num=0, train/loss_simple_step=0.0496, train/loss_vlb_step=0.00017, train/loss_step=0.0496, global_step=3194.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  58%|█████▊    | 699/1208 [20:09<14:41,  1.73s/it, loss=0.214, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000699, train/loss_step=0.199, global_step=3194.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  58%|█████▊    | 700/1208 [20:13<14:40,  1.73s/it, loss=0.214, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000699, train/loss_step=0.199, global_step=3194.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  58%|█████▊    | 700/1208 [20:13<14:40,  1.73s/it, loss=0.213, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=3194.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  58%|█████▊    | 701/1208 [20:14<14:38,  1.73s/it, loss=0.213, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=3194.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  58%|█████▊    | 701/1208 [20:14<14:38,  1.73s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0533, train/loss_vlb_step=0.000191, train/loss_step=0.0533, global_step=3195.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  58%|█████▊    | 702/1208 [20:15<14:35,  1.73s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0533, train/loss_vlb_step=0.000191, train/loss_step=0.0533, global_step=3195.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  58%|█████▊    | 702/1208 [20:15<14:35,  1.73s/it, loss=0.204, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00101, train/loss_step=0.254, global_step=3195.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  58%|█████▊    | 703/1208 [20:16<14:33,  1.73s/it, loss=0.204, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00101, train/loss_step=0.254, global_step=3195.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  58%|█████▊    | 703/1208 [20:16<14:33,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.066, train/loss_vlb_step=0.000227, train/loss_step=0.066, global_step=3195.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  58%|█████▊    | 704/1208 [20:19<14:33,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.066, train/loss_vlb_step=0.000227, train/loss_step=0.066, global_step=3195.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  58%|█████▊    | 704/1208 [20:19<14:33,  1.73s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.95e-5, train/loss_step=0.0131, global_step=3195.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  58%|█████▊    | 705/1208 [20:20<14:30,  1.73s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.95e-5, train/loss_step=0.0131, global_step=3195.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  58%|█████▊    | 705/1208 [20:20<14:30,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0925, train/loss_vlb_step=0.000308, train/loss_step=0.0925, global_step=3196.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  58%|█████▊    | 706/1208 [20:21<14:28,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0925, train/loss_vlb_step=0.000308, train/loss_step=0.0925, global_step=3196.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  58%|█████▊    | 706/1208 [20:21<14:28,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00521, train/loss_vlb_step=2.66e-5, train/loss_step=0.00521, global_step=3196.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  59%|█████▊    | 707/1208 [20:22<14:26,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00521, train/loss_vlb_step=2.66e-5, train/loss_step=0.00521, global_step=3196.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  59%|█████▊    | 707/1208 [20:22<14:26,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.94e-5, train/loss_step=0.0178, global_step=3196.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  59%|█████▊    | 708/1208 [20:25<14:25,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.94e-5, train/loss_step=0.0178, global_step=3196.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  59%|█████▊    | 708/1208 [20:25<14:25,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000973, train/loss_step=0.237, global_step=3196.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  59%|█████▊    | 709/1208 [20:27<14:23,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000973, train/loss_step=0.237, global_step=3196.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  59%|█████▊    | 709/1208 [20:27<14:23,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.00038, train/loss_step=0.115, global_step=3197.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  59%|█████▉    | 710/1208 [20:28<14:21,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.00038, train/loss_step=0.115, global_step=3197.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  59%|█████▉    | 710/1208 [20:28<14:21,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.475, train/loss_vlb_step=0.00509, train/loss_step=0.475, global_step=3197.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  59%|█████▉    | 711/1208 [20:29<14:19,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.475, train/loss_vlb_step=0.00509, train/loss_step=0.475, global_step=3197.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  59%|█████▉    | 711/1208 [20:29<14:19,  1.73s/it, loss=0.191, v_num=0, train/loss_simple_step=0.358, train/loss_vlb_step=0.00205, train/loss_step=0.358, global_step=3197.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  59%|█████▉    | 712/1208 [20:32<14:18,  1.73s/it, loss=0.191, v_num=0, train/loss_simple_step=0.358, train/loss_vlb_step=0.00205, train/loss_step=0.358, global_step=3197.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  59%|█████▉    | 712/1208 [20:32<14:18,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00427, train/loss_step=0.405, global_step=3197.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  59%|█████▉    | 713/1208 [20:33<14:16,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00427, train/loss_step=0.405, global_step=3197.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  59%|█████▉    | 713/1208 [20:33<14:16,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.46e-5, train/loss_step=0.0121, global_step=3198.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  59%|█████▉    | 714/1208 [20:34<14:14,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.46e-5, train/loss_step=0.0121, global_step=3198.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  59%|█████▉    | 714/1208 [20:34<14:14,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0868, train/loss_vlb_step=0.000287, train/loss_step=0.0868, global_step=3198.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  59%|█████▉    | 715/1208 [20:35<14:11,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0868, train/loss_vlb_step=0.000287, train/loss_step=0.0868, global_step=3198.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  59%|█████▉    | 715/1208 [20:35<14:11,  1.73s/it, loss=0.198, v_num=0, train/loss_simple_step=0.644, train/loss_vlb_step=0.0122, train/loss_step=0.644, global_step=3198.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  59%|█████▉    | 716/1208 [20:38<14:11,  1.73s/it, loss=0.198, v_num=0, train/loss_simple_step=0.644, train/loss_vlb_step=0.0122, train/loss_step=0.644, global_step=3198.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  59%|█████▉    | 716/1208 [20:38<14:11,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000115, train/loss_step=0.0281, global_step=3198.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  59%|█████▉    | 717/1208 [20:39<14:09,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000115, train/loss_step=0.0281, global_step=3198.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  59%|█████▉    | 717/1208 [20:39<14:09,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.17e-5, train/loss_step=0.0167, global_step=3199.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  59%|█████▉    | 718/1208 [20:40<14:06,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.17e-5, train/loss_step=0.0167, global_step=3199.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  59%|█████▉    | 718/1208 [20:40<14:06,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00267, train/loss_step=0.368, global_step=3199.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  60%|█████▉    | 719/1208 [20:41<14:04,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00267, train/loss_step=0.368, global_step=3199.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  60%|█████▉    | 719/1208 [20:41<14:04,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000131, train/loss_step=0.0348, global_step=3199.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  60%|█████▉    | 720/1208 [20:45<14:03,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000131, train/loss_step=0.0348, global_step=3199.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  60%|█████▉    | 720/1208 [20:45<14:03,  1.73s/it, loss=0.176, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.00112, train/loss_step=0.241, global_step=3199.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  60%|█████▉    | 721/1208 [20:46<14:01,  1.73s/it, loss=0.176, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.00112, train/loss_step=0.241, global_step=3199.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  60%|█████▉    | 721/1208 [20:46<14:01,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=8.89e-5, train/loss_step=0.0227, global_step=3200.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  60%|█████▉    | 722/1208 [20:47<13:59,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=8.89e-5, train/loss_step=0.0227, global_step=3200.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  60%|█████▉    | 722/1208 [20:47<13:59,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00175, train/loss_step=0.354, global_step=3200.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  60%|█████▉    | 723/1208 [20:48<13:57,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00175, train/loss_step=0.354, global_step=3200.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  60%|█████▉    | 723/1208 [20:48<13:57,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000333, train/loss_step=0.101, global_step=3200.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  60%|█████▉    | 724/1208 [20:51<13:56,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000333, train/loss_step=0.101, global_step=3200.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  60%|█████▉    | 724/1208 [20:51<13:56,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.16e-5, train/loss_step=0.0231, global_step=3200.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  60%|██████    | 725/1208 [20:52<13:54,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.16e-5, train/loss_step=0.0231, global_step=3200.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  60%|██████    | 725/1208 [20:52<13:54,  1.73s/it, loss=0.187, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000649, train/loss_step=0.192, global_step=3201.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  60%|██████    | 726/1208 [20:53<13:52,  1.73s/it, loss=0.187, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000649, train/loss_step=0.192, global_step=3201.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  60%|██████    | 726/1208 [20:53<13:52,  1.73s/it, loss=0.187, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.39e-5, train/loss_step=0.00235, global_step=3201.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  60%|██████    | 727/1208 [20:54<13:50,  1.73s/it, loss=0.187, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.39e-5, train/loss_step=0.00235, global_step=3201.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  60%|██████    | 727/1208 [20:54<13:50,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.98e-5, train/loss_step=0.0103, global_step=3201.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  60%|██████    | 728/1208 [20:58<13:49,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.98e-5, train/loss_step=0.0103, global_step=3201.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  60%|██████    | 728/1208 [20:58<13:49,  1.73s/it, loss=0.193, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00166, train/loss_step=0.362, global_step=3201.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  60%|██████    | 729/1208 [20:59<13:47,  1.73s/it, loss=0.193, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00166, train/loss_step=0.362, global_step=3201.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  60%|██████    | 729/1208 [20:59<13:47,  1.73s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0935, train/loss_vlb_step=0.000307, train/loss_step=0.0935, global_step=3202.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  60%|██████    | 730/1208 [21:00<13:45,  1.73s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0935, train/loss_vlb_step=0.000307, train/loss_step=0.0935, global_step=3202.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  60%|██████    | 730/1208 [21:00<13:45,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.38e-5, train/loss_step=0.0202, global_step=3202.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  61%|██████    | 731/1208 [21:01<13:43,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.38e-5, train/loss_step=0.0202, global_step=3202.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  61%|██████    | 731/1208 [21:01<13:43,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000586, train/loss_step=0.168, global_step=3202.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  61%|██████    | 732/1208 [21:04<13:42,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000586, train/loss_step=0.168, global_step=3202.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  61%|██████    | 732/1208 [21:04<13:42,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00269, train/loss_vlb_step=1.54e-5, train/loss_step=0.00269, global_step=3202.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  61%|██████    | 733/1208 [21:05<13:40,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00269, train/loss_vlb_step=1.54e-5, train/loss_step=0.00269, global_step=3202.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  61%|██████    | 733/1208 [21:05<13:40,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.000131, train/loss_step=0.0362, global_step=3203.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  61%|██████    | 734/1208 [21:06<13:37,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.000131, train/loss_step=0.0362, global_step=3203.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  61%|██████    | 734/1208 [21:06<13:37,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000632, train/loss_step=0.174, global_step=3203.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  61%|██████    | 735/1208 [21:07<13:35,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000632, train/loss_step=0.174, global_step=3203.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  61%|██████    | 735/1208 [21:07<13:35,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000656, train/loss_step=0.181, global_step=3203.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  61%|██████    | 736/1208 [21:10<13:35,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000656, train/loss_step=0.181, global_step=3203.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  61%|██████    | 736/1208 [21:10<13:35,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000399, train/loss_step=0.121, global_step=3203.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  61%|██████    | 737/1208 [21:11<13:32,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000399, train/loss_step=0.121, global_step=3203.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  61%|██████    | 737/1208 [21:11<13:32,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0434, train/loss_vlb_step=0.000157, train/loss_step=0.0434, global_step=3204.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  61%|██████    | 738/1208 [21:13<13:30,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0434, train/loss_vlb_step=0.000157, train/loss_step=0.0434, global_step=3204.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  61%|██████    | 738/1208 [21:13<13:30,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.000123, train/loss_step=0.0316, global_step=3204.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  61%|██████    | 739/1208 [21:14<13:28,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.000123, train/loss_step=0.0316, global_step=3204.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  61%|██████    | 739/1208 [21:14<13:28,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.0016, train/loss_step=0.319, global_step=3204.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  61%|██████▏   | 740/1208 [21:17<13:27,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.0016, train/loss_step=0.319, global_step=3204.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  61%|██████▏   | 740/1208 [21:17<13:27,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00599, train/loss_vlb_step=3.06e-5, train/loss_step=0.00599, global_step=3204.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  61%|██████▏   | 741/1208 [21:18<13:25,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00599, train/loss_vlb_step=3.06e-5, train/loss_step=0.00599, global_step=3204.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  61%|██████▏   | 741/1208 [21:18<13:25,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=5.96e-5, train/loss_step=0.0138, global_step=3205.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  61%|██████▏   | 742/1208 [21:19<13:23,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=5.96e-5, train/loss_step=0.0138, global_step=3205.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  61%|██████▏   | 742/1208 [21:19<13:23,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.00793, train/loss_step=0.485, global_step=3205.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  62%|██████▏   | 743/1208 [21:20<13:21,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.00793, train/loss_step=0.485, global_step=3205.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  62%|██████▏   | 743/1208 [21:20<13:21,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000525, train/loss_step=0.157, global_step=3205.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  62%|██████▏   | 744/1208 [21:23<13:20,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000525, train/loss_step=0.157, global_step=3205.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  62%|██████▏   | 744/1208 [21:23<13:20,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00895, train/loss_vlb_step=4.24e-5, train/loss_step=0.00895, global_step=3205.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  62%|██████▏   | 745/1208 [21:24<13:18,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00895, train/loss_vlb_step=4.24e-5, train/loss_step=0.00895, global_step=3205.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  62%|██████▏   | 745/1208 [21:24<13:18,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.4e-5, train/loss_step=0.0231, global_step=3206.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  62%|██████▏   | 746/1208 [21:25<13:16,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.4e-5, train/loss_step=0.0231, global_step=3206.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  62%|██████▏   | 746/1208 [21:25<13:16,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.26e-5, train/loss_step=0.0116, global_step=3206.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  62%|██████▏   | 747/1208 [21:26<13:14,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.26e-5, train/loss_step=0.0116, global_step=3206.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  62%|██████▏   | 747/1208 [21:26<13:14,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.509, train/loss_vlb_step=0.011, train/loss_step=0.509, global_step=3206.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  62%|██████▏   | 748/1208 [21:30<13:13,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.509, train/loss_vlb_step=0.011, train/loss_step=0.509, global_step=3206.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  62%|██████▏   | 748/1208 [21:30<13:13,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=3206.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  62%|██████▏   | 749/1208 [21:31<13:11,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=3206.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  62%|██████▏   | 749/1208 [21:31<13:11,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.00091, train/loss_step=0.226, global_step=3207.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  62%|██████▏   | 750/1208 [21:32<13:09,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.00091, train/loss_step=0.226, global_step=3207.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  62%|██████▏   | 750/1208 [21:32<13:09,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=5.07e-5, train/loss_step=0.0106, global_step=3207.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  62%|██████▏   | 751/1208 [21:33<13:07,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=5.07e-5, train/loss_step=0.0106, global_step=3207.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  62%|██████▏   | 751/1208 [21:33<13:07,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.528, train/loss_vlb_step=0.0106, train/loss_step=0.528, global_step=3207.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  62%|██████▏   | 752/1208 [21:36<13:06,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.528, train/loss_vlb_step=0.0106, train/loss_step=0.528, global_step=3207.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  62%|██████▏   | 752/1208 [21:36<13:06,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0801, train/loss_vlb_step=0.000268, train/loss_step=0.0801, global_step=3207.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  62%|██████▏   | 753/1208 [21:37<13:04,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0801, train/loss_vlb_step=0.000268, train/loss_step=0.0801, global_step=3207.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  62%|██████▏   | 753/1208 [21:37<13:04,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.75e-5, train/loss_step=0.00304, global_step=3208.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  62%|██████▏   | 754/1208 [21:38<13:01,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.75e-5, train/loss_step=0.00304, global_step=3208.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  62%|██████▏   | 754/1208 [21:38<13:01,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000747, train/loss_step=0.204, global_step=3208.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  62%|██████▎   | 755/1208 [21:39<12:59,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000747, train/loss_step=0.204, global_step=3208.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  62%|██████▎   | 755/1208 [21:39<12:59,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.25e-5, train/loss_step=0.0143, global_step=3208.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  63%|██████▎   | 756/1208 [21:42<12:59,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.25e-5, train/loss_step=0.0143, global_step=3208.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  63%|██████▎   | 756/1208 [21:42<12:59,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000111, train/loss_step=0.0273, global_step=3208.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  63%|██████▎   | 757/1208 [21:44<12:56,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000111, train/loss_step=0.0273, global_step=3208.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  63%|██████▎   | 757/1208 [21:44<12:56,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=8.42e-5, train/loss_step=0.0204, global_step=3209.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  63%|██████▎   | 758/1208 [21:45<12:54,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=8.42e-5, train/loss_step=0.0204, global_step=3209.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  63%|██████▎   | 758/1208 [21:45<12:54,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000596, train/loss_step=0.172, global_step=3209.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  63%|██████▎   | 759/1208 [21:46<12:52,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000596, train/loss_step=0.172, global_step=3209.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  63%|██████▎   | 759/1208 [21:46<12:52,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000922, train/loss_step=0.242, global_step=3209.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  63%|██████▎   | 760/1208 [21:49<12:51,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000922, train/loss_step=0.242, global_step=3209.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  63%|██████▎   | 760/1208 [21:49<12:51,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0465, train/loss_vlb_step=0.00016, train/loss_step=0.0465, global_step=3209.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  63%|██████▎   | 761/1208 [21:50<12:49,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0465, train/loss_vlb_step=0.00016, train/loss_step=0.0465, global_step=3209.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  63%|██████▎   | 761/1208 [21:50<12:49,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.81e-5, train/loss_step=0.024, global_step=3210.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  63%|██████▎   | 762/1208 [21:51<12:47,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.81e-5, train/loss_step=0.024, global_step=3210.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  63%|██████▎   | 762/1208 [21:51<12:47,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.708, train/loss_vlb_step=0.0455, train/loss_step=0.708, global_step=3210.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  63%|██████▎   | 763/1208 [21:52<12:45,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.708, train/loss_vlb_step=0.0455, train/loss_step=0.708, global_step=3210.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  63%|██████▎   | 763/1208 [21:52<12:45,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.25e-5, train/loss_step=0.023, global_step=3210.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  63%|██████▎   | 764/1208 [21:55<12:44,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.25e-5, train/loss_step=0.023, global_step=3210.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  63%|██████▎   | 764/1208 [21:55<12:44,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000143, train/loss_step=0.0388, global_step=3210.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  63%|██████▎   | 765/1208 [21:56<12:42,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000143, train/loss_step=0.0388, global_step=3210.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  63%|██████▎   | 765/1208 [21:56<12:42,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.044, train/loss_vlb_step=0.000168, train/loss_step=0.044, global_step=3211.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  63%|██████▎   | 766/1208 [21:57<12:40,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.044, train/loss_vlb_step=0.000168, train/loss_step=0.044, global_step=3211.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  63%|██████▎   | 766/1208 [21:57<12:40,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0065, train/loss_vlb_step=3.3e-5, train/loss_step=0.0065, global_step=3211.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  63%|██████▎   | 767/1208 [21:58<12:38,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0065, train/loss_vlb_step=3.3e-5, train/loss_step=0.0065, global_step=3211.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  63%|██████▎   | 767/1208 [21:58<12:38,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00404, train/loss_vlb_step=2.16e-5, train/loss_step=0.00404, global_step=3211.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  64%|██████▎   | 768/1208 [22:02<12:37,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00404, train/loss_vlb_step=2.16e-5, train/loss_step=0.00404, global_step=3211.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  64%|██████▎   | 768/1208 [22:02<12:37,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00816, train/loss_vlb_step=3.78e-5, train/loss_step=0.00816, global_step=3211.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  64%|██████▎   | 769/1208 [22:03<12:35,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00816, train/loss_vlb_step=3.78e-5, train/loss_step=0.00816, global_step=3211.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  64%|██████▎   | 769/1208 [22:03<12:35,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000533, train/loss_step=0.156, global_step=3212.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  64%|██████▎   | 770/1208 [22:04<12:33,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000533, train/loss_step=0.156, global_step=3212.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  64%|██████▎   | 770/1208 [22:04<12:33,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00684, train/loss_vlb_step=3.39e-5, train/loss_step=0.00684, global_step=3212.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  64%|██████▍   | 771/1208 [22:05<12:31,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00684, train/loss_vlb_step=3.39e-5, train/loss_step=0.00684, global_step=3212.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  64%|██████▍   | 771/1208 [22:05<12:31,  1.72s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=8.98e-6, train/loss_step=0.00147, global_step=3212.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  64%|██████▍   | 772/1208 [22:08<12:30,  1.72s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=8.98e-6, train/loss_step=0.00147, global_step=3212.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  64%|██████▍   | 772/1208 [22:08<12:30,  1.72s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.0431, train/loss_vlb_step=0.000156, train/loss_step=0.0431, global_step=3212.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  64%|██████▍   | 773/1208 [22:09<12:28,  1.72s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.0431, train/loss_vlb_step=0.000156, train/loss_step=0.0431, global_step=3212.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  64%|██████▍   | 773/1208 [22:09<12:28,  1.72s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000385, train/loss_step=0.116, global_step=3213.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  64%|██████▍   | 774/1208 [22:10<12:26,  1.72s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000385, train/loss_step=0.116, global_step=3213.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  64%|██████▍   | 774/1208 [22:10<12:26,  1.72s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.00038, train/loss_step=0.116, global_step=3213.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  64%|██████▍   | 775/1208 [22:11<12:24,  1.72s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.00038, train/loss_step=0.116, global_step=3213.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  64%|██████▍   | 775/1208 [22:11<12:24,  1.72s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.0907, train/loss_vlb_step=0.000299, train/loss_step=0.0907, global_step=3213.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  64%|██████▍   | 776/1208 [22:15<12:23,  1.72s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.0907, train/loss_vlb_step=0.000299, train/loss_step=0.0907, global_step=3213.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  64%|██████▍   | 776/1208 [22:15<12:23,  1.72s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.00654, train/loss_vlb_step=3.31e-5, train/loss_step=0.00654, global_step=3213.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  64%|██████▍   | 777/1208 [22:16<12:21,  1.72s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.00654, train/loss_vlb_step=3.31e-5, train/loss_step=0.00654, global_step=3213.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  64%|██████▍   | 777/1208 [22:16<12:21,  1.72s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000145, train/loss_step=0.0388, global_step=3214.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  64%|██████▍   | 778/1208 [22:17<12:19,  1.72s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000145, train/loss_step=0.0388, global_step=3214.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  64%|██████▍   | 778/1208 [22:17<12:19,  1.72s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.00157, train/loss_vlb_step=9.56e-6, train/loss_step=0.00157, global_step=3214.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  64%|██████▍   | 779/1208 [22:18<12:16,  1.72s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.00157, train/loss_vlb_step=9.56e-6, train/loss_step=0.00157, global_step=3214.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  64%|██████▍   | 779/1208 [22:18<12:16,  1.72s/it, loss=0.0746, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.25e-5, train/loss_step=0.0115, global_step=3214.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  65%|██████▍   | 780/1208 [22:21<12:16,  1.72s/it, loss=0.0746, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.25e-5, train/loss_step=0.0115, global_step=3214.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  65%|██████▍   | 780/1208 [22:21<12:16,  1.72s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000902, train/loss_step=0.241, global_step=3214.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  65%|██████▍   | 781/1208 [22:22<12:14,  1.72s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000902, train/loss_step=0.241, global_step=3214.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  65%|██████▍   | 781/1208 [22:22<12:14,  1.72s/it, loss=0.0844, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000111, train/loss_step=0.0269, global_step=3215.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  65%|██████▍   | 782/1208 [22:23<12:11,  1.72s/it, loss=0.0844, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000111, train/loss_step=0.0269, global_step=3215.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  65%|██████▍   | 782/1208 [22:23<12:11,  1.72s/it, loss=0.0492, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.17e-5, train/loss_step=0.00199, global_step=3215.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  65%|██████▍   | 783/1208 [22:24<12:09,  1.72s/it, loss=0.0492, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.17e-5, train/loss_step=0.00199, global_step=3215.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  65%|██████▍   | 783/1208 [22:24<12:09,  1.72s/it, loss=0.0527, v_num=0, train/loss_simple_step=0.094, train/loss_vlb_step=0.000309, train/loss_step=0.094, global_step=3215.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  65%|██████▍   | 784/1208 [22:27<12:08,  1.72s/it, loss=0.0527, v_num=0, train/loss_simple_step=0.094, train/loss_vlb_step=0.000309, train/loss_step=0.094, global_step=3215.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  65%|██████▍   | 784/1208 [22:27<12:08,  1.72s/it, loss=0.0619, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000862, train/loss_step=0.223, global_step=3215.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  65%|██████▍   | 785/1208 [22:29<12:06,  1.72s/it, loss=0.0619, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000862, train/loss_step=0.223, global_step=3215.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  65%|██████▍   | 785/1208 [22:29<12:06,  1.72s/it, loss=0.0697, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000729, train/loss_step=0.201, global_step=3216.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  65%|██████▌   | 786/1208 [22:30<12:04,  1.72s/it, loss=0.0697, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000729, train/loss_step=0.201, global_step=3216.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  65%|██████▌   | 786/1208 [22:30<12:04,  1.72s/it, loss=0.0732, v_num=0, train/loss_simple_step=0.0749, train/loss_vlb_step=0.000256, train/loss_step=0.0749, global_step=3216.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  65%|██████▌   | 787/1208 [22:31<12:02,  1.72s/it, loss=0.0732, v_num=0, train/loss_simple_step=0.0749, train/loss_vlb_step=0.000256, train/loss_step=0.0749, global_step=3216.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  65%|██████▌   | 787/1208 [22:31<12:02,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.754, train/loss_vlb_step=0.0432, train/loss_step=0.754, global_step=3216.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 10:  65%|██████▌   | 788/1208 [22:34<12:01,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.754, train/loss_vlb_step=0.0432, train/loss_step=0.754, global_step=3216.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  65%|██████▌   | 788/1208 [22:34<12:01,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00108, train/loss_step=0.274, global_step=3216.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  65%|██████▌   | 789/1208 [22:35<11:59,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00108, train/loss_step=0.274, global_step=3216.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  65%|██████▌   | 789/1208 [22:35<11:59,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.91e-5, train/loss_step=0.0153, global_step=3217.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  65%|██████▌   | 790/1208 [22:36<11:57,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.91e-5, train/loss_step=0.0153, global_step=3217.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  65%|██████▌   | 790/1208 [22:36<11:57,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0551, train/loss_vlb_step=0.000193, train/loss_step=0.0551, global_step=3217.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  65%|██████▌   | 791/1208 [22:37<11:55,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0551, train/loss_vlb_step=0.000193, train/loss_step=0.0551, global_step=3217.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  65%|██████▌   | 791/1208 [22:37<11:55,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.002, train/loss_step=0.378, global_step=3217.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 10:  66%|██████▌   | 792/1208 [22:40<11:54,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.002, train/loss_step=0.378, global_step=3217.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  66%|██████▌   | 792/1208 [22:40<11:54,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00183, train/loss_step=0.344, global_step=3217.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  66%|██████▌   | 793/1208 [22:41<11:52,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00183, train/loss_step=0.344, global_step=3217.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  66%|██████▌   | 793/1208 [22:41<11:52,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000483, train/loss_step=0.146, global_step=3218.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  66%|██████▌   | 794/1208 [22:42<11:50,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000483, train/loss_step=0.146, global_step=3218.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  66%|██████▌   | 794/1208 [22:42<11:50,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000841, train/loss_step=0.216, global_step=3218.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  66%|██████▌   | 795/1208 [22:43<11:48,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000841, train/loss_step=0.216, global_step=3218.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  66%|██████▌   | 795/1208 [22:43<11:48,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0494, train/loss_vlb_step=0.000176, train/loss_step=0.0494, global_step=3218.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  66%|██████▌   | 796/1208 [22:47<11:47,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0494, train/loss_vlb_step=0.000176, train/loss_step=0.0494, global_step=3218.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  66%|██████▌   | 796/1208 [22:47<11:47,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00236, train/loss_step=0.380, global_step=3218.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  66%|██████▌   | 797/1208 [22:48<11:45,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00236, train/loss_step=0.380, global_step=3218.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  66%|██████▌   | 797/1208 [22:48<11:45,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0434, train/loss_vlb_step=0.000161, train/loss_step=0.0434, global_step=3219.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  66%|██████▌   | 798/1208 [22:49<11:43,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0434, train/loss_vlb_step=0.000161, train/loss_step=0.0434, global_step=3219.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  66%|██████▌   | 798/1208 [22:49<11:43,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0436, train/loss_vlb_step=0.000156, train/loss_step=0.0436, global_step=3219.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  66%|██████▌   | 799/1208 [22:50<11:41,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0436, train/loss_vlb_step=0.000156, train/loss_step=0.0436, global_step=3219.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  66%|██████▌   | 799/1208 [22:50<11:41,  1.71s/it, loss=0.201, v_num=0, train/loss_simple_step=0.469, train/loss_vlb_step=0.00488, train/loss_step=0.469, global_step=3219.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  66%|██████▌   | 800/1208 [22:53<11:40,  1.72s/it, loss=0.201, v_num=0, train/loss_simple_step=0.469, train/loss_vlb_step=0.00488, train/loss_step=0.469, global_step=3219.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  66%|██████▌   | 800/1208 [22:53<11:40,  1.72s/it, loss=0.205, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00159, train/loss_step=0.310, global_step=3219.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  66%|██████▋   | 801/1208 [22:54<11:38,  1.72s/it, loss=0.205, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00159, train/loss_step=0.310, global_step=3219.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  66%|██████▋   | 801/1208 [22:54<11:38,  1.72s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0822, train/loss_vlb_step=0.000277, train/loss_step=0.0822, global_step=3220.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  66%|██████▋   | 802/1208 [22:55<11:36,  1.72s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0822, train/loss_vlb_step=0.000277, train/loss_step=0.0822, global_step=3220.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  66%|██████▋   | 802/1208 [22:55<11:36,  1.72s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0688, train/loss_vlb_step=0.000234, train/loss_step=0.0688, global_step=3220.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  66%|██████▋   | 803/1208 [22:56<11:34,  1.71s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0688, train/loss_vlb_step=0.000234, train/loss_step=0.0688, global_step=3220.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  66%|██████▋   | 803/1208 [22:56<11:34,  1.71s/it, loss=0.232, v_num=0, train/loss_simple_step=0.511, train/loss_vlb_step=0.00574, train/loss_step=0.511, global_step=3220.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  67%|██████▋   | 804/1208 [22:59<11:33,  1.72s/it, loss=0.232, v_num=0, train/loss_simple_step=0.511, train/loss_vlb_step=0.00574, train/loss_step=0.511, global_step=3220.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  67%|██████▋   | 804/1208 [22:59<11:33,  1.72s/it, loss=0.226, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=3220.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  67%|██████▋   | 805/1208 [23:00<11:31,  1.72s/it, loss=0.226, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=3220.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  67%|██████▋   | 805/1208 [23:00<11:31,  1.72s/it, loss=0.216, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.19e-5, train/loss_step=0.00198, global_step=3221.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  67%|██████▋   | 806/1208 [23:02<11:29,  1.71s/it, loss=0.216, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.19e-5, train/loss_step=0.00198, global_step=3221.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  67%|██████▋   | 806/1208 [23:02<11:29,  1.71s/it, loss=0.222, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000759, train/loss_step=0.198, global_step=3221.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  67%|██████▋   | 807/1208 [23:03<11:27,  1.71s/it, loss=0.222, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000759, train/loss_step=0.198, global_step=3221.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  67%|██████▋   | 807/1208 [23:03<11:27,  1.71s/it, loss=0.201, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.0019, train/loss_step=0.319, global_step=3221.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  67%|██████▋   | 808/1208 [23:06<11:26,  1.72s/it, loss=0.201, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.0019, train/loss_step=0.319, global_step=3221.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  67%|██████▋   | 808/1208 [23:06<11:26,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.98e-5, train/loss_step=0.0107, global_step=3221.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  67%|██████▋   | 809/1208 [23:07<11:24,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.98e-5, train/loss_step=0.0107, global_step=3221.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  67%|██████▋   | 809/1208 [23:07<11:24,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000357, train/loss_step=0.109, global_step=3222.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  67%|██████▋   | 810/1208 [23:08<11:22,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000357, train/loss_step=0.109, global_step=3222.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  67%|██████▋   | 810/1208 [23:08<11:22,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.46e-5, train/loss_step=0.0178, global_step=3222.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  67%|██████▋   | 811/1208 [23:09<11:20,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.46e-5, train/loss_step=0.0178, global_step=3222.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  67%|██████▋   | 811/1208 [23:09<11:20,  1.71s/it, loss=0.187, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00229, train/loss_step=0.305, global_step=3222.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  67%|██████▋   | 812/1208 [23:12<11:19,  1.72s/it, loss=0.187, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00229, train/loss_step=0.305, global_step=3222.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  67%|██████▋   | 812/1208 [23:12<11:19,  1.72s/it, loss=0.199, v_num=0, train/loss_simple_step=0.593, train/loss_vlb_step=0.00899, train/loss_step=0.593, global_step=3222.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  67%|██████▋   | 813/1208 [23:13<11:17,  1.71s/it, loss=0.199, v_num=0, train/loss_simple_step=0.593, train/loss_vlb_step=0.00899, train/loss_step=0.593, global_step=3222.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  67%|██████▋   | 813/1208 [23:13<11:17,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.25e-5, train/loss_step=0.00423, global_step=3223.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  67%|██████▋   | 814/1208 [23:14<11:15,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.25e-5, train/loss_step=0.00423, global_step=3223.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  67%|██████▋   | 814/1208 [23:14<11:15,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=1.99e-5, train/loss_step=0.00362, global_step=3223.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  67%|██████▋   | 815/1208 [23:15<11:13,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=1.99e-5, train/loss_step=0.00362, global_step=3223.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  67%|██████▋   | 815/1208 [23:15<11:13,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000626, train/loss_step=0.178, global_step=3223.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  68%|██████▊   | 816/1208 [23:19<11:12,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000626, train/loss_step=0.178, global_step=3223.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  68%|██████▊   | 816/1208 [23:19<11:12,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00528, train/loss_vlb_step=2.62e-5, train/loss_step=0.00528, global_step=3223.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  68%|██████▊   | 817/1208 [23:20<11:10,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00528, train/loss_vlb_step=2.62e-5, train/loss_step=0.00528, global_step=3223.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  68%|██████▊   | 817/1208 [23:20<11:10,  1.71s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0768, train/loss_vlb_step=0.00026, train/loss_step=0.0768, global_step=3224.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  68%|██████▊   | 818/1208 [23:21<11:08,  1.71s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0768, train/loss_vlb_step=0.00026, train/loss_step=0.0768, global_step=3224.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  68%|██████▊   | 818/1208 [23:21<11:08,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000884, train/loss_step=0.223, global_step=3224.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  68%|██████▊   | 819/1208 [23:22<11:05,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000884, train/loss_step=0.223, global_step=3224.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  68%|██████▊   | 819/1208 [23:22<11:05,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.00041, train/loss_step=0.125, global_step=3224.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  68%|██████▊   | 820/1208 [23:25<11:05,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.00041, train/loss_step=0.125, global_step=3224.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  68%|██████▊   | 820/1208 [23:25<11:05,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0054, train/loss_vlb_step=2.89e-5, train/loss_step=0.0054, global_step=3224.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  68%|██████▊   | 821/1208 [23:26<11:02,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0054, train/loss_vlb_step=2.89e-5, train/loss_step=0.0054, global_step=3224.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  68%|██████▊   | 821/1208 [23:26<11:02,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00101, train/loss_step=0.257, global_step=3225.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  68%|██████▊   | 822/1208 [23:27<11:00,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00101, train/loss_step=0.257, global_step=3225.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  68%|██████▊   | 822/1208 [23:27<11:00,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.00096, train/loss_step=0.238, global_step=3225.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  68%|██████▊   | 823/1208 [23:28<10:58,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.00096, train/loss_step=0.238, global_step=3225.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  68%|██████▊   | 823/1208 [23:28<10:58,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.568, train/loss_vlb_step=0.00929, train/loss_step=0.568, global_step=3225.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  68%|██████▊   | 824/1208 [23:31<10:57,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.568, train/loss_vlb_step=0.00929, train/loss_step=0.568, global_step=3225.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  68%|██████▊   | 824/1208 [23:31<10:57,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000123, train/loss_step=0.0314, global_step=3225.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  68%|██████▊   | 825/1208 [23:32<10:55,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000123, train/loss_step=0.0314, global_step=3225.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  68%|██████▊   | 825/1208 [23:32<10:55,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000671, train/loss_step=0.195, global_step=3226.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  68%|██████▊   | 826/1208 [23:33<10:53,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000671, train/loss_step=0.195, global_step=3226.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  68%|██████▊   | 826/1208 [23:33<10:53,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0748, train/loss_vlb_step=0.000252, train/loss_step=0.0748, global_step=3226.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  68%|██████▊   | 827/1208 [23:34<10:51,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0748, train/loss_vlb_step=0.000252, train/loss_step=0.0748, global_step=3226.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  68%|██████▊   | 827/1208 [23:34<10:51,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0703, train/loss_vlb_step=0.00024, train/loss_step=0.0703, global_step=3226.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  69%|██████▊   | 828/1208 [23:38<10:50,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0703, train/loss_vlb_step=0.00024, train/loss_step=0.0703, global_step=3226.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  69%|██████▊   | 828/1208 [23:38<10:50,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000553, train/loss_step=0.162, global_step=3226.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  69%|██████▊   | 829/1208 [23:39<10:48,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000553, train/loss_step=0.162, global_step=3226.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  69%|██████▊   | 829/1208 [23:39<10:48,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000927, train/loss_step=0.240, global_step=3227.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  69%|██████▊   | 830/1208 [23:40<10:46,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000927, train/loss_step=0.240, global_step=3227.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  69%|██████▊   | 830/1208 [23:40<10:46,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.000965, train/loss_step=0.249, global_step=3227.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  69%|██████▉   | 831/1208 [23:41<10:44,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.000965, train/loss_step=0.249, global_step=3227.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  69%|██████▉   | 831/1208 [23:41<10:44,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000615, train/loss_step=0.168, global_step=3227.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  69%|██████▉   | 832/1208 [23:44<10:43,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000615, train/loss_step=0.168, global_step=3227.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  69%|██████▉   | 832/1208 [23:44<10:43,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00709, train/loss_vlb_step=3.48e-5, train/loss_step=0.00709, global_step=3227.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  69%|██████▉   | 833/1208 [23:45<10:41,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00709, train/loss_vlb_step=3.48e-5, train/loss_step=0.00709, global_step=3227.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  69%|██████▉   | 833/1208 [23:45<10:41,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000407, train/loss_step=0.124, global_step=3228.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  69%|██████▉   | 834/1208 [23:46<10:39,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000407, train/loss_step=0.124, global_step=3228.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  69%|██████▉   | 834/1208 [23:46<10:39,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000509, train/loss_step=0.149, global_step=3228.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  69%|██████▉   | 835/1208 [23:47<10:37,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000509, train/loss_step=0.149, global_step=3228.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  69%|██████▉   | 835/1208 [23:47<10:37,  1.71s/it, loss=0.187, v_num=0, train/loss_simple_step=0.766, train/loss_vlb_step=0.0653, train/loss_step=0.766, global_step=3228.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  69%|██████▉   | 836/1208 [23:51<10:36,  1.71s/it, loss=0.187, v_num=0, train/loss_simple_step=0.766, train/loss_vlb_step=0.0653, train/loss_step=0.766, global_step=3228.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  69%|██████▉   | 836/1208 [23:51<10:36,  1.71s/it, loss=0.206, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00336, train/loss_step=0.396, global_step=3228.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  69%|██████▉   | 837/1208 [23:52<10:34,  1.71s/it, loss=0.206, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00336, train/loss_step=0.396, global_step=3228.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  69%|██████▉   | 837/1208 [23:52<10:34,  1.71s/it, loss=0.203, v_num=0, train/loss_simple_step=0.00696, train/loss_vlb_step=3.43e-5, train/loss_step=0.00696, global_step=3229.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  69%|██████▉   | 838/1208 [23:53<10:32,  1.71s/it, loss=0.203, v_num=0, train/loss_simple_step=0.00696, train/loss_vlb_step=3.43e-5, train/loss_step=0.00696, global_step=3229.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  69%|██████▉   | 838/1208 [23:53<10:32,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00508, train/loss_vlb_step=2.51e-5, train/loss_step=0.00508, global_step=3229.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  69%|██████▉   | 839/1208 [23:54<10:30,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00508, train/loss_vlb_step=2.51e-5, train/loss_step=0.00508, global_step=3229.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  69%|██████▉   | 839/1208 [23:54<10:30,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0602, train/loss_vlb_step=0.000206, train/loss_step=0.0602, global_step=3229.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  70%|██████▉   | 840/1208 [23:57<10:29,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0602, train/loss_vlb_step=0.000206, train/loss_step=0.0602, global_step=3229.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  70%|██████▉   | 840/1208 [23:57<10:29,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00943, train/loss_vlb_step=4.45e-5, train/loss_step=0.00943, global_step=3229.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  70%|██████▉   | 841/1208 [23:58<10:27,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00943, train/loss_vlb_step=4.45e-5, train/loss_step=0.00943, global_step=3229.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  70%|██████▉   | 841/1208 [23:58<10:27,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=1.08e-5, train/loss_step=0.0018, global_step=3230.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  70%|██████▉   | 842/1208 [23:59<10:25,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=1.08e-5, train/loss_step=0.0018, global_step=3230.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  70%|██████▉   | 842/1208 [23:59<10:25,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000761, train/loss_step=0.205, global_step=3230.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  70%|██████▉   | 843/1208 [24:00<10:23,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000761, train/loss_step=0.205, global_step=3230.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  70%|██████▉   | 843/1208 [24:00<10:23,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0833, train/loss_vlb_step=0.000278, train/loss_step=0.0833, global_step=3230.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  70%|██████▉   | 844/1208 [24:04<10:22,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0833, train/loss_vlb_step=0.000278, train/loss_step=0.0833, global_step=3230.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  70%|██████▉   | 844/1208 [24:04<10:22,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00364, train/loss_vlb_step=2.07e-5, train/loss_step=0.00364, global_step=3230.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  70%|██████▉   | 845/1208 [24:05<10:20,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00364, train/loss_vlb_step=2.07e-5, train/loss_step=0.00364, global_step=3230.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  70%|██████▉   | 845/1208 [24:05<10:20,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000781, train/loss_step=0.215, global_step=3231.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  70%|███████   | 846/1208 [24:06<10:18,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000781, train/loss_step=0.215, global_step=3231.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  70%|███████   | 846/1208 [24:06<10:18,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00106, train/loss_step=0.267, global_step=3231.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  70%|███████   | 847/1208 [24:07<10:16,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00106, train/loss_step=0.267, global_step=3231.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  70%|███████   | 847/1208 [24:07<10:16,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00133, train/loss_step=0.281, global_step=3231.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  70%|███████   | 848/1208 [24:10<10:15,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00133, train/loss_step=0.281, global_step=3231.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  70%|███████   | 848/1208 [24:10<10:15,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0404, train/loss_vlb_step=0.000144, train/loss_step=0.0404, global_step=3231.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  70%|███████   | 849/1208 [24:11<10:13,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0404, train/loss_vlb_step=0.000144, train/loss_step=0.0404, global_step=3231.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  70%|███████   | 849/1208 [24:11<10:13,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.000185, train/loss_step=0.0521, global_step=3232.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  70%|███████   | 850/1208 [24:12<10:11,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.000185, train/loss_step=0.0521, global_step=3232.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  70%|███████   | 850/1208 [24:12<10:11,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00169, train/loss_step=0.316, global_step=3232.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  70%|███████   | 851/1208 [24:13<10:09,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00169, train/loss_step=0.316, global_step=3232.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  70%|███████   | 851/1208 [24:13<10:09,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=3232.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  71%|███████   | 852/1208 [24:16<10:08,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=3232.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  71%|███████   | 852/1208 [24:16<10:08,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00229, train/loss_step=0.380, global_step=3232.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  71%|███████   | 853/1208 [24:17<10:06,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00229, train/loss_step=0.380, global_step=3232.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  71%|███████   | 853/1208 [24:17<10:06,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000154, train/loss_step=0.0409, global_step=3233.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  71%|███████   | 854/1208 [24:18<10:04,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000154, train/loss_step=0.0409, global_step=3233.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  71%|███████   | 854/1208 [24:18<10:04,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0739, train/loss_vlb_step=0.000243, train/loss_step=0.0739, global_step=3233.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  71%|███████   | 855/1208 [24:19<10:02,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0739, train/loss_vlb_step=0.000243, train/loss_step=0.0739, global_step=3233.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  71%|███████   | 855/1208 [24:19<10:02,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.91e-5, train/loss_step=0.0246, global_step=3233.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  71%|███████   | 856/1208 [24:23<10:01,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.91e-5, train/loss_step=0.0246, global_step=3233.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  71%|███████   | 856/1208 [24:23<10:01,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.554, train/loss_vlb_step=0.0116, train/loss_step=0.554, global_step=3233.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  71%|███████   | 857/1208 [24:24<09:59,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.554, train/loss_vlb_step=0.0116, train/loss_step=0.554, global_step=3233.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  71%|███████   | 857/1208 [24:24<09:59,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.000943, train/loss_step=0.254, global_step=3234.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  71%|███████   | 858/1208 [24:25<09:57,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.000943, train/loss_step=0.254, global_step=3234.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  71%|███████   | 858/1208 [24:25<09:57,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000789, train/loss_step=0.202, global_step=3234.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  71%|███████   | 859/1208 [24:26<09:55,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000789, train/loss_step=0.202, global_step=3234.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  71%|███████   | 859/1208 [24:26<09:55,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.94e-5, train/loss_step=0.016, global_step=3234.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  71%|███████   | 860/1208 [24:29<09:54,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.94e-5, train/loss_step=0.016, global_step=3234.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  71%|███████   | 860/1208 [24:29<09:54,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.00015, train/loss_step=0.0402, global_step=3234.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  71%|███████▏  | 861/1208 [24:30<09:52,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.00015, train/loss_step=0.0402, global_step=3234.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  71%|███████▏  | 861/1208 [24:30<09:52,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.92e-5, train/loss_step=0.00351, global_step=3235.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  71%|███████▏  | 862/1208 [24:31<09:50,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.92e-5, train/loss_step=0.00351, global_step=3235.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  71%|███████▏  | 862/1208 [24:31<09:50,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0795, train/loss_vlb_step=0.000268, train/loss_step=0.0795, global_step=3235.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  71%|███████▏  | 863/1208 [24:32<09:48,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0795, train/loss_vlb_step=0.000268, train/loss_step=0.0795, global_step=3235.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  71%|███████▏  | 863/1208 [24:32<09:48,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000112, train/loss_step=0.0284, global_step=3235.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  72%|███████▏  | 864/1208 [24:35<09:47,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000112, train/loss_step=0.0284, global_step=3235.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  72%|███████▏  | 864/1208 [24:35<09:47,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00922, train/loss_vlb_step=4.43e-5, train/loss_step=0.00922, global_step=3235.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  72%|███████▏  | 865/1208 [24:37<09:45,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00922, train/loss_vlb_step=4.43e-5, train/loss_step=0.00922, global_step=3235.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  72%|███████▏  | 865/1208 [24:37<09:45,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0772, train/loss_vlb_step=0.000256, train/loss_step=0.0772, global_step=3236.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  72%|███████▏  | 866/1208 [24:38<09:43,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0772, train/loss_vlb_step=0.000256, train/loss_step=0.0772, global_step=3236.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  72%|███████▏  | 866/1208 [24:38<09:43,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00124, train/loss_step=0.304, global_step=3236.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  72%|███████▏  | 867/1208 [24:39<09:41,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00124, train/loss_step=0.304, global_step=3236.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  72%|███████▏  | 867/1208 [24:39<09:41,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00122, train/loss_step=0.282, global_step=3236.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  72%|███████▏  | 868/1208 [24:42<09:40,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00122, train/loss_step=0.282, global_step=3236.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  72%|███████▏  | 868/1208 [24:42<09:40,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000855, train/loss_step=0.212, global_step=3236.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  72%|███████▏  | 869/1208 [24:43<09:38,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000855, train/loss_step=0.212, global_step=3236.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  72%|███████▏  | 869/1208 [24:43<09:38,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=9.86e-5, train/loss_step=0.026, global_step=3237.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  72%|███████▏  | 870/1208 [24:44<09:36,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=9.86e-5, train/loss_step=0.026, global_step=3237.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  72%|███████▏  | 870/1208 [24:44<09:36,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=5.96e-5, train/loss_step=0.0137, global_step=3237.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  72%|███████▏  | 871/1208 [24:45<09:34,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=5.96e-5, train/loss_step=0.0137, global_step=3237.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  72%|███████▏  | 871/1208 [24:45<09:34,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0689, train/loss_vlb_step=0.000235, train/loss_step=0.0689, global_step=3237.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  72%|███████▏  | 872/1208 [24:48<09:33,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0689, train/loss_vlb_step=0.000235, train/loss_step=0.0689, global_step=3237.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  72%|███████▏  | 872/1208 [24:48<09:33,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.79e-5, train/loss_step=0.0032, global_step=3237.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  72%|███████▏  | 873/1208 [24:49<09:31,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.79e-5, train/loss_step=0.0032, global_step=3237.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  72%|███████▏  | 873/1208 [24:49<09:31,  1.71s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.22e-5, train/loss_step=0.00207, global_step=3238.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  72%|███████▏  | 874/1208 [24:50<09:29,  1.71s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.22e-5, train/loss_step=0.00207, global_step=3238.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  72%|███████▏  | 874/1208 [24:50<09:29,  1.71s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0366, train/loss_vlb_step=0.000131, train/loss_step=0.0366, global_step=3238.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  72%|███████▏  | 875/1208 [24:51<09:27,  1.71s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0366, train/loss_vlb_step=0.000131, train/loss_step=0.0366, global_step=3238.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  72%|███████▏  | 875/1208 [24:51<09:27,  1.71s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.62e-5, train/loss_step=0.0102, global_step=3238.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  73%|███████▎  | 876/1208 [24:55<09:26,  1.71s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.62e-5, train/loss_step=0.0102, global_step=3238.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  73%|███████▎  | 876/1208 [24:55<09:26,  1.71s/it, loss=0.0839, v_num=0, train/loss_simple_step=0.0088, train/loss_vlb_step=4.19e-5, train/loss_step=0.0088, global_step=3238.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  73%|███████▎  | 877/1208 [24:56<09:24,  1.71s/it, loss=0.0839, v_num=0, train/loss_simple_step=0.0088, train/loss_vlb_step=4.19e-5, train/loss_step=0.0088, global_step=3238.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  73%|███████▎  | 877/1208 [24:56<09:24,  1.71s/it, loss=0.0781, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000454, train/loss_step=0.138, global_step=3239.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  73%|███████▎  | 878/1208 [24:57<09:22,  1.71s/it, loss=0.0781, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000454, train/loss_step=0.138, global_step=3239.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  73%|███████▎  | 878/1208 [24:57<09:22,  1.71s/it, loss=0.0706, v_num=0, train/loss_simple_step=0.0511, train/loss_vlb_step=0.00018, train/loss_step=0.0511, global_step=3239.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  73%|███████▎  | 879/1208 [24:58<09:20,  1.70s/it, loss=0.0706, v_num=0, train/loss_simple_step=0.0511, train/loss_vlb_step=0.00018, train/loss_step=0.0511, global_step=3239.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  73%|███████▎  | 879/1208 [24:58<09:20,  1.70s/it, loss=0.0849, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00145, train/loss_step=0.303, global_step=3239.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  73%|███████▎  | 880/1208 [25:01<09:19,  1.71s/it, loss=0.0849, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00145, train/loss_step=0.303, global_step=3239.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  73%|███████▎  | 880/1208 [25:01<09:19,  1.71s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.97e-5, train/loss_step=0.0161, global_step=3239.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  73%|███████▎  | 881/1208 [25:02<09:17,  1.71s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.97e-5, train/loss_step=0.0161, global_step=3239.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  73%|███████▎  | 881/1208 [25:02<09:17,  1.71s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.000154, train/loss_step=0.043, global_step=3240.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  73%|███████▎  | 882/1208 [25:03<09:15,  1.70s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.000154, train/loss_step=0.043, global_step=3240.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  73%|███████▎  | 882/1208 [25:03<09:15,  1.70s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.0802, train/loss_vlb_step=0.000266, train/loss_step=0.0802, global_step=3240.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  73%|███████▎  | 883/1208 [25:04<09:13,  1.70s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.0802, train/loss_vlb_step=0.000266, train/loss_step=0.0802, global_step=3240.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  73%|███████▎  | 883/1208 [25:04<09:13,  1.70s/it, loss=0.0844, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=9.73e-6, train/loss_step=0.00166, global_step=3240.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  73%|███████▎  | 884/1208 [25:08<09:12,  1.71s/it, loss=0.0844, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=9.73e-6, train/loss_step=0.00166, global_step=3240.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  73%|███████▎  | 884/1208 [25:08<09:12,  1.71s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000547, train/loss_step=0.164, global_step=3240.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  73%|███████▎  | 885/1208 [25:09<09:10,  1.71s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000547, train/loss_step=0.164, global_step=3240.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  73%|███████▎  | 885/1208 [25:09<09:10,  1.71s/it, loss=0.092, v_num=0, train/loss_simple_step=0.0742, train/loss_vlb_step=0.00025, train/loss_step=0.0742, global_step=3241.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  73%|███████▎  | 886/1208 [25:10<09:08,  1.70s/it, loss=0.092, v_num=0, train/loss_simple_step=0.0742, train/loss_vlb_step=0.00025, train/loss_step=0.0742, global_step=3241.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  73%|███████▎  | 886/1208 [25:10<09:08,  1.70s/it, loss=0.077, v_num=0, train/loss_simple_step=0.00417, train/loss_vlb_step=2.28e-5, train/loss_step=0.00417, global_step=3241.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  73%|███████▎  | 887/1208 [25:11<09:06,  1.70s/it, loss=0.077, v_num=0, train/loss_simple_step=0.00417, train/loss_vlb_step=2.28e-5, train/loss_step=0.00417, global_step=3241.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  73%|███████▎  | 887/1208 [25:11<09:06,  1.70s/it, loss=0.0807, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00201, train/loss_step=0.356, global_step=3241.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  74%|███████▎  | 888/1208 [25:14<09:05,  1.71s/it, loss=0.0807, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00201, train/loss_step=0.356, global_step=3241.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  74%|███████▎  | 888/1208 [25:14<09:05,  1.71s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.494, train/loss_vlb_step=0.00748, train/loss_step=0.494, global_step=3241.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  74%|███████▎  | 889/1208 [25:15<09:03,  1.70s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.494, train/loss_vlb_step=0.00748, train/loss_step=0.494, global_step=3241.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  74%|███████▎  | 889/1208 [25:15<09:03,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000664, train/loss_step=0.194, global_step=3242.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  74%|███████▎  | 890/1208 [25:16<09:01,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000664, train/loss_step=0.194, global_step=3242.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  74%|███████▎  | 890/1208 [25:16<09:01,  1.70s/it, loss=0.107, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=3242.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  74%|███████▍  | 891/1208 [25:17<08:59,  1.70s/it, loss=0.107, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=3242.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  74%|███████▍  | 891/1208 [25:17<08:59,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.31e-5, train/loss_step=0.0208, global_step=3242.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  74%|███████▍  | 892/1208 [25:20<08:58,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.31e-5, train/loss_step=0.0208, global_step=3242.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  74%|███████▍  | 892/1208 [25:20<08:58,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00386, train/loss_vlb_step=2.14e-5, train/loss_step=0.00386, global_step=3242.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  74%|███████▍  | 893/1208 [25:21<08:56,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00386, train/loss_vlb_step=2.14e-5, train/loss_step=0.00386, global_step=3242.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  74%|███████▍  | 893/1208 [25:21<08:56,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.663, train/loss_vlb_step=0.0186, train/loss_step=0.663, global_step=3243.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 10:  74%|███████▍  | 894/1208 [25:22<08:54,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.663, train/loss_vlb_step=0.0186, train/loss_step=0.663, global_step=3243.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  74%|███████▍  | 894/1208 [25:22<08:54,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=2.04e-5, train/loss_step=0.00368, global_step=3243.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  74%|███████▍  | 895/1208 [25:23<08:52,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=2.04e-5, train/loss_step=0.00368, global_step=3243.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  74%|███████▍  | 895/1208 [25:23<08:52,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00549, train/loss_vlb_step=2.73e-5, train/loss_step=0.00549, global_step=3243.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  74%|███████▍  | 896/1208 [25:27<08:51,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00549, train/loss_vlb_step=2.73e-5, train/loss_step=0.00549, global_step=3243.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  74%|███████▍  | 896/1208 [25:27<08:51,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00158, train/loss_step=0.291, global_step=3243.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 10:  74%|███████▍  | 897/1208 [25:28<08:49,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00158, train/loss_step=0.291, global_step=3243.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  74%|███████▍  | 897/1208 [25:28<08:49,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000404, train/loss_step=0.123, global_step=3244.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  74%|███████▍  | 898/1208 [25:29<08:47,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000404, train/loss_step=0.123, global_step=3244.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  74%|███████▍  | 898/1208 [25:29<08:47,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.33e-5, train/loss_step=0.0144, global_step=3244.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  74%|███████▍  | 899/1208 [25:30<08:46,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.33e-5, train/loss_step=0.0144, global_step=3244.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  74%|███████▍  | 899/1208 [25:30<08:46,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000979, train/loss_step=0.240, global_step=3244.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  75%|███████▍  | 900/1208 [25:33<08:44,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000979, train/loss_step=0.240, global_step=3244.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  75%|███████▍  | 900/1208 [25:33<08:44,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0592, train/loss_vlb_step=0.000209, train/loss_step=0.0592, global_step=3244.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.75it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.83it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.76it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.76it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.76it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.75it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.80it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.75it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 10:  75%|███████▍  | 901/1208 [26:04<08:53,  1.74s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0592, train/loss_vlb_step=0.000209, train/loss_step=0.0592, global_step=3244.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  75%|███████▍  | 901/1208 [26:04<08:53,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000649, train/loss_step=0.181, global_step=3245.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  75%|███████▍  | 902/1208 [26:05<08:51,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000649, train/loss_step=0.181, global_step=3245.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  75%|███████▍  | 902/1208 [26:05<08:51,  1.74s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000104, train/loss_step=0.0279, global_step=3245.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  75%|███████▍  | 903/1208 [26:06<08:49,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000104, train/loss_step=0.0279, global_step=3245.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  75%|███████▍  | 903/1208 [26:06<08:49,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=3245.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  75%|███████▍  | 904/1208 [26:09<08:47,  1.74s/it, loss=0.157, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=3245.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  75%|███████▍  | 904/1208 [26:09<08:47,  1.74s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00873, train/loss_vlb_step=4.24e-5, train/loss_step=0.00873, global_step=3245.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  75%|███████▍  | 905/1208 [26:10<08:45,  1.74s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00873, train/loss_vlb_step=4.24e-5, train/loss_step=0.00873, global_step=3245.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  75%|███████▍  | 905/1208 [26:10<08:45,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.54e-5, train/loss_step=0.00278, global_step=3246.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  75%|███████▌  | 906/1208 [26:11<08:43,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.54e-5, train/loss_step=0.00278, global_step=3246.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  75%|███████▌  | 906/1208 [26:11<08:43,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.95e-5, train/loss_step=0.00342, global_step=3246.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  75%|███████▌  | 907/1208 [26:12<08:41,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.95e-5, train/loss_step=0.00342, global_step=3246.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  75%|███████▌  | 907/1208 [26:12<08:41,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.91e-5, train/loss_step=0.0215, global_step=3246.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  75%|███████▌  | 908/1208 [26:16<08:40,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.91e-5, train/loss_step=0.0215, global_step=3246.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  75%|███████▌  | 908/1208 [26:16<08:40,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000904, train/loss_step=0.221, global_step=3246.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  75%|███████▌  | 909/1208 [26:17<08:38,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000904, train/loss_step=0.221, global_step=3246.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  75%|███████▌  | 909/1208 [26:17<08:38,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000158, train/loss_step=0.0448, global_step=3247.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  75%|███████▌  | 910/1208 [26:18<08:36,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000158, train/loss_step=0.0448, global_step=3247.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  75%|███████▌  | 910/1208 [26:18<08:36,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000751, train/loss_step=0.203, global_step=3247.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  75%|███████▌  | 911/1208 [26:19<08:34,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000751, train/loss_step=0.203, global_step=3247.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  75%|███████▌  | 911/1208 [26:19<08:34,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000613, train/loss_step=0.182, global_step=3247.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  75%|███████▌  | 912/1208 [26:22<08:33,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000613, train/loss_step=0.182, global_step=3247.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  75%|███████▌  | 912/1208 [26:22<08:33,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6.13e-5, train/loss_step=0.0135, global_step=3247.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  76%|███████▌  | 913/1208 [26:23<08:31,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6.13e-5, train/loss_step=0.0135, global_step=3247.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  76%|███████▌  | 913/1208 [26:23<08:31,  1.73s/it, loss=0.0881, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=1.02e-5, train/loss_step=0.0017, global_step=3248.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  76%|███████▌  | 914/1208 [26:24<08:29,  1.73s/it, loss=0.0881, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=1.02e-5, train/loss_step=0.0017, global_step=3248.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  76%|███████▌  | 914/1208 [26:24<08:29,  1.73s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000773, train/loss_step=0.201, global_step=3248.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  76%|███████▌  | 915/1208 [26:25<08:27,  1.73s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000773, train/loss_step=0.201, global_step=3248.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  76%|███████▌  | 915/1208 [26:25<08:27,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.621, train/loss_vlb_step=0.0193, train/loss_step=0.621, global_step=3248.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  76%|███████▌  | 916/1208 [26:28<08:26,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.621, train/loss_vlb_step=0.0193, train/loss_step=0.621, global_step=3248.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  76%|███████▌  | 916/1208 [26:28<08:26,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.2e-5, train/loss_step=0.00197, global_step=3248.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  76%|███████▌  | 917/1208 [26:29<08:24,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.2e-5, train/loss_step=0.00197, global_step=3248.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  76%|███████▌  | 917/1208 [26:29<08:24,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00862, train/loss_vlb_step=4.24e-5, train/loss_step=0.00862, global_step=3249.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  76%|███████▌  | 918/1208 [26:30<08:22,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00862, train/loss_vlb_step=4.24e-5, train/loss_step=0.00862, global_step=3249.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  76%|███████▌  | 918/1208 [26:30<08:22,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000691, train/loss_step=0.187, global_step=3249.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  76%|███████▌  | 919/1208 [26:32<08:20,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000691, train/loss_step=0.187, global_step=3249.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  76%|███████▌  | 919/1208 [26:32<08:20,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00154, train/loss_step=0.280, global_step=3249.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  76%|███████▌  | 920/1208 [26:35<08:19,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00154, train/loss_step=0.280, global_step=3249.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  76%|███████▌  | 920/1208 [26:35<08:19,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000796, train/loss_step=0.200, global_step=3249.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  76%|███████▌  | 921/1208 [26:36<08:17,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000796, train/loss_step=0.200, global_step=3249.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  76%|███████▌  | 921/1208 [26:36<08:17,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.13e-5, train/loss_step=0.0199, global_step=3250.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  76%|███████▋  | 922/1208 [26:37<08:15,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.13e-5, train/loss_step=0.0199, global_step=3250.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  76%|███████▋  | 922/1208 [26:37<08:15,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.02e-5, train/loss_step=0.0138, global_step=3250.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  76%|███████▋  | 923/1208 [26:38<08:13,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.02e-5, train/loss_step=0.0138, global_step=3250.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  76%|███████▋  | 923/1208 [26:38<08:13,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00155, train/loss_step=0.294, global_step=3250.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  76%|███████▋  | 924/1208 [26:41<08:12,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00155, train/loss_step=0.294, global_step=3250.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  76%|███████▋  | 924/1208 [26:41<08:12,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.0014, train/loss_step=0.319, global_step=3250.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  77%|███████▋  | 925/1208 [26:42<08:10,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.0014, train/loss_step=0.319, global_step=3250.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  77%|███████▋  | 925/1208 [26:42<08:10,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.651, train/loss_vlb_step=0.0283, train/loss_step=0.651, global_step=3251.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  77%|███████▋  | 926/1208 [26:43<08:08,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.651, train/loss_vlb_step=0.0283, train/loss_step=0.651, global_step=3251.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  77%|███████▋  | 926/1208 [26:43<08:08,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000377, train/loss_step=0.114, global_step=3251.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  77%|███████▋  | 927/1208 [26:44<08:06,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000377, train/loss_step=0.114, global_step=3251.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  77%|███████▋  | 927/1208 [26:44<08:06,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0087, train/loss_vlb_step=4e-5, train/loss_step=0.0087, global_step=3251.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  77%|███████▋  | 928/1208 [26:48<08:05,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0087, train/loss_vlb_step=4e-5, train/loss_step=0.0087, global_step=3251.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  77%|███████▋  | 928/1208 [26:48<08:05,  1.73s/it, loss=0.188, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.0023, train/loss_step=0.391, global_step=3251.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  77%|███████▋  | 929/1208 [26:49<08:03,  1.73s/it, loss=0.188, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.0023, train/loss_step=0.391, global_step=3251.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  77%|███████▋  | 929/1208 [26:49<08:03,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00734, train/loss_vlb_step=3.53e-5, train/loss_step=0.00734, global_step=3252.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  77%|███████▋  | 930/1208 [26:50<08:01,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00734, train/loss_vlb_step=3.53e-5, train/loss_step=0.00734, global_step=3252.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  77%|███████▋  | 930/1208 [26:50<08:01,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000113, train/loss_step=0.0281, global_step=3252.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  77%|███████▋  | 931/1208 [26:51<07:59,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000113, train/loss_step=0.0281, global_step=3252.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  77%|███████▋  | 931/1208 [26:51<07:59,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=9.36e-6, train/loss_step=0.00156, global_step=3252.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  77%|███████▋  | 932/1208 [26:54<07:58,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=9.36e-6, train/loss_step=0.00156, global_step=3252.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  77%|███████▋  | 932/1208 [26:54<07:58,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00478, train/loss_vlb_step=2.51e-5, train/loss_step=0.00478, global_step=3252.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  77%|███████▋  | 933/1208 [26:55<07:56,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00478, train/loss_vlb_step=2.51e-5, train/loss_step=0.00478, global_step=3252.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  77%|███████▋  | 933/1208 [26:55<07:56,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.000212, train/loss_step=0.0615, global_step=3253.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  77%|███████▋  | 934/1208 [26:56<07:54,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.000212, train/loss_step=0.0615, global_step=3253.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  77%|███████▋  | 934/1208 [26:56<07:54,  1.73s/it, loss=0.176, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00141, train/loss_step=0.300, global_step=3253.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  77%|███████▋  | 935/1208 [26:57<07:52,  1.73s/it, loss=0.176, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00141, train/loss_step=0.300, global_step=3253.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  77%|███████▋  | 935/1208 [26:57<07:52,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0644, train/loss_vlb_step=0.000221, train/loss_step=0.0644, global_step=3253.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  77%|███████▋  | 936/1208 [27:00<07:51,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0644, train/loss_vlb_step=0.000221, train/loss_step=0.0644, global_step=3253.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  77%|███████▋  | 936/1208 [27:00<07:51,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000601, train/loss_step=0.178, global_step=3253.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  78%|███████▊  | 937/1208 [27:01<07:49,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000601, train/loss_step=0.178, global_step=3253.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  78%|███████▊  | 937/1208 [27:01<07:49,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.064, train/loss_vlb_step=0.000218, train/loss_step=0.064, global_step=3254.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  78%|███████▊  | 938/1208 [27:03<07:47,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.064, train/loss_vlb_step=0.000218, train/loss_step=0.064, global_step=3254.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  78%|███████▊  | 938/1208 [27:03<07:47,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0571, train/loss_vlb_step=0.000208, train/loss_step=0.0571, global_step=3254.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  78%|███████▊  | 939/1208 [27:04<07:45,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0571, train/loss_vlb_step=0.000208, train/loss_step=0.0571, global_step=3254.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  78%|███████▊  | 939/1208 [27:04<07:45,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.550, train/loss_vlb_step=0.0111, train/loss_step=0.550, global_step=3254.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  78%|███████▊  | 940/1208 [27:07<07:43,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.550, train/loss_vlb_step=0.0111, train/loss_step=0.550, global_step=3254.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  78%|███████▊  | 940/1208 [27:07<07:43,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000125, train/loss_step=0.0344, global_step=3254.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  78%|███████▊  | 941/1208 [27:08<07:42,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000125, train/loss_step=0.0344, global_step=3254.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  78%|███████▊  | 941/1208 [27:08<07:42,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00376, train/loss_step=0.414, global_step=3255.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  78%|███████▊  | 942/1208 [27:09<07:40,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00376, train/loss_step=0.414, global_step=3255.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  78%|███████▊  | 942/1208 [27:09<07:40,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0507, train/loss_vlb_step=0.000179, train/loss_step=0.0507, global_step=3255.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  78%|███████▊  | 943/1208 [27:10<07:38,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0507, train/loss_vlb_step=0.000179, train/loss_step=0.0507, global_step=3255.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  78%|███████▊  | 943/1208 [27:10<07:38,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00503, train/loss_vlb_step=2.58e-5, train/loss_step=0.00503, global_step=3255.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  78%|███████▊  | 944/1208 [27:13<07:36,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00503, train/loss_vlb_step=2.58e-5, train/loss_step=0.00503, global_step=3255.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  78%|███████▊  | 944/1208 [27:13<07:36,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0368, train/loss_vlb_step=0.000134, train/loss_step=0.0368, global_step=3255.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  78%|███████▊  | 945/1208 [27:14<07:35,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0368, train/loss_vlb_step=0.000134, train/loss_step=0.0368, global_step=3255.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  78%|███████▊  | 945/1208 [27:14<07:35,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00179, train/loss_step=0.352, global_step=3256.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  78%|███████▊  | 946/1208 [27:15<07:33,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00179, train/loss_step=0.352, global_step=3256.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  78%|███████▊  | 946/1208 [27:15<07:33,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000647, train/loss_step=0.179, global_step=3256.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  78%|███████▊  | 947/1208 [27:16<07:31,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000647, train/loss_step=0.179, global_step=3256.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  78%|███████▊  | 947/1208 [27:16<07:31,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000683, train/loss_step=0.197, global_step=3256.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  78%|███████▊  | 948/1208 [27:20<07:29,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000683, train/loss_step=0.197, global_step=3256.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  78%|███████▊  | 948/1208 [27:20<07:29,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.0022, train/loss_step=0.374, global_step=3256.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  79%|███████▊  | 949/1208 [27:21<07:27,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.0022, train/loss_step=0.374, global_step=3256.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  79%|███████▊  | 949/1208 [27:21<07:27,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00964, train/loss_vlb_step=4.41e-5, train/loss_step=0.00964, global_step=3257.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  79%|███████▊  | 950/1208 [27:22<07:26,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00964, train/loss_vlb_step=4.41e-5, train/loss_step=0.00964, global_step=3257.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  79%|███████▊  | 950/1208 [27:22<07:26,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0802, train/loss_vlb_step=0.000264, train/loss_step=0.0802, global_step=3257.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  79%|███████▊  | 951/1208 [27:23<07:24,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0802, train/loss_vlb_step=0.000264, train/loss_step=0.0802, global_step=3257.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  79%|███████▊  | 951/1208 [27:23<07:24,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.65e-5, train/loss_step=0.00291, global_step=3257.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  79%|███████▉  | 952/1208 [27:26<07:22,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.65e-5, train/loss_step=0.00291, global_step=3257.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  79%|███████▉  | 952/1208 [27:26<07:22,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=0.000101, train/loss_step=0.0252, global_step=3257.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  79%|███████▉  | 953/1208 [27:27<07:20,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=0.000101, train/loss_step=0.0252, global_step=3257.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  79%|███████▉  | 953/1208 [27:27<07:20,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000929, train/loss_step=0.242, global_step=3258.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  79%|███████▉  | 954/1208 [27:28<07:19,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000929, train/loss_step=0.242, global_step=3258.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  79%|███████▉  | 954/1208 [27:28<07:19,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00608, train/loss_vlb_step=3.06e-5, train/loss_step=0.00608, global_step=3258.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  79%|███████▉  | 955/1208 [27:29<07:17,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00608, train/loss_vlb_step=3.06e-5, train/loss_step=0.00608, global_step=3258.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  79%|███████▉  | 955/1208 [27:29<07:17,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.37e-5, train/loss_step=0.0172, global_step=3258.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  79%|███████▉  | 956/1208 [27:33<07:15,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.37e-5, train/loss_step=0.0172, global_step=3258.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  79%|███████▉  | 956/1208 [27:33<07:15,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=3258.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  79%|███████▉  | 957/1208 [27:34<07:13,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=3258.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  79%|███████▉  | 957/1208 [27:34<07:13,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00221, train/loss_step=0.379, global_step=3259.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  79%|███████▉  | 958/1208 [27:35<07:11,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00221, train/loss_step=0.379, global_step=3259.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  79%|███████▉  | 958/1208 [27:35<07:11,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00105, train/loss_step=0.249, global_step=3259.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  79%|███████▉  | 959/1208 [27:36<07:10,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00105, train/loss_step=0.249, global_step=3259.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  79%|███████▉  | 959/1208 [27:36<07:10,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00377, train/loss_step=0.394, global_step=3259.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  79%|███████▉  | 960/1208 [27:39<07:08,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00377, train/loss_step=0.394, global_step=3259.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  79%|███████▉  | 960/1208 [27:39<07:08,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000576, train/loss_step=0.168, global_step=3259.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  80%|███████▉  | 961/1208 [27:40<07:06,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000576, train/loss_step=0.168, global_step=3259.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  80%|███████▉  | 961/1208 [27:40<07:06,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.72e-5, train/loss_step=0.0125, global_step=3260.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  80%|███████▉  | 962/1208 [27:41<07:04,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.72e-5, train/loss_step=0.0125, global_step=3260.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  80%|███████▉  | 962/1208 [27:41<07:04,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00137, train/loss_step=0.291, global_step=3260.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  80%|███████▉  | 963/1208 [27:42<07:03,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00137, train/loss_step=0.291, global_step=3260.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  80%|███████▉  | 963/1208 [27:42<07:03,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000476, train/loss_step=0.143, global_step=3260.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  80%|███████▉  | 964/1208 [27:45<07:01,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000476, train/loss_step=0.143, global_step=3260.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  80%|███████▉  | 964/1208 [27:45<07:01,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0811, train/loss_vlb_step=0.000272, train/loss_step=0.0811, global_step=3260.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  80%|███████▉  | 965/1208 [27:47<06:59,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0811, train/loss_vlb_step=0.000272, train/loss_step=0.0811, global_step=3260.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  80%|███████▉  | 965/1208 [27:47<06:59,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00236, train/loss_step=0.350, global_step=3261.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  80%|███████▉  | 966/1208 [27:48<06:57,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00236, train/loss_step=0.350, global_step=3261.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  80%|███████▉  | 966/1208 [27:48<06:57,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00879, train/loss_vlb_step=4.23e-5, train/loss_step=0.00879, global_step=3261.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  80%|████████  | 967/1208 [27:49<06:55,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00879, train/loss_vlb_step=4.23e-5, train/loss_step=0.00879, global_step=3261.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  80%|████████  | 967/1208 [27:49<06:55,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00728, train/loss_vlb_step=3.52e-5, train/loss_step=0.00728, global_step=3261.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  80%|████████  | 968/1208 [27:52<06:54,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00728, train/loss_vlb_step=3.52e-5, train/loss_step=0.00728, global_step=3261.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  80%|████████  | 968/1208 [27:52<06:54,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.35e-5, train/loss_step=0.0118, global_step=3261.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  80%|████████  | 969/1208 [27:53<06:52,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.35e-5, train/loss_step=0.0118, global_step=3261.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  80%|████████  | 969/1208 [27:53<06:52,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00354, train/loss_vlb_step=1.97e-5, train/loss_step=0.00354, global_step=3262.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  80%|████████  | 970/1208 [27:54<06:50,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00354, train/loss_vlb_step=1.97e-5, train/loss_step=0.00354, global_step=3262.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  80%|████████  | 970/1208 [27:54<06:50,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=1.73e-5, train/loss_step=0.00308, global_step=3262.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  80%|████████  | 971/1208 [27:55<06:48,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=1.73e-5, train/loss_step=0.00308, global_step=3262.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  80%|████████  | 971/1208 [27:55<06:48,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00631, train/loss_vlb_step=3.31e-5, train/loss_step=0.00631, global_step=3262.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  80%|████████  | 972/1208 [27:58<06:47,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00631, train/loss_vlb_step=3.31e-5, train/loss_step=0.00631, global_step=3262.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  80%|████████  | 972/1208 [27:58<06:47,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0371, train/loss_vlb_step=0.000141, train/loss_step=0.0371, global_step=3262.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  81%|████████  | 973/1208 [27:59<06:45,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0371, train/loss_vlb_step=0.000141, train/loss_step=0.0371, global_step=3262.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  81%|████████  | 973/1208 [27:59<06:45,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.000234, train/loss_step=0.067, global_step=3263.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  81%|████████  | 974/1208 [28:00<06:43,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.000234, train/loss_step=0.067, global_step=3263.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  81%|████████  | 974/1208 [28:00<06:43,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.0031, train/loss_step=0.409, global_step=3263.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  81%|████████  | 975/1208 [28:02<06:41,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.0031, train/loss_step=0.409, global_step=3263.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  81%|████████  | 975/1208 [28:02<06:41,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=1.71e-5, train/loss_step=0.00302, global_step=3263.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  81%|████████  | 976/1208 [28:05<06:40,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=1.71e-5, train/loss_step=0.00302, global_step=3263.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  81%|████████  | 976/1208 [28:05<06:40,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.914, train/loss_vlb_step=0.460, train/loss_step=0.914, global_step=3263.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]      Epoch 10:  81%|████████  | 977/1208 [28:06<06:38,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.914, train/loss_vlb_step=0.460, train/loss_step=0.914, global_step=3263.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  81%|████████  | 977/1208 [28:06<06:38,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0621, train/loss_vlb_step=0.000212, train/loss_step=0.0621, global_step=3264.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  81%|████████  | 978/1208 [28:07<06:36,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0621, train/loss_vlb_step=0.000212, train/loss_step=0.0621, global_step=3264.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  81%|████████  | 978/1208 [28:07<06:36,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000736, train/loss_step=0.205, global_step=3264.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  81%|████████  | 979/1208 [28:08<06:34,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000736, train/loss_step=0.205, global_step=3264.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  81%|████████  | 979/1208 [28:08<06:34,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000544, train/loss_step=0.157, global_step=3264.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  81%|████████  | 980/1208 [28:11<06:33,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000544, train/loss_step=0.157, global_step=3264.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  81%|████████  | 980/1208 [28:11<06:33,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=3264.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  81%|████████  | 981/1208 [28:12<06:31,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=3264.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  81%|████████  | 981/1208 [28:12<06:31,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.76e-5, train/loss_step=0.0135, global_step=3265.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  81%|████████▏ | 982/1208 [28:13<06:29,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.76e-5, train/loss_step=0.0135, global_step=3265.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  81%|████████▏ | 982/1208 [28:13<06:29,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=9.38e-5, train/loss_step=0.0225, global_step=3265.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  81%|████████▏ | 983/1208 [28:14<06:27,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=9.38e-5, train/loss_step=0.0225, global_step=3265.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  81%|████████▏ | 983/1208 [28:14<06:27,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.541, train/loss_vlb_step=0.0102, train/loss_step=0.541, global_step=3265.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  81%|████████▏ | 984/1208 [28:18<06:26,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.541, train/loss_vlb_step=0.0102, train/loss_step=0.541, global_step=3265.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  81%|████████▏ | 984/1208 [28:18<06:26,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00387, train/loss_vlb_step=1.99e-5, train/loss_step=0.00387, global_step=3265.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  82%|████████▏ | 985/1208 [28:19<06:24,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00387, train/loss_vlb_step=1.99e-5, train/loss_step=0.00387, global_step=3265.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  82%|████████▏ | 985/1208 [28:19<06:24,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0902, train/loss_vlb_step=0.0003, train/loss_step=0.0902, global_step=3266.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  82%|████████▏ | 986/1208 [28:20<06:22,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0902, train/loss_vlb_step=0.0003, train/loss_step=0.0902, global_step=3266.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  82%|████████▏ | 986/1208 [28:20<06:22,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.06e-5, train/loss_step=0.00176, global_step=3266.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  82%|████████▏ | 987/1208 [28:21<06:20,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.06e-5, train/loss_step=0.00176, global_step=3266.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  82%|████████▏ | 987/1208 [28:21<06:20,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0683, train/loss_vlb_step=0.000229, train/loss_step=0.0683, global_step=3266.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  82%|████████▏ | 988/1208 [28:24<06:19,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0683, train/loss_vlb_step=0.000229, train/loss_step=0.0683, global_step=3266.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  82%|████████▏ | 988/1208 [28:24<06:19,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.51e-5, train/loss_step=0.00265, global_step=3266.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  82%|████████▏ | 989/1208 [28:25<06:17,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.51e-5, train/loss_step=0.00265, global_step=3266.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  82%|████████▏ | 989/1208 [28:25<06:17,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00294, train/loss_step=0.391, global_step=3267.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  82%|████████▏ | 990/1208 [28:26<06:15,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00294, train/loss_step=0.391, global_step=3267.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  82%|████████▏ | 990/1208 [28:26<06:15,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.4e-5, train/loss_step=0.0232, global_step=3267.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  82%|████████▏ | 991/1208 [28:27<06:13,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.4e-5, train/loss_step=0.0232, global_step=3267.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  82%|████████▏ | 991/1208 [28:27<06:13,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00211, train/loss_step=0.384, global_step=3267.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  82%|████████▏ | 992/1208 [28:30<06:12,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00211, train/loss_step=0.384, global_step=3267.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  82%|████████▏ | 992/1208 [28:30<06:12,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0685, train/loss_vlb_step=0.000232, train/loss_step=0.0685, global_step=3267.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  82%|████████▏ | 993/1208 [28:31<06:10,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0685, train/loss_vlb_step=0.000232, train/loss_step=0.0685, global_step=3267.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  82%|████████▏ | 993/1208 [28:31<06:10,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00244, train/loss_step=0.319, global_step=3268.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  82%|████████▏ | 994/1208 [28:33<06:08,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00244, train/loss_step=0.319, global_step=3268.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  82%|████████▏ | 994/1208 [28:33<06:08,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00118, train/loss_step=0.275, global_step=3268.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  82%|████████▏ | 995/1208 [28:34<06:06,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00118, train/loss_step=0.275, global_step=3268.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  82%|████████▏ | 995/1208 [28:34<06:06,  1.72s/it, loss=0.192, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000659, train/loss_step=0.189, global_step=3268.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  82%|████████▏ | 996/1208 [28:37<06:05,  1.72s/it, loss=0.192, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000659, train/loss_step=0.189, global_step=3268.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  82%|████████▏ | 996/1208 [28:37<06:05,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000543, train/loss_step=0.157, global_step=3268.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  83%|████████▎ | 997/1208 [28:38<06:03,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000543, train/loss_step=0.157, global_step=3268.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  83%|████████▎ | 997/1208 [28:38<06:03,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0995, train/loss_vlb_step=0.000327, train/loss_step=0.0995, global_step=3269.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  83%|████████▎ | 998/1208 [28:39<06:01,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0995, train/loss_vlb_step=0.000327, train/loss_step=0.0995, global_step=3269.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  83%|████████▎ | 998/1208 [28:39<06:01,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00104, train/loss_step=0.243, global_step=3269.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  83%|████████▎ | 999/1208 [28:40<05:59,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00104, train/loss_step=0.243, global_step=3269.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  83%|████████▎ | 999/1208 [28:40<05:59,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.00054, train/loss_step=0.162, global_step=3269.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  83%|████████▎ | 1000/1208 [28:43<05:58,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.00054, train/loss_step=0.162, global_step=3269.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  83%|████████▎ | 1000/1208 [28:43<05:58,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00165, train/loss_step=0.335, global_step=3269.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  83%|████████▎ | 1001/1208 [28:44<05:56,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00165, train/loss_step=0.335, global_step=3269.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  83%|████████▎ | 1001/1208 [28:44<05:56,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00341, train/loss_step=0.403, global_step=3270.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  83%|████████▎ | 1002/1208 [28:45<05:54,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00341, train/loss_step=0.403, global_step=3270.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  83%|████████▎ | 1002/1208 [28:45<05:54,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.25e-5, train/loss_step=0.0205, global_step=3270.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  83%|████████▎ | 1003/1208 [28:46<05:52,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.25e-5, train/loss_step=0.0205, global_step=3270.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  83%|████████▎ | 1003/1208 [28:46<05:52,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00209, train/loss_step=0.336, global_step=3270.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  83%|████████▎ | 1004/1208 [28:50<05:51,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00209, train/loss_step=0.336, global_step=3270.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  83%|████████▎ | 1004/1208 [28:50<05:51,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00907, train/loss_vlb_step=4.29e-5, train/loss_step=0.00907, global_step=3270.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  83%|████████▎ | 1005/1208 [28:51<05:49,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00907, train/loss_vlb_step=4.29e-5, train/loss_step=0.00907, global_step=3270.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  83%|████████▎ | 1005/1208 [28:51<05:49,  1.72s/it, loss=0.193, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00202, train/loss_step=0.370, global_step=3271.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  83%|████████▎ | 1006/1208 [28:52<05:47,  1.72s/it, loss=0.193, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00202, train/loss_step=0.370, global_step=3271.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  83%|████████▎ | 1006/1208 [28:52<05:47,  1.72s/it, loss=0.208, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00146, train/loss_step=0.313, global_step=3271.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  83%|████████▎ | 1007/1208 [28:53<05:45,  1.72s/it, loss=0.208, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00146, train/loss_step=0.313, global_step=3271.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  83%|████████▎ | 1007/1208 [28:53<05:45,  1.72s/it, loss=0.212, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.00044, train/loss_step=0.133, global_step=3271.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  83%|████████▎ | 1008/1208 [28:56<05:44,  1.72s/it, loss=0.212, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.00044, train/loss_step=0.133, global_step=3271.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  83%|████████▎ | 1008/1208 [28:56<05:44,  1.72s/it, loss=0.235, v_num=0, train/loss_simple_step=0.479, train/loss_vlb_step=0.00333, train/loss_step=0.479, global_step=3271.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  84%|████████▎ | 1009/1208 [28:57<05:42,  1.72s/it, loss=0.235, v_num=0, train/loss_simple_step=0.479, train/loss_vlb_step=0.00333, train/loss_step=0.479, global_step=3271.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  84%|████████▎ | 1009/1208 [28:57<05:42,  1.72s/it, loss=0.234, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00202, train/loss_step=0.364, global_step=3272.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  84%|████████▎ | 1010/1208 [28:58<05:40,  1.72s/it, loss=0.234, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00202, train/loss_step=0.364, global_step=3272.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  84%|████████▎ | 1010/1208 [28:58<05:40,  1.72s/it, loss=0.249, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00171, train/loss_step=0.324, global_step=3272.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  84%|████████▎ | 1011/1208 [28:59<05:39,  1.72s/it, loss=0.249, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00171, train/loss_step=0.324, global_step=3272.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  84%|████████▎ | 1011/1208 [28:59<05:39,  1.72s/it, loss=0.232, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000134, train/loss_step=0.0363, global_step=3272.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  84%|████████▍ | 1012/1208 [29:03<05:37,  1.72s/it, loss=0.232, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000134, train/loss_step=0.0363, global_step=3272.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  84%|████████▍ | 1012/1208 [29:03<05:37,  1.72s/it, loss=0.234, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=3272.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  84%|████████▍ | 1013/1208 [29:04<05:35,  1.72s/it, loss=0.234, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=3272.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  84%|████████▍ | 1013/1208 [29:04<05:35,  1.72s/it, loss=0.226, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.0006, train/loss_step=0.174, global_step=3273.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  84%|████████▍ | 1014/1208 [29:05<05:33,  1.72s/it, loss=0.226, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.0006, train/loss_step=0.174, global_step=3273.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  84%|████████▍ | 1014/1208 [29:05<05:33,  1.72s/it, loss=0.219, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=3273.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  84%|████████▍ | 1015/1208 [29:06<05:32,  1.72s/it, loss=0.219, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=3273.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  84%|████████▍ | 1015/1208 [29:06<05:32,  1.72s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000159, train/loss_step=0.0438, global_step=3273.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  84%|████████▍ | 1016/1208 [29:09<05:30,  1.72s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000159, train/loss_step=0.0438, global_step=3273.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  84%|████████▍ | 1016/1208 [29:09<05:30,  1.72s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0873, train/loss_vlb_step=0.000292, train/loss_step=0.0873, global_step=3273.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  84%|████████▍ | 1017/1208 [29:10<05:28,  1.72s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0873, train/loss_vlb_step=0.000292, train/loss_step=0.0873, global_step=3273.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  84%|████████▍ | 1017/1208 [29:10<05:28,  1.72s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0479, train/loss_vlb_step=0.00017, train/loss_step=0.0479, global_step=3274.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  84%|████████▍ | 1018/1208 [29:11<05:26,  1.72s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0479, train/loss_vlb_step=0.00017, train/loss_step=0.0479, global_step=3274.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  84%|████████▍ | 1018/1208 [29:11<05:26,  1.72s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00665, train/loss_vlb_step=3.3e-5, train/loss_step=0.00665, global_step=3274.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  84%|████████▍ | 1019/1208 [29:12<05:25,  1.72s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00665, train/loss_vlb_step=3.3e-5, train/loss_step=0.00665, global_step=3274.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  84%|████████▍ | 1019/1208 [29:12<05:25,  1.72s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00417, train/loss_vlb_step=2.18e-5, train/loss_step=0.00417, global_step=3274.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  84%|████████▍ | 1020/1208 [29:15<05:23,  1.72s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00417, train/loss_vlb_step=2.18e-5, train/loss_step=0.00417, global_step=3274.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  84%|████████▍ | 1020/1208 [29:15<05:23,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0981, train/loss_vlb_step=0.000323, train/loss_step=0.0981, global_step=3274.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  85%|████████▍ | 1021/1208 [29:17<05:21,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0981, train/loss_vlb_step=0.000323, train/loss_step=0.0981, global_step=3274.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  85%|████████▍ | 1021/1208 [29:17<05:21,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000579, train/loss_step=0.171, global_step=3275.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  85%|████████▍ | 1022/1208 [29:18<05:19,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000579, train/loss_step=0.171, global_step=3275.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  85%|████████▍ | 1022/1208 [29:18<05:19,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=3275.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  85%|████████▍ | 1023/1208 [29:19<05:18,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=3275.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  85%|████████▍ | 1023/1208 [29:19<05:18,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00127, train/loss_step=0.286, global_step=3275.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  85%|████████▍ | 1024/1208 [29:22<05:16,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00127, train/loss_step=0.286, global_step=3275.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  85%|████████▍ | 1024/1208 [29:22<05:16,  1.72s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000131, train/loss_step=0.0342, global_step=3275.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  85%|████████▍ | 1025/1208 [29:23<05:14,  1.72s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000131, train/loss_step=0.0342, global_step=3275.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  85%|████████▍ | 1025/1208 [29:23<05:14,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00716, train/loss_vlb_step=3.44e-5, train/loss_step=0.00716, global_step=3276.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  85%|████████▍ | 1026/1208 [29:24<05:12,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00716, train/loss_vlb_step=3.44e-5, train/loss_step=0.00716, global_step=3276.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  85%|████████▍ | 1026/1208 [29:24<05:12,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00312, train/loss_step=0.411, global_step=3276.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  85%|████████▌ | 1027/1208 [29:25<05:11,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00312, train/loss_step=0.411, global_step=3276.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  85%|████████▌ | 1027/1208 [29:25<05:11,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00418, train/loss_vlb_step=2.31e-5, train/loss_step=0.00418, global_step=3276.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  85%|████████▌ | 1028/1208 [29:28<05:09,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00418, train/loss_vlb_step=2.31e-5, train/loss_step=0.00418, global_step=3276.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  85%|████████▌ | 1028/1208 [29:28<05:09,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=3276.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  85%|████████▌ | 1029/1208 [29:29<05:07,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=3276.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  85%|████████▌ | 1029/1208 [29:29<05:07,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00215, train/loss_step=0.372, global_step=3277.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  85%|████████▌ | 1030/1208 [29:30<05:06,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00215, train/loss_step=0.372, global_step=3277.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  85%|████████▌ | 1030/1208 [29:30<05:06,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000873, train/loss_step=0.217, global_step=3277.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  85%|████████▌ | 1031/1208 [29:31<05:04,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000873, train/loss_step=0.217, global_step=3277.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  85%|████████▌ | 1031/1208 [29:31<05:04,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=3277.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  85%|████████▌ | 1032/1208 [29:35<05:02,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=3277.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  85%|████████▌ | 1032/1208 [29:35<05:02,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.83e-5, train/loss_step=0.0132, global_step=3277.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  86%|████████▌ | 1033/1208 [29:36<05:00,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.83e-5, train/loss_step=0.0132, global_step=3277.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  86%|████████▌ | 1033/1208 [29:36<05:00,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00383, train/loss_vlb_step=2.11e-5, train/loss_step=0.00383, global_step=3278.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  86%|████████▌ | 1034/1208 [29:37<04:59,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00383, train/loss_vlb_step=2.11e-5, train/loss_step=0.00383, global_step=3278.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  86%|████████▌ | 1034/1208 [29:37<04:59,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000312, train/loss_step=0.095, global_step=3278.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  86%|████████▌ | 1035/1208 [29:38<04:57,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000312, train/loss_step=0.095, global_step=3278.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  86%|████████▌ | 1035/1208 [29:38<04:57,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0567, train/loss_vlb_step=0.000199, train/loss_step=0.0567, global_step=3278.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  86%|████████▌ | 1036/1208 [29:41<04:55,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0567, train/loss_vlb_step=0.000199, train/loss_step=0.0567, global_step=3278.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  86%|████████▌ | 1036/1208 [29:41<04:55,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00548, train/loss_vlb_step=2.84e-5, train/loss_step=0.00548, global_step=3278.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  86%|████████▌ | 1037/1208 [29:42<04:53,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00548, train/loss_vlb_step=2.84e-5, train/loss_step=0.00548, global_step=3278.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  86%|████████▌ | 1037/1208 [29:42<04:53,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000364, train/loss_step=0.110, global_step=3279.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  86%|████████▌ | 1038/1208 [29:43<04:52,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000364, train/loss_step=0.110, global_step=3279.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  86%|████████▌ | 1038/1208 [29:43<04:52,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000454, train/loss_step=0.136, global_step=3279.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  86%|████████▌ | 1039/1208 [29:44<04:50,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000454, train/loss_step=0.136, global_step=3279.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  86%|████████▌ | 1039/1208 [29:44<04:50,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0466, train/loss_vlb_step=0.000168, train/loss_step=0.0466, global_step=3279.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  86%|████████▌ | 1040/1208 [29:48<04:48,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0466, train/loss_vlb_step=0.000168, train/loss_step=0.0466, global_step=3279.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  86%|████████▌ | 1040/1208 [29:48<04:48,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.730, train/loss_vlb_step=0.0419, train/loss_step=0.730, global_step=3279.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  86%|████████▌ | 1041/1208 [29:49<04:47,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.730, train/loss_vlb_step=0.0419, train/loss_step=0.730, global_step=3279.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  86%|████████▌ | 1041/1208 [29:49<04:47,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.613, train/loss_vlb_step=0.00952, train/loss_step=0.613, global_step=3280.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  86%|████████▋ | 1042/1208 [29:50<04:45,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.613, train/loss_vlb_step=0.00952, train/loss_step=0.613, global_step=3280.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  86%|████████▋ | 1042/1208 [29:50<04:45,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000518, train/loss_step=0.155, global_step=3280.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  86%|████████▋ | 1043/1208 [29:51<04:43,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000518, train/loss_step=0.155, global_step=3280.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  86%|████████▋ | 1043/1208 [29:51<04:43,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00632, train/loss_vlb_step=3.18e-5, train/loss_step=0.00632, global_step=3280.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  86%|████████▋ | 1044/1208 [29:54<04:41,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00632, train/loss_vlb_step=3.18e-5, train/loss_step=0.00632, global_step=3280.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  86%|████████▋ | 1044/1208 [29:54<04:41,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0547, train/loss_vlb_step=0.000195, train/loss_step=0.0547, global_step=3280.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  87%|████████▋ | 1045/1208 [29:55<04:40,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0547, train/loss_vlb_step=0.000195, train/loss_step=0.0547, global_step=3280.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  87%|████████▋ | 1045/1208 [29:55<04:40,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.065, train/loss_vlb_step=0.000217, train/loss_step=0.065, global_step=3281.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  87%|████████▋ | 1046/1208 [29:56<04:38,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.065, train/loss_vlb_step=0.000217, train/loss_step=0.065, global_step=3281.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  87%|████████▋ | 1046/1208 [29:56<04:38,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000437, train/loss_step=0.130, global_step=3281.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  87%|████████▋ | 1047/1208 [29:57<04:36,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000437, train/loss_step=0.130, global_step=3281.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  87%|████████▋ | 1047/1208 [29:57<04:36,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00125, train/loss_step=0.289, global_step=3281.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  87%|████████▋ | 1048/1208 [30:00<04:34,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00125, train/loss_step=0.289, global_step=3281.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  87%|████████▋ | 1048/1208 [30:00<04:34,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000553, train/loss_step=0.165, global_step=3281.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  87%|████████▋ | 1049/1208 [30:01<04:33,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000553, train/loss_step=0.165, global_step=3281.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  87%|████████▋ | 1049/1208 [30:01<04:33,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000445, train/loss_step=0.135, global_step=3282.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  87%|████████▋ | 1050/1208 [30:03<04:31,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000445, train/loss_step=0.135, global_step=3282.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  87%|████████▋ | 1050/1208 [30:03<04:31,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000164, train/loss_step=0.0449, global_step=3282.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  87%|████████▋ | 1051/1208 [30:04<04:29,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000164, train/loss_step=0.0449, global_step=3282.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  87%|████████▋ | 1051/1208 [30:04<04:29,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0383, train/loss_vlb_step=0.000149, train/loss_step=0.0383, global_step=3282.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  87%|████████▋ | 1052/1208 [30:07<04:28,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0383, train/loss_vlb_step=0.000149, train/loss_step=0.0383, global_step=3282.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  87%|████████▋ | 1052/1208 [30:07<04:28,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0546, train/loss_vlb_step=0.000194, train/loss_step=0.0546, global_step=3282.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  87%|████████▋ | 1053/1208 [30:08<04:26,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0546, train/loss_vlb_step=0.000194, train/loss_step=0.0546, global_step=3282.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  87%|████████▋ | 1053/1208 [30:08<04:26,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00974, train/loss_vlb_step=4.79e-5, train/loss_step=0.00974, global_step=3283.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  87%|████████▋ | 1054/1208 [30:09<04:24,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00974, train/loss_vlb_step=4.79e-5, train/loss_step=0.00974, global_step=3283.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  87%|████████▋ | 1054/1208 [30:09<04:24,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000612, train/loss_step=0.177, global_step=3283.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  87%|████████▋ | 1055/1208 [30:10<04:22,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000612, train/loss_step=0.177, global_step=3283.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  87%|████████▋ | 1055/1208 [30:10<04:22,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.484, train/loss_vlb_step=0.00446, train/loss_step=0.484, global_step=3283.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  87%|████████▋ | 1056/1208 [30:13<04:21,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.484, train/loss_vlb_step=0.00446, train/loss_step=0.484, global_step=3283.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  87%|████████▋ | 1056/1208 [30:13<04:21,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=7.35e-6, train/loss_step=0.00123, global_step=3283.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  88%|████████▊ | 1057/1208 [30:14<04:19,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=7.35e-6, train/loss_step=0.00123, global_step=3283.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  88%|████████▊ | 1057/1208 [30:14<04:19,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=8.75e-5, train/loss_step=0.0218, global_step=3284.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  88%|████████▊ | 1058/1208 [30:15<04:17,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=8.75e-5, train/loss_step=0.0218, global_step=3284.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  88%|████████▊ | 1058/1208 [30:15<04:17,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.67e-5, train/loss_step=0.0161, global_step=3284.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  88%|████████▊ | 1059/1208 [30:16<04:15,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.67e-5, train/loss_step=0.0161, global_step=3284.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  88%|████████▊ | 1059/1208 [30:16<04:15,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0617, train/loss_vlb_step=0.000209, train/loss_step=0.0617, global_step=3284.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  88%|████████▊ | 1060/1208 [30:20<04:14,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0617, train/loss_vlb_step=0.000209, train/loss_step=0.0617, global_step=3284.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  88%|████████▊ | 1060/1208 [30:20<04:14,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000393, train/loss_step=0.120, global_step=3284.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  88%|████████▊ | 1061/1208 [30:21<04:12,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000393, train/loss_step=0.120, global_step=3284.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  88%|████████▊ | 1061/1208 [30:21<04:12,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000901, train/loss_step=0.221, global_step=3285.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  88%|████████▊ | 1062/1208 [30:22<04:10,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000901, train/loss_step=0.221, global_step=3285.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  88%|████████▊ | 1062/1208 [30:22<04:10,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00818, train/loss_vlb_step=4.04e-5, train/loss_step=0.00818, global_step=3285.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  88%|████████▊ | 1063/1208 [30:23<04:08,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00818, train/loss_vlb_step=4.04e-5, train/loss_step=0.00818, global_step=3285.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  88%|████████▊ | 1063/1208 [30:23<04:08,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00984, train/loss_vlb_step=4.67e-5, train/loss_step=0.00984, global_step=3285.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  88%|████████▊ | 1064/1208 [30:26<04:07,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00984, train/loss_vlb_step=4.67e-5, train/loss_step=0.00984, global_step=3285.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  88%|████████▊ | 1064/1208 [30:26<04:07,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.05e-5, train/loss_step=0.011, global_step=3285.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  88%|████████▊ | 1065/1208 [30:27<04:05,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.05e-5, train/loss_step=0.011, global_step=3285.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  88%|████████▊ | 1065/1208 [30:27<04:05,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00222, train/loss_step=0.357, global_step=3286.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  88%|████████▊ | 1066/1208 [30:28<04:03,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00222, train/loss_step=0.357, global_step=3286.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  88%|████████▊ | 1066/1208 [30:28<04:03,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000519, train/loss_step=0.153, global_step=3286.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  88%|████████▊ | 1067/1208 [30:29<04:01,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000519, train/loss_step=0.153, global_step=3286.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  88%|████████▊ | 1067/1208 [30:29<04:01,  1.71s/it, loss=0.111, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000475, train/loss_step=0.137, global_step=3286.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  88%|████████▊ | 1068/1208 [30:33<04:00,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000475, train/loss_step=0.137, global_step=3286.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  88%|████████▊ | 1068/1208 [30:33<04:00,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.00056, train/loss_step=0.164, global_step=3286.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  88%|████████▊ | 1069/1208 [30:34<03:58,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.00056, train/loss_step=0.164, global_step=3286.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  88%|████████▊ | 1069/1208 [30:34<03:58,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000126, train/loss_step=0.0336, global_step=3287.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  89%|████████▊ | 1070/1208 [30:35<03:56,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000126, train/loss_step=0.0336, global_step=3287.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  89%|████████▊ | 1070/1208 [30:35<03:56,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=8.95e-6, train/loss_step=0.00147, global_step=3287.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  89%|████████▊ | 1071/1208 [30:36<03:54,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=8.95e-6, train/loss_step=0.00147, global_step=3287.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  89%|████████▊ | 1071/1208 [30:36<03:54,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00189, train/loss_vlb_step=1.13e-5, train/loss_step=0.00189, global_step=3287.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  89%|████████▊ | 1072/1208 [30:39<03:53,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00189, train/loss_vlb_step=1.13e-5, train/loss_step=0.00189, global_step=3287.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  89%|████████▊ | 1072/1208 [30:39<03:53,  1.72s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.00795, train/loss_vlb_step=3.92e-5, train/loss_step=0.00795, global_step=3287.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  89%|████████▉ | 1073/1208 [30:40<03:51,  1.72s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.00795, train/loss_vlb_step=3.92e-5, train/loss_step=0.00795, global_step=3287.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  89%|████████▉ | 1073/1208 [30:40<03:51,  1.72s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=1.53e-5, train/loss_step=0.00263, global_step=3288.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  89%|████████▉ | 1074/1208 [30:41<03:49,  1.71s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=1.53e-5, train/loss_step=0.00263, global_step=3288.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  89%|████████▉ | 1074/1208 [30:41<03:49,  1.71s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000113, train/loss_step=0.0297, global_step=3288.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  89%|████████▉ | 1075/1208 [30:42<03:47,  1.71s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000113, train/loss_step=0.0297, global_step=3288.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  89%|████████▉ | 1075/1208 [30:42<03:47,  1.71s/it, loss=0.0703, v_num=0, train/loss_simple_step=0.0461, train/loss_vlb_step=0.000165, train/loss_step=0.0461, global_step=3288.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  89%|████████▉ | 1076/1208 [30:46<03:46,  1.72s/it, loss=0.0703, v_num=0, train/loss_simple_step=0.0461, train/loss_vlb_step=0.000165, train/loss_step=0.0461, global_step=3288.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  89%|████████▉ | 1076/1208 [30:46<03:46,  1.72s/it, loss=0.0704, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.78e-5, train/loss_step=0.00319, global_step=3288.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  89%|████████▉ | 1077/1208 [30:47<03:44,  1.72s/it, loss=0.0704, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.78e-5, train/loss_step=0.00319, global_step=3288.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  89%|████████▉ | 1077/1208 [30:47<03:44,  1.72s/it, loss=0.0719, v_num=0, train/loss_simple_step=0.052, train/loss_vlb_step=0.000185, train/loss_step=0.052, global_step=3289.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  89%|████████▉ | 1078/1208 [30:48<03:42,  1.71s/it, loss=0.0719, v_num=0, train/loss_simple_step=0.052, train/loss_vlb_step=0.000185, train/loss_step=0.052, global_step=3289.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  89%|████████▉ | 1078/1208 [30:48<03:42,  1.71s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00109, train/loss_step=0.265, global_step=3289.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  89%|████████▉ | 1079/1208 [30:49<03:41,  1.71s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00109, train/loss_step=0.265, global_step=3289.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  89%|████████▉ | 1079/1208 [30:49<03:41,  1.71s/it, loss=0.096, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00138, train/loss_step=0.296, global_step=3289.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  89%|████████▉ | 1080/1208 [30:52<03:39,  1.72s/it, loss=0.096, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00138, train/loss_step=0.296, global_step=3289.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  89%|████████▉ | 1080/1208 [30:52<03:39,  1.72s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.86e-5, train/loss_step=0.00341, global_step=3289.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  89%|████████▉ | 1081/1208 [30:53<03:37,  1.71s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.86e-5, train/loss_step=0.00341, global_step=3289.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  89%|████████▉ | 1081/1208 [30:53<03:37,  1.71s/it, loss=0.0812, v_num=0, train/loss_simple_step=0.0397, train/loss_vlb_step=0.000144, train/loss_step=0.0397, global_step=3290.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  90%|████████▉ | 1082/1208 [30:54<03:35,  1.71s/it, loss=0.0812, v_num=0, train/loss_simple_step=0.0397, train/loss_vlb_step=0.000144, train/loss_step=0.0397, global_step=3290.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  90%|████████▉ | 1082/1208 [30:54<03:35,  1.71s/it, loss=0.081, v_num=0, train/loss_simple_step=0.00434, train/loss_vlb_step=2.25e-5, train/loss_step=0.00434, global_step=3290.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  90%|████████▉ | 1083/1208 [30:55<03:34,  1.71s/it, loss=0.081, v_num=0, train/loss_simple_step=0.00434, train/loss_vlb_step=2.25e-5, train/loss_step=0.00434, global_step=3290.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  90%|████████▉ | 1083/1208 [30:55<03:34,  1.71s/it, loss=0.0873, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000459, train/loss_step=0.137, global_step=3290.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  90%|████████▉ | 1084/1208 [30:58<03:32,  1.71s/it, loss=0.0873, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000459, train/loss_step=0.137, global_step=3290.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  90%|████████▉ | 1084/1208 [30:58<03:32,  1.71s/it, loss=0.0879, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.79e-5, train/loss_step=0.0226, global_step=3290.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  90%|████████▉ | 1085/1208 [30:59<03:30,  1.71s/it, loss=0.0879, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.79e-5, train/loss_step=0.0226, global_step=3290.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  90%|████████▉ | 1085/1208 [30:59<03:30,  1.71s/it, loss=0.0761, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000399, train/loss_step=0.121, global_step=3291.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  90%|████████▉ | 1086/1208 [31:00<03:29,  1.71s/it, loss=0.0761, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000399, train/loss_step=0.121, global_step=3291.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  90%|████████▉ | 1086/1208 [31:00<03:29,  1.71s/it, loss=0.0723, v_num=0, train/loss_simple_step=0.0773, train/loss_vlb_step=0.000256, train/loss_step=0.0773, global_step=3291.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  90%|████████▉ | 1087/1208 [31:01<03:27,  1.71s/it, loss=0.0723, v_num=0, train/loss_simple_step=0.0773, train/loss_vlb_step=0.000256, train/loss_step=0.0773, global_step=3291.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  90%|████████▉ | 1087/1208 [31:01<03:27,  1.71s/it, loss=0.0737, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000559, train/loss_step=0.167, global_step=3291.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  90%|█████████ | 1088/1208 [31:05<03:25,  1.71s/it, loss=0.0737, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000559, train/loss_step=0.167, global_step=3291.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  90%|█████████ | 1088/1208 [31:05<03:25,  1.71s/it, loss=0.0683, v_num=0, train/loss_simple_step=0.0549, train/loss_vlb_step=0.000199, train/loss_step=0.0549, global_step=3291.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  90%|█████████ | 1089/1208 [31:06<03:23,  1.71s/it, loss=0.0683, v_num=0, train/loss_simple_step=0.0549, train/loss_vlb_step=0.000199, train/loss_step=0.0549, global_step=3291.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  90%|█████████ | 1089/1208 [31:06<03:23,  1.71s/it, loss=0.0668, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.72e-5, train/loss_step=0.00304, global_step=3292.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  90%|█████████ | 1090/1208 [31:07<03:22,  1.71s/it, loss=0.0668, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.72e-5, train/loss_step=0.00304, global_step=3292.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  90%|█████████ | 1090/1208 [31:07<03:22,  1.71s/it, loss=0.0811, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00149, train/loss_step=0.288, global_step=3292.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  90%|█████████ | 1091/1208 [31:08<03:20,  1.71s/it, loss=0.0811, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00149, train/loss_step=0.288, global_step=3292.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  90%|█████████ | 1091/1208 [31:08<03:20,  1.71s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.46e-5, train/loss_step=0.0215, global_step=3292.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  90%|█████████ | 1092/1208 [31:11<03:18,  1.71s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.46e-5, train/loss_step=0.0215, global_step=3292.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  90%|█████████ | 1092/1208 [31:11<03:18,  1.71s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000449, train/loss_step=0.135, global_step=3292.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  90%|█████████ | 1093/1208 [31:12<03:17,  1.71s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000449, train/loss_step=0.135, global_step=3292.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  90%|█████████ | 1093/1208 [31:12<03:17,  1.71s/it, loss=0.0884, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=9.63e-6, train/loss_step=0.00161, global_step=3293.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  91%|█████████ | 1094/1208 [31:13<03:15,  1.71s/it, loss=0.0884, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=9.63e-6, train/loss_step=0.00161, global_step=3293.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  91%|█████████ | 1094/1208 [31:13<03:15,  1.71s/it, loss=0.0938, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000458, train/loss_step=0.138, global_step=3293.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  91%|█████████ | 1095/1208 [31:14<03:13,  1.71s/it, loss=0.0938, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000458, train/loss_step=0.138, global_step=3293.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  91%|█████████ | 1095/1208 [31:14<03:13,  1.71s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.0765, train/loss_vlb_step=0.000259, train/loss_step=0.0765, global_step=3293.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  91%|█████████ | 1096/1208 [31:18<03:11,  1.71s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.0765, train/loss_vlb_step=0.000259, train/loss_step=0.0765, global_step=3293.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  91%|█████████ | 1096/1208 [31:18<03:11,  1.71s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.0663, train/loss_vlb_step=0.000228, train/loss_step=0.0663, global_step=3293.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  91%|█████████ | 1097/1208 [31:19<03:10,  1.71s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.0663, train/loss_vlb_step=0.000228, train/loss_step=0.0663, global_step=3293.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  91%|█████████ | 1097/1208 [31:19<03:10,  1.71s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.42e-5, train/loss_step=0.0139, global_step=3294.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  91%|█████████ | 1098/1208 [31:20<03:08,  1.71s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.42e-5, train/loss_step=0.0139, global_step=3294.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  91%|█████████ | 1098/1208 [31:20<03:08,  1.71s/it, loss=0.0874, v_num=0, train/loss_simple_step=0.0799, train/loss_vlb_step=0.000269, train/loss_step=0.0799, global_step=3294.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  91%|█████████ | 1099/1208 [31:21<03:06,  1.71s/it, loss=0.0874, v_num=0, train/loss_simple_step=0.0799, train/loss_vlb_step=0.000269, train/loss_step=0.0799, global_step=3294.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  91%|█████████ | 1099/1208 [31:21<03:06,  1.71s/it, loss=0.0761, v_num=0, train/loss_simple_step=0.0711, train/loss_vlb_step=0.000242, train/loss_step=0.0711, global_step=3294.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  91%|█████████ | 1100/1208 [31:24<03:05,  1.71s/it, loss=0.0761, v_num=0, train/loss_simple_step=0.0711, train/loss_vlb_step=0.000242, train/loss_step=0.0711, global_step=3294.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  91%|█████████ | 1100/1208 [31:24<03:05,  1.71s/it, loss=0.0891, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00111, train/loss_step=0.263, global_step=3294.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  91%|█████████ | 1101/1208 [31:25<03:03,  1.71s/it, loss=0.0891, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00111, train/loss_step=0.263, global_step=3294.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  91%|█████████ | 1101/1208 [31:25<03:03,  1.71s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.8e-5, train/loss_step=0.0125, global_step=3295.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  91%|█████████ | 1102/1208 [31:26<03:01,  1.71s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.8e-5, train/loss_step=0.0125, global_step=3295.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  91%|█████████ | 1102/1208 [31:26<03:01,  1.71s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.0656, train/loss_vlb_step=0.000224, train/loss_step=0.0656, global_step=3295.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  91%|█████████▏| 1103/1208 [31:27<02:59,  1.71s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.0656, train/loss_vlb_step=0.000224, train/loss_step=0.0656, global_step=3295.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  91%|█████████▏| 1103/1208 [31:27<02:59,  1.71s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000805, train/loss_step=0.223, global_step=3295.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  91%|█████████▏| 1104/1208 [31:30<02:58,  1.71s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000805, train/loss_step=0.223, global_step=3295.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  91%|█████████▏| 1104/1208 [31:30<02:58,  1.71s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000147, train/loss_step=0.0407, global_step=3295.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  91%|█████████▏| 1105/1208 [31:32<02:56,  1.71s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000147, train/loss_step=0.0407, global_step=3295.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  91%|█████████▏| 1105/1208 [31:32<02:56,  1.71s/it, loss=0.111, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00271, train/loss_step=0.415, global_step=3296.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  92%|█████████▏| 1106/1208 [31:33<02:54,  1.71s/it, loss=0.111, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00271, train/loss_step=0.415, global_step=3296.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  92%|█████████▏| 1106/1208 [31:33<02:54,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00215, train/loss_step=0.341, global_step=3296.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  92%|█████████▏| 1107/1208 [31:34<02:52,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00215, train/loss_step=0.341, global_step=3296.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  92%|█████████▏| 1107/1208 [31:34<02:52,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0952, train/loss_vlb_step=0.000317, train/loss_step=0.0952, global_step=3296.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  92%|█████████▏| 1108/1208 [31:37<02:51,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0952, train/loss_vlb_step=0.000317, train/loss_step=0.0952, global_step=3296.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  92%|█████████▏| 1108/1208 [31:37<02:51,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00327, train/loss_step=0.411, global_step=3296.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  92%|█████████▏| 1109/1208 [31:38<02:49,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00327, train/loss_step=0.411, global_step=3296.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  92%|█████████▏| 1109/1208 [31:38<02:49,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000562, train/loss_step=0.163, global_step=3297.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  92%|█████████▏| 1110/1208 [31:39<02:47,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000562, train/loss_step=0.163, global_step=3297.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  92%|█████████▏| 1110/1208 [31:39<02:47,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0912, train/loss_vlb_step=0.000303, train/loss_step=0.0912, global_step=3297.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  92%|█████████▏| 1111/1208 [31:40<02:45,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0912, train/loss_vlb_step=0.000303, train/loss_step=0.0912, global_step=3297.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  92%|█████████▏| 1111/1208 [31:40<02:45,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.36e-5, train/loss_step=0.024, global_step=3297.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  92%|█████████▏| 1112/1208 [31:43<02:44,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.36e-5, train/loss_step=0.024, global_step=3297.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  92%|█████████▏| 1112/1208 [31:43<02:44,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00593, train/loss_vlb_step=3.04e-5, train/loss_step=0.00593, global_step=3297.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  92%|█████████▏| 1113/1208 [31:44<02:42,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00593, train/loss_vlb_step=3.04e-5, train/loss_step=0.00593, global_step=3297.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  92%|█████████▏| 1113/1208 [31:44<02:42,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000397, train/loss_step=0.119, global_step=3298.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  92%|█████████▏| 1114/1208 [31:45<02:40,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000397, train/loss_step=0.119, global_step=3298.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  92%|█████████▏| 1114/1208 [31:45<02:40,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00639, train/loss_vlb_step=3.19e-5, train/loss_step=0.00639, global_step=3298.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  92%|█████████▏| 1115/1208 [31:46<02:39,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00639, train/loss_vlb_step=3.19e-5, train/loss_step=0.00639, global_step=3298.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  92%|█████████▏| 1115/1208 [31:46<02:39,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00133, train/loss_step=0.306, global_step=3298.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  92%|█████████▏| 1116/1208 [31:50<02:37,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00133, train/loss_step=0.306, global_step=3298.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  92%|█████████▏| 1116/1208 [31:50<02:37,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.609, train/loss_vlb_step=0.0137, train/loss_step=0.609, global_step=3298.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  92%|█████████▏| 1117/1208 [31:51<02:35,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.609, train/loss_vlb_step=0.0137, train/loss_step=0.609, global_step=3298.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  92%|█████████▏| 1117/1208 [31:51<02:35,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.83e-5, train/loss_step=0.0105, global_step=3299.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  93%|█████████▎| 1118/1208 [31:52<02:33,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.83e-5, train/loss_step=0.0105, global_step=3299.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  93%|█████████▎| 1118/1208 [31:52<02:33,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00423, train/loss_step=0.425, global_step=3299.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  93%|█████████▎| 1119/1208 [31:53<02:32,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00423, train/loss_step=0.425, global_step=3299.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  93%|█████████▎| 1119/1208 [31:53<02:32,  1.71s/it, loss=0.2, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00262, train/loss_step=0.374, global_step=3299.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  93%|█████████▎| 1120/1208 [31:56<02:30,  1.71s/it, loss=0.2, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00262, train/loss_step=0.374, global_step=3299.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  93%|█████████▎| 1120/1208 [31:56<02:30,  1.71s/it, loss=0.204, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00159, train/loss_step=0.347, global_step=3299.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  93%|█████████▎| 1121/1208 [31:57<02:28,  1.71s/it, loss=0.204, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00159, train/loss_step=0.347, global_step=3299.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  93%|█████████▎| 1121/1208 [31:57<02:28,  1.71s/it, loss=0.216, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00109, train/loss_step=0.257, global_step=3300.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  93%|█████████▎| 1122/1208 [31:58<02:27,  1.71s/it, loss=0.216, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00109, train/loss_step=0.257, global_step=3300.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  93%|█████████▎| 1122/1208 [31:58<02:27,  1.71s/it, loss=0.213, v_num=0, train/loss_simple_step=0.00498, train/loss_vlb_step=2.59e-5, train/loss_step=0.00498, global_step=3300.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  93%|█████████▎| 1123/1208 [31:59<02:25,  1.71s/it, loss=0.213, v_num=0, train/loss_simple_step=0.00498, train/loss_vlb_step=2.59e-5, train/loss_step=0.00498, global_step=3300.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  93%|█████████▎| 1123/1208 [31:59<02:25,  1.71s/it, loss=0.204, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=0.000102, train/loss_step=0.025, global_step=3300.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  93%|█████████▎| 1124/1208 [32:03<02:23,  1.71s/it, loss=0.204, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=0.000102, train/loss_step=0.025, global_step=3300.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  93%|█████████▎| 1124/1208 [32:03<02:23,  1.71s/it, loss=0.217, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00138, train/loss_step=0.310, global_step=3300.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  93%|█████████▎| 1125/1208 [32:04<02:21,  1.71s/it, loss=0.217, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00138, train/loss_step=0.310, global_step=3300.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  93%|█████████▎| 1125/1208 [32:04<02:21,  1.71s/it, loss=0.21, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00125, train/loss_step=0.280, global_step=3301.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  93%|█████████▎| 1126/1208 [32:05<02:20,  1.71s/it, loss=0.21, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00125, train/loss_step=0.280, global_step=3301.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  93%|█████████▎| 1126/1208 [32:05<02:20,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000119, train/loss_step=0.0308, global_step=3301.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  93%|█████████▎| 1127/1208 [32:06<02:18,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000119, train/loss_step=0.0308, global_step=3301.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  93%|█████████▎| 1127/1208 [32:06<02:18,  1.71s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.000177, train/loss_step=0.0526, global_step=3301.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  93%|█████████▎| 1128/1208 [32:09<02:16,  1.71s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.000177, train/loss_step=0.0526, global_step=3301.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  93%|█████████▎| 1128/1208 [32:09<02:16,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000564, train/loss_step=0.166, global_step=3301.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  93%|█████████▎| 1129/1208 [32:10<02:15,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000564, train/loss_step=0.166, global_step=3301.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  93%|█████████▎| 1129/1208 [32:10<02:15,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00458, train/loss_vlb_step=2.41e-5, train/loss_step=0.00458, global_step=3302.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  94%|█████████▎| 1130/1208 [32:11<02:13,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00458, train/loss_vlb_step=2.41e-5, train/loss_step=0.00458, global_step=3302.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  94%|█████████▎| 1130/1208 [32:11<02:13,  1.71s/it, loss=0.198, v_num=0, train/loss_simple_step=0.602, train/loss_vlb_step=0.00782, train/loss_step=0.602, global_step=3302.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  94%|█████████▎| 1131/1208 [32:12<02:11,  1.71s/it, loss=0.198, v_num=0, train/loss_simple_step=0.602, train/loss_vlb_step=0.00782, train/loss_step=0.602, global_step=3302.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  94%|█████████▎| 1131/1208 [32:12<02:11,  1.71s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0752, train/loss_vlb_step=0.000249, train/loss_step=0.0752, global_step=3302.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  94%|█████████▎| 1132/1208 [32:15<02:09,  1.71s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0752, train/loss_vlb_step=0.000249, train/loss_step=0.0752, global_step=3302.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  94%|█████████▎| 1132/1208 [32:15<02:09,  1.71s/it, loss=0.201, v_num=0, train/loss_simple_step=0.00821, train/loss_vlb_step=3.81e-5, train/loss_step=0.00821, global_step=3302.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  94%|█████████▍| 1133/1208 [32:16<02:08,  1.71s/it, loss=0.201, v_num=0, train/loss_simple_step=0.00821, train/loss_vlb_step=3.81e-5, train/loss_step=0.00821, global_step=3302.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  94%|█████████▍| 1133/1208 [32:16<02:08,  1.71s/it, loss=0.208, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00105, train/loss_step=0.258, global_step=3303.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  94%|█████████▍| 1134/1208 [32:17<02:06,  1.71s/it, loss=0.208, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00105, train/loss_step=0.258, global_step=3303.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  94%|█████████▍| 1134/1208 [32:17<02:06,  1.71s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000186, train/loss_step=0.0525, global_step=3303.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  94%|█████████▍| 1135/1208 [32:18<02:04,  1.71s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000186, train/loss_step=0.0525, global_step=3303.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  94%|█████████▍| 1135/1208 [32:18<02:04,  1.71s/it, loss=0.2, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=3303.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  94%|█████████▍| 1136/1208 [32:22<02:03,  1.71s/it, loss=0.2, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=3303.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  94%|█████████▍| 1136/1208 [32:22<02:03,  1.71s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.15e-5, train/loss_step=0.0139, global_step=3303.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  94%|█████████▍| 1137/1208 [32:23<02:01,  1.71s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.15e-5, train/loss_step=0.0139, global_step=3303.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  94%|█████████▍| 1137/1208 [32:23<02:01,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00533, train/loss_vlb_step=2.75e-5, train/loss_step=0.00533, global_step=3304.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  94%|█████████▍| 1138/1208 [32:24<01:59,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00533, train/loss_vlb_step=2.75e-5, train/loss_step=0.00533, global_step=3304.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  94%|█████████▍| 1138/1208 [32:24<01:59,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00232, train/loss_step=0.350, global_step=3304.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  94%|█████████▍| 1139/1208 [32:25<01:57,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00232, train/loss_step=0.350, global_step=3304.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  94%|█████████▍| 1139/1208 [32:25<01:57,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.33e-5, train/loss_step=0.0196, global_step=3304.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  94%|█████████▍| 1140/1208 [32:28<01:56,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.33e-5, train/loss_step=0.0196, global_step=3304.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  94%|█████████▍| 1140/1208 [32:28<01:56,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.000272, train/loss_step=0.0817, global_step=3304.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  94%|█████████▍| 1141/1208 [32:29<01:54,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.000272, train/loss_step=0.0817, global_step=3304.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  94%|█████████▍| 1141/1208 [32:29<01:54,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000547, train/loss_step=0.161, global_step=3305.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  95%|█████████▍| 1142/1208 [32:30<01:52,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000547, train/loss_step=0.161, global_step=3305.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  95%|█████████▍| 1142/1208 [32:30<01:52,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00296, train/loss_step=0.401, global_step=3305.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  95%|█████████▍| 1143/1208 [32:31<01:50,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00296, train/loss_step=0.401, global_step=3305.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  95%|█████████▍| 1143/1208 [32:31<01:50,  1.71s/it, loss=0.171, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00297, train/loss_step=0.423, global_step=3305.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  95%|█████████▍| 1144/1208 [32:35<01:49,  1.71s/it, loss=0.171, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00297, train/loss_step=0.423, global_step=3305.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  95%|█████████▍| 1144/1208 [32:35<01:49,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=3305.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  95%|█████████▍| 1145/1208 [32:36<01:47,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=3305.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  95%|█████████▍| 1145/1208 [32:36<01:47,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0528, train/loss_vlb_step=0.00019, train/loss_step=0.0528, global_step=3306.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  95%|█████████▍| 1146/1208 [32:37<01:45,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0528, train/loss_vlb_step=0.00019, train/loss_step=0.0528, global_step=3306.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  95%|█████████▍| 1146/1208 [32:37<01:45,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0924, train/loss_vlb_step=0.000304, train/loss_step=0.0924, global_step=3306.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  95%|█████████▍| 1147/1208 [32:38<01:44,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0924, train/loss_vlb_step=0.000304, train/loss_step=0.0924, global_step=3306.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  95%|█████████▍| 1147/1208 [32:38<01:44,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000506, train/loss_step=0.151, global_step=3306.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  95%|█████████▌| 1148/1208 [32:41<01:42,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000506, train/loss_step=0.151, global_step=3306.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  95%|█████████▌| 1148/1208 [32:41<01:42,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.83e-5, train/loss_step=0.0246, global_step=3306.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  95%|█████████▌| 1149/1208 [32:42<01:40,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.83e-5, train/loss_step=0.0246, global_step=3306.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  95%|█████████▌| 1149/1208 [32:42<01:40,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.53e-5, train/loss_step=0.0145, global_step=3307.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  95%|█████████▌| 1150/1208 [32:43<01:39,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.53e-5, train/loss_step=0.0145, global_step=3307.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  95%|█████████▌| 1150/1208 [32:43<01:39,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000438, train/loss_step=0.133, global_step=3307.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  95%|█████████▌| 1151/1208 [32:44<01:37,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000438, train/loss_step=0.133, global_step=3307.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  95%|█████████▌| 1151/1208 [32:44<01:37,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000602, train/loss_step=0.179, global_step=3307.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  95%|█████████▌| 1152/1208 [32:47<01:35,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000602, train/loss_step=0.179, global_step=3307.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  95%|█████████▌| 1152/1208 [32:47<01:35,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.645, train/loss_vlb_step=0.0164, train/loss_step=0.645, global_step=3307.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  95%|█████████▌| 1153/1208 [32:48<01:33,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.645, train/loss_vlb_step=0.0164, train/loss_step=0.645, global_step=3307.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  95%|█████████▌| 1153/1208 [32:48<01:33,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.51e-5, train/loss_step=0.0215, global_step=3308.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  96%|█████████▌| 1154/1208 [32:49<01:32,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.51e-5, train/loss_step=0.0215, global_step=3308.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  96%|█████████▌| 1154/1208 [32:49<01:32,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.00074, train/loss_step=0.203, global_step=3308.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  96%|█████████▌| 1155/1208 [32:50<01:30,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.00074, train/loss_step=0.203, global_step=3308.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  96%|█████████▌| 1155/1208 [32:50<01:30,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000488, train/loss_step=0.146, global_step=3308.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  96%|█████████▌| 1156/1208 [32:54<01:28,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000488, train/loss_step=0.146, global_step=3308.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  96%|█████████▌| 1156/1208 [32:54<01:28,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0712, train/loss_vlb_step=0.00024, train/loss_step=0.0712, global_step=3308.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  96%|█████████▌| 1157/1208 [32:55<01:27,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0712, train/loss_vlb_step=0.00024, train/loss_step=0.0712, global_step=3308.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  96%|█████████▌| 1157/1208 [32:55<01:27,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00244, train/loss_step=0.377, global_step=3309.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  96%|█████████▌| 1158/1208 [32:56<01:25,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00244, train/loss_step=0.377, global_step=3309.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  96%|█████████▌| 1158/1208 [32:56<01:25,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0562, train/loss_vlb_step=0.0002, train/loss_step=0.0562, global_step=3309.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  96%|█████████▌| 1159/1208 [32:57<01:23,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0562, train/loss_vlb_step=0.0002, train/loss_step=0.0562, global_step=3309.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  96%|█████████▌| 1159/1208 [32:57<01:23,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.24e-5, train/loss_step=0.00212, global_step=3309.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  96%|█████████▌| 1160/1208 [33:00<01:21,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.24e-5, train/loss_step=0.00212, global_step=3309.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  96%|█████████▌| 1160/1208 [33:00<01:21,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=3309.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  96%|█████████▌| 1161/1208 [33:01<01:20,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=3309.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  96%|█████████▌| 1161/1208 [33:01<01:20,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.47e-5, train/loss_step=0.00249, global_step=3310.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  96%|█████████▌| 1162/1208 [33:02<01:18,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.47e-5, train/loss_step=0.00249, global_step=3310.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  96%|█████████▌| 1162/1208 [33:02<01:18,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00955, train/loss_vlb_step=4.46e-5, train/loss_step=0.00955, global_step=3310.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  96%|█████████▋| 1163/1208 [33:03<01:16,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00955, train/loss_vlb_step=4.46e-5, train/loss_step=0.00955, global_step=3310.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  96%|█████████▋| 1163/1208 [33:03<01:16,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00541, train/loss_step=0.425, global_step=3310.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  96%|█████████▋| 1164/1208 [33:07<01:15,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00541, train/loss_step=0.425, global_step=3310.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  96%|█████████▋| 1164/1208 [33:07<01:15,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.493, train/loss_vlb_step=0.0111, train/loss_step=0.493, global_step=3310.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  96%|█████████▋| 1165/1208 [33:08<01:13,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.493, train/loss_vlb_step=0.0111, train/loss_step=0.493, global_step=3310.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  96%|█████████▋| 1165/1208 [33:08<01:13,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000954, train/loss_step=0.239, global_step=3311.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  97%|█████████▋| 1166/1208 [33:09<01:11,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000954, train/loss_step=0.239, global_step=3311.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  97%|█████████▋| 1166/1208 [33:09<01:11,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.000151, train/loss_step=0.0417, global_step=3311.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  97%|█████████▋| 1167/1208 [33:10<01:09,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.000151, train/loss_step=0.0417, global_step=3311.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  97%|█████████▋| 1167/1208 [33:10<01:09,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00567, train/loss_vlb_step=2.95e-5, train/loss_step=0.00567, global_step=3311.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  97%|█████████▋| 1168/1208 [33:13<01:08,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00567, train/loss_vlb_step=2.95e-5, train/loss_step=0.00567, global_step=3311.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  97%|█████████▋| 1168/1208 [33:13<01:08,  1.71s/it, loss=0.184, v_num=0, train/loss_simple_step=0.501, train/loss_vlb_step=0.00741, train/loss_step=0.501, global_step=3311.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  97%|█████████▋| 1169/1208 [33:14<01:06,  1.71s/it, loss=0.184, v_num=0, train/loss_simple_step=0.501, train/loss_vlb_step=0.00741, train/loss_step=0.501, global_step=3311.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  97%|█████████▋| 1169/1208 [33:14<01:06,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.69e-5, train/loss_step=0.00304, global_step=3312.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  97%|█████████▋| 1170/1208 [33:15<01:04,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.69e-5, train/loss_step=0.00304, global_step=3312.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  97%|█████████▋| 1170/1208 [33:15<01:04,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=9.2e-5, train/loss_step=0.0225, global_step=3312.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  97%|█████████▋| 1171/1208 [33:16<01:03,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=9.2e-5, train/loss_step=0.0225, global_step=3312.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  97%|█████████▋| 1171/1208 [33:16<01:03,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00377, train/loss_vlb_step=2.1e-5, train/loss_step=0.00377, global_step=3312.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  97%|█████████▋| 1172/1208 [33:19<01:01,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00377, train/loss_vlb_step=2.1e-5, train/loss_step=0.00377, global_step=3312.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  97%|█████████▋| 1172/1208 [33:19<01:01,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00679, train/loss_vlb_step=3.34e-5, train/loss_step=0.00679, global_step=3312.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  97%|█████████▋| 1173/1208 [33:20<00:59,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00679, train/loss_vlb_step=3.34e-5, train/loss_step=0.00679, global_step=3312.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  97%|█████████▋| 1173/1208 [33:20<00:59,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00186, train/loss_step=0.315, global_step=3313.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  97%|█████████▋| 1174/1208 [33:21<00:57,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00186, train/loss_step=0.315, global_step=3313.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  97%|█████████▋| 1174/1208 [33:21<00:57,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0315, train/loss_vlb_step=0.000122, train/loss_step=0.0315, global_step=3313.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  97%|█████████▋| 1175/1208 [33:22<00:56,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0315, train/loss_vlb_step=0.000122, train/loss_step=0.0315, global_step=3313.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  97%|█████████▋| 1175/1208 [33:22<00:56,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000488, train/loss_step=0.146, global_step=3313.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  97%|█████████▋| 1176/1208 [33:26<00:54,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000488, train/loss_step=0.146, global_step=3313.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  97%|█████████▋| 1176/1208 [33:26<00:54,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0324, train/loss_vlb_step=0.000127, train/loss_step=0.0324, global_step=3313.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  97%|█████████▋| 1177/1208 [33:27<00:52,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0324, train/loss_vlb_step=0.000127, train/loss_step=0.0324, global_step=3313.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  97%|█████████▋| 1177/1208 [33:27<00:52,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00142, train/loss_step=0.300, global_step=3314.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  98%|█████████▊| 1178/1208 [33:28<00:51,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00142, train/loss_step=0.300, global_step=3314.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  98%|█████████▊| 1178/1208 [33:28<00:51,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0357, train/loss_vlb_step=0.000129, train/loss_step=0.0357, global_step=3314.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  98%|█████████▊| 1179/1208 [33:29<00:49,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0357, train/loss_vlb_step=0.000129, train/loss_step=0.0357, global_step=3314.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  98%|█████████▊| 1179/1208 [33:29<00:49,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0914, train/loss_vlb_step=0.000309, train/loss_step=0.0914, global_step=3314.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  98%|█████████▊| 1180/1208 [33:32<00:47,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0914, train/loss_vlb_step=0.000309, train/loss_step=0.0914, global_step=3314.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  98%|█████████▊| 1180/1208 [33:32<00:47,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00159, train/loss_step=0.293, global_step=3314.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 10:  98%|█████████▊| 1181/1208 [33:33<00:46,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00159, train/loss_step=0.293, global_step=3314.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  98%|█████████▊| 1181/1208 [33:33<00:46,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0775, train/loss_vlb_step=0.000258, train/loss_step=0.0775, global_step=3315.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  98%|█████████▊| 1182/1208 [33:34<00:44,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0775, train/loss_vlb_step=0.000258, train/loss_step=0.0775, global_step=3315.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  98%|█████████▊| 1182/1208 [33:34<00:44,  1.70s/it, loss=0.176, v_num=0, train/loss_simple_step=0.449, train/loss_vlb_step=0.00408, train/loss_step=0.449, global_step=3315.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  98%|█████████▊| 1183/1208 [33:35<00:42,  1.70s/it, loss=0.176, v_num=0, train/loss_simple_step=0.449, train/loss_vlb_step=0.00408, train/loss_step=0.449, global_step=3315.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  98%|█████████▊| 1183/1208 [33:35<00:42,  1.70s/it, loss=0.169, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00131, train/loss_step=0.283, global_step=3315.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  98%|█████████▊| 1184/1208 [33:39<00:40,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00131, train/loss_step=0.283, global_step=3315.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  98%|█████████▊| 1184/1208 [33:39<00:40,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00042, train/loss_step=0.128, global_step=3315.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  98%|█████████▊| 1185/1208 [33:40<00:39,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00042, train/loss_step=0.128, global_step=3315.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  98%|█████████▊| 1185/1208 [33:40<00:39,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00525, train/loss_vlb_step=2.77e-5, train/loss_step=0.00525, global_step=3316.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  98%|█████████▊| 1186/1208 [33:41<00:37,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00525, train/loss_vlb_step=2.77e-5, train/loss_step=0.00525, global_step=3316.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  98%|█████████▊| 1186/1208 [33:41<00:37,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000696, train/loss_step=0.188, global_step=3316.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  98%|█████████▊| 1187/1208 [33:42<00:35,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000696, train/loss_step=0.188, global_step=3316.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  98%|█████████▊| 1187/1208 [33:42<00:35,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.23e-5, train/loss_step=0.014, global_step=3316.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  98%|█████████▊| 1188/1208 [33:45<00:34,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.23e-5, train/loss_step=0.014, global_step=3316.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  98%|█████████▊| 1188/1208 [33:45<00:34,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00179, train/loss_step=0.319, global_step=3316.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  98%|█████████▊| 1189/1208 [33:46<00:32,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00179, train/loss_step=0.319, global_step=3316.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  98%|█████████▊| 1189/1208 [33:46<00:32,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000106, train/loss_step=0.0274, global_step=3317.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  99%|█████████▊| 1190/1208 [33:47<00:30,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000106, train/loss_step=0.0274, global_step=3317.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  99%|█████████▊| 1190/1208 [33:47<00:30,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.52e-5, train/loss_step=0.0234, global_step=3317.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  99%|█████████▊| 1191/1208 [33:48<00:28,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.52e-5, train/loss_step=0.0234, global_step=3317.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  99%|█████████▊| 1191/1208 [33:48<00:28,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0752, train/loss_vlb_step=0.000251, train/loss_step=0.0752, global_step=3317.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  99%|█████████▊| 1192/1208 [33:51<00:27,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0752, train/loss_vlb_step=0.000251, train/loss_step=0.0752, global_step=3317.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  99%|█████████▊| 1192/1208 [33:51<00:27,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.410, train/loss_vlb_step=0.00355, train/loss_step=0.410, global_step=3317.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  99%|█████████▉| 1193/1208 [33:53<00:25,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.410, train/loss_vlb_step=0.00355, train/loss_step=0.410, global_step=3317.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  99%|█████████▉| 1193/1208 [33:53<00:25,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0542, train/loss_vlb_step=0.000197, train/loss_step=0.0542, global_step=3318.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  99%|█████████▉| 1194/1208 [33:54<00:23,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0542, train/loss_vlb_step=0.000197, train/loss_step=0.0542, global_step=3318.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  99%|█████████▉| 1194/1208 [33:54<00:23,  1.70s/it, loss=0.155, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000531, train/loss_step=0.157, global_step=3318.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10:  99%|█████████▉| 1195/1208 [33:55<00:22,  1.70s/it, loss=0.155, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000531, train/loss_step=0.157, global_step=3318.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  99%|█████████▉| 1195/1208 [33:55<00:22,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000884, train/loss_step=0.226, global_step=3318.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  99%|█████████▉| 1196/1208 [33:58<00:20,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000884, train/loss_step=0.226, global_step=3318.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  99%|█████████▉| 1196/1208 [33:58<00:20,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=2.08e-5, train/loss_step=0.00363, global_step=3318.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  99%|█████████▉| 1197/1208 [33:59<00:18,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=2.08e-5, train/loss_step=0.00363, global_step=3318.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  99%|█████████▉| 1197/1208 [33:59<00:18,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0498, train/loss_vlb_step=0.000182, train/loss_step=0.0498, global_step=3319.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10:  99%|█████████▉| 1198/1208 [34:00<00:17,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0498, train/loss_vlb_step=0.000182, train/loss_step=0.0498, global_step=3319.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  99%|█████████▉| 1198/1208 [34:00<00:17,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00197, train/loss_step=0.370, global_step=3319.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10:  99%|█████████▉| 1199/1208 [34:01<00:15,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00197, train/loss_step=0.370, global_step=3319.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  99%|█████████▉| 1199/1208 [34:01<00:15,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000597, train/loss_step=0.166, global_step=3319.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  99%|█████████▉| 1200/1208 [34:04<00:13,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000597, train/loss_step=0.166, global_step=3319.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  99%|█████████▉| 1200/1208 [34:04<00:13,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.2e-5, train/loss_step=0.00198, global_step=3319.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.75it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.75it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.72it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.74it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.75it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.76it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.76it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.76it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.79it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.75it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.75it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 10:  99%|█████████▉| 1201/1208 [34:35<00:12,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.2e-5, train/loss_step=0.00198, global_step=3319.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10:  99%|█████████▉| 1201/1208 [34:35<00:12,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000781, train/loss_step=0.209, global_step=3320.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10: 100%|█████████▉| 1202/1208 [34:36<00:10,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000781, train/loss_step=0.209, global_step=3320.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10: 100%|█████████▉| 1202/1208 [34:36<00:10,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000361, train/loss_step=0.110, global_step=3320.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10: 100%|█████████▉| 1203/1208 [34:37<00:08,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000361, train/loss_step=0.110, global_step=3320.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10: 100%|█████████▉| 1203/1208 [34:37<00:08,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=2.21e-5, train/loss_step=0.00416, global_step=3320.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10: 100%|█████████▉| 1204/1208 [34:40<00:06,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=2.21e-5, train/loss_step=0.00416, global_step=3320.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10: 100%|█████████▉| 1204/1208 [34:40<00:06,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0744, train/loss_vlb_step=0.000261, train/loss_step=0.0744, global_step=3320.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 10: 100%|█████████▉| 1205/1208 [34:41<00:05,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0744, train/loss_vlb_step=0.000261, train/loss_step=0.0744, global_step=3320.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10: 100%|█████████▉| 1205/1208 [34:41<00:05,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000538, train/loss_step=0.154, global_step=3321.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 10: 100%|█████████▉| 1206/1208 [34:42<00:03,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000538, train/loss_step=0.154, global_step=3321.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10: 100%|█████████▉| 1206/1208 [34:42<00:03,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00925, train/loss_vlb_step=4.38e-5, train/loss_step=0.00925, global_step=3321.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10: 100%|█████████▉| 1207/1208 [34:43<00:01,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00925, train/loss_vlb_step=4.38e-5, train/loss_step=0.00925, global_step=3321.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10: 100%|█████████▉| 1207/1208 [34:43<00:01,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000407, train/loss_step=0.124, global_step=3321.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 10: 100%|██████████| 1208/1208 [34:48<00:00,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000407, train/loss_step=0.124, global_step=3321.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 10: 100%|██████████| 1208/1208 [34:48<00:00,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0807, train/loss_vlb_step=0.000266, train/loss_step=0.0807, global_step=3321.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]
+
+
+Epoch 10:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.116, v_num=0, train/loss_simple_step=0.0807, train/loss_vlb_step=0.000266, train/loss_step=0.0807, global_step=3321.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]           Epoch 11:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.116, v_num=0, train/loss_simple_step=0.0807, train/loss_vlb_step=0.000266, train/loss_step=0.0807, global_step=3321.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][AData shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.83it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.83it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.83it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.84it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.83it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.83it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:20,  1.70it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.73it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.84it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.75it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.76it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.83it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.84it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.78it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.83it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.78it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.83it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.83it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.83it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.82it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.83it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.78it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.80it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.81it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.77it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.78it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.75it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.78it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.75it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.79it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.75it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.80it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 11:   0%|          | 1/1208 [00:32<11:02:25, 32.93s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0807, train/loss_vlb_step=0.000266, train/loss_step=0.0807, global_step=3321.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 11:   0%|          | 1/1208 [00:32<11:02:27, 32.93s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=2.85e-5, train/loss_step=0.00545, global_step=3322.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   0%|          | 2/1208 [00:33<5:41:15, 16.98s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=2.85e-5, train/loss_step=0.00545, global_step=3322.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:   0%|          | 2/1208 [00:33<5:41:16, 16.98s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000155, train/loss_step=0.0405, global_step=3322.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:   0%|          | 3/1208 [00:34<3:54:13, 11.66s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000155, train/loss_step=0.0405, global_step=3322.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   0%|          | 3/1208 [00:34<3:54:13, 11.66s/it, loss=0.119, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000461, train/loss_step=0.139, global_step=3322.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:   0%|          | 4/1208 [00:38<3:11:16,  9.53s/it, loss=0.119, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000461, train/loss_step=0.139, global_step=3322.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   0%|          | 4/1208 [00:38<3:11:17,  9.53s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=5.08e-5, train/loss_step=0.0105, global_step=3322.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   0%|          | 5/1208 [00:39<2:37:08,  7.84s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=5.08e-5, train/loss_step=0.0105, global_step=3322.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   0%|          | 5/1208 [00:39<2:37:08,  7.84s/it, loss=0.11, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00116, train/loss_step=0.265, global_step=3323.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:   0%|          | 6/1208 [00:40<2:14:25,  6.71s/it, loss=0.11, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00116, train/loss_step=0.265, global_step=3323.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   0%|          | 6/1208 [00:40<2:14:25,  6.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000374, train/loss_step=0.112, global_step=3323.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   1%|          | 7/1208 [00:41<1:58:04,  5.90s/it, loss=0.108, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000374, train/loss_step=0.112, global_step=3323.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   1%|          | 7/1208 [00:41<1:58:04,  5.90s/it, loss=0.103, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000425, train/loss_step=0.125, global_step=3323.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   1%|          | 8/1208 [00:44<1:51:18,  5.57s/it, loss=0.103, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000425, train/loss_step=0.125, global_step=3323.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   1%|          | 8/1208 [00:44<1:51:18,  5.57s/it, loss=0.123, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00246, train/loss_step=0.413, global_step=3323.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:   1%|          | 9/1208 [00:45<1:41:13,  5.07s/it, loss=0.123, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00246, train/loss_step=0.413, global_step=3323.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   1%|          | 9/1208 [00:45<1:41:13,  5.07s/it, loss=0.13, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000622, train/loss_step=0.184, global_step=3324.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   1%|          | 10/1208 [00:46<1:33:05,  4.66s/it, loss=0.13, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000622, train/loss_step=0.184, global_step=3324.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   1%|          | 10/1208 [00:46<1:33:05,  4.66s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.23e-5, train/loss_step=0.00207, global_step=3324.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   1%|          | 11/1208 [00:47<1:26:25,  4.33s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.23e-5, train/loss_step=0.00207, global_step=3324.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   1%|          | 11/1208 [00:47<1:26:25,  4.33s/it, loss=0.114, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000797, train/loss_step=0.215, global_step=3324.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:   1%|          | 12/1208 [00:50<1:24:34,  4.24s/it, loss=0.114, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000797, train/loss_step=0.215, global_step=3324.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   1%|          | 12/1208 [00:50<1:24:34,  4.24s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0753, train/loss_vlb_step=0.00026, train/loss_step=0.0753, global_step=3324.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   1%|          | 13/1208 [00:51<1:19:36,  4.00s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0753, train/loss_vlb_step=0.00026, train/loss_step=0.0753, global_step=3324.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   1%|          | 13/1208 [00:51<1:19:36,  4.00s/it, loss=0.124, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.0015, train/loss_step=0.330, global_step=3325.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:   1%|          | 14/1208 [00:53<1:15:20,  3.79s/it, loss=0.124, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.0015, train/loss_step=0.330, global_step=3325.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   1%|          | 14/1208 [00:53<1:15:20,  3.79s/it, loss=0.128, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000729, train/loss_step=0.190, global_step=3325.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   1%|          | 15/1208 [00:54<1:11:38,  3.60s/it, loss=0.128, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000729, train/loss_step=0.190, global_step=3325.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   1%|          | 15/1208 [00:54<1:11:38,  3.60s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0092, train/loss_vlb_step=4.11e-5, train/loss_step=0.0092, global_step=3325.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   1%|▏         | 16/1208 [00:57<1:11:11,  3.58s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0092, train/loss_vlb_step=4.11e-5, train/loss_step=0.0092, global_step=3325.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   1%|▏         | 16/1208 [00:57<1:11:11,  3.58s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000113, train/loss_step=0.0283, global_step=3325.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   1%|▏         | 17/1208 [00:58<1:08:11,  3.44s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000113, train/loss_step=0.0283, global_step=3325.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   1%|▏         | 17/1208 [00:58<1:08:11,  3.44s/it, loss=0.136, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00235, train/loss_step=0.357, global_step=3326.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:   1%|▏         | 18/1208 [00:59<1:05:30,  3.30s/it, loss=0.136, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00235, train/loss_step=0.357, global_step=3326.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   1%|▏         | 18/1208 [00:59<1:05:30,  3.30s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.25e-5, train/loss_step=0.0021, global_step=3326.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   2%|▏         | 19/1208 [01:00<1:03:05,  3.18s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.25e-5, train/loss_step=0.0021, global_step=3326.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   2%|▏         | 19/1208 [01:00<1:03:05,  3.18s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0779, train/loss_vlb_step=0.000269, train/loss_step=0.0779, global_step=3326.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   2%|▏         | 20/1208 [01:03<1:03:06,  3.19s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0779, train/loss_vlb_step=0.000269, train/loss_step=0.0779, global_step=3326.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   2%|▏         | 20/1208 [01:03<1:03:06,  3.19s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.23e-5, train/loss_step=0.00204, global_step=3326.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   2%|▏         | 21/1208 [01:04<1:01:03,  3.09s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.23e-5, train/loss_step=0.00204, global_step=3326.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   2%|▏         | 21/1208 [01:04<1:01:03,  3.09s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0638, train/loss_vlb_step=0.000218, train/loss_step=0.0638, global_step=3327.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:   2%|▏         | 22/1208 [01:05<59:10,  2.99s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0638, train/loss_vlb_step=0.000218, train/loss_step=0.0638, global_step=3327.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:   2%|▏         | 22/1208 [01:05<59:10,  2.99s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=8.55e-5, train/loss_step=0.0204, global_step=3327.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:   2%|▏         | 23/1208 [01:06<57:26,  2.91s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=8.55e-5, train/loss_step=0.0204, global_step=3327.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   2%|▏         | 23/1208 [01:06<57:26,  2.91s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00765, train/loss_vlb_step=3.75e-5, train/loss_step=0.00765, global_step=3327.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   2%|▏         | 24/1208 [01:10<57:40,  2.92s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00765, train/loss_vlb_step=3.75e-5, train/loss_step=0.00765, global_step=3327.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   2%|▏         | 24/1208 [01:10<57:40,  2.92s/it, loss=0.139, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00142, train/loss_step=0.299, global_step=3327.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:   2%|▏         | 25/1208 [01:11<56:10,  2.85s/it, loss=0.139, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00142, train/loss_step=0.299, global_step=3327.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   2%|▏         | 25/1208 [01:11<56:10,  2.85s/it, loss=0.141, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00161, train/loss_step=0.301, global_step=3328.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   2%|▏         | 26/1208 [01:12<54:45,  2.78s/it, loss=0.141, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00161, train/loss_step=0.301, global_step=3328.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   2%|▏         | 26/1208 [01:12<54:45,  2.78s/it, loss=0.144, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.00062, train/loss_step=0.180, global_step=3328.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   2%|▏         | 27/1208 [01:13<53:28,  2.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.00062, train/loss_step=0.180, global_step=3328.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   2%|▏         | 27/1208 [01:13<53:28,  2.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000647, train/loss_step=0.187, global_step=3328.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   2%|▏         | 28/1208 [01:16<53:46,  2.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000647, train/loss_step=0.187, global_step=3328.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   2%|▏         | 28/1208 [01:16<53:46,  2.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000831, train/loss_step=0.228, global_step=3328.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   2%|▏         | 29/1208 [01:17<52:35,  2.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000831, train/loss_step=0.228, global_step=3328.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   2%|▏         | 29/1208 [01:17<52:35,  2.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000162, train/loss_step=0.0445, global_step=3329.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   2%|▏         | 30/1208 [01:18<51:28,  2.62s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000162, train/loss_step=0.0445, global_step=3329.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   2%|▏         | 30/1208 [01:18<51:28,  2.62s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0883, train/loss_vlb_step=0.00029, train/loss_step=0.0883, global_step=3329.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:   3%|▎         | 31/1208 [01:19<50:25,  2.57s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0883, train/loss_vlb_step=0.00029, train/loss_step=0.0883, global_step=3329.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   3%|▎         | 31/1208 [01:19<50:25,  2.57s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=0.0001, train/loss_step=0.0251, global_step=3329.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:   3%|▎         | 32/1208 [01:22<50:47,  2.59s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=0.0001, train/loss_step=0.0251, global_step=3329.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   3%|▎         | 32/1208 [01:22<50:47,  2.59s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6.09e-5, train/loss_step=0.0135, global_step=3329.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   3%|▎         | 33/1208 [01:23<49:50,  2.54s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6.09e-5, train/loss_step=0.0135, global_step=3329.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   3%|▎         | 33/1208 [01:23<49:50,  2.54s/it, loss=0.108, v_num=0, train/loss_simple_step=0.039, train/loss_vlb_step=0.000142, train/loss_step=0.039, global_step=3330.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:   3%|▎         | 34/1208 [01:25<48:55,  2.50s/it, loss=0.108, v_num=0, train/loss_simple_step=0.039, train/loss_vlb_step=0.000142, train/loss_step=0.039, global_step=3330.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   3%|▎         | 34/1208 [01:25<48:55,  2.50s/it, loss=0.119, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00247, train/loss_step=0.402, global_step=3330.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:   3%|▎         | 35/1208 [01:26<48:04,  2.46s/it, loss=0.119, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00247, train/loss_step=0.402, global_step=3330.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   3%|▎         | 35/1208 [01:26<48:04,  2.46s/it, loss=0.128, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.00074, train/loss_step=0.198, global_step=3330.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   3%|▎         | 36/1208 [01:29<48:28,  2.48s/it, loss=0.128, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.00074, train/loss_step=0.198, global_step=3330.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   3%|▎         | 36/1208 [01:29<48:28,  2.48s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.48e-5, train/loss_step=0.00254, global_step=3330.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   3%|▎         | 37/1208 [01:30<47:40,  2.44s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.48e-5, train/loss_step=0.00254, global_step=3330.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   3%|▎         | 37/1208 [01:30<47:40,  2.44s/it, loss=0.114, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000333, train/loss_step=0.101, global_step=3331.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:   3%|▎         | 38/1208 [01:31<46:54,  2.41s/it, loss=0.114, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000333, train/loss_step=0.101, global_step=3331.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   3%|▎         | 38/1208 [01:31<46:54,  2.41s/it, loss=0.12, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000418, train/loss_step=0.127, global_step=3331.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:   3%|▎         | 39/1208 [01:32<46:11,  2.37s/it, loss=0.12, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000418, train/loss_step=0.127, global_step=3331.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   3%|▎         | 39/1208 [01:32<46:11,  2.37s/it, loss=0.131, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00156, train/loss_step=0.293, global_step=3331.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   3%|▎         | 40/1208 [01:35<46:36,  2.39s/it, loss=0.131, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00156, train/loss_step=0.293, global_step=3331.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   3%|▎         | 40/1208 [01:35<46:36,  2.39s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=2.05e-5, train/loss_step=0.00365, global_step=3331.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   3%|▎         | 41/1208 [01:36<45:56,  2.36s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=2.05e-5, train/loss_step=0.00365, global_step=3331.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   3%|▎         | 41/1208 [01:36<45:56,  2.36s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000167, train/loss_step=0.0445, global_step=3332.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:   3%|▎         | 42/1208 [01:37<45:16,  2.33s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000167, train/loss_step=0.0445, global_step=3332.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   3%|▎         | 42/1208 [01:37<45:16,  2.33s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=3.61e-5, train/loss_step=0.00742, global_step=3332.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   4%|▎         | 43/1208 [01:38<44:39,  2.30s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=3.61e-5, train/loss_step=0.00742, global_step=3332.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   4%|▎         | 43/1208 [01:38<44:39,  2.30s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=8.32e-5, train/loss_step=0.0211, global_step=3332.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:   4%|▎         | 44/1208 [01:42<45:02,  2.32s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=8.32e-5, train/loss_step=0.0211, global_step=3332.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   4%|▎         | 44/1208 [01:42<45:02,  2.32s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0608, train/loss_vlb_step=0.00021, train/loss_step=0.0608, global_step=3332.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   4%|▎         | 45/1208 [01:43<44:27,  2.29s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0608, train/loss_vlb_step=0.00021, train/loss_step=0.0608, global_step=3332.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   4%|▎         | 45/1208 [01:43<44:27,  2.29s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.2e-5, train/loss_step=0.0194, global_step=3333.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:   4%|▍         | 46/1208 [01:44<43:53,  2.27s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.2e-5, train/loss_step=0.0194, global_step=3333.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   4%|▍         | 46/1208 [01:44<43:53,  2.27s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0942, train/loss_vlb_step=0.000317, train/loss_step=0.0942, global_step=3333.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   4%|▍         | 47/1208 [01:45<43:20,  2.24s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0942, train/loss_vlb_step=0.000317, train/loss_step=0.0942, global_step=3333.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   4%|▍         | 47/1208 [01:45<43:20,  2.24s/it, loss=0.0945, v_num=0, train/loss_simple_step=0.0772, train/loss_vlb_step=0.000265, train/loss_step=0.0772, global_step=3333.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   4%|▍         | 48/1208 [01:48<43:42,  2.26s/it, loss=0.0945, v_num=0, train/loss_simple_step=0.0772, train/loss_vlb_step=0.000265, train/loss_step=0.0772, global_step=3333.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   4%|▍         | 48/1208 [01:48<43:42,  2.26s/it, loss=0.087, v_num=0, train/loss_simple_step=0.0779, train/loss_vlb_step=0.000259, train/loss_step=0.0779, global_step=3333.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:   4%|▍         | 49/1208 [01:49<43:12,  2.24s/it, loss=0.087, v_num=0, train/loss_simple_step=0.0779, train/loss_vlb_step=0.000259, train/loss_step=0.0779, global_step=3333.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   4%|▍         | 49/1208 [01:49<43:12,  2.24s/it, loss=0.0853, v_num=0, train/loss_simple_step=0.00927, train/loss_vlb_step=4.32e-5, train/loss_step=0.00927, global_step=3334.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   4%|▍         | 50/1208 [01:50<42:42,  2.21s/it, loss=0.0853, v_num=0, train/loss_simple_step=0.00927, train/loss_vlb_step=4.32e-5, train/loss_step=0.00927, global_step=3334.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   4%|▍         | 50/1208 [01:50<42:42,  2.21s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000653, train/loss_step=0.178, global_step=3334.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:   4%|▍         | 51/1208 [01:51<42:13,  2.19s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000653, train/loss_step=0.178, global_step=3334.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   4%|▍         | 51/1208 [01:51<42:13,  2.19s/it, loss=0.0893, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.73e-5, train/loss_step=0.0158, global_step=3334.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   4%|▍         | 52/1208 [01:54<42:36,  2.21s/it, loss=0.0893, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.73e-5, train/loss_step=0.0158, global_step=3334.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   4%|▍         | 52/1208 [01:54<42:36,  2.21s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000153, train/loss_step=0.0407, global_step=3334.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   4%|▍         | 53/1208 [01:56<42:09,  2.19s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000153, train/loss_step=0.0407, global_step=3334.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   4%|▍         | 53/1208 [01:56<42:09,  2.19s/it, loss=0.101, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.000966, train/loss_step=0.256, global_step=3335.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:   4%|▍         | 54/1208 [01:57<41:42,  2.17s/it, loss=0.101, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.000966, train/loss_step=0.256, global_step=3335.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   4%|▍         | 54/1208 [01:57<41:42,  2.17s/it, loss=0.0815, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=2.04e-5, train/loss_step=0.00373, global_step=3335.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   5%|▍         | 55/1208 [01:58<41:16,  2.15s/it, loss=0.0815, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=2.04e-5, train/loss_step=0.00373, global_step=3335.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   5%|▍         | 55/1208 [01:58<41:16,  2.15s/it, loss=0.0856, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.0012, train/loss_step=0.279, global_step=3335.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]     Epoch 11:   5%|▍         | 56/1208 [02:01<41:37,  2.17s/it, loss=0.0856, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.0012, train/loss_step=0.279, global_step=3335.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   5%|▍         | 56/1208 [02:01<41:37,  2.17s/it, loss=0.0863, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.94e-5, train/loss_step=0.0162, global_step=3335.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   5%|▍         | 57/1208 [02:02<41:13,  2.15s/it, loss=0.0863, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.94e-5, train/loss_step=0.0162, global_step=3335.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   5%|▍         | 57/1208 [02:02<41:13,  2.15s/it, loss=0.085, v_num=0, train/loss_simple_step=0.0763, train/loss_vlb_step=0.000254, train/loss_step=0.0763, global_step=3336.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   5%|▍         | 58/1208 [02:03<40:48,  2.13s/it, loss=0.085, v_num=0, train/loss_simple_step=0.0763, train/loss_vlb_step=0.000254, train/loss_step=0.0763, global_step=3336.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   5%|▍         | 58/1208 [02:03<40:48,  2.13s/it, loss=0.0788, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=1.46e-5, train/loss_step=0.00258, global_step=3336.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   5%|▍         | 59/1208 [02:04<40:25,  2.11s/it, loss=0.0788, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=1.46e-5, train/loss_step=0.00258, global_step=3336.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   5%|▍         | 59/1208 [02:04<40:25,  2.11s/it, loss=0.0682, v_num=0, train/loss_simple_step=0.0806, train/loss_vlb_step=0.00027, train/loss_step=0.0806, global_step=3336.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:   5%|▍         | 60/1208 [02:07<40:45,  2.13s/it, loss=0.0682, v_num=0, train/loss_simple_step=0.0806, train/loss_vlb_step=0.00027, train/loss_step=0.0806, global_step=3336.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   5%|▍         | 60/1208 [02:07<40:45,  2.13s/it, loss=0.0718, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000256, train/loss_step=0.0754, global_step=3336.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   5%|▌         | 61/1208 [02:08<40:23,  2.11s/it, loss=0.0718, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000256, train/loss_step=0.0754, global_step=3336.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   5%|▌         | 61/1208 [02:08<40:23,  2.11s/it, loss=0.0742, v_num=0, train/loss_simple_step=0.0919, train/loss_vlb_step=0.000308, train/loss_step=0.0919, global_step=3337.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   5%|▌         | 62/1208 [02:09<40:01,  2.10s/it, loss=0.0742, v_num=0, train/loss_simple_step=0.0919, train/loss_vlb_step=0.000308, train/loss_step=0.0919, global_step=3337.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   5%|▌         | 62/1208 [02:09<40:01,  2.10s/it, loss=0.0739, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.49e-5, train/loss_step=0.00254, global_step=3337.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   5%|▌         | 63/1208 [02:10<39:39,  2.08s/it, loss=0.0739, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.49e-5, train/loss_step=0.00254, global_step=3337.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   5%|▌         | 63/1208 [02:10<39:39,  2.08s/it, loss=0.0751, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000163, train/loss_step=0.0448, global_step=3337.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:   5%|▌         | 64/1208 [02:14<39:59,  2.10s/it, loss=0.0751, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000163, train/loss_step=0.0448, global_step=3337.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   5%|▌         | 64/1208 [02:14<39:59,  2.10s/it, loss=0.0745, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.000176, train/loss_step=0.0485, global_step=3337.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   5%|▌         | 65/1208 [02:15<39:38,  2.08s/it, loss=0.0745, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.000176, train/loss_step=0.0485, global_step=3337.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   5%|▌         | 65/1208 [02:15<39:38,  2.08s/it, loss=0.0736, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=1.35e-5, train/loss_step=0.00231, global_step=3338.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   5%|▌         | 66/1208 [02:16<39:18,  2.07s/it, loss=0.0736, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=1.35e-5, train/loss_step=0.00231, global_step=3338.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   5%|▌         | 66/1208 [02:16<39:18,  2.07s/it, loss=0.081, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00117, train/loss_step=0.243, global_step=3338.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]     Epoch 11:   6%|▌         | 67/1208 [02:17<38:58,  2.05s/it, loss=0.081, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00117, train/loss_step=0.243, global_step=3338.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   6%|▌         | 67/1208 [02:17<38:58,  2.05s/it, loss=0.0791, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000145, train/loss_step=0.0388, global_step=3338.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   6%|▌         | 68/1208 [02:20<39:17,  2.07s/it, loss=0.0791, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000145, train/loss_step=0.0388, global_step=3338.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   6%|▌         | 68/1208 [02:20<39:17,  2.07s/it, loss=0.0766, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000103, train/loss_step=0.0269, global_step=3338.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   6%|▌         | 69/1208 [02:21<38:58,  2.05s/it, loss=0.0766, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000103, train/loss_step=0.0269, global_step=3338.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   6%|▌         | 69/1208 [02:21<38:58,  2.05s/it, loss=0.0762, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.26e-5, train/loss_step=0.00218, global_step=3339.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   6%|▌         | 70/1208 [02:22<38:39,  2.04s/it, loss=0.0762, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.26e-5, train/loss_step=0.00218, global_step=3339.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   6%|▌         | 70/1208 [02:22<38:40,  2.04s/it, loss=0.0733, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000394, train/loss_step=0.119, global_step=3339.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:   6%|▌         | 71/1208 [02:23<38:21,  2.02s/it, loss=0.0733, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000394, train/loss_step=0.119, global_step=3339.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   6%|▌         | 71/1208 [02:23<38:21,  2.02s/it, loss=0.0746, v_num=0, train/loss_simple_step=0.0428, train/loss_vlb_step=0.000162, train/loss_step=0.0428, global_step=3339.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   6%|▌         | 72/1208 [02:27<38:39,  2.04s/it, loss=0.0746, v_num=0, train/loss_simple_step=0.0428, train/loss_vlb_step=0.000162, train/loss_step=0.0428, global_step=3339.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   6%|▌         | 72/1208 [02:27<38:39,  2.04s/it, loss=0.0729, v_num=0, train/loss_simple_step=0.00544, train/loss_vlb_step=2.89e-5, train/loss_step=0.00544, global_step=3339.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   6%|▌         | 73/1208 [02:28<38:22,  2.03s/it, loss=0.0729, v_num=0, train/loss_simple_step=0.00544, train/loss_vlb_step=2.89e-5, train/loss_step=0.00544, global_step=3339.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   6%|▌         | 73/1208 [02:28<38:22,  2.03s/it, loss=0.0605, v_num=0, train/loss_simple_step=0.00822, train/loss_vlb_step=3.93e-5, train/loss_step=0.00822, global_step=3340.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   6%|▌         | 74/1208 [02:29<38:05,  2.02s/it, loss=0.0605, v_num=0, train/loss_simple_step=0.00822, train/loss_vlb_step=3.93e-5, train/loss_step=0.00822, global_step=3340.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   6%|▌         | 74/1208 [02:29<38:05,  2.02s/it, loss=0.0618, v_num=0, train/loss_simple_step=0.030, train/loss_vlb_step=0.000121, train/loss_step=0.030, global_step=3340.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:   6%|▌         | 75/1208 [02:30<37:48,  2.00s/it, loss=0.0618, v_num=0, train/loss_simple_step=0.030, train/loss_vlb_step=0.000121, train/loss_step=0.030, global_step=3340.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   6%|▌         | 75/1208 [02:30<37:48,  2.00s/it, loss=0.0639, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00179, train/loss_step=0.321, global_step=3340.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:   6%|▋         | 76/1208 [02:33<38:05,  2.02s/it, loss=0.0639, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00179, train/loss_step=0.321, global_step=3340.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   6%|▋         | 76/1208 [02:33<38:05,  2.02s/it, loss=0.0713, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000556, train/loss_step=0.164, global_step=3340.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   6%|▋         | 77/1208 [02:34<37:49,  2.01s/it, loss=0.0713, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000556, train/loss_step=0.164, global_step=3340.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   6%|▋         | 77/1208 [02:34<37:49,  2.01s/it, loss=0.0755, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000535, train/loss_step=0.161, global_step=3341.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   6%|▋         | 78/1208 [02:35<37:33,  1.99s/it, loss=0.0755, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000535, train/loss_step=0.161, global_step=3341.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   6%|▋         | 78/1208 [02:35<37:33,  1.99s/it, loss=0.0757, v_num=0, train/loss_simple_step=0.00574, train/loss_vlb_step=2.94e-5, train/loss_step=0.00574, global_step=3341.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   7%|▋         | 79/1208 [02:36<37:17,  1.98s/it, loss=0.0757, v_num=0, train/loss_simple_step=0.00574, train/loss_vlb_step=2.94e-5, train/loss_step=0.00574, global_step=3341.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   7%|▋         | 79/1208 [02:36<37:17,  1.98s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00138, train/loss_step=0.296, global_step=3341.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:   7%|▋         | 80/1208 [02:39<37:35,  2.00s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00138, train/loss_step=0.296, global_step=3341.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   7%|▋         | 80/1208 [02:39<37:35,  2.00s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.00455, train/loss_vlb_step=2.33e-5, train/loss_step=0.00455, global_step=3341.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   7%|▋         | 81/1208 [02:41<37:20,  1.99s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.00455, train/loss_vlb_step=2.33e-5, train/loss_step=0.00455, global_step=3341.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   7%|▋         | 81/1208 [02:41<37:20,  1.99s/it, loss=0.0784, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.66e-5, train/loss_step=0.00296, global_step=3342.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   7%|▋         | 82/1208 [02:42<37:05,  1.98s/it, loss=0.0784, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.66e-5, train/loss_step=0.00296, global_step=3342.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   7%|▋         | 82/1208 [02:42<37:05,  1.98s/it, loss=0.0791, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.56e-5, train/loss_step=0.0151, global_step=3342.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:   7%|▋         | 83/1208 [02:43<36:50,  1.97s/it, loss=0.0791, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.56e-5, train/loss_step=0.0151, global_step=3342.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   7%|▋         | 83/1208 [02:43<36:50,  1.97s/it, loss=0.0803, v_num=0, train/loss_simple_step=0.0694, train/loss_vlb_step=0.000233, train/loss_step=0.0694, global_step=3342.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   7%|▋         | 84/1208 [02:46<37:06,  1.98s/it, loss=0.0803, v_num=0, train/loss_simple_step=0.0694, train/loss_vlb_step=0.000233, train/loss_step=0.0694, global_step=3342.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   7%|▋         | 84/1208 [02:46<37:06,  1.98s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.084, train/loss_vlb_step=0.00028, train/loss_step=0.084, global_step=3342.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:   7%|▋         | 85/1208 [02:47<36:52,  1.97s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.084, train/loss_vlb_step=0.00028, train/loss_step=0.084, global_step=3342.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   7%|▋         | 85/1208 [02:47<36:52,  1.97s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00146, train/loss_step=0.308, global_step=3343.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   7%|▋         | 86/1208 [02:48<36:38,  1.96s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00146, train/loss_step=0.308, global_step=3343.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   7%|▋         | 86/1208 [02:48<36:38,  1.96s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=9.87e-5, train/loss_step=0.0244, global_step=3343.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   7%|▋         | 87/1208 [02:49<36:24,  1.95s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=9.87e-5, train/loss_step=0.0244, global_step=3343.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   7%|▋         | 87/1208 [02:49<36:24,  1.95s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000892, train/loss_step=0.225, global_step=3343.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:   7%|▋         | 88/1208 [02:52<36:39,  1.96s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000892, train/loss_step=0.225, global_step=3343.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   7%|▋         | 88/1208 [02:52<36:39,  1.96s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000101, train/loss_step=0.026, global_step=3343.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   7%|▋         | 89/1208 [02:53<36:25,  1.95s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000101, train/loss_step=0.026, global_step=3343.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   7%|▋         | 89/1208 [02:53<36:25,  1.95s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=1.39e-5, train/loss_step=0.00232, global_step=3344.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   7%|▋         | 90/1208 [02:54<36:12,  1.94s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=1.39e-5, train/loss_step=0.00232, global_step=3344.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   7%|▋         | 90/1208 [02:54<36:12,  1.94s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.0534, train/loss_vlb_step=0.000188, train/loss_step=0.0534, global_step=3344.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:   8%|▊         | 91/1208 [02:55<35:59,  1.93s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.0534, train/loss_vlb_step=0.000188, train/loss_step=0.0534, global_step=3344.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   8%|▊         | 91/1208 [02:55<35:59,  1.93s/it, loss=0.1, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000714, train/loss_step=0.200, global_step=3344.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]     Epoch 11:   8%|▊         | 92/1208 [02:59<36:13,  1.95s/it, loss=0.1, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000714, train/loss_step=0.200, global_step=3344.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   8%|▊         | 92/1208 [02:59<36:13,  1.95s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.00014, train/loss_step=0.0373, global_step=3344.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   8%|▊         | 93/1208 [03:00<36:00,  1.94s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.00014, train/loss_step=0.0373, global_step=3344.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   8%|▊         | 93/1208 [03:00<36:00,  1.94s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0745, train/loss_vlb_step=0.000248, train/loss_step=0.0745, global_step=3345.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   8%|▊         | 94/1208 [03:01<35:48,  1.93s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0745, train/loss_vlb_step=0.000248, train/loss_step=0.0745, global_step=3345.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   8%|▊         | 94/1208 [03:01<35:48,  1.93s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0502, train/loss_vlb_step=0.000177, train/loss_step=0.0502, global_step=3345.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   8%|▊         | 95/1208 [03:02<35:35,  1.92s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0502, train/loss_vlb_step=0.000177, train/loss_step=0.0502, global_step=3345.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   8%|▊         | 95/1208 [03:02<35:35,  1.92s/it, loss=0.103, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.000965, train/loss_step=0.247, global_step=3345.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:   8%|▊         | 96/1208 [03:05<35:50,  1.93s/it, loss=0.103, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.000965, train/loss_step=0.247, global_step=3345.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   8%|▊         | 96/1208 [03:05<35:50,  1.93s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.0451, train/loss_vlb_step=0.000163, train/loss_step=0.0451, global_step=3345.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   8%|▊         | 97/1208 [03:06<35:38,  1.92s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.0451, train/loss_vlb_step=0.000163, train/loss_step=0.0451, global_step=3345.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   8%|▊         | 97/1208 [03:06<35:38,  1.92s/it, loss=0.0888, v_num=0, train/loss_simple_step=0.00391, train/loss_vlb_step=2.12e-5, train/loss_step=0.00391, global_step=3346.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   8%|▊         | 98/1208 [03:07<35:26,  1.92s/it, loss=0.0888, v_num=0, train/loss_simple_step=0.00391, train/loss_vlb_step=2.12e-5, train/loss_step=0.00391, global_step=3346.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   8%|▊         | 98/1208 [03:07<35:26,  1.92s/it, loss=0.104, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00165, train/loss_step=0.302, global_step=3346.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]     Epoch 11:   8%|▊         | 99/1208 [03:08<35:14,  1.91s/it, loss=0.104, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00165, train/loss_step=0.302, global_step=3346.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   8%|▊         | 99/1208 [03:08<35:14,  1.91s/it, loss=0.112, v_num=0, train/loss_simple_step=0.455, train/loss_vlb_step=0.00467, train/loss_step=0.455, global_step=3346.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   8%|▊         | 100/1208 [03:12<35:27,  1.92s/it, loss=0.112, v_num=0, train/loss_simple_step=0.455, train/loss_vlb_step=0.00467, train/loss_step=0.455, global_step=3346.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   8%|▊         | 100/1208 [03:12<35:27,  1.92s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=8.77e-5, train/loss_step=0.0224, global_step=3346.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   8%|▊         | 101/1208 [03:13<35:16,  1.91s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=8.77e-5, train/loss_step=0.0224, global_step=3346.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   8%|▊         | 101/1208 [03:13<35:16,  1.91s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.9e-5, train/loss_step=0.0155, global_step=3347.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:   8%|▊         | 102/1208 [03:14<35:05,  1.90s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.9e-5, train/loss_step=0.0155, global_step=3347.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   8%|▊         | 102/1208 [03:14<35:05,  1.90s/it, loss=0.118, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=3347.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   9%|▊         | 103/1208 [03:15<34:54,  1.90s/it, loss=0.118, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=3347.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   9%|▊         | 103/1208 [03:15<34:54,  1.90s/it, loss=0.126, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000953, train/loss_step=0.228, global_step=3347.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   9%|▊         | 104/1208 [03:18<35:06,  1.91s/it, loss=0.126, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000953, train/loss_step=0.228, global_step=3347.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   9%|▊         | 104/1208 [03:18<35:06,  1.91s/it, loss=0.141, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00343, train/loss_step=0.396, global_step=3347.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:   9%|▊         | 105/1208 [03:19<34:56,  1.90s/it, loss=0.141, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00343, train/loss_step=0.396, global_step=3347.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   9%|▊         | 105/1208 [03:19<34:56,  1.90s/it, loss=0.128, v_num=0, train/loss_simple_step=0.055, train/loss_vlb_step=0.000192, train/loss_step=0.055, global_step=3348.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   9%|▉         | 106/1208 [03:20<34:45,  1.89s/it, loss=0.128, v_num=0, train/loss_simple_step=0.055, train/loss_vlb_step=0.000192, train/loss_step=0.055, global_step=3348.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   9%|▉         | 106/1208 [03:20<34:45,  1.89s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.79e-5, train/loss_step=0.0104, global_step=3348.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   9%|▉         | 107/1208 [03:21<34:34,  1.88s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.79e-5, train/loss_step=0.0104, global_step=3348.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   9%|▉         | 107/1208 [03:21<34:34,  1.88s/it, loss=0.125, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000576, train/loss_step=0.173, global_step=3348.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:   9%|▉         | 108/1208 [03:24<34:46,  1.90s/it, loss=0.125, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000576, train/loss_step=0.173, global_step=3348.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   9%|▉         | 108/1208 [03:24<34:47,  1.90s/it, loss=0.154, v_num=0, train/loss_simple_step=0.596, train/loss_vlb_step=0.0223, train/loss_step=0.596, global_step=3348.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:   9%|▉         | 109/1208 [03:25<34:36,  1.89s/it, loss=0.154, v_num=0, train/loss_simple_step=0.596, train/loss_vlb_step=0.0223, train/loss_step=0.596, global_step=3348.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   9%|▉         | 109/1208 [03:25<34:36,  1.89s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0289, train/loss_vlb_step=0.000112, train/loss_step=0.0289, global_step=3349.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   9%|▉         | 110/1208 [03:27<34:26,  1.88s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0289, train/loss_vlb_step=0.000112, train/loss_step=0.0289, global_step=3349.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   9%|▉         | 110/1208 [03:27<34:26,  1.88s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000117, train/loss_step=0.0308, global_step=3349.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   9%|▉         | 111/1208 [03:28<34:16,  1.87s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000117, train/loss_step=0.0308, global_step=3349.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   9%|▉         | 111/1208 [03:28<34:16,  1.87s/it, loss=0.177, v_num=0, train/loss_simple_step=0.655, train/loss_vlb_step=0.0229, train/loss_step=0.655, global_step=3349.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:   9%|▉         | 112/1208 [03:31<34:28,  1.89s/it, loss=0.177, v_num=0, train/loss_simple_step=0.655, train/loss_vlb_step=0.0229, train/loss_step=0.655, global_step=3349.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   9%|▉         | 112/1208 [03:31<34:28,  1.89s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0976, train/loss_vlb_step=0.000324, train/loss_step=0.0976, global_step=3349.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   9%|▉         | 113/1208 [03:32<34:18,  1.88s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0976, train/loss_vlb_step=0.000324, train/loss_step=0.0976, global_step=3349.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   9%|▉         | 113/1208 [03:32<34:18,  1.88s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0569, train/loss_vlb_step=0.000204, train/loss_step=0.0569, global_step=3350.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   9%|▉         | 114/1208 [03:33<34:08,  1.87s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0569, train/loss_vlb_step=0.000204, train/loss_step=0.0569, global_step=3350.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:   9%|▉         | 114/1208 [03:33<34:08,  1.87s/it, loss=0.183, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000422, train/loss_step=0.127, global_step=3350.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  10%|▉         | 115/1208 [03:34<33:58,  1.87s/it, loss=0.183, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000422, train/loss_step=0.127, global_step=3350.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  10%|▉         | 115/1208 [03:34<33:58,  1.87s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.09e-5, train/loss_step=0.0111, global_step=3350.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  10%|▉         | 116/1208 [03:37<34:09,  1.88s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.09e-5, train/loss_step=0.0111, global_step=3350.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  10%|▉         | 116/1208 [03:37<34:09,  1.88s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=4.97e-5, train/loss_step=0.0111, global_step=3350.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  10%|▉         | 117/1208 [03:38<34:00,  1.87s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=4.97e-5, train/loss_step=0.0111, global_step=3350.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  10%|▉         | 117/1208 [03:38<34:00,  1.87s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=9.16e-5, train/loss_step=0.0225, global_step=3351.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  10%|▉         | 118/1208 [03:39<33:50,  1.86s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=9.16e-5, train/loss_step=0.0225, global_step=3351.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  10%|▉         | 118/1208 [03:39<33:50,  1.86s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0655, train/loss_vlb_step=0.00022, train/loss_step=0.0655, global_step=3351.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  10%|▉         | 119/1208 [03:40<33:41,  1.86s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0655, train/loss_vlb_step=0.00022, train/loss_step=0.0655, global_step=3351.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  10%|▉         | 119/1208 [03:40<33:41,  1.86s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00681, train/loss_vlb_step=3.5e-5, train/loss_step=0.00681, global_step=3351.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  10%|▉         | 120/1208 [03:44<33:52,  1.87s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00681, train/loss_vlb_step=3.5e-5, train/loss_step=0.00681, global_step=3351.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  10%|▉         | 120/1208 [03:44<33:52,  1.87s/it, loss=0.136, v_num=0, train/loss_simple_step=0.036, train/loss_vlb_step=0.000131, train/loss_step=0.036, global_step=3351.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  10%|█         | 121/1208 [03:45<33:43,  1.86s/it, loss=0.136, v_num=0, train/loss_simple_step=0.036, train/loss_vlb_step=0.000131, train/loss_step=0.036, global_step=3351.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  10%|█         | 121/1208 [03:45<33:43,  1.86s/it, loss=0.169, v_num=0, train/loss_simple_step=0.660, train/loss_vlb_step=0.0129, train/loss_step=0.660, global_step=3352.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  10%|█         | 122/1208 [03:46<33:34,  1.85s/it, loss=0.169, v_num=0, train/loss_simple_step=0.660, train/loss_vlb_step=0.0129, train/loss_step=0.660, global_step=3352.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  10%|█         | 122/1208 [03:46<33:34,  1.85s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.19e-5, train/loss_step=0.00409, global_step=3352.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  10%|█         | 123/1208 [03:47<33:25,  1.85s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.19e-5, train/loss_step=0.00409, global_step=3352.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  10%|█         | 123/1208 [03:47<33:25,  1.85s/it, loss=0.159, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.00046, train/loss_step=0.139, global_step=3352.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  10%|█         | 124/1208 [03:50<33:35,  1.86s/it, loss=0.159, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.00046, train/loss_step=0.139, global_step=3352.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  10%|█         | 124/1208 [03:50<33:35,  1.86s/it, loss=0.154, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00125, train/loss_step=0.293, global_step=3352.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  10%|█         | 125/1208 [03:51<33:26,  1.85s/it, loss=0.154, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00125, train/loss_step=0.293, global_step=3352.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  10%|█         | 125/1208 [03:51<33:26,  1.85s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.59e-5, train/loss_step=0.00278, global_step=3353.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  10%|█         | 126/1208 [03:52<33:17,  1.85s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.59e-5, train/loss_step=0.00278, global_step=3353.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  10%|█         | 126/1208 [03:52<33:17,  1.85s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.82e-5, train/loss_step=0.0131, global_step=3353.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  11%|█         | 127/1208 [03:53<33:08,  1.84s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.82e-5, train/loss_step=0.0131, global_step=3353.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  11%|█         | 127/1208 [03:53<33:08,  1.84s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000112, train/loss_step=0.0295, global_step=3353.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  11%|█         | 128/1208 [03:56<33:18,  1.85s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000112, train/loss_step=0.0295, global_step=3353.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  11%|█         | 128/1208 [03:56<33:18,  1.85s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0587, train/loss_vlb_step=0.000204, train/loss_step=0.0587, global_step=3353.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  11%|█         | 129/1208 [03:57<33:10,  1.84s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0587, train/loss_vlb_step=0.000204, train/loss_step=0.0587, global_step=3353.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  11%|█         | 129/1208 [03:57<33:10,  1.84s/it, loss=0.122, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000412, train/loss_step=0.126, global_step=3354.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  11%|█         | 130/1208 [03:58<33:01,  1.84s/it, loss=0.122, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000412, train/loss_step=0.126, global_step=3354.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  11%|█         | 130/1208 [03:58<33:01,  1.84s/it, loss=0.129, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000636, train/loss_step=0.173, global_step=3354.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  11%|█         | 131/1208 [04:00<32:53,  1.83s/it, loss=0.129, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000636, train/loss_step=0.173, global_step=3354.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  11%|█         | 131/1208 [04:00<32:53,  1.83s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=9.04e-5, train/loss_step=0.0212, global_step=3354.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  11%|█         | 132/1208 [04:03<33:03,  1.84s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=9.04e-5, train/loss_step=0.0212, global_step=3354.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  11%|█         | 132/1208 [04:03<33:03,  1.84s/it, loss=0.0938, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.32e-5, train/loss_step=0.0197, global_step=3354.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  11%|█         | 133/1208 [04:04<32:55,  1.84s/it, loss=0.0938, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.32e-5, train/loss_step=0.0197, global_step=3354.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  11%|█         | 133/1208 [04:04<32:55,  1.84s/it, loss=0.103, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.000981, train/loss_step=0.249, global_step=3355.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  11%|█         | 134/1208 [04:05<32:47,  1.83s/it, loss=0.103, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.000981, train/loss_step=0.249, global_step=3355.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  11%|█         | 134/1208 [04:05<32:47,  1.83s/it, loss=0.112, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.0013, train/loss_step=0.291, global_step=3355.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  11%|█         | 135/1208 [04:06<32:39,  1.83s/it, loss=0.112, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.0013, train/loss_step=0.291, global_step=3355.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  11%|█         | 135/1208 [04:06<32:39,  1.83s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.03e-5, train/loss_step=0.0166, global_step=3355.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  11%|█▏        | 136/1208 [04:09<32:48,  1.84s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.03e-5, train/loss_step=0.0166, global_step=3355.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  11%|█▏        | 136/1208 [04:09<32:48,  1.84s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=0.000103, train/loss_step=0.0244, global_step=3355.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  11%|█▏        | 137/1208 [04:10<32:40,  1.83s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=0.000103, train/loss_step=0.0244, global_step=3355.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  11%|█▏        | 137/1208 [04:10<32:40,  1.83s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7.17e-5, train/loss_step=0.0165, global_step=3356.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  11%|█▏        | 138/1208 [04:11<32:32,  1.82s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7.17e-5, train/loss_step=0.0165, global_step=3356.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  11%|█▏        | 138/1208 [04:11<32:32,  1.82s/it, loss=0.117, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000527, train/loss_step=0.157, global_step=3356.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  12%|█▏        | 139/1208 [04:12<32:24,  1.82s/it, loss=0.117, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000527, train/loss_step=0.157, global_step=3356.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  12%|█▏        | 139/1208 [04:12<32:24,  1.82s/it, loss=0.121, v_num=0, train/loss_simple_step=0.082, train/loss_vlb_step=0.000274, train/loss_step=0.082, global_step=3356.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  12%|█▏        | 140/1208 [04:16<32:34,  1.83s/it, loss=0.121, v_num=0, train/loss_simple_step=0.082, train/loss_vlb_step=0.000274, train/loss_step=0.082, global_step=3356.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  12%|█▏        | 140/1208 [04:16<32:34,  1.83s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000119, train/loss_step=0.0287, global_step=3356.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  12%|█▏        | 141/1208 [04:17<32:27,  1.83s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000119, train/loss_step=0.0287, global_step=3356.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  12%|█▏        | 141/1208 [04:17<32:27,  1.83s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000623, train/loss_step=0.176, global_step=3357.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  12%|█▏        | 142/1208 [04:18<32:19,  1.82s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000623, train/loss_step=0.176, global_step=3357.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  12%|█▏        | 142/1208 [04:18<32:19,  1.82s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.53e-5, train/loss_step=0.0122, global_step=3357.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  12%|█▏        | 143/1208 [04:19<32:12,  1.81s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.53e-5, train/loss_step=0.0122, global_step=3357.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  12%|█▏        | 143/1208 [04:19<32:12,  1.81s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.0903, train/loss_vlb_step=0.000297, train/loss_step=0.0903, global_step=3357.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  12%|█▏        | 144/1208 [04:22<32:20,  1.82s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.0903, train/loss_vlb_step=0.000297, train/loss_step=0.0903, global_step=3357.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  12%|█▏        | 144/1208 [04:22<32:20,  1.82s/it, loss=0.0796, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.55e-5, train/loss_step=0.0026, global_step=3357.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  12%|█▏        | 145/1208 [04:23<32:13,  1.82s/it, loss=0.0796, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.55e-5, train/loss_step=0.0026, global_step=3357.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  12%|█▏        | 145/1208 [04:23<32:13,  1.82s/it, loss=0.0811, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000122, train/loss_step=0.0334, global_step=3358.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  12%|█▏        | 146/1208 [04:24<32:06,  1.81s/it, loss=0.0811, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000122, train/loss_step=0.0334, global_step=3358.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  12%|█▏        | 146/1208 [04:24<32:06,  1.81s/it, loss=0.0816, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=9.2e-5, train/loss_step=0.0223, global_step=3358.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  12%|█▏        | 147/1208 [04:25<31:58,  1.81s/it, loss=0.0816, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=9.2e-5, train/loss_step=0.0223, global_step=3358.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  12%|█▏        | 147/1208 [04:25<31:58,  1.81s/it, loss=0.115, v_num=0, train/loss_simple_step=0.697, train/loss_vlb_step=0.071, train/loss_step=0.697, global_step=3358.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  12%|█▏        | 148/1208 [04:29<32:07,  1.82s/it, loss=0.115, v_num=0, train/loss_simple_step=0.697, train/loss_vlb_step=0.071, train/loss_step=0.697, global_step=3358.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  12%|█▏        | 148/1208 [04:29<32:07,  1.82s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.00017, train/loss_step=0.0476, global_step=3358.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  12%|█▏        | 149/1208 [04:30<32:00,  1.81s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.00017, train/loss_step=0.0476, global_step=3358.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  12%|█▏        | 149/1208 [04:30<32:00,  1.81s/it, loss=0.114, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=3359.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  12%|█▏        | 150/1208 [04:31<31:52,  1.81s/it, loss=0.114, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=3359.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  12%|█▏        | 150/1208 [04:31<31:52,  1.81s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0998, train/loss_vlb_step=0.000328, train/loss_step=0.0998, global_step=3359.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  12%|█▎        | 151/1208 [04:32<31:45,  1.80s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0998, train/loss_vlb_step=0.000328, train/loss_step=0.0998, global_step=3359.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  12%|█▎        | 151/1208 [04:32<31:45,  1.80s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0837, train/loss_vlb_step=0.000284, train/loss_step=0.0837, global_step=3359.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  13%|█▎        | 152/1208 [04:35<31:54,  1.81s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0837, train/loss_vlb_step=0.000284, train/loss_step=0.0837, global_step=3359.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  13%|█▎        | 152/1208 [04:35<31:54,  1.81s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0643, train/loss_vlb_step=0.000224, train/loss_step=0.0643, global_step=3359.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  13%|█▎        | 153/1208 [04:36<31:47,  1.81s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0643, train/loss_vlb_step=0.000224, train/loss_step=0.0643, global_step=3359.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  13%|█▎        | 153/1208 [04:36<31:47,  1.81s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0586, train/loss_vlb_step=0.000205, train/loss_step=0.0586, global_step=3360.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  13%|█▎        | 154/1208 [04:37<31:40,  1.80s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0586, train/loss_vlb_step=0.000205, train/loss_step=0.0586, global_step=3360.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  13%|█▎        | 154/1208 [04:37<31:40,  1.80s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.42e-5, train/loss_step=0.00244, global_step=3360.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  13%|█▎        | 155/1208 [04:38<31:33,  1.80s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.42e-5, train/loss_step=0.00244, global_step=3360.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  13%|█▎        | 155/1208 [04:38<31:33,  1.80s/it, loss=0.114, v_num=0, train/loss_simple_step=0.473, train/loss_vlb_step=0.00754, train/loss_step=0.473, global_step=3360.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]     Epoch 11:  13%|█▎        | 156/1208 [04:41<31:41,  1.81s/it, loss=0.114, v_num=0, train/loss_simple_step=0.473, train/loss_vlb_step=0.00754, train/loss_step=0.473, global_step=3360.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  13%|█▎        | 156/1208 [04:41<31:41,  1.81s/it, loss=0.125, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000874, train/loss_step=0.228, global_step=3360.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  13%|█▎        | 157/1208 [04:42<31:34,  1.80s/it, loss=0.125, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000874, train/loss_step=0.228, global_step=3360.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  13%|█▎        | 157/1208 [04:42<31:34,  1.80s/it, loss=0.136, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00101, train/loss_step=0.239, global_step=3361.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  13%|█▎        | 158/1208 [04:44<31:27,  1.80s/it, loss=0.136, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00101, train/loss_step=0.239, global_step=3361.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  13%|█▎        | 158/1208 [04:44<31:27,  1.80s/it, loss=0.14, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000828, train/loss_step=0.235, global_step=3361.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  13%|█▎        | 159/1208 [04:45<31:20,  1.79s/it, loss=0.14, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000828, train/loss_step=0.235, global_step=3361.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  13%|█▎        | 159/1208 [04:45<31:20,  1.79s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=1.39e-5, train/loss_step=0.0025, global_step=3361.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  13%|█▎        | 160/1208 [04:48<31:28,  1.80s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=1.39e-5, train/loss_step=0.0025, global_step=3361.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  13%|█▎        | 160/1208 [04:48<31:28,  1.80s/it, loss=0.137, v_num=0, train/loss_simple_step=0.052, train/loss_vlb_step=0.000187, train/loss_step=0.052, global_step=3361.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  13%|█▎        | 161/1208 [04:49<31:22,  1.80s/it, loss=0.137, v_num=0, train/loss_simple_step=0.052, train/loss_vlb_step=0.000187, train/loss_step=0.052, global_step=3361.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  13%|█▎        | 161/1208 [04:49<31:22,  1.80s/it, loss=0.154, v_num=0, train/loss_simple_step=0.523, train/loss_vlb_step=0.00476, train/loss_step=0.523, global_step=3362.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  13%|█▎        | 162/1208 [04:50<31:15,  1.79s/it, loss=0.154, v_num=0, train/loss_simple_step=0.523, train/loss_vlb_step=0.00476, train/loss_step=0.523, global_step=3362.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  13%|█▎        | 162/1208 [04:50<31:15,  1.79s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00571, train/loss_vlb_step=2.96e-5, train/loss_step=0.00571, global_step=3362.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  13%|█▎        | 163/1208 [04:51<31:08,  1.79s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00571, train/loss_vlb_step=2.96e-5, train/loss_step=0.00571, global_step=3362.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  13%|█▎        | 163/1208 [04:51<31:08,  1.79s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.00012, train/loss_step=0.0309, global_step=3362.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  14%|█▎        | 164/1208 [04:54<31:16,  1.80s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.00012, train/loss_step=0.0309, global_step=3362.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  14%|█▎        | 164/1208 [04:54<31:16,  1.80s/it, loss=0.154, v_num=0, train/loss_simple_step=0.059, train/loss_vlb_step=0.000198, train/loss_step=0.059, global_step=3362.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  14%|█▎        | 165/1208 [04:55<31:10,  1.79s/it, loss=0.154, v_num=0, train/loss_simple_step=0.059, train/loss_vlb_step=0.000198, train/loss_step=0.059, global_step=3362.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  14%|█▎        | 165/1208 [04:55<31:10,  1.79s/it, loss=0.167, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00119, train/loss_step=0.293, global_step=3363.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  14%|█▎        | 166/1208 [04:56<31:03,  1.79s/it, loss=0.167, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00119, train/loss_step=0.293, global_step=3363.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  14%|█▎        | 166/1208 [04:56<31:03,  1.79s/it, loss=0.178, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00102, train/loss_step=0.251, global_step=3363.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  14%|█▍        | 167/1208 [04:57<30:57,  1.78s/it, loss=0.178, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00102, train/loss_step=0.251, global_step=3363.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  14%|█▍        | 167/1208 [04:57<30:57,  1.78s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.95e-5, train/loss_step=0.00352, global_step=3363.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  14%|█▍        | 168/1208 [05:01<31:04,  1.79s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.95e-5, train/loss_step=0.00352, global_step=3363.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  14%|█▍        | 168/1208 [05:01<31:04,  1.79s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000103, train/loss_step=0.0262, global_step=3363.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  14%|█▍        | 169/1208 [05:02<30:58,  1.79s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000103, train/loss_step=0.0262, global_step=3363.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  14%|█▍        | 169/1208 [05:02<30:58,  1.79s/it, loss=0.152, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00189, train/loss_step=0.316, global_step=3364.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  14%|█▍        | 170/1208 [05:03<30:52,  1.78s/it, loss=0.152, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00189, train/loss_step=0.316, global_step=3364.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  14%|█▍        | 170/1208 [05:03<30:52,  1.78s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00563, train/loss_vlb_step=2.87e-5, train/loss_step=0.00563, global_step=3364.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  14%|█▍        | 171/1208 [05:04<30:45,  1.78s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00563, train/loss_vlb_step=2.87e-5, train/loss_step=0.00563, global_step=3364.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  14%|█▍        | 171/1208 [05:04<30:45,  1.78s/it, loss=0.171, v_num=0, train/loss_simple_step=0.541, train/loss_vlb_step=0.00532, train/loss_step=0.541, global_step=3364.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  14%|█▍        | 172/1208 [05:07<30:53,  1.79s/it, loss=0.171, v_num=0, train/loss_simple_step=0.541, train/loss_vlb_step=0.00532, train/loss_step=0.541, global_step=3364.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  14%|█▍        | 172/1208 [05:07<30:53,  1.79s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000107, train/loss_step=0.0268, global_step=3364.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  14%|█▍        | 173/1208 [05:08<30:47,  1.79s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000107, train/loss_step=0.0268, global_step=3364.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  14%|█▍        | 173/1208 [05:08<30:47,  1.79s/it, loss=0.204, v_num=0, train/loss_simple_step=0.769, train/loss_vlb_step=0.0398, train/loss_step=0.769, global_step=3365.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  14%|█▍        | 174/1208 [05:09<30:41,  1.78s/it, loss=0.204, v_num=0, train/loss_simple_step=0.769, train/loss_vlb_step=0.0398, train/loss_step=0.769, global_step=3365.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  14%|█▍        | 174/1208 [05:09<30:41,  1.78s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0882, train/loss_vlb_step=0.000292, train/loss_step=0.0882, global_step=3365.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  14%|█▍        | 175/1208 [05:10<30:35,  1.78s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0882, train/loss_vlb_step=0.000292, train/loss_step=0.0882, global_step=3365.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  14%|█▍        | 175/1208 [05:10<30:35,  1.78s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.16e-5, train/loss_step=0.00192, global_step=3365.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  15%|█▍        | 176/1208 [05:14<30:42,  1.79s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.16e-5, train/loss_step=0.00192, global_step=3365.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  15%|█▍        | 176/1208 [05:14<30:42,  1.79s/it, loss=0.185, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000815, train/loss_step=0.221, global_step=3365.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  15%|█▍        | 177/1208 [05:15<30:36,  1.78s/it, loss=0.185, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000815, train/loss_step=0.221, global_step=3365.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  15%|█▍        | 177/1208 [05:15<30:36,  1.78s/it, loss=0.18, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000489, train/loss_step=0.148, global_step=3366.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  15%|█▍        | 178/1208 [05:16<30:30,  1.78s/it, loss=0.18, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000489, train/loss_step=0.148, global_step=3366.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  15%|█▍        | 178/1208 [05:16<30:30,  1.78s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00172, train/loss_vlb_step=1.02e-5, train/loss_step=0.00172, global_step=3366.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  15%|█▍        | 179/1208 [05:17<30:24,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00172, train/loss_vlb_step=1.02e-5, train/loss_step=0.00172, global_step=3366.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  15%|█▍        | 179/1208 [05:17<30:24,  1.77s/it, loss=0.187, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.0021, train/loss_step=0.375, global_step=3366.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]     Epoch 11:  15%|█▍        | 180/1208 [05:20<30:30,  1.78s/it, loss=0.187, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.0021, train/loss_step=0.375, global_step=3366.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  15%|█▍        | 180/1208 [05:20<30:30,  1.78s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.000177, train/loss_step=0.0485, global_step=3366.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  15%|█▍        | 181/1208 [05:21<30:24,  1.78s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.000177, train/loss_step=0.0485, global_step=3366.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  15%|█▍        | 181/1208 [05:21<30:24,  1.78s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=8.83e-5, train/loss_step=0.0226, global_step=3367.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  15%|█▌        | 182/1208 [05:22<30:19,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=8.83e-5, train/loss_step=0.0226, global_step=3367.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  15%|█▌        | 182/1208 [05:22<30:19,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.86e-5, train/loss_step=0.0033, global_step=3367.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  15%|█▌        | 183/1208 [05:23<30:13,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.86e-5, train/loss_step=0.0033, global_step=3367.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  15%|█▌        | 183/1208 [05:23<30:13,  1.77s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=2.07e-5, train/loss_step=0.00384, global_step=3367.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  15%|█▌        | 184/1208 [05:26<30:19,  1.78s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=2.07e-5, train/loss_step=0.00384, global_step=3367.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  15%|█▌        | 184/1208 [05:26<30:19,  1.78s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0771, train/loss_vlb_step=0.000257, train/loss_step=0.0771, global_step=3367.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  15%|█▌        | 185/1208 [05:28<30:14,  1.77s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0771, train/loss_vlb_step=0.000257, train/loss_step=0.0771, global_step=3367.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  15%|█▌        | 185/1208 [05:28<30:14,  1.77s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00929, train/loss_vlb_step=4.27e-5, train/loss_step=0.00929, global_step=3368.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  15%|█▌        | 186/1208 [05:29<30:08,  1.77s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00929, train/loss_vlb_step=4.27e-5, train/loss_step=0.00929, global_step=3368.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  15%|█▌        | 186/1208 [05:29<30:08,  1.77s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.17e-5, train/loss_step=0.0138, global_step=3368.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  15%|█▌        | 187/1208 [05:30<30:02,  1.77s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.17e-5, train/loss_step=0.0138, global_step=3368.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  15%|█▌        | 187/1208 [05:30<30:02,  1.77s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0865, train/loss_vlb_step=0.000284, train/loss_step=0.0865, global_step=3368.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  16%|█▌        | 188/1208 [05:33<30:08,  1.77s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0865, train/loss_vlb_step=0.000284, train/loss_step=0.0865, global_step=3368.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  16%|█▌        | 188/1208 [05:33<30:08,  1.77s/it, loss=0.15, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000911, train/loss_step=0.241, global_step=3368.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  16%|█▌        | 189/1208 [05:34<30:02,  1.77s/it, loss=0.15, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000911, train/loss_step=0.241, global_step=3368.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  16%|█▌        | 189/1208 [05:34<30:02,  1.77s/it, loss=0.165, v_num=0, train/loss_simple_step=0.613, train/loss_vlb_step=0.0289, train/loss_step=0.613, global_step=3369.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  16%|█▌        | 190/1208 [05:35<29:57,  1.77s/it, loss=0.165, v_num=0, train/loss_simple_step=0.613, train/loss_vlb_step=0.0289, train/loss_step=0.613, global_step=3369.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  16%|█▌        | 190/1208 [05:35<29:57,  1.77s/it, loss=0.172, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000465, train/loss_step=0.141, global_step=3369.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  16%|█▌        | 191/1208 [05:36<29:51,  1.76s/it, loss=0.172, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000465, train/loss_step=0.141, global_step=3369.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  16%|█▌        | 191/1208 [05:36<29:51,  1.76s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00455, train/loss_vlb_step=2.34e-5, train/loss_step=0.00455, global_step=3369.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  16%|█▌        | 192/1208 [05:39<29:57,  1.77s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00455, train/loss_vlb_step=2.34e-5, train/loss_step=0.00455, global_step=3369.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  16%|█▌        | 192/1208 [05:39<29:57,  1.77s/it, loss=0.16, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00171, train/loss_step=0.334, global_step=3369.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]     Epoch 11:  16%|█▌        | 193/1208 [05:40<29:52,  1.77s/it, loss=0.16, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00171, train/loss_step=0.334, global_step=3369.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  16%|█▌        | 193/1208 [05:40<29:52,  1.77s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00931, train/loss_vlb_step=4.45e-5, train/loss_step=0.00931, global_step=3370.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  16%|█▌        | 194/1208 [05:41<29:46,  1.76s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00931, train/loss_vlb_step=4.45e-5, train/loss_step=0.00931, global_step=3370.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  16%|█▌        | 194/1208 [05:41<29:46,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000436, train/loss_step=0.129, global_step=3370.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  16%|█▌        | 195/1208 [05:42<29:41,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000436, train/loss_step=0.129, global_step=3370.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  16%|█▌        | 195/1208 [05:42<29:41,  1.76s/it, loss=0.137, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00106, train/loss_step=0.266, global_step=3370.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  16%|█▌        | 196/1208 [05:46<29:47,  1.77s/it, loss=0.137, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00106, train/loss_step=0.266, global_step=3370.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  16%|█▌        | 196/1208 [05:46<29:47,  1.77s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.84e-5, train/loss_step=0.00331, global_step=3370.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  16%|█▋        | 197/1208 [05:47<29:41,  1.76s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.84e-5, train/loss_step=0.00331, global_step=3370.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  16%|█▋        | 197/1208 [05:47<29:41,  1.76s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.14e-5, train/loss_step=0.0196, global_step=3371.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  16%|█▋        | 198/1208 [05:48<29:36,  1.76s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.14e-5, train/loss_step=0.0196, global_step=3371.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  16%|█▋        | 198/1208 [05:48<29:36,  1.76s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.00017, train/loss_step=0.0476, global_step=3371.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  16%|█▋        | 199/1208 [05:49<29:30,  1.76s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.00017, train/loss_step=0.0476, global_step=3371.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  16%|█▋        | 199/1208 [05:49<29:30,  1.76s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000162, train/loss_step=0.0463, global_step=3371.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  17%|█▋        | 200/1208 [05:52<29:37,  1.76s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000162, train/loss_step=0.0463, global_step=3371.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  17%|█▋        | 200/1208 [05:52<29:37,  1.76s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.21e-5, train/loss_step=0.0239, global_step=3371.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  17%|█▋        | 201/1208 [05:53<29:31,  1.76s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.21e-5, train/loss_step=0.0239, global_step=3371.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  17%|█▋        | 201/1208 [05:53<29:31,  1.76s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000114, train/loss_step=0.0302, global_step=3372.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  17%|█▋        | 202/1208 [05:54<29:26,  1.76s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000114, train/loss_step=0.0302, global_step=3372.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  17%|█▋        | 202/1208 [05:54<29:26,  1.76s/it, loss=0.122, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00221, train/loss_step=0.346, global_step=3372.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  17%|█▋        | 203/1208 [05:55<29:21,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00221, train/loss_step=0.346, global_step=3372.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  17%|█▋        | 203/1208 [05:55<29:21,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000442, train/loss_step=0.134, global_step=3372.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  17%|█▋        | 204/1208 [05:59<29:26,  1.76s/it, loss=0.129, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000442, train/loss_step=0.134, global_step=3372.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  17%|█▋        | 204/1208 [05:59<29:27,  1.76s/it, loss=0.127, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.000124, train/loss_step=0.033, global_step=3372.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  17%|█▋        | 205/1208 [06:00<29:21,  1.76s/it, loss=0.127, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.000124, train/loss_step=0.033, global_step=3372.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  17%|█▋        | 205/1208 [06:00<29:21,  1.76s/it, loss=0.134, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000516, train/loss_step=0.149, global_step=3373.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  17%|█▋        | 206/1208 [06:01<29:16,  1.75s/it, loss=0.134, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000516, train/loss_step=0.149, global_step=3373.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  17%|█▋        | 206/1208 [06:01<29:16,  1.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00267, train/loss_step=0.362, global_step=3373.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  17%|█▋        | 207/1208 [06:02<29:11,  1.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00267, train/loss_step=0.362, global_step=3373.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  17%|█▋        | 207/1208 [06:02<29:11,  1.75s/it, loss=0.174, v_num=0, train/loss_simple_step=0.538, train/loss_vlb_step=0.00816, train/loss_step=0.538, global_step=3373.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  17%|█▋        | 208/1208 [06:05<29:17,  1.76s/it, loss=0.174, v_num=0, train/loss_simple_step=0.538, train/loss_vlb_step=0.00816, train/loss_step=0.538, global_step=3373.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  17%|█▋        | 208/1208 [06:05<29:17,  1.76s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0609, train/loss_vlb_step=0.000214, train/loss_step=0.0609, global_step=3373.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  17%|█▋        | 209/1208 [06:06<29:11,  1.75s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0609, train/loss_vlb_step=0.000214, train/loss_step=0.0609, global_step=3373.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  17%|█▋        | 209/1208 [06:06<29:11,  1.75s/it, loss=0.145, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.00094, train/loss_step=0.219, global_step=3374.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  17%|█▋        | 210/1208 [06:07<29:06,  1.75s/it, loss=0.145, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.00094, train/loss_step=0.219, global_step=3374.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  17%|█▋        | 210/1208 [06:07<29:06,  1.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0845, train/loss_vlb_step=0.00028, train/loss_step=0.0845, global_step=3374.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  17%|█▋        | 211/1208 [06:08<29:01,  1.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0845, train/loss_vlb_step=0.00028, train/loss_step=0.0845, global_step=3374.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  17%|█▋        | 211/1208 [06:08<29:01,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000891, train/loss_step=0.235, global_step=3374.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  18%|█▊        | 212/1208 [06:11<29:07,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000891, train/loss_step=0.235, global_step=3374.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  18%|█▊        | 212/1208 [06:11<29:07,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.9e-5, train/loss_step=0.0159, global_step=3374.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  18%|█▊        | 213/1208 [06:12<29:02,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.9e-5, train/loss_step=0.0159, global_step=3374.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  18%|█▊        | 213/1208 [06:12<29:02,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=3375.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  18%|█▊        | 214/1208 [06:13<28:56,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=3375.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  18%|█▊        | 214/1208 [06:13<28:56,  1.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=3375.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  18%|█▊        | 215/1208 [06:14<28:51,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=3375.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  18%|█▊        | 215/1208 [06:14<28:51,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.0011, train/loss_step=0.259, global_step=3375.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  18%|█▊        | 216/1208 [06:18<28:57,  1.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.0011, train/loss_step=0.259, global_step=3375.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  18%|█▊        | 216/1208 [06:18<28:57,  1.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00856, train/loss_vlb_step=4.08e-5, train/loss_step=0.00856, global_step=3375.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  18%|█▊        | 217/1208 [06:19<28:52,  1.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00856, train/loss_vlb_step=4.08e-5, train/loss_step=0.00856, global_step=3375.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  18%|█▊        | 217/1208 [06:19<28:52,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0049, train/loss_vlb_step=2.63e-5, train/loss_step=0.0049, global_step=3376.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  18%|█▊        | 218/1208 [06:20<28:47,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0049, train/loss_vlb_step=2.63e-5, train/loss_step=0.0049, global_step=3376.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  18%|█▊        | 218/1208 [06:20<28:47,  1.75s/it, loss=0.166, v_num=0, train/loss_simple_step=0.534, train/loss_vlb_step=0.0101, train/loss_step=0.534, global_step=3376.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  18%|█▊        | 219/1208 [06:21<28:42,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.534, train/loss_vlb_step=0.0101, train/loss_step=0.534, global_step=3376.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  18%|█▊        | 219/1208 [06:21<28:42,  1.74s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00659, train/loss_vlb_step=3.33e-5, train/loss_step=0.00659, global_step=3376.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  18%|█▊        | 220/1208 [06:24<28:47,  1.75s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00659, train/loss_vlb_step=3.33e-5, train/loss_step=0.00659, global_step=3376.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  18%|█▊        | 220/1208 [06:24<28:47,  1.75s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.43e-5, train/loss_step=0.0118, global_step=3376.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  18%|█▊        | 221/1208 [06:25<28:43,  1.75s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.43e-5, train/loss_step=0.0118, global_step=3376.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  18%|█▊        | 221/1208 [06:25<28:43,  1.75s/it, loss=0.18, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00312, train/loss_step=0.380, global_step=3377.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  18%|█▊        | 222/1208 [06:26<28:38,  1.74s/it, loss=0.18, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00312, train/loss_step=0.380, global_step=3377.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  18%|█▊        | 222/1208 [06:26<28:38,  1.74s/it, loss=0.188, v_num=0, train/loss_simple_step=0.501, train/loss_vlb_step=0.0082, train/loss_step=0.501, global_step=3377.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  18%|█▊        | 223/1208 [06:27<28:33,  1.74s/it, loss=0.188, v_num=0, train/loss_simple_step=0.501, train/loss_vlb_step=0.0082, train/loss_step=0.501, global_step=3377.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  18%|█▊        | 223/1208 [06:27<28:33,  1.74s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0864, train/loss_vlb_step=0.000286, train/loss_step=0.0864, global_step=3377.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  19%|█▊        | 224/1208 [06:31<28:38,  1.75s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0864, train/loss_vlb_step=0.000286, train/loss_step=0.0864, global_step=3377.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  19%|█▊        | 224/1208 [06:31<28:38,  1.75s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=3.17e-5, train/loss_step=0.00619, global_step=3377.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  19%|█▊        | 225/1208 [06:32<28:33,  1.74s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=3.17e-5, train/loss_step=0.00619, global_step=3377.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  19%|█▊        | 225/1208 [06:32<28:33,  1.74s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00505, train/loss_vlb_step=2.65e-5, train/loss_step=0.00505, global_step=3378.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  19%|█▊        | 226/1208 [06:33<28:28,  1.74s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00505, train/loss_vlb_step=2.65e-5, train/loss_step=0.00505, global_step=3378.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  19%|█▊        | 226/1208 [06:33<28:28,  1.74s/it, loss=0.169, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000621, train/loss_step=0.186, global_step=3378.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  19%|█▉        | 227/1208 [06:34<28:23,  1.74s/it, loss=0.169, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000621, train/loss_step=0.186, global_step=3378.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  19%|█▉        | 227/1208 [06:34<28:23,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00872, train/loss_vlb_step=4.24e-5, train/loss_step=0.00872, global_step=3378.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  19%|█▉        | 228/1208 [06:37<28:28,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00872, train/loss_vlb_step=4.24e-5, train/loss_step=0.00872, global_step=3378.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  19%|█▉        | 228/1208 [06:37<28:28,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000428, train/loss_step=0.129, global_step=3378.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  19%|█▉        | 229/1208 [06:38<28:23,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000428, train/loss_step=0.129, global_step=3378.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  19%|█▉        | 229/1208 [06:38<28:23,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.07e-5, train/loss_step=0.00176, global_step=3379.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  19%|█▉        | 230/1208 [06:39<28:19,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.07e-5, train/loss_step=0.00176, global_step=3379.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  19%|█▉        | 230/1208 [06:39<28:19,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00443, train/loss_step=0.499, global_step=3379.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  19%|█▉        | 231/1208 [06:40<28:14,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00443, train/loss_step=0.499, global_step=3379.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  19%|█▉        | 231/1208 [06:40<28:14,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.51e-5, train/loss_step=0.0237, global_step=3379.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  19%|█▉        | 232/1208 [06:43<28:19,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.51e-5, train/loss_step=0.0237, global_step=3379.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  19%|█▉        | 232/1208 [06:43<28:19,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0461, train/loss_vlb_step=0.000161, train/loss_step=0.0461, global_step=3379.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  19%|█▉        | 233/1208 [06:44<28:14,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0461, train/loss_vlb_step=0.000161, train/loss_step=0.0461, global_step=3379.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  19%|█▉        | 233/1208 [06:44<28:14,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00514, train/loss_vlb_step=2.62e-5, train/loss_step=0.00514, global_step=3380.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  19%|█▉        | 234/1208 [06:46<28:09,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00514, train/loss_vlb_step=2.62e-5, train/loss_step=0.00514, global_step=3380.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  19%|█▉        | 234/1208 [06:46<28:09,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00244, train/loss_step=0.328, global_step=3380.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  19%|█▉        | 235/1208 [06:47<28:05,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00244, train/loss_step=0.328, global_step=3380.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  19%|█▉        | 235/1208 [06:47<28:05,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00149, train/loss_step=0.319, global_step=3380.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  20%|█▉        | 236/1208 [06:50<28:09,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00149, train/loss_step=0.319, global_step=3380.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  20%|█▉        | 236/1208 [06:50<28:09,  1.74s/it, loss=0.18, v_num=0, train/loss_simple_step=0.522, train/loss_vlb_step=0.00986, train/loss_step=0.522, global_step=3380.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  20%|█▉        | 237/1208 [06:51<28:05,  1.74s/it, loss=0.18, v_num=0, train/loss_simple_step=0.522, train/loss_vlb_step=0.00986, train/loss_step=0.522, global_step=3380.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  20%|█▉        | 237/1208 [06:51<28:05,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=9.01e-5, train/loss_step=0.0201, global_step=3381.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  20%|█▉        | 238/1208 [06:52<28:00,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=9.01e-5, train/loss_step=0.0201, global_step=3381.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  20%|█▉        | 238/1208 [06:52<28:00,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=1.76e-5, train/loss_step=0.0031, global_step=3381.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  20%|█▉        | 239/1208 [06:53<27:56,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=1.76e-5, train/loss_step=0.0031, global_step=3381.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  20%|█▉        | 239/1208 [06:53<27:56,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00128, train/loss_step=0.288, global_step=3381.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  20%|█▉        | 240/1208 [06:56<28:00,  1.74s/it, loss=0.169, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00128, train/loss_step=0.288, global_step=3381.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  20%|█▉        | 240/1208 [06:56<28:00,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000128, train/loss_step=0.0328, global_step=3381.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  20%|█▉        | 241/1208 [06:57<27:56,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000128, train/loss_step=0.0328, global_step=3381.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  20%|█▉        | 241/1208 [06:57<27:56,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00488, train/loss_vlb_step=2.59e-5, train/loss_step=0.00488, global_step=3382.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  20%|██        | 242/1208 [06:58<27:51,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00488, train/loss_vlb_step=2.59e-5, train/loss_step=0.00488, global_step=3382.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  20%|██        | 242/1208 [06:58<27:51,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0642, train/loss_vlb_step=0.00022, train/loss_step=0.0642, global_step=3382.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  20%|██        | 243/1208 [06:59<27:47,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0642, train/loss_vlb_step=0.00022, train/loss_step=0.0642, global_step=3382.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  20%|██        | 243/1208 [06:59<27:47,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.43e-5, train/loss_step=0.0141, global_step=3382.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  20%|██        | 244/1208 [07:03<27:51,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.43e-5, train/loss_step=0.0141, global_step=3382.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  20%|██        | 244/1208 [07:03<27:51,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0321, train/loss_vlb_step=0.000126, train/loss_step=0.0321, global_step=3382.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  20%|██        | 245/1208 [07:04<27:47,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0321, train/loss_vlb_step=0.000126, train/loss_step=0.0321, global_step=3382.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  20%|██        | 245/1208 [07:04<27:47,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000477, train/loss_step=0.144, global_step=3383.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  20%|██        | 246/1208 [07:05<27:42,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000477, train/loss_step=0.144, global_step=3383.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  20%|██        | 246/1208 [07:05<27:42,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.61e-5, train/loss_step=0.0029, global_step=3383.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  20%|██        | 247/1208 [07:06<27:38,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.61e-5, train/loss_step=0.0029, global_step=3383.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  20%|██        | 247/1208 [07:06<27:38,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00876, train/loss_vlb_step=4.12e-5, train/loss_step=0.00876, global_step=3383.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  21%|██        | 248/1208 [07:09<27:42,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00876, train/loss_vlb_step=4.12e-5, train/loss_step=0.00876, global_step=3383.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  21%|██        | 248/1208 [07:09<27:42,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000129, train/loss_step=0.0336, global_step=3383.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  21%|██        | 249/1208 [07:10<27:38,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000129, train/loss_step=0.0336, global_step=3383.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  21%|██        | 249/1208 [07:10<27:38,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00198, train/loss_step=0.325, global_step=3384.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  21%|██        | 250/1208 [07:11<27:33,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00198, train/loss_step=0.325, global_step=3384.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  21%|██        | 250/1208 [07:11<27:33,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00123, train/loss_step=0.299, global_step=3384.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  21%|██        | 251/1208 [07:12<27:29,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00123, train/loss_step=0.299, global_step=3384.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  21%|██        | 251/1208 [07:12<27:29,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00254, train/loss_step=0.403, global_step=3384.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  21%|██        | 252/1208 [07:15<27:33,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00254, train/loss_step=0.403, global_step=3384.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  21%|██        | 252/1208 [07:15<27:33,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000605, train/loss_step=0.170, global_step=3384.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  21%|██        | 253/1208 [07:16<27:29,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000605, train/loss_step=0.170, global_step=3384.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  21%|██        | 253/1208 [07:16<27:29,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.483, train/loss_vlb_step=0.00495, train/loss_step=0.483, global_step=3385.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  21%|██        | 254/1208 [07:18<27:25,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.483, train/loss_vlb_step=0.00495, train/loss_step=0.483, global_step=3385.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  21%|██        | 254/1208 [07:18<27:25,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.52e-5, train/loss_step=0.0125, global_step=3385.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  21%|██        | 255/1208 [07:19<27:20,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.52e-5, train/loss_step=0.0125, global_step=3385.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  21%|██        | 255/1208 [07:19<27:20,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.44e-5, train/loss_step=0.00251, global_step=3385.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  21%|██        | 256/1208 [07:22<27:24,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.44e-5, train/loss_step=0.00251, global_step=3385.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  21%|██        | 256/1208 [07:22<27:24,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0761, train/loss_vlb_step=0.000257, train/loss_step=0.0761, global_step=3385.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  21%|██▏       | 257/1208 [07:23<27:20,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0761, train/loss_vlb_step=0.000257, train/loss_step=0.0761, global_step=3385.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  21%|██▏       | 257/1208 [07:23<27:20,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.003, train/loss_step=0.400, global_step=3386.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]      Epoch 11:  21%|██▏       | 258/1208 [07:24<27:16,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.003, train/loss_step=0.400, global_step=3386.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  21%|██▏       | 258/1208 [07:24<27:16,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000712, train/loss_step=0.209, global_step=3386.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  21%|██▏       | 259/1208 [07:25<27:12,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000712, train/loss_step=0.209, global_step=3386.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  21%|██▏       | 259/1208 [07:25<27:12,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9.25e-5, train/loss_step=0.0224, global_step=3386.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  22%|██▏       | 260/1208 [07:28<27:16,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9.25e-5, train/loss_step=0.0224, global_step=3386.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  22%|██▏       | 260/1208 [07:28<27:16,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00142, train/loss_step=0.288, global_step=3386.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  22%|██▏       | 261/1208 [07:29<27:12,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00142, train/loss_step=0.288, global_step=3386.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  22%|██▏       | 261/1208 [07:29<27:12,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.42e-5, train/loss_step=0.0129, global_step=3387.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  22%|██▏       | 262/1208 [07:30<27:08,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.42e-5, train/loss_step=0.0129, global_step=3387.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  22%|██▏       | 262/1208 [07:30<27:08,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.2e-5, train/loss_step=0.0112, global_step=3387.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  22%|██▏       | 263/1208 [07:31<27:03,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.2e-5, train/loss_step=0.0112, global_step=3387.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  22%|██▏       | 263/1208 [07:31<27:03,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=5.17e-5, train/loss_step=0.0105, global_step=3387.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  22%|██▏       | 264/1208 [07:35<27:07,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=5.17e-5, train/loss_step=0.0105, global_step=3387.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  22%|██▏       | 264/1208 [07:35<27:07,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=1.39e-5, train/loss_step=0.00234, global_step=3387.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  22%|██▏       | 265/1208 [07:36<27:03,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=1.39e-5, train/loss_step=0.00234, global_step=3387.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  22%|██▏       | 265/1208 [07:36<27:03,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.23e-5, train/loss_step=0.0114, global_step=3388.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  22%|██▏       | 266/1208 [07:37<26:59,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.23e-5, train/loss_step=0.0114, global_step=3388.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  22%|██▏       | 266/1208 [07:37<26:59,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0421, train/loss_vlb_step=0.000154, train/loss_step=0.0421, global_step=3388.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  22%|██▏       | 267/1208 [07:38<26:55,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0421, train/loss_vlb_step=0.000154, train/loss_step=0.0421, global_step=3388.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  22%|██▏       | 267/1208 [07:38<26:55,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.92e-5, train/loss_step=0.0104, global_step=3388.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  22%|██▏       | 268/1208 [07:41<26:58,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.92e-5, train/loss_step=0.0104, global_step=3388.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  22%|██▏       | 268/1208 [07:41<26:58,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00427, train/loss_vlb_step=2.27e-5, train/loss_step=0.00427, global_step=3388.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  22%|██▏       | 269/1208 [07:42<26:54,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00427, train/loss_vlb_step=2.27e-5, train/loss_step=0.00427, global_step=3388.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  22%|██▏       | 269/1208 [07:42<26:54,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000107, train/loss_step=0.0274, global_step=3389.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  22%|██▏       | 270/1208 [07:43<26:50,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000107, train/loss_step=0.0274, global_step=3389.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  22%|██▏       | 270/1208 [07:43<26:50,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0037, train/loss_vlb_step=2.05e-5, train/loss_step=0.0037, global_step=3389.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  22%|██▏       | 271/1208 [07:44<26:46,  1.71s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0037, train/loss_vlb_step=2.05e-5, train/loss_step=0.0037, global_step=3389.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  22%|██▏       | 271/1208 [07:44<26:46,  1.71s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.000121, train/loss_step=0.0316, global_step=3389.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  23%|██▎       | 272/1208 [07:47<26:50,  1.72s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.000121, train/loss_step=0.0316, global_step=3389.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  23%|██▎       | 272/1208 [07:47<26:50,  1.72s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00132, train/loss_step=0.274, global_step=3389.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  23%|██▎       | 273/1208 [07:49<26:46,  1.72s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00132, train/loss_step=0.274, global_step=3389.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  23%|██▎       | 273/1208 [07:49<26:46,  1.72s/it, loss=0.0767, v_num=0, train/loss_simple_step=0.081, train/loss_vlb_step=0.000271, train/loss_step=0.081, global_step=3390.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  23%|██▎       | 274/1208 [07:50<26:42,  1.72s/it, loss=0.0767, v_num=0, train/loss_simple_step=0.081, train/loss_vlb_step=0.000271, train/loss_step=0.081, global_step=3390.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  23%|██▎       | 274/1208 [07:50<26:42,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.519, train/loss_vlb_step=0.00637, train/loss_step=0.519, global_step=3390.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  23%|██▎       | 275/1208 [07:51<26:38,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.519, train/loss_vlb_step=0.00637, train/loss_step=0.519, global_step=3390.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  23%|██▎       | 275/1208 [07:51<26:38,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.508, train/loss_vlb_step=0.00513, train/loss_step=0.508, global_step=3390.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  23%|██▎       | 276/1208 [07:54<26:41,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.508, train/loss_vlb_step=0.00513, train/loss_step=0.508, global_step=3390.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  23%|██▎       | 276/1208 [07:54<26:41,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000795, train/loss_step=0.207, global_step=3390.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  23%|██▎       | 277/1208 [07:55<26:37,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000795, train/loss_step=0.207, global_step=3390.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  23%|██▎       | 277/1208 [07:55<26:37,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000884, train/loss_step=0.245, global_step=3391.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  23%|██▎       | 278/1208 [07:56<26:33,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000884, train/loss_step=0.245, global_step=3391.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  23%|██▎       | 278/1208 [07:56<26:33,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.595, train/loss_vlb_step=0.0159, train/loss_step=0.595, global_step=3391.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  23%|██▎       | 279/1208 [07:57<26:29,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.595, train/loss_vlb_step=0.0159, train/loss_step=0.595, global_step=3391.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  23%|██▎       | 279/1208 [07:57<26:29,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.76e-5, train/loss_step=0.0127, global_step=3391.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  23%|██▎       | 280/1208 [08:00<26:33,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.76e-5, train/loss_step=0.0127, global_step=3391.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  23%|██▎       | 280/1208 [08:00<26:33,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.000128, train/loss_step=0.0326, global_step=3391.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  23%|██▎       | 281/1208 [08:01<26:29,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.000128, train/loss_step=0.0326, global_step=3391.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  23%|██▎       | 281/1208 [08:01<26:29,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00674, train/loss_vlb_step=3.39e-5, train/loss_step=0.00674, global_step=3392.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  23%|██▎       | 282/1208 [08:02<26:25,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00674, train/loss_vlb_step=3.39e-5, train/loss_step=0.00674, global_step=3392.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  23%|██▎       | 282/1208 [08:02<26:25,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000495, train/loss_step=0.145, global_step=3392.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  23%|██▎       | 283/1208 [08:03<26:21,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000495, train/loss_step=0.145, global_step=3392.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  23%|██▎       | 283/1208 [08:03<26:21,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.689, train/loss_vlb_step=0.0325, train/loss_step=0.689, global_step=3392.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  24%|██▎       | 284/1208 [08:07<26:24,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.689, train/loss_vlb_step=0.0325, train/loss_step=0.689, global_step=3392.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  24%|██▎       | 284/1208 [08:07<26:24,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.58e-5, train/loss_step=0.018, global_step=3392.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  24%|██▎       | 285/1208 [08:08<26:20,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.58e-5, train/loss_step=0.018, global_step=3392.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  24%|██▎       | 285/1208 [08:08<26:20,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000127, train/loss_step=0.0329, global_step=3393.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  24%|██▎       | 286/1208 [08:09<26:17,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000127, train/loss_step=0.0329, global_step=3393.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  24%|██▎       | 286/1208 [08:09<26:17,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00131, train/loss_step=0.276, global_step=3393.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  24%|██▍       | 287/1208 [08:10<26:13,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00131, train/loss_step=0.276, global_step=3393.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  24%|██▍       | 287/1208 [08:10<26:13,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0733, train/loss_vlb_step=0.000246, train/loss_step=0.0733, global_step=3393.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  24%|██▍       | 288/1208 [08:13<26:16,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0733, train/loss_vlb_step=0.000246, train/loss_step=0.0733, global_step=3393.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  24%|██▍       | 288/1208 [08:13<26:16,  1.71s/it, loss=0.201, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.00097, train/loss_step=0.236, global_step=3393.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  24%|██▍       | 289/1208 [08:14<26:12,  1.71s/it, loss=0.201, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.00097, train/loss_step=0.236, global_step=3393.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  24%|██▍       | 289/1208 [08:14<26:12,  1.71s/it, loss=0.208, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000626, train/loss_step=0.179, global_step=3394.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  24%|██▍       | 290/1208 [08:15<26:08,  1.71s/it, loss=0.208, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000626, train/loss_step=0.179, global_step=3394.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  24%|██▍       | 290/1208 [08:15<26:08,  1.71s/it, loss=0.236, v_num=0, train/loss_simple_step=0.560, train/loss_vlb_step=0.0109, train/loss_step=0.560, global_step=3394.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  24%|██▍       | 291/1208 [08:16<26:04,  1.71s/it, loss=0.236, v_num=0, train/loss_simple_step=0.560, train/loss_vlb_step=0.0109, train/loss_step=0.560, global_step=3394.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  24%|██▍       | 291/1208 [08:16<26:04,  1.71s/it, loss=0.267, v_num=0, train/loss_simple_step=0.650, train/loss_vlb_step=0.0173, train/loss_step=0.650, global_step=3394.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  24%|██▍       | 292/1208 [08:19<26:08,  1.71s/it, loss=0.267, v_num=0, train/loss_simple_step=0.650, train/loss_vlb_step=0.0173, train/loss_step=0.650, global_step=3394.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  24%|██▍       | 292/1208 [08:19<26:08,  1.71s/it, loss=0.254, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=7.01e-5, train/loss_step=0.0155, global_step=3394.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  24%|██▍       | 293/1208 [08:20<26:04,  1.71s/it, loss=0.254, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=7.01e-5, train/loss_step=0.0155, global_step=3394.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  24%|██▍       | 293/1208 [08:20<26:04,  1.71s/it, loss=0.255, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000347, train/loss_step=0.106, global_step=3395.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  24%|██▍       | 294/1208 [08:21<26:00,  1.71s/it, loss=0.255, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000347, train/loss_step=0.106, global_step=3395.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  24%|██▍       | 294/1208 [08:21<26:00,  1.71s/it, loss=0.232, v_num=0, train/loss_simple_step=0.0447, train/loss_vlb_step=0.000163, train/loss_step=0.0447, global_step=3395.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  24%|██▍       | 295/1208 [08:23<25:56,  1.71s/it, loss=0.232, v_num=0, train/loss_simple_step=0.0447, train/loss_vlb_step=0.000163, train/loss_step=0.0447, global_step=3395.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  24%|██▍       | 295/1208 [08:23<25:56,  1.71s/it, loss=0.206, v_num=0, train/loss_simple_step=0.00307, train/loss_vlb_step=1.77e-5, train/loss_step=0.00307, global_step=3395.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  25%|██▍       | 296/1208 [08:26<25:59,  1.71s/it, loss=0.206, v_num=0, train/loss_simple_step=0.00307, train/loss_vlb_step=1.77e-5, train/loss_step=0.00307, global_step=3395.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  25%|██▍       | 296/1208 [08:26<25:59,  1.71s/it, loss=0.202, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000421, train/loss_step=0.126, global_step=3395.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  25%|██▍       | 297/1208 [08:27<25:56,  1.71s/it, loss=0.202, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000421, train/loss_step=0.126, global_step=3395.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  25%|██▍       | 297/1208 [08:27<25:56,  1.71s/it, loss=0.203, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00107, train/loss_step=0.253, global_step=3396.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  25%|██▍       | 298/1208 [08:28<25:52,  1.71s/it, loss=0.203, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00107, train/loss_step=0.253, global_step=3396.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  25%|██▍       | 298/1208 [08:28<25:52,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000536, train/loss_step=0.156, global_step=3396.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  25%|██▍       | 299/1208 [08:29<25:48,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000536, train/loss_step=0.156, global_step=3396.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  25%|██▍       | 299/1208 [08:29<25:48,  1.70s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=2e-5, train/loss_step=0.00359, global_step=3396.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  25%|██▍       | 300/1208 [08:32<25:51,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=2e-5, train/loss_step=0.00359, global_step=3396.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  25%|██▍       | 300/1208 [08:32<25:51,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000425, train/loss_step=0.128, global_step=3396.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.70it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.74it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.76it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.76it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.78it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.78it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 11:  25%|██▍       | 301/1208 [09:03<27:17,  1.81s/it, loss=0.185, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000425, train/loss_step=0.128, global_step=3396.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  25%|██▍       | 301/1208 [09:03<27:17,  1.81s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0338, train/loss_vlb_step=0.000122, train/loss_step=0.0338, global_step=3397.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  25%|██▌       | 302/1208 [09:04<27:13,  1.80s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0338, train/loss_vlb_step=0.000122, train/loss_step=0.0338, global_step=3397.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  25%|██▌       | 302/1208 [09:04<27:13,  1.80s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0811, train/loss_vlb_step=0.000274, train/loss_step=0.0811, global_step=3397.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  25%|██▌       | 303/1208 [09:05<27:09,  1.80s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0811, train/loss_vlb_step=0.000274, train/loss_step=0.0811, global_step=3397.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  25%|██▌       | 303/1208 [09:05<27:09,  1.80s/it, loss=0.155, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=3397.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  25%|██▌       | 304/1208 [09:08<27:11,  1.80s/it, loss=0.155, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=3397.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  25%|██▌       | 304/1208 [09:08<27:11,  1.80s/it, loss=0.16, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000408, train/loss_step=0.123, global_step=3397.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  25%|██▌       | 305/1208 [09:09<27:07,  1.80s/it, loss=0.16, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000408, train/loss_step=0.123, global_step=3397.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  25%|██▌       | 305/1208 [09:09<27:07,  1.80s/it, loss=0.166, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000593, train/loss_step=0.166, global_step=3398.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  25%|██▌       | 306/1208 [09:10<27:03,  1.80s/it, loss=0.166, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000593, train/loss_step=0.166, global_step=3398.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  25%|██▌       | 306/1208 [09:10<27:03,  1.80s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.00015, train/loss_step=0.0425, global_step=3398.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  25%|██▌       | 307/1208 [09:11<26:59,  1.80s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.00015, train/loss_step=0.0425, global_step=3398.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  25%|██▌       | 307/1208 [09:11<26:59,  1.80s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0073, train/loss_vlb_step=3.59e-5, train/loss_step=0.0073, global_step=3398.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  25%|██▌       | 308/1208 [09:15<27:01,  1.80s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0073, train/loss_vlb_step=3.59e-5, train/loss_step=0.0073, global_step=3398.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  25%|██▌       | 308/1208 [09:15<27:01,  1.80s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.53e-5, train/loss_step=0.0166, global_step=3398.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  26%|██▌       | 309/1208 [09:16<26:57,  1.80s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.53e-5, train/loss_step=0.0166, global_step=3398.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  26%|██▌       | 309/1208 [09:16<26:57,  1.80s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000144, train/loss_step=0.0396, global_step=3399.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  26%|██▌       | 310/1208 [09:17<26:53,  1.80s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000144, train/loss_step=0.0396, global_step=3399.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  26%|██▌       | 310/1208 [09:17<26:53,  1.80s/it, loss=0.115, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000685, train/loss_step=0.185, global_step=3399.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  26%|██▌       | 311/1208 [09:18<26:49,  1.79s/it, loss=0.115, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000685, train/loss_step=0.185, global_step=3399.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  26%|██▌       | 311/1208 [09:18<26:49,  1.79s/it, loss=0.0856, v_num=0, train/loss_simple_step=0.0671, train/loss_vlb_step=0.000222, train/loss_step=0.0671, global_step=3399.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  26%|██▌       | 312/1208 [09:21<26:52,  1.80s/it, loss=0.0856, v_num=0, train/loss_simple_step=0.0671, train/loss_vlb_step=0.000222, train/loss_step=0.0671, global_step=3399.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  26%|██▌       | 312/1208 [09:21<26:52,  1.80s/it, loss=0.106, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00232, train/loss_step=0.418, global_step=3399.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  26%|██▌       | 313/1208 [09:22<26:48,  1.80s/it, loss=0.106, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00232, train/loss_step=0.418, global_step=3399.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  26%|██▌       | 313/1208 [09:22<26:48,  1.80s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00718, train/loss_vlb_step=3.64e-5, train/loss_step=0.00718, global_step=3400.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  26%|██▌       | 314/1208 [09:23<26:44,  1.79s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00718, train/loss_vlb_step=3.64e-5, train/loss_step=0.00718, global_step=3400.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  26%|██▌       | 314/1208 [09:23<26:44,  1.79s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.00565, train/loss_vlb_step=3.02e-5, train/loss_step=0.00565, global_step=3400.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  26%|██▌       | 315/1208 [09:24<26:40,  1.79s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.00565, train/loss_vlb_step=3.02e-5, train/loss_step=0.00565, global_step=3400.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  26%|██▌       | 315/1208 [09:24<26:40,  1.79s/it, loss=0.119, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.0026, train/loss_step=0.401, global_step=3400.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]      Epoch 11:  26%|██▌       | 316/1208 [09:27<26:43,  1.80s/it, loss=0.119, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.0026, train/loss_step=0.401, global_step=3400.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  26%|██▌       | 316/1208 [09:27<26:43,  1.80s/it, loss=0.12, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000525, train/loss_step=0.153, global_step=3400.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  26%|██▌       | 317/1208 [09:29<26:39,  1.80s/it, loss=0.12, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000525, train/loss_step=0.153, global_step=3400.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  26%|██▌       | 317/1208 [09:29<26:39,  1.80s/it, loss=0.118, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000719, train/loss_step=0.200, global_step=3401.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  26%|██▋       | 318/1208 [09:30<26:35,  1.79s/it, loss=0.118, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000719, train/loss_step=0.200, global_step=3401.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  26%|██▋       | 318/1208 [09:30<26:35,  1.79s/it, loss=0.12, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000793, train/loss_step=0.208, global_step=3401.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  26%|██▋       | 319/1208 [09:31<26:31,  1.79s/it, loss=0.12, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000793, train/loss_step=0.208, global_step=3401.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  26%|██▋       | 319/1208 [09:31<26:31,  1.79s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0536, train/loss_vlb_step=0.000181, train/loss_step=0.0536, global_step=3401.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  26%|██▋       | 320/1208 [09:34<26:33,  1.79s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0536, train/loss_vlb_step=0.000181, train/loss_step=0.0536, global_step=3401.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  26%|██▋       | 320/1208 [09:34<26:33,  1.79s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.000126, train/loss_step=0.0322, global_step=3401.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  27%|██▋       | 321/1208 [09:35<26:30,  1.79s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.000126, train/loss_step=0.0322, global_step=3401.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  27%|██▋       | 321/1208 [09:35<26:30,  1.79s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.000133, train/loss_step=0.0351, global_step=3402.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  27%|██▋       | 322/1208 [09:36<26:26,  1.79s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.000133, train/loss_step=0.0351, global_step=3402.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  27%|██▋       | 322/1208 [09:36<26:26,  1.79s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0744, train/loss_vlb_step=0.000247, train/loss_step=0.0744, global_step=3402.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  27%|██▋       | 323/1208 [09:37<26:22,  1.79s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0744, train/loss_vlb_step=0.000247, train/loss_step=0.0744, global_step=3402.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  27%|██▋       | 323/1208 [09:37<26:22,  1.79s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0611, train/loss_vlb_step=0.000213, train/loss_step=0.0611, global_step=3402.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  27%|██▋       | 324/1208 [09:40<26:24,  1.79s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0611, train/loss_vlb_step=0.000213, train/loss_step=0.0611, global_step=3402.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  27%|██▋       | 324/1208 [09:40<26:24,  1.79s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.06e-5, train/loss_step=0.00394, global_step=3402.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  27%|██▋       | 325/1208 [09:41<26:20,  1.79s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.06e-5, train/loss_step=0.00394, global_step=3402.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  27%|██▋       | 325/1208 [09:41<26:20,  1.79s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00633, train/loss_vlb_step=3.25e-5, train/loss_step=0.00633, global_step=3403.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  27%|██▋       | 326/1208 [09:42<26:17,  1.79s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00633, train/loss_vlb_step=3.25e-5, train/loss_step=0.00633, global_step=3403.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  27%|██▋       | 326/1208 [09:42<26:17,  1.79s/it, loss=0.133, v_num=0, train/loss_simple_step=0.683, train/loss_vlb_step=0.0167, train/loss_step=0.683, global_step=3403.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]     Epoch 11:  27%|██▋       | 327/1208 [09:43<26:13,  1.79s/it, loss=0.133, v_num=0, train/loss_simple_step=0.683, train/loss_vlb_step=0.0167, train/loss_step=0.683, global_step=3403.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  27%|██▋       | 327/1208 [09:43<26:13,  1.79s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0605, train/loss_vlb_step=0.000206, train/loss_step=0.0605, global_step=3403.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  27%|██▋       | 328/1208 [09:47<26:15,  1.79s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0605, train/loss_vlb_step=0.000206, train/loss_step=0.0605, global_step=3403.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  27%|██▋       | 328/1208 [09:47<26:15,  1.79s/it, loss=0.145, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000757, train/loss_step=0.208, global_step=3403.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  27%|██▋       | 329/1208 [09:48<26:11,  1.79s/it, loss=0.145, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000757, train/loss_step=0.208, global_step=3403.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  27%|██▋       | 329/1208 [09:48<26:11,  1.79s/it, loss=0.154, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.00081, train/loss_step=0.216, global_step=3404.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  27%|██▋       | 330/1208 [09:49<26:08,  1.79s/it, loss=0.154, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.00081, train/loss_step=0.216, global_step=3404.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  27%|██▋       | 330/1208 [09:49<26:08,  1.79s/it, loss=0.173, v_num=0, train/loss_simple_step=0.558, train/loss_vlb_step=0.0209, train/loss_step=0.558, global_step=3404.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  27%|██▋       | 331/1208 [09:50<26:04,  1.78s/it, loss=0.173, v_num=0, train/loss_simple_step=0.558, train/loss_vlb_step=0.0209, train/loss_step=0.558, global_step=3404.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  27%|██▋       | 331/1208 [09:50<26:04,  1.78s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00583, train/loss_vlb_step=2.76e-5, train/loss_step=0.00583, global_step=3404.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  27%|██▋       | 332/1208 [09:53<26:06,  1.79s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00583, train/loss_vlb_step=2.76e-5, train/loss_step=0.00583, global_step=3404.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  27%|██▋       | 332/1208 [09:53<26:06,  1.79s/it, loss=0.159, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000731, train/loss_step=0.199, global_step=3404.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  28%|██▊       | 333/1208 [09:54<26:02,  1.79s/it, loss=0.159, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000731, train/loss_step=0.199, global_step=3404.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  28%|██▊       | 333/1208 [09:54<26:02,  1.79s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00293, train/loss_vlb_step=1.68e-5, train/loss_step=0.00293, global_step=3405.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  28%|██▊       | 334/1208 [09:55<25:58,  1.78s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00293, train/loss_vlb_step=1.68e-5, train/loss_step=0.00293, global_step=3405.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  28%|██▊       | 334/1208 [09:55<25:58,  1.78s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.000126, train/loss_step=0.0326, global_step=3405.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  28%|██▊       | 335/1208 [09:56<25:55,  1.78s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.000126, train/loss_step=0.0326, global_step=3405.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  28%|██▊       | 335/1208 [09:56<25:55,  1.78s/it, loss=0.147, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000494, train/loss_step=0.147, global_step=3405.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  28%|██▊       | 336/1208 [10:00<25:57,  1.79s/it, loss=0.147, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000494, train/loss_step=0.147, global_step=3405.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  28%|██▊       | 336/1208 [10:00<25:57,  1.79s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00636, train/loss_vlb_step=3.18e-5, train/loss_step=0.00636, global_step=3405.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  28%|██▊       | 337/1208 [10:01<25:53,  1.78s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00636, train/loss_vlb_step=3.18e-5, train/loss_step=0.00636, global_step=3405.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  28%|██▊       | 337/1208 [10:01<25:53,  1.78s/it, loss=0.17, v_num=0, train/loss_simple_step=0.815, train/loss_vlb_step=0.0524, train/loss_step=0.815, global_step=3406.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]     Epoch 11:  28%|██▊       | 338/1208 [10:02<25:49,  1.78s/it, loss=0.17, v_num=0, train/loss_simple_step=0.815, train/loss_vlb_step=0.0524, train/loss_step=0.815, global_step=3406.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  28%|██▊       | 338/1208 [10:02<25:49,  1.78s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0995, train/loss_vlb_step=0.000328, train/loss_step=0.0995, global_step=3406.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  28%|██▊       | 339/1208 [10:03<25:46,  1.78s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0995, train/loss_vlb_step=0.000328, train/loss_step=0.0995, global_step=3406.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  28%|██▊       | 339/1208 [10:03<25:46,  1.78s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0683, train/loss_vlb_step=0.000232, train/loss_step=0.0683, global_step=3406.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  28%|██▊       | 340/1208 [10:06<25:48,  1.78s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0683, train/loss_vlb_step=0.000232, train/loss_step=0.0683, global_step=3406.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  28%|██▊       | 340/1208 [10:06<25:48,  1.78s/it, loss=0.172, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000527, train/loss_step=0.155, global_step=3406.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  28%|██▊       | 341/1208 [10:07<25:44,  1.78s/it, loss=0.172, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000527, train/loss_step=0.155, global_step=3406.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  28%|██▊       | 341/1208 [10:07<25:44,  1.78s/it, loss=0.177, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000504, train/loss_step=0.148, global_step=3407.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  28%|██▊       | 342/1208 [10:08<25:41,  1.78s/it, loss=0.177, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000504, train/loss_step=0.148, global_step=3407.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  28%|██▊       | 342/1208 [10:08<25:41,  1.78s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.85e-5, train/loss_step=0.0126, global_step=3407.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  28%|██▊       | 343/1208 [10:09<25:37,  1.78s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.85e-5, train/loss_step=0.0126, global_step=3407.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  28%|██▊       | 343/1208 [10:09<25:37,  1.78s/it, loss=0.182, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000779, train/loss_step=0.207, global_step=3407.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  28%|██▊       | 344/1208 [10:12<25:39,  1.78s/it, loss=0.182, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000779, train/loss_step=0.207, global_step=3407.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  28%|██▊       | 344/1208 [10:12<25:39,  1.78s/it, loss=0.189, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.00054, train/loss_step=0.157, global_step=3407.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  29%|██▊       | 345/1208 [10:13<25:35,  1.78s/it, loss=0.189, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.00054, train/loss_step=0.157, global_step=3407.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  29%|██▊       | 345/1208 [10:13<25:35,  1.78s/it, loss=0.197, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000545, train/loss_step=0.164, global_step=3408.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  29%|██▊       | 346/1208 [10:14<25:32,  1.78s/it, loss=0.197, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000545, train/loss_step=0.164, global_step=3408.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  29%|██▊       | 346/1208 [10:14<25:32,  1.78s/it, loss=0.171, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000516, train/loss_step=0.157, global_step=3408.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  29%|██▊       | 347/1208 [10:15<25:28,  1.78s/it, loss=0.171, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000516, train/loss_step=0.157, global_step=3408.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  29%|██▊       | 347/1208 [10:15<25:28,  1.78s/it, loss=0.187, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00264, train/loss_step=0.383, global_step=3408.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  29%|██▉       | 348/1208 [10:19<25:30,  1.78s/it, loss=0.187, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00264, train/loss_step=0.383, global_step=3408.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  29%|██▉       | 348/1208 [10:19<25:30,  1.78s/it, loss=0.189, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.000962, train/loss_step=0.249, global_step=3408.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  29%|██▉       | 349/1208 [10:20<25:26,  1.78s/it, loss=0.189, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.000962, train/loss_step=0.249, global_step=3408.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  29%|██▉       | 349/1208 [10:20<25:26,  1.78s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0995, train/loss_vlb_step=0.000328, train/loss_step=0.0995, global_step=3409.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  29%|██▉       | 350/1208 [10:21<25:23,  1.78s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0995, train/loss_vlb_step=0.000328, train/loss_step=0.0995, global_step=3409.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  29%|██▉       | 350/1208 [10:21<25:23,  1.78s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.89e-5, train/loss_step=0.0159, global_step=3409.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  29%|██▉       | 351/1208 [10:22<25:19,  1.77s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.89e-5, train/loss_step=0.0159, global_step=3409.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  29%|██▉       | 351/1208 [10:22<25:19,  1.77s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=6.96e-5, train/loss_step=0.0165, global_step=3409.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  29%|██▉       | 352/1208 [10:25<25:21,  1.78s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=6.96e-5, train/loss_step=0.0165, global_step=3409.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  29%|██▉       | 352/1208 [10:25<25:21,  1.78s/it, loss=0.166, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.0029, train/loss_step=0.393, global_step=3409.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  29%|██▉       | 353/1208 [10:26<25:18,  1.78s/it, loss=0.166, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.0029, train/loss_step=0.393, global_step=3409.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  29%|██▉       | 353/1208 [10:26<25:18,  1.78s/it, loss=0.174, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.00051, train/loss_step=0.152, global_step=3410.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  29%|██▉       | 354/1208 [10:27<25:14,  1.77s/it, loss=0.174, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.00051, train/loss_step=0.152, global_step=3410.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  29%|██▉       | 354/1208 [10:27<25:14,  1.77s/it, loss=0.196, v_num=0, train/loss_simple_step=0.472, train/loss_vlb_step=0.0059, train/loss_step=0.472, global_step=3410.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  29%|██▉       | 355/1208 [10:28<25:11,  1.77s/it, loss=0.196, v_num=0, train/loss_simple_step=0.472, train/loss_vlb_step=0.0059, train/loss_step=0.472, global_step=3410.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  29%|██▉       | 355/1208 [10:28<25:11,  1.77s/it, loss=0.206, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00224, train/loss_step=0.348, global_step=3410.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  29%|██▉       | 356/1208 [10:32<25:13,  1.78s/it, loss=0.206, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00224, train/loss_step=0.348, global_step=3410.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  29%|██▉       | 356/1208 [10:32<25:13,  1.78s/it, loss=0.208, v_num=0, train/loss_simple_step=0.040, train/loss_vlb_step=0.000143, train/loss_step=0.040, global_step=3410.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  30%|██▉       | 357/1208 [10:33<25:09,  1.77s/it, loss=0.208, v_num=0, train/loss_simple_step=0.040, train/loss_vlb_step=0.000143, train/loss_step=0.040, global_step=3410.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  30%|██▉       | 357/1208 [10:33<25:09,  1.77s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00651, train/loss_vlb_step=3.28e-5, train/loss_step=0.00651, global_step=3411.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  30%|██▉       | 358/1208 [10:34<25:06,  1.77s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00651, train/loss_vlb_step=3.28e-5, train/loss_step=0.00651, global_step=3411.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  30%|██▉       | 358/1208 [10:34<25:06,  1.77s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.000141, train/loss_step=0.0379, global_step=3411.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  30%|██▉       | 359/1208 [10:35<25:02,  1.77s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.000141, train/loss_step=0.0379, global_step=3411.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  30%|██▉       | 359/1208 [10:35<25:02,  1.77s/it, loss=0.202, v_num=0, train/loss_simple_step=0.829, train/loss_vlb_step=0.209, train/loss_step=0.829, global_step=3411.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]     Epoch 11:  30%|██▉       | 360/1208 [10:38<25:04,  1.77s/it, loss=0.202, v_num=0, train/loss_simple_step=0.829, train/loss_vlb_step=0.209, train/loss_step=0.829, global_step=3411.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  30%|██▉       | 360/1208 [10:38<25:04,  1.77s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00984, train/loss_vlb_step=4.67e-5, train/loss_step=0.00984, global_step=3411.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  30%|██▉       | 361/1208 [10:39<25:00,  1.77s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00984, train/loss_vlb_step=4.67e-5, train/loss_step=0.00984, global_step=3411.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  30%|██▉       | 361/1208 [10:39<25:00,  1.77s/it, loss=0.188, v_num=0, train/loss_simple_step=0.00674, train/loss_vlb_step=3.43e-5, train/loss_step=0.00674, global_step=3412.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  30%|██▉       | 362/1208 [10:40<24:57,  1.77s/it, loss=0.188, v_num=0, train/loss_simple_step=0.00674, train/loss_vlb_step=3.43e-5, train/loss_step=0.00674, global_step=3412.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  30%|██▉       | 362/1208 [10:40<24:57,  1.77s/it, loss=0.197, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000744, train/loss_step=0.197, global_step=3412.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  30%|███       | 363/1208 [10:41<24:53,  1.77s/it, loss=0.197, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000744, train/loss_step=0.197, global_step=3412.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  30%|███       | 363/1208 [10:41<24:53,  1.77s/it, loss=0.187, v_num=0, train/loss_simple_step=0.00527, train/loss_vlb_step=2.78e-5, train/loss_step=0.00527, global_step=3412.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  30%|███       | 364/1208 [10:44<24:55,  1.77s/it, loss=0.187, v_num=0, train/loss_simple_step=0.00527, train/loss_vlb_step=2.78e-5, train/loss_step=0.00527, global_step=3412.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  30%|███       | 364/1208 [10:44<24:55,  1.77s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.85e-5, train/loss_step=0.0128, global_step=3412.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  30%|███       | 365/1208 [10:46<24:52,  1.77s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.85e-5, train/loss_step=0.0128, global_step=3412.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  30%|███       | 365/1208 [10:46<24:52,  1.77s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.000136, train/loss_step=0.0379, global_step=3413.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  30%|███       | 366/1208 [10:47<24:48,  1.77s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.000136, train/loss_step=0.0379, global_step=3413.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  30%|███       | 366/1208 [10:47<24:48,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000147, train/loss_step=0.0386, global_step=3413.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  30%|███       | 367/1208 [10:48<24:45,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000147, train/loss_step=0.0386, global_step=3413.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  30%|███       | 367/1208 [10:48<24:45,  1.77s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0536, train/loss_vlb_step=0.000192, train/loss_step=0.0536, global_step=3413.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  30%|███       | 368/1208 [10:51<24:46,  1.77s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0536, train/loss_vlb_step=0.000192, train/loss_step=0.0536, global_step=3413.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  30%|███       | 368/1208 [10:51<24:46,  1.77s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.93e-5, train/loss_step=0.0106, global_step=3413.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  31%|███       | 369/1208 [10:52<24:43,  1.77s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.93e-5, train/loss_step=0.0106, global_step=3413.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  31%|███       | 369/1208 [10:52<24:43,  1.77s/it, loss=0.141, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000469, train/loss_step=0.141, global_step=3414.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  31%|███       | 370/1208 [10:53<24:40,  1.77s/it, loss=0.141, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000469, train/loss_step=0.141, global_step=3414.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  31%|███       | 370/1208 [10:53<24:40,  1.77s/it, loss=0.151, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000857, train/loss_step=0.220, global_step=3414.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  31%|███       | 371/1208 [10:54<24:36,  1.76s/it, loss=0.151, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000857, train/loss_step=0.220, global_step=3414.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  31%|███       | 371/1208 [10:54<24:36,  1.76s/it, loss=0.16, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.00069, train/loss_step=0.192, global_step=3414.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  31%|███       | 372/1208 [10:57<24:38,  1.77s/it, loss=0.16, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.00069, train/loss_step=0.192, global_step=3414.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  31%|███       | 372/1208 [10:57<24:38,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.545, train/loss_vlb_step=0.0145, train/loss_step=0.545, global_step=3414.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  31%|███       | 373/1208 [10:58<24:35,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.545, train/loss_vlb_step=0.0145, train/loss_step=0.545, global_step=3414.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  31%|███       | 373/1208 [10:58<24:35,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000498, train/loss_step=0.148, global_step=3415.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  31%|███       | 374/1208 [10:59<24:31,  1.76s/it, loss=0.168, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000498, train/loss_step=0.148, global_step=3415.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  31%|███       | 374/1208 [10:59<24:31,  1.76s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=2.26e-5, train/loss_step=0.00407, global_step=3415.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  31%|███       | 375/1208 [11:00<24:28,  1.76s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=2.26e-5, train/loss_step=0.00407, global_step=3415.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  31%|███       | 375/1208 [11:00<24:28,  1.76s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000161, train/loss_step=0.0437, global_step=3415.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  31%|███       | 376/1208 [11:04<24:29,  1.77s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000161, train/loss_step=0.0437, global_step=3415.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  31%|███       | 376/1208 [11:04<24:29,  1.77s/it, loss=0.137, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000665, train/loss_step=0.191, global_step=3415.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  31%|███       | 377/1208 [11:05<24:26,  1.76s/it, loss=0.137, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000665, train/loss_step=0.191, global_step=3415.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  31%|███       | 377/1208 [11:05<24:26,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=9.53e-6, train/loss_step=0.00161, global_step=3416.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  31%|███▏      | 378/1208 [11:06<24:23,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=9.53e-6, train/loss_step=0.00161, global_step=3416.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  31%|███▏      | 378/1208 [11:06<24:23,  1.76s/it, loss=0.144, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000749, train/loss_step=0.190, global_step=3416.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  31%|███▏      | 379/1208 [11:07<24:19,  1.76s/it, loss=0.144, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000749, train/loss_step=0.190, global_step=3416.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  31%|███▏      | 379/1208 [11:07<24:19,  1.76s/it, loss=0.118, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00206, train/loss_step=0.318, global_step=3416.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  31%|███▏      | 380/1208 [11:10<24:21,  1.76s/it, loss=0.118, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00206, train/loss_step=0.318, global_step=3416.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  31%|███▏      | 380/1208 [11:10<24:21,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=3416.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  32%|███▏      | 381/1208 [11:11<24:18,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=3416.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  32%|███▏      | 381/1208 [11:11<24:18,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=1.11e-5, train/loss_step=0.00183, global_step=3417.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  32%|███▏      | 382/1208 [11:12<24:14,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=1.11e-5, train/loss_step=0.00183, global_step=3417.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  32%|███▏      | 382/1208 [11:12<24:14,  1.76s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0564, train/loss_vlb_step=0.000193, train/loss_step=0.0564, global_step=3417.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  32%|███▏      | 383/1208 [11:13<24:11,  1.76s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0564, train/loss_vlb_step=0.000193, train/loss_step=0.0564, global_step=3417.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  32%|███▏      | 383/1208 [11:13<24:11,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000673, train/loss_step=0.192, global_step=3417.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  32%|███▏      | 384/1208 [11:17<24:12,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000673, train/loss_step=0.192, global_step=3417.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  32%|███▏      | 384/1208 [11:17<24:12,  1.76s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000109, train/loss_step=0.0273, global_step=3417.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  32%|███▏      | 385/1208 [11:18<24:09,  1.76s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000109, train/loss_step=0.0273, global_step=3417.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  32%|███▏      | 385/1208 [11:18<24:09,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.000101, train/loss_step=0.0249, global_step=3418.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  32%|███▏      | 386/1208 [11:19<24:06,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.000101, train/loss_step=0.0249, global_step=3418.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  32%|███▏      | 386/1208 [11:19<24:06,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.21e-5, train/loss_step=0.00198, global_step=3418.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  32%|███▏      | 387/1208 [11:20<24:03,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.21e-5, train/loss_step=0.00198, global_step=3418.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  32%|███▏      | 387/1208 [11:20<24:03,  1.76s/it, loss=0.138, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00187, train/loss_step=0.334, global_step=3418.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  32%|███▏      | 388/1208 [11:23<24:04,  1.76s/it, loss=0.138, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00187, train/loss_step=0.334, global_step=3418.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  32%|███▏      | 388/1208 [11:23<24:04,  1.76s/it, loss=0.148, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000819, train/loss_step=0.210, global_step=3418.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  32%|███▏      | 389/1208 [11:24<24:01,  1.76s/it, loss=0.148, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000819, train/loss_step=0.210, global_step=3418.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  32%|███▏      | 389/1208 [11:24<24:01,  1.76s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0768, train/loss_vlb_step=0.000255, train/loss_step=0.0768, global_step=3419.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  32%|███▏      | 390/1208 [11:25<23:57,  1.76s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0768, train/loss_vlb_step=0.000255, train/loss_step=0.0768, global_step=3419.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  32%|███▏      | 390/1208 [11:25<23:57,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.41e-5, train/loss_step=0.0144, global_step=3419.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  32%|███▏      | 391/1208 [11:26<23:54,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.41e-5, train/loss_step=0.0144, global_step=3419.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  32%|███▏      | 391/1208 [11:26<23:54,  1.76s/it, loss=0.138, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00106, train/loss_step=0.264, global_step=3419.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  32%|███▏      | 392/1208 [11:29<23:56,  1.76s/it, loss=0.138, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00106, train/loss_step=0.264, global_step=3419.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  32%|███▏      | 392/1208 [11:29<23:56,  1.76s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=1.29e-5, train/loss_step=0.00214, global_step=3419.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  33%|███▎      | 393/1208 [11:30<23:52,  1.76s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=1.29e-5, train/loss_step=0.00214, global_step=3419.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  33%|███▎      | 393/1208 [11:30<23:52,  1.76s/it, loss=0.127, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00495, train/loss_step=0.476, global_step=3420.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  33%|███▎      | 394/1208 [11:32<23:49,  1.76s/it, loss=0.127, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00495, train/loss_step=0.476, global_step=3420.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  33%|███▎      | 394/1208 [11:32<23:49,  1.76s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.78e-5, train/loss_step=0.0105, global_step=3420.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  33%|███▎      | 395/1208 [11:33<23:46,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.78e-5, train/loss_step=0.0105, global_step=3420.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  33%|███▎      | 395/1208 [11:33<23:46,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00114, train/loss_step=0.260, global_step=3420.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  33%|███▎      | 396/1208 [11:36<23:47,  1.76s/it, loss=0.139, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00114, train/loss_step=0.260, global_step=3420.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  33%|███▎      | 396/1208 [11:36<23:47,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000473, train/loss_step=0.139, global_step=3420.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  33%|███▎      | 397/1208 [11:37<23:44,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000473, train/loss_step=0.139, global_step=3420.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  33%|███▎      | 397/1208 [11:37<23:44,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000921, train/loss_step=0.208, global_step=3421.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  33%|███▎      | 398/1208 [11:38<23:41,  1.75s/it, loss=0.146, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000921, train/loss_step=0.208, global_step=3421.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  33%|███▎      | 398/1208 [11:38<23:41,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.5e-5, train/loss_step=0.0125, global_step=3421.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  33%|███▎      | 399/1208 [11:39<23:38,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.5e-5, train/loss_step=0.0125, global_step=3421.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  33%|███▎      | 399/1208 [11:39<23:38,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0931, train/loss_vlb_step=0.000321, train/loss_step=0.0931, global_step=3421.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  33%|███▎      | 400/1208 [11:42<23:39,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0931, train/loss_vlb_step=0.000321, train/loss_step=0.0931, global_step=3421.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  33%|███▎      | 400/1208 [11:42<23:39,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00152, train/loss_step=0.292, global_step=3421.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  33%|███▎      | 401/1208 [11:43<23:36,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00152, train/loss_step=0.292, global_step=3421.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  33%|███▎      | 401/1208 [11:43<23:36,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00843, train/loss_vlb_step=4.21e-5, train/loss_step=0.00843, global_step=3422.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  33%|███▎      | 402/1208 [11:44<23:33,  1.75s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00843, train/loss_vlb_step=4.21e-5, train/loss_step=0.00843, global_step=3422.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  33%|███▎      | 402/1208 [11:44<23:33,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.000234, train/loss_step=0.0702, global_step=3422.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  33%|███▎      | 403/1208 [11:45<23:30,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.000234, train/loss_step=0.0702, global_step=3422.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  33%|███▎      | 403/1208 [11:45<23:30,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00551, train/loss_vlb_step=2.77e-5, train/loss_step=0.00551, global_step=3422.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  33%|███▎      | 404/1208 [11:49<23:31,  1.76s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00551, train/loss_vlb_step=2.77e-5, train/loss_step=0.00551, global_step=3422.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  33%|███▎      | 404/1208 [11:49<23:31,  1.76s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000181, train/loss_step=0.0524, global_step=3422.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  34%|███▎      | 405/1208 [11:50<23:28,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000181, train/loss_step=0.0524, global_step=3422.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  34%|███▎      | 405/1208 [11:50<23:28,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.47e-5, train/loss_step=0.0185, global_step=3423.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  34%|███▎      | 406/1208 [11:51<23:24,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.47e-5, train/loss_step=0.0185, global_step=3423.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  34%|███▎      | 406/1208 [11:51<23:24,  1.75s/it, loss=0.134, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000459, train/loss_step=0.139, global_step=3423.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  34%|███▎      | 407/1208 [11:52<23:21,  1.75s/it, loss=0.134, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000459, train/loss_step=0.139, global_step=3423.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  34%|███▎      | 407/1208 [11:52<23:21,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00467, train/loss_vlb_step=2.46e-5, train/loss_step=0.00467, global_step=3423.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  34%|███▍      | 408/1208 [11:55<23:23,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00467, train/loss_vlb_step=2.46e-5, train/loss_step=0.00467, global_step=3423.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  34%|███▍      | 408/1208 [11:55<23:23,  1.75s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000104, train/loss_step=0.0277, global_step=3423.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  34%|███▍      | 409/1208 [11:56<23:19,  1.75s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000104, train/loss_step=0.0277, global_step=3423.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  34%|███▍      | 409/1208 [11:56<23:19,  1.75s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.000168, train/loss_step=0.0468, global_step=3424.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  34%|███▍      | 410/1208 [11:57<23:16,  1.75s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.000168, train/loss_step=0.0468, global_step=3424.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  34%|███▍      | 410/1208 [11:57<23:16,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000768, train/loss_step=0.206, global_step=3424.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  34%|███▍      | 411/1208 [11:58<23:13,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000768, train/loss_step=0.206, global_step=3424.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  34%|███▍      | 411/1208 [11:58<23:13,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00183, train/loss_step=0.341, global_step=3424.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  34%|███▍      | 412/1208 [12:01<23:14,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00183, train/loss_step=0.341, global_step=3424.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  34%|███▍      | 412/1208 [12:01<23:14,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0542, train/loss_vlb_step=0.000189, train/loss_step=0.0542, global_step=3424.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  34%|███▍      | 413/1208 [12:03<23:11,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0542, train/loss_vlb_step=0.000189, train/loss_step=0.0542, global_step=3424.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  34%|███▍      | 413/1208 [12:03<23:11,  1.75s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.08e-5, train/loss_step=0.0171, global_step=3425.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  34%|███▍      | 414/1208 [12:04<23:08,  1.75s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.08e-5, train/loss_step=0.0171, global_step=3425.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  34%|███▍      | 414/1208 [12:04<23:08,  1.75s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.93e-5, train/loss_step=0.00344, global_step=3425.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  34%|███▍      | 415/1208 [12:05<23:05,  1.75s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.93e-5, train/loss_step=0.00344, global_step=3425.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  34%|███▍      | 415/1208 [12:05<23:05,  1.75s/it, loss=0.1, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00107, train/loss_step=0.261, global_step=3425.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  34%|███▍      | 416/1208 [12:08<23:06,  1.75s/it, loss=0.1, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00107, train/loss_step=0.261, global_step=3425.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  34%|███▍      | 416/1208 [12:08<23:06,  1.75s/it, loss=0.0938, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.49e-5, train/loss_step=0.0147, global_step=3425.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  35%|███▍      | 417/1208 [12:09<23:03,  1.75s/it, loss=0.0938, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.49e-5, train/loss_step=0.0147, global_step=3425.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  35%|███▍      | 417/1208 [12:09<23:03,  1.75s/it, loss=0.087, v_num=0, train/loss_simple_step=0.0715, train/loss_vlb_step=0.000244, train/loss_step=0.0715, global_step=3426.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  35%|███▍      | 418/1208 [12:10<23:00,  1.75s/it, loss=0.087, v_num=0, train/loss_simple_step=0.0715, train/loss_vlb_step=0.000244, train/loss_step=0.0715, global_step=3426.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  35%|███▍      | 418/1208 [12:10<23:00,  1.75s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000887, train/loss_step=0.220, global_step=3426.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  35%|███▍      | 419/1208 [12:11<22:57,  1.75s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000887, train/loss_step=0.220, global_step=3426.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  35%|███▍      | 419/1208 [12:11<22:57,  1.75s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.0522, train/loss_vlb_step=0.000181, train/loss_step=0.0522, global_step=3426.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  35%|███▍      | 420/1208 [12:14<22:58,  1.75s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.0522, train/loss_vlb_step=0.000181, train/loss_step=0.0522, global_step=3426.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  35%|███▍      | 420/1208 [12:14<22:58,  1.75s/it, loss=0.087, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.00041, train/loss_step=0.124, global_step=3426.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  35%|███▍      | 421/1208 [12:15<22:55,  1.75s/it, loss=0.087, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.00041, train/loss_step=0.124, global_step=3426.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  35%|███▍      | 421/1208 [12:15<22:55,  1.75s/it, loss=0.0901, v_num=0, train/loss_simple_step=0.0716, train/loss_vlb_step=0.000244, train/loss_step=0.0716, global_step=3427.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  35%|███▍      | 422/1208 [12:16<22:52,  1.75s/it, loss=0.0901, v_num=0, train/loss_simple_step=0.0716, train/loss_vlb_step=0.000244, train/loss_step=0.0716, global_step=3427.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  35%|███▍      | 422/1208 [12:16<22:52,  1.75s/it, loss=0.0878, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.01e-5, train/loss_step=0.0238, global_step=3427.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  35%|███▌      | 423/1208 [12:17<22:49,  1.74s/it, loss=0.0878, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.01e-5, train/loss_step=0.0238, global_step=3427.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  35%|███▌      | 423/1208 [12:17<22:49,  1.74s/it, loss=0.0938, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000409, train/loss_step=0.125, global_step=3427.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  35%|███▌      | 424/1208 [12:21<22:50,  1.75s/it, loss=0.0938, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000409, train/loss_step=0.125, global_step=3427.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  35%|███▌      | 424/1208 [12:21<22:50,  1.75s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.00614, train/loss_vlb_step=3.13e-5, train/loss_step=0.00614, global_step=3427.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  35%|███▌      | 425/1208 [12:22<22:47,  1.75s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.00614, train/loss_vlb_step=3.13e-5, train/loss_step=0.00614, global_step=3427.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  35%|███▌      | 425/1208 [12:22<22:47,  1.75s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.00468, train/loss_vlb_step=2.52e-5, train/loss_step=0.00468, global_step=3428.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  35%|███▌      | 426/1208 [12:23<22:44,  1.74s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.00468, train/loss_vlb_step=2.52e-5, train/loss_step=0.00468, global_step=3428.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  35%|███▌      | 426/1208 [12:23<22:44,  1.74s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.00063, train/loss_step=0.179, global_step=3428.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  35%|███▌      | 427/1208 [12:24<22:41,  1.74s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.00063, train/loss_step=0.179, global_step=3428.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  35%|███▌      | 427/1208 [12:24<22:41,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.455, train/loss_vlb_step=0.00579, train/loss_step=0.455, global_step=3428.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  35%|███▌      | 428/1208 [12:27<22:42,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.455, train/loss_vlb_step=0.00579, train/loss_step=0.455, global_step=3428.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  35%|███▌      | 428/1208 [12:27<22:42,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000499, train/loss_step=0.150, global_step=3428.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  36%|███▌      | 429/1208 [12:28<22:39,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000499, train/loss_step=0.150, global_step=3428.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  36%|███▌      | 429/1208 [12:28<22:39,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000438, train/loss_step=0.133, global_step=3429.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  36%|███▌      | 430/1208 [12:29<22:36,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000438, train/loss_step=0.133, global_step=3429.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  36%|███▌      | 430/1208 [12:29<22:36,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.000212, train/loss_step=0.0615, global_step=3429.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  36%|███▌      | 431/1208 [12:30<22:33,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.000212, train/loss_step=0.0615, global_step=3429.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  36%|███▌      | 431/1208 [12:30<22:33,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=3429.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  36%|███▌      | 432/1208 [12:33<22:34,  1.75s/it, loss=0.107, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=3429.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  36%|███▌      | 432/1208 [12:33<22:34,  1.75s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0626, train/loss_vlb_step=0.000214, train/loss_step=0.0626, global_step=3429.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  36%|███▌      | 433/1208 [12:35<22:31,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0626, train/loss_vlb_step=0.000214, train/loss_step=0.0626, global_step=3429.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  36%|███▌      | 433/1208 [12:35<22:31,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.4e-5, train/loss_step=0.00244, global_step=3430.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  36%|███▌      | 434/1208 [12:36<22:28,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.4e-5, train/loss_step=0.00244, global_step=3430.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  36%|███▌      | 434/1208 [12:36<22:28,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.7e-5, train/loss_step=0.0132, global_step=3430.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  36%|███▌      | 435/1208 [12:37<22:25,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.7e-5, train/loss_step=0.0132, global_step=3430.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  36%|███▌      | 435/1208 [12:37<22:25,  1.74s/it, loss=0.101, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.00043, train/loss_step=0.130, global_step=3430.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  36%|███▌      | 436/1208 [12:40<22:26,  1.74s/it, loss=0.101, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.00043, train/loss_step=0.130, global_step=3430.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  36%|███▌      | 436/1208 [12:40<22:26,  1.74s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.81e-5, train/loss_step=0.0102, global_step=3430.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  36%|███▌      | 437/1208 [12:41<22:23,  1.74s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.81e-5, train/loss_step=0.0102, global_step=3430.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  36%|███▌      | 437/1208 [12:41<22:23,  1.74s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0683, train/loss_vlb_step=0.000236, train/loss_step=0.0683, global_step=3431.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  36%|███▋      | 438/1208 [12:42<22:20,  1.74s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0683, train/loss_vlb_step=0.000236, train/loss_step=0.0683, global_step=3431.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  36%|███▋      | 438/1208 [12:42<22:20,  1.74s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=3431.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  36%|███▋      | 439/1208 [12:43<22:17,  1.74s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=3431.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  36%|███▋      | 439/1208 [12:43<22:17,  1.74s/it, loss=0.0927, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.57e-5, train/loss_step=0.0128, global_step=3431.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  36%|███▋      | 440/1208 [12:46<22:18,  1.74s/it, loss=0.0927, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.57e-5, train/loss_step=0.0128, global_step=3431.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  36%|███▋      | 440/1208 [12:46<22:18,  1.74s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=8.66e-5, train/loss_step=0.0222, global_step=3431.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  37%|███▋      | 441/1208 [12:47<22:15,  1.74s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=8.66e-5, train/loss_step=0.0222, global_step=3431.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  37%|███▋      | 441/1208 [12:47<22:15,  1.74s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00101, train/loss_step=0.255, global_step=3432.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  37%|███▋      | 442/1208 [12:49<22:12,  1.74s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00101, train/loss_step=0.255, global_step=3432.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  37%|███▋      | 442/1208 [12:49<22:12,  1.74s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.00447, train/loss_vlb_step=2.24e-5, train/loss_step=0.00447, global_step=3432.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  37%|███▋      | 443/1208 [12:50<22:09,  1.74s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.00447, train/loss_vlb_step=2.24e-5, train/loss_step=0.00447, global_step=3432.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  37%|███▋      | 443/1208 [12:50<22:09,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00112, train/loss_step=0.252, global_step=3432.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]     Epoch 11:  37%|███▋      | 444/1208 [12:53<22:10,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00112, train/loss_step=0.252, global_step=3432.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  37%|███▋      | 444/1208 [12:53<22:10,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.673, train/loss_vlb_step=0.0432, train/loss_step=0.673, global_step=3432.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  37%|███▋      | 445/1208 [12:54<22:07,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.673, train/loss_vlb_step=0.0432, train/loss_step=0.673, global_step=3432.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  37%|███▋      | 445/1208 [12:54<22:07,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00967, train/loss_vlb_step=4.42e-5, train/loss_step=0.00967, global_step=3433.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  37%|███▋      | 446/1208 [12:55<22:04,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00967, train/loss_vlb_step=4.42e-5, train/loss_step=0.00967, global_step=3433.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  37%|███▋      | 446/1208 [12:55<22:04,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.551, train/loss_vlb_step=0.00716, train/loss_step=0.551, global_step=3433.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  37%|███▋      | 447/1208 [12:56<22:01,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.551, train/loss_vlb_step=0.00716, train/loss_step=0.551, global_step=3433.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  37%|███▋      | 447/1208 [12:56<22:01,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0622, train/loss_vlb_step=0.000219, train/loss_step=0.0622, global_step=3433.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  37%|███▋      | 448/1208 [12:59<22:02,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0622, train/loss_vlb_step=0.000219, train/loss_step=0.0622, global_step=3433.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  37%|███▋      | 448/1208 [12:59<22:02,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00512, train/loss_vlb_step=2.64e-5, train/loss_step=0.00512, global_step=3433.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  37%|███▋      | 449/1208 [13:00<21:59,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00512, train/loss_vlb_step=2.64e-5, train/loss_step=0.00512, global_step=3433.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  37%|███▋      | 449/1208 [13:00<21:59,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.79e-5, train/loss_step=0.00324, global_step=3434.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  37%|███▋      | 450/1208 [13:01<21:56,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.79e-5, train/loss_step=0.00324, global_step=3434.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  37%|███▋      | 450/1208 [13:01<21:56,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00543, train/loss_vlb_step=2.77e-5, train/loss_step=0.00543, global_step=3434.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  37%|███▋      | 451/1208 [13:02<21:54,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00543, train/loss_vlb_step=2.77e-5, train/loss_step=0.00543, global_step=3434.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  37%|███▋      | 451/1208 [13:02<21:54,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.547, train/loss_vlb_step=0.00537, train/loss_step=0.547, global_step=3434.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]     Epoch 11:  37%|███▋      | 452/1208 [13:06<21:54,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.547, train/loss_vlb_step=0.00537, train/loss_step=0.547, global_step=3434.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  37%|███▋      | 452/1208 [13:06<21:54,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0092, train/loss_vlb_step=4.52e-5, train/loss_step=0.0092, global_step=3434.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  38%|███▊      | 453/1208 [13:07<21:52,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0092, train/loss_vlb_step=4.52e-5, train/loss_step=0.0092, global_step=3434.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  38%|███▊      | 453/1208 [13:07<21:52,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.082, train/loss_vlb_step=0.000272, train/loss_step=0.082, global_step=3435.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  38%|███▊      | 454/1208 [13:08<21:49,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.082, train/loss_vlb_step=0.000272, train/loss_step=0.082, global_step=3435.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  38%|███▊      | 454/1208 [13:08<21:49,  1.74s/it, loss=0.147, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000476, train/loss_step=0.142, global_step=3435.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  38%|███▊      | 455/1208 [13:09<21:46,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000476, train/loss_step=0.142, global_step=3435.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  38%|███▊      | 455/1208 [13:09<21:46,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0834, train/loss_vlb_step=0.000282, train/loss_step=0.0834, global_step=3435.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  38%|███▊      | 456/1208 [13:12<21:47,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0834, train/loss_vlb_step=0.000282, train/loss_step=0.0834, global_step=3435.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  38%|███▊      | 456/1208 [13:12<21:47,  1.74s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0818, train/loss_vlb_step=0.000273, train/loss_step=0.0818, global_step=3435.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  38%|███▊      | 457/1208 [13:13<21:44,  1.74s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0818, train/loss_vlb_step=0.000273, train/loss_step=0.0818, global_step=3435.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  38%|███▊      | 457/1208 [13:13<21:44,  1.74s/it, loss=0.161, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00237, train/loss_step=0.309, global_step=3436.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  38%|███▊      | 458/1208 [13:14<21:41,  1.74s/it, loss=0.161, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00237, train/loss_step=0.309, global_step=3436.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  38%|███▊      | 458/1208 [13:14<21:41,  1.74s/it, loss=0.178, v_num=0, train/loss_simple_step=0.440, train/loss_vlb_step=0.00294, train/loss_step=0.440, global_step=3436.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  38%|███▊      | 459/1208 [13:15<21:38,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.440, train/loss_vlb_step=0.00294, train/loss_step=0.440, global_step=3436.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  38%|███▊      | 459/1208 [13:15<21:38,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00597, train/loss_vlb_step=3e-5, train/loss_step=0.00597, global_step=3436.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  38%|███▊      | 460/1208 [13:18<21:39,  1.74s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00597, train/loss_vlb_step=3e-5, train/loss_step=0.00597, global_step=3436.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  38%|███▊      | 460/1208 [13:18<21:39,  1.74s/it, loss=0.186, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000834, train/loss_step=0.206, global_step=3436.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  38%|███▊      | 461/1208 [13:20<21:36,  1.74s/it, loss=0.186, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000834, train/loss_step=0.206, global_step=3436.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  38%|███▊      | 461/1208 [13:20<21:36,  1.74s/it, loss=0.191, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.002, train/loss_step=0.344, global_step=3437.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  38%|███▊      | 462/1208 [13:21<21:33,  1.73s/it, loss=0.191, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.002, train/loss_step=0.344, global_step=3437.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  38%|███▊      | 462/1208 [13:21<21:33,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000348, train/loss_step=0.104, global_step=3437.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  38%|███▊      | 463/1208 [13:22<21:30,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000348, train/loss_step=0.104, global_step=3437.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  38%|███▊      | 463/1208 [13:22<21:30,  1.73s/it, loss=0.204, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00247, train/loss_step=0.413, global_step=3437.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  38%|███▊      | 464/1208 [13:25<21:31,  1.74s/it, loss=0.204, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00247, train/loss_step=0.413, global_step=3437.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  38%|███▊      | 464/1208 [13:25<21:31,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000619, train/loss_step=0.178, global_step=3437.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  38%|███▊      | 465/1208 [13:26<21:28,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000619, train/loss_step=0.178, global_step=3437.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  38%|███▊      | 465/1208 [13:26<21:28,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.58e-5, train/loss_step=0.00273, global_step=3438.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  39%|███▊      | 466/1208 [13:27<21:25,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.58e-5, train/loss_step=0.00273, global_step=3438.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  39%|███▊      | 466/1208 [13:27<21:25,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00379, train/loss_step=0.457, global_step=3438.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  39%|███▊      | 467/1208 [13:28<21:22,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00379, train/loss_step=0.457, global_step=3438.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  39%|███▊      | 467/1208 [13:28<21:22,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000117, train/loss_step=0.0298, global_step=3438.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  39%|███▊      | 468/1208 [13:31<21:23,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000117, train/loss_step=0.0298, global_step=3438.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  39%|███▊      | 468/1208 [13:31<21:23,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.75e-5, train/loss_step=0.0149, global_step=3438.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  39%|███▉      | 469/1208 [13:32<21:20,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.75e-5, train/loss_step=0.0149, global_step=3438.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  39%|███▉      | 469/1208 [13:32<21:20,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00825, train/loss_vlb_step=3.94e-5, train/loss_step=0.00825, global_step=3439.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  39%|███▉      | 470/1208 [13:33<21:18,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00825, train/loss_vlb_step=3.94e-5, train/loss_step=0.00825, global_step=3439.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  39%|███▉      | 470/1208 [13:33<21:18,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000684, train/loss_step=0.190, global_step=3439.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  39%|███▉      | 471/1208 [13:34<21:15,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000684, train/loss_step=0.190, global_step=3439.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  39%|███▉      | 471/1208 [13:34<21:15,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000932, train/loss_step=0.245, global_step=3439.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  39%|███▉      | 472/1208 [13:38<21:15,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000932, train/loss_step=0.245, global_step=3439.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  39%|███▉      | 472/1208 [13:38<21:15,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=3439.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  39%|███▉      | 473/1208 [13:39<21:13,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=3439.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  39%|███▉      | 473/1208 [13:39<21:13,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000479, train/loss_step=0.144, global_step=3440.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  39%|███▉      | 474/1208 [13:40<21:10,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000479, train/loss_step=0.144, global_step=3440.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  39%|███▉      | 474/1208 [13:40<21:10,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00429, train/loss_vlb_step=2.37e-5, train/loss_step=0.00429, global_step=3440.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  39%|███▉      | 475/1208 [13:41<21:07,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00429, train/loss_vlb_step=2.37e-5, train/loss_step=0.00429, global_step=3440.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  39%|███▉      | 475/1208 [13:41<21:07,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.58e-5, train/loss_step=0.0205, global_step=3440.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  39%|███▉      | 476/1208 [13:44<21:08,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.58e-5, train/loss_step=0.0205, global_step=3440.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  39%|███▉      | 476/1208 [13:44<21:08,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000289, train/loss_step=0.087, global_step=3440.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  39%|███▉      | 477/1208 [13:45<21:05,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000289, train/loss_step=0.087, global_step=3440.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  39%|███▉      | 477/1208 [13:45<21:05,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.23e-5, train/loss_step=0.0021, global_step=3441.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  40%|███▉      | 478/1208 [13:46<21:02,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.23e-5, train/loss_step=0.0021, global_step=3441.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  40%|███▉      | 478/1208 [13:46<21:02,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000555, train/loss_step=0.164, global_step=3441.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  40%|███▉      | 479/1208 [13:47<20:59,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000555, train/loss_step=0.164, global_step=3441.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  40%|███▉      | 479/1208 [13:47<20:59,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000126, train/loss_step=0.0328, global_step=3441.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  40%|███▉      | 480/1208 [13:51<21:00,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000126, train/loss_step=0.0328, global_step=3441.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  40%|███▉      | 480/1208 [13:51<21:00,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000109, train/loss_step=0.0272, global_step=3441.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  40%|███▉      | 481/1208 [13:52<20:57,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000109, train/loss_step=0.0272, global_step=3441.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  40%|███▉      | 481/1208 [13:52<20:57,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00158, train/loss_step=0.310, global_step=3442.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  40%|███▉      | 482/1208 [13:53<20:55,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00158, train/loss_step=0.310, global_step=3442.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  40%|███▉      | 482/1208 [13:53<20:55,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0744, train/loss_vlb_step=0.000246, train/loss_step=0.0744, global_step=3442.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  40%|███▉      | 483/1208 [13:54<20:52,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0744, train/loss_vlb_step=0.000246, train/loss_step=0.0744, global_step=3442.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  40%|███▉      | 483/1208 [13:54<20:52,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0623, train/loss_vlb_step=0.00021, train/loss_step=0.0623, global_step=3442.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  40%|████      | 484/1208 [13:57<20:52,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0623, train/loss_vlb_step=0.00021, train/loss_step=0.0623, global_step=3442.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  40%|████      | 484/1208 [13:57<20:52,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000796, train/loss_step=0.211, global_step=3442.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  40%|████      | 485/1208 [13:58<20:50,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000796, train/loss_step=0.211, global_step=3442.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  40%|████      | 485/1208 [13:58<20:50,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000364, train/loss_step=0.110, global_step=3443.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  40%|████      | 486/1208 [13:59<20:47,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000364, train/loss_step=0.110, global_step=3443.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  40%|████      | 486/1208 [13:59<20:47,  1.73s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.0797, train/loss_vlb_step=0.000263, train/loss_step=0.0797, global_step=3443.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  40%|████      | 487/1208 [14:00<20:44,  1.73s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.0797, train/loss_vlb_step=0.000263, train/loss_step=0.0797, global_step=3443.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  40%|████      | 487/1208 [14:00<20:44,  1.73s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.00923, train/loss_vlb_step=4.5e-5, train/loss_step=0.00923, global_step=3443.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  40%|████      | 488/1208 [14:03<20:45,  1.73s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.00923, train/loss_vlb_step=4.5e-5, train/loss_step=0.00923, global_step=3443.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  40%|████      | 488/1208 [14:03<20:45,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.00081, train/loss_step=0.215, global_step=3443.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  40%|████      | 489/1208 [14:05<20:42,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.00081, train/loss_step=0.215, global_step=3443.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  40%|████      | 489/1208 [14:05<20:42,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000759, train/loss_step=0.200, global_step=3444.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  41%|████      | 490/1208 [14:06<20:39,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000759, train/loss_step=0.200, global_step=3444.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  41%|████      | 490/1208 [14:06<20:39,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0843, train/loss_vlb_step=0.000282, train/loss_step=0.0843, global_step=3444.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  41%|████      | 491/1208 [14:07<20:37,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0843, train/loss_vlb_step=0.000282, train/loss_step=0.0843, global_step=3444.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  41%|████      | 491/1208 [14:07<20:37,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000484, train/loss_step=0.144, global_step=3444.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  41%|████      | 492/1208 [14:10<20:37,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000484, train/loss_step=0.144, global_step=3444.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  41%|████      | 492/1208 [14:10<20:37,  1.73s/it, loss=0.105, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000388, train/loss_step=0.118, global_step=3444.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  41%|████      | 493/1208 [14:11<20:34,  1.73s/it, loss=0.105, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000388, train/loss_step=0.118, global_step=3444.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  41%|████      | 493/1208 [14:11<20:34,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00354, train/loss_step=0.432, global_step=3445.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  41%|████      | 494/1208 [14:12<20:32,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00354, train/loss_step=0.432, global_step=3445.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  41%|████      | 494/1208 [14:12<20:32,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.27e-5, train/loss_step=0.023, global_step=3445.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  41%|████      | 495/1208 [14:13<20:29,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.27e-5, train/loss_step=0.023, global_step=3445.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  41%|████      | 495/1208 [14:13<20:29,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000911, train/loss_step=0.229, global_step=3445.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  41%|████      | 496/1208 [14:16<20:29,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000911, train/loss_step=0.229, global_step=3445.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  41%|████      | 496/1208 [14:16<20:29,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.00062, train/loss_step=0.184, global_step=3445.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  41%|████      | 497/1208 [14:17<20:27,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.00062, train/loss_step=0.184, global_step=3445.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  41%|████      | 497/1208 [14:17<20:27,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.678, train/loss_vlb_step=0.0153, train/loss_step=0.678, global_step=3446.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  41%|████      | 498/1208 [14:18<20:24,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.678, train/loss_vlb_step=0.0153, train/loss_step=0.678, global_step=3446.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  41%|████      | 498/1208 [14:18<20:24,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00213, train/loss_step=0.354, global_step=3446.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  41%|████▏     | 499/1208 [14:19<20:21,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00213, train/loss_step=0.354, global_step=3446.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  41%|████▏     | 499/1208 [14:19<20:21,  1.72s/it, loss=0.192, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00131, train/loss_step=0.290, global_step=3446.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  41%|████▏     | 500/1208 [14:23<20:22,  1.73s/it, loss=0.192, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00131, train/loss_step=0.290, global_step=3446.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  41%|████▏     | 500/1208 [14:23<20:22,  1.73s/it, loss=0.192, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000152, train/loss_step=0.042, global_step=3446.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  41%|████▏     | 501/1208 [14:24<20:19,  1.73s/it, loss=0.192, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000152, train/loss_step=0.042, global_step=3446.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  41%|████▏     | 501/1208 [14:24<20:19,  1.73s/it, loss=0.201, v_num=0, train/loss_simple_step=0.474, train/loss_vlb_step=0.00389, train/loss_step=0.474, global_step=3447.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  42%|████▏     | 502/1208 [14:25<20:16,  1.72s/it, loss=0.201, v_num=0, train/loss_simple_step=0.474, train/loss_vlb_step=0.00389, train/loss_step=0.474, global_step=3447.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  42%|████▏     | 502/1208 [14:25<20:16,  1.72s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00385, train/loss_vlb_step=2.06e-5, train/loss_step=0.00385, global_step=3447.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  42%|████▏     | 503/1208 [14:26<20:14,  1.72s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00385, train/loss_vlb_step=2.06e-5, train/loss_step=0.00385, global_step=3447.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  42%|████▏     | 503/1208 [14:26<20:14,  1.72s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0618, train/loss_vlb_step=0.000212, train/loss_step=0.0618, global_step=3447.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  42%|████▏     | 504/1208 [14:29<20:14,  1.73s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0618, train/loss_vlb_step=0.000212, train/loss_step=0.0618, global_step=3447.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  42%|████▏     | 504/1208 [14:29<20:14,  1.73s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.02e-5, train/loss_step=0.0143, global_step=3447.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  42%|████▏     | 505/1208 [14:30<20:12,  1.72s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.02e-5, train/loss_step=0.0143, global_step=3447.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  42%|████▏     | 505/1208 [14:30<20:12,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=1.02e-5, train/loss_step=0.00168, global_step=3448.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  42%|████▏     | 506/1208 [14:31<20:09,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=1.02e-5, train/loss_step=0.00168, global_step=3448.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  42%|████▏     | 506/1208 [14:31<20:09,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00779, train/loss_vlb_step=3.73e-5, train/loss_step=0.00779, global_step=3448.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  42%|████▏     | 507/1208 [14:32<20:06,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00779, train/loss_vlb_step=3.73e-5, train/loss_step=0.00779, global_step=3448.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  42%|████▏     | 507/1208 [14:32<20:06,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00789, train/loss_vlb_step=3.84e-5, train/loss_step=0.00789, global_step=3448.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  42%|████▏     | 508/1208 [14:36<20:07,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00789, train/loss_vlb_step=3.84e-5, train/loss_step=0.00789, global_step=3448.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  42%|████▏     | 508/1208 [14:36<20:07,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00132, train/loss_step=0.272, global_step=3448.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  42%|████▏     | 509/1208 [14:37<20:04,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00132, train/loss_step=0.272, global_step=3448.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  42%|████▏     | 509/1208 [14:37<20:04,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00542, train/loss_vlb_step=2.78e-5, train/loss_step=0.00542, global_step=3449.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  42%|████▏     | 510/1208 [14:38<20:01,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00542, train/loss_vlb_step=2.78e-5, train/loss_step=0.00542, global_step=3449.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  42%|████▏     | 510/1208 [14:38<20:01,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.29e-5, train/loss_step=0.00212, global_step=3449.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  42%|████▏     | 511/1208 [14:39<19:59,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.29e-5, train/loss_step=0.00212, global_step=3449.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  42%|████▏     | 511/1208 [14:39<19:59,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0419, train/loss_vlb_step=0.000151, train/loss_step=0.0419, global_step=3449.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  42%|████▏     | 512/1208 [14:42<19:59,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0419, train/loss_vlb_step=0.000151, train/loss_step=0.0419, global_step=3449.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  42%|████▏     | 512/1208 [14:42<19:59,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00315, train/loss_step=0.351, global_step=3449.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  42%|████▏     | 513/1208 [14:43<19:57,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00315, train/loss_step=0.351, global_step=3449.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  42%|████▏     | 513/1208 [14:43<19:57,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.004, train/loss_step=0.379, global_step=3450.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  43%|████▎     | 514/1208 [14:44<19:54,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.004, train/loss_step=0.379, global_step=3450.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  43%|████▎     | 514/1208 [14:44<19:54,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000147, train/loss_step=0.0396, global_step=3450.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  43%|████▎     | 515/1208 [14:45<19:51,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000147, train/loss_step=0.0396, global_step=3450.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  43%|████▎     | 515/1208 [14:45<19:51,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=3450.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  43%|████▎     | 516/1208 [14:48<19:52,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=3450.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  43%|████▎     | 516/1208 [14:48<19:52,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000658, train/loss_step=0.190, global_step=3450.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  43%|████▎     | 517/1208 [14:50<19:49,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000658, train/loss_step=0.190, global_step=3450.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  43%|████▎     | 517/1208 [14:50<19:49,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.87e-5, train/loss_step=0.00557, global_step=3451.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  43%|████▎     | 518/1208 [14:51<19:46,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.87e-5, train/loss_step=0.00557, global_step=3451.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  43%|████▎     | 518/1208 [14:51<19:46,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000333, train/loss_step=0.101, global_step=3451.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  43%|████▎     | 519/1208 [14:52<19:44,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000333, train/loss_step=0.101, global_step=3451.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  43%|████▎     | 519/1208 [14:52<19:44,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.818, train/loss_vlb_step=0.412, train/loss_step=0.818, global_step=3451.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  43%|████▎     | 520/1208 [14:55<19:44,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.818, train/loss_vlb_step=0.412, train/loss_step=0.818, global_step=3451.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  43%|████▎     | 520/1208 [14:55<19:44,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00304, train/loss_step=0.401, global_step=3451.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  43%|████▎     | 521/1208 [14:56<19:42,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00304, train/loss_step=0.401, global_step=3451.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  43%|████▎     | 521/1208 [14:56<19:42,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=3452.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  43%|████▎     | 522/1208 [14:57<19:39,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=3452.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  43%|████▎     | 522/1208 [14:57<19:39,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000527, train/loss_step=0.152, global_step=3452.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  43%|████▎     | 523/1208 [14:58<19:36,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000527, train/loss_step=0.152, global_step=3452.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  43%|████▎     | 523/1208 [14:58<19:36,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=6.94e-5, train/loss_step=0.0171, global_step=3452.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  43%|████▎     | 524/1208 [15:01<19:37,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=6.94e-5, train/loss_step=0.0171, global_step=3452.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  43%|████▎     | 524/1208 [15:01<19:37,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.96e-5, train/loss_step=0.00351, global_step=3452.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  43%|████▎     | 525/1208 [15:02<19:34,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.96e-5, train/loss_step=0.00351, global_step=3452.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  43%|████▎     | 525/1208 [15:02<19:34,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0424, train/loss_vlb_step=0.000154, train/loss_step=0.0424, global_step=3453.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  44%|████▎     | 526/1208 [15:03<19:31,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0424, train/loss_vlb_step=0.000154, train/loss_step=0.0424, global_step=3453.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  44%|████▎     | 526/1208 [15:03<19:31,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0593, train/loss_vlb_step=0.000206, train/loss_step=0.0593, global_step=3453.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  44%|████▎     | 527/1208 [15:04<19:29,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0593, train/loss_vlb_step=0.000206, train/loss_step=0.0593, global_step=3453.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  44%|████▎     | 527/1208 [15:04<19:29,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00204, train/loss_step=0.399, global_step=3453.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  44%|████▎     | 528/1208 [15:08<19:29,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00204, train/loss_step=0.399, global_step=3453.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  44%|████▎     | 528/1208 [15:08<19:29,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00443, train/loss_vlb_step=2.39e-5, train/loss_step=0.00443, global_step=3453.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  44%|████▍     | 529/1208 [15:09<19:27,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00443, train/loss_vlb_step=2.39e-5, train/loss_step=0.00443, global_step=3453.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  44%|████▍     | 529/1208 [15:09<19:27,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=3454.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  44%|████▍     | 530/1208 [15:10<19:24,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=3454.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  44%|████▍     | 530/1208 [15:10<19:24,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000161, train/loss_step=0.0443, global_step=3454.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  44%|████▍     | 531/1208 [15:11<19:21,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000161, train/loss_step=0.0443, global_step=3454.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  44%|████▍     | 531/1208 [15:11<19:21,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0976, train/loss_vlb_step=0.000321, train/loss_step=0.0976, global_step=3454.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  44%|████▍     | 532/1208 [15:14<19:22,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0976, train/loss_vlb_step=0.000321, train/loss_step=0.0976, global_step=3454.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  44%|████▍     | 532/1208 [15:14<19:22,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0427, train/loss_vlb_step=0.000155, train/loss_step=0.0427, global_step=3454.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  44%|████▍     | 533/1208 [15:15<19:19,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0427, train/loss_vlb_step=0.000155, train/loss_step=0.0427, global_step=3454.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  44%|████▍     | 533/1208 [15:15<19:19,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=1.8e-5, train/loss_step=0.00334, global_step=3455.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  44%|████▍     | 534/1208 [15:16<19:17,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=1.8e-5, train/loss_step=0.00334, global_step=3455.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  44%|████▍     | 534/1208 [15:16<19:17,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.58e-5, train/loss_step=0.00284, global_step=3455.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  44%|████▍     | 535/1208 [15:17<19:14,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.58e-5, train/loss_step=0.00284, global_step=3455.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  44%|████▍     | 535/1208 [15:17<19:14,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000511, train/loss_step=0.152, global_step=3455.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  44%|████▍     | 536/1208 [15:21<19:14,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000511, train/loss_step=0.152, global_step=3455.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  44%|████▍     | 536/1208 [15:21<19:14,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000901, train/loss_step=0.235, global_step=3455.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  44%|████▍     | 537/1208 [15:22<19:12,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000901, train/loss_step=0.235, global_step=3455.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  44%|████▍     | 537/1208 [15:22<19:12,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=9.2e-5, train/loss_step=0.0218, global_step=3456.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  45%|████▍     | 538/1208 [15:23<19:09,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=9.2e-5, train/loss_step=0.0218, global_step=3456.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  45%|████▍     | 538/1208 [15:23<19:09,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.0028, train/loss_step=0.406, global_step=3456.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  45%|████▍     | 539/1208 [15:24<19:07,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.0028, train/loss_step=0.406, global_step=3456.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  45%|████▍     | 539/1208 [15:24<19:07,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00152, train/loss_step=0.282, global_step=3456.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  45%|████▍     | 540/1208 [15:27<19:07,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00152, train/loss_step=0.282, global_step=3456.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  45%|████▍     | 540/1208 [15:27<19:07,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=9.53e-6, train/loss_step=0.00158, global_step=3456.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  45%|████▍     | 541/1208 [15:28<19:04,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=9.53e-6, train/loss_step=0.00158, global_step=3456.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  45%|████▍     | 541/1208 [15:28<19:04,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0842, train/loss_vlb_step=0.000284, train/loss_step=0.0842, global_step=3457.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  45%|████▍     | 542/1208 [15:29<19:02,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0842, train/loss_vlb_step=0.000284, train/loss_step=0.0842, global_step=3457.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  45%|████▍     | 542/1208 [15:29<19:02,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00276, train/loss_step=0.420, global_step=3457.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  45%|████▍     | 543/1208 [15:30<18:59,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00276, train/loss_step=0.420, global_step=3457.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  45%|████▍     | 543/1208 [15:30<18:59,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000118, train/loss_step=0.0307, global_step=3457.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  45%|████▌     | 544/1208 [15:33<18:59,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000118, train/loss_step=0.0307, global_step=3457.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  45%|████▌     | 544/1208 [15:33<18:59,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000856, train/loss_step=0.223, global_step=3457.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  45%|████▌     | 545/1208 [15:34<18:57,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000856, train/loss_step=0.223, global_step=3457.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  45%|████▌     | 545/1208 [15:34<18:57,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0466, train/loss_vlb_step=0.000165, train/loss_step=0.0466, global_step=3458.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  45%|████▌     | 546/1208 [15:36<18:54,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0466, train/loss_vlb_step=0.000165, train/loss_step=0.0466, global_step=3458.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  45%|████▌     | 546/1208 [15:36<18:54,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0968, train/loss_vlb_step=0.000319, train/loss_step=0.0968, global_step=3458.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  45%|████▌     | 547/1208 [15:37<18:52,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0968, train/loss_vlb_step=0.000319, train/loss_step=0.0968, global_step=3458.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  45%|████▌     | 547/1208 [15:37<18:52,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0977, train/loss_vlb_step=0.000321, train/loss_step=0.0977, global_step=3458.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  45%|████▌     | 548/1208 [15:40<18:52,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0977, train/loss_vlb_step=0.000321, train/loss_step=0.0977, global_step=3458.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  45%|████▌     | 548/1208 [15:40<18:52,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.71e-5, train/loss_step=0.00289, global_step=3458.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  45%|████▌     | 549/1208 [15:41<18:50,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.71e-5, train/loss_step=0.00289, global_step=3458.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  45%|████▌     | 549/1208 [15:41<18:50,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.00023, train/loss_step=0.067, global_step=3459.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  46%|████▌     | 550/1208 [15:42<18:47,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.00023, train/loss_step=0.067, global_step=3459.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  46%|████▌     | 550/1208 [15:42<18:47,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000148, train/loss_step=0.0378, global_step=3459.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  46%|████▌     | 551/1208 [15:43<18:44,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000148, train/loss_step=0.0378, global_step=3459.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  46%|████▌     | 551/1208 [15:43<18:44,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0684, train/loss_vlb_step=0.000239, train/loss_step=0.0684, global_step=3459.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  46%|████▌     | 552/1208 [15:46<18:45,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0684, train/loss_vlb_step=0.000239, train/loss_step=0.0684, global_step=3459.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  46%|████▌     | 552/1208 [15:46<18:45,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000962, train/loss_step=0.230, global_step=3459.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  46%|████▌     | 553/1208 [15:47<18:42,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000962, train/loss_step=0.230, global_step=3459.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  46%|████▌     | 553/1208 [15:47<18:42,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.000221, train/loss_step=0.0665, global_step=3460.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  46%|████▌     | 554/1208 [15:48<18:40,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.000221, train/loss_step=0.0665, global_step=3460.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  46%|████▌     | 554/1208 [15:48<18:40,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000862, train/loss_step=0.219, global_step=3460.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  46%|████▌     | 555/1208 [15:49<18:37,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000862, train/loss_step=0.219, global_step=3460.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  46%|████▌     | 555/1208 [15:49<18:37,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00126, train/loss_step=0.295, global_step=3460.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  46%|████▌     | 556/1208 [15:53<18:37,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00126, train/loss_step=0.295, global_step=3460.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  46%|████▌     | 556/1208 [15:53<18:37,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.507, train/loss_vlb_step=0.00672, train/loss_step=0.507, global_step=3460.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  46%|████▌     | 557/1208 [15:54<18:35,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.507, train/loss_vlb_step=0.00672, train/loss_step=0.507, global_step=3460.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  46%|████▌     | 557/1208 [15:54<18:35,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00236, train/loss_step=0.395, global_step=3461.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  46%|████▌     | 558/1208 [15:55<18:32,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00236, train/loss_step=0.395, global_step=3461.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  46%|████▌     | 558/1208 [15:55<18:32,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0903, train/loss_vlb_step=0.000298, train/loss_step=0.0903, global_step=3461.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  46%|████▋     | 559/1208 [15:56<18:30,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0903, train/loss_vlb_step=0.000298, train/loss_step=0.0903, global_step=3461.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  46%|████▋     | 559/1208 [15:56<18:30,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000609, train/loss_step=0.172, global_step=3461.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  46%|████▋     | 560/1208 [15:59<18:30,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000609, train/loss_step=0.172, global_step=3461.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  46%|████▋     | 560/1208 [15:59<18:30,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00317, train/loss_vlb_step=1.75e-5, train/loss_step=0.00317, global_step=3461.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  46%|████▋     | 561/1208 [16:00<18:27,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00317, train/loss_vlb_step=1.75e-5, train/loss_step=0.00317, global_step=3461.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  46%|████▋     | 561/1208 [16:00<18:27,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000446, train/loss_step=0.135, global_step=3462.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  47%|████▋     | 562/1208 [16:01<18:25,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000446, train/loss_step=0.135, global_step=3462.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  47%|████▋     | 562/1208 [16:01<18:25,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.33e-5, train/loss_step=0.0136, global_step=3462.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  47%|████▋     | 563/1208 [16:02<18:22,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.33e-5, train/loss_step=0.0136, global_step=3462.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  47%|████▋     | 563/1208 [16:02<18:22,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.000143, train/loss_step=0.0395, global_step=3462.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  47%|████▋     | 564/1208 [16:05<18:23,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.000143, train/loss_step=0.0395, global_step=3462.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  47%|████▋     | 564/1208 [16:05<18:23,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000639, train/loss_step=0.187, global_step=3462.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  47%|████▋     | 565/1208 [16:07<18:20,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000639, train/loss_step=0.187, global_step=3462.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  47%|████▋     | 565/1208 [16:07<18:20,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.00065, train/loss_step=0.189, global_step=3463.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  47%|████▋     | 566/1208 [16:08<18:18,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.00065, train/loss_step=0.189, global_step=3463.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  47%|████▋     | 566/1208 [16:08<18:18,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0945, train/loss_vlb_step=0.000311, train/loss_step=0.0945, global_step=3463.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  47%|████▋     | 567/1208 [16:09<18:15,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0945, train/loss_vlb_step=0.000311, train/loss_step=0.0945, global_step=3463.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  47%|████▋     | 567/1208 [16:09<18:15,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000164, train/loss_step=0.0463, global_step=3463.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  47%|████▋     | 568/1208 [16:12<18:15,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000164, train/loss_step=0.0463, global_step=3463.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  47%|████▋     | 568/1208 [16:12<18:15,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.624, train/loss_vlb_step=0.0206, train/loss_step=0.624, global_step=3463.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  47%|████▋     | 569/1208 [16:13<18:13,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.624, train/loss_vlb_step=0.0206, train/loss_step=0.624, global_step=3463.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  47%|████▋     | 569/1208 [16:13<18:13,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000733, train/loss_step=0.210, global_step=3464.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  47%|████▋     | 570/1208 [16:14<18:10,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000733, train/loss_step=0.210, global_step=3464.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  47%|████▋     | 570/1208 [16:14<18:10,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=5.13e-5, train/loss_step=0.0106, global_step=3464.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  47%|████▋     | 571/1208 [16:15<18:08,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=5.13e-5, train/loss_step=0.0106, global_step=3464.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  47%|████▋     | 571/1208 [16:15<18:08,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.000147, train/loss_step=0.041, global_step=3464.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  47%|████▋     | 572/1208 [16:18<18:08,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.000147, train/loss_step=0.041, global_step=3464.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  47%|████▋     | 572/1208 [16:18<18:08,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.34e-5, train/loss_step=0.0168, global_step=3464.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  47%|████▋     | 573/1208 [16:19<18:05,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.34e-5, train/loss_step=0.0168, global_step=3464.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  47%|████▋     | 573/1208 [16:19<18:05,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000565, train/loss_step=0.165, global_step=3465.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  48%|████▊     | 574/1208 [16:20<18:03,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000565, train/loss_step=0.165, global_step=3465.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  48%|████▊     | 574/1208 [16:20<18:03,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.559, train/loss_vlb_step=0.0121, train/loss_step=0.559, global_step=3465.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  48%|████▊     | 575/1208 [16:21<18:00,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.559, train/loss_vlb_step=0.0121, train/loss_step=0.559, global_step=3465.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  48%|████▊     | 575/1208 [16:21<18:00,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00123, train/loss_step=0.274, global_step=3465.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  48%|████▊     | 576/1208 [16:25<18:00,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00123, train/loss_step=0.274, global_step=3465.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  48%|████▊     | 576/1208 [16:25<18:00,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0558, train/loss_vlb_step=0.000198, train/loss_step=0.0558, global_step=3465.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  48%|████▊     | 577/1208 [16:26<17:58,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0558, train/loss_vlb_step=0.000198, train/loss_step=0.0558, global_step=3465.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  48%|████▊     | 577/1208 [16:26<17:58,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00922, train/loss_vlb_step=4.32e-5, train/loss_step=0.00922, global_step=3466.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  48%|████▊     | 578/1208 [16:27<17:56,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00922, train/loss_vlb_step=4.32e-5, train/loss_step=0.00922, global_step=3466.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  48%|████▊     | 578/1208 [16:27<17:56,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000428, train/loss_step=0.129, global_step=3466.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  48%|████▊     | 579/1208 [16:28<17:53,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000428, train/loss_step=0.129, global_step=3466.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  48%|████▊     | 579/1208 [16:28<17:53,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000299, train/loss_step=0.0891, global_step=3466.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  48%|████▊     | 580/1208 [16:31<17:53,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000299, train/loss_step=0.0891, global_step=3466.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  48%|████▊     | 580/1208 [16:31<17:53,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00132, train/loss_step=0.277, global_step=3466.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  48%|████▊     | 581/1208 [16:32<17:51,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00132, train/loss_step=0.277, global_step=3466.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  48%|████▊     | 581/1208 [16:32<17:51,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000742, train/loss_step=0.198, global_step=3467.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  48%|████▊     | 582/1208 [16:33<17:48,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000742, train/loss_step=0.198, global_step=3467.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  48%|████▊     | 582/1208 [16:33<17:48,  1.71s/it, loss=0.184, v_num=0, train/loss_simple_step=0.467, train/loss_vlb_step=0.00391, train/loss_step=0.467, global_step=3467.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  48%|████▊     | 583/1208 [16:34<17:46,  1.71s/it, loss=0.184, v_num=0, train/loss_simple_step=0.467, train/loss_vlb_step=0.00391, train/loss_step=0.467, global_step=3467.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  48%|████▊     | 583/1208 [16:34<17:46,  1.71s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0966, train/loss_vlb_step=0.000318, train/loss_step=0.0966, global_step=3467.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  48%|████▊     | 584/1208 [16:38<17:46,  1.71s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0966, train/loss_vlb_step=0.000318, train/loss_step=0.0966, global_step=3467.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  48%|████▊     | 584/1208 [16:38<17:46,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000161, train/loss_step=0.042, global_step=3467.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  48%|████▊     | 585/1208 [16:39<17:44,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000161, train/loss_step=0.042, global_step=3467.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  48%|████▊     | 585/1208 [16:39<17:44,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.07e-5, train/loss_step=0.00176, global_step=3468.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  49%|████▊     | 586/1208 [16:40<17:41,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.07e-5, train/loss_step=0.00176, global_step=3468.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  49%|████▊     | 586/1208 [16:40<17:41,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00753, train/loss_vlb_step=3.69e-5, train/loss_step=0.00753, global_step=3468.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  49%|████▊     | 587/1208 [16:41<17:39,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00753, train/loss_vlb_step=3.69e-5, train/loss_step=0.00753, global_step=3468.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  49%|████▊     | 587/1208 [16:41<17:39,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.451, train/loss_vlb_step=0.00524, train/loss_step=0.451, global_step=3468.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  49%|████▊     | 588/1208 [16:44<17:39,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.451, train/loss_vlb_step=0.00524, train/loss_step=0.451, global_step=3468.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  49%|████▊     | 588/1208 [16:44<17:39,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000125, train/loss_step=0.0333, global_step=3468.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  49%|████▉     | 589/1208 [16:45<17:36,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000125, train/loss_step=0.0333, global_step=3468.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  49%|████▉     | 589/1208 [16:45<17:36,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00101, train/loss_step=0.251, global_step=3469.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  49%|████▉     | 590/1208 [16:46<17:34,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00101, train/loss_step=0.251, global_step=3469.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  49%|████▉     | 590/1208 [16:46<17:34,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000379, train/loss_step=0.113, global_step=3469.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  49%|████▉     | 591/1208 [16:47<17:31,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000379, train/loss_step=0.113, global_step=3469.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  49%|████▉     | 591/1208 [16:47<17:31,  1.70s/it, loss=0.174, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000935, train/loss_step=0.242, global_step=3469.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  49%|████▉     | 592/1208 [16:50<17:31,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000935, train/loss_step=0.242, global_step=3469.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  49%|████▉     | 592/1208 [16:50<17:31,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000952, train/loss_step=0.240, global_step=3469.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  49%|████▉     | 593/1208 [16:51<17:29,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000952, train/loss_step=0.240, global_step=3469.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  49%|████▉     | 593/1208 [16:51<17:29,  1.71s/it, loss=0.212, v_num=0, train/loss_simple_step=0.700, train/loss_vlb_step=0.0218, train/loss_step=0.700, global_step=3470.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  49%|████▉     | 594/1208 [16:52<17:26,  1.71s/it, loss=0.212, v_num=0, train/loss_simple_step=0.700, train/loss_vlb_step=0.0218, train/loss_step=0.700, global_step=3470.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  49%|████▉     | 594/1208 [16:52<17:26,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000598, train/loss_step=0.169, global_step=3470.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  49%|████▉     | 595/1208 [16:53<17:24,  1.70s/it, loss=0.192, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000598, train/loss_step=0.169, global_step=3470.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  49%|████▉     | 595/1208 [16:53<17:24,  1.70s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0743, train/loss_vlb_step=0.000249, train/loss_step=0.0743, global_step=3470.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  49%|████▉     | 596/1208 [16:57<17:24,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0743, train/loss_vlb_step=0.000249, train/loss_step=0.0743, global_step=3470.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  49%|████▉     | 596/1208 [16:57<17:24,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.03e-5, train/loss_step=0.00173, global_step=3470.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  49%|████▉     | 597/1208 [16:58<17:22,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.03e-5, train/loss_step=0.00173, global_step=3470.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  49%|████▉     | 597/1208 [16:58<17:22,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0563, train/loss_vlb_step=0.000198, train/loss_step=0.0563, global_step=3471.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  50%|████▉     | 598/1208 [16:59<17:19,  1.70s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0563, train/loss_vlb_step=0.000198, train/loss_step=0.0563, global_step=3471.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  50%|████▉     | 598/1208 [16:59<17:19,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=3471.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  50%|████▉     | 599/1208 [17:00<17:17,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=3471.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  50%|████▉     | 599/1208 [17:00<17:17,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.12e-5, train/loss_step=0.0175, global_step=3471.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  50%|████▉     | 600/1208 [17:03<17:17,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.12e-5, train/loss_step=0.0175, global_step=3471.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  50%|████▉     | 600/1208 [17:03<17:17,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.00016, train/loss_step=0.0443, global_step=3471.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.76it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.75it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.75it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.76it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.76it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.74it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.75it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.76it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.80it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.77it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.81it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 11:  50%|████▉     | 601/1208 [17:34<17:44,  1.75s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.00016, train/loss_step=0.0443, global_step=3471.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  50%|████▉     | 601/1208 [17:34<17:44,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.57e-5, train/loss_step=0.0126, global_step=3472.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  50%|████▉     | 602/1208 [17:35<17:42,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.57e-5, train/loss_step=0.0126, global_step=3472.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  50%|████▉     | 602/1208 [17:35<17:42,  1.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000741, train/loss_step=0.193, global_step=3472.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  50%|████▉     | 603/1208 [17:36<17:39,  1.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000741, train/loss_step=0.193, global_step=3472.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  50%|████▉     | 603/1208 [17:36<17:39,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00513, train/loss_vlb_step=2.66e-5, train/loss_step=0.00513, global_step=3472.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  50%|█████     | 604/1208 [17:39<17:39,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00513, train/loss_vlb_step=2.66e-5, train/loss_step=0.00513, global_step=3472.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  50%|█████     | 604/1208 [17:39<17:39,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.38e-5, train/loss_step=0.0196, global_step=3472.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  50%|█████     | 605/1208 [17:40<17:37,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.38e-5, train/loss_step=0.0196, global_step=3472.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  50%|█████     | 605/1208 [17:40<17:37,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.33e-5, train/loss_step=0.00222, global_step=3473.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  50%|█████     | 606/1208 [17:41<17:34,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.33e-5, train/loss_step=0.00222, global_step=3473.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  50%|█████     | 606/1208 [17:41<17:34,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000114, train/loss_step=0.0301, global_step=3473.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  50%|█████     | 607/1208 [17:42<17:32,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000114, train/loss_step=0.0301, global_step=3473.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  50%|█████     | 607/1208 [17:42<17:32,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000882, train/loss_step=0.222, global_step=3473.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  50%|█████     | 608/1208 [17:46<17:32,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000882, train/loss_step=0.222, global_step=3473.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  50%|█████     | 608/1208 [17:46<17:32,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000422, train/loss_step=0.126, global_step=3473.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  50%|█████     | 609/1208 [17:47<17:29,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000422, train/loss_step=0.126, global_step=3473.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  50%|█████     | 609/1208 [17:47<17:29,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.1e-5, train/loss_step=0.0209, global_step=3474.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  50%|█████     | 610/1208 [17:48<17:27,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.1e-5, train/loss_step=0.0209, global_step=3474.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  50%|█████     | 610/1208 [17:48<17:27,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.000149, train/loss_step=0.0413, global_step=3474.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  51%|█████     | 611/1208 [17:49<17:24,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.000149, train/loss_step=0.0413, global_step=3474.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  51%|█████     | 611/1208 [17:49<17:24,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000535, train/loss_step=0.153, global_step=3474.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  51%|█████     | 612/1208 [17:52<17:24,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000535, train/loss_step=0.153, global_step=3474.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  51%|█████     | 612/1208 [17:52<17:24,  1.75s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.46e-5, train/loss_step=0.0156, global_step=3474.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  51%|█████     | 613/1208 [17:53<17:21,  1.75s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.46e-5, train/loss_step=0.0156, global_step=3474.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  51%|█████     | 613/1208 [17:53<17:21,  1.75s/it, loss=0.0818, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00194, train/loss_step=0.328, global_step=3475.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  51%|█████     | 614/1208 [17:54<17:19,  1.75s/it, loss=0.0818, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00194, train/loss_step=0.328, global_step=3475.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  51%|█████     | 614/1208 [17:54<17:19,  1.75s/it, loss=0.0872, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00175, train/loss_step=0.278, global_step=3475.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  51%|█████     | 615/1208 [17:55<17:17,  1.75s/it, loss=0.0872, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00175, train/loss_step=0.278, global_step=3475.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  51%|█████     | 615/1208 [17:55<17:17,  1.75s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.0712, train/loss_vlb_step=0.000247, train/loss_step=0.0712, global_step=3475.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  51%|█████     | 616/1208 [17:58<17:16,  1.75s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.0712, train/loss_vlb_step=0.000247, train/loss_step=0.0712, global_step=3475.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  51%|█████     | 616/1208 [17:58<17:16,  1.75s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.00228, train/loss_vlb_step=1.34e-5, train/loss_step=0.00228, global_step=3475.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  51%|█████     | 617/1208 [17:59<17:14,  1.75s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.00228, train/loss_vlb_step=1.34e-5, train/loss_step=0.00228, global_step=3475.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  51%|█████     | 617/1208 [17:59<17:14,  1.75s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000108, train/loss_step=0.0279, global_step=3476.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  51%|█████     | 618/1208 [18:00<17:11,  1.75s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000108, train/loss_step=0.0279, global_step=3476.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  51%|█████     | 618/1208 [18:00<17:11,  1.75s/it, loss=0.081, v_num=0, train/loss_simple_step=0.00905, train/loss_vlb_step=4.46e-5, train/loss_step=0.00905, global_step=3476.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  51%|█████     | 619/1208 [18:01<17:09,  1.75s/it, loss=0.081, v_num=0, train/loss_simple_step=0.00905, train/loss_vlb_step=4.46e-5, train/loss_step=0.00905, global_step=3476.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  51%|█████     | 619/1208 [18:01<17:09,  1.75s/it, loss=0.0803, v_num=0, train/loss_simple_step=0.00336, train/loss_vlb_step=1.96e-5, train/loss_step=0.00336, global_step=3476.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  51%|█████▏    | 620/1208 [18:05<17:09,  1.75s/it, loss=0.0803, v_num=0, train/loss_simple_step=0.00336, train/loss_vlb_step=1.96e-5, train/loss_step=0.00336, global_step=3476.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  51%|█████▏    | 620/1208 [18:05<17:09,  1.75s/it, loss=0.0798, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.00013, train/loss_step=0.0347, global_step=3476.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  51%|█████▏    | 621/1208 [18:06<17:06,  1.75s/it, loss=0.0798, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.00013, train/loss_step=0.0347, global_step=3476.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  51%|█████▏    | 621/1208 [18:06<17:06,  1.75s/it, loss=0.0827, v_num=0, train/loss_simple_step=0.0712, train/loss_vlb_step=0.00024, train/loss_step=0.0712, global_step=3477.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  51%|█████▏    | 622/1208 [18:07<17:04,  1.75s/it, loss=0.0827, v_num=0, train/loss_simple_step=0.0712, train/loss_vlb_step=0.00024, train/loss_step=0.0712, global_step=3477.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  51%|█████▏    | 622/1208 [18:07<17:04,  1.75s/it, loss=0.0818, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.00065, train/loss_step=0.175, global_step=3477.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  52%|█████▏    | 623/1208 [18:08<17:02,  1.75s/it, loss=0.0818, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.00065, train/loss_step=0.175, global_step=3477.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  52%|█████▏    | 623/1208 [18:08<17:02,  1.75s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000812, train/loss_step=0.224, global_step=3477.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  52%|█████▏    | 624/1208 [18:11<17:01,  1.75s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000812, train/loss_step=0.224, global_step=3477.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  52%|█████▏    | 624/1208 [18:11<17:01,  1.75s/it, loss=0.104, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00108, train/loss_step=0.252, global_step=3477.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  52%|█████▏    | 625/1208 [18:12<16:59,  1.75s/it, loss=0.104, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00108, train/loss_step=0.252, global_step=3477.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  52%|█████▏    | 625/1208 [18:12<16:59,  1.75s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=8.02e-5, train/loss_step=0.0188, global_step=3478.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  52%|█████▏    | 626/1208 [18:13<16:56,  1.75s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=8.02e-5, train/loss_step=0.0188, global_step=3478.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  52%|█████▏    | 626/1208 [18:13<16:56,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000502, train/loss_step=0.152, global_step=3478.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  52%|█████▏    | 627/1208 [18:14<16:54,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000502, train/loss_step=0.152, global_step=3478.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  52%|█████▏    | 627/1208 [18:14<16:54,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.358, train/loss_vlb_step=0.00183, train/loss_step=0.358, global_step=3478.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  52%|█████▏    | 628/1208 [18:18<16:54,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.358, train/loss_vlb_step=0.00183, train/loss_step=0.358, global_step=3478.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  52%|█████▏    | 628/1208 [18:18<16:54,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00106, train/loss_step=0.269, global_step=3478.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  52%|█████▏    | 629/1208 [18:19<16:51,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00106, train/loss_step=0.269, global_step=3478.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  52%|█████▏    | 629/1208 [18:19<16:51,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.86e-5, train/loss_step=0.0102, global_step=3479.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  52%|█████▏    | 630/1208 [18:20<16:49,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.86e-5, train/loss_step=0.0102, global_step=3479.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  52%|█████▏    | 630/1208 [18:20<16:49,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0878, train/loss_vlb_step=0.000289, train/loss_step=0.0878, global_step=3479.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  52%|█████▏    | 631/1208 [18:21<16:47,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0878, train/loss_vlb_step=0.000289, train/loss_step=0.0878, global_step=3479.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  52%|█████▏    | 631/1208 [18:21<16:47,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.78e-5, train/loss_step=0.0129, global_step=3479.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  52%|█████▏    | 632/1208 [18:24<16:46,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.78e-5, train/loss_step=0.0129, global_step=3479.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  52%|█████▏    | 632/1208 [18:24<16:46,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000581, train/loss_step=0.167, global_step=3479.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  52%|█████▏    | 633/1208 [18:25<16:44,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000581, train/loss_step=0.167, global_step=3479.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  52%|█████▏    | 633/1208 [18:25<16:44,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0756, train/loss_vlb_step=0.000253, train/loss_step=0.0756, global_step=3480.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  52%|█████▏    | 634/1208 [18:26<16:41,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0756, train/loss_vlb_step=0.000253, train/loss_step=0.0756, global_step=3480.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  52%|█████▏    | 634/1208 [18:26<16:41,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000728, train/loss_step=0.207, global_step=3480.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  53%|█████▎    | 635/1208 [18:27<16:39,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000728, train/loss_step=0.207, global_step=3480.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  53%|█████▎    | 635/1208 [18:27<16:39,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00648, train/loss_vlb_step=3.24e-5, train/loss_step=0.00648, global_step=3480.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  53%|█████▎    | 636/1208 [18:31<16:39,  1.75s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00648, train/loss_vlb_step=3.24e-5, train/loss_step=0.00648, global_step=3480.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  53%|█████▎    | 636/1208 [18:31<16:39,  1.75s/it, loss=0.109, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.89e-5, train/loss_step=0.013, global_step=3480.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  53%|█████▎    | 637/1208 [18:32<16:36,  1.75s/it, loss=0.109, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.89e-5, train/loss_step=0.013, global_step=3480.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  53%|█████▎    | 637/1208 [18:32<16:36,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0889, train/loss_vlb_step=0.000293, train/loss_step=0.0889, global_step=3481.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  53%|█████▎    | 638/1208 [18:33<16:34,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0889, train/loss_vlb_step=0.000293, train/loss_step=0.0889, global_step=3481.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  53%|█████▎    | 638/1208 [18:33<16:34,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000482, train/loss_step=0.140, global_step=3481.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  53%|█████▎    | 639/1208 [18:34<16:32,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000482, train/loss_step=0.140, global_step=3481.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  53%|█████▎    | 639/1208 [18:34<16:32,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00194, train/loss_step=0.343, global_step=3481.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  53%|█████▎    | 640/1208 [18:37<16:31,  1.75s/it, loss=0.135, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00194, train/loss_step=0.343, global_step=3481.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  53%|█████▎    | 640/1208 [18:37<16:31,  1.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000586, train/loss_step=0.169, global_step=3481.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  53%|█████▎    | 641/1208 [18:38<16:29,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000586, train/loss_step=0.169, global_step=3481.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  53%|█████▎    | 641/1208 [18:38<16:29,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00575, train/loss_vlb_step=3.04e-5, train/loss_step=0.00575, global_step=3482.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  53%|█████▎    | 642/1208 [18:39<16:26,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00575, train/loss_vlb_step=3.04e-5, train/loss_step=0.00575, global_step=3482.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  53%|█████▎    | 642/1208 [18:39<16:26,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00523, train/loss_vlb_step=2.73e-5, train/loss_step=0.00523, global_step=3482.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  53%|█████▎    | 643/1208 [18:40<16:24,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00523, train/loss_vlb_step=2.73e-5, train/loss_step=0.00523, global_step=3482.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  53%|█████▎    | 643/1208 [18:40<16:24,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00202, train/loss_step=0.361, global_step=3482.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  53%|█████▎    | 644/1208 [18:43<16:24,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00202, train/loss_step=0.361, global_step=3482.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  53%|█████▎    | 644/1208 [18:43<16:24,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=9.92e-5, train/loss_step=0.0251, global_step=3482.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  53%|█████▎    | 645/1208 [18:44<16:21,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=9.92e-5, train/loss_step=0.0251, global_step=3482.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  53%|█████▎    | 645/1208 [18:44<16:21,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000115, train/loss_step=0.0286, global_step=3483.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  53%|█████▎    | 646/1208 [18:45<16:19,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000115, train/loss_step=0.0286, global_step=3483.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  53%|█████▎    | 646/1208 [18:45<16:19,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00307, train/loss_vlb_step=1.71e-5, train/loss_step=0.00307, global_step=3483.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  54%|█████▎    | 647/1208 [18:47<16:17,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00307, train/loss_vlb_step=1.71e-5, train/loss_step=0.00307, global_step=3483.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  54%|█████▎    | 647/1208 [18:47<16:17,  1.74s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00922, train/loss_vlb_step=4.42e-5, train/loss_step=0.00922, global_step=3483.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  54%|█████▎    | 648/1208 [18:50<16:16,  1.74s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00922, train/loss_vlb_step=4.42e-5, train/loss_step=0.00922, global_step=3483.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  54%|█████▎    | 648/1208 [18:50<16:16,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.541, train/loss_vlb_step=0.0102, train/loss_step=0.541, global_step=3483.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]     Epoch 11:  54%|█████▎    | 649/1208 [18:51<16:14,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.541, train/loss_vlb_step=0.0102, train/loss_step=0.541, global_step=3483.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  54%|█████▎    | 649/1208 [18:51<16:14,  1.74s/it, loss=0.15, v_num=0, train/loss_simple_step=0.714, train/loss_vlb_step=0.0222, train/loss_step=0.714, global_step=3484.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  54%|█████▍    | 650/1208 [18:52<16:12,  1.74s/it, loss=0.15, v_num=0, train/loss_simple_step=0.714, train/loss_vlb_step=0.0222, train/loss_step=0.714, global_step=3484.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  54%|█████▍    | 650/1208 [18:52<16:12,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.000144, train/loss_step=0.0394, global_step=3484.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  54%|█████▍    | 651/1208 [18:53<16:09,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.000144, train/loss_step=0.0394, global_step=3484.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  54%|█████▍    | 651/1208 [18:53<16:09,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000363, train/loss_step=0.110, global_step=3484.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  54%|█████▍    | 652/1208 [18:56<16:09,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000363, train/loss_step=0.110, global_step=3484.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  54%|█████▍    | 652/1208 [18:56<16:09,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000146, train/loss_step=0.0406, global_step=3484.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  54%|█████▍    | 653/1208 [18:57<16:06,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000146, train/loss_step=0.0406, global_step=3484.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  54%|█████▍    | 653/1208 [18:57<16:06,  1.74s/it, loss=0.172, v_num=0, train/loss_simple_step=0.586, train/loss_vlb_step=0.0137, train/loss_step=0.586, global_step=3485.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  54%|█████▍    | 654/1208 [18:58<16:04,  1.74s/it, loss=0.172, v_num=0, train/loss_simple_step=0.586, train/loss_vlb_step=0.0137, train/loss_step=0.586, global_step=3485.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  54%|█████▍    | 654/1208 [18:58<16:04,  1.74s/it, loss=0.172, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000703, train/loss_step=0.203, global_step=3485.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  54%|█████▍    | 655/1208 [18:59<16:02,  1.74s/it, loss=0.172, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000703, train/loss_step=0.203, global_step=3485.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  54%|█████▍    | 655/1208 [18:59<16:02,  1.74s/it, loss=0.199, v_num=0, train/loss_simple_step=0.563, train/loss_vlb_step=0.0143, train/loss_step=0.563, global_step=3485.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  54%|█████▍    | 656/1208 [19:03<16:01,  1.74s/it, loss=0.199, v_num=0, train/loss_simple_step=0.563, train/loss_vlb_step=0.0143, train/loss_step=0.563, global_step=3485.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  54%|█████▍    | 656/1208 [19:03<16:01,  1.74s/it, loss=0.241, v_num=0, train/loss_simple_step=0.841, train/loss_vlb_step=0.212, train/loss_step=0.841, global_step=3485.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  54%|█████▍    | 657/1208 [19:04<15:59,  1.74s/it, loss=0.241, v_num=0, train/loss_simple_step=0.841, train/loss_vlb_step=0.212, train/loss_step=0.841, global_step=3485.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  54%|█████▍    | 657/1208 [19:04<15:59,  1.74s/it, loss=0.24, v_num=0, train/loss_simple_step=0.0647, train/loss_vlb_step=0.000218, train/loss_step=0.0647, global_step=3486.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  54%|█████▍    | 658/1208 [19:05<15:57,  1.74s/it, loss=0.24, v_num=0, train/loss_simple_step=0.0647, train/loss_vlb_step=0.000218, train/loss_step=0.0647, global_step=3486.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  54%|█████▍    | 658/1208 [19:05<15:57,  1.74s/it, loss=0.234, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=0.000104, train/loss_step=0.0261, global_step=3486.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  55%|█████▍    | 659/1208 [19:06<15:54,  1.74s/it, loss=0.234, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=0.000104, train/loss_step=0.0261, global_step=3486.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  55%|█████▍    | 659/1208 [19:06<15:54,  1.74s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.6e-5, train/loss_step=0.0125, global_step=3486.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  55%|█████▍    | 660/1208 [19:09<15:54,  1.74s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.6e-5, train/loss_step=0.0125, global_step=3486.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  55%|█████▍    | 660/1208 [19:09<15:54,  1.74s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.65e-5, train/loss_step=0.0149, global_step=3486.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  55%|█████▍    | 661/1208 [19:10<15:52,  1.74s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.65e-5, train/loss_step=0.0149, global_step=3486.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  55%|█████▍    | 661/1208 [19:10<15:52,  1.74s/it, loss=0.247, v_num=0, train/loss_simple_step=0.752, train/loss_vlb_step=0.0767, train/loss_step=0.752, global_step=3487.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  55%|█████▍    | 662/1208 [19:11<15:49,  1.74s/it, loss=0.247, v_num=0, train/loss_simple_step=0.752, train/loss_vlb_step=0.0767, train/loss_step=0.752, global_step=3487.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  55%|█████▍    | 662/1208 [19:11<15:49,  1.74s/it, loss=0.249, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000128, train/loss_step=0.035, global_step=3487.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  55%|█████▍    | 663/1208 [19:12<15:47,  1.74s/it, loss=0.249, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000128, train/loss_step=0.035, global_step=3487.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  55%|█████▍    | 663/1208 [19:12<15:47,  1.74s/it, loss=0.231, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.92e-5, train/loss_step=0.0132, global_step=3487.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  55%|█████▍    | 664/1208 [19:15<15:47,  1.74s/it, loss=0.231, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.92e-5, train/loss_step=0.0132, global_step=3487.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  55%|█████▍    | 664/1208 [19:15<15:47,  1.74s/it, loss=0.239, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.00068, train/loss_step=0.191, global_step=3487.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  55%|█████▌    | 665/1208 [19:16<15:44,  1.74s/it, loss=0.239, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.00068, train/loss_step=0.191, global_step=3487.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  55%|█████▌    | 665/1208 [19:16<15:44,  1.74s/it, loss=0.242, v_num=0, train/loss_simple_step=0.0797, train/loss_vlb_step=0.000271, train/loss_step=0.0797, global_step=3488.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  55%|█████▌    | 666/1208 [19:18<15:42,  1.74s/it, loss=0.242, v_num=0, train/loss_simple_step=0.0797, train/loss_vlb_step=0.000271, train/loss_step=0.0797, global_step=3488.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  55%|█████▌    | 666/1208 [19:18<15:42,  1.74s/it, loss=0.242, v_num=0, train/loss_simple_step=0.00899, train/loss_vlb_step=4.36e-5, train/loss_step=0.00899, global_step=3488.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  55%|█████▌    | 667/1208 [19:19<15:40,  1.74s/it, loss=0.242, v_num=0, train/loss_simple_step=0.00899, train/loss_vlb_step=4.36e-5, train/loss_step=0.00899, global_step=3488.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  55%|█████▌    | 667/1208 [19:19<15:40,  1.74s/it, loss=0.243, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.000104, train/loss_step=0.027, global_step=3488.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  55%|█████▌    | 668/1208 [19:22<15:39,  1.74s/it, loss=0.243, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.000104, train/loss_step=0.027, global_step=3488.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  55%|█████▌    | 668/1208 [19:22<15:39,  1.74s/it, loss=0.225, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000637, train/loss_step=0.185, global_step=3488.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  55%|█████▌    | 669/1208 [19:23<15:37,  1.74s/it, loss=0.225, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000637, train/loss_step=0.185, global_step=3488.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  55%|█████▌    | 669/1208 [19:23<15:37,  1.74s/it, loss=0.19, v_num=0, train/loss_simple_step=0.00743, train/loss_vlb_step=3.71e-5, train/loss_step=0.00743, global_step=3489.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  55%|█████▌    | 670/1208 [19:24<15:35,  1.74s/it, loss=0.19, v_num=0, train/loss_simple_step=0.00743, train/loss_vlb_step=3.71e-5, train/loss_step=0.00743, global_step=3489.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  55%|█████▌    | 670/1208 [19:24<15:35,  1.74s/it, loss=0.193, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000321, train/loss_step=0.095, global_step=3489.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  56%|█████▌    | 671/1208 [19:25<15:32,  1.74s/it, loss=0.193, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000321, train/loss_step=0.095, global_step=3489.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  56%|█████▌    | 671/1208 [19:25<15:32,  1.74s/it, loss=0.2, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00121, train/loss_step=0.259, global_step=3489.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  56%|█████▌    | 672/1208 [19:28<15:32,  1.74s/it, loss=0.2, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00121, train/loss_step=0.259, global_step=3489.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  56%|█████▌    | 672/1208 [19:28<15:32,  1.74s/it, loss=0.213, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00125, train/loss_step=0.289, global_step=3489.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  56%|█████▌    | 673/1208 [19:29<15:29,  1.74s/it, loss=0.213, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00125, train/loss_step=0.289, global_step=3489.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  56%|█████▌    | 673/1208 [19:29<15:29,  1.74s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.3e-5, train/loss_step=0.00219, global_step=3490.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  56%|█████▌    | 674/1208 [19:30<15:27,  1.74s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.3e-5, train/loss_step=0.00219, global_step=3490.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  56%|█████▌    | 674/1208 [19:30<15:27,  1.74s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=9.2e-6, train/loss_step=0.00154, global_step=3490.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  56%|█████▌    | 675/1208 [19:31<15:25,  1.74s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=9.2e-6, train/loss_step=0.00154, global_step=3490.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  56%|█████▌    | 675/1208 [19:31<15:25,  1.74s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000124, train/loss_step=0.0333, global_step=3490.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  56%|█████▌    | 676/1208 [19:35<15:24,  1.74s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000124, train/loss_step=0.0333, global_step=3490.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  56%|█████▌    | 676/1208 [19:35<15:24,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=2.44e-5, train/loss_step=0.00471, global_step=3490.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  56%|█████▌    | 677/1208 [19:36<15:22,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=2.44e-5, train/loss_step=0.00471, global_step=3490.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  56%|█████▌    | 677/1208 [19:36<15:22,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0941, train/loss_vlb_step=0.000311, train/loss_step=0.0941, global_step=3491.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  56%|█████▌    | 678/1208 [19:37<15:20,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0941, train/loss_vlb_step=0.000311, train/loss_step=0.0941, global_step=3491.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  56%|█████▌    | 678/1208 [19:37<15:20,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=2.2e-5, train/loss_step=0.00402, global_step=3491.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  56%|█████▌    | 679/1208 [19:38<15:17,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=2.2e-5, train/loss_step=0.00402, global_step=3491.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  56%|█████▌    | 679/1208 [19:38<15:17,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000949, train/loss_step=0.233, global_step=3491.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  56%|█████▋    | 680/1208 [19:41<15:17,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000949, train/loss_step=0.233, global_step=3491.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  56%|█████▋    | 680/1208 [19:41<15:17,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.7e-5, train/loss_step=0.00304, global_step=3491.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  56%|█████▋    | 681/1208 [19:42<15:15,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.7e-5, train/loss_step=0.00304, global_step=3491.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  56%|█████▋    | 681/1208 [19:42<15:15,  1.74s/it, loss=0.0784, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.27e-5, train/loss_step=0.00208, global_step=3492.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  56%|█████▋    | 682/1208 [19:43<15:12,  1.74s/it, loss=0.0784, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.27e-5, train/loss_step=0.00208, global_step=3492.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  56%|█████▋    | 682/1208 [19:43<15:12,  1.74s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.00276, train/loss_step=0.400, global_step=3492.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  57%|█████▋    | 683/1208 [19:44<15:10,  1.73s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.00276, train/loss_step=0.400, global_step=3492.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  57%|█████▋    | 683/1208 [19:44<15:10,  1.73s/it, loss=0.104, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000512, train/loss_step=0.150, global_step=3492.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  57%|█████▋    | 684/1208 [19:47<15:09,  1.74s/it, loss=0.104, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000512, train/loss_step=0.150, global_step=3492.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  57%|█████▋    | 684/1208 [19:47<15:09,  1.74s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.0486, train/loss_vlb_step=0.00017, train/loss_step=0.0486, global_step=3492.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  57%|█████▋    | 685/1208 [19:48<15:07,  1.74s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.0486, train/loss_vlb_step=0.00017, train/loss_step=0.0486, global_step=3492.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  57%|█████▋    | 685/1208 [19:48<15:07,  1.74s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=8e-5, train/loss_step=0.0183, global_step=3493.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  57%|█████▋    | 686/1208 [19:49<15:05,  1.73s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=8e-5, train/loss_step=0.0183, global_step=3493.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  57%|█████▋    | 686/1208 [19:49<15:05,  1.73s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.000176, train/loss_step=0.0482, global_step=3493.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  57%|█████▋    | 687/1208 [19:50<15:03,  1.73s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.000176, train/loss_step=0.0482, global_step=3493.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  57%|█████▋    | 687/1208 [19:50<15:03,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00333, train/loss_step=0.397, global_step=3493.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  57%|█████▋    | 688/1208 [19:54<15:02,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00333, train/loss_step=0.397, global_step=3493.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  57%|█████▋    | 688/1208 [19:54<15:02,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=9.85e-5, train/loss_step=0.0255, global_step=3493.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  57%|█████▋    | 689/1208 [19:55<15:00,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=9.85e-5, train/loss_step=0.0255, global_step=3493.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  57%|█████▋    | 689/1208 [19:55<15:00,  1.73s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.19e-5, train/loss_step=0.0237, global_step=3494.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  57%|█████▋    | 690/1208 [19:56<14:58,  1.73s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.19e-5, train/loss_step=0.0237, global_step=3494.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  57%|█████▋    | 690/1208 [19:56<14:58,  1.73s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0088, train/loss_vlb_step=4.26e-5, train/loss_step=0.0088, global_step=3494.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  57%|█████▋    | 691/1208 [19:57<14:55,  1.73s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0088, train/loss_vlb_step=4.26e-5, train/loss_step=0.0088, global_step=3494.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  57%|█████▋    | 691/1208 [19:57<14:55,  1.73s/it, loss=0.107, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00196, train/loss_step=0.356, global_step=3494.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  57%|█████▋    | 692/1208 [20:00<14:55,  1.73s/it, loss=0.107, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00196, train/loss_step=0.356, global_step=3494.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  57%|█████▋    | 692/1208 [20:00<14:55,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.667, train/loss_vlb_step=0.0207, train/loss_step=0.667, global_step=3494.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  57%|█████▋    | 693/1208 [20:01<14:53,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.667, train/loss_vlb_step=0.0207, train/loss_step=0.667, global_step=3494.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  57%|█████▋    | 693/1208 [20:01<14:53,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=8.9e-5, train/loss_step=0.0221, global_step=3495.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  57%|█████▋    | 694/1208 [20:02<14:50,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=8.9e-5, train/loss_step=0.0221, global_step=3495.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  57%|█████▋    | 694/1208 [20:02<14:50,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.36e-5, train/loss_step=0.0145, global_step=3495.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  58%|█████▊    | 695/1208 [20:03<14:48,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.36e-5, train/loss_step=0.0145, global_step=3495.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  58%|█████▊    | 695/1208 [20:03<14:48,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000378, train/loss_step=0.114, global_step=3495.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  58%|█████▊    | 696/1208 [20:07<14:47,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000378, train/loss_step=0.114, global_step=3495.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  58%|█████▊    | 696/1208 [20:07<14:47,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0873, train/loss_vlb_step=0.000292, train/loss_step=0.0873, global_step=3495.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  58%|█████▊    | 697/1208 [20:08<14:45,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0873, train/loss_vlb_step=0.000292, train/loss_step=0.0873, global_step=3495.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  58%|█████▊    | 697/1208 [20:08<14:45,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.88e-5, train/loss_step=0.0241, global_step=3496.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  58%|█████▊    | 698/1208 [20:09<14:43,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.88e-5, train/loss_step=0.0241, global_step=3496.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  58%|█████▊    | 698/1208 [20:09<14:43,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.473, train/loss_vlb_step=0.00492, train/loss_step=0.473, global_step=3496.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  58%|█████▊    | 699/1208 [20:10<14:41,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.473, train/loss_vlb_step=0.00492, train/loss_step=0.473, global_step=3496.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  58%|█████▊    | 699/1208 [20:10<14:41,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=9.33e-5, train/loss_step=0.0225, global_step=3496.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  58%|█████▊    | 700/1208 [20:13<14:40,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=9.33e-5, train/loss_step=0.0225, global_step=3496.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  58%|█████▊    | 700/1208 [20:13<14:40,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000707, train/loss_step=0.202, global_step=3496.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  58%|█████▊    | 701/1208 [20:14<14:38,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000707, train/loss_step=0.202, global_step=3496.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  58%|█████▊    | 701/1208 [20:14<14:38,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00172, train/loss_step=0.325, global_step=3497.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  58%|█████▊    | 702/1208 [20:15<14:36,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00172, train/loss_step=0.325, global_step=3497.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  58%|█████▊    | 702/1208 [20:15<14:36,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00434, train/loss_vlb_step=2.33e-5, train/loss_step=0.00434, global_step=3497.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  58%|█████▊    | 703/1208 [20:16<14:33,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00434, train/loss_vlb_step=2.33e-5, train/loss_step=0.00434, global_step=3497.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  58%|█████▊    | 703/1208 [20:16<14:33,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=1.01e-5, train/loss_step=0.00165, global_step=3497.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  58%|█████▊    | 704/1208 [20:19<14:33,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=1.01e-5, train/loss_step=0.00165, global_step=3497.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  58%|█████▊    | 704/1208 [20:19<14:33,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0464, train/loss_vlb_step=0.000167, train/loss_step=0.0464, global_step=3497.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  58%|█████▊    | 705/1208 [20:21<14:31,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0464, train/loss_vlb_step=0.000167, train/loss_step=0.0464, global_step=3497.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  58%|█████▊    | 705/1208 [20:21<14:31,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.76e-5, train/loss_step=0.010, global_step=3498.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  58%|█████▊    | 706/1208 [20:22<14:28,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.76e-5, train/loss_step=0.010, global_step=3498.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  58%|█████▊    | 706/1208 [20:22<14:28,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000453, train/loss_step=0.136, global_step=3498.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  59%|█████▊    | 707/1208 [20:23<14:26,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000453, train/loss_step=0.136, global_step=3498.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  59%|█████▊    | 707/1208 [20:23<14:26,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000377, train/loss_step=0.115, global_step=3498.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  59%|█████▊    | 708/1208 [20:26<14:26,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000377, train/loss_step=0.115, global_step=3498.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  59%|█████▊    | 708/1208 [20:26<14:26,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.064, train/loss_vlb_step=0.000215, train/loss_step=0.064, global_step=3498.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  59%|█████▊    | 709/1208 [20:27<14:23,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.064, train/loss_vlb_step=0.000215, train/loss_step=0.064, global_step=3498.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  59%|█████▊    | 709/1208 [20:27<14:23,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=3499.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  59%|█████▉    | 710/1208 [20:28<14:21,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=3499.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  59%|█████▉    | 710/1208 [20:28<14:21,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000571, train/loss_step=0.171, global_step=3499.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  59%|█████▉    | 711/1208 [20:29<14:19,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000571, train/loss_step=0.171, global_step=3499.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  59%|█████▉    | 711/1208 [20:29<14:19,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000137, train/loss_step=0.0369, global_step=3499.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  59%|█████▉    | 712/1208 [20:32<14:18,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000137, train/loss_step=0.0369, global_step=3499.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  59%|█████▉    | 712/1208 [20:32<14:18,  1.73s/it, loss=0.0991, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.21e-5, train/loss_step=0.00202, global_step=3499.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  59%|█████▉    | 713/1208 [20:33<14:16,  1.73s/it, loss=0.0991, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.21e-5, train/loss_step=0.00202, global_step=3499.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  59%|█████▉    | 713/1208 [20:33<14:16,  1.73s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.00457, train/loss_vlb_step=2.43e-5, train/loss_step=0.00457, global_step=3500.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  59%|█████▉    | 714/1208 [20:34<14:14,  1.73s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.00457, train/loss_vlb_step=2.43e-5, train/loss_step=0.00457, global_step=3500.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  59%|█████▉    | 714/1208 [20:34<14:14,  1.73s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.000102, train/loss_step=0.0249, global_step=3500.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  59%|█████▉    | 715/1208 [20:36<14:12,  1.73s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.000102, train/loss_step=0.0249, global_step=3500.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  59%|█████▉    | 715/1208 [20:36<14:12,  1.73s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.77e-5, train/loss_step=0.00313, global_step=3500.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  59%|█████▉    | 716/1208 [20:39<14:11,  1.73s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.77e-5, train/loss_step=0.00313, global_step=3500.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  59%|█████▉    | 716/1208 [20:39<14:11,  1.73s/it, loss=0.089, v_num=0, train/loss_simple_step=0.00327, train/loss_vlb_step=1.87e-5, train/loss_step=0.00327, global_step=3500.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  59%|█████▉    | 717/1208 [20:40<14:09,  1.73s/it, loss=0.089, v_num=0, train/loss_simple_step=0.00327, train/loss_vlb_step=1.87e-5, train/loss_step=0.00327, global_step=3500.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  59%|█████▉    | 717/1208 [20:40<14:09,  1.73s/it, loss=0.0887, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.7e-5, train/loss_step=0.0185, global_step=3501.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  59%|█████▉    | 718/1208 [20:41<14:07,  1.73s/it, loss=0.0887, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.7e-5, train/loss_step=0.0185, global_step=3501.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  59%|█████▉    | 718/1208 [20:41<14:07,  1.73s/it, loss=0.0715, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000426, train/loss_step=0.129, global_step=3501.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  60%|█████▉    | 719/1208 [20:42<14:05,  1.73s/it, loss=0.0715, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000426, train/loss_step=0.129, global_step=3501.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  60%|█████▉    | 719/1208 [20:42<14:05,  1.73s/it, loss=0.0747, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000288, train/loss_step=0.086, global_step=3501.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  60%|█████▉    | 720/1208 [20:45<14:04,  1.73s/it, loss=0.0747, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000288, train/loss_step=0.086, global_step=3501.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  60%|█████▉    | 720/1208 [20:45<14:04,  1.73s/it, loss=0.0868, v_num=0, train/loss_simple_step=0.444, train/loss_vlb_step=0.00306, train/loss_step=0.444, global_step=3501.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  60%|█████▉    | 721/1208 [20:46<14:02,  1.73s/it, loss=0.0868, v_num=0, train/loss_simple_step=0.444, train/loss_vlb_step=0.00306, train/loss_step=0.444, global_step=3501.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  60%|█████▉    | 721/1208 [20:46<14:02,  1.73s/it, loss=0.0736, v_num=0, train/loss_simple_step=0.0625, train/loss_vlb_step=0.000212, train/loss_step=0.0625, global_step=3502.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  60%|█████▉    | 722/1208 [20:47<13:59,  1.73s/it, loss=0.0736, v_num=0, train/loss_simple_step=0.0625, train/loss_vlb_step=0.000212, train/loss_step=0.0625, global_step=3502.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  60%|█████▉    | 722/1208 [20:47<13:59,  1.73s/it, loss=0.074, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.05e-5, train/loss_step=0.0111, global_step=3502.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  60%|█████▉    | 723/1208 [20:48<13:57,  1.73s/it, loss=0.074, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.05e-5, train/loss_step=0.0111, global_step=3502.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  60%|█████▉    | 723/1208 [20:48<13:57,  1.73s/it, loss=0.074, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=8.55e-6, train/loss_step=0.0014, global_step=3502.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  60%|█████▉    | 724/1208 [20:52<13:57,  1.73s/it, loss=0.074, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=8.55e-6, train/loss_step=0.0014, global_step=3502.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  60%|█████▉    | 724/1208 [20:52<13:57,  1.73s/it, loss=0.0731, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000117, train/loss_step=0.0299, global_step=3502.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  60%|██████    | 725/1208 [20:53<13:54,  1.73s/it, loss=0.0731, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000117, train/loss_step=0.0299, global_step=3502.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  60%|██████    | 725/1208 [20:53<13:54,  1.73s/it, loss=0.073, v_num=0, train/loss_simple_step=0.00701, train/loss_vlb_step=3.32e-5, train/loss_step=0.00701, global_step=3503.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  60%|██████    | 726/1208 [20:54<13:52,  1.73s/it, loss=0.073, v_num=0, train/loss_simple_step=0.00701, train/loss_vlb_step=3.32e-5, train/loss_step=0.00701, global_step=3503.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  60%|██████    | 726/1208 [20:54<13:52,  1.73s/it, loss=0.0664, v_num=0, train/loss_simple_step=0.0056, train/loss_vlb_step=2.86e-5, train/loss_step=0.0056, global_step=3503.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  60%|██████    | 727/1208 [20:55<13:50,  1.73s/it, loss=0.0664, v_num=0, train/loss_simple_step=0.0056, train/loss_vlb_step=2.86e-5, train/loss_step=0.0056, global_step=3503.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  60%|██████    | 727/1208 [20:55<13:50,  1.73s/it, loss=0.0613, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.14e-5, train/loss_step=0.0111, global_step=3503.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  60%|██████    | 728/1208 [20:58<13:49,  1.73s/it, loss=0.0613, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.14e-5, train/loss_step=0.0111, global_step=3503.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  60%|██████    | 728/1208 [20:58<13:49,  1.73s/it, loss=0.0834, v_num=0, train/loss_simple_step=0.506, train/loss_vlb_step=0.00988, train/loss_step=0.506, global_step=3503.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  60%|██████    | 729/1208 [20:59<13:47,  1.73s/it, loss=0.0834, v_num=0, train/loss_simple_step=0.506, train/loss_vlb_step=0.00988, train/loss_step=0.506, global_step=3503.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  60%|██████    | 729/1208 [20:59<13:47,  1.73s/it, loss=0.0785, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.66e-5, train/loss_step=0.0123, global_step=3504.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  60%|██████    | 730/1208 [21:00<13:45,  1.73s/it, loss=0.0785, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.66e-5, train/loss_step=0.0123, global_step=3504.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  60%|██████    | 730/1208 [21:00<13:45,  1.73s/it, loss=0.073, v_num=0, train/loss_simple_step=0.0614, train/loss_vlb_step=0.000211, train/loss_step=0.0614, global_step=3504.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  61%|██████    | 731/1208 [21:01<13:43,  1.73s/it, loss=0.073, v_num=0, train/loss_simple_step=0.0614, train/loss_vlb_step=0.000211, train/loss_step=0.0614, global_step=3504.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  61%|██████    | 731/1208 [21:01<13:43,  1.73s/it, loss=0.0838, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00101, train/loss_step=0.252, global_step=3504.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  61%|██████    | 732/1208 [21:05<13:42,  1.73s/it, loss=0.0838, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00101, train/loss_step=0.252, global_step=3504.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  61%|██████    | 732/1208 [21:05<13:42,  1.73s/it, loss=0.0859, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.00016, train/loss_step=0.0438, global_step=3504.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  61%|██████    | 733/1208 [21:06<13:40,  1.73s/it, loss=0.0859, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.00016, train/loss_step=0.0438, global_step=3504.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  61%|██████    | 733/1208 [21:06<13:40,  1.73s/it, loss=0.0876, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000147, train/loss_step=0.0387, global_step=3505.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  61%|██████    | 734/1208 [21:07<13:38,  1.73s/it, loss=0.0876, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000147, train/loss_step=0.0387, global_step=3505.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  61%|██████    | 734/1208 [21:07<13:38,  1.73s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.00386, train/loss_vlb_step=2.11e-5, train/loss_step=0.00386, global_step=3505.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  61%|██████    | 735/1208 [21:08<13:36,  1.73s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.00386, train/loss_vlb_step=2.11e-5, train/loss_step=0.00386, global_step=3505.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  61%|██████    | 735/1208 [21:08<13:36,  1.73s/it, loss=0.0891, v_num=0, train/loss_simple_step=0.0552, train/loss_vlb_step=0.000197, train/loss_step=0.0552, global_step=3505.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  61%|██████    | 736/1208 [21:11<13:35,  1.73s/it, loss=0.0891, v_num=0, train/loss_simple_step=0.0552, train/loss_vlb_step=0.000197, train/loss_step=0.0552, global_step=3505.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  61%|██████    | 736/1208 [21:11<13:35,  1.73s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.64e-5, train/loss_step=0.0122, global_step=3505.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  61%|██████    | 737/1208 [21:12<13:33,  1.73s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.64e-5, train/loss_step=0.0122, global_step=3505.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  61%|██████    | 737/1208 [21:12<13:33,  1.73s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.0704, train/loss_vlb_step=0.000236, train/loss_step=0.0704, global_step=3506.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  61%|██████    | 738/1208 [21:13<13:31,  1.73s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.0704, train/loss_vlb_step=0.000236, train/loss_step=0.0704, global_step=3506.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  61%|██████    | 738/1208 [21:13<13:31,  1.73s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.00942, train/loss_vlb_step=4.62e-5, train/loss_step=0.00942, global_step=3506.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  61%|██████    | 739/1208 [21:14<13:28,  1.72s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.00942, train/loss_vlb_step=4.62e-5, train/loss_step=0.00942, global_step=3506.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  61%|██████    | 739/1208 [21:14<13:28,  1.72s/it, loss=0.0826, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.06e-5, train/loss_step=0.0137, global_step=3506.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  61%|██████▏   | 740/1208 [21:17<13:28,  1.73s/it, loss=0.0826, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.06e-5, train/loss_step=0.0137, global_step=3506.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  61%|██████▏   | 740/1208 [21:17<13:28,  1.73s/it, loss=0.0665, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000414, train/loss_step=0.123, global_step=3506.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  61%|██████▏   | 741/1208 [21:18<13:26,  1.73s/it, loss=0.0665, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000414, train/loss_step=0.123, global_step=3506.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  61%|██████▏   | 741/1208 [21:18<13:26,  1.73s/it, loss=0.07, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000436, train/loss_step=0.132, global_step=3507.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  61%|██████▏   | 742/1208 [21:19<13:23,  1.72s/it, loss=0.07, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000436, train/loss_step=0.132, global_step=3507.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  61%|██████▏   | 742/1208 [21:19<13:23,  1.72s/it, loss=0.0712, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000128, train/loss_step=0.035, global_step=3507.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  62%|██████▏   | 743/1208 [21:20<13:21,  1.72s/it, loss=0.0712, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000128, train/loss_step=0.035, global_step=3507.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  62%|██████▏   | 743/1208 [21:20<13:21,  1.72s/it, loss=0.0714, v_num=0, train/loss_simple_step=0.0056, train/loss_vlb_step=2.9e-5, train/loss_step=0.0056, global_step=3507.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  62%|██████▏   | 744/1208 [21:24<13:20,  1.73s/it, loss=0.0714, v_num=0, train/loss_simple_step=0.0056, train/loss_vlb_step=2.9e-5, train/loss_step=0.0056, global_step=3507.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  62%|██████▏   | 744/1208 [21:24<13:20,  1.73s/it, loss=0.0775, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000504, train/loss_step=0.151, global_step=3507.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  62%|██████▏   | 745/1208 [21:25<13:18,  1.73s/it, loss=0.0775, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000504, train/loss_step=0.151, global_step=3507.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  62%|██████▏   | 745/1208 [21:25<13:18,  1.73s/it, loss=0.0795, v_num=0, train/loss_simple_step=0.0475, train/loss_vlb_step=0.000173, train/loss_step=0.0475, global_step=3508.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  62%|██████▏   | 746/1208 [21:26<13:16,  1.72s/it, loss=0.0795, v_num=0, train/loss_simple_step=0.0475, train/loss_vlb_step=0.000173, train/loss_step=0.0475, global_step=3508.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  62%|██████▏   | 746/1208 [21:26<13:16,  1.72s/it, loss=0.0805, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000102, train/loss_step=0.0255, global_step=3508.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  62%|██████▏   | 747/1208 [21:27<13:14,  1.72s/it, loss=0.0805, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000102, train/loss_step=0.0255, global_step=3508.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  62%|██████▏   | 747/1208 [21:27<13:14,  1.72s/it, loss=0.0838, v_num=0, train/loss_simple_step=0.0768, train/loss_vlb_step=0.000254, train/loss_step=0.0768, global_step=3508.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  62%|██████▏   | 748/1208 [21:30<13:13,  1.73s/it, loss=0.0838, v_num=0, train/loss_simple_step=0.0768, train/loss_vlb_step=0.000254, train/loss_step=0.0768, global_step=3508.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  62%|██████▏   | 748/1208 [21:30<13:13,  1.73s/it, loss=0.0708, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00125, train/loss_step=0.247, global_step=3508.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  62%|██████▏   | 749/1208 [21:31<13:11,  1.72s/it, loss=0.0708, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00125, train/loss_step=0.247, global_step=3508.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  62%|██████▏   | 749/1208 [21:31<13:11,  1.72s/it, loss=0.0719, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000122, train/loss_step=0.0339, global_step=3509.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  62%|██████▏   | 750/1208 [21:32<13:09,  1.72s/it, loss=0.0719, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000122, train/loss_step=0.0339, global_step=3509.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  62%|██████▏   | 750/1208 [21:32<13:09,  1.72s/it, loss=0.0699, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=9.22e-5, train/loss_step=0.0217, global_step=3509.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  62%|██████▏   | 751/1208 [21:33<13:07,  1.72s/it, loss=0.0699, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=9.22e-5, train/loss_step=0.0217, global_step=3509.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  62%|██████▏   | 751/1208 [21:33<13:07,  1.72s/it, loss=0.0727, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00144, train/loss_step=0.308, global_step=3509.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  62%|██████▏   | 752/1208 [21:37<13:06,  1.72s/it, loss=0.0727, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00144, train/loss_step=0.308, global_step=3509.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  62%|██████▏   | 752/1208 [21:37<13:06,  1.72s/it, loss=0.0707, v_num=0, train/loss_simple_step=0.00364, train/loss_vlb_step=1.99e-5, train/loss_step=0.00364, global_step=3509.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  62%|██████▏   | 753/1208 [21:38<13:04,  1.72s/it, loss=0.0707, v_num=0, train/loss_simple_step=0.00364, train/loss_vlb_step=1.99e-5, train/loss_step=0.00364, global_step=3509.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  62%|██████▏   | 753/1208 [21:38<13:04,  1.72s/it, loss=0.0697, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=8.26e-5, train/loss_step=0.019, global_step=3510.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  62%|██████▏   | 754/1208 [21:39<13:02,  1.72s/it, loss=0.0697, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=8.26e-5, train/loss_step=0.019, global_step=3510.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  62%|██████▏   | 754/1208 [21:39<13:02,  1.72s/it, loss=0.095, v_num=0, train/loss_simple_step=0.509, train/loss_vlb_step=0.00662, train/loss_step=0.509, global_step=3510.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  62%|██████▎   | 755/1208 [21:40<13:00,  1.72s/it, loss=0.095, v_num=0, train/loss_simple_step=0.509, train/loss_vlb_step=0.00662, train/loss_step=0.509, global_step=3510.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  62%|██████▎   | 755/1208 [21:40<13:00,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.844, train/loss_vlb_step=0.213, train/loss_step=0.844, global_step=3510.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  63%|██████▎   | 756/1208 [21:43<12:59,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.844, train/loss_vlb_step=0.213, train/loss_step=0.844, global_step=3510.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  63%|██████▎   | 756/1208 [21:43<12:59,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.000125, train/loss_step=0.0326, global_step=3510.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  63%|██████▎   | 757/1208 [21:44<12:57,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.000125, train/loss_step=0.0326, global_step=3510.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  63%|██████▎   | 757/1208 [21:44<12:57,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00138, train/loss_vlb_step=8.38e-6, train/loss_step=0.00138, global_step=3511.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  63%|██████▎   | 758/1208 [21:45<12:55,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00138, train/loss_vlb_step=8.38e-6, train/loss_step=0.00138, global_step=3511.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  63%|██████▎   | 758/1208 [21:45<12:55,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000693, train/loss_step=0.190, global_step=3511.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  63%|██████▎   | 759/1208 [21:46<12:52,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000693, train/loss_step=0.190, global_step=3511.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  63%|██████▎   | 759/1208 [21:46<12:52,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0054, train/loss_vlb_step=2.69e-5, train/loss_step=0.0054, global_step=3511.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  63%|██████▎   | 760/1208 [21:49<12:52,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0054, train/loss_vlb_step=2.69e-5, train/loss_step=0.0054, global_step=3511.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  63%|██████▎   | 760/1208 [21:49<12:52,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0951, train/loss_vlb_step=0.000314, train/loss_step=0.0951, global_step=3511.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  63%|██████▎   | 761/1208 [21:50<12:50,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0951, train/loss_vlb_step=0.000314, train/loss_step=0.0951, global_step=3511.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  63%|██████▎   | 761/1208 [21:50<12:50,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.16e-5, train/loss_step=0.0169, global_step=3512.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  63%|██████▎   | 762/1208 [21:51<12:47,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.16e-5, train/loss_step=0.0169, global_step=3512.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  63%|██████▎   | 762/1208 [21:51<12:47,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00389, train/loss_vlb_step=2.11e-5, train/loss_step=0.00389, global_step=3512.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  63%|██████▎   | 763/1208 [21:53<12:45,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00389, train/loss_vlb_step=2.11e-5, train/loss_step=0.00389, global_step=3512.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  63%|██████▎   | 763/1208 [21:53<12:45,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0797, train/loss_vlb_step=0.000268, train/loss_step=0.0797, global_step=3512.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  63%|██████▎   | 764/1208 [21:56<12:44,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0797, train/loss_vlb_step=0.000268, train/loss_step=0.0797, global_step=3512.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  63%|██████▎   | 764/1208 [21:56<12:44,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000108, train/loss_step=0.0258, global_step=3512.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  63%|██████▎   | 765/1208 [21:57<12:42,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000108, train/loss_step=0.0258, global_step=3512.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  63%|██████▎   | 765/1208 [21:57<12:42,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000123, train/loss_step=0.0308, global_step=3513.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  63%|██████▎   | 766/1208 [21:58<12:40,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000123, train/loss_step=0.0308, global_step=3513.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  63%|██████▎   | 766/1208 [21:58<12:40,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000795, train/loss_step=0.213, global_step=3513.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  63%|██████▎   | 767/1208 [21:59<12:38,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000795, train/loss_step=0.213, global_step=3513.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  63%|██████▎   | 767/1208 [21:59<12:38,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.684, train/loss_vlb_step=0.0191, train/loss_step=0.684, global_step=3513.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  64%|██████▎   | 768/1208 [22:02<12:37,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.684, train/loss_vlb_step=0.0191, train/loss_step=0.684, global_step=3513.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  64%|██████▎   | 768/1208 [22:02<12:37,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000102, train/loss_step=0.0282, global_step=3513.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  64%|██████▎   | 769/1208 [22:03<12:35,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000102, train/loss_step=0.0282, global_step=3513.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  64%|██████▎   | 769/1208 [22:03<12:35,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.34e-5, train/loss_step=0.0209, global_step=3514.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  64%|██████▎   | 770/1208 [22:04<12:33,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.34e-5, train/loss_step=0.0209, global_step=3514.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  64%|██████▎   | 770/1208 [22:04<12:33,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000932, train/loss_step=0.232, global_step=3514.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  64%|██████▍   | 771/1208 [22:05<12:31,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000932, train/loss_step=0.232, global_step=3514.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  64%|██████▍   | 771/1208 [22:05<12:31,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.628, train/loss_vlb_step=0.016, train/loss_step=0.628, global_step=3514.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  64%|██████▍   | 772/1208 [22:09<12:30,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.628, train/loss_vlb_step=0.016, train/loss_step=0.628, global_step=3514.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  64%|██████▍   | 772/1208 [22:09<12:30,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.12e-5, train/loss_step=0.00186, global_step=3514.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  64%|██████▍   | 773/1208 [22:10<12:28,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.12e-5, train/loss_step=0.00186, global_step=3514.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  64%|██████▍   | 773/1208 [22:10<12:28,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000104, train/loss_step=0.0262, global_step=3515.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  64%|██████▍   | 774/1208 [22:11<12:26,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000104, train/loss_step=0.0262, global_step=3515.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  64%|██████▍   | 774/1208 [22:11<12:26,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.67e-5, train/loss_step=0.0102, global_step=3515.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  64%|██████▍   | 775/1208 [22:12<12:24,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.67e-5, train/loss_step=0.0102, global_step=3515.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  64%|██████▍   | 775/1208 [22:12<12:24,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000961, train/loss_step=0.225, global_step=3515.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  64%|██████▍   | 776/1208 [22:15<12:23,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000961, train/loss_step=0.225, global_step=3515.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  64%|██████▍   | 776/1208 [22:15<12:23,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=3515.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  64%|██████▍   | 777/1208 [22:16<12:21,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=3515.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  64%|██████▍   | 777/1208 [22:16<12:21,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0922, train/loss_vlb_step=0.000308, train/loss_step=0.0922, global_step=3516.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  64%|██████▍   | 778/1208 [22:17<12:19,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0922, train/loss_vlb_step=0.000308, train/loss_step=0.0922, global_step=3516.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  64%|██████▍   | 778/1208 [22:17<12:19,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0903, train/loss_vlb_step=0.000303, train/loss_step=0.0903, global_step=3516.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  64%|██████▍   | 779/1208 [22:18<12:17,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0903, train/loss_vlb_step=0.000303, train/loss_step=0.0903, global_step=3516.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  64%|██████▍   | 779/1208 [22:18<12:17,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.36e-5, train/loss_step=0.0237, global_step=3516.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  65%|██████▍   | 780/1208 [22:22<12:16,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.36e-5, train/loss_step=0.0237, global_step=3516.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  65%|██████▍   | 780/1208 [22:22<12:16,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00508, train/loss_vlb_step=2.74e-5, train/loss_step=0.00508, global_step=3516.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  65%|██████▍   | 781/1208 [22:23<12:14,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00508, train/loss_vlb_step=2.74e-5, train/loss_step=0.00508, global_step=3516.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  65%|██████▍   | 781/1208 [22:23<12:14,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.656, train/loss_vlb_step=0.0153, train/loss_step=0.656, global_step=3517.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]     Epoch 11:  65%|██████▍   | 782/1208 [22:24<12:12,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.656, train/loss_vlb_step=0.0153, train/loss_step=0.656, global_step=3517.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  65%|██████▍   | 782/1208 [22:24<12:12,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00525, train/loss_vlb_step=2.76e-5, train/loss_step=0.00525, global_step=3517.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  65%|██████▍   | 783/1208 [22:25<12:10,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00525, train/loss_vlb_step=2.76e-5, train/loss_step=0.00525, global_step=3517.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  65%|██████▍   | 783/1208 [22:25<12:10,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.00015, train/loss_step=0.0394, global_step=3517.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  65%|██████▍   | 784/1208 [22:28<12:09,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.00015, train/loss_step=0.0394, global_step=3517.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  65%|██████▍   | 784/1208 [22:28<12:09,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=1.08e-5, train/loss_step=0.00179, global_step=3517.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  65%|██████▍   | 785/1208 [22:29<12:07,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=1.08e-5, train/loss_step=0.00179, global_step=3517.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  65%|██████▍   | 785/1208 [22:29<12:07,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.45e-5, train/loss_step=0.00253, global_step=3518.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  65%|██████▌   | 786/1208 [22:30<12:05,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.45e-5, train/loss_step=0.00253, global_step=3518.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  65%|██████▌   | 786/1208 [22:30<12:05,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00121, train/loss_step=0.289, global_step=3518.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  65%|██████▌   | 787/1208 [22:31<12:03,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00121, train/loss_step=0.289, global_step=3518.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  65%|██████▌   | 787/1208 [22:31<12:03,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000464, train/loss_step=0.141, global_step=3518.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  65%|██████▌   | 788/1208 [22:34<12:02,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000464, train/loss_step=0.141, global_step=3518.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  65%|██████▌   | 788/1208 [22:34<12:02,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.21e-5, train/loss_step=0.00209, global_step=3518.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  65%|██████▌   | 789/1208 [22:35<12:00,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.21e-5, train/loss_step=0.00209, global_step=3518.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  65%|██████▌   | 789/1208 [22:35<12:00,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000919, train/loss_step=0.232, global_step=3519.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  65%|██████▌   | 790/1208 [22:36<11:57,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000919, train/loss_step=0.232, global_step=3519.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  65%|██████▌   | 790/1208 [22:36<11:57,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=7.05e-5, train/loss_step=0.016, global_step=3519.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  65%|██████▌   | 791/1208 [22:37<11:55,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=7.05e-5, train/loss_step=0.016, global_step=3519.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  65%|██████▌   | 791/1208 [22:37<11:55,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0805, train/loss_vlb_step=0.000269, train/loss_step=0.0805, global_step=3519.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  66%|██████▌   | 792/1208 [22:41<11:55,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0805, train/loss_vlb_step=0.000269, train/loss_step=0.0805, global_step=3519.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  66%|██████▌   | 792/1208 [22:41<11:55,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000123, train/loss_step=0.0306, global_step=3519.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  66%|██████▌   | 793/1208 [22:42<11:52,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000123, train/loss_step=0.0306, global_step=3519.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  66%|██████▌   | 793/1208 [22:42<11:52,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00346, train/loss_vlb_step=1.93e-5, train/loss_step=0.00346, global_step=3520.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  66%|██████▌   | 794/1208 [22:43<11:50,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00346, train/loss_vlb_step=1.93e-5, train/loss_step=0.00346, global_step=3520.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  66%|██████▌   | 794/1208 [22:43<11:50,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=8.88e-5, train/loss_step=0.0221, global_step=3520.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  66%|██████▌   | 795/1208 [22:44<11:48,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=8.88e-5, train/loss_step=0.0221, global_step=3520.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  66%|██████▌   | 795/1208 [22:44<11:48,  1.72s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000373, train/loss_step=0.113, global_step=3520.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  66%|██████▌   | 796/1208 [22:47<11:47,  1.72s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000373, train/loss_step=0.113, global_step=3520.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  66%|██████▌   | 796/1208 [22:47<11:47,  1.72s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000337, train/loss_step=0.102, global_step=3520.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  66%|██████▌   | 797/1208 [22:48<11:45,  1.72s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000337, train/loss_step=0.102, global_step=3520.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  66%|██████▌   | 797/1208 [22:48<11:45,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000984, train/loss_step=0.248, global_step=3521.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  66%|██████▌   | 798/1208 [22:49<11:43,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000984, train/loss_step=0.248, global_step=3521.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  66%|██████▌   | 798/1208 [22:49<11:43,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000599, train/loss_step=0.177, global_step=3521.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  66%|██████▌   | 799/1208 [22:50<11:41,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000599, train/loss_step=0.177, global_step=3521.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  66%|██████▌   | 799/1208 [22:50<11:41,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000456, train/loss_step=0.138, global_step=3521.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  66%|██████▌   | 800/1208 [22:54<11:40,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000456, train/loss_step=0.138, global_step=3521.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  66%|██████▌   | 800/1208 [22:54<11:40,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00731, train/loss_vlb_step=3.75e-5, train/loss_step=0.00731, global_step=3521.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  66%|██████▋   | 801/1208 [22:55<11:38,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00731, train/loss_vlb_step=3.75e-5, train/loss_step=0.00731, global_step=3521.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  66%|██████▋   | 801/1208 [22:55<11:38,  1.72s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.000994, train/loss_step=0.247, global_step=3522.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  66%|██████▋   | 802/1208 [22:56<11:36,  1.72s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.000994, train/loss_step=0.247, global_step=3522.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  66%|██████▋   | 802/1208 [22:56<11:36,  1.72s/it, loss=0.0952, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.14e-5, train/loss_step=0.011, global_step=3522.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  66%|██████▋   | 803/1208 [22:57<11:34,  1.72s/it, loss=0.0952, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.14e-5, train/loss_step=0.011, global_step=3522.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  66%|██████▋   | 803/1208 [22:57<11:34,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.0021, train/loss_step=0.335, global_step=3522.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  67%|██████▋   | 804/1208 [23:00<11:33,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.0021, train/loss_step=0.335, global_step=3522.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  67%|██████▋   | 804/1208 [23:00<11:33,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00237, train/loss_vlb_step=1.37e-5, train/loss_step=0.00237, global_step=3522.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  67%|██████▋   | 805/1208 [23:01<11:31,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00237, train/loss_vlb_step=1.37e-5, train/loss_step=0.00237, global_step=3522.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  67%|██████▋   | 805/1208 [23:01<11:31,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0954, train/loss_vlb_step=0.000314, train/loss_step=0.0954, global_step=3523.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  67%|██████▋   | 806/1208 [23:02<11:29,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0954, train/loss_vlb_step=0.000314, train/loss_step=0.0954, global_step=3523.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  67%|██████▋   | 806/1208 [23:02<11:29,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00594, train/loss_vlb_step=3.07e-5, train/loss_step=0.00594, global_step=3523.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  67%|██████▋   | 807/1208 [23:03<11:27,  1.71s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00594, train/loss_vlb_step=3.07e-5, train/loss_step=0.00594, global_step=3523.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  67%|██████▋   | 807/1208 [23:03<11:27,  1.71s/it, loss=0.0939, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.76e-5, train/loss_step=0.0101, global_step=3523.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  67%|██████▋   | 808/1208 [23:06<11:26,  1.72s/it, loss=0.0939, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.76e-5, train/loss_step=0.0101, global_step=3523.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  67%|██████▋   | 808/1208 [23:06<11:26,  1.72s/it, loss=0.099, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=3523.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  67%|██████▋   | 809/1208 [23:08<11:24,  1.72s/it, loss=0.099, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=3523.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  67%|██████▋   | 809/1208 [23:08<11:24,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00124, train/loss_step=0.264, global_step=3524.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  67%|██████▋   | 810/1208 [23:09<11:22,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00124, train/loss_step=0.264, global_step=3524.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  67%|██████▋   | 810/1208 [23:09<11:22,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000467, train/loss_step=0.139, global_step=3524.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  67%|██████▋   | 811/1208 [23:10<11:20,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000467, train/loss_step=0.139, global_step=3524.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  67%|██████▋   | 811/1208 [23:10<11:20,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=3524.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  67%|██████▋   | 812/1208 [23:13<11:19,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=3524.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  67%|██████▋   | 812/1208 [23:13<11:19,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0044, train/loss_vlb_step=2.36e-5, train/loss_step=0.0044, global_step=3524.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  67%|██████▋   | 813/1208 [23:14<11:17,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0044, train/loss_vlb_step=2.36e-5, train/loss_step=0.0044, global_step=3524.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  67%|██████▋   | 813/1208 [23:14<11:17,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.27e-5, train/loss_step=0.0021, global_step=3525.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  67%|██████▋   | 814/1208 [23:15<11:15,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.27e-5, train/loss_step=0.0021, global_step=3525.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  67%|██████▋   | 814/1208 [23:15<11:15,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0748, train/loss_vlb_step=0.000252, train/loss_step=0.0748, global_step=3525.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  67%|██████▋   | 815/1208 [23:16<11:13,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0748, train/loss_vlb_step=0.000252, train/loss_step=0.0748, global_step=3525.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  67%|██████▋   | 815/1208 [23:16<11:13,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=0.000103, train/loss_step=0.0261, global_step=3525.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  68%|██████▊   | 816/1208 [23:19<11:12,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=0.000103, train/loss_step=0.0261, global_step=3525.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  68%|██████▊   | 816/1208 [23:19<11:12,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000132, train/loss_step=0.0349, global_step=3525.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  68%|██████▊   | 817/1208 [23:20<11:10,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000132, train/loss_step=0.0349, global_step=3525.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  68%|██████▊   | 817/1208 [23:20<11:10,  1.71s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000878, train/loss_step=0.215, global_step=3526.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  68%|██████▊   | 818/1208 [23:21<11:08,  1.71s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000878, train/loss_step=0.215, global_step=3526.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  68%|██████▊   | 818/1208 [23:21<11:08,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00109, train/loss_step=0.239, global_step=3526.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  68%|██████▊   | 819/1208 [23:22<11:06,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00109, train/loss_step=0.239, global_step=3526.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  68%|██████▊   | 819/1208 [23:22<11:06,  1.71s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.3e-5, train/loss_step=0.00215, global_step=3526.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  68%|██████▊   | 820/1208 [23:26<11:05,  1.71s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.3e-5, train/loss_step=0.00215, global_step=3526.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  68%|██████▊   | 820/1208 [23:26<11:05,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000948, train/loss_step=0.241, global_step=3526.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  68%|██████▊   | 821/1208 [23:27<11:03,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000948, train/loss_step=0.241, global_step=3526.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  68%|██████▊   | 821/1208 [23:27<11:03,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000673, train/loss_step=0.190, global_step=3527.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  68%|██████▊   | 822/1208 [23:28<11:01,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000673, train/loss_step=0.190, global_step=3527.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  68%|██████▊   | 822/1208 [23:28<11:01,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00131, train/loss_step=0.276, global_step=3527.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  68%|██████▊   | 823/1208 [23:29<10:59,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00131, train/loss_step=0.276, global_step=3527.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  68%|██████▊   | 823/1208 [23:29<10:59,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00309, train/loss_step=0.411, global_step=3527.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  68%|██████▊   | 824/1208 [23:32<10:58,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00309, train/loss_step=0.411, global_step=3527.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  68%|██████▊   | 824/1208 [23:32<10:58,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000172, train/loss_step=0.0484, global_step=3527.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  68%|██████▊   | 825/1208 [23:33<10:56,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000172, train/loss_step=0.0484, global_step=3527.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  68%|██████▊   | 825/1208 [23:33<10:56,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00231, train/loss_step=0.393, global_step=3528.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  68%|██████▊   | 826/1208 [23:34<10:54,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00231, train/loss_step=0.393, global_step=3528.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  68%|██████▊   | 826/1208 [23:34<10:54,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.19e-5, train/loss_step=0.002, global_step=3528.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  68%|██████▊   | 827/1208 [23:35<10:52,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.19e-5, train/loss_step=0.002, global_step=3528.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  68%|██████▊   | 827/1208 [23:35<10:52,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00278, train/loss_step=0.425, global_step=3528.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  69%|██████▊   | 828/1208 [23:39<10:51,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00278, train/loss_step=0.425, global_step=3528.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  69%|██████▊   | 828/1208 [23:39<10:51,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.86e-5, train/loss_step=0.0102, global_step=3528.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  69%|██████▊   | 829/1208 [23:40<10:49,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.86e-5, train/loss_step=0.0102, global_step=3528.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  69%|██████▊   | 829/1208 [23:40<10:49,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=1.65e-5, train/loss_step=0.00294, global_step=3529.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  69%|██████▊   | 830/1208 [23:41<10:47,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=1.65e-5, train/loss_step=0.00294, global_step=3529.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  69%|██████▊   | 830/1208 [23:41<10:47,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=3529.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  69%|██████▉   | 831/1208 [23:42<10:45,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=3529.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  69%|██████▉   | 831/1208 [23:42<10:45,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.000943, train/loss_step=0.256, global_step=3529.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  69%|██████▉   | 832/1208 [23:45<10:44,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.000943, train/loss_step=0.256, global_step=3529.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  69%|██████▉   | 832/1208 [23:45<10:44,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00554, train/loss_vlb_step=2.85e-5, train/loss_step=0.00554, global_step=3529.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  69%|██████▉   | 833/1208 [23:46<10:42,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00554, train/loss_vlb_step=2.85e-5, train/loss_step=0.00554, global_step=3529.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  69%|██████▉   | 833/1208 [23:46<10:42,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.6e-5, train/loss_step=0.0126, global_step=3530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  69%|██████▉   | 834/1208 [23:47<10:40,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.6e-5, train/loss_step=0.0126, global_step=3530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  69%|██████▉   | 834/1208 [23:47<10:40,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00926, train/loss_vlb_step=4.35e-5, train/loss_step=0.00926, global_step=3530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  69%|██████▉   | 835/1208 [23:48<10:38,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00926, train/loss_vlb_step=4.35e-5, train/loss_step=0.00926, global_step=3530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  69%|██████▉   | 835/1208 [23:48<10:38,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0539, train/loss_vlb_step=0.000189, train/loss_step=0.0539, global_step=3530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  69%|██████▉   | 836/1208 [23:51<10:37,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0539, train/loss_vlb_step=0.000189, train/loss_step=0.0539, global_step=3530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  69%|██████▉   | 836/1208 [23:51<10:37,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000446, train/loss_step=0.136, global_step=3530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  69%|██████▉   | 837/1208 [23:52<10:35,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000446, train/loss_step=0.136, global_step=3530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  69%|██████▉   | 837/1208 [23:52<10:35,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.437, train/loss_vlb_step=0.00279, train/loss_step=0.437, global_step=3531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  69%|██████▉   | 838/1208 [23:54<10:33,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.437, train/loss_vlb_step=0.00279, train/loss_step=0.437, global_step=3531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  69%|██████▉   | 838/1208 [23:54<10:33,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000442, train/loss_step=0.135, global_step=3531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  69%|██████▉   | 839/1208 [23:55<10:31,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000442, train/loss_step=0.135, global_step=3531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  69%|██████▉   | 839/1208 [23:55<10:31,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.000164, train/loss_step=0.0456, global_step=3531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  70%|██████▉   | 840/1208 [23:58<10:30,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.000164, train/loss_step=0.0456, global_step=3531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  70%|██████▉   | 840/1208 [23:58<10:30,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.01e-5, train/loss_step=0.011, global_step=3531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  70%|██████▉   | 841/1208 [23:59<10:28,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.01e-5, train/loss_step=0.011, global_step=3531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  70%|██████▉   | 841/1208 [23:59<10:28,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00904, train/loss_vlb_step=4.46e-5, train/loss_step=0.00904, global_step=3532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  70%|██████▉   | 842/1208 [24:00<10:26,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00904, train/loss_vlb_step=4.46e-5, train/loss_step=0.00904, global_step=3532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  70%|██████▉   | 842/1208 [24:00<10:26,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=3532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  70%|██████▉   | 843/1208 [24:01<10:24,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=3532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  70%|██████▉   | 843/1208 [24:01<10:24,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0384, train/loss_vlb_step=0.000144, train/loss_step=0.0384, global_step=3532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  70%|██████▉   | 844/1208 [24:04<10:23,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0384, train/loss_vlb_step=0.000144, train/loss_step=0.0384, global_step=3532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  70%|██████▉   | 844/1208 [24:04<10:23,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000429, train/loss_step=0.129, global_step=3532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  70%|██████▉   | 845/1208 [24:05<10:21,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000429, train/loss_step=0.129, global_step=3532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  70%|██████▉   | 845/1208 [24:05<10:21,  1.71s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.00561, train/loss_vlb_step=2.96e-5, train/loss_step=0.00561, global_step=3533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  70%|███████   | 846/1208 [24:06<10:19,  1.71s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.00561, train/loss_vlb_step=2.96e-5, train/loss_step=0.00561, global_step=3533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  70%|███████   | 846/1208 [24:06<10:19,  1.71s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.00531, train/loss_vlb_step=2.71e-5, train/loss_step=0.00531, global_step=3533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  70%|███████   | 847/1208 [24:07<10:17,  1.71s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.00531, train/loss_vlb_step=2.71e-5, train/loss_step=0.00531, global_step=3533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  70%|███████   | 847/1208 [24:07<10:17,  1.71s/it, loss=0.077, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=2.34e-5, train/loss_step=0.00421, global_step=3533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  70%|███████   | 848/1208 [24:11<10:16,  1.71s/it, loss=0.077, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=2.34e-5, train/loss_step=0.00421, global_step=3533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  70%|███████   | 848/1208 [24:11<10:16,  1.71s/it, loss=0.0768, v_num=0, train/loss_simple_step=0.0047, train/loss_vlb_step=2.5e-5, train/loss_step=0.0047, global_step=3533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  70%|███████   | 849/1208 [24:12<10:14,  1.71s/it, loss=0.0768, v_num=0, train/loss_simple_step=0.0047, train/loss_vlb_step=2.5e-5, train/loss_step=0.0047, global_step=3533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  70%|███████   | 849/1208 [24:12<10:14,  1.71s/it, loss=0.0771, v_num=0, train/loss_simple_step=0.00924, train/loss_vlb_step=4.56e-5, train/loss_step=0.00924, global_step=3534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  70%|███████   | 850/1208 [24:13<10:12,  1.71s/it, loss=0.0771, v_num=0, train/loss_simple_step=0.00924, train/loss_vlb_step=4.56e-5, train/loss_step=0.00924, global_step=3534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  70%|███████   | 850/1208 [24:13<10:12,  1.71s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.511, train/loss_vlb_step=0.0103, train/loss_step=0.511, global_step=3534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]     Epoch 11:  70%|███████   | 851/1208 [24:14<10:10,  1.71s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.511, train/loss_vlb_step=0.0103, train/loss_step=0.511, global_step=3534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  70%|███████   | 851/1208 [24:14<10:10,  1.71s/it, loss=0.0834, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.1e-5, train/loss_step=0.00182, global_step=3534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  71%|███████   | 852/1208 [24:17<10:09,  1.71s/it, loss=0.0834, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.1e-5, train/loss_step=0.00182, global_step=3534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  71%|███████   | 852/1208 [24:17<10:09,  1.71s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000711, train/loss_step=0.201, global_step=3534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  71%|███████   | 853/1208 [24:18<10:07,  1.71s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000711, train/loss_step=0.201, global_step=3534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  71%|███████   | 853/1208 [24:18<10:07,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000559, train/loss_step=0.162, global_step=3535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  71%|███████   | 854/1208 [24:19<10:05,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000559, train/loss_step=0.162, global_step=3535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  71%|███████   | 854/1208 [24:19<10:05,  1.71s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00264, train/loss_vlb_step=1.49e-5, train/loss_step=0.00264, global_step=3535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  71%|███████   | 855/1208 [24:20<10:03,  1.71s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00264, train/loss_vlb_step=1.49e-5, train/loss_step=0.00264, global_step=3535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  71%|███████   | 855/1208 [24:20<10:03,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0871, train/loss_vlb_step=0.000287, train/loss_step=0.0871, global_step=3535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  71%|███████   | 856/1208 [24:24<10:02,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0871, train/loss_vlb_step=0.000287, train/loss_step=0.0871, global_step=3535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  71%|███████   | 856/1208 [24:24<10:02,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00125, train/loss_step=0.261, global_step=3535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  71%|███████   | 857/1208 [24:25<10:00,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00125, train/loss_step=0.261, global_step=3535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  71%|███████   | 857/1208 [24:25<10:00,  1.71s/it, loss=0.0876, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.97e-5, train/loss_step=0.024, global_step=3536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  71%|███████   | 858/1208 [24:26<09:58,  1.71s/it, loss=0.0876, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.97e-5, train/loss_step=0.024, global_step=3536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  71%|███████   | 858/1208 [24:26<09:58,  1.71s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000873, train/loss_step=0.236, global_step=3536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  71%|███████   | 859/1208 [24:27<09:56,  1.71s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000873, train/loss_step=0.236, global_step=3536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  71%|███████   | 859/1208 [24:27<09:56,  1.71s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000137, train/loss_step=0.0373, global_step=3536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  71%|███████   | 860/1208 [24:30<09:55,  1.71s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000137, train/loss_step=0.0373, global_step=3536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  71%|███████   | 860/1208 [24:30<09:55,  1.71s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.0904, train/loss_vlb_step=0.000298, train/loss_step=0.0904, global_step=3536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  71%|███████▏  | 861/1208 [24:31<09:53,  1.71s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.0904, train/loss_vlb_step=0.000298, train/loss_step=0.0904, global_step=3536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  71%|███████▏  | 861/1208 [24:31<09:53,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00116, train/loss_step=0.253, global_step=3537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  71%|███████▏  | 862/1208 [24:32<09:51,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00116, train/loss_step=0.253, global_step=3537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  71%|███████▏  | 862/1208 [24:32<09:51,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000376, train/loss_step=0.114, global_step=3537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  71%|███████▏  | 863/1208 [24:33<09:49,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000376, train/loss_step=0.114, global_step=3537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  71%|███████▏  | 863/1208 [24:33<09:49,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0384, train/loss_vlb_step=0.000148, train/loss_step=0.0384, global_step=3537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  72%|███████▏  | 864/1208 [24:36<09:47,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0384, train/loss_vlb_step=0.000148, train/loss_step=0.0384, global_step=3537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  72%|███████▏  | 864/1208 [24:36<09:47,  1.71s/it, loss=0.112, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000634, train/loss_step=0.184, global_step=3537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  72%|███████▏  | 865/1208 [24:37<09:46,  1.71s/it, loss=0.112, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000634, train/loss_step=0.184, global_step=3537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  72%|███████▏  | 865/1208 [24:37<09:46,  1.71s/it, loss=0.115, v_num=0, train/loss_simple_step=0.064, train/loss_vlb_step=0.000221, train/loss_step=0.064, global_step=3538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  72%|███████▏  | 866/1208 [24:38<09:44,  1.71s/it, loss=0.115, v_num=0, train/loss_simple_step=0.064, train/loss_vlb_step=0.000221, train/loss_step=0.064, global_step=3538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  72%|███████▏  | 866/1208 [24:38<09:44,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000496, train/loss_step=0.149, global_step=3538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  72%|███████▏  | 867/1208 [24:39<09:42,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000496, train/loss_step=0.149, global_step=3538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  72%|███████▏  | 867/1208 [24:39<09:42,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000148, train/loss_step=0.0405, global_step=3538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  72%|███████▏  | 868/1208 [24:43<09:40,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000148, train/loss_step=0.0405, global_step=3538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  72%|███████▏  | 868/1208 [24:43<09:40,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.00011, train/loss_step=0.0308, global_step=3538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  72%|███████▏  | 869/1208 [24:44<09:39,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.00011, train/loss_step=0.0308, global_step=3538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  72%|███████▏  | 869/1208 [24:44<09:39,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0455, train/loss_vlb_step=0.00016, train/loss_step=0.0455, global_step=3539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  72%|███████▏  | 870/1208 [24:45<09:37,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0455, train/loss_vlb_step=0.00016, train/loss_step=0.0455, global_step=3539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  72%|███████▏  | 870/1208 [24:45<09:37,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00279, train/loss_vlb_step=1.55e-5, train/loss_step=0.00279, global_step=3539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  72%|███████▏  | 871/1208 [24:46<09:35,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00279, train/loss_vlb_step=1.55e-5, train/loss_step=0.00279, global_step=3539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  72%|███████▏  | 871/1208 [24:46<09:35,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000457, train/loss_step=0.139, global_step=3539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  72%|███████▏  | 872/1208 [24:49<09:33,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000457, train/loss_step=0.139, global_step=3539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  72%|███████▏  | 872/1208 [24:49<09:33,  1.71s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=7.06e-5, train/loss_step=0.0154, global_step=3539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  72%|███████▏  | 873/1208 [24:50<09:32,  1.71s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=7.06e-5, train/loss_step=0.0154, global_step=3539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  72%|███████▏  | 873/1208 [24:50<09:32,  1.71s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.049, train/loss_vlb_step=0.000176, train/loss_step=0.049, global_step=3540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  72%|███████▏  | 874/1208 [24:51<09:30,  1.71s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.049, train/loss_vlb_step=0.000176, train/loss_step=0.049, global_step=3540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  72%|███████▏  | 874/1208 [24:51<09:30,  1.71s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.0709, train/loss_vlb_step=0.000244, train/loss_step=0.0709, global_step=3540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  72%|███████▏  | 875/1208 [24:52<09:28,  1.71s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.0709, train/loss_vlb_step=0.000244, train/loss_step=0.0709, global_step=3540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  72%|███████▏  | 875/1208 [24:52<09:28,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00315, train/loss_step=0.423, global_step=3540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  73%|███████▎  | 876/1208 [24:56<09:26,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00315, train/loss_step=0.423, global_step=3540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  73%|███████▎  | 876/1208 [24:56<09:26,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=2.2e-5, train/loss_step=0.00392, global_step=3540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  73%|███████▎  | 877/1208 [24:57<09:25,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=2.2e-5, train/loss_step=0.00392, global_step=3540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  73%|███████▎  | 877/1208 [24:57<09:25,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000568, train/loss_step=0.171, global_step=3541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  73%|███████▎  | 878/1208 [24:58<09:23,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000568, train/loss_step=0.171, global_step=3541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  73%|███████▎  | 878/1208 [24:58<09:23,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00251, train/loss_step=0.392, global_step=3541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  73%|███████▎  | 879/1208 [24:59<09:21,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00251, train/loss_step=0.392, global_step=3541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  73%|███████▎  | 879/1208 [24:59<09:21,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00197, train/loss_step=0.354, global_step=3541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  73%|███████▎  | 880/1208 [25:02<09:20,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00197, train/loss_step=0.354, global_step=3541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  73%|███████▎  | 880/1208 [25:02<09:20,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.76e-5, train/loss_step=0.0032, global_step=3541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  73%|███████▎  | 881/1208 [25:03<09:18,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.76e-5, train/loss_step=0.0032, global_step=3541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  73%|███████▎  | 881/1208 [25:03<09:18,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00185, train/loss_step=0.328, global_step=3542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  73%|███████▎  | 882/1208 [25:04<09:16,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00185, train/loss_step=0.328, global_step=3542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  73%|███████▎  | 882/1208 [25:04<09:16,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00203, train/loss_step=0.348, global_step=3542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  73%|███████▎  | 883/1208 [25:05<09:14,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00203, train/loss_step=0.348, global_step=3542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  73%|███████▎  | 883/1208 [25:05<09:14,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=1.03e-5, train/loss_step=0.00171, global_step=3542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  73%|███████▎  | 884/1208 [25:08<09:13,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=1.03e-5, train/loss_step=0.00171, global_step=3542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  73%|███████▎  | 884/1208 [25:08<09:13,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000165, train/loss_step=0.0457, global_step=3542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  73%|███████▎  | 885/1208 [25:09<09:11,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000165, train/loss_step=0.0457, global_step=3542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  73%|███████▎  | 885/1208 [25:09<09:11,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.13e-5, train/loss_step=0.00194, global_step=3543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  73%|███████▎  | 886/1208 [25:11<09:09,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.13e-5, train/loss_step=0.00194, global_step=3543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  73%|███████▎  | 886/1208 [25:11<09:09,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.940, train/loss_vlb_step=0.237, train/loss_step=0.940, global_step=3543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]       Epoch 11:  73%|███████▎  | 887/1208 [25:12<09:07,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.940, train/loss_vlb_step=0.237, train/loss_step=0.940, global_step=3543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  73%|███████▎  | 887/1208 [25:12<09:07,  1.70s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0693, train/loss_vlb_step=0.000238, train/loss_step=0.0693, global_step=3543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  74%|███████▎  | 888/1208 [25:15<09:06,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0693, train/loss_vlb_step=0.000238, train/loss_step=0.0693, global_step=3543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  74%|███████▎  | 888/1208 [25:15<09:06,  1.71s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00974, train/loss_vlb_step=4.61e-5, train/loss_step=0.00974, global_step=3543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  74%|███████▎  | 889/1208 [25:16<09:04,  1.71s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00974, train/loss_vlb_step=4.61e-5, train/loss_step=0.00974, global_step=3543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  74%|███████▎  | 889/1208 [25:16<09:04,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00347, train/loss_step=0.409, global_step=3544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  74%|███████▎  | 890/1208 [25:17<09:02,  1.70s/it, loss=0.189, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00347, train/loss_step=0.409, global_step=3544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  74%|███████▎  | 890/1208 [25:17<09:02,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.34e-5, train/loss_step=0.0181, global_step=3544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  74%|███████▍  | 891/1208 [25:18<09:00,  1.70s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.34e-5, train/loss_step=0.0181, global_step=3544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  74%|███████▍  | 891/1208 [25:18<09:00,  1.70s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00821, train/loss_vlb_step=4.04e-5, train/loss_step=0.00821, global_step=3544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  74%|███████▍  | 892/1208 [25:21<08:59,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00821, train/loss_vlb_step=4.04e-5, train/loss_step=0.00821, global_step=3544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  74%|███████▍  | 892/1208 [25:21<08:59,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000487, train/loss_step=0.147, global_step=3544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  74%|███████▍  | 893/1208 [25:22<08:57,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000487, train/loss_step=0.147, global_step=3544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  74%|███████▍  | 893/1208 [25:22<08:57,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.00818, train/loss_vlb_step=4.04e-5, train/loss_step=0.00818, global_step=3545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  74%|███████▍  | 894/1208 [25:23<08:55,  1.70s/it, loss=0.188, v_num=0, train/loss_simple_step=0.00818, train/loss_vlb_step=4.04e-5, train/loss_step=0.00818, global_step=3545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  74%|███████▍  | 894/1208 [25:23<08:55,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00434, train/loss_vlb_step=2.27e-5, train/loss_step=0.00434, global_step=3545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  74%|███████▍  | 895/1208 [25:24<08:53,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00434, train/loss_vlb_step=2.27e-5, train/loss_step=0.00434, global_step=3545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  74%|███████▍  | 895/1208 [25:24<08:53,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000503, train/loss_step=0.149, global_step=3545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  74%|███████▍  | 896/1208 [25:28<08:52,  1.71s/it, loss=0.171, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000503, train/loss_step=0.149, global_step=3545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  74%|███████▍  | 896/1208 [25:28<08:52,  1.71s/it, loss=0.198, v_num=0, train/loss_simple_step=0.562, train/loss_vlb_step=0.0157, train/loss_step=0.562, global_step=3545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  74%|███████▍  | 897/1208 [25:29<08:50,  1.70s/it, loss=0.198, v_num=0, train/loss_simple_step=0.562, train/loss_vlb_step=0.0157, train/loss_step=0.562, global_step=3545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  74%|███████▍  | 897/1208 [25:29<08:50,  1.70s/it, loss=0.201, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000962, train/loss_step=0.224, global_step=3546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  74%|███████▍  | 898/1208 [25:30<08:48,  1.70s/it, loss=0.201, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000962, train/loss_step=0.224, global_step=3546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  74%|███████▍  | 898/1208 [25:30<08:48,  1.70s/it, loss=0.202, v_num=0, train/loss_simple_step=0.419, train/loss_vlb_step=0.00301, train/loss_step=0.419, global_step=3546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  74%|███████▍  | 899/1208 [25:31<08:46,  1.70s/it, loss=0.202, v_num=0, train/loss_simple_step=0.419, train/loss_vlb_step=0.00301, train/loss_step=0.419, global_step=3546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  74%|███████▍  | 899/1208 [25:31<08:46,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.06e-5, train/loss_step=0.00178, global_step=3546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  75%|███████▍  | 900/1208 [25:34<08:45,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.06e-5, train/loss_step=0.00178, global_step=3546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  75%|███████▍  | 900/1208 [25:34<08:45,  1.71s/it, loss=0.201, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00194, train/loss_step=0.321, global_step=3546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.76it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.76it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.80it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.75it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.79it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.76it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.76it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.76it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.76it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.80it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.76it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.75it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.75it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.77it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 11:  75%|███████▍  | 901/1208 [26:05<08:53,  1.74s/it, loss=0.201, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00194, train/loss_step=0.321, global_step=3546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  75%|███████▍  | 901/1208 [26:05<08:53,  1.74s/it, loss=0.191, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000449, train/loss_step=0.135, global_step=3547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  75%|███████▍  | 902/1208 [26:06<08:51,  1.74s/it, loss=0.191, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000449, train/loss_step=0.135, global_step=3547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  75%|███████▍  | 902/1208 [26:06<08:51,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000508, train/loss_step=0.150, global_step=3547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  75%|███████▍  | 903/1208 [26:07<08:49,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000508, train/loss_step=0.150, global_step=3547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  75%|███████▍  | 903/1208 [26:07<08:49,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00764, train/loss_vlb_step=3.78e-5, train/loss_step=0.00764, global_step=3547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  75%|███████▍  | 904/1208 [26:10<08:48,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00764, train/loss_vlb_step=3.78e-5, train/loss_step=0.00764, global_step=3547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  75%|███████▍  | 904/1208 [26:10<08:48,  1.74s/it, loss=0.192, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00101, train/loss_step=0.254, global_step=3547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  75%|███████▍  | 905/1208 [26:11<08:46,  1.74s/it, loss=0.192, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00101, train/loss_step=0.254, global_step=3547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  75%|███████▍  | 905/1208 [26:11<08:46,  1.74s/it, loss=0.21, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00253, train/loss_step=0.370, global_step=3548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  75%|███████▌  | 906/1208 [26:12<08:44,  1.74s/it, loss=0.21, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00253, train/loss_step=0.370, global_step=3548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  75%|███████▌  | 906/1208 [26:12<08:44,  1.74s/it, loss=0.178, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00191, train/loss_step=0.286, global_step=3548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  75%|███████▌  | 907/1208 [26:13<08:42,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00191, train/loss_step=0.286, global_step=3548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  75%|███████▌  | 907/1208 [26:13<08:42,  1.73s/it, loss=0.195, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00451, train/loss_step=0.414, global_step=3548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  75%|███████▌  | 908/1208 [26:16<08:41,  1.74s/it, loss=0.195, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00451, train/loss_step=0.414, global_step=3548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  75%|███████▌  | 908/1208 [26:16<08:41,  1.74s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=3.84e-5, train/loss_step=0.00783, global_step=3548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  75%|███████▌  | 909/1208 [26:17<08:39,  1.74s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=3.84e-5, train/loss_step=0.00783, global_step=3548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  75%|███████▌  | 909/1208 [26:17<08:39,  1.74s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00457, train/loss_vlb_step=2.38e-5, train/loss_step=0.00457, global_step=3549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  75%|███████▌  | 910/1208 [26:19<08:37,  1.74s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00457, train/loss_vlb_step=2.38e-5, train/loss_step=0.00457, global_step=3549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  75%|███████▌  | 910/1208 [26:19<08:37,  1.74s/it, loss=0.183, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.0007, train/loss_step=0.192, global_step=3549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]     Epoch 11:  75%|███████▌  | 911/1208 [26:20<08:35,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.0007, train/loss_step=0.192, global_step=3549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  75%|███████▌  | 911/1208 [26:20<08:35,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.58e-5, train/loss_step=0.0125, global_step=3549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  75%|███████▌  | 912/1208 [26:23<08:33,  1.74s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.58e-5, train/loss_step=0.0125, global_step=3549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  75%|███████▌  | 912/1208 [26:23<08:33,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0561, train/loss_vlb_step=0.000193, train/loss_step=0.0561, global_step=3549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  76%|███████▌  | 913/1208 [26:24<08:31,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0561, train/loss_vlb_step=0.000193, train/loss_step=0.0561, global_step=3549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  76%|███████▌  | 913/1208 [26:24<08:31,  1.74s/it, loss=0.196, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00192, train/loss_step=0.356, global_step=3550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  76%|███████▌  | 914/1208 [26:25<08:29,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00192, train/loss_step=0.356, global_step=3550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  76%|███████▌  | 914/1208 [26:25<08:29,  1.73s/it, loss=0.211, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00144, train/loss_step=0.307, global_step=3550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  76%|███████▌  | 915/1208 [26:26<08:28,  1.73s/it, loss=0.211, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00144, train/loss_step=0.307, global_step=3550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  76%|███████▌  | 915/1208 [26:26<08:28,  1.73s/it, loss=0.204, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.8e-5, train/loss_step=0.00319, global_step=3550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  76%|███████▌  | 916/1208 [26:29<08:26,  1.74s/it, loss=0.204, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.8e-5, train/loss_step=0.00319, global_step=3550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  76%|███████▌  | 916/1208 [26:29<08:26,  1.74s/it, loss=0.182, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000409, train/loss_step=0.124, global_step=3550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  76%|███████▌  | 917/1208 [26:30<08:24,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000409, train/loss_step=0.124, global_step=3550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  76%|███████▌  | 917/1208 [26:30<08:24,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0594, train/loss_vlb_step=0.000202, train/loss_step=0.0594, global_step=3551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  76%|███████▌  | 918/1208 [26:31<08:22,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0594, train/loss_vlb_step=0.000202, train/loss_step=0.0594, global_step=3551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  76%|███████▌  | 918/1208 [26:31<08:22,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0587, train/loss_vlb_step=0.000199, train/loss_step=0.0587, global_step=3551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  76%|███████▌  | 919/1208 [26:32<08:20,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0587, train/loss_vlb_step=0.000199, train/loss_step=0.0587, global_step=3551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  76%|███████▌  | 919/1208 [26:32<08:20,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.422, train/loss_vlb_step=0.00446, train/loss_step=0.422, global_step=3551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  76%|███████▌  | 920/1208 [26:36<08:19,  1.74s/it, loss=0.177, v_num=0, train/loss_simple_step=0.422, train/loss_vlb_step=0.00446, train/loss_step=0.422, global_step=3551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  76%|███████▌  | 920/1208 [26:36<08:19,  1.74s/it, loss=0.177, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00217, train/loss_step=0.327, global_step=3551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  76%|███████▌  | 921/1208 [26:37<08:17,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00217, train/loss_step=0.327, global_step=3551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  76%|███████▌  | 921/1208 [26:37<08:17,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0878, train/loss_vlb_step=0.000289, train/loss_step=0.0878, global_step=3552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  76%|███████▋  | 922/1208 [26:38<08:15,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0878, train/loss_vlb_step=0.000289, train/loss_step=0.0878, global_step=3552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  76%|███████▋  | 922/1208 [26:38<08:15,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00181, train/loss_step=0.319, global_step=3552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  76%|███████▋  | 923/1208 [26:39<08:13,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00181, train/loss_step=0.319, global_step=3552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  76%|███████▋  | 923/1208 [26:39<08:13,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=8.99e-6, train/loss_step=0.00148, global_step=3552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  76%|███████▋  | 924/1208 [26:42<08:12,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=8.99e-6, train/loss_step=0.00148, global_step=3552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  76%|███████▋  | 924/1208 [26:42<08:12,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000776, train/loss_step=0.202, global_step=3552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  77%|███████▋  | 925/1208 [26:43<08:10,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000776, train/loss_step=0.202, global_step=3552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  77%|███████▋  | 925/1208 [26:43<08:10,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00155, train/loss_step=0.306, global_step=3553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  77%|███████▋  | 926/1208 [26:44<08:08,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00155, train/loss_step=0.306, global_step=3553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  77%|███████▋  | 926/1208 [26:44<08:08,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000516, train/loss_step=0.151, global_step=3553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  77%|███████▋  | 927/1208 [26:45<08:06,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000516, train/loss_step=0.151, global_step=3553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  77%|███████▋  | 927/1208 [26:45<08:06,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000111, train/loss_step=0.029, global_step=3553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  77%|███████▋  | 928/1208 [26:49<08:05,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000111, train/loss_step=0.029, global_step=3553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  77%|███████▋  | 928/1208 [26:49<08:05,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.462, train/loss_vlb_step=0.00467, train/loss_step=0.462, global_step=3553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  77%|███████▋  | 929/1208 [26:50<08:03,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.462, train/loss_vlb_step=0.00467, train/loss_step=0.462, global_step=3553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  77%|███████▋  | 929/1208 [26:50<08:03,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00123, train/loss_step=0.300, global_step=3554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  77%|███████▋  | 930/1208 [26:51<08:01,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00123, train/loss_step=0.300, global_step=3554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  77%|███████▋  | 930/1208 [26:51<08:01,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00903, train/loss_vlb_step=4.28e-5, train/loss_step=0.00903, global_step=3554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  77%|███████▋  | 931/1208 [26:52<07:59,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00903, train/loss_vlb_step=4.28e-5, train/loss_step=0.00903, global_step=3554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  77%|███████▋  | 931/1208 [26:52<07:59,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.000151, train/loss_step=0.0418, global_step=3554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  77%|███████▋  | 932/1208 [26:55<07:58,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.000151, train/loss_step=0.0418, global_step=3554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  77%|███████▋  | 932/1208 [26:55<07:58,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0788, train/loss_vlb_step=0.000267, train/loss_step=0.0788, global_step=3554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  77%|███████▋  | 933/1208 [26:56<07:56,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0788, train/loss_vlb_step=0.000267, train/loss_step=0.0788, global_step=3554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  77%|███████▋  | 933/1208 [26:56<07:56,  1.73s/it, loss=0.187, v_num=0, train/loss_simple_step=0.446, train/loss_vlb_step=0.003, train/loss_step=0.446, global_step=3555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]     Epoch 11:  77%|███████▋  | 934/1208 [26:57<07:54,  1.73s/it, loss=0.187, v_num=0, train/loss_simple_step=0.446, train/loss_vlb_step=0.003, train/loss_step=0.446, global_step=3555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  77%|███████▋  | 934/1208 [26:57<07:54,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.000205, train/loss_step=0.0598, global_step=3555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  77%|███████▋  | 935/1208 [26:58<07:52,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.000205, train/loss_step=0.0598, global_step=3555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  77%|███████▋  | 935/1208 [26:58<07:52,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0691, train/loss_vlb_step=0.000233, train/loss_step=0.0691, global_step=3555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  77%|███████▋  | 936/1208 [27:01<07:51,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0691, train/loss_vlb_step=0.000233, train/loss_step=0.0691, global_step=3555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  77%|███████▋  | 936/1208 [27:01<07:51,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.49e-5, train/loss_step=0.010, global_step=3555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  78%|███████▊  | 937/1208 [27:02<07:49,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.49e-5, train/loss_step=0.010, global_step=3555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  78%|███████▊  | 937/1208 [27:02<07:49,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00282, train/loss_step=0.336, global_step=3556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  78%|███████▊  | 938/1208 [27:04<07:47,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00282, train/loss_step=0.336, global_step=3556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  78%|███████▊  | 938/1208 [27:04<07:47,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=3556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  78%|███████▊  | 939/1208 [27:05<07:45,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=3556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  78%|███████▊  | 939/1208 [27:05<07:45,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000663, train/loss_step=0.189, global_step=3556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  78%|███████▊  | 940/1208 [27:08<07:44,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000663, train/loss_step=0.189, global_step=3556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  78%|███████▊  | 940/1208 [27:08<07:44,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000425, train/loss_step=0.129, global_step=3556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  78%|███████▊  | 941/1208 [27:09<07:42,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000425, train/loss_step=0.129, global_step=3556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  78%|███████▊  | 941/1208 [27:09<07:42,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0705, train/loss_vlb_step=0.00024, train/loss_step=0.0705, global_step=3557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  78%|███████▊  | 942/1208 [27:10<07:40,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0705, train/loss_vlb_step=0.00024, train/loss_step=0.0705, global_step=3557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  78%|███████▊  | 942/1208 [27:10<07:40,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.422, train/loss_vlb_step=0.00317, train/loss_step=0.422, global_step=3557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  78%|███████▊  | 943/1208 [27:11<07:38,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.422, train/loss_vlb_step=0.00317, train/loss_step=0.422, global_step=3557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  78%|███████▊  | 943/1208 [27:11<07:38,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000168, train/loss_step=0.0463, global_step=3557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  78%|███████▊  | 944/1208 [27:14<07:37,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000168, train/loss_step=0.0463, global_step=3557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  78%|███████▊  | 944/1208 [27:14<07:37,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.00224, train/loss_step=0.360, global_step=3557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  78%|███████▊  | 945/1208 [27:15<07:35,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.00224, train/loss_step=0.360, global_step=3557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  78%|███████▊  | 945/1208 [27:15<07:35,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000444, train/loss_step=0.135, global_step=3558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  78%|███████▊  | 946/1208 [27:16<07:33,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000444, train/loss_step=0.135, global_step=3558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  78%|███████▊  | 946/1208 [27:16<07:33,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.14e-5, train/loss_step=0.00191, global_step=3558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  78%|███████▊  | 947/1208 [27:17<07:31,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.14e-5, train/loss_step=0.00191, global_step=3558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  78%|███████▊  | 947/1208 [27:17<07:31,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000494, train/loss_step=0.150, global_step=3558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  78%|███████▊  | 948/1208 [27:21<07:30,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000494, train/loss_step=0.150, global_step=3558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  78%|███████▊  | 948/1208 [27:21<07:30,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.88e-5, train/loss_step=0.0105, global_step=3558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  79%|███████▊  | 949/1208 [27:22<07:28,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.88e-5, train/loss_step=0.0105, global_step=3558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  79%|███████▊  | 949/1208 [27:22<07:28,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00226, train/loss_step=0.397, global_step=3559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  79%|███████▊  | 950/1208 [27:23<07:26,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00226, train/loss_step=0.397, global_step=3559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  79%|███████▊  | 950/1208 [27:23<07:26,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000896, train/loss_step=0.233, global_step=3559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  79%|███████▊  | 951/1208 [27:24<07:24,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000896, train/loss_step=0.233, global_step=3559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  79%|███████▊  | 951/1208 [27:24<07:24,  1.73s/it, loss=0.192, v_num=0, train/loss_simple_step=0.574, train/loss_vlb_step=0.00891, train/loss_step=0.574, global_step=3559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  79%|███████▉  | 952/1208 [27:27<07:23,  1.73s/it, loss=0.192, v_num=0, train/loss_simple_step=0.574, train/loss_vlb_step=0.00891, train/loss_step=0.574, global_step=3559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  79%|███████▉  | 952/1208 [27:27<07:23,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.7e-5, train/loss_step=0.0154, global_step=3559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  79%|███████▉  | 953/1208 [27:28<07:21,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.7e-5, train/loss_step=0.0154, global_step=3559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  79%|███████▉  | 953/1208 [27:28<07:21,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.7e-5, train/loss_step=0.00303, global_step=3560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  79%|███████▉  | 954/1208 [27:29<07:19,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.7e-5, train/loss_step=0.00303, global_step=3560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  79%|███████▉  | 954/1208 [27:29<07:19,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00289, train/loss_step=0.413, global_step=3560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  79%|███████▉  | 955/1208 [27:30<07:17,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00289, train/loss_step=0.413, global_step=3560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  79%|███████▉  | 955/1208 [27:30<07:17,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=1.14e-5, train/loss_step=0.00187, global_step=3560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  79%|███████▉  | 956/1208 [27:34<07:16,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=1.14e-5, train/loss_step=0.00187, global_step=3560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  79%|███████▉  | 956/1208 [27:34<07:16,  1.73s/it, loss=0.187, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000442, train/loss_step=0.132, global_step=3560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  79%|███████▉  | 957/1208 [27:35<07:14,  1.73s/it, loss=0.187, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000442, train/loss_step=0.132, global_step=3560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  79%|███████▉  | 957/1208 [27:35<07:14,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.000189, train/loss_step=0.0527, global_step=3561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  79%|███████▉  | 958/1208 [27:36<07:12,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.000189, train/loss_step=0.0527, global_step=3561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  79%|███████▉  | 958/1208 [27:36<07:12,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000112, train/loss_step=0.0283, global_step=3561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  79%|███████▉  | 959/1208 [27:37<07:10,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000112, train/loss_step=0.0283, global_step=3561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  79%|███████▉  | 959/1208 [27:37<07:10,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.000129, train/loss_step=0.0359, global_step=3561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  79%|███████▉  | 960/1208 [27:40<07:08,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.000129, train/loss_step=0.0359, global_step=3561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  79%|███████▉  | 960/1208 [27:40<07:08,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00517, train/loss_vlb_step=2.74e-5, train/loss_step=0.00517, global_step=3561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  80%|███████▉  | 961/1208 [27:41<07:07,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00517, train/loss_vlb_step=2.74e-5, train/loss_step=0.00517, global_step=3561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  80%|███████▉  | 961/1208 [27:41<07:07,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000345, train/loss_step=0.104, global_step=3562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  80%|███████▉  | 962/1208 [27:42<07:05,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000345, train/loss_step=0.104, global_step=3562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  80%|███████▉  | 962/1208 [27:42<07:05,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.00013, train/loss_step=0.0344, global_step=3562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  80%|███████▉  | 963/1208 [27:43<07:03,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.00013, train/loss_step=0.0344, global_step=3562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  80%|███████▉  | 963/1208 [27:43<07:03,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0595, train/loss_vlb_step=0.000207, train/loss_step=0.0595, global_step=3562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  80%|███████▉  | 964/1208 [27:46<07:01,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0595, train/loss_vlb_step=0.000207, train/loss_step=0.0595, global_step=3562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  80%|███████▉  | 964/1208 [27:46<07:01,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.558, train/loss_vlb_step=0.0113, train/loss_step=0.558, global_step=3562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  80%|███████▉  | 965/1208 [27:48<07:00,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.558, train/loss_vlb_step=0.0113, train/loss_step=0.558, global_step=3562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  80%|███████▉  | 965/1208 [27:48<07:00,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000772, train/loss_step=0.208, global_step=3563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  80%|███████▉  | 966/1208 [27:49<06:58,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000772, train/loss_step=0.208, global_step=3563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  80%|███████▉  | 966/1208 [27:49<06:58,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000435, train/loss_step=0.132, global_step=3563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  80%|████████  | 967/1208 [27:50<06:56,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000435, train/loss_step=0.132, global_step=3563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  80%|████████  | 967/1208 [27:50<06:56,  1.73s/it, loss=0.192, v_num=0, train/loss_simple_step=0.849, train/loss_vlb_step=0.108, train/loss_step=0.849, global_step=3563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  80%|████████  | 968/1208 [27:53<06:54,  1.73s/it, loss=0.192, v_num=0, train/loss_simple_step=0.849, train/loss_vlb_step=0.108, train/loss_step=0.849, global_step=3563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  80%|████████  | 968/1208 [27:53<06:54,  1.73s/it, loss=0.201, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000655, train/loss_step=0.183, global_step=3563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  80%|████████  | 969/1208 [27:54<06:53,  1.73s/it, loss=0.201, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000655, train/loss_step=0.183, global_step=3563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  80%|████████  | 969/1208 [27:54<06:53,  1.73s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0796, train/loss_vlb_step=0.000266, train/loss_step=0.0796, global_step=3564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  80%|████████  | 970/1208 [27:55<06:51,  1.73s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0796, train/loss_vlb_step=0.000266, train/loss_step=0.0796, global_step=3564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  80%|████████  | 970/1208 [27:55<06:51,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.00058, train/loss_step=0.167, global_step=3564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  80%|████████  | 971/1208 [27:56<06:49,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.00058, train/loss_step=0.167, global_step=3564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  80%|████████  | 971/1208 [27:56<06:49,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0788, train/loss_vlb_step=0.000265, train/loss_step=0.0788, global_step=3564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  80%|████████  | 972/1208 [27:59<06:47,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0788, train/loss_vlb_step=0.000265, train/loss_step=0.0788, global_step=3564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  80%|████████  | 972/1208 [27:59<06:47,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.97e-5, train/loss_step=0.0107, global_step=3564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  81%|████████  | 973/1208 [28:00<06:45,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.97e-5, train/loss_step=0.0107, global_step=3564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  81%|████████  | 973/1208 [28:00<06:45,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.73e-5, train/loss_step=0.0184, global_step=3565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  81%|████████  | 974/1208 [28:01<06:44,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.73e-5, train/loss_step=0.0184, global_step=3565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  81%|████████  | 974/1208 [28:01<06:44,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000632, train/loss_step=0.174, global_step=3565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  81%|████████  | 975/1208 [28:02<06:42,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000632, train/loss_step=0.174, global_step=3565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  81%|████████  | 975/1208 [28:02<06:42,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=2.52e-5, train/loss_step=0.00462, global_step=3565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  81%|████████  | 976/1208 [28:06<06:40,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=2.52e-5, train/loss_step=0.00462, global_step=3565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  81%|████████  | 976/1208 [28:06<06:40,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00633, train/loss_vlb_step=3.16e-5, train/loss_step=0.00633, global_step=3565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  81%|████████  | 977/1208 [28:07<06:38,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00633, train/loss_vlb_step=3.16e-5, train/loss_step=0.00633, global_step=3565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  81%|████████  | 977/1208 [28:07<06:38,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=1.43e-5, train/loss_step=0.00239, global_step=3566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  81%|████████  | 978/1208 [28:08<06:37,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=1.43e-5, train/loss_step=0.00239, global_step=3566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  81%|████████  | 978/1208 [28:08<06:37,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0735, train/loss_vlb_step=0.000245, train/loss_step=0.0735, global_step=3566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  81%|████████  | 979/1208 [28:09<06:35,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0735, train/loss_vlb_step=0.000245, train/loss_step=0.0735, global_step=3566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  81%|████████  | 979/1208 [28:09<06:35,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.925, train/loss_vlb_step=0.466, train/loss_step=0.925, global_step=3566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]     Epoch 11:  81%|████████  | 980/1208 [28:12<06:33,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.925, train/loss_vlb_step=0.466, train/loss_step=0.925, global_step=3566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  81%|████████  | 980/1208 [28:12<06:33,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.96e-5, train/loss_step=0.0106, global_step=3566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  81%|████████  | 981/1208 [28:13<06:31,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.96e-5, train/loss_step=0.0106, global_step=3566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  81%|████████  | 981/1208 [28:13<06:31,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0907, train/loss_vlb_step=0.000302, train/loss_step=0.0907, global_step=3567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  81%|████████▏ | 982/1208 [28:14<06:30,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0907, train/loss_vlb_step=0.000302, train/loss_step=0.0907, global_step=3567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  81%|████████▏ | 982/1208 [28:14<06:30,  1.73s/it, loss=0.19, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000584, train/loss_step=0.169, global_step=3567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  81%|████████▏ | 983/1208 [28:15<06:28,  1.73s/it, loss=0.19, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000584, train/loss_step=0.169, global_step=3567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  81%|████████▏ | 983/1208 [28:15<06:28,  1.73s/it, loss=0.197, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000788, train/loss_step=0.188, global_step=3567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  81%|████████▏ | 984/1208 [28:19<06:26,  1.73s/it, loss=0.197, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000788, train/loss_step=0.188, global_step=3567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  81%|████████▏ | 984/1208 [28:19<06:26,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00606, train/loss_vlb_step=2.94e-5, train/loss_step=0.00606, global_step=3567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  82%|████████▏ | 985/1208 [28:20<06:24,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00606, train/loss_vlb_step=2.94e-5, train/loss_step=0.00606, global_step=3567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  82%|████████▏ | 985/1208 [28:20<06:24,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00152, train/loss_step=0.317, global_step=3568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  82%|████████▏ | 986/1208 [28:21<06:23,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00152, train/loss_step=0.317, global_step=3568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  82%|████████▏ | 986/1208 [28:21<06:23,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.41e-5, train/loss_step=0.0181, global_step=3568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  82%|████████▏ | 987/1208 [28:22<06:21,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.41e-5, train/loss_step=0.0181, global_step=3568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  82%|████████▏ | 987/1208 [28:22<06:21,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=8.04e-5, train/loss_step=0.0182, global_step=3568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  82%|████████▏ | 988/1208 [28:25<06:19,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=8.04e-5, train/loss_step=0.0182, global_step=3568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  82%|████████▏ | 988/1208 [28:25<06:19,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=3568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  82%|████████▏ | 989/1208 [28:26<06:17,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=3568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  82%|████████▏ | 989/1208 [28:26<06:17,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.58e-5, train/loss_step=0.0127, global_step=3569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  82%|████████▏ | 990/1208 [28:27<06:16,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.58e-5, train/loss_step=0.0127, global_step=3569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  82%|████████▏ | 990/1208 [28:27<06:16,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00336, train/loss_step=0.393, global_step=3569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  82%|████████▏ | 991/1208 [28:28<06:14,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00336, train/loss_step=0.393, global_step=3569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  82%|████████▏ | 991/1208 [28:28<06:14,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000776, train/loss_step=0.226, global_step=3569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  82%|████████▏ | 992/1208 [28:31<06:12,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000776, train/loss_step=0.226, global_step=3569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  82%|████████▏ | 992/1208 [28:31<06:12,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0988, train/loss_vlb_step=0.000326, train/loss_step=0.0988, global_step=3569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  82%|████████▏ | 993/1208 [28:32<06:10,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0988, train/loss_vlb_step=0.000326, train/loss_step=0.0988, global_step=3569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  82%|████████▏ | 993/1208 [28:32<06:10,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0971, train/loss_vlb_step=0.00032, train/loss_step=0.0971, global_step=3570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  82%|████████▏ | 994/1208 [28:34<06:09,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0971, train/loss_vlb_step=0.00032, train/loss_step=0.0971, global_step=3570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  82%|████████▏ | 994/1208 [28:34<06:09,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.46e-5, train/loss_step=0.00261, global_step=3570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  82%|████████▏ | 995/1208 [28:35<06:07,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.46e-5, train/loss_step=0.00261, global_step=3570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  82%|████████▏ | 995/1208 [28:35<06:07,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=3570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  82%|████████▏ | 996/1208 [28:38<06:05,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=3570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  82%|████████▏ | 996/1208 [28:38<06:05,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000544, train/loss_step=0.160, global_step=3570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  83%|████████▎ | 997/1208 [28:39<06:03,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000544, train/loss_step=0.160, global_step=3570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  83%|████████▎ | 997/1208 [28:39<06:03,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.000119, train/loss_step=0.032, global_step=3571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  83%|████████▎ | 998/1208 [28:40<06:02,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.000119, train/loss_step=0.032, global_step=3571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  83%|████████▎ | 998/1208 [28:40<06:02,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000953, train/loss_step=0.242, global_step=3571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  83%|████████▎ | 999/1208 [28:41<06:00,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000953, train/loss_step=0.242, global_step=3571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  83%|████████▎ | 999/1208 [28:41<06:00,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.000114, train/loss_step=0.0276, global_step=3571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  83%|████████▎ | 1000/1208 [28:44<05:58,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.000114, train/loss_step=0.0276, global_step=3571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  83%|████████▎ | 1000/1208 [28:44<05:58,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000543, train/loss_step=0.161, global_step=3571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  83%|████████▎ | 1001/1208 [28:45<05:56,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000543, train/loss_step=0.161, global_step=3571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  83%|████████▎ | 1001/1208 [28:45<05:56,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.7e-5, train/loss_step=0.0216, global_step=3572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  83%|████████▎ | 1002/1208 [28:46<05:55,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.7e-5, train/loss_step=0.0216, global_step=3572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  83%|████████▎ | 1002/1208 [28:46<05:55,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0818, train/loss_vlb_step=0.000278, train/loss_step=0.0818, global_step=3572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  83%|████████▎ | 1003/1208 [28:47<05:53,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0818, train/loss_vlb_step=0.000278, train/loss_step=0.0818, global_step=3572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  83%|████████▎ | 1003/1208 [28:47<05:53,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000504, train/loss_step=0.150, global_step=3572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  83%|████████▎ | 1004/1208 [28:51<05:51,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000504, train/loss_step=0.150, global_step=3572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  83%|████████▎ | 1004/1208 [28:51<05:51,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.83e-5, train/loss_step=0.0227, global_step=3572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  83%|████████▎ | 1005/1208 [28:52<05:49,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.83e-5, train/loss_step=0.0227, global_step=3572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  83%|████████▎ | 1005/1208 [28:52<05:49,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000633, train/loss_step=0.179, global_step=3573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  83%|████████▎ | 1006/1208 [28:53<05:48,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000633, train/loss_step=0.179, global_step=3573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  83%|████████▎ | 1006/1208 [28:53<05:48,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=1.21e-5, train/loss_step=0.00201, global_step=3573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  83%|████████▎ | 1007/1208 [28:54<05:46,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=1.21e-5, train/loss_step=0.00201, global_step=3573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  83%|████████▎ | 1007/1208 [28:54<05:46,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000463, train/loss_step=0.141, global_step=3573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  83%|████████▎ | 1008/1208 [28:57<05:44,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000463, train/loss_step=0.141, global_step=3573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  83%|████████▎ | 1008/1208 [28:57<05:44,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00162, train/loss_step=0.328, global_step=3573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  84%|████████▎ | 1009/1208 [28:58<05:42,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00162, train/loss_step=0.328, global_step=3573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  84%|████████▎ | 1009/1208 [28:58<05:42,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0809, train/loss_vlb_step=0.000269, train/loss_step=0.0809, global_step=3574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  84%|████████▎ | 1010/1208 [28:59<05:41,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0809, train/loss_vlb_step=0.000269, train/loss_step=0.0809, global_step=3574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  84%|████████▎ | 1010/1208 [28:59<05:41,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.444, train/loss_vlb_step=0.00403, train/loss_step=0.444, global_step=3574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  84%|████████▎ | 1011/1208 [29:00<05:39,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.444, train/loss_vlb_step=0.00403, train/loss_step=0.444, global_step=3574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  84%|████████▎ | 1011/1208 [29:00<05:39,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000701, train/loss_step=0.198, global_step=3574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  84%|████████▍ | 1012/1208 [29:04<05:37,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000701, train/loss_step=0.198, global_step=3574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  84%|████████▍ | 1012/1208 [29:04<05:37,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=8.2e-5, train/loss_step=0.0192, global_step=3574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  84%|████████▍ | 1013/1208 [29:05<05:35,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=8.2e-5, train/loss_step=0.0192, global_step=3574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  84%|████████▍ | 1013/1208 [29:05<05:35,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00466, train/loss_vlb_step=2.52e-5, train/loss_step=0.00466, global_step=3575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  84%|████████▍ | 1014/1208 [29:06<05:34,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00466, train/loss_vlb_step=2.52e-5, train/loss_step=0.00466, global_step=3575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  84%|████████▍ | 1014/1208 [29:06<05:34,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.23e-5, train/loss_step=0.0196, global_step=3575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  84%|████████▍ | 1015/1208 [29:07<05:32,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.23e-5, train/loss_step=0.0196, global_step=3575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  84%|████████▍ | 1015/1208 [29:07<05:32,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0611, train/loss_vlb_step=0.00021, train/loss_step=0.0611, global_step=3575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  84%|████████▍ | 1016/1208 [29:10<05:30,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0611, train/loss_vlb_step=0.00021, train/loss_step=0.0611, global_step=3575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  84%|████████▍ | 1016/1208 [29:10<05:30,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.00043, train/loss_step=0.130, global_step=3575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  84%|████████▍ | 1017/1208 [29:11<05:28,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.00043, train/loss_step=0.130, global_step=3575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  84%|████████▍ | 1017/1208 [29:11<05:28,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000536, train/loss_step=0.160, global_step=3576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  84%|████████▍ | 1018/1208 [29:12<05:27,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000536, train/loss_step=0.160, global_step=3576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  84%|████████▍ | 1018/1208 [29:12<05:27,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000528, train/loss_step=0.159, global_step=3576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  84%|████████▍ | 1019/1208 [29:13<05:25,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000528, train/loss_step=0.159, global_step=3576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  84%|████████▍ | 1019/1208 [29:13<05:25,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.32e-5, train/loss_step=0.017, global_step=3576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  84%|████████▍ | 1020/1208 [29:16<05:23,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.32e-5, train/loss_step=0.017, global_step=3576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  84%|████████▍ | 1020/1208 [29:16<05:23,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.00071, train/loss_step=0.191, global_step=3576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  85%|████████▍ | 1021/1208 [29:17<05:21,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.00071, train/loss_step=0.191, global_step=3576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  85%|████████▍ | 1021/1208 [29:17<05:21,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=1.51e-5, train/loss_step=0.00258, global_step=3577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  85%|████████▍ | 1022/1208 [29:18<05:20,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=1.51e-5, train/loss_step=0.00258, global_step=3577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  85%|████████▍ | 1022/1208 [29:18<05:20,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000601, train/loss_step=0.172, global_step=3577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  85%|████████▍ | 1023/1208 [29:20<05:18,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000601, train/loss_step=0.172, global_step=3577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  85%|████████▍ | 1023/1208 [29:20<05:18,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00149, train/loss_step=0.280, global_step=3577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  85%|████████▍ | 1024/1208 [29:23<05:16,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00149, train/loss_step=0.280, global_step=3577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  85%|████████▍ | 1024/1208 [29:23<05:16,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.72e-5, train/loss_step=0.015, global_step=3577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  85%|████████▍ | 1025/1208 [29:24<05:15,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.72e-5, train/loss_step=0.015, global_step=3577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  85%|████████▍ | 1025/1208 [29:24<05:15,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.509, train/loss_vlb_step=0.00994, train/loss_step=0.509, global_step=3578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  85%|████████▍ | 1026/1208 [29:25<05:13,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.509, train/loss_vlb_step=0.00994, train/loss_step=0.509, global_step=3578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  85%|████████▍ | 1026/1208 [29:25<05:13,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000673, train/loss_step=0.196, global_step=3578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  85%|████████▌ | 1027/1208 [29:26<05:11,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000673, train/loss_step=0.196, global_step=3578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  85%|████████▌ | 1027/1208 [29:26<05:11,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000432, train/loss_step=0.130, global_step=3578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  85%|████████▌ | 1028/1208 [29:29<05:09,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000432, train/loss_step=0.130, global_step=3578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  85%|████████▌ | 1028/1208 [29:29<05:09,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.81e-5, train/loss_step=0.0105, global_step=3578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  85%|████████▌ | 1029/1208 [29:30<05:08,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.81e-5, train/loss_step=0.0105, global_step=3578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  85%|████████▌ | 1029/1208 [29:30<05:08,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00172, train/loss_step=0.294, global_step=3579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  85%|████████▌ | 1030/1208 [29:31<05:06,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00172, train/loss_step=0.294, global_step=3579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  85%|████████▌ | 1030/1208 [29:31<05:06,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00489, train/loss_vlb_step=2.56e-5, train/loss_step=0.00489, global_step=3579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  85%|████████▌ | 1031/1208 [29:32<05:04,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00489, train/loss_vlb_step=2.56e-5, train/loss_step=0.00489, global_step=3579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  85%|████████▌ | 1031/1208 [29:32<05:04,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.710, train/loss_vlb_step=0.019, train/loss_step=0.710, global_step=3579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]      Epoch 11:  85%|████████▌ | 1032/1208 [29:36<05:02,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.710, train/loss_vlb_step=0.019, train/loss_step=0.710, global_step=3579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  85%|████████▌ | 1032/1208 [29:36<05:02,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0831, train/loss_vlb_step=0.000275, train/loss_step=0.0831, global_step=3579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  86%|████████▌ | 1033/1208 [29:37<05:01,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0831, train/loss_vlb_step=0.000275, train/loss_step=0.0831, global_step=3579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  86%|████████▌ | 1033/1208 [29:37<05:01,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=9.34e-5, train/loss_step=0.0218, global_step=3580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  86%|████████▌ | 1034/1208 [29:38<04:59,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=9.34e-5, train/loss_step=0.0218, global_step=3580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  86%|████████▌ | 1034/1208 [29:38<04:59,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00139, train/loss_step=0.326, global_step=3580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  86%|████████▌ | 1035/1208 [29:39<04:57,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00139, train/loss_step=0.326, global_step=3580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  86%|████████▌ | 1035/1208 [29:39<04:57,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00928, train/loss_vlb_step=4.4e-5, train/loss_step=0.00928, global_step=3580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  86%|████████▌ | 1036/1208 [29:42<04:55,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00928, train/loss_vlb_step=4.4e-5, train/loss_step=0.00928, global_step=3580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  86%|████████▌ | 1036/1208 [29:42<04:55,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=7.96e-5, train/loss_step=0.0197, global_step=3580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  86%|████████▌ | 1037/1208 [29:43<04:54,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=7.96e-5, train/loss_step=0.0197, global_step=3580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  86%|████████▌ | 1037/1208 [29:43<04:54,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.0025, train/loss_step=0.377, global_step=3581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  86%|████████▌ | 1038/1208 [29:44<04:52,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.0025, train/loss_step=0.377, global_step=3581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  86%|████████▌ | 1038/1208 [29:44<04:52,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0389, train/loss_vlb_step=0.000144, train/loss_step=0.0389, global_step=3581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  86%|████████▌ | 1039/1208 [29:45<04:50,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0389, train/loss_vlb_step=0.000144, train/loss_step=0.0389, global_step=3581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  86%|████████▌ | 1039/1208 [29:45<04:50,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.36e-5, train/loss_step=0.0199, global_step=3581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  86%|████████▌ | 1040/1208 [29:48<04:48,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.36e-5, train/loss_step=0.0199, global_step=3581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  86%|████████▌ | 1040/1208 [29:48<04:48,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.2e-5, train/loss_step=0.002, global_step=3581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  86%|████████▌ | 1041/1208 [29:49<04:47,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.2e-5, train/loss_step=0.002, global_step=3581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  86%|████████▌ | 1041/1208 [29:49<04:47,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0507, train/loss_vlb_step=0.000176, train/loss_step=0.0507, global_step=3582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  86%|████████▋ | 1042/1208 [29:50<04:45,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0507, train/loss_vlb_step=0.000176, train/loss_step=0.0507, global_step=3582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  86%|████████▋ | 1042/1208 [29:50<04:45,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0404, train/loss_vlb_step=0.000153, train/loss_step=0.0404, global_step=3582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  86%|████████▋ | 1043/1208 [29:52<04:43,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0404, train/loss_vlb_step=0.000153, train/loss_step=0.0404, global_step=3582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  86%|████████▋ | 1043/1208 [29:52<04:43,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.74e-5, train/loss_step=0.0134, global_step=3582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  86%|████████▋ | 1044/1208 [29:55<04:42,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.74e-5, train/loss_step=0.0134, global_step=3582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  86%|████████▋ | 1044/1208 [29:55<04:42,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.054, train/loss_vlb_step=0.000183, train/loss_step=0.054, global_step=3582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  87%|████████▋ | 1045/1208 [29:56<04:40,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.054, train/loss_vlb_step=0.000183, train/loss_step=0.054, global_step=3582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  87%|████████▋ | 1045/1208 [29:56<04:40,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.47e-5, train/loss_step=0.0166, global_step=3583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  87%|████████▋ | 1046/1208 [29:57<04:38,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.47e-5, train/loss_step=0.0166, global_step=3583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  87%|████████▋ | 1046/1208 [29:57<04:38,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0892, train/loss_vlb_step=0.000299, train/loss_step=0.0892, global_step=3583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  87%|████████▋ | 1047/1208 [29:58<04:36,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0892, train/loss_vlb_step=0.000299, train/loss_step=0.0892, global_step=3583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  87%|████████▋ | 1047/1208 [29:58<04:36,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00264, train/loss_vlb_step=1.55e-5, train/loss_step=0.00264, global_step=3583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  87%|████████▋ | 1048/1208 [30:01<04:35,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00264, train/loss_vlb_step=1.55e-5, train/loss_step=0.00264, global_step=3583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  87%|████████▋ | 1048/1208 [30:01<04:35,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00787, train/loss_vlb_step=3.76e-5, train/loss_step=0.00787, global_step=3583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  87%|████████▋ | 1049/1208 [30:02<04:33,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00787, train/loss_vlb_step=3.76e-5, train/loss_step=0.00787, global_step=3583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  87%|████████▋ | 1049/1208 [30:02<04:33,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00272, train/loss_step=0.388, global_step=3584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  87%|████████▋ | 1050/1208 [30:03<04:31,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00272, train/loss_step=0.388, global_step=3584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  87%|████████▋ | 1050/1208 [30:03<04:31,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.36e-5, train/loss_step=0.020, global_step=3584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  87%|████████▋ | 1051/1208 [30:04<04:29,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.36e-5, train/loss_step=0.020, global_step=3584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  87%|████████▋ | 1051/1208 [30:04<04:29,  1.72s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000605, train/loss_step=0.174, global_step=3584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  87%|████████▋ | 1052/1208 [30:08<04:28,  1.72s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000605, train/loss_step=0.174, global_step=3584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  87%|████████▋ | 1052/1208 [30:08<04:28,  1.72s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=1.98e-5, train/loss_step=0.00356, global_step=3584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  87%|████████▋ | 1053/1208 [30:09<04:26,  1.72s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=1.98e-5, train/loss_step=0.00356, global_step=3584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  87%|████████▋ | 1053/1208 [30:09<04:26,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00221, train/loss_step=0.365, global_step=3585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]     Epoch 11:  87%|████████▋ | 1054/1208 [30:10<04:24,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00221, train/loss_step=0.365, global_step=3585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  87%|████████▋ | 1054/1208 [30:10<04:24,  1.72s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.16e-5, train/loss_step=0.011, global_step=3585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  87%|████████▋ | 1055/1208 [30:11<04:22,  1.72s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.16e-5, train/loss_step=0.011, global_step=3585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  87%|████████▋ | 1055/1208 [30:11<04:22,  1.72s/it, loss=0.0856, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.83e-5, train/loss_step=0.0184, global_step=3585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  87%|████████▋ | 1056/1208 [30:14<04:21,  1.72s/it, loss=0.0856, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.83e-5, train/loss_step=0.0184, global_step=3585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  87%|████████▋ | 1056/1208 [30:14<04:21,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00198, train/loss_step=0.383, global_step=3585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  88%|████████▊ | 1057/1208 [30:15<04:19,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00198, train/loss_step=0.383, global_step=3585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  88%|████████▊ | 1057/1208 [30:15<04:19,  1.72s/it, loss=0.0993, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00145, train/loss_step=0.287, global_step=3586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  88%|████████▊ | 1058/1208 [30:16<04:17,  1.72s/it, loss=0.0993, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00145, train/loss_step=0.287, global_step=3586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  88%|████████▊ | 1058/1208 [30:16<04:17,  1.72s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.69e-5, train/loss_step=0.0103, global_step=3586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  88%|████████▊ | 1059/1208 [30:17<04:15,  1.72s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.69e-5, train/loss_step=0.0103, global_step=3586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  88%|████████▊ | 1059/1208 [30:17<04:15,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000363, train/loss_step=0.110, global_step=3586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  88%|████████▊ | 1060/1208 [30:21<04:14,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000363, train/loss_step=0.110, global_step=3586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  88%|████████▊ | 1060/1208 [30:21<04:14,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00269, train/loss_step=0.372, global_step=3586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  88%|████████▊ | 1061/1208 [30:22<04:12,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00269, train/loss_step=0.372, global_step=3586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  88%|████████▊ | 1061/1208 [30:22<04:12,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0701, train/loss_vlb_step=0.000237, train/loss_step=0.0701, global_step=3587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  88%|████████▊ | 1062/1208 [30:23<04:10,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0701, train/loss_vlb_step=0.000237, train/loss_step=0.0701, global_step=3587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  88%|████████▊ | 1062/1208 [30:23<04:10,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0773, train/loss_vlb_step=0.000255, train/loss_step=0.0773, global_step=3587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  88%|████████▊ | 1063/1208 [30:24<04:08,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0773, train/loss_vlb_step=0.000255, train/loss_step=0.0773, global_step=3587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  88%|████████▊ | 1063/1208 [30:24<04:08,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0871, train/loss_vlb_step=0.000294, train/loss_step=0.0871, global_step=3587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  88%|████████▊ | 1064/1208 [30:27<04:07,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0871, train/loss_vlb_step=0.000294, train/loss_step=0.0871, global_step=3587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  88%|████████▊ | 1064/1208 [30:27<04:07,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000393, train/loss_step=0.119, global_step=3587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  88%|████████▊ | 1065/1208 [30:28<04:05,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000393, train/loss_step=0.119, global_step=3587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  88%|████████▊ | 1065/1208 [30:28<04:05,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=3588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  88%|████████▊ | 1066/1208 [30:29<04:03,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=3588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  88%|████████▊ | 1066/1208 [30:29<04:03,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000874, train/loss_step=0.233, global_step=3588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  88%|████████▊ | 1067/1208 [30:30<04:01,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000874, train/loss_step=0.233, global_step=3588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  88%|████████▊ | 1067/1208 [30:30<04:01,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000337, train/loss_step=0.102, global_step=3588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  88%|████████▊ | 1068/1208 [30:33<04:00,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000337, train/loss_step=0.102, global_step=3588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  88%|████████▊ | 1068/1208 [30:33<04:00,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.00037, train/loss_step=0.113, global_step=3588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  88%|████████▊ | 1069/1208 [30:35<03:58,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.00037, train/loss_step=0.113, global_step=3588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  88%|████████▊ | 1069/1208 [30:35<03:58,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=1.34e-5, train/loss_step=0.00223, global_step=3589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  89%|████████▊ | 1070/1208 [30:36<03:56,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=1.34e-5, train/loss_step=0.00223, global_step=3589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  89%|████████▊ | 1070/1208 [30:36<03:56,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00987, train/loss_vlb_step=4.74e-5, train/loss_step=0.00987, global_step=3589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  89%|████████▊ | 1071/1208 [30:37<03:54,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00987, train/loss_vlb_step=4.74e-5, train/loss_step=0.00987, global_step=3589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  89%|████████▊ | 1071/1208 [30:37<03:54,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000987, train/loss_step=0.234, global_step=3589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  89%|████████▊ | 1072/1208 [30:40<03:53,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000987, train/loss_step=0.234, global_step=3589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  89%|████████▊ | 1072/1208 [30:40<03:53,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=3.83e-5, train/loss_step=0.00783, global_step=3589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  89%|████████▉ | 1073/1208 [30:41<03:51,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=3.83e-5, train/loss_step=0.00783, global_step=3589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  89%|████████▉ | 1073/1208 [30:41<03:51,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0947, train/loss_vlb_step=0.000313, train/loss_step=0.0947, global_step=3590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  89%|████████▉ | 1074/1208 [30:42<03:49,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0947, train/loss_vlb_step=0.000313, train/loss_step=0.0947, global_step=3590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  89%|████████▉ | 1074/1208 [30:42<03:49,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=8.45e-6, train/loss_step=0.00139, global_step=3590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  89%|████████▉ | 1075/1208 [30:43<03:48,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=8.45e-6, train/loss_step=0.00139, global_step=3590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  89%|████████▉ | 1075/1208 [30:43<03:48,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0816, train/loss_vlb_step=0.000275, train/loss_step=0.0816, global_step=3590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  89%|████████▉ | 1076/1208 [30:46<03:46,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0816, train/loss_vlb_step=0.000275, train/loss_step=0.0816, global_step=3590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  89%|████████▉ | 1076/1208 [30:46<03:46,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000414, train/loss_step=0.125, global_step=3590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  89%|████████▉ | 1077/1208 [30:47<03:44,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000414, train/loss_step=0.125, global_step=3590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  89%|████████▉ | 1077/1208 [30:47<03:44,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0642, train/loss_vlb_step=0.00022, train/loss_step=0.0642, global_step=3591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  89%|████████▉ | 1078/1208 [30:48<03:42,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0642, train/loss_vlb_step=0.00022, train/loss_step=0.0642, global_step=3591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  89%|████████▉ | 1078/1208 [30:48<03:42,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.61e-5, train/loss_step=0.0156, global_step=3591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  89%|████████▉ | 1079/1208 [30:49<03:41,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.61e-5, train/loss_step=0.0156, global_step=3591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  89%|████████▉ | 1079/1208 [30:49<03:41,  1.71s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000126, train/loss_step=0.0335, global_step=3591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  89%|████████▉ | 1080/1208 [30:53<03:39,  1.72s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000126, train/loss_step=0.0335, global_step=3591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  89%|████████▉ | 1080/1208 [30:53<03:39,  1.72s/it, loss=0.0917, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00104, train/loss_step=0.243, global_step=3591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  89%|████████▉ | 1081/1208 [30:54<03:37,  1.72s/it, loss=0.0917, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00104, train/loss_step=0.243, global_step=3591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  89%|████████▉ | 1081/1208 [30:54<03:37,  1.72s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=3592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  90%|████████▉ | 1082/1208 [30:55<03:36,  1.71s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=3592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  90%|████████▉ | 1082/1208 [30:55<03:36,  1.71s/it, loss=0.0907, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.46e-5, train/loss_step=0.0163, global_step=3592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  90%|████████▉ | 1083/1208 [30:56<03:34,  1.71s/it, loss=0.0907, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.46e-5, train/loss_step=0.0163, global_step=3592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  90%|████████▉ | 1083/1208 [30:56<03:34,  1.71s/it, loss=0.0869, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.6e-5, train/loss_step=0.0125, global_step=3592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  90%|████████▉ | 1084/1208 [30:59<03:32,  1.72s/it, loss=0.0869, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.6e-5, train/loss_step=0.0125, global_step=3592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  90%|████████▉ | 1084/1208 [30:59<03:32,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.477, train/loss_vlb_step=0.0066, train/loss_step=0.477, global_step=3592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  90%|████████▉ | 1085/1208 [31:00<03:30,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.477, train/loss_vlb_step=0.0066, train/loss_step=0.477, global_step=3592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  90%|████████▉ | 1085/1208 [31:00<03:30,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.466, train/loss_vlb_step=0.00464, train/loss_step=0.466, global_step=3593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  90%|████████▉ | 1086/1208 [31:01<03:29,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.466, train/loss_vlb_step=0.00464, train/loss_step=0.466, global_step=3593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  90%|████████▉ | 1086/1208 [31:01<03:29,  1.71s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.14e-5, train/loss_step=0.0147, global_step=3593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  90%|████████▉ | 1087/1208 [31:02<03:27,  1.71s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.14e-5, train/loss_step=0.0147, global_step=3593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  90%|████████▉ | 1087/1208 [31:02<03:27,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.00069, train/loss_step=0.191, global_step=3593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  90%|█████████ | 1088/1208 [31:05<03:25,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.00069, train/loss_step=0.191, global_step=3593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  90%|█████████ | 1088/1208 [31:05<03:25,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.00049, train/loss_step=0.146, global_step=3593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  90%|█████████ | 1089/1208 [31:07<03:24,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.00049, train/loss_step=0.146, global_step=3593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  90%|█████████ | 1089/1208 [31:07<03:24,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000839, train/loss_step=0.220, global_step=3594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  90%|█████████ | 1090/1208 [31:08<03:22,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000839, train/loss_step=0.220, global_step=3594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  90%|█████████ | 1090/1208 [31:08<03:22,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.554, train/loss_vlb_step=0.00985, train/loss_step=0.554, global_step=3594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  90%|█████████ | 1091/1208 [31:09<03:20,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.554, train/loss_vlb_step=0.00985, train/loss_step=0.554, global_step=3594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  90%|█████████ | 1091/1208 [31:09<03:20,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000117, train/loss_step=0.0286, global_step=3594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  90%|█████████ | 1092/1208 [31:12<03:18,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000117, train/loss_step=0.0286, global_step=3594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  90%|█████████ | 1092/1208 [31:12<03:18,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.0018, train/loss_step=0.308, global_step=3594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]     Epoch 11:  90%|█████████ | 1093/1208 [31:13<03:17,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.0018, train/loss_step=0.308, global_step=3594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  90%|█████████ | 1093/1208 [31:13<03:17,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0535, train/loss_vlb_step=0.000186, train/loss_step=0.0535, global_step=3595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  91%|█████████ | 1094/1208 [31:14<03:15,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0535, train/loss_vlb_step=0.000186, train/loss_step=0.0535, global_step=3595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  91%|█████████ | 1094/1208 [31:14<03:15,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00207, train/loss_step=0.354, global_step=3595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  91%|█████████ | 1095/1208 [31:15<03:13,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00207, train/loss_step=0.354, global_step=3595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  91%|█████████ | 1095/1208 [31:15<03:13,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00203, train/loss_step=0.336, global_step=3595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  91%|█████████ | 1096/1208 [31:18<03:11,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00203, train/loss_step=0.336, global_step=3595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  91%|█████████ | 1096/1208 [31:18<03:11,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0743, train/loss_vlb_step=0.000258, train/loss_step=0.0743, global_step=3595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  91%|█████████ | 1097/1208 [31:19<03:10,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0743, train/loss_vlb_step=0.000258, train/loss_step=0.0743, global_step=3595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  91%|█████████ | 1097/1208 [31:19<03:10,  1.71s/it, loss=0.191, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000573, train/loss_step=0.167, global_step=3596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  91%|█████████ | 1098/1208 [31:20<03:08,  1.71s/it, loss=0.191, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000573, train/loss_step=0.167, global_step=3596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  91%|█████████ | 1098/1208 [31:20<03:08,  1.71s/it, loss=0.191, v_num=0, train/loss_simple_step=0.00796, train/loss_vlb_step=3.57e-5, train/loss_step=0.00796, global_step=3596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  91%|█████████ | 1099/1208 [31:21<03:06,  1.71s/it, loss=0.191, v_num=0, train/loss_simple_step=0.00796, train/loss_vlb_step=3.57e-5, train/loss_step=0.00796, global_step=3596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  91%|█████████ | 1099/1208 [31:21<03:06,  1.71s/it, loss=0.205, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00217, train/loss_step=0.319, global_step=3596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  91%|█████████ | 1100/1208 [31:25<03:05,  1.71s/it, loss=0.205, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00217, train/loss_step=0.319, global_step=3596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  91%|█████████ | 1100/1208 [31:25<03:05,  1.71s/it, loss=0.202, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.00065, train/loss_step=0.181, global_step=3596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  91%|█████████ | 1101/1208 [31:26<03:03,  1.71s/it, loss=0.202, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.00065, train/loss_step=0.181, global_step=3596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  91%|█████████ | 1101/1208 [31:26<03:03,  1.71s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.32e-5, train/loss_step=0.0172, global_step=3597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  91%|█████████ | 1102/1208 [31:27<03:01,  1.71s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.32e-5, train/loss_step=0.0172, global_step=3597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  91%|█████████ | 1102/1208 [31:27<03:01,  1.71s/it, loss=0.211, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00142, train/loss_step=0.295, global_step=3597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  91%|█████████▏| 1103/1208 [31:28<02:59,  1.71s/it, loss=0.211, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00142, train/loss_step=0.295, global_step=3597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  91%|█████████▏| 1103/1208 [31:28<02:59,  1.71s/it, loss=0.226, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.0018, train/loss_step=0.315, global_step=3597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  91%|█████████▏| 1104/1208 [31:31<02:58,  1.71s/it, loss=0.226, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.0018, train/loss_step=0.315, global_step=3597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  91%|█████████▏| 1104/1208 [31:31<02:58,  1.71s/it, loss=0.222, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00253, train/loss_step=0.399, global_step=3597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  91%|█████████▏| 1105/1208 [31:32<02:56,  1.71s/it, loss=0.222, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00253, train/loss_step=0.399, global_step=3597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  91%|█████████▏| 1105/1208 [31:32<02:56,  1.71s/it, loss=0.219, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00245, train/loss_step=0.389, global_step=3598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  92%|█████████▏| 1106/1208 [31:33<02:54,  1.71s/it, loss=0.219, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00245, train/loss_step=0.389, global_step=3598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  92%|█████████▏| 1106/1208 [31:33<02:54,  1.71s/it, loss=0.218, v_num=0, train/loss_simple_step=0.00438, train/loss_vlb_step=2.27e-5, train/loss_step=0.00438, global_step=3598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  92%|█████████▏| 1107/1208 [31:34<02:52,  1.71s/it, loss=0.218, v_num=0, train/loss_simple_step=0.00438, train/loss_vlb_step=2.27e-5, train/loss_step=0.00438, global_step=3598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  92%|█████████▏| 1107/1208 [31:34<02:52,  1.71s/it, loss=0.221, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.000997, train/loss_step=0.249, global_step=3598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  92%|█████████▏| 1108/1208 [31:38<02:51,  1.71s/it, loss=0.221, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.000997, train/loss_step=0.249, global_step=3598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  92%|█████████▏| 1108/1208 [31:38<02:51,  1.71s/it, loss=0.216, v_num=0, train/loss_simple_step=0.0433, train/loss_vlb_step=0.000161, train/loss_step=0.0433, global_step=3598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  92%|█████████▏| 1109/1208 [31:39<02:49,  1.71s/it, loss=0.216, v_num=0, train/loss_simple_step=0.0433, train/loss_vlb_step=0.000161, train/loss_step=0.0433, global_step=3598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  92%|█████████▏| 1109/1208 [31:39<02:49,  1.71s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.33e-5, train/loss_step=0.0203, global_step=3599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  92%|█████████▏| 1110/1208 [31:40<02:47,  1.71s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.33e-5, train/loss_step=0.0203, global_step=3599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  92%|█████████▏| 1110/1208 [31:40<02:47,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0657, train/loss_vlb_step=0.000222, train/loss_step=0.0657, global_step=3599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  92%|█████████▏| 1111/1208 [31:41<02:45,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0657, train/loss_vlb_step=0.000222, train/loss_step=0.0657, global_step=3599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  92%|█████████▏| 1111/1208 [31:41<02:45,  1.71s/it, loss=0.196, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00211, train/loss_step=0.316, global_step=3599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  92%|█████████▏| 1112/1208 [31:44<02:44,  1.71s/it, loss=0.196, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00211, train/loss_step=0.316, global_step=3599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  92%|█████████▏| 1112/1208 [31:44<02:44,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0475, train/loss_vlb_step=0.000173, train/loss_step=0.0475, global_step=3599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  92%|█████████▏| 1113/1208 [31:45<02:42,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0475, train/loss_vlb_step=0.000173, train/loss_step=0.0475, global_step=3599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  92%|█████████▏| 1113/1208 [31:45<02:42,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00379, train/loss_vlb_step=2.02e-5, train/loss_step=0.00379, global_step=3600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  92%|█████████▏| 1114/1208 [31:46<02:40,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00379, train/loss_vlb_step=2.02e-5, train/loss_step=0.00379, global_step=3600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  92%|█████████▏| 1114/1208 [31:46<02:40,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0515, train/loss_vlb_step=0.00018, train/loss_step=0.0515, global_step=3600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  92%|█████████▏| 1115/1208 [31:47<02:39,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0515, train/loss_vlb_step=0.00018, train/loss_step=0.0515, global_step=3600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  92%|█████████▏| 1115/1208 [31:47<02:39,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00842, train/loss_vlb_step=4.03e-5, train/loss_step=0.00842, global_step=3600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  92%|█████████▏| 1116/1208 [31:50<02:37,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00842, train/loss_vlb_step=4.03e-5, train/loss_step=0.00842, global_step=3600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  92%|█████████▏| 1116/1208 [31:51<02:37,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0748, train/loss_vlb_step=0.000256, train/loss_step=0.0748, global_step=3600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  92%|█████████▏| 1117/1208 [31:52<02:35,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0748, train/loss_vlb_step=0.000256, train/loss_step=0.0748, global_step=3600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  92%|█████████▏| 1117/1208 [31:52<02:35,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.600, train/loss_vlb_step=0.013, train/loss_step=0.600, global_step=3601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]      Epoch 11:  93%|█████████▎| 1118/1208 [31:53<02:34,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.600, train/loss_vlb_step=0.013, train/loss_step=0.600, global_step=3601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  93%|█████████▎| 1118/1208 [31:53<02:34,  1.71s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=7.25e-5, train/loss_step=0.0164, global_step=3601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  93%|█████████▎| 1119/1208 [31:54<02:32,  1.71s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=7.25e-5, train/loss_step=0.0164, global_step=3601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  93%|█████████▎| 1119/1208 [31:54<02:32,  1.71s/it, loss=0.202, v_num=0, train/loss_simple_step=0.947, train/loss_vlb_step=0.477, train/loss_step=0.947, global_step=3601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  93%|█████████▎| 1120/1208 [31:57<02:30,  1.71s/it, loss=0.202, v_num=0, train/loss_simple_step=0.947, train/loss_vlb_step=0.477, train/loss_step=0.947, global_step=3601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  93%|█████████▎| 1120/1208 [31:57<02:30,  1.71s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0743, train/loss_vlb_step=0.000253, train/loss_step=0.0743, global_step=3601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  93%|█████████▎| 1121/1208 [31:58<02:28,  1.71s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0743, train/loss_vlb_step=0.000253, train/loss_step=0.0743, global_step=3601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  93%|█████████▎| 1121/1208 [31:58<02:28,  1.71s/it, loss=0.211, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00165, train/loss_step=0.308, global_step=3602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  93%|█████████▎| 1122/1208 [31:59<02:27,  1.71s/it, loss=0.211, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00165, train/loss_step=0.308, global_step=3602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  93%|█████████▎| 1122/1208 [31:59<02:27,  1.71s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.34e-5, train/loss_step=0.00225, global_step=3602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  93%|█████████▎| 1123/1208 [32:00<02:25,  1.71s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.34e-5, train/loss_step=0.00225, global_step=3602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  93%|█████████▎| 1123/1208 [32:00<02:25,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00142, train/loss_step=0.277, global_step=3602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  93%|█████████▎| 1124/1208 [32:03<02:23,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00142, train/loss_step=0.277, global_step=3602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  93%|█████████▎| 1124/1208 [32:03<02:23,  1.71s/it, loss=0.197, v_num=0, train/loss_simple_step=0.437, train/loss_vlb_step=0.00413, train/loss_step=0.437, global_step=3602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  93%|█████████▎| 1125/1208 [32:04<02:22,  1.71s/it, loss=0.197, v_num=0, train/loss_simple_step=0.437, train/loss_vlb_step=0.00413, train/loss_step=0.437, global_step=3602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  93%|█████████▎| 1125/1208 [32:04<02:22,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0375, train/loss_vlb_step=0.000144, train/loss_step=0.0375, global_step=3603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  93%|█████████▎| 1126/1208 [32:05<02:20,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0375, train/loss_vlb_step=0.000144, train/loss_step=0.0375, global_step=3603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  93%|█████████▎| 1126/1208 [32:05<02:20,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.000295, train/loss_step=0.0894, global_step=3603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  93%|█████████▎| 1127/1208 [32:06<02:18,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.000295, train/loss_step=0.0894, global_step=3603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  93%|█████████▎| 1127/1208 [32:06<02:18,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0542, train/loss_vlb_step=0.000185, train/loss_step=0.0542, global_step=3603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  93%|█████████▎| 1128/1208 [32:10<02:16,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0542, train/loss_vlb_step=0.000185, train/loss_step=0.0542, global_step=3603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  93%|█████████▎| 1128/1208 [32:10<02:16,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00276, train/loss_step=0.375, global_step=3603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  93%|█████████▎| 1129/1208 [32:11<02:15,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00276, train/loss_step=0.375, global_step=3603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  93%|█████████▎| 1129/1208 [32:11<02:15,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.15e-5, train/loss_step=0.0121, global_step=3604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  94%|█████████▎| 1130/1208 [32:12<02:13,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.15e-5, train/loss_step=0.0121, global_step=3604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  94%|█████████▎| 1130/1208 [32:12<02:13,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.000154, train/loss_step=0.0425, global_step=3604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  94%|█████████▎| 1131/1208 [32:13<02:11,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.000154, train/loss_step=0.0425, global_step=3604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  94%|█████████▎| 1131/1208 [32:13<02:11,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.00056, train/loss_step=0.162, global_step=3604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  94%|█████████▎| 1132/1208 [32:16<02:10,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.00056, train/loss_step=0.162, global_step=3604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  94%|█████████▎| 1132/1208 [32:16<02:10,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0914, train/loss_vlb_step=0.000301, train/loss_step=0.0914, global_step=3604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  94%|█████████▍| 1133/1208 [32:17<02:08,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0914, train/loss_vlb_step=0.000301, train/loss_step=0.0914, global_step=3604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  94%|█████████▍| 1133/1208 [32:17<02:08,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.29e-5, train/loss_step=0.00212, global_step=3605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  94%|█████████▍| 1134/1208 [32:18<02:06,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.29e-5, train/loss_step=0.00212, global_step=3605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  94%|█████████▍| 1134/1208 [32:18<02:06,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000692, train/loss_step=0.192, global_step=3605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  94%|█████████▍| 1135/1208 [32:19<02:04,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000692, train/loss_step=0.192, global_step=3605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  94%|█████████▍| 1135/1208 [32:19<02:04,  1.71s/it, loss=0.2, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000742, train/loss_step=0.200, global_step=3605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  94%|█████████▍| 1136/1208 [32:23<02:03,  1.71s/it, loss=0.2, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000742, train/loss_step=0.200, global_step=3605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  94%|█████████▍| 1136/1208 [32:23<02:03,  1.71s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000108, train/loss_step=0.0269, global_step=3605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  94%|█████████▍| 1137/1208 [32:24<02:01,  1.71s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000108, train/loss_step=0.0269, global_step=3605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  94%|█████████▍| 1137/1208 [32:24<02:01,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000765, train/loss_step=0.193, global_step=3606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  94%|█████████▍| 1138/1208 [32:25<01:59,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000765, train/loss_step=0.193, global_step=3606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  94%|█████████▍| 1138/1208 [32:25<01:59,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00106, train/loss_step=0.264, global_step=3606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  94%|█████████▍| 1139/1208 [32:26<01:57,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00106, train/loss_step=0.264, global_step=3606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  94%|█████████▍| 1139/1208 [32:26<01:57,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0882, train/loss_vlb_step=0.00029, train/loss_step=0.0882, global_step=3606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  94%|█████████▍| 1140/1208 [32:29<01:56,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0882, train/loss_vlb_step=0.00029, train/loss_step=0.0882, global_step=3606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  94%|█████████▍| 1140/1208 [32:29<01:56,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.906, train/loss_vlb_step=0.456, train/loss_step=0.906, global_step=3606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  94%|█████████▍| 1141/1208 [32:30<01:54,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.906, train/loss_vlb_step=0.456, train/loss_step=0.906, global_step=3606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  94%|█████████▍| 1141/1208 [32:30<01:54,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.000135, train/loss_step=0.0359, global_step=3607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  95%|█████████▍| 1142/1208 [32:31<01:52,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.000135, train/loss_step=0.0359, global_step=3607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  95%|█████████▍| 1142/1208 [32:31<01:52,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0696, train/loss_vlb_step=0.000233, train/loss_step=0.0696, global_step=3607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  95%|█████████▍| 1143/1208 [32:32<01:51,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0696, train/loss_vlb_step=0.000233, train/loss_step=0.0696, global_step=3607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  95%|█████████▍| 1143/1208 [32:32<01:51,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=9.63e-5, train/loss_step=0.0244, global_step=3607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  95%|█████████▍| 1144/1208 [32:35<01:49,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=9.63e-5, train/loss_step=0.0244, global_step=3607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  95%|█████████▍| 1144/1208 [32:35<01:49,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00147, train/loss_step=0.312, global_step=3607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  95%|█████████▍| 1145/1208 [32:36<01:47,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00147, train/loss_step=0.312, global_step=3607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  95%|█████████▍| 1145/1208 [32:36<01:47,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000546, train/loss_step=0.165, global_step=3608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  95%|█████████▍| 1146/1208 [32:37<01:45,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000546, train/loss_step=0.165, global_step=3608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  95%|█████████▍| 1146/1208 [32:37<01:45,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00568, train/loss_vlb_step=2.75e-5, train/loss_step=0.00568, global_step=3608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  95%|█████████▍| 1147/1208 [32:39<01:44,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00568, train/loss_vlb_step=2.75e-5, train/loss_step=0.00568, global_step=3608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  95%|█████████▍| 1147/1208 [32:39<01:44,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000398, train/loss_step=0.121, global_step=3608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  95%|█████████▌| 1148/1208 [32:42<01:42,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000398, train/loss_step=0.121, global_step=3608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  95%|█████████▌| 1148/1208 [32:42<01:42,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00131, train/loss_step=0.303, global_step=3608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  95%|█████████▌| 1149/1208 [32:43<01:40,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00131, train/loss_step=0.303, global_step=3608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  95%|█████████▌| 1149/1208 [32:43<01:40,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00839, train/loss_vlb_step=4.05e-5, train/loss_step=0.00839, global_step=3609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  95%|█████████▌| 1150/1208 [32:44<01:39,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00839, train/loss_vlb_step=4.05e-5, train/loss_step=0.00839, global_step=3609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  95%|█████████▌| 1150/1208 [32:44<01:39,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000544, train/loss_step=0.162, global_step=3609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  95%|█████████▌| 1151/1208 [32:45<01:37,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000544, train/loss_step=0.162, global_step=3609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  95%|█████████▌| 1151/1208 [32:45<01:37,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00383, train/loss_vlb_step=2.11e-5, train/loss_step=0.00383, global_step=3609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  95%|█████████▌| 1152/1208 [32:48<01:35,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00383, train/loss_vlb_step=2.11e-5, train/loss_step=0.00383, global_step=3609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  95%|█████████▌| 1152/1208 [32:48<01:35,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00148, train/loss_step=0.297, global_step=3609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  95%|█████████▌| 1153/1208 [32:49<01:33,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00148, train/loss_step=0.297, global_step=3609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  95%|█████████▌| 1153/1208 [32:49<01:33,  1.71s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000172, train/loss_step=0.0484, global_step=3610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  96%|█████████▌| 1154/1208 [32:50<01:32,  1.71s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000172, train/loss_step=0.0484, global_step=3610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  96%|█████████▌| 1154/1208 [32:50<01:32,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0842, train/loss_vlb_step=0.000278, train/loss_step=0.0842, global_step=3610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  96%|█████████▌| 1155/1208 [32:51<01:30,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0842, train/loss_vlb_step=0.000278, train/loss_step=0.0842, global_step=3610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  96%|█████████▌| 1155/1208 [32:51<01:30,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000104, train/loss_step=0.0265, global_step=3610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  96%|█████████▌| 1156/1208 [32:55<01:28,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000104, train/loss_step=0.0265, global_step=3610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  96%|█████████▌| 1156/1208 [32:55<01:28,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00821, train/loss_vlb_step=4.03e-5, train/loss_step=0.00821, global_step=3610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  96%|█████████▌| 1157/1208 [32:56<01:27,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00821, train/loss_vlb_step=4.03e-5, train/loss_step=0.00821, global_step=3610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  96%|█████████▌| 1157/1208 [32:56<01:27,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0779, train/loss_vlb_step=0.000263, train/loss_step=0.0779, global_step=3611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  96%|█████████▌| 1158/1208 [32:57<01:25,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0779, train/loss_vlb_step=0.000263, train/loss_step=0.0779, global_step=3611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  96%|█████████▌| 1158/1208 [32:57<01:25,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.601, train/loss_vlb_step=0.0198, train/loss_step=0.601, global_step=3611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  96%|█████████▌| 1159/1208 [32:58<01:23,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.601, train/loss_vlb_step=0.0198, train/loss_step=0.601, global_step=3611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  96%|█████████▌| 1159/1208 [32:58<01:23,  1.71s/it, loss=0.171, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000592, train/loss_step=0.169, global_step=3611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  96%|█████████▌| 1160/1208 [33:01<01:21,  1.71s/it, loss=0.171, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000592, train/loss_step=0.169, global_step=3611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  96%|█████████▌| 1160/1208 [33:01<01:21,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00638, train/loss_vlb_step=3.2e-5, train/loss_step=0.00638, global_step=3611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  96%|█████████▌| 1161/1208 [33:02<01:20,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00638, train/loss_vlb_step=3.2e-5, train/loss_step=0.00638, global_step=3611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  96%|█████████▌| 1161/1208 [33:02<01:20,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00108, train/loss_step=0.270, global_step=3612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  96%|█████████▌| 1162/1208 [33:03<01:18,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00108, train/loss_step=0.270, global_step=3612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  96%|█████████▌| 1162/1208 [33:03<01:18,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000522, train/loss_step=0.152, global_step=3612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  96%|█████████▋| 1163/1208 [33:04<01:16,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000522, train/loss_step=0.152, global_step=3612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  96%|█████████▋| 1163/1208 [33:04<01:16,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=1.93e-5, train/loss_step=0.00347, global_step=3612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  96%|█████████▋| 1164/1208 [33:07<01:15,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=1.93e-5, train/loss_step=0.00347, global_step=3612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  96%|█████████▋| 1164/1208 [33:07<01:15,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.547, train/loss_vlb_step=0.0118, train/loss_step=0.547, global_step=3612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]     Epoch 11:  96%|█████████▋| 1165/1208 [33:09<01:13,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.547, train/loss_vlb_step=0.0118, train/loss_step=0.547, global_step=3612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  96%|█████████▋| 1165/1208 [33:09<01:13,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00134, train/loss_step=0.307, global_step=3613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  97%|█████████▋| 1166/1208 [33:10<01:11,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00134, train/loss_step=0.307, global_step=3613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  97%|█████████▋| 1166/1208 [33:10<01:11,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0661, train/loss_vlb_step=0.000226, train/loss_step=0.0661, global_step=3613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  97%|█████████▋| 1167/1208 [33:11<01:09,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0661, train/loss_vlb_step=0.000226, train/loss_step=0.0661, global_step=3613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  97%|█████████▋| 1167/1208 [33:11<01:09,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.92e-5, train/loss_step=0.0101, global_step=3613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  97%|█████████▋| 1168/1208 [33:14<01:08,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.92e-5, train/loss_step=0.0101, global_step=3613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  97%|█████████▋| 1168/1208 [33:14<01:08,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000923, train/loss_step=0.236, global_step=3613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  97%|█████████▋| 1169/1208 [33:15<01:06,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000923, train/loss_step=0.236, global_step=3613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  97%|█████████▋| 1169/1208 [33:15<01:06,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.28e-5, train/loss_step=0.00212, global_step=3614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  97%|█████████▋| 1170/1208 [33:16<01:04,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.28e-5, train/loss_step=0.00212, global_step=3614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  97%|█████████▋| 1170/1208 [33:16<01:04,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0493, train/loss_vlb_step=0.000179, train/loss_step=0.0493, global_step=3614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  97%|█████████▋| 1171/1208 [33:17<01:03,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0493, train/loss_vlb_step=0.000179, train/loss_step=0.0493, global_step=3614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  97%|█████████▋| 1171/1208 [33:17<01:03,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0959, train/loss_vlb_step=0.000316, train/loss_step=0.0959, global_step=3614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  97%|█████████▋| 1172/1208 [33:20<01:01,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0959, train/loss_vlb_step=0.000316, train/loss_step=0.0959, global_step=3614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  97%|█████████▋| 1172/1208 [33:20<01:01,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000723, train/loss_step=0.198, global_step=3614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  97%|█████████▋| 1173/1208 [33:21<00:59,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000723, train/loss_step=0.198, global_step=3614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  97%|█████████▋| 1173/1208 [33:21<00:59,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.712, train/loss_vlb_step=0.0249, train/loss_step=0.712, global_step=3615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  97%|█████████▋| 1174/1208 [33:23<00:58,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.712, train/loss_vlb_step=0.0249, train/loss_step=0.712, global_step=3615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  97%|█████████▋| 1174/1208 [33:23<00:58,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=8.04e-5, train/loss_step=0.019, global_step=3615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  97%|█████████▋| 1175/1208 [33:24<00:56,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=8.04e-5, train/loss_step=0.019, global_step=3615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  97%|█████████▋| 1175/1208 [33:24<00:56,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.000126, train/loss_step=0.0322, global_step=3615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  97%|█████████▋| 1176/1208 [33:27<00:54,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.000126, train/loss_step=0.0322, global_step=3615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  97%|█████████▋| 1176/1208 [33:27<00:54,  1.71s/it, loss=0.218, v_num=0, train/loss_simple_step=0.799, train/loss_vlb_step=0.0321, train/loss_step=0.799, global_step=3615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]    Epoch 11:  97%|█████████▋| 1177/1208 [33:28<00:52,  1.71s/it, loss=0.218, v_num=0, train/loss_simple_step=0.799, train/loss_vlb_step=0.0321, train/loss_step=0.799, global_step=3615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  97%|█████████▋| 1177/1208 [33:28<00:52,  1.71s/it, loss=0.227, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00117, train/loss_step=0.272, global_step=3616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  98%|█████████▊| 1178/1208 [33:29<00:51,  1.71s/it, loss=0.227, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00117, train/loss_step=0.272, global_step=3616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  98%|█████████▊| 1178/1208 [33:29<00:51,  1.71s/it, loss=0.237, v_num=0, train/loss_simple_step=0.784, train/loss_vlb_step=0.0406, train/loss_step=0.784, global_step=3616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  98%|█████████▊| 1179/1208 [33:30<00:49,  1.71s/it, loss=0.237, v_num=0, train/loss_simple_step=0.784, train/loss_vlb_step=0.0406, train/loss_step=0.784, global_step=3616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  98%|█████████▊| 1179/1208 [33:30<00:49,  1.71s/it, loss=0.229, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.82e-5, train/loss_step=0.0191, global_step=3616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  98%|█████████▊| 1180/1208 [33:33<00:47,  1.71s/it, loss=0.229, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.82e-5, train/loss_step=0.0191, global_step=3616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  98%|█████████▊| 1180/1208 [33:33<00:47,  1.71s/it, loss=0.229, v_num=0, train/loss_simple_step=0.00969, train/loss_vlb_step=4.57e-5, train/loss_step=0.00969, global_step=3616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  98%|█████████▊| 1181/1208 [33:34<00:46,  1.71s/it, loss=0.229, v_num=0, train/loss_simple_step=0.00969, train/loss_vlb_step=4.57e-5, train/loss_step=0.00969, global_step=3616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  98%|█████████▊| 1181/1208 [33:34<00:46,  1.71s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0318, train/loss_vlb_step=0.000113, train/loss_step=0.0318, global_step=3617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  98%|█████████▊| 1182/1208 [33:35<00:44,  1.71s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0318, train/loss_vlb_step=0.000113, train/loss_step=0.0318, global_step=3617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  98%|█████████▊| 1182/1208 [33:35<00:44,  1.71s/it, loss=0.21, v_num=0, train/loss_simple_step=0.00489, train/loss_vlb_step=2.57e-5, train/loss_step=0.00489, global_step=3617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  98%|█████████▊| 1183/1208 [33:36<00:42,  1.70s/it, loss=0.21, v_num=0, train/loss_simple_step=0.00489, train/loss_vlb_step=2.57e-5, train/loss_step=0.00489, global_step=3617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  98%|█████████▊| 1183/1208 [33:36<00:42,  1.70s/it, loss=0.217, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000463, train/loss_step=0.141, global_step=3617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11:  98%|█████████▊| 1184/1208 [33:40<00:40,  1.71s/it, loss=0.217, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000463, train/loss_step=0.141, global_step=3617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  98%|█████████▊| 1184/1208 [33:40<00:40,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.000166, train/loss_step=0.0462, global_step=3617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  98%|█████████▊| 1185/1208 [33:41<00:39,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.000166, train/loss_step=0.0462, global_step=3617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  98%|█████████▊| 1185/1208 [33:41<00:39,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0698, train/loss_vlb_step=0.000235, train/loss_step=0.0698, global_step=3618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  98%|█████████▊| 1186/1208 [33:42<00:37,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0698, train/loss_vlb_step=0.000235, train/loss_step=0.0698, global_step=3618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  98%|█████████▊| 1186/1208 [33:42<00:37,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.76e-5, train/loss_step=0.0191, global_step=3618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  98%|█████████▊| 1187/1208 [33:43<00:35,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.76e-5, train/loss_step=0.0191, global_step=3618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  98%|█████████▊| 1187/1208 [33:43<00:35,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00576, train/loss_vlb_step=2.92e-5, train/loss_step=0.00576, global_step=3618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  98%|█████████▊| 1188/1208 [33:46<00:34,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00576, train/loss_vlb_step=2.92e-5, train/loss_step=0.00576, global_step=3618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  98%|█████████▊| 1188/1208 [33:46<00:34,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0553, train/loss_vlb_step=0.000195, train/loss_step=0.0553, global_step=3618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11:  98%|█████████▊| 1189/1208 [33:47<00:32,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0553, train/loss_vlb_step=0.000195, train/loss_step=0.0553, global_step=3618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  98%|█████████▊| 1189/1208 [33:47<00:32,  1.71s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0496, train/loss_vlb_step=0.000177, train/loss_step=0.0496, global_step=3619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  99%|█████████▊| 1190/1208 [33:48<00:30,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0496, train/loss_vlb_step=0.000177, train/loss_step=0.0496, global_step=3619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  99%|█████████▊| 1190/1208 [33:48<00:30,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0579, train/loss_vlb_step=0.000202, train/loss_step=0.0579, global_step=3619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  99%|█████████▊| 1191/1208 [33:49<00:28,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0579, train/loss_vlb_step=0.000202, train/loss_step=0.0579, global_step=3619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  99%|█████████▊| 1191/1208 [33:49<00:28,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.00086, train/loss_step=0.217, global_step=3619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]   Epoch 11:  99%|█████████▊| 1192/1208 [33:53<00:27,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.00086, train/loss_step=0.217, global_step=3619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  99%|█████████▊| 1192/1208 [33:53<00:27,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000161, train/loss_step=0.0454, global_step=3619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  99%|█████████▉| 1193/1208 [33:54<00:25,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000161, train/loss_step=0.0454, global_step=3619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  99%|█████████▉| 1193/1208 [33:54<00:25,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00453, train/loss_vlb_step=2.45e-5, train/loss_step=0.00453, global_step=3620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  99%|█████████▉| 1194/1208 [33:55<00:23,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00453, train/loss_vlb_step=2.45e-5, train/loss_step=0.00453, global_step=3620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  99%|█████████▉| 1194/1208 [33:55<00:23,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.08e-5, train/loss_step=0.00186, global_step=3620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  99%|█████████▉| 1195/1208 [33:56<00:22,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.08e-5, train/loss_step=0.00186, global_step=3620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  99%|█████████▉| 1195/1208 [33:56<00:22,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.0011, train/loss_step=0.258, global_step=3620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]     Epoch 11:  99%|█████████▉| 1196/1208 [33:59<00:20,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.0011, train/loss_step=0.258, global_step=3620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  99%|█████████▉| 1196/1208 [33:59<00:20,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.809, train/loss_vlb_step=0.0593, train/loss_step=0.809, global_step=3620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  99%|█████████▉| 1197/1208 [34:00<00:18,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.809, train/loss_vlb_step=0.0593, train/loss_step=0.809, global_step=3620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  99%|█████████▉| 1197/1208 [34:00<00:18,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.518, train/loss_vlb_step=0.00495, train/loss_step=0.518, global_step=3621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  99%|█████████▉| 1198/1208 [34:01<00:17,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.518, train/loss_vlb_step=0.00495, train/loss_step=0.518, global_step=3621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  99%|█████████▉| 1198/1208 [34:01<00:17,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.00034, train/loss_step=0.103, global_step=3621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  99%|█████████▉| 1199/1208 [34:02<00:15,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.00034, train/loss_step=0.103, global_step=3621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  99%|█████████▉| 1199/1208 [34:02<00:15,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=3621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  99%|█████████▉| 1200/1208 [34:05<00:13,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=3621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  99%|█████████▉| 1200/1208 [34:05<00:13,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00205, train/loss_step=0.377, global_step=3621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] 
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.76it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.76it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.83it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.83it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.75it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.75it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.75it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.75it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.76it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.76it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.75it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.75it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.75it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.77it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.78it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.78it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 11:  99%|█████████▉| 1201/1208 [34:36<00:12,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00205, train/loss_step=0.377, global_step=3621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11:  99%|█████████▉| 1201/1208 [34:36<00:12,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000107, train/loss_step=0.0278, global_step=3622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11: 100%|█████████▉| 1202/1208 [34:37<00:10,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000107, train/loss_step=0.0278, global_step=3622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11: 100%|█████████▉| 1202/1208 [34:37<00:10,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0783, train/loss_vlb_step=0.00026, train/loss_step=0.0783, global_step=3622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  Epoch 11: 100%|█████████▉| 1203/1208 [34:38<00:08,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0783, train/loss_vlb_step=0.00026, train/loss_step=0.0783, global_step=3622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11: 100%|█████████▉| 1203/1208 [34:38<00:08,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=7.98e-5, train/loss_step=0.0189, global_step=3622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11: 100%|█████████▉| 1204/1208 [34:41<00:06,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=7.98e-5, train/loss_step=0.0189, global_step=3622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11: 100%|█████████▉| 1204/1208 [34:41<00:06,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=2.23e-5, train/loss_step=0.00416, global_step=3622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11: 100%|█████████▉| 1205/1208 [34:42<00:05,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=2.23e-5, train/loss_step=0.00416, global_step=3622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11: 100%|█████████▉| 1205/1208 [34:42<00:05,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00718, train/loss_vlb_step=3.59e-5, train/loss_step=0.00718, global_step=3623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11: 100%|█████████▉| 1206/1208 [34:43<00:03,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00718, train/loss_vlb_step=3.59e-5, train/loss_step=0.00718, global_step=3623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11: 100%|█████████▉| 1206/1208 [34:43<00:03,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0903, train/loss_vlb_step=0.000299, train/loss_step=0.0903, global_step=3623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141] Epoch 11: 100%|█████████▉| 1207/1208 [34:44<00:01,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0903, train/loss_vlb_step=0.000299, train/loss_step=0.0903, global_step=3623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11: 100%|█████████▉| 1207/1208 [34:44<00:01,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00989, train/loss_vlb_step=4.67e-5, train/loss_step=0.00989, global_step=3623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11: 100%|██████████| 1208/1208 [34:50<00:00,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00989, train/loss_vlb_step=4.67e-5, train/loss_step=0.00989, global_step=3623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 11: 100%|██████████| 1208/1208 [34:50<00:00,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0051, train/loss_vlb_step=2.74e-5, train/loss_step=0.0051, global_step=3623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]  
+
+
+Epoch 11:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.139, v_num=0, train/loss_simple_step=0.0051, train/loss_vlb_step=2.74e-5, train/loss_step=0.0051, global_step=3623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]           Epoch 12:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.139, v_num=0, train/loss_simple_step=0.0051, train/loss_vlb_step=2.74e-5, train/loss_step=0.0051, global_step=3623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][AData shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.84it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.73it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.74it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.83it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.83it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.83it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.83it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.76it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.82it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.83it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.83it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.78it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.83it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.83it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.78it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.83it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.83it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.83it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.83it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.83it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.83it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.83it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.82it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.82it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.83it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.83it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.83it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.74it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.83it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.75it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.81it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.78it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.78it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.83it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]Epoch 12:   0%|          | 1/1208 [00:32<11:01:49, 32.90s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0051, train/loss_vlb_step=2.74e-5, train/loss_step=0.0051, global_step=3623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00229, train/loss_epoch=0.141]Epoch 12:   0%|          | 1/1208 [00:32<11:01:53, 32.90s/it, loss=0.162, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.0058, train/loss_step=0.499, global_step=3624.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:   0%|          | 2/1208 [00:33<5:41:01, 16.97s/it, loss=0.162, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.0058, train/loss_step=0.499, global_step=3624.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:   0%|          | 2/1208 [00:34<5:48:52, 17.36s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00912, train/loss_vlb_step=4.4e-5, train/loss_step=0.00912, global_step=3624.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   0%|          | 3/1208 [00:35<3:59:14, 11.91s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00912, train/loss_vlb_step=4.4e-5, train/loss_step=0.00912, global_step=3624.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   0%|          | 3/1208 [00:35<3:59:15, 11.91s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.87e-5, train/loss_step=0.0186, global_step=3624.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:   0%|          | 4/1208 [00:38<3:14:52,  9.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.87e-5, train/loss_step=0.0186, global_step=3624.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   0%|          | 4/1208 [00:38<3:14:53,  9.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000426, train/loss_step=0.129, global_step=3624.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   0%|          | 5/1208 [00:39<2:40:03,  7.98s/it, loss=0.154, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000426, train/loss_step=0.129, global_step=3624.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   0%|          | 5/1208 [00:39<2:40:04,  7.98s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=2.05e-5, train/loss_step=0.00375, global_step=3625.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   0%|          | 6/1208 [00:40<2:16:44,  6.83s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=2.05e-5, train/loss_step=0.00375, global_step=3625.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   0%|          | 6/1208 [00:40<2:16:44,  6.83s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00858, train/loss_vlb_step=4.13e-5, train/loss_step=0.00858, global_step=3625.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   1%|          | 7/1208 [00:41<2:00:03,  6.00s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00858, train/loss_vlb_step=4.13e-5, train/loss_step=0.00858, global_step=3625.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   1%|          | 7/1208 [00:41<2:00:04,  6.00s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00556, train/loss_vlb_step=2.79e-5, train/loss_step=0.00556, global_step=3625.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   1%|          | 8/1208 [00:45<1:53:09,  5.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00556, train/loss_vlb_step=2.79e-5, train/loss_step=0.00556, global_step=3625.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   1%|          | 8/1208 [00:45<1:53:10,  5.66s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0247, train/loss_vlb_step=9.89e-5, train/loss_step=0.0247, global_step=3625.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:   1%|          | 9/1208 [00:46<1:42:50,  5.15s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0247, train/loss_vlb_step=9.89e-5, train/loss_step=0.0247, global_step=3625.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   1%|          | 9/1208 [00:46<1:42:51,  5.15s/it, loss=0.0785, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000158, train/loss_step=0.0438, global_step=3626.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   1%|          | 10/1208 [00:47<1:34:33,  4.74s/it, loss=0.0785, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000158, train/loss_step=0.0438, global_step=3626.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   1%|          | 10/1208 [00:47<1:34:33,  4.74s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00116, train/loss_step=0.263, global_step=3626.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:   1%|          | 11/1208 [00:48<1:27:45,  4.40s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00116, train/loss_step=0.263, global_step=3626.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   1%|          | 11/1208 [00:48<1:27:46,  4.40s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.000133, train/loss_step=0.0359, global_step=3626.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   1%|          | 12/1208 [00:51<1:25:50,  4.31s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.000133, train/loss_step=0.0359, global_step=3626.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   1%|          | 12/1208 [00:51<1:25:50,  4.31s/it, loss=0.074, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000766, train/loss_step=0.198, global_step=3626.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:   1%|          | 13/1208 [00:52<1:20:47,  4.06s/it, loss=0.074, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000766, train/loss_step=0.198, global_step=3626.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   1%|          | 13/1208 [00:52<1:20:47,  4.06s/it, loss=0.073, v_num=0, train/loss_simple_step=0.0075, train/loss_vlb_step=3.64e-5, train/loss_step=0.0075, global_step=3627.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   1%|          | 14/1208 [00:53<1:16:25,  3.84s/it, loss=0.073, v_num=0, train/loss_simple_step=0.0075, train/loss_vlb_step=3.64e-5, train/loss_step=0.0075, global_step=3627.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   1%|          | 14/1208 [00:53<1:16:25,  3.84s/it, loss=0.0783, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000675, train/loss_step=0.185, global_step=3627.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   1%|          | 15/1208 [00:54<1:12:38,  3.65s/it, loss=0.0783, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000675, train/loss_step=0.185, global_step=3627.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   1%|          | 15/1208 [00:54<1:12:38,  3.65s/it, loss=0.0794, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.00015, train/loss_step=0.0405, global_step=3627.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   1%|▏         | 16/1208 [00:58<1:12:04,  3.63s/it, loss=0.0794, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.00015, train/loss_step=0.0405, global_step=3627.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   1%|▏         | 16/1208 [00:58<1:12:04,  3.63s/it, loss=0.0794, v_num=0, train/loss_simple_step=0.00528, train/loss_vlb_step=2.79e-5, train/loss_step=0.00528, global_step=3627.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   1%|▏         | 17/1208 [00:59<1:09:00,  3.48s/it, loss=0.0794, v_num=0, train/loss_simple_step=0.00528, train/loss_vlb_step=2.79e-5, train/loss_step=0.00528, global_step=3627.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   1%|▏         | 17/1208 [00:59<1:09:00,  3.48s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.0619, train/loss_vlb_step=0.000207, train/loss_step=0.0619, global_step=3628.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:   1%|▏         | 18/1208 [01:00<1:06:14,  3.34s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.0619, train/loss_vlb_step=0.000207, train/loss_step=0.0619, global_step=3628.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   1%|▏         | 18/1208 [01:00<1:06:14,  3.34s/it, loss=0.0793, v_num=0, train/loss_simple_step=0.0321, train/loss_vlb_step=0.000121, train/loss_step=0.0321, global_step=3628.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   2%|▏         | 19/1208 [01:01<1:03:46,  3.22s/it, loss=0.0793, v_num=0, train/loss_simple_step=0.0321, train/loss_vlb_step=0.000121, train/loss_step=0.0321, global_step=3628.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   2%|▏         | 19/1208 [01:01<1:03:46,  3.22s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000742, train/loss_step=0.203, global_step=3628.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:   2%|▏         | 20/1208 [01:04<1:03:53,  3.23s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000742, train/loss_step=0.203, global_step=3628.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   2%|▏         | 20/1208 [01:04<1:03:53,  3.23s/it, loss=0.098, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000657, train/loss_step=0.187, global_step=3628.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:   2%|▏         | 21/1208 [01:05<1:01:48,  3.12s/it, loss=0.098, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000657, train/loss_step=0.187, global_step=3628.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   2%|▏         | 21/1208 [01:05<1:01:48,  3.12s/it, loss=0.0741, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.38e-5, train/loss_step=0.0205, global_step=3629.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   2%|▏         | 22/1208 [01:06<59:52,  3.03s/it, loss=0.0741, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.38e-5, train/loss_step=0.0205, global_step=3629.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:   2%|▏         | 22/1208 [01:06<59:53,  3.03s/it, loss=0.0849, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000937, train/loss_step=0.227, global_step=3629.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:   2%|▏         | 23/1208 [01:07<58:07,  2.94s/it, loss=0.0849, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000937, train/loss_step=0.227, global_step=3629.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   2%|▏         | 23/1208 [01:07<58:07,  2.94s/it, loss=0.0846, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.97e-5, train/loss_step=0.0106, global_step=3629.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   2%|▏         | 24/1208 [01:10<58:22,  2.96s/it, loss=0.0846, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.97e-5, train/loss_step=0.0106, global_step=3629.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   2%|▏         | 24/1208 [01:11<58:22,  2.96s/it, loss=0.0797, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000122, train/loss_step=0.0327, global_step=3629.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   2%|▏         | 25/1208 [01:12<56:49,  2.88s/it, loss=0.0797, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000122, train/loss_step=0.0327, global_step=3629.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   2%|▏         | 25/1208 [01:12<56:49,  2.88s/it, loss=0.08, v_num=0, train/loss_simple_step=0.0086, train/loss_vlb_step=4.12e-5, train/loss_step=0.0086, global_step=3630.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:   2%|▏         | 26/1208 [01:13<55:22,  2.81s/it, loss=0.08, v_num=0, train/loss_simple_step=0.0086, train/loss_vlb_step=4.12e-5, train/loss_step=0.0086, global_step=3630.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   2%|▏         | 26/1208 [01:13<55:23,  2.81s/it, loss=0.08, v_num=0, train/loss_simple_step=0.00858, train/loss_vlb_step=4.08e-5, train/loss_step=0.00858, global_step=3630.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   2%|▏         | 27/1208 [01:14<54:02,  2.75s/it, loss=0.08, v_num=0, train/loss_simple_step=0.00858, train/loss_vlb_step=4.08e-5, train/loss_step=0.00858, global_step=3630.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   2%|▏         | 27/1208 [01:14<54:02,  2.75s/it, loss=0.0813, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000129, train/loss_step=0.0327, global_step=3630.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   2%|▏         | 28/1208 [01:17<54:20,  2.76s/it, loss=0.0813, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000129, train/loss_step=0.0327, global_step=3630.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   2%|▏         | 28/1208 [01:17<54:20,  2.76s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.0554, train/loss_vlb_step=0.000193, train/loss_step=0.0554, global_step=3630.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   2%|▏         | 29/1208 [01:18<53:09,  2.70s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.0554, train/loss_vlb_step=0.000193, train/loss_step=0.0554, global_step=3630.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   2%|▏         | 29/1208 [01:18<53:09,  2.71s/it, loss=0.0816, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.86e-5, train/loss_step=0.0188, global_step=3631.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:   2%|▏         | 30/1208 [01:19<52:01,  2.65s/it, loss=0.0816, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.86e-5, train/loss_step=0.0188, global_step=3631.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   2%|▏         | 30/1208 [01:19<52:01,  2.65s/it, loss=0.0718, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.000227, train/loss_step=0.0672, global_step=3631.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   3%|▎         | 31/1208 [01:20<50:57,  2.60s/it, loss=0.0718, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.000227, train/loss_step=0.0672, global_step=3631.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   3%|▎         | 31/1208 [01:20<50:57,  2.60s/it, loss=0.0759, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000384, train/loss_step=0.117, global_step=3631.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:   3%|▎         | 32/1208 [01:23<51:19,  2.62s/it, loss=0.0759, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000384, train/loss_step=0.117, global_step=3631.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   3%|▎         | 32/1208 [01:23<51:19,  2.62s/it, loss=0.0695, v_num=0, train/loss_simple_step=0.0697, train/loss_vlb_step=0.000238, train/loss_step=0.0697, global_step=3631.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   3%|▎         | 33/1208 [01:24<50:20,  2.57s/it, loss=0.0695, v_num=0, train/loss_simple_step=0.0697, train/loss_vlb_step=0.000238, train/loss_step=0.0697, global_step=3631.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   3%|▎         | 33/1208 [01:24<50:20,  2.57s/it, loss=0.0697, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.42e-5, train/loss_step=0.0119, global_step=3632.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:   3%|▎         | 34/1208 [01:25<49:24,  2.53s/it, loss=0.0697, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.42e-5, train/loss_step=0.0119, global_step=3632.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   3%|▎         | 34/1208 [01:25<49:25,  2.53s/it, loss=0.0609, v_num=0, train/loss_simple_step=0.00943, train/loss_vlb_step=4.39e-5, train/loss_step=0.00943, global_step=3632.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   3%|▎         | 35/1208 [01:26<48:32,  2.48s/it, loss=0.0609, v_num=0, train/loss_simple_step=0.00943, train/loss_vlb_step=4.39e-5, train/loss_step=0.00943, global_step=3632.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   3%|▎         | 35/1208 [01:26<48:32,  2.48s/it, loss=0.106, v_num=0, train/loss_simple_step=0.943, train/loss_vlb_step=0.475, train/loss_step=0.943, global_step=3632.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]       Epoch 12:   3%|▎         | 36/1208 [01:30<48:54,  2.50s/it, loss=0.106, v_num=0, train/loss_simple_step=0.943, train/loss_vlb_step=0.475, train/loss_step=0.943, global_step=3632.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   3%|▎         | 36/1208 [01:30<48:54,  2.50s/it, loss=0.112, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=3632.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   3%|▎         | 37/1208 [01:31<48:07,  2.47s/it, loss=0.112, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=3632.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   3%|▎         | 37/1208 [01:31<48:07,  2.47s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0714, train/loss_vlb_step=0.000242, train/loss_step=0.0714, global_step=3633.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   3%|▎         | 38/1208 [01:32<47:20,  2.43s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0714, train/loss_vlb_step=0.000242, train/loss_step=0.0714, global_step=3633.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   3%|▎         | 38/1208 [01:32<47:20,  2.43s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00994, train/loss_vlb_step=4.61e-5, train/loss_step=0.00994, global_step=3633.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   3%|▎         | 39/1208 [01:33<46:36,  2.39s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00994, train/loss_vlb_step=4.61e-5, train/loss_step=0.00994, global_step=3633.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   3%|▎         | 39/1208 [01:33<46:36,  2.39s/it, loss=0.123, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00459, train/loss_step=0.435, global_step=3633.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:   3%|▎         | 40/1208 [01:36<46:58,  2.41s/it, loss=0.123, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00459, train/loss_step=0.435, global_step=3633.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   3%|▎         | 40/1208 [01:36<46:58,  2.41s/it, loss=0.125, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000862, train/loss_step=0.229, global_step=3633.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   3%|▎         | 41/1208 [01:37<46:17,  2.38s/it, loss=0.125, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000862, train/loss_step=0.229, global_step=3633.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   3%|▎         | 41/1208 [01:37<46:17,  2.38s/it, loss=0.131, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.00045, train/loss_step=0.135, global_step=3634.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:   3%|▎         | 42/1208 [01:38<45:37,  2.35s/it, loss=0.131, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.00045, train/loss_step=0.135, global_step=3634.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   3%|▎         | 42/1208 [01:38<45:37,  2.35s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.56e-5, train/loss_step=0.00282, global_step=3634.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   4%|▎         | 43/1208 [01:39<44:59,  2.32s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.56e-5, train/loss_step=0.00282, global_step=3634.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   4%|▎         | 43/1208 [01:39<44:59,  2.32s/it, loss=0.125, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000414, train/loss_step=0.126, global_step=3634.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:   4%|▎         | 44/1208 [01:42<45:23,  2.34s/it, loss=0.125, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000414, train/loss_step=0.126, global_step=3634.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   4%|▎         | 44/1208 [01:42<45:23,  2.34s/it, loss=0.133, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.00063, train/loss_step=0.186, global_step=3634.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:   4%|▎         | 45/1208 [01:43<44:47,  2.31s/it, loss=0.133, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.00063, train/loss_step=0.186, global_step=3634.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   4%|▎         | 45/1208 [01:44<44:47,  2.31s/it, loss=0.151, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00266, train/loss_step=0.374, global_step=3635.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   4%|▍         | 46/1208 [01:45<44:13,  2.28s/it, loss=0.151, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00266, train/loss_step=0.374, global_step=3635.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   4%|▍         | 46/1208 [01:45<44:13,  2.28s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0943, train/loss_vlb_step=0.00032, train/loss_step=0.0943, global_step=3635.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   4%|▍         | 47/1208 [01:46<43:40,  2.26s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0943, train/loss_vlb_step=0.00032, train/loss_step=0.0943, global_step=3635.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   4%|▍         | 47/1208 [01:46<43:40,  2.26s/it, loss=0.185, v_num=0, train/loss_simple_step=0.632, train/loss_vlb_step=0.0274, train/loss_step=0.632, global_step=3635.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:   4%|▍         | 48/1208 [01:49<44:01,  2.28s/it, loss=0.185, v_num=0, train/loss_simple_step=0.632, train/loss_vlb_step=0.0274, train/loss_step=0.632, global_step=3635.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   4%|▍         | 48/1208 [01:49<44:01,  2.28s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.89e-5, train/loss_step=0.0183, global_step=3635.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   4%|▍         | 49/1208 [01:50<43:30,  2.25s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.89e-5, train/loss_step=0.0183, global_step=3635.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   4%|▍         | 49/1208 [01:50<43:30,  2.25s/it, loss=0.199, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00147, train/loss_step=0.324, global_step=3636.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:   4%|▍         | 50/1208 [01:51<42:59,  2.23s/it, loss=0.199, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00147, train/loss_step=0.324, global_step=3636.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   4%|▍         | 50/1208 [01:51<42:59,  2.23s/it, loss=0.2, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=3636.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:   4%|▍         | 51/1208 [01:52<42:30,  2.20s/it, loss=0.2, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=3636.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   4%|▍         | 51/1208 [01:52<42:30,  2.20s/it, loss=0.215, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00407, train/loss_step=0.403, global_step=3636.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   4%|▍         | 52/1208 [01:55<42:52,  2.23s/it, loss=0.215, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00407, train/loss_step=0.403, global_step=3636.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   4%|▍         | 52/1208 [01:55<42:52,  2.23s/it, loss=0.216, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=3636.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   4%|▍         | 53/1208 [01:56<42:24,  2.20s/it, loss=0.216, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=3636.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   4%|▍         | 53/1208 [01:56<42:24,  2.20s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.78e-5, train/loss_step=0.0154, global_step=3637.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   4%|▍         | 54/1208 [01:57<41:57,  2.18s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.78e-5, train/loss_step=0.0154, global_step=3637.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   4%|▍         | 54/1208 [01:57<41:57,  2.18s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000113, train/loss_step=0.0278, global_step=3637.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   5%|▍         | 55/1208 [01:58<41:31,  2.16s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000113, train/loss_step=0.0278, global_step=3637.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   5%|▍         | 55/1208 [01:58<41:31,  2.16s/it, loss=0.171, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.76e-5, train/loss_step=0.013, global_step=3637.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:   5%|▍         | 56/1208 [02:02<41:51,  2.18s/it, loss=0.171, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.76e-5, train/loss_step=0.013, global_step=3637.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   5%|▍         | 56/1208 [02:02<41:52,  2.18s/it, loss=0.204, v_num=0, train/loss_simple_step=0.772, train/loss_vlb_step=0.0197, train/loss_step=0.772, global_step=3637.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:   5%|▍         | 57/1208 [02:03<41:27,  2.16s/it, loss=0.204, v_num=0, train/loss_simple_step=0.772, train/loss_vlb_step=0.0197, train/loss_step=0.772, global_step=3637.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   5%|▍         | 57/1208 [02:03<41:27,  2.16s/it, loss=0.201, v_num=0, train/loss_simple_step=0.00884, train/loss_vlb_step=4.37e-5, train/loss_step=0.00884, global_step=3638.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   5%|▍         | 58/1208 [02:04<41:03,  2.14s/it, loss=0.201, v_num=0, train/loss_simple_step=0.00884, train/loss_vlb_step=4.37e-5, train/loss_step=0.00884, global_step=3638.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   5%|▍         | 58/1208 [02:04<41:03,  2.14s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0889, train/loss_vlb_step=0.000293, train/loss_step=0.0889, global_step=3638.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:   5%|▍         | 59/1208 [02:05<40:39,  2.12s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0889, train/loss_vlb_step=0.000293, train/loss_step=0.0889, global_step=3638.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   5%|▍         | 59/1208 [02:05<40:39,  2.12s/it, loss=0.19, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000464, train/loss_step=0.138, global_step=3638.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:   5%|▍         | 60/1208 [02:08<40:59,  2.14s/it, loss=0.19, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000464, train/loss_step=0.138, global_step=3638.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   5%|▍         | 60/1208 [02:08<40:59,  2.14s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0687, train/loss_vlb_step=0.000241, train/loss_step=0.0687, global_step=3638.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   5%|▌         | 61/1208 [02:09<40:36,  2.12s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0687, train/loss_vlb_step=0.000241, train/loss_step=0.0687, global_step=3638.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   5%|▌         | 61/1208 [02:09<40:36,  2.12s/it, loss=0.177, v_num=0, train/loss_simple_step=0.040, train/loss_vlb_step=0.00015, train/loss_step=0.040, global_step=3639.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:   5%|▌         | 62/1208 [02:10<40:14,  2.11s/it, loss=0.177, v_num=0, train/loss_simple_step=0.040, train/loss_vlb_step=0.00015, train/loss_step=0.040, global_step=3639.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   5%|▌         | 62/1208 [02:10<40:14,  2.11s/it, loss=0.188, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000756, train/loss_step=0.221, global_step=3639.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   5%|▌         | 63/1208 [02:11<39:52,  2.09s/it, loss=0.188, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000756, train/loss_step=0.221, global_step=3639.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   5%|▌         | 63/1208 [02:11<39:52,  2.09s/it, loss=0.193, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000825, train/loss_step=0.222, global_step=3639.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   5%|▌         | 64/1208 [02:14<40:11,  2.11s/it, loss=0.193, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000825, train/loss_step=0.222, global_step=3639.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   5%|▌         | 64/1208 [02:14<40:11,  2.11s/it, loss=0.209, v_num=0, train/loss_simple_step=0.518, train/loss_vlb_step=0.00767, train/loss_step=0.518, global_step=3639.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:   5%|▌         | 65/1208 [02:15<39:51,  2.09s/it, loss=0.209, v_num=0, train/loss_simple_step=0.518, train/loss_vlb_step=0.00767, train/loss_step=0.518, global_step=3639.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   5%|▌         | 65/1208 [02:15<39:51,  2.09s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0794, train/loss_vlb_step=0.000261, train/loss_step=0.0794, global_step=3640.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   5%|▌         | 66/1208 [02:17<39:30,  2.08s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0794, train/loss_vlb_step=0.000261, train/loss_step=0.0794, global_step=3640.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   5%|▌         | 66/1208 [02:17<39:30,  2.08s/it, loss=0.203, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00112, train/loss_step=0.269, global_step=3640.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:   6%|▌         | 67/1208 [02:18<39:11,  2.06s/it, loss=0.203, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00112, train/loss_step=0.269, global_step=3640.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   6%|▌         | 67/1208 [02:18<39:11,  2.06s/it, loss=0.18, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.00056, train/loss_step=0.165, global_step=3640.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:   6%|▌         | 68/1208 [02:21<39:30,  2.08s/it, loss=0.18, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.00056, train/loss_step=0.165, global_step=3640.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   6%|▌         | 68/1208 [02:21<39:30,  2.08s/it, loss=0.18, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.13e-5, train/loss_step=0.020, global_step=3640.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   6%|▌         | 69/1208 [02:22<39:11,  2.06s/it, loss=0.18, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.13e-5, train/loss_step=0.020, global_step=3640.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   6%|▌         | 69/1208 [02:22<39:11,  2.06s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.00012, train/loss_step=0.0316, global_step=3641.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   6%|▌         | 70/1208 [02:23<38:52,  2.05s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.00012, train/loss_step=0.0316, global_step=3641.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   6%|▌         | 70/1208 [02:23<38:52,  2.05s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.22e-5, train/loss_step=0.00205, global_step=3641.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   6%|▌         | 71/1208 [02:24<38:34,  2.04s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.22e-5, train/loss_step=0.00205, global_step=3641.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   6%|▌         | 71/1208 [02:24<38:34,  2.04s/it, loss=0.147, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000489, train/loss_step=0.143, global_step=3641.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:   6%|▌         | 72/1208 [02:27<38:51,  2.05s/it, loss=0.147, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000489, train/loss_step=0.143, global_step=3641.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   6%|▌         | 72/1208 [02:27<38:51,  2.05s/it, loss=0.159, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00178, train/loss_step=0.335, global_step=3641.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:   6%|▌         | 73/1208 [02:28<38:34,  2.04s/it, loss=0.159, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00178, train/loss_step=0.335, global_step=3641.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   6%|▌         | 73/1208 [02:28<38:34,  2.04s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0682, train/loss_vlb_step=0.000232, train/loss_step=0.0682, global_step=3642.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   6%|▌         | 74/1208 [02:29<38:17,  2.03s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0682, train/loss_vlb_step=0.000232, train/loss_step=0.0682, global_step=3642.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   6%|▌         | 74/1208 [02:29<38:17,  2.03s/it, loss=0.18, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.0024, train/loss_step=0.400, global_step=3642.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]     Epoch 12:   6%|▌         | 75/1208 [02:30<38:00,  2.01s/it, loss=0.18, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.0024, train/loss_step=0.400, global_step=3642.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   6%|▌         | 75/1208 [02:30<38:00,  2.01s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00843, train/loss_vlb_step=4.16e-5, train/loss_step=0.00843, global_step=3642.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   6%|▋         | 76/1208 [02:34<38:16,  2.03s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00843, train/loss_vlb_step=4.16e-5, train/loss_step=0.00843, global_step=3642.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   6%|▋         | 76/1208 [02:34<38:16,  2.03s/it, loss=0.147, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=3642.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:   6%|▋         | 77/1208 [02:35<38:00,  2.02s/it, loss=0.147, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=3642.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   6%|▋         | 77/1208 [02:35<38:00,  2.02s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000104, train/loss_step=0.0266, global_step=3643.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   6%|▋         | 78/1208 [02:36<37:44,  2.00s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000104, train/loss_step=0.0266, global_step=3643.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   6%|▋         | 78/1208 [02:36<37:44,  2.00s/it, loss=0.163, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00279, train/loss_step=0.385, global_step=3643.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:   7%|▋         | 79/1208 [02:37<37:28,  1.99s/it, loss=0.163, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00279, train/loss_step=0.385, global_step=3643.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   7%|▋         | 79/1208 [02:37<37:28,  1.99s/it, loss=0.172, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00221, train/loss_step=0.331, global_step=3643.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   7%|▋         | 80/1208 [02:40<37:43,  2.01s/it, loss=0.172, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00221, train/loss_step=0.331, global_step=3643.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   7%|▋         | 80/1208 [02:40<37:43,  2.01s/it, loss=0.177, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000532, train/loss_step=0.156, global_step=3643.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   7%|▋         | 81/1208 [02:41<37:28,  2.00s/it, loss=0.177, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000532, train/loss_step=0.156, global_step=3643.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   7%|▋         | 81/1208 [02:41<37:28,  2.00s/it, loss=0.18, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.00034, train/loss_step=0.103, global_step=3644.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:   7%|▋         | 82/1208 [02:42<37:13,  1.98s/it, loss=0.18, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.00034, train/loss_step=0.103, global_step=3644.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   7%|▋         | 82/1208 [02:42<37:13,  1.98s/it, loss=0.18, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000864, train/loss_step=0.231, global_step=3644.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   7%|▋         | 83/1208 [02:43<36:58,  1.97s/it, loss=0.18, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000864, train/loss_step=0.231, global_step=3644.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   7%|▋         | 83/1208 [02:43<36:58,  1.97s/it, loss=0.183, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00127, train/loss_step=0.278, global_step=3644.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   7%|▋         | 84/1208 [02:46<37:13,  1.99s/it, loss=0.183, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00127, train/loss_step=0.278, global_step=3644.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   7%|▋         | 84/1208 [02:46<37:13,  1.99s/it, loss=0.165, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000541, train/loss_step=0.155, global_step=3644.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   7%|▋         | 85/1208 [02:47<36:59,  1.98s/it, loss=0.165, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000541, train/loss_step=0.155, global_step=3644.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   7%|▋         | 85/1208 [02:47<36:59,  1.98s/it, loss=0.162, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=7.03e-5, train/loss_step=0.016, global_step=3645.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:   7%|▋         | 86/1208 [02:49<36:45,  1.97s/it, loss=0.162, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=7.03e-5, train/loss_step=0.016, global_step=3645.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   7%|▋         | 86/1208 [02:49<36:45,  1.97s/it, loss=0.18, v_num=0, train/loss_simple_step=0.638, train/loss_vlb_step=0.0301, train/loss_step=0.638, global_step=3645.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:   7%|▋         | 87/1208 [02:50<36:31,  1.95s/it, loss=0.18, v_num=0, train/loss_simple_step=0.638, train/loss_vlb_step=0.0301, train/loss_step=0.638, global_step=3645.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   7%|▋         | 87/1208 [02:50<36:31,  1.95s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00638, train/loss_vlb_step=3.12e-5, train/loss_step=0.00638, global_step=3645.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   7%|▋         | 88/1208 [02:53<36:46,  1.97s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00638, train/loss_vlb_step=3.12e-5, train/loss_step=0.00638, global_step=3645.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   7%|▋         | 88/1208 [02:53<36:46,  1.97s/it, loss=0.18, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000611, train/loss_step=0.179, global_step=3645.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:   7%|▋         | 89/1208 [02:54<36:32,  1.96s/it, loss=0.18, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000611, train/loss_step=0.179, global_step=3645.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   7%|▋         | 89/1208 [02:54<36:32,  1.96s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=9.03e-6, train/loss_step=0.00148, global_step=3646.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   7%|▋         | 90/1208 [02:55<36:19,  1.95s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=9.03e-6, train/loss_step=0.00148, global_step=3646.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   7%|▋         | 90/1208 [02:55<36:19,  1.95s/it, loss=0.189, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000852, train/loss_step=0.213, global_step=3646.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:   8%|▊         | 91/1208 [02:56<36:06,  1.94s/it, loss=0.189, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000852, train/loss_step=0.213, global_step=3646.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   8%|▊         | 91/1208 [02:56<36:06,  1.94s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00329, train/loss_vlb_step=1.81e-5, train/loss_step=0.00329, global_step=3646.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   8%|▊         | 92/1208 [02:59<36:20,  1.95s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00329, train/loss_vlb_step=1.81e-5, train/loss_step=0.00329, global_step=3646.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   8%|▊         | 92/1208 [02:59<36:20,  1.95s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.29e-5, train/loss_step=0.0169, global_step=3646.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:   8%|▊         | 93/1208 [03:00<36:07,  1.94s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.29e-5, train/loss_step=0.0169, global_step=3646.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   8%|▊         | 93/1208 [03:00<36:07,  1.94s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0738, train/loss_vlb_step=0.000246, train/loss_step=0.0738, global_step=3647.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   8%|▊         | 94/1208 [03:01<35:54,  1.93s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0738, train/loss_vlb_step=0.000246, train/loss_step=0.0738, global_step=3647.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   8%|▊         | 94/1208 [03:01<35:55,  1.93s/it, loss=0.156, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000717, train/loss_step=0.182, global_step=3647.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:   8%|▊         | 95/1208 [03:02<35:42,  1.92s/it, loss=0.156, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000717, train/loss_step=0.182, global_step=3647.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   8%|▊         | 95/1208 [03:02<35:42,  1.92s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0636, train/loss_vlb_step=0.000219, train/loss_step=0.0636, global_step=3647.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   8%|▊         | 96/1208 [03:06<35:55,  1.94s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0636, train/loss_vlb_step=0.000219, train/loss_step=0.0636, global_step=3647.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   8%|▊         | 96/1208 [03:06<35:55,  1.94s/it, loss=0.16, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000473, train/loss_step=0.139, global_step=3647.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:   8%|▊         | 97/1208 [03:07<35:44,  1.93s/it, loss=0.16, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000473, train/loss_step=0.139, global_step=3647.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   8%|▊         | 97/1208 [03:07<35:44,  1.93s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0567, train/loss_vlb_step=0.0002, train/loss_step=0.0567, global_step=3648.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   8%|▊         | 98/1208 [03:08<35:31,  1.92s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0567, train/loss_vlb_step=0.0002, train/loss_step=0.0567, global_step=3648.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   8%|▊         | 98/1208 [03:08<35:31,  1.92s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0589, train/loss_vlb_step=0.0002, train/loss_step=0.0589, global_step=3648.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   8%|▊         | 99/1208 [03:09<35:20,  1.91s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0589, train/loss_vlb_step=0.0002, train/loss_step=0.0589, global_step=3648.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   8%|▊         | 99/1208 [03:09<35:20,  1.91s/it, loss=0.135, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=3648.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   8%|▊         | 100/1208 [03:12<35:33,  1.93s/it, loss=0.135, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=3648.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   8%|▊         | 100/1208 [03:12<35:33,  1.93s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=7.15e-5, train/loss_step=0.0159, global_step=3648.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   8%|▊         | 101/1208 [03:13<35:21,  1.92s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=7.15e-5, train/loss_step=0.0159, global_step=3648.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   8%|▊         | 101/1208 [03:13<35:21,  1.92s/it, loss=0.137, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00129, train/loss_step=0.282, global_step=3649.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:   8%|▊         | 102/1208 [03:14<35:10,  1.91s/it, loss=0.137, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00129, train/loss_step=0.282, global_step=3649.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   8%|▊         | 102/1208 [03:14<35:10,  1.91s/it, loss=0.136, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.00072, train/loss_step=0.210, global_step=3649.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   9%|▊         | 103/1208 [03:15<34:59,  1.90s/it, loss=0.136, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.00072, train/loss_step=0.210, global_step=3649.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   9%|▊         | 103/1208 [03:15<34:59,  1.90s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.43e-5, train/loss_step=0.0119, global_step=3649.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   9%|▊         | 104/1208 [03:18<35:11,  1.91s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.43e-5, train/loss_step=0.0119, global_step=3649.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   9%|▊         | 104/1208 [03:18<35:11,  1.91s/it, loss=0.128, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00127, train/loss_step=0.271, global_step=3649.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:   9%|▊         | 105/1208 [03:20<35:01,  1.90s/it, loss=0.128, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00127, train/loss_step=0.271, global_step=3649.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   9%|▊         | 105/1208 [03:20<35:01,  1.90s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.01e-5, train/loss_step=0.0108, global_step=3650.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   9%|▉         | 106/1208 [03:21<34:50,  1.90s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.01e-5, train/loss_step=0.0108, global_step=3650.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   9%|▉         | 106/1208 [03:21<34:50,  1.90s/it, loss=0.107, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000903, train/loss_step=0.222, global_step=3650.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:   9%|▉         | 107/1208 [03:22<34:39,  1.89s/it, loss=0.107, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000903, train/loss_step=0.222, global_step=3650.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   9%|▉         | 107/1208 [03:22<34:39,  1.89s/it, loss=0.138, v_num=0, train/loss_simple_step=0.623, train/loss_vlb_step=0.0194, train/loss_step=0.623, global_step=3650.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:   9%|▉         | 108/1208 [03:25<34:52,  1.90s/it, loss=0.138, v_num=0, train/loss_simple_step=0.623, train/loss_vlb_step=0.0194, train/loss_step=0.623, global_step=3650.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   9%|▉         | 108/1208 [03:25<34:52,  1.90s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.74e-5, train/loss_step=0.0032, global_step=3650.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   9%|▉         | 109/1208 [03:26<34:41,  1.89s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.74e-5, train/loss_step=0.0032, global_step=3650.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   9%|▉         | 109/1208 [03:26<34:41,  1.89s/it, loss=0.136, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.00044, train/loss_step=0.133, global_step=3651.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:   9%|▉         | 110/1208 [03:27<34:31,  1.89s/it, loss=0.136, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.00044, train/loss_step=0.133, global_step=3651.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   9%|▉         | 110/1208 [03:27<34:31,  1.89s/it, loss=0.131, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000394, train/loss_step=0.119, global_step=3651.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   9%|▉         | 111/1208 [03:28<34:21,  1.88s/it, loss=0.131, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000394, train/loss_step=0.119, global_step=3651.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   9%|▉         | 111/1208 [03:28<34:21,  1.88s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000102, train/loss_step=0.0263, global_step=3651.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   9%|▉         | 112/1208 [03:31<34:33,  1.89s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000102, train/loss_step=0.0263, global_step=3651.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   9%|▉         | 112/1208 [03:31<34:33,  1.89s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.000114, train/loss_step=0.0292, global_step=3651.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   9%|▉         | 113/1208 [03:32<34:23,  1.88s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.000114, train/loss_step=0.0292, global_step=3651.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   9%|▉         | 113/1208 [03:32<34:23,  1.88s/it, loss=0.138, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000686, train/loss_step=0.189, global_step=3652.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:   9%|▉         | 114/1208 [03:33<34:13,  1.88s/it, loss=0.138, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000686, train/loss_step=0.189, global_step=3652.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:   9%|▉         | 114/1208 [03:33<34:13,  1.88s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0719, train/loss_vlb_step=0.000246, train/loss_step=0.0719, global_step=3652.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  10%|▉         | 115/1208 [03:35<34:03,  1.87s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0719, train/loss_vlb_step=0.000246, train/loss_step=0.0719, global_step=3652.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  10%|▉         | 115/1208 [03:35<34:03,  1.87s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0452, train/loss_vlb_step=0.00016, train/loss_step=0.0452, global_step=3652.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  10%|▉         | 116/1208 [03:38<34:14,  1.88s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0452, train/loss_vlb_step=0.00016, train/loss_step=0.0452, global_step=3652.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  10%|▉         | 116/1208 [03:38<34:14,  1.88s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00141, train/loss_vlb_step=8.37e-6, train/loss_step=0.00141, global_step=3652.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  10%|▉         | 117/1208 [03:39<34:05,  1.87s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00141, train/loss_vlb_step=8.37e-6, train/loss_step=0.00141, global_step=3652.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  10%|▉         | 117/1208 [03:39<34:05,  1.87s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.06e-5, train/loss_step=0.0172, global_step=3653.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  10%|▉         | 118/1208 [03:40<33:55,  1.87s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.06e-5, train/loss_step=0.0172, global_step=3653.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  10%|▉         | 118/1208 [03:40<33:55,  1.87s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0758, train/loss_vlb_step=0.000254, train/loss_step=0.0758, global_step=3653.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  10%|▉         | 119/1208 [03:41<33:46,  1.86s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0758, train/loss_vlb_step=0.000254, train/loss_step=0.0758, global_step=3653.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  10%|▉         | 119/1208 [03:41<33:46,  1.86s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.000162, train/loss_step=0.0468, global_step=3653.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  10%|▉         | 120/1208 [03:44<33:57,  1.87s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.000162, train/loss_step=0.0468, global_step=3653.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  10%|▉         | 120/1208 [03:44<33:57,  1.87s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.79e-5, train/loss_step=0.0184, global_step=3653.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  10%|█         | 121/1208 [03:45<33:48,  1.87s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.79e-5, train/loss_step=0.0184, global_step=3653.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  10%|█         | 121/1208 [03:45<33:48,  1.87s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.31e-5, train/loss_step=0.0176, global_step=3654.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  10%|█         | 122/1208 [03:46<33:39,  1.86s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.31e-5, train/loss_step=0.0176, global_step=3654.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  10%|█         | 122/1208 [03:46<33:39,  1.86s/it, loss=0.099, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.000176, train/loss_step=0.0471, global_step=3654.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  10%|█         | 123/1208 [03:47<33:29,  1.85s/it, loss=0.099, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.000176, train/loss_step=0.0471, global_step=3654.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  10%|█         | 123/1208 [03:47<33:29,  1.85s/it, loss=0.105, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000449, train/loss_step=0.132, global_step=3654.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  10%|█         | 124/1208 [03:51<33:40,  1.86s/it, loss=0.105, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000449, train/loss_step=0.132, global_step=3654.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  10%|█         | 124/1208 [03:51<33:40,  1.86s/it, loss=0.121, v_num=0, train/loss_simple_step=0.587, train/loss_vlb_step=0.00795, train/loss_step=0.587, global_step=3654.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  10%|█         | 125/1208 [03:52<33:31,  1.86s/it, loss=0.121, v_num=0, train/loss_simple_step=0.587, train/loss_vlb_step=0.00795, train/loss_step=0.587, global_step=3654.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  10%|█         | 125/1208 [03:52<33:31,  1.86s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.59e-5, train/loss_step=0.0123, global_step=3655.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  10%|█         | 126/1208 [03:53<33:22,  1.85s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.59e-5, train/loss_step=0.0123, global_step=3655.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  10%|█         | 126/1208 [03:53<33:22,  1.85s/it, loss=0.122, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.001, train/loss_step=0.235, global_step=3655.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  11%|█         | 127/1208 [03:54<33:13,  1.84s/it, loss=0.122, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.001, train/loss_step=0.235, global_step=3655.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  11%|█         | 127/1208 [03:54<33:13,  1.84s/it, loss=0.105, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00137, train/loss_step=0.297, global_step=3655.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  11%|█         | 128/1208 [03:57<33:23,  1.86s/it, loss=0.105, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00137, train/loss_step=0.297, global_step=3655.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  11%|█         | 128/1208 [03:57<33:23,  1.86s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00307, train/loss_vlb_step=1.62e-5, train/loss_step=0.00307, global_step=3655.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  11%|█         | 129/1208 [03:58<33:15,  1.85s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00307, train/loss_vlb_step=1.62e-5, train/loss_step=0.00307, global_step=3655.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  11%|█         | 129/1208 [03:58<33:15,  1.85s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.23e-5, train/loss_step=0.020, global_step=3656.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  11%|█         | 130/1208 [03:59<33:06,  1.84s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.23e-5, train/loss_step=0.020, global_step=3656.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  11%|█         | 130/1208 [03:59<33:06,  1.84s/it, loss=0.103, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000636, train/loss_step=0.183, global_step=3656.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  11%|█         | 131/1208 [04:00<32:58,  1.84s/it, loss=0.103, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000636, train/loss_step=0.183, global_step=3656.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  11%|█         | 131/1208 [04:00<32:58,  1.84s/it, loss=0.11, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000607, train/loss_step=0.177, global_step=3656.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  11%|█         | 132/1208 [04:03<33:08,  1.85s/it, loss=0.11, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000607, train/loss_step=0.177, global_step=3656.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  11%|█         | 132/1208 [04:03<33:08,  1.85s/it, loss=0.116, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000466, train/loss_step=0.135, global_step=3656.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  11%|█         | 133/1208 [04:04<33:00,  1.84s/it, loss=0.116, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000466, train/loss_step=0.135, global_step=3656.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  11%|█         | 133/1208 [04:04<33:00,  1.84s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00736, train/loss_vlb_step=3.63e-5, train/loss_step=0.00736, global_step=3657.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  11%|█         | 134/1208 [04:06<32:51,  1.84s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00736, train/loss_vlb_step=3.63e-5, train/loss_step=0.00736, global_step=3657.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  11%|█         | 134/1208 [04:06<32:51,  1.84s/it, loss=0.113, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.00076, train/loss_step=0.204, global_step=3657.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  11%|█         | 135/1208 [04:07<32:43,  1.83s/it, loss=0.113, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.00076, train/loss_step=0.204, global_step=3657.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  11%|█         | 135/1208 [04:07<32:43,  1.83s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00803, train/loss_vlb_step=3.55e-5, train/loss_step=0.00803, global_step=3657.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  11%|█▏        | 136/1208 [04:10<32:52,  1.84s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00803, train/loss_vlb_step=3.55e-5, train/loss_step=0.00803, global_step=3657.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  11%|█▏        | 136/1208 [04:10<32:52,  1.84s/it, loss=0.123, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.00101, train/loss_step=0.230, global_step=3657.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  11%|█▏        | 137/1208 [04:11<32:45,  1.83s/it, loss=0.123, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.00101, train/loss_step=0.230, global_step=3657.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  11%|█▏        | 137/1208 [04:11<32:45,  1.83s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0544, train/loss_vlb_step=0.00019, train/loss_step=0.0544, global_step=3658.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  11%|█▏        | 138/1208 [04:12<32:37,  1.83s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0544, train/loss_vlb_step=0.00019, train/loss_step=0.0544, global_step=3658.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  11%|█▏        | 138/1208 [04:12<32:37,  1.83s/it, loss=0.128, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000522, train/loss_step=0.155, global_step=3658.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  12%|█▏        | 139/1208 [04:13<32:29,  1.82s/it, loss=0.128, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000522, train/loss_step=0.155, global_step=3658.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  12%|█▏        | 139/1208 [04:13<32:29,  1.82s/it, loss=0.141, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00138, train/loss_step=0.298, global_step=3658.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  12%|█▏        | 140/1208 [04:16<32:38,  1.83s/it, loss=0.141, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00138, train/loss_step=0.298, global_step=3658.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  12%|█▏        | 140/1208 [04:16<32:38,  1.83s/it, loss=0.157, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00272, train/loss_step=0.338, global_step=3658.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  12%|█▏        | 141/1208 [04:17<32:30,  1.83s/it, loss=0.157, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00272, train/loss_step=0.338, global_step=3658.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  12%|█▏        | 141/1208 [04:17<32:30,  1.83s/it, loss=0.168, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000892, train/loss_step=0.237, global_step=3659.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  12%|█▏        | 142/1208 [04:18<32:22,  1.82s/it, loss=0.168, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000892, train/loss_step=0.237, global_step=3659.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  12%|█▏        | 142/1208 [04:18<32:22,  1.82s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0044, train/loss_vlb_step=2.33e-5, train/loss_step=0.0044, global_step=3659.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  12%|█▏        | 143/1208 [04:19<32:14,  1.82s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0044, train/loss_vlb_step=2.33e-5, train/loss_step=0.0044, global_step=3659.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  12%|█▏        | 143/1208 [04:19<32:14,  1.82s/it, loss=0.174, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00156, train/loss_step=0.290, global_step=3659.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  12%|█▏        | 144/1208 [04:23<32:24,  1.83s/it, loss=0.174, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00156, train/loss_step=0.290, global_step=3659.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  12%|█▏        | 144/1208 [04:23<32:24,  1.83s/it, loss=0.175, v_num=0, train/loss_simple_step=0.605, train/loss_vlb_step=0.0161, train/loss_step=0.605, global_step=3659.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  12%|█▏        | 145/1208 [04:24<32:16,  1.82s/it, loss=0.175, v_num=0, train/loss_simple_step=0.605, train/loss_vlb_step=0.0161, train/loss_step=0.605, global_step=3659.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  12%|█▏        | 145/1208 [04:24<32:16,  1.82s/it, loss=0.176, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000144, train/loss_step=0.042, global_step=3660.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  12%|█▏        | 146/1208 [04:25<32:08,  1.82s/it, loss=0.176, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000144, train/loss_step=0.042, global_step=3660.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  12%|█▏        | 146/1208 [04:25<32:08,  1.82s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.59e-5, train/loss_step=0.0028, global_step=3660.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  12%|█▏        | 147/1208 [04:26<32:01,  1.81s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.59e-5, train/loss_step=0.0028, global_step=3660.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  12%|█▏        | 147/1208 [04:26<32:01,  1.81s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.91e-5, train/loss_step=0.0212, global_step=3660.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  12%|█▏        | 148/1208 [04:29<32:10,  1.82s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.91e-5, train/loss_step=0.0212, global_step=3660.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  12%|█▏        | 148/1208 [04:29<32:10,  1.82s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0694, train/loss_vlb_step=0.000233, train/loss_step=0.0694, global_step=3660.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  12%|█▏        | 149/1208 [04:30<32:03,  1.82s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0694, train/loss_vlb_step=0.000233, train/loss_step=0.0694, global_step=3660.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  12%|█▏        | 149/1208 [04:30<32:03,  1.82s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=9.96e-5, train/loss_step=0.0248, global_step=3661.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  12%|█▏        | 150/1208 [04:31<31:56,  1.81s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=9.96e-5, train/loss_step=0.0248, global_step=3661.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  12%|█▏        | 150/1208 [04:31<31:56,  1.81s/it, loss=0.177, v_num=0, train/loss_simple_step=0.635, train/loss_vlb_step=0.0137, train/loss_step=0.635, global_step=3661.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  12%|█▎        | 151/1208 [04:32<31:48,  1.81s/it, loss=0.177, v_num=0, train/loss_simple_step=0.635, train/loss_vlb_step=0.0137, train/loss_step=0.635, global_step=3661.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  12%|█▎        | 151/1208 [04:32<31:48,  1.81s/it, loss=0.182, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00107, train/loss_step=0.270, global_step=3661.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  13%|█▎        | 152/1208 [04:35<31:57,  1.82s/it, loss=0.182, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00107, train/loss_step=0.270, global_step=3661.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  13%|█▎        | 152/1208 [04:35<31:57,  1.82s/it, loss=0.182, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.00045, train/loss_step=0.137, global_step=3661.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  13%|█▎        | 153/1208 [04:37<31:50,  1.81s/it, loss=0.182, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.00045, train/loss_step=0.137, global_step=3661.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  13%|█▎        | 153/1208 [04:37<31:50,  1.81s/it, loss=0.194, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00127, train/loss_step=0.261, global_step=3662.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  13%|█▎        | 154/1208 [04:38<31:43,  1.81s/it, loss=0.194, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00127, train/loss_step=0.261, global_step=3662.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  13%|█▎        | 154/1208 [04:38<31:43,  1.81s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000132, train/loss_step=0.0372, global_step=3662.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  13%|█▎        | 155/1208 [04:39<31:36,  1.80s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000132, train/loss_step=0.0372, global_step=3662.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  13%|█▎        | 155/1208 [04:39<31:36,  1.80s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.53e-5, train/loss_step=0.0167, global_step=3662.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  13%|█▎        | 156/1208 [04:42<31:44,  1.81s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.53e-5, train/loss_step=0.0167, global_step=3662.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  13%|█▎        | 156/1208 [04:42<31:44,  1.81s/it, loss=0.183, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000514, train/loss_step=0.153, global_step=3662.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  13%|█▎        | 157/1208 [04:43<31:37,  1.81s/it, loss=0.183, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000514, train/loss_step=0.153, global_step=3662.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  13%|█▎        | 157/1208 [04:43<31:37,  1.81s/it, loss=0.186, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000392, train/loss_step=0.117, global_step=3663.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  13%|█▎        | 158/1208 [04:44<31:30,  1.80s/it, loss=0.186, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000392, train/loss_step=0.117, global_step=3663.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  13%|█▎        | 158/1208 [04:44<31:30,  1.80s/it, loss=0.198, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00223, train/loss_step=0.404, global_step=3663.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  13%|█▎        | 159/1208 [04:45<31:23,  1.80s/it, loss=0.198, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00223, train/loss_step=0.404, global_step=3663.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  13%|█▎        | 159/1208 [04:45<31:23,  1.80s/it, loss=0.189, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000398, train/loss_step=0.121, global_step=3663.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  13%|█▎        | 160/1208 [04:48<31:31,  1.81s/it, loss=0.189, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000398, train/loss_step=0.121, global_step=3663.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  13%|█▎        | 160/1208 [04:48<31:31,  1.81s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.91e-5, train/loss_step=0.00341, global_step=3663.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  13%|█▎        | 161/1208 [04:49<31:25,  1.80s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.91e-5, train/loss_step=0.00341, global_step=3663.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  13%|█▎        | 161/1208 [04:49<31:25,  1.80s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.56e-5, train/loss_step=0.00272, global_step=3664.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  13%|█▎        | 162/1208 [04:50<31:18,  1.80s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.56e-5, train/loss_step=0.00272, global_step=3664.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  13%|█▎        | 162/1208 [04:50<31:18,  1.80s/it, loss=0.166, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000379, train/loss_step=0.114, global_step=3664.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  13%|█▎        | 163/1208 [04:51<31:11,  1.79s/it, loss=0.166, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000379, train/loss_step=0.114, global_step=3664.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  13%|█▎        | 163/1208 [04:51<31:11,  1.79s/it, loss=0.159, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000494, train/loss_step=0.148, global_step=3664.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  14%|█▎        | 164/1208 [04:55<31:19,  1.80s/it, loss=0.159, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000494, train/loss_step=0.148, global_step=3664.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  14%|█▎        | 164/1208 [04:55<31:19,  1.80s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0472, train/loss_vlb_step=0.000165, train/loss_step=0.0472, global_step=3664.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  14%|█▎        | 165/1208 [04:56<31:13,  1.80s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0472, train/loss_vlb_step=0.000165, train/loss_step=0.0472, global_step=3664.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  14%|█▎        | 165/1208 [04:56<31:13,  1.80s/it, loss=0.138, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000569, train/loss_step=0.166, global_step=3665.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  14%|█▎        | 166/1208 [04:57<31:06,  1.79s/it, loss=0.138, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000569, train/loss_step=0.166, global_step=3665.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  14%|█▎        | 166/1208 [04:57<31:06,  1.79s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.000155, train/loss_step=0.0418, global_step=3665.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  14%|█▍        | 167/1208 [04:58<31:00,  1.79s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.000155, train/loss_step=0.0418, global_step=3665.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  14%|█▍        | 167/1208 [04:58<31:00,  1.79s/it, loss=0.154, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00143, train/loss_step=0.320, global_step=3665.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  14%|█▍        | 168/1208 [05:01<31:07,  1.80s/it, loss=0.154, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00143, train/loss_step=0.320, global_step=3665.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  14%|█▍        | 168/1208 [05:01<31:07,  1.80s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00984, train/loss_vlb_step=4.65e-5, train/loss_step=0.00984, global_step=3665.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  14%|█▍        | 169/1208 [05:02<31:01,  1.79s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00984, train/loss_vlb_step=4.65e-5, train/loss_step=0.00984, global_step=3665.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  14%|█▍        | 169/1208 [05:02<31:01,  1.79s/it, loss=0.157, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000456, train/loss_step=0.138, global_step=3666.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  14%|█▍        | 170/1208 [05:03<30:54,  1.79s/it, loss=0.157, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000456, train/loss_step=0.138, global_step=3666.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  14%|█▍        | 170/1208 [05:03<30:54,  1.79s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000229, train/loss_step=0.0676, global_step=3666.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  14%|█▍        | 171/1208 [05:04<30:48,  1.78s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000229, train/loss_step=0.0676, global_step=3666.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  14%|█▍        | 171/1208 [05:04<30:48,  1.78s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00731, train/loss_vlb_step=3.69e-5, train/loss_step=0.00731, global_step=3666.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  14%|█▍        | 172/1208 [05:08<30:55,  1.79s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00731, train/loss_vlb_step=3.69e-5, train/loss_step=0.00731, global_step=3666.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  14%|█▍        | 172/1208 [05:08<30:55,  1.79s/it, loss=0.12, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.00091, train/loss_step=0.226, global_step=3666.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]     Epoch 12:  14%|█▍        | 173/1208 [05:09<30:49,  1.79s/it, loss=0.12, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.00091, train/loss_step=0.226, global_step=3666.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  14%|█▍        | 173/1208 [05:09<30:49,  1.79s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00824, train/loss_vlb_step=4.08e-5, train/loss_step=0.00824, global_step=3667.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  14%|█▍        | 174/1208 [05:10<30:42,  1.78s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00824, train/loss_vlb_step=4.08e-5, train/loss_step=0.00824, global_step=3667.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  14%|█▍        | 174/1208 [05:10<30:42,  1.78s/it, loss=0.112, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=3667.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  14%|█▍        | 175/1208 [05:11<30:36,  1.78s/it, loss=0.112, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=3667.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  14%|█▍        | 175/1208 [05:11<30:36,  1.78s/it, loss=0.156, v_num=0, train/loss_simple_step=0.897, train/loss_vlb_step=0.0764, train/loss_step=0.897, global_step=3667.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  15%|█▍        | 176/1208 [05:14<30:43,  1.79s/it, loss=0.156, v_num=0, train/loss_simple_step=0.897, train/loss_vlb_step=0.0764, train/loss_step=0.897, global_step=3667.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  15%|█▍        | 176/1208 [05:14<30:43,  1.79s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000115, train/loss_step=0.0273, global_step=3667.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  15%|█▍        | 177/1208 [05:15<30:37,  1.78s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000115, train/loss_step=0.0273, global_step=3667.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  15%|█▍        | 177/1208 [05:15<30:37,  1.78s/it, loss=0.155, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000969, train/loss_step=0.237, global_step=3668.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  15%|█▍        | 178/1208 [05:16<30:31,  1.78s/it, loss=0.155, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000969, train/loss_step=0.237, global_step=3668.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  15%|█▍        | 178/1208 [05:16<30:31,  1.78s/it, loss=0.149, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00127, train/loss_step=0.282, global_step=3668.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  15%|█▍        | 179/1208 [05:17<30:25,  1.77s/it, loss=0.149, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00127, train/loss_step=0.282, global_step=3668.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  15%|█▍        | 179/1208 [05:17<30:25,  1.77s/it, loss=0.159, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00136, train/loss_step=0.309, global_step=3668.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  15%|█▍        | 180/1208 [05:20<30:32,  1.78s/it, loss=0.159, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00136, train/loss_step=0.309, global_step=3668.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  15%|█▍        | 180/1208 [05:20<30:32,  1.78s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00477, train/loss_vlb_step=2.4e-5, train/loss_step=0.00477, global_step=3668.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  15%|█▍        | 181/1208 [05:21<30:26,  1.78s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00477, train/loss_vlb_step=2.4e-5, train/loss_step=0.00477, global_step=3668.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  15%|█▍        | 181/1208 [05:21<30:26,  1.78s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.56e-5, train/loss_step=0.0122, global_step=3669.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  15%|█▌        | 182/1208 [05:22<30:20,  1.77s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.56e-5, train/loss_step=0.0122, global_step=3669.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  15%|█▌        | 182/1208 [05:22<30:20,  1.77s/it, loss=0.175, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00401, train/loss_step=0.425, global_step=3669.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  15%|█▌        | 183/1208 [05:24<30:14,  1.77s/it, loss=0.175, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00401, train/loss_step=0.425, global_step=3669.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  15%|█▌        | 183/1208 [05:24<30:14,  1.77s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000122, train/loss_step=0.0317, global_step=3669.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  15%|█▌        | 184/1208 [05:27<30:21,  1.78s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000122, train/loss_step=0.0317, global_step=3669.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  15%|█▌        | 184/1208 [05:27<30:21,  1.78s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0812, train/loss_vlb_step=0.000276, train/loss_step=0.0812, global_step=3669.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  15%|█▌        | 185/1208 [05:28<30:15,  1.77s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0812, train/loss_vlb_step=0.000276, train/loss_step=0.0812, global_step=3669.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  15%|█▌        | 185/1208 [05:28<30:15,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.18e-5, train/loss_step=0.00203, global_step=3670.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  15%|█▌        | 186/1208 [05:29<30:09,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.18e-5, train/loss_step=0.00203, global_step=3670.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  15%|█▌        | 186/1208 [05:29<30:09,  1.77s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.89e-5, train/loss_step=0.0186, global_step=3670.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  15%|█▌        | 187/1208 [05:30<30:03,  1.77s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.89e-5, train/loss_step=0.0186, global_step=3670.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  15%|█▌        | 187/1208 [05:30<30:03,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00186, train/loss_step=0.335, global_step=3670.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  16%|█▌        | 188/1208 [05:33<30:10,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00186, train/loss_step=0.335, global_step=3670.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  16%|█▌        | 188/1208 [05:33<30:10,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00401, train/loss_vlb_step=2.17e-5, train/loss_step=0.00401, global_step=3670.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  16%|█▌        | 189/1208 [05:34<30:04,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00401, train/loss_vlb_step=2.17e-5, train/loss_step=0.00401, global_step=3670.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  16%|█▌        | 189/1208 [05:34<30:04,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000476, train/loss_step=0.143, global_step=3671.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  16%|█▌        | 190/1208 [05:35<29:59,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000476, train/loss_step=0.143, global_step=3671.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  16%|█▌        | 190/1208 [05:35<29:59,  1.77s/it, loss=0.161, v_num=0, train/loss_simple_step=0.047, train/loss_vlb_step=0.000166, train/loss_step=0.047, global_step=3671.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  16%|█▌        | 191/1208 [05:36<29:53,  1.76s/it, loss=0.161, v_num=0, train/loss_simple_step=0.047, train/loss_vlb_step=0.000166, train/loss_step=0.047, global_step=3671.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  16%|█▌        | 191/1208 [05:36<29:53,  1.76s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=7.94e-5, train/loss_step=0.0199, global_step=3671.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  16%|█▌        | 192/1208 [05:40<29:59,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=7.94e-5, train/loss_step=0.0199, global_step=3671.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  16%|█▌        | 192/1208 [05:40<29:59,  1.77s/it, loss=0.165, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00152, train/loss_step=0.284, global_step=3671.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  16%|█▌        | 193/1208 [05:41<29:54,  1.77s/it, loss=0.165, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00152, train/loss_step=0.284, global_step=3671.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  16%|█▌        | 193/1208 [05:41<29:54,  1.77s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.5e-5, train/loss_step=0.0206, global_step=3672.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  16%|█▌        | 194/1208 [05:42<29:48,  1.76s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.5e-5, train/loss_step=0.0206, global_step=3672.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  16%|█▌        | 194/1208 [05:42<29:48,  1.76s/it, loss=0.16, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.41e-5, train/loss_step=0.020, global_step=3672.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  16%|█▌        | 195/1208 [05:43<29:43,  1.76s/it, loss=0.16, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.41e-5, train/loss_step=0.020, global_step=3672.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  16%|█▌        | 195/1208 [05:43<29:43,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000743, train/loss_step=0.216, global_step=3672.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  16%|█▌        | 196/1208 [05:46<29:49,  1.77s/it, loss=0.126, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000743, train/loss_step=0.216, global_step=3672.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  16%|█▌        | 196/1208 [05:46<29:49,  1.77s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0693, train/loss_vlb_step=0.00024, train/loss_step=0.0693, global_step=3672.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  16%|█▋        | 197/1208 [05:47<29:43,  1.76s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0693, train/loss_vlb_step=0.00024, train/loss_step=0.0693, global_step=3672.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  16%|█▋        | 197/1208 [05:47<29:43,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000686, train/loss_step=0.189, global_step=3673.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  16%|█▋        | 198/1208 [05:48<29:38,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000686, train/loss_step=0.189, global_step=3673.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  16%|█▋        | 198/1208 [05:48<29:38,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.92e-5, train/loss_step=0.0108, global_step=3673.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  16%|█▋        | 199/1208 [05:49<29:32,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.92e-5, train/loss_step=0.0108, global_step=3673.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  16%|█▋        | 199/1208 [05:49<29:32,  1.76s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000112, train/loss_step=0.0283, global_step=3673.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  17%|█▋        | 200/1208 [05:52<29:38,  1.76s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000112, train/loss_step=0.0283, global_step=3673.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  17%|█▋        | 200/1208 [05:52<29:38,  1.76s/it, loss=0.115, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00196, train/loss_step=0.348, global_step=3673.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  17%|█▋        | 201/1208 [05:53<29:33,  1.76s/it, loss=0.115, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00196, train/loss_step=0.348, global_step=3673.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  17%|█▋        | 201/1208 [05:53<29:33,  1.76s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0727, train/loss_vlb_step=0.000249, train/loss_step=0.0727, global_step=3674.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  17%|█▋        | 202/1208 [05:54<29:27,  1.76s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0727, train/loss_vlb_step=0.000249, train/loss_step=0.0727, global_step=3674.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  17%|█▋        | 202/1208 [05:54<29:27,  1.76s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.000128, train/loss_step=0.0347, global_step=3674.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  17%|█▋        | 203/1208 [05:56<29:22,  1.75s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.000128, train/loss_step=0.0347, global_step=3674.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  17%|█▋        | 203/1208 [05:56<29:22,  1.75s/it, loss=0.0993, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000145, train/loss_step=0.0405, global_step=3674.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  17%|█▋        | 204/1208 [05:59<29:28,  1.76s/it, loss=0.0993, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000145, train/loss_step=0.0405, global_step=3674.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  17%|█▋        | 204/1208 [05:59<29:28,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.482, train/loss_vlb_step=0.00449, train/loss_step=0.482, global_step=3674.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  17%|█▋        | 205/1208 [06:00<29:23,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.482, train/loss_vlb_step=0.00449, train/loss_step=0.482, global_step=3674.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  17%|█▋        | 205/1208 [06:00<29:23,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00264, train/loss_vlb_step=1.56e-5, train/loss_step=0.00264, global_step=3675.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  17%|█▋        | 206/1208 [06:01<29:18,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00264, train/loss_vlb_step=1.56e-5, train/loss_step=0.00264, global_step=3675.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  17%|█▋        | 206/1208 [06:01<29:18,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.44e-5, train/loss_step=0.024, global_step=3675.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]     Epoch 12:  17%|█▋        | 207/1208 [06:02<29:12,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.44e-5, train/loss_step=0.024, global_step=3675.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  17%|█▋        | 207/1208 [06:02<29:12,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.25e-5, train/loss_step=0.00212, global_step=3675.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  17%|█▋        | 208/1208 [06:05<29:18,  1.76s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.25e-5, train/loss_step=0.00212, global_step=3675.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  17%|█▋        | 208/1208 [06:05<29:18,  1.76s/it, loss=0.109, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=3675.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  17%|█▋        | 209/1208 [06:06<29:13,  1.76s/it, loss=0.109, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=3675.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  17%|█▋        | 209/1208 [06:06<29:13,  1.76s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=7.01e-5, train/loss_step=0.0159, global_step=3676.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  17%|█▋        | 210/1208 [06:07<29:08,  1.75s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=7.01e-5, train/loss_step=0.0159, global_step=3676.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  17%|█▋        | 210/1208 [06:07<29:08,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00159, train/loss_step=0.319, global_step=3676.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  17%|█▋        | 211/1208 [06:08<29:03,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00159, train/loss_step=0.319, global_step=3676.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  17%|█▋        | 211/1208 [06:08<29:03,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0498, train/loss_vlb_step=0.000178, train/loss_step=0.0498, global_step=3676.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  18%|█▊        | 212/1208 [06:12<29:08,  1.76s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0498, train/loss_vlb_step=0.000178, train/loss_step=0.0498, global_step=3676.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  18%|█▊        | 212/1208 [06:12<29:08,  1.76s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0633, train/loss_vlb_step=0.000215, train/loss_step=0.0633, global_step=3676.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  18%|█▊        | 213/1208 [06:13<29:03,  1.75s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0633, train/loss_vlb_step=0.000215, train/loss_step=0.0633, global_step=3676.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  18%|█▊        | 213/1208 [06:13<29:03,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00458, train/loss_step=0.447, global_step=3677.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  18%|█▊        | 214/1208 [06:14<28:58,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00458, train/loss_step=0.447, global_step=3677.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  18%|█▊        | 214/1208 [06:14<28:58,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000335, train/loss_step=0.101, global_step=3677.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  18%|█▊        | 215/1208 [06:15<28:53,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000335, train/loss_step=0.101, global_step=3677.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  18%|█▊        | 215/1208 [06:15<28:53,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=3677.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  18%|█▊        | 216/1208 [06:18<28:58,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=3677.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  18%|█▊        | 216/1208 [06:18<28:58,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000406, train/loss_step=0.124, global_step=3677.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  18%|█▊        | 217/1208 [06:19<28:53,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000406, train/loss_step=0.124, global_step=3677.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  18%|█▊        | 217/1208 [06:19<28:53,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.467, train/loss_vlb_step=0.00465, train/loss_step=0.467, global_step=3678.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  18%|█▊        | 218/1208 [06:20<28:48,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.467, train/loss_vlb_step=0.00465, train/loss_step=0.467, global_step=3678.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  18%|█▊        | 218/1208 [06:20<28:48,  1.75s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.87e-5, train/loss_step=0.0184, global_step=3678.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  18%|█▊        | 219/1208 [06:21<28:43,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.87e-5, train/loss_step=0.0184, global_step=3678.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  18%|█▊        | 219/1208 [06:21<28:43,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000106, train/loss_step=0.0265, global_step=3678.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  18%|█▊        | 220/1208 [06:25<28:49,  1.75s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000106, train/loss_step=0.0265, global_step=3678.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  18%|█▊        | 220/1208 [06:25<28:49,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=1.31e-5, train/loss_step=0.00223, global_step=3678.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  18%|█▊        | 221/1208 [06:26<28:44,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=1.31e-5, train/loss_step=0.00223, global_step=3678.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  18%|█▊        | 221/1208 [06:26<28:44,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000476, train/loss_step=0.139, global_step=3679.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  18%|█▊        | 222/1208 [06:27<28:39,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000476, train/loss_step=0.139, global_step=3679.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  18%|█▊        | 222/1208 [06:27<28:39,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000529, train/loss_step=0.155, global_step=3679.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  18%|█▊        | 223/1208 [06:28<28:34,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000529, train/loss_step=0.155, global_step=3679.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  18%|█▊        | 223/1208 [06:28<28:34,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00232, train/loss_step=0.371, global_step=3679.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  19%|█▊        | 224/1208 [06:31<28:39,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00232, train/loss_step=0.371, global_step=3679.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  19%|█▊        | 224/1208 [06:31<28:39,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.479, train/loss_vlb_step=0.00344, train/loss_step=0.479, global_step=3679.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  19%|█▊        | 225/1208 [06:32<28:34,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.479, train/loss_vlb_step=0.00344, train/loss_step=0.479, global_step=3679.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  19%|█▊        | 225/1208 [06:32<28:34,  1.74s/it, loss=0.175, v_num=0, train/loss_simple_step=0.471, train/loss_vlb_step=0.00651, train/loss_step=0.471, global_step=3680.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  19%|█▊        | 226/1208 [06:33<28:30,  1.74s/it, loss=0.175, v_num=0, train/loss_simple_step=0.471, train/loss_vlb_step=0.00651, train/loss_step=0.471, global_step=3680.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  19%|█▊        | 226/1208 [06:33<28:30,  1.74s/it, loss=0.192, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00194, train/loss_step=0.357, global_step=3680.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  19%|█▉        | 227/1208 [06:34<28:25,  1.74s/it, loss=0.192, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00194, train/loss_step=0.357, global_step=3680.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  19%|█▉        | 227/1208 [06:34<28:25,  1.74s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00386, train/loss_vlb_step=2.05e-5, train/loss_step=0.00386, global_step=3680.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  19%|█▉        | 228/1208 [06:37<28:30,  1.75s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00386, train/loss_vlb_step=2.05e-5, train/loss_step=0.00386, global_step=3680.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  19%|█▉        | 228/1208 [06:37<28:30,  1.75s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000146, train/loss_step=0.0392, global_step=3680.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  19%|█▉        | 229/1208 [06:38<28:25,  1.74s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000146, train/loss_step=0.0392, global_step=3680.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  19%|█▉        | 229/1208 [06:38<28:25,  1.74s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.84e-5, train/loss_step=0.0207, global_step=3681.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  19%|█▉        | 230/1208 [06:40<28:21,  1.74s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.84e-5, train/loss_step=0.0207, global_step=3681.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  19%|█▉        | 230/1208 [06:40<28:21,  1.74s/it, loss=0.182, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000637, train/loss_step=0.186, global_step=3681.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  19%|█▉        | 231/1208 [06:41<28:16,  1.74s/it, loss=0.182, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000637, train/loss_step=0.186, global_step=3681.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  19%|█▉        | 231/1208 [06:41<28:16,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0294, train/loss_vlb_step=0.000117, train/loss_step=0.0294, global_step=3681.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  19%|█▉        | 232/1208 [06:44<28:21,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0294, train/loss_vlb_step=0.000117, train/loss_step=0.0294, global_step=3681.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  19%|█▉        | 232/1208 [06:44<28:21,  1.74s/it, loss=0.202, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.0048, train/loss_step=0.476, global_step=3681.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  19%|█▉        | 233/1208 [06:45<28:16,  1.74s/it, loss=0.202, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.0048, train/loss_step=0.476, global_step=3681.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  19%|█▉        | 233/1208 [06:45<28:16,  1.74s/it, loss=0.195, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00168, train/loss_step=0.309, global_step=3682.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  19%|█▉        | 234/1208 [06:46<28:11,  1.74s/it, loss=0.195, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00168, train/loss_step=0.309, global_step=3682.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  19%|█▉        | 234/1208 [06:46<28:11,  1.74s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.44e-5, train/loss_step=0.0149, global_step=3682.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  19%|█▉        | 235/1208 [06:47<28:07,  1.73s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.44e-5, train/loss_step=0.0149, global_step=3682.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  19%|█▉        | 235/1208 [06:47<28:07,  1.73s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.87e-5, train/loss_step=0.0158, global_step=3682.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  20%|█▉        | 236/1208 [06:50<28:11,  1.74s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.87e-5, train/loss_step=0.0158, global_step=3682.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  20%|█▉        | 236/1208 [06:50<28:11,  1.74s/it, loss=0.184, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=3682.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  20%|█▉        | 237/1208 [06:51<28:07,  1.74s/it, loss=0.184, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=3682.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  20%|█▉        | 237/1208 [06:51<28:07,  1.74s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0786, train/loss_vlb_step=0.000263, train/loss_step=0.0786, global_step=3683.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  20%|█▉        | 238/1208 [06:52<28:02,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0786, train/loss_vlb_step=0.000263, train/loss_step=0.0786, global_step=3683.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  20%|█▉        | 238/1208 [06:52<28:02,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000805, train/loss_step=0.222, global_step=3683.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  20%|█▉        | 239/1208 [06:53<27:58,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000805, train/loss_step=0.222, global_step=3683.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  20%|█▉        | 239/1208 [06:53<27:58,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00332, train/loss_step=0.447, global_step=3683.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  20%|█▉        | 240/1208 [06:57<28:02,  1.74s/it, loss=0.196, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00332, train/loss_step=0.447, global_step=3683.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  20%|█▉        | 240/1208 [06:57<28:02,  1.74s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.47e-5, train/loss_step=0.00261, global_step=3683.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  20%|█▉        | 241/1208 [06:58<27:58,  1.74s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.47e-5, train/loss_step=0.00261, global_step=3683.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  20%|█▉        | 241/1208 [06:58<27:58,  1.74s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.05e-5, train/loss_step=0.00174, global_step=3684.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  20%|██        | 242/1208 [06:59<27:53,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.05e-5, train/loss_step=0.00174, global_step=3684.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  20%|██        | 242/1208 [06:59<27:53,  1.73s/it, loss=0.199, v_num=0, train/loss_simple_step=0.358, train/loss_vlb_step=0.00193, train/loss_step=0.358, global_step=3684.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  20%|██        | 243/1208 [07:00<27:49,  1.73s/it, loss=0.199, v_num=0, train/loss_simple_step=0.358, train/loss_vlb_step=0.00193, train/loss_step=0.358, global_step=3684.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  20%|██        | 243/1208 [07:00<27:49,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0557, train/loss_vlb_step=0.00019, train/loss_step=0.0557, global_step=3684.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  20%|██        | 244/1208 [07:03<27:53,  1.74s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0557, train/loss_vlb_step=0.00019, train/loss_step=0.0557, global_step=3684.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  20%|██        | 244/1208 [07:03<27:53,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0652, train/loss_vlb_step=0.000227, train/loss_step=0.0652, global_step=3684.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  20%|██        | 245/1208 [07:04<27:49,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0652, train/loss_vlb_step=0.000227, train/loss_step=0.0652, global_step=3684.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  20%|██        | 245/1208 [07:04<27:49,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000608, train/loss_step=0.177, global_step=3685.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  20%|██        | 246/1208 [07:05<27:44,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000608, train/loss_step=0.177, global_step=3685.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  20%|██        | 246/1208 [07:05<27:44,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=3685.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  20%|██        | 247/1208 [07:06<27:40,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=3685.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  20%|██        | 247/1208 [07:06<27:40,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.000188, train/loss_step=0.0537, global_step=3685.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  21%|██        | 248/1208 [07:09<27:44,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.000188, train/loss_step=0.0537, global_step=3685.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  21%|██        | 248/1208 [07:09<27:44,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.78e-5, train/loss_step=0.0104, global_step=3685.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  21%|██        | 249/1208 [07:11<27:40,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.78e-5, train/loss_step=0.0104, global_step=3685.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  21%|██        | 249/1208 [07:11<27:40,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000111, train/loss_step=0.0299, global_step=3686.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  21%|██        | 250/1208 [07:12<27:35,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000111, train/loss_step=0.0299, global_step=3686.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  21%|██        | 250/1208 [07:12<27:35,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00104, train/loss_step=0.239, global_step=3686.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  21%|██        | 251/1208 [07:13<27:31,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00104, train/loss_step=0.239, global_step=3686.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  21%|██        | 251/1208 [07:13<27:31,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00143, train/loss_step=0.315, global_step=3686.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  21%|██        | 252/1208 [07:16<27:35,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00143, train/loss_step=0.315, global_step=3686.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  21%|██        | 252/1208 [07:16<27:35,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.13e-5, train/loss_step=0.0117, global_step=3686.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  21%|██        | 253/1208 [07:17<27:31,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.13e-5, train/loss_step=0.0117, global_step=3686.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  21%|██        | 253/1208 [07:17<27:31,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000646, train/loss_step=0.187, global_step=3687.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  21%|██        | 254/1208 [07:18<27:26,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000646, train/loss_step=0.187, global_step=3687.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  21%|██        | 254/1208 [07:18<27:26,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.99e-5, train/loss_step=0.0106, global_step=3687.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  21%|██        | 255/1208 [07:19<27:22,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.99e-5, train/loss_step=0.0106, global_step=3687.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  21%|██        | 255/1208 [07:19<27:22,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.473, train/loss_vlb_step=0.00321, train/loss_step=0.473, global_step=3687.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  21%|██        | 256/1208 [07:22<27:26,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.473, train/loss_vlb_step=0.00321, train/loss_step=0.473, global_step=3687.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  21%|██        | 256/1208 [07:22<27:26,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.01e-5, train/loss_step=0.0177, global_step=3687.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  21%|██▏       | 257/1208 [07:23<27:22,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.01e-5, train/loss_step=0.0177, global_step=3687.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  21%|██▏       | 257/1208 [07:23<27:22,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00372, train/loss_vlb_step=2.07e-5, train/loss_step=0.00372, global_step=3688.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  21%|██▏       | 258/1208 [07:24<27:17,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00372, train/loss_vlb_step=2.07e-5, train/loss_step=0.00372, global_step=3688.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  21%|██▏       | 258/1208 [07:24<27:17,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=1.96e-5, train/loss_step=0.0036, global_step=3688.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  21%|██▏       | 259/1208 [07:25<27:13,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=1.96e-5, train/loss_step=0.0036, global_step=3688.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  21%|██▏       | 259/1208 [07:25<27:13,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=4.93e-5, train/loss_step=0.0109, global_step=3688.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  22%|██▏       | 260/1208 [07:29<27:17,  1.73s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=4.93e-5, train/loss_step=0.0109, global_step=3688.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  22%|██▏       | 260/1208 [07:29<27:17,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.72e-5, train/loss_step=0.010, global_step=3688.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  22%|██▏       | 261/1208 [07:30<27:13,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.72e-5, train/loss_step=0.010, global_step=3688.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  22%|██▏       | 261/1208 [07:30<27:13,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0694, train/loss_vlb_step=0.000236, train/loss_step=0.0694, global_step=3689.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  22%|██▏       | 262/1208 [07:31<27:09,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0694, train/loss_vlb_step=0.000236, train/loss_step=0.0694, global_step=3689.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  22%|██▏       | 262/1208 [07:31<27:09,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00119, train/loss_step=0.275, global_step=3689.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  22%|██▏       | 263/1208 [07:32<27:05,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00119, train/loss_step=0.275, global_step=3689.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  22%|██▏       | 263/1208 [07:32<27:05,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00142, train/loss_step=0.273, global_step=3689.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  22%|██▏       | 264/1208 [07:35<27:09,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00142, train/loss_step=0.273, global_step=3689.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  22%|██▏       | 264/1208 [07:35<27:09,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00432, train/loss_step=0.433, global_step=3689.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  22%|██▏       | 265/1208 [07:36<27:04,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00432, train/loss_step=0.433, global_step=3689.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  22%|██▏       | 265/1208 [07:36<27:04,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00907, train/loss_vlb_step=4.23e-5, train/loss_step=0.00907, global_step=3690.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  22%|██▏       | 266/1208 [07:37<27:00,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00907, train/loss_vlb_step=4.23e-5, train/loss_step=0.00907, global_step=3690.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  22%|██▏       | 266/1208 [07:37<27:00,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.057, train/loss_vlb_step=0.000199, train/loss_step=0.057, global_step=3690.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  22%|██▏       | 267/1208 [07:38<26:56,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.057, train/loss_vlb_step=0.000199, train/loss_step=0.057, global_step=3690.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  22%|██▏       | 267/1208 [07:38<26:56,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.91e-5, train/loss_step=0.016, global_step=3690.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  22%|██▏       | 268/1208 [07:41<27:00,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.91e-5, train/loss_step=0.016, global_step=3690.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  22%|██▏       | 268/1208 [07:41<27:00,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00949, train/loss_vlb_step=4.56e-5, train/loss_step=0.00949, global_step=3690.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  22%|██▏       | 269/1208 [07:43<26:56,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00949, train/loss_vlb_step=4.56e-5, train/loss_step=0.00949, global_step=3690.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  22%|██▏       | 269/1208 [07:43<26:56,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00155, train/loss_step=0.272, global_step=3691.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  22%|██▏       | 270/1208 [07:44<26:52,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00155, train/loss_step=0.272, global_step=3691.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  22%|██▏       | 270/1208 [07:44<26:52,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00122, train/loss_step=0.286, global_step=3691.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  22%|██▏       | 271/1208 [07:45<26:48,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00122, train/loss_step=0.286, global_step=3691.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  22%|██▏       | 271/1208 [07:45<26:48,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.500, train/loss_vlb_step=0.00945, train/loss_step=0.500, global_step=3691.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  23%|██▎       | 272/1208 [07:48<26:51,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.500, train/loss_vlb_step=0.00945, train/loss_step=0.500, global_step=3691.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  23%|██▎       | 272/1208 [07:48<26:51,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=3691.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  23%|██▎       | 273/1208 [07:49<26:47,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=3691.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  23%|██▎       | 273/1208 [07:49<26:47,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000171, train/loss_step=0.0484, global_step=3692.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  23%|██▎       | 274/1208 [07:50<26:43,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000171, train/loss_step=0.0484, global_step=3692.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  23%|██▎       | 274/1208 [07:50<26:43,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0458, train/loss_vlb_step=0.000159, train/loss_step=0.0458, global_step=3692.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  23%|██▎       | 275/1208 [07:51<26:39,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0458, train/loss_vlb_step=0.000159, train/loss_step=0.0458, global_step=3692.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  23%|██▎       | 275/1208 [07:51<26:39,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00143, train/loss_step=0.263, global_step=3692.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  23%|██▎       | 276/1208 [07:54<26:43,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00143, train/loss_step=0.263, global_step=3692.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  23%|██▎       | 276/1208 [07:54<26:43,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000785, train/loss_step=0.222, global_step=3692.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  23%|██▎       | 277/1208 [07:55<26:39,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000785, train/loss_step=0.222, global_step=3692.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  23%|██▎       | 277/1208 [07:55<26:39,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0673, train/loss_vlb_step=0.000226, train/loss_step=0.0673, global_step=3693.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  23%|██▎       | 278/1208 [07:56<26:35,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0673, train/loss_vlb_step=0.000226, train/loss_step=0.0673, global_step=3693.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  23%|██▎       | 278/1208 [07:56<26:35,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000823, train/loss_step=0.230, global_step=3693.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  23%|██▎       | 279/1208 [07:57<26:31,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000823, train/loss_step=0.230, global_step=3693.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  23%|██▎       | 279/1208 [07:57<26:31,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=8.95e-5, train/loss_step=0.0224, global_step=3693.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  23%|██▎       | 280/1208 [08:01<26:34,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=8.95e-5, train/loss_step=0.0224, global_step=3693.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  23%|██▎       | 280/1208 [08:01<26:34,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00299, train/loss_step=0.372, global_step=3693.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  23%|██▎       | 281/1208 [08:02<26:30,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00299, train/loss_step=0.372, global_step=3693.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  23%|██▎       | 281/1208 [08:02<26:30,  1.72s/it, loss=0.187, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000762, train/loss_step=0.215, global_step=3694.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  23%|██▎       | 282/1208 [08:03<26:26,  1.71s/it, loss=0.187, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000762, train/loss_step=0.215, global_step=3694.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  23%|██▎       | 282/1208 [08:03<26:26,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00752, train/loss_vlb_step=3.7e-5, train/loss_step=0.00752, global_step=3694.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  23%|██▎       | 283/1208 [08:04<26:23,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00752, train/loss_vlb_step=3.7e-5, train/loss_step=0.00752, global_step=3694.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  23%|██▎       | 283/1208 [08:04<26:23,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.452, train/loss_vlb_step=0.00401, train/loss_step=0.452, global_step=3694.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  24%|██▎       | 284/1208 [08:07<26:26,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.452, train/loss_vlb_step=0.00401, train/loss_step=0.452, global_step=3694.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  24%|██▎       | 284/1208 [08:07<26:26,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00484, train/loss_vlb_step=2.53e-5, train/loss_step=0.00484, global_step=3694.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  24%|██▎       | 285/1208 [08:08<26:22,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00484, train/loss_vlb_step=2.53e-5, train/loss_step=0.00484, global_step=3694.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  24%|██▎       | 285/1208 [08:08<26:22,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000478, train/loss_step=0.140, global_step=3695.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  24%|██▎       | 286/1208 [08:09<26:18,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000478, train/loss_step=0.140, global_step=3695.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  24%|██▎       | 286/1208 [08:09<26:18,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.52e-5, train/loss_step=0.00265, global_step=3695.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  24%|██▍       | 287/1208 [08:10<26:14,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.52e-5, train/loss_step=0.00265, global_step=3695.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  24%|██▍       | 287/1208 [08:10<26:14,  1.71s/it, loss=0.171, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.00052, train/loss_step=0.150, global_step=3695.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  24%|██▍       | 288/1208 [08:14<26:18,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.00052, train/loss_step=0.150, global_step=3695.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  24%|██▍       | 288/1208 [08:14<26:18,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.000154, train/loss_step=0.0403, global_step=3695.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  24%|██▍       | 289/1208 [08:15<26:14,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.000154, train/loss_step=0.0403, global_step=3695.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  24%|██▍       | 289/1208 [08:15<26:14,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0912, train/loss_vlb_step=0.000302, train/loss_step=0.0912, global_step=3696.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  24%|██▍       | 290/1208 [08:16<26:10,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0912, train/loss_vlb_step=0.000302, train/loss_step=0.0912, global_step=3696.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  24%|██▍       | 290/1208 [08:16<26:10,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00108, train/loss_step=0.261, global_step=3696.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  24%|██▍       | 291/1208 [08:17<26:06,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00108, train/loss_step=0.261, global_step=3696.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  24%|██▍       | 291/1208 [08:17<26:06,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.04e-5, train/loss_step=0.00174, global_step=3696.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  24%|██▍       | 292/1208 [08:20<26:09,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.04e-5, train/loss_step=0.00174, global_step=3696.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  24%|██▍       | 292/1208 [08:20<26:09,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=7.03e-5, train/loss_step=0.0159, global_step=3696.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  24%|██▍       | 293/1208 [08:21<26:06,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=7.03e-5, train/loss_step=0.0159, global_step=3696.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  24%|██▍       | 293/1208 [08:21<26:06,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.0036, train/loss_step=0.434, global_step=3697.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  24%|██▍       | 294/1208 [08:22<26:02,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.0036, train/loss_step=0.434, global_step=3697.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  24%|██▍       | 294/1208 [08:22<26:02,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000135, train/loss_step=0.0372, global_step=3697.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  24%|██▍       | 295/1208 [08:23<25:58,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000135, train/loss_step=0.0372, global_step=3697.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  24%|██▍       | 295/1208 [08:23<25:58,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=3697.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  25%|██▍       | 296/1208 [08:26<26:01,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=3697.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  25%|██▍       | 296/1208 [08:26<26:01,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=3697.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  25%|██▍       | 297/1208 [08:27<25:57,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=3697.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  25%|██▍       | 297/1208 [08:27<25:57,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000424, train/loss_step=0.129, global_step=3698.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  25%|██▍       | 298/1208 [08:28<25:54,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000424, train/loss_step=0.129, global_step=3698.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  25%|██▍       | 298/1208 [08:28<25:54,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000152, train/loss_step=0.0412, global_step=3698.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  25%|██▍       | 299/1208 [08:29<25:50,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000152, train/loss_step=0.0412, global_step=3698.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  25%|██▍       | 299/1208 [08:29<25:50,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00132, train/loss_step=0.300, global_step=3698.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  25%|██▍       | 300/1208 [08:33<25:53,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00132, train/loss_step=0.300, global_step=3698.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  25%|██▍       | 300/1208 [08:33<25:53,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00164, train/loss_step=0.333, global_step=3698.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.73it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.74it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.75it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.75it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.76it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.76it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.76it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.77it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.75it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 12:  25%|██▍       | 301/1208 [09:03<27:19,  1.81s/it, loss=0.145, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00164, train/loss_step=0.333, global_step=3698.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  25%|██▍       | 301/1208 [09:03<27:19,  1.81s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0389, train/loss_vlb_step=0.000141, train/loss_step=0.0389, global_step=3699.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  25%|██▌       | 302/1208 [09:04<27:14,  1.80s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0389, train/loss_vlb_step=0.000141, train/loss_step=0.0389, global_step=3699.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  25%|██▌       | 302/1208 [09:04<27:14,  1.80s/it, loss=0.161, v_num=0, train/loss_simple_step=0.514, train/loss_vlb_step=0.0111, train/loss_step=0.514, global_step=3699.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  25%|██▌       | 303/1208 [09:06<27:10,  1.80s/it, loss=0.161, v_num=0, train/loss_simple_step=0.514, train/loss_vlb_step=0.0111, train/loss_step=0.514, global_step=3699.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  25%|██▌       | 303/1208 [09:06<27:10,  1.80s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00728, train/loss_vlb_step=3.58e-5, train/loss_step=0.00728, global_step=3699.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  25%|██▌       | 304/1208 [09:09<27:13,  1.81s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00728, train/loss_vlb_step=3.58e-5, train/loss_step=0.00728, global_step=3699.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  25%|██▌       | 304/1208 [09:09<27:13,  1.81s/it, loss=0.162, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00323, train/loss_step=0.458, global_step=3699.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  25%|██▌       | 305/1208 [09:10<27:09,  1.80s/it, loss=0.162, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00323, train/loss_step=0.458, global_step=3699.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  25%|██▌       | 305/1208 [09:10<27:09,  1.80s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00943, train/loss_vlb_step=4.28e-5, train/loss_step=0.00943, global_step=3700.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  25%|██▌       | 306/1208 [09:11<27:05,  1.80s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00943, train/loss_vlb_step=4.28e-5, train/loss_step=0.00943, global_step=3700.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  25%|██▌       | 306/1208 [09:11<27:05,  1.80s/it, loss=0.173, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00361, train/loss_step=0.367, global_step=3700.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  25%|██▌       | 307/1208 [09:12<27:00,  1.80s/it, loss=0.173, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00361, train/loss_step=0.367, global_step=3700.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  25%|██▌       | 307/1208 [09:12<27:00,  1.80s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.86e-5, train/loss_step=0.0159, global_step=3700.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  25%|██▌       | 308/1208 [09:15<27:03,  1.80s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.86e-5, train/loss_step=0.0159, global_step=3700.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  25%|██▌       | 308/1208 [09:15<27:03,  1.80s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00903, train/loss_vlb_step=4.28e-5, train/loss_step=0.00903, global_step=3700.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  26%|██▌       | 309/1208 [09:16<26:59,  1.80s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00903, train/loss_vlb_step=4.28e-5, train/loss_step=0.00903, global_step=3700.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  26%|██▌       | 309/1208 [09:16<26:59,  1.80s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00829, train/loss_vlb_step=3.97e-5, train/loss_step=0.00829, global_step=3701.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  26%|██▌       | 310/1208 [09:17<26:55,  1.80s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00829, train/loss_vlb_step=3.97e-5, train/loss_step=0.00829, global_step=3701.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  26%|██▌       | 310/1208 [09:17<26:55,  1.80s/it, loss=0.153, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=3701.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  26%|██▌       | 311/1208 [09:18<26:51,  1.80s/it, loss=0.153, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=3701.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  26%|██▌       | 311/1208 [09:18<26:51,  1.80s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0433, train/loss_vlb_step=0.00016, train/loss_step=0.0433, global_step=3701.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  26%|██▌       | 312/1208 [09:22<26:53,  1.80s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0433, train/loss_vlb_step=0.00016, train/loss_step=0.0433, global_step=3701.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  26%|██▌       | 312/1208 [09:22<26:53,  1.80s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0811, train/loss_vlb_step=0.00027, train/loss_step=0.0811, global_step=3701.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  26%|██▌       | 313/1208 [09:23<26:50,  1.80s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0811, train/loss_vlb_step=0.00027, train/loss_step=0.0811, global_step=3701.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  26%|██▌       | 313/1208 [09:23<26:50,  1.80s/it, loss=0.161, v_num=0, train/loss_simple_step=0.484, train/loss_vlb_step=0.00536, train/loss_step=0.484, global_step=3702.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  26%|██▌       | 314/1208 [09:24<26:46,  1.80s/it, loss=0.161, v_num=0, train/loss_simple_step=0.484, train/loss_vlb_step=0.00536, train/loss_step=0.484, global_step=3702.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  26%|██▌       | 314/1208 [09:24<26:46,  1.80s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000125, train/loss_step=0.0334, global_step=3702.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  26%|██▌       | 315/1208 [09:25<26:42,  1.79s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000125, train/loss_step=0.0334, global_step=3702.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  26%|██▌       | 315/1208 [09:25<26:42,  1.79s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00353, train/loss_vlb_step=1.92e-5, train/loss_step=0.00353, global_step=3702.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  26%|██▌       | 316/1208 [09:28<26:44,  1.80s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00353, train/loss_vlb_step=1.92e-5, train/loss_step=0.00353, global_step=3702.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  26%|██▌       | 316/1208 [09:28<26:44,  1.80s/it, loss=0.161, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000961, train/loss_step=0.235, global_step=3702.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  26%|██▌       | 317/1208 [09:29<26:40,  1.80s/it, loss=0.161, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000961, train/loss_step=0.235, global_step=3702.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  26%|██▌       | 317/1208 [09:29<26:40,  1.80s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00592, train/loss_vlb_step=3.06e-5, train/loss_step=0.00592, global_step=3703.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  26%|██▋       | 318/1208 [09:30<26:36,  1.79s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00592, train/loss_vlb_step=3.06e-5, train/loss_step=0.00592, global_step=3703.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  26%|██▋       | 318/1208 [09:30<26:36,  1.79s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000122, train/loss_step=0.0329, global_step=3703.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  26%|██▋       | 319/1208 [09:31<26:32,  1.79s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000122, train/loss_step=0.0329, global_step=3703.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  26%|██▋       | 319/1208 [09:31<26:32,  1.79s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00493, train/loss_vlb_step=2.59e-5, train/loss_step=0.00493, global_step=3703.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  26%|██▋       | 320/1208 [09:34<26:35,  1.80s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00493, train/loss_vlb_step=2.59e-5, train/loss_step=0.00493, global_step=3703.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  26%|██▋       | 320/1208 [09:34<26:35,  1.80s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00163, train/loss_vlb_step=9.33e-6, train/loss_step=0.00163, global_step=3703.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  27%|██▋       | 321/1208 [09:35<26:31,  1.79s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00163, train/loss_vlb_step=9.33e-6, train/loss_step=0.00163, global_step=3703.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  27%|██▋       | 321/1208 [09:35<26:31,  1.79s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0065, train/loss_vlb_step=3.23e-5, train/loss_step=0.0065, global_step=3704.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  27%|██▋       | 322/1208 [09:36<26:27,  1.79s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0065, train/loss_vlb_step=3.23e-5, train/loss_step=0.0065, global_step=3704.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  27%|██▋       | 322/1208 [09:36<26:27,  1.79s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0912, train/loss_vlb_step=0.0003, train/loss_step=0.0912, global_step=3704.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  27%|██▋       | 323/1208 [09:37<26:23,  1.79s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0912, train/loss_vlb_step=0.0003, train/loss_step=0.0912, global_step=3704.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  27%|██▋       | 323/1208 [09:37<26:23,  1.79s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=1.73e-5, train/loss_step=0.0031, global_step=3704.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  27%|██▋       | 324/1208 [09:41<26:25,  1.79s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=1.73e-5, train/loss_step=0.0031, global_step=3704.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  27%|██▋       | 324/1208 [09:41<26:25,  1.79s/it, loss=0.0792, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.000167, train/loss_step=0.0462, global_step=3704.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  27%|██▋       | 325/1208 [09:42<26:22,  1.79s/it, loss=0.0792, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.000167, train/loss_step=0.0462, global_step=3704.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  27%|██▋       | 325/1208 [09:42<26:22,  1.79s/it, loss=0.079, v_num=0, train/loss_simple_step=0.00575, train/loss_vlb_step=2.99e-5, train/loss_step=0.00575, global_step=3705.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  27%|██▋       | 326/1208 [09:43<26:18,  1.79s/it, loss=0.079, v_num=0, train/loss_simple_step=0.00575, train/loss_vlb_step=2.99e-5, train/loss_step=0.00575, global_step=3705.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  27%|██▋       | 326/1208 [09:43<26:18,  1.79s/it, loss=0.062, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.00011, train/loss_step=0.0276, global_step=3705.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  27%|██▋       | 327/1208 [09:44<26:14,  1.79s/it, loss=0.062, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.00011, train/loss_step=0.0276, global_step=3705.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  27%|██▋       | 327/1208 [09:44<26:14,  1.79s/it, loss=0.064, v_num=0, train/loss_simple_step=0.0554, train/loss_vlb_step=0.000192, train/loss_step=0.0554, global_step=3705.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  27%|██▋       | 328/1208 [09:47<26:16,  1.79s/it, loss=0.064, v_num=0, train/loss_simple_step=0.0554, train/loss_vlb_step=0.000192, train/loss_step=0.0554, global_step=3705.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  27%|██▋       | 328/1208 [09:47<26:16,  1.79s/it, loss=0.0663, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000195, train/loss_step=0.0555, global_step=3705.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  27%|██▋       | 329/1208 [09:48<26:12,  1.79s/it, loss=0.0663, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000195, train/loss_step=0.0555, global_step=3705.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  27%|██▋       | 329/1208 [09:48<26:12,  1.79s/it, loss=0.0661, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=1.84e-5, train/loss_step=0.00325, global_step=3706.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  27%|██▋       | 330/1208 [09:49<26:09,  1.79s/it, loss=0.0661, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=1.84e-5, train/loss_step=0.00325, global_step=3706.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  27%|██▋       | 330/1208 [09:49<26:09,  1.79s/it, loss=0.066, v_num=0, train/loss_simple_step=0.099, train/loss_vlb_step=0.000326, train/loss_step=0.099, global_step=3706.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  27%|██▋       | 331/1208 [09:50<26:05,  1.78s/it, loss=0.066, v_num=0, train/loss_simple_step=0.099, train/loss_vlb_step=0.000326, train/loss_step=0.099, global_step=3706.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  27%|██▋       | 331/1208 [09:50<26:05,  1.78s/it, loss=0.064, v_num=0, train/loss_simple_step=0.00346, train/loss_vlb_step=1.95e-5, train/loss_step=0.00346, global_step=3706.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  27%|██▋       | 332/1208 [09:54<26:07,  1.79s/it, loss=0.064, v_num=0, train/loss_simple_step=0.00346, train/loss_vlb_step=1.95e-5, train/loss_step=0.00346, global_step=3706.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  27%|██▋       | 332/1208 [09:54<26:07,  1.79s/it, loss=0.069, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000657, train/loss_step=0.180, global_step=3706.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  28%|██▊       | 333/1208 [09:55<26:03,  1.79s/it, loss=0.069, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000657, train/loss_step=0.180, global_step=3706.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  28%|██▊       | 333/1208 [09:55<26:03,  1.79s/it, loss=0.0449, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.48e-5, train/loss_step=0.00261, global_step=3707.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  28%|██▊       | 334/1208 [09:56<25:59,  1.78s/it, loss=0.0449, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.48e-5, train/loss_step=0.00261, global_step=3707.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  28%|██▊       | 334/1208 [09:56<25:59,  1.78s/it, loss=0.0435, v_num=0, train/loss_simple_step=0.00671, train/loss_vlb_step=3.32e-5, train/loss_step=0.00671, global_step=3707.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  28%|██▊       | 335/1208 [09:57<25:56,  1.78s/it, loss=0.0435, v_num=0, train/loss_simple_step=0.00671, train/loss_vlb_step=3.32e-5, train/loss_step=0.00671, global_step=3707.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  28%|██▊       | 335/1208 [09:57<25:56,  1.78s/it, loss=0.0439, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.01e-5, train/loss_step=0.0108, global_step=3707.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  28%|██▊       | 336/1208 [10:00<25:58,  1.79s/it, loss=0.0439, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.01e-5, train/loss_step=0.0108, global_step=3707.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  28%|██▊       | 336/1208 [10:00<25:58,  1.79s/it, loss=0.0334, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.49e-5, train/loss_step=0.0243, global_step=3707.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  28%|██▊       | 337/1208 [10:01<25:54,  1.78s/it, loss=0.0334, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.49e-5, train/loss_step=0.0243, global_step=3707.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  28%|██▊       | 337/1208 [10:01<25:54,  1.78s/it, loss=0.0334, v_num=0, train/loss_simple_step=0.00588, train/loss_vlb_step=2.77e-5, train/loss_step=0.00588, global_step=3708.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  28%|██▊       | 338/1208 [10:02<25:50,  1.78s/it, loss=0.0334, v_num=0, train/loss_simple_step=0.00588, train/loss_vlb_step=2.77e-5, train/loss_step=0.00588, global_step=3708.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  28%|██▊       | 338/1208 [10:02<25:50,  1.78s/it, loss=0.0445, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00117, train/loss_step=0.257, global_step=3708.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  28%|██▊       | 339/1208 [10:03<25:47,  1.78s/it, loss=0.0445, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00117, train/loss_step=0.257, global_step=3708.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  28%|██▊       | 339/1208 [10:03<25:47,  1.78s/it, loss=0.049, v_num=0, train/loss_simple_step=0.0947, train/loss_vlb_step=0.000313, train/loss_step=0.0947, global_step=3708.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  28%|██▊       | 340/1208 [10:06<25:49,  1.79s/it, loss=0.049, v_num=0, train/loss_simple_step=0.0947, train/loss_vlb_step=0.000313, train/loss_step=0.0947, global_step=3708.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  28%|██▊       | 340/1208 [10:06<25:49,  1.79s/it, loss=0.0611, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.001, train/loss_step=0.242, global_step=3708.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  28%|██▊       | 341/1208 [10:07<25:45,  1.78s/it, loss=0.0611, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.001, train/loss_step=0.242, global_step=3708.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  28%|██▊       | 341/1208 [10:07<25:45,  1.78s/it, loss=0.076, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00154, train/loss_step=0.305, global_step=3709.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  28%|██▊       | 342/1208 [10:09<25:42,  1.78s/it, loss=0.076, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00154, train/loss_step=0.305, global_step=3709.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  28%|██▊       | 342/1208 [10:09<25:42,  1.78s/it, loss=0.0721, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.1e-5, train/loss_step=0.0138, global_step=3709.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  28%|██▊       | 343/1208 [10:10<25:38,  1.78s/it, loss=0.0721, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.1e-5, train/loss_step=0.0138, global_step=3709.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  28%|██▊       | 343/1208 [10:10<25:38,  1.78s/it, loss=0.0761, v_num=0, train/loss_simple_step=0.0839, train/loss_vlb_step=0.000278, train/loss_step=0.0839, global_step=3709.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  28%|██▊       | 344/1208 [10:13<25:40,  1.78s/it, loss=0.0761, v_num=0, train/loss_simple_step=0.0839, train/loss_vlb_step=0.000278, train/loss_step=0.0839, global_step=3709.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  28%|██▊       | 344/1208 [10:13<25:40,  1.78s/it, loss=0.0812, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000496, train/loss_step=0.147, global_step=3709.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  29%|██▊       | 345/1208 [10:14<25:36,  1.78s/it, loss=0.0812, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000496, train/loss_step=0.147, global_step=3709.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  29%|██▊       | 345/1208 [10:14<25:36,  1.78s/it, loss=0.0828, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.00014, train/loss_step=0.0376, global_step=3710.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  29%|██▊       | 346/1208 [10:15<25:33,  1.78s/it, loss=0.0828, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.00014, train/loss_step=0.0376, global_step=3710.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  29%|██▊       | 346/1208 [10:15<25:33,  1.78s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000774, train/loss_step=0.203, global_step=3710.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  29%|██▊       | 347/1208 [10:16<25:29,  1.78s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000774, train/loss_step=0.203, global_step=3710.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  29%|██▊       | 347/1208 [10:16<25:29,  1.78s/it, loss=0.0892, v_num=0, train/loss_simple_step=0.00766, train/loss_vlb_step=3.84e-5, train/loss_step=0.00766, global_step=3710.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  29%|██▉       | 348/1208 [10:19<25:31,  1.78s/it, loss=0.0892, v_num=0, train/loss_simple_step=0.00766, train/loss_vlb_step=3.84e-5, train/loss_step=0.00766, global_step=3710.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  29%|██▉       | 348/1208 [10:19<25:31,  1.78s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.0366, train/loss_vlb_step=0.00014, train/loss_step=0.0366, global_step=3710.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  29%|██▉       | 349/1208 [10:20<25:27,  1.78s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.0366, train/loss_vlb_step=0.00014, train/loss_step=0.0366, global_step=3710.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  29%|██▉       | 349/1208 [10:20<25:27,  1.78s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.00328, train/loss_vlb_step=1.78e-5, train/loss_step=0.00328, global_step=3711.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  29%|██▉       | 350/1208 [10:21<25:23,  1.78s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.00328, train/loss_vlb_step=1.78e-5, train/loss_step=0.00328, global_step=3711.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  29%|██▉       | 350/1208 [10:21<25:23,  1.78s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.0018, train/loss_step=0.310, global_step=3711.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]     Epoch 12:  29%|██▉       | 351/1208 [10:22<25:20,  1.77s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.0018, train/loss_step=0.310, global_step=3711.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  29%|██▉       | 351/1208 [10:22<25:20,  1.77s/it, loss=0.135, v_num=0, train/loss_simple_step=0.733, train/loss_vlb_step=0.0747, train/loss_step=0.733, global_step=3711.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  29%|██▉       | 352/1208 [10:25<25:21,  1.78s/it, loss=0.135, v_num=0, train/loss_simple_step=0.733, train/loss_vlb_step=0.0747, train/loss_step=0.733, global_step=3711.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  29%|██▉       | 352/1208 [10:25<25:21,  1.78s/it, loss=0.142, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00146, train/loss_step=0.322, global_step=3711.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  29%|██▉       | 353/1208 [10:26<25:17,  1.78s/it, loss=0.142, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00146, train/loss_step=0.322, global_step=3711.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  29%|██▉       | 353/1208 [10:26<25:17,  1.78s/it, loss=0.156, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00111, train/loss_step=0.269, global_step=3712.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  29%|██▉       | 354/1208 [10:27<25:14,  1.77s/it, loss=0.156, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00111, train/loss_step=0.269, global_step=3712.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  29%|██▉       | 354/1208 [10:27<25:14,  1.77s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0578, train/loss_vlb_step=0.000195, train/loss_step=0.0578, global_step=3712.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  29%|██▉       | 355/1208 [10:28<25:10,  1.77s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0578, train/loss_vlb_step=0.000195, train/loss_step=0.0578, global_step=3712.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  29%|██▉       | 355/1208 [10:28<25:10,  1.77s/it, loss=0.165, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000449, train/loss_step=0.136, global_step=3712.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  29%|██▉       | 356/1208 [10:31<25:12,  1.78s/it, loss=0.165, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000449, train/loss_step=0.136, global_step=3712.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  29%|██▉       | 356/1208 [10:31<25:12,  1.78s/it, loss=0.169, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=3712.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  30%|██▉       | 357/1208 [10:33<25:08,  1.77s/it, loss=0.169, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=3712.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  30%|██▉       | 357/1208 [10:33<25:08,  1.77s/it, loss=0.183, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00136, train/loss_step=0.298, global_step=3713.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  30%|██▉       | 358/1208 [10:34<25:05,  1.77s/it, loss=0.183, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00136, train/loss_step=0.298, global_step=3713.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  30%|██▉       | 358/1208 [10:34<25:05,  1.77s/it, loss=0.177, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000407, train/loss_step=0.124, global_step=3713.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  30%|██▉       | 359/1208 [10:35<25:01,  1.77s/it, loss=0.177, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000407, train/loss_step=0.124, global_step=3713.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  30%|██▉       | 359/1208 [10:35<25:01,  1.77s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=1.41e-5, train/loss_step=0.00245, global_step=3713.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  30%|██▉       | 360/1208 [10:38<25:03,  1.77s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=1.41e-5, train/loss_step=0.00245, global_step=3713.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  30%|██▉       | 360/1208 [10:38<25:03,  1.77s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=8.9e-5, train/loss_step=0.0229, global_step=3713.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  30%|██▉       | 361/1208 [10:39<25:00,  1.77s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=8.9e-5, train/loss_step=0.0229, global_step=3713.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  30%|██▉       | 361/1208 [10:39<25:00,  1.77s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=1.19e-5, train/loss_step=0.00201, global_step=3714.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  30%|██▉       | 362/1208 [10:40<24:56,  1.77s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=1.19e-5, train/loss_step=0.00201, global_step=3714.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  30%|██▉       | 362/1208 [10:40<24:56,  1.77s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.57e-5, train/loss_step=0.0026, global_step=3714.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  30%|███       | 363/1208 [10:41<24:53,  1.77s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.57e-5, train/loss_step=0.0026, global_step=3714.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  30%|███       | 363/1208 [10:41<24:53,  1.77s/it, loss=0.159, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00252, train/loss_step=0.363, global_step=3714.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  30%|███       | 364/1208 [10:44<24:55,  1.77s/it, loss=0.159, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00252, train/loss_step=0.363, global_step=3714.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  30%|███       | 364/1208 [10:44<24:55,  1.77s/it, loss=0.156, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000283, train/loss_step=0.086, global_step=3714.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  30%|███       | 365/1208 [10:45<24:51,  1.77s/it, loss=0.156, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000283, train/loss_step=0.086, global_step=3714.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  30%|███       | 365/1208 [10:45<24:51,  1.77s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0289, train/loss_vlb_step=0.000115, train/loss_step=0.0289, global_step=3715.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  30%|███       | 366/1208 [10:46<24:48,  1.77s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0289, train/loss_vlb_step=0.000115, train/loss_step=0.0289, global_step=3715.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  30%|███       | 366/1208 [10:46<24:48,  1.77s/it, loss=0.155, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000624, train/loss_step=0.182, global_step=3715.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  30%|███       | 367/1208 [10:47<24:44,  1.77s/it, loss=0.155, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000624, train/loss_step=0.182, global_step=3715.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  30%|███       | 367/1208 [10:47<24:44,  1.77s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0324, train/loss_vlb_step=0.000123, train/loss_step=0.0324, global_step=3715.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  30%|███       | 368/1208 [10:51<24:46,  1.77s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0324, train/loss_vlb_step=0.000123, train/loss_step=0.0324, global_step=3715.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  30%|███       | 368/1208 [10:51<24:46,  1.77s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000116, train/loss_step=0.0306, global_step=3715.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  31%|███       | 369/1208 [10:52<24:43,  1.77s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000116, train/loss_step=0.0306, global_step=3715.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  31%|███       | 369/1208 [10:52<24:43,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000429, train/loss_step=0.130, global_step=3716.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  31%|███       | 370/1208 [10:53<24:39,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000429, train/loss_step=0.130, global_step=3716.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  31%|███       | 370/1208 [10:53<24:39,  1.77s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00949, train/loss_vlb_step=4.4e-5, train/loss_step=0.00949, global_step=3716.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  31%|███       | 371/1208 [10:54<24:36,  1.76s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00949, train/loss_vlb_step=4.4e-5, train/loss_step=0.00949, global_step=3716.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  31%|███       | 371/1208 [10:54<24:36,  1.76s/it, loss=0.123, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00105, train/loss_step=0.247, global_step=3716.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  31%|███       | 372/1208 [10:57<24:37,  1.77s/it, loss=0.123, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00105, train/loss_step=0.247, global_step=3716.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  31%|███       | 372/1208 [10:57<24:37,  1.77s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=0.000105, train/loss_step=0.0257, global_step=3716.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  31%|███       | 373/1208 [10:58<24:34,  1.77s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=0.000105, train/loss_step=0.0257, global_step=3716.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  31%|███       | 373/1208 [10:58<24:34,  1.77s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.85e-5, train/loss_step=0.0133, global_step=3717.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  31%|███       | 374/1208 [10:59<24:31,  1.76s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.85e-5, train/loss_step=0.0133, global_step=3717.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  31%|███       | 374/1208 [10:59<24:31,  1.76s/it, loss=0.105, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00108, train/loss_step=0.265, global_step=3717.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  31%|███       | 375/1208 [11:00<24:27,  1.76s/it, loss=0.105, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00108, train/loss_step=0.265, global_step=3717.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  31%|███       | 375/1208 [11:00<24:27,  1.76s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0452, train/loss_vlb_step=0.000166, train/loss_step=0.0452, global_step=3717.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  31%|███       | 376/1208 [11:04<24:29,  1.77s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0452, train/loss_vlb_step=0.000166, train/loss_step=0.0452, global_step=3717.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  31%|███       | 376/1208 [11:04<24:29,  1.77s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0097, train/loss_vlb_step=4.51e-5, train/loss_step=0.0097, global_step=3717.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  31%|███       | 377/1208 [11:05<24:25,  1.76s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0097, train/loss_vlb_step=4.51e-5, train/loss_step=0.0097, global_step=3717.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  31%|███       | 377/1208 [11:05<24:25,  1.76s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.000973, train/loss_step=0.251, global_step=3718.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  31%|███▏      | 378/1208 [11:06<24:22,  1.76s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.000973, train/loss_step=0.251, global_step=3718.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  31%|███▏      | 378/1208 [11:06<24:22,  1.76s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.13e-5, train/loss_step=0.00195, global_step=3718.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  31%|███▏      | 379/1208 [11:07<24:19,  1.76s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.13e-5, train/loss_step=0.00195, global_step=3718.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  31%|███▏      | 379/1208 [11:07<24:19,  1.76s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.67e-5, train/loss_step=0.0155, global_step=3718.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  31%|███▏      | 380/1208 [11:10<24:20,  1.76s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.67e-5, train/loss_step=0.0155, global_step=3718.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  31%|███▏      | 380/1208 [11:10<24:20,  1.76s/it, loss=0.094, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.00047, train/loss_step=0.138, global_step=3718.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  32%|███▏      | 381/1208 [11:11<24:17,  1.76s/it, loss=0.094, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.00047, train/loss_step=0.138, global_step=3718.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  32%|███▏      | 381/1208 [11:11<24:17,  1.76s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.00435, train/loss_vlb_step=2.35e-5, train/loss_step=0.00435, global_step=3719.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  32%|███▏      | 382/1208 [11:12<24:14,  1.76s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.00435, train/loss_vlb_step=2.35e-5, train/loss_step=0.00435, global_step=3719.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  32%|███▏      | 382/1208 [11:12<24:14,  1.76s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.29e-5, train/loss_step=0.0181, global_step=3719.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  32%|███▏      | 383/1208 [11:13<24:10,  1.76s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.29e-5, train/loss_step=0.0181, global_step=3719.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  32%|███▏      | 383/1208 [11:13<24:10,  1.76s/it, loss=0.077, v_num=0, train/loss_simple_step=0.00658, train/loss_vlb_step=3.23e-5, train/loss_step=0.00658, global_step=3719.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  32%|███▏      | 384/1208 [11:16<24:12,  1.76s/it, loss=0.077, v_num=0, train/loss_simple_step=0.00658, train/loss_vlb_step=3.23e-5, train/loss_step=0.00658, global_step=3719.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  32%|███▏      | 384/1208 [11:16<24:12,  1.76s/it, loss=0.0903, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00176, train/loss_step=0.352, global_step=3719.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  32%|███▏      | 385/1208 [11:17<24:09,  1.76s/it, loss=0.0903, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00176, train/loss_step=0.352, global_step=3719.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  32%|███▏      | 385/1208 [11:17<24:09,  1.76s/it, loss=0.101, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00111, train/loss_step=0.251, global_step=3720.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  32%|███▏      | 386/1208 [11:18<24:05,  1.76s/it, loss=0.101, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00111, train/loss_step=0.251, global_step=3720.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  32%|███▏      | 386/1208 [11:18<24:05,  1.76s/it, loss=0.102, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.0007, train/loss_step=0.196, global_step=3720.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  32%|███▏      | 387/1208 [11:19<24:02,  1.76s/it, loss=0.102, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.0007, train/loss_step=0.196, global_step=3720.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  32%|███▏      | 387/1208 [11:19<24:02,  1.76s/it, loss=0.109, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000553, train/loss_step=0.164, global_step=3720.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  32%|███▏      | 388/1208 [11:23<24:03,  1.76s/it, loss=0.109, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000553, train/loss_step=0.164, global_step=3720.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  32%|███▏      | 388/1208 [11:23<24:03,  1.76s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00926, train/loss_vlb_step=4.43e-5, train/loss_step=0.00926, global_step=3720.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  32%|███▏      | 389/1208 [11:24<24:00,  1.76s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00926, train/loss_vlb_step=4.43e-5, train/loss_step=0.00926, global_step=3720.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  32%|███▏      | 389/1208 [11:24<24:00,  1.76s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00237, train/loss_vlb_step=1.41e-5, train/loss_step=0.00237, global_step=3721.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  32%|███▏      | 390/1208 [11:25<23:57,  1.76s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00237, train/loss_vlb_step=1.41e-5, train/loss_step=0.00237, global_step=3721.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  32%|███▏      | 390/1208 [11:25<23:57,  1.76s/it, loss=0.11, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000663, train/loss_step=0.187, global_step=3721.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  32%|███▏      | 391/1208 [11:26<23:54,  1.76s/it, loss=0.11, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000663, train/loss_step=0.187, global_step=3721.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  32%|███▏      | 391/1208 [11:26<23:54,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00129, train/loss_step=0.301, global_step=3721.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  32%|███▏      | 392/1208 [11:29<23:55,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00129, train/loss_step=0.301, global_step=3721.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  32%|███▏      | 392/1208 [11:29<23:55,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00955, train/loss_vlb_step=4.37e-5, train/loss_step=0.00955, global_step=3721.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  33%|███▎      | 393/1208 [11:30<23:52,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00955, train/loss_vlb_step=4.37e-5, train/loss_step=0.00955, global_step=3721.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  33%|███▎      | 393/1208 [11:30<23:52,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.89e-5, train/loss_step=0.0183, global_step=3722.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  33%|███▎      | 394/1208 [11:31<23:48,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.89e-5, train/loss_step=0.0183, global_step=3722.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  33%|███▎      | 394/1208 [11:31<23:48,  1.76s/it, loss=0.105, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000386, train/loss_step=0.118, global_step=3722.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  33%|███▎      | 395/1208 [11:32<23:45,  1.75s/it, loss=0.105, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000386, train/loss_step=0.118, global_step=3722.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  33%|███▎      | 395/1208 [11:32<23:45,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.0013, train/loss_step=0.282, global_step=3722.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  33%|███▎      | 396/1208 [11:35<23:46,  1.76s/it, loss=0.117, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.0013, train/loss_step=0.282, global_step=3722.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  33%|███▎      | 396/1208 [11:35<23:46,  1.76s/it, loss=0.128, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000961, train/loss_step=0.225, global_step=3722.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  33%|███▎      | 397/1208 [11:36<23:43,  1.76s/it, loss=0.128, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000961, train/loss_step=0.225, global_step=3722.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  33%|███▎      | 397/1208 [11:36<23:43,  1.76s/it, loss=0.116, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.8e-5, train/loss_step=0.024, global_step=3723.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  33%|███▎      | 398/1208 [11:38<23:40,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.8e-5, train/loss_step=0.024, global_step=3723.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  33%|███▎      | 398/1208 [11:38<23:40,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0882, train/loss_vlb_step=0.000292, train/loss_step=0.0882, global_step=3723.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  33%|███▎      | 399/1208 [11:39<23:37,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0882, train/loss_vlb_step=0.000292, train/loss_step=0.0882, global_step=3723.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  33%|███▎      | 399/1208 [11:39<23:37,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=1.99e-5, train/loss_step=0.00373, global_step=3723.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  33%|███▎      | 400/1208 [11:42<23:38,  1.76s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=1.99e-5, train/loss_step=0.00373, global_step=3723.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  33%|███▎      | 400/1208 [11:42<23:38,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00893, train/loss_vlb_step=4.15e-5, train/loss_step=0.00893, global_step=3723.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  33%|███▎      | 401/1208 [11:43<23:35,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00893, train/loss_vlb_step=4.15e-5, train/loss_step=0.00893, global_step=3723.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  33%|███▎      | 401/1208 [11:43<23:35,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.00057, train/loss_step=0.167, global_step=3724.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  33%|███▎      | 402/1208 [11:44<23:32,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.00057, train/loss_step=0.167, global_step=3724.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  33%|███▎      | 402/1208 [11:44<23:32,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0725, train/loss_vlb_step=0.000246, train/loss_step=0.0725, global_step=3724.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  33%|███▎      | 403/1208 [11:45<23:29,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0725, train/loss_vlb_step=0.000246, train/loss_step=0.0725, global_step=3724.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  33%|███▎      | 403/1208 [11:45<23:29,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00101, train/loss_step=0.248, global_step=3724.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  33%|███▎      | 404/1208 [11:48<23:30,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00101, train/loss_step=0.248, global_step=3724.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  33%|███▎      | 404/1208 [11:48<23:30,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000984, train/loss_step=0.246, global_step=3724.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  34%|███▎      | 405/1208 [11:49<23:27,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000984, train/loss_step=0.246, global_step=3724.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  34%|███▎      | 405/1208 [11:49<23:27,  1.75s/it, loss=0.16, v_num=0, train/loss_simple_step=0.837, train/loss_vlb_step=0.0538, train/loss_step=0.837, global_step=3725.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  34%|███▎      | 406/1208 [11:50<23:24,  1.75s/it, loss=0.16, v_num=0, train/loss_simple_step=0.837, train/loss_vlb_step=0.0538, train/loss_step=0.837, global_step=3725.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  34%|███▎      | 406/1208 [11:50<23:24,  1.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0081, train/loss_vlb_step=3.93e-5, train/loss_step=0.0081, global_step=3725.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  34%|███▎      | 407/1208 [11:51<23:21,  1.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0081, train/loss_vlb_step=3.93e-5, train/loss_step=0.0081, global_step=3725.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  34%|███▎      | 407/1208 [11:51<23:21,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000902, train/loss_step=0.226, global_step=3725.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  34%|███▍      | 408/1208 [11:55<23:22,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000902, train/loss_step=0.226, global_step=3725.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  34%|███▍      | 408/1208 [11:55<23:22,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000559, train/loss_step=0.164, global_step=3725.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  34%|███▍      | 409/1208 [11:56<23:19,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000559, train/loss_step=0.164, global_step=3725.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  34%|███▍      | 409/1208 [11:56<23:19,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=1.25e-5, train/loss_step=0.00214, global_step=3726.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  34%|███▍      | 410/1208 [11:57<23:16,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=1.25e-5, train/loss_step=0.00214, global_step=3726.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  34%|███▍      | 410/1208 [11:57<23:16,  1.75s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00719, train/loss_vlb_step=3.79e-5, train/loss_step=0.00719, global_step=3726.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  34%|███▍      | 411/1208 [11:58<23:13,  1.75s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00719, train/loss_vlb_step=3.79e-5, train/loss_step=0.00719, global_step=3726.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  34%|███▍      | 411/1208 [11:58<23:13,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=8.07e-5, train/loss_step=0.0193, global_step=3726.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  34%|███▍      | 412/1208 [12:01<23:14,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=8.07e-5, train/loss_step=0.0193, global_step=3726.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  34%|███▍      | 412/1208 [12:01<23:14,  1.75s/it, loss=0.146, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000557, train/loss_step=0.164, global_step=3726.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  34%|███▍      | 413/1208 [12:02<23:11,  1.75s/it, loss=0.146, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000557, train/loss_step=0.164, global_step=3726.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  34%|███▍      | 413/1208 [12:02<23:11,  1.75s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0616, train/loss_vlb_step=0.000211, train/loss_step=0.0616, global_step=3727.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  34%|███▍      | 414/1208 [12:03<23:08,  1.75s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0616, train/loss_vlb_step=0.000211, train/loss_step=0.0616, global_step=3727.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  34%|███▍      | 414/1208 [12:03<23:08,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00567, train/loss_vlb_step=2.93e-5, train/loss_step=0.00567, global_step=3727.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  34%|███▍      | 415/1208 [12:04<23:04,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00567, train/loss_vlb_step=2.93e-5, train/loss_step=0.00567, global_step=3727.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  34%|███▍      | 415/1208 [12:04<23:04,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000112, train/loss_step=0.0291, global_step=3727.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  34%|███▍      | 416/1208 [12:08<23:06,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000112, train/loss_step=0.0291, global_step=3727.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  34%|███▍      | 416/1208 [12:08<23:06,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0944, train/loss_vlb_step=0.00031, train/loss_step=0.0944, global_step=3727.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  35%|███▍      | 417/1208 [12:09<23:03,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0944, train/loss_vlb_step=0.00031, train/loss_step=0.0944, global_step=3727.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  35%|███▍      | 417/1208 [12:09<23:03,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00171, train/loss_step=0.342, global_step=3728.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  35%|███▍      | 418/1208 [12:10<22:59,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00171, train/loss_step=0.342, global_step=3728.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  35%|███▍      | 418/1208 [12:10<22:59,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0498, train/loss_vlb_step=0.000168, train/loss_step=0.0498, global_step=3728.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  35%|███▍      | 419/1208 [12:11<22:56,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0498, train/loss_vlb_step=0.000168, train/loss_step=0.0498, global_step=3728.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  35%|███▍      | 419/1208 [12:11<22:56,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=3728.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  35%|███▍      | 420/1208 [12:14<22:58,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=3728.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  35%|███▍      | 420/1208 [12:14<22:58,  1.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000461, train/loss_step=0.139, global_step=3728.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  35%|███▍      | 421/1208 [12:15<22:54,  1.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000461, train/loss_step=0.139, global_step=3728.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  35%|███▍      | 421/1208 [12:15<22:54,  1.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.26e-5, train/loss_step=0.0236, global_step=3729.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  35%|███▍      | 422/1208 [12:16<22:51,  1.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.26e-5, train/loss_step=0.0236, global_step=3729.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  35%|███▍      | 422/1208 [12:16<22:51,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0435, train/loss_vlb_step=0.000163, train/loss_step=0.0435, global_step=3729.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  35%|███▌      | 423/1208 [12:17<22:48,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0435, train/loss_vlb_step=0.000163, train/loss_step=0.0435, global_step=3729.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  35%|███▌      | 423/1208 [12:17<22:48,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00223, train/loss_step=0.336, global_step=3729.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  35%|███▌      | 424/1208 [12:20<22:49,  1.75s/it, loss=0.145, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00223, train/loss_step=0.336, global_step=3729.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  35%|███▌      | 424/1208 [12:20<22:49,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0619, train/loss_vlb_step=0.000209, train/loss_step=0.0619, global_step=3729.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  35%|███▌      | 425/1208 [12:21<22:46,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0619, train/loss_vlb_step=0.000209, train/loss_step=0.0619, global_step=3729.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  35%|███▌      | 425/1208 [12:21<22:46,  1.75s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000104, train/loss_step=0.0282, global_step=3730.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  35%|███▌      | 426/1208 [12:22<22:43,  1.74s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000104, train/loss_step=0.0282, global_step=3730.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  35%|███▌      | 426/1208 [12:22<22:43,  1.74s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.00512, train/loss_vlb_step=2.79e-5, train/loss_step=0.00512, global_step=3730.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  35%|███▌      | 427/1208 [12:24<22:40,  1.74s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.00512, train/loss_vlb_step=2.79e-5, train/loss_step=0.00512, global_step=3730.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  35%|███▌      | 427/1208 [12:24<22:40,  1.74s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.35e-5, train/loss_step=0.015, global_step=3730.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  35%|███▌      | 428/1208 [12:27<22:42,  1.75s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.35e-5, train/loss_step=0.015, global_step=3730.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  35%|███▌      | 428/1208 [12:27<22:42,  1.75s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00165, train/loss_step=0.310, global_step=3730.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  36%|███▌      | 429/1208 [12:28<22:39,  1.74s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00165, train/loss_step=0.310, global_step=3730.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  36%|███▌      | 429/1208 [12:28<22:39,  1.74s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.00269, train/loss_vlb_step=1.54e-5, train/loss_step=0.00269, global_step=3731.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  36%|███▌      | 430/1208 [12:29<22:36,  1.74s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.00269, train/loss_vlb_step=1.54e-5, train/loss_step=0.00269, global_step=3731.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  36%|███▌      | 430/1208 [12:29<22:36,  1.74s/it, loss=0.0923, v_num=0, train/loss_simple_step=0.00441, train/loss_vlb_step=2.36e-5, train/loss_step=0.00441, global_step=3731.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  36%|███▌      | 431/1208 [12:30<22:33,  1.74s/it, loss=0.0923, v_num=0, train/loss_simple_step=0.00441, train/loss_vlb_step=2.36e-5, train/loss_step=0.00441, global_step=3731.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  36%|███▌      | 431/1208 [12:30<22:33,  1.74s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.8e-5, train/loss_step=0.0104, global_step=3731.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  36%|███▌      | 432/1208 [12:33<22:34,  1.74s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.8e-5, train/loss_step=0.0104, global_step=3731.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  36%|███▌      | 432/1208 [12:33<22:34,  1.74s/it, loss=0.0841, v_num=0, train/loss_simple_step=0.00847, train/loss_vlb_step=4.08e-5, train/loss_step=0.00847, global_step=3731.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  36%|███▌      | 433/1208 [12:34<22:31,  1.74s/it, loss=0.0841, v_num=0, train/loss_simple_step=0.00847, train/loss_vlb_step=4.08e-5, train/loss_step=0.00847, global_step=3731.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  36%|███▌      | 433/1208 [12:34<22:31,  1.74s/it, loss=0.0817, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.99e-5, train/loss_step=0.0135, global_step=3732.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  36%|███▌      | 434/1208 [12:35<22:28,  1.74s/it, loss=0.0817, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.99e-5, train/loss_step=0.0135, global_step=3732.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  36%|███▌      | 434/1208 [12:35<22:28,  1.74s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.0745, train/loss_vlb_step=0.000247, train/loss_step=0.0745, global_step=3732.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  36%|███▌      | 435/1208 [12:36<22:25,  1.74s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.0745, train/loss_vlb_step=0.000247, train/loss_step=0.0745, global_step=3732.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  36%|███▌      | 435/1208 [12:36<22:25,  1.74s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00162, train/loss_step=0.316, global_step=3732.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  36%|███▌      | 436/1208 [12:40<22:26,  1.74s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00162, train/loss_step=0.316, global_step=3732.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  36%|███▌      | 436/1208 [12:40<22:26,  1.74s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000132, train/loss_step=0.0349, global_step=3732.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  36%|███▌      | 437/1208 [12:41<22:23,  1.74s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000132, train/loss_step=0.0349, global_step=3732.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  36%|███▌      | 437/1208 [12:41<22:23,  1.74s/it, loss=0.0798, v_num=0, train/loss_simple_step=0.00907, train/loss_vlb_step=4.13e-5, train/loss_step=0.00907, global_step=3733.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  36%|███▋      | 438/1208 [12:42<22:20,  1.74s/it, loss=0.0798, v_num=0, train/loss_simple_step=0.00907, train/loss_vlb_step=4.13e-5, train/loss_step=0.00907, global_step=3733.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  36%|███▋      | 438/1208 [12:42<22:20,  1.74s/it, loss=0.0778, v_num=0, train/loss_simple_step=0.00797, train/loss_vlb_step=3.97e-5, train/loss_step=0.00797, global_step=3733.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  36%|███▋      | 439/1208 [12:43<22:17,  1.74s/it, loss=0.0778, v_num=0, train/loss_simple_step=0.00797, train/loss_vlb_step=3.97e-5, train/loss_step=0.00797, global_step=3733.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  36%|███▋      | 439/1208 [12:43<22:17,  1.74s/it, loss=0.0831, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000795, train/loss_step=0.218, global_step=3733.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  36%|███▋      | 440/1208 [12:46<22:18,  1.74s/it, loss=0.0831, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000795, train/loss_step=0.218, global_step=3733.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  36%|███▋      | 440/1208 [12:46<22:18,  1.74s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00201, train/loss_step=0.399, global_step=3733.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  37%|███▋      | 441/1208 [12:47<22:15,  1.74s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00201, train/loss_step=0.399, global_step=3733.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  37%|███▋      | 441/1208 [12:47<22:15,  1.74s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.26e-5, train/loss_step=0.0115, global_step=3734.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  37%|███▋      | 442/1208 [12:48<22:12,  1.74s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.26e-5, train/loss_step=0.0115, global_step=3734.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  37%|███▋      | 442/1208 [12:48<22:12,  1.74s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=0.000106, train/loss_step=0.025, global_step=3734.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  37%|███▋      | 443/1208 [12:49<22:09,  1.74s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=0.000106, train/loss_step=0.025, global_step=3734.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  37%|███▋      | 443/1208 [12:49<22:09,  1.74s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00128, train/loss_step=0.313, global_step=3734.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  37%|███▋      | 444/1208 [12:53<22:10,  1.74s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00128, train/loss_step=0.313, global_step=3734.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  37%|███▋      | 444/1208 [12:53<22:10,  1.74s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.0985, train/loss_vlb_step=0.000326, train/loss_step=0.0985, global_step=3734.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  37%|███▋      | 445/1208 [12:54<22:07,  1.74s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.0985, train/loss_vlb_step=0.000326, train/loss_step=0.0985, global_step=3734.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  37%|███▋      | 445/1208 [12:54<22:07,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00119, train/loss_step=0.249, global_step=3735.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  37%|███▋      | 446/1208 [12:55<22:04,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00119, train/loss_step=0.249, global_step=3735.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  37%|███▋      | 446/1208 [12:55<22:04,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.750, train/loss_vlb_step=0.0388, train/loss_step=0.750, global_step=3735.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  37%|███▋      | 447/1208 [12:56<22:01,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.750, train/loss_vlb_step=0.0388, train/loss_step=0.750, global_step=3735.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  37%|███▋      | 447/1208 [12:56<22:01,  1.74s/it, loss=0.158, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00134, train/loss_step=0.295, global_step=3735.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  37%|███▋      | 448/1208 [12:59<22:02,  1.74s/it, loss=0.158, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00134, train/loss_step=0.295, global_step=3735.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  37%|███▋      | 448/1208 [12:59<22:02,  1.74s/it, loss=0.15, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000568, train/loss_step=0.167, global_step=3735.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  37%|███▋      | 449/1208 [13:00<21:59,  1.74s/it, loss=0.15, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000568, train/loss_step=0.167, global_step=3735.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  37%|███▋      | 449/1208 [13:00<21:59,  1.74s/it, loss=0.156, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=3736.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  37%|███▋      | 450/1208 [13:01<21:56,  1.74s/it, loss=0.156, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=3736.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  37%|███▋      | 450/1208 [13:01<21:56,  1.74s/it, loss=0.161, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000348, train/loss_step=0.106, global_step=3736.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  37%|███▋      | 451/1208 [13:02<21:53,  1.74s/it, loss=0.161, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000348, train/loss_step=0.106, global_step=3736.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  37%|███▋      | 451/1208 [13:02<21:53,  1.74s/it, loss=0.171, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000804, train/loss_step=0.217, global_step=3736.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  37%|███▋      | 452/1208 [13:05<21:54,  1.74s/it, loss=0.171, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000804, train/loss_step=0.217, global_step=3736.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  37%|███▋      | 452/1208 [13:05<21:54,  1.74s/it, loss=0.191, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00433, train/loss_step=0.398, global_step=3736.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  38%|███▊      | 453/1208 [13:06<21:51,  1.74s/it, loss=0.191, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00433, train/loss_step=0.398, global_step=3736.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  38%|███▊      | 453/1208 [13:06<21:51,  1.74s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.17e-5, train/loss_step=0.0116, global_step=3737.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  38%|███▊      | 454/1208 [13:07<21:48,  1.74s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.17e-5, train/loss_step=0.0116, global_step=3737.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  38%|███▊      | 454/1208 [13:07<21:48,  1.74s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.000241, train/loss_step=0.0702, global_step=3737.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  38%|███▊      | 455/1208 [13:09<21:45,  1.73s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.000241, train/loss_step=0.0702, global_step=3737.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  38%|███▊      | 455/1208 [13:09<21:45,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.02e-5, train/loss_step=0.0111, global_step=3737.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  38%|███▊      | 456/1208 [13:12<21:46,  1.74s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.02e-5, train/loss_step=0.0111, global_step=3737.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  38%|███▊      | 456/1208 [13:12<21:46,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00869, train/loss_vlb_step=4.21e-5, train/loss_step=0.00869, global_step=3737.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  38%|███▊      | 457/1208 [13:13<21:43,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00869, train/loss_vlb_step=4.21e-5, train/loss_step=0.00869, global_step=3737.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  38%|███▊      | 457/1208 [13:13<21:43,  1.74s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0647, train/loss_vlb_step=0.000226, train/loss_step=0.0647, global_step=3738.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  38%|███▊      | 458/1208 [13:14<21:40,  1.73s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0647, train/loss_vlb_step=0.000226, train/loss_step=0.0647, global_step=3738.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  38%|███▊      | 458/1208 [13:14<21:40,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000402, train/loss_step=0.121, global_step=3738.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  38%|███▊      | 459/1208 [13:15<21:37,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000402, train/loss_step=0.121, global_step=3738.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  38%|███▊      | 459/1208 [13:15<21:37,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.15e-5, train/loss_step=0.00202, global_step=3738.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  38%|███▊      | 460/1208 [13:18<21:38,  1.74s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.15e-5, train/loss_step=0.00202, global_step=3738.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  38%|███▊      | 460/1208 [13:18<21:38,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0641, train/loss_vlb_step=0.000224, train/loss_step=0.0641, global_step=3738.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  38%|███▊      | 461/1208 [13:19<21:35,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0641, train/loss_vlb_step=0.000224, train/loss_step=0.0641, global_step=3738.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  38%|███▊      | 461/1208 [13:19<21:35,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00133, train/loss_step=0.288, global_step=3739.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  38%|███▊      | 462/1208 [13:20<21:33,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00133, train/loss_step=0.288, global_step=3739.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  38%|███▊      | 462/1208 [13:20<21:33,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000905, train/loss_step=0.219, global_step=3739.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  38%|███▊      | 463/1208 [13:21<21:30,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000905, train/loss_step=0.219, global_step=3739.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  38%|███▊      | 463/1208 [13:21<21:30,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000532, train/loss_step=0.155, global_step=3739.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  38%|███▊      | 464/1208 [13:25<21:31,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000532, train/loss_step=0.155, global_step=3739.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  38%|███▊      | 464/1208 [13:25<21:31,  1.74s/it, loss=0.175, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000795, train/loss_step=0.204, global_step=3739.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  38%|███▊      | 465/1208 [13:26<21:28,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000795, train/loss_step=0.204, global_step=3739.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  38%|███▊      | 465/1208 [13:26<21:28,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.21e-5, train/loss_step=0.0115, global_step=3740.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  39%|███▊      | 466/1208 [13:27<21:25,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.21e-5, train/loss_step=0.0115, global_step=3740.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  39%|███▊      | 466/1208 [13:27<21:25,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=3740.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  39%|███▊      | 467/1208 [13:28<21:22,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=3740.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  39%|███▊      | 467/1208 [13:28<21:22,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.28e-5, train/loss_step=0.0147, global_step=3740.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  39%|███▊      | 468/1208 [13:31<21:23,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.28e-5, train/loss_step=0.0147, global_step=3740.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  39%|███▊      | 468/1208 [13:31<21:23,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000994, train/loss_step=0.244, global_step=3740.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  39%|███▉      | 469/1208 [13:32<21:20,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000994, train/loss_step=0.244, global_step=3740.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  39%|███▉      | 469/1208 [13:32<21:20,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00934, train/loss_vlb_step=4.32e-5, train/loss_step=0.00934, global_step=3741.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  39%|███▉      | 470/1208 [13:33<21:17,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00934, train/loss_vlb_step=4.32e-5, train/loss_step=0.00934, global_step=3741.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  39%|███▉      | 470/1208 [13:33<21:17,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00581, train/loss_vlb_step=2.94e-5, train/loss_step=0.00581, global_step=3741.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  39%|███▉      | 471/1208 [13:34<21:14,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00581, train/loss_vlb_step=2.94e-5, train/loss_step=0.00581, global_step=3741.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  39%|███▉      | 471/1208 [13:34<21:14,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000171, train/loss_step=0.0463, global_step=3741.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  39%|███▉      | 472/1208 [13:38<21:15,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000171, train/loss_step=0.0463, global_step=3741.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  39%|███▉      | 472/1208 [13:38<21:15,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.849, train/loss_vlb_step=0.427, train/loss_step=0.849, global_step=3741.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]     Epoch 12:  39%|███▉      | 473/1208 [13:39<21:12,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.849, train/loss_vlb_step=0.427, train/loss_step=0.849, global_step=3741.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  39%|███▉      | 473/1208 [13:39<21:12,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00662, train/loss_vlb_step=3.4e-5, train/loss_step=0.00662, global_step=3742.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  39%|███▉      | 474/1208 [13:40<21:10,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00662, train/loss_vlb_step=3.4e-5, train/loss_step=0.00662, global_step=3742.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  39%|███▉      | 474/1208 [13:40<21:10,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.00065, train/loss_step=0.188, global_step=3742.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  39%|███▉      | 475/1208 [13:41<21:07,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.00065, train/loss_step=0.188, global_step=3742.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  39%|███▉      | 475/1208 [13:41<21:07,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00283, train/loss_step=0.384, global_step=3742.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  39%|███▉      | 476/1208 [13:44<21:07,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00283, train/loss_step=0.384, global_step=3742.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  39%|███▉      | 476/1208 [13:44<21:07,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000744, train/loss_step=0.203, global_step=3742.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  39%|███▉      | 477/1208 [13:45<21:05,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000744, train/loss_step=0.203, global_step=3742.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  39%|███▉      | 477/1208 [13:45<21:05,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0428, train/loss_vlb_step=0.000159, train/loss_step=0.0428, global_step=3743.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  40%|███▉      | 478/1208 [13:46<21:02,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0428, train/loss_vlb_step=0.000159, train/loss_step=0.0428, global_step=3743.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  40%|███▉      | 478/1208 [13:46<21:02,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00148, train/loss_step=0.310, global_step=3743.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  40%|███▉      | 479/1208 [13:47<20:59,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00148, train/loss_step=0.310, global_step=3743.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  40%|███▉      | 479/1208 [13:47<20:59,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.12e-5, train/loss_step=0.00186, global_step=3743.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  40%|███▉      | 480/1208 [13:50<21:00,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.12e-5, train/loss_step=0.00186, global_step=3743.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  40%|███▉      | 480/1208 [13:50<21:00,  1.73s/it, loss=0.191, v_num=0, train/loss_simple_step=0.522, train/loss_vlb_step=0.0139, train/loss_step=0.522, global_step=3743.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]     Epoch 12:  40%|███▉      | 481/1208 [13:51<20:57,  1.73s/it, loss=0.191, v_num=0, train/loss_simple_step=0.522, train/loss_vlb_step=0.0139, train/loss_step=0.522, global_step=3743.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  40%|███▉      | 481/1208 [13:51<20:57,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0294, train/loss_vlb_step=0.000116, train/loss_step=0.0294, global_step=3744.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  40%|███▉      | 482/1208 [13:52<20:54,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0294, train/loss_vlb_step=0.000116, train/loss_step=0.0294, global_step=3744.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  40%|███▉      | 482/1208 [13:52<20:54,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.69e-5, train/loss_step=0.00304, global_step=3744.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  40%|███▉      | 483/1208 [13:54<20:51,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.69e-5, train/loss_step=0.00304, global_step=3744.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  40%|███▉      | 483/1208 [13:54<20:51,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00136, train/loss_step=0.290, global_step=3744.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  40%|████      | 484/1208 [13:57<20:52,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00136, train/loss_step=0.290, global_step=3744.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  40%|████      | 484/1208 [13:57<20:52,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000173, train/loss_step=0.0484, global_step=3744.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  40%|████      | 485/1208 [13:58<20:49,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000173, train/loss_step=0.0484, global_step=3744.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  40%|████      | 485/1208 [13:58<20:49,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0758, train/loss_vlb_step=0.000256, train/loss_step=0.0758, global_step=3745.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  40%|████      | 486/1208 [13:59<20:46,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0758, train/loss_vlb_step=0.000256, train/loss_step=0.0758, global_step=3745.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  40%|████      | 486/1208 [13:59<20:46,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000186, train/loss_step=0.0524, global_step=3745.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  40%|████      | 487/1208 [14:00<20:44,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000186, train/loss_step=0.0524, global_step=3745.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  40%|████      | 487/1208 [14:00<20:44,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=0.000102, train/loss_step=0.0245, global_step=3745.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  40%|████      | 488/1208 [14:03<20:44,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=0.000102, train/loss_step=0.0245, global_step=3745.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  40%|████      | 488/1208 [14:03<20:44,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000383, train/loss_step=0.115, global_step=3745.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  40%|████      | 489/1208 [14:04<20:42,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000383, train/loss_step=0.115, global_step=3745.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  40%|████      | 489/1208 [14:04<20:42,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.000984, train/loss_step=0.253, global_step=3746.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  41%|████      | 490/1208 [14:05<20:39,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.000984, train/loss_step=0.253, global_step=3746.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  41%|████      | 490/1208 [14:05<20:39,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000842, train/loss_step=0.232, global_step=3746.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  41%|████      | 491/1208 [14:06<20:36,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000842, train/loss_step=0.232, global_step=3746.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  41%|████      | 491/1208 [14:06<20:36,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000459, train/loss_step=0.136, global_step=3746.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  41%|████      | 492/1208 [14:10<20:37,  1.73s/it, loss=0.188, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000459, train/loss_step=0.136, global_step=3746.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  41%|████      | 492/1208 [14:10<20:37,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.95e-5, train/loss_step=0.00349, global_step=3746.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  41%|████      | 493/1208 [14:11<20:34,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.95e-5, train/loss_step=0.00349, global_step=3746.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  41%|████      | 493/1208 [14:11<20:34,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.21e-5, train/loss_step=0.014, global_step=3747.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  41%|████      | 494/1208 [14:12<20:31,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.21e-5, train/loss_step=0.014, global_step=3747.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  41%|████      | 494/1208 [14:12<20:31,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.29e-5, train/loss_step=0.0246, global_step=3747.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  41%|████      | 495/1208 [14:13<20:29,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.29e-5, train/loss_step=0.0246, global_step=3747.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  41%|████      | 495/1208 [14:13<20:29,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.67e-5, train/loss_step=0.0176, global_step=3747.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  41%|████      | 496/1208 [14:16<20:29,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.67e-5, train/loss_step=0.0176, global_step=3747.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  41%|████      | 496/1208 [14:16<20:29,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00115, train/loss_step=0.262, global_step=3747.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  41%|████      | 497/1208 [14:17<20:26,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00115, train/loss_step=0.262, global_step=3747.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  41%|████      | 497/1208 [14:17<20:26,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.25e-5, train/loss_step=0.0226, global_step=3748.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  41%|████      | 498/1208 [14:18<20:24,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.25e-5, train/loss_step=0.0226, global_step=3748.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  41%|████      | 498/1208 [14:18<20:24,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=3748.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  41%|████▏     | 499/1208 [14:19<20:21,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=3748.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  41%|████▏     | 499/1208 [14:19<20:21,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000428, train/loss_step=0.130, global_step=3748.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  41%|████▏     | 500/1208 [14:22<20:21,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000428, train/loss_step=0.130, global_step=3748.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  41%|████▏     | 500/1208 [14:22<20:21,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00532, train/loss_step=0.442, global_step=3748.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  41%|████▏     | 501/1208 [14:23<20:19,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00532, train/loss_step=0.442, global_step=3748.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  41%|████▏     | 501/1208 [14:23<20:19,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0625, train/loss_vlb_step=0.000209, train/loss_step=0.0625, global_step=3749.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  42%|████▏     | 502/1208 [14:25<20:16,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0625, train/loss_vlb_step=0.000209, train/loss_step=0.0625, global_step=3749.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  42%|████▏     | 502/1208 [14:25<20:16,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000518, train/loss_step=0.154, global_step=3749.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  42%|████▏     | 503/1208 [14:26<20:13,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000518, train/loss_step=0.154, global_step=3749.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  42%|████▏     | 503/1208 [14:26<20:13,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.082, train/loss_vlb_step=0.000279, train/loss_step=0.082, global_step=3749.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  42%|████▏     | 504/1208 [14:29<20:14,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.082, train/loss_vlb_step=0.000279, train/loss_step=0.082, global_step=3749.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  42%|████▏     | 504/1208 [14:29<20:14,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00123, train/loss_step=0.287, global_step=3749.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  42%|████▏     | 505/1208 [14:30<20:11,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00123, train/loss_step=0.287, global_step=3749.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  42%|████▏     | 505/1208 [14:30<20:11,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000788, train/loss_step=0.217, global_step=3750.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  42%|████▏     | 506/1208 [14:31<20:09,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000788, train/loss_step=0.217, global_step=3750.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  42%|████▏     | 506/1208 [14:31<20:09,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000401, train/loss_step=0.122, global_step=3750.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  42%|████▏     | 507/1208 [14:32<20:06,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000401, train/loss_step=0.122, global_step=3750.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  42%|████▏     | 507/1208 [14:32<20:06,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.26e-5, train/loss_step=0.0239, global_step=3750.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  42%|████▏     | 508/1208 [14:35<20:06,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.26e-5, train/loss_step=0.0239, global_step=3750.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  42%|████▏     | 508/1208 [14:35<20:06,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=3750.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  42%|████▏     | 509/1208 [14:36<20:04,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=3750.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  42%|████▏     | 509/1208 [14:36<20:04,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00172, train/loss_step=0.317, global_step=3751.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  42%|████▏     | 510/1208 [14:37<20:01,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00172, train/loss_step=0.317, global_step=3751.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  42%|████▏     | 510/1208 [14:37<20:01,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=7.15e-5, train/loss_step=0.0161, global_step=3751.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  42%|████▏     | 511/1208 [14:38<19:58,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=7.15e-5, train/loss_step=0.0161, global_step=3751.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  42%|████▏     | 511/1208 [14:38<19:58,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=1.23e-5, train/loss_step=0.00217, global_step=3751.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  42%|████▏     | 512/1208 [14:42<19:59,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=1.23e-5, train/loss_step=0.00217, global_step=3751.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  42%|████▏     | 512/1208 [14:42<19:59,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000377, train/loss_step=0.115, global_step=3751.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  42%|████▏     | 513/1208 [14:43<19:56,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000377, train/loss_step=0.115, global_step=3751.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  42%|████▏     | 513/1208 [14:43<19:56,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=9.14e-5, train/loss_step=0.0225, global_step=3752.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  43%|████▎     | 514/1208 [14:44<19:53,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=9.14e-5, train/loss_step=0.0225, global_step=3752.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  43%|████▎     | 514/1208 [14:44<19:53,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00537, train/loss_vlb_step=2.84e-5, train/loss_step=0.00537, global_step=3752.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  43%|████▎     | 515/1208 [14:45<19:51,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00537, train/loss_vlb_step=2.84e-5, train/loss_step=0.00537, global_step=3752.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  43%|████▎     | 515/1208 [14:45<19:51,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000137, train/loss_step=0.0372, global_step=3752.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  43%|████▎     | 516/1208 [14:48<19:51,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000137, train/loss_step=0.0372, global_step=3752.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  43%|████▎     | 516/1208 [14:48<19:51,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00634, train/loss_step=0.428, global_step=3752.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  43%|████▎     | 517/1208 [14:49<19:49,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00634, train/loss_step=0.428, global_step=3752.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  43%|████▎     | 517/1208 [14:49<19:49,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=8.8e-5, train/loss_step=0.0226, global_step=3753.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  43%|████▎     | 518/1208 [14:50<19:46,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=8.8e-5, train/loss_step=0.0226, global_step=3753.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  43%|████▎     | 518/1208 [14:50<19:46,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0789, train/loss_vlb_step=0.000261, train/loss_step=0.0789, global_step=3753.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  43%|████▎     | 519/1208 [14:51<19:43,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0789, train/loss_vlb_step=0.000261, train/loss_step=0.0789, global_step=3753.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  43%|████▎     | 519/1208 [14:51<19:43,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.71e-5, train/loss_step=0.0208, global_step=3753.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  43%|████▎     | 520/1208 [14:55<19:44,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.71e-5, train/loss_step=0.0208, global_step=3753.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  43%|████▎     | 520/1208 [14:55<19:44,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=9.19e-5, train/loss_step=0.0216, global_step=3753.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  43%|████▎     | 521/1208 [14:56<19:41,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=9.19e-5, train/loss_step=0.0216, global_step=3753.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  43%|████▎     | 521/1208 [14:56<19:41,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.87e-5, train/loss_step=0.0215, global_step=3754.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  43%|████▎     | 522/1208 [14:57<19:39,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.87e-5, train/loss_step=0.0215, global_step=3754.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  43%|████▎     | 522/1208 [14:57<19:39,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000521, train/loss_step=0.155, global_step=3754.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  43%|████▎     | 523/1208 [14:58<19:36,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000521, train/loss_step=0.155, global_step=3754.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  43%|████▎     | 523/1208 [14:58<19:36,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0574, train/loss_vlb_step=0.000203, train/loss_step=0.0574, global_step=3754.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  43%|████▎     | 524/1208 [15:01<19:36,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0574, train/loss_vlb_step=0.000203, train/loss_step=0.0574, global_step=3754.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  43%|████▎     | 524/1208 [15:01<19:36,  1.72s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.22e-5, train/loss_step=0.0166, global_step=3754.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  43%|████▎     | 525/1208 [15:02<19:34,  1.72s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.22e-5, train/loss_step=0.0166, global_step=3754.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  43%|████▎     | 525/1208 [15:02<19:34,  1.72s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000825, train/loss_step=0.219, global_step=3755.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  44%|████▎     | 526/1208 [15:03<19:31,  1.72s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000825, train/loss_step=0.219, global_step=3755.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  44%|████▎     | 526/1208 [15:03<19:31,  1.72s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000949, train/loss_step=0.234, global_step=3755.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  44%|████▎     | 527/1208 [15:04<19:29,  1.72s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000949, train/loss_step=0.234, global_step=3755.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  44%|████▎     | 527/1208 [15:04<19:29,  1.72s/it, loss=0.0952, v_num=0, train/loss_simple_step=0.00371, train/loss_vlb_step=2.03e-5, train/loss_step=0.00371, global_step=3755.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  44%|████▎     | 528/1208 [15:07<19:29,  1.72s/it, loss=0.0952, v_num=0, train/loss_simple_step=0.00371, train/loss_vlb_step=2.03e-5, train/loss_step=0.00371, global_step=3755.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  44%|████▎     | 528/1208 [15:07<19:29,  1.72s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000627, train/loss_step=0.180, global_step=3755.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  44%|████▍     | 529/1208 [15:08<19:26,  1.72s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000627, train/loss_step=0.180, global_step=3755.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  44%|████▍     | 529/1208 [15:08<19:26,  1.72s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000624, train/loss_step=0.180, global_step=3756.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  44%|████▍     | 530/1208 [15:10<19:24,  1.72s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000624, train/loss_step=0.180, global_step=3756.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  44%|████▍     | 530/1208 [15:10<19:24,  1.72s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.00814, train/loss_vlb_step=4.06e-5, train/loss_step=0.00814, global_step=3756.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  44%|████▍     | 531/1208 [15:11<19:21,  1.72s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.00814, train/loss_vlb_step=4.06e-5, train/loss_step=0.00814, global_step=3756.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  44%|████▍     | 531/1208 [15:11<19:21,  1.72s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.87e-5, train/loss_step=0.0105, global_step=3756.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  44%|████▍     | 532/1208 [15:14<19:21,  1.72s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.87e-5, train/loss_step=0.0105, global_step=3756.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  44%|████▍     | 532/1208 [15:14<19:21,  1.72s/it, loss=0.0873, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.38e-5, train/loss_step=0.0229, global_step=3756.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  44%|████▍     | 533/1208 [15:15<19:19,  1.72s/it, loss=0.0873, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.38e-5, train/loss_step=0.0229, global_step=3756.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  44%|████▍     | 533/1208 [15:15<19:19,  1.72s/it, loss=0.0866, v_num=0, train/loss_simple_step=0.00874, train/loss_vlb_step=4.21e-5, train/loss_step=0.00874, global_step=3757.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  44%|████▍     | 534/1208 [15:16<19:16,  1.72s/it, loss=0.0866, v_num=0, train/loss_simple_step=0.00874, train/loss_vlb_step=4.21e-5, train/loss_step=0.00874, global_step=3757.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  44%|████▍     | 534/1208 [15:16<19:16,  1.72s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=3757.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  44%|████▍     | 535/1208 [15:17<19:14,  1.71s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=3757.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  44%|████▍     | 535/1208 [15:17<19:14,  1.71s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.0548, train/loss_vlb_step=0.000193, train/loss_step=0.0548, global_step=3757.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  44%|████▍     | 536/1208 [15:20<19:14,  1.72s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.0548, train/loss_vlb_step=0.000193, train/loss_step=0.0548, global_step=3757.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  44%|████▍     | 536/1208 [15:20<19:14,  1.72s/it, loss=0.0716, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.17e-5, train/loss_step=0.0115, global_step=3757.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  44%|████▍     | 537/1208 [15:21<19:11,  1.72s/it, loss=0.0716, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.17e-5, train/loss_step=0.0115, global_step=3757.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  44%|████▍     | 537/1208 [15:21<19:11,  1.72s/it, loss=0.0824, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000917, train/loss_step=0.237, global_step=3758.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  45%|████▍     | 538/1208 [15:22<19:09,  1.72s/it, loss=0.0824, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000917, train/loss_step=0.237, global_step=3758.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  45%|████▍     | 538/1208 [15:22<19:09,  1.72s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000592, train/loss_step=0.174, global_step=3758.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  45%|████▍     | 539/1208 [15:23<19:06,  1.71s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000592, train/loss_step=0.174, global_step=3758.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  45%|████▍     | 539/1208 [15:23<19:06,  1.71s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.0907, train/loss_vlb_step=0.000298, train/loss_step=0.0907, global_step=3758.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  45%|████▍     | 540/1208 [15:27<19:06,  1.72s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.0907, train/loss_vlb_step=0.000298, train/loss_step=0.0907, global_step=3758.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  45%|████▍     | 540/1208 [15:27<19:06,  1.72s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.39e-5, train/loss_step=0.00235, global_step=3758.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  45%|████▍     | 541/1208 [15:28<19:04,  1.72s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.39e-5, train/loss_step=0.00235, global_step=3758.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  45%|████▍     | 541/1208 [15:28<19:04,  1.72s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.0473, train/loss_vlb_step=0.000173, train/loss_step=0.0473, global_step=3759.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  45%|████▍     | 542/1208 [15:29<19:01,  1.71s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.0473, train/loss_vlb_step=0.000173, train/loss_step=0.0473, global_step=3759.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  45%|████▍     | 542/1208 [15:29<19:01,  1.71s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.0092, train/loss_vlb_step=4.46e-5, train/loss_step=0.0092, global_step=3759.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  45%|████▍     | 543/1208 [15:30<18:59,  1.71s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.0092, train/loss_vlb_step=4.46e-5, train/loss_step=0.0092, global_step=3759.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  45%|████▍     | 543/1208 [15:30<18:59,  1.71s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000111, train/loss_step=0.0278, global_step=3759.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  45%|████▌     | 544/1208 [15:33<18:59,  1.72s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000111, train/loss_step=0.0278, global_step=3759.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  45%|████▌     | 544/1208 [15:33<18:59,  1.72s/it, loss=0.0827, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000104, train/loss_step=0.0268, global_step=3759.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  45%|████▌     | 545/1208 [15:34<18:57,  1.71s/it, loss=0.0827, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000104, train/loss_step=0.0268, global_step=3759.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  45%|████▌     | 545/1208 [15:34<18:57,  1.71s/it, loss=0.0904, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00242, train/loss_step=0.373, global_step=3760.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  45%|████▌     | 546/1208 [15:35<18:54,  1.71s/it, loss=0.0904, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00242, train/loss_step=0.373, global_step=3760.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  45%|████▌     | 546/1208 [15:35<18:54,  1.71s/it, loss=0.0811, v_num=0, train/loss_simple_step=0.047, train/loss_vlb_step=0.000167, train/loss_step=0.047, global_step=3760.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  45%|████▌     | 547/1208 [15:36<18:51,  1.71s/it, loss=0.0811, v_num=0, train/loss_simple_step=0.047, train/loss_vlb_step=0.000167, train/loss_step=0.047, global_step=3760.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  45%|████▌     | 547/1208 [15:36<18:51,  1.71s/it, loss=0.0817, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7e-5, train/loss_step=0.0167, global_step=3760.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  45%|████▌     | 548/1208 [15:40<18:52,  1.72s/it, loss=0.0817, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7e-5, train/loss_step=0.0167, global_step=3760.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  45%|████▌     | 548/1208 [15:40<18:52,  1.72s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00093, train/loss_step=0.249, global_step=3760.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  45%|████▌     | 549/1208 [15:41<18:49,  1.71s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00093, train/loss_step=0.249, global_step=3760.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  45%|████▌     | 549/1208 [15:41<18:49,  1.71s/it, loss=0.078, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000134, train/loss_step=0.0367, global_step=3761.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  46%|████▌     | 550/1208 [15:42<18:47,  1.71s/it, loss=0.078, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000134, train/loss_step=0.0367, global_step=3761.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  46%|████▌     | 550/1208 [15:42<18:47,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.500, train/loss_vlb_step=0.00776, train/loss_step=0.500, global_step=3761.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  46%|████▌     | 551/1208 [15:43<18:44,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.500, train/loss_vlb_step=0.00776, train/loss_step=0.500, global_step=3761.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  46%|████▌     | 551/1208 [15:43<18:44,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00404, train/loss_vlb_step=2.22e-5, train/loss_step=0.00404, global_step=3761.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  46%|████▌     | 552/1208 [15:46<18:44,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00404, train/loss_vlb_step=2.22e-5, train/loss_step=0.00404, global_step=3761.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  46%|████▌     | 552/1208 [15:46<18:44,  1.71s/it, loss=0.11, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000653, train/loss_step=0.183, global_step=3761.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  46%|████▌     | 553/1208 [15:47<18:42,  1.71s/it, loss=0.11, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000653, train/loss_step=0.183, global_step=3761.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  46%|████▌     | 553/1208 [15:47<18:42,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.0021, train/loss_step=0.378, global_step=3762.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  46%|████▌     | 554/1208 [15:48<18:39,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.0021, train/loss_step=0.378, global_step=3762.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  46%|████▌     | 554/1208 [15:48<18:39,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=3762.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  46%|████▌     | 555/1208 [15:49<18:37,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=3762.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  46%|████▌     | 555/1208 [15:49<18:37,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.54e-5, train/loss_step=0.00274, global_step=3762.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  46%|████▌     | 556/1208 [15:52<18:37,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.54e-5, train/loss_step=0.00274, global_step=3762.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  46%|████▌     | 556/1208 [15:52<18:37,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00269, train/loss_step=0.413, global_step=3762.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  46%|████▌     | 557/1208 [15:53<18:34,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00269, train/loss_step=0.413, global_step=3762.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  46%|████▌     | 557/1208 [15:53<18:34,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000141, train/loss_step=0.0372, global_step=3763.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  46%|████▌     | 558/1208 [15:54<18:32,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000141, train/loss_step=0.0372, global_step=3763.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  46%|████▌     | 558/1208 [15:54<18:32,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00673, train/loss_vlb_step=3.36e-5, train/loss_step=0.00673, global_step=3763.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  46%|████▋     | 559/1208 [15:55<18:29,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00673, train/loss_vlb_step=3.36e-5, train/loss_step=0.00673, global_step=3763.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  46%|████▋     | 559/1208 [15:55<18:29,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00108, train/loss_step=0.251, global_step=3763.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  46%|████▋     | 560/1208 [15:59<18:29,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00108, train/loss_step=0.251, global_step=3763.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  46%|████▋     | 560/1208 [15:59<18:29,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0659, train/loss_vlb_step=0.000223, train/loss_step=0.0659, global_step=3763.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  46%|████▋     | 561/1208 [16:00<18:27,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0659, train/loss_vlb_step=0.000223, train/loss_step=0.0659, global_step=3763.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  46%|████▋     | 561/1208 [16:00<18:27,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00125, train/loss_step=0.297, global_step=3764.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  47%|████▋     | 562/1208 [16:01<18:25,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00125, train/loss_step=0.297, global_step=3764.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  47%|████▋     | 562/1208 [16:01<18:25,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00591, train/loss_vlb_step=3.07e-5, train/loss_step=0.00591, global_step=3764.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  47%|████▋     | 563/1208 [16:02<18:22,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00591, train/loss_vlb_step=3.07e-5, train/loss_step=0.00591, global_step=3764.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  47%|████▋     | 563/1208 [16:02<18:22,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0653, train/loss_vlb_step=0.000225, train/loss_step=0.0653, global_step=3764.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  47%|████▋     | 564/1208 [16:05<18:22,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0653, train/loss_vlb_step=0.000225, train/loss_step=0.0653, global_step=3764.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  47%|████▋     | 564/1208 [16:05<18:22,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00182, train/loss_step=0.335, global_step=3764.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  47%|████▋     | 565/1208 [16:06<18:20,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00182, train/loss_step=0.335, global_step=3764.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  47%|████▋     | 565/1208 [16:06<18:20,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.00039, train/loss_step=0.118, global_step=3765.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  47%|████▋     | 566/1208 [16:07<18:17,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.00039, train/loss_step=0.118, global_step=3765.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  47%|████▋     | 566/1208 [16:07<18:17,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00102, train/loss_step=0.254, global_step=3765.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  47%|████▋     | 567/1208 [16:08<18:15,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00102, train/loss_step=0.254, global_step=3765.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  47%|████▋     | 567/1208 [16:08<18:15,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=9.86e-5, train/loss_step=0.0254, global_step=3765.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  47%|████▋     | 568/1208 [16:12<18:15,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=9.86e-5, train/loss_step=0.0254, global_step=3765.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  47%|████▋     | 568/1208 [16:12<18:15,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00223, train/loss_step=0.344, global_step=3765.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  47%|████▋     | 569/1208 [16:13<18:12,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00223, train/loss_step=0.344, global_step=3765.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  47%|████▋     | 569/1208 [16:13<18:12,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000625, train/loss_step=0.184, global_step=3766.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  47%|████▋     | 570/1208 [16:14<18:10,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000625, train/loss_step=0.184, global_step=3766.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  47%|████▋     | 570/1208 [16:14<18:10,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00403, train/loss_vlb_step=2.16e-5, train/loss_step=0.00403, global_step=3766.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  47%|████▋     | 571/1208 [16:15<18:07,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00403, train/loss_vlb_step=2.16e-5, train/loss_step=0.00403, global_step=3766.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  47%|████▋     | 571/1208 [16:15<18:07,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.000949, train/loss_step=0.252, global_step=3766.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  47%|████▋     | 572/1208 [16:18<18:07,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.000949, train/loss_step=0.252, global_step=3766.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  47%|████▋     | 572/1208 [16:18<18:07,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.00017, train/loss_step=0.048, global_step=3766.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  47%|████▋     | 573/1208 [16:19<18:05,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.00017, train/loss_step=0.048, global_step=3766.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  47%|████▋     | 573/1208 [16:19<18:05,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.538, train/loss_vlb_step=0.00551, train/loss_step=0.538, global_step=3767.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  48%|████▊     | 574/1208 [16:20<18:03,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.538, train/loss_vlb_step=0.00551, train/loss_step=0.538, global_step=3767.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  48%|████▊     | 574/1208 [16:20<18:03,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.96e-5, train/loss_step=0.0216, global_step=3767.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  48%|████▊     | 575/1208 [16:21<18:00,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.96e-5, train/loss_step=0.0216, global_step=3767.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  48%|████▊     | 575/1208 [16:21<18:00,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.67e-5, train/loss_step=0.0146, global_step=3767.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  48%|████▊     | 576/1208 [16:24<18:00,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.67e-5, train/loss_step=0.0146, global_step=3767.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  48%|████▊     | 576/1208 [16:24<18:00,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.99e-5, train/loss_step=0.0162, global_step=3767.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  48%|████▊     | 577/1208 [16:25<17:58,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.99e-5, train/loss_step=0.0162, global_step=3767.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  48%|████▊     | 577/1208 [16:25<17:58,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000916, train/loss_step=0.248, global_step=3768.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  48%|████▊     | 578/1208 [16:26<17:55,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000916, train/loss_step=0.248, global_step=3768.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  48%|████▊     | 578/1208 [16:26<17:55,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00427, train/loss_step=0.458, global_step=3768.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  48%|████▊     | 579/1208 [16:28<17:53,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00427, train/loss_step=0.458, global_step=3768.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  48%|████▊     | 579/1208 [16:28<17:53,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0549, train/loss_vlb_step=0.000195, train/loss_step=0.0549, global_step=3768.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  48%|████▊     | 580/1208 [16:31<17:53,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0549, train/loss_vlb_step=0.000195, train/loss_step=0.0549, global_step=3768.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  48%|████▊     | 580/1208 [16:31<17:53,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00132, train/loss_step=0.275, global_step=3768.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  48%|████▊     | 581/1208 [16:32<17:50,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00132, train/loss_step=0.275, global_step=3768.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  48%|████▊     | 581/1208 [16:32<17:50,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0604, train/loss_vlb_step=0.000206, train/loss_step=0.0604, global_step=3769.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  48%|████▊     | 582/1208 [16:33<17:48,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0604, train/loss_vlb_step=0.000206, train/loss_step=0.0604, global_step=3769.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  48%|████▊     | 582/1208 [16:33<17:48,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.0019, train/loss_step=0.293, global_step=3769.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  48%|████▊     | 583/1208 [16:34<17:46,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.0019, train/loss_step=0.293, global_step=3769.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  48%|████▊     | 583/1208 [16:34<17:46,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00868, train/loss_vlb_step=4.21e-5, train/loss_step=0.00868, global_step=3769.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  48%|████▊     | 584/1208 [16:37<17:46,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00868, train/loss_vlb_step=4.21e-5, train/loss_step=0.00868, global_step=3769.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  48%|████▊     | 584/1208 [16:37<17:46,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0806, train/loss_vlb_step=0.000269, train/loss_step=0.0806, global_step=3769.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  48%|████▊     | 585/1208 [16:38<17:43,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0806, train/loss_vlb_step=0.000269, train/loss_step=0.0806, global_step=3769.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  48%|████▊     | 585/1208 [16:38<17:43,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0604, train/loss_vlb_step=0.00021, train/loss_step=0.0604, global_step=3770.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  49%|████▊     | 586/1208 [16:39<17:41,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0604, train/loss_vlb_step=0.00021, train/loss_step=0.0604, global_step=3770.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  49%|████▊     | 586/1208 [16:39<17:41,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0762, train/loss_vlb_step=0.000256, train/loss_step=0.0762, global_step=3770.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  49%|████▊     | 587/1208 [16:40<17:38,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0762, train/loss_vlb_step=0.000256, train/loss_step=0.0762, global_step=3770.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  49%|████▊     | 587/1208 [16:40<17:38,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00142, train/loss_step=0.293, global_step=3770.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  49%|████▊     | 588/1208 [16:44<17:38,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00142, train/loss_step=0.293, global_step=3770.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  49%|████▊     | 588/1208 [16:44<17:38,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=1.04e-5, train/loss_step=0.00177, global_step=3770.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  49%|████▉     | 589/1208 [16:45<17:36,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=1.04e-5, train/loss_step=0.00177, global_step=3770.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  49%|████▉     | 589/1208 [16:45<17:36,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000841, train/loss_step=0.231, global_step=3771.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  49%|████▉     | 590/1208 [16:46<17:34,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000841, train/loss_step=0.231, global_step=3771.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  49%|████▉     | 590/1208 [16:46<17:34,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0609, train/loss_vlb_step=0.000208, train/loss_step=0.0609, global_step=3771.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  49%|████▉     | 591/1208 [16:47<17:31,  1.70s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0609, train/loss_vlb_step=0.000208, train/loss_step=0.0609, global_step=3771.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  49%|████▉     | 591/1208 [16:47<17:31,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.23e-5, train/loss_step=0.00204, global_step=3771.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  49%|████▉     | 592/1208 [16:50<17:31,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.23e-5, train/loss_step=0.00204, global_step=3771.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  49%|████▉     | 592/1208 [16:50<17:31,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.000958, train/loss_step=0.249, global_step=3771.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  49%|████▉     | 593/1208 [16:51<17:29,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.000958, train/loss_step=0.249, global_step=3771.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  49%|████▉     | 593/1208 [16:51<17:29,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.0012, train/loss_step=0.283, global_step=3772.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  49%|████▉     | 594/1208 [16:52<17:26,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.0012, train/loss_step=0.283, global_step=3772.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  49%|████▉     | 594/1208 [16:52<17:26,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0627, train/loss_vlb_step=0.000216, train/loss_step=0.0627, global_step=3772.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  49%|████▉     | 595/1208 [16:53<17:24,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0627, train/loss_vlb_step=0.000216, train/loss_step=0.0627, global_step=3772.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  49%|████▉     | 595/1208 [16:53<17:24,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0788, train/loss_vlb_step=0.000264, train/loss_step=0.0788, global_step=3772.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  49%|████▉     | 596/1208 [16:57<17:24,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0788, train/loss_vlb_step=0.000264, train/loss_step=0.0788, global_step=3772.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  49%|████▉     | 596/1208 [16:57<17:24,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000593, train/loss_step=0.172, global_step=3772.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  49%|████▉     | 597/1208 [16:58<17:21,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000593, train/loss_step=0.172, global_step=3772.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  49%|████▉     | 597/1208 [16:58<17:21,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.47e-5, train/loss_step=0.00254, global_step=3773.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  50%|████▉     | 598/1208 [16:59<17:19,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.47e-5, train/loss_step=0.00254, global_step=3773.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  50%|████▉     | 598/1208 [16:59<17:19,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=3773.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  50%|████▉     | 599/1208 [17:00<17:17,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=3773.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  50%|████▉     | 599/1208 [17:00<17:17,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000657, train/loss_step=0.182, global_step=3773.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  50%|████▉     | 600/1208 [17:03<17:17,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000657, train/loss_step=0.182, global_step=3773.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  50%|████▉     | 600/1208 [17:03<17:17,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00137, train/loss_step=0.328, global_step=3773.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] 
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.75it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.80it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.79it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.80it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.75it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.75it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 12:  50%|████▉     | 601/1208 [17:34<17:44,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00137, train/loss_step=0.328, global_step=3773.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  50%|████▉     | 601/1208 [17:34<17:44,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.07e-5, train/loss_step=0.00178, global_step=3774.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  50%|████▉     | 602/1208 [17:35<17:42,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.07e-5, train/loss_step=0.00178, global_step=3774.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  50%|████▉     | 602/1208 [17:35<17:42,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00105, train/loss_step=0.264, global_step=3774.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  50%|████▉     | 603/1208 [17:36<17:39,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00105, train/loss_step=0.264, global_step=3774.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  50%|████▉     | 603/1208 [17:36<17:39,  1.75s/it, loss=0.134, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000436, train/loss_step=0.132, global_step=3774.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  50%|█████     | 604/1208 [17:39<17:39,  1.75s/it, loss=0.134, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000436, train/loss_step=0.132, global_step=3774.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  50%|█████     | 604/1208 [17:39<17:39,  1.75s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0773, train/loss_vlb_step=0.000256, train/loss_step=0.0773, global_step=3774.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  50%|█████     | 605/1208 [17:40<17:36,  1.75s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0773, train/loss_vlb_step=0.000256, train/loss_step=0.0773, global_step=3774.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  50%|█████     | 605/1208 [17:40<17:36,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=8.32e-5, train/loss_step=0.0192, global_step=3775.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  50%|█████     | 606/1208 [17:41<17:34,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=8.32e-5, train/loss_step=0.0192, global_step=3775.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  50%|█████     | 606/1208 [17:41<17:34,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.000138, train/loss_step=0.038, global_step=3775.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  50%|█████     | 607/1208 [17:42<17:32,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.000138, train/loss_step=0.038, global_step=3775.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  50%|█████     | 607/1208 [17:42<17:32,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.45e-5, train/loss_step=0.0209, global_step=3775.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  50%|█████     | 608/1208 [17:45<17:31,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.45e-5, train/loss_step=0.0209, global_step=3775.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  50%|█████     | 608/1208 [17:45<17:31,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000617, train/loss_step=0.184, global_step=3775.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  50%|█████     | 609/1208 [17:46<17:29,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000617, train/loss_step=0.184, global_step=3775.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  50%|█████     | 609/1208 [17:46<17:29,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0868, train/loss_vlb_step=0.000286, train/loss_step=0.0868, global_step=3776.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  50%|█████     | 610/1208 [17:47<17:26,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0868, train/loss_vlb_step=0.000286, train/loss_step=0.0868, global_step=3776.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  50%|█████     | 610/1208 [17:47<17:26,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=9.94e-6, train/loss_step=0.00164, global_step=3776.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  51%|█████     | 611/1208 [17:48<17:24,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=9.94e-6, train/loss_step=0.00164, global_step=3776.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  51%|█████     | 611/1208 [17:48<17:24,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=7.89e-5, train/loss_step=0.0192, global_step=3776.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  51%|█████     | 612/1208 [17:52<17:24,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=7.89e-5, train/loss_step=0.0192, global_step=3776.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  51%|█████     | 612/1208 [17:52<17:24,  1.75s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000153, train/loss_step=0.0445, global_step=3776.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  51%|█████     | 613/1208 [17:53<17:21,  1.75s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000153, train/loss_step=0.0445, global_step=3776.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  51%|█████     | 613/1208 [17:53<17:21,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000979, train/loss_step=0.235, global_step=3777.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  51%|█████     | 614/1208 [17:54<17:19,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000979, train/loss_step=0.235, global_step=3777.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  51%|█████     | 614/1208 [17:54<17:19,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.000223, train/loss_step=0.0665, global_step=3777.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  51%|█████     | 615/1208 [17:55<17:16,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.000223, train/loss_step=0.0665, global_step=3777.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  51%|█████     | 615/1208 [17:55<17:16,  1.75s/it, loss=0.0997, v_num=0, train/loss_simple_step=0.00723, train/loss_vlb_step=3.59e-5, train/loss_step=0.00723, global_step=3777.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  51%|█████     | 616/1208 [17:58<17:16,  1.75s/it, loss=0.0997, v_num=0, train/loss_simple_step=0.00723, train/loss_vlb_step=3.59e-5, train/loss_step=0.00723, global_step=3777.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  51%|█████     | 616/1208 [17:58<17:16,  1.75s/it, loss=0.0923, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=9.71e-5, train/loss_step=0.025, global_step=3777.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  51%|█████     | 617/1208 [17:59<17:14,  1.75s/it, loss=0.0923, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=9.71e-5, train/loss_step=0.025, global_step=3777.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  51%|█████     | 617/1208 [17:59<17:14,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.565, train/loss_vlb_step=0.00977, train/loss_step=0.565, global_step=3778.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  51%|█████     | 618/1208 [18:00<17:11,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.565, train/loss_vlb_step=0.00977, train/loss_step=0.565, global_step=3778.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  51%|█████     | 618/1208 [18:00<17:11,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00714, train/loss_vlb_step=3.53e-5, train/loss_step=0.00714, global_step=3778.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  51%|█████     | 619/1208 [18:01<17:09,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00714, train/loss_vlb_step=3.53e-5, train/loss_step=0.00714, global_step=3778.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  51%|█████     | 619/1208 [18:01<17:09,  1.75s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0621, train/loss_vlb_step=0.000215, train/loss_step=0.0621, global_step=3778.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  51%|█████▏    | 620/1208 [18:05<17:09,  1.75s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0621, train/loss_vlb_step=0.000215, train/loss_step=0.0621, global_step=3778.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  51%|█████▏    | 620/1208 [18:05<17:09,  1.75s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.00439, train/loss_vlb_step=2.3e-5, train/loss_step=0.00439, global_step=3778.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  51%|█████▏    | 621/1208 [18:06<17:06,  1.75s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.00439, train/loss_vlb_step=2.3e-5, train/loss_step=0.00439, global_step=3778.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  51%|█████▏    | 621/1208 [18:06<17:06,  1.75s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=1.93e-5, train/loss_step=0.00325, global_step=3779.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  51%|█████▏    | 622/1208 [18:07<17:04,  1.75s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=1.93e-5, train/loss_step=0.00325, global_step=3779.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  51%|█████▏    | 622/1208 [18:07<17:04,  1.75s/it, loss=0.0825, v_num=0, train/loss_simple_step=0.0507, train/loss_vlb_step=0.000179, train/loss_step=0.0507, global_step=3779.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  52%|█████▏    | 623/1208 [18:08<17:02,  1.75s/it, loss=0.0825, v_num=0, train/loss_simple_step=0.0507, train/loss_vlb_step=0.000179, train/loss_step=0.0507, global_step=3779.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  52%|█████▏    | 623/1208 [18:08<17:02,  1.75s/it, loss=0.0762, v_num=0, train/loss_simple_step=0.00514, train/loss_vlb_step=2.63e-5, train/loss_step=0.00514, global_step=3779.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  52%|█████▏    | 624/1208 [18:11<17:01,  1.75s/it, loss=0.0762, v_num=0, train/loss_simple_step=0.00514, train/loss_vlb_step=2.63e-5, train/loss_step=0.00514, global_step=3779.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  52%|█████▏    | 624/1208 [18:11<17:01,  1.75s/it, loss=0.0817, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000677, train/loss_step=0.188, global_step=3779.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  52%|█████▏    | 625/1208 [18:12<16:59,  1.75s/it, loss=0.0817, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000677, train/loss_step=0.188, global_step=3779.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  52%|█████▏    | 625/1208 [18:12<16:59,  1.75s/it, loss=0.0884, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000506, train/loss_step=0.153, global_step=3780.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  52%|█████▏    | 626/1208 [18:13<16:56,  1.75s/it, loss=0.0884, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000506, train/loss_step=0.153, global_step=3780.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  52%|█████▏    | 626/1208 [18:13<16:56,  1.75s/it, loss=0.088, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000116, train/loss_step=0.0297, global_step=3780.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  52%|█████▏    | 627/1208 [18:14<16:54,  1.75s/it, loss=0.088, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000116, train/loss_step=0.0297, global_step=3780.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  52%|█████▏    | 627/1208 [18:14<16:54,  1.75s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000905, train/loss_step=0.246, global_step=3780.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  52%|█████▏    | 628/1208 [18:18<16:54,  1.75s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000905, train/loss_step=0.246, global_step=3780.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  52%|█████▏    | 628/1208 [18:18<16:54,  1.75s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000512, train/loss_step=0.154, global_step=3780.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  52%|█████▏    | 629/1208 [18:19<16:51,  1.75s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000512, train/loss_step=0.154, global_step=3780.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  52%|█████▏    | 629/1208 [18:19<16:51,  1.75s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1.31e-5, train/loss_step=0.00226, global_step=3781.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  52%|█████▏    | 630/1208 [18:20<16:49,  1.75s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1.31e-5, train/loss_step=0.00226, global_step=3781.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  52%|█████▏    | 630/1208 [18:20<16:49,  1.75s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000138, train/loss_step=0.0365, global_step=3781.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  52%|█████▏    | 631/1208 [18:21<16:46,  1.75s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000138, train/loss_step=0.0365, global_step=3781.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  52%|█████▏    | 631/1208 [18:21<16:46,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00252, train/loss_step=0.372, global_step=3781.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  52%|█████▏    | 632/1208 [18:24<16:46,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00252, train/loss_step=0.372, global_step=3781.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  52%|█████▏    | 632/1208 [18:24<16:46,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.000138, train/loss_step=0.0352, global_step=3781.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  52%|█████▏    | 633/1208 [18:25<16:44,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.000138, train/loss_step=0.0352, global_step=3781.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  52%|█████▏    | 633/1208 [18:25<16:44,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.574, train/loss_vlb_step=0.0068, train/loss_step=0.574, global_step=3782.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  52%|█████▏    | 634/1208 [18:26<16:41,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.574, train/loss_vlb_step=0.0068, train/loss_step=0.574, global_step=3782.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  52%|█████▏    | 634/1208 [18:26<16:41,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0723, train/loss_vlb_step=0.000252, train/loss_step=0.0723, global_step=3782.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  53%|█████▎    | 635/1208 [18:27<16:39,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0723, train/loss_vlb_step=0.000252, train/loss_step=0.0723, global_step=3782.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  53%|█████▎    | 635/1208 [18:27<16:39,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.46e-5, train/loss_step=0.0147, global_step=3782.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  53%|█████▎    | 636/1208 [18:30<16:39,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.46e-5, train/loss_step=0.0147, global_step=3782.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  53%|█████▎    | 636/1208 [18:30<16:39,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.0002, train/loss_step=0.0555, global_step=3782.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  53%|█████▎    | 637/1208 [18:31<16:36,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.0002, train/loss_step=0.0555, global_step=3782.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  53%|█████▎    | 637/1208 [18:31<16:36,  1.75s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0633, train/loss_vlb_step=0.000215, train/loss_step=0.0633, global_step=3783.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  53%|█████▎    | 638/1208 [18:32<16:34,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0633, train/loss_vlb_step=0.000215, train/loss_step=0.0633, global_step=3783.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  53%|█████▎    | 638/1208 [18:33<16:34,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.0031, train/loss_step=0.425, global_step=3783.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  53%|█████▎    | 639/1208 [18:34<16:31,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.0031, train/loss_step=0.425, global_step=3783.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  53%|█████▎    | 639/1208 [18:34<16:31,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0091, train/loss_vlb_step=4.48e-5, train/loss_step=0.0091, global_step=3783.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  53%|█████▎    | 640/1208 [18:37<16:31,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0091, train/loss_vlb_step=4.48e-5, train/loss_step=0.0091, global_step=3783.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  53%|█████▎    | 640/1208 [18:37<16:31,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00104, train/loss_step=0.251, global_step=3783.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  53%|█████▎    | 641/1208 [18:38<16:29,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00104, train/loss_step=0.251, global_step=3783.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  53%|█████▎    | 641/1208 [18:38<16:29,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.056, train/loss_vlb_step=0.00019, train/loss_step=0.056, global_step=3784.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  53%|█████▎    | 642/1208 [18:39<16:26,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.056, train/loss_vlb_step=0.00019, train/loss_step=0.056, global_step=3784.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  53%|█████▎    | 642/1208 [18:39<16:26,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000133, train/loss_step=0.0339, global_step=3784.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  53%|█████▎    | 643/1208 [18:40<16:24,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000133, train/loss_step=0.0339, global_step=3784.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  53%|█████▎    | 643/1208 [18:40<16:24,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.12e-5, train/loss_step=0.0206, global_step=3784.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  53%|█████▎    | 644/1208 [18:43<16:24,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.12e-5, train/loss_step=0.0206, global_step=3784.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  53%|█████▎    | 644/1208 [18:43<16:24,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.0004, train/loss_step=0.122, global_step=3784.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  53%|█████▎    | 645/1208 [18:44<16:21,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.0004, train/loss_step=0.122, global_step=3784.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  53%|█████▎    | 645/1208 [18:44<16:21,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.04e-5, train/loss_step=0.00174, global_step=3785.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  53%|█████▎    | 646/1208 [18:45<16:19,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.04e-5, train/loss_step=0.00174, global_step=3785.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  53%|█████▎    | 646/1208 [18:45<16:19,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=3785.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  54%|█████▎    | 647/1208 [18:46<16:17,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=3785.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  54%|█████▎    | 647/1208 [18:46<16:17,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.0029, train/loss_step=0.394, global_step=3785.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  54%|█████▎    | 648/1208 [18:50<16:16,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.0029, train/loss_step=0.394, global_step=3785.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  54%|█████▎    | 648/1208 [18:50<16:16,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=7.84e-5, train/loss_step=0.0194, global_step=3785.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  54%|█████▎    | 649/1208 [18:51<16:14,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=7.84e-5, train/loss_step=0.0194, global_step=3785.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  54%|█████▎    | 649/1208 [18:51<16:14,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00624, train/loss_vlb_step=3.2e-5, train/loss_step=0.00624, global_step=3786.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  54%|█████▍    | 650/1208 [18:52<16:12,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00624, train/loss_vlb_step=3.2e-5, train/loss_step=0.00624, global_step=3786.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  54%|█████▍    | 650/1208 [18:52<16:12,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00103, train/loss_step=0.247, global_step=3786.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  54%|█████▍    | 651/1208 [18:53<16:09,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00103, train/loss_step=0.247, global_step=3786.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  54%|█████▍    | 651/1208 [18:53<16:09,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.64e-5, train/loss_step=0.0235, global_step=3786.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  54%|█████▍    | 652/1208 [18:56<16:09,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.64e-5, train/loss_step=0.0235, global_step=3786.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  54%|█████▍    | 652/1208 [18:56<16:09,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00158, train/loss_step=0.281, global_step=3786.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  54%|█████▍    | 653/1208 [18:57<16:06,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00158, train/loss_step=0.281, global_step=3786.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  54%|█████▍    | 653/1208 [18:57<16:06,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00553, train/loss_vlb_step=2.76e-5, train/loss_step=0.00553, global_step=3787.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  54%|█████▍    | 654/1208 [18:58<16:04,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00553, train/loss_vlb_step=2.76e-5, train/loss_step=0.00553, global_step=3787.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  54%|█████▍    | 654/1208 [18:58<16:04,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.43e-5, train/loss_step=0.0167, global_step=3787.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  54%|█████▍    | 655/1208 [18:59<16:02,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.43e-5, train/loss_step=0.0167, global_step=3787.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  54%|█████▍    | 655/1208 [18:59<16:02,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00154, train/loss_step=0.291, global_step=3787.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  54%|█████▍    | 656/1208 [19:03<16:01,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00154, train/loss_step=0.291, global_step=3787.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  54%|█████▍    | 656/1208 [19:03<16:01,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.481, train/loss_vlb_step=0.00387, train/loss_step=0.481, global_step=3787.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  54%|█████▍    | 657/1208 [19:04<15:59,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.481, train/loss_vlb_step=0.00387, train/loss_step=0.481, global_step=3787.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  54%|█████▍    | 657/1208 [19:04<15:59,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000188, train/loss_step=0.0524, global_step=3788.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  54%|█████▍    | 658/1208 [19:05<15:57,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000188, train/loss_step=0.0524, global_step=3788.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  54%|█████▍    | 658/1208 [19:05<15:57,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00559, train/loss_vlb_step=2.86e-5, train/loss_step=0.00559, global_step=3788.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  55%|█████▍    | 659/1208 [19:06<15:54,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00559, train/loss_vlb_step=2.86e-5, train/loss_step=0.00559, global_step=3788.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  55%|█████▍    | 659/1208 [19:06<15:54,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.00105, train/loss_step=0.221, global_step=3788.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  55%|█████▍    | 660/1208 [19:09<15:54,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.00105, train/loss_step=0.221, global_step=3788.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  55%|█████▍    | 660/1208 [19:09<15:54,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0383, train/loss_vlb_step=0.000141, train/loss_step=0.0383, global_step=3788.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  55%|█████▍    | 661/1208 [19:10<15:52,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0383, train/loss_vlb_step=0.000141, train/loss_step=0.0383, global_step=3788.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  55%|█████▍    | 661/1208 [19:10<15:52,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00367, train/loss_vlb_step=1.98e-5, train/loss_step=0.00367, global_step=3789.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  55%|█████▍    | 662/1208 [19:11<15:49,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00367, train/loss_vlb_step=1.98e-5, train/loss_step=0.00367, global_step=3789.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  55%|█████▍    | 662/1208 [19:11<15:49,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0991, train/loss_vlb_step=0.000326, train/loss_step=0.0991, global_step=3789.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  55%|█████▍    | 663/1208 [19:12<15:47,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0991, train/loss_vlb_step=0.000326, train/loss_step=0.0991, global_step=3789.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  55%|█████▍    | 663/1208 [19:12<15:47,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.02e-5, train/loss_step=0.0197, global_step=3789.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  55%|█████▍    | 664/1208 [19:16<15:47,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.02e-5, train/loss_step=0.0197, global_step=3789.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  55%|█████▍    | 664/1208 [19:16<15:47,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.56e-5, train/loss_step=0.00266, global_step=3789.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  55%|█████▌    | 665/1208 [19:17<15:44,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.56e-5, train/loss_step=0.00266, global_step=3789.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  55%|█████▌    | 665/1208 [19:17<15:44,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=3790.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  55%|█████▌    | 666/1208 [19:18<15:42,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=3790.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  55%|█████▌    | 666/1208 [19:18<15:42,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000382, train/loss_step=0.115, global_step=3790.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  55%|█████▌    | 667/1208 [19:19<15:40,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000382, train/loss_step=0.115, global_step=3790.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  55%|█████▌    | 667/1208 [19:19<15:40,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.28e-5, train/loss_step=0.0022, global_step=3790.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  55%|█████▌    | 668/1208 [19:22<15:39,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.28e-5, train/loss_step=0.0022, global_step=3790.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  55%|█████▌    | 668/1208 [19:22<15:39,  1.74s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=1.53e-5, train/loss_step=0.00256, global_step=3790.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  55%|█████▌    | 669/1208 [19:23<15:37,  1.74s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=1.53e-5, train/loss_step=0.00256, global_step=3790.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  55%|█████▌    | 669/1208 [19:23<15:37,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0897, train/loss_vlb_step=0.000296, train/loss_step=0.0897, global_step=3791.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  55%|█████▌    | 670/1208 [19:24<15:35,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0897, train/loss_vlb_step=0.000296, train/loss_step=0.0897, global_step=3791.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  55%|█████▌    | 670/1208 [19:24<15:35,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.565, train/loss_vlb_step=0.0103, train/loss_step=0.565, global_step=3791.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  56%|█████▌    | 671/1208 [19:25<15:32,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.565, train/loss_vlb_step=0.0103, train/loss_step=0.565, global_step=3791.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  56%|█████▌    | 671/1208 [19:25<15:32,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00315, train/loss_step=0.407, global_step=3791.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  56%|█████▌    | 672/1208 [19:28<15:32,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00315, train/loss_step=0.407, global_step=3791.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  56%|█████▌    | 672/1208 [19:28<15:32,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000289, train/loss_step=0.087, global_step=3791.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  56%|█████▌    | 673/1208 [19:29<15:30,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000289, train/loss_step=0.087, global_step=3791.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  56%|█████▌    | 673/1208 [19:29<15:30,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.000152, train/loss_step=0.0418, global_step=3792.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  56%|█████▌    | 674/1208 [19:30<15:27,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.000152, train/loss_step=0.0418, global_step=3792.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  56%|█████▌    | 674/1208 [19:30<15:27,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.000176, train/loss_step=0.048, global_step=3792.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  56%|█████▌    | 675/1208 [19:32<15:25,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.000176, train/loss_step=0.048, global_step=3792.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  56%|█████▌    | 675/1208 [19:32<15:25,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0294, train/loss_vlb_step=0.000114, train/loss_step=0.0294, global_step=3792.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  56%|█████▌    | 676/1208 [19:35<15:24,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0294, train/loss_vlb_step=0.000114, train/loss_step=0.0294, global_step=3792.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  56%|█████▌    | 676/1208 [19:35<15:24,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00141, train/loss_step=0.289, global_step=3792.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  56%|█████▌    | 677/1208 [19:36<15:22,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00141, train/loss_step=0.289, global_step=3792.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  56%|█████▌    | 677/1208 [19:36<15:22,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00139, train/loss_step=0.281, global_step=3793.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  56%|█████▌    | 678/1208 [19:37<15:20,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00139, train/loss_step=0.281, global_step=3793.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  56%|█████▌    | 678/1208 [19:37<15:20,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00797, train/loss_vlb_step=3.9e-5, train/loss_step=0.00797, global_step=3793.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  56%|█████▌    | 679/1208 [19:38<15:18,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00797, train/loss_vlb_step=3.9e-5, train/loss_step=0.00797, global_step=3793.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  56%|█████▌    | 679/1208 [19:38<15:18,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00306, train/loss_vlb_step=1.71e-5, train/loss_step=0.00306, global_step=3793.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  56%|█████▋    | 680/1208 [19:41<15:17,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00306, train/loss_vlb_step=1.71e-5, train/loss_step=0.00306, global_step=3793.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  56%|█████▋    | 680/1208 [19:41<15:17,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000492, train/loss_step=0.149, global_step=3793.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  56%|█████▋    | 681/1208 [19:42<15:15,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000492, train/loss_step=0.149, global_step=3793.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  56%|█████▋    | 681/1208 [19:42<15:15,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0787, train/loss_vlb_step=0.000261, train/loss_step=0.0787, global_step=3794.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  56%|█████▋    | 682/1208 [19:43<15:13,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0787, train/loss_vlb_step=0.000261, train/loss_step=0.0787, global_step=3794.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  56%|█████▋    | 682/1208 [19:43<15:13,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000507, train/loss_step=0.147, global_step=3794.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  57%|█████▋    | 683/1208 [19:44<15:10,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000507, train/loss_step=0.147, global_step=3794.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  57%|█████▋    | 683/1208 [19:44<15:10,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.52e-5, train/loss_step=0.0203, global_step=3794.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  57%|█████▋    | 684/1208 [19:48<15:10,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.52e-5, train/loss_step=0.0203, global_step=3794.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  57%|█████▋    | 684/1208 [19:48<15:10,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000115, train/loss_step=0.0284, global_step=3794.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  57%|█████▋    | 685/1208 [19:49<15:08,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000115, train/loss_step=0.0284, global_step=3794.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  57%|█████▋    | 685/1208 [19:49<15:08,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.00017, train/loss_step=0.0468, global_step=3795.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  57%|█████▋    | 686/1208 [19:50<15:05,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.00017, train/loss_step=0.0468, global_step=3795.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  57%|█████▋    | 686/1208 [19:50<15:05,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.709, train/loss_vlb_step=0.0198, train/loss_step=0.709, global_step=3795.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  57%|█████▋    | 687/1208 [19:51<15:03,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.709, train/loss_vlb_step=0.0198, train/loss_step=0.709, global_step=3795.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  57%|█████▋    | 687/1208 [19:51<15:03,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000994, train/loss_step=0.246, global_step=3795.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  57%|█████▋    | 688/1208 [19:54<15:02,  1.74s/it, loss=0.164, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000994, train/loss_step=0.246, global_step=3795.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  57%|█████▋    | 688/1208 [19:54<15:02,  1.74s/it, loss=0.172, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000574, train/loss_step=0.166, global_step=3795.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  57%|█████▋    | 689/1208 [19:55<15:00,  1.74s/it, loss=0.172, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000574, train/loss_step=0.166, global_step=3795.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  57%|█████▋    | 689/1208 [19:55<15:00,  1.74s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.03e-5, train/loss_step=0.0163, global_step=3796.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  57%|█████▋    | 690/1208 [19:56<14:58,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.03e-5, train/loss_step=0.0163, global_step=3796.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  57%|█████▋    | 690/1208 [19:56<14:58,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.94e-5, train/loss_step=0.0186, global_step=3796.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  57%|█████▋    | 691/1208 [19:57<14:56,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.94e-5, train/loss_step=0.0186, global_step=3796.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  57%|█████▋    | 691/1208 [19:57<14:56,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0723, train/loss_vlb_step=0.000243, train/loss_step=0.0723, global_step=3796.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  57%|█████▋    | 692/1208 [20:01<14:55,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0723, train/loss_vlb_step=0.000243, train/loss_step=0.0723, global_step=3796.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  57%|█████▋    | 692/1208 [20:01<14:55,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00636, train/loss_vlb_step=3.42e-5, train/loss_step=0.00636, global_step=3796.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  57%|█████▋    | 693/1208 [20:02<14:53,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00636, train/loss_vlb_step=3.42e-5, train/loss_step=0.00636, global_step=3796.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  57%|█████▋    | 693/1208 [20:02<14:53,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.0011, train/loss_step=0.263, global_step=3797.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  57%|█████▋    | 694/1208 [20:03<14:51,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.0011, train/loss_step=0.263, global_step=3797.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  57%|█████▋    | 694/1208 [20:03<14:51,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000407, train/loss_step=0.124, global_step=3797.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  58%|█████▊    | 695/1208 [20:04<14:48,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000407, train/loss_step=0.124, global_step=3797.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  58%|█████▊    | 695/1208 [20:04<14:48,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000754, train/loss_step=0.206, global_step=3797.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  58%|█████▊    | 696/1208 [20:07<14:48,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000754, train/loss_step=0.206, global_step=3797.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  58%|█████▊    | 696/1208 [20:07<14:48,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00675, train/loss_vlb_step=3.36e-5, train/loss_step=0.00675, global_step=3797.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  58%|█████▊    | 697/1208 [20:08<14:45,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00675, train/loss_vlb_step=3.36e-5, train/loss_step=0.00675, global_step=3797.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  58%|█████▊    | 697/1208 [20:08<14:45,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.63e-5, train/loss_step=0.0188, global_step=3798.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  58%|█████▊    | 698/1208 [20:09<14:43,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.63e-5, train/loss_step=0.0188, global_step=3798.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  58%|█████▊    | 698/1208 [20:09<14:43,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00474, train/loss_vlb_step=2.54e-5, train/loss_step=0.00474, global_step=3798.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  58%|█████▊    | 699/1208 [20:10<14:41,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00474, train/loss_vlb_step=2.54e-5, train/loss_step=0.00474, global_step=3798.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  58%|█████▊    | 699/1208 [20:10<14:41,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.537, train/loss_vlb_step=0.0126, train/loss_step=0.537, global_step=3798.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]     Epoch 12:  58%|█████▊    | 700/1208 [20:13<14:40,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.537, train/loss_vlb_step=0.0126, train/loss_step=0.537, global_step=3798.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  58%|█████▊    | 700/1208 [20:13<14:40,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000849, train/loss_step=0.212, global_step=3798.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  58%|█████▊    | 701/1208 [20:14<14:38,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000849, train/loss_step=0.212, global_step=3798.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  58%|█████▊    | 701/1208 [20:14<14:38,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000652, train/loss_step=0.177, global_step=3799.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  58%|█████▊    | 702/1208 [20:15<14:36,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000652, train/loss_step=0.177, global_step=3799.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  58%|█████▊    | 702/1208 [20:15<14:36,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=2.29e-5, train/loss_step=0.00416, global_step=3799.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  58%|█████▊    | 703/1208 [20:16<14:34,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=2.29e-5, train/loss_step=0.00416, global_step=3799.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  58%|█████▊    | 703/1208 [20:16<14:34,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.73e-5, train/loss_step=0.0104, global_step=3799.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  58%|█████▊    | 704/1208 [20:20<14:33,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.73e-5, train/loss_step=0.0104, global_step=3799.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  58%|█████▊    | 704/1208 [20:20<14:33,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.614, train/loss_vlb_step=0.029, train/loss_step=0.614, global_step=3799.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  58%|█████▊    | 705/1208 [20:21<14:31,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.614, train/loss_vlb_step=0.029, train/loss_step=0.614, global_step=3799.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  58%|█████▊    | 705/1208 [20:21<14:31,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=9.22e-5, train/loss_step=0.0219, global_step=3800.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  58%|█████▊    | 706/1208 [20:22<14:29,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=9.22e-5, train/loss_step=0.0219, global_step=3800.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  58%|█████▊    | 706/1208 [20:22<14:29,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00181, train/loss_step=0.325, global_step=3800.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  59%|█████▊    | 707/1208 [20:23<14:26,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00181, train/loss_step=0.325, global_step=3800.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  59%|█████▊    | 707/1208 [20:23<14:26,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.67e-5, train/loss_step=0.019, global_step=3800.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  59%|█████▊    | 708/1208 [20:26<14:26,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.67e-5, train/loss_step=0.019, global_step=3800.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  59%|█████▊    | 708/1208 [20:26<14:26,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.82e-5, train/loss_step=0.0104, global_step=3800.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  59%|█████▊    | 709/1208 [20:27<14:24,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.82e-5, train/loss_step=0.0104, global_step=3800.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  59%|█████▊    | 709/1208 [20:27<14:24,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000495, train/loss_step=0.150, global_step=3801.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  59%|█████▉    | 710/1208 [20:28<14:21,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000495, train/loss_step=0.150, global_step=3801.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  59%|█████▉    | 710/1208 [20:28<14:21,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00692, train/loss_vlb_step=3.46e-5, train/loss_step=0.00692, global_step=3801.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  59%|█████▉    | 711/1208 [20:29<14:19,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00692, train/loss_vlb_step=3.46e-5, train/loss_step=0.00692, global_step=3801.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  59%|█████▉    | 711/1208 [20:29<14:19,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0922, train/loss_vlb_step=0.000307, train/loss_step=0.0922, global_step=3801.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  59%|█████▉    | 712/1208 [20:32<14:18,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0922, train/loss_vlb_step=0.000307, train/loss_step=0.0922, global_step=3801.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  59%|█████▉    | 712/1208 [20:32<14:18,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00722, train/loss_vlb_step=3.25e-5, train/loss_step=0.00722, global_step=3801.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  59%|█████▉    | 713/1208 [20:34<14:16,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00722, train/loss_vlb_step=3.25e-5, train/loss_step=0.00722, global_step=3801.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  59%|█████▉    | 713/1208 [20:34<14:16,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.633, train/loss_vlb_step=0.0186, train/loss_step=0.633, global_step=3802.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  59%|█████▉    | 714/1208 [20:35<14:14,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.633, train/loss_vlb_step=0.0186, train/loss_step=0.633, global_step=3802.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  59%|█████▉    | 714/1208 [20:35<14:14,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0645, train/loss_vlb_step=0.00022, train/loss_step=0.0645, global_step=3802.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  59%|█████▉    | 715/1208 [20:36<14:12,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0645, train/loss_vlb_step=0.00022, train/loss_step=0.0645, global_step=3802.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  59%|█████▉    | 715/1208 [20:36<14:12,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000475, train/loss_step=0.144, global_step=3802.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  59%|█████▉    | 716/1208 [20:39<14:11,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000475, train/loss_step=0.144, global_step=3802.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  59%|█████▉    | 716/1208 [20:39<14:11,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.3e-5, train/loss_step=0.0231, global_step=3802.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  59%|█████▉    | 717/1208 [20:40<14:09,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.3e-5, train/loss_step=0.0231, global_step=3802.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  59%|█████▉    | 717/1208 [20:40<14:09,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.071, train/loss_vlb_step=0.000238, train/loss_step=0.071, global_step=3803.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  59%|█████▉    | 718/1208 [20:41<14:07,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.071, train/loss_vlb_step=0.000238, train/loss_step=0.071, global_step=3803.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  59%|█████▉    | 718/1208 [20:41<14:07,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00215, train/loss_step=0.366, global_step=3803.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  60%|█████▉    | 719/1208 [20:42<14:05,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00215, train/loss_step=0.366, global_step=3803.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  60%|█████▉    | 719/1208 [20:42<14:05,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00182, train/loss_step=0.317, global_step=3803.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  60%|█████▉    | 720/1208 [20:45<14:04,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00182, train/loss_step=0.317, global_step=3803.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  60%|█████▉    | 720/1208 [20:45<14:04,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00221, train/loss_step=0.377, global_step=3803.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  60%|█████▉    | 721/1208 [20:46<14:02,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00221, train/loss_step=0.377, global_step=3803.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  60%|█████▉    | 721/1208 [20:46<14:02,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0798, train/loss_vlb_step=0.000266, train/loss_step=0.0798, global_step=3804.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  60%|█████▉    | 722/1208 [20:47<13:59,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0798, train/loss_vlb_step=0.000266, train/loss_step=0.0798, global_step=3804.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  60%|█████▉    | 722/1208 [20:47<13:59,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00125, train/loss_step=0.297, global_step=3804.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  60%|█████▉    | 723/1208 [20:48<13:57,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00125, train/loss_step=0.297, global_step=3804.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  60%|█████▉    | 723/1208 [20:48<13:57,  1.73s/it, loss=0.19, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000685, train/loss_step=0.191, global_step=3804.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  60%|█████▉    | 724/1208 [20:52<13:57,  1.73s/it, loss=0.19, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000685, train/loss_step=0.191, global_step=3804.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  60%|█████▉    | 724/1208 [20:52<13:57,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.438, train/loss_vlb_step=0.0043, train/loss_step=0.438, global_step=3804.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  60%|██████    | 725/1208 [20:53<13:54,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.438, train/loss_vlb_step=0.0043, train/loss_step=0.438, global_step=3804.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  60%|██████    | 725/1208 [20:53<13:54,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.52e-5, train/loss_step=0.0233, global_step=3805.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  60%|██████    | 726/1208 [20:54<13:52,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.52e-5, train/loss_step=0.0233, global_step=3805.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  60%|██████    | 726/1208 [20:54<13:52,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=1.51e-5, train/loss_step=0.00258, global_step=3805.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  60%|██████    | 727/1208 [20:55<13:50,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=1.51e-5, train/loss_step=0.00258, global_step=3805.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  60%|██████    | 727/1208 [20:55<13:50,  1.73s/it, loss=0.185, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00271, train/loss_step=0.402, global_step=3805.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  60%|██████    | 728/1208 [20:58<13:49,  1.73s/it, loss=0.185, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00271, train/loss_step=0.402, global_step=3805.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  60%|██████    | 728/1208 [20:58<13:49,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00487, train/loss_vlb_step=2.61e-5, train/loss_step=0.00487, global_step=3805.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  60%|██████    | 729/1208 [20:59<13:47,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00487, train/loss_vlb_step=2.61e-5, train/loss_step=0.00487, global_step=3805.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  60%|██████    | 729/1208 [20:59<13:47,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000416, train/loss_step=0.124, global_step=3806.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  60%|██████    | 730/1208 [21:00<13:45,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000416, train/loss_step=0.124, global_step=3806.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  60%|██████    | 730/1208 [21:00<13:45,  1.73s/it, loss=0.199, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.0013, train/loss_step=0.316, global_step=3806.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  61%|██████    | 731/1208 [21:01<13:43,  1.73s/it, loss=0.199, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.0013, train/loss_step=0.316, global_step=3806.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  61%|██████    | 731/1208 [21:01<13:43,  1.73s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.67e-5, train/loss_step=0.0127, global_step=3806.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  61%|██████    | 732/1208 [21:05<13:42,  1.73s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.67e-5, train/loss_step=0.0127, global_step=3806.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  61%|██████    | 732/1208 [21:05<13:42,  1.73s/it, loss=0.194, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.55e-5, train/loss_step=0.00288, global_step=3806.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  61%|██████    | 733/1208 [21:06<13:40,  1.73s/it, loss=0.194, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.55e-5, train/loss_step=0.00288, global_step=3806.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  61%|██████    | 733/1208 [21:06<13:40,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0465, train/loss_vlb_step=0.000167, train/loss_step=0.0465, global_step=3807.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  61%|██████    | 734/1208 [21:07<13:38,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0465, train/loss_vlb_step=0.000167, train/loss_step=0.0465, global_step=3807.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  61%|██████    | 734/1208 [21:07<13:38,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000551, train/loss_step=0.165, global_step=3807.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  61%|██████    | 735/1208 [21:08<13:36,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000551, train/loss_step=0.165, global_step=3807.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  61%|██████    | 735/1208 [21:08<13:36,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.000189, train/loss_step=0.0556, global_step=3807.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  61%|██████    | 736/1208 [21:11<13:35,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.000189, train/loss_step=0.0556, global_step=3807.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  61%|██████    | 736/1208 [21:11<13:35,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0495, train/loss_vlb_step=0.000173, train/loss_step=0.0495, global_step=3807.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  61%|██████    | 737/1208 [21:12<13:33,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0495, train/loss_vlb_step=0.000173, train/loss_step=0.0495, global_step=3807.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  61%|██████    | 737/1208 [21:12<13:33,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.000134, train/loss_step=0.0351, global_step=3808.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  61%|██████    | 738/1208 [21:13<13:31,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.000134, train/loss_step=0.0351, global_step=3808.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  61%|██████    | 738/1208 [21:13<13:31,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00918, train/loss_vlb_step=4.53e-5, train/loss_step=0.00918, global_step=3808.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  61%|██████    | 739/1208 [21:14<13:28,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00918, train/loss_vlb_step=4.53e-5, train/loss_step=0.00918, global_step=3808.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  61%|██████    | 739/1208 [21:14<13:28,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.46e-5, train/loss_step=0.00247, global_step=3808.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  61%|██████▏   | 740/1208 [21:17<13:28,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.46e-5, train/loss_step=0.00247, global_step=3808.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  61%|██████▏   | 740/1208 [21:17<13:28,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0762, train/loss_vlb_step=0.000255, train/loss_step=0.0762, global_step=3808.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  61%|██████▏   | 741/1208 [21:18<13:25,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0762, train/loss_vlb_step=0.000255, train/loss_step=0.0762, global_step=3808.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  61%|██████▏   | 741/1208 [21:18<13:25,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=3809.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  61%|██████▏   | 742/1208 [21:19<13:23,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=3809.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  61%|██████▏   | 742/1208 [21:19<13:23,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000805, train/loss_step=0.220, global_step=3809.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  62%|██████▏   | 743/1208 [21:20<13:21,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000805, train/loss_step=0.220, global_step=3809.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  62%|██████▏   | 743/1208 [21:20<13:21,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00133, train/loss_step=0.318, global_step=3809.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  62%|██████▏   | 744/1208 [21:24<13:20,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00133, train/loss_step=0.318, global_step=3809.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  62%|██████▏   | 744/1208 [21:24<13:20,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00255, train/loss_step=0.371, global_step=3809.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  62%|██████▏   | 745/1208 [21:25<13:18,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00255, train/loss_step=0.371, global_step=3809.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  62%|██████▏   | 745/1208 [21:25<13:18,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00119, train/loss_step=0.292, global_step=3810.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  62%|██████▏   | 746/1208 [21:26<13:16,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00119, train/loss_step=0.292, global_step=3810.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  62%|██████▏   | 746/1208 [21:26<13:16,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.0001, train/loss_step=0.0249, global_step=3810.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  62%|██████▏   | 747/1208 [21:27<13:14,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.0001, train/loss_step=0.0249, global_step=3810.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  62%|██████▏   | 747/1208 [21:27<13:14,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.0012, train/loss_step=0.323, global_step=3810.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  62%|██████▏   | 748/1208 [21:30<13:13,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.0012, train/loss_step=0.323, global_step=3810.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  62%|██████▏   | 748/1208 [21:30<13:13,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000548, train/loss_step=0.162, global_step=3810.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  62%|██████▏   | 749/1208 [21:31<13:11,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000548, train/loss_step=0.162, global_step=3810.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  62%|██████▏   | 749/1208 [21:31<13:11,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=8.77e-5, train/loss_step=0.0221, global_step=3811.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  62%|██████▏   | 750/1208 [21:32<13:09,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=8.77e-5, train/loss_step=0.0221, global_step=3811.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  62%|██████▏   | 750/1208 [21:32<13:09,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0431, train/loss_vlb_step=0.000156, train/loss_step=0.0431, global_step=3811.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  62%|██████▏   | 751/1208 [21:33<13:07,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0431, train/loss_vlb_step=0.000156, train/loss_step=0.0431, global_step=3811.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  62%|██████▏   | 751/1208 [21:33<13:07,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0743, train/loss_vlb_step=0.000249, train/loss_step=0.0743, global_step=3811.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  62%|██████▏   | 752/1208 [21:37<13:06,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0743, train/loss_vlb_step=0.000249, train/loss_step=0.0743, global_step=3811.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  62%|██████▏   | 752/1208 [21:37<13:06,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000678, train/loss_step=0.193, global_step=3811.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  62%|██████▏   | 753/1208 [21:38<13:04,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000678, train/loss_step=0.193, global_step=3811.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  62%|██████▏   | 753/1208 [21:38<13:04,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0377, train/loss_vlb_step=0.000142, train/loss_step=0.0377, global_step=3812.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  62%|██████▏   | 754/1208 [21:39<13:02,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0377, train/loss_vlb_step=0.000142, train/loss_step=0.0377, global_step=3812.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  62%|██████▏   | 754/1208 [21:39<13:02,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00354, train/loss_step=0.404, global_step=3812.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  62%|██████▎   | 755/1208 [21:40<13:00,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00354, train/loss_step=0.404, global_step=3812.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  62%|██████▎   | 755/1208 [21:40<13:00,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0715, train/loss_vlb_step=0.000244, train/loss_step=0.0715, global_step=3812.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  63%|██████▎   | 756/1208 [21:43<12:59,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0715, train/loss_vlb_step=0.000244, train/loss_step=0.0715, global_step=3812.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  63%|██████▎   | 756/1208 [21:43<12:59,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.41e-5, train/loss_step=0.00247, global_step=3812.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  63%|██████▎   | 757/1208 [21:44<12:57,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.41e-5, train/loss_step=0.00247, global_step=3812.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  63%|██████▎   | 757/1208 [21:44<12:57,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00147, train/loss_step=0.292, global_step=3813.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  63%|██████▎   | 758/1208 [21:45<12:55,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00147, train/loss_step=0.292, global_step=3813.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  63%|██████▎   | 758/1208 [21:45<12:55,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.056, train/loss_vlb_step=0.000195, train/loss_step=0.056, global_step=3813.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  63%|██████▎   | 759/1208 [21:46<12:52,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.056, train/loss_vlb_step=0.000195, train/loss_step=0.056, global_step=3813.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  63%|██████▎   | 759/1208 [21:46<12:52,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.052, train/loss_vlb_step=0.000182, train/loss_step=0.052, global_step=3813.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  63%|██████▎   | 760/1208 [21:49<12:52,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.052, train/loss_vlb_step=0.000182, train/loss_step=0.052, global_step=3813.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  63%|██████▎   | 760/1208 [21:49<12:52,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00162, train/loss_step=0.309, global_step=3813.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  63%|██████▎   | 761/1208 [21:50<12:50,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00162, train/loss_step=0.309, global_step=3813.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  63%|██████▎   | 761/1208 [21:50<12:50,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.066, train/loss_vlb_step=0.000234, train/loss_step=0.066, global_step=3814.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  63%|██████▎   | 762/1208 [21:52<12:47,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.066, train/loss_vlb_step=0.000234, train/loss_step=0.066, global_step=3814.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  63%|██████▎   | 762/1208 [21:52<12:47,  1.72s/it, loss=0.186, v_num=0, train/loss_simple_step=0.612, train/loss_vlb_step=0.0265, train/loss_step=0.612, global_step=3814.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  63%|██████▎   | 763/1208 [21:53<12:45,  1.72s/it, loss=0.186, v_num=0, train/loss_simple_step=0.612, train/loss_vlb_step=0.0265, train/loss_step=0.612, global_step=3814.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  63%|██████▎   | 763/1208 [21:53<12:45,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.77e-5, train/loss_step=0.019, global_step=3814.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  63%|██████▎   | 764/1208 [21:56<12:44,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.77e-5, train/loss_step=0.019, global_step=3814.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  63%|██████▎   | 764/1208 [21:56<12:44,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=1.28e-5, train/loss_step=0.00221, global_step=3814.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  63%|██████▎   | 765/1208 [21:57<12:42,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=1.28e-5, train/loss_step=0.00221, global_step=3814.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  63%|██████▎   | 765/1208 [21:57<12:42,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00183, train/loss_step=0.317, global_step=3815.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  63%|██████▎   | 766/1208 [21:58<12:40,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00183, train/loss_step=0.317, global_step=3815.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  63%|██████▎   | 766/1208 [21:58<12:40,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.036, train/loss_vlb_step=0.000139, train/loss_step=0.036, global_step=3815.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  63%|██████▎   | 767/1208 [21:59<12:38,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.036, train/loss_vlb_step=0.000139, train/loss_step=0.036, global_step=3815.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  63%|██████▎   | 767/1208 [21:59<12:38,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.00081, train/loss_step=0.197, global_step=3815.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  64%|██████▎   | 768/1208 [22:02<12:37,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.00081, train/loss_step=0.197, global_step=3815.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  64%|██████▎   | 768/1208 [22:02<12:37,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.00058, train/loss_step=0.165, global_step=3815.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  64%|██████▎   | 769/1208 [22:03<12:35,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.00058, train/loss_step=0.165, global_step=3815.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  64%|██████▎   | 769/1208 [22:03<12:35,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.009, train/loss_vlb_step=4.24e-5, train/loss_step=0.009, global_step=3816.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  64%|██████▎   | 770/1208 [22:04<12:33,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.009, train/loss_vlb_step=4.24e-5, train/loss_step=0.009, global_step=3816.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  64%|██████▎   | 770/1208 [22:04<12:33,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000172, train/loss_step=0.050, global_step=3816.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  64%|██████▍   | 771/1208 [22:05<12:31,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000172, train/loss_step=0.050, global_step=3816.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  64%|██████▍   | 771/1208 [22:05<12:31,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000631, train/loss_step=0.185, global_step=3816.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  64%|██████▍   | 772/1208 [22:09<12:30,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000631, train/loss_step=0.185, global_step=3816.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  64%|██████▍   | 772/1208 [22:09<12:30,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0667, train/loss_vlb_step=0.000227, train/loss_step=0.0667, global_step=3816.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  64%|██████▍   | 773/1208 [22:10<12:28,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0667, train/loss_vlb_step=0.000227, train/loss_step=0.0667, global_step=3816.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  64%|██████▍   | 773/1208 [22:10<12:28,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=8.92e-5, train/loss_step=0.022, global_step=3817.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  64%|██████▍   | 774/1208 [22:11<12:26,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=8.92e-5, train/loss_step=0.022, global_step=3817.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  64%|██████▍   | 774/1208 [22:11<12:26,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.00011, train/loss_step=0.0278, global_step=3817.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  64%|██████▍   | 775/1208 [22:12<12:24,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.00011, train/loss_step=0.0278, global_step=3817.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  64%|██████▍   | 775/1208 [22:12<12:24,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=7.85e-5, train/loss_step=0.0189, global_step=3817.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  64%|██████▍   | 776/1208 [22:15<12:23,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=7.85e-5, train/loss_step=0.0189, global_step=3817.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  64%|██████▍   | 776/1208 [22:15<12:23,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=1.44e-5, train/loss_step=0.0025, global_step=3817.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  64%|██████▍   | 777/1208 [22:16<12:21,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=1.44e-5, train/loss_step=0.0025, global_step=3817.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  64%|██████▍   | 777/1208 [22:16<12:21,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.0015, train/loss_step=0.322, global_step=3818.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  64%|██████▍   | 778/1208 [22:17<12:19,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.0015, train/loss_step=0.322, global_step=3818.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  64%|██████▍   | 778/1208 [22:17<12:19,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0987, train/loss_vlb_step=0.000325, train/loss_step=0.0987, global_step=3818.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  64%|██████▍   | 779/1208 [22:18<12:17,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0987, train/loss_vlb_step=0.000325, train/loss_step=0.0987, global_step=3818.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  64%|██████▍   | 779/1208 [22:18<12:17,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00318, train/loss_vlb_step=1.79e-5, train/loss_step=0.00318, global_step=3818.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  65%|██████▍   | 780/1208 [22:21<12:16,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00318, train/loss_vlb_step=1.79e-5, train/loss_step=0.00318, global_step=3818.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  65%|██████▍   | 780/1208 [22:21<12:16,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000458, train/loss_step=0.138, global_step=3818.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  65%|██████▍   | 781/1208 [22:23<12:14,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000458, train/loss_step=0.138, global_step=3818.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  65%|██████▍   | 781/1208 [22:23<12:14,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=3819.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  65%|██████▍   | 782/1208 [22:24<12:12,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=3819.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  65%|██████▍   | 782/1208 [22:24<12:12,  1.72s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.0712, train/loss_vlb_step=0.000243, train/loss_step=0.0712, global_step=3819.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  65%|██████▍   | 783/1208 [22:25<12:10,  1.72s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.0712, train/loss_vlb_step=0.000243, train/loss_step=0.0712, global_step=3819.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  65%|██████▍   | 783/1208 [22:25<12:10,  1.72s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.00287, train/loss_vlb_step=1.62e-5, train/loss_step=0.00287, global_step=3819.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  65%|██████▍   | 784/1208 [22:28<12:09,  1.72s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.00287, train/loss_vlb_step=1.62e-5, train/loss_step=0.00287, global_step=3819.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  65%|██████▍   | 784/1208 [22:28<12:09,  1.72s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.4e-5, train/loss_step=0.0238, global_step=3819.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  65%|██████▍   | 785/1208 [22:29<12:07,  1.72s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.4e-5, train/loss_step=0.0238, global_step=3819.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  65%|██████▍   | 785/1208 [22:29<12:07,  1.72s/it, loss=0.0788, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=7.46e-5, train/loss_step=0.0189, global_step=3820.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  65%|██████▌   | 786/1208 [22:30<12:05,  1.72s/it, loss=0.0788, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=7.46e-5, train/loss_step=0.0189, global_step=3820.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  65%|██████▌   | 786/1208 [22:30<12:05,  1.72s/it, loss=0.0866, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000663, train/loss_step=0.192, global_step=3820.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  65%|██████▌   | 787/1208 [22:31<12:02,  1.72s/it, loss=0.0866, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000663, train/loss_step=0.192, global_step=3820.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  65%|██████▌   | 787/1208 [22:31<12:02,  1.72s/it, loss=0.0769, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.19e-5, train/loss_step=0.00205, global_step=3820.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  65%|██████▌   | 788/1208 [22:34<12:02,  1.72s/it, loss=0.0769, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.19e-5, train/loss_step=0.00205, global_step=3820.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  65%|██████▌   | 788/1208 [22:34<12:02,  1.72s/it, loss=0.0923, v_num=0, train/loss_simple_step=0.474, train/loss_vlb_step=0.00466, train/loss_step=0.474, global_step=3820.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  65%|██████▌   | 789/1208 [22:35<12:00,  1.72s/it, loss=0.0923, v_num=0, train/loss_simple_step=0.474, train/loss_vlb_step=0.00466, train/loss_step=0.474, global_step=3820.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  65%|██████▌   | 789/1208 [22:35<12:00,  1.72s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.14e-5, train/loss_step=0.0114, global_step=3821.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  65%|██████▌   | 790/1208 [22:36<11:57,  1.72s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.14e-5, train/loss_step=0.0114, global_step=3821.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  65%|██████▌   | 790/1208 [22:36<11:57,  1.72s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000481, train/loss_step=0.145, global_step=3821.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  65%|██████▌   | 791/1208 [22:37<11:55,  1.72s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000481, train/loss_step=0.145, global_step=3821.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  65%|██████▌   | 791/1208 [22:37<11:55,  1.72s/it, loss=0.093, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000333, train/loss_step=0.100, global_step=3821.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  66%|██████▌   | 792/1208 [22:41<11:54,  1.72s/it, loss=0.093, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000333, train/loss_step=0.100, global_step=3821.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  66%|██████▌   | 792/1208 [22:41<11:54,  1.72s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.00037, train/loss_step=0.113, global_step=3821.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  66%|██████▌   | 793/1208 [22:42<11:52,  1.72s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.00037, train/loss_step=0.113, global_step=3821.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  66%|██████▌   | 793/1208 [22:42<11:52,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000757, train/loss_step=0.210, global_step=3822.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  66%|██████▌   | 794/1208 [22:43<11:50,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000757, train/loss_step=0.210, global_step=3822.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  66%|██████▌   | 794/1208 [22:43<11:50,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.91e-5, train/loss_step=0.0183, global_step=3822.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  66%|██████▌   | 795/1208 [22:44<11:48,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.91e-5, train/loss_step=0.0183, global_step=3822.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  66%|██████▌   | 795/1208 [22:44<11:48,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.000187, train/loss_step=0.0537, global_step=3822.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  66%|██████▌   | 796/1208 [22:47<11:47,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.000187, train/loss_step=0.0537, global_step=3822.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  66%|██████▌   | 796/1208 [22:47<11:47,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0763, train/loss_vlb_step=0.000255, train/loss_step=0.0763, global_step=3822.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  66%|██████▌   | 797/1208 [22:48<11:45,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0763, train/loss_vlb_step=0.000255, train/loss_step=0.0763, global_step=3822.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  66%|██████▌   | 797/1208 [22:48<11:45,  1.72s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.45e-5, train/loss_step=0.0134, global_step=3823.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  66%|██████▌   | 798/1208 [22:49<11:43,  1.72s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.45e-5, train/loss_step=0.0134, global_step=3823.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  66%|██████▌   | 798/1208 [22:49<11:43,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00101, train/loss_step=0.270, global_step=3823.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  66%|██████▌   | 799/1208 [22:50<11:41,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00101, train/loss_step=0.270, global_step=3823.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  66%|██████▌   | 799/1208 [22:50<11:41,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.61e-5, train/loss_step=0.00278, global_step=3823.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  66%|██████▌   | 800/1208 [22:54<11:40,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.61e-5, train/loss_step=0.00278, global_step=3823.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  66%|██████▌   | 800/1208 [22:54<11:40,  1.72s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.00432, train/loss_vlb_step=2.27e-5, train/loss_step=0.00432, global_step=3823.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  66%|██████▋   | 801/1208 [22:55<11:38,  1.72s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.00432, train/loss_vlb_step=2.27e-5, train/loss_step=0.00432, global_step=3823.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  66%|██████▋   | 801/1208 [22:55<11:38,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000821, train/loss_step=0.216, global_step=3824.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  66%|██████▋   | 802/1208 [22:56<11:36,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000821, train/loss_step=0.216, global_step=3824.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  66%|██████▋   | 802/1208 [22:56<11:36,  1.72s/it, loss=0.0993, v_num=0, train/loss_simple_step=0.0371, train/loss_vlb_step=0.00014, train/loss_step=0.0371, global_step=3824.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  66%|██████▋   | 803/1208 [22:57<11:34,  1.72s/it, loss=0.0993, v_num=0, train/loss_simple_step=0.0371, train/loss_vlb_step=0.00014, train/loss_step=0.0371, global_step=3824.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  66%|██████▋   | 803/1208 [22:57<11:34,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000412, train/loss_step=0.126, global_step=3824.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  67%|██████▋   | 804/1208 [23:00<11:33,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000412, train/loss_step=0.126, global_step=3824.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  67%|██████▋   | 804/1208 [23:00<11:33,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000118, train/loss_step=0.0309, global_step=3824.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  67%|██████▋   | 805/1208 [23:01<11:31,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000118, train/loss_step=0.0309, global_step=3824.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  67%|██████▋   | 805/1208 [23:01<11:31,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0809, train/loss_vlb_step=0.000268, train/loss_step=0.0809, global_step=3825.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  67%|██████▋   | 806/1208 [23:02<11:29,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0809, train/loss_vlb_step=0.000268, train/loss_step=0.0809, global_step=3825.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  67%|██████▋   | 806/1208 [23:02<11:29,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.522, train/loss_vlb_step=0.00692, train/loss_step=0.522, global_step=3825.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  67%|██████▋   | 807/1208 [23:03<11:27,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.522, train/loss_vlb_step=0.00692, train/loss_step=0.522, global_step=3825.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  67%|██████▋   | 807/1208 [23:03<11:27,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.935, train/loss_vlb_step=0.471, train/loss_step=0.935, global_step=3825.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  67%|██████▋   | 808/1208 [23:06<11:26,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.935, train/loss_vlb_step=0.471, train/loss_step=0.935, global_step=3825.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  67%|██████▋   | 808/1208 [23:06<11:26,  1.72s/it, loss=0.191, v_num=0, train/loss_simple_step=0.862, train/loss_vlb_step=0.218, train/loss_step=0.862, global_step=3825.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  67%|██████▋   | 809/1208 [23:08<11:24,  1.72s/it, loss=0.191, v_num=0, train/loss_simple_step=0.862, train/loss_vlb_step=0.218, train/loss_step=0.862, global_step=3825.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  67%|██████▋   | 809/1208 [23:08<11:24,  1.72s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0952, train/loss_vlb_step=0.000314, train/loss_step=0.0952, global_step=3826.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  67%|██████▋   | 810/1208 [23:09<11:22,  1.71s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0952, train/loss_vlb_step=0.000314, train/loss_step=0.0952, global_step=3826.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  67%|██████▋   | 810/1208 [23:09<11:22,  1.71s/it, loss=0.197, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000632, train/loss_step=0.176, global_step=3826.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  67%|██████▋   | 811/1208 [23:10<11:20,  1.71s/it, loss=0.197, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000632, train/loss_step=0.176, global_step=3826.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  67%|██████▋   | 811/1208 [23:10<11:20,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0575, train/loss_vlb_step=0.000206, train/loss_step=0.0575, global_step=3826.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  67%|██████▋   | 812/1208 [23:13<11:19,  1.72s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0575, train/loss_vlb_step=0.000206, train/loss_step=0.0575, global_step=3826.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  67%|██████▋   | 812/1208 [23:13<11:19,  1.72s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.34e-5, train/loss_step=0.0233, global_step=3826.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  67%|██████▋   | 813/1208 [23:14<11:17,  1.72s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.34e-5, train/loss_step=0.0233, global_step=3826.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  67%|██████▋   | 813/1208 [23:14<11:17,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.53e-5, train/loss_step=0.0175, global_step=3827.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  67%|██████▋   | 814/1208 [23:15<11:15,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.53e-5, train/loss_step=0.0175, global_step=3827.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  67%|██████▋   | 814/1208 [23:15<11:15,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.04e-5, train/loss_step=0.00174, global_step=3827.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  67%|██████▋   | 815/1208 [23:16<11:13,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.04e-5, train/loss_step=0.00174, global_step=3827.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  67%|██████▋   | 815/1208 [23:16<11:13,  1.71s/it, loss=0.184, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000427, train/loss_step=0.130, global_step=3827.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  68%|██████▊   | 816/1208 [23:19<11:12,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000427, train/loss_step=0.130, global_step=3827.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  68%|██████▊   | 816/1208 [23:19<11:12,  1.72s/it, loss=0.193, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00108, train/loss_step=0.250, global_step=3827.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  68%|██████▊   | 817/1208 [23:20<11:10,  1.71s/it, loss=0.193, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00108, train/loss_step=0.250, global_step=3827.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  68%|██████▊   | 817/1208 [23:20<11:10,  1.71s/it, loss=0.197, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=3828.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  68%|██████▊   | 818/1208 [23:21<11:08,  1.71s/it, loss=0.197, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=3828.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  68%|██████▊   | 818/1208 [23:21<11:08,  1.71s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.25e-5, train/loss_step=0.00207, global_step=3828.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  68%|██████▊   | 819/1208 [23:23<11:06,  1.71s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.25e-5, train/loss_step=0.00207, global_step=3828.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  68%|██████▊   | 819/1208 [23:23<11:06,  1.71s/it, loss=0.212, v_num=0, train/loss_simple_step=0.562, train/loss_vlb_step=0.00971, train/loss_step=0.562, global_step=3828.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  68%|██████▊   | 820/1208 [23:26<11:05,  1.72s/it, loss=0.212, v_num=0, train/loss_simple_step=0.562, train/loss_vlb_step=0.00971, train/loss_step=0.562, global_step=3828.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  68%|██████▊   | 820/1208 [23:26<11:05,  1.72s/it, loss=0.223, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000907, train/loss_step=0.232, global_step=3828.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  68%|██████▊   | 821/1208 [23:27<11:03,  1.71s/it, loss=0.223, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000907, train/loss_step=0.232, global_step=3828.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  68%|██████▊   | 821/1208 [23:27<11:03,  1.71s/it, loss=0.216, v_num=0, train/loss_simple_step=0.0632, train/loss_vlb_step=0.000217, train/loss_step=0.0632, global_step=3829.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  68%|██████▊   | 822/1208 [23:28<11:01,  1.71s/it, loss=0.216, v_num=0, train/loss_simple_step=0.0632, train/loss_vlb_step=0.000217, train/loss_step=0.0632, global_step=3829.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  68%|██████▊   | 822/1208 [23:28<11:01,  1.71s/it, loss=0.214, v_num=0, train/loss_simple_step=0.00905, train/loss_vlb_step=4.53e-5, train/loss_step=0.00905, global_step=3829.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  68%|██████▊   | 823/1208 [23:29<10:59,  1.71s/it, loss=0.214, v_num=0, train/loss_simple_step=0.00905, train/loss_vlb_step=4.53e-5, train/loss_step=0.00905, global_step=3829.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  68%|██████▊   | 823/1208 [23:29<10:59,  1.71s/it, loss=0.223, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00125, train/loss_step=0.292, global_step=3829.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  68%|██████▊   | 824/1208 [23:32<10:58,  1.71s/it, loss=0.223, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00125, train/loss_step=0.292, global_step=3829.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  68%|██████▊   | 824/1208 [23:32<10:58,  1.71s/it, loss=0.222, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.41e-5, train/loss_step=0.0118, global_step=3829.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  68%|██████▊   | 825/1208 [23:33<10:56,  1.71s/it, loss=0.222, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.41e-5, train/loss_step=0.0118, global_step=3829.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  68%|██████▊   | 825/1208 [23:33<10:56,  1.71s/it, loss=0.227, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000645, train/loss_step=0.182, global_step=3830.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  68%|██████▊   | 826/1208 [23:34<10:54,  1.71s/it, loss=0.227, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000645, train/loss_step=0.182, global_step=3830.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  68%|██████▊   | 826/1208 [23:34<10:54,  1.71s/it, loss=0.206, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000382, train/loss_step=0.115, global_step=3830.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  68%|██████▊   | 827/1208 [23:35<10:52,  1.71s/it, loss=0.206, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000382, train/loss_step=0.115, global_step=3830.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  68%|██████▊   | 827/1208 [23:35<10:52,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00382, train/loss_vlb_step=2.03e-5, train/loss_step=0.00382, global_step=3830.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  69%|██████▊   | 828/1208 [23:39<10:51,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00382, train/loss_vlb_step=2.03e-5, train/loss_step=0.00382, global_step=3830.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  69%|██████▊   | 828/1208 [23:39<10:51,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000722, train/loss_step=0.198, global_step=3830.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  69%|██████▊   | 829/1208 [23:40<10:49,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000722, train/loss_step=0.198, global_step=3830.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  69%|██████▊   | 829/1208 [23:40<10:49,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000131, train/loss_step=0.0344, global_step=3831.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  69%|██████▊   | 830/1208 [23:41<10:47,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000131, train/loss_step=0.0344, global_step=3831.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  69%|██████▊   | 830/1208 [23:41<10:47,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.0012, train/loss_step=0.273, global_step=3831.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  69%|██████▉   | 831/1208 [23:42<10:45,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.0012, train/loss_step=0.273, global_step=3831.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  69%|██████▉   | 831/1208 [23:42<10:45,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.65e-5, train/loss_step=0.0101, global_step=3831.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  69%|██████▉   | 832/1208 [23:45<10:44,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.65e-5, train/loss_step=0.0101, global_step=3831.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  69%|██████▉   | 832/1208 [23:45<10:44,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0774, train/loss_vlb_step=0.000262, train/loss_step=0.0774, global_step=3831.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  69%|██████▉   | 833/1208 [23:46<10:42,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0774, train/loss_vlb_step=0.000262, train/loss_step=0.0774, global_step=3831.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  69%|██████▉   | 833/1208 [23:46<10:42,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000675, train/loss_step=0.184, global_step=3832.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  69%|██████▉   | 834/1208 [23:47<10:40,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000675, train/loss_step=0.184, global_step=3832.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  69%|██████▉   | 834/1208 [23:47<10:40,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0481, train/loss_vlb_step=0.000174, train/loss_step=0.0481, global_step=3832.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  69%|██████▉   | 835/1208 [23:48<10:38,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0481, train/loss_vlb_step=0.000174, train/loss_step=0.0481, global_step=3832.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  69%|██████▉   | 835/1208 [23:48<10:38,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000688, train/loss_step=0.191, global_step=3832.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  69%|██████▉   | 836/1208 [23:52<10:37,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000688, train/loss_step=0.191, global_step=3832.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  69%|██████▉   | 836/1208 [23:52<10:37,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000916, train/loss_step=0.235, global_step=3832.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  69%|██████▉   | 837/1208 [23:53<10:35,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000916, train/loss_step=0.235, global_step=3832.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  69%|██████▉   | 837/1208 [23:53<10:35,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000588, train/loss_step=0.165, global_step=3833.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  69%|██████▉   | 838/1208 [23:54<10:33,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000588, train/loss_step=0.165, global_step=3833.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  69%|██████▉   | 838/1208 [23:54<10:33,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.000131, train/loss_step=0.0356, global_step=3833.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  69%|██████▉   | 839/1208 [23:55<10:31,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.000131, train/loss_step=0.0356, global_step=3833.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  69%|██████▉   | 839/1208 [23:55<10:31,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0646, train/loss_vlb_step=0.000219, train/loss_step=0.0646, global_step=3833.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  70%|██████▉   | 840/1208 [23:58<10:30,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0646, train/loss_vlb_step=0.000219, train/loss_step=0.0646, global_step=3833.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  70%|██████▉   | 840/1208 [23:58<10:30,  1.71s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=5.99e-5, train/loss_step=0.0137, global_step=3833.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  70%|██████▉   | 841/1208 [23:59<10:28,  1.71s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=5.99e-5, train/loss_step=0.0137, global_step=3833.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  70%|██████▉   | 841/1208 [23:59<10:28,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00105, train/loss_step=0.250, global_step=3834.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  70%|██████▉   | 842/1208 [24:00<10:26,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00105, train/loss_step=0.250, global_step=3834.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  70%|██████▉   | 842/1208 [24:00<10:26,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.000271, train/loss_step=0.0817, global_step=3834.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  70%|██████▉   | 843/1208 [24:01<10:24,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.000271, train/loss_step=0.0817, global_step=3834.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  70%|██████▉   | 843/1208 [24:01<10:24,  1.71s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0574, train/loss_vlb_step=0.000198, train/loss_step=0.0574, global_step=3834.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  70%|██████▉   | 844/1208 [24:04<10:23,  1.71s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0574, train/loss_vlb_step=0.000198, train/loss_step=0.0574, global_step=3834.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  70%|██████▉   | 844/1208 [24:04<10:23,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000418, train/loss_step=0.127, global_step=3834.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  70%|██████▉   | 845/1208 [24:06<10:21,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000418, train/loss_step=0.127, global_step=3834.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  70%|██████▉   | 845/1208 [24:06<10:21,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000744, train/loss_step=0.204, global_step=3835.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  70%|███████   | 846/1208 [24:07<10:19,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000744, train/loss_step=0.204, global_step=3835.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  70%|███████   | 846/1208 [24:07<10:19,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0052, train/loss_vlb_step=2.75e-5, train/loss_step=0.0052, global_step=3835.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  70%|███████   | 847/1208 [24:08<10:17,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0052, train/loss_vlb_step=2.75e-5, train/loss_step=0.0052, global_step=3835.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  70%|███████   | 847/1208 [24:08<10:17,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=1.54e-5, train/loss_step=0.00263, global_step=3835.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  70%|███████   | 848/1208 [24:11<10:16,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=1.54e-5, train/loss_step=0.00263, global_step=3835.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  70%|███████   | 848/1208 [24:11<10:16,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.44e-5, train/loss_step=0.0121, global_step=3835.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  70%|███████   | 849/1208 [24:12<10:14,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.44e-5, train/loss_step=0.0121, global_step=3835.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  70%|███████   | 849/1208 [24:12<10:14,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0594, train/loss_vlb_step=0.000197, train/loss_step=0.0594, global_step=3836.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  70%|███████   | 850/1208 [24:13<10:12,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0594, train/loss_vlb_step=0.000197, train/loss_step=0.0594, global_step=3836.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  70%|███████   | 850/1208 [24:13<10:12,  1.71s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.0377, train/loss_vlb_step=0.000142, train/loss_step=0.0377, global_step=3836.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  70%|███████   | 851/1208 [24:14<10:10,  1.71s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.0377, train/loss_vlb_step=0.000142, train/loss_step=0.0377, global_step=3836.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  70%|███████   | 851/1208 [24:14<10:10,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000566, train/loss_step=0.169, global_step=3836.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  71%|███████   | 852/1208 [24:17<10:09,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000566, train/loss_step=0.169, global_step=3836.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  71%|███████   | 852/1208 [24:17<10:09,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000622, train/loss_step=0.178, global_step=3836.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  71%|███████   | 853/1208 [24:18<10:07,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000622, train/loss_step=0.178, global_step=3836.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  71%|███████   | 853/1208 [24:18<10:07,  1.71s/it, loss=0.112, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00143, train/loss_step=0.305, global_step=3837.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  71%|███████   | 854/1208 [24:19<10:05,  1.71s/it, loss=0.112, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00143, train/loss_step=0.305, global_step=3837.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  71%|███████   | 854/1208 [24:19<10:05,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0582, train/loss_vlb_step=0.000204, train/loss_step=0.0582, global_step=3837.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  71%|███████   | 855/1208 [24:20<10:03,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0582, train/loss_vlb_step=0.000204, train/loss_step=0.0582, global_step=3837.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  71%|███████   | 855/1208 [24:20<10:03,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00526, train/loss_step=0.476, global_step=3837.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  71%|███████   | 856/1208 [24:24<10:02,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00526, train/loss_step=0.476, global_step=3837.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  71%|███████   | 856/1208 [24:24<10:02,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.709, train/loss_vlb_step=0.0406, train/loss_step=0.709, global_step=3837.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  71%|███████   | 857/1208 [24:25<10:00,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.709, train/loss_vlb_step=0.0406, train/loss_step=0.709, global_step=3837.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  71%|███████   | 857/1208 [24:25<10:00,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000394, train/loss_step=0.119, global_step=3838.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  71%|███████   | 858/1208 [24:26<09:58,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000394, train/loss_step=0.119, global_step=3838.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  71%|███████   | 858/1208 [24:26<09:58,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.000162, train/loss_step=0.0441, global_step=3838.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  71%|███████   | 859/1208 [24:27<09:56,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.000162, train/loss_step=0.0441, global_step=3838.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  71%|███████   | 859/1208 [24:27<09:56,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00167, train/loss_step=0.309, global_step=3838.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  71%|███████   | 860/1208 [24:30<09:55,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00167, train/loss_step=0.309, global_step=3838.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  71%|███████   | 860/1208 [24:30<09:55,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0633, train/loss_vlb_step=0.000217, train/loss_step=0.0633, global_step=3838.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  71%|███████▏  | 861/1208 [24:31<09:53,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0633, train/loss_vlb_step=0.000217, train/loss_step=0.0633, global_step=3838.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  71%|███████▏  | 861/1208 [24:31<09:53,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00197, train/loss_step=0.373, global_step=3839.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  71%|███████▏  | 862/1208 [24:32<09:51,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00197, train/loss_step=0.373, global_step=3839.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  71%|███████▏  | 862/1208 [24:32<09:51,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000113, train/loss_step=0.0277, global_step=3839.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  71%|███████▏  | 863/1208 [24:33<09:49,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000113, train/loss_step=0.0277, global_step=3839.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  71%|███████▏  | 863/1208 [24:33<09:49,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00138, train/loss_step=0.275, global_step=3839.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  72%|███████▏  | 864/1208 [24:37<09:48,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00138, train/loss_step=0.275, global_step=3839.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  72%|███████▏  | 864/1208 [24:37<09:48,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00382, train/loss_vlb_step=2.08e-5, train/loss_step=0.00382, global_step=3839.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  72%|███████▏  | 865/1208 [24:38<09:46,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00382, train/loss_vlb_step=2.08e-5, train/loss_step=0.00382, global_step=3839.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  72%|███████▏  | 865/1208 [24:38<09:46,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0343, train/loss_vlb_step=0.000129, train/loss_step=0.0343, global_step=3840.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  72%|███████▏  | 866/1208 [24:39<09:44,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0343, train/loss_vlb_step=0.000129, train/loss_step=0.0343, global_step=3840.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  72%|███████▏  | 866/1208 [24:39<09:44,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=3840.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  72%|███████▏  | 867/1208 [24:40<09:42,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=3840.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  72%|███████▏  | 867/1208 [24:40<09:42,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.97e-5, train/loss_step=0.0245, global_step=3840.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  72%|███████▏  | 868/1208 [24:43<09:41,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.97e-5, train/loss_step=0.0245, global_step=3840.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  72%|███████▏  | 868/1208 [24:43<09:41,  1.71s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000194, train/loss_step=0.0524, global_step=3840.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  72%|███████▏  | 869/1208 [24:44<09:39,  1.71s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000194, train/loss_step=0.0524, global_step=3840.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  72%|███████▏  | 869/1208 [24:44<09:39,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0677, train/loss_vlb_step=0.000235, train/loss_step=0.0677, global_step=3841.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  72%|███████▏  | 870/1208 [24:45<09:37,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0677, train/loss_vlb_step=0.000235, train/loss_step=0.0677, global_step=3841.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  72%|███████▏  | 870/1208 [24:45<09:37,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0383, train/loss_vlb_step=0.000138, train/loss_step=0.0383, global_step=3841.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  72%|███████▏  | 871/1208 [24:46<09:35,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0383, train/loss_vlb_step=0.000138, train/loss_step=0.0383, global_step=3841.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  72%|███████▏  | 871/1208 [24:46<09:35,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00114, train/loss_step=0.265, global_step=3841.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  72%|███████▏  | 872/1208 [24:49<09:34,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00114, train/loss_step=0.265, global_step=3841.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  72%|███████▏  | 872/1208 [24:49<09:34,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0452, train/loss_vlb_step=0.000164, train/loss_step=0.0452, global_step=3841.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  72%|███████▏  | 873/1208 [24:50<09:32,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0452, train/loss_vlb_step=0.000164, train/loss_step=0.0452, global_step=3841.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  72%|███████▏  | 873/1208 [24:50<09:32,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.45e-5, train/loss_step=0.0147, global_step=3842.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  72%|███████▏  | 874/1208 [24:52<09:30,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.45e-5, train/loss_step=0.0147, global_step=3842.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  72%|███████▏  | 874/1208 [24:52<09:30,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.37e-5, train/loss_step=0.00235, global_step=3842.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  72%|███████▏  | 875/1208 [24:53<09:28,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.37e-5, train/loss_step=0.00235, global_step=3842.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  72%|███████▏  | 875/1208 [24:53<09:28,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00524, train/loss_vlb_step=2.66e-5, train/loss_step=0.00524, global_step=3842.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  73%|███████▎  | 876/1208 [24:56<09:27,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00524, train/loss_vlb_step=2.66e-5, train/loss_step=0.00524, global_step=3842.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  73%|███████▎  | 876/1208 [24:56<09:27,  1.71s/it, loss=0.0939, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=2.09e-5, train/loss_step=0.00416, global_step=3842.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  73%|███████▎  | 877/1208 [24:57<09:25,  1.71s/it, loss=0.0939, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=2.09e-5, train/loss_step=0.00416, global_step=3842.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  73%|███████▎  | 877/1208 [24:57<09:25,  1.71s/it, loss=0.0886, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.85e-5, train/loss_step=0.013, global_step=3843.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  73%|███████▎  | 878/1208 [24:58<09:23,  1.71s/it, loss=0.0886, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.85e-5, train/loss_step=0.013, global_step=3843.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  73%|███████▎  | 878/1208 [24:58<09:23,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00198, train/loss_step=0.372, global_step=3843.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  73%|███████▎  | 879/1208 [24:59<09:21,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00198, train/loss_step=0.372, global_step=3843.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  73%|███████▎  | 879/1208 [24:59<09:21,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00181, train/loss_step=0.346, global_step=3843.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  73%|███████▎  | 880/1208 [25:02<09:20,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00181, train/loss_step=0.346, global_step=3843.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  73%|███████▎  | 880/1208 [25:02<09:20,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.97e-5, train/loss_step=0.0164, global_step=3843.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  73%|███████▎  | 881/1208 [25:03<09:18,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.97e-5, train/loss_step=0.0164, global_step=3843.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  73%|███████▎  | 881/1208 [25:03<09:18,  1.71s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=3844.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  73%|███████▎  | 882/1208 [25:04<09:16,  1.71s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=3844.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  73%|███████▎  | 882/1208 [25:04<09:16,  1.71s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.00036, train/loss_step=0.110, global_step=3844.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  73%|███████▎  | 883/1208 [25:06<09:14,  1.71s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.00036, train/loss_step=0.110, global_step=3844.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  73%|███████▎  | 883/1208 [25:06<09:14,  1.71s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000427, train/loss_step=0.129, global_step=3844.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  73%|███████▎  | 884/1208 [25:09<09:13,  1.71s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000427, train/loss_step=0.129, global_step=3844.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  73%|███████▎  | 884/1208 [25:09<09:13,  1.71s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000707, train/loss_step=0.199, global_step=3844.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  73%|███████▎  | 885/1208 [25:10<09:11,  1.71s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000707, train/loss_step=0.199, global_step=3844.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  73%|███████▎  | 885/1208 [25:10<09:11,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000581, train/loss_step=0.167, global_step=3845.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  73%|███████▎  | 886/1208 [25:11<09:09,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000581, train/loss_step=0.167, global_step=3845.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  73%|███████▎  | 886/1208 [25:11<09:09,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000426, train/loss_step=0.129, global_step=3845.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  73%|███████▎  | 887/1208 [25:12<09:07,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000426, train/loss_step=0.129, global_step=3845.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  73%|███████▎  | 887/1208 [25:12<09:07,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000272, train/loss_step=0.0815, global_step=3845.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  74%|███████▎  | 888/1208 [25:15<09:06,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000272, train/loss_step=0.0815, global_step=3845.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  74%|███████▎  | 888/1208 [25:15<09:06,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000455, train/loss_step=0.138, global_step=3845.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  74%|███████▎  | 889/1208 [25:16<09:04,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000455, train/loss_step=0.138, global_step=3845.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  74%|███████▎  | 889/1208 [25:16<09:04,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00354, train/loss_step=0.413, global_step=3846.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  74%|███████▎  | 890/1208 [25:17<09:02,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00354, train/loss_step=0.413, global_step=3846.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  74%|███████▎  | 890/1208 [25:17<09:02,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000245, train/loss_step=0.0741, global_step=3846.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  74%|███████▍  | 891/1208 [25:18<09:00,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000245, train/loss_step=0.0741, global_step=3846.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  74%|███████▍  | 891/1208 [25:18<09:00,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0324, train/loss_vlb_step=0.000122, train/loss_step=0.0324, global_step=3846.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  74%|███████▍  | 892/1208 [25:22<08:59,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0324, train/loss_vlb_step=0.000122, train/loss_step=0.0324, global_step=3846.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  74%|███████▍  | 892/1208 [25:22<08:59,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0027, train/loss_vlb_step=1.51e-5, train/loss_step=0.0027, global_step=3846.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  74%|███████▍  | 893/1208 [25:23<08:57,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0027, train/loss_vlb_step=1.51e-5, train/loss_step=0.0027, global_step=3846.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  74%|███████▍  | 893/1208 [25:23<08:57,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000124, train/loss_step=0.0334, global_step=3847.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  74%|███████▍  | 894/1208 [25:24<08:55,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000124, train/loss_step=0.0334, global_step=3847.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  74%|███████▍  | 894/1208 [25:24<08:55,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00422, train/loss_vlb_step=2.36e-5, train/loss_step=0.00422, global_step=3847.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  74%|███████▍  | 895/1208 [25:25<08:53,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00422, train/loss_vlb_step=2.36e-5, train/loss_step=0.00422, global_step=3847.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  74%|███████▍  | 895/1208 [25:25<08:53,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0354, train/loss_vlb_step=0.000138, train/loss_step=0.0354, global_step=3847.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  74%|███████▍  | 896/1208 [25:28<08:52,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0354, train/loss_vlb_step=0.000138, train/loss_step=0.0354, global_step=3847.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  74%|███████▍  | 896/1208 [25:28<08:52,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000727, train/loss_step=0.211, global_step=3847.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  74%|███████▍  | 897/1208 [25:29<08:50,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000727, train/loss_step=0.211, global_step=3847.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  74%|███████▍  | 897/1208 [25:29<08:50,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0632, train/loss_vlb_step=0.000216, train/loss_step=0.0632, global_step=3848.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  74%|███████▍  | 898/1208 [25:30<08:48,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0632, train/loss_vlb_step=0.000216, train/loss_step=0.0632, global_step=3848.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  74%|███████▍  | 898/1208 [25:30<08:48,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.25e-5, train/loss_step=0.012, global_step=3848.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  74%|███████▍  | 899/1208 [25:31<08:46,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.25e-5, train/loss_step=0.012, global_step=3848.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  74%|███████▍  | 899/1208 [25:31<08:46,  1.70s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000141, train/loss_step=0.0364, global_step=3848.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  75%|███████▍  | 900/1208 [25:34<08:45,  1.71s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000141, train/loss_step=0.0364, global_step=3848.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  75%|███████▍  | 900/1208 [25:34<08:45,  1.71s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.27e-5, train/loss_step=0.0202, global_step=3848.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] 
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.77it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.83it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.76it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.81it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.76it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.76it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.79it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.75it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.75it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.75it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 12:  75%|███████▍  | 901/1208 [26:05<08:53,  1.74s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.27e-5, train/loss_step=0.0202, global_step=3848.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  75%|███████▍  | 901/1208 [26:05<08:53,  1.74s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=6.93e-5, train/loss_step=0.0169, global_step=3849.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  75%|███████▍  | 902/1208 [26:06<08:51,  1.74s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=6.93e-5, train/loss_step=0.0169, global_step=3849.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  75%|███████▍  | 902/1208 [26:06<08:51,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00112, train/loss_step=0.251, global_step=3849.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  75%|███████▍  | 903/1208 [26:07<08:49,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00112, train/loss_step=0.251, global_step=3849.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  75%|███████▍  | 903/1208 [26:07<08:49,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000902, train/loss_step=0.227, global_step=3849.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  75%|███████▍  | 904/1208 [26:10<08:48,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000902, train/loss_step=0.227, global_step=3849.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  75%|███████▍  | 904/1208 [26:10<08:48,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000556, train/loss_step=0.168, global_step=3849.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  75%|███████▍  | 905/1208 [26:11<08:46,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000556, train/loss_step=0.168, global_step=3849.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  75%|███████▍  | 905/1208 [26:11<08:46,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=3850.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  75%|███████▌  | 906/1208 [26:12<08:44,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=3850.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  75%|███████▌  | 906/1208 [26:12<08:44,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.0019, train/loss_step=0.334, global_step=3850.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  75%|███████▌  | 907/1208 [26:13<08:42,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.0019, train/loss_step=0.334, global_step=3850.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  75%|███████▌  | 907/1208 [26:13<08:42,  1.74s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.35e-5, train/loss_step=0.0167, global_step=3850.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  75%|███████▌  | 908/1208 [26:17<08:41,  1.74s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.35e-5, train/loss_step=0.0167, global_step=3850.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  75%|███████▌  | 908/1208 [26:17<08:41,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0675, train/loss_vlb_step=0.000231, train/loss_step=0.0675, global_step=3850.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  75%|███████▌  | 909/1208 [26:18<08:39,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0675, train/loss_vlb_step=0.000231, train/loss_step=0.0675, global_step=3850.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  75%|███████▌  | 909/1208 [26:18<08:39,  1.74s/it, loss=0.0959, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000813, train/loss_step=0.203, global_step=3851.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  75%|███████▌  | 910/1208 [26:19<08:37,  1.74s/it, loss=0.0959, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000813, train/loss_step=0.203, global_step=3851.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  75%|███████▌  | 910/1208 [26:19<08:37,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00253, train/loss_step=0.418, global_step=3851.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  75%|███████▌  | 911/1208 [26:20<08:35,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00253, train/loss_step=0.418, global_step=3851.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  75%|███████▌  | 911/1208 [26:20<08:35,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0841, train/loss_vlb_step=0.000283, train/loss_step=0.0841, global_step=3851.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  75%|███████▌  | 912/1208 [26:23<08:33,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0841, train/loss_vlb_step=0.000283, train/loss_step=0.0841, global_step=3851.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  75%|███████▌  | 912/1208 [26:23<08:33,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00125, train/loss_step=0.263, global_step=3851.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  76%|███████▌  | 913/1208 [26:24<08:32,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00125, train/loss_step=0.263, global_step=3851.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  76%|███████▌  | 913/1208 [26:24<08:32,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.00046, train/loss_step=0.133, global_step=3852.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  76%|███████▌  | 914/1208 [26:25<08:30,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.00046, train/loss_step=0.133, global_step=3852.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  76%|███████▌  | 914/1208 [26:25<08:30,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00114, train/loss_step=0.282, global_step=3852.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  76%|███████▌  | 915/1208 [26:26<08:28,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00114, train/loss_step=0.282, global_step=3852.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  76%|███████▌  | 915/1208 [26:26<08:28,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.58e-5, train/loss_step=0.00277, global_step=3852.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  76%|███████▌  | 916/1208 [26:30<08:26,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.58e-5, train/loss_step=0.00277, global_step=3852.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  76%|███████▌  | 916/1208 [26:30<08:26,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000494, train/loss_step=0.148, global_step=3852.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  76%|███████▌  | 917/1208 [26:31<08:24,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000494, train/loss_step=0.148, global_step=3852.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  76%|███████▌  | 917/1208 [26:31<08:24,  1.74s/it, loss=0.147, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000529, train/loss_step=0.157, global_step=3853.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  76%|███████▌  | 918/1208 [26:32<08:22,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000529, train/loss_step=0.157, global_step=3853.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  76%|███████▌  | 918/1208 [26:32<08:22,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000913, train/loss_step=0.235, global_step=3853.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  76%|███████▌  | 919/1208 [26:33<08:20,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000913, train/loss_step=0.235, global_step=3853.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  76%|███████▌  | 919/1208 [26:33<08:20,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.48e-5, train/loss_step=0.0026, global_step=3853.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  76%|███████▌  | 920/1208 [26:36<08:19,  1.74s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.48e-5, train/loss_step=0.0026, global_step=3853.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  76%|███████▌  | 920/1208 [26:36<08:19,  1.74s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000103, train/loss_step=0.0264, global_step=3853.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  76%|███████▌  | 921/1208 [26:37<08:17,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000103, train/loss_step=0.0264, global_step=3853.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  76%|███████▌  | 921/1208 [26:37<08:17,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000139, train/loss_step=0.0364, global_step=3854.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  76%|███████▋  | 922/1208 [26:38<08:15,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000139, train/loss_step=0.0364, global_step=3854.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  76%|███████▋  | 922/1208 [26:38<08:15,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.7e-5, train/loss_step=0.00299, global_step=3854.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  76%|███████▋  | 923/1208 [26:39<08:13,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.7e-5, train/loss_step=0.00299, global_step=3854.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  76%|███████▋  | 923/1208 [26:39<08:13,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000114, train/loss_step=0.0306, global_step=3854.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  76%|███████▋  | 924/1208 [26:42<08:12,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000114, train/loss_step=0.0306, global_step=3854.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  76%|███████▋  | 924/1208 [26:42<08:12,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000567, train/loss_step=0.167, global_step=3854.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  77%|███████▋  | 925/1208 [26:43<08:10,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000567, train/loss_step=0.167, global_step=3854.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  77%|███████▋  | 925/1208 [26:43<08:10,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00186, train/loss_step=0.333, global_step=3855.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  77%|███████▋  | 926/1208 [26:44<08:08,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00186, train/loss_step=0.333, global_step=3855.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  77%|███████▋  | 926/1208 [26:44<08:08,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.19e-5, train/loss_step=0.0144, global_step=3855.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  77%|███████▋  | 927/1208 [26:45<08:06,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.19e-5, train/loss_step=0.0144, global_step=3855.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  77%|███████▋  | 927/1208 [26:45<08:06,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00118, train/loss_step=0.287, global_step=3855.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  77%|███████▋  | 928/1208 [26:49<08:05,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00118, train/loss_step=0.287, global_step=3855.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  77%|███████▋  | 928/1208 [26:49<08:05,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0323, train/loss_vlb_step=0.000126, train/loss_step=0.0323, global_step=3855.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  77%|███████▋  | 929/1208 [26:50<08:03,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0323, train/loss_vlb_step=0.000126, train/loss_step=0.0323, global_step=3855.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  77%|███████▋  | 929/1208 [26:50<08:03,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00472, train/loss_vlb_step=2.52e-5, train/loss_step=0.00472, global_step=3856.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  77%|███████▋  | 930/1208 [26:51<08:01,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00472, train/loss_vlb_step=2.52e-5, train/loss_step=0.00472, global_step=3856.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  77%|███████▋  | 930/1208 [26:51<08:01,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0697, train/loss_vlb_step=0.000238, train/loss_step=0.0697, global_step=3856.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  77%|███████▋  | 931/1208 [26:52<07:59,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0697, train/loss_vlb_step=0.000238, train/loss_step=0.0697, global_step=3856.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  77%|███████▋  | 931/1208 [26:52<07:59,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0993, train/loss_vlb_step=0.000327, train/loss_step=0.0993, global_step=3856.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  77%|███████▋  | 932/1208 [26:55<07:58,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0993, train/loss_vlb_step=0.000327, train/loss_step=0.0993, global_step=3856.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  77%|███████▋  | 932/1208 [26:55<07:58,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.00018, train/loss_step=0.0508, global_step=3856.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  77%|███████▋  | 933/1208 [26:56<07:56,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.00018, train/loss_step=0.0508, global_step=3856.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  77%|███████▋  | 933/1208 [26:56<07:56,  1.73s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.66e-5, train/loss_step=0.0154, global_step=3857.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  77%|███████▋  | 934/1208 [26:57<07:54,  1.73s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.66e-5, train/loss_step=0.0154, global_step=3857.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  77%|███████▋  | 934/1208 [26:57<07:54,  1.73s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000717, train/loss_step=0.198, global_step=3857.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  77%|███████▋  | 935/1208 [26:58<07:52,  1.73s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000717, train/loss_step=0.198, global_step=3857.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  77%|███████▋  | 935/1208 [26:58<07:52,  1.73s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000121, train/loss_step=0.0298, global_step=3857.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  77%|███████▋  | 936/1208 [27:02<07:51,  1.73s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000121, train/loss_step=0.0298, global_step=3857.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  77%|███████▋  | 936/1208 [27:02<07:51,  1.73s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000556, train/loss_step=0.162, global_step=3857.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  78%|███████▊  | 937/1208 [27:03<07:49,  1.73s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000556, train/loss_step=0.162, global_step=3857.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  78%|███████▊  | 937/1208 [27:03<07:49,  1.73s/it, loss=0.107, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00243, train/loss_step=0.350, global_step=3858.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  78%|███████▊  | 938/1208 [27:04<07:47,  1.73s/it, loss=0.107, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00243, train/loss_step=0.350, global_step=3858.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  78%|███████▊  | 938/1208 [27:04<07:47,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00105, train/loss_step=0.245, global_step=3858.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  78%|███████▊  | 939/1208 [27:05<07:45,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00105, train/loss_step=0.245, global_step=3858.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  78%|███████▊  | 939/1208 [27:05<07:45,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=1.48e-5, train/loss_step=0.00256, global_step=3858.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  78%|███████▊  | 940/1208 [27:08<07:44,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=1.48e-5, train/loss_step=0.00256, global_step=3858.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  78%|███████▊  | 940/1208 [27:08<07:44,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.00545, train/loss_step=0.485, global_step=3858.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  78%|███████▊  | 941/1208 [27:09<07:42,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.00545, train/loss_step=0.485, global_step=3858.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  78%|███████▊  | 941/1208 [27:09<07:42,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.546, train/loss_vlb_step=0.00614, train/loss_step=0.546, global_step=3859.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  78%|███████▊  | 942/1208 [27:10<07:40,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.546, train/loss_vlb_step=0.00614, train/loss_step=0.546, global_step=3859.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  78%|███████▊  | 942/1208 [27:10<07:40,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000246, train/loss_step=0.0741, global_step=3859.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  78%|███████▊  | 943/1208 [27:11<07:38,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000246, train/loss_step=0.0741, global_step=3859.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  78%|███████▊  | 943/1208 [27:11<07:38,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.5e-5, train/loss_step=0.0168, global_step=3859.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  78%|███████▊  | 944/1208 [27:14<07:37,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.5e-5, train/loss_step=0.0168, global_step=3859.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  78%|███████▊  | 944/1208 [27:14<07:37,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000513, train/loss_step=0.154, global_step=3859.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  78%|███████▊  | 945/1208 [27:15<07:35,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000513, train/loss_step=0.154, global_step=3859.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  78%|███████▊  | 945/1208 [27:15<07:35,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000125, train/loss_step=0.0329, global_step=3860.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  78%|███████▊  | 946/1208 [27:16<07:33,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000125, train/loss_step=0.0329, global_step=3860.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  78%|███████▊  | 946/1208 [27:16<07:33,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.502, train/loss_vlb_step=0.00377, train/loss_step=0.502, global_step=3860.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  78%|███████▊  | 947/1208 [27:18<07:31,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.502, train/loss_vlb_step=0.00377, train/loss_step=0.502, global_step=3860.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  78%|███████▊  | 947/1208 [27:18<07:31,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.500, train/loss_vlb_step=0.0052, train/loss_step=0.500, global_step=3860.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  78%|███████▊  | 948/1208 [27:21<07:30,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.500, train/loss_vlb_step=0.0052, train/loss_step=0.500, global_step=3860.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  78%|███████▊  | 948/1208 [27:21<07:30,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000428, train/loss_step=0.130, global_step=3860.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  79%|███████▊  | 949/1208 [27:22<07:28,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000428, train/loss_step=0.130, global_step=3860.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  79%|███████▊  | 949/1208 [27:22<07:28,  1.73s/it, loss=0.194, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000838, train/loss_step=0.210, global_step=3861.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  79%|███████▊  | 950/1208 [27:23<07:26,  1.73s/it, loss=0.194, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000838, train/loss_step=0.210, global_step=3861.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  79%|███████▊  | 950/1208 [27:23<07:26,  1.73s/it, loss=0.203, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00115, train/loss_step=0.256, global_step=3861.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  79%|███████▊  | 951/1208 [27:24<07:24,  1.73s/it, loss=0.203, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00115, train/loss_step=0.256, global_step=3861.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  79%|███████▊  | 951/1208 [27:24<07:24,  1.73s/it, loss=0.215, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00199, train/loss_step=0.349, global_step=3861.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  79%|███████▉  | 952/1208 [27:27<07:23,  1.73s/it, loss=0.215, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00199, train/loss_step=0.349, global_step=3861.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  79%|███████▉  | 952/1208 [27:27<07:23,  1.73s/it, loss=0.213, v_num=0, train/loss_simple_step=0.00854, train/loss_vlb_step=4.13e-5, train/loss_step=0.00854, global_step=3861.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  79%|███████▉  | 953/1208 [27:28<07:21,  1.73s/it, loss=0.213, v_num=0, train/loss_simple_step=0.00854, train/loss_vlb_step=4.13e-5, train/loss_step=0.00854, global_step=3861.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  79%|███████▉  | 953/1208 [27:28<07:21,  1.73s/it, loss=0.213, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.29e-5, train/loss_step=0.0176, global_step=3862.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  79%|███████▉  | 954/1208 [27:29<07:19,  1.73s/it, loss=0.213, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.29e-5, train/loss_step=0.0176, global_step=3862.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  79%|███████▉  | 954/1208 [27:29<07:19,  1.73s/it, loss=0.204, v_num=0, train/loss_simple_step=0.00354, train/loss_vlb_step=1.91e-5, train/loss_step=0.00354, global_step=3862.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  79%|███████▉  | 955/1208 [27:30<07:17,  1.73s/it, loss=0.204, v_num=0, train/loss_simple_step=0.00354, train/loss_vlb_step=1.91e-5, train/loss_step=0.00354, global_step=3862.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  79%|███████▉  | 955/1208 [27:30<07:17,  1.73s/it, loss=0.204, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000147, train/loss_step=0.0412, global_step=3862.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  79%|███████▉  | 956/1208 [27:34<07:16,  1.73s/it, loss=0.204, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000147, train/loss_step=0.0412, global_step=3862.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  79%|███████▉  | 956/1208 [27:34<07:16,  1.73s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.83e-5, train/loss_step=0.0102, global_step=3862.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  79%|███████▉  | 957/1208 [27:35<07:14,  1.73s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.83e-5, train/loss_step=0.0102, global_step=3862.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  79%|███████▉  | 957/1208 [27:35<07:14,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9.13e-5, train/loss_step=0.0224, global_step=3863.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  79%|███████▉  | 958/1208 [27:36<07:12,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9.13e-5, train/loss_step=0.0224, global_step=3863.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  79%|███████▉  | 958/1208 [27:36<07:12,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000727, train/loss_step=0.202, global_step=3863.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  79%|███████▉  | 959/1208 [27:37<07:10,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000727, train/loss_step=0.202, global_step=3863.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  79%|███████▉  | 959/1208 [27:37<07:10,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00132, train/loss_vlb_step=7.98e-6, train/loss_step=0.00132, global_step=3863.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  79%|███████▉  | 960/1208 [27:40<07:08,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00132, train/loss_vlb_step=7.98e-6, train/loss_step=0.00132, global_step=3863.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  79%|███████▉  | 960/1208 [27:40<07:08,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00132, train/loss_step=0.263, global_step=3863.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  80%|███████▉  | 961/1208 [27:41<07:07,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00132, train/loss_step=0.263, global_step=3863.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  80%|███████▉  | 961/1208 [27:41<07:07,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0094, train/loss_vlb_step=4.4e-5, train/loss_step=0.0094, global_step=3864.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  80%|███████▉  | 962/1208 [27:42<07:05,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0094, train/loss_vlb_step=4.4e-5, train/loss_step=0.0094, global_step=3864.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  80%|███████▉  | 962/1208 [27:42<07:05,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.00423, train/loss_step=0.460, global_step=3864.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  80%|███████▉  | 963/1208 [27:43<07:03,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.00423, train/loss_step=0.460, global_step=3864.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  80%|███████▉  | 963/1208 [27:43<07:03,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00438, train/loss_vlb_step=2.27e-5, train/loss_step=0.00438, global_step=3864.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  80%|███████▉  | 964/1208 [27:46<07:01,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00438, train/loss_vlb_step=2.27e-5, train/loss_step=0.00438, global_step=3864.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  80%|███████▉  | 964/1208 [27:46<07:01,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00139, train/loss_step=0.300, global_step=3864.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  80%|███████▉  | 965/1208 [27:48<07:00,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00139, train/loss_step=0.300, global_step=3864.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  80%|███████▉  | 965/1208 [27:48<07:00,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00916, train/loss_vlb_step=4.22e-5, train/loss_step=0.00916, global_step=3865.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  80%|███████▉  | 966/1208 [27:49<06:58,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00916, train/loss_vlb_step=4.22e-5, train/loss_step=0.00916, global_step=3865.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  80%|███████▉  | 966/1208 [27:49<06:58,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00125, train/loss_step=0.261, global_step=3865.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  80%|████████  | 967/1208 [27:50<06:56,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00125, train/loss_step=0.261, global_step=3865.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  80%|████████  | 967/1208 [27:50<06:56,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000725, train/loss_step=0.191, global_step=3865.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  80%|████████  | 968/1208 [27:53<06:54,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000725, train/loss_step=0.191, global_step=3865.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  80%|████████  | 968/1208 [27:53<06:54,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.028, train/loss_vlb_step=0.000112, train/loss_step=0.028, global_step=3865.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  80%|████████  | 969/1208 [27:54<06:53,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.028, train/loss_vlb_step=0.000112, train/loss_step=0.028, global_step=3865.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  80%|████████  | 969/1208 [27:54<06:53,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00768, train/loss_vlb_step=3.75e-5, train/loss_step=0.00768, global_step=3866.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  80%|████████  | 970/1208 [27:55<06:51,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00768, train/loss_vlb_step=3.75e-5, train/loss_step=0.00768, global_step=3866.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  80%|████████  | 970/1208 [27:55<06:51,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00328, train/loss_vlb_step=1.81e-5, train/loss_step=0.00328, global_step=3866.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  80%|████████  | 971/1208 [27:56<06:49,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00328, train/loss_vlb_step=1.81e-5, train/loss_step=0.00328, global_step=3866.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  80%|████████  | 971/1208 [27:56<06:49,  1.73s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.00567, train/loss_vlb_step=2.86e-5, train/loss_step=0.00567, global_step=3866.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  80%|████████  | 972/1208 [27:59<06:47,  1.73s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.00567, train/loss_vlb_step=2.86e-5, train/loss_step=0.00567, global_step=3866.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  80%|████████  | 972/1208 [27:59<06:47,  1.73s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.99e-5, train/loss_step=0.0104, global_step=3866.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  81%|████████  | 973/1208 [28:00<06:45,  1.73s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.99e-5, train/loss_step=0.0104, global_step=3866.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  81%|████████  | 973/1208 [28:00<06:45,  1.73s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.00459, train/loss_vlb_step=2.47e-5, train/loss_step=0.00459, global_step=3867.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  81%|████████  | 974/1208 [28:01<06:44,  1.73s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.00459, train/loss_vlb_step=2.47e-5, train/loss_step=0.00459, global_step=3867.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  81%|████████  | 974/1208 [28:01<06:44,  1.73s/it, loss=0.0959, v_num=0, train/loss_simple_step=0.0841, train/loss_vlb_step=0.000283, train/loss_step=0.0841, global_step=3867.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  81%|████████  | 975/1208 [28:02<06:42,  1.73s/it, loss=0.0959, v_num=0, train/loss_simple_step=0.0841, train/loss_vlb_step=0.000283, train/loss_step=0.0841, global_step=3867.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  81%|████████  | 975/1208 [28:02<06:42,  1.73s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.00585, train/loss_vlb_step=2.91e-5, train/loss_step=0.00585, global_step=3867.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  81%|████████  | 976/1208 [28:05<06:40,  1.73s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.00585, train/loss_vlb_step=2.91e-5, train/loss_step=0.00585, global_step=3867.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  81%|████████  | 976/1208 [28:05<06:40,  1.73s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000128, train/loss_step=0.0358, global_step=3867.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  81%|████████  | 977/1208 [28:06<06:38,  1.73s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000128, train/loss_step=0.0358, global_step=3867.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  81%|████████  | 977/1208 [28:06<06:38,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.596, train/loss_vlb_step=0.0129, train/loss_step=0.596, global_step=3868.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]     Epoch 12:  81%|████████  | 978/1208 [28:07<06:36,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.596, train/loss_vlb_step=0.0129, train/loss_step=0.596, global_step=3868.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  81%|████████  | 978/1208 [28:07<06:36,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.58e-5, train/loss_step=0.00274, global_step=3868.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  81%|████████  | 979/1208 [28:08<06:35,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.58e-5, train/loss_step=0.00274, global_step=3868.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  81%|████████  | 979/1208 [28:08<06:35,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00237, train/loss_step=0.373, global_step=3868.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  81%|████████  | 980/1208 [28:11<06:33,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00237, train/loss_step=0.373, global_step=3868.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  81%|████████  | 980/1208 [28:11<06:33,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0568, train/loss_vlb_step=0.000195, train/loss_step=0.0568, global_step=3868.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  81%|████████  | 981/1208 [28:12<06:31,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0568, train/loss_vlb_step=0.000195, train/loss_step=0.0568, global_step=3868.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  81%|████████  | 981/1208 [28:12<06:31,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=5.02e-5, train/loss_step=0.0107, global_step=3869.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  81%|████████▏ | 982/1208 [28:13<06:29,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=5.02e-5, train/loss_step=0.0107, global_step=3869.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  81%|████████▏ | 982/1208 [28:13<06:29,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000587, train/loss_step=0.169, global_step=3869.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  81%|████████▏ | 983/1208 [28:14<06:27,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000587, train/loss_step=0.169, global_step=3869.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  81%|████████▏ | 983/1208 [28:14<06:27,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.00115, train/loss_step=0.220, global_step=3869.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  81%|████████▏ | 984/1208 [28:17<06:26,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.00115, train/loss_step=0.220, global_step=3869.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  81%|████████▏ | 984/1208 [28:17<06:26,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0502, train/loss_vlb_step=0.000175, train/loss_step=0.0502, global_step=3869.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  82%|████████▏ | 985/1208 [28:18<06:24,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0502, train/loss_vlb_step=0.000175, train/loss_step=0.0502, global_step=3869.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  82%|████████▏ | 985/1208 [28:18<06:24,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000336, train/loss_step=0.101, global_step=3870.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  82%|████████▏ | 986/1208 [28:19<06:22,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000336, train/loss_step=0.101, global_step=3870.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  82%|████████▏ | 986/1208 [28:19<06:22,  1.72s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=8.28e-5, train/loss_step=0.0187, global_step=3870.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  82%|████████▏ | 987/1208 [28:20<06:20,  1.72s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=8.28e-5, train/loss_step=0.0187, global_step=3870.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  82%|████████▏ | 987/1208 [28:20<06:20,  1.72s/it, loss=0.0929, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000258, train/loss_step=0.0741, global_step=3870.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  82%|████████▏ | 988/1208 [28:23<06:19,  1.72s/it, loss=0.0929, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000258, train/loss_step=0.0741, global_step=3870.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  82%|████████▏ | 988/1208 [28:23<06:19,  1.72s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.0447, train/loss_vlb_step=0.000161, train/loss_step=0.0447, global_step=3870.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  82%|████████▏ | 989/1208 [28:24<06:17,  1.72s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.0447, train/loss_vlb_step=0.000161, train/loss_step=0.0447, global_step=3870.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  82%|████████▏ | 989/1208 [28:24<06:17,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000754, train/loss_step=0.213, global_step=3871.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  82%|████████▏ | 990/1208 [28:25<06:15,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000754, train/loss_step=0.213, global_step=3871.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  82%|████████▏ | 990/1208 [28:25<06:15,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.654, train/loss_vlb_step=0.0147, train/loss_step=0.654, global_step=3871.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  82%|████████▏ | 991/1208 [28:26<06:13,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.654, train/loss_vlb_step=0.0147, train/loss_step=0.654, global_step=3871.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  82%|████████▏ | 991/1208 [28:26<06:13,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00353, train/loss_step=0.425, global_step=3871.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  82%|████████▏ | 992/1208 [28:29<06:12,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00353, train/loss_step=0.425, global_step=3871.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  82%|████████▏ | 992/1208 [28:29<06:12,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00456, train/loss_vlb_step=2.37e-5, train/loss_step=0.00456, global_step=3871.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  82%|████████▏ | 993/1208 [28:30<06:10,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00456, train/loss_vlb_step=2.37e-5, train/loss_step=0.00456, global_step=3871.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  82%|████████▏ | 993/1208 [28:30<06:10,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0607, train/loss_vlb_step=0.00021, train/loss_step=0.0607, global_step=3872.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  82%|████████▏ | 994/1208 [28:31<06:08,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0607, train/loss_vlb_step=0.00021, train/loss_step=0.0607, global_step=3872.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  82%|████████▏ | 994/1208 [28:31<06:08,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0557, train/loss_vlb_step=0.000197, train/loss_step=0.0557, global_step=3872.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  82%|████████▏ | 995/1208 [28:32<06:06,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0557, train/loss_vlb_step=0.000197, train/loss_step=0.0557, global_step=3872.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  82%|████████▏ | 995/1208 [28:32<06:06,  1.72s/it, loss=0.194, v_num=0, train/loss_simple_step=0.710, train/loss_vlb_step=0.0308, train/loss_step=0.710, global_step=3872.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  82%|████████▏ | 996/1208 [28:35<06:05,  1.72s/it, loss=0.194, v_num=0, train/loss_simple_step=0.710, train/loss_vlb_step=0.0308, train/loss_step=0.710, global_step=3872.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  82%|████████▏ | 996/1208 [28:35<06:05,  1.72s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.18e-5, train/loss_step=0.00204, global_step=3872.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  83%|████████▎ | 997/1208 [28:36<06:03,  1.72s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.18e-5, train/loss_step=0.00204, global_step=3872.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  83%|████████▎ | 997/1208 [28:36<06:03,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.000154, train/loss_step=0.0401, global_step=3873.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  83%|████████▎ | 998/1208 [28:37<06:01,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.000154, train/loss_step=0.0401, global_step=3873.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  83%|████████▎ | 998/1208 [28:37<06:01,  1.72s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.34e-5, train/loss_step=0.0142, global_step=3873.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  83%|████████▎ | 999/1208 [28:38<05:59,  1.72s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.34e-5, train/loss_step=0.0142, global_step=3873.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  83%|████████▎ | 999/1208 [28:38<05:59,  1.72s/it, loss=0.187, v_num=0, train/loss_simple_step=0.822, train/loss_vlb_step=0.070, train/loss_step=0.822, global_step=3873.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  83%|████████▎ | 1000/1208 [28:41<05:58,  1.72s/it, loss=0.187, v_num=0, train/loss_simple_step=0.822, train/loss_vlb_step=0.070, train/loss_step=0.822, global_step=3873.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  83%|████████▎ | 1000/1208 [28:41<05:58,  1.72s/it, loss=0.197, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00115, train/loss_step=0.243, global_step=3873.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  83%|████████▎ | 1001/1208 [28:42<05:56,  1.72s/it, loss=0.197, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00115, train/loss_step=0.243, global_step=3873.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  83%|████████▎ | 1001/1208 [28:42<05:56,  1.72s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00701, train/loss_vlb_step=3.33e-5, train/loss_step=0.00701, global_step=3874.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  83%|████████▎ | 1002/1208 [28:43<05:54,  1.72s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00701, train/loss_vlb_step=3.33e-5, train/loss_step=0.00701, global_step=3874.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  83%|████████▎ | 1002/1208 [28:43<05:54,  1.72s/it, loss=0.196, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000543, train/loss_step=0.163, global_step=3874.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  83%|████████▎ | 1003/1208 [28:44<05:52,  1.72s/it, loss=0.196, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000543, train/loss_step=0.163, global_step=3874.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  83%|████████▎ | 1003/1208 [28:44<05:52,  1.72s/it, loss=0.194, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000598, train/loss_step=0.173, global_step=3874.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  83%|████████▎ | 1004/1208 [28:47<05:50,  1.72s/it, loss=0.194, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000598, train/loss_step=0.173, global_step=3874.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  83%|████████▎ | 1004/1208 [28:47<05:50,  1.72s/it, loss=0.21, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00227, train/loss_step=0.363, global_step=3874.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  83%|████████▎ | 1005/1208 [28:48<05:49,  1.72s/it, loss=0.21, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00227, train/loss_step=0.363, global_step=3874.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  83%|████████▎ | 1005/1208 [28:48<05:49,  1.72s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0048, train/loss_vlb_step=2.48e-5, train/loss_step=0.0048, global_step=3875.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  83%|████████▎ | 1006/1208 [28:49<05:47,  1.72s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0048, train/loss_vlb_step=2.48e-5, train/loss_step=0.0048, global_step=3875.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  83%|████████▎ | 1006/1208 [28:49<05:47,  1.72s/it, loss=0.211, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000489, train/loss_step=0.145, global_step=3875.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  83%|████████▎ | 1007/1208 [28:50<05:45,  1.72s/it, loss=0.211, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000489, train/loss_step=0.145, global_step=3875.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  83%|████████▎ | 1007/1208 [28:50<05:45,  1.72s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0541, train/loss_vlb_step=0.000191, train/loss_step=0.0541, global_step=3875.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  83%|████████▎ | 1008/1208 [28:53<05:43,  1.72s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0541, train/loss_vlb_step=0.000191, train/loss_step=0.0541, global_step=3875.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  83%|████████▎ | 1008/1208 [28:53<05:43,  1.72s/it, loss=0.209, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=8.02e-5, train/loss_step=0.0188, global_step=3875.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  84%|████████▎ | 1009/1208 [28:54<05:42,  1.72s/it, loss=0.209, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=8.02e-5, train/loss_step=0.0188, global_step=3875.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  84%|████████▎ | 1009/1208 [28:54<05:42,  1.72s/it, loss=0.233, v_num=0, train/loss_simple_step=0.704, train/loss_vlb_step=0.0718, train/loss_step=0.704, global_step=3876.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  84%|████████▎ | 1010/1208 [28:55<05:40,  1.72s/it, loss=0.233, v_num=0, train/loss_simple_step=0.704, train/loss_vlb_step=0.0718, train/loss_step=0.704, global_step=3876.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  84%|████████▎ | 1010/1208 [28:55<05:40,  1.72s/it, loss=0.211, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000692, train/loss_step=0.208, global_step=3876.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  84%|████████▎ | 1011/1208 [28:56<05:38,  1.72s/it, loss=0.211, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000692, train/loss_step=0.208, global_step=3876.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  84%|████████▎ | 1011/1208 [28:56<05:38,  1.72s/it, loss=0.201, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000844, train/loss_step=0.220, global_step=3876.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  84%|████████▍ | 1012/1208 [28:59<05:36,  1.72s/it, loss=0.201, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000844, train/loss_step=0.220, global_step=3876.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  84%|████████▍ | 1012/1208 [28:59<05:36,  1.72s/it, loss=0.233, v_num=0, train/loss_simple_step=0.654, train/loss_vlb_step=0.0159, train/loss_step=0.654, global_step=3876.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  84%|████████▍ | 1013/1208 [29:00<05:35,  1.72s/it, loss=0.233, v_num=0, train/loss_simple_step=0.654, train/loss_vlb_step=0.0159, train/loss_step=0.654, global_step=3876.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  84%|████████▍ | 1013/1208 [29:00<05:35,  1.72s/it, loss=0.237, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000445, train/loss_step=0.134, global_step=3877.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  84%|████████▍ | 1014/1208 [29:01<05:33,  1.72s/it, loss=0.237, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000445, train/loss_step=0.134, global_step=3877.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  84%|████████▍ | 1014/1208 [29:01<05:33,  1.72s/it, loss=0.234, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=1.36e-5, train/loss_step=0.00229, global_step=3877.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  84%|████████▍ | 1015/1208 [29:02<05:31,  1.72s/it, loss=0.234, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=1.36e-5, train/loss_step=0.00229, global_step=3877.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  84%|████████▍ | 1015/1208 [29:02<05:31,  1.72s/it, loss=0.206, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000526, train/loss_step=0.153, global_step=3877.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  84%|████████▍ | 1016/1208 [29:05<05:29,  1.72s/it, loss=0.206, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000526, train/loss_step=0.153, global_step=3877.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  84%|████████▍ | 1016/1208 [29:05<05:29,  1.72s/it, loss=0.215, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.00064, train/loss_step=0.179, global_step=3877.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  84%|████████▍ | 1017/1208 [29:06<05:27,  1.72s/it, loss=0.215, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.00064, train/loss_step=0.179, global_step=3877.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  84%|████████▍ | 1017/1208 [29:06<05:27,  1.72s/it, loss=0.234, v_num=0, train/loss_simple_step=0.416, train/loss_vlb_step=0.00364, train/loss_step=0.416, global_step=3878.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  84%|████████▍ | 1018/1208 [29:07<05:26,  1.72s/it, loss=0.234, v_num=0, train/loss_simple_step=0.416, train/loss_vlb_step=0.00364, train/loss_step=0.416, global_step=3878.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  84%|████████▍ | 1018/1208 [29:07<05:26,  1.72s/it, loss=0.234, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.92e-5, train/loss_step=0.0206, global_step=3878.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  84%|████████▍ | 1019/1208 [29:08<05:24,  1.72s/it, loss=0.234, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.92e-5, train/loss_step=0.0206, global_step=3878.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  84%|████████▍ | 1019/1208 [29:08<05:24,  1.72s/it, loss=0.203, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000691, train/loss_step=0.193, global_step=3878.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  84%|████████▍ | 1020/1208 [29:11<05:22,  1.72s/it, loss=0.203, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000691, train/loss_step=0.193, global_step=3878.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  84%|████████▍ | 1020/1208 [29:11<05:22,  1.72s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.59e-5, train/loss_step=0.0028, global_step=3878.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  85%|████████▍ | 1021/1208 [29:12<05:20,  1.72s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.59e-5, train/loss_step=0.0028, global_step=3878.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  85%|████████▍ | 1021/1208 [29:12<05:20,  1.72s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.78e-5, train/loss_step=0.0219, global_step=3879.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  85%|████████▍ | 1022/1208 [29:13<05:19,  1.72s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.78e-5, train/loss_step=0.0219, global_step=3879.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  85%|████████▍ | 1022/1208 [29:13<05:19,  1.72s/it, loss=0.192, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000598, train/loss_step=0.165, global_step=3879.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  85%|████████▍ | 1023/1208 [29:14<05:17,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000598, train/loss_step=0.165, global_step=3879.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  85%|████████▍ | 1023/1208 [29:14<05:17,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0099, train/loss_vlb_step=4.74e-5, train/loss_step=0.0099, global_step=3879.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  85%|████████▍ | 1024/1208 [29:17<05:15,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0099, train/loss_vlb_step=4.74e-5, train/loss_step=0.0099, global_step=3879.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  85%|████████▍ | 1024/1208 [29:17<05:15,  1.72s/it, loss=0.193, v_num=0, train/loss_simple_step=0.550, train/loss_vlb_step=0.0119, train/loss_step=0.550, global_step=3879.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  85%|████████▍ | 1025/1208 [29:18<05:13,  1.72s/it, loss=0.193, v_num=0, train/loss_simple_step=0.550, train/loss_vlb_step=0.0119, train/loss_step=0.550, global_step=3879.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  85%|████████▍ | 1025/1208 [29:18<05:13,  1.72s/it, loss=0.207, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00164, train/loss_step=0.298, global_step=3880.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  85%|████████▍ | 1026/1208 [29:19<05:12,  1.71s/it, loss=0.207, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00164, train/loss_step=0.298, global_step=3880.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  85%|████████▍ | 1026/1208 [29:19<05:12,  1.71s/it, loss=0.217, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00182, train/loss_step=0.342, global_step=3880.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  85%|████████▌ | 1027/1208 [29:20<05:10,  1.71s/it, loss=0.217, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00182, train/loss_step=0.342, global_step=3880.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  85%|████████▌ | 1027/1208 [29:20<05:10,  1.71s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0511, train/loss_vlb_step=0.00018, train/loss_step=0.0511, global_step=3880.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  85%|████████▌ | 1028/1208 [29:22<05:08,  1.71s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0511, train/loss_vlb_step=0.00018, train/loss_step=0.0511, global_step=3880.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  85%|████████▌ | 1028/1208 [29:22<05:08,  1.71s/it, loss=0.243, v_num=0, train/loss_simple_step=0.532, train/loss_vlb_step=0.0142, train/loss_step=0.532, global_step=3880.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  85%|████████▌ | 1029/1208 [29:23<05:06,  1.71s/it, loss=0.243, v_num=0, train/loss_simple_step=0.532, train/loss_vlb_step=0.0142, train/loss_step=0.532, global_step=3880.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  85%|████████▌ | 1029/1208 [29:24<05:06,  1.71s/it, loss=0.208, v_num=0, train/loss_simple_step=0.00467, train/loss_vlb_step=2.42e-5, train/loss_step=0.00467, global_step=3881.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  85%|████████▌ | 1030/1208 [29:25<05:05,  1.71s/it, loss=0.208, v_num=0, train/loss_simple_step=0.00467, train/loss_vlb_step=2.42e-5, train/loss_step=0.00467, global_step=3881.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  85%|████████▌ | 1030/1208 [29:25<05:05,  1.71s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.000158, train/loss_step=0.0441, global_step=3881.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  85%|████████▌ | 1031/1208 [29:26<05:03,  1.71s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.000158, train/loss_step=0.0441, global_step=3881.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  85%|████████▌ | 1031/1208 [29:26<05:03,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.000108, train/loss_step=0.0276, global_step=3881.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  85%|████████▌ | 1032/1208 [29:28<05:01,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.000108, train/loss_step=0.0276, global_step=3881.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  85%|████████▌ | 1032/1208 [29:28<05:01,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.78e-5, train/loss_step=0.0208, global_step=3881.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  86%|████████▌ | 1033/1208 [29:29<04:59,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.78e-5, train/loss_step=0.0208, global_step=3881.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  86%|████████▌ | 1033/1208 [29:29<04:59,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.00459, train/loss_step=0.512, global_step=3882.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  86%|████████▌ | 1034/1208 [29:30<04:58,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.00459, train/loss_step=0.512, global_step=3882.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  86%|████████▌ | 1034/1208 [29:30<04:58,  1.71s/it, loss=0.194, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00158, train/loss_step=0.334, global_step=3882.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  86%|████████▌ | 1035/1208 [29:31<04:56,  1.71s/it, loss=0.194, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00158, train/loss_step=0.334, global_step=3882.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  86%|████████▌ | 1035/1208 [29:31<04:56,  1.71s/it, loss=0.201, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00145, train/loss_step=0.291, global_step=3882.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  86%|████████▌ | 1036/1208 [29:34<04:54,  1.71s/it, loss=0.201, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00145, train/loss_step=0.291, global_step=3882.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  86%|████████▌ | 1036/1208 [29:34<04:54,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0098, train/loss_vlb_step=4.67e-5, train/loss_step=0.0098, global_step=3882.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  86%|████████▌ | 1037/1208 [29:35<04:52,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0098, train/loss_vlb_step=4.67e-5, train/loss_step=0.0098, global_step=3882.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  86%|████████▌ | 1037/1208 [29:35<04:52,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=2.25e-5, train/loss_step=0.00413, global_step=3883.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  86%|████████▌ | 1038/1208 [29:36<04:51,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=2.25e-5, train/loss_step=0.00413, global_step=3883.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  86%|████████▌ | 1038/1208 [29:36<04:51,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.000146, train/loss_step=0.038, global_step=3883.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  86%|████████▌ | 1039/1208 [29:37<04:49,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.000146, train/loss_step=0.038, global_step=3883.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  86%|████████▌ | 1039/1208 [29:37<04:49,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00194, train/loss_step=0.344, global_step=3883.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  86%|████████▌ | 1040/1208 [29:40<04:47,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00194, train/loss_step=0.344, global_step=3883.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  86%|████████▌ | 1040/1208 [29:40<04:47,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.72e-5, train/loss_step=0.0102, global_step=3883.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  86%|████████▌ | 1041/1208 [29:41<04:45,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.72e-5, train/loss_step=0.0102, global_step=3883.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  86%|████████▌ | 1041/1208 [29:41<04:45,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000455, train/loss_step=0.139, global_step=3884.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  86%|████████▋ | 1042/1208 [29:42<04:44,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000455, train/loss_step=0.139, global_step=3884.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  86%|████████▋ | 1042/1208 [29:42<04:44,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=2.45e-5, train/loss_step=0.00448, global_step=3884.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  86%|████████▋ | 1043/1208 [29:43<04:42,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=2.45e-5, train/loss_step=0.00448, global_step=3884.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  86%|████████▋ | 1043/1208 [29:43<04:42,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=1.67e-5, train/loss_step=0.00294, global_step=3884.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  86%|████████▋ | 1044/1208 [29:46<04:40,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=1.67e-5, train/loss_step=0.00294, global_step=3884.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  86%|████████▋ | 1044/1208 [29:46<04:40,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00362, train/loss_step=0.423, global_step=3884.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  87%|████████▋ | 1045/1208 [29:47<04:38,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00362, train/loss_step=0.423, global_step=3884.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  87%|████████▋ | 1045/1208 [29:47<04:38,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.514, train/loss_vlb_step=0.010, train/loss_step=0.514, global_step=3885.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  87%|████████▋ | 1046/1208 [29:48<04:37,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.514, train/loss_vlb_step=0.010, train/loss_step=0.514, global_step=3885.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  87%|████████▋ | 1046/1208 [29:48<04:37,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000647, train/loss_step=0.175, global_step=3885.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  87%|████████▋ | 1047/1208 [29:49<04:35,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000647, train/loss_step=0.175, global_step=3885.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  87%|████████▋ | 1047/1208 [29:49<04:35,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000126, train/loss_step=0.0334, global_step=3885.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  87%|████████▋ | 1048/1208 [29:52<04:33,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000126, train/loss_step=0.0334, global_step=3885.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  87%|████████▋ | 1048/1208 [29:52<04:33,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00123, train/loss_step=0.272, global_step=3885.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  87%|████████▋ | 1049/1208 [29:53<04:31,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00123, train/loss_step=0.272, global_step=3885.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  87%|████████▋ | 1049/1208 [29:53<04:31,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.48e-5, train/loss_step=0.00278, global_step=3886.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  87%|████████▋ | 1050/1208 [29:54<04:30,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.48e-5, train/loss_step=0.00278, global_step=3886.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  87%|████████▋ | 1050/1208 [29:54<04:30,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00143, train/loss_step=0.291, global_step=3886.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  87%|████████▋ | 1051/1208 [29:55<04:28,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00143, train/loss_step=0.291, global_step=3886.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  87%|████████▋ | 1051/1208 [29:55<04:28,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=7.09e-5, train/loss_step=0.0159, global_step=3886.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  87%|████████▋ | 1052/1208 [29:58<04:26,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=7.09e-5, train/loss_step=0.0159, global_step=3886.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  87%|████████▋ | 1052/1208 [29:58<04:26,  1.71s/it, loss=0.207, v_num=0, train/loss_simple_step=0.724, train/loss_vlb_step=0.0137, train/loss_step=0.724, global_step=3886.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  87%|████████▋ | 1053/1208 [29:59<04:24,  1.71s/it, loss=0.207, v_num=0, train/loss_simple_step=0.724, train/loss_vlb_step=0.0137, train/loss_step=0.724, global_step=3886.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  87%|████████▋ | 1053/1208 [29:59<04:24,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00732, train/loss_vlb_step=3.42e-5, train/loss_step=0.00732, global_step=3887.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  87%|████████▋ | 1054/1208 [30:00<04:23,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00732, train/loss_vlb_step=3.42e-5, train/loss_step=0.00732, global_step=3887.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  87%|████████▋ | 1054/1208 [30:00<04:23,  1.71s/it, loss=0.198, v_num=0, train/loss_simple_step=0.660, train/loss_vlb_step=0.0194, train/loss_step=0.660, global_step=3887.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]     Epoch 12:  87%|████████▋ | 1055/1208 [30:01<04:21,  1.71s/it, loss=0.198, v_num=0, train/loss_simple_step=0.660, train/loss_vlb_step=0.0194, train/loss_step=0.660, global_step=3887.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  87%|████████▋ | 1055/1208 [30:01<04:21,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000448, train/loss_step=0.136, global_step=3887.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  87%|████████▋ | 1056/1208 [30:04<04:19,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000448, train/loss_step=0.136, global_step=3887.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  87%|████████▋ | 1056/1208 [30:04<04:19,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.31e-5, train/loss_step=0.011, global_step=3887.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  88%|████████▊ | 1057/1208 [30:05<04:17,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.31e-5, train/loss_step=0.011, global_step=3887.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  88%|████████▊ | 1057/1208 [30:05<04:17,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.000144, train/loss_step=0.0403, global_step=3888.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  88%|████████▊ | 1058/1208 [30:06<04:16,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.000144, train/loss_step=0.0403, global_step=3888.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  88%|████████▊ | 1058/1208 [30:06<04:16,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=3888.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  88%|████████▊ | 1059/1208 [30:07<04:14,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=3888.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  88%|████████▊ | 1059/1208 [30:07<04:14,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.3e-5, train/loss_step=0.0227, global_step=3888.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  88%|████████▊ | 1060/1208 [30:10<04:12,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.3e-5, train/loss_step=0.0227, global_step=3888.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  88%|████████▊ | 1060/1208 [30:10<04:12,  1.71s/it, loss=0.196, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00165, train/loss_step=0.340, global_step=3888.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  88%|████████▊ | 1061/1208 [30:11<04:10,  1.71s/it, loss=0.196, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00165, train/loss_step=0.340, global_step=3888.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  88%|████████▊ | 1061/1208 [30:11<04:10,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0683, train/loss_vlb_step=0.000226, train/loss_step=0.0683, global_step=3889.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  88%|████████▊ | 1062/1208 [30:12<04:09,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0683, train/loss_vlb_step=0.000226, train/loss_step=0.0683, global_step=3889.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  88%|████████▊ | 1062/1208 [30:12<04:09,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.13e-5, train/loss_step=0.00186, global_step=3889.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  88%|████████▊ | 1063/1208 [30:13<04:07,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.13e-5, train/loss_step=0.00186, global_step=3889.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  88%|████████▊ | 1063/1208 [30:13<04:07,  1.71s/it, loss=0.199, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000492, train/loss_step=0.147, global_step=3889.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  88%|████████▊ | 1064/1208 [30:16<04:05,  1.71s/it, loss=0.199, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000492, train/loss_step=0.147, global_step=3889.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  88%|████████▊ | 1064/1208 [30:16<04:05,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000296, train/loss_step=0.0901, global_step=3889.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  88%|████████▊ | 1065/1208 [30:17<04:04,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000296, train/loss_step=0.0901, global_step=3889.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  88%|████████▊ | 1065/1208 [30:17<04:04,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=3890.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  88%|████████▊ | 1066/1208 [30:18<04:02,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=3890.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  88%|████████▊ | 1066/1208 [30:18<04:02,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000718, train/loss_step=0.193, global_step=3890.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  88%|████████▊ | 1067/1208 [30:19<04:00,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000718, train/loss_step=0.193, global_step=3890.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  88%|████████▊ | 1067/1208 [30:19<04:00,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.74e-5, train/loss_step=0.0147, global_step=3890.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  88%|████████▊ | 1068/1208 [30:22<03:58,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.74e-5, train/loss_step=0.0147, global_step=3890.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  88%|████████▊ | 1068/1208 [30:22<03:58,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00864, train/loss_vlb_step=4.1e-5, train/loss_step=0.00864, global_step=3890.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  88%|████████▊ | 1069/1208 [30:23<03:57,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00864, train/loss_vlb_step=4.1e-5, train/loss_step=0.00864, global_step=3890.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  88%|████████▊ | 1069/1208 [30:23<03:57,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.42e-5, train/loss_step=0.00246, global_step=3891.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  89%|████████▊ | 1070/1208 [30:24<03:55,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.42e-5, train/loss_step=0.00246, global_step=3891.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  89%|████████▊ | 1070/1208 [30:24<03:55,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000734, train/loss_step=0.205, global_step=3891.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  89%|████████▊ | 1071/1208 [30:25<03:53,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000734, train/loss_step=0.205, global_step=3891.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  89%|████████▊ | 1071/1208 [30:25<03:53,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00388, train/loss_step=0.458, global_step=3891.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  89%|████████▊ | 1072/1208 [30:28<03:51,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00388, train/loss_step=0.458, global_step=3891.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  89%|████████▊ | 1072/1208 [30:28<03:51,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.00012, train/loss_step=0.0312, global_step=3891.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  89%|████████▉ | 1073/1208 [30:29<03:50,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.00012, train/loss_step=0.0312, global_step=3891.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  89%|████████▉ | 1073/1208 [30:29<03:50,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=9.86e-6, train/loss_step=0.00162, global_step=3892.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  89%|████████▉ | 1074/1208 [30:30<03:48,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=9.86e-6, train/loss_step=0.00162, global_step=3892.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  89%|████████▉ | 1074/1208 [30:30<03:48,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.000215, train/loss_step=0.062, global_step=3892.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  89%|████████▉ | 1075/1208 [30:31<03:46,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.000215, train/loss_step=0.062, global_step=3892.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  89%|████████▉ | 1075/1208 [30:31<03:46,  1.70s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=7.94e-5, train/loss_step=0.0192, global_step=3892.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  89%|████████▉ | 1076/1208 [30:34<03:44,  1.70s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=7.94e-5, train/loss_step=0.0192, global_step=3892.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  89%|████████▉ | 1076/1208 [30:34<03:44,  1.70s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=2.16e-5, train/loss_step=0.00402, global_step=3892.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  89%|████████▉ | 1077/1208 [30:35<03:43,  1.70s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=2.16e-5, train/loss_step=0.00402, global_step=3892.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  89%|████████▉ | 1077/1208 [30:35<03:43,  1.70s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.05e-5, train/loss_step=0.0145, global_step=3893.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  89%|████████▉ | 1078/1208 [30:36<03:41,  1.70s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.05e-5, train/loss_step=0.0145, global_step=3893.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  89%|████████▉ | 1078/1208 [30:36<03:41,  1.70s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=5.01e-5, train/loss_step=0.0103, global_step=3893.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  89%|████████▉ | 1079/1208 [30:37<03:39,  1.70s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=5.01e-5, train/loss_step=0.0103, global_step=3893.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  89%|████████▉ | 1079/1208 [30:37<03:39,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.563, train/loss_vlb_step=0.015, train/loss_step=0.563, global_step=3893.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]     Epoch 12:  89%|████████▉ | 1080/1208 [30:39<03:38,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.563, train/loss_vlb_step=0.015, train/loss_step=0.563, global_step=3893.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  89%|████████▉ | 1080/1208 [30:39<03:38,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.61e-5, train/loss_step=0.00284, global_step=3893.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  89%|████████▉ | 1081/1208 [30:40<03:36,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.61e-5, train/loss_step=0.00284, global_step=3893.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  89%|████████▉ | 1081/1208 [30:40<03:36,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00142, train/loss_step=0.285, global_step=3894.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  90%|████████▉ | 1082/1208 [30:41<03:34,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00142, train/loss_step=0.285, global_step=3894.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  90%|████████▉ | 1082/1208 [30:41<03:34,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00707, train/loss_vlb_step=3.63e-5, train/loss_step=0.00707, global_step=3894.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  90%|████████▉ | 1083/1208 [30:42<03:32,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00707, train/loss_vlb_step=3.63e-5, train/loss_step=0.00707, global_step=3894.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  90%|████████▉ | 1083/1208 [30:42<03:32,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00678, train/loss_vlb_step=3.32e-5, train/loss_step=0.00678, global_step=3894.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  90%|████████▉ | 1084/1208 [30:45<03:31,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00678, train/loss_vlb_step=3.32e-5, train/loss_step=0.00678, global_step=3894.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  90%|████████▉ | 1084/1208 [30:45<03:31,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00716, train/loss_vlb_step=3.59e-5, train/loss_step=0.00716, global_step=3894.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  90%|████████▉ | 1085/1208 [30:46<03:29,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00716, train/loss_vlb_step=3.59e-5, train/loss_step=0.00716, global_step=3894.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  90%|████████▉ | 1085/1208 [30:46<03:29,  1.70s/it, loss=0.107, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.000985, train/loss_step=0.253, global_step=3895.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  90%|████████▉ | 1086/1208 [30:47<03:27,  1.70s/it, loss=0.107, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.000985, train/loss_step=0.253, global_step=3895.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  90%|████████▉ | 1086/1208 [30:47<03:27,  1.70s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.00641, train/loss_vlb_step=3.16e-5, train/loss_step=0.00641, global_step=3895.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  90%|████████▉ | 1087/1208 [30:48<03:25,  1.70s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.00641, train/loss_vlb_step=3.16e-5, train/loss_step=0.00641, global_step=3895.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  90%|████████▉ | 1087/1208 [30:48<03:25,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.00224, train/loss_step=0.360, global_step=3895.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]     Epoch 12:  90%|█████████ | 1088/1208 [30:51<03:24,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.00224, train/loss_step=0.360, global_step=3895.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  90%|█████████ | 1088/1208 [30:51<03:24,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.00244, train/loss_step=0.400, global_step=3895.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  90%|█████████ | 1089/1208 [30:52<03:22,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.00244, train/loss_step=0.400, global_step=3895.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  90%|█████████ | 1089/1208 [30:52<03:22,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.000111, train/loss_step=0.0285, global_step=3896.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  90%|█████████ | 1090/1208 [30:53<03:20,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.000111, train/loss_step=0.0285, global_step=3896.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  90%|█████████ | 1090/1208 [30:53<03:20,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000602, train/loss_step=0.170, global_step=3896.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  90%|█████████ | 1091/1208 [30:54<03:18,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000602, train/loss_step=0.170, global_step=3896.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  90%|█████████ | 1091/1208 [30:54<03:18,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00165, train/loss_step=0.285, global_step=3896.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  90%|█████████ | 1092/1208 [30:57<03:17,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00165, train/loss_step=0.285, global_step=3896.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  90%|█████████ | 1092/1208 [30:57<03:17,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.00034, train/loss_step=0.103, global_step=3896.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  90%|█████████ | 1093/1208 [30:58<03:15,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.00034, train/loss_step=0.103, global_step=3896.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  90%|█████████ | 1093/1208 [30:58<03:15,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000751, train/loss_step=0.200, global_step=3897.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  91%|█████████ | 1094/1208 [30:59<03:13,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000751, train/loss_step=0.200, global_step=3897.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  91%|█████████ | 1094/1208 [30:59<03:13,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00114, train/loss_step=0.266, global_step=3897.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  91%|█████████ | 1095/1208 [31:00<03:12,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00114, train/loss_step=0.266, global_step=3897.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  91%|█████████ | 1095/1208 [31:00<03:12,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00713, train/loss_vlb_step=3.44e-5, train/loss_step=0.00713, global_step=3897.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  91%|█████████ | 1096/1208 [31:03<03:10,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00713, train/loss_vlb_step=3.44e-5, train/loss_step=0.00713, global_step=3897.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  91%|█████████ | 1096/1208 [31:03<03:10,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.438, train/loss_vlb_step=0.00569, train/loss_step=0.438, global_step=3897.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  91%|█████████ | 1097/1208 [31:04<03:08,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.438, train/loss_vlb_step=0.00569, train/loss_step=0.438, global_step=3897.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  91%|█████████ | 1097/1208 [31:04<03:08,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.56e-5, train/loss_step=0.0236, global_step=3898.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  91%|█████████ | 1098/1208 [31:05<03:06,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.56e-5, train/loss_step=0.0236, global_step=3898.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  91%|█████████ | 1098/1208 [31:05<03:06,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00445, train/loss_vlb_step=2.36e-5, train/loss_step=0.00445, global_step=3898.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  91%|█████████ | 1099/1208 [31:06<03:05,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00445, train/loss_vlb_step=2.36e-5, train/loss_step=0.00445, global_step=3898.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  91%|█████████ | 1099/1208 [31:06<03:05,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.21e-5, train/loss_step=0.0142, global_step=3898.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  91%|█████████ | 1100/1208 [31:10<03:03,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.21e-5, train/loss_step=0.0142, global_step=3898.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  91%|█████████ | 1100/1208 [31:10<03:03,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.482, train/loss_vlb_step=0.00571, train/loss_step=0.482, global_step=3898.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  91%|█████████ | 1101/1208 [31:11<03:01,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.482, train/loss_vlb_step=0.00571, train/loss_step=0.482, global_step=3898.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  91%|█████████ | 1101/1208 [31:11<03:01,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0523, train/loss_vlb_step=0.000186, train/loss_step=0.0523, global_step=3899.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  91%|█████████ | 1102/1208 [31:12<03:00,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0523, train/loss_vlb_step=0.000186, train/loss_step=0.0523, global_step=3899.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  91%|█████████ | 1102/1208 [31:12<03:00,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.33e-5, train/loss_step=0.0117, global_step=3899.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  91%|█████████▏| 1103/1208 [31:13<02:58,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.33e-5, train/loss_step=0.0117, global_step=3899.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  91%|█████████▏| 1103/1208 [31:13<02:58,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.0014, train/loss_step=0.343, global_step=3899.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  91%|█████████▏| 1104/1208 [31:16<02:56,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.0014, train/loss_step=0.343, global_step=3899.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  91%|█████████▏| 1104/1208 [31:16<02:56,  1.70s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.000155, train/loss_step=0.0425, global_step=3899.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  91%|█████████▏| 1105/1208 [31:17<02:55,  1.70s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.000155, train/loss_step=0.0425, global_step=3899.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  91%|█████████▏| 1105/1208 [31:17<02:55,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000361, train/loss_step=0.109, global_step=3900.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  92%|█████████▏| 1106/1208 [31:18<02:53,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000361, train/loss_step=0.109, global_step=3900.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  92%|█████████▏| 1106/1208 [31:18<02:53,  1.70s/it, loss=0.18, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00137, train/loss_step=0.266, global_step=3900.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  92%|█████████▏| 1107/1208 [31:19<02:51,  1.70s/it, loss=0.18, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00137, train/loss_step=0.266, global_step=3900.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  92%|█████████▏| 1107/1208 [31:19<02:51,  1.70s/it, loss=0.192, v_num=0, train/loss_simple_step=0.583, train/loss_vlb_step=0.00905, train/loss_step=0.583, global_step=3900.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  92%|█████████▏| 1108/1208 [31:22<02:49,  1.70s/it, loss=0.192, v_num=0, train/loss_simple_step=0.583, train/loss_vlb_step=0.00905, train/loss_step=0.583, global_step=3900.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  92%|█████████▏| 1108/1208 [31:22<02:49,  1.70s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0837, train/loss_vlb_step=0.000279, train/loss_step=0.0837, global_step=3900.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  92%|█████████▏| 1109/1208 [31:24<02:48,  1.70s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0837, train/loss_vlb_step=0.000279, train/loss_step=0.0837, global_step=3900.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  92%|█████████▏| 1109/1208 [31:24<02:48,  1.70s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=2e-5, train/loss_step=0.00361, global_step=3901.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  92%|█████████▏| 1110/1208 [31:25<02:46,  1.70s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=2e-5, train/loss_step=0.00361, global_step=3901.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  92%|█████████▏| 1110/1208 [31:25<02:46,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.58e-5, train/loss_step=0.00277, global_step=3901.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  92%|█████████▏| 1111/1208 [31:26<02:44,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.58e-5, train/loss_step=0.00277, global_step=3901.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  92%|█████████▏| 1111/1208 [31:26<02:44,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00797, train/loss_vlb_step=3.8e-5, train/loss_step=0.00797, global_step=3901.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  92%|█████████▏| 1112/1208 [31:29<02:43,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00797, train/loss_vlb_step=3.8e-5, train/loss_step=0.00797, global_step=3901.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  92%|█████████▏| 1112/1208 [31:29<02:43,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.000186, train/loss_step=0.0543, global_step=3901.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  92%|█████████▏| 1113/1208 [31:30<02:41,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.000186, train/loss_step=0.0543, global_step=3901.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  92%|█████████▏| 1113/1208 [31:30<02:41,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000109, train/loss_step=0.0286, global_step=3902.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  92%|█████████▏| 1114/1208 [31:31<02:39,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000109, train/loss_step=0.0286, global_step=3902.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  92%|█████████▏| 1114/1208 [31:31<02:39,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00201, train/loss_step=0.339, global_step=3902.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  92%|█████████▏| 1115/1208 [31:32<02:37,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00201, train/loss_step=0.339, global_step=3902.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  92%|█████████▏| 1115/1208 [31:32<02:37,  1.70s/it, loss=0.155, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000823, train/loss_step=0.214, global_step=3902.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  92%|█████████▏| 1116/1208 [31:35<02:36,  1.70s/it, loss=0.155, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000823, train/loss_step=0.214, global_step=3902.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  92%|█████████▏| 1116/1208 [31:35<02:36,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00547, train/loss_vlb_step=2.98e-5, train/loss_step=0.00547, global_step=3902.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  92%|█████████▏| 1117/1208 [31:36<02:34,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00547, train/loss_vlb_step=2.98e-5, train/loss_step=0.00547, global_step=3902.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  92%|█████████▏| 1117/1208 [31:36<02:34,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00182, train/loss_step=0.324, global_step=3903.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  93%|█████████▎| 1118/1208 [31:37<02:32,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00182, train/loss_step=0.324, global_step=3903.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  93%|█████████▎| 1118/1208 [31:37<02:32,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00127, train/loss_step=0.280, global_step=3903.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  93%|█████████▎| 1119/1208 [31:38<02:31,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00127, train/loss_step=0.280, global_step=3903.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  93%|█████████▎| 1119/1208 [31:38<02:31,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.56e-5, train/loss_step=0.0207, global_step=3903.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  93%|█████████▎| 1120/1208 [31:42<02:29,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.56e-5, train/loss_step=0.0207, global_step=3903.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  93%|█████████▎| 1120/1208 [31:42<02:29,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00314, train/loss_vlb_step=1.78e-5, train/loss_step=0.00314, global_step=3903.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  93%|█████████▎| 1121/1208 [31:43<02:27,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00314, train/loss_vlb_step=1.78e-5, train/loss_step=0.00314, global_step=3903.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  93%|█████████▎| 1121/1208 [31:43<02:27,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000167, train/loss_step=0.0454, global_step=3904.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  93%|█████████▎| 1122/1208 [31:44<02:25,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000167, train/loss_step=0.0454, global_step=3904.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  93%|█████████▎| 1122/1208 [31:44<02:25,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00494, train/loss_vlb_step=2.61e-5, train/loss_step=0.00494, global_step=3904.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  93%|█████████▎| 1123/1208 [31:45<02:24,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00494, train/loss_vlb_step=2.61e-5, train/loss_step=0.00494, global_step=3904.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  93%|█████████▎| 1123/1208 [31:45<02:24,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.58e-5, train/loss_step=0.00282, global_step=3904.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  93%|█████████▎| 1124/1208 [31:48<02:22,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.58e-5, train/loss_step=0.00282, global_step=3904.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  93%|█████████▎| 1124/1208 [31:48<02:22,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0553, train/loss_vlb_step=0.000199, train/loss_step=0.0553, global_step=3904.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  93%|█████████▎| 1125/1208 [31:49<02:20,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0553, train/loss_vlb_step=0.000199, train/loss_step=0.0553, global_step=3904.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  93%|█████████▎| 1125/1208 [31:49<02:20,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000329, train/loss_step=0.100, global_step=3905.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  93%|█████████▎| 1126/1208 [31:50<02:19,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000329, train/loss_step=0.100, global_step=3905.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  93%|█████████▎| 1126/1208 [31:50<02:19,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000109, train/loss_step=0.0281, global_step=3905.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  93%|█████████▎| 1127/1208 [31:51<02:17,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000109, train/loss_step=0.0281, global_step=3905.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  93%|█████████▎| 1127/1208 [31:51<02:17,  1.70s/it, loss=0.0874, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.00048, train/loss_step=0.145, global_step=3905.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  93%|█████████▎| 1128/1208 [31:55<02:15,  1.70s/it, loss=0.0874, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.00048, train/loss_step=0.145, global_step=3905.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  93%|█████████▎| 1128/1208 [31:55<02:15,  1.70s/it, loss=0.0834, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.59e-5, train/loss_step=0.00282, global_step=3905.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  93%|█████████▎| 1129/1208 [31:56<02:14,  1.70s/it, loss=0.0834, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.59e-5, train/loss_step=0.00282, global_step=3905.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  93%|█████████▎| 1129/1208 [31:56<02:14,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.387, train/loss_vlb_step=0.00493, train/loss_step=0.387, global_step=3906.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]     Epoch 12:  94%|█████████▎| 1130/1208 [31:57<02:12,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.387, train/loss_vlb_step=0.00493, train/loss_step=0.387, global_step=3906.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  94%|█████████▎| 1130/1208 [31:57<02:12,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.67e-5, train/loss_step=0.0153, global_step=3906.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  94%|█████████▎| 1131/1208 [31:58<02:10,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.67e-5, train/loss_step=0.0153, global_step=3906.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  94%|█████████▎| 1131/1208 [31:58<02:10,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00279, train/loss_step=0.391, global_step=3906.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  94%|█████████▎| 1132/1208 [32:01<02:08,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00279, train/loss_step=0.391, global_step=3906.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  94%|█████████▎| 1132/1208 [32:01<02:08,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000584, train/loss_step=0.168, global_step=3906.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  94%|█████████▍| 1133/1208 [32:02<02:07,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000584, train/loss_step=0.168, global_step=3906.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  94%|█████████▍| 1133/1208 [32:02<02:07,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.14e-5, train/loss_step=0.00192, global_step=3907.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  94%|█████████▍| 1134/1208 [32:03<02:05,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.14e-5, train/loss_step=0.00192, global_step=3907.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  94%|█████████▍| 1134/1208 [32:03<02:05,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.39e-5, train/loss_step=0.0233, global_step=3907.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  94%|█████████▍| 1135/1208 [32:04<02:03,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.39e-5, train/loss_step=0.0233, global_step=3907.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  94%|█████████▍| 1135/1208 [32:04<02:03,  1.70s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.85e-5, train/loss_step=0.0033, global_step=3907.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  94%|█████████▍| 1136/1208 [32:07<02:02,  1.70s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.85e-5, train/loss_step=0.0033, global_step=3907.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  94%|█████████▍| 1136/1208 [32:07<02:02,  1.70s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00404, train/loss_vlb_step=2.21e-5, train/loss_step=0.00404, global_step=3907.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  94%|█████████▍| 1137/1208 [32:08<02:00,  1.70s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00404, train/loss_vlb_step=2.21e-5, train/loss_step=0.00404, global_step=3907.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  94%|█████████▍| 1137/1208 [32:08<02:00,  1.70s/it, loss=0.0844, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=2.86e-5, train/loss_step=0.00572, global_step=3908.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  94%|█████████▍| 1138/1208 [32:09<01:58,  1.70s/it, loss=0.0844, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=2.86e-5, train/loss_step=0.00572, global_step=3908.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  94%|█████████▍| 1138/1208 [32:09<01:58,  1.70s/it, loss=0.0729, v_num=0, train/loss_simple_step=0.0495, train/loss_vlb_step=0.000184, train/loss_step=0.0495, global_step=3908.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  94%|█████████▍| 1139/1208 [32:10<01:56,  1.70s/it, loss=0.0729, v_num=0, train/loss_simple_step=0.0495, train/loss_vlb_step=0.000184, train/loss_step=0.0495, global_step=3908.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  94%|█████████▍| 1139/1208 [32:10<01:56,  1.70s/it, loss=0.0789, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000463, train/loss_step=0.141, global_step=3908.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  94%|█████████▍| 1140/1208 [32:14<01:55,  1.70s/it, loss=0.0789, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000463, train/loss_step=0.141, global_step=3908.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  94%|█████████▍| 1140/1208 [32:14<01:55,  1.70s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.00171, train/loss_step=0.382, global_step=3908.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  94%|█████████▍| 1141/1208 [32:15<01:53,  1.70s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.00171, train/loss_step=0.382, global_step=3908.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  94%|█████████▍| 1141/1208 [32:15<01:53,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=3909.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  95%|█████████▍| 1142/1208 [32:16<01:51,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=3909.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  95%|█████████▍| 1142/1208 [32:16<01:51,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00157, train/loss_step=0.306, global_step=3909.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  95%|█████████▍| 1143/1208 [32:17<01:50,  1.69s/it, loss=0.116, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00157, train/loss_step=0.306, global_step=3909.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  95%|█████████▍| 1143/1208 [32:17<01:50,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000525, train/loss_step=0.155, global_step=3909.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  95%|█████████▍| 1144/1208 [32:20<01:48,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000525, train/loss_step=0.155, global_step=3909.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  95%|█████████▍| 1144/1208 [32:20<01:48,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000455, train/loss_step=0.138, global_step=3909.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  95%|█████████▍| 1145/1208 [32:21<01:46,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000455, train/loss_step=0.138, global_step=3909.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  95%|█████████▍| 1145/1208 [32:21<01:46,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.673, train/loss_vlb_step=0.0432, train/loss_step=0.673, global_step=3910.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  95%|█████████▍| 1146/1208 [32:22<01:45,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.673, train/loss_vlb_step=0.0432, train/loss_step=0.673, global_step=3910.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  95%|█████████▍| 1146/1208 [32:22<01:45,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0736, train/loss_vlb_step=0.000245, train/loss_step=0.0736, global_step=3910.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  95%|█████████▍| 1147/1208 [32:23<01:43,  1.69s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0736, train/loss_vlb_step=0.000245, train/loss_step=0.0736, global_step=3910.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  95%|█████████▍| 1147/1208 [32:23<01:43,  1.69s/it, loss=0.17, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00254, train/loss_step=0.386, global_step=3910.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  95%|█████████▌| 1148/1208 [32:27<01:41,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00254, train/loss_step=0.386, global_step=3910.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  95%|█████████▌| 1148/1208 [32:27<01:41,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000799, train/loss_step=0.215, global_step=3910.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  95%|█████████▌| 1149/1208 [32:28<01:40,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000799, train/loss_step=0.215, global_step=3910.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  95%|█████████▌| 1149/1208 [32:28<01:40,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0491, train/loss_vlb_step=0.000179, train/loss_step=0.0491, global_step=3911.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  95%|█████████▌| 1150/1208 [32:29<01:38,  1.69s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0491, train/loss_vlb_step=0.000179, train/loss_step=0.0491, global_step=3911.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  95%|█████████▌| 1150/1208 [32:29<01:38,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0683, train/loss_vlb_step=0.000232, train/loss_step=0.0683, global_step=3911.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  95%|█████████▌| 1151/1208 [32:30<01:36,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0683, train/loss_vlb_step=0.000232, train/loss_step=0.0683, global_step=3911.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  95%|█████████▌| 1151/1208 [32:30<01:36,  1.69s/it, loss=0.154, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000486, train/loss_step=0.146, global_step=3911.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  95%|█████████▌| 1152/1208 [32:33<01:34,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000486, train/loss_step=0.146, global_step=3911.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  95%|█████████▌| 1152/1208 [32:33<01:34,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.89e-5, train/loss_step=0.00557, global_step=3911.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  95%|█████████▌| 1153/1208 [32:34<01:33,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.89e-5, train/loss_step=0.00557, global_step=3911.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  95%|█████████▌| 1153/1208 [32:34<01:33,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000393, train/loss_step=0.120, global_step=3912.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  96%|█████████▌| 1154/1208 [32:35<01:31,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000393, train/loss_step=0.120, global_step=3912.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  96%|█████████▌| 1154/1208 [32:35<01:31,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0451, train/loss_vlb_step=0.000156, train/loss_step=0.0451, global_step=3912.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  96%|█████████▌| 1155/1208 [32:36<01:29,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0451, train/loss_vlb_step=0.000156, train/loss_step=0.0451, global_step=3912.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  96%|█████████▌| 1155/1208 [32:36<01:29,  1.69s/it, loss=0.172, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00237, train/loss_step=0.374, global_step=3912.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  96%|█████████▌| 1156/1208 [32:39<01:28,  1.70s/it, loss=0.172, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00237, train/loss_step=0.374, global_step=3912.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  96%|█████████▌| 1156/1208 [32:39<01:28,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000416, train/loss_step=0.126, global_step=3912.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  96%|█████████▌| 1157/1208 [32:40<01:26,  1.69s/it, loss=0.178, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000416, train/loss_step=0.126, global_step=3912.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  96%|█████████▌| 1157/1208 [32:40<01:26,  1.69s/it, loss=0.197, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00267, train/loss_step=0.385, global_step=3913.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  96%|█████████▌| 1158/1208 [32:41<01:24,  1.69s/it, loss=0.197, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00267, train/loss_step=0.385, global_step=3913.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  96%|█████████▌| 1158/1208 [32:41<01:24,  1.69s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000123, train/loss_step=0.0325, global_step=3913.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  96%|█████████▌| 1159/1208 [32:42<01:22,  1.69s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000123, train/loss_step=0.0325, global_step=3913.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  96%|█████████▌| 1159/1208 [32:42<01:22,  1.69s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=8.89e-5, train/loss_step=0.0221, global_step=3913.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  96%|█████████▌| 1160/1208 [32:46<01:21,  1.70s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=8.89e-5, train/loss_step=0.0221, global_step=3913.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  96%|█████████▌| 1160/1208 [32:46<01:21,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=3913.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  96%|█████████▌| 1161/1208 [32:47<01:19,  1.69s/it, loss=0.177, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=3913.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  96%|█████████▌| 1161/1208 [32:47<01:19,  1.69s/it, loss=0.184, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.00102, train/loss_step=0.238, global_step=3914.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  96%|█████████▌| 1162/1208 [32:48<01:17,  1.69s/it, loss=0.184, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.00102, train/loss_step=0.238, global_step=3914.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  96%|█████████▌| 1162/1208 [32:48<01:17,  1.69s/it, loss=0.189, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00254, train/loss_step=0.403, global_step=3914.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  96%|█████████▋| 1163/1208 [32:49<01:16,  1.69s/it, loss=0.189, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00254, train/loss_step=0.403, global_step=3914.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  96%|█████████▋| 1163/1208 [32:49<01:16,  1.69s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.00012, train/loss_step=0.0326, global_step=3914.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  96%|█████████▋| 1164/1208 [32:52<01:14,  1.69s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.00012, train/loss_step=0.0326, global_step=3914.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  96%|█████████▋| 1164/1208 [32:52<01:14,  1.69s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=8.01e-5, train/loss_step=0.0189, global_step=3914.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  96%|█████████▋| 1165/1208 [32:53<01:12,  1.69s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=8.01e-5, train/loss_step=0.0189, global_step=3914.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  96%|█████████▋| 1165/1208 [32:53<01:12,  1.69s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0421, train/loss_vlb_step=0.000154, train/loss_step=0.0421, global_step=3915.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  97%|█████████▋| 1166/1208 [32:54<01:11,  1.69s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0421, train/loss_vlb_step=0.000154, train/loss_step=0.0421, global_step=3915.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  97%|█████████▋| 1166/1208 [32:54<01:11,  1.69s/it, loss=0.158, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00205, train/loss_step=0.338, global_step=3915.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  97%|█████████▋| 1167/1208 [32:55<01:09,  1.69s/it, loss=0.158, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00205, train/loss_step=0.338, global_step=3915.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  97%|█████████▋| 1167/1208 [32:55<01:09,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00708, train/loss_vlb_step=3.48e-5, train/loss_step=0.00708, global_step=3915.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  97%|█████████▋| 1168/1208 [32:59<01:07,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00708, train/loss_vlb_step=3.48e-5, train/loss_step=0.00708, global_step=3915.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  97%|█████████▋| 1168/1208 [32:59<01:07,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00877, train/loss_vlb_step=4.22e-5, train/loss_step=0.00877, global_step=3915.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  97%|█████████▋| 1169/1208 [33:00<01:06,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00877, train/loss_vlb_step=4.22e-5, train/loss_step=0.00877, global_step=3915.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  97%|█████████▋| 1169/1208 [33:00<01:06,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00955, train/loss_vlb_step=4.46e-5, train/loss_step=0.00955, global_step=3916.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  97%|█████████▋| 1170/1208 [33:01<01:04,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00955, train/loss_vlb_step=4.46e-5, train/loss_step=0.00955, global_step=3916.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  97%|█████████▋| 1170/1208 [33:01<01:04,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.037, train/loss_vlb_step=0.00013, train/loss_step=0.037, global_step=3916.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]    Epoch 12:  97%|█████████▋| 1171/1208 [33:02<01:02,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.037, train/loss_vlb_step=0.00013, train/loss_step=0.037, global_step=3916.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  97%|█████████▋| 1171/1208 [33:02<01:02,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.0022, train/loss_step=0.345, global_step=3916.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  97%|█████████▋| 1172/1208 [33:05<01:00,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.0022, train/loss_step=0.345, global_step=3916.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  97%|█████████▋| 1172/1208 [33:05<01:00,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00254, train/loss_step=0.351, global_step=3916.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  97%|█████████▋| 1173/1208 [33:06<00:59,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00254, train/loss_step=0.351, global_step=3916.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  97%|█████████▋| 1173/1208 [33:06<00:59,  1.69s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.75e-5, train/loss_step=0.0186, global_step=3917.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  97%|█████████▋| 1174/1208 [33:07<00:57,  1.69s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.75e-5, train/loss_step=0.0186, global_step=3917.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  97%|█████████▋| 1174/1208 [33:07<00:57,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00383, train/loss_vlb_step=1.99e-5, train/loss_step=0.00383, global_step=3917.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  97%|█████████▋| 1175/1208 [33:08<00:55,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00383, train/loss_vlb_step=1.99e-5, train/loss_step=0.00383, global_step=3917.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  97%|█████████▋| 1175/1208 [33:08<00:55,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=3917.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  97%|█████████▋| 1176/1208 [33:11<00:54,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=3917.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  97%|█████████▋| 1176/1208 [33:11<00:54,  1.69s/it, loss=0.149, v_num=0, train/loss_simple_step=0.448, train/loss_vlb_step=0.00356, train/loss_step=0.448, global_step=3917.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  97%|█████████▋| 1177/1208 [33:12<00:52,  1.69s/it, loss=0.149, v_num=0, train/loss_simple_step=0.448, train/loss_vlb_step=0.00356, train/loss_step=0.448, global_step=3917.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  97%|█████████▋| 1177/1208 [33:12<00:52,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0683, train/loss_vlb_step=0.000233, train/loss_step=0.0683, global_step=3918.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  98%|█████████▊| 1178/1208 [33:13<00:50,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0683, train/loss_vlb_step=0.000233, train/loss_step=0.0683, global_step=3918.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  98%|█████████▊| 1178/1208 [33:13<00:50,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00548, train/loss_vlb_step=2.88e-5, train/loss_step=0.00548, global_step=3918.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  98%|█████████▊| 1179/1208 [33:14<00:49,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00548, train/loss_vlb_step=2.88e-5, train/loss_step=0.00548, global_step=3918.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  98%|█████████▊| 1179/1208 [33:15<00:49,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000793, train/loss_step=0.222, global_step=3918.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  98%|█████████▊| 1180/1208 [33:18<00:47,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000793, train/loss_step=0.222, global_step=3918.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  98%|█████████▊| 1180/1208 [33:18<00:47,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000118, train/loss_step=0.0311, global_step=3918.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  98%|█████████▊| 1181/1208 [33:19<00:45,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000118, train/loss_step=0.0311, global_step=3918.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  98%|█████████▊| 1181/1208 [33:19<00:45,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000429, train/loss_step=0.130, global_step=3919.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  98%|█████████▊| 1182/1208 [33:20<00:44,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000429, train/loss_step=0.130, global_step=3919.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  98%|█████████▊| 1182/1208 [33:20<00:44,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.81e-5, train/loss_step=0.019, global_step=3919.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  98%|█████████▊| 1183/1208 [33:21<00:42,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.81e-5, train/loss_step=0.019, global_step=3919.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  98%|█████████▊| 1183/1208 [33:21<00:42,  1.69s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=1.25e-5, train/loss_step=0.00206, global_step=3919.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  98%|█████████▊| 1184/1208 [33:24<00:40,  1.69s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=1.25e-5, train/loss_step=0.00206, global_step=3919.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  98%|█████████▊| 1184/1208 [33:24<00:40,  1.69s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000108, train/loss_step=0.0268, global_step=3919.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  98%|█████████▊| 1185/1208 [33:25<00:38,  1.69s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000108, train/loss_step=0.0268, global_step=3919.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  98%|█████████▊| 1185/1208 [33:25<00:38,  1.69s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.8e-5, train/loss_step=0.0128, global_step=3920.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  98%|█████████▊| 1186/1208 [33:26<00:37,  1.69s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.8e-5, train/loss_step=0.0128, global_step=3920.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  98%|█████████▊| 1186/1208 [33:26<00:37,  1.69s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.0548, train/loss_vlb_step=0.000195, train/loss_step=0.0548, global_step=3920.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  98%|█████████▊| 1187/1208 [33:27<00:35,  1.69s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.0548, train/loss_vlb_step=0.000195, train/loss_step=0.0548, global_step=3920.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  98%|█████████▊| 1187/1208 [33:27<00:35,  1.69s/it, loss=0.116, v_num=0, train/loss_simple_step=0.419, train/loss_vlb_step=0.0028, train/loss_step=0.419, global_step=3920.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]     Epoch 12:  98%|█████████▊| 1188/1208 [33:31<00:33,  1.69s/it, loss=0.116, v_num=0, train/loss_simple_step=0.419, train/loss_vlb_step=0.0028, train/loss_step=0.419, global_step=3920.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  98%|█████████▊| 1188/1208 [33:31<00:33,  1.69s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00995, train/loss_vlb_step=4.56e-5, train/loss_step=0.00995, global_step=3920.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  98%|█████████▊| 1189/1208 [33:32<00:32,  1.69s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00995, train/loss_vlb_step=4.56e-5, train/loss_step=0.00995, global_step=3920.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  98%|█████████▊| 1189/1208 [33:32<00:32,  1.69s/it, loss=0.122, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=3921.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12:  99%|█████████▊| 1190/1208 [33:33<00:30,  1.69s/it, loss=0.122, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=3921.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  99%|█████████▊| 1190/1208 [33:33<00:30,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000109, train/loss_step=0.0264, global_step=3921.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  99%|█████████▊| 1191/1208 [33:34<00:28,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000109, train/loss_step=0.0264, global_step=3921.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  99%|█████████▊| 1191/1208 [33:34<00:28,  1.69s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.61e-5, train/loss_step=0.0028, global_step=3921.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145] Epoch 12:  99%|█████████▊| 1192/1208 [33:37<00:27,  1.69s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.61e-5, train/loss_step=0.0028, global_step=3921.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  99%|█████████▊| 1192/1208 [33:37<00:27,  1.69s/it, loss=0.0878, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000106, train/loss_step=0.0262, global_step=3921.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  99%|█████████▉| 1193/1208 [33:38<00:25,  1.69s/it, loss=0.0878, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000106, train/loss_step=0.0262, global_step=3921.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  99%|█████████▉| 1193/1208 [33:38<00:25,  1.69s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.053, train/loss_vlb_step=0.000191, train/loss_step=0.053, global_step=3922.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  99%|█████████▉| 1194/1208 [33:39<00:23,  1.69s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.053, train/loss_vlb_step=0.000191, train/loss_step=0.053, global_step=3922.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  99%|█████████▉| 1194/1208 [33:39<00:23,  1.69s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000423, train/loss_step=0.128, global_step=3922.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  99%|█████████▉| 1195/1208 [33:40<00:21,  1.69s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000423, train/loss_step=0.128, global_step=3922.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  99%|█████████▉| 1195/1208 [33:40<00:21,  1.69s/it, loss=0.0903, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.9e-5, train/loss_step=0.00352, global_step=3922.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  99%|█████████▉| 1196/1208 [33:43<00:20,  1.69s/it, loss=0.0903, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.9e-5, train/loss_step=0.00352, global_step=3922.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  99%|█████████▉| 1196/1208 [33:43<00:20,  1.69s/it, loss=0.0723, v_num=0, train/loss_simple_step=0.0888, train/loss_vlb_step=0.000294, train/loss_step=0.0888, global_step=3922.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  99%|█████████▉| 1197/1208 [33:44<00:18,  1.69s/it, loss=0.0723, v_num=0, train/loss_simple_step=0.0888, train/loss_vlb_step=0.000294, train/loss_step=0.0888, global_step=3922.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  99%|█████████▉| 1197/1208 [33:44<00:18,  1.69s/it, loss=0.0795, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000826, train/loss_step=0.212, global_step=3923.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  99%|█████████▉| 1198/1208 [33:45<00:16,  1.69s/it, loss=0.0795, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000826, train/loss_step=0.212, global_step=3923.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  99%|█████████▉| 1198/1208 [33:45<00:16,  1.69s/it, loss=0.101, v_num=0, train/loss_simple_step=0.444, train/loss_vlb_step=0.00282, train/loss_step=0.444, global_step=3923.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]  Epoch 12:  99%|█████████▉| 1199/1208 [33:46<00:15,  1.69s/it, loss=0.101, v_num=0, train/loss_simple_step=0.444, train/loss_vlb_step=0.00282, train/loss_step=0.444, global_step=3923.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  99%|█████████▉| 1199/1208 [33:46<00:15,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000908, train/loss_step=0.230, global_step=3923.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  99%|█████████▉| 1200/1208 [33:50<00:13,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000908, train/loss_step=0.230, global_step=3923.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  99%|█████████▉| 1200/1208 [33:50<00:13,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.00017, train/loss_step=0.0463, global_step=3923.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.76it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.74it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.75it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.76it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.80it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.76it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.78it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.76it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.76it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.76it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.77it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.78it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 12:  99%|█████████▉| 1201/1208 [34:20<00:12,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.00017, train/loss_step=0.0463, global_step=3923.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12:  99%|█████████▉| 1201/1208 [34:20<00:12,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.078, train/loss_vlb_step=0.000257, train/loss_step=0.078, global_step=3924.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12: 100%|█████████▉| 1202/1208 [34:21<00:10,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.078, train/loss_vlb_step=0.000257, train/loss_step=0.078, global_step=3924.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12: 100%|█████████▉| 1202/1208 [34:21<00:10,  1.72s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=1.43e-5, train/loss_step=0.00256, global_step=3924.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12: 100%|█████████▉| 1203/1208 [34:22<00:08,  1.71s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=1.43e-5, train/loss_step=0.00256, global_step=3924.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12: 100%|█████████▉| 1203/1208 [34:22<00:08,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.00019, train/loss_step=0.0537, global_step=3924.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12: 100%|█████████▉| 1204/1208 [34:26<00:06,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.00019, train/loss_step=0.0537, global_step=3924.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12: 100%|█████████▉| 1204/1208 [34:26<00:06,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00235, train/loss_step=0.388, global_step=3924.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12: 100%|█████████▉| 1205/1208 [34:27<00:05,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00235, train/loss_step=0.388, global_step=3924.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12: 100%|█████████▉| 1205/1208 [34:27<00:05,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.68e-5, train/loss_step=0.0239, global_step=3925.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12: 100%|█████████▉| 1206/1208 [34:28<00:03,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.68e-5, train/loss_step=0.0239, global_step=3925.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12: 100%|█████████▉| 1206/1208 [34:28<00:03,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.26e-5, train/loss_step=0.00222, global_step=3925.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12: 100%|█████████▉| 1207/1208 [34:29<00:01,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.26e-5, train/loss_step=0.00222, global_step=3925.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12: 100%|█████████▉| 1207/1208 [34:29<00:01,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000921, train/loss_step=0.233, global_step=3925.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]   Epoch 12: 100%|██████████| 1208/1208 [34:34<00:00,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000921, train/loss_step=0.233, global_step=3925.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 12: 100%|██████████| 1208/1208 [34:34<00:00,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.07e-5, train/loss_step=0.0169, global_step=3925.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]
+
+
+Epoch 12:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.109, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.07e-5, train/loss_step=0.0169, global_step=3925.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]           Epoch 13:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.109, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.07e-5, train/loss_step=0.0169, global_step=3925.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.84it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.73it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.83it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.83it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.83it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.80it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.80it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.73it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:20,  1.75it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.76it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.76it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.83it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.83it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.78it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.83it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.83it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.83it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.83it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.82it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.83it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.83it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.78it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.83it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.83it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.78it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.83it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.83it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.82it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.82it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.77it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.78it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 13:   0%|          | 1/1208 [00:33<11:04:46, 33.05s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.07e-5, train/loss_step=0.0169, global_step=3925.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00309, train/loss_epoch=0.145]Epoch 13:   0%|          | 1/1208 [00:33<11:04:49, 33.05s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00323, train/loss_vlb_step=1.79e-5, train/loss_step=0.00323, global_step=3926.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   0%|          | 2/1208 [00:34<5:42:28, 17.04s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00323, train/loss_vlb_step=1.79e-5, train/loss_step=0.00323, global_step=3926.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:   0%|          | 2/1208 [00:34<5:42:29, 17.04s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.38e-5, train/loss_step=0.0198, global_step=3926.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:   0%|          | 3/1208 [00:35<3:55:00, 11.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.38e-5, train/loss_step=0.0198, global_step=3926.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   0%|          | 3/1208 [00:35<3:55:01, 11.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000156, train/loss_step=0.0454, global_step=3926.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   0%|          | 4/1208 [00:38<3:11:42,  9.55s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000156, train/loss_step=0.0454, global_step=3926.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   0%|          | 4/1208 [00:38<3:11:42,  9.55s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000128, train/loss_step=0.0334, global_step=3926.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   0%|          | 5/1208 [00:39<2:37:27,  7.85s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000128, train/loss_step=0.0334, global_step=3926.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   0%|          | 5/1208 [00:39<2:37:27,  7.85s/it, loss=0.109, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000458, train/loss_step=0.132, global_step=3927.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:   0%|          | 6/1208 [00:40<2:14:30,  6.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000458, train/loss_step=0.132, global_step=3927.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   0%|          | 6/1208 [00:40<2:14:31,  6.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.32e-5, train/loss_step=0.00233, global_step=3927.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   1%|          | 7/1208 [00:41<1:58:08,  5.90s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.32e-5, train/loss_step=0.00233, global_step=3927.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   1%|          | 7/1208 [00:41<1:58:08,  5.90s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00892, train/loss_vlb_step=4.31e-5, train/loss_step=0.00892, global_step=3927.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   1%|          | 8/1208 [00:44<1:51:28,  5.57s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00892, train/loss_vlb_step=4.31e-5, train/loss_step=0.00892, global_step=3927.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   1%|          | 8/1208 [00:44<1:51:28,  5.57s/it, loss=0.108, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000623, train/loss_step=0.182, global_step=3927.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:   1%|          | 9/1208 [00:45<1:41:22,  5.07s/it, loss=0.108, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000623, train/loss_step=0.182, global_step=3927.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   1%|          | 9/1208 [00:45<1:41:23,  5.07s/it, loss=0.104, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000449, train/loss_step=0.136, global_step=3928.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   1%|          | 10/1208 [00:46<1:33:14,  4.67s/it, loss=0.104, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000449, train/loss_step=0.136, global_step=3928.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   1%|          | 10/1208 [00:46<1:33:14,  4.67s/it, loss=0.0839, v_num=0, train/loss_simple_step=0.0404, train/loss_vlb_step=0.000148, train/loss_step=0.0404, global_step=3928.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   1%|          | 11/1208 [00:47<1:26:32,  4.34s/it, loss=0.0839, v_num=0, train/loss_simple_step=0.0404, train/loss_vlb_step=0.000148, train/loss_step=0.0404, global_step=3928.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   1%|          | 11/1208 [00:47<1:26:32,  4.34s/it, loss=0.0764, v_num=0, train/loss_simple_step=0.0801, train/loss_vlb_step=0.000269, train/loss_step=0.0801, global_step=3928.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   1%|          | 12/1208 [00:50<1:24:37,  4.25s/it, loss=0.0764, v_num=0, train/loss_simple_step=0.0801, train/loss_vlb_step=0.000269, train/loss_step=0.0801, global_step=3928.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   1%|          | 12/1208 [00:50<1:24:37,  4.25s/it, loss=0.0757, v_num=0, train/loss_simple_step=0.0315, train/loss_vlb_step=0.00012, train/loss_step=0.0315, global_step=3928.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:   1%|          | 13/1208 [00:51<1:19:39,  4.00s/it, loss=0.0757, v_num=0, train/loss_simple_step=0.0315, train/loss_vlb_step=0.00012, train/loss_step=0.0315, global_step=3928.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   1%|          | 13/1208 [00:52<1:19:40,  4.00s/it, loss=0.0724, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.86e-5, train/loss_step=0.0132, global_step=3929.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   1%|          | 14/1208 [00:53<1:15:25,  3.79s/it, loss=0.0724, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.86e-5, train/loss_step=0.0132, global_step=3929.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   1%|          | 14/1208 [00:53<1:15:25,  3.79s/it, loss=0.0813, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000629, train/loss_step=0.180, global_step=3929.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:   1%|          | 15/1208 [00:54<1:11:42,  3.61s/it, loss=0.0813, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000629, train/loss_step=0.180, global_step=3929.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   1%|          | 15/1208 [00:54<1:11:42,  3.61s/it, loss=0.0789, v_num=0, train/loss_simple_step=0.00509, train/loss_vlb_step=2.63e-5, train/loss_step=0.00509, global_step=3929.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   1%|▏         | 16/1208 [00:57<1:11:08,  3.58s/it, loss=0.0789, v_num=0, train/loss_simple_step=0.00509, train/loss_vlb_step=2.63e-5, train/loss_step=0.00509, global_step=3929.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   1%|▏         | 16/1208 [00:57<1:11:08,  3.58s/it, loss=0.0687, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000658, train/loss_step=0.184, global_step=3929.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:   1%|▏         | 17/1208 [00:58<1:08:08,  3.43s/it, loss=0.0687, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000658, train/loss_step=0.184, global_step=3929.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   1%|▏         | 17/1208 [00:58<1:08:08,  3.43s/it, loss=0.0787, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000982, train/loss_step=0.225, global_step=3930.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   1%|▏         | 18/1208 [00:59<1:05:26,  3.30s/it, loss=0.0787, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000982, train/loss_step=0.225, global_step=3930.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   1%|▏         | 18/1208 [00:59<1:05:26,  3.30s/it, loss=0.0807, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000159, train/loss_step=0.042, global_step=3930.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   2%|▏         | 19/1208 [01:00<1:03:02,  3.18s/it, loss=0.0807, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000159, train/loss_step=0.042, global_step=3930.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   2%|▏         | 19/1208 [01:00<1:03:02,  3.18s/it, loss=0.107, v_num=0, train/loss_simple_step=0.765, train/loss_vlb_step=0.129, train/loss_step=0.765, global_step=3930.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:   2%|▏         | 20/1208 [01:03<1:03:01,  3.18s/it, loss=0.107, v_num=0, train/loss_simple_step=0.765, train/loss_vlb_step=0.129, train/loss_step=0.765, global_step=3930.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   2%|▏         | 20/1208 [01:03<1:03:01,  3.18s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00834, train/loss_vlb_step=4.1e-5, train/loss_step=0.00834, global_step=3930.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   2%|▏         | 21/1208 [01:04<1:00:59,  3.08s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00834, train/loss_vlb_step=4.1e-5, train/loss_step=0.00834, global_step=3930.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   2%|▏         | 21/1208 [01:04<1:00:59,  3.08s/it, loss=0.114, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000505, train/loss_step=0.148, global_step=3931.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:   2%|▏         | 22/1208 [01:05<59:05,  2.99s/it, loss=0.114, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000505, train/loss_step=0.148, global_step=3931.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:   2%|▏         | 22/1208 [01:05<59:05,  2.99s/it, loss=0.129, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00161, train/loss_step=0.319, global_step=3931.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:   2%|▏         | 23/1208 [01:06<57:21,  2.90s/it, loss=0.129, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00161, train/loss_step=0.319, global_step=3931.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   2%|▏         | 23/1208 [01:06<57:21,  2.90s/it, loss=0.13, v_num=0, train/loss_simple_step=0.069, train/loss_vlb_step=0.000234, train/loss_step=0.069, global_step=3931.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   2%|▏         | 24/1208 [01:10<57:35,  2.92s/it, loss=0.13, v_num=0, train/loss_simple_step=0.069, train/loss_vlb_step=0.000234, train/loss_step=0.069, global_step=3931.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   2%|▏         | 24/1208 [01:10<57:35,  2.92s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0883, train/loss_vlb_step=0.000292, train/loss_step=0.0883, global_step=3931.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   2%|▏         | 25/1208 [01:11<56:04,  2.84s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0883, train/loss_vlb_step=0.000292, train/loss_step=0.0883, global_step=3931.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   2%|▏         | 25/1208 [01:11<56:05,  2.84s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0716, train/loss_vlb_step=0.000238, train/loss_step=0.0716, global_step=3932.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:   2%|▏         | 26/1208 [01:12<54:39,  2.77s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0716, train/loss_vlb_step=0.000238, train/loss_step=0.0716, global_step=3932.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   2%|▏         | 26/1208 [01:12<54:39,  2.77s/it, loss=0.138, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000559, train/loss_step=0.167, global_step=3932.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:   2%|▏         | 27/1208 [01:13<53:20,  2.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000559, train/loss_step=0.167, global_step=3932.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   2%|▏         | 27/1208 [01:13<53:20,  2.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000616, train/loss_step=0.175, global_step=3932.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   2%|▏         | 28/1208 [01:16<53:42,  2.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000616, train/loss_step=0.175, global_step=3932.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   2%|▏         | 28/1208 [01:16<53:42,  2.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00674, train/loss_vlb_step=3.34e-5, train/loss_step=0.00674, global_step=3932.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   2%|▏         | 29/1208 [01:17<52:32,  2.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00674, train/loss_vlb_step=3.34e-5, train/loss_step=0.00674, global_step=3932.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   2%|▏         | 29/1208 [01:17<52:32,  2.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000111, train/loss_step=0.0293, global_step=3933.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:   2%|▏         | 30/1208 [01:18<51:25,  2.62s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000111, train/loss_step=0.0293, global_step=3933.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   2%|▏         | 30/1208 [01:18<51:25,  2.62s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.73e-5, train/loss_step=0.0105, global_step=3933.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:   3%|▎         | 31/1208 [01:19<50:22,  2.57s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.73e-5, train/loss_step=0.0105, global_step=3933.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   3%|▎         | 31/1208 [01:19<50:22,  2.57s/it, loss=0.135, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000536, train/loss_step=0.160, global_step=3933.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:   3%|▎         | 32/1208 [01:22<50:46,  2.59s/it, loss=0.135, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000536, train/loss_step=0.160, global_step=3933.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   3%|▎         | 32/1208 [01:22<50:46,  2.59s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0833, train/loss_vlb_step=0.000276, train/loss_step=0.0833, global_step=3933.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   3%|▎         | 33/1208 [01:23<49:49,  2.54s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0833, train/loss_vlb_step=0.000276, train/loss_step=0.0833, global_step=3933.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   3%|▎         | 33/1208 [01:23<49:49,  2.54s/it, loss=0.143, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000415, train/loss_step=0.126, global_step=3934.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:   3%|▎         | 34/1208 [01:24<48:54,  2.50s/it, loss=0.143, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000415, train/loss_step=0.126, global_step=3934.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   3%|▎         | 34/1208 [01:24<48:54,  2.50s/it, loss=0.152, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00207, train/loss_step=0.353, global_step=3934.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:   3%|▎         | 35/1208 [01:26<48:03,  2.46s/it, loss=0.152, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00207, train/loss_step=0.353, global_step=3934.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   3%|▎         | 35/1208 [01:26<48:03,  2.46s/it, loss=0.164, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.0011, train/loss_step=0.258, global_step=3934.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:   3%|▎         | 36/1208 [01:29<48:28,  2.48s/it, loss=0.164, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.0011, train/loss_step=0.258, global_step=3934.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   3%|▎         | 36/1208 [01:29<48:28,  2.48s/it, loss=0.169, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00119, train/loss_step=0.272, global_step=3934.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   3%|▎         | 37/1208 [01:30<47:41,  2.44s/it, loss=0.169, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00119, train/loss_step=0.272, global_step=3934.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   3%|▎         | 37/1208 [01:30<47:41,  2.44s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000109, train/loss_step=0.0274, global_step=3935.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   3%|▎         | 38/1208 [01:31<46:55,  2.41s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000109, train/loss_step=0.0274, global_step=3935.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   3%|▎         | 38/1208 [01:31<46:55,  2.41s/it, loss=0.17, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00125, train/loss_step=0.257, global_step=3935.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:   3%|▎         | 39/1208 [01:32<46:11,  2.37s/it, loss=0.17, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00125, train/loss_step=0.257, global_step=3935.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   3%|▎         | 39/1208 [01:32<46:11,  2.37s/it, loss=0.138, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.00044, train/loss_step=0.133, global_step=3935.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   3%|▎         | 40/1208 [01:35<46:34,  2.39s/it, loss=0.138, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.00044, train/loss_step=0.133, global_step=3935.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   3%|▎         | 40/1208 [01:35<46:34,  2.39s/it, loss=0.156, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00178, train/loss_step=0.363, global_step=3935.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   3%|▎         | 41/1208 [01:36<45:54,  2.36s/it, loss=0.156, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00178, train/loss_step=0.363, global_step=3935.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   3%|▎         | 41/1208 [01:36<45:54,  2.36s/it, loss=0.192, v_num=0, train/loss_simple_step=0.872, train/loss_vlb_step=0.439, train/loss_step=0.872, global_step=3936.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:   3%|▎         | 42/1208 [01:37<45:15,  2.33s/it, loss=0.192, v_num=0, train/loss_simple_step=0.872, train/loss_vlb_step=0.439, train/loss_step=0.872, global_step=3936.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   3%|▎         | 42/1208 [01:37<45:15,  2.33s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.03e-5, train/loss_step=0.00173, global_step=3936.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   4%|▎         | 43/1208 [01:38<44:37,  2.30s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.03e-5, train/loss_step=0.00173, global_step=3936.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   4%|▎         | 43/1208 [01:38<44:37,  2.30s/it, loss=0.192, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.0025, train/loss_step=0.385, global_step=3936.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]     Epoch 13:   4%|▎         | 44/1208 [01:42<45:00,  2.32s/it, loss=0.192, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.0025, train/loss_step=0.385, global_step=3936.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   4%|▎         | 44/1208 [01:42<45:00,  2.32s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0711, train/loss_vlb_step=0.000236, train/loss_step=0.0711, global_step=3936.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   4%|▎         | 45/1208 [01:43<44:25,  2.29s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0711, train/loss_vlb_step=0.000236, train/loss_step=0.0711, global_step=3936.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   4%|▎         | 45/1208 [01:43<44:25,  2.29s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=8.55e-5, train/loss_step=0.0204, global_step=3937.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:   4%|▍         | 46/1208 [01:44<43:51,  2.26s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=8.55e-5, train/loss_step=0.0204, global_step=3937.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   4%|▍         | 46/1208 [01:44<43:51,  2.26s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0657, train/loss_vlb_step=0.000219, train/loss_step=0.0657, global_step=3937.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   4%|▍         | 47/1208 [01:45<43:18,  2.24s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0657, train/loss_vlb_step=0.000219, train/loss_step=0.0657, global_step=3937.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   4%|▍         | 47/1208 [01:45<43:19,  2.24s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0809, train/loss_vlb_step=0.000287, train/loss_step=0.0809, global_step=3937.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   4%|▍         | 48/1208 [01:48<43:41,  2.26s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0809, train/loss_vlb_step=0.000287, train/loss_step=0.0809, global_step=3937.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   4%|▍         | 48/1208 [01:48<43:41,  2.26s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.2e-5, train/loss_step=0.0136, global_step=3937.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:   4%|▍         | 49/1208 [01:49<43:10,  2.24s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.2e-5, train/loss_step=0.0136, global_step=3937.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   4%|▍         | 49/1208 [01:49<43:10,  2.24s/it, loss=0.189, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000984, train/loss_step=0.226, global_step=3938.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   4%|▍         | 50/1208 [01:50<42:41,  2.21s/it, loss=0.189, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000984, train/loss_step=0.226, global_step=3938.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   4%|▍         | 50/1208 [01:50<42:41,  2.21s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000164, train/loss_step=0.0448, global_step=3938.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   4%|▍         | 51/1208 [01:51<42:12,  2.19s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000164, train/loss_step=0.0448, global_step=3938.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   4%|▍         | 51/1208 [01:51<42:12,  2.19s/it, loss=0.215, v_num=0, train/loss_simple_step=0.637, train/loss_vlb_step=0.0277, train/loss_step=0.637, global_step=3938.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:   4%|▍         | 52/1208 [01:54<42:32,  2.21s/it, loss=0.215, v_num=0, train/loss_simple_step=0.637, train/loss_vlb_step=0.0277, train/loss_step=0.637, global_step=3938.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   4%|▍         | 52/1208 [01:54<42:32,  2.21s/it, loss=0.211, v_num=0, train/loss_simple_step=0.00877, train/loss_vlb_step=4.1e-5, train/loss_step=0.00877, global_step=3938.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   4%|▍         | 53/1208 [01:55<42:05,  2.19s/it, loss=0.211, v_num=0, train/loss_simple_step=0.00877, train/loss_vlb_step=4.1e-5, train/loss_step=0.00877, global_step=3938.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   4%|▍         | 53/1208 [01:55<42:05,  2.19s/it, loss=0.23, v_num=0, train/loss_simple_step=0.500, train/loss_vlb_step=0.00562, train/loss_step=0.500, global_step=3939.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:   4%|▍         | 54/1208 [01:56<41:39,  2.17s/it, loss=0.23, v_num=0, train/loss_simple_step=0.500, train/loss_vlb_step=0.00562, train/loss_step=0.500, global_step=3939.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   4%|▍         | 54/1208 [01:56<41:39,  2.17s/it, loss=0.217, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=3939.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   5%|▍         | 55/1208 [01:57<41:13,  2.14s/it, loss=0.217, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=3939.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   5%|▍         | 55/1208 [01:57<41:13,  2.14s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000227, train/loss_step=0.0676, global_step=3939.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   5%|▍         | 56/1208 [02:01<41:32,  2.16s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000227, train/loss_step=0.0676, global_step=3939.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   5%|▍         | 56/1208 [02:01<41:32,  2.16s/it, loss=0.197, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.000215, train/loss_step=0.062, global_step=3939.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:   5%|▍         | 57/1208 [02:02<41:08,  2.14s/it, loss=0.197, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.000215, train/loss_step=0.062, global_step=3939.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   5%|▍         | 57/1208 [02:02<41:08,  2.14s/it, loss=0.215, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00412, train/loss_step=0.385, global_step=3940.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:   5%|▍         | 58/1208 [02:03<40:44,  2.13s/it, loss=0.215, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00412, train/loss_step=0.385, global_step=3940.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   5%|▍         | 58/1208 [02:03<40:44,  2.13s/it, loss=0.208, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000394, train/loss_step=0.120, global_step=3940.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   5%|▍         | 59/1208 [02:04<40:21,  2.11s/it, loss=0.208, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000394, train/loss_step=0.120, global_step=3940.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   5%|▍         | 59/1208 [02:04<40:21,  2.11s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.79e-5, train/loss_step=0.0132, global_step=3940.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   5%|▍         | 60/1208 [02:07<40:40,  2.13s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.79e-5, train/loss_step=0.0132, global_step=3940.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   5%|▍         | 60/1208 [02:07<40:40,  2.13s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0636, train/loss_vlb_step=0.000221, train/loss_step=0.0636, global_step=3940.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   5%|▌         | 61/1208 [02:08<40:18,  2.11s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0636, train/loss_vlb_step=0.000221, train/loss_step=0.0636, global_step=3940.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   5%|▌         | 61/1208 [02:08<40:18,  2.11s/it, loss=0.166, v_num=0, train/loss_simple_step=0.448, train/loss_vlb_step=0.00371, train/loss_step=0.448, global_step=3941.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:   5%|▌         | 62/1208 [02:09<39:56,  2.09s/it, loss=0.166, v_num=0, train/loss_simple_step=0.448, train/loss_vlb_step=0.00371, train/loss_step=0.448, global_step=3941.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   5%|▌         | 62/1208 [02:09<39:56,  2.09s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.02e-5, train/loss_step=0.0142, global_step=3941.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   5%|▌         | 63/1208 [02:10<39:34,  2.07s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.02e-5, train/loss_step=0.0142, global_step=3941.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   5%|▌         | 63/1208 [02:10<39:34,  2.07s/it, loss=0.152, v_num=0, train/loss_simple_step=0.099, train/loss_vlb_step=0.000325, train/loss_step=0.099, global_step=3941.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:   5%|▌         | 64/1208 [02:13<39:53,  2.09s/it, loss=0.152, v_num=0, train/loss_simple_step=0.099, train/loss_vlb_step=0.000325, train/loss_step=0.099, global_step=3941.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   5%|▌         | 64/1208 [02:13<39:53,  2.09s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00816, train/loss_vlb_step=4.11e-5, train/loss_step=0.00816, global_step=3941.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   5%|▌         | 65/1208 [02:14<39:33,  2.08s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00816, train/loss_vlb_step=4.11e-5, train/loss_step=0.00816, global_step=3941.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   5%|▌         | 65/1208 [02:14<39:33,  2.08s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00831, train/loss_vlb_step=4.06e-5, train/loss_step=0.00831, global_step=3942.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   5%|▌         | 66/1208 [02:16<39:13,  2.06s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00831, train/loss_vlb_step=4.06e-5, train/loss_step=0.00831, global_step=3942.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   5%|▌         | 66/1208 [02:16<39:13,  2.06s/it, loss=0.152, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000501, train/loss_step=0.150, global_step=3942.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:   6%|▌         | 67/1208 [02:17<38:53,  2.05s/it, loss=0.152, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000501, train/loss_step=0.150, global_step=3942.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   6%|▌         | 67/1208 [02:17<38:53,  2.05s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=2e-5, train/loss_step=0.00362, global_step=3942.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   6%|▌         | 68/1208 [02:20<39:12,  2.06s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=2e-5, train/loss_step=0.00362, global_step=3942.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   6%|▌         | 68/1208 [02:20<39:12,  2.06s/it, loss=0.153, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=3942.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   6%|▌         | 69/1208 [02:21<38:54,  2.05s/it, loss=0.153, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=3942.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   6%|▌         | 69/1208 [02:21<38:54,  2.05s/it, loss=0.156, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00122, train/loss_step=0.279, global_step=3943.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:   6%|▌         | 70/1208 [02:22<38:35,  2.04s/it, loss=0.156, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00122, train/loss_step=0.279, global_step=3943.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   6%|▌         | 70/1208 [02:22<38:35,  2.04s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.73e-5, train/loss_step=0.00312, global_step=3943.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   6%|▌         | 71/1208 [02:23<38:17,  2.02s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.73e-5, train/loss_step=0.00312, global_step=3943.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   6%|▌         | 71/1208 [02:23<38:17,  2.02s/it, loss=0.164, v_num=0, train/loss_simple_step=0.838, train/loss_vlb_step=0.106, train/loss_step=0.838, global_step=3943.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]      Epoch 13:   6%|▌         | 72/1208 [02:26<38:35,  2.04s/it, loss=0.164, v_num=0, train/loss_simple_step=0.838, train/loss_vlb_step=0.106, train/loss_step=0.838, global_step=3943.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   6%|▌         | 72/1208 [02:26<38:35,  2.04s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000129, train/loss_step=0.0349, global_step=3943.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   6%|▌         | 73/1208 [02:27<38:17,  2.02s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000129, train/loss_step=0.0349, global_step=3943.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   6%|▌         | 73/1208 [02:27<38:17,  2.02s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000298, train/loss_step=0.0891, global_step=3944.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   6%|▌         | 74/1208 [02:28<38:00,  2.01s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000298, train/loss_step=0.0891, global_step=3944.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   6%|▌         | 74/1208 [02:28<38:00,  2.01s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0851, train/loss_vlb_step=0.000283, train/loss_step=0.0851, global_step=3944.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   6%|▌         | 75/1208 [02:29<37:43,  2.00s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0851, train/loss_vlb_step=0.000283, train/loss_step=0.0851, global_step=3944.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   6%|▌         | 75/1208 [02:29<37:43,  2.00s/it, loss=0.152, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000951, train/loss_step=0.228, global_step=3944.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:   6%|▋         | 76/1208 [02:33<38:00,  2.01s/it, loss=0.152, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000951, train/loss_step=0.228, global_step=3944.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   6%|▋         | 76/1208 [02:33<38:00,  2.01s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000151, train/loss_step=0.0415, global_step=3944.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   6%|▋         | 77/1208 [02:34<37:44,  2.00s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000151, train/loss_step=0.0415, global_step=3944.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   6%|▋         | 77/1208 [02:34<37:44,  2.00s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.93e-5, train/loss_step=0.00557, global_step=3945.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   6%|▋         | 78/1208 [02:35<37:28,  1.99s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.93e-5, train/loss_step=0.00557, global_step=3945.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   6%|▋         | 78/1208 [02:35<37:28,  1.99s/it, loss=0.132, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000406, train/loss_step=0.123, global_step=3945.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:   7%|▋         | 79/1208 [02:36<37:13,  1.98s/it, loss=0.132, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000406, train/loss_step=0.123, global_step=3945.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   7%|▋         | 79/1208 [02:36<37:13,  1.98s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00982, train/loss_vlb_step=4.73e-5, train/loss_step=0.00982, global_step=3945.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   7%|▋         | 80/1208 [02:39<37:28,  1.99s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00982, train/loss_vlb_step=4.73e-5, train/loss_step=0.00982, global_step=3945.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   7%|▋         | 80/1208 [02:39<37:28,  1.99s/it, loss=0.143, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00122, train/loss_step=0.282, global_step=3945.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:   7%|▋         | 81/1208 [02:40<37:13,  1.98s/it, loss=0.143, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00122, train/loss_step=0.282, global_step=3945.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   7%|▋         | 81/1208 [02:40<37:13,  1.98s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0056, train/loss_vlb_step=2.83e-5, train/loss_step=0.0056, global_step=3946.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   7%|▋         | 82/1208 [02:41<36:58,  1.97s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0056, train/loss_vlb_step=2.83e-5, train/loss_step=0.0056, global_step=3946.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   7%|▋         | 82/1208 [02:41<36:58,  1.97s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0066, train/loss_vlb_step=3.25e-5, train/loss_step=0.0066, global_step=3946.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   7%|▋         | 83/1208 [02:42<36:43,  1.96s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0066, train/loss_vlb_step=3.25e-5, train/loss_step=0.0066, global_step=3946.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   7%|▋         | 83/1208 [02:42<36:43,  1.96s/it, loss=0.135, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00242, train/loss_step=0.397, global_step=3946.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:   7%|▋         | 84/1208 [02:45<36:58,  1.97s/it, loss=0.135, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00242, train/loss_step=0.397, global_step=3946.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   7%|▋         | 84/1208 [02:45<36:58,  1.97s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=1.78e-5, train/loss_step=0.0031, global_step=3946.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   7%|▋         | 85/1208 [02:46<36:44,  1.96s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=1.78e-5, train/loss_step=0.0031, global_step=3946.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   7%|▋         | 85/1208 [02:46<36:44,  1.96s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0624, train/loss_vlb_step=0.000214, train/loss_step=0.0624, global_step=3947.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   7%|▋         | 86/1208 [02:47<36:30,  1.95s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0624, train/loss_vlb_step=0.000214, train/loss_step=0.0624, global_step=3947.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   7%|▋         | 86/1208 [02:47<36:30,  1.95s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00477, train/loss_vlb_step=2.49e-5, train/loss_step=0.00477, global_step=3947.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   7%|▋         | 87/1208 [02:48<36:17,  1.94s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00477, train/loss_vlb_step=2.49e-5, train/loss_step=0.00477, global_step=3947.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   7%|▋         | 87/1208 [02:48<36:17,  1.94s/it, loss=0.147, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00136, train/loss_step=0.334, global_step=3947.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:   7%|▋         | 88/1208 [02:52<36:32,  1.96s/it, loss=0.147, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00136, train/loss_step=0.334, global_step=3947.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   7%|▋         | 88/1208 [02:52<36:32,  1.96s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0679, train/loss_vlb_step=0.000226, train/loss_step=0.0679, global_step=3947.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   7%|▋         | 89/1208 [02:53<36:19,  1.95s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0679, train/loss_vlb_step=0.000226, train/loss_step=0.0679, global_step=3947.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   7%|▋         | 89/1208 [02:53<36:19,  1.95s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00157, train/loss_vlb_step=9.61e-6, train/loss_step=0.00157, global_step=3948.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   7%|▋         | 90/1208 [02:54<36:05,  1.94s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00157, train/loss_vlb_step=9.61e-6, train/loss_step=0.00157, global_step=3948.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   7%|▋         | 90/1208 [02:54<36:05,  1.94s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00538, train/loss_vlb_step=2.79e-5, train/loss_step=0.00538, global_step=3948.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   8%|▊         | 91/1208 [02:55<35:52,  1.93s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00538, train/loss_vlb_step=2.79e-5, train/loss_step=0.00538, global_step=3948.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   8%|▊         | 91/1208 [02:55<35:52,  1.93s/it, loss=0.103, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00134, train/loss_step=0.276, global_step=3948.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:   8%|▊         | 92/1208 [02:58<36:07,  1.94s/it, loss=0.103, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00134, train/loss_step=0.276, global_step=3948.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   8%|▊         | 92/1208 [02:58<36:07,  1.94s/it, loss=0.11, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000596, train/loss_step=0.176, global_step=3948.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   8%|▊         | 93/1208 [02:59<35:55,  1.93s/it, loss=0.11, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000596, train/loss_step=0.176, global_step=3948.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   8%|▊         | 93/1208 [02:59<35:55,  1.93s/it, loss=0.116, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000736, train/loss_step=0.199, global_step=3949.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   8%|▊         | 94/1208 [03:00<35:42,  1.92s/it, loss=0.116, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000736, train/loss_step=0.199, global_step=3949.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   8%|▊         | 94/1208 [03:00<35:42,  1.92s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000187, train/loss_step=0.0525, global_step=3949.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   8%|▊         | 95/1208 [03:01<35:29,  1.91s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000187, train/loss_step=0.0525, global_step=3949.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   8%|▊         | 95/1208 [03:01<35:30,  1.91s/it, loss=0.113, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000788, train/loss_step=0.212, global_step=3949.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:   8%|▊         | 96/1208 [03:05<35:44,  1.93s/it, loss=0.113, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000788, train/loss_step=0.212, global_step=3949.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   8%|▊         | 96/1208 [03:05<35:44,  1.93s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.43e-5, train/loss_step=0.00249, global_step=3949.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   8%|▊         | 97/1208 [03:06<35:32,  1.92s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.43e-5, train/loss_step=0.00249, global_step=3949.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   8%|▊         | 97/1208 [03:06<35:32,  1.92s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.68e-5, train/loss_step=0.00277, global_step=3950.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   8%|▊         | 98/1208 [03:07<35:20,  1.91s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.68e-5, train/loss_step=0.00277, global_step=3950.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   8%|▊         | 98/1208 [03:07<35:20,  1.91s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00427, train/loss_vlb_step=2.3e-5, train/loss_step=0.00427, global_step=3950.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:   8%|▊         | 99/1208 [03:08<35:08,  1.90s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00427, train/loss_vlb_step=2.3e-5, train/loss_step=0.00427, global_step=3950.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   8%|▊         | 99/1208 [03:08<35:08,  1.90s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00301, train/loss_vlb_step=1.68e-5, train/loss_step=0.00301, global_step=3950.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   8%|▊         | 100/1208 [03:11<35:21,  1.92s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00301, train/loss_vlb_step=1.68e-5, train/loss_step=0.00301, global_step=3950.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   8%|▊         | 100/1208 [03:11<35:21,  1.92s/it, loss=0.0912, v_num=0, train/loss_simple_step=0.0073, train/loss_vlb_step=3.6e-5, train/loss_step=0.0073, global_step=3950.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:   8%|▊         | 101/1208 [03:12<35:10,  1.91s/it, loss=0.0912, v_num=0, train/loss_simple_step=0.0073, train/loss_vlb_step=3.6e-5, train/loss_step=0.0073, global_step=3950.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   8%|▊         | 101/1208 [03:12<35:10,  1.91s/it, loss=0.0911, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=2.24e-5, train/loss_step=0.00402, global_step=3951.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   8%|▊         | 102/1208 [03:13<34:59,  1.90s/it, loss=0.0911, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=2.24e-5, train/loss_step=0.00402, global_step=3951.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   8%|▊         | 102/1208 [03:13<34:59,  1.90s/it, loss=0.102, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000936, train/loss_step=0.232, global_step=3951.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:   9%|▊         | 103/1208 [03:14<34:48,  1.89s/it, loss=0.102, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000936, train/loss_step=0.232, global_step=3951.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   9%|▊         | 103/1208 [03:14<34:48,  1.89s/it, loss=0.107, v_num=0, train/loss_simple_step=0.489, train/loss_vlb_step=0.00896, train/loss_step=0.489, global_step=3951.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:   9%|▊         | 104/1208 [03:17<35:00,  1.90s/it, loss=0.107, v_num=0, train/loss_simple_step=0.489, train/loss_vlb_step=0.00896, train/loss_step=0.489, global_step=3951.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   9%|▊         | 104/1208 [03:17<35:00,  1.90s/it, loss=0.115, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.00061, train/loss_step=0.171, global_step=3951.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   9%|▊         | 105/1208 [03:18<34:49,  1.89s/it, loss=0.115, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.00061, train/loss_step=0.171, global_step=3951.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   9%|▊         | 105/1208 [03:18<34:49,  1.89s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.66e-5, train/loss_step=0.00284, global_step=3952.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   9%|▉         | 106/1208 [03:19<34:39,  1.89s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.66e-5, train/loss_step=0.00284, global_step=3952.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   9%|▉         | 106/1208 [03:19<34:39,  1.89s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0782, train/loss_vlb_step=0.00026, train/loss_step=0.0782, global_step=3952.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:   9%|▉         | 107/1208 [03:21<34:28,  1.88s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0782, train/loss_vlb_step=0.00026, train/loss_step=0.0782, global_step=3952.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   9%|▉         | 107/1208 [03:21<34:28,  1.88s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000173, train/loss_step=0.0474, global_step=3952.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   9%|▉         | 108/1208 [03:24<34:40,  1.89s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000173, train/loss_step=0.0474, global_step=3952.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   9%|▉         | 108/1208 [03:24<34:40,  1.89s/it, loss=0.107, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000629, train/loss_step=0.181, global_step=3952.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:   9%|▉         | 109/1208 [03:25<34:30,  1.88s/it, loss=0.107, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000629, train/loss_step=0.181, global_step=3952.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   9%|▉         | 109/1208 [03:25<34:30,  1.88s/it, loss=0.108, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.18e-5, train/loss_step=0.011, global_step=3953.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:   9%|▉         | 110/1208 [03:26<34:19,  1.88s/it, loss=0.108, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.18e-5, train/loss_step=0.011, global_step=3953.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   9%|▉         | 110/1208 [03:26<34:19,  1.88s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=9e-5, train/loss_step=0.0217, global_step=3953.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:   9%|▉         | 111/1208 [03:27<34:09,  1.87s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=9e-5, train/loss_step=0.0217, global_step=3953.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   9%|▉         | 111/1208 [03:27<34:09,  1.87s/it, loss=0.113, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00179, train/loss_step=0.354, global_step=3953.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   9%|▉         | 112/1208 [03:30<34:21,  1.88s/it, loss=0.113, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00179, train/loss_step=0.354, global_step=3953.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   9%|▉         | 112/1208 [03:30<34:21,  1.88s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0649, train/loss_vlb_step=0.000228, train/loss_step=0.0649, global_step=3953.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   9%|▉         | 113/1208 [03:31<34:11,  1.87s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0649, train/loss_vlb_step=0.000228, train/loss_step=0.0649, global_step=3953.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   9%|▉         | 113/1208 [03:31<34:11,  1.87s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.00385, train/loss_vlb_step=2.1e-5, train/loss_step=0.00385, global_step=3954.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   9%|▉         | 114/1208 [03:32<34:01,  1.87s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.00385, train/loss_vlb_step=2.1e-5, train/loss_step=0.00385, global_step=3954.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:   9%|▉         | 114/1208 [03:32<34:01,  1.87s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.0977, train/loss_vlb_step=0.000321, train/loss_step=0.0977, global_step=3954.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  10%|▉         | 115/1208 [03:33<33:51,  1.86s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.0977, train/loss_vlb_step=0.000321, train/loss_step=0.0977, global_step=3954.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  10%|▉         | 115/1208 [03:33<33:51,  1.86s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.23e-5, train/loss_step=0.0199, global_step=3954.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  10%|▉         | 116/1208 [03:37<34:02,  1.87s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.23e-5, train/loss_step=0.0199, global_step=3954.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  10%|▉         | 116/1208 [03:37<34:02,  1.87s/it, loss=0.0912, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000109, train/loss_step=0.0283, global_step=3954.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  10%|▉         | 117/1208 [03:38<33:53,  1.86s/it, loss=0.0912, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000109, train/loss_step=0.0283, global_step=3954.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  10%|▉         | 117/1208 [03:38<33:53,  1.86s/it, loss=0.111, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00366, train/loss_step=0.402, global_step=3955.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  10%|▉         | 118/1208 [03:39<33:43,  1.86s/it, loss=0.111, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00366, train/loss_step=0.402, global_step=3955.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  10%|▉         | 118/1208 [03:39<33:43,  1.86s/it, loss=0.126, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00166, train/loss_step=0.304, global_step=3955.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  10%|▉         | 119/1208 [03:40<33:34,  1.85s/it, loss=0.126, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00166, train/loss_step=0.304, global_step=3955.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  10%|▉         | 119/1208 [03:40<33:34,  1.85s/it, loss=0.132, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000417, train/loss_step=0.126, global_step=3955.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  10%|▉         | 120/1208 [03:43<33:45,  1.86s/it, loss=0.132, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000417, train/loss_step=0.126, global_step=3955.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  10%|▉         | 120/1208 [03:43<33:45,  1.86s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00483, train/loss_vlb_step=2.55e-5, train/loss_step=0.00483, global_step=3955.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  10%|█         | 121/1208 [03:44<33:36,  1.86s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00483, train/loss_vlb_step=2.55e-5, train/loss_step=0.00483, global_step=3955.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  10%|█         | 121/1208 [03:44<33:36,  1.86s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0898, train/loss_vlb_step=0.0003, train/loss_step=0.0898, global_step=3956.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  10%|█         | 122/1208 [03:45<33:27,  1.85s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0898, train/loss_vlb_step=0.0003, train/loss_step=0.0898, global_step=3956.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  10%|█         | 122/1208 [03:45<33:27,  1.85s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00477, train/loss_vlb_step=2.5e-5, train/loss_step=0.00477, global_step=3956.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  10%|█         | 123/1208 [03:46<33:18,  1.84s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00477, train/loss_vlb_step=2.5e-5, train/loss_step=0.00477, global_step=3956.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  10%|█         | 123/1208 [03:46<33:18,  1.84s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000116, train/loss_step=0.0307, global_step=3956.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  10%|█         | 124/1208 [03:49<33:28,  1.85s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000116, train/loss_step=0.0307, global_step=3956.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  10%|█         | 124/1208 [03:49<33:28,  1.85s/it, loss=0.0939, v_num=0, train/loss_simple_step=0.00398, train/loss_vlb_step=2.18e-5, train/loss_step=0.00398, global_step=3956.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  10%|█         | 125/1208 [03:50<33:20,  1.85s/it, loss=0.0939, v_num=0, train/loss_simple_step=0.00398, train/loss_vlb_step=2.18e-5, train/loss_step=0.00398, global_step=3956.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  10%|█         | 125/1208 [03:50<33:20,  1.85s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.89e-5, train/loss_step=0.0215, global_step=3957.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  10%|█         | 126/1208 [03:51<33:11,  1.84s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.89e-5, train/loss_step=0.0215, global_step=3957.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  10%|█         | 126/1208 [03:51<33:11,  1.84s/it, loss=0.106, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00153, train/loss_step=0.297, global_step=3957.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  11%|█         | 127/1208 [03:52<33:02,  1.83s/it, loss=0.106, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00153, train/loss_step=0.297, global_step=3957.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  11%|█         | 127/1208 [03:52<33:02,  1.83s/it, loss=0.113, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000641, train/loss_step=0.190, global_step=3957.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  11%|█         | 128/1208 [03:56<33:12,  1.85s/it, loss=0.113, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000641, train/loss_step=0.190, global_step=3957.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  11%|█         | 128/1208 [03:56<33:12,  1.85s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.62e-5, train/loss_step=0.0208, global_step=3957.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  11%|█         | 129/1208 [03:57<33:04,  1.84s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.62e-5, train/loss_step=0.0208, global_step=3957.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  11%|█         | 129/1208 [03:57<33:04,  1.84s/it, loss=0.115, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000846, train/loss_step=0.220, global_step=3958.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  11%|█         | 130/1208 [03:58<32:56,  1.83s/it, loss=0.115, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000846, train/loss_step=0.220, global_step=3958.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  11%|█         | 130/1208 [03:58<32:56,  1.83s/it, loss=0.129, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00147, train/loss_step=0.305, global_step=3958.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  11%|█         | 131/1208 [03:59<32:47,  1.83s/it, loss=0.129, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00147, train/loss_step=0.305, global_step=3958.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  11%|█         | 131/1208 [03:59<32:47,  1.83s/it, loss=0.117, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.00034, train/loss_step=0.104, global_step=3958.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  11%|█         | 132/1208 [04:02<32:57,  1.84s/it, loss=0.117, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.00034, train/loss_step=0.104, global_step=3958.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  11%|█         | 132/1208 [04:02<32:57,  1.84s/it, loss=0.123, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000658, train/loss_step=0.190, global_step=3958.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  11%|█         | 133/1208 [04:03<32:49,  1.83s/it, loss=0.123, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000658, train/loss_step=0.190, global_step=3958.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  11%|█         | 133/1208 [04:03<32:49,  1.83s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=1.72e-5, train/loss_step=0.00294, global_step=3959.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  11%|█         | 134/1208 [04:04<32:41,  1.83s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=1.72e-5, train/loss_step=0.00294, global_step=3959.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  11%|█         | 134/1208 [04:04<32:41,  1.83s/it, loss=0.137, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00358, train/loss_step=0.379, global_step=3959.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  11%|█         | 135/1208 [04:05<32:32,  1.82s/it, loss=0.137, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00358, train/loss_step=0.379, global_step=3959.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  11%|█         | 135/1208 [04:05<32:33,  1.82s/it, loss=0.149, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.000921, train/loss_step=0.256, global_step=3959.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  11%|█▏        | 136/1208 [04:08<32:42,  1.83s/it, loss=0.149, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.000921, train/loss_step=0.256, global_step=3959.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  11%|█▏        | 136/1208 [04:08<32:42,  1.83s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.52e-5, train/loss_step=0.0179, global_step=3959.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  11%|█▏        | 137/1208 [04:10<32:34,  1.83s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.52e-5, train/loss_step=0.0179, global_step=3959.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  11%|█▏        | 137/1208 [04:10<32:34,  1.83s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.47e-5, train/loss_step=0.0153, global_step=3960.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  11%|█▏        | 138/1208 [04:11<32:26,  1.82s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.47e-5, train/loss_step=0.0153, global_step=3960.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  11%|█▏        | 138/1208 [04:11<32:26,  1.82s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00658, train/loss_vlb_step=3.17e-5, train/loss_step=0.00658, global_step=3960.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  12%|█▏        | 139/1208 [04:12<32:18,  1.81s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00658, train/loss_vlb_step=3.17e-5, train/loss_step=0.00658, global_step=3960.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  12%|█▏        | 139/1208 [04:12<32:18,  1.81s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0488, train/loss_vlb_step=0.000177, train/loss_step=0.0488, global_step=3960.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  12%|█▏        | 140/1208 [04:15<32:27,  1.82s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0488, train/loss_vlb_step=0.000177, train/loss_step=0.0488, global_step=3960.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  12%|█▏        | 140/1208 [04:15<32:27,  1.82s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0788, train/loss_vlb_step=0.000267, train/loss_step=0.0788, global_step=3960.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  12%|█▏        | 141/1208 [04:16<32:20,  1.82s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0788, train/loss_vlb_step=0.000267, train/loss_step=0.0788, global_step=3960.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  12%|█▏        | 141/1208 [04:16<32:20,  1.82s/it, loss=0.119, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000609, train/loss_step=0.180, global_step=3961.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  12%|█▏        | 142/1208 [04:17<32:12,  1.81s/it, loss=0.119, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000609, train/loss_step=0.180, global_step=3961.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  12%|█▏        | 142/1208 [04:17<32:12,  1.81s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.00013, train/loss_step=0.0339, global_step=3961.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  12%|█▏        | 143/1208 [04:18<32:04,  1.81s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.00013, train/loss_step=0.0339, global_step=3961.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  12%|█▏        | 143/1208 [04:18<32:04,  1.81s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.06e-5, train/loss_step=0.0113, global_step=3961.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  12%|█▏        | 144/1208 [04:21<32:13,  1.82s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.06e-5, train/loss_step=0.0113, global_step=3961.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  12%|█▏        | 144/1208 [04:21<32:14,  1.82s/it, loss=0.139, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00239, train/loss_step=0.394, global_step=3961.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  12%|█▏        | 145/1208 [04:22<32:06,  1.81s/it, loss=0.139, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00239, train/loss_step=0.394, global_step=3961.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  12%|█▏        | 145/1208 [04:22<32:06,  1.81s/it, loss=0.148, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000828, train/loss_step=0.216, global_step=3962.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  12%|█▏        | 146/1208 [04:23<31:59,  1.81s/it, loss=0.148, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000828, train/loss_step=0.216, global_step=3962.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  12%|█▏        | 146/1208 [04:23<31:59,  1.81s/it, loss=0.141, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000509, train/loss_step=0.153, global_step=3962.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  12%|█▏        | 147/1208 [04:24<31:51,  1.80s/it, loss=0.141, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000509, train/loss_step=0.153, global_step=3962.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  12%|█▏        | 147/1208 [04:24<31:51,  1.80s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0736, train/loss_vlb_step=0.000249, train/loss_step=0.0736, global_step=3962.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  12%|█▏        | 148/1208 [04:28<32:00,  1.81s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0736, train/loss_vlb_step=0.000249, train/loss_step=0.0736, global_step=3962.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  12%|█▏        | 148/1208 [04:28<32:00,  1.81s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0906, train/loss_vlb_step=0.000298, train/loss_step=0.0906, global_step=3962.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  12%|█▏        | 149/1208 [04:29<31:53,  1.81s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0906, train/loss_vlb_step=0.000298, train/loss_step=0.0906, global_step=3962.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  12%|█▏        | 149/1208 [04:29<31:53,  1.81s/it, loss=0.147, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00252, train/loss_step=0.392, global_step=3963.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  12%|█▏        | 150/1208 [04:30<31:46,  1.80s/it, loss=0.147, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00252, train/loss_step=0.392, global_step=3963.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  12%|█▏        | 150/1208 [04:30<31:46,  1.80s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000103, train/loss_step=0.0266, global_step=3963.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  12%|█▎        | 151/1208 [04:31<31:39,  1.80s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000103, train/loss_step=0.0266, global_step=3963.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  12%|█▎        | 151/1208 [04:31<31:39,  1.80s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.93e-5, train/loss_step=0.0243, global_step=3963.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  13%|█▎        | 152/1208 [04:34<31:47,  1.81s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.93e-5, train/loss_step=0.0243, global_step=3963.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  13%|█▎        | 152/1208 [04:34<31:47,  1.81s/it, loss=0.125, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=3963.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  13%|█▎        | 153/1208 [04:35<31:40,  1.80s/it, loss=0.125, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=3963.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  13%|█▎        | 153/1208 [04:35<31:40,  1.80s/it, loss=0.162, v_num=0, train/loss_simple_step=0.738, train/loss_vlb_step=0.0297, train/loss_step=0.738, global_step=3964.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  13%|█▎        | 154/1208 [04:36<31:33,  1.80s/it, loss=0.162, v_num=0, train/loss_simple_step=0.738, train/loss_vlb_step=0.0297, train/loss_step=0.738, global_step=3964.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  13%|█▎        | 154/1208 [04:36<31:33,  1.80s/it, loss=0.152, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000628, train/loss_step=0.176, global_step=3964.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  13%|█▎        | 155/1208 [04:37<31:26,  1.79s/it, loss=0.152, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000628, train/loss_step=0.176, global_step=3964.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  13%|█▎        | 155/1208 [04:37<31:26,  1.79s/it, loss=0.153, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00125, train/loss_step=0.269, global_step=3964.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  13%|█▎        | 156/1208 [04:40<31:34,  1.80s/it, loss=0.153, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00125, train/loss_step=0.269, global_step=3964.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  13%|█▎        | 156/1208 [04:40<31:34,  1.80s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.81e-5, train/loss_step=0.00331, global_step=3964.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  13%|█▎        | 157/1208 [04:42<31:28,  1.80s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.81e-5, train/loss_step=0.00331, global_step=3964.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  13%|█▎        | 157/1208 [04:42<31:28,  1.80s/it, loss=0.158, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000443, train/loss_step=0.133, global_step=3965.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  13%|█▎        | 158/1208 [04:43<31:21,  1.79s/it, loss=0.158, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000443, train/loss_step=0.133, global_step=3965.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  13%|█▎        | 158/1208 [04:43<31:21,  1.79s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00485, train/loss_vlb_step=2.5e-5, train/loss_step=0.00485, global_step=3965.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  13%|█▎        | 159/1208 [04:44<31:14,  1.79s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00485, train/loss_vlb_step=2.5e-5, train/loss_step=0.00485, global_step=3965.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  13%|█▎        | 159/1208 [04:44<31:14,  1.79s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.79e-5, train/loss_step=0.00311, global_step=3965.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  13%|█▎        | 160/1208 [04:47<31:22,  1.80s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.79e-5, train/loss_step=0.00311, global_step=3965.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  13%|█▎        | 160/1208 [04:47<31:22,  1.80s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000246, train/loss_step=0.0741, global_step=3965.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  13%|█▎        | 161/1208 [04:48<31:15,  1.79s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000246, train/loss_step=0.0741, global_step=3965.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  13%|█▎        | 161/1208 [04:48<31:15,  1.79s/it, loss=0.164, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.0027, train/loss_step=0.353, global_step=3966.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  13%|█▎        | 162/1208 [04:49<31:09,  1.79s/it, loss=0.164, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.0027, train/loss_step=0.353, global_step=3966.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  13%|█▎        | 162/1208 [04:49<31:09,  1.79s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.19e-5, train/loss_step=0.0177, global_step=3966.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  13%|█▎        | 163/1208 [04:50<31:02,  1.78s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.19e-5, train/loss_step=0.0177, global_step=3966.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  13%|█▎        | 163/1208 [04:50<31:02,  1.78s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0663, train/loss_vlb_step=0.000226, train/loss_step=0.0663, global_step=3966.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  14%|█▎        | 164/1208 [04:53<31:10,  1.79s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0663, train/loss_vlb_step=0.000226, train/loss_step=0.0663, global_step=3966.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  14%|█▎        | 164/1208 [04:53<31:10,  1.79s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.98e-5, train/loss_step=0.0164, global_step=3966.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  14%|█▎        | 165/1208 [04:54<31:03,  1.79s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.98e-5, train/loss_step=0.0164, global_step=3966.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  14%|█▎        | 165/1208 [04:54<31:04,  1.79s/it, loss=0.137, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.19e-5, train/loss_step=0.024, global_step=3967.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  14%|█▎        | 166/1208 [04:55<30:57,  1.78s/it, loss=0.137, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.19e-5, train/loss_step=0.024, global_step=3967.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  14%|█▎        | 166/1208 [04:55<30:57,  1.78s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.27e-5, train/loss_step=0.00208, global_step=3967.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  14%|█▍        | 167/1208 [04:56<30:51,  1.78s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.27e-5, train/loss_step=0.00208, global_step=3967.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  14%|█▍        | 167/1208 [04:56<30:51,  1.78s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0538, train/loss_vlb_step=0.00019, train/loss_step=0.0538, global_step=3967.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  14%|█▍        | 168/1208 [05:00<30:58,  1.79s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0538, train/loss_vlb_step=0.00019, train/loss_step=0.0538, global_step=3967.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  14%|█▍        | 168/1208 [05:00<30:58,  1.79s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0617, train/loss_vlb_step=0.000211, train/loss_step=0.0617, global_step=3967.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  14%|█▍        | 169/1208 [05:01<30:52,  1.78s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0617, train/loss_vlb_step=0.000211, train/loss_step=0.0617, global_step=3967.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  14%|█▍        | 169/1208 [05:01<30:52,  1.78s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00438, train/loss_vlb_step=2.34e-5, train/loss_step=0.00438, global_step=3968.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  14%|█▍        | 170/1208 [05:02<30:45,  1.78s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00438, train/loss_vlb_step=2.34e-5, train/loss_step=0.00438, global_step=3968.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  14%|█▍        | 170/1208 [05:02<30:45,  1.78s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000145, train/loss_step=0.0402, global_step=3968.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  14%|█▍        | 171/1208 [05:03<30:39,  1.77s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000145, train/loss_step=0.0402, global_step=3968.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  14%|█▍        | 171/1208 [05:03<30:39,  1.77s/it, loss=0.108, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.18e-5, train/loss_step=0.011, global_step=3968.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  14%|█▍        | 172/1208 [05:06<30:46,  1.78s/it, loss=0.108, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.18e-5, train/loss_step=0.011, global_step=3968.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  14%|█▍        | 172/1208 [05:06<30:46,  1.78s/it, loss=0.108, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=3968.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  14%|█▍        | 173/1208 [05:07<30:40,  1.78s/it, loss=0.108, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=3968.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  14%|█▍        | 173/1208 [05:07<30:40,  1.78s/it, loss=0.0771, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000428, train/loss_step=0.129, global_step=3969.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  14%|█▍        | 174/1208 [05:08<30:34,  1.77s/it, loss=0.0771, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000428, train/loss_step=0.129, global_step=3969.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  14%|█▍        | 174/1208 [05:08<30:34,  1.77s/it, loss=0.0758, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000495, train/loss_step=0.149, global_step=3969.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  14%|█▍        | 175/1208 [05:09<30:28,  1.77s/it, loss=0.0758, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000495, train/loss_step=0.149, global_step=3969.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  14%|█▍        | 175/1208 [05:09<30:28,  1.77s/it, loss=0.0664, v_num=0, train/loss_simple_step=0.0801, train/loss_vlb_step=0.000266, train/loss_step=0.0801, global_step=3969.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  15%|█▍        | 176/1208 [05:12<30:35,  1.78s/it, loss=0.0664, v_num=0, train/loss_simple_step=0.0801, train/loss_vlb_step=0.000266, train/loss_step=0.0801, global_step=3969.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  15%|█▍        | 176/1208 [05:12<30:35,  1.78s/it, loss=0.07, v_num=0, train/loss_simple_step=0.0751, train/loss_vlb_step=0.000256, train/loss_step=0.0751, global_step=3969.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  15%|█▍        | 177/1208 [05:14<30:29,  1.77s/it, loss=0.07, v_num=0, train/loss_simple_step=0.0751, train/loss_vlb_step=0.000256, train/loss_step=0.0751, global_step=3969.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  15%|█▍        | 177/1208 [05:14<30:29,  1.77s/it, loss=0.064, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.36e-5, train/loss_step=0.0142, global_step=3970.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  15%|█▍        | 178/1208 [05:15<30:23,  1.77s/it, loss=0.064, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.36e-5, train/loss_step=0.0142, global_step=3970.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  15%|█▍        | 178/1208 [05:15<30:23,  1.77s/it, loss=0.0645, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.33e-5, train/loss_step=0.0142, global_step=3970.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  15%|█▍        | 179/1208 [05:16<30:17,  1.77s/it, loss=0.0645, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.33e-5, train/loss_step=0.0142, global_step=3970.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  15%|█▍        | 179/1208 [05:16<30:17,  1.77s/it, loss=0.0659, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000115, train/loss_step=0.0307, global_step=3970.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  15%|█▍        | 180/1208 [05:19<30:24,  1.77s/it, loss=0.0659, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000115, train/loss_step=0.0307, global_step=3970.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  15%|█▍        | 180/1208 [05:19<30:24,  1.77s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00294, train/loss_step=0.398, global_step=3970.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  15%|█▍        | 181/1208 [05:20<30:18,  1.77s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00294, train/loss_step=0.398, global_step=3970.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  15%|█▍        | 181/1208 [05:20<30:18,  1.77s/it, loss=0.0655, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=9.2e-5, train/loss_step=0.0223, global_step=3971.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  15%|█▌        | 182/1208 [05:21<30:12,  1.77s/it, loss=0.0655, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=9.2e-5, train/loss_step=0.0223, global_step=3971.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  15%|█▌        | 182/1208 [05:21<30:12,  1.77s/it, loss=0.0659, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=9.15e-5, train/loss_step=0.0248, global_step=3971.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  15%|█▌        | 183/1208 [05:22<30:06,  1.76s/it, loss=0.0659, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=9.15e-5, train/loss_step=0.0248, global_step=3971.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  15%|█▌        | 183/1208 [05:22<30:06,  1.76s/it, loss=0.0678, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.00034, train/loss_step=0.104, global_step=3971.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  15%|█▌        | 184/1208 [05:25<30:13,  1.77s/it, loss=0.0678, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.00034, train/loss_step=0.104, global_step=3971.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  15%|█▌        | 184/1208 [05:25<30:13,  1.77s/it, loss=0.0778, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000776, train/loss_step=0.216, global_step=3971.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  15%|█▌        | 185/1208 [05:26<30:07,  1.77s/it, loss=0.0778, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000776, train/loss_step=0.216, global_step=3971.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  15%|█▌        | 185/1208 [05:26<30:07,  1.77s/it, loss=0.0817, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=3972.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  15%|█▌        | 186/1208 [05:27<30:01,  1.76s/it, loss=0.0817, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=3972.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  15%|█▌        | 186/1208 [05:27<30:01,  1.76s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.00018, train/loss_step=0.0527, global_step=3972.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  15%|█▌        | 187/1208 [05:28<29:56,  1.76s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.00018, train/loss_step=0.0527, global_step=3972.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  15%|█▌        | 187/1208 [05:28<29:56,  1.76s/it, loss=0.088, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000427, train/loss_step=0.129, global_step=3972.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  16%|█▌        | 188/1208 [05:32<30:02,  1.77s/it, loss=0.088, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000427, train/loss_step=0.129, global_step=3972.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  16%|█▌        | 188/1208 [05:32<30:02,  1.77s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=8.93e-5, train/loss_step=0.0225, global_step=3972.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  16%|█▌        | 189/1208 [05:33<29:56,  1.76s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=8.93e-5, train/loss_step=0.0225, global_step=3972.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  16%|█▌        | 189/1208 [05:33<29:56,  1.76s/it, loss=0.128, v_num=0, train/loss_simple_step=0.849, train/loss_vlb_step=0.0865, train/loss_step=0.849, global_step=3973.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  16%|█▌        | 190/1208 [05:34<29:51,  1.76s/it, loss=0.128, v_num=0, train/loss_simple_step=0.849, train/loss_vlb_step=0.0865, train/loss_step=0.849, global_step=3973.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  16%|█▌        | 190/1208 [05:34<29:51,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.39e-5, train/loss_step=0.00241, global_step=3973.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  16%|█▌        | 191/1208 [05:35<29:45,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.39e-5, train/loss_step=0.00241, global_step=3973.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  16%|█▌        | 191/1208 [05:35<29:45,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.00348, train/loss_step=0.406, global_step=3973.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  16%|█▌        | 192/1208 [05:38<29:51,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.00348, train/loss_step=0.406, global_step=3973.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  16%|█▌        | 192/1208 [05:38<29:51,  1.76s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.63e-5, train/loss_step=0.00286, global_step=3973.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  16%|█▌        | 193/1208 [05:39<29:46,  1.76s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.63e-5, train/loss_step=0.00286, global_step=3973.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  16%|█▌        | 193/1208 [05:39<29:46,  1.76s/it, loss=0.152, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00195, train/loss_step=0.352, global_step=3974.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  16%|█▌        | 194/1208 [05:40<29:40,  1.76s/it, loss=0.152, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00195, train/loss_step=0.352, global_step=3974.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  16%|█▌        | 194/1208 [05:40<29:40,  1.76s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0599, train/loss_vlb_step=0.000214, train/loss_step=0.0599, global_step=3974.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  16%|█▌        | 195/1208 [05:41<29:35,  1.75s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0599, train/loss_vlb_step=0.000214, train/loss_step=0.0599, global_step=3974.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  16%|█▌        | 195/1208 [05:41<29:35,  1.75s/it, loss=0.172, v_num=0, train/loss_simple_step=0.561, train/loss_vlb_step=0.0113, train/loss_step=0.561, global_step=3974.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  16%|█▌        | 196/1208 [05:44<29:40,  1.76s/it, loss=0.172, v_num=0, train/loss_simple_step=0.561, train/loss_vlb_step=0.0113, train/loss_step=0.561, global_step=3974.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  16%|█▌        | 196/1208 [05:44<29:40,  1.76s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0071, train/loss_vlb_step=3.22e-5, train/loss_step=0.0071, global_step=3974.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  16%|█▋        | 197/1208 [05:45<29:35,  1.76s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0071, train/loss_vlb_step=3.22e-5, train/loss_step=0.0071, global_step=3974.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  16%|█▋        | 197/1208 [05:45<29:35,  1.76s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000117, train/loss_step=0.0297, global_step=3975.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  16%|█▋        | 198/1208 [05:47<29:30,  1.75s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000117, train/loss_step=0.0297, global_step=3975.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  16%|█▋        | 198/1208 [05:47<29:30,  1.75s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0908, train/loss_vlb_step=0.000298, train/loss_step=0.0908, global_step=3975.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  16%|█▋        | 199/1208 [05:48<29:24,  1.75s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0908, train/loss_vlb_step=0.000298, train/loss_step=0.0908, global_step=3975.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  16%|█▋        | 199/1208 [05:48<29:24,  1.75s/it, loss=0.183, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000975, train/loss_step=0.221, global_step=3975.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  17%|█▋        | 200/1208 [05:51<29:30,  1.76s/it, loss=0.183, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000975, train/loss_step=0.221, global_step=3975.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  17%|█▋        | 200/1208 [05:51<29:30,  1.76s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00896, train/loss_vlb_step=4.36e-5, train/loss_step=0.00896, global_step=3975.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  17%|█▋        | 201/1208 [05:52<29:25,  1.75s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00896, train/loss_vlb_step=4.36e-5, train/loss_step=0.00896, global_step=3975.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  17%|█▋        | 201/1208 [05:52<29:25,  1.75s/it, loss=0.183, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00337, train/loss_step=0.420, global_step=3976.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  17%|█▋        | 202/1208 [05:53<29:20,  1.75s/it, loss=0.183, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00337, train/loss_step=0.420, global_step=3976.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  17%|█▋        | 202/1208 [05:53<29:20,  1.75s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=5.98e-5, train/loss_step=0.0147, global_step=3976.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  17%|█▋        | 203/1208 [05:54<29:14,  1.75s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=5.98e-5, train/loss_step=0.0147, global_step=3976.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  17%|█▋        | 203/1208 [05:54<29:14,  1.75s/it, loss=0.193, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00166, train/loss_step=0.303, global_step=3976.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  17%|█▋        | 204/1208 [05:57<29:20,  1.75s/it, loss=0.193, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00166, train/loss_step=0.303, global_step=3976.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  17%|█▋        | 204/1208 [05:57<29:20,  1.75s/it, loss=0.187, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=3976.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  17%|█▋        | 205/1208 [05:58<29:15,  1.75s/it, loss=0.187, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=3976.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  17%|█▋        | 205/1208 [05:58<29:15,  1.75s/it, loss=0.203, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00285, train/loss_step=0.414, global_step=3977.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  17%|█▋        | 206/1208 [05:59<29:10,  1.75s/it, loss=0.203, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00285, train/loss_step=0.414, global_step=3977.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  17%|█▋        | 206/1208 [05:59<29:10,  1.75s/it, loss=0.207, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000517, train/loss_step=0.152, global_step=3977.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  17%|█▋        | 207/1208 [06:00<29:05,  1.74s/it, loss=0.207, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000517, train/loss_step=0.152, global_step=3977.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  17%|█▋        | 207/1208 [06:00<29:05,  1.74s/it, loss=0.201, v_num=0, train/loss_simple_step=0.00875, train/loss_vlb_step=4.18e-5, train/loss_step=0.00875, global_step=3977.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  17%|█▋        | 208/1208 [06:04<29:10,  1.75s/it, loss=0.201, v_num=0, train/loss_simple_step=0.00875, train/loss_vlb_step=4.18e-5, train/loss_step=0.00875, global_step=3977.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  17%|█▋        | 208/1208 [06:04<29:10,  1.75s/it, loss=0.201, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.75e-5, train/loss_step=0.012, global_step=3977.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  17%|█▋        | 209/1208 [06:05<29:05,  1.75s/it, loss=0.201, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.75e-5, train/loss_step=0.012, global_step=3977.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  17%|█▋        | 209/1208 [06:05<29:05,  1.75s/it, loss=0.168, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000695, train/loss_step=0.186, global_step=3978.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  17%|█▋        | 210/1208 [06:06<29:00,  1.74s/it, loss=0.168, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000695, train/loss_step=0.186, global_step=3978.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  17%|█▋        | 210/1208 [06:06<29:00,  1.74s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.5e-5, train/loss_step=0.0177, global_step=3978.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  17%|█▋        | 211/1208 [06:07<28:55,  1.74s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.5e-5, train/loss_step=0.0177, global_step=3978.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  17%|█▋        | 211/1208 [06:07<28:55,  1.74s/it, loss=0.165, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00176, train/loss_step=0.331, global_step=3978.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  18%|█▊        | 212/1208 [06:10<29:00,  1.75s/it, loss=0.165, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00176, train/loss_step=0.331, global_step=3978.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  18%|█▊        | 212/1208 [06:10<29:00,  1.75s/it, loss=0.186, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00242, train/loss_step=0.425, global_step=3978.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  18%|█▊        | 213/1208 [06:11<28:55,  1.74s/it, loss=0.186, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00242, train/loss_step=0.425, global_step=3978.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  18%|█▊        | 213/1208 [06:11<28:55,  1.74s/it, loss=0.178, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000728, train/loss_step=0.202, global_step=3979.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  18%|█▊        | 214/1208 [06:12<28:50,  1.74s/it, loss=0.178, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000728, train/loss_step=0.202, global_step=3979.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  18%|█▊        | 214/1208 [06:12<28:50,  1.74s/it, loss=0.187, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.00089, train/loss_step=0.227, global_step=3979.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  18%|█▊        | 215/1208 [06:13<28:45,  1.74s/it, loss=0.187, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.00089, train/loss_step=0.227, global_step=3979.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  18%|█▊        | 215/1208 [06:13<28:45,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0626, train/loss_vlb_step=0.00021, train/loss_step=0.0626, global_step=3979.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  18%|█▊        | 216/1208 [06:16<28:50,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0626, train/loss_vlb_step=0.00021, train/loss_step=0.0626, global_step=3979.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  18%|█▊        | 216/1208 [06:16<28:50,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00823, train/loss_vlb_step=4.06e-5, train/loss_step=0.00823, global_step=3979.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  18%|█▊        | 217/1208 [06:17<28:45,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00823, train/loss_vlb_step=4.06e-5, train/loss_step=0.00823, global_step=3979.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  18%|█▊        | 217/1208 [06:17<28:45,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.0004, train/loss_step=0.121, global_step=3980.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]     Epoch 13:  18%|█▊        | 218/1208 [06:18<28:41,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.0004, train/loss_step=0.121, global_step=3980.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  18%|█▊        | 218/1208 [06:18<28:41,  1.74s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0502, train/loss_vlb_step=0.000182, train/loss_step=0.0502, global_step=3980.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  18%|█▊        | 219/1208 [06:20<28:36,  1.74s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0502, train/loss_vlb_step=0.000182, train/loss_step=0.0502, global_step=3980.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  18%|█▊        | 219/1208 [06:20<28:36,  1.74s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0751, train/loss_vlb_step=0.000255, train/loss_step=0.0751, global_step=3980.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  18%|█▊        | 220/1208 [06:23<28:40,  1.74s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0751, train/loss_vlb_step=0.000255, train/loss_step=0.0751, global_step=3980.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  18%|█▊        | 220/1208 [06:23<28:40,  1.74s/it, loss=0.161, v_num=0, train/loss_simple_step=0.088, train/loss_vlb_step=0.00029, train/loss_step=0.088, global_step=3980.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  18%|█▊        | 221/1208 [06:24<28:36,  1.74s/it, loss=0.161, v_num=0, train/loss_simple_step=0.088, train/loss_vlb_step=0.00029, train/loss_step=0.088, global_step=3980.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  18%|█▊        | 221/1208 [06:24<28:36,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00404, train/loss_vlb_step=2.09e-5, train/loss_step=0.00404, global_step=3981.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  18%|█▊        | 222/1208 [06:25<28:31,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00404, train/loss_vlb_step=2.09e-5, train/loss_step=0.00404, global_step=3981.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  18%|█▊        | 222/1208 [06:25<28:31,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000394, train/loss_step=0.119, global_step=3981.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  18%|█▊        | 223/1208 [06:26<28:26,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000394, train/loss_step=0.119, global_step=3981.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  18%|█▊        | 223/1208 [06:26<28:26,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9.08e-5, train/loss_step=0.0224, global_step=3981.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  19%|█▊        | 224/1208 [06:29<28:31,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9.08e-5, train/loss_step=0.0224, global_step=3981.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  19%|█▊        | 224/1208 [06:29<28:31,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000462, train/loss_step=0.138, global_step=3981.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  19%|█▊        | 225/1208 [06:30<28:26,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000462, train/loss_step=0.138, global_step=3981.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  19%|█▊        | 225/1208 [06:30<28:26,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=1.09e-5, train/loss_step=0.00183, global_step=3982.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  19%|█▊        | 226/1208 [06:31<28:21,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=1.09e-5, train/loss_step=0.00183, global_step=3982.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  19%|█▊        | 226/1208 [06:31<28:21,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.00011, train/loss_step=0.0278, global_step=3982.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  19%|█▉        | 227/1208 [06:32<28:17,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.00011, train/loss_step=0.0278, global_step=3982.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  19%|█▉        | 227/1208 [06:32<28:17,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.00036, train/loss_step=0.109, global_step=3982.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  19%|█▉        | 228/1208 [06:35<28:21,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.00036, train/loss_step=0.109, global_step=3982.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  19%|█▉        | 228/1208 [06:35<28:21,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0693, train/loss_vlb_step=0.000241, train/loss_step=0.0693, global_step=3982.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  19%|█▉        | 229/1208 [06:36<28:17,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0693, train/loss_vlb_step=0.000241, train/loss_step=0.0693, global_step=3982.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  19%|█▉        | 229/1208 [06:36<28:17,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0247, train/loss_vlb_step=9.85e-5, train/loss_step=0.0247, global_step=3983.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  19%|█▉        | 230/1208 [06:37<28:12,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0247, train/loss_vlb_step=9.85e-5, train/loss_step=0.0247, global_step=3983.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  19%|█▉        | 230/1208 [06:37<28:12,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000406, train/loss_step=0.123, global_step=3983.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  19%|█▉        | 231/1208 [06:39<28:07,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000406, train/loss_step=0.123, global_step=3983.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  19%|█▉        | 231/1208 [06:39<28:07,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00308, train/loss_step=0.398, global_step=3983.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  19%|█▉        | 232/1208 [06:42<28:12,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00308, train/loss_step=0.398, global_step=3983.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  19%|█▉        | 232/1208 [06:42<28:12,  1.73s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.0981, train/loss_vlb_step=0.000322, train/loss_step=0.0981, global_step=3983.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  19%|█▉        | 233/1208 [06:43<28:07,  1.73s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.0981, train/loss_vlb_step=0.000322, train/loss_step=0.0981, global_step=3983.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  19%|█▉        | 233/1208 [06:43<28:07,  1.73s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000859, train/loss_step=0.227, global_step=3984.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  19%|█▉        | 234/1208 [06:44<28:03,  1.73s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000859, train/loss_step=0.227, global_step=3984.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  19%|█▉        | 234/1208 [06:44<28:03,  1.73s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000768, train/loss_step=0.209, global_step=3984.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  19%|█▉        | 235/1208 [06:45<27:58,  1.73s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000768, train/loss_step=0.209, global_step=3984.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  19%|█▉        | 235/1208 [06:45<27:58,  1.73s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.044, train/loss_vlb_step=0.00016, train/loss_step=0.044, global_step=3984.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  20%|█▉        | 236/1208 [06:48<28:03,  1.73s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.044, train/loss_vlb_step=0.00016, train/loss_step=0.044, global_step=3984.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  20%|█▉        | 236/1208 [06:48<28:03,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000582, train/loss_step=0.166, global_step=3984.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  20%|█▉        | 237/1208 [06:49<27:58,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000582, train/loss_step=0.166, global_step=3984.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  20%|█▉        | 237/1208 [06:49<27:58,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000407, train/loss_step=0.123, global_step=3985.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  20%|█▉        | 238/1208 [06:50<27:54,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000407, train/loss_step=0.123, global_step=3985.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  20%|█▉        | 238/1208 [06:50<27:54,  1.73s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000154, train/loss_step=0.0386, global_step=3985.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  20%|█▉        | 239/1208 [06:51<27:49,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000154, train/loss_step=0.0386, global_step=3985.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  20%|█▉        | 239/1208 [06:51<27:49,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=3985.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  20%|█▉        | 240/1208 [06:55<27:54,  1.73s/it, loss=0.107, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=3985.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  20%|█▉        | 240/1208 [06:55<27:54,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=3985.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  20%|█▉        | 241/1208 [06:56<27:49,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=3985.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  20%|█▉        | 241/1208 [06:56<27:49,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000467, train/loss_step=0.137, global_step=3986.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  20%|██        | 242/1208 [06:57<27:45,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000467, train/loss_step=0.137, global_step=3986.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  20%|██        | 242/1208 [06:57<27:45,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0568, train/loss_vlb_step=0.000197, train/loss_step=0.0568, global_step=3986.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  20%|██        | 243/1208 [06:58<27:40,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0568, train/loss_vlb_step=0.000197, train/loss_step=0.0568, global_step=3986.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  20%|██        | 243/1208 [06:58<27:40,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.745, train/loss_vlb_step=0.0946, train/loss_step=0.745, global_step=3986.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  20%|██        | 244/1208 [07:01<27:44,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.745, train/loss_vlb_step=0.0946, train/loss_step=0.745, global_step=3986.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  20%|██        | 244/1208 [07:01<27:44,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000338, train/loss_step=0.103, global_step=3986.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  20%|██        | 245/1208 [07:02<27:40,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000338, train/loss_step=0.103, global_step=3986.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  20%|██        | 245/1208 [07:02<27:40,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00505, train/loss_step=0.457, global_step=3987.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  20%|██        | 246/1208 [07:03<27:36,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00505, train/loss_step=0.457, global_step=3987.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  20%|██        | 246/1208 [07:03<27:36,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00197, train/loss_step=0.324, global_step=3987.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  20%|██        | 247/1208 [07:04<27:31,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00197, train/loss_step=0.324, global_step=3987.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  20%|██        | 247/1208 [07:04<27:31,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0825, train/loss_vlb_step=0.000275, train/loss_step=0.0825, global_step=3987.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  21%|██        | 248/1208 [07:07<27:35,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0825, train/loss_vlb_step=0.000275, train/loss_step=0.0825, global_step=3987.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  21%|██        | 248/1208 [07:07<27:35,  1.72s/it, loss=0.185, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.00044, train/loss_step=0.133, global_step=3987.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  21%|██        | 249/1208 [07:08<27:31,  1.72s/it, loss=0.185, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.00044, train/loss_step=0.133, global_step=3987.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  21%|██        | 249/1208 [07:08<27:31,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0751, train/loss_vlb_step=0.000252, train/loss_step=0.0751, global_step=3988.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  21%|██        | 250/1208 [07:09<27:27,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0751, train/loss_vlb_step=0.000252, train/loss_step=0.0751, global_step=3988.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  21%|██        | 250/1208 [07:09<27:27,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.4e-5, train/loss_step=0.019, global_step=3988.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  21%|██        | 251/1208 [07:10<27:22,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.4e-5, train/loss_step=0.019, global_step=3988.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  21%|██        | 251/1208 [07:10<27:22,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.000954, train/loss_step=0.260, global_step=3988.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  21%|██        | 252/1208 [07:14<27:27,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.000954, train/loss_step=0.260, global_step=3988.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  21%|██        | 252/1208 [07:14<27:27,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0994, train/loss_vlb_step=0.000328, train/loss_step=0.0994, global_step=3988.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  21%|██        | 253/1208 [07:15<27:22,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0994, train/loss_vlb_step=0.000328, train/loss_step=0.0994, global_step=3988.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  21%|██        | 253/1208 [07:15<27:22,  1.72s/it, loss=0.165, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.91e-5, train/loss_step=0.019, global_step=3989.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  21%|██        | 254/1208 [07:16<27:18,  1.72s/it, loss=0.165, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.91e-5, train/loss_step=0.019, global_step=3989.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  21%|██        | 254/1208 [07:16<27:18,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000469, train/loss_step=0.141, global_step=3989.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  21%|██        | 255/1208 [07:17<27:14,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000469, train/loss_step=0.141, global_step=3989.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  21%|██        | 255/1208 [07:17<27:14,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0566, train/loss_vlb_step=0.000191, train/loss_step=0.0566, global_step=3989.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  21%|██        | 256/1208 [07:20<27:18,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0566, train/loss_vlb_step=0.000191, train/loss_step=0.0566, global_step=3989.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  21%|██        | 256/1208 [07:20<27:18,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00208, train/loss_step=0.366, global_step=3989.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  21%|██▏       | 257/1208 [07:21<27:14,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00208, train/loss_step=0.366, global_step=3989.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  21%|██▏       | 257/1208 [07:21<27:14,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0629, train/loss_vlb_step=0.000211, train/loss_step=0.0629, global_step=3990.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  21%|██▏       | 258/1208 [07:22<27:09,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0629, train/loss_vlb_step=0.000211, train/loss_step=0.0629, global_step=3990.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  21%|██▏       | 258/1208 [07:22<27:09,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0943, train/loss_vlb_step=0.000313, train/loss_step=0.0943, global_step=3990.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  21%|██▏       | 259/1208 [07:23<27:05,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0943, train/loss_vlb_step=0.000313, train/loss_step=0.0943, global_step=3990.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  21%|██▏       | 259/1208 [07:23<27:05,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=2.47e-5, train/loss_step=0.00469, global_step=3990.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  22%|██▏       | 260/1208 [07:26<27:09,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=2.47e-5, train/loss_step=0.00469, global_step=3990.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  22%|██▏       | 260/1208 [07:26<27:09,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000515, train/loss_step=0.154, global_step=3990.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  22%|██▏       | 261/1208 [07:27<27:05,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000515, train/loss_step=0.154, global_step=3990.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  22%|██▏       | 261/1208 [07:27<27:05,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.508, train/loss_vlb_step=0.00854, train/loss_step=0.508, global_step=3991.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  22%|██▏       | 262/1208 [07:28<27:01,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.508, train/loss_vlb_step=0.00854, train/loss_step=0.508, global_step=3991.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  22%|██▏       | 262/1208 [07:28<27:01,  1.71s/it, loss=0.196, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000779, train/loss_step=0.220, global_step=3991.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  22%|██▏       | 263/1208 [07:30<26:56,  1.71s/it, loss=0.196, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000779, train/loss_step=0.220, global_step=3991.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  22%|██▏       | 263/1208 [07:30<26:56,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=7e-5, train/loss_step=0.016, global_step=3991.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]     Epoch 13:  22%|██▏       | 264/1208 [07:33<27:00,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=7e-5, train/loss_step=0.016, global_step=3991.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  22%|██▏       | 264/1208 [07:33<27:00,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00581, train/loss_vlb_step=3.01e-5, train/loss_step=0.00581, global_step=3991.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  22%|██▏       | 265/1208 [07:34<26:56,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00581, train/loss_vlb_step=3.01e-5, train/loss_step=0.00581, global_step=3991.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  22%|██▏       | 265/1208 [07:34<26:56,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000572, train/loss_step=0.169, global_step=3992.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  22%|██▏       | 266/1208 [07:35<26:52,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000572, train/loss_step=0.169, global_step=3992.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  22%|██▏       | 266/1208 [07:35<26:52,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000116, train/loss_step=0.0283, global_step=3992.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  22%|██▏       | 267/1208 [07:36<26:48,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000116, train/loss_step=0.0283, global_step=3992.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  22%|██▏       | 267/1208 [07:36<26:48,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0531, train/loss_vlb_step=0.000185, train/loss_step=0.0531, global_step=3992.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  22%|██▏       | 268/1208 [07:39<26:52,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0531, train/loss_vlb_step=0.000185, train/loss_step=0.0531, global_step=3992.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  22%|██▏       | 268/1208 [07:39<26:52,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000431, train/loss_step=0.131, global_step=3992.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  22%|██▏       | 269/1208 [07:40<26:48,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000431, train/loss_step=0.131, global_step=3992.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  22%|██▏       | 269/1208 [07:40<26:48,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.00013, train/loss_step=0.0352, global_step=3993.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  22%|██▏       | 270/1208 [07:41<26:44,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.00013, train/loss_step=0.0352, global_step=3993.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  22%|██▏       | 270/1208 [07:41<26:44,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000118, train/loss_step=0.0307, global_step=3993.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  22%|██▏       | 271/1208 [07:42<26:40,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000118, train/loss_step=0.0307, global_step=3993.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  22%|██▏       | 271/1208 [07:42<26:40,  1.71s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00826, train/loss_vlb_step=4.1e-5, train/loss_step=0.00826, global_step=3993.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  23%|██▎       | 272/1208 [07:46<26:43,  1.71s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00826, train/loss_vlb_step=4.1e-5, train/loss_step=0.00826, global_step=3993.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  23%|██▎       | 272/1208 [07:46<26:43,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.86e-5, train/loss_step=0.00331, global_step=3993.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  23%|██▎       | 273/1208 [07:47<26:39,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.86e-5, train/loss_step=0.00331, global_step=3993.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  23%|██▎       | 273/1208 [07:47<26:40,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00874, train/loss_vlb_step=4.29e-5, train/loss_step=0.00874, global_step=3994.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  23%|██▎       | 274/1208 [07:48<26:36,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00874, train/loss_vlb_step=4.29e-5, train/loss_step=0.00874, global_step=3994.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  23%|██▎       | 274/1208 [07:48<26:36,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.440, train/loss_vlb_step=0.00511, train/loss_step=0.440, global_step=3994.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]     Epoch 13:  23%|██▎       | 275/1208 [07:49<26:32,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.440, train/loss_vlb_step=0.00511, train/loss_step=0.440, global_step=3994.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  23%|██▎       | 275/1208 [07:49<26:32,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000779, train/loss_step=0.215, global_step=3994.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  23%|██▎       | 276/1208 [07:52<26:35,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000779, train/loss_step=0.215, global_step=3994.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  23%|██▎       | 276/1208 [07:52<26:35,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000762, train/loss_step=0.212, global_step=3994.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  23%|██▎       | 277/1208 [07:53<26:31,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000762, train/loss_step=0.212, global_step=3994.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  23%|██▎       | 277/1208 [07:53<26:31,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.000123, train/loss_step=0.0316, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  23%|██▎       | 278/1208 [07:54<26:27,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.000123, train/loss_step=0.0316, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  23%|██▎       | 278/1208 [07:54<26:27,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.459, train/loss_vlb_step=0.00428, train/loss_step=0.459, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  23%|██▎       | 279/1208 [07:55<26:23,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.459, train/loss_vlb_step=0.00428, train/loss_step=0.459, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  23%|██▎       | 279/1208 [07:55<26:23,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00534, train/loss_vlb_step=2.9e-5, train/loss_step=0.00534, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  23%|██▎       | 280/1208 [07:58<26:27,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00534, train/loss_vlb_step=2.9e-5, train/loss_step=0.00534, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  23%|██▎       | 280/1208 [07:58<26:27,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000644, train/loss_step=0.182, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  23%|██▎       | 281/1208 [07:59<26:23,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000644, train/loss_step=0.182, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  23%|██▎       | 281/1208 [07:59<26:23,  1.71s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=9.6e-5, train/loss_step=0.0261, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  23%|██▎       | 282/1208 [08:01<26:19,  1.71s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=9.6e-5, train/loss_step=0.0261, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  23%|██▎       | 282/1208 [08:01<26:19,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.19e-5, train/loss_step=0.0194, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  23%|██▎       | 283/1208 [08:02<26:15,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.19e-5, train/loss_step=0.0194, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  23%|██▎       | 283/1208 [08:02<26:15,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=9.02e-5, train/loss_step=0.022, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  24%|██▎       | 284/1208 [08:05<26:18,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=9.02e-5, train/loss_step=0.022, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  24%|██▎       | 284/1208 [08:05<26:18,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.052, train/loss_vlb_step=0.000188, train/loss_step=0.052, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  24%|██▎       | 285/1208 [08:06<26:15,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.052, train/loss_vlb_step=0.000188, train/loss_step=0.052, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  24%|██▎       | 285/1208 [08:06<26:15,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.451, train/loss_vlb_step=0.00286, train/loss_step=0.451, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  24%|██▎       | 286/1208 [08:07<26:11,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.451, train/loss_vlb_step=0.00286, train/loss_step=0.451, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  24%|██▎       | 286/1208 [08:07<26:11,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.11e-5, train/loss_step=0.0208, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  24%|██▍       | 287/1208 [08:08<26:07,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.11e-5, train/loss_step=0.0208, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  24%|██▍       | 287/1208 [08:08<26:07,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000688, train/loss_step=0.194, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  24%|██▍       | 288/1208 [08:11<26:10,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000688, train/loss_step=0.194, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  24%|██▍       | 288/1208 [08:11<26:10,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00133, train/loss_step=0.275, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  24%|██▍       | 289/1208 [08:12<26:06,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00133, train/loss_step=0.275, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  24%|██▍       | 289/1208 [08:12<26:06,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000925, train/loss_step=0.236, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  24%|██▍       | 290/1208 [08:13<26:03,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000925, train/loss_step=0.236, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  24%|██▍       | 290/1208 [08:13<26:03,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.00359, train/loss_step=0.400, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  24%|██▍       | 291/1208 [08:14<25:59,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.00359, train/loss_step=0.400, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  24%|██▍       | 291/1208 [08:14<25:59,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0513, train/loss_vlb_step=0.000175, train/loss_step=0.0513, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  24%|██▍       | 292/1208 [08:18<26:02,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0513, train/loss_vlb_step=0.000175, train/loss_step=0.0513, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  24%|██▍       | 292/1208 [08:18<26:02,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00126, train/loss_step=0.281, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  24%|██▍       | 293/1208 [08:19<25:58,  1.70s/it, loss=0.179, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00126, train/loss_step=0.281, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  24%|██▍       | 293/1208 [08:19<25:59,  1.70s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000135, train/loss_step=0.0364, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  24%|██▍       | 294/1208 [08:20<25:55,  1.70s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000135, train/loss_step=0.0364, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  24%|██▍       | 294/1208 [08:20<25:55,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000449, train/loss_step=0.134, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  24%|██▍       | 295/1208 [08:21<25:51,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000449, train/loss_step=0.134, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  24%|██▍       | 295/1208 [08:21<25:51,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0966, train/loss_vlb_step=0.000321, train/loss_step=0.0966, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  25%|██▍       | 296/1208 [08:24<25:54,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0966, train/loss_vlb_step=0.000321, train/loss_step=0.0966, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  25%|██▍       | 296/1208 [08:24<25:54,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00235, train/loss_step=0.367, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  25%|██▍       | 297/1208 [08:25<25:50,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00235, train/loss_step=0.367, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  25%|██▍       | 297/1208 [08:25<25:50,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=1.37e-5, train/loss_step=0.00239, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  25%|██▍       | 298/1208 [08:26<25:47,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=1.37e-5, train/loss_step=0.00239, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  25%|██▍       | 298/1208 [08:26<25:47,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00235, train/loss_step=0.367, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  25%|██▍       | 299/1208 [08:27<25:43,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00235, train/loss_step=0.367, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  25%|██▍       | 299/1208 [08:27<25:43,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=2.47e-5, train/loss_step=0.00464, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  25%|██▍       | 300/1208 [08:30<25:46,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=2.47e-5, train/loss_step=0.00464, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  25%|██▍       | 300/1208 [08:30<25:46,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.89e-5, train/loss_step=0.0136, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.75it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.83it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.76it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.83it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.76it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.78it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.78it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.76it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.75it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.76it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.76it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.76it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.78it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.78it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.75it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.79it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.75it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.75it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.75it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.75it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.75it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.81it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 13:  25%|██▍       | 301/1208 [09:01<27:12,  1.80s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.89e-5, train/loss_step=0.0136, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  25%|██▍       | 301/1208 [09:01<27:12,  1.80s/it, loss=0.161, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000727, train/loss_step=0.200, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  25%|██▌       | 302/1208 [09:02<27:08,  1.80s/it, loss=0.161, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000727, train/loss_step=0.200, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  25%|██▌       | 302/1208 [09:02<27:08,  1.80s/it, loss=0.195, v_num=0, train/loss_simple_step=0.687, train/loss_vlb_step=0.0503, train/loss_step=0.687, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  25%|██▌       | 303/1208 [09:03<27:04,  1.79s/it, loss=0.195, v_num=0, train/loss_simple_step=0.687, train/loss_vlb_step=0.0503, train/loss_step=0.687, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  25%|██▌       | 303/1208 [09:03<27:04,  1.79s/it, loss=0.194, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=2.22e-5, train/loss_step=0.00413, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  25%|██▌       | 304/1208 [09:06<27:06,  1.80s/it, loss=0.194, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=2.22e-5, train/loss_step=0.00413, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  25%|██▌       | 304/1208 [09:06<27:06,  1.80s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0699, train/loss_vlb_step=0.000236, train/loss_step=0.0699, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  25%|██▌       | 305/1208 [09:07<27:02,  1.80s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0699, train/loss_vlb_step=0.000236, train/loss_step=0.0699, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  25%|██▌       | 305/1208 [09:07<27:02,  1.80s/it, loss=0.203, v_num=0, train/loss_simple_step=0.624, train/loss_vlb_step=0.0146, train/loss_step=0.624, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  25%|██▌       | 306/1208 [09:08<26:58,  1.79s/it, loss=0.203, v_num=0, train/loss_simple_step=0.624, train/loss_vlb_step=0.0146, train/loss_step=0.624, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  25%|██▌       | 306/1208 [09:08<26:58,  1.79s/it, loss=0.249, v_num=0, train/loss_simple_step=0.940, train/loss_vlb_step=0.473, train/loss_step=0.940, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  25%|██▌       | 307/1208 [09:09<26:54,  1.79s/it, loss=0.249, v_num=0, train/loss_simple_step=0.940, train/loss_vlb_step=0.473, train/loss_step=0.940, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  25%|██▌       | 307/1208 [09:09<26:54,  1.79s/it, loss=0.24, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.47e-5, train/loss_step=0.00254, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  25%|██▌       | 308/1208 [09:13<26:56,  1.80s/it, loss=0.24, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.47e-5, train/loss_step=0.00254, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  25%|██▌       | 308/1208 [09:13<26:56,  1.80s/it, loss=0.227, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.13e-5, train/loss_step=0.0177, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  26%|██▌       | 309/1208 [09:14<26:52,  1.79s/it, loss=0.227, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.13e-5, train/loss_step=0.0177, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  26%|██▌       | 309/1208 [09:14<26:52,  1.79s/it, loss=0.223, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000535, train/loss_step=0.156, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  26%|██▌       | 310/1208 [09:15<26:48,  1.79s/it, loss=0.223, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000535, train/loss_step=0.156, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  26%|██▌       | 310/1208 [09:15<26:48,  1.79s/it, loss=0.217, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00121, train/loss_step=0.279, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  26%|██▌       | 311/1208 [09:16<26:44,  1.79s/it, loss=0.217, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00121, train/loss_step=0.279, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  26%|██▌       | 311/1208 [09:16<26:44,  1.79s/it, loss=0.245, v_num=0, train/loss_simple_step=0.612, train/loss_vlb_step=0.0133, train/loss_step=0.612, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  26%|██▌       | 312/1208 [09:19<26:47,  1.79s/it, loss=0.245, v_num=0, train/loss_simple_step=0.612, train/loss_vlb_step=0.0133, train/loss_step=0.612, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  26%|██▌       | 312/1208 [09:19<26:47,  1.79s/it, loss=0.234, v_num=0, train/loss_simple_step=0.0647, train/loss_vlb_step=0.000222, train/loss_step=0.0647, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  26%|██▌       | 313/1208 [09:20<26:43,  1.79s/it, loss=0.234, v_num=0, train/loss_simple_step=0.0647, train/loss_vlb_step=0.000222, train/loss_step=0.0647, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  26%|██▌       | 313/1208 [09:20<26:43,  1.79s/it, loss=0.235, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000175, train/loss_step=0.0478, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  26%|██▌       | 314/1208 [09:21<26:39,  1.79s/it, loss=0.235, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000175, train/loss_step=0.0478, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  26%|██▌       | 314/1208 [09:21<26:39,  1.79s/it, loss=0.228, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.25e-5, train/loss_step=0.00208, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  26%|██▌       | 315/1208 [09:22<26:35,  1.79s/it, loss=0.228, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.25e-5, train/loss_step=0.00208, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  26%|██▌       | 315/1208 [09:22<26:35,  1.79s/it, loss=0.223, v_num=0, train/loss_simple_step=0.00517, train/loss_vlb_step=2.74e-5, train/loss_step=0.00517, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  26%|██▌       | 316/1208 [09:26<26:37,  1.79s/it, loss=0.223, v_num=0, train/loss_simple_step=0.00517, train/loss_vlb_step=2.74e-5, train/loss_step=0.00517, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  26%|██▌       | 316/1208 [09:26<26:37,  1.79s/it, loss=0.211, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000379, train/loss_step=0.114, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  26%|██▌       | 317/1208 [09:27<26:34,  1.79s/it, loss=0.211, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000379, train/loss_step=0.114, global_step=4e+3, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  26%|██▌       | 317/1208 [09:27<26:34,  1.79s/it, loss=0.243, v_num=0, train/loss_simple_step=0.656, train/loss_vlb_step=0.0216, train/loss_step=0.656, global_step=4005.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  26%|██▋       | 318/1208 [09:28<26:30,  1.79s/it, loss=0.243, v_num=0, train/loss_simple_step=0.656, train/loss_vlb_step=0.0216, train/loss_step=0.656, global_step=4005.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  26%|██▋       | 318/1208 [09:28<26:30,  1.79s/it, loss=0.235, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000703, train/loss_step=0.202, global_step=4005.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  26%|██▋       | 319/1208 [09:29<26:26,  1.78s/it, loss=0.235, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000703, train/loss_step=0.202, global_step=4005.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  26%|██▋       | 319/1208 [09:29<26:26,  1.78s/it, loss=0.235, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.5e-5, train/loss_step=0.00257, global_step=4005.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  26%|██▋       | 320/1208 [09:32<26:28,  1.79s/it, loss=0.235, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.5e-5, train/loss_step=0.00257, global_step=4005.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  26%|██▋       | 320/1208 [09:32<26:28,  1.79s/it, loss=0.25, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00148, train/loss_step=0.312, global_step=4005.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  27%|██▋       | 321/1208 [09:33<26:24,  1.79s/it, loss=0.25, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00148, train/loss_step=0.312, global_step=4005.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  27%|██▋       | 321/1208 [09:33<26:24,  1.79s/it, loss=0.241, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.45e-5, train/loss_step=0.0149, global_step=4006.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  27%|██▋       | 322/1208 [09:34<26:20,  1.78s/it, loss=0.241, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.45e-5, train/loss_step=0.0149, global_step=4006.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  27%|██▋       | 322/1208 [09:34<26:20,  1.78s/it, loss=0.221, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.0011, train/loss_step=0.289, global_step=4006.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  27%|██▋       | 323/1208 [09:35<26:17,  1.78s/it, loss=0.221, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.0011, train/loss_step=0.289, global_step=4006.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  27%|██▋       | 323/1208 [09:35<26:17,  1.78s/it, loss=0.225, v_num=0, train/loss_simple_step=0.0966, train/loss_vlb_step=0.000319, train/loss_step=0.0966, global_step=4006.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  27%|██▋       | 324/1208 [09:38<26:19,  1.79s/it, loss=0.225, v_num=0, train/loss_simple_step=0.0966, train/loss_vlb_step=0.000319, train/loss_step=0.0966, global_step=4006.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  27%|██▋       | 324/1208 [09:38<26:19,  1.79s/it, loss=0.223, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000105, train/loss_step=0.026, global_step=4006.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  27%|██▋       | 325/1208 [09:39<26:15,  1.78s/it, loss=0.223, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000105, train/loss_step=0.026, global_step=4006.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  27%|██▋       | 325/1208 [09:39<26:15,  1.78s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00763, train/loss_vlb_step=3.86e-5, train/loss_step=0.00763, global_step=4007.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  27%|██▋       | 326/1208 [09:40<26:11,  1.78s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00763, train/loss_vlb_step=3.86e-5, train/loss_step=0.00763, global_step=4007.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  27%|██▋       | 326/1208 [09:40<26:11,  1.78s/it, loss=0.151, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=4007.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  27%|██▋       | 327/1208 [09:41<26:07,  1.78s/it, loss=0.151, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=4007.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  27%|██▋       | 327/1208 [09:41<26:07,  1.78s/it, loss=0.158, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000526, train/loss_step=0.160, global_step=4007.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  27%|██▋       | 328/1208 [09:45<26:10,  1.78s/it, loss=0.158, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000526, train/loss_step=0.160, global_step=4007.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  27%|██▋       | 328/1208 [09:45<26:10,  1.78s/it, loss=0.163, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=4007.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  27%|██▋       | 329/1208 [09:46<26:06,  1.78s/it, loss=0.163, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=4007.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  27%|██▋       | 329/1208 [09:46<26:06,  1.78s/it, loss=0.174, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00237, train/loss_step=0.381, global_step=4008.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  27%|██▋       | 330/1208 [09:47<26:02,  1.78s/it, loss=0.174, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00237, train/loss_step=0.381, global_step=4008.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  27%|██▋       | 330/1208 [09:47<26:02,  1.78s/it, loss=0.166, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=4008.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  27%|██▋       | 331/1208 [09:48<25:58,  1.78s/it, loss=0.166, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=4008.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  27%|██▋       | 331/1208 [09:48<25:58,  1.78s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.86e-5, train/loss_step=0.0187, global_step=4008.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  27%|██▋       | 332/1208 [09:51<26:00,  1.78s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.86e-5, train/loss_step=0.0187, global_step=4008.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  27%|██▋       | 332/1208 [09:51<26:00,  1.78s/it, loss=0.147, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00137, train/loss_step=0.288, global_step=4008.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  28%|██▊       | 333/1208 [09:52<25:57,  1.78s/it, loss=0.147, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00137, train/loss_step=0.288, global_step=4008.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  28%|██▊       | 333/1208 [09:52<25:57,  1.78s/it, loss=0.147, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.000143, train/loss_step=0.038, global_step=4009.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  28%|██▊       | 334/1208 [09:53<25:53,  1.78s/it, loss=0.147, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.000143, train/loss_step=0.038, global_step=4009.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  28%|██▊       | 334/1208 [09:53<25:53,  1.78s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000115, train/loss_step=0.0304, global_step=4009.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  28%|██▊       | 335/1208 [09:54<25:49,  1.78s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000115, train/loss_step=0.0304, global_step=4009.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  28%|██▊       | 335/1208 [09:54<25:49,  1.78s/it, loss=0.177, v_num=0, train/loss_simple_step=0.577, train/loss_vlb_step=0.00834, train/loss_step=0.577, global_step=4009.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  28%|██▊       | 336/1208 [09:57<25:51,  1.78s/it, loss=0.177, v_num=0, train/loss_simple_step=0.577, train/loss_vlb_step=0.00834, train/loss_step=0.577, global_step=4009.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  28%|██▊       | 336/1208 [09:57<25:51,  1.78s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00849, train/loss_vlb_step=4.14e-5, train/loss_step=0.00849, global_step=4009.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  28%|██▊       | 337/1208 [09:59<25:48,  1.78s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00849, train/loss_vlb_step=4.14e-5, train/loss_step=0.00849, global_step=4009.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  28%|██▊       | 337/1208 [09:59<25:48,  1.78s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=1.49e-5, train/loss_step=0.00259, global_step=4010.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  28%|██▊       | 338/1208 [10:00<25:44,  1.78s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=1.49e-5, train/loss_step=0.00259, global_step=4010.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  28%|██▊       | 338/1208 [10:00<25:44,  1.78s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.18e-5, train/loss_step=0.00199, global_step=4010.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  28%|██▊       | 339/1208 [10:01<25:40,  1.77s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.18e-5, train/loss_step=0.00199, global_step=4010.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  28%|██▊       | 339/1208 [10:01<25:40,  1.77s/it, loss=0.171, v_num=0, train/loss_simple_step=0.842, train/loss_vlb_step=0.107, train/loss_step=0.842, global_step=4010.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]      Epoch 13:  28%|██▊       | 340/1208 [10:04<25:42,  1.78s/it, loss=0.171, v_num=0, train/loss_simple_step=0.842, train/loss_vlb_step=0.107, train/loss_step=0.842, global_step=4010.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  28%|██▊       | 340/1208 [10:04<25:42,  1.78s/it, loss=0.172, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.0017, train/loss_step=0.341, global_step=4010.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  28%|██▊       | 341/1208 [10:05<25:39,  1.78s/it, loss=0.172, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.0017, train/loss_step=0.341, global_step=4010.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  28%|██▊       | 341/1208 [10:05<25:39,  1.78s/it, loss=0.194, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00335, train/loss_step=0.447, global_step=4011.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  28%|██▊       | 342/1208 [10:06<25:35,  1.77s/it, loss=0.194, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00335, train/loss_step=0.447, global_step=4011.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  28%|██▊       | 342/1208 [10:06<25:35,  1.77s/it, loss=0.192, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.000955, train/loss_step=0.258, global_step=4011.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  28%|██▊       | 343/1208 [10:07<25:32,  1.77s/it, loss=0.192, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.000955, train/loss_step=0.258, global_step=4011.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  28%|██▊       | 343/1208 [10:07<25:32,  1.77s/it, loss=0.2, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000981, train/loss_step=0.244, global_step=4011.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  28%|██▊       | 344/1208 [10:10<25:33,  1.78s/it, loss=0.2, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000981, train/loss_step=0.244, global_step=4011.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  28%|██▊       | 344/1208 [10:10<25:33,  1.78s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0568, train/loss_vlb_step=0.000198, train/loss_step=0.0568, global_step=4011.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  29%|██▊       | 345/1208 [10:11<25:30,  1.77s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0568, train/loss_vlb_step=0.000198, train/loss_step=0.0568, global_step=4011.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  29%|██▊       | 345/1208 [10:11<25:30,  1.77s/it, loss=0.201, v_num=0, train/loss_simple_step=0.00815, train/loss_vlb_step=3.78e-5, train/loss_step=0.00815, global_step=4012.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  29%|██▊       | 346/1208 [10:12<25:26,  1.77s/it, loss=0.201, v_num=0, train/loss_simple_step=0.00815, train/loss_vlb_step=3.78e-5, train/loss_step=0.00815, global_step=4012.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  29%|██▊       | 346/1208 [10:12<25:26,  1.77s/it, loss=0.203, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000496, train/loss_step=0.143, global_step=4012.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  29%|██▊       | 347/1208 [10:13<25:23,  1.77s/it, loss=0.203, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000496, train/loss_step=0.143, global_step=4012.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  29%|██▊       | 347/1208 [10:13<25:23,  1.77s/it, loss=0.201, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=4012.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  29%|██▉       | 348/1208 [10:17<25:25,  1.77s/it, loss=0.201, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=4012.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  29%|██▉       | 348/1208 [10:17<25:25,  1.77s/it, loss=0.204, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000602, train/loss_step=0.177, global_step=4012.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  29%|██▉       | 349/1208 [10:18<25:21,  1.77s/it, loss=0.204, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000602, train/loss_step=0.177, global_step=4012.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  29%|██▉       | 349/1208 [10:18<25:21,  1.77s/it, loss=0.192, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000469, train/loss_step=0.142, global_step=4013.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  29%|██▉       | 350/1208 [10:19<25:18,  1.77s/it, loss=0.192, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000469, train/loss_step=0.142, global_step=4013.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  29%|██▉       | 350/1208 [10:19<25:18,  1.77s/it, loss=0.198, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000819, train/loss_step=0.225, global_step=4013.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  29%|██▉       | 351/1208 [10:20<25:14,  1.77s/it, loss=0.198, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000819, train/loss_step=0.225, global_step=4013.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  29%|██▉       | 351/1208 [10:20<25:14,  1.77s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0886, train/loss_vlb_step=0.000298, train/loss_step=0.0886, global_step=4013.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  29%|██▉       | 352/1208 [10:23<25:16,  1.77s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0886, train/loss_vlb_step=0.000298, train/loss_step=0.0886, global_step=4013.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  29%|██▉       | 352/1208 [10:23<25:16,  1.77s/it, loss=0.187, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=2.05e-5, train/loss_step=0.00359, global_step=4013.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  29%|██▉       | 353/1208 [10:24<25:12,  1.77s/it, loss=0.187, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=2.05e-5, train/loss_step=0.00359, global_step=4013.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  29%|██▉       | 353/1208 [10:24<25:12,  1.77s/it, loss=0.192, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000489, train/loss_step=0.146, global_step=4014.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  29%|██▉       | 354/1208 [10:25<25:09,  1.77s/it, loss=0.192, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000489, train/loss_step=0.146, global_step=4014.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  29%|██▉       | 354/1208 [10:25<25:09,  1.77s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0305, train/loss_vlb_step=0.000115, train/loss_step=0.0305, global_step=4014.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  29%|██▉       | 355/1208 [10:26<25:05,  1.77s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0305, train/loss_vlb_step=0.000115, train/loss_step=0.0305, global_step=4014.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  29%|██▉       | 355/1208 [10:26<25:05,  1.77s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00946, train/loss_vlb_step=4.35e-5, train/loss_step=0.00946, global_step=4014.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  29%|██▉       | 356/1208 [10:29<25:07,  1.77s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00946, train/loss_vlb_step=4.35e-5, train/loss_step=0.00946, global_step=4014.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  29%|██▉       | 356/1208 [10:29<25:07,  1.77s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00306, train/loss_vlb_step=1.68e-5, train/loss_step=0.00306, global_step=4014.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  30%|██▉       | 357/1208 [10:30<25:04,  1.77s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00306, train/loss_vlb_step=1.68e-5, train/loss_step=0.00306, global_step=4014.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  30%|██▉       | 357/1208 [10:30<25:04,  1.77s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.63e-5, train/loss_step=0.0242, global_step=4015.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  30%|██▉       | 358/1208 [10:31<25:00,  1.77s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.63e-5, train/loss_step=0.0242, global_step=4015.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  30%|██▉       | 358/1208 [10:31<25:00,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0562, train/loss_vlb_step=0.000193, train/loss_step=0.0562, global_step=4015.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  30%|██▉       | 359/1208 [10:33<24:57,  1.76s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0562, train/loss_vlb_step=0.000193, train/loss_step=0.0562, global_step=4015.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  30%|██▉       | 359/1208 [10:33<24:57,  1.76s/it, loss=0.134, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000547, train/loss_step=0.162, global_step=4015.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  30%|██▉       | 360/1208 [10:36<24:58,  1.77s/it, loss=0.134, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000547, train/loss_step=0.162, global_step=4015.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  30%|██▉       | 360/1208 [10:36<24:58,  1.77s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0713, train/loss_vlb_step=0.000243, train/loss_step=0.0713, global_step=4015.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  30%|██▉       | 361/1208 [10:37<24:55,  1.77s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0713, train/loss_vlb_step=0.000243, train/loss_step=0.0713, global_step=4015.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  30%|██▉       | 361/1208 [10:37<24:55,  1.77s/it, loss=0.099, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.8e-5, train/loss_step=0.0242, global_step=4016.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  30%|██▉       | 362/1208 [10:38<24:51,  1.76s/it, loss=0.099, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.8e-5, train/loss_step=0.0242, global_step=4016.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  30%|██▉       | 362/1208 [10:38<24:51,  1.76s/it, loss=0.103, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.0024, train/loss_step=0.340, global_step=4016.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  30%|███       | 363/1208 [10:39<24:48,  1.76s/it, loss=0.103, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.0024, train/loss_step=0.340, global_step=4016.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  30%|███       | 363/1208 [10:39<24:48,  1.76s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000525, train/loss_step=0.156, global_step=4016.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  30%|███       | 364/1208 [10:42<24:50,  1.77s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000525, train/loss_step=0.156, global_step=4016.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  30%|███       | 364/1208 [10:42<24:50,  1.77s/it, loss=0.108, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00108, train/loss_step=0.247, global_step=4016.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  30%|███       | 365/1208 [10:43<24:46,  1.76s/it, loss=0.108, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00108, train/loss_step=0.247, global_step=4016.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  30%|███       | 365/1208 [10:43<24:46,  1.76s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000157, train/loss_step=0.0445, global_step=4017.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  30%|███       | 366/1208 [10:44<24:43,  1.76s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000157, train/loss_step=0.0445, global_step=4017.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  30%|███       | 366/1208 [10:44<24:43,  1.76s/it, loss=0.125, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00252, train/loss_step=0.442, global_step=4017.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  30%|███       | 367/1208 [10:45<24:39,  1.76s/it, loss=0.125, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00252, train/loss_step=0.442, global_step=4017.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  30%|███       | 367/1208 [10:45<24:39,  1.76s/it, loss=0.132, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00096, train/loss_step=0.237, global_step=4017.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  30%|███       | 368/1208 [10:49<24:41,  1.76s/it, loss=0.132, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00096, train/loss_step=0.237, global_step=4017.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  30%|███       | 368/1208 [10:49<24:41,  1.76s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00339, train/loss_vlb_step=1.92e-5, train/loss_step=0.00339, global_step=4017.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  31%|███       | 369/1208 [10:50<24:38,  1.76s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00339, train/loss_vlb_step=1.92e-5, train/loss_step=0.00339, global_step=4017.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  31%|███       | 369/1208 [10:50<24:38,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000515, train/loss_step=0.156, global_step=4018.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  31%|███       | 370/1208 [10:51<24:34,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000515, train/loss_step=0.156, global_step=4018.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  31%|███       | 370/1208 [10:51<24:34,  1.76s/it, loss=0.14, v_num=0, train/loss_simple_step=0.546, train/loss_vlb_step=0.00552, train/loss_step=0.546, global_step=4018.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  31%|███       | 371/1208 [10:52<24:31,  1.76s/it, loss=0.14, v_num=0, train/loss_simple_step=0.546, train/loss_vlb_step=0.00552, train/loss_step=0.546, global_step=4018.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  31%|███       | 371/1208 [10:52<24:31,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00791, train/loss_vlb_step=3.95e-5, train/loss_step=0.00791, global_step=4018.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  31%|███       | 372/1208 [10:55<24:33,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00791, train/loss_vlb_step=3.95e-5, train/loss_step=0.00791, global_step=4018.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  31%|███       | 372/1208 [10:55<24:33,  1.76s/it, loss=0.148, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.000929, train/loss_step=0.257, global_step=4018.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  31%|███       | 373/1208 [10:56<24:29,  1.76s/it, loss=0.148, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.000929, train/loss_step=0.257, global_step=4018.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  31%|███       | 373/1208 [10:56<24:29,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.00033, train/loss_step=0.101, global_step=4019.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  31%|███       | 374/1208 [10:57<24:26,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.00033, train/loss_step=0.101, global_step=4019.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  31%|███       | 374/1208 [10:57<24:26,  1.76s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00864, train/loss_vlb_step=3.89e-5, train/loss_step=0.00864, global_step=4019.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  31%|███       | 375/1208 [10:58<24:22,  1.76s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00864, train/loss_vlb_step=3.89e-5, train/loss_step=0.00864, global_step=4019.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  31%|███       | 375/1208 [10:58<24:22,  1.76s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.78e-5, train/loss_step=0.00312, global_step=4019.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  31%|███       | 376/1208 [11:01<24:24,  1.76s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.78e-5, train/loss_step=0.00312, global_step=4019.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  31%|███       | 376/1208 [11:01<24:24,  1.76s/it, loss=0.16, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.0014, train/loss_step=0.302, global_step=4019.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]      Epoch 13:  31%|███       | 377/1208 [11:02<24:21,  1.76s/it, loss=0.16, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.0014, train/loss_step=0.302, global_step=4019.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  31%|███       | 377/1208 [11:02<24:21,  1.76s/it, loss=0.177, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00257, train/loss_step=0.368, global_step=4020.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  31%|███▏      | 378/1208 [11:03<24:17,  1.76s/it, loss=0.177, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00257, train/loss_step=0.368, global_step=4020.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  31%|███▏      | 378/1208 [11:03<24:17,  1.76s/it, loss=0.18, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000403, train/loss_step=0.122, global_step=4020.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  31%|███▏      | 379/1208 [11:05<24:14,  1.75s/it, loss=0.18, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000403, train/loss_step=0.122, global_step=4020.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  31%|███▏      | 379/1208 [11:05<24:14,  1.75s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00546, train/loss_vlb_step=2.9e-5, train/loss_step=0.00546, global_step=4020.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  31%|███▏      | 380/1208 [11:08<24:16,  1.76s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00546, train/loss_vlb_step=2.9e-5, train/loss_step=0.00546, global_step=4020.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  31%|███▏      | 380/1208 [11:08<24:16,  1.76s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000161, train/loss_step=0.0449, global_step=4020.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  32%|███▏      | 381/1208 [11:09<24:12,  1.76s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000161, train/loss_step=0.0449, global_step=4020.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  32%|███▏      | 381/1208 [11:09<24:12,  1.76s/it, loss=0.18, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000784, train/loss_step=0.215, global_step=4021.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  32%|███▏      | 382/1208 [11:10<24:09,  1.75s/it, loss=0.18, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000784, train/loss_step=0.215, global_step=4021.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  32%|███▏      | 382/1208 [11:10<24:09,  1.75s/it, loss=0.173, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.00066, train/loss_step=0.184, global_step=4021.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  32%|███▏      | 383/1208 [11:11<24:06,  1.75s/it, loss=0.173, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.00066, train/loss_step=0.184, global_step=4021.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  32%|███▏      | 383/1208 [11:11<24:06,  1.75s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00632, train/loss_vlb_step=3.19e-5, train/loss_step=0.00632, global_step=4021.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  32%|███▏      | 384/1208 [11:14<24:07,  1.76s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00632, train/loss_vlb_step=3.19e-5, train/loss_step=0.00632, global_step=4021.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  32%|███▏      | 384/1208 [11:14<24:07,  1.76s/it, loss=0.155, v_num=0, train/loss_simple_step=0.055, train/loss_vlb_step=0.000191, train/loss_step=0.055, global_step=4021.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  32%|███▏      | 385/1208 [11:15<24:04,  1.76s/it, loss=0.155, v_num=0, train/loss_simple_step=0.055, train/loss_vlb_step=0.000191, train/loss_step=0.055, global_step=4021.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  32%|███▏      | 385/1208 [11:15<24:04,  1.76s/it, loss=0.159, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000399, train/loss_step=0.120, global_step=4022.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  32%|███▏      | 386/1208 [11:16<24:01,  1.75s/it, loss=0.159, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000399, train/loss_step=0.120, global_step=4022.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  32%|███▏      | 386/1208 [11:16<24:01,  1.75s/it, loss=0.146, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.00066, train/loss_step=0.185, global_step=4022.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  32%|███▏      | 387/1208 [11:17<23:57,  1.75s/it, loss=0.146, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.00066, train/loss_step=0.185, global_step=4022.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  32%|███▏      | 387/1208 [11:17<23:57,  1.75s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.73e-5, train/loss_step=0.00304, global_step=4022.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  32%|███▏      | 388/1208 [11:20<23:59,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.73e-5, train/loss_step=0.00304, global_step=4022.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  32%|███▏      | 388/1208 [11:20<23:59,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00567, train/loss_vlb_step=2.96e-5, train/loss_step=0.00567, global_step=4022.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  32%|███▏      | 389/1208 [11:22<23:56,  1.75s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00567, train/loss_vlb_step=2.96e-5, train/loss_step=0.00567, global_step=4022.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  32%|███▏      | 389/1208 [11:22<23:56,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000112, train/loss_step=0.0298, global_step=4023.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  32%|███▏      | 390/1208 [11:23<23:52,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000112, train/loss_step=0.0298, global_step=4023.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  32%|███▏      | 390/1208 [11:23<23:52,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0423, train/loss_vlb_step=0.000156, train/loss_step=0.0423, global_step=4023.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  32%|███▏      | 391/1208 [11:24<23:49,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0423, train/loss_vlb_step=0.000156, train/loss_step=0.0423, global_step=4023.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  32%|███▏      | 391/1208 [11:24<23:49,  1.75s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.75e-5, train/loss_step=0.0183, global_step=4023.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  32%|███▏      | 392/1208 [11:27<23:50,  1.75s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.75e-5, train/loss_step=0.0183, global_step=4023.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  32%|███▏      | 392/1208 [11:27<23:50,  1.75s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.95e-5, train/loss_step=0.0129, global_step=4023.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  33%|███▎      | 393/1208 [11:28<23:47,  1.75s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.95e-5, train/loss_step=0.0129, global_step=4023.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  33%|███▎      | 393/1208 [11:28<23:47,  1.75s/it, loss=0.0886, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.000157, train/loss_step=0.0417, global_step=4024.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  33%|███▎      | 394/1208 [11:29<23:44,  1.75s/it, loss=0.0886, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.000157, train/loss_step=0.0417, global_step=4024.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  33%|███▎      | 394/1208 [11:29<23:44,  1.75s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000725, train/loss_step=0.184, global_step=4024.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  33%|███▎      | 395/1208 [11:30<23:41,  1.75s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000725, train/loss_step=0.184, global_step=4024.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  33%|███▎      | 395/1208 [11:30<23:41,  1.75s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.37e-5, train/loss_step=0.0233, global_step=4024.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  33%|███▎      | 396/1208 [11:33<23:42,  1.75s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.37e-5, train/loss_step=0.0233, global_step=4024.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  33%|███▎      | 396/1208 [11:33<23:42,  1.75s/it, loss=0.0855, v_num=0, train/loss_simple_step=0.0434, train/loss_vlb_step=0.000167, train/loss_step=0.0434, global_step=4024.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  33%|███▎      | 397/1208 [11:34<23:39,  1.75s/it, loss=0.0855, v_num=0, train/loss_simple_step=0.0434, train/loss_vlb_step=0.000167, train/loss_step=0.0434, global_step=4024.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  33%|███▎      | 397/1208 [11:34<23:39,  1.75s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00153, train/loss_step=0.300, global_step=4025.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  33%|███▎      | 398/1208 [11:35<23:36,  1.75s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00153, train/loss_step=0.300, global_step=4025.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  33%|███▎      | 398/1208 [11:35<23:36,  1.75s/it, loss=0.0805, v_num=0, train/loss_simple_step=0.0915, train/loss_vlb_step=0.000303, train/loss_step=0.0915, global_step=4025.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  33%|███▎      | 399/1208 [11:36<23:32,  1.75s/it, loss=0.0805, v_num=0, train/loss_simple_step=0.0915, train/loss_vlb_step=0.000303, train/loss_step=0.0915, global_step=4025.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  33%|███▎      | 399/1208 [11:36<23:32,  1.75s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00115, train/loss_step=0.239, global_step=4025.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  33%|███▎      | 400/1208 [11:40<23:34,  1.75s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00115, train/loss_step=0.239, global_step=4025.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  33%|███▎      | 400/1208 [11:40<23:34,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.679, train/loss_vlb_step=0.0273, train/loss_step=0.679, global_step=4025.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  33%|███▎      | 401/1208 [11:41<23:31,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.679, train/loss_vlb_step=0.0273, train/loss_step=0.679, global_step=4025.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  33%|███▎      | 401/1208 [11:41<23:31,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.531, train/loss_vlb_step=0.00767, train/loss_step=0.531, global_step=4026.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  33%|███▎      | 402/1208 [11:42<23:27,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.531, train/loss_vlb_step=0.00767, train/loss_step=0.531, global_step=4026.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  33%|███▎      | 402/1208 [11:42<23:27,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000673, train/loss_step=0.189, global_step=4026.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  33%|███▎      | 403/1208 [11:43<23:24,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000673, train/loss_step=0.189, global_step=4026.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  33%|███▎      | 403/1208 [11:43<23:24,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=8.78e-5, train/loss_step=0.0223, global_step=4026.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  33%|███▎      | 404/1208 [11:46<23:25,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=8.78e-5, train/loss_step=0.0223, global_step=4026.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  33%|███▎      | 404/1208 [11:46<23:25,  1.75s/it, loss=0.146, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000539, train/loss_step=0.157, global_step=4026.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  34%|███▎      | 405/1208 [11:47<23:22,  1.75s/it, loss=0.146, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000539, train/loss_step=0.157, global_step=4026.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  34%|███▎      | 405/1208 [11:47<23:22,  1.75s/it, loss=0.149, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000721, train/loss_step=0.188, global_step=4027.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  34%|███▎      | 406/1208 [11:48<23:19,  1.75s/it, loss=0.149, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000721, train/loss_step=0.188, global_step=4027.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  34%|███▎      | 406/1208 [11:48<23:19,  1.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.000145, train/loss_step=0.0394, global_step=4027.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  34%|███▎      | 407/1208 [11:49<23:16,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.000145, train/loss_step=0.0394, global_step=4027.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  34%|███▎      | 407/1208 [11:49<23:16,  1.74s/it, loss=0.161, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00229, train/loss_step=0.393, global_step=4027.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  34%|███▍      | 408/1208 [11:52<23:17,  1.75s/it, loss=0.161, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00229, train/loss_step=0.393, global_step=4027.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  34%|███▍      | 408/1208 [11:52<23:17,  1.75s/it, loss=0.182, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00259, train/loss_step=0.411, global_step=4027.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  34%|███▍      | 409/1208 [11:53<23:14,  1.75s/it, loss=0.182, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00259, train/loss_step=0.411, global_step=4027.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  34%|███▍      | 409/1208 [11:53<23:14,  1.75s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.00013, train/loss_step=0.0347, global_step=4028.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  34%|███▍      | 410/1208 [11:54<23:11,  1.74s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.00013, train/loss_step=0.0347, global_step=4028.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  34%|███▍      | 410/1208 [11:54<23:11,  1.74s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.15e-5, train/loss_step=0.00197, global_step=4028.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  34%|███▍      | 411/1208 [11:55<23:08,  1.74s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.15e-5, train/loss_step=0.00197, global_step=4028.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  34%|███▍      | 411/1208 [11:55<23:08,  1.74s/it, loss=0.191, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000953, train/loss_step=0.244, global_step=4028.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  34%|███▍      | 412/1208 [11:59<23:09,  1.75s/it, loss=0.191, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000953, train/loss_step=0.244, global_step=4028.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  34%|███▍      | 412/1208 [11:59<23:09,  1.75s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.7e-5, train/loss_step=0.0144, global_step=4028.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  34%|███▍      | 413/1208 [12:00<23:06,  1.74s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.7e-5, train/loss_step=0.0144, global_step=4028.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  34%|███▍      | 413/1208 [12:00<23:06,  1.74s/it, loss=0.19, v_num=0, train/loss_simple_step=0.00879, train/loss_vlb_step=4.19e-5, train/loss_step=0.00879, global_step=4029.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  34%|███▍      | 414/1208 [12:01<23:03,  1.74s/it, loss=0.19, v_num=0, train/loss_simple_step=0.00879, train/loss_vlb_step=4.19e-5, train/loss_step=0.00879, global_step=4029.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  34%|███▍      | 414/1208 [12:01<23:03,  1.74s/it, loss=0.189, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000634, train/loss_step=0.179, global_step=4029.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  34%|███▍      | 415/1208 [12:02<23:00,  1.74s/it, loss=0.189, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000634, train/loss_step=0.179, global_step=4029.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  34%|███▍      | 415/1208 [12:02<23:00,  1.74s/it, loss=0.188, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.28e-5, train/loss_step=0.00218, global_step=4029.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  34%|███▍      | 416/1208 [12:05<23:01,  1.74s/it, loss=0.188, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.28e-5, train/loss_step=0.00218, global_step=4029.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  34%|███▍      | 416/1208 [12:05<23:01,  1.74s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0447, train/loss_vlb_step=0.000162, train/loss_step=0.0447, global_step=4029.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  35%|███▍      | 417/1208 [12:06<22:58,  1.74s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0447, train/loss_vlb_step=0.000162, train/loss_step=0.0447, global_step=4029.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  35%|███▍      | 417/1208 [12:06<22:58,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=9.23e-6, train/loss_step=0.00154, global_step=4030.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  35%|███▍      | 418/1208 [12:07<22:55,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=9.23e-6, train/loss_step=0.00154, global_step=4030.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  35%|███▍      | 418/1208 [12:07<22:55,  1.74s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.00013, train/loss_step=0.0336, global_step=4030.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  35%|███▍      | 419/1208 [12:08<22:52,  1.74s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.00013, train/loss_step=0.0336, global_step=4030.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  35%|███▍      | 419/1208 [12:08<22:52,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.91e-5, train/loss_step=0.00351, global_step=4030.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  35%|███▍      | 420/1208 [12:11<22:53,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.91e-5, train/loss_step=0.00351, global_step=4030.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  35%|███▍      | 420/1208 [12:11<22:53,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000104, train/loss_step=0.0266, global_step=4030.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  35%|███▍      | 421/1208 [12:12<22:50,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000104, train/loss_step=0.0266, global_step=4030.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  35%|███▍      | 421/1208 [12:12<22:50,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00368, train/loss_step=0.415, global_step=4031.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  35%|███▍      | 422/1208 [12:14<22:47,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00368, train/loss_step=0.415, global_step=4031.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  35%|███▍      | 422/1208 [12:14<22:47,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=2.02e-5, train/loss_step=0.00356, global_step=4031.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  35%|███▌      | 423/1208 [12:15<22:44,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=2.02e-5, train/loss_step=0.00356, global_step=4031.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  35%|███▌      | 423/1208 [12:15<22:44,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00185, train/loss_step=0.324, global_step=4031.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  35%|███▌      | 424/1208 [12:18<22:45,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00185, train/loss_step=0.324, global_step=4031.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  35%|███▌      | 424/1208 [12:18<22:45,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0608, train/loss_vlb_step=0.000213, train/loss_step=0.0608, global_step=4031.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  35%|███▌      | 425/1208 [12:19<22:42,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0608, train/loss_vlb_step=0.000213, train/loss_step=0.0608, global_step=4031.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  35%|███▌      | 425/1208 [12:19<22:42,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000398, train/loss_step=0.120, global_step=4032.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  35%|███▌      | 426/1208 [12:20<22:39,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000398, train/loss_step=0.120, global_step=4032.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  35%|███▌      | 426/1208 [12:20<22:39,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00542, train/loss_vlb_step=2.89e-5, train/loss_step=0.00542, global_step=4032.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  35%|███▌      | 427/1208 [12:21<22:36,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00542, train/loss_vlb_step=2.89e-5, train/loss_step=0.00542, global_step=4032.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  35%|███▌      | 427/1208 [12:21<22:36,  1.74s/it, loss=0.098, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=9.66e-5, train/loss_step=0.0248, global_step=4032.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  35%|███▌      | 428/1208 [12:24<22:37,  1.74s/it, loss=0.098, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=9.66e-5, train/loss_step=0.0248, global_step=4032.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  35%|███▌      | 428/1208 [12:24<22:37,  1.74s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00177, train/loss_step=0.326, global_step=4032.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  36%|███▌      | 429/1208 [12:25<22:34,  1.74s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00177, train/loss_step=0.326, global_step=4032.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  36%|███▌      | 429/1208 [12:25<22:34,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000775, train/loss_step=0.209, global_step=4033.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  36%|███▌      | 430/1208 [12:26<22:31,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000775, train/loss_step=0.209, global_step=4033.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  36%|███▌      | 430/1208 [12:26<22:31,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0637, train/loss_vlb_step=0.000219, train/loss_step=0.0637, global_step=4033.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  36%|███▌      | 431/1208 [12:27<22:28,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0637, train/loss_vlb_step=0.000219, train/loss_step=0.0637, global_step=4033.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  36%|███▌      | 431/1208 [12:27<22:28,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.456, train/loss_vlb_step=0.00455, train/loss_step=0.456, global_step=4033.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  36%|███▌      | 432/1208 [12:31<22:29,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.456, train/loss_vlb_step=0.00455, train/loss_step=0.456, global_step=4033.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  36%|███▌      | 432/1208 [12:31<22:29,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00633, train/loss_vlb_step=3.01e-5, train/loss_step=0.00633, global_step=4033.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  36%|███▌      | 433/1208 [12:32<22:26,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00633, train/loss_vlb_step=3.01e-5, train/loss_step=0.00633, global_step=4033.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  36%|███▌      | 433/1208 [12:32<22:26,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000488, train/loss_step=0.148, global_step=4034.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  36%|███▌      | 434/1208 [12:33<22:23,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000488, train/loss_step=0.148, global_step=4034.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  36%|███▌      | 434/1208 [12:33<22:23,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000347, train/loss_step=0.105, global_step=4034.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  36%|███▌      | 435/1208 [12:34<22:20,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000347, train/loss_step=0.105, global_step=4034.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  36%|███▌      | 435/1208 [12:34<22:20,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.52e-5, train/loss_step=0.0128, global_step=4034.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  36%|███▌      | 436/1208 [12:37<22:21,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.52e-5, train/loss_step=0.0128, global_step=4034.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  36%|███▌      | 436/1208 [12:37<22:21,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0747, train/loss_vlb_step=0.000252, train/loss_step=0.0747, global_step=4034.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  36%|███▌      | 437/1208 [12:38<22:18,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0747, train/loss_vlb_step=0.000252, train/loss_step=0.0747, global_step=4034.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  36%|███▌      | 437/1208 [12:38<22:18,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=1.33e-5, train/loss_step=0.00224, global_step=4035.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  36%|███▋      | 438/1208 [12:39<22:15,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=1.33e-5, train/loss_step=0.00224, global_step=4035.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  36%|███▋      | 438/1208 [12:39<22:15,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.82e-5, train/loss_step=0.0239, global_step=4035.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  36%|███▋      | 439/1208 [12:40<22:12,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.82e-5, train/loss_step=0.0239, global_step=4035.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  36%|███▋      | 439/1208 [12:40<22:12,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00167, train/loss_step=0.314, global_step=4035.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  36%|███▋      | 440/1208 [12:43<22:13,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00167, train/loss_step=0.314, global_step=4035.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  36%|███▋      | 440/1208 [12:43<22:13,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000446, train/loss_step=0.133, global_step=4035.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  37%|███▋      | 441/1208 [12:44<22:10,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000446, train/loss_step=0.133, global_step=4035.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  37%|███▋      | 441/1208 [12:44<22:10,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000357, train/loss_step=0.108, global_step=4036.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  37%|███▋      | 442/1208 [12:45<22:07,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000357, train/loss_step=0.108, global_step=4036.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  37%|███▋      | 442/1208 [12:45<22:07,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.00034, train/loss_step=0.103, global_step=4036.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  37%|███▋      | 443/1208 [12:46<22:04,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.00034, train/loss_step=0.103, global_step=4036.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  37%|███▋      | 443/1208 [12:46<22:04,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00137, train/loss_step=0.309, global_step=4036.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  37%|███▋      | 444/1208 [12:50<22:05,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00137, train/loss_step=0.309, global_step=4036.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  37%|███▋      | 444/1208 [12:50<22:05,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.00013, train/loss_step=0.0329, global_step=4036.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  37%|███▋      | 445/1208 [12:51<22:02,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.00013, train/loss_step=0.0329, global_step=4036.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  37%|███▋      | 445/1208 [12:51<22:02,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0733, train/loss_vlb_step=0.000248, train/loss_step=0.0733, global_step=4037.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  37%|███▋      | 446/1208 [12:52<21:59,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0733, train/loss_vlb_step=0.000248, train/loss_step=0.0733, global_step=4037.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  37%|███▋      | 446/1208 [12:52<21:59,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.674, train/loss_vlb_step=0.0146, train/loss_step=0.674, global_step=4037.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]     Epoch 13:  37%|███▋      | 447/1208 [12:53<21:56,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.674, train/loss_vlb_step=0.0146, train/loss_step=0.674, global_step=4037.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  37%|███▋      | 447/1208 [12:53<21:56,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000278, train/loss_step=0.0815, global_step=4037.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  37%|███▋      | 448/1208 [12:56<21:57,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000278, train/loss_step=0.0815, global_step=4037.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  37%|███▋      | 448/1208 [12:56<21:57,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.19e-5, train/loss_step=0.0138, global_step=4037.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  37%|███▋      | 449/1208 [12:57<21:54,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.19e-5, train/loss_step=0.0138, global_step=4037.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  37%|███▋      | 449/1208 [12:57<21:54,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00837, train/loss_vlb_step=3.96e-5, train/loss_step=0.00837, global_step=4038.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  37%|███▋      | 450/1208 [12:58<21:51,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00837, train/loss_vlb_step=3.96e-5, train/loss_step=0.00837, global_step=4038.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  37%|███▋      | 450/1208 [12:58<21:51,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=1.4e-5, train/loss_step=0.00242, global_step=4038.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  37%|███▋      | 451/1208 [12:59<21:48,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=1.4e-5, train/loss_step=0.00242, global_step=4038.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  37%|███▋      | 451/1208 [12:59<21:48,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000105, train/loss_step=0.0262, global_step=4038.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  37%|███▋      | 452/1208 [13:02<21:49,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000105, train/loss_step=0.0262, global_step=4038.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  37%|███▋      | 452/1208 [13:02<21:49,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000428, train/loss_step=0.129, global_step=4038.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  38%|███▊      | 453/1208 [13:04<21:46,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000428, train/loss_step=0.129, global_step=4038.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  38%|███▊      | 453/1208 [13:04<21:46,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00232, train/loss_step=0.392, global_step=4039.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  38%|███▊      | 454/1208 [13:05<21:43,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00232, train/loss_step=0.392, global_step=4039.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  38%|███▊      | 454/1208 [13:05<21:43,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=8.83e-5, train/loss_step=0.0217, global_step=4039.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  38%|███▊      | 455/1208 [13:06<21:40,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=8.83e-5, train/loss_step=0.0217, global_step=4039.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  38%|███▊      | 455/1208 [13:06<21:40,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.44e-5, train/loss_step=0.0149, global_step=4039.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  38%|███▊      | 456/1208 [13:09<21:41,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.44e-5, train/loss_step=0.0149, global_step=4039.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  38%|███▊      | 456/1208 [13:09<21:41,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00109, train/loss_step=0.263, global_step=4039.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  38%|███▊      | 457/1208 [13:10<21:38,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00109, train/loss_step=0.263, global_step=4039.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  38%|███▊      | 457/1208 [13:10<21:38,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0904, train/loss_vlb_step=0.000297, train/loss_step=0.0904, global_step=4040.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  38%|███▊      | 458/1208 [13:11<21:36,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0904, train/loss_vlb_step=0.000297, train/loss_step=0.0904, global_step=4040.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  38%|███▊      | 458/1208 [13:11<21:36,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00412, train/loss_vlb_step=2.27e-5, train/loss_step=0.00412, global_step=4040.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  38%|███▊      | 459/1208 [13:12<21:33,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00412, train/loss_vlb_step=2.27e-5, train/loss_step=0.00412, global_step=4040.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  38%|███▊      | 459/1208 [13:12<21:33,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000114, train/loss_step=0.0301, global_step=4040.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  38%|███▊      | 460/1208 [13:15<21:33,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000114, train/loss_step=0.0301, global_step=4040.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  38%|███▊      | 460/1208 [13:15<21:33,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000665, train/loss_step=0.182, global_step=4040.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  38%|███▊      | 461/1208 [13:16<21:31,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000665, train/loss_step=0.182, global_step=4040.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  38%|███▊      | 461/1208 [13:16<21:31,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00158, train/loss_step=0.316, global_step=4041.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  38%|███▊      | 462/1208 [13:17<21:28,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00158, train/loss_step=0.316, global_step=4041.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  38%|███▊      | 462/1208 [13:17<21:28,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.753, train/loss_vlb_step=0.0551, train/loss_step=0.753, global_step=4041.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  38%|███▊      | 463/1208 [13:18<21:25,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.753, train/loss_vlb_step=0.0551, train/loss_step=0.753, global_step=4041.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  38%|███▊      | 463/1208 [13:18<21:25,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0422, train/loss_vlb_step=0.000153, train/loss_step=0.0422, global_step=4041.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  38%|███▊      | 464/1208 [13:22<21:26,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0422, train/loss_vlb_step=0.000153, train/loss_step=0.0422, global_step=4041.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  38%|███▊      | 464/1208 [13:22<21:26,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.18e-5, train/loss_step=0.0172, global_step=4041.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  38%|███▊      | 465/1208 [13:23<21:23,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.18e-5, train/loss_step=0.0172, global_step=4041.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  38%|███▊      | 465/1208 [13:23<21:23,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00132, train/loss_step=0.309, global_step=4042.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  39%|███▊      | 466/1208 [13:24<21:20,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00132, train/loss_step=0.309, global_step=4042.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  39%|███▊      | 466/1208 [13:24<21:20,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00156, train/loss_step=0.294, global_step=4042.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  39%|███▊      | 467/1208 [13:25<21:17,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00156, train/loss_step=0.294, global_step=4042.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  39%|███▊      | 467/1208 [13:25<21:17,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000112, train/loss_step=0.0291, global_step=4042.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  39%|███▊      | 468/1208 [13:28<21:18,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000112, train/loss_step=0.0291, global_step=4042.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  39%|███▊      | 468/1208 [13:28<21:18,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.00016, train/loss_step=0.045, global_step=4042.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  39%|███▉      | 469/1208 [13:29<21:15,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.00016, train/loss_step=0.045, global_step=4042.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  39%|███▉      | 469/1208 [13:29<21:15,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000819, train/loss_step=0.213, global_step=4043.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  39%|███▉      | 470/1208 [13:30<21:12,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000819, train/loss_step=0.213, global_step=4043.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  39%|███▉      | 470/1208 [13:30<21:12,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0077, train/loss_vlb_step=3.76e-5, train/loss_step=0.0077, global_step=4043.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  39%|███▉      | 471/1208 [13:31<21:09,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0077, train/loss_vlb_step=3.76e-5, train/loss_step=0.0077, global_step=4043.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  39%|███▉      | 471/1208 [13:31<21:09,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000987, train/loss_step=0.235, global_step=4043.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  39%|███▉      | 472/1208 [13:34<21:10,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000987, train/loss_step=0.235, global_step=4043.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  39%|███▉      | 472/1208 [13:34<21:10,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00635, train/loss_vlb_step=3.2e-5, train/loss_step=0.00635, global_step=4043.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  39%|███▉      | 473/1208 [13:35<21:07,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00635, train/loss_vlb_step=3.2e-5, train/loss_step=0.00635, global_step=4043.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  39%|███▉      | 473/1208 [13:35<21:07,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000247, train/loss_step=0.0741, global_step=4044.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  39%|███▉      | 474/1208 [13:36<21:05,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000247, train/loss_step=0.0741, global_step=4044.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  39%|███▉      | 474/1208 [13:36<21:05,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000644, train/loss_step=0.187, global_step=4044.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  39%|███▉      | 475/1208 [13:37<21:02,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000644, train/loss_step=0.187, global_step=4044.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  39%|███▉      | 475/1208 [13:37<21:02,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000899, train/loss_step=0.228, global_step=4044.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  39%|███▉      | 476/1208 [13:41<21:02,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000899, train/loss_step=0.228, global_step=4044.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  39%|███▉      | 476/1208 [13:41<21:02,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00268, train/loss_step=0.374, global_step=4044.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  39%|███▉      | 477/1208 [13:42<21:00,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00268, train/loss_step=0.374, global_step=4044.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  39%|███▉      | 477/1208 [13:42<21:00,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000347, train/loss_step=0.105, global_step=4045.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  40%|███▉      | 478/1208 [13:43<20:57,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000347, train/loss_step=0.105, global_step=4045.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  40%|███▉      | 478/1208 [13:43<20:57,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.29e-5, train/loss_step=0.0149, global_step=4045.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  40%|███▉      | 479/1208 [13:44<20:54,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.29e-5, train/loss_step=0.0149, global_step=4045.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  40%|███▉      | 479/1208 [13:44<20:54,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000443, train/loss_step=0.134, global_step=4045.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  40%|███▉      | 480/1208 [13:47<20:55,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000443, train/loss_step=0.134, global_step=4045.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  40%|███▉      | 480/1208 [13:47<20:55,  1.72s/it, loss=0.191, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.0032, train/loss_step=0.430, global_step=4045.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  40%|███▉      | 481/1208 [13:48<20:52,  1.72s/it, loss=0.191, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.0032, train/loss_step=0.430, global_step=4045.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  40%|███▉      | 481/1208 [13:48<20:52,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.38e-5, train/loss_step=0.0112, global_step=4046.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  40%|███▉      | 482/1208 [13:49<20:49,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.38e-5, train/loss_step=0.0112, global_step=4046.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  40%|███▉      | 482/1208 [13:49<20:49,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0877, train/loss_vlb_step=0.00029, train/loss_step=0.0877, global_step=4046.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  40%|███▉      | 483/1208 [13:50<20:46,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0877, train/loss_vlb_step=0.00029, train/loss_step=0.0877, global_step=4046.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  40%|███▉      | 483/1208 [13:50<20:46,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000909, train/loss_step=0.236, global_step=4046.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  40%|████      | 484/1208 [13:53<20:47,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000909, train/loss_step=0.236, global_step=4046.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  40%|████      | 484/1208 [13:53<20:47,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0933, train/loss_vlb_step=0.000307, train/loss_step=0.0933, global_step=4046.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  40%|████      | 485/1208 [13:55<20:44,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0933, train/loss_vlb_step=0.000307, train/loss_step=0.0933, global_step=4046.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  40%|████      | 485/1208 [13:55<20:44,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.46e-5, train/loss_step=0.0233, global_step=4047.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  40%|████      | 486/1208 [13:56<20:42,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.46e-5, train/loss_step=0.0233, global_step=4047.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  40%|████      | 486/1208 [13:56<20:42,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00978, train/loss_vlb_step=4.48e-5, train/loss_step=0.00978, global_step=4047.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  40%|████      | 487/1208 [13:57<20:39,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00978, train/loss_vlb_step=4.48e-5, train/loss_step=0.00978, global_step=4047.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  40%|████      | 487/1208 [13:57<20:39,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=9.9e-5, train/loss_step=0.025, global_step=4047.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]     Epoch 13:  40%|████      | 488/1208 [14:00<20:39,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=9.9e-5, train/loss_step=0.025, global_step=4047.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  40%|████      | 488/1208 [14:00<20:39,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00467, train/loss_vlb_step=2.51e-5, train/loss_step=0.00467, global_step=4047.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  40%|████      | 489/1208 [14:01<20:37,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00467, train/loss_vlb_step=2.51e-5, train/loss_step=0.00467, global_step=4047.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  40%|████      | 489/1208 [14:01<20:37,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000371, train/loss_step=0.113, global_step=4048.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  41%|████      | 490/1208 [14:02<20:34,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000371, train/loss_step=0.113, global_step=4048.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  41%|████      | 490/1208 [14:02<20:34,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00119, train/loss_step=0.273, global_step=4048.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  41%|████      | 491/1208 [14:03<20:31,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00119, train/loss_step=0.273, global_step=4048.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  41%|████      | 491/1208 [14:03<20:31,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.0013, train/loss_step=0.292, global_step=4048.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  41%|████      | 492/1208 [14:06<20:32,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.0013, train/loss_step=0.292, global_step=4048.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  41%|████      | 492/1208 [14:06<20:32,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.093, train/loss_vlb_step=0.000306, train/loss_step=0.093, global_step=4048.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  41%|████      | 493/1208 [14:07<20:29,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.093, train/loss_vlb_step=0.000306, train/loss_step=0.093, global_step=4048.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  41%|████      | 493/1208 [14:07<20:29,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.00061, train/loss_step=0.185, global_step=4049.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  41%|████      | 494/1208 [14:08<20:26,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.00061, train/loss_step=0.185, global_step=4049.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  41%|████      | 494/1208 [14:08<20:26,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=1.73e-5, train/loss_step=0.00315, global_step=4049.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  41%|████      | 495/1208 [14:09<20:24,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=1.73e-5, train/loss_step=0.00315, global_step=4049.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  41%|████      | 495/1208 [14:09<20:24,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.12e-5, train/loss_step=0.0113, global_step=4049.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  41%|████      | 496/1208 [14:13<20:24,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.12e-5, train/loss_step=0.0113, global_step=4049.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  41%|████      | 496/1208 [14:13<20:24,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000169, train/loss_step=0.0478, global_step=4049.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  41%|████      | 497/1208 [14:14<20:21,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000169, train/loss_step=0.0478, global_step=4049.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  41%|████      | 497/1208 [14:14<20:21,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000368, train/loss_step=0.111, global_step=4050.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  41%|████      | 498/1208 [14:15<20:19,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000368, train/loss_step=0.111, global_step=4050.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  41%|████      | 498/1208 [14:15<20:19,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00376, train/loss_vlb_step=2.1e-5, train/loss_step=0.00376, global_step=4050.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  41%|████▏     | 499/1208 [14:16<20:16,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00376, train/loss_vlb_step=2.1e-5, train/loss_step=0.00376, global_step=4050.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  41%|████▏     | 499/1208 [14:16<20:16,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000483, train/loss_step=0.147, global_step=4050.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  41%|████▏     | 500/1208 [14:19<20:17,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000483, train/loss_step=0.147, global_step=4050.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  41%|████▏     | 500/1208 [14:19<20:17,  1.72s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.0622, train/loss_vlb_step=0.000216, train/loss_step=0.0622, global_step=4050.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  41%|████▏     | 501/1208 [14:20<20:14,  1.72s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.0622, train/loss_vlb_step=0.000216, train/loss_step=0.0622, global_step=4050.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  41%|████▏     | 501/1208 [14:20<20:14,  1.72s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000117, train/loss_step=0.0308, global_step=4051.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  42%|████▏     | 502/1208 [14:21<20:11,  1.72s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000117, train/loss_step=0.0308, global_step=4051.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  42%|████▏     | 502/1208 [14:21<20:11,  1.72s/it, loss=0.0884, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=2.09e-5, train/loss_step=0.00392, global_step=4051.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  42%|████▏     | 503/1208 [14:22<20:09,  1.72s/it, loss=0.0884, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=2.09e-5, train/loss_step=0.00392, global_step=4051.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  42%|████▏     | 503/1208 [14:22<20:09,  1.72s/it, loss=0.0798, v_num=0, train/loss_simple_step=0.0644, train/loss_vlb_step=0.000221, train/loss_step=0.0644, global_step=4051.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  42%|████▏     | 504/1208 [14:25<20:09,  1.72s/it, loss=0.0798, v_num=0, train/loss_simple_step=0.0644, train/loss_vlb_step=0.000221, train/loss_step=0.0644, global_step=4051.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  42%|████▏     | 504/1208 [14:25<20:09,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.584, train/loss_vlb_step=0.00954, train/loss_step=0.584, global_step=4051.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  42%|████▏     | 505/1208 [14:27<20:06,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.584, train/loss_vlb_step=0.00954, train/loss_step=0.584, global_step=4051.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  42%|████▏     | 505/1208 [14:27<20:06,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00152, train/loss_step=0.327, global_step=4052.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  42%|████▏     | 506/1208 [14:28<20:04,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00152, train/loss_step=0.327, global_step=4052.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  42%|████▏     | 506/1208 [14:28<20:04,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=4052.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  42%|████▏     | 507/1208 [14:29<20:01,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=4052.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  42%|████▏     | 507/1208 [14:29<20:01,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00165, train/loss_step=0.303, global_step=4052.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  42%|████▏     | 508/1208 [14:32<20:02,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00165, train/loss_step=0.303, global_step=4052.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  42%|████▏     | 508/1208 [14:32<20:02,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.490, train/loss_vlb_step=0.0044, train/loss_step=0.490, global_step=4052.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  42%|████▏     | 509/1208 [14:33<19:59,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.490, train/loss_vlb_step=0.0044, train/loss_step=0.490, global_step=4052.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  42%|████▏     | 509/1208 [14:33<19:59,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00144, train/loss_step=0.310, global_step=4053.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  42%|████▏     | 510/1208 [14:34<19:56,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00144, train/loss_step=0.310, global_step=4053.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  42%|████▏     | 510/1208 [14:34<19:56,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000482, train/loss_step=0.144, global_step=4053.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  42%|████▏     | 511/1208 [14:35<19:54,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000482, train/loss_step=0.144, global_step=4053.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  42%|████▏     | 511/1208 [14:35<19:54,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.040, train/loss_vlb_step=0.000145, train/loss_step=0.040, global_step=4053.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  42%|████▏     | 512/1208 [14:38<19:54,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.040, train/loss_vlb_step=0.000145, train/loss_step=0.040, global_step=4053.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  42%|████▏     | 512/1208 [14:38<19:54,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000647, train/loss_step=0.188, global_step=4053.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  42%|████▏     | 513/1208 [14:39<19:51,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000647, train/loss_step=0.188, global_step=4053.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  42%|████▏     | 513/1208 [14:39<19:51,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00154, train/loss_step=0.295, global_step=4054.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  43%|████▎     | 514/1208 [14:40<19:49,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00154, train/loss_step=0.295, global_step=4054.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  43%|████▎     | 514/1208 [14:40<19:49,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00117, train/loss_step=0.258, global_step=4054.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  43%|████▎     | 515/1208 [14:41<19:46,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00117, train/loss_step=0.258, global_step=4054.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  43%|████▎     | 515/1208 [14:41<19:46,  1.71s/it, loss=0.194, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00185, train/loss_step=0.368, global_step=4054.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  43%|████▎     | 516/1208 [14:45<19:46,  1.72s/it, loss=0.194, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00185, train/loss_step=0.368, global_step=4054.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  43%|████▎     | 516/1208 [14:45<19:46,  1.72s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0533, train/loss_vlb_step=0.000195, train/loss_step=0.0533, global_step=4054.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  43%|████▎     | 517/1208 [14:46<19:44,  1.71s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0533, train/loss_vlb_step=0.000195, train/loss_step=0.0533, global_step=4054.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  43%|████▎     | 517/1208 [14:46<19:44,  1.71s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000139, train/loss_step=0.0365, global_step=4055.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  43%|████▎     | 518/1208 [14:47<19:41,  1.71s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000139, train/loss_step=0.0365, global_step=4055.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  43%|████▎     | 518/1208 [14:47<19:41,  1.71s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.51e-5, train/loss_step=0.0119, global_step=4055.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  43%|████▎     | 519/1208 [14:48<19:39,  1.71s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.51e-5, train/loss_step=0.0119, global_step=4055.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  43%|████▎     | 519/1208 [14:48<19:39,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0997, train/loss_vlb_step=0.00033, train/loss_step=0.0997, global_step=4055.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  43%|████▎     | 520/1208 [14:51<19:39,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0997, train/loss_vlb_step=0.00033, train/loss_step=0.0997, global_step=4055.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  43%|████▎     | 520/1208 [14:51<19:39,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.29e-5, train/loss_step=0.0111, global_step=4055.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  43%|████▎     | 521/1208 [14:52<19:36,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.29e-5, train/loss_step=0.0111, global_step=4055.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  43%|████▎     | 521/1208 [14:52<19:36,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.00083, train/loss_step=0.219, global_step=4056.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  43%|████▎     | 522/1208 [14:53<19:34,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.00083, train/loss_step=0.219, global_step=4056.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  43%|████▎     | 522/1208 [14:53<19:34,  1.71s/it, loss=0.209, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00118, train/loss_step=0.267, global_step=4056.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  43%|████▎     | 523/1208 [14:54<19:31,  1.71s/it, loss=0.209, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00118, train/loss_step=0.267, global_step=4056.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  43%|████▎     | 523/1208 [14:54<19:31,  1.71s/it, loss=0.214, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.00055, train/loss_step=0.166, global_step=4056.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  43%|████▎     | 524/1208 [14:57<19:31,  1.71s/it, loss=0.214, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.00055, train/loss_step=0.166, global_step=4056.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  43%|████▎     | 524/1208 [14:57<19:31,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.66e-5, train/loss_step=0.003, global_step=4056.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  43%|████▎     | 525/1208 [14:58<19:29,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.66e-5, train/loss_step=0.003, global_step=4056.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  43%|████▎     | 525/1208 [14:58<19:29,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000132, train/loss_step=0.0372, global_step=4057.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  44%|████▎     | 526/1208 [14:59<19:26,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000132, train/loss_step=0.0372, global_step=4057.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  44%|████▎     | 526/1208 [14:59<19:26,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00678, train/loss_vlb_step=3.47e-5, train/loss_step=0.00678, global_step=4057.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  44%|████▎     | 527/1208 [15:00<19:24,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00678, train/loss_vlb_step=3.47e-5, train/loss_step=0.00678, global_step=4057.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  44%|████▎     | 527/1208 [15:00<19:24,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00514, train/loss_vlb_step=2.67e-5, train/loss_step=0.00514, global_step=4057.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  44%|████▎     | 528/1208 [15:04<19:24,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00514, train/loss_vlb_step=2.67e-5, train/loss_step=0.00514, global_step=4057.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  44%|████▎     | 528/1208 [15:04<19:24,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.58e-5, train/loss_step=0.0159, global_step=4057.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  44%|████▍     | 529/1208 [15:05<19:21,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.58e-5, train/loss_step=0.0159, global_step=4057.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  44%|████▍     | 529/1208 [15:05<19:21,  1.71s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000254, train/loss_step=0.0754, global_step=4058.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  44%|████▍     | 530/1208 [15:06<19:19,  1.71s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000254, train/loss_step=0.0754, global_step=4058.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  44%|████▍     | 530/1208 [15:06<19:19,  1.71s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.000169, train/loss_step=0.0483, global_step=4058.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  44%|████▍     | 531/1208 [15:07<19:16,  1.71s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.000169, train/loss_step=0.0483, global_step=4058.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  44%|████▍     | 531/1208 [15:07<19:16,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00117, train/loss_step=0.263, global_step=4058.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  44%|████▍     | 532/1208 [15:10<19:17,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00117, train/loss_step=0.263, global_step=4058.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  44%|████▍     | 532/1208 [15:10<19:17,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.27e-5, train/loss_step=0.0153, global_step=4058.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  44%|████▍     | 533/1208 [15:11<19:14,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.27e-5, train/loss_step=0.0153, global_step=4058.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  44%|████▍     | 533/1208 [15:11<19:14,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0903, train/loss_vlb_step=0.000298, train/loss_step=0.0903, global_step=4059.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  44%|████▍     | 534/1208 [15:12<19:11,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0903, train/loss_vlb_step=0.000298, train/loss_step=0.0903, global_step=4059.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  44%|████▍     | 534/1208 [15:12<19:11,  1.71s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=4059.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  44%|████▍     | 535/1208 [15:13<19:09,  1.71s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=4059.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  44%|████▍     | 535/1208 [15:13<19:09,  1.71s/it, loss=0.0839, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000452, train/loss_step=0.137, global_step=4059.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  44%|████▍     | 536/1208 [15:16<19:09,  1.71s/it, loss=0.0839, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000452, train/loss_step=0.137, global_step=4059.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  44%|████▍     | 536/1208 [15:16<19:09,  1.71s/it, loss=0.083, v_num=0, train/loss_simple_step=0.0343, train/loss_vlb_step=0.000123, train/loss_step=0.0343, global_step=4059.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  44%|████▍     | 537/1208 [15:18<19:07,  1.71s/it, loss=0.083, v_num=0, train/loss_simple_step=0.0343, train/loss_vlb_step=0.000123, train/loss_step=0.0343, global_step=4059.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  44%|████▍     | 537/1208 [15:18<19:07,  1.71s/it, loss=0.0818, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.4e-5, train/loss_step=0.0126, global_step=4060.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  45%|████▍     | 538/1208 [15:19<19:04,  1.71s/it, loss=0.0818, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.4e-5, train/loss_step=0.0126, global_step=4060.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  45%|████▍     | 538/1208 [15:19<19:04,  1.71s/it, loss=0.0814, v_num=0, train/loss_simple_step=0.00508, train/loss_vlb_step=2.73e-5, train/loss_step=0.00508, global_step=4060.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  45%|████▍     | 539/1208 [15:20<19:02,  1.71s/it, loss=0.0814, v_num=0, train/loss_simple_step=0.00508, train/loss_vlb_step=2.73e-5, train/loss_step=0.00508, global_step=4060.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  45%|████▍     | 539/1208 [15:20<19:02,  1.71s/it, loss=0.0768, v_num=0, train/loss_simple_step=0.00745, train/loss_vlb_step=3.67e-5, train/loss_step=0.00745, global_step=4060.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  45%|████▍     | 540/1208 [15:23<19:02,  1.71s/it, loss=0.0768, v_num=0, train/loss_simple_step=0.00745, train/loss_vlb_step=3.67e-5, train/loss_step=0.00745, global_step=4060.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  45%|████▍     | 540/1208 [15:23<19:02,  1.71s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000672, train/loss_step=0.188, global_step=4060.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  45%|████▍     | 541/1208 [15:24<18:59,  1.71s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000672, train/loss_step=0.188, global_step=4060.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  45%|████▍     | 541/1208 [15:24<18:59,  1.71s/it, loss=0.0859, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000814, train/loss_step=0.225, global_step=4061.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  45%|████▍     | 542/1208 [15:25<18:57,  1.71s/it, loss=0.0859, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000814, train/loss_step=0.225, global_step=4061.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  45%|████▍     | 542/1208 [15:25<18:57,  1.71s/it, loss=0.0811, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000573, train/loss_step=0.170, global_step=4061.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  45%|████▍     | 543/1208 [15:26<18:54,  1.71s/it, loss=0.0811, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000573, train/loss_step=0.170, global_step=4061.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  45%|████▍     | 543/1208 [15:26<18:54,  1.71s/it, loss=0.0754, v_num=0, train/loss_simple_step=0.0516, train/loss_vlb_step=0.000185, train/loss_step=0.0516, global_step=4061.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  45%|████▌     | 544/1208 [15:29<18:54,  1.71s/it, loss=0.0754, v_num=0, train/loss_simple_step=0.0516, train/loss_vlb_step=0.000185, train/loss_step=0.0516, global_step=4061.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  45%|████▌     | 544/1208 [15:29<18:54,  1.71s/it, loss=0.0762, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=7.92e-5, train/loss_step=0.0193, global_step=4061.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  45%|████▌     | 545/1208 [15:30<18:52,  1.71s/it, loss=0.0762, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=7.92e-5, train/loss_step=0.0193, global_step=4061.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  45%|████▌     | 545/1208 [15:30<18:52,  1.71s/it, loss=0.0748, v_num=0, train/loss_simple_step=0.0096, train/loss_vlb_step=4.42e-5, train/loss_step=0.0096, global_step=4062.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  45%|████▌     | 546/1208 [15:31<18:49,  1.71s/it, loss=0.0748, v_num=0, train/loss_simple_step=0.0096, train/loss_vlb_step=4.42e-5, train/loss_step=0.0096, global_step=4062.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  45%|████▌     | 546/1208 [15:31<18:49,  1.71s/it, loss=0.0753, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.28e-5, train/loss_step=0.0152, global_step=4062.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  45%|████▌     | 547/1208 [15:32<18:47,  1.71s/it, loss=0.0753, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.28e-5, train/loss_step=0.0152, global_step=4062.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  45%|████▌     | 547/1208 [15:32<18:47,  1.71s/it, loss=0.0753, v_num=0, train/loss_simple_step=0.00591, train/loss_vlb_step=2.93e-5, train/loss_step=0.00591, global_step=4062.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  45%|████▌     | 548/1208 [15:36<18:47,  1.71s/it, loss=0.0753, v_num=0, train/loss_simple_step=0.00591, train/loss_vlb_step=2.93e-5, train/loss_step=0.00591, global_step=4062.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  45%|████▌     | 548/1208 [15:36<18:47,  1.71s/it, loss=0.0838, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000651, train/loss_step=0.186, global_step=4062.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  45%|████▌     | 549/1208 [15:37<18:45,  1.71s/it, loss=0.0838, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000651, train/loss_step=0.186, global_step=4062.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  45%|████▌     | 549/1208 [15:37<18:45,  1.71s/it, loss=0.0823, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000167, train/loss_step=0.0457, global_step=4063.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  46%|████▌     | 550/1208 [15:38<18:42,  1.71s/it, loss=0.0823, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000167, train/loss_step=0.0457, global_step=4063.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  46%|████▌     | 550/1208 [15:38<18:42,  1.71s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00173, train/loss_step=0.327, global_step=4063.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  46%|████▌     | 551/1208 [15:39<18:39,  1.70s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00173, train/loss_step=0.327, global_step=4063.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  46%|████▌     | 551/1208 [15:39<18:39,  1.70s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00136, train/loss_step=0.313, global_step=4063.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  46%|████▌     | 552/1208 [15:42<18:40,  1.71s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00136, train/loss_step=0.313, global_step=4063.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  46%|████▌     | 552/1208 [15:42<18:40,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.440, train/loss_vlb_step=0.0041, train/loss_step=0.440, global_step=4063.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  46%|████▌     | 553/1208 [15:43<18:37,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.440, train/loss_vlb_step=0.0041, train/loss_step=0.440, global_step=4063.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  46%|████▌     | 553/1208 [15:43<18:37,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0928, train/loss_vlb_step=0.000306, train/loss_step=0.0928, global_step=4064.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  46%|████▌     | 554/1208 [15:44<18:35,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0928, train/loss_vlb_step=0.000306, train/loss_step=0.0928, global_step=4064.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  46%|████▌     | 554/1208 [15:44<18:35,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.644, train/loss_vlb_step=0.0304, train/loss_step=0.644, global_step=4064.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  46%|████▌     | 555/1208 [15:45<18:32,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.644, train/loss_vlb_step=0.0304, train/loss_step=0.644, global_step=4064.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  46%|████▌     | 555/1208 [15:45<18:32,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.86e-5, train/loss_step=0.0132, global_step=4064.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  46%|████▌     | 556/1208 [15:49<18:32,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.86e-5, train/loss_step=0.0132, global_step=4064.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  46%|████▌     | 556/1208 [15:49<18:32,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.0043, train/loss_step=0.485, global_step=4064.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  46%|████▌     | 557/1208 [15:50<18:30,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.0043, train/loss_step=0.485, global_step=4064.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  46%|████▌     | 557/1208 [15:50<18:30,  1.71s/it, loss=0.184, v_num=0, train/loss_simple_step=0.444, train/loss_vlb_step=0.00499, train/loss_step=0.444, global_step=4065.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  46%|████▌     | 558/1208 [15:51<18:28,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.444, train/loss_vlb_step=0.00499, train/loss_step=0.444, global_step=4065.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  46%|████▌     | 558/1208 [15:51<18:28,  1.70s/it, loss=0.194, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000785, train/loss_step=0.188, global_step=4065.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  46%|████▋     | 559/1208 [15:52<18:25,  1.70s/it, loss=0.194, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000785, train/loss_step=0.188, global_step=4065.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  46%|████▋     | 559/1208 [15:52<18:25,  1.70s/it, loss=0.201, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000563, train/loss_step=0.167, global_step=4065.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  46%|████▋     | 560/1208 [15:55<18:25,  1.71s/it, loss=0.201, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000563, train/loss_step=0.167, global_step=4065.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  46%|████▋     | 560/1208 [15:55<18:25,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.43e-5, train/loss_step=0.00246, global_step=4065.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  46%|████▋     | 561/1208 [15:56<18:23,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.43e-5, train/loss_step=0.00246, global_step=4065.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  46%|████▋     | 561/1208 [15:56<18:23,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0477, train/loss_vlb_step=0.00017, train/loss_step=0.0477, global_step=4066.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  47%|████▋     | 562/1208 [15:57<18:20,  1.70s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0477, train/loss_vlb_step=0.00017, train/loss_step=0.0477, global_step=4066.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  47%|████▋     | 562/1208 [15:57<18:20,  1.70s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=1.78e-5, train/loss_step=0.00315, global_step=4066.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  47%|████▋     | 563/1208 [15:58<18:18,  1.70s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=1.78e-5, train/loss_step=0.00315, global_step=4066.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  47%|████▋     | 563/1208 [15:58<18:18,  1.70s/it, loss=0.182, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000757, train/loss_step=0.189, global_step=4066.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  47%|████▋     | 564/1208 [16:01<18:18,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000757, train/loss_step=0.189, global_step=4066.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  47%|████▋     | 564/1208 [16:01<18:18,  1.71s/it, loss=0.187, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000411, train/loss_step=0.124, global_step=4066.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  47%|████▋     | 565/1208 [16:02<18:15,  1.70s/it, loss=0.187, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000411, train/loss_step=0.124, global_step=4066.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  47%|████▋     | 565/1208 [16:02<18:15,  1.70s/it, loss=0.197, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000781, train/loss_step=0.208, global_step=4067.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  47%|████▋     | 566/1208 [16:03<18:13,  1.70s/it, loss=0.197, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000781, train/loss_step=0.208, global_step=4067.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  47%|████▋     | 566/1208 [16:03<18:13,  1.70s/it, loss=0.232, v_num=0, train/loss_simple_step=0.714, train/loss_vlb_step=0.0409, train/loss_step=0.714, global_step=4067.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  47%|████▋     | 567/1208 [16:05<18:10,  1.70s/it, loss=0.232, v_num=0, train/loss_simple_step=0.714, train/loss_vlb_step=0.0409, train/loss_step=0.714, global_step=4067.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  47%|████▋     | 567/1208 [16:05<18:10,  1.70s/it, loss=0.266, v_num=0, train/loss_simple_step=0.688, train/loss_vlb_step=0.0298, train/loss_step=0.688, global_step=4067.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  47%|████▋     | 568/1208 [16:08<18:10,  1.70s/it, loss=0.266, v_num=0, train/loss_simple_step=0.688, train/loss_vlb_step=0.0298, train/loss_step=0.688, global_step=4067.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  47%|████▋     | 568/1208 [16:08<18:10,  1.70s/it, loss=0.275, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.0018, train/loss_step=0.360, global_step=4067.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  47%|████▋     | 569/1208 [16:09<18:08,  1.70s/it, loss=0.275, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.0018, train/loss_step=0.360, global_step=4067.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  47%|████▋     | 569/1208 [16:09<18:08,  1.70s/it, loss=0.276, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000239, train/loss_step=0.0676, global_step=4068.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  47%|████▋     | 570/1208 [16:10<18:06,  1.70s/it, loss=0.276, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000239, train/loss_step=0.0676, global_step=4068.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  47%|████▋     | 570/1208 [16:10<18:06,  1.70s/it, loss=0.26, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.66e-5, train/loss_step=0.0147, global_step=4068.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  47%|████▋     | 571/1208 [16:11<18:03,  1.70s/it, loss=0.26, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.66e-5, train/loss_step=0.0147, global_step=4068.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  47%|████▋     | 571/1208 [16:11<18:03,  1.70s/it, loss=0.248, v_num=0, train/loss_simple_step=0.0661, train/loss_vlb_step=0.000223, train/loss_step=0.0661, global_step=4068.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  47%|████▋     | 572/1208 [16:14<18:03,  1.70s/it, loss=0.248, v_num=0, train/loss_simple_step=0.0661, train/loss_vlb_step=0.000223, train/loss_step=0.0661, global_step=4068.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  47%|████▋     | 572/1208 [16:14<18:03,  1.70s/it, loss=0.237, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000883, train/loss_step=0.229, global_step=4068.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  47%|████▋     | 573/1208 [16:15<18:01,  1.70s/it, loss=0.237, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000883, train/loss_step=0.229, global_step=4068.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  47%|████▋     | 573/1208 [16:15<18:01,  1.70s/it, loss=0.239, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000397, train/loss_step=0.121, global_step=4069.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  48%|████▊     | 574/1208 [16:16<17:58,  1.70s/it, loss=0.239, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000397, train/loss_step=0.121, global_step=4069.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  48%|████▊     | 574/1208 [16:16<17:58,  1.70s/it, loss=0.207, v_num=0, train/loss_simple_step=0.00401, train/loss_vlb_step=2.2e-5, train/loss_step=0.00401, global_step=4069.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  48%|████▊     | 575/1208 [16:17<17:56,  1.70s/it, loss=0.207, v_num=0, train/loss_simple_step=0.00401, train/loss_vlb_step=2.2e-5, train/loss_step=0.00401, global_step=4069.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  48%|████▊     | 575/1208 [16:17<17:56,  1.70s/it, loss=0.22, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00136, train/loss_step=0.280, global_step=4069.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  48%|████▊     | 576/1208 [16:20<17:56,  1.70s/it, loss=0.22, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00136, train/loss_step=0.280, global_step=4069.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  48%|████▊     | 576/1208 [16:20<17:56,  1.70s/it, loss=0.206, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000709, train/loss_step=0.211, global_step=4069.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  48%|████▊     | 577/1208 [16:22<17:53,  1.70s/it, loss=0.206, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000709, train/loss_step=0.211, global_step=4069.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  48%|████▊     | 577/1208 [16:22<17:53,  1.70s/it, loss=0.205, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00578, train/loss_step=0.418, global_step=4070.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  48%|████▊     | 578/1208 [16:23<17:51,  1.70s/it, loss=0.205, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00578, train/loss_step=0.418, global_step=4070.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  48%|████▊     | 578/1208 [16:23<17:51,  1.70s/it, loss=0.204, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000605, train/loss_step=0.172, global_step=4070.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  48%|████▊     | 579/1208 [16:24<17:49,  1.70s/it, loss=0.204, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000605, train/loss_step=0.172, global_step=4070.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  48%|████▊     | 579/1208 [16:24<17:49,  1.70s/it, loss=0.205, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000637, train/loss_step=0.176, global_step=4070.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  48%|████▊     | 580/1208 [16:27<17:49,  1.70s/it, loss=0.205, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000637, train/loss_step=0.176, global_step=4070.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  48%|████▊     | 580/1208 [16:27<17:49,  1.70s/it, loss=0.205, v_num=0, train/loss_simple_step=0.00483, train/loss_vlb_step=2.51e-5, train/loss_step=0.00483, global_step=4070.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  48%|████▊     | 581/1208 [16:28<17:46,  1.70s/it, loss=0.205, v_num=0, train/loss_simple_step=0.00483, train/loss_vlb_step=2.51e-5, train/loss_step=0.00483, global_step=4070.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  48%|████▊     | 581/1208 [16:28<17:46,  1.70s/it, loss=0.203, v_num=0, train/loss_simple_step=0.00447, train/loss_vlb_step=2.2e-5, train/loss_step=0.00447, global_step=4071.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  48%|████▊     | 582/1208 [16:29<17:44,  1.70s/it, loss=0.203, v_num=0, train/loss_simple_step=0.00447, train/loss_vlb_step=2.2e-5, train/loss_step=0.00447, global_step=4071.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  48%|████▊     | 582/1208 [16:29<17:44,  1.70s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0827, train/loss_vlb_step=0.000277, train/loss_step=0.0827, global_step=4071.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  48%|████▊     | 583/1208 [16:30<17:41,  1.70s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0827, train/loss_vlb_step=0.000277, train/loss_step=0.0827, global_step=4071.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  48%|████▊     | 583/1208 [16:30<17:41,  1.70s/it, loss=0.206, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000646, train/loss_step=0.185, global_step=4071.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  48%|████▊     | 584/1208 [16:33<17:41,  1.70s/it, loss=0.206, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000646, train/loss_step=0.185, global_step=4071.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  48%|████▊     | 584/1208 [16:33<17:41,  1.70s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0324, train/loss_vlb_step=0.000123, train/loss_step=0.0324, global_step=4071.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  48%|████▊     | 585/1208 [16:34<17:39,  1.70s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0324, train/loss_vlb_step=0.000123, train/loss_step=0.0324, global_step=4071.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  48%|████▊     | 585/1208 [16:34<17:39,  1.70s/it, loss=0.203, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000819, train/loss_step=0.224, global_step=4072.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  49%|████▊     | 586/1208 [16:35<17:37,  1.70s/it, loss=0.203, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000819, train/loss_step=0.224, global_step=4072.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  49%|████▊     | 586/1208 [16:35<17:37,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00564, train/loss_vlb_step=2.79e-5, train/loss_step=0.00564, global_step=4072.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  49%|████▊     | 587/1208 [16:36<17:34,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00564, train/loss_vlb_step=2.79e-5, train/loss_step=0.00564, global_step=4072.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  49%|████▊     | 587/1208 [16:36<17:34,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000781, train/loss_step=0.206, global_step=4072.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  49%|████▊     | 588/1208 [16:40<17:34,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000781, train/loss_step=0.206, global_step=4072.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  49%|████▊     | 588/1208 [16:40<17:34,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00638, train/loss_vlb_step=3.19e-5, train/loss_step=0.00638, global_step=4072.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  49%|████▉     | 589/1208 [16:41<17:32,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00638, train/loss_vlb_step=3.19e-5, train/loss_step=0.00638, global_step=4072.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  49%|████▉     | 589/1208 [16:41<17:32,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.00042, train/loss_step=0.125, global_step=4073.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  49%|████▉     | 590/1208 [16:42<17:29,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.00042, train/loss_step=0.125, global_step=4073.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  49%|████▉     | 590/1208 [16:42<17:29,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0599, train/loss_vlb_step=0.000206, train/loss_step=0.0599, global_step=4073.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  49%|████▉     | 591/1208 [16:43<17:27,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0599, train/loss_vlb_step=0.000206, train/loss_step=0.0599, global_step=4073.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  49%|████▉     | 591/1208 [16:43<17:27,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000693, train/loss_step=0.199, global_step=4073.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  49%|████▉     | 592/1208 [16:46<17:27,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000693, train/loss_step=0.199, global_step=4073.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  49%|████▉     | 592/1208 [16:46<17:27,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00444, train/loss_vlb_step=2.22e-5, train/loss_step=0.00444, global_step=4073.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  49%|████▉     | 593/1208 [16:47<17:24,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00444, train/loss_vlb_step=2.22e-5, train/loss_step=0.00444, global_step=4073.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  49%|████▉     | 593/1208 [16:47<17:24,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.00017, train/loss_step=0.0471, global_step=4074.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  49%|████▉     | 594/1208 [16:48<17:22,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.00017, train/loss_step=0.0471, global_step=4074.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  49%|████▉     | 594/1208 [16:48<17:22,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000866, train/loss_step=0.225, global_step=4074.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  49%|████▉     | 595/1208 [16:49<17:20,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000866, train/loss_step=0.225, global_step=4074.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  49%|████▉     | 595/1208 [16:49<17:20,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00111, train/loss_step=0.261, global_step=4074.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  49%|████▉     | 596/1208 [16:52<17:20,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00111, train/loss_step=0.261, global_step=4074.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  49%|████▉     | 596/1208 [16:52<17:20,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.00046, train/loss_step=0.137, global_step=4074.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  49%|████▉     | 597/1208 [16:53<17:17,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.00046, train/loss_step=0.137, global_step=4074.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  49%|████▉     | 597/1208 [16:53<17:17,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000591, train/loss_step=0.177, global_step=4075.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  50%|████▉     | 598/1208 [16:54<17:15,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000591, train/loss_step=0.177, global_step=4075.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  50%|████▉     | 598/1208 [16:54<17:15,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000925, train/loss_step=0.231, global_step=4075.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  50%|████▉     | 599/1208 [16:55<17:12,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000925, train/loss_step=0.231, global_step=4075.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  50%|████▉     | 599/1208 [16:55<17:12,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0694, train/loss_vlb_step=0.000239, train/loss_step=0.0694, global_step=4075.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  50%|████▉     | 600/1208 [16:59<17:12,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0694, train/loss_vlb_step=0.000239, train/loss_step=0.0694, global_step=4075.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  50%|████▉     | 600/1208 [16:59<17:12,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0354, train/loss_vlb_step=0.000135, train/loss_step=0.0354, global_step=4075.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.76it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.74it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.76it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.76it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.81it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.74it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.75it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.76it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.76it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.76it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.76it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.76it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.80it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.76it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.78it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.78it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.75it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.75it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.82it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 13:  50%|████▉     | 601/1208 [17:29<17:40,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0354, train/loss_vlb_step=0.000135, train/loss_step=0.0354, global_step=4075.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  50%|████▉     | 601/1208 [17:29<17:40,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00122, train/loss_step=0.279, global_step=4076.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  50%|████▉     | 602/1208 [17:30<17:37,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00122, train/loss_step=0.279, global_step=4076.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  50%|████▉     | 602/1208 [17:30<17:37,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00168, train/loss_step=0.318, global_step=4076.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  50%|████▉     | 603/1208 [17:31<17:35,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00168, train/loss_step=0.318, global_step=4076.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  50%|████▉     | 603/1208 [17:31<17:35,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00185, train/loss_step=0.317, global_step=4076.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  50%|█████     | 604/1208 [17:35<17:35,  1.75s/it, loss=0.148, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00185, train/loss_step=0.317, global_step=4076.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  50%|█████     | 604/1208 [17:35<17:35,  1.75s/it, loss=0.159, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000974, train/loss_step=0.244, global_step=4076.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  50%|█████     | 605/1208 [17:36<17:32,  1.75s/it, loss=0.159, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000974, train/loss_step=0.244, global_step=4076.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  50%|█████     | 605/1208 [17:36<17:32,  1.75s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.21e-5, train/loss_step=0.00203, global_step=4077.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  50%|█████     | 606/1208 [17:37<17:30,  1.74s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.21e-5, train/loss_step=0.00203, global_step=4077.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  50%|█████     | 606/1208 [17:37<17:30,  1.74s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0488, train/loss_vlb_step=0.000176, train/loss_step=0.0488, global_step=4077.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  50%|█████     | 607/1208 [17:38<17:27,  1.74s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0488, train/loss_vlb_step=0.000176, train/loss_step=0.0488, global_step=4077.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  50%|█████     | 607/1208 [17:38<17:27,  1.74s/it, loss=0.151, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000925, train/loss_step=0.233, global_step=4077.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  50%|█████     | 608/1208 [17:41<17:27,  1.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000925, train/loss_step=0.233, global_step=4077.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  50%|█████     | 608/1208 [17:41<17:27,  1.75s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000156, train/loss_step=0.0406, global_step=4077.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  50%|█████     | 609/1208 [17:42<17:25,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000156, train/loss_step=0.0406, global_step=4077.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  50%|█████     | 609/1208 [17:42<17:25,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000107, train/loss_step=0.0266, global_step=4078.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  50%|█████     | 610/1208 [17:43<17:22,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000107, train/loss_step=0.0266, global_step=4078.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  50%|█████     | 610/1208 [17:43<17:22,  1.74s/it, loss=0.15, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000348, train/loss_step=0.106, global_step=4078.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  51%|█████     | 611/1208 [17:44<17:20,  1.74s/it, loss=0.15, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000348, train/loss_step=0.106, global_step=4078.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  51%|█████     | 611/1208 [17:44<17:20,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000422, train/loss_step=0.128, global_step=4078.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  51%|█████     | 612/1208 [17:47<17:19,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000422, train/loss_step=0.128, global_step=4078.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  51%|█████     | 612/1208 [17:47<17:19,  1.74s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00599, train/loss_vlb_step=3.06e-5, train/loss_step=0.00599, global_step=4078.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  51%|█████     | 613/1208 [17:48<17:17,  1.74s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00599, train/loss_vlb_step=3.06e-5, train/loss_step=0.00599, global_step=4078.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  51%|█████     | 613/1208 [17:48<17:17,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0778, train/loss_vlb_step=0.00026, train/loss_step=0.0778, global_step=4079.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  51%|█████     | 614/1208 [17:49<17:15,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0778, train/loss_vlb_step=0.00026, train/loss_step=0.0778, global_step=4079.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  51%|█████     | 614/1208 [17:49<17:15,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.25e-5, train/loss_step=0.0142, global_step=4079.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  51%|█████     | 615/1208 [17:51<17:12,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.25e-5, train/loss_step=0.0142, global_step=4079.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  51%|█████     | 615/1208 [17:51<17:12,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00232, train/loss_step=0.396, global_step=4079.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  51%|█████     | 616/1208 [17:54<17:12,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00232, train/loss_step=0.396, global_step=4079.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  51%|█████     | 616/1208 [17:54<17:12,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0858, train/loss_vlb_step=0.000285, train/loss_step=0.0858, global_step=4079.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  51%|█████     | 617/1208 [17:55<17:09,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0858, train/loss_vlb_step=0.000285, train/loss_step=0.0858, global_step=4079.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  51%|█████     | 617/1208 [17:55<17:09,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000903, train/loss_step=0.232, global_step=4080.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  51%|█████     | 618/1208 [17:56<17:07,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000903, train/loss_step=0.232, global_step=4080.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  51%|█████     | 618/1208 [17:56<17:07,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000546, train/loss_step=0.160, global_step=4080.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  51%|█████     | 619/1208 [17:57<17:05,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000546, train/loss_step=0.160, global_step=4080.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  51%|█████     | 619/1208 [17:57<17:05,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0774, train/loss_vlb_step=0.000255, train/loss_step=0.0774, global_step=4080.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  51%|█████▏    | 620/1208 [18:00<17:04,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0774, train/loss_vlb_step=0.000255, train/loss_step=0.0774, global_step=4080.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  51%|█████▏    | 620/1208 [18:00<17:04,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=2.06e-5, train/loss_step=0.00363, global_step=4080.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  51%|█████▏    | 621/1208 [18:01<17:02,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=2.06e-5, train/loss_step=0.00363, global_step=4080.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  51%|█████▏    | 621/1208 [18:01<17:02,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000751, train/loss_step=0.202, global_step=4081.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  51%|█████▏    | 622/1208 [18:02<16:59,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000751, train/loss_step=0.202, global_step=4081.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  51%|█████▏    | 622/1208 [18:02<16:59,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.07e-5, train/loss_step=0.00175, global_step=4081.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  52%|█████▏    | 623/1208 [18:03<16:57,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.07e-5, train/loss_step=0.00175, global_step=4081.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  52%|█████▏    | 623/1208 [18:03<16:57,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0439, train/loss_vlb_step=0.000158, train/loss_step=0.0439, global_step=4081.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  52%|█████▏    | 624/1208 [18:06<16:57,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0439, train/loss_vlb_step=0.000158, train/loss_step=0.0439, global_step=4081.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  52%|█████▏    | 624/1208 [18:06<16:57,  1.74s/it, loss=0.1, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.00039, train/loss_step=0.118, global_step=4081.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]     Epoch 13:  52%|█████▏    | 625/1208 [18:08<16:54,  1.74s/it, loss=0.1, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.00039, train/loss_step=0.118, global_step=4081.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  52%|█████▏    | 625/1208 [18:08<16:54,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00207, train/loss_step=0.362, global_step=4082.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  52%|█████▏    | 626/1208 [18:09<16:52,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00207, train/loss_step=0.362, global_step=4082.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  52%|█████▏    | 626/1208 [18:09<16:52,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000857, train/loss_step=0.224, global_step=4082.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  52%|█████▏    | 627/1208 [18:10<16:50,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000857, train/loss_step=0.224, global_step=4082.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  52%|█████▏    | 627/1208 [18:10<16:50,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00104, train/loss_step=0.263, global_step=4082.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  52%|█████▏    | 628/1208 [18:13<16:49,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00104, train/loss_step=0.263, global_step=4082.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  52%|█████▏    | 628/1208 [18:13<16:49,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00186, train/loss_step=0.345, global_step=4082.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  52%|█████▏    | 629/1208 [18:14<16:47,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00186, train/loss_step=0.345, global_step=4082.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  52%|█████▏    | 629/1208 [18:14<16:47,  1.74s/it, loss=0.157, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00137, train/loss_step=0.303, global_step=4083.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  52%|█████▏    | 630/1208 [18:15<16:45,  1.74s/it, loss=0.157, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00137, train/loss_step=0.303, global_step=4083.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  52%|█████▏    | 630/1208 [18:15<16:45,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.3e-5, train/loss_step=0.00423, global_step=4083.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  52%|█████▏    | 631/1208 [18:16<16:42,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.3e-5, train/loss_step=0.00423, global_step=4083.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  52%|█████▏    | 631/1208 [18:16<16:42,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00412, train/loss_step=0.408, global_step=4083.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  52%|█████▏    | 632/1208 [18:19<16:42,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00412, train/loss_step=0.408, global_step=4083.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  52%|█████▏    | 632/1208 [18:19<16:42,  1.74s/it, loss=0.172, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000373, train/loss_step=0.114, global_step=4083.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  52%|█████▏    | 633/1208 [18:20<16:40,  1.74s/it, loss=0.172, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000373, train/loss_step=0.114, global_step=4083.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  52%|█████▏    | 633/1208 [18:20<16:40,  1.74s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00658, train/loss_vlb_step=3.33e-5, train/loss_step=0.00658, global_step=4084.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  52%|█████▏    | 634/1208 [18:21<16:37,  1.74s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00658, train/loss_vlb_step=3.33e-5, train/loss_step=0.00658, global_step=4084.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  52%|█████▏    | 634/1208 [18:21<16:37,  1.74s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0688, train/loss_vlb_step=0.000232, train/loss_step=0.0688, global_step=4084.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  53%|█████▎    | 635/1208 [18:22<16:35,  1.74s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0688, train/loss_vlb_step=0.000232, train/loss_step=0.0688, global_step=4084.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  53%|█████▎    | 635/1208 [18:22<16:35,  1.74s/it, loss=0.158, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000441, train/loss_step=0.134, global_step=4084.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  53%|█████▎    | 636/1208 [18:26<16:34,  1.74s/it, loss=0.158, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000441, train/loss_step=0.134, global_step=4084.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  53%|█████▎    | 636/1208 [18:26<16:34,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=4084.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  53%|█████▎    | 637/1208 [18:27<16:32,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=4084.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  53%|█████▎    | 637/1208 [18:27<16:32,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.537, train/loss_vlb_step=0.00727, train/loss_step=0.537, global_step=4085.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  53%|█████▎    | 638/1208 [18:28<16:30,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.537, train/loss_vlb_step=0.00727, train/loss_step=0.537, global_step=4085.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  53%|█████▎    | 638/1208 [18:28<16:30,  1.74s/it, loss=0.182, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00184, train/loss_step=0.314, global_step=4085.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  53%|█████▎    | 639/1208 [18:29<16:27,  1.74s/it, loss=0.182, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00184, train/loss_step=0.314, global_step=4085.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  53%|█████▎    | 639/1208 [18:29<16:27,  1.74s/it, loss=0.187, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000618, train/loss_step=0.176, global_step=4085.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  53%|█████▎    | 640/1208 [18:32<16:27,  1.74s/it, loss=0.187, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000618, train/loss_step=0.176, global_step=4085.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  53%|█████▎    | 640/1208 [18:32<16:27,  1.74s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000138, train/loss_step=0.0376, global_step=4085.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  53%|█████▎    | 641/1208 [18:33<16:25,  1.74s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000138, train/loss_step=0.0376, global_step=4085.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  53%|█████▎    | 641/1208 [18:33<16:25,  1.74s/it, loss=0.188, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000685, train/loss_step=0.194, global_step=4086.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  53%|█████▎    | 642/1208 [18:34<16:22,  1.74s/it, loss=0.188, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000685, train/loss_step=0.194, global_step=4086.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  53%|█████▎    | 642/1208 [18:34<16:22,  1.74s/it, loss=0.205, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00207, train/loss_step=0.344, global_step=4086.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  53%|█████▎    | 643/1208 [18:35<16:20,  1.74s/it, loss=0.205, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00207, train/loss_step=0.344, global_step=4086.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  53%|█████▎    | 643/1208 [18:35<16:20,  1.74s/it, loss=0.222, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00166, train/loss_step=0.381, global_step=4086.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  53%|█████▎    | 644/1208 [18:38<16:19,  1.74s/it, loss=0.222, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00166, train/loss_step=0.381, global_step=4086.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  53%|█████▎    | 644/1208 [18:38<16:19,  1.74s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=6.77e-5, train/loss_step=0.0172, global_step=4086.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  53%|█████▎    | 645/1208 [18:39<16:17,  1.74s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=6.77e-5, train/loss_step=0.0172, global_step=4086.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  53%|█████▎    | 645/1208 [18:39<16:17,  1.74s/it, loss=0.199, v_num=0, train/loss_simple_step=0.00669, train/loss_vlb_step=3.45e-5, train/loss_step=0.00669, global_step=4087.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  53%|█████▎    | 646/1208 [18:41<16:15,  1.74s/it, loss=0.199, v_num=0, train/loss_simple_step=0.00669, train/loss_vlb_step=3.45e-5, train/loss_step=0.00669, global_step=4087.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  53%|█████▎    | 646/1208 [18:41<16:15,  1.74s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0796, train/loss_vlb_step=0.000265, train/loss_step=0.0796, global_step=4087.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  54%|█████▎    | 647/1208 [18:42<16:12,  1.73s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0796, train/loss_vlb_step=0.000265, train/loss_step=0.0796, global_step=4087.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  54%|█████▎    | 647/1208 [18:42<16:12,  1.73s/it, loss=0.187, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.00052, train/loss_step=0.155, global_step=4087.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  54%|█████▎    | 648/1208 [18:45<16:12,  1.74s/it, loss=0.187, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.00052, train/loss_step=0.155, global_step=4087.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  54%|█████▎    | 648/1208 [18:45<16:12,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0096, train/loss_vlb_step=4.48e-5, train/loss_step=0.0096, global_step=4087.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  54%|█████▎    | 649/1208 [18:46<16:10,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0096, train/loss_vlb_step=4.48e-5, train/loss_step=0.0096, global_step=4087.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  54%|█████▎    | 649/1208 [18:46<16:10,  1.74s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.74e-5, train/loss_step=0.0157, global_step=4088.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  54%|█████▍    | 650/1208 [18:47<16:07,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.74e-5, train/loss_step=0.0157, global_step=4088.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  54%|█████▍    | 650/1208 [18:47<16:07,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00267, train/loss_step=0.336, global_step=4088.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  54%|█████▍    | 651/1208 [18:48<16:05,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00267, train/loss_step=0.336, global_step=4088.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  54%|█████▍    | 651/1208 [18:48<16:05,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.00045, train/loss_step=0.137, global_step=4088.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  54%|█████▍    | 652/1208 [18:51<16:05,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.00045, train/loss_step=0.137, global_step=4088.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  54%|█████▍    | 652/1208 [18:51<16:05,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.46e-5, train/loss_step=0.0147, global_step=4088.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  54%|█████▍    | 653/1208 [18:52<16:02,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.46e-5, train/loss_step=0.0147, global_step=4088.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  54%|█████▍    | 653/1208 [18:52<16:02,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000472, train/loss_step=0.141, global_step=4089.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  54%|█████▍    | 654/1208 [18:53<16:00,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000472, train/loss_step=0.141, global_step=4089.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  54%|█████▍    | 654/1208 [18:53<16:00,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00283, train/loss_vlb_step=1.63e-5, train/loss_step=0.00283, global_step=4089.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  54%|█████▍    | 655/1208 [18:54<15:58,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00283, train/loss_vlb_step=1.63e-5, train/loss_step=0.00283, global_step=4089.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  54%|█████▍    | 655/1208 [18:54<15:58,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.456, train/loss_vlb_step=0.00581, train/loss_step=0.456, global_step=4089.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  54%|█████▍    | 656/1208 [18:58<15:57,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.456, train/loss_vlb_step=0.00581, train/loss_step=0.456, global_step=4089.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  54%|█████▍    | 656/1208 [18:58<15:57,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.000122, train/loss_step=0.0316, global_step=4089.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  54%|█████▍    | 657/1208 [18:59<15:55,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.000122, train/loss_step=0.0316, global_step=4089.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  54%|█████▍    | 657/1208 [18:59<15:55,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=7e-5, train/loss_step=0.0159, global_step=4090.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  54%|█████▍    | 658/1208 [19:00<15:53,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=7e-5, train/loss_step=0.0159, global_step=4090.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  54%|█████▍    | 658/1208 [19:00<15:53,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.097, train/loss_vlb_step=0.000319, train/loss_step=0.097, global_step=4090.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  55%|█████▍    | 659/1208 [19:01<15:50,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.097, train/loss_vlb_step=0.000319, train/loss_step=0.097, global_step=4090.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  55%|█████▍    | 659/1208 [19:01<15:50,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.47e-5, train/loss_step=0.0026, global_step=4090.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  55%|█████▍    | 660/1208 [19:04<15:50,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.47e-5, train/loss_step=0.0026, global_step=4090.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  55%|█████▍    | 660/1208 [19:04<15:50,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.0004, train/loss_step=0.121, global_step=4090.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  55%|█████▍    | 661/1208 [19:05<15:47,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.0004, train/loss_step=0.121, global_step=4090.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  55%|█████▍    | 661/1208 [19:05<15:47,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00621, train/loss_vlb_step=3.07e-5, train/loss_step=0.00621, global_step=4091.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  55%|█████▍    | 662/1208 [19:06<15:45,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00621, train/loss_vlb_step=3.07e-5, train/loss_step=0.00621, global_step=4091.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  55%|█████▍    | 662/1208 [19:06<15:45,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00139, train/loss_step=0.310, global_step=4091.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  55%|█████▍    | 663/1208 [19:07<15:43,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00139, train/loss_step=0.310, global_step=4091.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  55%|█████▍    | 663/1208 [19:07<15:43,  1.73s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.36e-5, train/loss_step=0.017, global_step=4091.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  55%|█████▍    | 664/1208 [19:10<15:42,  1.73s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.36e-5, train/loss_step=0.017, global_step=4091.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  55%|█████▍    | 664/1208 [19:10<15:42,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00111, train/loss_step=0.268, global_step=4091.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  55%|█████▌    | 665/1208 [19:11<15:40,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00111, train/loss_step=0.268, global_step=4091.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  55%|█████▌    | 665/1208 [19:11<15:40,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0506, train/loss_vlb_step=0.000178, train/loss_step=0.0506, global_step=4092.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  55%|█████▌    | 666/1208 [19:12<15:38,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0506, train/loss_vlb_step=0.000178, train/loss_step=0.0506, global_step=4092.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  55%|█████▌    | 666/1208 [19:12<15:38,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000112, train/loss_step=0.0284, global_step=4092.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  55%|█████▌    | 667/1208 [19:14<15:36,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000112, train/loss_step=0.0284, global_step=4092.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  55%|█████▌    | 667/1208 [19:14<15:36,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00222, train/loss_step=0.361, global_step=4092.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  55%|█████▌    | 668/1208 [19:17<15:35,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00222, train/loss_step=0.361, global_step=4092.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  55%|█████▌    | 668/1208 [19:17<15:35,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.463, train/loss_vlb_step=0.00512, train/loss_step=0.463, global_step=4092.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  55%|█████▌    | 669/1208 [19:18<15:33,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.463, train/loss_vlb_step=0.00512, train/loss_step=0.463, global_step=4092.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  55%|█████▌    | 669/1208 [19:18<15:33,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.34e-5, train/loss_step=0.00225, global_step=4093.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  55%|█████▌    | 670/1208 [19:19<15:30,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.34e-5, train/loss_step=0.00225, global_step=4093.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  55%|█████▌    | 670/1208 [19:19<15:30,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.53e-5, train/loss_step=0.018, global_step=4093.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  56%|█████▌    | 671/1208 [19:20<15:28,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.53e-5, train/loss_step=0.018, global_step=4093.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  56%|█████▌    | 671/1208 [19:20<15:28,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000403, train/loss_step=0.120, global_step=4093.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  56%|█████▌    | 672/1208 [19:23<15:28,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000403, train/loss_step=0.120, global_step=4093.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  56%|█████▌    | 672/1208 [19:23<15:28,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00187, train/loss_step=0.329, global_step=4093.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  56%|█████▌    | 673/1208 [19:24<15:25,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00187, train/loss_step=0.329, global_step=4093.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  56%|█████▌    | 673/1208 [19:24<15:25,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.54e-5, train/loss_step=0.0151, global_step=4094.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  56%|█████▌    | 674/1208 [19:25<15:23,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.54e-5, train/loss_step=0.0151, global_step=4094.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  56%|█████▌    | 674/1208 [19:25<15:23,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000794, train/loss_step=0.219, global_step=4094.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  56%|█████▌    | 675/1208 [19:26<15:21,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000794, train/loss_step=0.219, global_step=4094.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  56%|█████▌    | 675/1208 [19:26<15:21,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=7.99e-5, train/loss_step=0.0196, global_step=4094.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  56%|█████▌    | 676/1208 [19:29<15:20,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=7.99e-5, train/loss_step=0.0196, global_step=4094.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  56%|█████▌    | 676/1208 [19:29<15:20,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.000137, train/loss_step=0.038, global_step=4094.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  56%|█████▌    | 677/1208 [19:31<15:18,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.000137, train/loss_step=0.038, global_step=4094.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  56%|█████▌    | 677/1208 [19:31<15:18,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00133, train/loss_step=0.288, global_step=4095.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  56%|█████▌    | 678/1208 [19:32<15:16,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00133, train/loss_step=0.288, global_step=4095.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  56%|█████▌    | 678/1208 [19:32<15:16,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00548, train/loss_step=0.454, global_step=4095.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  56%|█████▌    | 679/1208 [19:33<15:13,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00548, train/loss_step=0.454, global_step=4095.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  56%|█████▌    | 679/1208 [19:33<15:13,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000521, train/loss_step=0.153, global_step=4095.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  56%|█████▋    | 680/1208 [19:36<15:13,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000521, train/loss_step=0.153, global_step=4095.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  56%|█████▋    | 680/1208 [19:36<15:13,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000947, train/loss_step=0.237, global_step=4095.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  56%|█████▋    | 681/1208 [19:37<15:11,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000947, train/loss_step=0.237, global_step=4095.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  56%|█████▋    | 681/1208 [19:37<15:11,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000103, train/loss_step=0.0254, global_step=4096.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  56%|█████▋    | 682/1208 [19:38<15:08,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000103, train/loss_step=0.0254, global_step=4096.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  56%|█████▋    | 682/1208 [19:38<15:08,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.51e-5, train/loss_step=0.00272, global_step=4096.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  57%|█████▋    | 683/1208 [19:39<15:06,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.51e-5, train/loss_step=0.00272, global_step=4096.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  57%|█████▋    | 683/1208 [19:39<15:06,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0663, train/loss_vlb_step=0.000231, train/loss_step=0.0663, global_step=4096.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  57%|█████▋    | 684/1208 [19:42<15:06,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0663, train/loss_vlb_step=0.000231, train/loss_step=0.0663, global_step=4096.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  57%|█████▋    | 684/1208 [19:42<15:06,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=1.64e-5, train/loss_step=0.00276, global_step=4096.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  57%|█████▋    | 685/1208 [19:43<15:03,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=1.64e-5, train/loss_step=0.00276, global_step=4096.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  57%|█████▋    | 685/1208 [19:43<15:03,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.32e-5, train/loss_step=0.0171, global_step=4097.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  57%|█████▋    | 686/1208 [19:44<15:01,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.32e-5, train/loss_step=0.0171, global_step=4097.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  57%|█████▋    | 686/1208 [19:44<15:01,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0878, train/loss_vlb_step=0.000291, train/loss_step=0.0878, global_step=4097.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  57%|█████▋    | 687/1208 [19:45<14:59,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0878, train/loss_vlb_step=0.000291, train/loss_step=0.0878, global_step=4097.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  57%|█████▋    | 687/1208 [19:45<14:59,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0366, train/loss_vlb_step=0.000134, train/loss_step=0.0366, global_step=4097.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  57%|█████▋    | 688/1208 [19:49<14:58,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0366, train/loss_vlb_step=0.000134, train/loss_step=0.0366, global_step=4097.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  57%|█████▋    | 688/1208 [19:49<14:58,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.00107, train/loss_step=0.235, global_step=4097.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  57%|█████▋    | 689/1208 [19:50<14:56,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.00107, train/loss_step=0.235, global_step=4097.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  57%|█████▋    | 689/1208 [19:50<14:56,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00102, train/loss_step=0.245, global_step=4098.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  57%|█████▋    | 690/1208 [19:51<14:54,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00102, train/loss_step=0.245, global_step=4098.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  57%|█████▋    | 690/1208 [19:51<14:54,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000518, train/loss_step=0.151, global_step=4098.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  57%|█████▋    | 691/1208 [19:52<14:52,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000518, train/loss_step=0.151, global_step=4098.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  57%|█████▋    | 691/1208 [19:52<14:52,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00135, train/loss_step=0.290, global_step=4098.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  57%|█████▋    | 692/1208 [19:55<14:51,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00135, train/loss_step=0.290, global_step=4098.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  57%|█████▋    | 692/1208 [19:55<14:51,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.6e-5, train/loss_step=0.0178, global_step=4098.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  57%|█████▋    | 693/1208 [19:56<14:49,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.6e-5, train/loss_step=0.0178, global_step=4098.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  57%|█████▋    | 693/1208 [19:56<14:49,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0907, train/loss_vlb_step=0.000301, train/loss_step=0.0907, global_step=4099.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  57%|█████▋    | 694/1208 [19:57<14:46,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0907, train/loss_vlb_step=0.000301, train/loss_step=0.0907, global_step=4099.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  57%|█████▋    | 694/1208 [19:57<14:46,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0666, train/loss_vlb_step=0.000229, train/loss_step=0.0666, global_step=4099.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  58%|█████▊    | 695/1208 [19:58<14:44,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0666, train/loss_vlb_step=0.000229, train/loss_step=0.0666, global_step=4099.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  58%|█████▊    | 695/1208 [19:58<14:44,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000517, train/loss_step=0.156, global_step=4099.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  58%|█████▊    | 696/1208 [20:01<14:44,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000517, train/loss_step=0.156, global_step=4099.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  58%|█████▊    | 696/1208 [20:01<14:44,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=1.7e-5, train/loss_step=0.00295, global_step=4099.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  58%|█████▊    | 697/1208 [20:02<14:41,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=1.7e-5, train/loss_step=0.00295, global_step=4099.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  58%|█████▊    | 697/1208 [20:02<14:41,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00123, train/loss_step=0.277, global_step=4100.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  58%|█████▊    | 698/1208 [20:03<14:39,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00123, train/loss_step=0.277, global_step=4100.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  58%|█████▊    | 698/1208 [20:03<14:39,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000106, train/loss_step=0.0262, global_step=4100.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  58%|█████▊    | 699/1208 [20:04<14:37,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000106, train/loss_step=0.0262, global_step=4100.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  58%|█████▊    | 699/1208 [20:04<14:37,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00361, train/loss_step=0.436, global_step=4100.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  58%|█████▊    | 700/1208 [20:08<14:36,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00361, train/loss_step=0.436, global_step=4100.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  58%|█████▊    | 700/1208 [20:08<14:36,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000348, train/loss_step=0.106, global_step=4100.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  58%|█████▊    | 701/1208 [20:09<14:34,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000348, train/loss_step=0.106, global_step=4100.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  58%|█████▊    | 701/1208 [20:09<14:34,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00287, train/loss_vlb_step=1.6e-5, train/loss_step=0.00287, global_step=4101.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  58%|█████▊    | 702/1208 [20:10<14:32,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00287, train/loss_vlb_step=1.6e-5, train/loss_step=0.00287, global_step=4101.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  58%|█████▊    | 702/1208 [20:10<14:32,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000958, train/loss_step=0.210, global_step=4101.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  58%|█████▊    | 703/1208 [20:11<14:30,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000958, train/loss_step=0.210, global_step=4101.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  58%|█████▊    | 703/1208 [20:11<14:30,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00205, train/loss_step=0.321, global_step=4101.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  58%|█████▊    | 704/1208 [20:14<14:29,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00205, train/loss_step=0.321, global_step=4101.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  58%|█████▊    | 704/1208 [20:14<14:29,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0782, train/loss_vlb_step=0.000262, train/loss_step=0.0782, global_step=4101.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  58%|█████▊    | 705/1208 [20:15<14:27,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0782, train/loss_vlb_step=0.000262, train/loss_step=0.0782, global_step=4101.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  58%|█████▊    | 705/1208 [20:15<14:27,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.35e-5, train/loss_step=0.0242, global_step=4102.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  58%|█████▊    | 706/1208 [20:16<14:25,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.35e-5, train/loss_step=0.0242, global_step=4102.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  58%|█████▊    | 706/1208 [20:16<14:25,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.0045, train/loss_step=0.427, global_step=4102.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  59%|█████▊    | 707/1208 [20:17<14:22,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.0045, train/loss_step=0.427, global_step=4102.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  59%|█████▊    | 707/1208 [20:17<14:22,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000401, train/loss_step=0.120, global_step=4102.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  59%|█████▊    | 708/1208 [20:20<14:22,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000401, train/loss_step=0.120, global_step=4102.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  59%|█████▊    | 708/1208 [20:20<14:22,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0919, train/loss_vlb_step=0.000304, train/loss_step=0.0919, global_step=4102.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  59%|█████▊    | 709/1208 [20:22<14:20,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0919, train/loss_vlb_step=0.000304, train/loss_step=0.0919, global_step=4102.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  59%|█████▊    | 709/1208 [20:22<14:20,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00192, train/loss_step=0.359, global_step=4103.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  59%|█████▉    | 710/1208 [20:23<14:17,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00192, train/loss_step=0.359, global_step=4103.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  59%|█████▉    | 710/1208 [20:23<14:17,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00853, train/loss_vlb_step=4.18e-5, train/loss_step=0.00853, global_step=4103.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  59%|█████▉    | 711/1208 [20:24<14:15,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00853, train/loss_vlb_step=4.18e-5, train/loss_step=0.00853, global_step=4103.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  59%|█████▉    | 711/1208 [20:24<14:15,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.81e-5, train/loss_step=0.0245, global_step=4103.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  59%|█████▉    | 712/1208 [20:27<14:14,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.81e-5, train/loss_step=0.0245, global_step=4103.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  59%|█████▉    | 712/1208 [20:27<14:14,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000944, train/loss_step=0.231, global_step=4103.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  59%|█████▉    | 713/1208 [20:28<14:12,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000944, train/loss_step=0.231, global_step=4103.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  59%|█████▉    | 713/1208 [20:28<14:12,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0548, train/loss_vlb_step=0.000196, train/loss_step=0.0548, global_step=4104.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  59%|█████▉    | 714/1208 [20:29<14:10,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0548, train/loss_vlb_step=0.000196, train/loss_step=0.0548, global_step=4104.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  59%|█████▉    | 714/1208 [20:29<14:10,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.00057, train/loss_step=0.173, global_step=4104.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  59%|█████▉    | 715/1208 [20:30<14:08,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.00057, train/loss_step=0.173, global_step=4104.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  59%|█████▉    | 715/1208 [20:30<14:08,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000915, train/loss_step=0.230, global_step=4104.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  59%|█████▉    | 716/1208 [20:33<14:07,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000915, train/loss_step=0.230, global_step=4104.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  59%|█████▉    | 716/1208 [20:33<14:07,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.09e-5, train/loss_step=0.0112, global_step=4104.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  59%|█████▉    | 717/1208 [20:34<14:05,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.09e-5, train/loss_step=0.0112, global_step=4104.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  59%|█████▉    | 717/1208 [20:34<14:05,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.22e-5, train/loss_step=0.0113, global_step=4105.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  59%|█████▉    | 718/1208 [20:35<14:03,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.22e-5, train/loss_step=0.0113, global_step=4105.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  59%|█████▉    | 718/1208 [20:35<14:03,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=4105.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  60%|█████▉    | 719/1208 [20:36<14:01,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=4105.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  60%|█████▉    | 719/1208 [20:36<14:01,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00939, train/loss_vlb_step=4.5e-5, train/loss_step=0.00939, global_step=4105.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  60%|█████▉    | 720/1208 [20:40<14:00,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00939, train/loss_vlb_step=4.5e-5, train/loss_step=0.00939, global_step=4105.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  60%|█████▉    | 720/1208 [20:40<14:00,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0083, train/loss_vlb_step=4.05e-5, train/loss_step=0.0083, global_step=4105.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  60%|█████▉    | 721/1208 [20:41<13:58,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0083, train/loss_vlb_step=4.05e-5, train/loss_step=0.0083, global_step=4105.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  60%|█████▉    | 721/1208 [20:41<13:58,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00666, train/loss_vlb_step=3.28e-5, train/loss_step=0.00666, global_step=4106.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  60%|█████▉    | 722/1208 [20:42<13:56,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00666, train/loss_vlb_step=3.28e-5, train/loss_step=0.00666, global_step=4106.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  60%|█████▉    | 722/1208 [20:42<13:56,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00882, train/loss_vlb_step=4.24e-5, train/loss_step=0.00882, global_step=4106.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  60%|█████▉    | 723/1208 [20:43<13:54,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00882, train/loss_vlb_step=4.24e-5, train/loss_step=0.00882, global_step=4106.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  60%|█████▉    | 723/1208 [20:43<13:54,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000103, train/loss_step=0.0268, global_step=4106.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  60%|█████▉    | 724/1208 [20:46<13:53,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000103, train/loss_step=0.0268, global_step=4106.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  60%|█████▉    | 724/1208 [20:46<13:53,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0774, train/loss_vlb_step=0.000255, train/loss_step=0.0774, global_step=4106.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  60%|██████    | 725/1208 [20:47<13:51,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0774, train/loss_vlb_step=0.000255, train/loss_step=0.0774, global_step=4106.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  60%|██████    | 725/1208 [20:47<13:51,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.507, train/loss_vlb_step=0.0058, train/loss_step=0.507, global_step=4107.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  60%|██████    | 726/1208 [20:48<13:49,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.507, train/loss_vlb_step=0.0058, train/loss_step=0.507, global_step=4107.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  60%|██████    | 726/1208 [20:48<13:49,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00177, train/loss_step=0.338, global_step=4107.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  60%|██████    | 727/1208 [20:49<13:46,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00177, train/loss_step=0.338, global_step=4107.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  60%|██████    | 727/1208 [20:49<13:46,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0559, train/loss_vlb_step=0.000196, train/loss_step=0.0559, global_step=4107.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  60%|██████    | 728/1208 [20:53<13:46,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0559, train/loss_vlb_step=0.000196, train/loss_step=0.0559, global_step=4107.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  60%|██████    | 728/1208 [20:53<13:46,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00219, train/loss_step=0.352, global_step=4107.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  60%|██████    | 729/1208 [20:54<13:44,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00219, train/loss_step=0.352, global_step=4107.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  60%|██████    | 729/1208 [20:54<13:44,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00393, train/loss_vlb_step=2.14e-5, train/loss_step=0.00393, global_step=4108.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  60%|██████    | 730/1208 [20:55<13:41,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00393, train/loss_vlb_step=2.14e-5, train/loss_step=0.00393, global_step=4108.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  60%|██████    | 730/1208 [20:55<13:41,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.41e-5, train/loss_step=0.0119, global_step=4108.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  61%|██████    | 731/1208 [20:56<13:39,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.41e-5, train/loss_step=0.0119, global_step=4108.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  61%|██████    | 731/1208 [20:56<13:39,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.475, train/loss_vlb_step=0.00756, train/loss_step=0.475, global_step=4108.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  61%|██████    | 732/1208 [20:59<13:38,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.475, train/loss_vlb_step=0.00756, train/loss_step=0.475, global_step=4108.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  61%|██████    | 732/1208 [20:59<13:38,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0609, train/loss_vlb_step=0.000217, train/loss_step=0.0609, global_step=4108.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  61%|██████    | 733/1208 [21:00<13:36,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0609, train/loss_vlb_step=0.000217, train/loss_step=0.0609, global_step=4108.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  61%|██████    | 733/1208 [21:00<13:36,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000347, train/loss_step=0.106, global_step=4109.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  61%|██████    | 734/1208 [21:01<13:34,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000347, train/loss_step=0.106, global_step=4109.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  61%|██████    | 734/1208 [21:01<13:34,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00134, train/loss_step=0.294, global_step=4109.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  61%|██████    | 735/1208 [21:02<13:32,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00134, train/loss_step=0.294, global_step=4109.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  61%|██████    | 735/1208 [21:02<13:32,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000403, train/loss_step=0.122, global_step=4109.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  61%|██████    | 736/1208 [21:05<13:31,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000403, train/loss_step=0.122, global_step=4109.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  61%|██████    | 736/1208 [21:05<13:31,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.72e-5, train/loss_step=0.0191, global_step=4109.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  61%|██████    | 737/1208 [21:06<13:29,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.72e-5, train/loss_step=0.0191, global_step=4109.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  61%|██████    | 737/1208 [21:06<13:29,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00166, train/loss_step=0.303, global_step=4110.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  61%|██████    | 738/1208 [21:07<13:27,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00166, train/loss_step=0.303, global_step=4110.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  61%|██████    | 738/1208 [21:07<13:27,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00779, train/loss_vlb_step=3.72e-5, train/loss_step=0.00779, global_step=4110.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  61%|██████    | 739/1208 [21:09<13:25,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00779, train/loss_vlb_step=3.72e-5, train/loss_step=0.00779, global_step=4110.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  61%|██████    | 739/1208 [21:09<13:25,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0735, train/loss_vlb_step=0.000247, train/loss_step=0.0735, global_step=4110.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  61%|██████▏   | 740/1208 [21:12<13:24,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0735, train/loss_vlb_step=0.000247, train/loss_step=0.0735, global_step=4110.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  61%|██████▏   | 740/1208 [21:12<13:24,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=1.78e-5, train/loss_step=0.0031, global_step=4110.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  61%|██████▏   | 741/1208 [21:13<13:22,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=1.78e-5, train/loss_step=0.0031, global_step=4110.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  61%|██████▏   | 741/1208 [21:13<13:22,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000125, train/loss_step=0.0336, global_step=4111.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  61%|██████▏   | 742/1208 [21:14<13:20,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000125, train/loss_step=0.0336, global_step=4111.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  61%|██████▏   | 742/1208 [21:14<13:20,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00273, train/loss_step=0.390, global_step=4111.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  62%|██████▏   | 743/1208 [21:15<13:18,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00273, train/loss_step=0.390, global_step=4111.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  62%|██████▏   | 743/1208 [21:15<13:18,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.00056, train/loss_step=0.162, global_step=4111.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  62%|██████▏   | 744/1208 [21:18<13:17,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.00056, train/loss_step=0.162, global_step=4111.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  62%|██████▏   | 744/1208 [21:18<13:17,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000922, train/loss_step=0.218, global_step=4111.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  62%|██████▏   | 745/1208 [21:19<13:15,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000922, train/loss_step=0.218, global_step=4111.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  62%|██████▏   | 745/1208 [21:19<13:15,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000504, train/loss_step=0.152, global_step=4112.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  62%|██████▏   | 746/1208 [21:20<13:13,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000504, train/loss_step=0.152, global_step=4112.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  62%|██████▏   | 746/1208 [21:20<13:13,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00223, train/loss_step=0.346, global_step=4112.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  62%|██████▏   | 747/1208 [21:21<13:11,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00223, train/loss_step=0.346, global_step=4112.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  62%|██████▏   | 747/1208 [21:21<13:11,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000493, train/loss_step=0.146, global_step=4112.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  62%|██████▏   | 748/1208 [21:24<13:10,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000493, train/loss_step=0.146, global_step=4112.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  62%|██████▏   | 748/1208 [21:24<13:10,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.710, train/loss_vlb_step=0.0407, train/loss_step=0.710, global_step=4112.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  62%|██████▏   | 749/1208 [21:26<13:08,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.710, train/loss_vlb_step=0.0407, train/loss_step=0.710, global_step=4112.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  62%|██████▏   | 749/1208 [21:26<13:08,  1.72s/it, loss=0.19, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000555, train/loss_step=0.162, global_step=4113.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  62%|██████▏   | 750/1208 [21:27<13:05,  1.72s/it, loss=0.19, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000555, train/loss_step=0.162, global_step=4113.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  62%|██████▏   | 750/1208 [21:27<13:05,  1.72s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000108, train/loss_step=0.0283, global_step=4113.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  62%|██████▏   | 751/1208 [21:28<13:03,  1.72s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000108, train/loss_step=0.0283, global_step=4113.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  62%|██████▏   | 751/1208 [21:28<13:03,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00841, train/loss_vlb_step=4e-5, train/loss_step=0.00841, global_step=4113.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  62%|██████▏   | 752/1208 [21:31<13:03,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00841, train/loss_vlb_step=4e-5, train/loss_step=0.00841, global_step=4113.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  62%|██████▏   | 752/1208 [21:31<13:03,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0498, train/loss_vlb_step=0.000173, train/loss_step=0.0498, global_step=4113.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  62%|██████▏   | 753/1208 [21:32<13:00,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0498, train/loss_vlb_step=0.000173, train/loss_step=0.0498, global_step=4113.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  62%|██████▏   | 753/1208 [21:32<13:00,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.24e-5, train/loss_step=0.0174, global_step=4114.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  62%|██████▏   | 754/1208 [21:33<12:58,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.24e-5, train/loss_step=0.0174, global_step=4114.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  62%|██████▏   | 754/1208 [21:33<12:58,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000491, train/loss_step=0.147, global_step=4114.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  62%|██████▎   | 755/1208 [21:34<12:56,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000491, train/loss_step=0.147, global_step=4114.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  62%|██████▎   | 755/1208 [21:34<12:56,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000584, train/loss_step=0.174, global_step=4114.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  63%|██████▎   | 756/1208 [21:37<12:55,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000584, train/loss_step=0.174, global_step=4114.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  63%|██████▎   | 756/1208 [21:37<12:55,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.44e-5, train/loss_step=0.012, global_step=4114.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  63%|██████▎   | 757/1208 [21:38<12:53,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.44e-5, train/loss_step=0.012, global_step=4114.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  63%|██████▎   | 757/1208 [21:38<12:53,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.776, train/loss_vlb_step=0.029, train/loss_step=0.776, global_step=4115.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  63%|██████▎   | 758/1208 [21:39<12:51,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.776, train/loss_vlb_step=0.029, train/loss_step=0.776, global_step=4115.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  63%|██████▎   | 758/1208 [21:39<12:51,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00506, train/loss_vlb_step=2.7e-5, train/loss_step=0.00506, global_step=4115.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  63%|██████▎   | 759/1208 [21:40<12:49,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00506, train/loss_vlb_step=2.7e-5, train/loss_step=0.00506, global_step=4115.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  63%|██████▎   | 759/1208 [21:40<12:49,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000499, train/loss_step=0.151, global_step=4115.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  63%|██████▎   | 760/1208 [21:44<12:48,  1.72s/it, loss=0.185, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000499, train/loss_step=0.151, global_step=4115.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  63%|██████▎   | 760/1208 [21:44<12:48,  1.72s/it, loss=0.203, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00313, train/loss_step=0.361, global_step=4115.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  63%|██████▎   | 761/1208 [21:45<12:46,  1.72s/it, loss=0.203, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00313, train/loss_step=0.361, global_step=4115.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  63%|██████▎   | 761/1208 [21:45<12:46,  1.72s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000105, train/loss_step=0.0268, global_step=4116.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  63%|██████▎   | 762/1208 [21:46<12:44,  1.71s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000105, train/loss_step=0.0268, global_step=4116.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  63%|██████▎   | 762/1208 [21:46<12:44,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0486, train/loss_vlb_step=0.000175, train/loss_step=0.0486, global_step=4116.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  63%|██████▎   | 763/1208 [21:47<12:42,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0486, train/loss_vlb_step=0.000175, train/loss_step=0.0486, global_step=4116.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  63%|██████▎   | 763/1208 [21:47<12:42,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00941, train/loss_vlb_step=4.09e-5, train/loss_step=0.00941, global_step=4116.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  63%|██████▎   | 764/1208 [21:50<12:41,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00941, train/loss_vlb_step=4.09e-5, train/loss_step=0.00941, global_step=4116.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  63%|██████▎   | 764/1208 [21:50<12:41,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0389, train/loss_vlb_step=0.000143, train/loss_step=0.0389, global_step=4116.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  63%|██████▎   | 765/1208 [21:51<12:39,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0389, train/loss_vlb_step=0.000143, train/loss_step=0.0389, global_step=4116.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  63%|██████▎   | 765/1208 [21:51<12:39,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.00404, train/loss_step=0.406, global_step=4117.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  63%|██████▎   | 766/1208 [21:52<12:37,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.00404, train/loss_step=0.406, global_step=4117.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  63%|██████▎   | 766/1208 [21:52<12:37,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0492, train/loss_vlb_step=0.000176, train/loss_step=0.0492, global_step=4117.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  63%|██████▎   | 767/1208 [21:53<12:35,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0492, train/loss_vlb_step=0.000176, train/loss_step=0.0492, global_step=4117.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  63%|██████▎   | 767/1208 [21:53<12:35,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00173, train/loss_step=0.330, global_step=4117.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  64%|██████▎   | 768/1208 [21:56<12:34,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00173, train/loss_step=0.330, global_step=4117.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  64%|██████▎   | 768/1208 [21:56<12:34,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000245, train/loss_step=0.0741, global_step=4117.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  64%|██████▎   | 769/1208 [21:58<12:32,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000245, train/loss_step=0.0741, global_step=4117.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  64%|██████▎   | 769/1208 [21:58<12:32,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.00043, train/loss_step=0.130, global_step=4118.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  64%|██████▎   | 770/1208 [21:59<12:30,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.00043, train/loss_step=0.130, global_step=4118.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  64%|██████▎   | 770/1208 [21:59<12:30,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00699, train/loss_vlb_step=3.56e-5, train/loss_step=0.00699, global_step=4118.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  64%|██████▍   | 771/1208 [22:00<12:28,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00699, train/loss_vlb_step=3.56e-5, train/loss_step=0.00699, global_step=4118.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  64%|██████▍   | 771/1208 [22:00<12:28,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.29e-5, train/loss_step=0.014, global_step=4118.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  64%|██████▍   | 772/1208 [22:03<12:27,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.29e-5, train/loss_step=0.014, global_step=4118.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  64%|██████▍   | 772/1208 [22:03<12:27,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0424, train/loss_vlb_step=0.00016, train/loss_step=0.0424, global_step=4118.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  64%|██████▍   | 773/1208 [22:04<12:25,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0424, train/loss_vlb_step=0.00016, train/loss_step=0.0424, global_step=4118.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  64%|██████▍   | 773/1208 [22:04<12:25,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.53e-5, train/loss_step=0.0122, global_step=4119.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  64%|██████▍   | 774/1208 [22:05<12:23,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.53e-5, train/loss_step=0.0122, global_step=4119.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  64%|██████▍   | 774/1208 [22:05<12:23,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.00039, train/loss_step=0.119, global_step=4119.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  64%|██████▍   | 775/1208 [22:06<12:21,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.00039, train/loss_step=0.119, global_step=4119.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  64%|██████▍   | 775/1208 [22:06<12:21,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000552, train/loss_step=0.166, global_step=4119.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  64%|██████▍   | 776/1208 [22:09<12:20,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000552, train/loss_step=0.166, global_step=4119.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  64%|██████▍   | 776/1208 [22:09<12:20,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00219, train/loss_step=0.335, global_step=4119.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  64%|██████▍   | 777/1208 [22:10<12:18,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00219, train/loss_step=0.335, global_step=4119.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  64%|██████▍   | 777/1208 [22:10<12:18,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.078, train/loss_vlb_step=0.000265, train/loss_step=0.078, global_step=4120.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  64%|██████▍   | 778/1208 [22:11<12:16,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.078, train/loss_vlb_step=0.000265, train/loss_step=0.078, global_step=4120.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  64%|██████▍   | 778/1208 [22:11<12:16,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000165, train/loss_step=0.0445, global_step=4120.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  64%|██████▍   | 779/1208 [22:12<12:14,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000165, train/loss_step=0.0445, global_step=4120.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  64%|██████▍   | 779/1208 [22:12<12:14,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=0.0001, train/loss_step=0.025, global_step=4120.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  65%|██████▍   | 780/1208 [22:16<12:13,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=0.0001, train/loss_step=0.025, global_step=4120.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  65%|██████▍   | 780/1208 [22:16<12:13,  1.71s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.3e-5, train/loss_step=0.0111, global_step=4120.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  65%|██████▍   | 781/1208 [22:17<12:11,  1.71s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.3e-5, train/loss_step=0.0111, global_step=4120.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  65%|██████▍   | 781/1208 [22:17<12:11,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000489, train/loss_step=0.147, global_step=4121.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  65%|██████▍   | 782/1208 [22:18<12:09,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000489, train/loss_step=0.147, global_step=4121.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  65%|██████▍   | 782/1208 [22:18<12:09,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0606, train/loss_vlb_step=0.000208, train/loss_step=0.0606, global_step=4121.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  65%|██████▍   | 783/1208 [22:19<12:07,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0606, train/loss_vlb_step=0.000208, train/loss_step=0.0606, global_step=4121.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  65%|██████▍   | 783/1208 [22:19<12:07,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00554, train/loss_vlb_step=2.84e-5, train/loss_step=0.00554, global_step=4121.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  65%|██████▍   | 784/1208 [22:22<12:06,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00554, train/loss_vlb_step=2.84e-5, train/loss_step=0.00554, global_step=4121.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  65%|██████▍   | 784/1208 [22:22<12:06,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0464, train/loss_vlb_step=0.000178, train/loss_step=0.0464, global_step=4121.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  65%|██████▍   | 785/1208 [22:23<12:04,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0464, train/loss_vlb_step=0.000178, train/loss_step=0.0464, global_step=4121.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  65%|██████▍   | 785/1208 [22:23<12:04,  1.71s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.00791, train/loss_vlb_step=3.93e-5, train/loss_step=0.00791, global_step=4122.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  65%|██████▌   | 786/1208 [22:24<12:02,  1.71s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.00791, train/loss_vlb_step=3.93e-5, train/loss_step=0.00791, global_step=4122.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  65%|██████▌   | 786/1208 [22:24<12:02,  1.71s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.73e-5, train/loss_step=0.0155, global_step=4122.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  65%|██████▌   | 787/1208 [22:25<11:59,  1.71s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.73e-5, train/loss_step=0.0155, global_step=4122.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  65%|██████▌   | 787/1208 [22:25<11:59,  1.71s/it, loss=0.0702, v_num=0, train/loss_simple_step=0.0635, train/loss_vlb_step=0.000215, train/loss_step=0.0635, global_step=4122.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  65%|██████▌   | 788/1208 [22:29<11:59,  1.71s/it, loss=0.0702, v_num=0, train/loss_simple_step=0.0635, train/loss_vlb_step=0.000215, train/loss_step=0.0635, global_step=4122.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  65%|██████▌   | 788/1208 [22:29<11:59,  1.71s/it, loss=0.0754, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000628, train/loss_step=0.178, global_step=4122.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  65%|██████▌   | 789/1208 [22:30<11:57,  1.71s/it, loss=0.0754, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000628, train/loss_step=0.178, global_step=4122.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  65%|██████▌   | 789/1208 [22:30<11:57,  1.71s/it, loss=0.0804, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.001, train/loss_step=0.229, global_step=4123.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  65%|██████▌   | 790/1208 [22:31<11:54,  1.71s/it, loss=0.0804, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.001, train/loss_step=0.229, global_step=4123.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  65%|██████▌   | 790/1208 [22:31<11:54,  1.71s/it, loss=0.0809, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.11e-5, train/loss_step=0.0169, global_step=4123.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  65%|██████▌   | 791/1208 [22:32<11:52,  1.71s/it, loss=0.0809, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.11e-5, train/loss_step=0.0169, global_step=4123.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  65%|██████▌   | 791/1208 [22:32<11:52,  1.71s/it, loss=0.088, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000523, train/loss_step=0.156, global_step=4123.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  66%|██████▌   | 792/1208 [22:35<11:51,  1.71s/it, loss=0.088, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000523, train/loss_step=0.156, global_step=4123.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  66%|██████▌   | 792/1208 [22:35<11:51,  1.71s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.0012, train/loss_step=0.266, global_step=4123.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  66%|██████▌   | 793/1208 [22:36<11:49,  1.71s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.0012, train/loss_step=0.266, global_step=4123.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  66%|██████▌   | 793/1208 [22:36<11:49,  1.71s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=1.41e-5, train/loss_step=0.0024, global_step=4124.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  66%|██████▌   | 794/1208 [22:37<11:47,  1.71s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=1.41e-5, train/loss_step=0.0024, global_step=4124.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  66%|██████▌   | 794/1208 [22:37<11:47,  1.71s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.082, train/loss_vlb_step=0.000278, train/loss_step=0.082, global_step=4124.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  66%|██████▌   | 795/1208 [22:38<11:45,  1.71s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.082, train/loss_vlb_step=0.000278, train/loss_step=0.082, global_step=4124.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  66%|██████▌   | 795/1208 [22:38<11:45,  1.71s/it, loss=0.0898, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=9.96e-5, train/loss_step=0.0249, global_step=4124.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  66%|██████▌   | 796/1208 [22:41<11:44,  1.71s/it, loss=0.0898, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=9.96e-5, train/loss_step=0.0249, global_step=4124.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  66%|██████▌   | 796/1208 [22:41<11:44,  1.71s/it, loss=0.0757, v_num=0, train/loss_simple_step=0.0534, train/loss_vlb_step=0.000178, train/loss_step=0.0534, global_step=4124.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  66%|██████▌   | 797/1208 [22:42<11:42,  1.71s/it, loss=0.0757, v_num=0, train/loss_simple_step=0.0534, train/loss_vlb_step=0.000178, train/loss_step=0.0534, global_step=4124.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  66%|██████▌   | 797/1208 [22:42<11:42,  1.71s/it, loss=0.0841, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00129, train/loss_step=0.245, global_step=4125.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  66%|██████▌   | 798/1208 [22:43<11:40,  1.71s/it, loss=0.0841, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00129, train/loss_step=0.245, global_step=4125.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  66%|██████▌   | 798/1208 [22:43<11:40,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00306, train/loss_step=0.412, global_step=4125.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  66%|██████▌   | 799/1208 [22:45<11:38,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00306, train/loss_step=0.412, global_step=4125.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  66%|██████▌   | 799/1208 [22:45<11:38,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.15e-5, train/loss_step=0.00423, global_step=4125.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  66%|██████▌   | 800/1208 [22:48<11:37,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.15e-5, train/loss_step=0.00423, global_step=4125.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  66%|██████▌   | 800/1208 [22:48<11:37,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.000188, train/loss_step=0.0527, global_step=4125.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  66%|██████▋   | 801/1208 [22:49<11:35,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.000188, train/loss_step=0.0527, global_step=4125.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  66%|██████▋   | 801/1208 [22:49<11:35,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0911, train/loss_vlb_step=0.000301, train/loss_step=0.0911, global_step=4126.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  66%|██████▋   | 802/1208 [22:50<11:33,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0911, train/loss_vlb_step=0.000301, train/loss_step=0.0911, global_step=4126.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  66%|██████▋   | 802/1208 [22:50<11:33,  1.71s/it, loss=0.114, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00157, train/loss_step=0.320, global_step=4126.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  66%|██████▋   | 803/1208 [22:51<11:31,  1.71s/it, loss=0.114, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00157, train/loss_step=0.320, global_step=4126.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  66%|██████▋   | 803/1208 [22:51<11:31,  1.71s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.74e-5, train/loss_step=0.0108, global_step=4126.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  67%|██████▋   | 804/1208 [22:54<11:30,  1.71s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.74e-5, train/loss_step=0.0108, global_step=4126.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  67%|██████▋   | 804/1208 [22:54<11:30,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.0018, train/loss_step=0.318, global_step=4126.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  67%|██████▋   | 805/1208 [22:55<11:28,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.0018, train/loss_step=0.318, global_step=4126.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  67%|██████▋   | 805/1208 [22:55<11:28,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000674, train/loss_step=0.194, global_step=4127.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  67%|██████▋   | 806/1208 [22:56<11:26,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000674, train/loss_step=0.194, global_step=4127.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  67%|██████▋   | 806/1208 [22:56<11:26,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00476, train/loss_step=0.458, global_step=4127.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  67%|██████▋   | 807/1208 [22:57<11:24,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00476, train/loss_step=0.458, global_step=4127.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  67%|██████▋   | 807/1208 [22:57<11:24,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.41e-5, train/loss_step=0.0124, global_step=4127.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  67%|██████▋   | 808/1208 [23:01<11:23,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.41e-5, train/loss_step=0.0124, global_step=4127.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  67%|██████▋   | 808/1208 [23:01<11:23,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000643, train/loss_step=0.190, global_step=4127.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  67%|██████▋   | 809/1208 [23:02<11:21,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000643, train/loss_step=0.190, global_step=4127.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  67%|██████▋   | 809/1208 [23:02<11:21,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00114, train/loss_step=0.296, global_step=4128.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  67%|██████▋   | 810/1208 [23:03<11:19,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00114, train/loss_step=0.296, global_step=4128.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  67%|██████▋   | 810/1208 [23:03<11:19,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.51e-5, train/loss_step=0.00278, global_step=4128.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  67%|██████▋   | 811/1208 [23:04<11:17,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.51e-5, train/loss_step=0.00278, global_step=4128.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  67%|██████▋   | 811/1208 [23:04<11:17,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00554, train/loss_vlb_step=2.86e-5, train/loss_step=0.00554, global_step=4128.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  67%|██████▋   | 812/1208 [23:07<11:16,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00554, train/loss_vlb_step=2.86e-5, train/loss_step=0.00554, global_step=4128.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  67%|██████▋   | 812/1208 [23:07<11:16,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000101, train/loss_step=0.026, global_step=4128.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  67%|██████▋   | 813/1208 [23:08<11:14,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000101, train/loss_step=0.026, global_step=4128.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  67%|██████▋   | 813/1208 [23:08<11:14,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000793, train/loss_step=0.212, global_step=4129.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  67%|██████▋   | 814/1208 [23:09<11:12,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000793, train/loss_step=0.212, global_step=4129.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  67%|██████▋   | 814/1208 [23:09<11:12,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=1.72e-5, train/loss_step=0.00302, global_step=4129.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  67%|██████▋   | 815/1208 [23:10<11:10,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=1.72e-5, train/loss_step=0.00302, global_step=4129.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  67%|██████▋   | 815/1208 [23:10<11:10,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000401, train/loss_step=0.122, global_step=4129.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  68%|██████▊   | 816/1208 [23:13<11:09,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000401, train/loss_step=0.122, global_step=4129.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  68%|██████▊   | 816/1208 [23:13<11:09,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.000152, train/loss_step=0.0403, global_step=4129.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  68%|██████▊   | 817/1208 [23:14<11:07,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.000152, train/loss_step=0.0403, global_step=4129.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  68%|██████▊   | 817/1208 [23:14<11:07,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00339, train/loss_vlb_step=1.86e-5, train/loss_step=0.00339, global_step=4130.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  68%|██████▊   | 818/1208 [23:16<11:05,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00339, train/loss_vlb_step=1.86e-5, train/loss_step=0.00339, global_step=4130.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  68%|██████▊   | 818/1208 [23:16<11:05,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00944, train/loss_vlb_step=4.49e-5, train/loss_step=0.00944, global_step=4130.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  68%|██████▊   | 819/1208 [23:17<11:03,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00944, train/loss_vlb_step=4.49e-5, train/loss_step=0.00944, global_step=4130.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  68%|██████▊   | 819/1208 [23:17<11:03,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000337, train/loss_step=0.103, global_step=4130.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  68%|██████▊   | 820/1208 [23:20<11:02,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000337, train/loss_step=0.103, global_step=4130.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  68%|██████▊   | 820/1208 [23:20<11:02,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00649, train/loss_vlb_step=3.3e-5, train/loss_step=0.00649, global_step=4130.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  68%|██████▊   | 821/1208 [23:21<11:00,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00649, train/loss_vlb_step=3.3e-5, train/loss_step=0.00649, global_step=4130.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  68%|██████▊   | 821/1208 [23:21<11:00,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000895, train/loss_step=0.239, global_step=4131.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  68%|██████▊   | 822/1208 [23:22<10:58,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000895, train/loss_step=0.239, global_step=4131.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  68%|██████▊   | 822/1208 [23:22<10:58,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00237, train/loss_vlb_step=1.44e-5, train/loss_step=0.00237, global_step=4131.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  68%|██████▊   | 823/1208 [23:23<10:56,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00237, train/loss_vlb_step=1.44e-5, train/loss_step=0.00237, global_step=4131.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  68%|██████▊   | 823/1208 [23:23<10:56,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.00011, train/loss_step=0.027, global_step=4131.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  68%|██████▊   | 824/1208 [23:26<10:55,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.00011, train/loss_step=0.027, global_step=4131.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  68%|██████▊   | 824/1208 [23:26<10:55,  1.71s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.0047, train/loss_vlb_step=2.44e-5, train/loss_step=0.0047, global_step=4131.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  68%|██████▊   | 825/1208 [23:27<10:53,  1.71s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.0047, train/loss_vlb_step=2.44e-5, train/loss_step=0.0047, global_step=4131.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  68%|██████▊   | 825/1208 [23:27<10:53,  1.71s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.0658, train/loss_vlb_step=0.000228, train/loss_step=0.0658, global_step=4132.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  68%|██████▊   | 826/1208 [23:28<10:51,  1.71s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.0658, train/loss_vlb_step=0.000228, train/loss_step=0.0658, global_step=4132.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  68%|██████▊   | 826/1208 [23:28<10:51,  1.71s/it, loss=0.069, v_num=0, train/loss_simple_step=0.0092, train/loss_vlb_step=4.37e-5, train/loss_step=0.0092, global_step=4132.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  68%|██████▊   | 827/1208 [23:29<10:49,  1.70s/it, loss=0.069, v_num=0, train/loss_simple_step=0.0092, train/loss_vlb_step=4.37e-5, train/loss_step=0.0092, global_step=4132.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  68%|██████▊   | 827/1208 [23:29<10:49,  1.70s/it, loss=0.0801, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000939, train/loss_step=0.236, global_step=4132.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  69%|██████▊   | 828/1208 [23:33<10:48,  1.71s/it, loss=0.0801, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000939, train/loss_step=0.236, global_step=4132.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  69%|██████▊   | 828/1208 [23:33<10:48,  1.71s/it, loss=0.0724, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000123, train/loss_step=0.0345, global_step=4132.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  69%|██████▊   | 829/1208 [23:34<10:46,  1.71s/it, loss=0.0724, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000123, train/loss_step=0.0345, global_step=4132.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  69%|██████▊   | 829/1208 [23:34<10:46,  1.71s/it, loss=0.0583, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.33e-5, train/loss_step=0.0152, global_step=4133.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  69%|██████▊   | 830/1208 [23:35<10:44,  1.71s/it, loss=0.0583, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.33e-5, train/loss_step=0.0152, global_step=4133.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  69%|██████▊   | 830/1208 [23:35<10:44,  1.71s/it, loss=0.0763, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00212, train/loss_step=0.363, global_step=4133.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  69%|██████▉   | 831/1208 [23:36<10:42,  1.70s/it, loss=0.0763, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00212, train/loss_step=0.363, global_step=4133.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  69%|██████▉   | 831/1208 [23:36<10:42,  1.70s/it, loss=0.0763, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=2.43e-5, train/loss_step=0.00452, global_step=4133.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  69%|██████▉   | 832/1208 [23:39<10:41,  1.71s/it, loss=0.0763, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=2.43e-5, train/loss_step=0.00452, global_step=4133.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  69%|██████▉   | 832/1208 [23:39<10:41,  1.71s/it, loss=0.0869, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00105, train/loss_step=0.239, global_step=4133.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  69%|██████▉   | 833/1208 [23:40<10:39,  1.71s/it, loss=0.0869, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00105, train/loss_step=0.239, global_step=4133.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  69%|██████▉   | 833/1208 [23:40<10:39,  1.71s/it, loss=0.0768, v_num=0, train/loss_simple_step=0.00986, train/loss_vlb_step=4.45e-5, train/loss_step=0.00986, global_step=4134.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  69%|██████▉   | 834/1208 [23:41<10:37,  1.70s/it, loss=0.0768, v_num=0, train/loss_simple_step=0.00986, train/loss_vlb_step=4.45e-5, train/loss_step=0.00986, global_step=4134.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  69%|██████▉   | 834/1208 [23:41<10:37,  1.70s/it, loss=0.0778, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=9.21e-5, train/loss_step=0.0215, global_step=4134.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  69%|██████▉   | 835/1208 [23:42<10:35,  1.70s/it, loss=0.0778, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=9.21e-5, train/loss_step=0.0215, global_step=4134.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  69%|██████▉   | 835/1208 [23:42<10:35,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.732, train/loss_vlb_step=0.0379, train/loss_step=0.732, global_step=4134.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  69%|██████▉   | 836/1208 [23:45<10:34,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.732, train/loss_vlb_step=0.0379, train/loss_step=0.732, global_step=4134.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  69%|██████▉   | 836/1208 [23:45<10:34,  1.71s/it, loss=0.111, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000337, train/loss_step=0.103, global_step=4134.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  69%|██████▉   | 837/1208 [23:46<10:32,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000337, train/loss_step=0.103, global_step=4134.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  69%|██████▉   | 837/1208 [23:46<10:32,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00548, train/loss_vlb_step=2.84e-5, train/loss_step=0.00548, global_step=4135.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  69%|██████▉   | 838/1208 [23:47<10:30,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00548, train/loss_vlb_step=2.84e-5, train/loss_step=0.00548, global_step=4135.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  69%|██████▉   | 838/1208 [23:47<10:30,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.534, train/loss_vlb_step=0.0068, train/loss_step=0.534, global_step=4135.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]     Epoch 13:  69%|██████▉   | 839/1208 [23:49<10:28,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.534, train/loss_vlb_step=0.0068, train/loss_step=0.534, global_step=4135.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  69%|██████▉   | 839/1208 [23:49<10:28,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000543, train/loss_step=0.165, global_step=4135.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  70%|██████▉   | 840/1208 [23:52<10:27,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000543, train/loss_step=0.165, global_step=4135.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  70%|██████▉   | 840/1208 [23:52<10:27,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000771, train/loss_step=0.212, global_step=4135.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  70%|██████▉   | 841/1208 [23:53<10:25,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000771, train/loss_step=0.212, global_step=4135.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  70%|██████▉   | 841/1208 [23:53<10:25,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0909, train/loss_vlb_step=0.0003, train/loss_step=0.0909, global_step=4136.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  70%|██████▉   | 842/1208 [23:54<10:23,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0909, train/loss_vlb_step=0.0003, train/loss_step=0.0909, global_step=4136.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  70%|██████▉   | 842/1208 [23:54<10:23,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0491, train/loss_vlb_step=0.000177, train/loss_step=0.0491, global_step=4136.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  70%|██████▉   | 843/1208 [23:55<10:21,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0491, train/loss_vlb_step=0.000177, train/loss_step=0.0491, global_step=4136.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  70%|██████▉   | 843/1208 [23:55<10:21,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000361, train/loss_step=0.109, global_step=4136.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  70%|██████▉   | 844/1208 [23:58<10:20,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000361, train/loss_step=0.109, global_step=4136.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  70%|██████▉   | 844/1208 [23:58<10:20,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00355, train/loss_vlb_step=1.98e-5, train/loss_step=0.00355, global_step=4136.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  70%|██████▉   | 845/1208 [23:59<10:18,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00355, train/loss_vlb_step=1.98e-5, train/loss_step=0.00355, global_step=4136.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  70%|██████▉   | 845/1208 [23:59<10:18,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.000133, train/loss_step=0.0362, global_step=4137.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  70%|███████   | 846/1208 [24:00<10:16,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.000133, train/loss_step=0.0362, global_step=4137.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  70%|███████   | 846/1208 [24:00<10:16,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000912, train/loss_step=0.242, global_step=4137.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  70%|███████   | 847/1208 [24:01<10:14,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000912, train/loss_step=0.242, global_step=4137.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  70%|███████   | 847/1208 [24:01<10:14,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000113, train/loss_step=0.0309, global_step=4137.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  70%|███████   | 848/1208 [24:05<10:13,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000113, train/loss_step=0.0309, global_step=4137.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  70%|███████   | 848/1208 [24:05<10:13,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.00064, train/loss_step=0.180, global_step=4137.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  70%|███████   | 849/1208 [24:06<10:11,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.00064, train/loss_step=0.180, global_step=4137.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  70%|███████   | 849/1208 [24:06<10:11,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=1.44e-5, train/loss_step=0.00245, global_step=4138.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  70%|███████   | 850/1208 [24:07<10:09,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=1.44e-5, train/loss_step=0.00245, global_step=4138.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  70%|███████   | 850/1208 [24:07<10:09,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000136, train/loss_step=0.0374, global_step=4138.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  70%|███████   | 851/1208 [24:08<10:07,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000136, train/loss_step=0.0374, global_step=4138.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  70%|███████   | 851/1208 [24:08<10:07,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0596, train/loss_vlb_step=0.000208, train/loss_step=0.0596, global_step=4138.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  71%|███████   | 852/1208 [24:11<10:06,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0596, train/loss_vlb_step=0.000208, train/loss_step=0.0596, global_step=4138.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  71%|███████   | 852/1208 [24:11<10:06,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000497, train/loss_step=0.148, global_step=4138.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  71%|███████   | 853/1208 [24:12<10:04,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000497, train/loss_step=0.148, global_step=4138.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  71%|███████   | 853/1208 [24:12<10:04,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000586, train/loss_step=0.168, global_step=4139.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  71%|███████   | 854/1208 [24:13<10:02,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000586, train/loss_step=0.168, global_step=4139.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  71%|███████   | 854/1208 [24:13<10:02,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0427, train/loss_vlb_step=0.000154, train/loss_step=0.0427, global_step=4139.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  71%|███████   | 855/1208 [24:14<10:00,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0427, train/loss_vlb_step=0.000154, train/loss_step=0.0427, global_step=4139.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  71%|███████   | 855/1208 [24:14<10:00,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000966, train/loss_step=0.235, global_step=4139.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  71%|███████   | 856/1208 [24:18<09:59,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000966, train/loss_step=0.235, global_step=4139.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  71%|███████   | 856/1208 [24:18<09:59,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.000153, train/loss_step=0.041, global_step=4139.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  71%|███████   | 857/1208 [24:19<09:57,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.000153, train/loss_step=0.041, global_step=4139.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  71%|███████   | 857/1208 [24:19<09:57,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.474, train/loss_vlb_step=0.00493, train/loss_step=0.474, global_step=4140.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  71%|███████   | 858/1208 [24:20<09:55,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.474, train/loss_vlb_step=0.00493, train/loss_step=0.474, global_step=4140.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  71%|███████   | 858/1208 [24:20<09:55,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.580, train/loss_vlb_step=0.009, train/loss_step=0.580, global_step=4140.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  71%|███████   | 859/1208 [24:21<09:53,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.580, train/loss_vlb_step=0.009, train/loss_step=0.580, global_step=4140.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  71%|███████   | 859/1208 [24:21<09:53,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00252, train/loss_vlb_step=1.41e-5, train/loss_step=0.00252, global_step=4140.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  71%|███████   | 860/1208 [24:24<09:52,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00252, train/loss_vlb_step=1.41e-5, train/loss_step=0.00252, global_step=4140.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  71%|███████   | 860/1208 [24:24<09:52,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000901, train/loss_step=0.238, global_step=4140.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  71%|███████▏  | 861/1208 [24:25<09:50,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000901, train/loss_step=0.238, global_step=4140.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  71%|███████▏  | 861/1208 [24:25<09:50,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.553, train/loss_vlb_step=0.00881, train/loss_step=0.553, global_step=4141.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  71%|███████▏  | 862/1208 [24:26<09:48,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.553, train/loss_vlb_step=0.00881, train/loss_step=0.553, global_step=4141.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  71%|███████▏  | 862/1208 [24:26<09:48,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0427, train/loss_vlb_step=0.000159, train/loss_step=0.0427, global_step=4141.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  71%|███████▏  | 863/1208 [24:27<09:46,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0427, train/loss_vlb_step=0.000159, train/loss_step=0.0427, global_step=4141.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  71%|███████▏  | 863/1208 [24:27<09:46,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00766, train/loss_vlb_step=3.79e-5, train/loss_step=0.00766, global_step=4141.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  72%|███████▏  | 864/1208 [24:30<09:45,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00766, train/loss_vlb_step=3.79e-5, train/loss_step=0.00766, global_step=4141.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  72%|███████▏  | 864/1208 [24:30<09:45,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00969, train/loss_vlb_step=4.53e-5, train/loss_step=0.00969, global_step=4141.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  72%|███████▏  | 865/1208 [24:31<09:43,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00969, train/loss_vlb_step=4.53e-5, train/loss_step=0.00969, global_step=4141.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  72%|███████▏  | 865/1208 [24:31<09:43,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.000135, train/loss_step=0.0352, global_step=4142.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  72%|███████▏  | 866/1208 [24:32<09:41,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.000135, train/loss_step=0.0352, global_step=4142.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  72%|███████▏  | 866/1208 [24:32<09:41,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.89e-5, train/loss_step=0.0155, global_step=4142.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  72%|███████▏  | 867/1208 [24:33<09:39,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.89e-5, train/loss_step=0.0155, global_step=4142.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  72%|███████▏  | 867/1208 [24:33<09:39,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00781, train/loss_vlb_step=3.87e-5, train/loss_step=0.00781, global_step=4142.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  72%|███████▏  | 868/1208 [24:37<09:38,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00781, train/loss_vlb_step=3.87e-5, train/loss_step=0.00781, global_step=4142.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  72%|███████▏  | 868/1208 [24:37<09:38,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.507, train/loss_vlb_step=0.00535, train/loss_step=0.507, global_step=4142.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]     Epoch 13:  72%|███████▏  | 869/1208 [24:38<09:36,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.507, train/loss_vlb_step=0.00535, train/loss_step=0.507, global_step=4142.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  72%|███████▏  | 869/1208 [24:38<09:36,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000688, train/loss_step=0.200, global_step=4143.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  72%|███████▏  | 870/1208 [24:39<09:34,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000688, train/loss_step=0.200, global_step=4143.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  72%|███████▏  | 870/1208 [24:39<09:34,  1.70s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.65e-5, train/loss_step=0.0209, global_step=4143.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  72%|███████▏  | 871/1208 [24:40<09:32,  1.70s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.65e-5, train/loss_step=0.0209, global_step=4143.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  72%|███████▏  | 871/1208 [24:40<09:32,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00838, train/loss_vlb_step=4.05e-5, train/loss_step=0.00838, global_step=4143.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  72%|███████▏  | 872/1208 [24:43<09:31,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00838, train/loss_vlb_step=4.05e-5, train/loss_step=0.00838, global_step=4143.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  72%|███████▏  | 872/1208 [24:43<09:31,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000148, train/loss_step=0.0415, global_step=4143.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  72%|███████▏  | 873/1208 [24:44<09:29,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000148, train/loss_step=0.0415, global_step=4143.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  72%|███████▏  | 873/1208 [24:44<09:29,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00428, train/loss_step=0.393, global_step=4144.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  72%|███████▏  | 874/1208 [24:45<09:27,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00428, train/loss_step=0.393, global_step=4144.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  72%|███████▏  | 874/1208 [24:45<09:27,  1.70s/it, loss=0.183, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000916, train/loss_step=0.239, global_step=4144.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  72%|███████▏  | 875/1208 [24:46<09:25,  1.70s/it, loss=0.183, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000916, train/loss_step=0.239, global_step=4144.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  72%|███████▏  | 875/1208 [24:46<09:25,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000669, train/loss_step=0.193, global_step=4144.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  73%|███████▎  | 876/1208 [24:50<09:24,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000669, train/loss_step=0.193, global_step=4144.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  73%|███████▎  | 876/1208 [24:50<09:24,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.00046, train/loss_step=0.139, global_step=4144.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  73%|███████▎  | 877/1208 [24:51<09:22,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.00046, train/loss_step=0.139, global_step=4144.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  73%|███████▎  | 877/1208 [24:51<09:22,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00914, train/loss_vlb_step=4.34e-5, train/loss_step=0.00914, global_step=4145.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  73%|███████▎  | 878/1208 [24:52<09:20,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00914, train/loss_vlb_step=4.34e-5, train/loss_step=0.00914, global_step=4145.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  73%|███████▎  | 878/1208 [24:52<09:20,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0882, train/loss_vlb_step=0.000291, train/loss_step=0.0882, global_step=4145.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  73%|███████▎  | 879/1208 [24:53<09:18,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0882, train/loss_vlb_step=0.000291, train/loss_step=0.0882, global_step=4145.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  73%|███████▎  | 879/1208 [24:53<09:18,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00248, train/loss_step=0.394, global_step=4145.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  73%|███████▎  | 880/1208 [24:56<09:17,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00248, train/loss_step=0.394, global_step=4145.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  73%|███████▎  | 880/1208 [24:56<09:17,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00946, train/loss_vlb_step=4.42e-5, train/loss_step=0.00946, global_step=4145.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  73%|███████▎  | 881/1208 [24:57<09:15,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00946, train/loss_vlb_step=4.42e-5, train/loss_step=0.00946, global_step=4145.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  73%|███████▎  | 881/1208 [24:57<09:15,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.028, train/loss_vlb_step=0.000104, train/loss_step=0.028, global_step=4146.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  73%|███████▎  | 882/1208 [24:58<09:13,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.028, train/loss_vlb_step=0.000104, train/loss_step=0.028, global_step=4146.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  73%|███████▎  | 882/1208 [24:58<09:13,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.459, train/loss_vlb_step=0.00464, train/loss_step=0.459, global_step=4146.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  73%|███████▎  | 883/1208 [24:59<09:11,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.459, train/loss_vlb_step=0.00464, train/loss_step=0.459, global_step=4146.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  73%|███████▎  | 883/1208 [24:59<09:11,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0698, train/loss_vlb_step=0.000238, train/loss_step=0.0698, global_step=4146.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  73%|███████▎  | 884/1208 [25:02<09:10,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0698, train/loss_vlb_step=0.000238, train/loss_step=0.0698, global_step=4146.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  73%|███████▎  | 884/1208 [25:02<09:10,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.000188, train/loss_step=0.0521, global_step=4146.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  73%|███████▎  | 885/1208 [25:03<09:08,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.000188, train/loss_step=0.0521, global_step=4146.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  73%|███████▎  | 885/1208 [25:03<09:08,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0951, train/loss_vlb_step=0.000313, train/loss_step=0.0951, global_step=4147.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  73%|███████▎  | 886/1208 [25:04<09:06,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0951, train/loss_vlb_step=0.000313, train/loss_step=0.0951, global_step=4147.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  73%|███████▎  | 886/1208 [25:04<09:06,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000731, train/loss_step=0.189, global_step=4147.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  73%|███████▎  | 887/1208 [25:05<09:04,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000731, train/loss_step=0.189, global_step=4147.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  73%|███████▎  | 887/1208 [25:05<09:04,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000911, train/loss_step=0.232, global_step=4147.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  74%|███████▎  | 888/1208 [25:09<09:03,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000911, train/loss_step=0.232, global_step=4147.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  74%|███████▎  | 888/1208 [25:09<09:03,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000822, train/loss_step=0.226, global_step=4147.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  74%|███████▎  | 889/1208 [25:10<09:01,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000822, train/loss_step=0.226, global_step=4147.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  74%|███████▎  | 889/1208 [25:10<09:01,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000588, train/loss_step=0.169, global_step=4148.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  74%|███████▎  | 890/1208 [25:11<08:59,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000588, train/loss_step=0.169, global_step=4148.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  74%|███████▎  | 890/1208 [25:11<08:59,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=2.42e-5, train/loss_step=0.0046, global_step=4148.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  74%|███████▍  | 891/1208 [25:12<08:58,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=2.42e-5, train/loss_step=0.0046, global_step=4148.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  74%|███████▍  | 891/1208 [25:12<08:58,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.18e-5, train/loss_step=0.0139, global_step=4148.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  74%|███████▍  | 892/1208 [25:15<08:56,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.18e-5, train/loss_step=0.0139, global_step=4148.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  74%|███████▍  | 892/1208 [25:15<08:56,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.00074, train/loss_step=0.208, global_step=4148.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  74%|███████▍  | 893/1208 [25:16<08:54,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.00074, train/loss_step=0.208, global_step=4148.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  74%|███████▍  | 893/1208 [25:16<08:54,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00604, train/loss_vlb_step=3.02e-5, train/loss_step=0.00604, global_step=4149.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  74%|███████▍  | 894/1208 [25:17<08:53,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00604, train/loss_vlb_step=3.02e-5, train/loss_step=0.00604, global_step=4149.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  74%|███████▍  | 894/1208 [25:17<08:53,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00225, train/loss_step=0.349, global_step=4149.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  74%|███████▍  | 895/1208 [25:18<08:51,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00225, train/loss_step=0.349, global_step=4149.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  74%|███████▍  | 895/1208 [25:18<08:51,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.815, train/loss_vlb_step=0.138, train/loss_step=0.815, global_step=4149.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  74%|███████▍  | 896/1208 [25:21<08:49,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.815, train/loss_vlb_step=0.138, train/loss_step=0.815, global_step=4149.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  74%|███████▍  | 896/1208 [25:21<08:49,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000133, train/loss_step=0.0349, global_step=4149.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  74%|███████▍  | 897/1208 [25:22<08:48,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000133, train/loss_step=0.0349, global_step=4149.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  74%|███████▍  | 897/1208 [25:23<08:48,  1.70s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0546, train/loss_vlb_step=0.000184, train/loss_step=0.0546, global_step=4150.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  74%|███████▍  | 898/1208 [25:24<08:46,  1.70s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0546, train/loss_vlb_step=0.000184, train/loss_step=0.0546, global_step=4150.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  74%|███████▍  | 898/1208 [25:24<08:46,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.56e-5, train/loss_step=0.00282, global_step=4150.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  74%|███████▍  | 899/1208 [25:25<08:44,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.56e-5, train/loss_step=0.00282, global_step=4150.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  74%|███████▍  | 899/1208 [25:25<08:44,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.26e-5, train/loss_step=0.024, global_step=4150.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  75%|███████▍  | 900/1208 [25:28<08:43,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.26e-5, train/loss_step=0.024, global_step=4150.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  75%|███████▍  | 900/1208 [25:28<08:43,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.504, train/loss_vlb_step=0.00524, train/loss_step=0.504, global_step=4150.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.75it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.74it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.73it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.75it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.76it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.76it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.76it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.75it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 13:  75%|███████▍  | 901/1208 [25:58<08:51,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.504, train/loss_vlb_step=0.00524, train/loss_step=0.504, global_step=4150.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  75%|███████▍  | 901/1208 [25:58<08:51,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00135, train/loss_step=0.266, global_step=4151.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  75%|███████▍  | 902/1208 [26:00<08:49,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00135, train/loss_step=0.266, global_step=4151.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  75%|███████▍  | 902/1208 [26:00<08:49,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0397, train/loss_vlb_step=0.000146, train/loss_step=0.0397, global_step=4151.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  75%|███████▍  | 903/1208 [26:01<08:47,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0397, train/loss_vlb_step=0.000146, train/loss_step=0.0397, global_step=4151.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  75%|███████▍  | 903/1208 [26:01<08:47,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.00081, train/loss_step=0.211, global_step=4151.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  75%|███████▍  | 904/1208 [26:04<08:46,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.00081, train/loss_step=0.211, global_step=4151.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  75%|███████▍  | 904/1208 [26:04<08:46,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000106, train/loss_step=0.0266, global_step=4151.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  75%|███████▍  | 905/1208 [26:05<08:44,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000106, train/loss_step=0.0266, global_step=4151.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  75%|███████▍  | 905/1208 [26:05<08:44,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.7e-5, train/loss_step=0.012, global_step=4152.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  75%|███████▌  | 906/1208 [26:06<08:42,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.7e-5, train/loss_step=0.012, global_step=4152.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  75%|███████▌  | 906/1208 [26:06<08:42,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000559, train/loss_step=0.162, global_step=4152.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  75%|███████▌  | 907/1208 [26:07<08:40,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000559, train/loss_step=0.162, global_step=4152.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  75%|███████▌  | 907/1208 [26:07<08:40,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00556, train/loss_vlb_step=2.77e-5, train/loss_step=0.00556, global_step=4152.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  75%|███████▌  | 908/1208 [26:10<08:38,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00556, train/loss_vlb_step=2.77e-5, train/loss_step=0.00556, global_step=4152.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  75%|███████▌  | 908/1208 [26:10<08:38,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.97e-5, train/loss_step=0.0108, global_step=4152.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  75%|███████▌  | 909/1208 [26:11<08:36,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.97e-5, train/loss_step=0.0108, global_step=4152.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  75%|███████▌  | 909/1208 [26:11<08:36,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000182, train/loss_step=0.0484, global_step=4153.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  75%|███████▌  | 910/1208 [26:12<08:35,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000182, train/loss_step=0.0484, global_step=4153.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  75%|███████▌  | 910/1208 [26:12<08:35,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.06e-5, train/loss_step=0.00173, global_step=4153.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  75%|███████▌  | 911/1208 [26:13<08:33,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.06e-5, train/loss_step=0.00173, global_step=4153.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  75%|███████▌  | 911/1208 [26:13<08:33,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000822, train/loss_step=0.215, global_step=4153.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  75%|███████▌  | 912/1208 [26:17<08:31,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000822, train/loss_step=0.215, global_step=4153.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  75%|███████▌  | 912/1208 [26:17<08:31,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.34e-5, train/loss_step=0.0231, global_step=4153.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  76%|███████▌  | 913/1208 [26:18<08:29,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.34e-5, train/loss_step=0.0231, global_step=4153.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  76%|███████▌  | 913/1208 [26:18<08:29,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=4154.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  76%|███████▌  | 914/1208 [26:19<08:27,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=4154.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  76%|███████▌  | 914/1208 [26:19<08:27,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=1.61e-5, train/loss_step=0.0031, global_step=4154.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  76%|███████▌  | 915/1208 [26:20<08:26,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=1.61e-5, train/loss_step=0.0031, global_step=4154.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  76%|███████▌  | 915/1208 [26:20<08:26,  1.73s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=1.67e-5, train/loss_step=0.00298, global_step=4154.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  76%|███████▌  | 916/1208 [26:23<08:24,  1.73s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=1.67e-5, train/loss_step=0.00298, global_step=4154.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  76%|███████▌  | 916/1208 [26:23<08:24,  1.73s/it, loss=0.0874, v_num=0, train/loss_simple_step=0.0294, train/loss_vlb_step=0.000113, train/loss_step=0.0294, global_step=4154.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  76%|███████▌  | 917/1208 [26:24<08:22,  1.73s/it, loss=0.0874, v_num=0, train/loss_simple_step=0.0294, train/loss_vlb_step=0.000113, train/loss_step=0.0294, global_step=4154.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  76%|███████▌  | 917/1208 [26:24<08:22,  1.73s/it, loss=0.0849, v_num=0, train/loss_simple_step=0.00424, train/loss_vlb_step=2.29e-5, train/loss_step=0.00424, global_step=4155.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  76%|███████▌  | 918/1208 [26:25<08:20,  1.73s/it, loss=0.0849, v_num=0, train/loss_simple_step=0.00424, train/loss_vlb_step=2.29e-5, train/loss_step=0.00424, global_step=4155.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  76%|███████▌  | 918/1208 [26:25<08:20,  1.73s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.0593, train/loss_vlb_step=0.000199, train/loss_step=0.0593, global_step=4155.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  76%|███████▌  | 919/1208 [26:26<08:18,  1.73s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.0593, train/loss_vlb_step=0.000199, train/loss_step=0.0593, global_step=4155.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  76%|███████▌  | 919/1208 [26:26<08:18,  1.73s/it, loss=0.0911, v_num=0, train/loss_simple_step=0.0916, train/loss_vlb_step=0.000304, train/loss_step=0.0916, global_step=4155.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  76%|███████▌  | 920/1208 [26:29<08:17,  1.73s/it, loss=0.0911, v_num=0, train/loss_simple_step=0.0916, train/loss_vlb_step=0.000304, train/loss_step=0.0916, global_step=4155.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  76%|███████▌  | 920/1208 [26:29<08:17,  1.73s/it, loss=0.0694, v_num=0, train/loss_simple_step=0.0714, train/loss_vlb_step=0.000239, train/loss_step=0.0714, global_step=4155.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  76%|███████▌  | 921/1208 [26:30<08:15,  1.73s/it, loss=0.0694, v_num=0, train/loss_simple_step=0.0714, train/loss_vlb_step=0.000239, train/loss_step=0.0714, global_step=4155.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  76%|███████▌  | 921/1208 [26:30<08:15,  1.73s/it, loss=0.0563, v_num=0, train/loss_simple_step=0.0039, train/loss_vlb_step=2.21e-5, train/loss_step=0.0039, global_step=4156.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  76%|███████▋  | 922/1208 [26:31<08:13,  1.73s/it, loss=0.0563, v_num=0, train/loss_simple_step=0.0039, train/loss_vlb_step=2.21e-5, train/loss_step=0.0039, global_step=4156.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  76%|███████▋  | 922/1208 [26:31<08:13,  1.73s/it, loss=0.0553, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.5e-5, train/loss_step=0.0198, global_step=4156.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  76%|███████▋  | 923/1208 [26:33<08:11,  1.73s/it, loss=0.0553, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.5e-5, train/loss_step=0.0198, global_step=4156.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  76%|███████▋  | 923/1208 [26:33<08:11,  1.73s/it, loss=0.0702, v_num=0, train/loss_simple_step=0.508, train/loss_vlb_step=0.00612, train/loss_step=0.508, global_step=4156.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  76%|███████▋  | 924/1208 [26:36<08:10,  1.73s/it, loss=0.0702, v_num=0, train/loss_simple_step=0.508, train/loss_vlb_step=0.00612, train/loss_step=0.508, global_step=4156.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  76%|███████▋  | 924/1208 [26:36<08:10,  1.73s/it, loss=0.071, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000162, train/loss_step=0.0443, global_step=4156.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  77%|███████▋  | 925/1208 [26:37<08:08,  1.73s/it, loss=0.071, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000162, train/loss_step=0.0443, global_step=4156.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  77%|███████▋  | 925/1208 [26:37<08:08,  1.73s/it, loss=0.0777, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000497, train/loss_step=0.145, global_step=4157.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  77%|███████▋  | 926/1208 [26:38<08:06,  1.73s/it, loss=0.0777, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000497, train/loss_step=0.145, global_step=4157.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  77%|███████▋  | 926/1208 [26:38<08:06,  1.73s/it, loss=0.0735, v_num=0, train/loss_simple_step=0.0774, train/loss_vlb_step=0.000263, train/loss_step=0.0774, global_step=4157.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  77%|███████▋  | 927/1208 [26:39<08:04,  1.73s/it, loss=0.0735, v_num=0, train/loss_simple_step=0.0774, train/loss_vlb_step=0.000263, train/loss_step=0.0774, global_step=4157.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  77%|███████▋  | 927/1208 [26:39<08:04,  1.73s/it, loss=0.0739, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.33e-5, train/loss_step=0.0149, global_step=4157.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  77%|███████▋  | 928/1208 [26:42<08:03,  1.73s/it, loss=0.0739, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.33e-5, train/loss_step=0.0149, global_step=4157.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  77%|███████▋  | 928/1208 [26:42<08:03,  1.73s/it, loss=0.0855, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000962, train/loss_step=0.242, global_step=4157.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  77%|███████▋  | 929/1208 [26:43<08:01,  1.73s/it, loss=0.0855, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000962, train/loss_step=0.242, global_step=4157.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  77%|███████▋  | 929/1208 [26:43<08:01,  1.73s/it, loss=0.0832, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.75e-5, train/loss_step=0.00312, global_step=4158.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  77%|███████▋  | 930/1208 [26:44<07:59,  1.73s/it, loss=0.0832, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.75e-5, train/loss_step=0.00312, global_step=4158.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  77%|███████▋  | 930/1208 [26:44<07:59,  1.73s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000518, train/loss_step=0.154, global_step=4158.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  77%|███████▋  | 931/1208 [26:45<07:57,  1.72s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000518, train/loss_step=0.154, global_step=4158.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  77%|███████▋  | 931/1208 [26:45<07:57,  1.72s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00113, train/loss_step=0.260, global_step=4158.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  77%|███████▋  | 932/1208 [26:49<07:56,  1.73s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00113, train/loss_step=0.260, global_step=4158.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  77%|███████▋  | 932/1208 [26:49<07:56,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00126, train/loss_step=0.285, global_step=4158.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  77%|███████▋  | 933/1208 [26:50<07:54,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00126, train/loss_step=0.285, global_step=4158.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  77%|███████▋  | 933/1208 [26:50<07:54,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0966, train/loss_vlb_step=0.000318, train/loss_step=0.0966, global_step=4159.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  77%|███████▋  | 934/1208 [26:51<07:52,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0966, train/loss_vlb_step=0.000318, train/loss_step=0.0966, global_step=4159.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  77%|███████▋  | 934/1208 [26:51<07:52,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00396, train/loss_vlb_step=2.28e-5, train/loss_step=0.00396, global_step=4159.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  77%|███████▋  | 935/1208 [26:52<07:50,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00396, train/loss_vlb_step=2.28e-5, train/loss_step=0.00396, global_step=4159.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  77%|███████▋  | 935/1208 [26:52<07:50,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=4159.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  77%|███████▋  | 936/1208 [26:55<07:49,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=4159.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  77%|███████▋  | 936/1208 [26:55<07:49,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00135, train/loss_step=0.289, global_step=4159.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  78%|███████▊  | 937/1208 [26:56<07:47,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00135, train/loss_step=0.289, global_step=4159.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  78%|███████▊  | 937/1208 [26:56<07:47,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000555, train/loss_step=0.167, global_step=4160.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  78%|███████▊  | 938/1208 [26:57<07:45,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000555, train/loss_step=0.167, global_step=4160.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  78%|███████▊  | 938/1208 [26:57<07:45,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0436, train/loss_vlb_step=0.000158, train/loss_step=0.0436, global_step=4160.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  78%|███████▊  | 939/1208 [26:58<07:43,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0436, train/loss_vlb_step=0.000158, train/loss_step=0.0436, global_step=4160.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  78%|███████▊  | 939/1208 [26:58<07:43,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000108, train/loss_step=0.0268, global_step=4160.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  78%|███████▊  | 940/1208 [27:01<07:42,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000108, train/loss_step=0.0268, global_step=4160.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  78%|███████▊  | 940/1208 [27:01<07:42,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=9.4e-6, train/loss_step=0.00156, global_step=4160.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  78%|███████▊  | 941/1208 [27:02<07:40,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=9.4e-6, train/loss_step=0.00156, global_step=4160.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  78%|███████▊  | 941/1208 [27:02<07:40,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00118, train/loss_step=0.247, global_step=4161.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  78%|███████▊  | 942/1208 [27:03<07:38,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00118, train/loss_step=0.247, global_step=4161.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  78%|███████▊  | 942/1208 [27:03<07:38,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00823, train/loss_vlb_step=3.92e-5, train/loss_step=0.00823, global_step=4161.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  78%|███████▊  | 943/1208 [27:05<07:36,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00823, train/loss_vlb_step=3.92e-5, train/loss_step=0.00823, global_step=4161.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  78%|███████▊  | 943/1208 [27:05<07:36,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.77e-5, train/loss_step=0.0101, global_step=4161.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  78%|███████▊  | 944/1208 [27:08<07:35,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.77e-5, train/loss_step=0.0101, global_step=4161.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  78%|███████▊  | 944/1208 [27:08<07:35,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000481, train/loss_step=0.145, global_step=4161.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  78%|███████▊  | 945/1208 [27:09<07:33,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000481, train/loss_step=0.145, global_step=4161.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  78%|███████▊  | 945/1208 [27:09<07:33,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.570, train/loss_vlb_step=0.0119, train/loss_step=0.570, global_step=4162.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  78%|███████▊  | 946/1208 [27:10<07:31,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.570, train/loss_vlb_step=0.0119, train/loss_step=0.570, global_step=4162.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  78%|███████▊  | 946/1208 [27:10<07:31,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.45e-5, train/loss_step=0.00255, global_step=4162.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  78%|███████▊  | 947/1208 [27:11<07:29,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.45e-5, train/loss_step=0.00255, global_step=4162.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  78%|███████▊  | 947/1208 [27:11<07:29,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000171, train/loss_step=0.0454, global_step=4162.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  78%|███████▊  | 948/1208 [27:14<07:28,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000171, train/loss_step=0.0454, global_step=4162.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  78%|███████▊  | 948/1208 [27:14<07:28,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000729, train/loss_step=0.208, global_step=4162.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  79%|███████▊  | 949/1208 [27:15<07:26,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000729, train/loss_step=0.208, global_step=4162.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  79%|███████▊  | 949/1208 [27:15<07:26,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00153, train/loss_step=0.287, global_step=4163.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  79%|███████▊  | 950/1208 [27:16<07:24,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00153, train/loss_step=0.287, global_step=4163.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  79%|███████▊  | 950/1208 [27:16<07:24,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000499, train/loss_step=0.150, global_step=4163.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  79%|███████▊  | 951/1208 [27:17<07:22,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000499, train/loss_step=0.150, global_step=4163.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  79%|███████▊  | 951/1208 [27:17<07:22,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00268, train/loss_step=0.373, global_step=4163.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  79%|███████▉  | 952/1208 [27:21<07:21,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00268, train/loss_step=0.373, global_step=4163.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  79%|███████▉  | 952/1208 [27:21<07:21,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.68e-5, train/loss_step=0.003, global_step=4163.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  79%|███████▉  | 953/1208 [27:22<07:19,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.68e-5, train/loss_step=0.003, global_step=4163.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  79%|███████▉  | 953/1208 [27:22<07:19,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.17e-5, train/loss_step=0.0228, global_step=4164.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  79%|███████▉  | 954/1208 [27:23<07:17,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.17e-5, train/loss_step=0.0228, global_step=4164.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  79%|███████▉  | 954/1208 [27:23<07:17,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000716, train/loss_step=0.198, global_step=4164.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  79%|███████▉  | 955/1208 [27:24<07:15,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000716, train/loss_step=0.198, global_step=4164.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  79%|███████▉  | 955/1208 [27:24<07:15,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0723, train/loss_vlb_step=0.000248, train/loss_step=0.0723, global_step=4164.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  79%|███████▉  | 956/1208 [27:27<07:14,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0723, train/loss_vlb_step=0.000248, train/loss_step=0.0723, global_step=4164.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  79%|███████▉  | 956/1208 [27:27<07:14,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0539, train/loss_vlb_step=0.000189, train/loss_step=0.0539, global_step=4164.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  79%|███████▉  | 957/1208 [27:28<07:12,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0539, train/loss_vlb_step=0.000189, train/loss_step=0.0539, global_step=4164.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  79%|███████▉  | 957/1208 [27:28<07:12,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00692, train/loss_vlb_step=3.44e-5, train/loss_step=0.00692, global_step=4165.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  79%|███████▉  | 958/1208 [27:29<07:10,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00692, train/loss_vlb_step=3.44e-5, train/loss_step=0.00692, global_step=4165.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  79%|███████▉  | 958/1208 [27:29<07:10,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.11e-5, train/loss_step=0.0144, global_step=4165.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  79%|███████▉  | 959/1208 [27:30<07:08,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.11e-5, train/loss_step=0.0144, global_step=4165.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  79%|███████▉  | 959/1208 [27:30<07:08,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=9.84e-5, train/loss_step=0.0249, global_step=4165.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  79%|███████▉  | 960/1208 [27:33<07:07,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=9.84e-5, train/loss_step=0.0249, global_step=4165.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  79%|███████▉  | 960/1208 [27:33<07:07,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.36e-5, train/loss_step=0.0231, global_step=4165.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  80%|███████▉  | 961/1208 [27:35<07:05,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.36e-5, train/loss_step=0.0231, global_step=4165.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  80%|███████▉  | 961/1208 [27:35<07:05,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000168, train/loss_step=0.0457, global_step=4166.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  80%|███████▉  | 962/1208 [27:36<07:03,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000168, train/loss_step=0.0457, global_step=4166.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  80%|███████▉  | 962/1208 [27:36<07:03,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=4166.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  80%|███████▉  | 963/1208 [27:37<07:01,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=4166.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  80%|███████▉  | 963/1208 [27:37<07:01,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000471, train/loss_step=0.142, global_step=4166.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  80%|███████▉  | 964/1208 [27:40<07:00,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000471, train/loss_step=0.142, global_step=4166.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  80%|███████▉  | 964/1208 [27:40<07:00,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000388, train/loss_step=0.118, global_step=4166.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  80%|███████▉  | 965/1208 [27:41<06:58,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000388, train/loss_step=0.118, global_step=4166.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  80%|███████▉  | 965/1208 [27:41<06:58,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000566, train/loss_step=0.166, global_step=4167.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  80%|███████▉  | 966/1208 [27:42<06:56,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000566, train/loss_step=0.166, global_step=4167.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  80%|███████▉  | 966/1208 [27:42<06:56,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.07e-5, train/loss_step=0.0114, global_step=4167.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  80%|████████  | 967/1208 [27:43<06:54,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.07e-5, train/loss_step=0.0114, global_step=4167.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  80%|████████  | 967/1208 [27:43<06:54,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=7.08e-5, train/loss_step=0.0164, global_step=4167.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  80%|████████  | 968/1208 [27:46<06:53,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=7.08e-5, train/loss_step=0.0164, global_step=4167.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  80%|████████  | 968/1208 [27:46<06:53,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000572, train/loss_step=0.167, global_step=4167.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  80%|████████  | 969/1208 [27:47<06:51,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000572, train/loss_step=0.167, global_step=4167.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  80%|████████  | 969/1208 [27:47<06:51,  1.72s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.00781, train/loss_vlb_step=3.74e-5, train/loss_step=0.00781, global_step=4168.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  80%|████████  | 970/1208 [27:48<06:49,  1.72s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.00781, train/loss_vlb_step=3.74e-5, train/loss_step=0.00781, global_step=4168.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  80%|████████  | 970/1208 [27:48<06:49,  1.72s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000534, train/loss_step=0.159, global_step=4168.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  80%|████████  | 971/1208 [27:49<06:47,  1.72s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000534, train/loss_step=0.159, global_step=4168.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  80%|████████  | 971/1208 [27:49<06:47,  1.72s/it, loss=0.0754, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000507, train/loss_step=0.151, global_step=4168.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  80%|████████  | 972/1208 [27:53<06:46,  1.72s/it, loss=0.0754, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000507, train/loss_step=0.151, global_step=4168.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  80%|████████  | 972/1208 [27:53<06:46,  1.72s/it, loss=0.0779, v_num=0, train/loss_simple_step=0.0528, train/loss_vlb_step=0.000185, train/loss_step=0.0528, global_step=4168.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  81%|████████  | 973/1208 [27:54<06:44,  1.72s/it, loss=0.0779, v_num=0, train/loss_simple_step=0.0528, train/loss_vlb_step=0.000185, train/loss_step=0.0528, global_step=4168.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  81%|████████  | 973/1208 [27:54<06:44,  1.72s/it, loss=0.0774, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.29e-5, train/loss_step=0.0122, global_step=4169.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  81%|████████  | 974/1208 [27:55<06:42,  1.72s/it, loss=0.0774, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.29e-5, train/loss_step=0.0122, global_step=4169.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  81%|████████  | 974/1208 [27:55<06:42,  1.72s/it, loss=0.0707, v_num=0, train/loss_simple_step=0.0637, train/loss_vlb_step=0.000214, train/loss_step=0.0637, global_step=4169.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  81%|████████  | 975/1208 [27:56<06:40,  1.72s/it, loss=0.0707, v_num=0, train/loss_simple_step=0.0637, train/loss_vlb_step=0.000214, train/loss_step=0.0637, global_step=4169.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  81%|████████  | 975/1208 [27:56<06:40,  1.72s/it, loss=0.079, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.00101, train/loss_step=0.238, global_step=4169.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  81%|████████  | 976/1208 [27:59<06:39,  1.72s/it, loss=0.079, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.00101, train/loss_step=0.238, global_step=4169.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  81%|████████  | 976/1208 [27:59<06:39,  1.72s/it, loss=0.0765, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=2.43e-5, train/loss_step=0.00452, global_step=4169.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  81%|████████  | 977/1208 [28:00<06:37,  1.72s/it, loss=0.0765, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=2.43e-5, train/loss_step=0.00452, global_step=4169.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  81%|████████  | 977/1208 [28:00<06:37,  1.72s/it, loss=0.0771, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.57e-5, train/loss_step=0.0187, global_step=4170.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  81%|████████  | 978/1208 [28:01<06:35,  1.72s/it, loss=0.0771, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.57e-5, train/loss_step=0.0187, global_step=4170.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  81%|████████  | 978/1208 [28:01<06:35,  1.72s/it, loss=0.0764, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=9.1e-6, train/loss_step=0.00152, global_step=4170.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  81%|████████  | 979/1208 [28:02<06:33,  1.72s/it, loss=0.0764, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=9.1e-6, train/loss_step=0.00152, global_step=4170.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  81%|████████  | 979/1208 [28:02<06:33,  1.72s/it, loss=0.0757, v_num=0, train/loss_simple_step=0.00982, train/loss_vlb_step=4.73e-5, train/loss_step=0.00982, global_step=4170.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  81%|████████  | 980/1208 [28:05<06:32,  1.72s/it, loss=0.0757, v_num=0, train/loss_simple_step=0.00982, train/loss_vlb_step=4.73e-5, train/loss_step=0.00982, global_step=4170.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  81%|████████  | 980/1208 [28:05<06:32,  1.72s/it, loss=0.0748, v_num=0, train/loss_simple_step=0.0047, train/loss_vlb_step=2.44e-5, train/loss_step=0.0047, global_step=4170.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  81%|████████  | 981/1208 [28:07<06:30,  1.72s/it, loss=0.0748, v_num=0, train/loss_simple_step=0.0047, train/loss_vlb_step=2.44e-5, train/loss_step=0.0047, global_step=4170.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  81%|████████  | 981/1208 [28:07<06:30,  1.72s/it, loss=0.0728, v_num=0, train/loss_simple_step=0.0058, train/loss_vlb_step=2.91e-5, train/loss_step=0.0058, global_step=4171.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  81%|████████▏ | 982/1208 [28:08<06:28,  1.72s/it, loss=0.0728, v_num=0, train/loss_simple_step=0.0058, train/loss_vlb_step=2.91e-5, train/loss_step=0.0058, global_step=4171.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  81%|████████▏ | 982/1208 [28:08<06:28,  1.72s/it, loss=0.0816, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00143, train/loss_step=0.281, global_step=4171.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  81%|████████▏ | 983/1208 [28:09<06:26,  1.72s/it, loss=0.0816, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00143, train/loss_step=0.281, global_step=4171.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  81%|████████▏ | 983/1208 [28:09<06:26,  1.72s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000875, train/loss_step=0.233, global_step=4171.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  81%|████████▏ | 984/1208 [28:12<06:25,  1.72s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000875, train/loss_step=0.233, global_step=4171.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  81%|████████▏ | 984/1208 [28:12<06:25,  1.72s/it, loss=0.0839, v_num=0, train/loss_simple_step=0.0727, train/loss_vlb_step=0.000243, train/loss_step=0.0727, global_step=4171.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  82%|████████▏ | 985/1208 [28:13<06:23,  1.72s/it, loss=0.0839, v_num=0, train/loss_simple_step=0.0727, train/loss_vlb_step=0.000243, train/loss_step=0.0727, global_step=4171.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  82%|████████▏ | 985/1208 [28:13<06:23,  1.72s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000633, train/loss_step=0.184, global_step=4172.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  82%|████████▏ | 986/1208 [28:14<06:21,  1.72s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000633, train/loss_step=0.184, global_step=4172.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  82%|████████▏ | 986/1208 [28:14<06:21,  1.72s/it, loss=0.097, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00114, train/loss_step=0.256, global_step=4172.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  82%|████████▏ | 987/1208 [28:15<06:19,  1.72s/it, loss=0.097, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00114, train/loss_step=0.256, global_step=4172.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  82%|████████▏ | 987/1208 [28:15<06:19,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00367, train/loss_step=0.433, global_step=4172.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  82%|████████▏ | 988/1208 [28:18<06:18,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00367, train/loss_step=0.433, global_step=4172.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  82%|████████▏ | 988/1208 [28:18<06:18,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=1.22e-5, train/loss_step=0.00206, global_step=4172.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  82%|████████▏ | 989/1208 [28:19<06:16,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=1.22e-5, train/loss_step=0.00206, global_step=4172.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  82%|████████▏ | 989/1208 [28:19<06:16,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000125, train/loss_step=0.0335, global_step=4173.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  82%|████████▏ | 990/1208 [28:20<06:14,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000125, train/loss_step=0.0335, global_step=4173.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  82%|████████▏ | 990/1208 [28:20<06:14,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0391, train/loss_vlb_step=0.000144, train/loss_step=0.0391, global_step=4173.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  82%|████████▏ | 991/1208 [28:21<06:12,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0391, train/loss_vlb_step=0.000144, train/loss_step=0.0391, global_step=4173.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  82%|████████▏ | 991/1208 [28:21<06:12,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000897, train/loss_step=0.224, global_step=4173.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  82%|████████▏ | 992/1208 [28:25<06:11,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000897, train/loss_step=0.224, global_step=4173.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  82%|████████▏ | 992/1208 [28:25<06:11,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00154, train/loss_step=0.331, global_step=4173.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  82%|████████▏ | 993/1208 [28:26<06:09,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00154, train/loss_step=0.331, global_step=4173.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  82%|████████▏ | 993/1208 [28:26<06:09,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.31e-5, train/loss_step=0.0201, global_step=4174.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  82%|████████▏ | 994/1208 [28:27<06:07,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.31e-5, train/loss_step=0.0201, global_step=4174.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  82%|████████▏ | 994/1208 [28:27<06:07,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0696, train/loss_vlb_step=0.000234, train/loss_step=0.0696, global_step=4174.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  82%|████████▏ | 995/1208 [28:28<06:05,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0696, train/loss_vlb_step=0.000234, train/loss_step=0.0696, global_step=4174.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  82%|████████▏ | 995/1208 [28:28<06:05,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0867, train/loss_vlb_step=0.000285, train/loss_step=0.0867, global_step=4174.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  82%|████████▏ | 996/1208 [28:31<06:04,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0867, train/loss_vlb_step=0.000285, train/loss_step=0.0867, global_step=4174.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  82%|████████▏ | 996/1208 [28:31<06:04,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.730, train/loss_vlb_step=0.0227, train/loss_step=0.730, global_step=4174.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  83%|████████▎ | 997/1208 [28:32<06:02,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.730, train/loss_vlb_step=0.0227, train/loss_step=0.730, global_step=4174.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  83%|████████▎ | 997/1208 [28:32<06:02,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000144, train/loss_step=0.0396, global_step=4175.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  83%|████████▎ | 998/1208 [28:33<06:00,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000144, train/loss_step=0.0396, global_step=4175.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  83%|████████▎ | 998/1208 [28:33<06:00,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.000983, train/loss_step=0.258, global_step=4175.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  83%|████████▎ | 999/1208 [28:34<05:58,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.000983, train/loss_step=0.258, global_step=4175.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  83%|████████▎ | 999/1208 [28:34<05:58,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.00061, train/loss_step=0.173, global_step=4175.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  83%|████████▎ | 1000/1208 [28:37<05:57,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.00061, train/loss_step=0.173, global_step=4175.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  83%|████████▎ | 1000/1208 [28:37<05:57,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0843, train/loss_vlb_step=0.000278, train/loss_step=0.0843, global_step=4175.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  83%|████████▎ | 1001/1208 [28:39<05:55,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0843, train/loss_vlb_step=0.000278, train/loss_step=0.0843, global_step=4175.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  83%|████████▎ | 1001/1208 [28:39<05:55,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0943, train/loss_vlb_step=0.000311, train/loss_step=0.0943, global_step=4176.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  83%|████████▎ | 1002/1208 [28:40<05:53,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0943, train/loss_vlb_step=0.000311, train/loss_step=0.0943, global_step=4176.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  83%|████████▎ | 1002/1208 [28:40<05:53,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0979, train/loss_vlb_step=0.000322, train/loss_step=0.0979, global_step=4176.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  83%|████████▎ | 1003/1208 [28:41<05:51,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0979, train/loss_vlb_step=0.000322, train/loss_step=0.0979, global_step=4176.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  83%|████████▎ | 1003/1208 [28:41<05:51,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=2.41e-5, train/loss_step=0.00464, global_step=4176.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  83%|████████▎ | 1004/1208 [28:44<05:50,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=2.41e-5, train/loss_step=0.00464, global_step=4176.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  83%|████████▎ | 1004/1208 [28:44<05:50,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=2.46e-5, train/loss_step=0.00471, global_step=4176.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  83%|████████▎ | 1005/1208 [28:45<05:48,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=2.46e-5, train/loss_step=0.00471, global_step=4176.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  83%|████████▎ | 1005/1208 [28:45<05:48,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00901, train/loss_vlb_step=4.18e-5, train/loss_step=0.00901, global_step=4177.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  83%|████████▎ | 1006/1208 [28:46<05:46,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00901, train/loss_vlb_step=4.18e-5, train/loss_step=0.00901, global_step=4177.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  83%|████████▎ | 1006/1208 [28:46<05:46,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000777, train/loss_step=0.200, global_step=4177.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  83%|████████▎ | 1007/1208 [28:47<05:44,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000777, train/loss_step=0.200, global_step=4177.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  83%|████████▎ | 1007/1208 [28:47<05:44,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000517, train/loss_step=0.150, global_step=4177.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  83%|████████▎ | 1008/1208 [28:50<05:43,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000517, train/loss_step=0.150, global_step=4177.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  83%|████████▎ | 1008/1208 [28:50<05:43,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00334, train/loss_step=0.420, global_step=4177.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  84%|████████▎ | 1009/1208 [28:51<05:41,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00334, train/loss_step=0.420, global_step=4177.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  84%|████████▎ | 1009/1208 [28:51<05:41,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00171, train/loss_step=0.317, global_step=4178.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  84%|████████▎ | 1010/1208 [28:52<05:39,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00171, train/loss_step=0.317, global_step=4178.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  84%|████████▎ | 1010/1208 [28:52<05:39,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0551, train/loss_vlb_step=0.000192, train/loss_step=0.0551, global_step=4178.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  84%|████████▎ | 1011/1208 [28:53<05:37,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0551, train/loss_vlb_step=0.000192, train/loss_step=0.0551, global_step=4178.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  84%|████████▎ | 1011/1208 [28:53<05:37,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.092, train/loss_vlb_step=0.000303, train/loss_step=0.092, global_step=4178.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  84%|████████▍ | 1012/1208 [28:57<05:36,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.092, train/loss_vlb_step=0.000303, train/loss_step=0.092, global_step=4178.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  84%|████████▍ | 1012/1208 [28:57<05:36,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.89e-5, train/loss_step=0.00344, global_step=4178.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  84%|████████▍ | 1013/1208 [28:58<05:34,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.89e-5, train/loss_step=0.00344, global_step=4178.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  84%|████████▍ | 1013/1208 [28:58<05:34,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00183, train/loss_step=0.351, global_step=4179.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  84%|████████▍ | 1014/1208 [28:59<05:32,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00183, train/loss_step=0.351, global_step=4179.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  84%|████████▍ | 1014/1208 [28:59<05:32,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00127, train/loss_step=0.284, global_step=4179.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  84%|████████▍ | 1015/1208 [29:00<05:30,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00127, train/loss_step=0.284, global_step=4179.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  84%|████████▍ | 1015/1208 [29:00<05:30,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.530, train/loss_vlb_step=0.010, train/loss_step=0.530, global_step=4179.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  84%|████████▍ | 1016/1208 [29:03<05:29,  1.72s/it, loss=0.195, v_num=0, train/loss_simple_step=0.530, train/loss_vlb_step=0.010, train/loss_step=0.530, global_step=4179.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  84%|████████▍ | 1016/1208 [29:03<05:29,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00574, train/loss_vlb_step=2.96e-5, train/loss_step=0.00574, global_step=4179.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  84%|████████▍ | 1017/1208 [29:04<05:27,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00574, train/loss_vlb_step=2.96e-5, train/loss_step=0.00574, global_step=4179.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  84%|████████▍ | 1017/1208 [29:04<05:27,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000837, train/loss_step=0.213, global_step=4180.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  84%|████████▍ | 1018/1208 [29:05<05:25,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000837, train/loss_step=0.213, global_step=4180.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  84%|████████▍ | 1018/1208 [29:05<05:25,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000446, train/loss_step=0.134, global_step=4180.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  84%|████████▍ | 1019/1208 [29:06<05:23,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000446, train/loss_step=0.134, global_step=4180.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  84%|████████▍ | 1019/1208 [29:06<05:23,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00154, train/loss_step=0.315, global_step=4180.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  84%|████████▍ | 1020/1208 [29:10<05:22,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00154, train/loss_step=0.315, global_step=4180.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  84%|████████▍ | 1020/1208 [29:10<05:22,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000789, train/loss_step=0.208, global_step=4180.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  85%|████████▍ | 1021/1208 [29:11<05:20,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000789, train/loss_step=0.208, global_step=4180.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  85%|████████▍ | 1021/1208 [29:11<05:20,  1.72s/it, loss=0.213, v_num=0, train/loss_simple_step=0.870, train/loss_vlb_step=0.111, train/loss_step=0.870, global_step=4181.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  85%|████████▍ | 1022/1208 [29:12<05:18,  1.71s/it, loss=0.213, v_num=0, train/loss_simple_step=0.870, train/loss_vlb_step=0.111, train/loss_step=0.870, global_step=4181.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  85%|████████▍ | 1022/1208 [29:12<05:18,  1.71s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0511, train/loss_vlb_step=0.000184, train/loss_step=0.0511, global_step=4181.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  85%|████████▍ | 1023/1208 [29:13<05:17,  1.71s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0511, train/loss_vlb_step=0.000184, train/loss_step=0.0511, global_step=4181.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  85%|████████▍ | 1023/1208 [29:13<05:17,  1.71s/it, loss=0.215, v_num=0, train/loss_simple_step=0.0957, train/loss_vlb_step=0.000319, train/loss_step=0.0957, global_step=4181.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  85%|████████▍ | 1024/1208 [29:16<05:15,  1.72s/it, loss=0.215, v_num=0, train/loss_simple_step=0.0957, train/loss_vlb_step=0.000319, train/loss_step=0.0957, global_step=4181.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  85%|████████▍ | 1024/1208 [29:16<05:15,  1.72s/it, loss=0.215, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.94e-5, train/loss_step=0.00352, global_step=4181.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  85%|████████▍ | 1025/1208 [29:17<05:13,  1.71s/it, loss=0.215, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.94e-5, train/loss_step=0.00352, global_step=4181.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  85%|████████▍ | 1025/1208 [29:17<05:13,  1.71s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000166, train/loss_step=0.0449, global_step=4182.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  85%|████████▍ | 1026/1208 [29:18<05:11,  1.71s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000166, train/loss_step=0.0449, global_step=4182.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  85%|████████▍ | 1026/1208 [29:18<05:11,  1.71s/it, loss=0.207, v_num=0, train/loss_simple_step=0.00541, train/loss_vlb_step=2.78e-5, train/loss_step=0.00541, global_step=4182.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  85%|████████▌ | 1027/1208 [29:19<05:10,  1.71s/it, loss=0.207, v_num=0, train/loss_simple_step=0.00541, train/loss_vlb_step=2.78e-5, train/loss_step=0.00541, global_step=4182.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  85%|████████▌ | 1027/1208 [29:19<05:10,  1.71s/it, loss=0.218, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00237, train/loss_step=0.365, global_step=4182.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  85%|████████▌ | 1028/1208 [29:22<05:08,  1.71s/it, loss=0.218, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00237, train/loss_step=0.365, global_step=4182.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  85%|████████▌ | 1028/1208 [29:22<05:08,  1.71s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000271, train/loss_step=0.0815, global_step=4182.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  85%|████████▌ | 1029/1208 [29:23<05:06,  1.71s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000271, train/loss_step=0.0815, global_step=4182.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  85%|████████▌ | 1029/1208 [29:23<05:06,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.3e-5, train/loss_step=0.0147, global_step=4183.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  85%|████████▌ | 1030/1208 [29:24<05:05,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.3e-5, train/loss_step=0.0147, global_step=4183.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  85%|████████▌ | 1030/1208 [29:24<05:05,  1.71s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00938, train/loss_vlb_step=4.32e-5, train/loss_step=0.00938, global_step=4183.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  85%|████████▌ | 1031/1208 [29:25<05:03,  1.71s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00938, train/loss_vlb_step=4.32e-5, train/loss_step=0.00938, global_step=4183.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  85%|████████▌ | 1031/1208 [29:25<05:03,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000602, train/loss_step=0.178, global_step=4183.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  85%|████████▌ | 1032/1208 [29:29<05:01,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000602, train/loss_step=0.178, global_step=4183.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  85%|████████▌ | 1032/1208 [29:29<05:01,  1.71s/it, loss=0.201, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00108, train/loss_step=0.259, global_step=4183.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  86%|████████▌ | 1033/1208 [29:30<04:59,  1.71s/it, loss=0.201, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00108, train/loss_step=0.259, global_step=4183.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  86%|████████▌ | 1033/1208 [29:30<04:59,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=4184.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  86%|████████▌ | 1034/1208 [29:31<04:58,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=4184.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  86%|████████▌ | 1034/1208 [29:31<04:58,  1.71s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.24e-5, train/loss_step=0.00213, global_step=4184.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  86%|████████▌ | 1035/1208 [29:32<04:56,  1.71s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.24e-5, train/loss_step=0.00213, global_step=4184.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  86%|████████▌ | 1035/1208 [29:32<04:56,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000474, train/loss_step=0.142, global_step=4184.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  86%|████████▌ | 1036/1208 [29:35<04:54,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000474, train/loss_step=0.142, global_step=4184.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  86%|████████▌ | 1036/1208 [29:35<04:54,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000545, train/loss_step=0.163, global_step=4184.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  86%|████████▌ | 1037/1208 [29:36<04:52,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000545, train/loss_step=0.163, global_step=4184.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  86%|████████▌ | 1037/1208 [29:36<04:52,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0915, train/loss_vlb_step=0.000305, train/loss_step=0.0915, global_step=4185.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  86%|████████▌ | 1038/1208 [29:37<04:51,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0915, train/loss_vlb_step=0.000305, train/loss_step=0.0915, global_step=4185.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  86%|████████▌ | 1038/1208 [29:37<04:51,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0664, train/loss_vlb_step=0.000227, train/loss_step=0.0664, global_step=4185.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  86%|████████▌ | 1039/1208 [29:38<04:49,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0664, train/loss_vlb_step=0.000227, train/loss_step=0.0664, global_step=4185.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  86%|████████▌ | 1039/1208 [29:38<04:49,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.076, train/loss_vlb_step=0.000253, train/loss_step=0.076, global_step=4185.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  86%|████████▌ | 1040/1208 [29:42<04:47,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.076, train/loss_vlb_step=0.000253, train/loss_step=0.076, global_step=4185.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  86%|████████▌ | 1040/1208 [29:42<04:47,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000482, train/loss_step=0.142, global_step=4185.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  86%|████████▌ | 1041/1208 [29:43<04:46,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000482, train/loss_step=0.142, global_step=4185.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  86%|████████▌ | 1041/1208 [29:43<04:46,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000478, train/loss_step=0.139, global_step=4186.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  86%|████████▋ | 1042/1208 [29:44<04:44,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000478, train/loss_step=0.139, global_step=4186.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  86%|████████▋ | 1042/1208 [29:44<04:44,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.085, train/loss_vlb_step=0.000282, train/loss_step=0.085, global_step=4186.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  86%|████████▋ | 1043/1208 [29:45<04:42,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.085, train/loss_vlb_step=0.000282, train/loss_step=0.085, global_step=4186.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  86%|████████▋ | 1043/1208 [29:45<04:42,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00343, train/loss_step=0.413, global_step=4186.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  86%|████████▋ | 1044/1208 [29:48<04:40,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00343, train/loss_step=0.413, global_step=4186.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  86%|████████▋ | 1044/1208 [29:48<04:40,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00179, train/loss_step=0.321, global_step=4186.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  87%|████████▋ | 1045/1208 [29:49<04:39,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00179, train/loss_step=0.321, global_step=4186.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  87%|████████▋ | 1045/1208 [29:49<04:39,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000672, train/loss_step=0.183, global_step=4187.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  87%|████████▋ | 1046/1208 [29:50<04:37,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000672, train/loss_step=0.183, global_step=4187.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  87%|████████▋ | 1046/1208 [29:50<04:37,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00888, train/loss_vlb_step=4.19e-5, train/loss_step=0.00888, global_step=4187.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  87%|████████▋ | 1047/1208 [29:51<04:35,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00888, train/loss_vlb_step=4.19e-5, train/loss_step=0.00888, global_step=4187.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  87%|████████▋ | 1047/1208 [29:51<04:35,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.429, train/loss_vlb_step=0.00338, train/loss_step=0.429, global_step=4187.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  87%|████████▋ | 1048/1208 [29:54<04:34,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.429, train/loss_vlb_step=0.00338, train/loss_step=0.429, global_step=4187.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  87%|████████▋ | 1048/1208 [29:54<04:34,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=3.24e-5, train/loss_step=0.00611, global_step=4187.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  87%|████████▋ | 1049/1208 [29:55<04:32,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=3.24e-5, train/loss_step=0.00611, global_step=4187.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  87%|████████▋ | 1049/1208 [29:55<04:32,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.000221, train/loss_step=0.0665, global_step=4188.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  87%|████████▋ | 1050/1208 [29:56<04:30,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.000221, train/loss_step=0.0665, global_step=4188.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  87%|████████▋ | 1050/1208 [29:56<04:30,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.00014, train/loss_step=0.0395, global_step=4188.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  87%|████████▋ | 1051/1208 [29:57<04:28,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.00014, train/loss_step=0.0395, global_step=4188.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  87%|████████▋ | 1051/1208 [29:57<04:28,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00795, train/loss_vlb_step=3.95e-5, train/loss_step=0.00795, global_step=4188.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  87%|████████▋ | 1052/1208 [30:01<04:27,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00795, train/loss_vlb_step=3.95e-5, train/loss_step=0.00795, global_step=4188.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  87%|████████▋ | 1052/1208 [30:01<04:27,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00165, train/loss_step=0.290, global_step=4188.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  87%|████████▋ | 1053/1208 [30:02<04:25,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00165, train/loss_step=0.290, global_step=4188.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  87%|████████▋ | 1053/1208 [30:02<04:25,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0881, train/loss_vlb_step=0.00029, train/loss_step=0.0881, global_step=4189.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  87%|████████▋ | 1054/1208 [30:03<04:23,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0881, train/loss_vlb_step=0.00029, train/loss_step=0.0881, global_step=4189.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  87%|████████▋ | 1054/1208 [30:03<04:23,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.000232, train/loss_step=0.0672, global_step=4189.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  87%|████████▋ | 1055/1208 [30:04<04:21,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.000232, train/loss_step=0.0672, global_step=4189.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  87%|████████▋ | 1055/1208 [30:04<04:21,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.94e-5, train/loss_step=0.019, global_step=4189.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  87%|████████▋ | 1056/1208 [30:07<04:20,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.94e-5, train/loss_step=0.019, global_step=4189.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  87%|████████▋ | 1056/1208 [30:07<04:20,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.540, train/loss_vlb_step=0.0138, train/loss_step=0.540, global_step=4189.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  88%|████████▊ | 1057/1208 [30:08<04:18,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.540, train/loss_vlb_step=0.0138, train/loss_step=0.540, global_step=4189.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  88%|████████▊ | 1057/1208 [30:08<04:18,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0538, train/loss_vlb_step=0.00019, train/loss_step=0.0538, global_step=4190.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  88%|████████▊ | 1058/1208 [30:09<04:16,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0538, train/loss_vlb_step=0.00019, train/loss_step=0.0538, global_step=4190.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  88%|████████▊ | 1058/1208 [30:09<04:16,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.00043, train/loss_step=0.131, global_step=4190.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  88%|████████▊ | 1059/1208 [30:10<04:14,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.00043, train/loss_step=0.131, global_step=4190.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  88%|████████▊ | 1059/1208 [30:10<04:14,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00703, train/loss_vlb_step=3.54e-5, train/loss_step=0.00703, global_step=4190.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  88%|████████▊ | 1060/1208 [30:14<04:13,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00703, train/loss_vlb_step=3.54e-5, train/loss_step=0.00703, global_step=4190.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  88%|████████▊ | 1060/1208 [30:14<04:13,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0868, train/loss_vlb_step=0.000289, train/loss_step=0.0868, global_step=4190.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  88%|████████▊ | 1061/1208 [30:15<04:11,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0868, train/loss_vlb_step=0.000289, train/loss_step=0.0868, global_step=4190.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  88%|████████▊ | 1061/1208 [30:15<04:11,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=4191.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  88%|████████▊ | 1062/1208 [30:16<04:09,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=4191.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  88%|████████▊ | 1062/1208 [30:16<04:09,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00205, train/loss_step=0.375, global_step=4191.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  88%|████████▊ | 1063/1208 [30:17<04:07,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00205, train/loss_step=0.375, global_step=4191.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  88%|████████▊ | 1063/1208 [30:17<04:07,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00236, train/loss_step=0.345, global_step=4191.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  88%|████████▊ | 1064/1208 [30:20<04:06,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00236, train/loss_step=0.345, global_step=4191.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  88%|████████▊ | 1064/1208 [30:20<04:06,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0604, train/loss_vlb_step=0.000207, train/loss_step=0.0604, global_step=4191.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  88%|████████▊ | 1065/1208 [30:21<04:04,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0604, train/loss_vlb_step=0.000207, train/loss_step=0.0604, global_step=4191.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  88%|████████▊ | 1065/1208 [30:21<04:04,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00185, train/loss_step=0.357, global_step=4192.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  88%|████████▊ | 1066/1208 [30:22<04:02,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00185, train/loss_step=0.357, global_step=4192.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  88%|████████▊ | 1066/1208 [30:22<04:02,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.07e-5, train/loss_step=0.00394, global_step=4192.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  88%|████████▊ | 1067/1208 [30:23<04:00,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.07e-5, train/loss_step=0.00394, global_step=4192.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  88%|████████▊ | 1067/1208 [30:23<04:00,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00214, train/loss_step=0.324, global_step=4192.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  88%|████████▊ | 1068/1208 [30:26<03:59,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00214, train/loss_step=0.324, global_step=4192.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  88%|████████▊ | 1068/1208 [30:26<03:59,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000754, train/loss_step=0.210, global_step=4192.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  88%|████████▊ | 1069/1208 [30:28<03:57,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000754, train/loss_step=0.210, global_step=4192.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  88%|████████▊ | 1069/1208 [30:28<03:57,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00354, train/loss_vlb_step=1.94e-5, train/loss_step=0.00354, global_step=4193.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  89%|████████▊ | 1070/1208 [30:29<03:55,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00354, train/loss_vlb_step=1.94e-5, train/loss_step=0.00354, global_step=4193.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  89%|████████▊ | 1070/1208 [30:29<03:55,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.88e-5, train/loss_step=0.0131, global_step=4193.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  89%|████████▊ | 1071/1208 [30:30<03:54,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.88e-5, train/loss_step=0.0131, global_step=4193.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  89%|████████▊ | 1071/1208 [30:30<03:54,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0669, train/loss_vlb_step=0.000229, train/loss_step=0.0669, global_step=4193.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  89%|████████▊ | 1072/1208 [30:33<03:52,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0669, train/loss_vlb_step=0.000229, train/loss_step=0.0669, global_step=4193.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  89%|████████▊ | 1072/1208 [30:33<03:52,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000962, train/loss_step=0.248, global_step=4193.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  89%|████████▉ | 1073/1208 [30:34<03:50,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000962, train/loss_step=0.248, global_step=4193.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  89%|████████▉ | 1073/1208 [30:34<03:50,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0343, train/loss_vlb_step=0.000131, train/loss_step=0.0343, global_step=4194.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  89%|████████▉ | 1074/1208 [30:35<03:49,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0343, train/loss_vlb_step=0.000131, train/loss_step=0.0343, global_step=4194.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  89%|████████▉ | 1074/1208 [30:35<03:49,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000122, train/loss_step=0.0319, global_step=4194.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  89%|████████▉ | 1075/1208 [30:36<03:47,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000122, train/loss_step=0.0319, global_step=4194.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  89%|████████▉ | 1075/1208 [30:36<03:47,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.000138, train/loss_step=0.038, global_step=4194.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  89%|████████▉ | 1076/1208 [30:39<03:45,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.000138, train/loss_step=0.038, global_step=4194.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  89%|████████▉ | 1076/1208 [30:39<03:45,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=2.58e-5, train/loss_step=0.00469, global_step=4194.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  89%|████████▉ | 1077/1208 [30:40<03:43,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=2.58e-5, train/loss_step=0.00469, global_step=4194.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  89%|████████▉ | 1077/1208 [30:40<03:43,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00293, train/loss_step=0.353, global_step=4195.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  89%|████████▉ | 1078/1208 [30:41<03:42,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00293, train/loss_step=0.353, global_step=4195.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  89%|████████▉ | 1078/1208 [30:41<03:42,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00192, train/loss_step=0.341, global_step=4195.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  89%|████████▉ | 1079/1208 [30:42<03:40,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00192, train/loss_step=0.341, global_step=4195.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  89%|████████▉ | 1079/1208 [30:43<03:40,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.29e-5, train/loss_step=0.0115, global_step=4195.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  89%|████████▉ | 1080/1208 [30:46<03:38,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.29e-5, train/loss_step=0.0115, global_step=4195.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  89%|████████▉ | 1080/1208 [30:46<03:38,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000588, train/loss_step=0.175, global_step=4195.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  89%|████████▉ | 1081/1208 [30:47<03:37,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000588, train/loss_step=0.175, global_step=4195.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  89%|████████▉ | 1081/1208 [30:47<03:37,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000429, train/loss_step=0.130, global_step=4196.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  90%|████████▉ | 1082/1208 [30:48<03:35,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000429, train/loss_step=0.130, global_step=4196.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  90%|████████▉ | 1082/1208 [30:48<03:35,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000653, train/loss_step=0.185, global_step=4196.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  90%|████████▉ | 1083/1208 [30:49<03:33,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000653, train/loss_step=0.185, global_step=4196.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  90%|████████▉ | 1083/1208 [30:49<03:33,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000578, train/loss_step=0.172, global_step=4196.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  90%|████████▉ | 1084/1208 [30:52<03:31,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000578, train/loss_step=0.172, global_step=4196.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  90%|████████▉ | 1084/1208 [30:52<03:31,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0042, train/loss_vlb_step=2.27e-5, train/loss_step=0.0042, global_step=4196.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  90%|████████▉ | 1085/1208 [30:53<03:30,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0042, train/loss_vlb_step=2.27e-5, train/loss_step=0.0042, global_step=4196.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  90%|████████▉ | 1085/1208 [30:53<03:30,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00218, train/loss_step=0.343, global_step=4197.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  90%|████████▉ | 1086/1208 [30:54<03:28,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00218, train/loss_step=0.343, global_step=4197.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  90%|████████▉ | 1086/1208 [30:54<03:28,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=1.94e-5, train/loss_step=0.00347, global_step=4197.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  90%|████████▉ | 1087/1208 [30:55<03:26,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=1.94e-5, train/loss_step=0.00347, global_step=4197.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  90%|████████▉ | 1087/1208 [30:55<03:26,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00652, train/loss_vlb_step=3.31e-5, train/loss_step=0.00652, global_step=4197.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  90%|█████████ | 1088/1208 [30:59<03:25,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00652, train/loss_vlb_step=3.31e-5, train/loss_step=0.00652, global_step=4197.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  90%|█████████ | 1088/1208 [30:59<03:25,  1.71s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0744, train/loss_vlb_step=0.000244, train/loss_step=0.0744, global_step=4197.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  90%|█████████ | 1089/1208 [31:00<03:23,  1.71s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0744, train/loss_vlb_step=0.000244, train/loss_step=0.0744, global_step=4197.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  90%|█████████ | 1089/1208 [31:00<03:23,  1.71s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00978, train/loss_vlb_step=4.58e-5, train/loss_step=0.00978, global_step=4198.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  90%|█████████ | 1090/1208 [31:01<03:21,  1.71s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00978, train/loss_vlb_step=4.58e-5, train/loss_step=0.00978, global_step=4198.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  90%|█████████ | 1090/1208 [31:01<03:21,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000108, train/loss_step=0.0273, global_step=4198.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  90%|█████████ | 1091/1208 [31:02<03:19,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000108, train/loss_step=0.0273, global_step=4198.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  90%|█████████ | 1091/1208 [31:02<03:19,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000598, train/loss_step=0.172, global_step=4198.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  90%|█████████ | 1092/1208 [31:05<03:18,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000598, train/loss_step=0.172, global_step=4198.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  90%|█████████ | 1092/1208 [31:05<03:18,  1.71s/it, loss=0.115, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000684, train/loss_step=0.188, global_step=4198.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  90%|█████████ | 1093/1208 [31:06<03:16,  1.71s/it, loss=0.115, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000684, train/loss_step=0.188, global_step=4198.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  90%|█████████ | 1093/1208 [31:06<03:16,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000548, train/loss_step=0.160, global_step=4199.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  91%|█████████ | 1094/1208 [31:07<03:14,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000548, train/loss_step=0.160, global_step=4199.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  91%|█████████ | 1094/1208 [31:07<03:14,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=4199.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  91%|█████████ | 1095/1208 [31:08<03:12,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=4199.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  91%|█████████ | 1095/1208 [31:08<03:12,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.523, train/loss_vlb_step=0.00481, train/loss_step=0.523, global_step=4199.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  91%|█████████ | 1096/1208 [31:11<03:11,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.523, train/loss_vlb_step=0.00481, train/loss_step=0.523, global_step=4199.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  91%|█████████ | 1096/1208 [31:11<03:11,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000127, train/loss_step=0.0337, global_step=4199.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  91%|█████████ | 1097/1208 [31:12<03:09,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000127, train/loss_step=0.0337, global_step=4199.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  91%|█████████ | 1097/1208 [31:12<03:09,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00318, train/loss_step=0.408, global_step=4200.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  91%|█████████ | 1098/1208 [31:13<03:07,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00318, train/loss_step=0.408, global_step=4200.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  91%|█████████ | 1098/1208 [31:13<03:07,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00646, train/loss_vlb_step=3.22e-5, train/loss_step=0.00646, global_step=4200.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  91%|█████████ | 1099/1208 [31:15<03:05,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00646, train/loss_vlb_step=3.22e-5, train/loss_step=0.00646, global_step=4200.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  91%|█████████ | 1099/1208 [31:15<03:05,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.004, train/loss_vlb_step=2.15e-5, train/loss_step=0.004, global_step=4200.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  91%|█████████ | 1100/1208 [31:18<03:04,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.004, train/loss_vlb_step=2.15e-5, train/loss_step=0.004, global_step=4200.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  91%|█████████ | 1100/1208 [31:18<03:04,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.89e-5, train/loss_step=0.00349, global_step=4200.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  91%|█████████ | 1101/1208 [31:19<03:02,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.89e-5, train/loss_step=0.00349, global_step=4200.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  91%|█████████ | 1101/1208 [31:19<03:02,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000687, train/loss_step=0.186, global_step=4201.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  91%|█████████ | 1102/1208 [31:20<03:00,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000687, train/loss_step=0.186, global_step=4201.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  91%|█████████ | 1102/1208 [31:20<03:00,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00877, train/loss_vlb_step=4.26e-5, train/loss_step=0.00877, global_step=4201.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  91%|█████████▏| 1103/1208 [31:21<02:59,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00877, train/loss_vlb_step=4.26e-5, train/loss_step=0.00877, global_step=4201.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  91%|█████████▏| 1103/1208 [31:21<02:59,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00125, train/loss_step=0.280, global_step=4201.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  91%|█████████▏| 1104/1208 [31:24<02:57,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00125, train/loss_step=0.280, global_step=4201.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  91%|█████████▏| 1104/1208 [31:24<02:57,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=2.5e-5, train/loss_step=0.00492, global_step=4201.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  91%|█████████▏| 1105/1208 [31:25<02:55,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=2.5e-5, train/loss_step=0.00492, global_step=4201.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  91%|█████████▏| 1105/1208 [31:25<02:55,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000471, train/loss_step=0.142, global_step=4202.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  92%|█████████▏| 1106/1208 [31:26<02:54,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000471, train/loss_step=0.142, global_step=4202.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  92%|█████████▏| 1106/1208 [31:26<02:54,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0728, train/loss_vlb_step=0.000244, train/loss_step=0.0728, global_step=4202.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  92%|█████████▏| 1107/1208 [31:27<02:52,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0728, train/loss_vlb_step=0.000244, train/loss_step=0.0728, global_step=4202.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  92%|█████████▏| 1107/1208 [31:27<02:52,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=2.01e-5, train/loss_step=0.00384, global_step=4202.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  92%|█████████▏| 1108/1208 [31:31<02:50,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=2.01e-5, train/loss_step=0.00384, global_step=4202.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  92%|█████████▏| 1108/1208 [31:31<02:50,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00598, train/loss_vlb_step=3.04e-5, train/loss_step=0.00598, global_step=4202.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  92%|█████████▏| 1109/1208 [31:32<02:48,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00598, train/loss_vlb_step=3.04e-5, train/loss_step=0.00598, global_step=4202.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  92%|█████████▏| 1109/1208 [31:32<02:48,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000614, train/loss_step=0.166, global_step=4203.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  92%|█████████▏| 1110/1208 [31:33<02:47,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000614, train/loss_step=0.166, global_step=4203.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  92%|█████████▏| 1110/1208 [31:33<02:47,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.22e-5, train/loss_step=0.0114, global_step=4203.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  92%|█████████▏| 1111/1208 [31:34<02:45,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.22e-5, train/loss_step=0.0114, global_step=4203.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  92%|█████████▏| 1111/1208 [31:34<02:45,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000434, train/loss_step=0.130, global_step=4203.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  92%|█████████▏| 1112/1208 [31:37<02:43,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000434, train/loss_step=0.130, global_step=4203.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  92%|█████████▏| 1112/1208 [31:37<02:43,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.79e-5, train/loss_step=0.00305, global_step=4203.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  92%|█████████▏| 1113/1208 [31:38<02:42,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.79e-5, train/loss_step=0.00305, global_step=4203.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  92%|█████████▏| 1113/1208 [31:38<02:42,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000844, train/loss_step=0.223, global_step=4204.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  92%|█████████▏| 1114/1208 [31:39<02:40,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000844, train/loss_step=0.223, global_step=4204.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  92%|█████████▏| 1114/1208 [31:39<02:40,  1.71s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0906, train/loss_vlb_step=0.000301, train/loss_step=0.0906, global_step=4204.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  92%|█████████▏| 1115/1208 [31:40<02:38,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0906, train/loss_vlb_step=0.000301, train/loss_step=0.0906, global_step=4204.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  92%|█████████▏| 1115/1208 [31:40<02:38,  1.70s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000499, train/loss_step=0.149, global_step=4204.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  92%|█████████▏| 1116/1208 [31:43<02:36,  1.71s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000499, train/loss_step=0.149, global_step=4204.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  92%|█████████▏| 1116/1208 [31:43<02:36,  1.71s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.0496, train/loss_vlb_step=0.000177, train/loss_step=0.0496, global_step=4204.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  92%|█████████▏| 1117/1208 [31:44<02:35,  1.71s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.0496, train/loss_vlb_step=0.000177, train/loss_step=0.0496, global_step=4204.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  92%|█████████▏| 1117/1208 [31:44<02:35,  1.71s/it, loss=0.0777, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.32e-5, train/loss_step=0.0146, global_step=4205.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  93%|█████████▎| 1118/1208 [31:45<02:33,  1.70s/it, loss=0.0777, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.32e-5, train/loss_step=0.0146, global_step=4205.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  93%|█████████▎| 1118/1208 [31:45<02:33,  1.70s/it, loss=0.0775, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.31e-5, train/loss_step=0.00219, global_step=4205.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  93%|█████████▎| 1119/1208 [31:46<02:31,  1.70s/it, loss=0.0775, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.31e-5, train/loss_step=0.00219, global_step=4205.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  93%|█████████▎| 1119/1208 [31:46<02:31,  1.70s/it, loss=0.0791, v_num=0, train/loss_simple_step=0.0354, train/loss_vlb_step=0.000127, train/loss_step=0.0354, global_step=4205.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  93%|█████████▎| 1120/1208 [31:50<02:30,  1.71s/it, loss=0.0791, v_num=0, train/loss_simple_step=0.0354, train/loss_vlb_step=0.000127, train/loss_step=0.0354, global_step=4205.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  93%|█████████▎| 1120/1208 [31:50<02:30,  1.71s/it, loss=0.0803, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000109, train/loss_step=0.0269, global_step=4205.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  93%|█████████▎| 1121/1208 [31:51<02:28,  1.71s/it, loss=0.0803, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000109, train/loss_step=0.0269, global_step=4205.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  93%|█████████▎| 1121/1208 [31:51<02:28,  1.71s/it, loss=0.0827, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000882, train/loss_step=0.234, global_step=4206.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  93%|█████████▎| 1122/1208 [31:52<02:26,  1.70s/it, loss=0.0827, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000882, train/loss_step=0.234, global_step=4206.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  93%|█████████▎| 1122/1208 [31:52<02:26,  1.70s/it, loss=0.0847, v_num=0, train/loss_simple_step=0.0493, train/loss_vlb_step=0.000179, train/loss_step=0.0493, global_step=4206.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  93%|█████████▎| 1123/1208 [31:53<02:24,  1.70s/it, loss=0.0847, v_num=0, train/loss_simple_step=0.0493, train/loss_vlb_step=0.000179, train/loss_step=0.0493, global_step=4206.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  93%|█████████▎| 1123/1208 [31:53<02:24,  1.70s/it, loss=0.0709, v_num=0, train/loss_simple_step=0.00406, train/loss_vlb_step=2.23e-5, train/loss_step=0.00406, global_step=4206.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  93%|█████████▎| 1124/1208 [31:56<02:23,  1.71s/it, loss=0.0709, v_num=0, train/loss_simple_step=0.00406, train/loss_vlb_step=2.23e-5, train/loss_step=0.00406, global_step=4206.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  93%|█████████▎| 1124/1208 [31:56<02:23,  1.71s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00181, train/loss_step=0.341, global_step=4206.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  93%|█████████▎| 1125/1208 [31:57<02:21,  1.70s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00181, train/loss_step=0.341, global_step=4206.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  93%|█████████▎| 1125/1208 [31:57<02:21,  1.70s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000667, train/loss_step=0.191, global_step=4207.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  93%|█████████▎| 1126/1208 [31:58<02:19,  1.70s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000667, train/loss_step=0.191, global_step=4207.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  93%|█████████▎| 1126/1208 [31:58<02:19,  1.70s/it, loss=0.0887, v_num=0, train/loss_simple_step=0.0435, train/loss_vlb_step=0.000152, train/loss_step=0.0435, global_step=4207.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  93%|█████████▎| 1127/1208 [31:59<02:17,  1.70s/it, loss=0.0887, v_num=0, train/loss_simple_step=0.0435, train/loss_vlb_step=0.000152, train/loss_step=0.0435, global_step=4207.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  93%|█████████▎| 1127/1208 [31:59<02:17,  1.70s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.49e-5, train/loss_step=0.0233, global_step=4207.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  93%|█████████▎| 1128/1208 [32:03<02:16,  1.70s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.49e-5, train/loss_step=0.0233, global_step=4207.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  93%|█████████▎| 1128/1208 [32:03<02:16,  1.70s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000543, train/loss_step=0.156, global_step=4207.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  93%|█████████▎| 1129/1208 [32:04<02:14,  1.70s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000543, train/loss_step=0.156, global_step=4207.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  93%|█████████▎| 1129/1208 [32:04<02:14,  1.70s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.0661, train/loss_vlb_step=0.000226, train/loss_step=0.0661, global_step=4208.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  94%|█████████▎| 1130/1208 [32:05<02:12,  1.70s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.0661, train/loss_vlb_step=0.000226, train/loss_step=0.0661, global_step=4208.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  94%|█████████▎| 1130/1208 [32:05<02:12,  1.70s/it, loss=0.093, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000105, train/loss_step=0.0265, global_step=4208.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  94%|█████████▎| 1131/1208 [32:06<02:11,  1.70s/it, loss=0.093, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000105, train/loss_step=0.0265, global_step=4208.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  94%|█████████▎| 1131/1208 [32:06<02:11,  1.70s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000547, train/loss_step=0.152, global_step=4208.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  94%|█████████▎| 1132/1208 [32:09<02:09,  1.70s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000547, train/loss_step=0.152, global_step=4208.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  94%|█████████▎| 1132/1208 [32:09<02:09,  1.70s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.00441, train/loss_vlb_step=2.39e-5, train/loss_step=0.00441, global_step=4208.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  94%|█████████▍| 1133/1208 [32:10<02:07,  1.70s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.00441, train/loss_vlb_step=2.39e-5, train/loss_step=0.00441, global_step=4208.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  94%|█████████▍| 1133/1208 [32:10<02:07,  1.70s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.0094, train/loss_vlb_step=4.37e-5, train/loss_step=0.0094, global_step=4209.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  94%|█████████▍| 1134/1208 [32:11<02:06,  1.70s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.0094, train/loss_vlb_step=4.37e-5, train/loss_step=0.0094, global_step=4209.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  94%|█████████▍| 1134/1208 [32:11<02:06,  1.70s/it, loss=0.0805, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000121, train/loss_step=0.0314, global_step=4209.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  94%|█████████▍| 1135/1208 [32:12<02:04,  1.70s/it, loss=0.0805, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000121, train/loss_step=0.0314, global_step=4209.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  94%|█████████▍| 1135/1208 [32:12<02:04,  1.70s/it, loss=0.0752, v_num=0, train/loss_simple_step=0.0423, train/loss_vlb_step=0.000153, train/loss_step=0.0423, global_step=4209.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  94%|█████████▍| 1136/1208 [32:15<02:02,  1.70s/it, loss=0.0752, v_num=0, train/loss_simple_step=0.0423, train/loss_vlb_step=0.000153, train/loss_step=0.0423, global_step=4209.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  94%|█████████▍| 1136/1208 [32:15<02:02,  1.70s/it, loss=0.074, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.000103, train/loss_step=0.0256, global_step=4209.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  94%|█████████▍| 1137/1208 [32:17<02:00,  1.70s/it, loss=0.074, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.000103, train/loss_step=0.0256, global_step=4209.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  94%|█████████▍| 1137/1208 [32:17<02:00,  1.70s/it, loss=0.0887, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00136, train/loss_step=0.308, global_step=4210.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  94%|█████████▍| 1138/1208 [32:18<01:59,  1.70s/it, loss=0.0887, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00136, train/loss_step=0.308, global_step=4210.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  94%|█████████▍| 1138/1208 [32:18<01:59,  1.70s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=4210.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  94%|█████████▍| 1139/1208 [32:19<01:57,  1.70s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=4210.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  94%|█████████▍| 1139/1208 [32:19<01:57,  1.70s/it, loss=0.0945, v_num=0, train/loss_simple_step=0.0432, train/loss_vlb_step=0.000158, train/loss_step=0.0432, global_step=4210.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  94%|█████████▍| 1140/1208 [32:22<01:55,  1.70s/it, loss=0.0945, v_num=0, train/loss_simple_step=0.0432, train/loss_vlb_step=0.000158, train/loss_step=0.0432, global_step=4210.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  94%|█████████▍| 1140/1208 [32:22<01:55,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.530, train/loss_vlb_step=0.00559, train/loss_step=0.530, global_step=4210.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]     Epoch 13:  94%|█████████▍| 1141/1208 [32:23<01:54,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.530, train/loss_vlb_step=0.00559, train/loss_step=0.530, global_step=4210.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  94%|█████████▍| 1141/1208 [32:23<01:54,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.57e-5, train/loss_step=0.0184, global_step=4211.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  95%|█████████▍| 1142/1208 [32:24<01:52,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.57e-5, train/loss_step=0.0184, global_step=4211.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  95%|█████████▍| 1142/1208 [32:24<01:52,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.079, train/loss_vlb_step=0.000268, train/loss_step=0.079, global_step=4211.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  95%|█████████▍| 1143/1208 [32:25<01:50,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.079, train/loss_vlb_step=0.000268, train/loss_step=0.079, global_step=4211.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  95%|█████████▍| 1143/1208 [32:25<01:50,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000442, train/loss_step=0.131, global_step=4211.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  95%|█████████▍| 1144/1208 [32:28<01:49,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000442, train/loss_step=0.131, global_step=4211.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  95%|█████████▍| 1144/1208 [32:28<01:49,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00347, train/loss_step=0.423, global_step=4211.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  95%|█████████▍| 1145/1208 [32:29<01:47,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00347, train/loss_step=0.423, global_step=4211.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  95%|█████████▍| 1145/1208 [32:29<01:47,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000561, train/loss_step=0.162, global_step=4212.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  95%|█████████▍| 1146/1208 [32:30<01:45,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000561, train/loss_step=0.162, global_step=4212.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  95%|█████████▍| 1146/1208 [32:30<01:45,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0821, train/loss_vlb_step=0.000276, train/loss_step=0.0821, global_step=4212.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  95%|█████████▍| 1147/1208 [32:31<01:43,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0821, train/loss_vlb_step=0.000276, train/loss_step=0.0821, global_step=4212.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  95%|█████████▍| 1147/1208 [32:31<01:43,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00342, train/loss_step=0.399, global_step=4212.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]    Epoch 13:  95%|█████████▌| 1148/1208 [32:35<01:42,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00342, train/loss_step=0.399, global_step=4212.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  95%|█████████▌| 1148/1208 [32:35<01:42,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0785, train/loss_vlb_step=0.000272, train/loss_step=0.0785, global_step=4212.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  95%|█████████▌| 1149/1208 [32:36<01:40,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0785, train/loss_vlb_step=0.000272, train/loss_step=0.0785, global_step=4212.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  95%|█████████▌| 1149/1208 [32:36<01:40,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0633, train/loss_vlb_step=0.000218, train/loss_step=0.0633, global_step=4213.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  95%|█████████▌| 1150/1208 [32:37<01:38,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0633, train/loss_vlb_step=0.000218, train/loss_step=0.0633, global_step=4213.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  95%|█████████▌| 1150/1208 [32:37<01:38,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.521, train/loss_vlb_step=0.00511, train/loss_step=0.521, global_step=4213.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  95%|█████████▌| 1151/1208 [32:38<01:36,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.521, train/loss_vlb_step=0.00511, train/loss_step=0.521, global_step=4213.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  95%|█████████▌| 1151/1208 [32:38<01:36,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.490, train/loss_vlb_step=0.00708, train/loss_step=0.490, global_step=4213.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  95%|█████████▌| 1152/1208 [32:41<01:35,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.490, train/loss_vlb_step=0.00708, train/loss_step=0.490, global_step=4213.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  95%|█████████▌| 1152/1208 [32:41<01:35,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00389, train/loss_vlb_step=2.13e-5, train/loss_step=0.00389, global_step=4213.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  95%|█████████▌| 1153/1208 [32:42<01:33,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00389, train/loss_vlb_step=2.13e-5, train/loss_step=0.00389, global_step=4213.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  95%|█████████▌| 1153/1208 [32:42<01:33,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0789, train/loss_vlb_step=0.000271, train/loss_step=0.0789, global_step=4214.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  96%|█████████▌| 1154/1208 [32:43<01:31,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0789, train/loss_vlb_step=0.000271, train/loss_step=0.0789, global_step=4214.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  96%|█████████▌| 1154/1208 [32:43<01:31,  1.70s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=5.99e-5, train/loss_step=0.0138, global_step=4214.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  96%|█████████▌| 1155/1208 [32:44<01:30,  1.70s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=5.99e-5, train/loss_step=0.0138, global_step=4214.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  96%|█████████▌| 1155/1208 [32:44<01:30,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000492, train/loss_step=0.144, global_step=4214.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  96%|█████████▌| 1156/1208 [32:47<01:28,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000492, train/loss_step=0.144, global_step=4214.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  96%|█████████▌| 1156/1208 [32:47<01:28,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.4e-5, train/loss_step=0.0138, global_step=4214.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  96%|█████████▌| 1157/1208 [32:49<01:26,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.4e-5, train/loss_step=0.0138, global_step=4214.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  96%|█████████▌| 1157/1208 [32:49<01:26,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000548, train/loss_step=0.151, global_step=4215.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  96%|█████████▌| 1158/1208 [32:50<01:25,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000548, train/loss_step=0.151, global_step=4215.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  96%|█████████▌| 1158/1208 [32:50<01:25,  1.70s/it, loss=0.215, v_num=0, train/loss_simple_step=0.875, train/loss_vlb_step=0.148, train/loss_step=0.875, global_step=4215.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  96%|█████████▌| 1159/1208 [32:51<01:23,  1.70s/it, loss=0.215, v_num=0, train/loss_simple_step=0.875, train/loss_vlb_step=0.148, train/loss_step=0.875, global_step=4215.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  96%|█████████▌| 1159/1208 [32:51<01:23,  1.70s/it, loss=0.25, v_num=0, train/loss_simple_step=0.736, train/loss_vlb_step=0.0206, train/loss_step=0.736, global_step=4215.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  96%|█████████▌| 1160/1208 [32:54<01:21,  1.70s/it, loss=0.25, v_num=0, train/loss_simple_step=0.736, train/loss_vlb_step=0.0206, train/loss_step=0.736, global_step=4215.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  96%|█████████▌| 1160/1208 [32:54<01:21,  1.70s/it, loss=0.223, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.96e-5, train/loss_step=0.00352, global_step=4215.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  96%|█████████▌| 1161/1208 [32:55<01:19,  1.70s/it, loss=0.223, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.96e-5, train/loss_step=0.00352, global_step=4215.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  96%|█████████▌| 1161/1208 [32:55<01:19,  1.70s/it, loss=0.223, v_num=0, train/loss_simple_step=0.00722, train/loss_vlb_step=3.52e-5, train/loss_step=0.00722, global_step=4216.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  96%|█████████▌| 1162/1208 [32:56<01:18,  1.70s/it, loss=0.223, v_num=0, train/loss_simple_step=0.00722, train/loss_vlb_step=3.52e-5, train/loss_step=0.00722, global_step=4216.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  96%|█████████▌| 1162/1208 [32:56<01:18,  1.70s/it, loss=0.219, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=1.29e-5, train/loss_step=0.00217, global_step=4216.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  96%|█████████▋| 1163/1208 [32:57<01:16,  1.70s/it, loss=0.219, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=1.29e-5, train/loss_step=0.00217, global_step=4216.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  96%|█████████▋| 1163/1208 [32:57<01:16,  1.70s/it, loss=0.213, v_num=0, train/loss_simple_step=0.00844, train/loss_vlb_step=3.98e-5, train/loss_step=0.00844, global_step=4216.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  96%|█████████▋| 1164/1208 [33:00<01:14,  1.70s/it, loss=0.213, v_num=0, train/loss_simple_step=0.00844, train/loss_vlb_step=3.98e-5, train/loss_step=0.00844, global_step=4216.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  96%|█████████▋| 1164/1208 [33:00<01:14,  1.70s/it, loss=0.199, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000526, train/loss_step=0.154, global_step=4216.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  96%|█████████▋| 1165/1208 [33:01<01:13,  1.70s/it, loss=0.199, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000526, train/loss_step=0.154, global_step=4216.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  96%|█████████▋| 1165/1208 [33:01<01:13,  1.70s/it, loss=0.213, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00345, train/loss_step=0.430, global_step=4217.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  97%|█████████▋| 1166/1208 [33:02<01:11,  1.70s/it, loss=0.213, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00345, train/loss_step=0.430, global_step=4217.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  97%|█████████▋| 1166/1208 [33:02<01:11,  1.70s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000101, train/loss_step=0.0264, global_step=4217.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  97%|█████████▋| 1167/1208 [33:03<01:09,  1.70s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000101, train/loss_step=0.0264, global_step=4217.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  97%|█████████▋| 1167/1208 [33:03<01:09,  1.70s/it, loss=0.194, v_num=0, train/loss_simple_step=0.084, train/loss_vlb_step=0.000289, train/loss_step=0.084, global_step=4217.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  97%|█████████▋| 1168/1208 [33:07<01:08,  1.70s/it, loss=0.194, v_num=0, train/loss_simple_step=0.084, train/loss_vlb_step=0.000289, train/loss_step=0.084, global_step=4217.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  97%|█████████▋| 1168/1208 [33:07<01:08,  1.70s/it, loss=0.204, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00109, train/loss_step=0.269, global_step=4217.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  97%|█████████▋| 1169/1208 [33:08<01:06,  1.70s/it, loss=0.204, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00109, train/loss_step=0.269, global_step=4217.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  97%|█████████▋| 1169/1208 [33:08<01:06,  1.70s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0566, train/loss_vlb_step=0.000201, train/loss_step=0.0566, global_step=4218.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  97%|█████████▋| 1170/1208 [33:09<01:04,  1.70s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0566, train/loss_vlb_step=0.000201, train/loss_step=0.0566, global_step=4218.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  97%|█████████▋| 1170/1208 [33:09<01:04,  1.70s/it, loss=0.189, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000952, train/loss_step=0.228, global_step=4218.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  97%|█████████▋| 1171/1208 [33:10<01:02,  1.70s/it, loss=0.189, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000952, train/loss_step=0.228, global_step=4218.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  97%|█████████▋| 1171/1208 [33:10<01:02,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=1.33e-5, train/loss_step=0.00229, global_step=4218.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  97%|█████████▋| 1172/1208 [33:13<01:01,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=1.33e-5, train/loss_step=0.00229, global_step=4218.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  97%|█████████▋| 1172/1208 [33:13<01:01,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00584, train/loss_vlb_step=2.9e-5, train/loss_step=0.00584, global_step=4218.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  97%|█████████▋| 1173/1208 [33:14<00:59,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00584, train/loss_vlb_step=2.9e-5, train/loss_step=0.00584, global_step=4218.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  97%|█████████▋| 1173/1208 [33:14<00:59,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000384, train/loss_step=0.116, global_step=4219.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  97%|█████████▋| 1174/1208 [33:15<00:57,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000384, train/loss_step=0.116, global_step=4219.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  97%|█████████▋| 1174/1208 [33:15<00:57,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.000965, train/loss_step=0.251, global_step=4219.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  97%|█████████▋| 1175/1208 [33:16<00:56,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.000965, train/loss_step=0.251, global_step=4219.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  97%|█████████▋| 1175/1208 [33:16<00:56,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000133, train/loss_step=0.0344, global_step=4219.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  97%|█████████▋| 1176/1208 [33:20<00:54,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000133, train/loss_step=0.0344, global_step=4219.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  97%|█████████▋| 1176/1208 [33:20<00:54,  1.70s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00809, train/loss_vlb_step=3.85e-5, train/loss_step=0.00809, global_step=4219.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  97%|█████████▋| 1177/1208 [33:21<00:52,  1.70s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00809, train/loss_vlb_step=3.85e-5, train/loss_step=0.00809, global_step=4219.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  97%|█████████▋| 1177/1208 [33:21<00:52,  1.70s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0879, train/loss_vlb_step=0.000293, train/loss_step=0.0879, global_step=4220.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  98%|█████████▊| 1178/1208 [33:22<00:50,  1.70s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0879, train/loss_vlb_step=0.000293, train/loss_step=0.0879, global_step=4220.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  98%|█████████▊| 1178/1208 [33:22<00:50,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0838, train/loss_vlb_step=0.00028, train/loss_step=0.0838, global_step=4220.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  98%|█████████▊| 1179/1208 [33:23<00:49,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0838, train/loss_vlb_step=0.00028, train/loss_step=0.0838, global_step=4220.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  98%|█████████▊| 1179/1208 [33:23<00:49,  1.70s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.0565, train/loss_vlb_step=0.000199, train/loss_step=0.0565, global_step=4220.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  98%|█████████▊| 1180/1208 [33:26<00:47,  1.70s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.0565, train/loss_vlb_step=0.000199, train/loss_step=0.0565, global_step=4220.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  98%|█████████▊| 1180/1208 [33:26<00:47,  1.70s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=7.81e-5, train/loss_step=0.0195, global_step=4220.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  98%|█████████▊| 1181/1208 [33:27<00:45,  1.70s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=7.81e-5, train/loss_step=0.0195, global_step=4220.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  98%|█████████▊| 1181/1208 [33:27<00:45,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0997, train/loss_vlb_step=0.00033, train/loss_step=0.0997, global_step=4221.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  98%|█████████▊| 1182/1208 [33:28<00:44,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0997, train/loss_vlb_step=0.00033, train/loss_step=0.0997, global_step=4221.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  98%|█████████▊| 1182/1208 [33:28<00:44,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00583, train/loss_vlb_step=3.08e-5, train/loss_step=0.00583, global_step=4221.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  98%|█████████▊| 1183/1208 [33:29<00:42,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00583, train/loss_vlb_step=3.08e-5, train/loss_step=0.00583, global_step=4221.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  98%|█████████▊| 1183/1208 [33:29<00:42,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.000231, train/loss_step=0.0665, global_step=4221.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  98%|█████████▊| 1184/1208 [33:32<00:40,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.000231, train/loss_step=0.0665, global_step=4221.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  98%|█████████▊| 1184/1208 [33:32<00:40,  1.70s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.53e-5, train/loss_step=0.0231, global_step=4221.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  98%|█████████▊| 1185/1208 [33:33<00:39,  1.70s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.53e-5, train/loss_step=0.0231, global_step=4221.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  98%|█████████▊| 1185/1208 [33:33<00:39,  1.70s/it, loss=0.0842, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000554, train/loss_step=0.160, global_step=4222.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  98%|█████████▊| 1186/1208 [33:35<00:37,  1.70s/it, loss=0.0842, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000554, train/loss_step=0.160, global_step=4222.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  98%|█████████▊| 1186/1208 [33:35<00:37,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.636, train/loss_vlb_step=0.0187, train/loss_step=0.636, global_step=4222.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13:  98%|█████████▊| 1187/1208 [33:36<00:35,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.636, train/loss_vlb_step=0.0187, train/loss_step=0.636, global_step=4222.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  98%|█████████▊| 1187/1208 [33:36<00:35,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.64e-5, train/loss_step=0.020, global_step=4222.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  98%|█████████▊| 1188/1208 [33:39<00:33,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.64e-5, train/loss_step=0.020, global_step=4222.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  98%|█████████▊| 1188/1208 [33:39<00:33,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00124, train/loss_step=0.289, global_step=4222.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  98%|█████████▊| 1189/1208 [33:40<00:32,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00124, train/loss_step=0.289, global_step=4222.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  98%|█████████▊| 1189/1208 [33:40<00:32,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00153, train/loss_step=0.302, global_step=4223.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  99%|█████████▊| 1190/1208 [33:41<00:30,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00153, train/loss_step=0.302, global_step=4223.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  99%|█████████▊| 1190/1208 [33:41<00:30,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=4223.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  99%|█████████▊| 1191/1208 [33:42<00:28,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=4223.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  99%|█████████▊| 1191/1208 [33:42<00:28,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000119, train/loss_step=0.0297, global_step=4223.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  99%|█████████▊| 1192/1208 [33:45<00:27,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000119, train/loss_step=0.0297, global_step=4223.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  99%|█████████▊| 1192/1208 [33:45<00:27,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0864, train/loss_vlb_step=0.000291, train/loss_step=0.0864, global_step=4223.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  99%|█████████▉| 1193/1208 [33:46<00:25,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0864, train/loss_vlb_step=0.000291, train/loss_step=0.0864, global_step=4223.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  99%|█████████▉| 1193/1208 [33:46<00:25,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=0.0001, train/loss_step=0.025, global_step=4224.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]     Epoch 13:  99%|█████████▉| 1194/1208 [33:47<00:23,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=0.0001, train/loss_step=0.025, global_step=4224.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  99%|█████████▉| 1194/1208 [33:47<00:23,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.31e-5, train/loss_step=0.012, global_step=4224.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  99%|█████████▉| 1195/1208 [33:48<00:22,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.31e-5, train/loss_step=0.012, global_step=4224.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  99%|█████████▉| 1195/1208 [33:48<00:22,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000159, train/loss_step=0.0449, global_step=4224.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  99%|█████████▉| 1196/1208 [33:52<00:20,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000159, train/loss_step=0.0449, global_step=4224.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  99%|█████████▉| 1196/1208 [33:52<00:20,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000432, train/loss_step=0.129, global_step=4224.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13:  99%|█████████▉| 1197/1208 [33:53<00:18,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000432, train/loss_step=0.129, global_step=4224.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  99%|█████████▉| 1197/1208 [33:53<00:18,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00175, train/loss_step=0.336, global_step=4225.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13:  99%|█████████▉| 1198/1208 [33:54<00:16,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00175, train/loss_step=0.336, global_step=4225.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  99%|█████████▉| 1198/1208 [33:54<00:16,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00104, train/loss_step=0.249, global_step=4225.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  99%|█████████▉| 1199/1208 [33:55<00:15,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00104, train/loss_step=0.249, global_step=4225.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  99%|█████████▉| 1199/1208 [33:55<00:15,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0571, train/loss_vlb_step=0.000193, train/loss_step=0.0571, global_step=4225.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  99%|█████████▉| 1200/1208 [33:58<00:13,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0571, train/loss_vlb_step=0.000193, train/loss_step=0.0571, global_step=4225.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  99%|█████████▉| 1200/1208 [33:58<00:13,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000475, train/loss_step=0.139, global_step=4225.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.75it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.76it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.76it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.76it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.79it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.80it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.80it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.75it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.75it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.75it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 13:  99%|█████████▉| 1201/1208 [34:29<00:12,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000475, train/loss_step=0.139, global_step=4225.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13:  99%|█████████▉| 1201/1208 [34:29<00:12,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.429, train/loss_vlb_step=0.004, train/loss_step=0.429, global_step=4226.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]   Epoch 13: 100%|█████████▉| 1202/1208 [34:30<00:10,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.429, train/loss_vlb_step=0.004, train/loss_step=0.429, global_step=4226.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13: 100%|█████████▉| 1202/1208 [34:30<00:10,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00233, train/loss_step=0.346, global_step=4226.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13: 100%|█████████▉| 1203/1208 [34:31<00:08,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00233, train/loss_step=0.346, global_step=4226.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13: 100%|█████████▉| 1203/1208 [34:31<00:08,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0841, train/loss_vlb_step=0.000285, train/loss_step=0.0841, global_step=4226.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13: 100%|█████████▉| 1204/1208 [34:34<00:06,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0841, train/loss_vlb_step=0.000285, train/loss_step=0.0841, global_step=4226.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13: 100%|█████████▉| 1204/1208 [34:34<00:06,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000573, train/loss_step=0.166, global_step=4226.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]  Epoch 13: 100%|█████████▉| 1205/1208 [34:35<00:05,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000573, train/loss_step=0.166, global_step=4226.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13: 100%|█████████▉| 1205/1208 [34:35<00:05,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.89e-5, train/loss_step=0.010, global_step=4227.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142] Epoch 13: 100%|█████████▉| 1206/1208 [34:36<00:03,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.89e-5, train/loss_step=0.010, global_step=4227.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13: 100%|█████████▉| 1206/1208 [34:36<00:03,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00196, train/loss_step=0.355, global_step=4227.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13: 100%|█████████▉| 1207/1208 [34:37<00:01,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00196, train/loss_step=0.355, global_step=4227.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13: 100%|█████████▉| 1207/1208 [34:37<00:01,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000992, train/loss_step=0.250, global_step=4227.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13: 100%|██████████| 1208/1208 [34:42<00:00,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000992, train/loss_step=0.250, global_step=4227.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 13: 100%|██████████| 1208/1208 [34:42<00:00,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000626, train/loss_step=0.181, global_step=4227.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]
+
+
+Epoch 13:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.168, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000626, train/loss_step=0.181, global_step=4227.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]           Epoch 14:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.168, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000626, train/loss_step=0.181, global_step=4227.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][AData shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.76it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.74it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.83it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.83it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:22,  1.66it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.76it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.71it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.73it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.76it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.82it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.83it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:13,  1.81it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.78it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.78it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.78it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.78it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.80it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.79it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.77it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.83it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.83it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.75it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.83it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.83it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 14:   0%|          | 1/1208 [00:32<11:01:19, 32.87s/it, loss=0.168, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000626, train/loss_step=0.181, global_step=4227.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00292, train/loss_epoch=0.142]Epoch 14:   0%|          | 1/1208 [00:32<11:01:21, 32.88s/it, loss=0.158, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000386, train/loss_step=0.116, global_step=4228.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   0%|          | 2/1208 [00:33<5:40:45, 16.95s/it, loss=0.158, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000386, train/loss_step=0.116, global_step=4228.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:   0%|          | 2/1208 [00:33<5:40:46, 16.95s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000143, train/loss_step=0.0392, global_step=4228.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   0%|          | 3/1208 [00:34<3:53:51, 11.64s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000143, train/loss_step=0.0392, global_step=4228.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   0%|          | 3/1208 [00:34<3:53:52, 11.65s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.31e-5, train/loss_step=0.00215, global_step=4228.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   0%|          | 4/1208 [00:38<3:10:45,  9.51s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.31e-5, train/loss_step=0.00215, global_step=4228.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   0%|          | 4/1208 [00:38<3:10:46,  9.51s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0893, train/loss_vlb_step=0.000294, train/loss_step=0.0893, global_step=4228.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:   0%|          | 5/1208 [00:39<2:36:46,  7.82s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0893, train/loss_vlb_step=0.000294, train/loss_step=0.0893, global_step=4228.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   0%|          | 5/1208 [00:39<2:36:46,  7.82s/it, loss=0.172, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00291, train/loss_step=0.401, global_step=4229.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:   0%|          | 6/1208 [00:40<2:13:59,  6.69s/it, loss=0.172, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00291, train/loss_step=0.401, global_step=4229.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   0%|          | 6/1208 [00:40<2:13:59,  6.69s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0945, train/loss_vlb_step=0.000312, train/loss_step=0.0945, global_step=4229.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   1%|          | 7/1208 [00:41<1:57:43,  5.88s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0945, train/loss_vlb_step=0.000312, train/loss_step=0.0945, global_step=4229.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   1%|          | 7/1208 [00:41<1:57:43,  5.88s/it, loss=0.176, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.00016, train/loss_step=0.045, global_step=4229.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:   1%|          | 8/1208 [00:44<1:51:04,  5.55s/it, loss=0.176, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.00016, train/loss_step=0.045, global_step=4229.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   1%|          | 8/1208 [00:44<1:51:04,  5.55s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.32e-5, train/loss_step=0.0216, global_step=4229.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   1%|          | 9/1208 [00:45<1:41:00,  5.05s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.32e-5, train/loss_step=0.0216, global_step=4229.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   1%|          | 9/1208 [00:45<1:41:01,  5.06s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.24e-5, train/loss_step=0.00213, global_step=4230.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   1%|          | 10/1208 [00:46<1:32:56,  4.65s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.24e-5, train/loss_step=0.00213, global_step=4230.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   1%|          | 10/1208 [00:46<1:32:56,  4.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00362, train/loss_step=0.369, global_step=4230.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]     Epoch 14:   1%|          | 11/1208 [00:47<1:26:18,  4.33s/it, loss=0.16, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00362, train/loss_step=0.369, global_step=4230.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   1%|          | 11/1208 [00:47<1:26:18,  4.33s/it, loss=0.186, v_num=0, train/loss_simple_step=0.577, train/loss_vlb_step=0.0121, train/loss_step=0.577, global_step=4230.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   1%|          | 12/1208 [00:50<1:24:25,  4.24s/it, loss=0.186, v_num=0, train/loss_simple_step=0.577, train/loss_vlb_step=0.0121, train/loss_step=0.577, global_step=4230.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   1%|          | 12/1208 [00:50<1:24:25,  4.24s/it, loss=0.189, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000758, train/loss_step=0.196, global_step=4230.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   1%|          | 13/1208 [00:51<1:19:31,  3.99s/it, loss=0.189, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000758, train/loss_step=0.196, global_step=4230.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   1%|          | 13/1208 [00:51<1:19:31,  3.99s/it, loss=0.181, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00176, train/loss_step=0.280, global_step=4231.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:   1%|          | 14/1208 [00:52<1:15:15,  3.78s/it, loss=0.181, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00176, train/loss_step=0.280, global_step=4231.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   1%|          | 14/1208 [00:52<1:15:15,  3.78s/it, loss=0.166, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.000125, train/loss_step=0.034, global_step=4231.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   1%|          | 15/1208 [00:53<1:11:33,  3.60s/it, loss=0.166, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.000125, train/loss_step=0.034, global_step=4231.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   1%|          | 15/1208 [00:53<1:11:33,  3.60s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=5.89e-5, train/loss_step=0.0138, global_step=4231.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   1%|▏         | 16/1208 [00:57<1:11:06,  3.58s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=5.89e-5, train/loss_step=0.0138, global_step=4231.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   1%|▏         | 16/1208 [00:57<1:11:06,  3.58s/it, loss=0.155, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.79e-5, train/loss_step=0.018, global_step=4231.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:   1%|▏         | 17/1208 [00:58<1:08:05,  3.43s/it, loss=0.155, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.79e-5, train/loss_step=0.018, global_step=4231.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   1%|▏         | 17/1208 [00:58<1:08:06,  3.43s/it, loss=0.157, v_num=0, train/loss_simple_step=0.054, train/loss_vlb_step=0.000191, train/loss_step=0.054, global_step=4232.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   1%|▏         | 18/1208 [00:59<1:05:24,  3.30s/it, loss=0.157, v_num=0, train/loss_simple_step=0.054, train/loss_vlb_step=0.000191, train/loss_step=0.054, global_step=4232.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   1%|▏         | 18/1208 [00:59<1:05:24,  3.30s/it, loss=0.148, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000713, train/loss_step=0.185, global_step=4232.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   2%|▏         | 19/1208 [01:00<1:02:58,  3.18s/it, loss=0.148, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000713, train/loss_step=0.185, global_step=4232.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   2%|▏         | 19/1208 [01:00<1:02:59,  3.18s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.76e-5, train/loss_step=0.00303, global_step=4232.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   2%|▏         | 20/1208 [01:03<1:03:03,  3.18s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.76e-5, train/loss_step=0.00303, global_step=4232.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   2%|▏         | 20/1208 [01:03<1:03:03,  3.19s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.00012, train/loss_step=0.0317, global_step=4232.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:   2%|▏         | 21/1208 [01:04<1:01:00,  3.08s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.00012, train/loss_step=0.0317, global_step=4232.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   2%|▏         | 21/1208 [01:04<1:01:00,  3.08s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0841, train/loss_vlb_step=0.000284, train/loss_step=0.0841, global_step=4233.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   2%|▏         | 22/1208 [01:05<59:07,  2.99s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0841, train/loss_vlb_step=0.000284, train/loss_step=0.0841, global_step=4233.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:   2%|▏         | 22/1208 [01:05<59:07,  2.99s/it, loss=0.136, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000794, train/loss_step=0.209, global_step=4233.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:   2%|▏         | 23/1208 [01:06<57:23,  2.91s/it, loss=0.136, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000794, train/loss_step=0.209, global_step=4233.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   2%|▏         | 23/1208 [01:06<57:23,  2.91s/it, loss=0.144, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000581, train/loss_step=0.168, global_step=4233.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   2%|▏         | 24/1208 [01:10<57:37,  2.92s/it, loss=0.144, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000581, train/loss_step=0.168, global_step=4233.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   2%|▏         | 24/1208 [01:10<57:37,  2.92s/it, loss=0.16, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00292, train/loss_step=0.414, global_step=4233.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:   2%|▏         | 25/1208 [01:11<56:05,  2.85s/it, loss=0.16, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00292, train/loss_step=0.414, global_step=4233.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   2%|▏         | 25/1208 [01:11<56:06,  2.85s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0559, train/loss_vlb_step=0.000195, train/loss_step=0.0559, global_step=4234.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   2%|▏         | 26/1208 [01:12<54:40,  2.78s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0559, train/loss_vlb_step=0.000195, train/loss_step=0.0559, global_step=4234.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   2%|▏         | 26/1208 [01:12<54:41,  2.78s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=6.39e-5, train/loss_step=0.0133, global_step=4234.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:   2%|▏         | 27/1208 [01:13<53:21,  2.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=6.39e-5, train/loss_step=0.0133, global_step=4234.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   2%|▏         | 27/1208 [01:13<53:21,  2.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0986, train/loss_vlb_step=0.000324, train/loss_step=0.0986, global_step=4234.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   2%|▏         | 28/1208 [01:16<53:40,  2.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0986, train/loss_vlb_step=0.000324, train/loss_step=0.0986, global_step=4234.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   2%|▏         | 28/1208 [01:16<53:40,  2.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000614, train/loss_step=0.177, global_step=4234.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:   2%|▏         | 29/1208 [01:17<52:30,  2.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000614, train/loss_step=0.177, global_step=4234.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   2%|▏         | 29/1208 [01:17<52:30,  2.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000914, train/loss_step=0.238, global_step=4235.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   2%|▏         | 30/1208 [01:18<51:23,  2.62s/it, loss=0.161, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000914, train/loss_step=0.238, global_step=4235.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   2%|▏         | 30/1208 [01:18<51:23,  2.62s/it, loss=0.153, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000739, train/loss_step=0.204, global_step=4235.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   3%|▎         | 31/1208 [01:19<50:20,  2.57s/it, loss=0.153, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000739, train/loss_step=0.204, global_step=4235.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   3%|▎         | 31/1208 [01:19<50:20,  2.57s/it, loss=0.125, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.23e-5, train/loss_step=0.015, global_step=4235.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:   3%|▎         | 32/1208 [01:22<50:40,  2.59s/it, loss=0.125, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.23e-5, train/loss_step=0.015, global_step=4235.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   3%|▎         | 32/1208 [01:22<50:40,  2.59s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=2.24e-5, train/loss_step=0.00421, global_step=4235.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   3%|▎         | 33/1208 [01:23<49:43,  2.54s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=2.24e-5, train/loss_step=0.00421, global_step=4235.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   3%|▎         | 33/1208 [01:23<49:43,  2.54s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0966, train/loss_vlb_step=0.00032, train/loss_step=0.0966, global_step=4236.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:   3%|▎         | 34/1208 [01:24<48:48,  2.49s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0966, train/loss_vlb_step=0.00032, train/loss_step=0.0966, global_step=4236.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   3%|▎         | 34/1208 [01:24<48:48,  2.49s/it, loss=0.109, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.00034, train/loss_step=0.103, global_step=4236.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:   3%|▎         | 35/1208 [01:25<47:57,  2.45s/it, loss=0.109, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.00034, train/loss_step=0.103, global_step=4236.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   3%|▎         | 35/1208 [01:25<47:57,  2.45s/it, loss=0.126, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.002, train/loss_step=0.342, global_step=4236.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:   3%|▎         | 36/1208 [01:29<48:20,  2.47s/it, loss=0.126, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.002, train/loss_step=0.342, global_step=4236.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   3%|▎         | 36/1208 [01:29<48:20,  2.47s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0761, train/loss_vlb_step=0.000253, train/loss_step=0.0761, global_step=4236.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   3%|▎         | 37/1208 [01:30<47:33,  2.44s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0761, train/loss_vlb_step=0.000253, train/loss_step=0.0761, global_step=4236.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   3%|▎         | 37/1208 [01:30<47:33,  2.44s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.00012, train/loss_step=0.0306, global_step=4237.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:   3%|▎         | 38/1208 [01:31<46:47,  2.40s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.00012, train/loss_step=0.0306, global_step=4237.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   3%|▎         | 38/1208 [01:31<46:47,  2.40s/it, loss=0.126, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000509, train/loss_step=0.149, global_step=4237.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:   3%|▎         | 39/1208 [01:32<46:04,  2.36s/it, loss=0.126, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000509, train/loss_step=0.149, global_step=4237.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   3%|▎         | 39/1208 [01:32<46:04,  2.36s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.62e-5, train/loss_step=0.00292, global_step=4237.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   3%|▎         | 40/1208 [01:35<46:28,  2.39s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.62e-5, train/loss_step=0.00292, global_step=4237.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   3%|▎         | 40/1208 [01:35<46:28,  2.39s/it, loss=0.149, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00738, train/loss_step=0.499, global_step=4237.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:   3%|▎         | 41/1208 [01:36<45:48,  2.35s/it, loss=0.149, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00738, train/loss_step=0.499, global_step=4237.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   3%|▎         | 41/1208 [01:36<45:48,  2.35s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000149, train/loss_step=0.0402, global_step=4238.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   3%|▎         | 42/1208 [01:37<45:09,  2.32s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000149, train/loss_step=0.0402, global_step=4238.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   3%|▎         | 42/1208 [01:37<45:09,  2.32s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0932, train/loss_vlb_step=0.000307, train/loss_step=0.0932, global_step=4238.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   4%|▎         | 43/1208 [01:38<44:32,  2.29s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0932, train/loss_vlb_step=0.000307, train/loss_step=0.0932, global_step=4238.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   4%|▎         | 43/1208 [01:38<44:32,  2.29s/it, loss=0.14, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000463, train/loss_step=0.138, global_step=4238.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:   4%|▎         | 44/1208 [01:41<44:54,  2.32s/it, loss=0.14, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000463, train/loss_step=0.138, global_step=4238.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   4%|▎         | 44/1208 [01:41<44:55,  2.32s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=1.66e-5, train/loss_step=0.00302, global_step=4238.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   4%|▎         | 45/1208 [01:42<44:20,  2.29s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=1.66e-5, train/loss_step=0.00302, global_step=4238.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   4%|▎         | 45/1208 [01:42<44:20,  2.29s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00463, train/loss_vlb_step=2.42e-5, train/loss_step=0.00463, global_step=4239.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   4%|▍         | 46/1208 [01:43<43:46,  2.26s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00463, train/loss_vlb_step=2.42e-5, train/loss_step=0.00463, global_step=4239.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   4%|▍         | 46/1208 [01:43<43:46,  2.26s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.31e-5, train/loss_step=0.0199, global_step=4239.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:   4%|▍         | 47/1208 [01:45<43:14,  2.23s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.31e-5, train/loss_step=0.0199, global_step=4239.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   4%|▍         | 47/1208 [01:45<43:14,  2.23s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00535, train/loss_vlb_step=2.68e-5, train/loss_step=0.00535, global_step=4239.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   4%|▍         | 48/1208 [01:48<43:36,  2.26s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00535, train/loss_vlb_step=2.68e-5, train/loss_step=0.00535, global_step=4239.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   4%|▍         | 48/1208 [01:48<43:36,  2.26s/it, loss=0.108, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=4239.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:   4%|▍         | 49/1208 [01:49<43:06,  2.23s/it, loss=0.108, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=4239.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   4%|▍         | 49/1208 [01:49<43:06,  2.23s/it, loss=0.105, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000556, train/loss_step=0.162, global_step=4240.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   4%|▍         | 50/1208 [01:50<42:36,  2.21s/it, loss=0.105, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000556, train/loss_step=0.162, global_step=4240.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   4%|▍         | 50/1208 [01:50<42:36,  2.21s/it, loss=0.095, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.91e-5, train/loss_step=0.0101, global_step=4240.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   4%|▍         | 51/1208 [01:51<42:07,  2.18s/it, loss=0.095, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.91e-5, train/loss_step=0.0101, global_step=4240.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   4%|▍         | 51/1208 [01:51<42:07,  2.18s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.00011, train/loss_step=0.0283, global_step=4240.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   4%|▍         | 52/1208 [01:54<42:28,  2.20s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.00011, train/loss_step=0.0283, global_step=4240.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   4%|▍         | 52/1208 [01:54<42:28,  2.20s/it, loss=0.11, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00171, train/loss_step=0.287, global_step=4240.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:   4%|▍         | 53/1208 [01:55<42:01,  2.18s/it, loss=0.11, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00171, train/loss_step=0.287, global_step=4240.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   4%|▍         | 53/1208 [01:55<42:01,  2.18s/it, loss=0.12, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00159, train/loss_step=0.296, global_step=4241.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   4%|▍         | 54/1208 [01:56<41:35,  2.16s/it, loss=0.12, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00159, train/loss_step=0.296, global_step=4241.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   4%|▍         | 54/1208 [01:56<41:35,  2.16s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000133, train/loss_step=0.0373, global_step=4241.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   5%|▍         | 55/1208 [01:57<41:09,  2.14s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000133, train/loss_step=0.0373, global_step=4241.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   5%|▍         | 55/1208 [01:57<41:09,  2.14s/it, loss=0.122, v_num=0, train/loss_simple_step=0.461, train/loss_vlb_step=0.00441, train/loss_step=0.461, global_step=4241.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:   5%|▍         | 56/1208 [02:00<41:29,  2.16s/it, loss=0.122, v_num=0, train/loss_simple_step=0.461, train/loss_vlb_step=0.00441, train/loss_step=0.461, global_step=4241.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   5%|▍         | 56/1208 [02:00<41:29,  2.16s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.62e-5, train/loss_step=0.00288, global_step=4241.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   5%|▍         | 57/1208 [02:02<41:04,  2.14s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.62e-5, train/loss_step=0.00288, global_step=4241.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   5%|▍         | 57/1208 [02:02<41:04,  2.14s/it, loss=0.124, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000483, train/loss_step=0.143, global_step=4242.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:   5%|▍         | 58/1208 [02:03<40:40,  2.12s/it, loss=0.124, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000483, train/loss_step=0.143, global_step=4242.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   5%|▍         | 58/1208 [02:03<40:40,  2.12s/it, loss=0.132, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00147, train/loss_step=0.300, global_step=4242.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:   5%|▍         | 59/1208 [02:04<40:17,  2.10s/it, loss=0.132, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00147, train/loss_step=0.300, global_step=4242.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   5%|▍         | 59/1208 [02:04<40:17,  2.10s/it, loss=0.142, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000759, train/loss_step=0.204, global_step=4242.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   5%|▍         | 60/1208 [02:07<40:36,  2.12s/it, loss=0.142, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000759, train/loss_step=0.204, global_step=4242.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   5%|▍         | 60/1208 [02:07<40:36,  2.12s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0939, train/loss_vlb_step=0.000312, train/loss_step=0.0939, global_step=4242.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   5%|▌         | 61/1208 [02:08<40:14,  2.11s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0939, train/loss_vlb_step=0.000312, train/loss_step=0.0939, global_step=4242.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   5%|▌         | 61/1208 [02:08<40:14,  2.11s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.82e-5, train/loss_step=0.0132, global_step=4243.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:   5%|▌         | 62/1208 [02:09<39:52,  2.09s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.82e-5, train/loss_step=0.0132, global_step=4243.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   5%|▌         | 62/1208 [02:09<39:52,  2.09s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.12e-5, train/loss_step=0.0109, global_step=4243.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   5%|▌         | 63/1208 [02:10<39:31,  2.07s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.12e-5, train/loss_step=0.0109, global_step=4243.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   5%|▌         | 63/1208 [02:10<39:31,  2.07s/it, loss=0.138, v_num=0, train/loss_simple_step=0.563, train/loss_vlb_step=0.00477, train/loss_step=0.563, global_step=4243.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:   5%|▌         | 64/1208 [02:13<39:50,  2.09s/it, loss=0.138, v_num=0, train/loss_simple_step=0.563, train/loss_vlb_step=0.00477, train/loss_step=0.563, global_step=4243.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   5%|▌         | 64/1208 [02:13<39:50,  2.09s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0631, train/loss_vlb_step=0.000212, train/loss_step=0.0631, global_step=4243.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   5%|▌         | 65/1208 [02:14<39:30,  2.07s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0631, train/loss_vlb_step=0.000212, train/loss_step=0.0631, global_step=4243.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   5%|▌         | 65/1208 [02:14<39:30,  2.07s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.23e-5, train/loss_step=0.00211, global_step=4244.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   5%|▌         | 66/1208 [02:15<39:10,  2.06s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.23e-5, train/loss_step=0.00211, global_step=4244.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   5%|▌         | 66/1208 [02:15<39:10,  2.06s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.51e-5, train/loss_step=0.0233, global_step=4244.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:   6%|▌         | 67/1208 [02:16<38:50,  2.04s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.51e-5, train/loss_step=0.0233, global_step=4244.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   6%|▌         | 67/1208 [02:16<38:50,  2.04s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.89e-5, train/loss_step=0.0209, global_step=4244.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   6%|▌         | 68/1208 [02:20<39:09,  2.06s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.89e-5, train/loss_step=0.0209, global_step=4244.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   6%|▌         | 68/1208 [02:20<39:09,  2.06s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=9.49e-6, train/loss_step=0.00156, global_step=4244.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   6%|▌         | 69/1208 [02:21<38:51,  2.05s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=9.49e-6, train/loss_step=0.00156, global_step=4244.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   6%|▌         | 69/1208 [02:21<38:51,  2.05s/it, loss=0.153, v_num=0, train/loss_simple_step=0.495, train/loss_vlb_step=0.00515, train/loss_step=0.495, global_step=4245.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:   6%|▌         | 70/1208 [02:22<38:32,  2.03s/it, loss=0.153, v_num=0, train/loss_simple_step=0.495, train/loss_vlb_step=0.00515, train/loss_step=0.495, global_step=4245.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   6%|▌         | 70/1208 [02:22<38:32,  2.03s/it, loss=0.157, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=4245.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   6%|▌         | 71/1208 [02:23<38:15,  2.02s/it, loss=0.157, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=4245.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   6%|▌         | 71/1208 [02:23<38:15,  2.02s/it, loss=0.18, v_num=0, train/loss_simple_step=0.477, train/loss_vlb_step=0.00355, train/loss_step=0.477, global_step=4245.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:   6%|▌         | 72/1208 [02:26<38:32,  2.04s/it, loss=0.18, v_num=0, train/loss_simple_step=0.477, train/loss_vlb_step=0.00355, train/loss_step=0.477, global_step=4245.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   6%|▌         | 72/1208 [02:26<38:32,  2.04s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.38e-5, train/loss_step=0.0116, global_step=4245.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   6%|▌         | 73/1208 [02:27<38:15,  2.02s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.38e-5, train/loss_step=0.0116, global_step=4245.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   6%|▌         | 73/1208 [02:27<38:15,  2.02s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.66e-5, train/loss_step=0.0177, global_step=4246.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   6%|▌         | 74/1208 [02:28<37:58,  2.01s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.66e-5, train/loss_step=0.0177, global_step=4246.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   6%|▌         | 74/1208 [02:28<37:58,  2.01s/it, loss=0.156, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000373, train/loss_step=0.111, global_step=4246.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:   6%|▌         | 75/1208 [02:29<37:42,  2.00s/it, loss=0.156, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000373, train/loss_step=0.111, global_step=4246.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   6%|▌         | 75/1208 [02:29<37:42,  2.00s/it, loss=0.14, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000467, train/loss_step=0.138, global_step=4246.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:   6%|▋         | 76/1208 [02:33<37:58,  2.01s/it, loss=0.14, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000467, train/loss_step=0.138, global_step=4246.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   6%|▋         | 76/1208 [02:33<37:58,  2.01s/it, loss=0.166, v_num=0, train/loss_simple_step=0.532, train/loss_vlb_step=0.00441, train/loss_step=0.532, global_step=4246.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   6%|▋         | 77/1208 [02:34<37:42,  2.00s/it, loss=0.166, v_num=0, train/loss_simple_step=0.532, train/loss_vlb_step=0.00441, train/loss_step=0.532, global_step=4246.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   6%|▋         | 77/1208 [02:34<37:42,  2.00s/it, loss=0.166, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000499, train/loss_step=0.149, global_step=4247.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   6%|▋         | 78/1208 [02:35<37:27,  1.99s/it, loss=0.166, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000499, train/loss_step=0.149, global_step=4247.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   6%|▋         | 78/1208 [02:35<37:27,  1.99s/it, loss=0.177, v_num=0, train/loss_simple_step=0.511, train/loss_vlb_step=0.00756, train/loss_step=0.511, global_step=4247.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:   7%|▋         | 79/1208 [02:36<37:11,  1.98s/it, loss=0.177, v_num=0, train/loss_simple_step=0.511, train/loss_vlb_step=0.00756, train/loss_step=0.511, global_step=4247.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   7%|▋         | 79/1208 [02:36<37:11,  1.98s/it, loss=0.179, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000949, train/loss_step=0.239, global_step=4247.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   7%|▋         | 80/1208 [02:39<37:28,  1.99s/it, loss=0.179, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000949, train/loss_step=0.239, global_step=4247.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   7%|▋         | 80/1208 [02:39<37:28,  1.99s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000119, train/loss_step=0.0298, global_step=4247.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   7%|▋         | 81/1208 [02:40<37:13,  1.98s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000119, train/loss_step=0.0298, global_step=4247.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   7%|▋         | 81/1208 [02:40<37:13,  1.98s/it, loss=0.182, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000463, train/loss_step=0.141, global_step=4248.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:   7%|▋         | 82/1208 [02:41<36:58,  1.97s/it, loss=0.182, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000463, train/loss_step=0.141, global_step=4248.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   7%|▋         | 82/1208 [02:41<36:58,  1.97s/it, loss=0.209, v_num=0, train/loss_simple_step=0.552, train/loss_vlb_step=0.0055, train/loss_step=0.552, global_step=4248.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:   7%|▋         | 83/1208 [02:42<36:43,  1.96s/it, loss=0.209, v_num=0, train/loss_simple_step=0.552, train/loss_vlb_step=0.0055, train/loss_step=0.552, global_step=4248.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   7%|▋         | 83/1208 [02:42<36:43,  1.96s/it, loss=0.192, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000844, train/loss_step=0.216, global_step=4248.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   7%|▋         | 84/1208 [02:45<36:58,  1.97s/it, loss=0.192, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000844, train/loss_step=0.216, global_step=4248.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   7%|▋         | 84/1208 [02:45<36:58,  1.97s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.64e-5, train/loss_step=0.00288, global_step=4248.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   7%|▋         | 85/1208 [02:46<36:44,  1.96s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.64e-5, train/loss_step=0.00288, global_step=4248.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   7%|▋         | 85/1208 [02:46<36:44,  1.96s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0696, train/loss_vlb_step=0.000238, train/loss_step=0.0696, global_step=4249.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:   7%|▋         | 86/1208 [02:47<36:30,  1.95s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0696, train/loss_vlb_step=0.000238, train/loss_step=0.0696, global_step=4249.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   7%|▋         | 86/1208 [02:47<36:30,  1.95s/it, loss=0.196, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=4249.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:   7%|▋         | 87/1208 [02:48<36:16,  1.94s/it, loss=0.196, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=4249.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   7%|▋         | 87/1208 [02:48<36:16,  1.94s/it, loss=0.205, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000787, train/loss_step=0.208, global_step=4249.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   7%|▋         | 88/1208 [02:52<36:31,  1.96s/it, loss=0.205, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000787, train/loss_step=0.208, global_step=4249.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   7%|▋         | 88/1208 [02:52<36:31,  1.96s/it, loss=0.206, v_num=0, train/loss_simple_step=0.00718, train/loss_vlb_step=3.54e-5, train/loss_step=0.00718, global_step=4249.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   7%|▋         | 89/1208 [02:53<36:18,  1.95s/it, loss=0.206, v_num=0, train/loss_simple_step=0.00718, train/loss_vlb_step=3.54e-5, train/loss_step=0.00718, global_step=4249.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   7%|▋         | 89/1208 [02:53<36:18,  1.95s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0814, train/loss_vlb_step=0.000268, train/loss_step=0.0814, global_step=4250.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:   7%|▋         | 90/1208 [02:54<36:05,  1.94s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0814, train/loss_vlb_step=0.000268, train/loss_step=0.0814, global_step=4250.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   7%|▋         | 90/1208 [02:54<36:05,  1.94s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0536, train/loss_vlb_step=0.000188, train/loss_step=0.0536, global_step=4250.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   8%|▊         | 91/1208 [02:55<35:52,  1.93s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0536, train/loss_vlb_step=0.000188, train/loss_step=0.0536, global_step=4250.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   8%|▊         | 91/1208 [02:55<35:52,  1.93s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0572, train/loss_vlb_step=0.000203, train/loss_step=0.0572, global_step=4250.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   8%|▊         | 92/1208 [02:58<36:06,  1.94s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0572, train/loss_vlb_step=0.000203, train/loss_step=0.0572, global_step=4250.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   8%|▊         | 92/1208 [02:58<36:06,  1.94s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=1.14e-5, train/loss_step=0.0019, global_step=4250.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:   8%|▊         | 93/1208 [02:59<35:54,  1.93s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=1.14e-5, train/loss_step=0.0019, global_step=4250.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   8%|▊         | 93/1208 [02:59<35:54,  1.93s/it, loss=0.172, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000889, train/loss_step=0.229, global_step=4251.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:   8%|▊         | 94/1208 [03:00<35:42,  1.92s/it, loss=0.172, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000889, train/loss_step=0.229, global_step=4251.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   8%|▊         | 94/1208 [03:00<35:42,  1.92s/it, loss=0.179, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00145, train/loss_step=0.266, global_step=4251.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:   8%|▊         | 95/1208 [03:01<35:30,  1.91s/it, loss=0.179, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00145, train/loss_step=0.266, global_step=4251.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   8%|▊         | 95/1208 [03:01<35:30,  1.91s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.35e-5, train/loss_step=0.0116, global_step=4251.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   8%|▊         | 96/1208 [03:05<35:43,  1.93s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.35e-5, train/loss_step=0.0116, global_step=4251.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   8%|▊         | 96/1208 [03:05<35:43,  1.93s/it, loss=0.161, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00139, train/loss_step=0.287, global_step=4251.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:   8%|▊         | 97/1208 [03:06<35:31,  1.92s/it, loss=0.161, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00139, train/loss_step=0.287, global_step=4251.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   8%|▊         | 97/1208 [03:06<35:31,  1.92s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.66e-5, train/loss_step=0.0105, global_step=4252.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   8%|▊         | 98/1208 [03:07<35:20,  1.91s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.66e-5, train/loss_step=0.0105, global_step=4252.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   8%|▊         | 98/1208 [03:07<35:20,  1.91s/it, loss=0.134, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000406, train/loss_step=0.123, global_step=4252.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:   8%|▊         | 99/1208 [03:08<35:08,  1.90s/it, loss=0.134, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000406, train/loss_step=0.123, global_step=4252.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   8%|▊         | 99/1208 [03:08<35:08,  1.90s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0679, train/loss_vlb_step=0.000232, train/loss_step=0.0679, global_step=4252.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   8%|▊         | 100/1208 [03:11<35:21,  1.91s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0679, train/loss_vlb_step=0.000232, train/loss_step=0.0679, global_step=4252.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   8%|▊         | 100/1208 [03:11<35:21,  1.91s/it, loss=0.144, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00353, train/loss_step=0.388, global_step=4252.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:   8%|▊         | 101/1208 [03:12<35:10,  1.91s/it, loss=0.144, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00353, train/loss_step=0.388, global_step=4252.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   8%|▊         | 101/1208 [03:12<35:10,  1.91s/it, loss=0.172, v_num=0, train/loss_simple_step=0.708, train/loss_vlb_step=0.0455, train/loss_step=0.708, global_step=4253.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:   8%|▊         | 102/1208 [03:13<34:59,  1.90s/it, loss=0.172, v_num=0, train/loss_simple_step=0.708, train/loss_vlb_step=0.0455, train/loss_step=0.708, global_step=4253.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   8%|▊         | 102/1208 [03:13<34:59,  1.90s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00536, train/loss_vlb_step=2.8e-5, train/loss_step=0.00536, global_step=4253.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   9%|▊         | 103/1208 [03:14<34:48,  1.89s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00536, train/loss_vlb_step=2.8e-5, train/loss_step=0.00536, global_step=4253.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   9%|▊         | 103/1208 [03:14<34:48,  1.89s/it, loss=0.14, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=4253.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:   9%|▊         | 104/1208 [03:17<35:00,  1.90s/it, loss=0.14, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=4253.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   9%|▊         | 104/1208 [03:17<35:00,  1.90s/it, loss=0.147, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.00047, train/loss_step=0.141, global_step=4253.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   9%|▊         | 105/1208 [03:18<34:49,  1.89s/it, loss=0.147, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.00047, train/loss_step=0.141, global_step=4253.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   9%|▊         | 105/1208 [03:18<34:49,  1.89s/it, loss=0.176, v_num=0, train/loss_simple_step=0.637, train/loss_vlb_step=0.011, train/loss_step=0.637, global_step=4254.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:   9%|▉         | 106/1208 [03:19<34:39,  1.89s/it, loss=0.176, v_num=0, train/loss_simple_step=0.637, train/loss_vlb_step=0.011, train/loss_step=0.637, global_step=4254.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   9%|▉         | 106/1208 [03:19<34:39,  1.89s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.19e-5, train/loss_step=0.0113, global_step=4254.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   9%|▉         | 107/1208 [03:21<34:28,  1.88s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.19e-5, train/loss_step=0.0113, global_step=4254.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   9%|▉         | 107/1208 [03:21<34:28,  1.88s/it, loss=0.169, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.00055, train/loss_step=0.163, global_step=4254.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:   9%|▉         | 108/1208 [03:24<34:40,  1.89s/it, loss=0.169, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.00055, train/loss_step=0.163, global_step=4254.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   9%|▉         | 108/1208 [03:24<34:40,  1.89s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.39e-5, train/loss_step=0.0118, global_step=4254.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   9%|▉         | 109/1208 [03:25<34:30,  1.88s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.39e-5, train/loss_step=0.0118, global_step=4254.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   9%|▉         | 109/1208 [03:25<34:30,  1.88s/it, loss=0.172, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000467, train/loss_step=0.138, global_step=4255.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:   9%|▉         | 110/1208 [03:26<34:20,  1.88s/it, loss=0.172, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000467, train/loss_step=0.138, global_step=4255.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   9%|▉         | 110/1208 [03:26<34:20,  1.88s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.42e-5, train/loss_step=0.0229, global_step=4255.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   9%|▉         | 111/1208 [03:27<34:09,  1.87s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.42e-5, train/loss_step=0.0229, global_step=4255.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   9%|▉         | 111/1208 [03:27<34:09,  1.87s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000129, train/loss_step=0.0364, global_step=4255.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   9%|▉         | 112/1208 [03:30<34:21,  1.88s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000129, train/loss_step=0.0364, global_step=4255.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   9%|▉         | 112/1208 [03:30<34:21,  1.88s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.27e-5, train/loss_step=0.0116, global_step=4255.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:   9%|▉         | 113/1208 [03:31<34:11,  1.87s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.27e-5, train/loss_step=0.0116, global_step=4255.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   9%|▉         | 113/1208 [03:31<34:12,  1.87s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000163, train/loss_step=0.0448, global_step=4256.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   9%|▉         | 114/1208 [03:32<34:02,  1.87s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000163, train/loss_step=0.0448, global_step=4256.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:   9%|▉         | 114/1208 [03:32<34:02,  1.87s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.13e-5, train/loss_step=0.00192, global_step=4256.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  10%|▉         | 115/1208 [03:33<33:52,  1.86s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.13e-5, train/loss_step=0.00192, global_step=4256.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  10%|▉         | 115/1208 [03:33<33:52,  1.86s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.58e-5, train/loss_step=0.0175, global_step=4256.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  10%|▉         | 116/1208 [03:37<34:03,  1.87s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.58e-5, train/loss_step=0.0175, global_step=4256.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  10%|▉         | 116/1208 [03:37<34:03,  1.87s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00971, train/loss_vlb_step=4.52e-5, train/loss_step=0.00971, global_step=4256.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  10%|▉         | 117/1208 [03:38<33:54,  1.86s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00971, train/loss_vlb_step=4.52e-5, train/loss_step=0.00971, global_step=4256.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  10%|▉         | 117/1208 [03:38<33:54,  1.86s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.000177, train/loss_step=0.0468, global_step=4257.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  10%|▉         | 118/1208 [03:39<33:44,  1.86s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.000177, train/loss_step=0.0468, global_step=4257.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  10%|▉         | 118/1208 [03:39<33:44,  1.86s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00864, train/loss_vlb_step=4.39e-5, train/loss_step=0.00864, global_step=4257.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  10%|▉         | 119/1208 [03:40<33:35,  1.85s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00864, train/loss_vlb_step=4.39e-5, train/loss_step=0.00864, global_step=4257.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  10%|▉         | 119/1208 [03:40<33:35,  1.85s/it, loss=0.147, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00235, train/loss_step=0.405, global_step=4257.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  10%|▉         | 120/1208 [03:43<33:45,  1.86s/it, loss=0.147, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00235, train/loss_step=0.405, global_step=4257.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  10%|▉         | 120/1208 [03:43<33:45,  1.86s/it, loss=0.132, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000329, train/loss_step=0.100, global_step=4257.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  10%|█         | 121/1208 [03:44<33:36,  1.86s/it, loss=0.132, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000329, train/loss_step=0.100, global_step=4257.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  10%|█         | 121/1208 [03:44<33:36,  1.86s/it, loss=0.097, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.24e-5, train/loss_step=0.00204, global_step=4258.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  10%|█         | 122/1208 [03:45<33:27,  1.85s/it, loss=0.097, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.24e-5, train/loss_step=0.00204, global_step=4258.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  10%|█         | 122/1208 [03:45<33:27,  1.85s/it, loss=0.098, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.0001, train/loss_step=0.0262, global_step=4258.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  10%|█         | 123/1208 [03:46<33:18,  1.84s/it, loss=0.098, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.0001, train/loss_step=0.0262, global_step=4258.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  10%|█         | 123/1208 [03:46<33:18,  1.84s/it, loss=0.1, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000574, train/loss_step=0.170, global_step=4258.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  10%|█         | 124/1208 [03:49<33:28,  1.85s/it, loss=0.1, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000574, train/loss_step=0.170, global_step=4258.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  10%|█         | 124/1208 [03:49<33:28,  1.85s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000136, train/loss_step=0.0365, global_step=4258.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  10%|█         | 125/1208 [03:50<33:20,  1.85s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000136, train/loss_step=0.0365, global_step=4258.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  10%|█         | 125/1208 [03:50<33:20,  1.85s/it, loss=0.0655, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.00016, train/loss_step=0.0448, global_step=4259.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  10%|█         | 126/1208 [03:51<33:11,  1.84s/it, loss=0.0655, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.00016, train/loss_step=0.0448, global_step=4259.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  10%|█         | 126/1208 [03:51<33:11,  1.84s/it, loss=0.0692, v_num=0, train/loss_simple_step=0.0856, train/loss_vlb_step=0.000287, train/loss_step=0.0856, global_step=4259.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  11%|█         | 127/1208 [03:52<33:02,  1.83s/it, loss=0.0692, v_num=0, train/loss_simple_step=0.0856, train/loss_vlb_step=0.000287, train/loss_step=0.0856, global_step=4259.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  11%|█         | 127/1208 [03:52<33:02,  1.83s/it, loss=0.0704, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000697, train/loss_step=0.187, global_step=4259.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  11%|█         | 128/1208 [03:56<33:12,  1.84s/it, loss=0.0704, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000697, train/loss_step=0.187, global_step=4259.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  11%|█         | 128/1208 [03:56<33:12,  1.84s/it, loss=0.0763, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000429, train/loss_step=0.130, global_step=4259.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  11%|█         | 129/1208 [03:57<33:04,  1.84s/it, loss=0.0763, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000429, train/loss_step=0.130, global_step=4259.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  11%|█         | 129/1208 [03:57<33:04,  1.84s/it, loss=0.0744, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=4260.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  11%|█         | 130/1208 [03:58<32:55,  1.83s/it, loss=0.0744, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=4260.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  11%|█         | 130/1208 [03:58<32:55,  1.83s/it, loss=0.0737, v_num=0, train/loss_simple_step=0.00873, train/loss_vlb_step=4.16e-5, train/loss_step=0.00873, global_step=4260.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  11%|█         | 131/1208 [03:59<32:47,  1.83s/it, loss=0.0737, v_num=0, train/loss_simple_step=0.00873, train/loss_vlb_step=4.16e-5, train/loss_step=0.00873, global_step=4260.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  11%|█         | 131/1208 [03:59<32:47,  1.83s/it, loss=0.0792, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000491, train/loss_step=0.146, global_step=4260.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  11%|█         | 132/1208 [04:02<32:57,  1.84s/it, loss=0.0792, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000491, train/loss_step=0.146, global_step=4260.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  11%|█         | 132/1208 [04:02<32:57,  1.84s/it, loss=0.0802, v_num=0, train/loss_simple_step=0.0315, train/loss_vlb_step=0.000116, train/loss_step=0.0315, global_step=4260.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  11%|█         | 133/1208 [04:03<32:49,  1.83s/it, loss=0.0802, v_num=0, train/loss_simple_step=0.0315, train/loss_vlb_step=0.000116, train/loss_step=0.0315, global_step=4260.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  11%|█         | 133/1208 [04:03<32:49,  1.83s/it, loss=0.0782, v_num=0, train/loss_simple_step=0.00513, train/loss_vlb_step=2.76e-5, train/loss_step=0.00513, global_step=4261.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  11%|█         | 134/1208 [04:04<32:41,  1.83s/it, loss=0.0782, v_num=0, train/loss_simple_step=0.00513, train/loss_vlb_step=2.76e-5, train/loss_step=0.00513, global_step=4261.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  11%|█         | 134/1208 [04:04<32:41,  1.83s/it, loss=0.0789, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.8e-5, train/loss_step=0.0154, global_step=4261.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  11%|█         | 135/1208 [04:05<32:33,  1.82s/it, loss=0.0789, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.8e-5, train/loss_step=0.0154, global_step=4261.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  11%|█         | 135/1208 [04:05<32:33,  1.82s/it, loss=0.0792, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.74e-5, train/loss_step=0.0239, global_step=4261.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  11%|█▏        | 136/1208 [04:09<32:42,  1.83s/it, loss=0.0792, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.74e-5, train/loss_step=0.0239, global_step=4261.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  11%|█▏        | 136/1208 [04:09<32:42,  1.83s/it, loss=0.0818, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.000208, train/loss_step=0.0615, global_step=4261.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  11%|█▏        | 137/1208 [04:10<32:34,  1.83s/it, loss=0.0818, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.000208, train/loss_step=0.0615, global_step=4261.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  11%|█▏        | 137/1208 [04:10<32:34,  1.83s/it, loss=0.0808, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000106, train/loss_step=0.0272, global_step=4262.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  11%|█▏        | 138/1208 [04:11<32:27,  1.82s/it, loss=0.0808, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000106, train/loss_step=0.0272, global_step=4262.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  11%|█▏        | 138/1208 [04:11<32:27,  1.82s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=4262.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  12%|█▏        | 139/1208 [04:12<32:19,  1.81s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=4262.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  12%|█▏        | 139/1208 [04:12<32:19,  1.81s/it, loss=0.0763, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000718, train/loss_step=0.206, global_step=4262.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  12%|█▏        | 140/1208 [04:15<32:29,  1.82s/it, loss=0.0763, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000718, train/loss_step=0.206, global_step=4262.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  12%|█▏        | 140/1208 [04:15<32:29,  1.82s/it, loss=0.072, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.11e-5, train/loss_step=0.0141, global_step=4262.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  12%|█▏        | 141/1208 [04:16<32:21,  1.82s/it, loss=0.072, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.11e-5, train/loss_step=0.0141, global_step=4262.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  12%|█▏        | 141/1208 [04:16<32:21,  1.82s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.0038, train/loss_step=0.392, global_step=4263.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  12%|█▏        | 142/1208 [04:17<32:14,  1.81s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.0038, train/loss_step=0.392, global_step=4263.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  12%|█▏        | 142/1208 [04:17<32:14,  1.81s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.0602, train/loss_vlb_step=0.000212, train/loss_step=0.0602, global_step=4263.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  12%|█▏        | 143/1208 [04:18<32:06,  1.81s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.0602, train/loss_vlb_step=0.000212, train/loss_step=0.0602, global_step=4263.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  12%|█▏        | 143/1208 [04:18<32:06,  1.81s/it, loss=0.0991, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00145, train/loss_step=0.289, global_step=4263.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  12%|█▏        | 144/1208 [04:21<32:15,  1.82s/it, loss=0.0991, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00145, train/loss_step=0.289, global_step=4263.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  12%|█▏        | 144/1208 [04:21<32:15,  1.82s/it, loss=0.0993, v_num=0, train/loss_simple_step=0.0398, train/loss_vlb_step=0.000144, train/loss_step=0.0398, global_step=4263.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  12%|█▏        | 145/1208 [04:22<32:07,  1.81s/it, loss=0.0993, v_num=0, train/loss_simple_step=0.0398, train/loss_vlb_step=0.000144, train/loss_step=0.0398, global_step=4263.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  12%|█▏        | 145/1208 [04:22<32:07,  1.81s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.42e-5, train/loss_step=0.012, global_step=4264.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  12%|█▏        | 146/1208 [04:24<32:00,  1.81s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.42e-5, train/loss_step=0.012, global_step=4264.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  12%|█▏        | 146/1208 [04:24<32:00,  1.81s/it, loss=0.108, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00131, train/loss_step=0.301, global_step=4264.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  12%|█▏        | 147/1208 [04:25<31:53,  1.80s/it, loss=0.108, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00131, train/loss_step=0.301, global_step=4264.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  12%|█▏        | 147/1208 [04:25<31:53,  1.80s/it, loss=0.1, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.94e-5, train/loss_step=0.021, global_step=4264.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  12%|█▏        | 148/1208 [04:28<32:01,  1.81s/it, loss=0.1, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.94e-5, train/loss_step=0.021, global_step=4264.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  12%|█▏        | 148/1208 [04:28<32:01,  1.81s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.075, train/loss_vlb_step=0.000252, train/loss_step=0.075, global_step=4264.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  12%|█▏        | 149/1208 [04:29<31:54,  1.81s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.075, train/loss_vlb_step=0.000252, train/loss_step=0.075, global_step=4264.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  12%|█▏        | 149/1208 [04:29<31:54,  1.81s/it, loss=0.112, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00194, train/loss_step=0.396, global_step=4265.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  12%|█▏        | 150/1208 [04:30<31:47,  1.80s/it, loss=0.112, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00194, train/loss_step=0.396, global_step=4265.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  12%|█▏        | 150/1208 [04:30<31:47,  1.80s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0919, train/loss_vlb_step=0.000303, train/loss_step=0.0919, global_step=4265.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  12%|█▎        | 151/1208 [04:31<31:40,  1.80s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0919, train/loss_vlb_step=0.000303, train/loss_step=0.0919, global_step=4265.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  12%|█▎        | 151/1208 [04:31<31:40,  1.80s/it, loss=0.124, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00133, train/loss_step=0.306, global_step=4265.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  13%|█▎        | 152/1208 [04:34<31:48,  1.81s/it, loss=0.124, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00133, train/loss_step=0.306, global_step=4265.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  13%|█▎        | 152/1208 [04:34<31:48,  1.81s/it, loss=0.138, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00173, train/loss_step=0.313, global_step=4265.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  13%|█▎        | 153/1208 [04:35<31:41,  1.80s/it, loss=0.138, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00173, train/loss_step=0.313, global_step=4265.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  13%|█▎        | 153/1208 [04:35<31:41,  1.80s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.39e-5, train/loss_step=0.0118, global_step=4266.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  13%|█▎        | 154/1208 [04:36<31:34,  1.80s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.39e-5, train/loss_step=0.0118, global_step=4266.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  13%|█▎        | 154/1208 [04:36<31:34,  1.80s/it, loss=0.139, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000111, train/loss_step=0.029, global_step=4266.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  13%|█▎        | 155/1208 [04:37<31:27,  1.79s/it, loss=0.139, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000111, train/loss_step=0.029, global_step=4266.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  13%|█▎        | 155/1208 [04:37<31:27,  1.79s/it, loss=0.156, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00214, train/loss_step=0.352, global_step=4266.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  13%|█▎        | 156/1208 [04:41<31:36,  1.80s/it, loss=0.156, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00214, train/loss_step=0.352, global_step=4266.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  13%|█▎        | 156/1208 [04:41<31:36,  1.80s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0827, train/loss_vlb_step=0.000278, train/loss_step=0.0827, global_step=4266.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  13%|█▎        | 157/1208 [04:42<31:29,  1.80s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0827, train/loss_vlb_step=0.000278, train/loss_step=0.0827, global_step=4266.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  13%|█▎        | 157/1208 [04:42<31:29,  1.80s/it, loss=0.183, v_num=0, train/loss_simple_step=0.554, train/loss_vlb_step=0.00612, train/loss_step=0.554, global_step=4267.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  13%|█▎        | 158/1208 [04:43<31:22,  1.79s/it, loss=0.183, v_num=0, train/loss_simple_step=0.554, train/loss_vlb_step=0.00612, train/loss_step=0.554, global_step=4267.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  13%|█▎        | 158/1208 [04:43<31:22,  1.79s/it, loss=0.19, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00112, train/loss_step=0.252, global_step=4267.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  13%|█▎        | 159/1208 [04:44<31:16,  1.79s/it, loss=0.19, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00112, train/loss_step=0.252, global_step=4267.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  13%|█▎        | 159/1208 [04:44<31:16,  1.79s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=2.05e-5, train/loss_step=0.00381, global_step=4267.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  13%|█▎        | 160/1208 [04:47<31:23,  1.80s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=2.05e-5, train/loss_step=0.00381, global_step=4267.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  13%|█▎        | 160/1208 [04:47<31:23,  1.80s/it, loss=0.185, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000396, train/loss_step=0.119, global_step=4267.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  13%|█▎        | 161/1208 [04:48<31:17,  1.79s/it, loss=0.185, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000396, train/loss_step=0.119, global_step=4267.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  13%|█▎        | 161/1208 [04:48<31:17,  1.79s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.68e-5, train/loss_step=0.00304, global_step=4268.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  13%|█▎        | 162/1208 [04:49<31:10,  1.79s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.68e-5, train/loss_step=0.00304, global_step=4268.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  13%|█▎        | 162/1208 [04:49<31:10,  1.79s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.35e-5, train/loss_step=0.0226, global_step=4268.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  13%|█▎        | 163/1208 [04:50<31:03,  1.78s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.35e-5, train/loss_step=0.0226, global_step=4268.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  13%|█▎        | 163/1208 [04:50<31:03,  1.78s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0432, train/loss_vlb_step=0.000157, train/loss_step=0.0432, global_step=4268.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  14%|█▎        | 164/1208 [04:53<31:11,  1.79s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0432, train/loss_vlb_step=0.000157, train/loss_step=0.0432, global_step=4268.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  14%|█▎        | 164/1208 [04:53<31:11,  1.79s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.35e-5, train/loss_step=0.0119, global_step=4268.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  14%|█▎        | 165/1208 [04:55<31:04,  1.79s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.35e-5, train/loss_step=0.0119, global_step=4268.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  14%|█▎        | 165/1208 [04:55<31:04,  1.79s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0769, train/loss_vlb_step=0.00026, train/loss_step=0.0769, global_step=4269.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  14%|█▎        | 166/1208 [04:56<30:58,  1.78s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0769, train/loss_vlb_step=0.00026, train/loss_step=0.0769, global_step=4269.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  14%|█▎        | 166/1208 [04:56<30:58,  1.78s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00864, train/loss_vlb_step=4.32e-5, train/loss_step=0.00864, global_step=4269.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  14%|█▍        | 167/1208 [04:57<30:51,  1.78s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00864, train/loss_vlb_step=4.32e-5, train/loss_step=0.00864, global_step=4269.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  14%|█▍        | 167/1208 [04:57<30:51,  1.78s/it, loss=0.15, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00103, train/loss_step=0.253, global_step=4269.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]     Epoch 14:  14%|█▍        | 168/1208 [05:00<30:59,  1.79s/it, loss=0.15, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00103, train/loss_step=0.253, global_step=4269.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  14%|█▍        | 168/1208 [05:00<30:59,  1.79s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=2.48e-5, train/loss_step=0.00448, global_step=4269.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  14%|█▍        | 169/1208 [05:01<30:52,  1.78s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=2.48e-5, train/loss_step=0.00448, global_step=4269.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  14%|█▍        | 169/1208 [05:01<30:52,  1.78s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.25e-5, train/loss_step=0.0142, global_step=4270.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  14%|█▍        | 170/1208 [05:02<30:46,  1.78s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.25e-5, train/loss_step=0.0142, global_step=4270.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  14%|█▍        | 170/1208 [05:02<30:46,  1.78s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0983, train/loss_vlb_step=0.000324, train/loss_step=0.0983, global_step=4270.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  14%|█▍        | 171/1208 [05:03<30:40,  1.77s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0983, train/loss_vlb_step=0.000324, train/loss_step=0.0983, global_step=4270.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  14%|█▍        | 171/1208 [05:03<30:40,  1.77s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0576, train/loss_vlb_step=0.0002, train/loss_step=0.0576, global_step=4270.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  14%|█▍        | 172/1208 [05:06<30:47,  1.78s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0576, train/loss_vlb_step=0.0002, train/loss_step=0.0576, global_step=4270.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  14%|█▍        | 172/1208 [05:06<30:47,  1.78s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0535, train/loss_vlb_step=0.00019, train/loss_step=0.0535, global_step=4270.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  14%|█▍        | 173/1208 [05:07<30:41,  1.78s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0535, train/loss_vlb_step=0.00019, train/loss_step=0.0535, global_step=4270.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  14%|█▍        | 173/1208 [05:07<30:41,  1.78s/it, loss=0.105, v_num=0, train/loss_simple_step=0.057, train/loss_vlb_step=0.0002, train/loss_step=0.057, global_step=4271.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  14%|█▍        | 174/1208 [05:08<30:35,  1.78s/it, loss=0.105, v_num=0, train/loss_simple_step=0.057, train/loss_vlb_step=0.0002, train/loss_step=0.057, global_step=4271.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  14%|█▍        | 174/1208 [05:08<30:35,  1.78s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00762, train/loss_vlb_step=3.88e-5, train/loss_step=0.00762, global_step=4271.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  14%|█▍        | 175/1208 [05:09<30:29,  1.77s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00762, train/loss_vlb_step=3.88e-5, train/loss_step=0.00762, global_step=4271.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  14%|█▍        | 175/1208 [05:09<30:29,  1.77s/it, loss=0.109, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.00464, train/loss_step=0.460, global_step=4271.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  15%|█▍        | 176/1208 [05:13<30:36,  1.78s/it, loss=0.109, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.00464, train/loss_step=0.460, global_step=4271.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  15%|█▍        | 176/1208 [05:13<30:36,  1.78s/it, loss=0.111, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000398, train/loss_step=0.120, global_step=4271.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  15%|█▍        | 177/1208 [05:14<30:30,  1.78s/it, loss=0.111, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000398, train/loss_step=0.120, global_step=4271.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  15%|█▍        | 177/1208 [05:14<30:30,  1.78s/it, loss=0.0836, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=3.21e-5, train/loss_step=0.00611, global_step=4272.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  15%|█▍        | 178/1208 [05:15<30:24,  1.77s/it, loss=0.0836, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=3.21e-5, train/loss_step=0.00611, global_step=4272.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  15%|█▍        | 178/1208 [05:15<30:24,  1.77s/it, loss=0.0718, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.49e-5, train/loss_step=0.0148, global_step=4272.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  15%|█▍        | 179/1208 [05:16<30:18,  1.77s/it, loss=0.0718, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.49e-5, train/loss_step=0.0148, global_step=4272.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  15%|█▍        | 179/1208 [05:16<30:18,  1.77s/it, loss=0.074, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000171, train/loss_step=0.0478, global_step=4272.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  15%|█▍        | 180/1208 [05:19<30:25,  1.78s/it, loss=0.074, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000171, train/loss_step=0.0478, global_step=4272.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  15%|█▍        | 180/1208 [05:19<30:25,  1.78s/it, loss=0.0701, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000152, train/loss_step=0.0412, global_step=4272.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  15%|█▍        | 181/1208 [05:20<30:19,  1.77s/it, loss=0.0701, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000152, train/loss_step=0.0412, global_step=4272.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  15%|█▍        | 181/1208 [05:20<30:19,  1.77s/it, loss=0.113, v_num=0, train/loss_simple_step=0.870, train/loss_vlb_step=0.147, train/loss_step=0.870, global_step=4273.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]      Epoch 14:  15%|█▌        | 182/1208 [05:21<30:13,  1.77s/it, loss=0.113, v_num=0, train/loss_simple_step=0.870, train/loss_vlb_step=0.147, train/loss_step=0.870, global_step=4273.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  15%|█▌        | 182/1208 [05:21<30:13,  1.77s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0777, train/loss_vlb_step=0.00026, train/loss_step=0.0777, global_step=4273.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  15%|█▌        | 183/1208 [05:22<30:07,  1.76s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0777, train/loss_vlb_step=0.00026, train/loss_step=0.0777, global_step=4273.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  15%|█▌        | 183/1208 [05:22<30:07,  1.76s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0751, train/loss_vlb_step=0.000252, train/loss_step=0.0751, global_step=4273.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  15%|█▌        | 184/1208 [05:25<30:14,  1.77s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0751, train/loss_vlb_step=0.000252, train/loss_step=0.0751, global_step=4273.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  15%|█▌        | 184/1208 [05:25<30:14,  1.77s/it, loss=0.142, v_num=0, train/loss_simple_step=0.502, train/loss_vlb_step=0.00666, train/loss_step=0.502, global_step=4273.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  15%|█▌        | 185/1208 [05:27<30:08,  1.77s/it, loss=0.142, v_num=0, train/loss_simple_step=0.502, train/loss_vlb_step=0.00666, train/loss_step=0.502, global_step=4273.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  15%|█▌        | 185/1208 [05:27<30:08,  1.77s/it, loss=0.145, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000418, train/loss_step=0.127, global_step=4274.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  15%|█▌        | 186/1208 [05:28<30:02,  1.76s/it, loss=0.145, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000418, train/loss_step=0.127, global_step=4274.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  15%|█▌        | 186/1208 [05:28<30:02,  1.76s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.78e-5, train/loss_step=0.0123, global_step=4274.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  15%|█▌        | 187/1208 [05:29<29:56,  1.76s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.78e-5, train/loss_step=0.0123, global_step=4274.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  15%|█▌        | 187/1208 [05:29<29:56,  1.76s/it, loss=0.15, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00241, train/loss_step=0.364, global_step=4274.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  16%|█▌        | 188/1208 [05:32<30:03,  1.77s/it, loss=0.15, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00241, train/loss_step=0.364, global_step=4274.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  16%|█▌        | 188/1208 [05:32<30:03,  1.77s/it, loss=0.165, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00138, train/loss_step=0.289, global_step=4274.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  16%|█▌        | 189/1208 [05:33<29:57,  1.76s/it, loss=0.165, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00138, train/loss_step=0.289, global_step=4274.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  16%|█▌        | 189/1208 [05:33<29:57,  1.76s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=1.12e-5, train/loss_step=0.00187, global_step=4275.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  16%|█▌        | 190/1208 [05:34<29:51,  1.76s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=1.12e-5, train/loss_step=0.00187, global_step=4275.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  16%|█▌        | 190/1208 [05:34<29:51,  1.76s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=2.56e-5, train/loss_step=0.00464, global_step=4275.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  16%|█▌        | 191/1208 [05:35<29:46,  1.76s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=2.56e-5, train/loss_step=0.00464, global_step=4275.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  16%|█▌        | 191/1208 [05:35<29:46,  1.76s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00379, train/loss_vlb_step=2.12e-5, train/loss_step=0.00379, global_step=4275.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  16%|█▌        | 192/1208 [05:38<29:52,  1.76s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00379, train/loss_vlb_step=2.12e-5, train/loss_step=0.00379, global_step=4275.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  16%|█▌        | 192/1208 [05:38<29:52,  1.76s/it, loss=0.165, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000805, train/loss_step=0.222, global_step=4275.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  16%|█▌        | 193/1208 [05:39<29:47,  1.76s/it, loss=0.165, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000805, train/loss_step=0.222, global_step=4275.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  16%|█▌        | 193/1208 [05:39<29:47,  1.76s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00656, train/loss_vlb_step=3.28e-5, train/loss_step=0.00656, global_step=4276.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  16%|█▌        | 194/1208 [05:40<29:41,  1.76s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00656, train/loss_vlb_step=3.28e-5, train/loss_step=0.00656, global_step=4276.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  16%|█▌        | 194/1208 [05:40<29:41,  1.76s/it, loss=0.192, v_num=0, train/loss_simple_step=0.595, train/loss_vlb_step=0.0152, train/loss_step=0.595, global_step=4276.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]     Epoch 14:  16%|█▌        | 195/1208 [05:41<29:36,  1.75s/it, loss=0.192, v_num=0, train/loss_simple_step=0.595, train/loss_vlb_step=0.0152, train/loss_step=0.595, global_step=4276.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  16%|█▌        | 195/1208 [05:41<29:36,  1.75s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0515, train/loss_vlb_step=0.000179, train/loss_step=0.0515, global_step=4276.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  16%|█▌        | 196/1208 [05:45<29:42,  1.76s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0515, train/loss_vlb_step=0.000179, train/loss_step=0.0515, global_step=4276.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  16%|█▌        | 196/1208 [05:45<29:42,  1.76s/it, loss=0.171, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.00035, train/loss_step=0.106, global_step=4276.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  16%|█▋        | 197/1208 [05:46<29:36,  1.76s/it, loss=0.171, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.00035, train/loss_step=0.106, global_step=4276.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  16%|█▋        | 197/1208 [05:46<29:36,  1.76s/it, loss=0.181, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000888, train/loss_step=0.213, global_step=4277.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  16%|█▋        | 198/1208 [05:47<29:31,  1.75s/it, loss=0.181, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000888, train/loss_step=0.213, global_step=4277.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  16%|█▋        | 198/1208 [05:47<29:31,  1.75s/it, loss=0.186, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=4277.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  16%|█▋        | 199/1208 [05:48<29:25,  1.75s/it, loss=0.186, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=4277.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  16%|█▋        | 199/1208 [05:48<29:25,  1.75s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0986, train/loss_vlb_step=0.000325, train/loss_step=0.0986, global_step=4277.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  17%|█▋        | 200/1208 [05:51<29:31,  1.76s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0986, train/loss_vlb_step=0.000325, train/loss_step=0.0986, global_step=4277.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  17%|█▋        | 200/1208 [05:51<29:32,  1.76s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.42e-5, train/loss_step=0.0203, global_step=4277.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  17%|█▋        | 201/1208 [05:52<29:26,  1.75s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.42e-5, train/loss_step=0.0203, global_step=4277.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  17%|█▋        | 201/1208 [05:52<29:26,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000484, train/loss_step=0.146, global_step=4278.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  17%|█▋        | 202/1208 [05:53<29:21,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000484, train/loss_step=0.146, global_step=4278.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  17%|█▋        | 202/1208 [05:53<29:21,  1.75s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.00013, train/loss_step=0.0344, global_step=4278.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  17%|█▋        | 203/1208 [05:54<29:16,  1.75s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.00013, train/loss_step=0.0344, global_step=4278.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  17%|█▋        | 203/1208 [05:54<29:16,  1.75s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0414, train/loss_vlb_step=0.000157, train/loss_step=0.0414, global_step=4278.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  17%|█▋        | 204/1208 [05:57<29:21,  1.75s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0414, train/loss_vlb_step=0.000157, train/loss_step=0.0414, global_step=4278.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  17%|█▋        | 204/1208 [05:57<29:21,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0679, train/loss_vlb_step=0.000229, train/loss_step=0.0679, global_step=4278.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  17%|█▋        | 205/1208 [05:59<29:16,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0679, train/loss_vlb_step=0.000229, train/loss_step=0.0679, global_step=4278.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  17%|█▋        | 205/1208 [05:59<29:16,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000724, train/loss_step=0.204, global_step=4279.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  17%|█▋        | 206/1208 [06:00<29:11,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000724, train/loss_step=0.204, global_step=4279.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  17%|█▋        | 206/1208 [06:00<29:11,  1.75s/it, loss=0.144, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.0017, train/loss_step=0.302, global_step=4279.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  17%|█▋        | 207/1208 [06:01<29:06,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.0017, train/loss_step=0.302, global_step=4279.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  17%|█▋        | 207/1208 [06:01<29:06,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=4279.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  17%|█▋        | 208/1208 [06:04<29:11,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=4279.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  17%|█▋        | 208/1208 [06:04<29:11,  1.75s/it, loss=0.144, v_num=0, train/loss_simple_step=0.525, train/loss_vlb_step=0.00633, train/loss_step=0.525, global_step=4279.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  17%|█▋        | 209/1208 [06:05<29:06,  1.75s/it, loss=0.144, v_num=0, train/loss_simple_step=0.525, train/loss_vlb_step=0.00633, train/loss_step=0.525, global_step=4279.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  17%|█▋        | 209/1208 [06:05<29:06,  1.75s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=8.37e-5, train/loss_step=0.0195, global_step=4280.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  17%|█▋        | 210/1208 [06:06<29:01,  1.75s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=8.37e-5, train/loss_step=0.0195, global_step=4280.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  17%|█▋        | 210/1208 [06:06<29:01,  1.75s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=9.06e-5, train/loss_step=0.0219, global_step=4280.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  17%|█▋        | 211/1208 [06:07<28:56,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=9.06e-5, train/loss_step=0.0219, global_step=4280.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  17%|█▋        | 211/1208 [06:07<28:56,  1.74s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0845, train/loss_vlb_step=0.000287, train/loss_step=0.0845, global_step=4280.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  18%|█▊        | 212/1208 [06:10<29:01,  1.75s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0845, train/loss_vlb_step=0.000287, train/loss_step=0.0845, global_step=4280.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  18%|█▊        | 212/1208 [06:10<29:01,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.61e-5, train/loss_step=0.003, global_step=4280.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  18%|█▊        | 213/1208 [06:11<28:56,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.61e-5, train/loss_step=0.003, global_step=4280.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  18%|█▊        | 213/1208 [06:11<28:56,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.000146, train/loss_step=0.0401, global_step=4281.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  18%|█▊        | 214/1208 [06:12<28:51,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.000146, train/loss_step=0.0401, global_step=4281.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  18%|█▊        | 214/1208 [06:12<28:51,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0727, train/loss_vlb_step=0.000246, train/loss_step=0.0727, global_step=4281.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  18%|█▊        | 215/1208 [06:13<28:46,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0727, train/loss_vlb_step=0.000246, train/loss_step=0.0727, global_step=4281.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  18%|█▊        | 215/1208 [06:13<28:46,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.0012, train/loss_step=0.280, global_step=4281.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  18%|█▊        | 216/1208 [06:17<28:52,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.0012, train/loss_step=0.280, global_step=4281.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  18%|█▊        | 216/1208 [06:17<28:52,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=4281.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  18%|█▊        | 217/1208 [06:18<28:47,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=4281.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  18%|█▊        | 217/1208 [06:18<28:47,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00816, train/loss_vlb_step=3.81e-5, train/loss_step=0.00816, global_step=4282.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  18%|█▊        | 218/1208 [06:19<28:42,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00816, train/loss_vlb_step=3.81e-5, train/loss_step=0.00816, global_step=4282.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  18%|█▊        | 218/1208 [06:19<28:42,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000147, train/loss_step=0.0406, global_step=4282.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  18%|█▊        | 219/1208 [06:20<28:37,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000147, train/loss_step=0.0406, global_step=4282.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  18%|█▊        | 219/1208 [06:20<28:37,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.07e-5, train/loss_step=0.0137, global_step=4282.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  18%|█▊        | 220/1208 [06:23<28:42,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.07e-5, train/loss_step=0.0137, global_step=4282.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  18%|█▊        | 220/1208 [06:23<28:42,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000394, train/loss_step=0.119, global_step=4282.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  18%|█▊        | 221/1208 [06:24<28:37,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000394, train/loss_step=0.119, global_step=4282.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  18%|█▊        | 221/1208 [06:24<28:37,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00212, train/loss_step=0.320, global_step=4283.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  18%|█▊        | 222/1208 [06:25<28:32,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00212, train/loss_step=0.320, global_step=4283.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  18%|█▊        | 222/1208 [06:25<28:32,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0536, train/loss_vlb_step=0.000188, train/loss_step=0.0536, global_step=4283.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  18%|█▊        | 223/1208 [06:26<28:27,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0536, train/loss_vlb_step=0.000188, train/loss_step=0.0536, global_step=4283.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  18%|█▊        | 223/1208 [06:26<28:28,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0826, train/loss_vlb_step=0.000272, train/loss_step=0.0826, global_step=4283.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  19%|█▊        | 224/1208 [06:29<28:32,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0826, train/loss_vlb_step=0.000272, train/loss_step=0.0826, global_step=4283.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  19%|█▊        | 224/1208 [06:29<28:32,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.28e-5, train/loss_step=0.0141, global_step=4283.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  19%|█▊        | 225/1208 [06:31<28:28,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.28e-5, train/loss_step=0.0141, global_step=4283.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  19%|█▊        | 225/1208 [06:31<28:28,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00519, train/loss_vlb_step=2.73e-5, train/loss_step=0.00519, global_step=4284.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  19%|█▊        | 226/1208 [06:32<28:23,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00519, train/loss_vlb_step=2.73e-5, train/loss_step=0.00519, global_step=4284.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  19%|█▊        | 226/1208 [06:32<28:23,  1.73s/it, loss=0.097, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.59e-5, train/loss_step=0.0103, global_step=4284.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  19%|█▉        | 227/1208 [06:33<28:18,  1.73s/it, loss=0.097, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.59e-5, train/loss_step=0.0103, global_step=4284.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  19%|█▉        | 227/1208 [06:33<28:18,  1.73s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.00599, train/loss_vlb_step=2.98e-5, train/loss_step=0.00599, global_step=4284.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  19%|█▉        | 228/1208 [06:36<28:23,  1.74s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.00599, train/loss_vlb_step=2.98e-5, train/loss_step=0.00599, global_step=4284.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  19%|█▉        | 228/1208 [06:36<28:23,  1.74s/it, loss=0.0806, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00153, train/loss_step=0.304, global_step=4284.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  19%|█▉        | 229/1208 [06:37<28:19,  1.74s/it, loss=0.0806, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00153, train/loss_step=0.304, global_step=4284.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  19%|█▉        | 229/1208 [06:37<28:19,  1.74s/it, loss=0.0813, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000129, train/loss_step=0.0342, global_step=4285.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  19%|█▉        | 230/1208 [06:38<28:14,  1.73s/it, loss=0.0813, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000129, train/loss_step=0.0342, global_step=4285.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  19%|█▉        | 230/1208 [06:38<28:14,  1.73s/it, loss=0.0813, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=8.48e-5, train/loss_step=0.0218, global_step=4285.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  19%|█▉        | 231/1208 [06:39<28:09,  1.73s/it, loss=0.0813, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=8.48e-5, train/loss_step=0.0218, global_step=4285.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  19%|█▉        | 231/1208 [06:39<28:09,  1.73s/it, loss=0.0789, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.00014, train/loss_step=0.0369, global_step=4285.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  19%|█▉        | 232/1208 [06:42<28:14,  1.74s/it, loss=0.0789, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.00014, train/loss_step=0.0369, global_step=4285.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  19%|█▉        | 232/1208 [06:42<28:14,  1.74s/it, loss=0.079, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=1.98e-5, train/loss_step=0.00361, global_step=4285.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  19%|█▉        | 233/1208 [06:43<28:09,  1.73s/it, loss=0.079, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=1.98e-5, train/loss_step=0.00361, global_step=4285.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  19%|█▉        | 233/1208 [06:43<28:09,  1.73s/it, loss=0.0841, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000475, train/loss_step=0.143, global_step=4286.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  19%|█▉        | 234/1208 [06:44<28:05,  1.73s/it, loss=0.0841, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000475, train/loss_step=0.143, global_step=4286.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  19%|█▉        | 234/1208 [06:44<28:05,  1.73s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000124, train/loss_step=0.0325, global_step=4286.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  19%|█▉        | 235/1208 [06:45<28:00,  1.73s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000124, train/loss_step=0.0325, global_step=4286.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  19%|█▉        | 235/1208 [06:45<28:00,  1.73s/it, loss=0.0684, v_num=0, train/loss_simple_step=0.00593, train/loss_vlb_step=3.1e-5, train/loss_step=0.00593, global_step=4286.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  20%|█▉        | 236/1208 [06:49<28:05,  1.73s/it, loss=0.0684, v_num=0, train/loss_simple_step=0.00593, train/loss_vlb_step=3.1e-5, train/loss_step=0.00593, global_step=4286.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  20%|█▉        | 236/1208 [06:49<28:05,  1.73s/it, loss=0.0712, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000574, train/loss_step=0.168, global_step=4286.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  20%|█▉        | 237/1208 [06:50<28:00,  1.73s/it, loss=0.0712, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000574, train/loss_step=0.168, global_step=4286.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  20%|█▉        | 237/1208 [06:50<28:00,  1.73s/it, loss=0.0716, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=6.98e-5, train/loss_step=0.0166, global_step=4287.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  20%|█▉        | 238/1208 [06:51<27:56,  1.73s/it, loss=0.0716, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=6.98e-5, train/loss_step=0.0166, global_step=4287.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  20%|█▉        | 238/1208 [06:51<27:56,  1.73s/it, loss=0.0733, v_num=0, train/loss_simple_step=0.0758, train/loss_vlb_step=0.000255, train/loss_step=0.0758, global_step=4287.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  20%|█▉        | 239/1208 [06:52<27:51,  1.73s/it, loss=0.0733, v_num=0, train/loss_simple_step=0.0758, train/loss_vlb_step=0.000255, train/loss_step=0.0758, global_step=4287.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  20%|█▉        | 239/1208 [06:52<27:51,  1.73s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00118, train/loss_step=0.278, global_step=4287.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  20%|█▉        | 240/1208 [06:55<27:56,  1.73s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00118, train/loss_step=0.278, global_step=4287.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  20%|█▉        | 240/1208 [06:55<27:56,  1.73s/it, loss=0.0817, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.43e-5, train/loss_step=0.0213, global_step=4287.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  20%|█▉        | 241/1208 [06:56<27:51,  1.73s/it, loss=0.0817, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.43e-5, train/loss_step=0.0213, global_step=4287.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  20%|█▉        | 241/1208 [06:56<27:51,  1.73s/it, loss=0.0689, v_num=0, train/loss_simple_step=0.0646, train/loss_vlb_step=0.000218, train/loss_step=0.0646, global_step=4288.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  20%|██        | 242/1208 [06:57<27:47,  1.73s/it, loss=0.0689, v_num=0, train/loss_simple_step=0.0646, train/loss_vlb_step=0.000218, train/loss_step=0.0646, global_step=4288.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  20%|██        | 242/1208 [06:57<27:47,  1.73s/it, loss=0.0697, v_num=0, train/loss_simple_step=0.0701, train/loss_vlb_step=0.000238, train/loss_step=0.0701, global_step=4288.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  20%|██        | 243/1208 [06:58<27:42,  1.72s/it, loss=0.0697, v_num=0, train/loss_simple_step=0.0701, train/loss_vlb_step=0.000238, train/loss_step=0.0701, global_step=4288.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  20%|██        | 243/1208 [06:58<27:42,  1.72s/it, loss=0.066, v_num=0, train/loss_simple_step=0.00843, train/loss_vlb_step=4.08e-5, train/loss_step=0.00843, global_step=4288.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  20%|██        | 244/1208 [07:01<27:47,  1.73s/it, loss=0.066, v_num=0, train/loss_simple_step=0.00843, train/loss_vlb_step=4.08e-5, train/loss_step=0.00843, global_step=4288.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  20%|██        | 244/1208 [07:01<27:47,  1.73s/it, loss=0.0663, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.02e-5, train/loss_step=0.020, global_step=4288.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  20%|██        | 245/1208 [07:03<27:42,  1.73s/it, loss=0.0663, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.02e-5, train/loss_step=0.020, global_step=4288.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  20%|██        | 245/1208 [07:03<27:42,  1.73s/it, loss=0.0774, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000822, train/loss_step=0.226, global_step=4289.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  20%|██        | 246/1208 [07:04<27:38,  1.72s/it, loss=0.0774, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000822, train/loss_step=0.226, global_step=4289.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  20%|██        | 246/1208 [07:04<27:38,  1.72s/it, loss=0.0788, v_num=0, train/loss_simple_step=0.0382, train/loss_vlb_step=0.000139, train/loss_step=0.0382, global_step=4289.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  20%|██        | 247/1208 [07:05<27:34,  1.72s/it, loss=0.0788, v_num=0, train/loss_simple_step=0.0382, train/loss_vlb_step=0.000139, train/loss_step=0.0382, global_step=4289.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  20%|██        | 247/1208 [07:05<27:34,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.574, train/loss_vlb_step=0.00965, train/loss_step=0.574, global_step=4289.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  21%|██        | 248/1208 [07:08<27:38,  1.73s/it, loss=0.107, v_num=0, train/loss_simple_step=0.574, train/loss_vlb_step=0.00965, train/loss_step=0.574, global_step=4289.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  21%|██        | 248/1208 [07:08<27:38,  1.73s/it, loss=0.0927, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.81e-5, train/loss_step=0.0155, global_step=4289.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  21%|██        | 249/1208 [07:09<27:33,  1.72s/it, loss=0.0927, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.81e-5, train/loss_step=0.0155, global_step=4289.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  21%|██        | 249/1208 [07:09<27:33,  1.72s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.0357, train/loss_vlb_step=0.000136, train/loss_step=0.0357, global_step=4290.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  21%|██        | 250/1208 [07:10<27:29,  1.72s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.0357, train/loss_vlb_step=0.000136, train/loss_step=0.0357, global_step=4290.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  21%|██        | 250/1208 [07:10<27:29,  1.72s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.00759, train/loss_vlb_step=3.72e-5, train/loss_step=0.00759, global_step=4290.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  21%|██        | 251/1208 [07:11<27:25,  1.72s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.00759, train/loss_vlb_step=3.72e-5, train/loss_step=0.00759, global_step=4290.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  21%|██        | 251/1208 [07:11<27:25,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.755, train/loss_vlb_step=0.0356, train/loss_step=0.755, global_step=4290.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]      Epoch 14:  21%|██        | 252/1208 [07:14<27:29,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.755, train/loss_vlb_step=0.0356, train/loss_step=0.755, global_step=4290.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  21%|██        | 252/1208 [07:14<27:29,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000683, train/loss_step=0.188, global_step=4290.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  21%|██        | 253/1208 [07:15<27:25,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000683, train/loss_step=0.188, global_step=4290.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  21%|██        | 253/1208 [07:15<27:25,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00205, train/loss_step=0.366, global_step=4291.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  21%|██        | 254/1208 [07:16<27:20,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00205, train/loss_step=0.366, global_step=4291.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  21%|██        | 254/1208 [07:16<27:20,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000588, train/loss_step=0.167, global_step=4291.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  21%|██        | 255/1208 [07:17<27:16,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000588, train/loss_step=0.167, global_step=4291.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  21%|██        | 255/1208 [07:17<27:16,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.000172, train/loss_step=0.0489, global_step=4291.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  21%|██        | 256/1208 [07:21<27:20,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.000172, train/loss_step=0.0489, global_step=4291.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  21%|██        | 256/1208 [07:21<27:20,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000114, train/loss_step=0.0295, global_step=4291.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  21%|██▏       | 257/1208 [07:22<27:16,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000114, train/loss_step=0.0295, global_step=4291.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  21%|██▏       | 257/1208 [07:22<27:16,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.3e-5, train/loss_step=0.00218, global_step=4292.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  21%|██▏       | 258/1208 [07:23<27:11,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.3e-5, train/loss_step=0.00218, global_step=4292.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  21%|██▏       | 258/1208 [07:23<27:11,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000775, train/loss_step=0.192, global_step=4292.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  21%|██▏       | 259/1208 [07:24<27:07,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000775, train/loss_step=0.192, global_step=4292.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  21%|██▏       | 259/1208 [07:24<27:07,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.00096, train/loss_step=0.232, global_step=4292.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  22%|██▏       | 260/1208 [07:27<27:11,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.00096, train/loss_step=0.232, global_step=4292.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  22%|██▏       | 260/1208 [07:27<27:11,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.00082, train/loss_step=0.212, global_step=4292.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  22%|██▏       | 261/1208 [07:28<27:07,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.00082, train/loss_step=0.212, global_step=4292.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  22%|██▏       | 261/1208 [07:28<27:07,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00187, train/loss_step=0.309, global_step=4293.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  22%|██▏       | 262/1208 [07:29<27:03,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00187, train/loss_step=0.309, global_step=4293.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  22%|██▏       | 262/1208 [07:29<27:03,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000514, train/loss_step=0.152, global_step=4293.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  22%|██▏       | 263/1208 [07:30<26:59,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000514, train/loss_step=0.152, global_step=4293.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  22%|██▏       | 263/1208 [07:30<26:59,  1.71s/it, loss=0.206, v_num=0, train/loss_simple_step=0.547, train/loss_vlb_step=0.0107, train/loss_step=0.547, global_step=4293.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  22%|██▏       | 264/1208 [07:33<27:02,  1.72s/it, loss=0.206, v_num=0, train/loss_simple_step=0.547, train/loss_vlb_step=0.0107, train/loss_step=0.547, global_step=4293.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  22%|██▏       | 264/1208 [07:33<27:02,  1.72s/it, loss=0.205, v_num=0, train/loss_simple_step=0.00893, train/loss_vlb_step=4.39e-5, train/loss_step=0.00893, global_step=4293.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  22%|██▏       | 265/1208 [07:34<26:58,  1.72s/it, loss=0.205, v_num=0, train/loss_simple_step=0.00893, train/loss_vlb_step=4.39e-5, train/loss_step=0.00893, global_step=4293.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  22%|██▏       | 265/1208 [07:34<26:58,  1.72s/it, loss=0.194, v_num=0, train/loss_simple_step=0.00685, train/loss_vlb_step=3.38e-5, train/loss_step=0.00685, global_step=4294.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  22%|██▏       | 266/1208 [07:35<26:54,  1.71s/it, loss=0.194, v_num=0, train/loss_simple_step=0.00685, train/loss_vlb_step=3.38e-5, train/loss_step=0.00685, global_step=4294.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  22%|██▏       | 266/1208 [07:35<26:54,  1.71s/it, loss=0.2, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000504, train/loss_step=0.151, global_step=4294.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]     Epoch 14:  22%|██▏       | 267/1208 [07:37<26:50,  1.71s/it, loss=0.2, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000504, train/loss_step=0.151, global_step=4294.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  22%|██▏       | 267/1208 [07:37<26:50,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000653, train/loss_step=0.179, global_step=4294.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  22%|██▏       | 268/1208 [07:40<26:54,  1.72s/it, loss=0.18, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000653, train/loss_step=0.179, global_step=4294.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  22%|██▏       | 268/1208 [07:40<26:54,  1.72s/it, loss=0.186, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000439, train/loss_step=0.129, global_step=4294.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  22%|██▏       | 269/1208 [07:41<26:50,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000439, train/loss_step=0.129, global_step=4294.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  22%|██▏       | 269/1208 [07:41<26:50,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000817, train/loss_step=0.211, global_step=4295.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  22%|██▏       | 270/1208 [07:42<26:46,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000817, train/loss_step=0.211, global_step=4295.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  22%|██▏       | 270/1208 [07:42<26:46,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00538, train/loss_vlb_step=2.87e-5, train/loss_step=0.00538, global_step=4295.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  22%|██▏       | 271/1208 [07:43<26:42,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00538, train/loss_vlb_step=2.87e-5, train/loss_step=0.00538, global_step=4295.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  22%|██▏       | 271/1208 [07:43<26:42,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0854, train/loss_vlb_step=0.000281, train/loss_step=0.0854, global_step=4295.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  23%|██▎       | 272/1208 [07:46<26:45,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0854, train/loss_vlb_step=0.000281, train/loss_step=0.0854, global_step=4295.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  23%|██▎       | 272/1208 [07:46<26:45,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000859, train/loss_step=0.224, global_step=4295.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  23%|██▎       | 273/1208 [07:47<26:41,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000859, train/loss_step=0.224, global_step=4295.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  23%|██▎       | 273/1208 [07:47<26:41,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.0021, train/loss_step=0.390, global_step=4296.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  23%|██▎       | 274/1208 [07:48<26:37,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.0021, train/loss_step=0.390, global_step=4296.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  23%|██▎       | 274/1208 [07:48<26:37,  1.71s/it, loss=0.171, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00153, train/loss_step=0.295, global_step=4296.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  23%|██▎       | 275/1208 [07:49<26:33,  1.71s/it, loss=0.171, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00153, train/loss_step=0.295, global_step=4296.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  23%|██▎       | 275/1208 [07:49<26:33,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.43e-5, train/loss_step=0.00247, global_step=4296.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  23%|██▎       | 276/1208 [07:52<26:37,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.43e-5, train/loss_step=0.00247, global_step=4296.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  23%|██▎       | 276/1208 [07:52<26:37,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00738, train/loss_vlb_step=3.72e-5, train/loss_step=0.00738, global_step=4296.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  23%|██▎       | 277/1208 [07:54<26:33,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00738, train/loss_vlb_step=3.72e-5, train/loss_step=0.00738, global_step=4296.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  23%|██▎       | 277/1208 [07:54<26:33,  1.71s/it, loss=0.196, v_num=0, train/loss_simple_step=0.573, train/loss_vlb_step=0.0102, train/loss_step=0.573, global_step=4297.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]     Epoch 14:  23%|██▎       | 278/1208 [07:55<26:29,  1.71s/it, loss=0.196, v_num=0, train/loss_simple_step=0.573, train/loss_vlb_step=0.0102, train/loss_step=0.573, global_step=4297.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  23%|██▎       | 278/1208 [07:55<26:29,  1.71s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.81e-5, train/loss_step=0.0129, global_step=4297.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  23%|██▎       | 279/1208 [07:56<26:25,  1.71s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.81e-5, train/loss_step=0.0129, global_step=4297.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  23%|██▎       | 279/1208 [07:56<26:25,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000357, train/loss_step=0.109, global_step=4297.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  23%|██▎       | 280/1208 [07:59<26:28,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000357, train/loss_step=0.109, global_step=4297.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  23%|██▎       | 280/1208 [07:59<26:28,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00168, train/loss_step=0.292, global_step=4297.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  23%|██▎       | 281/1208 [08:00<26:24,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00168, train/loss_step=0.292, global_step=4297.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  23%|██▎       | 281/1208 [08:00<26:24,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000925, train/loss_step=0.242, global_step=4298.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  23%|██▎       | 282/1208 [08:01<26:20,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000925, train/loss_step=0.242, global_step=4298.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  23%|██▎       | 282/1208 [08:01<26:20,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000658, train/loss_step=0.184, global_step=4298.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  23%|██▎       | 283/1208 [08:02<26:17,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000658, train/loss_step=0.184, global_step=4298.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  23%|██▎       | 283/1208 [08:02<26:17,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.15e-5, train/loss_step=0.0138, global_step=4298.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  24%|██▎       | 284/1208 [08:05<26:20,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.15e-5, train/loss_step=0.0138, global_step=4298.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  24%|██▎       | 284/1208 [08:05<26:20,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.54e-5, train/loss_step=0.0175, global_step=4298.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  24%|██▎       | 285/1208 [08:06<26:16,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.54e-5, train/loss_step=0.0175, global_step=4298.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  24%|██▎       | 285/1208 [08:06<26:16,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00214, train/loss_step=0.339, global_step=4299.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  24%|██▎       | 286/1208 [08:07<26:12,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00214, train/loss_step=0.339, global_step=4299.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  24%|██▎       | 286/1208 [08:07<26:12,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00178, train/loss_step=0.353, global_step=4299.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  24%|██▍       | 287/1208 [08:08<26:08,  1.70s/it, loss=0.183, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00178, train/loss_step=0.353, global_step=4299.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  24%|██▍       | 287/1208 [08:08<26:08,  1.70s/it, loss=0.188, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00124, train/loss_step=0.282, global_step=4299.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  24%|██▍       | 288/1208 [08:12<26:12,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00124, train/loss_step=0.282, global_step=4299.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  24%|██▍       | 288/1208 [08:12<26:12,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00433, train/loss_vlb_step=2.35e-5, train/loss_step=0.00433, global_step=4299.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  24%|██▍       | 289/1208 [08:13<26:08,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00433, train/loss_vlb_step=2.35e-5, train/loss_step=0.00433, global_step=4299.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  24%|██▍       | 289/1208 [08:13<26:08,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.87e-5, train/loss_step=0.0243, global_step=4300.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  24%|██▍       | 290/1208 [08:14<26:04,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.87e-5, train/loss_step=0.0243, global_step=4300.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  24%|██▍       | 290/1208 [08:14<26:04,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00109, train/loss_step=0.263, global_step=4300.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  24%|██▍       | 291/1208 [08:15<26:00,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00109, train/loss_step=0.263, global_step=4300.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  24%|██▍       | 291/1208 [08:15<26:00,  1.70s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.21e-5, train/loss_step=0.0173, global_step=4300.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  24%|██▍       | 292/1208 [08:18<26:03,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.21e-5, train/loss_step=0.0173, global_step=4300.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  24%|██▍       | 292/1208 [08:18<26:03,  1.71s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0826, train/loss_vlb_step=0.000273, train/loss_step=0.0826, global_step=4300.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  24%|██▍       | 293/1208 [08:19<26:00,  1.71s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0826, train/loss_vlb_step=0.000273, train/loss_step=0.0826, global_step=4300.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  24%|██▍       | 293/1208 [08:19<26:00,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000433, train/loss_step=0.130, global_step=4301.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  24%|██▍       | 294/1208 [08:20<25:56,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000433, train/loss_step=0.130, global_step=4301.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  24%|██▍       | 294/1208 [08:20<25:56,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000116, train/loss_step=0.0295, global_step=4301.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  24%|██▍       | 295/1208 [08:21<25:52,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000116, train/loss_step=0.0295, global_step=4301.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  24%|██▍       | 295/1208 [08:21<25:52,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0922, train/loss_vlb_step=0.00031, train/loss_step=0.0922, global_step=4301.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  25%|██▍       | 296/1208 [08:24<25:55,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0922, train/loss_vlb_step=0.00031, train/loss_step=0.0922, global_step=4301.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  25%|██▍       | 296/1208 [08:24<25:55,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000621, train/loss_step=0.180, global_step=4301.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  25%|██▍       | 297/1208 [08:25<25:52,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000621, train/loss_step=0.180, global_step=4301.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  25%|██▍       | 297/1208 [08:25<25:52,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000139, train/loss_step=0.0378, global_step=4302.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  25%|██▍       | 298/1208 [08:27<25:48,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000139, train/loss_step=0.0378, global_step=4302.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  25%|██▍       | 298/1208 [08:27<25:48,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000462, train/loss_step=0.138, global_step=4302.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  25%|██▍       | 299/1208 [08:28<25:44,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000462, train/loss_step=0.138, global_step=4302.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  25%|██▍       | 299/1208 [08:28<25:44,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000485, train/loss_step=0.145, global_step=4302.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  25%|██▍       | 300/1208 [08:31<25:47,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000485, train/loss_step=0.145, global_step=4302.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  25%|██▍       | 300/1208 [08:31<25:47,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0493, train/loss_vlb_step=0.000174, train/loss_step=0.0493, global_step=4302.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.74it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.76it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.80it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.80it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 14:  25%|██▍       | 301/1208 [09:02<27:13,  1.80s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0493, train/loss_vlb_step=0.000174, train/loss_step=0.0493, global_step=4302.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  25%|██▍       | 301/1208 [09:02<27:13,  1.80s/it, loss=0.144, v_num=0, train/loss_simple_step=0.489, train/loss_vlb_step=0.00381, train/loss_step=0.489, global_step=4303.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  25%|██▌       | 302/1208 [09:03<27:09,  1.80s/it, loss=0.144, v_num=0, train/loss_simple_step=0.489, train/loss_vlb_step=0.00381, train/loss_step=0.489, global_step=4303.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  25%|██▌       | 302/1208 [09:03<27:09,  1.80s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00474, train/loss_vlb_step=2.5e-5, train/loss_step=0.00474, global_step=4303.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  25%|██▌       | 303/1208 [09:04<27:05,  1.80s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00474, train/loss_vlb_step=2.5e-5, train/loss_step=0.00474, global_step=4303.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  25%|██▌       | 303/1208 [09:04<27:05,  1.80s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000111, train/loss_step=0.0293, global_step=4303.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  25%|██▌       | 304/1208 [09:07<27:07,  1.80s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000111, train/loss_step=0.0293, global_step=4303.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  25%|██▌       | 304/1208 [09:07<27:07,  1.80s/it, loss=0.14, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=4303.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  25%|██▌       | 305/1208 [09:08<27:03,  1.80s/it, loss=0.14, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=4303.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  25%|██▌       | 305/1208 [09:08<27:03,  1.80s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=7.9e-5, train/loss_step=0.0194, global_step=4304.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  25%|██▌       | 306/1208 [09:09<26:59,  1.80s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=7.9e-5, train/loss_step=0.0194, global_step=4304.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  25%|██▌       | 306/1208 [09:09<26:59,  1.80s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000298, train/loss_step=0.0901, global_step=4304.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  25%|██▌       | 307/1208 [09:10<26:55,  1.79s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000298, train/loss_step=0.0901, global_step=4304.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  25%|██▌       | 307/1208 [09:10<26:55,  1.79s/it, loss=0.103, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000452, train/loss_step=0.136, global_step=4304.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  25%|██▌       | 308/1208 [09:13<26:57,  1.80s/it, loss=0.103, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000452, train/loss_step=0.136, global_step=4304.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  25%|██▌       | 308/1208 [09:13<26:57,  1.80s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00427, train/loss_vlb_step=2.22e-5, train/loss_step=0.00427, global_step=4304.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  26%|██▌       | 309/1208 [09:14<26:53,  1.79s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00427, train/loss_vlb_step=2.22e-5, train/loss_step=0.00427, global_step=4304.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  26%|██▌       | 309/1208 [09:14<26:53,  1.79s/it, loss=0.135, v_num=0, train/loss_simple_step=0.660, train/loss_vlb_step=0.0185, train/loss_step=0.660, global_step=4305.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]     Epoch 14:  26%|██▌       | 310/1208 [09:15<26:49,  1.79s/it, loss=0.135, v_num=0, train/loss_simple_step=0.660, train/loss_vlb_step=0.0185, train/loss_step=0.660, global_step=4305.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  26%|██▌       | 310/1208 [09:15<26:49,  1.79s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0949, train/loss_vlb_step=0.000325, train/loss_step=0.0949, global_step=4305.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  26%|██▌       | 311/1208 [09:16<26:45,  1.79s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0949, train/loss_vlb_step=0.000325, train/loss_step=0.0949, global_step=4305.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  26%|██▌       | 311/1208 [09:16<26:45,  1.79s/it, loss=0.138, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.00103, train/loss_step=0.236, global_step=4305.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  26%|██▌       | 312/1208 [09:19<26:47,  1.79s/it, loss=0.138, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.00103, train/loss_step=0.236, global_step=4305.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  26%|██▌       | 312/1208 [09:19<26:47,  1.79s/it, loss=0.14, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.00047, train/loss_step=0.141, global_step=4305.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  26%|██▌       | 313/1208 [09:20<26:44,  1.79s/it, loss=0.14, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.00047, train/loss_step=0.141, global_step=4305.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  26%|██▌       | 313/1208 [09:20<26:44,  1.79s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.05e-5, train/loss_step=0.0134, global_step=4306.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  26%|██▌       | 314/1208 [09:22<26:40,  1.79s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.05e-5, train/loss_step=0.0134, global_step=4306.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  26%|██▌       | 314/1208 [09:22<26:40,  1.79s/it, loss=0.154, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00389, train/loss_step=0.407, global_step=4306.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  26%|██▌       | 315/1208 [09:23<26:36,  1.79s/it, loss=0.154, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00389, train/loss_step=0.407, global_step=4306.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  26%|██▌       | 315/1208 [09:23<26:36,  1.79s/it, loss=0.155, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000411, train/loss_step=0.125, global_step=4306.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  26%|██▌       | 316/1208 [09:26<26:38,  1.79s/it, loss=0.155, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000411, train/loss_step=0.125, global_step=4306.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  26%|██▌       | 316/1208 [09:26<26:38,  1.79s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.66e-5, train/loss_step=0.0126, global_step=4306.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  26%|██▌       | 317/1208 [09:27<26:34,  1.79s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.66e-5, train/loss_step=0.0126, global_step=4306.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  26%|██▌       | 317/1208 [09:27<26:34,  1.79s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000109, train/loss_step=0.0272, global_step=4307.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  26%|██▋       | 318/1208 [09:28<26:30,  1.79s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000109, train/loss_step=0.0272, global_step=4307.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  26%|██▋       | 318/1208 [09:28<26:30,  1.79s/it, loss=0.149, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000719, train/loss_step=0.193, global_step=4307.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  26%|██▋       | 319/1208 [09:29<26:26,  1.79s/it, loss=0.149, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000719, train/loss_step=0.193, global_step=4307.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  26%|██▋       | 319/1208 [09:29<26:26,  1.79s/it, loss=0.148, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000445, train/loss_step=0.135, global_step=4307.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  26%|██▋       | 320/1208 [09:32<26:29,  1.79s/it, loss=0.148, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000445, train/loss_step=0.135, global_step=4307.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  26%|██▋       | 320/1208 [09:32<26:29,  1.79s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0771, train/loss_vlb_step=0.000254, train/loss_step=0.0771, global_step=4307.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  27%|██▋       | 321/1208 [09:33<26:25,  1.79s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0771, train/loss_vlb_step=0.000254, train/loss_step=0.0771, global_step=4307.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  27%|██▋       | 321/1208 [09:33<26:25,  1.79s/it, loss=0.133, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000521, train/loss_step=0.155, global_step=4308.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  27%|██▋       | 322/1208 [09:34<26:21,  1.79s/it, loss=0.133, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000521, train/loss_step=0.155, global_step=4308.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  27%|██▋       | 322/1208 [09:34<26:21,  1.79s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0447, train/loss_vlb_step=0.000161, train/loss_step=0.0447, global_step=4308.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  27%|██▋       | 323/1208 [09:35<26:17,  1.78s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0447, train/loss_vlb_step=0.000161, train/loss_step=0.0447, global_step=4308.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  27%|██▋       | 323/1208 [09:35<26:17,  1.78s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.4e-5, train/loss_step=0.0117, global_step=4308.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  27%|██▋       | 324/1208 [09:39<26:20,  1.79s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.4e-5, train/loss_step=0.0117, global_step=4308.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  27%|██▋       | 324/1208 [09:39<26:20,  1.79s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.51e-5, train/loss_step=0.0123, global_step=4308.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  27%|██▋       | 325/1208 [09:40<26:16,  1.79s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.51e-5, train/loss_step=0.0123, global_step=4308.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  27%|██▋       | 325/1208 [09:40<26:16,  1.79s/it, loss=0.14, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000866, train/loss_step=0.229, global_step=4309.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  27%|██▋       | 326/1208 [09:41<26:12,  1.78s/it, loss=0.14, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000866, train/loss_step=0.229, global_step=4309.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  27%|██▋       | 326/1208 [09:41<26:12,  1.78s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.26e-5, train/loss_step=0.0147, global_step=4309.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  27%|██▋       | 327/1208 [09:42<26:08,  1.78s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.26e-5, train/loss_step=0.0147, global_step=4309.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  27%|██▋       | 327/1208 [09:42<26:08,  1.78s/it, loss=0.137, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000497, train/loss_step=0.150, global_step=4309.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  27%|██▋       | 328/1208 [09:45<26:10,  1.78s/it, loss=0.137, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000497, train/loss_step=0.150, global_step=4309.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  27%|██▋       | 328/1208 [09:45<26:10,  1.78s/it, loss=0.152, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00128, train/loss_step=0.292, global_step=4309.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  27%|██▋       | 329/1208 [09:46<26:07,  1.78s/it, loss=0.152, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00128, train/loss_step=0.292, global_step=4309.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  27%|██▋       | 329/1208 [09:46<26:07,  1.78s/it, loss=0.127, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000544, train/loss_step=0.161, global_step=4310.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  27%|██▋       | 330/1208 [09:47<26:03,  1.78s/it, loss=0.127, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000544, train/loss_step=0.161, global_step=4310.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  27%|██▋       | 330/1208 [09:47<26:03,  1.78s/it, loss=0.133, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.00086, train/loss_step=0.218, global_step=4310.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  27%|██▋       | 331/1208 [09:48<25:59,  1.78s/it, loss=0.133, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.00086, train/loss_step=0.218, global_step=4310.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  27%|██▋       | 331/1208 [09:48<25:59,  1.78s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0855, train/loss_vlb_step=0.000283, train/loss_step=0.0855, global_step=4310.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  27%|██▋       | 332/1208 [09:51<26:01,  1.78s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0855, train/loss_vlb_step=0.000283, train/loss_step=0.0855, global_step=4310.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  27%|██▋       | 332/1208 [09:51<26:01,  1.78s/it, loss=0.138, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00371, train/loss_step=0.399, global_step=4310.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  28%|██▊       | 333/1208 [09:52<25:57,  1.78s/it, loss=0.138, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00371, train/loss_step=0.399, global_step=4310.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  28%|██▊       | 333/1208 [09:52<25:58,  1.78s/it, loss=0.151, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00123, train/loss_step=0.271, global_step=4311.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  28%|██▊       | 334/1208 [09:53<25:54,  1.78s/it, loss=0.151, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00123, train/loss_step=0.271, global_step=4311.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  28%|██▊       | 334/1208 [09:53<25:54,  1.78s/it, loss=0.145, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.0012, train/loss_step=0.282, global_step=4311.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  28%|██▊       | 335/1208 [09:55<25:50,  1.78s/it, loss=0.145, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.0012, train/loss_step=0.282, global_step=4311.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  28%|██▊       | 335/1208 [09:55<25:50,  1.78s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000144, train/loss_step=0.0407, global_step=4311.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  28%|██▊       | 336/1208 [09:58<25:52,  1.78s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000144, train/loss_step=0.0407, global_step=4311.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  28%|██▊       | 336/1208 [09:58<25:52,  1.78s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0423, train/loss_vlb_step=0.000155, train/loss_step=0.0423, global_step=4311.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  28%|██▊       | 337/1208 [09:59<25:48,  1.78s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0423, train/loss_vlb_step=0.000155, train/loss_step=0.0423, global_step=4311.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  28%|██▊       | 337/1208 [09:59<25:48,  1.78s/it, loss=0.156, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00135, train/loss_step=0.300, global_step=4312.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  28%|██▊       | 338/1208 [10:00<25:45,  1.78s/it, loss=0.156, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00135, train/loss_step=0.300, global_step=4312.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  28%|██▊       | 338/1208 [10:00<25:45,  1.78s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=6.96e-5, train/loss_step=0.0168, global_step=4312.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  28%|██▊       | 339/1208 [10:01<25:41,  1.77s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=6.96e-5, train/loss_step=0.0168, global_step=4312.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  28%|██▊       | 339/1208 [10:01<25:41,  1.77s/it, loss=0.142, v_num=0, train/loss_simple_step=0.040, train/loss_vlb_step=0.000141, train/loss_step=0.040, global_step=4312.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  28%|██▊       | 340/1208 [10:04<25:43,  1.78s/it, loss=0.142, v_num=0, train/loss_simple_step=0.040, train/loss_vlb_step=0.000141, train/loss_step=0.040, global_step=4312.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  28%|██▊       | 340/1208 [10:04<25:43,  1.78s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.61e-5, train/loss_step=0.00289, global_step=4312.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  28%|██▊       | 341/1208 [10:05<25:40,  1.78s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.61e-5, train/loss_step=0.00289, global_step=4312.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  28%|██▊       | 341/1208 [10:05<25:40,  1.78s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00457, train/loss_vlb_step=2.42e-5, train/loss_step=0.00457, global_step=4313.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  28%|██▊       | 342/1208 [10:06<25:36,  1.77s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00457, train/loss_vlb_step=2.42e-5, train/loss_step=0.00457, global_step=4313.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  28%|██▊       | 342/1208 [10:06<25:36,  1.77s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0818, train/loss_vlb_step=0.00027, train/loss_step=0.0818, global_step=4313.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  28%|██▊       | 343/1208 [10:07<25:32,  1.77s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0818, train/loss_vlb_step=0.00027, train/loss_step=0.0818, global_step=4313.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  28%|██▊       | 343/1208 [10:07<25:32,  1.77s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=1.89e-5, train/loss_step=0.00326, global_step=4313.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  28%|██▊       | 344/1208 [10:11<25:34,  1.78s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=1.89e-5, train/loss_step=0.00326, global_step=4313.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  28%|██▊       | 344/1208 [10:11<25:34,  1.78s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0695, train/loss_vlb_step=0.000238, train/loss_step=0.0695, global_step=4313.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  29%|██▊       | 345/1208 [10:12<25:31,  1.77s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0695, train/loss_vlb_step=0.000238, train/loss_step=0.0695, global_step=4313.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  29%|██▊       | 345/1208 [10:12<25:31,  1.77s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.53e-5, train/loss_step=0.0238, global_step=4314.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  29%|██▊       | 346/1208 [10:13<25:27,  1.77s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.53e-5, train/loss_step=0.0238, global_step=4314.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  29%|██▊       | 346/1208 [10:13<25:27,  1.77s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0752, train/loss_vlb_step=0.000251, train/loss_step=0.0752, global_step=4314.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  29%|██▊       | 347/1208 [10:14<25:24,  1.77s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0752, train/loss_vlb_step=0.000251, train/loss_step=0.0752, global_step=4314.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  29%|██▊       | 347/1208 [10:14<25:24,  1.77s/it, loss=0.147, v_num=0, train/loss_simple_step=0.524, train/loss_vlb_step=0.00482, train/loss_step=0.524, global_step=4314.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  29%|██▉       | 348/1208 [10:17<25:25,  1.77s/it, loss=0.147, v_num=0, train/loss_simple_step=0.524, train/loss_vlb_step=0.00482, train/loss_step=0.524, global_step=4314.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  29%|██▉       | 348/1208 [10:17<25:25,  1.77s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.45e-5, train/loss_step=0.0153, global_step=4314.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  29%|██▉       | 349/1208 [10:18<25:22,  1.77s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.45e-5, train/loss_step=0.0153, global_step=4314.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  29%|██▉       | 349/1208 [10:18<25:22,  1.77s/it, loss=0.132, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000446, train/loss_step=0.136, global_step=4315.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  29%|██▉       | 350/1208 [10:19<25:18,  1.77s/it, loss=0.132, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000446, train/loss_step=0.136, global_step=4315.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  29%|██▉       | 350/1208 [10:19<25:18,  1.77s/it, loss=0.132, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000841, train/loss_step=0.226, global_step=4315.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  29%|██▉       | 351/1208 [10:20<25:15,  1.77s/it, loss=0.132, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000841, train/loss_step=0.226, global_step=4315.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  29%|██▉       | 351/1208 [10:20<25:15,  1.77s/it, loss=0.138, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000868, train/loss_step=0.206, global_step=4315.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  29%|██▉       | 352/1208 [10:23<25:17,  1.77s/it, loss=0.138, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000868, train/loss_step=0.206, global_step=4315.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  29%|██▉       | 352/1208 [10:23<25:17,  1.77s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0737, train/loss_vlb_step=0.000244, train/loss_step=0.0737, global_step=4315.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  29%|██▉       | 353/1208 [10:24<25:13,  1.77s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0737, train/loss_vlb_step=0.000244, train/loss_step=0.0737, global_step=4315.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  29%|██▉       | 353/1208 [10:24<25:13,  1.77s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0962, train/loss_vlb_step=0.000319, train/loss_step=0.0962, global_step=4316.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  29%|██▉       | 354/1208 [10:25<25:10,  1.77s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0962, train/loss_vlb_step=0.000319, train/loss_step=0.0962, global_step=4316.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  29%|██▉       | 354/1208 [10:25<25:10,  1.77s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0539, train/loss_vlb_step=0.00019, train/loss_step=0.0539, global_step=4316.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  29%|██▉       | 355/1208 [10:27<25:06,  1.77s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0539, train/loss_vlb_step=0.00019, train/loss_step=0.0539, global_step=4316.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  29%|██▉       | 355/1208 [10:27<25:06,  1.77s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.00438, train/loss_vlb_step=2.32e-5, train/loss_step=0.00438, global_step=4316.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  29%|██▉       | 356/1208 [10:30<25:08,  1.77s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.00438, train/loss_vlb_step=2.32e-5, train/loss_step=0.00438, global_step=4316.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  29%|██▉       | 356/1208 [10:30<25:08,  1.77s/it, loss=0.104, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000423, train/loss_step=0.129, global_step=4316.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  30%|██▉       | 357/1208 [10:31<25:04,  1.77s/it, loss=0.104, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000423, train/loss_step=0.129, global_step=4316.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  30%|██▉       | 357/1208 [10:31<25:05,  1.77s/it, loss=0.0892, v_num=0, train/loss_simple_step=0.00269, train/loss_vlb_step=1.52e-5, train/loss_step=0.00269, global_step=4317.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  30%|██▉       | 358/1208 [10:32<25:01,  1.77s/it, loss=0.0892, v_num=0, train/loss_simple_step=0.00269, train/loss_vlb_step=1.52e-5, train/loss_step=0.00269, global_step=4317.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  30%|██▉       | 358/1208 [10:32<25:01,  1.77s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.0634, train/loss_vlb_step=0.000218, train/loss_step=0.0634, global_step=4317.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  30%|██▉       | 359/1208 [10:33<24:58,  1.76s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.0634, train/loss_vlb_step=0.000218, train/loss_step=0.0634, global_step=4317.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  30%|██▉       | 359/1208 [10:33<24:58,  1.76s/it, loss=0.0898, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=2.77e-5, train/loss_step=0.00526, global_step=4317.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  30%|██▉       | 360/1208 [10:36<24:59,  1.77s/it, loss=0.0898, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=2.77e-5, train/loss_step=0.00526, global_step=4317.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  30%|██▉       | 360/1208 [10:36<24:59,  1.77s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.00065, train/loss_step=0.184, global_step=4317.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  30%|██▉       | 361/1208 [10:37<24:56,  1.77s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.00065, train/loss_step=0.184, global_step=4317.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  30%|██▉       | 361/1208 [10:37<24:56,  1.77s/it, loss=0.108, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000652, train/loss_step=0.181, global_step=4318.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  30%|██▉       | 362/1208 [10:38<24:52,  1.76s/it, loss=0.108, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000652, train/loss_step=0.181, global_step=4318.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  30%|██▉       | 362/1208 [10:38<24:52,  1.76s/it, loss=0.109, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=4318.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  30%|███       | 363/1208 [10:39<24:49,  1.76s/it, loss=0.109, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=4318.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  30%|███       | 363/1208 [10:39<24:49,  1.76s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=2.11e-5, train/loss_step=0.00388, global_step=4318.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  30%|███       | 364/1208 [10:43<24:51,  1.77s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=2.11e-5, train/loss_step=0.00388, global_step=4318.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  30%|███       | 364/1208 [10:43<24:51,  1.77s/it, loss=0.118, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000844, train/loss_step=0.237, global_step=4318.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  30%|███       | 365/1208 [10:44<24:47,  1.76s/it, loss=0.118, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000844, train/loss_step=0.237, global_step=4318.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  30%|███       | 365/1208 [10:44<24:47,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.592, train/loss_vlb_step=0.0124, train/loss_step=0.592, global_step=4319.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  30%|███       | 366/1208 [10:45<24:44,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.592, train/loss_vlb_step=0.0124, train/loss_step=0.592, global_step=4319.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  30%|███       | 366/1208 [10:45<24:44,  1.76s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00447, train/loss_vlb_step=2.33e-5, train/loss_step=0.00447, global_step=4319.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  30%|███       | 367/1208 [10:46<24:40,  1.76s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00447, train/loss_vlb_step=2.33e-5, train/loss_step=0.00447, global_step=4319.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  30%|███       | 367/1208 [10:46<24:40,  1.76s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.22e-5, train/loss_step=0.0021, global_step=4319.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  30%|███       | 368/1208 [10:49<24:42,  1.76s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.22e-5, train/loss_step=0.0021, global_step=4319.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  30%|███       | 368/1208 [10:49<24:42,  1.76s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.00017, train/loss_step=0.0476, global_step=4319.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  31%|███       | 369/1208 [10:50<24:39,  1.76s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.00017, train/loss_step=0.0476, global_step=4319.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  31%|███       | 369/1208 [10:50<24:39,  1.76s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0712, train/loss_vlb_step=0.000241, train/loss_step=0.0712, global_step=4320.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  31%|███       | 370/1208 [10:51<24:35,  1.76s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0712, train/loss_vlb_step=0.000241, train/loss_step=0.0712, global_step=4320.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  31%|███       | 370/1208 [10:51<24:35,  1.76s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000136, train/loss_step=0.0364, global_step=4320.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  31%|███       | 371/1208 [10:52<24:32,  1.76s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000136, train/loss_step=0.0364, global_step=4320.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  31%|███       | 371/1208 [10:52<24:32,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00213, train/loss_step=0.356, global_step=4320.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  31%|███       | 372/1208 [10:55<24:33,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00213, train/loss_step=0.356, global_step=4320.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  31%|███       | 372/1208 [10:55<24:33,  1.76s/it, loss=0.116, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000424, train/loss_step=0.129, global_step=4320.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  31%|███       | 373/1208 [10:56<24:30,  1.76s/it, loss=0.116, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000424, train/loss_step=0.129, global_step=4320.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  31%|███       | 373/1208 [10:56<24:30,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000154, train/loss_step=0.0437, global_step=4321.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  31%|███       | 374/1208 [10:57<24:27,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000154, train/loss_step=0.0437, global_step=4321.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  31%|███       | 374/1208 [10:57<24:27,  1.76s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00994, train/loss_vlb_step=4.73e-5, train/loss_step=0.00994, global_step=4321.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  31%|███       | 375/1208 [10:58<24:23,  1.76s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00994, train/loss_vlb_step=4.73e-5, train/loss_step=0.00994, global_step=4321.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  31%|███       | 375/1208 [10:58<24:23,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000565, train/loss_step=0.162, global_step=4321.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  31%|███       | 376/1208 [11:02<24:25,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000565, train/loss_step=0.162, global_step=4321.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  31%|███       | 376/1208 [11:02<24:25,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00778, train/loss_vlb_step=3.81e-5, train/loss_step=0.00778, global_step=4321.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  31%|███       | 377/1208 [11:03<24:21,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00778, train/loss_vlb_step=3.81e-5, train/loss_step=0.00778, global_step=4321.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  31%|███       | 377/1208 [11:03<24:21,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00994, train/loss_vlb_step=4.85e-5, train/loss_step=0.00994, global_step=4322.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  31%|███▏      | 378/1208 [11:04<24:18,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00994, train/loss_vlb_step=4.85e-5, train/loss_step=0.00994, global_step=4322.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  31%|███▏      | 378/1208 [11:04<24:18,  1.76s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0926, train/loss_vlb_step=0.000304, train/loss_step=0.0926, global_step=4322.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  31%|███▏      | 379/1208 [11:05<24:15,  1.76s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0926, train/loss_vlb_step=0.000304, train/loss_step=0.0926, global_step=4322.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  31%|███▏      | 379/1208 [11:05<24:15,  1.76s/it, loss=0.121, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000456, train/loss_step=0.138, global_step=4322.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  31%|███▏      | 380/1208 [11:08<24:16,  1.76s/it, loss=0.121, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000456, train/loss_step=0.138, global_step=4322.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  31%|███▏      | 380/1208 [11:08<24:16,  1.76s/it, loss=0.125, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00105, train/loss_step=0.265, global_step=4322.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  32%|███▏      | 381/1208 [11:09<24:13,  1.76s/it, loss=0.125, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00105, train/loss_step=0.265, global_step=4322.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  32%|███▏      | 381/1208 [11:09<24:13,  1.76s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.27e-5, train/loss_step=0.0022, global_step=4323.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  32%|███▏      | 382/1208 [11:10<24:10,  1.76s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.27e-5, train/loss_step=0.0022, global_step=4323.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  32%|███▏      | 382/1208 [11:10<24:10,  1.76s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=2.7e-5, train/loss_step=0.00526, global_step=4323.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  32%|███▏      | 383/1208 [11:11<24:06,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=2.7e-5, train/loss_step=0.00526, global_step=4323.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  32%|███▏      | 383/1208 [11:11<24:06,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00431, train/loss_vlb_step=2.26e-5, train/loss_step=0.00431, global_step=4323.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  32%|███▏      | 384/1208 [11:14<24:08,  1.76s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00431, train/loss_vlb_step=2.26e-5, train/loss_step=0.00431, global_step=4323.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  32%|███▏      | 384/1208 [11:14<24:08,  1.76s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=8.08e-5, train/loss_step=0.0193, global_step=4323.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  32%|███▏      | 385/1208 [11:15<24:04,  1.76s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=8.08e-5, train/loss_step=0.0193, global_step=4323.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  32%|███▏      | 385/1208 [11:15<24:04,  1.76s/it, loss=0.0706, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=2.52e-5, train/loss_step=0.00481, global_step=4324.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  32%|███▏      | 386/1208 [11:16<24:01,  1.75s/it, loss=0.0706, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=2.52e-5, train/loss_step=0.00481, global_step=4324.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  32%|███▏      | 386/1208 [11:16<24:01,  1.75s/it, loss=0.0725, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.00015, train/loss_step=0.0417, global_step=4324.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  32%|███▏      | 387/1208 [11:18<23:58,  1.75s/it, loss=0.0725, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.00015, train/loss_step=0.0417, global_step=4324.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  32%|███▏      | 387/1208 [11:18<23:58,  1.75s/it, loss=0.0765, v_num=0, train/loss_simple_step=0.0833, train/loss_vlb_step=0.000274, train/loss_step=0.0833, global_step=4324.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  32%|███▏      | 388/1208 [11:21<23:59,  1.76s/it, loss=0.0765, v_num=0, train/loss_simple_step=0.0833, train/loss_vlb_step=0.000274, train/loss_step=0.0833, global_step=4324.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  32%|███▏      | 388/1208 [11:21<23:59,  1.76s/it, loss=0.08, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.00039, train/loss_step=0.118, global_step=4324.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]     Epoch 14:  32%|███▏      | 389/1208 [11:22<23:56,  1.75s/it, loss=0.08, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.00039, train/loss_step=0.118, global_step=4324.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  32%|███▏      | 389/1208 [11:22<23:56,  1.75s/it, loss=0.077, v_num=0, train/loss_simple_step=0.00993, train/loss_vlb_step=4.65e-5, train/loss_step=0.00993, global_step=4325.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  32%|███▏      | 390/1208 [11:23<23:53,  1.75s/it, loss=0.077, v_num=0, train/loss_simple_step=0.00993, train/loss_vlb_step=4.65e-5, train/loss_step=0.00993, global_step=4325.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  32%|███▏      | 390/1208 [11:23<23:53,  1.75s/it, loss=0.084, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000632, train/loss_step=0.178, global_step=4325.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  32%|███▏      | 391/1208 [11:24<23:49,  1.75s/it, loss=0.084, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000632, train/loss_step=0.178, global_step=4325.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  32%|███▏      | 391/1208 [11:24<23:49,  1.75s/it, loss=0.0735, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000478, train/loss_step=0.145, global_step=4325.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  32%|███▏      | 392/1208 [11:27<23:51,  1.75s/it, loss=0.0735, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000478, train/loss_step=0.145, global_step=4325.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  32%|███▏      | 392/1208 [11:27<23:51,  1.75s/it, loss=0.0681, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=8.7e-5, train/loss_step=0.0221, global_step=4325.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  33%|███▎      | 393/1208 [11:28<23:48,  1.75s/it, loss=0.0681, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=8.7e-5, train/loss_step=0.0221, global_step=4325.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  33%|███▎      | 393/1208 [11:28<23:48,  1.75s/it, loss=0.0716, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000378, train/loss_step=0.114, global_step=4326.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  33%|███▎      | 394/1208 [11:29<23:44,  1.75s/it, loss=0.0716, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000378, train/loss_step=0.114, global_step=4326.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  33%|███▎      | 394/1208 [11:29<23:44,  1.75s/it, loss=0.073, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000143, train/loss_step=0.0381, global_step=4326.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  33%|███▎      | 395/1208 [11:30<23:41,  1.75s/it, loss=0.073, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000143, train/loss_step=0.0381, global_step=4326.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  33%|███▎      | 395/1208 [11:30<23:41,  1.75s/it, loss=0.0661, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=8.68e-5, train/loss_step=0.0229, global_step=4326.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  33%|███▎      | 396/1208 [11:33<23:42,  1.75s/it, loss=0.0661, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=8.68e-5, train/loss_step=0.0229, global_step=4326.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  33%|███▎      | 396/1208 [11:33<23:42,  1.75s/it, loss=0.0661, v_num=0, train/loss_simple_step=0.00737, train/loss_vlb_step=3.6e-5, train/loss_step=0.00737, global_step=4326.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  33%|███▎      | 397/1208 [11:35<23:39,  1.75s/it, loss=0.0661, v_num=0, train/loss_simple_step=0.00737, train/loss_vlb_step=3.6e-5, train/loss_step=0.00737, global_step=4326.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  33%|███▎      | 397/1208 [11:35<23:39,  1.75s/it, loss=0.0668, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000102, train/loss_step=0.0254, global_step=4327.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  33%|███▎      | 398/1208 [11:36<23:36,  1.75s/it, loss=0.0668, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000102, train/loss_step=0.0254, global_step=4327.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  33%|███▎      | 398/1208 [11:36<23:36,  1.75s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.689, train/loss_vlb_step=0.0875, train/loss_step=0.689, global_step=4327.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  33%|███▎      | 399/1208 [11:37<23:33,  1.75s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.689, train/loss_vlb_step=0.0875, train/loss_step=0.689, global_step=4327.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  33%|███▎      | 399/1208 [11:37<23:33,  1.75s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.72e-5, train/loss_step=0.0101, global_step=4327.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  33%|███▎      | 400/1208 [11:40<23:34,  1.75s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.72e-5, train/loss_step=0.0101, global_step=4327.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  33%|███▎      | 400/1208 [11:40<23:34,  1.75s/it, loss=0.0826, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000373, train/loss_step=0.113, global_step=4327.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  33%|███▎      | 401/1208 [11:41<23:31,  1.75s/it, loss=0.0826, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000373, train/loss_step=0.113, global_step=4327.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  33%|███▎      | 401/1208 [11:41<23:31,  1.75s/it, loss=0.084, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000111, train/loss_step=0.0302, global_step=4328.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  33%|███▎      | 402/1208 [11:42<23:28,  1.75s/it, loss=0.084, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000111, train/loss_step=0.0302, global_step=4328.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  33%|███▎      | 402/1208 [11:42<23:28,  1.75s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000512, train/loss_step=0.150, global_step=4328.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  33%|███▎      | 403/1208 [11:43<23:25,  1.75s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000512, train/loss_step=0.150, global_step=4328.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  33%|███▎      | 403/1208 [11:43<23:25,  1.75s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000486, train/loss_step=0.147, global_step=4328.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  33%|███▎      | 404/1208 [11:46<23:26,  1.75s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000486, train/loss_step=0.147, global_step=4328.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  33%|███▎      | 404/1208 [11:46<23:26,  1.75s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.94e-5, train/loss_step=0.0158, global_step=4328.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  34%|███▎      | 405/1208 [11:47<23:23,  1.75s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.94e-5, train/loss_step=0.0158, global_step=4328.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  34%|███▎      | 405/1208 [11:47<23:23,  1.75s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.000163, train/loss_step=0.0456, global_step=4329.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  34%|███▎      | 406/1208 [11:48<23:20,  1.75s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.000163, train/loss_step=0.0456, global_step=4329.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  34%|███▎      | 406/1208 [11:48<23:20,  1.75s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.00706, train/loss_vlb_step=3.47e-5, train/loss_step=0.00706, global_step=4329.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  34%|███▎      | 407/1208 [11:49<23:16,  1.74s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.00706, train/loss_vlb_step=3.47e-5, train/loss_step=0.00706, global_step=4329.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  34%|███▎      | 407/1208 [11:49<23:16,  1.74s/it, loss=0.1, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000373, train/loss_step=0.114, global_step=4329.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]      Epoch 14:  34%|███▍      | 408/1208 [11:53<23:18,  1.75s/it, loss=0.1, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000373, train/loss_step=0.114, global_step=4329.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  34%|███▍      | 408/1208 [11:53<23:18,  1.75s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.14e-5, train/loss_step=0.0119, global_step=4329.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  34%|███▍      | 409/1208 [11:54<23:15,  1.75s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.14e-5, train/loss_step=0.0119, global_step=4329.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  34%|███▍      | 409/1208 [11:54<23:15,  1.75s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=1.56e-5, train/loss_step=0.00271, global_step=4330.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  34%|███▍      | 410/1208 [11:55<23:12,  1.74s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=1.56e-5, train/loss_step=0.00271, global_step=4330.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  34%|███▍      | 410/1208 [11:55<23:12,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00162, train/loss_step=0.321, global_step=4330.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]     Epoch 14:  34%|███▍      | 411/1208 [11:56<23:08,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00162, train/loss_step=0.321, global_step=4330.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  34%|███▍      | 411/1208 [11:56<23:08,  1.74s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.000184, train/loss_step=0.0521, global_step=4330.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  34%|███▍      | 412/1208 [11:59<23:10,  1.75s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.000184, train/loss_step=0.0521, global_step=4330.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  34%|███▍      | 412/1208 [11:59<23:10,  1.75s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.00023, train/loss_step=0.067, global_step=4330.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  34%|███▍      | 413/1208 [12:00<23:07,  1.74s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.00023, train/loss_step=0.067, global_step=4330.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  34%|███▍      | 413/1208 [12:00<23:07,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00316, train/loss_step=0.398, global_step=4331.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  34%|███▍      | 414/1208 [12:01<23:03,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00316, train/loss_step=0.398, global_step=4331.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  34%|███▍      | 414/1208 [12:01<23:03,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000524, train/loss_step=0.152, global_step=4331.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  34%|███▍      | 415/1208 [12:02<23:00,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000524, train/loss_step=0.152, global_step=4331.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  34%|███▍      | 415/1208 [12:02<23:00,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000144, train/loss_step=0.0388, global_step=4331.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  34%|███▍      | 416/1208 [12:05<23:02,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000144, train/loss_step=0.0388, global_step=4331.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  34%|███▍      | 416/1208 [12:05<23:02,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0666, train/loss_vlb_step=0.000227, train/loss_step=0.0666, global_step=4331.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  35%|███▍      | 417/1208 [12:06<22:58,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0666, train/loss_vlb_step=0.000227, train/loss_step=0.0666, global_step=4331.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  35%|███▍      | 417/1208 [12:06<22:58,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0972, train/loss_vlb_step=0.00032, train/loss_step=0.0972, global_step=4332.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  35%|███▍      | 418/1208 [12:08<22:55,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0972, train/loss_vlb_step=0.00032, train/loss_step=0.0972, global_step=4332.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  35%|███▍      | 418/1208 [12:08<22:55,  1.74s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.85e-5, train/loss_step=0.0157, global_step=4332.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  35%|███▍      | 419/1208 [12:09<22:52,  1.74s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.85e-5, train/loss_step=0.0157, global_step=4332.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  35%|███▍      | 419/1208 [12:09<22:52,  1.74s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.0907, train/loss_vlb_step=0.000302, train/loss_step=0.0907, global_step=4332.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  35%|███▍      | 420/1208 [12:11<22:53,  1.74s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.0907, train/loss_vlb_step=0.000302, train/loss_step=0.0907, global_step=4332.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  35%|███▍      | 420/1208 [12:11<22:53,  1.74s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000484, train/loss_step=0.143, global_step=4332.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  35%|███▍      | 421/1208 [12:12<22:50,  1.74s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000484, train/loss_step=0.143, global_step=4332.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  35%|███▍      | 421/1208 [12:12<22:50,  1.74s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.25e-5, train/loss_step=0.0021, global_step=4333.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  35%|███▍      | 422/1208 [12:13<22:47,  1.74s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.25e-5, train/loss_step=0.0021, global_step=4333.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  35%|███▍      | 422/1208 [12:13<22:47,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00174, train/loss_step=0.320, global_step=4333.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  35%|███▌      | 423/1208 [12:15<22:44,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00174, train/loss_step=0.320, global_step=4333.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  35%|███▌      | 423/1208 [12:15<22:44,  1.74s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000123, train/loss_step=0.0308, global_step=4333.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  35%|███▌      | 424/1208 [12:17<22:44,  1.74s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000123, train/loss_step=0.0308, global_step=4333.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  35%|███▌      | 424/1208 [12:17<22:44,  1.74s/it, loss=0.0993, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.03e-5, train/loss_step=0.0111, global_step=4333.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  35%|███▌      | 425/1208 [12:18<22:41,  1.74s/it, loss=0.0993, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.03e-5, train/loss_step=0.0111, global_step=4333.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  35%|███▌      | 425/1208 [12:18<22:41,  1.74s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.82e-5, train/loss_step=0.0245, global_step=4334.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  35%|███▌      | 426/1208 [12:19<22:38,  1.74s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.82e-5, train/loss_step=0.0245, global_step=4334.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  35%|███▌      | 426/1208 [12:19<22:38,  1.74s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.39e-5, train/loss_step=0.017, global_step=4334.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  35%|███▌      | 427/1208 [12:20<22:35,  1.74s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.39e-5, train/loss_step=0.017, global_step=4334.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  35%|███▌      | 427/1208 [12:20<22:35,  1.74s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.0913, train/loss_vlb_step=0.000301, train/loss_step=0.0913, global_step=4334.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  35%|███▌      | 428/1208 [12:23<22:35,  1.74s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.0913, train/loss_vlb_step=0.000301, train/loss_step=0.0913, global_step=4334.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  35%|███▌      | 428/1208 [12:23<22:35,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.456, train/loss_vlb_step=0.00415, train/loss_step=0.456, global_step=4334.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]     Epoch 14:  36%|███▌      | 429/1208 [12:24<22:32,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.456, train/loss_vlb_step=0.00415, train/loss_step=0.456, global_step=4334.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  36%|███▌      | 429/1208 [12:24<22:32,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000348, train/loss_step=0.106, global_step=4335.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  36%|███▌      | 430/1208 [12:25<22:29,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000348, train/loss_step=0.106, global_step=4335.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  36%|███▌      | 430/1208 [12:25<22:29,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.044, train/loss_vlb_step=0.000159, train/loss_step=0.044, global_step=4335.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  36%|███▌      | 431/1208 [12:26<22:26,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.044, train/loss_vlb_step=0.000159, train/loss_step=0.044, global_step=4335.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  36%|███▌      | 431/1208 [12:26<22:26,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.41e-5, train/loss_step=0.0142, global_step=4335.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  36%|███▌      | 432/1208 [12:29<22:26,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.41e-5, train/loss_step=0.0142, global_step=4335.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  36%|███▌      | 432/1208 [12:29<22:26,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00185, train/loss_step=0.342, global_step=4335.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  36%|███▌      | 433/1208 [12:30<22:23,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00185, train/loss_step=0.342, global_step=4335.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  36%|███▌      | 433/1208 [12:30<22:23,  1.73s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=8.17e-5, train/loss_step=0.0195, global_step=4336.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  36%|███▌      | 434/1208 [12:31<22:20,  1.73s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=8.17e-5, train/loss_step=0.0195, global_step=4336.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  36%|███▌      | 434/1208 [12:31<22:20,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.0033, train/loss_step=0.402, global_step=4336.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  36%|███▌      | 435/1208 [12:32<22:17,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.0033, train/loss_step=0.402, global_step=4336.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  36%|███▌      | 435/1208 [12:32<22:17,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.46e-5, train/loss_step=0.0173, global_step=4336.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  36%|███▌      | 436/1208 [12:35<22:17,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.46e-5, train/loss_step=0.0173, global_step=4336.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  36%|███▌      | 436/1208 [12:35<22:17,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00213, train/loss_step=0.343, global_step=4336.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  36%|███▌      | 437/1208 [12:36<22:14,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00213, train/loss_step=0.343, global_step=4336.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  36%|███▌      | 437/1208 [12:36<22:14,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.467, train/loss_vlb_step=0.00471, train/loss_step=0.467, global_step=4337.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  36%|███▋      | 438/1208 [12:37<22:11,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.467, train/loss_vlb_step=0.00471, train/loss_step=0.467, global_step=4337.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  36%|███▋      | 438/1208 [12:37<22:11,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.000176, train/loss_step=0.0485, global_step=4337.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  36%|███▋      | 439/1208 [12:38<22:08,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.000176, train/loss_step=0.0485, global_step=4337.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  36%|███▋      | 439/1208 [12:38<22:08,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000348, train/loss_step=0.106, global_step=4337.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  36%|███▋      | 440/1208 [12:41<22:09,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000348, train/loss_step=0.106, global_step=4337.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  36%|███▋      | 440/1208 [12:41<22:09,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.00052, train/loss_step=0.155, global_step=4337.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  37%|███▋      | 441/1208 [12:42<22:06,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.00052, train/loss_step=0.155, global_step=4337.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  37%|███▋      | 441/1208 [12:42<22:06,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.455, train/loss_vlb_step=0.00333, train/loss_step=0.455, global_step=4338.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  37%|███▋      | 442/1208 [12:43<22:03,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.455, train/loss_vlb_step=0.00333, train/loss_step=0.455, global_step=4338.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  37%|███▋      | 442/1208 [12:43<22:03,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.95e-5, train/loss_step=0.0219, global_step=4338.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  37%|███▋      | 443/1208 [12:44<22:00,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.95e-5, train/loss_step=0.0219, global_step=4338.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  37%|███▋      | 443/1208 [12:44<22:00,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00438, train/loss_step=0.476, global_step=4338.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  37%|███▋      | 444/1208 [12:47<22:00,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00438, train/loss_step=0.476, global_step=4338.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  37%|███▋      | 444/1208 [12:47<22:00,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=1.04e-5, train/loss_step=0.0018, global_step=4338.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  37%|███▋      | 445/1208 [12:48<21:57,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=1.04e-5, train/loss_step=0.0018, global_step=4338.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  37%|███▋      | 445/1208 [12:48<21:57,  1.73s/it, loss=0.192, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00103, train/loss_step=0.256, global_step=4339.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  37%|███▋      | 446/1208 [12:49<21:54,  1.73s/it, loss=0.192, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00103, train/loss_step=0.256, global_step=4339.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  37%|███▋      | 446/1208 [12:49<21:54,  1.73s/it, loss=0.191, v_num=0, train/loss_simple_step=0.00316, train/loss_vlb_step=1.72e-5, train/loss_step=0.00316, global_step=4339.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  37%|███▋      | 447/1208 [12:50<21:51,  1.72s/it, loss=0.191, v_num=0, train/loss_simple_step=0.00316, train/loss_vlb_step=1.72e-5, train/loss_step=0.00316, global_step=4339.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  37%|███▋      | 447/1208 [12:50<21:51,  1.72s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0618, train/loss_vlb_step=0.000214, train/loss_step=0.0618, global_step=4339.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  37%|███▋      | 448/1208 [12:53<21:51,  1.73s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0618, train/loss_vlb_step=0.000214, train/loss_step=0.0618, global_step=4339.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  37%|███▋      | 448/1208 [12:53<21:51,  1.73s/it, loss=0.176, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000583, train/loss_step=0.171, global_step=4339.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  37%|███▋      | 449/1208 [12:54<21:49,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000583, train/loss_step=0.171, global_step=4339.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  37%|███▋      | 449/1208 [12:54<21:49,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00796, train/loss_vlb_step=3.73e-5, train/loss_step=0.00796, global_step=4340.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  37%|███▋      | 450/1208 [12:55<21:46,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00796, train/loss_vlb_step=3.73e-5, train/loss_step=0.00796, global_step=4340.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  37%|███▋      | 450/1208 [12:55<21:46,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000527, train/loss_step=0.157, global_step=4340.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  37%|███▋      | 451/1208 [12:56<21:43,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000527, train/loss_step=0.157, global_step=4340.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  37%|███▋      | 451/1208 [12:56<21:43,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.03e-5, train/loss_step=0.0226, global_step=4340.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  37%|███▋      | 452/1208 [12:59<21:43,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.03e-5, train/loss_step=0.0226, global_step=4340.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  37%|███▋      | 452/1208 [12:59<21:43,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000407, train/loss_step=0.124, global_step=4340.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  38%|███▊      | 453/1208 [13:00<21:40,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000407, train/loss_step=0.124, global_step=4340.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  38%|███▊      | 453/1208 [13:00<21:40,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.079, train/loss_vlb_step=0.000262, train/loss_step=0.079, global_step=4341.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  38%|███▊      | 454/1208 [13:01<21:37,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.079, train/loss_vlb_step=0.000262, train/loss_step=0.079, global_step=4341.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  38%|███▊      | 454/1208 [13:01<21:37,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00154, train/loss_step=0.302, global_step=4341.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  38%|███▊      | 455/1208 [13:02<21:34,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00154, train/loss_step=0.302, global_step=4341.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  38%|███▊      | 455/1208 [13:02<21:34,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00583, train/loss_vlb_step=3.12e-5, train/loss_step=0.00583, global_step=4341.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  38%|███▊      | 456/1208 [13:05<21:34,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00583, train/loss_vlb_step=3.12e-5, train/loss_step=0.00583, global_step=4341.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  38%|███▊      | 456/1208 [13:05<21:34,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000107, train/loss_step=0.0268, global_step=4341.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  38%|███▊      | 457/1208 [13:06<21:32,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000107, train/loss_step=0.0268, global_step=4341.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  38%|███▊      | 457/1208 [13:06<21:32,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0927, train/loss_vlb_step=0.000305, train/loss_step=0.0927, global_step=4342.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  38%|███▊      | 458/1208 [13:07<21:29,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0927, train/loss_vlb_step=0.000305, train/loss_step=0.0927, global_step=4342.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  38%|███▊      | 458/1208 [13:07<21:29,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.00027, train/loss_step=0.0817, global_step=4342.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  38%|███▊      | 459/1208 [13:08<21:26,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.00027, train/loss_step=0.0817, global_step=4342.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  38%|███▊      | 459/1208 [13:08<21:26,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.26e-5, train/loss_step=0.00216, global_step=4342.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  38%|███▊      | 460/1208 [13:11<21:26,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.26e-5, train/loss_step=0.00216, global_step=4342.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  38%|███▊      | 460/1208 [13:11<21:26,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=4342.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  38%|███▊      | 461/1208 [13:12<21:23,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=4342.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  38%|███▊      | 461/1208 [13:12<21:23,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.54e-5, train/loss_step=0.015, global_step=4343.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  38%|███▊      | 462/1208 [13:13<21:20,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.54e-5, train/loss_step=0.015, global_step=4343.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  38%|███▊      | 462/1208 [13:13<21:20,  1.72s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.00547, train/loss_vlb_step=2.78e-5, train/loss_step=0.00547, global_step=4343.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  38%|███▊      | 463/1208 [13:14<21:17,  1.72s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.00547, train/loss_vlb_step=2.78e-5, train/loss_step=0.00547, global_step=4343.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  38%|███▊      | 463/1208 [13:14<21:17,  1.72s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.468, train/loss_vlb_step=0.00621, train/loss_step=0.468, global_step=4343.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  38%|███▊      | 464/1208 [13:17<21:18,  1.72s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.468, train/loss_vlb_step=0.00621, train/loss_step=0.468, global_step=4343.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  38%|███▊      | 464/1208 [13:17<21:18,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00115, train/loss_step=0.274, global_step=4343.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  38%|███▊      | 465/1208 [13:18<21:15,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00115, train/loss_step=0.274, global_step=4343.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  38%|███▊      | 465/1208 [13:18<21:15,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00231, train/loss_step=0.361, global_step=4344.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  39%|███▊      | 466/1208 [13:19<21:12,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00231, train/loss_step=0.361, global_step=4344.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  39%|███▊      | 466/1208 [13:19<21:12,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000438, train/loss_step=0.131, global_step=4344.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  39%|███▊      | 467/1208 [13:20<21:09,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000438, train/loss_step=0.131, global_step=4344.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  39%|███▊      | 467/1208 [13:20<21:09,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000653, train/loss_step=0.182, global_step=4344.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  39%|███▊      | 468/1208 [13:23<21:09,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000653, train/loss_step=0.182, global_step=4344.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  39%|███▊      | 468/1208 [13:23<21:09,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00133, train/loss_step=0.299, global_step=4344.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  39%|███▉      | 469/1208 [13:24<21:06,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00133, train/loss_step=0.299, global_step=4344.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  39%|███▉      | 469/1208 [13:24<21:06,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0797, train/loss_vlb_step=0.000269, train/loss_step=0.0797, global_step=4345.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  39%|███▉      | 470/1208 [13:25<21:04,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0797, train/loss_vlb_step=0.000269, train/loss_step=0.0797, global_step=4345.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  39%|███▉      | 470/1208 [13:25<21:04,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000397, train/loss_step=0.121, global_step=4345.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  39%|███▉      | 471/1208 [13:26<21:01,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000397, train/loss_step=0.121, global_step=4345.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  39%|███▉      | 471/1208 [13:26<21:01,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00215, train/loss_step=0.350, global_step=4345.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  39%|███▉      | 472/1208 [13:28<21:01,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00215, train/loss_step=0.350, global_step=4345.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  39%|███▉      | 472/1208 [13:28<21:01,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0247, train/loss_vlb_step=9.53e-5, train/loss_step=0.0247, global_step=4345.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  39%|███▉      | 473/1208 [13:29<20:58,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0247, train/loss_vlb_step=9.53e-5, train/loss_step=0.0247, global_step=4345.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  39%|███▉      | 473/1208 [13:29<20:58,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0644, train/loss_vlb_step=0.00022, train/loss_step=0.0644, global_step=4346.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  39%|███▉      | 474/1208 [13:30<20:55,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0644, train/loss_vlb_step=0.00022, train/loss_step=0.0644, global_step=4346.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  39%|███▉      | 474/1208 [13:30<20:55,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000417, train/loss_step=0.125, global_step=4346.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  39%|███▉      | 475/1208 [13:32<20:53,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000417, train/loss_step=0.125, global_step=4346.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  39%|███▉      | 475/1208 [13:32<20:53,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.47e-5, train/loss_step=0.0122, global_step=4346.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  39%|███▉      | 476/1208 [13:34<20:53,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.47e-5, train/loss_step=0.0122, global_step=4346.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  39%|███▉      | 476/1208 [13:34<20:53,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0709, train/loss_vlb_step=0.000242, train/loss_step=0.0709, global_step=4346.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  39%|███▉      | 477/1208 [13:35<20:50,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0709, train/loss_vlb_step=0.000242, train/loss_step=0.0709, global_step=4346.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  39%|███▉      | 477/1208 [13:35<20:50,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000203, train/loss_step=0.0588, global_step=4347.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  40%|███▉      | 478/1208 [13:36<20:47,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000203, train/loss_step=0.0588, global_step=4347.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  40%|███▉      | 478/1208 [13:36<20:47,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000434, train/loss_step=0.132, global_step=4347.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  40%|███▉      | 479/1208 [13:37<20:44,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000434, train/loss_step=0.132, global_step=4347.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  40%|███▉      | 479/1208 [13:37<20:44,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.000168, train/loss_step=0.0483, global_step=4347.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  40%|███▉      | 480/1208 [13:40<20:44,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.000168, train/loss_step=0.0483, global_step=4347.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  40%|███▉      | 480/1208 [13:40<20:44,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0762, train/loss_vlb_step=0.000256, train/loss_step=0.0762, global_step=4347.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  40%|███▉      | 481/1208 [13:41<20:42,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0762, train/loss_vlb_step=0.000256, train/loss_step=0.0762, global_step=4347.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  40%|███▉      | 481/1208 [13:41<20:42,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00106, train/loss_step=0.262, global_step=4348.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  40%|███▉      | 482/1208 [13:42<20:39,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00106, train/loss_step=0.262, global_step=4348.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  40%|███▉      | 482/1208 [13:42<20:39,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0582, train/loss_vlb_step=0.000204, train/loss_step=0.0582, global_step=4348.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  40%|███▉      | 483/1208 [13:43<20:36,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0582, train/loss_vlb_step=0.000204, train/loss_step=0.0582, global_step=4348.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  40%|███▉      | 483/1208 [13:43<20:36,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000125, train/loss_step=0.0325, global_step=4348.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  40%|████      | 484/1208 [13:46<20:36,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000125, train/loss_step=0.0325, global_step=4348.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  40%|████      | 484/1208 [13:46<20:36,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0917, train/loss_vlb_step=0.000301, train/loss_step=0.0917, global_step=4348.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  40%|████      | 485/1208 [13:47<20:33,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0917, train/loss_vlb_step=0.000301, train/loss_step=0.0917, global_step=4348.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  40%|████      | 485/1208 [13:47<20:33,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=4349.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  40%|████      | 486/1208 [13:48<20:31,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=4349.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  40%|████      | 486/1208 [13:48<20:31,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000866, train/loss_step=0.226, global_step=4349.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  40%|████      | 487/1208 [13:49<20:28,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000866, train/loss_step=0.226, global_step=4349.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  40%|████      | 487/1208 [13:49<20:28,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7e-5, train/loss_step=0.017, global_step=4349.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  40%|████      | 488/1208 [13:52<20:28,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7e-5, train/loss_step=0.017, global_step=4349.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  40%|████      | 488/1208 [13:52<20:28,  1.71s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.9e-5, train/loss_step=0.00351, global_step=4349.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  40%|████      | 489/1208 [13:53<20:25,  1.70s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.9e-5, train/loss_step=0.00351, global_step=4349.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  40%|████      | 489/1208 [13:53<20:25,  1.70s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000111, train/loss_step=0.0286, global_step=4350.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  41%|████      | 490/1208 [13:54<20:23,  1.70s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000111, train/loss_step=0.0286, global_step=4350.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  41%|████      | 490/1208 [13:54<20:23,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00216, train/loss_step=0.331, global_step=4350.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  41%|████      | 491/1208 [13:55<20:20,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00216, train/loss_step=0.331, global_step=4350.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  41%|████      | 491/1208 [13:55<20:20,  1.70s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000476, train/loss_step=0.139, global_step=4350.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  41%|████      | 492/1208 [13:58<20:20,  1.70s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000476, train/loss_step=0.139, global_step=4350.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  41%|████      | 492/1208 [13:58<20:20,  1.70s/it, loss=0.102, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000582, train/loss_step=0.167, global_step=4350.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  41%|████      | 493/1208 [13:59<20:17,  1.70s/it, loss=0.102, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000582, train/loss_step=0.167, global_step=4350.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  41%|████      | 493/1208 [13:59<20:17,  1.70s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=9.16e-6, train/loss_step=0.00151, global_step=4351.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  41%|████      | 494/1208 [14:00<20:14,  1.70s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=9.16e-6, train/loss_step=0.00151, global_step=4351.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  41%|████      | 494/1208 [14:00<20:14,  1.70s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.0976, train/loss_vlb_step=0.000323, train/loss_step=0.0976, global_step=4351.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  41%|████      | 495/1208 [14:01<20:12,  1.70s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.0976, train/loss_vlb_step=0.000323, train/loss_step=0.0976, global_step=4351.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  41%|████      | 495/1208 [14:01<20:12,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0768, train/loss_vlb_step=0.000262, train/loss_step=0.0768, global_step=4351.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  41%|████      | 496/1208 [14:04<20:12,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0768, train/loss_vlb_step=0.000262, train/loss_step=0.0768, global_step=4351.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  41%|████      | 496/1208 [14:04<20:12,  1.70s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.7e-5, train/loss_step=0.0155, global_step=4351.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  41%|████      | 497/1208 [14:05<20:09,  1.70s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.7e-5, train/loss_step=0.0155, global_step=4351.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  41%|████      | 497/1208 [14:05<20:09,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00154, train/loss_step=0.319, global_step=4352.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  41%|████      | 498/1208 [14:06<20:06,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00154, train/loss_step=0.319, global_step=4352.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  41%|████      | 498/1208 [14:06<20:06,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.76e-5, train/loss_step=0.0127, global_step=4352.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  41%|████▏     | 499/1208 [14:07<20:04,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.76e-5, train/loss_step=0.0127, global_step=4352.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  41%|████▏     | 499/1208 [14:07<20:04,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000619, train/loss_step=0.180, global_step=4352.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  41%|████▏     | 500/1208 [14:10<20:04,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000619, train/loss_step=0.180, global_step=4352.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  41%|████▏     | 500/1208 [14:10<20:04,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00367, train/loss_step=0.404, global_step=4352.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  41%|████▏     | 501/1208 [14:11<20:01,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00367, train/loss_step=0.404, global_step=4352.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  41%|████▏     | 501/1208 [14:11<20:01,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=1.65e-5, train/loss_step=0.00295, global_step=4353.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  42%|████▏     | 502/1208 [14:12<19:58,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=1.65e-5, train/loss_step=0.00295, global_step=4353.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  42%|████▏     | 502/1208 [14:12<19:58,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0918, train/loss_vlb_step=0.000304, train/loss_step=0.0918, global_step=4353.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  42%|████▏     | 503/1208 [14:13<19:56,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0918, train/loss_vlb_step=0.000304, train/loss_step=0.0918, global_step=4353.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  42%|████▏     | 503/1208 [14:13<19:56,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00657, train/loss_vlb_step=3.24e-5, train/loss_step=0.00657, global_step=4353.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  42%|████▏     | 504/1208 [14:16<19:56,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00657, train/loss_vlb_step=3.24e-5, train/loss_step=0.00657, global_step=4353.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  42%|████▏     | 504/1208 [14:16<19:56,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000417, train/loss_step=0.126, global_step=4353.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  42%|████▏     | 505/1208 [14:17<19:53,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000417, train/loss_step=0.126, global_step=4353.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  42%|████▏     | 505/1208 [14:17<19:53,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00709, train/loss_vlb_step=3.55e-5, train/loss_step=0.00709, global_step=4354.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  42%|████▏     | 506/1208 [14:18<19:50,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00709, train/loss_vlb_step=3.55e-5, train/loss_step=0.00709, global_step=4354.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  42%|████▏     | 506/1208 [14:18<19:50,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.533, train/loss_vlb_step=0.0111, train/loss_step=0.533, global_step=4354.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]     Epoch 14:  42%|████▏     | 507/1208 [14:19<19:48,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.533, train/loss_vlb_step=0.0111, train/loss_step=0.533, global_step=4354.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  42%|████▏     | 507/1208 [14:19<19:48,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00304, train/loss_step=0.409, global_step=4354.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  42%|████▏     | 508/1208 [14:22<19:48,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00304, train/loss_step=0.409, global_step=4354.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  42%|████▏     | 508/1208 [14:22<19:48,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00844, train/loss_vlb_step=4.14e-5, train/loss_step=0.00844, global_step=4354.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  42%|████▏     | 509/1208 [14:23<19:45,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00844, train/loss_vlb_step=4.14e-5, train/loss_step=0.00844, global_step=4354.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  42%|████▏     | 509/1208 [14:23<19:45,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0529, train/loss_vlb_step=0.00019, train/loss_step=0.0529, global_step=4355.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  42%|████▏     | 510/1208 [14:24<19:42,  1.69s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0529, train/loss_vlb_step=0.00019, train/loss_step=0.0529, global_step=4355.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  42%|████▏     | 510/1208 [14:24<19:42,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000576, train/loss_step=0.159, global_step=4355.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  42%|████▏     | 511/1208 [14:25<19:40,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000576, train/loss_step=0.159, global_step=4355.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  42%|████▏     | 511/1208 [14:25<19:40,  1.69s/it, loss=0.148, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00119, train/loss_step=0.284, global_step=4355.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  42%|████▏     | 512/1208 [14:28<19:40,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00119, train/loss_step=0.284, global_step=4355.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  42%|████▏     | 512/1208 [14:28<19:40,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.00044, train/loss_step=0.132, global_step=4355.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  42%|████▏     | 513/1208 [14:29<19:37,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.00044, train/loss_step=0.132, global_step=4355.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  42%|████▏     | 513/1208 [14:29<19:37,  1.69s/it, loss=0.158, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.00113, train/loss_step=0.238, global_step=4356.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  43%|████▎     | 514/1208 [14:30<19:34,  1.69s/it, loss=0.158, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.00113, train/loss_step=0.238, global_step=4356.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  43%|████▎     | 514/1208 [14:30<19:34,  1.69s/it, loss=0.161, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000536, train/loss_step=0.159, global_step=4356.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  43%|████▎     | 515/1208 [14:31<19:32,  1.69s/it, loss=0.161, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000536, train/loss_step=0.159, global_step=4356.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  43%|████▎     | 515/1208 [14:31<19:32,  1.69s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=1.12e-5, train/loss_step=0.00187, global_step=4356.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  43%|████▎     | 516/1208 [14:34<19:32,  1.69s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=1.12e-5, train/loss_step=0.00187, global_step=4356.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  43%|████▎     | 516/1208 [14:34<19:32,  1.69s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=0.000103, train/loss_step=0.0259, global_step=4356.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  43%|████▎     | 517/1208 [14:35<19:29,  1.69s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=0.000103, train/loss_step=0.0259, global_step=4356.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  43%|████▎     | 517/1208 [14:35<19:29,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00698, train/loss_vlb_step=3.36e-5, train/loss_step=0.00698, global_step=4357.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  43%|████▎     | 518/1208 [14:36<19:27,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00698, train/loss_vlb_step=3.36e-5, train/loss_step=0.00698, global_step=4357.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  43%|████▎     | 518/1208 [14:36<19:27,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.783, train/loss_vlb_step=0.0573, train/loss_step=0.783, global_step=4357.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]      Epoch 14:  43%|████▎     | 519/1208 [14:37<19:24,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.783, train/loss_vlb_step=0.0573, train/loss_step=0.783, global_step=4357.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  43%|████▎     | 519/1208 [14:37<19:24,  1.69s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.23e-5, train/loss_step=0.00211, global_step=4357.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  43%|████▎     | 520/1208 [14:40<19:24,  1.69s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.23e-5, train/loss_step=0.00211, global_step=4357.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  43%|████▎     | 520/1208 [14:40<19:24,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00227, train/loss_step=0.353, global_step=4357.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  43%|████▎     | 521/1208 [14:41<19:21,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00227, train/loss_step=0.353, global_step=4357.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  43%|████▎     | 521/1208 [14:41<19:21,  1.69s/it, loss=0.174, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000331, train/loss_step=0.100, global_step=4358.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  43%|████▎     | 522/1208 [14:42<19:19,  1.69s/it, loss=0.174, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000331, train/loss_step=0.100, global_step=4358.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  43%|████▎     | 522/1208 [14:42<19:19,  1.69s/it, loss=0.182, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00103, train/loss_step=0.257, global_step=4358.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  43%|████▎     | 523/1208 [14:43<19:16,  1.69s/it, loss=0.182, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00103, train/loss_step=0.257, global_step=4358.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  43%|████▎     | 523/1208 [14:43<19:16,  1.69s/it, loss=0.197, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00163, train/loss_step=0.305, global_step=4358.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  43%|████▎     | 524/1208 [14:45<19:16,  1.69s/it, loss=0.197, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00163, train/loss_step=0.305, global_step=4358.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  43%|████▎     | 524/1208 [14:45<19:16,  1.69s/it, loss=0.199, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000584, train/loss_step=0.170, global_step=4358.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  43%|████▎     | 525/1208 [14:46<19:13,  1.69s/it, loss=0.199, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000584, train/loss_step=0.170, global_step=4358.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  43%|████▎     | 525/1208 [14:46<19:13,  1.69s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.33e-5, train/loss_step=0.0143, global_step=4359.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  44%|████▎     | 526/1208 [14:47<19:11,  1.69s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.33e-5, train/loss_step=0.0143, global_step=4359.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  44%|████▎     | 526/1208 [14:47<19:11,  1.69s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00656, train/loss_vlb_step=3.3e-5, train/loss_step=0.00656, global_step=4359.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  44%|████▎     | 527/1208 [14:48<19:08,  1.69s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00656, train/loss_vlb_step=3.3e-5, train/loss_step=0.00656, global_step=4359.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  44%|████▎     | 527/1208 [14:48<19:08,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.00051, train/loss_step=0.152, global_step=4359.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  44%|████▎     | 528/1208 [14:51<19:08,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.00051, train/loss_step=0.152, global_step=4359.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  44%|████▎     | 528/1208 [14:51<19:08,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00678, train/loss_vlb_step=3.29e-5, train/loss_step=0.00678, global_step=4359.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  44%|████▍     | 529/1208 [14:52<19:06,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00678, train/loss_vlb_step=3.29e-5, train/loss_step=0.00678, global_step=4359.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  44%|████▍     | 529/1208 [14:52<19:06,  1.69s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=5.9e-5, train/loss_step=0.0138, global_step=4360.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  44%|████▍     | 530/1208 [14:53<19:03,  1.69s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=5.9e-5, train/loss_step=0.0138, global_step=4360.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  44%|████▍     | 530/1208 [14:53<19:03,  1.69s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0876, train/loss_vlb_step=0.000291, train/loss_step=0.0876, global_step=4360.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  44%|████▍     | 531/1208 [14:54<19:00,  1.69s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0876, train/loss_vlb_step=0.000291, train/loss_step=0.0876, global_step=4360.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  44%|████▍     | 531/1208 [14:54<19:00,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000193, train/loss_step=0.0555, global_step=4360.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  44%|████▍     | 532/1208 [14:57<19:00,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000193, train/loss_step=0.0555, global_step=4360.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  44%|████▍     | 532/1208 [14:57<19:00,  1.69s/it, loss=0.163, v_num=0, train/loss_simple_step=0.532, train/loss_vlb_step=0.00641, train/loss_step=0.532, global_step=4360.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  44%|████▍     | 533/1208 [14:58<18:58,  1.69s/it, loss=0.163, v_num=0, train/loss_simple_step=0.532, train/loss_vlb_step=0.00641, train/loss_step=0.532, global_step=4360.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  44%|████▍     | 533/1208 [14:58<18:58,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.42e-5, train/loss_step=0.0121, global_step=4361.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  44%|████▍     | 534/1208 [14:59<18:55,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.42e-5, train/loss_step=0.0121, global_step=4361.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  44%|████▍     | 534/1208 [14:59<18:55,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000407, train/loss_step=0.124, global_step=4361.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  44%|████▍     | 535/1208 [15:00<18:53,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000407, train/loss_step=0.124, global_step=4361.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  44%|████▍     | 535/1208 [15:00<18:53,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000449, train/loss_step=0.134, global_step=4361.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  44%|████▍     | 536/1208 [15:03<18:52,  1.69s/it, loss=0.157, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000449, train/loss_step=0.134, global_step=4361.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  44%|████▍     | 536/1208 [15:03<18:52,  1.69s/it, loss=0.163, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000483, train/loss_step=0.144, global_step=4361.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  44%|████▍     | 537/1208 [15:04<18:50,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000483, train/loss_step=0.144, global_step=4361.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  44%|████▍     | 537/1208 [15:04<18:50,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.32e-5, train/loss_step=0.0185, global_step=4362.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  45%|████▍     | 538/1208 [15:05<18:47,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.32e-5, train/loss_step=0.0185, global_step=4362.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  45%|████▍     | 538/1208 [15:05<18:47,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.89e-5, train/loss_step=0.0132, global_step=4362.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  45%|████▍     | 539/1208 [15:06<18:45,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.89e-5, train/loss_step=0.0132, global_step=4362.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  45%|████▍     | 539/1208 [15:06<18:45,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0493, train/loss_vlb_step=0.000175, train/loss_step=0.0493, global_step=4362.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  45%|████▍     | 540/1208 [15:09<18:45,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0493, train/loss_vlb_step=0.000175, train/loss_step=0.0493, global_step=4362.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  45%|████▍     | 540/1208 [15:09<18:45,  1.68s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.89e-5, train/loss_step=0.00335, global_step=4362.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  45%|████▍     | 541/1208 [15:10<18:42,  1.68s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.89e-5, train/loss_step=0.00335, global_step=4362.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  45%|████▍     | 541/1208 [15:10<18:42,  1.68s/it, loss=0.106, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.59e-5, train/loss_step=0.024, global_step=4363.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  45%|████▍     | 542/1208 [15:11<18:40,  1.68s/it, loss=0.106, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.59e-5, train/loss_step=0.024, global_step=4363.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  45%|████▍     | 542/1208 [15:11<18:40,  1.68s/it, loss=0.103, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000663, train/loss_step=0.188, global_step=4363.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  45%|████▍     | 543/1208 [15:12<18:37,  1.68s/it, loss=0.103, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000663, train/loss_step=0.188, global_step=4363.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  45%|████▍     | 543/1208 [15:12<18:37,  1.68s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000605, train/loss_step=0.179, global_step=4363.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  45%|████▌     | 544/1208 [15:15<18:37,  1.68s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000605, train/loss_step=0.179, global_step=4363.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  45%|████▌     | 544/1208 [15:15<18:37,  1.68s/it, loss=0.0901, v_num=0, train/loss_simple_step=0.0442, train/loss_vlb_step=0.00017, train/loss_step=0.0442, global_step=4363.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  45%|████▌     | 545/1208 [15:16<18:34,  1.68s/it, loss=0.0901, v_num=0, train/loss_simple_step=0.0442, train/loss_vlb_step=0.00017, train/loss_step=0.0442, global_step=4363.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  45%|████▌     | 545/1208 [15:16<18:34,  1.68s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000683, train/loss_step=0.178, global_step=4364.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  45%|████▌     | 546/1208 [15:17<18:32,  1.68s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000683, train/loss_step=0.178, global_step=4364.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  45%|████▌     | 546/1208 [15:17<18:32,  1.68s/it, loss=0.107, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000629, train/loss_step=0.184, global_step=4364.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  45%|████▌     | 547/1208 [15:18<18:29,  1.68s/it, loss=0.107, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000629, train/loss_step=0.184, global_step=4364.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  45%|████▌     | 547/1208 [15:18<18:29,  1.68s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.93e-5, train/loss_step=0.0162, global_step=4364.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  45%|████▌     | 548/1208 [15:21<18:29,  1.68s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.93e-5, train/loss_step=0.0162, global_step=4364.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  45%|████▌     | 548/1208 [15:21<18:29,  1.68s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0945, train/loss_vlb_step=0.000312, train/loss_step=0.0945, global_step=4364.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  45%|████▌     | 549/1208 [15:22<18:27,  1.68s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0945, train/loss_vlb_step=0.000312, train/loss_step=0.0945, global_step=4364.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  45%|████▌     | 549/1208 [15:22<18:27,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=4365.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  46%|████▌     | 550/1208 [15:23<18:24,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=4365.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  46%|████▌     | 550/1208 [15:23<18:24,  1.68s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.82e-5, train/loss_step=0.0104, global_step=4365.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  46%|████▌     | 551/1208 [15:24<18:22,  1.68s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.82e-5, train/loss_step=0.0104, global_step=4365.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  46%|████▌     | 551/1208 [15:24<18:22,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.921, train/loss_vlb_step=0.464, train/loss_step=0.921, global_step=4365.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  46%|████▌     | 552/1208 [15:27<18:22,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.921, train/loss_vlb_step=0.464, train/loss_step=0.921, global_step=4365.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  46%|████▌     | 552/1208 [15:27<18:22,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.00016, train/loss_step=0.0462, global_step=4365.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  46%|████▌     | 553/1208 [15:28<18:19,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.00016, train/loss_step=0.0462, global_step=4365.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  46%|████▌     | 553/1208 [15:28<18:19,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=6.85e-5, train/loss_step=0.0172, global_step=4366.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  46%|████▌     | 554/1208 [15:29<18:17,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=6.85e-5, train/loss_step=0.0172, global_step=4366.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  46%|████▌     | 554/1208 [15:29<18:17,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000418, train/loss_step=0.127, global_step=4366.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  46%|████▌     | 555/1208 [15:30<18:14,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000418, train/loss_step=0.127, global_step=4366.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  46%|████▌     | 555/1208 [15:30<18:14,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.56e-5, train/loss_step=0.019, global_step=4366.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  46%|████▌     | 556/1208 [15:33<18:14,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.56e-5, train/loss_step=0.019, global_step=4366.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  46%|████▌     | 556/1208 [15:33<18:14,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.00011, train/loss_step=0.0285, global_step=4366.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  46%|████▌     | 557/1208 [15:34<18:11,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.00011, train/loss_step=0.0285, global_step=4366.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  46%|████▌     | 557/1208 [15:34<18:11,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=3.52e-5, train/loss_step=0.00742, global_step=4367.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  46%|████▌     | 558/1208 [15:35<18:09,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=3.52e-5, train/loss_step=0.00742, global_step=4367.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  46%|████▌     | 558/1208 [15:35<18:09,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.53e-5, train/loss_step=0.0178, global_step=4367.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  46%|████▋     | 559/1208 [15:36<18:07,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.53e-5, train/loss_step=0.0178, global_step=4367.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  46%|████▋     | 559/1208 [15:36<18:07,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.0012, train/loss_step=0.271, global_step=4367.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  46%|████▋     | 560/1208 [15:39<18:06,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.0012, train/loss_step=0.271, global_step=4367.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  46%|████▋     | 560/1208 [15:39<18:06,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.571, train/loss_vlb_step=0.0105, train/loss_step=0.571, global_step=4367.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  46%|████▋     | 561/1208 [15:40<18:04,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.571, train/loss_vlb_step=0.0105, train/loss_step=0.571, global_step=4367.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  46%|████▋     | 561/1208 [15:40<18:04,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00129, train/loss_step=0.271, global_step=4368.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  47%|████▋     | 562/1208 [15:41<18:01,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00129, train/loss_step=0.271, global_step=4368.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  47%|████▋     | 562/1208 [15:41<18:01,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000124, train/loss_step=0.0317, global_step=4368.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  47%|████▋     | 563/1208 [15:42<17:59,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000124, train/loss_step=0.0317, global_step=4368.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  47%|████▋     | 563/1208 [15:42<17:59,  1.67s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0504, train/loss_vlb_step=0.00018, train/loss_step=0.0504, global_step=4368.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  47%|████▋     | 564/1208 [15:45<17:59,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0504, train/loss_vlb_step=0.00018, train/loss_step=0.0504, global_step=4368.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  47%|████▋     | 564/1208 [15:45<17:59,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.00011, train/loss_step=0.0288, global_step=4368.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  47%|████▋     | 565/1208 [15:46<17:56,  1.67s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.00011, train/loss_step=0.0288, global_step=4368.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  47%|████▋     | 565/1208 [15:46<17:56,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.15e-5, train/loss_step=0.00191, global_step=4369.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  47%|████▋     | 566/1208 [15:47<17:54,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.15e-5, train/loss_step=0.00191, global_step=4369.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  47%|████▋     | 566/1208 [15:47<17:54,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00768, train/loss_vlb_step=3.7e-5, train/loss_step=0.00768, global_step=4369.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  47%|████▋     | 567/1208 [15:48<17:51,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00768, train/loss_vlb_step=3.7e-5, train/loss_step=0.00768, global_step=4369.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  47%|████▋     | 567/1208 [15:48<17:51,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.00421, train/loss_step=0.417, global_step=4369.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  47%|████▋     | 568/1208 [15:51<17:51,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.00421, train/loss_step=0.417, global_step=4369.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  47%|████▋     | 568/1208 [15:51<17:51,  1.67s/it, loss=0.148, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.74e-5, train/loss_step=0.010, global_step=4369.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  47%|████▋     | 569/1208 [15:52<17:49,  1.67s/it, loss=0.148, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.74e-5, train/loss_step=0.010, global_step=4369.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  47%|████▋     | 569/1208 [15:52<17:49,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00525, train/loss_vlb_step=2.88e-5, train/loss_step=0.00525, global_step=4370.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  47%|████▋     | 570/1208 [15:53<17:46,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00525, train/loss_vlb_step=2.88e-5, train/loss_step=0.00525, global_step=4370.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  47%|████▋     | 570/1208 [15:53<17:46,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00278, train/loss_step=0.407, global_step=4370.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  47%|████▋     | 571/1208 [15:54<17:44,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00278, train/loss_step=0.407, global_step=4370.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  47%|████▋     | 571/1208 [15:54<17:44,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00432, train/loss_vlb_step=2.33e-5, train/loss_step=0.00432, global_step=4370.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  47%|████▋     | 572/1208 [15:56<17:44,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00432, train/loss_vlb_step=2.33e-5, train/loss_step=0.00432, global_step=4370.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  47%|████▋     | 572/1208 [15:56<17:44,  1.67s/it, loss=0.125, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000722, train/loss_step=0.197, global_step=4370.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  47%|████▋     | 573/1208 [15:57<17:41,  1.67s/it, loss=0.125, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000722, train/loss_step=0.197, global_step=4370.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  47%|████▋     | 573/1208 [15:57<17:41,  1.67s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=1.99e-5, train/loss_step=0.0036, global_step=4371.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  48%|████▊     | 574/1208 [15:59<17:39,  1.67s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=1.99e-5, train/loss_step=0.0036, global_step=4371.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  48%|████▊     | 574/1208 [15:59<17:39,  1.67s/it, loss=0.125, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000515, train/loss_step=0.155, global_step=4371.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  48%|████▊     | 575/1208 [16:00<17:36,  1.67s/it, loss=0.125, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000515, train/loss_step=0.155, global_step=4371.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  48%|████▊     | 575/1208 [16:00<17:36,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00581, train/loss_step=0.447, global_step=4371.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  48%|████▊     | 576/1208 [16:02<17:36,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00581, train/loss_step=0.447, global_step=4371.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  48%|████▊     | 576/1208 [16:02<17:36,  1.67s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0882, train/loss_vlb_step=0.000292, train/loss_step=0.0882, global_step=4371.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  48%|████▊     | 577/1208 [16:03<17:34,  1.67s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0882, train/loss_vlb_step=0.000292, train/loss_step=0.0882, global_step=4371.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  48%|████▊     | 577/1208 [16:03<17:34,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00164, train/loss_step=0.285, global_step=4372.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  48%|████▊     | 578/1208 [16:04<17:31,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00164, train/loss_step=0.285, global_step=4372.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  48%|████▊     | 578/1208 [16:04<17:31,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=8.89e-5, train/loss_step=0.0223, global_step=4372.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  48%|████▊     | 579/1208 [16:05<17:29,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=8.89e-5, train/loss_step=0.0223, global_step=4372.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  48%|████▊     | 579/1208 [16:05<17:29,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0983, train/loss_vlb_step=0.000324, train/loss_step=0.0983, global_step=4372.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  48%|████▊     | 580/1208 [16:08<17:28,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0983, train/loss_vlb_step=0.000324, train/loss_step=0.0983, global_step=4372.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  48%|████▊     | 580/1208 [16:08<17:29,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0834, train/loss_vlb_step=0.00028, train/loss_step=0.0834, global_step=4372.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  48%|████▊     | 581/1208 [16:09<17:26,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0834, train/loss_vlb_step=0.00028, train/loss_step=0.0834, global_step=4372.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  48%|████▊     | 581/1208 [16:09<17:26,  1.67s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.28e-5, train/loss_step=0.0119, global_step=4373.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  48%|████▊     | 582/1208 [16:10<17:24,  1.67s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.28e-5, train/loss_step=0.0119, global_step=4373.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  48%|████▊     | 582/1208 [16:10<17:24,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00157, train/loss_step=0.291, global_step=4373.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  48%|████▊     | 583/1208 [16:11<17:21,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00157, train/loss_step=0.291, global_step=4373.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  48%|████▊     | 583/1208 [16:11<17:21,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00129, train/loss_step=0.294, global_step=4373.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  48%|████▊     | 584/1208 [16:14<17:21,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00129, train/loss_step=0.294, global_step=4373.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  48%|████▊     | 584/1208 [16:14<17:21,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000914, train/loss_step=0.241, global_step=4373.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  48%|████▊     | 585/1208 [16:15<17:19,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000914, train/loss_step=0.241, global_step=4373.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  48%|████▊     | 585/1208 [16:15<17:19,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.000186, train/loss_step=0.0521, global_step=4374.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  49%|████▊     | 586/1208 [16:16<17:16,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.000186, train/loss_step=0.0521, global_step=4374.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  49%|████▊     | 586/1208 [16:16<17:16,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000447, train/loss_step=0.136, global_step=4374.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  49%|████▊     | 587/1208 [16:17<17:14,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000447, train/loss_step=0.136, global_step=4374.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  49%|████▊     | 587/1208 [16:17<17:14,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00214, train/loss_step=0.338, global_step=4374.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  49%|████▊     | 588/1208 [16:20<17:14,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00214, train/loss_step=0.338, global_step=4374.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  49%|████▊     | 588/1208 [16:20<17:14,  1.67s/it, loss=0.174, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00186, train/loss_step=0.324, global_step=4374.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  49%|████▉     | 589/1208 [16:21<17:11,  1.67s/it, loss=0.174, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00186, train/loss_step=0.324, global_step=4374.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  49%|████▉     | 589/1208 [16:21<17:11,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.8e-5, train/loss_step=0.0132, global_step=4375.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  49%|████▉     | 590/1208 [16:22<17:09,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.8e-5, train/loss_step=0.0132, global_step=4375.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  49%|████▉     | 590/1208 [16:22<17:09,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000523, train/loss_step=0.151, global_step=4375.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  49%|████▉     | 591/1208 [16:23<17:06,  1.66s/it, loss=0.162, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000523, train/loss_step=0.151, global_step=4375.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  49%|████▉     | 591/1208 [16:23<17:06,  1.66s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0553, train/loss_vlb_step=0.000194, train/loss_step=0.0553, global_step=4375.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  49%|████▉     | 592/1208 [16:26<17:06,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0553, train/loss_vlb_step=0.000194, train/loss_step=0.0553, global_step=4375.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  49%|████▉     | 592/1208 [16:26<17:06,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00114, train/loss_step=0.265, global_step=4375.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  49%|████▉     | 593/1208 [16:27<17:04,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00114, train/loss_step=0.265, global_step=4375.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  49%|████▉     | 593/1208 [16:27<17:04,  1.67s/it, loss=0.174, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000441, train/loss_step=0.134, global_step=4376.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  49%|████▉     | 594/1208 [16:28<17:01,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000441, train/loss_step=0.134, global_step=4376.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  49%|████▉     | 594/1208 [16:28<17:01,  1.66s/it, loss=0.189, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00606, train/loss_step=0.457, global_step=4376.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  49%|████▉     | 595/1208 [16:29<16:59,  1.66s/it, loss=0.189, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00606, train/loss_step=0.457, global_step=4376.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  49%|████▉     | 595/1208 [16:29<16:59,  1.66s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0955, train/loss_vlb_step=0.000317, train/loss_step=0.0955, global_step=4376.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  49%|████▉     | 596/1208 [16:32<16:59,  1.67s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0955, train/loss_vlb_step=0.000317, train/loss_step=0.0955, global_step=4376.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  49%|████▉     | 596/1208 [16:32<16:59,  1.67s/it, loss=0.189, v_num=0, train/loss_simple_step=0.440, train/loss_vlb_step=0.0052, train/loss_step=0.440, global_step=4376.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  49%|████▉     | 597/1208 [16:33<16:56,  1.66s/it, loss=0.189, v_num=0, train/loss_simple_step=0.440, train/loss_vlb_step=0.0052, train/loss_step=0.440, global_step=4376.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  49%|████▉     | 597/1208 [16:33<16:56,  1.66s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.00013, train/loss_step=0.0347, global_step=4377.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  50%|████▉     | 598/1208 [16:34<16:54,  1.66s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.00013, train/loss_step=0.0347, global_step=4377.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  50%|████▉     | 598/1208 [16:34<16:54,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.057, train/loss_vlb_step=0.000198, train/loss_step=0.057, global_step=4377.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  50%|████▉     | 599/1208 [16:35<16:52,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.057, train/loss_vlb_step=0.000198, train/loss_step=0.057, global_step=4377.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  50%|████▉     | 599/1208 [16:35<16:52,  1.66s/it, loss=0.185, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000862, train/loss_step=0.235, global_step=4377.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  50%|████▉     | 600/1208 [16:38<16:51,  1.66s/it, loss=0.185, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000862, train/loss_step=0.235, global_step=4377.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  50%|████▉     | 600/1208 [16:38<16:51,  1.66s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000161, train/loss_step=0.0449, global_step=4377.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.85it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.85it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:25,  1.85it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.84it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.85it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.85it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.85it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.85it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.85it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.84it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.84it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.84it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.84it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.84it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.84it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.85it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.84it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.84it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.84it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.84it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.84it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.85it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.84it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.85it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.84it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.85it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:18,  1.84it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.84it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.84it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.84it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.84it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.84it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.84it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.84it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.84it/s][ADDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.84it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.84it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.84it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.84it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.84it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.84it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.84it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.84it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.85it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.85it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.85it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.84it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.84it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.84it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.84it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.84it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:18<00:08,  1.84it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.84it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.83it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.84it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.83it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.84it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.84it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.83it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.83it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.83it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.84it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.82it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.84it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.84it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.84it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.84it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.84it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.84it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.84it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.84it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.84it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.84it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:24<00:02,  1.84it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.84it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.84it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.83it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.84it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.84it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.83it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.85it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.84it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]Epoch 14:  50%|████▉     | 601/1208 [17:07<17:18,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000161, train/loss_step=0.0449, global_step=4377.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  50%|████▉     | 601/1208 [17:07<17:18,  1.71s/it, loss=0.191, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000537, train/loss_step=0.158, global_step=4378.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  50%|████▉     | 602/1208 [17:09<17:15,  1.71s/it, loss=0.191, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000537, train/loss_step=0.158, global_step=4378.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  50%|████▉     | 602/1208 [17:09<17:15,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0073, train/loss_vlb_step=3.65e-5, train/loss_step=0.0073, global_step=4378.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  50%|████▉     | 603/1208 [17:10<17:13,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0073, train/loss_vlb_step=3.65e-5, train/loss_step=0.0073, global_step=4378.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  50%|████▉     | 603/1208 [17:10<17:13,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00738, train/loss_vlb_step=3.78e-5, train/loss_step=0.00738, global_step=4378.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  50%|█████     | 604/1208 [17:13<17:13,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00738, train/loss_vlb_step=3.78e-5, train/loss_step=0.00738, global_step=4378.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  50%|█████     | 604/1208 [17:13<17:13,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000131, train/loss_step=0.0349, global_step=4378.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  50%|█████     | 605/1208 [17:14<17:10,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000131, train/loss_step=0.0349, global_step=4378.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  50%|█████     | 605/1208 [17:14<17:10,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0806, train/loss_vlb_step=0.00027, train/loss_step=0.0806, global_step=4379.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  50%|█████     | 606/1208 [17:15<17:08,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0806, train/loss_vlb_step=0.00027, train/loss_step=0.0806, global_step=4379.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  50%|█████     | 606/1208 [17:15<17:08,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00371, train/loss_step=0.357, global_step=4379.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  50%|█████     | 607/1208 [17:16<17:05,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00371, train/loss_step=0.357, global_step=4379.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  50%|█████     | 607/1208 [17:16<17:05,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=0.000104, train/loss_step=0.0259, global_step=4379.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  50%|█████     | 608/1208 [17:18<17:05,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=0.000104, train/loss_step=0.0259, global_step=4379.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  50%|█████     | 608/1208 [17:18<17:05,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.00035, train/loss_step=0.107, global_step=4379.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  50%|█████     | 609/1208 [17:19<17:02,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.00035, train/loss_step=0.107, global_step=4379.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  50%|█████     | 609/1208 [17:19<17:02,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0623, train/loss_vlb_step=0.000215, train/loss_step=0.0623, global_step=4380.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  50%|█████     | 610/1208 [17:20<17:00,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0623, train/loss_vlb_step=0.000215, train/loss_step=0.0623, global_step=4380.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  50%|█████     | 610/1208 [17:20<17:00,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00189, train/loss_step=0.338, global_step=4380.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  51%|█████     | 611/1208 [17:21<16:58,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00189, train/loss_step=0.338, global_step=4380.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  51%|█████     | 611/1208 [17:21<16:58,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000623, train/loss_step=0.184, global_step=4380.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  51%|█████     | 612/1208 [17:24<16:57,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000623, train/loss_step=0.184, global_step=4380.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  51%|█████     | 612/1208 [17:24<16:57,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00376, train/loss_vlb_step=2.12e-5, train/loss_step=0.00376, global_step=4380.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  51%|█████     | 613/1208 [17:25<16:55,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00376, train/loss_vlb_step=2.12e-5, train/loss_step=0.00376, global_step=4380.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  51%|█████     | 613/1208 [17:25<16:55,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0972, train/loss_vlb_step=0.00032, train/loss_step=0.0972, global_step=4381.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  51%|█████     | 614/1208 [17:26<16:52,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0972, train/loss_vlb_step=0.00032, train/loss_step=0.0972, global_step=4381.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  51%|█████     | 614/1208 [17:26<16:52,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=4381.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  51%|█████     | 615/1208 [17:27<16:50,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=4381.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  51%|█████     | 615/1208 [17:27<16:50,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0793, train/loss_vlb_step=0.000262, train/loss_step=0.0793, global_step=4381.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  51%|█████     | 616/1208 [17:30<16:49,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0793, train/loss_vlb_step=0.000262, train/loss_step=0.0793, global_step=4381.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  51%|█████     | 616/1208 [17:30<16:49,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=6.74e-5, train/loss_step=0.017, global_step=4381.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  51%|█████     | 617/1208 [17:31<16:47,  1.70s/it, loss=0.102, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=6.74e-5, train/loss_step=0.017, global_step=4381.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  51%|█████     | 617/1208 [17:31<16:47,  1.70s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.000137, train/loss_step=0.0359, global_step=4382.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  51%|█████     | 618/1208 [17:32<16:45,  1.70s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.000137, train/loss_step=0.0359, global_step=4382.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  51%|█████     | 618/1208 [17:32<16:45,  1.70s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.81e-5, train/loss_step=0.0105, global_step=4382.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  51%|█████     | 619/1208 [17:33<16:42,  1.70s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.81e-5, train/loss_step=0.0105, global_step=4382.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  51%|█████     | 619/1208 [17:33<16:42,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00122, train/loss_step=0.261, global_step=4382.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  51%|█████▏    | 620/1208 [17:36<16:42,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00122, train/loss_step=0.261, global_step=4382.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  51%|█████▏    | 620/1208 [17:36<16:42,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000869, train/loss_step=0.220, global_step=4382.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  51%|█████▏    | 621/1208 [17:37<16:39,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000869, train/loss_step=0.220, global_step=4382.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  51%|█████▏    | 621/1208 [17:37<16:39,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.77e-5, train/loss_step=0.0182, global_step=4383.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  51%|█████▏    | 622/1208 [17:38<16:37,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.77e-5, train/loss_step=0.0182, global_step=4383.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  51%|█████▏    | 622/1208 [17:38<16:37,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00486, train/loss_vlb_step=2.51e-5, train/loss_step=0.00486, global_step=4383.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  52%|█████▏    | 623/1208 [17:39<16:35,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00486, train/loss_vlb_step=2.51e-5, train/loss_step=0.00486, global_step=4383.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  52%|█████▏    | 623/1208 [17:39<16:35,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000441, train/loss_step=0.133, global_step=4383.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  52%|█████▏    | 624/1208 [17:42<16:34,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000441, train/loss_step=0.133, global_step=4383.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  52%|█████▏    | 624/1208 [17:42<16:34,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0609, train/loss_vlb_step=0.000212, train/loss_step=0.0609, global_step=4383.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  52%|█████▏    | 625/1208 [17:43<16:32,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0609, train/loss_vlb_step=0.000212, train/loss_step=0.0609, global_step=4383.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  52%|█████▏    | 625/1208 [17:43<16:32,  1.70s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00643, train/loss_vlb_step=3.28e-5, train/loss_step=0.00643, global_step=4384.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  52%|█████▏    | 626/1208 [17:44<16:29,  1.70s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00643, train/loss_vlb_step=3.28e-5, train/loss_step=0.00643, global_step=4384.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  52%|█████▏    | 626/1208 [17:44<16:29,  1.70s/it, loss=0.0895, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.11e-5, train/loss_step=0.011, global_step=4384.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  52%|█████▏    | 627/1208 [17:45<16:27,  1.70s/it, loss=0.0895, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.11e-5, train/loss_step=0.011, global_step=4384.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  52%|█████▏    | 627/1208 [17:45<16:27,  1.70s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.00011, train/loss_step=0.0284, global_step=4384.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  52%|█████▏    | 628/1208 [17:48<16:26,  1.70s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.00011, train/loss_step=0.0284, global_step=4384.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  52%|█████▏    | 628/1208 [17:48<16:26,  1.70s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000762, train/loss_step=0.202, global_step=4384.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  52%|█████▏    | 629/1208 [17:49<16:24,  1.70s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000762, train/loss_step=0.202, global_step=4384.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  52%|█████▏    | 629/1208 [17:49<16:24,  1.70s/it, loss=0.0918, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.92e-5, train/loss_step=0.0104, global_step=4385.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  52%|█████▏    | 630/1208 [17:50<16:22,  1.70s/it, loss=0.0918, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.92e-5, train/loss_step=0.0104, global_step=4385.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  52%|█████▏    | 630/1208 [17:50<16:22,  1.70s/it, loss=0.0814, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000427, train/loss_step=0.130, global_step=4385.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  52%|█████▏    | 631/1208 [17:51<16:19,  1.70s/it, loss=0.0814, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000427, train/loss_step=0.130, global_step=4385.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  52%|█████▏    | 631/1208 [17:51<16:19,  1.70s/it, loss=0.0796, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000503, train/loss_step=0.148, global_step=4385.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  52%|█████▏    | 632/1208 [17:54<16:19,  1.70s/it, loss=0.0796, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000503, train/loss_step=0.148, global_step=4385.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  52%|█████▏    | 632/1208 [17:54<16:19,  1.70s/it, loss=0.0796, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.82e-5, train/loss_step=0.00324, global_step=4385.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  52%|█████▏    | 633/1208 [17:55<16:16,  1.70s/it, loss=0.0796, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.82e-5, train/loss_step=0.00324, global_step=4385.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  52%|█████▏    | 633/1208 [17:55<16:16,  1.70s/it, loss=0.0826, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000548, train/loss_step=0.158, global_step=4386.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  52%|█████▏    | 634/1208 [17:56<16:14,  1.70s/it, loss=0.0826, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000548, train/loss_step=0.158, global_step=4386.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  52%|█████▏    | 634/1208 [17:56<16:14,  1.70s/it, loss=0.107, v_num=0, train/loss_simple_step=0.600, train/loss_vlb_step=0.00956, train/loss_step=0.600, global_step=4386.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  53%|█████▎    | 635/1208 [17:57<16:12,  1.70s/it, loss=0.107, v_num=0, train/loss_simple_step=0.600, train/loss_vlb_step=0.00956, train/loss_step=0.600, global_step=4386.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  53%|█████▎    | 635/1208 [17:57<16:12,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.638, train/loss_vlb_step=0.0179, train/loss_step=0.638, global_step=4386.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  53%|█████▎    | 636/1208 [18:00<16:11,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.638, train/loss_vlb_step=0.0179, train/loss_step=0.638, global_step=4386.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  53%|█████▎    | 636/1208 [18:00<16:11,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00206, train/loss_step=0.332, global_step=4386.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  53%|█████▎    | 637/1208 [18:01<16:09,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00206, train/loss_step=0.332, global_step=4386.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  53%|█████▎    | 637/1208 [18:01<16:09,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00132, train/loss_step=0.293, global_step=4387.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  53%|█████▎    | 638/1208 [18:02<16:07,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00132, train/loss_step=0.293, global_step=4387.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  53%|█████▎    | 638/1208 [18:02<16:07,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000782, train/loss_step=0.208, global_step=4387.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  53%|█████▎    | 639/1208 [18:03<16:04,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000782, train/loss_step=0.208, global_step=4387.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  53%|█████▎    | 639/1208 [18:03<16:04,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000445, train/loss_step=0.133, global_step=4387.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  53%|█████▎    | 640/1208 [18:06<16:04,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000445, train/loss_step=0.133, global_step=4387.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  53%|█████▎    | 640/1208 [18:06<16:04,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0546, train/loss_vlb_step=0.000191, train/loss_step=0.0546, global_step=4387.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  53%|█████▎    | 641/1208 [18:07<16:01,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0546, train/loss_vlb_step=0.000191, train/loss_step=0.0546, global_step=4387.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  53%|█████▎    | 641/1208 [18:07<16:01,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0688, train/loss_vlb_step=0.000234, train/loss_step=0.0688, global_step=4388.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  53%|█████▎    | 642/1208 [18:08<15:59,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0688, train/loss_vlb_step=0.000234, train/loss_step=0.0688, global_step=4388.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  53%|█████▎    | 642/1208 [18:08<15:59,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000137, train/loss_step=0.0392, global_step=4388.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  53%|█████▎    | 643/1208 [18:09<15:57,  1.69s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000137, train/loss_step=0.0392, global_step=4388.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  53%|█████▎    | 643/1208 [18:09<15:57,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0746, train/loss_vlb_step=0.000249, train/loss_step=0.0746, global_step=4388.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  53%|█████▎    | 644/1208 [18:12<15:56,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0746, train/loss_vlb_step=0.000249, train/loss_step=0.0746, global_step=4388.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  53%|█████▎    | 644/1208 [18:12<15:56,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000541, train/loss_step=0.157, global_step=4388.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  53%|█████▎    | 645/1208 [18:13<15:54,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000541, train/loss_step=0.157, global_step=4388.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  53%|█████▎    | 645/1208 [18:13<15:54,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.387, train/loss_vlb_step=0.00247, train/loss_step=0.387, global_step=4389.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  53%|█████▎    | 646/1208 [18:14<15:51,  1.69s/it, loss=0.184, v_num=0, train/loss_simple_step=0.387, train/loss_vlb_step=0.00247, train/loss_step=0.387, global_step=4389.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  53%|█████▎    | 646/1208 [18:14<15:51,  1.69s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0629, train/loss_vlb_step=0.000221, train/loss_step=0.0629, global_step=4389.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  54%|█████▎    | 647/1208 [18:15<15:49,  1.69s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0629, train/loss_vlb_step=0.000221, train/loss_step=0.0629, global_step=4389.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  54%|█████▎    | 647/1208 [18:15<15:49,  1.69s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0999, train/loss_vlb_step=0.000328, train/loss_step=0.0999, global_step=4389.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  54%|█████▎    | 648/1208 [18:18<15:49,  1.69s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0999, train/loss_vlb_step=0.000328, train/loss_step=0.0999, global_step=4389.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  54%|█████▎    | 648/1208 [18:18<15:49,  1.69s/it, loss=0.191, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000858, train/loss_step=0.222, global_step=4389.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  54%|█████▎    | 649/1208 [18:19<15:46,  1.69s/it, loss=0.191, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000858, train/loss_step=0.222, global_step=4389.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  54%|█████▎    | 649/1208 [18:19<15:46,  1.69s/it, loss=0.196, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=4390.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  54%|█████▍    | 650/1208 [18:20<15:44,  1.69s/it, loss=0.196, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=4390.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  54%|█████▍    | 650/1208 [18:20<15:44,  1.69s/it, loss=0.198, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000592, train/loss_step=0.168, global_step=4390.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  54%|█████▍    | 651/1208 [18:21<15:42,  1.69s/it, loss=0.198, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000592, train/loss_step=0.168, global_step=4390.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  54%|█████▍    | 651/1208 [18:21<15:42,  1.69s/it, loss=0.191, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=1.39e-5, train/loss_step=0.00245, global_step=4390.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  54%|█████▍    | 652/1208 [18:24<15:41,  1.69s/it, loss=0.191, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=1.39e-5, train/loss_step=0.00245, global_step=4390.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  54%|█████▍    | 652/1208 [18:24<15:41,  1.69s/it, loss=0.205, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00126, train/loss_step=0.278, global_step=4390.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  54%|█████▍    | 653/1208 [18:25<15:39,  1.69s/it, loss=0.205, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00126, train/loss_step=0.278, global_step=4390.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  54%|█████▍    | 653/1208 [18:25<15:39,  1.69s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0513, train/loss_vlb_step=0.000183, train/loss_step=0.0513, global_step=4391.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  54%|█████▍    | 654/1208 [18:26<15:36,  1.69s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0513, train/loss_vlb_step=0.000183, train/loss_step=0.0513, global_step=4391.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  54%|█████▍    | 654/1208 [18:26<15:36,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=3.14e-5, train/loss_step=0.00619, global_step=4391.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  54%|█████▍    | 655/1208 [18:27<15:34,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=3.14e-5, train/loss_step=0.00619, global_step=4391.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  54%|█████▍    | 655/1208 [18:27<15:34,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.66e-5, train/loss_step=0.00292, global_step=4391.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  54%|█████▍    | 656/1208 [18:29<15:34,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.66e-5, train/loss_step=0.00292, global_step=4391.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  54%|█████▍    | 656/1208 [18:29<15:34,  1.69s/it, loss=0.163, v_num=0, train/loss_simple_step=0.830, train/loss_vlb_step=0.140, train/loss_step=0.830, global_step=4391.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]      Epoch 14:  54%|█████▍    | 657/1208 [18:31<15:31,  1.69s/it, loss=0.163, v_num=0, train/loss_simple_step=0.830, train/loss_vlb_step=0.140, train/loss_step=0.830, global_step=4391.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  54%|█████▍    | 657/1208 [18:31<15:31,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000832, train/loss_step=0.223, global_step=4392.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  54%|█████▍    | 658/1208 [18:32<15:29,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000832, train/loss_step=0.223, global_step=4392.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  54%|█████▍    | 658/1208 [18:32<15:29,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0782, train/loss_vlb_step=0.000263, train/loss_step=0.0782, global_step=4392.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  55%|█████▍    | 659/1208 [18:33<15:27,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0782, train/loss_vlb_step=0.000263, train/loss_step=0.0782, global_step=4392.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  55%|█████▍    | 659/1208 [18:33<15:27,  1.69s/it, loss=0.161, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00154, train/loss_step=0.299, global_step=4392.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  55%|█████▍    | 660/1208 [18:35<15:26,  1.69s/it, loss=0.161, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00154, train/loss_step=0.299, global_step=4392.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  55%|█████▍    | 660/1208 [18:35<15:26,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00987, train/loss_vlb_step=4.59e-5, train/loss_step=0.00987, global_step=4392.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  55%|█████▍    | 661/1208 [18:36<15:24,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00987, train/loss_vlb_step=4.59e-5, train/loss_step=0.00987, global_step=4392.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  55%|█████▍    | 661/1208 [18:36<15:24,  1.69s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0617, train/loss_vlb_step=0.000211, train/loss_step=0.0617, global_step=4393.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  55%|█████▍    | 662/1208 [18:37<15:22,  1.69s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0617, train/loss_vlb_step=0.000211, train/loss_step=0.0617, global_step=4393.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  55%|█████▍    | 662/1208 [18:37<15:22,  1.69s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=1.35e-5, train/loss_step=0.00239, global_step=4393.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  55%|█████▍    | 663/1208 [18:38<15:19,  1.69s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=1.35e-5, train/loss_step=0.00239, global_step=4393.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  55%|█████▍    | 663/1208 [18:38<15:19,  1.69s/it, loss=0.163, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000796, train/loss_step=0.206, global_step=4393.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  55%|█████▍    | 664/1208 [18:41<15:19,  1.69s/it, loss=0.163, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000796, train/loss_step=0.206, global_step=4393.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  55%|█████▍    | 664/1208 [18:41<15:19,  1.69s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=0.000105, train/loss_step=0.0261, global_step=4393.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  55%|█████▌    | 665/1208 [18:42<15:16,  1.69s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=0.000105, train/loss_step=0.0261, global_step=4393.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  55%|█████▌    | 665/1208 [18:42<15:16,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.66e-5, train/loss_step=0.00284, global_step=4394.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  55%|█████▌    | 666/1208 [18:43<15:14,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.66e-5, train/loss_step=0.00284, global_step=4394.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  55%|█████▌    | 666/1208 [18:43<15:14,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000112, train/loss_step=0.0273, global_step=4394.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  55%|█████▌    | 667/1208 [18:44<15:12,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000112, train/loss_step=0.0273, global_step=4394.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  55%|█████▌    | 667/1208 [18:44<15:12,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000445, train/loss_step=0.134, global_step=4394.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  55%|█████▌    | 668/1208 [18:47<15:11,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000445, train/loss_step=0.134, global_step=4394.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  55%|█████▌    | 668/1208 [18:47<15:11,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0811, train/loss_vlb_step=0.000267, train/loss_step=0.0811, global_step=4394.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  55%|█████▌    | 669/1208 [18:48<15:09,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0811, train/loss_vlb_step=0.000267, train/loss_step=0.0811, global_step=4394.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  55%|█████▌    | 669/1208 [18:48<15:09,  1.69s/it, loss=0.141, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00165, train/loss_step=0.323, global_step=4395.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  55%|█████▌    | 670/1208 [18:49<15:07,  1.69s/it, loss=0.141, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00165, train/loss_step=0.323, global_step=4395.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  55%|█████▌    | 670/1208 [18:49<15:07,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.00012, train/loss_step=0.0308, global_step=4395.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  56%|█████▌    | 671/1208 [18:50<15:05,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.00012, train/loss_step=0.0308, global_step=4395.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  56%|█████▌    | 671/1208 [18:50<15:05,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00631, train/loss_vlb_step=3.21e-5, train/loss_step=0.00631, global_step=4395.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  56%|█████▌    | 672/1208 [18:53<15:04,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00631, train/loss_vlb_step=3.21e-5, train/loss_step=0.00631, global_step=4395.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  56%|█████▌    | 672/1208 [18:53<15:04,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.72e-5, train/loss_step=0.0188, global_step=4395.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  56%|█████▌    | 673/1208 [18:54<15:02,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.72e-5, train/loss_step=0.0188, global_step=4395.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  56%|█████▌    | 673/1208 [18:54<15:02,  1.69s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00521, train/loss_vlb_step=2.71e-5, train/loss_step=0.00521, global_step=4396.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  56%|█████▌    | 674/1208 [18:55<14:59,  1.69s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00521, train/loss_vlb_step=2.71e-5, train/loss_step=0.00521, global_step=4396.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  56%|█████▌    | 674/1208 [18:55<14:59,  1.69s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.91e-5, train/loss_step=0.0105, global_step=4396.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  56%|█████▌    | 675/1208 [18:56<14:57,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.91e-5, train/loss_step=0.0105, global_step=4396.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  56%|█████▌    | 675/1208 [18:56<14:57,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.78e-5, train/loss_step=0.0156, global_step=4396.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  56%|█████▌    | 676/1208 [18:59<14:56,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.78e-5, train/loss_step=0.0156, global_step=4396.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  56%|█████▌    | 676/1208 [18:59<14:56,  1.69s/it, loss=0.0786, v_num=0, train/loss_simple_step=0.00973, train/loss_vlb_step=4.69e-5, train/loss_step=0.00973, global_step=4396.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  56%|█████▌    | 677/1208 [19:00<14:54,  1.68s/it, loss=0.0786, v_num=0, train/loss_simple_step=0.00973, train/loss_vlb_step=4.69e-5, train/loss_step=0.00973, global_step=4396.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  56%|█████▌    | 677/1208 [19:00<14:54,  1.68s/it, loss=0.0679, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.66e-5, train/loss_step=0.0101, global_step=4397.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  56%|█████▌    | 678/1208 [19:01<14:52,  1.68s/it, loss=0.0679, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.66e-5, train/loss_step=0.0101, global_step=4397.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  56%|█████▌    | 678/1208 [19:01<14:52,  1.68s/it, loss=0.0647, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.71e-5, train/loss_step=0.0128, global_step=4397.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  56%|█████▌    | 679/1208 [19:02<14:50,  1.68s/it, loss=0.0647, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.71e-5, train/loss_step=0.0128, global_step=4397.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  56%|█████▌    | 679/1208 [19:02<14:50,  1.68s/it, loss=0.0506, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.59e-5, train/loss_step=0.0181, global_step=4397.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  56%|█████▋    | 680/1208 [19:05<14:49,  1.68s/it, loss=0.0506, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.59e-5, train/loss_step=0.0181, global_step=4397.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  56%|█████▋    | 680/1208 [19:05<14:49,  1.68s/it, loss=0.0502, v_num=0, train/loss_simple_step=0.00131, train/loss_vlb_step=7.97e-6, train/loss_step=0.00131, global_step=4397.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  56%|█████▋    | 681/1208 [19:06<14:47,  1.68s/it, loss=0.0502, v_num=0, train/loss_simple_step=0.00131, train/loss_vlb_step=7.97e-6, train/loss_step=0.00131, global_step=4397.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  56%|█████▋    | 681/1208 [19:06<14:47,  1.68s/it, loss=0.0647, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.0021, train/loss_step=0.351, global_step=4398.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]     Epoch 14:  56%|█████▋    | 682/1208 [19:07<14:45,  1.68s/it, loss=0.0647, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.0021, train/loss_step=0.351, global_step=4398.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  56%|█████▋    | 682/1208 [19:07<14:45,  1.68s/it, loss=0.0685, v_num=0, train/loss_simple_step=0.0783, train/loss_vlb_step=0.000261, train/loss_step=0.0783, global_step=4398.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  57%|█████▋    | 683/1208 [19:08<14:42,  1.68s/it, loss=0.0685, v_num=0, train/loss_simple_step=0.0783, train/loss_vlb_step=0.000261, train/loss_step=0.0783, global_step=4398.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  57%|█████▋    | 683/1208 [19:08<14:42,  1.68s/it, loss=0.0602, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000144, train/loss_step=0.0399, global_step=4398.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  57%|█████▋    | 684/1208 [19:11<14:42,  1.68s/it, loss=0.0602, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000144, train/loss_step=0.0399, global_step=4398.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  57%|█████▋    | 684/1208 [19:11<14:42,  1.68s/it, loss=0.0597, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.84e-5, train/loss_step=0.0159, global_step=4398.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  57%|█████▋    | 685/1208 [19:12<14:39,  1.68s/it, loss=0.0597, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.84e-5, train/loss_step=0.0159, global_step=4398.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  57%|█████▋    | 685/1208 [19:12<14:39,  1.68s/it, loss=0.064, v_num=0, train/loss_simple_step=0.0893, train/loss_vlb_step=0.000295, train/loss_step=0.0893, global_step=4399.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  57%|█████▋    | 686/1208 [19:13<14:37,  1.68s/it, loss=0.064, v_num=0, train/loss_simple_step=0.0893, train/loss_vlb_step=0.000295, train/loss_step=0.0893, global_step=4399.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  57%|█████▋    | 686/1208 [19:13<14:37,  1.68s/it, loss=0.0629, v_num=0, train/loss_simple_step=0.00539, train/loss_vlb_step=2.73e-5, train/loss_step=0.00539, global_step=4399.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  57%|█████▋    | 687/1208 [19:14<14:35,  1.68s/it, loss=0.0629, v_num=0, train/loss_simple_step=0.00539, train/loss_vlb_step=2.73e-5, train/loss_step=0.00539, global_step=4399.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  57%|█████▋    | 687/1208 [19:14<14:35,  1.68s/it, loss=0.0723, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00165, train/loss_step=0.323, global_step=4399.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  57%|█████▋    | 688/1208 [19:17<14:34,  1.68s/it, loss=0.0723, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00165, train/loss_step=0.323, global_step=4399.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  57%|█████▋    | 688/1208 [19:17<14:34,  1.68s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00196, train/loss_step=0.330, global_step=4399.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  57%|█████▋    | 689/1208 [19:18<14:32,  1.68s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00196, train/loss_step=0.330, global_step=4399.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  57%|█████▋    | 689/1208 [19:18<14:32,  1.68s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.625, train/loss_vlb_step=0.0152, train/loss_step=0.625, global_step=4400.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  57%|█████▋    | 690/1208 [19:19<14:30,  1.68s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.625, train/loss_vlb_step=0.0152, train/loss_step=0.625, global_step=4400.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  57%|█████▋    | 690/1208 [19:19<14:30,  1.68s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0842, train/loss_vlb_step=0.000277, train/loss_step=0.0842, global_step=4400.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  57%|█████▋    | 691/1208 [19:20<14:28,  1.68s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0842, train/loss_vlb_step=0.000277, train/loss_step=0.0842, global_step=4400.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  57%|█████▋    | 691/1208 [19:20<14:28,  1.68s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0083, train/loss_vlb_step=3.8e-5, train/loss_step=0.0083, global_step=4400.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  57%|█████▋    | 692/1208 [19:23<14:27,  1.68s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0083, train/loss_vlb_step=3.8e-5, train/loss_step=0.0083, global_step=4400.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  57%|█████▋    | 692/1208 [19:23<14:27,  1.68s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=2.12e-5, train/loss_step=0.00402, global_step=4400.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  57%|█████▋    | 693/1208 [19:24<14:25,  1.68s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=2.12e-5, train/loss_step=0.00402, global_step=4400.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  57%|█████▋    | 693/1208 [19:24<14:25,  1.68s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.21e-5, train/loss_step=0.0021, global_step=4401.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  57%|█████▋    | 694/1208 [19:25<14:23,  1.68s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.21e-5, train/loss_step=0.0021, global_step=4401.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  57%|█████▋    | 694/1208 [19:25<14:23,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000519, train/loss_step=0.151, global_step=4401.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  58%|█████▊    | 695/1208 [19:26<14:20,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000519, train/loss_step=0.151, global_step=4401.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  58%|█████▊    | 695/1208 [19:26<14:20,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.075, train/loss_vlb_step=0.00025, train/loss_step=0.075, global_step=4401.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  58%|█████▊    | 696/1208 [19:29<14:20,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.075, train/loss_vlb_step=0.00025, train/loss_step=0.075, global_step=4401.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  58%|█████▊    | 696/1208 [19:29<14:20,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000658, train/loss_step=0.177, global_step=4401.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  58%|█████▊    | 697/1208 [19:30<14:17,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000658, train/loss_step=0.177, global_step=4401.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  58%|█████▊    | 697/1208 [19:30<14:17,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.0019, train/loss_step=0.332, global_step=4402.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  58%|█████▊    | 698/1208 [19:31<14:15,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.0019, train/loss_step=0.332, global_step=4402.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  58%|█████▊    | 698/1208 [19:31<14:15,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000339, train/loss_step=0.102, global_step=4402.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  58%|█████▊    | 699/1208 [19:32<14:13,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000339, train/loss_step=0.102, global_step=4402.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  58%|█████▊    | 699/1208 [19:32<14:13,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00139, train/loss_step=0.286, global_step=4402.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  58%|█████▊    | 700/1208 [19:35<14:12,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00139, train/loss_step=0.286, global_step=4402.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  58%|█████▊    | 700/1208 [19:35<14:12,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000557, train/loss_step=0.148, global_step=4402.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  58%|█████▊    | 701/1208 [19:36<14:10,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000557, train/loss_step=0.148, global_step=4402.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  58%|█████▊    | 701/1208 [19:36<14:10,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.21e-5, train/loss_step=0.0233, global_step=4403.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  58%|█████▊    | 702/1208 [19:37<14:08,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.21e-5, train/loss_step=0.0233, global_step=4403.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  58%|█████▊    | 702/1208 [19:37<14:08,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00614, train/loss_vlb_step=3.22e-5, train/loss_step=0.00614, global_step=4403.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  58%|█████▊    | 703/1208 [19:38<14:06,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00614, train/loss_vlb_step=3.22e-5, train/loss_step=0.00614, global_step=4403.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  58%|█████▊    | 703/1208 [19:38<14:06,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000396, train/loss_step=0.121, global_step=4403.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  58%|█████▊    | 704/1208 [19:41<14:05,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000396, train/loss_step=0.121, global_step=4403.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  58%|█████▊    | 704/1208 [19:41<14:05,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.000185, train/loss_step=0.0508, global_step=4403.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  58%|█████▊    | 705/1208 [19:42<14:03,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.000185, train/loss_step=0.0508, global_step=4403.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  58%|█████▊    | 705/1208 [19:42<14:03,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.57e-5, train/loss_step=0.00261, global_step=4404.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  58%|█████▊    | 706/1208 [19:43<14:01,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.57e-5, train/loss_step=0.00261, global_step=4404.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  58%|█████▊    | 706/1208 [19:43<14:01,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0708, train/loss_vlb_step=0.000241, train/loss_step=0.0708, global_step=4404.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  59%|█████▊    | 707/1208 [19:44<13:59,  1.67s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0708, train/loss_vlb_step=0.000241, train/loss_step=0.0708, global_step=4404.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  59%|█████▊    | 707/1208 [19:44<13:59,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.00082, train/loss_step=0.201, global_step=4404.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  59%|█████▊    | 708/1208 [19:47<13:58,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.00082, train/loss_step=0.201, global_step=4404.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  59%|█████▊    | 708/1208 [19:47<13:58,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000481, train/loss_step=0.143, global_step=4404.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  59%|█████▊    | 709/1208 [19:48<13:56,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000481, train/loss_step=0.143, global_step=4404.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  59%|█████▊    | 709/1208 [19:48<13:56,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00144, train/loss_step=0.268, global_step=4405.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  59%|█████▉    | 710/1208 [19:49<13:53,  1.67s/it, loss=0.113, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00144, train/loss_step=0.268, global_step=4405.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  59%|█████▉    | 710/1208 [19:49<13:53,  1.67s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000124, train/loss_step=0.0335, global_step=4405.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  59%|█████▉    | 711/1208 [19:50<13:51,  1.67s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000124, train/loss_step=0.0335, global_step=4405.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  59%|█████▉    | 711/1208 [19:50<13:51,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0997, train/loss_vlb_step=0.000331, train/loss_step=0.0997, global_step=4405.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  59%|█████▉    | 712/1208 [19:52<13:51,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0997, train/loss_vlb_step=0.000331, train/loss_step=0.0997, global_step=4405.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  59%|█████▉    | 712/1208 [19:52<13:51,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000523, train/loss_step=0.156, global_step=4405.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  59%|█████▉    | 713/1208 [19:53<13:48,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000523, train/loss_step=0.156, global_step=4405.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  59%|█████▉    | 713/1208 [19:53<13:48,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00187, train/loss_step=0.370, global_step=4406.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  59%|█████▉    | 714/1208 [19:54<13:46,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00187, train/loss_step=0.370, global_step=4406.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  59%|█████▉    | 714/1208 [19:54<13:46,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00127, train/loss_step=0.284, global_step=4406.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  59%|█████▉    | 715/1208 [19:55<13:44,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00127, train/loss_step=0.284, global_step=4406.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  59%|█████▉    | 715/1208 [19:55<13:44,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00274, train/loss_step=0.395, global_step=4406.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  59%|█████▉    | 716/1208 [19:58<13:43,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00274, train/loss_step=0.395, global_step=4406.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  59%|█████▉    | 716/1208 [19:58<13:43,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00918, train/loss_vlb_step=4.45e-5, train/loss_step=0.00918, global_step=4406.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  59%|█████▉    | 717/1208 [19:59<13:41,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00918, train/loss_vlb_step=4.45e-5, train/loss_step=0.00918, global_step=4406.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  59%|█████▉    | 717/1208 [19:59<13:41,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000112, train/loss_step=0.0277, global_step=4407.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  59%|█████▉    | 718/1208 [20:00<13:39,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000112, train/loss_step=0.0277, global_step=4407.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  59%|█████▉    | 718/1208 [20:00<13:39,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000177, train/loss_step=0.050, global_step=4407.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  60%|█████▉    | 719/1208 [20:01<13:37,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000177, train/loss_step=0.050, global_step=4407.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  60%|█████▉    | 719/1208 [20:01<13:37,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.0006, train/loss_step=0.168, global_step=4407.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  60%|█████▉    | 720/1208 [20:04<13:36,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.0006, train/loss_step=0.168, global_step=4407.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  60%|█████▉    | 720/1208 [20:04<13:36,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000488, train/loss_step=0.147, global_step=4407.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  60%|█████▉    | 721/1208 [20:05<13:34,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000488, train/loss_step=0.147, global_step=4407.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  60%|█████▉    | 721/1208 [20:05<13:34,  1.67s/it, loss=0.178, v_num=0, train/loss_simple_step=0.949, train/loss_vlb_step=0.477, train/loss_step=0.949, global_step=4408.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  60%|█████▉    | 722/1208 [20:06<13:32,  1.67s/it, loss=0.178, v_num=0, train/loss_simple_step=0.949, train/loss_vlb_step=0.477, train/loss_step=0.949, global_step=4408.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  60%|█████▉    | 722/1208 [20:06<13:32,  1.67s/it, loss=0.191, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00114, train/loss_step=0.269, global_step=4408.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  60%|█████▉    | 723/1208 [20:07<13:30,  1.67s/it, loss=0.191, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00114, train/loss_step=0.269, global_step=4408.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  60%|█████▉    | 723/1208 [20:07<13:30,  1.67s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00461, train/loss_vlb_step=2.45e-5, train/loss_step=0.00461, global_step=4408.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  60%|█████▉    | 724/1208 [20:10<13:29,  1.67s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00461, train/loss_vlb_step=2.45e-5, train/loss_step=0.00461, global_step=4408.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  60%|█████▉    | 724/1208 [20:10<13:29,  1.67s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000143, train/loss_step=0.0407, global_step=4408.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  60%|██████    | 725/1208 [20:11<13:27,  1.67s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000143, train/loss_step=0.0407, global_step=4408.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  60%|██████    | 725/1208 [20:11<13:27,  1.67s/it, loss=0.208, v_num=0, train/loss_simple_step=0.473, train/loss_vlb_step=0.00654, train/loss_step=0.473, global_step=4409.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  60%|██████    | 726/1208 [20:12<13:25,  1.67s/it, loss=0.208, v_num=0, train/loss_simple_step=0.473, train/loss_vlb_step=0.00654, train/loss_step=0.473, global_step=4409.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  60%|██████    | 726/1208 [20:12<13:25,  1.67s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0571, train/loss_vlb_step=0.000198, train/loss_step=0.0571, global_step=4409.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  60%|██████    | 727/1208 [20:13<13:23,  1.67s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0571, train/loss_vlb_step=0.000198, train/loss_step=0.0571, global_step=4409.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  60%|██████    | 727/1208 [20:13<13:23,  1.67s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0088, train/loss_vlb_step=4.25e-5, train/loss_step=0.0088, global_step=4409.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  60%|██████    | 728/1208 [20:16<13:22,  1.67s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0088, train/loss_vlb_step=4.25e-5, train/loss_step=0.0088, global_step=4409.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  60%|██████    | 728/1208 [20:16<13:22,  1.67s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0538, train/loss_vlb_step=0.00018, train/loss_step=0.0538, global_step=4409.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  60%|██████    | 729/1208 [20:17<13:20,  1.67s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0538, train/loss_vlb_step=0.00018, train/loss_step=0.0538, global_step=4409.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  60%|██████    | 729/1208 [20:17<13:20,  1.67s/it, loss=0.191, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000825, train/loss_step=0.223, global_step=4410.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  60%|██████    | 730/1208 [20:18<13:17,  1.67s/it, loss=0.191, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000825, train/loss_step=0.223, global_step=4410.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  60%|██████    | 730/1208 [20:18<13:17,  1.67s/it, loss=0.192, v_num=0, train/loss_simple_step=0.061, train/loss_vlb_step=0.000204, train/loss_step=0.061, global_step=4410.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  61%|██████    | 731/1208 [20:19<13:15,  1.67s/it, loss=0.192, v_num=0, train/loss_simple_step=0.061, train/loss_vlb_step=0.000204, train/loss_step=0.061, global_step=4410.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  61%|██████    | 731/1208 [20:19<13:15,  1.67s/it, loss=0.188, v_num=0, train/loss_simple_step=0.00687, train/loss_vlb_step=3.33e-5, train/loss_step=0.00687, global_step=4410.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  61%|██████    | 732/1208 [20:22<13:14,  1.67s/it, loss=0.188, v_num=0, train/loss_simple_step=0.00687, train/loss_vlb_step=3.33e-5, train/loss_step=0.00687, global_step=4410.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  61%|██████    | 732/1208 [20:22<13:14,  1.67s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.83e-5, train/loss_step=0.0107, global_step=4410.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  61%|██████    | 733/1208 [20:23<13:12,  1.67s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.83e-5, train/loss_step=0.0107, global_step=4410.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  61%|██████    | 733/1208 [20:23<13:12,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000127, train/loss_step=0.0348, global_step=4411.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  61%|██████    | 734/1208 [20:24<13:10,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000127, train/loss_step=0.0348, global_step=4411.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  61%|██████    | 734/1208 [20:24<13:10,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000409, train/loss_step=0.124, global_step=4411.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  61%|██████    | 735/1208 [20:25<13:08,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000409, train/loss_step=0.124, global_step=4411.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  61%|██████    | 735/1208 [20:25<13:08,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00221, train/loss_step=0.389, global_step=4411.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  61%|██████    | 736/1208 [20:28<13:07,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00221, train/loss_step=0.389, global_step=4411.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  61%|██████    | 736/1208 [20:28<13:07,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000113, train/loss_step=0.0283, global_step=4411.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  61%|██████    | 737/1208 [20:29<13:05,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000113, train/loss_step=0.0283, global_step=4411.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  61%|██████    | 737/1208 [20:29<13:05,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00696, train/loss_vlb_step=3.4e-5, train/loss_step=0.00696, global_step=4412.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  61%|██████    | 738/1208 [20:30<13:03,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00696, train/loss_vlb_step=3.4e-5, train/loss_step=0.00696, global_step=4412.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  61%|██████    | 738/1208 [20:30<13:03,  1.67s/it, loss=0.172, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00248, train/loss_step=0.391, global_step=4412.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  61%|██████    | 739/1208 [20:31<13:01,  1.67s/it, loss=0.172, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00248, train/loss_step=0.391, global_step=4412.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  61%|██████    | 739/1208 [20:31<13:01,  1.67s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.00018, train/loss_step=0.0524, global_step=4412.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  61%|██████▏   | 740/1208 [20:34<13:00,  1.67s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.00018, train/loss_step=0.0524, global_step=4412.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  61%|██████▏   | 740/1208 [20:34<13:00,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0522, train/loss_vlb_step=0.000185, train/loss_step=0.0522, global_step=4412.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  61%|██████▏   | 741/1208 [20:35<12:58,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0522, train/loss_vlb_step=0.000185, train/loss_step=0.0522, global_step=4412.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  61%|██████▏   | 741/1208 [20:35<12:58,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.62e-5, train/loss_step=0.00296, global_step=4413.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  61%|██████▏   | 742/1208 [20:36<12:56,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.62e-5, train/loss_step=0.00296, global_step=4413.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  61%|██████▏   | 742/1208 [20:36<12:56,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00173, train/loss_step=0.319, global_step=4413.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  62%|██████▏   | 743/1208 [20:37<12:54,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00173, train/loss_step=0.319, global_step=4413.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  62%|██████▏   | 743/1208 [20:37<12:54,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0606, train/loss_vlb_step=0.000211, train/loss_step=0.0606, global_step=4413.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  62%|██████▏   | 744/1208 [20:40<12:53,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0606, train/loss_vlb_step=0.000211, train/loss_step=0.0606, global_step=4413.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  62%|██████▏   | 744/1208 [20:40<12:53,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00236, train/loss_step=0.367, global_step=4413.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  62%|██████▏   | 745/1208 [20:41<12:51,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00236, train/loss_step=0.367, global_step=4413.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  62%|██████▏   | 745/1208 [20:41<12:51,  1.67s/it, loss=0.125, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00107, train/loss_step=0.248, global_step=4414.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  62%|██████▏   | 746/1208 [20:42<12:49,  1.67s/it, loss=0.125, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00107, train/loss_step=0.248, global_step=4414.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  62%|██████▏   | 746/1208 [20:42<12:49,  1.67s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0755, train/loss_vlb_step=0.000249, train/loss_step=0.0755, global_step=4414.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  62%|██████▏   | 747/1208 [20:43<12:47,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0755, train/loss_vlb_step=0.000249, train/loss_step=0.0755, global_step=4414.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  62%|██████▏   | 747/1208 [20:43<12:47,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00364, train/loss_vlb_step=2.07e-5, train/loss_step=0.00364, global_step=4414.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  62%|██████▏   | 748/1208 [20:46<12:46,  1.67s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00364, train/loss_vlb_step=2.07e-5, train/loss_step=0.00364, global_step=4414.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  62%|██████▏   | 748/1208 [20:46<12:46,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000631, train/loss_step=0.179, global_step=4414.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  62%|██████▏   | 749/1208 [20:47<12:44,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000631, train/loss_step=0.179, global_step=4414.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  62%|██████▏   | 749/1208 [20:47<12:44,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.87e-5, train/loss_step=0.0105, global_step=4415.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  62%|██████▏   | 750/1208 [20:48<12:42,  1.66s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.87e-5, train/loss_step=0.0105, global_step=4415.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  62%|██████▏   | 750/1208 [20:48<12:42,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.513, train/loss_vlb_step=0.00862, train/loss_step=0.513, global_step=4415.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  62%|██████▏   | 751/1208 [20:49<12:40,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.513, train/loss_vlb_step=0.00862, train/loss_step=0.513, global_step=4415.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  62%|██████▏   | 751/1208 [20:49<12:40,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.1e-5, train/loss_step=0.014, global_step=4415.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  62%|██████▏   | 752/1208 [20:52<12:39,  1.67s/it, loss=0.144, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.1e-5, train/loss_step=0.014, global_step=4415.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  62%|██████▏   | 752/1208 [20:52<12:39,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000908, train/loss_step=0.233, global_step=4415.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  62%|██████▏   | 753/1208 [20:53<12:37,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000908, train/loss_step=0.233, global_step=4415.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  62%|██████▏   | 753/1208 [20:53<12:37,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00935, train/loss_vlb_step=4.4e-5, train/loss_step=0.00935, global_step=4416.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  62%|██████▏   | 754/1208 [20:54<12:35,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00935, train/loss_vlb_step=4.4e-5, train/loss_step=0.00935, global_step=4416.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  62%|██████▏   | 754/1208 [20:54<12:35,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000769, train/loss_step=0.198, global_step=4416.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  62%|██████▎   | 755/1208 [20:55<12:33,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000769, train/loss_step=0.198, global_step=4416.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  62%|██████▎   | 755/1208 [20:55<12:33,  1.66s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0753, train/loss_vlb_step=0.000263, train/loss_step=0.0753, global_step=4416.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  63%|██████▎   | 756/1208 [20:58<12:32,  1.66s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0753, train/loss_vlb_step=0.000263, train/loss_step=0.0753, global_step=4416.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  63%|██████▎   | 756/1208 [20:58<12:32,  1.66s/it, loss=0.165, v_num=0, train/loss_simple_step=0.493, train/loss_vlb_step=0.00641, train/loss_step=0.493, global_step=4416.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  63%|██████▎   | 757/1208 [20:59<12:30,  1.66s/it, loss=0.165, v_num=0, train/loss_simple_step=0.493, train/loss_vlb_step=0.00641, train/loss_step=0.493, global_step=4416.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  63%|██████▎   | 757/1208 [20:59<12:30,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0971, train/loss_vlb_step=0.000319, train/loss_step=0.0971, global_step=4417.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  63%|██████▎   | 758/1208 [21:00<12:28,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0971, train/loss_vlb_step=0.000319, train/loss_step=0.0971, global_step=4417.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  63%|██████▎   | 758/1208 [21:00<12:28,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00127, train/loss_step=0.253, global_step=4417.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  63%|██████▎   | 759/1208 [21:01<12:26,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00127, train/loss_step=0.253, global_step=4417.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  63%|██████▎   | 759/1208 [21:01<12:26,  1.66s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000146, train/loss_step=0.0388, global_step=4417.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  63%|██████▎   | 760/1208 [21:04<12:25,  1.66s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000146, train/loss_step=0.0388, global_step=4417.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  63%|██████▎   | 760/1208 [21:04<12:25,  1.66s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.00013, train/loss_step=0.0347, global_step=4417.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  63%|██████▎   | 761/1208 [21:05<12:23,  1.66s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.00013, train/loss_step=0.0347, global_step=4417.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  63%|██████▎   | 761/1208 [21:05<12:23,  1.66s/it, loss=0.162, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.8e-5, train/loss_step=0.016, global_step=4418.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  63%|██████▎   | 762/1208 [21:06<12:21,  1.66s/it, loss=0.162, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.8e-5, train/loss_step=0.016, global_step=4418.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  63%|██████▎   | 762/1208 [21:06<12:21,  1.66s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.28e-5, train/loss_step=0.0179, global_step=4418.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  63%|██████▎   | 763/1208 [21:07<12:19,  1.66s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.28e-5, train/loss_step=0.0179, global_step=4418.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  63%|██████▎   | 763/1208 [21:07<12:19,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000579, train/loss_step=0.174, global_step=4418.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  63%|██████▎   | 764/1208 [21:11<12:18,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000579, train/loss_step=0.174, global_step=4418.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  63%|██████▎   | 764/1208 [21:11<12:18,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.069, train/loss_vlb_step=0.000237, train/loss_step=0.069, global_step=4418.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  63%|██████▎   | 765/1208 [21:12<12:16,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.069, train/loss_vlb_step=0.000237, train/loss_step=0.069, global_step=4418.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  63%|██████▎   | 765/1208 [21:12<12:16,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000587, train/loss_step=0.167, global_step=4419.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  63%|██████▎   | 766/1208 [21:13<12:14,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000587, train/loss_step=0.167, global_step=4419.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  63%|██████▎   | 766/1208 [21:13<12:14,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.464, train/loss_vlb_step=0.00851, train/loss_step=0.464, global_step=4419.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  63%|██████▎   | 767/1208 [21:14<12:12,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.464, train/loss_vlb_step=0.00851, train/loss_step=0.464, global_step=4419.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  63%|██████▎   | 767/1208 [21:14<12:12,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000201, train/loss_step=0.0588, global_step=4419.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  64%|██████▎   | 768/1208 [21:17<12:11,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000201, train/loss_step=0.0588, global_step=4419.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  64%|██████▎   | 768/1208 [21:17<12:11,  1.66s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.41e-5, train/loss_step=0.0228, global_step=4419.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  64%|██████▎   | 769/1208 [21:18<12:09,  1.66s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.41e-5, train/loss_step=0.0228, global_step=4419.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  64%|██████▎   | 769/1208 [21:18<12:09,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000555, train/loss_step=0.161, global_step=4420.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  64%|██████▎   | 770/1208 [21:19<12:07,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000555, train/loss_step=0.161, global_step=4420.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  64%|██████▎   | 770/1208 [21:19<12:07,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000772, train/loss_step=0.209, global_step=4420.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  64%|██████▍   | 771/1208 [21:20<12:05,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000772, train/loss_step=0.209, global_step=4420.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  64%|██████▍   | 771/1208 [21:20<12:05,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000828, train/loss_step=0.222, global_step=4420.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  64%|██████▍   | 772/1208 [21:23<12:05,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000828, train/loss_step=0.222, global_step=4420.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  64%|██████▍   | 772/1208 [21:23<12:05,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000788, train/loss_step=0.214, global_step=4420.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  64%|██████▍   | 773/1208 [21:24<12:03,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000788, train/loss_step=0.214, global_step=4420.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  64%|██████▍   | 773/1208 [21:24<12:03,  1.66s/it, loss=0.165, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00132, train/loss_step=0.317, global_step=4421.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  64%|██████▍   | 774/1208 [21:26<12:01,  1.66s/it, loss=0.165, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00132, train/loss_step=0.317, global_step=4421.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  64%|██████▍   | 774/1208 [21:26<12:01,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.046, train/loss_vlb_step=0.000161, train/loss_step=0.046, global_step=4421.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  64%|██████▍   | 775/1208 [21:27<11:59,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.046, train/loss_vlb_step=0.000161, train/loss_step=0.046, global_step=4421.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  64%|██████▍   | 775/1208 [21:27<11:59,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0528, train/loss_vlb_step=0.000192, train/loss_step=0.0528, global_step=4421.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  64%|██████▍   | 776/1208 [21:30<11:58,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0528, train/loss_vlb_step=0.000192, train/loss_step=0.0528, global_step=4421.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  64%|██████▍   | 776/1208 [21:30<11:58,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=7.74e-5, train/loss_step=0.0196, global_step=4421.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  64%|██████▍   | 777/1208 [21:31<11:56,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=7.74e-5, train/loss_step=0.0196, global_step=4421.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  64%|██████▍   | 777/1208 [21:31<11:56,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.24e-5, train/loss_step=0.0114, global_step=4422.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  64%|██████▍   | 778/1208 [21:32<11:54,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.24e-5, train/loss_step=0.0114, global_step=4422.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  64%|██████▍   | 778/1208 [21:32<11:54,  1.66s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00854, train/loss_vlb_step=4.01e-5, train/loss_step=0.00854, global_step=4422.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  64%|██████▍   | 779/1208 [21:33<11:52,  1.66s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00854, train/loss_vlb_step=4.01e-5, train/loss_step=0.00854, global_step=4422.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  64%|██████▍   | 779/1208 [21:33<11:52,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00164, train/loss_step=0.301, global_step=4422.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  65%|██████▍   | 780/1208 [21:36<11:51,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00164, train/loss_step=0.301, global_step=4422.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  65%|██████▍   | 780/1208 [21:36<11:51,  1.66s/it, loss=0.143, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.0015, train/loss_step=0.304, global_step=4422.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  65%|██████▍   | 781/1208 [21:37<11:49,  1.66s/it, loss=0.143, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.0015, train/loss_step=0.304, global_step=4422.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  65%|██████▍   | 781/1208 [21:37<11:49,  1.66s/it, loss=0.148, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000409, train/loss_step=0.125, global_step=4423.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  65%|██████▍   | 782/1208 [21:38<11:47,  1.66s/it, loss=0.148, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000409, train/loss_step=0.125, global_step=4423.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  65%|██████▍   | 782/1208 [21:38<11:47,  1.66s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.53e-5, train/loss_step=0.0171, global_step=4423.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  65%|██████▍   | 783/1208 [21:39<11:45,  1.66s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.53e-5, train/loss_step=0.0171, global_step=4423.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  65%|██████▍   | 783/1208 [21:39<11:45,  1.66s/it, loss=0.161, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00454, train/loss_step=0.430, global_step=4423.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  65%|██████▍   | 784/1208 [21:43<11:44,  1.66s/it, loss=0.161, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00454, train/loss_step=0.430, global_step=4423.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  65%|██████▍   | 784/1208 [21:43<11:44,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00406, train/loss_vlb_step=2.22e-5, train/loss_step=0.00406, global_step=4423.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  65%|██████▍   | 785/1208 [21:44<11:42,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00406, train/loss_vlb_step=2.22e-5, train/loss_step=0.00406, global_step=4423.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  65%|██████▍   | 785/1208 [21:44<11:42,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0699, train/loss_vlb_step=0.00024, train/loss_step=0.0699, global_step=4424.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  65%|██████▌   | 786/1208 [21:45<11:40,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0699, train/loss_vlb_step=0.00024, train/loss_step=0.0699, global_step=4424.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  65%|██████▌   | 786/1208 [21:45<11:40,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.00815, train/loss_step=0.512, global_step=4424.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  65%|██████▌   | 787/1208 [21:46<11:38,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.00815, train/loss_step=0.512, global_step=4424.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  65%|██████▌   | 787/1208 [21:46<11:38,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0778, train/loss_vlb_step=0.000261, train/loss_step=0.0778, global_step=4424.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  65%|██████▌   | 788/1208 [21:49<11:37,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0778, train/loss_vlb_step=0.000261, train/loss_step=0.0778, global_step=4424.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  65%|██████▌   | 788/1208 [21:49<11:37,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.69e-5, train/loss_step=0.0152, global_step=4424.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  65%|██████▌   | 789/1208 [21:50<11:35,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.69e-5, train/loss_step=0.0152, global_step=4424.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  65%|██████▌   | 789/1208 [21:50<11:35,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000351, train/loss_step=0.107, global_step=4425.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  65%|██████▌   | 790/1208 [21:51<11:33,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000351, train/loss_step=0.107, global_step=4425.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  65%|██████▌   | 790/1208 [21:51<11:33,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0607, train/loss_vlb_step=0.000207, train/loss_step=0.0607, global_step=4425.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  65%|██████▌   | 791/1208 [21:52<11:31,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0607, train/loss_vlb_step=0.000207, train/loss_step=0.0607, global_step=4425.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  65%|██████▌   | 791/1208 [21:52<11:31,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.00036, train/loss_step=0.109, global_step=4425.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  66%|██████▌   | 792/1208 [21:55<11:31,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.00036, train/loss_step=0.109, global_step=4425.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  66%|██████▌   | 792/1208 [21:55<11:31,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00334, train/loss_step=0.436, global_step=4425.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  66%|██████▌   | 793/1208 [21:56<11:29,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00334, train/loss_step=0.436, global_step=4425.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  66%|██████▌   | 793/1208 [21:56<11:29,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0561, train/loss_vlb_step=0.000196, train/loss_step=0.0561, global_step=4426.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  66%|██████▌   | 794/1208 [21:57<11:27,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0561, train/loss_vlb_step=0.000196, train/loss_step=0.0561, global_step=4426.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  66%|██████▌   | 794/1208 [21:57<11:27,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=4426.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  66%|██████▌   | 795/1208 [21:58<11:25,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=4426.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  66%|██████▌   | 795/1208 [21:58<11:25,  1.66s/it, loss=0.162, v_num=0, train/loss_simple_step=0.478, train/loss_vlb_step=0.00365, train/loss_step=0.478, global_step=4426.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  66%|██████▌   | 796/1208 [22:02<11:24,  1.66s/it, loss=0.162, v_num=0, train/loss_simple_step=0.478, train/loss_vlb_step=0.00365, train/loss_step=0.478, global_step=4426.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  66%|██████▌   | 796/1208 [22:02<11:24,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000132, train/loss_step=0.035, global_step=4426.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  66%|██████▌   | 797/1208 [22:03<11:22,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000132, train/loss_step=0.035, global_step=4426.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  66%|██████▌   | 797/1208 [22:03<11:22,  1.66s/it, loss=0.169, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000426, train/loss_step=0.128, global_step=4427.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  66%|██████▌   | 798/1208 [22:04<11:20,  1.66s/it, loss=0.169, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000426, train/loss_step=0.128, global_step=4427.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  66%|██████▌   | 798/1208 [22:04<11:20,  1.66s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.81e-5, train/loss_step=0.0188, global_step=4427.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  66%|██████▌   | 799/1208 [22:05<11:18,  1.66s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.81e-5, train/loss_step=0.0188, global_step=4427.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  66%|██████▌   | 799/1208 [22:05<11:18,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0691, train/loss_vlb_step=0.000231, train/loss_step=0.0691, global_step=4427.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  66%|██████▌   | 800/1208 [22:08<11:17,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0691, train/loss_vlb_step=0.000231, train/loss_step=0.0691, global_step=4427.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  66%|██████▌   | 800/1208 [22:08<11:17,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000638, train/loss_step=0.171, global_step=4427.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  66%|██████▋   | 801/1208 [22:09<11:15,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000638, train/loss_step=0.171, global_step=4427.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  66%|██████▋   | 801/1208 [22:09<11:15,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000664, train/loss_step=0.187, global_step=4428.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  66%|██████▋   | 802/1208 [22:10<11:13,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000664, train/loss_step=0.187, global_step=4428.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  66%|██████▋   | 802/1208 [22:10<11:13,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000434, train/loss_step=0.131, global_step=4428.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  66%|██████▋   | 803/1208 [22:11<11:11,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000434, train/loss_step=0.131, global_step=4428.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  66%|██████▋   | 803/1208 [22:11<11:11,  1.66s/it, loss=0.171, v_num=0, train/loss_simple_step=0.657, train/loss_vlb_step=0.0264, train/loss_step=0.657, global_step=4428.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  67%|██████▋   | 804/1208 [22:14<11:10,  1.66s/it, loss=0.171, v_num=0, train/loss_simple_step=0.657, train/loss_vlb_step=0.0264, train/loss_step=0.657, global_step=4428.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  67%|██████▋   | 804/1208 [22:14<11:10,  1.66s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00601, train/loss_vlb_step=3.07e-5, train/loss_step=0.00601, global_step=4428.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  67%|██████▋   | 805/1208 [22:16<11:08,  1.66s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00601, train/loss_vlb_step=3.07e-5, train/loss_step=0.00601, global_step=4428.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  67%|██████▋   | 805/1208 [22:16<11:08,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.07e-5, train/loss_step=0.0137, global_step=4429.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  67%|██████▋   | 806/1208 [22:17<11:06,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.07e-5, train/loss_step=0.0137, global_step=4429.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  67%|██████▋   | 806/1208 [22:17<11:06,  1.66s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=2.03e-5, train/loss_step=0.00365, global_step=4429.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  67%|██████▋   | 807/1208 [22:18<11:04,  1.66s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=2.03e-5, train/loss_step=0.00365, global_step=4429.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  67%|██████▋   | 807/1208 [22:18<11:04,  1.66s/it, loss=0.159, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00287, train/loss_step=0.389, global_step=4429.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  67%|██████▋   | 808/1208 [22:21<11:04,  1.66s/it, loss=0.159, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00287, train/loss_step=0.389, global_step=4429.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  67%|██████▋   | 808/1208 [22:21<11:04,  1.66s/it, loss=0.192, v_num=0, train/loss_simple_step=0.685, train/loss_vlb_step=0.0275, train/loss_step=0.685, global_step=4429.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  67%|██████▋   | 809/1208 [22:22<11:02,  1.66s/it, loss=0.192, v_num=0, train/loss_simple_step=0.685, train/loss_vlb_step=0.0275, train/loss_step=0.685, global_step=4429.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  67%|██████▋   | 809/1208 [22:22<11:02,  1.66s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000135, train/loss_step=0.0388, global_step=4430.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  67%|██████▋   | 810/1208 [22:23<11:00,  1.66s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000135, train/loss_step=0.0388, global_step=4430.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  67%|██████▋   | 810/1208 [22:23<11:00,  1.66s/it, loss=0.203, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00203, train/loss_step=0.337, global_step=4430.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  67%|██████▋   | 811/1208 [22:24<10:58,  1.66s/it, loss=0.203, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00203, train/loss_step=0.337, global_step=4430.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  67%|██████▋   | 811/1208 [22:24<10:58,  1.66s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.45e-5, train/loss_step=0.0143, global_step=4430.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  67%|██████▋   | 812/1208 [22:27<10:57,  1.66s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.45e-5, train/loss_step=0.0143, global_step=4430.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  67%|██████▋   | 812/1208 [22:27<10:57,  1.66s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0091, train/loss_vlb_step=4.49e-5, train/loss_step=0.0091, global_step=4430.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  67%|██████▋   | 813/1208 [22:28<10:55,  1.66s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0091, train/loss_vlb_step=4.49e-5, train/loss_step=0.0091, global_step=4430.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  67%|██████▋   | 813/1208 [22:28<10:55,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00659, train/loss_vlb_step=3.36e-5, train/loss_step=0.00659, global_step=4431.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  67%|██████▋   | 814/1208 [22:29<10:53,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00659, train/loss_vlb_step=3.36e-5, train/loss_step=0.00659, global_step=4431.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  67%|██████▋   | 814/1208 [22:29<10:53,  1.66s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00746, train/loss_vlb_step=3.66e-5, train/loss_step=0.00746, global_step=4431.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  67%|██████▋   | 815/1208 [22:31<10:51,  1.66s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00746, train/loss_vlb_step=3.66e-5, train/loss_step=0.00746, global_step=4431.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  67%|██████▋   | 815/1208 [22:31<10:51,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00953, train/loss_vlb_step=4.67e-5, train/loss_step=0.00953, global_step=4431.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  68%|██████▊   | 816/1208 [22:33<10:50,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00953, train/loss_vlb_step=4.67e-5, train/loss_step=0.00953, global_step=4431.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  68%|██████▊   | 816/1208 [22:33<10:50,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00207, train/loss_step=0.328, global_step=4431.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]     Epoch 14:  68%|██████▊   | 817/1208 [22:34<10:48,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00207, train/loss_step=0.328, global_step=4431.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  68%|██████▊   | 817/1208 [22:34<10:48,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00216, train/loss_step=0.321, global_step=4432.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  68%|██████▊   | 818/1208 [22:35<10:46,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00216, train/loss_step=0.321, global_step=4432.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  68%|██████▊   | 818/1208 [22:35<10:46,  1.66s/it, loss=0.175, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000394, train/loss_step=0.120, global_step=4432.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  68%|██████▊   | 819/1208 [22:36<10:44,  1.66s/it, loss=0.175, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000394, train/loss_step=0.120, global_step=4432.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  68%|██████▊   | 819/1208 [22:36<10:44,  1.66s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.19e-5, train/loss_step=0.0166, global_step=4432.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  68%|██████▊   | 820/1208 [22:39<10:43,  1.66s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.19e-5, train/loss_step=0.0166, global_step=4432.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  68%|██████▊   | 820/1208 [22:39<10:43,  1.66s/it, loss=0.165, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.2e-5, train/loss_step=0.014, global_step=4432.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  68%|██████▊   | 821/1208 [22:40<10:41,  1.66s/it, loss=0.165, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.2e-5, train/loss_step=0.014, global_step=4432.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  68%|██████▊   | 821/1208 [22:40<10:41,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=1.3e-5, train/loss_step=0.00227, global_step=4433.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  68%|██████▊   | 822/1208 [22:41<10:39,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=1.3e-5, train/loss_step=0.00227, global_step=4433.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  68%|██████▊   | 822/1208 [22:41<10:39,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000924, train/loss_step=0.232, global_step=4433.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  68%|██████▊   | 823/1208 [22:42<10:37,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000924, train/loss_step=0.232, global_step=4433.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  68%|██████▊   | 823/1208 [22:42<10:37,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.422, train/loss_vlb_step=0.00293, train/loss_step=0.422, global_step=4433.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  68%|██████▊   | 824/1208 [22:45<10:36,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.422, train/loss_vlb_step=0.00293, train/loss_step=0.422, global_step=4433.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  68%|██████▊   | 824/1208 [22:45<10:36,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000393, train/loss_step=0.119, global_step=4433.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  68%|██████▊   | 825/1208 [22:46<10:34,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000393, train/loss_step=0.119, global_step=4433.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  68%|██████▊   | 825/1208 [22:46<10:34,  1.66s/it, loss=0.167, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00134, train/loss_step=0.274, global_step=4434.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  68%|██████▊   | 826/1208 [22:47<10:32,  1.66s/it, loss=0.167, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00134, train/loss_step=0.274, global_step=4434.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  68%|██████▊   | 826/1208 [22:47<10:32,  1.66s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00488, train/loss_vlb_step=2.68e-5, train/loss_step=0.00488, global_step=4434.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  68%|██████▊   | 827/1208 [22:48<10:30,  1.66s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00488, train/loss_vlb_step=2.68e-5, train/loss_step=0.00488, global_step=4434.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  68%|██████▊   | 827/1208 [22:48<10:30,  1.66s/it, loss=0.157, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000685, train/loss_step=0.186, global_step=4434.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  69%|██████▊   | 828/1208 [22:51<10:29,  1.66s/it, loss=0.157, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000685, train/loss_step=0.186, global_step=4434.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  69%|██████▊   | 828/1208 [22:51<10:29,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0629, train/loss_vlb_step=0.00022, train/loss_step=0.0629, global_step=4434.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  69%|██████▊   | 829/1208 [22:52<10:27,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0629, train/loss_vlb_step=0.00022, train/loss_step=0.0629, global_step=4434.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  69%|██████▊   | 829/1208 [22:52<10:27,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000124, train/loss_step=0.0329, global_step=4435.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  69%|██████▊   | 830/1208 [22:53<10:25,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000124, train/loss_step=0.0329, global_step=4435.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  69%|██████▊   | 830/1208 [22:53<10:25,  1.65s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00579, train/loss_vlb_step=2.92e-5, train/loss_step=0.00579, global_step=4435.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  69%|██████▉   | 831/1208 [22:54<10:23,  1.65s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00579, train/loss_vlb_step=2.92e-5, train/loss_step=0.00579, global_step=4435.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  69%|██████▉   | 831/1208 [22:54<10:23,  1.65s/it, loss=0.124, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00149, train/loss_step=0.305, global_step=4435.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  69%|██████▉   | 832/1208 [22:57<10:22,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00149, train/loss_step=0.305, global_step=4435.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  69%|██████▉   | 832/1208 [22:57<10:22,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000944, train/loss_step=0.218, global_step=4435.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  69%|██████▉   | 833/1208 [22:58<10:20,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000944, train/loss_step=0.218, global_step=4435.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  69%|██████▉   | 833/1208 [22:58<10:20,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00974, train/loss_vlb_step=4.63e-5, train/loss_step=0.00974, global_step=4436.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  69%|██████▉   | 834/1208 [22:59<10:18,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00974, train/loss_vlb_step=4.63e-5, train/loss_step=0.00974, global_step=4436.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  69%|██████▉   | 834/1208 [22:59<10:18,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=1.04e-5, train/loss_step=0.00171, global_step=4436.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  69%|██████▉   | 835/1208 [23:00<10:16,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=1.04e-5, train/loss_step=0.00171, global_step=4436.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  69%|██████▉   | 835/1208 [23:00<10:16,  1.65s/it, loss=0.145, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000932, train/loss_step=0.227, global_step=4436.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  69%|██████▉   | 836/1208 [23:03<10:15,  1.65s/it, loss=0.145, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000932, train/loss_step=0.227, global_step=4436.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  69%|██████▉   | 836/1208 [23:03<10:15,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000134, train/loss_step=0.0364, global_step=4436.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  69%|██████▉   | 837/1208 [23:04<10:13,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000134, train/loss_step=0.0364, global_step=4436.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  69%|██████▉   | 837/1208 [23:04<10:13,  1.65s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0836, train/loss_vlb_step=0.000279, train/loss_step=0.0836, global_step=4437.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  69%|██████▉   | 838/1208 [23:05<10:11,  1.65s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0836, train/loss_vlb_step=0.000279, train/loss_step=0.0836, global_step=4437.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  69%|██████▉   | 838/1208 [23:05<10:11,  1.65s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0713, train/loss_vlb_step=0.000241, train/loss_step=0.0713, global_step=4437.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  69%|██████▉   | 839/1208 [23:06<10:09,  1.65s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0713, train/loss_vlb_step=0.000241, train/loss_step=0.0713, global_step=4437.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  69%|██████▉   | 839/1208 [23:06<10:09,  1.65s/it, loss=0.116, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.91e-5, train/loss_step=0.021, global_step=4437.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  70%|██████▉   | 840/1208 [23:09<10:08,  1.65s/it, loss=0.116, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.91e-5, train/loss_step=0.021, global_step=4437.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  70%|██████▉   | 840/1208 [23:09<10:08,  1.65s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0541, train/loss_vlb_step=0.000185, train/loss_step=0.0541, global_step=4437.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  70%|██████▉   | 841/1208 [23:10<10:06,  1.65s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0541, train/loss_vlb_step=0.000185, train/loss_step=0.0541, global_step=4437.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  70%|██████▉   | 841/1208 [23:10<10:06,  1.65s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00988, train/loss_vlb_step=4.8e-5, train/loss_step=0.00988, global_step=4438.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  70%|██████▉   | 842/1208 [23:11<10:04,  1.65s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00988, train/loss_vlb_step=4.8e-5, train/loss_step=0.00988, global_step=4438.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  70%|██████▉   | 842/1208 [23:11<10:04,  1.65s/it, loss=0.118, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000831, train/loss_step=0.209, global_step=4438.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  70%|██████▉   | 843/1208 [23:12<10:02,  1.65s/it, loss=0.118, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000831, train/loss_step=0.209, global_step=4438.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  70%|██████▉   | 843/1208 [23:12<10:02,  1.65s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.0635, train/loss_vlb_step=0.000224, train/loss_step=0.0635, global_step=4438.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  70%|██████▉   | 844/1208 [23:15<10:01,  1.65s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.0635, train/loss_vlb_step=0.000224, train/loss_step=0.0635, global_step=4438.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  70%|██████▉   | 844/1208 [23:15<10:01,  1.65s/it, loss=0.105, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000878, train/loss_step=0.230, global_step=4438.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  70%|██████▉   | 845/1208 [23:16<09:59,  1.65s/it, loss=0.105, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000878, train/loss_step=0.230, global_step=4438.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  70%|██████▉   | 845/1208 [23:16<09:59,  1.65s/it, loss=0.122, v_num=0, train/loss_simple_step=0.614, train/loss_vlb_step=0.0172, train/loss_step=0.614, global_step=4439.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  70%|███████   | 846/1208 [23:17<09:57,  1.65s/it, loss=0.122, v_num=0, train/loss_simple_step=0.614, train/loss_vlb_step=0.0172, train/loss_step=0.614, global_step=4439.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  70%|███████   | 846/1208 [23:17<09:57,  1.65s/it, loss=0.156, v_num=0, train/loss_simple_step=0.687, train/loss_vlb_step=0.0214, train/loss_step=0.687, global_step=4439.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  70%|███████   | 847/1208 [23:18<09:56,  1.65s/it, loss=0.156, v_num=0, train/loss_simple_step=0.687, train/loss_vlb_step=0.0214, train/loss_step=0.687, global_step=4439.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  70%|███████   | 847/1208 [23:18<09:56,  1.65s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0621, train/loss_vlb_step=0.00021, train/loss_step=0.0621, global_step=4439.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  70%|███████   | 848/1208 [23:21<09:54,  1.65s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0621, train/loss_vlb_step=0.00021, train/loss_step=0.0621, global_step=4439.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  70%|███████   | 848/1208 [23:21<09:54,  1.65s/it, loss=0.169, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00352, train/loss_step=0.447, global_step=4439.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  70%|███████   | 849/1208 [23:22<09:52,  1.65s/it, loss=0.169, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00352, train/loss_step=0.447, global_step=4439.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  70%|███████   | 849/1208 [23:22<09:52,  1.65s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.68e-5, train/loss_step=0.0126, global_step=4440.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  70%|███████   | 850/1208 [23:23<09:51,  1.65s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.68e-5, train/loss_step=0.0126, global_step=4440.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  70%|███████   | 850/1208 [23:23<09:51,  1.65s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00379, train/loss_vlb_step=2.15e-5, train/loss_step=0.00379, global_step=4440.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  70%|███████   | 851/1208 [23:24<09:49,  1.65s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00379, train/loss_vlb_step=2.15e-5, train/loss_step=0.00379, global_step=4440.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  70%|███████   | 851/1208 [23:24<09:49,  1.65s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00507, train/loss_vlb_step=2.7e-5, train/loss_step=0.00507, global_step=4440.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  71%|███████   | 852/1208 [23:27<09:47,  1.65s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00507, train/loss_vlb_step=2.7e-5, train/loss_step=0.00507, global_step=4440.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  71%|███████   | 852/1208 [23:27<09:47,  1.65s/it, loss=0.154, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000914, train/loss_step=0.238, global_step=4440.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  71%|███████   | 853/1208 [23:28<09:46,  1.65s/it, loss=0.154, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000914, train/loss_step=0.238, global_step=4440.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  71%|███████   | 853/1208 [23:28<09:46,  1.65s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0562, train/loss_vlb_step=0.000199, train/loss_step=0.0562, global_step=4441.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  71%|███████   | 854/1208 [23:29<09:44,  1.65s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0562, train/loss_vlb_step=0.000199, train/loss_step=0.0562, global_step=4441.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  71%|███████   | 854/1208 [23:29<09:44,  1.65s/it, loss=0.187, v_num=0, train/loss_simple_step=0.615, train/loss_vlb_step=0.023, train/loss_step=0.615, global_step=4441.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]     Epoch 14:  71%|███████   | 855/1208 [23:30<09:42,  1.65s/it, loss=0.187, v_num=0, train/loss_simple_step=0.615, train/loss_vlb_step=0.023, train/loss_step=0.615, global_step=4441.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  71%|███████   | 855/1208 [23:30<09:42,  1.65s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000114, train/loss_step=0.0297, global_step=4441.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  71%|███████   | 856/1208 [23:33<09:41,  1.65s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000114, train/loss_step=0.0297, global_step=4441.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  71%|███████   | 856/1208 [23:33<09:41,  1.65s/it, loss=0.186, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000805, train/loss_step=0.212, global_step=4441.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  71%|███████   | 857/1208 [23:34<09:39,  1.65s/it, loss=0.186, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000805, train/loss_step=0.212, global_step=4441.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  71%|███████   | 857/1208 [23:34<09:39,  1.65s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00774, train/loss_vlb_step=3.76e-5, train/loss_step=0.00774, global_step=4442.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  71%|███████   | 858/1208 [23:35<09:37,  1.65s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00774, train/loss_vlb_step=3.76e-5, train/loss_step=0.00774, global_step=4442.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  71%|███████   | 858/1208 [23:35<09:37,  1.65s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0621, train/loss_vlb_step=0.000217, train/loss_step=0.0621, global_step=4442.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  71%|███████   | 859/1208 [23:36<09:35,  1.65s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0621, train/loss_vlb_step=0.000217, train/loss_step=0.0621, global_step=4442.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  71%|███████   | 859/1208 [23:36<09:35,  1.65s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.49e-5, train/loss_step=0.0146, global_step=4442.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  71%|███████   | 860/1208 [23:39<09:34,  1.65s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.49e-5, train/loss_step=0.0146, global_step=4442.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  71%|███████   | 860/1208 [23:39<09:34,  1.65s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000157, train/loss_step=0.0438, global_step=4442.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  71%|███████▏  | 861/1208 [23:40<09:32,  1.65s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000157, train/loss_step=0.0438, global_step=4442.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  71%|███████▏  | 861/1208 [23:40<09:32,  1.65s/it, loss=0.192, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000908, train/loss_step=0.225, global_step=4443.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  71%|███████▏  | 862/1208 [23:41<09:30,  1.65s/it, loss=0.192, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000908, train/loss_step=0.225, global_step=4443.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  71%|███████▏  | 862/1208 [23:41<09:30,  1.65s/it, loss=0.205, v_num=0, train/loss_simple_step=0.475, train/loss_vlb_step=0.00553, train/loss_step=0.475, global_step=4443.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  71%|███████▏  | 863/1208 [23:42<09:28,  1.65s/it, loss=0.205, v_num=0, train/loss_simple_step=0.475, train/loss_vlb_step=0.00553, train/loss_step=0.475, global_step=4443.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  71%|███████▏  | 863/1208 [23:42<09:28,  1.65s/it, loss=0.203, v_num=0, train/loss_simple_step=0.00974, train/loss_vlb_step=4.62e-5, train/loss_step=0.00974, global_step=4443.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  72%|███████▏  | 864/1208 [23:44<09:27,  1.65s/it, loss=0.203, v_num=0, train/loss_simple_step=0.00974, train/loss_vlb_step=4.62e-5, train/loss_step=0.00974, global_step=4443.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  72%|███████▏  | 864/1208 [23:44<09:27,  1.65s/it, loss=0.201, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000663, train/loss_step=0.194, global_step=4443.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  72%|███████▏  | 865/1208 [23:45<09:25,  1.65s/it, loss=0.201, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000663, train/loss_step=0.194, global_step=4443.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  72%|███████▏  | 865/1208 [23:45<09:25,  1.65s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00577, train/loss_vlb_step=2.87e-5, train/loss_step=0.00577, global_step=4444.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  72%|███████▏  | 866/1208 [23:46<09:23,  1.65s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00577, train/loss_vlb_step=2.87e-5, train/loss_step=0.00577, global_step=4444.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  72%|███████▏  | 866/1208 [23:46<09:23,  1.65s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0984, train/loss_vlb_step=0.000324, train/loss_step=0.0984, global_step=4444.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  72%|███████▏  | 867/1208 [23:47<09:21,  1.65s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0984, train/loss_vlb_step=0.000324, train/loss_step=0.0984, global_step=4444.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  72%|███████▏  | 867/1208 [23:47<09:21,  1.65s/it, loss=0.151, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00138, train/loss_step=0.258, global_step=4444.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  72%|███████▏  | 868/1208 [23:50<09:20,  1.65s/it, loss=0.151, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00138, train/loss_step=0.258, global_step=4444.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  72%|███████▏  | 868/1208 [23:50<09:20,  1.65s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0506, train/loss_vlb_step=0.000188, train/loss_step=0.0506, global_step=4444.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  72%|███████▏  | 869/1208 [23:51<09:18,  1.65s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0506, train/loss_vlb_step=0.000188, train/loss_step=0.0506, global_step=4444.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  72%|███████▏  | 869/1208 [23:51<09:18,  1.65s/it, loss=0.136, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000388, train/loss_step=0.118, global_step=4445.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  72%|███████▏  | 870/1208 [23:52<09:16,  1.65s/it, loss=0.136, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000388, train/loss_step=0.118, global_step=4445.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  72%|███████▏  | 870/1208 [23:52<09:16,  1.65s/it, loss=0.154, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00251, train/loss_step=0.365, global_step=4445.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  72%|███████▏  | 871/1208 [23:53<09:14,  1.65s/it, loss=0.154, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00251, train/loss_step=0.365, global_step=4445.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  72%|███████▏  | 871/1208 [23:53<09:14,  1.65s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.06e-5, train/loss_step=0.00175, global_step=4445.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  72%|███████▏  | 872/1208 [23:56<09:13,  1.65s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.06e-5, train/loss_step=0.00175, global_step=4445.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  72%|███████▏  | 872/1208 [23:56<09:13,  1.65s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.26e-5, train/loss_step=0.00213, global_step=4445.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  72%|███████▏  | 873/1208 [23:57<09:11,  1.65s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.26e-5, train/loss_step=0.00213, global_step=4445.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  72%|███████▏  | 873/1208 [23:57<09:11,  1.65s/it, loss=0.145, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000397, train/loss_step=0.121, global_step=4446.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  72%|███████▏  | 874/1208 [23:58<09:09,  1.65s/it, loss=0.145, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000397, train/loss_step=0.121, global_step=4446.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  72%|███████▏  | 874/1208 [23:58<09:09,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.61e-5, train/loss_step=0.0125, global_step=4446.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  72%|███████▏  | 875/1208 [23:59<09:07,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.61e-5, train/loss_step=0.0125, global_step=4446.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  72%|███████▏  | 875/1208 [23:59<09:07,  1.65s/it, loss=0.119, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000347, train/loss_step=0.105, global_step=4446.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  73%|███████▎  | 876/1208 [24:02<09:06,  1.65s/it, loss=0.119, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000347, train/loss_step=0.105, global_step=4446.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  73%|███████▎  | 876/1208 [24:02<09:06,  1.65s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000105, train/loss_step=0.0273, global_step=4446.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  73%|███████▎  | 877/1208 [24:03<09:04,  1.65s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000105, train/loss_step=0.0273, global_step=4446.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  73%|███████▎  | 877/1208 [24:03<09:04,  1.65s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=8.29e-5, train/loss_step=0.0191, global_step=4447.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  73%|███████▎  | 878/1208 [24:04<09:02,  1.65s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=8.29e-5, train/loss_step=0.0191, global_step=4447.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  73%|███████▎  | 878/1208 [24:04<09:02,  1.65s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.65e-5, train/loss_step=0.0208, global_step=4447.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  73%|███████▎  | 879/1208 [24:05<09:01,  1.64s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.65e-5, train/loss_step=0.0208, global_step=4447.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  73%|███████▎  | 879/1208 [24:05<09:01,  1.64s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00632, train/loss_vlb_step=3.09e-5, train/loss_step=0.00632, global_step=4447.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  73%|███████▎  | 880/1208 [24:08<08:59,  1.65s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00632, train/loss_vlb_step=3.09e-5, train/loss_step=0.00632, global_step=4447.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  73%|███████▎  | 880/1208 [24:08<08:59,  1.65s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0608, train/loss_vlb_step=0.000216, train/loss_step=0.0608, global_step=4447.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  73%|███████▎  | 881/1208 [24:09<08:58,  1.65s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0608, train/loss_vlb_step=0.000216, train/loss_step=0.0608, global_step=4447.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  73%|███████▎  | 881/1208 [24:09<08:58,  1.65s/it, loss=0.11, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000941, train/loss_step=0.242, global_step=4448.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  73%|███████▎  | 882/1208 [24:10<08:56,  1.64s/it, loss=0.11, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000941, train/loss_step=0.242, global_step=4448.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  73%|███████▎  | 882/1208 [24:10<08:56,  1.64s/it, loss=0.0863, v_num=0, train/loss_simple_step=0.0094, train/loss_vlb_step=4.37e-5, train/loss_step=0.0094, global_step=4448.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  73%|███████▎  | 883/1208 [24:11<08:54,  1.64s/it, loss=0.0863, v_num=0, train/loss_simple_step=0.0094, train/loss_vlb_step=4.37e-5, train/loss_step=0.0094, global_step=4448.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  73%|███████▎  | 883/1208 [24:11<08:54,  1.64s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=2.97e-5, train/loss_step=0.00611, global_step=4448.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  73%|███████▎  | 884/1208 [24:14<08:53,  1.65s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=2.97e-5, train/loss_step=0.00611, global_step=4448.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  73%|███████▎  | 884/1208 [24:14<08:53,  1.65s/it, loss=0.089, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000962, train/loss_step=0.250, global_step=4448.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  73%|███████▎  | 885/1208 [24:15<08:51,  1.64s/it, loss=0.089, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000962, train/loss_step=0.250, global_step=4448.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  73%|███████▎  | 885/1208 [24:15<08:51,  1.64s/it, loss=0.089, v_num=0, train/loss_simple_step=0.00628, train/loss_vlb_step=3.21e-5, train/loss_step=0.00628, global_step=4449.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  73%|███████▎  | 886/1208 [24:16<08:49,  1.64s/it, loss=0.089, v_num=0, train/loss_simple_step=0.00628, train/loss_vlb_step=3.21e-5, train/loss_step=0.00628, global_step=4449.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  73%|███████▎  | 886/1208 [24:16<08:49,  1.64s/it, loss=0.112, v_num=0, train/loss_simple_step=0.561, train/loss_vlb_step=0.0106, train/loss_step=0.561, global_step=4449.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]     Epoch 14:  73%|███████▎  | 887/1208 [24:17<08:47,  1.64s/it, loss=0.112, v_num=0, train/loss_simple_step=0.561, train/loss_vlb_step=0.0106, train/loss_step=0.561, global_step=4449.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  73%|███████▎  | 887/1208 [24:17<08:47,  1.64s/it, loss=0.107, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000552, train/loss_step=0.159, global_step=4449.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  74%|███████▎  | 888/1208 [24:21<08:46,  1.65s/it, loss=0.107, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000552, train/loss_step=0.159, global_step=4449.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  74%|███████▎  | 888/1208 [24:21<08:46,  1.65s/it, loss=0.11, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000383, train/loss_step=0.116, global_step=4449.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  74%|███████▎  | 889/1208 [24:22<08:44,  1.64s/it, loss=0.11, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000383, train/loss_step=0.116, global_step=4449.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  74%|███████▎  | 889/1208 [24:22<08:44,  1.64s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00398, train/loss_vlb_step=2.12e-5, train/loss_step=0.00398, global_step=4450.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  74%|███████▎  | 890/1208 [24:23<08:42,  1.64s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00398, train/loss_vlb_step=2.12e-5, train/loss_step=0.00398, global_step=4450.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  74%|███████▎  | 890/1208 [24:23<08:42,  1.64s/it, loss=0.105, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00357, train/loss_step=0.369, global_step=4450.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  74%|███████▍  | 891/1208 [24:24<08:40,  1.64s/it, loss=0.105, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00357, train/loss_step=0.369, global_step=4450.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  74%|███████▍  | 891/1208 [24:24<08:40,  1.64s/it, loss=0.115, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000793, train/loss_step=0.205, global_step=4450.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  74%|███████▍  | 892/1208 [24:27<08:39,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000793, train/loss_step=0.205, global_step=4450.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  74%|███████▍  | 892/1208 [24:27<08:39,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000771, train/loss_step=0.215, global_step=4450.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  74%|███████▍  | 893/1208 [24:28<08:38,  1.64s/it, loss=0.126, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000771, train/loss_step=0.215, global_step=4450.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  74%|███████▍  | 893/1208 [24:28<08:38,  1.64s/it, loss=0.128, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000663, train/loss_step=0.175, global_step=4451.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  74%|███████▍  | 894/1208 [24:29<08:36,  1.64s/it, loss=0.128, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000663, train/loss_step=0.175, global_step=4451.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  74%|███████▍  | 894/1208 [24:29<08:36,  1.64s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=2.02e-5, train/loss_step=0.00375, global_step=4451.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  74%|███████▍  | 895/1208 [24:30<08:34,  1.64s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=2.02e-5, train/loss_step=0.00375, global_step=4451.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  74%|███████▍  | 895/1208 [24:30<08:34,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00871, train/loss_vlb_step=4.06e-5, train/loss_step=0.00871, global_step=4451.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  74%|███████▍  | 896/1208 [24:33<08:33,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00871, train/loss_vlb_step=4.06e-5, train/loss_step=0.00871, global_step=4451.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  74%|███████▍  | 896/1208 [24:33<08:33,  1.64s/it, loss=0.134, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00108, train/loss_step=0.252, global_step=4451.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  74%|███████▍  | 897/1208 [24:34<08:31,  1.64s/it, loss=0.134, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00108, train/loss_step=0.252, global_step=4451.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  74%|███████▍  | 897/1208 [24:34<08:31,  1.64s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.9e-5, train/loss_step=0.0187, global_step=4452.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  74%|███████▍  | 898/1208 [24:35<08:29,  1.64s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.9e-5, train/loss_step=0.0187, global_step=4452.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  74%|███████▍  | 898/1208 [24:35<08:29,  1.64s/it, loss=0.157, v_num=0, train/loss_simple_step=0.478, train/loss_vlb_step=0.00414, train/loss_step=0.478, global_step=4452.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  74%|███████▍  | 899/1208 [24:37<08:27,  1.64s/it, loss=0.157, v_num=0, train/loss_simple_step=0.478, train/loss_vlb_step=0.00414, train/loss_step=0.478, global_step=4452.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  74%|███████▍  | 899/1208 [24:37<08:27,  1.64s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000138, train/loss_step=0.0372, global_step=4452.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  75%|███████▍  | 900/1208 [24:40<08:26,  1.64s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000138, train/loss_step=0.0372, global_step=4452.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  75%|███████▍  | 900/1208 [24:40<08:26,  1.64s/it, loss=0.18, v_num=0, train/loss_simple_step=0.491, train/loss_vlb_step=0.00744, train/loss_step=0.491, global_step=4452.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.76it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.83it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.83it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.84it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.82it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.84it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.84it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.84it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.84it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.84it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.84it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.84it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.84it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.84it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.84it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.84it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:12,  1.85it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.83it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.83it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.83it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.84it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.84it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.85it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.84it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.84it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.84it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.84it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.84it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.83it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.84it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.84it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.83it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.84it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.83it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.83it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.83it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.84it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.83it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.84it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.84it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.84it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.84it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.84it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.84it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.84it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.84it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.84it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.83it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.84it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.84it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.83it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.84it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.84it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.83it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.84it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.84it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.83it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.85it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.85it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.83it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.85it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.84it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.83it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.85it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.85it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.83it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.83it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]Epoch 14:  75%|███████▍  | 901/1208 [25:10<08:34,  1.68s/it, loss=0.18, v_num=0, train/loss_simple_step=0.491, train/loss_vlb_step=0.00744, train/loss_step=0.491, global_step=4452.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  75%|███████▍  | 901/1208 [25:10<08:34,  1.68s/it, loss=0.169, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.1e-5, train/loss_step=0.023, global_step=4453.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  75%|███████▍  | 902/1208 [25:11<08:32,  1.68s/it, loss=0.169, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.1e-5, train/loss_step=0.023, global_step=4453.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  75%|███████▍  | 902/1208 [25:11<08:32,  1.68s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.17e-5, train/loss_step=0.0113, global_step=4453.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  75%|███████▍  | 903/1208 [25:12<08:30,  1.67s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.17e-5, train/loss_step=0.0113, global_step=4453.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  75%|███████▍  | 903/1208 [25:12<08:30,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00873, train/loss_vlb_step=4.2e-5, train/loss_step=0.00873, global_step=4453.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  75%|███████▍  | 904/1208 [25:15<08:29,  1.68s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00873, train/loss_vlb_step=4.2e-5, train/loss_step=0.00873, global_step=4453.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  75%|███████▍  | 904/1208 [25:15<08:29,  1.68s/it, loss=0.175, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00219, train/loss_step=0.355, global_step=4453.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  75%|███████▍  | 905/1208 [25:16<08:27,  1.68s/it, loss=0.175, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00219, train/loss_step=0.355, global_step=4453.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  75%|███████▍  | 905/1208 [25:16<08:27,  1.68s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.78e-5, train/loss_step=0.0103, global_step=4454.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  75%|███████▌  | 906/1208 [25:17<08:25,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.78e-5, train/loss_step=0.0103, global_step=4454.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  75%|███████▌  | 906/1208 [25:17<08:25,  1.67s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.28e-5, train/loss_step=0.0118, global_step=4454.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  75%|███████▌  | 907/1208 [25:18<08:23,  1.67s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.28e-5, train/loss_step=0.0118, global_step=4454.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  75%|███████▌  | 907/1208 [25:18<08:23,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.96e-5, train/loss_step=0.0183, global_step=4454.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  75%|███████▌  | 908/1208 [25:20<08:22,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.96e-5, train/loss_step=0.0183, global_step=4454.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  75%|███████▌  | 908/1208 [25:20<08:22,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00979, train/loss_vlb_step=4.77e-5, train/loss_step=0.00979, global_step=4454.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  75%|███████▌  | 909/1208 [25:21<08:20,  1.67s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00979, train/loss_vlb_step=4.77e-5, train/loss_step=0.00979, global_step=4454.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  75%|███████▌  | 909/1208 [25:21<08:20,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000102, train/loss_step=0.0279, global_step=4455.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  75%|███████▌  | 910/1208 [25:22<08:18,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000102, train/loss_step=0.0279, global_step=4455.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  75%|███████▌  | 910/1208 [25:22<08:18,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0324, train/loss_vlb_step=0.000123, train/loss_step=0.0324, global_step=4455.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  75%|███████▌  | 911/1208 [25:23<08:16,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0324, train/loss_vlb_step=0.000123, train/loss_step=0.0324, global_step=4455.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  75%|███████▌  | 911/1208 [25:23<08:16,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.540, train/loss_vlb_step=0.00883, train/loss_step=0.540, global_step=4455.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  75%|███████▌  | 912/1208 [25:26<08:15,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.540, train/loss_vlb_step=0.00883, train/loss_step=0.540, global_step=4455.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  75%|███████▌  | 912/1208 [25:26<08:15,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.00038, train/loss_step=0.115, global_step=4455.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  76%|███████▌  | 913/1208 [25:27<08:13,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.00038, train/loss_step=0.115, global_step=4455.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  76%|███████▌  | 913/1208 [25:27<08:13,  1.67s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0722, train/loss_vlb_step=0.000248, train/loss_step=0.0722, global_step=4456.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  76%|███████▌  | 914/1208 [25:28<08:11,  1.67s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0722, train/loss_vlb_step=0.000248, train/loss_step=0.0722, global_step=4456.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  76%|███████▌  | 914/1208 [25:28<08:11,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.00096, train/loss_step=0.233, global_step=4456.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  76%|███████▌  | 915/1208 [25:29<08:09,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.00096, train/loss_step=0.233, global_step=4456.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  76%|███████▌  | 915/1208 [25:29<08:09,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.96e-5, train/loss_step=0.00352, global_step=4456.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  76%|███████▌  | 916/1208 [25:32<08:08,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.96e-5, train/loss_step=0.00352, global_step=4456.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  76%|███████▌  | 916/1208 [25:32<08:08,  1.67s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00828, train/loss_vlb_step=4.04e-5, train/loss_step=0.00828, global_step=4456.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  76%|███████▌  | 917/1208 [25:33<08:06,  1.67s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00828, train/loss_vlb_step=4.04e-5, train/loss_step=0.00828, global_step=4456.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  76%|███████▌  | 917/1208 [25:33<08:06,  1.67s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.87e-5, train/loss_step=0.0107, global_step=4457.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  76%|███████▌  | 918/1208 [25:34<08:04,  1.67s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.87e-5, train/loss_step=0.0107, global_step=4457.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  76%|███████▌  | 918/1208 [25:34<08:04,  1.67s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00505, train/loss_vlb_step=2.63e-5, train/loss_step=0.00505, global_step=4457.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  76%|███████▌  | 919/1208 [25:35<08:02,  1.67s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00505, train/loss_vlb_step=2.63e-5, train/loss_step=0.00505, global_step=4457.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  76%|███████▌  | 919/1208 [25:35<08:02,  1.67s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.00494, train/loss_vlb_step=2.69e-5, train/loss_step=0.00494, global_step=4457.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  76%|███████▌  | 920/1208 [25:38<08:01,  1.67s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.00494, train/loss_vlb_step=2.69e-5, train/loss_step=0.00494, global_step=4457.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  76%|███████▌  | 920/1208 [25:38<08:01,  1.67s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00135, train/loss_step=0.253, global_step=4457.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  76%|███████▌  | 921/1208 [25:39<07:59,  1.67s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00135, train/loss_step=0.253, global_step=4457.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  76%|███████▌  | 921/1208 [25:39<07:59,  1.67s/it, loss=0.091, v_num=0, train/loss_simple_step=0.089, train/loss_vlb_step=0.000297, train/loss_step=0.089, global_step=4458.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  76%|███████▋  | 922/1208 [25:40<07:57,  1.67s/it, loss=0.091, v_num=0, train/loss_simple_step=0.089, train/loss_vlb_step=0.000297, train/loss_step=0.089, global_step=4458.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  76%|███████▋  | 922/1208 [25:40<07:57,  1.67s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=1.18e-5, train/loss_step=0.00201, global_step=4458.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  76%|███████▋  | 923/1208 [25:41<07:56,  1.67s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=1.18e-5, train/loss_step=0.00201, global_step=4458.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  76%|███████▋  | 923/1208 [25:41<07:56,  1.67s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.000154, train/loss_step=0.041, global_step=4458.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  76%|███████▋  | 924/1208 [25:44<07:54,  1.67s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.000154, train/loss_step=0.041, global_step=4458.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  76%|███████▋  | 924/1208 [25:44<07:54,  1.67s/it, loss=0.1, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.010, train/loss_step=0.512, global_step=4458.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]      Epoch 14:  77%|███████▋  | 925/1208 [25:45<07:52,  1.67s/it, loss=0.1, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.010, train/loss_step=0.512, global_step=4458.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  77%|███████▋  | 925/1208 [25:45<07:52,  1.67s/it, loss=0.107, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000527, train/loss_step=0.157, global_step=4459.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  77%|███████▋  | 926/1208 [25:46<07:51,  1.67s/it, loss=0.107, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000527, train/loss_step=0.157, global_step=4459.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  77%|███████▋  | 926/1208 [25:46<07:51,  1.67s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.000174, train/loss_step=0.0485, global_step=4459.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  77%|███████▋  | 927/1208 [25:47<07:49,  1.67s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.000174, train/loss_step=0.0485, global_step=4459.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  77%|███████▋  | 927/1208 [25:47<07:49,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0816, train/loss_vlb_step=0.000273, train/loss_step=0.0816, global_step=4459.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  77%|███████▋  | 928/1208 [25:50<07:47,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0816, train/loss_vlb_step=0.000273, train/loss_step=0.0816, global_step=4459.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  77%|███████▋  | 928/1208 [25:50<07:47,  1.67s/it, loss=0.123, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000901, train/loss_step=0.230, global_step=4459.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  77%|███████▋  | 929/1208 [25:51<07:45,  1.67s/it, loss=0.123, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000901, train/loss_step=0.230, global_step=4459.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  77%|███████▋  | 929/1208 [25:51<07:45,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00403, train/loss_vlb_step=2.2e-5, train/loss_step=0.00403, global_step=4460.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  77%|███████▋  | 930/1208 [25:52<07:44,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00403, train/loss_vlb_step=2.2e-5, train/loss_step=0.00403, global_step=4460.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  77%|███████▋  | 930/1208 [25:52<07:44,  1.67s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.000153, train/loss_step=0.0418, global_step=4460.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  77%|███████▋  | 931/1208 [25:53<07:42,  1.67s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.000153, train/loss_step=0.0418, global_step=4460.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  77%|███████▋  | 931/1208 [25:53<07:42,  1.67s/it, loss=0.102, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000428, train/loss_step=0.129, global_step=4460.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  77%|███████▋  | 932/1208 [25:56<07:40,  1.67s/it, loss=0.102, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000428, train/loss_step=0.129, global_step=4460.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  77%|███████▋  | 932/1208 [25:56<07:40,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.488, train/loss_vlb_step=0.00508, train/loss_step=0.488, global_step=4460.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  77%|███████▋  | 933/1208 [25:57<07:39,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.488, train/loss_vlb_step=0.00508, train/loss_step=0.488, global_step=4460.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  77%|███████▋  | 933/1208 [25:57<07:39,  1.67s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.47e-5, train/loss_step=0.0125, global_step=4461.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  77%|███████▋  | 934/1208 [25:58<07:37,  1.67s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.47e-5, train/loss_step=0.0125, global_step=4461.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  77%|███████▋  | 934/1208 [25:58<07:37,  1.67s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0733, train/loss_vlb_step=0.000246, train/loss_step=0.0733, global_step=4461.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  77%|███████▋  | 935/1208 [25:59<07:35,  1.67s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0733, train/loss_vlb_step=0.000246, train/loss_step=0.0733, global_step=4461.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  77%|███████▋  | 935/1208 [25:59<07:35,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=4461.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  77%|███████▋  | 936/1208 [26:02<07:34,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=4461.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  77%|███████▋  | 936/1208 [26:02<07:34,  1.67s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0922, train/loss_vlb_step=0.000312, train/loss_step=0.0922, global_step=4461.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  78%|███████▊  | 937/1208 [26:03<07:32,  1.67s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0922, train/loss_vlb_step=0.000312, train/loss_step=0.0922, global_step=4461.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  78%|███████▊  | 937/1208 [26:03<07:32,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00193, train/loss_step=0.318, global_step=4462.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  78%|███████▊  | 938/1208 [26:04<07:30,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00193, train/loss_step=0.318, global_step=4462.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  78%|███████▊  | 938/1208 [26:04<07:30,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00142, train/loss_step=0.300, global_step=4462.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  78%|███████▊  | 939/1208 [26:05<07:28,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00142, train/loss_step=0.300, global_step=4462.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  78%|███████▊  | 939/1208 [26:05<07:28,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000384, train/loss_step=0.117, global_step=4462.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  78%|███████▊  | 940/1208 [26:08<07:27,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000384, train/loss_step=0.117, global_step=4462.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  78%|███████▊  | 940/1208 [26:08<07:27,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.0033, train/loss_step=0.389, global_step=4462.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  78%|███████▊  | 941/1208 [26:09<07:25,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.0033, train/loss_step=0.389, global_step=4462.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  78%|███████▊  | 941/1208 [26:09<07:25,  1.67s/it, loss=0.176, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00286, train/loss_step=0.380, global_step=4463.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  78%|███████▊  | 942/1208 [26:10<07:23,  1.67s/it, loss=0.176, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00286, train/loss_step=0.380, global_step=4463.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  78%|███████▊  | 942/1208 [26:10<07:23,  1.67s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=1.05e-5, train/loss_step=0.00181, global_step=4463.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  78%|███████▊  | 943/1208 [26:11<07:21,  1.67s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=1.05e-5, train/loss_step=0.00181, global_step=4463.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  78%|███████▊  | 943/1208 [26:11<07:21,  1.67s/it, loss=0.18, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=4463.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  78%|███████▊  | 944/1208 [26:14<07:20,  1.67s/it, loss=0.18, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=4463.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  78%|███████▊  | 944/1208 [26:14<07:20,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0769, train/loss_vlb_step=0.000257, train/loss_step=0.0769, global_step=4463.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  78%|███████▊  | 945/1208 [26:15<07:18,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0769, train/loss_vlb_step=0.000257, train/loss_step=0.0769, global_step=4463.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  78%|███████▊  | 945/1208 [26:15<07:18,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.29e-5, train/loss_step=0.0142, global_step=4464.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  78%|███████▊  | 946/1208 [26:16<07:16,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.29e-5, train/loss_step=0.0142, global_step=4464.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  78%|███████▊  | 946/1208 [26:16<07:16,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.00037, train/loss_step=0.113, global_step=4464.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  78%|███████▊  | 947/1208 [26:17<07:14,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.00037, train/loss_step=0.113, global_step=4464.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  78%|███████▊  | 947/1208 [26:17<07:14,  1.67s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.2e-5, train/loss_step=0.00202, global_step=4464.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  78%|███████▊  | 948/1208 [26:20<07:13,  1.67s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.2e-5, train/loss_step=0.00202, global_step=4464.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  78%|███████▊  | 948/1208 [26:20<07:13,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00155, train/loss_step=0.299, global_step=4464.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  79%|███████▊  | 949/1208 [26:21<07:11,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00155, train/loss_step=0.299, global_step=4464.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  79%|███████▊  | 949/1208 [26:21<07:11,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0487, train/loss_vlb_step=0.000176, train/loss_step=0.0487, global_step=4465.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  79%|███████▊  | 950/1208 [26:22<07:09,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0487, train/loss_vlb_step=0.000176, train/loss_step=0.0487, global_step=4465.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  79%|███████▊  | 950/1208 [26:22<07:09,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.000113, train/loss_step=0.0292, global_step=4465.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  79%|███████▊  | 951/1208 [26:23<07:07,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.000113, train/loss_step=0.0292, global_step=4465.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  79%|███████▊  | 951/1208 [26:23<07:07,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0094, train/loss_vlb_step=4.46e-5, train/loss_step=0.0094, global_step=4465.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  79%|███████▉  | 952/1208 [26:26<07:06,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0094, train/loss_vlb_step=4.46e-5, train/loss_step=0.0094, global_step=4465.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  79%|███████▉  | 952/1208 [26:26<07:06,  1.67s/it, loss=0.139, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00143, train/loss_step=0.287, global_step=4465.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  79%|███████▉  | 953/1208 [26:27<07:04,  1.67s/it, loss=0.139, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00143, train/loss_step=0.287, global_step=4465.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  79%|███████▉  | 953/1208 [26:27<07:04,  1.67s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00866, train/loss_vlb_step=3.96e-5, train/loss_step=0.00866, global_step=4466.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  79%|███████▉  | 954/1208 [26:28<07:02,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00866, train/loss_vlb_step=3.96e-5, train/loss_step=0.00866, global_step=4466.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  79%|███████▉  | 954/1208 [26:28<07:02,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0477, train/loss_vlb_step=0.000166, train/loss_step=0.0477, global_step=4466.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  79%|███████▉  | 955/1208 [26:29<07:01,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0477, train/loss_vlb_step=0.000166, train/loss_step=0.0477, global_step=4466.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  79%|███████▉  | 955/1208 [26:29<07:01,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000893, train/loss_step=0.239, global_step=4466.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  79%|███████▉  | 956/1208 [26:32<06:59,  1.67s/it, loss=0.144, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000893, train/loss_step=0.239, global_step=4466.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  79%|███████▉  | 956/1208 [26:32<06:59,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.6e-5, train/loss_step=0.00284, global_step=4466.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  79%|███████▉  | 957/1208 [26:33<06:57,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.6e-5, train/loss_step=0.00284, global_step=4466.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  79%|███████▉  | 957/1208 [26:33<06:57,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.75e-5, train/loss_step=0.00319, global_step=4467.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  79%|███████▉  | 958/1208 [26:34<06:55,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.75e-5, train/loss_step=0.00319, global_step=4467.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  79%|███████▉  | 958/1208 [26:34<06:55,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=4467.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  79%|███████▉  | 959/1208 [26:35<06:54,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=4467.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  79%|███████▉  | 959/1208 [26:35<06:54,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00171, train/loss_step=0.322, global_step=4467.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  79%|███████▉  | 960/1208 [26:38<06:52,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00171, train/loss_step=0.322, global_step=4467.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  79%|███████▉  | 960/1208 [26:38<06:52,  1.66s/it, loss=0.111, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000384, train/loss_step=0.117, global_step=4467.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  80%|███████▉  | 961/1208 [26:39<06:50,  1.66s/it, loss=0.111, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000384, train/loss_step=0.117, global_step=4467.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  80%|███████▉  | 961/1208 [26:39<06:50,  1.66s/it, loss=0.0927, v_num=0, train/loss_simple_step=0.00862, train/loss_vlb_step=4.17e-5, train/loss_step=0.00862, global_step=4468.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  80%|███████▉  | 962/1208 [26:40<06:49,  1.66s/it, loss=0.0927, v_num=0, train/loss_simple_step=0.00862, train/loss_vlb_step=4.17e-5, train/loss_step=0.00862, global_step=4468.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  80%|███████▉  | 962/1208 [26:40<06:49,  1.66s/it, loss=0.116, v_num=0, train/loss_simple_step=0.469, train/loss_vlb_step=0.00635, train/loss_step=0.469, global_step=4468.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]     Epoch 14:  80%|███████▉  | 963/1208 [26:41<06:47,  1.66s/it, loss=0.116, v_num=0, train/loss_simple_step=0.469, train/loss_vlb_step=0.00635, train/loss_step=0.469, global_step=4468.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  80%|███████▉  | 963/1208 [26:41<06:47,  1.66s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0664, train/loss_vlb_step=0.000224, train/loss_step=0.0664, global_step=4468.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  80%|███████▉  | 964/1208 [26:43<06:45,  1.66s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0664, train/loss_vlb_step=0.000224, train/loss_step=0.0664, global_step=4468.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  80%|███████▉  | 964/1208 [26:43<06:45,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000465, train/loss_step=0.142, global_step=4468.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  80%|███████▉  | 965/1208 [26:44<06:44,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000465, train/loss_step=0.142, global_step=4468.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  80%|███████▉  | 965/1208 [26:44<06:44,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.41e-5, train/loss_step=0.0147, global_step=4469.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  80%|███████▉  | 966/1208 [26:45<06:42,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.41e-5, train/loss_step=0.0147, global_step=4469.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  80%|███████▉  | 966/1208 [26:45<06:42,  1.66s/it, loss=0.116, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000334, train/loss_step=0.101, global_step=4469.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  80%|████████  | 967/1208 [26:46<06:40,  1.66s/it, loss=0.116, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000334, train/loss_step=0.101, global_step=4469.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  80%|████████  | 967/1208 [26:46<06:40,  1.66s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00597, train/loss_vlb_step=3.01e-5, train/loss_step=0.00597, global_step=4469.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  80%|████████  | 968/1208 [26:49<06:39,  1.66s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00597, train/loss_vlb_step=3.01e-5, train/loss_step=0.00597, global_step=4469.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  80%|████████  | 968/1208 [26:49<06:39,  1.66s/it, loss=0.112, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000754, train/loss_step=0.212, global_step=4469.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  80%|████████  | 969/1208 [26:50<06:37,  1.66s/it, loss=0.112, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000754, train/loss_step=0.212, global_step=4469.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  80%|████████  | 969/1208 [26:50<06:37,  1.66s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000147, train/loss_step=0.0405, global_step=4470.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  80%|████████  | 970/1208 [26:51<06:35,  1.66s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000147, train/loss_step=0.0405, global_step=4470.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  80%|████████  | 970/1208 [26:51<06:35,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000465, train/loss_step=0.139, global_step=4470.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  80%|████████  | 971/1208 [26:52<06:33,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000465, train/loss_step=0.139, global_step=4470.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  80%|████████  | 971/1208 [26:52<06:33,  1.66s/it, loss=0.121, v_num=0, train/loss_simple_step=0.079, train/loss_vlb_step=0.000264, train/loss_step=0.079, global_step=4470.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  80%|████████  | 972/1208 [26:55<06:32,  1.66s/it, loss=0.121, v_num=0, train/loss_simple_step=0.079, train/loss_vlb_step=0.000264, train/loss_step=0.079, global_step=4470.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  80%|████████  | 972/1208 [26:55<06:32,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000596, train/loss_step=0.175, global_step=4470.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  81%|████████  | 973/1208 [26:56<06:30,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000596, train/loss_step=0.175, global_step=4470.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  81%|████████  | 973/1208 [26:56<06:30,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000473, train/loss_step=0.143, global_step=4471.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  81%|████████  | 974/1208 [26:57<06:28,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000473, train/loss_step=0.143, global_step=4471.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  81%|████████  | 974/1208 [26:57<06:28,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000472, train/loss_step=0.143, global_step=4471.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  81%|████████  | 975/1208 [26:58<06:26,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000472, train/loss_step=0.143, global_step=4471.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  81%|████████  | 975/1208 [26:58<06:26,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00628, train/loss_vlb_step=3.26e-5, train/loss_step=0.00628, global_step=4471.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  81%|████████  | 976/1208 [27:01<06:25,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00628, train/loss_vlb_step=3.26e-5, train/loss_step=0.00628, global_step=4471.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  81%|████████  | 976/1208 [27:01<06:25,  1.66s/it, loss=0.127, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.001, train/loss_step=0.241, global_step=4471.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]      Epoch 14:  81%|████████  | 977/1208 [27:02<06:23,  1.66s/it, loss=0.127, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.001, train/loss_step=0.241, global_step=4471.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  81%|████████  | 977/1208 [27:02<06:23,  1.66s/it, loss=0.127, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.75e-5, train/loss_step=0.013, global_step=4472.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  81%|████████  | 978/1208 [27:03<06:21,  1.66s/it, loss=0.127, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.75e-5, train/loss_step=0.013, global_step=4472.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  81%|████████  | 978/1208 [27:03<06:21,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.4e-5, train/loss_step=0.0112, global_step=4472.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  81%|████████  | 979/1208 [27:04<06:20,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.4e-5, train/loss_step=0.0112, global_step=4472.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  81%|████████  | 979/1208 [27:04<06:20,  1.66s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0569, train/loss_vlb_step=0.000196, train/loss_step=0.0569, global_step=4472.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  81%|████████  | 980/1208 [27:07<06:18,  1.66s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0569, train/loss_vlb_step=0.000196, train/loss_step=0.0569, global_step=4472.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  81%|████████  | 980/1208 [27:07<06:18,  1.66s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.09e-5, train/loss_step=0.0198, global_step=4472.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  81%|████████  | 981/1208 [27:08<06:16,  1.66s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.09e-5, train/loss_step=0.0198, global_step=4472.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  81%|████████  | 981/1208 [27:08<06:16,  1.66s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00403, train/loss_vlb_step=2.12e-5, train/loss_step=0.00403, global_step=4473.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  81%|████████▏ | 982/1208 [27:09<06:15,  1.66s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00403, train/loss_vlb_step=2.12e-5, train/loss_step=0.00403, global_step=4473.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  81%|████████▏ | 982/1208 [27:09<06:15,  1.66s/it, loss=0.081, v_num=0, train/loss_simple_step=0.00835, train/loss_vlb_step=4.15e-5, train/loss_step=0.00835, global_step=4473.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  81%|████████▏ | 983/1208 [27:10<06:13,  1.66s/it, loss=0.081, v_num=0, train/loss_simple_step=0.00835, train/loss_vlb_step=4.15e-5, train/loss_step=0.00835, global_step=4473.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  81%|████████▏ | 983/1208 [27:10<06:13,  1.66s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00492, train/loss_step=0.423, global_step=4473.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  81%|████████▏ | 984/1208 [27:13<06:11,  1.66s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00492, train/loss_step=0.423, global_step=4473.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  81%|████████▏ | 984/1208 [27:13<06:11,  1.66s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=6.85e-5, train/loss_step=0.0165, global_step=4473.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  82%|████████▏ | 985/1208 [27:14<06:10,  1.66s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=6.85e-5, train/loss_step=0.0165, global_step=4473.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  82%|████████▏ | 985/1208 [27:14<06:10,  1.66s/it, loss=0.0923, v_num=0, train/loss_simple_step=0.00898, train/loss_vlb_step=4.37e-5, train/loss_step=0.00898, global_step=4474.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  82%|████████▏ | 986/1208 [27:15<06:08,  1.66s/it, loss=0.0923, v_num=0, train/loss_simple_step=0.00898, train/loss_vlb_step=4.37e-5, train/loss_step=0.00898, global_step=4474.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  82%|████████▏ | 986/1208 [27:15<06:08,  1.66s/it, loss=0.106, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00302, train/loss_step=0.380, global_step=4474.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]     Epoch 14:  82%|████████▏ | 987/1208 [27:16<06:06,  1.66s/it, loss=0.106, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00302, train/loss_step=0.380, global_step=4474.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  82%|████████▏ | 987/1208 [27:16<06:06,  1.66s/it, loss=0.148, v_num=0, train/loss_simple_step=0.850, train/loss_vlb_step=0.428, train/loss_step=0.850, global_step=4474.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  82%|████████▏ | 988/1208 [27:19<06:05,  1.66s/it, loss=0.148, v_num=0, train/loss_simple_step=0.850, train/loss_vlb_step=0.428, train/loss_step=0.850, global_step=4474.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  82%|████████▏ | 988/1208 [27:19<06:05,  1.66s/it, loss=0.148, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000809, train/loss_step=0.211, global_step=4474.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  82%|████████▏ | 989/1208 [27:20<06:03,  1.66s/it, loss=0.148, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000809, train/loss_step=0.211, global_step=4474.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  82%|████████▏ | 989/1208 [27:20<06:03,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000168, train/loss_step=0.0474, global_step=4475.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  82%|████████▏ | 990/1208 [27:21<06:01,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000168, train/loss_step=0.0474, global_step=4475.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  82%|████████▏ | 990/1208 [27:21<06:01,  1.66s/it, loss=0.159, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00183, train/loss_step=0.336, global_step=4475.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  82%|████████▏ | 991/1208 [27:22<05:59,  1.66s/it, loss=0.159, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00183, train/loss_step=0.336, global_step=4475.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  82%|████████▏ | 991/1208 [27:22<05:59,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.9e-5, train/loss_step=0.0162, global_step=4475.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  82%|████████▏ | 992/1208 [27:25<05:58,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.9e-5, train/loss_step=0.0162, global_step=4475.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  82%|████████▏ | 992/1208 [27:25<05:58,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000585, train/loss_step=0.163, global_step=4475.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  82%|████████▏ | 993/1208 [27:26<05:56,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000585, train/loss_step=0.163, global_step=4475.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  82%|████████▏ | 993/1208 [27:26<05:56,  1.66s/it, loss=0.157, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000617, train/loss_step=0.180, global_step=4476.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  82%|████████▏ | 994/1208 [27:27<05:54,  1.66s/it, loss=0.157, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000617, train/loss_step=0.180, global_step=4476.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  82%|████████▏ | 994/1208 [27:27<05:54,  1.66s/it, loss=0.161, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.00083, train/loss_step=0.221, global_step=4476.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  82%|████████▏ | 995/1208 [27:28<05:52,  1.66s/it, loss=0.161, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.00083, train/loss_step=0.221, global_step=4476.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  82%|████████▏ | 995/1208 [27:28<05:52,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.060, train/loss_vlb_step=0.000199, train/loss_step=0.060, global_step=4476.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  82%|████████▏ | 996/1208 [27:31<05:51,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.060, train/loss_vlb_step=0.000199, train/loss_step=0.060, global_step=4476.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  82%|████████▏ | 996/1208 [27:31<05:51,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0787, train/loss_vlb_step=0.000269, train/loss_step=0.0787, global_step=4476.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  83%|████████▎ | 997/1208 [27:32<05:49,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0787, train/loss_vlb_step=0.000269, train/loss_step=0.0787, global_step=4476.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  83%|████████▎ | 997/1208 [27:32<05:49,  1.66s/it, loss=0.161, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000462, train/loss_step=0.137, global_step=4477.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  83%|████████▎ | 998/1208 [27:33<05:47,  1.66s/it, loss=0.161, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000462, train/loss_step=0.137, global_step=4477.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  83%|████████▎ | 998/1208 [27:33<05:47,  1.66s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.15e-5, train/loss_step=0.00194, global_step=4477.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  83%|████████▎ | 999/1208 [27:34<05:46,  1.66s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.15e-5, train/loss_step=0.00194, global_step=4477.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  83%|████████▎ | 999/1208 [27:34<05:46,  1.66s/it, loss=0.172, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00108, train/loss_step=0.268, global_step=4477.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  83%|████████▎ | 1000/1208 [27:37<05:44,  1.66s/it, loss=0.172, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00108, train/loss_step=0.268, global_step=4477.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  83%|████████▎ | 1000/1208 [27:37<05:44,  1.66s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0863, train/loss_vlb_step=0.000284, train/loss_step=0.0863, global_step=4477.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  83%|████████▎ | 1001/1208 [27:38<05:42,  1.66s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0863, train/loss_vlb_step=0.000284, train/loss_step=0.0863, global_step=4477.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  83%|████████▎ | 1001/1208 [27:38<05:42,  1.66s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.74e-5, train/loss_step=0.0182, global_step=4478.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  83%|████████▎ | 1002/1208 [27:39<05:41,  1.66s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.74e-5, train/loss_step=0.0182, global_step=4478.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  83%|████████▎ | 1002/1208 [27:39<05:41,  1.66s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00567, train/loss_vlb_step=3.01e-5, train/loss_step=0.00567, global_step=4478.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  83%|████████▎ | 1003/1208 [27:40<05:39,  1.66s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00567, train/loss_vlb_step=3.01e-5, train/loss_step=0.00567, global_step=4478.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  83%|████████▎ | 1003/1208 [27:40<05:39,  1.66s/it, loss=0.165, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000837, train/loss_step=0.208, global_step=4478.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  83%|████████▎ | 1004/1208 [27:43<05:37,  1.66s/it, loss=0.165, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000837, train/loss_step=0.208, global_step=4478.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  83%|████████▎ | 1004/1208 [27:43<05:37,  1.66s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000126, train/loss_step=0.0327, global_step=4478.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  83%|████████▎ | 1005/1208 [27:44<05:36,  1.66s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000126, train/loss_step=0.0327, global_step=4478.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  83%|████████▎ | 1005/1208 [27:44<05:36,  1.66s/it, loss=0.171, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000404, train/loss_step=0.122, global_step=4479.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  83%|████████▎ | 1006/1208 [27:45<05:34,  1.66s/it, loss=0.171, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000404, train/loss_step=0.122, global_step=4479.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  83%|████████▎ | 1006/1208 [27:45<05:34,  1.66s/it, loss=0.169, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00155, train/loss_step=0.342, global_step=4479.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  83%|████████▎ | 1007/1208 [27:46<05:32,  1.65s/it, loss=0.169, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00155, train/loss_step=0.342, global_step=4479.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  83%|████████▎ | 1007/1208 [27:46<05:32,  1.65s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.07e-5, train/loss_step=0.00178, global_step=4479.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  83%|████████▎ | 1008/1208 [27:49<05:31,  1.66s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.07e-5, train/loss_step=0.00178, global_step=4479.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  83%|████████▎ | 1008/1208 [27:49<05:31,  1.66s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0689, train/loss_vlb_step=0.000238, train/loss_step=0.0689, global_step=4479.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  84%|████████▎ | 1009/1208 [27:50<05:29,  1.66s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0689, train/loss_vlb_step=0.000238, train/loss_step=0.0689, global_step=4479.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  84%|████████▎ | 1009/1208 [27:50<05:29,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00559, train/loss_vlb_step=2.81e-5, train/loss_step=0.00559, global_step=4480.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  84%|████████▎ | 1010/1208 [27:51<05:27,  1.65s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00559, train/loss_vlb_step=2.81e-5, train/loss_step=0.00559, global_step=4480.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  84%|████████▎ | 1010/1208 [27:51<05:27,  1.65s/it, loss=0.105, v_num=0, train/loss_simple_step=0.089, train/loss_vlb_step=0.000293, train/loss_step=0.089, global_step=4480.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  84%|████████▎ | 1011/1208 [27:52<05:25,  1.65s/it, loss=0.105, v_num=0, train/loss_simple_step=0.089, train/loss_vlb_step=0.000293, train/loss_step=0.089, global_step=4480.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  84%|████████▎ | 1011/1208 [27:52<05:25,  1.65s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000146, train/loss_step=0.0406, global_step=4480.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  84%|████████▍ | 1012/1208 [27:54<05:24,  1.66s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000146, train/loss_step=0.0406, global_step=4480.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  84%|████████▍ | 1012/1208 [27:54<05:24,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000649, train/loss_step=0.192, global_step=4480.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  84%|████████▍ | 1013/1208 [27:55<05:22,  1.65s/it, loss=0.108, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000649, train/loss_step=0.192, global_step=4480.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  84%|████████▍ | 1013/1208 [27:55<05:22,  1.65s/it, loss=0.111, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00103, train/loss_step=0.249, global_step=4481.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  84%|████████▍ | 1014/1208 [27:56<05:20,  1.65s/it, loss=0.111, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00103, train/loss_step=0.249, global_step=4481.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  84%|████████▍ | 1014/1208 [27:56<05:20,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.597, train/loss_vlb_step=0.00719, train/loss_step=0.597, global_step=4481.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  84%|████████▍ | 1015/1208 [27:57<05:19,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.597, train/loss_vlb_step=0.00719, train/loss_step=0.597, global_step=4481.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  84%|████████▍ | 1015/1208 [27:57<05:19,  1.65s/it, loss=0.138, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000746, train/loss_step=0.206, global_step=4481.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  84%|████████▍ | 1016/1208 [28:00<05:17,  1.65s/it, loss=0.138, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000746, train/loss_step=0.206, global_step=4481.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  84%|████████▍ | 1016/1208 [28:00<05:17,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00453, train/loss_vlb_step=2.33e-5, train/loss_step=0.00453, global_step=4481.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  84%|████████▍ | 1017/1208 [28:01<05:15,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00453, train/loss_vlb_step=2.33e-5, train/loss_step=0.00453, global_step=4481.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  84%|████████▍ | 1017/1208 [28:01<05:15,  1.65s/it, loss=0.16, v_num=0, train/loss_simple_step=0.660, train/loss_vlb_step=0.0311, train/loss_step=0.660, global_step=4482.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]      Epoch 14:  84%|████████▍ | 1018/1208 [28:02<05:14,  1.65s/it, loss=0.16, v_num=0, train/loss_simple_step=0.660, train/loss_vlb_step=0.0311, train/loss_step=0.660, global_step=4482.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  84%|████████▍ | 1018/1208 [28:02<05:14,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0576, train/loss_vlb_step=0.000204, train/loss_step=0.0576, global_step=4482.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  84%|████████▍ | 1019/1208 [28:03<05:12,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0576, train/loss_vlb_step=0.000204, train/loss_step=0.0576, global_step=4482.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  84%|████████▍ | 1019/1208 [28:03<05:12,  1.65s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00997, train/loss_vlb_step=4.81e-5, train/loss_step=0.00997, global_step=4482.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  84%|████████▍ | 1020/1208 [28:06<05:10,  1.65s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00997, train/loss_vlb_step=4.81e-5, train/loss_step=0.00997, global_step=4482.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  84%|████████▍ | 1020/1208 [28:06<05:10,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00144, train/loss_step=0.309, global_step=4482.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  85%|████████▍ | 1021/1208 [28:07<05:09,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00144, train/loss_step=0.309, global_step=4482.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  85%|████████▍ | 1021/1208 [28:07<05:09,  1.65s/it, loss=0.204, v_num=0, train/loss_simple_step=0.874, train/loss_vlb_step=0.440, train/loss_step=0.874, global_step=4483.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  85%|████████▍ | 1022/1208 [28:08<05:07,  1.65s/it, loss=0.204, v_num=0, train/loss_simple_step=0.874, train/loss_vlb_step=0.440, train/loss_step=0.874, global_step=4483.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  85%|████████▍ | 1022/1208 [28:08<05:07,  1.65s/it, loss=0.218, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00117, train/loss_step=0.290, global_step=4483.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  85%|████████▍ | 1023/1208 [28:09<05:05,  1.65s/it, loss=0.218, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00117, train/loss_step=0.290, global_step=4483.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  85%|████████▍ | 1023/1208 [28:09<05:05,  1.65s/it, loss=0.219, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.00078, train/loss_step=0.220, global_step=4483.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  85%|████████▍ | 1024/1208 [28:12<05:04,  1.65s/it, loss=0.219, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.00078, train/loss_step=0.220, global_step=4483.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  85%|████████▍ | 1024/1208 [28:12<05:04,  1.65s/it, loss=0.225, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000546, train/loss_step=0.153, global_step=4483.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  85%|████████▍ | 1025/1208 [28:13<05:02,  1.65s/it, loss=0.225, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000546, train/loss_step=0.153, global_step=4483.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  85%|████████▍ | 1025/1208 [28:13<05:02,  1.65s/it, loss=0.22, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.0001, train/loss_step=0.0255, global_step=4484.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  85%|████████▍ | 1026/1208 [28:14<05:00,  1.65s/it, loss=0.22, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.0001, train/loss_step=0.0255, global_step=4484.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  85%|████████▍ | 1026/1208 [28:14<05:00,  1.65s/it, loss=0.217, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00128, train/loss_step=0.283, global_step=4484.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  85%|████████▌ | 1027/1208 [28:15<04:58,  1.65s/it, loss=0.217, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00128, train/loss_step=0.283, global_step=4484.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  85%|████████▌ | 1027/1208 [28:15<04:58,  1.65s/it, loss=0.219, v_num=0, train/loss_simple_step=0.0541, train/loss_vlb_step=0.000189, train/loss_step=0.0541, global_step=4484.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  85%|████████▌ | 1028/1208 [28:18<04:57,  1.65s/it, loss=0.219, v_num=0, train/loss_simple_step=0.0541, train/loss_vlb_step=0.000189, train/loss_step=0.0541, global_step=4484.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  85%|████████▌ | 1028/1208 [28:18<04:57,  1.65s/it, loss=0.218, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000166, train/loss_step=0.0449, global_step=4484.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  85%|████████▌ | 1029/1208 [28:19<04:55,  1.65s/it, loss=0.218, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000166, train/loss_step=0.0449, global_step=4484.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  85%|████████▌ | 1029/1208 [28:19<04:55,  1.65s/it, loss=0.232, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00124, train/loss_step=0.277, global_step=4485.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  85%|████████▌ | 1030/1208 [28:20<04:53,  1.65s/it, loss=0.232, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00124, train/loss_step=0.277, global_step=4485.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  85%|████████▌ | 1030/1208 [28:20<04:53,  1.65s/it, loss=0.243, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00132, train/loss_step=0.311, global_step=4485.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  85%|████████▌ | 1031/1208 [28:21<04:52,  1.65s/it, loss=0.243, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00132, train/loss_step=0.311, global_step=4485.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  85%|████████▌ | 1031/1208 [28:21<04:52,  1.65s/it, loss=0.241, v_num=0, train/loss_simple_step=0.00692, train/loss_vlb_step=3.41e-5, train/loss_step=0.00692, global_step=4485.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  85%|████████▌ | 1032/1208 [28:24<04:50,  1.65s/it, loss=0.241, v_num=0, train/loss_simple_step=0.00692, train/loss_vlb_step=3.41e-5, train/loss_step=0.00692, global_step=4485.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  85%|████████▌ | 1032/1208 [28:24<04:50,  1.65s/it, loss=0.243, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000898, train/loss_step=0.232, global_step=4485.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  86%|████████▌ | 1033/1208 [28:25<04:48,  1.65s/it, loss=0.243, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000898, train/loss_step=0.232, global_step=4485.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  86%|████████▌ | 1033/1208 [28:25<04:48,  1.65s/it, loss=0.231, v_num=0, train/loss_simple_step=0.00812, train/loss_vlb_step=3.87e-5, train/loss_step=0.00812, global_step=4486.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  86%|████████▌ | 1034/1208 [28:26<04:47,  1.65s/it, loss=0.231, v_num=0, train/loss_simple_step=0.00812, train/loss_vlb_step=3.87e-5, train/loss_step=0.00812, global_step=4486.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  86%|████████▌ | 1034/1208 [28:26<04:47,  1.65s/it, loss=0.202, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=2.05e-5, train/loss_step=0.00378, global_step=4486.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  86%|████████▌ | 1035/1208 [28:27<04:45,  1.65s/it, loss=0.202, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=2.05e-5, train/loss_step=0.00378, global_step=4486.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  86%|████████▌ | 1035/1208 [28:27<04:45,  1.65s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0043, train/loss_vlb_step=2.35e-5, train/loss_step=0.0043, global_step=4486.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  86%|████████▌ | 1036/1208 [28:30<04:43,  1.65s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0043, train/loss_vlb_step=2.35e-5, train/loss_step=0.0043, global_step=4486.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  86%|████████▌ | 1036/1208 [28:30<04:43,  1.65s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0491, train/loss_vlb_step=0.000173, train/loss_step=0.0491, global_step=4486.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  86%|████████▌ | 1037/1208 [28:31<04:42,  1.65s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0491, train/loss_vlb_step=0.000173, train/loss_step=0.0491, global_step=4486.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  86%|████████▌ | 1037/1208 [28:31<04:42,  1.65s/it, loss=0.198, v_num=0, train/loss_simple_step=0.753, train/loss_vlb_step=0.0552, train/loss_step=0.753, global_step=4487.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  86%|████████▌ | 1038/1208 [28:32<04:40,  1.65s/it, loss=0.198, v_num=0, train/loss_simple_step=0.753, train/loss_vlb_step=0.0552, train/loss_step=0.753, global_step=4487.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  86%|████████▌ | 1038/1208 [28:32<04:40,  1.65s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0433, train/loss_vlb_step=0.000154, train/loss_step=0.0433, global_step=4487.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  86%|████████▌ | 1039/1208 [28:33<04:38,  1.65s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0433, train/loss_vlb_step=0.000154, train/loss_step=0.0433, global_step=4487.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  86%|████████▌ | 1039/1208 [28:33<04:38,  1.65s/it, loss=0.2, v_num=0, train/loss_simple_step=0.065, train/loss_vlb_step=0.00022, train/loss_step=0.065, global_step=4487.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]     Epoch 14:  86%|████████▌ | 1040/1208 [28:36<04:37,  1.65s/it, loss=0.2, v_num=0, train/loss_simple_step=0.065, train/loss_vlb_step=0.00022, train/loss_step=0.065, global_step=4487.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  86%|████████▌ | 1040/1208 [28:36<04:37,  1.65s/it, loss=0.191, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=4487.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  86%|████████▌ | 1041/1208 [28:37<04:35,  1.65s/it, loss=0.191, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=4487.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  86%|████████▌ | 1041/1208 [28:37<04:35,  1.65s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.54e-5, train/loss_step=0.0104, global_step=4488.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  86%|████████▋ | 1042/1208 [28:38<04:33,  1.65s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.54e-5, train/loss_step=0.0104, global_step=4488.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  86%|████████▋ | 1042/1208 [28:38<04:33,  1.65s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0749, train/loss_vlb_step=0.000252, train/loss_step=0.0749, global_step=4488.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  86%|████████▋ | 1043/1208 [28:39<04:31,  1.65s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0749, train/loss_vlb_step=0.000252, train/loss_step=0.0749, global_step=4488.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  86%|████████▋ | 1043/1208 [28:39<04:31,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0692, train/loss_vlb_step=0.000231, train/loss_step=0.0692, global_step=4488.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  86%|████████▋ | 1044/1208 [28:42<04:30,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0692, train/loss_vlb_step=0.000231, train/loss_step=0.0692, global_step=4488.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  86%|████████▋ | 1044/1208 [28:42<04:30,  1.65s/it, loss=0.15, v_num=0, train/loss_simple_step=0.555, train/loss_vlb_step=0.00657, train/loss_step=0.555, global_step=4488.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  87%|████████▋ | 1045/1208 [28:43<04:28,  1.65s/it, loss=0.15, v_num=0, train/loss_simple_step=0.555, train/loss_vlb_step=0.00657, train/loss_step=0.555, global_step=4488.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  87%|████████▋ | 1045/1208 [28:43<04:28,  1.65s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.15e-5, train/loss_step=0.0147, global_step=4489.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  87%|████████▋ | 1046/1208 [28:44<04:27,  1.65s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.15e-5, train/loss_step=0.0147, global_step=4489.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  87%|████████▋ | 1046/1208 [28:44<04:27,  1.65s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=2.31e-5, train/loss_step=0.00421, global_step=4489.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  87%|████████▋ | 1047/1208 [28:45<04:25,  1.65s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=2.31e-5, train/loss_step=0.00421, global_step=4489.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  87%|████████▋ | 1047/1208 [28:45<04:25,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000901, train/loss_step=0.224, global_step=4489.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  87%|████████▋ | 1048/1208 [28:48<04:23,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000901, train/loss_step=0.224, global_step=4489.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  87%|████████▋ | 1048/1208 [28:48<04:23,  1.65s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.36e-5, train/loss_step=0.0118, global_step=4489.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  87%|████████▋ | 1049/1208 [28:49<04:22,  1.65s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.36e-5, train/loss_step=0.0118, global_step=4489.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  87%|████████▋ | 1049/1208 [28:49<04:22,  1.65s/it, loss=0.143, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00147, train/loss_step=0.298, global_step=4490.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  87%|████████▋ | 1050/1208 [28:50<04:20,  1.65s/it, loss=0.143, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00147, train/loss_step=0.298, global_step=4490.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  87%|████████▋ | 1050/1208 [28:50<04:20,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.000183, train/loss_step=0.0521, global_step=4490.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  87%|████████▋ | 1051/1208 [28:51<04:18,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.000183, train/loss_step=0.0521, global_step=4490.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  87%|████████▋ | 1051/1208 [28:51<04:18,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00568, train/loss_vlb_step=2.88e-5, train/loss_step=0.00568, global_step=4490.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  87%|████████▋ | 1052/1208 [28:54<04:17,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00568, train/loss_vlb_step=2.88e-5, train/loss_step=0.00568, global_step=4490.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  87%|████████▋ | 1052/1208 [28:54<04:17,  1.65s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0674, train/loss_vlb_step=0.00023, train/loss_step=0.0674, global_step=4490.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  87%|████████▋ | 1053/1208 [28:55<04:15,  1.65s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0674, train/loss_vlb_step=0.00023, train/loss_step=0.0674, global_step=4490.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  87%|████████▋ | 1053/1208 [28:55<04:15,  1.65s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0737, train/loss_vlb_step=0.000247, train/loss_step=0.0737, global_step=4491.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  87%|████████▋ | 1054/1208 [28:56<04:13,  1.65s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0737, train/loss_vlb_step=0.000247, train/loss_step=0.0737, global_step=4491.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  87%|████████▋ | 1054/1208 [28:56<04:13,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000332, train/loss_step=0.100, global_step=4491.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  87%|████████▋ | 1055/1208 [28:57<04:11,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000332, train/loss_step=0.100, global_step=4491.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  87%|████████▋ | 1055/1208 [28:57<04:11,  1.65s/it, loss=0.145, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00185, train/loss_step=0.304, global_step=4491.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  87%|████████▋ | 1056/1208 [29:00<04:10,  1.65s/it, loss=0.145, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00185, train/loss_step=0.304, global_step=4491.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  87%|████████▋ | 1056/1208 [29:00<04:10,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.0029, train/loss_step=0.418, global_step=4491.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  88%|████████▊ | 1057/1208 [29:01<04:08,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.0029, train/loss_step=0.418, global_step=4491.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  88%|████████▊ | 1057/1208 [29:01<04:08,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0585, train/loss_vlb_step=0.000204, train/loss_step=0.0585, global_step=4492.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  88%|████████▊ | 1058/1208 [29:02<04:06,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0585, train/loss_vlb_step=0.000204, train/loss_step=0.0585, global_step=4492.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  88%|████████▊ | 1058/1208 [29:02<04:06,  1.65s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.88e-5, train/loss_step=0.00341, global_step=4492.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  88%|████████▊ | 1059/1208 [29:03<04:05,  1.65s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.88e-5, train/loss_step=0.00341, global_step=4492.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  88%|████████▊ | 1059/1208 [29:03<04:05,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=4492.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  88%|████████▊ | 1060/1208 [29:05<04:03,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=4492.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  88%|████████▊ | 1060/1208 [29:05<04:03,  1.65s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.52e-5, train/loss_step=0.0231, global_step=4492.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  88%|████████▊ | 1061/1208 [29:06<04:02,  1.65s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.52e-5, train/loss_step=0.0231, global_step=4492.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  88%|████████▊ | 1061/1208 [29:06<04:02,  1.65s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000108, train/loss_step=0.0293, global_step=4493.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  88%|████████▊ | 1062/1208 [29:07<04:00,  1.65s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000108, train/loss_step=0.0293, global_step=4493.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  88%|████████▊ | 1062/1208 [29:07<04:00,  1.65s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00548, train/loss_vlb_step=2.8e-5, train/loss_step=0.00548, global_step=4493.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  88%|████████▊ | 1063/1208 [29:08<03:58,  1.65s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00548, train/loss_vlb_step=2.8e-5, train/loss_step=0.00548, global_step=4493.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  88%|████████▊ | 1063/1208 [29:08<03:58,  1.65s/it, loss=0.127, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000642, train/loss_step=0.183, global_step=4493.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  88%|████████▊ | 1064/1208 [29:11<03:57,  1.65s/it, loss=0.127, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000642, train/loss_step=0.183, global_step=4493.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  88%|████████▊ | 1064/1208 [29:11<03:57,  1.65s/it, loss=0.111, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000831, train/loss_step=0.223, global_step=4493.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  88%|████████▊ | 1065/1208 [29:12<03:55,  1.65s/it, loss=0.111, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000831, train/loss_step=0.223, global_step=4493.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  88%|████████▊ | 1065/1208 [29:12<03:55,  1.65s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.49e-5, train/loss_step=0.0232, global_step=4494.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  88%|████████▊ | 1066/1208 [29:13<03:53,  1.65s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.49e-5, train/loss_step=0.0232, global_step=4494.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  88%|████████▊ | 1066/1208 [29:13<03:53,  1.65s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00691, train/loss_vlb_step=3.51e-5, train/loss_step=0.00691, global_step=4494.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  88%|████████▊ | 1067/1208 [29:14<03:51,  1.64s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00691, train/loss_vlb_step=3.51e-5, train/loss_step=0.00691, global_step=4494.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  88%|████████▊ | 1067/1208 [29:14<03:51,  1.64s/it, loss=0.102, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000127, train/loss_step=0.035, global_step=4494.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  88%|████████▊ | 1068/1208 [29:17<03:50,  1.65s/it, loss=0.102, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000127, train/loss_step=0.035, global_step=4494.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  88%|████████▊ | 1068/1208 [29:17<03:50,  1.65s/it, loss=0.112, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000785, train/loss_step=0.215, global_step=4494.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  88%|████████▊ | 1069/1208 [29:18<03:48,  1.65s/it, loss=0.112, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000785, train/loss_step=0.215, global_step=4494.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  88%|████████▊ | 1069/1208 [29:18<03:48,  1.65s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.87e-5, train/loss_step=0.0132, global_step=4495.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  89%|████████▊ | 1070/1208 [29:19<03:46,  1.64s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.87e-5, train/loss_step=0.0132, global_step=4495.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  89%|████████▊ | 1070/1208 [29:19<03:46,  1.64s/it, loss=0.1, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=4495.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  89%|████████▊ | 1071/1208 [29:20<03:45,  1.64s/it, loss=0.1, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=4495.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  89%|████████▊ | 1071/1208 [29:20<03:45,  1.64s/it, loss=0.114, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00131, train/loss_step=0.280, global_step=4495.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  89%|████████▊ | 1072/1208 [29:23<03:43,  1.65s/it, loss=0.114, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00131, train/loss_step=0.280, global_step=4495.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  89%|████████▊ | 1072/1208 [29:23<03:43,  1.65s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=1.93e-5, train/loss_step=0.00359, global_step=4495.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  89%|████████▉ | 1073/1208 [29:24<03:42,  1.64s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=1.93e-5, train/loss_step=0.00359, global_step=4495.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  89%|████████▉ | 1073/1208 [29:24<03:42,  1.64s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.79e-5, train/loss_step=0.0105, global_step=4496.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  89%|████████▉ | 1074/1208 [29:25<03:40,  1.64s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.79e-5, train/loss_step=0.0105, global_step=4496.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  89%|████████▉ | 1074/1208 [29:25<03:40,  1.64s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=1.96e-5, train/loss_step=0.00362, global_step=4496.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  89%|████████▉ | 1075/1208 [29:26<03:38,  1.64s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=1.96e-5, train/loss_step=0.00362, global_step=4496.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  89%|████████▉ | 1075/1208 [29:26<03:38,  1.64s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000252, train/loss_step=0.0754, global_step=4496.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  89%|████████▉ | 1076/1208 [29:29<03:37,  1.64s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000252, train/loss_step=0.0754, global_step=4496.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  89%|████████▉ | 1076/1208 [29:29<03:37,  1.64s/it, loss=0.0817, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000972, train/loss_step=0.224, global_step=4496.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  89%|████████▉ | 1077/1208 [29:30<03:35,  1.64s/it, loss=0.0817, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000972, train/loss_step=0.224, global_step=4496.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  89%|████████▉ | 1077/1208 [29:30<03:35,  1.64s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.0811, train/loss_vlb_step=0.000272, train/loss_step=0.0811, global_step=4497.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  89%|████████▉ | 1078/1208 [29:31<03:33,  1.64s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.0811, train/loss_vlb_step=0.000272, train/loss_step=0.0811, global_step=4497.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  89%|████████▉ | 1078/1208 [29:31<03:33,  1.64s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000147, train/loss_step=0.0415, global_step=4497.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  89%|████████▉ | 1079/1208 [29:32<03:31,  1.64s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000147, train/loss_step=0.0415, global_step=4497.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  89%|████████▉ | 1079/1208 [29:32<03:31,  1.64s/it, loss=0.0863, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000491, train/loss_step=0.145, global_step=4497.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  89%|████████▉ | 1080/1208 [29:35<03:30,  1.64s/it, loss=0.0863, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000491, train/loss_step=0.145, global_step=4497.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  89%|████████▉ | 1080/1208 [29:35<03:30,  1.64s/it, loss=0.101, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00147, train/loss_step=0.312, global_step=4497.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  89%|████████▉ | 1081/1208 [29:36<03:28,  1.64s/it, loss=0.101, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00147, train/loss_step=0.312, global_step=4497.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  89%|████████▉ | 1081/1208 [29:36<03:28,  1.64s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0559, train/loss_vlb_step=0.000191, train/loss_step=0.0559, global_step=4498.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  90%|████████▉ | 1082/1208 [29:37<03:26,  1.64s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0559, train/loss_vlb_step=0.000191, train/loss_step=0.0559, global_step=4498.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  90%|████████▉ | 1082/1208 [29:37<03:26,  1.64s/it, loss=0.112, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000794, train/loss_step=0.213, global_step=4498.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  90%|████████▉ | 1083/1208 [29:38<03:25,  1.64s/it, loss=0.112, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000794, train/loss_step=0.213, global_step=4498.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  90%|████████▉ | 1083/1208 [29:38<03:25,  1.64s/it, loss=0.11, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000458, train/loss_step=0.139, global_step=4498.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  90%|████████▉ | 1084/1208 [29:41<03:23,  1.64s/it, loss=0.11, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000458, train/loss_step=0.139, global_step=4498.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  90%|████████▉ | 1084/1208 [29:41<03:23,  1.64s/it, loss=0.115, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00145, train/loss_step=0.310, global_step=4498.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  90%|████████▉ | 1085/1208 [29:42<03:22,  1.64s/it, loss=0.115, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00145, train/loss_step=0.310, global_step=4498.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  90%|████████▉ | 1085/1208 [29:42<03:22,  1.64s/it, loss=0.119, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=4499.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  90%|████████▉ | 1086/1208 [29:43<03:20,  1.64s/it, loss=0.119, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=4499.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  90%|████████▉ | 1086/1208 [29:43<03:20,  1.64s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000123, train/loss_step=0.0319, global_step=4499.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  90%|████████▉ | 1087/1208 [29:44<03:18,  1.64s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000123, train/loss_step=0.0319, global_step=4499.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  90%|████████▉ | 1087/1208 [29:44<03:18,  1.64s/it, loss=0.158, v_num=0, train/loss_simple_step=0.802, train/loss_vlb_step=0.0587, train/loss_step=0.802, global_step=4499.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  90%|█████████ | 1088/1208 [29:47<03:17,  1.64s/it, loss=0.158, v_num=0, train/loss_simple_step=0.802, train/loss_vlb_step=0.0587, train/loss_step=0.802, global_step=4499.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  90%|█████████ | 1088/1208 [29:47<03:17,  1.64s/it, loss=0.17, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00336, train/loss_step=0.439, global_step=4499.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  90%|█████████ | 1089/1208 [29:48<03:15,  1.64s/it, loss=0.17, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00336, train/loss_step=0.439, global_step=4499.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  90%|█████████ | 1089/1208 [29:48<03:15,  1.64s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00923, train/loss_vlb_step=4.27e-5, train/loss_step=0.00923, global_step=4500.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  90%|█████████ | 1090/1208 [29:49<03:13,  1.64s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00923, train/loss_vlb_step=4.27e-5, train/loss_step=0.00923, global_step=4500.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  90%|█████████ | 1090/1208 [29:49<03:13,  1.64s/it, loss=0.188, v_num=0, train/loss_simple_step=0.481, train/loss_vlb_step=0.00695, train/loss_step=0.481, global_step=4500.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  90%|█████████ | 1091/1208 [29:50<03:12,  1.64s/it, loss=0.188, v_num=0, train/loss_simple_step=0.481, train/loss_vlb_step=0.00695, train/loss_step=0.481, global_step=4500.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  90%|█████████ | 1091/1208 [29:50<03:12,  1.64s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0641, train/loss_vlb_step=0.000214, train/loss_step=0.0641, global_step=4500.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  90%|█████████ | 1092/1208 [29:53<03:10,  1.64s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0641, train/loss_vlb_step=0.000214, train/loss_step=0.0641, global_step=4500.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  90%|█████████ | 1092/1208 [29:53<03:10,  1.64s/it, loss=0.179, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.000129, train/loss_step=0.033, global_step=4500.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  90%|█████████ | 1093/1208 [29:54<03:08,  1.64s/it, loss=0.179, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.000129, train/loss_step=0.033, global_step=4500.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  90%|█████████ | 1093/1208 [29:54<03:08,  1.64s/it, loss=0.184, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000334, train/loss_step=0.101, global_step=4501.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  91%|█████████ | 1094/1208 [29:55<03:07,  1.64s/it, loss=0.184, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000334, train/loss_step=0.101, global_step=4501.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  91%|█████████ | 1094/1208 [29:55<03:07,  1.64s/it, loss=0.2, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00163, train/loss_step=0.325, global_step=4501.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  91%|█████████ | 1095/1208 [29:56<03:05,  1.64s/it, loss=0.2, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00163, train/loss_step=0.325, global_step=4501.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  91%|█████████ | 1095/1208 [29:56<03:05,  1.64s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0338, train/loss_vlb_step=0.000124, train/loss_step=0.0338, global_step=4501.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  91%|█████████ | 1096/1208 [29:59<03:03,  1.64s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0338, train/loss_vlb_step=0.000124, train/loss_step=0.0338, global_step=4501.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  91%|█████████ | 1096/1208 [29:59<03:03,  1.64s/it, loss=0.207, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00322, train/loss_step=0.413, global_step=4501.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  91%|█████████ | 1097/1208 [30:00<03:02,  1.64s/it, loss=0.207, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00322, train/loss_step=0.413, global_step=4501.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  91%|█████████ | 1097/1208 [30:00<03:02,  1.64s/it, loss=0.204, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.22e-5, train/loss_step=0.0116, global_step=4502.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  91%|█████████ | 1098/1208 [30:01<03:00,  1.64s/it, loss=0.204, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.22e-5, train/loss_step=0.0116, global_step=4502.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  91%|█████████ | 1098/1208 [30:01<03:00,  1.64s/it, loss=0.22, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00197, train/loss_step=0.363, global_step=4502.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  91%|█████████ | 1099/1208 [30:02<02:58,  1.64s/it, loss=0.22, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00197, train/loss_step=0.363, global_step=4502.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  91%|█████████ | 1099/1208 [30:02<02:58,  1.64s/it, loss=0.244, v_num=0, train/loss_simple_step=0.631, train/loss_vlb_step=0.0254, train/loss_step=0.631, global_step=4502.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  91%|█████████ | 1100/1208 [30:05<02:57,  1.64s/it, loss=0.244, v_num=0, train/loss_simple_step=0.631, train/loss_vlb_step=0.0254, train/loss_step=0.631, global_step=4502.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  91%|█████████ | 1100/1208 [30:05<02:57,  1.64s/it, loss=0.231, v_num=0, train/loss_simple_step=0.053, train/loss_vlb_step=0.000184, train/loss_step=0.053, global_step=4502.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  91%|█████████ | 1101/1208 [30:06<02:55,  1.64s/it, loss=0.231, v_num=0, train/loss_simple_step=0.053, train/loss_vlb_step=0.000184, train/loss_step=0.053, global_step=4502.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  91%|█████████ | 1101/1208 [30:06<02:55,  1.64s/it, loss=0.229, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.14e-5, train/loss_step=0.0137, global_step=4503.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  91%|█████████ | 1102/1208 [30:07<02:53,  1.64s/it, loss=0.229, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.14e-5, train/loss_step=0.0137, global_step=4503.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  91%|█████████ | 1102/1208 [30:07<02:53,  1.64s/it, loss=0.218, v_num=0, train/loss_simple_step=0.00509, train/loss_vlb_step=2.7e-5, train/loss_step=0.00509, global_step=4503.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  91%|█████████▏| 1103/1208 [30:08<02:52,  1.64s/it, loss=0.218, v_num=0, train/loss_simple_step=0.00509, train/loss_vlb_step=2.7e-5, train/loss_step=0.00509, global_step=4503.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  91%|█████████▏| 1103/1208 [30:08<02:52,  1.64s/it, loss=0.212, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=2.7e-5, train/loss_step=0.00526, global_step=4503.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  91%|█████████▏| 1104/1208 [30:11<02:50,  1.64s/it, loss=0.212, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=2.7e-5, train/loss_step=0.00526, global_step=4503.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  91%|█████████▏| 1104/1208 [30:11<02:50,  1.64s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.68e-5, train/loss_step=0.0235, global_step=4503.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  91%|█████████▏| 1105/1208 [30:12<02:48,  1.64s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.68e-5, train/loss_step=0.0235, global_step=4503.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  91%|█████████▏| 1105/1208 [30:12<02:48,  1.64s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.000121, train/loss_step=0.0316, global_step=4504.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  92%|█████████▏| 1106/1208 [30:13<02:47,  1.64s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.000121, train/loss_step=0.0316, global_step=4504.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  92%|█████████▏| 1106/1208 [30:13<02:47,  1.64s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.22e-5, train/loss_step=0.0197, global_step=4504.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  92%|█████████▏| 1107/1208 [30:14<02:45,  1.64s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.22e-5, train/loss_step=0.0197, global_step=4504.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  92%|█████████▏| 1107/1208 [30:14<02:45,  1.64s/it, loss=0.171, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00268, train/loss_step=0.357, global_step=4504.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  92%|█████████▏| 1108/1208 [30:17<02:43,  1.64s/it, loss=0.171, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00268, train/loss_step=0.357, global_step=4504.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  92%|█████████▏| 1108/1208 [30:17<02:43,  1.64s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.000133, train/loss_step=0.0351, global_step=4504.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  92%|█████████▏| 1109/1208 [30:18<02:42,  1.64s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.000133, train/loss_step=0.0351, global_step=4504.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  92%|█████████▏| 1109/1208 [30:18<02:42,  1.64s/it, loss=0.162, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000929, train/loss_step=0.237, global_step=4505.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  92%|█████████▏| 1110/1208 [30:19<02:40,  1.64s/it, loss=0.162, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000929, train/loss_step=0.237, global_step=4505.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  92%|█████████▏| 1110/1208 [30:19<02:40,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.27e-5, train/loss_step=0.0176, global_step=4505.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  92%|█████████▏| 1111/1208 [30:20<02:38,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.27e-5, train/loss_step=0.0176, global_step=4505.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  92%|█████████▏| 1111/1208 [30:20<02:38,  1.64s/it, loss=0.147, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000891, train/loss_step=0.230, global_step=4505.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  92%|█████████▏| 1112/1208 [30:22<02:37,  1.64s/it, loss=0.147, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000891, train/loss_step=0.230, global_step=4505.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  92%|█████████▏| 1112/1208 [30:22<02:37,  1.64s/it, loss=0.152, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000475, train/loss_step=0.137, global_step=4505.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  92%|█████████▏| 1113/1208 [30:23<02:35,  1.64s/it, loss=0.152, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000475, train/loss_step=0.137, global_step=4505.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  92%|█████████▏| 1113/1208 [30:23<02:35,  1.64s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0897, train/loss_vlb_step=0.000299, train/loss_step=0.0897, global_step=4506.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  92%|█████████▏| 1114/1208 [30:24<02:33,  1.64s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0897, train/loss_vlb_step=0.000299, train/loss_step=0.0897, global_step=4506.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  92%|█████████▏| 1114/1208 [30:24<02:33,  1.64s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=7.94e-5, train/loss_step=0.0192, global_step=4506.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  92%|█████████▏| 1115/1208 [30:25<02:32,  1.64s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=7.94e-5, train/loss_step=0.0192, global_step=4506.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  92%|█████████▏| 1115/1208 [30:25<02:32,  1.64s/it, loss=0.144, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000654, train/loss_step=0.185, global_step=4506.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  92%|█████████▏| 1116/1208 [30:28<02:30,  1.64s/it, loss=0.144, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000654, train/loss_step=0.185, global_step=4506.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  92%|█████████▏| 1116/1208 [30:28<02:30,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.0012, train/loss_step=0.274, global_step=4506.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  92%|█████████▏| 1117/1208 [30:29<02:29,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.0012, train/loss_step=0.274, global_step=4506.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  92%|█████████▏| 1117/1208 [30:29<02:29,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=1.79e-5, train/loss_step=0.00309, global_step=4507.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  93%|█████████▎| 1118/1208 [30:30<02:27,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=1.79e-5, train/loss_step=0.00309, global_step=4507.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  93%|█████████▎| 1118/1208 [30:30<02:27,  1.64s/it, loss=0.12, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.000131, train/loss_step=0.034, global_step=4507.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  93%|█████████▎| 1119/1208 [30:31<02:25,  1.64s/it, loss=0.12, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.000131, train/loss_step=0.034, global_step=4507.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  93%|█████████▎| 1119/1208 [30:31<02:25,  1.64s/it, loss=0.104, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00173, train/loss_step=0.319, global_step=4507.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  93%|█████████▎| 1120/1208 [30:34<02:24,  1.64s/it, loss=0.104, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00173, train/loss_step=0.319, global_step=4507.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  93%|█████████▎| 1120/1208 [30:34<02:24,  1.64s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.19e-5, train/loss_step=0.0114, global_step=4507.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  93%|█████████▎| 1121/1208 [30:35<02:22,  1.64s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.19e-5, train/loss_step=0.0114, global_step=4507.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  93%|█████████▎| 1121/1208 [30:35<02:22,  1.64s/it, loss=0.129, v_num=0, train/loss_simple_step=0.553, train/loss_vlb_step=0.0124, train/loss_step=0.553, global_step=4508.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  93%|█████████▎| 1122/1208 [30:36<02:20,  1.64s/it, loss=0.129, v_num=0, train/loss_simple_step=0.553, train/loss_vlb_step=0.0124, train/loss_step=0.553, global_step=4508.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  93%|█████████▎| 1122/1208 [30:36<02:20,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000956, train/loss_step=0.224, global_step=4508.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  93%|█████████▎| 1123/1208 [30:37<02:19,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000956, train/loss_step=0.224, global_step=4508.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  93%|█████████▎| 1123/1208 [30:37<02:19,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0041, train/loss_vlb_step=2.2e-5, train/loss_step=0.0041, global_step=4508.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  93%|█████████▎| 1124/1208 [30:40<02:17,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0041, train/loss_vlb_step=2.2e-5, train/loss_step=0.0041, global_step=4508.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  93%|█████████▎| 1124/1208 [30:40<02:17,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.16e-5, train/loss_step=0.00195, global_step=4508.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  93%|█████████▎| 1125/1208 [30:41<02:15,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.16e-5, train/loss_step=0.00195, global_step=4508.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  93%|█████████▎| 1125/1208 [30:41<02:15,  1.64s/it, loss=0.143, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000377, train/loss_step=0.113, global_step=4509.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  93%|█████████▎| 1126/1208 [30:42<02:14,  1.64s/it, loss=0.143, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000377, train/loss_step=0.113, global_step=4509.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  93%|█████████▎| 1126/1208 [30:42<02:14,  1.64s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00453, train/loss_vlb_step=2.35e-5, train/loss_step=0.00453, global_step=4509.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  93%|█████████▎| 1127/1208 [30:43<02:12,  1.64s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00453, train/loss_vlb_step=2.35e-5, train/loss_step=0.00453, global_step=4509.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  93%|█████████▎| 1127/1208 [30:43<02:12,  1.64s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0518, train/loss_vlb_step=0.000188, train/loss_step=0.0518, global_step=4509.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  93%|█████████▎| 1128/1208 [30:46<02:10,  1.64s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0518, train/loss_vlb_step=0.000188, train/loss_step=0.0518, global_step=4509.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  93%|█████████▎| 1128/1208 [30:46<02:10,  1.64s/it, loss=0.159, v_num=0, train/loss_simple_step=0.662, train/loss_vlb_step=0.0248, train/loss_step=0.662, global_step=4509.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  93%|█████████▎| 1129/1208 [30:47<02:09,  1.64s/it, loss=0.159, v_num=0, train/loss_simple_step=0.662, train/loss_vlb_step=0.0248, train/loss_step=0.662, global_step=4509.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  93%|█████████▎| 1129/1208 [30:47<02:09,  1.64s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.14e-5, train/loss_step=0.00195, global_step=4510.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  94%|█████████▎| 1130/1208 [30:48<02:07,  1.64s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.14e-5, train/loss_step=0.00195, global_step=4510.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  94%|█████████▎| 1130/1208 [30:48<02:07,  1.64s/it, loss=0.154, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000522, train/loss_step=0.159, global_step=4510.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  94%|█████████▎| 1131/1208 [30:49<02:05,  1.64s/it, loss=0.154, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000522, train/loss_step=0.159, global_step=4510.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  94%|█████████▎| 1131/1208 [30:49<02:05,  1.64s/it, loss=0.152, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000651, train/loss_step=0.192, global_step=4510.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  94%|█████████▎| 1132/1208 [30:52<02:04,  1.64s/it, loss=0.152, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000651, train/loss_step=0.192, global_step=4510.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  94%|█████████▎| 1132/1208 [30:52<02:04,  1.64s/it, loss=0.156, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000857, train/loss_step=0.219, global_step=4510.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  94%|█████████▍| 1133/1208 [30:53<02:02,  1.64s/it, loss=0.156, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000857, train/loss_step=0.219, global_step=4510.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  94%|█████████▍| 1133/1208 [30:53<02:02,  1.64s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=3.28e-5, train/loss_step=0.00677, global_step=4511.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  94%|█████████▍| 1134/1208 [30:54<02:01,  1.64s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=3.28e-5, train/loss_step=0.00677, global_step=4511.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  94%|█████████▍| 1134/1208 [30:54<02:01,  1.64s/it, loss=0.152, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.27e-5, train/loss_step=0.018, global_step=4511.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  94%|█████████▍| 1135/1208 [30:55<01:59,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.27e-5, train/loss_step=0.018, global_step=4511.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  94%|█████████▍| 1135/1208 [30:55<01:59,  1.63s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000185, train/loss_step=0.0525, global_step=4511.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  94%|█████████▍| 1136/1208 [30:58<01:57,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000185, train/loss_step=0.0525, global_step=4511.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  94%|█████████▍| 1136/1208 [30:58<01:57,  1.64s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0444, train/loss_vlb_step=0.000157, train/loss_step=0.0444, global_step=4511.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  94%|█████████▍| 1137/1208 [30:59<01:56,  1.64s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0444, train/loss_vlb_step=0.000157, train/loss_step=0.0444, global_step=4511.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  94%|█████████▍| 1137/1208 [30:59<01:56,  1.64s/it, loss=0.141, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000535, train/loss_step=0.153, global_step=4512.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  94%|█████████▍| 1138/1208 [31:00<01:54,  1.63s/it, loss=0.141, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000535, train/loss_step=0.153, global_step=4512.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  94%|█████████▍| 1138/1208 [31:00<01:54,  1.63s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.00012, train/loss_step=0.0295, global_step=4512.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  94%|█████████▍| 1139/1208 [31:01<01:52,  1.63s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.00012, train/loss_step=0.0295, global_step=4512.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  94%|█████████▍| 1139/1208 [31:01<01:52,  1.63s/it, loss=0.134, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.00065, train/loss_step=0.184, global_step=4512.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  94%|█████████▍| 1140/1208 [31:04<01:51,  1.64s/it, loss=0.134, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.00065, train/loss_step=0.184, global_step=4512.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  94%|█████████▍| 1140/1208 [31:04<01:51,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000922, train/loss_step=0.234, global_step=4512.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  94%|█████████▍| 1141/1208 [31:05<01:49,  1.63s/it, loss=0.145, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000922, train/loss_step=0.234, global_step=4512.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  94%|█████████▍| 1141/1208 [31:05<01:49,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=4513.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  95%|█████████▍| 1142/1208 [31:06<01:47,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=4513.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  95%|█████████▍| 1142/1208 [31:06<01:47,  1.63s/it, loss=0.128, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00172, train/loss_step=0.316, global_step=4513.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  95%|█████████▍| 1143/1208 [31:07<01:46,  1.63s/it, loss=0.128, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00172, train/loss_step=0.316, global_step=4513.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  95%|█████████▍| 1143/1208 [31:07<01:46,  1.63s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0639, train/loss_vlb_step=0.000219, train/loss_step=0.0639, global_step=4513.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  95%|█████████▍| 1144/1208 [31:10<01:44,  1.63s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0639, train/loss_vlb_step=0.000219, train/loss_step=0.0639, global_step=4513.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  95%|█████████▍| 1144/1208 [31:10<01:44,  1.63s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.85e-5, train/loss_step=0.0207, global_step=4513.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  95%|█████████▍| 1145/1208 [31:11<01:42,  1.63s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.85e-5, train/loss_step=0.0207, global_step=4513.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  95%|█████████▍| 1145/1208 [31:11<01:42,  1.63s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=9.42e-5, train/loss_step=0.0254, global_step=4514.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  95%|█████████▍| 1146/1208 [31:12<01:41,  1.63s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=9.42e-5, train/loss_step=0.0254, global_step=4514.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  95%|█████████▍| 1146/1208 [31:12<01:41,  1.63s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0593, train/loss_vlb_step=0.000203, train/loss_step=0.0593, global_step=4514.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  95%|█████████▍| 1147/1208 [31:13<01:39,  1.63s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0593, train/loss_vlb_step=0.000203, train/loss_step=0.0593, global_step=4514.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  95%|█████████▍| 1147/1208 [31:13<01:39,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00163, train/loss_step=0.298, global_step=4514.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  95%|█████████▌| 1148/1208 [31:16<01:38,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00163, train/loss_step=0.298, global_step=4514.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  95%|█████████▌| 1148/1208 [31:16<01:38,  1.63s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.48e-5, train/loss_step=0.0238, global_step=4514.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  95%|█████████▌| 1149/1208 [31:17<01:36,  1.63s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.48e-5, train/loss_step=0.0238, global_step=4514.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  95%|█████████▌| 1149/1208 [31:17<01:36,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00116, train/loss_step=0.271, global_step=4515.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  95%|█████████▌| 1150/1208 [31:18<01:34,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00116, train/loss_step=0.271, global_step=4515.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  95%|█████████▌| 1150/1208 [31:18<01:34,  1.63s/it, loss=0.125, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000651, train/loss_step=0.181, global_step=4515.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  95%|█████████▌| 1151/1208 [31:19<01:33,  1.63s/it, loss=0.125, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000651, train/loss_step=0.181, global_step=4515.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  95%|█████████▌| 1151/1208 [31:19<01:33,  1.63s/it, loss=0.136, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00341, train/loss_step=0.407, global_step=4515.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  95%|█████████▌| 1152/1208 [31:22<01:31,  1.63s/it, loss=0.136, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00341, train/loss_step=0.407, global_step=4515.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  95%|█████████▌| 1152/1208 [31:22<01:31,  1.63s/it, loss=0.14, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00126, train/loss_step=0.291, global_step=4515.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  95%|█████████▌| 1153/1208 [31:23<01:29,  1.63s/it, loss=0.14, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00126, train/loss_step=0.291, global_step=4515.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  95%|█████████▌| 1153/1208 [31:23<01:29,  1.63s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000139, train/loss_step=0.0378, global_step=4516.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  96%|█████████▌| 1154/1208 [31:24<01:28,  1.63s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000139, train/loss_step=0.0378, global_step=4516.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  96%|█████████▌| 1154/1208 [31:24<01:28,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0595, train/loss_vlb_step=0.0002, train/loss_step=0.0595, global_step=4516.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  96%|█████████▌| 1155/1208 [31:25<01:26,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0595, train/loss_vlb_step=0.0002, train/loss_step=0.0595, global_step=4516.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  96%|█████████▌| 1155/1208 [31:25<01:26,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0464, train/loss_vlb_step=0.000169, train/loss_step=0.0464, global_step=4516.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  96%|█████████▌| 1156/1208 [31:28<01:24,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0464, train/loss_vlb_step=0.000169, train/loss_step=0.0464, global_step=4516.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  96%|█████████▌| 1156/1208 [31:28<01:24,  1.63s/it, loss=0.146, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000373, train/loss_step=0.114, global_step=4516.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  96%|█████████▌| 1157/1208 [31:29<01:23,  1.63s/it, loss=0.146, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000373, train/loss_step=0.114, global_step=4516.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  96%|█████████▌| 1157/1208 [31:29<01:23,  1.63s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000105, train/loss_step=0.0255, global_step=4517.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  96%|█████████▌| 1158/1208 [31:30<01:21,  1.63s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000105, train/loss_step=0.0255, global_step=4517.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  96%|█████████▌| 1158/1208 [31:30<01:21,  1.63s/it, loss=0.139, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.65e-5, train/loss_step=0.011, global_step=4517.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  96%|█████████▌| 1159/1208 [31:31<01:19,  1.63s/it, loss=0.139, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.65e-5, train/loss_step=0.011, global_step=4517.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  96%|█████████▌| 1159/1208 [31:31<01:19,  1.63s/it, loss=0.142, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000992, train/loss_step=0.237, global_step=4517.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  96%|█████████▌| 1160/1208 [31:34<01:18,  1.63s/it, loss=0.142, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000992, train/loss_step=0.237, global_step=4517.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  96%|█████████▌| 1160/1208 [31:34<01:18,  1.63s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0869, train/loss_vlb_step=0.000289, train/loss_step=0.0869, global_step=4517.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  96%|█████████▌| 1161/1208 [31:35<01:16,  1.63s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0869, train/loss_vlb_step=0.000289, train/loss_step=0.0869, global_step=4517.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  96%|█████████▌| 1161/1208 [31:35<01:16,  1.63s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0628, train/loss_vlb_step=0.000216, train/loss_step=0.0628, global_step=4518.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  96%|█████████▌| 1162/1208 [31:36<01:15,  1.63s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0628, train/loss_vlb_step=0.000216, train/loss_step=0.0628, global_step=4518.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  96%|█████████▌| 1162/1208 [31:36<01:15,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.27e-5, train/loss_step=0.00216, global_step=4518.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  96%|█████████▋| 1163/1208 [31:37<01:13,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.27e-5, train/loss_step=0.00216, global_step=4518.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  96%|█████████▋| 1163/1208 [31:37<01:13,  1.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00172, train/loss_vlb_step=1.03e-5, train/loss_step=0.00172, global_step=4518.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  96%|█████████▋| 1164/1208 [31:39<01:11,  1.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00172, train/loss_vlb_step=1.03e-5, train/loss_step=0.00172, global_step=4518.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  96%|█████████▋| 1164/1208 [31:39<01:11,  1.63s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0945, train/loss_vlb_step=0.000311, train/loss_step=0.0945, global_step=4518.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  96%|█████████▋| 1165/1208 [31:40<01:10,  1.63s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0945, train/loss_vlb_step=0.000311, train/loss_step=0.0945, global_step=4518.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  96%|█████████▋| 1165/1208 [31:40<01:10,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.98e-5, train/loss_step=0.0128, global_step=4519.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  97%|█████████▋| 1166/1208 [31:41<01:08,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.98e-5, train/loss_step=0.0128, global_step=4519.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  97%|█████████▋| 1166/1208 [31:41<01:08,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.063, train/loss_vlb_step=0.000212, train/loss_step=0.063, global_step=4519.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  97%|█████████▋| 1167/1208 [31:42<01:06,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.063, train/loss_vlb_step=0.000212, train/loss_step=0.063, global_step=4519.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  97%|█████████▋| 1167/1208 [31:42<01:06,  1.63s/it, loss=0.107, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000351, train/loss_step=0.107, global_step=4519.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  97%|█████████▋| 1168/1208 [31:45<01:05,  1.63s/it, loss=0.107, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000351, train/loss_step=0.107, global_step=4519.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  97%|█████████▋| 1168/1208 [31:45<01:05,  1.63s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00849, train/loss_vlb_step=4.08e-5, train/loss_step=0.00849, global_step=4519.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  97%|█████████▋| 1169/1208 [31:46<01:03,  1.63s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00849, train/loss_vlb_step=4.08e-5, train/loss_step=0.00849, global_step=4519.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  97%|█████████▋| 1169/1208 [31:46<01:03,  1.63s/it, loss=0.118, v_num=0, train/loss_simple_step=0.507, train/loss_vlb_step=0.00901, train/loss_step=0.507, global_step=4520.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  97%|█████████▋| 1170/1208 [31:47<01:01,  1.63s/it, loss=0.118, v_num=0, train/loss_simple_step=0.507, train/loss_vlb_step=0.00901, train/loss_step=0.507, global_step=4520.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  97%|█████████▋| 1170/1208 [31:47<01:01,  1.63s/it, loss=0.133, v_num=0, train/loss_simple_step=0.487, train/loss_vlb_step=0.00674, train/loss_step=0.487, global_step=4520.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  97%|█████████▋| 1171/1208 [31:48<01:00,  1.63s/it, loss=0.133, v_num=0, train/loss_simple_step=0.487, train/loss_vlb_step=0.00674, train/loss_step=0.487, global_step=4520.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  97%|█████████▋| 1171/1208 [31:48<01:00,  1.63s/it, loss=0.12, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.00045, train/loss_step=0.136, global_step=4520.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  97%|█████████▋| 1172/1208 [31:51<00:58,  1.63s/it, loss=0.12, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.00045, train/loss_step=0.136, global_step=4520.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  97%|█████████▋| 1172/1208 [31:51<00:58,  1.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000566, train/loss_step=0.166, global_step=4520.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  97%|█████████▋| 1173/1208 [31:52<00:57,  1.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000566, train/loss_step=0.166, global_step=4520.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  97%|█████████▋| 1173/1208 [31:52<00:57,  1.63s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.11e-5, train/loss_step=0.0114, global_step=4521.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  97%|█████████▋| 1174/1208 [31:53<00:55,  1.63s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.11e-5, train/loss_step=0.0114, global_step=4521.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  97%|█████████▋| 1174/1208 [31:53<00:55,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00173, train/loss_step=0.297, global_step=4521.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  97%|█████████▋| 1175/1208 [31:54<00:53,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00173, train/loss_step=0.297, global_step=4521.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  97%|█████████▋| 1175/1208 [31:54<00:53,  1.63s/it, loss=0.146, v_num=0, train/loss_simple_step=0.480, train/loss_vlb_step=0.0039, train/loss_step=0.480, global_step=4521.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  97%|█████████▋| 1176/1208 [31:57<00:52,  1.63s/it, loss=0.146, v_num=0, train/loss_simple_step=0.480, train/loss_vlb_step=0.0039, train/loss_step=0.480, global_step=4521.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  97%|█████████▋| 1176/1208 [31:57<00:52,  1.63s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=2.55e-5, train/loss_step=0.00481, global_step=4521.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  97%|█████████▋| 1177/1208 [31:58<00:50,  1.63s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=2.55e-5, train/loss_step=0.00481, global_step=4521.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  97%|█████████▋| 1177/1208 [31:58<00:50,  1.63s/it, loss=0.147, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000545, train/loss_step=0.164, global_step=4522.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  98%|█████████▊| 1178/1208 [31:59<00:48,  1.63s/it, loss=0.147, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000545, train/loss_step=0.164, global_step=4522.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  98%|█████████▊| 1178/1208 [31:59<00:48,  1.63s/it, loss=0.163, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00154, train/loss_step=0.322, global_step=4522.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  98%|█████████▊| 1179/1208 [32:00<00:47,  1.63s/it, loss=0.163, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00154, train/loss_step=0.322, global_step=4522.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  98%|█████████▊| 1179/1208 [32:00<00:47,  1.63s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.37e-5, train/loss_step=0.00233, global_step=4522.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  98%|█████████▊| 1180/1208 [32:03<00:45,  1.63s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.37e-5, train/loss_step=0.00233, global_step=4522.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  98%|█████████▊| 1180/1208 [32:03<00:45,  1.63s/it, loss=0.166, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00314, train/loss_step=0.395, global_step=4522.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]    Epoch 14:  98%|█████████▊| 1181/1208 [32:04<00:44,  1.63s/it, loss=0.166, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00314, train/loss_step=0.395, global_step=4522.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  98%|█████████▊| 1181/1208 [32:04<00:44,  1.63s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000184, train/loss_step=0.0525, global_step=4523.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  98%|█████████▊| 1182/1208 [32:05<00:42,  1.63s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000184, train/loss_step=0.0525, global_step=4523.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  98%|█████████▊| 1182/1208 [32:05<00:42,  1.63s/it, loss=0.174, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000579, train/loss_step=0.167, global_step=4523.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  98%|█████████▊| 1183/1208 [32:06<00:40,  1.63s/it, loss=0.174, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000579, train/loss_step=0.167, global_step=4523.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  98%|█████████▊| 1183/1208 [32:06<00:40,  1.63s/it, loss=0.18, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000414, train/loss_step=0.125, global_step=4523.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  98%|█████████▊| 1184/1208 [32:09<00:39,  1.63s/it, loss=0.18, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000414, train/loss_step=0.125, global_step=4523.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  98%|█████████▊| 1184/1208 [32:09<00:39,  1.63s/it, loss=0.203, v_num=0, train/loss_simple_step=0.553, train/loss_vlb_step=0.0105, train/loss_step=0.553, global_step=4523.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  98%|█████████▊| 1185/1208 [32:10<00:37,  1.63s/it, loss=0.203, v_num=0, train/loss_simple_step=0.553, train/loss_vlb_step=0.0105, train/loss_step=0.553, global_step=4523.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  98%|█████████▊| 1185/1208 [32:10<00:37,  1.63s/it, loss=0.21, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000501, train/loss_step=0.150, global_step=4524.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  98%|█████████▊| 1186/1208 [32:11<00:35,  1.63s/it, loss=0.21, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000501, train/loss_step=0.150, global_step=4524.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  98%|█████████▊| 1186/1208 [32:11<00:35,  1.63s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.05e-5, train/loss_step=0.0226, global_step=4524.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  98%|█████████▊| 1187/1208 [32:12<00:34,  1.63s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.05e-5, train/loss_step=0.0226, global_step=4524.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  98%|█████████▊| 1187/1208 [32:12<00:34,  1.63s/it, loss=0.212, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000701, train/loss_step=0.193, global_step=4524.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  98%|█████████▊| 1188/1208 [32:15<00:32,  1.63s/it, loss=0.212, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000701, train/loss_step=0.193, global_step=4524.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  98%|█████████▊| 1188/1208 [32:15<00:32,  1.63s/it, loss=0.215, v_num=0, train/loss_simple_step=0.0668, train/loss_vlb_step=0.000234, train/loss_step=0.0668, global_step=4524.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  98%|█████████▊| 1189/1208 [32:16<00:30,  1.63s/it, loss=0.215, v_num=0, train/loss_simple_step=0.0668, train/loss_vlb_step=0.000234, train/loss_step=0.0668, global_step=4524.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  98%|█████████▊| 1189/1208 [32:16<00:30,  1.63s/it, loss=0.197, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000476, train/loss_step=0.144, global_step=4525.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  99%|█████████▊| 1190/1208 [32:17<00:29,  1.63s/it, loss=0.197, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000476, train/loss_step=0.144, global_step=4525.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  99%|█████████▊| 1190/1208 [32:17<00:29,  1.63s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=5.1e-5, train/loss_step=0.0107, global_step=4525.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  99%|█████████▊| 1191/1208 [32:18<00:27,  1.63s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=5.1e-5, train/loss_step=0.0107, global_step=4525.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  99%|█████████▊| 1191/1208 [32:18<00:27,  1.63s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.23e-5, train/loss_step=0.00209, global_step=4525.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  99%|█████████▊| 1192/1208 [32:21<00:26,  1.63s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.23e-5, train/loss_step=0.00209, global_step=4525.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  99%|█████████▊| 1192/1208 [32:21<00:26,  1.63s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.3e-5, train/loss_step=0.0236, global_step=4525.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]   Epoch 14:  99%|█████████▉| 1193/1208 [32:22<00:24,  1.63s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.3e-5, train/loss_step=0.0236, global_step=4525.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  99%|█████████▉| 1193/1208 [32:22<00:24,  1.63s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=5.08e-5, train/loss_step=0.0107, global_step=4526.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  99%|█████████▉| 1194/1208 [32:23<00:22,  1.63s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=5.08e-5, train/loss_step=0.0107, global_step=4526.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  99%|█████████▉| 1194/1208 [32:23<00:22,  1.63s/it, loss=0.163, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00283, train/loss_step=0.374, global_step=4526.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]  Epoch 14:  99%|█████████▉| 1195/1208 [32:24<00:21,  1.63s/it, loss=0.163, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00283, train/loss_step=0.374, global_step=4526.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  99%|█████████▉| 1195/1208 [32:24<00:21,  1.63s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.84e-5, train/loss_step=0.0164, global_step=4526.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  99%|█████████▉| 1196/1208 [32:28<00:19,  1.63s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.84e-5, train/loss_step=0.0164, global_step=4526.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  99%|█████████▉| 1196/1208 [32:28<00:19,  1.63s/it, loss=0.146, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000396, train/loss_step=0.121, global_step=4526.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  99%|█████████▉| 1197/1208 [32:29<00:17,  1.63s/it, loss=0.146, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000396, train/loss_step=0.121, global_step=4526.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  99%|█████████▉| 1197/1208 [32:29<00:17,  1.63s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.02e-5, train/loss_step=0.0111, global_step=4527.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  99%|█████████▉| 1198/1208 [32:30<00:16,  1.63s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.02e-5, train/loss_step=0.0111, global_step=4527.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  99%|█████████▉| 1198/1208 [32:30<00:16,  1.63s/it, loss=0.131, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000684, train/loss_step=0.187, global_step=4527.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  99%|█████████▉| 1199/1208 [32:31<00:14,  1.63s/it, loss=0.131, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000684, train/loss_step=0.187, global_step=4527.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  99%|█████████▉| 1199/1208 [32:31<00:14,  1.63s/it, loss=0.147, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00174, train/loss_step=0.318, global_step=4527.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14:  99%|█████████▉| 1200/1208 [32:34<00:13,  1.63s/it, loss=0.147, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00174, train/loss_step=0.318, global_step=4527.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  99%|█████████▉| 1200/1208 [32:34<00:13,  1.63s/it, loss=0.142, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00128, train/loss_step=0.289, global_step=4527.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.75it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.73it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.74it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.74it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.76it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.82it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.78it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.78it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.83it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.83it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.82it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 14:  99%|█████████▉| 1201/1208 [33:05<00:11,  1.65s/it, loss=0.142, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00128, train/loss_step=0.289, global_step=4527.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14:  99%|█████████▉| 1201/1208 [33:05<00:11,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0961, train/loss_vlb_step=0.000316, train/loss_step=0.0961, global_step=4528.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14: 100%|█████████▉| 1202/1208 [33:06<00:09,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0961, train/loss_vlb_step=0.000316, train/loss_step=0.0961, global_step=4528.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14: 100%|█████████▉| 1202/1208 [33:06<00:09,  1.65s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.35e-5, train/loss_step=0.0208, global_step=4528.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14: 100%|█████████▉| 1203/1208 [33:07<00:08,  1.65s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.35e-5, train/loss_step=0.0208, global_step=4528.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14: 100%|█████████▉| 1203/1208 [33:07<00:08,  1.65s/it, loss=0.141, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000805, train/loss_step=0.218, global_step=4528.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14: 100%|█████████▉| 1204/1208 [33:10<00:06,  1.65s/it, loss=0.141, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000805, train/loss_step=0.218, global_step=4528.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14: 100%|█████████▉| 1204/1208 [33:10<00:06,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00112, train/loss_step=0.243, global_step=4528.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14: 100%|█████████▉| 1205/1208 [33:11<00:04,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00112, train/loss_step=0.243, global_step=4528.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14: 100%|█████████▉| 1205/1208 [33:11<00:04,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000781, train/loss_step=0.214, global_step=4529.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14: 100%|█████████▉| 1206/1208 [33:12<00:03,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000781, train/loss_step=0.214, global_step=4529.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14: 100%|█████████▉| 1206/1208 [33:12<00:03,  1.65s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00393, train/loss_vlb_step=2.03e-5, train/loss_step=0.00393, global_step=4529.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14: 100%|█████████▉| 1207/1208 [33:13<00:01,  1.65s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00393, train/loss_vlb_step=2.03e-5, train/loss_step=0.00393, global_step=4529.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14: 100%|█████████▉| 1207/1208 [33:13<00:01,  1.65s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0424, train/loss_vlb_step=0.000153, train/loss_step=0.0424, global_step=4529.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] Epoch 14: 100%|██████████| 1208/1208 [33:18<00:00,  1.65s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0424, train/loss_vlb_step=0.000153, train/loss_step=0.0424, global_step=4529.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 14: 100%|██████████| 1208/1208 [33:18<00:00,  1.65s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=7.19e-5, train/loss_step=0.0162, global_step=4529.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144] 
+
+
+Epoch 14:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.118, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=7.19e-5, train/loss_step=0.0162, global_step=4529.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]           Epoch 15:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.118, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=7.19e-5, train/loss_step=0.0162, global_step=4529.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][AData shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.84it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.85it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.86it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.84it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.85it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:25,  1.86it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.84it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.84it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.85it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.84it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.84it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.84it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.84it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.85it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.84it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.84it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.85it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.84it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.85it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.84it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.84it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.85it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.84it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.85it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.85it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.84it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.86it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.84it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.83it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.86it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:19,  1.86it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.86it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:18,  1.86it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.84it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.85it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.86it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.85it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.86it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.85it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.80it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.86it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.85it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.86it/s][ADDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.85it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.86it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.84it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.83it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.85it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.85it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.86it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.85it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:12<00:14,  1.85it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.85it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.86it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.84it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:12,  1.86it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:12,  1.85it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.83it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.86it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.85it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.83it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.80it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.85it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.85it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.83it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.85it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.85it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.83it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.86it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.85it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.85it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.85it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.85it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.85it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.83it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.85it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.85it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.83it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.85it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.85it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.83it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:18<00:08,  1.85it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:18<00:08,  1.85it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.83it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.85it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.85it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.83it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:19<00:07,  1.85it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.84it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.84it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.84it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.83it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.83it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.83it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.82it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.81it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.83it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.78it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.83it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.78it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.83it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.83it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.81it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.83it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:24<00:02,  1.83it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:25<00:01,  1.82it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.85it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.83it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]Epoch 15:   0%|          | 1/1208 [00:31<10:24:27, 31.04s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=7.19e-5, train/loss_step=0.0162, global_step=4529.0, train/loss_simple_epoch=0.144, train/loss_vlb_epoch=0.00264, train/loss_epoch=0.144]Epoch 15:   0%|          | 1/1208 [00:31<10:24:30, 31.04s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=5.05e-5, train/loss_step=0.0104, global_step=4530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   0%|          | 2/1208 [00:32<5:22:18, 16.04s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=5.05e-5, train/loss_step=0.0104, global_step=4530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:   0%|          | 2/1208 [00:32<5:22:19, 16.04s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.52e-5, train/loss_step=0.0151, global_step=4530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   0%|          | 3/1208 [00:33<3:41:37, 11.03s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.52e-5, train/loss_step=0.0151, global_step=4530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   0%|          | 3/1208 [00:33<3:41:37, 11.04s/it, loss=0.123, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.00101, train/loss_step=0.230, global_step=4530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:   0%|          | 4/1208 [00:36<3:01:46,  9.06s/it, loss=0.123, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.00101, train/loss_step=0.230, global_step=4530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   0%|          | 4/1208 [00:36<3:01:47,  9.06s/it, loss=0.133, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.00078, train/loss_step=0.218, global_step=4530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   0%|          | 5/1208 [00:37<2:29:35,  7.46s/it, loss=0.133, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.00078, train/loss_step=0.218, global_step=4530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   0%|          | 5/1208 [00:38<2:33:07,  7.64s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000224, train/loss_step=0.0676, global_step=4531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   0%|          | 6/1208 [00:39<2:10:59,  6.54s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000224, train/loss_step=0.0676, global_step=4531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   0%|          | 6/1208 [00:39<2:11:00,  6.54s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.000139, train/loss_step=0.0393, global_step=4531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   1%|          | 7/1208 [00:40<1:55:12,  5.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.000139, train/loss_step=0.0393, global_step=4531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   1%|          | 7/1208 [00:40<1:55:12,  5.76s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.43e-5, train/loss_step=0.00246, global_step=4531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   1%|          | 8/1208 [00:43<1:48:29,  5.42s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.43e-5, train/loss_step=0.00246, global_step=4531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   1%|          | 8/1208 [00:43<1:48:30,  5.43s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000148, train/loss_step=0.0399, global_step=4531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:   1%|          | 9/1208 [00:44<1:38:45,  4.94s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000148, train/loss_step=0.0399, global_step=4531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   1%|          | 9/1208 [00:44<1:38:45,  4.94s/it, loss=0.119, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000347, train/loss_step=0.105, global_step=4532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:   1%|          | 10/1208 [00:45<1:30:52,  4.55s/it, loss=0.119, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000347, train/loss_step=0.105, global_step=4532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   1%|          | 10/1208 [00:45<1:30:52,  4.55s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000129, train/loss_step=0.0346, global_step=4532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   1%|          | 11/1208 [00:46<1:24:25,  4.23s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000129, train/loss_step=0.0346, global_step=4532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   1%|          | 11/1208 [00:46<1:24:25,  4.23s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.00708, train/loss_vlb_step=3.55e-5, train/loss_step=0.00708, global_step=4532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   1%|          | 12/1208 [00:49<1:22:40,  4.15s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.00708, train/loss_vlb_step=3.55e-5, train/loss_step=0.00708, global_step=4532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   1%|          | 12/1208 [00:49<1:22:40,  4.15s/it, loss=0.0832, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.00014, train/loss_step=0.0392, global_step=4532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:   1%|          | 13/1208 [00:50<1:17:52,  3.91s/it, loss=0.0832, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.00014, train/loss_step=0.0392, global_step=4532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   1%|          | 13/1208 [00:50<1:17:52,  3.91s/it, loss=0.0815, v_num=0, train/loss_simple_step=0.0621, train/loss_vlb_step=0.000214, train/loss_step=0.0621, global_step=4533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   1%|          | 14/1208 [00:51<1:13:42,  3.70s/it, loss=0.0815, v_num=0, train/loss_simple_step=0.0621, train/loss_vlb_step=0.000214, train/loss_step=0.0621, global_step=4533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   1%|          | 14/1208 [00:51<1:13:42,  3.70s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.0024, train/loss_step=0.362, global_step=4533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:   1%|          | 15/1208 [00:52<1:10:06,  3.53s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.0024, train/loss_step=0.362, global_step=4533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   1%|          | 15/1208 [00:52<1:10:06,  3.53s/it, loss=0.112, v_num=0, train/loss_simple_step=0.480, train/loss_vlb_step=0.00416, train/loss_step=0.480, global_step=4533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   1%|▏         | 16/1208 [00:56<1:09:43,  3.51s/it, loss=0.112, v_num=0, train/loss_simple_step=0.480, train/loss_vlb_step=0.00416, train/loss_step=0.480, global_step=4533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   1%|▏         | 16/1208 [00:56<1:09:43,  3.51s/it, loss=0.106, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000449, train/loss_step=0.135, global_step=4533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   1%|▏         | 17/1208 [00:57<1:06:48,  3.37s/it, loss=0.106, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000449, train/loss_step=0.135, global_step=4533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   1%|▏         | 17/1208 [00:57<1:06:48,  3.37s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.0845, train/loss_vlb_step=0.000283, train/loss_step=0.0845, global_step=4534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   1%|▏         | 18/1208 [00:58<1:04:10,  3.24s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.0845, train/loss_vlb_step=0.000283, train/loss_step=0.0845, global_step=4534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   1%|▏         | 18/1208 [00:58<1:04:10,  3.24s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.68e-5, train/loss_step=0.0106, global_step=4534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:   2%|▏         | 19/1208 [00:59<1:01:49,  3.12s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.68e-5, train/loss_step=0.0106, global_step=4534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   2%|▏         | 19/1208 [00:59<1:01:49,  3.12s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.00501, train/loss_vlb_step=2.67e-5, train/loss_step=0.00501, global_step=4534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   2%|▏         | 20/1208 [01:02<1:01:56,  3.13s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.00501, train/loss_vlb_step=2.67e-5, train/loss_step=0.00501, global_step=4534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   2%|▏         | 20/1208 [01:02<1:01:56,  3.13s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.000178, train/loss_step=0.048, global_step=4534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:   2%|▏         | 21/1208 [01:03<59:56,  3.03s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.000178, train/loss_step=0.048, global_step=4534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:   2%|▏         | 21/1208 [01:03<59:56,  3.03s/it, loss=0.108, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000604, train/loss_step=0.173, global_step=4535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:   2%|▏         | 22/1208 [01:04<58:06,  2.94s/it, loss=0.108, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000604, train/loss_step=0.173, global_step=4535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   2%|▏         | 22/1208 [01:04<58:06,  2.94s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.64e-5, train/loss_step=0.0243, global_step=4535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   2%|▏         | 23/1208 [01:05<56:26,  2.86s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.64e-5, train/loss_step=0.0243, global_step=4535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   2%|▏         | 23/1208 [01:05<56:26,  2.86s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0725, train/loss_vlb_step=0.000245, train/loss_step=0.0725, global_step=4535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   2%|▏         | 24/1208 [01:08<56:39,  2.87s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0725, train/loss_vlb_step=0.000245, train/loss_step=0.0725, global_step=4535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   2%|▏         | 24/1208 [01:08<56:39,  2.87s/it, loss=0.095, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=4535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:   2%|▏         | 25/1208 [01:09<55:11,  2.80s/it, loss=0.095, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=4535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   2%|▏         | 25/1208 [01:09<55:12,  2.80s/it, loss=0.129, v_num=0, train/loss_simple_step=0.754, train/loss_vlb_step=0.0769, train/loss_step=0.754, global_step=4536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:   2%|▏         | 26/1208 [01:11<53:48,  2.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.754, train/loss_vlb_step=0.0769, train/loss_step=0.754, global_step=4536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   2%|▏         | 26/1208 [01:11<53:49,  2.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0943, train/loss_vlb_step=0.00031, train/loss_step=0.0943, global_step=4536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   2%|▏         | 27/1208 [01:12<52:32,  2.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0943, train/loss_vlb_step=0.00031, train/loss_step=0.0943, global_step=4536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   2%|▏         | 27/1208 [01:12<52:32,  2.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.71e-5, train/loss_step=0.003, global_step=4536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:   2%|▏         | 28/1208 [01:15<52:56,  2.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.71e-5, train/loss_step=0.003, global_step=4536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   2%|▏         | 28/1208 [01:15<52:56,  2.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=9.23e-6, train/loss_step=0.0016, global_step=4536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   2%|▏         | 29/1208 [01:16<51:48,  2.64s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=9.23e-6, train/loss_step=0.0016, global_step=4536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   2%|▏         | 29/1208 [01:16<51:48,  2.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00126, train/loss_step=0.266, global_step=4537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:   2%|▏         | 30/1208 [01:17<50:43,  2.58s/it, loss=0.138, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00126, train/loss_step=0.266, global_step=4537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   2%|▏         | 30/1208 [01:17<50:43,  2.58s/it, loss=0.171, v_num=0, train/loss_simple_step=0.683, train/loss_vlb_step=0.0439, train/loss_step=0.683, global_step=4537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:   3%|▎         | 31/1208 [01:18<49:41,  2.53s/it, loss=0.171, v_num=0, train/loss_simple_step=0.683, train/loss_vlb_step=0.0439, train/loss_step=0.683, global_step=4537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   3%|▎         | 31/1208 [01:18<49:41,  2.53s/it, loss=0.192, v_num=0, train/loss_simple_step=0.426, train/loss_vlb_step=0.00262, train/loss_step=0.426, global_step=4537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   3%|▎         | 32/1208 [01:21<50:05,  2.56s/it, loss=0.192, v_num=0, train/loss_simple_step=0.426, train/loss_vlb_step=0.00262, train/loss_step=0.426, global_step=4537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   3%|▎         | 32/1208 [01:21<50:05,  2.56s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0629, train/loss_vlb_step=0.000213, train/loss_step=0.0629, global_step=4537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   3%|▎         | 33/1208 [01:22<49:10,  2.51s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0629, train/loss_vlb_step=0.000213, train/loss_step=0.0629, global_step=4537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   3%|▎         | 33/1208 [01:22<49:10,  2.51s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0634, train/loss_vlb_step=0.000222, train/loss_step=0.0634, global_step=4538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   3%|▎         | 34/1208 [01:23<48:16,  2.47s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0634, train/loss_vlb_step=0.000222, train/loss_step=0.0634, global_step=4538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   3%|▎         | 34/1208 [01:23<48:16,  2.47s/it, loss=0.183, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000613, train/loss_step=0.173, global_step=4538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:   3%|▎         | 35/1208 [01:24<47:27,  2.43s/it, loss=0.183, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000613, train/loss_step=0.173, global_step=4538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   3%|▎         | 35/1208 [01:24<47:27,  2.43s/it, loss=0.178, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00306, train/loss_step=0.365, global_step=4538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:   3%|▎         | 36/1208 [01:28<47:50,  2.45s/it, loss=0.178, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00306, train/loss_step=0.365, global_step=4538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   3%|▎         | 36/1208 [01:28<47:50,  2.45s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.08e-5, train/loss_step=0.00394, global_step=4538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   3%|▎         | 37/1208 [01:29<47:03,  2.41s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.08e-5, train/loss_step=0.00394, global_step=4538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   3%|▎         | 37/1208 [01:29<47:03,  2.41s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0724, train/loss_vlb_step=0.000242, train/loss_step=0.0724, global_step=4539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:   3%|▎         | 38/1208 [01:30<46:19,  2.38s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0724, train/loss_vlb_step=0.000242, train/loss_step=0.0724, global_step=4539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   3%|▎         | 38/1208 [01:30<46:19,  2.38s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0321, train/loss_vlb_step=0.000115, train/loss_step=0.0321, global_step=4539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   3%|▎         | 39/1208 [01:31<45:37,  2.34s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0321, train/loss_vlb_step=0.000115, train/loss_step=0.0321, global_step=4539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   3%|▎         | 39/1208 [01:31<45:37,  2.34s/it, loss=0.186, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00143, train/loss_step=0.290, global_step=4539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:   3%|▎         | 40/1208 [01:34<46:02,  2.37s/it, loss=0.186, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00143, train/loss_step=0.290, global_step=4539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   3%|▎         | 40/1208 [01:34<46:02,  2.37s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000118, train/loss_step=0.0299, global_step=4539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   3%|▎         | 41/1208 [01:35<45:23,  2.33s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000118, train/loss_step=0.0299, global_step=4539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   3%|▎         | 41/1208 [01:35<45:23,  2.33s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.08e-5, train/loss_step=0.0197, global_step=4540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:   3%|▎         | 42/1208 [01:36<44:45,  2.30s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.08e-5, train/loss_step=0.0197, global_step=4540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   3%|▎         | 42/1208 [01:36<44:45,  2.30s/it, loss=0.186, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000743, train/loss_step=0.191, global_step=4540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:   4%|▎         | 43/1208 [01:37<44:08,  2.27s/it, loss=0.186, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000743, train/loss_step=0.191, global_step=4540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   4%|▎         | 43/1208 [01:37<44:09,  2.27s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00997, train/loss_vlb_step=4.6e-5, train/loss_step=0.00997, global_step=4540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   4%|▎         | 44/1208 [01:40<44:31,  2.30s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00997, train/loss_vlb_step=4.6e-5, train/loss_step=0.00997, global_step=4540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   4%|▎         | 44/1208 [01:40<44:31,  2.30s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0886, train/loss_vlb_step=0.000295, train/loss_step=0.0886, global_step=4540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   4%|▎         | 45/1208 [01:42<43:57,  2.27s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0886, train/loss_vlb_step=0.000295, train/loss_step=0.0886, global_step=4540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   4%|▎         | 45/1208 [01:42<43:57,  2.27s/it, loss=0.153, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000606, train/loss_step=0.177, global_step=4541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:   4%|▍         | 46/1208 [01:43<43:24,  2.24s/it, loss=0.153, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000606, train/loss_step=0.177, global_step=4541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   4%|▍         | 46/1208 [01:43<43:24,  2.24s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0877, train/loss_vlb_step=0.000292, train/loss_step=0.0877, global_step=4541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   4%|▍         | 47/1208 [01:44<42:51,  2.22s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0877, train/loss_vlb_step=0.000292, train/loss_step=0.0877, global_step=4541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   4%|▍         | 47/1208 [01:44<42:51,  2.22s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=2.57e-5, train/loss_step=0.00495, global_step=4541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   4%|▍         | 48/1208 [01:46<43:04,  2.23s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=2.57e-5, train/loss_step=0.00495, global_step=4541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   4%|▍         | 48/1208 [01:46<43:04,  2.23s/it, loss=0.167, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00136, train/loss_step=0.299, global_step=4541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:   4%|▍         | 49/1208 [01:47<42:33,  2.20s/it, loss=0.167, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00136, train/loss_step=0.299, global_step=4541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   4%|▍         | 49/1208 [01:47<42:33,  2.20s/it, loss=0.163, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000653, train/loss_step=0.189, global_step=4542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   4%|▍         | 50/1208 [01:48<42:03,  2.18s/it, loss=0.163, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000653, train/loss_step=0.189, global_step=4542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   4%|▍         | 50/1208 [01:48<42:03,  2.18s/it, loss=0.155, v_num=0, train/loss_simple_step=0.509, train/loss_vlb_step=0.00514, train/loss_step=0.509, global_step=4542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:   4%|▍         | 51/1208 [01:49<41:35,  2.16s/it, loss=0.155, v_num=0, train/loss_simple_step=0.509, train/loss_vlb_step=0.00514, train/loss_step=0.509, global_step=4542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   4%|▍         | 51/1208 [01:49<41:35,  2.16s/it, loss=0.152, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00281, train/loss_step=0.374, global_step=4542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   4%|▍         | 52/1208 [01:52<41:49,  2.17s/it, loss=0.152, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00281, train/loss_step=0.374, global_step=4542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   4%|▍         | 52/1208 [01:52<41:49,  2.17s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0481, train/loss_vlb_step=0.000169, train/loss_step=0.0481, global_step=4542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   4%|▍         | 53/1208 [01:53<41:22,  2.15s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0481, train/loss_vlb_step=0.000169, train/loss_step=0.0481, global_step=4542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   4%|▍         | 53/1208 [01:53<41:22,  2.15s/it, loss=0.159, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000765, train/loss_step=0.207, global_step=4543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:   4%|▍         | 54/1208 [01:54<40:55,  2.13s/it, loss=0.159, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000765, train/loss_step=0.207, global_step=4543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   4%|▍         | 54/1208 [01:54<40:55,  2.13s/it, loss=0.157, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000479, train/loss_step=0.145, global_step=4543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   5%|▍         | 55/1208 [01:55<40:29,  2.11s/it, loss=0.157, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000479, train/loss_step=0.145, global_step=4543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   5%|▍         | 55/1208 [01:55<40:29,  2.11s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0389, train/loss_vlb_step=0.000135, train/loss_step=0.0389, global_step=4543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   5%|▍         | 56/1208 [01:58<40:43,  2.12s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0389, train/loss_vlb_step=0.000135, train/loss_step=0.0389, global_step=4543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   5%|▍         | 56/1208 [01:58<40:43,  2.12s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00946, train/loss_vlb_step=4.33e-5, train/loss_step=0.00946, global_step=4543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   5%|▍         | 57/1208 [01:59<40:19,  2.10s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00946, train/loss_vlb_step=4.33e-5, train/loss_step=0.00946, global_step=4543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   5%|▍         | 57/1208 [01:59<40:19,  2.10s/it, loss=0.151, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00136, train/loss_step=0.280, global_step=4544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:   5%|▍         | 58/1208 [02:00<39:55,  2.08s/it, loss=0.151, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00136, train/loss_step=0.280, global_step=4544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   5%|▍         | 58/1208 [02:00<39:55,  2.08s/it, loss=0.155, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000347, train/loss_step=0.105, global_step=4544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   5%|▍         | 59/1208 [02:01<39:32,  2.06s/it, loss=0.155, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000347, train/loss_step=0.105, global_step=4544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   5%|▍         | 59/1208 [02:01<39:32,  2.06s/it, loss=0.149, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.0006, train/loss_step=0.177, global_step=4544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:   5%|▍         | 60/1208 [02:04<39:46,  2.08s/it, loss=0.149, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.0006, train/loss_step=0.177, global_step=4544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   5%|▍         | 60/1208 [02:04<39:46,  2.08s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=0.000101, train/loss_step=0.0252, global_step=4544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   5%|▌         | 61/1208 [02:05<39:24,  2.06s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=0.000101, train/loss_step=0.0252, global_step=4544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   5%|▌         | 61/1208 [02:05<39:24,  2.06s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.76e-5, train/loss_step=0.0201, global_step=4545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:   5%|▌         | 62/1208 [02:06<39:03,  2.04s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.76e-5, train/loss_step=0.0201, global_step=4545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   5%|▌         | 62/1208 [02:06<39:03,  2.04s/it, loss=0.156, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.002, train/loss_step=0.322, global_step=4545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:   5%|▌         | 63/1208 [02:07<38:42,  2.03s/it, loss=0.156, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.002, train/loss_step=0.322, global_step=4545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   5%|▌         | 63/1208 [02:07<38:42,  2.03s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.000125, train/loss_step=0.0347, global_step=4545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   5%|▌         | 64/1208 [02:10<38:55,  2.04s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.000125, train/loss_step=0.0347, global_step=4545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   5%|▌         | 64/1208 [02:10<38:55,  2.04s/it, loss=0.159, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000453, train/loss_step=0.137, global_step=4545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:   5%|▌         | 65/1208 [02:11<38:35,  2.03s/it, loss=0.159, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000453, train/loss_step=0.137, global_step=4545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   5%|▌         | 65/1208 [02:11<38:35,  2.03s/it, loss=0.168, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00217, train/loss_step=0.347, global_step=4546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:   5%|▌         | 66/1208 [02:12<38:16,  2.01s/it, loss=0.168, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00217, train/loss_step=0.347, global_step=4546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   5%|▌         | 66/1208 [02:12<38:16,  2.01s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0628, train/loss_vlb_step=0.000215, train/loss_step=0.0628, global_step=4546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   6%|▌         | 67/1208 [02:13<37:57,  2.00s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0628, train/loss_vlb_step=0.000215, train/loss_step=0.0628, global_step=4546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   6%|▌         | 67/1208 [02:13<37:57,  2.00s/it, loss=0.203, v_num=0, train/loss_simple_step=0.738, train/loss_vlb_step=0.0423, train/loss_step=0.738, global_step=4546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:   6%|▌         | 68/1208 [02:16<38:15,  2.01s/it, loss=0.203, v_num=0, train/loss_simple_step=0.738, train/loss_vlb_step=0.0423, train/loss_step=0.738, global_step=4546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   6%|▌         | 68/1208 [02:16<38:15,  2.01s/it, loss=0.192, v_num=0, train/loss_simple_step=0.063, train/loss_vlb_step=0.000211, train/loss_step=0.063, global_step=4546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   6%|▌         | 69/1208 [02:17<37:57,  2.00s/it, loss=0.192, v_num=0, train/loss_simple_step=0.063, train/loss_vlb_step=0.000211, train/loss_step=0.063, global_step=4546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   6%|▌         | 69/1208 [02:17<37:57,  2.00s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0936, train/loss_vlb_step=0.000307, train/loss_step=0.0936, global_step=4547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   6%|▌         | 70/1208 [02:19<37:40,  1.99s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0936, train/loss_vlb_step=0.000307, train/loss_step=0.0936, global_step=4547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   6%|▌         | 70/1208 [02:19<37:40,  1.99s/it, loss=0.169, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000519, train/loss_step=0.155, global_step=4547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:   6%|▌         | 71/1208 [02:20<37:23,  1.97s/it, loss=0.169, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000519, train/loss_step=0.155, global_step=4547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   6%|▌         | 71/1208 [02:20<37:23,  1.97s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=1.93e-5, train/loss_step=0.00359, global_step=4547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   6%|▌         | 72/1208 [02:23<37:40,  1.99s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=1.93e-5, train/loss_step=0.00359, global_step=4547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   6%|▌         | 72/1208 [02:23<37:40,  1.99s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000125, train/loss_step=0.0344, global_step=4547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:   6%|▌         | 73/1208 [02:24<37:24,  1.98s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000125, train/loss_step=0.0344, global_step=4547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   6%|▌         | 73/1208 [02:24<37:24,  1.98s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00574, train/loss_vlb_step=2.87e-5, train/loss_step=0.00574, global_step=4548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   6%|▌         | 74/1208 [02:25<37:08,  1.97s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00574, train/loss_vlb_step=2.87e-5, train/loss_step=0.00574, global_step=4548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   6%|▌         | 74/1208 [02:25<37:08,  1.97s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.11e-5, train/loss_step=0.0109, global_step=4548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:   6%|▌         | 75/1208 [02:26<36:52,  1.95s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.11e-5, train/loss_step=0.0109, global_step=4548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   6%|▌         | 75/1208 [02:26<36:52,  1.95s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00847, train/loss_vlb_step=4.17e-5, train/loss_step=0.00847, global_step=4548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   6%|▋         | 76/1208 [02:29<37:09,  1.97s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00847, train/loss_vlb_step=4.17e-5, train/loss_step=0.00847, global_step=4548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   6%|▋         | 76/1208 [02:29<37:09,  1.97s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0749, train/loss_vlb_step=0.000248, train/loss_step=0.0749, global_step=4548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:   6%|▋         | 77/1208 [02:30<36:54,  1.96s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0749, train/loss_vlb_step=0.000248, train/loss_step=0.0749, global_step=4548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   6%|▋         | 77/1208 [02:30<36:54,  1.96s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00252, train/loss_vlb_step=1.45e-5, train/loss_step=0.00252, global_step=4549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   6%|▋         | 78/1208 [02:31<36:38,  1.95s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00252, train/loss_vlb_step=1.45e-5, train/loss_step=0.00252, global_step=4549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   6%|▋         | 78/1208 [02:31<36:38,  1.95s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.41e-5, train/loss_step=0.00248, global_step=4549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   7%|▋         | 79/1208 [02:32<36:24,  1.93s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.41e-5, train/loss_step=0.00248, global_step=4549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   7%|▋         | 79/1208 [02:32<36:24,  1.93s/it, loss=0.126, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00201, train/loss_step=0.378, global_step=4549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:   7%|▋         | 80/1208 [02:36<36:40,  1.95s/it, loss=0.126, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00201, train/loss_step=0.378, global_step=4549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   7%|▋         | 80/1208 [02:36<36:40,  1.95s/it, loss=0.151, v_num=0, train/loss_simple_step=0.534, train/loss_vlb_step=0.00667, train/loss_step=0.534, global_step=4549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   7%|▋         | 81/1208 [02:37<36:25,  1.94s/it, loss=0.151, v_num=0, train/loss_simple_step=0.534, train/loss_vlb_step=0.00667, train/loss_step=0.534, global_step=4549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   7%|▋         | 81/1208 [02:37<36:26,  1.94s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00806, train/loss_vlb_step=4.07e-5, train/loss_step=0.00806, global_step=4550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   7%|▋         | 82/1208 [02:38<36:11,  1.93s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00806, train/loss_vlb_step=4.07e-5, train/loss_step=0.00806, global_step=4550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   7%|▋         | 82/1208 [02:38<36:11,  1.93s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0548, train/loss_vlb_step=0.000186, train/loss_step=0.0548, global_step=4550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:   7%|▋         | 83/1208 [02:39<35:57,  1.92s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0548, train/loss_vlb_step=0.000186, train/loss_step=0.0548, global_step=4550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   7%|▋         | 83/1208 [02:39<35:57,  1.92s/it, loss=0.155, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00232, train/loss_step=0.381, global_step=4550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:   7%|▋         | 84/1208 [02:42<36:13,  1.93s/it, loss=0.155, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00232, train/loss_step=0.381, global_step=4550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   7%|▋         | 84/1208 [02:42<36:13,  1.93s/it, loss=0.16, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.00108, train/loss_step=0.236, global_step=4550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:   7%|▋         | 85/1208 [02:43<36:00,  1.92s/it, loss=0.16, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.00108, train/loss_step=0.236, global_step=4550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   7%|▋         | 85/1208 [02:43<36:00,  1.92s/it, loss=0.156, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00112, train/loss_step=0.270, global_step=4551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   7%|▋         | 86/1208 [02:44<35:46,  1.91s/it, loss=0.156, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00112, train/loss_step=0.270, global_step=4551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   7%|▋         | 86/1208 [02:44<35:46,  1.91s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0599, train/loss_vlb_step=0.000209, train/loss_step=0.0599, global_step=4551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   7%|▋         | 87/1208 [02:45<35:33,  1.90s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0599, train/loss_vlb_step=0.000209, train/loss_step=0.0599, global_step=4551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   7%|▋         | 87/1208 [02:45<35:33,  1.90s/it, loss=0.119, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.19e-5, train/loss_step=0.002, global_step=4551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:   7%|▋         | 88/1208 [02:48<35:48,  1.92s/it, loss=0.119, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.19e-5, train/loss_step=0.002, global_step=4551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   7%|▋         | 88/1208 [02:48<35:48,  1.92s/it, loss=0.129, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.000962, train/loss_step=0.257, global_step=4551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   7%|▋         | 89/1208 [02:49<35:36,  1.91s/it, loss=0.129, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.000962, train/loss_step=0.257, global_step=4551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   7%|▋         | 89/1208 [02:49<35:36,  1.91s/it, loss=0.131, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000487, train/loss_step=0.147, global_step=4552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   7%|▋         | 90/1208 [02:50<35:23,  1.90s/it, loss=0.131, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000487, train/loss_step=0.147, global_step=4552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   7%|▋         | 90/1208 [02:50<35:23,  1.90s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0715, train/loss_vlb_step=0.000245, train/loss_step=0.0715, global_step=4552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   8%|▊         | 91/1208 [02:51<35:11,  1.89s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0715, train/loss_vlb_step=0.000245, train/loss_step=0.0715, global_step=4552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   8%|▊         | 91/1208 [02:51<35:11,  1.89s/it, loss=0.137, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000843, train/loss_step=0.205, global_step=4552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:   8%|▊         | 92/1208 [02:55<35:25,  1.90s/it, loss=0.137, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000843, train/loss_step=0.205, global_step=4552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   8%|▊         | 92/1208 [02:55<35:25,  1.90s/it, loss=0.15, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00144, train/loss_step=0.301, global_step=4552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:   8%|▊         | 93/1208 [02:56<35:13,  1.90s/it, loss=0.15, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00144, train/loss_step=0.301, global_step=4552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   8%|▊         | 93/1208 [02:56<35:13,  1.90s/it, loss=0.161, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000805, train/loss_step=0.211, global_step=4553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   8%|▊         | 94/1208 [02:57<35:01,  1.89s/it, loss=0.161, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000805, train/loss_step=0.211, global_step=4553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   8%|▊         | 94/1208 [02:57<35:01,  1.89s/it, loss=0.174, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.0014, train/loss_step=0.286, global_step=4553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:   8%|▊         | 95/1208 [02:58<34:49,  1.88s/it, loss=0.174, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.0014, train/loss_step=0.286, global_step=4553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   8%|▊         | 95/1208 [02:58<34:49,  1.88s/it, loss=0.184, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000725, train/loss_step=0.202, global_step=4553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   8%|▊         | 96/1208 [03:01<35:03,  1.89s/it, loss=0.184, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000725, train/loss_step=0.202, global_step=4553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   8%|▊         | 96/1208 [03:01<35:03,  1.89s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00828, train/loss_vlb_step=3.98e-5, train/loss_step=0.00828, global_step=4553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   8%|▊         | 97/1208 [03:02<34:52,  1.88s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00828, train/loss_vlb_step=3.98e-5, train/loss_step=0.00828, global_step=4553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   8%|▊         | 97/1208 [03:02<34:52,  1.88s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=6.19e-5, train/loss_step=0.0133, global_step=4554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:   8%|▊         | 98/1208 [03:03<34:40,  1.87s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=6.19e-5, train/loss_step=0.0133, global_step=4554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   8%|▊         | 98/1208 [03:03<34:40,  1.87s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00923, train/loss_vlb_step=4.49e-5, train/loss_step=0.00923, global_step=4554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   8%|▊         | 99/1208 [03:04<34:29,  1.87s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00923, train/loss_vlb_step=4.49e-5, train/loss_step=0.00923, global_step=4554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   8%|▊         | 99/1208 [03:04<34:29,  1.87s/it, loss=0.185, v_num=0, train/loss_simple_step=0.445, train/loss_vlb_step=0.0032, train/loss_step=0.445, global_step=4554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]     Epoch 15:   8%|▊         | 100/1208 [03:07<34:42,  1.88s/it, loss=0.185, v_num=0, train/loss_simple_step=0.445, train/loss_vlb_step=0.0032, train/loss_step=0.445, global_step=4554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   8%|▊         | 100/1208 [03:07<34:42,  1.88s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.75e-5, train/loss_step=0.0156, global_step=4554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   8%|▊         | 101/1208 [03:08<34:31,  1.87s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.75e-5, train/loss_step=0.0156, global_step=4554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   8%|▊         | 101/1208 [03:08<34:31,  1.87s/it, loss=0.171, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000869, train/loss_step=0.235, global_step=4555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:   8%|▊         | 102/1208 [03:09<34:19,  1.86s/it, loss=0.171, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000869, train/loss_step=0.235, global_step=4555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   8%|▊         | 102/1208 [03:09<34:19,  1.86s/it, loss=0.174, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=4555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   9%|▊         | 103/1208 [03:10<34:08,  1.85s/it, loss=0.174, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=4555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   9%|▊         | 103/1208 [03:10<34:08,  1.85s/it, loss=0.169, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.0014, train/loss_step=0.279, global_step=4555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:   9%|▊         | 104/1208 [03:13<34:17,  1.86s/it, loss=0.169, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.0014, train/loss_step=0.279, global_step=4555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   9%|▊         | 104/1208 [03:13<34:17,  1.86s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00877, train/loss_vlb_step=4.06e-5, train/loss_step=0.00877, global_step=4555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   9%|▊         | 105/1208 [03:14<34:06,  1.86s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00877, train/loss_vlb_step=4.06e-5, train/loss_step=0.00877, global_step=4555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   9%|▊         | 105/1208 [03:14<34:06,  1.86s/it, loss=0.154, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000724, train/loss_step=0.202, global_step=4556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:   9%|▉         | 106/1208 [03:15<33:56,  1.85s/it, loss=0.154, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000724, train/loss_step=0.202, global_step=4556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   9%|▉         | 106/1208 [03:15<33:56,  1.85s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0793, train/loss_vlb_step=0.000265, train/loss_step=0.0793, global_step=4556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   9%|▉         | 107/1208 [03:16<33:45,  1.84s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0793, train/loss_vlb_step=0.000265, train/loss_step=0.0793, global_step=4556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   9%|▉         | 107/1208 [03:16<33:45,  1.84s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0571, train/loss_vlb_step=0.000198, train/loss_step=0.0571, global_step=4556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   9%|▉         | 108/1208 [03:19<33:54,  1.85s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0571, train/loss_vlb_step=0.000198, train/loss_step=0.0571, global_step=4556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   9%|▉         | 108/1208 [03:19<33:54,  1.85s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0628, train/loss_vlb_step=0.000208, train/loss_step=0.0628, global_step=4556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   9%|▉         | 109/1208 [03:20<33:44,  1.84s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0628, train/loss_vlb_step=0.000208, train/loss_step=0.0628, global_step=4556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   9%|▉         | 109/1208 [03:20<33:44,  1.84s/it, loss=0.143, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.000121, train/loss_step=0.033, global_step=4557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:   9%|▉         | 110/1208 [03:21<33:34,  1.83s/it, loss=0.143, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.000121, train/loss_step=0.033, global_step=4557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   9%|▉         | 110/1208 [03:21<33:34,  1.83s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0645, train/loss_vlb_step=0.000221, train/loss_step=0.0645, global_step=4557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   9%|▉         | 111/1208 [03:22<33:24,  1.83s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0645, train/loss_vlb_step=0.000221, train/loss_step=0.0645, global_step=4557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   9%|▉         | 111/1208 [03:22<33:24,  1.83s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.95e-5, train/loss_step=0.0161, global_step=4557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:   9%|▉         | 112/1208 [03:25<33:32,  1.84s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.95e-5, train/loss_step=0.0161, global_step=4557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   9%|▉         | 112/1208 [03:25<33:32,  1.84s/it, loss=0.132, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00121, train/loss_step=0.273, global_step=4557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:   9%|▉         | 113/1208 [03:26<33:23,  1.83s/it, loss=0.132, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00121, train/loss_step=0.273, global_step=4557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   9%|▉         | 113/1208 [03:26<33:23,  1.83s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0377, train/loss_vlb_step=0.000137, train/loss_step=0.0377, global_step=4558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   9%|▉         | 114/1208 [03:27<33:13,  1.82s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0377, train/loss_vlb_step=0.000137, train/loss_step=0.0377, global_step=4558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:   9%|▉         | 114/1208 [03:27<33:13,  1.82s/it, loss=0.127, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00304, train/loss_step=0.367, global_step=4558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  10%|▉         | 115/1208 [03:28<33:03,  1.82s/it, loss=0.127, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00304, train/loss_step=0.367, global_step=4558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  10%|▉         | 115/1208 [03:28<33:03,  1.82s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0772, train/loss_vlb_step=0.000261, train/loss_step=0.0772, global_step=4558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  10%|▉         | 116/1208 [03:31<33:12,  1.82s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0772, train/loss_vlb_step=0.000261, train/loss_step=0.0772, global_step=4558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  10%|▉         | 116/1208 [03:31<33:12,  1.82s/it, loss=0.126, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.00034, train/loss_step=0.103, global_step=4558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  10%|▉         | 117/1208 [03:32<33:02,  1.82s/it, loss=0.126, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.00034, train/loss_step=0.103, global_step=4558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  10%|▉         | 117/1208 [03:32<33:02,  1.82s/it, loss=0.131, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.00038, train/loss_step=0.116, global_step=4559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  10%|▉         | 118/1208 [03:33<32:53,  1.81s/it, loss=0.131, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.00038, train/loss_step=0.116, global_step=4559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  10%|▉         | 118/1208 [03:33<32:53,  1.81s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0289, train/loss_vlb_step=0.000106, train/loss_step=0.0289, global_step=4559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  10%|▉         | 119/1208 [03:34<32:44,  1.80s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0289, train/loss_vlb_step=0.000106, train/loss_step=0.0289, global_step=4559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  10%|▉         | 119/1208 [03:34<32:44,  1.80s/it, loss=0.116, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000472, train/loss_step=0.141, global_step=4559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  10%|▉         | 120/1208 [03:37<32:52,  1.81s/it, loss=0.116, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000472, train/loss_step=0.141, global_step=4559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  10%|▉         | 120/1208 [03:37<32:52,  1.81s/it, loss=0.124, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000544, train/loss_step=0.161, global_step=4559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  10%|█         | 121/1208 [03:38<32:43,  1.81s/it, loss=0.124, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000544, train/loss_step=0.161, global_step=4559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  10%|█         | 121/1208 [03:38<32:43,  1.81s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.000224, train/loss_step=0.0665, global_step=4560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  10%|█         | 122/1208 [03:39<32:34,  1.80s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.000224, train/loss_step=0.0665, global_step=4560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  10%|█         | 122/1208 [03:39<32:34,  1.80s/it, loss=0.13, v_num=0, train/loss_simple_step=0.416, train/loss_vlb_step=0.00304, train/loss_step=0.416, global_step=4560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  10%|█         | 123/1208 [03:40<32:25,  1.79s/it, loss=0.13, v_num=0, train/loss_simple_step=0.416, train/loss_vlb_step=0.00304, train/loss_step=0.416, global_step=4560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  10%|█         | 123/1208 [03:40<32:25,  1.79s/it, loss=0.116, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.75e-5, train/loss_step=0.003, global_step=4560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  10%|█         | 124/1208 [03:43<32:33,  1.80s/it, loss=0.116, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.75e-5, train/loss_step=0.003, global_step=4560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  10%|█         | 124/1208 [03:43<32:33,  1.80s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00544, train/loss_vlb_step=2.91e-5, train/loss_step=0.00544, global_step=4560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  10%|█         | 125/1208 [03:44<32:25,  1.80s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00544, train/loss_vlb_step=2.91e-5, train/loss_step=0.00544, global_step=4560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  10%|█         | 125/1208 [03:44<32:25,  1.80s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00353, train/loss_vlb_step=1.92e-5, train/loss_step=0.00353, global_step=4561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  10%|█         | 126/1208 [03:45<32:16,  1.79s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00353, train/loss_vlb_step=1.92e-5, train/loss_step=0.00353, global_step=4561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  10%|█         | 126/1208 [03:45<32:16,  1.79s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0617, train/loss_vlb_step=0.000208, train/loss_step=0.0617, global_step=4561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  11%|█         | 127/1208 [03:46<32:08,  1.78s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0617, train/loss_vlb_step=0.000208, train/loss_step=0.0617, global_step=4561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  11%|█         | 127/1208 [03:46<32:08,  1.78s/it, loss=0.12, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00244, train/loss_step=0.354, global_step=4561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  11%|█         | 128/1208 [03:49<32:15,  1.79s/it, loss=0.12, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00244, train/loss_step=0.354, global_step=4561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  11%|█         | 128/1208 [03:49<32:15,  1.79s/it, loss=0.138, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00388, train/loss_step=0.432, global_step=4561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  11%|█         | 129/1208 [03:50<32:07,  1.79s/it, loss=0.138, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00388, train/loss_step=0.432, global_step=4561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  11%|█         | 129/1208 [03:50<32:07,  1.79s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0874, train/loss_vlb_step=0.000288, train/loss_step=0.0874, global_step=4562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  11%|█         | 130/1208 [03:51<31:59,  1.78s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0874, train/loss_vlb_step=0.000288, train/loss_step=0.0874, global_step=4562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  11%|█         | 130/1208 [03:51<31:59,  1.78s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.000145, train/loss_step=0.0395, global_step=4562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  11%|█         | 131/1208 [03:52<31:51,  1.77s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.000145, train/loss_step=0.0395, global_step=4562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  11%|█         | 131/1208 [03:52<31:51,  1.77s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=1.89e-5, train/loss_step=0.0034, global_step=4562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  11%|█         | 132/1208 [03:55<31:58,  1.78s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=1.89e-5, train/loss_step=0.0034, global_step=4562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  11%|█         | 132/1208 [03:55<31:58,  1.78s/it, loss=0.145, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.0033, train/loss_step=0.390, global_step=4562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  11%|█         | 133/1208 [03:56<31:50,  1.78s/it, loss=0.145, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.0033, train/loss_step=0.390, global_step=4562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  11%|█         | 133/1208 [03:56<31:50,  1.78s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.59e-5, train/loss_step=0.00475, global_step=4563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  11%|█         | 134/1208 [03:57<31:42,  1.77s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.59e-5, train/loss_step=0.00475, global_step=4563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  11%|█         | 134/1208 [03:57<31:42,  1.77s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000108, train/loss_step=0.0274, global_step=4563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  11%|█         | 135/1208 [03:58<31:34,  1.77s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000108, train/loss_step=0.0274, global_step=4563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  11%|█         | 135/1208 [03:58<31:34,  1.77s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0683, train/loss_vlb_step=0.000233, train/loss_step=0.0683, global_step=4563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  11%|█▏        | 136/1208 [04:01<31:42,  1.77s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0683, train/loss_vlb_step=0.000233, train/loss_step=0.0683, global_step=4563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  11%|█▏        | 136/1208 [04:01<31:42,  1.77s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=1.68e-5, train/loss_step=0.00309, global_step=4563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  11%|█▏        | 137/1208 [04:02<31:34,  1.77s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=1.68e-5, train/loss_step=0.00309, global_step=4563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  11%|█▏        | 137/1208 [04:02<31:34,  1.77s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.94e-5, train/loss_step=0.00342, global_step=4564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  11%|█▏        | 138/1208 [04:03<31:26,  1.76s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.94e-5, train/loss_step=0.00342, global_step=4564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  11%|█▏        | 138/1208 [04:03<31:26,  1.76s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.67e-5, train/loss_step=0.0127, global_step=4564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  12%|█▏        | 139/1208 [04:04<31:19,  1.76s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.67e-5, train/loss_step=0.0127, global_step=4564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  12%|█▏        | 139/1208 [04:04<31:19,  1.76s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=9.52e-5, train/loss_step=0.0254, global_step=4564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  12%|█▏        | 140/1208 [04:07<31:25,  1.77s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=9.52e-5, train/loss_step=0.0254, global_step=4564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  12%|█▏        | 140/1208 [04:07<31:25,  1.77s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0928, train/loss_vlb_step=0.000305, train/loss_step=0.0928, global_step=4564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  12%|█▏        | 141/1208 [04:08<31:18,  1.76s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0928, train/loss_vlb_step=0.000305, train/loss_step=0.0928, global_step=4564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  12%|█▏        | 141/1208 [04:08<31:18,  1.76s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00449, train/loss_vlb_step=2.15e-5, train/loss_step=0.00449, global_step=4565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  12%|█▏        | 142/1208 [04:09<31:10,  1.76s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00449, train/loss_vlb_step=2.15e-5, train/loss_step=0.00449, global_step=4565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  12%|█▏        | 142/1208 [04:09<31:10,  1.76s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00228, train/loss_step=0.352, global_step=4565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  12%|█▏        | 143/1208 [04:10<31:03,  1.75s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00228, train/loss_step=0.352, global_step=4565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  12%|█▏        | 143/1208 [04:10<31:03,  1.75s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.0271, train/loss_vlb_step=0.000105, train/loss_step=0.0271, global_step=4565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  12%|█▏        | 144/1208 [04:13<31:10,  1.76s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.0271, train/loss_vlb_step=0.000105, train/loss_step=0.0271, global_step=4565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  12%|█▏        | 144/1208 [04:13<31:10,  1.76s/it, loss=0.128, v_num=0, train/loss_simple_step=0.562, train/loss_vlb_step=0.00851, train/loss_step=0.562, global_step=4565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  12%|█▏        | 145/1208 [04:14<31:03,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.562, train/loss_vlb_step=0.00851, train/loss_step=0.562, global_step=4565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  12%|█▏        | 145/1208 [04:14<31:03,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00922, train/loss_vlb_step=4.39e-5, train/loss_step=0.00922, global_step=4566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  12%|█▏        | 146/1208 [04:15<30:56,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00922, train/loss_vlb_step=4.39e-5, train/loss_step=0.00922, global_step=4566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  12%|█▏        | 146/1208 [04:15<30:56,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00178, train/loss_step=0.331, global_step=4566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  12%|█▏        | 147/1208 [04:16<30:48,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00178, train/loss_step=0.331, global_step=4566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  12%|█▏        | 147/1208 [04:16<30:48,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.0017, train/loss_step=0.311, global_step=4566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  12%|█▏        | 148/1208 [04:19<30:55,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.0017, train/loss_step=0.311, global_step=4566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  12%|█▏        | 148/1208 [04:19<30:55,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00707, train/loss_vlb_step=3.39e-5, train/loss_step=0.00707, global_step=4566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  12%|█▏        | 149/1208 [04:20<30:48,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00707, train/loss_vlb_step=3.39e-5, train/loss_step=0.00707, global_step=4566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  12%|█▏        | 149/1208 [04:20<30:48,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000699, train/loss_step=0.197, global_step=4567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  12%|█▏        | 150/1208 [04:21<30:41,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000699, train/loss_step=0.197, global_step=4567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  12%|█▏        | 150/1208 [04:21<30:41,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000578, train/loss_step=0.167, global_step=4567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  12%|█▎        | 151/1208 [04:22<30:34,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000578, train/loss_step=0.167, global_step=4567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  12%|█▎        | 151/1208 [04:22<30:34,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=7.91e-5, train/loss_step=0.0193, global_step=4567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  13%|█▎        | 152/1208 [04:24<30:40,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=7.91e-5, train/loss_step=0.0193, global_step=4567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  13%|█▎        | 152/1208 [04:24<30:40,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000119, train/loss_step=0.0308, global_step=4567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  13%|█▎        | 153/1208 [04:25<30:34,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000119, train/loss_step=0.0308, global_step=4567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  13%|█▎        | 153/1208 [04:25<30:34,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00237, train/loss_step=0.389, global_step=4568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  13%|█▎        | 154/1208 [04:26<30:27,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00237, train/loss_step=0.389, global_step=4568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  13%|█▎        | 154/1208 [04:26<30:27,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00393, train/loss_step=0.433, global_step=4568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  13%|█▎        | 155/1208 [04:28<30:20,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00393, train/loss_step=0.433, global_step=4568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  13%|█▎        | 155/1208 [04:28<30:20,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.38e-5, train/loss_step=0.0151, global_step=4568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  13%|█▎        | 156/1208 [04:30<30:26,  1.74s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.38e-5, train/loss_step=0.0151, global_step=4568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  13%|█▎        | 156/1208 [04:30<30:26,  1.74s/it, loss=0.158, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000625, train/loss_step=0.174, global_step=4568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  13%|█▎        | 157/1208 [04:31<30:20,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000625, train/loss_step=0.174, global_step=4568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  13%|█▎        | 157/1208 [04:31<30:20,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000419, train/loss_step=0.125, global_step=4569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  13%|█▎        | 158/1208 [04:32<30:13,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000419, train/loss_step=0.125, global_step=4569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  13%|█▎        | 158/1208 [04:32<30:13,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.36e-5, train/loss_step=0.0149, global_step=4569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  13%|█▎        | 159/1208 [04:33<30:07,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.36e-5, train/loss_step=0.0149, global_step=4569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  13%|█▎        | 159/1208 [04:33<30:07,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00978, train/loss_vlb_step=4.58e-5, train/loss_step=0.00978, global_step=4569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  13%|█▎        | 160/1208 [04:36<30:13,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00978, train/loss_vlb_step=4.58e-5, train/loss_step=0.00978, global_step=4569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  13%|█▎        | 160/1208 [04:36<30:13,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00272, train/loss_step=0.398, global_step=4569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  13%|█▎        | 161/1208 [04:37<30:06,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00272, train/loss_step=0.398, global_step=4569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  13%|█▎        | 161/1208 [04:37<30:06,  1.73s/it, loss=0.193, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00138, train/loss_step=0.286, global_step=4570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  13%|█▎        | 162/1208 [04:38<30:00,  1.72s/it, loss=0.193, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00138, train/loss_step=0.286, global_step=4570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  13%|█▎        | 162/1208 [04:38<30:00,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000224, train/loss_step=0.0676, global_step=4570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  13%|█▎        | 163/1208 [04:39<29:54,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000224, train/loss_step=0.0676, global_step=4570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  13%|█▎        | 163/1208 [04:39<29:54,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000905, train/loss_step=0.234, global_step=4570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  14%|█▎        | 164/1208 [04:42<29:59,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000905, train/loss_step=0.234, global_step=4570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  14%|█▎        | 164/1208 [04:42<29:59,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.2e-5, train/loss_step=0.00202, global_step=4570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  14%|█▎        | 165/1208 [04:43<29:53,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.2e-5, train/loss_step=0.00202, global_step=4570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  14%|█▎        | 165/1208 [04:43<29:53,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=9.31e-6, train/loss_step=0.00154, global_step=4571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  14%|█▎        | 166/1208 [04:44<29:47,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=9.31e-6, train/loss_step=0.00154, global_step=4571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  14%|█▎        | 166/1208 [04:44<29:47,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.08e-5, train/loss_step=0.0139, global_step=4571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  14%|█▍        | 167/1208 [04:45<29:41,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.08e-5, train/loss_step=0.0139, global_step=4571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  14%|█▍        | 167/1208 [04:45<29:41,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000456, train/loss_step=0.137, global_step=4571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  14%|█▍        | 168/1208 [04:48<29:47,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000456, train/loss_step=0.137, global_step=4571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  14%|█▍        | 168/1208 [04:48<29:47,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.2e-5, train/loss_step=0.0232, global_step=4571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  14%|█▍        | 169/1208 [04:49<29:41,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.2e-5, train/loss_step=0.0232, global_step=4571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  14%|█▍        | 169/1208 [04:49<29:41,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000614, train/loss_step=0.170, global_step=4572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  14%|█▍        | 170/1208 [04:50<29:35,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000614, train/loss_step=0.170, global_step=4572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  14%|█▍        | 170/1208 [04:50<29:35,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000417, train/loss_step=0.126, global_step=4572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  14%|█▍        | 171/1208 [04:51<29:29,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000417, train/loss_step=0.126, global_step=4572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  14%|█▍        | 171/1208 [04:51<29:29,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.00046, train/loss_step=0.138, global_step=4572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  14%|█▍        | 172/1208 [04:54<29:34,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.00046, train/loss_step=0.138, global_step=4572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  14%|█▍        | 172/1208 [04:54<29:34,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000405, train/loss_step=0.122, global_step=4572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  14%|█▍        | 173/1208 [04:55<29:28,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000405, train/loss_step=0.122, global_step=4572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  14%|█▍        | 173/1208 [04:55<29:28,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000126, train/loss_step=0.0337, global_step=4573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  14%|█▍        | 174/1208 [04:56<29:22,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000126, train/loss_step=0.0337, global_step=4573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  14%|█▍        | 174/1208 [04:56<29:22,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00093, train/loss_step=0.237, global_step=4573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  14%|█▍        | 175/1208 [04:57<29:17,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00093, train/loss_step=0.237, global_step=4573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  14%|█▍        | 175/1208 [04:57<29:17,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00834, train/loss_vlb_step=4.01e-5, train/loss_step=0.00834, global_step=4573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  15%|█▍        | 176/1208 [05:00<29:22,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00834, train/loss_vlb_step=4.01e-5, train/loss_step=0.00834, global_step=4573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  15%|█▍        | 176/1208 [05:00<29:22,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00169, train/loss_step=0.328, global_step=4573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  15%|█▍        | 177/1208 [05:01<29:16,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00169, train/loss_step=0.328, global_step=4573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  15%|█▍        | 177/1208 [05:01<29:16,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00497, train/loss_vlb_step=2.68e-5, train/loss_step=0.00497, global_step=4574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  15%|█▍        | 178/1208 [05:02<29:10,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00497, train/loss_vlb_step=2.68e-5, train/loss_step=0.00497, global_step=4574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  15%|█▍        | 178/1208 [05:02<29:10,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00136, train/loss_step=0.267, global_step=4574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]     Epoch 15:  15%|█▍        | 179/1208 [05:03<29:05,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00136, train/loss_step=0.267, global_step=4574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  15%|█▍        | 179/1208 [05:03<29:05,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000478, train/loss_step=0.144, global_step=4574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  15%|█▍        | 180/1208 [05:06<29:10,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000478, train/loss_step=0.144, global_step=4574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  15%|█▍        | 180/1208 [05:06<29:10,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.71e-5, train/loss_step=0.0147, global_step=4574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  15%|█▍        | 181/1208 [05:07<29:04,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.71e-5, train/loss_step=0.0147, global_step=4574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  15%|█▍        | 181/1208 [05:07<29:04,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.000167, train/loss_step=0.0462, global_step=4575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  15%|█▌        | 182/1208 [05:08<28:58,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.000167, train/loss_step=0.0462, global_step=4575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  15%|█▌        | 182/1208 [05:08<28:58,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000655, train/loss_step=0.178, global_step=4575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  15%|█▌        | 183/1208 [05:09<28:53,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000655, train/loss_step=0.178, global_step=4575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  15%|█▌        | 183/1208 [05:09<28:53,  1.69s/it, loss=0.11, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000743, train/loss_step=0.205, global_step=4575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  15%|█▌        | 184/1208 [05:12<28:58,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000743, train/loss_step=0.205, global_step=4575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  15%|█▌        | 184/1208 [05:12<28:58,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00189, train/loss_step=0.378, global_step=4575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  15%|█▌        | 185/1208 [05:13<28:52,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00189, train/loss_step=0.378, global_step=4575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  15%|█▌        | 185/1208 [05:13<28:52,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.474, train/loss_vlb_step=0.00655, train/loss_step=0.474, global_step=4576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  15%|█▌        | 186/1208 [05:14<28:47,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.474, train/loss_vlb_step=0.00655, train/loss_step=0.474, global_step=4576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  15%|█▌        | 186/1208 [05:14<28:47,  1.69s/it, loss=0.166, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00141, train/loss_step=0.289, global_step=4576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  15%|█▌        | 187/1208 [05:15<28:41,  1.69s/it, loss=0.166, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00141, train/loss_step=0.289, global_step=4576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  15%|█▌        | 187/1208 [05:15<28:41,  1.69s/it, loss=0.189, v_num=0, train/loss_simple_step=0.595, train/loss_vlb_step=0.00923, train/loss_step=0.595, global_step=4576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  16%|█▌        | 188/1208 [05:18<28:46,  1.69s/it, loss=0.189, v_num=0, train/loss_simple_step=0.595, train/loss_vlb_step=0.00923, train/loss_step=0.595, global_step=4576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  16%|█▌        | 188/1208 [05:18<28:46,  1.69s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0856, train/loss_vlb_step=0.000283, train/loss_step=0.0856, global_step=4576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  16%|█▌        | 189/1208 [05:19<28:41,  1.69s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0856, train/loss_vlb_step=0.000283, train/loss_step=0.0856, global_step=4576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  16%|█▌        | 189/1208 [05:19<28:41,  1.69s/it, loss=0.191, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000468, train/loss_step=0.141, global_step=4577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  16%|█▌        | 190/1208 [05:20<28:36,  1.69s/it, loss=0.191, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000468, train/loss_step=0.141, global_step=4577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  16%|█▌        | 190/1208 [05:20<28:36,  1.69s/it, loss=0.199, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00142, train/loss_step=0.295, global_step=4577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  16%|█▌        | 191/1208 [05:21<28:30,  1.68s/it, loss=0.199, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00142, train/loss_step=0.295, global_step=4577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  16%|█▌        | 191/1208 [05:21<28:30,  1.68s/it, loss=0.208, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00163, train/loss_step=0.319, global_step=4577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  16%|█▌        | 192/1208 [05:24<28:35,  1.69s/it, loss=0.208, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00163, train/loss_step=0.319, global_step=4577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  16%|█▌        | 192/1208 [05:24<28:35,  1.69s/it, loss=0.227, v_num=0, train/loss_simple_step=0.486, train/loss_vlb_step=0.00426, train/loss_step=0.486, global_step=4577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  16%|█▌        | 193/1208 [05:25<28:30,  1.69s/it, loss=0.227, v_num=0, train/loss_simple_step=0.486, train/loss_vlb_step=0.00426, train/loss_step=0.486, global_step=4577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  16%|█▌        | 193/1208 [05:25<28:30,  1.69s/it, loss=0.243, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00319, train/loss_step=0.372, global_step=4578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  16%|█▌        | 194/1208 [05:26<28:25,  1.68s/it, loss=0.243, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00319, train/loss_step=0.372, global_step=4578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  16%|█▌        | 194/1208 [05:26<28:25,  1.68s/it, loss=0.25, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.0024, train/loss_step=0.360, global_step=4578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  16%|█▌        | 195/1208 [05:27<28:19,  1.68s/it, loss=0.25, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.0024, train/loss_step=0.360, global_step=4578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  16%|█▌        | 195/1208 [05:27<28:19,  1.68s/it, loss=0.251, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.000149, train/loss_step=0.0403, global_step=4578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  16%|█▌        | 196/1208 [05:30<28:24,  1.68s/it, loss=0.251, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.000149, train/loss_step=0.0403, global_step=4578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  16%|█▌        | 196/1208 [05:30<28:24,  1.68s/it, loss=0.235, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=2.1e-5, train/loss_step=0.00413, global_step=4578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  16%|█▋        | 197/1208 [05:31<28:19,  1.68s/it, loss=0.235, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=2.1e-5, train/loss_step=0.00413, global_step=4578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  16%|█▋        | 197/1208 [05:31<28:19,  1.68s/it, loss=0.246, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000727, train/loss_step=0.215, global_step=4579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  16%|█▋        | 198/1208 [05:32<28:14,  1.68s/it, loss=0.246, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000727, train/loss_step=0.215, global_step=4579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  16%|█▋        | 198/1208 [05:32<28:14,  1.68s/it, loss=0.242, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.00068, train/loss_step=0.193, global_step=4579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  16%|█▋        | 199/1208 [05:33<28:09,  1.67s/it, loss=0.242, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.00068, train/loss_step=0.193, global_step=4579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  16%|█▋        | 199/1208 [05:33<28:09,  1.67s/it, loss=0.246, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000895, train/loss_step=0.233, global_step=4579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  17%|█▋        | 200/1208 [05:36<28:13,  1.68s/it, loss=0.246, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000895, train/loss_step=0.233, global_step=4579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  17%|█▋        | 200/1208 [05:36<28:13,  1.68s/it, loss=0.252, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000462, train/loss_step=0.139, global_step=4579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  17%|█▋        | 201/1208 [05:37<28:08,  1.68s/it, loss=0.252, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000462, train/loss_step=0.139, global_step=4579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  17%|█▋        | 201/1208 [05:37<28:08,  1.68s/it, loss=0.251, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.29e-5, train/loss_step=0.017, global_step=4580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  17%|█▋        | 202/1208 [05:38<28:03,  1.67s/it, loss=0.251, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.29e-5, train/loss_step=0.017, global_step=4580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  17%|█▋        | 202/1208 [05:38<28:03,  1.67s/it, loss=0.249, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000441, train/loss_step=0.133, global_step=4580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  17%|█▋        | 203/1208 [05:39<27:58,  1.67s/it, loss=0.249, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000441, train/loss_step=0.133, global_step=4580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  17%|█▋        | 203/1208 [05:39<27:58,  1.67s/it, loss=0.271, v_num=0, train/loss_simple_step=0.649, train/loss_vlb_step=0.0141, train/loss_step=0.649, global_step=4580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  17%|█▋        | 204/1208 [05:41<28:02,  1.68s/it, loss=0.271, v_num=0, train/loss_simple_step=0.649, train/loss_vlb_step=0.0141, train/loss_step=0.649, global_step=4580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  17%|█▋        | 204/1208 [05:41<28:02,  1.68s/it, loss=0.255, v_num=0, train/loss_simple_step=0.0523, train/loss_vlb_step=0.000191, train/loss_step=0.0523, global_step=4580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  17%|█▋        | 205/1208 [05:42<27:58,  1.67s/it, loss=0.255, v_num=0, train/loss_simple_step=0.0523, train/loss_vlb_step=0.000191, train/loss_step=0.0523, global_step=4580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  17%|█▋        | 205/1208 [05:42<27:58,  1.67s/it, loss=0.251, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00243, train/loss_step=0.404, global_step=4581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  17%|█▋        | 206/1208 [05:44<27:53,  1.67s/it, loss=0.251, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00243, train/loss_step=0.404, global_step=4581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  17%|█▋        | 206/1208 [05:44<27:53,  1.67s/it, loss=0.238, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.83e-5, train/loss_step=0.0213, global_step=4581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  17%|█▋        | 207/1208 [05:45<27:48,  1.67s/it, loss=0.238, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.83e-5, train/loss_step=0.0213, global_step=4581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  17%|█▋        | 207/1208 [05:45<27:48,  1.67s/it, loss=0.228, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00306, train/loss_step=0.399, global_step=4581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  17%|█▋        | 208/1208 [05:47<27:52,  1.67s/it, loss=0.228, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00306, train/loss_step=0.399, global_step=4581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  17%|█▋        | 208/1208 [05:47<27:52,  1.67s/it, loss=0.233, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000689, train/loss_step=0.189, global_step=4581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  17%|█▋        | 209/1208 [05:48<27:47,  1.67s/it, loss=0.233, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000689, train/loss_step=0.189, global_step=4581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  17%|█▋        | 209/1208 [05:48<27:47,  1.67s/it, loss=0.227, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.35e-5, train/loss_step=0.0178, global_step=4582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  17%|█▋        | 210/1208 [05:49<27:42,  1.67s/it, loss=0.227, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.35e-5, train/loss_step=0.0178, global_step=4582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  17%|█▋        | 210/1208 [05:49<27:42,  1.67s/it, loss=0.22, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000515, train/loss_step=0.151, global_step=4582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  17%|█▋        | 211/1208 [05:50<27:38,  1.66s/it, loss=0.22, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000515, train/loss_step=0.151, global_step=4582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  17%|█▋        | 211/1208 [05:50<27:38,  1.66s/it, loss=0.211, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000486, train/loss_step=0.143, global_step=4582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  18%|█▊        | 212/1208 [05:53<27:42,  1.67s/it, loss=0.211, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000486, train/loss_step=0.143, global_step=4582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  18%|█▊        | 212/1208 [05:53<27:42,  1.67s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.17e-5, train/loss_step=0.0142, global_step=4582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  18%|█▊        | 213/1208 [05:54<27:37,  1.67s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.17e-5, train/loss_step=0.0142, global_step=4582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  18%|█▊        | 213/1208 [05:54<27:37,  1.67s/it, loss=0.185, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00194, train/loss_step=0.330, global_step=4583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  18%|█▊        | 214/1208 [05:55<27:32,  1.66s/it, loss=0.185, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00194, train/loss_step=0.330, global_step=4583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  18%|█▊        | 214/1208 [05:55<27:32,  1.66s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.64e-5, train/loss_step=0.00296, global_step=4583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  18%|█▊        | 215/1208 [05:56<27:27,  1.66s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.64e-5, train/loss_step=0.00296, global_step=4583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  18%|█▊        | 215/1208 [05:56<27:27,  1.66s/it, loss=0.166, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.78e-5, train/loss_step=0.016, global_step=4583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  18%|█▊        | 216/1208 [05:59<27:31,  1.67s/it, loss=0.166, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.78e-5, train/loss_step=0.016, global_step=4583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  18%|█▊        | 216/1208 [05:59<27:32,  1.67s/it, loss=0.189, v_num=0, train/loss_simple_step=0.463, train/loss_vlb_step=0.00654, train/loss_step=0.463, global_step=4583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  18%|█▊        | 217/1208 [06:00<27:27,  1.66s/it, loss=0.189, v_num=0, train/loss_simple_step=0.463, train/loss_vlb_step=0.00654, train/loss_step=0.463, global_step=4583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  18%|█▊        | 217/1208 [06:00<27:27,  1.66s/it, loss=0.184, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=4584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  18%|█▊        | 218/1208 [06:01<27:22,  1.66s/it, loss=0.184, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=4584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  18%|█▊        | 218/1208 [06:01<27:22,  1.66s/it, loss=0.188, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00163, train/loss_step=0.283, global_step=4584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  18%|█▊        | 219/1208 [06:02<27:18,  1.66s/it, loss=0.188, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00163, train/loss_step=0.283, global_step=4584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  18%|█▊        | 219/1208 [06:02<27:18,  1.66s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.25e-5, train/loss_step=0.00423, global_step=4584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  18%|█▊        | 220/1208 [06:05<27:22,  1.66s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.25e-5, train/loss_step=0.00423, global_step=4584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  18%|█▊        | 220/1208 [06:05<27:22,  1.66s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0618, train/loss_vlb_step=0.000208, train/loss_step=0.0618, global_step=4584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  18%|█▊        | 221/1208 [06:06<27:17,  1.66s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0618, train/loss_vlb_step=0.000208, train/loss_step=0.0618, global_step=4584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  18%|█▊        | 221/1208 [06:06<27:17,  1.66s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.51e-5, train/loss_step=0.0124, global_step=4585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  18%|█▊        | 222/1208 [06:07<27:12,  1.66s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.51e-5, train/loss_step=0.0124, global_step=4585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  18%|█▊        | 222/1208 [06:07<27:12,  1.66s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.83e-5, train/loss_step=0.0106, global_step=4585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  18%|█▊        | 223/1208 [06:08<27:08,  1.65s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.83e-5, train/loss_step=0.0106, global_step=4585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  18%|█▊        | 223/1208 [06:08<27:08,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00735, train/loss_vlb_step=3.66e-5, train/loss_step=0.00735, global_step=4585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  19%|█▊        | 224/1208 [06:11<27:12,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00735, train/loss_vlb_step=3.66e-5, train/loss_step=0.00735, global_step=4585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  19%|█▊        | 224/1208 [06:11<27:12,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0824, train/loss_vlb_step=0.000276, train/loss_step=0.0824, global_step=4585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  19%|█▊        | 225/1208 [06:12<27:07,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0824, train/loss_vlb_step=0.000276, train/loss_step=0.0824, global_step=4585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  19%|█▊        | 225/1208 [06:12<27:07,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000615, train/loss_step=0.171, global_step=4586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  19%|█▊        | 226/1208 [06:13<27:03,  1.65s/it, loss=0.124, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000615, train/loss_step=0.171, global_step=4586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  19%|█▊        | 226/1208 [06:13<27:03,  1.65s/it, loss=0.159, v_num=0, train/loss_simple_step=0.709, train/loss_vlb_step=0.0221, train/loss_step=0.709, global_step=4586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  19%|█▉        | 227/1208 [06:14<26:58,  1.65s/it, loss=0.159, v_num=0, train/loss_simple_step=0.709, train/loss_vlb_step=0.0221, train/loss_step=0.709, global_step=4586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  19%|█▉        | 227/1208 [06:14<26:58,  1.65s/it, loss=0.148, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000622, train/loss_step=0.179, global_step=4586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  19%|█▉        | 228/1208 [06:17<27:02,  1.66s/it, loss=0.148, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000622, train/loss_step=0.179, global_step=4586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  19%|█▉        | 228/1208 [06:17<27:02,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00169, train/loss_step=0.388, global_step=4586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  19%|█▉        | 229/1208 [06:18<26:58,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00169, train/loss_step=0.388, global_step=4586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  19%|█▉        | 229/1208 [06:18<26:58,  1.65s/it, loss=0.186, v_num=0, train/loss_simple_step=0.578, train/loss_vlb_step=0.017, train/loss_step=0.578, global_step=4587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  19%|█▉        | 230/1208 [06:19<26:53,  1.65s/it, loss=0.186, v_num=0, train/loss_simple_step=0.578, train/loss_vlb_step=0.017, train/loss_step=0.578, global_step=4587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  19%|█▉        | 230/1208 [06:19<26:53,  1.65s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000212, train/loss_step=0.0588, global_step=4587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  19%|█▉        | 231/1208 [06:20<26:49,  1.65s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000212, train/loss_step=0.0588, global_step=4587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  19%|█▉        | 231/1208 [06:20<26:49,  1.65s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00676, train/loss_vlb_step=3.27e-5, train/loss_step=0.00676, global_step=4587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  19%|█▉        | 232/1208 [06:23<26:52,  1.65s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00676, train/loss_vlb_step=3.27e-5, train/loss_step=0.00676, global_step=4587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  19%|█▉        | 232/1208 [06:23<26:52,  1.65s/it, loss=0.184, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.00085, train/loss_step=0.217, global_step=4587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  19%|█▉        | 233/1208 [06:24<26:48,  1.65s/it, loss=0.184, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.00085, train/loss_step=0.217, global_step=4587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  19%|█▉        | 233/1208 [06:24<26:48,  1.65s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00323, train/loss_vlb_step=1.88e-5, train/loss_step=0.00323, global_step=4588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  19%|█▉        | 234/1208 [06:25<26:44,  1.65s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00323, train/loss_vlb_step=1.88e-5, train/loss_step=0.00323, global_step=4588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  19%|█▉        | 234/1208 [06:25<26:44,  1.65s/it, loss=0.17, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.000151, train/loss_step=0.041, global_step=4588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  19%|█▉        | 235/1208 [06:26<26:39,  1.64s/it, loss=0.17, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.000151, train/loss_step=0.041, global_step=4588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  19%|█▉        | 235/1208 [06:26<26:39,  1.64s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.16e-5, train/loss_step=0.00192, global_step=4588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  20%|█▉        | 236/1208 [06:29<26:43,  1.65s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.16e-5, train/loss_step=0.00192, global_step=4588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  20%|█▉        | 236/1208 [06:29<26:43,  1.65s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0479, train/loss_vlb_step=0.000171, train/loss_step=0.0479, global_step=4588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  20%|█▉        | 237/1208 [06:30<26:39,  1.65s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0479, train/loss_vlb_step=0.000171, train/loss_step=0.0479, global_step=4588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  20%|█▉        | 237/1208 [06:30<26:39,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00294, train/loss_step=0.395, global_step=4589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  20%|█▉        | 238/1208 [06:31<26:34,  1.64s/it, loss=0.163, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00294, train/loss_step=0.395, global_step=4589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  20%|█▉        | 238/1208 [06:31<26:34,  1.64s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0645, train/loss_vlb_step=0.000221, train/loss_step=0.0645, global_step=4589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  20%|█▉        | 239/1208 [06:32<26:30,  1.64s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0645, train/loss_vlb_step=0.000221, train/loss_step=0.0645, global_step=4589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  20%|█▉        | 239/1208 [06:32<26:30,  1.64s/it, loss=0.162, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000676, train/loss_step=0.197, global_step=4589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  20%|█▉        | 240/1208 [06:35<26:33,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000676, train/loss_step=0.197, global_step=4589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  20%|█▉        | 240/1208 [06:35<26:33,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0925, train/loss_vlb_step=0.000307, train/loss_step=0.0925, global_step=4589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  20%|█▉        | 241/1208 [06:36<26:29,  1.64s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0925, train/loss_vlb_step=0.000307, train/loss_step=0.0925, global_step=4589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  20%|█▉        | 241/1208 [06:36<26:29,  1.64s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.61e-5, train/loss_step=0.00282, global_step=4590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  20%|██        | 242/1208 [06:37<26:25,  1.64s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.61e-5, train/loss_step=0.00282, global_step=4590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  20%|██        | 242/1208 [06:37<26:25,  1.64s/it, loss=0.168, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=4590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  20%|██        | 243/1208 [06:38<26:21,  1.64s/it, loss=0.168, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=4590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  20%|██        | 243/1208 [06:38<26:21,  1.64s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.000168, train/loss_step=0.0468, global_step=4590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  20%|██        | 244/1208 [06:41<26:24,  1.64s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.000168, train/loss_step=0.0468, global_step=4590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  20%|██        | 244/1208 [06:41<26:24,  1.64s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000166, train/loss_step=0.0449, global_step=4590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  20%|██        | 245/1208 [06:42<26:20,  1.64s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000166, train/loss_step=0.0449, global_step=4590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  20%|██        | 245/1208 [06:42<26:20,  1.64s/it, loss=0.167, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000473, train/loss_step=0.141, global_step=4591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  20%|██        | 246/1208 [06:43<26:16,  1.64s/it, loss=0.167, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000473, train/loss_step=0.141, global_step=4591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  20%|██        | 246/1208 [06:43<26:16,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000413, train/loss_step=0.124, global_step=4591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  20%|██        | 247/1208 [06:44<26:12,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000413, train/loss_step=0.124, global_step=4591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  20%|██        | 247/1208 [06:44<26:12,  1.64s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.09e-5, train/loss_step=0.0138, global_step=4591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  21%|██        | 248/1208 [06:47<26:15,  1.64s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.09e-5, train/loss_step=0.0138, global_step=4591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  21%|██        | 248/1208 [06:47<26:15,  1.64s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0837, train/loss_vlb_step=0.000277, train/loss_step=0.0837, global_step=4591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  21%|██        | 249/1208 [06:48<26:11,  1.64s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0837, train/loss_vlb_step=0.000277, train/loss_step=0.0837, global_step=4591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  21%|██        | 249/1208 [06:48<26:11,  1.64s/it, loss=0.0892, v_num=0, train/loss_simple_step=0.0849, train/loss_vlb_step=0.000282, train/loss_step=0.0849, global_step=4592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  21%|██        | 250/1208 [06:49<26:07,  1.64s/it, loss=0.0892, v_num=0, train/loss_simple_step=0.0849, train/loss_vlb_step=0.000282, train/loss_step=0.0849, global_step=4592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  21%|██        | 250/1208 [06:49<26:07,  1.64s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.00015, train/loss_step=0.038, global_step=4592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  21%|██        | 251/1208 [06:50<26:03,  1.63s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.00015, train/loss_step=0.038, global_step=4592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  21%|██        | 251/1208 [06:50<26:03,  1.63s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.00076, train/loss_step=0.209, global_step=4592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  21%|██        | 252/1208 [06:52<26:06,  1.64s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.00076, train/loss_step=0.209, global_step=4592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  21%|██        | 252/1208 [06:52<26:06,  1.64s/it, loss=0.0876, v_num=0, train/loss_simple_step=0.00301, train/loss_vlb_step=1.66e-5, train/loss_step=0.00301, global_step=4592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  21%|██        | 253/1208 [06:53<26:02,  1.64s/it, loss=0.0876, v_num=0, train/loss_simple_step=0.00301, train/loss_vlb_step=1.66e-5, train/loss_step=0.00301, global_step=4592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  21%|██        | 253/1208 [06:53<26:02,  1.64s/it, loss=0.117, v_num=0, train/loss_simple_step=0.589, train/loss_vlb_step=0.0115, train/loss_step=0.589, global_step=4593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]      Epoch 15:  21%|██        | 254/1208 [06:54<25:58,  1.63s/it, loss=0.117, v_num=0, train/loss_simple_step=0.589, train/loss_vlb_step=0.0115, train/loss_step=0.589, global_step=4593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  21%|██        | 254/1208 [06:54<25:58,  1.63s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000159, train/loss_step=0.0437, global_step=4593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  21%|██        | 255/1208 [06:56<25:54,  1.63s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000159, train/loss_step=0.0437, global_step=4593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  21%|██        | 255/1208 [06:56<25:54,  1.63s/it, loss=0.132, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00122, train/loss_step=0.295, global_step=4593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  21%|██        | 256/1208 [06:58<25:57,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00122, train/loss_step=0.295, global_step=4593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  21%|██        | 256/1208 [06:58<25:57,  1.64s/it, loss=0.141, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00091, train/loss_step=0.237, global_step=4593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  21%|██▏       | 257/1208 [06:59<25:53,  1.63s/it, loss=0.141, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00091, train/loss_step=0.237, global_step=4593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  21%|██▏       | 257/1208 [06:59<25:53,  1.63s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=8.32e-5, train/loss_step=0.0195, global_step=4594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  21%|██▏       | 258/1208 [07:00<25:49,  1.63s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=8.32e-5, train/loss_step=0.0195, global_step=4594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  21%|██▏       | 258/1208 [07:00<25:49,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0758, train/loss_vlb_step=0.00025, train/loss_step=0.0758, global_step=4594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  21%|██▏       | 259/1208 [07:01<25:45,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0758, train/loss_vlb_step=0.00025, train/loss_step=0.0758, global_step=4594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  21%|██▏       | 259/1208 [07:01<25:46,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0648, train/loss_vlb_step=0.00022, train/loss_step=0.0648, global_step=4594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  22%|██▏       | 260/1208 [07:04<25:48,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0648, train/loss_vlb_step=0.00022, train/loss_step=0.0648, global_step=4594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  22%|██▏       | 260/1208 [07:04<25:48,  1.63s/it, loss=0.127, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00213, train/loss_step=0.302, global_step=4594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  22%|██▏       | 261/1208 [07:05<25:45,  1.63s/it, loss=0.127, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00213, train/loss_step=0.302, global_step=4594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  22%|██▏       | 261/1208 [07:05<25:45,  1.63s/it, loss=0.132, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=4595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  22%|██▏       | 262/1208 [07:06<25:41,  1.63s/it, loss=0.132, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=4595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  22%|██▏       | 262/1208 [07:06<25:41,  1.63s/it, loss=0.149, v_num=0, train/loss_simple_step=0.445, train/loss_vlb_step=0.0071, train/loss_step=0.445, global_step=4595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  22%|██▏       | 263/1208 [07:07<25:37,  1.63s/it, loss=0.149, v_num=0, train/loss_simple_step=0.445, train/loss_vlb_step=0.0071, train/loss_step=0.445, global_step=4595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  22%|██▏       | 263/1208 [07:07<25:37,  1.63s/it, loss=0.163, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00163, train/loss_step=0.339, global_step=4595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  22%|██▏       | 264/1208 [07:10<25:40,  1.63s/it, loss=0.163, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00163, train/loss_step=0.339, global_step=4595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  22%|██▏       | 264/1208 [07:10<25:40,  1.63s/it, loss=0.172, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000968, train/loss_step=0.218, global_step=4595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  22%|██▏       | 265/1208 [07:11<25:36,  1.63s/it, loss=0.172, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000968, train/loss_step=0.218, global_step=4595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  22%|██▏       | 265/1208 [07:11<25:36,  1.63s/it, loss=0.171, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000387, train/loss_step=0.117, global_step=4596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  22%|██▏       | 266/1208 [07:12<25:32,  1.63s/it, loss=0.171, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000387, train/loss_step=0.117, global_step=4596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  22%|██▏       | 266/1208 [07:12<25:32,  1.63s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0846, train/loss_vlb_step=0.000284, train/loss_step=0.0846, global_step=4596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  22%|██▏       | 267/1208 [07:13<25:28,  1.62s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0846, train/loss_vlb_step=0.000284, train/loss_step=0.0846, global_step=4596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  22%|██▏       | 267/1208 [07:13<25:28,  1.62s/it, loss=0.195, v_num=0, train/loss_simple_step=0.536, train/loss_vlb_step=0.00982, train/loss_step=0.536, global_step=4596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  22%|██▏       | 268/1208 [07:16<25:31,  1.63s/it, loss=0.195, v_num=0, train/loss_simple_step=0.536, train/loss_vlb_step=0.00982, train/loss_step=0.536, global_step=4596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  22%|██▏       | 268/1208 [07:16<25:31,  1.63s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0747, train/loss_vlb_step=0.000253, train/loss_step=0.0747, global_step=4596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  22%|██▏       | 269/1208 [07:17<25:27,  1.63s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0747, train/loss_vlb_step=0.000253, train/loss_step=0.0747, global_step=4596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  22%|██▏       | 269/1208 [07:17<25:27,  1.63s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0318, train/loss_vlb_step=0.000115, train/loss_step=0.0318, global_step=4597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  22%|██▏       | 270/1208 [07:18<25:23,  1.62s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0318, train/loss_vlb_step=0.000115, train/loss_step=0.0318, global_step=4597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  22%|██▏       | 270/1208 [07:18<25:23,  1.62s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.68e-5, train/loss_step=0.0246, global_step=4597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  22%|██▏       | 271/1208 [07:19<25:20,  1.62s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.68e-5, train/loss_step=0.0246, global_step=4597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  22%|██▏       | 271/1208 [07:19<25:20,  1.62s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.0001, train/loss_step=0.0248, global_step=4597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  23%|██▎       | 272/1208 [07:22<25:22,  1.63s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.0001, train/loss_step=0.0248, global_step=4597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  23%|██▎       | 272/1208 [07:22<25:22,  1.63s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.65e-5, train/loss_step=0.00286, global_step=4597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  23%|██▎       | 273/1208 [07:23<25:19,  1.62s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.65e-5, train/loss_step=0.00286, global_step=4597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  23%|██▎       | 273/1208 [07:23<25:19,  1.62s/it, loss=0.188, v_num=0, train/loss_simple_step=0.709, train/loss_vlb_step=0.0285, train/loss_step=0.709, global_step=4598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]     Epoch 15:  23%|██▎       | 274/1208 [07:24<25:15,  1.62s/it, loss=0.188, v_num=0, train/loss_simple_step=0.709, train/loss_vlb_step=0.0285, train/loss_step=0.709, global_step=4598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  23%|██▎       | 274/1208 [07:24<25:15,  1.62s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.88e-5, train/loss_step=0.0164, global_step=4598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  23%|██▎       | 275/1208 [07:25<25:11,  1.62s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.88e-5, train/loss_step=0.0164, global_step=4598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  23%|██▎       | 275/1208 [07:25<25:11,  1.62s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00762, train/loss_vlb_step=3.73e-5, train/loss_step=0.00762, global_step=4598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  23%|██▎       | 276/1208 [07:28<25:14,  1.62s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00762, train/loss_vlb_step=3.73e-5, train/loss_step=0.00762, global_step=4598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  23%|██▎       | 276/1208 [07:28<25:14,  1.62s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000119, train/loss_step=0.0304, global_step=4598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  23%|██▎       | 277/1208 [07:29<25:10,  1.62s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000119, train/loss_step=0.0304, global_step=4598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  23%|██▎       | 277/1208 [07:29<25:10,  1.62s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.55e-5, train/loss_step=0.0102, global_step=4599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  23%|██▎       | 278/1208 [07:30<25:07,  1.62s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.55e-5, train/loss_step=0.0102, global_step=4599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  23%|██▎       | 278/1208 [07:30<25:07,  1.62s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0713, train/loss_vlb_step=0.000243, train/loss_step=0.0713, global_step=4599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  23%|██▎       | 279/1208 [07:31<25:03,  1.62s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0713, train/loss_vlb_step=0.000243, train/loss_step=0.0713, global_step=4599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  23%|██▎       | 279/1208 [07:31<25:03,  1.62s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0566, train/loss_vlb_step=0.000191, train/loss_step=0.0566, global_step=4599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  23%|██▎       | 280/1208 [07:34<25:05,  1.62s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0566, train/loss_vlb_step=0.000191, train/loss_step=0.0566, global_step=4599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  23%|██▎       | 280/1208 [07:34<25:05,  1.62s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.000169, train/loss_step=0.0485, global_step=4599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  23%|██▎       | 281/1208 [07:35<25:02,  1.62s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.000169, train/loss_step=0.0485, global_step=4599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  23%|██▎       | 281/1208 [07:35<25:02,  1.62s/it, loss=0.155, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00114, train/loss_step=0.259, global_step=4600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  23%|██▎       | 282/1208 [07:36<24:58,  1.62s/it, loss=0.155, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00114, train/loss_step=0.259, global_step=4600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  23%|██▎       | 282/1208 [07:36<24:58,  1.62s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=3.33e-5, train/loss_step=0.00677, global_step=4600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  23%|██▎       | 283/1208 [07:37<24:55,  1.62s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=3.33e-5, train/loss_step=0.00677, global_step=4600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  23%|██▎       | 283/1208 [07:37<24:55,  1.62s/it, loss=0.136, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.0024, train/loss_step=0.396, global_step=4600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]     Epoch 15:  24%|██▎       | 284/1208 [07:40<24:57,  1.62s/it, loss=0.136, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.0024, train/loss_step=0.396, global_step=4600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  24%|██▎       | 284/1208 [07:40<24:57,  1.62s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.000272, train/loss_step=0.0817, global_step=4600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  24%|██▎       | 285/1208 [07:41<24:54,  1.62s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.000272, train/loss_step=0.0817, global_step=4600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  24%|██▎       | 285/1208 [07:41<24:54,  1.62s/it, loss=0.127, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.000226, train/loss_step=0.067, global_step=4601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  24%|██▎       | 286/1208 [07:42<24:50,  1.62s/it, loss=0.127, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.000226, train/loss_step=0.067, global_step=4601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  24%|██▎       | 286/1208 [07:42<24:50,  1.62s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000143, train/loss_step=0.0386, global_step=4601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  24%|██▍       | 287/1208 [07:43<24:46,  1.61s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000143, train/loss_step=0.0386, global_step=4601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  24%|██▍       | 287/1208 [07:43<24:46,  1.61s/it, loss=0.115, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.0021, train/loss_step=0.346, global_step=4601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  24%|██▍       | 288/1208 [07:46<24:49,  1.62s/it, loss=0.115, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.0021, train/loss_step=0.346, global_step=4601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  24%|██▍       | 288/1208 [07:46<24:49,  1.62s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.61e-5, train/loss_step=0.0101, global_step=4601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  24%|██▍       | 289/1208 [07:47<24:45,  1.62s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.61e-5, train/loss_step=0.0101, global_step=4601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  24%|██▍       | 289/1208 [07:47<24:45,  1.62s/it, loss=0.118, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000542, train/loss_step=0.161, global_step=4602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  24%|██▍       | 290/1208 [07:48<24:42,  1.61s/it, loss=0.118, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000542, train/loss_step=0.161, global_step=4602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  24%|██▍       | 290/1208 [07:48<24:42,  1.61s/it, loss=0.13, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00107, train/loss_step=0.253, global_step=4602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  24%|██▍       | 291/1208 [07:49<24:38,  1.61s/it, loss=0.13, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00107, train/loss_step=0.253, global_step=4602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  24%|██▍       | 291/1208 [07:49<24:38,  1.61s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000129, train/loss_step=0.0348, global_step=4602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  24%|██▍       | 292/1208 [07:52<24:41,  1.62s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000129, train/loss_step=0.0348, global_step=4602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  24%|██▍       | 292/1208 [07:52<24:41,  1.62s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0069, train/loss_vlb_step=3.48e-5, train/loss_step=0.0069, global_step=4602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  24%|██▍       | 293/1208 [07:53<24:37,  1.61s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0069, train/loss_vlb_step=3.48e-5, train/loss_step=0.0069, global_step=4602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  24%|██▍       | 293/1208 [07:53<24:37,  1.61s/it, loss=0.0952, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=1.04e-5, train/loss_step=0.00177, global_step=4603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  24%|██▍       | 294/1208 [07:54<24:34,  1.61s/it, loss=0.0952, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=1.04e-5, train/loss_step=0.00177, global_step=4603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  24%|██▍       | 294/1208 [07:54<24:34,  1.61s/it, loss=0.101, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000448, train/loss_step=0.136, global_step=4603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  24%|██▍       | 295/1208 [07:55<24:30,  1.61s/it, loss=0.101, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000448, train/loss_step=0.136, global_step=4603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  24%|██▍       | 295/1208 [07:55<24:30,  1.61s/it, loss=0.119, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.00237, train/loss_step=0.360, global_step=4603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  25%|██▍       | 296/1208 [07:58<24:32,  1.61s/it, loss=0.119, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.00237, train/loss_step=0.360, global_step=4603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  25%|██▍       | 296/1208 [07:58<24:32,  1.61s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000186, train/loss_step=0.0525, global_step=4603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  25%|██▍       | 297/1208 [07:59<24:29,  1.61s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000186, train/loss_step=0.0525, global_step=4603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  25%|██▍       | 297/1208 [07:59<24:29,  1.61s/it, loss=0.137, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00172, train/loss_step=0.353, global_step=4604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  25%|██▍       | 298/1208 [08:00<24:25,  1.61s/it, loss=0.137, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00172, train/loss_step=0.353, global_step=4604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  25%|██▍       | 298/1208 [08:00<24:26,  1.61s/it, loss=0.139, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=4604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  25%|██▍       | 299/1208 [08:01<24:22,  1.61s/it, loss=0.139, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=4604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  25%|██▍       | 299/1208 [08:01<24:22,  1.61s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0834, train/loss_vlb_step=0.000278, train/loss_step=0.0834, global_step=4604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  25%|██▍       | 300/1208 [08:03<24:24,  1.61s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0834, train/loss_vlb_step=0.000278, train/loss_step=0.0834, global_step=4604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  25%|██▍       | 300/1208 [08:03<24:24,  1.61s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0397, train/loss_vlb_step=0.000146, train/loss_step=0.0397, global_step=4604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] 
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.86it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.84it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:25,  1.85it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.85it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.84it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.84it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.84it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.84it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.84it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.84it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.85it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.84it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.85it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.84it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.84it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.85it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.85it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.85it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.82it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.84it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.84it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.85it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.85it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.84it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.84it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:18,  1.84it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:18,  1.84it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.84it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.84it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.84it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.84it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.84it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.84it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s][ADDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.83it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.83it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.78it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.78it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.81it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.78it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.78it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.77it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.80it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.79it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.75it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.75it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]Epoch 15:  25%|██▍       | 301/1208 [08:34<25:50,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0397, train/loss_vlb_step=0.000146, train/loss_step=0.0397, global_step=4604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  25%|██▍       | 301/1208 [08:34<25:50,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0518, train/loss_vlb_step=0.00018, train/loss_step=0.0518, global_step=4605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  25%|██▌       | 302/1208 [08:35<25:46,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0518, train/loss_vlb_step=0.00018, train/loss_step=0.0518, global_step=4605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  25%|██▌       | 302/1208 [08:35<25:46,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=1.8e-5, train/loss_step=0.00308, global_step=4605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  25%|██▌       | 303/1208 [08:36<25:42,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=1.8e-5, train/loss_step=0.00308, global_step=4605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  25%|██▌       | 303/1208 [08:36<25:42,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00287, train/loss_vlb_step=1.61e-5, train/loss_step=0.00287, global_step=4605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  25%|██▌       | 304/1208 [08:39<25:45,  1.71s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00287, train/loss_vlb_step=1.61e-5, train/loss_step=0.00287, global_step=4605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  25%|██▌       | 304/1208 [08:39<25:45,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.36e-5, train/loss_step=0.0219, global_step=4605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  25%|██▌       | 305/1208 [08:40<25:41,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.36e-5, train/loss_step=0.0219, global_step=4605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  25%|██▌       | 305/1208 [08:40<25:41,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0554, train/loss_vlb_step=0.000195, train/loss_step=0.0554, global_step=4606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  25%|██▌       | 306/1208 [08:41<25:37,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0554, train/loss_vlb_step=0.000195, train/loss_step=0.0554, global_step=4606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  25%|██▌       | 306/1208 [08:41<25:37,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000421, train/loss_step=0.128, global_step=4606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  25%|██▌       | 307/1208 [08:42<25:34,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000421, train/loss_step=0.128, global_step=4606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  25%|██▌       | 307/1208 [08:42<25:34,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00518, train/loss_step=0.476, global_step=4606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  25%|██▌       | 308/1208 [08:45<25:36,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00518, train/loss_step=0.476, global_step=4606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  25%|██▌       | 308/1208 [08:45<25:36,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.24e-5, train/loss_step=0.0147, global_step=4606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  26%|██▌       | 309/1208 [08:46<25:33,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.24e-5, train/loss_step=0.0147, global_step=4606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  26%|██▌       | 309/1208 [08:46<25:33,  1.71s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0983, train/loss_vlb_step=0.000323, train/loss_step=0.0983, global_step=4607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  26%|██▌       | 310/1208 [08:48<25:29,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0983, train/loss_vlb_step=0.000323, train/loss_step=0.0983, global_step=4607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  26%|██▌       | 310/1208 [08:48<25:29,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00432, train/loss_step=0.427, global_step=4607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  26%|██▌       | 311/1208 [08:49<25:25,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00432, train/loss_step=0.427, global_step=4607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  26%|██▌       | 311/1208 [08:49<25:25,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.000169, train/loss_step=0.0476, global_step=4607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  26%|██▌       | 312/1208 [08:52<25:28,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.000169, train/loss_step=0.0476, global_step=4607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  26%|██▌       | 312/1208 [08:52<25:28,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.17e-5, train/loss_step=0.0172, global_step=4607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  26%|██▌       | 313/1208 [08:53<25:25,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.17e-5, train/loss_step=0.0172, global_step=4607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  26%|██▌       | 313/1208 [08:53<25:25,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0657, train/loss_vlb_step=0.000223, train/loss_step=0.0657, global_step=4608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  26%|██▌       | 314/1208 [08:54<25:21,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0657, train/loss_vlb_step=0.000223, train/loss_step=0.0657, global_step=4608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  26%|██▌       | 314/1208 [08:54<25:21,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.68e-5, train/loss_step=0.0157, global_step=4608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  26%|██▌       | 315/1208 [08:55<25:18,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.68e-5, train/loss_step=0.0157, global_step=4608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  26%|██▌       | 315/1208 [08:55<25:18,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000832, train/loss_step=0.230, global_step=4608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  26%|██▌       | 316/1208 [08:58<25:20,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000832, train/loss_step=0.230, global_step=4608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  26%|██▌       | 316/1208 [08:58<25:20,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000485, train/loss_step=0.141, global_step=4608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  26%|██▌       | 317/1208 [08:59<25:17,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000485, train/loss_step=0.141, global_step=4608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  26%|██▌       | 317/1208 [08:59<25:17,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.0017, train/loss_step=0.326, global_step=4609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  26%|██▋       | 318/1208 [09:00<25:13,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.0017, train/loss_step=0.326, global_step=4609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  26%|██▋       | 318/1208 [09:00<25:13,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00778, train/loss_vlb_step=3.92e-5, train/loss_step=0.00778, global_step=4609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  26%|██▋       | 319/1208 [09:01<25:10,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00778, train/loss_vlb_step=3.92e-5, train/loss_step=0.00778, global_step=4609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  26%|██▋       | 319/1208 [09:01<25:10,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000346, train/loss_step=0.103, global_step=4609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  26%|██▋       | 320/1208 [09:05<25:12,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000346, train/loss_step=0.103, global_step=4609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  26%|██▋       | 320/1208 [09:05<25:12,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0892, train/loss_vlb_step=0.000293, train/loss_step=0.0892, global_step=4609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  27%|██▋       | 321/1208 [09:06<25:09,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0892, train/loss_vlb_step=0.000293, train/loss_step=0.0892, global_step=4609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  27%|██▋       | 321/1208 [09:06<25:09,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=1.66e-5, train/loss_step=0.00298, global_step=4610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  27%|██▋       | 322/1208 [09:07<25:06,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=1.66e-5, train/loss_step=0.00298, global_step=4610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  27%|██▋       | 322/1208 [09:07<25:06,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000579, train/loss_step=0.172, global_step=4610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  27%|██▋       | 323/1208 [09:08<25:02,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000579, train/loss_step=0.172, global_step=4610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  27%|██▋       | 323/1208 [09:08<25:02,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000414, train/loss_step=0.125, global_step=4610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  27%|██▋       | 324/1208 [09:11<25:04,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000414, train/loss_step=0.125, global_step=4610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  27%|██▋       | 324/1208 [09:11<25:04,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0574, train/loss_vlb_step=0.000199, train/loss_step=0.0574, global_step=4610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  27%|██▋       | 325/1208 [09:12<25:01,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0574, train/loss_vlb_step=0.000199, train/loss_step=0.0574, global_step=4610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  27%|██▋       | 325/1208 [09:12<25:01,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00652, train/loss_vlb_step=3.32e-5, train/loss_step=0.00652, global_step=4611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  27%|██▋       | 326/1208 [09:13<24:58,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00652, train/loss_vlb_step=3.32e-5, train/loss_step=0.00652, global_step=4611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  27%|██▋       | 326/1208 [09:13<24:58,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000179, train/loss_step=0.0514, global_step=4611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  27%|██▋       | 327/1208 [09:14<24:54,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000179, train/loss_step=0.0514, global_step=4611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  27%|██▋       | 327/1208 [09:14<24:54,  1.70s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.28e-5, train/loss_step=0.0022, global_step=4611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  27%|██▋       | 328/1208 [09:18<24:57,  1.70s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.28e-5, train/loss_step=0.0022, global_step=4611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  27%|██▋       | 328/1208 [09:18<24:57,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000714, train/loss_step=0.196, global_step=4611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  27%|██▋       | 329/1208 [09:19<24:53,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000714, train/loss_step=0.196, global_step=4611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  27%|██▋       | 329/1208 [09:19<24:53,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.7e-5, train/loss_step=0.00311, global_step=4612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  27%|██▋       | 330/1208 [09:20<24:50,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.7e-5, train/loss_step=0.00311, global_step=4612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  27%|██▋       | 330/1208 [09:20<24:50,  1.70s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.000966, train/loss_step=0.256, global_step=4612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  27%|██▋       | 331/1208 [09:21<24:46,  1.70s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.000966, train/loss_step=0.256, global_step=4612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  27%|██▋       | 331/1208 [09:21<24:46,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000849, train/loss_step=0.213, global_step=4612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  27%|██▋       | 332/1208 [09:24<24:49,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000849, train/loss_step=0.213, global_step=4612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  27%|██▋       | 332/1208 [09:24<24:49,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.51e-5, train/loss_step=0.020, global_step=4612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  28%|██▊       | 333/1208 [09:25<24:45,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.51e-5, train/loss_step=0.020, global_step=4612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  28%|██▊       | 333/1208 [09:25<24:45,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.431, train/loss_vlb_step=0.00336, train/loss_step=0.431, global_step=4613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  28%|██▊       | 334/1208 [09:26<24:42,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.431, train/loss_vlb_step=0.00336, train/loss_step=0.431, global_step=4613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  28%|██▊       | 334/1208 [09:26<24:42,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0366, train/loss_vlb_step=0.000138, train/loss_step=0.0366, global_step=4613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  28%|██▊       | 335/1208 [09:27<24:39,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0366, train/loss_vlb_step=0.000138, train/loss_step=0.0366, global_step=4613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  28%|██▊       | 335/1208 [09:27<24:39,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000355, train/loss_step=0.107, global_step=4613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  28%|██▊       | 336/1208 [09:30<24:41,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000355, train/loss_step=0.107, global_step=4613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  28%|██▊       | 336/1208 [09:30<24:41,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000461, train/loss_step=0.140, global_step=4613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  28%|██▊       | 337/1208 [09:31<24:37,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000461, train/loss_step=0.140, global_step=4613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  28%|██▊       | 337/1208 [09:31<24:37,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0809, train/loss_vlb_step=0.000269, train/loss_step=0.0809, global_step=4614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  28%|██▊       | 338/1208 [09:32<24:34,  1.69s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0809, train/loss_vlb_step=0.000269, train/loss_step=0.0809, global_step=4614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  28%|██▊       | 338/1208 [09:32<24:34,  1.69s/it, loss=0.114, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000629, train/loss_step=0.179, global_step=4614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  28%|██▊       | 339/1208 [09:33<24:31,  1.69s/it, loss=0.114, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000629, train/loss_step=0.179, global_step=4614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  28%|██▊       | 339/1208 [09:33<24:31,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.488, train/loss_vlb_step=0.00611, train/loss_step=0.488, global_step=4614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  28%|██▊       | 340/1208 [09:37<24:33,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.488, train/loss_vlb_step=0.00611, train/loss_step=0.488, global_step=4614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  28%|██▊       | 340/1208 [09:37<24:33,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=4614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  28%|██▊       | 341/1208 [09:38<24:30,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=4614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  28%|██▊       | 341/1208 [09:38<24:30,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=1.1e-5, train/loss_step=0.00185, global_step=4615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  28%|██▊       | 342/1208 [09:39<24:26,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=1.1e-5, train/loss_step=0.00185, global_step=4615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  28%|██▊       | 342/1208 [09:39<24:26,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0913, train/loss_vlb_step=0.0003, train/loss_step=0.0913, global_step=4615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  28%|██▊       | 343/1208 [09:40<24:23,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0913, train/loss_vlb_step=0.0003, train/loss_step=0.0913, global_step=4615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  28%|██▊       | 343/1208 [09:40<24:23,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000537, train/loss_step=0.158, global_step=4615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  28%|██▊       | 344/1208 [09:43<24:25,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000537, train/loss_step=0.158, global_step=4615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  28%|██▊       | 344/1208 [09:43<24:25,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.683, train/loss_vlb_step=0.050, train/loss_step=0.683, global_step=4615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  29%|██▊       | 345/1208 [09:44<24:22,  1.69s/it, loss=0.162, v_num=0, train/loss_simple_step=0.683, train/loss_vlb_step=0.050, train/loss_step=0.683, global_step=4615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  29%|██▊       | 345/1208 [09:44<24:22,  1.69s/it, loss=0.195, v_num=0, train/loss_simple_step=0.658, train/loss_vlb_step=0.0205, train/loss_step=0.658, global_step=4616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  29%|██▊       | 346/1208 [09:45<24:18,  1.69s/it, loss=0.195, v_num=0, train/loss_simple_step=0.658, train/loss_vlb_step=0.0205, train/loss_step=0.658, global_step=4616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  29%|██▊       | 346/1208 [09:45<24:18,  1.69s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0974, train/loss_vlb_step=0.000321, train/loss_step=0.0974, global_step=4616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  29%|██▊       | 347/1208 [09:46<24:15,  1.69s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0974, train/loss_vlb_step=0.000321, train/loss_step=0.0974, global_step=4616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  29%|██▊       | 347/1208 [09:46<24:15,  1.69s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0996, train/loss_vlb_step=0.000327, train/loss_step=0.0996, global_step=4616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  29%|██▉       | 348/1208 [09:49<24:16,  1.69s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0996, train/loss_vlb_step=0.000327, train/loss_step=0.0996, global_step=4616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  29%|██▉       | 348/1208 [09:49<24:16,  1.69s/it, loss=0.225, v_num=0, train/loss_simple_step=0.644, train/loss_vlb_step=0.0304, train/loss_step=0.644, global_step=4616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  29%|██▉       | 349/1208 [09:50<24:13,  1.69s/it, loss=0.225, v_num=0, train/loss_simple_step=0.644, train/loss_vlb_step=0.0304, train/loss_step=0.644, global_step=4616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  29%|██▉       | 349/1208 [09:50<24:13,  1.69s/it, loss=0.226, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000102, train/loss_step=0.0258, global_step=4617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  29%|██▉       | 350/1208 [09:51<24:09,  1.69s/it, loss=0.226, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000102, train/loss_step=0.0258, global_step=4617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  29%|██▉       | 350/1208 [09:51<24:09,  1.69s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0739, train/loss_vlb_step=0.000248, train/loss_step=0.0739, global_step=4617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  29%|██▉       | 351/1208 [09:52<24:06,  1.69s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0739, train/loss_vlb_step=0.000248, train/loss_step=0.0739, global_step=4617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  29%|██▉       | 351/1208 [09:52<24:06,  1.69s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.000136, train/loss_step=0.0362, global_step=4617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  29%|██▉       | 352/1208 [09:55<24:07,  1.69s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.000136, train/loss_step=0.0362, global_step=4617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  29%|██▉       | 352/1208 [09:55<24:07,  1.69s/it, loss=0.224, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00234, train/loss_step=0.348, global_step=4617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  29%|██▉       | 353/1208 [09:56<24:04,  1.69s/it, loss=0.224, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00234, train/loss_step=0.348, global_step=4617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  29%|██▉       | 353/1208 [09:56<24:04,  1.69s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.92e-5, train/loss_step=0.0107, global_step=4618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  29%|██▉       | 354/1208 [09:57<24:01,  1.69s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.92e-5, train/loss_step=0.0107, global_step=4618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  29%|██▉       | 354/1208 [09:57<24:01,  1.69s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000134, train/loss_step=0.0364, global_step=4618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  29%|██▉       | 355/1208 [09:58<23:57,  1.69s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000134, train/loss_step=0.0364, global_step=4618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  29%|██▉       | 355/1208 [09:58<23:57,  1.69s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.04e-5, train/loss_step=0.0228, global_step=4618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  29%|██▉       | 356/1208 [10:01<23:58,  1.69s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.04e-5, train/loss_step=0.0228, global_step=4618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  29%|██▉       | 356/1208 [10:01<23:58,  1.69s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.49e-5, train/loss_step=0.00475, global_step=4618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  30%|██▉       | 357/1208 [10:02<23:55,  1.69s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.49e-5, train/loss_step=0.00475, global_step=4618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  30%|██▉       | 357/1208 [10:02<23:55,  1.69s/it, loss=0.193, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=4619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  30%|██▉       | 358/1208 [10:03<23:52,  1.69s/it, loss=0.193, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=4619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  30%|██▉       | 358/1208 [10:03<23:52,  1.69s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.000229, train/loss_step=0.0672, global_step=4619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  30%|██▉       | 359/1208 [10:04<23:49,  1.68s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.000229, train/loss_step=0.0672, global_step=4619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  30%|██▉       | 359/1208 [10:04<23:49,  1.68s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.000231, train/loss_step=0.0702, global_step=4619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  30%|██▉       | 360/1208 [10:07<23:50,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.000231, train/loss_step=0.0702, global_step=4619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  30%|██▉       | 360/1208 [10:07<23:50,  1.69s/it, loss=0.177, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00174, train/loss_step=0.310, global_step=4619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  30%|██▉       | 361/1208 [10:08<23:47,  1.68s/it, loss=0.177, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00174, train/loss_step=0.310, global_step=4619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  30%|██▉       | 361/1208 [10:08<23:47,  1.68s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000177, train/loss_step=0.0474, global_step=4620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  30%|██▉       | 362/1208 [10:09<23:43,  1.68s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000177, train/loss_step=0.0474, global_step=4620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  30%|██▉       | 362/1208 [10:09<23:43,  1.68s/it, loss=0.186, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000829, train/loss_step=0.214, global_step=4620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  30%|███       | 363/1208 [10:10<23:40,  1.68s/it, loss=0.186, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000829, train/loss_step=0.214, global_step=4620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  30%|███       | 363/1208 [10:10<23:40,  1.68s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0572, train/loss_vlb_step=0.000193, train/loss_step=0.0572, global_step=4620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  30%|███       | 364/1208 [10:13<23:41,  1.68s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0572, train/loss_vlb_step=0.000193, train/loss_step=0.0572, global_step=4620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  30%|███       | 364/1208 [10:13<23:41,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0054, train/loss_vlb_step=2.77e-5, train/loss_step=0.0054, global_step=4620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  30%|███       | 365/1208 [10:14<23:38,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0054, train/loss_vlb_step=2.77e-5, train/loss_step=0.0054, global_step=4620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  30%|███       | 365/1208 [10:14<23:38,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.518, train/loss_vlb_step=0.0066, train/loss_step=0.518, global_step=4621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  30%|███       | 366/1208 [10:15<23:35,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.518, train/loss_vlb_step=0.0066, train/loss_step=0.518, global_step=4621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  30%|███       | 366/1208 [10:15<23:35,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000406, train/loss_step=0.122, global_step=4621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  30%|███       | 367/1208 [10:16<23:31,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000406, train/loss_step=0.122, global_step=4621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  30%|███       | 367/1208 [10:16<23:31,  1.68s/it, loss=0.171, v_num=0, train/loss_simple_step=0.698, train/loss_vlb_step=0.0303, train/loss_step=0.698, global_step=4621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  30%|███       | 368/1208 [10:19<23:32,  1.68s/it, loss=0.171, v_num=0, train/loss_simple_step=0.698, train/loss_vlb_step=0.0303, train/loss_step=0.698, global_step=4621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  30%|███       | 368/1208 [10:19<23:33,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.41e-5, train/loss_step=0.0203, global_step=4621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  31%|███       | 369/1208 [10:20<23:29,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.41e-5, train/loss_step=0.0203, global_step=4621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  31%|███       | 369/1208 [10:20<23:29,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.61e-5, train/loss_step=0.0126, global_step=4622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  31%|███       | 370/1208 [10:21<23:26,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.61e-5, train/loss_step=0.0126, global_step=4622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  31%|███       | 370/1208 [10:21<23:26,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00151, train/loss_step=0.343, global_step=4622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  31%|███       | 371/1208 [10:22<23:23,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00151, train/loss_step=0.343, global_step=4622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  31%|███       | 371/1208 [10:22<23:23,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000145, train/loss_step=0.0405, global_step=4622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  31%|███       | 372/1208 [10:24<23:24,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000145, train/loss_step=0.0405, global_step=4622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  31%|███       | 372/1208 [10:24<23:24,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.66e-5, train/loss_step=0.0127, global_step=4622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  31%|███       | 373/1208 [10:25<23:21,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.66e-5, train/loss_step=0.0127, global_step=4622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  31%|███       | 373/1208 [10:25<23:21,  1.68s/it, loss=0.162, v_num=0, train/loss_simple_step=0.522, train/loss_vlb_step=0.00877, train/loss_step=0.522, global_step=4623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  31%|███       | 374/1208 [10:26<23:18,  1.68s/it, loss=0.162, v_num=0, train/loss_simple_step=0.522, train/loss_vlb_step=0.00877, train/loss_step=0.522, global_step=4623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  31%|███       | 374/1208 [10:26<23:18,  1.68s/it, loss=0.166, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000416, train/loss_step=0.126, global_step=4623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  31%|███       | 375/1208 [10:27<23:14,  1.67s/it, loss=0.166, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000416, train/loss_step=0.126, global_step=4623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  31%|███       | 375/1208 [10:27<23:14,  1.67s/it, loss=0.197, v_num=0, train/loss_simple_step=0.638, train/loss_vlb_step=0.017, train/loss_step=0.638, global_step=4623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  31%|███       | 376/1208 [10:30<23:15,  1.68s/it, loss=0.197, v_num=0, train/loss_simple_step=0.638, train/loss_vlb_step=0.017, train/loss_step=0.638, global_step=4623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  31%|███       | 376/1208 [10:30<23:15,  1.68s/it, loss=0.203, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000449, train/loss_step=0.135, global_step=4623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  31%|███       | 377/1208 [10:31<23:12,  1.68s/it, loss=0.203, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000449, train/loss_step=0.135, global_step=4623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  31%|███       | 377/1208 [10:31<23:12,  1.68s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=1.79e-5, train/loss_step=0.00315, global_step=4624.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  31%|███▏      | 378/1208 [10:32<23:09,  1.67s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=1.79e-5, train/loss_step=0.00315, global_step=4624.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  31%|███▏      | 378/1208 [10:32<23:09,  1.67s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00569, train/loss_vlb_step=3e-5, train/loss_step=0.00569, global_step=4624.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  31%|███▏      | 379/1208 [10:33<23:06,  1.67s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00569, train/loss_vlb_step=3e-5, train/loss_step=0.00569, global_step=4624.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  31%|███▏      | 379/1208 [10:33<23:06,  1.67s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0377, train/loss_vlb_step=0.000142, train/loss_step=0.0377, global_step=4624.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  31%|███▏      | 380/1208 [10:36<23:07,  1.68s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0377, train/loss_vlb_step=0.000142, train/loss_step=0.0377, global_step=4624.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  31%|███▏      | 380/1208 [10:36<23:07,  1.68s/it, loss=0.204, v_num=0, train/loss_simple_step=0.528, train/loss_vlb_step=0.00519, train/loss_step=0.528, global_step=4624.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  32%|███▏      | 381/1208 [10:37<23:04,  1.67s/it, loss=0.204, v_num=0, train/loss_simple_step=0.528, train/loss_vlb_step=0.00519, train/loss_step=0.528, global_step=4624.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  32%|███▏      | 381/1208 [10:37<23:04,  1.67s/it, loss=0.207, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=4625.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  32%|███▏      | 382/1208 [10:38<23:01,  1.67s/it, loss=0.207, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=4625.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  32%|███▏      | 382/1208 [10:38<23:01,  1.67s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.000159, train/loss_step=0.0417, global_step=4625.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  32%|███▏      | 383/1208 [10:39<22:58,  1.67s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.000159, train/loss_step=0.0417, global_step=4625.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  32%|███▏      | 383/1208 [10:39<22:58,  1.67s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000178, train/loss_step=0.0525, global_step=4625.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  32%|███▏      | 384/1208 [10:42<22:59,  1.67s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000178, train/loss_step=0.0525, global_step=4625.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  32%|███▏      | 384/1208 [10:42<22:59,  1.67s/it, loss=0.22, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00295, train/loss_step=0.425, global_step=4625.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  32%|███▏      | 385/1208 [10:43<22:56,  1.67s/it, loss=0.22, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00295, train/loss_step=0.425, global_step=4625.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  32%|███▏      | 385/1208 [10:43<22:56,  1.67s/it, loss=0.194, v_num=0, train/loss_simple_step=0.00731, train/loss_vlb_step=3.58e-5, train/loss_step=0.00731, global_step=4626.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  32%|███▏      | 386/1208 [10:44<22:52,  1.67s/it, loss=0.194, v_num=0, train/loss_simple_step=0.00731, train/loss_vlb_step=3.58e-5, train/loss_step=0.00731, global_step=4626.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  32%|███▏      | 386/1208 [10:44<22:52,  1.67s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0834, train/loss_vlb_step=0.000281, train/loss_step=0.0834, global_step=4626.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  32%|███▏      | 387/1208 [10:45<22:49,  1.67s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0834, train/loss_vlb_step=0.000281, train/loss_step=0.0834, global_step=4626.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  32%|███▏      | 387/1208 [10:45<22:49,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.63e-5, train/loss_step=0.00285, global_step=4626.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  32%|███▏      | 388/1208 [10:48<22:50,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.63e-5, train/loss_step=0.00285, global_step=4626.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  32%|███▏      | 388/1208 [10:48<22:50,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00386, train/loss_vlb_step=2.07e-5, train/loss_step=0.00386, global_step=4626.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  32%|███▏      | 389/1208 [10:49<22:47,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00386, train/loss_vlb_step=2.07e-5, train/loss_step=0.00386, global_step=4626.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  32%|███▏      | 389/1208 [10:49<22:47,  1.67s/it, loss=0.172, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00191, train/loss_step=0.326, global_step=4627.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  32%|███▏      | 390/1208 [10:50<22:44,  1.67s/it, loss=0.172, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00191, train/loss_step=0.326, global_step=4627.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  32%|███▏      | 390/1208 [10:50<22:44,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00667, train/loss_vlb_step=3.32e-5, train/loss_step=0.00667, global_step=4627.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  32%|███▏      | 391/1208 [10:51<22:41,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00667, train/loss_vlb_step=3.32e-5, train/loss_step=0.00667, global_step=4627.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  32%|███▏      | 391/1208 [10:51<22:41,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=7.85e-5, train/loss_step=0.0189, global_step=4627.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  32%|███▏      | 392/1208 [10:54<22:42,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=7.85e-5, train/loss_step=0.0189, global_step=4627.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  32%|███▏      | 392/1208 [10:54<22:42,  1.67s/it, loss=0.159, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=4627.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  33%|███▎      | 393/1208 [10:55<22:39,  1.67s/it, loss=0.159, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=4627.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  33%|███▎      | 393/1208 [10:55<22:39,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000428, train/loss_step=0.129, global_step=4628.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  33%|███▎      | 394/1208 [10:56<22:36,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000428, train/loss_step=0.129, global_step=4628.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  33%|███▎      | 394/1208 [10:56<22:36,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.000154, train/loss_step=0.0418, global_step=4628.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  33%|███▎      | 395/1208 [10:57<22:33,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.000154, train/loss_step=0.0418, global_step=4628.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  33%|███▎      | 395/1208 [10:57<22:33,  1.66s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=2.17e-5, train/loss_step=0.00381, global_step=4628.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  33%|███▎      | 396/1208 [11:00<22:34,  1.67s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=2.17e-5, train/loss_step=0.00381, global_step=4628.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  33%|███▎      | 396/1208 [11:00<22:34,  1.67s/it, loss=0.107, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000729, train/loss_step=0.201, global_step=4628.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  33%|███▎      | 397/1208 [11:01<22:31,  1.67s/it, loss=0.107, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000729, train/loss_step=0.201, global_step=4628.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  33%|███▎      | 397/1208 [11:01<22:31,  1.67s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000103, train/loss_step=0.0254, global_step=4629.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  33%|███▎      | 398/1208 [11:02<22:28,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000103, train/loss_step=0.0254, global_step=4629.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  33%|███▎      | 398/1208 [11:02<22:28,  1.66s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.59e-5, train/loss_step=0.0179, global_step=4629.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  33%|███▎      | 399/1208 [11:03<22:25,  1.66s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.59e-5, train/loss_step=0.0179, global_step=4629.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  33%|███▎      | 399/1208 [11:03<22:25,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.538, train/loss_vlb_step=0.00816, train/loss_step=0.538, global_step=4629.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  33%|███▎      | 400/1208 [11:06<22:26,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.538, train/loss_vlb_step=0.00816, train/loss_step=0.538, global_step=4629.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  33%|███▎      | 400/1208 [11:06<22:26,  1.67s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00353, train/loss_vlb_step=1.87e-5, train/loss_step=0.00353, global_step=4629.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  33%|███▎      | 401/1208 [11:07<22:23,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00353, train/loss_vlb_step=1.87e-5, train/loss_step=0.00353, global_step=4629.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  33%|███▎      | 401/1208 [11:07<22:23,  1.66s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0079, train/loss_vlb_step=3.9e-5, train/loss_step=0.0079, global_step=4630.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  33%|███▎      | 402/1208 [11:08<22:20,  1.66s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0079, train/loss_vlb_step=3.9e-5, train/loss_step=0.0079, global_step=4630.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  33%|███▎      | 402/1208 [11:08<22:20,  1.66s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.05e-5, train/loss_step=0.0137, global_step=4630.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  33%|███▎      | 403/1208 [11:09<22:17,  1.66s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.05e-5, train/loss_step=0.0137, global_step=4630.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  33%|███▎      | 403/1208 [11:09<22:17,  1.66s/it, loss=0.107, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000568, train/loss_step=0.160, global_step=4630.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  33%|███▎      | 404/1208 [11:12<22:17,  1.66s/it, loss=0.107, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000568, train/loss_step=0.160, global_step=4630.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  33%|███▎      | 404/1208 [11:12<22:17,  1.66s/it, loss=0.092, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.00046, train/loss_step=0.134, global_step=4630.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  34%|███▎      | 405/1208 [11:13<22:14,  1.66s/it, loss=0.092, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.00046, train/loss_step=0.134, global_step=4630.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  34%|███▎      | 405/1208 [11:13<22:14,  1.66s/it, loss=0.0918, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.62e-5, train/loss_step=0.00284, global_step=4631.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  34%|███▎      | 406/1208 [11:14<22:12,  1.66s/it, loss=0.0918, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.62e-5, train/loss_step=0.00284, global_step=4631.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  34%|███▎      | 406/1208 [11:14<22:12,  1.66s/it, loss=0.088, v_num=0, train/loss_simple_step=0.00881, train/loss_vlb_step=4.31e-5, train/loss_step=0.00881, global_step=4631.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  34%|███▎      | 407/1208 [11:15<22:09,  1.66s/it, loss=0.088, v_num=0, train/loss_simple_step=0.00881, train/loss_vlb_step=4.31e-5, train/loss_step=0.00881, global_step=4631.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  34%|███▎      | 407/1208 [11:15<22:09,  1.66s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.0722, train/loss_vlb_step=0.000245, train/loss_step=0.0722, global_step=4631.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  34%|███▍      | 408/1208 [11:18<22:09,  1.66s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.0722, train/loss_vlb_step=0.000245, train/loss_step=0.0722, global_step=4631.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  34%|███▍      | 408/1208 [11:18<22:09,  1.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.824, train/loss_vlb_step=0.139, train/loss_step=0.824, global_step=4631.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]      Epoch 15:  34%|███▍      | 409/1208 [11:19<22:06,  1.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.824, train/loss_vlb_step=0.139, train/loss_step=0.824, global_step=4631.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  34%|███▍      | 409/1208 [11:19<22:06,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.57e-5, train/loss_step=0.0104, global_step=4632.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  34%|███▍      | 410/1208 [11:20<22:04,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.57e-5, train/loss_step=0.0104, global_step=4632.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  34%|███▍      | 410/1208 [11:20<22:04,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.36e-5, train/loss_step=0.0122, global_step=4632.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  34%|███▍      | 411/1208 [11:21<22:01,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.36e-5, train/loss_step=0.0122, global_step=4632.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  34%|███▍      | 411/1208 [11:21<22:01,  1.66s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0511, train/loss_vlb_step=0.000177, train/loss_step=0.0511, global_step=4632.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  34%|███▍      | 412/1208 [11:24<22:01,  1.66s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0511, train/loss_vlb_step=0.000177, train/loss_step=0.0511, global_step=4632.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  34%|███▍      | 412/1208 [11:24<22:01,  1.66s/it, loss=0.137, v_num=0, train/loss_simple_step=0.484, train/loss_vlb_step=0.00553, train/loss_step=0.484, global_step=4632.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  34%|███▍      | 413/1208 [11:25<21:58,  1.66s/it, loss=0.137, v_num=0, train/loss_simple_step=0.484, train/loss_vlb_step=0.00553, train/loss_step=0.484, global_step=4632.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  34%|███▍      | 413/1208 [11:25<21:58,  1.66s/it, loss=0.137, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000443, train/loss_step=0.135, global_step=4633.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  34%|███▍      | 414/1208 [11:26<21:55,  1.66s/it, loss=0.137, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000443, train/loss_step=0.135, global_step=4633.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  34%|███▍      | 414/1208 [11:26<21:55,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=9.3e-5, train/loss_step=0.022, global_step=4633.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  34%|███▍      | 415/1208 [11:27<21:53,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=9.3e-5, train/loss_step=0.022, global_step=4633.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  34%|███▍      | 415/1208 [11:27<21:53,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000139, train/loss_step=0.0376, global_step=4633.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  34%|███▍      | 416/1208 [11:30<21:53,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000139, train/loss_step=0.0376, global_step=4633.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  34%|███▍      | 416/1208 [11:30<21:53,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.001, train/loss_step=0.229, global_step=4633.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]      Epoch 15:  35%|███▍      | 417/1208 [11:31<21:50,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.001, train/loss_step=0.229, global_step=4633.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  35%|███▍      | 417/1208 [11:31<21:50,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0371, train/loss_vlb_step=0.000138, train/loss_step=0.0371, global_step=4634.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  35%|███▍      | 418/1208 [11:32<21:47,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0371, train/loss_vlb_step=0.000138, train/loss_step=0.0371, global_step=4634.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  35%|███▍      | 418/1208 [11:32<21:47,  1.66s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0727, train/loss_vlb_step=0.000244, train/loss_step=0.0727, global_step=4634.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  35%|███▍      | 419/1208 [11:33<21:45,  1.65s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0727, train/loss_vlb_step=0.000244, train/loss_step=0.0727, global_step=4634.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  35%|███▍      | 419/1208 [11:33<21:45,  1.65s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=2.03e-5, train/loss_step=0.00349, global_step=4634.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  35%|███▍      | 420/1208 [11:35<21:45,  1.66s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=2.03e-5, train/loss_step=0.00349, global_step=4634.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  35%|███▍      | 420/1208 [11:35<21:45,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.78e-5, train/loss_step=0.015, global_step=4634.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  35%|███▍      | 421/1208 [11:36<21:42,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.78e-5, train/loss_step=0.015, global_step=4634.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  35%|███▍      | 421/1208 [11:36<21:42,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000111, train/loss_step=0.0287, global_step=4635.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  35%|███▍      | 422/1208 [11:37<21:40,  1.65s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000111, train/loss_step=0.0287, global_step=4635.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  35%|███▍      | 422/1208 [11:37<21:40,  1.65s/it, loss=0.123, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=4635.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  35%|███▌      | 423/1208 [11:39<21:37,  1.65s/it, loss=0.123, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=4635.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  35%|███▌      | 423/1208 [11:39<21:37,  1.65s/it, loss=0.125, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000687, train/loss_step=0.198, global_step=4635.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  35%|███▌      | 424/1208 [11:41<21:37,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000687, train/loss_step=0.198, global_step=4635.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  35%|███▌      | 424/1208 [11:41<21:37,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00108, train/loss_step=0.253, global_step=4635.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  35%|███▌      | 425/1208 [11:42<21:35,  1.65s/it, loss=0.131, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00108, train/loss_step=0.253, global_step=4635.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  35%|███▌      | 425/1208 [11:42<21:35,  1.65s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=9.93e-6, train/loss_step=0.00164, global_step=4636.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  35%|███▌      | 426/1208 [11:43<21:32,  1.65s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=9.93e-6, train/loss_step=0.00164, global_step=4636.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  35%|███▌      | 426/1208 [11:43<21:32,  1.65s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.18e-5, train/loss_step=0.0226, global_step=4636.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  35%|███▌      | 427/1208 [11:44<21:29,  1.65s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.18e-5, train/loss_step=0.0226, global_step=4636.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  35%|███▌      | 427/1208 [11:44<21:29,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000129, train/loss_step=0.0327, global_step=4636.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  35%|███▌      | 428/1208 [11:47<21:29,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000129, train/loss_step=0.0327, global_step=4636.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  35%|███▌      | 428/1208 [11:47<21:29,  1.65s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000706, train/loss_step=0.198, global_step=4636.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  36%|███▌      | 429/1208 [11:48<21:27,  1.65s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000706, train/loss_step=0.198, global_step=4636.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  36%|███▌      | 429/1208 [11:48<21:27,  1.65s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.92e-5, train/loss_step=0.0157, global_step=4637.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  36%|███▌      | 430/1208 [11:49<21:24,  1.65s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.92e-5, train/loss_step=0.0157, global_step=4637.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  36%|███▌      | 430/1208 [11:49<21:24,  1.65s/it, loss=0.107, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000624, train/loss_step=0.175, global_step=4637.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  36%|███▌      | 431/1208 [11:50<21:21,  1.65s/it, loss=0.107, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000624, train/loss_step=0.175, global_step=4637.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  36%|███▌      | 431/1208 [11:50<21:21,  1.65s/it, loss=0.114, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000768, train/loss_step=0.206, global_step=4637.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  36%|███▌      | 432/1208 [11:53<21:22,  1.65s/it, loss=0.114, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000768, train/loss_step=0.206, global_step=4637.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  36%|███▌      | 432/1208 [11:53<21:22,  1.65s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000337, train/loss_step=0.103, global_step=4637.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  36%|███▌      | 433/1208 [11:54<21:19,  1.65s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000337, train/loss_step=0.103, global_step=4637.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  36%|███▌      | 433/1208 [11:54<21:19,  1.65s/it, loss=0.089, v_num=0, train/loss_simple_step=0.00739, train/loss_vlb_step=3.71e-5, train/loss_step=0.00739, global_step=4638.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  36%|███▌      | 434/1208 [11:55<21:16,  1.65s/it, loss=0.089, v_num=0, train/loss_simple_step=0.00739, train/loss_vlb_step=3.71e-5, train/loss_step=0.00739, global_step=4638.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  36%|███▌      | 434/1208 [11:55<21:16,  1.65s/it, loss=0.118, v_num=0, train/loss_simple_step=0.593, train/loss_vlb_step=0.00771, train/loss_step=0.593, global_step=4638.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  36%|███▌      | 435/1208 [11:56<21:13,  1.65s/it, loss=0.118, v_num=0, train/loss_simple_step=0.593, train/loss_vlb_step=0.00771, train/loss_step=0.593, global_step=4638.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  36%|███▌      | 435/1208 [11:56<21:13,  1.65s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0682, train/loss_vlb_step=0.000232, train/loss_step=0.0682, global_step=4638.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  36%|███▌      | 436/1208 [11:59<21:14,  1.65s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0682, train/loss_vlb_step=0.000232, train/loss_step=0.0682, global_step=4638.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  36%|███▌      | 436/1208 [11:59<21:14,  1.65s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.16e-5, train/loss_step=0.0227, global_step=4638.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  36%|███▌      | 437/1208 [12:00<21:11,  1.65s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.16e-5, train/loss_step=0.0227, global_step=4638.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  36%|███▌      | 437/1208 [12:00<21:11,  1.65s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.75e-5, train/loss_step=0.0123, global_step=4639.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  36%|███▋      | 438/1208 [12:01<21:08,  1.65s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.75e-5, train/loss_step=0.0123, global_step=4639.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  36%|███▋      | 438/1208 [12:01<21:08,  1.65s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.15e-5, train/loss_step=0.00191, global_step=4639.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  36%|███▋      | 439/1208 [12:02<21:05,  1.65s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.15e-5, train/loss_step=0.00191, global_step=4639.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  36%|███▋      | 439/1208 [12:02<21:05,  1.65s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0975, train/loss_vlb_step=0.000323, train/loss_step=0.0975, global_step=4639.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  36%|███▋      | 440/1208 [12:05<21:06,  1.65s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0975, train/loss_vlb_step=0.000323, train/loss_step=0.0975, global_step=4639.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  36%|███▋      | 440/1208 [12:05<21:06,  1.65s/it, loss=0.118, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000686, train/loss_step=0.194, global_step=4639.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  37%|███▋      | 441/1208 [12:06<21:03,  1.65s/it, loss=0.118, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000686, train/loss_step=0.194, global_step=4639.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  37%|███▋      | 441/1208 [12:06<21:03,  1.65s/it, loss=0.117, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.86e-5, train/loss_step=0.019, global_step=4640.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  37%|███▋      | 442/1208 [12:07<21:00,  1.65s/it, loss=0.117, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.86e-5, train/loss_step=0.019, global_step=4640.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  37%|███▋      | 442/1208 [12:07<21:00,  1.65s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000136, train/loss_step=0.0364, global_step=4640.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  37%|███▋      | 443/1208 [12:08<20:58,  1.64s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000136, train/loss_step=0.0364, global_step=4640.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  37%|███▋      | 443/1208 [12:08<20:58,  1.64s/it, loss=0.109, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=4640.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  37%|███▋      | 444/1208 [12:11<20:58,  1.65s/it, loss=0.109, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=4640.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  37%|███▋      | 444/1208 [12:11<20:58,  1.65s/it, loss=0.103, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000449, train/loss_step=0.135, global_step=4640.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  37%|███▋      | 445/1208 [12:12<20:55,  1.65s/it, loss=0.103, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000449, train/loss_step=0.135, global_step=4640.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  37%|███▋      | 445/1208 [12:12<20:55,  1.65s/it, loss=0.11, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000455, train/loss_step=0.138, global_step=4641.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  37%|███▋      | 446/1208 [12:13<20:53,  1.64s/it, loss=0.11, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000455, train/loss_step=0.138, global_step=4641.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  37%|███▋      | 446/1208 [12:13<20:53,  1.64s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.00011, train/loss_step=0.0286, global_step=4641.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  37%|███▋      | 447/1208 [12:14<20:50,  1.64s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.00011, train/loss_step=0.0286, global_step=4641.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  37%|███▋      | 447/1208 [12:14<20:50,  1.64s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00524, train/loss_vlb_step=2.79e-5, train/loss_step=0.00524, global_step=4641.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  37%|███▋      | 448/1208 [12:17<20:50,  1.65s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00524, train/loss_vlb_step=2.79e-5, train/loss_step=0.00524, global_step=4641.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  37%|███▋      | 448/1208 [12:17<20:50,  1.65s/it, loss=0.109, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000672, train/loss_step=0.195, global_step=4641.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  37%|███▋      | 449/1208 [12:18<20:48,  1.64s/it, loss=0.109, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000672, train/loss_step=0.195, global_step=4641.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  37%|███▋      | 449/1208 [12:18<20:48,  1.64s/it, loss=0.124, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00145, train/loss_step=0.321, global_step=4642.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  37%|███▋      | 450/1208 [12:19<20:45,  1.64s/it, loss=0.124, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00145, train/loss_step=0.321, global_step=4642.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  37%|███▋      | 450/1208 [12:19<20:45,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00153, train/loss_step=0.318, global_step=4642.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  37%|███▋      | 451/1208 [12:20<20:42,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00153, train/loss_step=0.318, global_step=4642.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  37%|███▋      | 451/1208 [12:20<20:42,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000134, train/loss_step=0.0373, global_step=4642.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  37%|███▋      | 452/1208 [12:23<20:43,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000134, train/loss_step=0.0373, global_step=4642.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  37%|███▋      | 452/1208 [12:23<20:43,  1.64s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000105, train/loss_step=0.0264, global_step=4642.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  38%|███▊      | 453/1208 [12:24<20:40,  1.64s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000105, train/loss_step=0.0264, global_step=4642.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  38%|███▊      | 453/1208 [12:24<20:40,  1.64s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=1.95e-5, train/loss_step=0.00359, global_step=4643.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  38%|███▊      | 454/1208 [12:25<20:37,  1.64s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=1.95e-5, train/loss_step=0.00359, global_step=4643.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  38%|███▊      | 454/1208 [12:25<20:37,  1.64s/it, loss=0.0892, v_num=0, train/loss_simple_step=0.00439, train/loss_vlb_step=2.39e-5, train/loss_step=0.00439, global_step=4643.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  38%|███▊      | 455/1208 [12:26<20:35,  1.64s/it, loss=0.0892, v_num=0, train/loss_simple_step=0.00439, train/loss_vlb_step=2.39e-5, train/loss_step=0.00439, global_step=4643.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  38%|███▊      | 455/1208 [12:26<20:35,  1.64s/it, loss=0.0879, v_num=0, train/loss_simple_step=0.0427, train/loss_vlb_step=0.000157, train/loss_step=0.0427, global_step=4643.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  38%|███▊      | 456/1208 [12:29<20:35,  1.64s/it, loss=0.0879, v_num=0, train/loss_simple_step=0.0427, train/loss_vlb_step=0.000157, train/loss_step=0.0427, global_step=4643.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  38%|███▊      | 456/1208 [12:29<20:35,  1.64s/it, loss=0.103, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00161, train/loss_step=0.323, global_step=4643.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  38%|███▊      | 457/1208 [12:30<20:32,  1.64s/it, loss=0.103, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00161, train/loss_step=0.323, global_step=4643.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  38%|███▊      | 457/1208 [12:30<20:32,  1.64s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.000172, train/loss_step=0.0489, global_step=4644.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  38%|███▊      | 458/1208 [12:31<20:30,  1.64s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.000172, train/loss_step=0.0489, global_step=4644.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  38%|███▊      | 458/1208 [12:31<20:30,  1.64s/it, loss=0.115, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000799, train/loss_step=0.205, global_step=4644.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  38%|███▊      | 459/1208 [12:32<20:27,  1.64s/it, loss=0.115, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000799, train/loss_step=0.205, global_step=4644.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  38%|███▊      | 459/1208 [12:32<20:27,  1.64s/it, loss=0.13, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00257, train/loss_step=0.393, global_step=4644.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  38%|███▊      | 460/1208 [12:35<20:27,  1.64s/it, loss=0.13, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00257, train/loss_step=0.393, global_step=4644.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  38%|███▊      | 460/1208 [12:35<20:27,  1.64s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0742, train/loss_vlb_step=0.000252, train/loss_step=0.0742, global_step=4644.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  38%|███▊      | 461/1208 [12:36<20:25,  1.64s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0742, train/loss_vlb_step=0.000252, train/loss_step=0.0742, global_step=4644.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  38%|███▊      | 461/1208 [12:36<20:25,  1.64s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.1e-5, train/loss_step=0.0167, global_step=4645.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  38%|███▊      | 462/1208 [12:37<20:22,  1.64s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.1e-5, train/loss_step=0.0167, global_step=4645.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  38%|███▊      | 462/1208 [12:37<20:22,  1.64s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0986, train/loss_vlb_step=0.000326, train/loss_step=0.0986, global_step=4645.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  38%|███▊      | 463/1208 [12:38<20:20,  1.64s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0986, train/loss_vlb_step=0.000326, train/loss_step=0.0986, global_step=4645.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  38%|███▊      | 463/1208 [12:38<20:20,  1.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00216, train/loss_step=0.353, global_step=4645.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  38%|███▊      | 464/1208 [12:41<20:20,  1.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00216, train/loss_step=0.353, global_step=4645.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  38%|███▊      | 464/1208 [12:41<20:20,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.65e-5, train/loss_step=0.0132, global_step=4645.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  38%|███▊      | 465/1208 [12:42<20:17,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.65e-5, train/loss_step=0.0132, global_step=4645.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  38%|███▊      | 465/1208 [12:42<20:17,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000504, train/loss_step=0.152, global_step=4646.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  39%|███▊      | 466/1208 [12:43<20:15,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000504, train/loss_step=0.152, global_step=4646.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  39%|███▊      | 466/1208 [12:43<20:15,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00508, train/loss_vlb_step=2.73e-5, train/loss_step=0.00508, global_step=4646.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  39%|███▊      | 467/1208 [12:44<20:12,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00508, train/loss_vlb_step=2.73e-5, train/loss_step=0.00508, global_step=4646.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  39%|███▊      | 467/1208 [12:44<20:12,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00934, train/loss_vlb_step=4.57e-5, train/loss_step=0.00934, global_step=4646.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  39%|███▊      | 468/1208 [12:47<20:12,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00934, train/loss_vlb_step=4.57e-5, train/loss_step=0.00934, global_step=4646.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  39%|███▊      | 468/1208 [12:47<20:12,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00151, train/loss_step=0.333, global_step=4646.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  39%|███▉      | 469/1208 [12:48<20:10,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00151, train/loss_step=0.333, global_step=4646.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  39%|███▉      | 469/1208 [12:48<20:10,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.85e-5, train/loss_step=0.0103, global_step=4647.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  39%|███▉      | 470/1208 [12:49<20:07,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.85e-5, train/loss_step=0.0103, global_step=4647.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  39%|███▉      | 470/1208 [12:49<20:07,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.743, train/loss_vlb_step=0.0944, train/loss_step=0.743, global_step=4647.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  39%|███▉      | 471/1208 [12:50<20:04,  1.63s/it, loss=0.145, v_num=0, train/loss_simple_step=0.743, train/loss_vlb_step=0.0944, train/loss_step=0.743, global_step=4647.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  39%|███▉      | 471/1208 [12:50<20:04,  1.63s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.25e-5, train/loss_step=0.0197, global_step=4647.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  39%|███▉      | 472/1208 [12:52<20:05,  1.64s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.25e-5, train/loss_step=0.0197, global_step=4647.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  39%|███▉      | 472/1208 [12:52<20:05,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0465, train/loss_vlb_step=0.000165, train/loss_step=0.0465, global_step=4647.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  39%|███▉      | 473/1208 [12:53<20:02,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0465, train/loss_vlb_step=0.000165, train/loss_step=0.0465, global_step=4647.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  39%|███▉      | 473/1208 [12:53<20:02,  1.64s/it, loss=0.164, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00304, train/loss_step=0.386, global_step=4648.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  39%|███▉      | 474/1208 [12:54<20:00,  1.63s/it, loss=0.164, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00304, train/loss_step=0.386, global_step=4648.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  39%|███▉      | 474/1208 [12:54<20:00,  1.63s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.44e-5, train/loss_step=0.00255, global_step=4648.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  39%|███▉      | 475/1208 [12:55<19:57,  1.63s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.44e-5, train/loss_step=0.00255, global_step=4648.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  39%|███▉      | 475/1208 [12:55<19:57,  1.63s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0614, train/loss_vlb_step=0.000212, train/loss_step=0.0614, global_step=4648.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  39%|███▉      | 476/1208 [12:58<19:57,  1.64s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0614, train/loss_vlb_step=0.000212, train/loss_step=0.0614, global_step=4648.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  39%|███▉      | 476/1208 [12:58<19:57,  1.64s/it, loss=0.166, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00221, train/loss_step=0.346, global_step=4648.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  39%|███▉      | 477/1208 [12:59<19:55,  1.63s/it, loss=0.166, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00221, train/loss_step=0.346, global_step=4648.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  39%|███▉      | 477/1208 [12:59<19:55,  1.63s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000105, train/loss_step=0.0279, global_step=4649.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  40%|███▉      | 478/1208 [13:00<19:52,  1.63s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000105, train/loss_step=0.0279, global_step=4649.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  40%|███▉      | 478/1208 [13:00<19:52,  1.63s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0467, train/loss_vlb_step=0.00017, train/loss_step=0.0467, global_step=4649.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  40%|███▉      | 479/1208 [13:01<19:50,  1.63s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0467, train/loss_vlb_step=0.00017, train/loss_step=0.0467, global_step=4649.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  40%|███▉      | 479/1208 [13:01<19:50,  1.63s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=2.07e-5, train/loss_step=0.00407, global_step=4649.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  40%|███▉      | 480/1208 [13:04<19:50,  1.63s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=2.07e-5, train/loss_step=0.00407, global_step=4649.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  40%|███▉      | 480/1208 [13:04<19:50,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000621, train/loss_step=0.178, global_step=4649.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  40%|███▉      | 481/1208 [13:05<19:47,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000621, train/loss_step=0.178, global_step=4649.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  40%|███▉      | 481/1208 [13:05<19:47,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.43e-5, train/loss_step=0.0145, global_step=4650.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  40%|███▉      | 482/1208 [13:06<19:45,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.43e-5, train/loss_step=0.0145, global_step=4650.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  40%|███▉      | 482/1208 [13:06<19:45,  1.63s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00891, train/loss_vlb_step=4.22e-5, train/loss_step=0.00891, global_step=4650.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  40%|███▉      | 483/1208 [13:07<19:42,  1.63s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00891, train/loss_vlb_step=4.22e-5, train/loss_step=0.00891, global_step=4650.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  40%|███▉      | 483/1208 [13:07<19:42,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.41e-5, train/loss_step=0.00236, global_step=4650.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  40%|████      | 484/1208 [13:10<19:42,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.41e-5, train/loss_step=0.00236, global_step=4650.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  40%|████      | 484/1208 [13:10<19:42,  1.63s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=2.14e-5, train/loss_step=0.00392, global_step=4650.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  40%|████      | 485/1208 [13:11<19:40,  1.63s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=2.14e-5, train/loss_step=0.00392, global_step=4650.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  40%|████      | 485/1208 [13:11<19:40,  1.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=9.11e-6, train/loss_step=0.0015, global_step=4651.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  40%|████      | 486/1208 [13:12<19:37,  1.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=9.11e-6, train/loss_step=0.0015, global_step=4651.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  40%|████      | 486/1208 [13:12<19:37,  1.63s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000119, train/loss_step=0.0336, global_step=4651.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  40%|████      | 487/1208 [13:13<19:35,  1.63s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000119, train/loss_step=0.0336, global_step=4651.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  40%|████      | 487/1208 [13:13<19:35,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000514, train/loss_step=0.153, global_step=4651.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  40%|████      | 488/1208 [13:16<19:35,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000514, train/loss_step=0.153, global_step=4651.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  40%|████      | 488/1208 [13:16<19:35,  1.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000546, train/loss_step=0.162, global_step=4651.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  40%|████      | 489/1208 [13:17<19:32,  1.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000546, train/loss_step=0.162, global_step=4651.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  40%|████      | 489/1208 [13:17<19:32,  1.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.35e-5, train/loss_step=0.0169, global_step=4652.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  41%|████      | 490/1208 [13:18<19:30,  1.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.35e-5, train/loss_step=0.0169, global_step=4652.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  41%|████      | 490/1208 [13:18<19:30,  1.63s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00147, train/loss_step=0.311, global_step=4652.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  41%|████      | 491/1208 [13:19<19:27,  1.63s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00147, train/loss_step=0.311, global_step=4652.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  41%|████      | 491/1208 [13:19<19:27,  1.63s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=4652.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  41%|████      | 492/1208 [13:22<19:27,  1.63s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=4652.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  41%|████      | 492/1208 [13:22<19:27,  1.63s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000465, train/loss_step=0.135, global_step=4652.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  41%|████      | 493/1208 [13:23<19:25,  1.63s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000465, train/loss_step=0.135, global_step=4652.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  41%|████      | 493/1208 [13:23<19:25,  1.63s/it, loss=0.0808, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.94e-5, train/loss_step=0.00349, global_step=4653.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  41%|████      | 494/1208 [13:24<19:22,  1.63s/it, loss=0.0808, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.94e-5, train/loss_step=0.00349, global_step=4653.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  41%|████      | 494/1208 [13:24<19:22,  1.63s/it, loss=0.0911, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000816, train/loss_step=0.209, global_step=4653.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  41%|████      | 495/1208 [13:25<19:20,  1.63s/it, loss=0.0911, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000816, train/loss_step=0.209, global_step=4653.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  41%|████      | 495/1208 [13:25<19:20,  1.63s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.3e-5, train/loss_step=0.00222, global_step=4653.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  41%|████      | 496/1208 [13:28<19:20,  1.63s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.3e-5, train/loss_step=0.00222, global_step=4653.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  41%|████      | 496/1208 [13:28<19:20,  1.63s/it, loss=0.071, v_num=0, train/loss_simple_step=0.00355, train/loss_vlb_step=2.01e-5, train/loss_step=0.00355, global_step=4653.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  41%|████      | 497/1208 [13:29<19:18,  1.63s/it, loss=0.071, v_num=0, train/loss_simple_step=0.00355, train/loss_vlb_step=2.01e-5, train/loss_step=0.00355, global_step=4653.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  41%|████      | 497/1208 [13:29<19:18,  1.63s/it, loss=0.097, v_num=0, train/loss_simple_step=0.547, train/loss_vlb_step=0.0123, train/loss_step=0.547, global_step=4654.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]     Epoch 15:  41%|████      | 498/1208 [13:30<19:15,  1.63s/it, loss=0.097, v_num=0, train/loss_simple_step=0.547, train/loss_vlb_step=0.0123, train/loss_step=0.547, global_step=4654.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  41%|████      | 498/1208 [13:30<19:15,  1.63s/it, loss=0.095, v_num=0, train/loss_simple_step=0.00651, train/loss_vlb_step=3.35e-5, train/loss_step=0.00651, global_step=4654.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  41%|████▏     | 499/1208 [13:31<19:12,  1.63s/it, loss=0.095, v_num=0, train/loss_simple_step=0.00651, train/loss_vlb_step=3.35e-5, train/loss_step=0.00651, global_step=4654.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  41%|████▏     | 499/1208 [13:31<19:12,  1.63s/it, loss=0.101, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000404, train/loss_step=0.123, global_step=4654.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  41%|████▏     | 500/1208 [13:34<19:13,  1.63s/it, loss=0.101, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000404, train/loss_step=0.123, global_step=4654.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  41%|████▏     | 500/1208 [13:34<19:13,  1.63s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000419, train/loss_step=0.127, global_step=4654.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  41%|████▏     | 501/1208 [13:35<19:10,  1.63s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000419, train/loss_step=0.127, global_step=4654.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  41%|████▏     | 501/1208 [13:35<19:10,  1.63s/it, loss=0.098, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=3.27e-5, train/loss_step=0.00677, global_step=4655.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  42%|████▏     | 502/1208 [13:36<19:08,  1.63s/it, loss=0.098, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=3.27e-5, train/loss_step=0.00677, global_step=4655.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  42%|████▏     | 502/1208 [13:36<19:08,  1.63s/it, loss=0.104, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000409, train/loss_step=0.125, global_step=4655.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  42%|████▏     | 503/1208 [13:37<19:05,  1.63s/it, loss=0.104, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000409, train/loss_step=0.125, global_step=4655.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  42%|████▏     | 503/1208 [13:37<19:05,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00207, train/loss_step=0.345, global_step=4655.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  42%|████▏     | 504/1208 [13:40<19:05,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00207, train/loss_step=0.345, global_step=4655.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  42%|████▏     | 504/1208 [13:40<19:05,  1.63s/it, loss=0.128, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000464, train/loss_step=0.138, global_step=4655.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  42%|████▏     | 505/1208 [13:41<19:03,  1.63s/it, loss=0.128, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000464, train/loss_step=0.138, global_step=4655.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  42%|████▏     | 505/1208 [13:41<19:03,  1.63s/it, loss=0.133, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=4656.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  42%|████▏     | 506/1208 [13:42<19:00,  1.63s/it, loss=0.133, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=4656.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  42%|████▏     | 506/1208 [13:42<19:00,  1.63s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.71e-5, train/loss_step=0.00312, global_step=4656.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  42%|████▏     | 507/1208 [13:43<18:58,  1.62s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.71e-5, train/loss_step=0.00312, global_step=4656.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  42%|████▏     | 507/1208 [13:43<18:58,  1.62s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000233, train/loss_step=0.0676, global_step=4656.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  42%|████▏     | 508/1208 [13:46<18:58,  1.63s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000233, train/loss_step=0.0676, global_step=4656.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  42%|████▏     | 508/1208 [13:46<18:58,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0938, train/loss_vlb_step=0.00031, train/loss_step=0.0938, global_step=4656.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  42%|████▏     | 509/1208 [13:47<18:56,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0938, train/loss_vlb_step=0.00031, train/loss_step=0.0938, global_step=4656.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  42%|████▏     | 509/1208 [13:47<18:56,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00253, train/loss_step=0.408, global_step=4657.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  42%|████▏     | 510/1208 [13:48<18:53,  1.62s/it, loss=0.143, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00253, train/loss_step=0.408, global_step=4657.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  42%|████▏     | 510/1208 [13:48<18:53,  1.62s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.99e-5, train/loss_step=0.0135, global_step=4657.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  42%|████▏     | 511/1208 [13:49<18:51,  1.62s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.99e-5, train/loss_step=0.0135, global_step=4657.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  42%|████▏     | 511/1208 [13:49<18:51,  1.62s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000252, train/loss_step=0.0754, global_step=4657.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  42%|████▏     | 512/1208 [13:52<18:51,  1.63s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000252, train/loss_step=0.0754, global_step=4657.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  42%|████▏     | 512/1208 [13:52<18:51,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0571, train/loss_vlb_step=0.0002, train/loss_step=0.0571, global_step=4657.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  42%|████▏     | 513/1208 [13:53<18:48,  1.62s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0571, train/loss_vlb_step=0.0002, train/loss_step=0.0571, global_step=4657.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  42%|████▏     | 513/1208 [13:53<18:48,  1.62s/it, loss=0.138, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00145, train/loss_step=0.308, global_step=4658.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  43%|████▎     | 514/1208 [13:54<18:46,  1.62s/it, loss=0.138, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00145, train/loss_step=0.308, global_step=4658.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  43%|████▎     | 514/1208 [13:54<18:46,  1.62s/it, loss=0.144, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00152, train/loss_step=0.321, global_step=4658.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  43%|████▎     | 515/1208 [13:55<18:43,  1.62s/it, loss=0.144, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00152, train/loss_step=0.321, global_step=4658.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  43%|████▎     | 515/1208 [13:55<18:43,  1.62s/it, loss=0.155, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000827, train/loss_step=0.223, global_step=4658.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  43%|████▎     | 516/1208 [13:58<18:43,  1.62s/it, loss=0.155, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000827, train/loss_step=0.223, global_step=4658.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  43%|████▎     | 516/1208 [13:58<18:43,  1.62s/it, loss=0.161, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000377, train/loss_step=0.115, global_step=4658.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  43%|████▎     | 517/1208 [13:59<18:41,  1.62s/it, loss=0.161, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000377, train/loss_step=0.115, global_step=4658.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  43%|████▎     | 517/1208 [13:59<18:41,  1.62s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000141, train/loss_step=0.0376, global_step=4659.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  43%|████▎     | 518/1208 [14:00<18:39,  1.62s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000141, train/loss_step=0.0376, global_step=4659.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  43%|████▎     | 518/1208 [14:00<18:39,  1.62s/it, loss=0.143, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000553, train/loss_step=0.162, global_step=4659.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  43%|████▎     | 519/1208 [14:01<18:36,  1.62s/it, loss=0.143, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000553, train/loss_step=0.162, global_step=4659.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  43%|████▎     | 519/1208 [14:01<18:36,  1.62s/it, loss=0.148, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.00105, train/loss_step=0.228, global_step=4659.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  43%|████▎     | 520/1208 [14:03<18:36,  1.62s/it, loss=0.148, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.00105, train/loss_step=0.228, global_step=4659.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  43%|████▎     | 520/1208 [14:03<18:36,  1.62s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.48e-5, train/loss_step=0.0119, global_step=4659.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  43%|████▎     | 521/1208 [14:04<18:34,  1.62s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.48e-5, train/loss_step=0.0119, global_step=4659.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  43%|████▎     | 521/1208 [14:04<18:34,  1.62s/it, loss=0.151, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000611, train/loss_step=0.181, global_step=4660.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  43%|████▎     | 522/1208 [14:05<18:31,  1.62s/it, loss=0.151, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000611, train/loss_step=0.181, global_step=4660.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  43%|████▎     | 522/1208 [14:05<18:31,  1.62s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=2.94e-5, train/loss_step=0.00572, global_step=4660.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  43%|████▎     | 523/1208 [14:07<18:29,  1.62s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=2.94e-5, train/loss_step=0.00572, global_step=4660.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  43%|████▎     | 523/1208 [14:07<18:29,  1.62s/it, loss=0.135, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000476, train/loss_step=0.141, global_step=4660.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  43%|████▎     | 524/1208 [14:09<18:29,  1.62s/it, loss=0.135, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000476, train/loss_step=0.141, global_step=4660.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  43%|████▎     | 524/1208 [14:09<18:29,  1.62s/it, loss=0.141, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00107, train/loss_step=0.255, global_step=4660.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  43%|████▎     | 525/1208 [14:10<18:26,  1.62s/it, loss=0.141, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00107, train/loss_step=0.255, global_step=4660.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  43%|████▎     | 525/1208 [14:10<18:26,  1.62s/it, loss=0.146, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000786, train/loss_step=0.207, global_step=4661.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  44%|████▎     | 526/1208 [14:11<18:24,  1.62s/it, loss=0.146, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000786, train/loss_step=0.207, global_step=4661.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  44%|████▎     | 526/1208 [14:11<18:24,  1.62s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.000179, train/loss_step=0.0526, global_step=4661.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  44%|████▎     | 527/1208 [14:12<18:22,  1.62s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.000179, train/loss_step=0.0526, global_step=4661.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  44%|████▎     | 527/1208 [14:12<18:22,  1.62s/it, loss=0.155, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000752, train/loss_step=0.205, global_step=4661.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  44%|████▎     | 528/1208 [14:15<18:22,  1.62s/it, loss=0.155, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000752, train/loss_step=0.205, global_step=4661.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  44%|████▎     | 528/1208 [14:15<18:22,  1.62s/it, loss=0.156, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000389, train/loss_step=0.117, global_step=4661.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  44%|████▍     | 529/1208 [14:16<18:19,  1.62s/it, loss=0.156, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000389, train/loss_step=0.117, global_step=4661.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  44%|████▍     | 529/1208 [14:16<18:19,  1.62s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=2.72e-5, train/loss_step=0.00526, global_step=4662.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  44%|████▍     | 530/1208 [14:17<18:17,  1.62s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=2.72e-5, train/loss_step=0.00526, global_step=4662.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  44%|████▍     | 530/1208 [14:17<18:17,  1.62s/it, loss=0.166, v_num=0, train/loss_simple_step=0.622, train/loss_vlb_step=0.0357, train/loss_step=0.622, global_step=4662.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]     Epoch 15:  44%|████▍     | 531/1208 [14:18<18:14,  1.62s/it, loss=0.166, v_num=0, train/loss_simple_step=0.622, train/loss_vlb_step=0.0357, train/loss_step=0.622, global_step=4662.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  44%|████▍     | 531/1208 [14:18<18:14,  1.62s/it, loss=0.175, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.00102, train/loss_step=0.238, global_step=4662.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  44%|████▍     | 532/1208 [14:21<18:14,  1.62s/it, loss=0.175, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.00102, train/loss_step=0.238, global_step=4662.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  44%|████▍     | 532/1208 [14:21<18:14,  1.62s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00738, train/loss_vlb_step=3.7e-5, train/loss_step=0.00738, global_step=4662.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  44%|████▍     | 533/1208 [14:22<18:12,  1.62s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00738, train/loss_vlb_step=3.7e-5, train/loss_step=0.00738, global_step=4662.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  44%|████▍     | 533/1208 [14:22<18:12,  1.62s/it, loss=0.172, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00118, train/loss_step=0.311, global_step=4663.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  44%|████▍     | 534/1208 [14:23<18:10,  1.62s/it, loss=0.172, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00118, train/loss_step=0.311, global_step=4663.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  44%|████▍     | 534/1208 [14:23<18:10,  1.62s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0609, train/loss_vlb_step=0.000216, train/loss_step=0.0609, global_step=4663.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  44%|████▍     | 535/1208 [14:24<18:07,  1.62s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0609, train/loss_vlb_step=0.000216, train/loss_step=0.0609, global_step=4663.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  44%|████▍     | 535/1208 [14:24<18:07,  1.62s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=2.38e-5, train/loss_step=0.00464, global_step=4663.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  44%|████▍     | 536/1208 [14:27<18:07,  1.62s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=2.38e-5, train/loss_step=0.00464, global_step=4663.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  44%|████▍     | 536/1208 [14:27<18:07,  1.62s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00538, train/loss_vlb_step=2.75e-5, train/loss_step=0.00538, global_step=4663.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  44%|████▍     | 537/1208 [14:28<18:05,  1.62s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00538, train/loss_vlb_step=2.75e-5, train/loss_step=0.00538, global_step=4663.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  44%|████▍     | 537/1208 [14:28<18:05,  1.62s/it, loss=0.149, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000586, train/loss_step=0.165, global_step=4664.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  45%|████▍     | 538/1208 [14:29<18:03,  1.62s/it, loss=0.149, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000586, train/loss_step=0.165, global_step=4664.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  45%|████▍     | 538/1208 [14:29<18:03,  1.62s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00861, train/loss_vlb_step=4.19e-5, train/loss_step=0.00861, global_step=4664.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  45%|████▍     | 539/1208 [14:30<18:00,  1.62s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00861, train/loss_vlb_step=4.19e-5, train/loss_step=0.00861, global_step=4664.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  45%|████▍     | 539/1208 [14:30<18:00,  1.62s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.14e-5, train/loss_step=0.0111, global_step=4664.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  45%|████▍     | 540/1208 [14:33<18:00,  1.62s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.14e-5, train/loss_step=0.0111, global_step=4664.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  45%|████▍     | 540/1208 [14:33<18:00,  1.62s/it, loss=0.142, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000965, train/loss_step=0.234, global_step=4664.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  45%|████▍     | 541/1208 [14:34<17:58,  1.62s/it, loss=0.142, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000965, train/loss_step=0.234, global_step=4664.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  45%|████▍     | 541/1208 [14:34<17:58,  1.62s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.000145, train/loss_step=0.0394, global_step=4665.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  45%|████▍     | 542/1208 [14:35<17:55,  1.62s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.000145, train/loss_step=0.0394, global_step=4665.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  45%|████▍     | 542/1208 [14:35<17:55,  1.62s/it, loss=0.136, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000133, train/loss_step=0.035, global_step=4665.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  45%|████▍     | 543/1208 [14:36<17:53,  1.61s/it, loss=0.136, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000133, train/loss_step=0.035, global_step=4665.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  45%|████▍     | 543/1208 [14:36<17:53,  1.61s/it, loss=0.135, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000392, train/loss_step=0.118, global_step=4665.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  45%|████▌     | 544/1208 [14:39<17:53,  1.62s/it, loss=0.135, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000392, train/loss_step=0.118, global_step=4665.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  45%|████▌     | 544/1208 [14:39<17:53,  1.62s/it, loss=0.141, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00285, train/loss_step=0.380, global_step=4665.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  45%|████▌     | 545/1208 [14:40<17:51,  1.62s/it, loss=0.141, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00285, train/loss_step=0.380, global_step=4665.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  45%|████▌     | 545/1208 [14:40<17:51,  1.62s/it, loss=0.153, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00465, train/loss_step=0.434, global_step=4666.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  45%|████▌     | 546/1208 [14:41<17:48,  1.61s/it, loss=0.153, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00465, train/loss_step=0.434, global_step=4666.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  45%|████▌     | 546/1208 [14:41<17:48,  1.61s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.37e-5, train/loss_step=0.00241, global_step=4666.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  45%|████▌     | 547/1208 [14:42<17:46,  1.61s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.37e-5, train/loss_step=0.00241, global_step=4666.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  45%|████▌     | 547/1208 [14:42<17:46,  1.61s/it, loss=0.157, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00215, train/loss_step=0.345, global_step=4666.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  45%|████▌     | 548/1208 [14:45<17:46,  1.62s/it, loss=0.157, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00215, train/loss_step=0.345, global_step=4666.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  45%|████▌     | 548/1208 [14:45<17:46,  1.62s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000298, train/loss_step=0.0901, global_step=4666.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  45%|████▌     | 549/1208 [14:46<17:44,  1.61s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000298, train/loss_step=0.0901, global_step=4666.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  45%|████▌     | 549/1208 [14:46<17:44,  1.61s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0565, train/loss_vlb_step=0.000202, train/loss_step=0.0565, global_step=4667.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  46%|████▌     | 550/1208 [14:47<17:41,  1.61s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0565, train/loss_vlb_step=0.000202, train/loss_step=0.0565, global_step=4667.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  46%|████▌     | 550/1208 [14:47<17:41,  1.61s/it, loss=0.149, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00359, train/loss_step=0.442, global_step=4667.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  46%|████▌     | 551/1208 [14:48<17:39,  1.61s/it, loss=0.149, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00359, train/loss_step=0.442, global_step=4667.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  46%|████▌     | 551/1208 [14:48<17:39,  1.61s/it, loss=0.138, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.33e-5, train/loss_step=0.012, global_step=4667.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  46%|████▌     | 552/1208 [14:51<17:39,  1.61s/it, loss=0.138, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.33e-5, train/loss_step=0.012, global_step=4667.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  46%|████▌     | 552/1208 [14:51<17:39,  1.61s/it, loss=0.144, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=4667.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  46%|████▌     | 553/1208 [14:52<17:36,  1.61s/it, loss=0.144, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=4667.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  46%|████▌     | 553/1208 [14:52<17:36,  1.61s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.75e-5, train/loss_step=0.0245, global_step=4668.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  46%|████▌     | 554/1208 [14:53<17:34,  1.61s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.75e-5, train/loss_step=0.0245, global_step=4668.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  46%|████▌     | 554/1208 [14:53<17:34,  1.61s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000103, train/loss_step=0.0269, global_step=4668.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  46%|████▌     | 555/1208 [14:54<17:32,  1.61s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000103, train/loss_step=0.0269, global_step=4668.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  46%|████▌     | 555/1208 [14:54<17:32,  1.61s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00886, train/loss_vlb_step=4.12e-5, train/loss_step=0.00886, global_step=4668.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  46%|████▌     | 556/1208 [14:57<17:32,  1.61s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00886, train/loss_vlb_step=4.12e-5, train/loss_step=0.00886, global_step=4668.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  46%|████▌     | 556/1208 [14:57<17:32,  1.61s/it, loss=0.136, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000553, train/loss_step=0.166, global_step=4668.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  46%|████▌     | 557/1208 [14:58<17:29,  1.61s/it, loss=0.136, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000553, train/loss_step=0.166, global_step=4668.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  46%|████▌     | 557/1208 [14:58<17:29,  1.61s/it, loss=0.138, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000717, train/loss_step=0.200, global_step=4669.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  46%|████▌     | 558/1208 [14:59<17:27,  1.61s/it, loss=0.138, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000717, train/loss_step=0.200, global_step=4669.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  46%|████▌     | 558/1208 [14:59<17:27,  1.61s/it, loss=0.143, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=4669.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  46%|████▋     | 559/1208 [15:00<17:25,  1.61s/it, loss=0.143, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=4669.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  46%|████▋     | 559/1208 [15:00<17:25,  1.61s/it, loss=0.154, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.00101, train/loss_step=0.246, global_step=4669.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  46%|████▋     | 560/1208 [15:03<17:25,  1.61s/it, loss=0.154, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.00101, train/loss_step=0.246, global_step=4669.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  46%|████▋     | 560/1208 [15:03<17:25,  1.61s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.22e-5, train/loss_step=0.0143, global_step=4669.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  46%|████▋     | 561/1208 [15:04<17:22,  1.61s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.22e-5, train/loss_step=0.0143, global_step=4669.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  46%|████▋     | 561/1208 [15:04<17:22,  1.61s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=1.07e-5, train/loss_step=0.00181, global_step=4670.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  47%|████▋     | 562/1208 [15:05<17:20,  1.61s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=1.07e-5, train/loss_step=0.00181, global_step=4670.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  47%|████▋     | 562/1208 [15:05<17:20,  1.61s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.53e-5, train/loss_step=0.00268, global_step=4670.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  47%|████▋     | 563/1208 [15:06<17:18,  1.61s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.53e-5, train/loss_step=0.00268, global_step=4670.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  47%|████▋     | 563/1208 [15:06<17:18,  1.61s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=9.42e-5, train/loss_step=0.0249, global_step=4670.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  47%|████▋     | 564/1208 [15:09<17:18,  1.61s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=9.42e-5, train/loss_step=0.0249, global_step=4670.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  47%|████▋     | 564/1208 [15:09<17:18,  1.61s/it, loss=0.138, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00279, train/loss_step=0.442, global_step=4670.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  47%|████▋     | 565/1208 [15:10<17:15,  1.61s/it, loss=0.138, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00279, train/loss_step=0.442, global_step=4670.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  47%|████▋     | 565/1208 [15:10<17:15,  1.61s/it, loss=0.124, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000494, train/loss_step=0.142, global_step=4671.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  47%|████▋     | 566/1208 [15:11<17:13,  1.61s/it, loss=0.124, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000494, train/loss_step=0.142, global_step=4671.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  47%|████▋     | 566/1208 [15:11<17:13,  1.61s/it, loss=0.144, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00377, train/loss_step=0.405, global_step=4671.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  47%|████▋     | 567/1208 [15:12<17:11,  1.61s/it, loss=0.144, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00377, train/loss_step=0.405, global_step=4671.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  47%|████▋     | 567/1208 [15:12<17:11,  1.61s/it, loss=0.136, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000643, train/loss_step=0.175, global_step=4671.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  47%|████▋     | 568/1208 [15:15<17:10,  1.61s/it, loss=0.136, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000643, train/loss_step=0.175, global_step=4671.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  47%|████▋     | 568/1208 [15:15<17:10,  1.61s/it, loss=0.152, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00375, train/loss_step=0.427, global_step=4671.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  47%|████▋     | 569/1208 [15:16<17:08,  1.61s/it, loss=0.152, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00375, train/loss_step=0.427, global_step=4671.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  47%|████▋     | 569/1208 [15:16<17:08,  1.61s/it, loss=0.169, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00247, train/loss_step=0.392, global_step=4672.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  47%|████▋     | 570/1208 [15:17<17:06,  1.61s/it, loss=0.169, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00247, train/loss_step=0.392, global_step=4672.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  47%|████▋     | 570/1208 [15:17<17:06,  1.61s/it, loss=0.162, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00143, train/loss_step=0.289, global_step=4672.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  47%|████▋     | 571/1208 [15:18<17:04,  1.61s/it, loss=0.162, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00143, train/loss_step=0.289, global_step=4672.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  47%|████▋     | 571/1208 [15:18<17:04,  1.61s/it, loss=0.183, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00273, train/loss_step=0.433, global_step=4672.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  47%|████▋     | 572/1208 [15:20<17:03,  1.61s/it, loss=0.183, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00273, train/loss_step=0.433, global_step=4672.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  47%|████▋     | 572/1208 [15:20<17:03,  1.61s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00327, train/loss_vlb_step=1.81e-5, train/loss_step=0.00327, global_step=4672.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  47%|████▋     | 573/1208 [15:21<17:01,  1.61s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00327, train/loss_vlb_step=1.81e-5, train/loss_step=0.00327, global_step=4672.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  47%|████▋     | 573/1208 [15:21<17:01,  1.61s/it, loss=0.183, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000529, train/loss_step=0.156, global_step=4673.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  48%|████▊     | 574/1208 [15:22<16:59,  1.61s/it, loss=0.183, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000529, train/loss_step=0.156, global_step=4673.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  48%|████▊     | 574/1208 [15:22<16:59,  1.61s/it, loss=0.193, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000852, train/loss_step=0.220, global_step=4673.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  48%|████▊     | 575/1208 [15:23<16:57,  1.61s/it, loss=0.193, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000852, train/loss_step=0.220, global_step=4673.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  48%|████▊     | 575/1208 [15:23<16:57,  1.61s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0693, train/loss_vlb_step=0.000233, train/loss_step=0.0693, global_step=4673.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  48%|████▊     | 576/1208 [15:26<16:56,  1.61s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0693, train/loss_vlb_step=0.000233, train/loss_step=0.0693, global_step=4673.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  48%|████▊     | 576/1208 [15:26<16:56,  1.61s/it, loss=0.205, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00192, train/loss_step=0.351, global_step=4673.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  48%|████▊     | 577/1208 [15:27<16:54,  1.61s/it, loss=0.205, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00192, train/loss_step=0.351, global_step=4673.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  48%|████▊     | 577/1208 [15:27<16:54,  1.61s/it, loss=0.208, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00107, train/loss_step=0.250, global_step=4674.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  48%|████▊     | 578/1208 [15:28<16:52,  1.61s/it, loss=0.208, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00107, train/loss_step=0.250, global_step=4674.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  48%|████▊     | 578/1208 [15:28<16:52,  1.61s/it, loss=0.204, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000113, train/loss_step=0.0277, global_step=4674.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  48%|████▊     | 579/1208 [15:29<16:50,  1.61s/it, loss=0.204, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000113, train/loss_step=0.0277, global_step=4674.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  48%|████▊     | 579/1208 [15:29<16:50,  1.61s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.49e-5, train/loss_step=0.0203, global_step=4674.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  48%|████▊     | 580/1208 [15:32<16:49,  1.61s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.49e-5, train/loss_step=0.0203, global_step=4674.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  48%|████▊     | 580/1208 [15:32<16:49,  1.61s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0651, train/loss_vlb_step=0.000226, train/loss_step=0.0651, global_step=4674.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  48%|████▊     | 581/1208 [15:33<16:47,  1.61s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0651, train/loss_vlb_step=0.000226, train/loss_step=0.0651, global_step=4674.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  48%|████▊     | 581/1208 [15:33<16:47,  1.61s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0679, train/loss_vlb_step=0.000231, train/loss_step=0.0679, global_step=4675.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  48%|████▊     | 582/1208 [15:34<16:45,  1.61s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0679, train/loss_vlb_step=0.000231, train/loss_step=0.0679, global_step=4675.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  48%|████▊     | 582/1208 [15:34<16:45,  1.61s/it, loss=0.205, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.00046, train/loss_step=0.137, global_step=4675.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  48%|████▊     | 583/1208 [15:35<16:43,  1.61s/it, loss=0.205, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.00046, train/loss_step=0.137, global_step=4675.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  48%|████▊     | 583/1208 [15:35<16:43,  1.61s/it, loss=0.218, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00113, train/loss_step=0.284, global_step=4675.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  48%|████▊     | 584/1208 [15:38<16:42,  1.61s/it, loss=0.218, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00113, train/loss_step=0.284, global_step=4675.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  48%|████▊     | 584/1208 [15:38<16:42,  1.61s/it, loss=0.203, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000481, train/loss_step=0.145, global_step=4675.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  48%|████▊     | 585/1208 [15:39<16:40,  1.61s/it, loss=0.203, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000481, train/loss_step=0.145, global_step=4675.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  48%|████▊     | 585/1208 [15:39<16:40,  1.61s/it, loss=0.207, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000809, train/loss_step=0.212, global_step=4676.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  49%|████▊     | 586/1208 [15:40<16:38,  1.61s/it, loss=0.207, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000809, train/loss_step=0.212, global_step=4676.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  49%|████▊     | 586/1208 [15:40<16:38,  1.61s/it, loss=0.187, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=2.6e-5, train/loss_step=0.00492, global_step=4676.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  49%|████▊     | 587/1208 [15:41<16:36,  1.60s/it, loss=0.187, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=2.6e-5, train/loss_step=0.00492, global_step=4676.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  49%|████▊     | 587/1208 [15:41<16:36,  1.60s/it, loss=0.19, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00107, train/loss_step=0.252, global_step=4676.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  49%|████▊     | 588/1208 [15:44<16:36,  1.61s/it, loss=0.19, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00107, train/loss_step=0.252, global_step=4676.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  49%|████▊     | 588/1208 [15:44<16:36,  1.61s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00898, train/loss_vlb_step=4.25e-5, train/loss_step=0.00898, global_step=4676.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  49%|████▉     | 589/1208 [15:45<16:33,  1.61s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00898, train/loss_vlb_step=4.25e-5, train/loss_step=0.00898, global_step=4676.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  49%|████▉     | 589/1208 [15:45<16:33,  1.61s/it, loss=0.152, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000182, train/loss_step=0.051, global_step=4677.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  49%|████▉     | 590/1208 [15:46<16:31,  1.60s/it, loss=0.152, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000182, train/loss_step=0.051, global_step=4677.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  49%|████▉     | 590/1208 [15:46<16:31,  1.60s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=6.85e-5, train/loss_step=0.0163, global_step=4677.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  49%|████▉     | 591/1208 [15:47<16:29,  1.60s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=6.85e-5, train/loss_step=0.0163, global_step=4677.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  49%|████▉     | 591/1208 [15:47<16:29,  1.60s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0995, train/loss_vlb_step=0.000327, train/loss_step=0.0995, global_step=4677.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  49%|████▉     | 592/1208 [15:50<16:29,  1.61s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0995, train/loss_vlb_step=0.000327, train/loss_step=0.0995, global_step=4677.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  49%|████▉     | 592/1208 [15:50<16:29,  1.61s/it, loss=0.133, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000771, train/loss_step=0.213, global_step=4677.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  49%|████▉     | 593/1208 [15:51<16:26,  1.60s/it, loss=0.133, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000771, train/loss_step=0.213, global_step=4677.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  49%|████▉     | 593/1208 [15:51<16:26,  1.60s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.33e-5, train/loss_step=0.0232, global_step=4678.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  49%|████▉     | 594/1208 [15:52<16:24,  1.60s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.33e-5, train/loss_step=0.0232, global_step=4678.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  49%|████▉     | 594/1208 [15:52<16:24,  1.60s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0544, train/loss_vlb_step=0.000191, train/loss_step=0.0544, global_step=4678.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  49%|████▉     | 595/1208 [15:53<16:22,  1.60s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0544, train/loss_vlb_step=0.000191, train/loss_step=0.0544, global_step=4678.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  49%|████▉     | 595/1208 [15:53<16:22,  1.60s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0802, train/loss_vlb_step=0.000264, train/loss_step=0.0802, global_step=4678.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  49%|████▉     | 596/1208 [15:56<16:22,  1.60s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0802, train/loss_vlb_step=0.000264, train/loss_step=0.0802, global_step=4678.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  49%|████▉     | 596/1208 [15:56<16:22,  1.60s/it, loss=0.122, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.00281, train/loss_step=0.417, global_step=4678.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  49%|████▉     | 597/1208 [15:57<16:19,  1.60s/it, loss=0.122, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.00281, train/loss_step=0.417, global_step=4678.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  49%|████▉     | 597/1208 [15:57<16:19,  1.60s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00644, train/loss_vlb_step=3.17e-5, train/loss_step=0.00644, global_step=4679.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  50%|████▉     | 598/1208 [15:58<16:17,  1.60s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00644, train/loss_vlb_step=3.17e-5, train/loss_step=0.00644, global_step=4679.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  50%|████▉     | 598/1208 [15:58<16:17,  1.60s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.000131, train/loss_step=0.0347, global_step=4679.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  50%|████▉     | 599/1208 [15:59<16:15,  1.60s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.000131, train/loss_step=0.0347, global_step=4679.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  50%|████▉     | 599/1208 [15:59<16:15,  1.60s/it, loss=0.127, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00394, train/loss_step=0.373, global_step=4679.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  50%|████▉     | 600/1208 [16:02<16:15,  1.60s/it, loss=0.127, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00394, train/loss_step=0.373, global_step=4679.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  50%|████▉     | 600/1208 [16:02<16:15,  1.60s/it, loss=0.157, v_num=0, train/loss_simple_step=0.656, train/loss_vlb_step=0.0246, train/loss_step=0.656, global_step=4679.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] 
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.86it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.85it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:25,  1.85it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.84it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.85it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.85it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.85it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.84it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.84it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.84it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.84it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.84it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.84it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.84it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.84it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.84it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.84it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.84it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.84it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.84it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.83it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.84it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.84it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:19,  1.85it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.84it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.85it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:18,  1.84it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.84it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.85it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.85it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.83it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.84it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.84it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.84it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s][ADDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.85it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.84it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.84it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.84it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.84it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.84it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.84it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.84it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.83it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.83it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.83it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.83it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.83it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.83it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.84it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.84it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.83it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.84it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.83it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.84it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.83it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.84it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.84it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.84it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.84it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.84it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.84it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.84it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.84it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.84it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.83it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.85it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.82it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.84it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.83it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.84it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.83it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.85it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.83it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.85it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.83it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.85it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.83it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:24<00:02,  1.85it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.83it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.85it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.83it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.84it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.84it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.84it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.83it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.83it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]Epoch 15:  50%|████▉     | 601/1208 [16:31<16:41,  1.65s/it, loss=0.157, v_num=0, train/loss_simple_step=0.656, train/loss_vlb_step=0.0246, train/loss_step=0.656, global_step=4679.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  50%|████▉     | 601/1208 [16:31<16:41,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0913, train/loss_vlb_step=0.0003, train/loss_step=0.0913, global_step=4680.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  50%|████▉     | 602/1208 [16:33<16:39,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0913, train/loss_vlb_step=0.0003, train/loss_step=0.0913, global_step=4680.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  50%|████▉     | 602/1208 [16:33<16:39,  1.65s/it, loss=0.186, v_num=0, train/loss_simple_step=0.692, train/loss_vlb_step=0.0278, train/loss_step=0.692, global_step=4680.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  50%|████▉     | 603/1208 [16:34<16:37,  1.65s/it, loss=0.186, v_num=0, train/loss_simple_step=0.692, train/loss_vlb_step=0.0278, train/loss_step=0.692, global_step=4680.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  50%|████▉     | 603/1208 [16:34<16:37,  1.65s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000135, train/loss_step=0.0367, global_step=4680.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  50%|█████     | 604/1208 [16:36<16:36,  1.65s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000135, train/loss_step=0.0367, global_step=4680.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  50%|█████     | 604/1208 [16:36<16:36,  1.65s/it, loss=0.175, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000636, train/loss_step=0.168, global_step=4680.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  50%|█████     | 605/1208 [16:37<16:34,  1.65s/it, loss=0.175, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000636, train/loss_step=0.168, global_step=4680.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  50%|█████     | 605/1208 [16:37<16:34,  1.65s/it, loss=0.182, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00235, train/loss_step=0.370, global_step=4681.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  50%|█████     | 606/1208 [16:38<16:32,  1.65s/it, loss=0.182, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00235, train/loss_step=0.370, global_step=4681.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  50%|█████     | 606/1208 [16:38<16:32,  1.65s/it, loss=0.197, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00146, train/loss_step=0.301, global_step=4681.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  50%|█████     | 607/1208 [16:39<16:30,  1.65s/it, loss=0.197, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00146, train/loss_step=0.301, global_step=4681.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  50%|█████     | 607/1208 [16:39<16:30,  1.65s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0583, train/loss_vlb_step=0.000208, train/loss_step=0.0583, global_step=4681.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  50%|█████     | 608/1208 [16:42<16:29,  1.65s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0583, train/loss_vlb_step=0.000208, train/loss_step=0.0583, global_step=4681.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  50%|█████     | 608/1208 [16:42<16:29,  1.65s/it, loss=0.196, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000598, train/loss_step=0.175, global_step=4681.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  50%|█████     | 609/1208 [16:43<16:27,  1.65s/it, loss=0.196, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000598, train/loss_step=0.175, global_step=4681.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  50%|█████     | 609/1208 [16:43<16:27,  1.65s/it, loss=0.201, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000564, train/loss_step=0.160, global_step=4682.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  50%|█████     | 610/1208 [16:44<16:25,  1.65s/it, loss=0.201, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000564, train/loss_step=0.160, global_step=4682.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  50%|█████     | 610/1208 [16:44<16:25,  1.65s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0982, train/loss_vlb_step=0.000323, train/loss_step=0.0982, global_step=4682.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  51%|█████     | 611/1208 [16:45<16:22,  1.65s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0982, train/loss_vlb_step=0.000323, train/loss_step=0.0982, global_step=4682.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  51%|█████     | 611/1208 [16:45<16:22,  1.65s/it, loss=0.215, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00157, train/loss_step=0.284, global_step=4682.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  51%|█████     | 612/1208 [16:48<16:22,  1.65s/it, loss=0.215, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00157, train/loss_step=0.284, global_step=4682.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  51%|█████     | 612/1208 [16:48<16:22,  1.65s/it, loss=0.207, v_num=0, train/loss_simple_step=0.063, train/loss_vlb_step=0.000218, train/loss_step=0.063, global_step=4682.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  51%|█████     | 613/1208 [16:49<16:20,  1.65s/it, loss=0.207, v_num=0, train/loss_simple_step=0.063, train/loss_vlb_step=0.000218, train/loss_step=0.063, global_step=4682.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  51%|█████     | 613/1208 [16:49<16:20,  1.65s/it, loss=0.217, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000802, train/loss_step=0.216, global_step=4683.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  51%|█████     | 614/1208 [16:50<16:17,  1.65s/it, loss=0.217, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000802, train/loss_step=0.216, global_step=4683.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  51%|█████     | 614/1208 [16:50<16:17,  1.65s/it, loss=0.215, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.41e-5, train/loss_step=0.0235, global_step=4683.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  51%|█████     | 615/1208 [16:51<16:15,  1.65s/it, loss=0.215, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.41e-5, train/loss_step=0.0235, global_step=4683.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  51%|█████     | 615/1208 [16:51<16:15,  1.65s/it, loss=0.251, v_num=0, train/loss_simple_step=0.801, train/loss_vlb_step=0.0515, train/loss_step=0.801, global_step=4683.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  51%|█████     | 616/1208 [16:54<16:15,  1.65s/it, loss=0.251, v_num=0, train/loss_simple_step=0.801, train/loss_vlb_step=0.0515, train/loss_step=0.801, global_step=4683.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  51%|█████     | 616/1208 [16:54<16:15,  1.65s/it, loss=0.238, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000538, train/loss_step=0.160, global_step=4683.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  51%|█████     | 617/1208 [16:55<16:12,  1.65s/it, loss=0.238, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000538, train/loss_step=0.160, global_step=4683.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  51%|█████     | 617/1208 [16:55<16:12,  1.65s/it, loss=0.238, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=1.48e-5, train/loss_step=0.00258, global_step=4684.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  51%|█████     | 618/1208 [16:56<16:10,  1.65s/it, loss=0.238, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=1.48e-5, train/loss_step=0.00258, global_step=4684.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  51%|█████     | 618/1208 [16:56<16:10,  1.65s/it, loss=0.237, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.3e-5, train/loss_step=0.00222, global_step=4684.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  51%|█████     | 619/1208 [16:57<16:08,  1.64s/it, loss=0.237, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.3e-5, train/loss_step=0.00222, global_step=4684.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  51%|█████     | 619/1208 [16:57<16:08,  1.64s/it, loss=0.218, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=2e-5, train/loss_step=0.0036, global_step=4684.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  51%|█████▏    | 620/1208 [17:00<16:07,  1.65s/it, loss=0.218, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=2e-5, train/loss_step=0.0036, global_step=4684.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  51%|█████▏    | 620/1208 [17:00<16:07,  1.65s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.59e-5, train/loss_step=0.0028, global_step=4684.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  51%|█████▏    | 621/1208 [17:01<16:05,  1.65s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.59e-5, train/loss_step=0.0028, global_step=4684.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  51%|█████▏    | 621/1208 [17:01<16:05,  1.65s/it, loss=0.202, v_num=0, train/loss_simple_step=0.419, train/loss_vlb_step=0.00417, train/loss_step=0.419, global_step=4685.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  51%|█████▏    | 622/1208 [17:02<16:03,  1.64s/it, loss=0.202, v_num=0, train/loss_simple_step=0.419, train/loss_vlb_step=0.00417, train/loss_step=0.419, global_step=4685.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  51%|█████▏    | 622/1208 [17:02<16:03,  1.64s/it, loss=0.173, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000399, train/loss_step=0.120, global_step=4685.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  52%|█████▏    | 623/1208 [17:03<16:01,  1.64s/it, loss=0.173, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000399, train/loss_step=0.120, global_step=4685.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  52%|█████▏    | 623/1208 [17:03<16:01,  1.64s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00972, train/loss_vlb_step=4.89e-5, train/loss_step=0.00972, global_step=4685.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  52%|█████▏    | 624/1208 [17:06<16:00,  1.65s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00972, train/loss_vlb_step=4.89e-5, train/loss_step=0.00972, global_step=4685.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  52%|█████▏    | 624/1208 [17:06<16:00,  1.65s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0864, train/loss_vlb_step=0.000285, train/loss_step=0.0864, global_step=4685.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  52%|█████▏    | 625/1208 [17:07<15:58,  1.64s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0864, train/loss_vlb_step=0.000285, train/loss_step=0.0864, global_step=4685.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  52%|█████▏    | 625/1208 [17:07<15:58,  1.64s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.34e-5, train/loss_step=0.0201, global_step=4686.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  52%|█████▏    | 626/1208 [17:08<15:56,  1.64s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.34e-5, train/loss_step=0.0201, global_step=4686.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  52%|█████▏    | 626/1208 [17:08<15:56,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0724, train/loss_vlb_step=0.000243, train/loss_step=0.0724, global_step=4686.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  52%|█████▏    | 627/1208 [17:09<15:54,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0724, train/loss_vlb_step=0.000243, train/loss_step=0.0724, global_step=4686.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  52%|█████▏    | 627/1208 [17:09<15:54,  1.64s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.88e-5, train/loss_step=0.00324, global_step=4686.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  52%|█████▏    | 628/1208 [17:12<15:53,  1.64s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.88e-5, train/loss_step=0.00324, global_step=4686.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  52%|█████▏    | 628/1208 [17:12<15:53,  1.64s/it, loss=0.147, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00286, train/loss_step=0.401, global_step=4686.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  52%|█████▏    | 629/1208 [17:13<15:51,  1.64s/it, loss=0.147, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00286, train/loss_step=0.401, global_step=4686.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  52%|█████▏    | 629/1208 [17:13<15:51,  1.64s/it, loss=0.173, v_num=0, train/loss_simple_step=0.667, train/loss_vlb_step=0.0345, train/loss_step=0.667, global_step=4687.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  52%|█████▏    | 630/1208 [17:14<15:49,  1.64s/it, loss=0.173, v_num=0, train/loss_simple_step=0.667, train/loss_vlb_step=0.0345, train/loss_step=0.667, global_step=4687.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  52%|█████▏    | 630/1208 [17:14<15:49,  1.64s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=0.0001, train/loss_step=0.0243, global_step=4687.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  52%|█████▏    | 631/1208 [17:15<15:46,  1.64s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=0.0001, train/loss_step=0.0243, global_step=4687.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  52%|█████▏    | 631/1208 [17:15<15:46,  1.64s/it, loss=0.159, v_num=0, train/loss_simple_step=0.080, train/loss_vlb_step=0.000263, train/loss_step=0.080, global_step=4687.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  52%|█████▏    | 632/1208 [17:18<15:46,  1.64s/it, loss=0.159, v_num=0, train/loss_simple_step=0.080, train/loss_vlb_step=0.000263, train/loss_step=0.080, global_step=4687.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  52%|█████▏    | 632/1208 [17:18<15:46,  1.64s/it, loss=0.183, v_num=0, train/loss_simple_step=0.539, train/loss_vlb_step=0.00529, train/loss_step=0.539, global_step=4687.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  52%|█████▏    | 633/1208 [17:19<15:44,  1.64s/it, loss=0.183, v_num=0, train/loss_simple_step=0.539, train/loss_vlb_step=0.00529, train/loss_step=0.539, global_step=4687.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  52%|█████▏    | 633/1208 [17:19<15:44,  1.64s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0801, train/loss_vlb_step=0.000266, train/loss_step=0.0801, global_step=4688.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  52%|█████▏    | 634/1208 [17:20<15:41,  1.64s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0801, train/loss_vlb_step=0.000266, train/loss_step=0.0801, global_step=4688.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  52%|█████▏    | 634/1208 [17:20<15:41,  1.64s/it, loss=0.182, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000548, train/loss_step=0.156, global_step=4688.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  53%|█████▎    | 635/1208 [17:21<15:39,  1.64s/it, loss=0.182, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000548, train/loss_step=0.156, global_step=4688.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  53%|█████▎    | 635/1208 [17:21<15:39,  1.64s/it, loss=0.152, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.00067, train/loss_step=0.185, global_step=4688.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  53%|█████▎    | 636/1208 [17:24<15:39,  1.64s/it, loss=0.152, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.00067, train/loss_step=0.185, global_step=4688.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  53%|█████▎    | 636/1208 [17:24<15:39,  1.64s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0725, train/loss_vlb_step=0.000248, train/loss_step=0.0725, global_step=4688.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  53%|█████▎    | 637/1208 [17:25<15:37,  1.64s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0725, train/loss_vlb_step=0.000248, train/loss_step=0.0725, global_step=4688.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  53%|█████▎    | 637/1208 [17:25<15:37,  1.64s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.41e-5, train/loss_step=0.00241, global_step=4689.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  53%|█████▎    | 638/1208 [17:26<15:34,  1.64s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.41e-5, train/loss_step=0.00241, global_step=4689.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  53%|█████▎    | 638/1208 [17:26<15:34,  1.64s/it, loss=0.164, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00205, train/loss_step=0.338, global_step=4689.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  53%|█████▎    | 639/1208 [17:27<15:32,  1.64s/it, loss=0.164, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00205, train/loss_step=0.338, global_step=4689.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  53%|█████▎    | 639/1208 [17:27<15:32,  1.64s/it, loss=0.175, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000874, train/loss_step=0.222, global_step=4689.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  53%|█████▎    | 640/1208 [17:30<15:32,  1.64s/it, loss=0.175, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000874, train/loss_step=0.222, global_step=4689.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  53%|█████▎    | 640/1208 [17:30<15:32,  1.64s/it, loss=0.204, v_num=0, train/loss_simple_step=0.579, train/loss_vlb_step=0.0154, train/loss_step=0.579, global_step=4689.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  53%|█████▎    | 641/1208 [17:31<15:29,  1.64s/it, loss=0.204, v_num=0, train/loss_simple_step=0.579, train/loss_vlb_step=0.0154, train/loss_step=0.579, global_step=4689.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  53%|█████▎    | 641/1208 [17:31<15:29,  1.64s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0634, train/loss_vlb_step=0.00022, train/loss_step=0.0634, global_step=4690.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  53%|█████▎    | 642/1208 [17:32<15:27,  1.64s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0634, train/loss_vlb_step=0.00022, train/loss_step=0.0634, global_step=4690.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  53%|█████▎    | 642/1208 [17:32<15:27,  1.64s/it, loss=0.195, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00131, train/loss_step=0.291, global_step=4690.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  53%|█████▎    | 643/1208 [17:33<15:25,  1.64s/it, loss=0.195, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00131, train/loss_step=0.291, global_step=4690.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  53%|█████▎    | 643/1208 [17:33<15:25,  1.64s/it, loss=0.208, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00105, train/loss_step=0.276, global_step=4690.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  53%|█████▎    | 644/1208 [17:36<15:24,  1.64s/it, loss=0.208, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00105, train/loss_step=0.276, global_step=4690.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  53%|█████▎    | 644/1208 [17:36<15:24,  1.64s/it, loss=0.204, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.05e-5, train/loss_step=0.011, global_step=4690.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  53%|█████▎    | 645/1208 [17:37<15:22,  1.64s/it, loss=0.204, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.05e-5, train/loss_step=0.011, global_step=4690.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  53%|█████▎    | 645/1208 [17:37<15:22,  1.64s/it, loss=0.209, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.00036, train/loss_step=0.109, global_step=4691.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  53%|█████▎    | 646/1208 [17:38<15:20,  1.64s/it, loss=0.209, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.00036, train/loss_step=0.109, global_step=4691.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  53%|█████▎    | 646/1208 [17:38<15:20,  1.64s/it, loss=0.225, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00332, train/loss_step=0.401, global_step=4691.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  54%|█████▎    | 647/1208 [17:39<15:18,  1.64s/it, loss=0.225, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00332, train/loss_step=0.401, global_step=4691.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  54%|█████▎    | 647/1208 [17:39<15:18,  1.64s/it, loss=0.227, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000176, train/loss_step=0.0514, global_step=4691.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  54%|█████▎    | 648/1208 [17:42<15:17,  1.64s/it, loss=0.227, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000176, train/loss_step=0.0514, global_step=4691.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  54%|█████▎    | 648/1208 [17:42<15:17,  1.64s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0522, train/loss_vlb_step=0.000189, train/loss_step=0.0522, global_step=4691.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  54%|█████▎    | 649/1208 [17:43<15:15,  1.64s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0522, train/loss_vlb_step=0.000189, train/loss_step=0.0522, global_step=4691.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  54%|█████▎    | 649/1208 [17:43<15:15,  1.64s/it, loss=0.207, v_num=0, train/loss_simple_step=0.604, train/loss_vlb_step=0.0141, train/loss_step=0.604, global_step=4692.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  54%|█████▍    | 650/1208 [17:44<15:13,  1.64s/it, loss=0.207, v_num=0, train/loss_simple_step=0.604, train/loss_vlb_step=0.0141, train/loss_step=0.604, global_step=4692.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  54%|█████▍    | 650/1208 [17:44<15:13,  1.64s/it, loss=0.213, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000506, train/loss_step=0.153, global_step=4692.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  54%|█████▍    | 651/1208 [17:45<15:11,  1.64s/it, loss=0.213, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000506, train/loss_step=0.153, global_step=4692.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  54%|█████▍    | 651/1208 [17:45<15:11,  1.64s/it, loss=0.212, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.00016, train/loss_step=0.0457, global_step=4692.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  54%|█████▍    | 652/1208 [17:48<15:10,  1.64s/it, loss=0.212, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.00016, train/loss_step=0.0457, global_step=4692.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  54%|█████▍    | 652/1208 [17:48<15:10,  1.64s/it, loss=0.196, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000938, train/loss_step=0.228, global_step=4692.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  54%|█████▍    | 653/1208 [17:49<15:08,  1.64s/it, loss=0.196, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000938, train/loss_step=0.228, global_step=4692.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  54%|█████▍    | 653/1208 [17:49<15:08,  1.64s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.62e-5, train/loss_step=0.0212, global_step=4693.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  54%|█████▍    | 654/1208 [17:50<15:06,  1.64s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.62e-5, train/loss_step=0.0212, global_step=4693.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  54%|█████▍    | 654/1208 [17:50<15:06,  1.64s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00793, train/loss_vlb_step=3.85e-5, train/loss_step=0.00793, global_step=4693.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  54%|█████▍    | 655/1208 [17:51<15:04,  1.64s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00793, train/loss_vlb_step=3.85e-5, train/loss_step=0.00793, global_step=4693.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  54%|█████▍    | 655/1208 [17:51<15:04,  1.64s/it, loss=0.19, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00112, train/loss_step=0.270, global_step=4693.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]     Epoch 15:  54%|█████▍    | 656/1208 [17:53<15:03,  1.64s/it, loss=0.19, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00112, train/loss_step=0.270, global_step=4693.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  54%|█████▍    | 656/1208 [17:53<15:03,  1.64s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0529, train/loss_vlb_step=0.000181, train/loss_step=0.0529, global_step=4693.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  54%|█████▍    | 657/1208 [17:54<15:01,  1.64s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0529, train/loss_vlb_step=0.000181, train/loss_step=0.0529, global_step=4693.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  54%|█████▍    | 657/1208 [17:54<15:01,  1.64s/it, loss=0.235, v_num=0, train/loss_simple_step=0.927, train/loss_vlb_step=0.467, train/loss_step=0.927, global_step=4694.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]     Epoch 15:  54%|█████▍    | 658/1208 [17:55<14:59,  1.64s/it, loss=0.235, v_num=0, train/loss_simple_step=0.927, train/loss_vlb_step=0.467, train/loss_step=0.927, global_step=4694.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  54%|█████▍    | 658/1208 [17:55<14:59,  1.64s/it, loss=0.219, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=7.94e-5, train/loss_step=0.0193, global_step=4694.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  55%|█████▍    | 659/1208 [17:56<14:57,  1.63s/it, loss=0.219, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=7.94e-5, train/loss_step=0.0193, global_step=4694.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  55%|█████▍    | 659/1208 [17:56<14:57,  1.63s/it, loss=0.217, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.0006, train/loss_step=0.169, global_step=4694.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  55%|█████▍    | 660/1208 [17:59<14:56,  1.64s/it, loss=0.217, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.0006, train/loss_step=0.169, global_step=4694.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  55%|█████▍    | 660/1208 [17:59<14:56,  1.64s/it, loss=0.202, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00147, train/loss_step=0.284, global_step=4694.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  55%|█████▍    | 661/1208 [18:00<14:54,  1.64s/it, loss=0.202, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00147, train/loss_step=0.284, global_step=4694.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  55%|█████▍    | 661/1208 [18:00<14:54,  1.64s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.000102, train/loss_step=0.0248, global_step=4695.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  55%|█████▍    | 662/1208 [18:01<14:52,  1.63s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.000102, train/loss_step=0.0248, global_step=4695.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  55%|█████▍    | 662/1208 [18:01<14:52,  1.63s/it, loss=0.193, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000495, train/loss_step=0.149, global_step=4695.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  55%|█████▍    | 663/1208 [18:02<14:50,  1.63s/it, loss=0.193, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000495, train/loss_step=0.149, global_step=4695.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  55%|█████▍    | 663/1208 [18:02<14:50,  1.63s/it, loss=0.186, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000484, train/loss_step=0.145, global_step=4695.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  55%|█████▍    | 664/1208 [18:05<14:49,  1.64s/it, loss=0.186, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000484, train/loss_step=0.145, global_step=4695.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  55%|█████▍    | 664/1208 [18:05<14:49,  1.64s/it, loss=0.208, v_num=0, train/loss_simple_step=0.437, train/loss_vlb_step=0.00375, train/loss_step=0.437, global_step=4695.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  55%|█████▌    | 665/1208 [18:06<14:47,  1.63s/it, loss=0.208, v_num=0, train/loss_simple_step=0.437, train/loss_vlb_step=0.00375, train/loss_step=0.437, global_step=4695.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  55%|█████▌    | 665/1208 [18:06<14:47,  1.63s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=6.04e-5, train/loss_step=0.0132, global_step=4696.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  55%|█████▌    | 666/1208 [18:07<14:45,  1.63s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=6.04e-5, train/loss_step=0.0132, global_step=4696.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  55%|█████▌    | 666/1208 [18:07<14:45,  1.63s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=3.64e-5, train/loss_step=0.0072, global_step=4696.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  55%|█████▌    | 667/1208 [18:08<14:43,  1.63s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=3.64e-5, train/loss_step=0.0072, global_step=4696.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  55%|█████▌    | 667/1208 [18:08<14:43,  1.63s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.67e-5, train/loss_step=0.0215, global_step=4696.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  55%|█████▌    | 668/1208 [18:11<14:42,  1.63s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.67e-5, train/loss_step=0.0215, global_step=4696.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  55%|█████▌    | 668/1208 [18:11<14:42,  1.63s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000142, train/loss_step=0.0378, global_step=4696.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  55%|█████▌    | 669/1208 [18:12<14:40,  1.63s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000142, train/loss_step=0.0378, global_step=4696.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  55%|█████▌    | 669/1208 [18:12<14:40,  1.63s/it, loss=0.185, v_num=0, train/loss_simple_step=0.682, train/loss_vlb_step=0.0255, train/loss_step=0.682, global_step=4697.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  55%|█████▌    | 670/1208 [18:13<14:38,  1.63s/it, loss=0.185, v_num=0, train/loss_simple_step=0.682, train/loss_vlb_step=0.0255, train/loss_step=0.682, global_step=4697.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  55%|█████▌    | 670/1208 [18:13<14:38,  1.63s/it, loss=0.178, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.36e-5, train/loss_step=0.015, global_step=4697.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  56%|█████▌    | 671/1208 [18:14<14:36,  1.63s/it, loss=0.178, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.36e-5, train/loss_step=0.015, global_step=4697.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  56%|█████▌    | 671/1208 [18:14<14:36,  1.63s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00539, train/loss_vlb_step=2.69e-5, train/loss_step=0.00539, global_step=4697.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  56%|█████▌    | 672/1208 [18:17<14:35,  1.63s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00539, train/loss_vlb_step=2.69e-5, train/loss_step=0.00539, global_step=4697.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  56%|█████▌    | 672/1208 [18:17<14:35,  1.63s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0746, train/loss_vlb_step=0.000255, train/loss_step=0.0746, global_step=4697.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  56%|█████▌    | 673/1208 [18:18<14:33,  1.63s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0746, train/loss_vlb_step=0.000255, train/loss_step=0.0746, global_step=4697.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  56%|█████▌    | 673/1208 [18:18<14:33,  1.63s/it, loss=0.192, v_num=0, train/loss_simple_step=0.489, train/loss_vlb_step=0.00601, train/loss_step=0.489, global_step=4698.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  56%|█████▌    | 674/1208 [18:19<14:31,  1.63s/it, loss=0.192, v_num=0, train/loss_simple_step=0.489, train/loss_vlb_step=0.00601, train/loss_step=0.489, global_step=4698.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  56%|█████▌    | 674/1208 [18:19<14:31,  1.63s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0717, train/loss_vlb_step=0.00024, train/loss_step=0.0717, global_step=4698.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  56%|█████▌    | 675/1208 [18:20<14:29,  1.63s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0717, train/loss_vlb_step=0.00024, train/loss_step=0.0717, global_step=4698.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  56%|█████▌    | 675/1208 [18:20<14:29,  1.63s/it, loss=0.193, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000928, train/loss_step=0.226, global_step=4698.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  56%|█████▌    | 676/1208 [18:23<14:28,  1.63s/it, loss=0.193, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000928, train/loss_step=0.226, global_step=4698.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  56%|█████▌    | 676/1208 [18:23<14:28,  1.63s/it, loss=0.207, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00159, train/loss_step=0.350, global_step=4698.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  56%|█████▌    | 677/1208 [18:24<14:26,  1.63s/it, loss=0.207, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00159, train/loss_step=0.350, global_step=4698.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  56%|█████▌    | 677/1208 [18:24<14:26,  1.63s/it, loss=0.173, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000948, train/loss_step=0.245, global_step=4699.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  56%|█████▌    | 678/1208 [18:25<14:24,  1.63s/it, loss=0.173, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000948, train/loss_step=0.245, global_step=4699.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  56%|█████▌    | 678/1208 [18:25<14:24,  1.63s/it, loss=0.179, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000411, train/loss_step=0.125, global_step=4699.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  56%|█████▌    | 679/1208 [18:26<14:22,  1.63s/it, loss=0.179, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000411, train/loss_step=0.125, global_step=4699.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  56%|█████▌    | 679/1208 [18:26<14:22,  1.63s/it, loss=0.19, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00291, train/loss_step=0.392, global_step=4699.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  56%|█████▋    | 680/1208 [18:29<14:21,  1.63s/it, loss=0.19, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00291, train/loss_step=0.392, global_step=4699.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  56%|█████▋    | 680/1208 [18:29<14:21,  1.63s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0315, train/loss_vlb_step=0.000119, train/loss_step=0.0315, global_step=4699.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  56%|█████▋    | 681/1208 [18:30<14:19,  1.63s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0315, train/loss_vlb_step=0.000119, train/loss_step=0.0315, global_step=4699.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  56%|█████▋    | 681/1208 [18:30<14:19,  1.63s/it, loss=0.177, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.15e-5, train/loss_step=0.017, global_step=4700.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  56%|█████▋    | 682/1208 [18:31<14:17,  1.63s/it, loss=0.177, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.15e-5, train/loss_step=0.017, global_step=4700.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  56%|█████▋    | 682/1208 [18:31<14:17,  1.63s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00283, train/loss_vlb_step=1.61e-5, train/loss_step=0.00283, global_step=4700.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  57%|█████▋    | 683/1208 [18:32<14:15,  1.63s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00283, train/loss_vlb_step=1.61e-5, train/loss_step=0.00283, global_step=4700.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  57%|█████▋    | 683/1208 [18:32<14:15,  1.63s/it, loss=0.169, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000454, train/loss_step=0.137, global_step=4700.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  57%|█████▋    | 684/1208 [18:35<14:14,  1.63s/it, loss=0.169, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000454, train/loss_step=0.137, global_step=4700.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  57%|█████▋    | 684/1208 [18:35<14:14,  1.63s/it, loss=0.148, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.92e-5, train/loss_step=0.019, global_step=4700.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  57%|█████▋    | 685/1208 [18:36<14:12,  1.63s/it, loss=0.148, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.92e-5, train/loss_step=0.019, global_step=4700.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  57%|█████▋    | 685/1208 [18:36<14:12,  1.63s/it, loss=0.15, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000185, train/loss_step=0.050, global_step=4701.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  57%|█████▋    | 686/1208 [18:37<14:10,  1.63s/it, loss=0.15, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000185, train/loss_step=0.050, global_step=4701.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  57%|█████▋    | 686/1208 [18:37<14:10,  1.63s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0796, train/loss_vlb_step=0.000264, train/loss_step=0.0796, global_step=4701.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  57%|█████▋    | 687/1208 [18:38<14:08,  1.63s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0796, train/loss_vlb_step=0.000264, train/loss_step=0.0796, global_step=4701.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  57%|█████▋    | 687/1208 [18:38<14:08,  1.63s/it, loss=0.164, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000842, train/loss_step=0.235, global_step=4701.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  57%|█████▋    | 688/1208 [18:41<14:07,  1.63s/it, loss=0.164, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000842, train/loss_step=0.235, global_step=4701.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  57%|█████▋    | 688/1208 [18:41<14:07,  1.63s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=9.52e-5, train/loss_step=0.0244, global_step=4701.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  57%|█████▋    | 689/1208 [18:42<14:05,  1.63s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=9.52e-5, train/loss_step=0.0244, global_step=4701.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  57%|█████▋    | 689/1208 [18:42<14:05,  1.63s/it, loss=0.145, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00152, train/loss_step=0.312, global_step=4702.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  57%|█████▋    | 690/1208 [18:43<14:03,  1.63s/it, loss=0.145, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00152, train/loss_step=0.312, global_step=4702.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  57%|█████▋    | 690/1208 [18:43<14:03,  1.63s/it, loss=0.166, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00369, train/loss_step=0.430, global_step=4702.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  57%|█████▋    | 691/1208 [18:44<14:01,  1.63s/it, loss=0.166, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00369, train/loss_step=0.430, global_step=4702.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  57%|█████▋    | 691/1208 [18:44<14:01,  1.63s/it, loss=0.182, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00166, train/loss_step=0.337, global_step=4702.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  57%|█████▋    | 692/1208 [18:47<14:00,  1.63s/it, loss=0.182, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00166, train/loss_step=0.337, global_step=4702.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  57%|█████▋    | 692/1208 [18:47<14:00,  1.63s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.09e-5, train/loss_step=0.0113, global_step=4702.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  57%|█████▋    | 693/1208 [18:48<13:58,  1.63s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.09e-5, train/loss_step=0.0113, global_step=4702.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  57%|█████▋    | 693/1208 [18:48<13:58,  1.63s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0936, train/loss_vlb_step=0.00031, train/loss_step=0.0936, global_step=4703.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  57%|█████▋    | 694/1208 [18:49<13:56,  1.63s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0936, train/loss_vlb_step=0.00031, train/loss_step=0.0936, global_step=4703.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  57%|█████▋    | 694/1208 [18:49<13:56,  1.63s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.04e-5, train/loss_step=0.00173, global_step=4703.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  58%|█████▊    | 695/1208 [18:50<13:54,  1.63s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.04e-5, train/loss_step=0.00173, global_step=4703.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  58%|█████▊    | 695/1208 [18:50<13:54,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000504, train/loss_step=0.151, global_step=4703.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  58%|█████▊    | 696/1208 [18:53<13:53,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000504, train/loss_step=0.151, global_step=4703.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  58%|█████▊    | 696/1208 [18:53<13:53,  1.63s/it, loss=0.145, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000784, train/loss_step=0.206, global_step=4703.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  58%|█████▊    | 697/1208 [18:54<13:51,  1.63s/it, loss=0.145, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000784, train/loss_step=0.206, global_step=4703.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  58%|█████▊    | 697/1208 [18:54<13:51,  1.63s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=9.63e-6, train/loss_step=0.00161, global_step=4704.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  58%|█████▊    | 698/1208 [18:55<13:49,  1.63s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=9.63e-6, train/loss_step=0.00161, global_step=4704.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  58%|█████▊    | 698/1208 [18:55<13:49,  1.63s/it, loss=0.161, v_num=0, train/loss_simple_step=0.685, train/loss_vlb_step=0.0125, train/loss_step=0.685, global_step=4704.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]     Epoch 15:  58%|█████▊    | 699/1208 [18:56<13:47,  1.63s/it, loss=0.161, v_num=0, train/loss_simple_step=0.685, train/loss_vlb_step=0.0125, train/loss_step=0.685, global_step=4704.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  58%|█████▊    | 699/1208 [18:56<13:47,  1.63s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0616, train/loss_vlb_step=0.00021, train/loss_step=0.0616, global_step=4704.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  58%|█████▊    | 700/1208 [18:59<13:46,  1.63s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0616, train/loss_vlb_step=0.00021, train/loss_step=0.0616, global_step=4704.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  58%|█████▊    | 700/1208 [18:59<13:46,  1.63s/it, loss=0.155, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000902, train/loss_step=0.236, global_step=4704.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  58%|█████▊    | 701/1208 [19:00<13:44,  1.63s/it, loss=0.155, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000902, train/loss_step=0.236, global_step=4704.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  58%|█████▊    | 701/1208 [19:00<13:44,  1.63s/it, loss=0.164, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000704, train/loss_step=0.199, global_step=4705.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  58%|█████▊    | 702/1208 [19:01<13:42,  1.63s/it, loss=0.164, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000704, train/loss_step=0.199, global_step=4705.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  58%|█████▊    | 702/1208 [19:01<13:42,  1.63s/it, loss=0.171, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000465, train/loss_step=0.141, global_step=4705.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  58%|█████▊    | 703/1208 [19:02<13:40,  1.62s/it, loss=0.171, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000465, train/loss_step=0.141, global_step=4705.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  58%|█████▊    | 703/1208 [19:02<13:40,  1.62s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.43e-5, train/loss_step=0.0158, global_step=4705.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  58%|█████▊    | 704/1208 [19:05<13:39,  1.63s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.43e-5, train/loss_step=0.0158, global_step=4705.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  58%|█████▊    | 704/1208 [19:05<13:39,  1.63s/it, loss=0.165, v_num=0, train/loss_simple_step=0.030, train/loss_vlb_step=0.000109, train/loss_step=0.030, global_step=4705.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  58%|█████▊    | 705/1208 [19:06<13:37,  1.63s/it, loss=0.165, v_num=0, train/loss_simple_step=0.030, train/loss_vlb_step=0.000109, train/loss_step=0.030, global_step=4705.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  58%|█████▊    | 705/1208 [19:06<13:37,  1.63s/it, loss=0.172, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000687, train/loss_step=0.193, global_step=4706.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  58%|█████▊    | 706/1208 [19:07<13:35,  1.62s/it, loss=0.172, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000687, train/loss_step=0.193, global_step=4706.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  58%|█████▊    | 706/1208 [19:07<13:35,  1.62s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8e-5, train/loss_step=0.0194, global_step=4706.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  59%|█████▊    | 707/1208 [19:08<13:33,  1.62s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8e-5, train/loss_step=0.0194, global_step=4706.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  59%|█████▊    | 707/1208 [19:08<13:33,  1.62s/it, loss=0.174, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00167, train/loss_step=0.323, global_step=4706.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  59%|█████▊    | 708/1208 [19:10<13:32,  1.63s/it, loss=0.174, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00167, train/loss_step=0.323, global_step=4706.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  59%|█████▊    | 708/1208 [19:10<13:32,  1.63s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.89e-5, train/loss_step=0.0157, global_step=4706.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  59%|█████▊    | 709/1208 [19:11<13:30,  1.62s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.89e-5, train/loss_step=0.0157, global_step=4706.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  59%|█████▊    | 709/1208 [19:11<13:30,  1.62s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.2e-5, train/loss_step=0.00204, global_step=4707.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  59%|█████▉    | 710/1208 [19:12<13:28,  1.62s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.2e-5, train/loss_step=0.00204, global_step=4707.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  59%|█████▉    | 710/1208 [19:12<13:28,  1.62s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000105, train/loss_step=0.0269, global_step=4707.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  59%|█████▉    | 711/1208 [19:13<13:26,  1.62s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000105, train/loss_step=0.0269, global_step=4707.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  59%|█████▉    | 711/1208 [19:13<13:26,  1.62s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00734, train/loss_vlb_step=3.56e-5, train/loss_step=0.00734, global_step=4707.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  59%|█████▉    | 712/1208 [19:16<13:25,  1.62s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00734, train/loss_vlb_step=3.56e-5, train/loss_step=0.00734, global_step=4707.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  59%|█████▉    | 712/1208 [19:16<13:25,  1.62s/it, loss=0.155, v_num=0, train/loss_simple_step=0.700, train/loss_vlb_step=0.0513, train/loss_step=0.700, global_step=4707.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]     Epoch 15:  59%|█████▉    | 713/1208 [19:17<13:23,  1.62s/it, loss=0.155, v_num=0, train/loss_simple_step=0.700, train/loss_vlb_step=0.0513, train/loss_step=0.700, global_step=4707.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  59%|█████▉    | 713/1208 [19:17<13:23,  1.62s/it, loss=0.163, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00099, train/loss_step=0.245, global_step=4708.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  59%|█████▉    | 714/1208 [19:18<13:21,  1.62s/it, loss=0.163, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00099, train/loss_step=0.245, global_step=4708.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  59%|█████▉    | 714/1208 [19:18<13:21,  1.62s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0844, train/loss_vlb_step=0.000277, train/loss_step=0.0844, global_step=4708.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  59%|█████▉    | 715/1208 [19:19<13:19,  1.62s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0844, train/loss_vlb_step=0.000277, train/loss_step=0.0844, global_step=4708.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  59%|█████▉    | 715/1208 [19:19<13:19,  1.62s/it, loss=0.162, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000153, train/loss_step=0.042, global_step=4708.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  59%|█████▉    | 716/1208 [19:22<13:18,  1.62s/it, loss=0.162, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000153, train/loss_step=0.042, global_step=4708.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  59%|█████▉    | 716/1208 [19:22<13:18,  1.62s/it, loss=0.176, v_num=0, train/loss_simple_step=0.487, train/loss_vlb_step=0.00522, train/loss_step=0.487, global_step=4708.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  59%|█████▉    | 717/1208 [19:23<13:16,  1.62s/it, loss=0.176, v_num=0, train/loss_simple_step=0.487, train/loss_vlb_step=0.00522, train/loss_step=0.487, global_step=4708.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  59%|█████▉    | 717/1208 [19:23<13:16,  1.62s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0852, train/loss_vlb_step=0.000282, train/loss_step=0.0852, global_step=4709.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  59%|█████▉    | 718/1208 [19:24<13:14,  1.62s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0852, train/loss_vlb_step=0.000282, train/loss_step=0.0852, global_step=4709.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  59%|█████▉    | 718/1208 [19:24<13:14,  1.62s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.43e-5, train/loss_step=0.00244, global_step=4709.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  60%|█████▉    | 719/1208 [19:25<13:12,  1.62s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.43e-5, train/loss_step=0.00244, global_step=4709.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  60%|█████▉    | 719/1208 [19:25<13:12,  1.62s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0671, train/loss_vlb_step=0.000222, train/loss_step=0.0671, global_step=4709.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  60%|█████▉    | 720/1208 [19:28<13:12,  1.62s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0671, train/loss_vlb_step=0.000222, train/loss_step=0.0671, global_step=4709.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  60%|█████▉    | 720/1208 [19:28<13:12,  1.62s/it, loss=0.159, v_num=0, train/loss_simple_step=0.501, train/loss_vlb_step=0.00429, train/loss_step=0.501, global_step=4709.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  60%|█████▉    | 721/1208 [19:29<13:10,  1.62s/it, loss=0.159, v_num=0, train/loss_simple_step=0.501, train/loss_vlb_step=0.00429, train/loss_step=0.501, global_step=4709.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  60%|█████▉    | 721/1208 [19:29<13:10,  1.62s/it, loss=0.157, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000537, train/loss_step=0.162, global_step=4710.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  60%|█████▉    | 722/1208 [19:30<13:08,  1.62s/it, loss=0.157, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000537, train/loss_step=0.162, global_step=4710.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  60%|█████▉    | 722/1208 [19:30<13:08,  1.62s/it, loss=0.157, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000403, train/loss_step=0.122, global_step=4710.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  60%|█████▉    | 723/1208 [19:31<13:05,  1.62s/it, loss=0.157, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000403, train/loss_step=0.122, global_step=4710.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  60%|█████▉    | 723/1208 [19:31<13:05,  1.62s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0938, train/loss_vlb_step=0.000318, train/loss_step=0.0938, global_step=4710.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  60%|█████▉    | 724/1208 [19:34<13:05,  1.62s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0938, train/loss_vlb_step=0.000318, train/loss_step=0.0938, global_step=4710.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  60%|█████▉    | 724/1208 [19:34<13:05,  1.62s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.83e-5, train/loss_step=0.0156, global_step=4710.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  60%|██████    | 725/1208 [19:35<13:03,  1.62s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.83e-5, train/loss_step=0.0156, global_step=4710.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  60%|██████    | 725/1208 [19:35<13:03,  1.62s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=8.65e-6, train/loss_step=0.00145, global_step=4711.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  60%|██████    | 726/1208 [19:36<13:01,  1.62s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=8.65e-6, train/loss_step=0.00145, global_step=4711.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  60%|██████    | 726/1208 [19:36<13:01,  1.62s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=6.95e-5, train/loss_step=0.0169, global_step=4711.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  60%|██████    | 727/1208 [19:37<12:59,  1.62s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=6.95e-5, train/loss_step=0.0169, global_step=4711.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  60%|██████    | 727/1208 [19:37<12:59,  1.62s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00435, train/loss_vlb_step=2.42e-5, train/loss_step=0.00435, global_step=4711.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  60%|██████    | 728/1208 [19:40<12:58,  1.62s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00435, train/loss_vlb_step=2.42e-5, train/loss_step=0.00435, global_step=4711.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  60%|██████    | 728/1208 [19:40<12:58,  1.62s/it, loss=0.141, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000529, train/loss_step=0.156, global_step=4711.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  60%|██████    | 729/1208 [19:41<12:56,  1.62s/it, loss=0.141, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000529, train/loss_step=0.156, global_step=4711.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  60%|██████    | 729/1208 [19:41<12:56,  1.62s/it, loss=0.156, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00124, train/loss_step=0.293, global_step=4712.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  60%|██████    | 730/1208 [19:42<12:54,  1.62s/it, loss=0.156, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00124, train/loss_step=0.293, global_step=4712.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  60%|██████    | 730/1208 [19:42<12:54,  1.62s/it, loss=0.159, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=4712.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  61%|██████    | 731/1208 [19:43<12:52,  1.62s/it, loss=0.159, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=4712.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  61%|██████    | 731/1208 [19:43<12:52,  1.62s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=8.84e-5, train/loss_step=0.0204, global_step=4712.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  61%|██████    | 732/1208 [19:46<12:51,  1.62s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=8.84e-5, train/loss_step=0.0204, global_step=4712.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  61%|██████    | 732/1208 [19:46<12:51,  1.62s/it, loss=0.138, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00117, train/loss_step=0.267, global_step=4712.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  61%|██████    | 733/1208 [19:47<12:49,  1.62s/it, loss=0.138, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00117, train/loss_step=0.267, global_step=4712.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  61%|██████    | 733/1208 [19:47<12:49,  1.62s/it, loss=0.134, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000531, train/loss_step=0.156, global_step=4713.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  61%|██████    | 734/1208 [19:48<12:47,  1.62s/it, loss=0.134, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000531, train/loss_step=0.156, global_step=4713.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  61%|██████    | 734/1208 [19:48<12:47,  1.62s/it, loss=0.146, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00163, train/loss_step=0.327, global_step=4713.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  61%|██████    | 735/1208 [19:49<12:45,  1.62s/it, loss=0.146, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00163, train/loss_step=0.327, global_step=4713.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  61%|██████    | 735/1208 [19:49<12:45,  1.62s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.32e-5, train/loss_step=0.0117, global_step=4713.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  61%|██████    | 736/1208 [19:52<12:44,  1.62s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.32e-5, train/loss_step=0.0117, global_step=4713.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  61%|██████    | 736/1208 [19:52<12:44,  1.62s/it, loss=0.131, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.00078, train/loss_step=0.222, global_step=4713.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  61%|██████    | 737/1208 [19:53<12:42,  1.62s/it, loss=0.131, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.00078, train/loss_step=0.222, global_step=4713.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  61%|██████    | 737/1208 [19:53<12:42,  1.62s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.64e-5, train/loss_step=0.00282, global_step=4714.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  61%|██████    | 738/1208 [19:54<12:40,  1.62s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.64e-5, train/loss_step=0.00282, global_step=4714.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  61%|██████    | 738/1208 [19:54<12:40,  1.62s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.55e-5, train/loss_step=0.00272, global_step=4714.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  61%|██████    | 739/1208 [19:55<12:38,  1.62s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.55e-5, train/loss_step=0.00272, global_step=4714.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  61%|██████    | 739/1208 [19:55<12:38,  1.62s/it, loss=0.13, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000421, train/loss_step=0.128, global_step=4714.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  61%|██████▏   | 740/1208 [19:58<12:37,  1.62s/it, loss=0.13, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000421, train/loss_step=0.128, global_step=4714.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  61%|██████▏   | 740/1208 [19:58<12:37,  1.62s/it, loss=0.107, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.000153, train/loss_step=0.041, global_step=4714.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  61%|██████▏   | 741/1208 [19:59<12:35,  1.62s/it, loss=0.107, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.000153, train/loss_step=0.041, global_step=4714.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  61%|██████▏   | 741/1208 [19:59<12:35,  1.62s/it, loss=0.124, v_num=0, train/loss_simple_step=0.504, train/loss_vlb_step=0.00464, train/loss_step=0.504, global_step=4715.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  61%|██████▏   | 742/1208 [20:00<12:33,  1.62s/it, loss=0.124, v_num=0, train/loss_simple_step=0.504, train/loss_vlb_step=0.00464, train/loss_step=0.504, global_step=4715.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  61%|██████▏   | 742/1208 [20:00<12:33,  1.62s/it, loss=0.128, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000681, train/loss_step=0.189, global_step=4715.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  62%|██████▏   | 743/1208 [20:01<12:31,  1.62s/it, loss=0.128, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000681, train/loss_step=0.189, global_step=4715.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  62%|██████▏   | 743/1208 [20:01<12:31,  1.62s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0839, train/loss_vlb_step=0.000276, train/loss_step=0.0839, global_step=4715.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  62%|██████▏   | 744/1208 [20:04<12:30,  1.62s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0839, train/loss_vlb_step=0.000276, train/loss_step=0.0839, global_step=4715.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  62%|██████▏   | 744/1208 [20:04<12:30,  1.62s/it, loss=0.147, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00311, train/loss_step=0.403, global_step=4715.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  62%|██████▏   | 745/1208 [20:05<12:28,  1.62s/it, loss=0.147, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00311, train/loss_step=0.403, global_step=4715.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  62%|██████▏   | 745/1208 [20:05<12:29,  1.62s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000108, train/loss_step=0.0267, global_step=4716.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  62%|██████▏   | 746/1208 [20:06<12:27,  1.62s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000108, train/loss_step=0.0267, global_step=4716.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  62%|██████▏   | 746/1208 [20:06<12:27,  1.62s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0522, train/loss_vlb_step=0.000184, train/loss_step=0.0522, global_step=4716.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  62%|██████▏   | 747/1208 [20:07<12:25,  1.62s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0522, train/loss_vlb_step=0.000184, train/loss_step=0.0522, global_step=4716.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  62%|██████▏   | 747/1208 [20:07<12:25,  1.62s/it, loss=0.15, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.39e-5, train/loss_step=0.012, global_step=4716.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  62%|██████▏   | 748/1208 [20:10<12:24,  1.62s/it, loss=0.15, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.39e-5, train/loss_step=0.012, global_step=4716.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  62%|██████▏   | 748/1208 [20:10<12:24,  1.62s/it, loss=0.152, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000707, train/loss_step=0.196, global_step=4716.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  62%|██████▏   | 749/1208 [20:11<12:22,  1.62s/it, loss=0.152, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000707, train/loss_step=0.196, global_step=4716.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  62%|██████▏   | 749/1208 [20:11<12:22,  1.62s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.51e-5, train/loss_step=0.0179, global_step=4717.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  62%|██████▏   | 750/1208 [20:12<12:20,  1.62s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.51e-5, train/loss_step=0.0179, global_step=4717.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  62%|██████▏   | 750/1208 [20:12<12:20,  1.62s/it, loss=0.156, v_num=0, train/loss_simple_step=0.467, train/loss_vlb_step=0.00675, train/loss_step=0.467, global_step=4717.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  62%|██████▏   | 751/1208 [20:13<12:18,  1.62s/it, loss=0.156, v_num=0, train/loss_simple_step=0.467, train/loss_vlb_step=0.00675, train/loss_step=0.467, global_step=4717.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  62%|██████▏   | 751/1208 [20:13<12:18,  1.62s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0097, train/loss_vlb_step=4.62e-5, train/loss_step=0.0097, global_step=4717.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  62%|██████▏   | 752/1208 [20:16<12:17,  1.62s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0097, train/loss_vlb_step=4.62e-5, train/loss_step=0.0097, global_step=4717.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  62%|██████▏   | 752/1208 [20:16<12:17,  1.62s/it, loss=0.15, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000506, train/loss_step=0.149, global_step=4717.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  62%|██████▏   | 753/1208 [20:17<12:15,  1.62s/it, loss=0.15, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000506, train/loss_step=0.149, global_step=4717.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  62%|██████▏   | 753/1208 [20:17<12:15,  1.62s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.8e-5, train/loss_step=0.00331, global_step=4718.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  62%|██████▏   | 754/1208 [20:18<12:13,  1.62s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.8e-5, train/loss_step=0.00331, global_step=4718.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  62%|██████▏   | 754/1208 [20:18<12:13,  1.62s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.27e-5, train/loss_step=0.00211, global_step=4718.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  62%|██████▎   | 755/1208 [20:19<12:11,  1.61s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.27e-5, train/loss_step=0.00211, global_step=4718.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  62%|██████▎   | 755/1208 [20:19<12:11,  1.61s/it, loss=0.135, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000661, train/loss_step=0.189, global_step=4718.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  63%|██████▎   | 756/1208 [20:21<12:10,  1.62s/it, loss=0.135, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000661, train/loss_step=0.189, global_step=4718.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  63%|██████▎   | 756/1208 [20:21<12:10,  1.62s/it, loss=0.157, v_num=0, train/loss_simple_step=0.662, train/loss_vlb_step=0.0169, train/loss_step=0.662, global_step=4718.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  63%|██████▎   | 757/1208 [20:22<12:08,  1.62s/it, loss=0.157, v_num=0, train/loss_simple_step=0.662, train/loss_vlb_step=0.0169, train/loss_step=0.662, global_step=4718.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  63%|██████▎   | 757/1208 [20:22<12:08,  1.62s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000135, train/loss_step=0.0363, global_step=4719.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  63%|██████▎   | 758/1208 [20:23<12:06,  1.61s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000135, train/loss_step=0.0363, global_step=4719.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  63%|██████▎   | 758/1208 [20:23<12:06,  1.61s/it, loss=0.176, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00223, train/loss_step=0.351, global_step=4719.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  63%|██████▎   | 759/1208 [20:24<12:04,  1.61s/it, loss=0.176, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00223, train/loss_step=0.351, global_step=4719.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  63%|██████▎   | 759/1208 [20:24<12:04,  1.61s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0965, train/loss_vlb_step=0.000319, train/loss_step=0.0965, global_step=4719.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  63%|██████▎   | 760/1208 [20:27<12:03,  1.62s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0965, train/loss_vlb_step=0.000319, train/loss_step=0.0965, global_step=4719.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  63%|██████▎   | 760/1208 [20:27<12:03,  1.62s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0098, train/loss_vlb_step=4.69e-5, train/loss_step=0.0098, global_step=4719.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  63%|██████▎   | 761/1208 [20:28<12:01,  1.61s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0098, train/loss_vlb_step=4.69e-5, train/loss_step=0.0098, global_step=4719.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  63%|██████▎   | 761/1208 [20:28<12:01,  1.61s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0699, train/loss_vlb_step=0.000242, train/loss_step=0.0699, global_step=4720.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  63%|██████▎   | 762/1208 [20:29<11:59,  1.61s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0699, train/loss_vlb_step=0.000242, train/loss_step=0.0699, global_step=4720.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  63%|██████▎   | 762/1208 [20:29<11:59,  1.61s/it, loss=0.151, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000642, train/loss_step=0.188, global_step=4720.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  63%|██████▎   | 763/1208 [20:30<11:57,  1.61s/it, loss=0.151, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000642, train/loss_step=0.188, global_step=4720.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  63%|██████▎   | 763/1208 [20:30<11:57,  1.61s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00838, train/loss_vlb_step=4.02e-5, train/loss_step=0.00838, global_step=4720.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  63%|██████▎   | 764/1208 [20:33<11:57,  1.61s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00838, train/loss_vlb_step=4.02e-5, train/loss_step=0.00838, global_step=4720.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  63%|██████▎   | 764/1208 [20:33<11:57,  1.61s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=4.93e-5, train/loss_step=0.0114, global_step=4720.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  63%|██████▎   | 765/1208 [20:34<11:55,  1.61s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=4.93e-5, train/loss_step=0.0114, global_step=4720.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  63%|██████▎   | 765/1208 [20:34<11:55,  1.61s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00364, train/loss_vlb_step=1.96e-5, train/loss_step=0.00364, global_step=4721.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  63%|██████▎   | 766/1208 [20:35<11:53,  1.61s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00364, train/loss_vlb_step=1.96e-5, train/loss_step=0.00364, global_step=4721.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  63%|██████▎   | 766/1208 [20:35<11:53,  1.61s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.98e-5, train/loss_step=0.0215, global_step=4721.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  63%|██████▎   | 767/1208 [20:36<11:51,  1.61s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.98e-5, train/loss_step=0.0215, global_step=4721.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  63%|██████▎   | 767/1208 [20:36<11:51,  1.61s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=3.78e-5, train/loss_step=0.00783, global_step=4721.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  64%|██████▎   | 768/1208 [20:39<11:50,  1.61s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=3.78e-5, train/loss_step=0.00783, global_step=4721.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  64%|██████▎   | 768/1208 [20:39<11:50,  1.61s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00552, train/loss_vlb_step=2.82e-5, train/loss_step=0.00552, global_step=4721.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  64%|██████▎   | 769/1208 [20:40<11:48,  1.61s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00552, train/loss_vlb_step=2.82e-5, train/loss_step=0.00552, global_step=4721.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  64%|██████▎   | 769/1208 [20:40<11:48,  1.61s/it, loss=0.129, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00122, train/loss_step=0.278, global_step=4722.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  64%|██████▎   | 770/1208 [20:41<11:46,  1.61s/it, loss=0.129, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00122, train/loss_step=0.278, global_step=4722.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  64%|██████▎   | 770/1208 [20:41<11:46,  1.61s/it, loss=0.114, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.0006, train/loss_step=0.171, global_step=4722.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  64%|██████▍   | 771/1208 [20:42<11:44,  1.61s/it, loss=0.114, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.0006, train/loss_step=0.171, global_step=4722.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  64%|██████▍   | 771/1208 [20:42<11:44,  1.61s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.97e-5, train/loss_step=0.00351, global_step=4722.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  64%|██████▍   | 772/1208 [20:45<11:43,  1.61s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.97e-5, train/loss_step=0.00351, global_step=4722.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  64%|██████▍   | 772/1208 [20:45<11:43,  1.61s/it, loss=0.126, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00346, train/loss_step=0.403, global_step=4722.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  64%|██████▍   | 773/1208 [20:46<11:41,  1.61s/it, loss=0.126, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00346, train/loss_step=0.403, global_step=4722.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  64%|██████▍   | 773/1208 [20:46<11:41,  1.61s/it, loss=0.136, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000737, train/loss_step=0.204, global_step=4723.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  64%|██████▍   | 774/1208 [20:47<11:39,  1.61s/it, loss=0.136, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000737, train/loss_step=0.204, global_step=4723.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  64%|██████▍   | 774/1208 [20:47<11:39,  1.61s/it, loss=0.143, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000494, train/loss_step=0.148, global_step=4723.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  64%|██████▍   | 775/1208 [20:48<11:37,  1.61s/it, loss=0.143, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000494, train/loss_step=0.148, global_step=4723.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  64%|██████▍   | 775/1208 [20:48<11:37,  1.61s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0731, train/loss_vlb_step=0.000248, train/loss_step=0.0731, global_step=4723.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  64%|██████▍   | 776/1208 [20:51<11:36,  1.61s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0731, train/loss_vlb_step=0.000248, train/loss_step=0.0731, global_step=4723.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  64%|██████▍   | 776/1208 [20:51<11:36,  1.61s/it, loss=0.111, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00042, train/loss_step=0.128, global_step=4723.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  64%|██████▍   | 777/1208 [20:52<11:34,  1.61s/it, loss=0.111, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00042, train/loss_step=0.128, global_step=4723.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  64%|██████▍   | 777/1208 [20:52<11:34,  1.61s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=3.35e-5, train/loss_step=0.00677, global_step=4724.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  64%|██████▍   | 778/1208 [20:53<11:32,  1.61s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=3.35e-5, train/loss_step=0.00677, global_step=4724.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  64%|██████▍   | 778/1208 [20:53<11:32,  1.61s/it, loss=0.092, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.19e-5, train/loss_step=0.00199, global_step=4724.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  64%|██████▍   | 779/1208 [20:54<11:30,  1.61s/it, loss=0.092, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.19e-5, train/loss_step=0.00199, global_step=4724.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  64%|██████▍   | 779/1208 [20:54<11:30,  1.61s/it, loss=0.0881, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.73e-5, train/loss_step=0.0179, global_step=4724.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  65%|██████▍   | 780/1208 [20:57<11:29,  1.61s/it, loss=0.0881, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.73e-5, train/loss_step=0.0179, global_step=4724.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  65%|██████▍   | 780/1208 [20:57<11:29,  1.61s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.00049, train/loss_step=0.145, global_step=4724.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  65%|██████▍   | 781/1208 [20:58<11:28,  1.61s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.00049, train/loss_step=0.145, global_step=4724.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  65%|██████▍   | 781/1208 [20:58<11:28,  1.61s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=1.75e-5, train/loss_step=0.00308, global_step=4725.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  65%|██████▍   | 782/1208 [20:59<11:26,  1.61s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=1.75e-5, train/loss_step=0.00308, global_step=4725.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  65%|██████▍   | 782/1208 [20:59<11:26,  1.61s/it, loss=0.084, v_num=0, train/loss_simple_step=0.0391, train/loss_vlb_step=0.000145, train/loss_step=0.0391, global_step=4725.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  65%|██████▍   | 783/1208 [21:00<11:24,  1.61s/it, loss=0.084, v_num=0, train/loss_simple_step=0.0391, train/loss_vlb_step=0.000145, train/loss_step=0.0391, global_step=4725.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  65%|██████▍   | 783/1208 [21:00<11:24,  1.61s/it, loss=0.0917, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000551, train/loss_step=0.162, global_step=4725.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  65%|██████▍   | 784/1208 [21:03<11:23,  1.61s/it, loss=0.0917, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000551, train/loss_step=0.162, global_step=4725.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  65%|██████▍   | 784/1208 [21:03<11:23,  1.61s/it, loss=0.11, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00277, train/loss_step=0.372, global_step=4725.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  65%|██████▍   | 785/1208 [21:04<11:21,  1.61s/it, loss=0.11, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00277, train/loss_step=0.372, global_step=4725.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  65%|██████▍   | 785/1208 [21:04<11:21,  1.61s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00669, train/loss_vlb_step=3.38e-5, train/loss_step=0.00669, global_step=4726.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  65%|██████▌   | 786/1208 [21:05<11:19,  1.61s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00669, train/loss_vlb_step=3.38e-5, train/loss_step=0.00669, global_step=4726.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  65%|██████▌   | 786/1208 [21:05<11:19,  1.61s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=1.07e-5, train/loss_step=0.00179, global_step=4726.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  65%|██████▌   | 787/1208 [21:06<11:17,  1.61s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=1.07e-5, train/loss_step=0.00179, global_step=4726.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  65%|██████▌   | 787/1208 [21:06<11:17,  1.61s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.58e-5, train/loss_step=0.0181, global_step=4726.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  65%|██████▌   | 788/1208 [21:09<11:16,  1.61s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.58e-5, train/loss_step=0.0181, global_step=4726.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  65%|██████▌   | 788/1208 [21:09<11:16,  1.61s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0902, train/loss_vlb_step=0.000296, train/loss_step=0.0902, global_step=4726.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  65%|██████▌   | 789/1208 [21:10<11:14,  1.61s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0902, train/loss_vlb_step=0.000296, train/loss_step=0.0902, global_step=4726.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  65%|██████▌   | 789/1208 [21:10<11:14,  1.61s/it, loss=0.12, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.00428, train/loss_step=0.406, global_step=4727.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  65%|██████▌   | 790/1208 [21:11<11:12,  1.61s/it, loss=0.12, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.00428, train/loss_step=0.406, global_step=4727.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  65%|██████▌   | 790/1208 [21:11<11:12,  1.61s/it, loss=0.126, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.0015, train/loss_step=0.300, global_step=4727.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  65%|██████▌   | 791/1208 [21:12<11:10,  1.61s/it, loss=0.126, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.0015, train/loss_step=0.300, global_step=4727.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  65%|██████▌   | 791/1208 [21:12<11:10,  1.61s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0844, train/loss_vlb_step=0.000283, train/loss_step=0.0844, global_step=4727.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  66%|██████▌   | 792/1208 [21:15<11:09,  1.61s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0844, train/loss_vlb_step=0.000283, train/loss_step=0.0844, global_step=4727.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  66%|██████▌   | 792/1208 [21:15<11:09,  1.61s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.66e-5, train/loss_step=0.0028, global_step=4727.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  66%|██████▌   | 793/1208 [21:16<11:07,  1.61s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.66e-5, train/loss_step=0.0028, global_step=4727.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  66%|██████▌   | 793/1208 [21:16<11:07,  1.61s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.41e-5, train/loss_step=0.00241, global_step=4728.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  66%|██████▌   | 794/1208 [21:17<11:05,  1.61s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.41e-5, train/loss_step=0.00241, global_step=4728.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  66%|██████▌   | 794/1208 [21:17<11:05,  1.61s/it, loss=0.111, v_num=0, train/loss_simple_step=0.358, train/loss_vlb_step=0.0029, train/loss_step=0.358, global_step=4728.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  66%|██████▌   | 795/1208 [21:18<11:04,  1.61s/it, loss=0.111, v_num=0, train/loss_simple_step=0.358, train/loss_vlb_step=0.0029, train/loss_step=0.358, global_step=4728.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  66%|██████▌   | 795/1208 [21:18<11:04,  1.61s/it, loss=0.116, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000602, train/loss_step=0.167, global_step=4728.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  66%|██████▌   | 796/1208 [21:21<11:03,  1.61s/it, loss=0.116, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000602, train/loss_step=0.167, global_step=4728.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  66%|██████▌   | 796/1208 [21:21<11:03,  1.61s/it, loss=0.121, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000893, train/loss_step=0.237, global_step=4728.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  66%|██████▌   | 797/1208 [21:22<11:01,  1.61s/it, loss=0.121, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000893, train/loss_step=0.237, global_step=4728.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  66%|██████▌   | 797/1208 [21:22<11:01,  1.61s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0622, train/loss_vlb_step=0.000212, train/loss_step=0.0622, global_step=4729.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  66%|██████▌   | 798/1208 [21:23<10:59,  1.61s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0622, train/loss_vlb_step=0.000212, train/loss_step=0.0622, global_step=4729.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  66%|██████▌   | 798/1208 [21:23<10:59,  1.61s/it, loss=0.158, v_num=0, train/loss_simple_step=0.695, train/loss_vlb_step=0.0509, train/loss_step=0.695, global_step=4729.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  66%|██████▌   | 799/1208 [21:24<10:57,  1.61s/it, loss=0.158, v_num=0, train/loss_simple_step=0.695, train/loss_vlb_step=0.0509, train/loss_step=0.695, global_step=4729.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  66%|██████▌   | 799/1208 [21:24<10:57,  1.61s/it, loss=0.186, v_num=0, train/loss_simple_step=0.577, train/loss_vlb_step=0.0116, train/loss_step=0.577, global_step=4729.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  66%|██████▌   | 800/1208 [21:27<10:56,  1.61s/it, loss=0.186, v_num=0, train/loss_simple_step=0.577, train/loss_vlb_step=0.0116, train/loss_step=0.577, global_step=4729.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  66%|██████▌   | 800/1208 [21:27<10:56,  1.61s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.2e-5, train/loss_step=0.00199, global_step=4729.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  66%|██████▋   | 801/1208 [21:28<10:54,  1.61s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.2e-5, train/loss_step=0.00199, global_step=4729.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  66%|██████▋   | 801/1208 [21:28<10:54,  1.61s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00708, train/loss_vlb_step=3.44e-5, train/loss_step=0.00708, global_step=4730.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  66%|██████▋   | 802/1208 [21:29<10:52,  1.61s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00708, train/loss_vlb_step=3.44e-5, train/loss_step=0.00708, global_step=4730.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  66%|██████▋   | 802/1208 [21:29<10:52,  1.61s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.61e-5, train/loss_step=0.0214, global_step=4730.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  66%|██████▋   | 803/1208 [21:30<10:50,  1.61s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.61e-5, train/loss_step=0.0214, global_step=4730.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  66%|██████▋   | 803/1208 [21:30<10:50,  1.61s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.6e-5, train/loss_step=0.0128, global_step=4730.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  67%|██████▋   | 804/1208 [21:33<10:50,  1.61s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.6e-5, train/loss_step=0.0128, global_step=4730.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  67%|██████▋   | 804/1208 [21:33<10:50,  1.61s/it, loss=0.162, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000649, train/loss_step=0.191, global_step=4730.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  67%|██████▋   | 805/1208 [21:34<10:48,  1.61s/it, loss=0.162, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000649, train/loss_step=0.191, global_step=4730.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  67%|██████▋   | 805/1208 [21:34<10:48,  1.61s/it, loss=0.173, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000798, train/loss_step=0.219, global_step=4731.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  67%|██████▋   | 806/1208 [21:35<10:46,  1.61s/it, loss=0.173, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000798, train/loss_step=0.219, global_step=4731.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  67%|██████▋   | 806/1208 [21:35<10:46,  1.61s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0647, train/loss_vlb_step=0.000224, train/loss_step=0.0647, global_step=4731.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  67%|██████▋   | 807/1208 [21:36<10:44,  1.61s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0647, train/loss_vlb_step=0.000224, train/loss_step=0.0647, global_step=4731.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  67%|██████▋   | 807/1208 [21:36<10:44,  1.61s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000156, train/loss_step=0.0454, global_step=4731.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  67%|██████▋   | 808/1208 [21:40<10:43,  1.61s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000156, train/loss_step=0.0454, global_step=4731.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  67%|██████▋   | 808/1208 [21:40<10:43,  1.61s/it, loss=0.2, v_num=0, train/loss_simple_step=0.553, train/loss_vlb_step=0.00929, train/loss_step=0.553, global_step=4731.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]     Epoch 15:  67%|██████▋   | 809/1208 [21:41<10:41,  1.61s/it, loss=0.2, v_num=0, train/loss_simple_step=0.553, train/loss_vlb_step=0.00929, train/loss_step=0.553, global_step=4731.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  67%|██████▋   | 809/1208 [21:41<10:41,  1.61s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00551, train/loss_vlb_step=2.87e-5, train/loss_step=0.00551, global_step=4732.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  67%|██████▋   | 810/1208 [21:42<10:39,  1.61s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00551, train/loss_vlb_step=2.87e-5, train/loss_step=0.00551, global_step=4732.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  67%|██████▋   | 810/1208 [21:42<10:39,  1.61s/it, loss=0.175, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000785, train/loss_step=0.200, global_step=4732.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  67%|██████▋   | 811/1208 [21:43<10:37,  1.61s/it, loss=0.175, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000785, train/loss_step=0.200, global_step=4732.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  67%|██████▋   | 811/1208 [21:43<10:37,  1.61s/it, loss=0.179, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000559, train/loss_step=0.166, global_step=4732.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  67%|██████▋   | 812/1208 [21:46<10:37,  1.61s/it, loss=0.179, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000559, train/loss_step=0.166, global_step=4732.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  67%|██████▋   | 812/1208 [21:46<10:37,  1.61s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0366, train/loss_vlb_step=0.000136, train/loss_step=0.0366, global_step=4732.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  67%|██████▋   | 813/1208 [21:47<10:35,  1.61s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0366, train/loss_vlb_step=0.000136, train/loss_step=0.0366, global_step=4732.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  67%|██████▋   | 813/1208 [21:47<10:35,  1.61s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00803, train/loss_vlb_step=3.79e-5, train/loss_step=0.00803, global_step=4733.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  67%|██████▋   | 814/1208 [21:48<10:33,  1.61s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00803, train/loss_vlb_step=3.79e-5, train/loss_step=0.00803, global_step=4733.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  67%|██████▋   | 814/1208 [21:48<10:33,  1.61s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0973, train/loss_vlb_step=0.00032, train/loss_step=0.0973, global_step=4733.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  67%|██████▋   | 815/1208 [21:49<10:31,  1.61s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0973, train/loss_vlb_step=0.00032, train/loss_step=0.0973, global_step=4733.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  67%|██████▋   | 815/1208 [21:49<10:31,  1.61s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0783, train/loss_vlb_step=0.000262, train/loss_step=0.0783, global_step=4733.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  68%|██████▊   | 816/1208 [21:52<10:30,  1.61s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0783, train/loss_vlb_step=0.000262, train/loss_step=0.0783, global_step=4733.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  68%|██████▊   | 816/1208 [21:52<10:30,  1.61s/it, loss=0.162, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.00069, train/loss_step=0.193, global_step=4733.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  68%|██████▊   | 817/1208 [21:53<10:28,  1.61s/it, loss=0.162, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.00069, train/loss_step=0.193, global_step=4733.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  68%|██████▊   | 817/1208 [21:53<10:28,  1.61s/it, loss=0.171, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.0012, train/loss_step=0.254, global_step=4734.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  68%|██████▊   | 818/1208 [21:54<10:26,  1.61s/it, loss=0.171, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.0012, train/loss_step=0.254, global_step=4734.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  68%|██████▊   | 818/1208 [21:54<10:26,  1.61s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.53e-5, train/loss_step=0.00273, global_step=4734.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  68%|██████▊   | 819/1208 [21:55<10:25,  1.61s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.53e-5, train/loss_step=0.00273, global_step=4734.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  68%|██████▊   | 819/1208 [21:56<10:25,  1.61s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00701, train/loss_vlb_step=3.55e-5, train/loss_step=0.00701, global_step=4734.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  68%|██████▊   | 820/1208 [21:59<10:24,  1.61s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00701, train/loss_vlb_step=3.55e-5, train/loss_step=0.00701, global_step=4734.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  68%|██████▊   | 820/1208 [21:59<10:24,  1.61s/it, loss=0.114, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=4734.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  68%|██████▊   | 821/1208 [22:00<10:22,  1.61s/it, loss=0.114, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=4734.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  68%|██████▊   | 821/1208 [22:00<10:22,  1.61s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000124, train/loss_step=0.0337, global_step=4735.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  68%|██████▊   | 822/1208 [22:01<10:20,  1.61s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000124, train/loss_step=0.0337, global_step=4735.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  68%|██████▊   | 822/1208 [22:01<10:20,  1.61s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000131, train/loss_step=0.0365, global_step=4735.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  68%|██████▊   | 823/1208 [22:02<10:18,  1.61s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000131, train/loss_step=0.0365, global_step=4735.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  68%|██████▊   | 823/1208 [22:02<10:18,  1.61s/it, loss=0.133, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00195, train/loss_step=0.349, global_step=4735.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  68%|██████▊   | 824/1208 [22:05<10:17,  1.61s/it, loss=0.133, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00195, train/loss_step=0.349, global_step=4735.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  68%|██████▊   | 824/1208 [22:05<10:17,  1.61s/it, loss=0.129, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000388, train/loss_step=0.118, global_step=4735.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  68%|██████▊   | 825/1208 [22:06<10:15,  1.61s/it, loss=0.129, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000388, train/loss_step=0.118, global_step=4735.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  68%|██████▊   | 825/1208 [22:06<10:15,  1.61s/it, loss=0.125, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000433, train/loss_step=0.132, global_step=4736.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  68%|██████▊   | 826/1208 [22:07<10:14,  1.61s/it, loss=0.125, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000433, train/loss_step=0.132, global_step=4736.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  68%|██████▊   | 826/1208 [22:07<10:14,  1.61s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.77e-5, train/loss_step=0.0127, global_step=4736.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  68%|██████▊   | 827/1208 [22:08<10:12,  1.61s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.77e-5, train/loss_step=0.0127, global_step=4736.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  68%|██████▊   | 827/1208 [22:08<10:12,  1.61s/it, loss=0.121, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.84e-5, train/loss_step=0.016, global_step=4736.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  69%|██████▊   | 828/1208 [22:12<10:11,  1.61s/it, loss=0.121, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.84e-5, train/loss_step=0.016, global_step=4736.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  69%|██████▊   | 828/1208 [22:12<10:11,  1.61s/it, loss=0.111, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00239, train/loss_step=0.355, global_step=4736.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  69%|██████▊   | 829/1208 [22:13<10:09,  1.61s/it, loss=0.111, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00239, train/loss_step=0.355, global_step=4736.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  69%|██████▊   | 829/1208 [22:13<10:09,  1.61s/it, loss=0.154, v_num=0, train/loss_simple_step=0.870, train/loss_vlb_step=0.220, train/loss_step=0.870, global_step=4737.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  69%|██████▊   | 830/1208 [22:14<10:07,  1.61s/it, loss=0.154, v_num=0, train/loss_simple_step=0.870, train/loss_vlb_step=0.220, train/loss_step=0.870, global_step=4737.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  69%|██████▊   | 830/1208 [22:14<10:07,  1.61s/it, loss=0.171, v_num=0, train/loss_simple_step=0.531, train/loss_vlb_step=0.00597, train/loss_step=0.531, global_step=4737.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  69%|██████▉   | 831/1208 [22:15<10:05,  1.61s/it, loss=0.171, v_num=0, train/loss_simple_step=0.531, train/loss_vlb_step=0.00597, train/loss_step=0.531, global_step=4737.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  69%|██████▉   | 831/1208 [22:15<10:05,  1.61s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000101, train/loss_step=0.0258, global_step=4737.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  69%|██████▉   | 832/1208 [22:18<10:04,  1.61s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000101, train/loss_step=0.0258, global_step=4737.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  69%|██████▉   | 832/1208 [22:18<10:04,  1.61s/it, loss=0.166, v_num=0, train/loss_simple_step=0.081, train/loss_vlb_step=0.000272, train/loss_step=0.081, global_step=4737.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  69%|██████▉   | 833/1208 [22:19<10:03,  1.61s/it, loss=0.166, v_num=0, train/loss_simple_step=0.081, train/loss_vlb_step=0.000272, train/loss_step=0.081, global_step=4737.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  69%|██████▉   | 833/1208 [22:19<10:03,  1.61s/it, loss=0.174, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000568, train/loss_step=0.168, global_step=4738.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  69%|██████▉   | 834/1208 [22:20<10:01,  1.61s/it, loss=0.174, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000568, train/loss_step=0.168, global_step=4738.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  69%|██████▉   | 834/1208 [22:20<10:01,  1.61s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=1.3e-5, train/loss_step=0.00224, global_step=4738.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  69%|██████▉   | 835/1208 [22:21<09:59,  1.61s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=1.3e-5, train/loss_step=0.00224, global_step=4738.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  69%|██████▉   | 835/1208 [22:21<09:59,  1.61s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000124, train/loss_step=0.0339, global_step=4738.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  69%|██████▉   | 836/1208 [22:24<09:58,  1.61s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000124, train/loss_step=0.0339, global_step=4738.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  69%|██████▉   | 836/1208 [22:24<09:58,  1.61s/it, loss=0.163, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000406, train/loss_step=0.124, global_step=4738.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  69%|██████▉   | 837/1208 [22:25<09:56,  1.61s/it, loss=0.163, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000406, train/loss_step=0.124, global_step=4738.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  69%|██████▉   | 837/1208 [22:25<09:56,  1.61s/it, loss=0.164, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00112, train/loss_step=0.266, global_step=4739.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  69%|██████▉   | 838/1208 [22:26<09:54,  1.61s/it, loss=0.164, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00112, train/loss_step=0.266, global_step=4739.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  69%|██████▉   | 838/1208 [22:26<09:54,  1.61s/it, loss=0.164, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.16e-5, train/loss_step=0.011, global_step=4739.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  69%|██████▉   | 839/1208 [22:27<09:52,  1.61s/it, loss=0.164, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.16e-5, train/loss_step=0.011, global_step=4739.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  69%|██████▉   | 839/1208 [22:27<09:52,  1.61s/it, loss=0.186, v_num=0, train/loss_simple_step=0.446, train/loss_vlb_step=0.00579, train/loss_step=0.446, global_step=4739.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  70%|██████▉   | 840/1208 [22:31<09:51,  1.61s/it, loss=0.186, v_num=0, train/loss_simple_step=0.446, train/loss_vlb_step=0.00579, train/loss_step=0.446, global_step=4739.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  70%|██████▉   | 840/1208 [22:31<09:51,  1.61s/it, loss=0.195, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00132, train/loss_step=0.286, global_step=4739.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  70%|██████▉   | 841/1208 [22:32<09:50,  1.61s/it, loss=0.195, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00132, train/loss_step=0.286, global_step=4739.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  70%|██████▉   | 841/1208 [22:32<09:50,  1.61s/it, loss=0.199, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000394, train/loss_step=0.119, global_step=4740.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  70%|██████▉   | 842/1208 [22:33<09:48,  1.61s/it, loss=0.199, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000394, train/loss_step=0.119, global_step=4740.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  70%|██████▉   | 842/1208 [22:33<09:48,  1.61s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0731, train/loss_vlb_step=0.000242, train/loss_step=0.0731, global_step=4740.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  70%|██████▉   | 843/1208 [22:34<09:46,  1.61s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0731, train/loss_vlb_step=0.000242, train/loss_step=0.0731, global_step=4740.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  70%|██████▉   | 843/1208 [22:34<09:46,  1.61s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0626, train/loss_vlb_step=0.000218, train/loss_step=0.0626, global_step=4740.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  70%|██████▉   | 844/1208 [22:37<09:45,  1.61s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0626, train/loss_vlb_step=0.000218, train/loss_step=0.0626, global_step=4740.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  70%|██████▉   | 844/1208 [22:37<09:45,  1.61s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0955, train/loss_vlb_step=0.000318, train/loss_step=0.0955, global_step=4740.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  70%|██████▉   | 845/1208 [22:38<09:43,  1.61s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0955, train/loss_vlb_step=0.000318, train/loss_step=0.0955, global_step=4740.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  70%|██████▉   | 845/1208 [22:38<09:43,  1.61s/it, loss=0.2, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00475, train/loss_step=0.430, global_step=4741.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]     Epoch 15:  70%|███████   | 846/1208 [22:39<09:41,  1.61s/it, loss=0.2, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00475, train/loss_step=0.430, global_step=4741.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  70%|███████   | 846/1208 [22:39<09:41,  1.61s/it, loss=0.2, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.17e-5, train/loss_step=0.00423, global_step=4741.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  70%|███████   | 847/1208 [22:40<09:39,  1.61s/it, loss=0.2, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.17e-5, train/loss_step=0.00423, global_step=4741.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  70%|███████   | 847/1208 [22:40<09:39,  1.61s/it, loss=0.2, v_num=0, train/loss_simple_step=0.00801, train/loss_vlb_step=3.83e-5, train/loss_step=0.00801, global_step=4741.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  70%|███████   | 848/1208 [22:43<09:39,  1.61s/it, loss=0.2, v_num=0, train/loss_simple_step=0.00801, train/loss_vlb_step=3.83e-5, train/loss_step=0.00801, global_step=4741.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  70%|███████   | 848/1208 [22:43<09:39,  1.61s/it, loss=0.203, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00242, train/loss_step=0.415, global_step=4741.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  70%|███████   | 849/1208 [22:45<09:37,  1.61s/it, loss=0.203, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00242, train/loss_step=0.415, global_step=4741.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  70%|███████   | 849/1208 [22:45<09:37,  1.61s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0953, train/loss_vlb_step=0.000313, train/loss_step=0.0953, global_step=4742.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  70%|███████   | 850/1208 [22:46<09:35,  1.61s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0953, train/loss_vlb_step=0.000313, train/loss_step=0.0953, global_step=4742.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  70%|███████   | 850/1208 [22:46<09:35,  1.61s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0076, train/loss_vlb_step=3.65e-5, train/loss_step=0.0076, global_step=4742.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  70%|███████   | 851/1208 [22:47<09:33,  1.61s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0076, train/loss_vlb_step=3.65e-5, train/loss_step=0.0076, global_step=4742.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  70%|███████   | 851/1208 [22:47<09:33,  1.61s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=1.72e-5, train/loss_step=0.00322, global_step=4742.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  71%|███████   | 852/1208 [22:50<09:32,  1.61s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=1.72e-5, train/loss_step=0.00322, global_step=4742.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  71%|███████   | 852/1208 [22:50<09:32,  1.61s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=7.79e-5, train/loss_step=0.0192, global_step=4742.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  71%|███████   | 853/1208 [22:51<09:30,  1.61s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=7.79e-5, train/loss_step=0.0192, global_step=4742.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  71%|███████   | 853/1208 [22:51<09:30,  1.61s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0541, train/loss_vlb_step=0.000188, train/loss_step=0.0541, global_step=4743.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  71%|███████   | 854/1208 [22:52<09:28,  1.61s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0541, train/loss_vlb_step=0.000188, train/loss_step=0.0541, global_step=4743.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  71%|███████   | 854/1208 [22:52<09:28,  1.61s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000139, train/loss_step=0.0363, global_step=4743.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  71%|███████   | 855/1208 [22:53<09:27,  1.61s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000139, train/loss_step=0.0363, global_step=4743.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  71%|███████   | 855/1208 [22:53<09:27,  1.61s/it, loss=0.133, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000367, train/loss_step=0.111, global_step=4743.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  71%|███████   | 856/1208 [22:56<09:26,  1.61s/it, loss=0.133, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000367, train/loss_step=0.111, global_step=4743.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  71%|███████   | 856/1208 [22:56<09:26,  1.61s/it, loss=0.134, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000445, train/loss_step=0.135, global_step=4743.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  71%|███████   | 857/1208 [22:57<09:24,  1.61s/it, loss=0.134, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000445, train/loss_step=0.135, global_step=4743.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  71%|███████   | 857/1208 [22:57<09:24,  1.61s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00568, train/loss_vlb_step=2.93e-5, train/loss_step=0.00568, global_step=4744.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  71%|███████   | 858/1208 [22:58<09:22,  1.61s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00568, train/loss_vlb_step=2.93e-5, train/loss_step=0.00568, global_step=4744.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  71%|███████   | 858/1208 [22:58<09:22,  1.61s/it, loss=0.131, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000907, train/loss_step=0.205, global_step=4744.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  71%|███████   | 859/1208 [22:59<09:20,  1.61s/it, loss=0.131, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000907, train/loss_step=0.205, global_step=4744.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  71%|███████   | 859/1208 [22:59<09:20,  1.61s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.19e-5, train/loss_step=0.00204, global_step=4744.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  71%|███████   | 860/1208 [23:03<09:19,  1.61s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.19e-5, train/loss_step=0.00204, global_step=4744.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  71%|███████   | 860/1208 [23:03<09:19,  1.61s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.00314, train/loss_vlb_step=1.81e-5, train/loss_step=0.00314, global_step=4744.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  71%|███████▏  | 861/1208 [23:04<09:17,  1.61s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.00314, train/loss_vlb_step=1.81e-5, train/loss_step=0.00314, global_step=4744.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  71%|███████▏  | 861/1208 [23:04<09:17,  1.61s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000341, train/loss_step=0.102, global_step=4745.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  71%|███████▏  | 862/1208 [23:05<09:16,  1.61s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000341, train/loss_step=0.102, global_step=4745.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  71%|███████▏  | 862/1208 [23:05<09:16,  1.61s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.0777, train/loss_vlb_step=0.000262, train/loss_step=0.0777, global_step=4745.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  71%|███████▏  | 863/1208 [23:06<09:14,  1.61s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.0777, train/loss_vlb_step=0.000262, train/loss_step=0.0777, global_step=4745.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  71%|███████▏  | 863/1208 [23:06<09:14,  1.61s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000455, train/loss_step=0.136, global_step=4745.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  72%|███████▏  | 864/1208 [23:09<09:13,  1.61s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000455, train/loss_step=0.136, global_step=4745.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  72%|███████▏  | 864/1208 [23:09<09:13,  1.61s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.0623, train/loss_vlb_step=0.000216, train/loss_step=0.0623, global_step=4745.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  72%|███████▏  | 865/1208 [23:10<09:11,  1.61s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.0623, train/loss_vlb_step=0.000216, train/loss_step=0.0623, global_step=4745.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  72%|███████▏  | 865/1208 [23:10<09:11,  1.61s/it, loss=0.0759, v_num=0, train/loss_simple_step=0.0354, train/loss_vlb_step=0.000134, train/loss_step=0.0354, global_step=4746.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  72%|███████▏  | 866/1208 [23:11<09:09,  1.61s/it, loss=0.0759, v_num=0, train/loss_simple_step=0.0354, train/loss_vlb_step=0.000134, train/loss_step=0.0354, global_step=4746.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  72%|███████▏  | 866/1208 [23:11<09:09,  1.61s/it, loss=0.0874, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.0011, train/loss_step=0.234, global_step=4746.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  72%|███████▏  | 867/1208 [23:12<09:07,  1.61s/it, loss=0.0874, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.0011, train/loss_step=0.234, global_step=4746.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  72%|███████▏  | 867/1208 [23:12<09:07,  1.61s/it, loss=0.0873, v_num=0, train/loss_simple_step=0.00667, train/loss_vlb_step=3.38e-5, train/loss_step=0.00667, global_step=4746.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  72%|███████▏  | 868/1208 [23:15<09:06,  1.61s/it, loss=0.0873, v_num=0, train/loss_simple_step=0.00667, train/loss_vlb_step=3.38e-5, train/loss_step=0.00667, global_step=4746.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  72%|███████▏  | 868/1208 [23:16<09:06,  1.61s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.519, train/loss_vlb_step=0.0108, train/loss_step=0.519, global_step=4746.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]     Epoch 15:  72%|███████▏  | 869/1208 [23:17<09:04,  1.61s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.519, train/loss_vlb_step=0.0108, train/loss_step=0.519, global_step=4746.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  72%|███████▏  | 869/1208 [23:17<09:04,  1.61s/it, loss=0.0891, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=9.93e-5, train/loss_step=0.0262, global_step=4747.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  72%|███████▏  | 870/1208 [23:18<09:03,  1.61s/it, loss=0.0891, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=9.93e-5, train/loss_step=0.0262, global_step=4747.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  72%|███████▏  | 870/1208 [23:18<09:03,  1.61s/it, loss=0.102, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.0012, train/loss_step=0.267, global_step=4747.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  72%|███████▏  | 871/1208 [23:19<09:01,  1.61s/it, loss=0.102, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.0012, train/loss_step=0.267, global_step=4747.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  72%|███████▏  | 871/1208 [23:19<09:01,  1.61s/it, loss=0.11, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000538, train/loss_step=0.159, global_step=4747.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  72%|███████▏  | 872/1208 [23:22<09:00,  1.61s/it, loss=0.11, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000538, train/loss_step=0.159, global_step=4747.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  72%|███████▏  | 872/1208 [23:22<09:00,  1.61s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.000113, train/loss_step=0.0285, global_step=4747.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  72%|███████▏  | 873/1208 [23:23<08:58,  1.61s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.000113, train/loss_step=0.0285, global_step=4747.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  72%|███████▏  | 873/1208 [23:23<08:58,  1.61s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1.28e-5, train/loss_step=0.00226, global_step=4748.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  72%|███████▏  | 874/1208 [23:24<08:56,  1.61s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1.28e-5, train/loss_step=0.00226, global_step=4748.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  72%|███████▏  | 874/1208 [23:24<08:56,  1.61s/it, loss=0.112, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000371, train/loss_step=0.112, global_step=4748.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  72%|███████▏  | 875/1208 [23:25<08:54,  1.61s/it, loss=0.112, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000371, train/loss_step=0.112, global_step=4748.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  72%|███████▏  | 875/1208 [23:25<08:54,  1.61s/it, loss=0.139, v_num=0, train/loss_simple_step=0.657, train/loss_vlb_step=0.0216, train/loss_step=0.657, global_step=4748.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  73%|███████▎  | 876/1208 [23:28<08:53,  1.61s/it, loss=0.139, v_num=0, train/loss_simple_step=0.657, train/loss_vlb_step=0.0216, train/loss_step=0.657, global_step=4748.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  73%|███████▎  | 876/1208 [23:28<08:53,  1.61s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000126, train/loss_step=0.0334, global_step=4748.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  73%|███████▎  | 877/1208 [23:29<08:52,  1.61s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000126, train/loss_step=0.0334, global_step=4748.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  73%|███████▎  | 877/1208 [23:29<08:52,  1.61s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0633, train/loss_vlb_step=0.000213, train/loss_step=0.0633, global_step=4749.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  73%|███████▎  | 878/1208 [23:30<08:50,  1.61s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0633, train/loss_vlb_step=0.000213, train/loss_step=0.0633, global_step=4749.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  73%|███████▎  | 878/1208 [23:30<08:50,  1.61s/it, loss=0.163, v_num=0, train/loss_simple_step=0.741, train/loss_vlb_step=0.0218, train/loss_step=0.741, global_step=4749.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  73%|███████▎  | 879/1208 [23:31<08:48,  1.61s/it, loss=0.163, v_num=0, train/loss_simple_step=0.741, train/loss_vlb_step=0.0218, train/loss_step=0.741, global_step=4749.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  73%|███████▎  | 879/1208 [23:31<08:48,  1.61s/it, loss=0.171, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000484, train/loss_step=0.146, global_step=4749.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  73%|███████▎  | 880/1208 [23:35<08:47,  1.61s/it, loss=0.171, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000484, train/loss_step=0.146, global_step=4749.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  73%|███████▎  | 880/1208 [23:35<08:47,  1.61s/it, loss=0.178, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000518, train/loss_step=0.150, global_step=4749.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  73%|███████▎  | 881/1208 [23:36<08:45,  1.61s/it, loss=0.178, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000518, train/loss_step=0.150, global_step=4749.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  73%|███████▎  | 881/1208 [23:36<08:45,  1.61s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00417, train/loss_vlb_step=2.19e-5, train/loss_step=0.00417, global_step=4750.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  73%|███████▎  | 882/1208 [23:37<08:43,  1.61s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00417, train/loss_vlb_step=2.19e-5, train/loss_step=0.00417, global_step=4750.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  73%|███████▎  | 882/1208 [23:37<08:43,  1.61s/it, loss=0.176, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000425, train/loss_step=0.129, global_step=4750.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  73%|███████▎  | 883/1208 [23:38<08:42,  1.61s/it, loss=0.176, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000425, train/loss_step=0.129, global_step=4750.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  73%|███████▎  | 883/1208 [23:38<08:42,  1.61s/it, loss=0.189, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00361, train/loss_step=0.407, global_step=4750.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  73%|███████▎  | 884/1208 [23:41<08:41,  1.61s/it, loss=0.189, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00361, train/loss_step=0.407, global_step=4750.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  73%|███████▎  | 884/1208 [23:41<08:41,  1.61s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000111, train/loss_step=0.0287, global_step=4750.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  73%|███████▎  | 885/1208 [23:42<08:39,  1.61s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000111, train/loss_step=0.0287, global_step=4750.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  73%|███████▎  | 885/1208 [23:42<08:39,  1.61s/it, loss=0.209, v_num=0, train/loss_simple_step=0.462, train/loss_vlb_step=0.00332, train/loss_step=0.462, global_step=4751.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  73%|███████▎  | 886/1208 [23:43<08:37,  1.61s/it, loss=0.209, v_num=0, train/loss_simple_step=0.462, train/loss_vlb_step=0.00332, train/loss_step=0.462, global_step=4751.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  73%|███████▎  | 886/1208 [23:43<08:37,  1.61s/it, loss=0.212, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.0013, train/loss_step=0.289, global_step=4751.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  73%|███████▎  | 887/1208 [23:44<08:35,  1.61s/it, loss=0.212, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.0013, train/loss_step=0.289, global_step=4751.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  73%|███████▎  | 887/1208 [23:44<08:35,  1.61s/it, loss=0.213, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.000137, train/loss_step=0.0379, global_step=4751.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  74%|███████▎  | 888/1208 [23:47<08:34,  1.61s/it, loss=0.213, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.000137, train/loss_step=0.0379, global_step=4751.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  74%|███████▎  | 888/1208 [23:47<08:34,  1.61s/it, loss=0.195, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000555, train/loss_step=0.162, global_step=4751.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  74%|███████▎  | 889/1208 [23:49<08:32,  1.61s/it, loss=0.195, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000555, train/loss_step=0.162, global_step=4751.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  74%|███████▎  | 889/1208 [23:49<08:32,  1.61s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0635, train/loss_vlb_step=0.000216, train/loss_step=0.0635, global_step=4752.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  74%|███████▎  | 890/1208 [23:50<08:30,  1.61s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0635, train/loss_vlb_step=0.000216, train/loss_step=0.0635, global_step=4752.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  74%|███████▎  | 890/1208 [23:50<08:30,  1.61s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.56e-5, train/loss_step=0.0028, global_step=4752.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  74%|███████▍  | 891/1208 [23:51<08:29,  1.61s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.56e-5, train/loss_step=0.0028, global_step=4752.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  74%|███████▍  | 891/1208 [23:51<08:29,  1.61s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.93e-5, train/loss_step=0.0102, global_step=4752.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  74%|███████▍  | 892/1208 [23:54<08:28,  1.61s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.93e-5, train/loss_step=0.0102, global_step=4752.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  74%|███████▍  | 892/1208 [23:54<08:28,  1.61s/it, loss=0.184, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000652, train/loss_step=0.187, global_step=4752.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  74%|███████▍  | 893/1208 [23:55<08:26,  1.61s/it, loss=0.184, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000652, train/loss_step=0.187, global_step=4752.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  74%|███████▍  | 893/1208 [23:55<08:26,  1.61s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.14e-5, train/loss_step=0.0226, global_step=4753.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  74%|███████▍  | 894/1208 [23:56<08:24,  1.61s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.14e-5, train/loss_step=0.0226, global_step=4753.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  74%|███████▍  | 894/1208 [23:56<08:24,  1.61s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.83e-5, train/loss_step=0.0235, global_step=4753.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  74%|███████▍  | 895/1208 [23:57<08:22,  1.61s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.83e-5, train/loss_step=0.0235, global_step=4753.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  74%|███████▍  | 895/1208 [23:57<08:22,  1.61s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=7.99e-5, train/loss_step=0.0192, global_step=4753.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  74%|███████▍  | 896/1208 [24:00<08:21,  1.61s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=7.99e-5, train/loss_step=0.0192, global_step=4753.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  74%|███████▍  | 896/1208 [24:00<08:21,  1.61s/it, loss=0.162, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00129, train/loss_step=0.293, global_step=4753.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  74%|███████▍  | 897/1208 [24:01<08:19,  1.61s/it, loss=0.162, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00129, train/loss_step=0.293, global_step=4753.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  74%|███████▍  | 897/1208 [24:01<08:19,  1.61s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.57e-5, train/loss_step=0.00282, global_step=4754.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  74%|███████▍  | 898/1208 [24:02<08:18,  1.61s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.57e-5, train/loss_step=0.00282, global_step=4754.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  74%|███████▍  | 898/1208 [24:02<08:18,  1.61s/it, loss=0.135, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00118, train/loss_step=0.260, global_step=4754.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  74%|███████▍  | 899/1208 [24:03<08:16,  1.61s/it, loss=0.135, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00118, train/loss_step=0.260, global_step=4754.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  74%|███████▍  | 899/1208 [24:03<08:16,  1.61s/it, loss=0.141, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00122, train/loss_step=0.268, global_step=4754.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  75%|███████▍  | 900/1208 [24:07<08:15,  1.61s/it, loss=0.141, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00122, train/loss_step=0.268, global_step=4754.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  75%|███████▍  | 900/1208 [24:07<08:15,  1.61s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0937, train/loss_vlb_step=0.000309, train/loss_step=0.0937, global_step=4754.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.73it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.76it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.76it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.77it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 15:  75%|███████▍  | 901/1208 [24:37<08:23,  1.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0937, train/loss_vlb_step=0.000309, train/loss_step=0.0937, global_step=4754.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  75%|███████▍  | 901/1208 [24:37<08:23,  1.64s/it, loss=0.149, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000995, train/loss_step=0.221, global_step=4755.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  75%|███████▍  | 902/1208 [24:38<08:21,  1.64s/it, loss=0.149, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000995, train/loss_step=0.221, global_step=4755.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  75%|███████▍  | 902/1208 [24:38<08:21,  1.64s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=1.47e-5, train/loss_step=0.00258, global_step=4755.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  75%|███████▍  | 903/1208 [24:39<08:19,  1.64s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=1.47e-5, train/loss_step=0.00258, global_step=4755.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  75%|███████▍  | 903/1208 [24:39<08:19,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00553, train/loss_vlb_step=2.86e-5, train/loss_step=0.00553, global_step=4755.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  75%|███████▍  | 904/1208 [24:42<08:18,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00553, train/loss_vlb_step=2.86e-5, train/loss_step=0.00553, global_step=4755.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  75%|███████▍  | 904/1208 [24:42<08:18,  1.64s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=1.48e-5, train/loss_step=0.00263, global_step=4755.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  75%|███████▍  | 905/1208 [24:43<08:16,  1.64s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=1.48e-5, train/loss_step=0.00263, global_step=4755.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  75%|███████▍  | 905/1208 [24:43<08:16,  1.64s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0512, train/loss_vlb_step=0.000182, train/loss_step=0.0512, global_step=4756.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  75%|███████▌  | 906/1208 [24:44<08:14,  1.64s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0512, train/loss_vlb_step=0.000182, train/loss_step=0.0512, global_step=4756.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  75%|███████▌  | 906/1208 [24:44<08:14,  1.64s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000816, train/loss_step=0.210, global_step=4756.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  75%|███████▌  | 907/1208 [24:46<08:13,  1.64s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000816, train/loss_step=0.210, global_step=4756.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  75%|███████▌  | 907/1208 [24:46<08:13,  1.64s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0737, train/loss_vlb_step=0.000246, train/loss_step=0.0737, global_step=4756.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  75%|███████▌  | 908/1208 [24:49<08:12,  1.64s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0737, train/loss_vlb_step=0.000246, train/loss_step=0.0737, global_step=4756.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  75%|███████▌  | 908/1208 [24:49<08:12,  1.64s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000253, train/loss_step=0.0754, global_step=4756.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  75%|███████▌  | 909/1208 [24:50<08:10,  1.64s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000253, train/loss_step=0.0754, global_step=4756.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  75%|███████▌  | 909/1208 [24:50<08:10,  1.64s/it, loss=0.099, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000534, train/loss_step=0.155, global_step=4757.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  75%|███████▌  | 910/1208 [24:51<08:08,  1.64s/it, loss=0.099, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000534, train/loss_step=0.155, global_step=4757.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  75%|███████▌  | 910/1208 [24:51<08:08,  1.64s/it, loss=0.111, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000906, train/loss_step=0.242, global_step=4757.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  75%|███████▌  | 911/1208 [24:52<08:06,  1.64s/it, loss=0.111, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000906, train/loss_step=0.242, global_step=4757.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  75%|███████▌  | 911/1208 [24:52<08:06,  1.64s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0617, train/loss_vlb_step=0.000213, train/loss_step=0.0617, global_step=4757.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  75%|███████▌  | 912/1208 [24:55<08:05,  1.64s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0617, train/loss_vlb_step=0.000213, train/loss_step=0.0617, global_step=4757.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  75%|███████▌  | 912/1208 [24:55<08:05,  1.64s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=1.03e-5, train/loss_step=0.00171, global_step=4757.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  76%|███████▌  | 913/1208 [24:56<08:03,  1.64s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=1.03e-5, train/loss_step=0.00171, global_step=4757.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  76%|███████▌  | 913/1208 [24:56<08:03,  1.64s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.75e-5, train/loss_step=0.0156, global_step=4758.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  76%|███████▌  | 914/1208 [24:57<08:01,  1.64s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.75e-5, train/loss_step=0.0156, global_step=4758.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  76%|███████▌  | 914/1208 [24:57<08:01,  1.64s/it, loss=0.112, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000696, train/loss_step=0.188, global_step=4758.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  76%|███████▌  | 915/1208 [24:58<07:59,  1.64s/it, loss=0.112, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000696, train/loss_step=0.188, global_step=4758.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  76%|███████▌  | 915/1208 [24:58<07:59,  1.64s/it, loss=0.124, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00131, train/loss_step=0.266, global_step=4758.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  76%|███████▌  | 916/1208 [25:02<07:58,  1.64s/it, loss=0.124, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00131, train/loss_step=0.266, global_step=4758.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  76%|███████▌  | 916/1208 [25:02<07:58,  1.64s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000109, train/loss_step=0.0266, global_step=4758.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  76%|███████▌  | 917/1208 [25:03<07:56,  1.64s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000109, train/loss_step=0.0266, global_step=4758.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  76%|███████▌  | 917/1208 [25:03<07:56,  1.64s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.26e-5, train/loss_step=0.0142, global_step=4759.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  76%|███████▌  | 918/1208 [25:04<07:55,  1.64s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.26e-5, train/loss_step=0.0142, global_step=4759.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  76%|███████▌  | 918/1208 [25:04<07:55,  1.64s/it, loss=0.109, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000723, train/loss_step=0.208, global_step=4759.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  76%|███████▌  | 919/1208 [25:05<07:53,  1.64s/it, loss=0.109, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000723, train/loss_step=0.208, global_step=4759.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  76%|███████▌  | 919/1208 [25:05<07:53,  1.64s/it, loss=0.116, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00549, train/loss_step=0.405, global_step=4759.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  76%|███████▌  | 920/1208 [25:08<07:52,  1.64s/it, loss=0.116, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00549, train/loss_step=0.405, global_step=4759.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  76%|███████▌  | 920/1208 [25:08<07:52,  1.64s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0807, train/loss_vlb_step=0.00027, train/loss_step=0.0807, global_step=4759.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  76%|███████▌  | 921/1208 [25:09<07:50,  1.64s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0807, train/loss_vlb_step=0.00027, train/loss_step=0.0807, global_step=4759.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  76%|███████▌  | 921/1208 [25:09<07:50,  1.64s/it, loss=0.112, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.00051, train/loss_step=0.149, global_step=4760.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  76%|███████▋  | 922/1208 [25:10<07:48,  1.64s/it, loss=0.112, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.00051, train/loss_step=0.149, global_step=4760.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  76%|███████▋  | 922/1208 [25:10<07:48,  1.64s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0904, train/loss_vlb_step=0.0003, train/loss_step=0.0904, global_step=4760.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  76%|███████▋  | 923/1208 [25:11<07:46,  1.64s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0904, train/loss_vlb_step=0.0003, train/loss_step=0.0904, global_step=4760.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  76%|███████▋  | 923/1208 [25:11<07:46,  1.64s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=0.000104, train/loss_step=0.0252, global_step=4760.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  76%|███████▋  | 924/1208 [25:14<07:45,  1.64s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=0.000104, train/loss_step=0.0252, global_step=4760.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  76%|███████▋  | 924/1208 [25:14<07:45,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.0012, train/loss_step=0.279, global_step=4760.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  77%|███████▋  | 925/1208 [25:15<07:43,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.0012, train/loss_step=0.279, global_step=4760.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  77%|███████▋  | 925/1208 [25:15<07:43,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0542, train/loss_vlb_step=0.000184, train/loss_step=0.0542, global_step=4761.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  77%|███████▋  | 926/1208 [25:17<07:41,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0542, train/loss_vlb_step=0.000184, train/loss_step=0.0542, global_step=4761.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  77%|███████▋  | 926/1208 [25:17<07:41,  1.64s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0855, train/loss_vlb_step=0.000287, train/loss_step=0.0855, global_step=4761.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  77%|███████▋  | 927/1208 [25:18<07:40,  1.64s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0855, train/loss_vlb_step=0.000287, train/loss_step=0.0855, global_step=4761.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  77%|███████▋  | 927/1208 [25:18<07:40,  1.64s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00465, train/loss_vlb_step=2.46e-5, train/loss_step=0.00465, global_step=4761.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  77%|███████▋  | 928/1208 [25:21<07:39,  1.64s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00465, train/loss_vlb_step=2.46e-5, train/loss_step=0.00465, global_step=4761.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  77%|███████▋  | 928/1208 [25:21<07:39,  1.64s/it, loss=0.128, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000811, train/loss_step=0.208, global_step=4761.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  77%|███████▋  | 929/1208 [25:22<07:37,  1.64s/it, loss=0.128, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000811, train/loss_step=0.208, global_step=4761.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  77%|███████▋  | 929/1208 [25:22<07:37,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000814, train/loss_step=0.212, global_step=4762.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  77%|███████▋  | 930/1208 [25:23<07:35,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000814, train/loss_step=0.212, global_step=4762.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  77%|███████▋  | 930/1208 [25:23<07:35,  1.64s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000118, train/loss_step=0.0293, global_step=4762.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  77%|███████▋  | 931/1208 [25:24<07:33,  1.64s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000118, train/loss_step=0.0293, global_step=4762.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  77%|███████▋  | 931/1208 [25:24<07:33,  1.64s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0593, train/loss_vlb_step=0.000204, train/loss_step=0.0593, global_step=4762.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  77%|███████▋  | 932/1208 [25:27<07:32,  1.64s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0593, train/loss_vlb_step=0.000204, train/loss_step=0.0593, global_step=4762.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  77%|███████▋  | 932/1208 [25:27<07:32,  1.64s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0354, train/loss_vlb_step=0.000134, train/loss_step=0.0354, global_step=4762.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  77%|███████▋  | 933/1208 [25:28<07:30,  1.64s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0354, train/loss_vlb_step=0.000134, train/loss_step=0.0354, global_step=4762.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  77%|███████▋  | 933/1208 [25:28<07:30,  1.64s/it, loss=0.151, v_num=0, train/loss_simple_step=0.594, train/loss_vlb_step=0.0124, train/loss_step=0.594, global_step=4763.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  77%|███████▋  | 934/1208 [25:29<07:28,  1.64s/it, loss=0.151, v_num=0, train/loss_simple_step=0.594, train/loss_vlb_step=0.0124, train/loss_step=0.594, global_step=4763.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  77%|███████▋  | 934/1208 [25:29<07:28,  1.64s/it, loss=0.156, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00138, train/loss_step=0.290, global_step=4763.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  77%|███████▋  | 935/1208 [25:30<07:26,  1.64s/it, loss=0.156, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00138, train/loss_step=0.290, global_step=4763.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  77%|███████▋  | 935/1208 [25:30<07:26,  1.64s/it, loss=0.16, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00228, train/loss_step=0.352, global_step=4763.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  77%|███████▋  | 936/1208 [25:34<07:25,  1.64s/it, loss=0.16, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00228, train/loss_step=0.352, global_step=4763.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  77%|███████▋  | 936/1208 [25:34<07:25,  1.64s/it, loss=0.165, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.0004, train/loss_step=0.121, global_step=4763.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  78%|███████▊  | 937/1208 [25:35<07:23,  1.64s/it, loss=0.165, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.0004, train/loss_step=0.121, global_step=4763.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  78%|███████▊  | 937/1208 [25:35<07:23,  1.64s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=1.01e-5, train/loss_step=0.0017, global_step=4764.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  78%|███████▊  | 938/1208 [25:36<07:22,  1.64s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=1.01e-5, train/loss_step=0.0017, global_step=4764.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  78%|███████▊  | 938/1208 [25:36<07:22,  1.64s/it, loss=0.17, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00174, train/loss_step=0.325, global_step=4764.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  78%|███████▊  | 939/1208 [25:37<07:20,  1.64s/it, loss=0.17, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00174, train/loss_step=0.325, global_step=4764.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  78%|███████▊  | 939/1208 [25:37<07:20,  1.64s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=9.05e-5, train/loss_step=0.0223, global_step=4764.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  78%|███████▊  | 940/1208 [25:40<07:19,  1.64s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=9.05e-5, train/loss_step=0.0223, global_step=4764.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  78%|███████▊  | 940/1208 [25:40<07:19,  1.64s/it, loss=0.15, v_num=0, train/loss_simple_step=0.063, train/loss_vlb_step=0.000216, train/loss_step=0.063, global_step=4764.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  78%|███████▊  | 941/1208 [25:41<07:17,  1.64s/it, loss=0.15, v_num=0, train/loss_simple_step=0.063, train/loss_vlb_step=0.000216, train/loss_step=0.063, global_step=4764.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  78%|███████▊  | 941/1208 [25:41<07:17,  1.64s/it, loss=0.151, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000628, train/loss_step=0.178, global_step=4765.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  78%|███████▊  | 942/1208 [25:42<07:15,  1.64s/it, loss=0.151, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000628, train/loss_step=0.178, global_step=4765.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  78%|███████▊  | 942/1208 [25:42<07:15,  1.64s/it, loss=0.16, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00133, train/loss_step=0.269, global_step=4765.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  78%|███████▊  | 943/1208 [25:43<07:13,  1.64s/it, loss=0.16, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00133, train/loss_step=0.269, global_step=4765.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  78%|███████▊  | 943/1208 [25:43<07:13,  1.64s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=8.78e-5, train/loss_step=0.0223, global_step=4765.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  78%|███████▊  | 944/1208 [25:46<07:12,  1.64s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=8.78e-5, train/loss_step=0.0223, global_step=4765.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  78%|███████▊  | 944/1208 [25:46<07:12,  1.64s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000101, train/loss_step=0.0268, global_step=4765.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  78%|███████▊  | 945/1208 [25:47<07:10,  1.64s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000101, train/loss_step=0.0268, global_step=4765.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  78%|███████▊  | 945/1208 [25:47<07:10,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=3.1e-5, train/loss_step=0.00619, global_step=4766.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  78%|███████▊  | 946/1208 [25:48<07:08,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=3.1e-5, train/loss_step=0.00619, global_step=4766.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  78%|███████▊  | 946/1208 [25:48<07:08,  1.64s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00995, train/loss_vlb_step=4.72e-5, train/loss_step=0.00995, global_step=4766.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  78%|███████▊  | 947/1208 [25:49<07:07,  1.64s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00995, train/loss_vlb_step=4.72e-5, train/loss_step=0.00995, global_step=4766.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  78%|███████▊  | 947/1208 [25:49<07:07,  1.64s/it, loss=0.15, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000588, train/loss_step=0.168, global_step=4766.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  78%|███████▊  | 948/1208 [25:53<07:05,  1.64s/it, loss=0.15, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000588, train/loss_step=0.168, global_step=4766.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  78%|███████▊  | 948/1208 [25:53<07:05,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.05e-5, train/loss_step=0.00175, global_step=4766.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  79%|███████▊  | 949/1208 [25:54<07:04,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.05e-5, train/loss_step=0.00175, global_step=4766.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  79%|███████▊  | 949/1208 [25:54<07:04,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0833, train/loss_vlb_step=0.000275, train/loss_step=0.0833, global_step=4767.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  79%|███████▊  | 950/1208 [25:55<07:02,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0833, train/loss_vlb_step=0.000275, train/loss_step=0.0833, global_step=4767.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  79%|███████▊  | 950/1208 [25:55<07:02,  1.64s/it, loss=0.144, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000968, train/loss_step=0.248, global_step=4767.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  79%|███████▊  | 951/1208 [25:56<07:00,  1.64s/it, loss=0.144, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000968, train/loss_step=0.248, global_step=4767.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  79%|███████▊  | 951/1208 [25:56<07:00,  1.64s/it, loss=0.165, v_num=0, train/loss_simple_step=0.486, train/loss_vlb_step=0.00547, train/loss_step=0.486, global_step=4767.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  79%|███████▉  | 952/1208 [25:59<06:59,  1.64s/it, loss=0.165, v_num=0, train/loss_simple_step=0.486, train/loss_vlb_step=0.00547, train/loss_step=0.486, global_step=4767.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  79%|███████▉  | 952/1208 [25:59<06:59,  1.64s/it, loss=0.176, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.00101, train/loss_step=0.246, global_step=4767.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  79%|███████▉  | 953/1208 [26:00<06:57,  1.64s/it, loss=0.176, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.00101, train/loss_step=0.246, global_step=4767.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  79%|███████▉  | 953/1208 [26:00<06:57,  1.64s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00478, train/loss_vlb_step=2.51e-5, train/loss_step=0.00478, global_step=4768.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  79%|███████▉  | 954/1208 [26:01<06:55,  1.64s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00478, train/loss_vlb_step=2.51e-5, train/loss_step=0.00478, global_step=4768.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  79%|███████▉  | 954/1208 [26:01<06:55,  1.64s/it, loss=0.141, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000657, train/loss_step=0.192, global_step=4768.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  79%|███████▉  | 955/1208 [26:02<06:54,  1.64s/it, loss=0.141, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000657, train/loss_step=0.192, global_step=4768.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  79%|███████▉  | 955/1208 [26:02<06:54,  1.64s/it, loss=0.136, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000997, train/loss_step=0.250, global_step=4768.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  79%|███████▉  | 956/1208 [26:05<06:52,  1.64s/it, loss=0.136, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000997, train/loss_step=0.250, global_step=4768.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  79%|███████▉  | 956/1208 [26:05<06:52,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=7.95e-5, train/loss_step=0.0189, global_step=4768.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  79%|███████▉  | 957/1208 [26:07<06:51,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=7.95e-5, train/loss_step=0.0189, global_step=4768.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  79%|███████▉  | 957/1208 [26:07<06:51,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0461, train/loss_vlb_step=0.000169, train/loss_step=0.0461, global_step=4769.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  79%|███████▉  | 958/1208 [26:08<06:49,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0461, train/loss_vlb_step=0.000169, train/loss_step=0.0461, global_step=4769.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  79%|███████▉  | 958/1208 [26:08<06:49,  1.64s/it, loss=0.13, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00107, train/loss_step=0.253, global_step=4769.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  79%|███████▉  | 959/1208 [26:09<06:47,  1.64s/it, loss=0.13, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00107, train/loss_step=0.253, global_step=4769.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  79%|███████▉  | 959/1208 [26:09<06:47,  1.64s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=9.99e-6, train/loss_step=0.00171, global_step=4769.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  79%|███████▉  | 960/1208 [26:12<06:46,  1.64s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=9.99e-6, train/loss_step=0.00171, global_step=4769.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  79%|███████▉  | 960/1208 [26:12<06:46,  1.64s/it, loss=0.153, v_num=0, train/loss_simple_step=0.548, train/loss_vlb_step=0.00811, train/loss_step=0.548, global_step=4769.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  80%|███████▉  | 961/1208 [26:13<06:44,  1.64s/it, loss=0.153, v_num=0, train/loss_simple_step=0.548, train/loss_vlb_step=0.00811, train/loss_step=0.548, global_step=4769.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  80%|███████▉  | 961/1208 [26:13<06:44,  1.64s/it, loss=0.151, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.00046, train/loss_step=0.136, global_step=4770.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  80%|███████▉  | 962/1208 [26:14<06:42,  1.64s/it, loss=0.151, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.00046, train/loss_step=0.136, global_step=4770.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  80%|███████▉  | 962/1208 [26:14<06:42,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000144, train/loss_step=0.0402, global_step=4770.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  80%|███████▉  | 963/1208 [26:15<06:40,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000144, train/loss_step=0.0402, global_step=4770.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  80%|███████▉  | 963/1208 [26:15<06:40,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.75e-5, train/loss_step=0.0106, global_step=4770.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  80%|███████▉  | 964/1208 [26:18<06:39,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.75e-5, train/loss_step=0.0106, global_step=4770.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  80%|███████▉  | 964/1208 [26:18<06:39,  1.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.1e-5, train/loss_step=0.0114, global_step=4770.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  80%|███████▉  | 965/1208 [26:19<06:37,  1.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.1e-5, train/loss_step=0.0114, global_step=4770.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  80%|███████▉  | 965/1208 [26:19<06:37,  1.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00799, train/loss_vlb_step=3.84e-5, train/loss_step=0.00799, global_step=4771.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  80%|███████▉  | 966/1208 [26:20<06:36,  1.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00799, train/loss_vlb_step=3.84e-5, train/loss_step=0.00799, global_step=4771.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  80%|███████▉  | 966/1208 [26:20<06:36,  1.64s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0564, train/loss_vlb_step=0.000193, train/loss_step=0.0564, global_step=4771.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  80%|████████  | 967/1208 [26:21<06:34,  1.64s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0564, train/loss_vlb_step=0.000193, train/loss_step=0.0564, global_step=4771.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  80%|████████  | 967/1208 [26:21<06:34,  1.64s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0458, train/loss_vlb_step=0.000164, train/loss_step=0.0458, global_step=4771.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  80%|████████  | 968/1208 [26:25<06:32,  1.64s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0458, train/loss_vlb_step=0.000164, train/loss_step=0.0458, global_step=4771.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  80%|████████  | 968/1208 [26:25<06:32,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000353, train/loss_step=0.108, global_step=4771.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  80%|████████  | 969/1208 [26:26<06:31,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000353, train/loss_step=0.108, global_step=4771.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  80%|████████  | 969/1208 [26:26<06:31,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000313, train/loss_step=0.095, global_step=4772.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  80%|████████  | 970/1208 [26:27<06:29,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000313, train/loss_step=0.095, global_step=4772.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  80%|████████  | 970/1208 [26:27<06:29,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00108, train/loss_step=0.247, global_step=4772.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  80%|████████  | 971/1208 [26:28<06:27,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00108, train/loss_step=0.247, global_step=4772.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  80%|████████  | 971/1208 [26:28<06:27,  1.64s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.79e-5, train/loss_step=0.00311, global_step=4772.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  80%|████████  | 972/1208 [26:31<06:26,  1.64s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.79e-5, train/loss_step=0.00311, global_step=4772.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  80%|████████  | 972/1208 [26:31<06:26,  1.64s/it, loss=0.114, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000827, train/loss_step=0.210, global_step=4772.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  81%|████████  | 973/1208 [26:32<06:24,  1.64s/it, loss=0.114, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000827, train/loss_step=0.210, global_step=4772.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  81%|████████  | 973/1208 [26:32<06:24,  1.64s/it, loss=0.129, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.0015, train/loss_step=0.294, global_step=4773.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  81%|████████  | 974/1208 [26:33<06:22,  1.64s/it, loss=0.129, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.0015, train/loss_step=0.294, global_step=4773.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  81%|████████  | 974/1208 [26:33<06:22,  1.64s/it, loss=0.125, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=4773.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  81%|████████  | 975/1208 [26:34<06:21,  1.64s/it, loss=0.125, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=4773.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  81%|████████  | 975/1208 [26:34<06:21,  1.64s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0768, train/loss_vlb_step=0.000255, train/loss_step=0.0768, global_step=4773.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  81%|████████  | 976/1208 [26:37<06:19,  1.64s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0768, train/loss_vlb_step=0.000255, train/loss_step=0.0768, global_step=4773.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  81%|████████  | 976/1208 [26:37<06:19,  1.64s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0355, train/loss_vlb_step=0.000132, train/loss_step=0.0355, global_step=4773.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  81%|████████  | 977/1208 [26:38<06:18,  1.64s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0355, train/loss_vlb_step=0.000132, train/loss_step=0.0355, global_step=4773.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  81%|████████  | 977/1208 [26:38<06:18,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00218, train/loss_step=0.368, global_step=4774.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  81%|████████  | 978/1208 [26:39<06:16,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00218, train/loss_step=0.368, global_step=4774.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  81%|████████  | 978/1208 [26:39<06:16,  1.64s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000127, train/loss_step=0.0329, global_step=4774.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  81%|████████  | 979/1208 [26:41<06:14,  1.64s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000127, train/loss_step=0.0329, global_step=4774.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  81%|████████  | 979/1208 [26:41<06:14,  1.64s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0623, train/loss_vlb_step=0.000217, train/loss_step=0.0623, global_step=4774.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  81%|████████  | 980/1208 [26:44<06:13,  1.64s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0623, train/loss_vlb_step=0.000217, train/loss_step=0.0623, global_step=4774.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  81%|████████  | 980/1208 [26:44<06:13,  1.64s/it, loss=0.107, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000608, train/loss_step=0.182, global_step=4774.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  81%|████████  | 981/1208 [26:45<06:11,  1.64s/it, loss=0.107, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000608, train/loss_step=0.182, global_step=4774.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  81%|████████  | 981/1208 [26:45<06:11,  1.64s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0773, train/loss_vlb_step=0.00026, train/loss_step=0.0773, global_step=4775.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  81%|████████▏ | 982/1208 [26:46<06:09,  1.64s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0773, train/loss_vlb_step=0.00026, train/loss_step=0.0773, global_step=4775.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  81%|████████▏ | 982/1208 [26:46<06:09,  1.64s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000273, train/loss_step=0.0815, global_step=4775.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  81%|████████▏ | 983/1208 [26:47<06:07,  1.64s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000273, train/loss_step=0.0815, global_step=4775.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  81%|████████▏ | 983/1208 [26:47<06:07,  1.64s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0435, train/loss_vlb_step=0.000156, train/loss_step=0.0435, global_step=4775.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  81%|████████▏ | 984/1208 [26:50<06:06,  1.64s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0435, train/loss_vlb_step=0.000156, train/loss_step=0.0435, global_step=4775.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  81%|████████▏ | 984/1208 [26:50<06:06,  1.64s/it, loss=0.121, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.0013, train/loss_step=0.290, global_step=4775.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  82%|████████▏ | 985/1208 [26:51<06:04,  1.64s/it, loss=0.121, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.0013, train/loss_step=0.290, global_step=4775.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  82%|████████▏ | 985/1208 [26:51<06:04,  1.64s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.71e-5, train/loss_step=0.0198, global_step=4776.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  82%|████████▏ | 986/1208 [26:52<06:03,  1.64s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.71e-5, train/loss_step=0.0198, global_step=4776.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  82%|████████▏ | 986/1208 [26:52<06:03,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00226, train/loss_step=0.394, global_step=4776.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  82%|████████▏ | 987/1208 [26:53<06:01,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00226, train/loss_step=0.394, global_step=4776.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  82%|████████▏ | 987/1208 [26:53<06:01,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000547, train/loss_step=0.161, global_step=4776.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  82%|████████▏ | 988/1208 [26:57<06:00,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000547, train/loss_step=0.161, global_step=4776.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  82%|████████▏ | 988/1208 [26:57<06:00,  1.64s/it, loss=0.157, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.0022, train/loss_step=0.351, global_step=4776.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  82%|████████▏ | 989/1208 [26:58<05:58,  1.64s/it, loss=0.157, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.0022, train/loss_step=0.351, global_step=4776.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  82%|████████▏ | 989/1208 [26:58<05:58,  1.64s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000115, train/loss_step=0.0299, global_step=4777.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  82%|████████▏ | 990/1208 [26:59<05:56,  1.64s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000115, train/loss_step=0.0299, global_step=4777.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  82%|████████▏ | 990/1208 [26:59<05:56,  1.64s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00163, train/loss_vlb_step=9.68e-6, train/loss_step=0.00163, global_step=4777.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  82%|████████▏ | 991/1208 [27:00<05:54,  1.63s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00163, train/loss_vlb_step=9.68e-6, train/loss_step=0.00163, global_step=4777.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  82%|████████▏ | 991/1208 [27:00<05:54,  1.63s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.32e-5, train/loss_step=0.0198, global_step=4777.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  82%|████████▏ | 992/1208 [27:03<05:53,  1.64s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.32e-5, train/loss_step=0.0198, global_step=4777.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  82%|████████▏ | 992/1208 [27:03<05:53,  1.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=4777.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  82%|████████▏ | 993/1208 [27:04<05:51,  1.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=4777.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  82%|████████▏ | 993/1208 [27:04<05:51,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00169, train/loss_vlb_step=9.9e-6, train/loss_step=0.00169, global_step=4778.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  82%|████████▏ | 994/1208 [27:05<05:49,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00169, train/loss_vlb_step=9.9e-6, train/loss_step=0.00169, global_step=4778.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  82%|████████▏ | 994/1208 [27:05<05:49,  1.64s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=8.32e-5, train/loss_step=0.0204, global_step=4778.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  82%|████████▏ | 995/1208 [27:06<05:48,  1.63s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=8.32e-5, train/loss_step=0.0204, global_step=4778.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  82%|████████▏ | 995/1208 [27:06<05:48,  1.63s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0994, train/loss_vlb_step=0.000327, train/loss_step=0.0994, global_step=4778.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  82%|████████▏ | 996/1208 [27:09<05:46,  1.64s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0994, train/loss_vlb_step=0.000327, train/loss_step=0.0994, global_step=4778.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  82%|████████▏ | 996/1208 [27:09<05:46,  1.64s/it, loss=0.128, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000837, train/loss_step=0.209, global_step=4778.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  83%|████████▎ | 997/1208 [27:10<05:45,  1.64s/it, loss=0.128, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000837, train/loss_step=0.209, global_step=4778.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  83%|████████▎ | 997/1208 [27:10<05:45,  1.64s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7.29e-5, train/loss_step=0.0165, global_step=4779.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  83%|████████▎ | 998/1208 [27:11<05:43,  1.64s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7.29e-5, train/loss_step=0.0165, global_step=4779.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  83%|████████▎ | 998/1208 [27:11<05:43,  1.64s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000127, train/loss_step=0.0339, global_step=4779.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  83%|████████▎ | 999/1208 [27:12<05:41,  1.63s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000127, train/loss_step=0.0339, global_step=4779.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  83%|████████▎ | 999/1208 [27:12<05:41,  1.63s/it, loss=0.112, v_num=0, train/loss_simple_step=0.083, train/loss_vlb_step=0.000284, train/loss_step=0.083, global_step=4779.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  83%|████████▎ | 1000/1208 [27:16<05:40,  1.64s/it, loss=0.112, v_num=0, train/loss_simple_step=0.083, train/loss_vlb_step=0.000284, train/loss_step=0.083, global_step=4779.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  83%|████████▎ | 1000/1208 [27:16<05:40,  1.64s/it, loss=0.109, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000462, train/loss_step=0.137, global_step=4779.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  83%|████████▎ | 1001/1208 [27:17<05:38,  1.64s/it, loss=0.109, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000462, train/loss_step=0.137, global_step=4779.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  83%|████████▎ | 1001/1208 [27:17<05:38,  1.64s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=2.6e-5, train/loss_step=0.00469, global_step=4780.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  83%|████████▎ | 1002/1208 [27:18<05:36,  1.64s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=2.6e-5, train/loss_step=0.00469, global_step=4780.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  83%|████████▎ | 1002/1208 [27:18<05:36,  1.64s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=2.2e-5, train/loss_step=0.00421, global_step=4780.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  83%|████████▎ | 1003/1208 [27:19<05:35,  1.63s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=2.2e-5, train/loss_step=0.00421, global_step=4780.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  83%|████████▎ | 1003/1208 [27:19<05:35,  1.63s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=1.36e-5, train/loss_step=0.00238, global_step=4780.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  83%|████████▎ | 1004/1208 [27:22<05:33,  1.64s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=1.36e-5, train/loss_step=0.00238, global_step=4780.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  83%|████████▎ | 1004/1208 [27:22<05:33,  1.64s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.21e-5, train/loss_step=0.0172, global_step=4780.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  83%|████████▎ | 1005/1208 [27:23<05:31,  1.64s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.21e-5, train/loss_step=0.0172, global_step=4780.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  83%|████████▎ | 1005/1208 [27:23<05:31,  1.64s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000693, train/loss_step=0.205, global_step=4781.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  83%|████████▎ | 1006/1208 [27:24<05:30,  1.63s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000693, train/loss_step=0.205, global_step=4781.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  83%|████████▎ | 1006/1208 [27:24<05:30,  1.63s/it, loss=0.103, v_num=0, train/loss_simple_step=0.540, train/loss_vlb_step=0.00838, train/loss_step=0.540, global_step=4781.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  83%|████████▎ | 1007/1208 [27:25<05:28,  1.63s/it, loss=0.103, v_num=0, train/loss_simple_step=0.540, train/loss_vlb_step=0.00838, train/loss_step=0.540, global_step=4781.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  83%|████████▎ | 1007/1208 [27:25<05:28,  1.63s/it, loss=0.102, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000504, train/loss_step=0.151, global_step=4781.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  83%|████████▎ | 1008/1208 [27:28<05:27,  1.64s/it, loss=0.102, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000504, train/loss_step=0.151, global_step=4781.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  83%|████████▎ | 1008/1208 [27:28<05:27,  1.64s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.0011, train/loss_step=0.264, global_step=4781.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  84%|████████▎ | 1009/1208 [27:30<05:25,  1.64s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.0011, train/loss_step=0.264, global_step=4781.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  84%|████████▎ | 1009/1208 [27:30<05:25,  1.64s/it, loss=0.12, v_num=0, train/loss_simple_step=0.464, train/loss_vlb_step=0.00483, train/loss_step=0.464, global_step=4782.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  84%|████████▎ | 1010/1208 [27:31<05:23,  1.63s/it, loss=0.12, v_num=0, train/loss_simple_step=0.464, train/loss_vlb_step=0.00483, train/loss_step=0.464, global_step=4782.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  84%|████████▎ | 1010/1208 [27:31<05:23,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000127, train/loss_step=0.0332, global_step=4782.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  84%|████████▎ | 1011/1208 [27:32<05:21,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000127, train/loss_step=0.0332, global_step=4782.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  84%|████████▎ | 1011/1208 [27:32<05:21,  1.63s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1.38e-5, train/loss_step=0.00226, global_step=4782.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  84%|████████▍ | 1012/1208 [27:35<05:20,  1.64s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1.38e-5, train/loss_step=0.00226, global_step=4782.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  84%|████████▍ | 1012/1208 [27:35<05:20,  1.64s/it, loss=0.135, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00477, train/loss_step=0.418, global_step=4782.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  84%|████████▍ | 1013/1208 [27:36<05:18,  1.64s/it, loss=0.135, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00477, train/loss_step=0.418, global_step=4782.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  84%|████████▍ | 1013/1208 [27:36<05:18,  1.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.000165, train/loss_step=0.0471, global_step=4783.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  84%|████████▍ | 1014/1208 [27:37<05:17,  1.63s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.000165, train/loss_step=0.0471, global_step=4783.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  84%|████████▍ | 1014/1208 [27:37<05:17,  1.63s/it, loss=0.151, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00142, train/loss_step=0.292, global_step=4783.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  84%|████████▍ | 1015/1208 [27:38<05:15,  1.63s/it, loss=0.151, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00142, train/loss_step=0.292, global_step=4783.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  84%|████████▍ | 1015/1208 [27:38<05:15,  1.63s/it, loss=0.159, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00116, train/loss_step=0.257, global_step=4783.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  84%|████████▍ | 1016/1208 [27:41<05:14,  1.64s/it, loss=0.159, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00116, train/loss_step=0.257, global_step=4783.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  84%|████████▍ | 1016/1208 [27:41<05:14,  1.64s/it, loss=0.159, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.0009, train/loss_step=0.216, global_step=4783.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  84%|████████▍ | 1017/1208 [27:42<05:12,  1.64s/it, loss=0.159, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.0009, train/loss_step=0.216, global_step=4783.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  84%|████████▍ | 1017/1208 [27:42<05:12,  1.64s/it, loss=0.192, v_num=0, train/loss_simple_step=0.667, train/loss_vlb_step=0.0315, train/loss_step=0.667, global_step=4784.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  84%|████████▍ | 1018/1208 [27:43<05:10,  1.63s/it, loss=0.192, v_num=0, train/loss_simple_step=0.667, train/loss_vlb_step=0.0315, train/loss_step=0.667, global_step=4784.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  84%|████████▍ | 1018/1208 [27:43<05:10,  1.63s/it, loss=0.19, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.47e-5, train/loss_step=0.00257, global_step=4784.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  84%|████████▍ | 1019/1208 [27:44<05:08,  1.63s/it, loss=0.19, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.47e-5, train/loss_step=0.00257, global_step=4784.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  84%|████████▍ | 1019/1208 [27:44<05:08,  1.63s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.38e-5, train/loss_step=0.00233, global_step=4784.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  84%|████████▍ | 1020/1208 [27:48<05:07,  1.64s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.38e-5, train/loss_step=0.00233, global_step=4784.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  84%|████████▍ | 1020/1208 [27:48<05:07,  1.64s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00301, train/loss_vlb_step=1.64e-5, train/loss_step=0.00301, global_step=4784.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  85%|████████▍ | 1021/1208 [27:49<05:05,  1.63s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00301, train/loss_vlb_step=1.64e-5, train/loss_step=0.00301, global_step=4784.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  85%|████████▍ | 1021/1208 [27:49<05:05,  1.63s/it, loss=0.196, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00178, train/loss_step=0.333, global_step=4785.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  85%|████████▍ | 1022/1208 [27:50<05:03,  1.63s/it, loss=0.196, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00178, train/loss_step=0.333, global_step=4785.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  85%|████████▍ | 1022/1208 [27:50<05:03,  1.63s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00782, train/loss_vlb_step=3.82e-5, train/loss_step=0.00782, global_step=4785.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  85%|████████▍ | 1023/1208 [27:51<05:02,  1.63s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00782, train/loss_vlb_step=3.82e-5, train/loss_step=0.00782, global_step=4785.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  85%|████████▍ | 1023/1208 [27:51<05:02,  1.63s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=2.12e-5, train/loss_step=0.00378, global_step=4785.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  85%|████████▍ | 1024/1208 [27:54<05:00,  1.64s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=2.12e-5, train/loss_step=0.00378, global_step=4785.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  85%|████████▍ | 1024/1208 [27:54<05:00,  1.64s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.41e-5, train/loss_step=0.00244, global_step=4785.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  85%|████████▍ | 1025/1208 [27:55<04:59,  1.63s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.41e-5, train/loss_step=0.00244, global_step=4785.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  85%|████████▍ | 1025/1208 [27:55<04:59,  1.63s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.95e-5, train/loss_step=0.0136, global_step=4786.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  85%|████████▍ | 1026/1208 [27:56<04:57,  1.63s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.95e-5, train/loss_step=0.0136, global_step=4786.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  85%|████████▍ | 1026/1208 [27:56<04:57,  1.63s/it, loss=0.169, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000677, train/loss_step=0.199, global_step=4786.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  85%|████████▌ | 1027/1208 [27:57<04:55,  1.63s/it, loss=0.169, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000677, train/loss_step=0.199, global_step=4786.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  85%|████████▌ | 1027/1208 [27:57<04:55,  1.63s/it, loss=0.184, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00397, train/loss_step=0.447, global_step=4786.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  85%|████████▌ | 1028/1208 [28:00<04:54,  1.64s/it, loss=0.184, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00397, train/loss_step=0.447, global_step=4786.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  85%|████████▌ | 1028/1208 [28:00<04:54,  1.64s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.56e-5, train/loss_step=0.0202, global_step=4786.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  85%|████████▌ | 1029/1208 [28:01<04:52,  1.63s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.56e-5, train/loss_step=0.0202, global_step=4786.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  85%|████████▌ | 1029/1208 [28:01<04:52,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0636, train/loss_vlb_step=0.00022, train/loss_step=0.0636, global_step=4787.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  85%|████████▌ | 1030/1208 [28:03<04:50,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0636, train/loss_vlb_step=0.00022, train/loss_step=0.0636, global_step=4787.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  85%|████████▌ | 1030/1208 [28:03<04:50,  1.63s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=4.93e-5, train/loss_step=0.0116, global_step=4787.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  85%|████████▌ | 1031/1208 [28:04<04:49,  1.63s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=4.93e-5, train/loss_step=0.0116, global_step=4787.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  85%|████████▌ | 1031/1208 [28:04<04:49,  1.63s/it, loss=0.163, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.000979, train/loss_step=0.247, global_step=4787.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  85%|████████▌ | 1032/1208 [28:07<04:47,  1.63s/it, loss=0.163, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.000979, train/loss_step=0.247, global_step=4787.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  85%|████████▌ | 1032/1208 [28:07<04:47,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.55e-5, train/loss_step=0.0153, global_step=4787.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  86%|████████▌ | 1033/1208 [28:08<04:46,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.55e-5, train/loss_step=0.0153, global_step=4787.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  86%|████████▌ | 1033/1208 [28:08<04:46,  1.63s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=1.89e-5, train/loss_step=0.00345, global_step=4788.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  86%|████████▌ | 1034/1208 [28:09<04:44,  1.63s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=1.89e-5, train/loss_step=0.00345, global_step=4788.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  86%|████████▌ | 1034/1208 [28:09<04:44,  1.63s/it, loss=0.147, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00438, train/loss_step=0.428, global_step=4788.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  86%|████████▌ | 1035/1208 [28:10<04:42,  1.63s/it, loss=0.147, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00438, train/loss_step=0.428, global_step=4788.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  86%|████████▌ | 1035/1208 [28:10<04:42,  1.63s/it, loss=0.156, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00334, train/loss_step=0.428, global_step=4788.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  86%|████████▌ | 1036/1208 [28:13<04:41,  1.63s/it, loss=0.156, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00334, train/loss_step=0.428, global_step=4788.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  86%|████████▌ | 1036/1208 [28:13<04:41,  1.63s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=9.16e-6, train/loss_step=0.00152, global_step=4788.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  86%|████████▌ | 1037/1208 [28:14<04:39,  1.63s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=9.16e-6, train/loss_step=0.00152, global_step=4788.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  86%|████████▌ | 1037/1208 [28:14<04:39,  1.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=8.9e-5, train/loss_step=0.0217, global_step=4789.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  86%|████████▌ | 1038/1208 [28:15<04:37,  1.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=8.9e-5, train/loss_step=0.0217, global_step=4789.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  86%|████████▌ | 1038/1208 [28:15<04:37,  1.63s/it, loss=0.141, v_num=0, train/loss_simple_step=0.566, train/loss_vlb_step=0.0127, train/loss_step=0.566, global_step=4789.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  86%|████████▌ | 1039/1208 [28:16<04:36,  1.63s/it, loss=0.141, v_num=0, train/loss_simple_step=0.566, train/loss_vlb_step=0.0127, train/loss_step=0.566, global_step=4789.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  86%|████████▌ | 1039/1208 [28:16<04:36,  1.63s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0974, train/loss_vlb_step=0.000323, train/loss_step=0.0974, global_step=4789.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  86%|████████▌ | 1040/1208 [28:20<04:34,  1.63s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0974, train/loss_vlb_step=0.000323, train/loss_step=0.0974, global_step=4789.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  86%|████████▌ | 1040/1208 [28:20<04:34,  1.63s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0756, train/loss_vlb_step=0.000253, train/loss_step=0.0756, global_step=4789.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  86%|████████▌ | 1041/1208 [28:21<04:32,  1.63s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0756, train/loss_vlb_step=0.000253, train/loss_step=0.0756, global_step=4789.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  86%|████████▌ | 1041/1208 [28:21<04:32,  1.63s/it, loss=0.166, v_num=0, train/loss_simple_step=0.662, train/loss_vlb_step=0.0379, train/loss_step=0.662, global_step=4790.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  86%|████████▋ | 1042/1208 [28:22<04:31,  1.63s/it, loss=0.166, v_num=0, train/loss_simple_step=0.662, train/loss_vlb_step=0.0379, train/loss_step=0.662, global_step=4790.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  86%|████████▋ | 1042/1208 [28:22<04:31,  1.63s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.000166, train/loss_step=0.0483, global_step=4790.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  86%|████████▋ | 1043/1208 [28:23<04:29,  1.63s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.000166, train/loss_step=0.0483, global_step=4790.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  86%|████████▋ | 1043/1208 [28:23<04:29,  1.63s/it, loss=0.19, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.00514, train/loss_step=0.450, global_step=4790.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  86%|████████▋ | 1044/1208 [28:26<04:28,  1.63s/it, loss=0.19, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.00514, train/loss_step=0.450, global_step=4790.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  86%|████████▋ | 1044/1208 [28:26<04:28,  1.63s/it, loss=0.199, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.00066, train/loss_step=0.178, global_step=4790.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  87%|████████▋ | 1045/1208 [28:27<04:26,  1.63s/it, loss=0.199, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.00066, train/loss_step=0.178, global_step=4790.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  87%|████████▋ | 1045/1208 [28:27<04:26,  1.63s/it, loss=0.215, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00297, train/loss_step=0.339, global_step=4791.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  87%|████████▋ | 1046/1208 [28:28<04:24,  1.63s/it, loss=0.215, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00297, train/loss_step=0.339, global_step=4791.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  87%|████████▋ | 1046/1208 [28:28<04:24,  1.63s/it, loss=0.205, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.25e-5, train/loss_step=0.00216, global_step=4791.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  87%|████████▋ | 1047/1208 [28:29<04:22,  1.63s/it, loss=0.205, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.25e-5, train/loss_step=0.00216, global_step=4791.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  87%|████████▋ | 1047/1208 [28:29<04:22,  1.63s/it, loss=0.196, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00115, train/loss_step=0.268, global_step=4791.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  87%|████████▋ | 1048/1208 [28:33<04:21,  1.63s/it, loss=0.196, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00115, train/loss_step=0.268, global_step=4791.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  87%|████████▋ | 1048/1208 [28:33<04:21,  1.63s/it, loss=0.209, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00118, train/loss_step=0.269, global_step=4791.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  87%|████████▋ | 1049/1208 [28:34<04:19,  1.63s/it, loss=0.209, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00118, train/loss_step=0.269, global_step=4791.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  87%|████████▋ | 1049/1208 [28:34<04:19,  1.63s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.000133, train/loss_step=0.0352, global_step=4792.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  87%|████████▋ | 1050/1208 [28:35<04:18,  1.63s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.000133, train/loss_step=0.0352, global_step=4792.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  87%|████████▋ | 1050/1208 [28:35<04:18,  1.63s/it, loss=0.211, v_num=0, train/loss_simple_step=0.090, train/loss_vlb_step=0.000299, train/loss_step=0.090, global_step=4792.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  87%|████████▋ | 1051/1208 [28:36<04:16,  1.63s/it, loss=0.211, v_num=0, train/loss_simple_step=0.090, train/loss_vlb_step=0.000299, train/loss_step=0.090, global_step=4792.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  87%|████████▋ | 1051/1208 [28:36<04:16,  1.63s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0338, train/loss_vlb_step=0.000124, train/loss_step=0.0338, global_step=4792.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  87%|████████▋ | 1052/1208 [28:39<04:14,  1.63s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0338, train/loss_vlb_step=0.000124, train/loss_step=0.0338, global_step=4792.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  87%|████████▋ | 1052/1208 [28:39<04:14,  1.63s/it, loss=0.2, v_num=0, train/loss_simple_step=0.00527, train/loss_vlb_step=2.79e-5, train/loss_step=0.00527, global_step=4792.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  87%|████████▋ | 1053/1208 [28:40<04:13,  1.63s/it, loss=0.2, v_num=0, train/loss_simple_step=0.00527, train/loss_vlb_step=2.79e-5, train/loss_step=0.00527, global_step=4792.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  87%|████████▋ | 1053/1208 [28:40<04:13,  1.63s/it, loss=0.208, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000522, train/loss_step=0.157, global_step=4793.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  87%|████████▋ | 1054/1208 [28:41<04:11,  1.63s/it, loss=0.208, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000522, train/loss_step=0.157, global_step=4793.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  87%|████████▋ | 1054/1208 [28:41<04:11,  1.63s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000143, train/loss_step=0.0387, global_step=4793.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  87%|████████▋ | 1055/1208 [28:42<04:09,  1.63s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000143, train/loss_step=0.0387, global_step=4793.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  87%|████████▋ | 1055/1208 [28:42<04:09,  1.63s/it, loss=0.177, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000749, train/loss_step=0.200, global_step=4793.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  87%|████████▋ | 1056/1208 [28:45<04:08,  1.63s/it, loss=0.177, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000749, train/loss_step=0.200, global_step=4793.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  87%|████████▋ | 1056/1208 [28:45<04:08,  1.63s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000124, train/loss_step=0.0311, global_step=4793.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  88%|████████▊ | 1057/1208 [28:46<04:06,  1.63s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000124, train/loss_step=0.0311, global_step=4793.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  88%|████████▊ | 1057/1208 [28:46<04:06,  1.63s/it, loss=0.185, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000532, train/loss_step=0.152, global_step=4794.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  88%|████████▊ | 1058/1208 [28:47<04:04,  1.63s/it, loss=0.185, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000532, train/loss_step=0.152, global_step=4794.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  88%|████████▊ | 1058/1208 [28:47<04:04,  1.63s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.8e-5, train/loss_step=0.00331, global_step=4794.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  88%|████████▊ | 1059/1208 [28:48<04:03,  1.63s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.8e-5, train/loss_step=0.00331, global_step=4794.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  88%|████████▊ | 1059/1208 [28:48<04:03,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.29e-5, train/loss_step=0.00219, global_step=4794.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  88%|████████▊ | 1060/1208 [28:52<04:01,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.29e-5, train/loss_step=0.00219, global_step=4794.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  88%|████████▊ | 1060/1208 [28:52<04:01,  1.63s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=2.13e-5, train/loss_step=0.00392, global_step=4794.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  88%|████████▊ | 1061/1208 [28:53<04:00,  1.63s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=2.13e-5, train/loss_step=0.00392, global_step=4794.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  88%|████████▊ | 1061/1208 [28:53<04:00,  1.63s/it, loss=0.133, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00159, train/loss_step=0.355, global_step=4795.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  88%|████████▊ | 1062/1208 [28:54<03:58,  1.63s/it, loss=0.133, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00159, train/loss_step=0.355, global_step=4795.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  88%|████████▊ | 1062/1208 [28:54<03:58,  1.63s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0473, train/loss_vlb_step=0.000165, train/loss_step=0.0473, global_step=4795.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  88%|████████▊ | 1063/1208 [28:55<03:56,  1.63s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0473, train/loss_vlb_step=0.000165, train/loss_step=0.0473, global_step=4795.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  88%|████████▊ | 1063/1208 [28:55<03:56,  1.63s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.94e-5, train/loss_step=0.00351, global_step=4795.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  88%|████████▊ | 1064/1208 [28:58<03:55,  1.63s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.94e-5, train/loss_step=0.00351, global_step=4795.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  88%|████████▊ | 1064/1208 [28:58<03:55,  1.63s/it, loss=0.108, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000393, train/loss_step=0.117, global_step=4795.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  88%|████████▊ | 1065/1208 [28:59<03:53,  1.63s/it, loss=0.108, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000393, train/loss_step=0.117, global_step=4795.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  88%|████████▊ | 1065/1208 [28:59<03:53,  1.63s/it, loss=0.101, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000755, train/loss_step=0.207, global_step=4796.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  88%|████████▊ | 1066/1208 [29:00<03:51,  1.63s/it, loss=0.101, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000755, train/loss_step=0.207, global_step=4796.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  88%|████████▊ | 1066/1208 [29:00<03:51,  1.63s/it, loss=0.118, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.002, train/loss_step=0.338, global_step=4796.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  88%|████████▊ | 1067/1208 [29:01<03:50,  1.63s/it, loss=0.118, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.002, train/loss_step=0.338, global_step=4796.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  88%|████████▊ | 1067/1208 [29:01<03:50,  1.63s/it, loss=0.127, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00361, train/loss_step=0.454, global_step=4796.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  88%|████████▊ | 1068/1208 [29:05<03:48,  1.63s/it, loss=0.127, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00361, train/loss_step=0.454, global_step=4796.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  88%|████████▊ | 1068/1208 [29:05<03:48,  1.63s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00577, train/loss_vlb_step=2.89e-5, train/loss_step=0.00577, global_step=4796.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  88%|████████▊ | 1069/1208 [29:06<03:47,  1.63s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00577, train/loss_vlb_step=2.89e-5, train/loss_step=0.00577, global_step=4796.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  88%|████████▊ | 1069/1208 [29:06<03:47,  1.63s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00372, train/loss_vlb_step=2.04e-5, train/loss_step=0.00372, global_step=4797.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  89%|████████▊ | 1070/1208 [29:07<03:45,  1.63s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00372, train/loss_vlb_step=2.04e-5, train/loss_step=0.00372, global_step=4797.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  89%|████████▊ | 1070/1208 [29:07<03:45,  1.63s/it, loss=0.114, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000432, train/loss_step=0.129, global_step=4797.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  89%|████████▊ | 1071/1208 [29:08<03:43,  1.63s/it, loss=0.114, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000432, train/loss_step=0.129, global_step=4797.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  89%|████████▊ | 1071/1208 [29:08<03:43,  1.63s/it, loss=0.122, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000676, train/loss_step=0.190, global_step=4797.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  89%|████████▊ | 1072/1208 [29:11<03:42,  1.63s/it, loss=0.122, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000676, train/loss_step=0.190, global_step=4797.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  89%|████████▊ | 1072/1208 [29:11<03:42,  1.63s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00799, train/loss_vlb_step=3.95e-5, train/loss_step=0.00799, global_step=4797.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  89%|████████▉ | 1073/1208 [29:12<03:40,  1.63s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00799, train/loss_vlb_step=3.95e-5, train/loss_step=0.00799, global_step=4797.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  89%|████████▉ | 1073/1208 [29:12<03:40,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.00061, train/loss_step=0.177, global_step=4798.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  89%|████████▉ | 1074/1208 [29:13<03:38,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.00061, train/loss_step=0.177, global_step=4798.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  89%|████████▉ | 1074/1208 [29:13<03:38,  1.63s/it, loss=0.132, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000738, train/loss_step=0.202, global_step=4798.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  89%|████████▉ | 1075/1208 [29:14<03:37,  1.63s/it, loss=0.132, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000738, train/loss_step=0.202, global_step=4798.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  89%|████████▉ | 1075/1208 [29:14<03:37,  1.63s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00404, train/loss_vlb_step=2.25e-5, train/loss_step=0.00404, global_step=4798.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  89%|████████▉ | 1076/1208 [29:17<03:35,  1.63s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00404, train/loss_vlb_step=2.25e-5, train/loss_step=0.00404, global_step=4798.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  89%|████████▉ | 1076/1208 [29:17<03:35,  1.63s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=2.03e-5, train/loss_step=0.00375, global_step=4798.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  89%|████████▉ | 1077/1208 [29:18<03:33,  1.63s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=2.03e-5, train/loss_step=0.00375, global_step=4798.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  89%|████████▉ | 1077/1208 [29:18<03:33,  1.63s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.98e-5, train/loss_step=0.0246, global_step=4799.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  89%|████████▉ | 1078/1208 [29:19<03:32,  1.63s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.98e-5, train/loss_step=0.0246, global_step=4799.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  89%|████████▉ | 1078/1208 [29:19<03:32,  1.63s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.0001, train/loss_step=0.0256, global_step=4799.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  89%|████████▉ | 1079/1208 [29:20<03:30,  1.63s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.0001, train/loss_step=0.0256, global_step=4799.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  89%|████████▉ | 1079/1208 [29:20<03:30,  1.63s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00502, train/loss_vlb_step=2.49e-5, train/loss_step=0.00502, global_step=4799.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  89%|████████▉ | 1080/1208 [29:24<03:29,  1.63s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00502, train/loss_vlb_step=2.49e-5, train/loss_step=0.00502, global_step=4799.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  89%|████████▉ | 1080/1208 [29:24<03:29,  1.63s/it, loss=0.128, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.0011, train/loss_step=0.265, global_step=4799.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]     Epoch 15:  89%|████████▉ | 1081/1208 [29:25<03:27,  1.63s/it, loss=0.128, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.0011, train/loss_step=0.265, global_step=4799.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  89%|████████▉ | 1081/1208 [29:25<03:27,  1.63s/it, loss=0.111, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.68e-5, train/loss_step=0.003, global_step=4800.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  90%|████████▉ | 1082/1208 [29:26<03:25,  1.63s/it, loss=0.111, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.68e-5, train/loss_step=0.003, global_step=4800.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  90%|████████▉ | 1082/1208 [29:26<03:25,  1.63s/it, loss=0.131, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00421, train/loss_step=0.457, global_step=4800.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  90%|████████▉ | 1083/1208 [29:27<03:23,  1.63s/it, loss=0.131, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00421, train/loss_step=0.457, global_step=4800.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  90%|████████▉ | 1083/1208 [29:27<03:23,  1.63s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=9.72e-5, train/loss_step=0.0244, global_step=4800.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  90%|████████▉ | 1084/1208 [29:30<03:22,  1.63s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=9.72e-5, train/loss_step=0.0244, global_step=4800.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  90%|████████▉ | 1084/1208 [29:30<03:22,  1.63s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0877, train/loss_vlb_step=0.000291, train/loss_step=0.0877, global_step=4800.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  90%|████████▉ | 1085/1208 [29:31<03:20,  1.63s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0877, train/loss_vlb_step=0.000291, train/loss_step=0.0877, global_step=4800.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  90%|████████▉ | 1085/1208 [29:31<03:20,  1.63s/it, loss=0.126, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000401, train/loss_step=0.121, global_step=4801.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  90%|████████▉ | 1086/1208 [29:32<03:19,  1.63s/it, loss=0.126, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000401, train/loss_step=0.121, global_step=4801.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  90%|████████▉ | 1086/1208 [29:32<03:19,  1.63s/it, loss=0.12, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000897, train/loss_step=0.218, global_step=4801.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  90%|████████▉ | 1087/1208 [29:33<03:17,  1.63s/it, loss=0.12, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000897, train/loss_step=0.218, global_step=4801.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  90%|████████▉ | 1087/1208 [29:33<03:17,  1.63s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.37e-5, train/loss_step=0.0199, global_step=4801.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  90%|█████████ | 1088/1208 [29:37<03:16,  1.63s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.37e-5, train/loss_step=0.0199, global_step=4801.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  90%|█████████ | 1088/1208 [29:37<03:16,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000743, train/loss_step=0.213, global_step=4801.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  90%|█████████ | 1089/1208 [29:38<03:14,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000743, train/loss_step=0.213, global_step=4801.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  90%|█████████ | 1089/1208 [29:38<03:14,  1.63s/it, loss=0.119, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000753, train/loss_step=0.209, global_step=4802.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  90%|█████████ | 1090/1208 [29:39<03:12,  1.63s/it, loss=0.119, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000753, train/loss_step=0.209, global_step=4802.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  90%|█████████ | 1090/1208 [29:39<03:12,  1.63s/it, loss=0.119, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000403, train/loss_step=0.123, global_step=4802.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  90%|█████████ | 1091/1208 [29:40<03:10,  1.63s/it, loss=0.119, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000403, train/loss_step=0.123, global_step=4802.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  90%|█████████ | 1091/1208 [29:40<03:10,  1.63s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.22e-5, train/loss_step=0.00205, global_step=4802.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  90%|█████████ | 1092/1208 [29:43<03:09,  1.63s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.22e-5, train/loss_step=0.00205, global_step=4802.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  90%|█████████ | 1092/1208 [29:43<03:09,  1.63s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0988, train/loss_vlb_step=0.000325, train/loss_step=0.0988, global_step=4802.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  90%|█████████ | 1093/1208 [29:44<03:07,  1.63s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0988, train/loss_vlb_step=0.000325, train/loss_step=0.0988, global_step=4802.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  90%|█████████ | 1093/1208 [29:44<03:07,  1.63s/it, loss=0.119, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00114, train/loss_step=0.273, global_step=4803.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  91%|█████████ | 1094/1208 [29:45<03:06,  1.63s/it, loss=0.119, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00114, train/loss_step=0.273, global_step=4803.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  91%|█████████ | 1094/1208 [29:45<03:06,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.26e-5, train/loss_step=0.00213, global_step=4803.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  91%|█████████ | 1095/1208 [29:46<03:04,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.26e-5, train/loss_step=0.00213, global_step=4803.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  91%|█████████ | 1095/1208 [29:46<03:04,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.65e-5, train/loss_step=0.0134, global_step=4803.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  91%|█████████ | 1096/1208 [29:49<03:02,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.65e-5, train/loss_step=0.0134, global_step=4803.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  91%|█████████ | 1096/1208 [29:49<03:02,  1.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0786, train/loss_vlb_step=0.00026, train/loss_step=0.0786, global_step=4803.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  91%|█████████ | 1097/1208 [29:50<03:01,  1.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0786, train/loss_vlb_step=0.00026, train/loss_step=0.0786, global_step=4803.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  91%|█████████ | 1097/1208 [29:50<03:01,  1.63s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00678, train/loss_vlb_step=3.49e-5, train/loss_step=0.00678, global_step=4804.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  91%|█████████ | 1098/1208 [29:51<02:59,  1.63s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00678, train/loss_vlb_step=3.49e-5, train/loss_step=0.00678, global_step=4804.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  91%|█████████ | 1098/1208 [29:51<02:59,  1.63s/it, loss=0.125, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00114, train/loss_step=0.274, global_step=4804.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  91%|█████████ | 1099/1208 [29:52<02:57,  1.63s/it, loss=0.125, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00114, train/loss_step=0.274, global_step=4804.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  91%|█████████ | 1099/1208 [29:52<02:57,  1.63s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=1.39e-5, train/loss_step=0.00245, global_step=4804.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  91%|█████████ | 1100/1208 [29:56<02:56,  1.63s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=1.39e-5, train/loss_step=0.00245, global_step=4804.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  91%|█████████ | 1100/1208 [29:56<02:56,  1.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000102, train/loss_step=0.0253, global_step=4804.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  91%|█████████ | 1101/1208 [29:57<02:54,  1.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000102, train/loss_step=0.0253, global_step=4804.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  91%|█████████ | 1101/1208 [29:57<02:54,  1.63s/it, loss=0.118, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000334, train/loss_step=0.102, global_step=4805.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  91%|█████████ | 1102/1208 [29:58<02:52,  1.63s/it, loss=0.118, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000334, train/loss_step=0.102, global_step=4805.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  91%|█████████ | 1102/1208 [29:58<02:52,  1.63s/it, loss=0.104, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000623, train/loss_step=0.182, global_step=4805.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  91%|█████████▏| 1103/1208 [29:59<02:51,  1.63s/it, loss=0.104, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000623, train/loss_step=0.182, global_step=4805.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  91%|█████████▏| 1103/1208 [29:59<02:51,  1.63s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000134, train/loss_step=0.0369, global_step=4805.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  91%|█████████▏| 1104/1208 [30:02<02:49,  1.63s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000134, train/loss_step=0.0369, global_step=4805.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  91%|█████████▏| 1104/1208 [30:02<02:49,  1.63s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0608, train/loss_vlb_step=0.000203, train/loss_step=0.0608, global_step=4805.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  91%|█████████▏| 1105/1208 [30:03<02:48,  1.63s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0608, train/loss_vlb_step=0.000203, train/loss_step=0.0608, global_step=4805.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  91%|█████████▏| 1105/1208 [30:03<02:48,  1.63s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.0065, train/loss_vlb_step=3.19e-5, train/loss_step=0.0065, global_step=4806.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  92%|█████████▏| 1106/1208 [30:04<02:46,  1.63s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.0065, train/loss_vlb_step=3.19e-5, train/loss_step=0.0065, global_step=4806.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  92%|█████████▏| 1106/1208 [30:04<02:46,  1.63s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000522, train/loss_step=0.156, global_step=4806.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  92%|█████████▏| 1107/1208 [30:05<02:44,  1.63s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000522, train/loss_step=0.156, global_step=4806.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  92%|█████████▏| 1107/1208 [30:05<02:44,  1.63s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.0681, train/loss_vlb_step=0.00023, train/loss_step=0.0681, global_step=4806.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  92%|█████████▏| 1108/1208 [30:09<02:43,  1.63s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.0681, train/loss_vlb_step=0.00023, train/loss_step=0.0681, global_step=4806.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  92%|█████████▏| 1108/1208 [30:09<02:43,  1.63s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000961, train/loss_step=0.224, global_step=4806.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  92%|█████████▏| 1109/1208 [30:10<02:41,  1.63s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000961, train/loss_step=0.224, global_step=4806.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  92%|█████████▏| 1109/1208 [30:10<02:41,  1.63s/it, loss=0.0869, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.2e-5, train/loss_step=0.00198, global_step=4807.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  92%|█████████▏| 1110/1208 [30:11<02:39,  1.63s/it, loss=0.0869, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.2e-5, train/loss_step=0.00198, global_step=4807.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  92%|█████████▏| 1110/1208 [30:11<02:39,  1.63s/it, loss=0.0873, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.00044, train/loss_step=0.131, global_step=4807.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  92%|█████████▏| 1111/1208 [30:12<02:38,  1.63s/it, loss=0.0873, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.00044, train/loss_step=0.131, global_step=4807.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  92%|█████████▏| 1111/1208 [30:12<02:38,  1.63s/it, loss=0.0923, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000337, train/loss_step=0.103, global_step=4807.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  92%|█████████▏| 1112/1208 [30:15<02:36,  1.63s/it, loss=0.0923, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000337, train/loss_step=0.103, global_step=4807.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  92%|█████████▏| 1112/1208 [30:15<02:36,  1.63s/it, loss=0.0891, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.00013, train/loss_step=0.0344, global_step=4807.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  92%|█████████▏| 1113/1208 [30:16<02:35,  1.63s/it, loss=0.0891, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.00013, train/loss_step=0.0344, global_step=4807.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  92%|█████████▏| 1113/1208 [30:16<02:35,  1.63s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.00045, train/loss_step=0.135, global_step=4808.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  92%|█████████▏| 1114/1208 [30:17<02:33,  1.63s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.00045, train/loss_step=0.135, global_step=4808.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  92%|█████████▏| 1114/1208 [30:17<02:33,  1.63s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00174, train/loss_step=0.325, global_step=4808.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  92%|█████████▏| 1115/1208 [30:18<02:31,  1.63s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00174, train/loss_step=0.325, global_step=4808.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  92%|█████████▏| 1115/1208 [30:18<02:31,  1.63s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0861, train/loss_vlb_step=0.000286, train/loss_step=0.0861, global_step=4808.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  92%|█████████▏| 1116/1208 [30:21<02:30,  1.63s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0861, train/loss_vlb_step=0.000286, train/loss_step=0.0861, global_step=4808.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  92%|█████████▏| 1116/1208 [30:21<02:30,  1.63s/it, loss=0.128, v_num=0, train/loss_simple_step=0.598, train/loss_vlb_step=0.00884, train/loss_step=0.598, global_step=4808.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  92%|█████████▏| 1117/1208 [30:22<02:28,  1.63s/it, loss=0.128, v_num=0, train/loss_simple_step=0.598, train/loss_vlb_step=0.00884, train/loss_step=0.598, global_step=4808.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  92%|█████████▏| 1117/1208 [30:22<02:28,  1.63s/it, loss=0.162, v_num=0, train/loss_simple_step=0.695, train/loss_vlb_step=0.0216, train/loss_step=0.695, global_step=4809.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  93%|█████████▎| 1118/1208 [30:23<02:26,  1.63s/it, loss=0.162, v_num=0, train/loss_simple_step=0.695, train/loss_vlb_step=0.0216, train/loss_step=0.695, global_step=4809.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  93%|█████████▎| 1118/1208 [30:23<02:26,  1.63s/it, loss=0.157, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000609, train/loss_step=0.173, global_step=4809.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  93%|█████████▎| 1119/1208 [30:25<02:25,  1.63s/it, loss=0.157, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000609, train/loss_step=0.173, global_step=4809.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  93%|█████████▎| 1119/1208 [30:25<02:25,  1.63s/it, loss=0.171, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00164, train/loss_step=0.284, global_step=4809.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  93%|█████████▎| 1120/1208 [30:28<02:23,  1.63s/it, loss=0.171, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00164, train/loss_step=0.284, global_step=4809.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  93%|█████████▎| 1120/1208 [30:28<02:23,  1.63s/it, loss=0.175, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=4809.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  93%|█████████▎| 1121/1208 [30:29<02:21,  1.63s/it, loss=0.175, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=4809.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  93%|█████████▎| 1121/1208 [30:29<02:21,  1.63s/it, loss=0.192, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00447, train/loss_step=0.436, global_step=4810.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  93%|█████████▎| 1122/1208 [30:30<02:20,  1.63s/it, loss=0.192, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00447, train/loss_step=0.436, global_step=4810.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  93%|█████████▎| 1122/1208 [30:30<02:20,  1.63s/it, loss=0.185, v_num=0, train/loss_simple_step=0.040, train/loss_vlb_step=0.000144, train/loss_step=0.040, global_step=4810.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  93%|█████████▎| 1123/1208 [30:31<02:18,  1.63s/it, loss=0.185, v_num=0, train/loss_simple_step=0.040, train/loss_vlb_step=0.000144, train/loss_step=0.040, global_step=4810.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  93%|█████████▎| 1123/1208 [30:31<02:18,  1.63s/it, loss=0.203, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00285, train/loss_step=0.408, global_step=4810.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  93%|█████████▎| 1124/1208 [30:34<02:17,  1.63s/it, loss=0.203, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00285, train/loss_step=0.408, global_step=4810.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  93%|█████████▎| 1124/1208 [30:34<02:17,  1.63s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.27e-5, train/loss_step=0.0239, global_step=4810.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  93%|█████████▎| 1125/1208 [30:35<02:15,  1.63s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.27e-5, train/loss_step=0.0239, global_step=4810.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  93%|█████████▎| 1125/1208 [30:35<02:15,  1.63s/it, loss=0.211, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000717, train/loss_step=0.200, global_step=4811.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  93%|█████████▎| 1126/1208 [30:36<02:13,  1.63s/it, loss=0.211, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000717, train/loss_step=0.200, global_step=4811.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  93%|█████████▎| 1126/1208 [30:36<02:13,  1.63s/it, loss=0.204, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.69e-5, train/loss_step=0.0154, global_step=4811.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  93%|█████████▎| 1127/1208 [30:37<02:12,  1.63s/it, loss=0.204, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.69e-5, train/loss_step=0.0154, global_step=4811.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  93%|█████████▎| 1127/1208 [30:37<02:12,  1.63s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.72e-5, train/loss_step=0.0101, global_step=4811.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  93%|█████████▎| 1128/1208 [30:41<02:10,  1.63s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.72e-5, train/loss_step=0.0101, global_step=4811.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  93%|█████████▎| 1128/1208 [30:41<02:10,  1.63s/it, loss=0.19, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.14e-5, train/loss_step=0.00194, global_step=4811.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  93%|█████████▎| 1129/1208 [30:42<02:08,  1.63s/it, loss=0.19, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.14e-5, train/loss_step=0.00194, global_step=4811.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  93%|█████████▎| 1129/1208 [30:42<02:08,  1.63s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0747, train/loss_vlb_step=0.000253, train/loss_step=0.0747, global_step=4812.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  94%|█████████▎| 1130/1208 [30:43<02:07,  1.63s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0747, train/loss_vlb_step=0.000253, train/loss_step=0.0747, global_step=4812.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  94%|█████████▎| 1130/1208 [30:43<02:07,  1.63s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000127, train/loss_step=0.0333, global_step=4812.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  94%|█████████▎| 1131/1208 [30:44<02:05,  1.63s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000127, train/loss_step=0.0333, global_step=4812.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  94%|█████████▎| 1131/1208 [30:44<02:05,  1.63s/it, loss=0.205, v_num=0, train/loss_simple_step=0.429, train/loss_vlb_step=0.00306, train/loss_step=0.429, global_step=4812.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  94%|█████████▎| 1132/1208 [30:47<02:04,  1.63s/it, loss=0.205, v_num=0, train/loss_simple_step=0.429, train/loss_vlb_step=0.00306, train/loss_step=0.429, global_step=4812.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  94%|█████████▎| 1132/1208 [30:47<02:04,  1.63s/it, loss=0.208, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000313, train/loss_step=0.095, global_step=4812.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  94%|█████████▍| 1133/1208 [30:48<02:02,  1.63s/it, loss=0.208, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000313, train/loss_step=0.095, global_step=4812.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  94%|█████████▍| 1133/1208 [30:48<02:02,  1.63s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.38e-5, train/loss_step=0.0127, global_step=4813.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  94%|█████████▍| 1134/1208 [30:49<02:00,  1.63s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.38e-5, train/loss_step=0.0127, global_step=4813.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  94%|█████████▍| 1134/1208 [30:49<02:00,  1.63s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.61e-5, train/loss_step=0.0153, global_step=4813.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  94%|█████████▍| 1135/1208 [30:50<01:59,  1.63s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.61e-5, train/loss_step=0.0153, global_step=4813.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  94%|█████████▍| 1135/1208 [30:50<01:59,  1.63s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00941, train/loss_vlb_step=4.48e-5, train/loss_step=0.00941, global_step=4813.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  94%|█████████▍| 1136/1208 [30:53<01:57,  1.63s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00941, train/loss_vlb_step=4.48e-5, train/loss_step=0.00941, global_step=4813.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  94%|█████████▍| 1136/1208 [30:53<01:57,  1.63s/it, loss=0.166, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00101, train/loss_step=0.250, global_step=4813.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  94%|█████████▍| 1137/1208 [30:54<01:55,  1.63s/it, loss=0.166, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00101, train/loss_step=0.250, global_step=4813.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  94%|█████████▍| 1137/1208 [30:54<01:55,  1.63s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000122, train/loss_step=0.0317, global_step=4814.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  94%|█████████▍| 1138/1208 [30:55<01:54,  1.63s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000122, train/loss_step=0.0317, global_step=4814.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  94%|█████████▍| 1138/1208 [30:55<01:54,  1.63s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.7e-5, train/loss_step=0.0162, global_step=4814.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  94%|█████████▍| 1139/1208 [30:56<01:52,  1.63s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.7e-5, train/loss_step=0.0162, global_step=4814.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  94%|█████████▍| 1139/1208 [30:56<01:52,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=4814.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  94%|█████████▍| 1140/1208 [31:00<01:50,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=4814.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  94%|█████████▍| 1140/1208 [31:00<01:50,  1.63s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.00014, train/loss_step=0.0379, global_step=4814.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  94%|█████████▍| 1141/1208 [31:01<01:49,  1.63s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.00014, train/loss_step=0.0379, global_step=4814.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  94%|█████████▍| 1141/1208 [31:01<01:49,  1.63s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.00982, train/loss_vlb_step=4.51e-5, train/loss_step=0.00982, global_step=4815.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  95%|█████████▍| 1142/1208 [31:02<01:47,  1.63s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.00982, train/loss_vlb_step=4.51e-5, train/loss_step=0.00982, global_step=4815.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  95%|█████████▍| 1142/1208 [31:02<01:47,  1.63s/it, loss=0.0895, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.74e-5, train/loss_step=0.012, global_step=4815.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  95%|█████████▍| 1143/1208 [31:03<01:45,  1.63s/it, loss=0.0895, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.74e-5, train/loss_step=0.012, global_step=4815.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  95%|█████████▍| 1143/1208 [31:03<01:45,  1.63s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00142, train/loss_step=0.313, global_step=4815.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  95%|█████████▍| 1144/1208 [31:06<01:44,  1.63s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00142, train/loss_step=0.313, global_step=4815.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  95%|█████████▍| 1144/1208 [31:06<01:44,  1.63s/it, loss=0.117, v_num=0, train/loss_simple_step=0.674, train/loss_vlb_step=0.0189, train/loss_step=0.674, global_step=4815.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  95%|█████████▍| 1145/1208 [31:07<01:42,  1.63s/it, loss=0.117, v_num=0, train/loss_simple_step=0.674, train/loss_vlb_step=0.0189, train/loss_step=0.674, global_step=4815.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  95%|█████████▍| 1145/1208 [31:07<01:42,  1.63s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00172, train/loss_vlb_step=1.03e-5, train/loss_step=0.00172, global_step=4816.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  95%|█████████▍| 1146/1208 [31:08<01:41,  1.63s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00172, train/loss_vlb_step=1.03e-5, train/loss_step=0.00172, global_step=4816.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  95%|█████████▍| 1146/1208 [31:08<01:41,  1.63s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000244, train/loss_step=0.0732, global_step=4816.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  95%|█████████▍| 1147/1208 [31:09<01:39,  1.63s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000244, train/loss_step=0.0732, global_step=4816.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  95%|█████████▍| 1147/1208 [31:09<01:39,  1.63s/it, loss=0.12, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000747, train/loss_step=0.209, global_step=4816.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  95%|█████████▌| 1148/1208 [31:12<01:37,  1.63s/it, loss=0.12, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000747, train/loss_step=0.209, global_step=4816.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  95%|█████████▌| 1148/1208 [31:12<01:37,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000254, train/loss_step=0.0741, global_step=4816.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  95%|█████████▌| 1149/1208 [31:14<01:36,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000254, train/loss_step=0.0741, global_step=4816.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  95%|█████████▌| 1149/1208 [31:14<01:36,  1.63s/it, loss=0.136, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00159, train/loss_step=0.317, global_step=4817.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  95%|█████████▌| 1150/1208 [31:15<01:34,  1.63s/it, loss=0.136, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00159, train/loss_step=0.317, global_step=4817.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  95%|█████████▌| 1150/1208 [31:15<01:34,  1.63s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.00013, train/loss_step=0.0349, global_step=4817.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  95%|█████████▌| 1151/1208 [31:16<01:32,  1.63s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.00013, train/loss_step=0.0349, global_step=4817.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  95%|█████████▌| 1151/1208 [31:16<01:32,  1.63s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=9.76e-6, train/loss_step=0.00166, global_step=4817.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  95%|█████████▌| 1152/1208 [31:19<01:31,  1.63s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=9.76e-6, train/loss_step=0.00166, global_step=4817.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  95%|█████████▌| 1152/1208 [31:19<01:31,  1.63s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0998, train/loss_vlb_step=0.000328, train/loss_step=0.0998, global_step=4817.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  95%|█████████▌| 1153/1208 [31:20<01:29,  1.63s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0998, train/loss_vlb_step=0.000328, train/loss_step=0.0998, global_step=4817.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  95%|█████████▌| 1153/1208 [31:20<01:29,  1.63s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0895, train/loss_vlb_step=0.000295, train/loss_step=0.0895, global_step=4818.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  96%|█████████▌| 1154/1208 [31:21<01:28,  1.63s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0895, train/loss_vlb_step=0.000295, train/loss_step=0.0895, global_step=4818.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  96%|█████████▌| 1154/1208 [31:21<01:28,  1.63s/it, loss=0.134, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00187, train/loss_step=0.330, global_step=4818.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  96%|█████████▌| 1155/1208 [31:22<01:26,  1.63s/it, loss=0.134, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00187, train/loss_step=0.330, global_step=4818.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  96%|█████████▌| 1155/1208 [31:22<01:26,  1.63s/it, loss=0.155, v_num=0, train/loss_simple_step=0.416, train/loss_vlb_step=0.00304, train/loss_step=0.416, global_step=4818.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  96%|█████████▌| 1156/1208 [31:25<01:24,  1.63s/it, loss=0.155, v_num=0, train/loss_simple_step=0.416, train/loss_vlb_step=0.00304, train/loss_step=0.416, global_step=4818.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  96%|█████████▌| 1156/1208 [31:25<01:24,  1.63s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=1.1e-5, train/loss_step=0.00187, global_step=4818.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  96%|█████████▌| 1157/1208 [31:26<01:23,  1.63s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=1.1e-5, train/loss_step=0.00187, global_step=4818.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  96%|█████████▌| 1157/1208 [31:26<01:23,  1.63s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00693, train/loss_vlb_step=3.6e-5, train/loss_step=0.00693, global_step=4819.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  96%|█████████▌| 1158/1208 [31:27<01:21,  1.63s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00693, train/loss_vlb_step=3.6e-5, train/loss_step=0.00693, global_step=4819.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  96%|█████████▌| 1158/1208 [31:27<01:21,  1.63s/it, loss=0.17, v_num=0, train/loss_simple_step=0.593, train/loss_vlb_step=0.0166, train/loss_step=0.593, global_step=4819.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]     Epoch 15:  96%|█████████▌| 1159/1208 [31:28<01:19,  1.63s/it, loss=0.17, v_num=0, train/loss_simple_step=0.593, train/loss_vlb_step=0.0166, train/loss_step=0.593, global_step=4819.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  96%|█████████▌| 1159/1208 [31:28<01:19,  1.63s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=8.51e-6, train/loss_step=0.0014, global_step=4819.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  96%|█████████▌| 1160/1208 [31:32<01:18,  1.63s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=8.51e-6, train/loss_step=0.0014, global_step=4819.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  96%|█████████▌| 1160/1208 [31:32<01:18,  1.63s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.76e-5, train/loss_step=0.0214, global_step=4819.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  96%|█████████▌| 1161/1208 [31:33<01:16,  1.63s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.76e-5, train/loss_step=0.0214, global_step=4819.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  96%|█████████▌| 1161/1208 [31:33<01:16,  1.63s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00929, train/loss_vlb_step=4.44e-5, train/loss_step=0.00929, global_step=4820.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  96%|█████████▌| 1162/1208 [31:34<01:14,  1.63s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00929, train/loss_vlb_step=4.44e-5, train/loss_step=0.00929, global_step=4820.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  96%|█████████▌| 1162/1208 [31:34<01:14,  1.63s/it, loss=0.184, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.0037, train/loss_step=0.407, global_step=4820.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]     Epoch 15:  96%|█████████▋| 1163/1208 [31:35<01:13,  1.63s/it, loss=0.184, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.0037, train/loss_step=0.407, global_step=4820.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  96%|█████████▋| 1163/1208 [31:35<01:13,  1.63s/it, loss=0.176, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000518, train/loss_step=0.149, global_step=4820.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  96%|█████████▋| 1164/1208 [31:38<01:11,  1.63s/it, loss=0.176, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000518, train/loss_step=0.149, global_step=4820.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  96%|█████████▋| 1164/1208 [31:38<01:11,  1.63s/it, loss=0.153, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000939, train/loss_step=0.221, global_step=4820.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  96%|█████████▋| 1165/1208 [31:39<01:10,  1.63s/it, loss=0.153, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000939, train/loss_step=0.221, global_step=4820.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  96%|█████████▋| 1165/1208 [31:39<01:10,  1.63s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0421, train/loss_vlb_step=0.000153, train/loss_step=0.0421, global_step=4821.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  97%|█████████▋| 1166/1208 [31:40<01:08,  1.63s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0421, train/loss_vlb_step=0.000153, train/loss_step=0.0421, global_step=4821.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  97%|█████████▋| 1166/1208 [31:40<01:08,  1.63s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00353, train/loss_vlb_step=1.91e-5, train/loss_step=0.00353, global_step=4821.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  97%|█████████▋| 1167/1208 [31:41<01:06,  1.63s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00353, train/loss_vlb_step=1.91e-5, train/loss_step=0.00353, global_step=4821.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  97%|█████████▋| 1167/1208 [31:41<01:06,  1.63s/it, loss=0.147, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000423, train/loss_step=0.129, global_step=4821.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  97%|█████████▋| 1168/1208 [31:44<01:05,  1.63s/it, loss=0.147, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000423, train/loss_step=0.129, global_step=4821.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  97%|█████████▋| 1168/1208 [31:44<01:05,  1.63s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.19e-5, train/loss_step=0.00203, global_step=4821.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  97%|█████████▋| 1169/1208 [31:45<01:03,  1.63s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.19e-5, train/loss_step=0.00203, global_step=4821.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  97%|█████████▋| 1169/1208 [31:45<01:03,  1.63s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=1.51e-5, train/loss_step=0.00258, global_step=4822.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  97%|█████████▋| 1170/1208 [31:46<01:01,  1.63s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=1.51e-5, train/loss_step=0.00258, global_step=4822.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  97%|█████████▋| 1170/1208 [31:46<01:01,  1.63s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.00016, train/loss_step=0.0459, global_step=4822.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  97%|█████████▋| 1171/1208 [31:48<01:00,  1.63s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.00016, train/loss_step=0.0459, global_step=4822.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  97%|█████████▋| 1171/1208 [31:48<01:00,  1.63s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000146, train/loss_step=0.0406, global_step=4822.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  97%|█████████▋| 1172/1208 [31:51<00:58,  1.63s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000146, train/loss_step=0.0406, global_step=4822.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  97%|█████████▋| 1172/1208 [31:51<00:58,  1.63s/it, loss=0.136, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000753, train/loss_step=0.202, global_step=4822.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  97%|█████████▋| 1173/1208 [31:52<00:57,  1.63s/it, loss=0.136, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000753, train/loss_step=0.202, global_step=4822.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  97%|█████████▋| 1173/1208 [31:52<00:57,  1.63s/it, loss=0.135, v_num=0, train/loss_simple_step=0.080, train/loss_vlb_step=0.000264, train/loss_step=0.080, global_step=4823.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  97%|█████████▋| 1174/1208 [31:53<00:55,  1.63s/it, loss=0.135, v_num=0, train/loss_simple_step=0.080, train/loss_vlb_step=0.000264, train/loss_step=0.080, global_step=4823.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  97%|█████████▋| 1174/1208 [31:53<00:55,  1.63s/it, loss=0.13, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000782, train/loss_step=0.224, global_step=4823.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  97%|█████████▋| 1175/1208 [31:54<00:53,  1.63s/it, loss=0.13, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000782, train/loss_step=0.224, global_step=4823.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  97%|█████████▋| 1175/1208 [31:54<00:53,  1.63s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0592, train/loss_vlb_step=0.000208, train/loss_step=0.0592, global_step=4823.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  97%|█████████▋| 1176/1208 [31:57<00:52,  1.63s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0592, train/loss_vlb_step=0.000208, train/loss_step=0.0592, global_step=4823.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  97%|█████████▋| 1176/1208 [31:57<00:52,  1.63s/it, loss=0.128, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.0014, train/loss_step=0.313, global_step=4823.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]    Epoch 15:  97%|█████████▋| 1177/1208 [31:58<00:50,  1.63s/it, loss=0.128, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.0014, train/loss_step=0.313, global_step=4823.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  97%|█████████▋| 1177/1208 [31:58<00:50,  1.63s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0881, train/loss_vlb_step=0.00029, train/loss_step=0.0881, global_step=4824.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  98%|█████████▊| 1178/1208 [31:59<00:48,  1.63s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0881, train/loss_vlb_step=0.00029, train/loss_step=0.0881, global_step=4824.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  98%|█████████▊| 1178/1208 [31:59<00:48,  1.63s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0559, train/loss_vlb_step=0.000196, train/loss_step=0.0559, global_step=4824.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  98%|█████████▊| 1179/1208 [32:00<00:47,  1.63s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0559, train/loss_vlb_step=0.000196, train/loss_step=0.0559, global_step=4824.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  98%|█████████▊| 1179/1208 [32:00<00:47,  1.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000526, train/loss_step=0.157, global_step=4824.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  98%|█████████▊| 1180/1208 [32:04<00:45,  1.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000526, train/loss_step=0.157, global_step=4824.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  98%|█████████▊| 1180/1208 [32:04<00:45,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000843, train/loss_step=0.224, global_step=4824.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  98%|█████████▊| 1181/1208 [32:05<00:44,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000843, train/loss_step=0.224, global_step=4824.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  98%|█████████▊| 1181/1208 [32:05<00:44,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.11e-5, train/loss_step=0.0113, global_step=4825.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  98%|█████████▊| 1182/1208 [32:06<00:42,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.11e-5, train/loss_step=0.0113, global_step=4825.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  98%|█████████▊| 1182/1208 [32:06<00:42,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000458, train/loss_step=0.134, global_step=4825.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  98%|█████████▊| 1183/1208 [32:07<00:40,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000458, train/loss_step=0.134, global_step=4825.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  98%|█████████▊| 1183/1208 [32:07<00:40,  1.63s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000117, train/loss_step=0.0298, global_step=4825.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  98%|█████████▊| 1184/1208 [32:10<00:39,  1.63s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000117, train/loss_step=0.0298, global_step=4825.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  98%|█████████▊| 1184/1208 [32:10<00:39,  1.63s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000363, train/loss_step=0.110, global_step=4825.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  98%|█████████▊| 1185/1208 [32:11<00:37,  1.63s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000363, train/loss_step=0.110, global_step=4825.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  98%|█████████▊| 1185/1208 [32:11<00:37,  1.63s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.04e-5, train/loss_step=0.0167, global_step=4826.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  98%|█████████▊| 1186/1208 [32:12<00:35,  1.63s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.04e-5, train/loss_step=0.0167, global_step=4826.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  98%|█████████▊| 1186/1208 [32:12<00:35,  1.63s/it, loss=0.0991, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000191, train/loss_step=0.0555, global_step=4826.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  98%|█████████▊| 1187/1208 [32:13<00:34,  1.63s/it, loss=0.0991, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000191, train/loss_step=0.0555, global_step=4826.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  98%|█████████▊| 1187/1208 [32:13<00:34,  1.63s/it, loss=0.102, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000715, train/loss_step=0.187, global_step=4826.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  98%|█████████▊| 1188/1208 [32:16<00:32,  1.63s/it, loss=0.102, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000715, train/loss_step=0.187, global_step=4826.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  98%|█████████▊| 1188/1208 [32:16<00:32,  1.63s/it, loss=0.125, v_num=0, train/loss_simple_step=0.453, train/loss_vlb_step=0.00556, train/loss_step=0.453, global_step=4826.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  98%|█████████▊| 1189/1208 [32:17<00:30,  1.63s/it, loss=0.125, v_num=0, train/loss_simple_step=0.453, train/loss_vlb_step=0.00556, train/loss_step=0.453, global_step=4826.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  98%|█████████▊| 1189/1208 [32:17<00:30,  1.63s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.00011, train/loss_step=0.0301, global_step=4827.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  99%|█████████▊| 1190/1208 [32:18<00:29,  1.63s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.00011, train/loss_step=0.0301, global_step=4827.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  99%|█████████▊| 1190/1208 [32:18<00:29,  1.63s/it, loss=0.15, v_num=0, train/loss_simple_step=0.525, train/loss_vlb_step=0.00547, train/loss_step=0.525, global_step=4827.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   Epoch 15:  99%|█████████▊| 1191/1208 [32:19<00:27,  1.63s/it, loss=0.15, v_num=0, train/loss_simple_step=0.525, train/loss_vlb_step=0.00547, train/loss_step=0.525, global_step=4827.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  99%|█████████▊| 1191/1208 [32:19<00:27,  1.63s/it, loss=0.158, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000763, train/loss_step=0.200, global_step=4827.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  99%|█████████▊| 1192/1208 [32:23<00:26,  1.63s/it, loss=0.158, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000763, train/loss_step=0.200, global_step=4827.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  99%|█████████▊| 1192/1208 [32:23<00:26,  1.63s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.83e-5, train/loss_step=0.0125, global_step=4827.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  99%|█████████▉| 1193/1208 [32:24<00:24,  1.63s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.83e-5, train/loss_step=0.0125, global_step=4827.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  99%|█████████▉| 1193/1208 [32:24<00:24,  1.63s/it, loss=0.166, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00341, train/loss_step=0.433, global_step=4828.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]  Epoch 15:  99%|█████████▉| 1194/1208 [32:25<00:22,  1.63s/it, loss=0.166, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00341, train/loss_step=0.433, global_step=4828.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  99%|█████████▉| 1194/1208 [32:25<00:22,  1.63s/it, loss=0.168, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00105, train/loss_step=0.263, global_step=4828.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  99%|█████████▉| 1195/1208 [32:26<00:21,  1.63s/it, loss=0.168, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00105, train/loss_step=0.263, global_step=4828.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  99%|█████████▉| 1195/1208 [32:26<00:21,  1.63s/it, loss=0.173, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000518, train/loss_step=0.152, global_step=4828.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  99%|█████████▉| 1196/1208 [32:29<00:19,  1.63s/it, loss=0.173, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000518, train/loss_step=0.152, global_step=4828.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  99%|█████████▉| 1196/1208 [32:29<00:19,  1.63s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000127, train/loss_step=0.0328, global_step=4828.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  99%|█████████▉| 1197/1208 [32:30<00:17,  1.63s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000127, train/loss_step=0.0328, global_step=4828.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  99%|█████████▉| 1197/1208 [32:30<00:17,  1.63s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.000207, train/loss_step=0.0615, global_step=4829.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  99%|█████████▉| 1198/1208 [32:31<00:16,  1.63s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.000207, train/loss_step=0.0615, global_step=4829.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  99%|█████████▉| 1198/1208 [32:31<00:16,  1.63s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00456, train/loss_vlb_step=2.35e-5, train/loss_step=0.00456, global_step=4829.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  99%|█████████▉| 1199/1208 [32:32<00:14,  1.63s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00456, train/loss_vlb_step=2.35e-5, train/loss_step=0.00456, global_step=4829.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  99%|█████████▉| 1199/1208 [32:32<00:14,  1.63s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000161, train/loss_step=0.0463, global_step=4829.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15:  99%|█████████▉| 1200/1208 [32:35<00:13,  1.63s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000161, train/loss_step=0.0463, global_step=4829.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  99%|█████████▉| 1200/1208 [32:35<00:13,  1.63s/it, loss=0.15, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000978, train/loss_step=0.236, global_step=4829.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]   
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.76it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.83it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.84it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.79it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.80it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.81it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.78it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 15:  99%|█████████▉| 1201/1208 [33:06<00:11,  1.65s/it, loss=0.15, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000978, train/loss_step=0.236, global_step=4829.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15:  99%|█████████▉| 1201/1208 [33:06<00:11,  1.65s/it, loss=0.154, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000342, train/loss_step=0.103, global_step=4830.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15: 100%|█████████▉| 1202/1208 [33:07<00:09,  1.65s/it, loss=0.154, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000342, train/loss_step=0.103, global_step=4830.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15: 100%|█████████▉| 1202/1208 [33:07<00:09,  1.65s/it, loss=0.153, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000373, train/loss_step=0.114, global_step=4830.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15: 100%|█████████▉| 1203/1208 [33:08<00:08,  1.65s/it, loss=0.153, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000373, train/loss_step=0.114, global_step=4830.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15: 100%|█████████▉| 1203/1208 [33:08<00:08,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000756, train/loss_step=0.209, global_step=4830.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15: 100%|█████████▉| 1204/1208 [33:11<00:06,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000756, train/loss_step=0.209, global_step=4830.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15: 100%|█████████▉| 1204/1208 [33:11<00:06,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=8.74e-5, train/loss_step=0.0232, global_step=4830.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15: 100%|█████████▉| 1205/1208 [33:12<00:04,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=8.74e-5, train/loss_step=0.0232, global_step=4830.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15: 100%|█████████▉| 1205/1208 [33:12<00:04,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000357, train/loss_step=0.109, global_step=4831.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] Epoch 15: 100%|█████████▉| 1206/1208 [33:13<00:03,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000357, train/loss_step=0.109, global_step=4831.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15: 100%|█████████▉| 1206/1208 [33:13<00:03,  1.65s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.22e-5, train/loss_step=0.00219, global_step=4831.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15: 100%|█████████▉| 1207/1208 [33:14<00:01,  1.65s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.22e-5, train/loss_step=0.00219, global_step=4831.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15: 100%|█████████▉| 1207/1208 [33:14<00:01,  1.65s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00353, train/loss_vlb_step=1.97e-5, train/loss_step=0.00353, global_step=4831.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15: 100%|██████████| 1208/1208 [33:20<00:00,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00353, train/loss_vlb_step=1.97e-5, train/loss_step=0.00353, global_step=4831.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 15: 100%|██████████| 1208/1208 [33:20<00:00,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0498, train/loss_vlb_step=0.000178, train/loss_step=0.0498, global_step=4831.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141] 
+
+
+Epoch 15:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.131, v_num=0, train/loss_simple_step=0.0498, train/loss_vlb_step=0.000178, train/loss_step=0.0498, global_step=4831.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]           Epoch 16:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.131, v_num=0, train/loss_simple_step=0.0498, train/loss_vlb_step=0.000178, train/loss_step=0.0498, global_step=4831.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.77it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.83it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.83it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.83it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.83it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.83it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.80it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.80it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.78it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.83it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.78it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.83it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.83it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.83it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.83it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.82it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.82it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.78it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.78it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.78it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.78it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.77it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.80it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.81it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.77it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]Epoch 16:   0%|          | 1/1208 [00:33<11:05:32, 33.08s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0498, train/loss_vlb_step=0.000178, train/loss_step=0.0498, global_step=4831.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.141]Epoch 16:   0%|          | 1/1208 [00:33<11:05:34, 33.09s/it, loss=0.139, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000681, train/loss_step=0.193, global_step=4832.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:   0%|          | 2/1208 [00:34<5:42:58, 17.06s/it, loss=0.139, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000681, train/loss_step=0.193, global_step=4832.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:   0%|          | 2/1208 [00:34<5:42:59, 17.06s/it, loss=0.122, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000666, train/loss_step=0.187, global_step=4832.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   0%|          | 3/1208 [00:35<3:55:23, 11.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000666, train/loss_step=0.187, global_step=4832.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   0%|          | 3/1208 [00:35<3:55:24, 11.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=4832.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   0%|          | 4/1208 [00:38<3:12:05,  9.57s/it, loss=0.117, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=4832.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   0%|          | 4/1208 [00:38<3:12:06,  9.57s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.24e-5, train/loss_step=0.0118, global_step=4832.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   0%|          | 5/1208 [00:39<2:37:51,  7.87s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.24e-5, train/loss_step=0.0118, global_step=4832.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   0%|          | 5/1208 [00:39<2:37:51,  7.87s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.0595, train/loss_vlb_step=0.000204, train/loss_step=0.0595, global_step=4833.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   0%|          | 6/1208 [00:40<2:14:54,  6.73s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.0595, train/loss_vlb_step=0.000204, train/loss_step=0.0595, global_step=4833.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   0%|          | 6/1208 [00:40<2:14:54,  6.73s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.93e-5, train/loss_step=0.0103, global_step=4833.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:   1%|          | 7/1208 [00:41<1:58:31,  5.92s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.93e-5, train/loss_step=0.0103, global_step=4833.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   1%|          | 7/1208 [00:41<1:58:31,  5.92s/it, loss=0.0853, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000477, train/loss_step=0.144, global_step=4833.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:   1%|          | 8/1208 [00:44<1:51:37,  5.58s/it, loss=0.0853, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000477, train/loss_step=0.144, global_step=4833.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   1%|          | 8/1208 [00:44<1:51:38,  5.58s/it, loss=0.101, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00181, train/loss_step=0.353, global_step=4833.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:   1%|          | 9/1208 [00:45<1:41:30,  5.08s/it, loss=0.101, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00181, train/loss_step=0.353, global_step=4833.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   1%|          | 9/1208 [00:45<1:41:30,  5.08s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.00548, train/loss_vlb_step=2.76e-5, train/loss_step=0.00548, global_step=4834.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   1%|          | 10/1208 [00:46<1:33:21,  4.68s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.00548, train/loss_vlb_step=2.76e-5, train/loss_step=0.00548, global_step=4834.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   1%|          | 10/1208 [00:46<1:33:21,  4.68s/it, loss=0.105, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000409, train/loss_step=0.124, global_step=4834.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:   1%|          | 11/1208 [00:47<1:26:40,  4.35s/it, loss=0.105, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000409, train/loss_step=0.124, global_step=4834.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   1%|          | 11/1208 [00:47<1:26:41,  4.35s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.75e-5, train/loss_step=0.0235, global_step=4834.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   1%|          | 12/1208 [00:51<1:24:44,  4.25s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.75e-5, train/loss_step=0.0235, global_step=4834.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   1%|          | 12/1208 [00:51<1:24:44,  4.25s/it, loss=0.11, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00311, train/loss_step=0.362, global_step=4834.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:   1%|          | 13/1208 [00:52<1:19:47,  4.01s/it, loss=0.11, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00311, train/loss_step=0.362, global_step=4834.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   1%|          | 13/1208 [00:52<1:19:47,  4.01s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0879, train/loss_vlb_step=0.000293, train/loss_step=0.0879, global_step=4835.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   1%|          | 14/1208 [00:53<1:15:30,  3.79s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0879, train/loss_vlb_step=0.000293, train/loss_step=0.0879, global_step=4835.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   1%|          | 14/1208 [00:53<1:15:30,  3.79s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.5e-5, train/loss_step=0.0196, global_step=4835.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:   1%|          | 15/1208 [00:54<1:11:46,  3.61s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.5e-5, train/loss_step=0.0196, global_step=4835.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   1%|          | 15/1208 [00:54<1:11:47,  3.61s/it, loss=0.0939, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=1.41e-5, train/loss_step=0.00242, global_step=4835.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   1%|▏         | 16/1208 [00:57<1:11:15,  3.59s/it, loss=0.0939, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=1.41e-5, train/loss_step=0.00242, global_step=4835.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   1%|▏         | 16/1208 [00:57<1:11:15,  3.59s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.07e-5, train/loss_step=0.0171, global_step=4835.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:   1%|▏         | 17/1208 [00:58<1:08:14,  3.44s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.07e-5, train/loss_step=0.0171, global_step=4835.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   1%|▏         | 17/1208 [00:58<1:08:14,  3.44s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=5.98e-5, train/loss_step=0.0137, global_step=4836.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   1%|▏         | 18/1208 [00:59<1:05:32,  3.30s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=5.98e-5, train/loss_step=0.0137, global_step=4836.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   1%|▏         | 18/1208 [00:59<1:05:32,  3.30s/it, loss=0.0929, v_num=0, train/loss_simple_step=0.0821, train/loss_vlb_step=0.000271, train/loss_step=0.0821, global_step=4836.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   2%|▏         | 19/1208 [01:00<1:03:06,  3.18s/it, loss=0.0929, v_num=0, train/loss_simple_step=0.0821, train/loss_vlb_step=0.000271, train/loss_step=0.0821, global_step=4836.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   2%|▏         | 19/1208 [01:00<1:03:06,  3.18s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.060, train/loss_vlb_step=0.000209, train/loss_step=0.060, global_step=4836.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:   2%|▏         | 20/1208 [01:03<1:03:09,  3.19s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.060, train/loss_vlb_step=0.000209, train/loss_step=0.060, global_step=4836.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   2%|▏         | 20/1208 [01:03<1:03:09,  3.19s/it, loss=0.125, v_num=0, train/loss_simple_step=0.639, train/loss_vlb_step=0.0156, train/loss_step=0.639, global_step=4836.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:   2%|▏         | 21/1208 [01:04<1:01:06,  3.09s/it, loss=0.125, v_num=0, train/loss_simple_step=0.639, train/loss_vlb_step=0.0156, train/loss_step=0.639, global_step=4836.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   2%|▏         | 21/1208 [01:04<1:01:06,  3.09s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00738, train/loss_vlb_step=3.57e-5, train/loss_step=0.00738, global_step=4837.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   2%|▏         | 22/1208 [01:05<59:12,  3.00s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00738, train/loss_vlb_step=3.57e-5, train/loss_step=0.00738, global_step=4837.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:   2%|▏         | 22/1208 [01:05<59:12,  3.00s/it, loss=0.119, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.0011, train/loss_step=0.254, global_step=4837.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]     Epoch 16:   2%|▏         | 23/1208 [01:06<57:28,  2.91s/it, loss=0.119, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.0011, train/loss_step=0.254, global_step=4837.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   2%|▏         | 23/1208 [01:06<57:28,  2.91s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0821, train/loss_vlb_step=0.000276, train/loss_step=0.0821, global_step=4837.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   2%|▏         | 24/1208 [01:10<57:40,  2.92s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0821, train/loss_vlb_step=0.000276, train/loss_step=0.0821, global_step=4837.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   2%|▏         | 24/1208 [01:10<57:40,  2.92s/it, loss=0.124, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000458, train/loss_step=0.138, global_step=4837.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:   2%|▏         | 25/1208 [01:11<56:10,  2.85s/it, loss=0.124, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000458, train/loss_step=0.138, global_step=4837.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   2%|▏         | 25/1208 [01:11<56:10,  2.85s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0784, train/loss_vlb_step=0.000264, train/loss_step=0.0784, global_step=4838.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   2%|▏         | 26/1208 [01:12<54:45,  2.78s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0784, train/loss_vlb_step=0.000264, train/loss_step=0.0784, global_step=4838.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   2%|▏         | 26/1208 [01:12<54:45,  2.78s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0624, train/loss_vlb_step=0.00022, train/loss_step=0.0624, global_step=4838.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:   2%|▏         | 27/1208 [01:13<53:26,  2.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0624, train/loss_vlb_step=0.00022, train/loss_step=0.0624, global_step=4838.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   2%|▏         | 27/1208 [01:13<53:26,  2.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.093, train/loss_vlb_step=0.000306, train/loss_step=0.093, global_step=4838.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:   2%|▏         | 28/1208 [01:16<53:45,  2.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.093, train/loss_vlb_step=0.000306, train/loss_step=0.093, global_step=4838.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   2%|▏         | 28/1208 [01:16<53:45,  2.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000865, train/loss_step=0.216, global_step=4838.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   2%|▏         | 29/1208 [01:17<52:34,  2.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000865, train/loss_step=0.216, global_step=4838.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   2%|▏         | 29/1208 [01:17<52:34,  2.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.000171, train/loss_step=0.048, global_step=4839.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   2%|▏         | 30/1208 [01:18<51:28,  2.62s/it, loss=0.121, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.000171, train/loss_step=0.048, global_step=4839.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   2%|▏         | 30/1208 [01:18<51:28,  2.62s/it, loss=0.128, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00107, train/loss_step=0.267, global_step=4839.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:   3%|▎         | 31/1208 [01:19<50:25,  2.57s/it, loss=0.128, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00107, train/loss_step=0.267, global_step=4839.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   3%|▎         | 31/1208 [01:19<50:25,  2.57s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=9.43e-5, train/loss_step=0.0223, global_step=4839.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   3%|▎         | 32/1208 [01:22<50:46,  2.59s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=9.43e-5, train/loss_step=0.0223, global_step=4839.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   3%|▎         | 32/1208 [01:22<50:46,  2.59s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=2.46e-5, train/loss_step=0.00462, global_step=4839.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   3%|▎         | 33/1208 [01:23<49:49,  2.54s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=2.46e-5, train/loss_step=0.00462, global_step=4839.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   3%|▎         | 33/1208 [01:23<49:49,  2.54s/it, loss=0.112, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000469, train/loss_step=0.138, global_step=4840.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:   3%|▎         | 34/1208 [01:25<48:55,  2.50s/it, loss=0.112, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000469, train/loss_step=0.138, global_step=4840.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   3%|▎         | 34/1208 [01:25<48:55,  2.50s/it, loss=0.121, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000725, train/loss_step=0.196, global_step=4840.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   3%|▎         | 35/1208 [01:26<48:04,  2.46s/it, loss=0.121, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000725, train/loss_step=0.196, global_step=4840.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   3%|▎         | 35/1208 [01:26<48:04,  2.46s/it, loss=0.127, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000403, train/loss_step=0.122, global_step=4840.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   3%|▎         | 36/1208 [01:29<48:28,  2.48s/it, loss=0.127, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000403, train/loss_step=0.122, global_step=4840.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   3%|▎         | 36/1208 [01:29<48:29,  2.48s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.31e-5, train/loss_step=0.0171, global_step=4840.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   3%|▎         | 37/1208 [01:30<47:41,  2.44s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.31e-5, train/loss_step=0.0171, global_step=4840.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   3%|▎         | 37/1208 [01:30<47:42,  2.44s/it, loss=0.134, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000546, train/loss_step=0.158, global_step=4841.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:   3%|▎         | 38/1208 [01:31<46:56,  2.41s/it, loss=0.134, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000546, train/loss_step=0.158, global_step=4841.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   3%|▎         | 38/1208 [01:31<46:56,  2.41s/it, loss=0.147, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00212, train/loss_step=0.334, global_step=4841.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:   3%|▎         | 39/1208 [01:32<46:13,  2.37s/it, loss=0.147, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00212, train/loss_step=0.334, global_step=4841.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   3%|▎         | 39/1208 [01:32<46:13,  2.37s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=8.77e-5, train/loss_step=0.0217, global_step=4841.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   3%|▎         | 40/1208 [01:35<46:35,  2.39s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=8.77e-5, train/loss_step=0.0217, global_step=4841.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   3%|▎         | 40/1208 [01:35<46:35,  2.39s/it, loss=0.122, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000601, train/loss_step=0.174, global_step=4841.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:   3%|▎         | 41/1208 [01:36<45:55,  2.36s/it, loss=0.122, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000601, train/loss_step=0.174, global_step=4841.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   3%|▎         | 41/1208 [01:36<45:55,  2.36s/it, loss=0.132, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000838, train/loss_step=0.213, global_step=4842.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   3%|▎         | 42/1208 [01:37<45:15,  2.33s/it, loss=0.132, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000838, train/loss_step=0.213, global_step=4842.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   3%|▎         | 42/1208 [01:37<45:15,  2.33s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.41e-5, train/loss_step=0.0177, global_step=4842.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   4%|▎         | 43/1208 [01:38<44:38,  2.30s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.41e-5, train/loss_step=0.0177, global_step=4842.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   4%|▎         | 43/1208 [01:38<44:38,  2.30s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0513, train/loss_vlb_step=0.000181, train/loss_step=0.0513, global_step=4842.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   4%|▎         | 44/1208 [01:42<44:59,  2.32s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0513, train/loss_vlb_step=0.000181, train/loss_step=0.0513, global_step=4842.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   4%|▎         | 44/1208 [01:42<44:59,  2.32s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0553, train/loss_vlb_step=0.000197, train/loss_step=0.0553, global_step=4842.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   4%|▎         | 45/1208 [01:43<44:25,  2.29s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0553, train/loss_vlb_step=0.000197, train/loss_step=0.0553, global_step=4842.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   4%|▎         | 45/1208 [01:43<44:25,  2.29s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0561, train/loss_vlb_step=0.000193, train/loss_step=0.0561, global_step=4843.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   4%|▍         | 46/1208 [01:44<43:51,  2.26s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0561, train/loss_vlb_step=0.000193, train/loss_step=0.0561, global_step=4843.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   4%|▍         | 46/1208 [01:44<43:51,  2.26s/it, loss=0.135, v_num=0, train/loss_simple_step=0.492, train/loss_vlb_step=0.00639, train/loss_step=0.492, global_step=4843.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:   4%|▍         | 47/1208 [01:45<43:18,  2.24s/it, loss=0.135, v_num=0, train/loss_simple_step=0.492, train/loss_vlb_step=0.00639, train/loss_step=0.492, global_step=4843.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   4%|▍         | 47/1208 [01:45<43:18,  2.24s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00903, train/loss_vlb_step=4.44e-5, train/loss_step=0.00903, global_step=4843.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   4%|▍         | 48/1208 [01:48<43:41,  2.26s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00903, train/loss_vlb_step=4.44e-5, train/loss_step=0.00903, global_step=4843.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   4%|▍         | 48/1208 [01:48<43:41,  2.26s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0822, train/loss_vlb_step=0.000275, train/loss_step=0.0822, global_step=4843.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:   4%|▍         | 49/1208 [01:49<43:11,  2.24s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0822, train/loss_vlb_step=0.000275, train/loss_step=0.0822, global_step=4843.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   4%|▍         | 49/1208 [01:49<43:11,  2.24s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00538, train/loss_vlb_step=2.73e-5, train/loss_step=0.00538, global_step=4844.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   4%|▍         | 50/1208 [01:50<42:41,  2.21s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00538, train/loss_vlb_step=2.73e-5, train/loss_step=0.00538, global_step=4844.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   4%|▍         | 50/1208 [01:50<42:41,  2.21s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.64e-5, train/loss_step=0.0125, global_step=4844.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:   4%|▍         | 51/1208 [01:51<42:12,  2.19s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.64e-5, train/loss_step=0.0125, global_step=4844.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   4%|▍         | 51/1208 [01:51<42:12,  2.19s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00689, train/loss_vlb_step=3.41e-5, train/loss_step=0.00689, global_step=4844.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   4%|▍         | 52/1208 [01:54<42:33,  2.21s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00689, train/loss_vlb_step=3.41e-5, train/loss_step=0.00689, global_step=4844.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   4%|▍         | 52/1208 [01:54<42:33,  2.21s/it, loss=0.122, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00142, train/loss_step=0.286, global_step=4844.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:   4%|▍         | 53/1208 [01:55<42:06,  2.19s/it, loss=0.122, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00142, train/loss_step=0.286, global_step=4844.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   4%|▍         | 53/1208 [01:55<42:06,  2.19s/it, loss=0.129, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00118, train/loss_step=0.274, global_step=4845.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   4%|▍         | 54/1208 [01:56<41:39,  2.17s/it, loss=0.129, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00118, train/loss_step=0.274, global_step=4845.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   4%|▍         | 54/1208 [01:56<41:39,  2.17s/it, loss=0.159, v_num=0, train/loss_simple_step=0.791, train/loss_vlb_step=0.134, train/loss_step=0.791, global_step=4845.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:   5%|▍         | 55/1208 [01:58<41:13,  2.15s/it, loss=0.159, v_num=0, train/loss_simple_step=0.791, train/loss_vlb_step=0.134, train/loss_step=0.791, global_step=4845.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   5%|▍         | 55/1208 [01:58<41:13,  2.15s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0435, train/loss_vlb_step=0.000157, train/loss_step=0.0435, global_step=4845.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   5%|▍         | 56/1208 [02:01<41:34,  2.17s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0435, train/loss_vlb_step=0.000157, train/loss_step=0.0435, global_step=4845.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   5%|▍         | 56/1208 [02:01<41:34,  2.17s/it, loss=0.17, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00157, train/loss_step=0.325, global_step=4845.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:   5%|▍         | 57/1208 [02:02<41:10,  2.15s/it, loss=0.17, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00157, train/loss_step=0.325, global_step=4845.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   5%|▍         | 57/1208 [02:02<41:10,  2.15s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000147, train/loss_step=0.0409, global_step=4846.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   5%|▍         | 58/1208 [02:03<40:46,  2.13s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000147, train/loss_step=0.0409, global_step=4846.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   5%|▍         | 58/1208 [02:03<40:46,  2.13s/it, loss=0.153, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=4846.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:   5%|▍         | 59/1208 [02:04<40:23,  2.11s/it, loss=0.153, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=4846.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   5%|▍         | 59/1208 [02:04<40:23,  2.11s/it, loss=0.157, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=4846.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   5%|▍         | 60/1208 [02:07<40:41,  2.13s/it, loss=0.157, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=4846.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   5%|▍         | 60/1208 [02:07<40:41,  2.13s/it, loss=0.173, v_num=0, train/loss_simple_step=0.487, train/loss_vlb_step=0.0092, train/loss_step=0.487, global_step=4846.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:   5%|▌         | 61/1208 [02:08<40:19,  2.11s/it, loss=0.173, v_num=0, train/loss_simple_step=0.487, train/loss_vlb_step=0.0092, train/loss_step=0.487, global_step=4846.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   5%|▌         | 61/1208 [02:08<40:20,  2.11s/it, loss=0.178, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00181, train/loss_step=0.311, global_step=4847.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   5%|▌         | 62/1208 [02:09<39:58,  2.09s/it, loss=0.178, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00181, train/loss_step=0.311, global_step=4847.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   5%|▌         | 62/1208 [02:09<39:58,  2.09s/it, loss=0.184, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000468, train/loss_step=0.142, global_step=4847.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   5%|▌         | 63/1208 [02:10<39:37,  2.08s/it, loss=0.184, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000468, train/loss_step=0.142, global_step=4847.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   5%|▌         | 63/1208 [02:10<39:37,  2.08s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000116, train/loss_step=0.0307, global_step=4847.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   5%|▌         | 64/1208 [02:13<39:48,  2.09s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000116, train/loss_step=0.0307, global_step=4847.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   5%|▌         | 64/1208 [02:13<39:48,  2.09s/it, loss=0.193, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000917, train/loss_step=0.245, global_step=4847.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:   5%|▌         | 65/1208 [02:14<39:27,  2.07s/it, loss=0.193, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000917, train/loss_step=0.245, global_step=4847.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   5%|▌         | 65/1208 [02:14<39:27,  2.07s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0952, train/loss_vlb_step=0.000314, train/loss_step=0.0952, global_step=4848.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   5%|▌         | 66/1208 [02:15<39:07,  2.06s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0952, train/loss_vlb_step=0.000314, train/loss_step=0.0952, global_step=4848.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   5%|▌         | 66/1208 [02:15<39:07,  2.06s/it, loss=0.195, v_num=0, train/loss_simple_step=0.505, train/loss_vlb_step=0.00483, train/loss_step=0.505, global_step=4848.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:   6%|▌         | 67/1208 [02:16<38:47,  2.04s/it, loss=0.195, v_num=0, train/loss_simple_step=0.505, train/loss_vlb_step=0.00483, train/loss_step=0.505, global_step=4848.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   6%|▌         | 67/1208 [02:16<38:47,  2.04s/it, loss=0.201, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=4848.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   6%|▌         | 68/1208 [02:19<38:59,  2.05s/it, loss=0.201, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=4848.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   6%|▌         | 68/1208 [02:19<38:59,  2.05s/it, loss=0.202, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.00034, train/loss_step=0.103, global_step=4848.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:   6%|▌         | 69/1208 [02:20<38:40,  2.04s/it, loss=0.202, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.00034, train/loss_step=0.103, global_step=4848.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   6%|▌         | 69/1208 [02:20<38:40,  2.04s/it, loss=0.216, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.002, train/loss_step=0.292, global_step=4849.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:   6%|▌         | 70/1208 [02:21<38:21,  2.02s/it, loss=0.216, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.002, train/loss_step=0.292, global_step=4849.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   6%|▌         | 70/1208 [02:21<38:21,  2.02s/it, loss=0.215, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.34e-5, train/loss_step=0.00235, global_step=4849.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   6%|▌         | 71/1208 [02:22<38:03,  2.01s/it, loss=0.215, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.34e-5, train/loss_step=0.00235, global_step=4849.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   6%|▌         | 71/1208 [02:22<38:03,  2.01s/it, loss=0.224, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000657, train/loss_step=0.185, global_step=4849.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:   6%|▌         | 72/1208 [02:25<38:14,  2.02s/it, loss=0.224, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000657, train/loss_step=0.185, global_step=4849.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   6%|▌         | 72/1208 [02:25<38:14,  2.02s/it, loss=0.226, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00159, train/loss_step=0.325, global_step=4849.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:   6%|▌         | 73/1208 [02:26<37:57,  2.01s/it, loss=0.226, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00159, train/loss_step=0.325, global_step=4849.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   6%|▌         | 73/1208 [02:26<37:57,  2.01s/it, loss=0.213, v_num=0, train/loss_simple_step=0.00143, train/loss_vlb_step=8.71e-6, train/loss_step=0.00143, global_step=4850.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   6%|▌         | 74/1208 [02:27<37:39,  1.99s/it, loss=0.213, v_num=0, train/loss_simple_step=0.00143, train/loss_vlb_step=8.71e-6, train/loss_step=0.00143, global_step=4850.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   6%|▌         | 74/1208 [02:27<37:39,  1.99s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.000297, train/loss_step=0.0894, global_step=4850.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:   6%|▌         | 75/1208 [02:28<37:23,  1.98s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.000297, train/loss_step=0.0894, global_step=4850.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   6%|▌         | 75/1208 [02:28<37:23,  1.98s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000134, train/loss_step=0.0361, global_step=4850.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   6%|▋         | 76/1208 [02:31<37:34,  1.99s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000134, train/loss_step=0.0361, global_step=4850.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   6%|▋         | 76/1208 [02:31<37:34,  1.99s/it, loss=0.179, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00199, train/loss_step=0.353, global_step=4850.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:   6%|▋         | 77/1208 [02:32<37:18,  1.98s/it, loss=0.179, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00199, train/loss_step=0.353, global_step=4850.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   6%|▋         | 77/1208 [02:32<37:18,  1.98s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000126, train/loss_step=0.0328, global_step=4851.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   6%|▋         | 78/1208 [02:33<37:02,  1.97s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000126, train/loss_step=0.0328, global_step=4851.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   6%|▋         | 78/1208 [02:33<37:02,  1.97s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=1.4e-5, train/loss_step=0.00239, global_step=4851.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   7%|▋         | 79/1208 [02:34<36:46,  1.95s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=1.4e-5, train/loss_step=0.00239, global_step=4851.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   7%|▋         | 79/1208 [02:34<36:46,  1.95s/it, loss=0.169, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000103, train/loss_step=0.026, global_step=4851.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:   7%|▋         | 80/1208 [02:37<36:57,  1.97s/it, loss=0.169, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000103, train/loss_step=0.026, global_step=4851.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   7%|▋         | 80/1208 [02:37<36:57,  1.97s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00898, train/loss_vlb_step=4.3e-5, train/loss_step=0.00898, global_step=4851.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   7%|▋         | 81/1208 [02:38<36:42,  1.95s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00898, train/loss_vlb_step=4.3e-5, train/loss_step=0.00898, global_step=4851.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   7%|▋         | 81/1208 [02:38<36:42,  1.95s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0048, train/loss_vlb_step=2.52e-5, train/loss_step=0.0048, global_step=4852.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:   7%|▋         | 82/1208 [02:39<36:27,  1.94s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0048, train/loss_vlb_step=2.52e-5, train/loss_step=0.0048, global_step=4852.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   7%|▋         | 82/1208 [02:39<36:27,  1.94s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.000151, train/loss_step=0.0403, global_step=4852.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   7%|▋         | 83/1208 [02:40<36:12,  1.93s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.000151, train/loss_step=0.0403, global_step=4852.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   7%|▋         | 83/1208 [02:40<36:12,  1.93s/it, loss=0.142, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00333, train/loss_step=0.376, global_step=4852.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:   7%|▋         | 84/1208 [02:43<36:23,  1.94s/it, loss=0.142, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00333, train/loss_step=0.376, global_step=4852.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   7%|▋         | 84/1208 [02:43<36:23,  1.94s/it, loss=0.142, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00102, train/loss_step=0.247, global_step=4852.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   7%|▋         | 85/1208 [02:44<36:09,  1.93s/it, loss=0.142, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00102, train/loss_step=0.247, global_step=4852.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   7%|▋         | 85/1208 [02:44<36:09,  1.93s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.68e-5, train/loss_step=0.00292, global_step=4853.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   7%|▋         | 86/1208 [02:45<35:55,  1.92s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.68e-5, train/loss_step=0.00292, global_step=4853.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   7%|▋         | 86/1208 [02:45<35:55,  1.92s/it, loss=0.126, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.0013, train/loss_step=0.278, global_step=4853.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]     Epoch 16:   7%|▋         | 87/1208 [02:46<35:42,  1.91s/it, loss=0.126, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.0013, train/loss_step=0.278, global_step=4853.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   7%|▋         | 87/1208 [02:46<35:42,  1.91s/it, loss=0.136, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00146, train/loss_step=0.322, global_step=4853.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   7%|▋         | 88/1208 [02:49<35:52,  1.92s/it, loss=0.136, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00146, train/loss_step=0.322, global_step=4853.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   7%|▋         | 88/1208 [02:49<35:52,  1.92s/it, loss=0.139, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000582, train/loss_step=0.164, global_step=4853.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   7%|▋         | 89/1208 [02:50<35:38,  1.91s/it, loss=0.139, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000582, train/loss_step=0.164, global_step=4853.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   7%|▋         | 89/1208 [02:50<35:38,  1.91s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.48e-5, train/loss_step=0.00265, global_step=4854.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   7%|▋         | 90/1208 [02:51<35:25,  1.90s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.48e-5, train/loss_step=0.00265, global_step=4854.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   7%|▋         | 90/1208 [02:51<35:25,  1.90s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000127, train/loss_step=0.0332, global_step=4854.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:   8%|▊         | 91/1208 [02:52<35:13,  1.89s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000127, train/loss_step=0.0332, global_step=4854.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   8%|▊         | 91/1208 [02:52<35:13,  1.89s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.75e-5, train/loss_step=0.00335, global_step=4854.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   8%|▊         | 92/1208 [02:55<35:22,  1.90s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.75e-5, train/loss_step=0.00335, global_step=4854.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   8%|▊         | 92/1208 [02:55<35:22,  1.90s/it, loss=0.102, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.8e-5, train/loss_step=0.016, global_step=4854.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]     Epoch 16:   8%|▊         | 93/1208 [02:56<35:10,  1.89s/it, loss=0.102, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.8e-5, train/loss_step=0.016, global_step=4854.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   8%|▊         | 93/1208 [02:56<35:10,  1.89s/it, loss=0.144, v_num=0, train/loss_simple_step=0.838, train/loss_vlb_step=0.142, train/loss_step=0.838, global_step=4855.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:   8%|▊         | 94/1208 [02:57<34:57,  1.88s/it, loss=0.144, v_num=0, train/loss_simple_step=0.838, train/loss_vlb_step=0.142, train/loss_step=0.838, global_step=4855.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   8%|▊         | 94/1208 [02:57<34:57,  1.88s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.000111, train/loss_step=0.0292, global_step=4855.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   8%|▊         | 95/1208 [02:58<34:45,  1.87s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.000111, train/loss_step=0.0292, global_step=4855.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   8%|▊         | 95/1208 [02:58<34:45,  1.87s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0087, train/loss_vlb_step=4.26e-5, train/loss_step=0.0087, global_step=4855.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:   8%|▊         | 96/1208 [03:00<34:55,  1.88s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0087, train/loss_vlb_step=4.26e-5, train/loss_step=0.0087, global_step=4855.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   8%|▊         | 96/1208 [03:00<34:55,  1.88s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0501, train/loss_vlb_step=0.000181, train/loss_step=0.0501, global_step=4855.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   8%|▊         | 97/1208 [03:01<34:43,  1.88s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0501, train/loss_vlb_step=0.000181, train/loss_step=0.0501, global_step=4855.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   8%|▊         | 97/1208 [03:01<34:43,  1.88s/it, loss=0.124, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=8.21e-5, train/loss_step=0.019, global_step=4856.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:   8%|▊         | 98/1208 [03:02<34:32,  1.87s/it, loss=0.124, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=8.21e-5, train/loss_step=0.019, global_step=4856.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   8%|▊         | 98/1208 [03:02<34:32,  1.87s/it, loss=0.129, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=4856.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   8%|▊         | 99/1208 [03:03<34:20,  1.86s/it, loss=0.129, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=4856.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   8%|▊         | 99/1208 [03:03<34:20,  1.86s/it, loss=0.162, v_num=0, train/loss_simple_step=0.697, train/loss_vlb_step=0.028, train/loss_step=0.697, global_step=4856.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:   8%|▊         | 100/1208 [03:06<34:30,  1.87s/it, loss=0.162, v_num=0, train/loss_simple_step=0.697, train/loss_vlb_step=0.028, train/loss_step=0.697, global_step=4856.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   8%|▊         | 100/1208 [03:06<34:30,  1.87s/it, loss=0.168, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000405, train/loss_step=0.123, global_step=4856.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   8%|▊         | 101/1208 [03:07<34:18,  1.86s/it, loss=0.168, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000405, train/loss_step=0.123, global_step=4856.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   8%|▊         | 101/1208 [03:07<34:18,  1.86s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=1.59e-5, train/loss_step=0.00295, global_step=4857.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   8%|▊         | 102/1208 [03:08<34:07,  1.85s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=1.59e-5, train/loss_step=0.00295, global_step=4857.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   8%|▊         | 102/1208 [03:08<34:07,  1.85s/it, loss=0.173, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000449, train/loss_step=0.135, global_step=4857.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:   9%|▊         | 103/1208 [03:09<33:57,  1.84s/it, loss=0.173, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000449, train/loss_step=0.135, global_step=4857.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   9%|▊         | 103/1208 [03:09<33:57,  1.84s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.53e-5, train/loss_step=0.00267, global_step=4857.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   9%|▊         | 104/1208 [03:12<34:06,  1.85s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.53e-5, train/loss_step=0.00267, global_step=4857.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   9%|▊         | 104/1208 [03:12<34:06,  1.85s/it, loss=0.183, v_num=0, train/loss_simple_step=0.827, train/loss_vlb_step=0.0531, train/loss_step=0.827, global_step=4857.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]     Epoch 16:   9%|▊         | 105/1208 [03:13<33:55,  1.85s/it, loss=0.183, v_num=0, train/loss_simple_step=0.827, train/loss_vlb_step=0.0531, train/loss_step=0.827, global_step=4857.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   9%|▊         | 105/1208 [03:13<33:55,  1.85s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.14e-5, train/loss_step=0.0138, global_step=4858.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   9%|▉         | 106/1208 [03:14<33:45,  1.84s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.14e-5, train/loss_step=0.0138, global_step=4858.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   9%|▉         | 106/1208 [03:14<33:45,  1.84s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000113, train/loss_step=0.0293, global_step=4858.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   9%|▉         | 107/1208 [03:15<33:34,  1.83s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000113, train/loss_step=0.0293, global_step=4858.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   9%|▉         | 107/1208 [03:15<33:34,  1.83s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00498, train/loss_vlb_step=2.57e-5, train/loss_step=0.00498, global_step=4858.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   9%|▉         | 108/1208 [03:18<33:43,  1.84s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00498, train/loss_vlb_step=2.57e-5, train/loss_step=0.00498, global_step=4858.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   9%|▉         | 108/1208 [03:18<33:43,  1.84s/it, loss=0.162, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00125, train/loss_step=0.292, global_step=4858.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:   9%|▉         | 109/1208 [03:19<33:33,  1.83s/it, loss=0.162, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00125, train/loss_step=0.292, global_step=4858.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   9%|▉         | 109/1208 [03:19<33:33,  1.83s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0967, train/loss_vlb_step=0.000319, train/loss_step=0.0967, global_step=4859.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   9%|▉         | 110/1208 [03:20<33:23,  1.82s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0967, train/loss_vlb_step=0.000319, train/loss_step=0.0967, global_step=4859.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   9%|▉         | 110/1208 [03:20<33:23,  1.82s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0787, train/loss_vlb_step=0.000259, train/loss_step=0.0787, global_step=4859.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   9%|▉         | 111/1208 [03:21<33:13,  1.82s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0787, train/loss_vlb_step=0.000259, train/loss_step=0.0787, global_step=4859.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   9%|▉         | 111/1208 [03:21<33:13,  1.82s/it, loss=0.177, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000597, train/loss_step=0.174, global_step=4859.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:   9%|▉         | 112/1208 [03:24<33:22,  1.83s/it, loss=0.177, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000597, train/loss_step=0.174, global_step=4859.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   9%|▉         | 112/1208 [03:24<33:22,  1.83s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.32e-5, train/loss_step=0.00225, global_step=4859.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   9%|▉         | 113/1208 [03:25<33:12,  1.82s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.32e-5, train/loss_step=0.00225, global_step=4859.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   9%|▉         | 113/1208 [03:25<33:12,  1.82s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0289, train/loss_vlb_step=0.000112, train/loss_step=0.0289, global_step=4860.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:   9%|▉         | 114/1208 [03:26<33:03,  1.81s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0289, train/loss_vlb_step=0.000112, train/loss_step=0.0289, global_step=4860.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:   9%|▉         | 114/1208 [03:26<33:03,  1.81s/it, loss=0.141, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000451, train/loss_step=0.135, global_step=4860.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  10%|▉         | 115/1208 [03:27<32:53,  1.81s/it, loss=0.141, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000451, train/loss_step=0.135, global_step=4860.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  10%|▉         | 115/1208 [03:27<32:53,  1.81s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.89e-5, train/loss_step=0.0186, global_step=4860.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  10%|▉         | 116/1208 [03:30<33:01,  1.81s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.89e-5, train/loss_step=0.0186, global_step=4860.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  10%|▉         | 116/1208 [03:30<33:01,  1.81s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0774, train/loss_vlb_step=0.000256, train/loss_step=0.0774, global_step=4860.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  10%|▉         | 117/1208 [03:31<32:52,  1.81s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0774, train/loss_vlb_step=0.000256, train/loss_step=0.0774, global_step=4860.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  10%|▉         | 117/1208 [03:31<32:52,  1.81s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0876, train/loss_vlb_step=0.000288, train/loss_step=0.0876, global_step=4861.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  10%|▉         | 118/1208 [03:32<32:43,  1.80s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0876, train/loss_vlb_step=0.000288, train/loss_step=0.0876, global_step=4861.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  10%|▉         | 118/1208 [03:32<32:43,  1.80s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.2e-5, train/loss_step=0.0232, global_step=4861.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  10%|▉         | 119/1208 [03:33<32:34,  1.79s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.2e-5, train/loss_step=0.0232, global_step=4861.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  10%|▉         | 119/1208 [03:33<32:34,  1.79s/it, loss=0.124, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00191, train/loss_step=0.335, global_step=4861.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  10%|▉         | 120/1208 [03:36<32:42,  1.80s/it, loss=0.124, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00191, train/loss_step=0.335, global_step=4861.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  10%|▉         | 120/1208 [03:36<32:42,  1.80s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00607, train/loss_vlb_step=3.23e-5, train/loss_step=0.00607, global_step=4861.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  10%|█         | 121/1208 [03:37<32:33,  1.80s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00607, train/loss_vlb_step=3.23e-5, train/loss_step=0.00607, global_step=4861.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  10%|█         | 121/1208 [03:37<32:33,  1.80s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00355, train/loss_vlb_step=1.96e-5, train/loss_step=0.00355, global_step=4862.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  10%|█         | 122/1208 [03:38<32:24,  1.79s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00355, train/loss_vlb_step=1.96e-5, train/loss_step=0.00355, global_step=4862.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  10%|█         | 122/1208 [03:38<32:24,  1.79s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00332, train/loss_vlb_step=1.81e-5, train/loss_step=0.00332, global_step=4862.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  10%|█         | 123/1208 [03:39<32:16,  1.78s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00332, train/loss_vlb_step=1.81e-5, train/loss_step=0.00332, global_step=4862.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  10%|█         | 123/1208 [03:39<32:16,  1.78s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0991, train/loss_vlb_step=0.000327, train/loss_step=0.0991, global_step=4862.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  10%|█         | 124/1208 [03:42<32:23,  1.79s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0991, train/loss_vlb_step=0.000327, train/loss_step=0.0991, global_step=4862.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  10%|█         | 124/1208 [03:42<32:23,  1.79s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000594, train/loss_step=0.176, global_step=4862.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  10%|█         | 125/1208 [03:43<32:15,  1.79s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000594, train/loss_step=0.176, global_step=4862.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  10%|█         | 125/1208 [03:43<32:15,  1.79s/it, loss=0.0839, v_num=0, train/loss_simple_step=0.00553, train/loss_vlb_step=2.59e-5, train/loss_step=0.00553, global_step=4863.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  10%|█         | 126/1208 [03:44<32:07,  1.78s/it, loss=0.0839, v_num=0, train/loss_simple_step=0.00553, train/loss_vlb_step=2.59e-5, train/loss_step=0.00553, global_step=4863.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  10%|█         | 126/1208 [03:44<32:07,  1.78s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.76e-5, train/loss_step=0.0215, global_step=4863.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  11%|█         | 127/1208 [03:45<31:58,  1.77s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.76e-5, train/loss_step=0.0215, global_step=4863.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  11%|█         | 127/1208 [03:45<31:58,  1.78s/it, loss=0.0834, v_num=0, train/loss_simple_step=0.00316, train/loss_vlb_step=1.84e-5, train/loss_step=0.00316, global_step=4863.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  11%|█         | 128/1208 [03:48<32:06,  1.78s/it, loss=0.0834, v_num=0, train/loss_simple_step=0.00316, train/loss_vlb_step=1.84e-5, train/loss_step=0.00316, global_step=4863.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  11%|█         | 128/1208 [03:48<32:06,  1.78s/it, loss=0.0785, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000659, train/loss_step=0.193, global_step=4863.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  11%|█         | 129/1208 [03:49<31:58,  1.78s/it, loss=0.0785, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000659, train/loss_step=0.193, global_step=4863.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  11%|█         | 129/1208 [03:49<31:58,  1.78s/it, loss=0.0792, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000367, train/loss_step=0.112, global_step=4864.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  11%|█         | 130/1208 [03:50<31:49,  1.77s/it, loss=0.0792, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000367, train/loss_step=0.112, global_step=4864.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  11%|█         | 130/1208 [03:50<31:49,  1.77s/it, loss=0.114, v_num=0, train/loss_simple_step=0.776, train/loss_vlb_step=0.0401, train/loss_step=0.776, global_step=4864.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  11%|█         | 131/1208 [03:51<31:42,  1.77s/it, loss=0.114, v_num=0, train/loss_simple_step=0.776, train/loss_vlb_step=0.0401, train/loss_step=0.776, global_step=4864.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  11%|█         | 131/1208 [03:51<31:42,  1.77s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.05e-5, train/loss_step=0.00178, global_step=4864.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  11%|█         | 132/1208 [03:54<31:49,  1.77s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.05e-5, train/loss_step=0.00178, global_step=4864.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  11%|█         | 132/1208 [03:54<31:49,  1.77s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0697, train/loss_vlb_step=0.000235, train/loss_step=0.0697, global_step=4864.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  11%|█         | 133/1208 [03:55<31:41,  1.77s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0697, train/loss_vlb_step=0.000235, train/loss_step=0.0697, global_step=4864.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  11%|█         | 133/1208 [03:55<31:41,  1.77s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0878, train/loss_vlb_step=0.000289, train/loss_step=0.0878, global_step=4865.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  11%|█         | 134/1208 [03:56<31:33,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0878, train/loss_vlb_step=0.000289, train/loss_step=0.0878, global_step=4865.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  11%|█         | 134/1208 [03:56<31:33,  1.76s/it, loss=0.11, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000358, train/loss_step=0.108, global_step=4865.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  11%|█         | 135/1208 [03:57<31:25,  1.76s/it, loss=0.11, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000358, train/loss_step=0.108, global_step=4865.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  11%|█         | 135/1208 [03:57<31:25,  1.76s/it, loss=0.13, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00296, train/loss_step=0.412, global_step=4865.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  11%|█▏        | 136/1208 [04:00<31:33,  1.77s/it, loss=0.13, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00296, train/loss_step=0.412, global_step=4865.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  11%|█▏        | 136/1208 [04:00<31:33,  1.77s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=1.1e-5, train/loss_step=0.00185, global_step=4865.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  11%|█▏        | 137/1208 [04:01<31:25,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=1.1e-5, train/loss_step=0.00185, global_step=4865.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  11%|█▏        | 137/1208 [04:01<31:25,  1.76s/it, loss=0.143, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00351, train/loss_step=0.423, global_step=4866.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  11%|█▏        | 138/1208 [04:02<31:17,  1.76s/it, loss=0.143, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00351, train/loss_step=0.423, global_step=4866.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  11%|█▏        | 138/1208 [04:02<31:17,  1.76s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.0002, train/loss_step=0.0556, global_step=4866.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  12%|█▏        | 139/1208 [04:03<31:10,  1.75s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.0002, train/loss_step=0.0556, global_step=4866.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  12%|█▏        | 139/1208 [04:03<31:10,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.54e-5, train/loss_step=0.00253, global_step=4866.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  12%|█▏        | 140/1208 [04:06<31:17,  1.76s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.54e-5, train/loss_step=0.00253, global_step=4866.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  12%|█▏        | 140/1208 [04:06<31:17,  1.76s/it, loss=0.133, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=4866.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  12%|█▏        | 141/1208 [04:07<31:09,  1.75s/it, loss=0.133, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=4866.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  12%|█▏        | 141/1208 [04:07<31:09,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0657, train/loss_vlb_step=0.000224, train/loss_step=0.0657, global_step=4867.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  12%|█▏        | 142/1208 [04:08<31:02,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0657, train/loss_vlb_step=0.000224, train/loss_step=0.0657, global_step=4867.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  12%|█▏        | 142/1208 [04:08<31:02,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.44e-5, train/loss_step=0.0123, global_step=4867.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  12%|█▏        | 143/1208 [04:09<30:55,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.44e-5, train/loss_step=0.0123, global_step=4867.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  12%|█▏        | 143/1208 [04:09<30:55,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000797, train/loss_step=0.215, global_step=4867.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  12%|█▏        | 144/1208 [04:12<31:02,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000797, train/loss_step=0.215, global_step=4867.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  12%|█▏        | 144/1208 [04:12<31:02,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.445, train/loss_vlb_step=0.00369, train/loss_step=0.445, global_step=4867.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  12%|█▏        | 145/1208 [04:13<30:54,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.445, train/loss_vlb_step=0.00369, train/loss_step=0.445, global_step=4867.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  12%|█▏        | 145/1208 [04:13<30:54,  1.75s/it, loss=0.173, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00213, train/loss_step=0.350, global_step=4868.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  12%|█▏        | 146/1208 [04:14<30:47,  1.74s/it, loss=0.173, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00213, train/loss_step=0.350, global_step=4868.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  12%|█▏        | 146/1208 [04:14<30:47,  1.74s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0614, train/loss_vlb_step=0.000214, train/loss_step=0.0614, global_step=4868.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  12%|█▏        | 147/1208 [04:15<30:40,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0614, train/loss_vlb_step=0.000214, train/loss_step=0.0614, global_step=4868.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  12%|█▏        | 147/1208 [04:15<30:40,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0875, train/loss_vlb_step=0.000288, train/loss_step=0.0875, global_step=4868.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  12%|█▏        | 148/1208 [04:17<30:47,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0875, train/loss_vlb_step=0.000288, train/loss_step=0.0875, global_step=4868.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  12%|█▏        | 148/1208 [04:17<30:47,  1.74s/it, loss=0.192, v_num=0, train/loss_simple_step=0.455, train/loss_vlb_step=0.00629, train/loss_step=0.455, global_step=4868.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  12%|█▏        | 149/1208 [04:18<30:40,  1.74s/it, loss=0.192, v_num=0, train/loss_simple_step=0.455, train/loss_vlb_step=0.00629, train/loss_step=0.455, global_step=4868.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  12%|█▏        | 149/1208 [04:18<30:40,  1.74s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0619, train/loss_vlb_step=0.000213, train/loss_step=0.0619, global_step=4869.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  12%|█▏        | 150/1208 [04:19<30:33,  1.73s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0619, train/loss_vlb_step=0.000213, train/loss_step=0.0619, global_step=4869.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  12%|█▏        | 150/1208 [04:19<30:33,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00214, train/loss_step=0.337, global_step=4869.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  12%|█▎        | 151/1208 [04:21<30:27,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00214, train/loss_step=0.337, global_step=4869.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  12%|█▎        | 151/1208 [04:21<30:27,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000148, train/loss_step=0.0396, global_step=4869.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  13%|█▎        | 152/1208 [04:23<30:33,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000148, train/loss_step=0.0396, global_step=4869.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  13%|█▎        | 152/1208 [04:23<30:33,  1.74s/it, loss=0.183, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00166, train/loss_step=0.327, global_step=4869.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  13%|█▎        | 153/1208 [04:24<30:26,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00166, train/loss_step=0.327, global_step=4869.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  13%|█▎        | 153/1208 [04:24<30:26,  1.73s/it, loss=0.185, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000422, train/loss_step=0.128, global_step=4870.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  13%|█▎        | 154/1208 [04:25<30:20,  1.73s/it, loss=0.185, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000422, train/loss_step=0.128, global_step=4870.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  13%|█▎        | 154/1208 [04:25<30:20,  1.73s/it, loss=0.206, v_num=0, train/loss_simple_step=0.536, train/loss_vlb_step=0.0125, train/loss_step=0.536, global_step=4870.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  13%|█▎        | 155/1208 [04:26<30:13,  1.72s/it, loss=0.206, v_num=0, train/loss_simple_step=0.536, train/loss_vlb_step=0.0125, train/loss_step=0.536, global_step=4870.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  13%|█▎        | 155/1208 [04:26<30:13,  1.72s/it, loss=0.195, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000735, train/loss_step=0.195, global_step=4870.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  13%|█▎        | 156/1208 [04:29<30:19,  1.73s/it, loss=0.195, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000735, train/loss_step=0.195, global_step=4870.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  13%|█▎        | 156/1208 [04:29<30:19,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.51e-5, train/loss_step=0.0154, global_step=4870.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  13%|█▎        | 157/1208 [04:30<30:13,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.51e-5, train/loss_step=0.0154, global_step=4870.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  13%|█▎        | 157/1208 [04:30<30:13,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00821, train/loss_vlb_step=4.06e-5, train/loss_step=0.00821, global_step=4871.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  13%|█▎        | 158/1208 [04:31<30:06,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00821, train/loss_vlb_step=4.06e-5, train/loss_step=0.00821, global_step=4871.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  13%|█▎        | 158/1208 [04:31<30:06,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000873, train/loss_step=0.225, global_step=4871.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  13%|█▎        | 159/1208 [04:32<30:00,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000873, train/loss_step=0.225, global_step=4871.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  13%|█▎        | 159/1208 [04:32<30:00,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.97e-5, train/loss_step=0.0186, global_step=4871.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  13%|█▎        | 160/1208 [04:35<30:06,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.97e-5, train/loss_step=0.0186, global_step=4871.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  13%|█▎        | 160/1208 [04:35<30:06,  1.72s/it, loss=0.186, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000515, train/loss_step=0.138, global_step=4871.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  13%|█▎        | 161/1208 [04:36<29:59,  1.72s/it, loss=0.186, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000515, train/loss_step=0.138, global_step=4871.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  13%|█▎        | 161/1208 [04:36<29:59,  1.72s/it, loss=0.194, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000999, train/loss_step=0.235, global_step=4872.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  13%|█▎        | 162/1208 [04:37<29:53,  1.71s/it, loss=0.194, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000999, train/loss_step=0.235, global_step=4872.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  13%|█▎        | 162/1208 [04:37<29:53,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000115, train/loss_step=0.0306, global_step=4872.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  13%|█▎        | 163/1208 [04:38<29:47,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000115, train/loss_step=0.0306, global_step=4872.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  13%|█▎        | 163/1208 [04:38<29:47,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=5.02e-5, train/loss_step=0.0104, global_step=4872.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  14%|█▎        | 164/1208 [04:41<29:52,  1.72s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=5.02e-5, train/loss_step=0.0104, global_step=4872.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  14%|█▎        | 164/1208 [04:41<29:52,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=2.1e-5, train/loss_step=0.00395, global_step=4872.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  14%|█▎        | 165/1208 [04:42<29:46,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=2.1e-5, train/loss_step=0.00395, global_step=4872.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  14%|█▎        | 165/1208 [04:42<29:46,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.00498, train/loss_step=0.450, global_step=4873.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  14%|█▎        | 166/1208 [04:43<29:40,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.00498, train/loss_step=0.450, global_step=4873.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  14%|█▎        | 166/1208 [04:43<29:40,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=3.08e-5, train/loss_step=0.00611, global_step=4873.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  14%|█▍        | 167/1208 [04:44<29:34,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=3.08e-5, train/loss_step=0.00611, global_step=4873.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  14%|█▍        | 167/1208 [04:44<29:34,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000458, train/loss_step=0.138, global_step=4873.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  14%|█▍        | 168/1208 [04:47<29:40,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000458, train/loss_step=0.138, global_step=4873.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  14%|█▍        | 168/1208 [04:47<29:40,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000872, train/loss_step=0.224, global_step=4873.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  14%|█▍        | 169/1208 [04:48<29:34,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000872, train/loss_step=0.224, global_step=4873.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  14%|█▍        | 169/1208 [04:48<29:34,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.00074, train/loss_step=0.191, global_step=4874.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  14%|█▍        | 170/1208 [04:49<29:28,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.00074, train/loss_step=0.191, global_step=4874.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  14%|█▍        | 170/1208 [04:49<29:28,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000536, train/loss_step=0.157, global_step=4874.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  14%|█▍        | 171/1208 [04:50<29:22,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000536, train/loss_step=0.157, global_step=4874.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  14%|█▍        | 171/1208 [04:50<29:22,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0889, train/loss_vlb_step=0.000295, train/loss_step=0.0889, global_step=4874.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  14%|█▍        | 172/1208 [04:53<29:27,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0889, train/loss_vlb_step=0.000295, train/loss_step=0.0889, global_step=4874.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  14%|█▍        | 172/1208 [04:53<29:27,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.562, train/loss_vlb_step=0.021, train/loss_step=0.562, global_step=4874.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]     Epoch 16:  14%|█▍        | 173/1208 [04:54<29:21,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.562, train/loss_vlb_step=0.021, train/loss_step=0.562, global_step=4874.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  14%|█▍        | 173/1208 [04:54<29:21,  1.70s/it, loss=0.176, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00124, train/loss_step=0.287, global_step=4875.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  14%|█▍        | 174/1208 [04:55<29:16,  1.70s/it, loss=0.176, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00124, train/loss_step=0.287, global_step=4875.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  14%|█▍        | 174/1208 [04:55<29:16,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000102, train/loss_step=0.0266, global_step=4875.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  14%|█▍        | 175/1208 [04:56<29:10,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000102, train/loss_step=0.0266, global_step=4875.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  14%|█▍        | 175/1208 [04:56<29:10,  1.69s/it, loss=0.154, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00121, train/loss_step=0.271, global_step=4875.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  15%|█▍        | 176/1208 [04:59<29:15,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00121, train/loss_step=0.271, global_step=4875.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  15%|█▍        | 176/1208 [04:59<29:15,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=4875.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  15%|█▍        | 177/1208 [05:00<29:09,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=4875.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  15%|█▍        | 177/1208 [05:00<29:09,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.57e-5, train/loss_step=0.0242, global_step=4876.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  15%|█▍        | 178/1208 [05:01<29:04,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.57e-5, train/loss_step=0.0242, global_step=4876.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  15%|█▍        | 178/1208 [05:01<29:04,  1.69s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0982, train/loss_vlb_step=0.000323, train/loss_step=0.0982, global_step=4876.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  15%|█▍        | 179/1208 [05:02<28:58,  1.69s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0982, train/loss_vlb_step=0.000323, train/loss_step=0.0982, global_step=4876.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  15%|█▍        | 179/1208 [05:02<28:58,  1.69s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.48e-5, train/loss_step=0.0171, global_step=4876.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  15%|█▍        | 180/1208 [05:05<29:03,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.48e-5, train/loss_step=0.0171, global_step=4876.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  15%|█▍        | 180/1208 [05:05<29:03,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.25e-5, train/loss_step=0.00219, global_step=4876.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  15%|█▍        | 181/1208 [05:06<28:58,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.25e-5, train/loss_step=0.00219, global_step=4876.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  15%|█▍        | 181/1208 [05:06<28:58,  1.69s/it, loss=0.161, v_num=0, train/loss_simple_step=0.517, train/loss_vlb_step=0.00823, train/loss_step=0.517, global_step=4877.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  15%|█▌        | 182/1208 [05:07<28:52,  1.69s/it, loss=0.161, v_num=0, train/loss_simple_step=0.517, train/loss_vlb_step=0.00823, train/loss_step=0.517, global_step=4877.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  15%|█▌        | 182/1208 [05:07<28:52,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00751, train/loss_vlb_step=3.71e-5, train/loss_step=0.00751, global_step=4877.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  15%|█▌        | 183/1208 [05:08<28:47,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00751, train/loss_vlb_step=3.71e-5, train/loss_step=0.00751, global_step=4877.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  15%|█▌        | 183/1208 [05:08<28:47,  1.69s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0823, train/loss_vlb_step=0.000273, train/loss_step=0.0823, global_step=4877.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  15%|█▌        | 184/1208 [05:11<28:52,  1.69s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0823, train/loss_vlb_step=0.000273, train/loss_step=0.0823, global_step=4877.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  15%|█▌        | 184/1208 [05:11<28:52,  1.69s/it, loss=0.17, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000469, train/loss_step=0.141, global_step=4877.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  15%|█▌        | 185/1208 [05:12<28:46,  1.69s/it, loss=0.17, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000469, train/loss_step=0.141, global_step=4877.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  15%|█▌        | 185/1208 [05:12<28:46,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0898, train/loss_vlb_step=0.000298, train/loss_step=0.0898, global_step=4878.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  15%|█▌        | 186/1208 [05:13<28:41,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0898, train/loss_vlb_step=0.000298, train/loss_step=0.0898, global_step=4878.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  15%|█▌        | 186/1208 [05:13<28:41,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000457, train/loss_step=0.136, global_step=4878.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  15%|█▌        | 187/1208 [05:14<28:35,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000457, train/loss_step=0.136, global_step=4878.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  15%|█▌        | 187/1208 [05:14<28:35,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.00082, train/loss_step=0.220, global_step=4878.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  16%|█▌        | 188/1208 [05:17<28:40,  1.69s/it, loss=0.163, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.00082, train/loss_step=0.220, global_step=4878.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  16%|█▌        | 188/1208 [05:17<28:40,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.43e-5, train/loss_step=0.0227, global_step=4878.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  16%|█▌        | 189/1208 [05:18<28:35,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.43e-5, train/loss_step=0.0227, global_step=4878.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  16%|█▌        | 189/1208 [05:18<28:35,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0837, train/loss_vlb_step=0.000276, train/loss_step=0.0837, global_step=4879.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  16%|█▌        | 190/1208 [05:19<28:30,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0837, train/loss_vlb_step=0.000276, train/loss_step=0.0837, global_step=4879.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  16%|█▌        | 190/1208 [05:19<28:30,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000595, train/loss_step=0.176, global_step=4879.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  16%|█▌        | 191/1208 [05:20<28:24,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000595, train/loss_step=0.176, global_step=4879.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  16%|█▌        | 191/1208 [05:20<28:24,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000524, train/loss_step=0.154, global_step=4879.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  16%|█▌        | 192/1208 [05:23<28:29,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000524, train/loss_step=0.154, global_step=4879.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  16%|█▌        | 192/1208 [05:23<28:29,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00218, train/loss_step=0.339, global_step=4879.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  16%|█▌        | 193/1208 [05:24<28:24,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00218, train/loss_step=0.339, global_step=4879.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  16%|█▌        | 193/1208 [05:24<28:24,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00126, train/loss_step=0.280, global_step=4880.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  16%|█▌        | 194/1208 [05:25<28:19,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00126, train/loss_step=0.280, global_step=4880.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  16%|█▌        | 194/1208 [05:25<28:19,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00116, train/loss_step=0.279, global_step=4880.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  16%|█▌        | 195/1208 [05:26<28:14,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00116, train/loss_step=0.279, global_step=4880.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  16%|█▌        | 195/1208 [05:26<28:14,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00117, train/loss_step=0.274, global_step=4880.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  16%|█▌        | 196/1208 [05:28<28:18,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00117, train/loss_step=0.274, global_step=4880.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  16%|█▌        | 196/1208 [05:28<28:18,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000941, train/loss_step=0.235, global_step=4880.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  16%|█▋        | 197/1208 [05:30<28:13,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000941, train/loss_step=0.235, global_step=4880.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  16%|█▋        | 197/1208 [05:30<28:13,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=1.09e-5, train/loss_step=0.00183, global_step=4881.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  16%|█▋        | 198/1208 [05:31<28:08,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=1.09e-5, train/loss_step=0.00183, global_step=4881.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  16%|█▋        | 198/1208 [05:31<28:08,  1.67s/it, loss=0.176, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00396, train/loss_step=0.457, global_step=4881.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  16%|█▋        | 199/1208 [05:32<28:03,  1.67s/it, loss=0.176, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00396, train/loss_step=0.457, global_step=4881.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  16%|█▋        | 199/1208 [05:32<28:03,  1.67s/it, loss=0.187, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.0011, train/loss_step=0.250, global_step=4881.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  17%|█▋        | 200/1208 [05:34<28:07,  1.67s/it, loss=0.187, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.0011, train/loss_step=0.250, global_step=4881.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  17%|█▋        | 200/1208 [05:34<28:07,  1.67s/it, loss=0.193, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=4881.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  17%|█▋        | 201/1208 [05:35<28:02,  1.67s/it, loss=0.193, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=4881.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  17%|█▋        | 201/1208 [05:35<28:02,  1.67s/it, loss=0.202, v_num=0, train/loss_simple_step=0.694, train/loss_vlb_step=0.0327, train/loss_step=0.694, global_step=4882.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  17%|█▋        | 202/1208 [05:36<27:57,  1.67s/it, loss=0.202, v_num=0, train/loss_simple_step=0.694, train/loss_vlb_step=0.0327, train/loss_step=0.694, global_step=4882.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  17%|█▋        | 202/1208 [05:36<27:57,  1.67s/it, loss=0.202, v_num=0, train/loss_simple_step=0.00982, train/loss_vlb_step=4.5e-5, train/loss_step=0.00982, global_step=4882.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  17%|█▋        | 203/1208 [05:37<27:53,  1.66s/it, loss=0.202, v_num=0, train/loss_simple_step=0.00982, train/loss_vlb_step=4.5e-5, train/loss_step=0.00982, global_step=4882.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  17%|█▋        | 203/1208 [05:37<27:53,  1.66s/it, loss=0.21, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000929, train/loss_step=0.237, global_step=4882.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  17%|█▋        | 204/1208 [05:40<27:57,  1.67s/it, loss=0.21, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000929, train/loss_step=0.237, global_step=4882.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  17%|█▋        | 204/1208 [05:40<27:57,  1.67s/it, loss=0.214, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000855, train/loss_step=0.227, global_step=4882.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  17%|█▋        | 205/1208 [05:41<27:52,  1.67s/it, loss=0.214, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000855, train/loss_step=0.227, global_step=4882.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  17%|█▋        | 205/1208 [05:41<27:52,  1.67s/it, loss=0.23, v_num=0, train/loss_simple_step=0.410, train/loss_vlb_step=0.00446, train/loss_step=0.410, global_step=4883.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  17%|█▋        | 206/1208 [05:42<27:47,  1.66s/it, loss=0.23, v_num=0, train/loss_simple_step=0.410, train/loss_vlb_step=0.00446, train/loss_step=0.410, global_step=4883.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  17%|█▋        | 206/1208 [05:42<27:47,  1.66s/it, loss=0.229, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=4883.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  17%|█▋        | 207/1208 [05:43<27:42,  1.66s/it, loss=0.229, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=4883.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  17%|█▋        | 207/1208 [05:43<27:42,  1.66s/it, loss=0.219, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000118, train/loss_step=0.0311, global_step=4883.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  17%|█▋        | 208/1208 [05:46<27:46,  1.67s/it, loss=0.219, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000118, train/loss_step=0.0311, global_step=4883.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  17%|█▋        | 208/1208 [05:46<27:46,  1.67s/it, loss=0.243, v_num=0, train/loss_simple_step=0.504, train/loss_vlb_step=0.00558, train/loss_step=0.504, global_step=4883.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  17%|█▋        | 209/1208 [05:47<27:42,  1.66s/it, loss=0.243, v_num=0, train/loss_simple_step=0.504, train/loss_vlb_step=0.00558, train/loss_step=0.504, global_step=4883.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  17%|█▋        | 209/1208 [05:47<27:42,  1.66s/it, loss=0.241, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000133, train/loss_step=0.0361, global_step=4884.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  17%|█▋        | 210/1208 [05:48<27:37,  1.66s/it, loss=0.241, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000133, train/loss_step=0.0361, global_step=4884.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  17%|█▋        | 210/1208 [05:48<27:37,  1.66s/it, loss=0.24, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.00049, train/loss_step=0.147, global_step=4884.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  17%|█▋        | 211/1208 [05:49<27:32,  1.66s/it, loss=0.24, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.00049, train/loss_step=0.147, global_step=4884.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  17%|█▋        | 211/1208 [05:49<27:32,  1.66s/it, loss=0.237, v_num=0, train/loss_simple_step=0.0998, train/loss_vlb_step=0.000329, train/loss_step=0.0998, global_step=4884.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  18%|█▊        | 212/1208 [05:52<27:36,  1.66s/it, loss=0.237, v_num=0, train/loss_simple_step=0.0998, train/loss_vlb_step=0.000329, train/loss_step=0.0998, global_step=4884.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  18%|█▊        | 212/1208 [05:52<27:36,  1.66s/it, loss=0.258, v_num=0, train/loss_simple_step=0.772, train/loss_vlb_step=0.0658, train/loss_step=0.772, global_step=4884.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  18%|█▊        | 213/1208 [05:53<27:32,  1.66s/it, loss=0.258, v_num=0, train/loss_simple_step=0.772, train/loss_vlb_step=0.0658, train/loss_step=0.772, global_step=4884.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  18%|█▊        | 213/1208 [05:53<27:32,  1.66s/it, loss=0.251, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000464, train/loss_step=0.140, global_step=4885.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  18%|█▊        | 214/1208 [05:54<27:27,  1.66s/it, loss=0.251, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000464, train/loss_step=0.140, global_step=4885.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  18%|█▊        | 214/1208 [05:54<27:27,  1.66s/it, loss=0.24, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.00016, train/loss_step=0.045, global_step=4885.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  18%|█▊        | 215/1208 [05:55<27:22,  1.65s/it, loss=0.24, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.00016, train/loss_step=0.045, global_step=4885.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  18%|█▊        | 215/1208 [05:55<27:22,  1.65s/it, loss=0.227, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=8.94e-5, train/loss_step=0.0229, global_step=4885.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  18%|█▊        | 216/1208 [05:58<27:26,  1.66s/it, loss=0.227, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=8.94e-5, train/loss_step=0.0229, global_step=4885.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  18%|█▊        | 216/1208 [05:58<27:26,  1.66s/it, loss=0.216, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=1.41e-5, train/loss_step=0.00243, global_step=4885.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  18%|█▊        | 217/1208 [05:59<27:22,  1.66s/it, loss=0.216, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=1.41e-5, train/loss_step=0.00243, global_step=4885.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  18%|█▊        | 217/1208 [05:59<27:22,  1.66s/it, loss=0.236, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00276, train/loss_step=0.413, global_step=4886.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  18%|█▊        | 218/1208 [06:00<27:17,  1.65s/it, loss=0.236, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00276, train/loss_step=0.413, global_step=4886.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  18%|█▊        | 218/1208 [06:00<27:17,  1.65s/it, loss=0.214, v_num=0, train/loss_simple_step=0.00813, train/loss_vlb_step=4.03e-5, train/loss_step=0.00813, global_step=4886.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  18%|█▊        | 219/1208 [06:01<27:12,  1.65s/it, loss=0.214, v_num=0, train/loss_simple_step=0.00813, train/loss_vlb_step=4.03e-5, train/loss_step=0.00813, global_step=4886.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  18%|█▊        | 219/1208 [06:01<27:12,  1.65s/it, loss=0.201, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.54e-5, train/loss_step=0.00268, global_step=4886.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  18%|█▊        | 220/1208 [06:04<27:16,  1.66s/it, loss=0.201, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.54e-5, train/loss_step=0.00268, global_step=4886.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  18%|█▊        | 220/1208 [06:04<27:16,  1.66s/it, loss=0.207, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000911, train/loss_step=0.223, global_step=4886.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  18%|█▊        | 221/1208 [06:05<27:12,  1.65s/it, loss=0.207, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000911, train/loss_step=0.223, global_step=4886.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  18%|█▊        | 221/1208 [06:05<27:12,  1.65s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.00017, train/loss_step=0.0476, global_step=4887.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  18%|█▊        | 222/1208 [06:06<27:07,  1.65s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.00017, train/loss_step=0.0476, global_step=4887.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  18%|█▊        | 222/1208 [06:06<27:07,  1.65s/it, loss=0.18, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000399, train/loss_step=0.122, global_step=4887.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  18%|█▊        | 223/1208 [06:07<27:03,  1.65s/it, loss=0.18, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000399, train/loss_step=0.122, global_step=4887.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  18%|█▊        | 223/1208 [06:07<27:03,  1.65s/it, loss=0.188, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00288, train/loss_step=0.402, global_step=4887.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  19%|█▊        | 224/1208 [06:10<27:07,  1.65s/it, loss=0.188, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00288, train/loss_step=0.402, global_step=4887.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  19%|█▊        | 224/1208 [06:10<27:07,  1.65s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.35e-5, train/loss_step=0.0114, global_step=4887.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  19%|█▊        | 225/1208 [06:11<27:02,  1.65s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.35e-5, train/loss_step=0.0114, global_step=4887.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  19%|█▊        | 225/1208 [06:11<27:02,  1.65s/it, loss=0.182, v_num=0, train/loss_simple_step=0.509, train/loss_vlb_step=0.00675, train/loss_step=0.509, global_step=4888.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  19%|█▊        | 226/1208 [06:12<26:58,  1.65s/it, loss=0.182, v_num=0, train/loss_simple_step=0.509, train/loss_vlb_step=0.00675, train/loss_step=0.509, global_step=4888.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  19%|█▊        | 226/1208 [06:12<26:58,  1.65s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00942, train/loss_vlb_step=4.46e-5, train/loss_step=0.00942, global_step=4888.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  19%|█▉        | 227/1208 [06:13<26:53,  1.65s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00942, train/loss_vlb_step=4.46e-5, train/loss_step=0.00942, global_step=4888.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  19%|█▉        | 227/1208 [06:13<26:53,  1.65s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0398, train/loss_vlb_step=0.000147, train/loss_step=0.0398, global_step=4888.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  19%|█▉        | 228/1208 [06:16<26:57,  1.65s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0398, train/loss_vlb_step=0.000147, train/loss_step=0.0398, global_step=4888.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  19%|█▉        | 228/1208 [06:16<26:57,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000532, train/loss_step=0.162, global_step=4888.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  19%|█▉        | 229/1208 [06:17<26:53,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000532, train/loss_step=0.162, global_step=4888.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  19%|█▉        | 229/1208 [06:17<26:53,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0622, train/loss_vlb_step=0.000212, train/loss_step=0.0622, global_step=4889.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  19%|█▉        | 230/1208 [06:18<26:48,  1.64s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0622, train/loss_vlb_step=0.000212, train/loss_step=0.0622, global_step=4889.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  19%|█▉        | 230/1208 [06:18<26:48,  1.64s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=1.44e-5, train/loss_step=0.00239, global_step=4889.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  19%|█▉        | 231/1208 [06:19<26:44,  1.64s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=1.44e-5, train/loss_step=0.00239, global_step=4889.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  19%|█▉        | 231/1208 [06:19<26:44,  1.64s/it, loss=0.17, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00271, train/loss_step=0.412, global_step=4889.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]     Epoch 16:  19%|█▉        | 232/1208 [06:22<26:48,  1.65s/it, loss=0.17, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00271, train/loss_step=0.412, global_step=4889.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  19%|█▉        | 232/1208 [06:22<26:48,  1.65s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00757, train/loss_vlb_step=3.72e-5, train/loss_step=0.00757, global_step=4889.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  19%|█▉        | 233/1208 [06:23<26:43,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00757, train/loss_vlb_step=3.72e-5, train/loss_step=0.00757, global_step=4889.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  19%|█▉        | 233/1208 [06:23<26:43,  1.64s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.27e-5, train/loss_step=0.00218, global_step=4890.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  19%|█▉        | 234/1208 [06:24<26:39,  1.64s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.27e-5, train/loss_step=0.00218, global_step=4890.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  19%|█▉        | 234/1208 [06:24<26:39,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.00061, train/loss_step=0.174, global_step=4890.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  19%|█▉        | 235/1208 [06:25<26:35,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.00061, train/loss_step=0.174, global_step=4890.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  19%|█▉        | 235/1208 [06:25<26:35,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=2.44e-5, train/loss_step=0.00451, global_step=4890.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  20%|█▉        | 236/1208 [06:28<26:38,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=2.44e-5, train/loss_step=0.00451, global_step=4890.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  20%|█▉        | 236/1208 [06:28<26:38,  1.64s/it, loss=0.136, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=4890.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  20%|█▉        | 237/1208 [06:29<26:34,  1.64s/it, loss=0.136, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=4890.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  20%|█▉        | 237/1208 [06:29<26:34,  1.64s/it, loss=0.126, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000797, train/loss_step=0.206, global_step=4891.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  20%|█▉        | 238/1208 [06:30<26:30,  1.64s/it, loss=0.126, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000797, train/loss_step=0.206, global_step=4891.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  20%|█▉        | 238/1208 [06:30<26:30,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00392, train/loss_step=0.394, global_step=4891.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  20%|█▉        | 239/1208 [06:31<26:25,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00392, train/loss_step=0.394, global_step=4891.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  20%|█▉        | 239/1208 [06:31<26:25,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=2.12e-5, train/loss_step=0.00384, global_step=4891.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  20%|█▉        | 240/1208 [06:34<26:29,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=2.12e-5, train/loss_step=0.00384, global_step=4891.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  20%|█▉        | 240/1208 [06:34<26:29,  1.64s/it, loss=0.179, v_num=0, train/loss_simple_step=0.893, train/loss_vlb_step=0.449, train/loss_step=0.893, global_step=4891.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]      Epoch 16:  20%|█▉        | 241/1208 [06:35<26:25,  1.64s/it, loss=0.179, v_num=0, train/loss_simple_step=0.893, train/loss_vlb_step=0.449, train/loss_step=0.893, global_step=4891.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  20%|█▉        | 241/1208 [06:35<26:25,  1.64s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=0.000103, train/loss_step=0.0257, global_step=4892.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  20%|██        | 242/1208 [06:36<26:20,  1.64s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=0.000103, train/loss_step=0.0257, global_step=4892.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  20%|██        | 242/1208 [06:36<26:20,  1.64s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.58e-5, train/loss_step=0.0177, global_step=4892.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  20%|██        | 243/1208 [06:37<26:16,  1.63s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.58e-5, train/loss_step=0.0177, global_step=4892.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  20%|██        | 243/1208 [06:37<26:16,  1.63s/it, loss=0.154, v_num=0, train/loss_simple_step=0.030, train/loss_vlb_step=0.000117, train/loss_step=0.030, global_step=4892.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  20%|██        | 244/1208 [06:39<26:20,  1.64s/it, loss=0.154, v_num=0, train/loss_simple_step=0.030, train/loss_vlb_step=0.000117, train/loss_step=0.030, global_step=4892.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  20%|██        | 244/1208 [06:39<26:20,  1.64s/it, loss=0.161, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000485, train/loss_step=0.147, global_step=4892.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  20%|██        | 245/1208 [06:40<26:16,  1.64s/it, loss=0.161, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000485, train/loss_step=0.147, global_step=4892.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  20%|██        | 245/1208 [06:40<26:16,  1.64s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00637, train/loss_vlb_step=3.16e-5, train/loss_step=0.00637, global_step=4893.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  20%|██        | 246/1208 [06:41<26:11,  1.63s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00637, train/loss_vlb_step=3.16e-5, train/loss_step=0.00637, global_step=4893.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  20%|██        | 246/1208 [06:41<26:11,  1.63s/it, loss=0.144, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.00063, train/loss_step=0.182, global_step=4893.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  20%|██        | 247/1208 [06:42<26:07,  1.63s/it, loss=0.144, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.00063, train/loss_step=0.182, global_step=4893.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  20%|██        | 247/1208 [06:42<26:07,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.34e-5, train/loss_step=0.0202, global_step=4893.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  21%|██        | 248/1208 [06:45<26:11,  1.64s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.34e-5, train/loss_step=0.0202, global_step=4893.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  21%|██        | 248/1208 [06:45<26:11,  1.64s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000115, train/loss_step=0.0287, global_step=4893.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  21%|██        | 249/1208 [06:46<26:07,  1.63s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000115, train/loss_step=0.0287, global_step=4893.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  21%|██        | 249/1208 [06:46<26:07,  1.63s/it, loss=0.139, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000393, train/loss_step=0.119, global_step=4894.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  21%|██        | 250/1208 [06:47<26:03,  1.63s/it, loss=0.139, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000393, train/loss_step=0.119, global_step=4894.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  21%|██        | 250/1208 [06:47<26:03,  1.63s/it, loss=0.161, v_num=0, train/loss_simple_step=0.437, train/loss_vlb_step=0.00536, train/loss_step=0.437, global_step=4894.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  21%|██        | 251/1208 [06:48<25:59,  1.63s/it, loss=0.161, v_num=0, train/loss_simple_step=0.437, train/loss_vlb_step=0.00536, train/loss_step=0.437, global_step=4894.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  21%|██        | 251/1208 [06:48<25:59,  1.63s/it, loss=0.15, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000751, train/loss_step=0.199, global_step=4894.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  21%|██        | 252/1208 [06:51<26:02,  1.63s/it, loss=0.15, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000751, train/loss_step=0.199, global_step=4894.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  21%|██        | 252/1208 [06:51<26:02,  1.63s/it, loss=0.169, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00206, train/loss_step=0.377, global_step=4894.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  21%|██        | 253/1208 [06:52<25:58,  1.63s/it, loss=0.169, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00206, train/loss_step=0.377, global_step=4894.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  21%|██        | 253/1208 [06:52<25:58,  1.63s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0087, train/loss_vlb_step=4.06e-5, train/loss_step=0.0087, global_step=4895.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  21%|██        | 254/1208 [06:53<25:54,  1.63s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0087, train/loss_vlb_step=4.06e-5, train/loss_step=0.0087, global_step=4895.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  21%|██        | 254/1208 [06:53<25:54,  1.63s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.000119, train/loss_step=0.0292, global_step=4895.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  21%|██        | 255/1208 [06:54<25:50,  1.63s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.000119, train/loss_step=0.0292, global_step=4895.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  21%|██        | 255/1208 [06:54<25:50,  1.63s/it, loss=0.177, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00142, train/loss_step=0.306, global_step=4895.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  21%|██        | 256/1208 [06:58<25:54,  1.63s/it, loss=0.177, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00142, train/loss_step=0.306, global_step=4895.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  21%|██        | 256/1208 [06:58<25:54,  1.63s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0909, train/loss_vlb_step=0.000299, train/loss_step=0.0909, global_step=4895.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  21%|██▏       | 257/1208 [06:59<25:50,  1.63s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0909, train/loss_vlb_step=0.000299, train/loss_step=0.0909, global_step=4895.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  21%|██▏       | 257/1208 [06:59<25:50,  1.63s/it, loss=0.172, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=4896.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  21%|██▏       | 258/1208 [07:00<25:46,  1.63s/it, loss=0.172, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=4896.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  21%|██▏       | 258/1208 [07:00<25:46,  1.63s/it, loss=0.163, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000757, train/loss_step=0.216, global_step=4896.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  21%|██▏       | 259/1208 [07:01<25:43,  1.63s/it, loss=0.163, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000757, train/loss_step=0.216, global_step=4896.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  21%|██▏       | 259/1208 [07:01<25:43,  1.63s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000127, train/loss_step=0.0345, global_step=4896.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  22%|██▏       | 260/1208 [07:04<25:47,  1.63s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000127, train/loss_step=0.0345, global_step=4896.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  22%|██▏       | 260/1208 [07:04<25:47,  1.63s/it, loss=0.135, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00149, train/loss_step=0.299, global_step=4896.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  22%|██▏       | 261/1208 [07:05<25:43,  1.63s/it, loss=0.135, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00149, train/loss_step=0.299, global_step=4896.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  22%|██▏       | 261/1208 [07:05<25:43,  1.63s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00916, train/loss_vlb_step=4.32e-5, train/loss_step=0.00916, global_step=4897.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  22%|██▏       | 262/1208 [07:06<25:39,  1.63s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00916, train/loss_vlb_step=4.32e-5, train/loss_step=0.00916, global_step=4897.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  22%|██▏       | 262/1208 [07:06<25:39,  1.63s/it, loss=0.144, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000776, train/loss_step=0.223, global_step=4897.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  22%|██▏       | 263/1208 [07:07<25:36,  1.63s/it, loss=0.144, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000776, train/loss_step=0.223, global_step=4897.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  22%|██▏       | 263/1208 [07:07<25:36,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.00063, train/loss_step=0.180, global_step=4897.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  22%|██▏       | 264/1208 [07:10<25:40,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.00063, train/loss_step=0.180, global_step=4897.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  22%|██▏       | 264/1208 [07:10<25:40,  1.63s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00511, train/loss_vlb_step=2.66e-5, train/loss_step=0.00511, global_step=4897.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  22%|██▏       | 265/1208 [07:11<25:36,  1.63s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00511, train/loss_vlb_step=2.66e-5, train/loss_step=0.00511, global_step=4897.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  22%|██▏       | 265/1208 [07:11<25:36,  1.63s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.18e-5, train/loss_step=0.00202, global_step=4898.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  22%|██▏       | 266/1208 [07:12<25:32,  1.63s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.18e-5, train/loss_step=0.00202, global_step=4898.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  22%|██▏       | 266/1208 [07:12<25:32,  1.63s/it, loss=0.14, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=4898.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  22%|██▏       | 267/1208 [07:13<25:29,  1.63s/it, loss=0.14, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=4898.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  22%|██▏       | 267/1208 [07:13<25:29,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0708, train/loss_vlb_step=0.000235, train/loss_step=0.0708, global_step=4898.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  22%|██▏       | 268/1208 [07:17<25:33,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0708, train/loss_vlb_step=0.000235, train/loss_step=0.0708, global_step=4898.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  22%|██▏       | 268/1208 [07:17<25:33,  1.63s/it, loss=0.155, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00107, train/loss_step=0.267, global_step=4898.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  22%|██▏       | 269/1208 [07:18<25:29,  1.63s/it, loss=0.155, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00107, train/loss_step=0.267, global_step=4898.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  22%|██▏       | 269/1208 [07:18<25:29,  1.63s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.65e-5, train/loss_step=0.0157, global_step=4899.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  22%|██▏       | 270/1208 [07:19<25:26,  1.63s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.65e-5, train/loss_step=0.0157, global_step=4899.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  22%|██▏       | 270/1208 [07:19<25:26,  1.63s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0432, train/loss_vlb_step=0.000153, train/loss_step=0.0432, global_step=4899.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  22%|██▏       | 271/1208 [07:20<25:22,  1.62s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0432, train/loss_vlb_step=0.000153, train/loss_step=0.0432, global_step=4899.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  22%|██▏       | 271/1208 [07:20<25:22,  1.62s/it, loss=0.133, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00117, train/loss_step=0.269, global_step=4899.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  23%|██▎       | 272/1208 [07:23<25:26,  1.63s/it, loss=0.133, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00117, train/loss_step=0.269, global_step=4899.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  23%|██▎       | 272/1208 [07:23<25:26,  1.63s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00592, train/loss_vlb_step=3.04e-5, train/loss_step=0.00592, global_step=4899.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  23%|██▎       | 273/1208 [07:24<25:22,  1.63s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00592, train/loss_vlb_step=3.04e-5, train/loss_step=0.00592, global_step=4899.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  23%|██▎       | 273/1208 [07:24<25:22,  1.63s/it, loss=0.129, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00121, train/loss_step=0.289, global_step=4900.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  23%|██▎       | 274/1208 [07:25<25:19,  1.63s/it, loss=0.129, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00121, train/loss_step=0.289, global_step=4900.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  23%|██▎       | 274/1208 [07:25<25:19,  1.63s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000112, train/loss_step=0.0287, global_step=4900.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  23%|██▎       | 275/1208 [07:26<25:15,  1.62s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000112, train/loss_step=0.0287, global_step=4900.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  23%|██▎       | 275/1208 [07:26<25:15,  1.62s/it, loss=0.123, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000677, train/loss_step=0.191, global_step=4900.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  23%|██▎       | 276/1208 [07:29<25:19,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000677, train/loss_step=0.191, global_step=4900.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  23%|██▎       | 276/1208 [07:29<25:19,  1.63s/it, loss=0.126, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000493, train/loss_step=0.144, global_step=4900.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  23%|██▎       | 277/1208 [07:31<25:15,  1.63s/it, loss=0.126, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000493, train/loss_step=0.144, global_step=4900.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  23%|██▎       | 277/1208 [07:31<25:15,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.000126, train/loss_step=0.0326, global_step=4901.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  23%|██▎       | 278/1208 [07:32<25:12,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.000126, train/loss_step=0.0326, global_step=4901.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  23%|██▎       | 278/1208 [07:32<25:12,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000383, train/loss_step=0.116, global_step=4901.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  23%|██▎       | 279/1208 [07:33<25:08,  1.62s/it, loss=0.116, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000383, train/loss_step=0.116, global_step=4901.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  23%|██▎       | 279/1208 [07:33<25:08,  1.62s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.33e-5, train/loss_step=0.0144, global_step=4901.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  23%|██▎       | 280/1208 [07:36<25:12,  1.63s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.33e-5, train/loss_step=0.0144, global_step=4901.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  23%|██▎       | 280/1208 [07:36<25:12,  1.63s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.89e-5, train/loss_step=0.0133, global_step=4901.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  23%|██▎       | 281/1208 [07:37<25:09,  1.63s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.89e-5, train/loss_step=0.0133, global_step=4901.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  23%|██▎       | 281/1208 [07:37<25:09,  1.63s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.71e-5, train/loss_step=0.0029, global_step=4902.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  23%|██▎       | 282/1208 [07:38<25:05,  1.63s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.71e-5, train/loss_step=0.0029, global_step=4902.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  23%|██▎       | 282/1208 [07:38<25:05,  1.63s/it, loss=0.105, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00152, train/loss_step=0.303, global_step=4902.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  23%|██▎       | 283/1208 [07:39<25:01,  1.62s/it, loss=0.105, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00152, train/loss_step=0.303, global_step=4902.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  23%|██▎       | 283/1208 [07:39<25:01,  1.62s/it, loss=0.106, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000745, train/loss_step=0.203, global_step=4902.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  24%|██▎       | 284/1208 [07:42<25:05,  1.63s/it, loss=0.106, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000745, train/loss_step=0.203, global_step=4902.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  24%|██▎       | 284/1208 [07:42<25:05,  1.63s/it, loss=0.122, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00186, train/loss_step=0.325, global_step=4902.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  24%|██▎       | 285/1208 [07:43<25:02,  1.63s/it, loss=0.122, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00186, train/loss_step=0.325, global_step=4902.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  24%|██▎       | 285/1208 [07:43<25:02,  1.63s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.62e-5, train/loss_step=0.00289, global_step=4903.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  24%|██▎       | 286/1208 [07:44<24:58,  1.63s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.62e-5, train/loss_step=0.00289, global_step=4903.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  24%|██▎       | 286/1208 [07:44<24:58,  1.63s/it, loss=0.142, v_num=0, train/loss_simple_step=0.510, train/loss_vlb_step=0.00834, train/loss_step=0.510, global_step=4903.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  24%|██▍       | 287/1208 [07:45<24:55,  1.62s/it, loss=0.142, v_num=0, train/loss_simple_step=0.510, train/loss_vlb_step=0.00834, train/loss_step=0.510, global_step=4903.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  24%|██▍       | 287/1208 [07:45<24:55,  1.62s/it, loss=0.156, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00184, train/loss_step=0.339, global_step=4903.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  24%|██▍       | 288/1208 [07:49<24:58,  1.63s/it, loss=0.156, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00184, train/loss_step=0.339, global_step=4903.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  24%|██▍       | 288/1208 [07:49<24:58,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.2e-5, train/loss_step=0.0113, global_step=4903.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  24%|██▍       | 289/1208 [07:50<24:55,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.2e-5, train/loss_step=0.0113, global_step=4903.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  24%|██▍       | 289/1208 [07:50<24:55,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.31e-5, train/loss_step=0.0122, global_step=4904.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  24%|██▍       | 290/1208 [07:51<24:51,  1.62s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.31e-5, train/loss_step=0.0122, global_step=4904.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  24%|██▍       | 290/1208 [07:51<24:51,  1.63s/it, loss=0.155, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00127, train/loss_step=0.289, global_step=4904.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  24%|██▍       | 291/1208 [07:52<24:48,  1.62s/it, loss=0.155, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00127, train/loss_step=0.289, global_step=4904.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  24%|██▍       | 291/1208 [07:52<24:48,  1.62s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0507, train/loss_vlb_step=0.000173, train/loss_step=0.0507, global_step=4904.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  24%|██▍       | 292/1208 [07:55<24:51,  1.63s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0507, train/loss_vlb_step=0.000173, train/loss_step=0.0507, global_step=4904.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  24%|██▍       | 292/1208 [07:55<24:51,  1.63s/it, loss=0.155, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000927, train/loss_step=0.229, global_step=4904.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  24%|██▍       | 293/1208 [07:56<24:48,  1.63s/it, loss=0.155, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000927, train/loss_step=0.229, global_step=4904.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  24%|██▍       | 293/1208 [07:56<24:48,  1.63s/it, loss=0.147, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=4905.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  24%|██▍       | 294/1208 [07:57<24:44,  1.62s/it, loss=0.147, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=4905.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  24%|██▍       | 294/1208 [07:57<24:44,  1.62s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=1.89e-5, train/loss_step=0.0034, global_step=4905.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  24%|██▍       | 295/1208 [07:58<24:41,  1.62s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=1.89e-5, train/loss_step=0.0034, global_step=4905.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  24%|██▍       | 295/1208 [07:58<24:41,  1.62s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00499, train/loss_vlb_step=2.55e-5, train/loss_step=0.00499, global_step=4905.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  25%|██▍       | 296/1208 [08:01<24:45,  1.63s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00499, train/loss_vlb_step=2.55e-5, train/loss_step=0.00499, global_step=4905.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  25%|██▍       | 296/1208 [08:01<24:45,  1.63s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0808, train/loss_vlb_step=0.00027, train/loss_step=0.0808, global_step=4905.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  25%|██▍       | 297/1208 [08:03<24:41,  1.63s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0808, train/loss_vlb_step=0.00027, train/loss_step=0.0808, global_step=4905.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  25%|██▍       | 297/1208 [08:03<24:41,  1.63s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=1.21e-5, train/loss_step=0.00201, global_step=4906.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  25%|██▍       | 298/1208 [08:04<24:38,  1.62s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=1.21e-5, train/loss_step=0.00201, global_step=4906.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  25%|██▍       | 298/1208 [08:04<24:38,  1.62s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00533, train/loss_vlb_step=2.72e-5, train/loss_step=0.00533, global_step=4906.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  25%|██▍       | 299/1208 [08:05<24:34,  1.62s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00533, train/loss_vlb_step=2.72e-5, train/loss_step=0.00533, global_step=4906.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  25%|██▍       | 299/1208 [08:05<24:34,  1.62s/it, loss=0.145, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00266, train/loss_step=0.390, global_step=4906.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  25%|██▍       | 300/1208 [08:08<24:38,  1.63s/it, loss=0.145, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00266, train/loss_step=0.390, global_step=4906.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  25%|██▍       | 300/1208 [08:08<24:38,  1.63s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0767, train/loss_vlb_step=0.000256, train/loss_step=0.0767, global_step=4906.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.84it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.77it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.75it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.76it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.76it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.78it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.76it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.80it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.75it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.75it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.75it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.82it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.82it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 16:  25%|██▍       | 301/1208 [08:39<26:04,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0767, train/loss_vlb_step=0.000256, train/loss_step=0.0767, global_step=4906.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  25%|██▍       | 301/1208 [08:39<26:04,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.005, train/loss_vlb_step=2.61e-5, train/loss_step=0.005, global_step=4907.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  25%|██▌       | 302/1208 [08:40<26:00,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.005, train/loss_vlb_step=2.61e-5, train/loss_step=0.005, global_step=4907.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  25%|██▌       | 302/1208 [08:40<26:00,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000334, train/loss_step=0.102, global_step=4907.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  25%|██▌       | 303/1208 [08:41<25:56,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000334, train/loss_step=0.102, global_step=4907.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  25%|██▌       | 303/1208 [08:41<25:56,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0589, train/loss_vlb_step=0.000198, train/loss_step=0.0589, global_step=4907.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  25%|██▌       | 304/1208 [08:44<25:58,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0589, train/loss_vlb_step=0.000198, train/loss_step=0.0589, global_step=4907.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  25%|██▌       | 304/1208 [08:44<25:58,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0318, train/loss_vlb_step=0.000119, train/loss_step=0.0318, global_step=4907.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  25%|██▌       | 305/1208 [08:45<25:55,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0318, train/loss_vlb_step=0.000119, train/loss_step=0.0318, global_step=4907.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  25%|██▌       | 305/1208 [08:45<25:55,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00237, train/loss_step=0.376, global_step=4908.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  25%|██▌       | 306/1208 [08:46<25:51,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00237, train/loss_step=0.376, global_step=4908.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  25%|██▌       | 306/1208 [08:46<25:51,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000545, train/loss_step=0.161, global_step=4908.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  25%|██▌       | 307/1208 [08:47<25:47,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000545, train/loss_step=0.161, global_step=4908.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  25%|██▌       | 307/1208 [08:47<25:47,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0743, train/loss_vlb_step=0.000247, train/loss_step=0.0743, global_step=4908.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  25%|██▌       | 308/1208 [08:50<25:50,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0743, train/loss_vlb_step=0.000247, train/loss_step=0.0743, global_step=4908.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  25%|██▌       | 308/1208 [08:50<25:50,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00185, train/loss_step=0.302, global_step=4908.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  26%|██▌       | 309/1208 [08:51<25:46,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00185, train/loss_step=0.302, global_step=4908.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  26%|██▌       | 309/1208 [08:51<25:47,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0507, train/loss_vlb_step=0.000182, train/loss_step=0.0507, global_step=4909.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  26%|██▌       | 310/1208 [08:52<25:43,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0507, train/loss_vlb_step=0.000182, train/loss_step=0.0507, global_step=4909.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  26%|██▌       | 310/1208 [08:52<25:43,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00168, train/loss_step=0.295, global_step=4909.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  26%|██▌       | 311/1208 [08:53<25:39,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00168, train/loss_step=0.295, global_step=4909.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  26%|██▌       | 311/1208 [08:53<25:39,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.63e-5, train/loss_step=0.00273, global_step=4909.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  26%|██▌       | 312/1208 [08:57<25:42,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.63e-5, train/loss_step=0.00273, global_step=4909.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  26%|██▌       | 312/1208 [08:57<25:42,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.0015, train/loss_step=0.290, global_step=4909.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]     Epoch 16:  26%|██▌       | 313/1208 [08:58<25:38,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.0015, train/loss_step=0.290, global_step=4909.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  26%|██▌       | 313/1208 [08:58<25:38,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0739, train/loss_vlb_step=0.000248, train/loss_step=0.0739, global_step=4910.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  26%|██▌       | 314/1208 [08:59<25:34,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0739, train/loss_vlb_step=0.000248, train/loss_step=0.0739, global_step=4910.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  26%|██▌       | 314/1208 [08:59<25:34,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00101, train/loss_step=0.259, global_step=4910.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  26%|██▌       | 315/1208 [09:00<25:31,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00101, train/loss_step=0.259, global_step=4910.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  26%|██▌       | 315/1208 [09:00<25:31,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000588, train/loss_step=0.171, global_step=4910.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  26%|██▌       | 316/1208 [09:02<25:32,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000588, train/loss_step=0.171, global_step=4910.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  26%|██▌       | 316/1208 [09:02<25:32,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.79e-5, train/loss_step=0.0179, global_step=4910.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  26%|██▌       | 317/1208 [09:04<25:29,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.79e-5, train/loss_step=0.0179, global_step=4910.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  26%|██▌       | 317/1208 [09:04<25:29,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.55e-5, train/loss_step=0.0153, global_step=4911.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  26%|██▋       | 318/1208 [09:05<25:25,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.55e-5, train/loss_step=0.0153, global_step=4911.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  26%|██▋       | 318/1208 [09:05<25:25,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000701, train/loss_step=0.199, global_step=4911.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  26%|██▋       | 319/1208 [09:06<25:21,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000701, train/loss_step=0.199, global_step=4911.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  26%|██▋       | 319/1208 [09:06<25:21,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0629, train/loss_vlb_step=0.000214, train/loss_step=0.0629, global_step=4911.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  26%|██▋       | 320/1208 [09:08<25:23,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0629, train/loss_vlb_step=0.000214, train/loss_step=0.0629, global_step=4911.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  26%|██▋       | 320/1208 [09:08<25:23,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.516, train/loss_vlb_step=0.00746, train/loss_step=0.516, global_step=4911.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  27%|██▋       | 321/1208 [09:09<25:19,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.516, train/loss_vlb_step=0.00746, train/loss_step=0.516, global_step=4911.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  27%|██▋       | 321/1208 [09:09<25:19,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.09e-5, train/loss_step=0.0109, global_step=4912.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  27%|██▋       | 322/1208 [09:10<25:15,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.09e-5, train/loss_step=0.0109, global_step=4912.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  27%|██▋       | 322/1208 [09:10<25:15,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000167, train/loss_step=0.0449, global_step=4912.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  27%|██▋       | 323/1208 [09:11<25:12,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000167, train/loss_step=0.0449, global_step=4912.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  27%|██▋       | 323/1208 [09:11<25:12,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00142, train/loss_step=0.310, global_step=4912.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  27%|██▋       | 324/1208 [09:14<25:13,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00142, train/loss_step=0.310, global_step=4912.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  27%|██▋       | 324/1208 [09:14<25:13,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000924, train/loss_step=0.236, global_step=4912.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  27%|██▋       | 325/1208 [09:15<25:10,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000924, train/loss_step=0.236, global_step=4912.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  27%|██▋       | 325/1208 [09:15<25:10,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.446, train/loss_vlb_step=0.00509, train/loss_step=0.446, global_step=4913.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  27%|██▋       | 326/1208 [09:16<25:06,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.446, train/loss_vlb_step=0.00509, train/loss_step=0.446, global_step=4913.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  27%|██▋       | 326/1208 [09:16<25:06,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0844, train/loss_vlb_step=0.00028, train/loss_step=0.0844, global_step=4913.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  27%|██▋       | 327/1208 [09:17<25:02,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0844, train/loss_vlb_step=0.00028, train/loss_step=0.0844, global_step=4913.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  27%|██▋       | 327/1208 [09:17<25:02,  1.71s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.000113, train/loss_step=0.0292, global_step=4913.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  27%|██▋       | 328/1208 [09:20<25:04,  1.71s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.000113, train/loss_step=0.0292, global_step=4913.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  27%|██▋       | 328/1208 [09:20<25:04,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000116, train/loss_step=0.0295, global_step=4913.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  27%|██▋       | 329/1208 [09:21<25:00,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000116, train/loss_step=0.0295, global_step=4913.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  27%|██▋       | 329/1208 [09:21<25:00,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00875, train/loss_vlb_step=4.34e-5, train/loss_step=0.00875, global_step=4914.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  27%|██▋       | 330/1208 [09:22<24:57,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00875, train/loss_vlb_step=4.34e-5, train/loss_step=0.00875, global_step=4914.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  27%|██▋       | 330/1208 [09:22<24:57,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0557, train/loss_vlb_step=0.000202, train/loss_step=0.0557, global_step=4914.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  27%|██▋       | 331/1208 [09:23<24:53,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0557, train/loss_vlb_step=0.000202, train/loss_step=0.0557, global_step=4914.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  27%|██▋       | 331/1208 [09:23<24:53,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0678, train/loss_vlb_step=0.000228, train/loss_step=0.0678, global_step=4914.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  27%|██▋       | 332/1208 [09:26<24:55,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0678, train/loss_vlb_step=0.000228, train/loss_step=0.0678, global_step=4914.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  27%|██▋       | 332/1208 [09:26<24:55,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0671, train/loss_vlb_step=0.00023, train/loss_step=0.0671, global_step=4914.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  28%|██▊       | 333/1208 [09:27<24:51,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0671, train/loss_vlb_step=0.00023, train/loss_step=0.0671, global_step=4914.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  28%|██▊       | 333/1208 [09:27<24:51,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.84e-5, train/loss_step=0.00341, global_step=4915.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  28%|██▊       | 334/1208 [09:28<24:48,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.84e-5, train/loss_step=0.00341, global_step=4915.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  28%|██▊       | 334/1208 [09:28<24:48,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.614, train/loss_vlb_step=0.0202, train/loss_step=0.614, global_step=4915.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]     Epoch 16:  28%|██▊       | 335/1208 [09:29<24:44,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.614, train/loss_vlb_step=0.0202, train/loss_step=0.614, global_step=4915.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  28%|██▊       | 335/1208 [09:29<24:44,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0481, train/loss_vlb_step=0.000168, train/loss_step=0.0481, global_step=4915.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  28%|██▊       | 336/1208 [09:32<24:45,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0481, train/loss_vlb_step=0.000168, train/loss_step=0.0481, global_step=4915.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  28%|██▊       | 336/1208 [09:32<24:45,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.55e-5, train/loss_step=0.0151, global_step=4915.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  28%|██▊       | 337/1208 [09:33<24:42,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.55e-5, train/loss_step=0.0151, global_step=4915.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  28%|██▊       | 337/1208 [09:33<24:42,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00966, train/loss_vlb_step=4.69e-5, train/loss_step=0.00966, global_step=4916.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  28%|██▊       | 338/1208 [09:34<24:39,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00966, train/loss_vlb_step=4.69e-5, train/loss_step=0.00966, global_step=4916.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  28%|██▊       | 338/1208 [09:34<24:39,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.13e-5, train/loss_step=0.00195, global_step=4916.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  28%|██▊       | 339/1208 [09:35<24:35,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.13e-5, train/loss_step=0.00195, global_step=4916.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  28%|██▊       | 339/1208 [09:35<24:35,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0903, train/loss_vlb_step=0.000299, train/loss_step=0.0903, global_step=4916.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  28%|██▊       | 340/1208 [09:38<24:36,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0903, train/loss_vlb_step=0.000299, train/loss_step=0.0903, global_step=4916.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  28%|██▊       | 340/1208 [09:38<24:36,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00661, train/loss_vlb_step=3.28e-5, train/loss_step=0.00661, global_step=4916.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  28%|██▊       | 341/1208 [09:39<24:33,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00661, train/loss_vlb_step=3.28e-5, train/loss_step=0.00661, global_step=4916.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  28%|██▊       | 341/1208 [09:39<24:33,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0609, train/loss_vlb_step=0.000208, train/loss_step=0.0609, global_step=4917.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  28%|██▊       | 342/1208 [09:40<24:29,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0609, train/loss_vlb_step=0.000208, train/loss_step=0.0609, global_step=4917.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  28%|██▊       | 342/1208 [09:40<24:29,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.000995, train/loss_step=0.253, global_step=4917.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  28%|██▊       | 343/1208 [09:41<24:26,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.000995, train/loss_step=0.253, global_step=4917.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  28%|██▊       | 343/1208 [09:41<24:26,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00298, train/loss_step=0.439, global_step=4917.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  28%|██▊       | 344/1208 [09:44<24:27,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00298, train/loss_step=0.439, global_step=4917.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  28%|██▊       | 344/1208 [09:44<24:27,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.6e-5, train/loss_step=0.0178, global_step=4917.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  29%|██▊       | 345/1208 [09:45<24:24,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.6e-5, train/loss_step=0.0178, global_step=4917.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  29%|██▊       | 345/1208 [09:45<24:24,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.617, train/loss_vlb_step=0.00873, train/loss_step=0.617, global_step=4918.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  29%|██▊       | 346/1208 [09:46<24:21,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.617, train/loss_vlb_step=0.00873, train/loss_step=0.617, global_step=4918.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  29%|██▊       | 346/1208 [09:46<24:21,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000373, train/loss_step=0.113, global_step=4918.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  29%|██▊       | 347/1208 [09:47<24:17,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000373, train/loss_step=0.113, global_step=4918.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  29%|██▊       | 347/1208 [09:47<24:17,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00649, train/loss_vlb_step=3.27e-5, train/loss_step=0.00649, global_step=4918.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  29%|██▉       | 348/1208 [09:50<24:18,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00649, train/loss_vlb_step=3.27e-5, train/loss_step=0.00649, global_step=4918.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  29%|██▉       | 348/1208 [09:50<24:18,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000561, train/loss_step=0.160, global_step=4918.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  29%|██▉       | 349/1208 [09:51<24:15,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000561, train/loss_step=0.160, global_step=4918.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  29%|██▉       | 349/1208 [09:51<24:15,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.53e-5, train/loss_step=0.0231, global_step=4919.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  29%|██▉       | 350/1208 [09:52<24:12,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.53e-5, train/loss_step=0.0231, global_step=4919.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  29%|██▉       | 350/1208 [09:52<24:12,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=4919.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  29%|██▉       | 351/1208 [09:53<24:08,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=4919.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  29%|██▉       | 351/1208 [09:53<24:08,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00188, train/loss_step=0.331, global_step=4919.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  29%|██▉       | 352/1208 [09:56<24:10,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00188, train/loss_step=0.331, global_step=4919.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  29%|██▉       | 352/1208 [09:56<24:10,  1.69s/it, loss=0.161, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00137, train/loss_step=0.295, global_step=4919.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  29%|██▉       | 353/1208 [09:57<24:06,  1.69s/it, loss=0.161, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00137, train/loss_step=0.295, global_step=4919.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  29%|██▉       | 353/1208 [09:57<24:06,  1.69s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00764, train/loss_vlb_step=3.61e-5, train/loss_step=0.00764, global_step=4920.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  29%|██▉       | 354/1208 [09:58<24:03,  1.69s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00764, train/loss_vlb_step=3.61e-5, train/loss_step=0.00764, global_step=4920.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  29%|██▉       | 354/1208 [09:58<24:03,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00132, train/loss_step=0.256, global_step=4920.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  29%|██▉       | 355/1208 [09:59<24:00,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00132, train/loss_step=0.256, global_step=4920.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  29%|██▉       | 355/1208 [09:59<24:00,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000932, train/loss_step=0.227, global_step=4920.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  29%|██▉       | 356/1208 [10:02<24:01,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000932, train/loss_step=0.227, global_step=4920.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  29%|██▉       | 356/1208 [10:02<24:01,  1.69s/it, loss=0.154, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.000135, train/loss_step=0.038, global_step=4920.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  30%|██▉       | 357/1208 [10:03<23:57,  1.69s/it, loss=0.154, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.000135, train/loss_step=0.038, global_step=4920.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  30%|██▉       | 357/1208 [10:03<23:57,  1.69s/it, loss=0.166, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00108, train/loss_step=0.252, global_step=4921.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  30%|██▉       | 358/1208 [10:04<23:54,  1.69s/it, loss=0.166, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00108, train/loss_step=0.252, global_step=4921.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  30%|██▉       | 358/1208 [10:04<23:54,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000128, train/loss_step=0.0335, global_step=4921.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  30%|██▉       | 359/1208 [10:05<23:51,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000128, train/loss_step=0.0335, global_step=4921.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  30%|██▉       | 359/1208 [10:05<23:51,  1.69s/it, loss=0.181, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00269, train/loss_step=0.368, global_step=4921.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  30%|██▉       | 360/1208 [10:08<23:52,  1.69s/it, loss=0.181, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00269, train/loss_step=0.368, global_step=4921.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  30%|██▉       | 360/1208 [10:08<23:52,  1.69s/it, loss=0.194, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00104, train/loss_step=0.269, global_step=4921.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  30%|██▉       | 361/1208 [10:09<23:49,  1.69s/it, loss=0.194, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00104, train/loss_step=0.269, global_step=4921.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  30%|██▉       | 361/1208 [10:09<23:49,  1.69s/it, loss=0.191, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.44e-5, train/loss_step=0.00241, global_step=4922.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  30%|██▉       | 362/1208 [10:10<23:45,  1.69s/it, loss=0.191, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.44e-5, train/loss_step=0.00241, global_step=4922.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  30%|██▉       | 362/1208 [10:10<23:45,  1.69s/it, loss=0.188, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000641, train/loss_step=0.182, global_step=4922.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  30%|███       | 363/1208 [10:11<23:42,  1.68s/it, loss=0.188, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000641, train/loss_step=0.182, global_step=4922.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  30%|███       | 363/1208 [10:11<23:42,  1.68s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.41e-5, train/loss_step=0.0179, global_step=4922.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  30%|███       | 364/1208 [10:14<23:43,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.41e-5, train/loss_step=0.0179, global_step=4922.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  30%|███       | 364/1208 [10:14<23:43,  1.69s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000144, train/loss_step=0.0387, global_step=4922.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  30%|███       | 365/1208 [10:15<23:40,  1.69s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000144, train/loss_step=0.0387, global_step=4922.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  30%|███       | 365/1208 [10:15<23:40,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0472, train/loss_vlb_step=0.000168, train/loss_step=0.0472, global_step=4923.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  30%|███       | 366/1208 [10:16<23:37,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0472, train/loss_vlb_step=0.000168, train/loss_step=0.0472, global_step=4923.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  30%|███       | 366/1208 [10:16<23:37,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.00053, train/loss_step=0.159, global_step=4923.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  30%|███       | 367/1208 [10:17<23:34,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.00053, train/loss_step=0.159, global_step=4923.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  30%|███       | 367/1208 [10:17<23:34,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=5.67e-5, train/loss_step=0.014, global_step=4923.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  30%|███       | 368/1208 [10:19<23:35,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=5.67e-5, train/loss_step=0.014, global_step=4923.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  30%|███       | 368/1208 [10:19<23:35,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000387, train/loss_step=0.114, global_step=4923.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  31%|███       | 369/1208 [10:20<23:31,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000387, train/loss_step=0.114, global_step=4923.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  31%|███       | 369/1208 [10:20<23:31,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00835, train/loss_vlb_step=4.06e-5, train/loss_step=0.00835, global_step=4924.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  31%|███       | 370/1208 [10:21<23:28,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00835, train/loss_vlb_step=4.06e-5, train/loss_step=0.00835, global_step=4924.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  31%|███       | 370/1208 [10:21<23:28,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0538, train/loss_vlb_step=0.000191, train/loss_step=0.0538, global_step=4924.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  31%|███       | 371/1208 [10:23<23:25,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0538, train/loss_vlb_step=0.000191, train/loss_step=0.0538, global_step=4924.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  31%|███       | 371/1208 [10:23<23:25,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000966, train/loss_step=0.234, global_step=4924.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  31%|███       | 372/1208 [10:25<23:26,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000966, train/loss_step=0.234, global_step=4924.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  31%|███       | 372/1208 [10:25<23:26,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000574, train/loss_step=0.168, global_step=4924.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  31%|███       | 373/1208 [10:26<23:23,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000574, train/loss_step=0.168, global_step=4924.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  31%|███       | 373/1208 [10:26<23:23,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000822, train/loss_step=0.223, global_step=4925.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  31%|███       | 374/1208 [10:27<23:20,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000822, train/loss_step=0.223, global_step=4925.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  31%|███       | 374/1208 [10:27<23:20,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000531, train/loss_step=0.157, global_step=4925.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  31%|███       | 375/1208 [10:28<23:17,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000531, train/loss_step=0.157, global_step=4925.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  31%|███       | 375/1208 [10:28<23:17,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.464, train/loss_vlb_step=0.00393, train/loss_step=0.464, global_step=4925.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  31%|███       | 376/1208 [10:31<23:18,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.464, train/loss_vlb_step=0.00393, train/loss_step=0.464, global_step=4925.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  31%|███       | 376/1208 [10:31<23:18,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0455, train/loss_vlb_step=0.000165, train/loss_step=0.0455, global_step=4925.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  31%|███       | 377/1208 [10:32<23:14,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0455, train/loss_vlb_step=0.000165, train/loss_step=0.0455, global_step=4925.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  31%|███       | 377/1208 [10:32<23:14,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.82e-5, train/loss_step=0.0134, global_step=4926.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  31%|███▏      | 378/1208 [10:33<23:11,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.82e-5, train/loss_step=0.0134, global_step=4926.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  31%|███▏      | 378/1208 [10:33<23:11,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00193, train/loss_step=0.356, global_step=4926.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  31%|███▏      | 379/1208 [10:34<23:08,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00193, train/loss_step=0.356, global_step=4926.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  31%|███▏      | 379/1208 [10:34<23:08,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.73e-5, train/loss_step=0.0216, global_step=4926.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  31%|███▏      | 380/1208 [10:37<23:09,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.73e-5, train/loss_step=0.0216, global_step=4926.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  31%|███▏      | 380/1208 [10:37<23:09,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.598, train/loss_vlb_step=0.00906, train/loss_step=0.598, global_step=4926.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  32%|███▏      | 381/1208 [10:38<23:06,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.598, train/loss_vlb_step=0.00906, train/loss_step=0.598, global_step=4926.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  32%|███▏      | 381/1208 [10:38<23:06,  1.68s/it, loss=0.171, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.00795, train/loss_step=0.512, global_step=4927.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  32%|███▏      | 382/1208 [10:39<23:03,  1.67s/it, loss=0.171, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.00795, train/loss_step=0.512, global_step=4927.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  32%|███▏      | 382/1208 [10:39<23:03,  1.67s/it, loss=0.176, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.0014, train/loss_step=0.277, global_step=4927.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  32%|███▏      | 383/1208 [10:40<23:00,  1.67s/it, loss=0.176, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.0014, train/loss_step=0.277, global_step=4927.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  32%|███▏      | 383/1208 [10:40<23:00,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.005, train/loss_vlb_step=2.59e-5, train/loss_step=0.005, global_step=4927.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  32%|███▏      | 384/1208 [10:43<23:01,  1.68s/it, loss=0.175, v_num=0, train/loss_simple_step=0.005, train/loss_vlb_step=2.59e-5, train/loss_step=0.005, global_step=4927.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  32%|███▏      | 384/1208 [10:43<23:01,  1.68s/it, loss=0.191, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00217, train/loss_step=0.349, global_step=4927.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  32%|███▏      | 385/1208 [10:44<22:58,  1.67s/it, loss=0.191, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00217, train/loss_step=0.349, global_step=4927.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  32%|███▏      | 385/1208 [10:44<22:58,  1.67s/it, loss=0.206, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.0028, train/loss_step=0.345, global_step=4928.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  32%|███▏      | 386/1208 [10:45<22:55,  1.67s/it, loss=0.206, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.0028, train/loss_step=0.345, global_step=4928.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  32%|███▏      | 386/1208 [10:45<22:55,  1.67s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000146, train/loss_step=0.0407, global_step=4928.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  32%|███▏      | 387/1208 [10:46<22:51,  1.67s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000146, train/loss_step=0.0407, global_step=4928.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  32%|███▏      | 387/1208 [10:46<22:51,  1.67s/it, loss=0.208, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000692, train/loss_step=0.183, global_step=4928.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  32%|███▏      | 388/1208 [10:49<22:52,  1.67s/it, loss=0.208, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000692, train/loss_step=0.183, global_step=4928.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  32%|███▏      | 388/1208 [10:49<22:52,  1.67s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0933, train/loss_vlb_step=0.000307, train/loss_step=0.0933, global_step=4928.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  32%|███▏      | 389/1208 [10:50<22:49,  1.67s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0933, train/loss_vlb_step=0.000307, train/loss_step=0.0933, global_step=4928.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  32%|███▏      | 389/1208 [10:50<22:49,  1.67s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.000122, train/loss_step=0.0313, global_step=4929.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  32%|███▏      | 390/1208 [10:51<22:46,  1.67s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.000122, train/loss_step=0.0313, global_step=4929.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  32%|███▏      | 390/1208 [10:51<22:46,  1.67s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0806, train/loss_vlb_step=0.000266, train/loss_step=0.0806, global_step=4929.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  32%|███▏      | 391/1208 [10:52<22:43,  1.67s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0806, train/loss_vlb_step=0.000266, train/loss_step=0.0806, global_step=4929.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  32%|███▏      | 391/1208 [10:52<22:43,  1.67s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=8.03e-6, train/loss_step=0.00133, global_step=4929.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  32%|███▏      | 392/1208 [10:55<22:44,  1.67s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=8.03e-6, train/loss_step=0.00133, global_step=4929.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  32%|███▏      | 392/1208 [10:55<22:44,  1.67s/it, loss=0.19, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=2.05e-5, train/loss_step=0.00366, global_step=4929.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  33%|███▎      | 393/1208 [10:56<22:41,  1.67s/it, loss=0.19, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=2.05e-5, train/loss_step=0.00366, global_step=4929.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  33%|███▎      | 393/1208 [10:56<22:41,  1.67s/it, loss=0.19, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000808, train/loss_step=0.221, global_step=4930.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  33%|███▎      | 394/1208 [10:57<22:38,  1.67s/it, loss=0.19, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000808, train/loss_step=0.221, global_step=4930.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  33%|███▎      | 394/1208 [10:57<22:38,  1.67s/it, loss=0.218, v_num=0, train/loss_simple_step=0.729, train/loss_vlb_step=0.0377, train/loss_step=0.729, global_step=4930.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  33%|███▎      | 395/1208 [10:58<22:35,  1.67s/it, loss=0.218, v_num=0, train/loss_simple_step=0.729, train/loss_vlb_step=0.0377, train/loss_step=0.729, global_step=4930.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  33%|███▎      | 395/1208 [10:58<22:35,  1.67s/it, loss=0.224, v_num=0, train/loss_simple_step=0.577, train/loss_vlb_step=0.00816, train/loss_step=0.577, global_step=4930.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  33%|███▎      | 396/1208 [11:01<22:36,  1.67s/it, loss=0.224, v_num=0, train/loss_simple_step=0.577, train/loss_vlb_step=0.00816, train/loss_step=0.577, global_step=4930.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  33%|███▎      | 396/1208 [11:01<22:36,  1.67s/it, loss=0.222, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=2.13e-5, train/loss_step=0.00384, global_step=4930.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  33%|███▎      | 397/1208 [11:02<22:33,  1.67s/it, loss=0.222, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=2.13e-5, train/loss_step=0.00384, global_step=4930.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  33%|███▎      | 397/1208 [11:02<22:33,  1.67s/it, loss=0.226, v_num=0, train/loss_simple_step=0.0948, train/loss_vlb_step=0.000312, train/loss_step=0.0948, global_step=4931.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  33%|███▎      | 398/1208 [11:03<22:30,  1.67s/it, loss=0.226, v_num=0, train/loss_simple_step=0.0948, train/loss_vlb_step=0.000312, train/loss_step=0.0948, global_step=4931.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  33%|███▎      | 398/1208 [11:03<22:30,  1.67s/it, loss=0.209, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.46e-5, train/loss_step=0.00475, global_step=4931.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  33%|███▎      | 399/1208 [11:04<22:27,  1.67s/it, loss=0.209, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.46e-5, train/loss_step=0.00475, global_step=4931.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  33%|███▎      | 399/1208 [11:04<22:27,  1.67s/it, loss=0.216, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000533, train/loss_step=0.162, global_step=4931.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  33%|███▎      | 400/1208 [11:07<22:28,  1.67s/it, loss=0.216, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000533, train/loss_step=0.162, global_step=4931.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  33%|███▎      | 400/1208 [11:07<22:28,  1.67s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.78e-5, train/loss_step=0.0148, global_step=4931.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  33%|███▎      | 401/1208 [11:08<22:25,  1.67s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.78e-5, train/loss_step=0.0148, global_step=4931.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  33%|███▎      | 401/1208 [11:08<22:25,  1.67s/it, loss=0.177, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00157, train/loss_step=0.324, global_step=4932.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  33%|███▎      | 402/1208 [11:09<22:22,  1.67s/it, loss=0.177, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00157, train/loss_step=0.324, global_step=4932.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  33%|███▎      | 402/1208 [11:09<22:22,  1.67s/it, loss=0.208, v_num=0, train/loss_simple_step=0.902, train/loss_vlb_step=0.228, train/loss_step=0.902, global_step=4932.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  33%|███▎      | 403/1208 [11:10<22:19,  1.66s/it, loss=0.208, v_num=0, train/loss_simple_step=0.902, train/loss_vlb_step=0.228, train/loss_step=0.902, global_step=4932.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  33%|███▎      | 403/1208 [11:10<22:19,  1.66s/it, loss=0.214, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000399, train/loss_step=0.121, global_step=4932.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  33%|███▎      | 404/1208 [11:13<22:19,  1.67s/it, loss=0.214, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000399, train/loss_step=0.121, global_step=4932.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  33%|███▎      | 404/1208 [11:13<22:19,  1.67s/it, loss=0.225, v_num=0, train/loss_simple_step=0.569, train/loss_vlb_step=0.0187, train/loss_step=0.569, global_step=4932.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  34%|███▎      | 405/1208 [11:14<22:16,  1.66s/it, loss=0.225, v_num=0, train/loss_simple_step=0.569, train/loss_vlb_step=0.0187, train/loss_step=0.569, global_step=4932.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  34%|███▎      | 405/1208 [11:14<22:16,  1.66s/it, loss=0.233, v_num=0, train/loss_simple_step=0.503, train/loss_vlb_step=0.00396, train/loss_step=0.503, global_step=4933.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  34%|███▎      | 406/1208 [11:15<22:13,  1.66s/it, loss=0.233, v_num=0, train/loss_simple_step=0.503, train/loss_vlb_step=0.00396, train/loss_step=0.503, global_step=4933.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  34%|███▎      | 406/1208 [11:15<22:13,  1.66s/it, loss=0.232, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.78e-5, train/loss_step=0.0186, global_step=4933.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  34%|███▎      | 407/1208 [11:16<22:11,  1.66s/it, loss=0.232, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.78e-5, train/loss_step=0.0186, global_step=4933.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  34%|███▎      | 407/1208 [11:16<22:11,  1.66s/it, loss=0.23, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000497, train/loss_step=0.147, global_step=4933.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  34%|███▍      | 408/1208 [11:19<22:11,  1.66s/it, loss=0.23, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000497, train/loss_step=0.147, global_step=4933.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  34%|███▍      | 408/1208 [11:19<22:11,  1.66s/it, loss=0.226, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=2.42e-5, train/loss_step=0.0046, global_step=4933.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  34%|███▍      | 409/1208 [11:20<22:08,  1.66s/it, loss=0.226, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=2.42e-5, train/loss_step=0.0046, global_step=4933.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  34%|███▍      | 409/1208 [11:20<22:08,  1.66s/it, loss=0.233, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000719, train/loss_step=0.189, global_step=4934.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  34%|███▍      | 410/1208 [11:21<22:05,  1.66s/it, loss=0.233, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000719, train/loss_step=0.189, global_step=4934.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  34%|███▍      | 410/1208 [11:21<22:05,  1.66s/it, loss=0.23, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.68e-5, train/loss_step=0.00304, global_step=4934.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  34%|███▍      | 411/1208 [11:22<22:02,  1.66s/it, loss=0.23, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.68e-5, train/loss_step=0.00304, global_step=4934.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  34%|███▍      | 411/1208 [11:22<22:02,  1.66s/it, loss=0.23, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.67e-5, train/loss_step=0.0102, global_step=4934.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  34%|███▍      | 412/1208 [11:25<22:03,  1.66s/it, loss=0.23, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.67e-5, train/loss_step=0.0102, global_step=4934.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  34%|███▍      | 412/1208 [11:25<22:03,  1.66s/it, loss=0.244, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00187, train/loss_step=0.286, global_step=4934.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  34%|███▍      | 413/1208 [11:26<22:00,  1.66s/it, loss=0.244, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00187, train/loss_step=0.286, global_step=4934.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  34%|███▍      | 413/1208 [11:26<22:00,  1.66s/it, loss=0.246, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00115, train/loss_step=0.265, global_step=4935.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  34%|███▍      | 414/1208 [11:27<21:57,  1.66s/it, loss=0.246, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00115, train/loss_step=0.265, global_step=4935.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  34%|███▍      | 414/1208 [11:27<21:57,  1.66s/it, loss=0.215, v_num=0, train/loss_simple_step=0.0995, train/loss_vlb_step=0.000327, train/loss_step=0.0995, global_step=4935.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  34%|███▍      | 415/1208 [11:28<21:54,  1.66s/it, loss=0.215, v_num=0, train/loss_simple_step=0.0995, train/loss_vlb_step=0.000327, train/loss_step=0.0995, global_step=4935.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  34%|███▍      | 415/1208 [11:28<21:54,  1.66s/it, loss=0.21, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00318, train/loss_step=0.476, global_step=4935.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  34%|███▍      | 416/1208 [11:31<21:55,  1.66s/it, loss=0.21, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00318, train/loss_step=0.476, global_step=4935.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  34%|███▍      | 416/1208 [11:31<21:55,  1.66s/it, loss=0.213, v_num=0, train/loss_simple_step=0.0679, train/loss_vlb_step=0.000233, train/loss_step=0.0679, global_step=4935.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  35%|███▍      | 417/1208 [11:32<21:52,  1.66s/it, loss=0.213, v_num=0, train/loss_simple_step=0.0679, train/loss_vlb_step=0.000233, train/loss_step=0.0679, global_step=4935.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  35%|███▍      | 417/1208 [11:32<21:52,  1.66s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000117, train/loss_step=0.0307, global_step=4936.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  35%|███▍      | 418/1208 [11:33<21:49,  1.66s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000117, train/loss_step=0.0307, global_step=4936.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  35%|███▍      | 418/1208 [11:33<21:49,  1.66s/it, loss=0.226, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00181, train/loss_step=0.332, global_step=4936.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  35%|███▍      | 419/1208 [11:34<21:46,  1.66s/it, loss=0.226, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00181, train/loss_step=0.332, global_step=4936.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  35%|███▍      | 419/1208 [11:34<21:46,  1.66s/it, loss=0.231, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00111, train/loss_step=0.254, global_step=4936.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  35%|███▍      | 420/1208 [11:36<21:47,  1.66s/it, loss=0.231, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00111, train/loss_step=0.254, global_step=4936.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  35%|███▍      | 420/1208 [11:36<21:47,  1.66s/it, loss=0.236, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.00038, train/loss_step=0.116, global_step=4936.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  35%|███▍      | 421/1208 [11:37<21:44,  1.66s/it, loss=0.236, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.00038, train/loss_step=0.116, global_step=4936.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  35%|███▍      | 421/1208 [11:37<21:44,  1.66s/it, loss=0.22, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.13e-5, train/loss_step=0.00192, global_step=4937.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  35%|███▍      | 422/1208 [11:38<21:41,  1.66s/it, loss=0.22, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.13e-5, train/loss_step=0.00192, global_step=4937.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  35%|███▍      | 422/1208 [11:38<21:41,  1.66s/it, loss=0.182, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.00046, train/loss_step=0.137, global_step=4937.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  35%|███▌      | 423/1208 [11:39<21:39,  1.65s/it, loss=0.182, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.00046, train/loss_step=0.137, global_step=4937.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  35%|███▌      | 423/1208 [11:39<21:39,  1.65s/it, loss=0.184, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000594, train/loss_step=0.173, global_step=4937.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  35%|███▌      | 424/1208 [11:42<21:39,  1.66s/it, loss=0.184, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000594, train/loss_step=0.173, global_step=4937.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  35%|███▌      | 424/1208 [11:42<21:39,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=1.08e-5, train/loss_step=0.00183, global_step=4937.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  35%|███▌      | 425/1208 [11:43<21:36,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=1.08e-5, train/loss_step=0.00183, global_step=4937.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  35%|███▌      | 425/1208 [11:43<21:36,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.48e-5, train/loss_step=0.00255, global_step=4938.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  35%|███▌      | 426/1208 [11:44<21:33,  1.65s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.48e-5, train/loss_step=0.00255, global_step=4938.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  35%|███▌      | 426/1208 [11:44<21:33,  1.65s/it, loss=0.136, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.00041, train/loss_step=0.124, global_step=4938.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  35%|███▌      | 427/1208 [11:45<21:31,  1.65s/it, loss=0.136, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.00041, train/loss_step=0.124, global_step=4938.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  35%|███▌      | 427/1208 [11:45<21:31,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.1e-5, train/loss_step=0.00191, global_step=4938.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  35%|███▌      | 428/1208 [11:48<21:31,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.1e-5, train/loss_step=0.00191, global_step=4938.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  35%|███▌      | 428/1208 [11:48<21:31,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0504, train/loss_vlb_step=0.000176, train/loss_step=0.0504, global_step=4938.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  36%|███▌      | 429/1208 [11:49<21:28,  1.65s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0504, train/loss_vlb_step=0.000176, train/loss_step=0.0504, global_step=4938.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  36%|███▌      | 429/1208 [11:49<21:28,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000457, train/loss_step=0.137, global_step=4939.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  36%|███▌      | 430/1208 [11:50<21:25,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000457, train/loss_step=0.137, global_step=4939.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  36%|███▌      | 430/1208 [11:50<21:25,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.65e-5, train/loss_step=0.0161, global_step=4939.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  36%|███▌      | 431/1208 [11:51<21:23,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.65e-5, train/loss_step=0.0161, global_step=4939.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  36%|███▌      | 431/1208 [11:51<21:23,  1.65s/it, loss=0.142, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.0012, train/loss_step=0.257, global_step=4939.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  36%|███▌      | 432/1208 [11:54<21:23,  1.65s/it, loss=0.142, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.0012, train/loss_step=0.257, global_step=4939.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  36%|███▌      | 432/1208 [11:54<21:23,  1.65s/it, loss=0.14, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00104, train/loss_step=0.248, global_step=4939.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  36%|███▌      | 433/1208 [11:55<21:20,  1.65s/it, loss=0.14, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00104, train/loss_step=0.248, global_step=4939.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  36%|███▌      | 433/1208 [11:55<21:20,  1.65s/it, loss=0.135, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000646, train/loss_step=0.174, global_step=4940.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  36%|███▌      | 434/1208 [11:56<21:18,  1.65s/it, loss=0.135, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000646, train/loss_step=0.174, global_step=4940.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  36%|███▌      | 434/1208 [11:56<21:18,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000608, train/loss_step=0.181, global_step=4940.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  36%|███▌      | 435/1208 [11:57<21:15,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000608, train/loss_step=0.181, global_step=4940.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  36%|███▌      | 435/1208 [11:57<21:15,  1.65s/it, loss=0.149, v_num=0, train/loss_simple_step=0.678, train/loss_vlb_step=0.0294, train/loss_step=0.678, global_step=4940.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  36%|███▌      | 436/1208 [12:00<21:15,  1.65s/it, loss=0.149, v_num=0, train/loss_simple_step=0.678, train/loss_vlb_step=0.0294, train/loss_step=0.678, global_step=4940.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  36%|███▌      | 436/1208 [12:00<21:15,  1.65s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0977, train/loss_vlb_step=0.000326, train/loss_step=0.0977, global_step=4940.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  36%|███▌      | 437/1208 [12:01<21:13,  1.65s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0977, train/loss_vlb_step=0.000326, train/loss_step=0.0977, global_step=4940.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  36%|███▌      | 437/1208 [12:01<21:13,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.000215, train/loss_step=0.0615, global_step=4941.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  36%|███▋      | 438/1208 [12:02<21:10,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.000215, train/loss_step=0.0615, global_step=4941.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  36%|███▋      | 438/1208 [12:02<21:10,  1.65s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0879, train/loss_vlb_step=0.000289, train/loss_step=0.0879, global_step=4941.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  36%|███▋      | 439/1208 [12:03<21:07,  1.65s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0879, train/loss_vlb_step=0.000289, train/loss_step=0.0879, global_step=4941.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  36%|███▋      | 439/1208 [12:03<21:07,  1.65s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00479, train/loss_vlb_step=2.51e-5, train/loss_step=0.00479, global_step=4941.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  36%|███▋      | 440/1208 [12:06<21:08,  1.65s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00479, train/loss_vlb_step=2.51e-5, train/loss_step=0.00479, global_step=4941.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  36%|███▋      | 440/1208 [12:06<21:08,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0819, train/loss_vlb_step=0.00027, train/loss_step=0.0819, global_step=4941.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  37%|███▋      | 441/1208 [12:07<21:05,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0819, train/loss_vlb_step=0.00027, train/loss_step=0.0819, global_step=4941.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  37%|███▋      | 441/1208 [12:07<21:05,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00105, train/loss_step=0.262, global_step=4942.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  37%|███▋      | 442/1208 [12:08<21:02,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00105, train/loss_step=0.262, global_step=4942.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  37%|███▋      | 442/1208 [12:08<21:02,  1.65s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.4e-5, train/loss_step=0.00249, global_step=4942.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  37%|███▋      | 443/1208 [12:09<20:59,  1.65s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.4e-5, train/loss_step=0.00249, global_step=4942.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  37%|███▋      | 443/1208 [12:09<20:59,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.00428, train/loss_step=0.406, global_step=4942.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  37%|███▋      | 444/1208 [12:12<21:00,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.00428, train/loss_step=0.406, global_step=4942.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  37%|███▋      | 444/1208 [12:12<21:00,  1.65s/it, loss=0.168, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.0118, train/loss_step=0.485, global_step=4942.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  37%|███▋      | 445/1208 [12:13<20:57,  1.65s/it, loss=0.168, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.0118, train/loss_step=0.485, global_step=4942.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  37%|███▋      | 445/1208 [12:13<20:57,  1.65s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=0.000101, train/loss_step=0.0246, global_step=4943.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  37%|███▋      | 446/1208 [12:14<20:54,  1.65s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=0.000101, train/loss_step=0.0246, global_step=4943.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  37%|███▋      | 446/1208 [12:14<20:54,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6.29e-5, train/loss_step=0.0135, global_step=4943.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  37%|███▋      | 447/1208 [12:15<20:52,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6.29e-5, train/loss_step=0.0135, global_step=4943.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  37%|███▋      | 447/1208 [12:15<20:52,  1.65s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0994, train/loss_vlb_step=0.000328, train/loss_step=0.0994, global_step=4943.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  37%|███▋      | 448/1208 [12:18<20:52,  1.65s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0994, train/loss_vlb_step=0.000328, train/loss_step=0.0994, global_step=4943.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  37%|███▋      | 448/1208 [12:18<20:52,  1.65s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000106, train/loss_step=0.0278, global_step=4943.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  37%|███▋      | 449/1208 [12:19<20:49,  1.65s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000106, train/loss_step=0.0278, global_step=4943.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  37%|███▋      | 449/1208 [12:19<20:49,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0318, train/loss_vlb_step=0.000122, train/loss_step=0.0318, global_step=4944.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  37%|███▋      | 450/1208 [12:20<20:47,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0318, train/loss_vlb_step=0.000122, train/loss_step=0.0318, global_step=4944.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  37%|███▋      | 450/1208 [12:20<20:47,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000105, train/loss_step=0.0269, global_step=4944.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  37%|███▋      | 451/1208 [12:21<20:44,  1.64s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000105, train/loss_step=0.0269, global_step=4944.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  37%|███▋      | 451/1208 [12:21<20:44,  1.64s/it, loss=0.175, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00817, train/loss_step=0.499, global_step=4944.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  37%|███▋      | 452/1208 [12:24<20:44,  1.65s/it, loss=0.175, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00817, train/loss_step=0.499, global_step=4944.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  37%|███▋      | 452/1208 [12:24<20:44,  1.65s/it, loss=0.167, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.00033, train/loss_step=0.101, global_step=4944.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  38%|███▊      | 453/1208 [12:25<20:42,  1.65s/it, loss=0.167, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.00033, train/loss_step=0.101, global_step=4944.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  38%|███▊      | 453/1208 [12:25<20:42,  1.65s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.57e-5, train/loss_step=0.00277, global_step=4945.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  38%|███▊      | 454/1208 [12:26<20:39,  1.64s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.57e-5, train/loss_step=0.00277, global_step=4945.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  38%|███▊      | 454/1208 [12:26<20:39,  1.64s/it, loss=0.157, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000505, train/loss_step=0.143, global_step=4945.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  38%|███▊      | 455/1208 [12:27<20:36,  1.64s/it, loss=0.157, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000505, train/loss_step=0.143, global_step=4945.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  38%|███▊      | 455/1208 [12:27<20:36,  1.64s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.38e-5, train/loss_step=0.0197, global_step=4945.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  38%|███▊      | 456/1208 [12:30<20:37,  1.65s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.38e-5, train/loss_step=0.0197, global_step=4945.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  38%|███▊      | 456/1208 [12:30<20:37,  1.65s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.85e-5, train/loss_step=0.00344, global_step=4945.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  38%|███▊      | 457/1208 [12:31<20:34,  1.64s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.85e-5, train/loss_step=0.00344, global_step=4945.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  38%|███▊      | 457/1208 [12:31<20:34,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00173, train/loss_step=0.331, global_step=4946.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  38%|███▊      | 458/1208 [12:32<20:31,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00173, train/loss_step=0.331, global_step=4946.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  38%|███▊      | 458/1208 [12:32<20:31,  1.64s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=2.49e-5, train/loss_step=0.00492, global_step=4946.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  38%|███▊      | 459/1208 [12:33<20:29,  1.64s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=2.49e-5, train/loss_step=0.00492, global_step=4946.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  38%|███▊      | 459/1208 [12:33<20:29,  1.64s/it, loss=0.142, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00117, train/loss_step=0.274, global_step=4946.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  38%|███▊      | 460/1208 [12:36<20:29,  1.64s/it, loss=0.142, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00117, train/loss_step=0.274, global_step=4946.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  38%|███▊      | 460/1208 [12:36<20:29,  1.64s/it, loss=0.146, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000528, train/loss_step=0.157, global_step=4946.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  38%|███▊      | 461/1208 [12:37<20:26,  1.64s/it, loss=0.146, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000528, train/loss_step=0.157, global_step=4946.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  38%|███▊      | 461/1208 [12:37<20:26,  1.64s/it, loss=0.141, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000574, train/loss_step=0.166, global_step=4947.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  38%|███▊      | 462/1208 [12:38<20:24,  1.64s/it, loss=0.141, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000574, train/loss_step=0.166, global_step=4947.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  38%|███▊      | 462/1208 [12:38<20:24,  1.64s/it, loss=0.144, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.000225, train/loss_step=0.067, global_step=4947.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  38%|███▊      | 463/1208 [12:39<20:21,  1.64s/it, loss=0.144, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.000225, train/loss_step=0.067, global_step=4947.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  38%|███▊      | 463/1208 [12:39<20:21,  1.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00156, train/loss_step=0.286, global_step=4947.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  38%|███▊      | 464/1208 [12:42<20:21,  1.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00156, train/loss_step=0.286, global_step=4947.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  38%|███▊      | 464/1208 [12:42<20:21,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.531, train/loss_vlb_step=0.00664, train/loss_step=0.531, global_step=4947.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  38%|███▊      | 465/1208 [12:43<20:19,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.531, train/loss_vlb_step=0.00664, train/loss_step=0.531, global_step=4947.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  38%|███▊      | 465/1208 [12:43<20:19,  1.64s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0533, train/loss_vlb_step=0.00019, train/loss_step=0.0533, global_step=4948.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  39%|███▊      | 466/1208 [12:44<20:16,  1.64s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0533, train/loss_vlb_step=0.00019, train/loss_step=0.0533, global_step=4948.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  39%|███▊      | 466/1208 [12:44<20:16,  1.64s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000144, train/loss_step=0.0381, global_step=4948.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  39%|███▊      | 467/1208 [12:45<20:13,  1.64s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000144, train/loss_step=0.0381, global_step=4948.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  39%|███▊      | 467/1208 [12:45<20:13,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00648, train/loss_vlb_step=3.21e-5, train/loss_step=0.00648, global_step=4948.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  39%|███▊      | 468/1208 [12:47<20:14,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00648, train/loss_vlb_step=3.21e-5, train/loss_step=0.00648, global_step=4948.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  39%|███▊      | 468/1208 [12:47<20:14,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0643, train/loss_vlb_step=0.00022, train/loss_step=0.0643, global_step=4948.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  39%|███▉      | 469/1208 [12:48<20:11,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0643, train/loss_vlb_step=0.00022, train/loss_step=0.0643, global_step=4948.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  39%|███▉      | 469/1208 [12:48<20:11,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00307, train/loss_vlb_step=1.72e-5, train/loss_step=0.00307, global_step=4949.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  39%|███▉      | 470/1208 [12:49<20:09,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00307, train/loss_vlb_step=1.72e-5, train/loss_step=0.00307, global_step=4949.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  39%|███▉      | 470/1208 [12:49<20:09,  1.64s/it, loss=0.147, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000677, train/loss_step=0.192, global_step=4949.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  39%|███▉      | 471/1208 [12:50<20:06,  1.64s/it, loss=0.147, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000677, train/loss_step=0.192, global_step=4949.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  39%|███▉      | 471/1208 [12:50<20:06,  1.64s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=2.52e-5, train/loss_step=0.00492, global_step=4949.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  39%|███▉      | 472/1208 [12:53<20:06,  1.64s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=2.52e-5, train/loss_step=0.00492, global_step=4949.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  39%|███▉      | 472/1208 [12:53<20:06,  1.64s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.03e-5, train/loss_step=0.00173, global_step=4949.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  39%|███▉      | 473/1208 [12:54<20:04,  1.64s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.03e-5, train/loss_step=0.00173, global_step=4949.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  39%|███▉      | 473/1208 [12:54<20:04,  1.64s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.33e-5, train/loss_step=0.0241, global_step=4950.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  39%|███▉      | 474/1208 [12:55<20:01,  1.64s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.33e-5, train/loss_step=0.0241, global_step=4950.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  39%|███▉      | 474/1208 [12:55<20:01,  1.64s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=9.87e-5, train/loss_step=0.0249, global_step=4950.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  39%|███▉      | 475/1208 [12:56<19:58,  1.64s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=9.87e-5, train/loss_step=0.0249, global_step=4950.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  39%|███▉      | 475/1208 [12:56<19:58,  1.64s/it, loss=0.12, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000596, train/loss_step=0.171, global_step=4950.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  39%|███▉      | 476/1208 [12:59<19:59,  1.64s/it, loss=0.12, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000596, train/loss_step=0.171, global_step=4950.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  39%|███▉      | 476/1208 [12:59<19:59,  1.64s/it, loss=0.142, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00554, train/loss_step=0.435, global_step=4950.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  39%|███▉      | 477/1208 [13:00<19:56,  1.64s/it, loss=0.142, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00554, train/loss_step=0.435, global_step=4950.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  39%|███▉      | 477/1208 [13:00<19:56,  1.64s/it, loss=0.148, v_num=0, train/loss_simple_step=0.456, train/loss_vlb_step=0.00405, train/loss_step=0.456, global_step=4951.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  40%|███▉      | 478/1208 [13:01<19:53,  1.64s/it, loss=0.148, v_num=0, train/loss_simple_step=0.456, train/loss_vlb_step=0.00405, train/loss_step=0.456, global_step=4951.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  40%|███▉      | 478/1208 [13:01<19:54,  1.64s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000162, train/loss_step=0.0448, global_step=4951.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  40%|███▉      | 479/1208 [13:02<19:51,  1.63s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000162, train/loss_step=0.0448, global_step=4951.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  40%|███▉      | 479/1208 [13:02<19:51,  1.63s/it, loss=0.148, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000875, train/loss_step=0.230, global_step=4951.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  40%|███▉      | 480/1208 [13:05<19:51,  1.64s/it, loss=0.148, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000875, train/loss_step=0.230, global_step=4951.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  40%|███▉      | 480/1208 [13:05<19:51,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00543, train/loss_vlb_step=2.7e-5, train/loss_step=0.00543, global_step=4951.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  40%|███▉      | 481/1208 [13:06<19:49,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00543, train/loss_vlb_step=2.7e-5, train/loss_step=0.00543, global_step=4951.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  40%|███▉      | 481/1208 [13:06<19:49,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.9e-5, train/loss_step=0.0219, global_step=4952.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  40%|███▉      | 482/1208 [13:07<19:46,  1.63s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.9e-5, train/loss_step=0.0219, global_step=4952.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  40%|███▉      | 482/1208 [13:07<19:46,  1.63s/it, loss=0.137, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000504, train/loss_step=0.151, global_step=4952.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  40%|███▉      | 483/1208 [13:08<19:44,  1.63s/it, loss=0.137, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000504, train/loss_step=0.151, global_step=4952.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  40%|███▉      | 483/1208 [13:08<19:44,  1.63s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.000175, train/loss_step=0.0483, global_step=4952.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  40%|████      | 484/1208 [13:12<19:45,  1.64s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.000175, train/loss_step=0.0483, global_step=4952.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  40%|████      | 484/1208 [13:12<19:45,  1.64s/it, loss=0.105, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000429, train/loss_step=0.129, global_step=4952.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  40%|████      | 485/1208 [13:13<19:42,  1.64s/it, loss=0.105, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000429, train/loss_step=0.129, global_step=4952.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  40%|████      | 485/1208 [13:13<19:42,  1.64s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00264, train/loss_vlb_step=1.51e-5, train/loss_step=0.00264, global_step=4953.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  40%|████      | 486/1208 [13:14<19:40,  1.63s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00264, train/loss_vlb_step=1.51e-5, train/loss_step=0.00264, global_step=4953.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  40%|████      | 486/1208 [13:14<19:40,  1.63s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000129, train/loss_step=0.0334, global_step=4953.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  40%|████      | 487/1208 [13:15<19:37,  1.63s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000129, train/loss_step=0.0334, global_step=4953.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  40%|████      | 487/1208 [13:15<19:37,  1.63s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.36e-5, train/loss_step=0.0122, global_step=4953.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  40%|████      | 488/1208 [13:18<19:38,  1.64s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.36e-5, train/loss_step=0.0122, global_step=4953.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  40%|████      | 488/1208 [13:18<19:38,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.788, train/loss_vlb_step=0.0408, train/loss_step=0.788, global_step=4953.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  40%|████      | 489/1208 [13:19<19:35,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.788, train/loss_vlb_step=0.0408, train/loss_step=0.788, global_step=4953.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  40%|████      | 489/1208 [13:19<19:35,  1.64s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.000171, train/loss_step=0.0485, global_step=4954.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  41%|████      | 490/1208 [13:20<19:33,  1.63s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.000171, train/loss_step=0.0485, global_step=4954.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  41%|████      | 490/1208 [13:20<19:33,  1.63s/it, loss=0.138, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=4954.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  41%|████      | 491/1208 [13:21<19:30,  1.63s/it, loss=0.138, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=4954.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  41%|████      | 491/1208 [13:21<19:30,  1.63s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0596, train/loss_vlb_step=0.000199, train/loss_step=0.0596, global_step=4954.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  41%|████      | 492/1208 [13:24<19:31,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0596, train/loss_vlb_step=0.000199, train/loss_step=0.0596, global_step=4954.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  41%|████      | 492/1208 [13:24<19:31,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00189, train/loss_vlb_step=1.11e-5, train/loss_step=0.00189, global_step=4954.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  41%|████      | 493/1208 [13:26<19:28,  1.63s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00189, train/loss_vlb_step=1.11e-5, train/loss_step=0.00189, global_step=4954.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  41%|████      | 493/1208 [13:26<19:29,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00111, train/loss_step=0.254, global_step=4955.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  41%|████      | 494/1208 [13:27<19:26,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00111, train/loss_step=0.254, global_step=4955.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  41%|████      | 494/1208 [13:27<19:26,  1.63s/it, loss=0.157, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.00043, train/loss_step=0.127, global_step=4955.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  41%|████      | 495/1208 [13:28<19:24,  1.63s/it, loss=0.157, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.00043, train/loss_step=0.127, global_step=4955.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  41%|████      | 495/1208 [13:28<19:24,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0667, train/loss_vlb_step=0.000229, train/loss_step=0.0667, global_step=4955.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  41%|████      | 496/1208 [13:31<19:24,  1.64s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0667, train/loss_vlb_step=0.000229, train/loss_step=0.0667, global_step=4955.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  41%|████      | 496/1208 [13:31<19:24,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.87e-5, train/loss_step=0.0102, global_step=4955.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  41%|████      | 497/1208 [13:32<19:22,  1.63s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.87e-5, train/loss_step=0.0102, global_step=4955.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  41%|████      | 497/1208 [13:32<19:22,  1.63s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.13e-5, train/loss_step=0.00195, global_step=4956.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  41%|████      | 498/1208 [13:33<19:19,  1.63s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.13e-5, train/loss_step=0.00195, global_step=4956.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  41%|████      | 498/1208 [13:33<19:19,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000831, train/loss_step=0.213, global_step=4956.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  41%|████▏     | 499/1208 [13:34<19:17,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000831, train/loss_step=0.213, global_step=4956.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  41%|████▏     | 499/1208 [13:34<19:17,  1.63s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00414, train/loss_vlb_step=2.2e-5, train/loss_step=0.00414, global_step=4956.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  41%|████▏     | 500/1208 [13:37<19:17,  1.64s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00414, train/loss_vlb_step=2.2e-5, train/loss_step=0.00414, global_step=4956.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  41%|████▏     | 500/1208 [13:37<19:17,  1.64s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.48e-5, train/loss_step=0.0118, global_step=4956.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  41%|████▏     | 501/1208 [13:38<19:15,  1.63s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.48e-5, train/loss_step=0.0118, global_step=4956.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  41%|████▏     | 501/1208 [13:38<19:15,  1.63s/it, loss=0.122, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00184, train/loss_step=0.351, global_step=4957.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  42%|████▏     | 502/1208 [13:39<19:13,  1.63s/it, loss=0.122, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00184, train/loss_step=0.351, global_step=4957.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  42%|████▏     | 502/1208 [13:39<19:13,  1.63s/it, loss=0.119, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=4957.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  42%|████▏     | 503/1208 [13:40<19:10,  1.63s/it, loss=0.119, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=4957.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  42%|████▏     | 503/1208 [13:40<19:10,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000381, train/loss_step=0.115, global_step=4957.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  42%|████▏     | 504/1208 [13:44<19:11,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000381, train/loss_step=0.115, global_step=4957.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  42%|████▏     | 504/1208 [13:44<19:11,  1.64s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.59e-5, train/loss_step=0.00284, global_step=4957.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  42%|████▏     | 505/1208 [13:45<19:08,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.59e-5, train/loss_step=0.00284, global_step=4957.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  42%|████▏     | 505/1208 [13:45<19:08,  1.63s/it, loss=0.138, v_num=0, train/loss_simple_step=0.429, train/loss_vlb_step=0.00216, train/loss_step=0.429, global_step=4958.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  42%|████▏     | 506/1208 [13:46<19:06,  1.63s/it, loss=0.138, v_num=0, train/loss_simple_step=0.429, train/loss_vlb_step=0.00216, train/loss_step=0.429, global_step=4958.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  42%|████▏     | 506/1208 [13:46<19:06,  1.63s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=5.97e-5, train/loss_step=0.0142, global_step=4958.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  42%|████▏     | 507/1208 [13:47<19:03,  1.63s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=5.97e-5, train/loss_step=0.0142, global_step=4958.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  42%|████▏     | 507/1208 [13:47<19:03,  1.63s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0324, train/loss_vlb_step=0.000125, train/loss_step=0.0324, global_step=4958.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  42%|████▏     | 508/1208 [13:50<19:04,  1.63s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0324, train/loss_vlb_step=0.000125, train/loss_step=0.0324, global_step=4958.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  42%|████▏     | 508/1208 [13:50<19:04,  1.63s/it, loss=0.107, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000607, train/loss_step=0.173, global_step=4958.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  42%|████▏     | 509/1208 [13:51<19:01,  1.63s/it, loss=0.107, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000607, train/loss_step=0.173, global_step=4958.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  42%|████▏     | 509/1208 [13:51<19:01,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0843, train/loss_vlb_step=0.000283, train/loss_step=0.0843, global_step=4959.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  42%|████▏     | 510/1208 [13:52<18:59,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0843, train/loss_vlb_step=0.000283, train/loss_step=0.0843, global_step=4959.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  42%|████▏     | 510/1208 [13:52<18:59,  1.63s/it, loss=0.104, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.32e-5, train/loss_step=0.020, global_step=4959.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  42%|████▏     | 511/1208 [13:53<18:57,  1.63s/it, loss=0.104, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.32e-5, train/loss_step=0.020, global_step=4959.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  42%|████▏     | 511/1208 [13:53<18:57,  1.63s/it, loss=0.107, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000392, train/loss_step=0.118, global_step=4959.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  42%|████▏     | 512/1208 [13:56<18:57,  1.63s/it, loss=0.107, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000392, train/loss_step=0.118, global_step=4959.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  42%|████▏     | 512/1208 [13:56<18:57,  1.63s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.000109, train/loss_step=0.0276, global_step=4959.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  42%|████▏     | 513/1208 [13:58<18:55,  1.63s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.000109, train/loss_step=0.0276, global_step=4959.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  42%|████▏     | 513/1208 [13:58<18:55,  1.63s/it, loss=0.114, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00208, train/loss_step=0.370, global_step=4960.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  43%|████▎     | 514/1208 [13:59<18:52,  1.63s/it, loss=0.114, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00208, train/loss_step=0.370, global_step=4960.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  43%|████▎     | 514/1208 [13:59<18:52,  1.63s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00485, train/loss_vlb_step=2.62e-5, train/loss_step=0.00485, global_step=4960.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  43%|████▎     | 515/1208 [14:00<18:50,  1.63s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00485, train/loss_vlb_step=2.62e-5, train/loss_step=0.00485, global_step=4960.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  43%|████▎     | 515/1208 [14:00<18:50,  1.63s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00625, train/loss_vlb_step=3.19e-5, train/loss_step=0.00625, global_step=4960.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  43%|████▎     | 516/1208 [14:03<18:51,  1.63s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00625, train/loss_vlb_step=3.19e-5, train/loss_step=0.00625, global_step=4960.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  43%|████▎     | 516/1208 [14:03<18:51,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00335, train/loss_step=0.377, global_step=4960.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  43%|████▎     | 517/1208 [14:04<18:48,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00335, train/loss_step=0.377, global_step=4960.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  43%|████▎     | 517/1208 [14:04<18:48,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.71e-5, train/loss_step=0.0212, global_step=4961.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  43%|████▎     | 518/1208 [14:05<18:46,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.71e-5, train/loss_step=0.0212, global_step=4961.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  43%|████▎     | 518/1208 [14:05<18:46,  1.63s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00717, train/loss_vlb_step=3.44e-5, train/loss_step=0.00717, global_step=4961.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  43%|████▎     | 519/1208 [14:06<18:43,  1.63s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00717, train/loss_vlb_step=3.44e-5, train/loss_step=0.00717, global_step=4961.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  43%|████▎     | 519/1208 [14:06<18:43,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000504, train/loss_step=0.151, global_step=4961.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  43%|████▎     | 520/1208 [14:09<18:44,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000504, train/loss_step=0.151, global_step=4961.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  43%|████▎     | 520/1208 [14:09<18:44,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0626, train/loss_vlb_step=0.000214, train/loss_step=0.0626, global_step=4961.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  43%|████▎     | 521/1208 [14:10<18:41,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0626, train/loss_vlb_step=0.000214, train/loss_step=0.0626, global_step=4961.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  43%|████▎     | 521/1208 [14:10<18:41,  1.63s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0922, train/loss_vlb_step=0.000305, train/loss_step=0.0922, global_step=4962.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  43%|████▎     | 522/1208 [14:11<18:39,  1.63s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0922, train/loss_vlb_step=0.000305, train/loss_step=0.0922, global_step=4962.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  43%|████▎     | 522/1208 [14:11<18:39,  1.63s/it, loss=0.146, v_num=0, train/loss_simple_step=0.815, train/loss_vlb_step=0.138, train/loss_step=0.815, global_step=4962.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]     Epoch 16:  43%|████▎     | 523/1208 [14:12<18:37,  1.63s/it, loss=0.146, v_num=0, train/loss_simple_step=0.815, train/loss_vlb_step=0.138, train/loss_step=0.815, global_step=4962.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  43%|████▎     | 523/1208 [14:12<18:37,  1.63s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=8.94e-5, train/loss_step=0.0223, global_step=4962.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  43%|████▎     | 524/1208 [14:16<18:37,  1.63s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=8.94e-5, train/loss_step=0.0223, global_step=4962.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  43%|████▎     | 524/1208 [14:16<18:37,  1.63s/it, loss=0.144, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.000163, train/loss_step=0.043, global_step=4962.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  43%|████▎     | 525/1208 [14:17<18:35,  1.63s/it, loss=0.144, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.000163, train/loss_step=0.043, global_step=4962.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  43%|████▎     | 525/1208 [14:17<18:35,  1.63s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0039, train/loss_vlb_step=2.1e-5, train/loss_step=0.0039, global_step=4963.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  44%|████▎     | 526/1208 [14:18<18:32,  1.63s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0039, train/loss_vlb_step=2.1e-5, train/loss_step=0.0039, global_step=4963.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  44%|████▎     | 526/1208 [14:18<18:32,  1.63s/it, loss=0.125, v_num=0, train/loss_simple_step=0.059, train/loss_vlb_step=0.000202, train/loss_step=0.059, global_step=4963.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  44%|████▎     | 527/1208 [14:19<18:30,  1.63s/it, loss=0.125, v_num=0, train/loss_simple_step=0.059, train/loss_vlb_step=0.000202, train/loss_step=0.059, global_step=4963.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  44%|████▎     | 527/1208 [14:19<18:30,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.18e-5, train/loss_step=0.00195, global_step=4963.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  44%|████▎     | 528/1208 [14:22<18:30,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.18e-5, train/loss_step=0.00195, global_step=4963.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  44%|████▎     | 528/1208 [14:22<18:30,  1.63s/it, loss=0.129, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00143, train/loss_step=0.290, global_step=4963.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  44%|████▍     | 529/1208 [14:23<18:28,  1.63s/it, loss=0.129, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00143, train/loss_step=0.290, global_step=4963.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  44%|████▍     | 529/1208 [14:23<18:28,  1.63s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00498, train/loss_vlb_step=2.67e-5, train/loss_step=0.00498, global_step=4964.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  44%|████▍     | 530/1208 [14:24<18:26,  1.63s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00498, train/loss_vlb_step=2.67e-5, train/loss_step=0.00498, global_step=4964.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  44%|████▍     | 530/1208 [14:24<18:26,  1.63s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=9.05e-5, train/loss_step=0.0215, global_step=4964.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  44%|████▍     | 531/1208 [14:25<18:23,  1.63s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=9.05e-5, train/loss_step=0.0215, global_step=4964.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  44%|████▍     | 531/1208 [14:25<18:23,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0989, train/loss_vlb_step=0.000325, train/loss_step=0.0989, global_step=4964.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  44%|████▍     | 532/1208 [14:28<18:24,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0989, train/loss_vlb_step=0.000325, train/loss_step=0.0989, global_step=4964.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  44%|████▍     | 532/1208 [14:28<18:24,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00973, train/loss_vlb_step=4.77e-5, train/loss_step=0.00973, global_step=4964.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  44%|████▍     | 533/1208 [14:30<18:21,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00973, train/loss_vlb_step=4.77e-5, train/loss_step=0.00973, global_step=4964.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  44%|████▍     | 533/1208 [14:30<18:21,  1.63s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0985, train/loss_vlb_step=0.000325, train/loss_step=0.0985, global_step=4965.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  44%|████▍     | 534/1208 [14:31<18:19,  1.63s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0985, train/loss_vlb_step=0.000325, train/loss_step=0.0985, global_step=4965.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  44%|████▍     | 534/1208 [14:31<18:19,  1.63s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0428, train/loss_vlb_step=0.000156, train/loss_step=0.0428, global_step=4965.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  44%|████▍     | 535/1208 [14:32<18:17,  1.63s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0428, train/loss_vlb_step=0.000156, train/loss_step=0.0428, global_step=4965.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  44%|████▍     | 535/1208 [14:32<18:17,  1.63s/it, loss=0.119, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000585, train/loss_step=0.165, global_step=4965.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  44%|████▍     | 536/1208 [14:35<18:17,  1.63s/it, loss=0.119, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000585, train/loss_step=0.165, global_step=4965.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  44%|████▍     | 536/1208 [14:35<18:17,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000609, train/loss_step=0.169, global_step=4965.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  44%|████▍     | 537/1208 [14:36<18:15,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000609, train/loss_step=0.169, global_step=4965.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  44%|████▍     | 537/1208 [14:36<18:15,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.98e-5, train/loss_step=0.0191, global_step=4966.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  45%|████▍     | 538/1208 [14:37<18:12,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.98e-5, train/loss_step=0.0191, global_step=4966.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  45%|████▍     | 538/1208 [14:37<18:12,  1.63s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0477, train/loss_vlb_step=0.000176, train/loss_step=0.0477, global_step=4966.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  45%|████▍     | 539/1208 [14:38<18:10,  1.63s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0477, train/loss_vlb_step=0.000176, train/loss_step=0.0477, global_step=4966.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  45%|████▍     | 539/1208 [14:38<18:10,  1.63s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.81e-5, train/loss_step=0.0183, global_step=4966.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  45%|████▍     | 540/1208 [14:41<18:10,  1.63s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.81e-5, train/loss_step=0.0183, global_step=4966.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  45%|████▍     | 540/1208 [14:41<18:10,  1.63s/it, loss=0.117, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00224, train/loss_step=0.323, global_step=4966.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  45%|████▍     | 541/1208 [14:42<18:08,  1.63s/it, loss=0.117, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00224, train/loss_step=0.323, global_step=4966.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  45%|████▍     | 541/1208 [14:42<18:08,  1.63s/it, loss=0.129, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00171, train/loss_step=0.325, global_step=4967.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  45%|████▍     | 542/1208 [14:43<18:06,  1.63s/it, loss=0.129, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00171, train/loss_step=0.325, global_step=4967.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  45%|████▍     | 542/1208 [14:43<18:06,  1.63s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.049, train/loss_vlb_step=0.000173, train/loss_step=0.049, global_step=4967.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  45%|████▍     | 543/1208 [14:44<18:03,  1.63s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.049, train/loss_vlb_step=0.000173, train/loss_step=0.049, global_step=4967.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  45%|████▍     | 543/1208 [14:44<18:03,  1.63s/it, loss=0.0904, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.43e-5, train/loss_step=0.0175, global_step=4967.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  45%|████▌     | 544/1208 [14:48<18:04,  1.63s/it, loss=0.0904, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.43e-5, train/loss_step=0.0175, global_step=4967.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  45%|████▌     | 544/1208 [14:48<18:04,  1.63s/it, loss=0.0887, v_num=0, train/loss_simple_step=0.00871, train/loss_vlb_step=4.13e-5, train/loss_step=0.00871, global_step=4967.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  45%|████▌     | 545/1208 [14:49<18:01,  1.63s/it, loss=0.0887, v_num=0, train/loss_simple_step=0.00871, train/loss_vlb_step=4.13e-5, train/loss_step=0.00871, global_step=4967.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  45%|████▌     | 545/1208 [14:49<18:01,  1.63s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.00788, train/loss_vlb_step=3.79e-5, train/loss_step=0.00788, global_step=4968.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  45%|████▌     | 546/1208 [14:50<17:59,  1.63s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.00788, train/loss_vlb_step=3.79e-5, train/loss_step=0.00788, global_step=4968.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  45%|████▌     | 546/1208 [14:50<17:59,  1.63s/it, loss=0.0867, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.8e-5, train/loss_step=0.0154, global_step=4968.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  45%|████▌     | 547/1208 [14:51<17:56,  1.63s/it, loss=0.0867, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.8e-5, train/loss_step=0.0154, global_step=4968.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  45%|████▌     | 547/1208 [14:51<17:56,  1.63s/it, loss=0.1, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00102, train/loss_step=0.273, global_step=4968.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  45%|████▌     | 548/1208 [14:54<17:57,  1.63s/it, loss=0.1, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00102, train/loss_step=0.273, global_step=4968.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  45%|████▌     | 548/1208 [14:54<17:57,  1.63s/it, loss=0.0859, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.24e-5, train/loss_step=0.00208, global_step=4968.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  45%|████▌     | 549/1208 [14:55<17:54,  1.63s/it, loss=0.0859, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.24e-5, train/loss_step=0.00208, global_step=4968.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  45%|████▌     | 549/1208 [14:55<17:54,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.759, train/loss_vlb_step=0.0964, train/loss_step=0.759, global_step=4969.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]      Epoch 16:  46%|████▌     | 550/1208 [14:56<17:52,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.759, train/loss_vlb_step=0.0964, train/loss_step=0.759, global_step=4969.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  46%|████▌     | 550/1208 [14:56<17:52,  1.63s/it, loss=0.14, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00238, train/loss_step=0.356, global_step=4969.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  46%|████▌     | 551/1208 [14:57<17:50,  1.63s/it, loss=0.14, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00238, train/loss_step=0.356, global_step=4969.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  46%|████▌     | 551/1208 [14:57<17:50,  1.63s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0624, train/loss_vlb_step=0.000223, train/loss_step=0.0624, global_step=4969.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  46%|████▌     | 552/1208 [15:00<17:50,  1.63s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0624, train/loss_vlb_step=0.000223, train/loss_step=0.0624, global_step=4969.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  46%|████▌     | 552/1208 [15:00<17:50,  1.63s/it, loss=0.149, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000892, train/loss_step=0.220, global_step=4969.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  46%|████▌     | 553/1208 [15:01<17:48,  1.63s/it, loss=0.149, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000892, train/loss_step=0.220, global_step=4969.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  46%|████▌     | 553/1208 [15:01<17:48,  1.63s/it, loss=0.151, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000492, train/loss_step=0.145, global_step=4970.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  46%|████▌     | 554/1208 [15:02<17:45,  1.63s/it, loss=0.151, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000492, train/loss_step=0.145, global_step=4970.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  46%|████▌     | 554/1208 [15:02<17:45,  1.63s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=2e-5, train/loss_step=0.00345, global_step=4970.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  46%|████▌     | 555/1208 [15:04<17:43,  1.63s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=2e-5, train/loss_step=0.00345, global_step=4970.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  46%|████▌     | 555/1208 [15:04<17:43,  1.63s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0838, train/loss_vlb_step=0.000281, train/loss_step=0.0838, global_step=4970.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  46%|████▌     | 556/1208 [15:07<17:43,  1.63s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0838, train/loss_vlb_step=0.000281, train/loss_step=0.0838, global_step=4970.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  46%|████▌     | 556/1208 [15:07<17:43,  1.63s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0708, train/loss_vlb_step=0.000248, train/loss_step=0.0708, global_step=4970.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  46%|████▌     | 557/1208 [15:08<17:41,  1.63s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0708, train/loss_vlb_step=0.000248, train/loss_step=0.0708, global_step=4970.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  46%|████▌     | 557/1208 [15:08<17:41,  1.63s/it, loss=0.173, v_num=0, train/loss_simple_step=0.667, train/loss_vlb_step=0.0345, train/loss_step=0.667, global_step=4971.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  46%|████▌     | 558/1208 [15:09<17:39,  1.63s/it, loss=0.173, v_num=0, train/loss_simple_step=0.667, train/loss_vlb_step=0.0345, train/loss_step=0.667, global_step=4971.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  46%|████▌     | 558/1208 [15:09<17:39,  1.63s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.44e-5, train/loss_step=0.00249, global_step=4971.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  46%|████▋     | 559/1208 [15:10<17:37,  1.63s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.44e-5, train/loss_step=0.00249, global_step=4971.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  46%|████▋     | 559/1208 [15:10<17:37,  1.63s/it, loss=0.203, v_num=0, train/loss_simple_step=0.663, train/loss_vlb_step=0.0139, train/loss_step=0.663, global_step=4971.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]     Epoch 16:  46%|████▋     | 560/1208 [15:13<17:37,  1.63s/it, loss=0.203, v_num=0, train/loss_simple_step=0.663, train/loss_vlb_step=0.0139, train/loss_step=0.663, global_step=4971.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  46%|████▋     | 560/1208 [15:13<17:37,  1.63s/it, loss=0.188, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000111, train/loss_step=0.029, global_step=4971.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  46%|████▋     | 561/1208 [15:14<17:34,  1.63s/it, loss=0.188, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000111, train/loss_step=0.029, global_step=4971.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  46%|████▋     | 561/1208 [15:14<17:34,  1.63s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000296, train/loss_step=0.0901, global_step=4972.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  47%|████▋     | 562/1208 [15:15<17:32,  1.63s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000296, train/loss_step=0.0901, global_step=4972.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  47%|████▋     | 562/1208 [15:15<17:32,  1.63s/it, loss=0.19, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00234, train/loss_step=0.331, global_step=4972.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  47%|████▋     | 563/1208 [15:16<17:30,  1.63s/it, loss=0.19, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00234, train/loss_step=0.331, global_step=4972.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  47%|████▋     | 563/1208 [15:16<17:30,  1.63s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.48e-5, train/loss_step=0.0174, global_step=4972.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  47%|████▋     | 564/1208 [15:19<17:30,  1.63s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.48e-5, train/loss_step=0.0174, global_step=4972.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  47%|████▋     | 564/1208 [15:19<17:30,  1.63s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0447, train/loss_vlb_step=0.000168, train/loss_step=0.0447, global_step=4972.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  47%|████▋     | 565/1208 [15:20<17:27,  1.63s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0447, train/loss_vlb_step=0.000168, train/loss_step=0.0447, global_step=4972.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  47%|████▋     | 565/1208 [15:20<17:27,  1.63s/it, loss=0.215, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00706, train/loss_step=0.454, global_step=4973.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  47%|████▋     | 566/1208 [15:21<17:25,  1.63s/it, loss=0.215, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00706, train/loss_step=0.454, global_step=4973.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  47%|████▋     | 566/1208 [15:21<17:25,  1.63s/it, loss=0.227, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00107, train/loss_step=0.267, global_step=4973.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  47%|████▋     | 567/1208 [15:22<17:23,  1.63s/it, loss=0.227, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00107, train/loss_step=0.267, global_step=4973.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  47%|████▋     | 567/1208 [15:22<17:23,  1.63s/it, loss=0.217, v_num=0, train/loss_simple_step=0.066, train/loss_vlb_step=0.000233, train/loss_step=0.066, global_step=4973.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  47%|████▋     | 568/1208 [15:25<17:23,  1.63s/it, loss=0.217, v_num=0, train/loss_simple_step=0.066, train/loss_vlb_step=0.000233, train/loss_step=0.066, global_step=4973.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  47%|████▋     | 568/1208 [15:25<17:23,  1.63s/it, loss=0.231, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00128, train/loss_step=0.284, global_step=4973.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  47%|████▋     | 569/1208 [15:26<17:20,  1.63s/it, loss=0.231, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00128, train/loss_step=0.284, global_step=4973.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  47%|████▋     | 569/1208 [15:26<17:20,  1.63s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=2.46e-5, train/loss_step=0.00464, global_step=4974.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  47%|████▋     | 570/1208 [15:27<17:18,  1.63s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=2.46e-5, train/loss_step=0.00464, global_step=4974.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  47%|████▋     | 570/1208 [15:27<17:18,  1.63s/it, loss=0.181, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000403, train/loss_step=0.121, global_step=4974.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  47%|████▋     | 571/1208 [15:28<17:16,  1.63s/it, loss=0.181, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000403, train/loss_step=0.121, global_step=4974.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  47%|████▋     | 571/1208 [15:28<17:16,  1.63s/it, loss=0.188, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000739, train/loss_step=0.195, global_step=4974.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  47%|████▋     | 572/1208 [15:31<17:15,  1.63s/it, loss=0.188, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000739, train/loss_step=0.195, global_step=4974.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  47%|████▋     | 572/1208 [15:31<17:15,  1.63s/it, loss=0.191, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00164, train/loss_step=0.280, global_step=4974.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  47%|████▋     | 573/1208 [15:32<17:13,  1.63s/it, loss=0.191, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00164, train/loss_step=0.280, global_step=4974.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  47%|████▋     | 573/1208 [15:32<17:13,  1.63s/it, loss=0.2, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00174, train/loss_step=0.328, global_step=4975.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  48%|████▊     | 574/1208 [15:33<17:11,  1.63s/it, loss=0.2, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00174, train/loss_step=0.328, global_step=4975.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  48%|████▊     | 574/1208 [15:33<17:11,  1.63s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0944, train/loss_vlb_step=0.000313, train/loss_step=0.0944, global_step=4975.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  48%|████▊     | 575/1208 [15:34<17:08,  1.63s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0944, train/loss_vlb_step=0.000313, train/loss_step=0.0944, global_step=4975.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  48%|████▊     | 575/1208 [15:34<17:08,  1.63s/it, loss=0.214, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00124, train/loss_step=0.270, global_step=4975.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  48%|████▊     | 576/1208 [15:37<17:08,  1.63s/it, loss=0.214, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00124, train/loss_step=0.270, global_step=4975.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  48%|████▊     | 576/1208 [15:37<17:08,  1.63s/it, loss=0.215, v_num=0, train/loss_simple_step=0.0885, train/loss_vlb_step=0.000292, train/loss_step=0.0885, global_step=4975.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  48%|████▊     | 577/1208 [15:38<17:06,  1.63s/it, loss=0.215, v_num=0, train/loss_simple_step=0.0885, train/loss_vlb_step=0.000292, train/loss_step=0.0885, global_step=4975.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  48%|████▊     | 577/1208 [15:38<17:06,  1.63s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.18e-5, train/loss_step=0.0114, global_step=4976.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  48%|████▊     | 578/1208 [15:39<17:04,  1.63s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.18e-5, train/loss_step=0.0114, global_step=4976.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  48%|████▊     | 578/1208 [15:39<17:04,  1.63s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00596, train/loss_vlb_step=2.99e-5, train/loss_step=0.00596, global_step=4976.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  48%|████▊     | 579/1208 [15:40<17:01,  1.62s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00596, train/loss_vlb_step=2.99e-5, train/loss_step=0.00596, global_step=4976.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  48%|████▊     | 579/1208 [15:40<17:01,  1.62s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.64e-5, train/loss_step=0.0102, global_step=4976.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  48%|████▊     | 580/1208 [15:43<17:01,  1.63s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.64e-5, train/loss_step=0.0102, global_step=4976.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  48%|████▊     | 580/1208 [15:43<17:01,  1.63s/it, loss=0.149, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.06e-5, train/loss_step=0.011, global_step=4976.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  48%|████▊     | 581/1208 [15:44<16:59,  1.63s/it, loss=0.149, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.06e-5, train/loss_step=0.011, global_step=4976.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  48%|████▊     | 581/1208 [15:44<16:59,  1.63s/it, loss=0.151, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.00049, train/loss_step=0.143, global_step=4977.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  48%|████▊     | 582/1208 [15:45<16:56,  1.62s/it, loss=0.151, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.00049, train/loss_step=0.143, global_step=4977.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  48%|████▊     | 582/1208 [15:45<16:56,  1.62s/it, loss=0.142, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000505, train/loss_step=0.152, global_step=4977.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  48%|████▊     | 583/1208 [15:46<16:54,  1.62s/it, loss=0.142, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000505, train/loss_step=0.152, global_step=4977.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  48%|████▊     | 583/1208 [15:46<16:54,  1.62s/it, loss=0.149, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000481, train/loss_step=0.140, global_step=4977.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  48%|████▊     | 584/1208 [15:49<16:54,  1.63s/it, loss=0.149, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000481, train/loss_step=0.140, global_step=4977.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  48%|████▊     | 584/1208 [15:49<16:54,  1.63s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000124, train/loss_step=0.0314, global_step=4977.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  48%|████▊     | 585/1208 [15:50<16:52,  1.62s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000124, train/loss_step=0.0314, global_step=4977.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  48%|████▊     | 585/1208 [15:50<16:52,  1.62s/it, loss=0.131, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000401, train/loss_step=0.121, global_step=4978.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  49%|████▊     | 586/1208 [15:51<16:49,  1.62s/it, loss=0.131, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000401, train/loss_step=0.121, global_step=4978.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  49%|████▊     | 586/1208 [15:51<16:49,  1.62s/it, loss=0.142, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00488, train/loss_step=0.476, global_step=4978.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  49%|████▊     | 587/1208 [15:52<16:47,  1.62s/it, loss=0.142, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00488, train/loss_step=0.476, global_step=4978.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  49%|████▊     | 587/1208 [15:52<16:47,  1.62s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=1.51e-5, train/loss_step=0.00263, global_step=4978.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  49%|████▊     | 588/1208 [15:55<16:47,  1.62s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=1.51e-5, train/loss_step=0.00263, global_step=4978.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  49%|████▊     | 588/1208 [15:55<16:47,  1.62s/it, loss=0.149, v_num=0, train/loss_simple_step=0.503, train/loss_vlb_step=0.00982, train/loss_step=0.503, global_step=4978.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  49%|████▉     | 589/1208 [15:56<16:44,  1.62s/it, loss=0.149, v_num=0, train/loss_simple_step=0.503, train/loss_vlb_step=0.00982, train/loss_step=0.503, global_step=4978.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  49%|████▉     | 589/1208 [15:56<16:44,  1.62s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0707, train/loss_vlb_step=0.000236, train/loss_step=0.0707, global_step=4979.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  49%|████▉     | 590/1208 [15:57<16:42,  1.62s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0707, train/loss_vlb_step=0.000236, train/loss_step=0.0707, global_step=4979.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  49%|████▉     | 590/1208 [15:57<16:42,  1.62s/it, loss=0.156, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000701, train/loss_step=0.196, global_step=4979.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  49%|████▉     | 591/1208 [15:58<16:40,  1.62s/it, loss=0.156, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000701, train/loss_step=0.196, global_step=4979.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  49%|████▉     | 591/1208 [15:58<16:40,  1.62s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0903, train/loss_vlb_step=0.000298, train/loss_step=0.0903, global_step=4979.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  49%|████▉     | 592/1208 [16:01<16:40,  1.62s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0903, train/loss_vlb_step=0.000298, train/loss_step=0.0903, global_step=4979.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  49%|████▉     | 592/1208 [16:01<16:40,  1.62s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=1.69e-5, train/loss_step=0.00309, global_step=4979.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  49%|████▉     | 593/1208 [16:02<16:37,  1.62s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=1.69e-5, train/loss_step=0.00309, global_step=4979.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  49%|████▉     | 593/1208 [16:02<16:37,  1.62s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00746, train/loss_vlb_step=3.6e-5, train/loss_step=0.00746, global_step=4980.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  49%|████▉     | 594/1208 [16:03<16:35,  1.62s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00746, train/loss_vlb_step=3.6e-5, train/loss_step=0.00746, global_step=4980.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  49%|████▉     | 594/1208 [16:03<16:35,  1.62s/it, loss=0.13, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00109, train/loss_step=0.257, global_step=4980.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  49%|████▉     | 595/1208 [16:04<16:33,  1.62s/it, loss=0.13, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00109, train/loss_step=0.257, global_step=4980.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  49%|████▉     | 595/1208 [16:04<16:33,  1.62s/it, loss=0.13, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00115, train/loss_step=0.279, global_step=4980.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  49%|████▉     | 596/1208 [16:07<16:33,  1.62s/it, loss=0.13, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00115, train/loss_step=0.279, global_step=4980.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  49%|████▉     | 596/1208 [16:07<16:33,  1.62s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00952, train/loss_vlb_step=4.51e-5, train/loss_step=0.00952, global_step=4980.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  49%|████▉     | 597/1208 [16:08<16:30,  1.62s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00952, train/loss_vlb_step=4.51e-5, train/loss_step=0.00952, global_step=4980.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  49%|████▉     | 597/1208 [16:08<16:30,  1.62s/it, loss=0.135, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.00067, train/loss_step=0.192, global_step=4981.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  50%|████▉     | 598/1208 [16:09<16:28,  1.62s/it, loss=0.135, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.00067, train/loss_step=0.192, global_step=4981.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  50%|████▉     | 598/1208 [16:09<16:28,  1.62s/it, loss=0.15, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00131, train/loss_step=0.296, global_step=4981.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  50%|████▉     | 599/1208 [16:10<16:26,  1.62s/it, loss=0.15, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00131, train/loss_step=0.296, global_step=4981.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  50%|████▉     | 599/1208 [16:10<16:26,  1.62s/it, loss=0.159, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000746, train/loss_step=0.194, global_step=4981.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  50%|████▉     | 600/1208 [16:13<16:26,  1.62s/it, loss=0.159, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000746, train/loss_step=0.194, global_step=4981.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  50%|████▉     | 600/1208 [16:13<16:26,  1.62s/it, loss=0.166, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000533, train/loss_step=0.155, global_step=4981.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.80it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.81it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.80it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.80it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.76it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.78it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.76it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.82it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.77it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 16:  50%|████▉     | 601/1208 [16:43<16:53,  1.67s/it, loss=0.166, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000533, train/loss_step=0.155, global_step=4981.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  50%|████▉     | 601/1208 [16:43<16:53,  1.67s/it, loss=0.183, v_num=0, train/loss_simple_step=0.474, train/loss_vlb_step=0.00869, train/loss_step=0.474, global_step=4982.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  50%|████▉     | 602/1208 [16:44<16:51,  1.67s/it, loss=0.183, v_num=0, train/loss_simple_step=0.474, train/loss_vlb_step=0.00869, train/loss_step=0.474, global_step=4982.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  50%|████▉     | 602/1208 [16:44<16:51,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.48e-5, train/loss_step=0.00246, global_step=4982.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  50%|████▉     | 603/1208 [16:45<16:49,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.48e-5, train/loss_step=0.00246, global_step=4982.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  50%|████▉     | 603/1208 [16:45<16:49,  1.67s/it, loss=0.179, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.00081, train/loss_step=0.213, global_step=4982.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  50%|█████     | 604/1208 [16:49<16:49,  1.67s/it, loss=0.179, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.00081, train/loss_step=0.213, global_step=4982.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  50%|█████     | 604/1208 [16:49<16:49,  1.67s/it, loss=0.183, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.00041, train/loss_step=0.124, global_step=4982.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  50%|█████     | 605/1208 [16:50<16:46,  1.67s/it, loss=0.183, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.00041, train/loss_step=0.124, global_step=4982.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  50%|█████     | 605/1208 [16:50<16:46,  1.67s/it, loss=0.185, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000535, train/loss_step=0.155, global_step=4983.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  50%|█████     | 606/1208 [16:51<16:44,  1.67s/it, loss=0.185, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000535, train/loss_step=0.155, global_step=4983.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  50%|█████     | 606/1208 [16:51<16:44,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00269, train/loss_vlb_step=1.45e-5, train/loss_step=0.00269, global_step=4983.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  50%|█████     | 607/1208 [16:52<16:42,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00269, train/loss_vlb_step=1.45e-5, train/loss_step=0.00269, global_step=4983.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  50%|█████     | 607/1208 [16:52<16:42,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000611, train/loss_step=0.182, global_step=4983.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  50%|█████     | 608/1208 [16:55<16:42,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000611, train/loss_step=0.182, global_step=4983.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  50%|█████     | 608/1208 [16:55<16:42,  1.67s/it, loss=0.159, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00131, train/loss_step=0.279, global_step=4983.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  50%|█████     | 609/1208 [16:56<16:39,  1.67s/it, loss=0.159, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00131, train/loss_step=0.279, global_step=4983.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  50%|█████     | 609/1208 [16:56<16:39,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.54e-5, train/loss_step=0.0199, global_step=4984.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  50%|█████     | 610/1208 [16:57<16:37,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.54e-5, train/loss_step=0.0199, global_step=4984.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  50%|█████     | 610/1208 [16:57<16:37,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0847, train/loss_vlb_step=0.000281, train/loss_step=0.0847, global_step=4984.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  51%|█████     | 611/1208 [16:58<16:35,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0847, train/loss_vlb_step=0.000281, train/loss_step=0.0847, global_step=4984.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  51%|█████     | 611/1208 [16:58<16:35,  1.67s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000246, train/loss_step=0.0732, global_step=4984.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  51%|█████     | 612/1208 [17:01<16:35,  1.67s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000246, train/loss_step=0.0732, global_step=4984.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  51%|█████     | 612/1208 [17:01<16:35,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.56e-5, train/loss_step=0.0121, global_step=4984.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  51%|█████     | 613/1208 [17:02<16:32,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.56e-5, train/loss_step=0.0121, global_step=4984.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  51%|█████     | 613/1208 [17:02<16:32,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000534, train/loss_step=0.152, global_step=4985.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  51%|█████     | 614/1208 [17:04<16:30,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000534, train/loss_step=0.152, global_step=4985.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  51%|█████     | 614/1208 [17:04<16:30,  1.67s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0915, train/loss_vlb_step=0.000301, train/loss_step=0.0915, global_step=4985.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  51%|█████     | 615/1208 [17:05<16:28,  1.67s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0915, train/loss_vlb_step=0.000301, train/loss_step=0.0915, global_step=4985.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  51%|█████     | 615/1208 [17:05<16:28,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=1.58e-5, train/loss_step=0.00271, global_step=4985.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  51%|█████     | 616/1208 [17:08<16:28,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=1.58e-5, train/loss_step=0.00271, global_step=4985.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  51%|█████     | 616/1208 [17:08<16:28,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.000166, train/loss_step=0.0441, global_step=4985.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  51%|█████     | 617/1208 [17:09<16:26,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.000166, train/loss_step=0.0441, global_step=4985.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  51%|█████     | 617/1208 [17:09<16:26,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0887, train/loss_vlb_step=0.000304, train/loss_step=0.0887, global_step=4986.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  51%|█████     | 618/1208 [17:10<16:23,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0887, train/loss_vlb_step=0.000304, train/loss_step=0.0887, global_step=4986.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  51%|█████     | 618/1208 [17:10<16:23,  1.67s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00454, train/loss_vlb_step=2.45e-5, train/loss_step=0.00454, global_step=4986.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  51%|█████     | 619/1208 [17:11<16:21,  1.67s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00454, train/loss_vlb_step=2.45e-5, train/loss_step=0.00454, global_step=4986.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  51%|█████     | 619/1208 [17:11<16:21,  1.67s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0914, train/loss_vlb_step=0.000308, train/loss_step=0.0914, global_step=4986.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  51%|█████▏    | 620/1208 [17:14<16:21,  1.67s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0914, train/loss_vlb_step=0.000308, train/loss_step=0.0914, global_step=4986.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  51%|█████▏    | 620/1208 [17:14<16:21,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000522, train/loss_step=0.153, global_step=4986.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  51%|█████▏    | 621/1208 [17:15<16:19,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000522, train/loss_step=0.153, global_step=4986.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  51%|█████▏    | 621/1208 [17:15<16:19,  1.67s/it, loss=0.111, v_num=0, train/loss_simple_step=0.446, train/loss_vlb_step=0.00326, train/loss_step=0.446, global_step=4987.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  51%|█████▏    | 622/1208 [17:16<16:16,  1.67s/it, loss=0.111, v_num=0, train/loss_simple_step=0.446, train/loss_vlb_step=0.00326, train/loss_step=0.446, global_step=4987.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  51%|█████▏    | 622/1208 [17:16<16:16,  1.67s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=1.92e-5, train/loss_step=0.00356, global_step=4987.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  52%|█████▏    | 623/1208 [17:17<16:14,  1.67s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=1.92e-5, train/loss_step=0.00356, global_step=4987.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  52%|█████▏    | 623/1208 [17:17<16:14,  1.67s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00649, train/loss_vlb_step=3.12e-5, train/loss_step=0.00649, global_step=4987.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  52%|█████▏    | 624/1208 [17:21<16:14,  1.67s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00649, train/loss_vlb_step=3.12e-5, train/loss_step=0.00649, global_step=4987.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  52%|█████▏    | 624/1208 [17:21<16:14,  1.67s/it, loss=0.104, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000623, train/loss_step=0.186, global_step=4987.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  52%|█████▏    | 625/1208 [17:22<16:12,  1.67s/it, loss=0.104, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000623, train/loss_step=0.186, global_step=4987.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  52%|█████▏    | 625/1208 [17:22<16:12,  1.67s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.00739, train/loss_vlb_step=3.42e-5, train/loss_step=0.00739, global_step=4988.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  52%|█████▏    | 626/1208 [17:23<16:09,  1.67s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.00739, train/loss_vlb_step=3.42e-5, train/loss_step=0.00739, global_step=4988.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  52%|█████▏    | 626/1208 [17:23<16:09,  1.67s/it, loss=0.109, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00124, train/loss_step=0.254, global_step=4988.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]     Epoch 16:  52%|█████▏    | 627/1208 [17:24<16:07,  1.67s/it, loss=0.109, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00124, train/loss_step=0.254, global_step=4988.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  52%|█████▏    | 627/1208 [17:24<16:07,  1.67s/it, loss=0.107, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000455, train/loss_step=0.137, global_step=4988.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  52%|█████▏    | 628/1208 [17:27<16:07,  1.67s/it, loss=0.107, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000455, train/loss_step=0.137, global_step=4988.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  52%|█████▏    | 628/1208 [17:27<16:07,  1.67s/it, loss=0.104, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000825, train/loss_step=0.220, global_step=4988.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  52%|█████▏    | 629/1208 [17:28<16:05,  1.67s/it, loss=0.104, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000825, train/loss_step=0.220, global_step=4988.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  52%|█████▏    | 629/1208 [17:28<16:05,  1.67s/it, loss=0.11, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000497, train/loss_step=0.148, global_step=4989.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  52%|█████▏    | 630/1208 [17:29<16:02,  1.67s/it, loss=0.11, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000497, train/loss_step=0.148, global_step=4989.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  52%|█████▏    | 630/1208 [17:29<16:02,  1.67s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.9e-5, train/loss_step=0.0131, global_step=4989.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  52%|█████▏    | 631/1208 [17:30<16:00,  1.67s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.9e-5, train/loss_step=0.0131, global_step=4989.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  52%|█████▏    | 631/1208 [17:30<16:00,  1.67s/it, loss=0.11, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000427, train/loss_step=0.130, global_step=4989.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  52%|█████▏    | 632/1208 [17:33<16:00,  1.67s/it, loss=0.11, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000427, train/loss_step=0.130, global_step=4989.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  52%|█████▏    | 632/1208 [17:33<16:00,  1.67s/it, loss=0.119, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000764, train/loss_step=0.204, global_step=4989.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  52%|█████▏    | 633/1208 [17:34<15:58,  1.67s/it, loss=0.119, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000764, train/loss_step=0.204, global_step=4989.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  52%|█████▏    | 633/1208 [17:34<15:58,  1.67s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.57e-5, train/loss_step=0.0232, global_step=4990.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  52%|█████▏    | 634/1208 [17:36<15:56,  1.67s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.57e-5, train/loss_step=0.0232, global_step=4990.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  52%|█████▏    | 634/1208 [17:36<15:56,  1.67s/it, loss=0.129, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00316, train/loss_step=0.425, global_step=4990.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  53%|█████▎    | 635/1208 [17:37<15:53,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00316, train/loss_step=0.425, global_step=4990.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  53%|█████▎    | 635/1208 [17:37<15:53,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0729, train/loss_vlb_step=0.00024, train/loss_step=0.0729, global_step=4990.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  53%|█████▎    | 636/1208 [17:40<15:53,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0729, train/loss_vlb_step=0.00024, train/loss_step=0.0729, global_step=4990.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  53%|█████▎    | 636/1208 [17:40<15:53,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.88e-5, train/loss_step=0.0104, global_step=4990.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  53%|█████▎    | 637/1208 [17:41<15:51,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.88e-5, train/loss_step=0.0104, global_step=4990.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  53%|█████▎    | 637/1208 [17:41<15:51,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=4991.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  53%|█████▎    | 638/1208 [17:42<15:49,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=4991.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  53%|█████▎    | 638/1208 [17:42<15:49,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000393, train/loss_step=0.119, global_step=4991.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  53%|█████▎    | 639/1208 [17:43<15:46,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000393, train/loss_step=0.119, global_step=4991.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  53%|█████▎    | 639/1208 [17:43<15:46,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00807, train/loss_vlb_step=3.83e-5, train/loss_step=0.00807, global_step=4991.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  53%|█████▎    | 640/1208 [17:46<15:46,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00807, train/loss_vlb_step=3.83e-5, train/loss_step=0.00807, global_step=4991.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  53%|█████▎    | 640/1208 [17:46<15:46,  1.67s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0465, train/loss_vlb_step=0.000162, train/loss_step=0.0465, global_step=4991.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  53%|█████▎    | 641/1208 [17:47<15:44,  1.67s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0465, train/loss_vlb_step=0.000162, train/loss_step=0.0465, global_step=4991.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  53%|█████▎    | 641/1208 [17:47<15:44,  1.67s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.00012, train/loss_step=0.0307, global_step=4992.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  53%|█████▎    | 642/1208 [17:48<15:42,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.00012, train/loss_step=0.0307, global_step=4992.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  53%|█████▎    | 642/1208 [17:48<15:42,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=5.8e-5, train/loss_step=0.0137, global_step=4992.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  53%|█████▎    | 643/1208 [17:49<15:40,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=5.8e-5, train/loss_step=0.0137, global_step=4992.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  53%|█████▎    | 643/1208 [17:49<15:40,  1.66s/it, loss=0.114, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=4992.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  53%|█████▎    | 644/1208 [17:53<15:39,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=4992.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  53%|█████▎    | 644/1208 [17:53<15:39,  1.67s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00935, train/loss_vlb_step=4.34e-5, train/loss_step=0.00935, global_step=4992.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  53%|█████▎    | 645/1208 [17:54<15:37,  1.67s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00935, train/loss_vlb_step=4.34e-5, train/loss_step=0.00935, global_step=4992.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  53%|█████▎    | 645/1208 [17:54<15:37,  1.67s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00695, train/loss_vlb_step=3.49e-5, train/loss_step=0.00695, global_step=4993.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  53%|█████▎    | 646/1208 [17:55<15:35,  1.66s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00695, train/loss_vlb_step=3.49e-5, train/loss_step=0.00695, global_step=4993.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  53%|█████▎    | 646/1208 [17:55<15:35,  1.66s/it, loss=0.104, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.00081, train/loss_step=0.221, global_step=4993.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  54%|█████▎    | 647/1208 [17:56<15:33,  1.66s/it, loss=0.104, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.00081, train/loss_step=0.221, global_step=4993.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  54%|█████▎    | 647/1208 [17:56<15:33,  1.66s/it, loss=0.104, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000502, train/loss_step=0.151, global_step=4993.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  54%|█████▎    | 648/1208 [17:59<15:32,  1.67s/it, loss=0.104, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000502, train/loss_step=0.151, global_step=4993.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  54%|█████▎    | 648/1208 [17:59<15:32,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.478, train/loss_vlb_step=0.00557, train/loss_step=0.478, global_step=4993.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  54%|█████▎    | 649/1208 [18:00<15:30,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.478, train/loss_vlb_step=0.00557, train/loss_step=0.478, global_step=4993.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  54%|█████▎    | 649/1208 [18:00<15:30,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=4994.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  54%|█████▍    | 650/1208 [18:01<15:28,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=4994.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  54%|█████▍    | 650/1208 [18:01<15:28,  1.66s/it, loss=0.13, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00159, train/loss_step=0.319, global_step=4994.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  54%|█████▍    | 651/1208 [18:02<15:26,  1.66s/it, loss=0.13, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00159, train/loss_step=0.319, global_step=4994.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  54%|█████▍    | 651/1208 [18:02<15:26,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000694, train/loss_step=0.196, global_step=4994.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  54%|█████▍    | 652/1208 [18:05<15:25,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000694, train/loss_step=0.196, global_step=4994.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  54%|█████▍    | 652/1208 [18:05<15:25,  1.67s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.65e-5, train/loss_step=0.0102, global_step=4994.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  54%|█████▍    | 653/1208 [18:06<15:23,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.65e-5, train/loss_step=0.0102, global_step=4994.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  54%|█████▍    | 653/1208 [18:06<15:23,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.55e-5, train/loss_step=0.0124, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  54%|█████▍    | 654/1208 [18:07<15:21,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.55e-5, train/loss_step=0.0124, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  54%|█████▍    | 654/1208 [18:07<15:21,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00042, train/loss_step=0.128, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  54%|█████▍    | 655/1208 [18:08<15:19,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00042, train/loss_step=0.128, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  54%|█████▍    | 655/1208 [18:08<15:19,  1.66s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0964, train/loss_vlb_step=0.000317, train/loss_step=0.0964, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  54%|█████▍    | 656/1208 [18:11<15:18,  1.66s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0964, train/loss_vlb_step=0.000317, train/loss_step=0.0964, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  54%|█████▍    | 656/1208 [18:11<15:18,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000388, train/loss_step=0.118, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  54%|█████▍    | 657/1208 [18:12<15:16,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000388, train/loss_step=0.118, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  54%|█████▍    | 657/1208 [18:12<15:16,  1.66s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0564, train/loss_vlb_step=0.000201, train/loss_step=0.0564, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  54%|█████▍    | 658/1208 [18:13<15:14,  1.66s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0564, train/loss_vlb_step=0.000201, train/loss_step=0.0564, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  54%|█████▍    | 658/1208 [18:13<15:14,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000813, train/loss_step=0.211, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  55%|█████▍    | 659/1208 [18:14<15:12,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000813, train/loss_step=0.211, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  55%|█████▍    | 659/1208 [18:14<15:12,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00417, train/loss_vlb_step=2.23e-5, train/loss_step=0.00417, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  55%|█████▍    | 660/1208 [18:17<15:11,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00417, train/loss_vlb_step=2.23e-5, train/loss_step=0.00417, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  55%|█████▍    | 660/1208 [18:17<15:11,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0782, train/loss_vlb_step=0.000262, train/loss_step=0.0782, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  55%|█████▍    | 661/1208 [18:18<15:09,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0782, train/loss_vlb_step=0.000262, train/loss_step=0.0782, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  55%|█████▍    | 661/1208 [18:18<15:09,  1.66s/it, loss=0.119, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.000157, train/loss_step=0.043, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  55%|█████▍    | 662/1208 [18:19<15:07,  1.66s/it, loss=0.119, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.000157, train/loss_step=0.043, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  55%|█████▍    | 662/1208 [18:19<15:07,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000357, train/loss_step=0.109, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  55%|█████▍    | 663/1208 [18:20<15:04,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000357, train/loss_step=0.109, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  55%|█████▍    | 663/1208 [18:20<15:04,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.89e-5, train/loss_step=0.00344, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  55%|█████▍    | 664/1208 [18:23<15:04,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.89e-5, train/loss_step=0.00344, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  55%|█████▍    | 664/1208 [18:23<15:04,  1.66s/it, loss=0.121, v_num=0, train/loss_simple_step=0.077, train/loss_vlb_step=0.000257, train/loss_step=0.077, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  55%|█████▌    | 665/1208 [18:24<15:02,  1.66s/it, loss=0.121, v_num=0, train/loss_simple_step=0.077, train/loss_vlb_step=0.000257, train/loss_step=0.077, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  55%|█████▌    | 665/1208 [18:24<15:02,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000577, train/loss_step=0.165, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  55%|█████▌    | 666/1208 [18:25<14:59,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000577, train/loss_step=0.165, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  55%|█████▌    | 666/1208 [18:25<14:59,  1.66s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0513, train/loss_vlb_step=0.000183, train/loss_step=0.0513, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  55%|█████▌    | 667/1208 [18:26<14:57,  1.66s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0513, train/loss_vlb_step=0.000183, train/loss_step=0.0513, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  55%|█████▌    | 667/1208 [18:26<14:57,  1.66s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00821, train/loss_vlb_step=3.95e-5, train/loss_step=0.00821, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  55%|█████▌    | 668/1208 [18:29<14:57,  1.66s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00821, train/loss_vlb_step=3.95e-5, train/loss_step=0.00821, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  55%|█████▌    | 668/1208 [18:29<14:57,  1.66s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.56e-5, train/loss_step=0.0176, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  55%|█████▌    | 669/1208 [18:30<14:54,  1.66s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.56e-5, train/loss_step=0.0176, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  55%|█████▌    | 669/1208 [18:30<14:54,  1.66s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000817, train/loss_step=0.212, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  55%|█████▌    | 670/1208 [18:31<14:52,  1.66s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000817, train/loss_step=0.212, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  55%|█████▌    | 670/1208 [18:31<14:52,  1.66s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000435, train/loss_step=0.132, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  56%|█████▌    | 671/1208 [18:32<14:50,  1.66s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000435, train/loss_step=0.132, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  56%|█████▌    | 671/1208 [18:32<14:50,  1.66s/it, loss=0.0825, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  56%|█████▌    | 672/1208 [18:35<14:49,  1.66s/it, loss=0.0825, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  56%|█████▌    | 672/1208 [18:35<14:49,  1.66s/it, loss=0.085, v_num=0, train/loss_simple_step=0.0601, train/loss_vlb_step=0.000214, train/loss_step=0.0601, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  56%|█████▌    | 673/1208 [18:36<14:47,  1.66s/it, loss=0.085, v_num=0, train/loss_simple_step=0.0601, train/loss_vlb_step=0.000214, train/loss_step=0.0601, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  56%|█████▌    | 673/1208 [18:36<14:47,  1.66s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000763, train/loss_step=0.197, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  56%|█████▌    | 674/1208 [18:37<14:45,  1.66s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000763, train/loss_step=0.197, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  56%|█████▌    | 674/1208 [18:37<14:45,  1.66s/it, loss=0.109, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00304, train/loss_step=0.423, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  56%|█████▌    | 675/1208 [18:38<14:43,  1.66s/it, loss=0.109, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00304, train/loss_step=0.423, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  56%|█████▌    | 675/1208 [18:38<14:43,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.484, train/loss_vlb_step=0.00511, train/loss_step=0.484, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  56%|█████▌    | 676/1208 [18:41<14:42,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.484, train/loss_vlb_step=0.00511, train/loss_step=0.484, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  56%|█████▌    | 676/1208 [18:41<14:42,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000462, train/loss_step=0.140, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  56%|█████▌    | 677/1208 [18:42<14:40,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000462, train/loss_step=0.140, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  56%|█████▌    | 677/1208 [18:42<14:40,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000447, train/loss_step=0.134, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  56%|█████▌    | 678/1208 [18:43<14:38,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000447, train/loss_step=0.134, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  56%|█████▌    | 678/1208 [18:43<14:38,  1.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000644, train/loss_step=0.176, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  56%|█████▌    | 679/1208 [18:44<14:36,  1.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000644, train/loss_step=0.176, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  56%|█████▌    | 679/1208 [18:44<14:36,  1.66s/it, loss=0.137, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000337, train/loss_step=0.102, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  56%|█████▋    | 680/1208 [18:47<14:35,  1.66s/it, loss=0.137, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000337, train/loss_step=0.102, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  56%|█████▋    | 680/1208 [18:47<14:35,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00203, train/loss_step=0.377, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  56%|█████▋    | 681/1208 [18:48<14:33,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00203, train/loss_step=0.377, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  56%|█████▋    | 681/1208 [18:48<14:33,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.79e-5, train/loss_step=0.0103, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  56%|█████▋    | 682/1208 [18:49<14:31,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.79e-5, train/loss_step=0.0103, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  56%|█████▋    | 682/1208 [18:49<14:31,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000367, train/loss_step=0.112, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  57%|█████▋    | 683/1208 [18:50<14:28,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000367, train/loss_step=0.112, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  57%|█████▋    | 683/1208 [18:50<14:28,  1.66s/it, loss=0.175, v_num=0, train/loss_simple_step=0.510, train/loss_vlb_step=0.00583, train/loss_step=0.510, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  57%|█████▋    | 684/1208 [18:53<14:28,  1.66s/it, loss=0.175, v_num=0, train/loss_simple_step=0.510, train/loss_vlb_step=0.00583, train/loss_step=0.510, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  57%|█████▋    | 684/1208 [18:53<14:28,  1.66s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=2.51e-5, train/loss_step=0.00481, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  57%|█████▋    | 685/1208 [18:54<14:26,  1.66s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=2.51e-5, train/loss_step=0.00481, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  57%|█████▋    | 685/1208 [18:54<14:26,  1.66s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.78e-5, train/loss_step=0.0158, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  57%|█████▋    | 686/1208 [18:55<14:23,  1.66s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.78e-5, train/loss_step=0.0158, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  57%|█████▋    | 686/1208 [18:55<14:23,  1.66s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=4.95e-5, train/loss_step=0.0113, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  57%|█████▋    | 687/1208 [18:56<14:21,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=4.95e-5, train/loss_step=0.0113, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  57%|█████▋    | 687/1208 [18:56<14:21,  1.65s/it, loss=0.175, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00114, train/loss_step=0.256, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  57%|█████▋    | 688/1208 [18:59<14:21,  1.66s/it, loss=0.175, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00114, train/loss_step=0.256, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  57%|█████▋    | 688/1208 [18:59<14:21,  1.66s/it, loss=0.18, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000393, train/loss_step=0.119, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  57%|█████▋    | 689/1208 [19:00<14:19,  1.66s/it, loss=0.18, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000393, train/loss_step=0.119, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  57%|█████▋    | 689/1208 [19:00<14:19,  1.66s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0444, train/loss_vlb_step=0.000162, train/loss_step=0.0444, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  57%|█████▋    | 690/1208 [19:01<14:16,  1.65s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0444, train/loss_vlb_step=0.000162, train/loss_step=0.0444, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  57%|█████▋    | 690/1208 [19:01<14:16,  1.65s/it, loss=0.179, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00112, train/loss_step=0.279, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  57%|█████▋    | 691/1208 [19:02<14:14,  1.65s/it, loss=0.179, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00112, train/loss_step=0.279, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  57%|█████▋    | 691/1208 [19:02<14:14,  1.65s/it, loss=0.186, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00112, train/loss_step=0.257, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  57%|█████▋    | 692/1208 [19:05<14:13,  1.66s/it, loss=0.186, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00112, train/loss_step=0.257, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  57%|█████▋    | 692/1208 [19:05<14:13,  1.66s/it, loss=0.193, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000815, train/loss_step=0.207, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  57%|█████▋    | 693/1208 [19:06<14:11,  1.65s/it, loss=0.193, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000815, train/loss_step=0.207, global_step=5e+3, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  57%|█████▋    | 693/1208 [19:06<14:11,  1.65s/it, loss=0.192, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000577, train/loss_step=0.172, global_step=5005.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  57%|█████▋    | 694/1208 [19:07<14:09,  1.65s/it, loss=0.192, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000577, train/loss_step=0.172, global_step=5005.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  57%|█████▋    | 694/1208 [19:07<14:09,  1.65s/it, loss=0.212, v_num=0, train/loss_simple_step=0.838, train/loss_vlb_step=0.141, train/loss_step=0.838, global_step=5005.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  58%|█████▊    | 695/1208 [19:08<14:07,  1.65s/it, loss=0.212, v_num=0, train/loss_simple_step=0.838, train/loss_vlb_step=0.141, train/loss_step=0.838, global_step=5005.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  58%|█████▊    | 695/1208 [19:08<14:07,  1.65s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=7.97e-5, train/loss_step=0.0193, global_step=5005.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  58%|█████▊    | 696/1208 [19:11<14:06,  1.65s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=7.97e-5, train/loss_step=0.0193, global_step=5005.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  58%|█████▊    | 696/1208 [19:11<14:06,  1.65s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.87e-5, train/loss_step=0.0135, global_step=5005.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  58%|█████▊    | 697/1208 [19:12<14:04,  1.65s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.87e-5, train/loss_step=0.0135, global_step=5005.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  58%|█████▊    | 697/1208 [19:12<14:04,  1.65s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00429, train/loss_vlb_step=2.36e-5, train/loss_step=0.00429, global_step=5006.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  58%|█████▊    | 698/1208 [19:13<14:02,  1.65s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00429, train/loss_vlb_step=2.36e-5, train/loss_step=0.00429, global_step=5006.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  58%|█████▊    | 698/1208 [19:13<14:02,  1.65s/it, loss=0.174, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000436, train/loss_step=0.132, global_step=5006.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  58%|█████▊    | 699/1208 [19:14<14:00,  1.65s/it, loss=0.174, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000436, train/loss_step=0.132, global_step=5006.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  58%|█████▊    | 699/1208 [19:14<14:00,  1.65s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000142, train/loss_step=0.0388, global_step=5006.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  58%|█████▊    | 700/1208 [19:17<13:59,  1.65s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000142, train/loss_step=0.0388, global_step=5006.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  58%|█████▊    | 700/1208 [19:17<13:59,  1.65s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0086, train/loss_vlb_step=4.11e-5, train/loss_step=0.0086, global_step=5006.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  58%|█████▊    | 701/1208 [19:18<13:57,  1.65s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0086, train/loss_vlb_step=4.11e-5, train/loss_step=0.0086, global_step=5006.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  58%|█████▊    | 701/1208 [19:18<13:57,  1.65s/it, loss=0.189, v_num=0, train/loss_simple_step=0.742, train/loss_vlb_step=0.0756, train/loss_step=0.742, global_step=5007.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  58%|█████▊    | 702/1208 [19:19<13:55,  1.65s/it, loss=0.189, v_num=0, train/loss_simple_step=0.742, train/loss_vlb_step=0.0756, train/loss_step=0.742, global_step=5007.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  58%|█████▊    | 702/1208 [19:19<13:55,  1.65s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0832, train/loss_vlb_step=0.000277, train/loss_step=0.0832, global_step=5007.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  58%|█████▊    | 703/1208 [19:20<13:53,  1.65s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0832, train/loss_vlb_step=0.000277, train/loss_step=0.0832, global_step=5007.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  58%|█████▊    | 703/1208 [19:20<13:53,  1.65s/it, loss=0.18, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00288, train/loss_step=0.355, global_step=5007.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  58%|█████▊    | 704/1208 [19:23<13:52,  1.65s/it, loss=0.18, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00288, train/loss_step=0.355, global_step=5007.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  58%|█████▊    | 704/1208 [19:23<13:52,  1.65s/it, loss=0.186, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000383, train/loss_step=0.116, global_step=5007.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  58%|█████▊    | 705/1208 [19:24<13:50,  1.65s/it, loss=0.186, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000383, train/loss_step=0.116, global_step=5007.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  58%|█████▊    | 705/1208 [19:24<13:50,  1.65s/it, loss=0.196, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000857, train/loss_step=0.234, global_step=5008.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  58%|█████▊    | 706/1208 [19:25<13:48,  1.65s/it, loss=0.196, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000857, train/loss_step=0.234, global_step=5008.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  58%|█████▊    | 706/1208 [19:25<13:48,  1.65s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000132, train/loss_step=0.0335, global_step=5008.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  59%|█████▊    | 707/1208 [19:26<13:46,  1.65s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000132, train/loss_step=0.0335, global_step=5008.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  59%|█████▊    | 707/1208 [19:26<13:46,  1.65s/it, loss=0.193, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000554, train/loss_step=0.161, global_step=5008.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  59%|█████▊    | 708/1208 [19:28<13:45,  1.65s/it, loss=0.193, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000554, train/loss_step=0.161, global_step=5008.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  59%|█████▊    | 708/1208 [19:28<13:45,  1.65s/it, loss=0.197, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.00069, train/loss_step=0.197, global_step=5008.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  59%|█████▊    | 709/1208 [19:29<13:43,  1.65s/it, loss=0.197, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.00069, train/loss_step=0.197, global_step=5008.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  59%|█████▊    | 709/1208 [19:29<13:43,  1.65s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=3.53e-5, train/loss_step=0.00677, global_step=5009.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  59%|█████▉    | 710/1208 [19:30<13:41,  1.65s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=3.53e-5, train/loss_step=0.00677, global_step=5009.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  59%|█████▉    | 710/1208 [19:30<13:41,  1.65s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0464, train/loss_vlb_step=0.000166, train/loss_step=0.0464, global_step=5009.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  59%|█████▉    | 711/1208 [19:31<13:39,  1.65s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0464, train/loss_vlb_step=0.000166, train/loss_step=0.0464, global_step=5009.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  59%|█████▉    | 711/1208 [19:31<13:39,  1.65s/it, loss=0.201, v_num=0, train/loss_simple_step=0.621, train/loss_vlb_step=0.011, train/loss_step=0.621, global_step=5009.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]     Epoch 16:  59%|█████▉    | 712/1208 [19:34<13:38,  1.65s/it, loss=0.201, v_num=0, train/loss_simple_step=0.621, train/loss_vlb_step=0.011, train/loss_step=0.621, global_step=5009.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  59%|█████▉    | 712/1208 [19:34<13:38,  1.65s/it, loss=0.199, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000554, train/loss_step=0.164, global_step=5009.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  59%|█████▉    | 713/1208 [19:35<13:36,  1.65s/it, loss=0.199, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000554, train/loss_step=0.164, global_step=5009.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  59%|█████▉    | 713/1208 [19:35<13:36,  1.65s/it, loss=0.199, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000553, train/loss_step=0.158, global_step=5010.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  59%|█████▉    | 714/1208 [19:36<13:34,  1.65s/it, loss=0.199, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000553, train/loss_step=0.158, global_step=5010.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  59%|█████▉    | 714/1208 [19:36<13:34,  1.65s/it, loss=0.168, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000868, train/loss_step=0.225, global_step=5010.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  59%|█████▉    | 715/1208 [19:37<13:32,  1.65s/it, loss=0.168, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000868, train/loss_step=0.225, global_step=5010.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  59%|█████▉    | 715/1208 [19:37<13:32,  1.65s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000122, train/loss_step=0.0342, global_step=5010.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  59%|█████▉    | 716/1208 [19:40<13:31,  1.65s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000122, train/loss_step=0.0342, global_step=5010.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  59%|█████▉    | 716/1208 [19:40<13:31,  1.65s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.7e-5, train/loss_step=0.00304, global_step=5010.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  59%|█████▉    | 717/1208 [19:41<13:29,  1.65s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.7e-5, train/loss_step=0.00304, global_step=5010.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  59%|█████▉    | 717/1208 [19:41<13:29,  1.65s/it, loss=0.183, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00135, train/loss_step=0.306, global_step=5011.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  59%|█████▉    | 718/1208 [19:42<13:27,  1.65s/it, loss=0.183, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00135, train/loss_step=0.306, global_step=5011.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  59%|█████▉    | 718/1208 [19:42<13:27,  1.65s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.83e-5, train/loss_step=0.0158, global_step=5011.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  60%|█████▉    | 719/1208 [19:43<13:25,  1.65s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.83e-5, train/loss_step=0.0158, global_step=5011.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  60%|█████▉    | 719/1208 [19:43<13:25,  1.65s/it, loss=0.194, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00199, train/loss_step=0.363, global_step=5011.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  60%|█████▉    | 720/1208 [19:46<13:24,  1.65s/it, loss=0.194, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00199, train/loss_step=0.363, global_step=5011.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  60%|█████▉    | 720/1208 [19:46<13:24,  1.65s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=1.93e-5, train/loss_step=0.00357, global_step=5011.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  60%|█████▉    | 721/1208 [19:47<13:22,  1.65s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=1.93e-5, train/loss_step=0.00357, global_step=5011.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  60%|█████▉    | 721/1208 [19:47<13:22,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000414, train/loss_step=0.126, global_step=5012.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  60%|█████▉    | 722/1208 [19:48<13:20,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000414, train/loss_step=0.126, global_step=5012.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  60%|█████▉    | 722/1208 [19:48<13:20,  1.65s/it, loss=0.171, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00101, train/loss_step=0.244, global_step=5012.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  60%|█████▉    | 723/1208 [19:49<13:18,  1.65s/it, loss=0.171, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00101, train/loss_step=0.244, global_step=5012.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  60%|█████▉    | 723/1208 [19:49<13:18,  1.65s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00837, train/loss_vlb_step=4.01e-5, train/loss_step=0.00837, global_step=5012.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  60%|█████▉    | 724/1208 [19:52<13:17,  1.65s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00837, train/loss_vlb_step=4.01e-5, train/loss_step=0.00837, global_step=5012.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  60%|█████▉    | 724/1208 [19:52<13:17,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0929, train/loss_vlb_step=0.000308, train/loss_step=0.0929, global_step=5012.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  60%|██████    | 725/1208 [19:53<13:15,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0929, train/loss_vlb_step=0.000308, train/loss_step=0.0929, global_step=5012.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  60%|██████    | 725/1208 [19:53<13:15,  1.65s/it, loss=0.155, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00125, train/loss_step=0.291, global_step=5013.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  60%|██████    | 726/1208 [19:54<13:13,  1.65s/it, loss=0.155, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00125, train/loss_step=0.291, global_step=5013.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  60%|██████    | 726/1208 [19:54<13:13,  1.65s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000268, train/loss_step=0.0815, global_step=5013.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  60%|██████    | 727/1208 [19:55<13:11,  1.64s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000268, train/loss_step=0.0815, global_step=5013.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  60%|██████    | 727/1208 [19:55<13:11,  1.64s/it, loss=0.16, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000832, train/loss_step=0.204, global_step=5013.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  60%|██████    | 728/1208 [19:58<13:10,  1.65s/it, loss=0.16, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000832, train/loss_step=0.204, global_step=5013.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  60%|██████    | 728/1208 [19:58<13:10,  1.65s/it, loss=0.159, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000662, train/loss_step=0.185, global_step=5013.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  60%|██████    | 729/1208 [19:59<13:08,  1.65s/it, loss=0.159, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000662, train/loss_step=0.185, global_step=5013.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  60%|██████    | 729/1208 [19:59<13:08,  1.65s/it, loss=0.169, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000835, train/loss_step=0.205, global_step=5014.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  60%|██████    | 730/1208 [20:00<13:06,  1.64s/it, loss=0.169, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000835, train/loss_step=0.205, global_step=5014.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  60%|██████    | 730/1208 [20:00<13:06,  1.64s/it, loss=0.172, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=5014.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  61%|██████    | 731/1208 [20:01<13:04,  1.64s/it, loss=0.172, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=5014.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  61%|██████    | 731/1208 [20:01<13:04,  1.64s/it, loss=0.159, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00253, train/loss_step=0.373, global_step=5014.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  61%|██████    | 732/1208 [20:04<13:03,  1.65s/it, loss=0.159, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00253, train/loss_step=0.373, global_step=5014.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  61%|██████    | 732/1208 [20:04<13:03,  1.65s/it, loss=0.191, v_num=0, train/loss_simple_step=0.800, train/loss_vlb_step=0.135, train/loss_step=0.800, global_step=5014.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  61%|██████    | 733/1208 [20:05<13:01,  1.64s/it, loss=0.191, v_num=0, train/loss_simple_step=0.800, train/loss_vlb_step=0.135, train/loss_step=0.800, global_step=5014.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  61%|██████    | 733/1208 [20:05<13:01,  1.64s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000167, train/loss_step=0.0484, global_step=5015.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  61%|██████    | 734/1208 [20:06<12:59,  1.64s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000167, train/loss_step=0.0484, global_step=5015.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  61%|██████    | 734/1208 [20:06<12:59,  1.64s/it, loss=0.179, v_num=0, train/loss_simple_step=0.096, train/loss_vlb_step=0.000321, train/loss_step=0.096, global_step=5015.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  61%|██████    | 735/1208 [20:07<12:57,  1.64s/it, loss=0.179, v_num=0, train/loss_simple_step=0.096, train/loss_vlb_step=0.000321, train/loss_step=0.096, global_step=5015.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  61%|██████    | 735/1208 [20:07<12:57,  1.64s/it, loss=0.18, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.000156, train/loss_step=0.043, global_step=5015.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  61%|██████    | 736/1208 [20:10<12:56,  1.64s/it, loss=0.18, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.000156, train/loss_step=0.043, global_step=5015.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  61%|██████    | 736/1208 [20:10<12:56,  1.64s/it, loss=0.185, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=5015.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  61%|██████    | 737/1208 [20:11<12:54,  1.64s/it, loss=0.185, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=5015.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  61%|██████    | 737/1208 [20:11<12:54,  1.64s/it, loss=0.177, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000477, train/loss_step=0.142, global_step=5016.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  61%|██████    | 738/1208 [20:12<12:52,  1.64s/it, loss=0.177, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000477, train/loss_step=0.142, global_step=5016.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  61%|██████    | 738/1208 [20:12<12:52,  1.64s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=1.33e-5, train/loss_step=0.00245, global_step=5016.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  61%|██████    | 739/1208 [20:13<12:50,  1.64s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=1.33e-5, train/loss_step=0.00245, global_step=5016.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  61%|██████    | 739/1208 [20:13<12:50,  1.64s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0854, train/loss_vlb_step=0.000283, train/loss_step=0.0854, global_step=5016.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  61%|██████▏   | 740/1208 [20:16<12:49,  1.64s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0854, train/loss_vlb_step=0.000283, train/loss_step=0.0854, global_step=5016.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  61%|██████▏   | 740/1208 [20:16<12:49,  1.64s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0728, train/loss_vlb_step=0.000247, train/loss_step=0.0728, global_step=5016.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  61%|██████▏   | 741/1208 [20:17<12:47,  1.64s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0728, train/loss_vlb_step=0.000247, train/loss_step=0.0728, global_step=5016.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  61%|██████▏   | 741/1208 [20:17<12:47,  1.64s/it, loss=0.194, v_num=0, train/loss_simple_step=0.692, train/loss_vlb_step=0.0135, train/loss_step=0.692, global_step=5017.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  61%|██████▏   | 742/1208 [20:18<12:45,  1.64s/it, loss=0.194, v_num=0, train/loss_simple_step=0.692, train/loss_vlb_step=0.0135, train/loss_step=0.692, global_step=5017.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  61%|██████▏   | 742/1208 [20:18<12:45,  1.64s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00694, train/loss_vlb_step=3.52e-5, train/loss_step=0.00694, global_step=5017.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  62%|██████▏   | 743/1208 [20:19<12:43,  1.64s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00694, train/loss_vlb_step=3.52e-5, train/loss_step=0.00694, global_step=5017.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  62%|██████▏   | 743/1208 [20:19<12:43,  1.64s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000162, train/loss_step=0.0449, global_step=5017.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  62%|██████▏   | 744/1208 [20:22<12:42,  1.64s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000162, train/loss_step=0.0449, global_step=5017.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  62%|██████▏   | 744/1208 [20:22<12:42,  1.64s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0436, train/loss_vlb_step=0.000155, train/loss_step=0.0436, global_step=5017.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  62%|██████▏   | 745/1208 [20:23<12:40,  1.64s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0436, train/loss_vlb_step=0.000155, train/loss_step=0.0436, global_step=5017.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  62%|██████▏   | 745/1208 [20:23<12:40,  1.64s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00338, train/loss_vlb_step=1.89e-5, train/loss_step=0.00338, global_step=5018.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  62%|██████▏   | 746/1208 [20:24<12:38,  1.64s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00338, train/loss_vlb_step=1.89e-5, train/loss_step=0.00338, global_step=5018.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  62%|██████▏   | 746/1208 [20:24<12:38,  1.64s/it, loss=0.186, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.0044, train/loss_step=0.460, global_step=5018.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]     Epoch 16:  62%|██████▏   | 747/1208 [20:25<12:36,  1.64s/it, loss=0.186, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.0044, train/loss_step=0.460, global_step=5018.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  62%|██████▏   | 747/1208 [20:25<12:36,  1.64s/it, loss=0.19, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.0013, train/loss_step=0.288, global_step=5018.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  62%|██████▏   | 748/1208 [20:28<12:35,  1.64s/it, loss=0.19, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.0013, train/loss_step=0.288, global_step=5018.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  62%|██████▏   | 748/1208 [20:28<12:35,  1.64s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.000166, train/loss_step=0.0459, global_step=5018.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  62%|██████▏   | 749/1208 [20:29<12:33,  1.64s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.000166, train/loss_step=0.0459, global_step=5018.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  62%|██████▏   | 749/1208 [20:29<12:33,  1.64s/it, loss=0.183, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000682, train/loss_step=0.199, global_step=5019.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  62%|██████▏   | 750/1208 [20:30<12:31,  1.64s/it, loss=0.183, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000682, train/loss_step=0.199, global_step=5019.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  62%|██████▏   | 750/1208 [20:30<12:31,  1.64s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=9.44e-5, train/loss_step=0.0222, global_step=5019.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  62%|██████▏   | 751/1208 [20:31<12:29,  1.64s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=9.44e-5, train/loss_step=0.0222, global_step=5019.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  62%|██████▏   | 751/1208 [20:31<12:29,  1.64s/it, loss=0.184, v_num=0, train/loss_simple_step=0.478, train/loss_vlb_step=0.0044, train/loss_step=0.478, global_step=5019.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  62%|██████▏   | 752/1208 [20:34<12:28,  1.64s/it, loss=0.184, v_num=0, train/loss_simple_step=0.478, train/loss_vlb_step=0.0044, train/loss_step=0.478, global_step=5019.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  62%|██████▏   | 752/1208 [20:34<12:28,  1.64s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0447, train/loss_vlb_step=0.000158, train/loss_step=0.0447, global_step=5019.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  62%|██████▏   | 753/1208 [20:35<12:26,  1.64s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0447, train/loss_vlb_step=0.000158, train/loss_step=0.0447, global_step=5019.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  62%|██████▏   | 753/1208 [20:35<12:26,  1.64s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0576, train/loss_vlb_step=0.0002, train/loss_step=0.0576, global_step=5020.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  62%|██████▏   | 754/1208 [20:36<12:24,  1.64s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0576, train/loss_vlb_step=0.0002, train/loss_step=0.0576, global_step=5020.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  62%|██████▏   | 754/1208 [20:36<12:24,  1.64s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=0.000101, train/loss_step=0.0245, global_step=5020.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  62%|██████▎   | 755/1208 [20:37<12:22,  1.64s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=0.000101, train/loss_step=0.0245, global_step=5020.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  62%|██████▎   | 755/1208 [20:37<12:22,  1.64s/it, loss=0.149, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000569, train/loss_step=0.165, global_step=5020.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  63%|██████▎   | 756/1208 [20:39<12:21,  1.64s/it, loss=0.149, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000569, train/loss_step=0.165, global_step=5020.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  63%|██████▎   | 756/1208 [20:39<12:21,  1.64s/it, loss=0.166, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00368, train/loss_step=0.434, global_step=5020.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  63%|██████▎   | 757/1208 [20:40<12:19,  1.64s/it, loss=0.166, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00368, train/loss_step=0.434, global_step=5020.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  63%|██████▎   | 757/1208 [20:40<12:19,  1.64s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=2.13e-5, train/loss_step=0.00405, global_step=5021.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  63%|██████▎   | 758/1208 [20:41<12:17,  1.64s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=2.13e-5, train/loss_step=0.00405, global_step=5021.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  63%|██████▎   | 758/1208 [20:41<12:17,  1.64s/it, loss=0.164, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000331, train/loss_step=0.100, global_step=5021.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  63%|██████▎   | 759/1208 [20:42<12:15,  1.64s/it, loss=0.164, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000331, train/loss_step=0.100, global_step=5021.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  63%|██████▎   | 759/1208 [20:42<12:15,  1.64s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0708, train/loss_vlb_step=0.000233, train/loss_step=0.0708, global_step=5021.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  63%|██████▎   | 760/1208 [20:45<12:14,  1.64s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0708, train/loss_vlb_step=0.000233, train/loss_step=0.0708, global_step=5021.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  63%|██████▎   | 760/1208 [20:45<12:14,  1.64s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00432, train/loss_vlb_step=2.27e-5, train/loss_step=0.00432, global_step=5021.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  63%|██████▎   | 761/1208 [20:46<12:12,  1.64s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00432, train/loss_vlb_step=2.27e-5, train/loss_step=0.00432, global_step=5021.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  63%|██████▎   | 761/1208 [20:46<12:12,  1.64s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00737, train/loss_vlb_step=3.84e-5, train/loss_step=0.00737, global_step=5022.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  63%|██████▎   | 762/1208 [20:47<12:10,  1.64s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00737, train/loss_vlb_step=3.84e-5, train/loss_step=0.00737, global_step=5022.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  63%|██████▎   | 762/1208 [20:47<12:10,  1.64s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.64e-5, train/loss_step=0.0206, global_step=5022.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  63%|██████▎   | 763/1208 [20:48<12:08,  1.64s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.64e-5, train/loss_step=0.0206, global_step=5022.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  63%|██████▎   | 763/1208 [20:48<12:08,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00135, train/loss_step=0.307, global_step=5022.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  63%|██████▎   | 764/1208 [20:52<12:07,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00135, train/loss_step=0.307, global_step=5022.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  63%|██████▎   | 764/1208 [20:52<12:07,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.54e-5, train/loss_step=0.00272, global_step=5022.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  63%|██████▎   | 765/1208 [20:53<12:05,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.54e-5, train/loss_step=0.00272, global_step=5022.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  63%|██████▎   | 765/1208 [20:53<12:05,  1.64s/it, loss=0.149, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00112, train/loss_step=0.245, global_step=5023.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  63%|██████▎   | 766/1208 [20:54<12:03,  1.64s/it, loss=0.149, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00112, train/loss_step=0.245, global_step=5023.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  63%|██████▎   | 766/1208 [20:54<12:03,  1.64s/it, loss=0.142, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00236, train/loss_step=0.328, global_step=5023.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  63%|██████▎   | 767/1208 [20:55<12:01,  1.64s/it, loss=0.142, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00236, train/loss_step=0.328, global_step=5023.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  63%|██████▎   | 767/1208 [20:55<12:01,  1.64s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.1e-5, train/loss_step=0.0167, global_step=5023.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  64%|██████▎   | 768/1208 [20:58<12:00,  1.64s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.1e-5, train/loss_step=0.0167, global_step=5023.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  64%|██████▎   | 768/1208 [20:58<12:00,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00104, train/loss_step=0.260, global_step=5023.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  64%|██████▎   | 769/1208 [20:59<11:58,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00104, train/loss_step=0.260, global_step=5023.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  64%|██████▎   | 769/1208 [20:59<11:58,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000791, train/loss_step=0.193, global_step=5024.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  64%|██████▎   | 770/1208 [21:00<11:56,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000791, train/loss_step=0.193, global_step=5024.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  64%|██████▎   | 770/1208 [21:00<11:56,  1.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=1.95e-5, train/loss_step=0.00357, global_step=5024.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  64%|██████▍   | 771/1208 [21:01<11:55,  1.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=1.95e-5, train/loss_step=0.00357, global_step=5024.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  64%|██████▍   | 771/1208 [21:01<11:55,  1.64s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0629, train/loss_vlb_step=0.000215, train/loss_step=0.0629, global_step=5024.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  64%|██████▍   | 772/1208 [21:04<11:54,  1.64s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0629, train/loss_vlb_step=0.000215, train/loss_step=0.0629, global_step=5024.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  64%|██████▍   | 772/1208 [21:04<11:54,  1.64s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0909, train/loss_vlb_step=0.000299, train/loss_step=0.0909, global_step=5024.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  64%|██████▍   | 773/1208 [21:05<11:52,  1.64s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0909, train/loss_vlb_step=0.000299, train/loss_step=0.0909, global_step=5024.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  64%|██████▍   | 773/1208 [21:05<11:52,  1.64s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.09e-5, train/loss_step=0.0108, global_step=5025.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  64%|██████▍   | 774/1208 [21:06<11:50,  1.64s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.09e-5, train/loss_step=0.0108, global_step=5025.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  64%|██████▍   | 774/1208 [21:06<11:50,  1.64s/it, loss=0.128, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.000928, train/loss_step=0.243, global_step=5025.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  64%|██████▍   | 775/1208 [21:07<11:48,  1.64s/it, loss=0.128, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.000928, train/loss_step=0.243, global_step=5025.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  64%|██████▍   | 775/1208 [21:07<11:48,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.492, train/loss_vlb_step=0.00399, train/loss_step=0.492, global_step=5025.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  64%|██████▍   | 776/1208 [21:11<11:47,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.492, train/loss_vlb_step=0.00399, train/loss_step=0.492, global_step=5025.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  64%|██████▍   | 776/1208 [21:11<11:47,  1.64s/it, loss=0.134, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000916, train/loss_step=0.227, global_step=5025.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  64%|██████▍   | 777/1208 [21:12<11:45,  1.64s/it, loss=0.134, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000916, train/loss_step=0.227, global_step=5025.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  64%|██████▍   | 777/1208 [21:12<11:45,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.000172, train/loss_step=0.0482, global_step=5026.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  64%|██████▍   | 778/1208 [21:13<11:43,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.000172, train/loss_step=0.0482, global_step=5026.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  64%|██████▍   | 778/1208 [21:13<11:43,  1.64s/it, loss=0.158, v_num=0, train/loss_simple_step=0.527, train/loss_vlb_step=0.00479, train/loss_step=0.527, global_step=5026.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  64%|██████▍   | 779/1208 [21:14<11:41,  1.64s/it, loss=0.158, v_num=0, train/loss_simple_step=0.527, train/loss_vlb_step=0.00479, train/loss_step=0.527, global_step=5026.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  64%|██████▍   | 779/1208 [21:14<11:41,  1.64s/it, loss=0.163, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000582, train/loss_step=0.172, global_step=5026.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  65%|██████▍   | 780/1208 [21:17<11:40,  1.64s/it, loss=0.163, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000582, train/loss_step=0.172, global_step=5026.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  65%|██████▍   | 780/1208 [21:17<11:40,  1.64s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.27e-5, train/loss_step=0.0118, global_step=5026.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  65%|██████▍   | 781/1208 [21:18<11:39,  1.64s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.27e-5, train/loss_step=0.0118, global_step=5026.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  65%|██████▍   | 781/1208 [21:18<11:39,  1.64s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.03e-5, train/loss_step=0.00176, global_step=5027.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  65%|██████▍   | 782/1208 [21:19<11:37,  1.64s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.03e-5, train/loss_step=0.00176, global_step=5027.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  65%|██████▍   | 782/1208 [21:19<11:37,  1.64s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=2.03e-5, train/loss_step=0.00368, global_step=5027.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  65%|██████▍   | 783/1208 [21:20<11:35,  1.64s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=2.03e-5, train/loss_step=0.00368, global_step=5027.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  65%|██████▍   | 783/1208 [21:20<11:35,  1.64s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00623, train/loss_vlb_step=3.14e-5, train/loss_step=0.00623, global_step=5027.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  65%|██████▍   | 784/1208 [21:23<11:34,  1.64s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00623, train/loss_vlb_step=3.14e-5, train/loss_step=0.00623, global_step=5027.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  65%|██████▍   | 784/1208 [21:23<11:34,  1.64s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.00013, train/loss_step=0.0333, global_step=5027.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  65%|██████▍   | 785/1208 [21:24<11:32,  1.64s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.00013, train/loss_step=0.0333, global_step=5027.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  65%|██████▍   | 785/1208 [21:24<11:32,  1.64s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0804, train/loss_vlb_step=0.000268, train/loss_step=0.0804, global_step=5028.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  65%|██████▌   | 786/1208 [21:26<11:30,  1.64s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0804, train/loss_vlb_step=0.000268, train/loss_step=0.0804, global_step=5028.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  65%|██████▌   | 786/1208 [21:26<11:30,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000668, train/loss_step=0.181, global_step=5028.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  65%|██████▌   | 787/1208 [21:27<11:28,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000668, train/loss_step=0.181, global_step=5028.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  65%|██████▌   | 787/1208 [21:27<11:28,  1.64s/it, loss=0.141, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.00059, train/loss_step=0.172, global_step=5028.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  65%|██████▌   | 788/1208 [21:30<11:27,  1.64s/it, loss=0.141, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.00059, train/loss_step=0.172, global_step=5028.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  65%|██████▌   | 788/1208 [21:30<11:27,  1.64s/it, loss=0.149, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00289, train/loss_step=0.415, global_step=5028.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  65%|██████▌   | 789/1208 [21:31<11:25,  1.64s/it, loss=0.149, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00289, train/loss_step=0.415, global_step=5028.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  65%|██████▌   | 789/1208 [21:31<11:25,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000384, train/loss_step=0.117, global_step=5029.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  65%|██████▌   | 790/1208 [21:32<11:23,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000384, train/loss_step=0.117, global_step=5029.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  65%|██████▌   | 790/1208 [21:32<11:23,  1.64s/it, loss=0.15, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000344, train/loss_step=0.104, global_step=5029.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  65%|██████▌   | 791/1208 [21:33<11:21,  1.64s/it, loss=0.15, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000344, train/loss_step=0.104, global_step=5029.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  65%|██████▌   | 791/1208 [21:33<11:21,  1.64s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00343, train/loss_vlb_step=1.92e-5, train/loss_step=0.00343, global_step=5029.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  66%|██████▌   | 792/1208 [21:36<11:21,  1.64s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00343, train/loss_vlb_step=1.92e-5, train/loss_step=0.00343, global_step=5029.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  66%|██████▌   | 792/1208 [21:36<11:21,  1.64s/it, loss=0.157, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00155, train/loss_step=0.291, global_step=5029.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  66%|██████▌   | 793/1208 [21:37<11:19,  1.64s/it, loss=0.157, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00155, train/loss_step=0.291, global_step=5029.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  66%|██████▌   | 793/1208 [21:37<11:19,  1.64s/it, loss=0.168, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.00101, train/loss_step=0.236, global_step=5030.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  66%|██████▌   | 794/1208 [21:38<11:17,  1.64s/it, loss=0.168, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.00101, train/loss_step=0.236, global_step=5030.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  66%|██████▌   | 794/1208 [21:38<11:17,  1.64s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=4.86e-5, train/loss_step=0.0109, global_step=5030.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  66%|██████▌   | 795/1208 [21:39<11:15,  1.64s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=4.86e-5, train/loss_step=0.0109, global_step=5030.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  66%|██████▌   | 795/1208 [21:39<11:15,  1.64s/it, loss=0.142, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000682, train/loss_step=0.190, global_step=5030.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  66%|██████▌   | 796/1208 [21:42<11:14,  1.64s/it, loss=0.142, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000682, train/loss_step=0.190, global_step=5030.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  66%|██████▌   | 796/1208 [21:42<11:14,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.92e-5, train/loss_step=0.0104, global_step=5030.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  66%|██████▌   | 797/1208 [21:43<11:12,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.92e-5, train/loss_step=0.0104, global_step=5030.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  66%|██████▌   | 797/1208 [21:43<11:12,  1.64s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00446, train/loss_vlb_step=2.39e-5, train/loss_step=0.00446, global_step=5031.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  66%|██████▌   | 798/1208 [21:44<11:10,  1.64s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00446, train/loss_vlb_step=2.39e-5, train/loss_step=0.00446, global_step=5031.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  66%|██████▌   | 798/1208 [21:44<11:10,  1.64s/it, loss=0.109, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000418, train/loss_step=0.126, global_step=5031.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  66%|██████▌   | 799/1208 [21:45<11:08,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000418, train/loss_step=0.126, global_step=5031.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  66%|██████▌   | 799/1208 [21:45<11:08,  1.63s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0956, train/loss_vlb_step=0.000331, train/loss_step=0.0956, global_step=5031.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  66%|██████▌   | 800/1208 [21:48<11:07,  1.64s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0956, train/loss_vlb_step=0.000331, train/loss_step=0.0956, global_step=5031.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  66%|██████▌   | 800/1208 [21:48<11:07,  1.64s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0998, train/loss_vlb_step=0.000332, train/loss_step=0.0998, global_step=5031.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  66%|██████▋   | 801/1208 [21:50<11:05,  1.64s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0998, train/loss_vlb_step=0.000332, train/loss_step=0.0998, global_step=5031.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  66%|██████▋   | 801/1208 [21:50<11:05,  1.64s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.89e-5, train/loss_step=0.0187, global_step=5032.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  66%|██████▋   | 802/1208 [21:51<11:03,  1.63s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.89e-5, train/loss_step=0.0187, global_step=5032.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  66%|██████▋   | 802/1208 [21:51<11:03,  1.63s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.52e-5, train/loss_step=0.0206, global_step=5032.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  66%|██████▋   | 803/1208 [21:52<11:01,  1.63s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.52e-5, train/loss_step=0.0206, global_step=5032.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  66%|██████▋   | 803/1208 [21:52<11:01,  1.63s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0651, train/loss_vlb_step=0.000225, train/loss_step=0.0651, global_step=5032.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  67%|██████▋   | 804/1208 [21:55<11:00,  1.64s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0651, train/loss_vlb_step=0.000225, train/loss_step=0.0651, global_step=5032.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  67%|██████▋   | 804/1208 [21:55<11:00,  1.64s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.73e-5, train/loss_step=0.0128, global_step=5032.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  67%|██████▋   | 805/1208 [21:56<10:59,  1.64s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.73e-5, train/loss_step=0.0128, global_step=5032.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  67%|██████▋   | 805/1208 [21:56<10:59,  1.64s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=3.45e-5, train/loss_step=0.00677, global_step=5033.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  67%|██████▋   | 806/1208 [21:57<10:57,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=3.45e-5, train/loss_step=0.00677, global_step=5033.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  67%|██████▋   | 806/1208 [21:57<10:57,  1.63s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.00016, train/loss_step=0.0437, global_step=5033.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  67%|██████▋   | 807/1208 [21:58<10:55,  1.63s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.00016, train/loss_step=0.0437, global_step=5033.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  67%|██████▋   | 807/1208 [21:58<10:55,  1.63s/it, loss=0.0959, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.00017, train/loss_step=0.0468, global_step=5033.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  67%|██████▋   | 808/1208 [22:01<10:54,  1.64s/it, loss=0.0959, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.00017, train/loss_step=0.0468, global_step=5033.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  67%|██████▋   | 808/1208 [22:01<10:54,  1.64s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00157, train/loss_step=0.310, global_step=5033.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  67%|██████▋   | 809/1208 [22:02<10:52,  1.64s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00157, train/loss_step=0.310, global_step=5033.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  67%|██████▋   | 809/1208 [22:02<10:52,  1.64s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.0587, train/loss_vlb_step=0.000207, train/loss_step=0.0587, global_step=5034.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  67%|██████▋   | 810/1208 [22:03<10:50,  1.63s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.0587, train/loss_vlb_step=0.000207, train/loss_step=0.0587, global_step=5034.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  67%|██████▋   | 810/1208 [22:03<10:50,  1.63s/it, loss=0.0828, v_num=0, train/loss_simple_step=0.00457, train/loss_vlb_step=2.48e-5, train/loss_step=0.00457, global_step=5034.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  67%|██████▋   | 811/1208 [22:04<10:48,  1.63s/it, loss=0.0828, v_num=0, train/loss_simple_step=0.00457, train/loss_vlb_step=2.48e-5, train/loss_step=0.00457, global_step=5034.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  67%|██████▋   | 811/1208 [22:04<10:48,  1.63s/it, loss=0.0847, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000146, train/loss_step=0.0412, global_step=5034.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  67%|██████▋   | 812/1208 [22:08<10:47,  1.64s/it, loss=0.0847, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000146, train/loss_step=0.0412, global_step=5034.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  67%|██████▋   | 812/1208 [22:08<10:47,  1.64s/it, loss=0.0804, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000823, train/loss_step=0.206, global_step=5034.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  67%|██████▋   | 813/1208 [22:09<10:45,  1.63s/it, loss=0.0804, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000823, train/loss_step=0.206, global_step=5034.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  67%|██████▋   | 813/1208 [22:09<10:45,  1.63s/it, loss=0.0689, v_num=0, train/loss_simple_step=0.00697, train/loss_vlb_step=3.59e-5, train/loss_step=0.00697, global_step=5035.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  67%|██████▋   | 814/1208 [22:10<10:43,  1.63s/it, loss=0.0689, v_num=0, train/loss_simple_step=0.00697, train/loss_vlb_step=3.59e-5, train/loss_step=0.00697, global_step=5035.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  67%|██████▋   | 814/1208 [22:10<10:43,  1.63s/it, loss=0.085, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00178, train/loss_step=0.333, global_step=5035.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]     Epoch 16:  67%|██████▋   | 815/1208 [22:11<10:41,  1.63s/it, loss=0.085, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00178, train/loss_step=0.333, global_step=5035.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  67%|██████▋   | 815/1208 [22:11<10:41,  1.63s/it, loss=0.0758, v_num=0, train/loss_simple_step=0.00529, train/loss_vlb_step=2.68e-5, train/loss_step=0.00529, global_step=5035.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  68%|██████▊   | 816/1208 [22:14<10:41,  1.64s/it, loss=0.0758, v_num=0, train/loss_simple_step=0.00529, train/loss_vlb_step=2.68e-5, train/loss_step=0.00529, global_step=5035.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  68%|██████▊   | 816/1208 [22:14<10:41,  1.64s/it, loss=0.0755, v_num=0, train/loss_simple_step=0.00449, train/loss_vlb_step=2.39e-5, train/loss_step=0.00449, global_step=5035.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  68%|██████▊   | 817/1208 [22:15<10:39,  1.63s/it, loss=0.0755, v_num=0, train/loss_simple_step=0.00449, train/loss_vlb_step=2.39e-5, train/loss_step=0.00449, global_step=5035.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  68%|██████▊   | 817/1208 [22:15<10:39,  1.63s/it, loss=0.077, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000129, train/loss_step=0.0344, global_step=5036.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  68%|██████▊   | 818/1208 [22:16<10:37,  1.63s/it, loss=0.077, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000129, train/loss_step=0.0344, global_step=5036.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  68%|██████▊   | 818/1208 [22:16<10:37,  1.63s/it, loss=0.0707, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=8.18e-6, train/loss_step=0.00135, global_step=5036.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  68%|██████▊   | 819/1208 [22:17<10:35,  1.63s/it, loss=0.0707, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=8.18e-6, train/loss_step=0.00135, global_step=5036.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  68%|██████▊   | 819/1208 [22:17<10:35,  1.63s/it, loss=0.0664, v_num=0, train/loss_simple_step=0.00836, train/loss_vlb_step=3.91e-5, train/loss_step=0.00836, global_step=5036.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  68%|██████▊   | 820/1208 [22:20<10:34,  1.64s/it, loss=0.0664, v_num=0, train/loss_simple_step=0.00836, train/loss_vlb_step=3.91e-5, train/loss_step=0.00836, global_step=5036.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  68%|██████▊   | 820/1208 [22:20<10:34,  1.64s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.0062, train/loss_step=0.458, global_step=5036.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]     Epoch 16:  68%|██████▊   | 821/1208 [22:21<10:32,  1.63s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.0062, train/loss_step=0.458, global_step=5036.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  68%|██████▊   | 821/1208 [22:21<10:32,  1.63s/it, loss=0.0873, v_num=0, train/loss_simple_step=0.0788, train/loss_vlb_step=0.000267, train/loss_step=0.0788, global_step=5037.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  68%|██████▊   | 822/1208 [22:22<10:30,  1.63s/it, loss=0.0873, v_num=0, train/loss_simple_step=0.0788, train/loss_vlb_step=0.000267, train/loss_step=0.0788, global_step=5037.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  68%|██████▊   | 822/1208 [22:22<10:30,  1.63s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=5037.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  68%|██████▊   | 823/1208 [22:24<10:28,  1.63s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=5037.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  68%|██████▊   | 823/1208 [22:24<10:28,  1.63s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.0515, train/loss_vlb_step=0.000181, train/loss_step=0.0515, global_step=5037.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  68%|██████▊   | 824/1208 [22:27<10:27,  1.63s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.0515, train/loss_vlb_step=0.000181, train/loss_step=0.0515, global_step=5037.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  68%|██████▊   | 824/1208 [22:27<10:27,  1.63s/it, loss=0.104, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00118, train/loss_step=0.267, global_step=5037.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  68%|██████▊   | 825/1208 [22:28<10:25,  1.63s/it, loss=0.104, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00118, train/loss_step=0.267, global_step=5037.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  68%|██████▊   | 825/1208 [22:28<10:25,  1.63s/it, loss=0.118, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00127, train/loss_step=0.289, global_step=5038.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  68%|██████▊   | 826/1208 [22:29<10:24,  1.63s/it, loss=0.118, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00127, train/loss_step=0.289, global_step=5038.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  68%|██████▊   | 826/1208 [22:29<10:24,  1.63s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=8.06e-5, train/loss_step=0.0187, global_step=5038.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  68%|██████▊   | 827/1208 [22:30<10:22,  1.63s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=8.06e-5, train/loss_step=0.0187, global_step=5038.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  68%|██████▊   | 827/1208 [22:30<10:22,  1.63s/it, loss=0.133, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00186, train/loss_step=0.364, global_step=5038.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  69%|██████▊   | 828/1208 [22:33<10:21,  1.63s/it, loss=0.133, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00186, train/loss_step=0.364, global_step=5038.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  69%|██████▊   | 828/1208 [22:33<10:21,  1.63s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0383, train/loss_vlb_step=0.00014, train/loss_step=0.0383, global_step=5038.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  69%|██████▊   | 829/1208 [22:34<10:19,  1.63s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0383, train/loss_vlb_step=0.00014, train/loss_step=0.0383, global_step=5038.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  69%|██████▊   | 829/1208 [22:34<10:19,  1.63s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.5e-5, train/loss_step=0.0154, global_step=5039.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  69%|██████▊   | 830/1208 [22:35<10:17,  1.63s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.5e-5, train/loss_step=0.0154, global_step=5039.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  69%|██████▊   | 830/1208 [22:35<10:17,  1.63s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000106, train/loss_step=0.0274, global_step=5039.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  69%|██████▉   | 831/1208 [22:36<10:15,  1.63s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000106, train/loss_step=0.0274, global_step=5039.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  69%|██████▉   | 831/1208 [22:36<10:15,  1.63s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000144, train/loss_step=0.0416, global_step=5039.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  69%|██████▉   | 832/1208 [22:39<10:14,  1.63s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000144, train/loss_step=0.0416, global_step=5039.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  69%|██████▉   | 832/1208 [22:39<10:14,  1.63s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.000119, train/loss_step=0.0313, global_step=5039.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  69%|██████▉   | 833/1208 [22:40<10:12,  1.63s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.000119, train/loss_step=0.0313, global_step=5039.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  69%|██████▉   | 833/1208 [22:40<10:12,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.68e-5, train/loss_step=0.003, global_step=5040.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  69%|██████▉   | 834/1208 [22:41<10:10,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.68e-5, train/loss_step=0.003, global_step=5040.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  69%|██████▉   | 834/1208 [22:41<10:10,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00169, train/loss_step=0.317, global_step=5040.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  69%|██████▉   | 835/1208 [22:42<10:08,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00169, train/loss_step=0.317, global_step=5040.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  69%|██████▉   | 835/1208 [22:42<10:08,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0057, train/loss_vlb_step=2.87e-5, train/loss_step=0.0057, global_step=5040.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  69%|██████▉   | 836/1208 [22:45<10:07,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0057, train/loss_vlb_step=2.87e-5, train/loss_step=0.0057, global_step=5040.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  69%|██████▉   | 836/1208 [22:45<10:07,  1.63s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=9.23e-5, train/loss_step=0.0225, global_step=5040.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  69%|██████▉   | 837/1208 [22:46<10:05,  1.63s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=9.23e-5, train/loss_step=0.0225, global_step=5040.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  69%|██████▉   | 837/1208 [22:46<10:05,  1.63s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.36e-5, train/loss_step=0.0124, global_step=5041.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  69%|██████▉   | 838/1208 [22:47<10:03,  1.63s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.36e-5, train/loss_step=0.0124, global_step=5041.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  69%|██████▉   | 838/1208 [22:47<10:03,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.85e-5, train/loss_step=0.0033, global_step=5041.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  69%|██████▉   | 839/1208 [22:48<10:02,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.85e-5, train/loss_step=0.0033, global_step=5041.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  69%|██████▉   | 839/1208 [22:48<10:02,  1.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.00033, train/loss_step=0.100, global_step=5041.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  70%|██████▉   | 840/1208 [22:52<10:01,  1.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.00033, train/loss_step=0.100, global_step=5041.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  70%|██████▉   | 840/1208 [22:52<10:01,  1.63s/it, loss=0.101, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000803, train/loss_step=0.207, global_step=5041.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  70%|██████▉   | 841/1208 [22:53<09:59,  1.63s/it, loss=0.101, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000803, train/loss_step=0.207, global_step=5041.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  70%|██████▉   | 841/1208 [22:53<09:59,  1.63s/it, loss=0.099, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.000174, train/loss_step=0.0471, global_step=5042.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  70%|██████▉   | 842/1208 [22:54<09:57,  1.63s/it, loss=0.099, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.000174, train/loss_step=0.0471, global_step=5042.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  70%|██████▉   | 842/1208 [22:54<09:57,  1.63s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.0701, train/loss_vlb_step=0.000234, train/loss_step=0.0701, global_step=5042.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  70%|██████▉   | 843/1208 [22:55<09:55,  1.63s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.0701, train/loss_vlb_step=0.000234, train/loss_step=0.0701, global_step=5042.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  70%|██████▉   | 843/1208 [22:55<09:55,  1.63s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.0071, train/loss_vlb_step=3.64e-5, train/loss_step=0.0071, global_step=5042.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  70%|██████▉   | 844/1208 [22:58<09:54,  1.63s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.0071, train/loss_vlb_step=3.64e-5, train/loss_step=0.0071, global_step=5042.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  70%|██████▉   | 844/1208 [22:58<09:54,  1.63s/it, loss=0.0912, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000711, train/loss_step=0.203, global_step=5042.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  70%|██████▉   | 845/1208 [22:59<09:52,  1.63s/it, loss=0.0912, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000711, train/loss_step=0.203, global_step=5042.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  70%|██████▉   | 845/1208 [22:59<09:52,  1.63s/it, loss=0.0831, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000417, train/loss_step=0.127, global_step=5043.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  70%|███████   | 846/1208 [23:00<09:50,  1.63s/it, loss=0.0831, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000417, train/loss_step=0.127, global_step=5043.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  70%|███████   | 846/1208 [23:00<09:50,  1.63s/it, loss=0.0847, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000173, train/loss_step=0.051, global_step=5043.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  70%|███████   | 847/1208 [23:01<09:48,  1.63s/it, loss=0.0847, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000173, train/loss_step=0.051, global_step=5043.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  70%|███████   | 847/1208 [23:01<09:48,  1.63s/it, loss=0.0675, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.52e-5, train/loss_step=0.0206, global_step=5043.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  70%|███████   | 848/1208 [23:04<09:47,  1.63s/it, loss=0.0675, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.52e-5, train/loss_step=0.0206, global_step=5043.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  70%|███████   | 848/1208 [23:04<09:47,  1.63s/it, loss=0.0669, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000104, train/loss_step=0.0264, global_step=5043.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  70%|███████   | 849/1208 [23:05<09:46,  1.63s/it, loss=0.0669, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000104, train/loss_step=0.0264, global_step=5043.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  70%|███████   | 849/1208 [23:05<09:46,  1.63s/it, loss=0.0713, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.00034, train/loss_step=0.103, global_step=5044.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  70%|███████   | 850/1208 [23:06<09:44,  1.63s/it, loss=0.0713, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.00034, train/loss_step=0.103, global_step=5044.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  70%|███████   | 850/1208 [23:06<09:44,  1.63s/it, loss=0.0842, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00145, train/loss_step=0.286, global_step=5044.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  70%|███████   | 851/1208 [23:08<09:42,  1.63s/it, loss=0.0842, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00145, train/loss_step=0.286, global_step=5044.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  70%|███████   | 851/1208 [23:08<09:42,  1.63s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.00056, train/loss_step=0.167, global_step=5044.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  71%|███████   | 852/1208 [23:11<09:41,  1.63s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.00056, train/loss_step=0.167, global_step=5044.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  71%|███████   | 852/1208 [23:11<09:41,  1.63s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.0952, train/loss_vlb_step=0.000315, train/loss_step=0.0952, global_step=5044.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  71%|███████   | 853/1208 [23:12<09:39,  1.63s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.0952, train/loss_vlb_step=0.000315, train/loss_step=0.0952, global_step=5044.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  71%|███████   | 853/1208 [23:12<09:39,  1.63s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.0646, train/loss_vlb_step=0.000224, train/loss_step=0.0646, global_step=5045.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  71%|███████   | 854/1208 [23:13<09:37,  1.63s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.0646, train/loss_vlb_step=0.000224, train/loss_step=0.0646, global_step=5045.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  71%|███████   | 854/1208 [23:13<09:37,  1.63s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000414, train/loss_step=0.123, global_step=5045.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  71%|███████   | 855/1208 [23:14<09:35,  1.63s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000414, train/loss_step=0.123, global_step=5045.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  71%|███████   | 855/1208 [23:14<09:35,  1.63s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000489, train/loss_step=0.146, global_step=5045.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  71%|███████   | 856/1208 [23:17<09:34,  1.63s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000489, train/loss_step=0.146, global_step=5045.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  71%|███████   | 856/1208 [23:17<09:34,  1.63s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.073, train/loss_vlb_step=0.000244, train/loss_step=0.073, global_step=5045.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  71%|███████   | 857/1208 [23:18<09:32,  1.63s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.073, train/loss_vlb_step=0.000244, train/loss_step=0.073, global_step=5045.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  71%|███████   | 857/1208 [23:18<09:32,  1.63s/it, loss=0.104, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.00055, train/loss_step=0.162, global_step=5046.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  71%|███████   | 858/1208 [23:19<09:31,  1.63s/it, loss=0.104, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.00055, train/loss_step=0.162, global_step=5046.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  71%|███████   | 858/1208 [23:19<09:31,  1.63s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00172, train/loss_vlb_step=1.04e-5, train/loss_step=0.00172, global_step=5046.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  71%|███████   | 859/1208 [23:20<09:29,  1.63s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00172, train/loss_vlb_step=1.04e-5, train/loss_step=0.00172, global_step=5046.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  71%|███████   | 859/1208 [23:20<09:29,  1.63s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0855, train/loss_vlb_step=0.000282, train/loss_step=0.0855, global_step=5046.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  71%|███████   | 860/1208 [23:24<09:28,  1.63s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0855, train/loss_vlb_step=0.000282, train/loss_step=0.0855, global_step=5046.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  71%|███████   | 860/1208 [23:24<09:28,  1.63s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000462, train/loss_step=0.139, global_step=5046.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  71%|███████▏  | 861/1208 [23:25<09:26,  1.63s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000462, train/loss_step=0.139, global_step=5046.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  71%|███████▏  | 861/1208 [23:25<09:26,  1.63s/it, loss=0.105, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000501, train/loss_step=0.150, global_step=5047.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  71%|███████▏  | 862/1208 [23:26<09:24,  1.63s/it, loss=0.105, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000501, train/loss_step=0.150, global_step=5047.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  71%|███████▏  | 862/1208 [23:26<09:24,  1.63s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.0001, train/loss_step=0.0263, global_step=5047.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  71%|███████▏  | 863/1208 [23:27<09:22,  1.63s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.0001, train/loss_step=0.0263, global_step=5047.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  71%|███████▏  | 863/1208 [23:27<09:22,  1.63s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0477, train/loss_vlb_step=0.000166, train/loss_step=0.0477, global_step=5047.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  72%|███████▏  | 864/1208 [23:30<09:21,  1.63s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0477, train/loss_vlb_step=0.000166, train/loss_step=0.0477, global_step=5047.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  72%|███████▏  | 864/1208 [23:30<09:21,  1.63s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.000205, train/loss_step=0.0615, global_step=5047.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  72%|███████▏  | 865/1208 [23:31<09:19,  1.63s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.000205, train/loss_step=0.0615, global_step=5047.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  72%|███████▏  | 865/1208 [23:31<09:19,  1.63s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.0643, train/loss_vlb_step=0.000219, train/loss_step=0.0643, global_step=5048.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  72%|███████▏  | 866/1208 [23:32<09:17,  1.63s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.0643, train/loss_vlb_step=0.000219, train/loss_step=0.0643, global_step=5048.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  72%|███████▏  | 866/1208 [23:32<09:17,  1.63s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=8.71e-5, train/loss_step=0.0223, global_step=5048.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  72%|███████▏  | 867/1208 [23:33<09:15,  1.63s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=8.71e-5, train/loss_step=0.0223, global_step=5048.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  72%|███████▏  | 867/1208 [23:33<09:15,  1.63s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.00605, train/loss_vlb_step=3.17e-5, train/loss_step=0.00605, global_step=5048.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  72%|███████▏  | 868/1208 [23:36<09:14,  1.63s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.00605, train/loss_vlb_step=3.17e-5, train/loss_step=0.00605, global_step=5048.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  72%|███████▏  | 868/1208 [23:36<09:14,  1.63s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=1.79e-5, train/loss_step=0.00334, global_step=5048.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  72%|███████▏  | 869/1208 [23:37<09:12,  1.63s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=1.79e-5, train/loss_step=0.00334, global_step=5048.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  72%|███████▏  | 869/1208 [23:37<09:12,  1.63s/it, loss=0.0893, v_num=0, train/loss_simple_step=0.0621, train/loss_vlb_step=0.000208, train/loss_step=0.0621, global_step=5049.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  72%|███████▏  | 870/1208 [23:38<09:11,  1.63s/it, loss=0.0893, v_num=0, train/loss_simple_step=0.0621, train/loss_vlb_step=0.000208, train/loss_step=0.0621, global_step=5049.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  72%|███████▏  | 870/1208 [23:38<09:11,  1.63s/it, loss=0.0754, v_num=0, train/loss_simple_step=0.00776, train/loss_vlb_step=3.73e-5, train/loss_step=0.00776, global_step=5049.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  72%|███████▏  | 871/1208 [23:39<09:09,  1.63s/it, loss=0.0754, v_num=0, train/loss_simple_step=0.00776, train/loss_vlb_step=3.73e-5, train/loss_step=0.00776, global_step=5049.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  72%|███████▏  | 871/1208 [23:39<09:09,  1.63s/it, loss=0.0791, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.00103, train/loss_step=0.240, global_step=5049.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  72%|███████▏  | 872/1208 [23:42<09:08,  1.63s/it, loss=0.0791, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.00103, train/loss_step=0.240, global_step=5049.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  72%|███████▏  | 872/1208 [23:42<09:08,  1.63s/it, loss=0.0746, v_num=0, train/loss_simple_step=0.00636, train/loss_vlb_step=3.28e-5, train/loss_step=0.00636, global_step=5049.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  72%|███████▏  | 873/1208 [23:43<09:06,  1.63s/it, loss=0.0746, v_num=0, train/loss_simple_step=0.00636, train/loss_vlb_step=3.28e-5, train/loss_step=0.00636, global_step=5049.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  72%|███████▏  | 873/1208 [23:43<09:06,  1.63s/it, loss=0.0836, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000962, train/loss_step=0.244, global_step=5050.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  72%|███████▏  | 874/1208 [23:44<09:04,  1.63s/it, loss=0.0836, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000962, train/loss_step=0.244, global_step=5050.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  72%|███████▏  | 874/1208 [23:44<09:04,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.771, train/loss_vlb_step=0.0288, train/loss_step=0.771, global_step=5050.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  72%|███████▏  | 875/1208 [23:45<09:02,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.771, train/loss_vlb_step=0.0288, train/loss_step=0.771, global_step=5050.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  72%|███████▏  | 875/1208 [23:45<09:02,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00947, train/loss_vlb_step=4.48e-5, train/loss_step=0.00947, global_step=5050.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  73%|███████▎  | 876/1208 [23:48<09:01,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00947, train/loss_vlb_step=4.48e-5, train/loss_step=0.00947, global_step=5050.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  73%|███████▎  | 876/1208 [23:48<09:01,  1.63s/it, loss=0.125, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00393, train/loss_step=0.394, global_step=5050.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  73%|███████▎  | 877/1208 [23:49<08:59,  1.63s/it, loss=0.125, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00393, train/loss_step=0.394, global_step=5050.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  73%|███████▎  | 877/1208 [23:49<08:59,  1.63s/it, loss=0.125, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000499, train/loss_step=0.151, global_step=5051.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  73%|███████▎  | 878/1208 [23:50<08:57,  1.63s/it, loss=0.125, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000499, train/loss_step=0.151, global_step=5051.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  73%|███████▎  | 878/1208 [23:50<08:57,  1.63s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0718, train/loss_vlb_step=0.000245, train/loss_step=0.0718, global_step=5051.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  73%|███████▎  | 879/1208 [23:51<08:55,  1.63s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0718, train/loss_vlb_step=0.000245, train/loss_step=0.0718, global_step=5051.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  73%|███████▎  | 879/1208 [23:51<08:55,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00584, train/loss_vlb_step=3.08e-5, train/loss_step=0.00584, global_step=5051.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  73%|███████▎  | 880/1208 [23:54<08:54,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00584, train/loss_vlb_step=3.08e-5, train/loss_step=0.00584, global_step=5051.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  73%|███████▎  | 880/1208 [23:54<08:54,  1.63s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000203, train/loss_step=0.0588, global_step=5051.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  73%|███████▎  | 881/1208 [23:55<08:52,  1.63s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000203, train/loss_step=0.0588, global_step=5051.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  73%|███████▎  | 881/1208 [23:55<08:52,  1.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.04e-5, train/loss_step=0.0115, global_step=5052.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  73%|███████▎  | 882/1208 [23:56<08:50,  1.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.04e-5, train/loss_step=0.0115, global_step=5052.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  73%|███████▎  | 882/1208 [23:56<08:50,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000664, train/loss_step=0.188, global_step=5052.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  73%|███████▎  | 883/1208 [23:57<08:48,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000664, train/loss_step=0.188, global_step=5052.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  73%|███████▎  | 883/1208 [23:57<08:48,  1.63s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.000184, train/loss_step=0.0521, global_step=5052.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  73%|███████▎  | 884/1208 [24:00<08:47,  1.63s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.000184, train/loss_step=0.0521, global_step=5052.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  73%|███████▎  | 884/1208 [24:00<08:47,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.00017, train/loss_step=0.0485, global_step=5052.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  73%|███████▎  | 885/1208 [24:01<08:45,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.00017, train/loss_step=0.0485, global_step=5052.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  73%|███████▎  | 885/1208 [24:01<08:45,  1.63s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000136, train/loss_step=0.0367, global_step=5053.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  73%|███████▎  | 886/1208 [24:02<08:44,  1.63s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000136, train/loss_step=0.0367, global_step=5053.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  73%|███████▎  | 886/1208 [24:02<08:44,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=5053.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  73%|███████▎  | 887/1208 [24:03<08:42,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=5053.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  73%|███████▎  | 887/1208 [24:03<08:42,  1.63s/it, loss=0.163, v_num=0, train/loss_simple_step=0.800, train/loss_vlb_step=0.0682, train/loss_step=0.800, global_step=5053.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  74%|███████▎  | 888/1208 [24:06<08:41,  1.63s/it, loss=0.163, v_num=0, train/loss_simple_step=0.800, train/loss_vlb_step=0.0682, train/loss_step=0.800, global_step=5053.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  74%|███████▎  | 888/1208 [24:06<08:41,  1.63s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0354, train/loss_vlb_step=0.000132, train/loss_step=0.0354, global_step=5053.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  74%|███████▎  | 889/1208 [24:07<08:39,  1.63s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0354, train/loss_vlb_step=0.000132, train/loss_step=0.0354, global_step=5053.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  74%|███████▎  | 889/1208 [24:07<08:39,  1.63s/it, loss=0.172, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.0007, train/loss_step=0.194, global_step=5054.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  74%|███████▎  | 890/1208 [24:08<08:37,  1.63s/it, loss=0.172, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.0007, train/loss_step=0.194, global_step=5054.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  74%|███████▎  | 890/1208 [24:08<08:37,  1.63s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00437, train/loss_vlb_step=2.36e-5, train/loss_step=0.00437, global_step=5054.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  74%|███████▍  | 891/1208 [24:09<08:35,  1.63s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00437, train/loss_vlb_step=2.36e-5, train/loss_step=0.00437, global_step=5054.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  74%|███████▍  | 891/1208 [24:09<08:35,  1.63s/it, loss=0.194, v_num=0, train/loss_simple_step=0.698, train/loss_vlb_step=0.023, train/loss_step=0.698, global_step=5054.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]      Epoch 16:  74%|███████▍  | 892/1208 [24:11<08:34,  1.63s/it, loss=0.194, v_num=0, train/loss_simple_step=0.698, train/loss_vlb_step=0.023, train/loss_step=0.698, global_step=5054.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  74%|███████▍  | 892/1208 [24:11<08:34,  1.63s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000129, train/loss_step=0.0345, global_step=5054.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  74%|███████▍  | 893/1208 [24:12<08:32,  1.63s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000129, train/loss_step=0.0345, global_step=5054.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  74%|███████▍  | 893/1208 [24:12<08:32,  1.63s/it, loss=0.205, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00535, train/loss_step=0.436, global_step=5055.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  74%|███████▍  | 894/1208 [24:13<08:30,  1.63s/it, loss=0.205, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00535, train/loss_step=0.436, global_step=5055.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  74%|███████▍  | 894/1208 [24:13<08:30,  1.63s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000127, train/loss_step=0.0336, global_step=5055.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  74%|███████▍  | 895/1208 [24:14<08:28,  1.63s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000127, train/loss_step=0.0336, global_step=5055.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  74%|███████▍  | 895/1208 [24:14<08:28,  1.63s/it, loss=0.169, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=9.47e-5, train/loss_step=0.025, global_step=5055.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  74%|███████▍  | 896/1208 [24:17<08:27,  1.63s/it, loss=0.169, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=9.47e-5, train/loss_step=0.025, global_step=5055.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  74%|███████▍  | 896/1208 [24:17<08:27,  1.63s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0675, train/loss_vlb_step=0.000226, train/loss_step=0.0675, global_step=5055.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  74%|███████▍  | 897/1208 [24:18<08:25,  1.63s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0675, train/loss_vlb_step=0.000226, train/loss_step=0.0675, global_step=5055.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  74%|███████▍  | 897/1208 [24:18<08:25,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000457, train/loss_step=0.139, global_step=5056.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  74%|███████▍  | 898/1208 [24:19<08:23,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000457, train/loss_step=0.139, global_step=5056.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  74%|███████▍  | 898/1208 [24:19<08:23,  1.63s/it, loss=0.166, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00173, train/loss_step=0.347, global_step=5056.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  74%|███████▍  | 899/1208 [24:20<08:22,  1.63s/it, loss=0.166, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00173, train/loss_step=0.347, global_step=5056.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  74%|███████▍  | 899/1208 [24:20<08:22,  1.63s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.000145, train/loss_step=0.0418, global_step=5056.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  75%|███████▍  | 900/1208 [24:24<08:21,  1.63s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.000145, train/loss_step=0.0418, global_step=5056.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  75%|███████▍  | 900/1208 [24:24<08:21,  1.63s/it, loss=0.181, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00164, train/loss_step=0.323, global_step=5056.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.76it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.80it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.80it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.77it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.82it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 16:  75%|███████▍  | 901/1208 [24:54<08:29,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00164, train/loss_step=0.323, global_step=5056.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  75%|███████▍  | 901/1208 [24:54<08:29,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00603, train/loss_vlb_step=3.03e-5, train/loss_step=0.00603, global_step=5057.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  75%|███████▍  | 902/1208 [24:55<08:27,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00603, train/loss_vlb_step=3.03e-5, train/loss_step=0.00603, global_step=5057.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  75%|███████▍  | 902/1208 [24:55<08:27,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000171, train/loss_step=0.0457, global_step=5057.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  75%|███████▍  | 903/1208 [24:56<08:25,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000171, train/loss_step=0.0457, global_step=5057.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  75%|███████▍  | 903/1208 [24:56<08:25,  1.66s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000108, train/loss_step=0.0272, global_step=5057.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  75%|███████▍  | 904/1208 [25:00<08:24,  1.66s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000108, train/loss_step=0.0272, global_step=5057.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  75%|███████▍  | 904/1208 [25:00<08:24,  1.66s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000134, train/loss_step=0.0376, global_step=5057.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  75%|███████▍  | 905/1208 [25:01<08:22,  1.66s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000134, train/loss_step=0.0376, global_step=5057.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  75%|███████▍  | 905/1208 [25:01<08:22,  1.66s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0592, train/loss_vlb_step=0.000205, train/loss_step=0.0592, global_step=5058.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  75%|███████▌  | 906/1208 [25:02<08:20,  1.66s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0592, train/loss_vlb_step=0.000205, train/loss_step=0.0592, global_step=5058.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  75%|███████▌  | 906/1208 [25:02<08:20,  1.66s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0876, train/loss_vlb_step=0.000291, train/loss_step=0.0876, global_step=5058.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  75%|███████▌  | 907/1208 [25:03<08:18,  1.66s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0876, train/loss_vlb_step=0.000291, train/loss_step=0.0876, global_step=5058.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  75%|███████▌  | 907/1208 [25:03<08:18,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.89e-5, train/loss_step=0.0128, global_step=5058.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  75%|███████▌  | 908/1208 [25:06<08:17,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.89e-5, train/loss_step=0.0128, global_step=5058.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  75%|███████▌  | 908/1208 [25:06<08:17,  1.66s/it, loss=0.152, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00497, train/loss_step=0.427, global_step=5058.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  75%|███████▌  | 909/1208 [25:07<08:15,  1.66s/it, loss=0.152, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00497, train/loss_step=0.427, global_step=5058.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  75%|███████▌  | 909/1208 [25:07<08:15,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.000175, train/loss_step=0.0499, global_step=5059.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  75%|███████▌  | 910/1208 [25:08<08:14,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.000175, train/loss_step=0.0499, global_step=5059.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  75%|███████▌  | 910/1208 [25:08<08:14,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.00075, train/loss_step=0.204, global_step=5059.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  75%|███████▌  | 911/1208 [25:09<08:12,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.00075, train/loss_step=0.204, global_step=5059.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  75%|███████▌  | 911/1208 [25:09<08:12,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00168, train/loss_step=0.320, global_step=5059.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  75%|███████▌  | 912/1208 [25:12<08:11,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00168, train/loss_step=0.320, global_step=5059.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  75%|███████▌  | 912/1208 [25:12<08:11,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0624, train/loss_vlb_step=0.000211, train/loss_step=0.0624, global_step=5059.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  76%|███████▌  | 913/1208 [25:13<08:09,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0624, train/loss_vlb_step=0.000211, train/loss_step=0.0624, global_step=5059.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  76%|███████▌  | 913/1208 [25:13<08:09,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00222, train/loss_step=0.365, global_step=5060.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  76%|███████▌  | 914/1208 [25:14<08:07,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00222, train/loss_step=0.365, global_step=5060.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  76%|███████▌  | 914/1208 [25:14<08:07,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00784, train/loss_step=0.454, global_step=5060.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  76%|███████▌  | 915/1208 [25:16<08:05,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00784, train/loss_step=0.454, global_step=5060.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  76%|███████▌  | 915/1208 [25:16<08:05,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00132, train/loss_step=0.292, global_step=5060.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  76%|███████▌  | 916/1208 [25:19<08:04,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00132, train/loss_step=0.292, global_step=5060.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  76%|███████▌  | 916/1208 [25:19<08:04,  1.66s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0788, train/loss_vlb_step=0.00026, train/loss_step=0.0788, global_step=5060.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  76%|███████▌  | 917/1208 [25:20<08:02,  1.66s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0788, train/loss_vlb_step=0.00026, train/loss_step=0.0788, global_step=5060.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  76%|███████▌  | 917/1208 [25:20<08:02,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000916, train/loss_step=0.232, global_step=5061.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  76%|███████▌  | 918/1208 [25:21<08:00,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000916, train/loss_step=0.232, global_step=5061.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  76%|███████▌  | 918/1208 [25:21<08:00,  1.66s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.03e-5, train/loss_step=0.0228, global_step=5061.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  76%|███████▌  | 919/1208 [25:22<07:58,  1.66s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.03e-5, train/loss_step=0.0228, global_step=5061.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  76%|███████▌  | 919/1208 [25:22<07:58,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.87e-5, train/loss_step=0.0104, global_step=5061.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  76%|███████▌  | 920/1208 [25:25<07:57,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.87e-5, train/loss_step=0.0104, global_step=5061.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  76%|███████▌  | 920/1208 [25:25<07:57,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00269, train/loss_vlb_step=1.54e-5, train/loss_step=0.00269, global_step=5061.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  76%|███████▌  | 921/1208 [25:26<07:55,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00269, train/loss_vlb_step=1.54e-5, train/loss_step=0.00269, global_step=5061.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  76%|███████▌  | 921/1208 [25:26<07:55,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000644, train/loss_step=0.185, global_step=5062.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  76%|███████▋  | 922/1208 [25:27<07:53,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000644, train/loss_step=0.185, global_step=5062.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  76%|███████▋  | 922/1208 [25:27<07:53,  1.66s/it, loss=0.157, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000743, train/loss_step=0.204, global_step=5062.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  76%|███████▋  | 923/1208 [25:28<07:52,  1.66s/it, loss=0.157, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000743, train/loss_step=0.204, global_step=5062.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  76%|███████▋  | 923/1208 [25:28<07:52,  1.66s/it, loss=0.162, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000456, train/loss_step=0.138, global_step=5062.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  76%|███████▋  | 924/1208 [25:32<07:50,  1.66s/it, loss=0.162, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000456, train/loss_step=0.138, global_step=5062.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  76%|███████▋  | 924/1208 [25:32<07:50,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00338, train/loss_vlb_step=1.85e-5, train/loss_step=0.00338, global_step=5062.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  77%|███████▋  | 925/1208 [25:33<07:49,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00338, train/loss_vlb_step=1.85e-5, train/loss_step=0.00338, global_step=5062.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  77%|███████▋  | 925/1208 [25:33<07:49,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=5063.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  77%|███████▋  | 926/1208 [25:34<07:47,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=5063.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  77%|███████▋  | 926/1208 [25:34<07:47,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00146, train/loss_step=0.313, global_step=5063.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  77%|███████▋  | 927/1208 [25:35<07:45,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00146, train/loss_step=0.313, global_step=5063.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  77%|███████▋  | 927/1208 [25:35<07:45,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000468, train/loss_step=0.139, global_step=5063.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  77%|███████▋  | 928/1208 [25:38<07:44,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000468, train/loss_step=0.139, global_step=5063.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  77%|███████▋  | 928/1208 [25:38<07:44,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00397, train/loss_vlb_step=2.19e-5, train/loss_step=0.00397, global_step=5063.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  77%|███████▋  | 929/1208 [25:39<07:42,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00397, train/loss_vlb_step=2.19e-5, train/loss_step=0.00397, global_step=5063.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  77%|███████▋  | 929/1208 [25:39<07:42,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.44e-5, train/loss_step=0.0234, global_step=5064.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  77%|███████▋  | 930/1208 [25:40<07:40,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.44e-5, train/loss_step=0.0234, global_step=5064.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  77%|███████▋  | 930/1208 [25:40<07:40,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000153, train/loss_step=0.0407, global_step=5064.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  77%|███████▋  | 931/1208 [25:41<07:38,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000153, train/loss_step=0.0407, global_step=5064.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  77%|███████▋  | 931/1208 [25:41<07:38,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0961, train/loss_vlb_step=0.000322, train/loss_step=0.0961, global_step=5064.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  77%|███████▋  | 932/1208 [25:44<07:37,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0961, train/loss_vlb_step=0.000322, train/loss_step=0.0961, global_step=5064.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  77%|███████▋  | 932/1208 [25:44<07:37,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00711, train/loss_vlb_step=3.4e-5, train/loss_step=0.00711, global_step=5064.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  77%|███████▋  | 933/1208 [25:45<07:35,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00711, train/loss_vlb_step=3.4e-5, train/loss_step=0.00711, global_step=5064.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  77%|███████▋  | 933/1208 [25:45<07:35,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000496, train/loss_step=0.144, global_step=5065.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  77%|███████▋  | 934/1208 [25:46<07:33,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000496, train/loss_step=0.144, global_step=5065.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  77%|███████▋  | 934/1208 [25:46<07:33,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.513, train/loss_vlb_step=0.00597, train/loss_step=0.513, global_step=5065.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  77%|███████▋  | 935/1208 [25:47<07:31,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.513, train/loss_vlb_step=0.00597, train/loss_step=0.513, global_step=5065.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  77%|███████▋  | 935/1208 [25:47<07:31,  1.66s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.73e-5, train/loss_step=0.00304, global_step=5065.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  77%|███████▋  | 936/1208 [25:51<07:30,  1.66s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.73e-5, train/loss_step=0.00304, global_step=5065.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  77%|███████▋  | 936/1208 [25:51<07:30,  1.66s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.47e-5, train/loss_step=0.0144, global_step=5065.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  78%|███████▊  | 937/1208 [25:52<07:28,  1.66s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.47e-5, train/loss_step=0.0144, global_step=5065.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  78%|███████▊  | 937/1208 [25:52<07:28,  1.66s/it, loss=0.116, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00216, train/loss_step=0.351, global_step=5066.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  78%|███████▊  | 938/1208 [25:53<07:27,  1.66s/it, loss=0.116, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00216, train/loss_step=0.351, global_step=5066.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  78%|███████▊  | 938/1208 [25:53<07:27,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0634, train/loss_vlb_step=0.000218, train/loss_step=0.0634, global_step=5066.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  78%|███████▊  | 939/1208 [25:54<07:25,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0634, train/loss_vlb_step=0.000218, train/loss_step=0.0634, global_step=5066.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  78%|███████▊  | 939/1208 [25:54<07:25,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00142, train/loss_step=0.272, global_step=5066.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  78%|███████▊  | 940/1208 [25:57<07:24,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00142, train/loss_step=0.272, global_step=5066.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  78%|███████▊  | 940/1208 [25:57<07:24,  1.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00529, train/loss_vlb_step=2.72e-5, train/loss_step=0.00529, global_step=5066.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  78%|███████▊  | 941/1208 [25:58<07:22,  1.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00529, train/loss_vlb_step=2.72e-5, train/loss_step=0.00529, global_step=5066.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  78%|███████▊  | 941/1208 [25:58<07:22,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.706, train/loss_vlb_step=0.0284, train/loss_step=0.706, global_step=5067.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]     Epoch 16:  78%|███████▊  | 942/1208 [25:59<07:20,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.706, train/loss_vlb_step=0.0284, train/loss_step=0.706, global_step=5067.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  78%|███████▊  | 942/1208 [25:59<07:20,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000205, train/loss_step=0.0588, global_step=5067.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  78%|███████▊  | 943/1208 [26:00<07:18,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000205, train/loss_step=0.0588, global_step=5067.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  78%|███████▊  | 943/1208 [26:00<07:18,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00709, train/loss_vlb_step=3.48e-5, train/loss_step=0.00709, global_step=5067.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  78%|███████▊  | 944/1208 [26:03<07:17,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00709, train/loss_vlb_step=3.48e-5, train/loss_step=0.00709, global_step=5067.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  78%|███████▊  | 944/1208 [26:03<07:17,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=1.3e-5, train/loss_step=0.00221, global_step=5067.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  78%|███████▊  | 945/1208 [26:04<07:15,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=1.3e-5, train/loss_step=0.00221, global_step=5067.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  78%|███████▊  | 945/1208 [26:04<07:15,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.00011, train/loss_step=0.0279, global_step=5068.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  78%|███████▊  | 946/1208 [26:05<07:13,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.00011, train/loss_step=0.0279, global_step=5068.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  78%|███████▊  | 946/1208 [26:05<07:13,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0488, train/loss_vlb_step=0.000171, train/loss_step=0.0488, global_step=5068.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  78%|███████▊  | 947/1208 [26:07<07:11,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0488, train/loss_vlb_step=0.000171, train/loss_step=0.0488, global_step=5068.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  78%|███████▊  | 947/1208 [26:07<07:11,  1.65s/it, loss=0.137, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00205, train/loss_step=0.351, global_step=5068.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  78%|███████▊  | 948/1208 [26:10<07:10,  1.66s/it, loss=0.137, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00205, train/loss_step=0.351, global_step=5068.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  78%|███████▊  | 948/1208 [26:10<07:10,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00145, train/loss_step=0.316, global_step=5068.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  79%|███████▊  | 949/1208 [26:11<07:08,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00145, train/loss_step=0.316, global_step=5068.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  79%|███████▊  | 949/1208 [26:11<07:08,  1.66s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00317, train/loss_vlb_step=1.76e-5, train/loss_step=0.00317, global_step=5069.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  79%|███████▊  | 950/1208 [26:12<07:07,  1.66s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00317, train/loss_vlb_step=1.76e-5, train/loss_step=0.00317, global_step=5069.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  79%|███████▊  | 950/1208 [26:12<07:07,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00586, train/loss_vlb_step=2.98e-5, train/loss_step=0.00586, global_step=5069.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  79%|███████▊  | 951/1208 [26:13<07:05,  1.65s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00586, train/loss_vlb_step=2.98e-5, train/loss_step=0.00586, global_step=5069.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  79%|███████▊  | 951/1208 [26:13<07:05,  1.65s/it, loss=0.147, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000126, train/loss_step=0.035, global_step=5069.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  79%|███████▉  | 952/1208 [26:16<07:03,  1.66s/it, loss=0.147, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000126, train/loss_step=0.035, global_step=5069.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  79%|███████▉  | 952/1208 [26:16<07:03,  1.66s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.08e-5, train/loss_step=0.0138, global_step=5069.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  79%|███████▉  | 953/1208 [26:17<07:02,  1.66s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.08e-5, train/loss_step=0.0138, global_step=5069.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  79%|███████▉  | 953/1208 [26:17<07:02,  1.66s/it, loss=0.152, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00105, train/loss_step=0.248, global_step=5070.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  79%|███████▉  | 954/1208 [26:18<07:00,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00105, train/loss_step=0.248, global_step=5070.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  79%|███████▉  | 954/1208 [26:18<07:00,  1.65s/it, loss=0.15, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.0065, train/loss_step=0.470, global_step=5070.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  79%|███████▉  | 955/1208 [26:19<06:58,  1.65s/it, loss=0.15, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.0065, train/loss_step=0.470, global_step=5070.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  79%|███████▉  | 955/1208 [26:19<06:58,  1.65s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.47e-5, train/loss_step=0.0201, global_step=5070.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  79%|███████▉  | 956/1208 [26:23<06:57,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.47e-5, train/loss_step=0.0201, global_step=5070.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  79%|███████▉  | 956/1208 [26:23<06:57,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00589, train/loss_vlb_step=3e-5, train/loss_step=0.00589, global_step=5070.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  79%|███████▉  | 957/1208 [26:24<06:55,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00589, train/loss_vlb_step=3e-5, train/loss_step=0.00589, global_step=5070.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  79%|███████▉  | 957/1208 [26:24<06:55,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.89e-5, train/loss_step=0.0132, global_step=5071.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  79%|███████▉  | 958/1208 [26:25<06:53,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.89e-5, train/loss_step=0.0132, global_step=5071.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  79%|███████▉  | 958/1208 [26:25<06:53,  1.65s/it, loss=0.136, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=5071.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  79%|███████▉  | 959/1208 [26:26<06:51,  1.65s/it, loss=0.136, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=5071.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  79%|███████▉  | 959/1208 [26:26<06:51,  1.65s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.00014, train/loss_step=0.0401, global_step=5071.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  79%|███████▉  | 960/1208 [26:29<06:50,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.00014, train/loss_step=0.0401, global_step=5071.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  79%|███████▉  | 960/1208 [26:29<06:50,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.523, train/loss_vlb_step=0.00654, train/loss_step=0.523, global_step=5071.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  80%|███████▉  | 961/1208 [26:30<06:48,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.523, train/loss_vlb_step=0.00654, train/loss_step=0.523, global_step=5071.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  80%|███████▉  | 961/1208 [26:30<06:48,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000587, train/loss_step=0.171, global_step=5072.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  80%|███████▉  | 962/1208 [26:31<06:47,  1.65s/it, loss=0.123, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000587, train/loss_step=0.171, global_step=5072.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  80%|███████▉  | 962/1208 [26:31<06:47,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000655, train/loss_step=0.178, global_step=5072.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  80%|███████▉  | 963/1208 [26:32<06:45,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000655, train/loss_step=0.178, global_step=5072.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  80%|███████▉  | 963/1208 [26:32<06:45,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000119, train/loss_step=0.0314, global_step=5072.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  80%|███████▉  | 964/1208 [26:35<06:43,  1.66s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000119, train/loss_step=0.0314, global_step=5072.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  80%|███████▉  | 964/1208 [26:35<06:43,  1.66s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=1.34e-5, train/loss_step=0.00227, global_step=5072.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  80%|███████▉  | 965/1208 [26:36<06:42,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=1.34e-5, train/loss_step=0.00227, global_step=5072.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  80%|███████▉  | 965/1208 [26:36<06:42,  1.65s/it, loss=0.143, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00127, train/loss_step=0.279, global_step=5073.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  80%|███████▉  | 966/1208 [26:37<06:40,  1.65s/it, loss=0.143, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00127, train/loss_step=0.279, global_step=5073.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  80%|███████▉  | 966/1208 [26:37<06:40,  1.65s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00825, train/loss_vlb_step=3.76e-5, train/loss_step=0.00825, global_step=5073.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  80%|████████  | 967/1208 [26:38<06:38,  1.65s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00825, train/loss_vlb_step=3.76e-5, train/loss_step=0.00825, global_step=5073.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  80%|████████  | 967/1208 [26:38<06:38,  1.65s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00722, train/loss_vlb_step=3.55e-5, train/loss_step=0.00722, global_step=5073.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  80%|████████  | 968/1208 [26:42<06:37,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00722, train/loss_vlb_step=3.55e-5, train/loss_step=0.00722, global_step=5073.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  80%|████████  | 968/1208 [26:42<06:37,  1.66s/it, loss=0.111, v_num=0, train/loss_simple_step=0.054, train/loss_vlb_step=0.000178, train/loss_step=0.054, global_step=5073.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  80%|████████  | 969/1208 [26:43<06:35,  1.65s/it, loss=0.111, v_num=0, train/loss_simple_step=0.054, train/loss_vlb_step=0.000178, train/loss_step=0.054, global_step=5073.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  80%|████████  | 969/1208 [26:43<06:35,  1.65s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000152, train/loss_step=0.0416, global_step=5074.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  80%|████████  | 970/1208 [26:44<06:33,  1.65s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000152, train/loss_step=0.0416, global_step=5074.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  80%|████████  | 970/1208 [26:44<06:33,  1.65s/it, loss=0.127, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00138, train/loss_step=0.296, global_step=5074.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  80%|████████  | 971/1208 [26:45<06:31,  1.65s/it, loss=0.127, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00138, train/loss_step=0.296, global_step=5074.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  80%|████████  | 971/1208 [26:45<06:31,  1.65s/it, loss=0.136, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.00093, train/loss_step=0.224, global_step=5074.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  80%|████████  | 972/1208 [26:48<06:30,  1.65s/it, loss=0.136, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.00093, train/loss_step=0.224, global_step=5074.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  80%|████████  | 972/1208 [26:48<06:30,  1.65s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0495, train/loss_vlb_step=0.000176, train/loss_step=0.0495, global_step=5074.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  81%|████████  | 973/1208 [26:49<06:28,  1.65s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0495, train/loss_vlb_step=0.000176, train/loss_step=0.0495, global_step=5074.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  81%|████████  | 973/1208 [26:49<06:28,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.94e-5, train/loss_step=0.0107, global_step=5075.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  81%|████████  | 974/1208 [26:50<06:26,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.94e-5, train/loss_step=0.0107, global_step=5075.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  81%|████████  | 974/1208 [26:50<06:26,  1.65s/it, loss=0.108, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=5075.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  81%|████████  | 975/1208 [26:51<06:25,  1.65s/it, loss=0.108, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=5075.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  81%|████████  | 975/1208 [26:51<06:25,  1.65s/it, loss=0.113, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=5075.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  81%|████████  | 976/1208 [26:54<06:23,  1.65s/it, loss=0.113, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=5075.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  81%|████████  | 976/1208 [26:54<06:23,  1.65s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00338, train/loss_vlb_step=1.89e-5, train/loss_step=0.00338, global_step=5075.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  81%|████████  | 977/1208 [26:56<06:22,  1.65s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00338, train/loss_vlb_step=1.89e-5, train/loss_step=0.00338, global_step=5075.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  81%|████████  | 977/1208 [26:56<06:22,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.0017, train/loss_step=0.333, global_step=5076.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]     Epoch 16:  81%|████████  | 978/1208 [26:57<06:20,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.0017, train/loss_step=0.333, global_step=5076.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  81%|████████  | 978/1208 [26:57<06:20,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00161, train/loss_step=0.314, global_step=5076.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  81%|████████  | 979/1208 [26:58<06:18,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00161, train/loss_step=0.314, global_step=5076.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  81%|████████  | 979/1208 [26:58<06:18,  1.65s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00863, train/loss_vlb_step=4.1e-5, train/loss_step=0.00863, global_step=5076.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  81%|████████  | 980/1208 [27:01<06:17,  1.65s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00863, train/loss_vlb_step=4.1e-5, train/loss_step=0.00863, global_step=5076.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  81%|████████  | 980/1208 [27:01<06:17,  1.65s/it, loss=0.124, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00115, train/loss_step=0.255, global_step=5076.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  81%|████████  | 981/1208 [27:02<06:15,  1.65s/it, loss=0.124, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00115, train/loss_step=0.255, global_step=5076.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  81%|████████  | 981/1208 [27:02<06:15,  1.65s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.12e-5, train/loss_step=0.0108, global_step=5077.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  81%|████████▏ | 982/1208 [27:03<06:13,  1.65s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.12e-5, train/loss_step=0.0108, global_step=5077.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  81%|████████▏ | 982/1208 [27:03<06:13,  1.65s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00429, train/loss_vlb_step=2.15e-5, train/loss_step=0.00429, global_step=5077.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  81%|████████▏ | 983/1208 [27:04<06:11,  1.65s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00429, train/loss_vlb_step=2.15e-5, train/loss_step=0.00429, global_step=5077.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  81%|████████▏ | 983/1208 [27:04<06:11,  1.65s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00754, train/loss_vlb_step=3.55e-5, train/loss_step=0.00754, global_step=5077.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  81%|████████▏ | 984/1208 [27:07<06:10,  1.65s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00754, train/loss_vlb_step=3.55e-5, train/loss_step=0.00754, global_step=5077.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  81%|████████▏ | 984/1208 [27:07<06:10,  1.65s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00316, train/loss_vlb_step=1.76e-5, train/loss_step=0.00316, global_step=5077.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  82%|████████▏ | 985/1208 [27:08<06:08,  1.65s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00316, train/loss_vlb_step=1.76e-5, train/loss_step=0.00316, global_step=5077.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  82%|████████▏ | 985/1208 [27:08<06:08,  1.65s/it, loss=0.103, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000834, train/loss_step=0.208, global_step=5078.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  82%|████████▏ | 986/1208 [27:09<06:06,  1.65s/it, loss=0.103, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000834, train/loss_step=0.208, global_step=5078.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  82%|████████▏ | 986/1208 [27:09<06:06,  1.65s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=1.35e-5, train/loss_step=0.0023, global_step=5078.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  82%|████████▏ | 987/1208 [27:10<06:05,  1.65s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=1.35e-5, train/loss_step=0.0023, global_step=5078.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  82%|████████▏ | 987/1208 [27:10<06:05,  1.65s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0947, train/loss_vlb_step=0.000312, train/loss_step=0.0947, global_step=5078.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  82%|████████▏ | 988/1208 [27:14<06:03,  1.65s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0947, train/loss_vlb_step=0.000312, train/loss_step=0.0947, global_step=5078.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  82%|████████▏ | 988/1208 [27:14<06:03,  1.65s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=2.59e-5, train/loss_step=0.00492, global_step=5078.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  82%|████████▏ | 989/1208 [27:15<06:02,  1.65s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=2.59e-5, train/loss_step=0.00492, global_step=5078.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  82%|████████▏ | 989/1208 [27:15<06:02,  1.65s/it, loss=0.11, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000508, train/loss_step=0.145, global_step=5079.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  82%|████████▏ | 990/1208 [27:16<06:00,  1.65s/it, loss=0.11, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000508, train/loss_step=0.145, global_step=5079.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  82%|████████▏ | 990/1208 [27:16<06:00,  1.65s/it, loss=0.0952, v_num=0, train/loss_simple_step=0.00415, train/loss_vlb_step=2.21e-5, train/loss_step=0.00415, global_step=5079.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  82%|████████▏ | 991/1208 [27:17<05:58,  1.65s/it, loss=0.0952, v_num=0, train/loss_simple_step=0.00415, train/loss_vlb_step=2.21e-5, train/loss_step=0.00415, global_step=5079.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  82%|████████▏ | 991/1208 [27:17<05:58,  1.65s/it, loss=0.0841, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=1.51e-5, train/loss_step=0.00263, global_step=5079.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  82%|████████▏ | 992/1208 [27:20<05:57,  1.65s/it, loss=0.0841, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=1.51e-5, train/loss_step=0.00263, global_step=5079.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  82%|████████▏ | 992/1208 [27:20<05:57,  1.65s/it, loss=0.0832, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000121, train/loss_step=0.031, global_step=5079.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  82%|████████▏ | 993/1208 [27:21<05:55,  1.65s/it, loss=0.0832, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000121, train/loss_step=0.031, global_step=5079.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  82%|████████▏ | 993/1208 [27:21<05:55,  1.65s/it, loss=0.0844, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.00013, train/loss_step=0.0346, global_step=5080.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  82%|████████▏ | 994/1208 [27:22<05:53,  1.65s/it, loss=0.0844, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.00013, train/loss_step=0.0346, global_step=5080.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  82%|████████▏ | 994/1208 [27:22<05:53,  1.65s/it, loss=0.0855, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000413, train/loss_step=0.125, global_step=5080.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  82%|████████▏ | 995/1208 [27:23<05:51,  1.65s/it, loss=0.0855, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000413, train/loss_step=0.125, global_step=5080.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  82%|████████▏ | 995/1208 [27:23<05:51,  1.65s/it, loss=0.0894, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000771, train/loss_step=0.195, global_step=5080.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  82%|████████▏ | 996/1208 [27:26<05:50,  1.65s/it, loss=0.0894, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000771, train/loss_step=0.195, global_step=5080.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  82%|████████▏ | 996/1208 [27:26<05:50,  1.65s/it, loss=0.109, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00309, train/loss_step=0.403, global_step=5080.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  83%|████████▎ | 997/1208 [27:27<05:48,  1.65s/it, loss=0.109, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00309, train/loss_step=0.403, global_step=5080.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  83%|████████▎ | 997/1208 [27:27<05:48,  1.65s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.0564, train/loss_vlb_step=0.000191, train/loss_step=0.0564, global_step=5081.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  83%|████████▎ | 998/1208 [27:28<05:46,  1.65s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.0564, train/loss_vlb_step=0.000191, train/loss_step=0.0564, global_step=5081.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  83%|████████▎ | 998/1208 [27:28<05:46,  1.65s/it, loss=0.0838, v_num=0, train/loss_simple_step=0.0796, train/loss_vlb_step=0.000267, train/loss_step=0.0796, global_step=5081.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  83%|████████▎ | 999/1208 [27:30<05:45,  1.65s/it, loss=0.0838, v_num=0, train/loss_simple_step=0.0796, train/loss_vlb_step=0.000267, train/loss_step=0.0796, global_step=5081.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  83%|████████▎ | 999/1208 [27:30<05:45,  1.65s/it, loss=0.0842, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.72e-5, train/loss_step=0.0177, global_step=5081.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  83%|████████▎ | 1000/1208 [27:33<05:43,  1.65s/it, loss=0.0842, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.72e-5, train/loss_step=0.0177, global_step=5081.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  83%|████████▎ | 1000/1208 [27:33<05:43,  1.65s/it, loss=0.0724, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.96e-5, train/loss_step=0.0185, global_step=5081.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  83%|████████▎ | 1001/1208 [27:34<05:42,  1.65s/it, loss=0.0724, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.96e-5, train/loss_step=0.0185, global_step=5081.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  83%|████████▎ | 1001/1208 [27:34<05:42,  1.65s/it, loss=0.084, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000953, train/loss_step=0.242, global_step=5082.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  83%|████████▎ | 1002/1208 [27:35<05:40,  1.65s/it, loss=0.084, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000953, train/loss_step=0.242, global_step=5082.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  83%|████████▎ | 1002/1208 [27:35<05:40,  1.65s/it, loss=0.0842, v_num=0, train/loss_simple_step=0.00872, train/loss_vlb_step=4.18e-5, train/loss_step=0.00872, global_step=5082.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  83%|████████▎ | 1003/1208 [27:36<05:38,  1.65s/it, loss=0.0842, v_num=0, train/loss_simple_step=0.00872, train/loss_vlb_step=4.18e-5, train/loss_step=0.00872, global_step=5082.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  83%|████████▎ | 1003/1208 [27:36<05:38,  1.65s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000583, train/loss_step=0.168, global_step=5082.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  83%|████████▎ | 1004/1208 [27:39<05:37,  1.65s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000583, train/loss_step=0.168, global_step=5082.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  83%|████████▎ | 1004/1208 [27:39<05:37,  1.65s/it, loss=0.0927, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.55e-5, train/loss_step=0.012, global_step=5082.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  83%|████████▎ | 1005/1208 [27:40<05:35,  1.65s/it, loss=0.0927, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.55e-5, train/loss_step=0.012, global_step=5082.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  83%|████████▎ | 1005/1208 [27:40<05:35,  1.65s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00158, train/loss_step=0.298, global_step=5083.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  83%|████████▎ | 1006/1208 [27:41<05:33,  1.65s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00158, train/loss_step=0.298, global_step=5083.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  83%|████████▎ | 1006/1208 [27:41<05:33,  1.65s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0852, train/loss_vlb_step=0.000283, train/loss_step=0.0852, global_step=5083.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  83%|████████▎ | 1007/1208 [27:42<05:31,  1.65s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0852, train/loss_vlb_step=0.000283, train/loss_step=0.0852, global_step=5083.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  83%|████████▎ | 1007/1208 [27:42<05:31,  1.65s/it, loss=0.137, v_num=0, train/loss_simple_step=0.813, train/loss_vlb_step=0.0384, train/loss_step=0.813, global_step=5083.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  83%|████████▎ | 1008/1208 [27:45<05:30,  1.65s/it, loss=0.137, v_num=0, train/loss_simple_step=0.813, train/loss_vlb_step=0.0384, train/loss_step=0.813, global_step=5083.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  83%|████████▎ | 1008/1208 [27:45<05:30,  1.65s/it, loss=0.155, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.0025, train/loss_step=0.362, global_step=5083.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  84%|████████▎ | 1009/1208 [27:46<05:28,  1.65s/it, loss=0.155, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.0025, train/loss_step=0.362, global_step=5083.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  84%|████████▎ | 1009/1208 [27:46<05:28,  1.65s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0052, train/loss_vlb_step=2.77e-5, train/loss_step=0.0052, global_step=5084.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  84%|████████▎ | 1010/1208 [27:48<05:27,  1.65s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0052, train/loss_vlb_step=2.77e-5, train/loss_step=0.0052, global_step=5084.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  84%|████████▎ | 1010/1208 [27:48<05:27,  1.65s/it, loss=0.157, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000603, train/loss_step=0.177, global_step=5084.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  84%|████████▎ | 1011/1208 [27:49<05:25,  1.65s/it, loss=0.157, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000603, train/loss_step=0.177, global_step=5084.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  84%|████████▎ | 1011/1208 [27:49<05:25,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0772, train/loss_vlb_step=0.000265, train/loss_step=0.0772, global_step=5084.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  84%|████████▍ | 1012/1208 [27:52<05:23,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0772, train/loss_vlb_step=0.000265, train/loss_step=0.0772, global_step=5084.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  84%|████████▍ | 1012/1208 [27:52<05:23,  1.65s/it, loss=0.176, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.0017, train/loss_step=0.337, global_step=5084.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  84%|████████▍ | 1013/1208 [27:53<05:22,  1.65s/it, loss=0.176, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.0017, train/loss_step=0.337, global_step=5084.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  84%|████████▍ | 1013/1208 [27:53<05:22,  1.65s/it, loss=0.188, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00124, train/loss_step=0.273, global_step=5085.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  84%|████████▍ | 1014/1208 [27:54<05:20,  1.65s/it, loss=0.188, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00124, train/loss_step=0.273, global_step=5085.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  84%|████████▍ | 1014/1208 [27:54<05:20,  1.65s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00717, train/loss_vlb_step=3.56e-5, train/loss_step=0.00717, global_step=5085.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  84%|████████▍ | 1015/1208 [27:55<05:18,  1.65s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00717, train/loss_vlb_step=3.56e-5, train/loss_step=0.00717, global_step=5085.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  84%|████████▍ | 1015/1208 [27:55<05:18,  1.65s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.7e-5, train/loss_step=0.0155, global_step=5085.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  84%|████████▍ | 1016/1208 [27:58<05:17,  1.65s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.7e-5, train/loss_step=0.0155, global_step=5085.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  84%|████████▍ | 1016/1208 [27:58<05:17,  1.65s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0791, train/loss_vlb_step=0.000266, train/loss_step=0.0791, global_step=5085.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  84%|████████▍ | 1017/1208 [27:59<05:15,  1.65s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0791, train/loss_vlb_step=0.000266, train/loss_step=0.0791, global_step=5085.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  84%|████████▍ | 1017/1208 [27:59<05:15,  1.65s/it, loss=0.168, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00113, train/loss_step=0.275, global_step=5086.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  84%|████████▍ | 1018/1208 [28:00<05:13,  1.65s/it, loss=0.168, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00113, train/loss_step=0.275, global_step=5086.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  84%|████████▍ | 1018/1208 [28:00<05:13,  1.65s/it, loss=0.17, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000443, train/loss_step=0.134, global_step=5086.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  84%|████████▍ | 1019/1208 [28:01<05:11,  1.65s/it, loss=0.17, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000443, train/loss_step=0.134, global_step=5086.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  84%|████████▍ | 1019/1208 [28:01<05:11,  1.65s/it, loss=0.19, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.00244, train/loss_step=0.417, global_step=5086.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  84%|████████▍ | 1020/1208 [28:05<05:10,  1.65s/it, loss=0.19, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.00244, train/loss_step=0.417, global_step=5086.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  84%|████████▍ | 1020/1208 [28:05<05:10,  1.65s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000148, train/loss_step=0.0409, global_step=5086.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  85%|████████▍ | 1021/1208 [28:06<05:08,  1.65s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000148, train/loss_step=0.0409, global_step=5086.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  85%|████████▍ | 1021/1208 [28:06<05:08,  1.65s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.7e-5, train/loss_step=0.0158, global_step=5087.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  85%|████████▍ | 1022/1208 [28:07<05:07,  1.65s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.7e-5, train/loss_step=0.0158, global_step=5087.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  85%|████████▍ | 1022/1208 [28:07<05:07,  1.65s/it, loss=0.208, v_num=0, train/loss_simple_step=0.574, train/loss_vlb_step=0.00915, train/loss_step=0.574, global_step=5087.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  85%|████████▍ | 1023/1208 [28:08<05:05,  1.65s/it, loss=0.208, v_num=0, train/loss_simple_step=0.574, train/loss_vlb_step=0.00915, train/loss_step=0.574, global_step=5087.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  85%|████████▍ | 1023/1208 [28:08<05:05,  1.65s/it, loss=0.21, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000743, train/loss_step=0.192, global_step=5087.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  85%|████████▍ | 1024/1208 [28:11<05:03,  1.65s/it, loss=0.21, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000743, train/loss_step=0.192, global_step=5087.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  85%|████████▍ | 1024/1208 [28:11<05:03,  1.65s/it, loss=0.217, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000542, train/loss_step=0.153, global_step=5087.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  85%|████████▍ | 1025/1208 [28:12<05:02,  1.65s/it, loss=0.217, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000542, train/loss_step=0.153, global_step=5087.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  85%|████████▍ | 1025/1208 [28:12<05:02,  1.65s/it, loss=0.211, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.00062, train/loss_step=0.184, global_step=5088.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  85%|████████▍ | 1026/1208 [28:13<05:00,  1.65s/it, loss=0.211, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.00062, train/loss_step=0.184, global_step=5088.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  85%|████████▍ | 1026/1208 [28:13<05:00,  1.65s/it, loss=0.216, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000648, train/loss_step=0.186, global_step=5088.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  85%|████████▌ | 1027/1208 [28:14<04:58,  1.65s/it, loss=0.216, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000648, train/loss_step=0.186, global_step=5088.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  85%|████████▌ | 1027/1208 [28:14<04:58,  1.65s/it, loss=0.177, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.63e-5, train/loss_step=0.024, global_step=5088.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  85%|████████▌ | 1028/1208 [28:17<04:57,  1.65s/it, loss=0.177, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.63e-5, train/loss_step=0.024, global_step=5088.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  85%|████████▌ | 1028/1208 [28:17<04:57,  1.65s/it, loss=0.164, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000338, train/loss_step=0.103, global_step=5088.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  85%|████████▌ | 1029/1208 [28:18<04:55,  1.65s/it, loss=0.164, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000338, train/loss_step=0.103, global_step=5088.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  85%|████████▌ | 1029/1208 [28:18<04:55,  1.65s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00389, train/loss_vlb_step=2.12e-5, train/loss_step=0.00389, global_step=5089.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  85%|████████▌ | 1030/1208 [28:19<04:53,  1.65s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00389, train/loss_vlb_step=2.12e-5, train/loss_step=0.00389, global_step=5089.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  85%|████████▌ | 1030/1208 [28:19<04:53,  1.65s/it, loss=0.168, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00121, train/loss_step=0.264, global_step=5089.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  85%|████████▌ | 1031/1208 [28:21<04:52,  1.65s/it, loss=0.168, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00121, train/loss_step=0.264, global_step=5089.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  85%|████████▌ | 1031/1208 [28:21<04:52,  1.65s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00346, train/loss_vlb_step=1.9e-5, train/loss_step=0.00346, global_step=5089.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  85%|████████▌ | 1032/1208 [28:24<04:50,  1.65s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00346, train/loss_vlb_step=1.9e-5, train/loss_step=0.00346, global_step=5089.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  85%|████████▌ | 1032/1208 [28:24<04:50,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00123, train/loss_step=0.264, global_step=5089.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  86%|████████▌ | 1033/1208 [28:25<04:48,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00123, train/loss_step=0.264, global_step=5089.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  86%|████████▌ | 1033/1208 [28:25<04:48,  1.65s/it, loss=0.156, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000664, train/loss_step=0.189, global_step=5090.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  86%|████████▌ | 1034/1208 [28:26<04:47,  1.65s/it, loss=0.156, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000664, train/loss_step=0.189, global_step=5090.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  86%|████████▌ | 1034/1208 [28:26<04:47,  1.65s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.72e-5, train/loss_step=0.00312, global_step=5090.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  86%|████████▌ | 1035/1208 [28:27<04:45,  1.65s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.72e-5, train/loss_step=0.00312, global_step=5090.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  86%|████████▌ | 1035/1208 [28:27<04:45,  1.65s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0695, train/loss_vlb_step=0.000233, train/loss_step=0.0695, global_step=5090.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  86%|████████▌ | 1036/1208 [28:30<04:44,  1.65s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0695, train/loss_vlb_step=0.000233, train/loss_step=0.0695, global_step=5090.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  86%|████████▌ | 1036/1208 [28:30<04:44,  1.65s/it, loss=0.177, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00343, train/loss_step=0.436, global_step=5090.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  86%|████████▌ | 1037/1208 [28:31<04:42,  1.65s/it, loss=0.177, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00343, train/loss_step=0.436, global_step=5090.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  86%|████████▌ | 1037/1208 [28:31<04:42,  1.65s/it, loss=0.175, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000974, train/loss_step=0.242, global_step=5091.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  86%|████████▌ | 1038/1208 [28:32<04:40,  1.65s/it, loss=0.175, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000974, train/loss_step=0.242, global_step=5091.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  86%|████████▌ | 1038/1208 [28:32<04:40,  1.65s/it, loss=0.189, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00267, train/loss_step=0.409, global_step=5091.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  86%|████████▌ | 1039/1208 [28:33<04:38,  1.65s/it, loss=0.189, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00267, train/loss_step=0.409, global_step=5091.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  86%|████████▌ | 1039/1208 [28:33<04:38,  1.65s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0571, train/loss_vlb_step=0.0002, train/loss_step=0.0571, global_step=5091.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  86%|████████▌ | 1040/1208 [28:37<04:37,  1.65s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0571, train/loss_vlb_step=0.0002, train/loss_step=0.0571, global_step=5091.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  86%|████████▌ | 1040/1208 [28:37<04:37,  1.65s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0952, train/loss_vlb_step=0.000313, train/loss_step=0.0952, global_step=5091.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  86%|████████▌ | 1041/1208 [28:38<04:35,  1.65s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0952, train/loss_vlb_step=0.000313, train/loss_step=0.0952, global_step=5091.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  86%|████████▌ | 1041/1208 [28:38<04:35,  1.65s/it, loss=0.174, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=9.74e-5, train/loss_step=0.025, global_step=5092.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  86%|████████▋ | 1042/1208 [28:39<04:33,  1.65s/it, loss=0.174, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=9.74e-5, train/loss_step=0.025, global_step=5092.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  86%|████████▋ | 1042/1208 [28:39<04:33,  1.65s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.43e-5, train/loss_step=0.0153, global_step=5092.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  86%|████████▋ | 1043/1208 [28:40<04:32,  1.65s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.43e-5, train/loss_step=0.0153, global_step=5092.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  86%|████████▋ | 1043/1208 [28:40<04:32,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000153, train/loss_step=0.0454, global_step=5092.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  86%|████████▋ | 1044/1208 [28:43<04:30,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000153, train/loss_step=0.0454, global_step=5092.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  86%|████████▋ | 1044/1208 [28:43<04:30,  1.65s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0895, train/loss_vlb_step=0.000297, train/loss_step=0.0895, global_step=5092.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  87%|████████▋ | 1045/1208 [28:44<04:28,  1.65s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0895, train/loss_vlb_step=0.000297, train/loss_step=0.0895, global_step=5092.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  87%|████████▋ | 1045/1208 [28:44<04:28,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000534, train/loss_step=0.158, global_step=5093.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  87%|████████▋ | 1046/1208 [28:45<04:27,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000534, train/loss_step=0.158, global_step=5093.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  87%|████████▋ | 1046/1208 [28:45<04:27,  1.65s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000142, train/loss_step=0.0399, global_step=5093.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  87%|████████▋ | 1047/1208 [28:46<04:25,  1.65s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000142, train/loss_step=0.0399, global_step=5093.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  87%|████████▋ | 1047/1208 [28:46<04:25,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00921, train/loss_vlb_step=4.32e-5, train/loss_step=0.00921, global_step=5093.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  87%|████████▋ | 1048/1208 [28:49<04:24,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00921, train/loss_vlb_step=4.32e-5, train/loss_step=0.00921, global_step=5093.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  87%|████████▋ | 1048/1208 [28:49<04:24,  1.65s/it, loss=0.131, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000833, train/loss_step=0.209, global_step=5093.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  87%|████████▋ | 1049/1208 [28:50<04:22,  1.65s/it, loss=0.131, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000833, train/loss_step=0.209, global_step=5093.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  87%|████████▋ | 1049/1208 [28:50<04:22,  1.65s/it, loss=0.149, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00171, train/loss_step=0.355, global_step=5094.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  87%|████████▋ | 1050/1208 [28:51<04:20,  1.65s/it, loss=0.149, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00171, train/loss_step=0.355, global_step=5094.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  87%|████████▋ | 1050/1208 [28:51<04:20,  1.65s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0888, train/loss_vlb_step=0.000292, train/loss_step=0.0888, global_step=5094.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  87%|████████▋ | 1051/1208 [28:52<04:18,  1.65s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0888, train/loss_vlb_step=0.000292, train/loss_step=0.0888, global_step=5094.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  87%|████████▋ | 1051/1208 [28:52<04:18,  1.65s/it, loss=0.147, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000477, train/loss_step=0.140, global_step=5094.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  87%|████████▋ | 1052/1208 [28:56<04:17,  1.65s/it, loss=0.147, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000477, train/loss_step=0.140, global_step=5094.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  87%|████████▋ | 1052/1208 [28:56<04:17,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.13e-5, train/loss_step=0.00194, global_step=5094.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  87%|████████▋ | 1053/1208 [28:57<04:15,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.13e-5, train/loss_step=0.00194, global_step=5094.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  87%|████████▋ | 1053/1208 [28:57<04:15,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0966, train/loss_vlb_step=0.000318, train/loss_step=0.0966, global_step=5095.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  87%|████████▋ | 1054/1208 [28:58<04:13,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0966, train/loss_vlb_step=0.000318, train/loss_step=0.0966, global_step=5095.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  87%|████████▋ | 1054/1208 [28:58<04:13,  1.65s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0849, train/loss_vlb_step=0.00028, train/loss_step=0.0849, global_step=5095.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  87%|████████▋ | 1055/1208 [28:59<04:12,  1.65s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0849, train/loss_vlb_step=0.00028, train/loss_step=0.0849, global_step=5095.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  87%|████████▋ | 1055/1208 [28:59<04:12,  1.65s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0668, train/loss_vlb_step=0.000234, train/loss_step=0.0668, global_step=5095.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  87%|████████▋ | 1056/1208 [29:02<04:10,  1.65s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0668, train/loss_vlb_step=0.000234, train/loss_step=0.0668, global_step=5095.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  87%|████████▋ | 1056/1208 [29:02<04:10,  1.65s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00755, train/loss_vlb_step=3.71e-5, train/loss_step=0.00755, global_step=5095.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  88%|████████▊ | 1057/1208 [29:03<04:09,  1.65s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00755, train/loss_vlb_step=3.71e-5, train/loss_step=0.00755, global_step=5095.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  88%|████████▊ | 1057/1208 [29:03<04:09,  1.65s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.53e-5, train/loss_step=0.00261, global_step=5096.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  88%|████████▊ | 1058/1208 [29:04<04:07,  1.65s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.53e-5, train/loss_step=0.00261, global_step=5096.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  88%|████████▊ | 1058/1208 [29:04<04:07,  1.65s/it, loss=0.0795, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=1.05e-5, train/loss_step=0.00177, global_step=5096.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  88%|████████▊ | 1059/1208 [29:05<04:05,  1.65s/it, loss=0.0795, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=1.05e-5, train/loss_step=0.00177, global_step=5096.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  88%|████████▊ | 1059/1208 [29:05<04:05,  1.65s/it, loss=0.0768, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=1.99e-5, train/loss_step=0.00366, global_step=5096.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  88%|████████▊ | 1060/1208 [29:09<04:04,  1.65s/it, loss=0.0768, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=1.99e-5, train/loss_step=0.00366, global_step=5096.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  88%|████████▊ | 1060/1208 [29:09<04:04,  1.65s/it, loss=0.0738, v_num=0, train/loss_simple_step=0.036, train/loss_vlb_step=0.000138, train/loss_step=0.036, global_step=5096.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  88%|████████▊ | 1061/1208 [29:10<04:02,  1.65s/it, loss=0.0738, v_num=0, train/loss_simple_step=0.036, train/loss_vlb_step=0.000138, train/loss_step=0.036, global_step=5096.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  88%|████████▊ | 1061/1208 [29:10<04:02,  1.65s/it, loss=0.0753, v_num=0, train/loss_simple_step=0.0544, train/loss_vlb_step=0.000189, train/loss_step=0.0544, global_step=5097.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  88%|████████▊ | 1062/1208 [29:11<04:00,  1.65s/it, loss=0.0753, v_num=0, train/loss_simple_step=0.0544, train/loss_vlb_step=0.000189, train/loss_step=0.0544, global_step=5097.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  88%|████████▊ | 1062/1208 [29:11<04:00,  1.65s/it, loss=0.0824, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000536, train/loss_step=0.158, global_step=5097.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  88%|████████▊ | 1063/1208 [29:12<03:59,  1.65s/it, loss=0.0824, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000536, train/loss_step=0.158, global_step=5097.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  88%|████████▊ | 1063/1208 [29:12<03:59,  1.65s/it, loss=0.0828, v_num=0, train/loss_simple_step=0.0516, train/loss_vlb_step=0.000179, train/loss_step=0.0516, global_step=5097.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  88%|████████▊ | 1064/1208 [29:15<03:57,  1.65s/it, loss=0.0828, v_num=0, train/loss_simple_step=0.0516, train/loss_vlb_step=0.000179, train/loss_step=0.0516, global_step=5097.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  88%|████████▊ | 1064/1208 [29:15<03:57,  1.65s/it, loss=0.0795, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.65e-5, train/loss_step=0.0241, global_step=5097.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  88%|████████▊ | 1065/1208 [29:16<03:55,  1.65s/it, loss=0.0795, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.65e-5, train/loss_step=0.0241, global_step=5097.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  88%|████████▊ | 1065/1208 [29:16<03:55,  1.65s/it, loss=0.0726, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.44e-5, train/loss_step=0.020, global_step=5098.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  88%|████████▊ | 1066/1208 [29:17<03:54,  1.65s/it, loss=0.0726, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.44e-5, train/loss_step=0.020, global_step=5098.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  88%|████████▊ | 1066/1208 [29:17<03:54,  1.65s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.564, train/loss_vlb_step=0.00797, train/loss_step=0.564, global_step=5098.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  88%|████████▊ | 1067/1208 [29:18<03:52,  1.65s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.564, train/loss_vlb_step=0.00797, train/loss_step=0.564, global_step=5098.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  88%|████████▊ | 1067/1208 [29:18<03:52,  1.65s/it, loss=0.0993, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=7.87e-5, train/loss_step=0.0196, global_step=5098.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  88%|████████▊ | 1068/1208 [29:21<03:50,  1.65s/it, loss=0.0993, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=7.87e-5, train/loss_step=0.0196, global_step=5098.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  88%|████████▊ | 1068/1208 [29:21<03:50,  1.65s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.0736, train/loss_vlb_step=0.000249, train/loss_step=0.0736, global_step=5098.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  88%|████████▊ | 1069/1208 [29:22<03:49,  1.65s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.0736, train/loss_vlb_step=0.000249, train/loss_step=0.0736, global_step=5098.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  88%|████████▊ | 1069/1208 [29:22<03:49,  1.65s/it, loss=0.0891, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00133, train/loss_step=0.286, global_step=5099.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  89%|████████▊ | 1070/1208 [29:23<03:47,  1.65s/it, loss=0.0891, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00133, train/loss_step=0.286, global_step=5099.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  89%|████████▊ | 1070/1208 [29:23<03:47,  1.65s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.00927, train/loss_vlb_step=4.3e-5, train/loss_step=0.00927, global_step=5099.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  89%|████████▊ | 1071/1208 [29:24<03:45,  1.65s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.00927, train/loss_vlb_step=4.3e-5, train/loss_step=0.00927, global_step=5099.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  89%|████████▊ | 1071/1208 [29:24<03:45,  1.65s/it, loss=0.112, v_num=0, train/loss_simple_step=0.679, train/loss_vlb_step=0.0173, train/loss_step=0.679, global_step=5099.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]     Epoch 16:  89%|████████▊ | 1072/1208 [29:28<03:44,  1.65s/it, loss=0.112, v_num=0, train/loss_simple_step=0.679, train/loss_vlb_step=0.0173, train/loss_step=0.679, global_step=5099.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  89%|████████▊ | 1072/1208 [29:28<03:44,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0595, train/loss_vlb_step=0.000209, train/loss_step=0.0595, global_step=5099.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  89%|████████▉ | 1073/1208 [29:29<03:42,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0595, train/loss_vlb_step=0.000209, train/loss_step=0.0595, global_step=5099.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  89%|████████▉ | 1073/1208 [29:29<03:42,  1.65s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00599, train/loss_vlb_step=3.1e-5, train/loss_step=0.00599, global_step=5100.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  89%|████████▉ | 1074/1208 [29:30<03:40,  1.65s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00599, train/loss_vlb_step=3.1e-5, train/loss_step=0.00599, global_step=5100.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  89%|████████▉ | 1074/1208 [29:30<03:40,  1.65s/it, loss=0.121, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00204, train/loss_step=0.298, global_step=5100.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  89%|████████▉ | 1075/1208 [29:31<03:39,  1.65s/it, loss=0.121, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00204, train/loss_step=0.298, global_step=5100.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  89%|████████▉ | 1075/1208 [29:31<03:39,  1.65s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.37e-5, train/loss_step=0.0145, global_step=5100.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  89%|████████▉ | 1076/1208 [29:34<03:37,  1.65s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.37e-5, train/loss_step=0.0145, global_step=5100.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  89%|████████▉ | 1076/1208 [29:34<03:37,  1.65s/it, loss=0.127, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000588, train/loss_step=0.171, global_step=5100.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  89%|████████▉ | 1077/1208 [29:35<03:35,  1.65s/it, loss=0.127, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000588, train/loss_step=0.171, global_step=5100.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  89%|████████▉ | 1077/1208 [29:35<03:35,  1.65s/it, loss=0.14, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00117, train/loss_step=0.275, global_step=5101.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  89%|████████▉ | 1078/1208 [29:36<03:34,  1.65s/it, loss=0.14, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00117, train/loss_step=0.275, global_step=5101.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  89%|████████▉ | 1078/1208 [29:36<03:34,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0791, train/loss_vlb_step=0.000266, train/loss_step=0.0791, global_step=5101.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  89%|████████▉ | 1079/1208 [29:37<03:32,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0791, train/loss_vlb_step=0.000266, train/loss_step=0.0791, global_step=5101.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  89%|████████▉ | 1079/1208 [29:37<03:32,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00519, train/loss_vlb_step=2.78e-5, train/loss_step=0.00519, global_step=5101.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  89%|████████▉ | 1080/1208 [29:41<03:31,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00519, train/loss_vlb_step=2.78e-5, train/loss_step=0.00519, global_step=5101.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  89%|████████▉ | 1080/1208 [29:41<03:31,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000714, train/loss_step=0.197, global_step=5101.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  89%|████████▉ | 1081/1208 [29:42<03:29,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000714, train/loss_step=0.197, global_step=5101.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  89%|████████▉ | 1081/1208 [29:42<03:29,  1.65s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.83e-5, train/loss_step=0.0126, global_step=5102.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  90%|████████▉ | 1082/1208 [29:43<03:27,  1.65s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.83e-5, train/loss_step=0.0126, global_step=5102.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  90%|████████▉ | 1082/1208 [29:43<03:27,  1.65s/it, loss=0.16, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00167, train/loss_step=0.345, global_step=5102.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  90%|████████▉ | 1083/1208 [29:44<03:25,  1.65s/it, loss=0.16, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00167, train/loss_step=0.345, global_step=5102.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  90%|████████▉ | 1083/1208 [29:44<03:25,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.5e-5, train/loss_step=0.0125, global_step=5102.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  90%|████████▉ | 1084/1208 [29:47<03:24,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.5e-5, train/loss_step=0.0125, global_step=5102.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  90%|████████▉ | 1084/1208 [29:47<03:24,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000127, train/loss_step=0.0339, global_step=5102.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  90%|████████▉ | 1085/1208 [29:48<03:22,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000127, train/loss_step=0.0339, global_step=5102.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  90%|████████▉ | 1085/1208 [29:48<03:22,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0759, train/loss_vlb_step=0.000254, train/loss_step=0.0759, global_step=5103.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  90%|████████▉ | 1086/1208 [29:49<03:21,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0759, train/loss_vlb_step=0.000254, train/loss_step=0.0759, global_step=5103.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  90%|████████▉ | 1086/1208 [29:49<03:21,  1.65s/it, loss=0.138, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.00035, train/loss_step=0.106, global_step=5103.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  90%|████████▉ | 1087/1208 [29:50<03:19,  1.65s/it, loss=0.138, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.00035, train/loss_step=0.106, global_step=5103.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  90%|████████▉ | 1087/1208 [29:50<03:19,  1.65s/it, loss=0.153, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00187, train/loss_step=0.328, global_step=5103.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  90%|█████████ | 1088/1208 [29:53<03:17,  1.65s/it, loss=0.153, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00187, train/loss_step=0.328, global_step=5103.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  90%|█████████ | 1088/1208 [29:53<03:17,  1.65s/it, loss=0.17, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00423, train/loss_step=0.413, global_step=5103.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  90%|█████████ | 1089/1208 [29:54<03:16,  1.65s/it, loss=0.17, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00423, train/loss_step=0.413, global_step=5103.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  90%|█████████ | 1089/1208 [29:54<03:16,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000349, train/loss_step=0.105, global_step=5104.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  90%|█████████ | 1090/1208 [29:55<03:14,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000349, train/loss_step=0.105, global_step=5104.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  90%|█████████ | 1090/1208 [29:56<03:14,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000115, train/loss_step=0.0287, global_step=5104.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  90%|█████████ | 1091/1208 [29:57<03:12,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000115, train/loss_step=0.0287, global_step=5104.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  90%|█████████ | 1091/1208 [29:57<03:12,  1.65s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0637, train/loss_vlb_step=0.000222, train/loss_step=0.0637, global_step=5104.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  90%|█████████ | 1092/1208 [30:00<03:11,  1.65s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0637, train/loss_vlb_step=0.000222, train/loss_step=0.0637, global_step=5104.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  90%|█████████ | 1092/1208 [30:00<03:11,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00148, train/loss_step=0.299, global_step=5104.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  90%|█████████ | 1093/1208 [30:01<03:09,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00148, train/loss_step=0.299, global_step=5104.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  90%|█████████ | 1093/1208 [30:01<03:09,  1.65s/it, loss=0.15, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000474, train/loss_step=0.143, global_step=5105.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  91%|█████████ | 1094/1208 [30:02<03:07,  1.65s/it, loss=0.15, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000474, train/loss_step=0.143, global_step=5105.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  91%|█████████ | 1094/1208 [30:02<03:07,  1.65s/it, loss=0.146, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000764, train/loss_step=0.211, global_step=5105.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  91%|█████████ | 1095/1208 [30:03<03:06,  1.65s/it, loss=0.146, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000764, train/loss_step=0.211, global_step=5105.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  91%|█████████ | 1095/1208 [30:03<03:06,  1.65s/it, loss=0.156, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000873, train/loss_step=0.213, global_step=5105.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  91%|█████████ | 1096/1208 [30:06<03:04,  1.65s/it, loss=0.156, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000873, train/loss_step=0.213, global_step=5105.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  91%|█████████ | 1096/1208 [30:06<03:04,  1.65s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00687, train/loss_vlb_step=3.5e-5, train/loss_step=0.00687, global_step=5105.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  91%|█████████ | 1097/1208 [30:07<03:02,  1.65s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00687, train/loss_vlb_step=3.5e-5, train/loss_step=0.00687, global_step=5105.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  91%|█████████ | 1097/1208 [30:07<03:02,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000359, train/loss_step=0.107, global_step=5106.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  91%|█████████ | 1098/1208 [30:08<03:01,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000359, train/loss_step=0.107, global_step=5106.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  91%|█████████ | 1098/1208 [30:08<03:01,  1.65s/it, loss=0.142, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000459, train/loss_step=0.138, global_step=5106.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  91%|█████████ | 1099/1208 [30:09<02:59,  1.65s/it, loss=0.142, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000459, train/loss_step=0.138, global_step=5106.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  91%|█████████ | 1099/1208 [30:09<02:59,  1.65s/it, loss=0.153, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000836, train/loss_step=0.223, global_step=5106.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  91%|█████████ | 1100/1208 [30:13<02:58,  1.65s/it, loss=0.153, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000836, train/loss_step=0.223, global_step=5106.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  91%|█████████ | 1100/1208 [30:13<02:58,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00201, train/loss_step=0.370, global_step=5106.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  91%|█████████ | 1101/1208 [30:14<02:56,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00201, train/loss_step=0.370, global_step=5106.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  91%|█████████ | 1101/1208 [30:14<02:56,  1.65s/it, loss=0.166, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=5107.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  91%|█████████ | 1102/1208 [30:15<02:54,  1.65s/it, loss=0.166, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=5107.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  91%|█████████ | 1102/1208 [30:15<02:54,  1.65s/it, loss=0.151, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.000161, train/loss_step=0.045, global_step=5107.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  91%|█████████▏| 1103/1208 [30:16<02:52,  1.65s/it, loss=0.151, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.000161, train/loss_step=0.045, global_step=5107.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  91%|█████████▏| 1103/1208 [30:16<02:52,  1.65s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00636, train/loss_vlb_step=3.28e-5, train/loss_step=0.00636, global_step=5107.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  91%|█████████▏| 1104/1208 [30:19<02:51,  1.65s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00636, train/loss_vlb_step=3.28e-5, train/loss_step=0.00636, global_step=5107.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  91%|█████████▏| 1104/1208 [30:19<02:51,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.059, train/loss_vlb_step=0.00021, train/loss_step=0.059, global_step=5107.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  91%|█████████▏| 1105/1208 [30:20<02:49,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.059, train/loss_vlb_step=0.00021, train/loss_step=0.059, global_step=5107.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  91%|█████████▏| 1105/1208 [30:20<02:49,  1.65s/it, loss=0.167, v_num=0, train/loss_simple_step=0.358, train/loss_vlb_step=0.00213, train/loss_step=0.358, global_step=5108.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  92%|█████████▏| 1106/1208 [30:21<02:47,  1.65s/it, loss=0.167, v_num=0, train/loss_simple_step=0.358, train/loss_vlb_step=0.00213, train/loss_step=0.358, global_step=5108.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  92%|█████████▏| 1106/1208 [30:21<02:47,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0043, train/loss_vlb_step=2.28e-5, train/loss_step=0.0043, global_step=5108.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  92%|█████████▏| 1107/1208 [30:22<02:46,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0043, train/loss_vlb_step=2.28e-5, train/loss_step=0.0043, global_step=5108.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  92%|█████████▏| 1107/1208 [30:22<02:46,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00189, train/loss_step=0.337, global_step=5108.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  92%|█████████▏| 1108/1208 [30:25<02:44,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00189, train/loss_step=0.337, global_step=5108.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  92%|█████████▏| 1108/1208 [30:25<02:44,  1.65s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.65e-5, train/loss_step=0.00281, global_step=5108.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  92%|█████████▏| 1109/1208 [30:26<02:43,  1.65s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.65e-5, train/loss_step=0.00281, global_step=5108.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  92%|█████████▏| 1109/1208 [30:26<02:43,  1.65s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000166, train/loss_step=0.0463, global_step=5109.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  92%|█████████▏| 1110/1208 [30:27<02:41,  1.65s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000166, train/loss_step=0.0463, global_step=5109.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  92%|█████████▏| 1110/1208 [30:27<02:41,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0458, train/loss_vlb_step=0.000171, train/loss_step=0.0458, global_step=5109.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  92%|█████████▏| 1111/1208 [30:29<02:39,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0458, train/loss_vlb_step=0.000171, train/loss_step=0.0458, global_step=5109.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  92%|█████████▏| 1111/1208 [30:29<02:39,  1.65s/it, loss=0.169, v_num=0, train/loss_simple_step=0.649, train/loss_vlb_step=0.0136, train/loss_step=0.649, global_step=5109.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  92%|█████████▏| 1112/1208 [30:32<02:38,  1.65s/it, loss=0.169, v_num=0, train/loss_simple_step=0.649, train/loss_vlb_step=0.0136, train/loss_step=0.649, global_step=5109.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  92%|█████████▏| 1112/1208 [30:32<02:38,  1.65s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000108, train/loss_step=0.0283, global_step=5109.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  92%|█████████▏| 1113/1208 [30:33<02:36,  1.65s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000108, train/loss_step=0.0283, global_step=5109.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  92%|█████████▏| 1113/1208 [30:33<02:36,  1.65s/it, loss=0.154, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.00038, train/loss_step=0.115, global_step=5110.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  92%|█████████▏| 1114/1208 [30:34<02:34,  1.65s/it, loss=0.154, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.00038, train/loss_step=0.115, global_step=5110.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  92%|█████████▏| 1114/1208 [30:34<02:34,  1.65s/it, loss=0.151, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000527, train/loss_step=0.156, global_step=5110.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  92%|█████████▏| 1115/1208 [30:35<02:33,  1.65s/it, loss=0.151, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000527, train/loss_step=0.156, global_step=5110.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  92%|█████████▏| 1115/1208 [30:35<02:33,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000232, train/loss_step=0.0676, global_step=5110.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  92%|█████████▏| 1116/1208 [30:38<02:31,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000232, train/loss_step=0.0676, global_step=5110.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  92%|█████████▏| 1116/1208 [30:38<02:31,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.24e-5, train/loss_step=0.0145, global_step=5110.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  92%|█████████▏| 1117/1208 [30:39<02:29,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.24e-5, train/loss_step=0.0145, global_step=5110.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  92%|█████████▏| 1117/1208 [30:39<02:29,  1.65s/it, loss=0.151, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000997, train/loss_step=0.245, global_step=5111.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  93%|█████████▎| 1118/1208 [30:40<02:28,  1.65s/it, loss=0.151, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000997, train/loss_step=0.245, global_step=5111.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  93%|█████████▎| 1118/1208 [30:40<02:28,  1.65s/it, loss=0.149, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=5111.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  93%|█████████▎| 1119/1208 [30:41<02:26,  1.65s/it, loss=0.149, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=5111.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  93%|█████████▎| 1119/1208 [30:41<02:26,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.16e-5, train/loss_step=0.0112, global_step=5111.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  93%|█████████▎| 1120/1208 [30:44<02:24,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.16e-5, train/loss_step=0.0112, global_step=5111.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  93%|█████████▎| 1120/1208 [30:45<02:24,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000635, train/loss_step=0.182, global_step=5111.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  93%|█████████▎| 1121/1208 [30:46<02:23,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000635, train/loss_step=0.182, global_step=5111.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  93%|█████████▎| 1121/1208 [30:46<02:23,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000353, train/loss_step=0.108, global_step=5112.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  93%|█████████▎| 1122/1208 [30:47<02:21,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000353, train/loss_step=0.108, global_step=5112.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  93%|█████████▎| 1122/1208 [30:47<02:21,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0496, train/loss_vlb_step=0.000181, train/loss_step=0.0496, global_step=5112.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  93%|█████████▎| 1123/1208 [30:48<02:19,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0496, train/loss_vlb_step=0.000181, train/loss_step=0.0496, global_step=5112.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  93%|█████████▎| 1123/1208 [30:48<02:19,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.02e-5, train/loss_step=0.00173, global_step=5112.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  93%|█████████▎| 1124/1208 [30:51<02:18,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.02e-5, train/loss_step=0.00173, global_step=5112.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  93%|█████████▎| 1124/1208 [30:51<02:18,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00111, train/loss_step=0.244, global_step=5112.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  93%|█████████▎| 1125/1208 [30:52<02:16,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00111, train/loss_step=0.244, global_step=5112.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  93%|█████████▎| 1125/1208 [30:52<02:16,  1.65s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0678, train/loss_vlb_step=0.000227, train/loss_step=0.0678, global_step=5113.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  93%|█████████▎| 1126/1208 [30:53<02:14,  1.65s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0678, train/loss_vlb_step=0.000227, train/loss_step=0.0678, global_step=5113.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  93%|█████████▎| 1126/1208 [30:53<02:14,  1.65s/it, loss=0.131, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000512, train/loss_step=0.153, global_step=5113.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  93%|█████████▎| 1127/1208 [30:54<02:13,  1.65s/it, loss=0.131, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000512, train/loss_step=0.153, global_step=5113.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  93%|█████████▎| 1127/1208 [30:54<02:13,  1.65s/it, loss=0.123, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000553, train/loss_step=0.165, global_step=5113.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  93%|█████████▎| 1128/1208 [30:57<02:11,  1.65s/it, loss=0.123, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000553, train/loss_step=0.165, global_step=5113.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  93%|█████████▎| 1128/1208 [30:57<02:11,  1.65s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0803, train/loss_vlb_step=0.000265, train/loss_step=0.0803, global_step=5113.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  93%|█████████▎| 1129/1208 [30:58<02:10,  1.65s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0803, train/loss_vlb_step=0.000265, train/loss_step=0.0803, global_step=5113.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  93%|█████████▎| 1129/1208 [30:58<02:10,  1.65s/it, loss=0.142, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00203, train/loss_step=0.356, global_step=5114.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  94%|█████████▎| 1130/1208 [30:59<02:08,  1.65s/it, loss=0.142, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00203, train/loss_step=0.356, global_step=5114.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  94%|█████████▎| 1130/1208 [30:59<02:08,  1.65s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000153, train/loss_step=0.0415, global_step=5114.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  94%|█████████▎| 1131/1208 [31:00<02:06,  1.65s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000153, train/loss_step=0.0415, global_step=5114.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  94%|█████████▎| 1131/1208 [31:00<02:06,  1.65s/it, loss=0.117, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000531, train/loss_step=0.156, global_step=5114.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  94%|█████████▎| 1132/1208 [31:04<02:05,  1.65s/it, loss=0.117, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000531, train/loss_step=0.156, global_step=5114.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  94%|█████████▎| 1132/1208 [31:04<02:05,  1.65s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.56e-5, train/loss_step=0.00281, global_step=5114.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  94%|█████████▍| 1133/1208 [31:05<02:03,  1.65s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.56e-5, train/loss_step=0.00281, global_step=5114.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  94%|█████████▍| 1133/1208 [31:05<02:03,  1.65s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0056, train/loss_vlb_step=2.83e-5, train/loss_step=0.0056, global_step=5115.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  94%|█████████▍| 1134/1208 [31:06<02:01,  1.65s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0056, train/loss_vlb_step=2.83e-5, train/loss_step=0.0056, global_step=5115.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  94%|█████████▍| 1134/1208 [31:06<02:01,  1.65s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=1.18e-5, train/loss_step=0.00201, global_step=5115.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  94%|█████████▍| 1135/1208 [31:07<02:00,  1.65s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=1.18e-5, train/loss_step=0.00201, global_step=5115.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  94%|█████████▍| 1135/1208 [31:07<02:00,  1.65s/it, loss=0.0997, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=2.01e-5, train/loss_step=0.00351, global_step=5115.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  94%|█████████▍| 1136/1208 [31:10<01:58,  1.65s/it, loss=0.0997, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=2.01e-5, train/loss_step=0.00351, global_step=5115.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  94%|█████████▍| 1136/1208 [31:10<01:58,  1.65s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.00948, train/loss_vlb_step=4.58e-5, train/loss_step=0.00948, global_step=5115.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  94%|█████████▍| 1137/1208 [31:11<01:56,  1.65s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.00948, train/loss_vlb_step=4.58e-5, train/loss_step=0.00948, global_step=5115.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  94%|█████████▍| 1137/1208 [31:11<01:56,  1.65s/it, loss=0.0923, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=5116.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  94%|█████████▍| 1138/1208 [31:12<01:55,  1.65s/it, loss=0.0923, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=5116.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  94%|█████████▍| 1138/1208 [31:12<01:55,  1.65s/it, loss=0.0874, v_num=0, train/loss_simple_step=0.00663, train/loss_vlb_step=3.34e-5, train/loss_step=0.00663, global_step=5116.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  94%|█████████▍| 1139/1208 [31:13<01:53,  1.65s/it, loss=0.0874, v_num=0, train/loss_simple_step=0.00663, train/loss_vlb_step=3.34e-5, train/loss_step=0.00663, global_step=5116.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  94%|█████████▍| 1139/1208 [31:13<01:53,  1.65s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000556, train/loss_step=0.165, global_step=5116.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  94%|█████████▍| 1140/1208 [31:16<01:51,  1.65s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000556, train/loss_step=0.165, global_step=5116.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  94%|█████████▍| 1140/1208 [31:16<01:51,  1.65s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=9.17e-5, train/loss_step=0.0221, global_step=5116.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  94%|█████████▍| 1141/1208 [31:17<01:50,  1.65s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=9.17e-5, train/loss_step=0.0221, global_step=5116.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  94%|█████████▍| 1141/1208 [31:17<01:50,  1.65s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.0926, train/loss_vlb_step=0.00031, train/loss_step=0.0926, global_step=5117.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  95%|█████████▍| 1142/1208 [31:19<01:48,  1.65s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.0926, train/loss_vlb_step=0.00031, train/loss_step=0.0926, global_step=5117.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  95%|█████████▍| 1142/1208 [31:19<01:48,  1.65s/it, loss=0.084, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.19e-5, train/loss_step=0.00195, global_step=5117.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  95%|█████████▍| 1143/1208 [31:20<01:46,  1.64s/it, loss=0.084, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.19e-5, train/loss_step=0.00195, global_step=5117.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  95%|█████████▍| 1143/1208 [31:20<01:46,  1.64s/it, loss=0.103, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00302, train/loss_step=0.391, global_step=5117.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  95%|█████████▍| 1144/1208 [31:23<01:45,  1.65s/it, loss=0.103, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00302, train/loss_step=0.391, global_step=5117.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  95%|█████████▍| 1144/1208 [31:23<01:45,  1.65s/it, loss=0.104, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000992, train/loss_step=0.248, global_step=5117.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  95%|█████████▍| 1145/1208 [31:24<01:43,  1.65s/it, loss=0.104, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000992, train/loss_step=0.248, global_step=5117.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  95%|█████████▍| 1145/1208 [31:24<01:43,  1.65s/it, loss=0.116, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00189, train/loss_step=0.319, global_step=5118.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  95%|█████████▍| 1146/1208 [31:25<01:42,  1.65s/it, loss=0.116, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00189, train/loss_step=0.319, global_step=5118.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  95%|█████████▍| 1146/1208 [31:25<01:42,  1.65s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.56e-5, train/loss_step=0.0234, global_step=5118.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  95%|█████████▍| 1147/1208 [31:26<01:40,  1.64s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.56e-5, train/loss_step=0.0234, global_step=5118.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  95%|█████████▍| 1147/1208 [31:26<01:40,  1.64s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.38e-5, train/loss_step=0.0126, global_step=5118.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  95%|█████████▌| 1148/1208 [31:29<01:38,  1.65s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.38e-5, train/loss_step=0.0126, global_step=5118.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  95%|█████████▌| 1148/1208 [31:29<01:38,  1.65s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.76e-5, train/loss_step=0.00319, global_step=5118.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  95%|█████████▌| 1149/1208 [31:30<01:37,  1.65s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.76e-5, train/loss_step=0.00319, global_step=5118.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  95%|█████████▌| 1149/1208 [31:30<01:37,  1.65s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000125, train/loss_step=0.0336, global_step=5119.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  95%|█████████▌| 1150/1208 [31:31<01:35,  1.65s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000125, train/loss_step=0.0336, global_step=5119.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  95%|█████████▌| 1150/1208 [31:31<01:35,  1.65s/it, loss=0.0806, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.29e-5, train/loss_step=0.0119, global_step=5119.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  95%|█████████▌| 1151/1208 [31:32<01:33,  1.64s/it, loss=0.0806, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.29e-5, train/loss_step=0.0119, global_step=5119.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  95%|█████████▌| 1151/1208 [31:32<01:33,  1.64s/it, loss=0.081, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000555, train/loss_step=0.163, global_step=5119.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  95%|█████████▌| 1152/1208 [31:36<01:32,  1.65s/it, loss=0.081, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000555, train/loss_step=0.163, global_step=5119.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  95%|█████████▌| 1152/1208 [31:36<01:32,  1.65s/it, loss=0.0836, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000195, train/loss_step=0.0555, global_step=5119.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  95%|█████████▌| 1153/1208 [31:37<01:30,  1.65s/it, loss=0.0836, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000195, train/loss_step=0.0555, global_step=5119.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  95%|█████████▌| 1153/1208 [31:37<01:30,  1.65s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000471, train/loss_step=0.139, global_step=5120.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  96%|█████████▌| 1154/1208 [31:38<01:28,  1.64s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000471, train/loss_step=0.139, global_step=5120.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  96%|█████████▌| 1154/1208 [31:38<01:28,  1.64s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.0643, train/loss_vlb_step=0.00022, train/loss_step=0.0643, global_step=5120.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  96%|█████████▌| 1155/1208 [31:39<01:27,  1.64s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.0643, train/loss_vlb_step=0.00022, train/loss_step=0.0643, global_step=5120.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  96%|█████████▌| 1155/1208 [31:39<01:27,  1.64s/it, loss=0.095, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000136, train/loss_step=0.0364, global_step=5120.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  96%|█████████▌| 1156/1208 [31:42<01:25,  1.65s/it, loss=0.095, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000136, train/loss_step=0.0364, global_step=5120.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  96%|█████████▌| 1156/1208 [31:42<01:25,  1.65s/it, loss=0.101, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000453, train/loss_step=0.136, global_step=5120.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  96%|█████████▌| 1157/1208 [31:43<01:23,  1.65s/it, loss=0.101, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000453, train/loss_step=0.136, global_step=5120.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  96%|█████████▌| 1157/1208 [31:43<01:23,  1.65s/it, loss=0.0997, v_num=0, train/loss_simple_step=0.0682, train/loss_vlb_step=0.000233, train/loss_step=0.0682, global_step=5121.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  96%|█████████▌| 1158/1208 [31:44<01:22,  1.64s/it, loss=0.0997, v_num=0, train/loss_simple_step=0.0682, train/loss_vlb_step=0.000233, train/loss_step=0.0682, global_step=5121.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  96%|█████████▌| 1158/1208 [31:44<01:22,  1.64s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.000141, train/loss_step=0.0393, global_step=5121.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  96%|█████████▌| 1159/1208 [31:45<01:20,  1.64s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.000141, train/loss_step=0.0393, global_step=5121.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  96%|█████████▌| 1159/1208 [31:45<01:20,  1.64s/it, loss=0.108, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00111, train/loss_step=0.293, global_step=5121.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  96%|█████████▌| 1160/1208 [31:48<01:18,  1.65s/it, loss=0.108, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00111, train/loss_step=0.293, global_step=5121.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  96%|█████████▌| 1160/1208 [31:48<01:18,  1.65s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0646, train/loss_vlb_step=0.000223, train/loss_step=0.0646, global_step=5121.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  96%|█████████▌| 1161/1208 [31:49<01:17,  1.65s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0646, train/loss_vlb_step=0.000223, train/loss_step=0.0646, global_step=5121.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  96%|█████████▌| 1161/1208 [31:49<01:17,  1.65s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.000241, train/loss_step=0.0702, global_step=5122.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  96%|█████████▌| 1162/1208 [31:51<01:15,  1.64s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.000241, train/loss_step=0.0702, global_step=5122.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  96%|█████████▌| 1162/1208 [31:51<01:15,  1.64s/it, loss=0.114, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=5122.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  96%|█████████▋| 1163/1208 [31:52<01:13,  1.64s/it, loss=0.114, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=5122.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  96%|█████████▋| 1163/1208 [31:52<01:13,  1.64s/it, loss=0.095, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.52e-5, train/loss_step=0.0122, global_step=5122.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  96%|█████████▋| 1164/1208 [31:55<01:12,  1.65s/it, loss=0.095, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.52e-5, train/loss_step=0.0122, global_step=5122.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  96%|█████████▋| 1164/1208 [31:55<01:12,  1.65s/it, loss=0.0876, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000329, train/loss_step=0.100, global_step=5122.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  96%|█████████▋| 1165/1208 [31:56<01:10,  1.64s/it, loss=0.0876, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000329, train/loss_step=0.100, global_step=5122.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  96%|█████████▋| 1165/1208 [31:56<01:10,  1.64s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000887, train/loss_step=0.226, global_step=5123.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  97%|█████████▋| 1166/1208 [31:57<01:09,  1.64s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000887, train/loss_step=0.226, global_step=5123.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  97%|█████████▋| 1166/1208 [31:57<01:09,  1.64s/it, loss=0.0858, v_num=0, train/loss_simple_step=0.0798, train/loss_vlb_step=0.000264, train/loss_step=0.0798, global_step=5123.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  97%|█████████▋| 1167/1208 [31:58<01:07,  1.64s/it, loss=0.0858, v_num=0, train/loss_simple_step=0.0798, train/loss_vlb_step=0.000264, train/loss_step=0.0798, global_step=5123.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  97%|█████████▋| 1167/1208 [31:58<01:07,  1.64s/it, loss=0.0892, v_num=0, train/loss_simple_step=0.081, train/loss_vlb_step=0.000268, train/loss_step=0.081, global_step=5123.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  97%|█████████▋| 1168/1208 [32:01<01:05,  1.65s/it, loss=0.0892, v_num=0, train/loss_simple_step=0.081, train/loss_vlb_step=0.000268, train/loss_step=0.081, global_step=5123.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  97%|█████████▋| 1168/1208 [32:01<01:05,  1.65s/it, loss=0.1, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.00105, train/loss_step=0.228, global_step=5123.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  97%|█████████▋| 1169/1208 [32:02<01:04,  1.64s/it, loss=0.1, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.00105, train/loss_step=0.228, global_step=5123.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  97%|█████████▋| 1169/1208 [32:02<01:04,  1.64s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.9e-5, train/loss_step=0.016, global_step=5124.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  97%|█████████▋| 1170/1208 [32:03<01:02,  1.64s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.9e-5, train/loss_step=0.016, global_step=5124.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  97%|█████████▋| 1170/1208 [32:03<01:02,  1.64s/it, loss=0.107, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000512, train/loss_step=0.156, global_step=5124.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  97%|█████████▋| 1171/1208 [32:04<01:00,  1.64s/it, loss=0.107, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000512, train/loss_step=0.156, global_step=5124.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  97%|█████████▋| 1171/1208 [32:04<01:00,  1.64s/it, loss=0.109, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.00079, train/loss_step=0.214, global_step=5124.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  97%|█████████▋| 1172/1208 [32:08<00:59,  1.65s/it, loss=0.109, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.00079, train/loss_step=0.214, global_step=5124.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  97%|█████████▋| 1172/1208 [32:08<00:59,  1.65s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=8.94e-5, train/loss_step=0.0218, global_step=5124.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  97%|█████████▋| 1173/1208 [32:09<00:57,  1.64s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=8.94e-5, train/loss_step=0.0218, global_step=5124.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  97%|█████████▋| 1173/1208 [32:09<00:57,  1.64s/it, loss=0.119, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00217, train/loss_step=0.361, global_step=5125.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  97%|█████████▋| 1174/1208 [32:10<00:55,  1.64s/it, loss=0.119, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00217, train/loss_step=0.361, global_step=5125.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  97%|█████████▋| 1174/1208 [32:10<00:55,  1.64s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00403, train/loss_vlb_step=2.22e-5, train/loss_step=0.00403, global_step=5125.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  97%|█████████▋| 1175/1208 [32:11<00:54,  1.64s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00403, train/loss_vlb_step=2.22e-5, train/loss_step=0.00403, global_step=5125.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  97%|█████████▋| 1175/1208 [32:11<00:54,  1.64s/it, loss=0.12, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000411, train/loss_step=0.125, global_step=5125.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  97%|█████████▋| 1176/1208 [32:14<00:52,  1.65s/it, loss=0.12, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000411, train/loss_step=0.125, global_step=5125.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  97%|█████████▋| 1176/1208 [32:14<00:52,  1.65s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00297, train/loss_vlb_step=1.68e-5, train/loss_step=0.00297, global_step=5125.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  97%|█████████▋| 1177/1208 [32:15<00:50,  1.64s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00297, train/loss_vlb_step=1.68e-5, train/loss_step=0.00297, global_step=5125.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  97%|█████████▋| 1177/1208 [32:15<00:50,  1.64s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000117, train/loss_step=0.0302, global_step=5126.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  98%|█████████▊| 1178/1208 [32:16<00:49,  1.64s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000117, train/loss_step=0.0302, global_step=5126.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  98%|█████████▊| 1178/1208 [32:16<00:49,  1.64s/it, loss=0.121, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000901, train/loss_step=0.237, global_step=5126.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  98%|█████████▊| 1179/1208 [32:17<00:47,  1.64s/it, loss=0.121, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000901, train/loss_step=0.237, global_step=5126.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  98%|█████████▊| 1179/1208 [32:17<00:47,  1.64s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000111, train/loss_step=0.0298, global_step=5126.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  98%|█████████▊| 1180/1208 [32:20<00:46,  1.64s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000111, train/loss_step=0.0298, global_step=5126.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  98%|█████████▊| 1180/1208 [32:20<00:46,  1.64s/it, loss=0.117, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00111, train/loss_step=0.245, global_step=5126.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  98%|█████████▊| 1181/1208 [32:22<00:44,  1.64s/it, loss=0.117, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00111, train/loss_step=0.245, global_step=5126.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  98%|█████████▊| 1181/1208 [32:22<00:44,  1.64s/it, loss=0.143, v_num=0, train/loss_simple_step=0.575, train/loss_vlb_step=0.0105, train/loss_step=0.575, global_step=5127.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  98%|█████████▊| 1182/1208 [32:23<00:42,  1.64s/it, loss=0.143, v_num=0, train/loss_simple_step=0.575, train/loss_vlb_step=0.0105, train/loss_step=0.575, global_step=5127.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  98%|█████████▊| 1182/1208 [32:23<00:42,  1.64s/it, loss=0.144, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000422, train/loss_step=0.127, global_step=5127.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  98%|█████████▊| 1183/1208 [32:24<00:41,  1.64s/it, loss=0.144, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000422, train/loss_step=0.127, global_step=5127.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  98%|█████████▊| 1183/1208 [32:24<00:41,  1.64s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.48e-5, train/loss_step=0.0143, global_step=5127.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  98%|█████████▊| 1184/1208 [32:27<00:39,  1.64s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.48e-5, train/loss_step=0.0143, global_step=5127.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  98%|█████████▊| 1184/1208 [32:27<00:39,  1.64s/it, loss=0.152, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00119, train/loss_step=0.264, global_step=5127.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  98%|█████████▊| 1185/1208 [32:28<00:37,  1.64s/it, loss=0.152, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00119, train/loss_step=0.264, global_step=5127.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  98%|█████████▊| 1185/1208 [32:28<00:37,  1.64s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0998, train/loss_vlb_step=0.000329, train/loss_step=0.0998, global_step=5128.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  98%|█████████▊| 1186/1208 [32:29<00:36,  1.64s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0998, train/loss_vlb_step=0.000329, train/loss_step=0.0998, global_step=5128.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  98%|█████████▊| 1186/1208 [32:29<00:36,  1.64s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00513, train/loss_vlb_step=2.61e-5, train/loss_step=0.00513, global_step=5128.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  98%|█████████▊| 1187/1208 [32:30<00:34,  1.64s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00513, train/loss_vlb_step=2.61e-5, train/loss_step=0.00513, global_step=5128.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  98%|█████████▊| 1187/1208 [32:30<00:34,  1.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00878, train/loss_vlb_step=4.19e-5, train/loss_step=0.00878, global_step=5128.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  98%|█████████▊| 1188/1208 [32:33<00:32,  1.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00878, train/loss_vlb_step=4.19e-5, train/loss_step=0.00878, global_step=5128.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  98%|█████████▊| 1188/1208 [32:33<00:32,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000367, train/loss_step=0.110, global_step=5128.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]   Epoch 16:  98%|█████████▊| 1189/1208 [32:34<00:31,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000367, train/loss_step=0.110, global_step=5128.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  98%|█████████▊| 1189/1208 [32:34<00:31,  1.64s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0779, train/loss_vlb_step=0.000258, train/loss_step=0.0779, global_step=5129.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  99%|█████████▊| 1190/1208 [32:35<00:29,  1.64s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0779, train/loss_vlb_step=0.000258, train/loss_step=0.0779, global_step=5129.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  99%|█████████▊| 1190/1208 [32:35<00:29,  1.64s/it, loss=0.135, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000509, train/loss_step=0.153, global_step=5129.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  99%|█████████▊| 1191/1208 [32:36<00:27,  1.64s/it, loss=0.135, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000509, train/loss_step=0.153, global_step=5129.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  99%|█████████▊| 1191/1208 [32:36<00:27,  1.64s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0052, train/loss_vlb_step=2.71e-5, train/loss_step=0.0052, global_step=5129.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  99%|█████████▊| 1192/1208 [32:40<00:26,  1.64s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0052, train/loss_vlb_step=2.71e-5, train/loss_step=0.0052, global_step=5129.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  99%|█████████▊| 1192/1208 [32:40<00:26,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.00048, train/loss_step=0.144, global_step=5129.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16:  99%|█████████▉| 1193/1208 [32:41<00:24,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.00048, train/loss_step=0.144, global_step=5129.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  99%|█████████▉| 1193/1208 [32:41<00:24,  1.64s/it, loss=0.121, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000565, train/loss_step=0.163, global_step=5130.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  99%|█████████▉| 1194/1208 [32:42<00:23,  1.64s/it, loss=0.121, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000565, train/loss_step=0.163, global_step=5130.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  99%|█████████▉| 1194/1208 [32:42<00:23,  1.64s/it, loss=0.129, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000585, train/loss_step=0.170, global_step=5130.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  99%|█████████▉| 1195/1208 [32:43<00:21,  1.64s/it, loss=0.129, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000585, train/loss_step=0.170, global_step=5130.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  99%|█████████▉| 1195/1208 [32:43<00:21,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00364, train/loss_vlb_step=1.98e-5, train/loss_step=0.00364, global_step=5130.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  99%|█████████▉| 1196/1208 [32:46<00:19,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00364, train/loss_vlb_step=1.98e-5, train/loss_step=0.00364, global_step=5130.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  99%|█████████▉| 1196/1208 [32:46<00:19,  1.64s/it, loss=0.129, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.00037, train/loss_step=0.113, global_step=5130.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16:  99%|█████████▉| 1197/1208 [32:47<00:18,  1.64s/it, loss=0.129, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.00037, train/loss_step=0.113, global_step=5130.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  99%|█████████▉| 1197/1208 [32:47<00:18,  1.64s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=8.36e-5, train/loss_step=0.0204, global_step=5131.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  99%|█████████▉| 1198/1208 [32:48<00:16,  1.64s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=8.36e-5, train/loss_step=0.0204, global_step=5131.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  99%|█████████▉| 1198/1208 [32:48<00:16,  1.64s/it, loss=0.121, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000329, train/loss_step=0.100, global_step=5131.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16:  99%|█████████▉| 1199/1208 [32:49<00:14,  1.64s/it, loss=0.121, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000329, train/loss_step=0.100, global_step=5131.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  99%|█████████▉| 1199/1208 [32:49<00:14,  1.64s/it, loss=0.126, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=5131.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  99%|█████████▉| 1200/1208 [32:52<00:13,  1.64s/it, loss=0.126, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=5131.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  99%|█████████▉| 1200/1208 [32:52<00:13,  1.64s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=2.44e-5, train/loss_step=0.0046, global_step=5131.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.71it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.72it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.74it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.75it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.79it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.79it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.76it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.76it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.80it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 16:  99%|█████████▉| 1201/1208 [33:23<00:11,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=2.44e-5, train/loss_step=0.0046, global_step=5131.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16:  99%|█████████▉| 1201/1208 [33:23<00:11,  1.67s/it, loss=0.093, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000545, train/loss_step=0.162, global_step=5132.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16: 100%|█████████▉| 1202/1208 [33:24<00:10,  1.67s/it, loss=0.093, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000545, train/loss_step=0.162, global_step=5132.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16: 100%|█████████▉| 1202/1208 [33:24<00:10,  1.67s/it, loss=0.0894, v_num=0, train/loss_simple_step=0.0553, train/loss_vlb_step=0.000194, train/loss_step=0.0553, global_step=5132.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16: 100%|█████████▉| 1203/1208 [33:25<00:08,  1.67s/it, loss=0.0894, v_num=0, train/loss_simple_step=0.0553, train/loss_vlb_step=0.000194, train/loss_step=0.0553, global_step=5132.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16: 100%|█████████▉| 1203/1208 [33:25<00:08,  1.67s/it, loss=0.0894, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.62e-5, train/loss_step=0.0143, global_step=5132.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146] Epoch 16: 100%|█████████▉| 1204/1208 [33:28<00:06,  1.67s/it, loss=0.0894, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.62e-5, train/loss_step=0.0143, global_step=5132.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16: 100%|█████████▉| 1204/1208 [33:28<00:06,  1.67s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00144, train/loss_step=0.286, global_step=5132.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]  Epoch 16: 100%|█████████▉| 1205/1208 [33:29<00:05,  1.67s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00144, train/loss_step=0.286, global_step=5132.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16: 100%|█████████▉| 1205/1208 [33:29<00:05,  1.67s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000149, train/loss_step=0.0409, global_step=5133.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16: 100%|█████████▉| 1206/1208 [33:30<00:03,  1.67s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000149, train/loss_step=0.0409, global_step=5133.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16: 100%|█████████▉| 1206/1208 [33:30<00:03,  1.67s/it, loss=0.102, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00121, train/loss_step=0.291, global_step=5133.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]    Epoch 16: 100%|█████████▉| 1207/1208 [33:31<00:01,  1.67s/it, loss=0.102, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00121, train/loss_step=0.291, global_step=5133.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16: 100%|█████████▉| 1207/1208 [33:31<00:01,  1.67s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=1.96e-5, train/loss_step=0.00361, global_step=5133.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16: 100%|██████████| 1208/1208 [33:37<00:00,  1.67s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=1.96e-5, train/loss_step=0.00361, global_step=5133.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 16: 100%|██████████| 1208/1208 [33:37<00:00,  1.67s/it, loss=0.113, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.0019, train/loss_step=0.344, global_step=5133.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]     
+
+
+Epoch 16:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.113, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.0019, train/loss_step=0.344, global_step=5133.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]           Epoch 17:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.113, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.0019, train/loss_step=0.344, global_step=5133.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.84it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.76it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.84it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.75it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.84it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.77it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.83it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.83it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.76it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:23,  1.72it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.83it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.74it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.84it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.75it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.76it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.78it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.78it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.83it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.78it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.79it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.83it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.83it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.83it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.83it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.83it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.83it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.82it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.78it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.83it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.78it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.81it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.83it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.83it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.82it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.83it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.78it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.83it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.83it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.78it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.83it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 17:   0%|          | 1/1208 [00:32<10:56:38, 32.64s/it, loss=0.113, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.0019, train/loss_step=0.344, global_step=5133.0, train/loss_simple_epoch=0.146, train/loss_vlb_epoch=0.0026, train/loss_epoch=0.146]Epoch 17:   0%|          | 1/1208 [00:32<10:56:40, 32.64s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0631, train/loss_vlb_step=0.000218, train/loss_step=0.0631, global_step=5134.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   0%|          | 2/1208 [00:33<5:38:30, 16.84s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0631, train/loss_vlb_step=0.000218, train/loss_step=0.0631, global_step=5134.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:   0%|          | 2/1208 [00:33<5:38:31, 16.84s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0439, train/loss_vlb_step=0.000157, train/loss_step=0.0439, global_step=5134.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   0%|          | 3/1208 [00:34<3:52:25, 11.57s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0439, train/loss_vlb_step=0.000157, train/loss_step=0.0439, global_step=5134.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   0%|          | 3/1208 [00:34<3:53:56, 11.65s/it, loss=0.14, v_num=0, train/loss_simple_step=0.669, train/loss_vlb_step=0.015, train/loss_step=0.669, global_step=5134.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]      Epoch 17:   0%|          | 4/1208 [00:38<3:10:57,  9.52s/it, loss=0.14, v_num=0, train/loss_simple_step=0.669, train/loss_vlb_step=0.015, train/loss_step=0.669, global_step=5134.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   0%|          | 4/1208 [00:38<3:10:58,  9.52s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0713, train/loss_vlb_step=0.000241, train/loss_step=0.0713, global_step=5134.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   0%|          | 5/1208 [00:39<2:36:56,  7.83s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0713, train/loss_vlb_step=0.000241, train/loss_step=0.0713, global_step=5134.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   0%|          | 5/1208 [00:39<2:36:56,  7.83s/it, loss=0.154, v_num=0, train/loss_simple_step=0.506, train/loss_vlb_step=0.00542, train/loss_step=0.506, global_step=5135.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:   0%|          | 6/1208 [00:40<2:14:07,  6.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.506, train/loss_vlb_step=0.00542, train/loss_step=0.506, global_step=5135.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   0%|          | 6/1208 [00:40<2:14:08,  6.70s/it, loss=0.18, v_num=0, train/loss_simple_step=0.690, train/loss_vlb_step=0.0395, train/loss_step=0.690, global_step=5135.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:   1%|          | 7/1208 [00:41<1:57:51,  5.89s/it, loss=0.18, v_num=0, train/loss_simple_step=0.690, train/loss_vlb_step=0.0395, train/loss_step=0.690, global_step=5135.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   1%|          | 7/1208 [00:41<1:57:51,  5.89s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00653, train/loss_vlb_step=3.29e-5, train/loss_step=0.00653, global_step=5135.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   1%|          | 8/1208 [00:44<1:51:10,  5.56s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00653, train/loss_vlb_step=3.29e-5, train/loss_step=0.00653, global_step=5135.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   1%|          | 8/1208 [00:44<1:51:10,  5.56s/it, loss=0.182, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000569, train/loss_step=0.158, global_step=5135.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:   1%|          | 9/1208 [00:45<1:41:04,  5.06s/it, loss=0.182, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000569, train/loss_step=0.158, global_step=5135.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   1%|          | 9/1208 [00:45<1:41:04,  5.06s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000108, train/loss_step=0.0291, global_step=5136.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   1%|          | 10/1208 [00:46<1:32:55,  4.65s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000108, train/loss_step=0.0291, global_step=5136.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   1%|          | 10/1208 [00:46<1:32:55,  4.65s/it, loss=0.183, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=5136.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:   1%|          | 11/1208 [00:47<1:26:16,  4.32s/it, loss=0.183, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=5136.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   1%|          | 11/1208 [00:47<1:26:16,  4.32s/it, loss=0.219, v_num=0, train/loss_simple_step=0.846, train/loss_vlb_step=0.0721, train/loss_step=0.846, global_step=5136.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:   1%|          | 12/1208 [00:50<1:24:31,  4.24s/it, loss=0.219, v_num=0, train/loss_simple_step=0.846, train/loss_vlb_step=0.0721, train/loss_step=0.846, global_step=5136.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   1%|          | 12/1208 [00:50<1:24:31,  4.24s/it, loss=0.22, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.4e-5, train/loss_step=0.0146, global_step=5136.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   1%|          | 13/1208 [00:51<1:19:35,  4.00s/it, loss=0.22, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.4e-5, train/loss_step=0.0146, global_step=5136.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   1%|          | 13/1208 [00:51<1:19:35,  4.00s/it, loss=0.212, v_num=0, train/loss_simple_step=0.00321, train/loss_vlb_step=1.8e-5, train/loss_step=0.00321, global_step=5137.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   1%|          | 14/1208 [00:52<1:15:18,  3.78s/it, loss=0.212, v_num=0, train/loss_simple_step=0.00321, train/loss_vlb_step=1.8e-5, train/loss_step=0.00321, global_step=5137.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   1%|          | 14/1208 [00:52<1:15:18,  3.78s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=7.94e-5, train/loss_step=0.0193, global_step=5137.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:   1%|          | 15/1208 [00:54<1:11:36,  3.60s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=7.94e-5, train/loss_step=0.0193, global_step=5137.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   1%|          | 15/1208 [00:54<1:11:36,  3.60s/it, loss=0.219, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000766, train/loss_step=0.199, global_step=5137.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   1%|▏         | 16/1208 [00:57<1:11:07,  3.58s/it, loss=0.219, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000766, train/loss_step=0.199, global_step=5137.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   1%|▏         | 16/1208 [00:57<1:11:08,  3.58s/it, loss=0.212, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000443, train/loss_step=0.135, global_step=5137.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   1%|▏         | 17/1208 [00:58<1:08:07,  3.43s/it, loss=0.212, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000443, train/loss_step=0.135, global_step=5137.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   1%|▏         | 17/1208 [00:58<1:08:08,  3.43s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.5e-5, train/loss_step=0.0117, global_step=5138.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:   1%|▏         | 18/1208 [00:59<1:05:25,  3.30s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.5e-5, train/loss_step=0.0117, global_step=5138.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   1%|▏         | 18/1208 [00:59<1:05:25,  3.30s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.2e-5, train/loss_step=0.00207, global_step=5138.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   2%|▏         | 19/1208 [01:00<1:02:59,  3.18s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.2e-5, train/loss_step=0.00207, global_step=5138.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   2%|▏         | 19/1208 [01:00<1:02:59,  3.18s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00301, train/loss_vlb_step=1.67e-5, train/loss_step=0.00301, global_step=5138.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   2%|▏         | 20/1208 [01:03<1:03:03,  3.19s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00301, train/loss_vlb_step=1.67e-5, train/loss_step=0.00301, global_step=5138.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   2%|▏         | 20/1208 [01:03<1:03:03,  3.19s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00717, train/loss_vlb_step=3.55e-5, train/loss_step=0.00717, global_step=5138.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   2%|▏         | 21/1208 [01:04<1:00:59,  3.08s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00717, train/loss_vlb_step=3.55e-5, train/loss_step=0.00717, global_step=5138.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   2%|▏         | 21/1208 [01:04<1:01:00,  3.08s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.75e-5, train/loss_step=0.00304, global_step=5139.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   2%|▏         | 22/1208 [01:05<59:06,  2.99s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.75e-5, train/loss_step=0.00304, global_step=5139.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:   2%|▏         | 22/1208 [01:05<59:06,  2.99s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0842, train/loss_vlb_step=0.000282, train/loss_step=0.0842, global_step=5139.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:   2%|▏         | 23/1208 [01:06<57:21,  2.90s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0842, train/loss_vlb_step=0.000282, train/loss_step=0.0842, global_step=5139.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   2%|▏         | 23/1208 [01:06<57:21,  2.90s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.16e-5, train/loss_step=0.0228, global_step=5139.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:   2%|▏         | 24/1208 [01:10<57:39,  2.92s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.16e-5, train/loss_step=0.0228, global_step=5139.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   2%|▏         | 24/1208 [01:10<57:39,  2.92s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0427, train/loss_vlb_step=0.000154, train/loss_step=0.0427, global_step=5139.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   2%|▏         | 25/1208 [01:11<56:08,  2.85s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0427, train/loss_vlb_step=0.000154, train/loss_step=0.0427, global_step=5139.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   2%|▏         | 25/1208 [01:11<56:08,  2.85s/it, loss=0.134, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00127, train/loss_step=0.300, global_step=5140.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:   2%|▏         | 26/1208 [01:12<54:43,  2.78s/it, loss=0.134, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00127, train/loss_step=0.300, global_step=5140.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   2%|▏         | 26/1208 [01:12<54:43,  2.78s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.27e-5, train/loss_step=0.00423, global_step=5140.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   2%|▏         | 27/1208 [01:13<53:24,  2.71s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.27e-5, train/loss_step=0.00423, global_step=5140.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   2%|▏         | 27/1208 [01:13<53:24,  2.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=0.000102, train/loss_step=0.0261, global_step=5140.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:   2%|▏         | 28/1208 [01:16<53:45,  2.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=0.000102, train/loss_step=0.0261, global_step=5140.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   2%|▏         | 28/1208 [01:16<53:45,  2.73s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.00827, train/loss_vlb_step=4.04e-5, train/loss_step=0.00827, global_step=5140.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   2%|▏         | 29/1208 [01:17<52:34,  2.68s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.00827, train/loss_vlb_step=4.04e-5, train/loss_step=0.00827, global_step=5140.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   2%|▏         | 29/1208 [01:17<52:34,  2.68s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.0765, train/loss_vlb_step=0.00026, train/loss_step=0.0765, global_step=5141.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:   2%|▏         | 30/1208 [01:18<51:27,  2.62s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.0765, train/loss_vlb_step=0.00026, train/loss_step=0.0765, global_step=5141.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   2%|▏         | 30/1208 [01:18<51:27,  2.62s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000284, train/loss_step=0.086, global_step=5141.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:   3%|▎         | 31/1208 [01:19<50:25,  2.57s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000284, train/loss_step=0.086, global_step=5141.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   3%|▎         | 31/1208 [01:19<50:25,  2.57s/it, loss=0.0593, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000451, train/loss_step=0.137, global_step=5141.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   3%|▎         | 32/1208 [01:22<50:47,  2.59s/it, loss=0.0593, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000451, train/loss_step=0.137, global_step=5141.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   3%|▎         | 32/1208 [01:22<50:47,  2.59s/it, loss=0.0593, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.6e-5, train/loss_step=0.0154, global_step=5141.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   3%|▎         | 33/1208 [01:23<49:50,  2.55s/it, loss=0.0593, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.6e-5, train/loss_step=0.0154, global_step=5141.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   3%|▎         | 33/1208 [01:23<49:50,  2.55s/it, loss=0.0597, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.67e-5, train/loss_step=0.0105, global_step=5142.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   3%|▎         | 34/1208 [01:25<48:55,  2.50s/it, loss=0.0597, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.67e-5, train/loss_step=0.0105, global_step=5142.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   3%|▎         | 34/1208 [01:25<48:55,  2.50s/it, loss=0.0603, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.000119, train/loss_step=0.0316, global_step=5142.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   3%|▎         | 35/1208 [01:26<48:03,  2.46s/it, loss=0.0603, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.000119, train/loss_step=0.0316, global_step=5142.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   3%|▎         | 35/1208 [01:26<48:03,  2.46s/it, loss=0.0558, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000364, train/loss_step=0.110, global_step=5142.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:   3%|▎         | 36/1208 [01:29<48:27,  2.48s/it, loss=0.0558, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000364, train/loss_step=0.110, global_step=5142.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   3%|▎         | 36/1208 [01:29<48:27,  2.48s/it, loss=0.0502, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.89e-5, train/loss_step=0.0219, global_step=5142.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   3%|▎         | 37/1208 [01:30<47:40,  2.44s/it, loss=0.0502, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.89e-5, train/loss_step=0.0219, global_step=5142.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   3%|▎         | 37/1208 [01:30<47:40,  2.44s/it, loss=0.0637, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.0012, train/loss_step=0.281, global_step=5143.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:   3%|▎         | 38/1208 [01:31<46:54,  2.41s/it, loss=0.0637, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.0012, train/loss_step=0.281, global_step=5143.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   3%|▎         | 38/1208 [01:31<46:54,  2.41s/it, loss=0.0689, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=5143.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   3%|▎         | 39/1208 [01:32<46:11,  2.37s/it, loss=0.0689, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=5143.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   3%|▎         | 39/1208 [01:32<46:11,  2.37s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.534, train/loss_vlb_step=0.00511, train/loss_step=0.534, global_step=5143.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:   3%|▎         | 40/1208 [01:35<46:35,  2.39s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.534, train/loss_vlb_step=0.00511, train/loss_step=0.534, global_step=5143.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   3%|▎         | 40/1208 [01:35<46:35,  2.39s/it, loss=0.112, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00206, train/loss_step=0.347, global_step=5143.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:   3%|▎         | 41/1208 [01:36<45:54,  2.36s/it, loss=0.112, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00206, train/loss_step=0.347, global_step=5143.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   3%|▎         | 41/1208 [01:36<45:54,  2.36s/it, loss=0.126, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00118, train/loss_step=0.271, global_step=5144.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   3%|▎         | 42/1208 [01:37<45:15,  2.33s/it, loss=0.126, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00118, train/loss_step=0.271, global_step=5144.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   3%|▎         | 42/1208 [01:37<45:15,  2.33s/it, loss=0.127, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000351, train/loss_step=0.106, global_step=5144.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   4%|▎         | 43/1208 [01:38<44:38,  2.30s/it, loss=0.127, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000351, train/loss_step=0.106, global_step=5144.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   4%|▎         | 43/1208 [01:38<44:38,  2.30s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.00012, train/loss_step=0.0311, global_step=5144.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   4%|▎         | 44/1208 [01:42<45:01,  2.32s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.00012, train/loss_step=0.0311, global_step=5144.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   4%|▎         | 44/1208 [01:42<45:01,  2.32s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00189, train/loss_vlb_step=1.14e-5, train/loss_step=0.00189, global_step=5144.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   4%|▎         | 45/1208 [01:43<44:26,  2.29s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00189, train/loss_vlb_step=1.14e-5, train/loss_step=0.00189, global_step=5144.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   4%|▎         | 45/1208 [01:43<44:26,  2.29s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000102, train/loss_step=0.0254, global_step=5145.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:   4%|▍         | 46/1208 [01:44<43:52,  2.27s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000102, train/loss_step=0.0254, global_step=5145.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   4%|▍         | 46/1208 [01:44<43:52,  2.27s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0867, train/loss_vlb_step=0.000285, train/loss_step=0.0867, global_step=5145.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   4%|▍         | 47/1208 [01:45<43:20,  2.24s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0867, train/loss_vlb_step=0.000285, train/loss_step=0.0867, global_step=5145.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   4%|▍         | 47/1208 [01:45<43:20,  2.24s/it, loss=0.131, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00159, train/loss_step=0.326, global_step=5145.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:   4%|▍         | 48/1208 [01:48<43:42,  2.26s/it, loss=0.131, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00159, train/loss_step=0.326, global_step=5145.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   4%|▍         | 48/1208 [01:48<43:42,  2.26s/it, loss=0.143, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00114, train/loss_step=0.258, global_step=5145.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   4%|▍         | 49/1208 [01:49<43:11,  2.24s/it, loss=0.143, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00114, train/loss_step=0.258, global_step=5145.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   4%|▍         | 49/1208 [01:49<43:11,  2.24s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.52e-5, train/loss_step=0.00268, global_step=5146.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   4%|▍         | 50/1208 [01:50<42:41,  2.21s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.52e-5, train/loss_step=0.00268, global_step=5146.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   4%|▍         | 50/1208 [01:50<42:41,  2.21s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=8.86e-6, train/loss_step=0.00145, global_step=5146.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   4%|▍         | 51/1208 [01:51<42:12,  2.19s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=8.86e-6, train/loss_step=0.00145, global_step=5146.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   4%|▍         | 51/1208 [01:51<42:12,  2.19s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.43e-5, train/loss_step=0.0157, global_step=5146.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:   4%|▍         | 52/1208 [01:54<42:34,  2.21s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.43e-5, train/loss_step=0.0157, global_step=5146.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   4%|▍         | 52/1208 [01:54<42:34,  2.21s/it, loss=0.131, v_num=0, train/loss_simple_step=0.056, train/loss_vlb_step=0.000204, train/loss_step=0.056, global_step=5146.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:   4%|▍         | 53/1208 [01:55<42:06,  2.19s/it, loss=0.131, v_num=0, train/loss_simple_step=0.056, train/loss_vlb_step=0.000204, train/loss_step=0.056, global_step=5146.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   4%|▍         | 53/1208 [01:55<42:06,  2.19s/it, loss=0.137, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=5147.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   4%|▍         | 54/1208 [01:56<41:39,  2.17s/it, loss=0.137, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=5147.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   4%|▍         | 54/1208 [01:56<41:39,  2.17s/it, loss=0.147, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00106, train/loss_step=0.243, global_step=5147.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:   5%|▍         | 55/1208 [01:58<41:13,  2.15s/it, loss=0.147, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00106, train/loss_step=0.243, global_step=5147.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   5%|▍         | 55/1208 [01:58<41:13,  2.15s/it, loss=0.15, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000548, train/loss_step=0.160, global_step=5147.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   5%|▍         | 56/1208 [02:01<41:34,  2.17s/it, loss=0.15, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000548, train/loss_step=0.160, global_step=5147.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   5%|▍         | 56/1208 [02:01<41:34,  2.17s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00597, train/loss_vlb_step=3.07e-5, train/loss_step=0.00597, global_step=5147.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   5%|▍         | 57/1208 [02:02<41:10,  2.15s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00597, train/loss_vlb_step=3.07e-5, train/loss_step=0.00597, global_step=5147.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   5%|▍         | 57/1208 [02:02<41:10,  2.15s/it, loss=0.15, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00157, train/loss_step=0.304, global_step=5148.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]     Epoch 17:   5%|▍         | 58/1208 [02:03<40:45,  2.13s/it, loss=0.15, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00157, train/loss_step=0.304, global_step=5148.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   5%|▍         | 58/1208 [02:03<40:45,  2.13s/it, loss=0.171, v_num=0, train/loss_simple_step=0.523, train/loss_vlb_step=0.00756, train/loss_step=0.523, global_step=5148.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   5%|▍         | 59/1208 [02:04<40:22,  2.11s/it, loss=0.171, v_num=0, train/loss_simple_step=0.523, train/loss_vlb_step=0.00756, train/loss_step=0.523, global_step=5148.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   5%|▍         | 59/1208 [02:04<40:22,  2.11s/it, loss=0.164, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00266, train/loss_step=0.390, global_step=5148.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   5%|▍         | 60/1208 [02:07<40:43,  2.13s/it, loss=0.164, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00266, train/loss_step=0.390, global_step=5148.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   5%|▍         | 60/1208 [02:07<40:43,  2.13s/it, loss=0.17, v_num=0, train/loss_simple_step=0.468, train/loss_vlb_step=0.00415, train/loss_step=0.468, global_step=5148.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:   5%|▌         | 61/1208 [02:08<40:21,  2.11s/it, loss=0.17, v_num=0, train/loss_simple_step=0.468, train/loss_vlb_step=0.00415, train/loss_step=0.468, global_step=5148.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   5%|▌         | 61/1208 [02:08<40:21,  2.11s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0793, train/loss_vlb_step=0.000267, train/loss_step=0.0793, global_step=5149.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   5%|▌         | 62/1208 [02:09<39:59,  2.09s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0793, train/loss_vlb_step=0.000267, train/loss_step=0.0793, global_step=5149.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   5%|▌         | 62/1208 [02:09<39:59,  2.09s/it, loss=0.164, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000632, train/loss_step=0.182, global_step=5149.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:   5%|▌         | 63/1208 [02:10<39:38,  2.08s/it, loss=0.164, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000632, train/loss_step=0.182, global_step=5149.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   5%|▌         | 63/1208 [02:10<39:38,  2.08s/it, loss=0.168, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.00039, train/loss_step=0.116, global_step=5149.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:   5%|▌         | 64/1208 [02:14<39:57,  2.10s/it, loss=0.168, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.00039, train/loss_step=0.116, global_step=5149.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   5%|▌         | 64/1208 [02:14<39:57,  2.10s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.84e-5, train/loss_step=0.00324, global_step=5149.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   5%|▌         | 65/1208 [02:15<39:37,  2.08s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.84e-5, train/loss_step=0.00324, global_step=5149.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   5%|▌         | 65/1208 [02:15<39:37,  2.08s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=7.04e-5, train/loss_step=0.0158, global_step=5150.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:   5%|▌         | 66/1208 [02:16<39:17,  2.06s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=7.04e-5, train/loss_step=0.0158, global_step=5150.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   5%|▌         | 66/1208 [02:16<39:17,  2.06s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.65e-5, train/loss_step=0.0147, global_step=5150.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   6%|▌         | 67/1208 [02:17<38:57,  2.05s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.65e-5, train/loss_step=0.0147, global_step=5150.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   6%|▌         | 67/1208 [02:17<38:57,  2.05s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.67e-5, train/loss_step=0.00303, global_step=5150.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   6%|▌         | 68/1208 [02:20<39:15,  2.07s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.67e-5, train/loss_step=0.00303, global_step=5150.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   6%|▌         | 68/1208 [02:20<39:15,  2.07s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.9e-5, train/loss_step=0.0158, global_step=5150.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:   6%|▌         | 69/1208 [02:21<38:56,  2.05s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.9e-5, train/loss_step=0.0158, global_step=5150.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   6%|▌         | 69/1208 [02:21<38:56,  2.05s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=1.02e-5, train/loss_step=0.00171, global_step=5151.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   6%|▌         | 70/1208 [02:22<38:37,  2.04s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=1.02e-5, train/loss_step=0.00171, global_step=5151.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   6%|▌         | 70/1208 [02:22<38:37,  2.04s/it, loss=0.141, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000363, train/loss_step=0.110, global_step=5151.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:   6%|▌         | 71/1208 [02:23<38:19,  2.02s/it, loss=0.141, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000363, train/loss_step=0.110, global_step=5151.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   6%|▌         | 71/1208 [02:23<38:19,  2.02s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.00013, train/loss_step=0.0327, global_step=5151.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   6%|▌         | 72/1208 [02:26<38:37,  2.04s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.00013, train/loss_step=0.0327, global_step=5151.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   6%|▌         | 72/1208 [02:26<38:37,  2.04s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.26e-5, train/loss_step=0.00222, global_step=5151.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   6%|▌         | 73/1208 [02:27<38:20,  2.03s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.26e-5, train/loss_step=0.00222, global_step=5151.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   6%|▌         | 73/1208 [02:27<38:20,  2.03s/it, loss=0.151, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00164, train/loss_step=0.353, global_step=5152.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:   6%|▌         | 74/1208 [02:29<38:03,  2.01s/it, loss=0.151, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00164, train/loss_step=0.353, global_step=5152.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   6%|▌         | 74/1208 [02:29<38:03,  2.01s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.66e-5, train/loss_step=0.0227, global_step=5152.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   6%|▌         | 75/1208 [02:30<37:46,  2.00s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.66e-5, train/loss_step=0.0227, global_step=5152.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   6%|▌         | 75/1208 [02:30<37:46,  2.00s/it, loss=0.137, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000348, train/loss_step=0.106, global_step=5152.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   6%|▋         | 76/1208 [02:33<38:03,  2.02s/it, loss=0.137, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000348, train/loss_step=0.106, global_step=5152.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   6%|▋         | 76/1208 [02:33<38:03,  2.02s/it, loss=0.152, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00136, train/loss_step=0.296, global_step=5152.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:   6%|▋         | 77/1208 [02:34<37:47,  2.00s/it, loss=0.152, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00136, train/loss_step=0.296, global_step=5152.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   6%|▋         | 77/1208 [02:34<37:47,  2.00s/it, loss=0.145, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000542, train/loss_step=0.164, global_step=5153.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   6%|▋         | 78/1208 [02:35<37:31,  1.99s/it, loss=0.145, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000542, train/loss_step=0.164, global_step=5153.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   6%|▋         | 78/1208 [02:35<37:31,  1.99s/it, loss=0.149, v_num=0, train/loss_simple_step=0.607, train/loss_vlb_step=0.0179, train/loss_step=0.607, global_step=5153.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:   7%|▋         | 79/1208 [02:36<37:15,  1.98s/it, loss=0.149, v_num=0, train/loss_simple_step=0.607, train/loss_vlb_step=0.0179, train/loss_step=0.607, global_step=5153.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   7%|▋         | 79/1208 [02:36<37:15,  1.98s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.000294, train/loss_step=0.0894, global_step=5153.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   7%|▋         | 80/1208 [02:39<37:31,  2.00s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.000294, train/loss_step=0.0894, global_step=5153.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   7%|▋         | 80/1208 [02:39<37:31,  2.00s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00683, train/loss_vlb_step=3.38e-5, train/loss_step=0.00683, global_step=5153.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   7%|▋         | 81/1208 [02:40<37:16,  1.98s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00683, train/loss_vlb_step=3.38e-5, train/loss_step=0.00683, global_step=5153.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   7%|▋         | 81/1208 [02:40<37:16,  1.98s/it, loss=0.113, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000415, train/loss_step=0.126, global_step=5154.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:   7%|▋         | 82/1208 [02:41<37:01,  1.97s/it, loss=0.113, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000415, train/loss_step=0.126, global_step=5154.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   7%|▋         | 82/1208 [02:41<37:01,  1.97s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000106, train/loss_step=0.0266, global_step=5154.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   7%|▋         | 83/1208 [02:42<36:46,  1.96s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000106, train/loss_step=0.0266, global_step=5154.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   7%|▋         | 83/1208 [02:42<36:46,  1.96s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.01e-5, train/loss_step=0.0174, global_step=5154.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:   7%|▋         | 84/1208 [02:46<37:02,  1.98s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.01e-5, train/loss_step=0.0174, global_step=5154.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   7%|▋         | 84/1208 [02:46<37:02,  1.98s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.05e-5, train/loss_step=0.00175, global_step=5154.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   7%|▋         | 85/1208 [02:47<36:48,  1.97s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.05e-5, train/loss_step=0.00175, global_step=5154.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   7%|▋         | 85/1208 [02:47<36:48,  1.97s/it, loss=0.105, v_num=0, train/loss_simple_step=0.094, train/loss_vlb_step=0.000312, train/loss_step=0.094, global_step=5155.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:   7%|▋         | 86/1208 [02:48<36:34,  1.96s/it, loss=0.105, v_num=0, train/loss_simple_step=0.094, train/loss_vlb_step=0.000312, train/loss_step=0.094, global_step=5155.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   7%|▋         | 86/1208 [02:48<36:34,  1.96s/it, loss=0.114, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000871, train/loss_step=0.207, global_step=5155.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   7%|▋         | 87/1208 [02:49<36:20,  1.95s/it, loss=0.114, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000871, train/loss_step=0.207, global_step=5155.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   7%|▋         | 87/1208 [02:49<36:20,  1.95s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0577, train/loss_vlb_step=0.000197, train/loss_step=0.0577, global_step=5155.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   7%|▋         | 88/1208 [02:52<36:35,  1.96s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0577, train/loss_vlb_step=0.000197, train/loss_step=0.0577, global_step=5155.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   7%|▋         | 88/1208 [02:52<36:35,  1.96s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.3e-5, train/loss_step=0.0122, global_step=5155.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:   7%|▋         | 89/1208 [02:53<36:22,  1.95s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.3e-5, train/loss_step=0.0122, global_step=5155.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   7%|▋         | 89/1208 [02:53<36:22,  1.95s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.000169, train/loss_step=0.0468, global_step=5156.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   7%|▋         | 90/1208 [02:54<36:09,  1.94s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.000169, train/loss_step=0.0468, global_step=5156.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   7%|▋         | 90/1208 [02:54<36:09,  1.94s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.00011, train/loss_step=0.0296, global_step=5156.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:   8%|▊         | 91/1208 [02:55<35:56,  1.93s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.00011, train/loss_step=0.0296, global_step=5156.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   8%|▊         | 91/1208 [02:55<35:56,  1.93s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000146, train/loss_step=0.0409, global_step=5156.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   8%|▊         | 92/1208 [02:58<36:10,  1.94s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000146, train/loss_step=0.0409, global_step=5156.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   8%|▊         | 92/1208 [02:58<36:10,  1.94s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0915, train/loss_vlb_step=0.000302, train/loss_step=0.0915, global_step=5156.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:   8%|▊         | 93/1208 [02:59<35:57,  1.94s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0915, train/loss_vlb_step=0.000302, train/loss_step=0.0915, global_step=5156.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   8%|▊         | 93/1208 [02:59<35:57,  1.94s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=1.23e-5, train/loss_step=0.00214, global_step=5157.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   8%|▊         | 94/1208 [03:01<35:45,  1.93s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=1.23e-5, train/loss_step=0.00214, global_step=5157.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   8%|▊         | 94/1208 [03:01<35:45,  1.93s/it, loss=0.112, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000721, train/loss_step=0.209, global_step=5157.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:   8%|▊         | 95/1208 [03:02<35:32,  1.92s/it, loss=0.112, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000721, train/loss_step=0.209, global_step=5157.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   8%|▊         | 95/1208 [03:02<35:32,  1.92s/it, loss=0.113, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000466, train/loss_step=0.139, global_step=5157.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   8%|▊         | 96/1208 [03:05<35:46,  1.93s/it, loss=0.113, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000466, train/loss_step=0.139, global_step=5157.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   8%|▊         | 96/1208 [03:05<35:46,  1.93s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.00705, train/loss_vlb_step=3.47e-5, train/loss_step=0.00705, global_step=5157.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   8%|▊         | 97/1208 [03:06<35:34,  1.92s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.00705, train/loss_vlb_step=3.47e-5, train/loss_step=0.00705, global_step=5157.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   8%|▊         | 97/1208 [03:06<35:34,  1.92s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.00163, train/loss_vlb_step=9.84e-6, train/loss_step=0.00163, global_step=5158.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   8%|▊         | 98/1208 [03:07<35:22,  1.91s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.00163, train/loss_vlb_step=9.84e-6, train/loss_step=0.00163, global_step=5158.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   8%|▊         | 98/1208 [03:07<35:22,  1.91s/it, loss=0.0756, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00148, train/loss_step=0.306, global_step=5158.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:   8%|▊         | 99/1208 [03:08<35:10,  1.90s/it, loss=0.0756, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00148, train/loss_step=0.306, global_step=5158.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   8%|▊         | 99/1208 [03:08<35:10,  1.90s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00285, train/loss_step=0.390, global_step=5158.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   8%|▊         | 100/1208 [03:11<35:23,  1.92s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00285, train/loss_step=0.390, global_step=5158.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   8%|▊         | 100/1208 [03:11<35:23,  1.92s/it, loss=0.1, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.00076, train/loss_step=0.197, global_step=5158.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:   8%|▊         | 101/1208 [03:12<35:12,  1.91s/it, loss=0.1, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.00076, train/loss_step=0.197, global_step=5158.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   8%|▊         | 101/1208 [03:12<35:12,  1.91s/it, loss=0.094, v_num=0, train/loss_simple_step=0.00408, train/loss_vlb_step=2.26e-5, train/loss_step=0.00408, global_step=5159.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   8%|▊         | 102/1208 [03:13<35:01,  1.90s/it, loss=0.094, v_num=0, train/loss_simple_step=0.00408, train/loss_vlb_step=2.26e-5, train/loss_step=0.00408, global_step=5159.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   8%|▊         | 102/1208 [03:13<35:01,  1.90s/it, loss=0.102, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000674, train/loss_step=0.189, global_step=5159.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:   9%|▊         | 103/1208 [03:14<34:50,  1.89s/it, loss=0.102, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000674, train/loss_step=0.189, global_step=5159.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   9%|▊         | 103/1208 [03:14<34:50,  1.89s/it, loss=0.12, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00282, train/loss_step=0.376, global_step=5159.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:   9%|▊         | 104/1208 [03:18<35:03,  1.90s/it, loss=0.12, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00282, train/loss_step=0.376, global_step=5159.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   9%|▊         | 104/1208 [03:18<35:03,  1.90s/it, loss=0.129, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000641, train/loss_step=0.183, global_step=5159.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   9%|▊         | 105/1208 [03:19<34:52,  1.90s/it, loss=0.129, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000641, train/loss_step=0.183, global_step=5159.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   9%|▊         | 105/1208 [03:19<34:52,  1.90s/it, loss=0.134, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000681, train/loss_step=0.194, global_step=5160.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   9%|▉         | 106/1208 [03:20<34:41,  1.89s/it, loss=0.134, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000681, train/loss_step=0.194, global_step=5160.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   9%|▉         | 106/1208 [03:20<34:41,  1.89s/it, loss=0.14, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00166, train/loss_step=0.330, global_step=5160.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:   9%|▉         | 107/1208 [03:21<34:30,  1.88s/it, loss=0.14, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00166, train/loss_step=0.330, global_step=5160.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   9%|▉         | 107/1208 [03:21<34:30,  1.88s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00633, train/loss_vlb_step=3.14e-5, train/loss_step=0.00633, global_step=5160.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   9%|▉         | 108/1208 [03:24<34:43,  1.89s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00633, train/loss_vlb_step=3.14e-5, train/loss_step=0.00633, global_step=5160.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   9%|▉         | 108/1208 [03:24<34:43,  1.89s/it, loss=0.149, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00107, train/loss_step=0.239, global_step=5160.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:   9%|▉         | 109/1208 [03:25<34:33,  1.89s/it, loss=0.149, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00107, train/loss_step=0.239, global_step=5160.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   9%|▉         | 109/1208 [03:25<34:33,  1.89s/it, loss=0.161, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00172, train/loss_step=0.294, global_step=5161.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   9%|▉         | 110/1208 [03:26<34:22,  1.88s/it, loss=0.161, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00172, train/loss_step=0.294, global_step=5161.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   9%|▉         | 110/1208 [03:26<34:22,  1.88s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0617, train/loss_vlb_step=0.000207, train/loss_step=0.0617, global_step=5161.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   9%|▉         | 111/1208 [03:27<34:12,  1.87s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0617, train/loss_vlb_step=0.000207, train/loss_step=0.0617, global_step=5161.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   9%|▉         | 111/1208 [03:27<34:12,  1.87s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0937, train/loss_vlb_step=0.000312, train/loss_step=0.0937, global_step=5161.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   9%|▉         | 112/1208 [03:30<34:24,  1.88s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0937, train/loss_vlb_step=0.000312, train/loss_step=0.0937, global_step=5161.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   9%|▉         | 112/1208 [03:30<34:24,  1.88s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=9.08e-6, train/loss_step=0.0015, global_step=5161.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:   9%|▉         | 113/1208 [03:32<34:14,  1.88s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=9.08e-6, train/loss_step=0.0015, global_step=5161.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   9%|▉         | 113/1208 [03:32<34:14,  1.88s/it, loss=0.183, v_num=0, train/loss_simple_step=0.437, train/loss_vlb_step=0.00222, train/loss_step=0.437, global_step=5162.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:   9%|▉         | 114/1208 [03:33<34:04,  1.87s/it, loss=0.183, v_num=0, train/loss_simple_step=0.437, train/loss_vlb_step=0.00222, train/loss_step=0.437, global_step=5162.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:   9%|▉         | 114/1208 [03:33<34:04,  1.87s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000101, train/loss_step=0.0253, global_step=5162.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  10%|▉         | 115/1208 [03:34<33:54,  1.86s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000101, train/loss_step=0.0253, global_step=5162.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  10%|▉         | 115/1208 [03:34<33:54,  1.86s/it, loss=0.185, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00205, train/loss_step=0.371, global_step=5162.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  10%|▉         | 116/1208 [03:37<34:06,  1.87s/it, loss=0.185, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00205, train/loss_step=0.371, global_step=5162.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  10%|▉         | 116/1208 [03:37<34:06,  1.87s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=2.02e-5, train/loss_step=0.00361, global_step=5162.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  10%|▉         | 117/1208 [03:38<33:56,  1.87s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=2.02e-5, train/loss_step=0.00361, global_step=5162.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  10%|▉         | 117/1208 [03:38<33:56,  1.87s/it, loss=0.209, v_num=0, train/loss_simple_step=0.489, train/loss_vlb_step=0.0087, train/loss_step=0.489, global_step=5163.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]     Epoch 17:  10%|▉         | 118/1208 [03:39<33:47,  1.86s/it, loss=0.209, v_num=0, train/loss_simple_step=0.489, train/loss_vlb_step=0.0087, train/loss_step=0.489, global_step=5163.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  10%|▉         | 118/1208 [03:39<33:47,  1.86s/it, loss=0.209, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00156, train/loss_step=0.290, global_step=5163.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  10%|▉         | 119/1208 [03:40<33:37,  1.85s/it, loss=0.209, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00156, train/loss_step=0.290, global_step=5163.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  10%|▉         | 119/1208 [03:40<33:37,  1.85s/it, loss=0.205, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00148, train/loss_step=0.315, global_step=5163.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  10%|▉         | 120/1208 [03:43<33:48,  1.86s/it, loss=0.205, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00148, train/loss_step=0.315, global_step=5163.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  10%|▉         | 120/1208 [03:43<33:48,  1.86s/it, loss=0.202, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000429, train/loss_step=0.131, global_step=5163.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  10%|█         | 121/1208 [03:44<33:39,  1.86s/it, loss=0.202, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000429, train/loss_step=0.131, global_step=5163.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  10%|█         | 121/1208 [03:44<33:39,  1.86s/it, loss=0.202, v_num=0, train/loss_simple_step=0.00575, train/loss_vlb_step=2.95e-5, train/loss_step=0.00575, global_step=5164.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  10%|█         | 122/1208 [03:45<33:30,  1.85s/it, loss=0.202, v_num=0, train/loss_simple_step=0.00575, train/loss_vlb_step=2.95e-5, train/loss_step=0.00575, global_step=5164.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  10%|█         | 122/1208 [03:45<33:30,  1.85s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00883, train/loss_vlb_step=4.34e-5, train/loss_step=0.00883, global_step=5164.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  10%|█         | 123/1208 [03:46<33:21,  1.84s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00883, train/loss_vlb_step=4.34e-5, train/loss_step=0.00883, global_step=5164.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  10%|█         | 123/1208 [03:46<33:21,  1.84s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.8e-5, train/loss_step=0.0172, global_step=5164.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  10%|█         | 124/1208 [03:50<33:32,  1.86s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.8e-5, train/loss_step=0.0172, global_step=5164.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  10%|█         | 124/1208 [03:50<33:32,  1.86s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0916, train/loss_vlb_step=0.000304, train/loss_step=0.0916, global_step=5164.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  10%|█         | 125/1208 [03:51<33:23,  1.85s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0916, train/loss_vlb_step=0.000304, train/loss_step=0.0916, global_step=5164.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  10%|█         | 125/1208 [03:51<33:23,  1.85s/it, loss=0.164, v_num=0, train/loss_simple_step=0.073, train/loss_vlb_step=0.000244, train/loss_step=0.073, global_step=5165.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  10%|█         | 126/1208 [03:52<33:14,  1.84s/it, loss=0.164, v_num=0, train/loss_simple_step=0.073, train/loss_vlb_step=0.000244, train/loss_step=0.073, global_step=5165.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  10%|█         | 126/1208 [03:52<33:14,  1.84s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00774, train/loss_vlb_step=3.89e-5, train/loss_step=0.00774, global_step=5165.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  11%|█         | 127/1208 [03:53<33:05,  1.84s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00774, train/loss_vlb_step=3.89e-5, train/loss_step=0.00774, global_step=5165.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  11%|█         | 127/1208 [03:53<33:05,  1.84s/it, loss=0.153, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=5165.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  11%|█         | 128/1208 [03:56<33:15,  1.85s/it, loss=0.153, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=5165.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  11%|█         | 128/1208 [03:56<33:16,  1.85s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0793, train/loss_vlb_step=0.000276, train/loss_step=0.0793, global_step=5165.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  11%|█         | 129/1208 [03:57<33:07,  1.84s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0793, train/loss_vlb_step=0.000276, train/loss_step=0.0793, global_step=5165.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  11%|█         | 129/1208 [03:57<33:07,  1.84s/it, loss=0.138, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000529, train/loss_step=0.152, global_step=5166.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  11%|█         | 130/1208 [03:58<32:59,  1.84s/it, loss=0.138, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000529, train/loss_step=0.152, global_step=5166.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  11%|█         | 130/1208 [03:58<32:59,  1.84s/it, loss=0.143, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000535, train/loss_step=0.157, global_step=5166.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  11%|█         | 131/1208 [03:59<32:50,  1.83s/it, loss=0.143, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000535, train/loss_step=0.157, global_step=5166.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  11%|█         | 131/1208 [03:59<32:50,  1.83s/it, loss=0.159, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00263, train/loss_step=0.415, global_step=5166.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  11%|█         | 132/1208 [04:02<33:00,  1.84s/it, loss=0.159, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00263, train/loss_step=0.415, global_step=5166.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  11%|█         | 132/1208 [04:02<33:00,  1.84s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.51e-5, train/loss_step=0.00272, global_step=5166.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  11%|█         | 133/1208 [04:04<32:52,  1.83s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.51e-5, train/loss_step=0.00272, global_step=5166.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  11%|█         | 133/1208 [04:04<32:52,  1.83s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.49e-5, train/loss_step=0.0214, global_step=5167.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  11%|█         | 134/1208 [04:05<32:44,  1.83s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.49e-5, train/loss_step=0.0214, global_step=5167.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  11%|█         | 134/1208 [04:05<32:44,  1.83s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0756, train/loss_vlb_step=0.000253, train/loss_step=0.0756, global_step=5167.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  11%|█         | 135/1208 [04:06<32:35,  1.82s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0756, train/loss_vlb_step=0.000253, train/loss_step=0.0756, global_step=5167.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  11%|█         | 135/1208 [04:06<32:35,  1.82s/it, loss=0.123, v_num=0, train/loss_simple_step=0.028, train/loss_vlb_step=0.000108, train/loss_step=0.028, global_step=5167.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  11%|█▏        | 136/1208 [04:09<32:45,  1.83s/it, loss=0.123, v_num=0, train/loss_simple_step=0.028, train/loss_vlb_step=0.000108, train/loss_step=0.028, global_step=5167.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  11%|█▏        | 136/1208 [04:09<32:45,  1.83s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.48e-5, train/loss_step=0.00247, global_step=5167.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  11%|█▏        | 137/1208 [04:10<32:37,  1.83s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.48e-5, train/loss_step=0.00247, global_step=5167.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  11%|█▏        | 137/1208 [04:10<32:37,  1.83s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.95e-5, train/loss_step=0.0102, global_step=5168.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  11%|█▏        | 138/1208 [04:11<32:29,  1.82s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.95e-5, train/loss_step=0.0102, global_step=5168.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  11%|█▏        | 138/1208 [04:11<32:29,  1.82s/it, loss=0.0869, v_num=0, train/loss_simple_step=0.0422, train/loss_vlb_step=0.000153, train/loss_step=0.0422, global_step=5168.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  12%|█▏        | 139/1208 [04:12<32:21,  1.82s/it, loss=0.0869, v_num=0, train/loss_simple_step=0.0422, train/loss_vlb_step=0.000153, train/loss_step=0.0422, global_step=5168.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  12%|█▏        | 139/1208 [04:12<32:21,  1.82s/it, loss=0.076, v_num=0, train/loss_simple_step=0.0992, train/loss_vlb_step=0.000329, train/loss_step=0.0992, global_step=5168.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  12%|█▏        | 140/1208 [04:15<32:31,  1.83s/it, loss=0.076, v_num=0, train/loss_simple_step=0.0992, train/loss_vlb_step=0.000329, train/loss_step=0.0992, global_step=5168.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  12%|█▏        | 140/1208 [04:15<32:31,  1.83s/it, loss=0.0696, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.4e-5, train/loss_step=0.00248, global_step=5168.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  12%|█▏        | 141/1208 [04:16<32:23,  1.82s/it, loss=0.0696, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.4e-5, train/loss_step=0.00248, global_step=5168.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  12%|█▏        | 141/1208 [04:16<32:23,  1.82s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.521, train/loss_vlb_step=0.00639, train/loss_step=0.521, global_step=5169.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  12%|█▏        | 142/1208 [04:17<32:15,  1.82s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.521, train/loss_vlb_step=0.00639, train/loss_step=0.521, global_step=5169.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  12%|█▏        | 142/1208 [04:17<32:15,  1.82s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000108, train/loss_step=0.0279, global_step=5169.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  12%|█▏        | 143/1208 [04:18<32:08,  1.81s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000108, train/loss_step=0.0279, global_step=5169.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  12%|█▏        | 143/1208 [04:18<32:08,  1.81s/it, loss=0.101, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000389, train/loss_step=0.117, global_step=5169.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  12%|█▏        | 144/1208 [04:22<32:16,  1.82s/it, loss=0.101, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000389, train/loss_step=0.117, global_step=5169.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  12%|█▏        | 144/1208 [04:22<32:16,  1.82s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.4e-5, train/loss_step=0.00247, global_step=5169.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  12%|█▏        | 145/1208 [04:23<32:08,  1.81s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.4e-5, train/loss_step=0.00247, global_step=5169.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  12%|█▏        | 145/1208 [04:23<32:09,  1.81s/it, loss=0.099, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=5170.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  12%|█▏        | 146/1208 [04:24<32:01,  1.81s/it, loss=0.099, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=5170.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  12%|█▏        | 146/1208 [04:24<32:01,  1.81s/it, loss=0.106, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000539, train/loss_step=0.155, global_step=5170.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  12%|█▏        | 147/1208 [04:25<31:54,  1.80s/it, loss=0.106, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000539, train/loss_step=0.155, global_step=5170.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  12%|█▏        | 147/1208 [04:25<31:54,  1.80s/it, loss=0.127, v_num=0, train/loss_simple_step=0.518, train/loss_vlb_step=0.0112, train/loss_step=0.518, global_step=5170.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  12%|█▏        | 148/1208 [04:28<32:02,  1.81s/it, loss=0.127, v_num=0, train/loss_simple_step=0.518, train/loss_vlb_step=0.0112, train/loss_step=0.518, global_step=5170.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  12%|█▏        | 148/1208 [04:28<32:02,  1.81s/it, loss=0.13, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000425, train/loss_step=0.126, global_step=5170.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  12%|█▏        | 149/1208 [04:29<31:55,  1.81s/it, loss=0.13, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000425, train/loss_step=0.126, global_step=5170.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  12%|█▏        | 149/1208 [04:29<31:55,  1.81s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0612, train/loss_vlb_step=0.000208, train/loss_step=0.0612, global_step=5171.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  12%|█▏        | 150/1208 [04:30<31:48,  1.80s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0612, train/loss_vlb_step=0.000208, train/loss_step=0.0612, global_step=5171.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  12%|█▏        | 150/1208 [04:30<31:48,  1.80s/it, loss=0.123, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=5171.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  12%|█▎        | 151/1208 [04:31<31:41,  1.80s/it, loss=0.123, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=5171.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  12%|█▎        | 151/1208 [04:31<31:41,  1.80s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00884, train/loss_vlb_step=4.3e-5, train/loss_step=0.00884, global_step=5171.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  13%|█▎        | 152/1208 [04:34<31:49,  1.81s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00884, train/loss_vlb_step=4.3e-5, train/loss_step=0.00884, global_step=5171.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  13%|█▎        | 152/1208 [04:34<31:49,  1.81s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0913, train/loss_vlb_step=0.0003, train/loss_step=0.0913, global_step=5171.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  13%|█▎        | 153/1208 [04:35<31:42,  1.80s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0913, train/loss_vlb_step=0.0003, train/loss_step=0.0913, global_step=5171.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  13%|█▎        | 153/1208 [04:35<31:42,  1.80s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0718, train/loss_vlb_step=0.000243, train/loss_step=0.0718, global_step=5172.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  13%|█▎        | 154/1208 [04:36<31:35,  1.80s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0718, train/loss_vlb_step=0.000243, train/loss_step=0.0718, global_step=5172.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  13%|█▎        | 154/1208 [04:36<31:35,  1.80s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0661, train/loss_vlb_step=0.000228, train/loss_step=0.0661, global_step=5172.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  13%|█▎        | 155/1208 [04:37<31:28,  1.79s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0661, train/loss_vlb_step=0.000228, train/loss_step=0.0661, global_step=5172.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  13%|█▎        | 155/1208 [04:37<31:28,  1.79s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000134, train/loss_step=0.0364, global_step=5172.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  13%|█▎        | 156/1208 [04:41<31:36,  1.80s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000134, train/loss_step=0.0364, global_step=5172.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  13%|█▎        | 156/1208 [04:41<31:36,  1.80s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.31e-5, train/loss_step=0.00219, global_step=5172.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  13%|█▎        | 157/1208 [04:42<31:29,  1.80s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.31e-5, train/loss_step=0.00219, global_step=5172.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  13%|█▎        | 157/1208 [04:42<31:29,  1.80s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00582, train/loss_vlb_step=2.95e-5, train/loss_step=0.00582, global_step=5173.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  13%|█▎        | 158/1208 [04:43<31:22,  1.79s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00582, train/loss_vlb_step=2.95e-5, train/loss_step=0.00582, global_step=5173.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  13%|█▎        | 158/1208 [04:43<31:22,  1.79s/it, loss=0.119, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000965, train/loss_step=0.239, global_step=5173.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  13%|█▎        | 159/1208 [04:44<31:15,  1.79s/it, loss=0.119, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000965, train/loss_step=0.239, global_step=5173.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  13%|█▎        | 159/1208 [04:44<31:16,  1.79s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0792, train/loss_vlb_step=0.000271, train/loss_step=0.0792, global_step=5173.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  13%|█▎        | 160/1208 [04:47<31:23,  1.80s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0792, train/loss_vlb_step=0.000271, train/loss_step=0.0792, global_step=5173.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  13%|█▎        | 160/1208 [04:47<31:23,  1.80s/it, loss=0.126, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000562, train/loss_step=0.167, global_step=5173.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  13%|█▎        | 161/1208 [04:48<31:16,  1.79s/it, loss=0.126, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000562, train/loss_step=0.167, global_step=5173.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  13%|█▎        | 161/1208 [04:48<31:16,  1.79s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0811, train/loss_vlb_step=0.000272, train/loss_step=0.0811, global_step=5174.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  13%|█▎        | 162/1208 [04:49<31:10,  1.79s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0811, train/loss_vlb_step=0.000272, train/loss_step=0.0811, global_step=5174.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  13%|█▎        | 162/1208 [04:49<31:10,  1.79s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0375, train/loss_vlb_step=0.000138, train/loss_step=0.0375, global_step=5174.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  13%|█▎        | 163/1208 [04:50<31:03,  1.78s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0375, train/loss_vlb_step=0.000138, train/loss_step=0.0375, global_step=5174.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  13%|█▎        | 163/1208 [04:50<31:03,  1.78s/it, loss=0.104, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=5174.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  14%|█▎        | 164/1208 [04:53<31:11,  1.79s/it, loss=0.104, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=5174.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  14%|█▎        | 164/1208 [04:53<31:11,  1.79s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.000208, train/loss_step=0.0598, global_step=5174.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  14%|█▎        | 165/1208 [04:55<31:04,  1.79s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.000208, train/loss_step=0.0598, global_step=5174.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  14%|█▎        | 165/1208 [04:55<31:04,  1.79s/it, loss=0.102, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.61e-5, train/loss_step=0.012, global_step=5175.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  14%|█▎        | 166/1208 [04:56<30:58,  1.78s/it, loss=0.102, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.61e-5, train/loss_step=0.012, global_step=5175.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  14%|█▎        | 166/1208 [04:56<30:58,  1.78s/it, loss=0.104, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000672, train/loss_step=0.192, global_step=5175.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  14%|█▍        | 167/1208 [04:57<30:52,  1.78s/it, loss=0.104, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000672, train/loss_step=0.192, global_step=5175.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  14%|█▍        | 167/1208 [04:57<30:52,  1.78s/it, loss=0.0841, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000398, train/loss_step=0.121, global_step=5175.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  14%|█▍        | 168/1208 [05:00<30:59,  1.79s/it, loss=0.0841, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000398, train/loss_step=0.121, global_step=5175.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  14%|█▍        | 168/1208 [05:00<30:59,  1.79s/it, loss=0.0786, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.8e-5, train/loss_step=0.016, global_step=5175.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  14%|█▍        | 169/1208 [05:01<30:52,  1.78s/it, loss=0.0786, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.8e-5, train/loss_step=0.016, global_step=5175.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  14%|█▍        | 169/1208 [05:01<30:52,  1.78s/it, loss=0.0765, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=8e-5, train/loss_step=0.019, global_step=5176.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  14%|█▍        | 170/1208 [05:02<30:46,  1.78s/it, loss=0.0765, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=8e-5, train/loss_step=0.019, global_step=5176.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  14%|█▍        | 170/1208 [05:02<30:46,  1.78s/it, loss=0.0904, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00256, train/loss_step=0.389, global_step=5176.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  14%|█▍        | 171/1208 [05:03<30:40,  1.77s/it, loss=0.0904, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00256, train/loss_step=0.389, global_step=5176.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  14%|█▍        | 171/1208 [05:03<30:40,  1.77s/it, loss=0.111, v_num=0, train/loss_simple_step=0.429, train/loss_vlb_step=0.00405, train/loss_step=0.429, global_step=5176.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  14%|█▍        | 172/1208 [05:06<30:47,  1.78s/it, loss=0.111, v_num=0, train/loss_simple_step=0.429, train/loss_vlb_step=0.00405, train/loss_step=0.429, global_step=5176.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  14%|█▍        | 172/1208 [05:06<30:47,  1.78s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=3.68e-5, train/loss_step=0.00742, global_step=5176.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  14%|█▍        | 173/1208 [05:07<30:40,  1.78s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=3.68e-5, train/loss_step=0.00742, global_step=5176.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  14%|█▍        | 173/1208 [05:07<30:40,  1.78s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00671, train/loss_vlb_step=3.42e-5, train/loss_step=0.00671, global_step=5177.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  14%|█▍        | 174/1208 [05:08<30:34,  1.77s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00671, train/loss_vlb_step=3.42e-5, train/loss_step=0.00671, global_step=5177.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  14%|█▍        | 174/1208 [05:08<30:34,  1.77s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.82e-5, train/loss_step=0.0106, global_step=5177.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  14%|█▍        | 175/1208 [05:09<30:28,  1.77s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.82e-5, train/loss_step=0.0106, global_step=5177.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  14%|█▍        | 175/1208 [05:09<30:28,  1.77s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0808, train/loss_vlb_step=0.000267, train/loss_step=0.0808, global_step=5177.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  15%|█▍        | 176/1208 [05:13<30:35,  1.78s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0808, train/loss_vlb_step=0.000267, train/loss_step=0.0808, global_step=5177.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  15%|█▍        | 176/1208 [05:13<30:35,  1.78s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0384, train/loss_vlb_step=0.00014, train/loss_step=0.0384, global_step=5177.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  15%|█▍        | 177/1208 [05:14<30:29,  1.77s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0384, train/loss_vlb_step=0.00014, train/loss_step=0.0384, global_step=5177.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  15%|█▍        | 177/1208 [05:14<30:29,  1.77s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0355, train/loss_vlb_step=0.000138, train/loss_step=0.0355, global_step=5178.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  15%|█▍        | 178/1208 [05:15<30:23,  1.77s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0355, train/loss_vlb_step=0.000138, train/loss_step=0.0355, global_step=5178.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  15%|█▍        | 178/1208 [05:15<30:23,  1.77s/it, loss=0.0952, v_num=0, train/loss_simple_step=0.00855, train/loss_vlb_step=4.27e-5, train/loss_step=0.00855, global_step=5178.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  15%|█▍        | 179/1208 [05:16<30:17,  1.77s/it, loss=0.0952, v_num=0, train/loss_simple_step=0.00855, train/loss_vlb_step=4.27e-5, train/loss_step=0.00855, global_step=5178.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  15%|█▍        | 179/1208 [05:16<30:17,  1.77s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=1.32e-5, train/loss_step=0.00232, global_step=5178.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  15%|█▍        | 180/1208 [05:19<30:24,  1.77s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=1.32e-5, train/loss_step=0.00232, global_step=5178.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  15%|█▍        | 180/1208 [05:19<30:24,  1.77s/it, loss=0.101, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00228, train/loss_step=0.367, global_step=5178.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]     Epoch 17:  15%|█▍        | 181/1208 [05:20<30:18,  1.77s/it, loss=0.101, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00228, train/loss_step=0.367, global_step=5178.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  15%|█▍        | 181/1208 [05:20<30:18,  1.77s/it, loss=0.108, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000719, train/loss_step=0.205, global_step=5179.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  15%|█▌        | 182/1208 [05:21<30:12,  1.77s/it, loss=0.108, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000719, train/loss_step=0.205, global_step=5179.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  15%|█▌        | 182/1208 [05:21<30:12,  1.77s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0921, train/loss_vlb_step=0.000304, train/loss_step=0.0921, global_step=5179.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  15%|█▌        | 183/1208 [05:22<30:06,  1.76s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0921, train/loss_vlb_step=0.000304, train/loss_step=0.0921, global_step=5179.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  15%|█▌        | 183/1208 [05:22<30:06,  1.76s/it, loss=0.106, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=8.85e-5, train/loss_step=0.022, global_step=5179.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  15%|█▌        | 184/1208 [05:25<30:13,  1.77s/it, loss=0.106, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=8.85e-5, train/loss_step=0.022, global_step=5179.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  15%|█▌        | 184/1208 [05:25<30:13,  1.77s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0759, train/loss_vlb_step=0.000257, train/loss_step=0.0759, global_step=5179.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  15%|█▌        | 185/1208 [05:26<30:07,  1.77s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0759, train/loss_vlb_step=0.000257, train/loss_step=0.0759, global_step=5179.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  15%|█▌        | 185/1208 [05:26<30:07,  1.77s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000126, train/loss_step=0.0336, global_step=5180.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  15%|█▌        | 186/1208 [05:27<30:01,  1.76s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000126, train/loss_step=0.0336, global_step=5180.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  15%|█▌        | 186/1208 [05:27<30:01,  1.76s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.000111, train/loss_step=0.0275, global_step=5180.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  15%|█▌        | 187/1208 [05:28<29:56,  1.76s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.000111, train/loss_step=0.0275, global_step=5180.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  15%|█▌        | 187/1208 [05:28<29:56,  1.76s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000414, train/loss_step=0.125, global_step=5180.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  16%|█▌        | 188/1208 [05:32<30:02,  1.77s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000414, train/loss_step=0.125, global_step=5180.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  16%|█▌        | 188/1208 [05:32<30:02,  1.77s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.00831, train/loss_vlb_step=4.02e-5, train/loss_step=0.00831, global_step=5180.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  16%|█▌        | 189/1208 [05:33<29:56,  1.76s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.00831, train/loss_vlb_step=4.02e-5, train/loss_step=0.00831, global_step=5180.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  16%|█▌        | 189/1208 [05:33<29:56,  1.76s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.00613, train/loss_vlb_step=3.07e-5, train/loss_step=0.00613, global_step=5181.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  16%|█▌        | 190/1208 [05:34<29:51,  1.76s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.00613, train/loss_vlb_step=3.07e-5, train/loss_step=0.00613, global_step=5181.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  16%|█▌        | 190/1208 [05:34<29:51,  1.76s/it, loss=0.107, v_num=0, train/loss_simple_step=0.568, train/loss_vlb_step=0.00753, train/loss_step=0.568, global_step=5181.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]     Epoch 17:  16%|█▌        | 191/1208 [05:35<29:45,  1.76s/it, loss=0.107, v_num=0, train/loss_simple_step=0.568, train/loss_vlb_step=0.00753, train/loss_step=0.568, global_step=5181.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  16%|█▌        | 191/1208 [05:35<29:45,  1.76s/it, loss=0.1, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.0015, train/loss_step=0.286, global_step=5181.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  16%|█▌        | 192/1208 [05:38<29:51,  1.76s/it, loss=0.1, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.0015, train/loss_step=0.286, global_step=5181.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  16%|█▌        | 192/1208 [05:38<29:51,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.00091, train/loss_step=0.238, global_step=5181.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  16%|█▌        | 193/1208 [05:39<29:46,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.00091, train/loss_step=0.238, global_step=5181.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  16%|█▌        | 193/1208 [05:39<29:46,  1.76s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0985, train/loss_vlb_step=0.000324, train/loss_step=0.0985, global_step=5182.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  16%|█▌        | 194/1208 [05:40<29:40,  1.76s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0985, train/loss_vlb_step=0.000324, train/loss_step=0.0985, global_step=5182.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  16%|█▌        | 194/1208 [05:40<29:40,  1.76s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0759, train/loss_vlb_step=0.000256, train/loss_step=0.0759, global_step=5182.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  16%|█▌        | 195/1208 [05:41<29:35,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0759, train/loss_vlb_step=0.000256, train/loss_step=0.0759, global_step=5182.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  16%|█▌        | 195/1208 [05:41<29:35,  1.75s/it, loss=0.134, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00294, train/loss_step=0.374, global_step=5182.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  16%|█▌        | 196/1208 [05:44<29:41,  1.76s/it, loss=0.134, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00294, train/loss_step=0.374, global_step=5182.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  16%|█▌        | 196/1208 [05:44<29:41,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.000162, train/loss_step=0.045, global_step=5182.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  16%|█▋        | 197/1208 [05:45<29:35,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.000162, train/loss_step=0.045, global_step=5182.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  16%|█▋        | 197/1208 [05:46<29:35,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0653, train/loss_vlb_step=0.000222, train/loss_step=0.0653, global_step=5183.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  16%|█▋        | 198/1208 [05:47<29:30,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0653, train/loss_vlb_step=0.000222, train/loss_step=0.0653, global_step=5183.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  16%|█▋        | 198/1208 [05:47<29:30,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000459, train/loss_step=0.137, global_step=5183.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  16%|█▋        | 199/1208 [05:48<29:24,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000459, train/loss_step=0.137, global_step=5183.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  16%|█▋        | 199/1208 [05:48<29:24,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.54e-5, train/loss_step=0.00274, global_step=5183.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  17%|█▋        | 200/1208 [05:51<29:30,  1.76s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.54e-5, train/loss_step=0.00274, global_step=5183.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  17%|█▋        | 200/1208 [05:51<29:30,  1.76s/it, loss=0.14, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00165, train/loss_step=0.311, global_step=5183.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]     Epoch 17:  17%|█▋        | 201/1208 [05:52<29:25,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00165, train/loss_step=0.311, global_step=5183.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  17%|█▋        | 201/1208 [05:52<29:25,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000649, train/loss_step=0.189, global_step=5184.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  17%|█▋        | 202/1208 [05:53<29:20,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000649, train/loss_step=0.189, global_step=5184.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  17%|█▋        | 202/1208 [05:53<29:20,  1.75s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=9.22e-6, train/loss_step=0.00151, global_step=5184.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  17%|█▋        | 203/1208 [05:54<29:14,  1.75s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=9.22e-6, train/loss_step=0.00151, global_step=5184.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  17%|█▋        | 203/1208 [05:54<29:14,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.00066, train/loss_step=0.186, global_step=5184.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  17%|█▋        | 204/1208 [05:57<29:20,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.00066, train/loss_step=0.186, global_step=5184.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  17%|█▋        | 204/1208 [05:57<29:20,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00748, train/loss_vlb_step=3.56e-5, train/loss_step=0.00748, global_step=5184.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  17%|█▋        | 205/1208 [05:58<29:15,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00748, train/loss_vlb_step=3.56e-5, train/loss_step=0.00748, global_step=5184.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  17%|█▋        | 205/1208 [05:58<29:15,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=0.000102, train/loss_step=0.0257, global_step=5185.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  17%|█▋        | 206/1208 [05:59<29:10,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=0.000102, train/loss_step=0.0257, global_step=5185.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  17%|█▋        | 206/1208 [05:59<29:10,  1.75s/it, loss=0.163, v_num=0, train/loss_simple_step=0.506, train/loss_vlb_step=0.00415, train/loss_step=0.506, global_step=5185.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  17%|█▋        | 207/1208 [06:00<29:04,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.506, train/loss_vlb_step=0.00415, train/loss_step=0.506, global_step=5185.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  17%|█▋        | 207/1208 [06:00<29:04,  1.74s/it, loss=0.176, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00233, train/loss_step=0.385, global_step=5185.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  17%|█▋        | 208/1208 [06:04<29:10,  1.75s/it, loss=0.176, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00233, train/loss_step=0.385, global_step=5185.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  17%|█▋        | 208/1208 [06:04<29:10,  1.75s/it, loss=0.191, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00132, train/loss_step=0.304, global_step=5185.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  17%|█▋        | 209/1208 [06:05<29:05,  1.75s/it, loss=0.191, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00132, train/loss_step=0.304, global_step=5185.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  17%|█▋        | 209/1208 [06:05<29:05,  1.75s/it, loss=0.191, v_num=0, train/loss_simple_step=0.00885, train/loss_vlb_step=4.19e-5, train/loss_step=0.00885, global_step=5186.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  17%|█▋        | 210/1208 [06:06<29:00,  1.74s/it, loss=0.191, v_num=0, train/loss_simple_step=0.00885, train/loss_vlb_step=4.19e-5, train/loss_step=0.00885, global_step=5186.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  17%|█▋        | 210/1208 [06:06<29:00,  1.74s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0591, train/loss_vlb_step=0.000202, train/loss_step=0.0591, global_step=5186.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  17%|█▋        | 211/1208 [06:07<28:55,  1.74s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0591, train/loss_vlb_step=0.000202, train/loss_step=0.0591, global_step=5186.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  17%|█▋        | 211/1208 [06:07<28:55,  1.74s/it, loss=0.16, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000596, train/loss_step=0.175, global_step=5186.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  18%|█▊        | 212/1208 [06:10<29:00,  1.75s/it, loss=0.16, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000596, train/loss_step=0.175, global_step=5186.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  18%|█▊        | 212/1208 [06:10<29:00,  1.75s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.57e-5, train/loss_step=0.0101, global_step=5186.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  18%|█▊        | 213/1208 [06:11<28:55,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.57e-5, train/loss_step=0.0101, global_step=5186.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  18%|█▊        | 213/1208 [06:11<28:55,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=1.44e-5, train/loss_step=0.00239, global_step=5187.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  18%|█▊        | 214/1208 [06:12<28:50,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=1.44e-5, train/loss_step=0.00239, global_step=5187.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  18%|█▊        | 214/1208 [06:12<28:50,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0833, train/loss_vlb_step=0.00028, train/loss_step=0.0833, global_step=5187.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  18%|█▊        | 215/1208 [06:13<28:45,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0833, train/loss_vlb_step=0.00028, train/loss_step=0.0833, global_step=5187.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  18%|█▊        | 215/1208 [06:13<28:45,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00215, train/loss_step=0.324, global_step=5187.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  18%|█▊        | 216/1208 [06:16<28:50,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00215, train/loss_step=0.324, global_step=5187.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  18%|█▊        | 216/1208 [06:16<28:50,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0498, train/loss_vlb_step=0.000181, train/loss_step=0.0498, global_step=5187.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  18%|█▊        | 217/1208 [06:17<28:45,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0498, train/loss_vlb_step=0.000181, train/loss_step=0.0498, global_step=5187.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  18%|█▊        | 217/1208 [06:17<28:45,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0898, train/loss_vlb_step=0.000301, train/loss_step=0.0898, global_step=5188.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  18%|█▊        | 218/1208 [06:18<28:40,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0898, train/loss_vlb_step=0.000301, train/loss_step=0.0898, global_step=5188.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  18%|█▊        | 218/1208 [06:18<28:40,  1.74s/it, loss=0.164, v_num=0, train/loss_simple_step=0.567, train/loss_vlb_step=0.0199, train/loss_step=0.567, global_step=5188.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  18%|█▊        | 219/1208 [06:19<28:35,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.567, train/loss_vlb_step=0.0199, train/loss_step=0.567, global_step=5188.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  18%|█▊        | 219/1208 [06:19<28:35,  1.73s/it, loss=0.198, v_num=0, train/loss_simple_step=0.667, train/loss_vlb_step=0.0345, train/loss_step=0.667, global_step=5188.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  18%|█▊        | 220/1208 [06:23<28:40,  1.74s/it, loss=0.198, v_num=0, train/loss_simple_step=0.667, train/loss_vlb_step=0.0345, train/loss_step=0.667, global_step=5188.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  18%|█▊        | 220/1208 [06:23<28:40,  1.74s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0623, train/loss_vlb_step=0.000213, train/loss_step=0.0623, global_step=5188.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  18%|█▊        | 221/1208 [06:24<28:35,  1.74s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0623, train/loss_vlb_step=0.000213, train/loss_step=0.0623, global_step=5188.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  18%|█▊        | 221/1208 [06:24<28:35,  1.74s/it, loss=0.185, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000628, train/loss_step=0.180, global_step=5189.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  18%|█▊        | 222/1208 [06:25<28:30,  1.74s/it, loss=0.185, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000628, train/loss_step=0.180, global_step=5189.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  18%|█▊        | 222/1208 [06:25<28:30,  1.74s/it, loss=0.186, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.000121, train/loss_step=0.033, global_step=5189.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  18%|█▊        | 223/1208 [06:26<28:25,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.000121, train/loss_step=0.033, global_step=5189.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  18%|█▊        | 223/1208 [06:26<28:25,  1.73s/it, loss=0.2, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.00697, train/loss_step=0.460, global_step=5189.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  19%|█▊        | 224/1208 [06:29<28:31,  1.74s/it, loss=0.2, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.00697, train/loss_step=0.460, global_step=5189.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  19%|█▊        | 224/1208 [06:29<28:31,  1.74s/it, loss=0.209, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000656, train/loss_step=0.181, global_step=5189.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  19%|█▊        | 225/1208 [06:30<28:26,  1.74s/it, loss=0.209, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000656, train/loss_step=0.181, global_step=5189.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  19%|█▊        | 225/1208 [06:30<28:26,  1.74s/it, loss=0.219, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000881, train/loss_step=0.226, global_step=5190.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  19%|█▊        | 226/1208 [06:31<28:21,  1.73s/it, loss=0.219, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000881, train/loss_step=0.226, global_step=5190.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  19%|█▊        | 226/1208 [06:31<28:21,  1.73s/it, loss=0.204, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000773, train/loss_step=0.214, global_step=5190.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  19%|█▉        | 227/1208 [06:32<28:16,  1.73s/it, loss=0.204, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000773, train/loss_step=0.214, global_step=5190.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  19%|█▉        | 227/1208 [06:32<28:16,  1.73s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0986, train/loss_vlb_step=0.000324, train/loss_step=0.0986, global_step=5190.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  19%|█▉        | 228/1208 [06:35<28:21,  1.74s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0986, train/loss_vlb_step=0.000324, train/loss_step=0.0986, global_step=5190.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  19%|█▉        | 228/1208 [06:35<28:21,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000458, train/loss_step=0.135, global_step=5190.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  19%|█▉        | 229/1208 [06:36<28:16,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000458, train/loss_step=0.135, global_step=5190.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  19%|█▉        | 229/1208 [06:36<28:16,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0999, train/loss_vlb_step=0.000328, train/loss_step=0.0999, global_step=5191.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  19%|█▉        | 230/1208 [06:37<28:12,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0999, train/loss_vlb_step=0.000328, train/loss_step=0.0999, global_step=5191.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  19%|█▉        | 230/1208 [06:37<28:12,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.43e-5, train/loss_step=0.0207, global_step=5191.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  19%|█▉        | 231/1208 [06:39<28:07,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.43e-5, train/loss_step=0.0207, global_step=5191.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  19%|█▉        | 231/1208 [06:39<28:07,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0859, train/loss_vlb_step=0.000283, train/loss_step=0.0859, global_step=5191.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  19%|█▉        | 232/1208 [06:42<28:12,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0859, train/loss_vlb_step=0.000283, train/loss_step=0.0859, global_step=5191.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  19%|█▉        | 232/1208 [06:42<28:12,  1.73s/it, loss=0.192, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00098, train/loss_step=0.251, global_step=5191.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  19%|█▉        | 233/1208 [06:43<28:07,  1.73s/it, loss=0.192, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00098, train/loss_step=0.251, global_step=5191.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  19%|█▉        | 233/1208 [06:43<28:07,  1.73s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.1e-5, train/loss_step=0.0149, global_step=5192.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  19%|█▉        | 234/1208 [06:44<28:03,  1.73s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.1e-5, train/loss_step=0.0149, global_step=5192.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  19%|█▉        | 234/1208 [06:44<28:03,  1.73s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000232, train/loss_step=0.0676, global_step=5192.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  19%|█▉        | 235/1208 [06:45<27:58,  1.73s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000232, train/loss_step=0.0676, global_step=5192.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  19%|█▉        | 235/1208 [06:45<27:58,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0785, train/loss_vlb_step=0.000261, train/loss_step=0.0785, global_step=5192.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  20%|█▉        | 236/1208 [06:48<28:03,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0785, train/loss_vlb_step=0.000261, train/loss_step=0.0785, global_step=5192.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  20%|█▉        | 236/1208 [06:48<28:03,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0479, train/loss_vlb_step=0.00017, train/loss_step=0.0479, global_step=5192.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  20%|█▉        | 237/1208 [06:49<27:58,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0479, train/loss_vlb_step=0.00017, train/loss_step=0.0479, global_step=5192.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  20%|█▉        | 237/1208 [06:49<27:58,  1.73s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.41e-5, train/loss_step=0.0234, global_step=5193.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  20%|█▉        | 238/1208 [06:50<27:54,  1.73s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.41e-5, train/loss_step=0.0234, global_step=5193.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  20%|█▉        | 238/1208 [06:50<27:54,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000185, train/loss_step=0.051, global_step=5193.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  20%|█▉        | 239/1208 [06:51<27:49,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000185, train/loss_step=0.051, global_step=5193.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  20%|█▉        | 239/1208 [06:51<27:49,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000107, train/loss_step=0.0287, global_step=5193.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  20%|█▉        | 240/1208 [06:55<27:53,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000107, train/loss_step=0.0287, global_step=5193.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  20%|█▉        | 240/1208 [06:55<27:53,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.000134, train/loss_step=0.038, global_step=5193.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  20%|█▉        | 241/1208 [06:56<27:49,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.000134, train/loss_step=0.038, global_step=5193.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  20%|█▉        | 241/1208 [06:56<27:49,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00106, train/loss_step=0.239, global_step=5194.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  20%|██        | 242/1208 [06:57<27:45,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00106, train/loss_step=0.239, global_step=5194.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  20%|██        | 242/1208 [06:57<27:45,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.09e-5, train/loss_step=0.0194, global_step=5194.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  20%|██        | 243/1208 [06:58<27:40,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.09e-5, train/loss_step=0.0194, global_step=5194.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  20%|██        | 243/1208 [06:58<27:40,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.000993, train/loss_step=0.260, global_step=5194.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  20%|██        | 244/1208 [07:01<27:45,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.000993, train/loss_step=0.260, global_step=5194.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  20%|██        | 244/1208 [07:01<27:45,  1.73s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.28e-5, train/loss_step=0.00215, global_step=5194.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  20%|██        | 245/1208 [07:02<27:40,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.28e-5, train/loss_step=0.00215, global_step=5194.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  20%|██        | 245/1208 [07:02<27:40,  1.72s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000684, train/loss_step=0.191, global_step=5195.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  20%|██        | 246/1208 [07:03<27:36,  1.72s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000684, train/loss_step=0.191, global_step=5195.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  20%|██        | 246/1208 [07:03<27:36,  1.72s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.059, train/loss_vlb_step=0.000208, train/loss_step=0.059, global_step=5195.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  20%|██        | 247/1208 [07:04<27:31,  1.72s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.059, train/loss_vlb_step=0.000208, train/loss_step=0.059, global_step=5195.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  20%|██        | 247/1208 [07:04<27:31,  1.72s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.0661, train/loss_vlb_step=0.000224, train/loss_step=0.0661, global_step=5195.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  21%|██        | 248/1208 [07:07<27:36,  1.73s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.0661, train/loss_vlb_step=0.000224, train/loss_step=0.0661, global_step=5195.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  21%|██        | 248/1208 [07:07<27:36,  1.73s/it, loss=0.097, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.0015, train/loss_step=0.296, global_step=5195.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]     Epoch 17:  21%|██        | 249/1208 [07:08<27:31,  1.72s/it, loss=0.097, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.0015, train/loss_step=0.296, global_step=5195.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  21%|██        | 249/1208 [07:08<27:31,  1.72s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000418, train/loss_step=0.125, global_step=5196.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  21%|██        | 250/1208 [07:09<27:27,  1.72s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000418, train/loss_step=0.125, global_step=5196.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  21%|██        | 250/1208 [07:09<27:27,  1.72s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.24e-5, train/loss_step=0.0022, global_step=5196.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  21%|██        | 251/1208 [07:10<27:23,  1.72s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.24e-5, train/loss_step=0.0022, global_step=5196.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  21%|██        | 251/1208 [07:10<27:23,  1.72s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.0678, train/loss_vlb_step=0.000228, train/loss_step=0.0678, global_step=5196.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  21%|██        | 252/1208 [07:14<27:27,  1.72s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.0678, train/loss_vlb_step=0.000228, train/loss_step=0.0678, global_step=5196.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  21%|██        | 252/1208 [07:14<27:27,  1.72s/it, loss=0.085, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9.02e-5, train/loss_step=0.0224, global_step=5196.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  21%|██        | 253/1208 [07:15<27:22,  1.72s/it, loss=0.085, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9.02e-5, train/loss_step=0.0224, global_step=5196.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  21%|██        | 253/1208 [07:15<27:22,  1.72s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.3e-5, train/loss_step=0.0239, global_step=5197.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  21%|██        | 254/1208 [07:16<27:18,  1.72s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.3e-5, train/loss_step=0.0239, global_step=5197.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  21%|██        | 254/1208 [07:16<27:18,  1.72s/it, loss=0.0867, v_num=0, train/loss_simple_step=0.0939, train/loss_vlb_step=0.000309, train/loss_step=0.0939, global_step=5197.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  21%|██        | 255/1208 [07:17<27:14,  1.72s/it, loss=0.0867, v_num=0, train/loss_simple_step=0.0939, train/loss_vlb_step=0.000309, train/loss_step=0.0939, global_step=5197.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  21%|██        | 255/1208 [07:17<27:14,  1.72s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=8.32e-6, train/loss_step=0.00136, global_step=5197.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  21%|██        | 256/1208 [07:20<27:18,  1.72s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=8.32e-6, train/loss_step=0.00136, global_step=5197.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  21%|██        | 256/1208 [07:20<27:18,  1.72s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000436, train/loss_step=0.132, global_step=5197.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  21%|██▏       | 257/1208 [07:21<27:14,  1.72s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000436, train/loss_step=0.132, global_step=5197.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  21%|██▏       | 257/1208 [07:21<27:14,  1.72s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.0733, train/loss_vlb_step=0.000247, train/loss_step=0.0733, global_step=5198.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  21%|██▏       | 258/1208 [07:22<27:09,  1.72s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.0733, train/loss_vlb_step=0.000247, train/loss_step=0.0733, global_step=5198.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  21%|██▏       | 258/1208 [07:22<27:09,  1.72s/it, loss=0.0888, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000133, train/loss_step=0.0363, global_step=5198.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  21%|██▏       | 259/1208 [07:23<27:05,  1.71s/it, loss=0.0888, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000133, train/loss_step=0.0363, global_step=5198.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  21%|██▏       | 259/1208 [07:23<27:05,  1.71s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000338, train/loss_step=0.103, global_step=5198.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  22%|██▏       | 260/1208 [07:26<27:09,  1.72s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000338, train/loss_step=0.103, global_step=5198.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  22%|██▏       | 260/1208 [07:26<27:09,  1.72s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000333, train/loss_step=0.101, global_step=5198.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  22%|██▏       | 261/1208 [07:27<27:05,  1.72s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000333, train/loss_step=0.101, global_step=5198.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  22%|██▏       | 261/1208 [07:27<27:05,  1.72s/it, loss=0.087, v_num=0, train/loss_simple_step=0.0656, train/loss_vlb_step=0.00022, train/loss_step=0.0656, global_step=5199.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  22%|██▏       | 262/1208 [07:29<27:01,  1.71s/it, loss=0.087, v_num=0, train/loss_simple_step=0.0656, train/loss_vlb_step=0.00022, train/loss_step=0.0656, global_step=5199.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  22%|██▏       | 262/1208 [07:29<27:01,  1.71s/it, loss=0.0867, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.34e-5, train/loss_step=0.0119, global_step=5199.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  22%|██▏       | 263/1208 [07:30<26:57,  1.71s/it, loss=0.0867, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.34e-5, train/loss_step=0.0119, global_step=5199.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  22%|██▏       | 263/1208 [07:30<26:57,  1.71s/it, loss=0.0833, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000668, train/loss_step=0.193, global_step=5199.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  22%|██▏       | 264/1208 [07:33<27:00,  1.72s/it, loss=0.0833, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000668, train/loss_step=0.193, global_step=5199.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  22%|██▏       | 264/1208 [07:33<27:00,  1.72s/it, loss=0.0833, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.18e-5, train/loss_step=0.00195, global_step=5199.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  22%|██▏       | 265/1208 [07:34<26:56,  1.71s/it, loss=0.0833, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.18e-5, train/loss_step=0.00195, global_step=5199.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  22%|██▏       | 265/1208 [07:34<26:56,  1.71s/it, loss=0.0741, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=3.01e-5, train/loss_step=0.00615, global_step=5200.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  22%|██▏       | 266/1208 [07:35<26:52,  1.71s/it, loss=0.0741, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=3.01e-5, train/loss_step=0.00615, global_step=5200.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  22%|██▏       | 266/1208 [07:35<26:52,  1.71s/it, loss=0.0834, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000996, train/loss_step=0.246, global_step=5200.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  22%|██▏       | 267/1208 [07:36<26:48,  1.71s/it, loss=0.0834, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000996, train/loss_step=0.246, global_step=5200.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  22%|██▏       | 267/1208 [07:36<26:48,  1.71s/it, loss=0.081, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.9e-5, train/loss_step=0.0188, global_step=5200.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  22%|██▏       | 268/1208 [07:39<26:52,  1.72s/it, loss=0.081, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.9e-5, train/loss_step=0.0188, global_step=5200.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  22%|██▏       | 268/1208 [07:39<26:52,  1.72s/it, loss=0.0692, v_num=0, train/loss_simple_step=0.0599, train/loss_vlb_step=0.000211, train/loss_step=0.0599, global_step=5200.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  22%|██▏       | 269/1208 [07:40<26:48,  1.71s/it, loss=0.0692, v_num=0, train/loss_simple_step=0.0599, train/loss_vlb_step=0.000211, train/loss_step=0.0599, global_step=5200.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  22%|██▏       | 269/1208 [07:40<26:48,  1.71s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00319, train/loss_step=0.385, global_step=5201.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  22%|██▏       | 270/1208 [07:41<26:44,  1.71s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00319, train/loss_step=0.385, global_step=5201.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  22%|██▏       | 270/1208 [07:41<26:44,  1.71s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.0611, train/loss_vlb_step=0.000207, train/loss_step=0.0611, global_step=5201.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  22%|██▏       | 271/1208 [07:42<26:40,  1.71s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.0611, train/loss_vlb_step=0.000207, train/loss_step=0.0611, global_step=5201.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  22%|██▏       | 271/1208 [07:42<26:40,  1.71s/it, loss=0.0888, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000461, train/loss_step=0.140, global_step=5201.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  23%|██▎       | 272/1208 [07:46<26:44,  1.71s/it, loss=0.0888, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000461, train/loss_step=0.140, global_step=5201.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  23%|██▎       | 272/1208 [07:46<26:44,  1.71s/it, loss=0.0884, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.62e-5, train/loss_step=0.0155, global_step=5201.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  23%|██▎       | 273/1208 [07:47<26:40,  1.71s/it, loss=0.0884, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.62e-5, train/loss_step=0.0155, global_step=5201.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  23%|██▎       | 273/1208 [07:47<26:40,  1.71s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000464, train/loss_step=0.137, global_step=5202.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  23%|██▎       | 274/1208 [07:48<26:36,  1.71s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000464, train/loss_step=0.137, global_step=5202.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  23%|██▎       | 274/1208 [07:48<26:36,  1.71s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000733, train/loss_step=0.202, global_step=5202.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  23%|██▎       | 275/1208 [07:49<26:32,  1.71s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000733, train/loss_step=0.202, global_step=5202.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  23%|██▎       | 275/1208 [07:49<26:32,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.00017, train/loss_step=0.0476, global_step=5202.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  23%|██▎       | 276/1208 [07:52<26:35,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.00017, train/loss_step=0.0476, global_step=5202.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  23%|██▎       | 276/1208 [07:52<26:35,  1.71s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000141, train/loss_step=0.0386, global_step=5202.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  23%|██▎       | 277/1208 [07:53<26:31,  1.71s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000141, train/loss_step=0.0386, global_step=5202.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  23%|██▎       | 277/1208 [07:53<26:31,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00116, train/loss_step=0.284, global_step=5203.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  23%|██▎       | 278/1208 [07:54<26:27,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00116, train/loss_step=0.284, global_step=5203.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  23%|██▎       | 278/1208 [07:54<26:27,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00129, train/loss_step=0.268, global_step=5203.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  23%|██▎       | 279/1208 [07:55<26:23,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00129, train/loss_step=0.268, global_step=5203.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  23%|██▎       | 279/1208 [07:55<26:23,  1.70s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0859, train/loss_vlb_step=0.000285, train/loss_step=0.0859, global_step=5203.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  23%|██▎       | 280/1208 [07:58<26:27,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0859, train/loss_vlb_step=0.000285, train/loss_step=0.0859, global_step=5203.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  23%|██▎       | 280/1208 [07:58<26:27,  1.71s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=2.16e-5, train/loss_step=0.00407, global_step=5203.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  23%|██▎       | 281/1208 [07:59<26:23,  1.71s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=2.16e-5, train/loss_step=0.00407, global_step=5203.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  23%|██▎       | 281/1208 [07:59<26:23,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.751, train/loss_vlb_step=0.0483, train/loss_step=0.751, global_step=5204.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]     Epoch 17:  23%|██▎       | 282/1208 [08:00<26:19,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.751, train/loss_vlb_step=0.0483, train/loss_step=0.751, global_step=5204.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  23%|██▎       | 282/1208 [08:00<26:19,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0725, train/loss_vlb_step=0.000247, train/loss_step=0.0725, global_step=5204.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  23%|██▎       | 283/1208 [08:01<26:15,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0725, train/loss_vlb_step=0.000247, train/loss_step=0.0725, global_step=5204.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  23%|██▎       | 283/1208 [08:01<26:15,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.11e-5, train/loss_step=0.00182, global_step=5204.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  24%|██▎       | 284/1208 [08:05<26:18,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.11e-5, train/loss_step=0.00182, global_step=5204.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  24%|██▎       | 284/1208 [08:05<26:18,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00773, train/loss_vlb_step=3.87e-5, train/loss_step=0.00773, global_step=5204.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  24%|██▎       | 285/1208 [08:06<26:14,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00773, train/loss_vlb_step=3.87e-5, train/loss_step=0.00773, global_step=5204.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  24%|██▎       | 285/1208 [08:06<26:14,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000462, train/loss_step=0.139, global_step=5205.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  24%|██▎       | 286/1208 [08:07<26:11,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000462, train/loss_step=0.139, global_step=5205.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  24%|██▎       | 286/1208 [08:07<26:11,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00127, train/loss_step=0.298, global_step=5205.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  24%|██▍       | 287/1208 [08:08<26:07,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00127, train/loss_step=0.298, global_step=5205.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  24%|██▍       | 287/1208 [08:08<26:07,  1.70s/it, loss=0.169, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.003, train/loss_step=0.384, global_step=5205.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  24%|██▍       | 288/1208 [08:11<26:10,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.003, train/loss_step=0.384, global_step=5205.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  24%|██▍       | 288/1208 [08:11<26:10,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000837, train/loss_step=0.206, global_step=5205.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  24%|██▍       | 289/1208 [08:12<26:06,  1.70s/it, loss=0.176, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000837, train/loss_step=0.206, global_step=5205.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  24%|██▍       | 289/1208 [08:12<26:06,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.68e-5, train/loss_step=0.0152, global_step=5206.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  24%|██▍       | 290/1208 [08:13<26:02,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.68e-5, train/loss_step=0.0152, global_step=5206.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  24%|██▍       | 290/1208 [08:13<26:02,  1.70s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00318, train/loss_vlb_step=1.74e-5, train/loss_step=0.00318, global_step=5206.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  24%|██▍       | 291/1208 [08:14<25:59,  1.70s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00318, train/loss_vlb_step=1.74e-5, train/loss_step=0.00318, global_step=5206.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  24%|██▍       | 291/1208 [08:14<25:59,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.00036, train/loss_step=0.109, global_step=5206.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  24%|██▍       | 292/1208 [08:18<26:02,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.00036, train/loss_step=0.109, global_step=5206.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  24%|██▍       | 292/1208 [08:18<26:02,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00108, train/loss_step=0.249, global_step=5206.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  24%|██▍       | 293/1208 [08:19<25:58,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00108, train/loss_step=0.249, global_step=5206.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  24%|██▍       | 293/1208 [08:19<25:58,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.65e-5, train/loss_step=0.0129, global_step=5207.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  24%|██▍       | 294/1208 [08:20<25:54,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.65e-5, train/loss_step=0.0129, global_step=5207.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  24%|██▍       | 294/1208 [08:20<25:54,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00128, train/loss_step=0.287, global_step=5207.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  24%|██▍       | 295/1208 [08:21<25:51,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00128, train/loss_step=0.287, global_step=5207.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  24%|██▍       | 295/1208 [08:21<25:51,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00156, train/loss_step=0.350, global_step=5207.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  25%|██▍       | 296/1208 [08:24<25:54,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00156, train/loss_step=0.350, global_step=5207.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  25%|██▍       | 296/1208 [08:24<25:54,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000561, train/loss_step=0.164, global_step=5207.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  25%|██▍       | 297/1208 [08:25<25:50,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000561, train/loss_step=0.164, global_step=5207.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  25%|██▍       | 297/1208 [08:25<25:50,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00547, train/loss_vlb_step=2.89e-5, train/loss_step=0.00547, global_step=5208.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  25%|██▍       | 298/1208 [08:26<25:46,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00547, train/loss_vlb_step=2.89e-5, train/loss_step=0.00547, global_step=5208.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  25%|██▍       | 298/1208 [08:26<25:46,  1.70s/it, loss=0.176, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00275, train/loss_step=0.379, global_step=5208.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  25%|██▍       | 299/1208 [08:27<25:43,  1.70s/it, loss=0.176, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00275, train/loss_step=0.379, global_step=5208.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  25%|██▍       | 299/1208 [08:27<25:43,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000904, train/loss_step=0.244, global_step=5208.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  25%|██▍       | 300/1208 [08:30<25:46,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000904, train/loss_step=0.244, global_step=5208.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  25%|██▍       | 300/1208 [08:30<25:46,  1.70s/it, loss=0.199, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00174, train/loss_step=0.311, global_step=5208.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] 
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.76it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.76it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.83it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.83it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.83it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.83it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.76it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.75it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.83it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.83it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.82it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.82it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.78it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 17:  25%|██▍       | 301/1208 [09:01<27:11,  1.80s/it, loss=0.199, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00174, train/loss_step=0.311, global_step=5208.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  25%|██▍       | 301/1208 [09:01<27:11,  1.80s/it, loss=0.172, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000723, train/loss_step=0.205, global_step=5209.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  25%|██▌       | 302/1208 [09:02<27:07,  1.80s/it, loss=0.172, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000723, train/loss_step=0.205, global_step=5209.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  25%|██▌       | 302/1208 [09:02<27:07,  1.80s/it, loss=0.18, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000865, train/loss_step=0.233, global_step=5209.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  25%|██▌       | 303/1208 [09:03<27:03,  1.79s/it, loss=0.18, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000865, train/loss_step=0.233, global_step=5209.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  25%|██▌       | 303/1208 [09:03<27:03,  1.79s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.85e-5, train/loss_step=0.0186, global_step=5209.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  25%|██▌       | 304/1208 [09:06<27:05,  1.80s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.85e-5, train/loss_step=0.0186, global_step=5209.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  25%|██▌       | 304/1208 [09:06<27:05,  1.80s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00654, train/loss_vlb_step=3.33e-5, train/loss_step=0.00654, global_step=5209.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  25%|██▌       | 305/1208 [09:07<27:01,  1.80s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00654, train/loss_vlb_step=3.33e-5, train/loss_step=0.00654, global_step=5209.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  25%|██▌       | 305/1208 [09:07<27:01,  1.80s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0685, train/loss_vlb_step=0.000229, train/loss_step=0.0685, global_step=5210.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  25%|██▌       | 306/1208 [09:08<26:57,  1.79s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0685, train/loss_vlb_step=0.000229, train/loss_step=0.0685, global_step=5210.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  25%|██▌       | 306/1208 [09:08<26:57,  1.79s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.2e-5, train/loss_step=0.0144, global_step=5210.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  25%|██▌       | 307/1208 [09:09<26:53,  1.79s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.2e-5, train/loss_step=0.0144, global_step=5210.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  25%|██▌       | 307/1208 [09:09<26:53,  1.79s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00157, train/loss_vlb_step=9.45e-6, train/loss_step=0.00157, global_step=5210.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  25%|██▌       | 308/1208 [09:13<26:55,  1.80s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00157, train/loss_vlb_step=9.45e-6, train/loss_step=0.00157, global_step=5210.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  25%|██▌       | 308/1208 [09:13<26:55,  1.80s/it, loss=0.14, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=5210.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  26%|██▌       | 309/1208 [09:14<26:52,  1.79s/it, loss=0.14, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=5210.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  26%|██▌       | 309/1208 [09:14<26:52,  1.79s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.05e-5, train/loss_step=0.0169, global_step=5211.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  26%|██▌       | 310/1208 [09:15<26:48,  1.79s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.05e-5, train/loss_step=0.0169, global_step=5211.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  26%|██▌       | 310/1208 [09:15<26:48,  1.79s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.4e-5, train/loss_step=0.0026, global_step=5211.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  26%|██▌       | 311/1208 [09:16<26:44,  1.79s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.4e-5, train/loss_step=0.0026, global_step=5211.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  26%|██▌       | 311/1208 [09:16<26:44,  1.79s/it, loss=0.135, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.35e-5, train/loss_step=0.017, global_step=5211.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  26%|██▌       | 312/1208 [09:19<26:46,  1.79s/it, loss=0.135, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.35e-5, train/loss_step=0.017, global_step=5211.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  26%|██▌       | 312/1208 [09:19<26:46,  1.79s/it, loss=0.142, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00281, train/loss_step=0.395, global_step=5211.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  26%|██▌       | 313/1208 [09:20<26:42,  1.79s/it, loss=0.142, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00281, train/loss_step=0.395, global_step=5211.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  26%|██▌       | 313/1208 [09:20<26:42,  1.79s/it, loss=0.162, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00434, train/loss_step=0.411, global_step=5212.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  26%|██▌       | 314/1208 [09:21<26:38,  1.79s/it, loss=0.162, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00434, train/loss_step=0.411, global_step=5212.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  26%|██▌       | 314/1208 [09:21<26:38,  1.79s/it, loss=0.157, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000649, train/loss_step=0.187, global_step=5212.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  26%|██▌       | 315/1208 [09:22<26:34,  1.79s/it, loss=0.157, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000649, train/loss_step=0.187, global_step=5212.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  26%|██▌       | 315/1208 [09:22<26:34,  1.79s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00337, train/loss_vlb_step=1.86e-5, train/loss_step=0.00337, global_step=5212.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  26%|██▌       | 316/1208 [09:25<26:37,  1.79s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00337, train/loss_vlb_step=1.86e-5, train/loss_step=0.00337, global_step=5212.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  26%|██▌       | 316/1208 [09:25<26:37,  1.79s/it, loss=0.143, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000944, train/loss_step=0.233, global_step=5212.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  26%|██▌       | 317/1208 [09:26<26:33,  1.79s/it, loss=0.143, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000944, train/loss_step=0.233, global_step=5212.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  26%|██▌       | 317/1208 [09:26<26:33,  1.79s/it, loss=0.173, v_num=0, train/loss_simple_step=0.607, train/loss_vlb_step=0.0148, train/loss_step=0.607, global_step=5213.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  26%|██▋       | 318/1208 [09:27<26:29,  1.79s/it, loss=0.173, v_num=0, train/loss_simple_step=0.607, train/loss_vlb_step=0.0148, train/loss_step=0.607, global_step=5213.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  26%|██▋       | 318/1208 [09:27<26:29,  1.79s/it, loss=0.163, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000598, train/loss_step=0.165, global_step=5213.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  26%|██▋       | 319/1208 [09:28<26:25,  1.78s/it, loss=0.163, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000598, train/loss_step=0.165, global_step=5213.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  26%|██▋       | 319/1208 [09:28<26:25,  1.78s/it, loss=0.16, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000715, train/loss_step=0.185, global_step=5213.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  26%|██▋       | 320/1208 [09:32<26:27,  1.79s/it, loss=0.16, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000715, train/loss_step=0.185, global_step=5213.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  26%|██▋       | 320/1208 [09:32<26:27,  1.79s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0887, train/loss_vlb_step=0.000294, train/loss_step=0.0887, global_step=5213.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  27%|██▋       | 321/1208 [09:33<26:24,  1.79s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0887, train/loss_vlb_step=0.000294, train/loss_step=0.0887, global_step=5213.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  27%|██▋       | 321/1208 [09:33<26:24,  1.79s/it, loss=0.148, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000731, train/loss_step=0.190, global_step=5214.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  27%|██▋       | 322/1208 [09:34<26:20,  1.78s/it, loss=0.148, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000731, train/loss_step=0.190, global_step=5214.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  27%|██▋       | 322/1208 [09:34<26:20,  1.78s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0772, train/loss_vlb_step=0.000258, train/loss_step=0.0772, global_step=5214.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  27%|██▋       | 323/1208 [09:35<26:16,  1.78s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0772, train/loss_vlb_step=0.000258, train/loss_step=0.0772, global_step=5214.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  27%|██▋       | 323/1208 [09:35<26:16,  1.78s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00629, train/loss_vlb_step=3.15e-5, train/loss_step=0.00629, global_step=5214.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  27%|██▋       | 324/1208 [09:38<26:18,  1.79s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00629, train/loss_vlb_step=3.15e-5, train/loss_step=0.00629, global_step=5214.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  27%|██▋       | 324/1208 [09:38<26:18,  1.79s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0065, train/loss_vlb_step=3.21e-5, train/loss_step=0.0065, global_step=5214.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  27%|██▋       | 325/1208 [09:39<26:14,  1.78s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0065, train/loss_vlb_step=3.21e-5, train/loss_step=0.0065, global_step=5214.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  27%|██▋       | 325/1208 [09:39<26:14,  1.78s/it, loss=0.145, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000631, train/loss_step=0.187, global_step=5215.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  27%|██▋       | 326/1208 [09:40<26:11,  1.78s/it, loss=0.145, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000631, train/loss_step=0.187, global_step=5215.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  27%|██▋       | 326/1208 [09:40<26:11,  1.78s/it, loss=0.15, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.00036, train/loss_step=0.110, global_step=5215.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  27%|██▋       | 327/1208 [09:41<26:07,  1.78s/it, loss=0.15, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.00036, train/loss_step=0.110, global_step=5215.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  27%|██▋       | 327/1208 [09:41<26:07,  1.78s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00709, train/loss_vlb_step=3.51e-5, train/loss_step=0.00709, global_step=5215.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  27%|██▋       | 328/1208 [09:44<26:09,  1.78s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00709, train/loss_vlb_step=3.51e-5, train/loss_step=0.00709, global_step=5215.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  27%|██▋       | 328/1208 [09:45<26:09,  1.78s/it, loss=0.161, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00163, train/loss_step=0.326, global_step=5215.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  27%|██▋       | 329/1208 [09:46<26:05,  1.78s/it, loss=0.161, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00163, train/loss_step=0.326, global_step=5215.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  27%|██▋       | 329/1208 [09:46<26:05,  1.78s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=8.49e-5, train/loss_step=0.0222, global_step=5216.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  27%|██▋       | 330/1208 [09:47<26:02,  1.78s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=8.49e-5, train/loss_step=0.0222, global_step=5216.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  27%|██▋       | 330/1208 [09:47<26:02,  1.78s/it, loss=0.173, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00101, train/loss_step=0.243, global_step=5216.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  27%|██▋       | 331/1208 [09:48<25:58,  1.78s/it, loss=0.173, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00101, train/loss_step=0.243, global_step=5216.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  27%|██▋       | 331/1208 [09:48<25:58,  1.78s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0703, train/loss_vlb_step=0.000238, train/loss_step=0.0703, global_step=5216.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  27%|██▋       | 332/1208 [09:51<26:00,  1.78s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0703, train/loss_vlb_step=0.000238, train/loss_step=0.0703, global_step=5216.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  27%|██▋       | 332/1208 [09:51<26:00,  1.78s/it, loss=0.168, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000963, train/loss_step=0.242, global_step=5216.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  28%|██▊       | 333/1208 [09:52<25:56,  1.78s/it, loss=0.168, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000963, train/loss_step=0.242, global_step=5216.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  28%|██▊       | 333/1208 [09:52<25:56,  1.78s/it, loss=0.183, v_num=0, train/loss_simple_step=0.699, train/loss_vlb_step=0.0178, train/loss_step=0.699, global_step=5217.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  28%|██▊       | 334/1208 [09:53<25:53,  1.78s/it, loss=0.183, v_num=0, train/loss_simple_step=0.699, train/loss_vlb_step=0.0178, train/loss_step=0.699, global_step=5217.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  28%|██▊       | 334/1208 [09:53<25:53,  1.78s/it, loss=0.197, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00382, train/loss_step=0.476, global_step=5217.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  28%|██▊       | 335/1208 [09:54<25:49,  1.77s/it, loss=0.197, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00382, train/loss_step=0.476, global_step=5217.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  28%|██▊       | 335/1208 [09:54<25:49,  1.77s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.54e-5, train/loss_step=0.00268, global_step=5217.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  28%|██▊       | 336/1208 [09:57<25:51,  1.78s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.54e-5, train/loss_step=0.00268, global_step=5217.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  28%|██▊       | 336/1208 [09:57<25:51,  1.78s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00509, train/loss_vlb_step=2.62e-5, train/loss_step=0.00509, global_step=5217.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  28%|██▊       | 337/1208 [09:58<25:47,  1.78s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00509, train/loss_vlb_step=2.62e-5, train/loss_step=0.00509, global_step=5217.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  28%|██▊       | 337/1208 [09:58<25:47,  1.78s/it, loss=0.167, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.00084, train/loss_step=0.229, global_step=5218.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  28%|██▊       | 338/1208 [09:59<25:44,  1.77s/it, loss=0.167, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.00084, train/loss_step=0.229, global_step=5218.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  28%|██▊       | 338/1208 [09:59<25:44,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0695, train/loss_vlb_step=0.000237, train/loss_step=0.0695, global_step=5218.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  28%|██▊       | 339/1208 [10:00<25:40,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0695, train/loss_vlb_step=0.000237, train/loss_step=0.0695, global_step=5218.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  28%|██▊       | 339/1208 [10:00<25:40,  1.77s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.21e-5, train/loss_step=0.00202, global_step=5218.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  28%|██▊       | 340/1208 [10:04<25:42,  1.78s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.21e-5, train/loss_step=0.00202, global_step=5218.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  28%|██▊       | 340/1208 [10:04<25:42,  1.78s/it, loss=0.163, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00133, train/loss_step=0.280, global_step=5218.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  28%|██▊       | 341/1208 [10:05<25:38,  1.77s/it, loss=0.163, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00133, train/loss_step=0.280, global_step=5218.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  28%|██▊       | 341/1208 [10:05<25:38,  1.77s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00765, train/loss_vlb_step=3.92e-5, train/loss_step=0.00765, global_step=5219.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  28%|██▊       | 342/1208 [10:06<25:35,  1.77s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00765, train/loss_vlb_step=3.92e-5, train/loss_step=0.00765, global_step=5219.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  28%|██▊       | 342/1208 [10:06<25:35,  1.77s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=9.77e-6, train/loss_step=0.00164, global_step=5219.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  28%|██▊       | 343/1208 [10:07<25:31,  1.77s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=9.77e-6, train/loss_step=0.00164, global_step=5219.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  28%|██▊       | 343/1208 [10:07<25:31,  1.77s/it, loss=0.182, v_num=0, train/loss_simple_step=0.659, train/loss_vlb_step=0.0217, train/loss_step=0.659, global_step=5219.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  28%|██▊       | 344/1208 [10:10<25:33,  1.77s/it, loss=0.182, v_num=0, train/loss_simple_step=0.659, train/loss_vlb_step=0.0217, train/loss_step=0.659, global_step=5219.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  28%|██▊       | 344/1208 [10:10<25:33,  1.77s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.23e-5, train/loss_step=0.0144, global_step=5219.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  29%|██▊       | 345/1208 [10:11<25:30,  1.77s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.23e-5, train/loss_step=0.0144, global_step=5219.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  29%|██▊       | 345/1208 [10:11<25:30,  1.77s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00755, train/loss_vlb_step=3.77e-5, train/loss_step=0.00755, global_step=5220.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  29%|██▊       | 346/1208 [10:12<25:26,  1.77s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00755, train/loss_vlb_step=3.77e-5, train/loss_step=0.00755, global_step=5220.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  29%|██▊       | 346/1208 [10:12<25:26,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.79e-5, train/loss_step=0.00305, global_step=5220.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  29%|██▊       | 347/1208 [10:13<25:22,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.79e-5, train/loss_step=0.00305, global_step=5220.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  29%|██▊       | 347/1208 [10:13<25:22,  1.77s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0839, train/loss_vlb_step=0.000277, train/loss_step=0.0839, global_step=5220.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  29%|██▉       | 348/1208 [10:16<25:24,  1.77s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0839, train/loss_vlb_step=0.000277, train/loss_step=0.0839, global_step=5220.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  29%|██▉       | 348/1208 [10:16<25:24,  1.77s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000132, train/loss_step=0.0353, global_step=5220.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  29%|██▉       | 349/1208 [10:18<25:21,  1.77s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000132, train/loss_step=0.0353, global_step=5220.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  29%|██▉       | 349/1208 [10:18<25:21,  1.77s/it, loss=0.179, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00388, train/loss_step=0.458, global_step=5221.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  29%|██▉       | 350/1208 [10:19<25:17,  1.77s/it, loss=0.179, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00388, train/loss_step=0.458, global_step=5221.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  29%|██▉       | 350/1208 [10:19<25:17,  1.77s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000119, train/loss_step=0.0328, global_step=5221.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  29%|██▉       | 351/1208 [10:20<25:14,  1.77s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000119, train/loss_step=0.0328, global_step=5221.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  29%|██▉       | 351/1208 [10:20<25:14,  1.77s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.27e-5, train/loss_step=0.00213, global_step=5221.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  29%|██▉       | 352/1208 [10:23<25:15,  1.77s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.27e-5, train/loss_step=0.00213, global_step=5221.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  29%|██▉       | 352/1208 [10:23<25:15,  1.77s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000136, train/loss_step=0.0374, global_step=5221.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  29%|██▉       | 353/1208 [10:24<25:12,  1.77s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000136, train/loss_step=0.0374, global_step=5221.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  29%|██▉       | 353/1208 [10:24<25:12,  1.77s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=9.09e-5, train/loss_step=0.0211, global_step=5222.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  29%|██▉       | 354/1208 [10:25<25:08,  1.77s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=9.09e-5, train/loss_step=0.0211, global_step=5222.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  29%|██▉       | 354/1208 [10:25<25:08,  1.77s/it, loss=0.109, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000956, train/loss_step=0.233, global_step=5222.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  29%|██▉       | 355/1208 [10:26<25:05,  1.76s/it, loss=0.109, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000956, train/loss_step=0.233, global_step=5222.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  29%|██▉       | 355/1208 [10:26<25:05,  1.76s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.00013, train/loss_step=0.0365, global_step=5222.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  29%|██▉       | 356/1208 [10:29<25:07,  1.77s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.00013, train/loss_step=0.0365, global_step=5222.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  29%|██▉       | 356/1208 [10:29<25:07,  1.77s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0765, train/loss_vlb_step=0.00026, train/loss_step=0.0765, global_step=5222.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  30%|██▉       | 357/1208 [10:30<25:03,  1.77s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0765, train/loss_vlb_step=0.00026, train/loss_step=0.0765, global_step=5222.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  30%|██▉       | 357/1208 [10:30<25:03,  1.77s/it, loss=0.11, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000502, train/loss_step=0.147, global_step=5223.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  30%|██▉       | 358/1208 [10:31<25:00,  1.76s/it, loss=0.11, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000502, train/loss_step=0.147, global_step=5223.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  30%|██▉       | 358/1208 [10:31<25:00,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000924, train/loss_step=0.232, global_step=5223.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  30%|██▉       | 359/1208 [10:32<24:56,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000924, train/loss_step=0.232, global_step=5223.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  30%|██▉       | 359/1208 [10:32<24:56,  1.76s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0687, train/loss_vlb_step=0.000238, train/loss_step=0.0687, global_step=5223.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  30%|██▉       | 360/1208 [10:36<24:58,  1.77s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0687, train/loss_vlb_step=0.000238, train/loss_step=0.0687, global_step=5223.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  30%|██▉       | 360/1208 [10:36<24:58,  1.77s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0841, train/loss_vlb_step=0.000282, train/loss_step=0.0841, global_step=5223.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  30%|██▉       | 361/1208 [10:37<24:55,  1.77s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0841, train/loss_vlb_step=0.000282, train/loss_step=0.0841, global_step=5223.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  30%|██▉       | 361/1208 [10:37<24:55,  1.77s/it, loss=0.14, v_num=0, train/loss_simple_step=0.559, train/loss_vlb_step=0.00966, train/loss_step=0.559, global_step=5224.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  30%|██▉       | 362/1208 [10:38<24:51,  1.76s/it, loss=0.14, v_num=0, train/loss_simple_step=0.559, train/loss_vlb_step=0.00966, train/loss_step=0.559, global_step=5224.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  30%|██▉       | 362/1208 [10:38<24:51,  1.76s/it, loss=0.158, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00165, train/loss_step=0.371, global_step=5224.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  30%|███       | 363/1208 [10:39<24:48,  1.76s/it, loss=0.158, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00165, train/loss_step=0.371, global_step=5224.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  30%|███       | 363/1208 [10:39<24:48,  1.76s/it, loss=0.145, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00294, train/loss_step=0.398, global_step=5224.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  30%|███       | 364/1208 [10:42<24:49,  1.77s/it, loss=0.145, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00294, train/loss_step=0.398, global_step=5224.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  30%|███       | 364/1208 [10:42<24:49,  1.77s/it, loss=0.155, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000765, train/loss_step=0.210, global_step=5224.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  30%|███       | 365/1208 [10:43<24:46,  1.76s/it, loss=0.155, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000765, train/loss_step=0.210, global_step=5224.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  30%|███       | 365/1208 [10:43<24:46,  1.76s/it, loss=0.166, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000997, train/loss_step=0.238, global_step=5225.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  30%|███       | 366/1208 [10:44<24:43,  1.76s/it, loss=0.166, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000997, train/loss_step=0.238, global_step=5225.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  30%|███       | 366/1208 [10:44<24:43,  1.76s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000134, train/loss_step=0.0353, global_step=5225.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  30%|███       | 367/1208 [10:45<24:39,  1.76s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000134, train/loss_step=0.0353, global_step=5225.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  30%|███       | 367/1208 [10:45<24:39,  1.76s/it, loss=0.17, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000429, train/loss_step=0.130, global_step=5225.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  30%|███       | 368/1208 [10:48<24:41,  1.76s/it, loss=0.17, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000429, train/loss_step=0.130, global_step=5225.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  30%|███       | 368/1208 [10:48<24:41,  1.76s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0509, train/loss_vlb_step=0.00018, train/loss_step=0.0509, global_step=5225.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  31%|███       | 369/1208 [10:49<24:37,  1.76s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0509, train/loss_vlb_step=0.00018, train/loss_step=0.0509, global_step=5225.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  31%|███       | 369/1208 [10:49<24:37,  1.76s/it, loss=0.166, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.0026, train/loss_step=0.359, global_step=5226.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  31%|███       | 370/1208 [10:51<24:34,  1.76s/it, loss=0.166, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.0026, train/loss_step=0.359, global_step=5226.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  31%|███       | 370/1208 [10:51<24:34,  1.76s/it, loss=0.168, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.000217, train/loss_step=0.062, global_step=5226.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  31%|███       | 371/1208 [10:52<24:31,  1.76s/it, loss=0.168, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.000217, train/loss_step=0.062, global_step=5226.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  31%|███       | 371/1208 [10:52<24:31,  1.76s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.00012, train/loss_step=0.0316, global_step=5226.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  31%|███       | 372/1208 [10:55<24:32,  1.76s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.00012, train/loss_step=0.0316, global_step=5226.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  31%|███       | 372/1208 [10:55<24:32,  1.76s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.26e-5, train/loss_step=0.0114, global_step=5226.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  31%|███       | 373/1208 [10:56<24:29,  1.76s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.26e-5, train/loss_step=0.0114, global_step=5226.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  31%|███       | 373/1208 [10:56<24:29,  1.76s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0368, train/loss_vlb_step=0.000134, train/loss_step=0.0368, global_step=5227.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  31%|███       | 374/1208 [10:57<24:25,  1.76s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0368, train/loss_vlb_step=0.000134, train/loss_step=0.0368, global_step=5227.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  31%|███       | 374/1208 [10:57<24:25,  1.76s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0721, train/loss_vlb_step=0.000243, train/loss_step=0.0721, global_step=5227.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  31%|███       | 375/1208 [10:58<24:22,  1.76s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0721, train/loss_vlb_step=0.000243, train/loss_step=0.0721, global_step=5227.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  31%|███       | 375/1208 [10:58<24:22,  1.76s/it, loss=0.178, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00237, train/loss_step=0.386, global_step=5227.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  31%|███       | 376/1208 [11:01<24:24,  1.76s/it, loss=0.178, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00237, train/loss_step=0.386, global_step=5227.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  31%|███       | 376/1208 [11:01<24:24,  1.76s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000128, train/loss_step=0.0329, global_step=5227.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  31%|███       | 377/1208 [11:02<24:20,  1.76s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000128, train/loss_step=0.0329, global_step=5227.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  31%|███       | 377/1208 [11:02<24:20,  1.76s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.04e-5, train/loss_step=0.00175, global_step=5228.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  31%|███▏      | 378/1208 [11:03<24:17,  1.76s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.04e-5, train/loss_step=0.00175, global_step=5228.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  31%|███▏      | 378/1208 [11:03<24:17,  1.76s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0802, train/loss_vlb_step=0.000267, train/loss_step=0.0802, global_step=5228.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  31%|███▏      | 379/1208 [11:04<24:14,  1.75s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0802, train/loss_vlb_step=0.000267, train/loss_step=0.0802, global_step=5228.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  31%|███▏      | 379/1208 [11:04<24:14,  1.75s/it, loss=0.172, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00165, train/loss_step=0.290, global_step=5228.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  31%|███▏      | 380/1208 [11:08<24:15,  1.76s/it, loss=0.172, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00165, train/loss_step=0.290, global_step=5228.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  31%|███▏      | 380/1208 [11:08<24:15,  1.76s/it, loss=0.182, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00167, train/loss_step=0.274, global_step=5228.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  32%|███▏      | 381/1208 [11:09<24:12,  1.76s/it, loss=0.182, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00167, train/loss_step=0.274, global_step=5228.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  32%|███▏      | 381/1208 [11:09<24:12,  1.76s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0305, train/loss_vlb_step=0.000116, train/loss_step=0.0305, global_step=5229.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  32%|███▏      | 382/1208 [11:10<24:08,  1.75s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0305, train/loss_vlb_step=0.000116, train/loss_step=0.0305, global_step=5229.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  32%|███▏      | 382/1208 [11:10<24:08,  1.75s/it, loss=0.153, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00147, train/loss_step=0.333, global_step=5229.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  32%|███▏      | 383/1208 [11:11<24:05,  1.75s/it, loss=0.153, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00147, train/loss_step=0.333, global_step=5229.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  32%|███▏      | 383/1208 [11:11<24:05,  1.75s/it, loss=0.146, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000976, train/loss_step=0.250, global_step=5229.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  32%|███▏      | 384/1208 [11:14<24:07,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000976, train/loss_step=0.250, global_step=5229.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  32%|███▏      | 384/1208 [11:14<24:07,  1.76s/it, loss=0.142, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000468, train/loss_step=0.138, global_step=5229.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  32%|███▏      | 385/1208 [11:15<24:03,  1.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000468, train/loss_step=0.138, global_step=5229.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  32%|███▏      | 385/1208 [11:15<24:03,  1.75s/it, loss=0.145, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00151, train/loss_step=0.292, global_step=5230.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  32%|███▏      | 386/1208 [11:16<24:00,  1.75s/it, loss=0.145, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00151, train/loss_step=0.292, global_step=5230.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  32%|███▏      | 386/1208 [11:16<24:00,  1.75s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0804, train/loss_vlb_step=0.00027, train/loss_step=0.0804, global_step=5230.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  32%|███▏      | 387/1208 [11:17<23:57,  1.75s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0804, train/loss_vlb_step=0.00027, train/loss_step=0.0804, global_step=5230.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  32%|███▏      | 387/1208 [11:17<23:57,  1.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.00065, train/loss_step=0.181, global_step=5230.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  32%|███▏      | 388/1208 [11:20<23:58,  1.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.00065, train/loss_step=0.181, global_step=5230.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  32%|███▏      | 388/1208 [11:20<23:58,  1.75s/it, loss=0.182, v_num=0, train/loss_simple_step=0.700, train/loss_vlb_step=0.0401, train/loss_step=0.700, global_step=5230.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  32%|███▏      | 389/1208 [11:21<23:55,  1.75s/it, loss=0.182, v_num=0, train/loss_simple_step=0.700, train/loss_vlb_step=0.0401, train/loss_step=0.700, global_step=5230.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  32%|███▏      | 389/1208 [11:21<23:55,  1.75s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000139, train/loss_step=0.0378, global_step=5231.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  32%|███▏      | 390/1208 [11:22<23:52,  1.75s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000139, train/loss_step=0.0378, global_step=5231.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  32%|███▏      | 390/1208 [11:22<23:52,  1.75s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00528, train/loss_vlb_step=2.71e-5, train/loss_step=0.00528, global_step=5231.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  32%|███▏      | 391/1208 [11:23<23:49,  1.75s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00528, train/loss_vlb_step=2.71e-5, train/loss_step=0.00528, global_step=5231.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  32%|███▏      | 391/1208 [11:23<23:49,  1.75s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0627, train/loss_vlb_step=0.00022, train/loss_step=0.0627, global_step=5231.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  32%|███▏      | 392/1208 [11:27<23:50,  1.75s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0627, train/loss_vlb_step=0.00022, train/loss_step=0.0627, global_step=5231.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  32%|███▏      | 392/1208 [11:27<23:50,  1.75s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00508, train/loss_vlb_step=2.63e-5, train/loss_step=0.00508, global_step=5231.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  33%|███▎      | 393/1208 [11:28<23:47,  1.75s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00508, train/loss_vlb_step=2.63e-5, train/loss_step=0.00508, global_step=5231.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  33%|███▎      | 393/1208 [11:28<23:47,  1.75s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000114, train/loss_step=0.0306, global_step=5232.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  33%|███▎      | 394/1208 [11:29<23:44,  1.75s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000114, train/loss_step=0.0306, global_step=5232.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  33%|███▎      | 394/1208 [11:29<23:44,  1.75s/it, loss=0.171, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000793, train/loss_step=0.213, global_step=5232.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  33%|███▎      | 395/1208 [11:30<23:40,  1.75s/it, loss=0.171, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000793, train/loss_step=0.213, global_step=5232.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  33%|███▎      | 395/1208 [11:30<23:40,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00476, train/loss_vlb_step=2.55e-5, train/loss_step=0.00476, global_step=5232.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  33%|███▎      | 396/1208 [11:33<23:42,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00476, train/loss_vlb_step=2.55e-5, train/loss_step=0.00476, global_step=5232.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  33%|███▎      | 396/1208 [11:33<23:42,  1.75s/it, loss=0.172, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00302, train/loss_step=0.428, global_step=5232.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  33%|███▎      | 397/1208 [11:34<23:38,  1.75s/it, loss=0.172, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00302, train/loss_step=0.428, global_step=5232.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  33%|███▎      | 397/1208 [11:34<23:38,  1.75s/it, loss=0.195, v_num=0, train/loss_simple_step=0.465, train/loss_vlb_step=0.0056, train/loss_step=0.465, global_step=5233.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  33%|███▎      | 398/1208 [11:35<23:35,  1.75s/it, loss=0.195, v_num=0, train/loss_simple_step=0.465, train/loss_vlb_step=0.0056, train/loss_step=0.465, global_step=5233.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  33%|███▎      | 398/1208 [11:35<23:35,  1.75s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.8e-5, train/loss_step=0.0191, global_step=5233.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  33%|███▎      | 399/1208 [11:36<23:32,  1.75s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.8e-5, train/loss_step=0.0191, global_step=5233.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  33%|███▎      | 399/1208 [11:36<23:32,  1.75s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0658, train/loss_vlb_step=0.000223, train/loss_step=0.0658, global_step=5233.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  33%|███▎      | 400/1208 [11:39<23:33,  1.75s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0658, train/loss_vlb_step=0.000223, train/loss_step=0.0658, global_step=5233.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  33%|███▎      | 400/1208 [11:39<23:33,  1.75s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00437, train/loss_vlb_step=2.33e-5, train/loss_step=0.00437, global_step=5233.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  33%|███▎      | 401/1208 [11:41<23:30,  1.75s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00437, train/loss_vlb_step=2.33e-5, train/loss_step=0.00437, global_step=5233.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  33%|███▎      | 401/1208 [11:41<23:30,  1.75s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000121, train/loss_step=0.0309, global_step=5234.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  33%|███▎      | 402/1208 [11:42<23:27,  1.75s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000121, train/loss_step=0.0309, global_step=5234.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  33%|███▎      | 402/1208 [11:42<23:27,  1.75s/it, loss=0.157, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000401, train/loss_step=0.122, global_step=5234.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  33%|███▎      | 403/1208 [11:43<23:24,  1.74s/it, loss=0.157, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000401, train/loss_step=0.122, global_step=5234.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  33%|███▎      | 403/1208 [11:43<23:24,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.00084, train/loss_step=0.224, global_step=5234.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  33%|███▎      | 404/1208 [11:46<23:25,  1.75s/it, loss=0.155, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.00084, train/loss_step=0.224, global_step=5234.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  33%|███▎      | 404/1208 [11:46<23:25,  1.75s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00377, train/loss_vlb_step=2.04e-5, train/loss_step=0.00377, global_step=5234.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  34%|███▎      | 405/1208 [11:47<23:22,  1.75s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00377, train/loss_vlb_step=2.04e-5, train/loss_step=0.00377, global_step=5234.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  34%|███▎      | 405/1208 [11:47<23:22,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0872, train/loss_vlb_step=0.000288, train/loss_step=0.0872, global_step=5235.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  34%|███▎      | 406/1208 [11:48<23:19,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0872, train/loss_vlb_step=0.000288, train/loss_step=0.0872, global_step=5235.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  34%|███▎      | 406/1208 [11:48<23:19,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0794, train/loss_vlb_step=0.000266, train/loss_step=0.0794, global_step=5235.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  34%|███▎      | 407/1208 [11:49<23:16,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0794, train/loss_vlb_step=0.000266, train/loss_step=0.0794, global_step=5235.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  34%|███▎      | 407/1208 [11:49<23:16,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00112, train/loss_step=0.256, global_step=5235.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  34%|███▍      | 408/1208 [11:52<23:17,  1.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00112, train/loss_step=0.256, global_step=5235.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  34%|███▍      | 408/1208 [11:52<23:17,  1.75s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.42e-5, train/loss_step=0.00475, global_step=5235.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  34%|███▍      | 409/1208 [11:53<23:14,  1.75s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.42e-5, train/loss_step=0.00475, global_step=5235.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  34%|███▍      | 409/1208 [11:53<23:14,  1.75s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=2.02e-5, train/loss_step=0.0036, global_step=5236.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  34%|███▍      | 410/1208 [11:54<23:11,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=2.02e-5, train/loss_step=0.0036, global_step=5236.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  34%|███▍      | 410/1208 [11:54<23:11,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000751, train/loss_step=0.200, global_step=5236.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  34%|███▍      | 411/1208 [11:55<23:08,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000751, train/loss_step=0.200, global_step=5236.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  34%|███▍      | 411/1208 [11:55<23:08,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00346, train/loss_vlb_step=1.96e-5, train/loss_step=0.00346, global_step=5236.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  34%|███▍      | 412/1208 [11:59<23:09,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00346, train/loss_vlb_step=1.96e-5, train/loss_step=0.00346, global_step=5236.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  34%|███▍      | 412/1208 [11:59<23:09,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0948, train/loss_vlb_step=0.000311, train/loss_step=0.0948, global_step=5236.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  34%|███▍      | 413/1208 [12:00<23:06,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0948, train/loss_vlb_step=0.000311, train/loss_step=0.0948, global_step=5236.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  34%|███▍      | 413/1208 [12:00<23:06,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000596, train/loss_step=0.173, global_step=5237.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  34%|███▍      | 414/1208 [12:01<23:03,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000596, train/loss_step=0.173, global_step=5237.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  34%|███▍      | 414/1208 [12:01<23:03,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000122, train/loss_step=0.0311, global_step=5237.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  34%|███▍      | 415/1208 [12:02<22:59,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000122, train/loss_step=0.0311, global_step=5237.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  34%|███▍      | 415/1208 [12:02<22:59,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=1.97e-5, train/loss_step=0.00366, global_step=5237.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  34%|███▍      | 416/1208 [12:05<23:01,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=1.97e-5, train/loss_step=0.00366, global_step=5237.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  34%|███▍      | 416/1208 [12:05<23:01,  1.74s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.0642, train/loss_vlb_step=0.000219, train/loss_step=0.0642, global_step=5237.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  35%|███▍      | 417/1208 [12:06<22:57,  1.74s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.0642, train/loss_vlb_step=0.000219, train/loss_step=0.0642, global_step=5237.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  35%|███▍      | 417/1208 [12:06<22:57,  1.74s/it, loss=0.0736, v_num=0, train/loss_simple_step=0.00169, train/loss_vlb_step=1.02e-5, train/loss_step=0.00169, global_step=5238.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  35%|███▍      | 418/1208 [12:07<22:54,  1.74s/it, loss=0.0736, v_num=0, train/loss_simple_step=0.00169, train/loss_vlb_step=1.02e-5, train/loss_step=0.00169, global_step=5238.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  35%|███▍      | 418/1208 [12:07<22:54,  1.74s/it, loss=0.0727, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.25e-5, train/loss_step=0.00205, global_step=5238.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  35%|███▍      | 419/1208 [12:08<22:51,  1.74s/it, loss=0.0727, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.25e-5, train/loss_step=0.00205, global_step=5238.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  35%|███▍      | 419/1208 [12:08<22:51,  1.74s/it, loss=0.0788, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000695, train/loss_step=0.187, global_step=5238.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  35%|███▍      | 420/1208 [12:11<22:52,  1.74s/it, loss=0.0788, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000695, train/loss_step=0.187, global_step=5238.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  35%|███▍      | 420/1208 [12:11<22:52,  1.74s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00101, train/loss_step=0.258, global_step=5238.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  35%|███▍      | 421/1208 [12:12<22:49,  1.74s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00101, train/loss_step=0.258, global_step=5238.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  35%|███▍      | 421/1208 [12:12<22:49,  1.74s/it, loss=0.0901, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.22e-5, train/loss_step=0.00409, global_step=5239.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  35%|███▍      | 422/1208 [12:13<22:46,  1.74s/it, loss=0.0901, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.22e-5, train/loss_step=0.00409, global_step=5239.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  35%|███▍      | 422/1208 [12:13<22:46,  1.74s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.68e-5, train/loss_step=0.0236, global_step=5239.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  35%|███▌      | 423/1208 [12:14<22:43,  1.74s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.68e-5, train/loss_step=0.0236, global_step=5239.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  35%|███▌      | 423/1208 [12:14<22:43,  1.74s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00144, train/loss_step=0.317, global_step=5239.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  35%|███▌      | 424/1208 [12:18<22:44,  1.74s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00144, train/loss_step=0.317, global_step=5239.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  35%|███▌      | 424/1208 [12:18<22:44,  1.74s/it, loss=0.092, v_num=0, train/loss_simple_step=0.0469, train/loss_vlb_step=0.000177, train/loss_step=0.0469, global_step=5239.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  35%|███▌      | 425/1208 [12:19<22:41,  1.74s/it, loss=0.092, v_num=0, train/loss_simple_step=0.0469, train/loss_vlb_step=0.000177, train/loss_step=0.0469, global_step=5239.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  35%|███▌      | 425/1208 [12:19<22:41,  1.74s/it, loss=0.088, v_num=0, train/loss_simple_step=0.00748, train/loss_vlb_step=3.61e-5, train/loss_step=0.00748, global_step=5240.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  35%|███▌      | 426/1208 [12:20<22:38,  1.74s/it, loss=0.088, v_num=0, train/loss_simple_step=0.00748, train/loss_vlb_step=3.61e-5, train/loss_step=0.00748, global_step=5240.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  35%|███▌      | 426/1208 [12:20<22:38,  1.74s/it, loss=0.0887, v_num=0, train/loss_simple_step=0.0927, train/loss_vlb_step=0.000308, train/loss_step=0.0927, global_step=5240.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  35%|███▌      | 427/1208 [12:21<22:35,  1.74s/it, loss=0.0887, v_num=0, train/loss_simple_step=0.0927, train/loss_vlb_step=0.000308, train/loss_step=0.0927, global_step=5240.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  35%|███▌      | 427/1208 [12:21<22:35,  1.74s/it, loss=0.0806, v_num=0, train/loss_simple_step=0.0936, train/loss_vlb_step=0.000308, train/loss_step=0.0936, global_step=5240.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  35%|███▌      | 428/1208 [12:24<22:36,  1.74s/it, loss=0.0806, v_num=0, train/loss_simple_step=0.0936, train/loss_vlb_step=0.000308, train/loss_step=0.0936, global_step=5240.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  35%|███▌      | 428/1208 [12:24<22:36,  1.74s/it, loss=0.0809, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.09e-5, train/loss_step=0.0115, global_step=5240.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  36%|███▌      | 429/1208 [12:25<22:33,  1.74s/it, loss=0.0809, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.09e-5, train/loss_step=0.0115, global_step=5240.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  36%|███▌      | 429/1208 [12:25<22:33,  1.74s/it, loss=0.0808, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.08e-5, train/loss_step=0.00182, global_step=5241.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  36%|███▌      | 430/1208 [12:26<22:30,  1.74s/it, loss=0.0808, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.08e-5, train/loss_step=0.00182, global_step=5241.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  36%|███▌      | 430/1208 [12:26<22:30,  1.74s/it, loss=0.082, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000872, train/loss_step=0.223, global_step=5241.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  36%|███▌      | 431/1208 [12:27<22:27,  1.73s/it, loss=0.082, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000872, train/loss_step=0.223, global_step=5241.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  36%|███▌      | 431/1208 [12:27<22:27,  1.73s/it, loss=0.0831, v_num=0, train/loss_simple_step=0.0247, train/loss_vlb_step=9.84e-5, train/loss_step=0.0247, global_step=5241.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  36%|███▌      | 432/1208 [12:30<22:28,  1.74s/it, loss=0.0831, v_num=0, train/loss_simple_step=0.0247, train/loss_vlb_step=9.84e-5, train/loss_step=0.0247, global_step=5241.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  36%|███▌      | 432/1208 [12:30<22:28,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00658, train/loss_step=0.476, global_step=5241.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  36%|███▌      | 433/1208 [12:31<22:25,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00658, train/loss_step=0.476, global_step=5241.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  36%|███▌      | 433/1208 [12:31<22:25,  1.74s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=8.94e-6, train/loss_step=0.0015, global_step=5242.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  36%|███▌      | 434/1208 [12:32<22:22,  1.73s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=8.94e-6, train/loss_step=0.0015, global_step=5242.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  36%|███▌      | 434/1208 [12:32<22:22,  1.73s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.37e-5, train/loss_step=0.0111, global_step=5242.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  36%|███▌      | 435/1208 [12:34<22:19,  1.73s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.37e-5, train/loss_step=0.0111, global_step=5242.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  36%|███▌      | 435/1208 [12:34<22:19,  1.73s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=9.96e-5, train/loss_step=0.0255, global_step=5242.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  36%|███▌      | 436/1208 [12:37<22:20,  1.74s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=9.96e-5, train/loss_step=0.0255, global_step=5242.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  36%|███▌      | 436/1208 [12:37<22:20,  1.74s/it, loss=0.0907, v_num=0, train/loss_simple_step=0.00429, train/loss_vlb_step=2.25e-5, train/loss_step=0.00429, global_step=5242.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  36%|███▌      | 437/1208 [12:38<22:17,  1.74s/it, loss=0.0907, v_num=0, train/loss_simple_step=0.00429, train/loss_vlb_step=2.25e-5, train/loss_step=0.00429, global_step=5242.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  36%|███▌      | 437/1208 [12:38<22:17,  1.74s/it, loss=0.0945, v_num=0, train/loss_simple_step=0.0776, train/loss_vlb_step=0.000255, train/loss_step=0.0776, global_step=5243.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  36%|███▋      | 438/1208 [12:39<22:14,  1.73s/it, loss=0.0945, v_num=0, train/loss_simple_step=0.0776, train/loss_vlb_step=0.000255, train/loss_step=0.0776, global_step=5243.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  36%|███▋      | 438/1208 [12:39<22:14,  1.73s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000133, train/loss_step=0.0367, global_step=5243.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  36%|███▋      | 439/1208 [12:40<22:11,  1.73s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000133, train/loss_step=0.0367, global_step=5243.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  36%|███▋      | 439/1208 [12:40<22:11,  1.73s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000723, train/loss_step=0.188, global_step=5243.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  36%|███▋      | 440/1208 [12:43<22:12,  1.74s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000723, train/loss_step=0.188, global_step=5243.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  36%|███▋      | 440/1208 [12:43<22:12,  1.74s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000148, train/loss_step=0.0409, global_step=5243.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  37%|███▋      | 441/1208 [12:44<22:09,  1.73s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000148, train/loss_step=0.0409, global_step=5243.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  37%|███▋      | 441/1208 [12:44<22:09,  1.73s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.000139, train/loss_step=0.0379, global_step=5244.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  37%|███▋      | 442/1208 [12:45<22:07,  1.73s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.000139, train/loss_step=0.0379, global_step=5244.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  37%|███▋      | 442/1208 [12:45<22:07,  1.73s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000507, train/loss_step=0.152, global_step=5244.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  37%|███▋      | 443/1208 [12:46<22:04,  1.73s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000507, train/loss_step=0.152, global_step=5244.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  37%|███▋      | 443/1208 [12:46<22:04,  1.73s/it, loss=0.0796, v_num=0, train/loss_simple_step=0.0385, train/loss_vlb_step=0.000142, train/loss_step=0.0385, global_step=5244.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  37%|███▋      | 444/1208 [12:49<22:04,  1.73s/it, loss=0.0796, v_num=0, train/loss_simple_step=0.0385, train/loss_vlb_step=0.000142, train/loss_step=0.0385, global_step=5244.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  37%|███▋      | 444/1208 [12:49<22:04,  1.73s/it, loss=0.0775, v_num=0, train/loss_simple_step=0.00493, train/loss_vlb_step=2.6e-5, train/loss_step=0.00493, global_step=5244.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  37%|███▋      | 445/1208 [12:51<22:02,  1.73s/it, loss=0.0775, v_num=0, train/loss_simple_step=0.00493, train/loss_vlb_step=2.6e-5, train/loss_step=0.00493, global_step=5244.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  37%|███▋      | 445/1208 [12:51<22:02,  1.73s/it, loss=0.0785, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000108, train/loss_step=0.0282, global_step=5245.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  37%|███▋      | 446/1208 [12:52<21:59,  1.73s/it, loss=0.0785, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000108, train/loss_step=0.0282, global_step=5245.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  37%|███▋      | 446/1208 [12:52<21:59,  1.73s/it, loss=0.0759, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000156, train/loss_step=0.0416, global_step=5245.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  37%|███▋      | 447/1208 [12:53<21:56,  1.73s/it, loss=0.0759, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000156, train/loss_step=0.0416, global_step=5245.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  37%|███▋      | 447/1208 [12:53<21:56,  1.73s/it, loss=0.0756, v_num=0, train/loss_simple_step=0.0859, train/loss_vlb_step=0.000282, train/loss_step=0.0859, global_step=5245.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  37%|███▋      | 448/1208 [12:56<21:57,  1.73s/it, loss=0.0756, v_num=0, train/loss_simple_step=0.0859, train/loss_vlb_step=0.000282, train/loss_step=0.0859, global_step=5245.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  37%|███▋      | 448/1208 [12:56<21:57,  1.73s/it, loss=0.0792, v_num=0, train/loss_simple_step=0.0846, train/loss_vlb_step=0.00028, train/loss_step=0.0846, global_step=5245.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  37%|███▋      | 449/1208 [12:57<21:54,  1.73s/it, loss=0.0792, v_num=0, train/loss_simple_step=0.0846, train/loss_vlb_step=0.00028, train/loss_step=0.0846, global_step=5245.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  37%|███▋      | 449/1208 [12:57<21:54,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.546, train/loss_vlb_step=0.0097, train/loss_step=0.546, global_step=5246.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  37%|███▋      | 450/1208 [12:58<21:51,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.546, train/loss_vlb_step=0.0097, train/loss_step=0.546, global_step=5246.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  37%|███▋      | 450/1208 [12:58<21:51,  1.73s/it, loss=0.102, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000478, train/loss_step=0.143, global_step=5246.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  37%|███▋      | 451/1208 [12:59<21:48,  1.73s/it, loss=0.102, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000478, train/loss_step=0.143, global_step=5246.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  37%|███▋      | 451/1208 [12:59<21:48,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00338, train/loss_step=0.412, global_step=5246.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  37%|███▋      | 452/1208 [13:02<21:49,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00338, train/loss_step=0.412, global_step=5246.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  37%|███▋      | 452/1208 [13:02<21:49,  1.73s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.00812, train/loss_vlb_step=3.61e-5, train/loss_step=0.00812, global_step=5246.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  38%|███▊      | 453/1208 [13:03<21:46,  1.73s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.00812, train/loss_vlb_step=3.61e-5, train/loss_step=0.00812, global_step=5246.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  38%|███▊      | 453/1208 [13:03<21:46,  1.73s/it, loss=0.104, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000361, train/loss_step=0.109, global_step=5247.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  38%|███▊      | 454/1208 [13:04<21:43,  1.73s/it, loss=0.104, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000361, train/loss_step=0.109, global_step=5247.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  38%|███▊      | 454/1208 [13:04<21:43,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000473, train/loss_step=0.139, global_step=5247.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  38%|███▊      | 455/1208 [13:05<21:40,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000473, train/loss_step=0.139, global_step=5247.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  38%|███▊      | 455/1208 [13:05<21:40,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000451, train/loss_step=0.134, global_step=5247.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  38%|███▊      | 456/1208 [13:09<21:41,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000451, train/loss_step=0.134, global_step=5247.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  38%|███▊      | 456/1208 [13:09<21:41,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00299, train/loss_step=0.391, global_step=5247.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  38%|███▊      | 457/1208 [13:10<21:38,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00299, train/loss_step=0.391, global_step=5247.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  38%|███▊      | 457/1208 [13:10<21:38,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0812, train/loss_vlb_step=0.000267, train/loss_step=0.0812, global_step=5248.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  38%|███▊      | 458/1208 [13:11<21:35,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0812, train/loss_vlb_step=0.000267, train/loss_step=0.0812, global_step=5248.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  38%|███▊      | 458/1208 [13:11<21:35,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=1.55e-5, train/loss_step=0.00262, global_step=5248.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  38%|███▊      | 459/1208 [13:12<21:32,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=1.55e-5, train/loss_step=0.00262, global_step=5248.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  38%|███▊      | 459/1208 [13:12<21:32,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00178, train/loss_step=0.310, global_step=5248.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]     Epoch 17:  38%|███▊      | 460/1208 [13:15<21:33,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00178, train/loss_step=0.310, global_step=5248.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  38%|███▊      | 460/1208 [13:15<21:33,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.6e-5, train/loss_step=0.0121, global_step=5248.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  38%|███▊      | 461/1208 [13:16<21:30,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.6e-5, train/loss_step=0.0121, global_step=5248.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  38%|███▊      | 461/1208 [13:16<21:30,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.00493, train/loss_step=0.460, global_step=5249.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  38%|███▊      | 462/1208 [13:17<21:27,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.00493, train/loss_step=0.460, global_step=5249.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  38%|███▊      | 462/1208 [13:17<21:27,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0954, train/loss_vlb_step=0.000313, train/loss_step=0.0954, global_step=5249.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  38%|███▊      | 463/1208 [13:18<21:25,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0954, train/loss_vlb_step=0.000313, train/loss_step=0.0954, global_step=5249.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  38%|███▊      | 463/1208 [13:18<21:25,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0076, train/loss_vlb_step=3.76e-5, train/loss_step=0.0076, global_step=5249.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  38%|███▊      | 464/1208 [13:21<21:25,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0076, train/loss_vlb_step=3.76e-5, train/loss_step=0.0076, global_step=5249.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  38%|███▊      | 464/1208 [13:21<21:25,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0641, train/loss_vlb_step=0.000222, train/loss_step=0.0641, global_step=5249.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  38%|███▊      | 465/1208 [13:23<21:23,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0641, train/loss_vlb_step=0.000222, train/loss_step=0.0641, global_step=5249.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  38%|███▊      | 465/1208 [13:23<21:23,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.34e-5, train/loss_step=0.0111, global_step=5250.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  39%|███▊      | 466/1208 [13:24<21:20,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.34e-5, train/loss_step=0.0111, global_step=5250.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  39%|███▊      | 466/1208 [13:24<21:20,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.84e-5, train/loss_step=0.0209, global_step=5250.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  39%|███▊      | 467/1208 [13:25<21:17,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.84e-5, train/loss_step=0.0209, global_step=5250.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  39%|███▊      | 467/1208 [13:25<21:17,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0857, train/loss_vlb_step=0.000285, train/loss_step=0.0857, global_step=5250.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  39%|███▊      | 468/1208 [13:28<21:18,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0857, train/loss_vlb_step=0.000285, train/loss_step=0.0857, global_step=5250.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  39%|███▊      | 468/1208 [13:28<21:18,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0549, train/loss_vlb_step=0.000198, train/loss_step=0.0549, global_step=5250.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  39%|███▉      | 469/1208 [13:29<21:15,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0549, train/loss_vlb_step=0.000198, train/loss_step=0.0549, global_step=5250.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  39%|███▉      | 469/1208 [13:29<21:15,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.7e-5, train/loss_step=0.023, global_step=5251.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  39%|███▉      | 470/1208 [13:30<21:12,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.7e-5, train/loss_step=0.023, global_step=5251.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  39%|███▉      | 470/1208 [13:30<21:12,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000374, train/loss_step=0.114, global_step=5251.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  39%|███▉      | 471/1208 [13:31<21:09,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000374, train/loss_step=0.114, global_step=5251.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  39%|███▉      | 471/1208 [13:31<21:09,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000889, train/loss_step=0.239, global_step=5251.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  39%|███▉      | 472/1208 [13:34<21:10,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000889, train/loss_step=0.239, global_step=5251.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  39%|███▉      | 472/1208 [13:34<21:10,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00695, train/loss_step=0.436, global_step=5251.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  39%|███▉      | 473/1208 [13:35<21:07,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00695, train/loss_step=0.436, global_step=5251.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  39%|███▉      | 473/1208 [13:35<21:07,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0807, train/loss_vlb_step=0.000267, train/loss_step=0.0807, global_step=5252.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  39%|███▉      | 474/1208 [13:36<21:04,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0807, train/loss_vlb_step=0.000267, train/loss_step=0.0807, global_step=5252.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  39%|███▉      | 474/1208 [13:36<21:04,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.061, train/loss_vlb_step=0.000215, train/loss_step=0.061, global_step=5252.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  39%|███▉      | 475/1208 [13:37<21:01,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.061, train/loss_vlb_step=0.000215, train/loss_step=0.061, global_step=5252.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  39%|███▉      | 475/1208 [13:37<21:01,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.19e-5, train/loss_step=0.00198, global_step=5252.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  39%|███▉      | 476/1208 [13:41<21:02,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.19e-5, train/loss_step=0.00198, global_step=5252.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  39%|███▉      | 476/1208 [13:41<21:02,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000777, train/loss_step=0.203, global_step=5252.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  39%|███▉      | 477/1208 [13:42<20:59,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000777, train/loss_step=0.203, global_step=5252.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  39%|███▉      | 477/1208 [13:42<20:59,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000115, train/loss_step=0.0299, global_step=5253.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  40%|███▉      | 478/1208 [13:43<20:57,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000115, train/loss_step=0.0299, global_step=5253.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  40%|███▉      | 478/1208 [13:43<20:57,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00338, train/loss_step=0.403, global_step=5253.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  40%|███▉      | 479/1208 [13:44<20:54,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00338, train/loss_step=0.403, global_step=5253.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  40%|███▉      | 479/1208 [13:44<20:54,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.48e-5, train/loss_step=0.0119, global_step=5253.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  40%|███▉      | 480/1208 [13:47<20:54,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.48e-5, train/loss_step=0.0119, global_step=5253.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  40%|███▉      | 480/1208 [13:47<20:54,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000391, train/loss_step=0.118, global_step=5253.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  40%|███▉      | 481/1208 [13:48<20:52,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000391, train/loss_step=0.118, global_step=5253.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  40%|███▉      | 481/1208 [13:48<20:52,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0042, train/loss_vlb_step=2.36e-5, train/loss_step=0.0042, global_step=5254.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  40%|███▉      | 482/1208 [13:49<20:49,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0042, train/loss_vlb_step=2.36e-5, train/loss_step=0.0042, global_step=5254.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  40%|███▉      | 482/1208 [13:49<20:49,  1.72s/it, loss=0.099, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.74e-5, train/loss_step=0.0103, global_step=5254.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  40%|███▉      | 483/1208 [13:50<20:46,  1.72s/it, loss=0.099, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.74e-5, train/loss_step=0.0103, global_step=5254.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  40%|███▉      | 483/1208 [13:50<20:46,  1.72s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=8.02e-5, train/loss_step=0.0191, global_step=5254.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  40%|████      | 484/1208 [13:53<20:47,  1.72s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=8.02e-5, train/loss_step=0.0191, global_step=5254.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  40%|████      | 484/1208 [13:53<20:47,  1.72s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.0644, train/loss_vlb_step=0.000216, train/loss_step=0.0644, global_step=5254.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  40%|████      | 485/1208 [13:54<20:44,  1.72s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.0644, train/loss_vlb_step=0.000216, train/loss_step=0.0644, global_step=5254.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  40%|████      | 485/1208 [13:54<20:44,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.0006, train/loss_step=0.173, global_step=5255.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]     Epoch 17:  40%|████      | 486/1208 [13:55<20:41,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.0006, train/loss_step=0.173, global_step=5255.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  40%|████      | 486/1208 [13:55<20:41,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.2e-5, train/loss_step=0.0166, global_step=5255.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  40%|████      | 487/1208 [13:56<20:39,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.2e-5, train/loss_step=0.0166, global_step=5255.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  40%|████      | 487/1208 [13:56<20:39,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00531, train/loss_vlb_step=2.66e-5, train/loss_step=0.00531, global_step=5255.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  40%|████      | 488/1208 [14:00<20:39,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00531, train/loss_vlb_step=2.66e-5, train/loss_step=0.00531, global_step=5255.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  40%|████      | 488/1208 [14:00<20:39,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00129, train/loss_step=0.292, global_step=5255.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  40%|████      | 489/1208 [14:01<20:36,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00129, train/loss_step=0.292, global_step=5255.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  40%|████      | 489/1208 [14:01<20:36,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000871, train/loss_step=0.216, global_step=5256.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  41%|████      | 490/1208 [14:02<20:34,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000871, train/loss_step=0.216, global_step=5256.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  41%|████      | 490/1208 [14:02<20:34,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0851, train/loss_vlb_step=0.000286, train/loss_step=0.0851, global_step=5256.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  41%|████      | 491/1208 [14:03<20:31,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0851, train/loss_vlb_step=0.000286, train/loss_step=0.0851, global_step=5256.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  41%|████      | 491/1208 [14:03<20:31,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000112, train/loss_step=0.0314, global_step=5256.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  41%|████      | 492/1208 [14:06<20:31,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000112, train/loss_step=0.0314, global_step=5256.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  41%|████      | 492/1208 [14:06<20:31,  1.72s/it, loss=0.0918, v_num=0, train/loss_simple_step=0.00826, train/loss_vlb_step=3.96e-5, train/loss_step=0.00826, global_step=5256.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  41%|████      | 493/1208 [14:07<20:29,  1.72s/it, loss=0.0918, v_num=0, train/loss_simple_step=0.00826, train/loss_vlb_step=3.96e-5, train/loss_step=0.00826, global_step=5256.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  41%|████      | 493/1208 [14:07<20:29,  1.72s/it, loss=0.091, v_num=0, train/loss_simple_step=0.0655, train/loss_vlb_step=0.000222, train/loss_step=0.0655, global_step=5257.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  41%|████      | 494/1208 [14:08<20:26,  1.72s/it, loss=0.091, v_num=0, train/loss_simple_step=0.0655, train/loss_vlb_step=0.000222, train/loss_step=0.0655, global_step=5257.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  41%|████      | 494/1208 [14:08<20:26,  1.72s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000487, train/loss_step=0.148, global_step=5257.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  41%|████      | 495/1208 [14:09<20:23,  1.72s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000487, train/loss_step=0.148, global_step=5257.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  41%|████      | 495/1208 [14:09<20:23,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000658, train/loss_step=0.181, global_step=5257.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  41%|████      | 496/1208 [14:12<20:24,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000658, train/loss_step=0.181, global_step=5257.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  41%|████      | 496/1208 [14:12<20:24,  1.72s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=3.71e-5, train/loss_step=0.00783, global_step=5257.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  41%|████      | 497/1208 [14:13<20:21,  1.72s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=3.71e-5, train/loss_step=0.00783, global_step=5257.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  41%|████      | 497/1208 [14:13<20:21,  1.72s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000451, train/loss_step=0.135, global_step=5258.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  41%|████      | 498/1208 [14:15<20:19,  1.72s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000451, train/loss_step=0.135, global_step=5258.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  41%|████      | 498/1208 [14:15<20:19,  1.72s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000374, train/loss_step=0.114, global_step=5258.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  41%|████▏     | 499/1208 [14:16<20:16,  1.72s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000374, train/loss_step=0.114, global_step=5258.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  41%|████▏     | 499/1208 [14:16<20:16,  1.72s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.0828, train/loss_vlb_step=0.000275, train/loss_step=0.0828, global_step=5258.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  41%|████▏     | 500/1208 [14:19<20:16,  1.72s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.0828, train/loss_vlb_step=0.000275, train/loss_step=0.0828, global_step=5258.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  41%|████▏     | 500/1208 [14:19<20:16,  1.72s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.0012, train/loss_step=0.292, global_step=5258.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  41%|████▏     | 501/1208 [14:20<20:14,  1.72s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.0012, train/loss_step=0.292, global_step=5258.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  41%|████▏     | 501/1208 [14:20<20:14,  1.72s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=2.18e-5, train/loss_step=0.00416, global_step=5259.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  42%|████▏     | 502/1208 [14:21<20:11,  1.72s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=2.18e-5, train/loss_step=0.00416, global_step=5259.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  42%|████▏     | 502/1208 [14:21<20:11,  1.72s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000101, train/loss_step=0.0253, global_step=5259.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  42%|████▏     | 503/1208 [14:22<20:08,  1.71s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000101, train/loss_step=0.0253, global_step=5259.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  42%|████▏     | 503/1208 [14:22<20:08,  1.71s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000107, train/loss_step=0.0266, global_step=5259.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  42%|████▏     | 504/1208 [14:25<20:09,  1.72s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000107, train/loss_step=0.0266, global_step=5259.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  42%|████▏     | 504/1208 [14:25<20:09,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000338, train/loss_step=0.103, global_step=5259.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  42%|████▏     | 505/1208 [14:26<20:06,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000338, train/loss_step=0.103, global_step=5259.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  42%|████▏     | 505/1208 [14:26<20:06,  1.72s/it, loss=0.0927, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.4e-5, train/loss_step=0.0145, global_step=5260.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  42%|████▏     | 506/1208 [14:27<20:03,  1.71s/it, loss=0.0927, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.4e-5, train/loss_step=0.0145, global_step=5260.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  42%|████▏     | 506/1208 [14:27<20:03,  1.71s/it, loss=0.097, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=5260.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  42%|████▏     | 507/1208 [14:28<20:01,  1.71s/it, loss=0.097, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=5260.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  42%|████▏     | 507/1208 [14:28<20:01,  1.71s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000111, train/loss_step=0.029, global_step=5260.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  42%|████▏     | 508/1208 [14:32<20:01,  1.72s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000111, train/loss_step=0.029, global_step=5260.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  42%|████▏     | 508/1208 [14:32<20:01,  1.72s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.00287, train/loss_vlb_step=1.63e-5, train/loss_step=0.00287, global_step=5260.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  42%|████▏     | 509/1208 [14:33<19:59,  1.72s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.00287, train/loss_vlb_step=1.63e-5, train/loss_step=0.00287, global_step=5260.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  42%|████▏     | 509/1208 [14:33<19:59,  1.72s/it, loss=0.0734, v_num=0, train/loss_simple_step=0.00988, train/loss_vlb_step=4.71e-5, train/loss_step=0.00988, global_step=5261.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  42%|████▏     | 510/1208 [14:34<19:56,  1.71s/it, loss=0.0734, v_num=0, train/loss_simple_step=0.00988, train/loss_vlb_step=4.71e-5, train/loss_step=0.00988, global_step=5261.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  42%|████▏     | 510/1208 [14:34<19:56,  1.71s/it, loss=0.0754, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000413, train/loss_step=0.124, global_step=5261.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  42%|████▏     | 511/1208 [14:35<19:53,  1.71s/it, loss=0.0754, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000413, train/loss_step=0.124, global_step=5261.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  42%|████▏     | 511/1208 [14:35<19:53,  1.71s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000769, train/loss_step=0.209, global_step=5261.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  42%|████▏     | 512/1208 [14:38<19:54,  1.72s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000769, train/loss_step=0.209, global_step=5261.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  42%|████▏     | 512/1208 [14:38<19:54,  1.72s/it, loss=0.0858, v_num=0, train/loss_simple_step=0.0385, train/loss_vlb_step=0.000144, train/loss_step=0.0385, global_step=5261.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  42%|████▏     | 513/1208 [14:39<19:51,  1.71s/it, loss=0.0858, v_num=0, train/loss_simple_step=0.0385, train/loss_vlb_step=0.000144, train/loss_step=0.0385, global_step=5261.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  42%|████▏     | 513/1208 [14:39<19:51,  1.71s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.0996, train/loss_vlb_step=0.000327, train/loss_step=0.0996, global_step=5262.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  43%|████▎     | 514/1208 [14:40<19:48,  1.71s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.0996, train/loss_vlb_step=0.000327, train/loss_step=0.0996, global_step=5262.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  43%|████▎     | 514/1208 [14:40<19:48,  1.71s/it, loss=0.0807, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=6.08e-5, train/loss_step=0.0132, global_step=5262.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  43%|████▎     | 515/1208 [14:41<19:46,  1.71s/it, loss=0.0807, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=6.08e-5, train/loss_step=0.0132, global_step=5262.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  43%|████▎     | 515/1208 [14:41<19:46,  1.71s/it, loss=0.0719, v_num=0, train/loss_simple_step=0.00513, train/loss_vlb_step=2.73e-5, train/loss_step=0.00513, global_step=5262.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  43%|████▎     | 516/1208 [14:44<19:46,  1.71s/it, loss=0.0719, v_num=0, train/loss_simple_step=0.00513, train/loss_vlb_step=2.73e-5, train/loss_step=0.00513, global_step=5262.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  43%|████▎     | 516/1208 [14:44<19:46,  1.71s/it, loss=0.0729, v_num=0, train/loss_simple_step=0.0271, train/loss_vlb_step=0.000105, train/loss_step=0.0271, global_step=5262.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  43%|████▎     | 517/1208 [14:45<19:44,  1.71s/it, loss=0.0729, v_num=0, train/loss_simple_step=0.0271, train/loss_vlb_step=0.000105, train/loss_step=0.0271, global_step=5262.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  43%|████▎     | 517/1208 [14:45<19:44,  1.71s/it, loss=0.0872, v_num=0, train/loss_simple_step=0.421, train/loss_vlb_step=0.00431, train/loss_step=0.421, global_step=5263.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  43%|████▎     | 518/1208 [14:46<19:41,  1.71s/it, loss=0.0872, v_num=0, train/loss_simple_step=0.421, train/loss_vlb_step=0.00431, train/loss_step=0.421, global_step=5263.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  43%|████▎     | 518/1208 [14:46<19:41,  1.71s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.040, train/loss_vlb_step=0.000147, train/loss_step=0.040, global_step=5263.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  43%|████▎     | 519/1208 [14:47<19:38,  1.71s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.040, train/loss_vlb_step=0.000147, train/loss_step=0.040, global_step=5263.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  43%|████▎     | 519/1208 [14:47<19:38,  1.71s/it, loss=0.0803, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=7.72e-5, train/loss_step=0.0194, global_step=5263.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  43%|████▎     | 520/1208 [14:51<19:39,  1.71s/it, loss=0.0803, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=7.72e-5, train/loss_step=0.0194, global_step=5263.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  43%|████▎     | 520/1208 [14:51<19:39,  1.71s/it, loss=0.0676, v_num=0, train/loss_simple_step=0.0382, train/loss_vlb_step=0.00014, train/loss_step=0.0382, global_step=5263.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  43%|████▎     | 521/1208 [14:52<19:36,  1.71s/it, loss=0.0676, v_num=0, train/loss_simple_step=0.0382, train/loss_vlb_step=0.00014, train/loss_step=0.0382, global_step=5263.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  43%|████▎     | 521/1208 [14:52<19:36,  1.71s/it, loss=0.0692, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000132, train/loss_step=0.0358, global_step=5264.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  43%|████▎     | 522/1208 [14:53<19:33,  1.71s/it, loss=0.0692, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000132, train/loss_step=0.0358, global_step=5264.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  43%|████▎     | 522/1208 [14:53<19:33,  1.71s/it, loss=0.0683, v_num=0, train/loss_simple_step=0.00786, train/loss_vlb_step=3.76e-5, train/loss_step=0.00786, global_step=5264.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  43%|████▎     | 523/1208 [14:54<19:31,  1.71s/it, loss=0.0683, v_num=0, train/loss_simple_step=0.00786, train/loss_vlb_step=3.76e-5, train/loss_step=0.00786, global_step=5264.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  43%|████▎     | 523/1208 [14:54<19:31,  1.71s/it, loss=0.0701, v_num=0, train/loss_simple_step=0.0611, train/loss_vlb_step=0.000215, train/loss_step=0.0611, global_step=5264.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  43%|████▎     | 524/1208 [14:57<19:31,  1.71s/it, loss=0.0701, v_num=0, train/loss_simple_step=0.0611, train/loss_vlb_step=0.000215, train/loss_step=0.0611, global_step=5264.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  43%|████▎     | 524/1208 [14:57<19:31,  1.71s/it, loss=0.0664, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000108, train/loss_step=0.0293, global_step=5264.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  43%|████▎     | 525/1208 [14:58<19:29,  1.71s/it, loss=0.0664, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000108, train/loss_step=0.0293, global_step=5264.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  43%|████▎     | 525/1208 [14:58<19:29,  1.71s/it, loss=0.0698, v_num=0, train/loss_simple_step=0.083, train/loss_vlb_step=0.000276, train/loss_step=0.083, global_step=5265.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  44%|████▎     | 526/1208 [14:59<19:26,  1.71s/it, loss=0.0698, v_num=0, train/loss_simple_step=0.083, train/loss_vlb_step=0.000276, train/loss_step=0.083, global_step=5265.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  44%|████▎     | 526/1208 [14:59<19:26,  1.71s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00311, train/loss_step=0.402, global_step=5265.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  44%|████▎     | 527/1208 [15:00<19:23,  1.71s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00311, train/loss_step=0.402, global_step=5265.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  44%|████▎     | 527/1208 [15:00<19:23,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00405, train/loss_step=0.499, global_step=5265.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  44%|████▎     | 528/1208 [15:03<19:24,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00405, train/loss_step=0.499, global_step=5265.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  44%|████▎     | 528/1208 [15:03<19:24,  1.71s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0809, train/loss_vlb_step=0.000272, train/loss_step=0.0809, global_step=5265.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  44%|████▍     | 529/1208 [15:05<19:21,  1.71s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0809, train/loss_vlb_step=0.000272, train/loss_step=0.0809, global_step=5265.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  44%|████▍     | 529/1208 [15:05<19:21,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.00816, train/loss_step=0.512, global_step=5266.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  44%|████▍     | 530/1208 [15:06<19:19,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.00816, train/loss_step=0.512, global_step=5266.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  44%|████▍     | 530/1208 [15:06<19:19,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0652, train/loss_vlb_step=0.000218, train/loss_step=0.0652, global_step=5266.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  44%|████▍     | 531/1208 [15:07<19:16,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0652, train/loss_vlb_step=0.000218, train/loss_step=0.0652, global_step=5266.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  44%|████▍     | 531/1208 [15:07<19:16,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.67e-5, train/loss_step=0.0182, global_step=5266.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  44%|████▍     | 532/1208 [15:10<19:16,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.67e-5, train/loss_step=0.0182, global_step=5266.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  44%|████▍     | 532/1208 [15:10<19:16,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.27e-5, train/loss_step=0.0022, global_step=5266.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  44%|████▍     | 533/1208 [15:11<19:14,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.27e-5, train/loss_step=0.0022, global_step=5266.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  44%|████▍     | 533/1208 [15:11<19:14,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=2.46e-5, train/loss_step=0.00448, global_step=5267.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  44%|████▍     | 534/1208 [15:12<19:11,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=2.46e-5, train/loss_step=0.00448, global_step=5267.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  44%|████▍     | 534/1208 [15:12<19:11,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.47e-5, train/loss_step=0.0236, global_step=5267.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  44%|████▍     | 535/1208 [15:13<19:09,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.47e-5, train/loss_step=0.0236, global_step=5267.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  44%|████▍     | 535/1208 [15:13<19:09,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.22e-5, train/loss_step=0.00409, global_step=5267.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  44%|████▍     | 536/1208 [15:16<19:09,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.22e-5, train/loss_step=0.00409, global_step=5267.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  44%|████▍     | 536/1208 [15:16<19:09,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0612, train/loss_vlb_step=0.000208, train/loss_step=0.0612, global_step=5267.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  44%|████▍     | 537/1208 [15:17<19:06,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0612, train/loss_vlb_step=0.000208, train/loss_step=0.0612, global_step=5267.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  44%|████▍     | 537/1208 [15:17<19:06,  1.71s/it, loss=0.0997, v_num=0, train/loss_simple_step=0.00623, train/loss_vlb_step=3.12e-5, train/loss_step=0.00623, global_step=5268.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  45%|████▍     | 538/1208 [15:18<19:04,  1.71s/it, loss=0.0997, v_num=0, train/loss_simple_step=0.00623, train/loss_vlb_step=3.12e-5, train/loss_step=0.00623, global_step=5268.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  45%|████▍     | 538/1208 [15:18<19:04,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000784, train/loss_step=0.219, global_step=5268.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  45%|████▍     | 539/1208 [15:19<19:01,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000784, train/loss_step=0.219, global_step=5268.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  45%|████▍     | 539/1208 [15:19<19:01,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.2e-5, train/loss_step=0.00204, global_step=5268.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  45%|████▍     | 540/1208 [15:23<19:02,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.2e-5, train/loss_step=0.00204, global_step=5268.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  45%|████▍     | 540/1208 [15:23<19:02,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.007, train/loss_vlb_step=3.38e-5, train/loss_step=0.007, global_step=5268.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  45%|████▍     | 541/1208 [15:24<18:59,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.007, train/loss_vlb_step=3.38e-5, train/loss_step=0.007, global_step=5268.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  45%|████▍     | 541/1208 [15:24<18:59,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.060, train/loss_vlb_step=0.000211, train/loss_step=0.060, global_step=5269.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  45%|████▍     | 542/1208 [15:25<18:56,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.060, train/loss_vlb_step=0.000211, train/loss_step=0.060, global_step=5269.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  45%|████▍     | 542/1208 [15:25<18:56,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0377, train/loss_vlb_step=0.00014, train/loss_step=0.0377, global_step=5269.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  45%|████▍     | 543/1208 [15:26<18:54,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0377, train/loss_vlb_step=0.00014, train/loss_step=0.0377, global_step=5269.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  45%|████▍     | 543/1208 [15:26<18:54,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.93e-5, train/loss_step=0.0243, global_step=5269.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  45%|████▌     | 544/1208 [15:29<18:54,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.93e-5, train/loss_step=0.0243, global_step=5269.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  45%|████▌     | 544/1208 [15:29<18:54,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0611, train/loss_vlb_step=0.000205, train/loss_step=0.0611, global_step=5269.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  45%|████▌     | 545/1208 [15:30<18:51,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0611, train/loss_vlb_step=0.000205, train/loss_step=0.0611, global_step=5269.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  45%|████▌     | 545/1208 [15:30<18:51,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0504, train/loss_vlb_step=0.000175, train/loss_step=0.0504, global_step=5270.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  45%|████▌     | 546/1208 [15:31<18:49,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0504, train/loss_vlb_step=0.000175, train/loss_step=0.0504, global_step=5270.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  45%|████▌     | 546/1208 [15:31<18:49,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00202, train/loss_step=0.320, global_step=5270.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  45%|████▌     | 547/1208 [15:32<18:46,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00202, train/loss_step=0.320, global_step=5270.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  45%|████▌     | 547/1208 [15:32<18:46,  1.70s/it, loss=0.0867, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000635, train/loss_step=0.175, global_step=5270.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  45%|████▌     | 548/1208 [15:35<18:46,  1.71s/it, loss=0.0867, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000635, train/loss_step=0.175, global_step=5270.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  45%|████▌     | 548/1208 [15:35<18:46,  1.71s/it, loss=0.0867, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.000269, train/loss_step=0.0817, global_step=5270.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  45%|████▌     | 549/1208 [15:36<18:44,  1.71s/it, loss=0.0867, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.000269, train/loss_step=0.0817, global_step=5270.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  45%|████▌     | 549/1208 [15:36<18:44,  1.71s/it, loss=0.0634, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.000167, train/loss_step=0.0456, global_step=5271.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  46%|████▌     | 550/1208 [15:37<18:41,  1.70s/it, loss=0.0634, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.000167, train/loss_step=0.0456, global_step=5271.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  46%|████▌     | 550/1208 [15:37<18:41,  1.70s/it, loss=0.0651, v_num=0, train/loss_simple_step=0.0996, train/loss_vlb_step=0.000329, train/loss_step=0.0996, global_step=5271.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  46%|████▌     | 551/1208 [15:38<18:39,  1.70s/it, loss=0.0651, v_num=0, train/loss_simple_step=0.0996, train/loss_vlb_step=0.000329, train/loss_step=0.0996, global_step=5271.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  46%|████▌     | 551/1208 [15:38<18:39,  1.70s/it, loss=0.0741, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000756, train/loss_step=0.198, global_step=5271.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  46%|████▌     | 552/1208 [15:41<18:39,  1.71s/it, loss=0.0741, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000756, train/loss_step=0.198, global_step=5271.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  46%|████▌     | 552/1208 [15:41<18:39,  1.71s/it, loss=0.0741, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.55e-5, train/loss_step=0.0028, global_step=5271.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  46%|████▌     | 553/1208 [15:42<18:36,  1.71s/it, loss=0.0741, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.55e-5, train/loss_step=0.0028, global_step=5271.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  46%|████▌     | 553/1208 [15:42<18:36,  1.71s/it, loss=0.0742, v_num=0, train/loss_simple_step=0.00468, train/loss_vlb_step=2.41e-5, train/loss_step=0.00468, global_step=5272.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  46%|████▌     | 554/1208 [15:43<18:34,  1.70s/it, loss=0.0742, v_num=0, train/loss_simple_step=0.00468, train/loss_vlb_step=2.41e-5, train/loss_step=0.00468, global_step=5272.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  46%|████▌     | 554/1208 [15:43<18:34,  1.70s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00229, train/loss_step=0.390, global_step=5272.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  46%|████▌     | 555/1208 [15:45<18:31,  1.70s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00229, train/loss_step=0.390, global_step=5272.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  46%|████▌     | 555/1208 [15:45<18:31,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00309, train/loss_step=0.388, global_step=5272.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  46%|████▌     | 556/1208 [15:48<18:32,  1.71s/it, loss=0.112, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00309, train/loss_step=0.388, global_step=5272.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  46%|████▌     | 556/1208 [15:48<18:32,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.600, train/loss_vlb_step=0.014, train/loss_step=0.600, global_step=5272.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  46%|████▌     | 557/1208 [15:49<18:29,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.600, train/loss_vlb_step=0.014, train/loss_step=0.600, global_step=5272.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  46%|████▌     | 557/1208 [15:49<18:29,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.00056, train/loss_step=0.166, global_step=5273.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  46%|████▌     | 558/1208 [15:50<18:27,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.00056, train/loss_step=0.166, global_step=5273.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  46%|████▌     | 558/1208 [15:50<18:27,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000126, train/loss_step=0.0325, global_step=5273.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  46%|████▋     | 559/1208 [15:51<18:24,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000126, train/loss_step=0.0325, global_step=5273.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  46%|████▋     | 559/1208 [15:51<18:24,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000447, train/loss_step=0.134, global_step=5273.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  46%|████▋     | 560/1208 [15:54<18:24,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000447, train/loss_step=0.134, global_step=5273.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  46%|████▋     | 560/1208 [15:54<18:24,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00315, train/loss_step=0.355, global_step=5273.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  46%|████▋     | 561/1208 [15:55<18:22,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00315, train/loss_step=0.355, global_step=5273.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  46%|████▋     | 561/1208 [15:55<18:22,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00825, train/loss_vlb_step=3.95e-5, train/loss_step=0.00825, global_step=5274.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  47%|████▋     | 562/1208 [15:56<18:19,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00825, train/loss_vlb_step=3.95e-5, train/loss_step=0.00825, global_step=5274.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  47%|████▋     | 562/1208 [15:56<18:19,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.69e-5, train/loss_step=0.0105, global_step=5274.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  47%|████▋     | 563/1208 [15:57<18:17,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.69e-5, train/loss_step=0.0105, global_step=5274.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  47%|████▋     | 563/1208 [15:57<18:17,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.0009, train/loss_step=0.232, global_step=5274.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  47%|████▋     | 564/1208 [16:01<18:17,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.0009, train/loss_step=0.232, global_step=5274.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  47%|████▋     | 564/1208 [16:01<18:17,  1.70s/it, loss=0.179, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00123, train/loss_step=0.281, global_step=5274.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  47%|████▋     | 565/1208 [16:02<18:15,  1.70s/it, loss=0.179, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00123, train/loss_step=0.281, global_step=5274.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  47%|████▋     | 565/1208 [16:02<18:15,  1.70s/it, loss=0.214, v_num=0, train/loss_simple_step=0.747, train/loss_vlb_step=0.0637, train/loss_step=0.747, global_step=5275.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  47%|████▋     | 566/1208 [16:03<18:12,  1.70s/it, loss=0.214, v_num=0, train/loss_simple_step=0.747, train/loss_vlb_step=0.0637, train/loss_step=0.747, global_step=5275.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  47%|████▋     | 566/1208 [16:03<18:12,  1.70s/it, loss=0.222, v_num=0, train/loss_simple_step=0.483, train/loss_vlb_step=0.0045, train/loss_step=0.483, global_step=5275.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  47%|████▋     | 567/1208 [16:04<18:10,  1.70s/it, loss=0.222, v_num=0, train/loss_simple_step=0.483, train/loss_vlb_step=0.0045, train/loss_step=0.483, global_step=5275.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  47%|████▋     | 567/1208 [16:04<18:10,  1.70s/it, loss=0.213, v_num=0, train/loss_simple_step=0.0027, train/loss_vlb_step=1.56e-5, train/loss_step=0.0027, global_step=5275.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  47%|████▋     | 568/1208 [16:07<18:10,  1.70s/it, loss=0.213, v_num=0, train/loss_simple_step=0.0027, train/loss_vlb_step=1.56e-5, train/loss_step=0.0027, global_step=5275.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  47%|████▋     | 568/1208 [16:07<18:10,  1.70s/it, loss=0.209, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.8e-5, train/loss_step=0.0032, global_step=5275.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  47%|████▋     | 569/1208 [16:08<18:07,  1.70s/it, loss=0.209, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.8e-5, train/loss_step=0.0032, global_step=5275.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  47%|████▋     | 569/1208 [16:08<18:07,  1.70s/it, loss=0.207, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=2.49e-5, train/loss_step=0.00481, global_step=5276.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  47%|████▋     | 570/1208 [16:09<18:05,  1.70s/it, loss=0.207, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=2.49e-5, train/loss_step=0.00481, global_step=5276.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  47%|████▋     | 570/1208 [16:09<18:05,  1.70s/it, loss=0.218, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00147, train/loss_step=0.316, global_step=5276.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  47%|████▋     | 571/1208 [16:10<18:02,  1.70s/it, loss=0.218, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00147, train/loss_step=0.316, global_step=5276.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  47%|████▋     | 571/1208 [16:10<18:02,  1.70s/it, loss=0.208, v_num=0, train/loss_simple_step=0.00517, train/loss_vlb_step=2.66e-5, train/loss_step=0.00517, global_step=5276.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  47%|████▋     | 572/1208 [16:13<18:02,  1.70s/it, loss=0.208, v_num=0, train/loss_simple_step=0.00517, train/loss_vlb_step=2.66e-5, train/loss_step=0.00517, global_step=5276.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  47%|████▋     | 572/1208 [16:13<18:02,  1.70s/it, loss=0.212, v_num=0, train/loss_simple_step=0.0704, train/loss_vlb_step=0.000237, train/loss_step=0.0704, global_step=5276.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  47%|████▋     | 573/1208 [16:14<18:00,  1.70s/it, loss=0.212, v_num=0, train/loss_simple_step=0.0704, train/loss_vlb_step=0.000237, train/loss_step=0.0704, global_step=5276.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  47%|████▋     | 573/1208 [16:14<18:00,  1.70s/it, loss=0.214, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000141, train/loss_step=0.0406, global_step=5277.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  48%|████▊     | 574/1208 [16:16<17:58,  1.70s/it, loss=0.214, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000141, train/loss_step=0.0406, global_step=5277.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  48%|████▊     | 574/1208 [16:16<17:58,  1.70s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000123, train/loss_step=0.0337, global_step=5277.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  48%|████▊     | 575/1208 [16:17<17:55,  1.70s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000123, train/loss_step=0.0337, global_step=5277.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  48%|████▊     | 575/1208 [16:17<17:55,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000123, train/loss_step=0.0325, global_step=5277.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  48%|████▊     | 576/1208 [16:20<17:55,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000123, train/loss_step=0.0325, global_step=5277.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  48%|████▊     | 576/1208 [16:20<17:55,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00428, train/loss_vlb_step=2.24e-5, train/loss_step=0.00428, global_step=5277.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  48%|████▊     | 577/1208 [16:21<17:53,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00428, train/loss_vlb_step=2.24e-5, train/loss_step=0.00428, global_step=5277.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  48%|████▊     | 577/1208 [16:21<17:53,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.0054, train/loss_step=0.382, global_step=5278.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]     Epoch 17:  48%|████▊     | 578/1208 [16:22<17:50,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.0054, train/loss_step=0.382, global_step=5278.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  48%|████▊     | 578/1208 [16:22<17:50,  1.70s/it, loss=0.192, v_num=0, train/loss_simple_step=0.689, train/loss_vlb_step=0.0443, train/loss_step=0.689, global_step=5278.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  48%|████▊     | 579/1208 [16:23<17:48,  1.70s/it, loss=0.192, v_num=0, train/loss_simple_step=0.689, train/loss_vlb_step=0.0443, train/loss_step=0.689, global_step=5278.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  48%|████▊     | 579/1208 [16:23<17:48,  1.70s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0861, train/loss_vlb_step=0.000285, train/loss_step=0.0861, global_step=5278.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  48%|████▊     | 580/1208 [16:26<17:48,  1.70s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0861, train/loss_vlb_step=0.000285, train/loss_step=0.0861, global_step=5278.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  48%|████▊     | 580/1208 [16:26<17:48,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000745, train/loss_step=0.197, global_step=5278.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  48%|████▊     | 581/1208 [16:27<17:45,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000745, train/loss_step=0.197, global_step=5278.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  48%|████▊     | 581/1208 [16:27<17:45,  1.70s/it, loss=0.213, v_num=0, train/loss_simple_step=0.642, train/loss_vlb_step=0.0368, train/loss_step=0.642, global_step=5279.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  48%|████▊     | 582/1208 [16:28<17:43,  1.70s/it, loss=0.213, v_num=0, train/loss_simple_step=0.642, train/loss_vlb_step=0.0368, train/loss_step=0.642, global_step=5279.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  48%|████▊     | 582/1208 [16:28<17:43,  1.70s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0925, train/loss_vlb_step=0.000305, train/loss_step=0.0925, global_step=5279.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  48%|████▊     | 583/1208 [16:29<17:41,  1.70s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0925, train/loss_vlb_step=0.000305, train/loss_step=0.0925, global_step=5279.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  48%|████▊     | 583/1208 [16:29<17:41,  1.70s/it, loss=0.206, v_num=0, train/loss_simple_step=0.005, train/loss_vlb_step=2.65e-5, train/loss_step=0.005, global_step=5279.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  48%|████▊     | 584/1208 [16:33<17:41,  1.70s/it, loss=0.206, v_num=0, train/loss_simple_step=0.005, train/loss_vlb_step=2.65e-5, train/loss_step=0.005, global_step=5279.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  48%|████▊     | 584/1208 [16:33<17:41,  1.70s/it, loss=0.201, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000611, train/loss_step=0.180, global_step=5279.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  48%|████▊     | 585/1208 [16:34<17:38,  1.70s/it, loss=0.201, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000611, train/loss_step=0.180, global_step=5279.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  48%|████▊     | 585/1208 [16:34<17:38,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00363, train/loss_step=0.434, global_step=5280.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  49%|████▊     | 586/1208 [16:35<17:36,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00363, train/loss_step=0.434, global_step=5280.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  49%|████▊     | 586/1208 [16:35<17:36,  1.70s/it, loss=0.179, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00168, train/loss_step=0.351, global_step=5280.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  49%|████▊     | 587/1208 [16:36<17:34,  1.70s/it, loss=0.179, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00168, train/loss_step=0.351, global_step=5280.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  49%|████▊     | 587/1208 [16:36<17:34,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000518, train/loss_step=0.150, global_step=5280.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  49%|████▊     | 588/1208 [16:39<17:33,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000518, train/loss_step=0.150, global_step=5280.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  49%|████▊     | 588/1208 [16:39<17:33,  1.70s/it, loss=0.192, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000433, train/loss_step=0.132, global_step=5280.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  49%|████▉     | 589/1208 [16:40<17:31,  1.70s/it, loss=0.192, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000433, train/loss_step=0.132, global_step=5280.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  49%|████▉     | 589/1208 [16:40<17:31,  1.70s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0517, train/loss_vlb_step=0.000182, train/loss_step=0.0517, global_step=5281.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  49%|████▉     | 590/1208 [16:41<17:29,  1.70s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0517, train/loss_vlb_step=0.000182, train/loss_step=0.0517, global_step=5281.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  49%|████▉     | 590/1208 [16:41<17:29,  1.70s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0636, train/loss_vlb_step=0.000217, train/loss_step=0.0636, global_step=5281.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  49%|████▉     | 591/1208 [16:42<17:26,  1.70s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0636, train/loss_vlb_step=0.000217, train/loss_step=0.0636, global_step=5281.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  49%|████▉     | 591/1208 [16:42<17:26,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0849, train/loss_vlb_step=0.000283, train/loss_step=0.0849, global_step=5281.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  49%|████▉     | 592/1208 [16:45<17:26,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0849, train/loss_vlb_step=0.000283, train/loss_step=0.0849, global_step=5281.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  49%|████▉     | 592/1208 [16:45<17:26,  1.70s/it, loss=0.191, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000614, train/loss_step=0.174, global_step=5281.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  49%|████▉     | 593/1208 [16:46<17:24,  1.70s/it, loss=0.191, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000614, train/loss_step=0.174, global_step=5281.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  49%|████▉     | 593/1208 [16:46<17:24,  1.70s/it, loss=0.219, v_num=0, train/loss_simple_step=0.589, train/loss_vlb_step=0.0105, train/loss_step=0.589, global_step=5282.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  49%|████▉     | 594/1208 [16:48<17:21,  1.70s/it, loss=0.219, v_num=0, train/loss_simple_step=0.589, train/loss_vlb_step=0.0105, train/loss_step=0.589, global_step=5282.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  49%|████▉     | 594/1208 [16:48<17:21,  1.70s/it, loss=0.234, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00293, train/loss_step=0.342, global_step=5282.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  49%|████▉     | 595/1208 [16:49<17:19,  1.70s/it, loss=0.234, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00293, train/loss_step=0.342, global_step=5282.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  49%|████▉     | 595/1208 [16:49<17:19,  1.70s/it, loss=0.233, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=1.42e-5, train/loss_step=0.0025, global_step=5282.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  49%|████▉     | 596/1208 [16:52<17:19,  1.70s/it, loss=0.233, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=1.42e-5, train/loss_step=0.0025, global_step=5282.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  49%|████▉     | 596/1208 [16:52<17:19,  1.70s/it, loss=0.232, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.42e-5, train/loss_step=0.00249, global_step=5282.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  49%|████▉     | 597/1208 [16:53<17:17,  1.70s/it, loss=0.232, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.42e-5, train/loss_step=0.00249, global_step=5282.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  49%|████▉     | 597/1208 [16:53<17:17,  1.70s/it, loss=0.215, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000129, train/loss_step=0.0335, global_step=5283.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  50%|████▉     | 598/1208 [16:54<17:14,  1.70s/it, loss=0.215, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000129, train/loss_step=0.0335, global_step=5283.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  50%|████▉     | 598/1208 [16:54<17:14,  1.70s/it, loss=0.188, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000494, train/loss_step=0.147, global_step=5283.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  50%|████▉     | 599/1208 [16:55<17:12,  1.70s/it, loss=0.188, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000494, train/loss_step=0.147, global_step=5283.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  50%|████▉     | 599/1208 [16:55<17:12,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.23e-5, train/loss_step=0.00423, global_step=5283.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  50%|████▉     | 600/1208 [16:58<17:12,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.23e-5, train/loss_step=0.00423, global_step=5283.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  50%|████▉     | 600/1208 [16:58<17:12,  1.70s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=1.96e-5, train/loss_step=0.00359, global_step=5283.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.75it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.75it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.76it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.74it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.77it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.83it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.76it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.76it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.76it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.76it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.76it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.76it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.76it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.76it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.76it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.76it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.80it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.83it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 17:  50%|████▉     | 601/1208 [17:29<17:39,  1.75s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=1.96e-5, train/loss_step=0.00359, global_step=5283.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  50%|████▉     | 601/1208 [17:29<17:39,  1.75s/it, loss=0.18, v_num=0, train/loss_simple_step=0.766, train/loss_vlb_step=0.078, train/loss_step=0.766, global_step=5284.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]       Epoch 17:  50%|████▉     | 602/1208 [17:30<17:37,  1.74s/it, loss=0.18, v_num=0, train/loss_simple_step=0.766, train/loss_vlb_step=0.078, train/loss_step=0.766, global_step=5284.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  50%|████▉     | 602/1208 [17:30<17:37,  1.74s/it, loss=0.185, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000653, train/loss_step=0.185, global_step=5284.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  50%|████▉     | 603/1208 [17:31<17:34,  1.74s/it, loss=0.185, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000653, train/loss_step=0.185, global_step=5284.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  50%|████▉     | 603/1208 [17:31<17:34,  1.74s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=7.77e-5, train/loss_step=0.0189, global_step=5284.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  50%|█████     | 604/1208 [17:34<17:34,  1.75s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=7.77e-5, train/loss_step=0.0189, global_step=5284.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  50%|█████     | 604/1208 [17:34<17:34,  1.75s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0503, train/loss_vlb_step=0.000176, train/loss_step=0.0503, global_step=5284.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  50%|█████     | 605/1208 [17:35<17:32,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0503, train/loss_vlb_step=0.000176, train/loss_step=0.0503, global_step=5284.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  50%|█████     | 605/1208 [17:35<17:32,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000118, train/loss_step=0.0307, global_step=5285.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  50%|█████     | 606/1208 [17:36<17:29,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000118, train/loss_step=0.0307, global_step=5285.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  50%|█████     | 606/1208 [17:36<17:29,  1.74s/it, loss=0.147, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.00035, train/loss_step=0.106, global_step=5285.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  50%|█████     | 607/1208 [17:37<17:27,  1.74s/it, loss=0.147, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.00035, train/loss_step=0.106, global_step=5285.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  50%|█████     | 607/1208 [17:37<17:27,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0802, train/loss_vlb_step=0.000267, train/loss_step=0.0802, global_step=5285.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  50%|█████     | 608/1208 [17:40<17:26,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0802, train/loss_vlb_step=0.000267, train/loss_step=0.0802, global_step=5285.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  50%|█████     | 608/1208 [17:40<17:26,  1.74s/it, loss=0.156, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.0029, train/loss_step=0.379, global_step=5285.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  50%|█████     | 609/1208 [17:41<17:24,  1.74s/it, loss=0.156, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.0029, train/loss_step=0.379, global_step=5285.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  50%|█████     | 609/1208 [17:41<17:24,  1.74s/it, loss=0.165, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00104, train/loss_step=0.248, global_step=5286.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  50%|█████     | 610/1208 [17:43<17:22,  1.74s/it, loss=0.165, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00104, train/loss_step=0.248, global_step=5286.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  50%|█████     | 610/1208 [17:43<17:22,  1.74s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000106, train/loss_step=0.0266, global_step=5286.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  51%|█████     | 611/1208 [17:44<17:19,  1.74s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000106, train/loss_step=0.0266, global_step=5286.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  51%|█████     | 611/1208 [17:44<17:19,  1.74s/it, loss=0.169, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000635, train/loss_step=0.187, global_step=5286.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  51%|█████     | 612/1208 [17:47<17:19,  1.74s/it, loss=0.169, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000635, train/loss_step=0.187, global_step=5286.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  51%|█████     | 612/1208 [17:47<17:19,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00236, train/loss_step=0.377, global_step=5286.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  51%|█████     | 613/1208 [17:48<17:17,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00236, train/loss_step=0.377, global_step=5286.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  51%|█████     | 613/1208 [17:48<17:17,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000351, train/loss_step=0.107, global_step=5287.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  51%|█████     | 614/1208 [17:49<17:14,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000351, train/loss_step=0.107, global_step=5287.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  51%|█████     | 614/1208 [17:49<17:14,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.89e-5, train/loss_step=0.0107, global_step=5287.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  51%|█████     | 615/1208 [17:50<17:12,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.89e-5, train/loss_step=0.0107, global_step=5287.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  51%|█████     | 615/1208 [17:50<17:12,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.7e-5, train/loss_step=0.0158, global_step=5287.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  51%|█████     | 616/1208 [17:53<17:11,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.7e-5, train/loss_step=0.0158, global_step=5287.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  51%|█████     | 616/1208 [17:53<17:11,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0973, train/loss_vlb_step=0.00032, train/loss_step=0.0973, global_step=5287.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  51%|█████     | 617/1208 [17:54<17:09,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0973, train/loss_vlb_step=0.00032, train/loss_step=0.0973, global_step=5287.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  51%|█████     | 617/1208 [17:54<17:09,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.31e-5, train/loss_step=0.0114, global_step=5288.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  51%|█████     | 618/1208 [17:55<17:07,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.31e-5, train/loss_step=0.0114, global_step=5288.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  51%|█████     | 618/1208 [17:55<17:07,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=1.94e-5, train/loss_step=0.00357, global_step=5288.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  51%|█████     | 619/1208 [17:56<17:04,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=1.94e-5, train/loss_step=0.00357, global_step=5288.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  51%|█████     | 619/1208 [17:56<17:04,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00093, train/loss_step=0.252, global_step=5288.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  51%|█████▏    | 620/1208 [18:00<17:04,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00093, train/loss_step=0.252, global_step=5288.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  51%|█████▏    | 620/1208 [18:00<17:04,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.22e-5, train/loss_step=0.0115, global_step=5288.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  51%|█████▏    | 621/1208 [18:01<17:01,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.22e-5, train/loss_step=0.0115, global_step=5288.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  51%|█████▏    | 621/1208 [18:01<17:01,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000137, train/loss_step=0.0348, global_step=5289.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  51%|█████▏    | 622/1208 [18:02<16:59,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000137, train/loss_step=0.0348, global_step=5289.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  51%|█████▏    | 622/1208 [18:02<16:59,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00713, train/loss_vlb_step=3.47e-5, train/loss_step=0.00713, global_step=5289.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  52%|█████▏    | 623/1208 [18:03<16:57,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00713, train/loss_vlb_step=3.47e-5, train/loss_step=0.00713, global_step=5289.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  52%|█████▏    | 623/1208 [18:03<16:57,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000871, train/loss_step=0.231, global_step=5289.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  52%|█████▏    | 624/1208 [18:06<16:56,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000871, train/loss_step=0.231, global_step=5289.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  52%|█████▏    | 624/1208 [18:06<16:56,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00996, train/loss_vlb_step=4.55e-5, train/loss_step=0.00996, global_step=5289.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  52%|█████▏    | 625/1208 [18:07<16:54,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00996, train/loss_vlb_step=4.55e-5, train/loss_step=0.00996, global_step=5289.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  52%|█████▏    | 625/1208 [18:07<16:54,  1.74s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00706, train/loss_vlb_step=3.45e-5, train/loss_step=0.00706, global_step=5290.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  52%|█████▏    | 626/1208 [18:08<16:52,  1.74s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00706, train/loss_vlb_step=3.45e-5, train/loss_step=0.00706, global_step=5290.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  52%|█████▏    | 626/1208 [18:08<16:52,  1.74s/it, loss=0.11, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=5290.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  52%|█████▏    | 627/1208 [18:09<16:49,  1.74s/it, loss=0.11, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=5290.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  52%|█████▏    | 627/1208 [18:09<16:49,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0934, train/loss_vlb_step=0.000309, train/loss_step=0.0934, global_step=5290.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  52%|█████▏    | 628/1208 [18:12<16:49,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0934, train/loss_vlb_step=0.000309, train/loss_step=0.0934, global_step=5290.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  52%|█████▏    | 628/1208 [18:12<16:49,  1.74s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=1.95e-5, train/loss_step=0.00363, global_step=5290.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  52%|█████▏    | 629/1208 [18:13<16:46,  1.74s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=1.95e-5, train/loss_step=0.00363, global_step=5290.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  52%|█████▏    | 629/1208 [18:13<16:46,  1.74s/it, loss=0.0811, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.000123, train/loss_step=0.0316, global_step=5291.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  52%|█████▏    | 630/1208 [18:14<16:44,  1.74s/it, loss=0.0811, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.000123, train/loss_step=0.0316, global_step=5291.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  52%|█████▏    | 630/1208 [18:14<16:44,  1.74s/it, loss=0.08, v_num=0, train/loss_simple_step=0.00408, train/loss_vlb_step=2.2e-5, train/loss_step=0.00408, global_step=5291.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  52%|█████▏    | 631/1208 [18:15<16:42,  1.74s/it, loss=0.08, v_num=0, train/loss_simple_step=0.00408, train/loss_vlb_step=2.2e-5, train/loss_step=0.00408, global_step=5291.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  52%|█████▏    | 631/1208 [18:16<16:42,  1.74s/it, loss=0.0717, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.6e-5, train/loss_step=0.0203, global_step=5291.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  52%|█████▏    | 632/1208 [18:19<16:41,  1.74s/it, loss=0.0717, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.6e-5, train/loss_step=0.0203, global_step=5291.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  52%|█████▏    | 632/1208 [18:19<16:41,  1.74s/it, loss=0.054, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=9.54e-5, train/loss_step=0.0248, global_step=5291.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  52%|█████▏    | 633/1208 [18:20<16:39,  1.74s/it, loss=0.054, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=9.54e-5, train/loss_step=0.0248, global_step=5291.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  52%|█████▏    | 633/1208 [18:20<16:39,  1.74s/it, loss=0.0665, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00178, train/loss_step=0.356, global_step=5292.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  52%|█████▏    | 634/1208 [18:21<16:37,  1.74s/it, loss=0.0665, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00178, train/loss_step=0.356, global_step=5292.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  52%|█████▏    | 634/1208 [18:21<16:37,  1.74s/it, loss=0.0671, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.47e-5, train/loss_step=0.023, global_step=5292.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  53%|█████▎    | 635/1208 [18:22<16:34,  1.74s/it, loss=0.0671, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.47e-5, train/loss_step=0.023, global_step=5292.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  53%|█████▎    | 635/1208 [18:22<16:34,  1.74s/it, loss=0.0677, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000112, train/loss_step=0.0282, global_step=5292.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  53%|█████▎    | 636/1208 [18:25<16:34,  1.74s/it, loss=0.0677, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000112, train/loss_step=0.0282, global_step=5292.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  53%|█████▎    | 636/1208 [18:25<16:34,  1.74s/it, loss=0.0709, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000539, train/loss_step=0.161, global_step=5292.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  53%|█████▎    | 637/1208 [18:26<16:31,  1.74s/it, loss=0.0709, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000539, train/loss_step=0.161, global_step=5292.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  53%|█████▎    | 637/1208 [18:26<16:31,  1.74s/it, loss=0.0731, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.000196, train/loss_step=0.0556, global_step=5293.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  53%|█████▎    | 638/1208 [18:27<16:29,  1.74s/it, loss=0.0731, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.000196, train/loss_step=0.0556, global_step=5293.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  53%|█████▎    | 638/1208 [18:27<16:29,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.632, train/loss_vlb_step=0.0208, train/loss_step=0.632, global_step=5293.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]     Epoch 17:  53%|█████▎    | 639/1208 [18:28<16:27,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.632, train/loss_vlb_step=0.0208, train/loss_step=0.632, global_step=5293.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  53%|█████▎    | 639/1208 [18:28<16:27,  1.74s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.47e-5, train/loss_step=0.00273, global_step=5293.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  53%|█████▎    | 640/1208 [18:31<16:26,  1.74s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.47e-5, train/loss_step=0.00273, global_step=5293.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  53%|█████▎    | 640/1208 [18:31<16:26,  1.74s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.04e-5, train/loss_step=0.0136, global_step=5293.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  53%|█████▎    | 641/1208 [18:33<16:24,  1.74s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.04e-5, train/loss_step=0.0136, global_step=5293.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  53%|█████▎    | 641/1208 [18:33<16:24,  1.74s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.73e-5, train/loss_step=0.010, global_step=5294.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  53%|█████▎    | 642/1208 [18:34<16:22,  1.74s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.73e-5, train/loss_step=0.010, global_step=5294.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  53%|█████▎    | 642/1208 [18:34<16:22,  1.74s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.0696, train/loss_vlb_step=0.00023, train/loss_step=0.0696, global_step=5294.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  53%|█████▎    | 643/1208 [18:35<16:19,  1.73s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.0696, train/loss_vlb_step=0.00023, train/loss_step=0.0696, global_step=5294.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  53%|█████▎    | 643/1208 [18:35<16:19,  1.73s/it, loss=0.0827, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=2.08e-5, train/loss_step=0.00388, global_step=5294.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  53%|█████▎    | 644/1208 [18:38<16:19,  1.74s/it, loss=0.0827, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=2.08e-5, train/loss_step=0.00388, global_step=5294.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  53%|█████▎    | 644/1208 [18:38<16:19,  1.74s/it, loss=0.0826, v_num=0, train/loss_simple_step=0.00754, train/loss_vlb_step=3.75e-5, train/loss_step=0.00754, global_step=5294.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  53%|█████▎    | 645/1208 [18:39<16:17,  1.74s/it, loss=0.0826, v_num=0, train/loss_simple_step=0.00754, train/loss_vlb_step=3.75e-5, train/loss_step=0.00754, global_step=5294.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  53%|█████▎    | 645/1208 [18:39<16:17,  1.74s/it, loss=0.0886, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.00042, train/loss_step=0.127, global_step=5295.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  53%|█████▎    | 646/1208 [18:40<16:14,  1.73s/it, loss=0.0886, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.00042, train/loss_step=0.127, global_step=5295.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  53%|█████▎    | 646/1208 [18:40<16:14,  1.73s/it, loss=0.084, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.2e-5, train/loss_step=0.0115, global_step=5295.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  54%|█████▎    | 647/1208 [18:41<16:12,  1.73s/it, loss=0.084, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.2e-5, train/loss_step=0.0115, global_step=5295.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  54%|█████▎    | 647/1208 [18:41<16:12,  1.73s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000544, train/loss_step=0.163, global_step=5295.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  54%|█████▎    | 648/1208 [18:44<16:11,  1.74s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000544, train/loss_step=0.163, global_step=5295.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  54%|█████▎    | 648/1208 [18:44<16:11,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.611, train/loss_vlb_step=0.00904, train/loss_step=0.611, global_step=5295.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  54%|█████▎    | 649/1208 [18:45<16:09,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.611, train/loss_vlb_step=0.00904, train/loss_step=0.611, global_step=5295.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  54%|█████▎    | 649/1208 [18:45<16:09,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00882, train/loss_vlb_step=4.29e-5, train/loss_step=0.00882, global_step=5296.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  54%|█████▍    | 650/1208 [18:46<16:07,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00882, train/loss_vlb_step=4.29e-5, train/loss_step=0.00882, global_step=5296.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  54%|█████▍    | 650/1208 [18:46<16:07,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000532, train/loss_step=0.159, global_step=5296.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  54%|█████▍    | 651/1208 [18:47<16:05,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000532, train/loss_step=0.159, global_step=5296.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  54%|█████▍    | 651/1208 [18:47<16:05,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0541, train/loss_vlb_step=0.000191, train/loss_step=0.0541, global_step=5296.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  54%|█████▍    | 652/1208 [18:51<16:04,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0541, train/loss_vlb_step=0.000191, train/loss_step=0.0541, global_step=5296.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  54%|█████▍    | 652/1208 [18:51<16:04,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=1.84e-5, train/loss_step=0.00334, global_step=5296.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  54%|█████▍    | 653/1208 [18:52<16:02,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=1.84e-5, train/loss_step=0.00334, global_step=5296.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  54%|█████▍    | 653/1208 [18:52<16:02,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000103, train/loss_step=0.0267, global_step=5297.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  54%|█████▍    | 654/1208 [18:53<15:59,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000103, train/loss_step=0.0267, global_step=5297.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  54%|█████▍    | 654/1208 [18:53<15:59,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.59e-5, train/loss_step=0.00278, global_step=5297.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  54%|█████▍    | 655/1208 [18:54<15:57,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.59e-5, train/loss_step=0.00278, global_step=5297.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  54%|█████▍    | 655/1208 [18:54<15:57,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000511, train/loss_step=0.147, global_step=5297.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  54%|█████▍    | 656/1208 [18:57<15:57,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000511, train/loss_step=0.147, global_step=5297.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  54%|█████▍    | 656/1208 [18:57<15:57,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.000173, train/loss_step=0.0482, global_step=5297.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  54%|█████▍    | 657/1208 [18:58<15:54,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.000173, train/loss_step=0.0482, global_step=5297.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  54%|█████▍    | 657/1208 [18:58<15:54,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000338, train/loss_step=0.102, global_step=5298.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  54%|█████▍    | 658/1208 [18:59<15:52,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000338, train/loss_step=0.102, global_step=5298.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  54%|█████▍    | 658/1208 [18:59<15:52,  1.73s/it, loss=0.0804, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000133, train/loss_step=0.0361, global_step=5298.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  55%|█████▍    | 659/1208 [19:00<15:50,  1.73s/it, loss=0.0804, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000133, train/loss_step=0.0361, global_step=5298.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  55%|█████▍    | 659/1208 [19:00<15:50,  1.73s/it, loss=0.0811, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.31e-5, train/loss_step=0.018, global_step=5298.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  55%|█████▍    | 660/1208 [19:03<15:49,  1.73s/it, loss=0.0811, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.31e-5, train/loss_step=0.018, global_step=5298.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  55%|█████▍    | 660/1208 [19:03<15:49,  1.73s/it, loss=0.0826, v_num=0, train/loss_simple_step=0.0426, train/loss_vlb_step=0.000146, train/loss_step=0.0426, global_step=5298.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  55%|█████▍    | 661/1208 [19:04<15:47,  1.73s/it, loss=0.0826, v_num=0, train/loss_simple_step=0.0426, train/loss_vlb_step=0.000146, train/loss_step=0.0426, global_step=5298.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  55%|█████▍    | 661/1208 [19:04<15:47,  1.73s/it, loss=0.0833, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.6e-5, train/loss_step=0.0235, global_step=5299.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  55%|█████▍    | 662/1208 [19:05<15:45,  1.73s/it, loss=0.0833, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.6e-5, train/loss_step=0.0235, global_step=5299.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  55%|█████▍    | 662/1208 [19:05<15:45,  1.73s/it, loss=0.0911, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000827, train/loss_step=0.227, global_step=5299.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  55%|█████▍    | 663/1208 [19:06<15:42,  1.73s/it, loss=0.0911, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000827, train/loss_step=0.227, global_step=5299.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  55%|█████▍    | 663/1208 [19:06<15:42,  1.73s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000116, train/loss_step=0.031, global_step=5299.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  55%|█████▍    | 664/1208 [19:10<15:42,  1.73s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000116, train/loss_step=0.031, global_step=5299.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  55%|█████▍    | 664/1208 [19:10<15:42,  1.73s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.00044, train/loss_step=0.131, global_step=5299.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  55%|█████▌    | 665/1208 [19:11<15:39,  1.73s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.00044, train/loss_step=0.131, global_step=5299.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  55%|█████▌    | 665/1208 [19:11<15:39,  1.73s/it, loss=0.0929, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.47e-5, train/loss_step=0.0121, global_step=5300.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  55%|█████▌    | 666/1208 [19:12<15:37,  1.73s/it, loss=0.0929, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.47e-5, train/loss_step=0.0121, global_step=5300.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  55%|█████▌    | 666/1208 [19:12<15:37,  1.73s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.32e-5, train/loss_step=0.00233, global_step=5300.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  55%|█████▌    | 667/1208 [19:13<15:35,  1.73s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.32e-5, train/loss_step=0.00233, global_step=5300.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  55%|█████▌    | 667/1208 [19:13<15:35,  1.73s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000108, train/loss_step=0.0279, global_step=5300.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  55%|█████▌    | 668/1208 [19:16<15:34,  1.73s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000108, train/loss_step=0.0279, global_step=5300.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  55%|█████▌    | 668/1208 [19:16<15:34,  1.73s/it, loss=0.0651, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000708, train/loss_step=0.200, global_step=5300.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  55%|█████▌    | 669/1208 [19:17<15:32,  1.73s/it, loss=0.0651, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000708, train/loss_step=0.200, global_step=5300.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  55%|█████▌    | 669/1208 [19:17<15:32,  1.73s/it, loss=0.0649, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.78e-5, train/loss_step=0.00311, global_step=5301.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  55%|█████▌    | 670/1208 [19:18<15:30,  1.73s/it, loss=0.0649, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.78e-5, train/loss_step=0.00311, global_step=5301.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  55%|█████▌    | 670/1208 [19:18<15:30,  1.73s/it, loss=0.0755, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00294, train/loss_step=0.373, global_step=5301.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  56%|█████▌    | 671/1208 [19:19<15:28,  1.73s/it, loss=0.0755, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00294, train/loss_step=0.373, global_step=5301.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  56%|█████▌    | 671/1208 [19:19<15:28,  1.73s/it, loss=0.0898, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00198, train/loss_step=0.339, global_step=5301.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  56%|█████▌    | 672/1208 [19:22<15:27,  1.73s/it, loss=0.0898, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00198, train/loss_step=0.339, global_step=5301.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  56%|█████▌    | 672/1208 [19:22<15:27,  1.73s/it, loss=0.095, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=5301.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  56%|█████▌    | 673/1208 [19:23<15:25,  1.73s/it, loss=0.095, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=5301.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  56%|█████▌    | 673/1208 [19:23<15:25,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000498, train/loss_step=0.150, global_step=5302.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  56%|█████▌    | 674/1208 [19:24<15:22,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000498, train/loss_step=0.150, global_step=5302.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  56%|█████▌    | 674/1208 [19:24<15:22,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00153, train/loss_step=0.326, global_step=5302.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  56%|█████▌    | 675/1208 [19:25<15:20,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00153, train/loss_step=0.326, global_step=5302.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  56%|█████▌    | 675/1208 [19:25<15:20,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000904, train/loss_step=0.210, global_step=5302.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  56%|█████▌    | 676/1208 [19:29<15:20,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000904, train/loss_step=0.210, global_step=5302.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  56%|█████▌    | 676/1208 [19:29<15:20,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000763, train/loss_step=0.207, global_step=5302.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  56%|█████▌    | 677/1208 [19:30<15:17,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000763, train/loss_step=0.207, global_step=5302.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  56%|█████▌    | 677/1208 [19:30<15:17,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00625, train/loss_vlb_step=3.17e-5, train/loss_step=0.00625, global_step=5303.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  56%|█████▌    | 678/1208 [19:31<15:15,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00625, train/loss_vlb_step=3.17e-5, train/loss_step=0.00625, global_step=5303.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  56%|█████▌    | 678/1208 [19:31<15:15,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000511, train/loss_step=0.152, global_step=5303.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  56%|█████▌    | 679/1208 [19:32<15:13,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000511, train/loss_step=0.152, global_step=5303.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  56%|█████▌    | 679/1208 [19:32<15:13,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.37e-5, train/loss_step=0.0176, global_step=5303.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  56%|█████▋    | 680/1208 [19:35<15:12,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.37e-5, train/loss_step=0.0176, global_step=5303.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  56%|█████▋    | 680/1208 [19:35<15:12,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000126, train/loss_step=0.0335, global_step=5303.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  56%|█████▋    | 681/1208 [19:36<15:10,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000126, train/loss_step=0.0335, global_step=5303.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  56%|█████▋    | 681/1208 [19:36<15:10,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.63e-5, train/loss_step=0.0203, global_step=5304.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  56%|█████▋    | 682/1208 [19:37<15:08,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.63e-5, train/loss_step=0.0203, global_step=5304.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  56%|█████▋    | 682/1208 [19:37<15:08,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000747, train/loss_step=0.205, global_step=5304.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  57%|█████▋    | 683/1208 [19:38<15:06,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000747, train/loss_step=0.205, global_step=5304.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  57%|█████▋    | 683/1208 [19:38<15:06,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.000998, train/loss_step=0.253, global_step=5304.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  57%|█████▋    | 684/1208 [19:41<15:05,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.000998, train/loss_step=0.253, global_step=5304.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  57%|█████▋    | 684/1208 [19:41<15:05,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00147, train/loss_step=0.309, global_step=5304.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  57%|█████▋    | 685/1208 [19:43<15:03,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00147, train/loss_step=0.309, global_step=5304.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  57%|█████▋    | 685/1208 [19:43<15:03,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00171, train/loss_step=0.324, global_step=5305.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  57%|█████▋    | 686/1208 [19:44<15:00,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00171, train/loss_step=0.324, global_step=5305.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  57%|█████▋    | 686/1208 [19:44<15:00,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000761, train/loss_step=0.203, global_step=5305.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  57%|█████▋    | 687/1208 [19:45<14:58,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000761, train/loss_step=0.203, global_step=5305.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  57%|█████▋    | 687/1208 [19:45<14:58,  1.73s/it, loss=0.185, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.0012, train/loss_step=0.270, global_step=5305.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  57%|█████▋    | 688/1208 [19:48<14:58,  1.73s/it, loss=0.185, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.0012, train/loss_step=0.270, global_step=5305.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  57%|█████▋    | 688/1208 [19:48<14:58,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000498, train/loss_step=0.145, global_step=5305.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  57%|█████▋    | 689/1208 [19:49<14:55,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000498, train/loss_step=0.145, global_step=5305.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  57%|█████▋    | 689/1208 [19:49<14:55,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.19e-5, train/loss_step=0.0226, global_step=5306.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  57%|█████▋    | 690/1208 [19:50<14:53,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.19e-5, train/loss_step=0.0226, global_step=5306.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  57%|█████▋    | 690/1208 [19:50<14:53,  1.73s/it, loss=0.188, v_num=0, train/loss_simple_step=0.468, train/loss_vlb_step=0.00509, train/loss_step=0.468, global_step=5306.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  57%|█████▋    | 691/1208 [19:51<14:51,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.468, train/loss_vlb_step=0.00509, train/loss_step=0.468, global_step=5306.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  57%|█████▋    | 691/1208 [19:51<14:51,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=1.34e-5, train/loss_step=0.00232, global_step=5306.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  57%|█████▋    | 692/1208 [19:54<14:50,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=1.34e-5, train/loss_step=0.00232, global_step=5306.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  57%|█████▋    | 692/1208 [19:54<14:50,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.00035, train/loss_step=0.106, global_step=5306.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  57%|█████▋    | 693/1208 [19:55<14:48,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.00035, train/loss_step=0.106, global_step=5306.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  57%|█████▋    | 693/1208 [19:55<14:48,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.38e-5, train/loss_step=0.0229, global_step=5307.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  57%|█████▋    | 694/1208 [19:56<14:46,  1.72s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.38e-5, train/loss_step=0.0229, global_step=5307.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  57%|█████▋    | 694/1208 [19:56<14:46,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0079, train/loss_vlb_step=3.8e-5, train/loss_step=0.0079, global_step=5307.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  58%|█████▊    | 695/1208 [19:57<14:44,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0079, train/loss_vlb_step=3.8e-5, train/loss_step=0.0079, global_step=5307.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  58%|█████▊    | 695/1208 [19:57<14:44,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000793, train/loss_step=0.207, global_step=5307.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  58%|█████▊    | 696/1208 [20:01<14:43,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000793, train/loss_step=0.207, global_step=5307.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  58%|█████▊    | 696/1208 [20:01<14:43,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000421, train/loss_step=0.128, global_step=5307.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  58%|█████▊    | 697/1208 [20:02<14:41,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000421, train/loss_step=0.128, global_step=5307.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  58%|█████▊    | 697/1208 [20:02<14:41,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00114, train/loss_step=0.245, global_step=5308.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  58%|█████▊    | 698/1208 [20:03<14:39,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00114, train/loss_step=0.245, global_step=5308.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  58%|█████▊    | 698/1208 [20:03<14:39,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0094, train/loss_vlb_step=4.31e-5, train/loss_step=0.0094, global_step=5308.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  58%|█████▊    | 699/1208 [20:04<14:36,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0094, train/loss_vlb_step=4.31e-5, train/loss_step=0.0094, global_step=5308.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  58%|█████▊    | 699/1208 [20:04<14:36,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=5308.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  58%|█████▊    | 700/1208 [20:07<14:36,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=5308.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  58%|█████▊    | 700/1208 [20:07<14:36,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000376, train/loss_step=0.114, global_step=5308.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  58%|█████▊    | 701/1208 [20:08<14:34,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000376, train/loss_step=0.114, global_step=5308.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  58%|█████▊    | 701/1208 [20:08<14:34,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.049, train/loss_vlb_step=0.000184, train/loss_step=0.049, global_step=5309.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  58%|█████▊    | 702/1208 [20:09<14:31,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.049, train/loss_vlb_step=0.000184, train/loss_step=0.049, global_step=5309.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  58%|█████▊    | 702/1208 [20:09<14:31,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.42e-5, train/loss_step=0.00253, global_step=5309.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  58%|█████▊    | 703/1208 [20:10<14:29,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.42e-5, train/loss_step=0.00253, global_step=5309.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  58%|█████▊    | 703/1208 [20:10<14:29,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.446, train/loss_vlb_step=0.00292, train/loss_step=0.446, global_step=5309.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  58%|█████▊    | 704/1208 [20:13<14:29,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.446, train/loss_vlb_step=0.00292, train/loss_step=0.446, global_step=5309.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  58%|█████▊    | 704/1208 [20:13<14:29,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00273, train/loss_step=0.389, global_step=5309.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  58%|█████▊    | 705/1208 [20:14<14:26,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00273, train/loss_step=0.389, global_step=5309.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  58%|█████▊    | 705/1208 [20:14<14:26,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=5310.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  58%|█████▊    | 706/1208 [20:15<14:24,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=5310.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  58%|█████▊    | 706/1208 [20:15<14:24,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000152, train/loss_step=0.042, global_step=5310.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  59%|█████▊    | 707/1208 [20:16<14:22,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000152, train/loss_step=0.042, global_step=5310.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  59%|█████▊    | 707/1208 [20:16<14:22,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000104, train/loss_step=0.0269, global_step=5310.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  59%|█████▊    | 708/1208 [20:20<14:21,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000104, train/loss_step=0.0269, global_step=5310.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  59%|█████▊    | 708/1208 [20:20<14:21,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00657, train/loss_vlb_step=3.27e-5, train/loss_step=0.00657, global_step=5310.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  59%|█████▊    | 709/1208 [20:21<14:19,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00657, train/loss_vlb_step=3.27e-5, train/loss_step=0.00657, global_step=5310.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  59%|█████▊    | 709/1208 [20:21<14:19,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000528, train/loss_step=0.158, global_step=5311.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  59%|█████▉    | 710/1208 [20:22<14:17,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000528, train/loss_step=0.158, global_step=5311.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  59%|█████▉    | 710/1208 [20:22<14:17,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.000128, train/loss_step=0.0347, global_step=5311.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  59%|█████▉    | 711/1208 [20:23<14:15,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.000128, train/loss_step=0.0347, global_step=5311.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  59%|█████▉    | 711/1208 [20:23<14:15,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0765, train/loss_vlb_step=0.000255, train/loss_step=0.0765, global_step=5311.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  59%|█████▉    | 712/1208 [20:26<14:14,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0765, train/loss_vlb_step=0.000255, train/loss_step=0.0765, global_step=5311.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  59%|█████▉    | 712/1208 [20:26<14:14,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000945, train/loss_step=0.242, global_step=5311.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  59%|█████▉    | 713/1208 [20:27<14:12,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000945, train/loss_step=0.242, global_step=5311.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  59%|█████▉    | 713/1208 [20:27<14:12,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.36e-5, train/loss_step=0.00233, global_step=5312.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  59%|█████▉    | 714/1208 [20:28<14:10,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.36e-5, train/loss_step=0.00233, global_step=5312.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  59%|█████▉    | 714/1208 [20:28<14:10,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=5312.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  59%|█████▉    | 715/1208 [20:29<14:07,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=5312.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  59%|█████▉    | 715/1208 [20:29<14:07,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00159, train/loss_step=0.283, global_step=5312.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  59%|█████▉    | 716/1208 [20:33<14:07,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00159, train/loss_step=0.283, global_step=5312.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  59%|█████▉    | 716/1208 [20:33<14:07,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.0017, train/loss_step=0.317, global_step=5312.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  59%|█████▉    | 717/1208 [20:34<14:05,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.0017, train/loss_step=0.317, global_step=5312.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  59%|█████▉    | 717/1208 [20:34<14:05,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00484, train/loss_vlb_step=2.55e-5, train/loss_step=0.00484, global_step=5313.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  59%|█████▉    | 718/1208 [20:35<14:02,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00484, train/loss_vlb_step=2.55e-5, train/loss_step=0.00484, global_step=5313.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  59%|█████▉    | 718/1208 [20:35<14:02,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0938, train/loss_vlb_step=0.000308, train/loss_step=0.0938, global_step=5313.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  60%|█████▉    | 719/1208 [20:36<14:00,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0938, train/loss_vlb_step=0.000308, train/loss_step=0.0938, global_step=5313.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  60%|█████▉    | 719/1208 [20:36<14:00,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0874, train/loss_vlb_step=0.000291, train/loss_step=0.0874, global_step=5313.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  60%|█████▉    | 720/1208 [20:39<14:00,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0874, train/loss_vlb_step=0.000291, train/loss_step=0.0874, global_step=5313.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  60%|█████▉    | 720/1208 [20:39<14:00,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0985, train/loss_vlb_step=0.000324, train/loss_step=0.0985, global_step=5313.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  60%|█████▉    | 721/1208 [20:40<13:57,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0985, train/loss_vlb_step=0.000324, train/loss_step=0.0985, global_step=5313.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  60%|█████▉    | 721/1208 [20:40<13:57,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=7.18e-5, train/loss_step=0.0164, global_step=5314.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  60%|█████▉    | 722/1208 [20:41<13:55,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=7.18e-5, train/loss_step=0.0164, global_step=5314.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  60%|█████▉    | 722/1208 [20:41<13:55,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.07e-5, train/loss_step=0.0138, global_step=5314.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  60%|█████▉    | 723/1208 [20:42<13:53,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.07e-5, train/loss_step=0.0138, global_step=5314.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  60%|█████▉    | 723/1208 [20:42<13:53,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.4e-5, train/loss_step=0.0185, global_step=5314.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  60%|█████▉    | 724/1208 [20:45<13:52,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.4e-5, train/loss_step=0.0185, global_step=5314.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  60%|█████▉    | 724/1208 [20:45<13:52,  1.72s/it, loss=0.0886, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000132, train/loss_step=0.0358, global_step=5314.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  60%|██████    | 725/1208 [20:46<13:50,  1.72s/it, loss=0.0886, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000132, train/loss_step=0.0358, global_step=5314.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  60%|██████    | 725/1208 [20:46<13:50,  1.72s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000134, train/loss_step=0.0348, global_step=5315.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  60%|██████    | 726/1208 [20:47<13:48,  1.72s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000134, train/loss_step=0.0348, global_step=5315.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  60%|██████    | 726/1208 [20:47<13:48,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.595, train/loss_vlb_step=0.0139, train/loss_step=0.595, global_step=5315.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]     Epoch 17:  60%|██████    | 727/1208 [20:48<13:46,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.595, train/loss_vlb_step=0.0139, train/loss_step=0.595, global_step=5315.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  60%|██████    | 727/1208 [20:48<13:46,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000467, train/loss_step=0.138, global_step=5315.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  60%|██████    | 728/1208 [20:52<13:45,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000467, train/loss_step=0.138, global_step=5315.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  60%|██████    | 728/1208 [20:52<13:45,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.49e-5, train/loss_step=0.0151, global_step=5315.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  60%|██████    | 729/1208 [20:53<13:43,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.49e-5, train/loss_step=0.0151, global_step=5315.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  60%|██████    | 729/1208 [20:53<13:43,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00252, train/loss_step=0.345, global_step=5316.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  60%|██████    | 730/1208 [20:54<13:41,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00252, train/loss_step=0.345, global_step=5316.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  60%|██████    | 730/1208 [20:54<13:41,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00453, train/loss_vlb_step=2.4e-5, train/loss_step=0.00453, global_step=5316.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  61%|██████    | 731/1208 [20:55<13:39,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00453, train/loss_vlb_step=2.4e-5, train/loss_step=0.00453, global_step=5316.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  61%|██████    | 731/1208 [20:55<13:39,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000121, train/loss_step=0.0314, global_step=5316.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  61%|██████    | 732/1208 [20:58<13:38,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000121, train/loss_step=0.0314, global_step=5316.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  61%|██████    | 732/1208 [20:58<13:38,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.000154, train/loss_step=0.0425, global_step=5316.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  61%|██████    | 733/1208 [20:59<13:36,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.000154, train/loss_step=0.0425, global_step=5316.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  61%|██████    | 733/1208 [20:59<13:36,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=5317.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  61%|██████    | 734/1208 [21:00<13:34,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=5317.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  61%|██████    | 734/1208 [21:00<13:34,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000174, train/loss_step=0.0474, global_step=5317.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  61%|██████    | 735/1208 [21:01<13:31,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000174, train/loss_step=0.0474, global_step=5317.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  61%|██████    | 735/1208 [21:01<13:31,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00249, train/loss_step=0.381, global_step=5317.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  61%|██████    | 736/1208 [21:04<13:31,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00249, train/loss_step=0.381, global_step=5317.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  61%|██████    | 736/1208 [21:04<13:31,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=5317.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  61%|██████    | 737/1208 [21:06<13:29,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=5317.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  61%|██████    | 737/1208 [21:06<13:29,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00161, train/loss_step=0.330, global_step=5318.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  61%|██████    | 738/1208 [21:07<13:26,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00161, train/loss_step=0.330, global_step=5318.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  61%|██████    | 738/1208 [21:07<13:26,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.54e-5, train/loss_step=0.0155, global_step=5318.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  61%|██████    | 739/1208 [21:08<13:24,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.54e-5, train/loss_step=0.0155, global_step=5318.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  61%|██████    | 739/1208 [21:08<13:24,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000708, train/loss_step=0.189, global_step=5318.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  61%|██████▏   | 740/1208 [21:11<13:24,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000708, train/loss_step=0.189, global_step=5318.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  61%|██████▏   | 740/1208 [21:11<13:24,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0784, train/loss_vlb_step=0.000261, train/loss_step=0.0784, global_step=5318.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  61%|██████▏   | 741/1208 [21:12<13:21,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0784, train/loss_vlb_step=0.000261, train/loss_step=0.0784, global_step=5318.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  61%|██████▏   | 741/1208 [21:12<13:21,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0605, train/loss_vlb_step=0.000209, train/loss_step=0.0605, global_step=5319.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  61%|██████▏   | 742/1208 [21:13<13:19,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0605, train/loss_vlb_step=0.000209, train/loss_step=0.0605, global_step=5319.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  61%|██████▏   | 742/1208 [21:13<13:19,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00397, train/loss_step=0.415, global_step=5319.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  62%|██████▏   | 743/1208 [21:14<13:17,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00397, train/loss_step=0.415, global_step=5319.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  62%|██████▏   | 743/1208 [21:14<13:17,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00105, train/loss_step=0.257, global_step=5319.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  62%|██████▏   | 744/1208 [21:17<13:16,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00105, train/loss_step=0.257, global_step=5319.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  62%|██████▏   | 744/1208 [21:17<13:16,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000156, train/loss_step=0.042, global_step=5319.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  62%|██████▏   | 745/1208 [21:18<13:14,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000156, train/loss_step=0.042, global_step=5319.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  62%|██████▏   | 745/1208 [21:18<13:14,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000537, train/loss_step=0.157, global_step=5320.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  62%|██████▏   | 746/1208 [21:19<13:12,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000537, train/loss_step=0.157, global_step=5320.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  62%|██████▏   | 746/1208 [21:19<13:12,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.84e-5, train/loss_step=0.0105, global_step=5320.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  62%|██████▏   | 747/1208 [21:20<13:10,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.84e-5, train/loss_step=0.0105, global_step=5320.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  62%|██████▏   | 747/1208 [21:20<13:10,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00161, train/loss_step=0.323, global_step=5320.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  62%|██████▏   | 748/1208 [21:24<13:09,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00161, train/loss_step=0.323, global_step=5320.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  62%|██████▏   | 748/1208 [21:24<13:09,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00132, train/loss_step=0.280, global_step=5320.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  62%|██████▏   | 749/1208 [21:25<13:07,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00132, train/loss_step=0.280, global_step=5320.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  62%|██████▏   | 749/1208 [21:25<13:07,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000791, train/loss_step=0.209, global_step=5321.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  62%|██████▏   | 750/1208 [21:26<13:05,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000791, train/loss_step=0.209, global_step=5321.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  62%|██████▏   | 750/1208 [21:26<13:05,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000867, train/loss_step=0.235, global_step=5321.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  62%|██████▏   | 751/1208 [21:27<13:03,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000867, train/loss_step=0.235, global_step=5321.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  62%|██████▏   | 751/1208 [21:27<13:03,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.00069, train/loss_step=0.190, global_step=5321.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  62%|██████▏   | 752/1208 [21:30<13:02,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.00069, train/loss_step=0.190, global_step=5321.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  62%|██████▏   | 752/1208 [21:30<13:02,  1.72s/it, loss=0.199, v_num=0, train/loss_simple_step=0.540, train/loss_vlb_step=0.0086, train/loss_step=0.540, global_step=5321.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  62%|██████▏   | 753/1208 [21:31<13:00,  1.72s/it, loss=0.199, v_num=0, train/loss_simple_step=0.540, train/loss_vlb_step=0.0086, train/loss_step=0.540, global_step=5321.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  62%|██████▏   | 753/1208 [21:31<13:00,  1.72s/it, loss=0.203, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000662, train/loss_step=0.184, global_step=5322.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  62%|██████▏   | 754/1208 [21:32<12:58,  1.71s/it, loss=0.203, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000662, train/loss_step=0.184, global_step=5322.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  62%|██████▏   | 754/1208 [21:32<12:58,  1.71s/it, loss=0.2, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=9.16e-6, train/loss_step=0.00153, global_step=5322.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  62%|██████▎   | 755/1208 [21:33<12:56,  1.71s/it, loss=0.2, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=9.16e-6, train/loss_step=0.00153, global_step=5322.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  62%|██████▎   | 755/1208 [21:33<12:56,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.64e-5, train/loss_step=0.0183, global_step=5322.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  63%|██████▎   | 756/1208 [21:36<12:55,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.64e-5, train/loss_step=0.0183, global_step=5322.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  63%|██████▎   | 756/1208 [21:36<12:55,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=5322.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  63%|██████▎   | 757/1208 [21:38<12:53,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=5322.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  63%|██████▎   | 757/1208 [21:38<12:53,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00131, train/loss_step=0.250, global_step=5323.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  63%|██████▎   | 758/1208 [21:39<12:51,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00131, train/loss_step=0.250, global_step=5323.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  63%|██████▎   | 758/1208 [21:39<12:51,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.6e-5, train/loss_step=0.0174, global_step=5323.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  63%|██████▎   | 759/1208 [21:40<12:49,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.6e-5, train/loss_step=0.0174, global_step=5323.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  63%|██████▎   | 759/1208 [21:40<12:49,  1.71s/it, loss=0.193, v_num=0, train/loss_simple_step=0.481, train/loss_vlb_step=0.00569, train/loss_step=0.481, global_step=5323.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  63%|██████▎   | 760/1208 [21:43<12:48,  1.71s/it, loss=0.193, v_num=0, train/loss_simple_step=0.481, train/loss_vlb_step=0.00569, train/loss_step=0.481, global_step=5323.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  63%|██████▎   | 760/1208 [21:43<12:48,  1.71s/it, loss=0.211, v_num=0, train/loss_simple_step=0.453, train/loss_vlb_step=0.00627, train/loss_step=0.453, global_step=5323.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  63%|██████▎   | 761/1208 [21:44<12:46,  1.71s/it, loss=0.211, v_num=0, train/loss_simple_step=0.453, train/loss_vlb_step=0.00627, train/loss_step=0.453, global_step=5323.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  63%|██████▎   | 761/1208 [21:44<12:46,  1.71s/it, loss=0.209, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.33e-5, train/loss_step=0.0152, global_step=5324.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  63%|██████▎   | 762/1208 [21:45<12:44,  1.71s/it, loss=0.209, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.33e-5, train/loss_step=0.0152, global_step=5324.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  63%|██████▎   | 762/1208 [21:45<12:44,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.000103, train/loss_step=0.0249, global_step=5324.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  63%|██████▎   | 763/1208 [21:46<12:42,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.000103, train/loss_step=0.0249, global_step=5324.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  63%|██████▎   | 763/1208 [21:46<12:42,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000337, train/loss_step=0.102, global_step=5324.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  63%|██████▎   | 764/1208 [21:49<12:41,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000337, train/loss_step=0.102, global_step=5324.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  63%|██████▎   | 764/1208 [21:49<12:41,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.81e-5, train/loss_step=0.0216, global_step=5324.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  63%|██████▎   | 765/1208 [21:50<12:39,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.81e-5, train/loss_step=0.0216, global_step=5324.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  63%|██████▎   | 765/1208 [21:50<12:39,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000713, train/loss_step=0.196, global_step=5325.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  63%|██████▎   | 766/1208 [21:51<12:37,  1.71s/it, loss=0.183, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000713, train/loss_step=0.196, global_step=5325.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  63%|██████▎   | 766/1208 [21:51<12:37,  1.71s/it, loss=0.205, v_num=0, train/loss_simple_step=0.448, train/loss_vlb_step=0.00429, train/loss_step=0.448, global_step=5325.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  63%|██████▎   | 767/1208 [21:52<12:34,  1.71s/it, loss=0.205, v_num=0, train/loss_simple_step=0.448, train/loss_vlb_step=0.00429, train/loss_step=0.448, global_step=5325.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  63%|██████▎   | 767/1208 [21:52<12:34,  1.71s/it, loss=0.212, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.00462, train/loss_step=0.470, global_step=5325.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  64%|██████▎   | 768/1208 [21:56<12:34,  1.71s/it, loss=0.212, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.00462, train/loss_step=0.470, global_step=5325.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  64%|██████▎   | 768/1208 [21:56<12:34,  1.71s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0467, train/loss_vlb_step=0.00017, train/loss_step=0.0467, global_step=5325.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  64%|██████▎   | 769/1208 [21:57<12:31,  1.71s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0467, train/loss_vlb_step=0.00017, train/loss_step=0.0467, global_step=5325.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  64%|██████▎   | 769/1208 [21:57<12:31,  1.71s/it, loss=0.208, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00214, train/loss_step=0.354, global_step=5326.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  64%|██████▎   | 770/1208 [21:58<12:29,  1.71s/it, loss=0.208, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00214, train/loss_step=0.354, global_step=5326.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  64%|██████▎   | 770/1208 [21:58<12:29,  1.71s/it, loss=0.204, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000508, train/loss_step=0.154, global_step=5326.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  64%|██████▍   | 771/1208 [21:59<12:27,  1.71s/it, loss=0.204, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000508, train/loss_step=0.154, global_step=5326.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  64%|██████▍   | 771/1208 [21:59<12:27,  1.71s/it, loss=0.202, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000527, train/loss_step=0.152, global_step=5326.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  64%|██████▍   | 772/1208 [22:02<12:26,  1.71s/it, loss=0.202, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000527, train/loss_step=0.152, global_step=5326.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  64%|██████▍   | 772/1208 [22:02<12:26,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00156, train/loss_step=0.304, global_step=5326.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  64%|██████▍   | 773/1208 [22:03<12:24,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00156, train/loss_step=0.304, global_step=5326.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  64%|██████▍   | 773/1208 [22:03<12:24,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.59e-5, train/loss_step=0.00274, global_step=5327.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  64%|██████▍   | 774/1208 [22:04<12:22,  1.71s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.59e-5, train/loss_step=0.00274, global_step=5327.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  64%|██████▍   | 774/1208 [22:04<12:22,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=5327.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  64%|██████▍   | 775/1208 [22:05<12:20,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=5327.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  64%|██████▍   | 775/1208 [22:05<12:20,  1.71s/it, loss=0.194, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000614, train/loss_step=0.183, global_step=5327.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  64%|██████▍   | 776/1208 [22:08<12:19,  1.71s/it, loss=0.194, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000614, train/loss_step=0.183, global_step=5327.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  64%|██████▍   | 776/1208 [22:08<12:19,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00472, train/loss_vlb_step=2.47e-5, train/loss_step=0.00472, global_step=5327.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  64%|██████▍   | 777/1208 [22:10<12:17,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00472, train/loss_vlb_step=2.47e-5, train/loss_step=0.00472, global_step=5327.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  64%|██████▍   | 777/1208 [22:10<12:17,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=2.02e-5, train/loss_step=0.00392, global_step=5328.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  64%|██████▍   | 778/1208 [22:11<12:15,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=2.02e-5, train/loss_step=0.00392, global_step=5328.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  64%|██████▍   | 778/1208 [22:11<12:15,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.000134, train/loss_step=0.0356, global_step=5328.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  64%|██████▍   | 779/1208 [22:12<12:13,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.000134, train/loss_step=0.0356, global_step=5328.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  64%|██████▍   | 779/1208 [22:12<12:13,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0096, train/loss_vlb_step=4.26e-5, train/loss_step=0.0096, global_step=5328.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  65%|██████▍   | 780/1208 [22:15<12:12,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0096, train/loss_vlb_step=4.26e-5, train/loss_step=0.0096, global_step=5328.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  65%|██████▍   | 780/1208 [22:15<12:12,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00877, train/loss_vlb_step=4.13e-5, train/loss_step=0.00877, global_step=5328.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  65%|██████▍   | 781/1208 [22:16<12:10,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00877, train/loss_vlb_step=4.13e-5, train/loss_step=0.00877, global_step=5328.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  65%|██████▍   | 781/1208 [22:16<12:10,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.832, train/loss_vlb_step=0.140, train/loss_step=0.832, global_step=5329.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]      Epoch 17:  65%|██████▍   | 782/1208 [22:17<12:08,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.832, train/loss_vlb_step=0.140, train/loss_step=0.832, global_step=5329.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  65%|██████▍   | 782/1208 [22:17<12:08,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=2.01e-5, train/loss_step=0.00368, global_step=5329.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  65%|██████▍   | 783/1208 [22:18<12:06,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=2.01e-5, train/loss_step=0.00368, global_step=5329.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  65%|██████▍   | 783/1208 [22:18<12:06,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=5329.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  65%|██████▍   | 784/1208 [22:21<12:05,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=5329.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  65%|██████▍   | 784/1208 [22:21<12:05,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=5329.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  65%|██████▍   | 785/1208 [22:22<12:03,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=5329.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  65%|██████▍   | 785/1208 [22:22<12:03,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00411, train/loss_vlb_step=2.22e-5, train/loss_step=0.00411, global_step=5330.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  65%|██████▌   | 786/1208 [22:23<12:01,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00411, train/loss_vlb_step=2.22e-5, train/loss_step=0.00411, global_step=5330.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  65%|██████▌   | 786/1208 [22:23<12:01,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000442, train/loss_step=0.132, global_step=5330.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  65%|██████▌   | 787/1208 [22:24<11:59,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000442, train/loss_step=0.132, global_step=5330.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  65%|██████▌   | 787/1208 [22:24<11:59,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00135, train/loss_step=0.302, global_step=5330.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  65%|██████▌   | 788/1208 [22:28<11:58,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00135, train/loss_step=0.302, global_step=5330.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  65%|██████▌   | 788/1208 [22:28<11:58,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00202, train/loss_step=0.351, global_step=5330.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  65%|██████▌   | 789/1208 [22:29<11:56,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00202, train/loss_step=0.351, global_step=5330.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  65%|██████▌   | 789/1208 [22:29<11:56,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.93e-5, train/loss_step=0.0107, global_step=5331.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  65%|██████▌   | 790/1208 [22:30<11:54,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.93e-5, train/loss_step=0.0107, global_step=5331.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  65%|██████▌   | 790/1208 [22:30<11:54,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000116, train/loss_step=0.0301, global_step=5331.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  65%|██████▌   | 791/1208 [22:31<11:52,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000116, train/loss_step=0.0301, global_step=5331.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  65%|██████▌   | 791/1208 [22:31<11:52,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000163, train/loss_step=0.0448, global_step=5331.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  66%|██████▌   | 792/1208 [22:34<11:51,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000163, train/loss_step=0.0448, global_step=5331.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  66%|██████▌   | 792/1208 [22:34<11:51,  1.71s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.32e-5, train/loss_step=0.0143, global_step=5331.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  66%|██████▌   | 793/1208 [22:35<11:49,  1.71s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.32e-5, train/loss_step=0.0143, global_step=5331.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  66%|██████▌   | 793/1208 [22:35<11:49,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0532, train/loss_vlb_step=0.000183, train/loss_step=0.0532, global_step=5332.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  66%|██████▌   | 794/1208 [22:36<11:47,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0532, train/loss_vlb_step=0.000183, train/loss_step=0.0532, global_step=5332.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  66%|██████▌   | 794/1208 [22:36<11:47,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000485, train/loss_step=0.145, global_step=5332.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  66%|██████▌   | 795/1208 [22:37<11:45,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000485, train/loss_step=0.145, global_step=5332.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  66%|██████▌   | 795/1208 [22:37<11:45,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000491, train/loss_step=0.146, global_step=5332.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  66%|██████▌   | 796/1208 [22:40<11:44,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000491, train/loss_step=0.146, global_step=5332.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  66%|██████▌   | 796/1208 [22:40<11:44,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0371, train/loss_vlb_step=0.000139, train/loss_step=0.0371, global_step=5332.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  66%|██████▌   | 797/1208 [22:41<11:42,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0371, train/loss_vlb_step=0.000139, train/loss_step=0.0371, global_step=5332.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  66%|██████▌   | 797/1208 [22:41<11:42,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=6.86e-5, train/loss_step=0.0166, global_step=5333.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  66%|██████▌   | 798/1208 [22:42<11:40,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=6.86e-5, train/loss_step=0.0166, global_step=5333.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  66%|██████▌   | 798/1208 [22:42<11:40,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=7.05e-5, train/loss_step=0.0161, global_step=5333.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  66%|██████▌   | 799/1208 [22:43<11:38,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=7.05e-5, train/loss_step=0.0161, global_step=5333.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  66%|██████▌   | 799/1208 [22:43<11:38,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000561, train/loss_step=0.157, global_step=5333.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  66%|██████▌   | 800/1208 [22:47<11:37,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000561, train/loss_step=0.157, global_step=5333.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  66%|██████▌   | 800/1208 [22:47<11:37,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.2e-5, train/loss_step=0.012, global_step=5333.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  66%|██████▋   | 801/1208 [22:48<11:35,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.2e-5, train/loss_step=0.012, global_step=5333.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  66%|██████▋   | 801/1208 [22:48<11:35,  1.71s/it, loss=0.095, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000784, train/loss_step=0.209, global_step=5334.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  66%|██████▋   | 802/1208 [22:49<11:33,  1.71s/it, loss=0.095, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000784, train/loss_step=0.209, global_step=5334.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  66%|██████▋   | 802/1208 [22:49<11:33,  1.71s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.0881, train/loss_vlb_step=0.00029, train/loss_step=0.0881, global_step=5334.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  66%|██████▋   | 803/1208 [22:50<11:31,  1.71s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.0881, train/loss_vlb_step=0.00029, train/loss_step=0.0881, global_step=5334.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  66%|██████▋   | 803/1208 [22:50<11:31,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00149, train/loss_step=0.292, global_step=5334.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  67%|██████▋   | 804/1208 [22:53<11:30,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00149, train/loss_step=0.292, global_step=5334.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  67%|██████▋   | 804/1208 [22:53<11:30,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.76e-5, train/loss_step=0.0208, global_step=5334.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  67%|██████▋   | 805/1208 [22:54<11:28,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.76e-5, train/loss_step=0.0208, global_step=5334.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  67%|██████▋   | 805/1208 [22:54<11:28,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00235, train/loss_step=0.366, global_step=5335.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  67%|██████▋   | 806/1208 [22:55<11:26,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00235, train/loss_step=0.366, global_step=5335.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  67%|██████▋   | 806/1208 [22:55<11:26,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.34e-5, train/loss_step=0.0209, global_step=5335.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  67%|██████▋   | 807/1208 [22:56<11:24,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.34e-5, train/loss_step=0.0209, global_step=5335.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  67%|██████▋   | 807/1208 [22:56<11:24,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000404, train/loss_step=0.123, global_step=5335.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  67%|██████▋   | 808/1208 [23:00<11:23,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000404, train/loss_step=0.123, global_step=5335.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  67%|██████▋   | 808/1208 [23:00<11:23,  1.71s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000441, train/loss_step=0.134, global_step=5335.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  67%|██████▋   | 809/1208 [23:01<11:21,  1.71s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000441, train/loss_step=0.134, global_step=5335.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  67%|██████▋   | 809/1208 [23:01<11:21,  1.71s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.0081, train/loss_vlb_step=3.9e-5, train/loss_step=0.0081, global_step=5336.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  67%|██████▋   | 810/1208 [23:02<11:19,  1.71s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.0081, train/loss_vlb_step=3.9e-5, train/loss_step=0.0081, global_step=5336.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  67%|██████▋   | 810/1208 [23:02<11:19,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.535, train/loss_vlb_step=0.0187, train/loss_step=0.535, global_step=5336.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  67%|██████▋   | 811/1208 [23:03<11:17,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.535, train/loss_vlb_step=0.0187, train/loss_step=0.535, global_step=5336.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  67%|██████▋   | 811/1208 [23:03<11:17,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00205, train/loss_step=0.326, global_step=5336.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  67%|██████▋   | 812/1208 [23:06<11:16,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00205, train/loss_step=0.326, global_step=5336.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  67%|██████▋   | 812/1208 [23:06<11:16,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00425, train/loss_vlb_step=2.24e-5, train/loss_step=0.00425, global_step=5336.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  67%|██████▋   | 813/1208 [23:07<11:14,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00425, train/loss_vlb_step=2.24e-5, train/loss_step=0.00425, global_step=5336.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  67%|██████▋   | 813/1208 [23:07<11:14,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.00363, train/loss_step=0.470, global_step=5337.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  67%|██████▋   | 814/1208 [23:08<11:12,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.00363, train/loss_step=0.470, global_step=5337.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  67%|██████▋   | 814/1208 [23:08<11:12,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000466, train/loss_step=0.140, global_step=5337.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  67%|██████▋   | 815/1208 [23:09<11:10,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000466, train/loss_step=0.140, global_step=5337.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  67%|██████▋   | 815/1208 [23:09<11:10,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00389, train/loss_vlb_step=2.05e-5, train/loss_step=0.00389, global_step=5337.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  68%|██████▊   | 816/1208 [23:12<11:09,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00389, train/loss_vlb_step=2.05e-5, train/loss_step=0.00389, global_step=5337.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  68%|██████▊   | 816/1208 [23:12<11:09,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0862, train/loss_vlb_step=0.000283, train/loss_step=0.0862, global_step=5337.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  68%|██████▊   | 817/1208 [23:13<11:07,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0862, train/loss_vlb_step=0.000283, train/loss_step=0.0862, global_step=5337.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  68%|██████▊   | 817/1208 [23:13<11:07,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.72e-5, train/loss_step=0.0186, global_step=5338.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  68%|██████▊   | 818/1208 [23:14<11:05,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.72e-5, train/loss_step=0.0186, global_step=5338.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  68%|██████▊   | 818/1208 [23:14<11:05,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000744, train/loss_step=0.207, global_step=5338.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  68%|██████▊   | 819/1208 [23:15<11:03,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000744, train/loss_step=0.207, global_step=5338.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  68%|██████▊   | 819/1208 [23:15<11:03,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0657, train/loss_vlb_step=0.000225, train/loss_step=0.0657, global_step=5338.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  68%|██████▊   | 820/1208 [23:19<11:02,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0657, train/loss_vlb_step=0.000225, train/loss_step=0.0657, global_step=5338.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  68%|██████▊   | 820/1208 [23:19<11:02,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00134, train/loss_step=0.275, global_step=5338.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  68%|██████▊   | 821/1208 [23:20<11:00,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00134, train/loss_step=0.275, global_step=5338.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  68%|██████▊   | 821/1208 [23:20<11:00,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=5339.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  68%|██████▊   | 822/1208 [23:21<10:58,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=5339.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  68%|██████▊   | 822/1208 [23:21<10:58,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000843, train/loss_step=0.220, global_step=5339.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  68%|██████▊   | 823/1208 [23:22<10:56,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000843, train/loss_step=0.220, global_step=5339.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  68%|██████▊   | 823/1208 [23:22<10:56,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.00011, train/loss_step=0.0293, global_step=5339.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  68%|██████▊   | 824/1208 [23:25<10:55,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.00011, train/loss_step=0.0293, global_step=5339.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  68%|██████▊   | 824/1208 [23:25<10:55,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000459, train/loss_step=0.138, global_step=5339.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  68%|██████▊   | 825/1208 [23:26<10:53,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000459, train/loss_step=0.138, global_step=5339.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  68%|██████▊   | 825/1208 [23:26<10:53,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00422, train/loss_vlb_step=2.35e-5, train/loss_step=0.00422, global_step=5340.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  68%|██████▊   | 826/1208 [23:27<10:51,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00422, train/loss_vlb_step=2.35e-5, train/loss_step=0.00422, global_step=5340.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  68%|██████▊   | 826/1208 [23:27<10:51,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.2e-5, train/loss_step=0.00202, global_step=5340.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  68%|██████▊   | 827/1208 [23:28<10:48,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.2e-5, train/loss_step=0.00202, global_step=5340.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  68%|██████▊   | 827/1208 [23:28<10:48,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00377, train/loss_vlb_step=2.07e-5, train/loss_step=0.00377, global_step=5340.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  69%|██████▊   | 828/1208 [23:31<10:48,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00377, train/loss_vlb_step=2.07e-5, train/loss_step=0.00377, global_step=5340.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  69%|██████▊   | 828/1208 [23:31<10:48,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=2.56e-5, train/loss_step=0.00481, global_step=5340.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  69%|██████▊   | 829/1208 [23:33<10:46,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=2.56e-5, train/loss_step=0.00481, global_step=5340.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  69%|██████▊   | 829/1208 [23:33<10:46,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0566, train/loss_vlb_step=0.000194, train/loss_step=0.0566, global_step=5341.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  69%|██████▊   | 830/1208 [23:34<10:44,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0566, train/loss_vlb_step=0.000194, train/loss_step=0.0566, global_step=5341.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  69%|██████▊   | 830/1208 [23:34<10:44,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00125, train/loss_step=0.297, global_step=5341.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  69%|██████▉   | 831/1208 [23:35<10:42,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00125, train/loss_step=0.297, global_step=5341.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  69%|██████▉   | 831/1208 [23:35<10:42,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0475, train/loss_vlb_step=0.000166, train/loss_step=0.0475, global_step=5341.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  69%|██████▉   | 832/1208 [23:38<10:40,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0475, train/loss_vlb_step=0.000166, train/loss_step=0.0475, global_step=5341.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  69%|██████▉   | 832/1208 [23:38<10:40,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00331, train/loss_step=0.395, global_step=5341.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  69%|██████▉   | 833/1208 [23:39<10:38,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00331, train/loss_step=0.395, global_step=5341.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  69%|██████▉   | 833/1208 [23:39<10:38,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.518, train/loss_vlb_step=0.00688, train/loss_step=0.518, global_step=5342.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  69%|██████▉   | 834/1208 [23:40<10:36,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.518, train/loss_vlb_step=0.00688, train/loss_step=0.518, global_step=5342.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  69%|██████▉   | 834/1208 [23:40<10:36,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000423, train/loss_step=0.129, global_step=5342.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  69%|██████▉   | 835/1208 [23:41<10:34,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000423, train/loss_step=0.129, global_step=5342.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  69%|██████▉   | 835/1208 [23:41<10:34,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=7.09e-5, train/loss_step=0.016, global_step=5342.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  69%|██████▉   | 836/1208 [23:44<10:33,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=7.09e-5, train/loss_step=0.016, global_step=5342.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  69%|██████▉   | 836/1208 [23:44<10:33,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.00072, train/loss_step=0.196, global_step=5342.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  69%|██████▉   | 837/1208 [23:45<10:31,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.00072, train/loss_step=0.196, global_step=5342.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  69%|██████▉   | 837/1208 [23:45<10:31,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.706, train/loss_vlb_step=0.022, train/loss_step=0.706, global_step=5343.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  69%|██████▉   | 838/1208 [23:46<10:29,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.706, train/loss_vlb_step=0.022, train/loss_step=0.706, global_step=5343.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  69%|██████▉   | 838/1208 [23:46<10:29,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000117, train/loss_step=0.0293, global_step=5343.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  69%|██████▉   | 839/1208 [23:47<10:27,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000117, train/loss_step=0.0293, global_step=5343.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  69%|██████▉   | 839/1208 [23:47<10:27,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00623, train/loss_vlb_step=3.17e-5, train/loss_step=0.00623, global_step=5343.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  70%|██████▉   | 840/1208 [23:51<10:26,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00623, train/loss_vlb_step=3.17e-5, train/loss_step=0.00623, global_step=5343.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  70%|██████▉   | 840/1208 [23:51<10:26,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0675, train/loss_vlb_step=0.000236, train/loss_step=0.0675, global_step=5343.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  70%|██████▉   | 841/1208 [23:52<10:24,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0675, train/loss_vlb_step=0.000236, train/loss_step=0.0675, global_step=5343.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  70%|██████▉   | 841/1208 [23:52<10:24,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.21e-5, train/loss_step=0.0205, global_step=5344.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  70%|██████▉   | 842/1208 [23:53<10:22,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.21e-5, train/loss_step=0.0205, global_step=5344.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  70%|██████▉   | 842/1208 [23:53<10:22,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000762, train/loss_step=0.209, global_step=5344.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  70%|██████▉   | 843/1208 [23:54<10:20,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000762, train/loss_step=0.209, global_step=5344.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  70%|██████▉   | 843/1208 [23:54<10:20,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000114, train/loss_step=0.0297, global_step=5344.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  70%|██████▉   | 844/1208 [23:57<10:19,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000114, train/loss_step=0.0297, global_step=5344.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  70%|██████▉   | 844/1208 [23:57<10:19,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00928, train/loss_vlb_step=4.4e-5, train/loss_step=0.00928, global_step=5344.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  70%|██████▉   | 845/1208 [23:58<10:17,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00928, train/loss_vlb_step=4.4e-5, train/loss_step=0.00928, global_step=5344.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  70%|██████▉   | 845/1208 [23:58<10:17,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00917, train/loss_vlb_step=4.39e-5, train/loss_step=0.00917, global_step=5345.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  70%|███████   | 846/1208 [23:59<10:15,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00917, train/loss_vlb_step=4.39e-5, train/loss_step=0.00917, global_step=5345.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  70%|███████   | 846/1208 [23:59<10:15,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00432, train/loss_vlb_step=2.27e-5, train/loss_step=0.00432, global_step=5345.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  70%|███████   | 847/1208 [24:00<10:13,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00432, train/loss_vlb_step=2.27e-5, train/loss_step=0.00432, global_step=5345.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  70%|███████   | 847/1208 [24:00<10:13,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000754, train/loss_step=0.206, global_step=5345.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  70%|███████   | 848/1208 [24:03<10:12,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000754, train/loss_step=0.206, global_step=5345.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  70%|███████   | 848/1208 [24:03<10:12,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.00063, train/loss_step=0.181, global_step=5345.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  70%|███████   | 849/1208 [24:04<10:10,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.00063, train/loss_step=0.181, global_step=5345.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  70%|███████   | 849/1208 [24:04<10:10,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0058, train/loss_vlb_step=2.88e-5, train/loss_step=0.0058, global_step=5346.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  70%|███████   | 850/1208 [24:05<10:08,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0058, train/loss_vlb_step=2.88e-5, train/loss_step=0.0058, global_step=5346.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  70%|███████   | 850/1208 [24:05<10:08,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000756, train/loss_step=0.199, global_step=5346.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  70%|███████   | 851/1208 [24:06<10:06,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000756, train/loss_step=0.199, global_step=5346.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  70%|███████   | 851/1208 [24:06<10:06,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000913, train/loss_step=0.242, global_step=5346.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  71%|███████   | 852/1208 [24:10<10:05,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000913, train/loss_step=0.242, global_step=5346.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  71%|███████   | 852/1208 [24:10<10:05,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.079, train/loss_vlb_step=0.000266, train/loss_step=0.079, global_step=5346.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  71%|███████   | 853/1208 [24:11<10:03,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.079, train/loss_vlb_step=0.000266, train/loss_step=0.079, global_step=5346.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  71%|███████   | 853/1208 [24:11<10:03,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00275, train/loss_step=0.367, global_step=5347.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  71%|███████   | 854/1208 [24:12<10:01,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00275, train/loss_step=0.367, global_step=5347.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  71%|███████   | 854/1208 [24:12<10:01,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.679, train/loss_vlb_step=0.020, train/loss_step=0.679, global_step=5347.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  71%|███████   | 855/1208 [24:13<09:59,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.679, train/loss_vlb_step=0.020, train/loss_step=0.679, global_step=5347.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  71%|███████   | 855/1208 [24:13<09:59,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000101, train/loss_step=0.0264, global_step=5347.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  71%|███████   | 856/1208 [24:16<09:58,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000101, train/loss_step=0.0264, global_step=5347.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  71%|███████   | 856/1208 [24:16<09:58,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00565, train/loss_vlb_step=2.93e-5, train/loss_step=0.00565, global_step=5347.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  71%|███████   | 857/1208 [24:17<09:56,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00565, train/loss_vlb_step=2.93e-5, train/loss_step=0.00565, global_step=5347.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  71%|███████   | 857/1208 [24:17<09:56,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00281, train/loss_step=0.430, global_step=5348.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]     Epoch 17:  71%|███████   | 858/1208 [24:18<09:55,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00281, train/loss_step=0.430, global_step=5348.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  71%|███████   | 858/1208 [24:18<09:55,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00831, train/loss_vlb_step=3.94e-5, train/loss_step=0.00831, global_step=5348.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  71%|███████   | 859/1208 [24:19<09:53,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00831, train/loss_vlb_step=3.94e-5, train/loss_step=0.00831, global_step=5348.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  71%|███████   | 859/1208 [24:19<09:53,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.851, train/loss_vlb_step=0.428, train/loss_step=0.851, global_step=5348.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]      Epoch 17:  71%|███████   | 860/1208 [24:22<09:51,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.851, train/loss_vlb_step=0.428, train/loss_step=0.851, global_step=5348.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  71%|███████   | 860/1208 [24:22<09:51,  1.70s/it, loss=0.196, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00231, train/loss_step=0.364, global_step=5348.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  71%|███████▏  | 861/1208 [24:23<09:49,  1.70s/it, loss=0.196, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00231, train/loss_step=0.364, global_step=5348.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  71%|███████▏  | 861/1208 [24:23<09:50,  1.70s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.75e-5, train/loss_step=0.0132, global_step=5349.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  71%|███████▏  | 862/1208 [24:24<09:48,  1.70s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.75e-5, train/loss_step=0.0132, global_step=5349.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  71%|███████▏  | 862/1208 [24:24<09:48,  1.70s/it, loss=0.208, v_num=0, train/loss_simple_step=0.459, train/loss_vlb_step=0.00543, train/loss_step=0.459, global_step=5349.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  71%|███████▏  | 863/1208 [24:26<09:46,  1.70s/it, loss=0.208, v_num=0, train/loss_simple_step=0.459, train/loss_vlb_step=0.00543, train/loss_step=0.459, global_step=5349.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  71%|███████▏  | 863/1208 [24:26<09:46,  1.70s/it, loss=0.207, v_num=0, train/loss_simple_step=0.00632, train/loss_vlb_step=3.25e-5, train/loss_step=0.00632, global_step=5349.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  72%|███████▏  | 864/1208 [24:29<09:44,  1.70s/it, loss=0.207, v_num=0, train/loss_simple_step=0.00632, train/loss_vlb_step=3.25e-5, train/loss_step=0.00632, global_step=5349.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  72%|███████▏  | 864/1208 [24:29<09:44,  1.70s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.26e-5, train/loss_step=0.0122, global_step=5349.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  72%|███████▏  | 865/1208 [24:30<09:43,  1.70s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.26e-5, train/loss_step=0.0122, global_step=5349.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  72%|███████▏  | 865/1208 [24:30<09:43,  1.70s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0883, train/loss_vlb_step=0.000294, train/loss_step=0.0883, global_step=5350.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  72%|███████▏  | 866/1208 [24:31<09:41,  1.70s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0883, train/loss_vlb_step=0.000294, train/loss_step=0.0883, global_step=5350.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  72%|███████▏  | 866/1208 [24:31<09:41,  1.70s/it, loss=0.217, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=5350.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  72%|███████▏  | 867/1208 [24:32<09:39,  1.70s/it, loss=0.217, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=5350.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  72%|███████▏  | 867/1208 [24:32<09:39,  1.70s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0635, train/loss_vlb_step=0.000214, train/loss_step=0.0635, global_step=5350.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  72%|███████▏  | 868/1208 [24:35<09:38,  1.70s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0635, train/loss_vlb_step=0.000214, train/loss_step=0.0635, global_step=5350.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  72%|███████▏  | 868/1208 [24:35<09:38,  1.70s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.9e-5, train/loss_step=0.0132, global_step=5350.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  72%|███████▏  | 869/1208 [24:36<09:36,  1.70s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.9e-5, train/loss_step=0.0132, global_step=5350.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  72%|███████▏  | 869/1208 [24:36<09:36,  1.70s/it, loss=0.201, v_num=0, train/loss_simple_step=0.00283, train/loss_vlb_step=1.64e-5, train/loss_step=0.00283, global_step=5351.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  72%|███████▏  | 870/1208 [24:37<09:34,  1.70s/it, loss=0.201, v_num=0, train/loss_simple_step=0.00283, train/loss_vlb_step=1.64e-5, train/loss_step=0.00283, global_step=5351.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  72%|███████▏  | 870/1208 [24:37<09:34,  1.70s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00994, train/loss_vlb_step=4.61e-5, train/loss_step=0.00994, global_step=5351.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  72%|███████▏  | 871/1208 [24:38<09:32,  1.70s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00994, train/loss_vlb_step=4.61e-5, train/loss_step=0.00994, global_step=5351.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  72%|███████▏  | 871/1208 [24:38<09:32,  1.70s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00453, train/loss_vlb_step=2.46e-5, train/loss_step=0.00453, global_step=5351.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  72%|███████▏  | 872/1208 [24:42<09:31,  1.70s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00453, train/loss_vlb_step=2.46e-5, train/loss_step=0.00453, global_step=5351.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  72%|███████▏  | 872/1208 [24:42<09:31,  1.70s/it, loss=0.187, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000893, train/loss_step=0.222, global_step=5351.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  72%|███████▏  | 873/1208 [24:43<09:29,  1.70s/it, loss=0.187, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000893, train/loss_step=0.222, global_step=5351.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  72%|███████▏  | 873/1208 [24:43<09:29,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000598, train/loss_step=0.172, global_step=5352.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  72%|███████▏  | 874/1208 [24:44<09:27,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000598, train/loss_step=0.172, global_step=5352.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  72%|███████▏  | 874/1208 [24:44<09:27,  1.70s/it, loss=0.19, v_num=0, train/loss_simple_step=0.927, train/loss_vlb_step=0.466, train/loss_step=0.927, global_step=5352.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  72%|███████▏  | 875/1208 [24:45<09:25,  1.70s/it, loss=0.19, v_num=0, train/loss_simple_step=0.927, train/loss_vlb_step=0.466, train/loss_step=0.927, global_step=5352.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  72%|███████▏  | 875/1208 [24:45<09:25,  1.70s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000112, train/loss_step=0.0295, global_step=5352.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  73%|███████▎  | 876/1208 [24:48<09:24,  1.70s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000112, train/loss_step=0.0295, global_step=5352.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  73%|███████▎  | 876/1208 [24:48<09:24,  1.70s/it, loss=0.198, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000583, train/loss_step=0.167, global_step=5352.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  73%|███████▎  | 877/1208 [24:49<09:22,  1.70s/it, loss=0.198, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000583, train/loss_step=0.167, global_step=5352.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  73%|███████▎  | 877/1208 [24:49<09:22,  1.70s/it, loss=0.193, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00168, train/loss_step=0.330, global_step=5353.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  73%|███████▎  | 878/1208 [24:50<09:20,  1.70s/it, loss=0.193, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00168, train/loss_step=0.330, global_step=5353.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  73%|███████▎  | 878/1208 [24:50<09:20,  1.70s/it, loss=0.203, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000749, train/loss_step=0.206, global_step=5353.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  73%|███████▎  | 879/1208 [24:51<09:18,  1.70s/it, loss=0.203, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000749, train/loss_step=0.206, global_step=5353.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  73%|███████▎  | 879/1208 [24:51<09:18,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0544, train/loss_vlb_step=0.000188, train/loss_step=0.0544, global_step=5353.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  73%|███████▎  | 880/1208 [24:54<09:17,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0544, train/loss_vlb_step=0.000188, train/loss_step=0.0544, global_step=5353.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  73%|███████▎  | 880/1208 [24:54<09:17,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.17e-5, train/loss_step=0.00192, global_step=5353.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  73%|███████▎  | 881/1208 [24:55<09:15,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.17e-5, train/loss_step=0.00192, global_step=5353.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  73%|███████▎  | 881/1208 [24:55<09:15,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000759, train/loss_step=0.208, global_step=5354.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  73%|███████▎  | 882/1208 [24:56<09:13,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000759, train/loss_step=0.208, global_step=5354.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  73%|███████▎  | 882/1208 [24:56<09:13,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.480, train/loss_vlb_step=0.00568, train/loss_step=0.480, global_step=5354.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  73%|███████▎  | 883/1208 [24:57<09:11,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.480, train/loss_vlb_step=0.00568, train/loss_step=0.480, global_step=5354.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  73%|███████▎  | 883/1208 [24:57<09:11,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.584, train/loss_vlb_step=0.0131, train/loss_step=0.584, global_step=5354.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  73%|███████▎  | 884/1208 [25:01<09:10,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.584, train/loss_vlb_step=0.0131, train/loss_step=0.584, global_step=5354.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  73%|███████▎  | 884/1208 [25:01<09:10,  1.70s/it, loss=0.201, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00157, train/loss_step=0.334, global_step=5354.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  73%|███████▎  | 885/1208 [25:02<09:08,  1.70s/it, loss=0.201, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00157, train/loss_step=0.334, global_step=5354.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  73%|███████▎  | 885/1208 [25:02<09:08,  1.70s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.45e-5, train/loss_step=0.0143, global_step=5355.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  73%|███████▎  | 886/1208 [25:03<09:06,  1.70s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.45e-5, train/loss_step=0.0143, global_step=5355.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  73%|███████▎  | 886/1208 [25:03<09:06,  1.70s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0585, train/loss_vlb_step=0.000202, train/loss_step=0.0585, global_step=5355.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  73%|███████▎  | 887/1208 [25:04<09:04,  1.70s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0585, train/loss_vlb_step=0.000202, train/loss_step=0.0585, global_step=5355.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  73%|███████▎  | 887/1208 [25:04<09:04,  1.70s/it, loss=0.202, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000931, train/loss_step=0.223, global_step=5355.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  74%|███████▎  | 888/1208 [25:07<09:03,  1.70s/it, loss=0.202, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000931, train/loss_step=0.223, global_step=5355.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  74%|███████▎  | 888/1208 [25:07<09:03,  1.70s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=7.13e-5, train/loss_step=0.0159, global_step=5355.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  74%|███████▎  | 889/1208 [25:08<09:01,  1.70s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=7.13e-5, train/loss_step=0.0159, global_step=5355.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  74%|███████▎  | 889/1208 [25:08<09:01,  1.70s/it, loss=0.211, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000664, train/loss_step=0.182, global_step=5356.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  74%|███████▎  | 890/1208 [25:09<08:59,  1.70s/it, loss=0.211, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000664, train/loss_step=0.182, global_step=5356.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  74%|███████▎  | 890/1208 [25:09<08:59,  1.70s/it, loss=0.212, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.27e-5, train/loss_step=0.0163, global_step=5356.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  74%|███████▍  | 891/1208 [25:10<08:57,  1.70s/it, loss=0.212, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.27e-5, train/loss_step=0.0163, global_step=5356.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  74%|███████▍  | 891/1208 [25:10<08:57,  1.70s/it, loss=0.23, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.0024, train/loss_step=0.367, global_step=5356.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  74%|███████▍  | 892/1208 [25:13<08:56,  1.70s/it, loss=0.23, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.0024, train/loss_step=0.367, global_step=5356.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  74%|███████▍  | 892/1208 [25:13<08:56,  1.70s/it, loss=0.22, v_num=0, train/loss_simple_step=0.0385, train/loss_vlb_step=0.000135, train/loss_step=0.0385, global_step=5356.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  74%|███████▍  | 893/1208 [25:15<08:54,  1.70s/it, loss=0.22, v_num=0, train/loss_simple_step=0.0385, train/loss_vlb_step=0.000135, train/loss_step=0.0385, global_step=5356.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  74%|███████▍  | 893/1208 [25:15<08:54,  1.70s/it, loss=0.216, v_num=0, train/loss_simple_step=0.0851, train/loss_vlb_step=0.000283, train/loss_step=0.0851, global_step=5357.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  74%|███████▍  | 894/1208 [25:16<08:52,  1.70s/it, loss=0.216, v_num=0, train/loss_simple_step=0.0851, train/loss_vlb_step=0.000283, train/loss_step=0.0851, global_step=5357.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  74%|███████▍  | 894/1208 [25:16<08:52,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00306, train/loss_vlb_step=1.7e-5, train/loss_step=0.00306, global_step=5357.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  74%|███████▍  | 895/1208 [25:17<08:50,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00306, train/loss_vlb_step=1.7e-5, train/loss_step=0.00306, global_step=5357.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  74%|███████▍  | 895/1208 [25:17<08:50,  1.70s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0623, train/loss_vlb_step=0.000215, train/loss_step=0.0623, global_step=5357.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  74%|███████▍  | 896/1208 [25:20<08:49,  1.70s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0623, train/loss_vlb_step=0.000215, train/loss_step=0.0623, global_step=5357.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  74%|███████▍  | 896/1208 [25:20<08:49,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00561, train/loss_vlb_step=2.91e-5, train/loss_step=0.00561, global_step=5357.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  74%|███████▍  | 897/1208 [25:21<08:47,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00561, train/loss_vlb_step=2.91e-5, train/loss_step=0.00561, global_step=5357.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  74%|███████▍  | 897/1208 [25:21<08:47,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0734, train/loss_vlb_step=0.000247, train/loss_step=0.0734, global_step=5358.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  74%|███████▍  | 898/1208 [25:22<08:45,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0734, train/loss_vlb_step=0.000247, train/loss_step=0.0734, global_step=5358.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  74%|███████▍  | 898/1208 [25:22<08:45,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000745, train/loss_step=0.195, global_step=5358.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  74%|███████▍  | 899/1208 [25:23<08:43,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000745, train/loss_step=0.195, global_step=5358.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  74%|███████▍  | 899/1208 [25:23<08:43,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0747, train/loss_vlb_step=0.00025, train/loss_step=0.0747, global_step=5358.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  75%|███████▍  | 900/1208 [25:26<08:42,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0747, train/loss_vlb_step=0.00025, train/loss_step=0.0747, global_step=5358.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  75%|███████▍  | 900/1208 [25:26<08:42,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000473, train/loss_step=0.141, global_step=5358.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] 
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.77it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.83it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.76it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.76it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.81it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.80it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.80it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.75it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 17:  75%|███████▍  | 901/1208 [25:57<08:50,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000473, train/loss_step=0.141, global_step=5358.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  75%|███████▍  | 901/1208 [25:57<08:50,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.449, train/loss_vlb_step=0.0025, train/loss_step=0.449, global_step=5359.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  75%|███████▍  | 902/1208 [25:58<08:48,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.449, train/loss_vlb_step=0.0025, train/loss_step=0.449, global_step=5359.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  75%|███████▍  | 902/1208 [25:58<08:48,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0795, train/loss_vlb_step=0.000263, train/loss_step=0.0795, global_step=5359.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  75%|███████▍  | 903/1208 [25:59<08:46,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0795, train/loss_vlb_step=0.000263, train/loss_step=0.0795, global_step=5359.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  75%|███████▍  | 903/1208 [25:59<08:46,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00128, train/loss_step=0.264, global_step=5359.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  75%|███████▍  | 904/1208 [26:01<08:45,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00128, train/loss_step=0.264, global_step=5359.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  75%|███████▍  | 904/1208 [26:01<08:45,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0659, train/loss_vlb_step=0.000232, train/loss_step=0.0659, global_step=5359.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  75%|███████▍  | 905/1208 [26:03<08:43,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0659, train/loss_vlb_step=0.000232, train/loss_step=0.0659, global_step=5359.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  75%|███████▍  | 905/1208 [26:03<08:43,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000591, train/loss_step=0.171, global_step=5360.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  75%|███████▌  | 906/1208 [26:04<08:41,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000591, train/loss_step=0.171, global_step=5360.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  75%|███████▌  | 906/1208 [26:04<08:41,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000742, train/loss_step=0.209, global_step=5360.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  75%|███████▌  | 907/1208 [26:05<08:39,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000742, train/loss_step=0.209, global_step=5360.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  75%|███████▌  | 907/1208 [26:05<08:39,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00144, train/loss_step=0.286, global_step=5360.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  75%|███████▌  | 908/1208 [26:07<08:38,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00144, train/loss_step=0.286, global_step=5360.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  75%|███████▌  | 908/1208 [26:07<08:38,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.609, train/loss_vlb_step=0.0179, train/loss_step=0.609, global_step=5360.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  75%|███████▌  | 909/1208 [26:08<08:36,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.609, train/loss_vlb_step=0.0179, train/loss_step=0.609, global_step=5360.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  75%|███████▌  | 909/1208 [26:08<08:36,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000986, train/loss_step=0.240, global_step=5361.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  75%|███████▌  | 910/1208 [26:09<08:34,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000986, train/loss_step=0.240, global_step=5361.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  75%|███████▌  | 910/1208 [26:09<08:34,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00787, train/loss_vlb_step=3.97e-5, train/loss_step=0.00787, global_step=5361.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  75%|███████▌  | 911/1208 [26:10<08:32,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00787, train/loss_vlb_step=3.97e-5, train/loss_step=0.00787, global_step=5361.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  75%|███████▌  | 911/1208 [26:10<08:32,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.0015, train/loss_step=0.310, global_step=5361.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]     Epoch 17:  75%|███████▌  | 912/1208 [26:13<08:30,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.0015, train/loss_step=0.310, global_step=5361.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  75%|███████▌  | 912/1208 [26:13<08:30,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0745, train/loss_vlb_step=0.000248, train/loss_step=0.0745, global_step=5361.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  76%|███████▌  | 913/1208 [26:14<08:28,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0745, train/loss_vlb_step=0.000248, train/loss_step=0.0745, global_step=5361.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  76%|███████▌  | 913/1208 [26:14<08:28,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000501, train/loss_step=0.150, global_step=5362.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  76%|███████▌  | 914/1208 [26:15<08:26,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000501, train/loss_step=0.150, global_step=5362.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  76%|███████▌  | 914/1208 [26:15<08:26,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00494, train/loss_vlb_step=2.62e-5, train/loss_step=0.00494, global_step=5362.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  76%|███████▌  | 915/1208 [26:16<08:24,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00494, train/loss_vlb_step=2.62e-5, train/loss_step=0.00494, global_step=5362.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  76%|███████▌  | 915/1208 [26:16<08:24,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000505, train/loss_step=0.143, global_step=5362.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  76%|███████▌  | 916/1208 [26:19<08:23,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000505, train/loss_step=0.143, global_step=5362.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  76%|███████▌  | 916/1208 [26:19<08:23,  1.72s/it, loss=0.195, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00159, train/loss_step=0.347, global_step=5362.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  76%|███████▌  | 917/1208 [26:20<08:21,  1.72s/it, loss=0.195, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00159, train/loss_step=0.347, global_step=5362.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  76%|███████▌  | 917/1208 [26:20<08:21,  1.72s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=8.83e-5, train/loss_step=0.0225, global_step=5363.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  76%|███████▌  | 918/1208 [26:21<08:19,  1.72s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=8.83e-5, train/loss_step=0.0225, global_step=5363.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  76%|███████▌  | 918/1208 [26:21<08:19,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.22e-5, train/loss_step=0.0227, global_step=5363.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  76%|███████▌  | 919/1208 [26:22<08:17,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.22e-5, train/loss_step=0.0227, global_step=5363.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  76%|███████▌  | 919/1208 [26:22<08:17,  1.72s/it, loss=0.187, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000493, train/loss_step=0.148, global_step=5363.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  76%|███████▌  | 920/1208 [26:25<08:16,  1.72s/it, loss=0.187, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000493, train/loss_step=0.148, global_step=5363.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  76%|███████▌  | 920/1208 [26:25<08:16,  1.72s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00371, train/loss_vlb_step=2.02e-5, train/loss_step=0.00371, global_step=5363.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  76%|███████▌  | 921/1208 [26:26<08:14,  1.72s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00371, train/loss_vlb_step=2.02e-5, train/loss_step=0.00371, global_step=5363.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  76%|███████▌  | 921/1208 [26:26<08:14,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.000185, train/loss_step=0.0537, global_step=5364.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  76%|███████▋  | 922/1208 [26:27<08:12,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.000185, train/loss_step=0.0537, global_step=5364.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  76%|███████▋  | 922/1208 [26:27<08:12,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000476, train/loss_step=0.143, global_step=5364.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  76%|███████▋  | 923/1208 [26:28<08:10,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000476, train/loss_step=0.143, global_step=5364.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  76%|███████▋  | 923/1208 [26:28<08:10,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000526, train/loss_step=0.154, global_step=5364.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  76%|███████▋  | 924/1208 [26:31<08:09,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000526, train/loss_step=0.154, global_step=5364.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  76%|███████▋  | 924/1208 [26:31<08:09,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=5364.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  77%|███████▋  | 925/1208 [26:32<08:07,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=5364.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  77%|███████▋  | 925/1208 [26:32<08:07,  1.72s/it, loss=0.165, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00116, train/loss_step=0.253, global_step=5365.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  77%|███████▋  | 926/1208 [26:33<08:05,  1.72s/it, loss=0.165, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00116, train/loss_step=0.253, global_step=5365.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  77%|███████▋  | 926/1208 [26:33<08:05,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=1.42e-5, train/loss_step=0.0025, global_step=5365.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  77%|███████▋  | 927/1208 [26:34<08:03,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=1.42e-5, train/loss_step=0.0025, global_step=5365.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  77%|███████▋  | 927/1208 [26:34<08:03,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0452, train/loss_vlb_step=0.000158, train/loss_step=0.0452, global_step=5365.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  77%|███████▋  | 928/1208 [26:37<08:02,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0452, train/loss_vlb_step=0.000158, train/loss_step=0.0452, global_step=5365.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  77%|███████▋  | 928/1208 [26:37<08:02,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0566, train/loss_vlb_step=0.000194, train/loss_step=0.0566, global_step=5365.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  77%|███████▋  | 929/1208 [26:38<08:00,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0566, train/loss_vlb_step=0.000194, train/loss_step=0.0566, global_step=5365.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  77%|███████▋  | 929/1208 [26:38<08:00,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0707, train/loss_vlb_step=0.000243, train/loss_step=0.0707, global_step=5366.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  77%|███████▋  | 930/1208 [26:39<07:58,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0707, train/loss_vlb_step=0.000243, train/loss_step=0.0707, global_step=5366.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  77%|███████▋  | 930/1208 [26:39<07:58,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00107, train/loss_step=0.254, global_step=5366.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  77%|███████▋  | 931/1208 [26:40<07:56,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00107, train/loss_step=0.254, global_step=5366.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  77%|███████▋  | 931/1208 [26:40<07:56,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0611, train/loss_vlb_step=0.00021, train/loss_step=0.0611, global_step=5366.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  77%|███████▋  | 932/1208 [26:43<07:54,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0611, train/loss_vlb_step=0.00021, train/loss_step=0.0611, global_step=5366.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  77%|███████▋  | 932/1208 [26:43<07:54,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000394, train/loss_step=0.120, global_step=5366.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  77%|███████▋  | 933/1208 [26:44<07:52,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000394, train/loss_step=0.120, global_step=5366.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  77%|███████▋  | 933/1208 [26:44<07:52,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.58e-5, train/loss_step=0.0102, global_step=5367.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  77%|███████▋  | 934/1208 [26:45<07:50,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.58e-5, train/loss_step=0.0102, global_step=5367.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  77%|███████▋  | 934/1208 [26:45<07:50,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00435, train/loss_vlb_step=2.35e-5, train/loss_step=0.00435, global_step=5367.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  77%|███████▋  | 935/1208 [26:46<07:49,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00435, train/loss_vlb_step=2.35e-5, train/loss_step=0.00435, global_step=5367.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  77%|███████▋  | 935/1208 [26:46<07:49,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000359, train/loss_step=0.107, global_step=5367.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]     Epoch 17:  77%|███████▋  | 936/1208 [26:49<07:47,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000359, train/loss_step=0.107, global_step=5367.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  77%|███████▋  | 936/1208 [26:49<07:47,  1.72s/it, loss=0.0846, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.000127, train/loss_step=0.0351, global_step=5367.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  78%|███████▊  | 937/1208 [26:50<07:45,  1.72s/it, loss=0.0846, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.000127, train/loss_step=0.0351, global_step=5367.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  78%|███████▊  | 937/1208 [26:50<07:45,  1.72s/it, loss=0.0894, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=5368.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  78%|███████▊  | 938/1208 [26:51<07:43,  1.72s/it, loss=0.0894, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=5368.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  78%|███████▊  | 938/1208 [26:51<07:43,  1.72s/it, loss=0.089, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=5.93e-5, train/loss_step=0.0139, global_step=5368.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  78%|███████▊  | 939/1208 [26:52<07:41,  1.72s/it, loss=0.089, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=5.93e-5, train/loss_step=0.0139, global_step=5368.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  78%|███████▊  | 939/1208 [26:52<07:41,  1.72s/it, loss=0.0818, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=2.07e-5, train/loss_step=0.00388, global_step=5368.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  78%|███████▊  | 940/1208 [26:55<07:40,  1.72s/it, loss=0.0818, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=2.07e-5, train/loss_step=0.00388, global_step=5368.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  78%|███████▊  | 940/1208 [26:55<07:40,  1.72s/it, loss=0.082, v_num=0, train/loss_simple_step=0.00731, train/loss_vlb_step=3.56e-5, train/loss_step=0.00731, global_step=5368.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  78%|███████▊  | 941/1208 [26:56<07:38,  1.72s/it, loss=0.082, v_num=0, train/loss_simple_step=0.00731, train/loss_vlb_step=3.56e-5, train/loss_step=0.00731, global_step=5368.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  78%|███████▊  | 941/1208 [26:56<07:38,  1.72s/it, loss=0.092, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00125, train/loss_step=0.254, global_step=5369.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  78%|███████▊  | 942/1208 [26:57<07:36,  1.72s/it, loss=0.092, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00125, train/loss_step=0.254, global_step=5369.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  78%|███████▊  | 942/1208 [26:57<07:36,  1.72s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.0051, train/loss_vlb_step=2.66e-5, train/loss_step=0.0051, global_step=5369.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  78%|███████▊  | 943/1208 [26:58<07:34,  1.72s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.0051, train/loss_vlb_step=2.66e-5, train/loss_step=0.0051, global_step=5369.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  78%|███████▊  | 943/1208 [26:58<07:34,  1.72s/it, loss=0.0783, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=7.75e-5, train/loss_step=0.0189, global_step=5369.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  78%|███████▊  | 944/1208 [27:01<07:33,  1.72s/it, loss=0.0783, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=7.75e-5, train/loss_step=0.0189, global_step=5369.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  78%|███████▊  | 944/1208 [27:01<07:33,  1.72s/it, loss=0.0782, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=5369.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  78%|███████▊  | 945/1208 [27:02<07:31,  1.72s/it, loss=0.0782, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=5369.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  78%|███████▊  | 945/1208 [27:02<07:31,  1.72s/it, loss=0.0661, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.99e-5, train/loss_step=0.0107, global_step=5370.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  78%|███████▊  | 946/1208 [27:03<07:29,  1.72s/it, loss=0.0661, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.99e-5, train/loss_step=0.0107, global_step=5370.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  78%|███████▊  | 946/1208 [27:03<07:29,  1.72s/it, loss=0.0697, v_num=0, train/loss_simple_step=0.0758, train/loss_vlb_step=0.00025, train/loss_step=0.0758, global_step=5370.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  78%|███████▊  | 947/1208 [27:04<07:27,  1.72s/it, loss=0.0697, v_num=0, train/loss_simple_step=0.0758, train/loss_vlb_step=0.00025, train/loss_step=0.0758, global_step=5370.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  78%|███████▊  | 947/1208 [27:04<07:27,  1.72s/it, loss=0.0676, v_num=0, train/loss_simple_step=0.00252, train/loss_vlb_step=1.36e-5, train/loss_step=0.00252, global_step=5370.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  78%|███████▊  | 948/1208 [27:07<07:26,  1.72s/it, loss=0.0676, v_num=0, train/loss_simple_step=0.00252, train/loss_vlb_step=1.36e-5, train/loss_step=0.00252, global_step=5370.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  78%|███████▊  | 948/1208 [27:07<07:26,  1.72s/it, loss=0.0907, v_num=0, train/loss_simple_step=0.518, train/loss_vlb_step=0.00896, train/loss_step=0.518, global_step=5370.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  79%|███████▊  | 949/1208 [27:08<07:24,  1.72s/it, loss=0.0907, v_num=0, train/loss_simple_step=0.518, train/loss_vlb_step=0.00896, train/loss_step=0.518, global_step=5370.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  79%|███████▊  | 949/1208 [27:08<07:24,  1.72s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.00055, train/loss_step=0.164, global_step=5371.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  79%|███████▊  | 950/1208 [27:09<07:22,  1.71s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.00055, train/loss_step=0.164, global_step=5371.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  79%|███████▊  | 950/1208 [27:09<07:22,  1.71s/it, loss=0.0828, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.22e-5, train/loss_step=0.00202, global_step=5371.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  79%|███████▊  | 951/1208 [27:10<07:20,  1.71s/it, loss=0.0828, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.22e-5, train/loss_step=0.00202, global_step=5371.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  79%|███████▊  | 951/1208 [27:10<07:20,  1.71s/it, loss=0.0803, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.82e-5, train/loss_step=0.0107, global_step=5371.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  79%|███████▉  | 952/1208 [27:13<07:19,  1.72s/it, loss=0.0803, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.82e-5, train/loss_step=0.0107, global_step=5371.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  79%|███████▉  | 952/1208 [27:13<07:19,  1.72s/it, loss=0.0749, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.68e-5, train/loss_step=0.0127, global_step=5371.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  79%|███████▉  | 953/1208 [27:14<07:17,  1.71s/it, loss=0.0749, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.68e-5, train/loss_step=0.0127, global_step=5371.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  79%|███████▉  | 953/1208 [27:14<07:17,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.677, train/loss_vlb_step=0.012, train/loss_step=0.677, global_step=5372.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]     Epoch 17:  79%|███████▉  | 954/1208 [27:15<07:15,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.677, train/loss_vlb_step=0.012, train/loss_step=0.677, global_step=5372.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  79%|███████▉  | 954/1208 [27:15<07:15,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000638, train/loss_step=0.188, global_step=5372.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  79%|███████▉  | 955/1208 [27:16<07:13,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000638, train/loss_step=0.188, global_step=5372.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  79%|███████▉  | 955/1208 [27:16<07:13,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000515, train/loss_step=0.154, global_step=5372.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  79%|███████▉  | 956/1208 [27:19<07:12,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000515, train/loss_step=0.154, global_step=5372.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  79%|███████▉  | 956/1208 [27:19<07:12,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00806, train/loss_vlb_step=3.76e-5, train/loss_step=0.00806, global_step=5372.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  79%|███████▉  | 957/1208 [27:20<07:10,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00806, train/loss_vlb_step=3.76e-5, train/loss_step=0.00806, global_step=5372.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  79%|███████▉  | 957/1208 [27:20<07:10,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0038, train/loss_vlb_step=2.13e-5, train/loss_step=0.0038, global_step=5373.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  79%|███████▉  | 958/1208 [27:21<07:08,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0038, train/loss_vlb_step=2.13e-5, train/loss_step=0.0038, global_step=5373.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  79%|███████▉  | 958/1208 [27:21<07:08,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000294, train/loss_step=0.0891, global_step=5373.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  79%|███████▉  | 959/1208 [27:22<07:06,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000294, train/loss_step=0.0891, global_step=5373.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  79%|███████▉  | 959/1208 [27:22<07:06,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=1.36e-5, train/loss_step=0.00223, global_step=5373.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  79%|███████▉  | 960/1208 [27:24<07:04,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=1.36e-5, train/loss_step=0.00223, global_step=5373.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  79%|███████▉  | 960/1208 [27:24<07:04,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.000137, train/loss_step=0.0362, global_step=5373.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  80%|███████▉  | 961/1208 [27:26<07:03,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.000137, train/loss_step=0.0362, global_step=5373.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  80%|███████▉  | 961/1208 [27:26<07:03,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=9.36e-5, train/loss_step=0.0253, global_step=5374.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  80%|███████▉  | 962/1208 [27:27<07:01,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=9.36e-5, train/loss_step=0.0253, global_step=5374.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  80%|███████▉  | 962/1208 [27:27<07:01,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=1.02e-5, train/loss_step=0.00168, global_step=5374.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  80%|███████▉  | 963/1208 [27:28<06:59,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=1.02e-5, train/loss_step=0.00168, global_step=5374.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  80%|███████▉  | 963/1208 [27:28<06:59,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00153, train/loss_step=0.291, global_step=5374.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]     Epoch 17:  80%|███████▉  | 964/1208 [27:30<06:57,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00153, train/loss_step=0.291, global_step=5374.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  80%|███████▉  | 964/1208 [27:30<06:57,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.437, train/loss_vlb_step=0.00546, train/loss_step=0.437, global_step=5374.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  80%|███████▉  | 965/1208 [27:31<06:55,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.437, train/loss_vlb_step=0.00546, train/loss_step=0.437, global_step=5374.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  80%|███████▉  | 965/1208 [27:31<06:55,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.00012, train/loss_step=0.0313, global_step=5375.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  80%|███████▉  | 966/1208 [27:32<06:54,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.00012, train/loss_step=0.0313, global_step=5375.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  80%|███████▉  | 966/1208 [27:32<06:54,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.54e-5, train/loss_step=0.0123, global_step=5375.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  80%|████████  | 967/1208 [27:33<06:52,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.54e-5, train/loss_step=0.0123, global_step=5375.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  80%|████████  | 967/1208 [27:33<06:52,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.04e-5, train/loss_step=0.00176, global_step=5375.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  80%|████████  | 968/1208 [27:36<06:50,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.04e-5, train/loss_step=0.00176, global_step=5375.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  80%|████████  | 968/1208 [27:36<06:50,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.48e-5, train/loss_step=0.0126, global_step=5375.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  80%|████████  | 969/1208 [27:37<06:48,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.48e-5, train/loss_step=0.0126, global_step=5375.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  80%|████████  | 969/1208 [27:37<06:48,  1.71s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.47e-5, train/loss_step=0.0145, global_step=5376.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  80%|████████  | 970/1208 [27:38<06:47,  1.71s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.47e-5, train/loss_step=0.0145, global_step=5376.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  80%|████████  | 970/1208 [27:38<06:47,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000549, train/loss_step=0.159, global_step=5376.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  80%|████████  | 971/1208 [27:39<06:45,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000549, train/loss_step=0.159, global_step=5376.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  80%|████████  | 971/1208 [27:39<06:45,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.25e-5, train/loss_step=0.0146, global_step=5376.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  80%|████████  | 972/1208 [27:42<06:43,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.25e-5, train/loss_step=0.0146, global_step=5376.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  80%|████████  | 972/1208 [27:42<06:43,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000107, train/loss_step=0.0274, global_step=5376.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  81%|████████  | 973/1208 [27:43<06:41,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000107, train/loss_step=0.0274, global_step=5376.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  81%|████████  | 973/1208 [27:43<06:41,  1.71s/it, loss=0.0792, v_num=0, train/loss_simple_step=0.0764, train/loss_vlb_step=0.000255, train/loss_step=0.0764, global_step=5377.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  81%|████████  | 974/1208 [27:44<06:39,  1.71s/it, loss=0.0792, v_num=0, train/loss_simple_step=0.0764, train/loss_vlb_step=0.000255, train/loss_step=0.0764, global_step=5377.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  81%|████████  | 974/1208 [27:44<06:39,  1.71s/it, loss=0.0709, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.49e-5, train/loss_step=0.0212, global_step=5377.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  81%|████████  | 975/1208 [27:45<06:38,  1.71s/it, loss=0.0709, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.49e-5, train/loss_step=0.0212, global_step=5377.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  81%|████████  | 975/1208 [27:45<06:38,  1.71s/it, loss=0.0692, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=5377.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  81%|████████  | 976/1208 [27:48<06:36,  1.71s/it, loss=0.0692, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=5377.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  81%|████████  | 976/1208 [27:48<06:36,  1.71s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.444, train/loss_vlb_step=0.00311, train/loss_step=0.444, global_step=5377.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  81%|████████  | 977/1208 [27:49<06:34,  1.71s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.444, train/loss_vlb_step=0.00311, train/loss_step=0.444, global_step=5377.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  81%|████████  | 977/1208 [27:49<06:34,  1.71s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.0866, train/loss_vlb_step=0.000286, train/loss_step=0.0866, global_step=5378.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  81%|████████  | 978/1208 [27:50<06:32,  1.71s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.0866, train/loss_vlb_step=0.000286, train/loss_step=0.0866, global_step=5378.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  81%|████████  | 978/1208 [27:50<06:32,  1.71s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.43e-5, train/loss_step=0.016, global_step=5378.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  81%|████████  | 979/1208 [27:51<06:31,  1.71s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.43e-5, train/loss_step=0.016, global_step=5378.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  81%|████████  | 979/1208 [27:51<06:31,  1.71s/it, loss=0.115, v_num=0, train/loss_simple_step=0.480, train/loss_vlb_step=0.00624, train/loss_step=0.480, global_step=5378.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  81%|████████  | 980/1208 [27:54<06:29,  1.71s/it, loss=0.115, v_num=0, train/loss_simple_step=0.480, train/loss_vlb_step=0.00624, train/loss_step=0.480, global_step=5378.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  81%|████████  | 980/1208 [27:54<06:29,  1.71s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000122, train/loss_step=0.0345, global_step=5378.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  81%|████████  | 981/1208 [27:55<06:27,  1.71s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000122, train/loss_step=0.0345, global_step=5378.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  81%|████████  | 981/1208 [27:55<06:27,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0472, train/loss_vlb_step=0.000171, train/loss_step=0.0472, global_step=5379.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  81%|████████▏ | 982/1208 [27:56<06:25,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0472, train/loss_vlb_step=0.000171, train/loss_step=0.0472, global_step=5379.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  81%|████████▏ | 982/1208 [27:56<06:25,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=8.89e-5, train/loss_step=0.022, global_step=5379.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  81%|████████▏ | 983/1208 [27:57<06:23,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=8.89e-5, train/loss_step=0.022, global_step=5379.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  81%|████████▏ | 983/1208 [27:57<06:23,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0938, train/loss_vlb_step=0.000309, train/loss_step=0.0938, global_step=5379.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  81%|████████▏ | 984/1208 [28:00<06:22,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0938, train/loss_vlb_step=0.000309, train/loss_step=0.0938, global_step=5379.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  81%|████████▏ | 984/1208 [28:00<06:22,  1.71s/it, loss=0.0863, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.24e-5, train/loss_step=0.012, global_step=5379.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  82%|████████▏ | 985/1208 [28:01<06:20,  1.71s/it, loss=0.0863, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.24e-5, train/loss_step=0.012, global_step=5379.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  82%|████████▏ | 985/1208 [28:01<06:20,  1.71s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.46e-5, train/loss_step=0.00261, global_step=5380.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  82%|████████▏ | 986/1208 [28:02<06:18,  1.71s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.46e-5, train/loss_step=0.00261, global_step=5380.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  82%|████████▏ | 986/1208 [28:02<06:18,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00316, train/loss_step=0.414, global_step=5380.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]     Epoch 17:  82%|████████▏ | 987/1208 [28:03<06:16,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00316, train/loss_step=0.414, global_step=5380.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  82%|████████▏ | 987/1208 [28:03<06:16,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000545, train/loss_step=0.159, global_step=5380.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  82%|████████▏ | 988/1208 [28:06<06:15,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000545, train/loss_step=0.159, global_step=5380.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  82%|████████▏ | 988/1208 [28:06<06:15,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.91e-5, train/loss_step=0.0131, global_step=5380.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  82%|████████▏ | 989/1208 [28:07<06:13,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.91e-5, train/loss_step=0.0131, global_step=5380.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  82%|████████▏ | 989/1208 [28:07<06:13,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.451, train/loss_vlb_step=0.00575, train/loss_step=0.451, global_step=5381.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  82%|████████▏ | 990/1208 [28:08<06:11,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.451, train/loss_vlb_step=0.00575, train/loss_step=0.451, global_step=5381.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  82%|████████▏ | 990/1208 [28:08<06:11,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0501, train/loss_vlb_step=0.000179, train/loss_step=0.0501, global_step=5381.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  82%|████████▏ | 991/1208 [28:09<06:09,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0501, train/loss_vlb_step=0.000179, train/loss_step=0.0501, global_step=5381.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  82%|████████▏ | 991/1208 [28:09<06:09,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00651, train/loss_vlb_step=3.36e-5, train/loss_step=0.00651, global_step=5381.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  82%|████████▏ | 992/1208 [28:12<06:08,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00651, train/loss_vlb_step=3.36e-5, train/loss_step=0.00651, global_step=5381.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  82%|████████▏ | 992/1208 [28:12<06:08,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.79e-5, train/loss_step=0.0128, global_step=5381.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  82%|████████▏ | 993/1208 [28:13<06:06,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.79e-5, train/loss_step=0.0128, global_step=5381.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  82%|████████▏ | 993/1208 [28:13<06:06,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.491, train/loss_vlb_step=0.00679, train/loss_step=0.491, global_step=5382.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  82%|████████▏ | 994/1208 [28:14<06:04,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.491, train/loss_vlb_step=0.00679, train/loss_step=0.491, global_step=5382.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  82%|████████▏ | 994/1208 [28:14<06:04,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000115, train/loss_step=0.0301, global_step=5382.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  82%|████████▏ | 995/1208 [28:15<06:02,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000115, train/loss_step=0.0301, global_step=5382.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  82%|████████▏ | 995/1208 [28:15<06:02,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=5382.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  82%|████████▏ | 996/1208 [28:18<06:01,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=5382.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  82%|████████▏ | 996/1208 [28:18<06:01,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0398, train/loss_vlb_step=0.000153, train/loss_step=0.0398, global_step=5382.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  83%|████████▎ | 997/1208 [28:19<05:59,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0398, train/loss_vlb_step=0.000153, train/loss_step=0.0398, global_step=5382.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  83%|████████▎ | 997/1208 [28:19<05:59,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00211, train/loss_step=0.357, global_step=5383.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  83%|████████▎ | 998/1208 [28:20<05:57,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00211, train/loss_step=0.357, global_step=5383.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  83%|████████▎ | 998/1208 [28:20<05:57,  1.70s/it, loss=0.155, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00109, train/loss_step=0.281, global_step=5383.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  83%|████████▎ | 999/1208 [28:21<05:55,  1.70s/it, loss=0.155, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00109, train/loss_step=0.281, global_step=5383.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  83%|████████▎ | 999/1208 [28:21<05:55,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000983, train/loss_step=0.239, global_step=5383.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  83%|████████▎ | 1000/1208 [28:24<05:54,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000983, train/loss_step=0.239, global_step=5383.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  83%|████████▎ | 1000/1208 [28:24<05:54,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000162, train/loss_step=0.0438, global_step=5383.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  83%|████████▎ | 1001/1208 [28:25<05:52,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000162, train/loss_step=0.0438, global_step=5383.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  83%|████████▎ | 1001/1208 [28:25<05:52,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00314, train/loss_vlb_step=1.75e-5, train/loss_step=0.00314, global_step=5384.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  83%|████████▎ | 1002/1208 [28:26<05:50,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00314, train/loss_vlb_step=1.75e-5, train/loss_step=0.00314, global_step=5384.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  83%|████████▎ | 1002/1208 [28:26<05:50,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00282, train/loss_step=0.372, global_step=5384.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  83%|████████▎ | 1003/1208 [28:27<05:48,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00282, train/loss_step=0.372, global_step=5384.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  83%|████████▎ | 1003/1208 [28:27<05:48,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=5384.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  83%|████████▎ | 1004/1208 [28:30<05:47,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=5384.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  83%|████████▎ | 1004/1208 [28:30<05:47,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000458, train/loss_step=0.139, global_step=5384.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  83%|████████▎ | 1005/1208 [28:31<05:45,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000458, train/loss_step=0.139, global_step=5384.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  83%|████████▎ | 1005/1208 [28:31<05:45,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.52e-5, train/loss_step=0.00261, global_step=5385.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  83%|████████▎ | 1006/1208 [28:32<05:43,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.52e-5, train/loss_step=0.00261, global_step=5385.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  83%|████████▎ | 1006/1208 [28:32<05:43,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0978, train/loss_vlb_step=0.000321, train/loss_step=0.0978, global_step=5385.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  83%|████████▎ | 1007/1208 [28:33<05:41,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0978, train/loss_vlb_step=0.000321, train/loss_step=0.0978, global_step=5385.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  83%|████████▎ | 1007/1208 [28:33<05:41,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00177, train/loss_step=0.318, global_step=5385.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  83%|████████▎ | 1008/1208 [28:36<05:40,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00177, train/loss_step=0.318, global_step=5385.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  83%|████████▎ | 1008/1208 [28:36<05:40,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=2.56e-5, train/loss_step=0.00481, global_step=5385.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  84%|████████▎ | 1009/1208 [28:37<05:38,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=2.56e-5, train/loss_step=0.00481, global_step=5385.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  84%|████████▎ | 1009/1208 [28:37<05:38,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000117, train/loss_step=0.0302, global_step=5386.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  84%|████████▎ | 1010/1208 [28:38<05:36,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000117, train/loss_step=0.0302, global_step=5386.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  84%|████████▎ | 1010/1208 [28:38<05:36,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.666, train/loss_vlb_step=0.0268, train/loss_step=0.666, global_step=5386.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  84%|████████▎ | 1011/1208 [28:39<05:34,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.666, train/loss_vlb_step=0.0268, train/loss_step=0.666, global_step=5386.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  84%|████████▎ | 1011/1208 [28:39<05:34,  1.70s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0969, train/loss_vlb_step=0.000318, train/loss_step=0.0969, global_step=5386.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  84%|████████▍ | 1012/1208 [28:41<05:33,  1.70s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0969, train/loss_vlb_step=0.000318, train/loss_step=0.0969, global_step=5386.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  84%|████████▍ | 1012/1208 [28:41<05:33,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000403, train/loss_step=0.123, global_step=5386.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  84%|████████▍ | 1013/1208 [28:42<05:31,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000403, train/loss_step=0.123, global_step=5386.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  84%|████████▍ | 1013/1208 [28:42<05:31,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00126, train/loss_step=0.281, global_step=5387.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  84%|████████▍ | 1014/1208 [28:44<05:29,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00126, train/loss_step=0.281, global_step=5387.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  84%|████████▍ | 1014/1208 [28:44<05:29,  1.70s/it, loss=0.174, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000581, train/loss_step=0.169, global_step=5387.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  84%|████████▍ | 1015/1208 [28:45<05:28,  1.70s/it, loss=0.174, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000581, train/loss_step=0.169, global_step=5387.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  84%|████████▍ | 1015/1208 [28:45<05:28,  1.70s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.53e-5, train/loss_step=0.0145, global_step=5387.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  84%|████████▍ | 1016/1208 [28:47<05:26,  1.70s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.53e-5, train/loss_step=0.0145, global_step=5387.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  84%|████████▍ | 1016/1208 [28:47<05:26,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.047, train/loss_vlb_step=0.000163, train/loss_step=0.047, global_step=5387.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  84%|████████▍ | 1017/1208 [28:48<05:24,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.047, train/loss_vlb_step=0.000163, train/loss_step=0.047, global_step=5387.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  84%|████████▍ | 1017/1208 [28:48<05:24,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.44e-5, train/loss_step=0.0206, global_step=5388.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  84%|████████▍ | 1018/1208 [28:49<05:22,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.44e-5, train/loss_step=0.0206, global_step=5388.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  84%|████████▍ | 1018/1208 [28:49<05:22,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00709, train/loss_step=0.434, global_step=5388.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  84%|████████▍ | 1019/1208 [28:50<05:21,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00709, train/loss_step=0.434, global_step=5388.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  84%|████████▍ | 1019/1208 [28:50<05:21,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0603, train/loss_vlb_step=0.000208, train/loss_step=0.0603, global_step=5388.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  84%|████████▍ | 1020/1208 [28:53<05:19,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0603, train/loss_vlb_step=0.000208, train/loss_step=0.0603, global_step=5388.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  84%|████████▍ | 1020/1208 [28:53<05:19,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=5388.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  85%|████████▍ | 1021/1208 [28:54<05:17,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=5388.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  85%|████████▍ | 1021/1208 [28:54<05:17,  1.70s/it, loss=0.176, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00363, train/loss_step=0.433, global_step=5389.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  85%|████████▍ | 1022/1208 [28:56<05:15,  1.70s/it, loss=0.176, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00363, train/loss_step=0.433, global_step=5389.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  85%|████████▍ | 1022/1208 [28:56<05:15,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.15e-5, train/loss_step=0.0172, global_step=5389.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  85%|████████▍ | 1023/1208 [28:57<05:14,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.15e-5, train/loss_step=0.0172, global_step=5389.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  85%|████████▍ | 1023/1208 [28:57<05:14,  1.70s/it, loss=0.174, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00507, train/loss_step=0.428, global_step=5389.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  85%|████████▍ | 1024/1208 [29:00<05:12,  1.70s/it, loss=0.174, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00507, train/loss_step=0.428, global_step=5389.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  85%|████████▍ | 1024/1208 [29:00<05:12,  1.70s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.16e-5, train/loss_step=0.0228, global_step=5389.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  85%|████████▍ | 1025/1208 [29:01<05:10,  1.70s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.16e-5, train/loss_step=0.0228, global_step=5389.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  85%|████████▍ | 1025/1208 [29:01<05:10,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=1.1e-5, train/loss_step=0.00184, global_step=5390.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  85%|████████▍ | 1026/1208 [29:02<05:09,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=1.1e-5, train/loss_step=0.00184, global_step=5390.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  85%|████████▍ | 1026/1208 [29:02<05:09,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0404, train/loss_vlb_step=0.000153, train/loss_step=0.0404, global_step=5390.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  85%|████████▌ | 1027/1208 [29:03<05:07,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0404, train/loss_vlb_step=0.000153, train/loss_step=0.0404, global_step=5390.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  85%|████████▌ | 1027/1208 [29:03<05:07,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00146, train/loss_step=0.308, global_step=5390.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  85%|████████▌ | 1028/1208 [29:06<05:05,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00146, train/loss_step=0.308, global_step=5390.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  85%|████████▌ | 1028/1208 [29:06<05:05,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=9.92e-5, train/loss_step=0.0254, global_step=5390.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  85%|████████▌ | 1029/1208 [29:07<05:04,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=9.92e-5, train/loss_step=0.0254, global_step=5390.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  85%|████████▌ | 1029/1208 [29:07<05:04,  1.70s/it, loss=0.179, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00129, train/loss_step=0.286, global_step=5391.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  85%|████████▌ | 1030/1208 [29:08<05:02,  1.70s/it, loss=0.179, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00129, train/loss_step=0.286, global_step=5391.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  85%|████████▌ | 1030/1208 [29:08<05:02,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00172, train/loss_step=0.326, global_step=5391.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  85%|████████▌ | 1031/1208 [29:09<05:00,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00172, train/loss_step=0.326, global_step=5391.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  85%|████████▌ | 1031/1208 [29:09<05:00,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00551, train/loss_vlb_step=2.89e-5, train/loss_step=0.00551, global_step=5391.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  85%|████████▌ | 1032/1208 [29:13<04:58,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00551, train/loss_vlb_step=2.89e-5, train/loss_step=0.00551, global_step=5391.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  85%|████████▌ | 1032/1208 [29:13<04:58,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000121, train/loss_step=0.0314, global_step=5391.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  86%|████████▌ | 1033/1208 [29:14<04:57,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000121, train/loss_step=0.0314, global_step=5391.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  86%|████████▌ | 1033/1208 [29:14<04:57,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00499, train/loss_vlb_step=2.68e-5, train/loss_step=0.00499, global_step=5392.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  86%|████████▌ | 1034/1208 [29:15<04:55,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00499, train/loss_vlb_step=2.68e-5, train/loss_step=0.00499, global_step=5392.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  86%|████████▌ | 1034/1208 [29:15<04:55,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000707, train/loss_step=0.186, global_step=5392.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  86%|████████▌ | 1035/1208 [29:16<04:53,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000707, train/loss_step=0.186, global_step=5392.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  86%|████████▌ | 1035/1208 [29:16<04:53,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0501, train/loss_vlb_step=0.000184, train/loss_step=0.0501, global_step=5392.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  86%|████████▌ | 1036/1208 [29:19<04:52,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0501, train/loss_vlb_step=0.000184, train/loss_step=0.0501, global_step=5392.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  86%|████████▌ | 1036/1208 [29:19<04:52,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=0.000102, train/loss_step=0.0257, global_step=5392.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  86%|████████▌ | 1037/1208 [29:20<04:50,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=0.000102, train/loss_step=0.0257, global_step=5392.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  86%|████████▌ | 1037/1208 [29:20<04:50,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.46e-5, train/loss_step=0.00253, global_step=5393.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  86%|████████▌ | 1038/1208 [29:21<04:48,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.46e-5, train/loss_step=0.00253, global_step=5393.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  86%|████████▌ | 1038/1208 [29:21<04:48,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.0014, train/loss_step=0.310, global_step=5393.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  86%|████████▌ | 1039/1208 [29:22<04:46,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.0014, train/loss_step=0.310, global_step=5393.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  86%|████████▌ | 1039/1208 [29:22<04:46,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.090, train/loss_vlb_step=0.000296, train/loss_step=0.090, global_step=5393.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  86%|████████▌ | 1040/1208 [29:25<04:45,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.090, train/loss_vlb_step=0.000296, train/loss_step=0.090, global_step=5393.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  86%|████████▌ | 1040/1208 [29:25<04:45,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00327, train/loss_vlb_step=1.87e-5, train/loss_step=0.00327, global_step=5393.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  86%|████████▌ | 1041/1208 [29:26<04:43,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00327, train/loss_vlb_step=1.87e-5, train/loss_step=0.00327, global_step=5393.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  86%|████████▌ | 1041/1208 [29:26<04:43,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.27e-5, train/loss_step=0.00213, global_step=5394.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  86%|████████▋ | 1042/1208 [29:27<04:41,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.27e-5, train/loss_step=0.00213, global_step=5394.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  86%|████████▋ | 1042/1208 [29:27<04:41,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=5394.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  86%|████████▋ | 1043/1208 [29:28<04:39,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=5394.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  86%|████████▋ | 1043/1208 [29:28<04:39,  1.70s/it, loss=0.0959, v_num=0, train/loss_simple_step=0.0881, train/loss_vlb_step=0.000292, train/loss_step=0.0881, global_step=5394.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  86%|████████▋ | 1044/1208 [29:31<04:38,  1.70s/it, loss=0.0959, v_num=0, train/loss_simple_step=0.0881, train/loss_vlb_step=0.000292, train/loss_step=0.0881, global_step=5394.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  86%|████████▋ | 1044/1208 [29:31<04:38,  1.70s/it, loss=0.095, v_num=0, train/loss_simple_step=0.005, train/loss_vlb_step=2.69e-5, train/loss_step=0.005, global_step=5394.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  87%|████████▋ | 1045/1208 [29:32<04:36,  1.70s/it, loss=0.095, v_num=0, train/loss_simple_step=0.005, train/loss_vlb_step=2.69e-5, train/loss_step=0.005, global_step=5394.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  87%|████████▋ | 1045/1208 [29:32<04:36,  1.70s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.0715, train/loss_vlb_step=0.000239, train/loss_step=0.0715, global_step=5395.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  87%|████████▋ | 1046/1208 [29:33<04:34,  1.70s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.0715, train/loss_vlb_step=0.000239, train/loss_step=0.0715, global_step=5395.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  87%|████████▋ | 1046/1208 [29:33<04:34,  1.70s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.23e-5, train/loss_step=0.00208, global_step=5395.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  87%|████████▋ | 1047/1208 [29:34<04:32,  1.70s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.23e-5, train/loss_step=0.00208, global_step=5395.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  87%|████████▋ | 1047/1208 [29:34<04:32,  1.70s/it, loss=0.087, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=5395.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  87%|████████▋ | 1048/1208 [29:38<04:31,  1.70s/it, loss=0.087, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=5395.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  87%|████████▋ | 1048/1208 [29:38<04:31,  1.70s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.79e-5, train/loss_step=0.0134, global_step=5395.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  87%|████████▋ | 1049/1208 [29:39<04:29,  1.70s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.79e-5, train/loss_step=0.0134, global_step=5395.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  87%|████████▋ | 1049/1208 [29:39<04:29,  1.70s/it, loss=0.0789, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000462, train/loss_step=0.137, global_step=5396.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  87%|████████▋ | 1050/1208 [29:40<04:27,  1.70s/it, loss=0.0789, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000462, train/loss_step=0.137, global_step=5396.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  87%|████████▋ | 1050/1208 [29:40<04:27,  1.70s/it, loss=0.0633, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.71e-5, train/loss_step=0.0133, global_step=5396.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  87%|████████▋ | 1051/1208 [29:41<04:26,  1.69s/it, loss=0.0633, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.71e-5, train/loss_step=0.0133, global_step=5396.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  87%|████████▋ | 1051/1208 [29:41<04:26,  1.69s/it, loss=0.064, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=7.55e-5, train/loss_step=0.0189, global_step=5396.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  87%|████████▋ | 1052/1208 [29:44<04:24,  1.70s/it, loss=0.064, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=7.55e-5, train/loss_step=0.0189, global_step=5396.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  87%|████████▋ | 1052/1208 [29:44<04:24,  1.70s/it, loss=0.0643, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000137, train/loss_step=0.0369, global_step=5396.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  87%|████████▋ | 1053/1208 [29:45<04:22,  1.70s/it, loss=0.0643, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000137, train/loss_step=0.0369, global_step=5396.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  87%|████████▋ | 1053/1208 [29:45<04:22,  1.70s/it, loss=0.0658, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.000136, train/loss_step=0.0352, global_step=5397.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  87%|████████▋ | 1054/1208 [29:46<04:21,  1.70s/it, loss=0.0658, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.000136, train/loss_step=0.0352, global_step=5397.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  87%|████████▋ | 1054/1208 [29:46<04:21,  1.70s/it, loss=0.0581, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000129, train/loss_step=0.0339, global_step=5397.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  87%|████████▋ | 1055/1208 [29:47<04:19,  1.69s/it, loss=0.0581, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000129, train/loss_step=0.0339, global_step=5397.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  87%|████████▋ | 1055/1208 [29:47<04:19,  1.69s/it, loss=0.0628, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000481, train/loss_step=0.144, global_step=5397.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  87%|████████▋ | 1056/1208 [29:50<04:17,  1.70s/it, loss=0.0628, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000481, train/loss_step=0.144, global_step=5397.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  87%|████████▋ | 1056/1208 [29:50<04:17,  1.70s/it, loss=0.0813, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00318, train/loss_step=0.395, global_step=5397.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  88%|████████▊ | 1057/1208 [29:51<04:15,  1.70s/it, loss=0.0813, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00318, train/loss_step=0.395, global_step=5397.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  88%|████████▊ | 1057/1208 [29:51<04:15,  1.70s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000604, train/loss_step=0.175, global_step=5398.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  88%|████████▊ | 1058/1208 [29:52<04:14,  1.69s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000604, train/loss_step=0.175, global_step=5398.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  88%|████████▊ | 1058/1208 [29:52<04:14,  1.69s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000967, train/loss_step=0.240, global_step=5398.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  88%|████████▊ | 1059/1208 [29:53<04:12,  1.69s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000967, train/loss_step=0.240, global_step=5398.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  88%|████████▊ | 1059/1208 [29:54<04:12,  1.69s/it, loss=0.0827, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.98e-5, train/loss_step=0.0164, global_step=5398.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  88%|████████▊ | 1060/1208 [29:57<04:10,  1.70s/it, loss=0.0827, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.98e-5, train/loss_step=0.0164, global_step=5398.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  88%|████████▊ | 1060/1208 [29:57<04:10,  1.70s/it, loss=0.0838, v_num=0, train/loss_simple_step=0.0247, train/loss_vlb_step=0.0001, train/loss_step=0.0247, global_step=5398.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  88%|████████▊ | 1061/1208 [29:58<04:09,  1.69s/it, loss=0.0838, v_num=0, train/loss_simple_step=0.0247, train/loss_vlb_step=0.0001, train/loss_step=0.0247, global_step=5398.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  88%|████████▊ | 1061/1208 [29:58<04:09,  1.69s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.0565, train/loss_vlb_step=0.000201, train/loss_step=0.0565, global_step=5399.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  88%|████████▊ | 1062/1208 [29:59<04:07,  1.69s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.0565, train/loss_vlb_step=0.000201, train/loss_step=0.0565, global_step=5399.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  88%|████████▊ | 1062/1208 [29:59<04:07,  1.69s/it, loss=0.0818, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.39e-5, train/loss_step=0.0112, global_step=5399.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  88%|████████▊ | 1063/1208 [30:00<04:05,  1.69s/it, loss=0.0818, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.39e-5, train/loss_step=0.0112, global_step=5399.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  88%|████████▊ | 1063/1208 [30:00<04:05,  1.69s/it, loss=0.0775, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.52e-5, train/loss_step=0.00268, global_step=5399.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  88%|████████▊ | 1064/1208 [30:03<04:04,  1.70s/it, loss=0.0775, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.52e-5, train/loss_step=0.00268, global_step=5399.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  88%|████████▊ | 1064/1208 [30:03<04:04,  1.70s/it, loss=0.0775, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=2.56e-5, train/loss_step=0.00481, global_step=5399.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  88%|████████▊ | 1065/1208 [30:04<04:02,  1.69s/it, loss=0.0775, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=2.56e-5, train/loss_step=0.00481, global_step=5399.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  88%|████████▊ | 1065/1208 [30:04<04:02,  1.69s/it, loss=0.0765, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000182, train/loss_step=0.0525, global_step=5400.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  88%|████████▊ | 1066/1208 [30:05<04:00,  1.69s/it, loss=0.0765, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000182, train/loss_step=0.0525, global_step=5400.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  88%|████████▊ | 1066/1208 [30:05<04:00,  1.69s/it, loss=0.0767, v_num=0, train/loss_simple_step=0.00588, train/loss_vlb_step=2.96e-5, train/loss_step=0.00588, global_step=5400.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  88%|████████▊ | 1067/1208 [30:06<03:58,  1.69s/it, loss=0.0767, v_num=0, train/loss_simple_step=0.00588, train/loss_vlb_step=2.96e-5, train/loss_step=0.00588, global_step=5400.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  88%|████████▊ | 1067/1208 [30:06<03:58,  1.69s/it, loss=0.0725, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.000121, train/loss_step=0.033, global_step=5400.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  88%|████████▊ | 1068/1208 [30:09<03:57,  1.69s/it, loss=0.0725, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.000121, train/loss_step=0.033, global_step=5400.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  88%|████████▊ | 1068/1208 [30:09<03:57,  1.69s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.559, train/loss_vlb_step=0.0126, train/loss_step=0.559, global_step=5400.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  88%|████████▊ | 1069/1208 [30:11<03:55,  1.69s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.559, train/loss_vlb_step=0.0126, train/loss_step=0.559, global_step=5400.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  88%|████████▊ | 1069/1208 [30:11<03:55,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00151, train/loss_step=0.302, global_step=5401.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  89%|████████▊ | 1070/1208 [30:12<03:53,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00151, train/loss_step=0.302, global_step=5401.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  89%|████████▊ | 1070/1208 [30:12<03:53,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00145, train/loss_step=0.303, global_step=5401.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  89%|████████▊ | 1071/1208 [30:13<03:51,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00145, train/loss_step=0.303, global_step=5401.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  89%|████████▊ | 1071/1208 [30:13<03:51,  1.69s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00318, train/loss_vlb_step=1.78e-5, train/loss_step=0.00318, global_step=5401.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  89%|████████▊ | 1072/1208 [30:16<03:50,  1.69s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00318, train/loss_vlb_step=1.78e-5, train/loss_step=0.00318, global_step=5401.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  89%|████████▊ | 1072/1208 [30:16<03:50,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00695, train/loss_vlb_step=3.37e-5, train/loss_step=0.00695, global_step=5401.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  89%|████████▉ | 1073/1208 [30:17<03:48,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00695, train/loss_vlb_step=3.37e-5, train/loss_step=0.00695, global_step=5401.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  89%|████████▉ | 1073/1208 [30:17<03:48,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.501, train/loss_vlb_step=0.00593, train/loss_step=0.501, global_step=5402.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  89%|████████▉ | 1074/1208 [30:18<03:46,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.501, train/loss_vlb_step=0.00593, train/loss_step=0.501, global_step=5402.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  89%|████████▉ | 1074/1208 [30:18<03:46,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0826, train/loss_vlb_step=0.000276, train/loss_step=0.0826, global_step=5402.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  89%|████████▉ | 1075/1208 [30:19<03:45,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0826, train/loss_vlb_step=0.000276, train/loss_step=0.0826, global_step=5402.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  89%|████████▉ | 1075/1208 [30:19<03:45,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000498, train/loss_step=0.150, global_step=5402.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  89%|████████▉ | 1076/1208 [30:22<03:43,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000498, train/loss_step=0.150, global_step=5402.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  89%|████████▉ | 1076/1208 [30:22<03:43,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.502, train/loss_vlb_step=0.00515, train/loss_step=0.502, global_step=5402.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  89%|████████▉ | 1077/1208 [30:23<03:41,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.502, train/loss_vlb_step=0.00515, train/loss_step=0.502, global_step=5402.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  89%|████████▉ | 1077/1208 [30:23<03:41,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0579, train/loss_vlb_step=0.000199, train/loss_step=0.0579, global_step=5403.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  89%|████████▉ | 1078/1208 [30:24<03:40,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0579, train/loss_vlb_step=0.000199, train/loss_step=0.0579, global_step=5403.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  89%|████████▉ | 1078/1208 [30:24<03:40,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00482, train/loss_vlb_step=2.45e-5, train/loss_step=0.00482, global_step=5403.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  89%|████████▉ | 1079/1208 [30:25<03:38,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00482, train/loss_vlb_step=2.45e-5, train/loss_step=0.00482, global_step=5403.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  89%|████████▉ | 1079/1208 [30:25<03:38,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0331, train/loss_vlb_step=0.000119, train/loss_step=0.0331, global_step=5403.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  89%|████████▉ | 1080/1208 [30:29<03:36,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0331, train/loss_vlb_step=0.000119, train/loss_step=0.0331, global_step=5403.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  89%|████████▉ | 1080/1208 [30:29<03:36,  1.69s/it, loss=0.155, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00307, train/loss_step=0.427, global_step=5403.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  89%|████████▉ | 1081/1208 [30:30<03:35,  1.69s/it, loss=0.155, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00307, train/loss_step=0.427, global_step=5403.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  89%|████████▉ | 1081/1208 [30:30<03:35,  1.69s/it, loss=0.163, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000761, train/loss_step=0.210, global_step=5404.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  90%|████████▉ | 1082/1208 [30:31<03:33,  1.69s/it, loss=0.163, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000761, train/loss_step=0.210, global_step=5404.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  90%|████████▉ | 1082/1208 [30:31<03:33,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000349, train/loss_step=0.105, global_step=5404.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  90%|████████▉ | 1083/1208 [30:32<03:31,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000349, train/loss_step=0.105, global_step=5404.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  90%|████████▉ | 1083/1208 [30:32<03:31,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00101, train/loss_step=0.248, global_step=5404.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  90%|████████▉ | 1084/1208 [30:35<03:29,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00101, train/loss_step=0.248, global_step=5404.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  90%|████████▉ | 1084/1208 [30:35<03:29,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.23e-5, train/loss_step=0.0194, global_step=5404.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  90%|████████▉ | 1085/1208 [30:36<03:28,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.23e-5, train/loss_step=0.0194, global_step=5404.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  90%|████████▉ | 1085/1208 [30:36<03:28,  1.69s/it, loss=0.184, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.00045, train/loss_step=0.137, global_step=5405.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  90%|████████▉ | 1086/1208 [30:37<03:26,  1.69s/it, loss=0.184, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.00045, train/loss_step=0.137, global_step=5405.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  90%|████████▉ | 1086/1208 [30:37<03:26,  1.69s/it, loss=0.191, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000442, train/loss_step=0.133, global_step=5405.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  90%|████████▉ | 1087/1208 [30:38<03:24,  1.69s/it, loss=0.191, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000442, train/loss_step=0.133, global_step=5405.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  90%|████████▉ | 1087/1208 [30:38<03:24,  1.69s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.000233, train/loss_step=0.0672, global_step=5405.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  90%|█████████ | 1088/1208 [30:42<03:23,  1.69s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.000233, train/loss_step=0.0672, global_step=5405.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  90%|█████████ | 1088/1208 [30:42<03:23,  1.69s/it, loss=0.177, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00122, train/loss_step=0.244, global_step=5405.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  90%|█████████ | 1089/1208 [30:43<03:21,  1.69s/it, loss=0.177, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00122, train/loss_step=0.244, global_step=5405.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  90%|█████████ | 1089/1208 [30:43<03:21,  1.69s/it, loss=0.162, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.19e-5, train/loss_step=0.011, global_step=5406.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  90%|█████████ | 1090/1208 [30:44<03:19,  1.69s/it, loss=0.162, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.19e-5, train/loss_step=0.011, global_step=5406.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  90%|█████████ | 1090/1208 [30:44<03:19,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0063, train/loss_vlb_step=2.99e-5, train/loss_step=0.0063, global_step=5406.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  90%|█████████ | 1091/1208 [30:45<03:17,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0063, train/loss_vlb_step=2.99e-5, train/loss_step=0.0063, global_step=5406.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  90%|█████████ | 1091/1208 [30:45<03:17,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000911, train/loss_step=0.233, global_step=5406.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  90%|█████████ | 1092/1208 [30:48<03:16,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000911, train/loss_step=0.233, global_step=5406.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  90%|█████████ | 1092/1208 [30:48<03:16,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000718, train/loss_step=0.201, global_step=5406.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  90%|█████████ | 1093/1208 [30:49<03:14,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000718, train/loss_step=0.201, global_step=5406.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  90%|█████████ | 1093/1208 [30:49<03:14,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.008, train/loss_vlb_step=3.68e-5, train/loss_step=0.008, global_step=5407.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  91%|█████████ | 1094/1208 [30:50<03:12,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.008, train/loss_vlb_step=3.68e-5, train/loss_step=0.008, global_step=5407.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  91%|█████████ | 1094/1208 [30:50<03:12,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00817, train/loss_vlb_step=3.85e-5, train/loss_step=0.00817, global_step=5407.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  91%|█████████ | 1095/1208 [30:51<03:11,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00817, train/loss_vlb_step=3.85e-5, train/loss_step=0.00817, global_step=5407.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  91%|█████████ | 1095/1208 [30:51<03:11,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00446, train/loss_vlb_step=2.41e-5, train/loss_step=0.00446, global_step=5407.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  91%|█████████ | 1096/1208 [30:54<03:09,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00446, train/loss_vlb_step=2.41e-5, train/loss_step=0.00446, global_step=5407.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  91%|█████████ | 1096/1208 [30:54<03:09,  1.69s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=8.59e-5, train/loss_step=0.0218, global_step=5407.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  91%|█████████ | 1097/1208 [30:55<03:07,  1.69s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=8.59e-5, train/loss_step=0.0218, global_step=5407.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  91%|█████████ | 1097/1208 [30:55<03:07,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000114, train/loss_step=0.0301, global_step=5408.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  91%|█████████ | 1098/1208 [30:56<03:06,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000114, train/loss_step=0.0301, global_step=5408.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  91%|█████████ | 1098/1208 [30:56<03:06,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.03e-5, train/loss_step=0.0136, global_step=5408.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  91%|█████████ | 1099/1208 [30:57<03:04,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.03e-5, train/loss_step=0.0136, global_step=5408.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  91%|█████████ | 1099/1208 [30:57<03:04,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00826, train/loss_vlb_step=4.23e-5, train/loss_step=0.00826, global_step=5408.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  91%|█████████ | 1100/1208 [31:01<03:02,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00826, train/loss_vlb_step=4.23e-5, train/loss_step=0.00826, global_step=5408.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  91%|█████████ | 1100/1208 [31:01<03:02,  1.69s/it, loss=0.0943, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000632, train/loss_step=0.177, global_step=5408.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  91%|█████████ | 1101/1208 [31:02<03:00,  1.69s/it, loss=0.0943, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000632, train/loss_step=0.177, global_step=5408.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  91%|█████████ | 1101/1208 [31:02<03:00,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.441, train/loss_vlb_step=0.00531, train/loss_step=0.441, global_step=5409.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  91%|█████████ | 1102/1208 [31:03<02:59,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.441, train/loss_vlb_step=0.00531, train/loss_step=0.441, global_step=5409.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  91%|█████████ | 1102/1208 [31:03<02:59,  1.69s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0623, train/loss_vlb_step=0.000209, train/loss_step=0.0623, global_step=5409.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  91%|█████████▏| 1103/1208 [31:04<02:57,  1.69s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0623, train/loss_vlb_step=0.000209, train/loss_step=0.0623, global_step=5409.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  91%|█████████▏| 1103/1208 [31:04<02:57,  1.69s/it, loss=0.0918, v_num=0, train/loss_simple_step=0.00893, train/loss_vlb_step=4.11e-5, train/loss_step=0.00893, global_step=5409.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  91%|█████████▏| 1104/1208 [31:07<02:55,  1.69s/it, loss=0.0918, v_num=0, train/loss_simple_step=0.00893, train/loss_vlb_step=4.11e-5, train/loss_step=0.00893, global_step=5409.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  91%|█████████▏| 1104/1208 [31:07<02:55,  1.69s/it, loss=0.091, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.39e-5, train/loss_step=0.00241, global_step=5409.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  91%|█████████▏| 1105/1208 [31:08<02:54,  1.69s/it, loss=0.091, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.39e-5, train/loss_step=0.00241, global_step=5409.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  91%|█████████▏| 1105/1208 [31:08<02:54,  1.69s/it, loss=0.0873, v_num=0, train/loss_simple_step=0.0641, train/loss_vlb_step=0.000214, train/loss_step=0.0641, global_step=5410.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  92%|█████████▏| 1106/1208 [31:09<02:52,  1.69s/it, loss=0.0873, v_num=0, train/loss_simple_step=0.0641, train/loss_vlb_step=0.000214, train/loss_step=0.0641, global_step=5410.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  92%|█████████▏| 1106/1208 [31:09<02:52,  1.69s/it, loss=0.0815, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.78e-5, train/loss_step=0.0161, global_step=5410.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  92%|█████████▏| 1107/1208 [31:10<02:50,  1.69s/it, loss=0.0815, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.78e-5, train/loss_step=0.0161, global_step=5410.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  92%|█████████▏| 1107/1208 [31:10<02:50,  1.69s/it, loss=0.0856, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000533, train/loss_step=0.150, global_step=5410.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  92%|█████████▏| 1108/1208 [31:13<02:49,  1.69s/it, loss=0.0856, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000533, train/loss_step=0.150, global_step=5410.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  92%|█████████▏| 1108/1208 [31:13<02:49,  1.69s/it, loss=0.0876, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00139, train/loss_step=0.285, global_step=5410.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  92%|█████████▏| 1109/1208 [31:14<02:47,  1.69s/it, loss=0.0876, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00139, train/loss_step=0.285, global_step=5410.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  92%|█████████▏| 1109/1208 [31:14<02:47,  1.69s/it, loss=0.0898, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000196, train/loss_step=0.0545, global_step=5411.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  92%|█████████▏| 1110/1208 [31:15<02:45,  1.69s/it, loss=0.0898, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000196, train/loss_step=0.0545, global_step=5411.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  92%|█████████▏| 1110/1208 [31:15<02:45,  1.69s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.25e-5, train/loss_step=0.00215, global_step=5411.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  92%|█████████▏| 1111/1208 [31:17<02:43,  1.69s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.25e-5, train/loss_step=0.00215, global_step=5411.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  92%|█████████▏| 1111/1208 [31:17<02:43,  1.69s/it, loss=0.0781, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.76e-5, train/loss_step=0.00331, global_step=5411.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  92%|█████████▏| 1112/1208 [31:20<02:42,  1.69s/it, loss=0.0781, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.76e-5, train/loss_step=0.00331, global_step=5411.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  92%|█████████▏| 1112/1208 [31:20<02:42,  1.69s/it, loss=0.0686, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.44e-5, train/loss_step=0.0123, global_step=5411.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  92%|█████████▏| 1113/1208 [31:21<02:40,  1.69s/it, loss=0.0686, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.44e-5, train/loss_step=0.0123, global_step=5411.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  92%|█████████▏| 1113/1208 [31:21<02:40,  1.69s/it, loss=0.078, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000688, train/loss_step=0.196, global_step=5412.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  92%|█████████▏| 1114/1208 [31:22<02:38,  1.69s/it, loss=0.078, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000688, train/loss_step=0.196, global_step=5412.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  92%|█████████▏| 1114/1208 [31:22<02:38,  1.69s/it, loss=0.0812, v_num=0, train/loss_simple_step=0.0715, train/loss_vlb_step=0.000248, train/loss_step=0.0715, global_step=5412.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  92%|█████████▏| 1115/1208 [31:23<02:37,  1.69s/it, loss=0.0812, v_num=0, train/loss_simple_step=0.0715, train/loss_vlb_step=0.000248, train/loss_step=0.0715, global_step=5412.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  92%|█████████▏| 1115/1208 [31:23<02:37,  1.69s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00118, train/loss_step=0.288, global_step=5412.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  92%|█████████▏| 1116/1208 [31:26<02:35,  1.69s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00118, train/loss_step=0.288, global_step=5412.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  92%|█████████▏| 1116/1208 [31:26<02:35,  1.69s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=5412.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  92%|█████████▏| 1117/1208 [31:27<02:33,  1.69s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=5412.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  92%|█████████▏| 1117/1208 [31:27<02:33,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00214, train/loss_step=0.397, global_step=5413.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  93%|█████████▎| 1118/1208 [31:28<02:32,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00214, train/loss_step=0.397, global_step=5413.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  93%|█████████▎| 1118/1208 [31:28<02:32,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00133, train/loss_step=0.315, global_step=5413.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  93%|█████████▎| 1119/1208 [31:29<02:30,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00133, train/loss_step=0.315, global_step=5413.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  93%|█████████▎| 1119/1208 [31:29<02:30,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.61e-5, train/loss_step=0.00285, global_step=5413.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  93%|█████████▎| 1120/1208 [31:33<02:28,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.61e-5, train/loss_step=0.00285, global_step=5413.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  93%|█████████▎| 1120/1208 [31:33<02:28,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.86e-5, train/loss_step=0.0135, global_step=5413.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  93%|█████████▎| 1121/1208 [31:34<02:27,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.86e-5, train/loss_step=0.0135, global_step=5413.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  93%|█████████▎| 1121/1208 [31:34<02:27,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00119, train/loss_step=0.254, global_step=5414.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  93%|█████████▎| 1122/1208 [31:35<02:25,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00119, train/loss_step=0.254, global_step=5414.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  93%|█████████▎| 1122/1208 [31:35<02:25,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0583, train/loss_vlb_step=0.000196, train/loss_step=0.0583, global_step=5414.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  93%|█████████▎| 1123/1208 [31:36<02:23,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0583, train/loss_vlb_step=0.000196, train/loss_step=0.0583, global_step=5414.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  93%|█████████▎| 1123/1208 [31:36<02:23,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00141, train/loss_step=0.290, global_step=5414.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  93%|█████████▎| 1124/1208 [31:39<02:21,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00141, train/loss_step=0.290, global_step=5414.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  93%|█████████▎| 1124/1208 [31:39<02:21,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.2e-5, train/loss_step=0.00423, global_step=5414.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  93%|█████████▎| 1125/1208 [31:40<02:20,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.2e-5, train/loss_step=0.00423, global_step=5414.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  93%|█████████▎| 1125/1208 [31:40<02:20,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.64e-5, train/loss_step=0.0158, global_step=5415.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  93%|█████████▎| 1126/1208 [31:41<02:18,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.64e-5, train/loss_step=0.0158, global_step=5415.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  93%|█████████▎| 1126/1208 [31:41<02:18,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.0035, train/loss_step=0.400, global_step=5415.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  93%|█████████▎| 1127/1208 [31:42<02:16,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.0035, train/loss_step=0.400, global_step=5415.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  93%|█████████▎| 1127/1208 [31:42<02:16,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00505, train/loss_vlb_step=2.71e-5, train/loss_step=0.00505, global_step=5415.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  93%|█████████▎| 1128/1208 [31:45<02:15,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00505, train/loss_vlb_step=2.71e-5, train/loss_step=0.00505, global_step=5415.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  93%|█████████▎| 1128/1208 [31:45<02:15,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.00019, train/loss_step=0.0543, global_step=5415.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  93%|█████████▎| 1129/1208 [31:46<02:13,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.00019, train/loss_step=0.0543, global_step=5415.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  93%|█████████▎| 1129/1208 [31:46<02:13,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.00102, train/loss_step=0.238, global_step=5416.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  94%|█████████▎| 1130/1208 [31:47<02:11,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.00102, train/loss_step=0.238, global_step=5416.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  94%|█████████▎| 1130/1208 [31:47<02:11,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.19e-5, train/loss_step=0.00198, global_step=5416.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  94%|█████████▎| 1131/1208 [31:48<02:09,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.19e-5, train/loss_step=0.00198, global_step=5416.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  94%|█████████▎| 1131/1208 [31:48<02:09,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.065, train/loss_vlb_step=0.00023, train/loss_step=0.065, global_step=5416.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]     Epoch 17:  94%|█████████▎| 1132/1208 [31:52<02:08,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.065, train/loss_vlb_step=0.00023, train/loss_step=0.065, global_step=5416.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  94%|█████████▎| 1132/1208 [31:52<02:08,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.29e-5, train/loss_step=0.017, global_step=5416.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  94%|█████████▍| 1133/1208 [31:53<02:06,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.29e-5, train/loss_step=0.017, global_step=5416.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  94%|█████████▍| 1133/1208 [31:53<02:06,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=1.47e-5, train/loss_step=0.00262, global_step=5417.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  94%|█████████▍| 1134/1208 [31:54<02:04,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=1.47e-5, train/loss_step=0.00262, global_step=5417.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  94%|█████████▍| 1134/1208 [31:54<02:04,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.2e-5, train/loss_step=0.0238, global_step=5417.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  94%|█████████▍| 1135/1208 [31:55<02:03,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.2e-5, train/loss_step=0.0238, global_step=5417.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  94%|█████████▍| 1135/1208 [31:55<02:03,  1.69s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00685, train/loss_vlb_step=3.37e-5, train/loss_step=0.00685, global_step=5417.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  94%|█████████▍| 1136/1208 [31:58<02:01,  1.69s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00685, train/loss_vlb_step=3.37e-5, train/loss_step=0.00685, global_step=5417.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  94%|█████████▍| 1136/1208 [31:58<02:01,  1.69s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=6.31e-5, train/loss_step=0.0133, global_step=5417.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  94%|█████████▍| 1137/1208 [31:59<01:59,  1.69s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=6.31e-5, train/loss_step=0.0133, global_step=5417.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  94%|█████████▍| 1137/1208 [31:59<01:59,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00138, train/loss_step=0.266, global_step=5418.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  94%|█████████▍| 1138/1208 [32:00<01:58,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00138, train/loss_step=0.266, global_step=5418.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  94%|█████████▍| 1138/1208 [32:00<01:58,  1.69s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.71e-5, train/loss_step=0.016, global_step=5418.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  94%|█████████▍| 1139/1208 [32:01<01:56,  1.69s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.71e-5, train/loss_step=0.016, global_step=5418.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  94%|█████████▍| 1139/1208 [32:01<01:56,  1.69s/it, loss=0.0881, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.54e-5, train/loss_step=0.0156, global_step=5418.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  94%|█████████▍| 1140/1208 [32:04<01:54,  1.69s/it, loss=0.0881, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.54e-5, train/loss_step=0.0156, global_step=5418.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  94%|█████████▍| 1140/1208 [32:04<01:54,  1.69s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.22e-5, train/loss_step=0.0021, global_step=5418.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  94%|█████████▍| 1141/1208 [32:06<01:53,  1.69s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.22e-5, train/loss_step=0.0021, global_step=5418.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  94%|█████████▍| 1141/1208 [32:06<01:53,  1.69s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.001, train/loss_step=0.229, global_step=5419.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  95%|█████████▍| 1142/1208 [32:07<01:51,  1.69s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.001, train/loss_step=0.229, global_step=5419.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  95%|█████████▍| 1142/1208 [32:07<01:51,  1.69s/it, loss=0.0842, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.39e-5, train/loss_step=0.0171, global_step=5419.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  95%|█████████▍| 1143/1208 [32:08<01:49,  1.69s/it, loss=0.0842, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.39e-5, train/loss_step=0.0171, global_step=5419.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  95%|█████████▍| 1143/1208 [32:08<01:49,  1.69s/it, loss=0.0698, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=1.34e-5, train/loss_step=0.00232, global_step=5419.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  95%|█████████▍| 1144/1208 [32:11<01:48,  1.69s/it, loss=0.0698, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=1.34e-5, train/loss_step=0.00232, global_step=5419.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  95%|█████████▍| 1144/1208 [32:11<01:48,  1.69s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.00478, train/loss_step=0.460, global_step=5419.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]    Epoch 17:  95%|█████████▍| 1145/1208 [32:12<01:46,  1.69s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.00478, train/loss_step=0.460, global_step=5419.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  95%|█████████▍| 1145/1208 [32:12<01:46,  1.69s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.00935, train/loss_vlb_step=4.59e-5, train/loss_step=0.00935, global_step=5420.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  95%|█████████▍| 1146/1208 [32:13<01:44,  1.69s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.00935, train/loss_vlb_step=4.59e-5, train/loss_step=0.00935, global_step=5420.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  95%|█████████▍| 1146/1208 [32:13<01:44,  1.69s/it, loss=0.0734, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=9.09e-5, train/loss_step=0.0219, global_step=5420.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  95%|█████████▍| 1147/1208 [32:14<01:42,  1.69s/it, loss=0.0734, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=9.09e-5, train/loss_step=0.0219, global_step=5420.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  95%|█████████▍| 1147/1208 [32:14<01:42,  1.69s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000787, train/loss_step=0.212, global_step=5420.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  95%|█████████▌| 1148/1208 [32:17<01:41,  1.69s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000787, train/loss_step=0.212, global_step=5420.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  95%|█████████▌| 1148/1208 [32:17<01:41,  1.69s/it, loss=0.0845, v_num=0, train/loss_simple_step=0.0703, train/loss_vlb_step=0.000233, train/loss_step=0.0703, global_step=5420.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  95%|█████████▌| 1149/1208 [32:18<01:39,  1.69s/it, loss=0.0845, v_num=0, train/loss_simple_step=0.0703, train/loss_vlb_step=0.000233, train/loss_step=0.0703, global_step=5420.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  95%|█████████▌| 1149/1208 [32:18<01:39,  1.69s/it, loss=0.078, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000358, train/loss_step=0.108, global_step=5421.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  95%|█████████▌| 1150/1208 [32:19<01:37,  1.69s/it, loss=0.078, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000358, train/loss_step=0.108, global_step=5421.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  95%|█████████▌| 1150/1208 [32:19<01:37,  1.69s/it, loss=0.0781, v_num=0, train/loss_simple_step=0.00457, train/loss_vlb_step=2.4e-5, train/loss_step=0.00457, global_step=5421.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  95%|█████████▌| 1151/1208 [32:20<01:36,  1.69s/it, loss=0.0781, v_num=0, train/loss_simple_step=0.00457, train/loss_vlb_step=2.4e-5, train/loss_step=0.00457, global_step=5421.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  95%|█████████▌| 1151/1208 [32:20<01:36,  1.69s/it, loss=0.0754, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.82e-5, train/loss_step=0.0102, global_step=5421.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  95%|█████████▌| 1152/1208 [32:24<01:34,  1.69s/it, loss=0.0754, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.82e-5, train/loss_step=0.0102, global_step=5421.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  95%|█████████▌| 1152/1208 [32:24<01:34,  1.69s/it, loss=0.0792, v_num=0, train/loss_simple_step=0.0941, train/loss_vlb_step=0.000309, train/loss_step=0.0941, global_step=5421.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  95%|█████████▌| 1153/1208 [32:25<01:32,  1.69s/it, loss=0.0792, v_num=0, train/loss_simple_step=0.0941, train/loss_vlb_step=0.000309, train/loss_step=0.0941, global_step=5421.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  95%|█████████▌| 1153/1208 [32:25<01:32,  1.69s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000807, train/loss_step=0.216, global_step=5422.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  96%|█████████▌| 1154/1208 [32:26<01:31,  1.69s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000807, train/loss_step=0.216, global_step=5422.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  96%|█████████▌| 1154/1208 [32:26<01:31,  1.69s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.0936, train/loss_vlb_step=0.00031, train/loss_step=0.0936, global_step=5422.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  96%|█████████▌| 1155/1208 [32:27<01:29,  1.69s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.0936, train/loss_vlb_step=0.00031, train/loss_step=0.0936, global_step=5422.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  96%|█████████▌| 1155/1208 [32:27<01:29,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.788, train/loss_vlb_step=0.100, train/loss_step=0.788, global_step=5422.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]     Epoch 17:  96%|█████████▌| 1156/1208 [32:30<01:27,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.788, train/loss_vlb_step=0.100, train/loss_step=0.788, global_step=5422.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  96%|█████████▌| 1156/1208 [32:30<01:27,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00667, train/loss_vlb_step=3.29e-5, train/loss_step=0.00667, global_step=5422.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  96%|█████████▌| 1157/1208 [32:31<01:26,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00667, train/loss_vlb_step=3.29e-5, train/loss_step=0.00667, global_step=5422.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  96%|█████████▌| 1157/1208 [32:31<01:26,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.000132, train/loss_step=0.0359, global_step=5423.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  96%|█████████▌| 1158/1208 [32:32<01:24,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.000132, train/loss_step=0.0359, global_step=5423.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  96%|█████████▌| 1158/1208 [32:32<01:24,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00812, train/loss_vlb_step=4.05e-5, train/loss_step=0.00812, global_step=5423.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  96%|█████████▌| 1159/1208 [32:33<01:22,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00812, train/loss_vlb_step=4.05e-5, train/loss_step=0.00812, global_step=5423.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  96%|█████████▌| 1159/1208 [32:33<01:22,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=1.89e-5, train/loss_step=0.00347, global_step=5423.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  96%|█████████▌| 1160/1208 [32:36<01:20,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=1.89e-5, train/loss_step=0.00347, global_step=5423.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  96%|█████████▌| 1160/1208 [32:36<01:20,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000648, train/loss_step=0.184, global_step=5423.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  96%|█████████▌| 1161/1208 [32:37<01:19,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000648, train/loss_step=0.184, global_step=5423.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  96%|█████████▌| 1161/1208 [32:37<01:19,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.000272, train/loss_step=0.0817, global_step=5424.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  96%|█████████▌| 1162/1208 [32:39<01:17,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.000272, train/loss_step=0.0817, global_step=5424.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  96%|█████████▌| 1162/1208 [32:39<01:17,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.94e-5, train/loss_step=0.00349, global_step=5424.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  96%|█████████▋| 1163/1208 [32:40<01:15,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.94e-5, train/loss_step=0.00349, global_step=5424.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  96%|█████████▋| 1163/1208 [32:40<01:15,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.14e-5, train/loss_step=0.00197, global_step=5424.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  96%|█████████▋| 1164/1208 [32:43<01:14,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.14e-5, train/loss_step=0.00197, global_step=5424.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  96%|█████████▋| 1164/1208 [32:43<01:14,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.680, train/loss_vlb_step=0.0142, train/loss_step=0.680, global_step=5424.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]     Epoch 17:  96%|█████████▋| 1165/1208 [32:44<01:12,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.680, train/loss_vlb_step=0.0142, train/loss_step=0.680, global_step=5424.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  96%|█████████▋| 1165/1208 [32:44<01:12,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00297, train/loss_vlb_step=1.7e-5, train/loss_step=0.00297, global_step=5425.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  97%|█████████▋| 1166/1208 [32:45<01:10,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00297, train/loss_vlb_step=1.7e-5, train/loss_step=0.00297, global_step=5425.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  97%|█████████▋| 1166/1208 [32:45<01:10,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.7e-5, train/loss_step=0.0133, global_step=5425.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  97%|█████████▋| 1167/1208 [32:46<01:09,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.7e-5, train/loss_step=0.0133, global_step=5425.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  97%|█████████▋| 1167/1208 [32:46<01:09,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.640, train/loss_vlb_step=0.0189, train/loss_step=0.640, global_step=5425.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  97%|█████████▋| 1168/1208 [32:49<01:07,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.640, train/loss_vlb_step=0.0189, train/loss_step=0.640, global_step=5425.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  97%|█████████▋| 1168/1208 [32:49<01:07,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000844, train/loss_step=0.225, global_step=5425.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  97%|█████████▋| 1169/1208 [32:50<01:05,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000844, train/loss_step=0.225, global_step=5425.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  97%|█████████▋| 1169/1208 [32:50<01:05,  1.69s/it, loss=0.162, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000515, train/loss_step=0.152, global_step=5426.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  97%|█████████▋| 1170/1208 [32:51<01:04,  1.69s/it, loss=0.162, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000515, train/loss_step=0.152, global_step=5426.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  97%|█████████▋| 1170/1208 [32:51<01:04,  1.69s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.9e-5, train/loss_step=0.0219, global_step=5426.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  97%|█████████▋| 1171/1208 [32:52<01:02,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.9e-5, train/loss_step=0.0219, global_step=5426.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  97%|█████████▋| 1171/1208 [32:52<01:02,  1.68s/it, loss=0.173, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000766, train/loss_step=0.212, global_step=5426.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  97%|█████████▋| 1172/1208 [32:56<01:00,  1.69s/it, loss=0.173, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000766, train/loss_step=0.212, global_step=5426.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  97%|█████████▋| 1172/1208 [32:56<01:00,  1.69s/it, loss=0.194, v_num=0, train/loss_simple_step=0.507, train/loss_vlb_step=0.00732, train/loss_step=0.507, global_step=5426.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  97%|█████████▋| 1173/1208 [32:57<00:58,  1.69s/it, loss=0.194, v_num=0, train/loss_simple_step=0.507, train/loss_vlb_step=0.00732, train/loss_step=0.507, global_step=5426.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  97%|█████████▋| 1173/1208 [32:57<00:58,  1.69s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0793, train/loss_vlb_step=0.000266, train/loss_step=0.0793, global_step=5427.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  97%|█████████▋| 1174/1208 [32:58<00:57,  1.68s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0793, train/loss_vlb_step=0.000266, train/loss_step=0.0793, global_step=5427.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  97%|█████████▋| 1174/1208 [32:58<00:57,  1.68s/it, loss=0.199, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00176, train/loss_step=0.328, global_step=5427.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  97%|█████████▋| 1175/1208 [32:59<00:55,  1.68s/it, loss=0.199, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00176, train/loss_step=0.328, global_step=5427.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  97%|█████████▋| 1175/1208 [32:59<00:55,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.46e-5, train/loss_step=0.021, global_step=5427.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  97%|█████████▋| 1176/1208 [33:02<00:53,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.46e-5, train/loss_step=0.021, global_step=5427.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  97%|█████████▋| 1176/1208 [33:02<00:53,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=1.38e-5, train/loss_step=0.00239, global_step=5427.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  97%|█████████▋| 1177/1208 [33:03<00:52,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=1.38e-5, train/loss_step=0.00239, global_step=5427.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  97%|█████████▋| 1177/1208 [33:03<00:52,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.26e-5, train/loss_step=0.0115, global_step=5428.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  98%|█████████▊| 1178/1208 [33:04<00:50,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.26e-5, train/loss_step=0.0115, global_step=5428.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  98%|█████████▊| 1178/1208 [33:04<00:50,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00428, train/loss_vlb_step=2.29e-5, train/loss_step=0.00428, global_step=5428.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  98%|█████████▊| 1179/1208 [33:05<00:48,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00428, train/loss_vlb_step=2.29e-5, train/loss_step=0.00428, global_step=5428.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  98%|█████████▊| 1179/1208 [33:05<00:48,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000117, train/loss_step=0.0296, global_step=5428.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  98%|█████████▊| 1180/1208 [33:08<00:47,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000117, train/loss_step=0.0296, global_step=5428.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  98%|█████████▊| 1180/1208 [33:08<00:47,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.0017, train/loss_step=0.331, global_step=5428.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17:  98%|█████████▊| 1181/1208 [33:09<00:45,  1.68s/it, loss=0.167, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.0017, train/loss_step=0.331, global_step=5428.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  98%|█████████▊| 1181/1208 [33:09<00:45,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00479, train/loss_vlb_step=2.47e-5, train/loss_step=0.00479, global_step=5429.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  98%|█████████▊| 1182/1208 [33:10<00:43,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00479, train/loss_vlb_step=2.47e-5, train/loss_step=0.00479, global_step=5429.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  98%|█████████▊| 1182/1208 [33:10<00:43,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00983, train/loss_vlb_step=4.47e-5, train/loss_step=0.00983, global_step=5429.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  98%|█████████▊| 1183/1208 [33:11<00:42,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00983, train/loss_vlb_step=4.47e-5, train/loss_step=0.00983, global_step=5429.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  98%|█████████▊| 1183/1208 [33:11<00:42,  1.68s/it, loss=0.189, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.0051, train/loss_step=0.512, global_step=5429.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]     Epoch 17:  98%|█████████▊| 1184/1208 [33:15<00:40,  1.69s/it, loss=0.189, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.0051, train/loss_step=0.512, global_step=5429.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  98%|█████████▊| 1184/1208 [33:15<00:40,  1.69s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0038, train/loss_vlb_step=2.02e-5, train/loss_step=0.0038, global_step=5429.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  98%|█████████▊| 1185/1208 [33:16<00:38,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0038, train/loss_vlb_step=2.02e-5, train/loss_step=0.0038, global_step=5429.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  98%|█████████▊| 1185/1208 [33:16<00:38,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=7.23e-5, train/loss_step=0.0162, global_step=5430.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  98%|█████████▊| 1186/1208 [33:17<00:37,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=7.23e-5, train/loss_step=0.0162, global_step=5430.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  98%|█████████▊| 1186/1208 [33:17<00:37,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0563, train/loss_vlb_step=0.000203, train/loss_step=0.0563, global_step=5430.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  98%|█████████▊| 1187/1208 [33:18<00:35,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0563, train/loss_vlb_step=0.000203, train/loss_step=0.0563, global_step=5430.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  98%|█████████▊| 1187/1208 [33:18<00:35,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000373, train/loss_step=0.112, global_step=5430.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  98%|█████████▊| 1188/1208 [33:21<00:33,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000373, train/loss_step=0.112, global_step=5430.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  98%|█████████▊| 1188/1208 [33:21<00:33,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=1.14e-5, train/loss_step=0.0019, global_step=5430.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  98%|█████████▊| 1189/1208 [33:22<00:32,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=1.14e-5, train/loss_step=0.0019, global_step=5430.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  98%|█████████▊| 1189/1208 [33:22<00:32,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00106, train/loss_step=0.263, global_step=5431.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  99%|█████████▊| 1190/1208 [33:23<00:30,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00106, train/loss_step=0.263, global_step=5431.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  99%|█████████▊| 1190/1208 [33:23<00:30,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000789, train/loss_step=0.218, global_step=5431.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  99%|█████████▊| 1191/1208 [33:24<00:28,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000789, train/loss_step=0.218, global_step=5431.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  99%|█████████▊| 1191/1208 [33:24<00:28,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00187, train/loss_step=0.328, global_step=5431.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  99%|█████████▊| 1192/1208 [33:27<00:26,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00187, train/loss_step=0.328, global_step=5431.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  99%|█████████▊| 1192/1208 [33:27<00:26,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000899, train/loss_step=0.230, global_step=5431.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  99%|█████████▉| 1193/1208 [33:28<00:25,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000899, train/loss_step=0.230, global_step=5431.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  99%|█████████▉| 1193/1208 [33:28<00:25,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000203, train/loss_step=0.0588, global_step=5432.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  99%|█████████▉| 1194/1208 [33:30<00:23,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000203, train/loss_step=0.0588, global_step=5432.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  99%|█████████▉| 1194/1208 [33:30<00:23,  1.68s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.53e-5, train/loss_step=0.0146, global_step=5432.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142] Epoch 17:  99%|█████████▉| 1195/1208 [33:31<00:21,  1.68s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.53e-5, train/loss_step=0.0146, global_step=5432.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  99%|█████████▉| 1195/1208 [33:31<00:21,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000755, train/loss_step=0.202, global_step=5432.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  99%|█████████▉| 1196/1208 [33:34<00:20,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000755, train/loss_step=0.202, global_step=5432.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  99%|█████████▉| 1196/1208 [33:34<00:20,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0728, train/loss_vlb_step=0.000242, train/loss_step=0.0728, global_step=5432.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  99%|█████████▉| 1197/1208 [33:35<00:18,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0728, train/loss_vlb_step=0.000242, train/loss_step=0.0728, global_step=5432.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  99%|█████████▉| 1197/1208 [33:35<00:18,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000856, train/loss_step=0.231, global_step=5433.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17:  99%|█████████▉| 1198/1208 [33:36<00:16,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000856, train/loss_step=0.231, global_step=5433.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  99%|█████████▉| 1198/1208 [33:36<00:16,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.000159, train/loss_step=0.045, global_step=5433.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  99%|█████████▉| 1199/1208 [33:37<00:15,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.000159, train/loss_step=0.045, global_step=5433.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  99%|█████████▉| 1199/1208 [33:37<00:15,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000644, train/loss_step=0.186, global_step=5433.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  99%|█████████▉| 1200/1208 [33:40<00:13,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000644, train/loss_step=0.186, global_step=5433.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  99%|█████████▉| 1200/1208 [33:40<00:13,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0926, train/loss_vlb_step=0.000306, train/loss_step=0.0926, global_step=5433.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.84it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.84it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.83it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.76it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.74it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.74it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.75it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.75it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:08,  1.75it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.81it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.78it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.78it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.78it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 17:  99%|█████████▉| 1201/1208 [34:11<00:11,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0926, train/loss_vlb_step=0.000306, train/loss_step=0.0926, global_step=5433.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17:  99%|█████████▉| 1201/1208 [34:11<00:11,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00483, train/loss_vlb_step=2.55e-5, train/loss_step=0.00483, global_step=5434.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17: 100%|█████████▉| 1202/1208 [34:12<00:10,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00483, train/loss_vlb_step=2.55e-5, train/loss_step=0.00483, global_step=5434.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17: 100%|█████████▉| 1202/1208 [34:12<00:10,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.4e-5, train/loss_step=0.0206, global_step=5434.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]   Epoch 17: 100%|█████████▉| 1203/1208 [34:13<00:08,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.4e-5, train/loss_step=0.0206, global_step=5434.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17: 100%|█████████▉| 1203/1208 [34:13<00:08,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00537, train/loss_vlb_step=2.89e-5, train/loss_step=0.00537, global_step=5434.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17: 100%|█████████▉| 1204/1208 [34:16<00:06,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00537, train/loss_vlb_step=2.89e-5, train/loss_step=0.00537, global_step=5434.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17: 100%|█████████▉| 1204/1208 [34:16<00:06,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.00012, train/loss_step=0.0307, global_step=5434.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17: 100%|█████████▉| 1205/1208 [34:17<00:05,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.00012, train/loss_step=0.0307, global_step=5434.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17: 100%|█████████▉| 1205/1208 [34:17<00:05,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00149, train/loss_step=0.276, global_step=5435.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17: 100%|█████████▉| 1206/1208 [34:18<00:03,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00149, train/loss_step=0.276, global_step=5435.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17: 100%|█████████▉| 1206/1208 [34:18<00:03,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000119, train/loss_step=0.0302, global_step=5435.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17: 100%|█████████▉| 1207/1208 [34:19<00:01,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000119, train/loss_step=0.0302, global_step=5435.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17: 100%|█████████▉| 1207/1208 [34:19<00:01,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000924, train/loss_step=0.239, global_step=5435.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]  Epoch 17: 100%|██████████| 1208/1208 [34:24<00:00,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000924, train/loss_step=0.239, global_step=5435.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 17: 100%|██████████| 1208/1208 [34:24<00:00,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000605, train/loss_step=0.163, global_step=5435.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]
+
+
+Epoch 17:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.136, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000605, train/loss_step=0.163, global_step=5435.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]           Epoch 18:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.136, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000605, train/loss_step=0.163, global_step=5435.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.75it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.83it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.80it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.83it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.76it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.83it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.83it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.83it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.83it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.83it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.83it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.72it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.75it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.75it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:09,  1.78it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.78it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.81it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.77it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.77it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.68it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.78it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.71it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.78it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.73it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.74it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.75it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.82it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.72it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 18:   0%|          | 1/1208 [00:33<11:10:06, 33.31s/it, loss=0.136, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000605, train/loss_step=0.163, global_step=5435.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00281, train/loss_epoch=0.142]Epoch 18:   0%|          | 1/1208 [00:33<11:10:10, 33.31s/it, loss=0.133, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000896, train/loss_step=0.208, global_step=5436.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   0%|          | 2/1208 [00:34<5:45:20, 17.18s/it, loss=0.133, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000896, train/loss_step=0.208, global_step=5436.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:   0%|          | 2/1208 [00:34<5:45:21, 17.18s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.2e-5, train/loss_step=0.0143, global_step=5436.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   0%|          | 3/1208 [00:35<3:56:53, 11.80s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.2e-5, train/loss_step=0.0143, global_step=5436.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   0%|          | 3/1208 [00:35<3:56:53, 11.80s/it, loss=0.135, v_num=0, train/loss_simple_step=0.569, train/loss_vlb_step=0.0152, train/loss_step=0.569, global_step=5436.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:   0%|          | 4/1208 [00:38<3:13:16,  9.63s/it, loss=0.135, v_num=0, train/loss_simple_step=0.569, train/loss_vlb_step=0.0152, train/loss_step=0.569, global_step=5436.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   0%|          | 4/1208 [00:38<3:13:17,  9.63s/it, loss=0.141, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00263, train/loss_step=0.353, global_step=5436.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   0%|          | 5/1208 [00:39<2:38:47,  7.92s/it, loss=0.141, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00263, train/loss_step=0.353, global_step=5436.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   0%|          | 5/1208 [00:39<2:38:48,  7.92s/it, loss=0.161, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00595, train/loss_step=0.457, global_step=5437.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   0%|          | 6/1208 [00:40<2:15:41,  6.77s/it, loss=0.161, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00595, train/loss_step=0.457, global_step=5437.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   0%|          | 6/1208 [00:40<2:15:41,  6.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0469, train/loss_vlb_step=0.000165, train/loss_step=0.0469, global_step=5437.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   1%|          | 7/1208 [00:41<1:59:12,  5.96s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0469, train/loss_vlb_step=0.000165, train/loss_step=0.0469, global_step=5437.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   1%|          | 7/1208 [00:41<1:59:13,  5.96s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00695, train/loss_vlb_step=3.33e-5, train/loss_step=0.00695, global_step=5437.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   1%|          | 8/1208 [00:44<1:52:25,  5.62s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00695, train/loss_vlb_step=3.33e-5, train/loss_step=0.00695, global_step=5437.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   1%|          | 8/1208 [00:44<1:52:25,  5.62s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=9.05e-6, train/loss_step=0.00149, global_step=5437.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   1%|          | 9/1208 [00:46<1:42:13,  5.12s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=9.05e-6, train/loss_step=0.00149, global_step=5437.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   1%|          | 9/1208 [00:46<1:42:13,  5.12s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.86e-5, train/loss_step=0.0188, global_step=5438.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:   1%|          | 10/1208 [00:47<1:34:02,  4.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.86e-5, train/loss_step=0.0188, global_step=5438.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   1%|          | 10/1208 [00:47<1:34:02,  4.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000814, train/loss_step=0.215, global_step=5438.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:   1%|          | 11/1208 [00:48<1:27:18,  4.38s/it, loss=0.147, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000814, train/loss_step=0.215, global_step=5438.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   1%|          | 11/1208 [00:48<1:27:18,  4.38s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.45e-5, train/loss_step=0.00246, global_step=5438.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   1%|          | 12/1208 [00:51<1:25:18,  4.28s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.45e-5, train/loss_step=0.00246, global_step=5438.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   1%|          | 12/1208 [00:51<1:25:18,  4.28s/it, loss=0.157, v_num=0, train/loss_simple_step=0.478, train/loss_vlb_step=0.00376, train/loss_step=0.478, global_step=5438.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:   1%|          | 13/1208 [00:52<1:20:16,  4.03s/it, loss=0.157, v_num=0, train/loss_simple_step=0.478, train/loss_vlb_step=0.00376, train/loss_step=0.478, global_step=5438.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   1%|          | 13/1208 [00:52<1:20:16,  4.03s/it, loss=0.174, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00166, train/loss_step=0.336, global_step=5439.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   1%|          | 14/1208 [00:53<1:15:56,  3.82s/it, loss=0.174, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00166, train/loss_step=0.336, global_step=5439.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   1%|          | 14/1208 [00:53<1:15:56,  3.82s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0998, train/loss_vlb_step=0.000336, train/loss_step=0.0998, global_step=5439.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   1%|          | 15/1208 [00:54<1:12:10,  3.63s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0998, train/loss_vlb_step=0.000336, train/loss_step=0.0998, global_step=5439.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   1%|          | 15/1208 [00:54<1:12:10,  3.63s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.19e-5, train/loss_step=0.0227, global_step=5439.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:   1%|▏         | 16/1208 [00:57<1:11:42,  3.61s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.19e-5, train/loss_step=0.0227, global_step=5439.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   1%|▏         | 16/1208 [00:57<1:11:42,  3.61s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.85e-5, train/loss_step=0.00341, global_step=5439.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   1%|▏         | 17/1208 [00:58<1:08:41,  3.46s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.85e-5, train/loss_step=0.00341, global_step=5439.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   1%|▏         | 17/1208 [00:58<1:08:41,  3.46s/it, loss=0.18, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00183, train/loss_step=0.331, global_step=5440.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 18:   1%|▏         | 18/1208 [00:59<1:05:57,  3.33s/it, loss=0.18, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00183, train/loss_step=0.331, global_step=5440.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   1%|▏         | 18/1208 [00:59<1:05:57,  3.33s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0523, train/loss_vlb_step=0.000187, train/loss_step=0.0523, global_step=5440.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   2%|▏         | 19/1208 [01:00<1:03:30,  3.21s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0523, train/loss_vlb_step=0.000187, train/loss_step=0.0523, global_step=5440.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   2%|▏         | 19/1208 [01:00<1:03:30,  3.21s/it, loss=0.18, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000774, train/loss_step=0.213, global_step=5440.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:   2%|▏         | 20/1208 [01:04<1:03:25,  3.20s/it, loss=0.18, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000774, train/loss_step=0.213, global_step=5440.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   2%|▏         | 20/1208 [01:04<1:03:25,  3.20s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.36e-5, train/loss_step=0.0119, global_step=5440.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   2%|▏         | 21/1208 [01:05<1:01:21,  3.10s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.36e-5, train/loss_step=0.0119, global_step=5440.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   2%|▏         | 21/1208 [01:05<1:01:21,  3.10s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000113, train/loss_step=0.0293, global_step=5441.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   2%|▏         | 22/1208 [01:06<59:26,  3.01s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000113, train/loss_step=0.0293, global_step=5441.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:   2%|▏         | 22/1208 [01:06<59:26,  3.01s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00478, train/loss_vlb_step=2.54e-5, train/loss_step=0.00478, global_step=5441.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   2%|▏         | 23/1208 [01:07<57:42,  2.92s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00478, train/loss_vlb_step=2.54e-5, train/loss_step=0.00478, global_step=5441.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   2%|▏         | 23/1208 [01:07<57:42,  2.92s/it, loss=0.152, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00251, train/loss_step=0.361, global_step=5441.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:   2%|▏         | 24/1208 [01:10<57:51,  2.93s/it, loss=0.152, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00251, train/loss_step=0.361, global_step=5441.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   2%|▏         | 24/1208 [01:10<57:52,  2.93s/it, loss=0.169, v_num=0, train/loss_simple_step=0.695, train/loss_vlb_step=0.0169, train/loss_step=0.695, global_step=5441.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:   2%|▏         | 25/1208 [01:11<56:19,  2.86s/it, loss=0.169, v_num=0, train/loss_simple_step=0.695, train/loss_vlb_step=0.0169, train/loss_step=0.695, global_step=5441.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   2%|▏         | 25/1208 [01:11<56:19,  2.86s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0553, train/loss_vlb_step=0.000195, train/loss_step=0.0553, global_step=5442.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   2%|▏         | 26/1208 [01:12<54:53,  2.79s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0553, train/loss_vlb_step=0.000195, train/loss_step=0.0553, global_step=5442.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   2%|▏         | 26/1208 [01:12<54:53,  2.79s/it, loss=0.188, v_num=0, train/loss_simple_step=0.822, train/loss_vlb_step=0.139, train/loss_step=0.822, global_step=5442.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 18:   2%|▏         | 27/1208 [01:13<53:34,  2.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.822, train/loss_vlb_step=0.139, train/loss_step=0.822, global_step=5442.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   2%|▏         | 27/1208 [01:13<53:34,  2.72s/it, loss=0.196, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000597, train/loss_step=0.169, global_step=5442.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   2%|▏         | 28/1208 [01:16<53:56,  2.74s/it, loss=0.196, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000597, train/loss_step=0.169, global_step=5442.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   2%|▏         | 28/1208 [01:16<53:56,  2.74s/it, loss=0.203, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.00045, train/loss_step=0.137, global_step=5442.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:   2%|▏         | 29/1208 [01:17<52:46,  2.69s/it, loss=0.203, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.00045, train/loss_step=0.137, global_step=5442.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   2%|▏         | 29/1208 [01:17<52:46,  2.69s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.54e-5, train/loss_step=0.0028, global_step=5443.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   2%|▏         | 30/1208 [01:18<51:39,  2.63s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.54e-5, train/loss_step=0.0028, global_step=5443.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   2%|▏         | 30/1208 [01:18<51:39,  2.63s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0621, train/loss_vlb_step=0.000214, train/loss_step=0.0621, global_step=5443.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   3%|▎         | 31/1208 [01:19<50:36,  2.58s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0621, train/loss_vlb_step=0.000214, train/loss_step=0.0621, global_step=5443.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   3%|▎         | 31/1208 [01:19<50:36,  2.58s/it, loss=0.207, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00106, train/loss_step=0.257, global_step=5443.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:   3%|▎         | 32/1208 [01:23<50:57,  2.60s/it, loss=0.207, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00106, train/loss_step=0.257, global_step=5443.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   3%|▎         | 32/1208 [01:23<50:57,  2.60s/it, loss=0.19, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000474, train/loss_step=0.142, global_step=5443.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   3%|▎         | 33/1208 [01:24<50:00,  2.55s/it, loss=0.19, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000474, train/loss_step=0.142, global_step=5443.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   3%|▎         | 33/1208 [01:24<50:00,  2.55s/it, loss=0.195, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00525, train/loss_step=0.420, global_step=5444.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   3%|▎         | 34/1208 [01:25<49:05,  2.51s/it, loss=0.195, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00525, train/loss_step=0.420, global_step=5444.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   3%|▎         | 34/1208 [01:25<49:05,  2.51s/it, loss=0.195, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=5444.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   3%|▎         | 35/1208 [01:26<48:12,  2.47s/it, loss=0.195, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=5444.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   3%|▎         | 35/1208 [01:26<48:12,  2.47s/it, loss=0.194, v_num=0, train/loss_simple_step=0.00336, train/loss_vlb_step=1.84e-5, train/loss_step=0.00336, global_step=5444.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   3%|▎         | 36/1208 [01:29<48:23,  2.48s/it, loss=0.194, v_num=0, train/loss_simple_step=0.00336, train/loss_vlb_step=1.84e-5, train/loss_step=0.00336, global_step=5444.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   3%|▎         | 36/1208 [01:29<48:23,  2.48s/it, loss=0.195, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.47e-5, train/loss_step=0.015, global_step=5444.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:   3%|▎         | 37/1208 [01:30<47:34,  2.44s/it, loss=0.195, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.47e-5, train/loss_step=0.015, global_step=5444.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   3%|▎         | 37/1208 [01:30<47:34,  2.44s/it, loss=0.202, v_num=0, train/loss_simple_step=0.469, train/loss_vlb_step=0.00519, train/loss_step=0.469, global_step=5445.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   3%|▎         | 38/1208 [01:31<46:47,  2.40s/it, loss=0.202, v_num=0, train/loss_simple_step=0.469, train/loss_vlb_step=0.00519, train/loss_step=0.469, global_step=5445.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   3%|▎         | 38/1208 [01:31<46:47,  2.40s/it, loss=0.208, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000602, train/loss_step=0.170, global_step=5445.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   3%|▎         | 39/1208 [01:32<46:03,  2.36s/it, loss=0.208, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000602, train/loss_step=0.170, global_step=5445.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   3%|▎         | 39/1208 [01:32<46:03,  2.36s/it, loss=0.202, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000337, train/loss_step=0.102, global_step=5445.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   3%|▎         | 40/1208 [01:35<46:16,  2.38s/it, loss=0.202, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000337, train/loss_step=0.102, global_step=5445.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   3%|▎         | 40/1208 [01:35<46:16,  2.38s/it, loss=0.209, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000546, train/loss_step=0.162, global_step=5445.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   3%|▎         | 41/1208 [01:36<45:35,  2.34s/it, loss=0.209, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000546, train/loss_step=0.162, global_step=5445.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   3%|▎         | 41/1208 [01:36<45:35,  2.34s/it, loss=0.214, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=5446.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   3%|▎         | 42/1208 [01:37<44:55,  2.31s/it, loss=0.214, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=5446.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   3%|▎         | 42/1208 [01:37<44:55,  2.31s/it, loss=0.222, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000576, train/loss_step=0.165, global_step=5446.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   4%|▎         | 43/1208 [01:38<44:18,  2.28s/it, loss=0.222, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000576, train/loss_step=0.165, global_step=5446.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   4%|▎         | 43/1208 [01:38<44:18,  2.28s/it, loss=0.204, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.31e-5, train/loss_step=0.00225, global_step=5446.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   4%|▎         | 44/1208 [01:40<44:31,  2.29s/it, loss=0.204, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.31e-5, train/loss_step=0.00225, global_step=5446.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   4%|▎         | 44/1208 [01:40<44:31,  2.29s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00396, train/loss_vlb_step=2.15e-5, train/loss_step=0.00396, global_step=5446.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:   4%|▎         | 45/1208 [01:41<43:55,  2.27s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00396, train/loss_vlb_step=2.15e-5, train/loss_step=0.00396, global_step=5446.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   4%|▎         | 45/1208 [01:41<43:55,  2.27s/it, loss=0.178, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000891, train/loss_step=0.229, global_step=5447.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:   4%|▍         | 46/1208 [01:42<43:21,  2.24s/it, loss=0.178, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000891, train/loss_step=0.229, global_step=5447.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   4%|▍         | 46/1208 [01:42<43:21,  2.24s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0069, train/loss_vlb_step=3.39e-5, train/loss_step=0.0069, global_step=5447.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   4%|▍         | 47/1208 [01:43<42:48,  2.21s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0069, train/loss_vlb_step=3.39e-5, train/loss_step=0.0069, global_step=5447.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   4%|▍         | 47/1208 [01:43<42:48,  2.21s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00377, train/loss_vlb_step=2.1e-5, train/loss_step=0.00377, global_step=5447.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   4%|▍         | 48/1208 [01:46<43:03,  2.23s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00377, train/loss_vlb_step=2.1e-5, train/loss_step=0.00377, global_step=5447.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   4%|▍         | 48/1208 [01:46<43:03,  2.23s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.23e-5, train/loss_step=0.0142, global_step=5447.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:   4%|▍         | 49/1208 [01:47<42:32,  2.20s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.23e-5, train/loss_step=0.0142, global_step=5447.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   4%|▍         | 49/1208 [01:47<42:32,  2.20s/it, loss=0.149, v_num=0, train/loss_simple_step=0.525, train/loss_vlb_step=0.00858, train/loss_step=0.525, global_step=5448.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:   4%|▍         | 50/1208 [01:48<42:02,  2.18s/it, loss=0.149, v_num=0, train/loss_simple_step=0.525, train/loss_vlb_step=0.00858, train/loss_step=0.525, global_step=5448.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   4%|▍         | 50/1208 [01:48<42:02,  2.18s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0574, train/loss_vlb_step=0.000198, train/loss_step=0.0574, global_step=5448.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   4%|▍         | 51/1208 [01:49<41:33,  2.16s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0574, train/loss_vlb_step=0.000198, train/loss_step=0.0574, global_step=5448.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   4%|▍         | 51/1208 [01:49<41:33,  2.16s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.58e-5, train/loss_step=0.0152, global_step=5448.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:   4%|▍         | 52/1208 [01:52<41:47,  2.17s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.58e-5, train/loss_step=0.0152, global_step=5448.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   4%|▍         | 52/1208 [01:52<41:47,  2.17s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.22e-5, train/loss_step=0.00207, global_step=5448.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   4%|▍         | 53/1208 [01:53<41:20,  2.15s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.22e-5, train/loss_step=0.00207, global_step=5448.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   4%|▍         | 53/1208 [01:53<41:20,  2.15s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0569, train/loss_vlb_step=0.000203, train/loss_step=0.0569, global_step=5449.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   4%|▍         | 54/1208 [01:54<40:54,  2.13s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0569, train/loss_vlb_step=0.000203, train/loss_step=0.0569, global_step=5449.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   4%|▍         | 54/1208 [01:54<40:54,  2.13s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0809, train/loss_vlb_step=0.000267, train/loss_step=0.0809, global_step=5449.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:   5%|▍         | 55/1208 [01:55<40:29,  2.11s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0809, train/loss_vlb_step=0.000267, train/loss_step=0.0809, global_step=5449.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   5%|▍         | 55/1208 [01:55<40:29,  2.11s/it, loss=0.123, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.0011, train/loss_step=0.262, global_step=5449.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:   5%|▍         | 56/1208 [01:58<40:42,  2.12s/it, loss=0.123, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.0011, train/loss_step=0.262, global_step=5449.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   5%|▍         | 56/1208 [01:58<40:42,  2.12s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.42e-5, train/loss_step=0.0132, global_step=5449.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   5%|▍         | 57/1208 [01:59<40:17,  2.10s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.42e-5, train/loss_step=0.0132, global_step=5449.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   5%|▍         | 57/1208 [01:59<40:17,  2.10s/it, loss=0.137, v_num=0, train/loss_simple_step=0.737, train/loss_vlb_step=0.054, train/loss_step=0.737, global_step=5450.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:   5%|▍         | 58/1208 [02:00<39:53,  2.08s/it, loss=0.137, v_num=0, train/loss_simple_step=0.737, train/loss_vlb_step=0.054, train/loss_step=0.737, global_step=5450.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   5%|▍         | 58/1208 [02:00<39:53,  2.08s/it, loss=0.165, v_num=0, train/loss_simple_step=0.730, train/loss_vlb_step=0.0419, train/loss_step=0.730, global_step=5450.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   5%|▍         | 59/1208 [02:01<39:30,  2.06s/it, loss=0.165, v_num=0, train/loss_simple_step=0.730, train/loss_vlb_step=0.0419, train/loss_step=0.730, global_step=5450.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   5%|▍         | 59/1208 [02:01<39:30,  2.06s/it, loss=0.166, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.00042, train/loss_step=0.126, global_step=5450.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   5%|▍         | 60/1208 [02:04<39:44,  2.08s/it, loss=0.166, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.00042, train/loss_step=0.126, global_step=5450.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   5%|▍         | 60/1208 [02:04<39:44,  2.08s/it, loss=0.171, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00164, train/loss_step=0.273, global_step=5450.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   5%|▌         | 61/1208 [02:05<39:22,  2.06s/it, loss=0.171, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00164, train/loss_step=0.273, global_step=5450.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   5%|▌         | 61/1208 [02:05<39:22,  2.06s/it, loss=0.172, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.00049, train/loss_step=0.145, global_step=5451.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   5%|▌         | 62/1208 [02:06<39:01,  2.04s/it, loss=0.172, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.00049, train/loss_step=0.145, global_step=5451.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   5%|▌         | 62/1208 [02:06<39:01,  2.04s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000109, train/loss_step=0.0278, global_step=5451.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   5%|▌         | 63/1208 [02:07<38:40,  2.03s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000109, train/loss_step=0.0278, global_step=5451.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   5%|▌         | 63/1208 [02:07<38:40,  2.03s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00749, train/loss_vlb_step=3.73e-5, train/loss_step=0.00749, global_step=5451.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   5%|▌         | 64/1208 [02:10<38:53,  2.04s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00749, train/loss_vlb_step=3.73e-5, train/loss_step=0.00749, global_step=5451.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   5%|▌         | 64/1208 [02:10<38:53,  2.04s/it, loss=0.18, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00152, train/loss_step=0.293, global_step=5451.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 18:   5%|▌         | 65/1208 [02:11<38:33,  2.02s/it, loss=0.18, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00152, train/loss_step=0.293, global_step=5451.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   5%|▌         | 65/1208 [02:11<38:33,  2.02s/it, loss=0.174, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=5452.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   5%|▌         | 66/1208 [02:12<38:13,  2.01s/it, loss=0.174, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=5452.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   5%|▌         | 66/1208 [02:12<38:13,  2.01s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0646, train/loss_vlb_step=0.000222, train/loss_step=0.0646, global_step=5452.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   6%|▌         | 67/1208 [02:13<37:54,  1.99s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0646, train/loss_vlb_step=0.000222, train/loss_step=0.0646, global_step=5452.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   6%|▌         | 67/1208 [02:13<37:54,  1.99s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0835, train/loss_vlb_step=0.000277, train/loss_step=0.0835, global_step=5452.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   6%|▌         | 68/1208 [02:16<38:07,  2.01s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0835, train/loss_vlb_step=0.000277, train/loss_step=0.0835, global_step=5452.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   6%|▌         | 68/1208 [02:16<38:07,  2.01s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0427, train/loss_vlb_step=0.000157, train/loss_step=0.0427, global_step=5452.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   6%|▌         | 69/1208 [02:17<37:49,  1.99s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0427, train/loss_vlb_step=0.000157, train/loss_step=0.0427, global_step=5452.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   6%|▌         | 69/1208 [02:17<37:49,  1.99s/it, loss=0.17, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00112, train/loss_step=0.268, global_step=5453.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:   6%|▌         | 70/1208 [02:18<37:31,  1.98s/it, loss=0.17, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00112, train/loss_step=0.268, global_step=5453.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   6%|▌         | 70/1208 [02:18<37:31,  1.98s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0694, train/loss_vlb_step=0.000236, train/loss_step=0.0694, global_step=5453.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   6%|▌         | 71/1208 [02:19<37:13,  1.96s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0694, train/loss_vlb_step=0.000236, train/loss_step=0.0694, global_step=5453.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   6%|▌         | 71/1208 [02:19<37:13,  1.96s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.41e-5, train/loss_step=0.00241, global_step=5453.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   6%|▌         | 72/1208 [02:22<37:26,  1.98s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.41e-5, train/loss_step=0.00241, global_step=5453.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   6%|▌         | 72/1208 [02:22<37:26,  1.98s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00791, train/loss_vlb_step=3.82e-5, train/loss_step=0.00791, global_step=5453.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   6%|▌         | 73/1208 [02:23<37:09,  1.96s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00791, train/loss_vlb_step=3.82e-5, train/loss_step=0.00791, global_step=5453.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   6%|▌         | 73/1208 [02:23<37:09,  1.96s/it, loss=0.181, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.0014, train/loss_step=0.278, global_step=5454.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:   6%|▌         | 74/1208 [02:24<36:52,  1.95s/it, loss=0.181, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.0014, train/loss_step=0.278, global_step=5454.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   6%|▌         | 74/1208 [02:24<36:52,  1.95s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=9.29e-6, train/loss_step=0.00152, global_step=5454.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   6%|▌         | 75/1208 [02:25<36:36,  1.94s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=9.29e-6, train/loss_step=0.00152, global_step=5454.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   6%|▌         | 75/1208 [02:25<36:36,  1.94s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.19e-5, train/loss_step=0.0198, global_step=5454.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:   6%|▋         | 76/1208 [02:28<36:48,  1.95s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.19e-5, train/loss_step=0.0198, global_step=5454.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   6%|▋         | 76/1208 [02:28<36:48,  1.95s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00935, train/loss_vlb_step=4.45e-5, train/loss_step=0.00935, global_step=5454.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   6%|▋         | 77/1208 [02:29<36:32,  1.94s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00935, train/loss_vlb_step=4.45e-5, train/loss_step=0.00935, global_step=5454.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   6%|▋         | 77/1208 [02:29<36:32,  1.94s/it, loss=0.145, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.0019, train/loss_step=0.344, global_step=5455.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 18:   6%|▋         | 78/1208 [02:30<36:17,  1.93s/it, loss=0.145, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.0019, train/loss_step=0.344, global_step=5455.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   6%|▋         | 78/1208 [02:30<36:17,  1.93s/it, loss=0.112, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.00023, train/loss_step=0.067, global_step=5455.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   7%|▋         | 79/1208 [02:31<36:02,  1.92s/it, loss=0.112, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.00023, train/loss_step=0.067, global_step=5455.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   7%|▋         | 79/1208 [02:31<36:02,  1.92s/it, loss=0.112, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000439, train/loss_step=0.133, global_step=5455.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   7%|▋         | 80/1208 [02:34<36:14,  1.93s/it, loss=0.112, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000439, train/loss_step=0.133, global_step=5455.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   7%|▋         | 80/1208 [02:34<36:14,  1.93s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0724, train/loss_vlb_step=0.000245, train/loss_step=0.0724, global_step=5455.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   7%|▋         | 81/1208 [02:35<35:59,  1.92s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0724, train/loss_vlb_step=0.000245, train/loss_step=0.0724, global_step=5455.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   7%|▋         | 81/1208 [02:35<35:59,  1.92s/it, loss=0.121, v_num=0, train/loss_simple_step=0.514, train/loss_vlb_step=0.00668, train/loss_step=0.514, global_step=5456.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:   7%|▋         | 82/1208 [02:36<35:44,  1.90s/it, loss=0.121, v_num=0, train/loss_simple_step=0.514, train/loss_vlb_step=0.00668, train/loss_step=0.514, global_step=5456.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   7%|▋         | 82/1208 [02:36<35:45,  1.90s/it, loss=0.124, v_num=0, train/loss_simple_step=0.093, train/loss_vlb_step=0.000306, train/loss_step=0.093, global_step=5456.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   7%|▋         | 83/1208 [02:37<35:30,  1.89s/it, loss=0.124, v_num=0, train/loss_simple_step=0.093, train/loss_vlb_step=0.000306, train/loss_step=0.093, global_step=5456.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   7%|▋         | 83/1208 [02:37<35:30,  1.89s/it, loss=0.129, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000379, train/loss_step=0.114, global_step=5456.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   7%|▋         | 84/1208 [02:40<35:42,  1.91s/it, loss=0.129, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000379, train/loss_step=0.114, global_step=5456.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   7%|▋         | 84/1208 [02:40<35:42,  1.91s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000161, train/loss_step=0.0449, global_step=5456.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   7%|▋         | 85/1208 [02:41<35:28,  1.90s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000161, train/loss_step=0.0449, global_step=5456.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   7%|▋         | 85/1208 [02:41<35:28,  1.90s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.92e-5, train/loss_step=0.00331, global_step=5457.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   7%|▋         | 86/1208 [02:42<35:15,  1.89s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.92e-5, train/loss_step=0.00331, global_step=5457.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   7%|▋         | 86/1208 [02:42<35:15,  1.89s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.66e-5, train/loss_step=0.00296, global_step=5457.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   7%|▋         | 87/1208 [02:43<35:01,  1.87s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.66e-5, train/loss_step=0.00296, global_step=5457.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   7%|▋         | 87/1208 [02:43<35:01,  1.87s/it, loss=0.106, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=9.99e-5, train/loss_step=0.025, global_step=5457.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:   7%|▋         | 88/1208 [02:46<35:13,  1.89s/it, loss=0.106, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=9.99e-5, train/loss_step=0.025, global_step=5457.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   7%|▋         | 88/1208 [02:46<35:13,  1.89s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.25e-5, train/loss_step=0.00216, global_step=5457.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   7%|▋         | 89/1208 [02:47<35:00,  1.88s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.25e-5, train/loss_step=0.00216, global_step=5457.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   7%|▋         | 89/1208 [02:47<35:00,  1.88s/it, loss=0.111, v_num=0, train/loss_simple_step=0.424, train/loss_vlb_step=0.00385, train/loss_step=0.424, global_step=5458.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:   7%|▋         | 90/1208 [02:48<34:47,  1.87s/it, loss=0.111, v_num=0, train/loss_simple_step=0.424, train/loss_vlb_step=0.00385, train/loss_step=0.424, global_step=5458.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   7%|▋         | 90/1208 [02:48<34:47,  1.87s/it, loss=0.114, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.0004, train/loss_step=0.121, global_step=5458.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:   8%|▊         | 91/1208 [02:49<34:35,  1.86s/it, loss=0.114, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.0004, train/loss_step=0.121, global_step=5458.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   8%|▊         | 91/1208 [02:49<34:35,  1.86s/it, loss=0.123, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.00059, train/loss_step=0.174, global_step=5458.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   8%|▊         | 92/1208 [02:52<34:50,  1.87s/it, loss=0.123, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.00059, train/loss_step=0.174, global_step=5458.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   8%|▊         | 92/1208 [02:52<34:50,  1.87s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.2e-5, train/loss_step=0.0178, global_step=5458.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   8%|▊         | 93/1208 [02:53<34:38,  1.86s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.2e-5, train/loss_step=0.0178, global_step=5458.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   8%|▊         | 93/1208 [02:53<34:38,  1.86s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000123, train/loss_step=0.0334, global_step=5459.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   8%|▊         | 94/1208 [02:54<34:26,  1.86s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000123, train/loss_step=0.0334, global_step=5459.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   8%|▊         | 94/1208 [02:54<34:26,  1.86s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00762, train/loss_vlb_step=3.81e-5, train/loss_step=0.00762, global_step=5459.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   8%|▊         | 95/1208 [02:55<34:15,  1.85s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00762, train/loss_vlb_step=3.81e-5, train/loss_step=0.00762, global_step=5459.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   8%|▊         | 95/1208 [02:55<34:15,  1.85s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.71e-5, train/loss_step=0.0125, global_step=5459.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:   8%|▊         | 96/1208 [02:58<34:30,  1.86s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.71e-5, train/loss_step=0.0125, global_step=5459.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   8%|▊         | 96/1208 [02:58<34:30,  1.86s/it, loss=0.126, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00158, train/loss_step=0.313, global_step=5459.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:   8%|▊         | 97/1208 [02:59<34:19,  1.85s/it, loss=0.126, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00158, train/loss_step=0.313, global_step=5459.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   8%|▊         | 97/1208 [02:59<34:19,  1.85s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0747, train/loss_vlb_step=0.000246, train/loss_step=0.0747, global_step=5460.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   8%|▊         | 98/1208 [03:00<34:08,  1.85s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0747, train/loss_vlb_step=0.000246, train/loss_step=0.0747, global_step=5460.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   8%|▊         | 98/1208 [03:00<34:08,  1.85s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.78e-5, train/loss_step=0.00324, global_step=5460.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   8%|▊         | 99/1208 [03:01<33:57,  1.84s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.78e-5, train/loss_step=0.00324, global_step=5460.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   8%|▊         | 99/1208 [03:01<33:57,  1.84s/it, loss=0.11, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000483, train/loss_step=0.145, global_step=5460.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:   8%|▊         | 100/1208 [03:05<34:11,  1.85s/it, loss=0.11, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000483, train/loss_step=0.145, global_step=5460.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   8%|▊         | 100/1208 [03:05<34:11,  1.85s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=8.75e-6, train/loss_step=0.00145, global_step=5460.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   8%|▊         | 101/1208 [03:06<34:00,  1.84s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=8.75e-6, train/loss_step=0.00145, global_step=5460.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   8%|▊         | 101/1208 [03:06<34:00,  1.84s/it, loss=0.0844, v_num=0, train/loss_simple_step=0.0738, train/loss_vlb_step=0.000252, train/loss_step=0.0738, global_step=5461.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   8%|▊         | 102/1208 [03:07<33:50,  1.84s/it, loss=0.0844, v_num=0, train/loss_simple_step=0.0738, train/loss_vlb_step=0.000252, train/loss_step=0.0738, global_step=5461.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   8%|▊         | 102/1208 [03:07<33:50,  1.84s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00183, train/loss_step=0.339, global_step=5461.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:   9%|▊         | 103/1208 [03:08<33:39,  1.83s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00183, train/loss_step=0.339, global_step=5461.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   9%|▊         | 103/1208 [03:08<33:39,  1.83s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000159, train/loss_step=0.0448, global_step=5461.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   9%|▊         | 104/1208 [03:11<33:52,  1.84s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000159, train/loss_step=0.0448, global_step=5461.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   9%|▊         | 104/1208 [03:11<33:52,  1.84s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.0978, train/loss_vlb_step=0.000324, train/loss_step=0.0978, global_step=5461.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   9%|▊         | 105/1208 [03:12<33:42,  1.83s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.0978, train/loss_vlb_step=0.000324, train/loss_step=0.0978, global_step=5461.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   9%|▊         | 105/1208 [03:12<33:42,  1.83s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000112, train/loss_step=0.0301, global_step=5462.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   9%|▉         | 106/1208 [03:13<33:32,  1.83s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000112, train/loss_step=0.0301, global_step=5462.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   9%|▉         | 106/1208 [03:13<33:32,  1.83s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.005, train/loss_vlb_step=2.6e-5, train/loss_step=0.005, global_step=5462.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:   9%|▉         | 107/1208 [03:14<33:22,  1.82s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.005, train/loss_vlb_step=2.6e-5, train/loss_step=0.005, global_step=5462.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   9%|▉         | 107/1208 [03:14<33:22,  1.82s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.000177, train/loss_step=0.0521, global_step=5462.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   9%|▉         | 108/1208 [03:17<33:35,  1.83s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.000177, train/loss_step=0.0521, global_step=5462.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   9%|▉         | 108/1208 [03:17<33:35,  1.83s/it, loss=0.131, v_num=0, train/loss_simple_step=0.656, train/loss_vlb_step=0.0184, train/loss_step=0.656, global_step=5462.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 18:   9%|▉         | 109/1208 [03:18<33:25,  1.82s/it, loss=0.131, v_num=0, train/loss_simple_step=0.656, train/loss_vlb_step=0.0184, train/loss_step=0.656, global_step=5462.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   9%|▉         | 109/1208 [03:18<33:25,  1.82s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=2.22e-5, train/loss_step=0.00416, global_step=5463.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   9%|▉         | 110/1208 [03:19<33:15,  1.82s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=2.22e-5, train/loss_step=0.00416, global_step=5463.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   9%|▉         | 110/1208 [03:19<33:15,  1.82s/it, loss=0.111, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000464, train/loss_step=0.139, global_step=5463.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:   9%|▉         | 111/1208 [03:20<33:06,  1.81s/it, loss=0.111, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000464, train/loss_step=0.139, global_step=5463.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   9%|▉         | 111/1208 [03:20<33:06,  1.81s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0424, train/loss_vlb_step=0.00015, train/loss_step=0.0424, global_step=5463.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   9%|▉         | 112/1208 [03:24<33:18,  1.82s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0424, train/loss_vlb_step=0.00015, train/loss_step=0.0424, global_step=5463.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   9%|▉         | 112/1208 [03:24<33:18,  1.82s/it, loss=0.137, v_num=0, train/loss_simple_step=0.658, train/loss_vlb_step=0.0217, train/loss_step=0.658, global_step=5463.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:   9%|▉         | 113/1208 [03:25<33:09,  1.82s/it, loss=0.137, v_num=0, train/loss_simple_step=0.658, train/loss_vlb_step=0.0217, train/loss_step=0.658, global_step=5463.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   9%|▉         | 113/1208 [03:25<33:09,  1.82s/it, loss=0.145, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000663, train/loss_step=0.191, global_step=5464.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   9%|▉         | 114/1208 [03:26<32:59,  1.81s/it, loss=0.145, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000663, train/loss_step=0.191, global_step=5464.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:   9%|▉         | 114/1208 [03:26<32:59,  1.81s/it, loss=0.167, v_num=0, train/loss_simple_step=0.464, train/loss_vlb_step=0.00558, train/loss_step=0.464, global_step=5464.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  10%|▉         | 115/1208 [03:27<32:50,  1.80s/it, loss=0.167, v_num=0, train/loss_simple_step=0.464, train/loss_vlb_step=0.00558, train/loss_step=0.464, global_step=5464.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  10%|▉         | 115/1208 [03:27<32:50,  1.80s/it, loss=0.174, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000482, train/loss_step=0.146, global_step=5464.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  10%|▉         | 116/1208 [03:30<33:02,  1.82s/it, loss=0.174, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000482, train/loss_step=0.146, global_step=5464.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  10%|▉         | 116/1208 [03:30<33:02,  1.82s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000125, train/loss_step=0.0327, global_step=5464.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  10%|▉         | 117/1208 [03:31<32:53,  1.81s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000125, train/loss_step=0.0327, global_step=5464.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  10%|▉         | 117/1208 [03:31<32:53,  1.81s/it, loss=0.161, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000337, train/loss_step=0.102, global_step=5465.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  10%|▉         | 118/1208 [03:32<32:44,  1.80s/it, loss=0.161, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000337, train/loss_step=0.102, global_step=5465.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  10%|▉         | 118/1208 [03:32<32:44,  1.80s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000142, train/loss_step=0.0376, global_step=5465.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  10%|▉         | 119/1208 [03:33<32:36,  1.80s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000142, train/loss_step=0.0376, global_step=5465.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  10%|▉         | 119/1208 [03:33<32:36,  1.80s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00891, train/loss_vlb_step=4.31e-5, train/loss_step=0.00891, global_step=5465.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  10%|▉         | 120/1208 [03:36<32:47,  1.81s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00891, train/loss_vlb_step=4.31e-5, train/loss_step=0.00891, global_step=5465.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  10%|▉         | 120/1208 [03:36<32:47,  1.81s/it, loss=0.186, v_num=0, train/loss_simple_step=0.591, train/loss_vlb_step=0.0138, train/loss_step=0.591, global_step=5465.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 18:  10%|█         | 121/1208 [03:38<32:38,  1.80s/it, loss=0.186, v_num=0, train/loss_simple_step=0.591, train/loss_vlb_step=0.0138, train/loss_step=0.591, global_step=5465.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  10%|█         | 121/1208 [03:38<32:38,  1.80s/it, loss=0.198, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00178, train/loss_step=0.322, global_step=5466.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  10%|█         | 122/1208 [03:39<32:29,  1.80s/it, loss=0.198, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00178, train/loss_step=0.322, global_step=5466.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  10%|█         | 122/1208 [03:39<32:29,  1.80s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0688, train/loss_vlb_step=0.000233, train/loss_step=0.0688, global_step=5466.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  10%|█         | 123/1208 [03:40<32:21,  1.79s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0688, train/loss_vlb_step=0.000233, train/loss_step=0.0688, global_step=5466.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  10%|█         | 123/1208 [03:40<32:21,  1.79s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=9.76e-6, train/loss_step=0.00161, global_step=5466.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  10%|█         | 124/1208 [03:43<32:32,  1.80s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=9.76e-6, train/loss_step=0.00161, global_step=5466.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  10%|█         | 124/1208 [03:43<32:32,  1.80s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00967, train/loss_vlb_step=4.49e-5, train/loss_step=0.00967, global_step=5466.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  10%|█         | 125/1208 [03:44<32:24,  1.80s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00967, train/loss_vlb_step=4.49e-5, train/loss_step=0.00967, global_step=5466.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  10%|█         | 125/1208 [03:44<32:24,  1.80s/it, loss=0.178, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=8.12e-5, train/loss_step=0.019, global_step=5467.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  10%|█         | 126/1208 [03:45<32:15,  1.79s/it, loss=0.178, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=8.12e-5, train/loss_step=0.019, global_step=5467.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  10%|█         | 126/1208 [03:45<32:15,  1.79s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000122, train/loss_step=0.0329, global_step=5467.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  11%|█         | 127/1208 [03:46<32:07,  1.78s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000122, train/loss_step=0.0329, global_step=5467.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  11%|█         | 127/1208 [03:46<32:07,  1.78s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.000116, train/loss_step=0.0292, global_step=5467.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  11%|█         | 128/1208 [03:49<32:18,  1.79s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.000116, train/loss_step=0.0292, global_step=5467.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  11%|█         | 128/1208 [03:49<32:18,  1.79s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00736, train/loss_vlb_step=3.74e-5, train/loss_step=0.00736, global_step=5467.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  11%|█         | 129/1208 [03:50<32:10,  1.79s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00736, train/loss_vlb_step=3.74e-5, train/loss_step=0.00736, global_step=5467.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  11%|█         | 129/1208 [03:50<32:10,  1.79s/it, loss=0.161, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00159, train/loss_step=0.309, global_step=5468.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  11%|█         | 130/1208 [03:51<32:01,  1.78s/it, loss=0.161, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00159, train/loss_step=0.309, global_step=5468.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  11%|█         | 130/1208 [03:51<32:01,  1.78s/it, loss=0.164, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000702, train/loss_step=0.206, global_step=5468.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  11%|█         | 131/1208 [03:52<31:53,  1.78s/it, loss=0.164, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000702, train/loss_step=0.206, global_step=5468.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  11%|█         | 131/1208 [03:52<31:53,  1.78s/it, loss=0.181, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00247, train/loss_step=0.390, global_step=5468.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  11%|█         | 132/1208 [03:56<32:04,  1.79s/it, loss=0.181, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00247, train/loss_step=0.390, global_step=5468.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  11%|█         | 132/1208 [03:56<32:04,  1.79s/it, loss=0.158, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000613, train/loss_step=0.183, global_step=5468.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  11%|█         | 133/1208 [03:57<31:56,  1.78s/it, loss=0.158, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000613, train/loss_step=0.183, global_step=5468.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  11%|█         | 133/1208 [03:57<31:56,  1.78s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=2.67e-5, train/loss_step=0.00526, global_step=5469.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  11%|█         | 134/1208 [03:58<31:48,  1.78s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=2.67e-5, train/loss_step=0.00526, global_step=5469.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  11%|█         | 134/1208 [03:58<31:48,  1.78s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.7e-5, train/loss_step=0.0101, global_step=5469.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  11%|█         | 135/1208 [03:59<31:41,  1.77s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.7e-5, train/loss_step=0.0101, global_step=5469.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  11%|█         | 135/1208 [03:59<31:41,  1.77s/it, loss=0.127, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.00056, train/loss_step=0.164, global_step=5469.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  11%|█▏        | 136/1208 [04:02<31:51,  1.78s/it, loss=0.127, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.00056, train/loss_step=0.164, global_step=5469.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  11%|█▏        | 136/1208 [04:02<31:51,  1.78s/it, loss=0.138, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00112, train/loss_step=0.255, global_step=5469.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  11%|█▏        | 137/1208 [04:03<31:43,  1.78s/it, loss=0.138, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00112, train/loss_step=0.255, global_step=5469.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  11%|█▏        | 137/1208 [04:03<31:43,  1.78s/it, loss=0.138, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=5470.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  11%|█▏        | 138/1208 [04:04<31:36,  1.77s/it, loss=0.138, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=5470.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  11%|█▏        | 138/1208 [04:04<31:36,  1.77s/it, loss=0.149, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00121, train/loss_step=0.247, global_step=5470.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  12%|█▏        | 139/1208 [04:05<31:28,  1.77s/it, loss=0.149, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00121, train/loss_step=0.247, global_step=5470.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  12%|█▏        | 139/1208 [04:05<31:28,  1.77s/it, loss=0.167, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00204, train/loss_step=0.372, global_step=5470.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  12%|█▏        | 140/1208 [04:08<31:38,  1.78s/it, loss=0.167, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00204, train/loss_step=0.372, global_step=5470.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  12%|█▏        | 140/1208 [04:08<31:38,  1.78s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000143, train/loss_step=0.0373, global_step=5470.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  12%|█▏        | 141/1208 [04:09<31:30,  1.77s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000143, train/loss_step=0.0373, global_step=5470.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  12%|█▏        | 141/1208 [04:09<31:30,  1.77s/it, loss=0.137, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00126, train/loss_step=0.283, global_step=5471.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  12%|█▏        | 142/1208 [04:10<31:23,  1.77s/it, loss=0.137, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00126, train/loss_step=0.283, global_step=5471.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  12%|█▏        | 142/1208 [04:10<31:23,  1.77s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.15e-5, train/loss_step=0.0108, global_step=5471.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  12%|█▏        | 143/1208 [04:11<31:16,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.15e-5, train/loss_step=0.0108, global_step=5471.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  12%|█▏        | 143/1208 [04:11<31:16,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00529, train/loss_vlb_step=2.65e-5, train/loss_step=0.00529, global_step=5471.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  12%|█▏        | 144/1208 [04:15<31:25,  1.77s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00529, train/loss_vlb_step=2.65e-5, train/loss_step=0.00529, global_step=5471.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  12%|█▏        | 144/1208 [04:15<31:25,  1.77s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0962, train/loss_vlb_step=0.000323, train/loss_step=0.0962, global_step=5471.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  12%|█▏        | 145/1208 [04:16<31:18,  1.77s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0962, train/loss_vlb_step=0.000323, train/loss_step=0.0962, global_step=5471.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  12%|█▏        | 145/1208 [04:16<31:18,  1.77s/it, loss=0.177, v_num=0, train/loss_simple_step=0.775, train/loss_vlb_step=0.0336, train/loss_step=0.775, global_step=5472.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  12%|█▏        | 146/1208 [04:17<31:11,  1.76s/it, loss=0.177, v_num=0, train/loss_simple_step=0.775, train/loss_vlb_step=0.0336, train/loss_step=0.775, global_step=5472.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  12%|█▏        | 146/1208 [04:17<31:11,  1.76s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0971, train/loss_vlb_step=0.00032, train/loss_step=0.0971, global_step=5472.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  12%|█▏        | 147/1208 [04:18<31:04,  1.76s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0971, train/loss_vlb_step=0.00032, train/loss_step=0.0971, global_step=5472.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  12%|█▏        | 147/1208 [04:18<31:04,  1.76s/it, loss=0.204, v_num=0, train/loss_simple_step=0.514, train/loss_vlb_step=0.00608, train/loss_step=0.514, global_step=5472.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  12%|█▏        | 148/1208 [04:21<31:13,  1.77s/it, loss=0.204, v_num=0, train/loss_simple_step=0.514, train/loss_vlb_step=0.00608, train/loss_step=0.514, global_step=5472.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  12%|█▏        | 148/1208 [04:21<31:13,  1.77s/it, loss=0.227, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00372, train/loss_step=0.458, global_step=5472.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  12%|█▏        | 149/1208 [04:22<31:06,  1.76s/it, loss=0.227, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00372, train/loss_step=0.458, global_step=5472.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  12%|█▏        | 149/1208 [04:22<31:06,  1.76s/it, loss=0.22, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000611, train/loss_step=0.166, global_step=5473.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  12%|█▏        | 150/1208 [04:23<30:59,  1.76s/it, loss=0.22, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000611, train/loss_step=0.166, global_step=5473.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  12%|█▏        | 150/1208 [04:23<30:59,  1.76s/it, loss=0.225, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00186, train/loss_step=0.311, global_step=5473.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  12%|█▎        | 151/1208 [04:24<30:53,  1.75s/it, loss=0.225, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00186, train/loss_step=0.311, global_step=5473.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  12%|█▎        | 151/1208 [04:24<30:53,  1.75s/it, loss=0.209, v_num=0, train/loss_simple_step=0.079, train/loss_vlb_step=0.000263, train/loss_step=0.079, global_step=5473.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  13%|█▎        | 152/1208 [04:27<31:01,  1.76s/it, loss=0.209, v_num=0, train/loss_simple_step=0.079, train/loss_vlb_step=0.000263, train/loss_step=0.079, global_step=5473.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  13%|█▎        | 152/1208 [04:27<31:01,  1.76s/it, loss=0.206, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=5473.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  13%|█▎        | 153/1208 [04:28<30:54,  1.76s/it, loss=0.206, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=5473.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  13%|█▎        | 153/1208 [04:28<30:54,  1.76s/it, loss=0.206, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=1.3e-5, train/loss_step=0.00224, global_step=5474.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  13%|█▎        | 154/1208 [04:30<30:48,  1.75s/it, loss=0.206, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=1.3e-5, train/loss_step=0.00224, global_step=5474.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  13%|█▎        | 154/1208 [04:30<30:48,  1.75s/it, loss=0.215, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000673, train/loss_step=0.192, global_step=5474.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  13%|█▎        | 155/1208 [04:31<30:41,  1.75s/it, loss=0.215, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000673, train/loss_step=0.192, global_step=5474.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  13%|█▎        | 155/1208 [04:31<30:41,  1.75s/it, loss=0.207, v_num=0, train/loss_simple_step=0.00358, train/loss_vlb_step=1.95e-5, train/loss_step=0.00358, global_step=5474.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  13%|█▎        | 156/1208 [04:34<30:49,  1.76s/it, loss=0.207, v_num=0, train/loss_simple_step=0.00358, train/loss_vlb_step=1.95e-5, train/loss_step=0.00358, global_step=5474.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  13%|█▎        | 156/1208 [04:34<30:49,  1.76s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0647, train/loss_vlb_step=0.000218, train/loss_step=0.0647, global_step=5474.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  13%|█▎        | 157/1208 [04:35<30:43,  1.75s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0647, train/loss_vlb_step=0.000218, train/loss_step=0.0647, global_step=5474.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  13%|█▎        | 157/1208 [04:35<30:43,  1.75s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=1.89e-5, train/loss_step=0.00347, global_step=5475.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  13%|█▎        | 158/1208 [04:36<30:36,  1.75s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=1.89e-5, train/loss_step=0.00347, global_step=5475.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  13%|█▎        | 158/1208 [04:36<30:36,  1.75s/it, loss=0.198, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00288, train/loss_step=0.380, global_step=5475.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  13%|█▎        | 159/1208 [04:37<30:30,  1.74s/it, loss=0.198, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00288, train/loss_step=0.380, global_step=5475.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  13%|█▎        | 159/1208 [04:37<30:30,  1.74s/it, loss=0.186, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=5475.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  13%|█▎        | 160/1208 [04:40<30:38,  1.75s/it, loss=0.186, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=5475.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  13%|█▎        | 160/1208 [04:40<30:38,  1.75s/it, loss=0.195, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000889, train/loss_step=0.213, global_step=5475.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  13%|█▎        | 161/1208 [04:41<30:32,  1.75s/it, loss=0.195, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000889, train/loss_step=0.213, global_step=5475.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  13%|█▎        | 161/1208 [04:41<30:32,  1.75s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=1.19e-5, train/loss_step=0.00196, global_step=5476.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  13%|█▎        | 162/1208 [04:42<30:26,  1.75s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=1.19e-5, train/loss_step=0.00196, global_step=5476.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  13%|█▎        | 162/1208 [04:42<30:26,  1.75s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000116, train/loss_step=0.0287, global_step=5476.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  13%|█▎        | 163/1208 [04:43<30:19,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000116, train/loss_step=0.0287, global_step=5476.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  13%|█▎        | 163/1208 [04:43<30:19,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00519, train/loss_vlb_step=2.69e-5, train/loss_step=0.00519, global_step=5476.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  14%|█▎        | 164/1208 [04:47<30:27,  1.75s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00519, train/loss_vlb_step=2.69e-5, train/loss_step=0.00519, global_step=5476.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  14%|█▎        | 164/1208 [04:47<30:27,  1.75s/it, loss=0.183, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000455, train/loss_step=0.137, global_step=5476.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  14%|█▎        | 165/1208 [04:48<30:21,  1.75s/it, loss=0.183, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000455, train/loss_step=0.137, global_step=5476.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  14%|█▎        | 165/1208 [04:48<30:21,  1.75s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.23e-5, train/loss_step=0.0021, global_step=5477.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  14%|█▎        | 166/1208 [04:49<30:15,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.23e-5, train/loss_step=0.0021, global_step=5477.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  14%|█▎        | 166/1208 [04:49<30:15,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0511, train/loss_vlb_step=0.000177, train/loss_step=0.0511, global_step=5477.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  14%|█▍        | 167/1208 [04:50<30:08,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0511, train/loss_vlb_step=0.000177, train/loss_step=0.0511, global_step=5477.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  14%|█▍        | 167/1208 [04:50<30:08,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.23e-5, train/loss_step=0.0167, global_step=5477.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  14%|█▍        | 168/1208 [04:53<30:16,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.23e-5, train/loss_step=0.0167, global_step=5477.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  14%|█▍        | 168/1208 [04:53<30:16,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00155, train/loss_step=0.323, global_step=5477.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  14%|█▍        | 169/1208 [04:54<30:10,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00155, train/loss_step=0.323, global_step=5477.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  14%|█▍        | 169/1208 [04:54<30:10,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000718, train/loss_step=0.204, global_step=5478.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  14%|█▍        | 170/1208 [04:55<30:04,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000718, train/loss_step=0.204, global_step=5478.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  14%|█▍        | 170/1208 [04:55<30:04,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0987, train/loss_vlb_step=0.000326, train/loss_step=0.0987, global_step=5478.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  14%|█▍        | 171/1208 [04:56<29:58,  1.73s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0987, train/loss_vlb_step=0.000326, train/loss_step=0.0987, global_step=5478.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  14%|█▍        | 171/1208 [04:56<29:58,  1.73s/it, loss=0.107, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000591, train/loss_step=0.173, global_step=5478.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  14%|█▍        | 172/1208 [04:59<30:05,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000591, train/loss_step=0.173, global_step=5478.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  14%|█▍        | 172/1208 [04:59<30:05,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000943, train/loss_step=0.238, global_step=5478.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  14%|█▍        | 173/1208 [05:00<29:59,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000943, train/loss_step=0.238, global_step=5478.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  14%|█▍        | 173/1208 [05:00<29:59,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=5479.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  14%|█▍        | 174/1208 [05:01<29:54,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=5479.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  14%|█▍        | 174/1208 [05:01<29:54,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.506, train/loss_vlb_step=0.0102, train/loss_step=0.506, global_step=5479.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  14%|█▍        | 175/1208 [05:02<29:48,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.506, train/loss_vlb_step=0.0102, train/loss_step=0.506, global_step=5479.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  14%|█▍        | 175/1208 [05:02<29:48,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0629, train/loss_vlb_step=0.000217, train/loss_step=0.0629, global_step=5479.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  15%|█▍        | 176/1208 [05:06<29:55,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0629, train/loss_vlb_step=0.000217, train/loss_step=0.0629, global_step=5479.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  15%|█▍        | 176/1208 [05:06<29:55,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.00069, train/loss_step=0.194, global_step=5479.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  15%|█▍        | 177/1208 [05:07<29:49,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.00069, train/loss_step=0.194, global_step=5479.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  15%|█▍        | 177/1208 [05:07<29:49,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.83e-5, train/loss_step=0.0106, global_step=5480.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  15%|█▍        | 178/1208 [05:08<29:43,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.83e-5, train/loss_step=0.0106, global_step=5480.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  15%|█▍        | 178/1208 [05:08<29:43,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=2.86e-5, train/loss_step=0.00572, global_step=5480.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  15%|█▍        | 179/1208 [05:09<29:37,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=2.86e-5, train/loss_step=0.00572, global_step=5480.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  15%|█▍        | 179/1208 [05:09<29:37,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000977, train/loss_step=0.246, global_step=5480.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  15%|█▍        | 180/1208 [05:12<29:42,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000977, train/loss_step=0.246, global_step=5480.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  15%|█▍        | 180/1208 [05:12<29:42,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000461, train/loss_step=0.138, global_step=5480.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  15%|█▍        | 181/1208 [05:13<29:36,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000461, train/loss_step=0.138, global_step=5480.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  15%|█▍        | 181/1208 [05:13<29:36,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.00077, train/loss_step=0.208, global_step=5481.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  15%|█▌        | 182/1208 [05:14<29:30,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.00077, train/loss_step=0.208, global_step=5481.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  15%|█▌        | 182/1208 [05:14<29:30,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0969, train/loss_vlb_step=0.00032, train/loss_step=0.0969, global_step=5481.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  15%|█▌        | 183/1208 [05:15<29:25,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0969, train/loss_vlb_step=0.00032, train/loss_step=0.0969, global_step=5481.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  15%|█▌        | 183/1208 [05:15<29:25,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0713, train/loss_vlb_step=0.000239, train/loss_step=0.0713, global_step=5481.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  15%|█▌        | 184/1208 [05:18<29:29,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0713, train/loss_vlb_step=0.000239, train/loss_step=0.0713, global_step=5481.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  15%|█▌        | 184/1208 [05:18<29:29,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000496, train/loss_step=0.145, global_step=5481.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  15%|█▌        | 185/1208 [05:19<29:24,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000496, train/loss_step=0.145, global_step=5481.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  15%|█▌        | 185/1208 [05:19<29:24,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=5482.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  15%|█▌        | 186/1208 [05:20<29:18,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=5482.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  15%|█▌        | 186/1208 [05:20<29:18,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00899, train/loss_vlb_step=4.12e-5, train/loss_step=0.00899, global_step=5482.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  15%|█▌        | 187/1208 [05:21<29:13,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00899, train/loss_vlb_step=4.12e-5, train/loss_step=0.00899, global_step=5482.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  15%|█▌        | 187/1208 [05:21<29:13,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.000155, train/loss_step=0.0425, global_step=5482.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  16%|█▌        | 188/1208 [05:23<29:17,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.000155, train/loss_step=0.0425, global_step=5482.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  16%|█▌        | 188/1208 [05:23<29:17,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0558, train/loss_vlb_step=0.0002, train/loss_step=0.0558, global_step=5482.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  16%|█▌        | 189/1208 [05:24<29:11,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0558, train/loss_vlb_step=0.0002, train/loss_step=0.0558, global_step=5482.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  16%|█▌        | 189/1208 [05:24<29:12,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0826, train/loss_vlb_step=0.000276, train/loss_step=0.0826, global_step=5483.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  16%|█▌        | 190/1208 [05:25<29:06,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0826, train/loss_vlb_step=0.000276, train/loss_step=0.0826, global_step=5483.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  16%|█▌        | 190/1208 [05:25<29:06,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00418, train/loss_vlb_step=2.27e-5, train/loss_step=0.00418, global_step=5483.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  16%|█▌        | 191/1208 [05:26<29:00,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00418, train/loss_vlb_step=2.27e-5, train/loss_step=0.00418, global_step=5483.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  16%|█▌        | 191/1208 [05:26<29:00,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=1.82e-5, train/loss_step=0.00326, global_step=5483.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  16%|█▌        | 192/1208 [05:29<29:05,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=1.82e-5, train/loss_step=0.00326, global_step=5483.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  16%|█▌        | 192/1208 [05:29<29:05,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.92e-5, train/loss_step=0.0184, global_step=5483.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  16%|█▌        | 193/1208 [05:30<29:00,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.92e-5, train/loss_step=0.0184, global_step=5483.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  16%|█▌        | 193/1208 [05:30<29:00,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000537, train/loss_step=0.163, global_step=5484.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  16%|█▌        | 194/1208 [05:31<28:54,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000537, train/loss_step=0.163, global_step=5484.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  16%|█▌        | 194/1208 [05:31<28:54,  1.71s/it, loss=0.0856, v_num=0, train/loss_simple_step=0.0391, train/loss_vlb_step=0.000139, train/loss_step=0.0391, global_step=5484.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  16%|█▌        | 195/1208 [05:32<28:49,  1.71s/it, loss=0.0856, v_num=0, train/loss_simple_step=0.0391, train/loss_vlb_step=0.000139, train/loss_step=0.0391, global_step=5484.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  16%|█▌        | 195/1208 [05:32<28:49,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.440, train/loss_vlb_step=0.00347, train/loss_step=0.440, global_step=5484.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  16%|█▌        | 196/1208 [05:35<28:53,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.440, train/loss_vlb_step=0.00347, train/loss_step=0.440, global_step=5484.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  16%|█▌        | 196/1208 [05:35<28:53,  1.71s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.00399, train/loss_vlb_step=2.2e-5, train/loss_step=0.00399, global_step=5484.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  16%|█▋        | 197/1208 [05:36<28:48,  1.71s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.00399, train/loss_vlb_step=2.2e-5, train/loss_step=0.00399, global_step=5484.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  16%|█▋        | 197/1208 [05:36<28:48,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.0006, train/loss_step=0.169, global_step=5485.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 18:  16%|█▋        | 198/1208 [05:37<28:43,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.0006, train/loss_step=0.169, global_step=5485.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  16%|█▋        | 198/1208 [05:37<28:43,  1.71s/it, loss=0.11, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000528, train/loss_step=0.157, global_step=5485.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  16%|█▋        | 199/1208 [05:38<28:37,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000528, train/loss_step=0.157, global_step=5485.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  16%|█▋        | 199/1208 [05:38<28:37,  1.70s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000116, train/loss_step=0.0301, global_step=5485.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  17%|█▋        | 200/1208 [05:41<28:42,  1.71s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000116, train/loss_step=0.0301, global_step=5485.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  17%|█▋        | 200/1208 [05:41<28:42,  1.71s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.35e-5, train/loss_step=0.0142, global_step=5485.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  17%|█▋        | 201/1208 [05:42<28:36,  1.71s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.35e-5, train/loss_step=0.0142, global_step=5485.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  17%|█▋        | 201/1208 [05:42<28:36,  1.71s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.00916, train/loss_vlb_step=4.1e-5, train/loss_step=0.00916, global_step=5486.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  17%|█▋        | 202/1208 [05:43<28:31,  1.70s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.00916, train/loss_vlb_step=4.1e-5, train/loss_step=0.00916, global_step=5486.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  17%|█▋        | 202/1208 [05:43<28:31,  1.70s/it, loss=0.0799, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.0001, train/loss_step=0.0248, global_step=5486.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  17%|█▋        | 203/1208 [05:44<28:26,  1.70s/it, loss=0.0799, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.0001, train/loss_step=0.0248, global_step=5486.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  17%|█▋        | 203/1208 [05:44<28:26,  1.70s/it, loss=0.0766, v_num=0, train/loss_simple_step=0.00681, train/loss_vlb_step=3.47e-5, train/loss_step=0.00681, global_step=5486.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  17%|█▋        | 204/1208 [05:47<28:30,  1.70s/it, loss=0.0766, v_num=0, train/loss_simple_step=0.00681, train/loss_vlb_step=3.47e-5, train/loss_step=0.00681, global_step=5486.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  17%|█▋        | 204/1208 [05:47<28:30,  1.70s/it, loss=0.0772, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000539, train/loss_step=0.156, global_step=5486.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  17%|█▋        | 205/1208 [05:48<28:25,  1.70s/it, loss=0.0772, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000539, train/loss_step=0.156, global_step=5486.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  17%|█▋        | 205/1208 [05:48<28:25,  1.70s/it, loss=0.0765, v_num=0, train/loss_simple_step=0.0997, train/loss_vlb_step=0.000331, train/loss_step=0.0997, global_step=5487.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  17%|█▋        | 206/1208 [05:49<28:20,  1.70s/it, loss=0.0765, v_num=0, train/loss_simple_step=0.0997, train/loss_vlb_step=0.000331, train/loss_step=0.0997, global_step=5487.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  17%|█▋        | 206/1208 [05:49<28:20,  1.70s/it, loss=0.0809, v_num=0, train/loss_simple_step=0.0986, train/loss_vlb_step=0.000325, train/loss_step=0.0986, global_step=5487.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  17%|█▋        | 207/1208 [05:50<28:15,  1.69s/it, loss=0.0809, v_num=0, train/loss_simple_step=0.0986, train/loss_vlb_step=0.000325, train/loss_step=0.0986, global_step=5487.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  17%|█▋        | 207/1208 [05:50<28:15,  1.69s/it, loss=0.0898, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000857, train/loss_step=0.219, global_step=5487.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  17%|█▋        | 208/1208 [05:53<28:19,  1.70s/it, loss=0.0898, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000857, train/loss_step=0.219, global_step=5487.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  17%|█▋        | 208/1208 [05:53<28:19,  1.70s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.21e-5, train/loss_step=0.00209, global_step=5487.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  17%|█▋        | 209/1208 [05:54<28:14,  1.70s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.21e-5, train/loss_step=0.00209, global_step=5487.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  17%|█▋        | 209/1208 [05:54<28:14,  1.70s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000396, train/loss_step=0.120, global_step=5488.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  17%|█▋        | 210/1208 [05:55<28:09,  1.69s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000396, train/loss_step=0.120, global_step=5488.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  17%|█▋        | 210/1208 [05:55<28:09,  1.69s/it, loss=0.1, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.00103, train/loss_step=0.228, global_step=5488.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  17%|█▋        | 211/1208 [05:56<28:04,  1.69s/it, loss=0.1, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.00103, train/loss_step=0.228, global_step=5488.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  17%|█▋        | 211/1208 [05:56<28:04,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.503, train/loss_vlb_step=0.00494, train/loss_step=0.503, global_step=5488.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  18%|█▊        | 212/1208 [05:59<28:08,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.503, train/loss_vlb_step=0.00494, train/loss_step=0.503, global_step=5488.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  18%|█▊        | 212/1208 [05:59<28:08,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000141, train/loss_step=0.0392, global_step=5488.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  18%|█▊        | 213/1208 [06:00<28:03,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000141, train/loss_step=0.0392, global_step=5488.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  18%|█▊        | 213/1208 [06:00<28:03,  1.69s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.06e-5, train/loss_step=0.0138, global_step=5489.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  18%|█▊        | 214/1208 [06:01<27:58,  1.69s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.06e-5, train/loss_step=0.0138, global_step=5489.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  18%|█▊        | 214/1208 [06:01<27:58,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000508, train/loss_step=0.153, global_step=5489.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  18%|█▊        | 215/1208 [06:02<27:54,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000508, train/loss_step=0.153, global_step=5489.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  18%|█▊        | 215/1208 [06:02<27:54,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000677, train/loss_step=0.198, global_step=5489.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  18%|█▊        | 216/1208 [06:05<27:58,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000677, train/loss_step=0.198, global_step=5489.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  18%|█▊        | 216/1208 [06:05<27:58,  1.69s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000142, train/loss_step=0.0402, global_step=5489.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  18%|█▊        | 217/1208 [06:06<27:53,  1.69s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000142, train/loss_step=0.0402, global_step=5489.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  18%|█▊        | 217/1208 [06:06<27:53,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00122, train/loss_step=0.282, global_step=5490.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  18%|█▊        | 218/1208 [06:07<27:48,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00122, train/loss_step=0.282, global_step=5490.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  18%|█▊        | 218/1208 [06:07<27:48,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=5490.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  18%|█▊        | 219/1208 [06:08<27:43,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=5490.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  18%|█▊        | 219/1208 [06:08<27:43,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.465, train/loss_vlb_step=0.00423, train/loss_step=0.465, global_step=5490.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  18%|█▊        | 220/1208 [06:11<27:47,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.465, train/loss_vlb_step=0.00423, train/loss_step=0.465, global_step=5490.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  18%|█▊        | 220/1208 [06:11<27:47,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.41e-5, train/loss_step=0.0119, global_step=5490.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  18%|█▊        | 221/1208 [06:12<27:42,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.41e-5, train/loss_step=0.0119, global_step=5490.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  18%|█▊        | 221/1208 [06:12<27:42,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000383, train/loss_step=0.117, global_step=5491.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  18%|█▊        | 222/1208 [06:13<27:38,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000383, train/loss_step=0.117, global_step=5491.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  18%|█▊        | 222/1208 [06:13<27:38,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.73e-5, train/loss_step=0.0232, global_step=5491.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  18%|█▊        | 223/1208 [06:14<27:33,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.73e-5, train/loss_step=0.0232, global_step=5491.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  18%|█▊        | 223/1208 [06:14<27:33,  1.68s/it, loss=0.167, v_num=0, train/loss_simple_step=0.468, train/loss_vlb_step=0.00518, train/loss_step=0.468, global_step=5491.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  19%|█▊        | 224/1208 [06:17<27:37,  1.68s/it, loss=0.167, v_num=0, train/loss_simple_step=0.468, train/loss_vlb_step=0.00518, train/loss_step=0.468, global_step=5491.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  19%|█▊        | 224/1208 [06:17<27:37,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000338, train/loss_step=0.102, global_step=5491.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  19%|█▊        | 225/1208 [06:18<27:32,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000338, train/loss_step=0.102, global_step=5491.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  19%|█▊        | 225/1208 [06:18<27:32,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0897, train/loss_vlb_step=0.000297, train/loss_step=0.0897, global_step=5492.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  19%|█▊        | 226/1208 [06:19<27:27,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0897, train/loss_vlb_step=0.000297, train/loss_step=0.0897, global_step=5492.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  19%|█▊        | 226/1208 [06:19<27:27,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000115, train/loss_step=0.0301, global_step=5492.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  19%|█▉        | 227/1208 [06:20<27:23,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000115, train/loss_step=0.0301, global_step=5492.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  19%|█▉        | 227/1208 [06:20<27:23,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000113, train/loss_step=0.0298, global_step=5492.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  19%|█▉        | 228/1208 [06:23<27:26,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000113, train/loss_step=0.0298, global_step=5492.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  19%|█▉        | 228/1208 [06:23<27:26,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0623, train/loss_vlb_step=0.000215, train/loss_step=0.0623, global_step=5492.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  19%|█▉        | 229/1208 [06:24<27:22,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0623, train/loss_vlb_step=0.000215, train/loss_step=0.0623, global_step=5492.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  19%|█▉        | 229/1208 [06:24<27:22,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000414, train/loss_step=0.126, global_step=5493.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  19%|█▉        | 230/1208 [06:25<27:17,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000414, train/loss_step=0.126, global_step=5493.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  19%|█▉        | 230/1208 [06:25<27:17,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000415, train/loss_step=0.123, global_step=5493.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  19%|█▉        | 231/1208 [06:26<27:13,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000415, train/loss_step=0.123, global_step=5493.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  19%|█▉        | 231/1208 [06:26<27:13,  1.67s/it, loss=0.135, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000799, train/loss_step=0.215, global_step=5493.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  19%|█▉        | 232/1208 [06:29<27:16,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000799, train/loss_step=0.215, global_step=5493.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  19%|█▉        | 232/1208 [06:29<27:16,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0585, train/loss_vlb_step=0.000202, train/loss_step=0.0585, global_step=5493.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  19%|█▉        | 233/1208 [06:30<27:12,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0585, train/loss_vlb_step=0.000202, train/loss_step=0.0585, global_step=5493.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  19%|█▉        | 233/1208 [06:30<27:12,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.603, train/loss_vlb_step=0.00961, train/loss_step=0.603, global_step=5494.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  19%|█▉        | 234/1208 [06:31<27:08,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.603, train/loss_vlb_step=0.00961, train/loss_step=0.603, global_step=5494.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  19%|█▉        | 234/1208 [06:31<27:08,  1.67s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0492, train/loss_vlb_step=0.000178, train/loss_step=0.0492, global_step=5494.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  19%|█▉        | 235/1208 [06:32<27:03,  1.67s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0492, train/loss_vlb_step=0.000178, train/loss_step=0.0492, global_step=5494.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  19%|█▉        | 235/1208 [06:32<27:03,  1.67s/it, loss=0.171, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.0048, train/loss_step=0.412, global_step=5494.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  20%|█▉        | 236/1208 [06:34<27:06,  1.67s/it, loss=0.171, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.0048, train/loss_step=0.412, global_step=5494.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  20%|█▉        | 236/1208 [06:34<27:06,  1.67s/it, loss=0.176, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.00047, train/loss_step=0.141, global_step=5494.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  20%|█▉        | 237/1208 [06:36<27:02,  1.67s/it, loss=0.176, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.00047, train/loss_step=0.141, global_step=5494.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  20%|█▉        | 237/1208 [06:36<27:02,  1.67s/it, loss=0.183, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00334, train/loss_step=0.420, global_step=5495.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  20%|█▉        | 238/1208 [06:37<26:58,  1.67s/it, loss=0.183, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00334, train/loss_step=0.420, global_step=5495.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  20%|█▉        | 238/1208 [06:37<26:58,  1.67s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.53e-5, train/loss_step=0.0155, global_step=5495.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  20%|█▉        | 239/1208 [06:38<26:53,  1.67s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.53e-5, train/loss_step=0.0155, global_step=5495.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  20%|█▉        | 239/1208 [06:38<26:53,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00317, train/loss_vlb_step=1.75e-5, train/loss_step=0.00317, global_step=5495.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  20%|█▉        | 240/1208 [06:40<26:57,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00317, train/loss_vlb_step=1.75e-5, train/loss_step=0.00317, global_step=5495.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  20%|█▉        | 240/1208 [06:40<26:57,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=1.1e-5, train/loss_step=0.00183, global_step=5495.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  20%|█▉        | 241/1208 [06:41<26:52,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=1.1e-5, train/loss_step=0.00183, global_step=5495.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  20%|█▉        | 241/1208 [06:41<26:52,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00433, train/loss_step=0.435, global_step=5496.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  20%|██        | 242/1208 [06:42<26:48,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00433, train/loss_step=0.435, global_step=5496.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  20%|██        | 242/1208 [06:42<26:48,  1.67s/it, loss=0.189, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00245, train/loss_step=0.402, global_step=5496.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  20%|██        | 243/1208 [06:43<26:44,  1.66s/it, loss=0.189, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00245, train/loss_step=0.402, global_step=5496.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  20%|██        | 243/1208 [06:43<26:44,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.00012, train/loss_step=0.0308, global_step=5496.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  20%|██        | 244/1208 [06:46<26:47,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.00012, train/loss_step=0.0308, global_step=5496.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  20%|██        | 244/1208 [06:46<26:47,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.24e-5, train/loss_step=0.00209, global_step=5496.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  20%|██        | 245/1208 [06:47<26:43,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.24e-5, train/loss_step=0.00209, global_step=5496.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  20%|██        | 245/1208 [06:47<26:43,  1.66s/it, loss=0.161, v_num=0, train/loss_simple_step=0.069, train/loss_vlb_step=0.000234, train/loss_step=0.069, global_step=5497.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  20%|██        | 246/1208 [06:48<26:38,  1.66s/it, loss=0.161, v_num=0, train/loss_simple_step=0.069, train/loss_vlb_step=0.000234, train/loss_step=0.069, global_step=5497.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  20%|██        | 246/1208 [06:48<26:38,  1.66s/it, loss=0.166, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=5497.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  20%|██        | 247/1208 [06:49<26:34,  1.66s/it, loss=0.166, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=5497.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  20%|██        | 247/1208 [06:49<26:34,  1.66s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.4e-5, train/loss_step=0.0175, global_step=5497.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  21%|██        | 248/1208 [06:52<26:37,  1.66s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.4e-5, train/loss_step=0.0175, global_step=5497.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  21%|██        | 248/1208 [06:52<26:37,  1.66s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000124, train/loss_step=0.0328, global_step=5497.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  21%|██        | 249/1208 [06:53<26:33,  1.66s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000124, train/loss_step=0.0328, global_step=5497.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  21%|██        | 249/1208 [06:53<26:33,  1.66s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0653, train/loss_vlb_step=0.000222, train/loss_step=0.0653, global_step=5498.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  21%|██        | 250/1208 [06:54<26:29,  1.66s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0653, train/loss_vlb_step=0.000222, train/loss_step=0.0653, global_step=5498.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  21%|██        | 250/1208 [06:54<26:29,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.56e-5, train/loss_step=0.00267, global_step=5498.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  21%|██        | 251/1208 [06:55<26:25,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.56e-5, train/loss_step=0.00267, global_step=5498.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  21%|██        | 251/1208 [06:55<26:25,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=6e-5, train/loss_step=0.0131, global_step=5498.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 18:  21%|██        | 252/1208 [06:58<26:28,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=6e-5, train/loss_step=0.0131, global_step=5498.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  21%|██        | 252/1208 [06:58<26:28,  1.66s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.45e-5, train/loss_step=0.00249, global_step=5498.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  21%|██        | 253/1208 [06:59<26:24,  1.66s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.45e-5, train/loss_step=0.00249, global_step=5498.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  21%|██        | 253/1208 [06:59<26:24,  1.66s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=9.1e-6, train/loss_step=0.00149, global_step=5499.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  21%|██        | 254/1208 [07:00<26:19,  1.66s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=9.1e-6, train/loss_step=0.00149, global_step=5499.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  21%|██        | 254/1208 [07:00<26:19,  1.66s/it, loss=0.112, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000183, train/loss_step=0.050, global_step=5499.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  21%|██        | 255/1208 [07:01<26:15,  1.65s/it, loss=0.112, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000183, train/loss_step=0.050, global_step=5499.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  21%|██        | 255/1208 [07:01<26:15,  1.65s/it, loss=0.0912, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.82e-5, train/loss_step=0.00335, global_step=5499.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  21%|██        | 256/1208 [07:04<26:18,  1.66s/it, loss=0.0912, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.82e-5, train/loss_step=0.00335, global_step=5499.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  21%|██        | 256/1208 [07:04<26:18,  1.66s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=9.83e-5, train/loss_step=0.025, global_step=5499.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  21%|██▏       | 257/1208 [07:05<26:14,  1.66s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=9.83e-5, train/loss_step=0.025, global_step=5499.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  21%|██▏       | 257/1208 [07:05<26:14,  1.66s/it, loss=0.0647, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=2.6e-5, train/loss_step=0.00481, global_step=5500.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  21%|██▏       | 258/1208 [07:06<26:10,  1.65s/it, loss=0.0647, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=2.6e-5, train/loss_step=0.00481, global_step=5500.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  21%|██▏       | 258/1208 [07:06<26:10,  1.65s/it, loss=0.0687, v_num=0, train/loss_simple_step=0.0963, train/loss_vlb_step=0.000319, train/loss_step=0.0963, global_step=5500.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  21%|██▏       | 259/1208 [07:07<26:06,  1.65s/it, loss=0.0687, v_num=0, train/loss_simple_step=0.0963, train/loss_vlb_step=0.000319, train/loss_step=0.0963, global_step=5500.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  21%|██▏       | 259/1208 [07:07<26:06,  1.65s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.422, train/loss_vlb_step=0.00264, train/loss_step=0.422, global_step=5500.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  22%|██▏       | 260/1208 [07:10<26:09,  1.66s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.422, train/loss_vlb_step=0.00264, train/loss_step=0.422, global_step=5500.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  22%|██▏       | 260/1208 [07:10<26:09,  1.66s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000511, train/loss_step=0.151, global_step=5500.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  22%|██▏       | 261/1208 [07:11<26:05,  1.65s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000511, train/loss_step=0.151, global_step=5500.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  22%|██▏       | 261/1208 [07:11<26:05,  1.65s/it, loss=0.0758, v_num=0, train/loss_simple_step=0.00951, train/loss_vlb_step=4.39e-5, train/loss_step=0.00951, global_step=5501.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  22%|██▏       | 262/1208 [07:12<26:01,  1.65s/it, loss=0.0758, v_num=0, train/loss_simple_step=0.00951, train/loss_vlb_step=4.39e-5, train/loss_step=0.00951, global_step=5501.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  22%|██▏       | 262/1208 [07:12<26:01,  1.65s/it, loss=0.0711, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00141, train/loss_step=0.308, global_step=5501.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  22%|██▏       | 263/1208 [07:13<25:57,  1.65s/it, loss=0.0711, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00141, train/loss_step=0.308, global_step=5501.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  22%|██▏       | 263/1208 [07:13<25:57,  1.65s/it, loss=0.0841, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00118, train/loss_step=0.290, global_step=5501.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  22%|██▏       | 264/1208 [07:16<26:00,  1.65s/it, loss=0.0841, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00118, train/loss_step=0.290, global_step=5501.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  22%|██▏       | 264/1208 [07:16<26:00,  1.65s/it, loss=0.0873, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.000224, train/loss_step=0.0665, global_step=5501.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  22%|██▏       | 265/1208 [07:17<25:56,  1.65s/it, loss=0.0873, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.000224, train/loss_step=0.0665, global_step=5501.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  22%|██▏       | 265/1208 [07:17<25:56,  1.65s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=8.15e-5, train/loss_step=0.0188, global_step=5502.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  22%|██▏       | 266/1208 [07:18<25:52,  1.65s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=8.15e-5, train/loss_step=0.0188, global_step=5502.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  22%|██▏       | 266/1208 [07:18<25:52,  1.65s/it, loss=0.0792, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.73e-5, train/loss_step=0.00312, global_step=5502.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  22%|██▏       | 267/1208 [07:19<25:48,  1.65s/it, loss=0.0792, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.73e-5, train/loss_step=0.00312, global_step=5502.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  22%|██▏       | 267/1208 [07:19<25:48,  1.65s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000456, train/loss_step=0.136, global_step=5502.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  22%|██▏       | 268/1208 [07:22<25:51,  1.65s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000456, train/loss_step=0.136, global_step=5502.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  22%|██▏       | 268/1208 [07:22<25:51,  1.65s/it, loss=0.0959, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00105, train/loss_step=0.248, global_step=5502.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  22%|██▏       | 269/1208 [07:23<25:47,  1.65s/it, loss=0.0959, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00105, train/loss_step=0.248, global_step=5502.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  22%|██▏       | 269/1208 [07:23<25:47,  1.65s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.00033, train/loss_step=0.100, global_step=5503.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  22%|██▏       | 270/1208 [07:24<25:43,  1.65s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.00033, train/loss_step=0.100, global_step=5503.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  22%|██▏       | 270/1208 [07:24<25:43,  1.65s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.44e-5, train/loss_step=0.00249, global_step=5503.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  22%|██▏       | 271/1208 [07:25<25:39,  1.64s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.44e-5, train/loss_step=0.00249, global_step=5503.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  22%|██▏       | 271/1208 [07:25<25:39,  1.64s/it, loss=0.103, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000413, train/loss_step=0.125, global_step=5503.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  23%|██▎       | 272/1208 [07:28<25:42,  1.65s/it, loss=0.103, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000413, train/loss_step=0.125, global_step=5503.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  23%|██▎       | 272/1208 [07:28<25:42,  1.65s/it, loss=0.118, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00146, train/loss_step=0.293, global_step=5503.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  23%|██▎       | 273/1208 [07:29<25:38,  1.65s/it, loss=0.118, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00146, train/loss_step=0.293, global_step=5503.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  23%|██▎       | 273/1208 [07:29<25:38,  1.65s/it, loss=0.131, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00136, train/loss_step=0.271, global_step=5504.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  23%|██▎       | 274/1208 [07:30<25:34,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00136, train/loss_step=0.271, global_step=5504.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  23%|██▎       | 274/1208 [07:30<25:34,  1.64s/it, loss=0.134, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000383, train/loss_step=0.115, global_step=5504.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  23%|██▎       | 275/1208 [07:31<25:31,  1.64s/it, loss=0.134, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000383, train/loss_step=0.115, global_step=5504.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  23%|██▎       | 275/1208 [07:31<25:31,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000347, train/loss_step=0.105, global_step=5504.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  23%|██▎       | 276/1208 [07:34<25:33,  1.65s/it, loss=0.14, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000347, train/loss_step=0.105, global_step=5504.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  23%|██▎       | 276/1208 [07:34<25:33,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00568, train/loss_vlb_step=2.98e-5, train/loss_step=0.00568, global_step=5504.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  23%|██▎       | 277/1208 [07:35<25:29,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00568, train/loss_vlb_step=2.98e-5, train/loss_step=0.00568, global_step=5504.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  23%|██▎       | 277/1208 [07:35<25:29,  1.64s/it, loss=0.146, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000501, train/loss_step=0.147, global_step=5505.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  23%|██▎       | 278/1208 [07:36<25:25,  1.64s/it, loss=0.146, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000501, train/loss_step=0.147, global_step=5505.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  23%|██▎       | 278/1208 [07:36<25:25,  1.64s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0971, train/loss_vlb_step=0.000319, train/loss_step=0.0971, global_step=5505.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  23%|██▎       | 279/1208 [07:37<25:22,  1.64s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0971, train/loss_vlb_step=0.000319, train/loss_step=0.0971, global_step=5505.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  23%|██▎       | 279/1208 [07:37<25:22,  1.64s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9e-5, train/loss_step=0.0224, global_step=5505.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  23%|██▎       | 280/1208 [07:40<25:24,  1.64s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9e-5, train/loss_step=0.0224, global_step=5505.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  23%|██▎       | 280/1208 [07:40<25:24,  1.64s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00908, train/loss_vlb_step=4.18e-5, train/loss_step=0.00908, global_step=5505.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  23%|██▎       | 281/1208 [07:41<25:20,  1.64s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00908, train/loss_vlb_step=4.18e-5, train/loss_step=0.00908, global_step=5505.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  23%|██▎       | 281/1208 [07:41<25:20,  1.64s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.78e-5, train/loss_step=0.0237, global_step=5506.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  23%|██▎       | 282/1208 [07:42<25:17,  1.64s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.78e-5, train/loss_step=0.0237, global_step=5506.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  23%|██▎       | 282/1208 [07:42<25:17,  1.64s/it, loss=0.109, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=5506.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  23%|██▎       | 283/1208 [07:43<25:13,  1.64s/it, loss=0.109, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=5506.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  23%|██▎       | 283/1208 [07:43<25:13,  1.64s/it, loss=0.107, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000925, train/loss_step=0.239, global_step=5506.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  24%|██▎       | 284/1208 [07:45<25:15,  1.64s/it, loss=0.107, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000925, train/loss_step=0.239, global_step=5506.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  24%|██▎       | 284/1208 [07:45<25:15,  1.64s/it, loss=0.117, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00125, train/loss_step=0.285, global_step=5506.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  24%|██▎       | 285/1208 [07:46<25:12,  1.64s/it, loss=0.117, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00125, train/loss_step=0.285, global_step=5506.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  24%|██▎       | 285/1208 [07:46<25:12,  1.64s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00377, train/loss_vlb_step=2.11e-5, train/loss_step=0.00377, global_step=5507.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  24%|██▎       | 286/1208 [07:47<25:08,  1.64s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00377, train/loss_vlb_step=2.11e-5, train/loss_step=0.00377, global_step=5507.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  24%|██▎       | 286/1208 [07:47<25:08,  1.64s/it, loss=0.151, v_num=0, train/loss_simple_step=0.689, train/loss_vlb_step=0.0325, train/loss_step=0.689, global_step=5507.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 18:  24%|██▍       | 287/1208 [07:48<25:04,  1.63s/it, loss=0.151, v_num=0, train/loss_simple_step=0.689, train/loss_vlb_step=0.0325, train/loss_step=0.689, global_step=5507.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  24%|██▍       | 287/1208 [07:48<25:04,  1.63s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0873, train/loss_vlb_step=0.000287, train/loss_step=0.0873, global_step=5507.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  24%|██▍       | 288/1208 [07:51<25:07,  1.64s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0873, train/loss_vlb_step=0.000287, train/loss_step=0.0873, global_step=5507.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  24%|██▍       | 288/1208 [07:51<25:07,  1.64s/it, loss=0.143, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000488, train/loss_step=0.145, global_step=5507.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  24%|██▍       | 289/1208 [07:52<25:03,  1.64s/it, loss=0.143, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000488, train/loss_step=0.145, global_step=5507.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  24%|██▍       | 289/1208 [07:52<25:03,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.18e-5, train/loss_step=0.0174, global_step=5508.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  24%|██▍       | 290/1208 [07:53<25:00,  1.63s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.18e-5, train/loss_step=0.0174, global_step=5508.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  24%|██▍       | 290/1208 [07:53<25:00,  1.63s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.85e-5, train/loss_step=0.0104, global_step=5508.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  24%|██▍       | 291/1208 [07:54<24:56,  1.63s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.85e-5, train/loss_step=0.0104, global_step=5508.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  24%|██▍       | 291/1208 [07:54<24:56,  1.63s/it, loss=0.142, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000576, train/loss_step=0.167, global_step=5508.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  24%|██▍       | 292/1208 [07:57<24:58,  1.64s/it, loss=0.142, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000576, train/loss_step=0.167, global_step=5508.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  24%|██▍       | 292/1208 [07:57<24:58,  1.64s/it, loss=0.146, v_num=0, train/loss_simple_step=0.387, train/loss_vlb_step=0.00385, train/loss_step=0.387, global_step=5508.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  24%|██▍       | 293/1208 [07:58<24:55,  1.63s/it, loss=0.146, v_num=0, train/loss_simple_step=0.387, train/loss_vlb_step=0.00385, train/loss_step=0.387, global_step=5508.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  24%|██▍       | 293/1208 [07:58<24:55,  1.63s/it, loss=0.142, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000617, train/loss_step=0.180, global_step=5509.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  24%|██▍       | 294/1208 [07:59<24:51,  1.63s/it, loss=0.142, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000617, train/loss_step=0.180, global_step=5509.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  24%|██▍       | 294/1208 [07:59<24:51,  1.63s/it, loss=0.144, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000498, train/loss_step=0.147, global_step=5509.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  24%|██▍       | 295/1208 [08:00<24:48,  1.63s/it, loss=0.144, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000498, train/loss_step=0.147, global_step=5509.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  24%|██▍       | 295/1208 [08:00<24:48,  1.63s/it, loss=0.148, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000666, train/loss_step=0.185, global_step=5509.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  25%|██▍       | 296/1208 [08:03<24:50,  1.63s/it, loss=0.148, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000666, train/loss_step=0.185, global_step=5509.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  25%|██▍       | 296/1208 [08:03<24:50,  1.63s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.74e-5, train/loss_step=0.0128, global_step=5509.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  25%|██▍       | 297/1208 [08:04<24:46,  1.63s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.74e-5, train/loss_step=0.0128, global_step=5509.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  25%|██▍       | 297/1208 [08:04<24:46,  1.63s/it, loss=0.15, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000708, train/loss_step=0.191, global_step=5510.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  25%|██▍       | 298/1208 [08:05<24:43,  1.63s/it, loss=0.15, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000708, train/loss_step=0.191, global_step=5510.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  25%|██▍       | 298/1208 [08:05<24:43,  1.63s/it, loss=0.151, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=5510.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  25%|██▍       | 299/1208 [08:06<24:39,  1.63s/it, loss=0.151, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=5510.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  25%|██▍       | 299/1208 [08:06<24:39,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0384, train/loss_vlb_step=0.000141, train/loss_step=0.0384, global_step=5510.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  25%|██▍       | 300/1208 [08:09<24:41,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0384, train/loss_vlb_step=0.000141, train/loss_step=0.0384, global_step=5510.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  25%|██▍       | 300/1208 [08:09<24:41,  1.63s/it, loss=0.16, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000548, train/loss_step=0.162, global_step=5510.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.86it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.84it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:25,  1.85it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.84it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.85it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.85it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.84it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.85it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.85it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.85it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.84it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.85it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.84it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.84it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.84it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.84it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.84it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.84it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.84it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.84it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.84it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.84it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.84it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.84it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.84it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.84it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:18,  1.84it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:18,  1.84it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.85it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.84it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.85it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.84it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.85it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.84it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.84it/s][ADDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.85it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.84it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.84it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.85it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.84it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.85it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.84it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.84it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.83it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.83it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.83it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.83it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.84it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.83it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.83it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.83it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.83it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.83it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.83it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.83it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.84it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.83it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.83it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.83it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.84it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.83it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.83it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.83it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.82it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.83it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.84it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.78it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.83it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.83it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.83it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.84it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.84it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.84it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.84it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.84it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.83it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.84it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.84it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.83it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.84it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.84it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.84it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.84it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.84it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.84it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]Epoch 18:  25%|██▍       | 301/1208 [08:39<26:04,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000548, train/loss_step=0.162, global_step=5510.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  25%|██▍       | 301/1208 [08:39<26:04,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.00019, train/loss_step=0.0527, global_step=5511.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  25%|██▌       | 302/1208 [08:40<26:00,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.00019, train/loss_step=0.0527, global_step=5511.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  25%|██▌       | 302/1208 [08:40<26:00,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.23e-5, train/loss_step=0.020, global_step=5511.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  25%|██▌       | 303/1208 [08:41<25:56,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.23e-5, train/loss_step=0.020, global_step=5511.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  25%|██▌       | 303/1208 [08:41<25:56,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=6.04e-5, train/loss_step=0.0132, global_step=5511.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  25%|██▌       | 304/1208 [08:44<25:58,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=6.04e-5, train/loss_step=0.0132, global_step=5511.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  25%|██▌       | 304/1208 [08:44<25:58,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000431, train/loss_step=0.130, global_step=5511.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  25%|██▌       | 305/1208 [08:45<25:54,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000431, train/loss_step=0.130, global_step=5511.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  25%|██▌       | 305/1208 [08:45<25:54,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.56e-5, train/loss_step=0.018, global_step=5512.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  25%|██▌       | 306/1208 [08:46<25:51,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.56e-5, train/loss_step=0.018, global_step=5512.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  25%|██▌       | 306/1208 [08:46<25:51,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.736, train/loss_vlb_step=0.0627, train/loss_step=0.736, global_step=5512.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  25%|██▌       | 307/1208 [08:47<25:47,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.736, train/loss_vlb_step=0.0627, train/loss_step=0.736, global_step=5512.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  25%|██▌       | 307/1208 [08:47<25:47,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00998, train/loss_vlb_step=4.63e-5, train/loss_step=0.00998, global_step=5512.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  25%|██▌       | 308/1208 [08:50<25:49,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00998, train/loss_vlb_step=4.63e-5, train/loss_step=0.00998, global_step=5512.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  25%|██▌       | 308/1208 [08:50<25:49,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.046, train/loss_vlb_step=0.000162, train/loss_step=0.046, global_step=5512.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  26%|██▌       | 309/1208 [08:51<25:45,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.046, train/loss_vlb_step=0.000162, train/loss_step=0.046, global_step=5512.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  26%|██▌       | 309/1208 [08:51<25:45,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0606, train/loss_vlb_step=0.00021, train/loss_step=0.0606, global_step=5513.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  26%|██▌       | 310/1208 [08:52<25:41,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0606, train/loss_vlb_step=0.00021, train/loss_step=0.0606, global_step=5513.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  26%|██▌       | 310/1208 [08:52<25:41,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.02e-5, train/loss_step=0.0116, global_step=5513.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  26%|██▌       | 311/1208 [08:53<25:37,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.02e-5, train/loss_step=0.0116, global_step=5513.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  26%|██▌       | 311/1208 [08:53<25:37,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=9.96e-5, train/loss_step=0.0255, global_step=5513.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  26%|██▌       | 312/1208 [08:56<25:39,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=9.96e-5, train/loss_step=0.0255, global_step=5513.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  26%|██▌       | 312/1208 [08:56<25:39,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=5513.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  26%|██▌       | 313/1208 [08:57<25:35,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=5513.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  26%|██▌       | 313/1208 [08:57<25:35,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00548, train/loss_vlb_step=2.88e-5, train/loss_step=0.00548, global_step=5514.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  26%|██▌       | 314/1208 [08:58<25:31,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00548, train/loss_vlb_step=2.88e-5, train/loss_step=0.00548, global_step=5514.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  26%|██▌       | 314/1208 [08:58<25:31,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=5514.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  26%|██▌       | 315/1208 [08:59<25:28,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=5514.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  26%|██▌       | 315/1208 [08:59<25:28,  1.71s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.00618, train/loss_vlb_step=3.22e-5, train/loss_step=0.00618, global_step=5514.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  26%|██▌       | 316/1208 [09:02<25:30,  1.72s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.00618, train/loss_vlb_step=3.22e-5, train/loss_step=0.00618, global_step=5514.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  26%|██▌       | 316/1208 [09:02<25:30,  1.72s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.73e-5, train/loss_step=0.0157, global_step=5514.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  26%|██▌       | 317/1208 [09:03<25:27,  1.71s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.73e-5, train/loss_step=0.0157, global_step=5514.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  26%|██▌       | 317/1208 [09:03<25:27,  1.71s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.0455, train/loss_vlb_step=0.000158, train/loss_step=0.0455, global_step=5515.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  26%|██▋       | 318/1208 [09:04<25:23,  1.71s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.0455, train/loss_vlb_step=0.000158, train/loss_step=0.0455, global_step=5515.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  26%|██▋       | 318/1208 [09:04<25:23,  1.71s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00124, train/loss_step=0.263, global_step=5515.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  26%|██▋       | 319/1208 [09:05<25:20,  1.71s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00124, train/loss_step=0.263, global_step=5515.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  26%|██▋       | 319/1208 [09:05<25:20,  1.71s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000148, train/loss_step=0.0407, global_step=5515.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  26%|██▋       | 320/1208 [09:08<25:22,  1.71s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000148, train/loss_step=0.0407, global_step=5515.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  26%|██▋       | 320/1208 [09:08<25:22,  1.71s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.0969, train/loss_vlb_step=0.000319, train/loss_step=0.0969, global_step=5515.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  27%|██▋       | 321/1208 [09:09<25:19,  1.71s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.0969, train/loss_vlb_step=0.000319, train/loss_step=0.0969, global_step=5515.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  27%|██▋       | 321/1208 [09:09<25:19,  1.71s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000368, train/loss_step=0.111, global_step=5516.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  27%|██▋       | 322/1208 [09:10<25:15,  1.71s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000368, train/loss_step=0.111, global_step=5516.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  27%|██▋       | 322/1208 [09:10<25:15,  1.71s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.05e-5, train/loss_step=0.00175, global_step=5516.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  27%|██▋       | 323/1208 [09:11<25:11,  1.71s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.05e-5, train/loss_step=0.00175, global_step=5516.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  27%|██▋       | 323/1208 [09:11<25:11,  1.71s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=9.5e-5, train/loss_step=0.0223, global_step=5516.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  27%|██▋       | 324/1208 [09:15<25:14,  1.71s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=9.5e-5, train/loss_step=0.0223, global_step=5516.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  27%|██▋       | 324/1208 [09:15<25:14,  1.71s/it, loss=0.0863, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=1.34e-5, train/loss_step=0.00232, global_step=5516.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  27%|██▋       | 325/1208 [09:16<25:11,  1.71s/it, loss=0.0863, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=1.34e-5, train/loss_step=0.00232, global_step=5516.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  27%|██▋       | 325/1208 [09:16<25:11,  1.71s/it, loss=0.0855, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.67e-5, train/loss_step=0.00296, global_step=5517.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  27%|██▋       | 326/1208 [09:17<25:07,  1.71s/it, loss=0.0855, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.67e-5, train/loss_step=0.00296, global_step=5517.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  27%|██▋       | 326/1208 [09:17<25:07,  1.71s/it, loss=0.0493, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.28e-5, train/loss_step=0.0121, global_step=5517.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  27%|██▋       | 327/1208 [09:18<25:03,  1.71s/it, loss=0.0493, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.28e-5, train/loss_step=0.0121, global_step=5517.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  27%|██▋       | 327/1208 [09:18<25:03,  1.71s/it, loss=0.0571, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000557, train/loss_step=0.166, global_step=5517.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  27%|██▋       | 328/1208 [09:21<25:06,  1.71s/it, loss=0.0571, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000557, train/loss_step=0.166, global_step=5517.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  27%|██▋       | 328/1208 [09:21<25:06,  1.71s/it, loss=0.0563, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000111, train/loss_step=0.0281, global_step=5517.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  27%|██▋       | 329/1208 [09:22<25:02,  1.71s/it, loss=0.0563, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000111, train/loss_step=0.0281, global_step=5517.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  27%|██▋       | 329/1208 [09:22<25:02,  1.71s/it, loss=0.0606, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000487, train/loss_step=0.147, global_step=5518.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  27%|██▋       | 330/1208 [09:23<24:59,  1.71s/it, loss=0.0606, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000487, train/loss_step=0.147, global_step=5518.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  27%|██▋       | 330/1208 [09:23<24:59,  1.71s/it, loss=0.0749, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00139, train/loss_step=0.297, global_step=5518.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  27%|██▋       | 331/1208 [09:24<24:55,  1.71s/it, loss=0.0749, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00139, train/loss_step=0.297, global_step=5518.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  27%|██▋       | 331/1208 [09:24<24:55,  1.71s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000577, train/loss_step=0.169, global_step=5518.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  27%|██▋       | 332/1208 [09:27<24:58,  1.71s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000577, train/loss_step=0.169, global_step=5518.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  27%|██▋       | 332/1208 [09:27<24:58,  1.71s/it, loss=0.0886, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000989, train/loss_step=0.235, global_step=5518.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  28%|██▊       | 333/1208 [09:28<24:54,  1.71s/it, loss=0.0886, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000989, train/loss_step=0.235, global_step=5518.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  28%|██▊       | 333/1208 [09:28<24:54,  1.71s/it, loss=0.0895, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.69e-5, train/loss_step=0.0242, global_step=5519.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  28%|██▊       | 334/1208 [09:29<24:51,  1.71s/it, loss=0.0895, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.69e-5, train/loss_step=0.0242, global_step=5519.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  28%|██▊       | 334/1208 [09:29<24:51,  1.71s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000914, train/loss_step=0.237, global_step=5519.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  28%|██▊       | 335/1208 [09:30<24:47,  1.70s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000914, train/loss_step=0.237, global_step=5519.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  28%|██▊       | 335/1208 [09:30<24:47,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000474, train/loss_step=0.138, global_step=5519.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  28%|██▊       | 336/1208 [09:34<24:50,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000474, train/loss_step=0.138, global_step=5519.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  28%|██▊       | 336/1208 [09:34<24:50,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0946, train/loss_vlb_step=0.000314, train/loss_step=0.0946, global_step=5519.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  28%|██▊       | 337/1208 [09:35<24:46,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0946, train/loss_vlb_step=0.000314, train/loss_step=0.0946, global_step=5519.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  28%|██▊       | 337/1208 [09:35<24:46,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.64e-5, train/loss_step=0.0151, global_step=5520.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  28%|██▊       | 338/1208 [09:36<24:43,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.64e-5, train/loss_step=0.0151, global_step=5520.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  28%|██▊       | 338/1208 [09:36<24:43,  1.71s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=5520.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  28%|██▊       | 339/1208 [09:37<24:40,  1.70s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=5520.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  28%|██▊       | 339/1208 [09:37<24:40,  1.70s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.00927, train/loss_vlb_step=4.19e-5, train/loss_step=0.00927, global_step=5520.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  28%|██▊       | 340/1208 [09:40<24:42,  1.71s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.00927, train/loss_vlb_step=4.19e-5, train/loss_step=0.00927, global_step=5520.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  28%|██▊       | 340/1208 [09:40<24:42,  1.71s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000497, train/loss_step=0.147, global_step=5520.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  28%|██▊       | 341/1208 [09:41<24:38,  1.71s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000497, train/loss_step=0.147, global_step=5520.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  28%|██▊       | 341/1208 [09:41<24:38,  1.71s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=2.5e-5, train/loss_step=0.00464, global_step=5521.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  28%|██▊       | 342/1208 [09:42<24:35,  1.70s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=2.5e-5, train/loss_step=0.00464, global_step=5521.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  28%|██▊       | 342/1208 [09:42<24:35,  1.70s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.43e-5, train/loss_step=0.00246, global_step=5521.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  28%|██▊       | 343/1208 [09:43<24:32,  1.70s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.43e-5, train/loss_step=0.00246, global_step=5521.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  28%|██▊       | 343/1208 [09:43<24:32,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000851, train/loss_step=0.222, global_step=5521.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  28%|██▊       | 344/1208 [09:46<24:34,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000851, train/loss_step=0.222, global_step=5521.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  28%|██▊       | 344/1208 [09:46<24:34,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00287, train/loss_vlb_step=1.65e-5, train/loss_step=0.00287, global_step=5521.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  29%|██▊       | 345/1208 [09:48<24:30,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00287, train/loss_vlb_step=1.65e-5, train/loss_step=0.00287, global_step=5521.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  29%|██▊       | 345/1208 [09:48<24:31,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=5522.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  29%|██▊       | 346/1208 [09:49<24:27,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=5522.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  29%|██▊       | 346/1208 [09:49<24:27,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000297, train/loss_step=0.0901, global_step=5522.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  29%|██▊       | 347/1208 [09:50<24:24,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000297, train/loss_step=0.0901, global_step=5522.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  29%|██▊       | 347/1208 [09:50<24:24,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000775, train/loss_step=0.203, global_step=5522.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  29%|██▉       | 348/1208 [09:53<24:26,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000775, train/loss_step=0.203, global_step=5522.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  29%|██▉       | 348/1208 [09:53<24:26,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000139, train/loss_step=0.0367, global_step=5522.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  29%|██▉       | 349/1208 [09:54<24:22,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000139, train/loss_step=0.0367, global_step=5522.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  29%|██▉       | 349/1208 [09:54<24:22,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00667, train/loss_vlb_step=3.18e-5, train/loss_step=0.00667, global_step=5523.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  29%|██▉       | 350/1208 [09:55<24:19,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00667, train/loss_vlb_step=3.18e-5, train/loss_step=0.00667, global_step=5523.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  29%|██▉       | 350/1208 [09:55<24:19,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000938, train/loss_step=0.242, global_step=5523.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  29%|██▉       | 351/1208 [09:56<24:16,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000938, train/loss_step=0.242, global_step=5523.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  29%|██▉       | 351/1208 [09:56<24:16,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0778, train/loss_vlb_step=0.000257, train/loss_step=0.0778, global_step=5523.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  29%|██▉       | 352/1208 [09:59<24:18,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0778, train/loss_vlb_step=0.000257, train/loss_step=0.0778, global_step=5523.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  29%|██▉       | 352/1208 [09:59<24:18,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.521, train/loss_vlb_step=0.0081, train/loss_step=0.521, global_step=5523.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  29%|██▉       | 353/1208 [10:00<24:14,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.521, train/loss_vlb_step=0.0081, train/loss_step=0.521, global_step=5523.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  29%|██▉       | 353/1208 [10:00<24:14,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000522, train/loss_step=0.151, global_step=5524.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  29%|██▉       | 354/1208 [10:01<24:11,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000522, train/loss_step=0.151, global_step=5524.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  29%|██▉       | 354/1208 [10:01<24:11,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0323, train/loss_vlb_step=0.000117, train/loss_step=0.0323, global_step=5524.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  29%|██▉       | 355/1208 [10:02<24:08,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0323, train/loss_vlb_step=0.000117, train/loss_step=0.0323, global_step=5524.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  29%|██▉       | 355/1208 [10:02<24:08,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.65e-5, train/loss_step=0.0156, global_step=5524.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  29%|██▉       | 356/1208 [10:05<24:09,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.65e-5, train/loss_step=0.0156, global_step=5524.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  29%|██▉       | 356/1208 [10:05<24:09,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00995, train/loss_vlb_step=4.7e-5, train/loss_step=0.00995, global_step=5524.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  30%|██▉       | 357/1208 [10:06<24:06,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00995, train/loss_vlb_step=4.7e-5, train/loss_step=0.00995, global_step=5524.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  30%|██▉       | 357/1208 [10:06<24:06,  1.70s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00682, train/loss_vlb_step=3.48e-5, train/loss_step=0.00682, global_step=5525.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  30%|██▉       | 358/1208 [10:07<24:02,  1.70s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00682, train/loss_vlb_step=3.48e-5, train/loss_step=0.00682, global_step=5525.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  30%|██▉       | 358/1208 [10:07<24:02,  1.70s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.0572, train/loss_vlb_step=0.000196, train/loss_step=0.0572, global_step=5525.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  30%|██▉       | 359/1208 [10:08<23:59,  1.70s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.0572, train/loss_vlb_step=0.000196, train/loss_step=0.0572, global_step=5525.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  30%|██▉       | 359/1208 [10:08<23:59,  1.70s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.00523, train/loss_vlb_step=2.58e-5, train/loss_step=0.00523, global_step=5525.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  30%|██▉       | 360/1208 [10:12<24:01,  1.70s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.00523, train/loss_vlb_step=2.58e-5, train/loss_step=0.00523, global_step=5525.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  30%|██▉       | 360/1208 [10:12<24:01,  1.70s/it, loss=0.094, v_num=0, train/loss_simple_step=0.0845, train/loss_vlb_step=0.00028, train/loss_step=0.0845, global_step=5525.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  30%|██▉       | 361/1208 [10:13<23:58,  1.70s/it, loss=0.094, v_num=0, train/loss_simple_step=0.0845, train/loss_vlb_step=0.00028, train/loss_step=0.0845, global_step=5525.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  30%|██▉       | 361/1208 [10:13<23:58,  1.70s/it, loss=0.107, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00112, train/loss_step=0.254, global_step=5526.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  30%|██▉       | 362/1208 [10:14<23:55,  1.70s/it, loss=0.107, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00112, train/loss_step=0.254, global_step=5526.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  30%|██▉       | 362/1208 [10:14<23:55,  1.70s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00843, train/loss_vlb_step=3.91e-5, train/loss_step=0.00843, global_step=5526.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  30%|███       | 363/1208 [10:15<23:51,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00843, train/loss_vlb_step=3.91e-5, train/loss_step=0.00843, global_step=5526.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  30%|███       | 363/1208 [10:15<23:51,  1.69s/it, loss=0.096, v_num=0, train/loss_simple_step=0.00562, train/loss_vlb_step=3.03e-5, train/loss_step=0.00562, global_step=5526.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  30%|███       | 364/1208 [10:18<23:53,  1.70s/it, loss=0.096, v_num=0, train/loss_simple_step=0.00562, train/loss_vlb_step=3.03e-5, train/loss_step=0.00562, global_step=5526.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  30%|███       | 364/1208 [10:18<23:53,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00126, train/loss_step=0.271, global_step=5526.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  30%|███       | 365/1208 [10:19<23:50,  1.70s/it, loss=0.109, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00126, train/loss_step=0.271, global_step=5526.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  30%|███       | 365/1208 [10:19<23:50,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.0012, train/loss_step=0.256, global_step=5527.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  30%|███       | 366/1208 [10:20<23:47,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.0012, train/loss_step=0.256, global_step=5527.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  30%|███       | 366/1208 [10:20<23:47,  1.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000164, train/loss_step=0.0457, global_step=5527.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  30%|███       | 367/1208 [10:21<23:44,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000164, train/loss_step=0.0457, global_step=5527.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  30%|███       | 367/1208 [10:21<23:44,  1.69s/it, loss=0.149, v_num=0, train/loss_simple_step=0.898, train/loss_vlb_step=0.452, train/loss_step=0.898, global_step=5527.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 18:  30%|███       | 368/1208 [10:24<23:46,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.898, train/loss_vlb_step=0.452, train/loss_step=0.898, global_step=5527.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  30%|███       | 368/1208 [10:24<23:46,  1.70s/it, loss=0.175, v_num=0, train/loss_simple_step=0.541, train/loss_vlb_step=0.00862, train/loss_step=0.541, global_step=5527.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  31%|███       | 369/1208 [10:25<23:42,  1.70s/it, loss=0.175, v_num=0, train/loss_simple_step=0.541, train/loss_vlb_step=0.00862, train/loss_step=0.541, global_step=5527.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  31%|███       | 369/1208 [10:25<23:42,  1.70s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.43e-5, train/loss_step=0.0208, global_step=5528.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  31%|███       | 370/1208 [10:26<23:39,  1.69s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.43e-5, train/loss_step=0.0208, global_step=5528.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  31%|███       | 370/1208 [10:26<23:39,  1.69s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00978, train/loss_vlb_step=4.53e-5, train/loss_step=0.00978, global_step=5528.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  31%|███       | 371/1208 [10:27<23:36,  1.69s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00978, train/loss_vlb_step=4.53e-5, train/loss_step=0.00978, global_step=5528.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  31%|███       | 371/1208 [10:27<23:36,  1.69s/it, loss=0.175, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00149, train/loss_step=0.299, global_step=5528.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  31%|███       | 372/1208 [10:31<23:38,  1.70s/it, loss=0.175, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00149, train/loss_step=0.299, global_step=5528.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  31%|███       | 372/1208 [10:31<23:38,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00161, train/loss_step=0.294, global_step=5528.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  31%|███       | 373/1208 [10:32<23:35,  1.69s/it, loss=0.163, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00161, train/loss_step=0.294, global_step=5528.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  31%|███       | 373/1208 [10:32<23:35,  1.69s/it, loss=0.162, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000441, train/loss_step=0.133, global_step=5529.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  31%|███       | 374/1208 [10:33<23:32,  1.69s/it, loss=0.162, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000441, train/loss_step=0.133, global_step=5529.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  31%|███       | 374/1208 [10:33<23:32,  1.69s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.000121, train/loss_step=0.0326, global_step=5529.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  31%|███       | 375/1208 [10:34<23:28,  1.69s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.000121, train/loss_step=0.0326, global_step=5529.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  31%|███       | 375/1208 [10:34<23:28,  1.69s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000188, train/loss_step=0.0545, global_step=5529.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  31%|███       | 376/1208 [10:37<23:30,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000188, train/loss_step=0.0545, global_step=5529.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  31%|███       | 376/1208 [10:37<23:30,  1.70s/it, loss=0.176, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000992, train/loss_step=0.246, global_step=5529.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  31%|███       | 377/1208 [10:38<23:27,  1.69s/it, loss=0.176, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000992, train/loss_step=0.246, global_step=5529.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  31%|███       | 377/1208 [10:38<23:27,  1.69s/it, loss=0.192, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00165, train/loss_step=0.314, global_step=5530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  31%|███▏      | 378/1208 [10:39<23:24,  1.69s/it, loss=0.192, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00165, train/loss_step=0.314, global_step=5530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  31%|███▏      | 378/1208 [10:39<23:24,  1.69s/it, loss=0.21, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00308, train/loss_step=0.425, global_step=5530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  31%|███▏      | 379/1208 [10:40<23:21,  1.69s/it, loss=0.21, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00308, train/loss_step=0.425, global_step=5530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  31%|███▏      | 379/1208 [10:40<23:21,  1.69s/it, loss=0.224, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00128, train/loss_step=0.278, global_step=5530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  31%|███▏      | 380/1208 [10:43<23:23,  1.69s/it, loss=0.224, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00128, train/loss_step=0.278, global_step=5530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  31%|███▏      | 380/1208 [10:43<23:23,  1.69s/it, loss=0.238, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00301, train/loss_step=0.375, global_step=5530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  32%|███▏      | 381/1208 [10:44<23:19,  1.69s/it, loss=0.238, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00301, train/loss_step=0.375, global_step=5530.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  32%|███▏      | 381/1208 [10:44<23:19,  1.69s/it, loss=0.226, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=1.08e-5, train/loss_step=0.00181, global_step=5531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  32%|███▏      | 382/1208 [10:46<23:16,  1.69s/it, loss=0.226, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=1.08e-5, train/loss_step=0.00181, global_step=5531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  32%|███▏      | 382/1208 [10:46<23:16,  1.69s/it, loss=0.23, v_num=0, train/loss_simple_step=0.0879, train/loss_vlb_step=0.00029, train/loss_step=0.0879, global_step=5531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  32%|███▏      | 383/1208 [10:47<23:13,  1.69s/it, loss=0.23, v_num=0, train/loss_simple_step=0.0879, train/loss_vlb_step=0.00029, train/loss_step=0.0879, global_step=5531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  32%|███▏      | 383/1208 [10:47<23:13,  1.69s/it, loss=0.234, v_num=0, train/loss_simple_step=0.0856, train/loss_vlb_step=0.000283, train/loss_step=0.0856, global_step=5531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  32%|███▏      | 384/1208 [10:50<23:15,  1.69s/it, loss=0.234, v_num=0, train/loss_simple_step=0.0856, train/loss_vlb_step=0.000283, train/loss_step=0.0856, global_step=5531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  32%|███▏      | 384/1208 [10:50<23:15,  1.69s/it, loss=0.221, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.09e-5, train/loss_step=0.0229, global_step=5531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  32%|███▏      | 385/1208 [10:51<23:12,  1.69s/it, loss=0.221, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.09e-5, train/loss_step=0.0229, global_step=5531.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  32%|███▏      | 385/1208 [10:51<23:12,  1.69s/it, loss=0.217, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000638, train/loss_step=0.181, global_step=5532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  32%|███▏      | 386/1208 [10:52<23:09,  1.69s/it, loss=0.217, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000638, train/loss_step=0.181, global_step=5532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  32%|███▏      | 386/1208 [10:52<23:09,  1.69s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.000114, train/loss_step=0.0316, global_step=5532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  32%|███▏      | 387/1208 [10:53<23:06,  1.69s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.000114, train/loss_step=0.0316, global_step=5532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  32%|███▏      | 387/1208 [10:53<23:06,  1.69s/it, loss=0.182, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000755, train/loss_step=0.207, global_step=5532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  32%|███▏      | 388/1208 [10:56<23:07,  1.69s/it, loss=0.182, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000755, train/loss_step=0.207, global_step=5532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  32%|███▏      | 388/1208 [10:56<23:07,  1.69s/it, loss=0.163, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000552, train/loss_step=0.161, global_step=5532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  32%|███▏      | 389/1208 [10:57<23:04,  1.69s/it, loss=0.163, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000552, train/loss_step=0.161, global_step=5532.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  32%|███▏      | 389/1208 [10:57<23:04,  1.69s/it, loss=0.163, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.02e-5, train/loss_step=0.017, global_step=5533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  32%|███▏      | 390/1208 [10:58<23:01,  1.69s/it, loss=0.163, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.02e-5, train/loss_step=0.017, global_step=5533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  32%|███▏      | 390/1208 [10:58<23:01,  1.69s/it, loss=0.175, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00105, train/loss_step=0.255, global_step=5533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  32%|███▏      | 391/1208 [10:59<22:58,  1.69s/it, loss=0.175, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00105, train/loss_step=0.255, global_step=5533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  32%|███▏      | 391/1208 [10:59<22:58,  1.69s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00621, train/loss_vlb_step=3.04e-5, train/loss_step=0.00621, global_step=5533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  32%|███▏      | 392/1208 [11:03<23:00,  1.69s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00621, train/loss_vlb_step=3.04e-5, train/loss_step=0.00621, global_step=5533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  32%|███▏      | 392/1208 [11:03<23:00,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0764, train/loss_vlb_step=0.000251, train/loss_step=0.0764, global_step=5533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  33%|███▎      | 393/1208 [11:04<22:57,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0764, train/loss_vlb_step=0.000251, train/loss_step=0.0764, global_step=5533.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  33%|███▎      | 393/1208 [11:04<22:57,  1.69s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000176, train/loss_step=0.0478, global_step=5534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  33%|███▎      | 394/1208 [11:05<22:54,  1.69s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000176, train/loss_step=0.0478, global_step=5534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  33%|███▎      | 394/1208 [11:05<22:54,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0746, train/loss_vlb_step=0.000256, train/loss_step=0.0746, global_step=5534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  33%|███▎      | 395/1208 [11:06<22:51,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0746, train/loss_vlb_step=0.000256, train/loss_step=0.0746, global_step=5534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  33%|███▎      | 395/1208 [11:06<22:51,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.71e-5, train/loss_step=0.0156, global_step=5534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  33%|███▎      | 396/1208 [11:09<22:52,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.71e-5, train/loss_step=0.0156, global_step=5534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  33%|███▎      | 396/1208 [11:09<22:52,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00516, train/loss_vlb_step=2.68e-5, train/loss_step=0.00516, global_step=5534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  33%|███▎      | 397/1208 [11:10<22:49,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00516, train/loss_vlb_step=2.68e-5, train/loss_step=0.00516, global_step=5534.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  33%|███▎      | 397/1208 [11:10<22:49,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.89e-5, train/loss_step=0.00335, global_step=5535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  33%|███▎      | 398/1208 [11:11<22:46,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.89e-5, train/loss_step=0.00335, global_step=5535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  33%|███▎      | 398/1208 [11:11<22:46,  1.69s/it, loss=0.099, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.000164, train/loss_step=0.0468, global_step=5535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  33%|███▎      | 399/1208 [11:12<22:43,  1.69s/it, loss=0.099, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.000164, train/loss_step=0.0468, global_step=5535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  33%|███▎      | 399/1208 [11:12<22:43,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00347, train/loss_step=0.409, global_step=5535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  33%|███▎      | 400/1208 [11:15<22:45,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00347, train/loss_step=0.409, global_step=5535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  33%|███▎      | 400/1208 [11:15<22:45,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.0036, train/loss_step=0.391, global_step=5535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  33%|███▎      | 401/1208 [11:16<22:42,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.0036, train/loss_step=0.391, global_step=5535.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  33%|███▎      | 401/1208 [11:16<22:42,  1.69s/it, loss=0.109, v_num=0, train/loss_simple_step=0.059, train/loss_vlb_step=0.000201, train/loss_step=0.059, global_step=5536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  33%|███▎      | 402/1208 [11:17<22:39,  1.69s/it, loss=0.109, v_num=0, train/loss_simple_step=0.059, train/loss_vlb_step=0.000201, train/loss_step=0.059, global_step=5536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  33%|███▎      | 402/1208 [11:17<22:39,  1.69s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00399, train/loss_vlb_step=2.16e-5, train/loss_step=0.00399, global_step=5536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  33%|███▎      | 403/1208 [11:18<22:36,  1.68s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00399, train/loss_vlb_step=2.16e-5, train/loss_step=0.00399, global_step=5536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  33%|███▎      | 403/1208 [11:18<22:36,  1.68s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00645, train/loss_vlb_step=3.16e-5, train/loss_step=0.00645, global_step=5536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  33%|███▎      | 404/1208 [11:22<22:37,  1.69s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00645, train/loss_vlb_step=3.16e-5, train/loss_step=0.00645, global_step=5536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  33%|███▎      | 404/1208 [11:22<22:37,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00118, train/loss_step=0.269, global_step=5536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  34%|███▎      | 405/1208 [11:23<22:34,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00118, train/loss_step=0.269, global_step=5536.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  34%|███▎      | 405/1208 [11:23<22:34,  1.69s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00515, train/loss_vlb_step=2.66e-5, train/loss_step=0.00515, global_step=5537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  34%|███▎      | 406/1208 [11:24<22:31,  1.69s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00515, train/loss_vlb_step=2.66e-5, train/loss_step=0.00515, global_step=5537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  34%|███▎      | 406/1208 [11:24<22:31,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.784, train/loss_vlb_step=0.395, train/loss_step=0.784, global_step=5537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]      Epoch 18:  34%|███▎      | 407/1208 [11:25<22:28,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.784, train/loss_vlb_step=0.395, train/loss_step=0.784, global_step=5537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  34%|███▎      | 407/1208 [11:25<22:28,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000161, train/loss_step=0.0443, global_step=5537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  34%|███▍      | 408/1208 [11:28<22:30,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000161, train/loss_step=0.0443, global_step=5537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  34%|███▍      | 408/1208 [11:28<22:30,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.05e-5, train/loss_step=0.0227, global_step=5537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  34%|███▍      | 409/1208 [11:29<22:27,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.05e-5, train/loss_step=0.0227, global_step=5537.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  34%|███▍      | 409/1208 [11:29<22:27,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000129, train/loss_step=0.0358, global_step=5538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  34%|███▍      | 410/1208 [11:30<22:24,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000129, train/loss_step=0.0358, global_step=5538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  34%|███▍      | 410/1208 [11:30<22:24,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.49e-5, train/loss_step=0.00254, global_step=5538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  34%|███▍      | 411/1208 [11:31<22:21,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.49e-5, train/loss_step=0.00254, global_step=5538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  34%|███▍      | 411/1208 [11:31<22:21,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00442, train/loss_vlb_step=2.34e-5, train/loss_step=0.00442, global_step=5538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  34%|███▍      | 412/1208 [11:34<22:22,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00442, train/loss_vlb_step=2.34e-5, train/loss_step=0.00442, global_step=5538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  34%|███▍      | 412/1208 [11:34<22:22,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000897, train/loss_step=0.229, global_step=5538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  34%|███▍      | 413/1208 [11:36<22:19,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000897, train/loss_step=0.229, global_step=5538.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  34%|███▍      | 413/1208 [11:36<22:19,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=5539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  34%|███▍      | 414/1208 [11:37<22:16,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=5539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  34%|███▍      | 414/1208 [11:37<22:16,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000159, train/loss_step=0.0449, global_step=5539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  34%|███▍      | 415/1208 [11:38<22:14,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000159, train/loss_step=0.0449, global_step=5539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  34%|███▍      | 415/1208 [11:38<22:14,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000744, train/loss_step=0.208, global_step=5539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  34%|███▍      | 416/1208 [11:41<22:15,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000744, train/loss_step=0.208, global_step=5539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  34%|███▍      | 416/1208 [11:41<22:15,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000139, train/loss_step=0.0387, global_step=5539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  35%|███▍      | 417/1208 [11:42<22:12,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000139, train/loss_step=0.0387, global_step=5539.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  35%|███▍      | 417/1208 [11:42<22:12,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000247, train/loss_step=0.0741, global_step=5540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  35%|███▍      | 418/1208 [11:43<22:09,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000247, train/loss_step=0.0741, global_step=5540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  35%|███▍      | 418/1208 [11:43<22:09,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0447, train/loss_vlb_step=0.000162, train/loss_step=0.0447, global_step=5540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  35%|███▍      | 419/1208 [11:44<22:06,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0447, train/loss_vlb_step=0.000162, train/loss_step=0.0447, global_step=5540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  35%|███▍      | 419/1208 [11:44<22:06,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=1.35e-5, train/loss_step=0.00231, global_step=5540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  35%|███▍      | 420/1208 [11:47<22:07,  1.69s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=1.35e-5, train/loss_step=0.00231, global_step=5540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  35%|███▍      | 420/1208 [11:47<22:07,  1.69s/it, loss=0.111, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000969, train/loss_step=0.231, global_step=5540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  35%|███▍      | 421/1208 [11:48<22:04,  1.68s/it, loss=0.111, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000969, train/loss_step=0.231, global_step=5540.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  35%|███▍      | 421/1208 [11:48<22:04,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=0.000101, train/loss_step=0.0257, global_step=5541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  35%|███▍      | 422/1208 [11:49<22:02,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=0.000101, train/loss_step=0.0257, global_step=5541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  35%|███▍      | 422/1208 [11:49<22:02,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.24e-5, train/loss_step=0.00209, global_step=5541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  35%|███▌      | 423/1208 [11:50<21:59,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.24e-5, train/loss_step=0.00209, global_step=5541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  35%|███▌      | 423/1208 [11:50<21:59,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.69e-5, train/loss_step=0.00305, global_step=5541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  35%|███▌      | 424/1208 [11:54<22:00,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.69e-5, train/loss_step=0.00305, global_step=5541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  35%|███▌      | 424/1208 [11:54<22:00,  1.68s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.00934, train/loss_vlb_step=4.55e-5, train/loss_step=0.00934, global_step=5541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  35%|███▌      | 425/1208 [11:55<21:57,  1.68s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.00934, train/loss_vlb_step=4.55e-5, train/loss_step=0.00934, global_step=5541.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  35%|███▌      | 425/1208 [11:55<21:57,  1.68s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0658, train/loss_vlb_step=0.000224, train/loss_step=0.0658, global_step=5542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  35%|███▌      | 426/1208 [11:56<21:54,  1.68s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0658, train/loss_vlb_step=0.000224, train/loss_step=0.0658, global_step=5542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  35%|███▌      | 426/1208 [11:56<21:54,  1.68s/it, loss=0.0874, v_num=0, train/loss_simple_step=0.558, train/loss_vlb_step=0.0142, train/loss_step=0.558, global_step=5542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  35%|███▌      | 427/1208 [11:57<21:51,  1.68s/it, loss=0.0874, v_num=0, train/loss_simple_step=0.558, train/loss_vlb_step=0.0142, train/loss_step=0.558, global_step=5542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  35%|███▌      | 427/1208 [11:57<21:51,  1.68s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.0011, train/loss_step=0.246, global_step=5542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  35%|███▌      | 428/1208 [12:00<21:53,  1.68s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.0011, train/loss_step=0.246, global_step=5542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  35%|███▌      | 428/1208 [12:00<21:53,  1.68s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=9.25e-5, train/loss_step=0.0214, global_step=5542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  36%|███▌      | 429/1208 [12:01<21:50,  1.68s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=9.25e-5, train/loss_step=0.0214, global_step=5542.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  36%|███▌      | 429/1208 [12:01<21:50,  1.68s/it, loss=0.097, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000107, train/loss_step=0.0273, global_step=5543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  36%|███▌      | 430/1208 [12:02<21:47,  1.68s/it, loss=0.097, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000107, train/loss_step=0.0273, global_step=5543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  36%|███▌      | 430/1208 [12:02<21:47,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.490, train/loss_vlb_step=0.00612, train/loss_step=0.490, global_step=5543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  36%|███▌      | 431/1208 [12:03<21:44,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.490, train/loss_vlb_step=0.00612, train/loss_step=0.490, global_step=5543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  36%|███▌      | 431/1208 [12:03<21:44,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=5543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  36%|███▌      | 432/1208 [12:06<21:45,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=5543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  36%|███▌      | 432/1208 [12:06<21:45,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000774, train/loss_step=0.203, global_step=5543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  36%|███▌      | 433/1208 [12:07<21:42,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000774, train/loss_step=0.203, global_step=5543.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  36%|███▌      | 433/1208 [12:07<21:42,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0452, train/loss_vlb_step=0.000163, train/loss_step=0.0452, global_step=5544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  36%|███▌      | 434/1208 [12:08<21:40,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0452, train/loss_vlb_step=0.000163, train/loss_step=0.0452, global_step=5544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  36%|███▌      | 434/1208 [12:08<21:40,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=5544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  36%|███▌      | 435/1208 [12:09<21:37,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=5544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  36%|███▌      | 435/1208 [12:09<21:37,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00938, train/loss_vlb_step=4.47e-5, train/loss_step=0.00938, global_step=5544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  36%|███▌      | 436/1208 [12:13<21:38,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00938, train/loss_vlb_step=4.47e-5, train/loss_step=0.00938, global_step=5544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  36%|███▌      | 436/1208 [12:13<21:38,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.445, train/loss_vlb_step=0.00347, train/loss_step=0.445, global_step=5544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  36%|███▌      | 437/1208 [12:14<21:35,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.445, train/loss_vlb_step=0.00347, train/loss_step=0.445, global_step=5544.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  36%|███▌      | 437/1208 [12:14<21:35,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.93e-5, train/loss_step=0.0159, global_step=5545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  36%|███▋      | 438/1208 [12:15<21:32,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.93e-5, train/loss_step=0.0159, global_step=5545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  36%|███▋      | 438/1208 [12:15<21:32,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000409, train/loss_step=0.124, global_step=5545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  36%|███▋      | 439/1208 [12:16<21:29,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000409, train/loss_step=0.124, global_step=5545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  36%|███▋      | 439/1208 [12:16<21:29,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000898, train/loss_step=0.228, global_step=5545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  36%|███▋      | 440/1208 [12:19<21:30,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000898, train/loss_step=0.228, global_step=5545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  36%|███▋      | 440/1208 [12:19<21:30,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000652, train/loss_step=0.191, global_step=5545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  37%|███▋      | 441/1208 [12:20<21:28,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000652, train/loss_step=0.191, global_step=5545.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  37%|███▋      | 441/1208 [12:20<21:28,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000103, train/loss_step=0.0265, global_step=5546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  37%|███▋      | 442/1208 [12:21<21:25,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000103, train/loss_step=0.0265, global_step=5546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  37%|███▋      | 442/1208 [12:21<21:25,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00111, train/loss_step=0.249, global_step=5546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  37%|███▋      | 443/1208 [12:22<21:22,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00111, train/loss_step=0.249, global_step=5546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  37%|███▋      | 443/1208 [12:22<21:22,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00777, train/loss_vlb_step=3.74e-5, train/loss_step=0.00777, global_step=5546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  37%|███▋      | 444/1208 [12:25<21:23,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00777, train/loss_vlb_step=3.74e-5, train/loss_step=0.00777, global_step=5546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  37%|███▋      | 444/1208 [12:25<21:23,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0592, train/loss_vlb_step=0.000205, train/loss_step=0.0592, global_step=5546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  37%|███▋      | 445/1208 [12:26<21:20,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0592, train/loss_vlb_step=0.000205, train/loss_step=0.0592, global_step=5546.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  37%|███▋      | 445/1208 [12:26<21:20,  1.68s/it, loss=0.173, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00183, train/loss_step=0.306, global_step=5547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  37%|███▋      | 446/1208 [12:28<21:17,  1.68s/it, loss=0.173, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00183, train/loss_step=0.306, global_step=5547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  37%|███▋      | 446/1208 [12:28<21:17,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000882, train/loss_step=0.225, global_step=5547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  37%|███▋      | 447/1208 [12:29<21:15,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000882, train/loss_step=0.225, global_step=5547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  37%|███▋      | 447/1208 [12:29<21:15,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0607, train/loss_vlb_step=0.00021, train/loss_step=0.0607, global_step=5547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  37%|███▋      | 448/1208 [12:32<21:16,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0607, train/loss_vlb_step=0.00021, train/loss_step=0.0607, global_step=5547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  37%|███▋      | 448/1208 [12:32<21:16,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000421, train/loss_step=0.128, global_step=5547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  37%|███▋      | 449/1208 [12:33<21:13,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000421, train/loss_step=0.128, global_step=5547.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  37%|███▋      | 449/1208 [12:33<21:13,  1.68s/it, loss=0.18, v_num=0, train/loss_simple_step=0.569, train/loss_vlb_step=0.0199, train/loss_step=0.569, global_step=5548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  37%|███▋      | 450/1208 [12:34<21:10,  1.68s/it, loss=0.18, v_num=0, train/loss_simple_step=0.569, train/loss_vlb_step=0.0199, train/loss_step=0.569, global_step=5548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  37%|███▋      | 450/1208 [12:34<21:10,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000115, train/loss_step=0.031, global_step=5548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  37%|███▋      | 451/1208 [12:35<21:07,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000115, train/loss_step=0.031, global_step=5548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  37%|███▋      | 451/1208 [12:35<21:07,  1.67s/it, loss=0.166, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00139, train/loss_step=0.293, global_step=5548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  37%|███▋      | 452/1208 [12:38<21:08,  1.68s/it, loss=0.166, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00139, train/loss_step=0.293, global_step=5548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  37%|███▋      | 452/1208 [12:38<21:08,  1.68s/it, loss=0.181, v_num=0, train/loss_simple_step=0.508, train/loss_vlb_step=0.00537, train/loss_step=0.508, global_step=5548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  38%|███▊      | 453/1208 [12:39<21:06,  1.68s/it, loss=0.181, v_num=0, train/loss_simple_step=0.508, train/loss_vlb_step=0.00537, train/loss_step=0.508, global_step=5548.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  38%|███▊      | 453/1208 [12:39<21:06,  1.68s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0601, train/loss_vlb_step=0.000204, train/loss_step=0.0601, global_step=5549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  38%|███▊      | 454/1208 [12:40<21:03,  1.68s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0601, train/loss_vlb_step=0.000204, train/loss_step=0.0601, global_step=5549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  38%|███▊      | 454/1208 [12:40<21:03,  1.68s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=1.11e-5, train/loss_step=0.00183, global_step=5549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  38%|███▊      | 455/1208 [12:41<21:00,  1.67s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=1.11e-5, train/loss_step=0.00183, global_step=5549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  38%|███▊      | 455/1208 [12:41<21:00,  1.67s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000117, train/loss_step=0.0293, global_step=5549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  38%|███▊      | 456/1208 [12:45<21:01,  1.68s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000117, train/loss_step=0.0293, global_step=5549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  38%|███▊      | 456/1208 [12:45<21:01,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=8.96e-5, train/loss_step=0.0236, global_step=5549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  38%|███▊      | 457/1208 [12:46<20:58,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=8.96e-5, train/loss_step=0.0236, global_step=5549.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  38%|███▊      | 457/1208 [12:46<20:58,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000517, train/loss_step=0.153, global_step=5550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  38%|███▊      | 458/1208 [12:47<20:56,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000517, train/loss_step=0.153, global_step=5550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  38%|███▊      | 458/1208 [12:47<20:56,  1.67s/it, loss=0.173, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00162, train/loss_step=0.307, global_step=5550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  38%|███▊      | 459/1208 [12:48<20:53,  1.67s/it, loss=0.173, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00162, train/loss_step=0.307, global_step=5550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  38%|███▊      | 459/1208 [12:48<20:53,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000124, train/loss_step=0.0333, global_step=5550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  38%|███▊      | 460/1208 [12:51<20:54,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000124, train/loss_step=0.0333, global_step=5550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  38%|███▊      | 460/1208 [12:51<20:54,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00839, train/loss_vlb_step=3.93e-5, train/loss_step=0.00839, global_step=5550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  38%|███▊      | 461/1208 [12:52<20:51,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00839, train/loss_vlb_step=3.93e-5, train/loss_step=0.00839, global_step=5550.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  38%|███▊      | 461/1208 [12:52<20:51,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00117, train/loss_step=0.247, global_step=5551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  38%|███▊      | 462/1208 [12:53<20:48,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00117, train/loss_step=0.247, global_step=5551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  38%|███▊      | 462/1208 [12:53<20:48,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.44e-5, train/loss_step=0.0209, global_step=5551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  38%|███▊      | 463/1208 [12:54<20:46,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.44e-5, train/loss_step=0.0209, global_step=5551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  38%|███▊      | 463/1208 [12:54<20:46,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0078, train/loss_vlb_step=3.65e-5, train/loss_step=0.0078, global_step=5551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  38%|███▊      | 464/1208 [12:57<20:47,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0078, train/loss_vlb_step=3.65e-5, train/loss_step=0.0078, global_step=5551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  38%|███▊      | 464/1208 [12:57<20:47,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000625, train/loss_step=0.183, global_step=5551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  38%|███▊      | 465/1208 [12:58<20:44,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000625, train/loss_step=0.183, global_step=5551.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  38%|███▊      | 465/1208 [12:58<20:44,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0595, train/loss_vlb_step=0.000205, train/loss_step=0.0595, global_step=5552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  39%|███▊      | 466/1208 [12:59<20:41,  1.67s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0595, train/loss_vlb_step=0.000205, train/loss_step=0.0595, global_step=5552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  39%|███▊      | 466/1208 [12:59<20:41,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000424, train/loss_step=0.128, global_step=5552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  39%|███▊      | 467/1208 [13:00<20:39,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000424, train/loss_step=0.128, global_step=5552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  39%|███▊      | 467/1208 [13:00<20:39,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00118, train/loss_step=0.264, global_step=5552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  39%|███▊      | 468/1208 [13:04<20:39,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00118, train/loss_step=0.264, global_step=5552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  39%|███▊      | 468/1208 [13:04<20:39,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=5552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  39%|███▉      | 469/1208 [13:05<20:37,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=5552.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  39%|███▉      | 469/1208 [13:05<20:37,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000456, train/loss_step=0.138, global_step=5553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  39%|███▉      | 470/1208 [13:06<20:34,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000456, train/loss_step=0.138, global_step=5553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  39%|███▉      | 470/1208 [13:06<20:34,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000986, train/loss_step=0.233, global_step=5553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  39%|███▉      | 471/1208 [13:07<20:31,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000986, train/loss_step=0.233, global_step=5553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  39%|███▉      | 471/1208 [13:07<20:31,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000505, train/loss_step=0.143, global_step=5553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  39%|███▉      | 472/1208 [13:10<20:32,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000505, train/loss_step=0.143, global_step=5553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  39%|███▉      | 472/1208 [13:10<20:32,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000671, train/loss_step=0.189, global_step=5553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  39%|███▉      | 473/1208 [13:11<20:30,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000671, train/loss_step=0.189, global_step=5553.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  39%|███▉      | 473/1208 [13:11<20:30,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00465, train/loss_vlb_step=2.51e-5, train/loss_step=0.00465, global_step=5554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  39%|███▉      | 474/1208 [13:12<20:27,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00465, train/loss_vlb_step=2.51e-5, train/loss_step=0.00465, global_step=5554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  39%|███▉      | 474/1208 [13:12<20:27,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.57e-5, train/loss_step=0.00282, global_step=5554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  39%|███▉      | 475/1208 [13:13<20:24,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.57e-5, train/loss_step=0.00282, global_step=5554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  39%|███▉      | 475/1208 [13:13<20:24,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0856, train/loss_vlb_step=0.000282, train/loss_step=0.0856, global_step=5554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  39%|███▉      | 476/1208 [13:16<20:25,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0856, train/loss_vlb_step=0.000282, train/loss_step=0.0856, global_step=5554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  39%|███▉      | 476/1208 [13:16<20:25,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.51e-5, train/loss_step=0.0206, global_step=5554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  39%|███▉      | 477/1208 [13:18<20:22,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.51e-5, train/loss_step=0.0206, global_step=5554.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  39%|███▉      | 477/1208 [13:18<20:22,  1.67s/it, loss=0.123, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00137, train/loss_step=0.283, global_step=5555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  40%|███▉      | 478/1208 [13:19<20:20,  1.67s/it, loss=0.123, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00137, train/loss_step=0.283, global_step=5555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  40%|███▉      | 478/1208 [13:19<20:20,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00107, train/loss_step=0.252, global_step=5555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  40%|███▉      | 479/1208 [13:20<20:17,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00107, train/loss_step=0.252, global_step=5555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  40%|███▉      | 479/1208 [13:20<20:17,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.674, train/loss_vlb_step=0.0434, train/loss_step=0.674, global_step=5555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  40%|███▉      | 480/1208 [13:23<20:18,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.674, train/loss_vlb_step=0.0434, train/loss_step=0.674, global_step=5555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  40%|███▉      | 480/1208 [13:23<20:18,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0786, train/loss_vlb_step=0.000264, train/loss_step=0.0786, global_step=5555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  40%|███▉      | 481/1208 [13:24<20:15,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0786, train/loss_vlb_step=0.000264, train/loss_step=0.0786, global_step=5555.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  40%|███▉      | 481/1208 [13:24<20:15,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.08e-5, train/loss_step=0.0233, global_step=5556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  40%|███▉      | 482/1208 [13:25<20:13,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.08e-5, train/loss_step=0.0233, global_step=5556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  40%|███▉      | 482/1208 [13:25<20:13,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.633, train/loss_vlb_step=0.0101, train/loss_step=0.633, global_step=5556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  40%|███▉      | 483/1208 [13:26<20:10,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.633, train/loss_vlb_step=0.0101, train/loss_step=0.633, global_step=5556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  40%|███▉      | 483/1208 [13:26<20:10,  1.67s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0584, train/loss_vlb_step=0.0002, train/loss_step=0.0584, global_step=5556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  40%|████      | 484/1208 [13:29<20:11,  1.67s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0584, train/loss_vlb_step=0.0002, train/loss_step=0.0584, global_step=5556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  40%|████      | 484/1208 [13:29<20:11,  1.67s/it, loss=0.178, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000629, train/loss_step=0.182, global_step=5556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  40%|████      | 485/1208 [13:30<20:08,  1.67s/it, loss=0.178, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000629, train/loss_step=0.182, global_step=5556.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  40%|████      | 485/1208 [13:30<20:08,  1.67s/it, loss=0.176, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.15e-5, train/loss_step=0.014, global_step=5557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  40%|████      | 486/1208 [13:31<20:06,  1.67s/it, loss=0.176, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.15e-5, train/loss_step=0.014, global_step=5557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  40%|████      | 486/1208 [13:31<20:06,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.65e-5, train/loss_step=0.0102, global_step=5557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  40%|████      | 487/1208 [13:32<20:03,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.65e-5, train/loss_step=0.0102, global_step=5557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  40%|████      | 487/1208 [13:32<20:03,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=5557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  40%|████      | 488/1208 [13:36<20:04,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=5557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  40%|████      | 488/1208 [13:36<20:04,  1.67s/it, loss=0.179, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00383, train/loss_step=0.442, global_step=5557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  40%|████      | 489/1208 [13:37<20:01,  1.67s/it, loss=0.179, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00383, train/loss_step=0.442, global_step=5557.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  40%|████      | 489/1208 [13:37<20:01,  1.67s/it, loss=0.181, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.00066, train/loss_step=0.183, global_step=5558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  41%|████      | 490/1208 [13:38<19:58,  1.67s/it, loss=0.181, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.00066, train/loss_step=0.183, global_step=5558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  41%|████      | 490/1208 [13:38<19:58,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000408, train/loss_step=0.120, global_step=5558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  41%|████      | 491/1208 [13:39<19:56,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000408, train/loss_step=0.120, global_step=5558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  41%|████      | 491/1208 [13:39<19:56,  1.67s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.57e-5, train/loss_step=0.0179, global_step=5558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  41%|████      | 492/1208 [13:42<19:56,  1.67s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.57e-5, train/loss_step=0.0179, global_step=5558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  41%|████      | 492/1208 [13:42<19:56,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=5558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  41%|████      | 493/1208 [13:43<19:54,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=5558.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  41%|████      | 493/1208 [13:43<19:54,  1.67s/it, loss=0.193, v_num=0, train/loss_simple_step=0.571, train/loss_vlb_step=0.0145, train/loss_step=0.571, global_step=5559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  41%|████      | 494/1208 [13:44<19:51,  1.67s/it, loss=0.193, v_num=0, train/loss_simple_step=0.571, train/loss_vlb_step=0.0145, train/loss_step=0.571, global_step=5559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  41%|████      | 494/1208 [13:44<19:51,  1.67s/it, loss=0.202, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000632, train/loss_step=0.172, global_step=5559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  41%|████      | 495/1208 [13:45<19:49,  1.67s/it, loss=0.202, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000632, train/loss_step=0.172, global_step=5559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  41%|████      | 495/1208 [13:45<19:49,  1.67s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00621, train/loss_vlb_step=3.17e-5, train/loss_step=0.00621, global_step=5559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  41%|████      | 496/1208 [13:48<19:49,  1.67s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00621, train/loss_vlb_step=3.17e-5, train/loss_step=0.00621, global_step=5559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  41%|████      | 496/1208 [13:48<19:49,  1.67s/it, loss=0.218, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00543, train/loss_step=0.434, global_step=5559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  41%|████      | 497/1208 [13:49<19:47,  1.67s/it, loss=0.218, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00543, train/loss_step=0.434, global_step=5559.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  41%|████      | 497/1208 [13:49<19:47,  1.67s/it, loss=0.217, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00103, train/loss_step=0.252, global_step=5560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  41%|████      | 498/1208 [13:50<19:44,  1.67s/it, loss=0.217, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00103, train/loss_step=0.252, global_step=5560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  41%|████      | 498/1208 [13:50<19:44,  1.67s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000163, train/loss_step=0.0443, global_step=5560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  41%|████▏     | 499/1208 [13:52<19:42,  1.67s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000163, train/loss_step=0.0443, global_step=5560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  41%|████▏     | 499/1208 [13:52<19:42,  1.67s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.53e-5, train/loss_step=0.00265, global_step=5560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  41%|████▏     | 500/1208 [13:55<19:42,  1.67s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.53e-5, train/loss_step=0.00265, global_step=5560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  41%|████▏     | 500/1208 [13:55<19:42,  1.67s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00494, train/loss_vlb_step=2.57e-5, train/loss_step=0.00494, global_step=5560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  41%|████▏     | 501/1208 [13:56<19:40,  1.67s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00494, train/loss_vlb_step=2.57e-5, train/loss_step=0.00494, global_step=5560.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  41%|████▏     | 501/1208 [13:56<19:40,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.000151, train/loss_step=0.0403, global_step=5561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  42%|████▏     | 502/1208 [13:57<19:37,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.000151, train/loss_step=0.0403, global_step=5561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  42%|████▏     | 502/1208 [13:57<19:37,  1.67s/it, loss=0.171, v_num=0, train/loss_simple_step=0.646, train/loss_vlb_step=0.014, train/loss_step=0.646, global_step=5561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  42%|████▏     | 503/1208 [13:58<19:35,  1.67s/it, loss=0.171, v_num=0, train/loss_simple_step=0.646, train/loss_vlb_step=0.014, train/loss_step=0.646, global_step=5561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  42%|████▏     | 503/1208 [13:58<19:35,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.67e-5, train/loss_step=0.00288, global_step=5561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  42%|████▏     | 504/1208 [14:01<19:35,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.67e-5, train/loss_step=0.00288, global_step=5561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  42%|████▏     | 504/1208 [14:01<19:35,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=5561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  42%|████▏     | 505/1208 [14:02<19:33,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=5561.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  42%|████▏     | 505/1208 [14:02<19:33,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.29e-5, train/loss_step=0.0213, global_step=5562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  42%|████▏     | 506/1208 [14:03<19:30,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.29e-5, train/loss_step=0.0213, global_step=5562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  42%|████▏     | 506/1208 [14:03<19:30,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.32e-5, train/loss_step=0.00222, global_step=5562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  42%|████▏     | 507/1208 [14:04<19:27,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.32e-5, train/loss_step=0.00222, global_step=5562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  42%|████▏     | 507/1208 [14:04<19:27,  1.67s/it, loss=0.171, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000968, train/loss_step=0.230, global_step=5562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  42%|████▏     | 508/1208 [14:08<19:28,  1.67s/it, loss=0.171, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000968, train/loss_step=0.230, global_step=5562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  42%|████▏     | 508/1208 [14:08<19:28,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0518, train/loss_vlb_step=0.000179, train/loss_step=0.0518, global_step=5562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  42%|████▏     | 509/1208 [14:09<19:26,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0518, train/loss_vlb_step=0.000179, train/loss_step=0.0518, global_step=5562.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  42%|████▏     | 509/1208 [14:09<19:26,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00254, train/loss_step=0.313, global_step=5563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  42%|████▏     | 510/1208 [14:10<19:23,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00254, train/loss_step=0.313, global_step=5563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  42%|████▏     | 510/1208 [14:10<19:23,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0477, train/loss_vlb_step=0.000168, train/loss_step=0.0477, global_step=5563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  42%|████▏     | 511/1208 [14:11<19:20,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0477, train/loss_vlb_step=0.000168, train/loss_step=0.0477, global_step=5563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  42%|████▏     | 511/1208 [14:11<19:20,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000666, train/loss_step=0.191, global_step=5563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  42%|████▏     | 512/1208 [14:14<19:21,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000666, train/loss_step=0.191, global_step=5563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  42%|████▏     | 512/1208 [14:14<19:21,  1.67s/it, loss=0.172, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00141, train/loss_step=0.291, global_step=5563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  42%|████▏     | 513/1208 [14:15<19:19,  1.67s/it, loss=0.172, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00141, train/loss_step=0.291, global_step=5563.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  42%|████▏     | 513/1208 [14:15<19:19,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00287, train/loss_step=0.361, global_step=5564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  43%|████▎     | 514/1208 [14:16<19:16,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00287, train/loss_step=0.361, global_step=5564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  43%|████▎     | 514/1208 [14:16<19:16,  1.67s/it, loss=0.159, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000383, train/loss_step=0.117, global_step=5564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  43%|████▎     | 515/1208 [14:17<19:13,  1.67s/it, loss=0.159, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000383, train/loss_step=0.117, global_step=5564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  43%|████▎     | 515/1208 [14:17<19:13,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00148, train/loss_step=0.332, global_step=5564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  43%|████▎     | 516/1208 [14:20<19:14,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00148, train/loss_step=0.332, global_step=5564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  43%|████▎     | 516/1208 [14:20<19:14,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00393, train/loss_vlb_step=2.05e-5, train/loss_step=0.00393, global_step=5564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  43%|████▎     | 517/1208 [14:21<19:11,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00393, train/loss_vlb_step=2.05e-5, train/loss_step=0.00393, global_step=5564.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  43%|████▎     | 517/1208 [14:21<19:11,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.0012, train/loss_step=0.273, global_step=5565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 18:  43%|████▎     | 518/1208 [14:22<19:09,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.0012, train/loss_step=0.273, global_step=5565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  43%|████▎     | 518/1208 [14:22<19:09,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0385, train/loss_vlb_step=0.00014, train/loss_step=0.0385, global_step=5565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  43%|████▎     | 519/1208 [14:23<19:06,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0385, train/loss_vlb_step=0.00014, train/loss_step=0.0385, global_step=5565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  43%|████▎     | 519/1208 [14:23<19:06,  1.66s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0621, train/loss_vlb_step=0.000213, train/loss_step=0.0621, global_step=5565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  43%|████▎     | 520/1208 [14:27<19:07,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0621, train/loss_vlb_step=0.000213, train/loss_step=0.0621, global_step=5565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  43%|████▎     | 520/1208 [14:27<19:07,  1.67s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0577, train/loss_vlb_step=0.000198, train/loss_step=0.0577, global_step=5565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  43%|████▎     | 521/1208 [14:28<19:04,  1.67s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0577, train/loss_vlb_step=0.000198, train/loss_step=0.0577, global_step=5565.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  43%|████▎     | 521/1208 [14:28<19:04,  1.67s/it, loss=0.199, v_num=0, train/loss_simple_step=0.813, train/loss_vlb_step=0.137, train/loss_step=0.813, global_step=5566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  43%|████▎     | 522/1208 [14:29<19:02,  1.67s/it, loss=0.199, v_num=0, train/loss_simple_step=0.813, train/loss_vlb_step=0.137, train/loss_step=0.813, global_step=5566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  43%|████▎     | 522/1208 [14:29<19:02,  1.67s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00652, train/loss_vlb_step=3.36e-5, train/loss_step=0.00652, global_step=5566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  43%|████▎     | 523/1208 [14:30<18:59,  1.66s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00652, train/loss_vlb_step=3.36e-5, train/loss_step=0.00652, global_step=5566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  43%|████▎     | 523/1208 [14:30<18:59,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00103, train/loss_step=0.247, global_step=5566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  43%|████▎     | 524/1208 [14:33<19:00,  1.67s/it, loss=0.179, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00103, train/loss_step=0.247, global_step=5566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  43%|████▎     | 524/1208 [14:33<19:00,  1.67s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=4.85e-5, train/loss_step=0.0109, global_step=5566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  43%|████▎     | 525/1208 [14:34<18:57,  1.67s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=4.85e-5, train/loss_step=0.0109, global_step=5566.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  43%|████▎     | 525/1208 [14:34<18:57,  1.67s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.1e-5, train/loss_step=0.0139, global_step=5567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  44%|████▎     | 526/1208 [14:35<18:55,  1.66s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.1e-5, train/loss_step=0.0139, global_step=5567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  44%|████▎     | 526/1208 [14:35<18:55,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.46e-5, train/loss_step=0.0111, global_step=5567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  44%|████▎     | 527/1208 [14:36<18:52,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.46e-5, train/loss_step=0.0111, global_step=5567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  44%|████▎     | 527/1208 [14:36<18:52,  1.66s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0584, train/loss_vlb_step=0.0002, train/loss_step=0.0584, global_step=5567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  44%|████▎     | 528/1208 [14:40<18:53,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0584, train/loss_vlb_step=0.0002, train/loss_step=0.0584, global_step=5567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  44%|████▎     | 528/1208 [14:40<18:53,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=8.05e-5, train/loss_step=0.0191, global_step=5567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  44%|████▍     | 529/1208 [14:41<18:50,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=8.05e-5, train/loss_step=0.0191, global_step=5567.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  44%|████▍     | 529/1208 [14:41<18:50,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=5568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  44%|████▍     | 530/1208 [14:42<18:48,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=5568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  44%|████▍     | 530/1208 [14:42<18:48,  1.66s/it, loss=0.162, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000779, train/loss_step=0.221, global_step=5568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  44%|████▍     | 531/1208 [14:43<18:46,  1.66s/it, loss=0.162, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000779, train/loss_step=0.221, global_step=5568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  44%|████▍     | 531/1208 [14:43<18:46,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00751, train/loss_vlb_step=3.71e-5, train/loss_step=0.00751, global_step=5568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  44%|████▍     | 532/1208 [14:46<18:46,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00751, train/loss_vlb_step=3.71e-5, train/loss_step=0.00751, global_step=5568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  44%|████▍     | 532/1208 [14:46<18:46,  1.67s/it, loss=0.144, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.00038, train/loss_step=0.114, global_step=5568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  44%|████▍     | 533/1208 [14:47<18:43,  1.67s/it, loss=0.144, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.00038, train/loss_step=0.114, global_step=5568.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  44%|████▍     | 533/1208 [14:47<18:43,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0662, train/loss_vlb_step=0.00022, train/loss_step=0.0662, global_step=5569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  44%|████▍     | 534/1208 [14:48<18:41,  1.66s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0662, train/loss_vlb_step=0.00022, train/loss_step=0.0662, global_step=5569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  44%|████▍     | 534/1208 [14:48<18:41,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=9.7e-5, train/loss_step=0.0253, global_step=5569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  44%|████▍     | 535/1208 [14:49<18:39,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=9.7e-5, train/loss_step=0.0253, global_step=5569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  44%|████▍     | 535/1208 [14:49<18:39,  1.66s/it, loss=0.121, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00109, train/loss_step=0.258, global_step=5569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  44%|████▍     | 536/1208 [14:52<18:39,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00109, train/loss_step=0.258, global_step=5569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  44%|████▍     | 536/1208 [14:52<18:39,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00183, train/loss_step=0.347, global_step=5569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  44%|████▍     | 537/1208 [14:53<18:36,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00183, train/loss_step=0.347, global_step=5569.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  44%|████▍     | 537/1208 [14:53<18:36,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0675, train/loss_vlb_step=0.000229, train/loss_step=0.0675, global_step=5570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  45%|████▍     | 538/1208 [14:54<18:34,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0675, train/loss_vlb_step=0.000229, train/loss_step=0.0675, global_step=5570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  45%|████▍     | 538/1208 [14:54<18:34,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0502, train/loss_vlb_step=0.000177, train/loss_step=0.0502, global_step=5570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  45%|████▍     | 539/1208 [14:55<18:32,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0502, train/loss_vlb_step=0.000177, train/loss_step=0.0502, global_step=5570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  45%|████▍     | 539/1208 [14:55<18:32,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.25e-5, train/loss_step=0.00219, global_step=5570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  45%|████▍     | 540/1208 [14:59<18:32,  1.67s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.25e-5, train/loss_step=0.00219, global_step=5570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  45%|████▍     | 540/1208 [14:59<18:32,  1.67s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00811, train/loss_vlb_step=4.06e-5, train/loss_step=0.00811, global_step=5570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  45%|████▍     | 541/1208 [15:00<18:29,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00811, train/loss_vlb_step=4.06e-5, train/loss_step=0.00811, global_step=5570.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  45%|████▍     | 541/1208 [15:00<18:29,  1.66s/it, loss=0.0912, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000583, train/loss_step=0.173, global_step=5571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  45%|████▍     | 542/1208 [15:01<18:27,  1.66s/it, loss=0.0912, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000583, train/loss_step=0.173, global_step=5571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  45%|████▍     | 542/1208 [15:01<18:27,  1.66s/it, loss=0.102, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000951, train/loss_step=0.222, global_step=5571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  45%|████▍     | 543/1208 [15:02<18:25,  1.66s/it, loss=0.102, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000951, train/loss_step=0.222, global_step=5571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  45%|████▍     | 543/1208 [15:02<18:25,  1.66s/it, loss=0.101, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000947, train/loss_step=0.237, global_step=5571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  45%|████▌     | 544/1208 [15:05<18:25,  1.66s/it, loss=0.101, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000947, train/loss_step=0.237, global_step=5571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  45%|████▌     | 544/1208 [15:05<18:25,  1.66s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.84e-5, train/loss_step=0.0132, global_step=5571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  45%|████▌     | 545/1208 [15:06<18:23,  1.66s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.84e-5, train/loss_step=0.0132, global_step=5571.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  45%|████▌     | 545/1208 [15:06<18:23,  1.66s/it, loss=0.106, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=5572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  45%|████▌     | 546/1208 [15:07<18:20,  1.66s/it, loss=0.106, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=5572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  45%|████▌     | 546/1208 [15:07<18:20,  1.66s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0746, train/loss_vlb_step=0.000249, train/loss_step=0.0746, global_step=5572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  45%|████▌     | 547/1208 [15:08<18:18,  1.66s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0746, train/loss_vlb_step=0.000249, train/loss_step=0.0746, global_step=5572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  45%|████▌     | 547/1208 [15:08<18:18,  1.66s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00157, train/loss_vlb_step=9.39e-6, train/loss_step=0.00157, global_step=5572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  45%|████▌     | 548/1208 [15:12<18:18,  1.66s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00157, train/loss_vlb_step=9.39e-6, train/loss_step=0.00157, global_step=5572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  45%|████▌     | 548/1208 [15:12<18:18,  1.66s/it, loss=0.119, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00144, train/loss_step=0.275, global_step=5572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  45%|████▌     | 549/1208 [15:13<18:16,  1.66s/it, loss=0.119, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00144, train/loss_step=0.275, global_step=5572.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  45%|████▌     | 549/1208 [15:13<18:16,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000108, train/loss_step=0.0264, global_step=5573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  46%|████▌     | 550/1208 [15:14<18:13,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000108, train/loss_step=0.0264, global_step=5573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  46%|████▌     | 550/1208 [15:14<18:13,  1.66s/it, loss=0.116, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.00102, train/loss_step=0.241, global_step=5573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  46%|████▌     | 551/1208 [15:15<18:11,  1.66s/it, loss=0.116, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.00102, train/loss_step=0.241, global_step=5573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  46%|████▌     | 551/1208 [15:15<18:11,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.000196, train/loss_step=0.0537, global_step=5573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  46%|████▌     | 552/1208 [15:18<18:11,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.000196, train/loss_step=0.0537, global_step=5573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  46%|████▌     | 552/1208 [15:18<18:11,  1.66s/it, loss=0.127, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00161, train/loss_step=0.293, global_step=5573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  46%|████▌     | 553/1208 [15:19<18:09,  1.66s/it, loss=0.127, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00161, train/loss_step=0.293, global_step=5573.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  46%|████▌     | 553/1208 [15:19<18:09,  1.66s/it, loss=0.137, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00121, train/loss_step=0.265, global_step=5574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  46%|████▌     | 554/1208 [15:20<18:06,  1.66s/it, loss=0.137, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00121, train/loss_step=0.265, global_step=5574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  46%|████▌     | 554/1208 [15:20<18:06,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.000215, train/loss_step=0.0615, global_step=5574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  46%|████▌     | 555/1208 [15:21<18:04,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.000215, train/loss_step=0.0615, global_step=5574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  46%|████▌     | 555/1208 [15:21<18:04,  1.66s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0872, train/loss_vlb_step=0.000287, train/loss_step=0.0872, global_step=5574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  46%|████▌     | 556/1208 [15:24<18:04,  1.66s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0872, train/loss_vlb_step=0.000287, train/loss_step=0.0872, global_step=5574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  46%|████▌     | 556/1208 [15:24<18:04,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00126, train/loss_step=0.271, global_step=5574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  46%|████▌     | 557/1208 [15:25<18:02,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00126, train/loss_step=0.271, global_step=5574.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  46%|████▌     | 557/1208 [15:25<18:02,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00551, train/loss_vlb_step=2.86e-5, train/loss_step=0.00551, global_step=5575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  46%|████▌     | 558/1208 [15:26<17:59,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00551, train/loss_vlb_step=2.86e-5, train/loss_step=0.00551, global_step=5575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  46%|████▌     | 558/1208 [15:26<17:59,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00401, train/loss_step=0.397, global_step=5575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  46%|████▋     | 559/1208 [15:27<17:57,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00401, train/loss_step=0.397, global_step=5575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  46%|████▋     | 559/1208 [15:27<17:57,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00187, train/loss_step=0.295, global_step=5575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  46%|████▋     | 560/1208 [15:31<17:57,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00187, train/loss_step=0.295, global_step=5575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  46%|████▋     | 560/1208 [15:31<17:57,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0701, train/loss_vlb_step=0.000231, train/loss_step=0.0701, global_step=5575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  46%|████▋     | 561/1208 [15:32<17:55,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0701, train/loss_vlb_step=0.000231, train/loss_step=0.0701, global_step=5575.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  46%|████▋     | 561/1208 [15:32<17:55,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.43e-5, train/loss_step=0.012, global_step=5576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  47%|████▋     | 562/1208 [15:33<17:52,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.43e-5, train/loss_step=0.012, global_step=5576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  47%|████▋     | 562/1208 [15:33<17:52,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00226, train/loss_step=0.338, global_step=5576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  47%|████▋     | 563/1208 [15:34<17:50,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00226, train/loss_step=0.338, global_step=5576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  47%|████▋     | 563/1208 [15:34<17:50,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.59e-5, train/loss_step=0.0101, global_step=5576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  47%|████▋     | 564/1208 [15:37<17:50,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.59e-5, train/loss_step=0.0101, global_step=5576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  47%|████▋     | 564/1208 [15:37<17:50,  1.66s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0868, train/loss_vlb_step=0.000287, train/loss_step=0.0868, global_step=5576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  47%|████▋     | 565/1208 [15:38<17:48,  1.66s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0868, train/loss_vlb_step=0.000287, train/loss_step=0.0868, global_step=5576.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  47%|████▋     | 565/1208 [15:38<17:48,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=4.81e-5, train/loss_step=0.0109, global_step=5577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  47%|████▋     | 566/1208 [15:39<17:45,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=4.81e-5, train/loss_step=0.0109, global_step=5577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  47%|████▋     | 566/1208 [15:39<17:45,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00954, train/loss_vlb_step=4.52e-5, train/loss_step=0.00954, global_step=5577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  47%|████▋     | 567/1208 [15:40<17:43,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00954, train/loss_vlb_step=4.52e-5, train/loss_step=0.00954, global_step=5577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  47%|████▋     | 567/1208 [15:40<17:43,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.25e-5, train/loss_step=0.0137, global_step=5577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  47%|████▋     | 568/1208 [15:44<17:43,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.25e-5, train/loss_step=0.0137, global_step=5577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  47%|████▋     | 568/1208 [15:44<17:43,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.000975, train/loss_step=0.251, global_step=5577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  47%|████▋     | 569/1208 [15:45<17:41,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.000975, train/loss_step=0.251, global_step=5577.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  47%|████▋     | 569/1208 [15:45<17:41,  1.66s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0745, train/loss_vlb_step=0.00025, train/loss_step=0.0745, global_step=5578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  47%|████▋     | 570/1208 [15:46<17:38,  1.66s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0745, train/loss_vlb_step=0.00025, train/loss_step=0.0745, global_step=5578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  47%|████▋     | 570/1208 [15:46<17:38,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00298, train/loss_step=0.389, global_step=5578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  47%|████▋     | 571/1208 [15:47<17:36,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00298, train/loss_step=0.389, global_step=5578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  47%|████▋     | 571/1208 [15:47<17:36,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00101, train/loss_step=0.250, global_step=5578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  47%|████▋     | 572/1208 [15:50<17:36,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00101, train/loss_step=0.250, global_step=5578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  47%|████▋     | 572/1208 [15:50<17:36,  1.66s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0432, train/loss_vlb_step=0.000157, train/loss_step=0.0432, global_step=5578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  47%|████▋     | 573/1208 [15:51<17:34,  1.66s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0432, train/loss_vlb_step=0.000157, train/loss_step=0.0432, global_step=5578.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  47%|████▋     | 573/1208 [15:51<17:34,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7.13e-5, train/loss_step=0.0165, global_step=5579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  48%|████▊     | 574/1208 [15:52<17:32,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7.13e-5, train/loss_step=0.0165, global_step=5579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  48%|████▊     | 574/1208 [15:52<17:32,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00112, train/loss_step=0.280, global_step=5579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  48%|████▊     | 575/1208 [15:53<17:29,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00112, train/loss_step=0.280, global_step=5579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  48%|████▊     | 575/1208 [15:53<17:29,  1.66s/it, loss=0.148, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000451, train/loss_step=0.133, global_step=5579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  48%|████▊     | 576/1208 [15:56<17:29,  1.66s/it, loss=0.148, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000451, train/loss_step=0.133, global_step=5579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  48%|████▊     | 576/1208 [15:56<17:29,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000409, train/loss_step=0.124, global_step=5579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  48%|████▊     | 577/1208 [15:57<17:27,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000409, train/loss_step=0.124, global_step=5579.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  48%|████▊     | 577/1208 [15:57<17:27,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=5.16e-5, train/loss_step=0.0104, global_step=5580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  48%|████▊     | 578/1208 [15:58<17:25,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=5.16e-5, train/loss_step=0.0104, global_step=5580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  48%|████▊     | 578/1208 [15:58<17:25,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0854, train/loss_vlb_step=0.000288, train/loss_step=0.0854, global_step=5580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  48%|████▊     | 579/1208 [15:59<17:22,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0854, train/loss_vlb_step=0.000288, train/loss_step=0.0854, global_step=5580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  48%|████▊     | 579/1208 [15:59<17:22,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000486, train/loss_step=0.147, global_step=5580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  48%|████▊     | 580/1208 [16:03<17:22,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000486, train/loss_step=0.147, global_step=5580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  48%|████▊     | 580/1208 [16:03<17:22,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00138, train/loss_step=0.288, global_step=5580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  48%|████▊     | 581/1208 [16:04<17:20,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00138, train/loss_step=0.288, global_step=5580.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  48%|████▊     | 581/1208 [16:04<17:20,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00165, train/loss_step=0.321, global_step=5581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  48%|████▊     | 582/1208 [16:05<17:18,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00165, train/loss_step=0.321, global_step=5581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  48%|████▊     | 582/1208 [16:05<17:18,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.00012, train/loss_step=0.0333, global_step=5581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  48%|████▊     | 583/1208 [16:06<17:15,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.00012, train/loss_step=0.0333, global_step=5581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  48%|████▊     | 583/1208 [16:06<17:15,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000284, train/loss_step=0.086, global_step=5581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  48%|████▊     | 584/1208 [16:09<17:15,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000284, train/loss_step=0.086, global_step=5581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  48%|████▊     | 584/1208 [16:09<17:15,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00899, train/loss_vlb_step=4.23e-5, train/loss_step=0.00899, global_step=5581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  48%|████▊     | 585/1208 [16:10<17:13,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00899, train/loss_vlb_step=4.23e-5, train/loss_step=0.00899, global_step=5581.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  48%|████▊     | 585/1208 [16:10<17:13,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0882, train/loss_vlb_step=0.000291, train/loss_step=0.0882, global_step=5582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  49%|████▊     | 586/1208 [16:11<17:11,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0882, train/loss_vlb_step=0.000291, train/loss_step=0.0882, global_step=5582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  49%|████▊     | 586/1208 [16:11<17:11,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000159, train/loss_step=0.0457, global_step=5582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  49%|████▊     | 587/1208 [16:12<17:08,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000159, train/loss_step=0.0457, global_step=5582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  49%|████▊     | 587/1208 [16:12<17:08,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000132, train/loss_step=0.0353, global_step=5582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  49%|████▊     | 588/1208 [16:15<17:09,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000132, train/loss_step=0.0353, global_step=5582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  49%|████▊     | 588/1208 [16:15<17:09,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00482, train/loss_vlb_step=2.42e-5, train/loss_step=0.00482, global_step=5582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  49%|████▉     | 589/1208 [16:16<17:06,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00482, train/loss_vlb_step=2.42e-5, train/loss_step=0.00482, global_step=5582.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  49%|████▉     | 589/1208 [16:16<17:06,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.0011, train/loss_step=0.269, global_step=5583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 18:  49%|████▉     | 590/1208 [16:17<17:04,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.0011, train/loss_step=0.269, global_step=5583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  49%|████▉     | 590/1208 [16:17<17:04,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00164, train/loss_step=0.318, global_step=5583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  49%|████▉     | 591/1208 [16:19<17:02,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00164, train/loss_step=0.318, global_step=5583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  49%|████▉     | 591/1208 [16:19<17:02,  1.66s/it, loss=0.127, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000654, train/loss_step=0.192, global_step=5583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  49%|████▉     | 592/1208 [16:22<17:02,  1.66s/it, loss=0.127, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000654, train/loss_step=0.192, global_step=5583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  49%|████▉     | 592/1208 [16:22<17:02,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.000991, train/loss_step=0.243, global_step=5583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  49%|████▉     | 593/1208 [16:23<16:59,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.000991, train/loss_step=0.243, global_step=5583.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  49%|████▉     | 593/1208 [16:23<16:59,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00143, train/loss_step=0.299, global_step=5584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  49%|████▉     | 594/1208 [16:24<16:57,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00143, train/loss_step=0.299, global_step=5584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  49%|████▉     | 594/1208 [16:24<16:57,  1.66s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.05e-5, train/loss_step=0.0112, global_step=5584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  49%|████▉     | 595/1208 [16:25<16:55,  1.66s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.05e-5, train/loss_step=0.0112, global_step=5584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  49%|████▉     | 595/1208 [16:25<16:55,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00678, train/loss_vlb_step=3.31e-5, train/loss_step=0.00678, global_step=5584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  49%|████▉     | 596/1208 [16:28<16:55,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00678, train/loss_vlb_step=3.31e-5, train/loss_step=0.00678, global_step=5584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  49%|████▉     | 596/1208 [16:28<16:55,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000613, train/loss_step=0.178, global_step=5584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  49%|████▉     | 597/1208 [16:29<16:52,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000613, train/loss_step=0.178, global_step=5584.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  49%|████▉     | 597/1208 [16:29<16:52,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000496, train/loss_step=0.144, global_step=5585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  50%|████▉     | 598/1208 [16:30<16:50,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000496, train/loss_step=0.144, global_step=5585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  50%|████▉     | 598/1208 [16:30<16:50,  1.66s/it, loss=0.147, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000842, train/loss_step=0.220, global_step=5585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  50%|████▉     | 599/1208 [16:31<16:48,  1.66s/it, loss=0.147, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000842, train/loss_step=0.220, global_step=5585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  50%|████▉     | 599/1208 [16:31<16:48,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=2.02e-5, train/loss_step=0.00351, global_step=5585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  50%|████▉     | 600/1208 [16:34<16:48,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=2.02e-5, train/loss_step=0.00351, global_step=5585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  50%|████▉     | 600/1208 [16:34<16:48,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000391, train/loss_step=0.118, global_step=5585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.72it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.76it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:28,  1.71it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.74it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.76it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.76it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.78it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.78it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.77it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.78it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.78it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 18:  50%|████▉     | 601/1208 [17:05<17:15,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000391, train/loss_step=0.118, global_step=5585.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  50%|████▉     | 601/1208 [17:05<17:15,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000416, train/loss_step=0.126, global_step=5586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  50%|████▉     | 602/1208 [17:06<17:13,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000416, train/loss_step=0.126, global_step=5586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  50%|████▉     | 602/1208 [17:06<17:13,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000954, train/loss_step=0.246, global_step=5586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  50%|████▉     | 603/1208 [17:07<17:11,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000954, train/loss_step=0.246, global_step=5586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  50%|████▉     | 603/1208 [17:07<17:11,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.464, train/loss_vlb_step=0.00629, train/loss_step=0.464, global_step=5586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  50%|█████     | 604/1208 [17:10<17:10,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.464, train/loss_vlb_step=0.00629, train/loss_step=0.464, global_step=5586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  50%|█████     | 604/1208 [17:10<17:10,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0999, train/loss_vlb_step=0.000328, train/loss_step=0.0999, global_step=5586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  50%|█████     | 605/1208 [17:11<17:08,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0999, train/loss_vlb_step=0.000328, train/loss_step=0.0999, global_step=5586.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  50%|█████     | 605/1208 [17:11<17:08,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00109, train/loss_step=0.282, global_step=5587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  50%|█████     | 606/1208 [17:12<17:06,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00109, train/loss_step=0.282, global_step=5587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  50%|█████     | 606/1208 [17:12<17:06,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0866, train/loss_vlb_step=0.000285, train/loss_step=0.0866, global_step=5587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  50%|█████     | 607/1208 [17:13<17:03,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0866, train/loss_vlb_step=0.000285, train/loss_step=0.0866, global_step=5587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  50%|█████     | 607/1208 [17:13<17:03,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0564, train/loss_vlb_step=0.000198, train/loss_step=0.0564, global_step=5587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  50%|█████     | 608/1208 [17:17<17:03,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0564, train/loss_vlb_step=0.000198, train/loss_step=0.0564, global_step=5587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  50%|█████     | 608/1208 [17:17<17:03,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=9.13e-5, train/loss_step=0.022, global_step=5587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  50%|█████     | 609/1208 [17:18<17:01,  1.70s/it, loss=0.169, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=9.13e-5, train/loss_step=0.022, global_step=5587.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  50%|█████     | 609/1208 [17:18<17:01,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.71e-5, train/loss_step=0.0212, global_step=5588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  50%|█████     | 610/1208 [17:19<16:58,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.71e-5, train/loss_step=0.0212, global_step=5588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  50%|█████     | 610/1208 [17:19<16:58,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.08e-5, train/loss_step=0.00178, global_step=5588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  51%|█████     | 611/1208 [17:20<16:56,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.08e-5, train/loss_step=0.00178, global_step=5588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  51%|█████     | 611/1208 [17:20<16:56,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=8.94e-5, train/loss_step=0.0218, global_step=5588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  51%|█████     | 612/1208 [17:23<16:56,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=8.94e-5, train/loss_step=0.0218, global_step=5588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  51%|█████     | 612/1208 [17:23<16:56,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0498, train/loss_vlb_step=0.000171, train/loss_step=0.0498, global_step=5588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  51%|█████     | 613/1208 [17:24<16:53,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0498, train/loss_vlb_step=0.000171, train/loss_step=0.0498, global_step=5588.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  51%|█████     | 613/1208 [17:24<16:53,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0656, train/loss_vlb_step=0.000225, train/loss_step=0.0656, global_step=5589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  51%|█████     | 614/1208 [17:25<16:51,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0656, train/loss_vlb_step=0.000225, train/loss_step=0.0656, global_step=5589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  51%|█████     | 614/1208 [17:25<16:51,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.000123, train/loss_step=0.033, global_step=5589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  51%|█████     | 615/1208 [17:26<16:49,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.000123, train/loss_step=0.033, global_step=5589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  51%|█████     | 615/1208 [17:26<16:49,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.0013, train/loss_step=0.307, global_step=5589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  51%|█████     | 616/1208 [17:29<16:48,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.0013, train/loss_step=0.307, global_step=5589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  51%|█████     | 616/1208 [17:29<16:49,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00814, train/loss_vlb_step=4.04e-5, train/loss_step=0.00814, global_step=5589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  51%|█████     | 617/1208 [17:30<16:46,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00814, train/loss_vlb_step=4.04e-5, train/loss_step=0.00814, global_step=5589.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  51%|█████     | 617/1208 [17:30<16:46,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.711, train/loss_vlb_step=0.0266, train/loss_step=0.711, global_step=5590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 18:  51%|█████     | 618/1208 [17:31<16:44,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.711, train/loss_vlb_step=0.0266, train/loss_step=0.711, global_step=5590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  51%|█████     | 618/1208 [17:31<16:44,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00616, train/loss_vlb_step=3.21e-5, train/loss_step=0.00616, global_step=5590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  51%|█████     | 619/1208 [17:33<16:41,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00616, train/loss_vlb_step=3.21e-5, train/loss_step=0.00616, global_step=5590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  51%|█████     | 619/1208 [17:33<16:41,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000469, train/loss_step=0.137, global_step=5590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  51%|█████▏    | 620/1208 [17:36<16:41,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000469, train/loss_step=0.137, global_step=5590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  51%|█████▏    | 620/1208 [17:36<16:41,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.068, train/loss_vlb_step=0.000225, train/loss_step=0.068, global_step=5590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  51%|█████▏    | 621/1208 [17:37<16:39,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.068, train/loss_vlb_step=0.000225, train/loss_step=0.068, global_step=5590.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  51%|█████▏    | 621/1208 [17:37<16:39,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00903, train/loss_vlb_step=4.03e-5, train/loss_step=0.00903, global_step=5591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  51%|█████▏    | 622/1208 [17:38<16:37,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00903, train/loss_vlb_step=4.03e-5, train/loss_step=0.00903, global_step=5591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  51%|█████▏    | 622/1208 [17:38<16:37,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00144, train/loss_step=0.312, global_step=5591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  52%|█████▏    | 623/1208 [17:39<16:34,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00144, train/loss_step=0.312, global_step=5591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  52%|█████▏    | 623/1208 [17:39<16:34,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0294, train/loss_vlb_step=0.000119, train/loss_step=0.0294, global_step=5591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  52%|█████▏    | 624/1208 [17:42<16:34,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0294, train/loss_vlb_step=0.000119, train/loss_step=0.0294, global_step=5591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  52%|█████▏    | 624/1208 [17:42<16:34,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00913, train/loss_vlb_step=4.18e-5, train/loss_step=0.00913, global_step=5591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  52%|█████▏    | 625/1208 [17:43<16:32,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00913, train/loss_vlb_step=4.18e-5, train/loss_step=0.00913, global_step=5591.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  52%|█████▏    | 625/1208 [17:43<16:32,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000799, train/loss_step=0.210, global_step=5592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  52%|█████▏    | 626/1208 [17:44<16:29,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000799, train/loss_step=0.210, global_step=5592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  52%|█████▏    | 626/1208 [17:44<16:29,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00398, train/loss_vlb_step=2.12e-5, train/loss_step=0.00398, global_step=5592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  52%|█████▏    | 627/1208 [17:45<16:27,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00398, train/loss_vlb_step=2.12e-5, train/loss_step=0.00398, global_step=5592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  52%|█████▏    | 627/1208 [17:45<16:27,  1.70s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00805, train/loss_vlb_step=3.91e-5, train/loss_step=0.00805, global_step=5592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  52%|█████▏    | 628/1208 [17:49<16:27,  1.70s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00805, train/loss_vlb_step=3.91e-5, train/loss_step=0.00805, global_step=5592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  52%|█████▏    | 628/1208 [17:49<16:27,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00101, train/loss_step=0.256, global_step=5592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  52%|█████▏    | 629/1208 [17:50<16:25,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00101, train/loss_step=0.256, global_step=5592.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  52%|█████▏    | 629/1208 [17:50<16:25,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.08e-5, train/loss_step=0.0144, global_step=5593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  52%|█████▏    | 630/1208 [17:51<16:22,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.08e-5, train/loss_step=0.0144, global_step=5593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  52%|█████▏    | 630/1208 [17:51<16:22,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0042, train/loss_vlb_step=2.24e-5, train/loss_step=0.0042, global_step=5593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  52%|█████▏    | 631/1208 [17:52<16:20,  1.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0042, train/loss_vlb_step=2.24e-5, train/loss_step=0.0042, global_step=5593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  52%|█████▏    | 631/1208 [17:52<16:20,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0428, train/loss_vlb_step=0.000152, train/loss_step=0.0428, global_step=5593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  52%|█████▏    | 632/1208 [17:55<16:19,  1.70s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0428, train/loss_vlb_step=0.000152, train/loss_step=0.0428, global_step=5593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  52%|█████▏    | 632/1208 [17:55<16:19,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00464, train/loss_step=0.433, global_step=5593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  52%|█████▏    | 633/1208 [17:56<16:17,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00464, train/loss_step=0.433, global_step=5593.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  52%|█████▏    | 633/1208 [17:56<16:17,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000935, train/loss_step=0.238, global_step=5594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  52%|█████▏    | 634/1208 [17:57<16:15,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000935, train/loss_step=0.238, global_step=5594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  52%|█████▏    | 634/1208 [17:57<16:15,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.95e-5, train/loss_step=0.0155, global_step=5594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  53%|█████▎    | 635/1208 [17:58<16:12,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.95e-5, train/loss_step=0.0155, global_step=5594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  53%|█████▎    | 635/1208 [17:58<16:12,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.6e-5, train/loss_step=0.010, global_step=5594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  53%|█████▎    | 636/1208 [18:00<16:12,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.6e-5, train/loss_step=0.010, global_step=5594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  53%|█████▎    | 636/1208 [18:00<16:12,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.98e-5, train/loss_step=0.00349, global_step=5594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  53%|█████▎    | 637/1208 [18:01<16:09,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.98e-5, train/loss_step=0.00349, global_step=5594.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  53%|█████▎    | 637/1208 [18:01<16:09,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00208, train/loss_step=0.340, global_step=5595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  53%|█████▎    | 638/1208 [18:02<16:07,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00208, train/loss_step=0.340, global_step=5595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  53%|█████▎    | 638/1208 [18:02<16:07,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00169, train/loss_step=0.324, global_step=5595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  53%|█████▎    | 639/1208 [18:03<16:05,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00169, train/loss_step=0.324, global_step=5595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  53%|█████▎    | 639/1208 [18:03<16:05,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0542, train/loss_vlb_step=0.000192, train/loss_step=0.0542, global_step=5595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  53%|█████▎    | 640/1208 [18:06<16:04,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0542, train/loss_vlb_step=0.000192, train/loss_step=0.0542, global_step=5595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  53%|█████▎    | 640/1208 [18:06<16:04,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.069, train/loss_vlb_step=0.000235, train/loss_step=0.069, global_step=5595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  53%|█████▎    | 641/1208 [18:07<16:02,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.069, train/loss_vlb_step=0.000235, train/loss_step=0.069, global_step=5595.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  53%|█████▎    | 641/1208 [18:07<16:02,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000523, train/loss_step=0.155, global_step=5596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  53%|█████▎    | 642/1208 [18:08<15:59,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000523, train/loss_step=0.155, global_step=5596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  53%|█████▎    | 642/1208 [18:08<15:59,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00609, train/loss_vlb_step=3.17e-5, train/loss_step=0.00609, global_step=5596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  53%|█████▎    | 643/1208 [18:09<15:57,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00609, train/loss_vlb_step=3.17e-5, train/loss_step=0.00609, global_step=5596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  53%|█████▎    | 643/1208 [18:09<15:57,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=2.39e-5, train/loss_step=0.00451, global_step=5596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  53%|█████▎    | 644/1208 [18:12<15:57,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=2.39e-5, train/loss_step=0.00451, global_step=5596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  53%|█████▎    | 644/1208 [18:12<15:57,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00559, train/loss_vlb_step=2.77e-5, train/loss_step=0.00559, global_step=5596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  53%|█████▎    | 645/1208 [18:13<15:54,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00559, train/loss_vlb_step=2.77e-5, train/loss_step=0.00559, global_step=5596.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  53%|█████▎    | 645/1208 [18:13<15:54,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0678, train/loss_vlb_step=0.000225, train/loss_step=0.0678, global_step=5597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  53%|█████▎    | 646/1208 [18:14<15:52,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0678, train/loss_vlb_step=0.000225, train/loss_step=0.0678, global_step=5597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  53%|█████▎    | 646/1208 [18:14<15:52,  1.69s/it, loss=0.11, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.00049, train/loss_step=0.148, global_step=5597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  54%|█████▎    | 647/1208 [18:15<15:50,  1.69s/it, loss=0.11, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.00049, train/loss_step=0.148, global_step=5597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  54%|█████▎    | 647/1208 [18:15<15:50,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.502, train/loss_vlb_step=0.00522, train/loss_step=0.502, global_step=5597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  54%|█████▎    | 648/1208 [18:18<15:49,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.502, train/loss_vlb_step=0.00522, train/loss_step=0.502, global_step=5597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  54%|█████▎    | 648/1208 [18:18<15:49,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0994, train/loss_vlb_step=0.000327, train/loss_step=0.0994, global_step=5597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  54%|█████▎    | 649/1208 [18:19<15:47,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0994, train/loss_vlb_step=0.000327, train/loss_step=0.0994, global_step=5597.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  54%|█████▎    | 649/1208 [18:19<15:47,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000126, train/loss_step=0.0317, global_step=5598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  54%|█████▍    | 650/1208 [18:20<15:44,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000126, train/loss_step=0.0317, global_step=5598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  54%|█████▍    | 650/1208 [18:20<15:44,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00855, train/loss_vlb_step=4.05e-5, train/loss_step=0.00855, global_step=5598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  54%|█████▍    | 651/1208 [18:21<15:42,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00855, train/loss_vlb_step=4.05e-5, train/loss_step=0.00855, global_step=5598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  54%|█████▍    | 651/1208 [18:21<15:42,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000567, train/loss_step=0.169, global_step=5598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  54%|█████▍    | 652/1208 [18:24<15:41,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000567, train/loss_step=0.169, global_step=5598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  54%|█████▍    | 652/1208 [18:24<15:41,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.25e-5, train/loss_step=0.0145, global_step=5598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  54%|█████▍    | 653/1208 [18:25<15:39,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.25e-5, train/loss_step=0.0145, global_step=5598.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  54%|█████▍    | 653/1208 [18:25<15:39,  1.69s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0616, train/loss_vlb_step=0.000214, train/loss_step=0.0616, global_step=5599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  54%|█████▍    | 654/1208 [18:26<15:37,  1.69s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0616, train/loss_vlb_step=0.000214, train/loss_step=0.0616, global_step=5599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  54%|█████▍    | 654/1208 [18:26<15:37,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000208, train/loss_step=0.0588, global_step=5599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  54%|█████▍    | 655/1208 [18:27<15:35,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000208, train/loss_step=0.0588, global_step=5599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  54%|█████▍    | 655/1208 [18:27<15:35,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.477, train/loss_vlb_step=0.00931, train/loss_step=0.477, global_step=5599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  54%|█████▍    | 656/1208 [18:30<15:34,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.477, train/loss_vlb_step=0.00931, train/loss_step=0.477, global_step=5599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  54%|█████▍    | 656/1208 [18:30<15:34,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.424, train/loss_vlb_step=0.00455, train/loss_step=0.424, global_step=5599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  54%|█████▍    | 657/1208 [18:31<15:32,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.424, train/loss_vlb_step=0.00455, train/loss_step=0.424, global_step=5599.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  54%|█████▍    | 657/1208 [18:31<15:32,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.28e-5, train/loss_step=0.014, global_step=5600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  54%|█████▍    | 658/1208 [18:32<15:29,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.28e-5, train/loss_step=0.014, global_step=5600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  54%|█████▍    | 658/1208 [18:32<15:29,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000101, train/loss_step=0.0255, global_step=5600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  55%|█████▍    | 659/1208 [18:33<15:27,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000101, train/loss_step=0.0255, global_step=5600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  55%|█████▍    | 659/1208 [18:33<15:27,  1.69s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0886, train/loss_vlb_step=0.000293, train/loss_step=0.0886, global_step=5600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  55%|█████▍    | 660/1208 [18:36<15:26,  1.69s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0886, train/loss_vlb_step=0.000293, train/loss_step=0.0886, global_step=5600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  55%|█████▍    | 660/1208 [18:36<15:26,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00671, train/loss_vlb_step=3.24e-5, train/loss_step=0.00671, global_step=5600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  55%|█████▍    | 661/1208 [18:37<15:24,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00671, train/loss_vlb_step=3.24e-5, train/loss_step=0.00671, global_step=5600.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  55%|█████▍    | 661/1208 [18:37<15:24,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000797, train/loss_step=0.212, global_step=5601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  55%|█████▍    | 662/1208 [18:38<15:22,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000797, train/loss_step=0.212, global_step=5601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  55%|█████▍    | 662/1208 [18:38<15:22,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000116, train/loss_step=0.0309, global_step=5601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  55%|█████▍    | 663/1208 [18:39<15:20,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000116, train/loss_step=0.0309, global_step=5601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  55%|█████▍    | 663/1208 [18:39<15:20,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0338, train/loss_vlb_step=0.00013, train/loss_step=0.0338, global_step=5601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  55%|█████▍    | 664/1208 [18:42<15:19,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0338, train/loss_vlb_step=0.00013, train/loss_step=0.0338, global_step=5601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  55%|█████▍    | 664/1208 [18:42<15:19,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.91e-5, train/loss_step=0.00344, global_step=5601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  55%|█████▌    | 665/1208 [18:43<15:17,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.91e-5, train/loss_step=0.00344, global_step=5601.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  55%|█████▌    | 665/1208 [18:43<15:17,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.00075, train/loss_step=0.213, global_step=5602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  55%|█████▌    | 666/1208 [18:44<15:15,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.00075, train/loss_step=0.213, global_step=5602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  55%|█████▌    | 666/1208 [18:44<15:15,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0926, train/loss_vlb_step=0.000305, train/loss_step=0.0926, global_step=5602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  55%|█████▌    | 667/1208 [18:45<15:12,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0926, train/loss_vlb_step=0.000305, train/loss_step=0.0926, global_step=5602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  55%|█████▌    | 667/1208 [18:45<15:12,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.17e-5, train/loss_step=0.00192, global_step=5602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  55%|█████▌    | 668/1208 [18:48<15:12,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.17e-5, train/loss_step=0.00192, global_step=5602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  55%|█████▌    | 668/1208 [18:48<15:12,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00253, train/loss_step=0.370, global_step=5602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  55%|█████▌    | 669/1208 [18:49<15:09,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00253, train/loss_step=0.370, global_step=5602.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  55%|█████▌    | 669/1208 [18:49<15:09,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0391, train/loss_vlb_step=0.00015, train/loss_step=0.0391, global_step=5603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  55%|█████▌    | 670/1208 [18:50<15:07,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0391, train/loss_vlb_step=0.00015, train/loss_step=0.0391, global_step=5603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  55%|█████▌    | 670/1208 [18:50<15:07,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.43e-5, train/loss_step=0.00244, global_step=5603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  56%|█████▌    | 671/1208 [18:51<15:05,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.43e-5, train/loss_step=0.00244, global_step=5603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  56%|█████▌    | 671/1208 [18:51<15:05,  1.69s/it, loss=0.114, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=5603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  56%|█████▌    | 672/1208 [18:54<15:04,  1.69s/it, loss=0.114, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=5603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  56%|█████▌    | 672/1208 [18:54<15:04,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.21e-5, train/loss_step=0.00209, global_step=5603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  56%|█████▌    | 673/1208 [18:55<15:02,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.21e-5, train/loss_step=0.00209, global_step=5603.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  56%|█████▌    | 673/1208 [18:55<15:02,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.655, train/loss_vlb_step=0.0183, train/loss_step=0.655, global_step=5604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 18:  56%|█████▌    | 674/1208 [18:56<15:00,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.655, train/loss_vlb_step=0.0183, train/loss_step=0.655, global_step=5604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  56%|█████▌    | 674/1208 [18:56<15:00,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00624, train/loss_vlb_step=3.08e-5, train/loss_step=0.00624, global_step=5604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  56%|█████▌    | 675/1208 [18:57<14:57,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00624, train/loss_vlb_step=3.08e-5, train/loss_step=0.00624, global_step=5604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  56%|█████▌    | 675/1208 [18:57<14:57,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.473, train/loss_vlb_step=0.00591, train/loss_step=0.473, global_step=5604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  56%|█████▌    | 676/1208 [19:00<14:57,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.473, train/loss_vlb_step=0.00591, train/loss_step=0.473, global_step=5604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  56%|█████▌    | 676/1208 [19:00<14:57,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000667, train/loss_step=0.192, global_step=5604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  56%|█████▌    | 677/1208 [19:01<14:54,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000667, train/loss_step=0.192, global_step=5604.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  56%|█████▌    | 677/1208 [19:01<14:54,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000127, train/loss_step=0.0344, global_step=5605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  56%|█████▌    | 678/1208 [19:02<14:52,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000127, train/loss_step=0.0344, global_step=5605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  56%|█████▌    | 678/1208 [19:02<14:52,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000841, train/loss_step=0.224, global_step=5605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  56%|█████▌    | 679/1208 [19:03<14:50,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000841, train/loss_step=0.224, global_step=5605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  56%|█████▌    | 679/1208 [19:03<14:50,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000107, train/loss_step=0.0272, global_step=5605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  56%|█████▋    | 680/1208 [19:05<14:49,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000107, train/loss_step=0.0272, global_step=5605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  56%|█████▋    | 680/1208 [19:05<14:49,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.455, train/loss_vlb_step=0.00512, train/loss_step=0.455, global_step=5605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  56%|█████▋    | 681/1208 [19:06<14:47,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.455, train/loss_vlb_step=0.00512, train/loss_step=0.455, global_step=5605.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  56%|█████▋    | 681/1208 [19:06<14:47,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00972, train/loss_vlb_step=4.66e-5, train/loss_step=0.00972, global_step=5606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  56%|█████▋    | 682/1208 [19:08<14:45,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00972, train/loss_vlb_step=4.66e-5, train/loss_step=0.00972, global_step=5606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  56%|█████▋    | 682/1208 [19:08<14:45,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.1e-5, train/loss_step=0.0175, global_step=5606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  57%|█████▋    | 683/1208 [19:09<14:43,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.1e-5, train/loss_step=0.0175, global_step=5606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  57%|█████▋    | 683/1208 [19:09<14:43,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0936, train/loss_vlb_step=0.000309, train/loss_step=0.0936, global_step=5606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  57%|█████▋    | 684/1208 [19:11<14:42,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0936, train/loss_vlb_step=0.000309, train/loss_step=0.0936, global_step=5606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  57%|█████▋    | 684/1208 [19:11<14:42,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000713, train/loss_step=0.201, global_step=5606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  57%|█████▋    | 685/1208 [19:12<14:40,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000713, train/loss_step=0.201, global_step=5606.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  57%|█████▋    | 685/1208 [19:12<14:40,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.46e-5, train/loss_step=0.0176, global_step=5607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  57%|█████▋    | 686/1208 [19:13<14:38,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.46e-5, train/loss_step=0.0176, global_step=5607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  57%|█████▋    | 686/1208 [19:13<14:38,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0491, train/loss_vlb_step=0.000176, train/loss_step=0.0491, global_step=5607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  57%|█████▋    | 687/1208 [19:14<14:35,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0491, train/loss_vlb_step=0.000176, train/loss_step=0.0491, global_step=5607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  57%|█████▋    | 687/1208 [19:14<14:35,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=9.94e-5, train/loss_step=0.0256, global_step=5607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  57%|█████▋    | 688/1208 [19:17<14:35,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=9.94e-5, train/loss_step=0.0256, global_step=5607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  57%|█████▋    | 688/1208 [19:17<14:35,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00338, train/loss_step=0.442, global_step=5607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  57%|█████▋    | 689/1208 [19:18<14:32,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00338, train/loss_step=0.442, global_step=5607.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  57%|█████▋    | 689/1208 [19:18<14:32,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.03e-5, train/loss_step=0.011, global_step=5608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  57%|█████▋    | 690/1208 [19:19<14:30,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.03e-5, train/loss_step=0.011, global_step=5608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  57%|█████▋    | 690/1208 [19:19<14:30,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00709, train/loss_vlb_step=3.46e-5, train/loss_step=0.00709, global_step=5608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  57%|█████▋    | 691/1208 [19:20<14:28,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00709, train/loss_vlb_step=3.46e-5, train/loss_step=0.00709, global_step=5608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  57%|█████▋    | 691/1208 [19:20<14:28,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00227, train/loss_step=0.332, global_step=5608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  57%|█████▋    | 692/1208 [19:23<14:27,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00227, train/loss_step=0.332, global_step=5608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  57%|█████▋    | 692/1208 [19:23<14:27,  1.68s/it, loss=0.182, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00146, train/loss_step=0.364, global_step=5608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  57%|█████▋    | 693/1208 [19:24<14:25,  1.68s/it, loss=0.182, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00146, train/loss_step=0.364, global_step=5608.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  57%|█████▋    | 693/1208 [19:24<14:25,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.00085, train/loss_step=0.215, global_step=5609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  57%|█████▋    | 694/1208 [19:25<14:23,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.00085, train/loss_step=0.215, global_step=5609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  57%|█████▋    | 694/1208 [19:25<14:23,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0315, train/loss_vlb_step=0.000121, train/loss_step=0.0315, global_step=5609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  58%|█████▊    | 695/1208 [19:26<14:21,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0315, train/loss_vlb_step=0.000121, train/loss_step=0.0315, global_step=5609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  58%|█████▊    | 695/1208 [19:26<14:21,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.534, train/loss_vlb_step=0.00621, train/loss_step=0.534, global_step=5609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  58%|█████▊    | 696/1208 [19:29<14:20,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.534, train/loss_vlb_step=0.00621, train/loss_step=0.534, global_step=5609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  58%|█████▊    | 696/1208 [19:29<14:20,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.000222, train/loss_step=0.0665, global_step=5609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  58%|█████▊    | 697/1208 [19:30<14:18,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.000222, train/loss_step=0.0665, global_step=5609.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  58%|█████▊    | 697/1208 [19:30<14:18,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0366, train/loss_vlb_step=0.000137, train/loss_step=0.0366, global_step=5610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  58%|█████▊    | 698/1208 [19:31<14:16,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0366, train/loss_vlb_step=0.000137, train/loss_step=0.0366, global_step=5610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  58%|█████▊    | 698/1208 [19:31<14:16,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.00041, train/loss_step=0.124, global_step=5610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  58%|█████▊    | 699/1208 [19:32<14:13,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.00041, train/loss_step=0.124, global_step=5610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  58%|█████▊    | 699/1208 [19:32<14:13,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00843, train/loss_vlb_step=4e-5, train/loss_step=0.00843, global_step=5610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  58%|█████▊    | 700/1208 [19:35<14:13,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00843, train/loss_vlb_step=4e-5, train/loss_step=0.00843, global_step=5610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  58%|█████▊    | 700/1208 [19:35<14:13,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.00012, train/loss_step=0.0319, global_step=5610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  58%|█████▊    | 701/1208 [19:36<14:10,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.00012, train/loss_step=0.0319, global_step=5610.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  58%|█████▊    | 701/1208 [19:36<14:10,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000543, train/loss_step=0.155, global_step=5611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  58%|█████▊    | 702/1208 [19:37<14:08,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000543, train/loss_step=0.155, global_step=5611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  58%|█████▊    | 702/1208 [19:37<14:08,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000363, train/loss_step=0.110, global_step=5611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  58%|█████▊    | 703/1208 [19:38<14:06,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000363, train/loss_step=0.110, global_step=5611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  58%|█████▊    | 703/1208 [19:38<14:06,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.25e-5, train/loss_step=0.012, global_step=5611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  58%|█████▊    | 704/1208 [19:41<14:05,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.25e-5, train/loss_step=0.012, global_step=5611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  58%|█████▊    | 704/1208 [19:41<14:05,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.55e-5, train/loss_step=0.00475, global_step=5611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  58%|█████▊    | 705/1208 [19:42<14:03,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.55e-5, train/loss_step=0.00475, global_step=5611.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  58%|█████▊    | 705/1208 [19:42<14:03,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.438, train/loss_vlb_step=0.00323, train/loss_step=0.438, global_step=5612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 18:  58%|█████▊    | 706/1208 [19:43<14:01,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.438, train/loss_vlb_step=0.00323, train/loss_step=0.438, global_step=5612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  58%|█████▊    | 706/1208 [19:43<14:01,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0845, train/loss_vlb_step=0.000284, train/loss_step=0.0845, global_step=5612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  59%|█████▊    | 707/1208 [19:44<13:59,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0845, train/loss_vlb_step=0.000284, train/loss_step=0.0845, global_step=5612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  59%|█████▊    | 707/1208 [19:44<13:59,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0421, train/loss_vlb_step=0.000153, train/loss_step=0.0421, global_step=5612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  59%|█████▊    | 708/1208 [19:47<13:58,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0421, train/loss_vlb_step=0.000153, train/loss_step=0.0421, global_step=5612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  59%|█████▊    | 708/1208 [19:47<13:58,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00119, train/loss_step=0.268, global_step=5612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  59%|█████▊    | 709/1208 [19:48<13:56,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00119, train/loss_step=0.268, global_step=5612.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  59%|█████▊    | 709/1208 [19:48<13:56,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000699, train/loss_step=0.190, global_step=5613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  59%|█████▉    | 710/1208 [19:49<13:54,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000699, train/loss_step=0.190, global_step=5613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  59%|█████▉    | 710/1208 [19:49<13:54,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000114, train/loss_step=0.0301, global_step=5613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  59%|█████▉    | 711/1208 [19:50<13:52,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000114, train/loss_step=0.0301, global_step=5613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  59%|█████▉    | 711/1208 [19:50<13:52,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=1.34e-5, train/loss_step=0.00227, global_step=5613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  59%|█████▉    | 712/1208 [19:53<13:51,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=1.34e-5, train/loss_step=0.00227, global_step=5613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  59%|█████▉    | 712/1208 [19:53<13:51,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0924, train/loss_vlb_step=0.000309, train/loss_step=0.0924, global_step=5613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  59%|█████▉    | 713/1208 [19:54<13:49,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0924, train/loss_vlb_step=0.000309, train/loss_step=0.0924, global_step=5613.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  59%|█████▉    | 713/1208 [19:54<13:49,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.873, train/loss_vlb_step=0.147, train/loss_step=0.873, global_step=5614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 18:  59%|█████▉    | 714/1208 [19:55<13:47,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.873, train/loss_vlb_step=0.147, train/loss_step=0.873, global_step=5614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  59%|█████▉    | 714/1208 [19:55<13:47,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00528, train/loss_vlb_step=2.72e-5, train/loss_step=0.00528, global_step=5614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  59%|█████▉    | 715/1208 [19:56<13:44,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00528, train/loss_vlb_step=2.72e-5, train/loss_step=0.00528, global_step=5614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  59%|█████▉    | 715/1208 [19:56<13:44,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0589, train/loss_vlb_step=0.000203, train/loss_step=0.0589, global_step=5614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  59%|█████▉    | 716/1208 [19:59<13:44,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0589, train/loss_vlb_step=0.000203, train/loss_step=0.0589, global_step=5614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  59%|█████▉    | 716/1208 [19:59<13:44,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0996, train/loss_vlb_step=0.000328, train/loss_step=0.0996, global_step=5614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  59%|█████▉    | 717/1208 [20:00<13:41,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0996, train/loss_vlb_step=0.000328, train/loss_step=0.0996, global_step=5614.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  59%|█████▉    | 717/1208 [20:00<13:41,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00453, train/loss_vlb_step=2.3e-5, train/loss_step=0.00453, global_step=5615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  59%|█████▉    | 718/1208 [20:01<13:39,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00453, train/loss_vlb_step=2.3e-5, train/loss_step=0.00453, global_step=5615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  59%|█████▉    | 718/1208 [20:01<13:39,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00188, train/loss_step=0.346, global_step=5615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  60%|█████▉    | 719/1208 [20:02<13:37,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00188, train/loss_step=0.346, global_step=5615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  60%|█████▉    | 719/1208 [20:02<13:37,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.31e-5, train/loss_step=0.0176, global_step=5615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  60%|█████▉    | 720/1208 [20:05<13:36,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.31e-5, train/loss_step=0.0176, global_step=5615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  60%|█████▉    | 720/1208 [20:05<13:36,  1.67s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0897, train/loss_vlb_step=0.000295, train/loss_step=0.0897, global_step=5615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  60%|█████▉    | 721/1208 [20:06<13:34,  1.67s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0897, train/loss_vlb_step=0.000295, train/loss_step=0.0897, global_step=5615.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  60%|█████▉    | 721/1208 [20:06<13:34,  1.67s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0759, train/loss_vlb_step=0.000255, train/loss_step=0.0759, global_step=5616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  60%|█████▉    | 722/1208 [20:07<13:32,  1.67s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0759, train/loss_vlb_step=0.000255, train/loss_step=0.0759, global_step=5616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  60%|█████▉    | 722/1208 [20:07<13:32,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0586, train/loss_vlb_step=0.000203, train/loss_step=0.0586, global_step=5616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  60%|█████▉    | 723/1208 [20:08<13:30,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0586, train/loss_vlb_step=0.000203, train/loss_step=0.0586, global_step=5616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  60%|█████▉    | 723/1208 [20:08<13:30,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.498, train/loss_vlb_step=0.00611, train/loss_step=0.498, global_step=5616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  60%|█████▉    | 724/1208 [20:11<13:29,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.498, train/loss_vlb_step=0.00611, train/loss_step=0.498, global_step=5616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  60%|█████▉    | 724/1208 [20:11<13:29,  1.67s/it, loss=0.177, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00122, train/loss_step=0.274, global_step=5616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  60%|██████    | 725/1208 [20:12<13:27,  1.67s/it, loss=0.177, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00122, train/loss_step=0.274, global_step=5616.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  60%|██████    | 725/1208 [20:12<13:27,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000461, train/loss_step=0.139, global_step=5617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  60%|██████    | 726/1208 [20:13<13:25,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000461, train/loss_step=0.139, global_step=5617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  60%|██████    | 726/1208 [20:13<13:25,  1.67s/it, loss=0.187, v_num=0, train/loss_simple_step=0.583, train/loss_vlb_step=0.0181, train/loss_step=0.583, global_step=5617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  60%|██████    | 727/1208 [20:14<13:23,  1.67s/it, loss=0.187, v_num=0, train/loss_simple_step=0.583, train/loss_vlb_step=0.0181, train/loss_step=0.583, global_step=5617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  60%|██████    | 727/1208 [20:14<13:23,  1.67s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00517, train/loss_vlb_step=2.75e-5, train/loss_step=0.00517, global_step=5617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  60%|██████    | 728/1208 [20:16<13:22,  1.67s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00517, train/loss_vlb_step=2.75e-5, train/loss_step=0.00517, global_step=5617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  60%|██████    | 728/1208 [20:16<13:22,  1.67s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=1.07e-5, train/loss_step=0.00181, global_step=5617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  60%|██████    | 729/1208 [20:17<13:20,  1.67s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=1.07e-5, train/loss_step=0.00181, global_step=5617.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  60%|██████    | 729/1208 [20:17<13:20,  1.67s/it, loss=0.177, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00132, train/loss_step=0.277, global_step=5618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  60%|██████    | 730/1208 [20:18<13:18,  1.67s/it, loss=0.177, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00132, train/loss_step=0.277, global_step=5618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  60%|██████    | 730/1208 [20:18<13:18,  1.67s/it, loss=0.18, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=5618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  61%|██████    | 731/1208 [20:20<13:16,  1.67s/it, loss=0.18, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=5618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  61%|██████    | 731/1208 [20:20<13:16,  1.67s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.00011, train/loss_step=0.0296, global_step=5618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  61%|██████    | 732/1208 [20:22<13:15,  1.67s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.00011, train/loss_step=0.0296, global_step=5618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  61%|██████    | 732/1208 [20:22<13:15,  1.67s/it, loss=0.187, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000787, train/loss_step=0.212, global_step=5618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  61%|██████    | 733/1208 [20:23<13:13,  1.67s/it, loss=0.187, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000787, train/loss_step=0.212, global_step=5618.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  61%|██████    | 733/1208 [20:23<13:13,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000115, train/loss_step=0.0307, global_step=5619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  61%|██████    | 734/1208 [20:24<13:11,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000115, train/loss_step=0.0307, global_step=5619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  61%|██████    | 734/1208 [20:24<13:11,  1.67s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0487, train/loss_vlb_step=0.000177, train/loss_step=0.0487, global_step=5619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  61%|██████    | 735/1208 [20:25<13:08,  1.67s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0487, train/loss_vlb_step=0.000177, train/loss_step=0.0487, global_step=5619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  61%|██████    | 735/1208 [20:25<13:08,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00139, train/loss_step=0.277, global_step=5619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  61%|██████    | 736/1208 [20:28<13:08,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00139, train/loss_step=0.277, global_step=5619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  61%|██████    | 736/1208 [20:28<13:08,  1.67s/it, loss=0.18, v_num=0, train/loss_simple_step=0.537, train/loss_vlb_step=0.00559, train/loss_step=0.537, global_step=5619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  61%|██████    | 737/1208 [20:29<13:05,  1.67s/it, loss=0.18, v_num=0, train/loss_simple_step=0.537, train/loss_vlb_step=0.00559, train/loss_step=0.537, global_step=5619.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  61%|██████    | 737/1208 [20:29<13:05,  1.67s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.02e-5, train/loss_step=0.0142, global_step=5620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  61%|██████    | 738/1208 [20:30<13:03,  1.67s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.02e-5, train/loss_step=0.0142, global_step=5620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  61%|██████    | 738/1208 [20:30<13:03,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.03e-5, train/loss_step=0.0111, global_step=5620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  61%|██████    | 739/1208 [20:31<13:01,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.03e-5, train/loss_step=0.0111, global_step=5620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  61%|██████    | 739/1208 [20:31<13:01,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0408, train/loss_vlb_step=0.000152, train/loss_step=0.0408, global_step=5620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  61%|██████▏   | 740/1208 [20:34<13:00,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0408, train/loss_vlb_step=0.000152, train/loss_step=0.0408, global_step=5620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  61%|██████▏   | 740/1208 [20:34<13:00,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.061, train/loss_vlb_step=0.000217, train/loss_step=0.061, global_step=5620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  61%|██████▏   | 741/1208 [20:35<12:58,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.061, train/loss_vlb_step=0.000217, train/loss_step=0.061, global_step=5620.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  61%|██████▏   | 741/1208 [20:35<12:58,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0898, train/loss_vlb_step=0.000296, train/loss_step=0.0898, global_step=5621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  61%|██████▏   | 742/1208 [20:36<12:56,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0898, train/loss_vlb_step=0.000296, train/loss_step=0.0898, global_step=5621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  61%|██████▏   | 742/1208 [20:36<12:56,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00717, train/loss_vlb_step=3.58e-5, train/loss_step=0.00717, global_step=5621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  62%|██████▏   | 743/1208 [20:37<12:54,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00717, train/loss_vlb_step=3.58e-5, train/loss_step=0.00717, global_step=5621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  62%|██████▏   | 743/1208 [20:37<12:54,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.62e-5, train/loss_step=0.0246, global_step=5621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  62%|██████▏   | 744/1208 [20:40<12:53,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.62e-5, train/loss_step=0.0246, global_step=5621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  62%|██████▏   | 744/1208 [20:40<12:53,  1.67s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00685, train/loss_vlb_step=3.35e-5, train/loss_step=0.00685, global_step=5621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  62%|██████▏   | 745/1208 [20:41<12:51,  1.67s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00685, train/loss_vlb_step=3.35e-5, train/loss_step=0.00685, global_step=5621.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  62%|██████▏   | 745/1208 [20:41<12:51,  1.67s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.84e-5, train/loss_step=0.0128, global_step=5622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  62%|██████▏   | 746/1208 [20:42<12:49,  1.67s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.84e-5, train/loss_step=0.0128, global_step=5622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  62%|██████▏   | 746/1208 [20:42<12:49,  1.67s/it, loss=0.09, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.17e-5, train/loss_step=0.0117, global_step=5622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  62%|██████▏   | 747/1208 [20:43<12:47,  1.66s/it, loss=0.09, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.17e-5, train/loss_step=0.0117, global_step=5622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  62%|██████▏   | 747/1208 [20:43<12:47,  1.66s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.0488, train/loss_vlb_step=0.000171, train/loss_step=0.0488, global_step=5622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  62%|██████▏   | 748/1208 [20:46<12:46,  1.67s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.0488, train/loss_vlb_step=0.000171, train/loss_step=0.0488, global_step=5622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  62%|██████▏   | 748/1208 [20:46<12:46,  1.67s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000416, train/loss_step=0.126, global_step=5622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  62%|██████▏   | 749/1208 [20:47<12:44,  1.67s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000416, train/loss_step=0.126, global_step=5622.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  62%|██████▏   | 749/1208 [20:47<12:44,  1.67s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000666, train/loss_step=0.192, global_step=5623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  62%|██████▏   | 750/1208 [20:48<12:42,  1.66s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000666, train/loss_step=0.192, global_step=5623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  62%|██████▏   | 750/1208 [20:48<12:42,  1.66s/it, loss=0.0927, v_num=0, train/loss_simple_step=0.0715, train/loss_vlb_step=0.00024, train/loss_step=0.0715, global_step=5623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  62%|██████▏   | 751/1208 [20:49<12:40,  1.66s/it, loss=0.0927, v_num=0, train/loss_simple_step=0.0715, train/loss_vlb_step=0.00024, train/loss_step=0.0715, global_step=5623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  62%|██████▏   | 751/1208 [20:49<12:40,  1.66s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000333, train/loss_step=0.101, global_step=5623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  62%|██████▏   | 752/1208 [20:52<12:39,  1.67s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000333, train/loss_step=0.101, global_step=5623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  62%|██████▏   | 752/1208 [20:52<12:39,  1.67s/it, loss=0.0879, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000158, train/loss_step=0.0445, global_step=5623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  62%|██████▏   | 753/1208 [20:53<12:37,  1.66s/it, loss=0.0879, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000158, train/loss_step=0.0445, global_step=5623.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  62%|██████▏   | 753/1208 [20:53<12:37,  1.66s/it, loss=0.0872, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.49e-5, train/loss_step=0.018, global_step=5624.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  62%|██████▏   | 754/1208 [20:54<12:35,  1.66s/it, loss=0.0872, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.49e-5, train/loss_step=0.018, global_step=5624.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  62%|██████▏   | 754/1208 [20:54<12:35,  1.66s/it, loss=0.0872, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.000173, train/loss_step=0.0482, global_step=5624.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  62%|██████▎   | 755/1208 [20:55<12:33,  1.66s/it, loss=0.0872, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.000173, train/loss_step=0.0482, global_step=5624.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  62%|██████▎   | 755/1208 [20:55<12:33,  1.66s/it, loss=0.0765, v_num=0, train/loss_simple_step=0.0635, train/loss_vlb_step=0.000217, train/loss_step=0.0635, global_step=5624.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  63%|██████▎   | 756/1208 [20:58<12:32,  1.66s/it, loss=0.0765, v_num=0, train/loss_simple_step=0.0635, train/loss_vlb_step=0.000217, train/loss_step=0.0635, global_step=5624.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  63%|██████▎   | 756/1208 [20:58<12:32,  1.66s/it, loss=0.0618, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000941, train/loss_step=0.244, global_step=5624.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  63%|██████▎   | 757/1208 [20:59<12:30,  1.66s/it, loss=0.0618, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000941, train/loss_step=0.244, global_step=5624.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  63%|██████▎   | 757/1208 [20:59<12:30,  1.66s/it, loss=0.0706, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000727, train/loss_step=0.189, global_step=5625.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  63%|██████▎   | 758/1208 [21:00<12:28,  1.66s/it, loss=0.0706, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000727, train/loss_step=0.189, global_step=5625.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  63%|██████▎   | 758/1208 [21:00<12:28,  1.66s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.431, train/loss_vlb_step=0.00315, train/loss_step=0.431, global_step=5625.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  63%|██████▎   | 759/1208 [21:01<12:26,  1.66s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.431, train/loss_vlb_step=0.00315, train/loss_step=0.431, global_step=5625.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  63%|██████▎   | 759/1208 [21:01<12:26,  1.66s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.0705, train/loss_vlb_step=0.000239, train/loss_step=0.0705, global_step=5625.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  63%|██████▎   | 760/1208 [21:04<12:25,  1.66s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.0705, train/loss_vlb_step=0.000239, train/loss_step=0.0705, global_step=5625.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  63%|██████▎   | 760/1208 [21:04<12:25,  1.66s/it, loss=0.0903, v_num=0, train/loss_simple_step=0.00536, train/loss_vlb_step=2.68e-5, train/loss_step=0.00536, global_step=5625.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  63%|██████▎   | 761/1208 [21:05<12:23,  1.66s/it, loss=0.0903, v_num=0, train/loss_simple_step=0.00536, train/loss_vlb_step=2.68e-5, train/loss_step=0.00536, global_step=5625.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  63%|██████▎   | 761/1208 [21:05<12:23,  1.66s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.00688, train/loss_vlb_step=3.32e-5, train/loss_step=0.00688, global_step=5626.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  63%|██████▎   | 762/1208 [21:06<12:21,  1.66s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.00688, train/loss_vlb_step=3.32e-5, train/loss_step=0.00688, global_step=5626.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  63%|██████▎   | 762/1208 [21:06<12:21,  1.66s/it, loss=0.086, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.93e-5, train/loss_step=0.00352, global_step=5626.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  63%|██████▎   | 763/1208 [21:07<12:19,  1.66s/it, loss=0.086, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.93e-5, train/loss_step=0.00352, global_step=5626.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  63%|██████▎   | 763/1208 [21:07<12:19,  1.66s/it, loss=0.111, v_num=0, train/loss_simple_step=0.534, train/loss_vlb_step=0.00873, train/loss_step=0.534, global_step=5626.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  63%|██████▎   | 764/1208 [21:10<12:18,  1.66s/it, loss=0.111, v_num=0, train/loss_simple_step=0.534, train/loss_vlb_step=0.00873, train/loss_step=0.534, global_step=5626.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  63%|██████▎   | 764/1208 [21:10<12:18,  1.66s/it, loss=0.121, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000759, train/loss_step=0.201, global_step=5626.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  63%|██████▎   | 765/1208 [21:11<12:16,  1.66s/it, loss=0.121, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000759, train/loss_step=0.201, global_step=5626.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  63%|██████▎   | 765/1208 [21:11<12:16,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000104, train/loss_step=0.0268, global_step=5627.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  63%|██████▎   | 766/1208 [21:12<12:14,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000104, train/loss_step=0.0268, global_step=5627.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  63%|██████▎   | 766/1208 [21:12<12:14,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000159, train/loss_step=0.0416, global_step=5627.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  63%|██████▎   | 767/1208 [21:13<12:12,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000159, train/loss_step=0.0416, global_step=5627.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  63%|██████▎   | 767/1208 [21:13<12:12,  1.66s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=2.19e-5, train/loss_step=0.00405, global_step=5627.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  64%|██████▎   | 768/1208 [21:16<12:11,  1.66s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=2.19e-5, train/loss_step=0.00405, global_step=5627.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  64%|██████▎   | 768/1208 [21:16<12:11,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.0009, train/loss_step=0.228, global_step=5627.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 18:  64%|██████▎   | 769/1208 [21:17<12:09,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.0009, train/loss_step=0.228, global_step=5627.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  64%|██████▎   | 769/1208 [21:17<12:09,  1.66s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0504, train/loss_vlb_step=0.000171, train/loss_step=0.0504, global_step=5628.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  64%|██████▎   | 770/1208 [21:18<12:07,  1.66s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0504, train/loss_vlb_step=0.000171, train/loss_step=0.0504, global_step=5628.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  64%|██████▎   | 770/1208 [21:18<12:07,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00206, train/loss_step=0.345, global_step=5628.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  64%|██████▍   | 771/1208 [21:19<12:05,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00206, train/loss_step=0.345, global_step=5628.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  64%|██████▍   | 771/1208 [21:19<12:05,  1.66s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000148, train/loss_step=0.0402, global_step=5628.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  64%|██████▍   | 772/1208 [21:22<12:04,  1.66s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000148, train/loss_step=0.0402, global_step=5628.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  64%|██████▍   | 772/1208 [21:22<12:04,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000452, train/loss_step=0.136, global_step=5628.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  64%|██████▍   | 773/1208 [21:23<12:02,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000452, train/loss_step=0.136, global_step=5628.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  64%|██████▍   | 773/1208 [21:23<12:02,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.41e-5, train/loss_step=0.0206, global_step=5629.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  64%|██████▍   | 774/1208 [21:24<11:59,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.41e-5, train/loss_step=0.0206, global_step=5629.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  64%|██████▍   | 774/1208 [21:24<11:59,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000104, train/loss_step=0.0265, global_step=5629.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  64%|██████▍   | 775/1208 [21:25<11:57,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000104, train/loss_step=0.0265, global_step=5629.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  64%|██████▍   | 775/1208 [21:25<11:57,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0094, train/loss_vlb_step=4.62e-5, train/loss_step=0.0094, global_step=5629.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  64%|██████▍   | 776/1208 [21:27<11:56,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0094, train/loss_vlb_step=4.62e-5, train/loss_step=0.0094, global_step=5629.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  64%|██████▍   | 776/1208 [21:27<11:56,  1.66s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000133, train/loss_step=0.0342, global_step=5629.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  64%|██████▍   | 777/1208 [21:28<11:54,  1.66s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000133, train/loss_step=0.0342, global_step=5629.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  64%|██████▍   | 777/1208 [21:28<11:54,  1.66s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0495, train/loss_vlb_step=0.000175, train/loss_step=0.0495, global_step=5630.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  64%|██████▍   | 778/1208 [21:29<11:52,  1.66s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0495, train/loss_vlb_step=0.000175, train/loss_step=0.0495, global_step=5630.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  64%|██████▍   | 778/1208 [21:29<11:52,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00172, train/loss_step=0.335, global_step=5630.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  64%|██████▍   | 779/1208 [21:30<11:50,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00172, train/loss_step=0.335, global_step=5630.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  64%|██████▍   | 779/1208 [21:30<11:50,  1.66s/it, loss=0.109, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000287, train/loss_step=0.087, global_step=5630.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  65%|██████▍   | 780/1208 [21:33<11:49,  1.66s/it, loss=0.109, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000287, train/loss_step=0.087, global_step=5630.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  65%|██████▍   | 780/1208 [21:33<11:49,  1.66s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00955, train/loss_vlb_step=4.51e-5, train/loss_step=0.00955, global_step=5630.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  65%|██████▍   | 781/1208 [21:34<11:47,  1.66s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00955, train/loss_vlb_step=4.51e-5, train/loss_step=0.00955, global_step=5630.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  65%|██████▍   | 781/1208 [21:34<11:47,  1.66s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=9.11e-5, train/loss_step=0.0221, global_step=5631.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  65%|██████▍   | 782/1208 [21:35<11:45,  1.66s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=9.11e-5, train/loss_step=0.0221, global_step=5631.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  65%|██████▍   | 782/1208 [21:35<11:45,  1.66s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=1.31e-5, train/loss_step=0.0024, global_step=5631.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  65%|██████▍   | 783/1208 [21:36<11:43,  1.66s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=1.31e-5, train/loss_step=0.0024, global_step=5631.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  65%|██████▍   | 783/1208 [21:36<11:43,  1.66s/it, loss=0.0844, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.13e-5, train/loss_step=0.0197, global_step=5631.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  65%|██████▍   | 784/1208 [21:39<11:42,  1.66s/it, loss=0.0844, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.13e-5, train/loss_step=0.0197, global_step=5631.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  65%|██████▍   | 784/1208 [21:39<11:42,  1.66s/it, loss=0.0876, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00119, train/loss_step=0.264, global_step=5631.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  65%|██████▍   | 785/1208 [21:40<11:40,  1.66s/it, loss=0.0876, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00119, train/loss_step=0.264, global_step=5631.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  65%|██████▍   | 785/1208 [21:40<11:40,  1.66s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.00391, train/loss_vlb_step=2.07e-5, train/loss_step=0.00391, global_step=5632.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  65%|██████▌   | 786/1208 [21:41<11:38,  1.66s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.00391, train/loss_vlb_step=2.07e-5, train/loss_step=0.00391, global_step=5632.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  65%|██████▌   | 786/1208 [21:41<11:38,  1.66s/it, loss=0.0847, v_num=0, train/loss_simple_step=0.00639, train/loss_vlb_step=3.19e-5, train/loss_step=0.00639, global_step=5632.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  65%|██████▌   | 787/1208 [21:42<11:36,  1.66s/it, loss=0.0847, v_num=0, train/loss_simple_step=0.00639, train/loss_vlb_step=3.19e-5, train/loss_step=0.00639, global_step=5632.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  65%|██████▌   | 787/1208 [21:42<11:36,  1.66s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000525, train/loss_step=0.157, global_step=5632.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  65%|██████▌   | 788/1208 [21:45<11:35,  1.66s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000525, train/loss_step=0.157, global_step=5632.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  65%|██████▌   | 788/1208 [21:45<11:35,  1.66s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.00087, train/loss_step=0.236, global_step=5632.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  65%|██████▌   | 789/1208 [21:46<11:33,  1.66s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.00087, train/loss_step=0.236, global_step=5632.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  65%|██████▌   | 789/1208 [21:46<11:33,  1.66s/it, loss=0.092, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.000136, train/loss_step=0.0356, global_step=5633.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  65%|██████▌   | 790/1208 [21:47<11:31,  1.66s/it, loss=0.092, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.000136, train/loss_step=0.0356, global_step=5633.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  65%|██████▌   | 790/1208 [21:47<11:31,  1.66s/it, loss=0.088, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.0013, train/loss_step=0.264, global_step=5633.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  65%|██████▌   | 791/1208 [21:48<11:29,  1.65s/it, loss=0.088, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.0013, train/loss_step=0.264, global_step=5633.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  65%|██████▌   | 791/1208 [21:48<11:29,  1.65s/it, loss=0.088, v_num=0, train/loss_simple_step=0.0411, train/loss_vlb_step=0.000147, train/loss_step=0.0411, global_step=5633.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  66%|██████▌   | 792/1208 [21:51<11:28,  1.66s/it, loss=0.088, v_num=0, train/loss_simple_step=0.0411, train/loss_vlb_step=0.000147, train/loss_step=0.0411, global_step=5633.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  66%|██████▌   | 792/1208 [21:51<11:28,  1.66s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.82e-5, train/loss_step=0.0184, global_step=5633.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  66%|██████▌   | 793/1208 [21:52<11:26,  1.66s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.82e-5, train/loss_step=0.0184, global_step=5633.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  66%|██████▌   | 793/1208 [21:52<11:26,  1.66s/it, loss=0.0824, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=9.98e-5, train/loss_step=0.0253, global_step=5634.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  66%|██████▌   | 794/1208 [21:53<11:24,  1.65s/it, loss=0.0824, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=9.98e-5, train/loss_step=0.0253, global_step=5634.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  66%|██████▌   | 794/1208 [21:53<11:24,  1.65s/it, loss=0.0814, v_num=0, train/loss_simple_step=0.00664, train/loss_vlb_step=3.29e-5, train/loss_step=0.00664, global_step=5634.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  66%|██████▌   | 795/1208 [21:54<11:22,  1.65s/it, loss=0.0814, v_num=0, train/loss_simple_step=0.00664, train/loss_vlb_step=3.29e-5, train/loss_step=0.00664, global_step=5634.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  66%|██████▌   | 795/1208 [21:54<11:22,  1.65s/it, loss=0.086, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.00033, train/loss_step=0.101, global_step=5634.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 18:  66%|██████▌   | 796/1208 [21:57<11:21,  1.66s/it, loss=0.086, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.00033, train/loss_step=0.101, global_step=5634.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  66%|██████▌   | 796/1208 [21:57<11:21,  1.66s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.0786, train/loss_vlb_step=0.000262, train/loss_step=0.0786, global_step=5634.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  66%|██████▌   | 797/1208 [21:58<11:19,  1.65s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.0786, train/loss_vlb_step=0.000262, train/loss_step=0.0786, global_step=5634.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  66%|██████▌   | 797/1208 [21:58<11:19,  1.65s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.0638, train/loss_vlb_step=0.000213, train/loss_step=0.0638, global_step=5635.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  66%|██████▌   | 798/1208 [21:59<11:17,  1.65s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.0638, train/loss_vlb_step=0.000213, train/loss_step=0.0638, global_step=5635.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  66%|██████▌   | 798/1208 [21:59<11:17,  1.65s/it, loss=0.0727, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.28e-5, train/loss_step=0.0115, global_step=5635.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  66%|██████▌   | 799/1208 [22:00<11:15,  1.65s/it, loss=0.0727, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.28e-5, train/loss_step=0.0115, global_step=5635.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  66%|██████▌   | 799/1208 [22:00<11:15,  1.65s/it, loss=0.0883, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.00303, train/loss_step=0.400, global_step=5635.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  66%|██████▌   | 800/1208 [22:03<11:14,  1.65s/it, loss=0.0883, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.00303, train/loss_step=0.400, global_step=5635.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  66%|██████▌   | 800/1208 [22:03<11:14,  1.65s/it, loss=0.0884, v_num=0, train/loss_simple_step=0.00985, train/loss_vlb_step=4.81e-5, train/loss_step=0.00985, global_step=5635.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  66%|██████▋   | 801/1208 [22:04<11:12,  1.65s/it, loss=0.0884, v_num=0, train/loss_simple_step=0.00985, train/loss_vlb_step=4.81e-5, train/loss_step=0.00985, global_step=5635.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  66%|██████▋   | 801/1208 [22:04<11:12,  1.65s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000754, train/loss_step=0.202, global_step=5636.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  66%|██████▋   | 802/1208 [22:05<11:11,  1.65s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000754, train/loss_step=0.202, global_step=5636.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  66%|██████▋   | 802/1208 [22:05<11:11,  1.65s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.17e-5, train/loss_step=0.00394, global_step=5636.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  66%|██████▋   | 803/1208 [22:06<11:09,  1.65s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.17e-5, train/loss_step=0.00394, global_step=5636.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  66%|██████▋   | 803/1208 [22:06<11:09,  1.65s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.88e-5, train/loss_step=0.00344, global_step=5636.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  67%|██████▋   | 804/1208 [22:09<11:07,  1.65s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.88e-5, train/loss_step=0.00344, global_step=5636.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  67%|██████▋   | 804/1208 [22:09<11:07,  1.65s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.54e-5, train/loss_step=0.00282, global_step=5636.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  67%|██████▋   | 805/1208 [22:10<11:06,  1.65s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.54e-5, train/loss_step=0.00282, global_step=5636.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  67%|██████▋   | 805/1208 [22:10<11:06,  1.65s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00042, train/loss_step=0.128, global_step=5637.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  67%|██████▋   | 806/1208 [22:11<11:04,  1.65s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00042, train/loss_step=0.128, global_step=5637.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  67%|██████▋   | 806/1208 [22:11<11:04,  1.65s/it, loss=0.0901, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.01e-5, train/loss_step=0.014, global_step=5637.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  67%|██████▋   | 807/1208 [22:12<11:02,  1.65s/it, loss=0.0901, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.01e-5, train/loss_step=0.014, global_step=5637.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  67%|██████▋   | 807/1208 [22:12<11:02,  1.65s/it, loss=0.0891, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000478, train/loss_step=0.137, global_step=5637.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  67%|██████▋   | 808/1208 [22:15<11:01,  1.65s/it, loss=0.0891, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000478, train/loss_step=0.137, global_step=5637.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  67%|██████▋   | 808/1208 [22:15<11:01,  1.65s/it, loss=0.0776, v_num=0, train/loss_simple_step=0.00633, train/loss_vlb_step=3.13e-5, train/loss_step=0.00633, global_step=5637.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  67%|██████▋   | 809/1208 [22:16<10:59,  1.65s/it, loss=0.0776, v_num=0, train/loss_simple_step=0.00633, train/loss_vlb_step=3.13e-5, train/loss_step=0.00633, global_step=5637.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  67%|██████▋   | 809/1208 [22:16<10:59,  1.65s/it, loss=0.0791, v_num=0, train/loss_simple_step=0.0649, train/loss_vlb_step=0.000233, train/loss_step=0.0649, global_step=5638.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  67%|██████▋   | 810/1208 [22:17<10:57,  1.65s/it, loss=0.0791, v_num=0, train/loss_simple_step=0.0649, train/loss_vlb_step=0.000233, train/loss_step=0.0649, global_step=5638.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  67%|██████▋   | 810/1208 [22:17<10:57,  1.65s/it, loss=0.0675, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000125, train/loss_step=0.0325, global_step=5638.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  67%|██████▋   | 811/1208 [22:18<10:55,  1.65s/it, loss=0.0675, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000125, train/loss_step=0.0325, global_step=5638.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  67%|██████▋   | 811/1208 [22:18<10:55,  1.65s/it, loss=0.0872, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00312, train/loss_step=0.435, global_step=5638.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  67%|██████▋   | 812/1208 [22:21<10:54,  1.65s/it, loss=0.0872, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00312, train/loss_step=0.435, global_step=5638.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  67%|██████▋   | 812/1208 [22:21<10:54,  1.65s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000248, train/loss_step=0.0732, global_step=5638.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  67%|██████▋   | 813/1208 [22:22<10:52,  1.65s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000248, train/loss_step=0.0732, global_step=5638.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  67%|██████▋   | 813/1208 [22:22<10:52,  1.65s/it, loss=0.091, v_num=0, train/loss_simple_step=0.0466, train/loss_vlb_step=0.000165, train/loss_step=0.0466, global_step=5639.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  67%|██████▋   | 814/1208 [22:23<10:50,  1.65s/it, loss=0.091, v_num=0, train/loss_simple_step=0.0466, train/loss_vlb_step=0.000165, train/loss_step=0.0466, global_step=5639.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  67%|██████▋   | 814/1208 [22:23<10:50,  1.65s/it, loss=0.124, v_num=0, train/loss_simple_step=0.662, train/loss_vlb_step=0.0114, train/loss_step=0.662, global_step=5639.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  67%|██████▋   | 815/1208 [22:24<10:48,  1.65s/it, loss=0.124, v_num=0, train/loss_simple_step=0.662, train/loss_vlb_step=0.0114, train/loss_step=0.662, global_step=5639.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  67%|██████▋   | 815/1208 [22:24<10:48,  1.65s/it, loss=0.135, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00187, train/loss_step=0.326, global_step=5639.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  68%|██████▊   | 816/1208 [22:27<10:47,  1.65s/it, loss=0.135, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00187, train/loss_step=0.326, global_step=5639.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  68%|██████▊   | 816/1208 [22:27<10:47,  1.65s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0431, train/loss_vlb_step=0.000154, train/loss_step=0.0431, global_step=5639.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  68%|██████▊   | 817/1208 [22:28<10:45,  1.65s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0431, train/loss_vlb_step=0.000154, train/loss_step=0.0431, global_step=5639.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  68%|██████▊   | 817/1208 [22:28<10:45,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.13e-5, train/loss_step=0.00191, global_step=5640.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  68%|██████▊   | 818/1208 [22:29<10:43,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.13e-5, train/loss_step=0.00191, global_step=5640.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  68%|██████▊   | 818/1208 [22:29<10:43,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.096, train/loss_vlb_step=0.000316, train/loss_step=0.096, global_step=5640.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  68%|██████▊   | 819/1208 [22:30<10:41,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.096, train/loss_vlb_step=0.000316, train/loss_step=0.096, global_step=5640.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  68%|██████▊   | 819/1208 [22:30<10:41,  1.65s/it, loss=0.125, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000782, train/loss_step=0.215, global_step=5640.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  68%|██████▊   | 820/1208 [22:33<10:40,  1.65s/it, loss=0.125, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000782, train/loss_step=0.215, global_step=5640.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  68%|██████▊   | 820/1208 [22:33<10:40,  1.65s/it, loss=0.142, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.0021, train/loss_step=0.355, global_step=5640.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  68%|██████▊   | 821/1208 [22:34<10:38,  1.65s/it, loss=0.142, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.0021, train/loss_step=0.355, global_step=5640.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  68%|██████▊   | 821/1208 [22:34<10:38,  1.65s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0918, train/loss_vlb_step=0.000302, train/loss_step=0.0918, global_step=5641.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  68%|██████▊   | 822/1208 [22:35<10:36,  1.65s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0918, train/loss_vlb_step=0.000302, train/loss_step=0.0918, global_step=5641.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  68%|██████▊   | 822/1208 [22:35<10:36,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000457, train/loss_step=0.136, global_step=5641.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  68%|██████▊   | 823/1208 [22:36<10:34,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000457, train/loss_step=0.136, global_step=5641.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  68%|██████▊   | 823/1208 [22:36<10:34,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=4.98e-5, train/loss_step=0.0117, global_step=5641.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  68%|██████▊   | 824/1208 [22:38<10:33,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=4.98e-5, train/loss_step=0.0117, global_step=5641.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  68%|██████▊   | 824/1208 [22:38<10:33,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00456, train/loss_vlb_step=2.43e-5, train/loss_step=0.00456, global_step=5641.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  68%|██████▊   | 825/1208 [22:39<10:31,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00456, train/loss_vlb_step=2.43e-5, train/loss_step=0.00456, global_step=5641.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  68%|██████▊   | 825/1208 [22:39<10:31,  1.65s/it, loss=0.15, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.00101, train/loss_step=0.246, global_step=5642.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 18:  68%|██████▊   | 826/1208 [22:40<10:29,  1.65s/it, loss=0.15, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.00101, train/loss_step=0.246, global_step=5642.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  68%|██████▊   | 826/1208 [22:40<10:29,  1.65s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.64e-5, train/loss_step=0.0102, global_step=5642.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  68%|██████▊   | 827/1208 [22:41<10:27,  1.65s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.64e-5, train/loss_step=0.0102, global_step=5642.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  68%|██████▊   | 827/1208 [22:41<10:27,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000656, train/loss_step=0.188, global_step=5642.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  69%|██████▊   | 828/1208 [22:45<10:26,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000656, train/loss_step=0.188, global_step=5642.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  69%|██████▊   | 828/1208 [22:45<10:26,  1.65s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.25e-5, train/loss_step=0.0167, global_step=5642.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  69%|██████▊   | 829/1208 [22:46<10:24,  1.65s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.25e-5, train/loss_step=0.0167, global_step=5642.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  69%|██████▊   | 829/1208 [22:46<10:24,  1.65s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0703, train/loss_vlb_step=0.00024, train/loss_step=0.0703, global_step=5643.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  69%|██████▊   | 830/1208 [22:47<10:22,  1.65s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0703, train/loss_vlb_step=0.00024, train/loss_step=0.0703, global_step=5643.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  69%|██████▊   | 830/1208 [22:47<10:22,  1.65s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0667, train/loss_vlb_step=0.000231, train/loss_step=0.0667, global_step=5643.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  69%|██████▉   | 831/1208 [22:48<10:20,  1.65s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0667, train/loss_vlb_step=0.000231, train/loss_step=0.0667, global_step=5643.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  69%|██████▉   | 831/1208 [22:48<10:20,  1.65s/it, loss=0.142, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000711, train/loss_step=0.188, global_step=5643.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  69%|██████▉   | 832/1208 [22:51<10:19,  1.65s/it, loss=0.142, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000711, train/loss_step=0.188, global_step=5643.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  69%|██████▉   | 832/1208 [22:51<10:19,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00237, train/loss_vlb_step=1.41e-5, train/loss_step=0.00237, global_step=5643.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  69%|██████▉   | 833/1208 [22:52<10:17,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00237, train/loss_vlb_step=1.41e-5, train/loss_step=0.00237, global_step=5643.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  69%|██████▉   | 833/1208 [22:52<10:17,  1.65s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.34e-5, train/loss_step=0.0152, global_step=5644.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  69%|██████▉   | 834/1208 [22:53<10:16,  1.65s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.34e-5, train/loss_step=0.0152, global_step=5644.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  69%|██████▉   | 834/1208 [22:53<10:16,  1.65s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00725, train/loss_vlb_step=3.6e-5, train/loss_step=0.00725, global_step=5644.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  69%|██████▉   | 835/1208 [22:54<10:14,  1.65s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00725, train/loss_vlb_step=3.6e-5, train/loss_step=0.00725, global_step=5644.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  69%|██████▉   | 835/1208 [22:54<10:14,  1.65s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000137, train/loss_step=0.0372, global_step=5644.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  69%|██████▉   | 836/1208 [22:57<10:13,  1.65s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000137, train/loss_step=0.0372, global_step=5644.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  69%|██████▉   | 836/1208 [22:57<10:13,  1.65s/it, loss=0.0903, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.000165, train/loss_step=0.0459, global_step=5644.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  69%|██████▉   | 837/1208 [22:58<10:11,  1.65s/it, loss=0.0903, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.000165, train/loss_step=0.0459, global_step=5644.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  69%|██████▉   | 837/1208 [22:58<10:11,  1.65s/it, loss=0.105, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00136, train/loss_step=0.286, global_step=5645.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  69%|██████▉   | 838/1208 [23:00<10:09,  1.65s/it, loss=0.105, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00136, train/loss_step=0.286, global_step=5645.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  69%|██████▉   | 838/1208 [23:00<10:09,  1.65s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.81e-5, train/loss_step=0.0105, global_step=5645.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  69%|██████▉   | 839/1208 [23:01<10:07,  1.65s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.81e-5, train/loss_step=0.0105, global_step=5645.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  69%|██████▉   | 839/1208 [23:01<10:07,  1.65s/it, loss=0.0904, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.69e-5, train/loss_step=0.0178, global_step=5645.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  70%|██████▉   | 840/1208 [23:04<10:06,  1.65s/it, loss=0.0904, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.69e-5, train/loss_step=0.0178, global_step=5645.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  70%|██████▉   | 840/1208 [23:04<10:06,  1.65s/it, loss=0.0959, v_num=0, train/loss_simple_step=0.466, train/loss_vlb_step=0.00644, train/loss_step=0.466, global_step=5645.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  70%|██████▉   | 841/1208 [23:05<10:04,  1.65s/it, loss=0.0959, v_num=0, train/loss_simple_step=0.466, train/loss_vlb_step=0.00644, train/loss_step=0.466, global_step=5645.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  70%|██████▉   | 841/1208 [23:05<10:04,  1.65s/it, loss=0.102, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000859, train/loss_step=0.221, global_step=5646.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  70%|██████▉   | 842/1208 [23:06<10:02,  1.65s/it, loss=0.102, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000859, train/loss_step=0.221, global_step=5646.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  70%|██████▉   | 842/1208 [23:06<10:02,  1.65s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=1.31e-5, train/loss_step=0.0023, global_step=5646.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  70%|██████▉   | 843/1208 [23:07<10:00,  1.65s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=1.31e-5, train/loss_step=0.0023, global_step=5646.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  70%|██████▉   | 843/1208 [23:07<10:00,  1.65s/it, loss=0.104, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000632, train/loss_step=0.177, global_step=5646.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  70%|██████▉   | 844/1208 [23:10<09:59,  1.65s/it, loss=0.104, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000632, train/loss_step=0.177, global_step=5646.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  70%|██████▉   | 844/1208 [23:10<09:59,  1.65s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.000294, train/loss_step=0.0894, global_step=5646.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  70%|██████▉   | 845/1208 [23:11<09:57,  1.65s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.000294, train/loss_step=0.0894, global_step=5646.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  70%|██████▉   | 845/1208 [23:11<09:57,  1.65s/it, loss=0.096, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.58e-5, train/loss_step=0.00284, global_step=5647.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  70%|███████   | 846/1208 [23:12<09:55,  1.65s/it, loss=0.096, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.58e-5, train/loss_step=0.00284, global_step=5647.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  70%|███████   | 846/1208 [23:12<09:55,  1.65s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000149, train/loss_step=0.0407, global_step=5647.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  70%|███████   | 847/1208 [23:13<09:54,  1.65s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000149, train/loss_step=0.0407, global_step=5647.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  70%|███████   | 847/1208 [23:13<09:54,  1.65s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.0404, train/loss_vlb_step=0.000149, train/loss_step=0.0404, global_step=5647.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  70%|███████   | 848/1208 [23:17<09:53,  1.65s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.0404, train/loss_vlb_step=0.000149, train/loss_step=0.0404, global_step=5647.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  70%|███████   | 848/1208 [23:17<09:53,  1.65s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.09e-5, train/loss_step=0.011, global_step=5647.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  70%|███████   | 849/1208 [23:18<09:51,  1.65s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.09e-5, train/loss_step=0.011, global_step=5647.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  70%|███████   | 849/1208 [23:18<09:51,  1.65s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.25e-5, train/loss_step=0.0137, global_step=5648.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  70%|███████   | 850/1208 [23:19<09:49,  1.65s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.25e-5, train/loss_step=0.0137, global_step=5648.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  70%|███████   | 850/1208 [23:19<09:49,  1.65s/it, loss=0.0841, v_num=0, train/loss_simple_step=0.00606, train/loss_vlb_step=3e-5, train/loss_step=0.00606, global_step=5648.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  70%|███████   | 851/1208 [23:20<09:47,  1.65s/it, loss=0.0841, v_num=0, train/loss_simple_step=0.00606, train/loss_vlb_step=3e-5, train/loss_step=0.00606, global_step=5648.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  70%|███████   | 851/1208 [23:20<09:47,  1.65s/it, loss=0.0775, v_num=0, train/loss_simple_step=0.057, train/loss_vlb_step=0.000205, train/loss_step=0.057, global_step=5648.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  71%|███████   | 852/1208 [23:23<09:46,  1.65s/it, loss=0.0775, v_num=0, train/loss_simple_step=0.057, train/loss_vlb_step=0.000205, train/loss_step=0.057, global_step=5648.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  71%|███████   | 852/1208 [23:23<09:46,  1.65s/it, loss=0.0779, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.95e-5, train/loss_step=0.0108, global_step=5648.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  71%|███████   | 853/1208 [23:24<09:44,  1.65s/it, loss=0.0779, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.95e-5, train/loss_step=0.0108, global_step=5648.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  71%|███████   | 853/1208 [23:24<09:44,  1.65s/it, loss=0.0808, v_num=0, train/loss_simple_step=0.0723, train/loss_vlb_step=0.000243, train/loss_step=0.0723, global_step=5649.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  71%|███████   | 854/1208 [23:25<09:42,  1.65s/it, loss=0.0808, v_num=0, train/loss_simple_step=0.0723, train/loss_vlb_step=0.000243, train/loss_step=0.0723, global_step=5649.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  71%|███████   | 854/1208 [23:25<09:42,  1.65s/it, loss=0.0814, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.75e-5, train/loss_step=0.021, global_step=5649.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  71%|███████   | 855/1208 [23:26<09:40,  1.65s/it, loss=0.0814, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.75e-5, train/loss_step=0.021, global_step=5649.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  71%|███████   | 855/1208 [23:26<09:40,  1.65s/it, loss=0.0855, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000388, train/loss_step=0.118, global_step=5649.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  71%|███████   | 856/1208 [23:29<09:39,  1.65s/it, loss=0.0855, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000388, train/loss_step=0.118, global_step=5649.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  71%|███████   | 856/1208 [23:29<09:39,  1.65s/it, loss=0.0834, v_num=0, train/loss_simple_step=0.00418, train/loss_vlb_step=2.29e-5, train/loss_step=0.00418, global_step=5649.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  71%|███████   | 857/1208 [23:30<09:37,  1.65s/it, loss=0.0834, v_num=0, train/loss_simple_step=0.00418, train/loss_vlb_step=2.29e-5, train/loss_step=0.00418, global_step=5649.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  71%|███████   | 857/1208 [23:30<09:37,  1.65s/it, loss=0.0805, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000915, train/loss_step=0.228, global_step=5650.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  71%|███████   | 858/1208 [23:31<09:35,  1.65s/it, loss=0.0805, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000915, train/loss_step=0.228, global_step=5650.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  71%|███████   | 858/1208 [23:31<09:35,  1.65s/it, loss=0.0823, v_num=0, train/loss_simple_step=0.0467, train/loss_vlb_step=0.000169, train/loss_step=0.0467, global_step=5650.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  71%|███████   | 859/1208 [23:32<09:34,  1.64s/it, loss=0.0823, v_num=0, train/loss_simple_step=0.0467, train/loss_vlb_step=0.000169, train/loss_step=0.0467, global_step=5650.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  71%|███████   | 859/1208 [23:32<09:34,  1.64s/it, loss=0.101, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00258, train/loss_step=0.397, global_step=5650.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  71%|███████   | 860/1208 [23:36<09:33,  1.65s/it, loss=0.101, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00258, train/loss_step=0.397, global_step=5650.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  71%|███████   | 860/1208 [23:36<09:33,  1.65s/it, loss=0.0812, v_num=0, train/loss_simple_step=0.0642, train/loss_vlb_step=0.000219, train/loss_step=0.0642, global_step=5650.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  71%|███████▏  | 861/1208 [23:37<09:31,  1.65s/it, loss=0.0812, v_num=0, train/loss_simple_step=0.0642, train/loss_vlb_step=0.000219, train/loss_step=0.0642, global_step=5650.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  71%|███████▏  | 861/1208 [23:37<09:31,  1.65s/it, loss=0.0736, v_num=0, train/loss_simple_step=0.0692, train/loss_vlb_step=0.00024, train/loss_step=0.0692, global_step=5651.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  71%|███████▏  | 862/1208 [23:38<09:29,  1.65s/it, loss=0.0736, v_num=0, train/loss_simple_step=0.0692, train/loss_vlb_step=0.00024, train/loss_step=0.0692, global_step=5651.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  71%|███████▏  | 862/1208 [23:38<09:29,  1.65s/it, loss=0.0737, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=1.49e-5, train/loss_step=0.00259, global_step=5651.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  71%|███████▏  | 863/1208 [23:39<09:27,  1.64s/it, loss=0.0737, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=1.49e-5, train/loss_step=0.00259, global_step=5651.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  71%|███████▏  | 863/1208 [23:39<09:27,  1.64s/it, loss=0.065, v_num=0, train/loss_simple_step=0.00343, train/loss_vlb_step=1.84e-5, train/loss_step=0.00343, global_step=5651.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  72%|███████▏  | 864/1208 [23:42<09:26,  1.65s/it, loss=0.065, v_num=0, train/loss_simple_step=0.00343, train/loss_vlb_step=1.84e-5, train/loss_step=0.00343, global_step=5651.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  72%|███████▏  | 864/1208 [23:42<09:26,  1.65s/it, loss=0.0619, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000112, train/loss_step=0.0286, global_step=5651.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  72%|███████▏  | 865/1208 [23:43<09:24,  1.65s/it, loss=0.0619, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000112, train/loss_step=0.0286, global_step=5651.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  72%|███████▏  | 865/1208 [23:43<09:24,  1.65s/it, loss=0.062, v_num=0, train/loss_simple_step=0.00459, train/loss_vlb_step=2.36e-5, train/loss_step=0.00459, global_step=5652.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  72%|███████▏  | 866/1208 [23:44<09:22,  1.65s/it, loss=0.062, v_num=0, train/loss_simple_step=0.00459, train/loss_vlb_step=2.36e-5, train/loss_step=0.00459, global_step=5652.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  72%|███████▏  | 866/1208 [23:44<09:22,  1.65s/it, loss=0.0605, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.26e-5, train/loss_step=0.0108, global_step=5652.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  72%|███████▏  | 867/1208 [23:45<09:20,  1.64s/it, loss=0.0605, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.26e-5, train/loss_step=0.0108, global_step=5652.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  72%|███████▏  | 867/1208 [23:45<09:20,  1.64s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.629, train/loss_vlb_step=0.0325, train/loss_step=0.629, global_step=5652.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  72%|███████▏  | 868/1208 [23:48<09:19,  1.65s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.629, train/loss_vlb_step=0.0325, train/loss_step=0.629, global_step=5652.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  72%|███████▏  | 868/1208 [23:48<09:19,  1.65s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000451, train/loss_step=0.137, global_step=5652.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  72%|███████▏  | 869/1208 [23:50<09:17,  1.65s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000451, train/loss_step=0.137, global_step=5652.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  72%|███████▏  | 869/1208 [23:50<09:17,  1.65s/it, loss=0.103, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000516, train/loss_step=0.150, global_step=5653.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  72%|███████▏  | 870/1208 [23:51<09:15,  1.64s/it, loss=0.103, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000516, train/loss_step=0.150, global_step=5653.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  72%|███████▏  | 870/1208 [23:51<09:15,  1.64s/it, loss=0.116, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00122, train/loss_step=0.264, global_step=5653.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  72%|███████▏  | 871/1208 [23:52<09:14,  1.64s/it, loss=0.116, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00122, train/loss_step=0.264, global_step=5653.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  72%|███████▏  | 871/1208 [23:52<09:14,  1.64s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.46e-5, train/loss_step=0.0214, global_step=5653.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  72%|███████▏  | 872/1208 [23:55<09:13,  1.65s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.46e-5, train/loss_step=0.0214, global_step=5653.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  72%|███████▏  | 872/1208 [23:55<09:13,  1.65s/it, loss=0.123, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000647, train/loss_step=0.187, global_step=5653.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  72%|███████▏  | 873/1208 [23:56<09:11,  1.65s/it, loss=0.123, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000647, train/loss_step=0.187, global_step=5653.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  72%|███████▏  | 873/1208 [23:56<09:11,  1.65s/it, loss=0.123, v_num=0, train/loss_simple_step=0.082, train/loss_vlb_step=0.000275, train/loss_step=0.082, global_step=5654.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  72%|███████▏  | 874/1208 [23:57<09:09,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.082, train/loss_vlb_step=0.000275, train/loss_step=0.082, global_step=5654.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  72%|███████▏  | 874/1208 [23:57<09:09,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00564, train/loss_vlb_step=2.95e-5, train/loss_step=0.00564, global_step=5654.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  72%|███████▏  | 875/1208 [23:58<09:07,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00564, train/loss_vlb_step=2.95e-5, train/loss_step=0.00564, global_step=5654.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  72%|███████▏  | 875/1208 [23:58<09:07,  1.64s/it, loss=0.135, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.0021, train/loss_step=0.357, global_step=5654.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 18:  73%|███████▎  | 876/1208 [24:01<09:06,  1.65s/it, loss=0.135, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.0021, train/loss_step=0.357, global_step=5654.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  73%|███████▎  | 876/1208 [24:01<09:06,  1.65s/it, loss=0.143, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000565, train/loss_step=0.168, global_step=5654.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  73%|███████▎  | 877/1208 [24:02<09:04,  1.65s/it, loss=0.143, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000565, train/loss_step=0.168, global_step=5654.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  73%|███████▎  | 877/1208 [24:02<09:04,  1.65s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=1.4e-5, train/loss_step=0.00242, global_step=5655.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  73%|███████▎  | 878/1208 [24:03<09:02,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=1.4e-5, train/loss_step=0.00242, global_step=5655.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  73%|███████▎  | 878/1208 [24:03<09:02,  1.64s/it, loss=0.142, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00118, train/loss_step=0.249, global_step=5655.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  73%|███████▎  | 879/1208 [24:04<09:00,  1.64s/it, loss=0.142, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00118, train/loss_step=0.249, global_step=5655.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  73%|███████▎  | 879/1208 [24:04<09:00,  1.64s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.98e-5, train/loss_step=0.0132, global_step=5655.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  73%|███████▎  | 880/1208 [24:08<08:59,  1.65s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.98e-5, train/loss_step=0.0132, global_step=5655.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  73%|███████▎  | 880/1208 [24:08<08:59,  1.65s/it, loss=0.141, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00269, train/loss_step=0.435, global_step=5655.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  73%|███████▎  | 881/1208 [24:09<08:57,  1.64s/it, loss=0.141, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00269, train/loss_step=0.435, global_step=5655.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  73%|███████▎  | 881/1208 [24:09<08:57,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.000157, train/loss_step=0.0417, global_step=5656.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  73%|███████▎  | 882/1208 [24:10<08:56,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.000157, train/loss_step=0.0417, global_step=5656.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  73%|███████▎  | 882/1208 [24:10<08:56,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=2.24e-5, train/loss_step=0.00416, global_step=5656.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  73%|███████▎  | 883/1208 [24:11<08:54,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=2.24e-5, train/loss_step=0.00416, global_step=5656.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  73%|███████▎  | 883/1208 [24:11<08:54,  1.64s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000107, train/loss_step=0.0278, global_step=5656.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  73%|███████▎  | 884/1208 [24:14<08:53,  1.65s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000107, train/loss_step=0.0278, global_step=5656.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  73%|███████▎  | 884/1208 [24:14<08:53,  1.65s/it, loss=0.154, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00129, train/loss_step=0.280, global_step=5656.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  73%|███████▎  | 885/1208 [24:15<08:51,  1.64s/it, loss=0.154, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00129, train/loss_step=0.280, global_step=5656.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  73%|███████▎  | 885/1208 [24:15<08:51,  1.64s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0982, train/loss_vlb_step=0.000324, train/loss_step=0.0982, global_step=5657.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  73%|███████▎  | 886/1208 [24:16<08:49,  1.64s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0982, train/loss_vlb_step=0.000324, train/loss_step=0.0982, global_step=5657.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  73%|███████▎  | 886/1208 [24:16<08:49,  1.64s/it, loss=0.168, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000876, train/loss_step=0.214, global_step=5657.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  73%|███████▎  | 887/1208 [24:17<08:47,  1.64s/it, loss=0.168, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000876, train/loss_step=0.214, global_step=5657.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  73%|███████▎  | 887/1208 [24:17<08:47,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.000161, train/loss_step=0.0456, global_step=5657.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  74%|███████▎  | 888/1208 [24:20<08:46,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.000161, train/loss_step=0.0456, global_step=5657.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  74%|███████▎  | 888/1208 [24:20<08:46,  1.65s/it, loss=0.14, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000543, train/loss_step=0.162, global_step=5657.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  74%|███████▎  | 889/1208 [24:21<08:44,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000543, train/loss_step=0.162, global_step=5657.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  74%|███████▎  | 889/1208 [24:21<08:44,  1.64s/it, loss=0.134, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=7.07e-5, train/loss_step=0.016, global_step=5658.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  74%|███████▎  | 890/1208 [24:22<08:42,  1.64s/it, loss=0.134, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=7.07e-5, train/loss_step=0.016, global_step=5658.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  74%|███████▎  | 890/1208 [24:22<08:42,  1.64s/it, loss=0.136, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.0019, train/loss_step=0.315, global_step=5658.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  74%|███████▍  | 891/1208 [24:23<08:40,  1.64s/it, loss=0.136, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.0019, train/loss_step=0.315, global_step=5658.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  74%|███████▍  | 891/1208 [24:23<08:40,  1.64s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=1.7e-5, train/loss_step=0.00298, global_step=5658.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  74%|███████▍  | 892/1208 [24:27<08:39,  1.64s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=1.7e-5, train/loss_step=0.00298, global_step=5658.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  74%|███████▍  | 892/1208 [24:27<08:39,  1.64s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.77e-5, train/loss_step=0.00324, global_step=5658.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  74%|███████▍  | 893/1208 [24:28<08:37,  1.64s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.77e-5, train/loss_step=0.00324, global_step=5658.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  74%|███████▍  | 893/1208 [24:28<08:37,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=9.86e-5, train/loss_step=0.0257, global_step=5659.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  74%|███████▍  | 894/1208 [24:29<08:36,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=9.86e-5, train/loss_step=0.0257, global_step=5659.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  74%|███████▍  | 894/1208 [24:29<08:36,  1.64s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0961, train/loss_vlb_step=0.000316, train/loss_step=0.0961, global_step=5659.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  74%|███████▍  | 895/1208 [24:30<08:34,  1.64s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0961, train/loss_vlb_step=0.000316, train/loss_step=0.0961, global_step=5659.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  74%|███████▍  | 895/1208 [24:30<08:34,  1.64s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0636, train/loss_vlb_step=0.000216, train/loss_step=0.0636, global_step=5659.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  74%|███████▍  | 896/1208 [24:33<08:33,  1.64s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0636, train/loss_vlb_step=0.000216, train/loss_step=0.0636, global_step=5659.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  74%|███████▍  | 896/1208 [24:33<08:33,  1.64s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00287, train/loss_vlb_step=1.64e-5, train/loss_step=0.00287, global_step=5659.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  74%|███████▍  | 897/1208 [24:34<08:31,  1.64s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00287, train/loss_vlb_step=1.64e-5, train/loss_step=0.00287, global_step=5659.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  74%|███████▍  | 897/1208 [24:34<08:31,  1.64s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=3.2e-5, train/loss_step=0.00611, global_step=5660.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  74%|███████▍  | 898/1208 [24:35<08:29,  1.64s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=3.2e-5, train/loss_step=0.00611, global_step=5660.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  74%|███████▍  | 898/1208 [24:35<08:29,  1.64s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.27e-5, train/loss_step=0.0198, global_step=5660.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  74%|███████▍  | 899/1208 [24:36<08:27,  1.64s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.27e-5, train/loss_step=0.0198, global_step=5660.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  74%|███████▍  | 899/1208 [24:36<08:27,  1.64s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.0658, train/loss_vlb_step=0.000228, train/loss_step=0.0658, global_step=5660.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  75%|███████▍  | 900/1208 [24:39<08:26,  1.64s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.0658, train/loss_vlb_step=0.000228, train/loss_step=0.0658, global_step=5660.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  75%|███████▍  | 900/1208 [24:39<08:26,  1.64s/it, loss=0.0832, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000632, train/loss_step=0.174, global_step=5660.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.85it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.84it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.84it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.77it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.83it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.83it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.83it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.83it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.76it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.79it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.81it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.83it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 18:  75%|███████▍  | 901/1208 [25:10<08:34,  1.68s/it, loss=0.0832, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000632, train/loss_step=0.174, global_step=5660.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  75%|███████▍  | 901/1208 [25:10<08:34,  1.68s/it, loss=0.0813, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=1.98e-5, train/loss_step=0.00363, global_step=5661.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  75%|███████▍  | 902/1208 [25:11<08:32,  1.68s/it, loss=0.0813, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=1.98e-5, train/loss_step=0.00363, global_step=5661.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  75%|███████▍  | 902/1208 [25:11<08:32,  1.68s/it, loss=0.0813, v_num=0, train/loss_simple_step=0.00275, train/loss_vlb_step=1.57e-5, train/loss_step=0.00275, global_step=5661.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  75%|███████▍  | 903/1208 [25:12<08:30,  1.67s/it, loss=0.0813, v_num=0, train/loss_simple_step=0.00275, train/loss_vlb_step=1.57e-5, train/loss_step=0.00275, global_step=5661.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  75%|███████▍  | 903/1208 [25:12<08:30,  1.67s/it, loss=0.0799, v_num=0, train/loss_simple_step=0.000961, train/loss_vlb_step=5.86e-6, train/loss_step=0.000961, global_step=5661.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  75%|███████▍  | 904/1208 [25:15<08:29,  1.68s/it, loss=0.0799, v_num=0, train/loss_simple_step=0.000961, train/loss_vlb_step=5.86e-6, train/loss_step=0.000961, global_step=5661.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  75%|███████▍  | 904/1208 [25:15<08:29,  1.68s/it, loss=0.0674, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000113, train/loss_step=0.0296, global_step=5661.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  75%|███████▍  | 905/1208 [25:16<08:27,  1.68s/it, loss=0.0674, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000113, train/loss_step=0.0296, global_step=5661.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  75%|███████▍  | 905/1208 [25:16<08:27,  1.68s/it, loss=0.0744, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000946, train/loss_step=0.239, global_step=5662.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  75%|███████▌  | 906/1208 [25:17<08:25,  1.68s/it, loss=0.0744, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000946, train/loss_step=0.239, global_step=5662.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  75%|███████▌  | 906/1208 [25:17<08:25,  1.68s/it, loss=0.0797, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00157, train/loss_step=0.320, global_step=5662.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  75%|███████▌  | 907/1208 [25:18<08:24,  1.67s/it, loss=0.0797, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00157, train/loss_step=0.320, global_step=5662.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  75%|███████▌  | 907/1208 [25:18<08:24,  1.67s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00139, train/loss_step=0.316, global_step=5662.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  75%|███████▌  | 908/1208 [25:22<08:22,  1.68s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00139, train/loss_step=0.316, global_step=5662.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  75%|███████▌  | 908/1208 [25:22<08:22,  1.68s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00137, train/loss_step=0.267, global_step=5662.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  75%|███████▌  | 909/1208 [25:23<08:20,  1.68s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00137, train/loss_step=0.267, global_step=5662.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  75%|███████▌  | 909/1208 [25:23<08:20,  1.68s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=2.41e-5, train/loss_step=0.00462, global_step=5663.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  75%|███████▌  | 910/1208 [25:24<08:19,  1.67s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=2.41e-5, train/loss_step=0.00462, global_step=5663.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  75%|███████▌  | 910/1208 [25:24<08:19,  1.67s/it, loss=0.09, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000527, train/loss_step=0.158, global_step=5663.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]     Epoch 18:  75%|███████▌  | 911/1208 [25:25<08:17,  1.67s/it, loss=0.09, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000527, train/loss_step=0.158, global_step=5663.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  75%|███████▌  | 911/1208 [25:25<08:17,  1.67s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=5663.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  75%|███████▌  | 912/1208 [25:28<08:16,  1.68s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=5663.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  75%|███████▌  | 912/1208 [25:28<08:16,  1.68s/it, loss=0.11, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.0016, train/loss_step=0.285, global_step=5663.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  76%|███████▌  | 913/1208 [25:29<08:14,  1.68s/it, loss=0.11, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.0016, train/loss_step=0.285, global_step=5663.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  76%|███████▌  | 913/1208 [25:29<08:14,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00372, train/loss_step=0.409, global_step=5664.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  76%|███████▌  | 914/1208 [25:30<08:12,  1.67s/it, loss=0.129, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00372, train/loss_step=0.409, global_step=5664.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  76%|███████▌  | 914/1208 [25:30<08:12,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.511, train/loss_vlb_step=0.00739, train/loss_step=0.511, global_step=5664.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  76%|███████▌  | 915/1208 [25:31<08:10,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.511, train/loss_vlb_step=0.00739, train/loss_step=0.511, global_step=5664.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  76%|███████▌  | 915/1208 [25:31<08:10,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.575, train/loss_vlb_step=0.00693, train/loss_step=0.575, global_step=5664.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  76%|███████▌  | 916/1208 [25:34<08:09,  1.68s/it, loss=0.175, v_num=0, train/loss_simple_step=0.575, train/loss_vlb_step=0.00693, train/loss_step=0.575, global_step=5664.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  76%|███████▌  | 916/1208 [25:34<08:09,  1.68s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=1.12e-5, train/loss_step=0.00187, global_step=5664.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  76%|███████▌  | 917/1208 [25:35<08:07,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=1.12e-5, train/loss_step=0.00187, global_step=5664.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  76%|███████▌  | 917/1208 [25:35<08:07,  1.67s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0897, train/loss_vlb_step=0.000298, train/loss_step=0.0897, global_step=5665.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  76%|███████▌  | 918/1208 [25:36<08:05,  1.67s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0897, train/loss_vlb_step=0.000298, train/loss_step=0.0897, global_step=5665.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  76%|███████▌  | 918/1208 [25:36<08:05,  1.67s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00547, train/loss_vlb_step=2.82e-5, train/loss_step=0.00547, global_step=5665.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  76%|███████▌  | 919/1208 [25:37<08:03,  1.67s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00547, train/loss_vlb_step=2.82e-5, train/loss_step=0.00547, global_step=5665.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  76%|███████▌  | 919/1208 [25:37<08:03,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.65e-5, train/loss_step=0.003, global_step=5665.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  76%|███████▌  | 920/1208 [25:41<08:02,  1.68s/it, loss=0.175, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.65e-5, train/loss_step=0.003, global_step=5665.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  76%|███████▌  | 920/1208 [25:41<08:02,  1.68s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=2.15e-5, train/loss_step=0.00402, global_step=5665.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  76%|███████▌  | 921/1208 [25:42<08:00,  1.67s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=2.15e-5, train/loss_step=0.00402, global_step=5665.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  76%|███████▌  | 921/1208 [25:42<08:00,  1.67s/it, loss=0.177, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000756, train/loss_step=0.209, global_step=5666.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  76%|███████▋  | 922/1208 [25:43<07:58,  1.67s/it, loss=0.177, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000756, train/loss_step=0.209, global_step=5666.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  76%|███████▋  | 922/1208 [25:43<07:58,  1.67s/it, loss=0.196, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00304, train/loss_step=0.386, global_step=5666.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  76%|███████▋  | 923/1208 [25:44<07:56,  1.67s/it, loss=0.196, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00304, train/loss_step=0.386, global_step=5666.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  76%|███████▋  | 923/1208 [25:44<07:56,  1.67s/it, loss=0.22, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00585, train/loss_step=0.476, global_step=5666.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  76%|███████▋  | 924/1208 [25:47<07:55,  1.67s/it, loss=0.22, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00585, train/loss_step=0.476, global_step=5666.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  76%|███████▋  | 924/1208 [25:47<07:55,  1.67s/it, loss=0.238, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00279, train/loss_step=0.391, global_step=5666.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  77%|███████▋  | 925/1208 [25:48<07:53,  1.67s/it, loss=0.238, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00279, train/loss_step=0.391, global_step=5666.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  77%|███████▋  | 925/1208 [25:48<07:53,  1.67s/it, loss=0.24, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00126, train/loss_step=0.273, global_step=5667.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  77%|███████▋  | 926/1208 [25:49<07:51,  1.67s/it, loss=0.24, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00126, train/loss_step=0.273, global_step=5667.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  77%|███████▋  | 926/1208 [25:49<07:51,  1.67s/it, loss=0.228, v_num=0, train/loss_simple_step=0.083, train/loss_vlb_step=0.000277, train/loss_step=0.083, global_step=5667.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  77%|███████▋  | 927/1208 [25:50<07:50,  1.67s/it, loss=0.228, v_num=0, train/loss_simple_step=0.083, train/loss_vlb_step=0.000277, train/loss_step=0.083, global_step=5667.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  77%|███████▋  | 927/1208 [25:50<07:50,  1.67s/it, loss=0.213, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.64e-5, train/loss_step=0.0213, global_step=5667.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  77%|███████▋  | 928/1208 [25:53<07:48,  1.67s/it, loss=0.213, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.64e-5, train/loss_step=0.0213, global_step=5667.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  77%|███████▋  | 928/1208 [25:53<07:48,  1.67s/it, loss=0.215, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00145, train/loss_step=0.300, global_step=5667.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  77%|███████▋  | 929/1208 [25:54<07:47,  1.67s/it, loss=0.215, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00145, train/loss_step=0.300, global_step=5667.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  77%|███████▋  | 929/1208 [25:54<07:47,  1.67s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0547, train/loss_vlb_step=0.00019, train/loss_step=0.0547, global_step=5668.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  77%|███████▋  | 930/1208 [25:56<07:45,  1.67s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0547, train/loss_vlb_step=0.00019, train/loss_step=0.0547, global_step=5668.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  77%|███████▋  | 930/1208 [25:56<07:45,  1.67s/it, loss=0.25, v_num=0, train/loss_simple_step=0.808, train/loss_vlb_step=0.0824, train/loss_step=0.808, global_step=5668.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  77%|███████▋  | 931/1208 [25:57<07:43,  1.67s/it, loss=0.25, v_num=0, train/loss_simple_step=0.808, train/loss_vlb_step=0.0824, train/loss_step=0.808, global_step=5668.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  77%|███████▋  | 931/1208 [25:57<07:43,  1.67s/it, loss=0.255, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000811, train/loss_step=0.218, global_step=5668.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  77%|███████▋  | 932/1208 [26:00<07:42,  1.67s/it, loss=0.255, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000811, train/loss_step=0.218, global_step=5668.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  77%|███████▋  | 932/1208 [26:00<07:42,  1.67s/it, loss=0.244, v_num=0, train/loss_simple_step=0.0551, train/loss_vlb_step=0.000191, train/loss_step=0.0551, global_step=5668.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  77%|███████▋  | 933/1208 [26:01<07:40,  1.67s/it, loss=0.244, v_num=0, train/loss_simple_step=0.0551, train/loss_vlb_step=0.000191, train/loss_step=0.0551, global_step=5668.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  77%|███████▋  | 933/1208 [26:01<07:40,  1.67s/it, loss=0.227, v_num=0, train/loss_simple_step=0.0647, train/loss_vlb_step=0.00022, train/loss_step=0.0647, global_step=5669.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  77%|███████▋  | 934/1208 [26:02<07:38,  1.67s/it, loss=0.227, v_num=0, train/loss_simple_step=0.0647, train/loss_vlb_step=0.00022, train/loss_step=0.0647, global_step=5669.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  77%|███████▋  | 934/1208 [26:02<07:38,  1.67s/it, loss=0.21, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.00064, train/loss_step=0.176, global_step=5669.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  77%|███████▋  | 935/1208 [26:03<07:36,  1.67s/it, loss=0.21, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.00064, train/loss_step=0.176, global_step=5669.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  77%|███████▋  | 935/1208 [26:03<07:36,  1.67s/it, loss=0.183, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.000132, train/loss_step=0.034, global_step=5669.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  77%|███████▋  | 936/1208 [26:06<07:35,  1.67s/it, loss=0.183, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.000132, train/loss_step=0.034, global_step=5669.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  77%|███████▋  | 936/1208 [26:06<07:35,  1.67s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000149, train/loss_step=0.0415, global_step=5669.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  78%|███████▊  | 937/1208 [26:07<07:33,  1.67s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000149, train/loss_step=0.0415, global_step=5669.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  78%|███████▊  | 937/1208 [26:07<07:33,  1.67s/it, loss=0.186, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000363, train/loss_step=0.111, global_step=5670.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  78%|███████▊  | 938/1208 [26:08<07:31,  1.67s/it, loss=0.186, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000363, train/loss_step=0.111, global_step=5670.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  78%|███████▊  | 938/1208 [26:08<07:31,  1.67s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.9e-5, train/loss_step=0.0156, global_step=5670.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  78%|███████▊  | 939/1208 [26:09<07:29,  1.67s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.9e-5, train/loss_step=0.0156, global_step=5670.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  78%|███████▊  | 939/1208 [26:09<07:29,  1.67s/it, loss=0.19, v_num=0, train/loss_simple_step=0.079, train/loss_vlb_step=0.000262, train/loss_step=0.079, global_step=5670.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  78%|███████▊  | 940/1208 [26:13<07:28,  1.67s/it, loss=0.19, v_num=0, train/loss_simple_step=0.079, train/loss_vlb_step=0.000262, train/loss_step=0.079, global_step=5670.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  78%|███████▊  | 940/1208 [26:13<07:28,  1.67s/it, loss=0.195, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=5670.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  78%|███████▊  | 941/1208 [26:14<07:26,  1.67s/it, loss=0.195, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=5670.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  78%|███████▊  | 941/1208 [26:14<07:26,  1.67s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=1.09e-5, train/loss_step=0.00183, global_step=5671.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  78%|███████▊  | 942/1208 [26:15<07:24,  1.67s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=1.09e-5, train/loss_step=0.00183, global_step=5671.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  78%|███████▊  | 942/1208 [26:15<07:24,  1.67s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0821, train/loss_vlb_step=0.000277, train/loss_step=0.0821, global_step=5671.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  78%|███████▊  | 943/1208 [26:16<07:22,  1.67s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0821, train/loss_vlb_step=0.000277, train/loss_step=0.0821, global_step=5671.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  78%|███████▊  | 943/1208 [26:16<07:22,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000406, train/loss_step=0.123, global_step=5671.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  78%|███████▊  | 944/1208 [26:19<07:21,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000406, train/loss_step=0.123, global_step=5671.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  78%|███████▊  | 944/1208 [26:19<07:21,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00367, train/loss_vlb_step=2.05e-5, train/loss_step=0.00367, global_step=5671.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  78%|███████▊  | 945/1208 [26:20<07:19,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00367, train/loss_vlb_step=2.05e-5, train/loss_step=0.00367, global_step=5671.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  78%|███████▊  | 945/1208 [26:20<07:19,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00195, train/loss_step=0.287, global_step=5672.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  78%|███████▊  | 946/1208 [26:21<07:18,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00195, train/loss_step=0.287, global_step=5672.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  78%|███████▊  | 946/1208 [26:21<07:18,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000361, train/loss_step=0.110, global_step=5672.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  78%|███████▊  | 947/1208 [26:22<07:16,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000361, train/loss_step=0.110, global_step=5672.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  78%|███████▊  | 947/1208 [26:22<07:16,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000189, train/loss_step=0.0555, global_step=5672.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  78%|███████▊  | 948/1208 [26:25<07:14,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000189, train/loss_step=0.0555, global_step=5672.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  78%|███████▊  | 948/1208 [26:25<07:14,  1.67s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0498, train/loss_vlb_step=0.000173, train/loss_step=0.0498, global_step=5672.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  79%|███████▊  | 949/1208 [26:26<07:13,  1.67s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0498, train/loss_vlb_step=0.000173, train/loss_step=0.0498, global_step=5672.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  79%|███████▊  | 949/1208 [26:26<07:13,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=9.13e-5, train/loss_step=0.0217, global_step=5673.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  79%|███████▊  | 950/1208 [26:28<07:11,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=9.13e-5, train/loss_step=0.0217, global_step=5673.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  79%|███████▊  | 950/1208 [26:28<07:11,  1.67s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00171, train/loss_step=0.315, global_step=5673.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  79%|███████▊  | 951/1208 [26:29<07:09,  1.67s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00171, train/loss_step=0.315, global_step=5673.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  79%|███████▊  | 951/1208 [26:29<07:09,  1.67s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.0375, train/loss_vlb_step=0.00014, train/loss_step=0.0375, global_step=5673.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  79%|███████▉  | 952/1208 [26:32<07:08,  1.67s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.0375, train/loss_vlb_step=0.00014, train/loss_step=0.0375, global_step=5673.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  79%|███████▉  | 952/1208 [26:32<07:08,  1.67s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=7.89e-5, train/loss_step=0.020, global_step=5673.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  79%|███████▉  | 953/1208 [26:33<07:06,  1.67s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=7.89e-5, train/loss_step=0.020, global_step=5673.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  79%|███████▉  | 953/1208 [26:33<07:06,  1.67s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.0577, train/loss_vlb_step=0.000201, train/loss_step=0.0577, global_step=5674.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  79%|███████▉  | 954/1208 [26:34<07:04,  1.67s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.0577, train/loss_vlb_step=0.000201, train/loss_step=0.0577, global_step=5674.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  79%|███████▉  | 954/1208 [26:34<07:04,  1.67s/it, loss=0.0873, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000702, train/loss_step=0.200, global_step=5674.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  79%|███████▉  | 955/1208 [26:35<07:02,  1.67s/it, loss=0.0873, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000702, train/loss_step=0.200, global_step=5674.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  79%|███████▉  | 955/1208 [26:35<07:02,  1.67s/it, loss=0.103, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00211, train/loss_step=0.347, global_step=5674.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  79%|███████▉  | 956/1208 [26:38<07:01,  1.67s/it, loss=0.103, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00211, train/loss_step=0.347, global_step=5674.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  79%|███████▉  | 956/1208 [26:38<07:01,  1.67s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0479, train/loss_vlb_step=0.00017, train/loss_step=0.0479, global_step=5674.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  79%|███████▉  | 957/1208 [26:39<06:59,  1.67s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0479, train/loss_vlb_step=0.00017, train/loss_step=0.0479, global_step=5674.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  79%|███████▉  | 957/1208 [26:39<06:59,  1.67s/it, loss=0.124, v_num=0, train/loss_simple_step=0.535, train/loss_vlb_step=0.0071, train/loss_step=0.535, global_step=5675.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  79%|███████▉  | 958/1208 [26:40<06:57,  1.67s/it, loss=0.124, v_num=0, train/loss_simple_step=0.535, train/loss_vlb_step=0.0071, train/loss_step=0.535, global_step=5675.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  79%|███████▉  | 958/1208 [26:40<06:57,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000849, train/loss_step=0.215, global_step=5675.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  79%|███████▉  | 959/1208 [26:41<06:55,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000849, train/loss_step=0.215, global_step=5675.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  79%|███████▉  | 959/1208 [26:41<06:55,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000463, train/loss_step=0.140, global_step=5675.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  79%|███████▉  | 960/1208 [26:45<06:54,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000463, train/loss_step=0.140, global_step=5675.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  79%|███████▉  | 960/1208 [26:45<06:54,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.500, train/loss_vlb_step=0.0046, train/loss_step=0.500, global_step=5675.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  80%|███████▉  | 961/1208 [26:46<06:52,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.500, train/loss_vlb_step=0.0046, train/loss_step=0.500, global_step=5675.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  80%|███████▉  | 961/1208 [26:46<06:52,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0892, train/loss_vlb_step=0.000294, train/loss_step=0.0892, global_step=5676.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  80%|███████▉  | 962/1208 [26:47<06:50,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0892, train/loss_vlb_step=0.000294, train/loss_step=0.0892, global_step=5676.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  80%|███████▉  | 962/1208 [26:47<06:50,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.26e-5, train/loss_step=0.0115, global_step=5676.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  80%|███████▉  | 963/1208 [26:48<06:49,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.26e-5, train/loss_step=0.0115, global_step=5676.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  80%|███████▉  | 963/1208 [26:48<06:49,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0056, train/loss_vlb_step=2.98e-5, train/loss_step=0.0056, global_step=5676.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  80%|███████▉  | 964/1208 [26:51<06:47,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0056, train/loss_vlb_step=2.98e-5, train/loss_step=0.0056, global_step=5676.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  80%|███████▉  | 964/1208 [26:51<06:47,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0853, train/loss_vlb_step=0.000283, train/loss_step=0.0853, global_step=5676.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  80%|███████▉  | 965/1208 [26:52<06:46,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0853, train/loss_vlb_step=0.000283, train/loss_step=0.0853, global_step=5676.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  80%|███████▉  | 965/1208 [26:52<06:46,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0917, train/loss_vlb_step=0.000302, train/loss_step=0.0917, global_step=5677.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  80%|███████▉  | 966/1208 [26:53<06:44,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0917, train/loss_vlb_step=0.000302, train/loss_step=0.0917, global_step=5677.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  80%|███████▉  | 966/1208 [26:53<06:44,  1.67s/it, loss=0.15, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000621, train/loss_step=0.182, global_step=5677.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  80%|████████  | 967/1208 [26:54<06:42,  1.67s/it, loss=0.15, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000621, train/loss_step=0.182, global_step=5677.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  80%|████████  | 967/1208 [26:54<06:42,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00206, train/loss_step=0.339, global_step=5677.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  80%|████████  | 968/1208 [26:57<06:41,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00206, train/loss_step=0.339, global_step=5677.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  80%|████████  | 968/1208 [26:57<06:41,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.82e-5, train/loss_step=0.0152, global_step=5677.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  80%|████████  | 969/1208 [26:59<06:39,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.82e-5, train/loss_step=0.0152, global_step=5677.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  80%|████████  | 969/1208 [26:59<06:39,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=5678.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  80%|████████  | 970/1208 [27:00<06:37,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=5678.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  80%|████████  | 970/1208 [27:00<06:37,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00482, train/loss_vlb_step=2.56e-5, train/loss_step=0.00482, global_step=5678.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  80%|████████  | 971/1208 [27:01<06:35,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00482, train/loss_vlb_step=2.56e-5, train/loss_step=0.00482, global_step=5678.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  80%|████████  | 971/1208 [27:01<06:35,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000486, train/loss_step=0.143, global_step=5678.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  80%|████████  | 972/1208 [27:04<06:34,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000486, train/loss_step=0.143, global_step=5678.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  80%|████████  | 972/1208 [27:04<06:34,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.1e-5, train/loss_step=0.0139, global_step=5678.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  81%|████████  | 973/1208 [27:05<06:32,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.1e-5, train/loss_step=0.0139, global_step=5678.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  81%|████████  | 973/1208 [27:05<06:32,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.48e-5, train/loss_step=0.00267, global_step=5679.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  81%|████████  | 974/1208 [27:06<06:30,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.48e-5, train/loss_step=0.00267, global_step=5679.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  81%|████████  | 974/1208 [27:06<06:30,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.17e-5, train/loss_step=0.0171, global_step=5679.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  81%|████████  | 975/1208 [27:07<06:28,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.17e-5, train/loss_step=0.0171, global_step=5679.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  81%|████████  | 975/1208 [27:07<06:28,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.754, train/loss_vlb_step=0.0769, train/loss_step=0.754, global_step=5679.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  81%|████████  | 976/1208 [27:10<06:27,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.754, train/loss_vlb_step=0.0769, train/loss_step=0.754, global_step=5679.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  81%|████████  | 976/1208 [27:10<06:27,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.53e-5, train/loss_step=0.0107, global_step=5679.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  81%|████████  | 977/1208 [27:11<06:25,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.53e-5, train/loss_step=0.0107, global_step=5679.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  81%|████████  | 977/1208 [27:11<06:25,  1.67s/it, loss=0.146, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000711, train/loss_step=0.180, global_step=5680.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  81%|████████  | 978/1208 [27:12<06:23,  1.67s/it, loss=0.146, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000711, train/loss_step=0.180, global_step=5680.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  81%|████████  | 978/1208 [27:12<06:23,  1.67s/it, loss=0.142, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000491, train/loss_step=0.146, global_step=5680.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  81%|████████  | 979/1208 [27:13<06:22,  1.67s/it, loss=0.142, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000491, train/loss_step=0.146, global_step=5680.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  81%|████████  | 979/1208 [27:13<06:22,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.34e-5, train/loss_step=0.0119, global_step=5680.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  81%|████████  | 980/1208 [27:17<06:20,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.34e-5, train/loss_step=0.0119, global_step=5680.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  81%|████████  | 980/1208 [27:17<06:20,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000434, train/loss_step=0.130, global_step=5680.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  81%|████████  | 981/1208 [27:18<06:19,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000434, train/loss_step=0.130, global_step=5680.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  81%|████████  | 981/1208 [27:18<06:19,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=7e-5, train/loss_step=0.0162, global_step=5681.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  81%|████████▏ | 982/1208 [27:19<06:17,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=7e-5, train/loss_step=0.0162, global_step=5681.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  81%|████████▏ | 982/1208 [27:19<06:17,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000783, train/loss_step=0.185, global_step=5681.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  81%|████████▏ | 983/1208 [27:20<06:15,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000783, train/loss_step=0.185, global_step=5681.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  81%|████████▏ | 983/1208 [27:20<06:15,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0989, train/loss_vlb_step=0.000325, train/loss_step=0.0989, global_step=5681.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  81%|████████▏ | 984/1208 [27:23<06:14,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0989, train/loss_vlb_step=0.000325, train/loss_step=0.0989, global_step=5681.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  81%|████████▏ | 984/1208 [27:23<06:14,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0753, train/loss_vlb_step=0.000251, train/loss_step=0.0753, global_step=5681.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  82%|████████▏ | 985/1208 [27:24<06:12,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0753, train/loss_vlb_step=0.000251, train/loss_step=0.0753, global_step=5681.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  82%|████████▏ | 985/1208 [27:24<06:12,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00139, train/loss_step=0.278, global_step=5682.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  82%|████████▏ | 986/1208 [27:25<06:10,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00139, train/loss_step=0.278, global_step=5682.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  82%|████████▏ | 986/1208 [27:25<06:10,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0542, train/loss_vlb_step=0.00019, train/loss_step=0.0542, global_step=5682.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  82%|████████▏ | 987/1208 [27:26<06:08,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0542, train/loss_vlb_step=0.00019, train/loss_step=0.0542, global_step=5682.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  82%|████████▏ | 987/1208 [27:26<06:08,  1.67s/it, loss=0.123, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000743, train/loss_step=0.201, global_step=5682.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  82%|████████▏ | 988/1208 [27:29<06:07,  1.67s/it, loss=0.123, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000743, train/loss_step=0.201, global_step=5682.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  82%|████████▏ | 988/1208 [27:29<06:07,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00337, train/loss_vlb_step=1.88e-5, train/loss_step=0.00337, global_step=5682.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  82%|████████▏ | 989/1208 [27:31<06:05,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00337, train/loss_vlb_step=1.88e-5, train/loss_step=0.00337, global_step=5682.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  82%|████████▏ | 989/1208 [27:31<06:05,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0926, train/loss_vlb_step=0.000313, train/loss_step=0.0926, global_step=5683.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  82%|████████▏ | 990/1208 [27:32<06:03,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0926, train/loss_vlb_step=0.000313, train/loss_step=0.0926, global_step=5683.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  82%|████████▏ | 990/1208 [27:32<06:03,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.08e-5, train/loss_step=0.0139, global_step=5683.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  82%|████████▏ | 991/1208 [27:33<06:01,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.08e-5, train/loss_step=0.0139, global_step=5683.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  82%|████████▏ | 991/1208 [27:33<06:01,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=8.28e-5, train/loss_step=0.0188, global_step=5683.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  82%|████████▏ | 992/1208 [27:36<06:00,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=8.28e-5, train/loss_step=0.0188, global_step=5683.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  82%|████████▏ | 992/1208 [27:36<06:00,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0477, train/loss_vlb_step=0.000168, train/loss_step=0.0477, global_step=5683.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  82%|████████▏ | 993/1208 [27:37<05:58,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0477, train/loss_vlb_step=0.000168, train/loss_step=0.0477, global_step=5683.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  82%|████████▏ | 993/1208 [27:37<05:58,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00534, train/loss_vlb_step=2.79e-5, train/loss_step=0.00534, global_step=5684.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  82%|████████▏ | 994/1208 [27:38<05:57,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00534, train/loss_vlb_step=2.79e-5, train/loss_step=0.00534, global_step=5684.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  82%|████████▏ | 994/1208 [27:38<05:57,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00839, train/loss_step=0.499, global_step=5684.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  82%|████████▏ | 995/1208 [27:39<05:55,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00839, train/loss_step=0.499, global_step=5684.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  82%|████████▏ | 995/1208 [27:39<05:55,  1.67s/it, loss=0.118, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00135, train/loss_step=0.285, global_step=5684.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  82%|████████▏ | 996/1208 [27:42<05:53,  1.67s/it, loss=0.118, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00135, train/loss_step=0.285, global_step=5684.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  82%|████████▏ | 996/1208 [27:42<05:53,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=1.62e-5, train/loss_step=0.00295, global_step=5684.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  83%|████████▎ | 997/1208 [27:43<05:52,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=1.62e-5, train/loss_step=0.00295, global_step=5684.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  83%|████████▎ | 997/1208 [27:43<05:52,  1.67s/it, loss=0.116, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000539, train/loss_step=0.159, global_step=5685.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  83%|████████▎ | 998/1208 [27:44<05:50,  1.67s/it, loss=0.116, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000539, train/loss_step=0.159, global_step=5685.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  83%|████████▎ | 998/1208 [27:44<05:50,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000779, train/loss_step=0.220, global_step=5685.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  83%|████████▎ | 999/1208 [27:45<05:48,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000779, train/loss_step=0.220, global_step=5685.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  83%|████████▎ | 999/1208 [27:45<05:48,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.000112, train/loss_step=0.0276, global_step=5685.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  83%|████████▎ | 1000/1208 [27:49<05:47,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.000112, train/loss_step=0.0276, global_step=5685.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  83%|████████▎ | 1000/1208 [27:49<05:47,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0037, train/loss_vlb_step=2.01e-5, train/loss_step=0.0037, global_step=5685.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  83%|████████▎ | 1001/1208 [27:50<05:45,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0037, train/loss_vlb_step=2.01e-5, train/loss_step=0.0037, global_step=5685.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  83%|████████▎ | 1001/1208 [27:50<05:45,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0742, train/loss_vlb_step=0.00025, train/loss_step=0.0742, global_step=5686.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  83%|████████▎ | 1002/1208 [27:51<05:43,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0742, train/loss_vlb_step=0.00025, train/loss_step=0.0742, global_step=5686.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  83%|████████▎ | 1002/1208 [27:51<05:43,  1.67s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=1.2e-5, train/loss_step=0.00201, global_step=5686.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  83%|████████▎ | 1003/1208 [27:52<05:41,  1.67s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=1.2e-5, train/loss_step=0.00201, global_step=5686.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  83%|████████▎ | 1003/1208 [27:52<05:41,  1.67s/it, loss=0.139, v_num=0, train/loss_simple_step=0.727, train/loss_vlb_step=0.0532, train/loss_step=0.727, global_step=5686.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  83%|████████▎ | 1004/1208 [27:55<05:40,  1.67s/it, loss=0.139, v_num=0, train/loss_simple_step=0.727, train/loss_vlb_step=0.0532, train/loss_step=0.727, global_step=5686.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  83%|████████▎ | 1004/1208 [27:55<05:40,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000714, train/loss_step=0.193, global_step=5686.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  83%|████████▎ | 1005/1208 [27:56<05:38,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000714, train/loss_step=0.193, global_step=5686.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  83%|████████▎ | 1005/1208 [27:56<05:38,  1.67s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0789, train/loss_vlb_step=0.000261, train/loss_step=0.0789, global_step=5687.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  83%|████████▎ | 1006/1208 [27:57<05:36,  1.67s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0789, train/loss_vlb_step=0.000261, train/loss_step=0.0789, global_step=5687.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  83%|████████▎ | 1006/1208 [27:57<05:36,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0804, train/loss_vlb_step=0.000267, train/loss_step=0.0804, global_step=5687.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  83%|████████▎ | 1007/1208 [27:58<05:35,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0804, train/loss_vlb_step=0.000267, train/loss_step=0.0804, global_step=5687.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  83%|████████▎ | 1007/1208 [27:58<05:35,  1.67s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000124, train/loss_step=0.0319, global_step=5687.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  83%|████████▎ | 1008/1208 [28:01<05:33,  1.67s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000124, train/loss_step=0.0319, global_step=5687.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  83%|████████▎ | 1008/1208 [28:01<05:33,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000742, train/loss_step=0.199, global_step=5687.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  84%|████████▎ | 1009/1208 [28:02<05:31,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000742, train/loss_step=0.199, global_step=5687.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  84%|████████▎ | 1009/1208 [28:02<05:31,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0597, train/loss_vlb_step=0.000205, train/loss_step=0.0597, global_step=5688.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  84%|████████▎ | 1010/1208 [28:04<05:30,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0597, train/loss_vlb_step=0.000205, train/loss_step=0.0597, global_step=5688.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  84%|████████▎ | 1010/1208 [28:04<05:30,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.14e-5, train/loss_step=0.0235, global_step=5688.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  84%|████████▎ | 1011/1208 [28:05<05:28,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.14e-5, train/loss_step=0.0235, global_step=5688.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  84%|████████▎ | 1011/1208 [28:05<05:28,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0956, train/loss_vlb_step=0.000314, train/loss_step=0.0956, global_step=5688.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  84%|████████▍ | 1012/1208 [28:08<05:26,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0956, train/loss_vlb_step=0.000314, train/loss_step=0.0956, global_step=5688.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  84%|████████▍ | 1012/1208 [28:08<05:26,  1.67s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.58e-5, train/loss_step=0.0191, global_step=5688.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  84%|████████▍ | 1013/1208 [28:09<05:25,  1.67s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.58e-5, train/loss_step=0.0191, global_step=5688.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  84%|████████▍ | 1013/1208 [28:09<05:25,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=8.98e-5, train/loss_step=0.0226, global_step=5689.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  84%|████████▍ | 1014/1208 [28:10<05:23,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=8.98e-5, train/loss_step=0.0226, global_step=5689.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  84%|████████▍ | 1014/1208 [28:10<05:23,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.586, train/loss_vlb_step=0.00868, train/loss_step=0.586, global_step=5689.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  84%|████████▍ | 1015/1208 [28:11<05:21,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.586, train/loss_vlb_step=0.00868, train/loss_step=0.586, global_step=5689.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  84%|████████▍ | 1015/1208 [28:11<05:21,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0612, train/loss_vlb_step=0.000216, train/loss_step=0.0612, global_step=5689.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  84%|████████▍ | 1016/1208 [28:14<05:20,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0612, train/loss_vlb_step=0.000216, train/loss_step=0.0612, global_step=5689.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  84%|████████▍ | 1016/1208 [28:14<05:20,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00497, train/loss_step=0.499, global_step=5689.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  84%|████████▍ | 1017/1208 [28:15<05:18,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00497, train/loss_step=0.499, global_step=5689.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  84%|████████▍ | 1017/1208 [28:15<05:18,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.97e-5, train/loss_step=0.0159, global_step=5690.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  84%|████████▍ | 1018/1208 [28:16<05:16,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.97e-5, train/loss_step=0.0159, global_step=5690.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  84%|████████▍ | 1018/1208 [28:16<05:16,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000361, train/loss_step=0.110, global_step=5690.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  84%|████████▍ | 1019/1208 [28:17<05:14,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000361, train/loss_step=0.110, global_step=5690.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  84%|████████▍ | 1019/1208 [28:17<05:14,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000107, train/loss_step=0.0268, global_step=5690.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  84%|████████▍ | 1020/1208 [28:21<05:13,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000107, train/loss_step=0.0268, global_step=5690.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  84%|████████▍ | 1020/1208 [28:21<05:13,  1.67s/it, loss=0.169, v_num=0, train/loss_simple_step=0.481, train/loss_vlb_step=0.00355, train/loss_step=0.481, global_step=5690.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  85%|████████▍ | 1021/1208 [28:22<05:11,  1.67s/it, loss=0.169, v_num=0, train/loss_simple_step=0.481, train/loss_vlb_step=0.00355, train/loss_step=0.481, global_step=5690.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  85%|████████▍ | 1021/1208 [28:22<05:11,  1.67s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0695, train/loss_vlb_step=0.000237, train/loss_step=0.0695, global_step=5691.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  85%|████████▍ | 1022/1208 [28:23<05:09,  1.67s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0695, train/loss_vlb_step=0.000237, train/loss_step=0.0695, global_step=5691.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  85%|████████▍ | 1022/1208 [28:23<05:09,  1.67s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0762, train/loss_vlb_step=0.000259, train/loss_step=0.0762, global_step=5691.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  85%|████████▍ | 1023/1208 [28:24<05:08,  1.67s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0762, train/loss_vlb_step=0.000259, train/loss_step=0.0762, global_step=5691.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  85%|████████▍ | 1023/1208 [28:24<05:08,  1.67s/it, loss=0.142, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.00039, train/loss_step=0.118, global_step=5691.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  85%|████████▍ | 1024/1208 [28:27<05:06,  1.67s/it, loss=0.142, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.00039, train/loss_step=0.118, global_step=5691.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  85%|████████▍ | 1024/1208 [28:27<05:06,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=9.98e-6, train/loss_step=0.00165, global_step=5691.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  85%|████████▍ | 1025/1208 [28:28<05:05,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=9.98e-6, train/loss_step=0.00165, global_step=5691.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  85%|████████▍ | 1025/1208 [28:28<05:05,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0706, train/loss_vlb_step=0.000245, train/loss_step=0.0706, global_step=5692.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  85%|████████▍ | 1026/1208 [28:29<05:03,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0706, train/loss_vlb_step=0.000245, train/loss_step=0.0706, global_step=5692.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  85%|████████▍ | 1026/1208 [28:29<05:03,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.469, train/loss_vlb_step=0.00729, train/loss_step=0.469, global_step=5692.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  85%|████████▌ | 1027/1208 [28:30<05:01,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.469, train/loss_vlb_step=0.00729, train/loss_step=0.469, global_step=5692.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  85%|████████▌ | 1027/1208 [28:30<05:01,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00143, train/loss_step=0.284, global_step=5692.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  85%|████████▌ | 1028/1208 [28:33<05:00,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00143, train/loss_step=0.284, global_step=5692.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  85%|████████▌ | 1028/1208 [28:33<05:00,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.24e-5, train/loss_step=0.0138, global_step=5692.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  85%|████████▌ | 1029/1208 [28:34<04:58,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.24e-5, train/loss_step=0.0138, global_step=5692.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  85%|████████▌ | 1029/1208 [28:34<04:58,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.51e-5, train/loss_step=0.0234, global_step=5693.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  85%|████████▌ | 1030/1208 [28:35<04:56,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.51e-5, train/loss_step=0.0234, global_step=5693.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  85%|████████▌ | 1030/1208 [28:35<04:56,  1.67s/it, loss=0.159, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000471, train/loss_step=0.141, global_step=5693.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  85%|████████▌ | 1031/1208 [28:36<04:54,  1.67s/it, loss=0.159, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000471, train/loss_step=0.141, global_step=5693.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  85%|████████▌ | 1031/1208 [28:36<04:54,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0704, train/loss_vlb_step=0.000234, train/loss_step=0.0704, global_step=5693.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  85%|████████▌ | 1032/1208 [28:40<04:53,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0704, train/loss_vlb_step=0.000234, train/loss_step=0.0704, global_step=5693.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  85%|████████▌ | 1032/1208 [28:40<04:53,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000494, train/loss_step=0.148, global_step=5693.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  86%|████████▌ | 1033/1208 [28:41<04:51,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000494, train/loss_step=0.148, global_step=5693.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  86%|████████▌ | 1033/1208 [28:41<04:51,  1.67s/it, loss=0.179, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.0013, train/loss_step=0.305, global_step=5694.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  86%|████████▌ | 1034/1208 [28:42<04:49,  1.67s/it, loss=0.179, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.0013, train/loss_step=0.305, global_step=5694.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  86%|████████▌ | 1034/1208 [28:42<04:49,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.00057, train/loss_step=0.162, global_step=5694.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  86%|████████▌ | 1035/1208 [28:43<04:48,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.00057, train/loss_step=0.162, global_step=5694.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  86%|████████▌ | 1035/1208 [28:43<04:48,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=9.36e-5, train/loss_step=0.0213, global_step=5694.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  86%|████████▌ | 1036/1208 [28:46<04:46,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=9.36e-5, train/loss_step=0.0213, global_step=5694.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  86%|████████▌ | 1036/1208 [28:46<04:46,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.000186, train/loss_step=0.0521, global_step=5694.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  86%|████████▌ | 1037/1208 [28:47<04:44,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.000186, train/loss_step=0.0521, global_step=5694.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  86%|████████▌ | 1037/1208 [28:47<04:44,  1.67s/it, loss=0.172, v_num=0, train/loss_simple_step=0.787, train/loss_vlb_step=0.0451, train/loss_step=0.787, global_step=5695.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  86%|████████▌ | 1038/1208 [28:48<04:43,  1.67s/it, loss=0.172, v_num=0, train/loss_simple_step=0.787, train/loss_vlb_step=0.0451, train/loss_step=0.787, global_step=5695.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  86%|████████▌ | 1038/1208 [28:48<04:43,  1.67s/it, loss=0.182, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00173, train/loss_step=0.316, global_step=5695.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  86%|████████▌ | 1039/1208 [28:49<04:41,  1.66s/it, loss=0.182, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00173, train/loss_step=0.316, global_step=5695.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  86%|████████▌ | 1039/1208 [28:49<04:41,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.24e-5, train/loss_step=0.00213, global_step=5695.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  86%|████████▌ | 1040/1208 [28:53<04:39,  1.67s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.24e-5, train/loss_step=0.00213, global_step=5695.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  86%|████████▌ | 1040/1208 [28:53<04:39,  1.67s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0759, train/loss_vlb_step=0.000251, train/loss_step=0.0759, global_step=5695.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  86%|████████▌ | 1041/1208 [28:54<04:38,  1.67s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0759, train/loss_vlb_step=0.000251, train/loss_step=0.0759, global_step=5695.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  86%|████████▌ | 1041/1208 [28:54<04:38,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=7.26e-5, train/loss_step=0.0164, global_step=5696.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  86%|████████▋ | 1042/1208 [28:55<04:36,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=7.26e-5, train/loss_step=0.0164, global_step=5696.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  86%|████████▋ | 1042/1208 [28:55<04:36,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0847, train/loss_vlb_step=0.000283, train/loss_step=0.0847, global_step=5696.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  86%|████████▋ | 1043/1208 [28:56<04:34,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0847, train/loss_vlb_step=0.000283, train/loss_step=0.0847, global_step=5696.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  86%|████████▋ | 1043/1208 [28:56<04:34,  1.66s/it, loss=0.162, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000817, train/loss_step=0.204, global_step=5696.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  86%|████████▋ | 1044/1208 [28:59<04:33,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000817, train/loss_step=0.204, global_step=5696.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  86%|████████▋ | 1044/1208 [28:59<04:33,  1.67s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0966, train/loss_vlb_step=0.00032, train/loss_step=0.0966, global_step=5696.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  87%|████████▋ | 1045/1208 [29:00<04:31,  1.67s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0966, train/loss_vlb_step=0.00032, train/loss_step=0.0966, global_step=5696.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  87%|████████▋ | 1045/1208 [29:00<04:31,  1.67s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0546, train/loss_vlb_step=0.000187, train/loss_step=0.0546, global_step=5697.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  87%|████████▋ | 1046/1208 [29:01<04:29,  1.66s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0546, train/loss_vlb_step=0.000187, train/loss_step=0.0546, global_step=5697.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  87%|████████▋ | 1046/1208 [29:01<04:29,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000463, train/loss_step=0.134, global_step=5697.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  87%|████████▋ | 1047/1208 [29:02<04:27,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000463, train/loss_step=0.134, global_step=5697.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  87%|████████▋ | 1047/1208 [29:02<04:27,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00108, train/loss_step=0.265, global_step=5697.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  87%|████████▋ | 1048/1208 [29:05<04:26,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00108, train/loss_step=0.265, global_step=5697.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  87%|████████▋ | 1048/1208 [29:05<04:26,  1.67s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.03e-5, train/loss_step=0.00174, global_step=5697.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  87%|████████▋ | 1049/1208 [29:06<04:24,  1.67s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.03e-5, train/loss_step=0.00174, global_step=5697.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  87%|████████▋ | 1049/1208 [29:06<04:24,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0772, train/loss_vlb_step=0.000267, train/loss_step=0.0772, global_step=5698.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  87%|████████▋ | 1050/1208 [29:07<04:23,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0772, train/loss_vlb_step=0.000267, train/loss_step=0.0772, global_step=5698.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  87%|████████▋ | 1050/1208 [29:07<04:23,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000726, train/loss_step=0.199, global_step=5698.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  87%|████████▋ | 1051/1208 [29:08<04:21,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000726, train/loss_step=0.199, global_step=5698.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  87%|████████▋ | 1051/1208 [29:08<04:21,  1.66s/it, loss=0.176, v_num=0, train/loss_simple_step=0.522, train/loss_vlb_step=0.00754, train/loss_step=0.522, global_step=5698.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  87%|████████▋ | 1052/1208 [29:12<04:19,  1.67s/it, loss=0.176, v_num=0, train/loss_simple_step=0.522, train/loss_vlb_step=0.00754, train/loss_step=0.522, global_step=5698.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  87%|████████▋ | 1052/1208 [29:12<04:19,  1.67s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=2.47e-5, train/loss_step=0.00448, global_step=5698.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  87%|████████▋ | 1053/1208 [29:13<04:18,  1.66s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=2.47e-5, train/loss_step=0.00448, global_step=5698.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  87%|████████▋ | 1053/1208 [29:13<04:18,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.000172, train/loss_step=0.0485, global_step=5699.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  87%|████████▋ | 1054/1208 [29:14<04:16,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.000172, train/loss_step=0.0485, global_step=5699.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  87%|████████▋ | 1054/1208 [29:14<04:16,  1.66s/it, loss=0.164, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.0014, train/loss_step=0.311, global_step=5699.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  87%|████████▋ | 1055/1208 [29:15<04:14,  1.66s/it, loss=0.164, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.0014, train/loss_step=0.311, global_step=5699.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  87%|████████▋ | 1055/1208 [29:15<04:14,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.41e-5, train/loss_step=0.0126, global_step=5699.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  87%|████████▋ | 1056/1208 [29:18<04:13,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.41e-5, train/loss_step=0.0126, global_step=5699.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  87%|████████▋ | 1056/1208 [29:18<04:13,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0096, train/loss_vlb_step=4.25e-5, train/loss_step=0.0096, global_step=5699.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  88%|████████▊ | 1057/1208 [29:19<04:11,  1.66s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0096, train/loss_vlb_step=4.25e-5, train/loss_step=0.0096, global_step=5699.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  88%|████████▊ | 1057/1208 [29:19<04:11,  1.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000764, train/loss_step=0.200, global_step=5700.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  88%|████████▊ | 1058/1208 [29:20<04:09,  1.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000764, train/loss_step=0.200, global_step=5700.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  88%|████████▊ | 1058/1208 [29:20<04:09,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.68e-5, train/loss_step=0.0242, global_step=5700.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  88%|████████▊ | 1059/1208 [29:21<04:07,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.68e-5, train/loss_step=0.0242, global_step=5700.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  88%|████████▊ | 1059/1208 [29:21<04:07,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00226, train/loss_step=0.413, global_step=5700.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  88%|████████▊ | 1060/1208 [29:24<04:06,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00226, train/loss_step=0.413, global_step=5700.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  88%|████████▊ | 1060/1208 [29:24<04:06,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.21e-5, train/loss_step=0.00205, global_step=5700.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  88%|████████▊ | 1061/1208 [29:25<04:04,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.21e-5, train/loss_step=0.00205, global_step=5700.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  88%|████████▊ | 1061/1208 [29:25<04:04,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000119, train/loss_step=0.0309, global_step=5701.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  88%|████████▊ | 1062/1208 [29:27<04:02,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000119, train/loss_step=0.0309, global_step=5701.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  88%|████████▊ | 1062/1208 [29:27<04:02,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0539, train/loss_vlb_step=0.000185, train/loss_step=0.0539, global_step=5701.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  88%|████████▊ | 1063/1208 [29:28<04:01,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0539, train/loss_vlb_step=0.000185, train/loss_step=0.0539, global_step=5701.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  88%|████████▊ | 1063/1208 [29:28<04:01,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00116, train/loss_step=0.248, global_step=5701.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  88%|████████▊ | 1064/1208 [29:31<03:59,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00116, train/loss_step=0.248, global_step=5701.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  88%|████████▊ | 1064/1208 [29:31<03:59,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.00398, train/loss_step=0.485, global_step=5701.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  88%|████████▊ | 1065/1208 [29:32<03:57,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.00398, train/loss_step=0.485, global_step=5701.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  88%|████████▊ | 1065/1208 [29:32<03:57,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000407, train/loss_step=0.123, global_step=5702.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  88%|████████▊ | 1066/1208 [29:33<03:56,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000407, train/loss_step=0.123, global_step=5702.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  88%|████████▊ | 1066/1208 [29:33<03:56,  1.66s/it, loss=0.182, v_num=0, train/loss_simple_step=0.606, train/loss_vlb_step=0.0178, train/loss_step=0.606, global_step=5702.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  88%|████████▊ | 1067/1208 [29:34<03:54,  1.66s/it, loss=0.182, v_num=0, train/loss_simple_step=0.606, train/loss_vlb_step=0.0178, train/loss_step=0.606, global_step=5702.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  88%|████████▊ | 1067/1208 [29:34<03:54,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000377, train/loss_step=0.114, global_step=5702.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  88%|████████▊ | 1068/1208 [29:37<03:53,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000377, train/loss_step=0.114, global_step=5702.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  88%|████████▊ | 1068/1208 [29:37<03:53,  1.66s/it, loss=0.182, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000527, train/loss_step=0.160, global_step=5702.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  88%|████████▊ | 1069/1208 [29:38<03:51,  1.66s/it, loss=0.182, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000527, train/loss_step=0.160, global_step=5702.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  88%|████████▊ | 1069/1208 [29:38<03:51,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00718, train/loss_vlb_step=3.57e-5, train/loss_step=0.00718, global_step=5703.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  89%|████████▊ | 1070/1208 [29:39<03:49,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00718, train/loss_vlb_step=3.57e-5, train/loss_step=0.00718, global_step=5703.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  89%|████████▊ | 1070/1208 [29:39<03:49,  1.66s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.000171, train/loss_step=0.0489, global_step=5703.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  89%|████████▊ | 1071/1208 [29:40<03:47,  1.66s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.000171, train/loss_step=0.0489, global_step=5703.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  89%|████████▊ | 1071/1208 [29:40<03:47,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.466, train/loss_vlb_step=0.00485, train/loss_step=0.466, global_step=5703.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  89%|████████▊ | 1072/1208 [29:44<03:46,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.466, train/loss_vlb_step=0.00485, train/loss_step=0.466, global_step=5703.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  89%|████████▊ | 1072/1208 [29:44<03:46,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=1.47e-5, train/loss_step=0.00262, global_step=5703.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  89%|████████▉ | 1073/1208 [29:45<03:44,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=1.47e-5, train/loss_step=0.00262, global_step=5703.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  89%|████████▉ | 1073/1208 [29:45<03:44,  1.66s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.31e-5, train/loss_step=0.0144, global_step=5704.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  89%|████████▉ | 1074/1208 [29:46<03:42,  1.66s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.31e-5, train/loss_step=0.0144, global_step=5704.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  89%|████████▉ | 1074/1208 [29:46<03:42,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.00253, train/loss_step=0.382, global_step=5704.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  89%|████████▉ | 1075/1208 [29:47<03:41,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.00253, train/loss_step=0.382, global_step=5704.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  89%|████████▉ | 1075/1208 [29:47<03:41,  1.66s/it, loss=0.177, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000483, train/loss_step=0.145, global_step=5704.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  89%|████████▉ | 1076/1208 [29:50<03:39,  1.66s/it, loss=0.177, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000483, train/loss_step=0.145, global_step=5704.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  89%|████████▉ | 1076/1208 [29:50<03:39,  1.66s/it, loss=0.178, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.43e-5, train/loss_step=0.023, global_step=5704.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  89%|████████▉ | 1077/1208 [29:51<03:37,  1.66s/it, loss=0.178, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.43e-5, train/loss_step=0.023, global_step=5704.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  89%|████████▉ | 1077/1208 [29:51<03:37,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=8.22e-6, train/loss_step=0.00135, global_step=5705.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  89%|████████▉ | 1078/1208 [29:52<03:36,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=8.22e-6, train/loss_step=0.00135, global_step=5705.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  89%|████████▉ | 1078/1208 [29:52<03:36,  1.66s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.3e-5, train/loss_step=0.0141, global_step=5705.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  89%|████████▉ | 1079/1208 [29:53<03:34,  1.66s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.3e-5, train/loss_step=0.0141, global_step=5705.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  89%|████████▉ | 1079/1208 [29:53<03:34,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0767, train/loss_vlb_step=0.000255, train/loss_step=0.0767, global_step=5705.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  89%|████████▉ | 1080/1208 [29:56<03:32,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0767, train/loss_vlb_step=0.000255, train/loss_step=0.0767, global_step=5705.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  89%|████████▉ | 1080/1208 [29:56<03:32,  1.66s/it, loss=0.188, v_num=0, train/loss_simple_step=0.747, train/loss_vlb_step=0.048, train/loss_step=0.747, global_step=5705.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  89%|████████▉ | 1081/1208 [29:57<03:31,  1.66s/it, loss=0.188, v_num=0, train/loss_simple_step=0.747, train/loss_vlb_step=0.048, train/loss_step=0.747, global_step=5705.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  89%|████████▉ | 1081/1208 [29:57<03:31,  1.66s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0039, train/loss_vlb_step=2.09e-5, train/loss_step=0.0039, global_step=5706.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  90%|████████▉ | 1082/1208 [29:58<03:29,  1.66s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0039, train/loss_vlb_step=2.09e-5, train/loss_step=0.0039, global_step=5706.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  90%|████████▉ | 1082/1208 [29:58<03:29,  1.66s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=2.14e-5, train/loss_step=0.00381, global_step=5706.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  90%|████████▉ | 1083/1208 [30:00<03:27,  1.66s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=2.14e-5, train/loss_step=0.00381, global_step=5706.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  90%|████████▉ | 1083/1208 [30:00<03:27,  1.66s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.36e-5, train/loss_step=0.0153, global_step=5706.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  90%|████████▉ | 1084/1208 [30:03<03:26,  1.66s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.36e-5, train/loss_step=0.0153, global_step=5706.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  90%|████████▉ | 1084/1208 [30:03<03:26,  1.66s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0075, train/loss_vlb_step=3.67e-5, train/loss_step=0.0075, global_step=5706.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  90%|████████▉ | 1085/1208 [30:04<03:24,  1.66s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0075, train/loss_vlb_step=3.67e-5, train/loss_step=0.0075, global_step=5706.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  90%|████████▉ | 1085/1208 [30:04<03:24,  1.66s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00297, train/loss_vlb_step=1.73e-5, train/loss_step=0.00297, global_step=5707.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  90%|████████▉ | 1086/1208 [30:05<03:22,  1.66s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00297, train/loss_vlb_step=1.73e-5, train/loss_step=0.00297, global_step=5707.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  90%|████████▉ | 1086/1208 [30:05<03:22,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0596, train/loss_vlb_step=0.000212, train/loss_step=0.0596, global_step=5707.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  90%|████████▉ | 1087/1208 [30:06<03:21,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0596, train/loss_vlb_step=0.000212, train/loss_step=0.0596, global_step=5707.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  90%|████████▉ | 1087/1208 [30:06<03:21,  1.66s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.58e-5, train/loss_step=0.0153, global_step=5707.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  90%|█████████ | 1088/1208 [30:09<03:19,  1.66s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.58e-5, train/loss_step=0.0153, global_step=5707.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  90%|█████████ | 1088/1208 [30:09<03:19,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000439, train/loss_step=0.133, global_step=5707.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  90%|█████████ | 1089/1208 [30:10<03:17,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000439, train/loss_step=0.133, global_step=5707.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  90%|█████████ | 1089/1208 [30:10<03:17,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.00078, train/loss_step=0.207, global_step=5708.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  90%|█████████ | 1090/1208 [30:11<03:16,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.00078, train/loss_step=0.207, global_step=5708.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  90%|█████████ | 1090/1208 [30:11<03:16,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000568, train/loss_step=0.159, global_step=5708.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  90%|█████████ | 1091/1208 [30:12<03:14,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000568, train/loss_step=0.159, global_step=5708.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  90%|█████████ | 1091/1208 [30:12<03:14,  1.66s/it, loss=0.116, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00139, train/loss_step=0.301, global_step=5708.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  90%|█████████ | 1092/1208 [30:15<03:12,  1.66s/it, loss=0.116, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00139, train/loss_step=0.301, global_step=5708.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  90%|█████████ | 1092/1208 [30:15<03:12,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.588, train/loss_vlb_step=0.0138, train/loss_step=0.588, global_step=5708.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  90%|█████████ | 1093/1208 [30:17<03:11,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.588, train/loss_vlb_step=0.0138, train/loss_step=0.588, global_step=5708.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  90%|█████████ | 1093/1208 [30:17<03:11,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.689, train/loss_vlb_step=0.0325, train/loss_step=0.689, global_step=5709.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  91%|█████████ | 1094/1208 [30:18<03:09,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.689, train/loss_vlb_step=0.0325, train/loss_step=0.689, global_step=5709.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  91%|█████████ | 1094/1208 [30:18<03:09,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00163, train/loss_vlb_step=9.96e-6, train/loss_step=0.00163, global_step=5709.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  91%|█████████ | 1095/1208 [30:19<03:07,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00163, train/loss_vlb_step=9.96e-6, train/loss_step=0.00163, global_step=5709.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  91%|█████████ | 1095/1208 [30:19<03:07,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=1.35e-5, train/loss_step=0.00232, global_step=5709.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  91%|█████████ | 1096/1208 [30:22<03:06,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=1.35e-5, train/loss_step=0.00232, global_step=5709.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  91%|█████████ | 1096/1208 [30:22<03:06,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000444, train/loss_step=0.132, global_step=5709.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  91%|█████████ | 1097/1208 [30:23<03:04,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000444, train/loss_step=0.132, global_step=5709.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  91%|█████████ | 1097/1208 [30:23<03:04,  1.66s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.68e-5, train/loss_step=0.0131, global_step=5710.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  91%|█████████ | 1098/1208 [30:24<03:02,  1.66s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.68e-5, train/loss_step=0.0131, global_step=5710.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  91%|█████████ | 1098/1208 [30:24<03:02,  1.66s/it, loss=0.18, v_num=0, train/loss_simple_step=0.445, train/loss_vlb_step=0.00297, train/loss_step=0.445, global_step=5710.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  91%|█████████ | 1099/1208 [30:25<03:01,  1.66s/it, loss=0.18, v_num=0, train/loss_simple_step=0.445, train/loss_vlb_step=0.00297, train/loss_step=0.445, global_step=5710.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  91%|█████████ | 1099/1208 [30:25<03:01,  1.66s/it, loss=0.191, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00123, train/loss_step=0.285, global_step=5710.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  91%|█████████ | 1100/1208 [30:28<02:59,  1.66s/it, loss=0.191, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00123, train/loss_step=0.285, global_step=5710.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  91%|█████████ | 1100/1208 [30:28<02:59,  1.66s/it, loss=0.169, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00167, train/loss_step=0.323, global_step=5710.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  91%|█████████ | 1101/1208 [30:29<02:57,  1.66s/it, loss=0.169, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00167, train/loss_step=0.323, global_step=5710.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  91%|█████████ | 1101/1208 [30:29<02:57,  1.66s/it, loss=0.182, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00123, train/loss_step=0.256, global_step=5711.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  91%|█████████ | 1102/1208 [30:30<02:56,  1.66s/it, loss=0.182, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00123, train/loss_step=0.256, global_step=5711.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  91%|█████████ | 1102/1208 [30:30<02:56,  1.66s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.8e-5, train/loss_step=0.0159, global_step=5711.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  91%|█████████▏| 1103/1208 [30:31<02:54,  1.66s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.8e-5, train/loss_step=0.0159, global_step=5711.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  91%|█████████▏| 1103/1208 [30:31<02:54,  1.66s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.06e-5, train/loss_step=0.0144, global_step=5711.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  91%|█████████▏| 1104/1208 [30:35<02:52,  1.66s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.06e-5, train/loss_step=0.0144, global_step=5711.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  91%|█████████▏| 1104/1208 [30:35<02:52,  1.66s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=0.000102, train/loss_step=0.0246, global_step=5711.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  91%|█████████▏| 1105/1208 [30:36<02:51,  1.66s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=0.000102, train/loss_step=0.0246, global_step=5711.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  91%|█████████▏| 1105/1208 [30:36<02:51,  1.66s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0574, train/loss_vlb_step=0.000201, train/loss_step=0.0574, global_step=5712.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  92%|█████████▏| 1106/1208 [30:37<02:49,  1.66s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0574, train/loss_vlb_step=0.000201, train/loss_step=0.0574, global_step=5712.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  92%|█████████▏| 1106/1208 [30:37<02:49,  1.66s/it, loss=0.208, v_num=0, train/loss_simple_step=0.489, train/loss_vlb_step=0.00474, train/loss_step=0.489, global_step=5712.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  92%|█████████▏| 1107/1208 [30:38<02:47,  1.66s/it, loss=0.208, v_num=0, train/loss_simple_step=0.489, train/loss_vlb_step=0.00474, train/loss_step=0.489, global_step=5712.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  92%|█████████▏| 1107/1208 [30:38<02:47,  1.66s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.00012, train/loss_step=0.0328, global_step=5712.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  92%|█████████▏| 1108/1208 [30:41<02:46,  1.66s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.00012, train/loss_step=0.0328, global_step=5712.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  92%|█████████▏| 1108/1208 [30:41<02:46,  1.66s/it, loss=0.207, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=5712.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  92%|█████████▏| 1109/1208 [30:42<02:44,  1.66s/it, loss=0.207, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=5712.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  92%|█████████▏| 1109/1208 [30:42<02:44,  1.66s/it, loss=0.207, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000852, train/loss_step=0.213, global_step=5713.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  92%|█████████▏| 1110/1208 [30:43<02:42,  1.66s/it, loss=0.207, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000852, train/loss_step=0.213, global_step=5713.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  92%|█████████▏| 1110/1208 [30:43<02:42,  1.66s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.00018, train/loss_step=0.0526, global_step=5713.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  92%|█████████▏| 1111/1208 [30:44<02:41,  1.66s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.00018, train/loss_step=0.0526, global_step=5713.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  92%|█████████▏| 1111/1208 [30:44<02:41,  1.66s/it, loss=0.21, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00482, train/loss_step=0.457, global_step=5713.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  92%|█████████▏| 1112/1208 [30:47<02:39,  1.66s/it, loss=0.21, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00482, train/loss_step=0.457, global_step=5713.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  92%|█████████▏| 1112/1208 [30:47<02:39,  1.66s/it, loss=0.189, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000606, train/loss_step=0.171, global_step=5713.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  92%|█████████▏| 1113/1208 [30:48<02:37,  1.66s/it, loss=0.189, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000606, train/loss_step=0.171, global_step=5713.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  92%|█████████▏| 1113/1208 [30:48<02:37,  1.66s/it, loss=0.167, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00102, train/loss_step=0.255, global_step=5714.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  92%|█████████▏| 1114/1208 [30:49<02:36,  1.66s/it, loss=0.167, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00102, train/loss_step=0.255, global_step=5714.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  92%|█████████▏| 1114/1208 [30:49<02:36,  1.66s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0871, train/loss_vlb_step=0.000288, train/loss_step=0.0871, global_step=5714.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  92%|█████████▏| 1115/1208 [30:50<02:34,  1.66s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0871, train/loss_vlb_step=0.000288, train/loss_step=0.0871, global_step=5714.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  92%|█████████▏| 1115/1208 [30:50<02:34,  1.66s/it, loss=0.183, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.00092, train/loss_step=0.228, global_step=5714.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  92%|█████████▏| 1116/1208 [30:54<02:32,  1.66s/it, loss=0.183, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.00092, train/loss_step=0.228, global_step=5714.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  92%|█████████▏| 1116/1208 [30:54<02:32,  1.66s/it, loss=0.187, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000789, train/loss_step=0.217, global_step=5714.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  92%|█████████▏| 1117/1208 [30:55<02:31,  1.66s/it, loss=0.187, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000789, train/loss_step=0.217, global_step=5714.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  92%|█████████▏| 1117/1208 [30:55<02:31,  1.66s/it, loss=0.195, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.00058, train/loss_step=0.173, global_step=5715.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  93%|█████████▎| 1118/1208 [30:56<02:29,  1.66s/it, loss=0.195, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.00058, train/loss_step=0.173, global_step=5715.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  93%|█████████▎| 1118/1208 [30:56<02:29,  1.66s/it, loss=0.203, v_num=0, train/loss_simple_step=0.601, train/loss_vlb_step=0.0153, train/loss_step=0.601, global_step=5715.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  93%|█████████▎| 1119/1208 [30:57<02:27,  1.66s/it, loss=0.203, v_num=0, train/loss_simple_step=0.601, train/loss_vlb_step=0.0153, train/loss_step=0.601, global_step=5715.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  93%|█████████▎| 1119/1208 [30:57<02:27,  1.66s/it, loss=0.194, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000373, train/loss_step=0.114, global_step=5715.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  93%|█████████▎| 1120/1208 [31:00<02:26,  1.66s/it, loss=0.194, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000373, train/loss_step=0.114, global_step=5715.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  93%|█████████▎| 1120/1208 [31:00<02:26,  1.66s/it, loss=0.189, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000799, train/loss_step=0.216, global_step=5715.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  93%|█████████▎| 1121/1208 [31:01<02:24,  1.66s/it, loss=0.189, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000799, train/loss_step=0.216, global_step=5715.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  93%|█████████▎| 1121/1208 [31:01<02:24,  1.66s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000131, train/loss_step=0.0346, global_step=5716.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  93%|█████████▎| 1122/1208 [31:02<02:22,  1.66s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000131, train/loss_step=0.0346, global_step=5716.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  93%|█████████▎| 1122/1208 [31:02<02:22,  1.66s/it, loss=0.183, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=5716.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  93%|█████████▎| 1123/1208 [31:03<02:21,  1.66s/it, loss=0.183, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=5716.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  93%|█████████▎| 1123/1208 [31:03<02:21,  1.66s/it, loss=0.197, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00163, train/loss_step=0.296, global_step=5716.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  93%|█████████▎| 1124/1208 [31:06<02:19,  1.66s/it, loss=0.197, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00163, train/loss_step=0.296, global_step=5716.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  93%|█████████▎| 1124/1208 [31:07<02:19,  1.66s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.72e-5, train/loss_step=0.00299, global_step=5716.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  93%|█████████▎| 1125/1208 [31:08<02:17,  1.66s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.72e-5, train/loss_step=0.00299, global_step=5716.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  93%|█████████▎| 1125/1208 [31:08<02:17,  1.66s/it, loss=0.202, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000637, train/loss_step=0.183, global_step=5717.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  93%|█████████▎| 1126/1208 [31:09<02:16,  1.66s/it, loss=0.202, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000637, train/loss_step=0.183, global_step=5717.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  93%|█████████▎| 1126/1208 [31:09<02:16,  1.66s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.91e-5, train/loss_step=0.0214, global_step=5717.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  93%|█████████▎| 1127/1208 [31:10<02:14,  1.66s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.91e-5, train/loss_step=0.0214, global_step=5717.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  93%|█████████▎| 1127/1208 [31:10<02:14,  1.66s/it, loss=0.191, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00123, train/loss_step=0.284, global_step=5717.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  93%|█████████▎| 1128/1208 [31:13<02:12,  1.66s/it, loss=0.191, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00123, train/loss_step=0.284, global_step=5717.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  93%|█████████▎| 1128/1208 [31:13<02:12,  1.66s/it, loss=0.194, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000549, train/loss_step=0.160, global_step=5717.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  93%|█████████▎| 1129/1208 [31:14<02:11,  1.66s/it, loss=0.194, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000549, train/loss_step=0.160, global_step=5717.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  93%|█████████▎| 1129/1208 [31:14<02:11,  1.66s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0542, train/loss_vlb_step=0.000192, train/loss_step=0.0542, global_step=5718.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  94%|█████████▎| 1130/1208 [31:15<02:09,  1.66s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0542, train/loss_vlb_step=0.000192, train/loss_step=0.0542, global_step=5718.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  94%|█████████▎| 1130/1208 [31:15<02:09,  1.66s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0915, train/loss_vlb_step=0.000301, train/loss_step=0.0915, global_step=5718.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  94%|█████████▎| 1131/1208 [31:16<02:07,  1.66s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0915, train/loss_vlb_step=0.000301, train/loss_step=0.0915, global_step=5718.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  94%|█████████▎| 1131/1208 [31:16<02:07,  1.66s/it, loss=0.172, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000508, train/loss_step=0.147, global_step=5718.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  94%|█████████▎| 1132/1208 [31:19<02:06,  1.66s/it, loss=0.172, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000508, train/loss_step=0.147, global_step=5718.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  94%|█████████▎| 1132/1208 [31:19<02:06,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000417, train/loss_step=0.124, global_step=5718.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  94%|█████████▍| 1133/1208 [31:20<02:04,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000417, train/loss_step=0.124, global_step=5718.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  94%|█████████▍| 1133/1208 [31:20<02:04,  1.66s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000128, train/loss_step=0.0336, global_step=5719.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  94%|█████████▍| 1134/1208 [31:21<02:02,  1.66s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000128, train/loss_step=0.0336, global_step=5719.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  94%|█████████▍| 1134/1208 [31:21<02:02,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.81e-5, train/loss_step=0.0157, global_step=5719.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  94%|█████████▍| 1135/1208 [31:22<02:01,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.81e-5, train/loss_step=0.0157, global_step=5719.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  94%|█████████▍| 1135/1208 [31:22<02:01,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.00063, train/loss_step=0.177, global_step=5719.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  94%|█████████▍| 1136/1208 [31:26<01:59,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.00063, train/loss_step=0.177, global_step=5719.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  94%|█████████▍| 1136/1208 [31:26<01:59,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0596, train/loss_vlb_step=0.000214, train/loss_step=0.0596, global_step=5719.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  94%|█████████▍| 1137/1208 [31:27<01:57,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0596, train/loss_vlb_step=0.000214, train/loss_step=0.0596, global_step=5719.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  94%|█████████▍| 1137/1208 [31:27<01:57,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0755, train/loss_vlb_step=0.000253, train/loss_step=0.0755, global_step=5720.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  94%|█████████▍| 1138/1208 [31:28<01:56,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0755, train/loss_vlb_step=0.000253, train/loss_step=0.0755, global_step=5720.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  94%|█████████▍| 1138/1208 [31:28<01:56,  1.66s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000109, train/loss_step=0.0277, global_step=5720.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  94%|█████████▍| 1139/1208 [31:29<01:54,  1.66s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000109, train/loss_step=0.0277, global_step=5720.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  94%|█████████▍| 1139/1208 [31:29<01:54,  1.66s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.13e-5, train/loss_step=0.0197, global_step=5720.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  94%|█████████▍| 1140/1208 [31:32<01:52,  1.66s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.13e-5, train/loss_step=0.0197, global_step=5720.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  94%|█████████▍| 1140/1208 [31:32<01:52,  1.66s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.0089, train/loss_vlb_step=4.09e-5, train/loss_step=0.0089, global_step=5720.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  94%|█████████▍| 1141/1208 [31:33<01:51,  1.66s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.0089, train/loss_vlb_step=4.09e-5, train/loss_step=0.0089, global_step=5720.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  94%|█████████▍| 1141/1208 [31:33<01:51,  1.66s/it, loss=0.107, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.000993, train/loss_step=0.249, global_step=5721.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  95%|█████████▍| 1142/1208 [31:34<01:49,  1.66s/it, loss=0.107, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.000993, train/loss_step=0.249, global_step=5721.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  95%|█████████▍| 1142/1208 [31:34<01:49,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.681, train/loss_vlb_step=0.0694, train/loss_step=0.681, global_step=5721.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  95%|█████████▍| 1143/1208 [31:35<01:47,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.681, train/loss_vlb_step=0.0694, train/loss_step=0.681, global_step=5721.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  95%|█████████▍| 1143/1208 [31:35<01:47,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000357, train/loss_step=0.109, global_step=5721.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  95%|█████████▍| 1144/1208 [31:38<01:46,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000357, train/loss_step=0.109, global_step=5721.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  95%|█████████▍| 1144/1208 [31:38<01:46,  1.66s/it, loss=0.142, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00163, train/loss_step=0.317, global_step=5721.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  95%|█████████▍| 1145/1208 [31:39<01:44,  1.66s/it, loss=0.142, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00163, train/loss_step=0.317, global_step=5721.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  95%|█████████▍| 1145/1208 [31:39<01:44,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.26e-5, train/loss_step=0.00211, global_step=5722.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  95%|█████████▍| 1146/1208 [31:41<01:42,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.26e-5, train/loss_step=0.00211, global_step=5722.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  95%|█████████▍| 1146/1208 [31:41<01:42,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0791, train/loss_vlb_step=0.000263, train/loss_step=0.0791, global_step=5722.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  95%|█████████▍| 1147/1208 [31:42<01:41,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0791, train/loss_vlb_step=0.000263, train/loss_step=0.0791, global_step=5722.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  95%|█████████▍| 1147/1208 [31:42<01:41,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.87e-5, train/loss_step=0.0183, global_step=5722.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  95%|█████████▌| 1148/1208 [31:45<01:39,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.87e-5, train/loss_step=0.0183, global_step=5722.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  95%|█████████▌| 1148/1208 [31:45<01:39,  1.66s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0903, train/loss_vlb_step=0.000298, train/loss_step=0.0903, global_step=5722.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  95%|█████████▌| 1149/1208 [31:46<01:37,  1.66s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0903, train/loss_vlb_step=0.000298, train/loss_step=0.0903, global_step=5722.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  95%|█████████▌| 1149/1208 [31:46<01:37,  1.66s/it, loss=0.142, v_num=0, train/loss_simple_step=0.520, train/loss_vlb_step=0.00387, train/loss_step=0.520, global_step=5723.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  95%|█████████▌| 1150/1208 [31:47<01:36,  1.66s/it, loss=0.142, v_num=0, train/loss_simple_step=0.520, train/loss_vlb_step=0.00387, train/loss_step=0.520, global_step=5723.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  95%|█████████▌| 1150/1208 [31:47<01:36,  1.66s/it, loss=0.142, v_num=0, train/loss_simple_step=0.081, train/loss_vlb_step=0.000269, train/loss_step=0.081, global_step=5723.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  95%|█████████▌| 1151/1208 [31:48<01:34,  1.66s/it, loss=0.142, v_num=0, train/loss_simple_step=0.081, train/loss_vlb_step=0.000269, train/loss_step=0.081, global_step=5723.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  95%|█████████▌| 1151/1208 [31:48<01:34,  1.66s/it, loss=0.162, v_num=0, train/loss_simple_step=0.553, train/loss_vlb_step=0.0108, train/loss_step=0.553, global_step=5723.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  95%|█████████▌| 1152/1208 [31:51<01:32,  1.66s/it, loss=0.162, v_num=0, train/loss_simple_step=0.553, train/loss_vlb_step=0.0108, train/loss_step=0.553, global_step=5723.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  95%|█████████▌| 1152/1208 [31:51<01:32,  1.66s/it, loss=0.178, v_num=0, train/loss_simple_step=0.449, train/loss_vlb_step=0.00317, train/loss_step=0.449, global_step=5723.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  95%|█████████▌| 1153/1208 [31:52<01:31,  1.66s/it, loss=0.178, v_num=0, train/loss_simple_step=0.449, train/loss_vlb_step=0.00317, train/loss_step=0.449, global_step=5723.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  95%|█████████▌| 1153/1208 [31:52<01:31,  1.66s/it, loss=0.187, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000781, train/loss_step=0.199, global_step=5724.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  96%|█████████▌| 1154/1208 [31:53<01:29,  1.66s/it, loss=0.187, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000781, train/loss_step=0.199, global_step=5724.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  96%|█████████▌| 1154/1208 [31:53<01:29,  1.66s/it, loss=0.2, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00126, train/loss_step=0.290, global_step=5724.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  96%|█████████▌| 1155/1208 [31:54<01:27,  1.66s/it, loss=0.2, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00126, train/loss_step=0.290, global_step=5724.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  96%|█████████▌| 1155/1208 [31:54<01:27,  1.66s/it, loss=0.216, v_num=0, train/loss_simple_step=0.497, train/loss_vlb_step=0.00502, train/loss_step=0.497, global_step=5724.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  96%|█████████▌| 1156/1208 [31:58<01:26,  1.66s/it, loss=0.216, v_num=0, train/loss_simple_step=0.497, train/loss_vlb_step=0.00502, train/loss_step=0.497, global_step=5724.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  96%|█████████▌| 1156/1208 [31:58<01:26,  1.66s/it, loss=0.228, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00122, train/loss_step=0.288, global_step=5724.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  96%|█████████▌| 1157/1208 [31:59<01:24,  1.66s/it, loss=0.228, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00122, train/loss_step=0.288, global_step=5724.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  96%|█████████▌| 1157/1208 [31:59<01:24,  1.66s/it, loss=0.245, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00386, train/loss_step=0.414, global_step=5725.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  96%|█████████▌| 1158/1208 [32:00<01:22,  1.66s/it, loss=0.245, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00386, train/loss_step=0.414, global_step=5725.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  96%|█████████▌| 1158/1208 [32:00<01:22,  1.66s/it, loss=0.26, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00325, train/loss_step=0.340, global_step=5725.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  96%|█████████▌| 1159/1208 [32:01<01:21,  1.66s/it, loss=0.26, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00325, train/loss_step=0.340, global_step=5725.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  96%|█████████▌| 1159/1208 [32:01<01:21,  1.66s/it, loss=0.26, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5e-5, train/loss_step=0.0109, global_step=5725.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  96%|█████████▌| 1160/1208 [32:04<01:19,  1.66s/it, loss=0.26, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5e-5, train/loss_step=0.0109, global_step=5725.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  96%|█████████▌| 1160/1208 [32:04<01:19,  1.66s/it, loss=0.268, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000612, train/loss_step=0.180, global_step=5725.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  96%|█████████▌| 1161/1208 [32:05<01:17,  1.66s/it, loss=0.268, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000612, train/loss_step=0.180, global_step=5725.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  96%|█████████▌| 1161/1208 [32:05<01:17,  1.66s/it, loss=0.264, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000544, train/loss_step=0.160, global_step=5726.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  96%|█████████▌| 1162/1208 [32:06<01:16,  1.66s/it, loss=0.264, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000544, train/loss_step=0.160, global_step=5726.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  96%|█████████▌| 1162/1208 [32:06<01:16,  1.66s/it, loss=0.239, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000607, train/loss_step=0.175, global_step=5726.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  96%|█████████▋| 1163/1208 [32:07<01:14,  1.66s/it, loss=0.239, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000607, train/loss_step=0.175, global_step=5726.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  96%|█████████▋| 1163/1208 [32:07<01:14,  1.66s/it, loss=0.234, v_num=0, train/loss_simple_step=0.00715, train/loss_vlb_step=3.49e-5, train/loss_step=0.00715, global_step=5726.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  96%|█████████▋| 1164/1208 [32:10<01:12,  1.66s/it, loss=0.234, v_num=0, train/loss_simple_step=0.00715, train/loss_vlb_step=3.49e-5, train/loss_step=0.00715, global_step=5726.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  96%|█████████▋| 1164/1208 [32:10<01:12,  1.66s/it, loss=0.222, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000295, train/loss_step=0.0891, global_step=5726.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  96%|█████████▋| 1165/1208 [32:11<01:11,  1.66s/it, loss=0.222, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000295, train/loss_step=0.0891, global_step=5726.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  96%|█████████▋| 1165/1208 [32:11<01:11,  1.66s/it, loss=0.226, v_num=0, train/loss_simple_step=0.0861, train/loss_vlb_step=0.000283, train/loss_step=0.0861, global_step=5727.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  97%|█████████▋| 1166/1208 [32:13<01:09,  1.66s/it, loss=0.226, v_num=0, train/loss_simple_step=0.0861, train/loss_vlb_step=0.000283, train/loss_step=0.0861, global_step=5727.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  97%|█████████▋| 1166/1208 [32:13<01:09,  1.66s/it, loss=0.232, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000681, train/loss_step=0.191, global_step=5727.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  97%|█████████▋| 1167/1208 [32:14<01:07,  1.66s/it, loss=0.232, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000681, train/loss_step=0.191, global_step=5727.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  97%|█████████▋| 1167/1208 [32:14<01:07,  1.66s/it, loss=0.233, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.00015, train/loss_step=0.0417, global_step=5727.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  97%|█████████▋| 1168/1208 [32:17<01:06,  1.66s/it, loss=0.233, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.00015, train/loss_step=0.0417, global_step=5727.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  97%|█████████▋| 1168/1208 [32:17<01:06,  1.66s/it, loss=0.231, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000145, train/loss_step=0.0392, global_step=5727.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  97%|█████████▋| 1169/1208 [32:18<01:04,  1.66s/it, loss=0.231, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000145, train/loss_step=0.0392, global_step=5727.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  97%|█████████▋| 1169/1208 [32:18<01:04,  1.66s/it, loss=0.211, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000455, train/loss_step=0.136, global_step=5728.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  97%|█████████▋| 1170/1208 [32:19<01:02,  1.66s/it, loss=0.211, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000455, train/loss_step=0.136, global_step=5728.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  97%|█████████▋| 1170/1208 [32:19<01:02,  1.66s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.26e-5, train/loss_step=0.0022, global_step=5728.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  97%|█████████▋| 1171/1208 [32:20<01:01,  1.66s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.26e-5, train/loss_step=0.0022, global_step=5728.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  97%|█████████▋| 1171/1208 [32:20<01:01,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=8.8e-5, train/loss_step=0.0221, global_step=5728.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  97%|█████████▋| 1172/1208 [32:23<00:59,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=8.8e-5, train/loss_step=0.0221, global_step=5728.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  97%|█████████▋| 1172/1208 [32:23<00:59,  1.66s/it, loss=0.18, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00556, train/loss_step=0.427, global_step=5728.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  97%|█████████▋| 1173/1208 [32:24<00:58,  1.66s/it, loss=0.18, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00556, train/loss_step=0.427, global_step=5728.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  97%|█████████▋| 1173/1208 [32:24<00:58,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00992, train/loss_vlb_step=4.5e-5, train/loss_step=0.00992, global_step=5729.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  97%|█████████▋| 1174/1208 [32:25<00:56,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00992, train/loss_vlb_step=4.5e-5, train/loss_step=0.00992, global_step=5729.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  97%|█████████▋| 1174/1208 [32:25<00:56,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.466, train/loss_vlb_step=0.00492, train/loss_step=0.466, global_step=5729.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  97%|█████████▋| 1175/1208 [32:26<00:54,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.466, train/loss_vlb_step=0.00492, train/loss_step=0.466, global_step=5729.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  97%|█████████▋| 1175/1208 [32:26<00:54,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0695, train/loss_vlb_step=0.000233, train/loss_step=0.0695, global_step=5729.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  97%|█████████▋| 1176/1208 [32:30<00:53,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0695, train/loss_vlb_step=0.000233, train/loss_step=0.0695, global_step=5729.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  97%|█████████▋| 1176/1208 [32:30<00:53,  1.66s/it, loss=0.152, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000623, train/loss_step=0.178, global_step=5729.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  97%|█████████▋| 1177/1208 [32:31<00:51,  1.66s/it, loss=0.152, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000623, train/loss_step=0.178, global_step=5729.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  97%|█████████▋| 1177/1208 [32:31<00:51,  1.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.71e-5, train/loss_step=0.00557, global_step=5730.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  98%|█████████▊| 1178/1208 [32:32<00:49,  1.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.71e-5, train/loss_step=0.00557, global_step=5730.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  98%|█████████▊| 1178/1208 [32:32<00:49,  1.66s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0774, train/loss_vlb_step=0.00026, train/loss_step=0.0774, global_step=5730.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  98%|█████████▊| 1179/1208 [32:33<00:48,  1.66s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0774, train/loss_vlb_step=0.00026, train/loss_step=0.0774, global_step=5730.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  98%|█████████▊| 1179/1208 [32:33<00:48,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.419, train/loss_vlb_step=0.004, train/loss_step=0.419, global_step=5730.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  98%|█████████▊| 1180/1208 [32:36<00:46,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.419, train/loss_vlb_step=0.004, train/loss_step=0.419, global_step=5730.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  98%|█████████▊| 1180/1208 [32:36<00:46,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000403, train/loss_step=0.123, global_step=5730.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  98%|█████████▊| 1181/1208 [32:37<00:44,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000403, train/loss_step=0.123, global_step=5730.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  98%|█████████▊| 1181/1208 [32:37<00:44,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00604, train/loss_vlb_step=3.12e-5, train/loss_step=0.00604, global_step=5731.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  98%|█████████▊| 1182/1208 [32:38<00:43,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00604, train/loss_vlb_step=3.12e-5, train/loss_step=0.00604, global_step=5731.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  98%|█████████▊| 1182/1208 [32:38<00:43,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0419, train/loss_vlb_step=0.000152, train/loss_step=0.0419, global_step=5731.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  98%|█████████▊| 1183/1208 [32:39<00:41,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0419, train/loss_vlb_step=0.000152, train/loss_step=0.0419, global_step=5731.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  98%|█████████▊| 1183/1208 [32:39<00:41,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.561, train/loss_vlb_step=0.00664, train/loss_step=0.561, global_step=5731.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  98%|█████████▊| 1184/1208 [32:42<00:39,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.561, train/loss_vlb_step=0.00664, train/loss_step=0.561, global_step=5731.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  98%|█████████▊| 1184/1208 [32:42<00:39,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00113, train/loss_step=0.261, global_step=5731.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  98%|█████████▊| 1185/1208 [32:43<00:38,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00113, train/loss_step=0.261, global_step=5731.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  98%|█████████▊| 1185/1208 [32:43<00:38,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.76e-5, train/loss_step=0.0191, global_step=5732.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  98%|█████████▊| 1186/1208 [32:44<00:36,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.76e-5, train/loss_step=0.0191, global_step=5732.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  98%|█████████▊| 1186/1208 [32:44<00:36,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0874, train/loss_vlb_step=0.000287, train/loss_step=0.0874, global_step=5732.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  98%|█████████▊| 1187/1208 [32:45<00:34,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0874, train/loss_vlb_step=0.000287, train/loss_step=0.0874, global_step=5732.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  98%|█████████▊| 1187/1208 [32:45<00:34,  1.66s/it, loss=0.18, v_num=0, train/loss_simple_step=0.642, train/loss_vlb_step=0.0258, train/loss_step=0.642, global_step=5732.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  98%|█████████▊| 1188/1208 [32:49<00:33,  1.66s/it, loss=0.18, v_num=0, train/loss_simple_step=0.642, train/loss_vlb_step=0.0258, train/loss_step=0.642, global_step=5732.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  98%|█████████▊| 1188/1208 [32:49<00:33,  1.66s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.34e-5, train/loss_step=0.00257, global_step=5732.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  98%|█████████▊| 1189/1208 [32:50<00:31,  1.66s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.34e-5, train/loss_step=0.00257, global_step=5732.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  98%|█████████▊| 1189/1208 [32:50<00:31,  1.66s/it, loss=0.18, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000666, train/loss_step=0.184, global_step=5733.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18:  99%|█████████▊| 1190/1208 [32:51<00:29,  1.66s/it, loss=0.18, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000666, train/loss_step=0.184, global_step=5733.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  99%|█████████▊| 1190/1208 [32:51<00:29,  1.66s/it, loss=0.186, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000384, train/loss_step=0.117, global_step=5733.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  99%|█████████▊| 1191/1208 [32:52<00:28,  1.66s/it, loss=0.186, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000384, train/loss_step=0.117, global_step=5733.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  99%|█████████▊| 1191/1208 [32:52<00:28,  1.66s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0611, train/loss_vlb_step=0.000213, train/loss_step=0.0611, global_step=5733.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  99%|█████████▊| 1192/1208 [32:55<00:26,  1.66s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0611, train/loss_vlb_step=0.000213, train/loss_step=0.0611, global_step=5733.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  99%|█████████▊| 1192/1208 [32:55<00:26,  1.66s/it, loss=0.175, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000572, train/loss_step=0.167, global_step=5733.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]  Epoch 18:  99%|█████████▉| 1193/1208 [32:56<00:24,  1.66s/it, loss=0.175, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000572, train/loss_step=0.167, global_step=5733.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  99%|█████████▉| 1193/1208 [32:56<00:24,  1.66s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.46e-5, train/loss_step=0.00254, global_step=5734.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  99%|█████████▉| 1194/1208 [32:57<00:23,  1.66s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.46e-5, train/loss_step=0.00254, global_step=5734.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  99%|█████████▉| 1194/1208 [32:57<00:23,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000461, train/loss_step=0.140, global_step=5734.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  99%|█████████▉| 1195/1208 [32:58<00:21,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000461, train/loss_step=0.140, global_step=5734.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  99%|█████████▉| 1195/1208 [32:58<00:21,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.89e-5, train/loss_step=0.00342, global_step=5734.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  99%|█████████▉| 1196/1208 [33:01<00:19,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.89e-5, train/loss_step=0.00342, global_step=5734.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  99%|█████████▉| 1196/1208 [33:01<00:19,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000617, train/loss_step=0.184, global_step=5734.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18:  99%|█████████▉| 1197/1208 [33:02<00:18,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000617, train/loss_step=0.184, global_step=5734.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  99%|█████████▉| 1197/1208 [33:02<00:18,  1.66s/it, loss=0.169, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00129, train/loss_step=0.278, global_step=5735.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18:  99%|█████████▉| 1198/1208 [33:03<00:16,  1.66s/it, loss=0.169, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00129, train/loss_step=0.278, global_step=5735.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  99%|█████████▉| 1198/1208 [33:03<00:16,  1.66s/it, loss=0.173, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000576, train/loss_step=0.165, global_step=5735.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  99%|█████████▉| 1199/1208 [33:05<00:14,  1.66s/it, loss=0.173, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000576, train/loss_step=0.165, global_step=5735.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  99%|█████████▉| 1199/1208 [33:05<00:14,  1.66s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=1.74e-5, train/loss_step=0.00315, global_step=5735.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  99%|█████████▉| 1200/1208 [33:08<00:13,  1.66s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=1.74e-5, train/loss_step=0.00315, global_step=5735.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  99%|█████████▉| 1200/1208 [33:08<00:13,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.000227, train/loss_step=0.067, global_step=5735.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.73it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.74it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.74it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.83it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.76it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.76it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.76it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.76it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.76it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.76it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.75it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.75it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.81it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.83it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.78it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.78it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 18:  99%|█████████▉| 1201/1208 [33:38<00:11,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.000227, train/loss_step=0.067, global_step=5735.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18:  99%|█████████▉| 1201/1208 [33:38<00:11,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000129, train/loss_step=0.0339, global_step=5736.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18: 100%|█████████▉| 1202/1208 [33:39<00:10,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000129, train/loss_step=0.0339, global_step=5736.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18: 100%|█████████▉| 1202/1208 [33:39<00:10,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000115, train/loss_step=0.0301, global_step=5736.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141] Epoch 18: 100%|█████████▉| 1203/1208 [33:40<00:08,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000115, train/loss_step=0.0301, global_step=5736.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18: 100%|█████████▉| 1203/1208 [33:40<00:08,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=8.73e-5, train/loss_step=0.0223, global_step=5736.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18: 100%|█████████▉| 1204/1208 [33:44<00:06,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=8.73e-5, train/loss_step=0.0223, global_step=5736.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18: 100%|█████████▉| 1204/1208 [33:44<00:06,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.860, train/loss_vlb_step=0.109, train/loss_step=0.860, global_step=5736.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]    Epoch 18: 100%|█████████▉| 1205/1208 [33:45<00:05,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.860, train/loss_vlb_step=0.109, train/loss_step=0.860, global_step=5736.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18: 100%|█████████▉| 1205/1208 [33:45<00:05,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00782, train/loss_vlb_step=3.71e-5, train/loss_step=0.00782, global_step=5737.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18: 100%|█████████▉| 1206/1208 [33:46<00:03,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00782, train/loss_vlb_step=3.71e-5, train/loss_step=0.00782, global_step=5737.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18: 100%|█████████▉| 1206/1208 [33:46<00:03,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000993, train/loss_step=0.250, global_step=5737.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]   Epoch 18: 100%|█████████▉| 1207/1208 [33:47<00:01,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000993, train/loss_step=0.250, global_step=5737.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18: 100%|█████████▉| 1207/1208 [33:47<00:01,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000136, train/loss_step=0.0372, global_step=5737.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18: 100%|██████████| 1208/1208 [33:52<00:00,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000136, train/loss_step=0.0372, global_step=5737.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 18: 100%|██████████| 1208/1208 [33:52<00:00,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00369, train/loss_vlb_step=1.97e-5, train/loss_step=0.00369, global_step=5737.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]
+
+
+Epoch 18:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.131, v_num=0, train/loss_simple_step=0.00369, train/loss_vlb_step=1.97e-5, train/loss_step=0.00369, global_step=5737.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]           Epoch 19:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.131, v_num=0, train/loss_simple_step=0.00369, train/loss_vlb_step=1.97e-5, train/loss_step=0.00369, global_step=5737.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][AData shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.72it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.75it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.84it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.83it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.83it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.83it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.83it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.80it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.80it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.76it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.80it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.76it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.76it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.78it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.73it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.74it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:08,  1.66it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.69it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.78it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.78it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:07,  1.71it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.78it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.72it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.73it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.73it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.73it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.74it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.75it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.77it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.78it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.75it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.75it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.75it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 19:   0%|          | 1/1208 [00:32<11:01:14, 32.87s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00369, train/loss_vlb_step=1.97e-5, train/loss_step=0.00369, global_step=5737.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00278, train/loss_epoch=0.141]Epoch 19:   0%|          | 1/1208 [00:32<11:01:15, 32.87s/it, loss=0.147, v_num=0, train/loss_simple_step=0.498, train/loss_vlb_step=0.0112, train/loss_step=0.498, global_step=5738.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]     Epoch 19:   0%|          | 2/1208 [00:33<5:40:40, 16.95s/it, loss=0.147, v_num=0, train/loss_simple_step=0.498, train/loss_vlb_step=0.0112, train/loss_step=0.498, global_step=5738.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:   0%|          | 2/1208 [00:33<5:40:41, 16.95s/it, loss=0.162, v_num=0, train/loss_simple_step=0.422, train/loss_vlb_step=0.00459, train/loss_step=0.422, global_step=5738.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   0%|          | 3/1208 [00:34<3:53:48, 11.64s/it, loss=0.162, v_num=0, train/loss_simple_step=0.422, train/loss_vlb_step=0.00459, train/loss_step=0.422, global_step=5738.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   0%|          | 3/1208 [00:34<3:53:48, 11.64s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00477, train/loss_vlb_step=2.54e-5, train/loss_step=0.00477, global_step=5738.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   0%|          | 4/1208 [00:38<3:10:48,  9.51s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00477, train/loss_vlb_step=2.54e-5, train/loss_step=0.00477, global_step=5738.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   0%|          | 4/1208 [00:38<3:10:49,  9.51s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.42e-5, train/loss_step=0.0207, global_step=5738.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:   0%|          | 5/1208 [00:39<2:36:47,  7.82s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.42e-5, train/loss_step=0.0207, global_step=5738.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   0%|          | 5/1208 [00:39<2:36:47,  7.82s/it, loss=0.162, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000793, train/loss_step=0.215, global_step=5739.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:   0%|          | 6/1208 [00:40<2:13:58,  6.69s/it, loss=0.162, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000793, train/loss_step=0.215, global_step=5739.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   0%|          | 6/1208 [00:40<2:13:58,  6.69s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000196, train/loss_step=0.0545, global_step=5739.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   1%|          | 7/1208 [00:41<1:57:40,  5.88s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000196, train/loss_step=0.0545, global_step=5739.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   1%|          | 7/1208 [00:41<1:57:41,  5.88s/it, loss=0.165, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000493, train/loss_step=0.148, global_step=5739.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:   1%|          | 8/1208 [00:44<1:50:59,  5.55s/it, loss=0.165, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000493, train/loss_step=0.148, global_step=5739.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   1%|          | 8/1208 [00:44<1:50:59,  5.55s/it, loss=0.162, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000407, train/loss_step=0.123, global_step=5739.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   1%|          | 9/1208 [00:45<1:40:56,  5.05s/it, loss=0.162, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000407, train/loss_step=0.123, global_step=5739.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   1%|          | 9/1208 [00:45<1:40:56,  5.05s/it, loss=0.171, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.00458, train/loss_step=0.460, global_step=5740.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:   1%|          | 10/1208 [00:46<1:32:52,  4.65s/it, loss=0.171, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.00458, train/loss_step=0.460, global_step=5740.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   1%|          | 10/1208 [00:46<1:32:52,  4.65s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0331, train/loss_vlb_step=0.000123, train/loss_step=0.0331, global_step=5740.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   1%|          | 11/1208 [00:47<1:26:14,  4.32s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0331, train/loss_vlb_step=0.000123, train/loss_step=0.0331, global_step=5740.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   1%|          | 11/1208 [00:47<1:26:14,  4.32s/it, loss=0.171, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000442, train/loss_step=0.134, global_step=5740.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:   1%|          | 12/1208 [00:50<1:24:20,  4.23s/it, loss=0.171, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000442, train/loss_step=0.134, global_step=5740.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   1%|          | 12/1208 [00:50<1:24:20,  4.23s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00915, train/loss_vlb_step=4.46e-5, train/loss_step=0.00915, global_step=5740.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   1%|          | 13/1208 [00:51<1:19:24,  3.99s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00915, train/loss_vlb_step=4.46e-5, train/loss_step=0.00915, global_step=5740.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   1%|          | 13/1208 [00:51<1:19:24,  3.99s/it, loss=0.182, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00143, train/loss_step=0.306, global_step=5741.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:   1%|          | 14/1208 [00:52<1:15:09,  3.78s/it, loss=0.182, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00143, train/loss_step=0.306, global_step=5741.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   1%|          | 14/1208 [00:52<1:15:09,  3.78s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0872, train/loss_vlb_step=0.000288, train/loss_step=0.0872, global_step=5741.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   1%|          | 15/1208 [00:53<1:11:27,  3.59s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0872, train/loss_vlb_step=0.000288, train/loss_step=0.0872, global_step=5741.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   1%|          | 15/1208 [00:53<1:11:27,  3.59s/it, loss=0.194, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000705, train/loss_step=0.200, global_step=5741.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:   1%|▏         | 16/1208 [00:57<1:10:58,  3.57s/it, loss=0.194, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000705, train/loss_step=0.200, global_step=5741.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   1%|▏         | 16/1208 [00:57<1:10:58,  3.57s/it, loss=0.174, v_num=0, train/loss_simple_step=0.462, train/loss_vlb_step=0.00383, train/loss_step=0.462, global_step=5741.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:   1%|▏         | 17/1208 [00:58<1:07:58,  3.42s/it, loss=0.174, v_num=0, train/loss_simple_step=0.462, train/loss_vlb_step=0.00383, train/loss_step=0.462, global_step=5741.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   1%|▏         | 17/1208 [00:58<1:07:58,  3.42s/it, loss=0.181, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000502, train/loss_step=0.152, global_step=5742.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   1%|▏         | 18/1208 [00:59<1:05:17,  3.29s/it, loss=0.181, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000502, train/loss_step=0.152, global_step=5742.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   1%|▏         | 18/1208 [00:59<1:05:17,  3.29s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.55e-5, train/loss_step=0.0028, global_step=5742.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   2%|▏         | 19/1208 [01:00<1:02:52,  3.17s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.55e-5, train/loss_step=0.0028, global_step=5742.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   2%|▏         | 19/1208 [01:00<1:02:52,  3.17s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00864, train/loss_vlb_step=4.33e-5, train/loss_step=0.00864, global_step=5742.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   2%|▏         | 20/1208 [01:03<1:02:54,  3.18s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00864, train/loss_vlb_step=4.33e-5, train/loss_step=0.00864, global_step=5742.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   2%|▏         | 20/1208 [01:03<1:02:54,  3.18s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.00017, train/loss_step=0.0483, global_step=5742.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:   2%|▏         | 21/1208 [01:04<1:00:51,  3.08s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.00017, train/loss_step=0.0483, global_step=5742.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   2%|▏         | 21/1208 [01:04<1:00:51,  3.08s/it, loss=0.153, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000598, train/loss_step=0.177, global_step=5743.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:   2%|▏         | 22/1208 [01:05<58:59,  2.98s/it, loss=0.153, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000598, train/loss_step=0.177, global_step=5743.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:   2%|▏         | 22/1208 [01:05<58:59,  2.98s/it, loss=0.148, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.0016, train/loss_step=0.308, global_step=5743.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:   2%|▏         | 23/1208 [01:06<57:15,  2.90s/it, loss=0.148, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.0016, train/loss_step=0.308, global_step=5743.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   2%|▏         | 23/1208 [01:06<57:16,  2.90s/it, loss=0.156, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000604, train/loss_step=0.180, global_step=5743.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   2%|▏         | 24/1208 [01:09<57:29,  2.91s/it, loss=0.156, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000604, train/loss_step=0.180, global_step=5743.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   2%|▏         | 24/1208 [01:09<57:29,  2.91s/it, loss=0.166, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000771, train/loss_step=0.219, global_step=5743.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   2%|▏         | 25/1208 [01:10<55:58,  2.84s/it, loss=0.166, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000771, train/loss_step=0.219, global_step=5743.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   2%|▏         | 25/1208 [01:10<55:58,  2.84s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00498, train/loss_vlb_step=2.55e-5, train/loss_step=0.00498, global_step=5744.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   2%|▏         | 26/1208 [01:11<54:32,  2.77s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00498, train/loss_vlb_step=2.55e-5, train/loss_step=0.00498, global_step=5744.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   2%|▏         | 26/1208 [01:11<54:32,  2.77s/it, loss=0.163, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000773, train/loss_step=0.199, global_step=5744.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:   2%|▏         | 27/1208 [01:13<53:13,  2.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000773, train/loss_step=0.199, global_step=5744.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   2%|▏         | 27/1208 [01:13<53:13,  2.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000424, train/loss_step=0.129, global_step=5744.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   2%|▏         | 28/1208 [01:16<53:35,  2.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000424, train/loss_step=0.129, global_step=5744.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   2%|▏         | 28/1208 [01:16<53:35,  2.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000104, train/loss_step=0.0264, global_step=5744.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   2%|▏         | 29/1208 [01:17<52:24,  2.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000104, train/loss_step=0.0264, global_step=5744.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   2%|▏         | 29/1208 [01:17<52:24,  2.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0762, train/loss_vlb_step=0.000253, train/loss_step=0.0762, global_step=5745.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   2%|▏         | 30/1208 [01:18<51:17,  2.61s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0762, train/loss_vlb_step=0.000253, train/loss_step=0.0762, global_step=5745.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   2%|▏         | 30/1208 [01:18<51:17,  2.61s/it, loss=0.146, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000708, train/loss_step=0.195, global_step=5745.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:   3%|▎         | 31/1208 [01:19<50:14,  2.56s/it, loss=0.146, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000708, train/loss_step=0.195, global_step=5745.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   3%|▎         | 31/1208 [01:19<50:14,  2.56s/it, loss=0.142, v_num=0, train/loss_simple_step=0.053, train/loss_vlb_step=0.000187, train/loss_step=0.053, global_step=5745.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   3%|▎         | 32/1208 [01:22<50:37,  2.58s/it, loss=0.142, v_num=0, train/loss_simple_step=0.053, train/loss_vlb_step=0.000187, train/loss_step=0.053, global_step=5745.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   3%|▎         | 32/1208 [01:22<50:37,  2.58s/it, loss=0.163, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00455, train/loss_step=0.418, global_step=5745.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:   3%|▎         | 33/1208 [01:23<49:41,  2.54s/it, loss=0.163, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00455, train/loss_step=0.418, global_step=5745.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   3%|▎         | 33/1208 [01:23<49:41,  2.54s/it, loss=0.162, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00159, train/loss_step=0.292, global_step=5746.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   3%|▎         | 34/1208 [01:24<48:46,  2.49s/it, loss=0.162, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00159, train/loss_step=0.292, global_step=5746.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   3%|▎         | 34/1208 [01:24<48:46,  2.49s/it, loss=0.163, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=5746.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   3%|▎         | 35/1208 [01:25<47:55,  2.45s/it, loss=0.163, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=5746.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   3%|▎         | 35/1208 [01:25<47:55,  2.45s/it, loss=0.159, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000436, train/loss_step=0.133, global_step=5746.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   3%|▎         | 36/1208 [01:29<48:19,  2.47s/it, loss=0.159, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000436, train/loss_step=0.133, global_step=5746.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   3%|▎         | 36/1208 [01:29<48:19,  2.47s/it, loss=0.157, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00242, train/loss_step=0.407, global_step=5746.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:   3%|▎         | 37/1208 [01:30<47:31,  2.44s/it, loss=0.157, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00242, train/loss_step=0.407, global_step=5746.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   3%|▎         | 37/1208 [01:30<47:31,  2.44s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.09e-5, train/loss_step=0.00188, global_step=5747.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   3%|▎         | 38/1208 [01:31<46:45,  2.40s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.09e-5, train/loss_step=0.00188, global_step=5747.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   3%|▎         | 38/1208 [01:31<46:46,  2.40s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0606, train/loss_vlb_step=0.000212, train/loss_step=0.0606, global_step=5747.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:   3%|▎         | 39/1208 [01:32<46:02,  2.36s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0606, train/loss_vlb_step=0.000212, train/loss_step=0.0606, global_step=5747.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   3%|▎         | 39/1208 [01:32<46:02,  2.36s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.000127, train/loss_step=0.0326, global_step=5747.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   3%|▎         | 40/1208 [01:35<46:26,  2.39s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.000127, train/loss_step=0.0326, global_step=5747.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   3%|▎         | 40/1208 [01:35<46:26,  2.39s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00703, train/loss_vlb_step=3.46e-5, train/loss_step=0.00703, global_step=5747.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   3%|▎         | 41/1208 [01:36<45:45,  2.35s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00703, train/loss_vlb_step=3.46e-5, train/loss_step=0.00703, global_step=5747.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   3%|▎         | 41/1208 [01:36<45:45,  2.35s/it, loss=0.152, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000712, train/loss_step=0.195, global_step=5748.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:   3%|▎         | 42/1208 [01:37<45:06,  2.32s/it, loss=0.152, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000712, train/loss_step=0.195, global_step=5748.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   3%|▎         | 42/1208 [01:37<45:06,  2.32s/it, loss=0.153, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00188, train/loss_step=0.334, global_step=5748.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:   4%|▎         | 43/1208 [01:38<44:29,  2.29s/it, loss=0.153, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00188, train/loss_step=0.334, global_step=5748.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   4%|▎         | 43/1208 [01:38<44:29,  2.29s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0954, train/loss_vlb_step=0.000315, train/loss_step=0.0954, global_step=5748.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   4%|▎         | 44/1208 [01:41<44:52,  2.31s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0954, train/loss_vlb_step=0.000315, train/loss_step=0.0954, global_step=5748.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   4%|▎         | 44/1208 [01:41<44:52,  2.31s/it, loss=0.151, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00099, train/loss_step=0.253, global_step=5748.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:   4%|▎         | 45/1208 [01:42<44:17,  2.29s/it, loss=0.151, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00099, train/loss_step=0.253, global_step=5748.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   4%|▎         | 45/1208 [01:42<44:17,  2.29s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0589, train/loss_vlb_step=0.000204, train/loss_step=0.0589, global_step=5749.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   4%|▍         | 46/1208 [01:43<43:43,  2.26s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0589, train/loss_vlb_step=0.000204, train/loss_step=0.0589, global_step=5749.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   4%|▍         | 46/1208 [01:43<43:44,  2.26s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.23e-5, train/loss_step=0.0114, global_step=5749.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:   4%|▍         | 47/1208 [01:44<43:11,  2.23s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.23e-5, train/loss_step=0.0114, global_step=5749.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   4%|▍         | 47/1208 [01:44<43:11,  2.23s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0303, train/loss_vlb_step=0.00011, train/loss_step=0.0303, global_step=5749.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   4%|▍         | 48/1208 [01:48<43:34,  2.25s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0303, train/loss_vlb_step=0.00011, train/loss_step=0.0303, global_step=5749.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   4%|▍         | 48/1208 [01:48<43:34,  2.25s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000123, train/loss_step=0.0332, global_step=5749.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   4%|▍         | 49/1208 [01:49<43:03,  2.23s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000123, train/loss_step=0.0332, global_step=5749.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   4%|▍         | 49/1208 [01:49<43:03,  2.23s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0655, train/loss_vlb_step=0.000226, train/loss_step=0.0655, global_step=5750.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   4%|▍         | 50/1208 [01:50<42:33,  2.20s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0655, train/loss_vlb_step=0.000226, train/loss_step=0.0655, global_step=5750.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   4%|▍         | 50/1208 [01:50<42:33,  2.20s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.00013, train/loss_step=0.0346, global_step=5750.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:   4%|▍         | 51/1208 [01:51<42:04,  2.18s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.00013, train/loss_step=0.0346, global_step=5750.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   4%|▍         | 51/1208 [01:51<42:04,  2.18s/it, loss=0.153, v_num=0, train/loss_simple_step=0.492, train/loss_vlb_step=0.00563, train/loss_step=0.492, global_step=5750.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:   4%|▍         | 52/1208 [01:54<42:25,  2.20s/it, loss=0.153, v_num=0, train/loss_simple_step=0.492, train/loss_vlb_step=0.00563, train/loss_step=0.492, global_step=5750.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   4%|▍         | 52/1208 [01:54<42:25,  2.20s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.76e-5, train/loss_step=0.0242, global_step=5750.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   4%|▍         | 53/1208 [01:55<41:58,  2.18s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.76e-5, train/loss_step=0.0242, global_step=5750.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   4%|▍         | 53/1208 [01:55<41:58,  2.18s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.17e-5, train/loss_step=0.0168, global_step=5751.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   4%|▍         | 54/1208 [01:56<41:31,  2.16s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.17e-5, train/loss_step=0.0168, global_step=5751.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   4%|▍         | 54/1208 [01:56<41:31,  2.16s/it, loss=0.128, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00113, train/loss_step=0.277, global_step=5751.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:   5%|▍         | 55/1208 [01:57<41:06,  2.14s/it, loss=0.128, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00113, train/loss_step=0.277, global_step=5751.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   5%|▍         | 55/1208 [01:57<41:06,  2.14s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=8.86e-5, train/loss_step=0.0217, global_step=5751.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   5%|▍         | 56/1208 [02:00<41:25,  2.16s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=8.86e-5, train/loss_step=0.0217, global_step=5751.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   5%|▍         | 56/1208 [02:00<41:25,  2.16s/it, loss=0.105, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.000172, train/loss_step=0.048, global_step=5751.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:   5%|▍         | 57/1208 [02:01<41:01,  2.14s/it, loss=0.105, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.000172, train/loss_step=0.048, global_step=5751.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   5%|▍         | 57/1208 [02:01<41:01,  2.14s/it, loss=0.121, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00186, train/loss_step=0.331, global_step=5752.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:   5%|▍         | 58/1208 [02:02<40:37,  2.12s/it, loss=0.121, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00186, train/loss_step=0.331, global_step=5752.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   5%|▍         | 58/1208 [02:02<40:37,  2.12s/it, loss=0.138, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00188, train/loss_step=0.397, global_step=5752.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   5%|▍         | 59/1208 [02:03<40:13,  2.10s/it, loss=0.138, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00188, train/loss_step=0.397, global_step=5752.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   5%|▍         | 59/1208 [02:03<40:13,  2.10s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.7e-5, train/loss_step=0.00303, global_step=5752.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   5%|▍         | 60/1208 [02:07<40:32,  2.12s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.7e-5, train/loss_step=0.00303, global_step=5752.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   5%|▍         | 60/1208 [02:07<40:32,  2.12s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0662, train/loss_vlb_step=0.000226, train/loss_step=0.0662, global_step=5752.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   5%|▌         | 61/1208 [02:08<40:10,  2.10s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0662, train/loss_vlb_step=0.000226, train/loss_step=0.0662, global_step=5752.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   5%|▌         | 61/1208 [02:08<40:10,  2.10s/it, loss=0.135, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000367, train/loss_step=0.111, global_step=5753.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:   5%|▌         | 62/1208 [02:09<39:48,  2.08s/it, loss=0.135, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000367, train/loss_step=0.111, global_step=5753.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   5%|▌         | 62/1208 [02:09<39:48,  2.08s/it, loss=0.134, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00152, train/loss_step=0.319, global_step=5753.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:   5%|▌         | 63/1208 [02:10<39:27,  2.07s/it, loss=0.134, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00152, train/loss_step=0.319, global_step=5753.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   5%|▌         | 63/1208 [02:10<39:27,  2.07s/it, loss=0.151, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00544, train/loss_step=0.427, global_step=5753.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   5%|▌         | 64/1208 [02:13<39:46,  2.09s/it, loss=0.151, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00544, train/loss_step=0.427, global_step=5753.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   5%|▌         | 64/1208 [02:13<39:46,  2.09s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0289, train/loss_vlb_step=0.000113, train/loss_step=0.0289, global_step=5753.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   5%|▌         | 65/1208 [02:14<39:25,  2.07s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0289, train/loss_vlb_step=0.000113, train/loss_step=0.0289, global_step=5753.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   5%|▌         | 65/1208 [02:14<39:25,  2.07s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.00017, train/loss_step=0.0471, global_step=5754.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   5%|▌         | 66/1208 [02:15<39:05,  2.05s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.00017, train/loss_step=0.0471, global_step=5754.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   5%|▌         | 66/1208 [02:15<39:05,  2.05s/it, loss=0.165, v_num=0, train/loss_simple_step=0.535, train/loss_vlb_step=0.00951, train/loss_step=0.535, global_step=5754.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:   6%|▌         | 67/1208 [02:16<38:46,  2.04s/it, loss=0.165, v_num=0, train/loss_simple_step=0.535, train/loss_vlb_step=0.00951, train/loss_step=0.535, global_step=5754.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   6%|▌         | 67/1208 [02:16<38:46,  2.04s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00961, train/loss_vlb_step=4.39e-5, train/loss_step=0.00961, global_step=5754.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   6%|▌         | 68/1208 [02:19<39:05,  2.06s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00961, train/loss_vlb_step=4.39e-5, train/loss_step=0.00961, global_step=5754.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   6%|▌         | 68/1208 [02:19<39:05,  2.06s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000147, train/loss_step=0.0399, global_step=5754.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:   6%|▌         | 69/1208 [02:20<38:46,  2.04s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000147, train/loss_step=0.0399, global_step=5754.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   6%|▌         | 69/1208 [02:20<38:46,  2.04s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=7.96e-5, train/loss_step=0.0193, global_step=5755.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:   6%|▌         | 70/1208 [02:21<38:28,  2.03s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=7.96e-5, train/loss_step=0.0193, global_step=5755.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   6%|▌         | 70/1208 [02:21<38:28,  2.03s/it, loss=0.188, v_num=0, train/loss_simple_step=0.547, train/loss_vlb_step=0.00626, train/loss_step=0.547, global_step=5755.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:   6%|▌         | 71/1208 [02:23<38:10,  2.01s/it, loss=0.188, v_num=0, train/loss_simple_step=0.547, train/loss_vlb_step=0.00626, train/loss_step=0.547, global_step=5755.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   6%|▌         | 71/1208 [02:23<38:10,  2.01s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00609, train/loss_vlb_step=3.05e-5, train/loss_step=0.00609, global_step=5755.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   6%|▌         | 72/1208 [02:26<38:28,  2.03s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00609, train/loss_vlb_step=3.05e-5, train/loss_step=0.00609, global_step=5755.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   6%|▌         | 72/1208 [02:26<38:28,  2.03s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0518, train/loss_vlb_step=0.000186, train/loss_step=0.0518, global_step=5755.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:   6%|▌         | 73/1208 [02:27<38:10,  2.02s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0518, train/loss_vlb_step=0.000186, train/loss_step=0.0518, global_step=5755.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   6%|▌         | 73/1208 [02:27<38:10,  2.02s/it, loss=0.164, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.22e-5, train/loss_step=0.002, global_step=5756.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:   6%|▌         | 74/1208 [02:28<37:53,  2.01s/it, loss=0.164, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.22e-5, train/loss_step=0.002, global_step=5756.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   6%|▌         | 74/1208 [02:28<37:53,  2.01s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00834, train/loss_vlb_step=4.13e-5, train/loss_step=0.00834, global_step=5756.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   6%|▌         | 75/1208 [02:29<37:37,  1.99s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00834, train/loss_vlb_step=4.13e-5, train/loss_step=0.00834, global_step=5756.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   6%|▌         | 75/1208 [02:29<37:37,  1.99s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000106, train/loss_step=0.0269, global_step=5756.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:   6%|▋         | 76/1208 [02:32<37:53,  2.01s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000106, train/loss_step=0.0269, global_step=5756.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   6%|▋         | 76/1208 [02:32<37:53,  2.01s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0404, train/loss_vlb_step=0.000147, train/loss_step=0.0404, global_step=5756.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   6%|▋         | 77/1208 [02:33<37:37,  2.00s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0404, train/loss_vlb_step=0.000147, train/loss_step=0.0404, global_step=5756.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   6%|▋         | 77/1208 [02:33<37:37,  2.00s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00484, train/loss_vlb_step=2.51e-5, train/loss_step=0.00484, global_step=5757.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   6%|▋         | 78/1208 [02:34<37:21,  1.98s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00484, train/loss_vlb_step=2.51e-5, train/loss_step=0.00484, global_step=5757.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   6%|▋         | 78/1208 [02:34<37:21,  1.98s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00724, train/loss_vlb_step=3.57e-5, train/loss_step=0.00724, global_step=5757.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   7%|▋         | 79/1208 [02:35<37:06,  1.97s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00724, train/loss_vlb_step=3.57e-5, train/loss_step=0.00724, global_step=5757.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   7%|▋         | 79/1208 [02:35<37:06,  1.97s/it, loss=0.131, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00159, train/loss_step=0.316, global_step=5757.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:   7%|▋         | 80/1208 [02:39<37:22,  1.99s/it, loss=0.131, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00159, train/loss_step=0.316, global_step=5757.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   7%|▋         | 80/1208 [02:39<37:22,  1.99s/it, loss=0.134, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000406, train/loss_step=0.122, global_step=5757.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   7%|▋         | 81/1208 [02:40<37:07,  1.98s/it, loss=0.134, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000406, train/loss_step=0.122, global_step=5757.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   7%|▋         | 81/1208 [02:40<37:07,  1.98s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.02e-5, train/loss_step=0.0143, global_step=5758.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   7%|▋         | 82/1208 [02:41<36:52,  1.97s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.02e-5, train/loss_step=0.0143, global_step=5758.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   7%|▋         | 82/1208 [02:41<36:52,  1.97s/it, loss=0.122, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000644, train/loss_step=0.187, global_step=5758.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:   7%|▋         | 83/1208 [02:42<36:38,  1.95s/it, loss=0.122, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000644, train/loss_step=0.187, global_step=5758.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   7%|▋         | 83/1208 [02:42<36:38,  1.95s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=8.26e-5, train/loss_step=0.0195, global_step=5758.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   7%|▋         | 84/1208 [02:45<36:53,  1.97s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=8.26e-5, train/loss_step=0.0195, global_step=5758.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   7%|▋         | 84/1208 [02:45<36:53,  1.97s/it, loss=0.112, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000802, train/loss_step=0.231, global_step=5758.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:   7%|▋         | 85/1208 [02:46<36:39,  1.96s/it, loss=0.112, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000802, train/loss_step=0.231, global_step=5758.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   7%|▋         | 85/1208 [02:46<36:39,  1.96s/it, loss=0.123, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00114, train/loss_step=0.275, global_step=5759.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:   7%|▋         | 86/1208 [02:47<36:25,  1.95s/it, loss=0.123, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00114, train/loss_step=0.275, global_step=5759.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   7%|▋         | 86/1208 [02:47<36:25,  1.95s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.04e-5, train/loss_step=0.00173, global_step=5759.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   7%|▋         | 87/1208 [02:48<36:11,  1.94s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.04e-5, train/loss_step=0.00173, global_step=5759.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   7%|▋         | 87/1208 [02:48<36:11,  1.94s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.000193, train/loss_step=0.0556, global_step=5759.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:   7%|▋         | 88/1208 [02:51<36:26,  1.95s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.000193, train/loss_step=0.0556, global_step=5759.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   7%|▋         | 88/1208 [02:51<36:26,  1.95s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.00015, train/loss_step=0.0402, global_step=5759.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:   7%|▋         | 89/1208 [02:52<36:13,  1.94s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.00015, train/loss_step=0.0402, global_step=5759.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   7%|▋         | 89/1208 [02:52<36:13,  1.94s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.58e-5, train/loss_step=0.0128, global_step=5760.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   7%|▋         | 90/1208 [02:53<36:00,  1.93s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.58e-5, train/loss_step=0.0128, global_step=5760.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   7%|▋         | 90/1208 [02:53<36:00,  1.93s/it, loss=0.0732, v_num=0, train/loss_simple_step=0.0423, train/loss_vlb_step=0.000157, train/loss_step=0.0423, global_step=5760.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   8%|▊         | 91/1208 [02:54<35:47,  1.92s/it, loss=0.0732, v_num=0, train/loss_simple_step=0.0423, train/loss_vlb_step=0.000157, train/loss_step=0.0423, global_step=5760.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   8%|▊         | 91/1208 [02:54<35:47,  1.92s/it, loss=0.0746, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000121, train/loss_step=0.0325, global_step=5760.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   8%|▊         | 92/1208 [02:58<36:00,  1.94s/it, loss=0.0746, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000121, train/loss_step=0.0325, global_step=5760.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   8%|▊         | 92/1208 [02:58<36:00,  1.94s/it, loss=0.076, v_num=0, train/loss_simple_step=0.0805, train/loss_vlb_step=0.000269, train/loss_step=0.0805, global_step=5760.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:   8%|▊         | 93/1208 [02:59<35:48,  1.93s/it, loss=0.076, v_num=0, train/loss_simple_step=0.0805, train/loss_vlb_step=0.000269, train/loss_step=0.0805, global_step=5760.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   8%|▊         | 93/1208 [02:59<35:48,  1.93s/it, loss=0.0761, v_num=0, train/loss_simple_step=0.00454, train/loss_vlb_step=2.41e-5, train/loss_step=0.00454, global_step=5761.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   8%|▊         | 94/1208 [03:00<35:35,  1.92s/it, loss=0.0761, v_num=0, train/loss_simple_step=0.00454, train/loss_vlb_step=2.41e-5, train/loss_step=0.00454, global_step=5761.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   8%|▊         | 94/1208 [03:00<35:35,  1.92s/it, loss=0.0859, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000761, train/loss_step=0.204, global_step=5761.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:   8%|▊         | 95/1208 [03:01<35:23,  1.91s/it, loss=0.0859, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000761, train/loss_step=0.204, global_step=5761.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   8%|▊         | 95/1208 [03:01<35:23,  1.91s/it, loss=0.0846, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=9.77e-6, train/loss_step=0.00161, global_step=5761.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   8%|▊         | 96/1208 [03:04<35:37,  1.92s/it, loss=0.0846, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=9.77e-6, train/loss_step=0.00161, global_step=5761.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   8%|▊         | 96/1208 [03:04<35:37,  1.92s/it, loss=0.0842, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000123, train/loss_step=0.0319, global_step=5761.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:   8%|▊         | 97/1208 [03:05<35:25,  1.91s/it, loss=0.0842, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000123, train/loss_step=0.0319, global_step=5761.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   8%|▊         | 97/1208 [03:05<35:25,  1.91s/it, loss=0.0856, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000121, train/loss_step=0.0334, global_step=5762.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   8%|▊         | 98/1208 [03:06<35:13,  1.90s/it, loss=0.0856, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000121, train/loss_step=0.0334, global_step=5762.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   8%|▊         | 98/1208 [03:06<35:13,  1.90s/it, loss=0.092, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000449, train/loss_step=0.136, global_step=5762.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:   8%|▊         | 99/1208 [03:07<35:02,  1.90s/it, loss=0.092, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000449, train/loss_step=0.136, global_step=5762.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   8%|▊         | 99/1208 [03:07<35:02,  1.90s/it, loss=0.0789, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000182, train/loss_step=0.0524, global_step=5762.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   8%|▊         | 100/1208 [03:10<35:14,  1.91s/it, loss=0.0789, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000182, train/loss_step=0.0524, global_step=5762.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   8%|▊         | 100/1208 [03:10<35:14,  1.91s/it, loss=0.0738, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.15e-5, train/loss_step=0.0209, global_step=5762.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:   8%|▊         | 101/1208 [03:11<35:03,  1.90s/it, loss=0.0738, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.15e-5, train/loss_step=0.0209, global_step=5762.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   8%|▊         | 101/1208 [03:11<35:03,  1.90s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000605, train/loss_step=0.183, global_step=5763.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:   8%|▊         | 102/1208 [03:12<34:52,  1.89s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000605, train/loss_step=0.183, global_step=5763.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   8%|▊         | 102/1208 [03:13<34:52,  1.89s/it, loss=0.077, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.00027, train/loss_step=0.0817, global_step=5763.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   9%|▊         | 103/1208 [03:14<34:41,  1.88s/it, loss=0.077, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.00027, train/loss_step=0.0817, global_step=5763.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   9%|▊         | 103/1208 [03:14<34:41,  1.88s/it, loss=0.0782, v_num=0, train/loss_simple_step=0.0444, train/loss_vlb_step=0.000162, train/loss_step=0.0444, global_step=5763.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   9%|▊         | 104/1208 [03:17<34:54,  1.90s/it, loss=0.0782, v_num=0, train/loss_simple_step=0.0444, train/loss_vlb_step=0.000162, train/loss_step=0.0444, global_step=5763.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   9%|▊         | 104/1208 [03:17<34:54,  1.90s/it, loss=0.0669, v_num=0, train/loss_simple_step=0.00397, train/loss_vlb_step=2.06e-5, train/loss_step=0.00397, global_step=5763.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   9%|▊         | 105/1208 [03:18<34:43,  1.89s/it, loss=0.0669, v_num=0, train/loss_simple_step=0.00397, train/loss_vlb_step=2.06e-5, train/loss_step=0.00397, global_step=5763.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   9%|▊         | 105/1208 [03:18<34:43,  1.89s/it, loss=0.0534, v_num=0, train/loss_simple_step=0.00559, train/loss_vlb_step=2.75e-5, train/loss_step=0.00559, global_step=5764.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   9%|▉         | 106/1208 [03:19<34:32,  1.88s/it, loss=0.0534, v_num=0, train/loss_simple_step=0.00559, train/loss_vlb_step=2.75e-5, train/loss_step=0.00559, global_step=5764.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   9%|▉         | 106/1208 [03:19<34:32,  1.88s/it, loss=0.0683, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00112, train/loss_step=0.299, global_step=5764.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:   9%|▉         | 107/1208 [03:20<34:22,  1.87s/it, loss=0.0683, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00112, train/loss_step=0.299, global_step=5764.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   9%|▉         | 107/1208 [03:20<34:22,  1.87s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.559, train/loss_vlb_step=0.00847, train/loss_step=0.559, global_step=5764.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   9%|▉         | 108/1208 [03:23<34:34,  1.89s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.559, train/loss_vlb_step=0.00847, train/loss_step=0.559, global_step=5764.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   9%|▉         | 108/1208 [03:23<34:34,  1.89s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.0852, train/loss_vlb_step=0.000286, train/loss_step=0.0852, global_step=5764.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   9%|▉         | 109/1208 [03:24<34:23,  1.88s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.0852, train/loss_vlb_step=0.000286, train/loss_step=0.0852, global_step=5764.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   9%|▉         | 109/1208 [03:24<34:23,  1.88s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=8.82e-6, train/loss_step=0.00145, global_step=5765.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   9%|▉         | 110/1208 [03:25<34:13,  1.87s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=8.82e-6, train/loss_step=0.00145, global_step=5765.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   9%|▉         | 110/1208 [03:25<34:13,  1.87s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.43e-5, train/loss_step=0.00241, global_step=5765.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   9%|▉         | 111/1208 [03:26<34:03,  1.86s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.43e-5, train/loss_step=0.00241, global_step=5765.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   9%|▉         | 111/1208 [03:26<34:03,  1.86s/it, loss=0.0923, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.64e-5, train/loss_step=0.0154, global_step=5765.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:   9%|▉         | 112/1208 [03:29<34:14,  1.87s/it, loss=0.0923, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.64e-5, train/loss_step=0.0154, global_step=5765.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   9%|▉         | 112/1208 [03:30<34:15,  1.88s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.0522, train/loss_vlb_step=0.000183, train/loss_step=0.0522, global_step=5765.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   9%|▉         | 113/1208 [03:31<34:04,  1.87s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.0522, train/loss_vlb_step=0.000183, train/loss_step=0.0522, global_step=5765.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   9%|▉         | 113/1208 [03:31<34:04,  1.87s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.67e-5, train/loss_step=0.0127, global_step=5766.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:   9%|▉         | 114/1208 [03:32<33:55,  1.86s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.67e-5, train/loss_step=0.0127, global_step=5766.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:   9%|▉         | 114/1208 [03:32<33:55,  1.86s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.001, train/loss_step=0.244, global_step=5766.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  10%|▉         | 115/1208 [03:33<33:45,  1.85s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.001, train/loss_step=0.244, global_step=5766.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  10%|▉         | 115/1208 [03:33<33:45,  1.85s/it, loss=0.101, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000516, train/loss_step=0.155, global_step=5766.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  10%|▉         | 116/1208 [03:36<33:57,  1.87s/it, loss=0.101, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000516, train/loss_step=0.155, global_step=5766.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  10%|▉         | 116/1208 [03:36<33:57,  1.87s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0411, train/loss_vlb_step=0.000148, train/loss_step=0.0411, global_step=5766.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  10%|▉         | 117/1208 [03:37<33:47,  1.86s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0411, train/loss_vlb_step=0.000148, train/loss_step=0.0411, global_step=5766.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  10%|▉         | 117/1208 [03:37<33:47,  1.86s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0942, train/loss_vlb_step=0.000309, train/loss_step=0.0942, global_step=5767.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  10%|▉         | 118/1208 [03:38<33:37,  1.85s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0942, train/loss_vlb_step=0.000309, train/loss_step=0.0942, global_step=5767.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  10%|▉         | 118/1208 [03:38<33:37,  1.85s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000135, train/loss_step=0.0361, global_step=5767.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  10%|▉         | 119/1208 [03:39<33:28,  1.84s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000135, train/loss_step=0.0361, global_step=5767.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  10%|▉         | 119/1208 [03:39<33:28,  1.84s/it, loss=0.107, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000722, train/loss_step=0.196, global_step=5767.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  10%|▉         | 120/1208 [03:42<33:39,  1.86s/it, loss=0.107, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000722, train/loss_step=0.196, global_step=5767.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  10%|▉         | 120/1208 [03:42<33:39,  1.86s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.75e-5, train/loss_step=0.0157, global_step=5767.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  10%|█         | 121/1208 [03:43<33:30,  1.85s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.75e-5, train/loss_step=0.0157, global_step=5767.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  10%|█         | 121/1208 [03:43<33:30,  1.85s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.4e-5, train/loss_step=0.0226, global_step=5768.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  10%|█         | 122/1208 [03:44<33:21,  1.84s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.4e-5, train/loss_step=0.0226, global_step=5768.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  10%|█         | 122/1208 [03:44<33:21,  1.84s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=1.3e-5, train/loss_step=0.00214, global_step=5768.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  10%|█         | 123/1208 [03:45<33:12,  1.84s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=1.3e-5, train/loss_step=0.00214, global_step=5768.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  10%|█         | 123/1208 [03:45<33:12,  1.84s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.0683, train/loss_vlb_step=0.000231, train/loss_step=0.0683, global_step=5768.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  10%|█         | 124/1208 [03:49<33:22,  1.85s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.0683, train/loss_vlb_step=0.000231, train/loss_step=0.0683, global_step=5768.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  10%|█         | 124/1208 [03:49<33:22,  1.85s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.00613, train/loss_vlb_step=3.27e-5, train/loss_step=0.00613, global_step=5768.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  10%|█         | 125/1208 [03:50<33:13,  1.84s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.00613, train/loss_vlb_step=3.27e-5, train/loss_step=0.00613, global_step=5768.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  10%|█         | 125/1208 [03:50<33:13,  1.84s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.31e-5, train/loss_step=0.0115, global_step=5769.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  10%|█         | 126/1208 [03:51<33:05,  1.83s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.31e-5, train/loss_step=0.0115, global_step=5769.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  10%|█         | 126/1208 [03:51<33:05,  1.83s/it, loss=0.082, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.09e-5, train/loss_step=0.0196, global_step=5769.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  11%|█         | 127/1208 [03:52<32:56,  1.83s/it, loss=0.082, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.09e-5, train/loss_step=0.0196, global_step=5769.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  11%|█         | 127/1208 [03:52<32:56,  1.83s/it, loss=0.056, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000144, train/loss_step=0.0381, global_step=5769.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  11%|█         | 128/1208 [03:55<33:06,  1.84s/it, loss=0.056, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000144, train/loss_step=0.0381, global_step=5769.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  11%|█         | 128/1208 [03:55<33:06,  1.84s/it, loss=0.0519, v_num=0, train/loss_simple_step=0.00332, train/loss_vlb_step=1.86e-5, train/loss_step=0.00332, global_step=5769.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  11%|█         | 129/1208 [03:56<32:58,  1.83s/it, loss=0.0519, v_num=0, train/loss_simple_step=0.00332, train/loss_vlb_step=1.86e-5, train/loss_step=0.00332, global_step=5769.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  11%|█         | 129/1208 [03:56<32:58,  1.83s/it, loss=0.0568, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000332, train/loss_step=0.100, global_step=5770.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  11%|█         | 130/1208 [03:57<32:49,  1.83s/it, loss=0.0568, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000332, train/loss_step=0.100, global_step=5770.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  11%|█         | 130/1208 [03:57<32:49,  1.83s/it, loss=0.0746, v_num=0, train/loss_simple_step=0.358, train/loss_vlb_step=0.00224, train/loss_step=0.358, global_step=5770.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  11%|█         | 131/1208 [03:58<32:41,  1.82s/it, loss=0.0746, v_num=0, train/loss_simple_step=0.358, train/loss_vlb_step=0.00224, train/loss_step=0.358, global_step=5770.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  11%|█         | 131/1208 [03:58<32:41,  1.82s/it, loss=0.075, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9.12e-5, train/loss_step=0.0224, global_step=5770.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  11%|█         | 132/1208 [04:01<32:51,  1.83s/it, loss=0.075, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9.12e-5, train/loss_step=0.0224, global_step=5770.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  11%|█         | 132/1208 [04:01<32:51,  1.83s/it, loss=0.0724, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=9.31e-6, train/loss_step=0.00153, global_step=5770.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  11%|█         | 133/1208 [04:02<32:43,  1.83s/it, loss=0.0724, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=9.31e-6, train/loss_step=0.00153, global_step=5770.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  11%|█         | 133/1208 [04:02<32:43,  1.83s/it, loss=0.072, v_num=0, train/loss_simple_step=0.00386, train/loss_vlb_step=2.07e-5, train/loss_step=0.00386, global_step=5771.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  11%|█         | 134/1208 [04:03<32:35,  1.82s/it, loss=0.072, v_num=0, train/loss_simple_step=0.00386, train/loss_vlb_step=2.07e-5, train/loss_step=0.00386, global_step=5771.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  11%|█         | 134/1208 [04:03<32:35,  1.82s/it, loss=0.0603, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.84e-5, train/loss_step=0.0104, global_step=5771.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  11%|█         | 135/1208 [04:05<32:27,  1.81s/it, loss=0.0603, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.84e-5, train/loss_step=0.0104, global_step=5771.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  11%|█         | 135/1208 [04:05<32:27,  1.81s/it, loss=0.085, v_num=0, train/loss_simple_step=0.649, train/loss_vlb_step=0.0173, train/loss_step=0.649, global_step=5771.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  11%|█▏        | 136/1208 [04:08<32:36,  1.83s/it, loss=0.085, v_num=0, train/loss_simple_step=0.649, train/loss_vlb_step=0.0173, train/loss_step=0.649, global_step=5771.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  11%|█▏        | 136/1208 [04:08<32:36,  1.83s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00133, train/loss_step=0.314, global_step=5771.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  11%|█▏        | 137/1208 [04:09<32:29,  1.82s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00133, train/loss_step=0.314, global_step=5771.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  11%|█▏        | 137/1208 [04:09<32:29,  1.82s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.55e-5, train/loss_step=0.00277, global_step=5772.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  11%|█▏        | 138/1208 [04:10<32:21,  1.81s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.55e-5, train/loss_step=0.00277, global_step=5772.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  11%|█▏        | 138/1208 [04:10<32:21,  1.81s/it, loss=0.0927, v_num=0, train/loss_simple_step=0.00884, train/loss_vlb_step=4.35e-5, train/loss_step=0.00884, global_step=5772.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  12%|█▏        | 139/1208 [04:11<32:13,  1.81s/it, loss=0.0927, v_num=0, train/loss_simple_step=0.00884, train/loss_vlb_step=4.35e-5, train/loss_step=0.00884, global_step=5772.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  12%|█▏        | 139/1208 [04:11<32:13,  1.81s/it, loss=0.0847, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000138, train/loss_step=0.0364, global_step=5772.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  12%|█▏        | 140/1208 [04:14<32:22,  1.82s/it, loss=0.0847, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000138, train/loss_step=0.0364, global_step=5772.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  12%|█▏        | 140/1208 [04:14<32:22,  1.82s/it, loss=0.0867, v_num=0, train/loss_simple_step=0.0559, train/loss_vlb_step=0.000194, train/loss_step=0.0559, global_step=5772.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  12%|█▏        | 141/1208 [04:15<32:15,  1.81s/it, loss=0.0867, v_num=0, train/loss_simple_step=0.0559, train/loss_vlb_step=0.000194, train/loss_step=0.0559, global_step=5772.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  12%|█▏        | 141/1208 [04:15<32:15,  1.81s/it, loss=0.0893, v_num=0, train/loss_simple_step=0.0727, train/loss_vlb_step=0.000241, train/loss_step=0.0727, global_step=5773.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  12%|█▏        | 142/1208 [04:16<32:07,  1.81s/it, loss=0.0893, v_num=0, train/loss_simple_step=0.0727, train/loss_vlb_step=0.000241, train/loss_step=0.0727, global_step=5773.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  12%|█▏        | 142/1208 [04:16<32:07,  1.81s/it, loss=0.0893, v_num=0, train/loss_simple_step=0.00354, train/loss_vlb_step=1.82e-5, train/loss_step=0.00354, global_step=5773.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  12%|█▏        | 143/1208 [04:17<32:00,  1.80s/it, loss=0.0893, v_num=0, train/loss_simple_step=0.00354, train/loss_vlb_step=1.82e-5, train/loss_step=0.00354, global_step=5773.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  12%|█▏        | 143/1208 [04:17<32:00,  1.80s/it, loss=0.102, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00163, train/loss_step=0.316, global_step=5773.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]     Epoch 19:  12%|█▏        | 144/1208 [04:21<32:08,  1.81s/it, loss=0.102, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00163, train/loss_step=0.316, global_step=5773.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  12%|█▏        | 144/1208 [04:21<32:08,  1.81s/it, loss=0.122, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.00388, train/loss_step=0.417, global_step=5773.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  12%|█▏        | 145/1208 [04:22<32:01,  1.81s/it, loss=0.122, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.00388, train/loss_step=0.417, global_step=5773.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  12%|█▏        | 145/1208 [04:22<32:01,  1.81s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0428, train/loss_vlb_step=0.000151, train/loss_step=0.0428, global_step=5774.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  12%|█▏        | 146/1208 [04:23<31:54,  1.80s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0428, train/loss_vlb_step=0.000151, train/loss_step=0.0428, global_step=5774.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  12%|█▏        | 146/1208 [04:23<31:54,  1.80s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6.02e-5, train/loss_step=0.0135, global_step=5774.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  12%|█▏        | 147/1208 [04:24<31:47,  1.80s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6.02e-5, train/loss_step=0.0135, global_step=5774.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  12%|█▏        | 147/1208 [04:24<31:47,  1.80s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0912, train/loss_vlb_step=0.0003, train/loss_step=0.0912, global_step=5774.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  12%|█▏        | 148/1208 [04:27<31:55,  1.81s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0912, train/loss_vlb_step=0.0003, train/loss_step=0.0912, global_step=5774.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  12%|█▏        | 148/1208 [04:27<31:55,  1.81s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0849, train/loss_vlb_step=0.000285, train/loss_step=0.0849, global_step=5774.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  12%|█▏        | 149/1208 [04:28<31:48,  1.80s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0849, train/loss_vlb_step=0.000285, train/loss_step=0.0849, global_step=5774.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  12%|█▏        | 149/1208 [04:28<31:48,  1.80s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00765, train/loss_vlb_step=3.65e-5, train/loss_step=0.00765, global_step=5775.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  12%|█▏        | 150/1208 [04:29<31:41,  1.80s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00765, train/loss_vlb_step=3.65e-5, train/loss_step=0.00765, global_step=5775.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  12%|█▏        | 150/1208 [04:29<31:41,  1.80s/it, loss=0.115, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000469, train/loss_step=0.143, global_step=5775.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  12%|█▎        | 151/1208 [04:30<31:34,  1.79s/it, loss=0.115, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000469, train/loss_step=0.143, global_step=5775.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  12%|█▎        | 151/1208 [04:30<31:34,  1.79s/it, loss=0.123, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000616, train/loss_step=0.177, global_step=5775.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  13%|█▎        | 152/1208 [04:33<31:42,  1.80s/it, loss=0.123, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000616, train/loss_step=0.177, global_step=5775.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  13%|█▎        | 152/1208 [04:33<31:42,  1.80s/it, loss=0.137, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00122, train/loss_step=0.289, global_step=5775.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  13%|█▎        | 153/1208 [04:34<31:35,  1.80s/it, loss=0.137, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00122, train/loss_step=0.289, global_step=5775.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  13%|█▎        | 153/1208 [04:34<31:35,  1.80s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0638, train/loss_vlb_step=0.000213, train/loss_step=0.0638, global_step=5776.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  13%|█▎        | 154/1208 [04:35<31:28,  1.79s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0638, train/loss_vlb_step=0.000213, train/loss_step=0.0638, global_step=5776.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  13%|█▎        | 154/1208 [04:35<31:28,  1.79s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00631, train/loss_vlb_step=3.04e-5, train/loss_step=0.00631, global_step=5776.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  13%|█▎        | 155/1208 [04:37<31:21,  1.79s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00631, train/loss_vlb_step=3.04e-5, train/loss_step=0.00631, global_step=5776.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  13%|█▎        | 155/1208 [04:37<31:21,  1.79s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000119, train/loss_step=0.0309, global_step=5776.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  13%|█▎        | 156/1208 [04:40<31:29,  1.80s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000119, train/loss_step=0.0309, global_step=5776.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  13%|█▎        | 156/1208 [04:40<31:29,  1.80s/it, loss=0.102, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000642, train/loss_step=0.183, global_step=5776.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  13%|█▎        | 157/1208 [04:41<31:23,  1.79s/it, loss=0.102, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000642, train/loss_step=0.183, global_step=5776.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  13%|█▎        | 157/1208 [04:41<31:23,  1.79s/it, loss=0.126, v_num=0, train/loss_simple_step=0.475, train/loss_vlb_step=0.00364, train/loss_step=0.475, global_step=5777.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  13%|█▎        | 158/1208 [04:42<31:16,  1.79s/it, loss=0.126, v_num=0, train/loss_simple_step=0.475, train/loss_vlb_step=0.00364, train/loss_step=0.475, global_step=5777.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  13%|█▎        | 158/1208 [04:42<31:16,  1.79s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.69e-5, train/loss_step=0.0124, global_step=5777.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  13%|█▎        | 159/1208 [04:43<31:09,  1.78s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.69e-5, train/loss_step=0.0124, global_step=5777.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  13%|█▎        | 159/1208 [04:43<31:09,  1.78s/it, loss=0.126, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.00014, train/loss_step=0.038, global_step=5777.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  13%|█▎        | 160/1208 [04:46<31:17,  1.79s/it, loss=0.126, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.00014, train/loss_step=0.038, global_step=5777.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  13%|█▎        | 160/1208 [04:46<31:17,  1.79s/it, loss=0.129, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000364, train/loss_step=0.110, global_step=5777.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  13%|█▎        | 161/1208 [04:47<31:11,  1.79s/it, loss=0.129, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000364, train/loss_step=0.110, global_step=5777.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  13%|█▎        | 161/1208 [04:47<31:11,  1.79s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.07e-5, train/loss_step=0.00178, global_step=5778.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  13%|█▎        | 162/1208 [04:48<31:04,  1.78s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.07e-5, train/loss_step=0.00178, global_step=5778.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  13%|█▎        | 162/1208 [04:48<31:04,  1.78s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.12e-5, train/loss_step=0.0207, global_step=5778.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  13%|█▎        | 163/1208 [04:49<30:58,  1.78s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.12e-5, train/loss_step=0.0207, global_step=5778.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  13%|█▎        | 163/1208 [04:49<30:58,  1.78s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0709, train/loss_vlb_step=0.000241, train/loss_step=0.0709, global_step=5778.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  14%|█▎        | 164/1208 [04:53<31:05,  1.79s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0709, train/loss_vlb_step=0.000241, train/loss_step=0.0709, global_step=5778.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  14%|█▎        | 164/1208 [04:53<31:05,  1.79s/it, loss=0.097, v_num=0, train/loss_simple_step=0.0784, train/loss_vlb_step=0.000261, train/loss_step=0.0784, global_step=5778.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  14%|█▎        | 165/1208 [04:54<30:59,  1.78s/it, loss=0.097, v_num=0, train/loss_simple_step=0.0784, train/loss_vlb_step=0.000261, train/loss_step=0.0784, global_step=5778.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  14%|█▎        | 165/1208 [04:54<30:59,  1.78s/it, loss=0.0952, v_num=0, train/loss_simple_step=0.00592, train/loss_vlb_step=3.09e-5, train/loss_step=0.00592, global_step=5779.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  14%|█▎        | 166/1208 [04:55<30:52,  1.78s/it, loss=0.0952, v_num=0, train/loss_simple_step=0.00592, train/loss_vlb_step=3.09e-5, train/loss_step=0.00592, global_step=5779.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  14%|█▎        | 166/1208 [04:55<30:53,  1.78s/it, loss=0.103, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000551, train/loss_step=0.161, global_step=5779.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  14%|█▍        | 167/1208 [04:56<30:46,  1.77s/it, loss=0.103, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000551, train/loss_step=0.161, global_step=5779.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  14%|█▍        | 167/1208 [04:56<30:46,  1.77s/it, loss=0.112, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00122, train/loss_step=0.283, global_step=5779.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  14%|█▍        | 168/1208 [04:59<30:53,  1.78s/it, loss=0.112, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00122, train/loss_step=0.283, global_step=5779.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  14%|█▍        | 168/1208 [04:59<30:53,  1.78s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=1.07e-5, train/loss_step=0.0018, global_step=5779.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  14%|█▍        | 169/1208 [05:00<30:47,  1.78s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=1.07e-5, train/loss_step=0.0018, global_step=5779.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  14%|█▍        | 169/1208 [05:00<30:47,  1.78s/it, loss=0.119, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000816, train/loss_step=0.223, global_step=5780.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  14%|█▍        | 170/1208 [05:01<30:41,  1.77s/it, loss=0.119, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000816, train/loss_step=0.223, global_step=5780.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  14%|█▍        | 170/1208 [05:01<30:41,  1.77s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00539, train/loss_vlb_step=2.7e-5, train/loss_step=0.00539, global_step=5780.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  14%|█▍        | 171/1208 [05:02<30:34,  1.77s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00539, train/loss_vlb_step=2.7e-5, train/loss_step=0.00539, global_step=5780.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  14%|█▍        | 171/1208 [05:02<30:34,  1.77s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.97e-5, train/loss_step=0.0103, global_step=5780.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  14%|█▍        | 172/1208 [05:05<30:41,  1.78s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.97e-5, train/loss_step=0.0103, global_step=5780.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  14%|█▍        | 172/1208 [05:05<30:41,  1.78s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.67e-5, train/loss_step=0.0102, global_step=5780.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  14%|█▍        | 173/1208 [05:06<30:35,  1.77s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.67e-5, train/loss_step=0.0102, global_step=5780.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  14%|█▍        | 173/1208 [05:06<30:35,  1.77s/it, loss=0.089, v_num=0, train/loss_simple_step=0.0523, train/loss_vlb_step=0.000177, train/loss_step=0.0523, global_step=5781.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  14%|█▍        | 174/1208 [05:07<30:29,  1.77s/it, loss=0.089, v_num=0, train/loss_simple_step=0.0523, train/loss_vlb_step=0.000177, train/loss_step=0.0523, global_step=5781.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  14%|█▍        | 174/1208 [05:07<30:29,  1.77s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=1.71e-5, train/loss_step=0.0031, global_step=5781.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  14%|█▍        | 175/1208 [05:08<30:23,  1.77s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=1.71e-5, train/loss_step=0.0031, global_step=5781.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  14%|█▍        | 175/1208 [05:08<30:23,  1.77s/it, loss=0.107, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00309, train/loss_step=0.389, global_step=5781.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  15%|█▍        | 176/1208 [05:12<30:30,  1.77s/it, loss=0.107, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00309, train/loss_step=0.389, global_step=5781.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  15%|█▍        | 176/1208 [05:12<30:30,  1.77s/it, loss=0.108, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000803, train/loss_step=0.201, global_step=5781.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  15%|█▍        | 177/1208 [05:13<30:24,  1.77s/it, loss=0.108, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000803, train/loss_step=0.201, global_step=5781.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  15%|█▍        | 177/1208 [05:13<30:24,  1.77s/it, loss=0.0855, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000127, train/loss_step=0.0332, global_step=5782.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  15%|█▍        | 178/1208 [05:14<30:18,  1.77s/it, loss=0.0855, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000127, train/loss_step=0.0332, global_step=5782.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  15%|█▍        | 178/1208 [05:14<30:18,  1.77s/it, loss=0.0938, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.00062, train/loss_step=0.178, global_step=5782.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  15%|█▍        | 179/1208 [05:15<30:12,  1.76s/it, loss=0.0938, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.00062, train/loss_step=0.178, global_step=5782.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  15%|█▍        | 179/1208 [05:15<30:12,  1.76s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.0706, train/loss_vlb_step=0.000235, train/loss_step=0.0706, global_step=5782.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  15%|█▍        | 180/1208 [05:18<30:19,  1.77s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.0706, train/loss_vlb_step=0.000235, train/loss_step=0.0706, global_step=5782.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  15%|█▍        | 180/1208 [05:18<30:19,  1.77s/it, loss=0.116, v_num=0, train/loss_simple_step=0.523, train/loss_vlb_step=0.00608, train/loss_step=0.523, global_step=5782.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  15%|█▍        | 181/1208 [05:19<30:13,  1.77s/it, loss=0.116, v_num=0, train/loss_simple_step=0.523, train/loss_vlb_step=0.00608, train/loss_step=0.523, global_step=5782.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  15%|█▍        | 181/1208 [05:19<30:13,  1.77s/it, loss=0.122, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000376, train/loss_step=0.114, global_step=5783.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  15%|█▌        | 182/1208 [05:20<30:07,  1.76s/it, loss=0.122, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000376, train/loss_step=0.114, global_step=5783.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  15%|█▌        | 182/1208 [05:20<30:07,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000761, train/loss_step=0.198, global_step=5783.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  15%|█▌        | 183/1208 [05:21<30:01,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000761, train/loss_step=0.198, global_step=5783.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  15%|█▌        | 183/1208 [05:21<30:01,  1.76s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0924, train/loss_vlb_step=0.000304, train/loss_step=0.0924, global_step=5783.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  15%|█▌        | 184/1208 [05:24<30:08,  1.77s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0924, train/loss_vlb_step=0.000304, train/loss_step=0.0924, global_step=5783.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  15%|█▌        | 184/1208 [05:24<30:08,  1.77s/it, loss=0.128, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.18e-5, train/loss_step=0.002, global_step=5783.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  15%|█▌        | 185/1208 [05:26<30:02,  1.76s/it, loss=0.128, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.18e-5, train/loss_step=0.002, global_step=5783.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  15%|█▌        | 185/1208 [05:26<30:02,  1.76s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00697, train/loss_vlb_step=3.51e-5, train/loss_step=0.00697, global_step=5784.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  15%|█▌        | 186/1208 [05:27<29:56,  1.76s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00697, train/loss_vlb_step=3.51e-5, train/loss_step=0.00697, global_step=5784.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  15%|█▌        | 186/1208 [05:27<29:56,  1.76s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0558, train/loss_vlb_step=0.00019, train/loss_step=0.0558, global_step=5784.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  15%|█▌        | 187/1208 [05:28<29:51,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0558, train/loss_vlb_step=0.00019, train/loss_step=0.0558, global_step=5784.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  15%|█▌        | 187/1208 [05:28<29:51,  1.75s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00762, train/loss_vlb_step=3.65e-5, train/loss_step=0.00762, global_step=5784.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  16%|█▌        | 188/1208 [05:31<29:57,  1.76s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00762, train/loss_vlb_step=3.65e-5, train/loss_step=0.00762, global_step=5784.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  16%|█▌        | 188/1208 [05:31<29:57,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0865, train/loss_vlb_step=0.000286, train/loss_step=0.0865, global_step=5784.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  16%|█▌        | 189/1208 [05:32<29:51,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0865, train/loss_vlb_step=0.000286, train/loss_step=0.0865, global_step=5784.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  16%|█▌        | 189/1208 [05:32<29:51,  1.76s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=9.23e-6, train/loss_step=0.00154, global_step=5785.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  16%|█▌        | 190/1208 [05:33<29:46,  1.75s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=9.23e-6, train/loss_step=0.00154, global_step=5785.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  16%|█▌        | 190/1208 [05:33<29:46,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00238, train/loss_step=0.398, global_step=5785.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  16%|█▌        | 191/1208 [05:34<29:40,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00238, train/loss_step=0.398, global_step=5785.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  16%|█▌        | 191/1208 [05:34<29:40,  1.75s/it, loss=0.133, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000954, train/loss_step=0.235, global_step=5785.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  16%|█▌        | 192/1208 [05:37<29:47,  1.76s/it, loss=0.133, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000954, train/loss_step=0.235, global_step=5785.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  16%|█▌        | 192/1208 [05:37<29:47,  1.76s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.21e-5, train/loss_step=0.0227, global_step=5785.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  16%|█▌        | 193/1208 [05:38<29:41,  1.76s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.21e-5, train/loss_step=0.0227, global_step=5785.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  16%|█▌        | 193/1208 [05:38<29:41,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0071, train/loss_vlb_step=3.47e-5, train/loss_step=0.0071, global_step=5786.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  16%|█▌        | 194/1208 [05:39<29:36,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0071, train/loss_vlb_step=3.47e-5, train/loss_step=0.0071, global_step=5786.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  16%|█▌        | 194/1208 [05:39<29:36,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.15e-5, train/loss_step=0.00199, global_step=5786.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  16%|█▌        | 195/1208 [05:40<29:30,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.15e-5, train/loss_step=0.00199, global_step=5786.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  16%|█▌        | 195/1208 [05:40<29:30,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=1.57e-5, train/loss_step=0.00276, global_step=5786.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  16%|█▌        | 196/1208 [05:44<29:36,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=1.57e-5, train/loss_step=0.00276, global_step=5786.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  16%|█▌        | 196/1208 [05:44<29:36,  1.76s/it, loss=0.109, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000463, train/loss_step=0.140, global_step=5786.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  16%|█▋        | 197/1208 [05:45<29:31,  1.75s/it, loss=0.109, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000463, train/loss_step=0.140, global_step=5786.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  16%|█▋        | 197/1208 [05:45<29:31,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00216, train/loss_step=0.305, global_step=5787.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  16%|█▋        | 198/1208 [05:46<29:25,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00216, train/loss_step=0.305, global_step=5787.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  16%|█▋        | 198/1208 [05:46<29:25,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.000173, train/loss_step=0.0456, global_step=5787.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  16%|█▋        | 199/1208 [05:47<29:20,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.000173, train/loss_step=0.0456, global_step=5787.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  16%|█▋        | 199/1208 [05:47<29:20,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.0011, train/loss_step=0.270, global_step=5787.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  17%|█▋        | 200/1208 [05:50<29:26,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.0011, train/loss_step=0.270, global_step=5787.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  17%|█▋        | 200/1208 [05:50<29:26,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000906, train/loss_step=0.246, global_step=5787.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  17%|█▋        | 201/1208 [05:51<29:21,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000906, train/loss_step=0.246, global_step=5787.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  17%|█▋        | 201/1208 [05:51<29:21,  1.75s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0764, train/loss_vlb_step=0.000257, train/loss_step=0.0764, global_step=5788.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  17%|█▋        | 202/1208 [05:52<29:15,  1.75s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0764, train/loss_vlb_step=0.000257, train/loss_step=0.0764, global_step=5788.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  17%|█▋        | 202/1208 [05:52<29:15,  1.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.834, train/loss_vlb_step=0.211, train/loss_step=0.834, global_step=5788.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  17%|█▋        | 203/1208 [05:53<29:10,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.834, train/loss_vlb_step=0.211, train/loss_step=0.834, global_step=5788.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  17%|█▋        | 203/1208 [05:53<29:10,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0907, train/loss_vlb_step=0.000298, train/loss_step=0.0907, global_step=5788.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  17%|█▋        | 204/1208 [05:56<29:16,  1.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0907, train/loss_vlb_step=0.000298, train/loss_step=0.0907, global_step=5788.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  17%|█▋        | 204/1208 [05:56<29:16,  1.75s/it, loss=0.157, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00168, train/loss_step=0.303, global_step=5788.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  17%|█▋        | 205/1208 [05:57<29:11,  1.75s/it, loss=0.157, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00168, train/loss_step=0.303, global_step=5788.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  17%|█▋        | 205/1208 [05:57<29:11,  1.75s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.07e-5, train/loss_step=0.00176, global_step=5789.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  17%|█▋        | 206/1208 [05:58<29:05,  1.74s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.07e-5, train/loss_step=0.00176, global_step=5789.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  17%|█▋        | 206/1208 [05:58<29:05,  1.74s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.00015, train/loss_step=0.0413, global_step=5789.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  17%|█▋        | 207/1208 [05:59<29:00,  1.74s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.00015, train/loss_step=0.0413, global_step=5789.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  17%|█▋        | 207/1208 [05:59<29:00,  1.74s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.97e-5, train/loss_step=0.0154, global_step=5789.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  17%|█▋        | 208/1208 [06:03<29:06,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.97e-5, train/loss_step=0.0154, global_step=5789.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  17%|█▋        | 208/1208 [06:03<29:06,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000812, train/loss_step=0.204, global_step=5789.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  17%|█▋        | 209/1208 [06:04<29:01,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000812, train/loss_step=0.204, global_step=5789.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  17%|█▋        | 209/1208 [06:04<29:01,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00192, train/loss_step=0.346, global_step=5790.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  17%|█▋        | 210/1208 [06:05<28:56,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00192, train/loss_step=0.346, global_step=5790.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  17%|█▋        | 210/1208 [06:05<28:56,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000922, train/loss_step=0.213, global_step=5790.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  17%|█▋        | 211/1208 [06:06<28:51,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000922, train/loss_step=0.213, global_step=5790.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  17%|█▋        | 211/1208 [06:06<28:51,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000934, train/loss_step=0.233, global_step=5790.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  18%|█▊        | 212/1208 [06:09<28:56,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000934, train/loss_step=0.233, global_step=5790.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  18%|█▊        | 212/1208 [06:09<28:56,  1.74s/it, loss=0.182, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.0012, train/loss_step=0.265, global_step=5790.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  18%|█▊        | 213/1208 [06:10<28:51,  1.74s/it, loss=0.182, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.0012, train/loss_step=0.265, global_step=5790.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  18%|█▊        | 213/1208 [06:10<28:51,  1.74s/it, loss=0.191, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000654, train/loss_step=0.189, global_step=5791.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  18%|█▊        | 214/1208 [06:11<28:46,  1.74s/it, loss=0.191, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000654, train/loss_step=0.189, global_step=5791.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  18%|█▊        | 214/1208 [06:11<28:46,  1.74s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=8.11e-5, train/loss_step=0.0191, global_step=5791.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  18%|█▊        | 215/1208 [06:12<28:41,  1.73s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=8.11e-5, train/loss_step=0.0191, global_step=5791.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  18%|█▊        | 215/1208 [06:12<28:41,  1.73s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0066, train/loss_vlb_step=3.22e-5, train/loss_step=0.0066, global_step=5791.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  18%|█▊        | 216/1208 [06:16<28:46,  1.74s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0066, train/loss_vlb_step=3.22e-5, train/loss_step=0.0066, global_step=5791.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  18%|█▊        | 216/1208 [06:16<28:46,  1.74s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0558, train/loss_vlb_step=0.000189, train/loss_step=0.0558, global_step=5791.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  18%|█▊        | 217/1208 [06:17<28:42,  1.74s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0558, train/loss_vlb_step=0.000189, train/loss_step=0.0558, global_step=5791.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  18%|█▊        | 217/1208 [06:17<28:42,  1.74s/it, loss=0.184, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000902, train/loss_step=0.221, global_step=5792.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  18%|█▊        | 218/1208 [06:18<28:37,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000902, train/loss_step=0.221, global_step=5792.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  18%|█▊        | 218/1208 [06:18<28:37,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.3e-5, train/loss_step=0.0174, global_step=5792.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  18%|█▊        | 219/1208 [06:19<28:32,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.3e-5, train/loss_step=0.0174, global_step=5792.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  18%|█▊        | 219/1208 [06:19<28:32,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00424, train/loss_vlb_step=2.26e-5, train/loss_step=0.00424, global_step=5792.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  18%|█▊        | 220/1208 [06:22<28:37,  1.74s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00424, train/loss_vlb_step=2.26e-5, train/loss_step=0.00424, global_step=5792.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  18%|█▊        | 220/1208 [06:22<28:37,  1.74s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.25e-5, train/loss_step=0.0144, global_step=5792.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  18%|█▊        | 221/1208 [06:23<28:32,  1.74s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.25e-5, train/loss_step=0.0144, global_step=5792.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  18%|█▊        | 221/1208 [06:23<28:32,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.45e-5, train/loss_step=0.0234, global_step=5793.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  18%|█▊        | 222/1208 [06:24<28:27,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.45e-5, train/loss_step=0.0234, global_step=5793.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  18%|█▊        | 222/1208 [06:24<28:27,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00401, train/loss_vlb_step=2.2e-5, train/loss_step=0.00401, global_step=5793.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  18%|█▊        | 223/1208 [06:25<28:22,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00401, train/loss_vlb_step=2.2e-5, train/loss_step=0.00401, global_step=5793.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  18%|█▊        | 223/1208 [06:25<28:22,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.38e-5, train/loss_step=0.0176, global_step=5793.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  19%|█▊        | 224/1208 [06:28<28:28,  1.74s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.38e-5, train/loss_step=0.0176, global_step=5793.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  19%|█▊        | 224/1208 [06:28<28:28,  1.74s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.59e-5, train/loss_step=0.00278, global_step=5793.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  19%|█▊        | 225/1208 [06:29<28:23,  1.73s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.59e-5, train/loss_step=0.00278, global_step=5793.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  19%|█▊        | 225/1208 [06:29<28:23,  1.73s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.0422, train/loss_vlb_step=0.000154, train/loss_step=0.0422, global_step=5794.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  19%|█▊        | 226/1208 [06:30<28:18,  1.73s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.0422, train/loss_vlb_step=0.000154, train/loss_step=0.0422, global_step=5794.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  19%|█▊        | 226/1208 [06:30<28:18,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.0028, train/loss_step=0.380, global_step=5794.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]     Epoch 19:  19%|█▉        | 227/1208 [06:31<28:13,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.0028, train/loss_step=0.380, global_step=5794.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  19%|█▉        | 227/1208 [06:31<28:13,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0919, train/loss_vlb_step=0.000304, train/loss_step=0.0919, global_step=5794.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  19%|█▉        | 228/1208 [06:35<28:18,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0919, train/loss_vlb_step=0.000304, train/loss_step=0.0919, global_step=5794.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  19%|█▉        | 228/1208 [06:35<28:18,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000493, train/loss_step=0.143, global_step=5794.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  19%|█▉        | 229/1208 [06:36<28:13,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000493, train/loss_step=0.143, global_step=5794.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  19%|█▉        | 229/1208 [06:36<28:13,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.595, train/loss_vlb_step=0.0145, train/loss_step=0.595, global_step=5795.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  19%|█▉        | 230/1208 [06:37<28:09,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.595, train/loss_vlb_step=0.0145, train/loss_step=0.595, global_step=5795.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  19%|█▉        | 230/1208 [06:37<28:09,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0488, train/loss_vlb_step=0.00018, train/loss_step=0.0488, global_step=5795.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  19%|█▉        | 231/1208 [06:38<28:04,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0488, train/loss_vlb_step=0.00018, train/loss_step=0.0488, global_step=5795.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  19%|█▉        | 231/1208 [06:38<28:04,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.431, train/loss_vlb_step=0.00353, train/loss_step=0.431, global_step=5795.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  19%|█▉        | 232/1208 [06:41<28:09,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.431, train/loss_vlb_step=0.00353, train/loss_step=0.431, global_step=5795.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  19%|█▉        | 232/1208 [06:41<28:09,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.31e-5, train/loss_step=0.0183, global_step=5795.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  19%|█▉        | 233/1208 [06:42<28:04,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.31e-5, train/loss_step=0.0183, global_step=5795.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  19%|█▉        | 233/1208 [06:42<28:04,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0913, train/loss_vlb_step=0.000301, train/loss_step=0.0913, global_step=5796.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  19%|█▉        | 234/1208 [06:43<28:00,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0913, train/loss_vlb_step=0.000301, train/loss_step=0.0913, global_step=5796.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  19%|█▉        | 234/1208 [06:43<28:00,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.61e-5, train/loss_step=0.0184, global_step=5796.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  19%|█▉        | 235/1208 [06:44<27:55,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.61e-5, train/loss_step=0.0184, global_step=5796.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  19%|█▉        | 235/1208 [06:44<27:55,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0505, train/loss_vlb_step=0.000183, train/loss_step=0.0505, global_step=5796.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  20%|█▉        | 236/1208 [06:47<28:00,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0505, train/loss_vlb_step=0.000183, train/loss_step=0.0505, global_step=5796.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  20%|█▉        | 236/1208 [06:47<28:00,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0645, train/loss_vlb_step=0.000223, train/loss_step=0.0645, global_step=5796.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  20%|█▉        | 237/1208 [06:48<27:55,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0645, train/loss_vlb_step=0.000223, train/loss_step=0.0645, global_step=5796.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  20%|█▉        | 237/1208 [06:48<27:55,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00748, train/loss_vlb_step=3.46e-5, train/loss_step=0.00748, global_step=5797.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  20%|█▉        | 238/1208 [06:50<27:51,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00748, train/loss_vlb_step=3.46e-5, train/loss_step=0.00748, global_step=5797.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  20%|█▉        | 238/1208 [06:50<27:51,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=5797.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  20%|█▉        | 239/1208 [06:51<27:46,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=5797.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  20%|█▉        | 239/1208 [06:51<27:46,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.00034, train/loss_step=0.104, global_step=5797.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  20%|█▉        | 240/1208 [06:54<27:50,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.00034, train/loss_step=0.104, global_step=5797.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  20%|█▉        | 240/1208 [06:54<27:50,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.00061, train/loss_step=0.177, global_step=5797.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  20%|█▉        | 241/1208 [06:55<27:46,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.00061, train/loss_step=0.177, global_step=5797.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  20%|█▉        | 241/1208 [06:55<27:46,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.05e-5, train/loss_step=0.00175, global_step=5798.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  20%|██        | 242/1208 [06:56<27:42,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.05e-5, train/loss_step=0.00175, global_step=5798.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  20%|██        | 242/1208 [06:56<27:42,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.25e-5, train/loss_step=0.0115, global_step=5798.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  20%|██        | 243/1208 [06:57<27:37,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.25e-5, train/loss_step=0.0115, global_step=5798.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  20%|██        | 243/1208 [06:57<27:37,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.18e-5, train/loss_step=0.011, global_step=5798.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  20%|██        | 244/1208 [07:00<27:41,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.18e-5, train/loss_step=0.011, global_step=5798.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  20%|██        | 244/1208 [07:00<27:42,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0791, train/loss_vlb_step=0.000263, train/loss_step=0.0791, global_step=5798.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  20%|██        | 245/1208 [07:01<27:37,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0791, train/loss_vlb_step=0.000263, train/loss_step=0.0791, global_step=5798.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  20%|██        | 245/1208 [07:01<27:37,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0613, train/loss_vlb_step=0.000213, train/loss_step=0.0613, global_step=5799.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  20%|██        | 246/1208 [07:02<27:33,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0613, train/loss_vlb_step=0.000213, train/loss_step=0.0613, global_step=5799.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  20%|██        | 246/1208 [07:02<27:33,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000697, train/loss_step=0.193, global_step=5799.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  20%|██        | 247/1208 [07:03<27:28,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000697, train/loss_step=0.193, global_step=5799.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  20%|██        | 247/1208 [07:03<27:28,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.13e-5, train/loss_step=0.00186, global_step=5799.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  21%|██        | 248/1208 [07:07<27:33,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.13e-5, train/loss_step=0.00186, global_step=5799.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  21%|██        | 248/1208 [07:07<27:33,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0341, train/loss_vlb_step=0.00013, train/loss_step=0.0341, global_step=5799.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  21%|██        | 249/1208 [07:08<27:28,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0341, train/loss_vlb_step=0.00013, train/loss_step=0.0341, global_step=5799.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  21%|██        | 249/1208 [07:08<27:28,  1.72s/it, loss=0.0833, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000516, train/loss_step=0.151, global_step=5800.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  21%|██        | 250/1208 [07:09<27:24,  1.72s/it, loss=0.0833, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000516, train/loss_step=0.151, global_step=5800.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  21%|██        | 250/1208 [07:09<27:24,  1.72s/it, loss=0.0811, v_num=0, train/loss_simple_step=0.00461, train/loss_vlb_step=2.38e-5, train/loss_step=0.00461, global_step=5800.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  21%|██        | 251/1208 [07:10<27:20,  1.71s/it, loss=0.0811, v_num=0, train/loss_simple_step=0.00461, train/loss_vlb_step=2.38e-5, train/loss_step=0.00461, global_step=5800.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  21%|██        | 251/1208 [07:10<27:20,  1.71s/it, loss=0.0603, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.38e-5, train/loss_step=0.0149, global_step=5800.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  21%|██        | 252/1208 [07:13<27:24,  1.72s/it, loss=0.0603, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.38e-5, train/loss_step=0.0149, global_step=5800.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  21%|██        | 252/1208 [07:13<27:24,  1.72s/it, loss=0.0597, v_num=0, train/loss_simple_step=0.00681, train/loss_vlb_step=3.53e-5, train/loss_step=0.00681, global_step=5800.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  21%|██        | 253/1208 [07:14<27:20,  1.72s/it, loss=0.0597, v_num=0, train/loss_simple_step=0.00681, train/loss_vlb_step=3.53e-5, train/loss_step=0.00681, global_step=5800.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  21%|██        | 253/1208 [07:14<27:20,  1.72s/it, loss=0.0572, v_num=0, train/loss_simple_step=0.0411, train/loss_vlb_step=0.000159, train/loss_step=0.0411, global_step=5801.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  21%|██        | 254/1208 [07:15<27:15,  1.71s/it, loss=0.0572, v_num=0, train/loss_simple_step=0.0411, train/loss_vlb_step=0.000159, train/loss_step=0.0411, global_step=5801.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  21%|██        | 254/1208 [07:15<27:15,  1.71s/it, loss=0.0657, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000677, train/loss_step=0.189, global_step=5801.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  21%|██        | 255/1208 [07:16<27:11,  1.71s/it, loss=0.0657, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000677, train/loss_step=0.189, global_step=5801.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  21%|██        | 255/1208 [07:16<27:11,  1.71s/it, loss=0.0635, v_num=0, train/loss_simple_step=0.0073, train/loss_vlb_step=3.46e-5, train/loss_step=0.0073, global_step=5801.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  21%|██        | 256/1208 [07:19<27:15,  1.72s/it, loss=0.0635, v_num=0, train/loss_simple_step=0.0073, train/loss_vlb_step=3.46e-5, train/loss_step=0.0073, global_step=5801.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  21%|██        | 256/1208 [07:19<27:15,  1.72s/it, loss=0.0616, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=9.88e-5, train/loss_step=0.026, global_step=5801.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  21%|██▏       | 257/1208 [07:20<27:11,  1.72s/it, loss=0.0616, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=9.88e-5, train/loss_step=0.026, global_step=5801.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  21%|██▏       | 257/1208 [07:20<27:11,  1.72s/it, loss=0.0662, v_num=0, train/loss_simple_step=0.0995, train/loss_vlb_step=0.000328, train/loss_step=0.0995, global_step=5802.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  21%|██▏       | 258/1208 [07:21<27:07,  1.71s/it, loss=0.0662, v_num=0, train/loss_simple_step=0.0995, train/loss_vlb_step=0.000328, train/loss_step=0.0995, global_step=5802.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  21%|██▏       | 258/1208 [07:21<27:07,  1.71s/it, loss=0.0708, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000751, train/loss_step=0.202, global_step=5802.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  21%|██▏       | 259/1208 [07:22<27:03,  1.71s/it, loss=0.0708, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000751, train/loss_step=0.202, global_step=5802.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  21%|██▏       | 259/1208 [07:22<27:03,  1.71s/it, loss=0.0661, v_num=0, train/loss_simple_step=0.00916, train/loss_vlb_step=4.27e-5, train/loss_step=0.00916, global_step=5802.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  22%|██▏       | 260/1208 [07:26<27:07,  1.72s/it, loss=0.0661, v_num=0, train/loss_simple_step=0.00916, train/loss_vlb_step=4.27e-5, train/loss_step=0.00916, global_step=5802.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  22%|██▏       | 260/1208 [07:26<27:07,  1.72s/it, loss=0.0583, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=8.79e-5, train/loss_step=0.0217, global_step=5802.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  22%|██▏       | 261/1208 [07:27<27:02,  1.71s/it, loss=0.0583, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=8.79e-5, train/loss_step=0.0217, global_step=5802.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  22%|██▏       | 261/1208 [07:27<27:02,  1.71s/it, loss=0.0669, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000597, train/loss_step=0.173, global_step=5803.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  22%|██▏       | 262/1208 [07:28<26:58,  1.71s/it, loss=0.0669, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000597, train/loss_step=0.173, global_step=5803.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  22%|██▏       | 262/1208 [07:28<26:58,  1.71s/it, loss=0.0667, v_num=0, train/loss_simple_step=0.00771, train/loss_vlb_step=3.82e-5, train/loss_step=0.00771, global_step=5803.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  22%|██▏       | 263/1208 [07:29<26:54,  1.71s/it, loss=0.0667, v_num=0, train/loss_simple_step=0.00771, train/loss_vlb_step=3.82e-5, train/loss_step=0.00771, global_step=5803.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  22%|██▏       | 263/1208 [07:29<26:54,  1.71s/it, loss=0.0664, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=2.24e-5, train/loss_step=0.00405, global_step=5803.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  22%|██▏       | 264/1208 [07:32<26:58,  1.71s/it, loss=0.0664, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=2.24e-5, train/loss_step=0.00405, global_step=5803.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  22%|██▏       | 264/1208 [07:32<26:58,  1.71s/it, loss=0.0768, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00123, train/loss_step=0.289, global_step=5803.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  22%|██▏       | 265/1208 [07:33<26:54,  1.71s/it, loss=0.0768, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00123, train/loss_step=0.289, global_step=5803.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  22%|██▏       | 265/1208 [07:33<26:54,  1.71s/it, loss=0.0879, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00115, train/loss_step=0.282, global_step=5804.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  22%|██▏       | 266/1208 [07:34<26:50,  1.71s/it, loss=0.0879, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00115, train/loss_step=0.282, global_step=5804.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  22%|██▏       | 266/1208 [07:34<26:50,  1.71s/it, loss=0.0786, v_num=0, train/loss_simple_step=0.00651, train/loss_vlb_step=3.3e-5, train/loss_step=0.00651, global_step=5804.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  22%|██▏       | 267/1208 [07:35<26:46,  1.71s/it, loss=0.0786, v_num=0, train/loss_simple_step=0.00651, train/loss_vlb_step=3.3e-5, train/loss_step=0.00651, global_step=5804.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  22%|██▏       | 267/1208 [07:35<26:46,  1.71s/it, loss=0.0842, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000379, train/loss_step=0.114, global_step=5804.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  22%|██▏       | 268/1208 [07:39<26:49,  1.71s/it, loss=0.0842, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000379, train/loss_step=0.114, global_step=5804.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  22%|██▏       | 268/1208 [07:39<26:49,  1.71s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.00047, train/loss_step=0.143, global_step=5804.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  22%|██▏       | 269/1208 [07:40<26:45,  1.71s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.00047, train/loss_step=0.143, global_step=5804.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  22%|██▏       | 269/1208 [07:40<26:46,  1.71s/it, loss=0.0855, v_num=0, train/loss_simple_step=0.0682, train/loss_vlb_step=0.000227, train/loss_step=0.0682, global_step=5805.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  22%|██▏       | 270/1208 [07:41<26:41,  1.71s/it, loss=0.0855, v_num=0, train/loss_simple_step=0.0682, train/loss_vlb_step=0.000227, train/loss_step=0.0682, global_step=5805.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  22%|██▏       | 270/1208 [07:41<26:41,  1.71s/it, loss=0.0903, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000336, train/loss_step=0.101, global_step=5805.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  22%|██▏       | 271/1208 [07:42<26:37,  1.71s/it, loss=0.0903, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000336, train/loss_step=0.101, global_step=5805.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  22%|██▏       | 271/1208 [07:42<26:37,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000904, train/loss_step=0.227, global_step=5805.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  23%|██▎       | 272/1208 [07:45<26:41,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000904, train/loss_step=0.227, global_step=5805.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  23%|██▎       | 272/1208 [07:45<26:41,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0522, train/loss_vlb_step=0.000177, train/loss_step=0.0522, global_step=5805.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  23%|██▎       | 273/1208 [07:46<26:37,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0522, train/loss_vlb_step=0.000177, train/loss_step=0.0522, global_step=5805.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  23%|██▎       | 273/1208 [07:46<26:37,  1.71s/it, loss=0.114, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.001, train/loss_step=0.254, global_step=5806.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]     Epoch 19:  23%|██▎       | 274/1208 [07:47<26:33,  1.71s/it, loss=0.114, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.001, train/loss_step=0.254, global_step=5806.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  23%|██▎       | 274/1208 [07:47<26:33,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.13e-5, train/loss_step=0.0166, global_step=5806.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  23%|██▎       | 275/1208 [07:48<26:29,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.13e-5, train/loss_step=0.0166, global_step=5806.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  23%|██▎       | 275/1208 [07:48<26:29,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.71e-5, train/loss_step=0.0186, global_step=5806.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  23%|██▎       | 276/1208 [07:51<26:33,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.71e-5, train/loss_step=0.0186, global_step=5806.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  23%|██▎       | 276/1208 [07:51<26:33,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000606, train/loss_step=0.168, global_step=5806.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  23%|██▎       | 277/1208 [07:52<26:29,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000606, train/loss_step=0.168, global_step=5806.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  23%|██▎       | 277/1208 [07:52<26:29,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=2.06e-5, train/loss_step=0.00384, global_step=5807.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  23%|██▎       | 278/1208 [07:53<26:25,  1.70s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=2.06e-5, train/loss_step=0.00384, global_step=5807.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  23%|██▎       | 278/1208 [07:53<26:25,  1.70s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.00852, train/loss_vlb_step=4.08e-5, train/loss_step=0.00852, global_step=5807.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  23%|██▎       | 279/1208 [07:54<26:21,  1.70s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.00852, train/loss_vlb_step=4.08e-5, train/loss_step=0.00852, global_step=5807.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  23%|██▎       | 279/1208 [07:54<26:21,  1.70s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.04e-5, train/loss_step=0.0134, global_step=5807.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  23%|██▎       | 280/1208 [07:58<26:24,  1.71s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.04e-5, train/loss_step=0.0134, global_step=5807.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  23%|██▎       | 280/1208 [07:58<26:24,  1.71s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.25e-5, train/loss_step=0.0196, global_step=5807.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  23%|██▎       | 281/1208 [07:59<26:21,  1.71s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.25e-5, train/loss_step=0.0196, global_step=5807.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  23%|██▎       | 281/1208 [07:59<26:21,  1.71s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.0991, train/loss_vlb_step=0.000326, train/loss_step=0.0991, global_step=5808.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  23%|██▎       | 282/1208 [08:00<26:17,  1.70s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.0991, train/loss_vlb_step=0.000326, train/loss_step=0.0991, global_step=5808.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  23%|██▎       | 282/1208 [08:00<26:17,  1.70s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=1.68e-5, train/loss_step=0.00298, global_step=5808.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  23%|██▎       | 283/1208 [08:01<26:13,  1.70s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=1.68e-5, train/loss_step=0.00298, global_step=5808.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  23%|██▎       | 283/1208 [08:01<26:13,  1.70s/it, loss=0.099, v_num=0, train/loss_simple_step=0.0927, train/loss_vlb_step=0.000306, train/loss_step=0.0927, global_step=5808.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  24%|██▎       | 284/1208 [08:04<26:16,  1.71s/it, loss=0.099, v_num=0, train/loss_simple_step=0.0927, train/loss_vlb_step=0.000306, train/loss_step=0.0927, global_step=5808.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  24%|██▎       | 284/1208 [08:04<26:16,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00419, train/loss_step=0.397, global_step=5808.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  24%|██▎       | 285/1208 [08:05<26:12,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00419, train/loss_step=0.397, global_step=5808.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  24%|██▎       | 285/1208 [08:05<26:12,  1.70s/it, loss=0.0904, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=9.93e-6, train/loss_step=0.00164, global_step=5809.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  24%|██▎       | 286/1208 [08:06<26:09,  1.70s/it, loss=0.0904, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=9.93e-6, train/loss_step=0.00164, global_step=5809.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  24%|██▎       | 286/1208 [08:06<26:09,  1.70s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000109, train/loss_step=0.0281, global_step=5809.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  24%|██▍       | 287/1208 [08:07<26:05,  1.70s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000109, train/loss_step=0.0281, global_step=5809.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  24%|██▍       | 287/1208 [08:07<26:05,  1.70s/it, loss=0.089, v_num=0, train/loss_simple_step=0.0648, train/loss_vlb_step=0.000222, train/loss_step=0.0648, global_step=5809.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  24%|██▍       | 288/1208 [08:10<26:08,  1.70s/it, loss=0.089, v_num=0, train/loss_simple_step=0.0648, train/loss_vlb_step=0.000222, train/loss_step=0.0648, global_step=5809.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  24%|██▍       | 288/1208 [08:10<26:08,  1.70s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000893, train/loss_step=0.227, global_step=5809.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  24%|██▍       | 289/1208 [08:11<26:04,  1.70s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000893, train/loss_step=0.227, global_step=5809.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  24%|██▍       | 289/1208 [08:11<26:04,  1.70s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.088, train/loss_vlb_step=0.000292, train/loss_step=0.088, global_step=5810.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  24%|██▍       | 290/1208 [08:12<26:00,  1.70s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.088, train/loss_vlb_step=0.000292, train/loss_step=0.088, global_step=5810.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  24%|██▍       | 290/1208 [08:12<26:00,  1.70s/it, loss=0.0901, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=8.16e-5, train/loss_step=0.0185, global_step=5810.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  24%|██▍       | 291/1208 [08:14<25:56,  1.70s/it, loss=0.0901, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=8.16e-5, train/loss_step=0.0185, global_step=5810.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  24%|██▍       | 291/1208 [08:14<25:56,  1.70s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00104, train/loss_step=0.264, global_step=5810.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  24%|██▍       | 292/1208 [08:17<26:00,  1.70s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00104, train/loss_step=0.264, global_step=5810.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  24%|██▍       | 292/1208 [08:17<26:00,  1.70s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000122, train/loss_step=0.0307, global_step=5810.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  24%|██▍       | 293/1208 [08:18<25:56,  1.70s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000122, train/loss_step=0.0307, global_step=5810.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  24%|██▍       | 293/1208 [08:18<25:56,  1.70s/it, loss=0.0809, v_num=0, train/loss_simple_step=0.0554, train/loss_vlb_step=0.000196, train/loss_step=0.0554, global_step=5811.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  24%|██▍       | 294/1208 [08:19<25:52,  1.70s/it, loss=0.0809, v_num=0, train/loss_simple_step=0.0554, train/loss_vlb_step=0.000196, train/loss_step=0.0554, global_step=5811.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  24%|██▍       | 294/1208 [08:19<25:52,  1.70s/it, loss=0.082, v_num=0, train/loss_simple_step=0.0391, train/loss_vlb_step=0.000145, train/loss_step=0.0391, global_step=5811.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  24%|██▍       | 295/1208 [08:20<25:48,  1.70s/it, loss=0.082, v_num=0, train/loss_simple_step=0.0391, train/loss_vlb_step=0.000145, train/loss_step=0.0391, global_step=5811.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  24%|██▍       | 295/1208 [08:20<25:48,  1.70s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00117, train/loss_step=0.277, global_step=5811.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  25%|██▍       | 296/1208 [08:23<25:51,  1.70s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00117, train/loss_step=0.277, global_step=5811.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  25%|██▍       | 296/1208 [08:23<25:51,  1.70s/it, loss=0.091, v_num=0, train/loss_simple_step=0.0895, train/loss_vlb_step=0.000295, train/loss_step=0.0895, global_step=5811.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  25%|██▍       | 297/1208 [08:24<25:48,  1.70s/it, loss=0.091, v_num=0, train/loss_simple_step=0.0895, train/loss_vlb_step=0.000295, train/loss_step=0.0895, global_step=5811.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  25%|██▍       | 297/1208 [08:24<25:48,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00114, train/loss_step=0.274, global_step=5812.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  25%|██▍       | 298/1208 [08:25<25:44,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00114, train/loss_step=0.274, global_step=5812.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  25%|██▍       | 298/1208 [08:25<25:44,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.67e-5, train/loss_step=0.00284, global_step=5812.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  25%|██▍       | 299/1208 [08:26<25:40,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.67e-5, train/loss_step=0.00284, global_step=5812.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  25%|██▍       | 299/1208 [08:26<25:40,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00856, train/loss_vlb_step=4.02e-5, train/loss_step=0.00856, global_step=5812.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  25%|██▍       | 300/1208 [08:30<25:43,  1.70s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00856, train/loss_vlb_step=4.02e-5, train/loss_step=0.00856, global_step=5812.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  25%|██▍       | 300/1208 [08:30<25:43,  1.70s/it, loss=0.107, v_num=0, train/loss_simple_step=0.080, train/loss_vlb_step=0.000263, train/loss_step=0.080, global_step=5812.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.84it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.76it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.73it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.74it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.81it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.76it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.76it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.79it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.76it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.76it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.76it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 19:  25%|██▍       | 301/1208 [09:00<27:09,  1.80s/it, loss=0.107, v_num=0, train/loss_simple_step=0.080, train/loss_vlb_step=0.000263, train/loss_step=0.080, global_step=5812.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  25%|██▍       | 301/1208 [09:00<27:09,  1.80s/it, loss=0.113, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000808, train/loss_step=0.209, global_step=5813.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  25%|██▌       | 302/1208 [09:01<27:05,  1.79s/it, loss=0.113, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000808, train/loss_step=0.209, global_step=5813.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  25%|██▌       | 302/1208 [09:01<27:05,  1.79s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.000169, train/loss_step=0.0485, global_step=5813.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  25%|██▌       | 303/1208 [09:02<27:00,  1.79s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.000169, train/loss_step=0.0485, global_step=5813.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  25%|██▌       | 303/1208 [09:02<27:00,  1.79s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.98e-5, train/loss_step=0.0157, global_step=5813.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  25%|██▌       | 304/1208 [09:05<27:03,  1.80s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.98e-5, train/loss_step=0.0157, global_step=5813.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  25%|██▌       | 304/1208 [09:05<27:03,  1.80s/it, loss=0.101, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.0007, train/loss_step=0.199, global_step=5813.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  25%|██▌       | 305/1208 [09:06<26:59,  1.79s/it, loss=0.101, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.0007, train/loss_step=0.199, global_step=5813.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  25%|██▌       | 305/1208 [09:06<26:59,  1.79s/it, loss=0.115, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.0012, train/loss_step=0.272, global_step=5814.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  25%|██▌       | 306/1208 [09:07<26:55,  1.79s/it, loss=0.115, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.0012, train/loss_step=0.272, global_step=5814.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  25%|██▌       | 306/1208 [09:07<26:55,  1.79s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000109, train/loss_step=0.0281, global_step=5814.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  25%|██▌       | 307/1208 [09:08<26:51,  1.79s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000109, train/loss_step=0.0281, global_step=5814.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  25%|██▌       | 307/1208 [09:08<26:51,  1.79s/it, loss=0.125, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00154, train/loss_step=0.282, global_step=5814.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  25%|██▌       | 308/1208 [09:12<26:53,  1.79s/it, loss=0.125, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00154, train/loss_step=0.282, global_step=5814.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  25%|██▌       | 308/1208 [09:12<26:53,  1.79s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0052, train/loss_vlb_step=2.71e-5, train/loss_step=0.0052, global_step=5814.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  26%|██▌       | 309/1208 [09:13<26:49,  1.79s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0052, train/loss_vlb_step=2.71e-5, train/loss_step=0.0052, global_step=5814.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  26%|██▌       | 309/1208 [09:13<26:49,  1.79s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0758, train/loss_vlb_step=0.000256, train/loss_step=0.0758, global_step=5815.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  26%|██▌       | 310/1208 [09:14<26:45,  1.79s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0758, train/loss_vlb_step=0.000256, train/loss_step=0.0758, global_step=5815.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  26%|██▌       | 310/1208 [09:14<26:45,  1.79s/it, loss=0.126, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00103, train/loss_step=0.266, global_step=5815.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  26%|██▌       | 311/1208 [09:15<26:41,  1.79s/it, loss=0.126, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00103, train/loss_step=0.266, global_step=5815.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  26%|██▌       | 311/1208 [09:15<26:41,  1.79s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0737, train/loss_vlb_step=0.000245, train/loss_step=0.0737, global_step=5815.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  26%|██▌       | 312/1208 [09:18<26:44,  1.79s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0737, train/loss_vlb_step=0.000245, train/loss_step=0.0737, global_step=5815.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  26%|██▌       | 312/1208 [09:18<26:44,  1.79s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0911, train/loss_vlb_step=0.000301, train/loss_step=0.0911, global_step=5815.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  26%|██▌       | 313/1208 [09:19<26:40,  1.79s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0911, train/loss_vlb_step=0.000301, train/loss_step=0.0911, global_step=5815.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  26%|██▌       | 313/1208 [09:19<26:40,  1.79s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.83e-5, train/loss_step=0.0219, global_step=5816.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  26%|██▌       | 314/1208 [09:20<26:36,  1.79s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.83e-5, train/loss_step=0.0219, global_step=5816.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  26%|██▌       | 314/1208 [09:20<26:36,  1.79s/it, loss=0.125, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000645, train/loss_step=0.181, global_step=5816.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  26%|██▌       | 315/1208 [09:21<26:32,  1.78s/it, loss=0.125, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000645, train/loss_step=0.181, global_step=5816.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  26%|██▌       | 315/1208 [09:21<26:32,  1.78s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0893, train/loss_vlb_step=0.000295, train/loss_step=0.0893, global_step=5816.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  26%|██▌       | 316/1208 [09:24<26:34,  1.79s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0893, train/loss_vlb_step=0.000295, train/loss_step=0.0893, global_step=5816.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  26%|██▌       | 316/1208 [09:24<26:34,  1.79s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.17e-5, train/loss_step=0.00198, global_step=5816.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  26%|██▌       | 317/1208 [09:26<26:30,  1.79s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.17e-5, train/loss_step=0.00198, global_step=5816.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  26%|██▌       | 317/1208 [09:26<26:30,  1.79s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0657, train/loss_vlb_step=0.000217, train/loss_step=0.0657, global_step=5817.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  26%|██▋       | 318/1208 [09:27<26:27,  1.78s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0657, train/loss_vlb_step=0.000217, train/loss_step=0.0657, global_step=5817.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  26%|██▋       | 318/1208 [09:27<26:27,  1.78s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.41e-5, train/loss_step=0.00236, global_step=5817.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  26%|██▋       | 319/1208 [09:28<26:23,  1.78s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.41e-5, train/loss_step=0.00236, global_step=5817.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  26%|██▋       | 319/1208 [09:28<26:23,  1.78s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.66e-5, train/loss_step=0.0186, global_step=5817.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  26%|██▋       | 320/1208 [09:31<26:25,  1.79s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.66e-5, train/loss_step=0.0186, global_step=5817.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  26%|██▋       | 320/1208 [09:31<26:25,  1.79s/it, loss=0.105, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000474, train/loss_step=0.144, global_step=5817.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  27%|██▋       | 321/1208 [09:32<26:21,  1.78s/it, loss=0.105, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000474, train/loss_step=0.144, global_step=5817.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  27%|██▋       | 321/1208 [09:32<26:21,  1.78s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=5818.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  27%|██▋       | 322/1208 [09:33<26:17,  1.78s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=5818.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  27%|██▋       | 322/1208 [09:33<26:17,  1.78s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=9.33e-6, train/loss_step=0.00153, global_step=5818.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  27%|██▋       | 323/1208 [09:34<26:14,  1.78s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=9.33e-6, train/loss_step=0.00153, global_step=5818.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  27%|██▋       | 323/1208 [09:34<26:14,  1.78s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.000121, train/loss_step=0.0313, global_step=5818.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  27%|██▋       | 324/1208 [09:37<26:16,  1.78s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.000121, train/loss_step=0.0313, global_step=5818.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  27%|██▋       | 324/1208 [09:37<26:16,  1.78s/it, loss=0.09, v_num=0, train/loss_simple_step=0.0446, train/loss_vlb_step=0.000155, train/loss_step=0.0446, global_step=5818.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  27%|██▋       | 325/1208 [09:38<26:12,  1.78s/it, loss=0.09, v_num=0, train/loss_simple_step=0.0446, train/loss_vlb_step=0.000155, train/loss_step=0.0446, global_step=5818.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  27%|██▋       | 325/1208 [09:38<26:12,  1.78s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.461, train/loss_vlb_step=0.00494, train/loss_step=0.461, global_step=5819.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  27%|██▋       | 326/1208 [09:39<26:08,  1.78s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.461, train/loss_vlb_step=0.00494, train/loss_step=0.461, global_step=5819.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  27%|██▋       | 326/1208 [09:39<26:08,  1.78s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0911, train/loss_vlb_step=0.000301, train/loss_step=0.0911, global_step=5819.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  27%|██▋       | 327/1208 [09:40<26:04,  1.78s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0911, train/loss_vlb_step=0.000301, train/loss_step=0.0911, global_step=5819.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  27%|██▋       | 327/1208 [09:40<26:04,  1.78s/it, loss=0.09, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000115, train/loss_step=0.0301, global_step=5819.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  27%|██▋       | 328/1208 [09:44<26:06,  1.78s/it, loss=0.09, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000115, train/loss_step=0.0301, global_step=5819.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  27%|██▋       | 328/1208 [09:44<26:06,  1.78s/it, loss=0.119, v_num=0, train/loss_simple_step=0.584, train/loss_vlb_step=0.0118, train/loss_step=0.584, global_step=5819.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  27%|██▋       | 329/1208 [09:45<26:03,  1.78s/it, loss=0.119, v_num=0, train/loss_simple_step=0.584, train/loss_vlb_step=0.0118, train/loss_step=0.584, global_step=5819.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  27%|██▋       | 329/1208 [09:45<26:03,  1.78s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=7.44e-5, train/loss_step=0.0192, global_step=5820.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  27%|██▋       | 330/1208 [09:46<25:59,  1.78s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=7.44e-5, train/loss_step=0.0192, global_step=5820.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  27%|██▋       | 330/1208 [09:46<25:59,  1.78s/it, loss=0.117, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00163, train/loss_step=0.293, global_step=5820.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  27%|██▋       | 331/1208 [09:47<25:55,  1.77s/it, loss=0.117, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00163, train/loss_step=0.293, global_step=5820.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  27%|██▋       | 331/1208 [09:47<25:55,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.968, train/loss_vlb_step=0.487, train/loss_step=0.968, global_step=5820.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  27%|██▋       | 332/1208 [09:50<25:57,  1.78s/it, loss=0.162, v_num=0, train/loss_simple_step=0.968, train/loss_vlb_step=0.487, train/loss_step=0.968, global_step=5820.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  27%|██▋       | 332/1208 [09:50<25:57,  1.78s/it, loss=0.166, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000589, train/loss_step=0.172, global_step=5820.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  28%|██▊       | 333/1208 [09:51<25:54,  1.78s/it, loss=0.166, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000589, train/loss_step=0.172, global_step=5820.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  28%|██▊       | 333/1208 [09:51<25:54,  1.78s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=2e-5, train/loss_step=0.00366, global_step=5821.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  28%|██▊       | 334/1208 [09:52<25:50,  1.77s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=2e-5, train/loss_step=0.00366, global_step=5821.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  28%|██▊       | 334/1208 [09:52<25:50,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000377, train/loss_step=0.115, global_step=5821.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  28%|██▊       | 335/1208 [09:53<25:46,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000377, train/loss_step=0.115, global_step=5821.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  28%|██▊       | 335/1208 [09:53<25:46,  1.77s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00641, train/loss_vlb_step=3.33e-5, train/loss_step=0.00641, global_step=5821.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  28%|██▊       | 336/1208 [09:56<25:48,  1.78s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00641, train/loss_vlb_step=3.33e-5, train/loss_step=0.00641, global_step=5821.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  28%|██▊       | 336/1208 [09:56<25:48,  1.78s/it, loss=0.169, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000767, train/loss_step=0.218, global_step=5821.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  28%|██▊       | 337/1208 [09:57<25:45,  1.77s/it, loss=0.169, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000767, train/loss_step=0.218, global_step=5821.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  28%|██▊       | 337/1208 [09:57<25:45,  1.77s/it, loss=0.178, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00111, train/loss_step=0.257, global_step=5822.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  28%|██▊       | 338/1208 [09:58<25:41,  1.77s/it, loss=0.178, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00111, train/loss_step=0.257, global_step=5822.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  28%|██▊       | 338/1208 [09:58<25:41,  1.77s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00479, train/loss_vlb_step=2.52e-5, train/loss_step=0.00479, global_step=5822.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  28%|██▊       | 339/1208 [09:59<25:37,  1.77s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00479, train/loss_vlb_step=2.52e-5, train/loss_step=0.00479, global_step=5822.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  28%|██▊       | 339/1208 [09:59<25:37,  1.77s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00467, train/loss_vlb_step=2.45e-5, train/loss_step=0.00467, global_step=5822.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  28%|██▊       | 340/1208 [10:03<25:39,  1.77s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00467, train/loss_vlb_step=2.45e-5, train/loss_step=0.00467, global_step=5822.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  28%|██▊       | 340/1208 [10:03<25:39,  1.77s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00693, train/loss_vlb_step=3.14e-5, train/loss_step=0.00693, global_step=5822.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  28%|██▊       | 341/1208 [10:04<25:36,  1.77s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00693, train/loss_vlb_step=3.14e-5, train/loss_step=0.00693, global_step=5822.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  28%|██▊       | 341/1208 [10:04<25:36,  1.77s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00415, train/loss_vlb_step=2.22e-5, train/loss_step=0.00415, global_step=5823.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  28%|██▊       | 342/1208 [10:05<25:32,  1.77s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00415, train/loss_vlb_step=2.22e-5, train/loss_step=0.00415, global_step=5823.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  28%|██▊       | 342/1208 [10:05<25:32,  1.77s/it, loss=0.17, v_num=0, train/loss_simple_step=0.081, train/loss_vlb_step=0.000269, train/loss_step=0.081, global_step=5823.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  28%|██▊       | 343/1208 [10:06<25:28,  1.77s/it, loss=0.17, v_num=0, train/loss_simple_step=0.081, train/loss_vlb_step=0.000269, train/loss_step=0.081, global_step=5823.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  28%|██▊       | 343/1208 [10:06<25:28,  1.77s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0303, train/loss_vlb_step=0.000118, train/loss_step=0.0303, global_step=5823.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  28%|██▊       | 344/1208 [10:09<25:30,  1.77s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0303, train/loss_vlb_step=0.000118, train/loss_step=0.0303, global_step=5823.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  28%|██▊       | 344/1208 [10:09<25:30,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00753, train/loss_vlb_step=3.65e-5, train/loss_step=0.00753, global_step=5823.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  29%|██▊       | 345/1208 [10:10<25:27,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00753, train/loss_vlb_step=3.65e-5, train/loss_step=0.00753, global_step=5823.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  29%|██▊       | 345/1208 [10:10<25:27,  1.77s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.75e-5, train/loss_step=0.0126, global_step=5824.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  29%|██▊       | 346/1208 [10:11<25:23,  1.77s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.75e-5, train/loss_step=0.0126, global_step=5824.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  29%|██▊       | 346/1208 [10:11<25:23,  1.77s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00642, train/loss_vlb_step=3.17e-5, train/loss_step=0.00642, global_step=5824.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  29%|██▊       | 347/1208 [10:12<25:20,  1.77s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00642, train/loss_vlb_step=3.17e-5, train/loss_step=0.00642, global_step=5824.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  29%|██▊       | 347/1208 [10:12<25:20,  1.77s/it, loss=0.142, v_num=0, train/loss_simple_step=0.055, train/loss_vlb_step=0.000201, train/loss_step=0.055, global_step=5824.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  29%|██▉       | 348/1208 [10:15<25:22,  1.77s/it, loss=0.142, v_num=0, train/loss_simple_step=0.055, train/loss_vlb_step=0.000201, train/loss_step=0.055, global_step=5824.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  29%|██▉       | 348/1208 [10:15<25:22,  1.77s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0303, train/loss_vlb_step=0.000116, train/loss_step=0.0303, global_step=5824.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  29%|██▉       | 349/1208 [10:16<25:18,  1.77s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0303, train/loss_vlb_step=0.000116, train/loss_step=0.0303, global_step=5824.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  29%|██▉       | 349/1208 [10:16<25:18,  1.77s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0423, train/loss_vlb_step=0.000156, train/loss_step=0.0423, global_step=5825.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  29%|██▉       | 350/1208 [10:18<25:15,  1.77s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0423, train/loss_vlb_step=0.000156, train/loss_step=0.0423, global_step=5825.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  29%|██▉       | 350/1208 [10:18<25:15,  1.77s/it, loss=0.107, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=5825.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  29%|██▉       | 351/1208 [10:19<25:11,  1.76s/it, loss=0.107, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=5825.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  29%|██▉       | 351/1208 [10:19<25:11,  1.76s/it, loss=0.0626, v_num=0, train/loss_simple_step=0.0808, train/loss_vlb_step=0.000268, train/loss_step=0.0808, global_step=5825.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  29%|██▉       | 352/1208 [10:22<25:13,  1.77s/it, loss=0.0626, v_num=0, train/loss_simple_step=0.0808, train/loss_vlb_step=0.000268, train/loss_step=0.0808, global_step=5825.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  29%|██▉       | 352/1208 [10:22<25:13,  1.77s/it, loss=0.0573, v_num=0, train/loss_simple_step=0.0654, train/loss_vlb_step=0.000225, train/loss_step=0.0654, global_step=5825.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  29%|██▉       | 353/1208 [10:23<25:09,  1.77s/it, loss=0.0573, v_num=0, train/loss_simple_step=0.0654, train/loss_vlb_step=0.000225, train/loss_step=0.0654, global_step=5825.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  29%|██▉       | 353/1208 [10:23<25:09,  1.77s/it, loss=0.0697, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.000959, train/loss_step=0.253, global_step=5826.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  29%|██▉       | 354/1208 [10:24<25:05,  1.76s/it, loss=0.0697, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.000959, train/loss_step=0.253, global_step=5826.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  29%|██▉       | 354/1208 [10:24<25:05,  1.76s/it, loss=0.0653, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.0001, train/loss_step=0.0255, global_step=5826.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  29%|██▉       | 355/1208 [10:25<25:02,  1.76s/it, loss=0.0653, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.0001, train/loss_step=0.0255, global_step=5826.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  29%|██▉       | 355/1208 [10:25<25:02,  1.76s/it, loss=0.0782, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00119, train/loss_step=0.265, global_step=5826.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  29%|██▉       | 356/1208 [10:28<25:03,  1.76s/it, loss=0.0782, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00119, train/loss_step=0.265, global_step=5826.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  29%|██▉       | 356/1208 [10:28<25:03,  1.76s/it, loss=0.0674, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.64e-5, train/loss_step=0.00281, global_step=5826.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  30%|██▉       | 357/1208 [10:29<24:59,  1.76s/it, loss=0.0674, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.64e-5, train/loss_step=0.00281, global_step=5826.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  30%|██▉       | 357/1208 [10:29<24:59,  1.76s/it, loss=0.0562, v_num=0, train/loss_simple_step=0.0323, train/loss_vlb_step=0.00012, train/loss_step=0.0323, global_step=5827.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  30%|██▉       | 358/1208 [10:30<24:56,  1.76s/it, loss=0.0562, v_num=0, train/loss_simple_step=0.0323, train/loss_vlb_step=0.00012, train/loss_step=0.0323, global_step=5827.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  30%|██▉       | 358/1208 [10:30<24:56,  1.76s/it, loss=0.0687, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00106, train/loss_step=0.255, global_step=5827.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  30%|██▉       | 359/1208 [10:31<24:52,  1.76s/it, loss=0.0687, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00106, train/loss_step=0.255, global_step=5827.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  30%|██▉       | 359/1208 [10:31<24:52,  1.76s/it, loss=0.114, v_num=0, train/loss_simple_step=0.904, train/loss_vlb_step=0.153, train/loss_step=0.904, global_step=5827.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  30%|██▉       | 360/1208 [10:34<24:53,  1.76s/it, loss=0.114, v_num=0, train/loss_simple_step=0.904, train/loss_vlb_step=0.153, train/loss_step=0.904, global_step=5827.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  30%|██▉       | 360/1208 [10:34<24:53,  1.76s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.66e-5, train/loss_step=0.0182, global_step=5827.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  30%|██▉       | 361/1208 [10:35<24:50,  1.76s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.66e-5, train/loss_step=0.0182, global_step=5827.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  30%|██▉       | 361/1208 [10:35<24:50,  1.76s/it, loss=0.147, v_num=0, train/loss_simple_step=0.655, train/loss_vlb_step=0.0113, train/loss_step=0.655, global_step=5828.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  30%|██▉       | 362/1208 [10:36<24:46,  1.76s/it, loss=0.147, v_num=0, train/loss_simple_step=0.655, train/loss_vlb_step=0.0113, train/loss_step=0.655, global_step=5828.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  30%|██▉       | 362/1208 [10:36<24:46,  1.76s/it, loss=0.148, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.00037, train/loss_step=0.113, global_step=5828.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  30%|███       | 363/1208 [10:37<24:42,  1.76s/it, loss=0.148, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.00037, train/loss_step=0.113, global_step=5828.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  30%|███       | 363/1208 [10:37<24:42,  1.76s/it, loss=0.161, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00141, train/loss_step=0.278, global_step=5828.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  30%|███       | 364/1208 [10:39<24:43,  1.76s/it, loss=0.161, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00141, train/loss_step=0.278, global_step=5828.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  30%|███       | 364/1208 [10:39<24:43,  1.76s/it, loss=0.169, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000551, train/loss_step=0.163, global_step=5828.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  30%|███       | 365/1208 [10:40<24:40,  1.76s/it, loss=0.169, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000551, train/loss_step=0.163, global_step=5828.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  30%|███       | 365/1208 [10:40<24:40,  1.76s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00764, train/loss_vlb_step=3.59e-5, train/loss_step=0.00764, global_step=5829.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  30%|███       | 366/1208 [10:42<24:36,  1.75s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00764, train/loss_vlb_step=3.59e-5, train/loss_step=0.00764, global_step=5829.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  30%|███       | 366/1208 [10:42<24:36,  1.75s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00318, train/loss_vlb_step=1.78e-5, train/loss_step=0.00318, global_step=5829.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  30%|███       | 367/1208 [10:43<24:33,  1.75s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00318, train/loss_vlb_step=1.78e-5, train/loss_step=0.00318, global_step=5829.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  30%|███       | 367/1208 [10:43<24:33,  1.75s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.48e-5, train/loss_step=0.0101, global_step=5829.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  30%|███       | 368/1208 [10:45<24:34,  1.76s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.48e-5, train/loss_step=0.0101, global_step=5829.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  30%|███       | 368/1208 [10:45<24:34,  1.76s/it, loss=0.176, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000896, train/loss_step=0.232, global_step=5829.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  31%|███       | 369/1208 [10:46<24:30,  1.75s/it, loss=0.176, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000896, train/loss_step=0.232, global_step=5829.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  31%|███       | 369/1208 [10:46<24:30,  1.75s/it, loss=0.198, v_num=0, train/loss_simple_step=0.493, train/loss_vlb_step=0.00354, train/loss_step=0.493, global_step=5830.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  31%|███       | 370/1208 [10:47<24:27,  1.75s/it, loss=0.198, v_num=0, train/loss_simple_step=0.493, train/loss_vlb_step=0.00354, train/loss_step=0.493, global_step=5830.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  31%|███       | 370/1208 [10:47<24:27,  1.75s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00694, train/loss_vlb_step=3.46e-5, train/loss_step=0.00694, global_step=5830.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  31%|███       | 371/1208 [10:48<24:24,  1.75s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00694, train/loss_vlb_step=3.46e-5, train/loss_step=0.00694, global_step=5830.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  31%|███       | 371/1208 [10:48<24:24,  1.75s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=1e-5, train/loss_step=0.00168, global_step=5830.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  31%|███       | 372/1208 [10:51<24:24,  1.75s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=1e-5, train/loss_step=0.00168, global_step=5830.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  31%|███       | 372/1208 [10:51<24:24,  1.75s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00655, train/loss_vlb_step=3.28e-5, train/loss_step=0.00655, global_step=5830.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  31%|███       | 373/1208 [10:52<24:21,  1.75s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00655, train/loss_vlb_step=3.28e-5, train/loss_step=0.00655, global_step=5830.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  31%|███       | 373/1208 [10:52<24:21,  1.75s/it, loss=0.193, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00251, train/loss_step=0.390, global_step=5831.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  31%|███       | 374/1208 [10:53<24:18,  1.75s/it, loss=0.193, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00251, train/loss_step=0.390, global_step=5831.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  31%|███       | 374/1208 [10:53<24:18,  1.75s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=0.00011, train/loss_step=0.0257, global_step=5831.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  31%|███       | 375/1208 [10:54<24:14,  1.75s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=0.00011, train/loss_step=0.0257, global_step=5831.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  31%|███       | 375/1208 [10:54<24:14,  1.75s/it, loss=0.185, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=5831.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  31%|███       | 376/1208 [10:57<24:15,  1.75s/it, loss=0.185, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=5831.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  31%|███       | 376/1208 [10:57<24:15,  1.75s/it, loss=0.193, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000554, train/loss_step=0.161, global_step=5831.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  31%|███       | 377/1208 [10:58<24:12,  1.75s/it, loss=0.193, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000554, train/loss_step=0.161, global_step=5831.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  31%|███       | 377/1208 [10:58<24:12,  1.75s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=1.02e-5, train/loss_step=0.0017, global_step=5832.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  31%|███▏      | 378/1208 [10:59<24:08,  1.75s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=1.02e-5, train/loss_step=0.0017, global_step=5832.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  31%|███▏      | 378/1208 [10:59<24:08,  1.75s/it, loss=0.19, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000842, train/loss_step=0.216, global_step=5832.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  31%|███▏      | 379/1208 [11:00<24:05,  1.74s/it, loss=0.19, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000842, train/loss_step=0.216, global_step=5832.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  31%|███▏      | 379/1208 [11:00<24:05,  1.74s/it, loss=0.169, v_num=0, train/loss_simple_step=0.484, train/loss_vlb_step=0.00734, train/loss_step=0.484, global_step=5832.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  31%|███▏      | 380/1208 [11:03<24:06,  1.75s/it, loss=0.169, v_num=0, train/loss_simple_step=0.484, train/loss_vlb_step=0.00734, train/loss_step=0.484, global_step=5832.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  31%|███▏      | 380/1208 [11:03<24:06,  1.75s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000108, train/loss_step=0.0277, global_step=5832.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  32%|███▏      | 381/1208 [11:04<24:02,  1.74s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000108, train/loss_step=0.0277, global_step=5832.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  32%|███▏      | 381/1208 [11:04<24:02,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000425, train/loss_step=0.129, global_step=5833.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  32%|███▏      | 382/1208 [11:05<23:59,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000425, train/loss_step=0.129, global_step=5833.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  32%|███▏      | 382/1208 [11:05<23:59,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.53e-5, train/loss_step=0.0207, global_step=5833.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  32%|███▏      | 383/1208 [11:06<23:56,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.53e-5, train/loss_step=0.0207, global_step=5833.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  32%|███▏      | 383/1208 [11:06<23:56,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000984, train/loss_step=0.239, global_step=5833.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  32%|███▏      | 384/1208 [11:09<23:56,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000984, train/loss_step=0.239, global_step=5833.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  32%|███▏      | 384/1208 [11:09<23:56,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.34e-5, train/loss_step=0.0205, global_step=5833.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  32%|███▏      | 385/1208 [11:10<23:53,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.34e-5, train/loss_step=0.0205, global_step=5833.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  32%|███▏      | 385/1208 [11:10<23:53,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.26e-5, train/loss_step=0.00216, global_step=5834.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  32%|███▏      | 386/1208 [11:11<23:50,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.26e-5, train/loss_step=0.00216, global_step=5834.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  32%|███▏      | 386/1208 [11:11<23:50,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0729, train/loss_vlb_step=0.000244, train/loss_step=0.0729, global_step=5834.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  32%|███▏      | 387/1208 [11:12<23:46,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0729, train/loss_vlb_step=0.000244, train/loss_step=0.0729, global_step=5834.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  32%|███▏      | 387/1208 [11:12<23:46,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000748, train/loss_step=0.202, global_step=5834.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  32%|███▏      | 388/1208 [11:15<23:47,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000748, train/loss_step=0.202, global_step=5834.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  32%|███▏      | 388/1208 [11:15<23:47,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000297, train/loss_step=0.0901, global_step=5834.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  32%|███▏      | 389/1208 [11:16<23:44,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000297, train/loss_step=0.0901, global_step=5834.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  32%|███▏      | 389/1208 [11:16<23:44,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.00045, train/loss_step=0.135, global_step=5835.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  32%|███▏      | 390/1208 [11:17<23:41,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.00045, train/loss_step=0.135, global_step=5835.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  32%|███▏      | 390/1208 [11:17<23:41,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=2.09e-5, train/loss_step=0.00375, global_step=5835.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  32%|███▏      | 391/1208 [11:18<23:37,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=2.09e-5, train/loss_step=0.00375, global_step=5835.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  32%|███▏      | 391/1208 [11:18<23:37,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.000133, train/loss_step=0.0347, global_step=5835.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  32%|███▏      | 392/1208 [11:21<23:38,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.000133, train/loss_step=0.0347, global_step=5835.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  32%|███▏      | 392/1208 [11:21<23:38,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000659, train/loss_step=0.177, global_step=5835.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  33%|███▎      | 393/1208 [11:22<23:35,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000659, train/loss_step=0.177, global_step=5835.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  33%|███▎      | 393/1208 [11:22<23:35,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0872, train/loss_vlb_step=0.000292, train/loss_step=0.0872, global_step=5836.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  33%|███▎      | 394/1208 [11:23<23:32,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0872, train/loss_vlb_step=0.000292, train/loss_step=0.0872, global_step=5836.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  33%|███▎      | 394/1208 [11:23<23:32,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0851, train/loss_vlb_step=0.000288, train/loss_step=0.0851, global_step=5836.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  33%|███▎      | 395/1208 [11:24<23:28,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0851, train/loss_vlb_step=0.000288, train/loss_step=0.0851, global_step=5836.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  33%|███▎      | 395/1208 [11:24<23:28,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00262, train/loss_step=0.346, global_step=5836.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  33%|███▎      | 396/1208 [11:27<23:29,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00262, train/loss_step=0.346, global_step=5836.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  33%|███▎      | 396/1208 [11:27<23:29,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.438, train/loss_vlb_step=0.00323, train/loss_step=0.438, global_step=5836.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  33%|███▎      | 397/1208 [11:28<23:26,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.438, train/loss_vlb_step=0.00323, train/loss_step=0.438, global_step=5836.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  33%|███▎      | 397/1208 [11:28<23:26,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.662, train/loss_vlb_step=0.0206, train/loss_step=0.662, global_step=5837.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  33%|███▎      | 398/1208 [11:29<23:23,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.662, train/loss_vlb_step=0.0206, train/loss_step=0.662, global_step=5837.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  33%|███▎      | 398/1208 [11:29<23:23,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.467, train/loss_vlb_step=0.00508, train/loss_step=0.467, global_step=5837.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  33%|███▎      | 399/1208 [11:30<23:19,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.467, train/loss_vlb_step=0.00508, train/loss_step=0.467, global_step=5837.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  33%|███▎      | 399/1208 [11:30<23:19,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.000102, train/loss_step=0.0256, global_step=5837.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  33%|███▎      | 400/1208 [11:33<23:20,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.000102, train/loss_step=0.0256, global_step=5837.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  33%|███▎      | 400/1208 [11:33<23:20,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00263, train/loss_step=0.366, global_step=5837.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  33%|███▎      | 401/1208 [11:34<23:17,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00263, train/loss_step=0.366, global_step=5837.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  33%|███▎      | 401/1208 [11:34<23:17,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0929, train/loss_vlb_step=0.000306, train/loss_step=0.0929, global_step=5838.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  33%|███▎      | 402/1208 [11:35<23:14,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0929, train/loss_vlb_step=0.000306, train/loss_step=0.0929, global_step=5838.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  33%|███▎      | 402/1208 [11:35<23:14,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00332, train/loss_step=0.383, global_step=5838.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  33%|███▎      | 403/1208 [11:36<23:10,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00332, train/loss_step=0.383, global_step=5838.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  33%|███▎      | 403/1208 [11:36<23:10,  1.73s/it, loss=0.215, v_num=0, train/loss_simple_step=0.607, train/loss_vlb_step=0.0213, train/loss_step=0.607, global_step=5838.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  33%|███▎      | 404/1208 [11:39<23:11,  1.73s/it, loss=0.215, v_num=0, train/loss_simple_step=0.607, train/loss_vlb_step=0.0213, train/loss_step=0.607, global_step=5838.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  33%|███▎      | 404/1208 [11:39<23:11,  1.73s/it, loss=0.223, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000683, train/loss_step=0.192, global_step=5838.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  34%|███▎      | 405/1208 [11:40<23:08,  1.73s/it, loss=0.223, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000683, train/loss_step=0.192, global_step=5838.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  34%|███▎      | 405/1208 [11:40<23:08,  1.73s/it, loss=0.238, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00124, train/loss_step=0.286, global_step=5839.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  34%|███▎      | 406/1208 [11:41<23:05,  1.73s/it, loss=0.238, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00124, train/loss_step=0.286, global_step=5839.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  34%|███▎      | 406/1208 [11:41<23:05,  1.73s/it, loss=0.235, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.87e-5, train/loss_step=0.0133, global_step=5839.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  34%|███▎      | 407/1208 [11:42<23:02,  1.73s/it, loss=0.235, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.87e-5, train/loss_step=0.0133, global_step=5839.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  34%|███▎      | 407/1208 [11:42<23:02,  1.73s/it, loss=0.235, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.00076, train/loss_step=0.203, global_step=5839.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  34%|███▍      | 408/1208 [11:45<23:02,  1.73s/it, loss=0.235, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.00076, train/loss_step=0.203, global_step=5839.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  34%|███▍      | 408/1208 [11:45<23:02,  1.73s/it, loss=0.241, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.0009, train/loss_step=0.215, global_step=5839.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  34%|███▍      | 409/1208 [11:46<22:59,  1.73s/it, loss=0.241, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.0009, train/loss_step=0.215, global_step=5839.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  34%|███▍      | 409/1208 [11:46<22:59,  1.73s/it, loss=0.234, v_num=0, train/loss_simple_step=0.00489, train/loss_vlb_step=2.64e-5, train/loss_step=0.00489, global_step=5840.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  34%|███▍      | 410/1208 [11:47<22:56,  1.72s/it, loss=0.234, v_num=0, train/loss_simple_step=0.00489, train/loss_vlb_step=2.64e-5, train/loss_step=0.00489, global_step=5840.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  34%|███▍      | 410/1208 [11:47<22:56,  1.72s/it, loss=0.265, v_num=0, train/loss_simple_step=0.606, train/loss_vlb_step=0.0227, train/loss_step=0.606, global_step=5840.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]     Epoch 19:  34%|███▍      | 411/1208 [11:48<22:53,  1.72s/it, loss=0.265, v_num=0, train/loss_simple_step=0.606, train/loss_vlb_step=0.0227, train/loss_step=0.606, global_step=5840.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  34%|███▍      | 411/1208 [11:48<22:53,  1.72s/it, loss=0.274, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000841, train/loss_step=0.214, global_step=5840.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  34%|███▍      | 412/1208 [11:51<22:53,  1.73s/it, loss=0.274, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000841, train/loss_step=0.214, global_step=5840.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  34%|███▍      | 412/1208 [11:51<22:53,  1.73s/it, loss=0.266, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.48e-5, train/loss_step=0.0201, global_step=5840.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  34%|███▍      | 413/1208 [11:52<22:50,  1.72s/it, loss=0.266, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.48e-5, train/loss_step=0.0201, global_step=5840.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  34%|███▍      | 413/1208 [11:52<22:50,  1.72s/it, loss=0.278, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00215, train/loss_step=0.332, global_step=5841.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  34%|███▍      | 414/1208 [11:53<22:47,  1.72s/it, loss=0.278, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00215, train/loss_step=0.332, global_step=5841.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  34%|███▍      | 414/1208 [11:53<22:47,  1.72s/it, loss=0.274, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=2.45e-5, train/loss_step=0.00471, global_step=5841.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  34%|███▍      | 415/1208 [11:54<22:44,  1.72s/it, loss=0.274, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=2.45e-5, train/loss_step=0.00471, global_step=5841.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  34%|███▍      | 415/1208 [11:54<22:44,  1.72s/it, loss=0.283, v_num=0, train/loss_simple_step=0.535, train/loss_vlb_step=0.00725, train/loss_step=0.535, global_step=5841.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  34%|███▍      | 416/1208 [11:56<22:44,  1.72s/it, loss=0.283, v_num=0, train/loss_simple_step=0.535, train/loss_vlb_step=0.00725, train/loss_step=0.535, global_step=5841.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  34%|███▍      | 416/1208 [11:56<22:44,  1.72s/it, loss=0.283, v_num=0, train/loss_simple_step=0.438, train/loss_vlb_step=0.00419, train/loss_step=0.438, global_step=5841.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  35%|███▍      | 417/1208 [11:57<22:41,  1.72s/it, loss=0.283, v_num=0, train/loss_simple_step=0.438, train/loss_vlb_step=0.00419, train/loss_step=0.438, global_step=5841.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  35%|███▍      | 417/1208 [11:57<22:41,  1.72s/it, loss=0.255, v_num=0, train/loss_simple_step=0.0953, train/loss_vlb_step=0.000313, train/loss_step=0.0953, global_step=5842.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  35%|███▍      | 418/1208 [11:58<22:38,  1.72s/it, loss=0.255, v_num=0, train/loss_simple_step=0.0953, train/loss_vlb_step=0.000313, train/loss_step=0.0953, global_step=5842.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  35%|███▍      | 418/1208 [11:58<22:38,  1.72s/it, loss=0.236, v_num=0, train/loss_simple_step=0.0782, train/loss_vlb_step=0.000267, train/loss_step=0.0782, global_step=5842.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  35%|███▍      | 419/1208 [11:59<22:35,  1.72s/it, loss=0.236, v_num=0, train/loss_simple_step=0.0782, train/loss_vlb_step=0.000267, train/loss_step=0.0782, global_step=5842.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  35%|███▍      | 419/1208 [11:59<22:35,  1.72s/it, loss=0.235, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.62e-5, train/loss_step=0.0123, global_step=5842.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  35%|███▍      | 420/1208 [12:02<22:36,  1.72s/it, loss=0.235, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.62e-5, train/loss_step=0.0123, global_step=5842.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  35%|███▍      | 420/1208 [12:02<22:36,  1.72s/it, loss=0.22, v_num=0, train/loss_simple_step=0.0619, train/loss_vlb_step=0.000216, train/loss_step=0.0619, global_step=5842.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  35%|███▍      | 421/1208 [12:03<22:33,  1.72s/it, loss=0.22, v_num=0, train/loss_simple_step=0.0619, train/loss_vlb_step=0.000216, train/loss_step=0.0619, global_step=5842.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  35%|███▍      | 421/1208 [12:03<22:33,  1.72s/it, loss=0.216, v_num=0, train/loss_simple_step=0.00792, train/loss_vlb_step=3.92e-5, train/loss_step=0.00792, global_step=5843.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  35%|███▍      | 422/1208 [12:04<22:30,  1.72s/it, loss=0.216, v_num=0, train/loss_simple_step=0.00792, train/loss_vlb_step=3.92e-5, train/loss_step=0.00792, global_step=5843.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  35%|███▍      | 422/1208 [12:04<22:30,  1.72s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0674, train/loss_vlb_step=0.000232, train/loss_step=0.0674, global_step=5843.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  35%|███▌      | 423/1208 [12:05<22:27,  1.72s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0674, train/loss_vlb_step=0.000232, train/loss_step=0.0674, global_step=5843.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  35%|███▌      | 423/1208 [12:05<22:27,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000842, train/loss_step=0.226, global_step=5843.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  35%|███▌      | 424/1208 [12:08<22:27,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000842, train/loss_step=0.226, global_step=5843.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  35%|███▌      | 424/1208 [12:08<22:27,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.000101, train/loss_step=0.0248, global_step=5843.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  35%|███▌      | 425/1208 [12:09<22:24,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.000101, train/loss_step=0.0248, global_step=5843.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  35%|███▌      | 425/1208 [12:09<22:24,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00946, train/loss_vlb_step=4.41e-5, train/loss_step=0.00946, global_step=5844.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  35%|███▌      | 426/1208 [12:10<22:21,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00946, train/loss_vlb_step=4.41e-5, train/loss_step=0.00946, global_step=5844.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  35%|███▌      | 426/1208 [12:10<22:21,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=2.12e-5, train/loss_step=0.00395, global_step=5844.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  35%|███▌      | 427/1208 [12:11<22:18,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=2.12e-5, train/loss_step=0.00395, global_step=5844.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  35%|███▌      | 427/1208 [12:11<22:18,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.000132, train/loss_step=0.0347, global_step=5844.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  35%|███▌      | 428/1208 [12:14<22:18,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.000132, train/loss_step=0.0347, global_step=5844.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  35%|███▌      | 428/1208 [12:14<22:18,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.084, train/loss_vlb_step=0.000287, train/loss_step=0.084, global_step=5844.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  36%|███▌      | 429/1208 [12:15<22:15,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.084, train/loss_vlb_step=0.000287, train/loss_step=0.084, global_step=5844.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  36%|███▌      | 429/1208 [12:15<22:15,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00704, train/loss_vlb_step=3.43e-5, train/loss_step=0.00704, global_step=5845.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  36%|███▌      | 430/1208 [12:16<22:12,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00704, train/loss_vlb_step=3.43e-5, train/loss_step=0.00704, global_step=5845.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  36%|███▌      | 430/1208 [12:16<22:12,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.000296, train/loss_step=0.0894, global_step=5845.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  36%|███▌      | 431/1208 [12:17<22:09,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.000296, train/loss_step=0.0894, global_step=5845.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  36%|███▌      | 431/1208 [12:17<22:09,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000155, train/loss_step=0.0396, global_step=5845.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  36%|███▌      | 432/1208 [12:20<22:10,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000155, train/loss_step=0.0396, global_step=5845.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  36%|███▌      | 432/1208 [12:20<22:10,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00191, train/loss_step=0.322, global_step=5845.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  36%|███▌      | 433/1208 [12:21<22:07,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00191, train/loss_step=0.322, global_step=5845.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  36%|███▌      | 433/1208 [12:21<22:07,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.00097, train/loss_step=0.233, global_step=5846.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  36%|███▌      | 434/1208 [12:22<22:04,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.00097, train/loss_step=0.233, global_step=5846.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  36%|███▌      | 434/1208 [12:22<22:04,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0654, train/loss_vlb_step=0.00022, train/loss_step=0.0654, global_step=5846.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  36%|███▌      | 435/1208 [12:23<22:01,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0654, train/loss_vlb_step=0.00022, train/loss_step=0.0654, global_step=5846.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  36%|███▌      | 435/1208 [12:23<22:01,  1.71s/it, loss=0.1, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000338, train/loss_step=0.102, global_step=5846.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  36%|███▌      | 436/1208 [12:26<22:01,  1.71s/it, loss=0.1, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000338, train/loss_step=0.102, global_step=5846.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  36%|███▌      | 436/1208 [12:26<22:01,  1.71s/it, loss=0.0807, v_num=0, train/loss_simple_step=0.0497, train/loss_vlb_step=0.000172, train/loss_step=0.0497, global_step=5846.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  36%|███▌      | 437/1208 [12:27<21:58,  1.71s/it, loss=0.0807, v_num=0, train/loss_simple_step=0.0497, train/loss_vlb_step=0.000172, train/loss_step=0.0497, global_step=5846.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  36%|███▌      | 437/1208 [12:27<21:58,  1.71s/it, loss=0.076, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.17e-5, train/loss_step=0.00202, global_step=5847.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  36%|███▋      | 438/1208 [12:28<21:55,  1.71s/it, loss=0.076, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.17e-5, train/loss_step=0.00202, global_step=5847.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  36%|███▋      | 438/1208 [12:28<21:55,  1.71s/it, loss=0.0832, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000883, train/loss_step=0.221, global_step=5847.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  36%|███▋      | 439/1208 [12:29<21:52,  1.71s/it, loss=0.0832, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000883, train/loss_step=0.221, global_step=5847.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  36%|███▋      | 439/1208 [12:29<21:52,  1.71s/it, loss=0.0874, v_num=0, train/loss_simple_step=0.096, train/loss_vlb_step=0.000317, train/loss_step=0.096, global_step=5847.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  36%|███▋      | 440/1208 [12:32<21:53,  1.71s/it, loss=0.0874, v_num=0, train/loss_simple_step=0.096, train/loss_vlb_step=0.000317, train/loss_step=0.096, global_step=5847.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  36%|███▋      | 440/1208 [12:32<21:53,  1.71s/it, loss=0.093, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000635, train/loss_step=0.175, global_step=5847.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  37%|███▋      | 441/1208 [12:33<21:50,  1.71s/it, loss=0.093, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000635, train/loss_step=0.175, global_step=5847.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  37%|███▋      | 441/1208 [12:33<21:50,  1.71s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.00043, train/loss_step=0.130, global_step=5848.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  37%|███▋      | 442/1208 [12:34<21:47,  1.71s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.00043, train/loss_step=0.130, global_step=5848.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  37%|███▋      | 442/1208 [12:34<21:47,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00332, train/loss_step=0.408, global_step=5848.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  37%|███▋      | 443/1208 [12:35<21:44,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00332, train/loss_step=0.408, global_step=5848.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  37%|███▋      | 443/1208 [12:35<21:44,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0355, train/loss_vlb_step=0.000132, train/loss_step=0.0355, global_step=5848.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  37%|███▋      | 444/1208 [12:38<21:44,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0355, train/loss_vlb_step=0.000132, train/loss_step=0.0355, global_step=5848.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  37%|███▋      | 444/1208 [12:38<21:44,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.797, train/loss_vlb_step=0.201, train/loss_step=0.797, global_step=5848.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]     Epoch 19:  37%|███▋      | 445/1208 [12:39<21:41,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.797, train/loss_vlb_step=0.201, train/loss_step=0.797, global_step=5848.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  37%|███▋      | 445/1208 [12:39<21:41,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000687, train/loss_step=0.200, global_step=5849.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  37%|███▋      | 446/1208 [12:40<21:39,  1.70s/it, loss=0.155, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000687, train/loss_step=0.200, global_step=5849.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  37%|███▋      | 446/1208 [12:40<21:39,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.41e-5, train/loss_step=0.0177, global_step=5849.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  37%|███▋      | 447/1208 [12:41<21:36,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.41e-5, train/loss_step=0.0177, global_step=5849.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  37%|███▋      | 447/1208 [12:41<21:36,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0767, train/loss_vlb_step=0.000254, train/loss_step=0.0767, global_step=5849.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  37%|███▋      | 448/1208 [12:44<21:36,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0767, train/loss_vlb_step=0.000254, train/loss_step=0.0767, global_step=5849.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  37%|███▋      | 448/1208 [12:44<21:36,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0723, train/loss_vlb_step=0.000241, train/loss_step=0.0723, global_step=5849.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  37%|███▋      | 449/1208 [12:45<21:33,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0723, train/loss_vlb_step=0.000241, train/loss_step=0.0723, global_step=5849.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  37%|███▋      | 449/1208 [12:45<21:33,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=9.11e-6, train/loss_step=0.00149, global_step=5850.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  37%|███▋      | 450/1208 [12:46<21:30,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=9.11e-6, train/loss_step=0.00149, global_step=5850.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  37%|███▋      | 450/1208 [12:46<21:30,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000605, train/loss_step=0.178, global_step=5850.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  37%|███▋      | 451/1208 [12:47<21:27,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000605, train/loss_step=0.178, global_step=5850.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  37%|███▋      | 451/1208 [12:47<21:27,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000108, train/loss_step=0.0273, global_step=5850.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  37%|███▋      | 452/1208 [12:50<21:28,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000108, train/loss_step=0.0273, global_step=5850.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  37%|███▋      | 452/1208 [12:50<21:28,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=1.08e-5, train/loss_step=0.00177, global_step=5850.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  38%|███▊      | 453/1208 [12:51<21:25,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=1.08e-5, train/loss_step=0.00177, global_step=5850.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  38%|███▊      | 453/1208 [12:51<21:25,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.81e-5, train/loss_step=0.00312, global_step=5851.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  38%|███▊      | 454/1208 [12:52<21:22,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.81e-5, train/loss_step=0.00312, global_step=5851.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  38%|███▊      | 454/1208 [12:52<21:22,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000377, train/loss_step=0.114, global_step=5851.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  38%|███▊      | 455/1208 [12:53<21:19,  1.70s/it, loss=0.135, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000377, train/loss_step=0.114, global_step=5851.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  38%|███▊      | 455/1208 [12:53<21:19,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.29e-5, train/loss_step=0.0228, global_step=5851.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  38%|███▊      | 456/1208 [12:56<21:19,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.29e-5, train/loss_step=0.0228, global_step=5851.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  38%|███▊      | 456/1208 [12:56<21:19,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000748, train/loss_step=0.196, global_step=5851.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  38%|███▊      | 457/1208 [12:57<21:16,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000748, train/loss_step=0.196, global_step=5851.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  38%|███▊      | 457/1208 [12:57<21:16,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000637, train/loss_step=0.184, global_step=5852.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  38%|███▊      | 458/1208 [12:58<21:14,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000637, train/loss_step=0.184, global_step=5852.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  38%|███▊      | 458/1208 [12:58<21:14,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000369, train/loss_step=0.111, global_step=5852.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  38%|███▊      | 459/1208 [12:59<21:11,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000369, train/loss_step=0.111, global_step=5852.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  38%|███▊      | 459/1208 [12:59<21:11,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.00054, train/loss_step=0.160, global_step=5852.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  38%|███▊      | 460/1208 [13:01<21:11,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.00054, train/loss_step=0.160, global_step=5852.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  38%|███▊      | 460/1208 [13:01<21:11,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0565, train/loss_vlb_step=0.000203, train/loss_step=0.0565, global_step=5852.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  38%|███▊      | 461/1208 [13:03<21:08,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0565, train/loss_vlb_step=0.000203, train/loss_step=0.0565, global_step=5852.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  38%|███▊      | 461/1208 [13:03<21:08,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0658, train/loss_vlb_step=0.000223, train/loss_step=0.0658, global_step=5853.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  38%|███▊      | 462/1208 [13:04<21:05,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0658, train/loss_vlb_step=0.000223, train/loss_step=0.0658, global_step=5853.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  38%|███▊      | 462/1208 [13:04<21:05,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000621, train/loss_step=0.170, global_step=5853.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  38%|███▊      | 463/1208 [13:05<21:03,  1.70s/it, loss=0.125, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000621, train/loss_step=0.170, global_step=5853.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  38%|███▊      | 463/1208 [13:05<21:03,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0097, train/loss_vlb_step=4.47e-5, train/loss_step=0.0097, global_step=5853.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  38%|███▊      | 464/1208 [13:07<21:03,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0097, train/loss_vlb_step=4.47e-5, train/loss_step=0.0097, global_step=5853.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  38%|███▊      | 464/1208 [13:07<21:03,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00217, train/loss_step=0.392, global_step=5853.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  38%|███▊      | 465/1208 [13:08<21:00,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00217, train/loss_step=0.392, global_step=5853.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  38%|███▊      | 465/1208 [13:08<21:00,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.711, train/loss_vlb_step=0.0286, train/loss_step=0.711, global_step=5854.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  39%|███▊      | 466/1208 [13:09<20:57,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.711, train/loss_vlb_step=0.0286, train/loss_step=0.711, global_step=5854.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  39%|███▊      | 466/1208 [13:09<20:57,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.00085, train/loss_step=0.227, global_step=5854.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  39%|███▊      | 467/1208 [13:10<20:55,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.00085, train/loss_step=0.227, global_step=5854.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  39%|███▊      | 467/1208 [13:10<20:55,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000931, train/loss_step=0.232, global_step=5854.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  39%|███▊      | 468/1208 [13:13<20:55,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000931, train/loss_step=0.232, global_step=5854.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  39%|███▊      | 468/1208 [13:13<20:55,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000134, train/loss_step=0.0365, global_step=5854.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  39%|███▉      | 469/1208 [13:14<20:52,  1.69s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000134, train/loss_step=0.0365, global_step=5854.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  39%|███▉      | 469/1208 [13:14<20:52,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.25e-5, train/loss_step=0.0196, global_step=5855.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  39%|███▉      | 470/1208 [13:15<20:49,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.25e-5, train/loss_step=0.0196, global_step=5855.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  39%|███▉      | 470/1208 [13:15<20:49,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00705, train/loss_vlb_step=3.47e-5, train/loss_step=0.00705, global_step=5855.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  39%|███▉      | 471/1208 [13:16<20:46,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00705, train/loss_vlb_step=3.47e-5, train/loss_step=0.00705, global_step=5855.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  39%|███▉      | 471/1208 [13:16<20:46,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0667, train/loss_vlb_step=0.000224, train/loss_step=0.0667, global_step=5855.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  39%|███▉      | 472/1208 [13:19<20:47,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0667, train/loss_vlb_step=0.000224, train/loss_step=0.0667, global_step=5855.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  39%|███▉      | 472/1208 [13:19<20:47,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.14e-5, train/loss_step=0.0171, global_step=5855.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  39%|███▉      | 473/1208 [13:20<20:44,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.14e-5, train/loss_step=0.0171, global_step=5855.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  39%|███▉      | 473/1208 [13:20<20:44,  1.69s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.98e-5, train/loss_step=0.0134, global_step=5856.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  39%|███▉      | 474/1208 [13:21<20:41,  1.69s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.98e-5, train/loss_step=0.0134, global_step=5856.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  39%|███▉      | 474/1208 [13:21<20:41,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=8.98e-5, train/loss_step=0.0236, global_step=5856.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  39%|███▉      | 475/1208 [13:22<20:38,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=8.98e-5, train/loss_step=0.0236, global_step=5856.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  39%|███▉      | 475/1208 [13:22<20:38,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000479, train/loss_step=0.141, global_step=5856.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  39%|███▉      | 476/1208 [13:25<20:38,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000479, train/loss_step=0.141, global_step=5856.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  39%|███▉      | 476/1208 [13:25<20:38,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=1.38e-5, train/loss_step=0.00232, global_step=5856.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  39%|███▉      | 477/1208 [13:26<20:36,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=1.38e-5, train/loss_step=0.00232, global_step=5856.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  39%|███▉      | 477/1208 [13:26<20:36,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000143, train/loss_step=0.0396, global_step=5857.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  40%|███▉      | 478/1208 [13:27<20:33,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000143, train/loss_step=0.0396, global_step=5857.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  40%|███▉      | 478/1208 [13:27<20:33,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00104, train/loss_step=0.248, global_step=5857.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  40%|███▉      | 479/1208 [13:28<20:30,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00104, train/loss_step=0.248, global_step=5857.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  40%|███▉      | 479/1208 [13:28<20:30,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000885, train/loss_step=0.214, global_step=5857.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  40%|███▉      | 480/1208 [13:31<20:30,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000885, train/loss_step=0.214, global_step=5857.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  40%|███▉      | 480/1208 [13:31<20:30,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000441, train/loss_step=0.133, global_step=5857.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  40%|███▉      | 481/1208 [13:32<20:28,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000441, train/loss_step=0.133, global_step=5857.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  40%|███▉      | 481/1208 [13:32<20:28,  1.69s/it, loss=0.154, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00198, train/loss_step=0.369, global_step=5858.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  40%|███▉      | 482/1208 [13:33<20:25,  1.69s/it, loss=0.154, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00198, train/loss_step=0.369, global_step=5858.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  40%|███▉      | 482/1208 [13:33<20:25,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000141, train/loss_step=0.0392, global_step=5858.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  40%|███▉      | 483/1208 [13:34<20:22,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000141, train/loss_step=0.0392, global_step=5858.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  40%|███▉      | 483/1208 [13:34<20:22,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=1.34e-5, train/loss_step=0.00242, global_step=5858.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  40%|████      | 484/1208 [13:37<20:22,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=1.34e-5, train/loss_step=0.00242, global_step=5858.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  40%|████      | 484/1208 [13:37<20:22,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.45e-5, train/loss_step=0.00248, global_step=5858.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  40%|████      | 485/1208 [13:38<20:20,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.45e-5, train/loss_step=0.00248, global_step=5858.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  40%|████      | 485/1208 [13:38<20:20,  1.69s/it, loss=0.0943, v_num=0, train/loss_simple_step=0.0532, train/loss_vlb_step=0.000186, train/loss_step=0.0532, global_step=5859.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  40%|████      | 486/1208 [13:39<20:17,  1.69s/it, loss=0.0943, v_num=0, train/loss_simple_step=0.0532, train/loss_vlb_step=0.000186, train/loss_step=0.0532, global_step=5859.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  40%|████      | 486/1208 [13:39<20:17,  1.69s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000103, train/loss_step=0.0266, global_step=5859.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  40%|████      | 487/1208 [13:40<20:14,  1.68s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000103, train/loss_step=0.0266, global_step=5859.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  40%|████      | 487/1208 [13:40<20:14,  1.68s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00357, train/loss_step=0.454, global_step=5859.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  40%|████      | 488/1208 [13:43<20:14,  1.69s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00357, train/loss_step=0.454, global_step=5859.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  40%|████      | 488/1208 [13:43<20:14,  1.69s/it, loss=0.105, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000949, train/loss_step=0.238, global_step=5859.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  40%|████      | 489/1208 [13:44<20:12,  1.69s/it, loss=0.105, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000949, train/loss_step=0.238, global_step=5859.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  40%|████      | 489/1208 [13:44<20:12,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000487, train/loss_step=0.143, global_step=5860.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  41%|████      | 490/1208 [13:45<20:09,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000487, train/loss_step=0.143, global_step=5860.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  41%|████      | 490/1208 [13:45<20:09,  1.68s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.56e-5, train/loss_step=0.0028, global_step=5860.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  41%|████      | 491/1208 [13:46<20:06,  1.68s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.56e-5, train/loss_step=0.0028, global_step=5860.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  41%|████      | 491/1208 [13:46<20:06,  1.68s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=1.37e-5, train/loss_step=0.00243, global_step=5860.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  41%|████      | 492/1208 [13:49<20:06,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=1.37e-5, train/loss_step=0.00243, global_step=5860.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  41%|████      | 492/1208 [13:49<20:06,  1.69s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000135, train/loss_step=0.0365, global_step=5860.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  41%|████      | 493/1208 [13:50<20:04,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000135, train/loss_step=0.0365, global_step=5860.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  41%|████      | 493/1208 [13:50<20:04,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.57e-5, train/loss_step=0.00277, global_step=5861.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  41%|████      | 494/1208 [13:51<20:01,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.57e-5, train/loss_step=0.00277, global_step=5861.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  41%|████      | 494/1208 [13:51<20:01,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.73e-5, train/loss_step=0.0245, global_step=5861.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  41%|████      | 495/1208 [13:52<19:58,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.73e-5, train/loss_step=0.0245, global_step=5861.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  41%|████      | 495/1208 [13:52<19:58,  1.68s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=9.6e-5, train/loss_step=0.0253, global_step=5861.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  41%|████      | 496/1208 [13:55<19:59,  1.68s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=9.6e-5, train/loss_step=0.0253, global_step=5861.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  41%|████      | 496/1208 [13:55<19:59,  1.68s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000185, train/loss_step=0.0514, global_step=5861.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  41%|████      | 497/1208 [13:56<19:56,  1.68s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000185, train/loss_step=0.0514, global_step=5861.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  41%|████      | 497/1208 [13:56<19:56,  1.68s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=2.48e-5, train/loss_step=0.00481, global_step=5862.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  41%|████      | 498/1208 [13:57<19:53,  1.68s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=2.48e-5, train/loss_step=0.00481, global_step=5862.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  41%|████      | 498/1208 [13:57<19:53,  1.68s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.45e-5, train/loss_step=0.0171, global_step=5862.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  41%|████▏     | 499/1208 [13:58<19:51,  1.68s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.45e-5, train/loss_step=0.0171, global_step=5862.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  41%|████▏     | 499/1208 [13:58<19:51,  1.68s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.094, train/loss_vlb_step=0.000309, train/loss_step=0.094, global_step=5862.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  41%|████▏     | 500/1208 [14:01<19:51,  1.68s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.094, train/loss_vlb_step=0.000309, train/loss_step=0.094, global_step=5862.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  41%|████▏     | 500/1208 [14:01<19:51,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.871, train/loss_vlb_step=0.147, train/loss_step=0.871, global_step=5862.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  41%|████▏     | 501/1208 [14:02<19:48,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.871, train/loss_vlb_step=0.147, train/loss_step=0.871, global_step=5862.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  41%|████▏     | 501/1208 [14:02<19:48,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000798, train/loss_step=0.211, global_step=5863.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  42%|████▏     | 502/1208 [14:03<19:45,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000798, train/loss_step=0.211, global_step=5863.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  42%|████▏     | 502/1208 [14:03<19:45,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000777, train/loss_step=0.207, global_step=5863.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  42%|████▏     | 503/1208 [14:04<19:43,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000777, train/loss_step=0.207, global_step=5863.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  42%|████▏     | 503/1208 [14:04<19:43,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000467, train/loss_step=0.140, global_step=5863.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  42%|████▏     | 504/1208 [14:07<19:43,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000467, train/loss_step=0.140, global_step=5863.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  42%|████▏     | 504/1208 [14:07<19:43,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0675, train/loss_vlb_step=0.000228, train/loss_step=0.0675, global_step=5863.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  42%|████▏     | 505/1208 [14:08<19:40,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0675, train/loss_vlb_step=0.000228, train/loss_step=0.0675, global_step=5863.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  42%|████▏     | 505/1208 [14:08<19:40,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.58e-5, train/loss_step=0.0188, global_step=5864.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  42%|████▏     | 506/1208 [14:09<19:38,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.58e-5, train/loss_step=0.0188, global_step=5864.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  42%|████▏     | 506/1208 [14:09<19:38,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.00055, train/loss_step=0.163, global_step=5864.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  42%|████▏     | 507/1208 [14:10<19:35,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.00055, train/loss_step=0.163, global_step=5864.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  42%|████▏     | 507/1208 [14:10<19:35,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.00064, train/loss_step=0.186, global_step=5864.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  42%|████▏     | 508/1208 [14:13<19:35,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.00064, train/loss_step=0.186, global_step=5864.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  42%|████▏     | 508/1208 [14:13<19:35,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.631, train/loss_vlb_step=0.0098, train/loss_step=0.631, global_step=5864.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  42%|████▏     | 509/1208 [14:14<19:32,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.631, train/loss_vlb_step=0.0098, train/loss_step=0.631, global_step=5864.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  42%|████▏     | 509/1208 [14:14<19:32,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.00036, train/loss_step=0.109, global_step=5865.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  42%|████▏     | 510/1208 [14:15<19:30,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.00036, train/loss_step=0.109, global_step=5865.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  42%|████▏     | 510/1208 [14:15<19:30,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00899, train/loss_vlb_step=4.33e-5, train/loss_step=0.00899, global_step=5865.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  42%|████▏     | 511/1208 [14:16<19:27,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00899, train/loss_vlb_step=4.33e-5, train/loss_step=0.00899, global_step=5865.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  42%|████▏     | 511/1208 [14:16<19:27,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00721, train/loss_vlb_step=3.53e-5, train/loss_step=0.00721, global_step=5865.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  42%|████▏     | 512/1208 [14:18<19:27,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00721, train/loss_vlb_step=3.53e-5, train/loss_step=0.00721, global_step=5865.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  42%|████▏     | 512/1208 [14:18<19:27,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000409, train/loss_step=0.122, global_step=5865.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  42%|████▏     | 513/1208 [14:19<19:25,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000409, train/loss_step=0.122, global_step=5865.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  42%|████▏     | 513/1208 [14:19<19:25,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00369, train/loss_vlb_step=1.99e-5, train/loss_step=0.00369, global_step=5866.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  43%|████▎     | 514/1208 [14:20<19:22,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00369, train/loss_vlb_step=1.99e-5, train/loss_step=0.00369, global_step=5866.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  43%|████▎     | 514/1208 [14:20<19:22,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0935, train/loss_vlb_step=0.000308, train/loss_step=0.0935, global_step=5866.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  43%|████▎     | 515/1208 [14:21<19:19,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0935, train/loss_vlb_step=0.000308, train/loss_step=0.0935, global_step=5866.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  43%|████▎     | 515/1208 [14:21<19:19,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0408, train/loss_vlb_step=0.000148, train/loss_step=0.0408, global_step=5866.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  43%|████▎     | 516/1208 [14:24<19:19,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0408, train/loss_vlb_step=0.000148, train/loss_step=0.0408, global_step=5866.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  43%|████▎     | 516/1208 [14:24<19:19,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00157, train/loss_step=0.297, global_step=5866.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  43%|████▎     | 517/1208 [14:25<19:17,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00157, train/loss_step=0.297, global_step=5866.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  43%|████▎     | 517/1208 [14:25<19:17,  1.67s/it, loss=0.176, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000988, train/loss_step=0.228, global_step=5867.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  43%|████▎     | 518/1208 [14:26<19:14,  1.67s/it, loss=0.176, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000988, train/loss_step=0.228, global_step=5867.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  43%|████▎     | 518/1208 [14:26<19:14,  1.67s/it, loss=0.182, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000479, train/loss_step=0.143, global_step=5867.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  43%|████▎     | 519/1208 [14:27<19:12,  1.67s/it, loss=0.182, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000479, train/loss_step=0.143, global_step=5867.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  43%|████▎     | 519/1208 [14:27<19:12,  1.67s/it, loss=0.182, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000334, train/loss_step=0.102, global_step=5867.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  43%|████▎     | 520/1208 [14:30<19:12,  1.67s/it, loss=0.182, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000334, train/loss_step=0.102, global_step=5867.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  43%|████▎     | 520/1208 [14:30<19:12,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00113, train/loss_step=0.243, global_step=5867.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  43%|████▎     | 521/1208 [14:31<19:09,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00113, train/loss_step=0.243, global_step=5867.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  43%|████▎     | 521/1208 [14:31<19:09,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000759, train/loss_step=0.201, global_step=5868.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  43%|████▎     | 522/1208 [14:32<19:06,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000759, train/loss_step=0.201, global_step=5868.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  43%|████▎     | 522/1208 [14:32<19:06,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0522, train/loss_vlb_step=0.000187, train/loss_step=0.0522, global_step=5868.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  43%|████▎     | 523/1208 [14:33<19:04,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0522, train/loss_vlb_step=0.000187, train/loss_step=0.0522, global_step=5868.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  43%|████▎     | 523/1208 [14:33<19:04,  1.67s/it, loss=0.148, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00103, train/loss_step=0.251, global_step=5868.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  43%|████▎     | 524/1208 [14:36<19:04,  1.67s/it, loss=0.148, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00103, train/loss_step=0.251, global_step=5868.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  43%|████▎     | 524/1208 [14:36<19:04,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000457, train/loss_step=0.138, global_step=5868.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  43%|████▎     | 525/1208 [14:37<19:01,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000457, train/loss_step=0.138, global_step=5868.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  43%|████▎     | 525/1208 [14:37<19:01,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.32e-5, train/loss_step=0.00423, global_step=5869.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  44%|████▎     | 526/1208 [14:38<18:59,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.32e-5, train/loss_step=0.00423, global_step=5869.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  44%|████▎     | 526/1208 [14:38<18:59,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.426, train/loss_vlb_step=0.00603, train/loss_step=0.426, global_step=5869.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  44%|████▎     | 527/1208 [14:39<18:56,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.426, train/loss_vlb_step=0.00603, train/loss_step=0.426, global_step=5869.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  44%|████▎     | 527/1208 [14:39<18:56,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00661, train/loss_vlb_step=3.27e-5, train/loss_step=0.00661, global_step=5869.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  44%|████▎     | 528/1208 [14:42<18:56,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00661, train/loss_vlb_step=3.27e-5, train/loss_step=0.00661, global_step=5869.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  44%|████▎     | 528/1208 [14:42<18:56,  1.67s/it, loss=0.139, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00143, train/loss_step=0.302, global_step=5869.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  44%|████▍     | 529/1208 [14:43<18:54,  1.67s/it, loss=0.139, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00143, train/loss_step=0.302, global_step=5869.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  44%|████▍     | 529/1208 [14:43<18:54,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.98e-5, train/loss_step=0.0104, global_step=5870.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  44%|████▍     | 530/1208 [14:44<18:51,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.98e-5, train/loss_step=0.0104, global_step=5870.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  44%|████▍     | 530/1208 [14:44<18:51,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.34e-5, train/loss_step=0.0173, global_step=5870.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  44%|████▍     | 531/1208 [14:45<18:49,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.34e-5, train/loss_step=0.0173, global_step=5870.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  44%|████▍     | 531/1208 [14:45<18:49,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0877, train/loss_vlb_step=0.000293, train/loss_step=0.0877, global_step=5870.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  44%|████▍     | 532/1208 [14:48<18:49,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0877, train/loss_vlb_step=0.000293, train/loss_step=0.0877, global_step=5870.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  44%|████▍     | 532/1208 [14:48<18:49,  1.67s/it, loss=0.15, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00205, train/loss_step=0.349, global_step=5870.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  44%|████▍     | 533/1208 [14:49<18:46,  1.67s/it, loss=0.15, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00205, train/loss_step=0.349, global_step=5870.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  44%|████▍     | 533/1208 [14:49<18:46,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00267, train/loss_step=0.409, global_step=5871.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  44%|████▍     | 534/1208 [14:50<18:44,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00267, train/loss_step=0.409, global_step=5871.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  44%|████▍     | 534/1208 [14:50<18:44,  1.67s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000135, train/loss_step=0.0344, global_step=5871.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  44%|████▍     | 535/1208 [14:51<18:41,  1.67s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000135, train/loss_step=0.0344, global_step=5871.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  44%|████▍     | 535/1208 [14:51<18:41,  1.67s/it, loss=0.178, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00114, train/loss_step=0.250, global_step=5871.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  44%|████▍     | 536/1208 [14:54<18:41,  1.67s/it, loss=0.178, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00114, train/loss_step=0.250, global_step=5871.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  44%|████▍     | 536/1208 [14:54<18:41,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=2.3e-5, train/loss_step=0.00448, global_step=5871.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  44%|████▍     | 537/1208 [14:55<18:38,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=2.3e-5, train/loss_step=0.00448, global_step=5871.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  44%|████▍     | 537/1208 [14:55<18:38,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000643, train/loss_step=0.188, global_step=5872.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  45%|████▍     | 538/1208 [14:56<18:36,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000643, train/loss_step=0.188, global_step=5872.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  45%|████▍     | 538/1208 [14:56<18:36,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000108, train/loss_step=0.0268, global_step=5872.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  45%|████▍     | 539/1208 [14:57<18:33,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000108, train/loss_step=0.0268, global_step=5872.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  45%|████▍     | 539/1208 [14:57<18:33,  1.67s/it, loss=0.188, v_num=0, train/loss_simple_step=0.755, train/loss_vlb_step=0.0959, train/loss_step=0.755, global_step=5872.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  45%|████▍     | 540/1208 [15:00<18:34,  1.67s/it, loss=0.188, v_num=0, train/loss_simple_step=0.755, train/loss_vlb_step=0.0959, train/loss_step=0.755, global_step=5872.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  45%|████▍     | 540/1208 [15:00<18:34,  1.67s/it, loss=0.186, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000784, train/loss_step=0.212, global_step=5872.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  45%|████▍     | 541/1208 [15:01<18:31,  1.67s/it, loss=0.186, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000784, train/loss_step=0.212, global_step=5872.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  45%|████▍     | 541/1208 [15:01<18:31,  1.67s/it, loss=0.184, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000579, train/loss_step=0.164, global_step=5873.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  45%|████▍     | 542/1208 [15:02<18:29,  1.67s/it, loss=0.184, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000579, train/loss_step=0.164, global_step=5873.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  45%|████▍     | 542/1208 [15:02<18:29,  1.67s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0838, train/loss_vlb_step=0.000279, train/loss_step=0.0838, global_step=5873.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  45%|████▍     | 543/1208 [15:03<18:26,  1.66s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0838, train/loss_vlb_step=0.000279, train/loss_step=0.0838, global_step=5873.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  45%|████▍     | 543/1208 [15:03<18:26,  1.66s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0799, train/loss_vlb_step=0.000269, train/loss_step=0.0799, global_step=5873.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  45%|████▌     | 544/1208 [15:07<18:27,  1.67s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0799, train/loss_vlb_step=0.000269, train/loss_step=0.0799, global_step=5873.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  45%|████▌     | 544/1208 [15:07<18:27,  1.67s/it, loss=0.208, v_num=0, train/loss_simple_step=0.744, train/loss_vlb_step=0.0261, train/loss_step=0.744, global_step=5873.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  45%|████▌     | 545/1208 [15:08<18:24,  1.67s/it, loss=0.208, v_num=0, train/loss_simple_step=0.744, train/loss_vlb_step=0.0261, train/loss_step=0.744, global_step=5873.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  45%|████▌     | 545/1208 [15:08<18:24,  1.67s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0523, train/loss_vlb_step=0.000182, train/loss_step=0.0523, global_step=5874.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  45%|████▌     | 546/1208 [15:09<18:22,  1.67s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0523, train/loss_vlb_step=0.000182, train/loss_step=0.0523, global_step=5874.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  45%|████▌     | 546/1208 [15:09<18:22,  1.67s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.89e-5, train/loss_step=0.0135, global_step=5874.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  45%|████▌     | 547/1208 [15:10<18:19,  1.66s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.89e-5, train/loss_step=0.0135, global_step=5874.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  45%|████▌     | 547/1208 [15:10<18:19,  1.66s/it, loss=0.226, v_num=0, train/loss_simple_step=0.738, train/loss_vlb_step=0.054, train/loss_step=0.738, global_step=5874.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  45%|████▌     | 548/1208 [15:13<18:20,  1.67s/it, loss=0.226, v_num=0, train/loss_simple_step=0.738, train/loss_vlb_step=0.054, train/loss_step=0.738, global_step=5874.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  45%|████▌     | 548/1208 [15:13<18:20,  1.67s/it, loss=0.213, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000169, train/loss_step=0.0457, global_step=5874.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  45%|████▌     | 549/1208 [15:14<18:17,  1.67s/it, loss=0.213, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000169, train/loss_step=0.0457, global_step=5874.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  45%|████▌     | 549/1208 [15:14<18:17,  1.67s/it, loss=0.223, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000746, train/loss_step=0.209, global_step=5875.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  46%|████▌     | 550/1208 [15:15<18:15,  1.66s/it, loss=0.223, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000746, train/loss_step=0.209, global_step=5875.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  46%|████▌     | 550/1208 [15:15<18:15,  1.66s/it, loss=0.226, v_num=0, train/loss_simple_step=0.0786, train/loss_vlb_step=0.000258, train/loss_step=0.0786, global_step=5875.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  46%|████▌     | 551/1208 [15:16<18:12,  1.66s/it, loss=0.226, v_num=0, train/loss_simple_step=0.0786, train/loss_vlb_step=0.000258, train/loss_step=0.0786, global_step=5875.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  46%|████▌     | 551/1208 [15:16<18:12,  1.66s/it, loss=0.222, v_num=0, train/loss_simple_step=0.00879, train/loss_vlb_step=4.22e-5, train/loss_step=0.00879, global_step=5875.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  46%|████▌     | 552/1208 [15:19<18:13,  1.67s/it, loss=0.222, v_num=0, train/loss_simple_step=0.00879, train/loss_vlb_step=4.22e-5, train/loss_step=0.00879, global_step=5875.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  46%|████▌     | 552/1208 [15:19<18:13,  1.67s/it, loss=0.211, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=5875.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  46%|████▌     | 553/1208 [15:20<18:10,  1.67s/it, loss=0.211, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=5875.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  46%|████▌     | 553/1208 [15:20<18:10,  1.67s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.29e-5, train/loss_step=0.0022, global_step=5876.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  46%|████▌     | 554/1208 [15:21<18:08,  1.66s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.29e-5, train/loss_step=0.0022, global_step=5876.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  46%|████▌     | 554/1208 [15:21<18:08,  1.66s/it, loss=0.196, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000441, train/loss_step=0.133, global_step=5876.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  46%|████▌     | 555/1208 [15:22<18:05,  1.66s/it, loss=0.196, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000441, train/loss_step=0.133, global_step=5876.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  46%|████▌     | 555/1208 [15:22<18:05,  1.66s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000112, train/loss_step=0.0279, global_step=5876.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  46%|████▌     | 556/1208 [15:26<18:06,  1.67s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000112, train/loss_step=0.0279, global_step=5876.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  46%|████▌     | 556/1208 [15:26<18:06,  1.67s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0535, train/loss_vlb_step=0.000188, train/loss_step=0.0535, global_step=5876.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  46%|████▌     | 557/1208 [15:27<18:03,  1.66s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0535, train/loss_vlb_step=0.000188, train/loss_step=0.0535, global_step=5876.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  46%|████▌     | 557/1208 [15:27<18:03,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0646, train/loss_vlb_step=0.000214, train/loss_step=0.0646, global_step=5877.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  46%|████▌     | 558/1208 [15:28<18:01,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0646, train/loss_vlb_step=0.000214, train/loss_step=0.0646, global_step=5877.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  46%|████▌     | 558/1208 [15:28<18:01,  1.66s/it, loss=0.187, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000496, train/loss_step=0.143, global_step=5877.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  46%|████▋     | 559/1208 [15:29<17:58,  1.66s/it, loss=0.187, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000496, train/loss_step=0.143, global_step=5877.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  46%|████▋     | 559/1208 [15:29<17:58,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00483, train/loss_vlb_step=2.26e-5, train/loss_step=0.00483, global_step=5877.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  46%|████▋     | 560/1208 [15:32<17:59,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00483, train/loss_vlb_step=2.26e-5, train/loss_step=0.00483, global_step=5877.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  46%|████▋     | 560/1208 [15:32<17:59,  1.67s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00883, train/loss_vlb_step=4.31e-5, train/loss_step=0.00883, global_step=5877.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  46%|████▋     | 561/1208 [15:33<17:56,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00883, train/loss_vlb_step=4.31e-5, train/loss_step=0.00883, global_step=5877.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  46%|████▋     | 561/1208 [15:33<17:56,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00468, train/loss_vlb_step=2.39e-5, train/loss_step=0.00468, global_step=5878.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  47%|████▋     | 562/1208 [15:34<17:54,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00468, train/loss_vlb_step=2.39e-5, train/loss_step=0.00468, global_step=5878.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  47%|████▋     | 562/1208 [15:34<17:54,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00129, train/loss_step=0.275, global_step=5878.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  47%|████▋     | 563/1208 [15:35<17:51,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00129, train/loss_step=0.275, global_step=5878.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  47%|████▋     | 563/1208 [15:35<17:51,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000978, train/loss_step=0.245, global_step=5878.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  47%|████▋     | 564/1208 [15:38<17:52,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000978, train/loss_step=0.245, global_step=5878.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  47%|████▋     | 564/1208 [15:38<17:52,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.677, train/loss_vlb_step=0.0223, train/loss_step=0.677, global_step=5878.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  47%|████▋     | 565/1208 [15:39<17:49,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.677, train/loss_vlb_step=0.0223, train/loss_step=0.677, global_step=5878.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  47%|████▋     | 565/1208 [15:39<17:49,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.000166, train/loss_step=0.0459, global_step=5879.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  47%|████▋     | 566/1208 [15:41<17:47,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.000166, train/loss_step=0.0459, global_step=5879.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  47%|████▋     | 566/1208 [15:41<17:47,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=2.12e-5, train/loss_step=0.00405, global_step=5879.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  47%|████▋     | 567/1208 [15:42<17:44,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=2.12e-5, train/loss_step=0.00405, global_step=5879.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  47%|████▋     | 567/1208 [15:42<17:44,  1.66s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.56e-5, train/loss_step=0.0148, global_step=5879.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  47%|████▋     | 568/1208 [15:45<17:45,  1.66s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.56e-5, train/loss_step=0.0148, global_step=5879.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  47%|████▋     | 568/1208 [15:45<17:45,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00192, train/loss_step=0.330, global_step=5879.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  47%|████▋     | 569/1208 [15:46<17:42,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00192, train/loss_step=0.330, global_step=5879.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  47%|████▋     | 569/1208 [15:46<17:42,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.446, train/loss_vlb_step=0.00335, train/loss_step=0.446, global_step=5880.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  47%|████▋     | 570/1208 [15:47<17:40,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.446, train/loss_vlb_step=0.00335, train/loss_step=0.446, global_step=5880.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  47%|████▋     | 570/1208 [15:47<17:40,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.63e-5, train/loss_step=0.00277, global_step=5880.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  47%|████▋     | 571/1208 [15:48<17:37,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.63e-5, train/loss_step=0.00277, global_step=5880.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  47%|████▋     | 571/1208 [15:48<17:37,  1.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000111, train/loss_step=0.0286, global_step=5880.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  47%|████▋     | 572/1208 [15:51<17:38,  1.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000111, train/loss_step=0.0286, global_step=5880.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  47%|████▋     | 572/1208 [15:51<17:38,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0558, train/loss_vlb_step=0.000197, train/loss_step=0.0558, global_step=5880.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  47%|████▋     | 573/1208 [15:52<17:35,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0558, train/loss_vlb_step=0.000197, train/loss_step=0.0558, global_step=5880.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  47%|████▋     | 573/1208 [15:52<17:35,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00188, train/loss_step=0.348, global_step=5881.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  48%|████▊     | 574/1208 [15:53<17:33,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00188, train/loss_step=0.348, global_step=5881.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  48%|████▊     | 574/1208 [15:53<17:33,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.422, train/loss_vlb_step=0.00245, train/loss_step=0.422, global_step=5881.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  48%|████▊     | 575/1208 [15:54<17:31,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.422, train/loss_vlb_step=0.00245, train/loss_step=0.422, global_step=5881.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  48%|████▊     | 575/1208 [15:54<17:31,  1.66s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=3.53e-5, train/loss_step=0.00742, global_step=5881.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  48%|████▊     | 576/1208 [15:57<17:31,  1.66s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=3.53e-5, train/loss_step=0.00742, global_step=5881.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  48%|████▊     | 576/1208 [15:57<17:31,  1.66s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=1.37e-5, train/loss_step=0.00242, global_step=5881.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  48%|████▊     | 577/1208 [15:58<17:28,  1.66s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=1.37e-5, train/loss_step=0.00242, global_step=5881.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  48%|████▊     | 577/1208 [15:58<17:28,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0955, train/loss_vlb_step=0.000314, train/loss_step=0.0955, global_step=5882.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  48%|████▊     | 578/1208 [16:00<17:26,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0955, train/loss_vlb_step=0.000314, train/loss_step=0.0955, global_step=5882.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  48%|████▊     | 578/1208 [16:00<17:26,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.66e-5, train/loss_step=0.00281, global_step=5882.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  48%|████▊     | 579/1208 [16:01<17:24,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.66e-5, train/loss_step=0.00281, global_step=5882.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  48%|████▊     | 579/1208 [16:01<17:24,  1.66s/it, loss=0.157, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000423, train/loss_step=0.127, global_step=5882.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  48%|████▊     | 580/1208 [16:04<17:24,  1.66s/it, loss=0.157, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000423, train/loss_step=0.127, global_step=5882.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  48%|████▊     | 580/1208 [16:04<17:24,  1.66s/it, loss=0.166, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000658, train/loss_step=0.189, global_step=5882.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  48%|████▊     | 581/1208 [16:05<17:21,  1.66s/it, loss=0.166, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000658, train/loss_step=0.189, global_step=5882.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  48%|████▊     | 581/1208 [16:05<17:21,  1.66s/it, loss=0.172, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=5883.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  48%|████▊     | 582/1208 [16:06<17:19,  1.66s/it, loss=0.172, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=5883.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  48%|████▊     | 582/1208 [16:06<17:19,  1.66s/it, loss=0.184, v_num=0, train/loss_simple_step=0.533, train/loss_vlb_step=0.00503, train/loss_step=0.533, global_step=5883.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  48%|████▊     | 583/1208 [16:07<17:17,  1.66s/it, loss=0.184, v_num=0, train/loss_simple_step=0.533, train/loss_vlb_step=0.00503, train/loss_step=0.533, global_step=5883.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  48%|████▊     | 583/1208 [16:07<17:17,  1.66s/it, loss=0.183, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000927, train/loss_step=0.222, global_step=5883.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  48%|████▊     | 584/1208 [16:10<17:17,  1.66s/it, loss=0.183, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000927, train/loss_step=0.222, global_step=5883.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  48%|████▊     | 584/1208 [16:10<17:17,  1.66s/it, loss=0.162, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00106, train/loss_step=0.257, global_step=5883.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  48%|████▊     | 585/1208 [16:11<17:14,  1.66s/it, loss=0.162, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00106, train/loss_step=0.257, global_step=5883.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  48%|████▊     | 585/1208 [16:11<17:14,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.51e-5, train/loss_step=0.00265, global_step=5884.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  49%|████▊     | 586/1208 [16:12<17:12,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.51e-5, train/loss_step=0.00265, global_step=5884.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  49%|████▊     | 586/1208 [16:12<17:12,  1.66s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.000153, train/loss_step=0.0401, global_step=5884.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  49%|████▊     | 587/1208 [16:13<17:10,  1.66s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.000153, train/loss_step=0.0401, global_step=5884.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  49%|████▊     | 587/1208 [16:13<17:10,  1.66s/it, loss=0.173, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.001, train/loss_step=0.246, global_step=5884.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]     Epoch 19:  49%|████▊     | 588/1208 [16:16<17:10,  1.66s/it, loss=0.173, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.001, train/loss_step=0.246, global_step=5884.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  49%|████▊     | 588/1208 [16:16<17:10,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.3e-5, train/loss_step=0.0142, global_step=5884.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  49%|████▉     | 589/1208 [16:18<17:07,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.3e-5, train/loss_step=0.0142, global_step=5884.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  49%|████▉     | 589/1208 [16:18<17:07,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=5885.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  49%|████▉     | 590/1208 [16:19<17:05,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=5885.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  49%|████▉     | 590/1208 [16:19<17:05,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0695, train/loss_vlb_step=0.000241, train/loss_step=0.0695, global_step=5885.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  49%|████▉     | 591/1208 [16:20<17:03,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0695, train/loss_vlb_step=0.000241, train/loss_step=0.0695, global_step=5885.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  49%|████▉     | 591/1208 [16:20<17:03,  1.66s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00367, train/loss_vlb_step=1.97e-5, train/loss_step=0.00367, global_step=5885.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  49%|████▉     | 592/1208 [16:23<17:03,  1.66s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00367, train/loss_vlb_step=1.97e-5, train/loss_step=0.00367, global_step=5885.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  49%|████▉     | 592/1208 [16:23<17:03,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.73e-5, train/loss_step=0.00299, global_step=5885.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  49%|████▉     | 593/1208 [16:24<17:00,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.73e-5, train/loss_step=0.00299, global_step=5885.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  49%|████▉     | 593/1208 [16:24<17:00,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=3.71e-5, train/loss_step=0.0072, global_step=5886.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  49%|████▉     | 594/1208 [16:25<16:58,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=3.71e-5, train/loss_step=0.0072, global_step=5886.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  49%|████▉     | 594/1208 [16:25<16:58,  1.66s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00605, train/loss_vlb_step=3.17e-5, train/loss_step=0.00605, global_step=5886.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  49%|████▉     | 595/1208 [16:26<16:56,  1.66s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00605, train/loss_vlb_step=3.17e-5, train/loss_step=0.00605, global_step=5886.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  49%|████▉     | 595/1208 [16:26<16:56,  1.66s/it, loss=0.111, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000558, train/loss_step=0.169, global_step=5886.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  49%|████▉     | 596/1208 [16:29<16:56,  1.66s/it, loss=0.111, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000558, train/loss_step=0.169, global_step=5886.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  49%|████▉     | 596/1208 [16:29<16:56,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000432, train/loss_step=0.130, global_step=5886.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  49%|████▉     | 597/1208 [16:30<16:53,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000432, train/loss_step=0.130, global_step=5886.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  49%|████▉     | 597/1208 [16:30<16:53,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00133, train/loss_step=0.325, global_step=5887.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  50%|████▉     | 598/1208 [16:31<16:51,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00133, train/loss_step=0.325, global_step=5887.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  50%|████▉     | 598/1208 [16:31<16:51,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.26e-5, train/loss_step=0.0163, global_step=5887.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  50%|████▉     | 599/1208 [16:32<16:49,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.26e-5, train/loss_step=0.0163, global_step=5887.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  50%|████▉     | 599/1208 [16:32<16:49,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000168, train/loss_step=0.0463, global_step=5887.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  50%|████▉     | 600/1208 [16:36<16:49,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000168, train/loss_step=0.0463, global_step=5887.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  50%|████▉     | 600/1208 [16:36<16:49,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.53e-5, train/loss_step=0.0207, global_step=5887.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] 
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.76it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.77it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.80it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.75it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.76it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.75it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.76it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.76it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.76it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.76it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.83it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.78it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.78it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.80it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.77it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 19:  50%|████▉     | 601/1208 [17:06<17:16,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.53e-5, train/loss_step=0.0207, global_step=5887.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  50%|████▉     | 601/1208 [17:06<17:16,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000834, train/loss_step=0.236, global_step=5888.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  50%|████▉     | 602/1208 [17:07<17:14,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000834, train/loss_step=0.236, global_step=5888.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  50%|████▉     | 602/1208 [17:07<17:14,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000434, train/loss_step=0.129, global_step=5888.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  50%|████▉     | 603/1208 [17:08<17:12,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000434, train/loss_step=0.129, global_step=5888.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  50%|████▉     | 603/1208 [17:08<17:12,  1.71s/it, loss=0.0938, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000141, train/loss_step=0.0374, global_step=5888.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  50%|█████     | 604/1208 [17:11<17:11,  1.71s/it, loss=0.0938, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000141, train/loss_step=0.0374, global_step=5888.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  50%|█████     | 604/1208 [17:11<17:11,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.523, train/loss_vlb_step=0.00723, train/loss_step=0.523, global_step=5888.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  50%|█████     | 605/1208 [17:12<17:09,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.523, train/loss_vlb_step=0.00723, train/loss_step=0.523, global_step=5888.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  50%|█████     | 605/1208 [17:12<17:09,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.410, train/loss_vlb_step=0.00311, train/loss_step=0.410, global_step=5889.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  50%|█████     | 606/1208 [17:13<17:07,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.410, train/loss_vlb_step=0.00311, train/loss_step=0.410, global_step=5889.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  50%|█████     | 606/1208 [17:13<17:07,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00404, train/loss_vlb_step=2.14e-5, train/loss_step=0.00404, global_step=5889.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  50%|█████     | 607/1208 [17:14<17:04,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00404, train/loss_vlb_step=2.14e-5, train/loss_step=0.00404, global_step=5889.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  50%|█████     | 607/1208 [17:14<17:04,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.00418, train/loss_step=0.460, global_step=5889.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  50%|█████     | 608/1208 [17:18<17:04,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.00418, train/loss_step=0.460, global_step=5889.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  50%|█████     | 608/1208 [17:18<17:04,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=1.63e-5, train/loss_step=0.00298, global_step=5889.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  50%|█████     | 609/1208 [17:19<17:02,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=1.63e-5, train/loss_step=0.00298, global_step=5889.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  50%|█████     | 609/1208 [17:19<17:02,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0753, train/loss_vlb_step=0.000252, train/loss_step=0.0753, global_step=5890.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  50%|█████     | 610/1208 [17:20<16:59,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0753, train/loss_vlb_step=0.000252, train/loss_step=0.0753, global_step=5890.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  50%|█████     | 610/1208 [17:20<16:59,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.34e-5, train/loss_step=0.0151, global_step=5890.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  51%|█████     | 611/1208 [17:21<16:57,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.34e-5, train/loss_step=0.0151, global_step=5890.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  51%|█████     | 611/1208 [17:21<16:57,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.00567, train/loss_step=0.512, global_step=5890.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  51%|█████     | 612/1208 [17:24<16:57,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.00567, train/loss_step=0.512, global_step=5890.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  51%|█████     | 612/1208 [17:24<16:57,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.00104, train/loss_step=0.227, global_step=5890.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  51%|█████     | 613/1208 [17:25<16:54,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.00104, train/loss_step=0.227, global_step=5890.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  51%|█████     | 613/1208 [17:25<16:54,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.000144, train/loss_step=0.041, global_step=5891.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  51%|█████     | 614/1208 [17:26<16:52,  1.70s/it, loss=0.169, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.000144, train/loss_step=0.041, global_step=5891.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  51%|█████     | 614/1208 [17:26<16:52,  1.70s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00817, train/loss_vlb_step=3.97e-5, train/loss_step=0.00817, global_step=5891.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  51%|█████     | 615/1208 [17:27<16:50,  1.70s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00817, train/loss_vlb_step=3.97e-5, train/loss_step=0.00817, global_step=5891.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  51%|█████     | 615/1208 [17:27<16:50,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0919, train/loss_vlb_step=0.000304, train/loss_step=0.0919, global_step=5891.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  51%|█████     | 616/1208 [17:30<16:49,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0919, train/loss_vlb_step=0.000304, train/loss_step=0.0919, global_step=5891.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  51%|█████     | 616/1208 [17:30<16:49,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00374, train/loss_vlb_step=2.02e-5, train/loss_step=0.00374, global_step=5891.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  51%|█████     | 617/1208 [17:31<16:47,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00374, train/loss_vlb_step=2.02e-5, train/loss_step=0.00374, global_step=5891.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  51%|█████     | 617/1208 [17:31<16:47,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000124, train/loss_step=0.0333, global_step=5892.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  51%|█████     | 618/1208 [17:32<16:45,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000124, train/loss_step=0.0333, global_step=5892.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  51%|█████     | 618/1208 [17:32<16:45,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00643, train/loss_vlb_step=3.34e-5, train/loss_step=0.00643, global_step=5892.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  51%|█████     | 619/1208 [17:33<16:42,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00643, train/loss_vlb_step=3.34e-5, train/loss_step=0.00643, global_step=5892.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  51%|█████     | 619/1208 [17:33<16:42,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0599, train/loss_vlb_step=0.000202, train/loss_step=0.0599, global_step=5892.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  51%|█████▏    | 620/1208 [17:37<16:42,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0599, train/loss_vlb_step=0.000202, train/loss_step=0.0599, global_step=5892.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  51%|█████▏    | 620/1208 [17:37<16:42,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00311, train/loss_step=0.371, global_step=5892.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  51%|█████▏    | 621/1208 [17:38<16:40,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00311, train/loss_step=0.371, global_step=5892.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  51%|█████▏    | 621/1208 [17:38<16:40,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.1e-5, train/loss_step=0.0138, global_step=5893.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  51%|█████▏    | 622/1208 [17:39<16:37,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.1e-5, train/loss_step=0.0138, global_step=5893.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  51%|█████▏    | 622/1208 [17:39<16:37,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.15e-5, train/loss_step=0.00194, global_step=5893.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  52%|█████▏    | 623/1208 [17:40<16:35,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.15e-5, train/loss_step=0.00194, global_step=5893.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  52%|█████▏    | 623/1208 [17:40<16:35,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000118, train/loss_step=0.0302, global_step=5893.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  52%|█████▏    | 624/1208 [17:43<16:35,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000118, train/loss_step=0.0302, global_step=5893.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  52%|█████▏    | 624/1208 [17:43<16:35,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.58e-5, train/loss_step=0.0156, global_step=5893.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  52%|█████▏    | 625/1208 [17:44<16:33,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.58e-5, train/loss_step=0.0156, global_step=5893.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  52%|█████▏    | 625/1208 [17:44<16:33,  1.70s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0696, train/loss_vlb_step=0.000233, train/loss_step=0.0696, global_step=5894.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  52%|█████▏    | 626/1208 [17:45<16:30,  1.70s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0696, train/loss_vlb_step=0.000233, train/loss_step=0.0696, global_step=5894.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  52%|█████▏    | 626/1208 [17:45<16:30,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.590, train/loss_vlb_step=0.0165, train/loss_step=0.590, global_step=5894.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  52%|█████▏    | 627/1208 [17:46<16:28,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.590, train/loss_vlb_step=0.0165, train/loss_step=0.590, global_step=5894.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  52%|█████▏    | 627/1208 [17:46<16:28,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.679, train/loss_vlb_step=0.0173, train/loss_step=0.679, global_step=5894.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  52%|█████▏    | 628/1208 [17:49<16:28,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.679, train/loss_vlb_step=0.0173, train/loss_step=0.679, global_step=5894.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  52%|█████▏    | 628/1208 [17:49<16:28,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000817, train/loss_step=0.216, global_step=5894.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  52%|█████▏    | 629/1208 [17:50<16:25,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000817, train/loss_step=0.216, global_step=5894.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  52%|█████▏    | 629/1208 [17:50<16:25,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.00051, train/loss_step=0.152, global_step=5895.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  52%|█████▏    | 630/1208 [17:51<16:23,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.00051, train/loss_step=0.152, global_step=5895.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  52%|█████▏    | 630/1208 [17:51<16:23,  1.70s/it, loss=0.191, v_num=0, train/loss_simple_step=0.699, train/loss_vlb_step=0.0362, train/loss_step=0.699, global_step=5895.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  52%|█████▏    | 631/1208 [17:52<16:21,  1.70s/it, loss=0.191, v_num=0, train/loss_simple_step=0.699, train/loss_vlb_step=0.0362, train/loss_step=0.699, global_step=5895.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  52%|█████▏    | 631/1208 [17:52<16:21,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000524, train/loss_step=0.154, global_step=5895.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  52%|█████▏    | 632/1208 [17:56<16:20,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000524, train/loss_step=0.154, global_step=5895.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  52%|█████▏    | 632/1208 [17:56<16:20,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=5895.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  52%|█████▏    | 633/1208 [17:57<16:18,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=5895.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  52%|█████▏    | 633/1208 [17:57<16:18,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000913, train/loss_step=0.239, global_step=5896.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  52%|█████▏    | 634/1208 [17:58<16:16,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000913, train/loss_step=0.239, global_step=5896.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  52%|█████▏    | 634/1208 [17:58<16:16,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0952, train/loss_vlb_step=0.000316, train/loss_step=0.0952, global_step=5896.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  53%|█████▎    | 635/1208 [17:59<16:13,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0952, train/loss_vlb_step=0.000316, train/loss_step=0.0952, global_step=5896.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  53%|█████▎    | 635/1208 [17:59<16:13,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=1.99e-5, train/loss_step=0.00361, global_step=5896.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  53%|█████▎    | 636/1208 [18:02<16:13,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=1.99e-5, train/loss_step=0.00361, global_step=5896.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  53%|█████▎    | 636/1208 [18:02<16:13,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000126, train/loss_step=0.0363, global_step=5896.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  53%|█████▎    | 637/1208 [18:03<16:11,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000126, train/loss_step=0.0363, global_step=5896.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  53%|█████▎    | 637/1208 [18:03<16:11,  1.70s/it, loss=0.193, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00214, train/loss_step=0.323, global_step=5897.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  53%|█████▎    | 638/1208 [18:04<16:08,  1.70s/it, loss=0.193, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00214, train/loss_step=0.323, global_step=5897.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  53%|█████▎    | 638/1208 [18:04<16:08,  1.70s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000117, train/loss_step=0.0319, global_step=5897.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  53%|█████▎    | 639/1208 [18:05<16:06,  1.70s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000117, train/loss_step=0.0319, global_step=5897.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  53%|█████▎    | 639/1208 [18:05<16:06,  1.70s/it, loss=0.2, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000636, train/loss_step=0.182, global_step=5897.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  53%|█████▎    | 640/1208 [18:08<16:06,  1.70s/it, loss=0.2, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000636, train/loss_step=0.182, global_step=5897.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  53%|█████▎    | 640/1208 [18:08<16:06,  1.70s/it, loss=0.19, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000558, train/loss_step=0.162, global_step=5897.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  53%|█████▎    | 641/1208 [18:09<16:04,  1.70s/it, loss=0.19, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000558, train/loss_step=0.162, global_step=5897.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  53%|█████▎    | 641/1208 [18:09<16:04,  1.70s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00675, train/loss_vlb_step=3.31e-5, train/loss_step=0.00675, global_step=5898.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  53%|█████▎    | 642/1208 [18:10<16:01,  1.70s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00675, train/loss_vlb_step=3.31e-5, train/loss_step=0.00675, global_step=5898.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  53%|█████▎    | 642/1208 [18:10<16:01,  1.70s/it, loss=0.19, v_num=0, train/loss_simple_step=0.00837, train/loss_vlb_step=3.96e-5, train/loss_step=0.00837, global_step=5898.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  53%|█████▎    | 643/1208 [18:11<15:59,  1.70s/it, loss=0.19, v_num=0, train/loss_simple_step=0.00837, train/loss_vlb_step=3.96e-5, train/loss_step=0.00837, global_step=5898.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  53%|█████▎    | 643/1208 [18:11<15:59,  1.70s/it, loss=0.19, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.000155, train/loss_step=0.043, global_step=5898.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  53%|█████▎    | 644/1208 [18:15<15:59,  1.70s/it, loss=0.19, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.000155, train/loss_step=0.043, global_step=5898.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  53%|█████▎    | 644/1208 [18:15<15:59,  1.70s/it, loss=0.196, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000437, train/loss_step=0.131, global_step=5898.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  53%|█████▎    | 645/1208 [18:16<15:56,  1.70s/it, loss=0.196, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000437, train/loss_step=0.131, global_step=5898.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  53%|█████▎    | 645/1208 [18:16<15:56,  1.70s/it, loss=0.207, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.0016, train/loss_step=0.282, global_step=5899.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  53%|█████▎    | 646/1208 [18:17<15:54,  1.70s/it, loss=0.207, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.0016, train/loss_step=0.282, global_step=5899.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  53%|█████▎    | 646/1208 [18:17<15:54,  1.70s/it, loss=0.195, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00255, train/loss_step=0.359, global_step=5899.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  54%|█████▎    | 647/1208 [18:18<15:52,  1.70s/it, loss=0.195, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00255, train/loss_step=0.359, global_step=5899.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  54%|█████▎    | 647/1208 [18:18<15:52,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0546, train/loss_vlb_step=0.000193, train/loss_step=0.0546, global_step=5899.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  54%|█████▎    | 648/1208 [18:21<15:51,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0546, train/loss_vlb_step=0.000193, train/loss_step=0.0546, global_step=5899.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  54%|█████▎    | 648/1208 [18:21<15:51,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0954, train/loss_vlb_step=0.000314, train/loss_step=0.0954, global_step=5899.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  54%|█████▎    | 649/1208 [18:22<15:49,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0954, train/loss_vlb_step=0.000314, train/loss_step=0.0954, global_step=5899.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  54%|█████▎    | 649/1208 [18:22<15:49,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00295, train/loss_step=0.392, global_step=5900.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  54%|█████▍    | 650/1208 [18:23<15:47,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00295, train/loss_step=0.392, global_step=5900.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  54%|█████▍    | 650/1208 [18:23<15:47,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00162, train/loss_step=0.290, global_step=5900.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  54%|█████▍    | 651/1208 [18:24<15:45,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00162, train/loss_step=0.290, global_step=5900.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  54%|█████▍    | 651/1208 [18:24<15:45,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00385, train/loss_vlb_step=2.06e-5, train/loss_step=0.00385, global_step=5900.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  54%|█████▍    | 652/1208 [18:27<15:44,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00385, train/loss_vlb_step=2.06e-5, train/loss_step=0.00385, global_step=5900.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  54%|█████▍    | 652/1208 [18:27<15:44,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0737, train/loss_vlb_step=0.000255, train/loss_step=0.0737, global_step=5900.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  54%|█████▍    | 653/1208 [18:28<15:42,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0737, train/loss_vlb_step=0.000255, train/loss_step=0.0737, global_step=5900.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  54%|█████▍    | 653/1208 [18:28<15:42,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00458, train/loss_step=0.434, global_step=5901.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  54%|█████▍    | 654/1208 [18:29<15:40,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00458, train/loss_step=0.434, global_step=5901.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  54%|█████▍    | 654/1208 [18:29<15:40,  1.70s/it, loss=0.172, v_num=0, train/loss_simple_step=0.536, train/loss_vlb_step=0.00534, train/loss_step=0.536, global_step=5901.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  54%|█████▍    | 655/1208 [18:30<15:37,  1.70s/it, loss=0.172, v_num=0, train/loss_simple_step=0.536, train/loss_vlb_step=0.00534, train/loss_step=0.536, global_step=5901.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  54%|█████▍    | 655/1208 [18:30<15:37,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.75e-5, train/loss_step=0.0128, global_step=5901.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  54%|█████▍    | 656/1208 [18:33<15:37,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.75e-5, train/loss_step=0.0128, global_step=5901.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  54%|█████▍    | 656/1208 [18:33<15:37,  1.70s/it, loss=0.192, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00344, train/loss_step=0.411, global_step=5901.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  54%|█████▍    | 657/1208 [18:34<15:34,  1.70s/it, loss=0.192, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00344, train/loss_step=0.411, global_step=5901.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  54%|█████▍    | 657/1208 [18:34<15:34,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000564, train/loss_step=0.165, global_step=5902.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  54%|█████▍    | 658/1208 [18:35<15:32,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000564, train/loss_step=0.165, global_step=5902.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  54%|█████▍    | 658/1208 [18:35<15:32,  1.70s/it, loss=0.212, v_num=0, train/loss_simple_step=0.593, train/loss_vlb_step=0.0238, train/loss_step=0.593, global_step=5902.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  55%|█████▍    | 659/1208 [18:36<15:30,  1.69s/it, loss=0.212, v_num=0, train/loss_simple_step=0.593, train/loss_vlb_step=0.0238, train/loss_step=0.593, global_step=5902.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  55%|█████▍    | 659/1208 [18:36<15:30,  1.69s/it, loss=0.22, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00236, train/loss_step=0.354, global_step=5902.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  55%|█████▍    | 660/1208 [18:39<15:29,  1.70s/it, loss=0.22, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00236, train/loss_step=0.354, global_step=5902.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  55%|█████▍    | 660/1208 [18:39<15:29,  1.70s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0979, train/loss_vlb_step=0.000322, train/loss_step=0.0979, global_step=5902.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  55%|█████▍    | 661/1208 [18:40<15:27,  1.70s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0979, train/loss_vlb_step=0.000322, train/loss_step=0.0979, global_step=5902.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  55%|█████▍    | 661/1208 [18:40<15:27,  1.70s/it, loss=0.22, v_num=0, train/loss_simple_step=0.057, train/loss_vlb_step=0.0002, train/loss_step=0.057, global_step=5903.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]     Epoch 19:  55%|█████▍    | 662/1208 [18:41<15:25,  1.69s/it, loss=0.22, v_num=0, train/loss_simple_step=0.057, train/loss_vlb_step=0.0002, train/loss_step=0.057, global_step=5903.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  55%|█████▍    | 662/1208 [18:41<15:25,  1.69s/it, loss=0.219, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=2.41e-5, train/loss_step=0.00464, global_step=5903.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  55%|█████▍    | 663/1208 [18:42<15:22,  1.69s/it, loss=0.219, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=2.41e-5, train/loss_step=0.00464, global_step=5903.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  55%|█████▍    | 663/1208 [18:42<15:22,  1.69s/it, loss=0.218, v_num=0, train/loss_simple_step=0.00987, train/loss_vlb_step=4.65e-5, train/loss_step=0.00987, global_step=5903.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  55%|█████▍    | 664/1208 [18:45<15:22,  1.69s/it, loss=0.218, v_num=0, train/loss_simple_step=0.00987, train/loss_vlb_step=4.65e-5, train/loss_step=0.00987, global_step=5903.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  55%|█████▍    | 664/1208 [18:45<15:22,  1.69s/it, loss=0.222, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000916, train/loss_step=0.224, global_step=5903.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  55%|█████▌    | 665/1208 [18:46<15:19,  1.69s/it, loss=0.222, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000916, train/loss_step=0.224, global_step=5903.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  55%|█████▌    | 665/1208 [18:46<15:19,  1.69s/it, loss=0.235, v_num=0, train/loss_simple_step=0.538, train/loss_vlb_step=0.00857, train/loss_step=0.538, global_step=5904.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  55%|█████▌    | 666/1208 [18:47<15:17,  1.69s/it, loss=0.235, v_num=0, train/loss_simple_step=0.538, train/loss_vlb_step=0.00857, train/loss_step=0.538, global_step=5904.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  55%|█████▌    | 666/1208 [18:47<15:17,  1.69s/it, loss=0.218, v_num=0, train/loss_simple_step=0.00482, train/loss_vlb_step=2.56e-5, train/loss_step=0.00482, global_step=5904.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  55%|█████▌    | 667/1208 [18:48<15:15,  1.69s/it, loss=0.218, v_num=0, train/loss_simple_step=0.00482, train/loss_vlb_step=2.56e-5, train/loss_step=0.00482, global_step=5904.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  55%|█████▌    | 667/1208 [18:48<15:15,  1.69s/it, loss=0.224, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000665, train/loss_step=0.190, global_step=5904.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  55%|█████▌    | 668/1208 [18:51<15:14,  1.69s/it, loss=0.224, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000665, train/loss_step=0.190, global_step=5904.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  55%|█████▌    | 668/1208 [18:51<15:14,  1.69s/it, loss=0.241, v_num=0, train/loss_simple_step=0.426, train/loss_vlb_step=0.00513, train/loss_step=0.426, global_step=5904.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  55%|█████▌    | 669/1208 [18:52<15:12,  1.69s/it, loss=0.241, v_num=0, train/loss_simple_step=0.426, train/loss_vlb_step=0.00513, train/loss_step=0.426, global_step=5904.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  55%|█████▌    | 669/1208 [18:52<15:12,  1.69s/it, loss=0.226, v_num=0, train/loss_simple_step=0.0893, train/loss_vlb_step=0.000295, train/loss_step=0.0893, global_step=5905.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  55%|█████▌    | 670/1208 [18:53<15:10,  1.69s/it, loss=0.226, v_num=0, train/loss_simple_step=0.0893, train/loss_vlb_step=0.000295, train/loss_step=0.0893, global_step=5905.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  55%|█████▌    | 670/1208 [18:53<15:10,  1.69s/it, loss=0.217, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000351, train/loss_step=0.107, global_step=5905.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  56%|█████▌    | 671/1208 [18:54<15:07,  1.69s/it, loss=0.217, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000351, train/loss_step=0.107, global_step=5905.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  56%|█████▌    | 671/1208 [18:54<15:07,  1.69s/it, loss=0.217, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.83e-5, train/loss_step=0.00319, global_step=5905.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  56%|█████▌    | 672/1208 [18:57<15:07,  1.69s/it, loss=0.217, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.83e-5, train/loss_step=0.00319, global_step=5905.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  56%|█████▌    | 672/1208 [18:57<15:07,  1.69s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0767, train/loss_vlb_step=0.000257, train/loss_step=0.0767, global_step=5905.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  56%|█████▌    | 673/1208 [18:58<15:04,  1.69s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0767, train/loss_vlb_step=0.000257, train/loss_step=0.0767, global_step=5905.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  56%|█████▌    | 673/1208 [18:58<15:04,  1.69s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.63e-5, train/loss_step=0.00288, global_step=5906.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  56%|█████▌    | 674/1208 [18:59<15:02,  1.69s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.63e-5, train/loss_step=0.00288, global_step=5906.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  56%|█████▌    | 674/1208 [18:59<15:02,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000897, train/loss_step=0.237, global_step=5906.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  56%|█████▌    | 675/1208 [19:00<15:00,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000897, train/loss_step=0.237, global_step=5906.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  56%|█████▌    | 675/1208 [19:00<15:00,  1.69s/it, loss=0.205, v_num=0, train/loss_simple_step=0.510, train/loss_vlb_step=0.00793, train/loss_step=0.510, global_step=5906.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  56%|█████▌    | 676/1208 [19:03<14:59,  1.69s/it, loss=0.205, v_num=0, train/loss_simple_step=0.510, train/loss_vlb_step=0.00793, train/loss_step=0.510, global_step=5906.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  56%|█████▌    | 676/1208 [19:03<14:59,  1.69s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000134, train/loss_step=0.0363, global_step=5906.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  56%|█████▌    | 677/1208 [19:04<14:57,  1.69s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000134, train/loss_step=0.0363, global_step=5906.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  56%|█████▌    | 677/1208 [19:04<14:57,  1.69s/it, loss=0.193, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00153, train/loss_step=0.298, global_step=5907.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  56%|█████▌    | 678/1208 [19:05<14:55,  1.69s/it, loss=0.193, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00153, train/loss_step=0.298, global_step=5907.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  56%|█████▌    | 678/1208 [19:05<14:55,  1.69s/it, loss=0.194, v_num=0, train/loss_simple_step=0.608, train/loss_vlb_step=0.0119, train/loss_step=0.608, global_step=5907.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  56%|█████▌    | 679/1208 [19:06<14:52,  1.69s/it, loss=0.194, v_num=0, train/loss_simple_step=0.608, train/loss_vlb_step=0.0119, train/loss_step=0.608, global_step=5907.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  56%|█████▌    | 679/1208 [19:06<14:52,  1.69s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.000126, train/loss_step=0.0326, global_step=5907.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  56%|█████▋    | 680/1208 [19:09<14:52,  1.69s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.000126, train/loss_step=0.0326, global_step=5907.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  56%|█████▋    | 680/1208 [19:09<14:52,  1.69s/it, loss=0.198, v_num=0, train/loss_simple_step=0.497, train/loss_vlb_step=0.00659, train/loss_step=0.497, global_step=5907.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  56%|█████▋    | 681/1208 [19:10<14:50,  1.69s/it, loss=0.198, v_num=0, train/loss_simple_step=0.497, train/loss_vlb_step=0.00659, train/loss_step=0.497, global_step=5907.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  56%|█████▋    | 681/1208 [19:10<14:50,  1.69s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00644, train/loss_vlb_step=3.24e-5, train/loss_step=0.00644, global_step=5908.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  56%|█████▋    | 682/1208 [19:11<14:47,  1.69s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00644, train/loss_vlb_step=3.24e-5, train/loss_step=0.00644, global_step=5908.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  56%|█████▋    | 682/1208 [19:11<14:47,  1.69s/it, loss=0.214, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00304, train/loss_step=0.386, global_step=5908.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  57%|█████▋    | 683/1208 [19:12<14:45,  1.69s/it, loss=0.214, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00304, train/loss_step=0.386, global_step=5908.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  57%|█████▋    | 683/1208 [19:12<14:45,  1.69s/it, loss=0.223, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000651, train/loss_step=0.183, global_step=5908.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  57%|█████▋    | 684/1208 [19:15<14:44,  1.69s/it, loss=0.223, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000651, train/loss_step=0.183, global_step=5908.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  57%|█████▋    | 684/1208 [19:15<14:44,  1.69s/it, loss=0.217, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=5908.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  57%|█████▋    | 685/1208 [19:16<14:42,  1.69s/it, loss=0.217, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=5908.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  57%|█████▋    | 685/1208 [19:16<14:42,  1.69s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0622, train/loss_vlb_step=0.00021, train/loss_step=0.0622, global_step=5909.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  57%|█████▋    | 686/1208 [19:17<14:40,  1.69s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0622, train/loss_vlb_step=0.00021, train/loss_step=0.0622, global_step=5909.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  57%|█████▋    | 686/1208 [19:17<14:40,  1.69s/it, loss=0.233, v_num=0, train/loss_simple_step=0.804, train/loss_vlb_step=0.136, train/loss_step=0.804, global_step=5909.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  57%|█████▋    | 687/1208 [19:18<14:38,  1.69s/it, loss=0.233, v_num=0, train/loss_simple_step=0.804, train/loss_vlb_step=0.136, train/loss_step=0.804, global_step=5909.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  57%|█████▋    | 687/1208 [19:18<14:38,  1.69s/it, loss=0.232, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000568, train/loss_step=0.163, global_step=5909.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  57%|█████▋    | 688/1208 [19:20<14:37,  1.69s/it, loss=0.232, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000568, train/loss_step=0.163, global_step=5909.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  57%|█████▋    | 688/1208 [19:20<14:37,  1.69s/it, loss=0.225, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00122, train/loss_step=0.291, global_step=5909.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  57%|█████▋    | 689/1208 [19:21<14:35,  1.69s/it, loss=0.225, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00122, train/loss_step=0.291, global_step=5909.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  57%|█████▋    | 689/1208 [19:21<14:35,  1.69s/it, loss=0.222, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.75e-5, train/loss_step=0.015, global_step=5910.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  57%|█████▋    | 690/1208 [19:22<14:33,  1.69s/it, loss=0.222, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.75e-5, train/loss_step=0.015, global_step=5910.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  57%|█████▋    | 690/1208 [19:22<14:33,  1.69s/it, loss=0.225, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000697, train/loss_step=0.186, global_step=5910.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  57%|█████▋    | 691/1208 [19:23<14:30,  1.68s/it, loss=0.225, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000697, train/loss_step=0.186, global_step=5910.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  57%|█████▋    | 691/1208 [19:23<14:30,  1.68s/it, loss=0.234, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.00061, train/loss_step=0.181, global_step=5910.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  57%|█████▋    | 692/1208 [19:26<14:30,  1.69s/it, loss=0.234, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.00061, train/loss_step=0.181, global_step=5910.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  57%|█████▋    | 692/1208 [19:26<14:30,  1.69s/it, loss=0.243, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00101, train/loss_step=0.243, global_step=5910.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  57%|█████▋    | 693/1208 [19:27<14:27,  1.69s/it, loss=0.243, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00101, train/loss_step=0.243, global_step=5910.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  57%|█████▋    | 693/1208 [19:27<14:27,  1.69s/it, loss=0.243, v_num=0, train/loss_simple_step=0.00936, train/loss_vlb_step=4.4e-5, train/loss_step=0.00936, global_step=5911.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  57%|█████▋    | 694/1208 [19:28<14:25,  1.68s/it, loss=0.243, v_num=0, train/loss_simple_step=0.00936, train/loss_vlb_step=4.4e-5, train/loss_step=0.00936, global_step=5911.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  57%|█████▋    | 694/1208 [19:28<14:25,  1.68s/it, loss=0.249, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00233, train/loss_step=0.362, global_step=5911.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  58%|█████▊    | 695/1208 [19:29<14:23,  1.68s/it, loss=0.249, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00233, train/loss_step=0.362, global_step=5911.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  58%|█████▊    | 695/1208 [19:29<14:23,  1.68s/it, loss=0.257, v_num=0, train/loss_simple_step=0.664, train/loss_vlb_step=0.0313, train/loss_step=0.664, global_step=5911.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  58%|█████▊    | 696/1208 [19:32<14:22,  1.68s/it, loss=0.257, v_num=0, train/loss_simple_step=0.664, train/loss_vlb_step=0.0313, train/loss_step=0.664, global_step=5911.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  58%|█████▊    | 696/1208 [19:32<14:22,  1.68s/it, loss=0.256, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=8.97e-5, train/loss_step=0.0226, global_step=5911.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  58%|█████▊    | 697/1208 [19:33<14:20,  1.68s/it, loss=0.256, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=8.97e-5, train/loss_step=0.0226, global_step=5911.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  58%|█████▊    | 697/1208 [19:33<14:20,  1.68s/it, loss=0.242, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.82e-5, train/loss_step=0.0179, global_step=5912.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  58%|█████▊    | 698/1208 [19:34<14:18,  1.68s/it, loss=0.242, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.82e-5, train/loss_step=0.0179, global_step=5912.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  58%|█████▊    | 698/1208 [19:34<14:18,  1.68s/it, loss=0.235, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.00587, train/loss_step=0.460, global_step=5912.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  58%|█████▊    | 699/1208 [19:35<14:16,  1.68s/it, loss=0.235, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.00587, train/loss_step=0.460, global_step=5912.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  58%|█████▊    | 699/1208 [19:35<14:16,  1.68s/it, loss=0.26, v_num=0, train/loss_simple_step=0.542, train/loss_vlb_step=0.00734, train/loss_step=0.542, global_step=5912.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  58%|█████▊    | 700/1208 [19:38<14:15,  1.68s/it, loss=0.26, v_num=0, train/loss_simple_step=0.542, train/loss_vlb_step=0.00734, train/loss_step=0.542, global_step=5912.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  58%|█████▊    | 700/1208 [19:38<14:15,  1.68s/it, loss=0.24, v_num=0, train/loss_simple_step=0.0932, train/loss_vlb_step=0.000309, train/loss_step=0.0932, global_step=5912.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  58%|█████▊    | 701/1208 [19:39<14:13,  1.68s/it, loss=0.24, v_num=0, train/loss_simple_step=0.0932, train/loss_vlb_step=0.000309, train/loss_step=0.0932, global_step=5912.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  58%|█████▊    | 701/1208 [19:39<14:13,  1.68s/it, loss=0.246, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000422, train/loss_step=0.128, global_step=5913.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  58%|█████▊    | 702/1208 [19:40<14:11,  1.68s/it, loss=0.246, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000422, train/loss_step=0.128, global_step=5913.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  58%|█████▊    | 702/1208 [19:40<14:11,  1.68s/it, loss=0.232, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000364, train/loss_step=0.110, global_step=5913.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  58%|█████▊    | 703/1208 [19:41<14:08,  1.68s/it, loss=0.232, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000364, train/loss_step=0.110, global_step=5913.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  58%|█████▊    | 703/1208 [19:41<14:08,  1.68s/it, loss=0.238, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00136, train/loss_step=0.292, global_step=5913.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  58%|█████▊    | 704/1208 [19:44<14:08,  1.68s/it, loss=0.238, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00136, train/loss_step=0.292, global_step=5913.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  58%|█████▊    | 704/1208 [19:44<14:08,  1.68s/it, loss=0.232, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=2e-5, train/loss_step=0.00368, global_step=5913.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  58%|█████▊    | 705/1208 [19:45<14:05,  1.68s/it, loss=0.232, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=2e-5, train/loss_step=0.00368, global_step=5913.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  58%|█████▊    | 705/1208 [19:45<14:05,  1.68s/it, loss=0.232, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.00019, train/loss_step=0.0555, global_step=5914.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  58%|█████▊    | 706/1208 [19:46<14:03,  1.68s/it, loss=0.232, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.00019, train/loss_step=0.0555, global_step=5914.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  58%|█████▊    | 706/1208 [19:46<14:03,  1.68s/it, loss=0.216, v_num=0, train/loss_simple_step=0.473, train/loss_vlb_step=0.0038, train/loss_step=0.473, global_step=5914.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  59%|█████▊    | 707/1208 [19:47<14:01,  1.68s/it, loss=0.216, v_num=0, train/loss_simple_step=0.473, train/loss_vlb_step=0.0038, train/loss_step=0.473, global_step=5914.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  59%|█████▊    | 707/1208 [19:47<14:01,  1.68s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.52e-5, train/loss_step=0.0176, global_step=5914.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  59%|█████▊    | 708/1208 [19:50<14:00,  1.68s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.52e-5, train/loss_step=0.0176, global_step=5914.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  59%|█████▊    | 708/1208 [19:50<14:00,  1.68s/it, loss=0.216, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00291, train/loss_step=0.436, global_step=5914.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  59%|█████▊    | 709/1208 [19:51<13:58,  1.68s/it, loss=0.216, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00291, train/loss_step=0.436, global_step=5914.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  59%|█████▊    | 709/1208 [19:51<13:58,  1.68s/it, loss=0.216, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=8.4e-5, train/loss_step=0.0217, global_step=5915.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  59%|█████▉    | 710/1208 [19:52<13:56,  1.68s/it, loss=0.216, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=8.4e-5, train/loss_step=0.0217, global_step=5915.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  59%|█████▉    | 710/1208 [19:52<13:56,  1.68s/it, loss=0.216, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000646, train/loss_step=0.186, global_step=5915.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  59%|█████▉    | 711/1208 [19:53<13:54,  1.68s/it, loss=0.216, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000646, train/loss_step=0.186, global_step=5915.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  59%|█████▉    | 711/1208 [19:53<13:54,  1.68s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0872, train/loss_vlb_step=0.000289, train/loss_step=0.0872, global_step=5915.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  59%|█████▉    | 712/1208 [19:56<13:53,  1.68s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0872, train/loss_vlb_step=0.000289, train/loss_step=0.0872, global_step=5915.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  59%|█████▉    | 712/1208 [19:56<13:53,  1.68s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.82e-5, train/loss_step=0.0129, global_step=5915.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  59%|█████▉    | 713/1208 [19:57<13:51,  1.68s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.82e-5, train/loss_step=0.0129, global_step=5915.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  59%|█████▉    | 713/1208 [19:57<13:51,  1.68s/it, loss=0.2, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.86e-5, train/loss_step=0.011, global_step=5916.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  59%|█████▉    | 714/1208 [19:58<13:49,  1.68s/it, loss=0.2, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.86e-5, train/loss_step=0.011, global_step=5916.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  59%|█████▉    | 714/1208 [19:58<13:49,  1.68s/it, loss=0.199, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00187, train/loss_step=0.340, global_step=5916.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  59%|█████▉    | 715/1208 [19:59<13:47,  1.68s/it, loss=0.199, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00187, train/loss_step=0.340, global_step=5916.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  59%|█████▉    | 715/1208 [19:59<13:47,  1.68s/it, loss=0.184, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00287, train/loss_step=0.365, global_step=5916.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  59%|█████▉    | 716/1208 [20:02<13:46,  1.68s/it, loss=0.184, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00287, train/loss_step=0.365, global_step=5916.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  59%|█████▉    | 716/1208 [20:02<13:46,  1.68s/it, loss=0.199, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00157, train/loss_step=0.322, global_step=5916.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  59%|█████▉    | 717/1208 [20:03<13:44,  1.68s/it, loss=0.199, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00157, train/loss_step=0.322, global_step=5916.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  59%|█████▉    | 717/1208 [20:03<13:44,  1.68s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00711, train/loss_vlb_step=3.45e-5, train/loss_step=0.00711, global_step=5917.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  59%|█████▉    | 718/1208 [20:04<13:41,  1.68s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00711, train/loss_vlb_step=3.45e-5, train/loss_step=0.00711, global_step=5917.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  59%|█████▉    | 718/1208 [20:04<13:41,  1.68s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00869, train/loss_vlb_step=4.2e-5, train/loss_step=0.00869, global_step=5917.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  60%|█████▉    | 719/1208 [20:05<13:39,  1.68s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00869, train/loss_vlb_step=4.2e-5, train/loss_step=0.00869, global_step=5917.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  60%|█████▉    | 719/1208 [20:05<13:39,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000674, train/loss_step=0.196, global_step=5917.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  60%|█████▉    | 720/1208 [20:08<13:38,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000674, train/loss_step=0.196, global_step=5917.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  60%|█████▉    | 720/1208 [20:08<13:38,  1.68s/it, loss=0.171, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00319, train/loss_step=0.351, global_step=5917.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  60%|█████▉    | 721/1208 [20:09<13:36,  1.68s/it, loss=0.171, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00319, train/loss_step=0.351, global_step=5917.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  60%|█████▉    | 721/1208 [20:09<13:36,  1.68s/it, loss=0.177, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000879, train/loss_step=0.235, global_step=5918.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  60%|█████▉    | 722/1208 [20:10<13:34,  1.68s/it, loss=0.177, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000879, train/loss_step=0.235, global_step=5918.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  60%|█████▉    | 722/1208 [20:10<13:34,  1.68s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=2.01e-5, train/loss_step=0.00378, global_step=5918.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  60%|█████▉    | 723/1208 [20:11<13:32,  1.68s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=2.01e-5, train/loss_step=0.00378, global_step=5918.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  60%|█████▉    | 723/1208 [20:11<13:32,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000564, train/loss_step=0.164, global_step=5918.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  60%|█████▉    | 724/1208 [20:14<13:31,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000564, train/loss_step=0.164, global_step=5918.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  60%|█████▉    | 724/1208 [20:14<13:31,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.18e-5, train/loss_step=0.00198, global_step=5918.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  60%|██████    | 725/1208 [20:15<13:29,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.18e-5, train/loss_step=0.00198, global_step=5918.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  60%|██████    | 725/1208 [20:15<13:29,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.23e-5, train/loss_step=0.0136, global_step=5919.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  60%|██████    | 726/1208 [20:16<13:27,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.23e-5, train/loss_step=0.0136, global_step=5919.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  60%|██████    | 726/1208 [20:16<13:27,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.498, train/loss_vlb_step=0.00447, train/loss_step=0.498, global_step=5919.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  60%|██████    | 727/1208 [20:17<13:25,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.498, train/loss_vlb_step=0.00447, train/loss_step=0.498, global_step=5919.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  60%|██████    | 727/1208 [20:17<13:25,  1.67s/it, loss=0.18, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00186, train/loss_step=0.332, global_step=5919.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  60%|██████    | 728/1208 [20:20<13:24,  1.68s/it, loss=0.18, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00186, train/loss_step=0.332, global_step=5919.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  60%|██████    | 728/1208 [20:20<13:24,  1.68s/it, loss=0.171, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.000936, train/loss_step=0.263, global_step=5919.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  60%|██████    | 729/1208 [20:21<13:22,  1.67s/it, loss=0.171, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.000936, train/loss_step=0.263, global_step=5919.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  60%|██████    | 729/1208 [20:21<13:22,  1.67s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.46e-5, train/loss_step=0.0237, global_step=5920.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  60%|██████    | 730/1208 [20:22<13:20,  1.67s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.46e-5, train/loss_step=0.0237, global_step=5920.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  60%|██████    | 730/1208 [20:22<13:20,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000158, train/loss_step=0.0437, global_step=5920.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  61%|██████    | 731/1208 [20:23<13:18,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000158, train/loss_step=0.0437, global_step=5920.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  61%|██████    | 731/1208 [20:23<13:18,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.0008, train/loss_step=0.204, global_step=5920.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]     Epoch 19:  61%|██████    | 732/1208 [20:25<13:17,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.0008, train/loss_step=0.204, global_step=5920.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  61%|██████    | 732/1208 [20:25<13:17,  1.67s/it, loss=0.174, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000337, train/loss_step=0.101, global_step=5920.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  61%|██████    | 733/1208 [20:26<13:15,  1.67s/it, loss=0.174, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000337, train/loss_step=0.101, global_step=5920.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  61%|██████    | 733/1208 [20:26<13:15,  1.67s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00613, train/loss_vlb_step=3.14e-5, train/loss_step=0.00613, global_step=5921.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  61%|██████    | 734/1208 [20:27<13:13,  1.67s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00613, train/loss_vlb_step=3.14e-5, train/loss_step=0.00613, global_step=5921.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  61%|██████    | 734/1208 [20:27<13:13,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0868, train/loss_vlb_step=0.000286, train/loss_step=0.0868, global_step=5921.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  61%|██████    | 735/1208 [20:28<13:10,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0868, train/loss_vlb_step=0.000286, train/loss_step=0.0868, global_step=5921.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  61%|██████    | 735/1208 [20:28<13:10,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00105, train/loss_step=0.250, global_step=5921.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  61%|██████    | 736/1208 [20:31<13:10,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00105, train/loss_step=0.250, global_step=5921.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  61%|██████    | 736/1208 [20:31<13:10,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.000146, train/loss_step=0.0401, global_step=5921.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  61%|██████    | 737/1208 [20:32<13:07,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.000146, train/loss_step=0.0401, global_step=5921.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  61%|██████    | 737/1208 [20:32<13:07,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0846, train/loss_vlb_step=0.000279, train/loss_step=0.0846, global_step=5922.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  61%|██████    | 738/1208 [20:33<13:05,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0846, train/loss_vlb_step=0.000279, train/loss_step=0.0846, global_step=5922.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  61%|██████    | 738/1208 [20:33<13:05,  1.67s/it, loss=0.159, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00137, train/loss_step=0.287, global_step=5922.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  61%|██████    | 739/1208 [20:34<13:03,  1.67s/it, loss=0.159, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00137, train/loss_step=0.287, global_step=5922.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  61%|██████    | 739/1208 [20:34<13:03,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.061, train/loss_vlb_step=0.000213, train/loss_step=0.061, global_step=5922.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  61%|██████▏   | 740/1208 [20:37<13:02,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.061, train/loss_vlb_step=0.000213, train/loss_step=0.061, global_step=5922.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  61%|██████▏   | 740/1208 [20:37<13:02,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.78e-5, train/loss_step=0.0185, global_step=5922.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  61%|██████▏   | 741/1208 [20:38<13:00,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.78e-5, train/loss_step=0.0185, global_step=5922.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  61%|██████▏   | 741/1208 [20:38<13:00,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0511, train/loss_vlb_step=0.000184, train/loss_step=0.0511, global_step=5923.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  61%|██████▏   | 742/1208 [20:39<12:58,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0511, train/loss_vlb_step=0.000184, train/loss_step=0.0511, global_step=5923.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  61%|██████▏   | 742/1208 [20:39<12:58,  1.67s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.00013, train/loss_step=0.0328, global_step=5923.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  62%|██████▏   | 743/1208 [20:40<12:56,  1.67s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.00013, train/loss_step=0.0328, global_step=5923.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  62%|██████▏   | 743/1208 [20:40<12:56,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000447, train/loss_step=0.134, global_step=5923.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  62%|██████▏   | 744/1208 [20:43<12:55,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000447, train/loss_step=0.134, global_step=5923.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  62%|██████▏   | 744/1208 [20:43<12:55,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000453, train/loss_step=0.137, global_step=5923.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  62%|██████▏   | 745/1208 [20:44<12:53,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000453, train/loss_step=0.137, global_step=5923.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  62%|██████▏   | 745/1208 [20:44<12:53,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00662, train/loss_step=0.447, global_step=5924.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  62%|██████▏   | 746/1208 [20:45<12:51,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00662, train/loss_step=0.447, global_step=5924.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  62%|██████▏   | 746/1208 [20:45<12:51,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0391, train/loss_vlb_step=0.000139, train/loss_step=0.0391, global_step=5924.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  62%|██████▏   | 747/1208 [20:46<12:49,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0391, train/loss_vlb_step=0.000139, train/loss_step=0.0391, global_step=5924.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  62%|██████▏   | 747/1208 [20:46<12:49,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.091, train/loss_vlb_step=0.0003, train/loss_step=0.091, global_step=5924.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]     Epoch 19:  62%|██████▏   | 748/1208 [20:49<12:48,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.091, train/loss_vlb_step=0.0003, train/loss_step=0.091, global_step=5924.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  62%|██████▏   | 748/1208 [20:49<12:48,  1.67s/it, loss=0.118, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000745, train/loss_step=0.217, global_step=5924.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  62%|██████▏   | 749/1208 [20:50<12:46,  1.67s/it, loss=0.118, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000745, train/loss_step=0.217, global_step=5924.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  62%|██████▏   | 749/1208 [20:50<12:46,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.065, train/loss_vlb_step=0.000225, train/loss_step=0.065, global_step=5925.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  62%|██████▏   | 750/1208 [20:51<12:44,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.065, train/loss_vlb_step=0.000225, train/loss_step=0.065, global_step=5925.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  62%|██████▏   | 750/1208 [20:51<12:44,  1.67s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000109, train/loss_step=0.0282, global_step=5925.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  62%|██████▏   | 751/1208 [20:52<12:42,  1.67s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000109, train/loss_step=0.0282, global_step=5925.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  62%|██████▏   | 751/1208 [20:52<12:42,  1.67s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000156, train/loss_step=0.0416, global_step=5925.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  62%|██████▏   | 752/1208 [20:55<12:41,  1.67s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000156, train/loss_step=0.0416, global_step=5925.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  62%|██████▏   | 752/1208 [20:55<12:41,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000398, train/loss_step=0.119, global_step=5925.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  62%|██████▏   | 753/1208 [20:56<12:39,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000398, train/loss_step=0.119, global_step=5925.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  62%|██████▏   | 753/1208 [20:56<12:39,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0721, train/loss_vlb_step=0.000238, train/loss_step=0.0721, global_step=5926.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  62%|██████▏   | 754/1208 [20:57<12:37,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0721, train/loss_vlb_step=0.000238, train/loss_step=0.0721, global_step=5926.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  62%|██████▏   | 754/1208 [20:57<12:37,  1.67s/it, loss=0.123, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.00105, train/loss_step=0.241, global_step=5926.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  62%|██████▎   | 755/1208 [20:58<12:35,  1.67s/it, loss=0.123, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.00105, train/loss_step=0.241, global_step=5926.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  62%|██████▎   | 755/1208 [20:58<12:35,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000865, train/loss_step=0.220, global_step=5926.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  63%|██████▎   | 756/1208 [21:01<12:34,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000865, train/loss_step=0.220, global_step=5926.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  63%|██████▎   | 756/1208 [21:01<12:34,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.76e-5, train/loss_step=0.0126, global_step=5926.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  63%|██████▎   | 757/1208 [21:02<12:32,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.76e-5, train/loss_step=0.0126, global_step=5926.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  63%|██████▎   | 757/1208 [21:02<12:32,  1.67s/it, loss=0.159, v_num=0, train/loss_simple_step=0.873, train/loss_vlb_step=0.089, train/loss_step=0.873, global_step=5927.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  63%|██████▎   | 758/1208 [21:03<12:30,  1.67s/it, loss=0.159, v_num=0, train/loss_simple_step=0.873, train/loss_vlb_step=0.089, train/loss_step=0.873, global_step=5927.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  63%|██████▎   | 758/1208 [21:03<12:30,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00476, train/loss_vlb_step=2.47e-5, train/loss_step=0.00476, global_step=5927.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  63%|██████▎   | 759/1208 [21:04<12:28,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00476, train/loss_vlb_step=2.47e-5, train/loss_step=0.00476, global_step=5927.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  63%|██████▎   | 759/1208 [21:04<12:28,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.45e-5, train/loss_step=0.0117, global_step=5927.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  63%|██████▎   | 760/1208 [21:07<12:27,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.45e-5, train/loss_step=0.0117, global_step=5927.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  63%|██████▎   | 760/1208 [21:07<12:27,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0941, train/loss_vlb_step=0.000311, train/loss_step=0.0941, global_step=5927.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  63%|██████▎   | 761/1208 [21:08<12:25,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0941, train/loss_vlb_step=0.000311, train/loss_step=0.0941, global_step=5927.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  63%|██████▎   | 761/1208 [21:08<12:25,  1.67s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0829, train/loss_vlb_step=0.000274, train/loss_step=0.0829, global_step=5928.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  63%|██████▎   | 762/1208 [21:09<12:22,  1.67s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0829, train/loss_vlb_step=0.000274, train/loss_step=0.0829, global_step=5928.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  63%|██████▎   | 762/1208 [21:09<12:22,  1.67s/it, loss=0.167, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00312, train/loss_step=0.415, global_step=5928.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  63%|██████▎   | 763/1208 [21:10<12:20,  1.66s/it, loss=0.167, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00312, train/loss_step=0.415, global_step=5928.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  63%|██████▎   | 763/1208 [21:10<12:20,  1.66s/it, loss=0.176, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00128, train/loss_step=0.317, global_step=5928.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  63%|██████▎   | 764/1208 [21:13<12:19,  1.67s/it, loss=0.176, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00128, train/loss_step=0.317, global_step=5928.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  63%|██████▎   | 764/1208 [21:13<12:19,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.77e-5, train/loss_step=0.0125, global_step=5928.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  63%|██████▎   | 765/1208 [21:14<12:17,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.77e-5, train/loss_step=0.0125, global_step=5928.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  63%|██████▎   | 765/1208 [21:14<12:17,  1.67s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0377, train/loss_vlb_step=0.000135, train/loss_step=0.0377, global_step=5929.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  63%|██████▎   | 766/1208 [21:15<12:15,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0377, train/loss_vlb_step=0.000135, train/loss_step=0.0377, global_step=5929.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  63%|██████▎   | 766/1208 [21:15<12:15,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00345, train/loss_step=0.398, global_step=5929.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  63%|██████▎   | 767/1208 [21:16<12:13,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00345, train/loss_step=0.398, global_step=5929.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  63%|██████▎   | 767/1208 [21:16<12:13,  1.66s/it, loss=0.172, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000618, train/loss_step=0.172, global_step=5929.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  64%|██████▎   | 768/1208 [21:19<12:12,  1.67s/it, loss=0.172, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000618, train/loss_step=0.172, global_step=5929.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  64%|██████▎   | 768/1208 [21:19<12:12,  1.67s/it, loss=0.176, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00124, train/loss_step=0.310, global_step=5929.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  64%|██████▎   | 769/1208 [21:20<12:10,  1.66s/it, loss=0.176, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00124, train/loss_step=0.310, global_step=5929.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  64%|██████▎   | 769/1208 [21:20<12:10,  1.66s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=1.12e-5, train/loss_step=0.00184, global_step=5930.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  64%|██████▎   | 770/1208 [21:21<12:08,  1.66s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=1.12e-5, train/loss_step=0.00184, global_step=5930.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  64%|██████▎   | 770/1208 [21:21<12:08,  1.66s/it, loss=0.18, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000557, train/loss_step=0.155, global_step=5930.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  64%|██████▍   | 771/1208 [21:22<12:06,  1.66s/it, loss=0.18, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000557, train/loss_step=0.155, global_step=5930.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  64%|██████▍   | 771/1208 [21:22<12:06,  1.66s/it, loss=0.185, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000526, train/loss_step=0.153, global_step=5930.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  64%|██████▍   | 772/1208 [21:25<12:05,  1.66s/it, loss=0.185, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000526, train/loss_step=0.153, global_step=5930.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  64%|██████▍   | 772/1208 [21:25<12:05,  1.66s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00622, train/loss_vlb_step=3.06e-5, train/loss_step=0.00622, global_step=5930.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  64%|██████▍   | 773/1208 [21:26<12:03,  1.66s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00622, train/loss_vlb_step=3.06e-5, train/loss_step=0.00622, global_step=5930.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  64%|██████▍   | 773/1208 [21:26<12:03,  1.66s/it, loss=0.188, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00105, train/loss_step=0.243, global_step=5931.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  64%|██████▍   | 774/1208 [21:27<12:01,  1.66s/it, loss=0.188, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00105, train/loss_step=0.243, global_step=5931.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  64%|██████▍   | 774/1208 [21:27<12:01,  1.66s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0807, train/loss_vlb_step=0.00027, train/loss_step=0.0807, global_step=5931.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  64%|██████▍   | 775/1208 [21:28<11:59,  1.66s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0807, train/loss_vlb_step=0.00027, train/loss_step=0.0807, global_step=5931.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  64%|██████▍   | 775/1208 [21:28<11:59,  1.66s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00758, train/loss_vlb_step=3.73e-5, train/loss_step=0.00758, global_step=5931.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  64%|██████▍   | 776/1208 [21:30<11:58,  1.66s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00758, train/loss_vlb_step=3.73e-5, train/loss_step=0.00758, global_step=5931.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  64%|██████▍   | 776/1208 [21:30<11:58,  1.66s/it, loss=0.178, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000621, train/loss_step=0.177, global_step=5931.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  64%|██████▍   | 777/1208 [21:31<11:56,  1.66s/it, loss=0.178, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000621, train/loss_step=0.177, global_step=5931.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  64%|██████▍   | 777/1208 [21:31<11:56,  1.66s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0677, train/loss_vlb_step=0.000227, train/loss_step=0.0677, global_step=5932.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  64%|██████▍   | 778/1208 [21:32<11:54,  1.66s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0677, train/loss_vlb_step=0.000227, train/loss_step=0.0677, global_step=5932.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  64%|██████▍   | 778/1208 [21:32<11:54,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.00454, train/loss_step=0.417, global_step=5932.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  64%|██████▍   | 779/1208 [21:33<11:52,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.00454, train/loss_step=0.417, global_step=5932.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  64%|██████▍   | 779/1208 [21:34<11:52,  1.66s/it, loss=0.173, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00133, train/loss_step=0.303, global_step=5932.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  65%|██████▍   | 780/1208 [21:37<11:51,  1.66s/it, loss=0.173, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00133, train/loss_step=0.303, global_step=5932.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  65%|██████▍   | 780/1208 [21:37<11:51,  1.66s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000105, train/loss_step=0.0274, global_step=5932.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  65%|██████▍   | 781/1208 [21:38<11:49,  1.66s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000105, train/loss_step=0.0274, global_step=5932.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  65%|██████▍   | 781/1208 [21:38<11:49,  1.66s/it, loss=0.178, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.000955, train/loss_step=0.249, global_step=5933.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  65%|██████▍   | 782/1208 [21:39<11:47,  1.66s/it, loss=0.178, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.000955, train/loss_step=0.249, global_step=5933.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  65%|██████▍   | 782/1208 [21:39<11:47,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000399, train/loss_step=0.121, global_step=5933.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  65%|██████▍   | 783/1208 [21:40<11:45,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000399, train/loss_step=0.121, global_step=5933.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  65%|██████▍   | 783/1208 [21:40<11:45,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000533, train/loss_step=0.158, global_step=5933.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  65%|██████▍   | 784/1208 [21:43<11:44,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000533, train/loss_step=0.158, global_step=5933.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  65%|██████▍   | 784/1208 [21:43<11:44,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00747, train/loss_vlb_step=3.76e-5, train/loss_step=0.00747, global_step=5933.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  65%|██████▍   | 785/1208 [21:44<11:42,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00747, train/loss_vlb_step=3.76e-5, train/loss_step=0.00747, global_step=5933.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  65%|██████▍   | 785/1208 [21:44<11:42,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00434, train/loss_vlb_step=2.29e-5, train/loss_step=0.00434, global_step=5934.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  65%|██████▌   | 786/1208 [21:45<11:40,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00434, train/loss_vlb_step=2.29e-5, train/loss_step=0.00434, global_step=5934.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  65%|██████▌   | 786/1208 [21:45<11:40,  1.66s/it, loss=0.142, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000574, train/loss_step=0.173, global_step=5934.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  65%|██████▌   | 787/1208 [21:46<11:38,  1.66s/it, loss=0.142, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000574, train/loss_step=0.173, global_step=5934.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  65%|██████▌   | 787/1208 [21:46<11:38,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000139, train/loss_step=0.0369, global_step=5934.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  65%|██████▌   | 788/1208 [21:49<11:38,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000139, train/loss_step=0.0369, global_step=5934.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  65%|██████▌   | 788/1208 [21:49<11:38,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000296, train/loss_step=0.0891, global_step=5934.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  65%|██████▌   | 789/1208 [21:50<11:36,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000296, train/loss_step=0.0891, global_step=5934.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  65%|██████▌   | 789/1208 [21:50<11:36,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0836, train/loss_vlb_step=0.000276, train/loss_step=0.0836, global_step=5935.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  65%|██████▌   | 790/1208 [21:51<11:34,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0836, train/loss_vlb_step=0.000276, train/loss_step=0.0836, global_step=5935.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  65%|██████▌   | 790/1208 [21:51<11:34,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000146, train/loss_step=0.0381, global_step=5935.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  65%|██████▌   | 791/1208 [21:52<11:32,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000146, train/loss_step=0.0381, global_step=5935.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  65%|██████▌   | 791/1208 [21:52<11:32,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.525, train/loss_vlb_step=0.006, train/loss_step=0.525, global_step=5935.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]     Epoch 19:  66%|██████▌   | 792/1208 [21:56<11:31,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.525, train/loss_vlb_step=0.006, train/loss_step=0.525, global_step=5935.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  66%|██████▌   | 792/1208 [21:56<11:31,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.090, train/loss_vlb_step=0.000296, train/loss_step=0.090, global_step=5935.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  66%|██████▌   | 793/1208 [21:57<11:29,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.090, train/loss_vlb_step=0.000296, train/loss_step=0.090, global_step=5935.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  66%|██████▌   | 793/1208 [21:57<11:29,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000574, train/loss_step=0.167, global_step=5936.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  66%|██████▌   | 794/1208 [21:58<11:27,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000574, train/loss_step=0.167, global_step=5936.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  66%|██████▌   | 794/1208 [21:58<11:27,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.608, train/loss_vlb_step=0.0227, train/loss_step=0.608, global_step=5936.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  66%|██████▌   | 795/1208 [21:59<11:25,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.608, train/loss_vlb_step=0.0227, train/loss_step=0.608, global_step=5936.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  66%|██████▌   | 795/1208 [21:59<11:25,  1.66s/it, loss=0.193, v_num=0, train/loss_simple_step=0.513, train/loss_vlb_step=0.0071, train/loss_step=0.513, global_step=5936.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  66%|██████▌   | 796/1208 [22:02<11:24,  1.66s/it, loss=0.193, v_num=0, train/loss_simple_step=0.513, train/loss_vlb_step=0.0071, train/loss_step=0.513, global_step=5936.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  66%|██████▌   | 796/1208 [22:02<11:24,  1.66s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.59e-5, train/loss_step=0.00282, global_step=5936.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  66%|██████▌   | 797/1208 [22:03<11:22,  1.66s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.59e-5, train/loss_step=0.00282, global_step=5936.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  66%|██████▌   | 797/1208 [22:03<11:22,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=2.14e-5, train/loss_step=0.00362, global_step=5937.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  66%|██████▌   | 798/1208 [22:04<11:20,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=2.14e-5, train/loss_step=0.00362, global_step=5937.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  66%|██████▌   | 798/1208 [22:04<11:20,  1.66s/it, loss=0.167, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000467, train/loss_step=0.140, global_step=5937.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  66%|██████▌   | 799/1208 [22:05<11:18,  1.66s/it, loss=0.167, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000467, train/loss_step=0.140, global_step=5937.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  66%|██████▌   | 799/1208 [22:05<11:18,  1.66s/it, loss=0.164, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00108, train/loss_step=0.245, global_step=5937.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  66%|██████▌   | 800/1208 [22:08<11:17,  1.66s/it, loss=0.164, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00108, train/loss_step=0.245, global_step=5937.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  66%|██████▌   | 800/1208 [22:08<11:17,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000343, train/loss_step=0.105, global_step=5937.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  66%|██████▋   | 801/1208 [22:09<11:15,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000343, train/loss_step=0.105, global_step=5937.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  66%|██████▋   | 801/1208 [22:09<11:15,  1.66s/it, loss=0.175, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.0028, train/loss_step=0.380, global_step=5938.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  66%|██████▋   | 802/1208 [22:10<11:13,  1.66s/it, loss=0.175, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.0028, train/loss_step=0.380, global_step=5938.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  66%|██████▋   | 802/1208 [22:10<11:13,  1.66s/it, loss=0.188, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00218, train/loss_step=0.381, global_step=5938.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  66%|██████▋   | 803/1208 [22:11<11:11,  1.66s/it, loss=0.188, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00218, train/loss_step=0.381, global_step=5938.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  66%|██████▋   | 803/1208 [22:11<11:11,  1.66s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.89e-5, train/loss_step=0.0104, global_step=5938.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  67%|██████▋   | 804/1208 [22:15<11:10,  1.66s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.89e-5, train/loss_step=0.0104, global_step=5938.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  67%|██████▋   | 804/1208 [22:15<11:10,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000107, train/loss_step=0.0277, global_step=5938.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  67%|██████▋   | 805/1208 [22:16<11:08,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000107, train/loss_step=0.0277, global_step=5938.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  67%|██████▋   | 805/1208 [22:16<11:08,  1.66s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.09e-5, train/loss_step=0.0168, global_step=5939.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  67%|██████▋   | 806/1208 [22:17<11:06,  1.66s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.09e-5, train/loss_step=0.0168, global_step=5939.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  67%|██████▋   | 806/1208 [22:17<11:06,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.0001, train/loss_step=0.0248, global_step=5939.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  67%|██████▋   | 807/1208 [22:18<11:05,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.0001, train/loss_step=0.0248, global_step=5939.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  67%|██████▋   | 807/1208 [22:18<11:05,  1.66s/it, loss=0.188, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00157, train/loss_step=0.306, global_step=5939.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  67%|██████▋   | 808/1208 [22:21<11:04,  1.66s/it, loss=0.188, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00157, train/loss_step=0.306, global_step=5939.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  67%|██████▋   | 808/1208 [22:21<11:04,  1.66s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=8.9e-5, train/loss_step=0.0217, global_step=5939.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  67%|██████▋   | 809/1208 [22:22<11:02,  1.66s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=8.9e-5, train/loss_step=0.0217, global_step=5939.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  67%|██████▋   | 809/1208 [22:22<11:02,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.06e-5, train/loss_step=0.0108, global_step=5940.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  67%|██████▋   | 810/1208 [22:23<11:00,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.06e-5, train/loss_step=0.0108, global_step=5940.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  67%|██████▋   | 810/1208 [22:23<11:00,  1.66s/it, loss=0.187, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000544, train/loss_step=0.157, global_step=5940.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  67%|██████▋   | 811/1208 [22:24<10:58,  1.66s/it, loss=0.187, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000544, train/loss_step=0.157, global_step=5940.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  67%|██████▋   | 811/1208 [22:24<10:58,  1.66s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.7e-5, train/loss_step=0.0246, global_step=5940.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  67%|██████▋   | 812/1208 [22:27<10:57,  1.66s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.7e-5, train/loss_step=0.0246, global_step=5940.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  67%|██████▋   | 812/1208 [22:27<10:57,  1.66s/it, loss=0.164, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000427, train/loss_step=0.129, global_step=5940.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  67%|██████▋   | 813/1208 [22:28<10:55,  1.66s/it, loss=0.164, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000427, train/loss_step=0.129, global_step=5940.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  67%|██████▋   | 813/1208 [22:28<10:55,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.12e-5, train/loss_step=0.00188, global_step=5941.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  67%|██████▋   | 814/1208 [22:29<10:53,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.12e-5, train/loss_step=0.00188, global_step=5941.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  67%|██████▋   | 814/1208 [22:29<10:53,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00186, train/loss_step=0.318, global_step=5941.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  67%|██████▋   | 815/1208 [22:31<10:51,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00186, train/loss_step=0.318, global_step=5941.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  67%|██████▋   | 815/1208 [22:31<10:51,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.24e-5, train/loss_step=0.00216, global_step=5941.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  68%|██████▊   | 816/1208 [22:34<10:50,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.24e-5, train/loss_step=0.00216, global_step=5941.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  68%|██████▊   | 816/1208 [22:34<10:50,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.001, train/loss_step=0.251, global_step=5941.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]      Epoch 19:  68%|██████▊   | 817/1208 [22:35<10:48,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.001, train/loss_step=0.251, global_step=5941.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  68%|██████▊   | 817/1208 [22:35<10:48,  1.66s/it, loss=0.143, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.0016, train/loss_step=0.306, global_step=5942.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  68%|██████▊   | 818/1208 [22:36<10:46,  1.66s/it, loss=0.143, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.0016, train/loss_step=0.306, global_step=5942.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  68%|██████▊   | 818/1208 [22:36<10:46,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.064, train/loss_vlb_step=0.000218, train/loss_step=0.064, global_step=5942.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  68%|██████▊   | 819/1208 [22:37<10:44,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.064, train/loss_vlb_step=0.000218, train/loss_step=0.064, global_step=5942.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  68%|██████▊   | 819/1208 [22:37<10:44,  1.66s/it, loss=0.142, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00134, train/loss_step=0.305, global_step=5942.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  68%|██████▊   | 820/1208 [22:40<10:43,  1.66s/it, loss=0.142, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00134, train/loss_step=0.305, global_step=5942.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  68%|██████▊   | 820/1208 [22:40<10:43,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.32e-5, train/loss_step=0.0138, global_step=5942.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  68%|██████▊   | 821/1208 [22:41<10:41,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.32e-5, train/loss_step=0.0138, global_step=5942.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  68%|██████▊   | 821/1208 [22:41<10:41,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00197, train/loss_step=0.312, global_step=5943.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  68%|██████▊   | 822/1208 [22:42<10:39,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00197, train/loss_step=0.312, global_step=5943.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  68%|██████▊   | 822/1208 [22:42<10:39,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00273, train/loss_step=0.390, global_step=5943.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  68%|██████▊   | 823/1208 [22:43<10:37,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00273, train/loss_step=0.390, global_step=5943.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  68%|██████▊   | 823/1208 [22:43<10:37,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=5.97e-5, train/loss_step=0.0138, global_step=5943.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  68%|██████▊   | 824/1208 [22:46<10:36,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=5.97e-5, train/loss_step=0.0138, global_step=5943.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  68%|██████▊   | 824/1208 [22:46<10:36,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00251, train/loss_step=0.425, global_step=5943.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  68%|██████▊   | 825/1208 [22:47<10:35,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00251, train/loss_step=0.425, global_step=5943.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  68%|██████▊   | 825/1208 [22:47<10:35,  1.66s/it, loss=0.189, v_num=0, train/loss_simple_step=0.705, train/loss_vlb_step=0.0453, train/loss_step=0.705, global_step=5944.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  68%|██████▊   | 826/1208 [22:48<10:33,  1.66s/it, loss=0.189, v_num=0, train/loss_simple_step=0.705, train/loss_vlb_step=0.0453, train/loss_step=0.705, global_step=5944.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  68%|██████▊   | 826/1208 [22:48<10:33,  1.66s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0461, train/loss_vlb_step=0.000164, train/loss_step=0.0461, global_step=5944.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  68%|██████▊   | 827/1208 [22:50<10:31,  1.66s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0461, train/loss_vlb_step=0.000164, train/loss_step=0.0461, global_step=5944.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  68%|██████▊   | 827/1208 [22:50<10:31,  1.66s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0636, train/loss_vlb_step=0.000218, train/loss_step=0.0636, global_step=5944.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  69%|██████▊   | 828/1208 [22:53<10:30,  1.66s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0636, train/loss_vlb_step=0.000218, train/loss_step=0.0636, global_step=5944.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  69%|██████▊   | 828/1208 [22:53<10:30,  1.66s/it, loss=0.186, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000606, train/loss_step=0.173, global_step=5944.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  69%|██████▊   | 829/1208 [22:54<10:28,  1.66s/it, loss=0.186, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000606, train/loss_step=0.173, global_step=5944.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  69%|██████▊   | 829/1208 [22:54<10:28,  1.66s/it, loss=0.193, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000493, train/loss_step=0.149, global_step=5945.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  69%|██████▊   | 830/1208 [22:55<10:26,  1.66s/it, loss=0.193, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000493, train/loss_step=0.149, global_step=5945.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  69%|██████▊   | 830/1208 [22:55<10:26,  1.66s/it, loss=0.194, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000688, train/loss_step=0.189, global_step=5945.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  69%|██████▉   | 831/1208 [22:56<10:24,  1.66s/it, loss=0.194, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000688, train/loss_step=0.189, global_step=5945.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  69%|██████▉   | 831/1208 [22:56<10:24,  1.66s/it, loss=0.204, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.00079, train/loss_step=0.216, global_step=5945.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  69%|██████▉   | 832/1208 [22:59<10:23,  1.66s/it, loss=0.204, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.00079, train/loss_step=0.216, global_step=5945.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  69%|██████▉   | 832/1208 [22:59<10:23,  1.66s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=7.05e-6, train/loss_step=0.00116, global_step=5945.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  69%|██████▉   | 833/1208 [23:00<10:21,  1.66s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=7.05e-6, train/loss_step=0.00116, global_step=5945.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  69%|██████▉   | 833/1208 [23:00<10:21,  1.66s/it, loss=0.231, v_num=0, train/loss_simple_step=0.672, train/loss_vlb_step=0.0385, train/loss_step=0.672, global_step=5946.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]     Epoch 19:  69%|██████▉   | 834/1208 [23:01<10:19,  1.66s/it, loss=0.231, v_num=0, train/loss_simple_step=0.672, train/loss_vlb_step=0.0385, train/loss_step=0.672, global_step=5946.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  69%|██████▉   | 834/1208 [23:01<10:19,  1.66s/it, loss=0.252, v_num=0, train/loss_simple_step=0.737, train/loss_vlb_step=0.0348, train/loss_step=0.737, global_step=5946.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  69%|██████▉   | 835/1208 [23:02<10:17,  1.66s/it, loss=0.252, v_num=0, train/loss_simple_step=0.737, train/loss_vlb_step=0.0348, train/loss_step=0.737, global_step=5946.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  69%|██████▉   | 835/1208 [23:02<10:17,  1.66s/it, loss=0.254, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000141, train/loss_step=0.0387, global_step=5946.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  69%|██████▉   | 836/1208 [23:05<10:16,  1.66s/it, loss=0.254, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000141, train/loss_step=0.0387, global_step=5946.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  69%|██████▉   | 836/1208 [23:05<10:16,  1.66s/it, loss=0.243, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.000142, train/loss_step=0.0403, global_step=5946.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  69%|██████▉   | 837/1208 [23:06<10:14,  1.66s/it, loss=0.243, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.000142, train/loss_step=0.0403, global_step=5946.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  69%|██████▉   | 837/1208 [23:06<10:14,  1.66s/it, loss=0.247, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00223, train/loss_step=0.384, global_step=5947.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  69%|██████▉   | 838/1208 [23:07<10:12,  1.66s/it, loss=0.247, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00223, train/loss_step=0.384, global_step=5947.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  69%|██████▉   | 838/1208 [23:07<10:12,  1.66s/it, loss=0.244, v_num=0, train/loss_simple_step=0.00483, train/loss_vlb_step=2.5e-5, train/loss_step=0.00483, global_step=5947.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  69%|██████▉   | 839/1208 [23:09<10:10,  1.66s/it, loss=0.244, v_num=0, train/loss_simple_step=0.00483, train/loss_vlb_step=2.5e-5, train/loss_step=0.00483, global_step=5947.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  69%|██████▉   | 839/1208 [23:09<10:10,  1.66s/it, loss=0.231, v_num=0, train/loss_simple_step=0.0436, train/loss_vlb_step=0.000158, train/loss_step=0.0436, global_step=5947.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  70%|██████▉   | 840/1208 [23:12<10:09,  1.66s/it, loss=0.231, v_num=0, train/loss_simple_step=0.0436, train/loss_vlb_step=0.000158, train/loss_step=0.0436, global_step=5947.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  70%|██████▉   | 840/1208 [23:12<10:09,  1.66s/it, loss=0.231, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=9.77e-5, train/loss_step=0.0251, global_step=5947.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  70%|██████▉   | 841/1208 [23:13<10:07,  1.66s/it, loss=0.231, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=9.77e-5, train/loss_step=0.0251, global_step=5947.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  70%|██████▉   | 841/1208 [23:13<10:07,  1.66s/it, loss=0.219, v_num=0, train/loss_simple_step=0.0611, train/loss_vlb_step=0.000205, train/loss_step=0.0611, global_step=5948.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  70%|██████▉   | 842/1208 [23:14<10:06,  1.66s/it, loss=0.219, v_num=0, train/loss_simple_step=0.0611, train/loss_vlb_step=0.000205, train/loss_step=0.0611, global_step=5948.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  70%|██████▉   | 842/1208 [23:14<10:06,  1.66s/it, loss=0.21, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000764, train/loss_step=0.218, global_step=5948.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  70%|██████▉   | 843/1208 [23:15<10:04,  1.66s/it, loss=0.21, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000764, train/loss_step=0.218, global_step=5948.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  70%|██████▉   | 843/1208 [23:15<10:04,  1.66s/it, loss=0.214, v_num=0, train/loss_simple_step=0.0804, train/loss_vlb_step=0.000266, train/loss_step=0.0804, global_step=5948.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  70%|██████▉   | 844/1208 [23:18<10:03,  1.66s/it, loss=0.214, v_num=0, train/loss_simple_step=0.0804, train/loss_vlb_step=0.000266, train/loss_step=0.0804, global_step=5948.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  70%|██████▉   | 844/1208 [23:18<10:03,  1.66s/it, loss=0.216, v_num=0, train/loss_simple_step=0.472, train/loss_vlb_step=0.00418, train/loss_step=0.472, global_step=5948.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  70%|██████▉   | 845/1208 [23:19<10:01,  1.66s/it, loss=0.216, v_num=0, train/loss_simple_step=0.472, train/loss_vlb_step=0.00418, train/loss_step=0.472, global_step=5948.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  70%|██████▉   | 845/1208 [23:19<10:01,  1.66s/it, loss=0.198, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.0019, train/loss_step=0.340, global_step=5949.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  70%|███████   | 846/1208 [23:20<09:59,  1.66s/it, loss=0.198, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.0019, train/loss_step=0.340, global_step=5949.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  70%|███████   | 846/1208 [23:20<09:59,  1.66s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0853, train/loss_vlb_step=0.000281, train/loss_step=0.0853, global_step=5949.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  70%|███████   | 847/1208 [23:21<09:57,  1.65s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0853, train/loss_vlb_step=0.000281, train/loss_step=0.0853, global_step=5949.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  70%|███████   | 847/1208 [23:21<09:57,  1.65s/it, loss=0.206, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000598, train/loss_step=0.181, global_step=5949.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  70%|███████   | 848/1208 [23:24<09:56,  1.66s/it, loss=0.206, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000598, train/loss_step=0.181, global_step=5949.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  70%|███████   | 848/1208 [23:24<09:56,  1.66s/it, loss=0.202, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=5949.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  70%|███████   | 849/1208 [23:25<09:54,  1.66s/it, loss=0.202, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=5949.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  70%|███████   | 849/1208 [23:25<09:54,  1.66s/it, loss=0.202, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000501, train/loss_step=0.150, global_step=5950.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  70%|███████   | 850/1208 [23:26<09:52,  1.66s/it, loss=0.202, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000501, train/loss_step=0.150, global_step=5950.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  70%|███████   | 850/1208 [23:26<09:52,  1.66s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.000103, train/loss_step=0.0275, global_step=5950.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  70%|███████   | 851/1208 [23:27<09:50,  1.65s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.000103, train/loss_step=0.0275, global_step=5950.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  70%|███████   | 851/1208 [23:27<09:50,  1.65s/it, loss=0.192, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.00064, train/loss_step=0.176, global_step=5950.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  71%|███████   | 852/1208 [23:31<09:49,  1.66s/it, loss=0.192, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.00064, train/loss_step=0.176, global_step=5950.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  71%|███████   | 852/1208 [23:31<09:49,  1.66s/it, loss=0.202, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000764, train/loss_step=0.211, global_step=5950.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  71%|███████   | 853/1208 [23:32<09:47,  1.66s/it, loss=0.202, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000764, train/loss_step=0.211, global_step=5950.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  71%|███████   | 853/1208 [23:32<09:47,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.000968, train/loss_step=0.253, global_step=5951.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  71%|███████   | 854/1208 [23:33<09:45,  1.65s/it, loss=0.181, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.000968, train/loss_step=0.253, global_step=5951.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  71%|███████   | 854/1208 [23:33<09:45,  1.65s/it, loss=0.172, v_num=0, train/loss_simple_step=0.538, train/loss_vlb_step=0.00577, train/loss_step=0.538, global_step=5951.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  71%|███████   | 855/1208 [23:34<09:43,  1.65s/it, loss=0.172, v_num=0, train/loss_simple_step=0.538, train/loss_vlb_step=0.00577, train/loss_step=0.538, global_step=5951.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  71%|███████   | 855/1208 [23:34<09:43,  1.65s/it, loss=0.17, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.93e-5, train/loss_step=0.013, global_step=5951.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  71%|███████   | 856/1208 [23:37<09:42,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.93e-5, train/loss_step=0.013, global_step=5951.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  71%|███████   | 856/1208 [23:37<09:42,  1.66s/it, loss=0.187, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00227, train/loss_step=0.384, global_step=5951.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  71%|███████   | 857/1208 [23:38<09:41,  1.66s/it, loss=0.187, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00227, train/loss_step=0.384, global_step=5951.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  71%|███████   | 857/1208 [23:38<09:41,  1.66s/it, loss=0.188, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00243, train/loss_step=0.386, global_step=5952.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  71%|███████   | 858/1208 [23:39<09:39,  1.65s/it, loss=0.188, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00243, train/loss_step=0.386, global_step=5952.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  71%|███████   | 858/1208 [23:39<09:39,  1.65s/it, loss=0.19, v_num=0, train/loss_simple_step=0.055, train/loss_vlb_step=0.00019, train/loss_step=0.055, global_step=5952.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  71%|███████   | 859/1208 [23:40<09:37,  1.65s/it, loss=0.19, v_num=0, train/loss_simple_step=0.055, train/loss_vlb_step=0.00019, train/loss_step=0.055, global_step=5952.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  71%|███████   | 859/1208 [23:40<09:37,  1.65s/it, loss=0.224, v_num=0, train/loss_simple_step=0.713, train/loss_vlb_step=0.031, train/loss_step=0.713, global_step=5952.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  71%|███████   | 860/1208 [23:43<09:36,  1.66s/it, loss=0.224, v_num=0, train/loss_simple_step=0.713, train/loss_vlb_step=0.031, train/loss_step=0.713, global_step=5952.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  71%|███████   | 860/1208 [23:43<09:36,  1.66s/it, loss=0.222, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.19e-5, train/loss_step=0.00203, global_step=5952.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  71%|███████▏  | 861/1208 [23:44<09:34,  1.65s/it, loss=0.222, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.19e-5, train/loss_step=0.00203, global_step=5952.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  71%|███████▏  | 861/1208 [23:44<09:34,  1.65s/it, loss=0.243, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00333, train/loss_step=0.476, global_step=5953.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  71%|███████▏  | 862/1208 [23:45<09:32,  1.65s/it, loss=0.243, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00333, train/loss_step=0.476, global_step=5953.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  71%|███████▏  | 862/1208 [23:45<09:32,  1.65s/it, loss=0.238, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=5953.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  71%|███████▏  | 863/1208 [23:46<09:30,  1.65s/it, loss=0.238, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=5953.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  71%|███████▏  | 863/1208 [23:46<09:30,  1.65s/it, loss=0.239, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000314, train/loss_step=0.095, global_step=5953.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  72%|███████▏  | 864/1208 [23:49<09:29,  1.65s/it, loss=0.239, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000314, train/loss_step=0.095, global_step=5953.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  72%|███████▏  | 864/1208 [23:49<09:29,  1.65s/it, loss=0.223, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.00056, train/loss_step=0.170, global_step=5953.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  72%|███████▏  | 865/1208 [23:50<09:27,  1.65s/it, loss=0.223, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.00056, train/loss_step=0.170, global_step=5953.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  72%|███████▏  | 865/1208 [23:50<09:27,  1.65s/it, loss=0.218, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000982, train/loss_step=0.232, global_step=5954.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  72%|███████▏  | 866/1208 [23:51<09:25,  1.65s/it, loss=0.218, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000982, train/loss_step=0.232, global_step=5954.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  72%|███████▏  | 866/1208 [23:51<09:25,  1.65s/it, loss=0.219, v_num=0, train/loss_simple_step=0.0944, train/loss_vlb_step=0.000311, train/loss_step=0.0944, global_step=5954.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  72%|███████▏  | 867/1208 [23:52<09:23,  1.65s/it, loss=0.219, v_num=0, train/loss_simple_step=0.0944, train/loss_vlb_step=0.000311, train/loss_step=0.0944, global_step=5954.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  72%|███████▏  | 867/1208 [23:52<09:23,  1.65s/it, loss=0.22, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000766, train/loss_step=0.205, global_step=5954.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  72%|███████▏  | 868/1208 [23:55<09:22,  1.65s/it, loss=0.22, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000766, train/loss_step=0.205, global_step=5954.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  72%|███████▏  | 868/1208 [23:55<09:22,  1.65s/it, loss=0.224, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000695, train/loss_step=0.184, global_step=5954.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  72%|███████▏  | 869/1208 [23:56<09:20,  1.65s/it, loss=0.224, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000695, train/loss_step=0.184, global_step=5954.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  72%|███████▏  | 869/1208 [23:56<09:20,  1.65s/it, loss=0.22, v_num=0, train/loss_simple_step=0.0814, train/loss_vlb_step=0.000268, train/loss_step=0.0814, global_step=5955.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  72%|███████▏  | 870/1208 [23:57<09:18,  1.65s/it, loss=0.22, v_num=0, train/loss_simple_step=0.0814, train/loss_vlb_step=0.000268, train/loss_step=0.0814, global_step=5955.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  72%|███████▏  | 870/1208 [23:57<09:18,  1.65s/it, loss=0.22, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.49e-5, train/loss_step=0.0169, global_step=5955.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  72%|███████▏  | 871/1208 [23:58<09:16,  1.65s/it, loss=0.22, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.49e-5, train/loss_step=0.0169, global_step=5955.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  72%|███████▏  | 871/1208 [23:58<09:16,  1.65s/it, loss=0.226, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00154, train/loss_step=0.308, global_step=5955.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  72%|███████▏  | 872/1208 [24:01<09:15,  1.65s/it, loss=0.226, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00154, train/loss_step=0.308, global_step=5955.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  72%|███████▏  | 872/1208 [24:01<09:15,  1.65s/it, loss=0.236, v_num=0, train/loss_simple_step=0.410, train/loss_vlb_step=0.00352, train/loss_step=0.410, global_step=5955.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  72%|███████▏  | 873/1208 [24:02<09:13,  1.65s/it, loss=0.236, v_num=0, train/loss_simple_step=0.410, train/loss_vlb_step=0.00352, train/loss_step=0.410, global_step=5955.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  72%|███████▏  | 873/1208 [24:02<09:13,  1.65s/it, loss=0.225, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.0001, train/loss_step=0.0249, global_step=5956.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  72%|███████▏  | 874/1208 [24:03<09:11,  1.65s/it, loss=0.225, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.0001, train/loss_step=0.0249, global_step=5956.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  72%|███████▏  | 874/1208 [24:03<09:11,  1.65s/it, loss=0.199, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.07e-5, train/loss_step=0.014, global_step=5956.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  72%|███████▏  | 875/1208 [24:04<09:09,  1.65s/it, loss=0.199, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.07e-5, train/loss_step=0.014, global_step=5956.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  72%|███████▏  | 875/1208 [24:04<09:09,  1.65s/it, loss=0.207, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000637, train/loss_step=0.177, global_step=5956.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  73%|███████▎  | 876/1208 [24:07<09:08,  1.65s/it, loss=0.207, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000637, train/loss_step=0.177, global_step=5956.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  73%|███████▎  | 876/1208 [24:07<09:08,  1.65s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0675, train/loss_vlb_step=0.000226, train/loss_step=0.0675, global_step=5956.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  73%|███████▎  | 877/1208 [24:08<09:06,  1.65s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0675, train/loss_vlb_step=0.000226, train/loss_step=0.0675, global_step=5956.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  73%|███████▎  | 877/1208 [24:08<09:06,  1.65s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.85e-5, train/loss_step=0.00335, global_step=5957.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  73%|███████▎  | 878/1208 [24:09<09:04,  1.65s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.85e-5, train/loss_step=0.00335, global_step=5957.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  73%|███████▎  | 878/1208 [24:09<09:04,  1.65s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00377, train/loss_vlb_step=2.04e-5, train/loss_step=0.00377, global_step=5957.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  73%|███████▎  | 879/1208 [24:10<09:02,  1.65s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00377, train/loss_vlb_step=2.04e-5, train/loss_step=0.00377, global_step=5957.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  73%|███████▎  | 879/1208 [24:10<09:02,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.593, train/loss_vlb_step=0.0077, train/loss_step=0.593, global_step=5957.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]     Epoch 19:  73%|███████▎  | 880/1208 [24:13<09:01,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.593, train/loss_vlb_step=0.0077, train/loss_step=0.593, global_step=5957.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  73%|███████▎  | 880/1208 [24:13<09:01,  1.65s/it, loss=0.17, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000425, train/loss_step=0.129, global_step=5957.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  73%|███████▎  | 881/1208 [24:14<08:59,  1.65s/it, loss=0.17, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000425, train/loss_step=0.129, global_step=5957.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  73%|███████▎  | 881/1208 [24:14<08:59,  1.65s/it, loss=0.177, v_num=0, train/loss_simple_step=0.612, train/loss_vlb_step=0.0112, train/loss_step=0.612, global_step=5958.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  73%|███████▎  | 882/1208 [24:15<08:57,  1.65s/it, loss=0.177, v_num=0, train/loss_simple_step=0.612, train/loss_vlb_step=0.0112, train/loss_step=0.612, global_step=5958.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  73%|███████▎  | 882/1208 [24:15<08:57,  1.65s/it, loss=0.177, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000413, train/loss_step=0.125, global_step=5958.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  73%|███████▎  | 883/1208 [24:16<08:55,  1.65s/it, loss=0.177, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000413, train/loss_step=0.125, global_step=5958.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  73%|███████▎  | 883/1208 [24:16<08:55,  1.65s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.04e-5, train/loss_step=0.00178, global_step=5958.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  73%|███████▎  | 884/1208 [24:19<08:54,  1.65s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.04e-5, train/loss_step=0.00178, global_step=5958.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  73%|███████▎  | 884/1208 [24:19<08:54,  1.65s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0855, train/loss_vlb_step=0.000281, train/loss_step=0.0855, global_step=5958.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  73%|███████▎  | 885/1208 [24:20<08:52,  1.65s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0855, train/loss_vlb_step=0.000281, train/loss_step=0.0855, global_step=5958.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  73%|███████▎  | 885/1208 [24:20<08:52,  1.65s/it, loss=0.165, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000563, train/loss_step=0.171, global_step=5959.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  73%|███████▎  | 886/1208 [24:21<08:50,  1.65s/it, loss=0.165, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000563, train/loss_step=0.171, global_step=5959.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  73%|███████▎  | 886/1208 [24:21<08:50,  1.65s/it, loss=0.173, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00118, train/loss_step=0.244, global_step=5959.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  73%|███████▎  | 887/1208 [24:22<08:49,  1.65s/it, loss=0.173, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00118, train/loss_step=0.244, global_step=5959.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  73%|███████▎  | 887/1208 [24:22<08:49,  1.65s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0986, train/loss_vlb_step=0.000325, train/loss_step=0.0986, global_step=5959.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  74%|███████▎  | 888/1208 [24:24<08:47,  1.65s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0986, train/loss_vlb_step=0.000325, train/loss_step=0.0986, global_step=5959.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  74%|███████▎  | 888/1208 [24:24<08:47,  1.65s/it, loss=0.197, v_num=0, train/loss_simple_step=0.768, train/loss_vlb_step=0.386, train/loss_step=0.768, global_step=5959.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]     Epoch 19:  74%|███████▎  | 889/1208 [24:25<08:46,  1.65s/it, loss=0.197, v_num=0, train/loss_simple_step=0.768, train/loss_vlb_step=0.386, train/loss_step=0.768, global_step=5959.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  74%|███████▎  | 889/1208 [24:25<08:46,  1.65s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0903, train/loss_vlb_step=0.000299, train/loss_step=0.0903, global_step=5960.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  74%|███████▎  | 890/1208 [24:26<08:44,  1.65s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0903, train/loss_vlb_step=0.000299, train/loss_step=0.0903, global_step=5960.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  74%|███████▎  | 890/1208 [24:26<08:44,  1.65s/it, loss=0.208, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000826, train/loss_step=0.226, global_step=5960.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  74%|███████▍  | 891/1208 [24:27<08:42,  1.65s/it, loss=0.208, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000826, train/loss_step=0.226, global_step=5960.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  74%|███████▍  | 891/1208 [24:27<08:42,  1.65s/it, loss=0.195, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.000215, train/loss_step=0.062, global_step=5960.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  74%|███████▍  | 892/1208 [24:30<08:41,  1.65s/it, loss=0.195, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.000215, train/loss_step=0.062, global_step=5960.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  74%|███████▍  | 892/1208 [24:30<08:41,  1.65s/it, loss=0.187, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000922, train/loss_step=0.242, global_step=5960.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  74%|███████▍  | 893/1208 [24:31<08:39,  1.65s/it, loss=0.187, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000922, train/loss_step=0.242, global_step=5960.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  74%|███████▍  | 893/1208 [24:31<08:39,  1.65s/it, loss=0.193, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000493, train/loss_step=0.144, global_step=5961.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  74%|███████▍  | 894/1208 [24:32<08:37,  1.65s/it, loss=0.193, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000493, train/loss_step=0.144, global_step=5961.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  74%|███████▍  | 894/1208 [24:32<08:37,  1.65s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000159, train/loss_step=0.0448, global_step=5961.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  74%|███████▍  | 895/1208 [24:33<08:35,  1.65s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000159, train/loss_step=0.0448, global_step=5961.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  74%|███████▍  | 895/1208 [24:33<08:35,  1.65s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.000118, train/loss_step=0.0312, global_step=5961.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  74%|███████▍  | 896/1208 [24:36<08:34,  1.65s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.000118, train/loss_step=0.0312, global_step=5961.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  74%|███████▍  | 896/1208 [24:36<08:34,  1.65s/it, loss=0.203, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00203, train/loss_step=0.378, global_step=5961.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  74%|███████▍  | 897/1208 [24:37<08:32,  1.65s/it, loss=0.203, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00203, train/loss_step=0.378, global_step=5961.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  74%|███████▍  | 897/1208 [24:37<08:32,  1.65s/it, loss=0.229, v_num=0, train/loss_simple_step=0.538, train/loss_vlb_step=0.00626, train/loss_step=0.538, global_step=5962.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  74%|███████▍  | 898/1208 [24:38<08:30,  1.65s/it, loss=0.229, v_num=0, train/loss_simple_step=0.538, train/loss_vlb_step=0.00626, train/loss_step=0.538, global_step=5962.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  74%|███████▍  | 898/1208 [24:38<08:30,  1.65s/it, loss=0.23, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.61e-5, train/loss_step=0.0179, global_step=5962.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  74%|███████▍  | 899/1208 [24:39<08:28,  1.65s/it, loss=0.23, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.61e-5, train/loss_step=0.0179, global_step=5962.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  74%|███████▍  | 899/1208 [24:39<08:28,  1.65s/it, loss=0.201, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=1.1e-5, train/loss_step=0.00187, global_step=5962.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  75%|███████▍  | 900/1208 [24:42<08:27,  1.65s/it, loss=0.201, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=1.1e-5, train/loss_step=0.00187, global_step=5962.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  75%|███████▍  | 900/1208 [24:42<08:27,  1.65s/it, loss=0.202, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000533, train/loss_step=0.156, global_step=5962.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.85it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.86it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.85it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:25,  1.85it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.84it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.85it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.84it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.85it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.84it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.85it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.84it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.84it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.84it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.84it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.84it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.84it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.84it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.84it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.84it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.84it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.84it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.84it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.84it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.84it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.84it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.84it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.84it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.85it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.84it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s][ADDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.84it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.83it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.84it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.83it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.84it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.84it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:12,  1.85it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.83it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.85it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.85it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.85it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.85it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.84it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.85it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.84it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.85it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.84it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.85it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.84it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.85it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.84it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.84it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.84it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.84it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.83it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.85it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.84it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.82it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.84it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.84it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.84it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.84it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.84it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.83it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.84it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.84it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.84it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.83it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:24<00:02,  1.83it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.84it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.83it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.84it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.84it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.84it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.84it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.84it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]Epoch 19:  75%|███████▍  | 901/1208 [25:12<08:35,  1.68s/it, loss=0.202, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000533, train/loss_step=0.156, global_step=5962.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  75%|███████▍  | 901/1208 [25:12<08:35,  1.68s/it, loss=0.183, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.00114, train/loss_step=0.233, global_step=5963.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  75%|███████▍  | 902/1208 [25:13<08:33,  1.68s/it, loss=0.183, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.00114, train/loss_step=0.233, global_step=5963.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  75%|███████▍  | 902/1208 [25:13<08:33,  1.68s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00515, train/loss_vlb_step=2.74e-5, train/loss_step=0.00515, global_step=5963.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  75%|███████▍  | 903/1208 [25:14<08:31,  1.68s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00515, train/loss_vlb_step=2.74e-5, train/loss_step=0.00515, global_step=5963.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  75%|███████▍  | 903/1208 [25:14<08:31,  1.68s/it, loss=0.192, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.0014, train/loss_step=0.306, global_step=5963.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]     Epoch 19:  75%|███████▍  | 904/1208 [25:17<08:30,  1.68s/it, loss=0.192, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.0014, train/loss_step=0.306, global_step=5963.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  75%|███████▍  | 904/1208 [25:17<08:30,  1.68s/it, loss=0.195, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000446, train/loss_step=0.134, global_step=5963.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  75%|███████▍  | 905/1208 [25:18<08:28,  1.68s/it, loss=0.195, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000446, train/loss_step=0.134, global_step=5963.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  75%|███████▍  | 905/1208 [25:18<08:28,  1.68s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00717, train/loss_vlb_step=3.46e-5, train/loss_step=0.00717, global_step=5964.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  75%|███████▌  | 906/1208 [25:19<08:26,  1.68s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00717, train/loss_vlb_step=3.46e-5, train/loss_step=0.00717, global_step=5964.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  75%|███████▌  | 906/1208 [25:19<08:26,  1.68s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.000158, train/loss_step=0.0456, global_step=5964.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  75%|███████▌  | 907/1208 [25:20<08:24,  1.68s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.000158, train/loss_step=0.0456, global_step=5964.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  75%|███████▌  | 907/1208 [25:20<08:24,  1.68s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0331, train/loss_vlb_step=0.000127, train/loss_step=0.0331, global_step=5964.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  75%|███████▌  | 908/1208 [25:23<08:23,  1.68s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0331, train/loss_vlb_step=0.000127, train/loss_step=0.0331, global_step=5964.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  75%|███████▌  | 908/1208 [25:23<08:23,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000103, train/loss_step=0.0273, global_step=5964.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  75%|███████▌  | 909/1208 [25:24<08:21,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000103, train/loss_step=0.0273, global_step=5964.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  75%|███████▌  | 909/1208 [25:24<08:21,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.000149, train/loss_step=0.0417, global_step=5965.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  75%|███████▌  | 910/1208 [25:25<08:19,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.000149, train/loss_step=0.0417, global_step=5965.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  75%|███████▌  | 910/1208 [25:25<08:19,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.93e-5, train/loss_step=0.00352, global_step=5965.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  75%|███████▌  | 911/1208 [25:26<08:17,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.93e-5, train/loss_step=0.00352, global_step=5965.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  75%|███████▌  | 911/1208 [25:26<08:17,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0084, train/loss_vlb_step=4.09e-5, train/loss_step=0.0084, global_step=5965.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  75%|███████▌  | 912/1208 [25:29<08:16,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0084, train/loss_vlb_step=4.09e-5, train/loss_step=0.0084, global_step=5965.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  75%|███████▌  | 912/1208 [25:29<08:16,  1.68s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0565, train/loss_vlb_step=0.000201, train/loss_step=0.0565, global_step=5965.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  76%|███████▌  | 913/1208 [25:30<08:14,  1.68s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0565, train/loss_vlb_step=0.000201, train/loss_step=0.0565, global_step=5965.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  76%|███████▌  | 913/1208 [25:30<08:14,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00389, train/loss_step=0.454, global_step=5966.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  76%|███████▌  | 914/1208 [25:31<08:12,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00389, train/loss_step=0.454, global_step=5966.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  76%|███████▌  | 914/1208 [25:31<08:12,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=1.18e-5, train/loss_step=0.00201, global_step=5966.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  76%|███████▌  | 915/1208 [25:32<08:10,  1.67s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=1.18e-5, train/loss_step=0.00201, global_step=5966.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  76%|███████▌  | 915/1208 [25:32<08:10,  1.67s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00444, train/loss_vlb_step=2.29e-5, train/loss_step=0.00444, global_step=5966.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  76%|███████▌  | 916/1208 [25:35<08:09,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00444, train/loss_vlb_step=2.29e-5, train/loss_step=0.00444, global_step=5966.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  76%|███████▌  | 916/1208 [25:35<08:09,  1.68s/it, loss=0.11, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000396, train/loss_step=0.120, global_step=5966.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  76%|███████▌  | 917/1208 [25:36<08:07,  1.68s/it, loss=0.11, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000396, train/loss_step=0.120, global_step=5966.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  76%|███████▌  | 917/1208 [25:36<08:07,  1.68s/it, loss=0.0853, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000176, train/loss_step=0.0478, global_step=5967.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  76%|███████▌  | 918/1208 [25:37<08:05,  1.67s/it, loss=0.0853, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000176, train/loss_step=0.0478, global_step=5967.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  76%|███████▌  | 918/1208 [25:37<08:05,  1.67s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.03e-5, train/loss_step=0.0199, global_step=5967.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  76%|███████▌  | 919/1208 [25:38<08:03,  1.67s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.03e-5, train/loss_step=0.0199, global_step=5967.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  76%|███████▌  | 919/1208 [25:38<08:03,  1.67s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000952, train/loss_step=0.221, global_step=5967.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  76%|███████▌  | 920/1208 [25:41<08:02,  1.68s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000952, train/loss_step=0.221, global_step=5967.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  76%|███████▌  | 920/1208 [25:41<08:02,  1.68s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000862, train/loss_step=0.220, global_step=5967.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  76%|███████▌  | 921/1208 [25:42<08:00,  1.67s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000862, train/loss_step=0.220, global_step=5967.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  76%|███████▌  | 921/1208 [25:42<08:00,  1.67s/it, loss=0.0907, v_num=0, train/loss_simple_step=0.0561, train/loss_vlb_step=0.000192, train/loss_step=0.0561, global_step=5968.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  76%|███████▋  | 922/1208 [25:43<07:58,  1.67s/it, loss=0.0907, v_num=0, train/loss_simple_step=0.0561, train/loss_vlb_step=0.000192, train/loss_step=0.0561, global_step=5968.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  76%|███████▋  | 922/1208 [25:43<07:58,  1.67s/it, loss=0.129, v_num=0, train/loss_simple_step=0.768, train/loss_vlb_step=0.0654, train/loss_step=0.768, global_step=5968.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]     Epoch 19:  76%|███████▋  | 923/1208 [25:44<07:56,  1.67s/it, loss=0.129, v_num=0, train/loss_simple_step=0.768, train/loss_vlb_step=0.0654, train/loss_step=0.768, global_step=5968.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  76%|███████▋  | 923/1208 [25:44<07:56,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.8e-5, train/loss_step=0.0228, global_step=5968.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  76%|███████▋  | 924/1208 [25:46<07:55,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.8e-5, train/loss_step=0.0228, global_step=5968.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  76%|███████▋  | 924/1208 [25:46<07:55,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0708, train/loss_vlb_step=0.000236, train/loss_step=0.0708, global_step=5968.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  77%|███████▋  | 925/1208 [25:47<07:53,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0708, train/loss_vlb_step=0.000236, train/loss_step=0.0708, global_step=5968.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  77%|███████▋  | 925/1208 [25:47<07:53,  1.67s/it, loss=0.129, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.0018, train/loss_step=0.349, global_step=5969.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  77%|███████▋  | 926/1208 [25:48<07:51,  1.67s/it, loss=0.129, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.0018, train/loss_step=0.349, global_step=5969.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  77%|███████▋  | 926/1208 [25:48<07:51,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000816, train/loss_step=0.207, global_step=5969.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  77%|███████▋  | 927/1208 [25:50<07:49,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000816, train/loss_step=0.207, global_step=5969.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  77%|███████▋  | 927/1208 [25:50<07:49,  1.67s/it, loss=0.135, v_num=0, train/loss_simple_step=0.009, train/loss_vlb_step=3.95e-5, train/loss_step=0.009, global_step=5969.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  77%|███████▋  | 928/1208 [25:52<07:48,  1.67s/it, loss=0.135, v_num=0, train/loss_simple_step=0.009, train/loss_vlb_step=3.95e-5, train/loss_step=0.009, global_step=5969.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  77%|███████▋  | 928/1208 [25:52<07:48,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000152, train/loss_step=0.0415, global_step=5969.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  77%|███████▋  | 929/1208 [25:53<07:46,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000152, train/loss_step=0.0415, global_step=5969.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  77%|███████▋  | 929/1208 [25:53<07:46,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000376, train/loss_step=0.114, global_step=5970.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  77%|███████▋  | 930/1208 [25:54<07:44,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000376, train/loss_step=0.114, global_step=5970.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  77%|███████▋  | 930/1208 [25:54<07:44,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000123, train/loss_step=0.0304, global_step=5970.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  77%|███████▋  | 931/1208 [25:55<07:42,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000123, train/loss_step=0.0304, global_step=5970.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  77%|███████▋  | 931/1208 [25:55<07:42,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.0016, train/loss_step=0.331, global_step=5970.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  77%|███████▋  | 932/1208 [25:58<07:41,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.0016, train/loss_step=0.331, global_step=5970.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  77%|███████▋  | 932/1208 [25:58<07:41,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000409, train/loss_step=0.125, global_step=5970.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  77%|███████▋  | 933/1208 [25:59<07:39,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000409, train/loss_step=0.125, global_step=5970.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  77%|███████▋  | 933/1208 [25:59<07:39,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00878, train/loss_vlb_step=4.29e-5, train/loss_step=0.00878, global_step=5971.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  77%|███████▋  | 934/1208 [26:00<07:37,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00878, train/loss_vlb_step=4.29e-5, train/loss_step=0.00878, global_step=5971.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  77%|███████▋  | 934/1208 [26:00<07:37,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.07e-5, train/loss_step=0.00182, global_step=5971.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  77%|███████▋  | 935/1208 [26:01<07:36,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.07e-5, train/loss_step=0.00182, global_step=5971.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  77%|███████▋  | 935/1208 [26:01<07:36,  1.67s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0066, train/loss_vlb_step=3.4e-5, train/loss_step=0.0066, global_step=5971.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  77%|███████▋  | 936/1208 [26:04<07:34,  1.67s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0066, train/loss_vlb_step=3.4e-5, train/loss_step=0.0066, global_step=5971.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  77%|███████▋  | 936/1208 [26:04<07:34,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.71e-5, train/loss_step=0.00304, global_step=5971.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  78%|███████▊  | 937/1208 [26:05<07:32,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.71e-5, train/loss_step=0.00304, global_step=5971.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  78%|███████▊  | 937/1208 [26:05<07:32,  1.67s/it, loss=0.146, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00154, train/loss_step=0.323, global_step=5972.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  78%|███████▊  | 938/1208 [26:06<07:30,  1.67s/it, loss=0.146, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00154, train/loss_step=0.323, global_step=5972.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  78%|███████▊  | 938/1208 [26:06<07:30,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000958, train/loss_step=0.230, global_step=5972.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  78%|███████▊  | 939/1208 [26:07<07:29,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000958, train/loss_step=0.230, global_step=5972.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  78%|███████▊  | 939/1208 [26:07<07:29,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000108, train/loss_step=0.0268, global_step=5972.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  78%|███████▊  | 940/1208 [26:10<07:27,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000108, train/loss_step=0.0268, global_step=5972.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  78%|███████▊  | 940/1208 [26:10<07:27,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.56e-5, train/loss_step=0.012, global_step=5972.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  78%|███████▊  | 941/1208 [26:11<07:25,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.56e-5, train/loss_step=0.012, global_step=5972.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  78%|███████▊  | 941/1208 [26:11<07:25,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0434, train/loss_vlb_step=0.000157, train/loss_step=0.0434, global_step=5973.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  78%|███████▊  | 942/1208 [26:12<07:24,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0434, train/loss_vlb_step=0.000157, train/loss_step=0.0434, global_step=5973.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  78%|███████▊  | 942/1208 [26:12<07:24,  1.67s/it, loss=0.104, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000443, train/loss_step=0.134, global_step=5973.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  78%|███████▊  | 943/1208 [26:13<07:22,  1.67s/it, loss=0.104, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000443, train/loss_step=0.134, global_step=5973.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  78%|███████▊  | 943/1208 [26:13<07:22,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00142, train/loss_step=0.280, global_step=5973.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  78%|███████▊  | 944/1208 [26:16<07:20,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00142, train/loss_step=0.280, global_step=5973.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  78%|███████▊  | 944/1208 [26:16<07:20,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00608, train/loss_vlb_step=3.13e-5, train/loss_step=0.00608, global_step=5973.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  78%|███████▊  | 945/1208 [26:17<07:19,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00608, train/loss_vlb_step=3.13e-5, train/loss_step=0.00608, global_step=5973.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  78%|███████▊  | 945/1208 [26:17<07:19,  1.67s/it, loss=0.103, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000422, train/loss_step=0.127, global_step=5974.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  78%|███████▊  | 946/1208 [26:18<07:17,  1.67s/it, loss=0.103, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000422, train/loss_step=0.127, global_step=5974.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  78%|███████▊  | 946/1208 [26:18<07:17,  1.67s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.0952, train/loss_vlb_step=0.000316, train/loss_step=0.0952, global_step=5974.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  78%|███████▊  | 947/1208 [26:19<07:15,  1.67s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.0952, train/loss_vlb_step=0.000316, train/loss_step=0.0952, global_step=5974.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  78%|███████▊  | 947/1208 [26:19<07:15,  1.67s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0769, train/loss_vlb_step=0.00026, train/loss_step=0.0769, global_step=5974.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  78%|███████▊  | 948/1208 [26:22<07:13,  1.67s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0769, train/loss_vlb_step=0.00026, train/loss_step=0.0769, global_step=5974.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  78%|███████▊  | 948/1208 [26:22<07:13,  1.67s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.76e-5, train/loss_step=0.0179, global_step=5974.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  79%|███████▊  | 949/1208 [26:23<07:12,  1.67s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.76e-5, train/loss_step=0.0179, global_step=5974.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  79%|███████▊  | 949/1208 [26:23<07:12,  1.67s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.097, train/loss_vlb_step=0.000319, train/loss_step=0.097, global_step=5975.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  79%|███████▊  | 950/1208 [26:24<07:10,  1.67s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.097, train/loss_vlb_step=0.000319, train/loss_step=0.097, global_step=5975.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  79%|███████▊  | 950/1208 [26:24<07:10,  1.67s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.00823, train/loss_vlb_step=3.93e-5, train/loss_step=0.00823, global_step=5975.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  79%|███████▊  | 951/1208 [26:25<07:08,  1.67s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.00823, train/loss_vlb_step=3.93e-5, train/loss_step=0.00823, global_step=5975.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  79%|███████▊  | 951/1208 [26:25<07:08,  1.67s/it, loss=0.0901, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000628, train/loss_step=0.180, global_step=5975.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  79%|███████▉  | 952/1208 [26:28<07:07,  1.67s/it, loss=0.0901, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000628, train/loss_step=0.180, global_step=5975.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  79%|███████▉  | 952/1208 [26:28<07:07,  1.67s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000618, train/loss_step=0.173, global_step=5975.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  79%|███████▉  | 953/1208 [26:29<07:05,  1.67s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000618, train/loss_step=0.173, global_step=5975.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  79%|███████▉  | 953/1208 [26:29<07:05,  1.67s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.0967, train/loss_vlb_step=0.000321, train/loss_step=0.0967, global_step=5976.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  79%|███████▉  | 954/1208 [26:30<07:03,  1.67s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.0967, train/loss_vlb_step=0.000321, train/loss_step=0.0967, global_step=5976.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  79%|███████▉  | 954/1208 [26:30<07:03,  1.67s/it, loss=0.106, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000626, train/loss_step=0.183, global_step=5976.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  79%|███████▉  | 955/1208 [26:31<07:01,  1.67s/it, loss=0.106, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000626, train/loss_step=0.183, global_step=5976.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  79%|███████▉  | 955/1208 [26:31<07:01,  1.67s/it, loss=0.107, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000101, train/loss_step=0.026, global_step=5976.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  79%|███████▉  | 956/1208 [26:34<07:00,  1.67s/it, loss=0.107, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000101, train/loss_step=0.026, global_step=5976.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  79%|███████▉  | 956/1208 [26:34<07:00,  1.67s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.97e-5, train/loss_step=0.0133, global_step=5976.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  79%|███████▉  | 957/1208 [26:35<06:58,  1.67s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.97e-5, train/loss_step=0.0133, global_step=5976.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  79%|███████▉  | 957/1208 [26:35<06:58,  1.67s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000421, train/loss_step=0.124, global_step=5977.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  79%|███████▉  | 958/1208 [26:36<06:56,  1.67s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000421, train/loss_step=0.124, global_step=5977.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  79%|███████▉  | 958/1208 [26:36<06:56,  1.67s/it, loss=0.086, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.03e-5, train/loss_step=0.00173, global_step=5977.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  79%|███████▉  | 959/1208 [26:37<06:54,  1.67s/it, loss=0.086, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.03e-5, train/loss_step=0.00173, global_step=5977.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  79%|███████▉  | 959/1208 [26:37<06:54,  1.67s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.000131, train/loss_step=0.0359, global_step=5977.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  79%|███████▉  | 960/1208 [26:40<06:53,  1.67s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.000131, train/loss_step=0.0359, global_step=5977.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  79%|███████▉  | 960/1208 [26:40<06:53,  1.67s/it, loss=0.0879, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000147, train/loss_step=0.0407, global_step=5977.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  80%|███████▉  | 961/1208 [26:41<06:51,  1.67s/it, loss=0.0879, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000147, train/loss_step=0.0407, global_step=5977.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  80%|███████▉  | 961/1208 [26:41<06:51,  1.67s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.0553, train/loss_vlb_step=0.000194, train/loss_step=0.0553, global_step=5978.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  80%|███████▉  | 962/1208 [26:42<06:49,  1.67s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.0553, train/loss_vlb_step=0.000194, train/loss_step=0.0553, global_step=5978.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  80%|███████▉  | 962/1208 [26:42<06:49,  1.67s/it, loss=0.0863, v_num=0, train/loss_simple_step=0.0897, train/loss_vlb_step=0.000298, train/loss_step=0.0897, global_step=5978.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  80%|███████▉  | 963/1208 [26:43<06:47,  1.66s/it, loss=0.0863, v_num=0, train/loss_simple_step=0.0897, train/loss_vlb_step=0.000298, train/loss_step=0.0897, global_step=5978.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  80%|███████▉  | 963/1208 [26:43<06:47,  1.66s/it, loss=0.074, v_num=0, train/loss_simple_step=0.0338, train/loss_vlb_step=0.000127, train/loss_step=0.0338, global_step=5978.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  80%|███████▉  | 964/1208 [26:46<06:46,  1.67s/it, loss=0.074, v_num=0, train/loss_simple_step=0.0338, train/loss_vlb_step=0.000127, train/loss_step=0.0338, global_step=5978.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  80%|███████▉  | 964/1208 [26:46<06:46,  1.67s/it, loss=0.0751, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000102, train/loss_step=0.0264, global_step=5978.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  80%|███████▉  | 965/1208 [26:47<06:44,  1.67s/it, loss=0.0751, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000102, train/loss_step=0.0264, global_step=5978.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  80%|███████▉  | 965/1208 [26:47<06:44,  1.67s/it, loss=0.0734, v_num=0, train/loss_simple_step=0.0942, train/loss_vlb_step=0.00031, train/loss_step=0.0942, global_step=5979.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  80%|███████▉  | 966/1208 [26:48<06:42,  1.66s/it, loss=0.0734, v_num=0, train/loss_simple_step=0.0942, train/loss_vlb_step=0.00031, train/loss_step=0.0942, global_step=5979.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  80%|███████▉  | 966/1208 [26:48<06:42,  1.66s/it, loss=0.0731, v_num=0, train/loss_simple_step=0.0889, train/loss_vlb_step=0.000293, train/loss_step=0.0889, global_step=5979.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  80%|████████  | 967/1208 [26:49<06:41,  1.66s/it, loss=0.0731, v_num=0, train/loss_simple_step=0.0889, train/loss_vlb_step=0.000293, train/loss_step=0.0889, global_step=5979.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  80%|████████  | 967/1208 [26:49<06:41,  1.66s/it, loss=0.0702, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.93e-5, train/loss_step=0.0191, global_step=5979.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  80%|████████  | 968/1208 [26:51<06:39,  1.67s/it, loss=0.0702, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.93e-5, train/loss_step=0.0191, global_step=5979.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  80%|████████  | 968/1208 [26:51<06:39,  1.67s/it, loss=0.0917, v_num=0, train/loss_simple_step=0.449, train/loss_vlb_step=0.00314, train/loss_step=0.449, global_step=5979.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  80%|████████  | 969/1208 [26:52<06:37,  1.66s/it, loss=0.0917, v_num=0, train/loss_simple_step=0.449, train/loss_vlb_step=0.00314, train/loss_step=0.449, global_step=5979.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  80%|████████  | 969/1208 [26:52<06:37,  1.66s/it, loss=0.0943, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000493, train/loss_step=0.147, global_step=5980.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  80%|████████  | 970/1208 [26:53<06:36,  1.66s/it, loss=0.0943, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000493, train/loss_step=0.147, global_step=5980.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  80%|████████  | 970/1208 [26:53<06:36,  1.66s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000328, train/loss_step=0.100, global_step=5980.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  80%|████████  | 971/1208 [26:54<06:34,  1.66s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000328, train/loss_step=0.100, global_step=5980.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  80%|████████  | 971/1208 [26:54<06:34,  1.66s/it, loss=0.0959, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000396, train/loss_step=0.120, global_step=5980.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  80%|████████  | 972/1208 [26:57<06:32,  1.66s/it, loss=0.0959, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000396, train/loss_step=0.120, global_step=5980.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  80%|████████  | 972/1208 [26:57<06:32,  1.66s/it, loss=0.095, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000535, train/loss_step=0.157, global_step=5980.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  81%|████████  | 973/1208 [26:58<06:30,  1.66s/it, loss=0.095, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000535, train/loss_step=0.157, global_step=5980.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  81%|████████  | 973/1208 [26:58<06:30,  1.66s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.0645, train/loss_vlb_step=0.000223, train/loss_step=0.0645, global_step=5981.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  81%|████████  | 974/1208 [26:59<06:29,  1.66s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.0645, train/loss_vlb_step=0.000223, train/loss_step=0.0645, global_step=5981.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  81%|████████  | 974/1208 [26:59<06:29,  1.66s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.93e-5, train/loss_step=0.0104, global_step=5981.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  81%|████████  | 975/1208 [27:00<06:27,  1.66s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.93e-5, train/loss_step=0.0104, global_step=5981.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  81%|████████  | 975/1208 [27:00<06:27,  1.66s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00158, train/loss_step=0.308, global_step=5981.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  81%|████████  | 976/1208 [27:03<06:25,  1.66s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00158, train/loss_step=0.308, global_step=5981.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  81%|████████  | 976/1208 [27:03<06:25,  1.66s/it, loss=0.101, v_num=0, train/loss_simple_step=0.059, train/loss_vlb_step=0.000201, train/loss_step=0.059, global_step=5981.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  81%|████████  | 977/1208 [27:04<06:24,  1.66s/it, loss=0.101, v_num=0, train/loss_simple_step=0.059, train/loss_vlb_step=0.000201, train/loss_step=0.059, global_step=5981.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  81%|████████  | 977/1208 [27:04<06:24,  1.66s/it, loss=0.099, v_num=0, train/loss_simple_step=0.0794, train/loss_vlb_step=0.000264, train/loss_step=0.0794, global_step=5982.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  81%|████████  | 978/1208 [27:05<06:22,  1.66s/it, loss=0.099, v_num=0, train/loss_simple_step=0.0794, train/loss_vlb_step=0.000264, train/loss_step=0.0794, global_step=5982.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  81%|████████  | 978/1208 [27:05<06:22,  1.66s/it, loss=0.112, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.0012, train/loss_step=0.256, global_step=5982.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  81%|████████  | 979/1208 [27:06<06:20,  1.66s/it, loss=0.112, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.0012, train/loss_step=0.256, global_step=5982.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  81%|████████  | 979/1208 [27:06<06:20,  1.66s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.000189, train/loss_step=0.0527, global_step=5982.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  81%|████████  | 980/1208 [27:09<06:19,  1.66s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.000189, train/loss_step=0.0527, global_step=5982.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  81%|████████  | 980/1208 [27:09<06:19,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00133, train/loss_step=0.272, global_step=5982.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  81%|████████  | 981/1208 [27:10<06:17,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00133, train/loss_step=0.272, global_step=5982.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  81%|████████  | 981/1208 [27:10<06:17,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00643, train/loss_vlb_step=3.13e-5, train/loss_step=0.00643, global_step=5983.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  81%|████████▏ | 982/1208 [27:11<06:15,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00643, train/loss_vlb_step=3.13e-5, train/loss_step=0.00643, global_step=5983.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  81%|████████▏ | 982/1208 [27:11<06:15,  1.66s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0771, train/loss_vlb_step=0.000256, train/loss_step=0.0771, global_step=5983.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  81%|████████▏ | 983/1208 [27:12<06:13,  1.66s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0771, train/loss_vlb_step=0.000256, train/loss_step=0.0771, global_step=5983.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  81%|████████▏ | 983/1208 [27:12<06:13,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000971, train/loss_step=0.226, global_step=5983.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  81%|████████▏ | 984/1208 [27:15<06:12,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000971, train/loss_step=0.226, global_step=5983.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  81%|████████▏ | 984/1208 [27:15<06:12,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0753, train/loss_vlb_step=0.000248, train/loss_step=0.0753, global_step=5983.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  82%|████████▏ | 985/1208 [27:16<06:10,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0753, train/loss_vlb_step=0.000248, train/loss_step=0.0753, global_step=5983.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  82%|████████▏ | 985/1208 [27:16<06:10,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=1.14e-5, train/loss_step=0.0019, global_step=5984.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  82%|████████▏ | 986/1208 [27:17<06:08,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=1.14e-5, train/loss_step=0.0019, global_step=5984.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  82%|████████▏ | 986/1208 [27:17<06:08,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00527, train/loss_vlb_step=2.66e-5, train/loss_step=0.00527, global_step=5984.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  82%|████████▏ | 987/1208 [27:18<06:06,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00527, train/loss_vlb_step=2.66e-5, train/loss_step=0.00527, global_step=5984.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  82%|████████▏ | 987/1208 [27:18<06:06,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0535, train/loss_vlb_step=0.000188, train/loss_step=0.0535, global_step=5984.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  82%|████████▏ | 988/1208 [27:21<06:05,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0535, train/loss_vlb_step=0.000188, train/loss_step=0.0535, global_step=5984.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  82%|████████▏ | 988/1208 [27:21<06:05,  1.66s/it, loss=0.119, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00172, train/loss_step=0.313, global_step=5984.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  82%|████████▏ | 989/1208 [27:22<06:03,  1.66s/it, loss=0.119, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00172, train/loss_step=0.313, global_step=5984.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  82%|████████▏ | 989/1208 [27:22<06:03,  1.66s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00424, train/loss_vlb_step=2.24e-5, train/loss_step=0.00424, global_step=5985.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  82%|████████▏ | 990/1208 [27:23<06:01,  1.66s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00424, train/loss_vlb_step=2.24e-5, train/loss_step=0.00424, global_step=5985.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  82%|████████▏ | 990/1208 [27:23<06:01,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.0079, train/loss_step=0.470, global_step=5985.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]     Epoch 19:  82%|████████▏ | 991/1208 [27:24<06:00,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.0079, train/loss_step=0.470, global_step=5985.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  82%|████████▏ | 991/1208 [27:24<06:00,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00642, train/loss_vlb_step=3.24e-5, train/loss_step=0.00642, global_step=5985.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  82%|████████▏ | 992/1208 [27:27<05:58,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00642, train/loss_vlb_step=3.24e-5, train/loss_step=0.00642, global_step=5985.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  82%|████████▏ | 992/1208 [27:27<05:58,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00137, train/loss_step=0.287, global_step=5985.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  82%|████████▏ | 993/1208 [27:28<05:56,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00137, train/loss_step=0.287, global_step=5985.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  82%|████████▏ | 993/1208 [27:28<05:56,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.37e-5, train/loss_step=0.0126, global_step=5986.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  82%|████████▏ | 994/1208 [27:29<05:55,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.37e-5, train/loss_step=0.0126, global_step=5986.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  82%|████████▏ | 994/1208 [27:29<05:55,  1.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0691, train/loss_vlb_step=0.000237, train/loss_step=0.0691, global_step=5986.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  82%|████████▏ | 995/1208 [27:30<05:53,  1.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0691, train/loss_vlb_step=0.000237, train/loss_step=0.0691, global_step=5986.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  82%|████████▏ | 995/1208 [27:30<05:53,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000106, train/loss_step=0.0267, global_step=5986.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  82%|████████▏ | 996/1208 [27:33<05:51,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000106, train/loss_step=0.0267, global_step=5986.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  82%|████████▏ | 996/1208 [27:33<05:51,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00165, train/loss_step=0.330, global_step=5986.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  83%|████████▎ | 997/1208 [27:34<05:50,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00165, train/loss_step=0.330, global_step=5986.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  83%|████████▎ | 997/1208 [27:34<05:50,  1.66s/it, loss=0.147, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00242, train/loss_step=0.391, global_step=5987.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  83%|████████▎ | 998/1208 [27:35<05:48,  1.66s/it, loss=0.147, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00242, train/loss_step=0.391, global_step=5987.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  83%|████████▎ | 998/1208 [27:35<05:48,  1.66s/it, loss=0.142, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000528, train/loss_step=0.158, global_step=5987.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  83%|████████▎ | 999/1208 [27:36<05:46,  1.66s/it, loss=0.142, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000528, train/loss_step=0.158, global_step=5987.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  83%|████████▎ | 999/1208 [27:36<05:46,  1.66s/it, loss=0.162, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00434, train/loss_step=0.454, global_step=5987.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  83%|████████▎ | 1000/1208 [27:39<05:45,  1.66s/it, loss=0.162, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00434, train/loss_step=0.454, global_step=5987.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  83%|████████▎ | 1000/1208 [27:39<05:45,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.87e-5, train/loss_step=0.0188, global_step=5987.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  83%|████████▎ | 1001/1208 [27:40<05:43,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.87e-5, train/loss_step=0.0188, global_step=5987.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  83%|████████▎ | 1001/1208 [27:40<05:43,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=5988.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  83%|████████▎ | 1002/1208 [27:41<05:41,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=5988.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  83%|████████▎ | 1002/1208 [27:41<05:41,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00228, train/loss_vlb_step=1.32e-5, train/loss_step=0.00228, global_step=5988.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  83%|████████▎ | 1003/1208 [27:42<05:39,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00228, train/loss_vlb_step=1.32e-5, train/loss_step=0.00228, global_step=5988.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  83%|████████▎ | 1003/1208 [27:42<05:39,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.61e-5, train/loss_step=0.00286, global_step=5988.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  83%|████████▎ | 1004/1208 [27:45<05:38,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.61e-5, train/loss_step=0.00286, global_step=5988.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  83%|████████▎ | 1004/1208 [27:45<05:38,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0354, train/loss_vlb_step=0.000135, train/loss_step=0.0354, global_step=5988.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  83%|████████▎ | 1005/1208 [27:46<05:36,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0354, train/loss_vlb_step=0.000135, train/loss_step=0.0354, global_step=5988.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  83%|████████▎ | 1005/1208 [27:46<05:36,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.000975, train/loss_step=0.243, global_step=5989.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  83%|████████▎ | 1006/1208 [27:47<05:34,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.000975, train/loss_step=0.243, global_step=5989.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  83%|████████▎ | 1006/1208 [27:47<05:34,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=1.66e-5, train/loss_step=0.00294, global_step=5989.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  83%|████████▎ | 1007/1208 [27:48<05:32,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=1.66e-5, train/loss_step=0.00294, global_step=5989.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  83%|████████▎ | 1007/1208 [27:48<05:32,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.643, train/loss_vlb_step=0.0279, train/loss_step=0.643, global_step=5989.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  83%|████████▎ | 1008/1208 [27:51<05:31,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.643, train/loss_vlb_step=0.0279, train/loss_step=0.643, global_step=5989.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  83%|████████▎ | 1008/1208 [27:51<05:31,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000433, train/loss_step=0.131, global_step=5989.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  84%|████████▎ | 1009/1208 [27:52<05:29,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000433, train/loss_step=0.131, global_step=5989.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  84%|████████▎ | 1009/1208 [27:52<05:29,  1.66s/it, loss=0.193, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.00444, train/loss_step=0.470, global_step=5990.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  84%|████████▎ | 1010/1208 [27:53<05:28,  1.66s/it, loss=0.193, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.00444, train/loss_step=0.470, global_step=5990.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  84%|████████▎ | 1010/1208 [27:53<05:28,  1.66s/it, loss=0.175, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000373, train/loss_step=0.114, global_step=5990.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  84%|████████▎ | 1011/1208 [27:54<05:26,  1.66s/it, loss=0.175, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000373, train/loss_step=0.114, global_step=5990.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  84%|████████▎ | 1011/1208 [27:54<05:26,  1.66s/it, loss=0.18, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.00034, train/loss_step=0.103, global_step=5990.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  84%|████████▍ | 1012/1208 [27:57<05:24,  1.66s/it, loss=0.18, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.00034, train/loss_step=0.103, global_step=5990.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  84%|████████▍ | 1012/1208 [27:57<05:24,  1.66s/it, loss=0.186, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.00261, train/loss_step=0.406, global_step=5990.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  84%|████████▍ | 1013/1208 [27:58<05:23,  1.66s/it, loss=0.186, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.00261, train/loss_step=0.406, global_step=5990.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  84%|████████▍ | 1013/1208 [27:58<05:23,  1.66s/it, loss=0.187, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.42e-5, train/loss_step=0.021, global_step=5991.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  84%|████████▍ | 1014/1208 [27:59<05:21,  1.66s/it, loss=0.187, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.42e-5, train/loss_step=0.021, global_step=5991.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  84%|████████▍ | 1014/1208 [27:59<05:21,  1.66s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0585, train/loss_vlb_step=0.0002, train/loss_step=0.0585, global_step=5991.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  84%|████████▍ | 1015/1208 [28:00<05:19,  1.66s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0585, train/loss_vlb_step=0.0002, train/loss_step=0.0585, global_step=5991.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  84%|████████▍ | 1015/1208 [28:00<05:19,  1.66s/it, loss=0.196, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000858, train/loss_step=0.232, global_step=5991.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  84%|████████▍ | 1016/1208 [28:04<05:18,  1.66s/it, loss=0.196, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000858, train/loss_step=0.232, global_step=5991.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  84%|████████▍ | 1016/1208 [28:04<05:18,  1.66s/it, loss=0.192, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.00119, train/loss_step=0.236, global_step=5991.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  84%|████████▍ | 1017/1208 [28:05<05:16,  1.66s/it, loss=0.192, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.00119, train/loss_step=0.236, global_step=5991.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  84%|████████▍ | 1017/1208 [28:05<05:16,  1.66s/it, loss=0.178, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=5992.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  84%|████████▍ | 1018/1208 [28:06<05:14,  1.66s/it, loss=0.178, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=5992.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  84%|████████▍ | 1018/1208 [28:06<05:14,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000286, train/loss_step=0.087, global_step=5992.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  84%|████████▍ | 1019/1208 [28:07<05:12,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000286, train/loss_step=0.087, global_step=5992.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  84%|████████▍ | 1019/1208 [28:07<05:12,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.00058, train/loss_step=0.171, global_step=5992.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  84%|████████▍ | 1020/1208 [28:10<05:11,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.00058, train/loss_step=0.171, global_step=5992.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  84%|████████▍ | 1020/1208 [28:10<05:11,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000839, train/loss_step=0.226, global_step=5992.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  85%|████████▍ | 1021/1208 [28:11<05:09,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000839, train/loss_step=0.226, global_step=5992.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  85%|████████▍ | 1021/1208 [28:11<05:09,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0714, train/loss_vlb_step=0.00024, train/loss_step=0.0714, global_step=5993.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  85%|████████▍ | 1022/1208 [28:12<05:08,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0714, train/loss_vlb_step=0.00024, train/loss_step=0.0714, global_step=5993.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  85%|████████▍ | 1022/1208 [28:12<05:08,  1.66s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00653, train/loss_vlb_step=3.33e-5, train/loss_step=0.00653, global_step=5993.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  85%|████████▍ | 1023/1208 [28:13<05:06,  1.66s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00653, train/loss_vlb_step=3.33e-5, train/loss_step=0.00653, global_step=5993.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  85%|████████▍ | 1023/1208 [28:13<05:06,  1.66s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00863, train/loss_vlb_step=4.15e-5, train/loss_step=0.00863, global_step=5993.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  85%|████████▍ | 1024/1208 [28:16<05:04,  1.66s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00863, train/loss_vlb_step=4.15e-5, train/loss_step=0.00863, global_step=5993.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  85%|████████▍ | 1024/1208 [28:16<05:04,  1.66s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.37e-5, train/loss_step=0.00235, global_step=5993.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  85%|████████▍ | 1025/1208 [28:17<05:03,  1.66s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.37e-5, train/loss_step=0.00235, global_step=5993.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  85%|████████▍ | 1025/1208 [28:17<05:03,  1.66s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000147, train/loss_step=0.0405, global_step=5994.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  85%|████████▍ | 1026/1208 [28:18<05:01,  1.66s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000147, train/loss_step=0.0405, global_step=5994.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  85%|████████▍ | 1026/1208 [28:18<05:01,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000226, train/loss_step=0.0676, global_step=5994.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  85%|████████▌ | 1027/1208 [28:19<04:59,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000226, train/loss_step=0.0676, global_step=5994.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  85%|████████▌ | 1027/1208 [28:19<04:59,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000502, train/loss_step=0.146, global_step=5994.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  85%|████████▌ | 1028/1208 [28:23<04:58,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000502, train/loss_step=0.146, global_step=5994.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  85%|████████▌ | 1028/1208 [28:23<04:58,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=2e-5, train/loss_step=0.00363, global_step=5994.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  85%|████████▌ | 1029/1208 [28:24<04:56,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=2e-5, train/loss_step=0.00363, global_step=5994.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  85%|████████▌ | 1029/1208 [28:24<04:56,  1.66s/it, loss=0.113, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000488, train/loss_step=0.145, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  85%|████████▌ | 1030/1208 [28:25<04:54,  1.66s/it, loss=0.113, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000488, train/loss_step=0.145, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  85%|████████▌ | 1030/1208 [28:25<04:54,  1.66s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0966, train/loss_vlb_step=0.000317, train/loss_step=0.0966, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  85%|████████▌ | 1031/1208 [28:26<04:52,  1.65s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0966, train/loss_vlb_step=0.000317, train/loss_step=0.0966, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  85%|████████▌ | 1031/1208 [28:26<04:52,  1.65s/it, loss=0.12, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.0011, train/loss_step=0.257, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]     Epoch 19:  85%|████████▌ | 1032/1208 [28:29<04:51,  1.66s/it, loss=0.12, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.0011, train/loss_step=0.257, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  85%|████████▌ | 1032/1208 [28:29<04:51,  1.66s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.16e-5, train/loss_step=0.00198, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  86%|████████▌ | 1033/1208 [28:30<04:49,  1.66s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.16e-5, train/loss_step=0.00198, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  86%|████████▌ | 1033/1208 [28:30<04:49,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.559, train/loss_vlb_step=0.00847, train/loss_step=0.559, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]     Epoch 19:  86%|████████▌ | 1034/1208 [28:31<04:47,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.559, train/loss_vlb_step=0.00847, train/loss_step=0.559, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  86%|████████▌ | 1034/1208 [28:31<04:47,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000369, train/loss_step=0.110, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  86%|████████▌ | 1035/1208 [28:32<04:46,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000369, train/loss_step=0.110, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  86%|████████▌ | 1035/1208 [28:32<04:46,  1.65s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000139, train/loss_step=0.0381, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  86%|████████▌ | 1036/1208 [28:35<04:44,  1.66s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000139, train/loss_step=0.0381, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  86%|████████▌ | 1036/1208 [28:35<04:44,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00536, train/loss_vlb_step=2.74e-5, train/loss_step=0.00536, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  86%|████████▌ | 1037/1208 [28:36<04:42,  1.65s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00536, train/loss_vlb_step=2.74e-5, train/loss_step=0.00536, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  86%|████████▌ | 1037/1208 [28:36<04:42,  1.65s/it, loss=0.12, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00216, train/loss_step=0.361, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]     Epoch 19:  86%|████████▌ | 1038/1208 [28:37<04:41,  1.65s/it, loss=0.12, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00216, train/loss_step=0.361, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  86%|████████▌ | 1038/1208 [28:37<04:41,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.00329, train/loss_step=0.470, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  86%|████████▌ | 1039/1208 [28:38<04:39,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.00329, train/loss_step=0.470, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  86%|████████▌ | 1039/1208 [28:38<04:39,  1.65s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00513, train/loss_vlb_step=2.66e-5, train/loss_step=0.00513, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  86%|████████▌ | 1040/1208 [28:40<04:38,  1.65s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00513, train/loss_vlb_step=2.66e-5, train/loss_step=0.00513, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  86%|████████▌ | 1040/1208 [28:40<04:38,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.004, train/loss_step=0.385, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]      Epoch 19:  86%|████████▌ | 1041/1208 [28:41<04:36,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.004, train/loss_step=0.385, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  86%|████████▌ | 1041/1208 [28:41<04:36,  1.65s/it, loss=0.147, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000995, train/loss_step=0.226, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  86%|████████▋ | 1042/1208 [28:42<04:34,  1.65s/it, loss=0.147, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000995, train/loss_step=0.226, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  86%|████████▋ | 1042/1208 [28:42<04:34,  1.65s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.03e-5, train/loss_step=0.00174, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  86%|████████▋ | 1043/1208 [28:44<04:32,  1.65s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.03e-5, train/loss_step=0.00174, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  86%|████████▋ | 1043/1208 [28:44<04:32,  1.65s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0958, train/loss_vlb_step=0.000315, train/loss_step=0.0958, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  86%|████████▋ | 1044/1208 [28:46<04:31,  1.65s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0958, train/loss_vlb_step=0.000315, train/loss_step=0.0958, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  86%|████████▋ | 1044/1208 [28:46<04:31,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000763, train/loss_step=0.202, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  87%|████████▋ | 1045/1208 [28:47<04:29,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000763, train/loss_step=0.202, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  87%|████████▋ | 1045/1208 [28:47<04:29,  1.65s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=1.55e-5, train/loss_step=0.00276, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  87%|████████▋ | 1046/1208 [28:48<04:27,  1.65s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=1.55e-5, train/loss_step=0.00276, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  87%|████████▋ | 1046/1208 [28:48<04:27,  1.65s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.91e-5, train/loss_step=0.0161, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  87%|████████▋ | 1047/1208 [28:49<04:26,  1.65s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.91e-5, train/loss_step=0.0161, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  87%|████████▋ | 1047/1208 [28:49<04:26,  1.65s/it, loss=0.177, v_num=0, train/loss_simple_step=0.558, train/loss_vlb_step=0.0131, train/loss_step=0.558, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  87%|████████▋ | 1048/1208 [28:52<04:24,  1.65s/it, loss=0.177, v_num=0, train/loss_simple_step=0.558, train/loss_vlb_step=0.0131, train/loss_step=0.558, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  87%|████████▋ | 1048/1208 [28:52<04:24,  1.65s/it, loss=0.191, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00136, train/loss_step=0.281, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  87%|████████▋ | 1049/1208 [28:53<04:22,  1.65s/it, loss=0.191, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00136, train/loss_step=0.281, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  87%|████████▋ | 1049/1208 [28:53<04:22,  1.65s/it, loss=0.191, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000494, train/loss_step=0.142, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  87%|████████▋ | 1050/1208 [28:54<04:21,  1.65s/it, loss=0.191, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000494, train/loss_step=0.142, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  87%|████████▋ | 1050/1208 [28:54<04:21,  1.65s/it, loss=0.204, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00259, train/loss_step=0.355, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  87%|████████▋ | 1051/1208 [28:55<04:19,  1.65s/it, loss=0.204, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00259, train/loss_step=0.355, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  87%|████████▋ | 1051/1208 [28:55<04:19,  1.65s/it, loss=0.199, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000542, train/loss_step=0.156, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  87%|████████▋ | 1052/1208 [28:58<04:17,  1.65s/it, loss=0.199, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000542, train/loss_step=0.156, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  87%|████████▋ | 1052/1208 [28:58<04:17,  1.65s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000199, train/loss_step=0.0555, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  87%|████████▋ | 1053/1208 [28:59<04:16,  1.65s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000199, train/loss_step=0.0555, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  87%|████████▋ | 1053/1208 [28:59<04:16,  1.65s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0823, train/loss_vlb_step=0.000274, train/loss_step=0.0823, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  87%|████████▋ | 1054/1208 [29:00<04:14,  1.65s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0823, train/loss_vlb_step=0.000274, train/loss_step=0.0823, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  87%|████████▋ | 1054/1208 [29:00<04:14,  1.65s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.01e-5, train/loss_step=0.0198, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  87%|████████▋ | 1055/1208 [29:01<04:12,  1.65s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.01e-5, train/loss_step=0.0198, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  87%|████████▋ | 1055/1208 [29:01<04:12,  1.65s/it, loss=0.176, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000337, train/loss_step=0.102, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  87%|████████▋ | 1056/1208 [29:04<04:11,  1.65s/it, loss=0.176, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000337, train/loss_step=0.102, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  87%|████████▋ | 1056/1208 [29:04<04:11,  1.65s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.32e-5, train/loss_step=0.0231, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  88%|████████▊ | 1057/1208 [29:05<04:09,  1.65s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.32e-5, train/loss_step=0.0231, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  88%|████████▊ | 1057/1208 [29:05<04:09,  1.65s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=1.51e-5, train/loss_step=0.00263, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  88%|████████▊ | 1058/1208 [29:07<04:07,  1.65s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=1.51e-5, train/loss_step=0.00263, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  88%|████████▊ | 1058/1208 [29:07<04:07,  1.65s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.33e-5, train/loss_step=0.0233, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  88%|████████▊ | 1059/1208 [29:08<04:05,  1.65s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.33e-5, train/loss_step=0.0233, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  88%|████████▊ | 1059/1208 [29:08<04:05,  1.65s/it, loss=0.157, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00243, train/loss_step=0.404, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  88%|████████▊ | 1060/1208 [29:11<04:04,  1.65s/it, loss=0.157, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00243, train/loss_step=0.404, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  88%|████████▊ | 1060/1208 [29:11<04:04,  1.65s/it, loss=0.146, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000609, train/loss_step=0.174, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  88%|████████▊ | 1061/1208 [29:12<04:02,  1.65s/it, loss=0.146, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000609, train/loss_step=0.174, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  88%|████████▊ | 1061/1208 [29:12<04:02,  1.65s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00623, train/loss_vlb_step=3.14e-5, train/loss_step=0.00623, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  88%|████████▊ | 1062/1208 [29:13<04:01,  1.65s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00623, train/loss_vlb_step=3.14e-5, train/loss_step=0.00623, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  88%|████████▊ | 1062/1208 [29:13<04:01,  1.65s/it, loss=0.141, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  88%|████████▊ | 1063/1208 [29:14<03:59,  1.65s/it, loss=0.141, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  88%|████████▊ | 1063/1208 [29:14<03:59,  1.65s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00612, train/loss_vlb_step=3.06e-5, train/loss_step=0.00612, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  88%|████████▊ | 1064/1208 [29:17<03:57,  1.65s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00612, train/loss_vlb_step=3.06e-5, train/loss_step=0.00612, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  88%|████████▊ | 1064/1208 [29:17<03:57,  1.65s/it, loss=0.142, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00162, train/loss_step=0.328, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  88%|████████▊ | 1065/1208 [29:18<03:56,  1.65s/it, loss=0.142, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00162, train/loss_step=0.328, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  88%|████████▊ | 1065/1208 [29:18<03:56,  1.65s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.46e-5, train/loss_step=0.0146, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  88%|████████▊ | 1066/1208 [29:19<03:54,  1.65s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.46e-5, train/loss_step=0.0146, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  88%|████████▊ | 1066/1208 [29:19<03:54,  1.65s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00639, train/loss_vlb_step=3.12e-5, train/loss_step=0.00639, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  88%|████████▊ | 1067/1208 [29:20<03:52,  1.65s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00639, train/loss_vlb_step=3.12e-5, train/loss_step=0.00639, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  88%|████████▊ | 1067/1208 [29:20<03:52,  1.65s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0658, train/loss_vlb_step=0.000222, train/loss_step=0.0658, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  88%|████████▊ | 1068/1208 [29:23<03:51,  1.65s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0658, train/loss_vlb_step=0.000222, train/loss_step=0.0658, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  88%|████████▊ | 1068/1208 [29:23<03:51,  1.65s/it, loss=0.104, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.69e-5, train/loss_step=0.003, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  88%|████████▊ | 1069/1208 [29:24<03:49,  1.65s/it, loss=0.104, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.69e-5, train/loss_step=0.003, global_step=6e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  88%|████████▊ | 1069/1208 [29:24<03:49,  1.65s/it, loss=0.103, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=6005.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  89%|████████▊ | 1070/1208 [29:25<03:47,  1.65s/it, loss=0.103, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=6005.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  89%|████████▊ | 1070/1208 [29:26<03:47,  1.65s/it, loss=0.108, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00596, train/loss_step=0.458, global_step=6005.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  89%|████████▊ | 1071/1208 [29:27<03:46,  1.65s/it, loss=0.108, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00596, train/loss_step=0.458, global_step=6005.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  89%|████████▊ | 1071/1208 [29:27<03:46,  1.65s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=1.38e-5, train/loss_step=0.00239, global_step=6005.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  89%|████████▊ | 1072/1208 [29:30<03:44,  1.65s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=1.38e-5, train/loss_step=0.00239, global_step=6005.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  89%|████████▊ | 1072/1208 [29:30<03:44,  1.65s/it, loss=0.103, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=6005.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  89%|████████▉ | 1073/1208 [29:31<03:42,  1.65s/it, loss=0.103, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=6005.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  89%|████████▉ | 1073/1208 [29:31<03:42,  1.65s/it, loss=0.102, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000173, train/loss_step=0.050, global_step=6006.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  89%|████████▉ | 1074/1208 [29:32<03:41,  1.65s/it, loss=0.102, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000173, train/loss_step=0.050, global_step=6006.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  89%|████████▉ | 1074/1208 [29:32<03:41,  1.65s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0528, train/loss_vlb_step=0.000188, train/loss_step=0.0528, global_step=6006.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  89%|████████▉ | 1075/1208 [29:33<03:39,  1.65s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0528, train/loss_vlb_step=0.000188, train/loss_step=0.0528, global_step=6006.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  89%|████████▉ | 1075/1208 [29:33<03:39,  1.65s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.37e-5, train/loss_step=0.0194, global_step=6006.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  89%|████████▉ | 1076/1208 [29:36<03:37,  1.65s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.37e-5, train/loss_step=0.0194, global_step=6006.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  89%|████████▉ | 1076/1208 [29:36<03:37,  1.65s/it, loss=0.104, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=6006.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  89%|████████▉ | 1077/1208 [29:37<03:36,  1.65s/it, loss=0.104, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=6006.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  89%|████████▉ | 1077/1208 [29:37<03:36,  1.65s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0087, train/loss_vlb_step=4.29e-5, train/loss_step=0.0087, global_step=6007.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  89%|████████▉ | 1078/1208 [29:38<03:34,  1.65s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0087, train/loss_vlb_step=4.29e-5, train/loss_step=0.0087, global_step=6007.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  89%|████████▉ | 1078/1208 [29:38<03:34,  1.65s/it, loss=0.122, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00241, train/loss_step=0.376, global_step=6007.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  89%|████████▉ | 1079/1208 [29:39<03:32,  1.65s/it, loss=0.122, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00241, train/loss_step=0.376, global_step=6007.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  89%|████████▉ | 1079/1208 [29:39<03:32,  1.65s/it, loss=0.12, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.0018, train/loss_step=0.373, global_step=6007.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  89%|████████▉ | 1080/1208 [29:42<03:31,  1.65s/it, loss=0.12, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.0018, train/loss_step=0.373, global_step=6007.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  89%|████████▉ | 1080/1208 [29:42<03:31,  1.65s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.87e-5, train/loss_step=0.0132, global_step=6007.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  89%|████████▉ | 1081/1208 [29:43<03:29,  1.65s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.87e-5, train/loss_step=0.0132, global_step=6007.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  89%|████████▉ | 1081/1208 [29:43<03:29,  1.65s/it, loss=0.12, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000546, train/loss_step=0.162, global_step=6008.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  90%|████████▉ | 1082/1208 [29:44<03:27,  1.65s/it, loss=0.12, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000546, train/loss_step=0.162, global_step=6008.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  90%|████████▉ | 1082/1208 [29:44<03:27,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.24e-5, train/loss_step=0.0115, global_step=6008.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  90%|████████▉ | 1083/1208 [29:46<03:26,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.24e-5, train/loss_step=0.0115, global_step=6008.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  90%|████████▉ | 1083/1208 [29:46<03:26,  1.65s/it, loss=0.123, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000578, train/loss_step=0.166, global_step=6008.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  90%|████████▉ | 1084/1208 [29:49<03:24,  1.65s/it, loss=0.123, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000578, train/loss_step=0.166, global_step=6008.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  90%|████████▉ | 1084/1208 [29:49<03:24,  1.65s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000104, train/loss_step=0.0272, global_step=6008.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  90%|████████▉ | 1085/1208 [29:50<03:22,  1.65s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000104, train/loss_step=0.0272, global_step=6008.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  90%|████████▉ | 1085/1208 [29:50<03:22,  1.65s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00487, train/loss_vlb_step=2.6e-5, train/loss_step=0.00487, global_step=6009.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  90%|████████▉ | 1086/1208 [29:51<03:21,  1.65s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00487, train/loss_vlb_step=2.6e-5, train/loss_step=0.00487, global_step=6009.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  90%|████████▉ | 1086/1208 [29:51<03:21,  1.65s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0922, train/loss_vlb_step=0.000304, train/loss_step=0.0922, global_step=6009.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  90%|████████▉ | 1087/1208 [29:52<03:19,  1.65s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0922, train/loss_vlb_step=0.000304, train/loss_step=0.0922, global_step=6009.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  90%|████████▉ | 1087/1208 [29:52<03:19,  1.65s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00332, train/loss_vlb_step=1.87e-5, train/loss_step=0.00332, global_step=6009.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  90%|█████████ | 1088/1208 [29:55<03:18,  1.65s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00332, train/loss_vlb_step=1.87e-5, train/loss_step=0.00332, global_step=6009.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  90%|█████████ | 1088/1208 [29:55<03:18,  1.65s/it, loss=0.114, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=6009.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  90%|█████████ | 1089/1208 [29:56<03:16,  1.65s/it, loss=0.114, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=6009.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  90%|█████████ | 1089/1208 [29:56<03:16,  1.65s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00765, train/loss_vlb_step=3.77e-5, train/loss_step=0.00765, global_step=6010.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  90%|█████████ | 1090/1208 [29:57<03:14,  1.65s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00765, train/loss_vlb_step=3.77e-5, train/loss_step=0.00765, global_step=6010.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  90%|█████████ | 1090/1208 [29:57<03:14,  1.65s/it, loss=0.0863, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=9.45e-5, train/loss_step=0.0249, global_step=6010.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  90%|█████████ | 1091/1208 [29:58<03:12,  1.65s/it, loss=0.0863, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=9.45e-5, train/loss_step=0.0249, global_step=6010.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  90%|█████████ | 1091/1208 [29:58<03:12,  1.65s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000351, train/loss_step=0.107, global_step=6010.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  90%|█████████ | 1092/1208 [30:01<03:11,  1.65s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000351, train/loss_step=0.107, global_step=6010.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  90%|█████████ | 1092/1208 [30:01<03:11,  1.65s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00107, train/loss_step=0.250, global_step=6010.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  90%|█████████ | 1093/1208 [30:02<03:09,  1.65s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00107, train/loss_step=0.250, global_step=6010.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  90%|█████████ | 1093/1208 [30:02<03:09,  1.65s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.00628, train/loss_vlb_step=3.1e-5, train/loss_step=0.00628, global_step=6011.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  91%|█████████ | 1094/1208 [30:03<03:07,  1.65s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.00628, train/loss_vlb_step=3.1e-5, train/loss_step=0.00628, global_step=6011.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  91%|█████████ | 1094/1208 [30:03<03:07,  1.65s/it, loss=0.106, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.00089, train/loss_step=0.240, global_step=6011.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  91%|█████████ | 1095/1208 [30:04<03:06,  1.65s/it, loss=0.106, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.00089, train/loss_step=0.240, global_step=6011.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  91%|█████████ | 1095/1208 [30:04<03:06,  1.65s/it, loss=0.118, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00148, train/loss_step=0.270, global_step=6011.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  91%|█████████ | 1096/1208 [30:08<03:04,  1.65s/it, loss=0.118, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00148, train/loss_step=0.270, global_step=6011.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  91%|█████████ | 1096/1208 [30:08<03:04,  1.65s/it, loss=0.145, v_num=0, train/loss_simple_step=0.646, train/loss_vlb_step=0.0213, train/loss_step=0.646, global_step=6011.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  91%|█████████ | 1097/1208 [30:09<03:03,  1.65s/it, loss=0.145, v_num=0, train/loss_simple_step=0.646, train/loss_vlb_step=0.0213, train/loss_step=0.646, global_step=6011.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  91%|█████████ | 1097/1208 [30:09<03:03,  1.65s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.55e-5, train/loss_step=0.0152, global_step=6012.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  91%|█████████ | 1098/1208 [30:10<03:01,  1.65s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.55e-5, train/loss_step=0.0152, global_step=6012.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  91%|█████████ | 1098/1208 [30:10<03:01,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0784, train/loss_vlb_step=0.000259, train/loss_step=0.0784, global_step=6012.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  91%|█████████ | 1099/1208 [30:11<02:59,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0784, train/loss_vlb_step=0.000259, train/loss_step=0.0784, global_step=6012.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  91%|█████████ | 1099/1208 [30:11<02:59,  1.65s/it, loss=0.117, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=6012.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  91%|█████████ | 1100/1208 [30:14<02:58,  1.65s/it, loss=0.117, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=6012.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  91%|█████████ | 1100/1208 [30:14<02:58,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00139, train/loss_step=0.292, global_step=6012.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  91%|█████████ | 1101/1208 [30:15<02:56,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00139, train/loss_step=0.292, global_step=6012.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  91%|█████████ | 1101/1208 [30:15<02:56,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0656, train/loss_vlb_step=0.000226, train/loss_step=0.0656, global_step=6013.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  91%|█████████ | 1102/1208 [30:16<02:54,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0656, train/loss_vlb_step=0.000226, train/loss_step=0.0656, global_step=6013.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  91%|█████████ | 1102/1208 [30:16<02:54,  1.65s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00316, train/loss_vlb_step=1.86e-5, train/loss_step=0.00316, global_step=6013.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  91%|█████████▏| 1103/1208 [30:17<02:53,  1.65s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00316, train/loss_vlb_step=1.86e-5, train/loss_step=0.00316, global_step=6013.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  91%|█████████▏| 1103/1208 [30:17<02:53,  1.65s/it, loss=0.137, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00481, train/loss_step=0.399, global_step=6013.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  91%|█████████▏| 1104/1208 [30:20<02:51,  1.65s/it, loss=0.137, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00481, train/loss_step=0.399, global_step=6013.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  91%|█████████▏| 1104/1208 [30:20<02:51,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00192, train/loss_step=0.335, global_step=6013.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  91%|█████████▏| 1105/1208 [30:21<02:49,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00192, train/loss_step=0.335, global_step=6013.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  91%|█████████▏| 1105/1208 [30:21<02:49,  1.65s/it, loss=0.167, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00114, train/loss_step=0.290, global_step=6014.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  92%|█████████▏| 1106/1208 [30:22<02:48,  1.65s/it, loss=0.167, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00114, train/loss_step=0.290, global_step=6014.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  92%|█████████▏| 1106/1208 [30:22<02:48,  1.65s/it, loss=0.179, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00192, train/loss_step=0.337, global_step=6014.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  92%|█████████▏| 1107/1208 [30:23<02:46,  1.65s/it, loss=0.179, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00192, train/loss_step=0.337, global_step=6014.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  92%|█████████▏| 1107/1208 [30:23<02:46,  1.65s/it, loss=0.184, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=6014.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  92%|█████████▏| 1108/1208 [30:27<02:44,  1.65s/it, loss=0.184, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=6014.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  92%|█████████▏| 1108/1208 [30:27<02:44,  1.65s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00364, train/loss_vlb_step=1.97e-5, train/loss_step=0.00364, global_step=6014.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  92%|█████████▏| 1109/1208 [30:28<02:43,  1.65s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00364, train/loss_vlb_step=1.97e-5, train/loss_step=0.00364, global_step=6014.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  92%|█████████▏| 1109/1208 [30:28<02:43,  1.65s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000118, train/loss_step=0.0308, global_step=6015.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  92%|█████████▏| 1110/1208 [30:29<02:41,  1.65s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000118, train/loss_step=0.0308, global_step=6015.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  92%|█████████▏| 1110/1208 [30:29<02:41,  1.65s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0384, train/loss_vlb_step=0.000144, train/loss_step=0.0384, global_step=6015.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  92%|█████████▏| 1111/1208 [30:30<02:39,  1.65s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0384, train/loss_vlb_step=0.000144, train/loss_step=0.0384, global_step=6015.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  92%|█████████▏| 1111/1208 [30:30<02:39,  1.65s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.34e-5, train/loss_step=0.00225, global_step=6015.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  92%|█████████▏| 1112/1208 [30:33<02:38,  1.65s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.34e-5, train/loss_step=0.00225, global_step=6015.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  92%|█████████▏| 1112/1208 [30:33<02:38,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=1.27e-5, train/loss_step=0.00221, global_step=6015.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  92%|█████████▏| 1113/1208 [30:34<02:36,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=1.27e-5, train/loss_step=0.00221, global_step=6015.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  92%|█████████▏| 1113/1208 [30:34<02:36,  1.65s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.000143, train/loss_step=0.0401, global_step=6016.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  92%|█████████▏| 1114/1208 [30:35<02:34,  1.65s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.000143, train/loss_step=0.0401, global_step=6016.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  92%|█████████▏| 1114/1208 [30:35<02:34,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=6016.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  92%|█████████▏| 1115/1208 [30:36<02:33,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=6016.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  92%|█████████▏| 1115/1208 [30:36<02:33,  1.65s/it, loss=0.179, v_num=0, train/loss_simple_step=0.680, train/loss_vlb_step=0.0437, train/loss_step=0.680, global_step=6016.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  92%|█████████▏| 1116/1208 [30:39<02:31,  1.65s/it, loss=0.179, v_num=0, train/loss_simple_step=0.680, train/loss_vlb_step=0.0437, train/loss_step=0.680, global_step=6016.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  92%|█████████▏| 1116/1208 [30:39<02:31,  1.65s/it, loss=0.156, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000666, train/loss_step=0.183, global_step=6016.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  92%|█████████▏| 1117/1208 [30:40<02:29,  1.65s/it, loss=0.156, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000666, train/loss_step=0.183, global_step=6016.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  92%|█████████▏| 1117/1208 [30:40<02:29,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.061, train/loss_vlb_step=0.000205, train/loss_step=0.061, global_step=6017.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  93%|█████████▎| 1118/1208 [30:41<02:28,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.061, train/loss_vlb_step=0.000205, train/loss_step=0.061, global_step=6017.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  93%|█████████▎| 1118/1208 [30:41<02:28,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000578, train/loss_step=0.168, global_step=6017.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  93%|█████████▎| 1119/1208 [30:42<02:26,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000578, train/loss_step=0.168, global_step=6017.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  93%|█████████▎| 1119/1208 [30:42<02:26,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00529, train/loss_vlb_step=2.72e-5, train/loss_step=0.00529, global_step=6017.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  93%|█████████▎| 1120/1208 [30:45<02:25,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00529, train/loss_vlb_step=2.72e-5, train/loss_step=0.00529, global_step=6017.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  93%|█████████▎| 1120/1208 [30:46<02:25,  1.65s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.46e-5, train/loss_step=0.00244, global_step=6017.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  93%|█████████▎| 1121/1208 [30:47<02:23,  1.65s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.46e-5, train/loss_step=0.00244, global_step=6017.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  93%|█████████▎| 1121/1208 [30:47<02:23,  1.65s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00968, train/loss_vlb_step=4.59e-5, train/loss_step=0.00968, global_step=6018.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  93%|█████████▎| 1122/1208 [30:48<02:21,  1.65s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00968, train/loss_vlb_step=4.59e-5, train/loss_step=0.00968, global_step=6018.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  93%|█████████▎| 1122/1208 [30:48<02:21,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000821, train/loss_step=0.239, global_step=6018.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  93%|█████████▎| 1123/1208 [30:49<02:19,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000821, train/loss_step=0.239, global_step=6018.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  93%|█████████▎| 1123/1208 [30:49<02:19,  1.65s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=2.01e-5, train/loss_step=0.00365, global_step=6018.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  93%|█████████▎| 1124/1208 [30:52<02:18,  1.65s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=2.01e-5, train/loss_step=0.00365, global_step=6018.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  93%|█████████▎| 1124/1208 [30:52<02:18,  1.65s/it, loss=0.138, v_num=0, train/loss_simple_step=0.441, train/loss_vlb_step=0.00521, train/loss_step=0.441, global_step=6018.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  93%|█████████▎| 1125/1208 [30:53<02:16,  1.65s/it, loss=0.138, v_num=0, train/loss_simple_step=0.441, train/loss_vlb_step=0.00521, train/loss_step=0.441, global_step=6018.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  93%|█████████▎| 1125/1208 [30:53<02:16,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0473, train/loss_vlb_step=0.000166, train/loss_step=0.0473, global_step=6019.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  93%|█████████▎| 1126/1208 [30:54<02:15,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0473, train/loss_vlb_step=0.000166, train/loss_step=0.0473, global_step=6019.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  93%|█████████▎| 1126/1208 [30:54<02:15,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00356, train/loss_step=0.411, global_step=6019.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  93%|█████████▎| 1127/1208 [30:55<02:13,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00356, train/loss_step=0.411, global_step=6019.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  93%|█████████▎| 1127/1208 [30:55<02:13,  1.65s/it, loss=0.145, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00463, train/loss_step=0.432, global_step=6019.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  93%|█████████▎| 1128/1208 [30:58<02:11,  1.65s/it, loss=0.145, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00463, train/loss_step=0.432, global_step=6019.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  93%|█████████▎| 1128/1208 [30:58<02:11,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00206, train/loss_step=0.339, global_step=6019.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  93%|█████████▎| 1129/1208 [30:59<02:10,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00206, train/loss_step=0.339, global_step=6019.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  93%|█████████▎| 1129/1208 [30:59<02:10,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00638, train/loss_vlb_step=3.15e-5, train/loss_step=0.00638, global_step=6020.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  94%|█████████▎| 1130/1208 [31:00<02:08,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00638, train/loss_vlb_step=3.15e-5, train/loss_step=0.00638, global_step=6020.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  94%|█████████▎| 1130/1208 [31:00<02:08,  1.65s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.77e-5, train/loss_step=0.0243, global_step=6020.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  94%|█████████▎| 1131/1208 [31:01<02:06,  1.65s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.77e-5, train/loss_step=0.0243, global_step=6020.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  94%|█████████▎| 1131/1208 [31:01<02:06,  1.65s/it, loss=0.172, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.000966, train/loss_step=0.247, global_step=6020.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  94%|█████████▎| 1132/1208 [31:05<02:05,  1.65s/it, loss=0.172, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.000966, train/loss_step=0.247, global_step=6020.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  94%|█████████▎| 1132/1208 [31:05<02:05,  1.65s/it, loss=0.186, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00119, train/loss_step=0.270, global_step=6020.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  94%|█████████▍| 1133/1208 [31:06<02:03,  1.65s/it, loss=0.186, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00119, train/loss_step=0.270, global_step=6020.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  94%|█████████▍| 1133/1208 [31:06<02:03,  1.65s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.75e-5, train/loss_step=0.0133, global_step=6021.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  94%|█████████▍| 1134/1208 [31:07<02:01,  1.65s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.75e-5, train/loss_step=0.0133, global_step=6021.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  94%|█████████▍| 1134/1208 [31:07<02:01,  1.65s/it, loss=0.185, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000373, train/loss_step=0.113, global_step=6021.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  94%|█████████▍| 1135/1208 [31:08<02:00,  1.65s/it, loss=0.185, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000373, train/loss_step=0.113, global_step=6021.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  94%|█████████▍| 1135/1208 [31:08<02:00,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000442, train/loss_step=0.134, global_step=6021.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  94%|█████████▍| 1136/1208 [31:11<01:58,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000442, train/loss_step=0.134, global_step=6021.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  94%|█████████▍| 1136/1208 [31:11<01:58,  1.65s/it, loss=0.154, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=6021.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  94%|█████████▍| 1137/1208 [31:12<01:56,  1.65s/it, loss=0.154, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=6021.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  94%|█████████▍| 1137/1208 [31:12<01:56,  1.65s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.23e-5, train/loss_step=0.00202, global_step=6022.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  94%|█████████▍| 1138/1208 [31:13<01:55,  1.65s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.23e-5, train/loss_step=0.00202, global_step=6022.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  94%|█████████▍| 1138/1208 [31:13<01:55,  1.65s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0464, train/loss_vlb_step=0.000165, train/loss_step=0.0464, global_step=6022.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  94%|█████████▍| 1139/1208 [31:14<01:53,  1.65s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0464, train/loss_vlb_step=0.000165, train/loss_step=0.0464, global_step=6022.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  94%|█████████▍| 1139/1208 [31:14<01:53,  1.65s/it, loss=0.16, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00152, train/loss_step=0.304, global_step=6022.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  94%|█████████▍| 1140/1208 [31:17<01:51,  1.65s/it, loss=0.16, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00152, train/loss_step=0.304, global_step=6022.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  94%|█████████▍| 1140/1208 [31:17<01:51,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0518, train/loss_vlb_step=0.000185, train/loss_step=0.0518, global_step=6022.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  94%|█████████▍| 1141/1208 [31:18<01:50,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0518, train/loss_vlb_step=0.000185, train/loss_step=0.0518, global_step=6022.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  94%|█████████▍| 1141/1208 [31:18<01:50,  1.65s/it, loss=0.174, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000958, train/loss_step=0.238, global_step=6023.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  95%|█████████▍| 1142/1208 [31:19<01:48,  1.65s/it, loss=0.174, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000958, train/loss_step=0.238, global_step=6023.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  95%|█████████▍| 1142/1208 [31:19<01:48,  1.65s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000202, train/loss_step=0.0588, global_step=6023.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  95%|█████████▍| 1143/1208 [31:20<01:46,  1.65s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000202, train/loss_step=0.0588, global_step=6023.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  95%|█████████▍| 1143/1208 [31:20<01:46,  1.65s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.2e-5, train/loss_step=0.0197, global_step=6023.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  95%|█████████▍| 1144/1208 [31:23<01:45,  1.65s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.2e-5, train/loss_step=0.0197, global_step=6023.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  95%|█████████▍| 1144/1208 [31:23<01:45,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.39e-5, train/loss_step=0.021, global_step=6023.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  95%|█████████▍| 1145/1208 [31:24<01:43,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.39e-5, train/loss_step=0.021, global_step=6023.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  95%|█████████▍| 1145/1208 [31:24<01:43,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000138, train/loss_step=0.0373, global_step=6024.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  95%|█████████▍| 1146/1208 [31:25<01:41,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000138, train/loss_step=0.0373, global_step=6024.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  95%|█████████▍| 1146/1208 [31:25<01:42,  1.65s/it, loss=0.138, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00165, train/loss_step=0.297, global_step=6024.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  95%|█████████▍| 1147/1208 [31:26<01:40,  1.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00165, train/loss_step=0.297, global_step=6024.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  95%|█████████▍| 1147/1208 [31:26<01:40,  1.64s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00735, train/loss_vlb_step=3.51e-5, train/loss_step=0.00735, global_step=6024.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  95%|█████████▌| 1148/1208 [31:29<01:38,  1.65s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00735, train/loss_vlb_step=3.51e-5, train/loss_step=0.00735, global_step=6024.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  95%|█████████▌| 1148/1208 [31:29<01:38,  1.65s/it, loss=0.106, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000404, train/loss_step=0.123, global_step=6024.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  95%|█████████▌| 1149/1208 [31:30<01:37,  1.65s/it, loss=0.106, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000404, train/loss_step=0.123, global_step=6024.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  95%|█████████▌| 1149/1208 [31:30<01:37,  1.65s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.52e-5, train/loss_step=0.0117, global_step=6025.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  95%|█████████▌| 1150/1208 [31:31<01:35,  1.64s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.52e-5, train/loss_step=0.0117, global_step=6025.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  95%|█████████▌| 1150/1208 [31:31<01:35,  1.64s/it, loss=0.127, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00625, train/loss_step=0.432, global_step=6025.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  95%|█████████▌| 1151/1208 [31:32<01:33,  1.64s/it, loss=0.127, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00625, train/loss_step=0.432, global_step=6025.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  95%|█████████▌| 1151/1208 [31:32<01:33,  1.64s/it, loss=0.13, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00167, train/loss_step=0.301, global_step=6025.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  95%|█████████▌| 1152/1208 [31:35<01:32,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00167, train/loss_step=0.301, global_step=6025.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  95%|█████████▌| 1152/1208 [31:35<01:32,  1.65s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=1.98e-5, train/loss_step=0.00347, global_step=6025.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  95%|█████████▌| 1153/1208 [31:36<01:30,  1.64s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=1.98e-5, train/loss_step=0.00347, global_step=6025.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  95%|█████████▌| 1153/1208 [31:36<01:30,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00366, train/loss_step=0.436, global_step=6026.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  96%|█████████▌| 1154/1208 [31:37<01:28,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00366, train/loss_step=0.436, global_step=6026.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  96%|█████████▌| 1154/1208 [31:37<01:28,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00114, train/loss_step=0.264, global_step=6026.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  96%|█████████▌| 1155/1208 [31:38<01:27,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00114, train/loss_step=0.264, global_step=6026.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  96%|█████████▌| 1155/1208 [31:38<01:27,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.77e-5, train/loss_step=0.0228, global_step=6026.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  96%|█████████▌| 1156/1208 [31:41<01:25,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.77e-5, train/loss_step=0.0228, global_step=6026.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  96%|█████████▌| 1156/1208 [31:41<01:25,  1.64s/it, loss=0.142, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000557, train/loss_step=0.167, global_step=6026.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  96%|█████████▌| 1157/1208 [31:42<01:23,  1.64s/it, loss=0.142, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000557, train/loss_step=0.167, global_step=6026.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  96%|█████████▌| 1157/1208 [31:42<01:23,  1.64s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00466, train/loss_vlb_step=2.42e-5, train/loss_step=0.00466, global_step=6027.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  96%|█████████▌| 1158/1208 [31:43<01:22,  1.64s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00466, train/loss_vlb_step=2.42e-5, train/loss_step=0.00466, global_step=6027.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  96%|█████████▌| 1158/1208 [31:43<01:22,  1.64s/it, loss=0.153, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.0011, train/loss_step=0.254, global_step=6027.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]     Epoch 19:  96%|█████████▌| 1159/1208 [31:44<01:20,  1.64s/it, loss=0.153, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.0011, train/loss_step=0.254, global_step=6027.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  96%|█████████▌| 1159/1208 [31:44<01:20,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=9.7e-5, train/loss_step=0.0254, global_step=6027.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  96%|█████████▌| 1160/1208 [31:46<01:18,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=9.7e-5, train/loss_step=0.0254, global_step=6027.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  96%|█████████▌| 1160/1208 [31:46<01:18,  1.64s/it, loss=0.142, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000374, train/loss_step=0.114, global_step=6027.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  96%|█████████▌| 1161/1208 [31:47<01:17,  1.64s/it, loss=0.142, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000374, train/loss_step=0.114, global_step=6027.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  96%|█████████▌| 1161/1208 [31:48<01:17,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.82e-5, train/loss_step=0.0103, global_step=6028.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  96%|█████████▌| 1162/1208 [31:49<01:15,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.82e-5, train/loss_step=0.0103, global_step=6028.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  96%|█████████▌| 1162/1208 [31:49<01:15,  1.64s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0429, train/loss_vlb_step=0.000154, train/loss_step=0.0429, global_step=6028.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  96%|█████████▋| 1163/1208 [31:50<01:13,  1.64s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0429, train/loss_vlb_step=0.000154, train/loss_step=0.0429, global_step=6028.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  96%|█████████▋| 1163/1208 [31:50<01:13,  1.64s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.65e-5, train/loss_step=0.00291, global_step=6028.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  96%|█████████▋| 1164/1208 [31:52<01:12,  1.64s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.65e-5, train/loss_step=0.00291, global_step=6028.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  96%|█████████▋| 1164/1208 [31:52<01:12,  1.64s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.76e-5, train/loss_step=0.0208, global_step=6028.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  96%|█████████▋| 1165/1208 [31:53<01:10,  1.64s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.76e-5, train/loss_step=0.0208, global_step=6028.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  96%|█████████▋| 1165/1208 [31:53<01:10,  1.64s/it, loss=0.135, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000601, train/loss_step=0.167, global_step=6029.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  97%|█████████▋| 1166/1208 [31:54<01:08,  1.64s/it, loss=0.135, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000601, train/loss_step=0.167, global_step=6029.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  97%|█████████▋| 1166/1208 [31:54<01:08,  1.64s/it, loss=0.13, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000701, train/loss_step=0.186, global_step=6029.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  97%|█████████▋| 1167/1208 [31:55<01:07,  1.64s/it, loss=0.13, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000701, train/loss_step=0.186, global_step=6029.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  97%|█████████▋| 1167/1208 [31:55<01:07,  1.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000632, train/loss_step=0.173, global_step=6029.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  97%|█████████▋| 1168/1208 [31:58<01:05,  1.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000632, train/loss_step=0.173, global_step=6029.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  97%|█████████▋| 1168/1208 [31:58<01:05,  1.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000418, train/loss_step=0.126, global_step=6029.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  97%|█████████▋| 1169/1208 [31:59<01:04,  1.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000418, train/loss_step=0.126, global_step=6029.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  97%|█████████▋| 1169/1208 [31:59<01:04,  1.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.14e-5, train/loss_step=0.0113, global_step=6030.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  97%|█████████▋| 1170/1208 [32:00<01:02,  1.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.14e-5, train/loss_step=0.0113, global_step=6030.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  97%|█████████▋| 1170/1208 [32:00<01:02,  1.64s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0035, train/loss_vlb_step=2.02e-5, train/loss_step=0.0035, global_step=6030.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  97%|█████████▋| 1171/1208 [32:01<01:00,  1.64s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0035, train/loss_vlb_step=2.02e-5, train/loss_step=0.0035, global_step=6030.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  97%|█████████▋| 1171/1208 [32:01<01:00,  1.64s/it, loss=0.113, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.00082, train/loss_step=0.216, global_step=6030.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  97%|█████████▋| 1172/1208 [32:04<00:59,  1.64s/it, loss=0.113, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.00082, train/loss_step=0.216, global_step=6030.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  97%|█████████▋| 1172/1208 [32:04<00:59,  1.64s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0576, train/loss_vlb_step=0.000197, train/loss_step=0.0576, global_step=6030.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  97%|█████████▋| 1173/1208 [32:05<00:57,  1.64s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0576, train/loss_vlb_step=0.000197, train/loss_step=0.0576, global_step=6030.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  97%|█████████▋| 1173/1208 [32:05<00:57,  1.64s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.34e-5, train/loss_step=0.0144, global_step=6031.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  97%|█████████▋| 1174/1208 [32:06<00:55,  1.64s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.34e-5, train/loss_step=0.0144, global_step=6031.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  97%|█████████▋| 1174/1208 [32:06<00:55,  1.64s/it, loss=0.0811, v_num=0, train/loss_simple_step=0.0041, train/loss_vlb_step=2.12e-5, train/loss_step=0.0041, global_step=6031.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  97%|█████████▋| 1175/1208 [32:07<00:54,  1.64s/it, loss=0.0811, v_num=0, train/loss_simple_step=0.0041, train/loss_vlb_step=2.12e-5, train/loss_step=0.0041, global_step=6031.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  97%|█████████▋| 1175/1208 [32:07<00:54,  1.64s/it, loss=0.0809, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.36e-5, train/loss_step=0.0174, global_step=6031.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  97%|█████████▋| 1176/1208 [32:10<00:52,  1.64s/it, loss=0.0809, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.36e-5, train/loss_step=0.0174, global_step=6031.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  97%|█████████▋| 1176/1208 [32:10<00:52,  1.64s/it, loss=0.0754, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000206, train/loss_step=0.0588, global_step=6031.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  97%|█████████▋| 1177/1208 [32:11<00:50,  1.64s/it, loss=0.0754, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000206, train/loss_step=0.0588, global_step=6031.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  97%|█████████▋| 1177/1208 [32:11<00:50,  1.64s/it, loss=0.0754, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=2.49e-5, train/loss_step=0.00469, global_step=6032.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  98%|█████████▊| 1178/1208 [32:12<00:49,  1.64s/it, loss=0.0754, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=2.49e-5, train/loss_step=0.00469, global_step=6032.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  98%|█████████▊| 1178/1208 [32:12<00:49,  1.64s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00372, train/loss_step=0.454, global_step=6032.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  98%|█████████▊| 1179/1208 [32:13<00:47,  1.64s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00372, train/loss_step=0.454, global_step=6032.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  98%|█████████▊| 1179/1208 [32:13<00:47,  1.64s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00144, train/loss_step=0.300, global_step=6032.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  98%|█████████▊| 1180/1208 [32:16<00:45,  1.64s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00144, train/loss_step=0.300, global_step=6032.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  98%|█████████▊| 1180/1208 [32:16<00:45,  1.64s/it, loss=0.111, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00231, train/loss_step=0.352, global_step=6032.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  98%|█████████▊| 1181/1208 [32:17<00:44,  1.64s/it, loss=0.111, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00231, train/loss_step=0.352, global_step=6032.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  98%|█████████▊| 1181/1208 [32:17<00:44,  1.64s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.93e-5, train/loss_step=0.0158, global_step=6033.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  98%|█████████▊| 1182/1208 [32:18<00:42,  1.64s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.93e-5, train/loss_step=0.0158, global_step=6033.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  98%|█████████▊| 1182/1208 [32:18<00:42,  1.64s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0562, train/loss_vlb_step=0.000195, train/loss_step=0.0562, global_step=6033.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  98%|█████████▊| 1183/1208 [32:19<00:40,  1.64s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0562, train/loss_vlb_step=0.000195, train/loss_step=0.0562, global_step=6033.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  98%|█████████▊| 1183/1208 [32:19<00:40,  1.64s/it, loss=0.115, v_num=0, train/loss_simple_step=0.057, train/loss_vlb_step=0.000208, train/loss_step=0.057, global_step=6033.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  98%|█████████▊| 1184/1208 [32:22<00:39,  1.64s/it, loss=0.115, v_num=0, train/loss_simple_step=0.057, train/loss_vlb_step=0.000208, train/loss_step=0.057, global_step=6033.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  98%|█████████▊| 1184/1208 [32:22<00:39,  1.64s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00947, train/loss_vlb_step=4.63e-5, train/loss_step=0.00947, global_step=6033.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  98%|█████████▊| 1185/1208 [32:23<00:37,  1.64s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00947, train/loss_vlb_step=4.63e-5, train/loss_step=0.00947, global_step=6033.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  98%|█████████▊| 1185/1208 [32:23<00:37,  1.64s/it, loss=0.111, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.00034, train/loss_step=0.103, global_step=6034.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  98%|█████████▊| 1186/1208 [32:24<00:36,  1.64s/it, loss=0.111, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.00034, train/loss_step=0.103, global_step=6034.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  98%|█████████▊| 1186/1208 [32:24<00:36,  1.64s/it, loss=0.116, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00141, train/loss_step=0.292, global_step=6034.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  98%|█████████▊| 1187/1208 [32:25<00:34,  1.64s/it, loss=0.116, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00141, train/loss_step=0.292, global_step=6034.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  98%|█████████▊| 1187/1208 [32:25<00:34,  1.64s/it, loss=0.116, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000588, train/loss_step=0.168, global_step=6034.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  98%|█████████▊| 1188/1208 [32:28<00:32,  1.64s/it, loss=0.116, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000588, train/loss_step=0.168, global_step=6034.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  98%|█████████▊| 1188/1208 [32:28<00:32,  1.64s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0421, train/loss_vlb_step=0.000159, train/loss_step=0.0421, global_step=6034.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  98%|█████████▊| 1189/1208 [32:29<00:31,  1.64s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0421, train/loss_vlb_step=0.000159, train/loss_step=0.0421, global_step=6034.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  98%|█████████▊| 1189/1208 [32:29<00:31,  1.64s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.61e-5, train/loss_step=0.00292, global_step=6035.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  99%|█████████▊| 1190/1208 [32:30<00:29,  1.64s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.61e-5, train/loss_step=0.00292, global_step=6035.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  99%|█████████▊| 1190/1208 [32:30<00:29,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000885, train/loss_step=0.229, global_step=6035.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19:  99%|█████████▊| 1191/1208 [32:31<00:27,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000885, train/loss_step=0.229, global_step=6035.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  99%|█████████▊| 1191/1208 [32:31<00:27,  1.64s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.57e-5, train/loss_step=0.00277, global_step=6035.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  99%|█████████▊| 1192/1208 [32:34<00:26,  1.64s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.57e-5, train/loss_step=0.00277, global_step=6035.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  99%|█████████▊| 1192/1208 [32:34<00:26,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00423, train/loss_step=0.454, global_step=6035.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    Epoch 19:  99%|█████████▉| 1193/1208 [32:35<00:24,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00423, train/loss_step=0.454, global_step=6035.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  99%|█████████▉| 1193/1208 [32:35<00:24,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00387, train/loss_vlb_step=2.04e-5, train/loss_step=0.00387, global_step=6036.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  99%|█████████▉| 1194/1208 [32:36<00:22,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00387, train/loss_vlb_step=2.04e-5, train/loss_step=0.00387, global_step=6036.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  99%|█████████▉| 1194/1208 [32:36<00:22,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000146, train/loss_step=0.0402, global_step=6036.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19:  99%|█████████▉| 1195/1208 [32:37<00:21,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000146, train/loss_step=0.0402, global_step=6036.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  99%|█████████▉| 1195/1208 [32:37<00:21,  1.64s/it, loss=0.143, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000832, train/loss_step=0.207, global_step=6036.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]  Epoch 19:  99%|█████████▉| 1196/1208 [32:40<00:19,  1.64s/it, loss=0.143, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000832, train/loss_step=0.207, global_step=6036.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  99%|█████████▉| 1196/1208 [32:40<00:19,  1.64s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0834, train/loss_vlb_step=0.00028, train/loss_step=0.0834, global_step=6036.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  99%|█████████▉| 1197/1208 [32:41<00:18,  1.64s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0834, train/loss_vlb_step=0.00028, train/loss_step=0.0834, global_step=6036.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  99%|█████████▉| 1197/1208 [32:41<00:18,  1.64s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=2.25e-5, train/loss_step=0.00405, global_step=6037.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  99%|█████████▉| 1198/1208 [32:42<00:16,  1.64s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=2.25e-5, train/loss_step=0.00405, global_step=6037.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  99%|█████████▉| 1198/1208 [32:42<00:16,  1.64s/it, loss=0.136, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.002, train/loss_step=0.294, global_step=6037.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]      Epoch 19:  99%|█████████▉| 1199/1208 [32:43<00:14,  1.64s/it, loss=0.136, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.002, train/loss_step=0.294, global_step=6037.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  99%|█████████▉| 1199/1208 [32:43<00:14,  1.64s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00682, train/loss_vlb_step=3.29e-5, train/loss_step=0.00682, global_step=6037.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  99%|█████████▉| 1200/1208 [32:46<00:13,  1.64s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00682, train/loss_vlb_step=3.29e-5, train/loss_step=0.00682, global_step=6037.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  99%|█████████▉| 1200/1208 [32:46<00:13,  1.64s/it, loss=0.121, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00199, train/loss_step=0.341, global_step=6037.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]    
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.85it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.84it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.84it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.84it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.84it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.83it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.84it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.85it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.85it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.85it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.84it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.84it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.83it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.84it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.84it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:18,  1.84it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.84it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.84it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.85it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.84it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.85it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.84it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.85it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.84it/s][ADDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.84it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.84it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.84it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.84it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.84it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.84it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.84it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.84it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.83it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.85it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.84it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.84it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.84it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.84it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.84it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:18<00:08,  1.84it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.84it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.84it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.84it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.83it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.83it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.83it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.83it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.84it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.83it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.84it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.83it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.82it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.84it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.83it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.84it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.83it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.83it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.84it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.83it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.84it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.83it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.83it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.84it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:24<00:02,  1.83it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.84it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.78it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.83it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.84it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.84it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.84it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.84it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.84it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.75it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.83it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]Epoch 19:  99%|█████████▉| 1201/1208 [33:15<00:11,  1.66s/it, loss=0.121, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00199, train/loss_step=0.341, global_step=6037.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19:  99%|█████████▉| 1201/1208 [33:15<00:11,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000797, train/loss_step=0.228, global_step=6038.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19: 100%|█████████▉| 1202/1208 [33:16<00:09,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000797, train/loss_step=0.228, global_step=6038.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19: 100%|█████████▉| 1202/1208 [33:16<00:09,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.38e-5, train/loss_step=0.00246, global_step=6038.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19: 100%|█████████▉| 1203/1208 [33:17<00:08,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.38e-5, train/loss_step=0.00246, global_step=6038.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19: 100%|█████████▉| 1203/1208 [33:17<00:08,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=1.82e-5, train/loss_step=0.00334, global_step=6038.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19: 100%|█████████▉| 1204/1208 [33:20<00:06,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=1.82e-5, train/loss_step=0.00334, global_step=6038.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19: 100%|█████████▉| 1204/1208 [33:20<00:06,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000528, train/loss_step=0.157, global_step=6038.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]   Epoch 19: 100%|█████████▉| 1205/1208 [33:21<00:04,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000528, train/loss_step=0.157, global_step=6038.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19: 100%|█████████▉| 1205/1208 [33:21<00:04,  1.66s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0422, train/loss_vlb_step=0.000154, train/loss_step=0.0422, global_step=6039.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19: 100%|█████████▉| 1206/1208 [33:22<00:03,  1.66s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0422, train/loss_vlb_step=0.000154, train/loss_step=0.0422, global_step=6039.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19: 100%|█████████▉| 1206/1208 [33:22<00:03,  1.66s/it, loss=0.119, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.000223, train/loss_step=0.067, global_step=6039.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19: 100%|█████████▉| 1207/1208 [33:23<00:01,  1.66s/it, loss=0.119, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.000223, train/loss_step=0.067, global_step=6039.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19: 100%|█████████▉| 1207/1208 [33:23<00:01,  1.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00401, train/loss_step=0.420, global_step=6039.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] Epoch 19: 100%|██████████| 1208/1208 [33:28<00:00,  1.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00401, train/loss_step=0.420, global_step=6039.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 19: 100%|██████████| 1208/1208 [33:28<00:00,  1.66s/it, loss=0.165, v_num=0, train/loss_simple_step=0.710, train/loss_vlb_step=0.0266, train/loss_step=0.710, global_step=6039.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139] 
+
+
+Epoch 19:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.165, v_num=0, train/loss_simple_step=0.710, train/loss_vlb_step=0.0266, train/loss_step=0.710, global_step=6039.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]           Epoch 20:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.165, v_num=0, train/loss_simple_step=0.710, train/loss_vlb_step=0.0266, train/loss_step=0.710, global_step=6039.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][AData shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.86it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.86it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.84it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:25,  1.85it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.85it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.85it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.81it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.86it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.85it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.86it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.86it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.86it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.86it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.83it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.86it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.85it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.85it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.85it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.85it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.85it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.85it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.85it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:23,  1.70it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.85it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.85it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.83it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.73it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.85it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.85it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.75it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:19,  1.85it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.85it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.85it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:18,  1.85it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:18,  1.84it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.85it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.85it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.85it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.85it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.85it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.85it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.86it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.85it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.76it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.85it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.85it/s][ADDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.85it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.84it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.83it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.85it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.84it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:12<00:14,  1.85it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:12<00:14,  1.85it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.85it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.85it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:13,  1.79it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.83it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.85it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.83it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.85it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.85it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.83it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.77it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.76it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.81it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.83it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.82it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.83it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.83it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.84it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.83it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.84it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.83it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:18<00:08,  1.84it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.84it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.84it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.84it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.84it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.83it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.83it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.81it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.84it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.83it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.85it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.83it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.85it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.83it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.85it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.84it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.85it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.83it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:24<00:02,  1.85it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.83it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.85it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.83it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.78it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.85it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.84it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.85it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.84it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.78it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.83it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.79it/s]Epoch 20:   0%|          | 1/1208 [00:30<10:21:50, 30.91s/it, loss=0.165, v_num=0, train/loss_simple_step=0.710, train/loss_vlb_step=0.0266, train/loss_step=0.710, global_step=6039.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.139]Epoch 20:   0%|          | 1/1208 [00:30<10:21:51, 30.91s/it, loss=0.176, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000827, train/loss_step=0.221, global_step=6040.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   0%|          | 2/1208 [00:31<5:20:48, 15.96s/it, loss=0.176, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000827, train/loss_step=0.221, global_step=6040.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:   0%|          | 2/1208 [00:31<5:20:49, 15.96s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.73e-5, train/loss_step=0.0106, global_step=6040.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   0%|          | 3/1208 [00:32<3:40:25, 10.98s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.73e-5, train/loss_step=0.0106, global_step=6040.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   0%|          | 3/1208 [00:32<3:40:26, 10.98s/it, loss=0.172, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000495, train/loss_step=0.147, global_step=6040.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:   0%|          | 4/1208 [00:35<2:59:31,  8.95s/it, loss=0.172, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000495, train/loss_step=0.147, global_step=6040.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   0%|          | 4/1208 [00:35<2:59:32,  8.95s/it, loss=0.159, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000639, train/loss_step=0.185, global_step=6040.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   0%|          | 5/1208 [00:36<2:27:36,  7.36s/it, loss=0.159, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000639, train/loss_step=0.185, global_step=6040.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   0%|          | 5/1208 [00:36<2:27:37,  7.36s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.05e-5, train/loss_step=0.0169, global_step=6041.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   0%|          | 6/1208 [00:37<2:06:17,  6.30s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.05e-5, train/loss_step=0.0169, global_step=6041.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   0%|          | 6/1208 [00:37<2:06:17,  6.30s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0762, train/loss_vlb_step=0.000254, train/loss_step=0.0762, global_step=6041.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   1%|          | 7/1208 [00:38<1:51:04,  5.55s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0762, train/loss_vlb_step=0.000254, train/loss_step=0.0762, global_step=6041.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   1%|          | 7/1208 [00:38<1:51:04,  5.55s/it, loss=0.151, v_num=0, train/loss_simple_step=0.005, train/loss_vlb_step=2.74e-5, train/loss_step=0.005, global_step=6041.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:   1%|          | 8/1208 [00:41<1:44:14,  5.21s/it, loss=0.151, v_num=0, train/loss_simple_step=0.005, train/loss_vlb_step=2.74e-5, train/loss_step=0.005, global_step=6041.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   1%|          | 8/1208 [00:41<1:44:14,  5.21s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=2.05e-5, train/loss_step=0.00375, global_step=6041.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   1%|          | 9/1208 [00:42<1:34:51,  4.75s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=2.05e-5, train/loss_step=0.00375, global_step=6041.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   1%|          | 9/1208 [00:42<1:34:52,  4.75s/it, loss=0.149, v_num=0, train/loss_simple_step=0.047, train/loss_vlb_step=0.000171, train/loss_step=0.047, global_step=6042.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:   1%|          | 10/1208 [00:43<1:27:19,  4.37s/it, loss=0.149, v_num=0, train/loss_simple_step=0.047, train/loss_vlb_step=0.000171, train/loss_step=0.047, global_step=6042.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   1%|          | 10/1208 [00:43<1:27:19,  4.37s/it, loss=0.144, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000638, train/loss_step=0.187, global_step=6042.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   1%|          | 11/1208 [00:44<1:21:09,  4.07s/it, loss=0.144, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000638, train/loss_step=0.187, global_step=6042.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   1%|          | 11/1208 [00:44<1:21:09,  4.07s/it, loss=0.15, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000396, train/loss_step=0.120, global_step=6042.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:   1%|          | 12/1208 [00:47<1:19:04,  3.97s/it, loss=0.15, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000396, train/loss_step=0.120, global_step=6042.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   1%|          | 12/1208 [00:47<1:19:04,  3.97s/it, loss=0.154, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00363, train/loss_step=0.433, global_step=6042.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   1%|          | 13/1208 [00:48<1:14:28,  3.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00363, train/loss_step=0.433, global_step=6042.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   1%|          | 13/1208 [00:48<1:14:28,  3.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=1.93e-5, train/loss_step=0.0034, global_step=6043.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   1%|          | 14/1208 [00:49<1:10:32,  3.54s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=1.93e-5, train/loss_step=0.0034, global_step=6043.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   1%|          | 14/1208 [00:49<1:10:32,  3.54s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00374, train/loss_vlb_step=2.14e-5, train/loss_step=0.00374, global_step=6043.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   1%|          | 15/1208 [00:50<1:07:07,  3.38s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00374, train/loss_vlb_step=2.14e-5, train/loss_step=0.00374, global_step=6043.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   1%|          | 15/1208 [00:50<1:07:07,  3.38s/it, loss=0.151, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.00053, train/loss_step=0.157, global_step=6043.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:   1%|▏         | 16/1208 [00:53<1:06:25,  3.34s/it, loss=0.151, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.00053, train/loss_step=0.157, global_step=6043.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   1%|▏         | 16/1208 [00:53<1:06:25,  3.34s/it, loss=0.154, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000844, train/loss_step=0.225, global_step=6043.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   1%|▏         | 17/1208 [00:54<1:03:39,  3.21s/it, loss=0.154, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000844, train/loss_step=0.225, global_step=6043.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   1%|▏         | 17/1208 [00:54<1:03:39,  3.21s/it, loss=0.165, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00109, train/loss_step=0.271, global_step=6044.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:   1%|▏         | 18/1208 [00:55<1:01:10,  3.08s/it, loss=0.165, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00109, train/loss_step=0.271, global_step=6044.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   1%|▏         | 18/1208 [00:55<1:01:10,  3.08s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=1.97e-5, train/loss_step=0.00356, global_step=6044.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   2%|▏         | 19/1208 [00:56<58:57,  2.98s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=1.97e-5, train/loss_step=0.00356, global_step=6044.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:   2%|▏         | 19/1208 [00:56<58:58,  2.98s/it, loss=0.153, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000901, train/loss_step=0.236, global_step=6044.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:   2%|▏         | 20/1208 [00:59<58:49,  2.97s/it, loss=0.153, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000901, train/loss_step=0.236, global_step=6044.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   2%|▏         | 20/1208 [00:59<58:49,  2.97s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000104, train/loss_step=0.0267, global_step=6044.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   2%|▏         | 21/1208 [01:00<56:56,  2.88s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000104, train/loss_step=0.0267, global_step=6044.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   2%|▏         | 21/1208 [01:00<56:56,  2.88s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.38e-5, train/loss_step=0.00244, global_step=6045.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   2%|▏         | 22/1208 [01:01<55:13,  2.79s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.38e-5, train/loss_step=0.00244, global_step=6045.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   2%|▏         | 22/1208 [01:01<55:13,  2.79s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0798, train/loss_vlb_step=0.000269, train/loss_step=0.0798, global_step=6045.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:   2%|▏         | 23/1208 [01:02<53:38,  2.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0798, train/loss_vlb_step=0.000269, train/loss_step=0.0798, global_step=6045.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   2%|▏         | 23/1208 [01:02<53:38,  2.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00292, train/loss_step=0.364, global_step=6045.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:   2%|▏         | 24/1208 [01:05<53:43,  2.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00292, train/loss_step=0.364, global_step=6045.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   2%|▏         | 24/1208 [01:05<53:43,  2.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000425, train/loss_step=0.128, global_step=6045.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   2%|▏         | 25/1208 [01:06<52:19,  2.65s/it, loss=0.119, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000425, train/loss_step=0.128, global_step=6045.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   2%|▏         | 25/1208 [01:06<52:20,  2.65s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=7.85e-5, train/loss_step=0.0199, global_step=6046.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   2%|▏         | 26/1208 [01:07<51:02,  2.59s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=7.85e-5, train/loss_step=0.0199, global_step=6046.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   2%|▏         | 26/1208 [01:07<51:02,  2.59s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.4e-5, train/loss_step=0.0115, global_step=6046.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   2%|▏         | 27/1208 [01:08<49:50,  2.53s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.4e-5, train/loss_step=0.0115, global_step=6046.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   2%|▏         | 27/1208 [01:08<49:50,  2.53s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00946, train/loss_vlb_step=4.52e-5, train/loss_step=0.00946, global_step=6046.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   2%|▏         | 28/1208 [01:11<50:10,  2.55s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00946, train/loss_vlb_step=4.52e-5, train/loss_step=0.00946, global_step=6046.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   2%|▏         | 28/1208 [01:11<50:10,  2.55s/it, loss=0.135, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.003, train/loss_step=0.366, global_step=6046.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]      Epoch 20:   2%|▏         | 29/1208 [01:12<49:06,  2.50s/it, loss=0.135, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.003, train/loss_step=0.366, global_step=6046.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   2%|▏         | 29/1208 [01:12<49:06,  2.50s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000258, train/loss_step=0.0732, global_step=6047.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   2%|▏         | 30/1208 [01:13<48:07,  2.45s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000258, train/loss_step=0.0732, global_step=6047.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   2%|▏         | 30/1208 [01:13<48:07,  2.45s/it, loss=0.147, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00286, train/loss_step=0.402, global_step=6047.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:   3%|▎         | 31/1208 [01:14<47:11,  2.41s/it, loss=0.147, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00286, train/loss_step=0.402, global_step=6047.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   3%|▎         | 31/1208 [01:14<47:11,  2.41s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.07e-5, train/loss_step=0.00176, global_step=6047.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   3%|▎         | 32/1208 [01:17<47:37,  2.43s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.07e-5, train/loss_step=0.00176, global_step=6047.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   3%|▎         | 32/1208 [01:17<47:37,  2.43s/it, loss=0.127, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000548, train/loss_step=0.160, global_step=6047.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:   3%|▎         | 33/1208 [01:18<46:45,  2.39s/it, loss=0.127, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000548, train/loss_step=0.160, global_step=6047.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   3%|▎         | 33/1208 [01:18<46:45,  2.39s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0605, train/loss_vlb_step=0.000209, train/loss_step=0.0605, global_step=6048.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   3%|▎         | 34/1208 [01:19<45:56,  2.35s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0605, train/loss_vlb_step=0.000209, train/loss_step=0.0605, global_step=6048.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   3%|▎         | 34/1208 [01:19<45:56,  2.35s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00874, train/loss_vlb_step=4.14e-5, train/loss_step=0.00874, global_step=6048.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   3%|▎         | 35/1208 [01:20<45:09,  2.31s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00874, train/loss_vlb_step=4.14e-5, train/loss_step=0.00874, global_step=6048.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   3%|▎         | 35/1208 [01:20<45:09,  2.31s/it, loss=0.148, v_num=0, train/loss_simple_step=0.506, train/loss_vlb_step=0.0038, train/loss_step=0.506, global_step=6048.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:   3%|▎         | 36/1208 [01:24<45:36,  2.33s/it, loss=0.148, v_num=0, train/loss_simple_step=0.506, train/loss_vlb_step=0.0038, train/loss_step=0.506, global_step=6048.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   3%|▎         | 36/1208 [01:24<45:36,  2.33s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00644, train/loss_vlb_step=3.14e-5, train/loss_step=0.00644, global_step=6048.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   3%|▎         | 37/1208 [01:25<44:53,  2.30s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00644, train/loss_vlb_step=3.14e-5, train/loss_step=0.00644, global_step=6048.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   3%|▎         | 37/1208 [01:25<44:54,  2.30s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000103, train/loss_step=0.0267, global_step=6049.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:   3%|▎         | 38/1208 [01:26<44:13,  2.27s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000103, train/loss_step=0.0267, global_step=6049.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   3%|▎         | 38/1208 [01:26<44:13,  2.27s/it, loss=0.139, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00128, train/loss_step=0.282, global_step=6049.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:   3%|▎         | 39/1208 [01:27<43:34,  2.24s/it, loss=0.139, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00128, train/loss_step=0.282, global_step=6049.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   3%|▎         | 39/1208 [01:27<43:34,  2.24s/it, loss=0.146, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00382, train/loss_step=0.388, global_step=6049.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   3%|▎         | 40/1208 [01:30<44:00,  2.26s/it, loss=0.146, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00382, train/loss_step=0.388, global_step=6049.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   3%|▎         | 40/1208 [01:30<44:00,  2.26s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0591, train/loss_vlb_step=0.000203, train/loss_step=0.0591, global_step=6049.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   3%|▎         | 41/1208 [01:31<43:23,  2.23s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0591, train/loss_vlb_step=0.000203, train/loss_step=0.0591, global_step=6049.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   3%|▎         | 41/1208 [01:31<43:23,  2.23s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.36e-5, train/loss_step=0.0173, global_step=6050.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:   3%|▎         | 42/1208 [01:32<42:48,  2.20s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.36e-5, train/loss_step=0.0173, global_step=6050.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   3%|▎         | 42/1208 [01:32<42:48,  2.20s/it, loss=0.145, v_num=0, train/loss_simple_step=0.004, train/loss_vlb_step=2.21e-5, train/loss_step=0.004, global_step=6050.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:   4%|▎         | 43/1208 [01:33<42:14,  2.18s/it, loss=0.145, v_num=0, train/loss_simple_step=0.004, train/loss_vlb_step=2.21e-5, train/loss_step=0.004, global_step=6050.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   4%|▎         | 43/1208 [01:33<42:14,  2.18s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000129, train/loss_step=0.0345, global_step=6050.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   4%|▎         | 44/1208 [01:36<42:39,  2.20s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000129, train/loss_step=0.0345, global_step=6050.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   4%|▎         | 44/1208 [01:36<42:39,  2.20s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000162, train/loss_step=0.0454, global_step=6050.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   4%|▎         | 45/1208 [01:37<42:08,  2.17s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000162, train/loss_step=0.0454, global_step=6050.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   4%|▎         | 45/1208 [01:37<42:08,  2.17s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.57e-5, train/loss_step=0.00282, global_step=6051.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   4%|▍         | 46/1208 [01:38<41:37,  2.15s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.57e-5, train/loss_step=0.00282, global_step=6051.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   4%|▍         | 46/1208 [01:38<41:37,  2.15s/it, loss=0.128, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000351, train/loss_step=0.106, global_step=6051.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:   4%|▍         | 47/1208 [01:39<41:07,  2.13s/it, loss=0.128, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000351, train/loss_step=0.106, global_step=6051.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   4%|▍         | 47/1208 [01:39<41:07,  2.13s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00703, train/loss_vlb_step=3.6e-5, train/loss_step=0.00703, global_step=6051.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   4%|▍         | 48/1208 [01:43<41:31,  2.15s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00703, train/loss_vlb_step=3.6e-5, train/loss_step=0.00703, global_step=6051.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   4%|▍         | 48/1208 [01:43<41:31,  2.15s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0737, train/loss_vlb_step=0.000242, train/loss_step=0.0737, global_step=6051.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   4%|▍         | 49/1208 [01:44<41:03,  2.13s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0737, train/loss_vlb_step=0.000242, train/loss_step=0.0737, global_step=6051.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   4%|▍         | 49/1208 [01:44<41:03,  2.13s/it, loss=0.117, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.0005, train/loss_step=0.152, global_step=6052.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:   4%|▍         | 50/1208 [01:45<40:35,  2.10s/it, loss=0.117, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.0005, train/loss_step=0.152, global_step=6052.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   4%|▍         | 50/1208 [01:45<40:35,  2.10s/it, loss=0.109, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000886, train/loss_step=0.228, global_step=6052.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   4%|▍         | 51/1208 [01:46<40:09,  2.08s/it, loss=0.109, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000886, train/loss_step=0.228, global_step=6052.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   4%|▍         | 51/1208 [01:46<40:09,  2.08s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.99e-5, train/loss_step=0.0162, global_step=6052.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   4%|▍         | 52/1208 [01:49<40:32,  2.10s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.99e-5, train/loss_step=0.0162, global_step=6052.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   4%|▍         | 52/1208 [01:49<40:32,  2.10s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.68e-5, train/loss_step=0.0131, global_step=6052.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   4%|▍         | 53/1208 [01:50<40:07,  2.08s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.68e-5, train/loss_step=0.0131, global_step=6052.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   4%|▍         | 53/1208 [01:50<40:07,  2.08s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.00596, train/loss_vlb_step=2.92e-5, train/loss_step=0.00596, global_step=6053.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   4%|▍         | 54/1208 [01:51<39:42,  2.06s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.00596, train/loss_vlb_step=2.92e-5, train/loss_step=0.00596, global_step=6053.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   4%|▍         | 54/1208 [01:51<39:42,  2.06s/it, loss=0.116, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00174, train/loss_step=0.352, global_step=6053.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]     Epoch 20:   5%|▍         | 55/1208 [01:52<39:19,  2.05s/it, loss=0.116, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00174, train/loss_step=0.352, global_step=6053.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   5%|▍         | 55/1208 [01:52<39:19,  2.05s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.29e-5, train/loss_step=0.0233, global_step=6053.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   5%|▍         | 56/1208 [01:55<39:41,  2.07s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.29e-5, train/loss_step=0.0233, global_step=6053.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   5%|▍         | 56/1208 [01:55<39:41,  2.07s/it, loss=0.109, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00178, train/loss_step=0.336, global_step=6053.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:   5%|▍         | 57/1208 [01:56<39:18,  2.05s/it, loss=0.109, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00178, train/loss_step=0.336, global_step=6053.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   5%|▍         | 57/1208 [01:56<39:18,  2.05s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000163, train/loss_step=0.0448, global_step=6054.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   5%|▍         | 58/1208 [01:57<38:56,  2.03s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000163, train/loss_step=0.0448, global_step=6054.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   5%|▍         | 58/1208 [01:57<38:56,  2.03s/it, loss=0.112, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00189, train/loss_step=0.338, global_step=6054.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:   5%|▍         | 59/1208 [01:58<38:35,  2.01s/it, loss=0.112, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00189, train/loss_step=0.338, global_step=6054.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   5%|▍         | 59/1208 [01:58<38:35,  2.01s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.00685, train/loss_vlb_step=3.36e-5, train/loss_step=0.00685, global_step=6054.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   5%|▍         | 60/1208 [02:02<38:55,  2.03s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.00685, train/loss_vlb_step=3.36e-5, train/loss_step=0.00685, global_step=6054.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   5%|▍         | 60/1208 [02:02<38:55,  2.03s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.054, train/loss_vlb_step=0.00019, train/loss_step=0.054, global_step=6054.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:   5%|▌         | 61/1208 [02:03<38:34,  2.02s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.054, train/loss_vlb_step=0.00019, train/loss_step=0.054, global_step=6054.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   5%|▌         | 61/1208 [02:03<38:34,  2.02s/it, loss=0.106, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00147, train/loss_step=0.272, global_step=6055.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:   5%|▌         | 62/1208 [02:04<38:14,  2.00s/it, loss=0.106, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00147, train/loss_step=0.272, global_step=6055.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   5%|▌         | 62/1208 [02:04<38:14,  2.00s/it, loss=0.115, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000801, train/loss_step=0.194, global_step=6055.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   5%|▌         | 63/1208 [02:05<37:54,  1.99s/it, loss=0.115, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000801, train/loss_step=0.194, global_step=6055.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   5%|▌         | 63/1208 [02:05<37:54,  1.99s/it, loss=0.122, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000577, train/loss_step=0.167, global_step=6055.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   5%|▌         | 64/1208 [02:08<38:15,  2.01s/it, loss=0.122, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000577, train/loss_step=0.167, global_step=6055.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   5%|▌         | 64/1208 [02:08<38:15,  2.01s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00795, train/loss_vlb_step=3.82e-5, train/loss_step=0.00795, global_step=6055.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   5%|▌         | 65/1208 [02:09<37:56,  1.99s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00795, train/loss_vlb_step=3.82e-5, train/loss_step=0.00795, global_step=6055.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   5%|▌         | 65/1208 [02:09<37:56,  1.99s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0854, train/loss_vlb_step=0.000289, train/loss_step=0.0854, global_step=6056.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   5%|▌         | 66/1208 [02:10<37:38,  1.98s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0854, train/loss_vlb_step=0.000289, train/loss_step=0.0854, global_step=6056.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   5%|▌         | 66/1208 [02:10<37:38,  1.98s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0864, train/loss_vlb_step=0.000284, train/loss_step=0.0864, global_step=6056.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   6%|▌         | 67/1208 [02:11<37:20,  1.96s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0864, train/loss_vlb_step=0.000284, train/loss_step=0.0864, global_step=6056.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   6%|▌         | 67/1208 [02:11<37:20,  1.96s/it, loss=0.139, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00251, train/loss_step=0.319, global_step=6056.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:   6%|▌         | 68/1208 [02:14<37:38,  1.98s/it, loss=0.139, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00251, train/loss_step=0.319, global_step=6056.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   6%|▌         | 68/1208 [02:14<37:38,  1.98s/it, loss=0.149, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00122, train/loss_step=0.285, global_step=6056.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   6%|▌         | 69/1208 [02:15<37:21,  1.97s/it, loss=0.149, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00122, train/loss_step=0.285, global_step=6056.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   6%|▌         | 69/1208 [02:15<37:21,  1.97s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0516, train/loss_vlb_step=0.000179, train/loss_step=0.0516, global_step=6057.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   6%|▌         | 70/1208 [02:16<37:04,  1.95s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0516, train/loss_vlb_step=0.000179, train/loss_step=0.0516, global_step=6057.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   6%|▌         | 70/1208 [02:16<37:04,  1.95s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=1.06e-5, train/loss_step=0.00183, global_step=6057.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   6%|▌         | 71/1208 [02:17<36:48,  1.94s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=1.06e-5, train/loss_step=0.00183, global_step=6057.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   6%|▌         | 71/1208 [02:17<36:48,  1.94s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0557, train/loss_vlb_step=0.000194, train/loss_step=0.0557, global_step=6057.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:   6%|▌         | 72/1208 [02:21<37:06,  1.96s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0557, train/loss_vlb_step=0.000194, train/loss_step=0.0557, global_step=6057.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   6%|▌         | 72/1208 [02:21<37:06,  1.96s/it, loss=0.144, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000719, train/loss_step=0.184, global_step=6057.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:   6%|▌         | 73/1208 [02:22<36:50,  1.95s/it, loss=0.144, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000719, train/loss_step=0.184, global_step=6057.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   6%|▌         | 73/1208 [02:22<36:50,  1.95s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00841, train/loss_vlb_step=4.05e-5, train/loss_step=0.00841, global_step=6058.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   6%|▌         | 74/1208 [02:23<36:33,  1.93s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00841, train/loss_vlb_step=4.05e-5, train/loss_step=0.00841, global_step=6058.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   6%|▌         | 74/1208 [02:23<36:33,  1.93s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0575, train/loss_vlb_step=0.000199, train/loss_step=0.0575, global_step=6058.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:   6%|▌         | 75/1208 [02:24<36:18,  1.92s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0575, train/loss_vlb_step=0.000199, train/loss_step=0.0575, global_step=6058.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   6%|▌         | 75/1208 [02:24<36:18,  1.92s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000144, train/loss_step=0.0388, global_step=6058.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:   6%|▋         | 76/1208 [02:27<36:30,  1.94s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000144, train/loss_step=0.0388, global_step=6058.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   6%|▋         | 76/1208 [02:27<36:30,  1.94s/it, loss=0.13, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00182, train/loss_step=0.348, global_step=6058.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:   6%|▋         | 77/1208 [02:28<36:15,  1.92s/it, loss=0.13, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00182, train/loss_step=0.348, global_step=6058.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   6%|▋         | 77/1208 [02:28<36:15,  1.92s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.02e-5, train/loss_step=0.0136, global_step=6059.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   6%|▋         | 78/1208 [02:29<36:00,  1.91s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.02e-5, train/loss_step=0.0136, global_step=6059.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   6%|▋         | 78/1208 [02:29<36:00,  1.91s/it, loss=0.122, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000689, train/loss_step=0.196, global_step=6059.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:   7%|▋         | 79/1208 [02:30<35:45,  1.90s/it, loss=0.122, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000689, train/loss_step=0.196, global_step=6059.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   7%|▋         | 79/1208 [02:30<35:45,  1.90s/it, loss=0.125, v_num=0, train/loss_simple_step=0.076, train/loss_vlb_step=0.000258, train/loss_step=0.076, global_step=6059.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   7%|▋         | 80/1208 [02:32<35:57,  1.91s/it, loss=0.125, v_num=0, train/loss_simple_step=0.076, train/loss_vlb_step=0.000258, train/loss_step=0.076, global_step=6059.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   7%|▋         | 80/1208 [02:32<35:57,  1.91s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.000185, train/loss_step=0.0521, global_step=6059.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   7%|▋         | 81/1208 [02:34<35:42,  1.90s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.000185, train/loss_step=0.0521, global_step=6059.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   7%|▋         | 81/1208 [02:34<35:42,  1.90s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0609, train/loss_vlb_step=0.00021, train/loss_step=0.0609, global_step=6060.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:   7%|▋         | 82/1208 [02:35<35:28,  1.89s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0609, train/loss_vlb_step=0.00021, train/loss_step=0.0609, global_step=6060.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   7%|▋         | 82/1208 [02:35<35:28,  1.89s/it, loss=0.11, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.00037, train/loss_step=0.113, global_step=6060.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:   7%|▋         | 83/1208 [02:36<35:14,  1.88s/it, loss=0.11, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.00037, train/loss_step=0.113, global_step=6060.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   7%|▋         | 83/1208 [02:36<35:14,  1.88s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=1.95e-5, train/loss_step=0.00347, global_step=6060.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   7%|▋         | 84/1208 [02:38<35:26,  1.89s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=1.95e-5, train/loss_step=0.00347, global_step=6060.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   7%|▋         | 84/1208 [02:38<35:26,  1.89s/it, loss=0.117, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00152, train/loss_step=0.307, global_step=6060.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:   7%|▋         | 85/1208 [02:39<35:12,  1.88s/it, loss=0.117, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00152, train/loss_step=0.307, global_step=6060.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   7%|▋         | 85/1208 [02:39<35:12,  1.88s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0707, train/loss_vlb_step=0.000236, train/loss_step=0.0707, global_step=6061.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   7%|▋         | 86/1208 [02:40<34:59,  1.87s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0707, train/loss_vlb_step=0.000236, train/loss_step=0.0707, global_step=6061.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   7%|▋         | 86/1208 [02:40<34:59,  1.87s/it, loss=0.113, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000101, train/loss_step=0.026, global_step=6061.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:   7%|▋         | 87/1208 [02:41<34:46,  1.86s/it, loss=0.113, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000101, train/loss_step=0.026, global_step=6061.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   7%|▋         | 87/1208 [02:41<34:46,  1.86s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.00801, train/loss_vlb_step=3.9e-5, train/loss_step=0.00801, global_step=6061.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   7%|▋         | 88/1208 [02:44<34:57,  1.87s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.00801, train/loss_vlb_step=3.9e-5, train/loss_step=0.00801, global_step=6061.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   7%|▋         | 88/1208 [02:44<34:57,  1.87s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000463, train/loss_step=0.138, global_step=6061.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:   7%|▋         | 89/1208 [02:45<34:45,  1.86s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000463, train/loss_step=0.138, global_step=6061.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   7%|▋         | 89/1208 [02:45<34:45,  1.86s/it, loss=0.093, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000337, train/loss_step=0.103, global_step=6062.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:   7%|▋         | 90/1208 [02:46<34:32,  1.85s/it, loss=0.093, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000337, train/loss_step=0.103, global_step=6062.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   7%|▋         | 90/1208 [02:46<34:32,  1.85s/it, loss=0.108, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00122, train/loss_step=0.301, global_step=6062.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:   8%|▊         | 91/1208 [02:47<34:20,  1.84s/it, loss=0.108, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00122, train/loss_step=0.301, global_step=6062.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   8%|▊         | 91/1208 [02:47<34:20,  1.84s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000102, train/loss_step=0.0253, global_step=6062.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   8%|▊         | 92/1208 [02:50<34:31,  1.86s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000102, train/loss_step=0.0253, global_step=6062.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   8%|▊         | 92/1208 [02:50<34:31,  1.86s/it, loss=0.103, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=6062.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:   8%|▊         | 93/1208 [02:51<34:19,  1.85s/it, loss=0.103, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=6062.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   8%|▊         | 93/1208 [02:51<34:19,  1.85s/it, loss=0.127, v_num=0, train/loss_simple_step=0.490, train/loss_vlb_step=0.00649, train/loss_step=0.490, global_step=6063.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:   8%|▊         | 94/1208 [02:52<34:07,  1.84s/it, loss=0.127, v_num=0, train/loss_simple_step=0.490, train/loss_vlb_step=0.00649, train/loss_step=0.490, global_step=6063.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   8%|▊         | 94/1208 [02:52<34:07,  1.84s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0825, train/loss_vlb_step=0.000272, train/loss_step=0.0825, global_step=6063.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   8%|▊         | 95/1208 [02:53<33:56,  1.83s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0825, train/loss_vlb_step=0.000272, train/loss_step=0.0825, global_step=6063.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   8%|▊         | 95/1208 [02:53<33:56,  1.83s/it, loss=0.127, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.73e-5, train/loss_step=0.013, global_step=6063.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:   8%|▊         | 96/1208 [02:56<34:06,  1.84s/it, loss=0.127, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.73e-5, train/loss_step=0.013, global_step=6063.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   8%|▊         | 96/1208 [02:56<34:06,  1.84s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0785, train/loss_vlb_step=0.00026, train/loss_step=0.0785, global_step=6063.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   8%|▊         | 97/1208 [02:57<33:54,  1.83s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0785, train/loss_vlb_step=0.00026, train/loss_step=0.0785, global_step=6063.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   8%|▊         | 97/1208 [02:57<33:54,  1.83s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.13e-5, train/loss_step=0.00188, global_step=6064.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   8%|▊         | 98/1208 [02:58<33:43,  1.82s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.13e-5, train/loss_step=0.00188, global_step=6064.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   8%|▊         | 98/1208 [02:58<33:43,  1.82s/it, loss=0.136, v_num=0, train/loss_simple_step=0.656, train/loss_vlb_step=0.0376, train/loss_step=0.656, global_step=6064.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]     Epoch 20:   8%|▊         | 99/1208 [02:59<33:32,  1.82s/it, loss=0.136, v_num=0, train/loss_simple_step=0.656, train/loss_vlb_step=0.0376, train/loss_step=0.656, global_step=6064.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   8%|▊         | 99/1208 [02:59<33:32,  1.82s/it, loss=0.139, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000426, train/loss_step=0.128, global_step=6064.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   8%|▊         | 100/1208 [03:02<33:42,  1.83s/it, loss=0.139, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000426, train/loss_step=0.128, global_step=6064.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   8%|▊         | 100/1208 [03:02<33:42,  1.83s/it, loss=0.152, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00148, train/loss_step=0.326, global_step=6064.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:   8%|▊         | 101/1208 [03:03<33:31,  1.82s/it, loss=0.152, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00148, train/loss_step=0.326, global_step=6064.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   8%|▊         | 101/1208 [03:03<33:31,  1.82s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.00012, train/loss_step=0.0302, global_step=6065.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   8%|▊         | 102/1208 [03:04<33:21,  1.81s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.00012, train/loss_step=0.0302, global_step=6065.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   8%|▊         | 102/1208 [03:04<33:21,  1.81s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.79e-5, train/loss_step=0.0246, global_step=6065.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   9%|▊         | 103/1208 [03:05<33:10,  1.80s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.79e-5, train/loss_step=0.0246, global_step=6065.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   9%|▊         | 103/1208 [03:05<33:10,  1.80s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.63e-5, train/loss_step=0.0215, global_step=6065.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   9%|▊         | 104/1208 [03:08<33:20,  1.81s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.63e-5, train/loss_step=0.0215, global_step=6065.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   9%|▊         | 104/1208 [03:08<33:20,  1.81s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.55e-5, train/loss_step=0.0149, global_step=6065.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   9%|▊         | 105/1208 [03:09<33:10,  1.80s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.55e-5, train/loss_step=0.0149, global_step=6065.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   9%|▊         | 105/1208 [03:09<33:10,  1.80s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0087, train/loss_vlb_step=4.14e-5, train/loss_step=0.0087, global_step=6066.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:   9%|▉         | 106/1208 [03:10<33:00,  1.80s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0087, train/loss_vlb_step=4.14e-5, train/loss_step=0.0087, global_step=6066.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   9%|▉         | 106/1208 [03:10<33:00,  1.80s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00439, train/loss_vlb_step=2.25e-5, train/loss_step=0.00439, global_step=6066.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   9%|▉         | 107/1208 [03:11<32:50,  1.79s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00439, train/loss_vlb_step=2.25e-5, train/loss_step=0.00439, global_step=6066.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   9%|▉         | 107/1208 [03:11<32:50,  1.79s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.000102, train/loss_step=0.0249, global_step=6066.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:   9%|▉         | 108/1208 [03:14<32:59,  1.80s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.000102, train/loss_step=0.0249, global_step=6066.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   9%|▉         | 108/1208 [03:14<32:59,  1.80s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0694, train/loss_vlb_step=0.000236, train/loss_step=0.0694, global_step=6066.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   9%|▉         | 109/1208 [03:15<32:49,  1.79s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0694, train/loss_vlb_step=0.000236, train/loss_step=0.0694, global_step=6066.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   9%|▉         | 109/1208 [03:15<32:49,  1.79s/it, loss=0.135, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00162, train/loss_step=0.288, global_step=6067.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:   9%|▉         | 110/1208 [03:16<32:40,  1.79s/it, loss=0.135, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00162, train/loss_step=0.288, global_step=6067.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   9%|▉         | 110/1208 [03:16<32:40,  1.79s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.12e-5, train/loss_step=0.0168, global_step=6067.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   9%|▉         | 111/1208 [03:17<32:30,  1.78s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.12e-5, train/loss_step=0.0168, global_step=6067.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   9%|▉         | 111/1208 [03:17<32:30,  1.78s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0091, train/loss_vlb_step=4.26e-5, train/loss_step=0.0091, global_step=6067.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:   9%|▉         | 112/1208 [03:20<32:39,  1.79s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0091, train/loss_vlb_step=4.26e-5, train/loss_step=0.0091, global_step=6067.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   9%|▉         | 112/1208 [03:20<32:39,  1.79s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.96e-5, train/loss_step=0.0208, global_step=6067.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   9%|▉         | 113/1208 [03:21<32:30,  1.78s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.96e-5, train/loss_step=0.0208, global_step=6067.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   9%|▉         | 113/1208 [03:21<32:30,  1.78s/it, loss=0.105, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00142, train/loss_step=0.289, global_step=6068.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:   9%|▉         | 114/1208 [03:22<32:21,  1.77s/it, loss=0.105, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00142, train/loss_step=0.289, global_step=6068.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:   9%|▉         | 114/1208 [03:22<32:21,  1.77s/it, loss=0.103, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.000119, train/loss_step=0.032, global_step=6068.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  10%|▉         | 115/1208 [03:23<32:12,  1.77s/it, loss=0.103, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.000119, train/loss_step=0.032, global_step=6068.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  10%|▉         | 115/1208 [03:23<32:12,  1.77s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=5.93e-5, train/loss_step=0.0137, global_step=6068.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  10%|▉         | 116/1208 [03:26<32:20,  1.78s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=5.93e-5, train/loss_step=0.0137, global_step=6068.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  10%|▉         | 116/1208 [03:26<32:20,  1.78s/it, loss=0.117, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.0025, train/loss_step=0.357, global_step=6068.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  10%|▉         | 117/1208 [03:27<32:12,  1.77s/it, loss=0.117, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.0025, train/loss_step=0.357, global_step=6068.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  10%|▉         | 117/1208 [03:27<32:12,  1.77s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00983, train/loss_vlb_step=4.7e-5, train/loss_step=0.00983, global_step=6069.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  10%|▉         | 118/1208 [03:28<32:03,  1.76s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00983, train/loss_vlb_step=4.7e-5, train/loss_step=0.00983, global_step=6069.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  10%|▉         | 118/1208 [03:28<32:03,  1.76s/it, loss=0.0867, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000161, train/loss_step=0.0445, global_step=6069.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  10%|▉         | 119/1208 [03:29<31:54,  1.76s/it, loss=0.0867, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000161, train/loss_step=0.0445, global_step=6069.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  10%|▉         | 119/1208 [03:29<31:54,  1.76s/it, loss=0.0809, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.88e-5, train/loss_step=0.0129, global_step=6069.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  10%|▉         | 120/1208 [03:32<32:02,  1.77s/it, loss=0.0809, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.88e-5, train/loss_step=0.0129, global_step=6069.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  10%|▉         | 120/1208 [03:32<32:02,  1.77s/it, loss=0.0648, v_num=0, train/loss_simple_step=0.00329, train/loss_vlb_step=1.83e-5, train/loss_step=0.00329, global_step=6069.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  10%|█         | 121/1208 [03:33<31:54,  1.76s/it, loss=0.0648, v_num=0, train/loss_simple_step=0.00329, train/loss_vlb_step=1.83e-5, train/loss_step=0.00329, global_step=6069.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  10%|█         | 121/1208 [03:33<31:54,  1.76s/it, loss=0.0634, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=1.35e-5, train/loss_step=0.00229, global_step=6070.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  10%|█         | 122/1208 [03:34<31:46,  1.76s/it, loss=0.0634, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=1.35e-5, train/loss_step=0.00229, global_step=6070.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  10%|█         | 122/1208 [03:34<31:46,  1.76s/it, loss=0.0695, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000499, train/loss_step=0.147, global_step=6070.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  10%|█         | 123/1208 [03:35<31:37,  1.75s/it, loss=0.0695, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000499, train/loss_step=0.147, global_step=6070.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  10%|█         | 123/1208 [03:35<31:37,  1.75s/it, loss=0.0717, v_num=0, train/loss_simple_step=0.0658, train/loss_vlb_step=0.000221, train/loss_step=0.0658, global_step=6070.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  10%|█         | 124/1208 [03:38<31:45,  1.76s/it, loss=0.0717, v_num=0, train/loss_simple_step=0.0658, train/loss_vlb_step=0.000221, train/loss_step=0.0658, global_step=6070.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  10%|█         | 124/1208 [03:38<31:45,  1.76s/it, loss=0.0715, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.15e-5, train/loss_step=0.0113, global_step=6070.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  10%|█         | 125/1208 [03:39<31:37,  1.75s/it, loss=0.0715, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.15e-5, train/loss_step=0.0113, global_step=6070.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  10%|█         | 125/1208 [03:39<31:37,  1.75s/it, loss=0.0715, v_num=0, train/loss_simple_step=0.0082, train/loss_vlb_step=3.82e-5, train/loss_step=0.0082, global_step=6071.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  10%|█         | 126/1208 [03:40<31:29,  1.75s/it, loss=0.0715, v_num=0, train/loss_simple_step=0.0082, train/loss_vlb_step=3.82e-5, train/loss_step=0.0082, global_step=6071.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  10%|█         | 126/1208 [03:40<31:29,  1.75s/it, loss=0.106, v_num=0, train/loss_simple_step=0.694, train/loss_vlb_step=0.015, train/loss_step=0.694, global_step=6071.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]     Epoch 20:  11%|█         | 127/1208 [03:41<31:21,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.694, train/loss_vlb_step=0.015, train/loss_step=0.694, global_step=6071.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  11%|█         | 127/1208 [03:41<31:21,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000123, train/loss_step=0.0333, global_step=6071.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  11%|█         | 128/1208 [03:43<31:29,  1.75s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000123, train/loss_step=0.0333, global_step=6071.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  11%|█         | 128/1208 [03:43<31:29,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00302, train/loss_step=0.405, global_step=6071.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  11%|█         | 129/1208 [03:44<31:21,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00302, train/loss_step=0.405, global_step=6071.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  11%|█         | 129/1208 [03:44<31:21,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00748, train/loss_vlb_step=3.61e-5, train/loss_step=0.00748, global_step=6072.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  11%|█         | 130/1208 [03:45<31:13,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00748, train/loss_vlb_step=3.61e-5, train/loss_step=0.00748, global_step=6072.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  11%|█         | 130/1208 [03:45<31:13,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000296, train/loss_step=0.0891, global_step=6072.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  11%|█         | 131/1208 [03:46<31:06,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000296, train/loss_step=0.0891, global_step=6072.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  11%|█         | 131/1208 [03:46<31:06,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0801, train/loss_vlb_step=0.000268, train/loss_step=0.0801, global_step=6072.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  11%|█         | 132/1208 [03:49<31:13,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0801, train/loss_vlb_step=0.000268, train/loss_step=0.0801, global_step=6072.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  11%|█         | 132/1208 [03:49<31:13,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00101, train/loss_step=0.281, global_step=6072.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  11%|█         | 133/1208 [03:50<31:05,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00101, train/loss_step=0.281, global_step=6072.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  11%|█         | 133/1208 [03:50<31:05,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000466, train/loss_step=0.141, global_step=6073.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  11%|█         | 134/1208 [03:51<30:58,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000466, train/loss_step=0.141, global_step=6073.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  11%|█         | 134/1208 [03:51<30:58,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00724, train/loss_vlb_step=3.63e-5, train/loss_step=0.00724, global_step=6073.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  11%|█         | 135/1208 [03:52<30:50,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00724, train/loss_vlb_step=3.63e-5, train/loss_step=0.00724, global_step=6073.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  11%|█         | 135/1208 [03:52<30:50,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0808, train/loss_vlb_step=0.000271, train/loss_step=0.0808, global_step=6073.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  11%|█▏        | 136/1208 [03:55<30:58,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0808, train/loss_vlb_step=0.000271, train/loss_step=0.0808, global_step=6073.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  11%|█▏        | 136/1208 [03:55<30:58,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0585, train/loss_vlb_step=0.0002, train/loss_step=0.0585, global_step=6073.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  11%|█▏        | 137/1208 [03:56<30:51,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0585, train/loss_vlb_step=0.0002, train/loss_step=0.0585, global_step=6073.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  11%|█▏        | 137/1208 [03:56<30:51,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0826, train/loss_vlb_step=0.000275, train/loss_step=0.0826, global_step=6074.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  11%|█▏        | 138/1208 [03:57<30:43,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0826, train/loss_vlb_step=0.000275, train/loss_step=0.0826, global_step=6074.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  11%|█▏        | 138/1208 [03:57<30:43,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0913, train/loss_vlb_step=0.000302, train/loss_step=0.0913, global_step=6074.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  12%|█▏        | 139/1208 [03:58<30:36,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0913, train/loss_vlb_step=0.000302, train/loss_step=0.0913, global_step=6074.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  12%|█▏        | 139/1208 [03:58<30:36,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=8.83e-5, train/loss_step=0.022, global_step=6074.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  12%|█▏        | 140/1208 [04:01<30:43,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=8.83e-5, train/loss_step=0.022, global_step=6074.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  12%|█▏        | 140/1208 [04:01<30:43,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.622, train/loss_vlb_step=0.0174, train/loss_step=0.622, global_step=6074.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  12%|█▏        | 141/1208 [04:02<30:36,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.622, train/loss_vlb_step=0.0174, train/loss_step=0.622, global_step=6074.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  12%|█▏        | 141/1208 [04:02<30:36,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.05e-5, train/loss_step=0.00175, global_step=6075.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  12%|█▏        | 142/1208 [04:03<30:29,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.05e-5, train/loss_step=0.00175, global_step=6075.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  12%|█▏        | 142/1208 [04:03<30:29,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0725, train/loss_vlb_step=0.000239, train/loss_step=0.0725, global_step=6075.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  12%|█▏        | 143/1208 [04:04<30:22,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0725, train/loss_vlb_step=0.000239, train/loss_step=0.0725, global_step=6075.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  12%|█▏        | 143/1208 [04:04<30:22,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000837, train/loss_step=0.211, global_step=6075.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  12%|█▏        | 144/1208 [04:07<30:29,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000837, train/loss_step=0.211, global_step=6075.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  12%|█▏        | 144/1208 [04:07<30:29,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.76e-5, train/loss_step=0.0104, global_step=6075.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  12%|█▏        | 145/1208 [04:08<30:22,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.76e-5, train/loss_step=0.0104, global_step=6075.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  12%|█▏        | 145/1208 [04:08<30:22,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0331, train/loss_vlb_step=0.000127, train/loss_step=0.0331, global_step=6076.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  12%|█▏        | 146/1208 [04:09<30:15,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0331, train/loss_vlb_step=0.000127, train/loss_step=0.0331, global_step=6076.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  12%|█▏        | 146/1208 [04:09<30:15,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00367, train/loss_step=0.433, global_step=6076.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  12%|█▏        | 147/1208 [04:10<30:08,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00367, train/loss_step=0.433, global_step=6076.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  12%|█▏        | 147/1208 [04:10<30:08,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0723, train/loss_vlb_step=0.000248, train/loss_step=0.0723, global_step=6076.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  12%|█▏        | 148/1208 [04:13<30:15,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0723, train/loss_vlb_step=0.000248, train/loss_step=0.0723, global_step=6076.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  12%|█▏        | 148/1208 [04:13<30:15,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000577, train/loss_step=0.165, global_step=6076.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  12%|█▏        | 149/1208 [04:14<30:08,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000577, train/loss_step=0.165, global_step=6076.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  12%|█▏        | 149/1208 [04:14<30:08,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.68e-5, train/loss_step=0.00299, global_step=6077.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  12%|█▏        | 150/1208 [04:15<30:02,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.68e-5, train/loss_step=0.00299, global_step=6077.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  12%|█▏        | 150/1208 [04:15<30:02,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000847, train/loss_step=0.213, global_step=6077.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  12%|█▎        | 151/1208 [04:16<29:55,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000847, train/loss_step=0.213, global_step=6077.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  12%|█▎        | 151/1208 [04:16<29:55,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00431, train/loss_vlb_step=2.26e-5, train/loss_step=0.00431, global_step=6077.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  13%|█▎        | 152/1208 [04:19<30:02,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00431, train/loss_vlb_step=2.26e-5, train/loss_step=0.00431, global_step=6077.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  13%|█▎        | 152/1208 [04:19<30:02,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0729, train/loss_vlb_step=0.000244, train/loss_step=0.0729, global_step=6077.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  13%|█▎        | 153/1208 [04:20<29:55,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0729, train/loss_vlb_step=0.000244, train/loss_step=0.0729, global_step=6077.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  13%|█▎        | 153/1208 [04:20<29:55,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000639, train/loss_step=0.175, global_step=6078.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  13%|█▎        | 154/1208 [04:21<29:49,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000639, train/loss_step=0.175, global_step=6078.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  13%|█▎        | 154/1208 [04:21<29:49,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000717, train/loss_step=0.197, global_step=6078.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  13%|█▎        | 155/1208 [04:22<29:43,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000717, train/loss_step=0.197, global_step=6078.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  13%|█▎        | 155/1208 [04:22<29:43,  1.69s/it, loss=0.156, v_num=0, train/loss_simple_step=0.576, train/loss_vlb_step=0.012, train/loss_step=0.576, global_step=6078.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  13%|█▎        | 156/1208 [04:25<29:49,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.576, train/loss_vlb_step=0.012, train/loss_step=0.576, global_step=6078.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  13%|█▎        | 156/1208 [04:25<29:49,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000253, train/loss_step=0.0754, global_step=6078.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  13%|█▎        | 157/1208 [04:26<29:43,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000253, train/loss_step=0.0754, global_step=6078.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  13%|█▎        | 157/1208 [04:26<29:43,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00454, train/loss_vlb_step=2.41e-5, train/loss_step=0.00454, global_step=6079.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  13%|█▎        | 158/1208 [04:27<29:36,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00454, train/loss_vlb_step=2.41e-5, train/loss_step=0.00454, global_step=6079.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  13%|█▎        | 158/1208 [04:27<29:36,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.629, train/loss_vlb_step=0.022, train/loss_step=0.629, global_step=6079.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]       Epoch 20:  13%|█▎        | 159/1208 [04:28<29:30,  1.69s/it, loss=0.18, v_num=0, train/loss_simple_step=0.629, train/loss_vlb_step=0.022, train/loss_step=0.629, global_step=6079.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  13%|█▎        | 159/1208 [04:28<29:30,  1.69s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0878, train/loss_vlb_step=0.000289, train/loss_step=0.0878, global_step=6079.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  13%|█▎        | 160/1208 [04:31<29:36,  1.70s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0878, train/loss_vlb_step=0.000289, train/loss_step=0.0878, global_step=6079.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  13%|█▎        | 160/1208 [04:31<29:36,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00598, train/loss_vlb_step=3.12e-5, train/loss_step=0.00598, global_step=6079.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  13%|█▎        | 161/1208 [04:32<29:30,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00598, train/loss_vlb_step=3.12e-5, train/loss_step=0.00598, global_step=6079.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  13%|█▎        | 161/1208 [04:32<29:30,  1.69s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000118, train/loss_step=0.0319, global_step=6080.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  13%|█▎        | 162/1208 [04:33<29:24,  1.69s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000118, train/loss_step=0.0319, global_step=6080.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  13%|█▎        | 162/1208 [04:33<29:24,  1.69s/it, loss=0.157, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000489, train/loss_step=0.149, global_step=6080.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  13%|█▎        | 163/1208 [04:34<29:18,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000489, train/loss_step=0.149, global_step=6080.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  13%|█▎        | 163/1208 [04:34<29:18,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0791, train/loss_vlb_step=0.000269, train/loss_step=0.0791, global_step=6080.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  14%|█▎        | 164/1208 [04:37<29:24,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0791, train/loss_vlb_step=0.000269, train/loss_step=0.0791, global_step=6080.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  14%|█▎        | 164/1208 [04:37<29:24,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0421, train/loss_vlb_step=0.000157, train/loss_step=0.0421, global_step=6080.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  14%|█▎        | 165/1208 [04:38<29:18,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0421, train/loss_vlb_step=0.000157, train/loss_step=0.0421, global_step=6080.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  14%|█▎        | 165/1208 [04:38<29:18,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00639, train/loss_vlb_step=3.11e-5, train/loss_step=0.00639, global_step=6081.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  14%|█▎        | 166/1208 [04:39<29:12,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00639, train/loss_vlb_step=3.11e-5, train/loss_step=0.00639, global_step=6081.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  14%|█▎        | 166/1208 [04:39<29:12,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=1.31e-5, train/loss_step=0.00217, global_step=6081.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  14%|█▍        | 167/1208 [04:40<29:06,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=1.31e-5, train/loss_step=0.00217, global_step=6081.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  14%|█▍        | 167/1208 [04:40<29:06,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00153, train/loss_step=0.277, global_step=6081.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  14%|█▍        | 168/1208 [04:43<29:12,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00153, train/loss_step=0.277, global_step=6081.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  14%|█▍        | 168/1208 [04:43<29:12,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00415, train/loss_vlb_step=2.2e-5, train/loss_step=0.00415, global_step=6081.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  14%|█▍        | 169/1208 [04:44<29:06,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00415, train/loss_vlb_step=2.2e-5, train/loss_step=0.00415, global_step=6081.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  14%|█▍        | 169/1208 [04:44<29:06,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000902, train/loss_step=0.232, global_step=6082.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  14%|█▍        | 170/1208 [04:45<29:00,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000902, train/loss_step=0.232, global_step=6082.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  14%|█▍        | 170/1208 [04:45<29:00,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.69e-5, train/loss_step=0.0126, global_step=6082.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  14%|█▍        | 171/1208 [04:46<28:55,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.69e-5, train/loss_step=0.0126, global_step=6082.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  14%|█▍        | 171/1208 [04:46<28:55,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00902, train/loss_vlb_step=4.23e-5, train/loss_step=0.00902, global_step=6082.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  14%|█▍        | 172/1208 [04:49<29:00,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00902, train/loss_vlb_step=4.23e-5, train/loss_step=0.00902, global_step=6082.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  14%|█▍        | 172/1208 [04:49<29:00,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.09e-5, train/loss_step=0.00182, global_step=6082.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  14%|█▍        | 173/1208 [04:50<28:55,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.09e-5, train/loss_step=0.00182, global_step=6082.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  14%|█▍        | 173/1208 [04:50<28:55,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00158, train/loss_step=0.316, global_step=6083.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  14%|█▍        | 174/1208 [04:51<28:49,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00158, train/loss_step=0.316, global_step=6083.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  14%|█▍        | 174/1208 [04:51<28:49,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00129, train/loss_step=0.286, global_step=6083.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  14%|█▍        | 175/1208 [04:52<28:44,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00129, train/loss_step=0.286, global_step=6083.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  14%|█▍        | 175/1208 [04:52<28:44,  1.67s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00961, train/loss_vlb_step=4.69e-5, train/loss_step=0.00961, global_step=6083.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  15%|█▍        | 176/1208 [04:54<28:49,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00961, train/loss_vlb_step=4.69e-5, train/loss_step=0.00961, global_step=6083.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  15%|█▍        | 176/1208 [04:54<28:49,  1.68s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00427, train/loss_vlb_step=2.24e-5, train/loss_step=0.00427, global_step=6083.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  15%|█▍        | 177/1208 [04:55<28:43,  1.67s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00427, train/loss_vlb_step=2.24e-5, train/loss_step=0.00427, global_step=6083.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  15%|█▍        | 177/1208 [04:55<28:43,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00274, train/loss_step=0.428, global_step=6084.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  15%|█▍        | 178/1208 [04:56<28:38,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00274, train/loss_step=0.428, global_step=6084.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  15%|█▍        | 178/1208 [04:56<28:38,  1.67s/it, loss=0.0997, v_num=0, train/loss_simple_step=0.00858, train/loss_vlb_step=4.21e-5, train/loss_step=0.00858, global_step=6084.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  15%|█▍        | 179/1208 [04:57<28:32,  1.66s/it, loss=0.0997, v_num=0, train/loss_simple_step=0.00858, train/loss_vlb_step=4.21e-5, train/loss_step=0.00858, global_step=6084.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  15%|█▍        | 179/1208 [04:57<28:32,  1.66s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.00297, train/loss_vlb_step=1.65e-5, train/loss_step=0.00297, global_step=6084.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  15%|█▍        | 180/1208 [05:00<28:38,  1.67s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.00297, train/loss_vlb_step=1.65e-5, train/loss_step=0.00297, global_step=6084.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  15%|█▍        | 180/1208 [05:00<28:38,  1.67s/it, loss=0.11, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00182, train/loss_step=0.299, global_step=6084.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]      Epoch 20:  15%|█▍        | 181/1208 [05:01<28:32,  1.67s/it, loss=0.11, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00182, train/loss_step=0.299, global_step=6084.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  15%|█▍        | 181/1208 [05:01<28:32,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00389, train/loss_step=0.439, global_step=6085.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  15%|█▌        | 182/1208 [05:02<28:27,  1.66s/it, loss=0.13, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00389, train/loss_step=0.439, global_step=6085.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  15%|█▌        | 182/1208 [05:02<28:27,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0331, train/loss_vlb_step=0.000126, train/loss_step=0.0331, global_step=6085.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  15%|█▌        | 183/1208 [05:03<28:22,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0331, train/loss_vlb_step=0.000126, train/loss_step=0.0331, global_step=6085.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  15%|█▌        | 183/1208 [05:03<28:22,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000594, train/loss_step=0.170, global_step=6085.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  15%|█▌        | 184/1208 [05:06<28:27,  1.67s/it, loss=0.129, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000594, train/loss_step=0.170, global_step=6085.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  15%|█▌        | 184/1208 [05:06<28:27,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=1.36e-5, train/loss_step=0.00231, global_step=6085.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  15%|█▌        | 185/1208 [05:07<28:21,  1.66s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=1.36e-5, train/loss_step=0.00231, global_step=6085.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  15%|█▌        | 185/1208 [05:07<28:21,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.00104, train/loss_step=0.227, global_step=6086.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  15%|█▌        | 186/1208 [05:08<28:16,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.00104, train/loss_step=0.227, global_step=6086.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  15%|█▌        | 186/1208 [05:08<28:16,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0044, train/loss_vlb_step=2.37e-5, train/loss_step=0.0044, global_step=6086.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  15%|█▌        | 187/1208 [05:09<28:11,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0044, train/loss_vlb_step=2.37e-5, train/loss_step=0.0044, global_step=6086.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  15%|█▌        | 187/1208 [05:09<28:11,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.54e-5, train/loss_step=0.0101, global_step=6086.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  16%|█▌        | 188/1208 [05:12<28:16,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.54e-5, train/loss_step=0.0101, global_step=6086.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  16%|█▌        | 188/1208 [05:12<28:16,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.71e-5, train/loss_step=0.00305, global_step=6086.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  16%|█▌        | 189/1208 [05:13<28:11,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.71e-5, train/loss_step=0.00305, global_step=6086.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  16%|█▌        | 189/1208 [05:13<28:11,  1.66s/it, loss=0.137, v_num=0, train/loss_simple_step=0.477, train/loss_vlb_step=0.00596, train/loss_step=0.477, global_step=6087.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  16%|█▌        | 190/1208 [05:14<28:06,  1.66s/it, loss=0.137, v_num=0, train/loss_simple_step=0.477, train/loss_vlb_step=0.00596, train/loss_step=0.477, global_step=6087.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  16%|█▌        | 190/1208 [05:14<28:06,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000482, train/loss_step=0.145, global_step=6087.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  16%|█▌        | 191/1208 [05:15<28:01,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000482, train/loss_step=0.145, global_step=6087.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  16%|█▌        | 191/1208 [05:15<28:01,  1.65s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.44e-5, train/loss_step=0.0237, global_step=6087.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  16%|█▌        | 192/1208 [05:18<28:05,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.44e-5, train/loss_step=0.0237, global_step=6087.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  16%|█▌        | 192/1208 [05:18<28:05,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000436, train/loss_step=0.131, global_step=6087.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  16%|█▌        | 193/1208 [05:19<28:00,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000436, train/loss_step=0.131, global_step=6087.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  16%|█▌        | 193/1208 [05:19<28:00,  1.66s/it, loss=0.143, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000515, train/loss_step=0.154, global_step=6088.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  16%|█▌        | 194/1208 [05:20<27:55,  1.65s/it, loss=0.143, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000515, train/loss_step=0.154, global_step=6088.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  16%|█▌        | 194/1208 [05:20<27:55,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.48e-5, train/loss_step=0.00251, global_step=6088.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  16%|█▌        | 195/1208 [05:21<27:50,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.48e-5, train/loss_step=0.00251, global_step=6088.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  16%|█▌        | 195/1208 [05:21<27:50,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.0019, train/loss_step=0.313, global_step=6088.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]     Epoch 20:  16%|█▌        | 196/1208 [05:24<27:55,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.0019, train/loss_step=0.313, global_step=6088.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  16%|█▌        | 196/1208 [05:24<27:55,  1.66s/it, loss=0.176, v_num=0, train/loss_simple_step=0.638, train/loss_vlb_step=0.0301, train/loss_step=0.638, global_step=6088.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  16%|█▋        | 197/1208 [05:25<27:50,  1.65s/it, loss=0.176, v_num=0, train/loss_simple_step=0.638, train/loss_vlb_step=0.0301, train/loss_step=0.638, global_step=6088.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  16%|█▋        | 197/1208 [05:25<27:50,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000518, train/loss_step=0.153, global_step=6089.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  16%|█▋        | 198/1208 [05:26<27:45,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000518, train/loss_step=0.153, global_step=6089.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  16%|█▋        | 198/1208 [05:26<27:45,  1.65s/it, loss=0.186, v_num=0, train/loss_simple_step=0.492, train/loss_vlb_step=0.00593, train/loss_step=0.492, global_step=6089.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  16%|█▋        | 199/1208 [05:27<27:40,  1.65s/it, loss=0.186, v_num=0, train/loss_simple_step=0.492, train/loss_vlb_step=0.00593, train/loss_step=0.492, global_step=6089.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  16%|█▋        | 199/1208 [05:27<27:40,  1.65s/it, loss=0.191, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=6089.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  17%|█▋        | 200/1208 [05:30<27:44,  1.65s/it, loss=0.191, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=6089.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  17%|█▋        | 200/1208 [05:30<27:44,  1.65s/it, loss=0.18, v_num=0, train/loss_simple_step=0.082, train/loss_vlb_step=0.000272, train/loss_step=0.082, global_step=6089.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  17%|█▋        | 201/1208 [05:31<27:40,  1.65s/it, loss=0.18, v_num=0, train/loss_simple_step=0.082, train/loss_vlb_step=0.000272, train/loss_step=0.082, global_step=6089.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  17%|█▋        | 201/1208 [05:31<27:40,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0778, train/loss_vlb_step=0.000261, train/loss_step=0.0778, global_step=6090.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  17%|█▋        | 202/1208 [05:32<27:35,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0778, train/loss_vlb_step=0.000261, train/loss_step=0.0778, global_step=6090.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  17%|█▋        | 202/1208 [05:32<27:35,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00434, train/loss_vlb_step=2.33e-5, train/loss_step=0.00434, global_step=6090.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  17%|█▋        | 203/1208 [05:33<27:30,  1.64s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00434, train/loss_vlb_step=2.33e-5, train/loss_step=0.00434, global_step=6090.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  17%|█▋        | 203/1208 [05:33<27:30,  1.64s/it, loss=0.181, v_num=0, train/loss_simple_step=0.584, train/loss_vlb_step=0.00616, train/loss_step=0.584, global_step=6090.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  17%|█▋        | 204/1208 [05:36<27:34,  1.65s/it, loss=0.181, v_num=0, train/loss_simple_step=0.584, train/loss_vlb_step=0.00616, train/loss_step=0.584, global_step=6090.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  17%|█▋        | 204/1208 [05:36<27:34,  1.65s/it, loss=0.191, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000716, train/loss_step=0.198, global_step=6090.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  17%|█▋        | 205/1208 [05:37<27:30,  1.65s/it, loss=0.191, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000716, train/loss_step=0.198, global_step=6090.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  17%|█▋        | 205/1208 [05:37<27:30,  1.65s/it, loss=0.186, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.00043, train/loss_step=0.131, global_step=6091.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  17%|█▋        | 206/1208 [05:38<27:25,  1.64s/it, loss=0.186, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.00043, train/loss_step=0.131, global_step=6091.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  17%|█▋        | 206/1208 [05:38<27:25,  1.64s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000128, train/loss_step=0.0339, global_step=6091.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  17%|█▋        | 207/1208 [05:39<27:20,  1.64s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000128, train/loss_step=0.0339, global_step=6091.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  17%|█▋        | 207/1208 [05:39<27:20,  1.64s/it, loss=0.193, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=6091.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  17%|█▋        | 208/1208 [05:42<27:25,  1.65s/it, loss=0.193, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=6091.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  17%|█▋        | 208/1208 [05:42<27:25,  1.65s/it, loss=0.202, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000592, train/loss_step=0.170, global_step=6091.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  17%|█▋        | 209/1208 [05:43<27:20,  1.64s/it, loss=0.202, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000592, train/loss_step=0.170, global_step=6091.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  17%|█▋        | 209/1208 [05:43<27:20,  1.64s/it, loss=0.195, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00191, train/loss_step=0.353, global_step=6092.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  17%|█▋        | 210/1208 [05:44<27:15,  1.64s/it, loss=0.195, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00191, train/loss_step=0.353, global_step=6092.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  17%|█▋        | 210/1208 [05:44<27:15,  1.64s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0722, train/loss_vlb_step=0.000247, train/loss_step=0.0722, global_step=6092.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  17%|█▋        | 211/1208 [05:45<27:11,  1.64s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0722, train/loss_vlb_step=0.000247, train/loss_step=0.0722, global_step=6092.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  17%|█▋        | 211/1208 [05:45<27:11,  1.64s/it, loss=0.201, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000842, train/loss_step=0.217, global_step=6092.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  18%|█▊        | 212/1208 [05:48<27:15,  1.64s/it, loss=0.201, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000842, train/loss_step=0.217, global_step=6092.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  18%|█▊        | 212/1208 [05:48<27:15,  1.64s/it, loss=0.211, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00173, train/loss_step=0.329, global_step=6092.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  18%|█▊        | 213/1208 [05:49<27:10,  1.64s/it, loss=0.211, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00173, train/loss_step=0.329, global_step=6092.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  18%|█▊        | 213/1208 [05:49<27:10,  1.64s/it, loss=0.211, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000493, train/loss_step=0.148, global_step=6093.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  18%|█▊        | 214/1208 [05:50<27:06,  1.64s/it, loss=0.211, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000493, train/loss_step=0.148, global_step=6093.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  18%|█▊        | 214/1208 [05:50<27:06,  1.64s/it, loss=0.211, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.15e-5, train/loss_step=0.00194, global_step=6093.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  18%|█▊        | 215/1208 [05:51<27:01,  1.63s/it, loss=0.211, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.15e-5, train/loss_step=0.00194, global_step=6093.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  18%|█▊        | 215/1208 [05:51<27:01,  1.63s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.46e-5, train/loss_step=0.0145, global_step=6093.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  18%|█▊        | 216/1208 [05:53<27:05,  1.64s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.46e-5, train/loss_step=0.0145, global_step=6093.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  18%|█▊        | 216/1208 [05:53<27:05,  1.64s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00807, train/loss_vlb_step=3.91e-5, train/loss_step=0.00807, global_step=6093.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  18%|█▊        | 217/1208 [05:54<27:01,  1.64s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00807, train/loss_vlb_step=3.91e-5, train/loss_step=0.00807, global_step=6093.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  18%|█▊        | 217/1208 [05:54<27:01,  1.64s/it, loss=0.197, v_num=0, train/loss_simple_step=0.801, train/loss_vlb_step=0.202, train/loss_step=0.801, global_step=6094.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]      Epoch 20:  18%|█▊        | 218/1208 [05:56<26:56,  1.63s/it, loss=0.197, v_num=0, train/loss_simple_step=0.801, train/loss_vlb_step=0.202, train/loss_step=0.801, global_step=6094.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  18%|█▊        | 218/1208 [05:56<26:56,  1.63s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0691, train/loss_vlb_step=0.000237, train/loss_step=0.0691, global_step=6094.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  18%|█▊        | 219/1208 [05:57<26:52,  1.63s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0691, train/loss_vlb_step=0.000237, train/loss_step=0.0691, global_step=6094.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  18%|█▊        | 219/1208 [05:57<26:52,  1.63s/it, loss=0.176, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000338, train/loss_step=0.102, global_step=6094.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  18%|█▊        | 220/1208 [05:59<26:56,  1.64s/it, loss=0.176, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000338, train/loss_step=0.102, global_step=6094.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  18%|█▊        | 220/1208 [05:59<26:56,  1.64s/it, loss=0.18, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000601, train/loss_step=0.173, global_step=6094.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  18%|█▊        | 221/1208 [06:00<26:51,  1.63s/it, loss=0.18, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000601, train/loss_step=0.173, global_step=6094.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  18%|█▊        | 221/1208 [06:00<26:51,  1.63s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.54e-5, train/loss_step=0.0125, global_step=6095.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  18%|█▊        | 222/1208 [06:01<26:47,  1.63s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.54e-5, train/loss_step=0.0125, global_step=6095.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  18%|█▊        | 222/1208 [06:01<26:47,  1.63s/it, loss=0.2, v_num=0, train/loss_simple_step=0.474, train/loss_vlb_step=0.00401, train/loss_step=0.474, global_step=6095.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  18%|█▊        | 223/1208 [06:02<26:42,  1.63s/it, loss=0.2, v_num=0, train/loss_simple_step=0.474, train/loss_vlb_step=0.00401, train/loss_step=0.474, global_step=6095.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  18%|█▊        | 223/1208 [06:02<26:42,  1.63s/it, loss=0.172, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.7e-5, train/loss_step=0.016, global_step=6095.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  19%|█▊        | 224/1208 [06:05<26:46,  1.63s/it, loss=0.172, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.7e-5, train/loss_step=0.016, global_step=6095.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  19%|█▊        | 224/1208 [06:05<26:46,  1.63s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.88e-5, train/loss_step=0.0105, global_step=6095.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  19%|█▊        | 225/1208 [06:06<26:42,  1.63s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.88e-5, train/loss_step=0.0105, global_step=6095.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  19%|█▊        | 225/1208 [06:06<26:42,  1.63s/it, loss=0.164, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000539, train/loss_step=0.158, global_step=6096.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  19%|█▊        | 226/1208 [06:07<26:38,  1.63s/it, loss=0.164, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000539, train/loss_step=0.158, global_step=6096.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  19%|█▊        | 226/1208 [06:07<26:38,  1.63s/it, loss=0.173, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000748, train/loss_step=0.206, global_step=6096.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  19%|█▉        | 227/1208 [06:08<26:33,  1.62s/it, loss=0.173, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000748, train/loss_step=0.206, global_step=6096.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  19%|█▉        | 227/1208 [06:08<26:33,  1.62s/it, loss=0.196, v_num=0, train/loss_simple_step=0.592, train/loss_vlb_step=0.0151, train/loss_step=0.592, global_step=6096.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  19%|█▉        | 228/1208 [06:11<26:37,  1.63s/it, loss=0.196, v_num=0, train/loss_simple_step=0.592, train/loss_vlb_step=0.0151, train/loss_step=0.592, global_step=6096.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  19%|█▉        | 228/1208 [06:11<26:37,  1.63s/it, loss=0.211, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00537, train/loss_step=0.454, global_step=6096.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  19%|█▉        | 229/1208 [06:12<26:33,  1.63s/it, loss=0.211, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00537, train/loss_step=0.454, global_step=6096.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  19%|█▉        | 229/1208 [06:12<26:33,  1.63s/it, loss=0.195, v_num=0, train/loss_simple_step=0.046, train/loss_vlb_step=0.000163, train/loss_step=0.046, global_step=6097.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  19%|█▉        | 230/1208 [06:13<26:29,  1.62s/it, loss=0.195, v_num=0, train/loss_simple_step=0.046, train/loss_vlb_step=0.000163, train/loss_step=0.046, global_step=6097.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  19%|█▉        | 230/1208 [06:13<26:29,  1.62s/it, loss=0.204, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00118, train/loss_step=0.257, global_step=6097.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  19%|█▉        | 231/1208 [06:14<26:24,  1.62s/it, loss=0.204, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00118, train/loss_step=0.257, global_step=6097.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  19%|█▉        | 231/1208 [06:14<26:24,  1.62s/it, loss=0.202, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000555, train/loss_step=0.163, global_step=6097.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  19%|█▉        | 232/1208 [06:17<26:28,  1.63s/it, loss=0.202, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000555, train/loss_step=0.163, global_step=6097.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  19%|█▉        | 232/1208 [06:17<26:28,  1.63s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0698, train/loss_vlb_step=0.000234, train/loss_step=0.0698, global_step=6097.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  19%|█▉        | 233/1208 [06:18<26:24,  1.63s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0698, train/loss_vlb_step=0.000234, train/loss_step=0.0698, global_step=6097.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  19%|█▉        | 233/1208 [06:18<26:24,  1.63s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0574, train/loss_vlb_step=0.0002, train/loss_step=0.0574, global_step=6098.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  19%|█▉        | 234/1208 [06:19<26:20,  1.62s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0574, train/loss_vlb_step=0.0002, train/loss_step=0.0574, global_step=6098.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  19%|█▉        | 234/1208 [06:19<26:20,  1.62s/it, loss=0.19, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=6098.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  19%|█▉        | 235/1208 [06:20<26:16,  1.62s/it, loss=0.19, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=6098.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  19%|█▉        | 235/1208 [06:20<26:16,  1.62s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00635, train/loss_vlb_step=3.19e-5, train/loss_step=0.00635, global_step=6098.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  20%|█▉        | 236/1208 [06:23<26:19,  1.63s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00635, train/loss_vlb_step=3.19e-5, train/loss_step=0.00635, global_step=6098.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  20%|█▉        | 236/1208 [06:23<26:19,  1.63s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.62e-5, train/loss_step=0.00278, global_step=6098.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  20%|█▉        | 237/1208 [06:24<26:15,  1.62s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.62e-5, train/loss_step=0.00278, global_step=6098.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  20%|█▉        | 237/1208 [06:24<26:15,  1.62s/it, loss=0.157, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000537, train/loss_step=0.160, global_step=6099.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  20%|█▉        | 238/1208 [06:25<26:11,  1.62s/it, loss=0.157, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000537, train/loss_step=0.160, global_step=6099.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  20%|█▉        | 238/1208 [06:25<26:11,  1.62s/it, loss=0.166, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00113, train/loss_step=0.252, global_step=6099.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  20%|█▉        | 239/1208 [06:26<26:07,  1.62s/it, loss=0.166, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00113, train/loss_step=0.252, global_step=6099.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  20%|█▉        | 239/1208 [06:26<26:07,  1.62s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=6.5e-6, train/loss_step=0.00108, global_step=6099.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  20%|█▉        | 240/1208 [06:29<26:10,  1.62s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=6.5e-6, train/loss_step=0.00108, global_step=6099.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  20%|█▉        | 240/1208 [06:29<26:10,  1.62s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.23e-5, train/loss_step=0.0142, global_step=6099.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  20%|█▉        | 241/1208 [06:30<26:06,  1.62s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.23e-5, train/loss_step=0.0142, global_step=6099.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  20%|█▉        | 241/1208 [06:30<26:06,  1.62s/it, loss=0.171, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00238, train/loss_step=0.375, global_step=6100.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  20%|██        | 242/1208 [06:31<26:02,  1.62s/it, loss=0.171, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00238, train/loss_step=0.375, global_step=6100.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  20%|██        | 242/1208 [06:31<26:02,  1.62s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=0.000103, train/loss_step=0.0252, global_step=6100.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  20%|██        | 243/1208 [06:32<25:58,  1.62s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=0.000103, train/loss_step=0.0252, global_step=6100.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  20%|██        | 243/1208 [06:32<25:58,  1.62s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0534, train/loss_vlb_step=0.00018, train/loss_step=0.0534, global_step=6100.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  20%|██        | 244/1208 [06:35<26:01,  1.62s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0534, train/loss_vlb_step=0.00018, train/loss_step=0.0534, global_step=6100.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  20%|██        | 244/1208 [06:35<26:01,  1.62s/it, loss=0.164, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00122, train/loss_step=0.272, global_step=6100.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  20%|██        | 245/1208 [06:36<25:57,  1.62s/it, loss=0.164, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00122, train/loss_step=0.272, global_step=6100.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  20%|██        | 245/1208 [06:36<25:57,  1.62s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0798, train/loss_vlb_step=0.000266, train/loss_step=0.0798, global_step=6101.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  20%|██        | 246/1208 [06:37<25:53,  1.62s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0798, train/loss_vlb_step=0.000266, train/loss_step=0.0798, global_step=6101.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  20%|██        | 246/1208 [06:37<25:53,  1.62s/it, loss=0.159, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000722, train/loss_step=0.192, global_step=6101.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  20%|██        | 247/1208 [06:38<25:49,  1.61s/it, loss=0.159, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000722, train/loss_step=0.192, global_step=6101.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  20%|██        | 247/1208 [06:38<25:49,  1.61s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0558, train/loss_vlb_step=0.000195, train/loss_step=0.0558, global_step=6101.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  21%|██        | 248/1208 [06:41<25:53,  1.62s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0558, train/loss_vlb_step=0.000195, train/loss_step=0.0558, global_step=6101.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  21%|██        | 248/1208 [06:41<25:53,  1.62s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0391, train/loss_vlb_step=0.000145, train/loss_step=0.0391, global_step=6101.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  21%|██        | 249/1208 [06:42<25:49,  1.62s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0391, train/loss_vlb_step=0.000145, train/loss_step=0.0391, global_step=6101.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  21%|██        | 249/1208 [06:42<25:49,  1.62s/it, loss=0.11, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=9.26e-5, train/loss_step=0.022, global_step=6102.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  21%|██        | 250/1208 [06:43<25:45,  1.61s/it, loss=0.11, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=9.26e-5, train/loss_step=0.022, global_step=6102.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  21%|██        | 250/1208 [06:43<25:45,  1.61s/it, loss=0.106, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000608, train/loss_step=0.176, global_step=6102.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  21%|██        | 251/1208 [06:44<25:41,  1.61s/it, loss=0.106, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000608, train/loss_step=0.176, global_step=6102.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  21%|██        | 251/1208 [06:44<25:41,  1.61s/it, loss=0.104, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000409, train/loss_step=0.124, global_step=6102.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  21%|██        | 252/1208 [06:47<25:44,  1.62s/it, loss=0.104, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000409, train/loss_step=0.124, global_step=6102.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  21%|██        | 252/1208 [06:47<25:44,  1.62s/it, loss=0.108, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.00051, train/loss_step=0.147, global_step=6102.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  21%|██        | 253/1208 [06:48<25:40,  1.61s/it, loss=0.108, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.00051, train/loss_step=0.147, global_step=6102.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  21%|██        | 253/1208 [06:48<25:40,  1.61s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.45e-5, train/loss_step=0.0237, global_step=6103.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  21%|██        | 254/1208 [06:49<25:36,  1.61s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.45e-5, train/loss_step=0.0237, global_step=6103.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  21%|██        | 254/1208 [06:49<25:36,  1.61s/it, loss=0.113, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.00093, train/loss_step=0.231, global_step=6103.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  21%|██        | 255/1208 [06:50<25:33,  1.61s/it, loss=0.113, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.00093, train/loss_step=0.231, global_step=6103.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  21%|██        | 255/1208 [06:50<25:33,  1.61s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0881, train/loss_vlb_step=0.00029, train/loss_step=0.0881, global_step=6103.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  21%|██        | 256/1208 [06:53<25:36,  1.61s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0881, train/loss_vlb_step=0.00029, train/loss_step=0.0881, global_step=6103.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  21%|██        | 256/1208 [06:53<25:36,  1.61s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0934, train/loss_vlb_step=0.000307, train/loss_step=0.0934, global_step=6103.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  21%|██▏       | 257/1208 [06:54<25:32,  1.61s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0934, train/loss_vlb_step=0.000307, train/loss_step=0.0934, global_step=6103.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  21%|██▏       | 257/1208 [06:54<25:32,  1.61s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00525, train/loss_vlb_step=2.74e-5, train/loss_step=0.00525, global_step=6104.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  21%|██▏       | 258/1208 [06:55<25:28,  1.61s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00525, train/loss_vlb_step=2.74e-5, train/loss_step=0.00525, global_step=6104.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  21%|██▏       | 258/1208 [06:55<25:28,  1.61s/it, loss=0.118, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00195, train/loss_step=0.350, global_step=6104.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  21%|██▏       | 259/1208 [06:56<25:24,  1.61s/it, loss=0.118, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00195, train/loss_step=0.350, global_step=6104.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  21%|██▏       | 259/1208 [06:56<25:24,  1.61s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.00011, train/loss_step=0.0285, global_step=6104.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  22%|██▏       | 260/1208 [06:59<25:27,  1.61s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.00011, train/loss_step=0.0285, global_step=6104.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  22%|██▏       | 260/1208 [06:59<25:27,  1.61s/it, loss=0.135, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00172, train/loss_step=0.311, global_step=6104.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  22%|██▏       | 261/1208 [07:00<25:24,  1.61s/it, loss=0.135, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00172, train/loss_step=0.311, global_step=6104.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  22%|██▏       | 261/1208 [07:00<25:24,  1.61s/it, loss=0.116, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.17e-5, train/loss_step=0.002, global_step=6105.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  22%|██▏       | 262/1208 [07:01<25:20,  1.61s/it, loss=0.116, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.17e-5, train/loss_step=0.002, global_step=6105.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  22%|██▏       | 262/1208 [07:01<25:20,  1.61s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.00023, train/loss_step=0.0676, global_step=6105.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  22%|██▏       | 263/1208 [07:02<25:16,  1.60s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.00023, train/loss_step=0.0676, global_step=6105.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  22%|██▏       | 263/1208 [07:02<25:16,  1.60s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00711, train/loss_vlb_step=3.59e-5, train/loss_step=0.00711, global_step=6105.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  22%|██▏       | 264/1208 [07:04<25:19,  1.61s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00711, train/loss_vlb_step=3.59e-5, train/loss_step=0.00711, global_step=6105.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  22%|██▏       | 264/1208 [07:04<25:19,  1.61s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.77e-5, train/loss_step=0.0135, global_step=6105.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  22%|██▏       | 265/1208 [07:05<25:15,  1.61s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.77e-5, train/loss_step=0.0135, global_step=6105.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  22%|██▏       | 265/1208 [07:05<25:15,  1.61s/it, loss=0.0993, v_num=0, train/loss_simple_step=0.00867, train/loss_vlb_step=4.1e-5, train/loss_step=0.00867, global_step=6106.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  22%|██▏       | 266/1208 [07:06<25:11,  1.61s/it, loss=0.0993, v_num=0, train/loss_simple_step=0.00867, train/loss_vlb_step=4.1e-5, train/loss_step=0.00867, global_step=6106.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  22%|██▏       | 266/1208 [07:06<25:11,  1.61s/it, loss=0.105, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00119, train/loss_step=0.304, global_step=6106.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  22%|██▏       | 267/1208 [07:07<25:08,  1.60s/it, loss=0.105, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00119, train/loss_step=0.304, global_step=6106.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  22%|██▏       | 267/1208 [07:07<25:08,  1.60s/it, loss=0.12, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00303, train/loss_step=0.353, global_step=6106.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  22%|██▏       | 268/1208 [07:10<25:11,  1.61s/it, loss=0.12, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00303, train/loss_step=0.353, global_step=6106.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  22%|██▏       | 268/1208 [07:10<25:11,  1.61s/it, loss=0.14, v_num=0, train/loss_simple_step=0.449, train/loss_vlb_step=0.00289, train/loss_step=0.449, global_step=6106.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  22%|██▏       | 269/1208 [07:11<25:07,  1.61s/it, loss=0.14, v_num=0, train/loss_simple_step=0.449, train/loss_vlb_step=0.00289, train/loss_step=0.449, global_step=6106.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  22%|██▏       | 269/1208 [07:11<25:07,  1.61s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00456, train/loss_vlb_step=2.35e-5, train/loss_step=0.00456, global_step=6107.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  22%|██▏       | 270/1208 [07:12<25:03,  1.60s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00456, train/loss_vlb_step=2.35e-5, train/loss_step=0.00456, global_step=6107.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  22%|██▏       | 270/1208 [07:12<25:03,  1.60s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0905, train/loss_vlb_step=0.000298, train/loss_step=0.0905, global_step=6107.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  22%|██▏       | 271/1208 [07:13<25:00,  1.60s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0905, train/loss_vlb_step=0.000298, train/loss_step=0.0905, global_step=6107.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  22%|██▏       | 271/1208 [07:13<25:00,  1.60s/it, loss=0.134, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000348, train/loss_step=0.104, global_step=6107.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  23%|██▎       | 272/1208 [07:16<25:02,  1.61s/it, loss=0.134, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000348, train/loss_step=0.104, global_step=6107.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  23%|██▎       | 272/1208 [07:16<25:02,  1.61s/it, loss=0.145, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00196, train/loss_step=0.355, global_step=6107.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  23%|██▎       | 273/1208 [07:17<24:59,  1.60s/it, loss=0.145, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00196, train/loss_step=0.355, global_step=6107.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  23%|██▎       | 273/1208 [07:17<24:59,  1.60s/it, loss=0.15, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000422, train/loss_step=0.128, global_step=6108.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  23%|██▎       | 274/1208 [07:18<24:55,  1.60s/it, loss=0.15, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000422, train/loss_step=0.128, global_step=6108.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  23%|██▎       | 274/1208 [07:18<24:55,  1.60s/it, loss=0.179, v_num=0, train/loss_simple_step=0.816, train/loss_vlb_step=0.206, train/loss_step=0.816, global_step=6108.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  23%|██▎       | 275/1208 [07:19<24:52,  1.60s/it, loss=0.179, v_num=0, train/loss_simple_step=0.816, train/loss_vlb_step=0.206, train/loss_step=0.816, global_step=6108.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  23%|██▎       | 275/1208 [07:19<24:52,  1.60s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0595, train/loss_vlb_step=0.000202, train/loss_step=0.0595, global_step=6108.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  23%|██▎       | 276/1208 [07:22<24:54,  1.60s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0595, train/loss_vlb_step=0.000202, train/loss_step=0.0595, global_step=6108.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  23%|██▎       | 276/1208 [07:22<24:54,  1.60s/it, loss=0.184, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000807, train/loss_step=0.220, global_step=6108.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  23%|██▎       | 277/1208 [07:23<24:51,  1.60s/it, loss=0.184, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000807, train/loss_step=0.220, global_step=6108.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  23%|██▎       | 277/1208 [07:23<24:51,  1.60s/it, loss=0.194, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000796, train/loss_step=0.217, global_step=6109.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  23%|██▎       | 278/1208 [07:24<24:47,  1.60s/it, loss=0.194, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000796, train/loss_step=0.217, global_step=6109.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  23%|██▎       | 278/1208 [07:24<24:47,  1.60s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00443, train/loss_vlb_step=2.35e-5, train/loss_step=0.00443, global_step=6109.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  23%|██▎       | 279/1208 [07:25<24:43,  1.60s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00443, train/loss_vlb_step=2.35e-5, train/loss_step=0.00443, global_step=6109.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  23%|██▎       | 279/1208 [07:25<24:43,  1.60s/it, loss=0.184, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000536, train/loss_step=0.158, global_step=6109.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  23%|██▎       | 280/1208 [07:28<24:46,  1.60s/it, loss=0.184, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000536, train/loss_step=0.158, global_step=6109.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  23%|██▎       | 280/1208 [07:28<24:46,  1.60s/it, loss=0.175, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000464, train/loss_step=0.137, global_step=6109.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  23%|██▎       | 281/1208 [07:29<24:43,  1.60s/it, loss=0.175, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000464, train/loss_step=0.137, global_step=6109.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  23%|██▎       | 281/1208 [07:29<24:43,  1.60s/it, loss=0.178, v_num=0, train/loss_simple_step=0.068, train/loss_vlb_step=0.000231, train/loss_step=0.068, global_step=6110.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  23%|██▎       | 282/1208 [07:30<24:39,  1.60s/it, loss=0.178, v_num=0, train/loss_simple_step=0.068, train/loss_vlb_step=0.000231, train/loss_step=0.068, global_step=6110.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  23%|██▎       | 282/1208 [07:30<24:39,  1.60s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0303, train/loss_vlb_step=0.000112, train/loss_step=0.0303, global_step=6110.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  23%|██▎       | 283/1208 [07:31<24:36,  1.60s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0303, train/loss_vlb_step=0.000112, train/loss_step=0.0303, global_step=6110.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  23%|██▎       | 283/1208 [07:31<24:36,  1.60s/it, loss=0.188, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000937, train/loss_step=0.233, global_step=6110.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  24%|██▎       | 284/1208 [07:34<24:38,  1.60s/it, loss=0.188, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000937, train/loss_step=0.233, global_step=6110.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  24%|██▎       | 284/1208 [07:34<24:38,  1.60s/it, loss=0.187, v_num=0, train/loss_simple_step=0.00428, train/loss_vlb_step=2.28e-5, train/loss_step=0.00428, global_step=6110.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  24%|██▎       | 285/1208 [07:35<24:35,  1.60s/it, loss=0.187, v_num=0, train/loss_simple_step=0.00428, train/loss_vlb_step=2.28e-5, train/loss_step=0.00428, global_step=6110.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  24%|██▎       | 285/1208 [07:35<24:35,  1.60s/it, loss=0.2, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00112, train/loss_step=0.261, global_step=6111.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]      Epoch 20:  24%|██▎       | 286/1208 [07:36<24:31,  1.60s/it, loss=0.2, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00112, train/loss_step=0.261, global_step=6111.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  24%|██▎       | 286/1208 [07:36<24:31,  1.60s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00478, train/loss_vlb_step=2.51e-5, train/loss_step=0.00478, global_step=6111.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  24%|██▍       | 287/1208 [07:37<24:28,  1.59s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00478, train/loss_vlb_step=2.51e-5, train/loss_step=0.00478, global_step=6111.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  24%|██▍       | 287/1208 [07:37<24:28,  1.59s/it, loss=0.174, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000431, train/loss_step=0.131, global_step=6111.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  24%|██▍       | 288/1208 [07:40<24:30,  1.60s/it, loss=0.174, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000431, train/loss_step=0.131, global_step=6111.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  24%|██▍       | 288/1208 [07:40<24:30,  1.60s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0811, train/loss_vlb_step=0.000268, train/loss_step=0.0811, global_step=6111.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  24%|██▍       | 289/1208 [07:41<24:27,  1.60s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0811, train/loss_vlb_step=0.000268, train/loss_step=0.0811, global_step=6111.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  24%|██▍       | 289/1208 [07:41<24:27,  1.60s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0382, train/loss_vlb_step=0.000143, train/loss_step=0.0382, global_step=6112.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  24%|██▍       | 290/1208 [07:42<24:23,  1.59s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0382, train/loss_vlb_step=0.000143, train/loss_step=0.0382, global_step=6112.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  24%|██▍       | 290/1208 [07:42<24:23,  1.59s/it, loss=0.158, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=6112.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  24%|██▍       | 291/1208 [07:43<24:20,  1.59s/it, loss=0.158, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=6112.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  24%|██▍       | 291/1208 [07:43<24:20,  1.59s/it, loss=0.16, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000438, train/loss_step=0.131, global_step=6112.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  24%|██▍       | 292/1208 [07:46<24:22,  1.60s/it, loss=0.16, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000438, train/loss_step=0.131, global_step=6112.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  24%|██▍       | 292/1208 [07:46<24:22,  1.60s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.7e-5, train/loss_step=0.0102, global_step=6112.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  24%|██▍       | 293/1208 [07:47<24:19,  1.59s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.7e-5, train/loss_step=0.0102, global_step=6112.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  24%|██▍       | 293/1208 [07:47<24:19,  1.59s/it, loss=0.152, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00134, train/loss_step=0.313, global_step=6113.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  24%|██▍       | 294/1208 [07:48<24:15,  1.59s/it, loss=0.152, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00134, train/loss_step=0.313, global_step=6113.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  24%|██▍       | 294/1208 [07:48<24:15,  1.59s/it, loss=0.118, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000472, train/loss_step=0.143, global_step=6113.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  24%|██▍       | 295/1208 [07:49<24:12,  1.59s/it, loss=0.118, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000472, train/loss_step=0.143, global_step=6113.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  24%|██▍       | 295/1208 [07:49<24:12,  1.59s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000224, train/loss_step=0.0676, global_step=6113.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  25%|██▍       | 296/1208 [07:52<24:14,  1.60s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000224, train/loss_step=0.0676, global_step=6113.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  25%|██▍       | 296/1208 [07:52<24:14,  1.60s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.14e-5, train/loss_step=0.00192, global_step=6113.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  25%|██▍       | 297/1208 [07:53<24:11,  1.59s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.14e-5, train/loss_step=0.00192, global_step=6113.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  25%|██▍       | 297/1208 [07:53<24:11,  1.59s/it, loss=0.104, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.00046, train/loss_step=0.138, global_step=6114.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  25%|██▍       | 298/1208 [07:54<24:08,  1.59s/it, loss=0.104, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.00046, train/loss_step=0.138, global_step=6114.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  25%|██▍       | 298/1208 [07:54<24:08,  1.59s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.21e-5, train/loss_step=0.0177, global_step=6114.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  25%|██▍       | 299/1208 [07:55<24:04,  1.59s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.21e-5, train/loss_step=0.0177, global_step=6114.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  25%|██▍       | 299/1208 [07:55<24:04,  1.59s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.19e-5, train/loss_step=0.023, global_step=6114.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  25%|██▍       | 300/1208 [07:58<24:07,  1.59s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.19e-5, train/loss_step=0.023, global_step=6114.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  25%|██▍       | 300/1208 [07:58<24:07,  1.59s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.95e-5, train/loss_step=0.0162, global_step=6114.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.86it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.84it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:25,  1.85it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.85it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.84it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.85it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.84it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.85it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.84it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.84it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.85it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.84it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.84it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.84it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.84it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.84it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.84it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.84it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.84it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.84it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.84it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.84it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.84it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:18,  1.84it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:18,  1.84it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.85it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.85it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.84it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.85it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.84it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.85it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.84it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.85it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.84it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.84it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.84it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.84it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.84it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.85it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.84it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.84it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.84it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.84it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.83it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.83it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.84it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.85it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.84it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.84it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.83it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.84it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.84it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.83it/s]DDIM Sampler:  70%|███████   | 35/50 [00:18<00:08,  1.84it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.84it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.83it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.84it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.84it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.84it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.83it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.83it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.84it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.84it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.84it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.83it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.84it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.82it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.84it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.84it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.84it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.84it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.84it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.84it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.84it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.84it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.84it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.84it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.83it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:24<00:02,  1.84it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.83it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.84it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.83it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.85it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.83it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.84it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.83it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.83it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]Epoch 20:  25%|██▍       | 301/1208 [08:27<25:29,  1.69s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.95e-5, train/loss_step=0.0162, global_step=6114.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  25%|██▍       | 301/1208 [08:27<25:29,  1.69s/it, loss=0.0894, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000101, train/loss_step=0.0253, global_step=6115.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  25%|██▌       | 302/1208 [08:28<25:26,  1.68s/it, loss=0.0894, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000101, train/loss_step=0.0253, global_step=6115.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  25%|██▌       | 302/1208 [08:28<25:26,  1.68s/it, loss=0.0887, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.72e-5, train/loss_step=0.016, global_step=6115.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  25%|██▌       | 303/1208 [08:29<25:22,  1.68s/it, loss=0.0887, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.72e-5, train/loss_step=0.016, global_step=6115.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  25%|██▌       | 303/1208 [08:29<25:22,  1.68s/it, loss=0.0826, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=6115.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  25%|██▌       | 304/1208 [08:32<25:24,  1.69s/it, loss=0.0826, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=6115.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  25%|██▌       | 304/1208 [08:32<25:24,  1.69s/it, loss=0.0825, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=1.47e-5, train/loss_step=0.00259, global_step=6115.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  25%|██▌       | 305/1208 [08:33<25:20,  1.68s/it, loss=0.0825, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=1.47e-5, train/loss_step=0.00259, global_step=6115.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  25%|██▌       | 305/1208 [08:33<25:20,  1.68s/it, loss=0.0724, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000198, train/loss_step=0.0588, global_step=6116.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  25%|██▌       | 306/1208 [08:34<25:17,  1.68s/it, loss=0.0724, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000198, train/loss_step=0.0588, global_step=6116.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  25%|██▌       | 306/1208 [08:34<25:17,  1.68s/it, loss=0.0825, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000776, train/loss_step=0.207, global_step=6116.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  25%|██▌       | 307/1208 [08:35<25:13,  1.68s/it, loss=0.0825, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000776, train/loss_step=0.207, global_step=6116.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  25%|██▌       | 307/1208 [08:35<25:13,  1.68s/it, loss=0.0887, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.000912, train/loss_step=0.254, global_step=6116.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  25%|██▌       | 308/1208 [08:38<25:15,  1.68s/it, loss=0.0887, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.000912, train/loss_step=0.254, global_step=6116.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  25%|██▌       | 308/1208 [08:38<25:15,  1.68s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00122, train/loss_step=0.252, global_step=6116.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  26%|██▌       | 309/1208 [08:39<25:11,  1.68s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00122, train/loss_step=0.252, global_step=6116.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  26%|██▌       | 309/1208 [08:39<25:11,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.465, train/loss_vlb_step=0.00604, train/loss_step=0.465, global_step=6117.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  26%|██▌       | 310/1208 [08:40<25:08,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.465, train/loss_vlb_step=0.00604, train/loss_step=0.465, global_step=6117.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  26%|██▌       | 310/1208 [08:40<25:08,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.446, train/loss_vlb_step=0.00432, train/loss_step=0.446, global_step=6117.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  26%|██▌       | 311/1208 [08:41<25:04,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.446, train/loss_vlb_step=0.00432, train/loss_step=0.446, global_step=6117.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  26%|██▌       | 311/1208 [08:41<25:04,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00649, train/loss_vlb_step=3.24e-5, train/loss_step=0.00649, global_step=6117.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  26%|██▌       | 312/1208 [08:44<25:06,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00649, train/loss_vlb_step=3.24e-5, train/loss_step=0.00649, global_step=6117.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  26%|██▌       | 312/1208 [08:44<25:06,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00146, train/loss_step=0.300, global_step=6117.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  26%|██▌       | 313/1208 [08:45<25:02,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00146, train/loss_step=0.300, global_step=6117.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  26%|██▌       | 313/1208 [08:45<25:02,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000333, train/loss_step=0.101, global_step=6118.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  26%|██▌       | 314/1208 [08:46<24:59,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000333, train/loss_step=0.101, global_step=6118.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  26%|██▌       | 314/1208 [08:46<24:59,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.21e-5, train/loss_step=0.00205, global_step=6118.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  26%|██▌       | 315/1208 [08:47<24:55,  1.67s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.21e-5, train/loss_step=0.00205, global_step=6118.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  26%|██▌       | 315/1208 [08:47<24:55,  1.67s/it, loss=0.123, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.000106, train/loss_step=0.027, global_step=6118.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  26%|██▌       | 316/1208 [08:50<24:58,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.000106, train/loss_step=0.027, global_step=6118.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  26%|██▌       | 316/1208 [08:50<24:58,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=1.05e-5, train/loss_step=0.00177, global_step=6118.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  26%|██▌       | 317/1208 [08:51<24:54,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=1.05e-5, train/loss_step=0.00177, global_step=6118.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  26%|██▌       | 317/1208 [08:51<24:54,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.00014, train/loss_step=0.0378, global_step=6119.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  26%|██▋       | 318/1208 [08:52<24:51,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.00014, train/loss_step=0.0378, global_step=6119.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  26%|██▋       | 318/1208 [08:52<24:51,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000949, train/loss_step=0.250, global_step=6119.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  26%|██▋       | 319/1208 [08:53<24:47,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000949, train/loss_step=0.250, global_step=6119.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  26%|██▋       | 319/1208 [08:53<24:47,  1.67s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.29e-5, train/loss_step=0.0022, global_step=6119.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  26%|██▋       | 320/1208 [08:57<24:50,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.29e-5, train/loss_step=0.0022, global_step=6119.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  26%|██▋       | 320/1208 [08:57<24:50,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000745, train/loss_step=0.214, global_step=6119.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  27%|██▋       | 321/1208 [08:58<24:47,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000745, train/loss_step=0.214, global_step=6119.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  27%|██▋       | 321/1208 [08:58<24:47,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.02e-5, train/loss_step=0.0137, global_step=6120.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  27%|██▋       | 322/1208 [08:59<24:43,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.02e-5, train/loss_step=0.0137, global_step=6120.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  27%|██▋       | 322/1208 [08:59<24:43,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00143, train/loss_step=0.286, global_step=6120.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  27%|██▋       | 323/1208 [09:00<24:40,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00143, train/loss_step=0.286, global_step=6120.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  27%|██▋       | 323/1208 [09:00<24:40,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000289, train/loss_step=0.087, global_step=6120.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  27%|██▋       | 324/1208 [09:03<24:42,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000289, train/loss_step=0.087, global_step=6120.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  27%|██▋       | 324/1208 [09:03<24:42,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00731, train/loss_vlb_step=3.65e-5, train/loss_step=0.00731, global_step=6120.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  27%|██▋       | 325/1208 [09:04<24:39,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00731, train/loss_vlb_step=3.65e-5, train/loss_step=0.00731, global_step=6120.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  27%|██▋       | 325/1208 [09:04<24:39,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000631, train/loss_step=0.179, global_step=6121.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  27%|██▋       | 326/1208 [09:05<24:35,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000631, train/loss_step=0.179, global_step=6121.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  27%|██▋       | 326/1208 [09:05<24:35,  1.67s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000109, train/loss_step=0.0282, global_step=6121.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  27%|██▋       | 327/1208 [09:06<24:32,  1.67s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000109, train/loss_step=0.0282, global_step=6121.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  27%|██▋       | 327/1208 [09:06<24:32,  1.67s/it, loss=0.144, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000628, train/loss_step=0.181, global_step=6121.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  27%|██▋       | 328/1208 [09:09<24:35,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000628, train/loss_step=0.181, global_step=6121.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  27%|██▋       | 328/1208 [09:09<24:35,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000787, train/loss_step=0.196, global_step=6121.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  27%|██▋       | 329/1208 [09:10<24:31,  1.67s/it, loss=0.142, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000787, train/loss_step=0.196, global_step=6121.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  27%|██▋       | 329/1208 [09:10<24:31,  1.67s/it, loss=0.124, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=6122.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  27%|██▋       | 330/1208 [09:11<24:28,  1.67s/it, loss=0.124, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=6122.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  27%|██▋       | 330/1208 [09:11<24:28,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.504, train/loss_vlb_step=0.0134, train/loss_step=0.504, global_step=6122.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  27%|██▋       | 331/1208 [09:12<24:25,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.504, train/loss_vlb_step=0.0134, train/loss_step=0.504, global_step=6122.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  27%|██▋       | 331/1208 [09:12<24:25,  1.67s/it, loss=0.146, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00253, train/loss_step=0.384, global_step=6122.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  27%|██▋       | 332/1208 [09:16<24:27,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00253, train/loss_step=0.384, global_step=6122.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  27%|██▋       | 332/1208 [09:16<24:27,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000579, train/loss_step=0.164, global_step=6122.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  28%|██▊       | 333/1208 [09:17<24:24,  1.67s/it, loss=0.139, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000579, train/loss_step=0.164, global_step=6122.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  28%|██▊       | 333/1208 [09:17<24:24,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000244, train/loss_step=0.0741, global_step=6123.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  28%|██▊       | 334/1208 [09:18<24:20,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000244, train/loss_step=0.0741, global_step=6123.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  28%|██▊       | 334/1208 [09:18<24:20,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=9.3e-6, train/loss_step=0.00154, global_step=6123.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  28%|██▊       | 335/1208 [09:19<24:17,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=9.3e-6, train/loss_step=0.00154, global_step=6123.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  28%|██▊       | 335/1208 [09:19<24:17,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00109, train/loss_step=0.267, global_step=6123.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  28%|██▊       | 336/1208 [09:22<24:19,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00109, train/loss_step=0.267, global_step=6123.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  28%|██▊       | 336/1208 [09:22<24:19,  1.67s/it, loss=0.15, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.68e-5, train/loss_step=0.015, global_step=6123.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  28%|██▊       | 337/1208 [09:23<24:16,  1.67s/it, loss=0.15, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.68e-5, train/loss_step=0.015, global_step=6123.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  28%|██▊       | 337/1208 [09:23<24:16,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00166, train/loss_step=0.298, global_step=6124.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  28%|██▊       | 338/1208 [09:24<24:13,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00166, train/loss_step=0.298, global_step=6124.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  28%|██▊       | 338/1208 [09:24<24:13,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000456, train/loss_step=0.138, global_step=6124.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  28%|██▊       | 339/1208 [09:25<24:09,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000456, train/loss_step=0.138, global_step=6124.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  28%|██▊       | 339/1208 [09:25<24:09,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000528, train/loss_step=0.158, global_step=6124.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  28%|██▊       | 340/1208 [09:28<24:12,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000528, train/loss_step=0.158, global_step=6124.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  28%|██▊       | 340/1208 [09:28<24:12,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.08e-5, train/loss_step=0.0112, global_step=6124.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  28%|██▊       | 341/1208 [09:29<24:09,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.08e-5, train/loss_step=0.0112, global_step=6124.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  28%|██▊       | 341/1208 [09:29<24:09,  1.67s/it, loss=0.186, v_num=0, train/loss_simple_step=0.627, train/loss_vlb_step=0.0296, train/loss_step=0.627, global_step=6125.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  28%|██▊       | 342/1208 [09:30<24:05,  1.67s/it, loss=0.186, v_num=0, train/loss_simple_step=0.627, train/loss_vlb_step=0.0296, train/loss_step=0.627, global_step=6125.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  28%|██▊       | 342/1208 [09:30<24:05,  1.67s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000111, train/loss_step=0.0284, global_step=6125.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  28%|██▊       | 343/1208 [09:32<24:02,  1.67s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000111, train/loss_step=0.0284, global_step=6125.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  28%|██▊       | 343/1208 [09:32<24:02,  1.67s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.00018, train/loss_step=0.0508, global_step=6125.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  28%|██▊       | 344/1208 [09:35<24:04,  1.67s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.00018, train/loss_step=0.0508, global_step=6125.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  28%|██▊       | 344/1208 [09:35<24:04,  1.67s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000102, train/loss_step=0.0255, global_step=6125.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  29%|██▊       | 345/1208 [09:36<24:01,  1.67s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000102, train/loss_step=0.0255, global_step=6125.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  29%|██▊       | 345/1208 [09:36<24:01,  1.67s/it, loss=0.179, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00151, train/loss_step=0.308, global_step=6126.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  29%|██▊       | 346/1208 [09:37<23:58,  1.67s/it, loss=0.179, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00151, train/loss_step=0.308, global_step=6126.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  29%|██▊       | 346/1208 [09:37<23:58,  1.67s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0877, train/loss_vlb_step=0.000294, train/loss_step=0.0877, global_step=6126.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  29%|██▊       | 347/1208 [09:38<23:54,  1.67s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0877, train/loss_vlb_step=0.000294, train/loss_step=0.0877, global_step=6126.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  29%|██▊       | 347/1208 [09:38<23:54,  1.67s/it, loss=0.197, v_num=0, train/loss_simple_step=0.488, train/loss_vlb_step=0.00757, train/loss_step=0.488, global_step=6126.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  29%|██▉       | 348/1208 [09:41<23:57,  1.67s/it, loss=0.197, v_num=0, train/loss_simple_step=0.488, train/loss_vlb_step=0.00757, train/loss_step=0.488, global_step=6126.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  29%|██▉       | 348/1208 [09:41<23:57,  1.67s/it, loss=0.192, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000338, train/loss_step=0.103, global_step=6126.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  29%|██▉       | 349/1208 [09:42<23:53,  1.67s/it, loss=0.192, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000338, train/loss_step=0.103, global_step=6126.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  29%|██▉       | 349/1208 [09:42<23:54,  1.67s/it, loss=0.187, v_num=0, train/loss_simple_step=0.00172, train/loss_vlb_step=1.04e-5, train/loss_step=0.00172, global_step=6127.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  29%|██▉       | 350/1208 [09:43<23:50,  1.67s/it, loss=0.187, v_num=0, train/loss_simple_step=0.00172, train/loss_vlb_step=1.04e-5, train/loss_step=0.00172, global_step=6127.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  29%|██▉       | 350/1208 [09:43<23:50,  1.67s/it, loss=0.169, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000464, train/loss_step=0.140, global_step=6127.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  29%|██▉       | 351/1208 [09:44<23:47,  1.67s/it, loss=0.169, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000464, train/loss_step=0.140, global_step=6127.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  29%|██▉       | 351/1208 [09:44<23:47,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=1.26e-5, train/loss_step=0.00217, global_step=6127.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  29%|██▉       | 352/1208 [09:47<23:49,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=1.26e-5, train/loss_step=0.00217, global_step=6127.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  29%|██▉       | 352/1208 [09:47<23:49,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=6127.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  29%|██▉       | 353/1208 [09:48<23:46,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=6127.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  29%|██▉       | 353/1208 [09:48<23:46,  1.67s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0708, train/loss_vlb_step=0.000243, train/loss_step=0.0708, global_step=6128.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  29%|██▉       | 354/1208 [09:49<23:43,  1.67s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0708, train/loss_vlb_step=0.000243, train/loss_step=0.0708, global_step=6128.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  29%|██▉       | 354/1208 [09:49<23:43,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00171, train/loss_step=0.326, global_step=6128.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  29%|██▉       | 355/1208 [09:51<23:40,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00171, train/loss_step=0.326, global_step=6128.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  29%|██▉       | 355/1208 [09:51<23:40,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.12e-5, train/loss_step=0.0201, global_step=6128.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  29%|██▉       | 356/1208 [09:54<23:42,  1.67s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.12e-5, train/loss_step=0.0201, global_step=6128.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  29%|██▉       | 356/1208 [09:54<23:42,  1.67s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.74e-5, train/loss_step=0.0102, global_step=6128.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  30%|██▉       | 357/1208 [09:55<23:38,  1.67s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.74e-5, train/loss_step=0.0102, global_step=6128.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  30%|██▉       | 357/1208 [09:55<23:38,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00214, train/loss_step=0.368, global_step=6129.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  30%|██▉       | 358/1208 [09:56<23:35,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00214, train/loss_step=0.368, global_step=6129.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  30%|██▉       | 358/1208 [09:56<23:35,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.32e-5, train/loss_step=0.0117, global_step=6129.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  30%|██▉       | 359/1208 [09:57<23:32,  1.66s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.32e-5, train/loss_step=0.0117, global_step=6129.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  30%|██▉       | 359/1208 [09:57<23:32,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00135, train/loss_step=0.300, global_step=6129.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  30%|██▉       | 360/1208 [10:00<23:34,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00135, train/loss_step=0.300, global_step=6129.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  30%|██▉       | 360/1208 [10:00<23:34,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0926, train/loss_vlb_step=0.000304, train/loss_step=0.0926, global_step=6129.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  30%|██▉       | 361/1208 [10:01<23:31,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0926, train/loss_vlb_step=0.000304, train/loss_step=0.0926, global_step=6129.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  30%|██▉       | 361/1208 [10:01<23:31,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0983, train/loss_vlb_step=0.000324, train/loss_step=0.0983, global_step=6130.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  30%|██▉       | 362/1208 [10:02<23:28,  1.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0983, train/loss_vlb_step=0.000324, train/loss_step=0.0983, global_step=6130.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  30%|██▉       | 362/1208 [10:02<23:28,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000635, train/loss_step=0.180, global_step=6130.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  30%|███       | 363/1208 [10:03<23:25,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000635, train/loss_step=0.180, global_step=6130.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  30%|███       | 363/1208 [10:03<23:25,  1.66s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0057, train/loss_vlb_step=2.89e-5, train/loss_step=0.0057, global_step=6130.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  30%|███       | 364/1208 [10:06<23:27,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0057, train/loss_vlb_step=2.89e-5, train/loss_step=0.0057, global_step=6130.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  30%|███       | 364/1208 [10:06<23:27,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=7.92e-5, train/loss_step=0.0194, global_step=6130.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  30%|███       | 365/1208 [10:07<23:24,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=7.92e-5, train/loss_step=0.0194, global_step=6130.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  30%|███       | 365/1208 [10:07<23:24,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6e-5, train/loss_step=0.0137, global_step=6131.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  30%|███       | 366/1208 [10:08<23:20,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6e-5, train/loss_step=0.0137, global_step=6131.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  30%|███       | 366/1208 [10:08<23:20,  1.66s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=9.67e-5, train/loss_step=0.0249, global_step=6131.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  30%|███       | 367/1208 [10:10<23:17,  1.66s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=9.67e-5, train/loss_step=0.0249, global_step=6131.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  30%|███       | 367/1208 [10:10<23:17,  1.66s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.00776, train/loss_vlb_step=3.94e-5, train/loss_step=0.00776, global_step=6131.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  30%|███       | 368/1208 [10:13<23:19,  1.67s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.00776, train/loss_vlb_step=3.94e-5, train/loss_step=0.00776, global_step=6131.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  30%|███       | 368/1208 [10:13<23:19,  1.67s/it, loss=0.102, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.00123, train/loss_step=0.242, global_step=6131.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]     Epoch 20:  31%|███       | 369/1208 [10:14<23:16,  1.66s/it, loss=0.102, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.00123, train/loss_step=0.242, global_step=6131.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  31%|███       | 369/1208 [10:14<23:16,  1.66s/it, loss=0.11, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000517, train/loss_step=0.152, global_step=6132.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  31%|███       | 370/1208 [10:15<23:13,  1.66s/it, loss=0.11, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000517, train/loss_step=0.152, global_step=6132.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  31%|███       | 370/1208 [10:15<23:13,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.507, train/loss_vlb_step=0.0135, train/loss_step=0.507, global_step=6132.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  31%|███       | 371/1208 [10:16<23:10,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.507, train/loss_vlb_step=0.0135, train/loss_step=0.507, global_step=6132.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  31%|███       | 371/1208 [10:16<23:10,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0593, train/loss_vlb_step=0.000204, train/loss_step=0.0593, global_step=6132.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  31%|███       | 372/1208 [10:19<23:12,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0593, train/loss_vlb_step=0.000204, train/loss_step=0.0593, global_step=6132.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  31%|███       | 372/1208 [10:19<23:12,  1.67s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00553, train/loss_vlb_step=2.79e-5, train/loss_step=0.00553, global_step=6132.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  31%|███       | 373/1208 [10:20<23:09,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00553, train/loss_vlb_step=2.79e-5, train/loss_step=0.00553, global_step=6132.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  31%|███       | 373/1208 [10:20<23:09,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.810, train/loss_vlb_step=0.103, train/loss_step=0.810, global_step=6133.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]      Epoch 20:  31%|███       | 374/1208 [10:21<23:06,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.810, train/loss_vlb_step=0.103, train/loss_step=0.810, global_step=6133.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  31%|███       | 374/1208 [10:21<23:06,  1.66s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.72e-5, train/loss_step=0.0236, global_step=6133.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  31%|███       | 375/1208 [10:22<23:03,  1.66s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.72e-5, train/loss_step=0.0236, global_step=6133.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  31%|███       | 375/1208 [10:22<23:03,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.469, train/loss_vlb_step=0.00406, train/loss_step=0.469, global_step=6133.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  31%|███       | 376/1208 [10:25<23:05,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.469, train/loss_vlb_step=0.00406, train/loss_step=0.469, global_step=6133.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  31%|███       | 376/1208 [10:25<23:05,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=1.06e-5, train/loss_step=0.00179, global_step=6133.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  31%|███       | 377/1208 [10:27<23:02,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=1.06e-5, train/loss_step=0.00179, global_step=6133.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  31%|███       | 377/1208 [10:27<23:02,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0912, train/loss_vlb_step=0.000303, train/loss_step=0.0912, global_step=6134.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  31%|███▏      | 378/1208 [10:28<22:59,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0912, train/loss_vlb_step=0.000303, train/loss_step=0.0912, global_step=6134.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  31%|███▏      | 378/1208 [10:28<22:59,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=1.53e-5, train/loss_step=0.00271, global_step=6134.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  31%|███▏      | 379/1208 [10:29<22:56,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=1.53e-5, train/loss_step=0.00271, global_step=6134.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  31%|███▏      | 379/1208 [10:29<22:56,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.668, train/loss_vlb_step=0.0269, train/loss_step=0.668, global_step=6134.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]     Epoch 20:  31%|███▏      | 380/1208 [10:32<22:57,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.668, train/loss_vlb_step=0.0269, train/loss_step=0.668, global_step=6134.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  31%|███▏      | 380/1208 [10:32<22:57,  1.66s/it, loss=0.191, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00287, train/loss_step=0.436, global_step=6134.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  32%|███▏      | 381/1208 [10:33<22:54,  1.66s/it, loss=0.191, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00287, train/loss_step=0.436, global_step=6134.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  32%|███▏      | 381/1208 [10:33<22:54,  1.66s/it, loss=0.193, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000456, train/loss_step=0.138, global_step=6135.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  32%|███▏      | 382/1208 [10:34<22:51,  1.66s/it, loss=0.193, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000456, train/loss_step=0.138, global_step=6135.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  32%|███▏      | 382/1208 [10:34<22:51,  1.66s/it, loss=0.21, v_num=0, train/loss_simple_step=0.521, train/loss_vlb_step=0.00346, train/loss_step=0.521, global_step=6135.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  32%|███▏      | 383/1208 [10:35<22:48,  1.66s/it, loss=0.21, v_num=0, train/loss_simple_step=0.521, train/loss_vlb_step=0.00346, train/loss_step=0.521, global_step=6135.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  32%|███▏      | 383/1208 [10:35<22:48,  1.66s/it, loss=0.227, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.0033, train/loss_step=0.350, global_step=6135.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  32%|███▏      | 384/1208 [10:38<22:50,  1.66s/it, loss=0.227, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.0033, train/loss_step=0.350, global_step=6135.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  32%|███▏      | 384/1208 [10:38<22:50,  1.66s/it, loss=0.228, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000141, train/loss_step=0.0376, global_step=6135.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  32%|███▏      | 385/1208 [10:39<22:47,  1.66s/it, loss=0.228, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000141, train/loss_step=0.0376, global_step=6135.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  32%|███▏      | 385/1208 [10:39<22:47,  1.66s/it, loss=0.233, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000351, train/loss_step=0.107, global_step=6136.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  32%|███▏      | 386/1208 [10:40<22:44,  1.66s/it, loss=0.233, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000351, train/loss_step=0.107, global_step=6136.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  32%|███▏      | 386/1208 [10:40<22:44,  1.66s/it, loss=0.246, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00148, train/loss_step=0.294, global_step=6136.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  32%|███▏      | 387/1208 [10:41<22:41,  1.66s/it, loss=0.246, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00148, train/loss_step=0.294, global_step=6136.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  32%|███▏      | 387/1208 [10:41<22:41,  1.66s/it, loss=0.248, v_num=0, train/loss_simple_step=0.0518, train/loss_vlb_step=0.000178, train/loss_step=0.0518, global_step=6136.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  32%|███▏      | 388/1208 [10:44<22:42,  1.66s/it, loss=0.248, v_num=0, train/loss_simple_step=0.0518, train/loss_vlb_step=0.000178, train/loss_step=0.0518, global_step=6136.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  32%|███▏      | 388/1208 [10:44<22:42,  1.66s/it, loss=0.243, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000434, train/loss_step=0.132, global_step=6136.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  32%|███▏      | 389/1208 [10:45<22:40,  1.66s/it, loss=0.243, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000434, train/loss_step=0.132, global_step=6136.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  32%|███▏      | 389/1208 [10:45<22:40,  1.66s/it, loss=0.242, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000484, train/loss_step=0.144, global_step=6137.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  32%|███▏      | 390/1208 [10:47<22:37,  1.66s/it, loss=0.242, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000484, train/loss_step=0.144, global_step=6137.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  32%|███▏      | 390/1208 [10:47<22:37,  1.66s/it, loss=0.233, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00154, train/loss_step=0.312, global_step=6137.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  32%|███▏      | 391/1208 [10:48<22:34,  1.66s/it, loss=0.233, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00154, train/loss_step=0.312, global_step=6137.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  32%|███▏      | 391/1208 [10:48<22:34,  1.66s/it, loss=0.236, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000439, train/loss_step=0.132, global_step=6137.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  32%|███▏      | 392/1208 [10:51<22:35,  1.66s/it, loss=0.236, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000439, train/loss_step=0.132, global_step=6137.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  32%|███▏      | 392/1208 [10:51<22:35,  1.66s/it, loss=0.237, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.03e-5, train/loss_step=0.0111, global_step=6137.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  33%|███▎      | 393/1208 [10:52<22:32,  1.66s/it, loss=0.237, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.03e-5, train/loss_step=0.0111, global_step=6137.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  33%|███▎      | 393/1208 [10:52<22:32,  1.66s/it, loss=0.214, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00238, train/loss_step=0.356, global_step=6138.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  33%|███▎      | 394/1208 [10:53<22:29,  1.66s/it, loss=0.214, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00238, train/loss_step=0.356, global_step=6138.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  33%|███▎      | 394/1208 [10:53<22:29,  1.66s/it, loss=0.224, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000844, train/loss_step=0.225, global_step=6138.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  33%|███▎      | 395/1208 [10:54<22:26,  1.66s/it, loss=0.224, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000844, train/loss_step=0.225, global_step=6138.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  33%|███▎      | 395/1208 [10:54<22:26,  1.66s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.56e-5, train/loss_step=0.0118, global_step=6138.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  33%|███▎      | 396/1208 [10:57<22:27,  1.66s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.56e-5, train/loss_step=0.0118, global_step=6138.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  33%|███▎      | 396/1208 [10:57<22:27,  1.66s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000127, train/loss_step=0.0327, global_step=6138.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  33%|███▎      | 397/1208 [10:58<22:24,  1.66s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000127, train/loss_step=0.0327, global_step=6138.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  33%|███▎      | 397/1208 [10:58<22:24,  1.66s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.000184, train/loss_step=0.0527, global_step=6139.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  33%|███▎      | 398/1208 [10:59<22:21,  1.66s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.000184, train/loss_step=0.0527, global_step=6139.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  33%|███▎      | 398/1208 [10:59<22:21,  1.66s/it, loss=0.211, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000761, train/loss_step=0.217, global_step=6139.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  33%|███▎      | 399/1208 [11:00<22:18,  1.65s/it, loss=0.211, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000761, train/loss_step=0.217, global_step=6139.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  33%|███▎      | 399/1208 [11:00<22:18,  1.65s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.14e-5, train/loss_step=0.0141, global_step=6139.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  33%|███▎      | 400/1208 [11:03<22:19,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.14e-5, train/loss_step=0.0141, global_step=6139.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  33%|███▎      | 400/1208 [11:03<22:19,  1.66s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=2.36e-5, train/loss_step=0.00462, global_step=6139.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  33%|███▎      | 401/1208 [11:04<22:16,  1.66s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=2.36e-5, train/loss_step=0.00462, global_step=6139.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  33%|███▎      | 401/1208 [11:04<22:16,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000694, train/loss_step=0.190, global_step=6140.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  33%|███▎      | 402/1208 [11:05<22:13,  1.65s/it, loss=0.16, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000694, train/loss_step=0.190, global_step=6140.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  33%|███▎      | 402/1208 [11:05<22:13,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=1.76e-5, train/loss_step=0.0031, global_step=6140.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  33%|███▎      | 403/1208 [11:06<22:10,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=1.76e-5, train/loss_step=0.0031, global_step=6140.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  33%|███▎      | 403/1208 [11:06<22:10,  1.65s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0756, train/loss_vlb_step=0.000252, train/loss_step=0.0756, global_step=6140.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  33%|███▎      | 404/1208 [11:09<22:11,  1.66s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0756, train/loss_vlb_step=0.000252, train/loss_step=0.0756, global_step=6140.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  33%|███▎      | 404/1208 [11:09<22:11,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00561, train/loss_step=0.432, global_step=6140.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  34%|███▎      | 405/1208 [11:10<22:08,  1.65s/it, loss=0.14, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00561, train/loss_step=0.432, global_step=6140.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  34%|███▎      | 405/1208 [11:10<22:08,  1.65s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00691, train/loss_vlb_step=3.4e-5, train/loss_step=0.00691, global_step=6141.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  34%|███▎      | 406/1208 [11:11<22:05,  1.65s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00691, train/loss_vlb_step=3.4e-5, train/loss_step=0.00691, global_step=6141.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  34%|███▎      | 406/1208 [11:11<22:05,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.823, train/loss_vlb_step=0.414, train/loss_step=0.823, global_step=6141.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]     Epoch 20:  34%|███▎      | 407/1208 [11:12<22:02,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.823, train/loss_vlb_step=0.414, train/loss_step=0.823, global_step=6141.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  34%|███▎      | 407/1208 [11:12<22:02,  1.65s/it, loss=0.166, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.00049, train/loss_step=0.145, global_step=6141.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  34%|███▍      | 408/1208 [11:14<22:03,  1.65s/it, loss=0.166, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.00049, train/loss_step=0.145, global_step=6141.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  34%|███▍      | 408/1208 [11:14<22:03,  1.65s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.44e-5, train/loss_step=0.0185, global_step=6141.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  34%|███▍      | 409/1208 [11:15<22:00,  1.65s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.44e-5, train/loss_step=0.0185, global_step=6141.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  34%|███▍      | 409/1208 [11:15<22:00,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000517, train/loss_step=0.154, global_step=6142.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  34%|███▍      | 410/1208 [11:16<21:57,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000517, train/loss_step=0.154, global_step=6142.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  34%|███▍      | 410/1208 [11:17<21:57,  1.65s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.45e-5, train/loss_step=0.0147, global_step=6142.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  34%|███▍      | 411/1208 [11:18<21:54,  1.65s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.45e-5, train/loss_step=0.0147, global_step=6142.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  34%|███▍      | 411/1208 [11:18<21:54,  1.65s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7.06e-5, train/loss_step=0.0165, global_step=6142.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  34%|███▍      | 412/1208 [11:20<21:55,  1.65s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7.06e-5, train/loss_step=0.0165, global_step=6142.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  34%|███▍      | 412/1208 [11:20<21:55,  1.65s/it, loss=0.156, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00202, train/loss_step=0.321, global_step=6142.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  34%|███▍      | 413/1208 [11:21<21:52,  1.65s/it, loss=0.156, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00202, train/loss_step=0.321, global_step=6142.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  34%|███▍      | 413/1208 [11:21<21:52,  1.65s/it, loss=0.147, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000624, train/loss_step=0.183, global_step=6143.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  34%|███▍      | 414/1208 [11:22<21:49,  1.65s/it, loss=0.147, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000624, train/loss_step=0.183, global_step=6143.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  34%|███▍      | 414/1208 [11:22<21:49,  1.65s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.97e-5, train/loss_step=0.0158, global_step=6143.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  34%|███▍      | 415/1208 [11:23<21:46,  1.65s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.97e-5, train/loss_step=0.0158, global_step=6143.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  34%|███▍      | 415/1208 [11:23<21:46,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000535, train/loss_step=0.153, global_step=6143.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  34%|███▍      | 416/1208 [11:26<21:47,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000535, train/loss_step=0.153, global_step=6143.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  34%|███▍      | 416/1208 [11:26<21:47,  1.65s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0785, train/loss_vlb_step=0.000261, train/loss_step=0.0785, global_step=6143.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  35%|███▍      | 417/1208 [11:27<21:44,  1.65s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0785, train/loss_vlb_step=0.000261, train/loss_step=0.0785, global_step=6143.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  35%|███▍      | 417/1208 [11:27<21:44,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.0022, train/loss_step=0.351, global_step=6144.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  35%|███▍      | 418/1208 [11:28<21:41,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.0022, train/loss_step=0.351, global_step=6144.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  35%|███▍      | 418/1208 [11:28<21:41,  1.65s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00269, train/loss_vlb_step=1.53e-5, train/loss_step=0.00269, global_step=6144.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  35%|███▍      | 419/1208 [11:29<21:38,  1.65s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00269, train/loss_vlb_step=1.53e-5, train/loss_step=0.00269, global_step=6144.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  35%|███▍      | 419/1208 [11:29<21:38,  1.65s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00513, train/loss_vlb_step=2.74e-5, train/loss_step=0.00513, global_step=6144.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  35%|███▍      | 420/1208 [11:32<21:39,  1.65s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00513, train/loss_vlb_step=2.74e-5, train/loss_step=0.00513, global_step=6144.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  35%|███▍      | 420/1208 [11:32<21:39,  1.65s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000125, train/loss_step=0.0342, global_step=6144.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  35%|███▍      | 421/1208 [11:33<21:36,  1.65s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000125, train/loss_step=0.0342, global_step=6144.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  35%|███▍      | 421/1208 [11:33<21:36,  1.65s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0805, train/loss_vlb_step=0.000267, train/loss_step=0.0805, global_step=6145.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  35%|███▍      | 422/1208 [11:34<21:33,  1.65s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0805, train/loss_vlb_step=0.000267, train/loss_step=0.0805, global_step=6145.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  35%|███▍      | 422/1208 [11:34<21:33,  1.65s/it, loss=0.171, v_num=0, train/loss_simple_step=0.509, train/loss_vlb_step=0.00493, train/loss_step=0.509, global_step=6145.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  35%|███▌      | 423/1208 [11:35<21:31,  1.64s/it, loss=0.171, v_num=0, train/loss_simple_step=0.509, train/loss_vlb_step=0.00493, train/loss_step=0.509, global_step=6145.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  35%|███▌      | 423/1208 [11:35<21:31,  1.64s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=2.32e-5, train/loss_step=0.00413, global_step=6145.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  35%|███▌      | 424/1208 [11:38<21:31,  1.65s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=2.32e-5, train/loss_step=0.00413, global_step=6145.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  35%|███▌      | 424/1208 [11:38<21:31,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000384, train/loss_step=0.117, global_step=6145.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  35%|███▌      | 425/1208 [11:39<21:28,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000384, train/loss_step=0.117, global_step=6145.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  35%|███▌      | 425/1208 [11:39<21:28,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000459, train/loss_step=0.136, global_step=6146.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  35%|███▌      | 426/1208 [11:40<21:26,  1.64s/it, loss=0.158, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000459, train/loss_step=0.136, global_step=6146.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  35%|███▌      | 426/1208 [11:40<21:26,  1.64s/it, loss=0.124, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000437, train/loss_step=0.132, global_step=6146.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  35%|███▌      | 427/1208 [11:41<21:23,  1.64s/it, loss=0.124, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000437, train/loss_step=0.132, global_step=6146.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  35%|███▌      | 427/1208 [11:41<21:23,  1.64s/it, loss=0.127, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000688, train/loss_step=0.204, global_step=6146.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  35%|███▌      | 428/1208 [11:44<21:23,  1.65s/it, loss=0.127, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000688, train/loss_step=0.204, global_step=6146.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  35%|███▌      | 428/1208 [11:44<21:23,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.91e-5, train/loss_step=0.0154, global_step=6146.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  36%|███▌      | 429/1208 [11:45<21:21,  1.64s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.91e-5, train/loss_step=0.0154, global_step=6146.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  36%|███▌      | 429/1208 [11:45<21:21,  1.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00237, train/loss_step=0.384, global_step=6147.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  36%|███▌      | 430/1208 [11:46<21:18,  1.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00237, train/loss_step=0.384, global_step=6147.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  36%|███▌      | 430/1208 [11:46<21:18,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=1.66e-5, train/loss_step=0.00295, global_step=6147.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  36%|███▌      | 431/1208 [11:47<21:15,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=1.66e-5, train/loss_step=0.00295, global_step=6147.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  36%|███▌      | 431/1208 [11:47<21:15,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.85e-5, train/loss_step=0.0187, global_step=6147.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  36%|███▌      | 432/1208 [11:50<21:16,  1.65s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.85e-5, train/loss_step=0.0187, global_step=6147.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  36%|███▌      | 432/1208 [11:50<21:16,  1.65s/it, loss=0.131, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000655, train/loss_step=0.190, global_step=6147.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  36%|███▌      | 433/1208 [11:51<21:14,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000655, train/loss_step=0.190, global_step=6147.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  36%|███▌      | 433/1208 [11:51<21:14,  1.64s/it, loss=0.15, v_num=0, train/loss_simple_step=0.574, train/loss_vlb_step=0.00718, train/loss_step=0.574, global_step=6148.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  36%|███▌      | 434/1208 [11:52<21:11,  1.64s/it, loss=0.15, v_num=0, train/loss_simple_step=0.574, train/loss_vlb_step=0.00718, train/loss_step=0.574, global_step=6148.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  36%|███▌      | 434/1208 [11:52<21:11,  1.64s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=9.69e-5, train/loss_step=0.0249, global_step=6148.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  36%|███▌      | 435/1208 [11:53<21:08,  1.64s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=9.69e-5, train/loss_step=0.0249, global_step=6148.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  36%|███▌      | 435/1208 [11:53<21:08,  1.64s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00886, train/loss_vlb_step=4.26e-5, train/loss_step=0.00886, global_step=6148.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  36%|███▌      | 436/1208 [11:57<21:09,  1.64s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00886, train/loss_vlb_step=4.26e-5, train/loss_step=0.00886, global_step=6148.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  36%|███▌      | 436/1208 [11:57<21:09,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00612, train/loss_vlb_step=3.09e-5, train/loss_step=0.00612, global_step=6148.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  36%|███▌      | 437/1208 [11:58<21:06,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00612, train/loss_vlb_step=3.09e-5, train/loss_step=0.00612, global_step=6148.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  36%|███▌      | 437/1208 [11:58<21:06,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00447, train/loss_vlb_step=2.38e-5, train/loss_step=0.00447, global_step=6149.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  36%|███▋      | 438/1208 [11:59<21:04,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00447, train/loss_vlb_step=2.38e-5, train/loss_step=0.00447, global_step=6149.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  36%|███▋      | 438/1208 [11:59<21:04,  1.64s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000123, train/loss_step=0.0327, global_step=6149.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  36%|███▋      | 439/1208 [12:00<21:01,  1.64s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000123, train/loss_step=0.0327, global_step=6149.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  36%|███▋      | 439/1208 [12:00<21:01,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00114, train/loss_step=0.266, global_step=6149.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  36%|███▋      | 440/1208 [12:03<21:02,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00114, train/loss_step=0.266, global_step=6149.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  36%|███▋      | 440/1208 [12:03<21:02,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.028, train/loss_vlb_step=0.000106, train/loss_step=0.028, global_step=6149.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  37%|███▋      | 441/1208 [12:04<20:59,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.028, train/loss_vlb_step=0.000106, train/loss_step=0.028, global_step=6149.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  37%|███▋      | 441/1208 [12:04<20:59,  1.64s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.26e-5, train/loss_step=0.0143, global_step=6150.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  37%|███▋      | 442/1208 [12:05<20:57,  1.64s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.26e-5, train/loss_step=0.0143, global_step=6150.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  37%|███▋      | 442/1208 [12:05<20:57,  1.64s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.000105, train/loss_step=0.0275, global_step=6150.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  37%|███▋      | 443/1208 [12:06<20:54,  1.64s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.000105, train/loss_step=0.0275, global_step=6150.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  37%|███▋      | 443/1208 [12:06<20:54,  1.64s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.32e-5, train/loss_step=0.0213, global_step=6150.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  37%|███▋      | 444/1208 [12:09<20:55,  1.64s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.32e-5, train/loss_step=0.0213, global_step=6150.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  37%|███▋      | 444/1208 [12:09<20:55,  1.64s/it, loss=0.124, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.0031, train/loss_step=0.397, global_step=6150.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  37%|███▋      | 445/1208 [12:10<20:52,  1.64s/it, loss=0.124, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.0031, train/loss_step=0.397, global_step=6150.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  37%|███▋      | 445/1208 [12:10<20:52,  1.64s/it, loss=0.146, v_num=0, train/loss_simple_step=0.572, train/loss_vlb_step=0.00911, train/loss_step=0.572, global_step=6151.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  37%|███▋      | 446/1208 [12:11<20:50,  1.64s/it, loss=0.146, v_num=0, train/loss_simple_step=0.572, train/loss_vlb_step=0.00911, train/loss_step=0.572, global_step=6151.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  37%|███▋      | 446/1208 [12:11<20:50,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00379, train/loss_vlb_step=2.05e-5, train/loss_step=0.00379, global_step=6151.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  37%|███▋      | 447/1208 [12:12<20:47,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00379, train/loss_vlb_step=2.05e-5, train/loss_step=0.00379, global_step=6151.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  37%|███▋      | 447/1208 [12:12<20:47,  1.64s/it, loss=0.136, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000399, train/loss_step=0.121, global_step=6151.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  37%|███▋      | 448/1208 [12:16<20:48,  1.64s/it, loss=0.136, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000399, train/loss_step=0.121, global_step=6151.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  37%|███▋      | 448/1208 [12:16<20:48,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.00092, train/loss_step=0.205, global_step=6151.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  37%|███▋      | 449/1208 [12:17<20:46,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.00092, train/loss_step=0.205, global_step=6151.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  37%|███▋      | 449/1208 [12:17<20:46,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000358, train/loss_step=0.108, global_step=6152.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  37%|███▋      | 450/1208 [12:18<20:43,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000358, train/loss_step=0.108, global_step=6152.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  37%|███▋      | 450/1208 [12:18<20:43,  1.64s/it, loss=0.157, v_num=0, train/loss_simple_step=0.520, train/loss_vlb_step=0.00461, train/loss_step=0.520, global_step=6152.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  37%|███▋      | 451/1208 [12:19<20:40,  1.64s/it, loss=0.157, v_num=0, train/loss_simple_step=0.520, train/loss_vlb_step=0.00461, train/loss_step=0.520, global_step=6152.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  37%|███▋      | 451/1208 [12:19<20:40,  1.64s/it, loss=0.163, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000414, train/loss_step=0.126, global_step=6152.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  37%|███▋      | 452/1208 [12:22<20:41,  1.64s/it, loss=0.163, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000414, train/loss_step=0.126, global_step=6152.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  37%|███▋      | 452/1208 [12:22<20:41,  1.64s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.6e-5, train/loss_step=0.0176, global_step=6152.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  38%|███▊      | 453/1208 [12:23<20:39,  1.64s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.6e-5, train/loss_step=0.0176, global_step=6152.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  38%|███▊      | 453/1208 [12:23<20:39,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000485, train/loss_step=0.147, global_step=6153.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  38%|███▊      | 454/1208 [12:24<20:36,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000485, train/loss_step=0.147, global_step=6153.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  38%|███▊      | 454/1208 [12:24<20:36,  1.64s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0772, train/loss_vlb_step=0.000263, train/loss_step=0.0772, global_step=6153.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  38%|███▊      | 455/1208 [12:25<20:33,  1.64s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0772, train/loss_vlb_step=0.000263, train/loss_step=0.0772, global_step=6153.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  38%|███▊      | 455/1208 [12:25<20:33,  1.64s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.1e-5, train/loss_step=0.00188, global_step=6153.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  38%|███▊      | 456/1208 [12:28<20:34,  1.64s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.1e-5, train/loss_step=0.00188, global_step=6153.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  38%|███▊      | 456/1208 [12:28<20:34,  1.64s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.68e-5, train/loss_step=0.0101, global_step=6153.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  38%|███▊      | 457/1208 [12:29<20:32,  1.64s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.68e-5, train/loss_step=0.0101, global_step=6153.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  38%|███▊      | 457/1208 [12:29<20:32,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.00037, train/loss_step=0.113, global_step=6154.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  38%|███▊      | 458/1208 [12:30<20:29,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.00037, train/loss_step=0.113, global_step=6154.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  38%|███▊      | 458/1208 [12:30<20:29,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.00011, train/loss_step=0.0299, global_step=6154.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  38%|███▊      | 459/1208 [12:31<20:26,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.00011, train/loss_step=0.0299, global_step=6154.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  38%|███▊      | 459/1208 [12:31<20:26,  1.64s/it, loss=0.136, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000637, train/loss_step=0.185, global_step=6154.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  38%|███▊      | 460/1208 [12:35<20:27,  1.64s/it, loss=0.136, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000637, train/loss_step=0.185, global_step=6154.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  38%|███▊      | 460/1208 [12:35<20:27,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000138, train/loss_step=0.0363, global_step=6154.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  38%|███▊      | 461/1208 [12:36<20:25,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000138, train/loss_step=0.0363, global_step=6154.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  38%|███▊      | 461/1208 [12:36<20:25,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=6.99e-5, train/loss_step=0.0163, global_step=6155.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  38%|███▊      | 462/1208 [12:37<20:22,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=6.99e-5, train/loss_step=0.0163, global_step=6155.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  38%|███▊      | 462/1208 [12:37<20:22,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0391, train/loss_vlb_step=0.000146, train/loss_step=0.0391, global_step=6155.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  38%|███▊      | 463/1208 [12:38<20:19,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0391, train/loss_vlb_step=0.000146, train/loss_step=0.0391, global_step=6155.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  38%|███▊      | 463/1208 [12:38<20:19,  1.64s/it, loss=0.165, v_num=0, train/loss_simple_step=0.567, train/loss_vlb_step=0.0123, train/loss_step=0.567, global_step=6155.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  38%|███▊      | 464/1208 [12:41<20:20,  1.64s/it, loss=0.165, v_num=0, train/loss_simple_step=0.567, train/loss_vlb_step=0.0123, train/loss_step=0.567, global_step=6155.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  38%|███▊      | 464/1208 [12:41<20:20,  1.64s/it, loss=0.155, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000727, train/loss_step=0.206, global_step=6155.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  38%|███▊      | 465/1208 [12:42<20:18,  1.64s/it, loss=0.155, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000727, train/loss_step=0.206, global_step=6155.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  38%|███▊      | 465/1208 [12:42<20:18,  1.64s/it, loss=0.136, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.00072, train/loss_step=0.193, global_step=6156.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  39%|███▊      | 466/1208 [12:43<20:15,  1.64s/it, loss=0.136, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.00072, train/loss_step=0.193, global_step=6156.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  39%|███▊      | 466/1208 [12:43<20:15,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.88e-5, train/loss_step=0.0214, global_step=6156.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  39%|███▊      | 467/1208 [12:44<20:13,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.88e-5, train/loss_step=0.0214, global_step=6156.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  39%|███▊      | 467/1208 [12:44<20:13,  1.64s/it, loss=0.15, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.003, train/loss_step=0.378, global_step=6156.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]     Epoch 20:  39%|███▊      | 468/1208 [12:47<20:13,  1.64s/it, loss=0.15, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.003, train/loss_step=0.378, global_step=6156.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  39%|███▊      | 468/1208 [12:47<20:13,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000344, train/loss_step=0.103, global_step=6156.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  39%|███▉      | 469/1208 [12:48<20:11,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000344, train/loss_step=0.103, global_step=6156.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  39%|███▉      | 469/1208 [12:48<20:11,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.42e-5, train/loss_step=0.012, global_step=6157.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  39%|███▉      | 470/1208 [12:49<20:08,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.42e-5, train/loss_step=0.012, global_step=6157.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  39%|███▉      | 470/1208 [12:49<20:08,  1.64s/it, loss=0.143, v_num=0, train/loss_simple_step=0.576, train/loss_vlb_step=0.0179, train/loss_step=0.576, global_step=6157.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  39%|███▉      | 471/1208 [12:50<20:06,  1.64s/it, loss=0.143, v_num=0, train/loss_simple_step=0.576, train/loss_vlb_step=0.0179, train/loss_step=0.576, global_step=6157.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  39%|███▉      | 471/1208 [12:50<20:06,  1.64s/it, loss=0.167, v_num=0, train/loss_simple_step=0.601, train/loss_vlb_step=0.0104, train/loss_step=0.601, global_step=6157.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  39%|███▉      | 472/1208 [12:53<20:06,  1.64s/it, loss=0.167, v_num=0, train/loss_simple_step=0.601, train/loss_vlb_step=0.0104, train/loss_step=0.601, global_step=6157.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  39%|███▉      | 472/1208 [12:53<20:06,  1.64s/it, loss=0.168, v_num=0, train/loss_simple_step=0.037, train/loss_vlb_step=0.000139, train/loss_step=0.037, global_step=6157.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  39%|███▉      | 473/1208 [12:55<20:04,  1.64s/it, loss=0.168, v_num=0, train/loss_simple_step=0.037, train/loss_vlb_step=0.000139, train/loss_step=0.037, global_step=6157.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  39%|███▉      | 473/1208 [12:55<20:04,  1.64s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0855, train/loss_vlb_step=0.000282, train/loss_step=0.0855, global_step=6158.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  39%|███▉      | 474/1208 [12:56<20:01,  1.64s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0855, train/loss_vlb_step=0.000282, train/loss_step=0.0855, global_step=6158.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  39%|███▉      | 474/1208 [12:56<20:01,  1.64s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.45e-5, train/loss_step=0.0124, global_step=6158.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  39%|███▉      | 475/1208 [12:57<19:59,  1.64s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.45e-5, train/loss_step=0.0124, global_step=6158.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  39%|███▉      | 475/1208 [12:57<19:59,  1.64s/it, loss=0.177, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00179, train/loss_step=0.324, global_step=6158.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  39%|███▉      | 476/1208 [13:00<19:59,  1.64s/it, loss=0.177, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00179, train/loss_step=0.324, global_step=6158.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  39%|███▉      | 476/1208 [13:00<19:59,  1.64s/it, loss=0.187, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000842, train/loss_step=0.213, global_step=6158.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  39%|███▉      | 477/1208 [13:01<19:57,  1.64s/it, loss=0.187, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000842, train/loss_step=0.213, global_step=6158.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  39%|███▉      | 477/1208 [13:01<19:57,  1.64s/it, loss=0.199, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00253, train/loss_step=0.337, global_step=6159.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  40%|███▉      | 478/1208 [13:02<19:54,  1.64s/it, loss=0.199, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00253, train/loss_step=0.337, global_step=6159.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  40%|███▉      | 478/1208 [13:02<19:54,  1.64s/it, loss=0.207, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000723, train/loss_step=0.203, global_step=6159.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  40%|███▉      | 479/1208 [13:03<19:52,  1.64s/it, loss=0.207, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000723, train/loss_step=0.203, global_step=6159.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  40%|███▉      | 479/1208 [13:03<19:52,  1.64s/it, loss=0.205, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.00049, train/loss_step=0.145, global_step=6159.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  40%|███▉      | 480/1208 [13:06<19:52,  1.64s/it, loss=0.205, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.00049, train/loss_step=0.145, global_step=6159.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  40%|███▉      | 480/1208 [13:06<19:52,  1.64s/it, loss=0.22, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00179, train/loss_step=0.335, global_step=6159.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  40%|███▉      | 481/1208 [13:07<19:50,  1.64s/it, loss=0.22, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00179, train/loss_step=0.335, global_step=6159.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  40%|███▉      | 481/1208 [13:07<19:50,  1.64s/it, loss=0.229, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000713, train/loss_step=0.196, global_step=6160.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  40%|███▉      | 482/1208 [13:08<19:47,  1.64s/it, loss=0.229, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000713, train/loss_step=0.196, global_step=6160.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  40%|███▉      | 482/1208 [13:08<19:47,  1.64s/it, loss=0.234, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000444, train/loss_step=0.135, global_step=6160.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  40%|███▉      | 483/1208 [13:09<19:45,  1.63s/it, loss=0.234, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000444, train/loss_step=0.135, global_step=6160.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  40%|███▉      | 483/1208 [13:09<19:45,  1.64s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.91e-5, train/loss_step=0.0134, global_step=6160.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  40%|████      | 484/1208 [13:12<19:46,  1.64s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.91e-5, train/loss_step=0.0134, global_step=6160.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  40%|████      | 484/1208 [13:12<19:46,  1.64s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00501, train/loss_vlb_step=2.68e-5, train/loss_step=0.00501, global_step=6160.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  40%|████      | 485/1208 [13:13<19:43,  1.64s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00501, train/loss_vlb_step=2.68e-5, train/loss_step=0.00501, global_step=6160.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  40%|████      | 485/1208 [13:13<19:43,  1.64s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.88e-5, train/loss_step=0.0131, global_step=6161.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  40%|████      | 486/1208 [13:15<19:41,  1.64s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.88e-5, train/loss_step=0.0131, global_step=6161.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  40%|████      | 486/1208 [13:15<19:41,  1.64s/it, loss=0.207, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00373, train/loss_step=0.411, global_step=6161.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  40%|████      | 487/1208 [13:16<19:38,  1.63s/it, loss=0.207, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00373, train/loss_step=0.411, global_step=6161.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  40%|████      | 487/1208 [13:16<19:38,  1.63s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0564, train/loss_vlb_step=0.000202, train/loss_step=0.0564, global_step=6161.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  40%|████      | 488/1208 [13:19<19:39,  1.64s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0564, train/loss_vlb_step=0.000202, train/loss_step=0.0564, global_step=6161.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  40%|████      | 488/1208 [13:19<19:39,  1.64s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00127, train/loss_vlb_step=7.68e-6, train/loss_step=0.00127, global_step=6161.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  40%|████      | 489/1208 [13:20<19:36,  1.64s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00127, train/loss_vlb_step=7.68e-6, train/loss_step=0.00127, global_step=6161.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  40%|████      | 489/1208 [13:20<19:36,  1.64s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0431, train/loss_vlb_step=0.000162, train/loss_step=0.0431, global_step=6162.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  41%|████      | 490/1208 [13:21<19:34,  1.64s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0431, train/loss_vlb_step=0.000162, train/loss_step=0.0431, global_step=6162.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  41%|████      | 490/1208 [13:21<19:34,  1.64s/it, loss=0.176, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00242, train/loss_step=0.345, global_step=6162.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  41%|████      | 491/1208 [13:22<19:31,  1.63s/it, loss=0.176, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00242, train/loss_step=0.345, global_step=6162.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  41%|████      | 491/1208 [13:22<19:31,  1.63s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0825, train/loss_vlb_step=0.000273, train/loss_step=0.0825, global_step=6162.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  41%|████      | 492/1208 [13:25<19:32,  1.64s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0825, train/loss_vlb_step=0.000273, train/loss_step=0.0825, global_step=6162.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  41%|████      | 492/1208 [13:25<19:32,  1.64s/it, loss=0.173, v_num=0, train/loss_simple_step=0.503, train/loss_vlb_step=0.00575, train/loss_step=0.503, global_step=6162.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  41%|████      | 493/1208 [13:26<19:29,  1.64s/it, loss=0.173, v_num=0, train/loss_simple_step=0.503, train/loss_vlb_step=0.00575, train/loss_step=0.503, global_step=6162.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  41%|████      | 493/1208 [13:26<19:29,  1.64s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0802, train/loss_vlb_step=0.000265, train/loss_step=0.0802, global_step=6163.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  41%|████      | 494/1208 [13:27<19:27,  1.64s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0802, train/loss_vlb_step=0.000265, train/loss_step=0.0802, global_step=6163.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  41%|████      | 494/1208 [13:27<19:27,  1.64s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.64e-5, train/loss_step=0.00291, global_step=6163.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  41%|████      | 495/1208 [13:28<19:24,  1.63s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.64e-5, train/loss_step=0.00291, global_step=6163.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  41%|████      | 495/1208 [13:28<19:24,  1.63s/it, loss=0.173, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00202, train/loss_step=0.350, global_step=6163.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  41%|████      | 496/1208 [13:32<19:25,  1.64s/it, loss=0.173, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00202, train/loss_step=0.350, global_step=6163.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  41%|████      | 496/1208 [13:32<19:25,  1.64s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000113, train/loss_step=0.0308, global_step=6163.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  41%|████      | 497/1208 [13:33<19:23,  1.64s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000113, train/loss_step=0.0308, global_step=6163.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  41%|████      | 497/1208 [13:33<19:23,  1.64s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0798, train/loss_vlb_step=0.000264, train/loss_step=0.0798, global_step=6164.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  41%|████      | 498/1208 [13:34<19:20,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0798, train/loss_vlb_step=0.000264, train/loss_step=0.0798, global_step=6164.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  41%|████      | 498/1208 [13:34<19:20,  1.63s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00321, train/loss_vlb_step=1.83e-5, train/loss_step=0.00321, global_step=6164.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  41%|████▏     | 499/1208 [13:35<19:18,  1.63s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00321, train/loss_vlb_step=1.83e-5, train/loss_step=0.00321, global_step=6164.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  41%|████▏     | 499/1208 [13:35<19:18,  1.63s/it, loss=0.146, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000968, train/loss_step=0.228, global_step=6164.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  41%|████▏     | 500/1208 [13:38<19:18,  1.64s/it, loss=0.146, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000968, train/loss_step=0.228, global_step=6164.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  41%|████▏     | 500/1208 [13:38<19:18,  1.64s/it, loss=0.143, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00143, train/loss_step=0.289, global_step=6164.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  41%|████▏     | 501/1208 [13:39<19:16,  1.64s/it, loss=0.143, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00143, train/loss_step=0.289, global_step=6164.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  41%|████▏     | 501/1208 [13:39<19:16,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0716, train/loss_vlb_step=0.000243, train/loss_step=0.0716, global_step=6165.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  42%|████▏     | 502/1208 [13:40<19:13,  1.63s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0716, train/loss_vlb_step=0.000243, train/loss_step=0.0716, global_step=6165.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  42%|████▏     | 502/1208 [13:40<19:13,  1.63s/it, loss=0.148, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00192, train/loss_step=0.341, global_step=6165.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  42%|████▏     | 503/1208 [13:41<19:11,  1.63s/it, loss=0.148, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00192, train/loss_step=0.341, global_step=6165.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  42%|████▏     | 503/1208 [13:41<19:11,  1.63s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.59e-5, train/loss_step=0.0205, global_step=6165.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  42%|████▏     | 504/1208 [13:44<19:11,  1.64s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.59e-5, train/loss_step=0.0205, global_step=6165.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  42%|████▏     | 504/1208 [13:44<19:11,  1.64s/it, loss=0.182, v_num=0, train/loss_simple_step=0.685, train/loss_vlb_step=0.0148, train/loss_step=0.685, global_step=6165.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  42%|████▏     | 505/1208 [13:45<19:09,  1.64s/it, loss=0.182, v_num=0, train/loss_simple_step=0.685, train/loss_vlb_step=0.0148, train/loss_step=0.685, global_step=6165.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  42%|████▏     | 505/1208 [13:45<19:09,  1.64s/it, loss=0.194, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.0011, train/loss_step=0.253, global_step=6166.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  42%|████▏     | 506/1208 [13:46<19:07,  1.63s/it, loss=0.194, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.0011, train/loss_step=0.253, global_step=6166.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  42%|████▏     | 506/1208 [13:46<19:07,  1.63s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.000156, train/loss_step=0.0417, global_step=6166.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  42%|████▏     | 507/1208 [13:47<19:04,  1.63s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.000156, train/loss_step=0.0417, global_step=6166.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  42%|████▏     | 507/1208 [13:47<19:04,  1.63s/it, loss=0.202, v_num=0, train/loss_simple_step=0.579, train/loss_vlb_step=0.0121, train/loss_step=0.579, global_step=6166.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  42%|████▏     | 508/1208 [13:51<19:05,  1.64s/it, loss=0.202, v_num=0, train/loss_simple_step=0.579, train/loss_vlb_step=0.0121, train/loss_step=0.579, global_step=6166.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  42%|████▏     | 508/1208 [13:51<19:05,  1.64s/it, loss=0.203, v_num=0, train/loss_simple_step=0.036, train/loss_vlb_step=0.000133, train/loss_step=0.036, global_step=6166.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  42%|████▏     | 509/1208 [13:52<19:02,  1.63s/it, loss=0.203, v_num=0, train/loss_simple_step=0.036, train/loss_vlb_step=0.000133, train/loss_step=0.036, global_step=6166.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  42%|████▏     | 509/1208 [13:52<19:02,  1.63s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000106, train/loss_step=0.0281, global_step=6167.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  42%|████▏     | 510/1208 [13:53<19:00,  1.63s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000106, train/loss_step=0.0281, global_step=6167.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  42%|████▏     | 510/1208 [13:53<19:00,  1.63s/it, loss=0.194, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000565, train/loss_step=0.171, global_step=6167.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  42%|████▏     | 511/1208 [13:54<18:57,  1.63s/it, loss=0.194, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000565, train/loss_step=0.171, global_step=6167.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  42%|████▏     | 511/1208 [13:54<18:57,  1.63s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0519, train/loss_vlb_step=0.000185, train/loss_step=0.0519, global_step=6167.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  42%|████▏     | 512/1208 [13:57<18:58,  1.64s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0519, train/loss_vlb_step=0.000185, train/loss_step=0.0519, global_step=6167.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  42%|████▏     | 512/1208 [13:57<18:58,  1.64s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0066, train/loss_vlb_step=3.21e-5, train/loss_step=0.0066, global_step=6167.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  42%|████▏     | 513/1208 [13:58<18:55,  1.63s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0066, train/loss_vlb_step=3.21e-5, train/loss_step=0.0066, global_step=6167.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  42%|████▏     | 513/1208 [13:58<18:55,  1.63s/it, loss=0.186, v_num=0, train/loss_simple_step=0.456, train/loss_vlb_step=0.00436, train/loss_step=0.456, global_step=6168.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  43%|████▎     | 514/1208 [13:59<18:53,  1.63s/it, loss=0.186, v_num=0, train/loss_simple_step=0.456, train/loss_vlb_step=0.00436, train/loss_step=0.456, global_step=6168.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  43%|████▎     | 514/1208 [13:59<18:53,  1.63s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.36e-5, train/loss_step=0.0141, global_step=6168.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  43%|████▎     | 515/1208 [14:00<18:51,  1.63s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.36e-5, train/loss_step=0.0141, global_step=6168.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  43%|████▎     | 515/1208 [14:00<18:51,  1.63s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00307, train/loss_vlb_step=1.72e-5, train/loss_step=0.00307, global_step=6168.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  43%|████▎     | 516/1208 [14:03<18:51,  1.64s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00307, train/loss_vlb_step=1.72e-5, train/loss_step=0.00307, global_step=6168.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  43%|████▎     | 516/1208 [14:03<18:51,  1.64s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0935, train/loss_vlb_step=0.000308, train/loss_step=0.0935, global_step=6168.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  43%|████▎     | 517/1208 [14:04<18:49,  1.63s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0935, train/loss_vlb_step=0.000308, train/loss_step=0.0935, global_step=6168.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  43%|████▎     | 517/1208 [14:04<18:49,  1.63s/it, loss=0.181, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00114, train/loss_step=0.248, global_step=6169.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  43%|████▎     | 518/1208 [14:05<18:46,  1.63s/it, loss=0.181, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00114, train/loss_step=0.248, global_step=6169.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  43%|████▎     | 518/1208 [14:05<18:46,  1.63s/it, loss=0.183, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.000165, train/loss_step=0.048, global_step=6169.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  43%|████▎     | 519/1208 [14:06<18:44,  1.63s/it, loss=0.183, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.000165, train/loss_step=0.048, global_step=6169.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  43%|████▎     | 519/1208 [14:06<18:44,  1.63s/it, loss=0.18, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000592, train/loss_step=0.170, global_step=6169.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  43%|████▎     | 520/1208 [14:10<18:44,  1.63s/it, loss=0.18, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000592, train/loss_step=0.170, global_step=6169.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  43%|████▎     | 520/1208 [14:10<18:44,  1.63s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.15e-5, train/loss_step=0.0143, global_step=6169.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  43%|████▎     | 521/1208 [14:11<18:42,  1.63s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.15e-5, train/loss_step=0.0143, global_step=6169.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  43%|████▎     | 521/1208 [14:11<18:42,  1.63s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.00011, train/loss_step=0.0285, global_step=6170.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  43%|████▎     | 522/1208 [14:12<18:39,  1.63s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.00011, train/loss_step=0.0285, global_step=6170.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  43%|████▎     | 522/1208 [14:12<18:39,  1.63s/it, loss=0.178, v_num=0, train/loss_simple_step=0.621, train/loss_vlb_step=0.00941, train/loss_step=0.621, global_step=6170.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  43%|████▎     | 523/1208 [14:13<18:37,  1.63s/it, loss=0.178, v_num=0, train/loss_simple_step=0.621, train/loss_vlb_step=0.00941, train/loss_step=0.621, global_step=6170.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  43%|████▎     | 523/1208 [14:13<18:37,  1.63s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=8.57e-5, train/loss_step=0.0218, global_step=6170.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  43%|████▎     | 524/1208 [14:16<18:37,  1.63s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=8.57e-5, train/loss_step=0.0218, global_step=6170.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  43%|████▎     | 524/1208 [14:16<18:37,  1.63s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0878, train/loss_vlb_step=0.000289, train/loss_step=0.0878, global_step=6170.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  43%|████▎     | 525/1208 [14:17<18:35,  1.63s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0878, train/loss_vlb_step=0.000289, train/loss_step=0.0878, global_step=6170.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  43%|████▎     | 525/1208 [14:17<18:35,  1.63s/it, loss=0.145, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000714, train/loss_step=0.188, global_step=6171.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  44%|████▎     | 526/1208 [14:18<18:33,  1.63s/it, loss=0.145, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000714, train/loss_step=0.188, global_step=6171.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  44%|████▎     | 526/1208 [14:18<18:33,  1.63s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000136, train/loss_step=0.0373, global_step=6171.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  44%|████▎     | 527/1208 [14:19<18:30,  1.63s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000136, train/loss_step=0.0373, global_step=6171.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  44%|████▎     | 527/1208 [14:19<18:30,  1.63s/it, loss=0.126, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000757, train/loss_step=0.201, global_step=6171.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  44%|████▎     | 528/1208 [14:22<18:31,  1.63s/it, loss=0.126, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000757, train/loss_step=0.201, global_step=6171.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  44%|████▎     | 528/1208 [14:22<18:31,  1.63s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00691, train/loss_vlb_step=3.48e-5, train/loss_step=0.00691, global_step=6171.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  44%|████▍     | 529/1208 [14:23<18:28,  1.63s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00691, train/loss_vlb_step=3.48e-5, train/loss_step=0.00691, global_step=6171.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  44%|████▍     | 529/1208 [14:23<18:28,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.5e-5, train/loss_step=0.0184, global_step=6172.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  44%|████▍     | 530/1208 [14:24<18:26,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.5e-5, train/loss_step=0.0184, global_step=6172.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  44%|████▍     | 530/1208 [14:24<18:26,  1.63s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0816, train/loss_vlb_step=0.000272, train/loss_step=0.0816, global_step=6172.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  44%|████▍     | 531/1208 [14:25<18:23,  1.63s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0816, train/loss_vlb_step=0.000272, train/loss_step=0.0816, global_step=6172.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  44%|████▍     | 531/1208 [14:25<18:23,  1.63s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.79e-5, train/loss_step=0.0175, global_step=6172.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  44%|████▍     | 532/1208 [14:29<18:24,  1.63s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.79e-5, train/loss_step=0.0175, global_step=6172.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  44%|████▍     | 532/1208 [14:29<18:24,  1.63s/it, loss=0.135, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00188, train/loss_step=0.344, global_step=6172.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  44%|████▍     | 533/1208 [14:30<18:21,  1.63s/it, loss=0.135, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00188, train/loss_step=0.344, global_step=6172.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  44%|████▍     | 533/1208 [14:30<18:21,  1.63s/it, loss=0.12, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000558, train/loss_step=0.162, global_step=6173.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  44%|████▍     | 534/1208 [14:31<18:19,  1.63s/it, loss=0.12, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000558, train/loss_step=0.162, global_step=6173.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  44%|████▍     | 534/1208 [14:31<18:19,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0633, train/loss_vlb_step=0.000219, train/loss_step=0.0633, global_step=6173.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  44%|████▍     | 535/1208 [14:32<18:17,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0633, train/loss_vlb_step=0.000219, train/loss_step=0.0633, global_step=6173.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  44%|████▍     | 535/1208 [14:32<18:17,  1.63s/it, loss=0.153, v_num=0, train/loss_simple_step=0.597, train/loss_vlb_step=0.0109, train/loss_step=0.597, global_step=6173.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  44%|████▍     | 536/1208 [14:35<18:17,  1.63s/it, loss=0.153, v_num=0, train/loss_simple_step=0.597, train/loss_vlb_step=0.0109, train/loss_step=0.597, global_step=6173.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  44%|████▍     | 536/1208 [14:35<18:17,  1.63s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0587, train/loss_vlb_step=0.000202, train/loss_step=0.0587, global_step=6173.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  44%|████▍     | 537/1208 [14:36<18:15,  1.63s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0587, train/loss_vlb_step=0.000202, train/loss_step=0.0587, global_step=6173.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  44%|████▍     | 537/1208 [14:36<18:15,  1.63s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0816, train/loss_vlb_step=0.000268, train/loss_step=0.0816, global_step=6174.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  45%|████▍     | 538/1208 [14:37<18:12,  1.63s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0816, train/loss_vlb_step=0.000268, train/loss_step=0.0816, global_step=6174.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  45%|████▍     | 538/1208 [14:37<18:12,  1.63s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0774, train/loss_vlb_step=0.000255, train/loss_step=0.0774, global_step=6174.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  45%|████▍     | 539/1208 [14:38<18:10,  1.63s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0774, train/loss_vlb_step=0.000255, train/loss_step=0.0774, global_step=6174.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  45%|████▍     | 539/1208 [14:38<18:10,  1.63s/it, loss=0.144, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000587, train/loss_step=0.172, global_step=6174.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  45%|████▍     | 540/1208 [14:41<18:10,  1.63s/it, loss=0.144, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000587, train/loss_step=0.172, global_step=6174.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  45%|████▍     | 540/1208 [14:41<18:10,  1.63s/it, loss=0.173, v_num=0, train/loss_simple_step=0.591, train/loss_vlb_step=0.0112, train/loss_step=0.591, global_step=6174.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  45%|████▍     | 541/1208 [14:42<18:08,  1.63s/it, loss=0.173, v_num=0, train/loss_simple_step=0.591, train/loss_vlb_step=0.0112, train/loss_step=0.591, global_step=6174.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  45%|████▍     | 541/1208 [14:42<18:08,  1.63s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.3e-5, train/loss_step=0.00216, global_step=6175.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  45%|████▍     | 542/1208 [14:43<18:06,  1.63s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.3e-5, train/loss_step=0.00216, global_step=6175.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  45%|████▍     | 542/1208 [14:43<18:06,  1.63s/it, loss=0.148, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.00054, train/loss_step=0.158, global_step=6175.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  45%|████▍     | 543/1208 [14:44<18:03,  1.63s/it, loss=0.148, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.00054, train/loss_step=0.158, global_step=6175.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  45%|████▍     | 543/1208 [14:44<18:03,  1.63s/it, loss=0.18, v_num=0, train/loss_simple_step=0.659, train/loss_vlb_step=0.0265, train/loss_step=0.659, global_step=6175.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  45%|████▌     | 544/1208 [14:48<18:03,  1.63s/it, loss=0.18, v_num=0, train/loss_simple_step=0.659, train/loss_vlb_step=0.0265, train/loss_step=0.659, global_step=6175.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  45%|████▌     | 544/1208 [14:48<18:03,  1.63s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.59e-5, train/loss_step=0.00267, global_step=6175.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  45%|████▌     | 545/1208 [14:49<18:01,  1.63s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.59e-5, train/loss_step=0.00267, global_step=6175.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  45%|████▌     | 545/1208 [14:49<18:01,  1.63s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0044, train/loss_vlb_step=2.32e-5, train/loss_step=0.0044, global_step=6176.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  45%|████▌     | 546/1208 [14:50<17:59,  1.63s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0044, train/loss_vlb_step=2.32e-5, train/loss_step=0.0044, global_step=6176.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  45%|████▌     | 546/1208 [14:50<17:59,  1.63s/it, loss=0.173, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000546, train/loss_step=0.162, global_step=6176.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  45%|████▌     | 547/1208 [14:51<17:56,  1.63s/it, loss=0.173, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000546, train/loss_step=0.162, global_step=6176.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  45%|████▌     | 547/1208 [14:51<17:56,  1.63s/it, loss=0.169, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000386, train/loss_step=0.116, global_step=6176.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  45%|████▌     | 548/1208 [14:54<17:57,  1.63s/it, loss=0.169, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000386, train/loss_step=0.116, global_step=6176.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  45%|████▌     | 548/1208 [14:54<17:57,  1.63s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0384, train/loss_vlb_step=0.000142, train/loss_step=0.0384, global_step=6176.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  45%|████▌     | 549/1208 [14:55<17:54,  1.63s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0384, train/loss_vlb_step=0.000142, train/loss_step=0.0384, global_step=6176.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  45%|████▌     | 549/1208 [14:55<17:54,  1.63s/it, loss=0.178, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000621, train/loss_step=0.175, global_step=6177.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  46%|████▌     | 550/1208 [14:56<17:52,  1.63s/it, loss=0.178, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000621, train/loss_step=0.175, global_step=6177.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  46%|████▌     | 550/1208 [14:56<17:52,  1.63s/it, loss=0.181, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000457, train/loss_step=0.139, global_step=6177.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  46%|████▌     | 551/1208 [14:57<17:50,  1.63s/it, loss=0.181, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000457, train/loss_step=0.139, global_step=6177.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  46%|████▌     | 551/1208 [14:57<17:50,  1.63s/it, loss=0.186, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000416, train/loss_step=0.125, global_step=6177.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  46%|████▌     | 552/1208 [15:00<17:50,  1.63s/it, loss=0.186, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000416, train/loss_step=0.125, global_step=6177.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  46%|████▌     | 552/1208 [15:00<17:50,  1.63s/it, loss=0.178, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000627, train/loss_step=0.176, global_step=6177.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  46%|████▌     | 553/1208 [15:01<17:47,  1.63s/it, loss=0.178, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000627, train/loss_step=0.176, global_step=6177.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  46%|████▌     | 553/1208 [15:01<17:47,  1.63s/it, loss=0.184, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00115, train/loss_step=0.280, global_step=6178.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  46%|████▌     | 554/1208 [15:02<17:45,  1.63s/it, loss=0.184, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00115, train/loss_step=0.280, global_step=6178.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  46%|████▌     | 554/1208 [15:02<17:45,  1.63s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0585, train/loss_vlb_step=0.000203, train/loss_step=0.0585, global_step=6178.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  46%|████▌     | 555/1208 [15:03<17:43,  1.63s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0585, train/loss_vlb_step=0.000203, train/loss_step=0.0585, global_step=6178.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  46%|████▌     | 555/1208 [15:03<17:43,  1.63s/it, loss=0.162, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000617, train/loss_step=0.172, global_step=6178.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  46%|████▌     | 556/1208 [15:06<17:43,  1.63s/it, loss=0.162, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000617, train/loss_step=0.172, global_step=6178.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  46%|████▌     | 556/1208 [15:06<17:43,  1.63s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00377, train/loss_vlb_step=2.08e-5, train/loss_step=0.00377, global_step=6178.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  46%|████▌     | 557/1208 [15:07<17:40,  1.63s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00377, train/loss_vlb_step=2.08e-5, train/loss_step=0.00377, global_step=6178.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  46%|████▌     | 557/1208 [15:07<17:40,  1.63s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.45e-5, train/loss_step=0.0233, global_step=6179.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  46%|████▌     | 558/1208 [15:08<17:38,  1.63s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.45e-5, train/loss_step=0.0233, global_step=6179.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  46%|████▌     | 558/1208 [15:08<17:38,  1.63s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.37e-5, train/loss_step=0.0114, global_step=6179.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  46%|████▋     | 559/1208 [15:09<17:36,  1.63s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.37e-5, train/loss_step=0.0114, global_step=6179.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  46%|████▋     | 559/1208 [15:09<17:36,  1.63s/it, loss=0.163, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00205, train/loss_step=0.371, global_step=6179.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  46%|████▋     | 560/1208 [15:13<17:36,  1.63s/it, loss=0.163, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00205, train/loss_step=0.371, global_step=6179.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  46%|████▋     | 560/1208 [15:13<17:36,  1.63s/it, loss=0.14, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000432, train/loss_step=0.128, global_step=6179.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  46%|████▋     | 561/1208 [15:14<17:34,  1.63s/it, loss=0.14, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000432, train/loss_step=0.128, global_step=6179.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  46%|████▋     | 561/1208 [15:14<17:34,  1.63s/it, loss=0.155, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00153, train/loss_step=0.296, global_step=6180.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  47%|████▋     | 562/1208 [15:15<17:31,  1.63s/it, loss=0.155, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00153, train/loss_step=0.296, global_step=6180.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  47%|████▋     | 562/1208 [15:15<17:31,  1.63s/it, loss=0.151, v_num=0, train/loss_simple_step=0.075, train/loss_vlb_step=0.000249, train/loss_step=0.075, global_step=6180.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  47%|████▋     | 563/1208 [15:16<17:29,  1.63s/it, loss=0.151, v_num=0, train/loss_simple_step=0.075, train/loss_vlb_step=0.000249, train/loss_step=0.075, global_step=6180.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  47%|████▋     | 563/1208 [15:16<17:29,  1.63s/it, loss=0.12, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.00015, train/loss_step=0.041, global_step=6180.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  47%|████▋     | 564/1208 [15:19<17:29,  1.63s/it, loss=0.12, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.00015, train/loss_step=0.041, global_step=6180.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  47%|████▋     | 564/1208 [15:19<17:29,  1.63s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.000148, train/loss_step=0.0417, global_step=6180.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  47%|████▋     | 565/1208 [15:20<17:27,  1.63s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.000148, train/loss_step=0.0417, global_step=6180.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  47%|████▋     | 565/1208 [15:20<17:27,  1.63s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0795, train/loss_vlb_step=0.000264, train/loss_step=0.0795, global_step=6181.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  47%|████▋     | 566/1208 [15:21<17:25,  1.63s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0795, train/loss_vlb_step=0.000264, train/loss_step=0.0795, global_step=6181.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  47%|████▋     | 566/1208 [15:21<17:25,  1.63s/it, loss=0.129, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000883, train/loss_step=0.221, global_step=6181.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  47%|████▋     | 567/1208 [15:22<17:22,  1.63s/it, loss=0.129, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000883, train/loss_step=0.221, global_step=6181.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  47%|████▋     | 567/1208 [15:22<17:22,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00952, train/loss_vlb_step=4.34e-5, train/loss_step=0.00952, global_step=6181.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  47%|████▋     | 568/1208 [15:25<17:23,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00952, train/loss_vlb_step=4.34e-5, train/loss_step=0.00952, global_step=6181.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  47%|████▋     | 568/1208 [15:25<17:23,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000149, train/loss_step=0.0415, global_step=6181.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  47%|████▋     | 569/1208 [15:26<17:20,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000149, train/loss_step=0.0415, global_step=6181.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  47%|████▋     | 569/1208 [15:26<17:20,  1.63s/it, loss=0.126, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000875, train/loss_step=0.230, global_step=6182.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  47%|████▋     | 570/1208 [15:27<17:18,  1.63s/it, loss=0.126, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000875, train/loss_step=0.230, global_step=6182.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  47%|████▋     | 570/1208 [15:27<17:18,  1.63s/it, loss=0.13, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000767, train/loss_step=0.213, global_step=6182.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  47%|████▋     | 571/1208 [15:28<17:16,  1.63s/it, loss=0.13, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000767, train/loss_step=0.213, global_step=6182.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  47%|████▋     | 571/1208 [15:28<17:16,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=3.7e-5, train/loss_step=0.00742, global_step=6182.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  47%|████▋     | 572/1208 [15:32<17:16,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=3.7e-5, train/loss_step=0.00742, global_step=6182.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  47%|████▋     | 572/1208 [15:32<17:16,  1.63s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.45e-5, train/loss_step=0.00249, global_step=6182.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  47%|████▋     | 573/1208 [15:33<17:14,  1.63s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.45e-5, train/loss_step=0.00249, global_step=6182.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  47%|████▋     | 573/1208 [15:33<17:14,  1.63s/it, loss=0.108, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000411, train/loss_step=0.125, global_step=6183.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  48%|████▊     | 574/1208 [15:34<17:11,  1.63s/it, loss=0.108, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000411, train/loss_step=0.125, global_step=6183.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  48%|████▊     | 574/1208 [15:34<17:11,  1.63s/it, loss=0.13, v_num=0, train/loss_simple_step=0.498, train/loss_vlb_step=0.00426, train/loss_step=0.498, global_step=6183.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  48%|████▊     | 575/1208 [15:35<17:09,  1.63s/it, loss=0.13, v_num=0, train/loss_simple_step=0.498, train/loss_vlb_step=0.00426, train/loss_step=0.498, global_step=6183.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  48%|████▊     | 575/1208 [15:35<17:09,  1.63s/it, loss=0.132, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000937, train/loss_step=0.216, global_step=6183.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  48%|████▊     | 576/1208 [15:38<17:09,  1.63s/it, loss=0.132, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000937, train/loss_step=0.216, global_step=6183.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  48%|████▊     | 576/1208 [15:38<17:09,  1.63s/it, loss=0.145, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00125, train/loss_step=0.264, global_step=6183.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  48%|████▊     | 577/1208 [15:39<17:07,  1.63s/it, loss=0.145, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00125, train/loss_step=0.264, global_step=6183.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  48%|████▊     | 577/1208 [15:39<17:07,  1.63s/it, loss=0.159, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00227, train/loss_step=0.313, global_step=6184.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  48%|████▊     | 578/1208 [15:40<17:05,  1.63s/it, loss=0.159, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00227, train/loss_step=0.313, global_step=6184.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  48%|████▊     | 578/1208 [15:40<17:05,  1.63s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=9.41e-6, train/loss_step=0.00156, global_step=6184.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  48%|████▊     | 579/1208 [15:41<17:02,  1.63s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=9.41e-6, train/loss_step=0.00156, global_step=6184.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  48%|████▊     | 579/1208 [15:41<17:02,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.064, train/loss_vlb_step=0.000217, train/loss_step=0.064, global_step=6184.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  48%|████▊     | 580/1208 [15:44<17:02,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.064, train/loss_vlb_step=0.000217, train/loss_step=0.064, global_step=6184.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  48%|████▊     | 580/1208 [15:44<17:02,  1.63s/it, loss=0.153, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00222, train/loss_step=0.317, global_step=6184.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  48%|████▊     | 581/1208 [15:45<17:00,  1.63s/it, loss=0.153, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00222, train/loss_step=0.317, global_step=6184.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  48%|████▊     | 581/1208 [15:45<17:00,  1.63s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00562, train/loss_vlb_step=2.9e-5, train/loss_step=0.00562, global_step=6185.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  48%|████▊     | 582/1208 [15:46<16:58,  1.63s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00562, train/loss_vlb_step=2.9e-5, train/loss_step=0.00562, global_step=6185.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  48%|████▊     | 582/1208 [15:46<16:58,  1.63s/it, loss=0.141, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000434, train/loss_step=0.130, global_step=6185.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  48%|████▊     | 583/1208 [15:47<16:56,  1.63s/it, loss=0.141, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000434, train/loss_step=0.130, global_step=6185.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  48%|████▊     | 583/1208 [15:47<16:56,  1.63s/it, loss=0.151, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000964, train/loss_step=0.238, global_step=6185.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  48%|████▊     | 584/1208 [15:51<16:56,  1.63s/it, loss=0.151, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000964, train/loss_step=0.238, global_step=6185.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  48%|████▊     | 584/1208 [15:51<16:56,  1.63s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=7.23e-5, train/loss_step=0.0158, global_step=6185.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  48%|████▊     | 585/1208 [15:52<16:53,  1.63s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=7.23e-5, train/loss_step=0.0158, global_step=6185.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  48%|████▊     | 585/1208 [15:52<16:53,  1.63s/it, loss=0.158, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000954, train/loss_step=0.245, global_step=6186.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  49%|████▊     | 586/1208 [15:53<16:51,  1.63s/it, loss=0.158, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000954, train/loss_step=0.245, global_step=6186.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  49%|████▊     | 586/1208 [15:53<16:51,  1.63s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=2.77e-5, train/loss_step=0.00526, global_step=6186.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  49%|████▊     | 587/1208 [15:54<16:49,  1.63s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=2.77e-5, train/loss_step=0.00526, global_step=6186.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  49%|████▊     | 587/1208 [15:54<16:49,  1.63s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0493, train/loss_vlb_step=0.000178, train/loss_step=0.0493, global_step=6186.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  49%|████▊     | 588/1208 [15:57<16:49,  1.63s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0493, train/loss_vlb_step=0.000178, train/loss_step=0.0493, global_step=6186.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  49%|████▊     | 588/1208 [15:57<16:49,  1.63s/it, loss=0.164, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00263, train/loss_step=0.340, global_step=6186.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  49%|████▉     | 589/1208 [15:58<16:47,  1.63s/it, loss=0.164, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00263, train/loss_step=0.340, global_step=6186.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  49%|████▉     | 589/1208 [15:58<16:47,  1.63s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=9.99e-5, train/loss_step=0.0252, global_step=6187.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  49%|████▉     | 590/1208 [15:59<16:45,  1.63s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=9.99e-5, train/loss_step=0.0252, global_step=6187.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  49%|████▉     | 590/1208 [15:59<16:45,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000566, train/loss_step=0.169, global_step=6187.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  49%|████▉     | 591/1208 [16:00<16:42,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000566, train/loss_step=0.169, global_step=6187.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  49%|████▉     | 591/1208 [16:00<16:42,  1.63s/it, loss=0.159, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000492, train/loss_step=0.145, global_step=6187.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  49%|████▉     | 592/1208 [16:03<16:42,  1.63s/it, loss=0.159, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000492, train/loss_step=0.145, global_step=6187.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  49%|████▉     | 592/1208 [16:03<16:42,  1.63s/it, loss=0.176, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00172, train/loss_step=0.361, global_step=6187.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  49%|████▉     | 593/1208 [16:04<16:40,  1.63s/it, loss=0.176, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00172, train/loss_step=0.361, global_step=6187.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  49%|████▉     | 593/1208 [16:04<16:40,  1.63s/it, loss=0.179, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000622, train/loss_step=0.178, global_step=6188.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  49%|████▉     | 594/1208 [16:05<16:38,  1.63s/it, loss=0.179, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000622, train/loss_step=0.178, global_step=6188.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  49%|████▉     | 594/1208 [16:05<16:38,  1.63s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0986, train/loss_vlb_step=0.000324, train/loss_step=0.0986, global_step=6188.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  49%|████▉     | 595/1208 [16:06<16:36,  1.63s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0986, train/loss_vlb_step=0.000324, train/loss_step=0.0986, global_step=6188.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  49%|████▉     | 595/1208 [16:06<16:36,  1.63s/it, loss=0.176, v_num=0, train/loss_simple_step=0.549, train/loss_vlb_step=0.0065, train/loss_step=0.549, global_step=6188.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  49%|████▉     | 596/1208 [16:10<16:36,  1.63s/it, loss=0.176, v_num=0, train/loss_simple_step=0.549, train/loss_vlb_step=0.0065, train/loss_step=0.549, global_step=6188.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  49%|████▉     | 596/1208 [16:10<16:36,  1.63s/it, loss=0.177, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00138, train/loss_step=0.283, global_step=6188.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  49%|████▉     | 597/1208 [16:11<16:33,  1.63s/it, loss=0.177, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00138, train/loss_step=0.283, global_step=6188.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  49%|████▉     | 597/1208 [16:11<16:33,  1.63s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.07e-5, train/loss_step=0.0136, global_step=6189.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  50%|████▉     | 598/1208 [16:12<16:31,  1.63s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.07e-5, train/loss_step=0.0136, global_step=6189.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  50%|████▉     | 598/1208 [16:12<16:31,  1.63s/it, loss=0.167, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=6189.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  50%|████▉     | 599/1208 [16:13<16:29,  1.62s/it, loss=0.167, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=6189.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  50%|████▉     | 599/1208 [16:13<16:29,  1.62s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00577, train/loss_vlb_step=3.04e-5, train/loss_step=0.00577, global_step=6189.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  50%|████▉     | 600/1208 [16:16<16:29,  1.63s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00577, train/loss_vlb_step=3.04e-5, train/loss_step=0.00577, global_step=6189.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  50%|████▉     | 600/1208 [16:16<16:29,  1.63s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00834, train/loss_vlb_step=4.06e-5, train/loss_step=0.00834, global_step=6189.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.74it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.73it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.73it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.76it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.82it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.78it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.80it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.82it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 20:  50%|████▉     | 601/1208 [16:46<16:57,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00834, train/loss_vlb_step=4.06e-5, train/loss_step=0.00834, global_step=6189.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  50%|████▉     | 601/1208 [16:46<16:57,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000992, train/loss_step=0.239, global_step=6190.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  50%|████▉     | 602/1208 [16:48<16:54,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000992, train/loss_step=0.239, global_step=6190.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  50%|████▉     | 602/1208 [16:48<16:54,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.00044, train/loss_step=0.129, global_step=6190.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  50%|████▉     | 603/1208 [16:49<16:52,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.00044, train/loss_step=0.129, global_step=6190.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  50%|████▉     | 603/1208 [16:49<16:52,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000493, train/loss_step=0.147, global_step=6190.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  50%|█████     | 604/1208 [16:52<16:52,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000493, train/loss_step=0.147, global_step=6190.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  50%|█████     | 604/1208 [16:52<16:52,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0305, train/loss_vlb_step=0.000118, train/loss_step=0.0305, global_step=6190.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  50%|█████     | 605/1208 [16:53<16:49,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0305, train/loss_vlb_step=0.000118, train/loss_step=0.0305, global_step=6190.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  50%|█████     | 605/1208 [16:53<16:49,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0898, train/loss_vlb_step=0.000304, train/loss_step=0.0898, global_step=6191.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  50%|█████     | 606/1208 [16:54<16:47,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0898, train/loss_vlb_step=0.000304, train/loss_step=0.0898, global_step=6191.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  50%|█████     | 606/1208 [16:54<16:47,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.67e-5, train/loss_step=0.0102, global_step=6191.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  50%|█████     | 607/1208 [16:55<16:45,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.67e-5, train/loss_step=0.0102, global_step=6191.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  50%|█████     | 607/1208 [16:55<16:45,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000638, train/loss_step=0.188, global_step=6191.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  50%|█████     | 608/1208 [16:58<16:45,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000638, train/loss_step=0.188, global_step=6191.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  50%|█████     | 608/1208 [16:58<16:45,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.22e-5, train/loss_step=0.0197, global_step=6191.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  50%|█████     | 609/1208 [16:59<16:42,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.22e-5, train/loss_step=0.0197, global_step=6191.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  50%|█████     | 609/1208 [16:59<16:42,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000758, train/loss_step=0.208, global_step=6192.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  50%|█████     | 610/1208 [17:00<16:40,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000758, train/loss_step=0.208, global_step=6192.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  50%|█████     | 610/1208 [17:00<16:40,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=1e-5, train/loss_step=0.00168, global_step=6192.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  51%|█████     | 611/1208 [17:01<16:38,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=1e-5, train/loss_step=0.00168, global_step=6192.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  51%|█████     | 611/1208 [17:01<16:38,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.43e-5, train/loss_step=0.00244, global_step=6192.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  51%|█████     | 612/1208 [17:04<16:37,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.43e-5, train/loss_step=0.00244, global_step=6192.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  51%|█████     | 612/1208 [17:04<16:37,  1.67s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.36e-5, train/loss_step=0.00235, global_step=6192.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  51%|█████     | 613/1208 [17:05<16:35,  1.67s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.36e-5, train/loss_step=0.00235, global_step=6192.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  51%|█████     | 613/1208 [17:05<16:35,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00127, train/loss_step=0.283, global_step=6193.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  51%|█████     | 614/1208 [17:06<16:33,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00127, train/loss_step=0.283, global_step=6193.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  51%|█████     | 614/1208 [17:06<16:33,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0962, train/loss_vlb_step=0.000317, train/loss_step=0.0962, global_step=6193.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  51%|█████     | 615/1208 [17:07<16:31,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0962, train/loss_vlb_step=0.000317, train/loss_step=0.0962, global_step=6193.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  51%|█████     | 615/1208 [17:07<16:31,  1.67s/it, loss=0.103, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000639, train/loss_step=0.189, global_step=6193.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  51%|█████     | 616/1208 [17:11<16:30,  1.67s/it, loss=0.103, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000639, train/loss_step=0.189, global_step=6193.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  51%|█████     | 616/1208 [17:11<16:30,  1.67s/it, loss=0.0901, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.000105, train/loss_step=0.0275, global_step=6193.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  51%|█████     | 617/1208 [17:12<16:28,  1.67s/it, loss=0.0901, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.000105, train/loss_step=0.0275, global_step=6193.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  51%|█████     | 617/1208 [17:12<16:28,  1.67s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.00913, train/loss_vlb_step=4.45e-5, train/loss_step=0.00913, global_step=6194.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  51%|█████     | 618/1208 [17:13<16:26,  1.67s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.00913, train/loss_vlb_step=4.45e-5, train/loss_step=0.00913, global_step=6194.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  51%|█████     | 618/1208 [17:13<16:26,  1.67s/it, loss=0.0888, v_num=0, train/loss_simple_step=0.0887, train/loss_vlb_step=0.0003, train/loss_step=0.0887, global_step=6194.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  51%|█████     | 619/1208 [17:14<16:24,  1.67s/it, loss=0.0888, v_num=0, train/loss_simple_step=0.0887, train/loss_vlb_step=0.0003, train/loss_step=0.0887, global_step=6194.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  51%|█████     | 619/1208 [17:14<16:24,  1.67s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.00843, train/loss_vlb_step=4.14e-5, train/loss_step=0.00843, global_step=6194.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  51%|█████▏    | 620/1208 [17:17<16:23,  1.67s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.00843, train/loss_vlb_step=4.14e-5, train/loss_step=0.00843, global_step=6194.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  51%|█████▏    | 620/1208 [17:17<16:23,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.631, train/loss_vlb_step=0.0254, train/loss_step=0.631, global_step=6194.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]       Epoch 20:  51%|█████▏    | 621/1208 [17:18<16:21,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.631, train/loss_vlb_step=0.0254, train/loss_step=0.631, global_step=6194.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  51%|█████▏    | 621/1208 [17:18<16:21,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00127, train/loss_step=0.281, global_step=6195.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  51%|█████▏    | 622/1208 [17:19<16:19,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00127, train/loss_step=0.281, global_step=6195.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  51%|█████▏    | 622/1208 [17:19<16:19,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000842, train/loss_step=0.218, global_step=6195.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  52%|█████▏    | 623/1208 [17:20<16:17,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000842, train/loss_step=0.218, global_step=6195.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  52%|█████▏    | 623/1208 [17:20<16:17,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=8.19e-5, train/loss_step=0.0211, global_step=6195.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  52%|█████▏    | 624/1208 [17:23<16:16,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=8.19e-5, train/loss_step=0.0211, global_step=6195.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  52%|█████▏    | 624/1208 [17:23<16:16,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000104, train/loss_step=0.0272, global_step=6195.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  52%|█████▏    | 625/1208 [17:24<16:14,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000104, train/loss_step=0.0272, global_step=6195.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  52%|█████▏    | 625/1208 [17:24<16:14,  1.67s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00779, train/loss_vlb_step=3.72e-5, train/loss_step=0.00779, global_step=6196.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  52%|█████▏    | 626/1208 [17:25<16:12,  1.67s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00779, train/loss_vlb_step=3.72e-5, train/loss_step=0.00779, global_step=6196.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  52%|█████▏    | 626/1208 [17:25<16:12,  1.67s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.43e-5, train/loss_step=0.0125, global_step=6196.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  52%|█████▏    | 627/1208 [17:26<16:10,  1.67s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.43e-5, train/loss_step=0.0125, global_step=6196.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  52%|█████▏    | 627/1208 [17:26<16:10,  1.67s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00804, train/loss_vlb_step=3.79e-5, train/loss_step=0.00804, global_step=6196.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  52%|█████▏    | 628/1208 [17:30<16:09,  1.67s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00804, train/loss_vlb_step=3.79e-5, train/loss_step=0.00804, global_step=6196.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  52%|█████▏    | 628/1208 [17:30<16:09,  1.67s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00655, train/loss_vlb_step=3.23e-5, train/loss_step=0.00655, global_step=6196.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  52%|█████▏    | 629/1208 [17:31<16:07,  1.67s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00655, train/loss_vlb_step=3.23e-5, train/loss_step=0.00655, global_step=6196.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  52%|█████▏    | 629/1208 [17:31<16:07,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.518, train/loss_vlb_step=0.00825, train/loss_step=0.518, global_step=6197.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  52%|█████▏    | 630/1208 [17:32<16:05,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.518, train/loss_vlb_step=0.00825, train/loss_step=0.518, global_step=6197.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  52%|█████▏    | 630/1208 [17:32<16:05,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00236, train/loss_step=0.361, global_step=6197.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  52%|█████▏    | 631/1208 [17:33<16:03,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00236, train/loss_step=0.361, global_step=6197.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  52%|█████▏    | 631/1208 [17:33<16:03,  1.67s/it, loss=0.16, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00329, train/loss_step=0.401, global_step=6197.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  52%|█████▏    | 632/1208 [17:36<16:02,  1.67s/it, loss=0.16, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00329, train/loss_step=0.401, global_step=6197.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  52%|█████▏    | 632/1208 [17:36<16:02,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=5.78e-5, train/loss_step=0.0146, global_step=6197.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  52%|█████▏    | 633/1208 [17:37<16:00,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=5.78e-5, train/loss_step=0.0146, global_step=6197.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  52%|█████▏    | 633/1208 [17:37<16:00,  1.67s/it, loss=0.16, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.0014, train/loss_step=0.277, global_step=6198.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  52%|█████▏    | 634/1208 [17:38<15:58,  1.67s/it, loss=0.16, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.0014, train/loss_step=0.277, global_step=6198.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  52%|█████▏    | 634/1208 [17:38<15:58,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000579, train/loss_step=0.173, global_step=6198.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  53%|█████▎    | 635/1208 [17:39<15:56,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000579, train/loss_step=0.173, global_step=6198.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  53%|█████▎    | 635/1208 [17:39<15:56,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00117, train/loss_step=0.269, global_step=6198.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  53%|█████▎    | 636/1208 [17:42<15:55,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00117, train/loss_step=0.269, global_step=6198.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  53%|█████▎    | 636/1208 [17:42<15:55,  1.67s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0533, train/loss_vlb_step=0.000184, train/loss_step=0.0533, global_step=6198.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  53%|█████▎    | 637/1208 [17:43<15:53,  1.67s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0533, train/loss_vlb_step=0.000184, train/loss_step=0.0533, global_step=6198.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  53%|█████▎    | 637/1208 [17:43<15:53,  1.67s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.83e-5, train/loss_step=0.0107, global_step=6199.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  53%|█████▎    | 638/1208 [17:45<15:51,  1.67s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.83e-5, train/loss_step=0.0107, global_step=6199.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  53%|█████▎    | 638/1208 [17:45<15:51,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00504, train/loss_vlb_step=2.66e-5, train/loss_step=0.00504, global_step=6199.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  53%|█████▎    | 639/1208 [17:46<15:49,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00504, train/loss_vlb_step=2.66e-5, train/loss_step=0.00504, global_step=6199.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  53%|█████▎    | 639/1208 [17:46<15:49,  1.67s/it, loss=0.173, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000584, train/loss_step=0.170, global_step=6199.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  53%|█████▎    | 640/1208 [17:49<15:48,  1.67s/it, loss=0.173, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000584, train/loss_step=0.170, global_step=6199.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  53%|█████▎    | 640/1208 [17:49<15:48,  1.67s/it, loss=0.16, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00239, train/loss_step=0.371, global_step=6199.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  53%|█████▎    | 641/1208 [17:50<15:46,  1.67s/it, loss=0.16, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00239, train/loss_step=0.371, global_step=6199.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  53%|█████▎    | 641/1208 [17:50<15:46,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000799, train/loss_step=0.218, global_step=6200.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  53%|█████▎    | 642/1208 [17:51<15:44,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000799, train/loss_step=0.218, global_step=6200.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  53%|█████▎    | 642/1208 [17:51<15:44,  1.67s/it, loss=0.148, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000116, train/loss_step=0.031, global_step=6200.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  53%|█████▎    | 643/1208 [17:52<15:42,  1.67s/it, loss=0.148, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000116, train/loss_step=0.031, global_step=6200.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  53%|█████▎    | 643/1208 [17:52<15:42,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.79e-5, train/loss_step=0.0127, global_step=6200.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  53%|█████▎    | 644/1208 [17:55<15:41,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.79e-5, train/loss_step=0.0127, global_step=6200.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  53%|█████▎    | 644/1208 [17:55<15:41,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0997, train/loss_vlb_step=0.000329, train/loss_step=0.0997, global_step=6200.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  53%|█████▎    | 645/1208 [17:56<15:39,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0997, train/loss_vlb_step=0.000329, train/loss_step=0.0997, global_step=6200.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  53%|█████▎    | 645/1208 [17:56<15:39,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00582, train/loss_vlb_step=3.07e-5, train/loss_step=0.00582, global_step=6201.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  53%|█████▎    | 646/1208 [17:57<15:37,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00582, train/loss_vlb_step=3.07e-5, train/loss_step=0.00582, global_step=6201.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  53%|█████▎    | 646/1208 [17:57<15:37,  1.67s/it, loss=0.176, v_num=0, train/loss_simple_step=0.519, train/loss_vlb_step=0.00556, train/loss_step=0.519, global_step=6201.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  54%|█████▎    | 647/1208 [17:58<15:35,  1.67s/it, loss=0.176, v_num=0, train/loss_simple_step=0.519, train/loss_vlb_step=0.00556, train/loss_step=0.519, global_step=6201.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  54%|█████▎    | 647/1208 [17:58<15:35,  1.67s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.9e-5, train/loss_step=0.0191, global_step=6201.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  54%|█████▎    | 648/1208 [18:01<15:34,  1.67s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.9e-5, train/loss_step=0.0191, global_step=6201.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  54%|█████▎    | 648/1208 [18:01<15:34,  1.67s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0551, train/loss_vlb_step=0.000194, train/loss_step=0.0551, global_step=6201.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  54%|█████▎    | 649/1208 [18:02<15:32,  1.67s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0551, train/loss_vlb_step=0.000194, train/loss_step=0.0551, global_step=6201.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  54%|█████▎    | 649/1208 [18:02<15:32,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000107, train/loss_step=0.0269, global_step=6202.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  54%|█████▍    | 650/1208 [18:04<15:30,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000107, train/loss_step=0.0269, global_step=6202.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  54%|█████▍    | 650/1208 [18:04<15:30,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.001, train/loss_step=0.253, global_step=6202.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]     Epoch 20:  54%|█████▍    | 651/1208 [18:05<15:28,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.001, train/loss_step=0.253, global_step=6202.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  54%|█████▍    | 651/1208 [18:05<15:28,  1.67s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.19e-5, train/loss_step=0.00409, global_step=6202.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  54%|█████▍    | 652/1208 [18:08<15:28,  1.67s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.19e-5, train/loss_step=0.00409, global_step=6202.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  54%|█████▍    | 652/1208 [18:08<15:28,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.00038, train/loss_step=0.116, global_step=6202.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  54%|█████▍    | 653/1208 [18:09<15:25,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.00038, train/loss_step=0.116, global_step=6202.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  54%|█████▍    | 653/1208 [18:09<15:25,  1.67s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0682, train/loss_vlb_step=0.000225, train/loss_step=0.0682, global_step=6203.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  54%|█████▍    | 654/1208 [18:10<15:23,  1.67s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0682, train/loss_vlb_step=0.000225, train/loss_step=0.0682, global_step=6203.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  54%|█████▍    | 654/1208 [18:10<15:23,  1.67s/it, loss=0.128, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.000999, train/loss_step=0.252, global_step=6203.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  54%|█████▍    | 655/1208 [18:11<15:21,  1.67s/it, loss=0.128, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.000999, train/loss_step=0.252, global_step=6203.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  54%|█████▍    | 655/1208 [18:11<15:21,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.59e-5, train/loss_step=0.00284, global_step=6203.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  54%|█████▍    | 656/1208 [18:14<15:21,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.59e-5, train/loss_step=0.00284, global_step=6203.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  54%|█████▍    | 656/1208 [18:14<15:21,  1.67s/it, loss=0.116, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000285, train/loss_step=0.086, global_step=6203.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  54%|█████▍    | 657/1208 [18:15<15:18,  1.67s/it, loss=0.116, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000285, train/loss_step=0.086, global_step=6203.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  54%|█████▍    | 657/1208 [18:15<15:18,  1.67s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00659, train/loss_vlb_step=3.44e-5, train/loss_step=0.00659, global_step=6204.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  54%|█████▍    | 658/1208 [18:16<15:16,  1.67s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00659, train/loss_vlb_step=3.44e-5, train/loss_step=0.00659, global_step=6204.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  54%|█████▍    | 658/1208 [18:16<15:16,  1.67s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00676, train/loss_vlb_step=3.21e-5, train/loss_step=0.00676, global_step=6204.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  55%|█████▍    | 659/1208 [18:17<15:14,  1.67s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00676, train/loss_vlb_step=3.21e-5, train/loss_step=0.00676, global_step=6204.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  55%|█████▍    | 659/1208 [18:17<15:14,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.00068, train/loss_step=0.196, global_step=6204.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  55%|█████▍    | 660/1208 [18:20<15:14,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.00068, train/loss_step=0.196, global_step=6204.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  55%|█████▍    | 660/1208 [18:20<15:14,  1.67s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.000154, train/loss_step=0.0413, global_step=6204.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  55%|█████▍    | 661/1208 [18:21<15:11,  1.67s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.000154, train/loss_step=0.0413, global_step=6204.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  55%|█████▍    | 661/1208 [18:21<15:11,  1.67s/it, loss=0.103, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00108, train/loss_step=0.251, global_step=6205.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  55%|█████▍    | 662/1208 [18:22<15:09,  1.67s/it, loss=0.103, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00108, train/loss_step=0.251, global_step=6205.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  55%|█████▍    | 662/1208 [18:22<15:09,  1.67s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00737, train/loss_vlb_step=3.58e-5, train/loss_step=0.00737, global_step=6205.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  55%|█████▍    | 663/1208 [18:23<15:07,  1.67s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00737, train/loss_vlb_step=3.58e-5, train/loss_step=0.00737, global_step=6205.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  55%|█████▍    | 663/1208 [18:23<15:07,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00144, train/loss_step=0.317, global_step=6205.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  55%|█████▍    | 664/1208 [18:27<15:07,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00144, train/loss_step=0.317, global_step=6205.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  55%|█████▍    | 664/1208 [18:27<15:07,  1.67s/it, loss=0.144, v_num=0, train/loss_simple_step=0.656, train/loss_vlb_step=0.0285, train/loss_step=0.656, global_step=6205.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  55%|█████▌    | 665/1208 [18:28<15:04,  1.67s/it, loss=0.144, v_num=0, train/loss_simple_step=0.656, train/loss_vlb_step=0.0285, train/loss_step=0.656, global_step=6205.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  55%|█████▌    | 665/1208 [18:28<15:04,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000811, train/loss_step=0.204, global_step=6206.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  55%|█████▌    | 666/1208 [18:29<15:02,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000811, train/loss_step=0.204, global_step=6206.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  55%|█████▌    | 666/1208 [18:29<15:02,  1.67s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=2.44e-5, train/loss_step=0.00462, global_step=6206.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  55%|█████▌    | 667/1208 [18:30<15:00,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=2.44e-5, train/loss_step=0.00462, global_step=6206.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  55%|█████▌    | 667/1208 [18:30<15:00,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00372, train/loss_vlb_step=1.95e-5, train/loss_step=0.00372, global_step=6206.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  55%|█████▌    | 668/1208 [18:33<15:00,  1.67s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00372, train/loss_vlb_step=1.95e-5, train/loss_step=0.00372, global_step=6206.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  55%|█████▌    | 668/1208 [18:33<15:00,  1.67s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.79e-5, train/loss_step=0.0107, global_step=6206.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  55%|█████▌    | 669/1208 [18:34<14:57,  1.67s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.79e-5, train/loss_step=0.0107, global_step=6206.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  55%|█████▌    | 669/1208 [18:34<14:57,  1.67s/it, loss=0.125, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.38e-5, train/loss_step=0.012, global_step=6207.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  55%|█████▌    | 670/1208 [18:35<14:55,  1.67s/it, loss=0.125, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.38e-5, train/loss_step=0.012, global_step=6207.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  55%|█████▌    | 670/1208 [18:35<14:55,  1.67s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00815, train/loss_vlb_step=4.06e-5, train/loss_step=0.00815, global_step=6207.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  56%|█████▌    | 671/1208 [18:36<14:53,  1.66s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00815, train/loss_vlb_step=4.06e-5, train/loss_step=0.00815, global_step=6207.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  56%|█████▌    | 671/1208 [18:36<14:53,  1.66s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00945, train/loss_vlb_step=4.6e-5, train/loss_step=0.00945, global_step=6207.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  56%|█████▌    | 672/1208 [18:39<14:53,  1.67s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00945, train/loss_vlb_step=4.6e-5, train/loss_step=0.00945, global_step=6207.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  56%|█████▌    | 672/1208 [18:39<14:53,  1.67s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0479, train/loss_vlb_step=0.000166, train/loss_step=0.0479, global_step=6207.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  56%|█████▌    | 673/1208 [18:40<14:51,  1.67s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0479, train/loss_vlb_step=0.000166, train/loss_step=0.0479, global_step=6207.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  56%|█████▌    | 673/1208 [18:40<14:51,  1.67s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.62e-5, train/loss_step=0.0104, global_step=6208.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  56%|█████▌    | 674/1208 [18:41<14:48,  1.66s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.62e-5, train/loss_step=0.0104, global_step=6208.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  56%|█████▌    | 674/1208 [18:41<14:48,  1.66s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.0865, train/loss_vlb_step=0.000287, train/loss_step=0.0865, global_step=6208.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  56%|█████▌    | 675/1208 [18:42<14:46,  1.66s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.0865, train/loss_vlb_step=0.000287, train/loss_step=0.0865, global_step=6208.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  56%|█████▌    | 675/1208 [18:42<14:46,  1.66s/it, loss=0.11, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000986, train/loss_step=0.237, global_step=6208.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  56%|█████▌    | 676/1208 [18:46<14:46,  1.67s/it, loss=0.11, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000986, train/loss_step=0.237, global_step=6208.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  56%|█████▌    | 676/1208 [18:46<14:46,  1.67s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00456, train/loss_vlb_step=2.39e-5, train/loss_step=0.00456, global_step=6208.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  56%|█████▌    | 677/1208 [18:47<14:44,  1.67s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00456, train/loss_vlb_step=2.39e-5, train/loss_step=0.00456, global_step=6208.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  56%|█████▌    | 677/1208 [18:47<14:44,  1.67s/it, loss=0.108, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.000152, train/loss_step=0.041, global_step=6209.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  56%|█████▌    | 678/1208 [18:48<14:41,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.000152, train/loss_step=0.041, global_step=6209.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  56%|█████▌    | 678/1208 [18:48<14:41,  1.66s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000157, train/loss_step=0.0443, global_step=6209.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  56%|█████▌    | 679/1208 [18:49<14:39,  1.66s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000157, train/loss_step=0.0443, global_step=6209.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  56%|█████▌    | 679/1208 [18:49<14:39,  1.66s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.46e-5, train/loss_step=0.0177, global_step=6209.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  56%|█████▋    | 680/1208 [18:52<14:39,  1.67s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.46e-5, train/loss_step=0.0177, global_step=6209.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  56%|█████▋    | 680/1208 [18:52<14:39,  1.67s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.15e-5, train/loss_step=0.0169, global_step=6209.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  56%|█████▋    | 681/1208 [18:53<14:37,  1.66s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.15e-5, train/loss_step=0.0169, global_step=6209.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  56%|█████▋    | 681/1208 [18:53<14:37,  1.66s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.84e-5, train/loss_step=0.0106, global_step=6210.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  56%|█████▋    | 682/1208 [18:54<14:35,  1.66s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.84e-5, train/loss_step=0.0106, global_step=6210.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  56%|█████▋    | 682/1208 [18:54<14:35,  1.66s/it, loss=0.0892, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.00015, train/loss_step=0.0413, global_step=6210.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  57%|█████▋    | 683/1208 [18:55<14:32,  1.66s/it, loss=0.0892, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.00015, train/loss_step=0.0413, global_step=6210.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  57%|█████▋    | 683/1208 [18:55<14:32,  1.66s/it, loss=0.0737, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=3.37e-5, train/loss_step=0.00677, global_step=6210.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  57%|█████▋    | 684/1208 [18:58<14:32,  1.66s/it, loss=0.0737, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=3.37e-5, train/loss_step=0.00677, global_step=6210.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  57%|█████▋    | 684/1208 [18:58<14:32,  1.66s/it, loss=0.0456, v_num=0, train/loss_simple_step=0.0937, train/loss_vlb_step=0.000312, train/loss_step=0.0937, global_step=6210.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  57%|█████▋    | 685/1208 [18:59<14:30,  1.66s/it, loss=0.0456, v_num=0, train/loss_simple_step=0.0937, train/loss_vlb_step=0.000312, train/loss_step=0.0937, global_step=6210.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  57%|█████▋    | 685/1208 [18:59<14:30,  1.66s/it, loss=0.0355, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.17e-5, train/loss_step=0.00203, global_step=6211.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  57%|█████▋    | 686/1208 [19:00<14:28,  1.66s/it, loss=0.0355, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.17e-5, train/loss_step=0.00203, global_step=6211.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  57%|█████▋    | 686/1208 [19:00<14:28,  1.66s/it, loss=0.0546, v_num=0, train/loss_simple_step=0.387, train/loss_vlb_step=0.00296, train/loss_step=0.387, global_step=6211.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  57%|█████▋    | 687/1208 [19:01<14:25,  1.66s/it, loss=0.0546, v_num=0, train/loss_simple_step=0.387, train/loss_vlb_step=0.00296, train/loss_step=0.387, global_step=6211.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  57%|█████▋    | 687/1208 [19:01<14:25,  1.66s/it, loss=0.0548, v_num=0, train/loss_simple_step=0.00797, train/loss_vlb_step=3.68e-5, train/loss_step=0.00797, global_step=6211.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  57%|█████▋    | 688/1208 [19:05<14:25,  1.66s/it, loss=0.0548, v_num=0, train/loss_simple_step=0.00797, train/loss_vlb_step=3.68e-5, train/loss_step=0.00797, global_step=6211.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  57%|█████▋    | 688/1208 [19:05<14:25,  1.66s/it, loss=0.0553, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.46e-5, train/loss_step=0.0213, global_step=6211.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  57%|█████▋    | 689/1208 [19:06<14:23,  1.66s/it, loss=0.0553, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.46e-5, train/loss_step=0.0213, global_step=6211.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  57%|█████▋    | 689/1208 [19:06<14:23,  1.66s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.828, train/loss_vlb_step=0.209, train/loss_step=0.828, global_step=6212.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  57%|█████▋    | 690/1208 [19:07<14:21,  1.66s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.828, train/loss_vlb_step=0.209, train/loss_step=0.828, global_step=6212.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  57%|█████▋    | 690/1208 [19:07<14:21,  1.66s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.67e-5, train/loss_step=0.0151, global_step=6212.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  57%|█████▋    | 691/1208 [19:08<14:19,  1.66s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.67e-5, train/loss_step=0.0151, global_step=6212.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  57%|█████▋    | 691/1208 [19:08<14:19,  1.66s/it, loss=0.103, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000502, train/loss_step=0.147, global_step=6212.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  57%|█████▋    | 692/1208 [19:11<14:18,  1.66s/it, loss=0.103, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000502, train/loss_step=0.147, global_step=6212.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  57%|█████▋    | 692/1208 [19:11<14:18,  1.66s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.25e-5, train/loss_step=0.0134, global_step=6212.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  57%|█████▋    | 693/1208 [19:12<14:16,  1.66s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.25e-5, train/loss_step=0.0134, global_step=6212.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  57%|█████▋    | 693/1208 [19:12<14:16,  1.66s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0575, train/loss_vlb_step=0.000209, train/loss_step=0.0575, global_step=6213.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  57%|█████▋    | 694/1208 [19:13<14:14,  1.66s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0575, train/loss_vlb_step=0.000209, train/loss_step=0.0575, global_step=6213.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  57%|█████▋    | 694/1208 [19:13<14:14,  1.66s/it, loss=0.106, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=6213.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  58%|█████▊    | 695/1208 [19:14<14:12,  1.66s/it, loss=0.106, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=6213.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  58%|█████▊    | 695/1208 [19:14<14:12,  1.66s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0541, train/loss_vlb_step=0.000187, train/loss_step=0.0541, global_step=6213.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  58%|█████▊    | 696/1208 [19:17<14:11,  1.66s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0541, train/loss_vlb_step=0.000187, train/loss_step=0.0541, global_step=6213.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  58%|█████▊    | 696/1208 [19:17<14:11,  1.66s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.0635, train/loss_vlb_step=0.000213, train/loss_step=0.0635, global_step=6213.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  58%|█████▊    | 697/1208 [19:18<14:09,  1.66s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.0635, train/loss_vlb_step=0.000213, train/loss_step=0.0635, global_step=6213.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  58%|█████▊    | 697/1208 [19:18<14:09,  1.66s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0809, train/loss_vlb_step=0.000281, train/loss_step=0.0809, global_step=6214.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  58%|█████▊    | 698/1208 [19:19<14:07,  1.66s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0809, train/loss_vlb_step=0.000281, train/loss_step=0.0809, global_step=6214.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  58%|█████▊    | 698/1208 [19:19<14:07,  1.66s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0677, train/loss_vlb_step=0.000229, train/loss_step=0.0677, global_step=6214.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  58%|█████▊    | 699/1208 [19:20<14:05,  1.66s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0677, train/loss_vlb_step=0.000229, train/loss_step=0.0677, global_step=6214.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  58%|█████▊    | 699/1208 [19:20<14:05,  1.66s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0778, train/loss_vlb_step=0.000264, train/loss_step=0.0778, global_step=6214.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  58%|█████▊    | 700/1208 [19:24<14:04,  1.66s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0778, train/loss_vlb_step=0.000264, train/loss_step=0.0778, global_step=6214.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  58%|█████▊    | 700/1208 [19:24<14:04,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.0055, train/loss_step=0.415, global_step=6214.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  58%|█████▊    | 701/1208 [19:25<14:02,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.0055, train/loss_step=0.415, global_step=6214.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  58%|█████▊    | 701/1208 [19:25<14:02,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.41e-5, train/loss_step=0.0197, global_step=6215.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  58%|█████▊    | 702/1208 [19:26<14:00,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.41e-5, train/loss_step=0.0197, global_step=6215.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  58%|█████▊    | 702/1208 [19:26<14:00,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000876, train/loss_step=0.229, global_step=6215.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  58%|█████▊    | 703/1208 [19:27<13:58,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000876, train/loss_step=0.229, global_step=6215.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  58%|█████▊    | 703/1208 [19:27<13:58,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0929, train/loss_vlb_step=0.000306, train/loss_step=0.0929, global_step=6215.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  58%|█████▊    | 704/1208 [19:30<13:57,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0929, train/loss_vlb_step=0.000306, train/loss_step=0.0929, global_step=6215.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  58%|█████▊    | 704/1208 [19:30<13:57,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.077, train/loss_vlb_step=0.00026, train/loss_step=0.077, global_step=6215.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  58%|█████▊    | 705/1208 [19:31<13:55,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.077, train/loss_vlb_step=0.00026, train/loss_step=0.077, global_step=6215.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  58%|█████▊    | 705/1208 [19:31<13:55,  1.66s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0785, train/loss_vlb_step=0.000275, train/loss_step=0.0785, global_step=6216.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  58%|█████▊    | 706/1208 [19:32<13:53,  1.66s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0785, train/loss_vlb_step=0.000275, train/loss_step=0.0785, global_step=6216.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  58%|█████▊    | 706/1208 [19:32<13:53,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000824, train/loss_step=0.220, global_step=6216.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  59%|█████▊    | 707/1208 [19:33<13:51,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000824, train/loss_step=0.220, global_step=6216.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  59%|█████▊    | 707/1208 [19:33<13:51,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0928, train/loss_vlb_step=0.00031, train/loss_step=0.0928, global_step=6216.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  59%|█████▊    | 708/1208 [19:36<13:51,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0928, train/loss_vlb_step=0.00031, train/loss_step=0.0928, global_step=6216.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  59%|█████▊    | 708/1208 [19:36<13:51,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0655, train/loss_vlb_step=0.000222, train/loss_step=0.0655, global_step=6216.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  59%|█████▊    | 709/1208 [19:37<13:48,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0655, train/loss_vlb_step=0.000222, train/loss_step=0.0655, global_step=6216.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  59%|█████▊    | 709/1208 [19:37<13:48,  1.66s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.99e-5, train/loss_step=0.0164, global_step=6217.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  59%|█████▉    | 710/1208 [19:38<13:46,  1.66s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.99e-5, train/loss_step=0.0164, global_step=6217.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  59%|█████▉    | 710/1208 [19:38<13:46,  1.66s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=1.47e-5, train/loss_step=0.00258, global_step=6217.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  59%|█████▉    | 711/1208 [19:39<13:44,  1.66s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=1.47e-5, train/loss_step=0.00258, global_step=6217.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  59%|█████▉    | 711/1208 [19:39<13:44,  1.66s/it, loss=0.116, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00584, train/loss_step=0.476, global_step=6217.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]     Epoch 20:  59%|█████▉    | 712/1208 [19:43<13:44,  1.66s/it, loss=0.116, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00584, train/loss_step=0.476, global_step=6217.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  59%|█████▉    | 712/1208 [19:43<13:44,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.00585, train/loss_step=0.485, global_step=6217.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  59%|█████▉    | 713/1208 [19:44<13:42,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.00585, train/loss_step=0.485, global_step=6217.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  59%|█████▉    | 713/1208 [19:44<13:42,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0934, train/loss_vlb_step=0.000307, train/loss_step=0.0934, global_step=6218.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  59%|█████▉    | 714/1208 [19:45<13:40,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0934, train/loss_vlb_step=0.000307, train/loss_step=0.0934, global_step=6218.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  59%|█████▉    | 714/1208 [19:45<13:40,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0858, train/loss_vlb_step=0.000284, train/loss_step=0.0858, global_step=6218.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  59%|█████▉    | 715/1208 [19:46<13:37,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0858, train/loss_vlb_step=0.000284, train/loss_step=0.0858, global_step=6218.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  59%|█████▉    | 715/1208 [19:46<13:37,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000109, train/loss_step=0.0279, global_step=6218.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  59%|█████▉    | 716/1208 [19:49<13:37,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000109, train/loss_step=0.0279, global_step=6218.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  59%|█████▉    | 716/1208 [19:49<13:37,  1.66s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000127, train/loss_step=0.0345, global_step=6218.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  59%|█████▉    | 717/1208 [19:50<13:35,  1.66s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000127, train/loss_step=0.0345, global_step=6218.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  59%|█████▉    | 717/1208 [19:50<13:35,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.54e-5, train/loss_step=0.0242, global_step=6219.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  59%|█████▉    | 718/1208 [19:51<13:33,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.54e-5, train/loss_step=0.0242, global_step=6219.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  59%|█████▉    | 718/1208 [19:51<13:33,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.92e-5, train/loss_step=0.0106, global_step=6219.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  60%|█████▉    | 719/1208 [19:52<13:31,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.92e-5, train/loss_step=0.0106, global_step=6219.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  60%|█████▉    | 719/1208 [19:52<13:31,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.83e-5, train/loss_step=0.0033, global_step=6219.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  60%|█████▉    | 720/1208 [19:55<13:30,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.83e-5, train/loss_step=0.0033, global_step=6219.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  60%|█████▉    | 720/1208 [19:55<13:30,  1.66s/it, loss=0.121, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00133, train/loss_step=0.278, global_step=6219.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  60%|█████▉    | 721/1208 [19:56<13:28,  1.66s/it, loss=0.121, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00133, train/loss_step=0.278, global_step=6219.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  60%|█████▉    | 721/1208 [19:56<13:28,  1.66s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.49e-5, train/loss_step=0.0121, global_step=6220.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  60%|█████▉    | 722/1208 [19:57<13:26,  1.66s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.49e-5, train/loss_step=0.0121, global_step=6220.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  60%|█████▉    | 722/1208 [19:57<13:26,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000442, train/loss_step=0.132, global_step=6220.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  60%|█████▉    | 723/1208 [19:58<13:24,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000442, train/loss_step=0.132, global_step=6220.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  60%|█████▉    | 723/1208 [19:58<13:24,  1.66s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00279, train/loss_vlb_step=1.59e-5, train/loss_step=0.00279, global_step=6220.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  60%|█████▉    | 724/1208 [20:02<13:23,  1.66s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00279, train/loss_vlb_step=1.59e-5, train/loss_step=0.00279, global_step=6220.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  60%|█████▉    | 724/1208 [20:02<13:23,  1.66s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.46e-5, train/loss_step=0.00249, global_step=6220.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  60%|██████    | 725/1208 [20:03<13:21,  1.66s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.46e-5, train/loss_step=0.00249, global_step=6220.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  60%|██████    | 725/1208 [20:03<13:21,  1.66s/it, loss=0.114, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000898, train/loss_step=0.223, global_step=6221.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  60%|██████    | 726/1208 [20:04<13:19,  1.66s/it, loss=0.114, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000898, train/loss_step=0.223, global_step=6221.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  60%|██████    | 726/1208 [20:04<13:19,  1.66s/it, loss=0.106, v_num=0, train/loss_simple_step=0.054, train/loss_vlb_step=0.000184, train/loss_step=0.054, global_step=6221.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  60%|██████    | 727/1208 [20:05<13:17,  1.66s/it, loss=0.106, v_num=0, train/loss_simple_step=0.054, train/loss_vlb_step=0.000184, train/loss_step=0.054, global_step=6221.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  60%|██████    | 727/1208 [20:05<13:17,  1.66s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000151, train/loss_step=0.0402, global_step=6221.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  60%|██████    | 728/1208 [20:08<13:16,  1.66s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000151, train/loss_step=0.0402, global_step=6221.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  60%|██████    | 728/1208 [20:08<13:16,  1.66s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0617, train/loss_vlb_step=0.000205, train/loss_step=0.0617, global_step=6221.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  60%|██████    | 729/1208 [20:09<13:14,  1.66s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0617, train/loss_vlb_step=0.000205, train/loss_step=0.0617, global_step=6221.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  60%|██████    | 729/1208 [20:09<13:14,  1.66s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.67e-5, train/loss_step=0.00292, global_step=6222.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  60%|██████    | 730/1208 [20:10<13:12,  1.66s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.67e-5, train/loss_step=0.00292, global_step=6222.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  60%|██████    | 730/1208 [20:10<13:12,  1.66s/it, loss=0.113, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000743, train/loss_step=0.199, global_step=6222.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  61%|██████    | 731/1208 [20:11<13:10,  1.66s/it, loss=0.113, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000743, train/loss_step=0.199, global_step=6222.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  61%|██████    | 731/1208 [20:11<13:10,  1.66s/it, loss=0.0993, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000774, train/loss_step=0.212, global_step=6222.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  61%|██████    | 732/1208 [20:14<13:09,  1.66s/it, loss=0.0993, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000774, train/loss_step=0.212, global_step=6222.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  61%|██████    | 732/1208 [20:14<13:09,  1.66s/it, loss=0.0761, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=8.89e-5, train/loss_step=0.022, global_step=6222.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  61%|██████    | 733/1208 [20:15<13:07,  1.66s/it, loss=0.0761, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=8.89e-5, train/loss_step=0.022, global_step=6222.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  61%|██████    | 733/1208 [20:15<13:07,  1.66s/it, loss=0.082, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000766, train/loss_step=0.210, global_step=6223.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  61%|██████    | 734/1208 [20:16<13:05,  1.66s/it, loss=0.082, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000766, train/loss_step=0.210, global_step=6223.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  61%|██████    | 734/1208 [20:16<13:05,  1.66s/it, loss=0.0789, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=0.0001, train/loss_step=0.0245, global_step=6223.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  61%|██████    | 735/1208 [20:17<13:03,  1.66s/it, loss=0.0789, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=0.0001, train/loss_step=0.0245, global_step=6223.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  61%|██████    | 735/1208 [20:17<13:03,  1.66s/it, loss=0.0778, v_num=0, train/loss_simple_step=0.00501, train/loss_vlb_step=2.54e-5, train/loss_step=0.00501, global_step=6223.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  61%|██████    | 736/1208 [20:21<13:03,  1.66s/it, loss=0.0778, v_num=0, train/loss_simple_step=0.00501, train/loss_vlb_step=2.54e-5, train/loss_step=0.00501, global_step=6223.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  61%|██████    | 736/1208 [20:21<13:03,  1.66s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00148, train/loss_step=0.290, global_step=6223.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  61%|██████    | 737/1208 [20:22<13:01,  1.66s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00148, train/loss_step=0.290, global_step=6223.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  61%|██████    | 737/1208 [20:22<13:01,  1.66s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.00037, train/loss_step=0.112, global_step=6224.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  61%|██████    | 738/1208 [20:23<12:58,  1.66s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.00037, train/loss_step=0.112, global_step=6224.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  61%|██████    | 738/1208 [20:23<12:58,  1.66s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0321, train/loss_vlb_step=0.000125, train/loss_step=0.0321, global_step=6224.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  61%|██████    | 739/1208 [20:24<12:56,  1.66s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0321, train/loss_vlb_step=0.000125, train/loss_step=0.0321, global_step=6224.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  61%|██████    | 739/1208 [20:24<12:56,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.451, train/loss_vlb_step=0.00355, train/loss_step=0.451, global_step=6224.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  61%|██████▏   | 740/1208 [20:27<12:56,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.451, train/loss_vlb_step=0.00355, train/loss_step=0.451, global_step=6224.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  61%|██████▏   | 740/1208 [20:27<12:56,  1.66s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0088, train/loss_vlb_step=4.18e-5, train/loss_step=0.0088, global_step=6224.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  61%|██████▏   | 741/1208 [20:28<12:54,  1.66s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0088, train/loss_vlb_step=4.18e-5, train/loss_step=0.0088, global_step=6224.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  61%|██████▏   | 741/1208 [20:28<12:54,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000769, train/loss_step=0.213, global_step=6225.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  61%|██████▏   | 742/1208 [20:29<12:52,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000769, train/loss_step=0.213, global_step=6225.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  61%|██████▏   | 742/1208 [20:29<12:52,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00135, train/loss_step=0.302, global_step=6225.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  62%|██████▏   | 743/1208 [20:30<12:50,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00135, train/loss_step=0.302, global_step=6225.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  62%|██████▏   | 743/1208 [20:30<12:50,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=6225.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  62%|██████▏   | 744/1208 [20:33<12:49,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=6225.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  62%|██████▏   | 744/1208 [20:33<12:49,  1.66s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00457, train/loss_vlb_step=2.41e-5, train/loss_step=0.00457, global_step=6225.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  62%|██████▏   | 745/1208 [20:34<12:47,  1.66s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00457, train/loss_vlb_step=2.41e-5, train/loss_step=0.00457, global_step=6225.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  62%|██████▏   | 745/1208 [20:34<12:47,  1.66s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.91e-5, train/loss_step=0.0151, global_step=6226.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  62%|██████▏   | 746/1208 [20:35<12:45,  1.66s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.91e-5, train/loss_step=0.0151, global_step=6226.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  62%|██████▏   | 746/1208 [20:35<12:45,  1.66s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0867, train/loss_vlb_step=0.000288, train/loss_step=0.0867, global_step=6226.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  62%|██████▏   | 747/1208 [20:36<12:43,  1.66s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0867, train/loss_vlb_step=0.000288, train/loss_step=0.0867, global_step=6226.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  62%|██████▏   | 747/1208 [20:36<12:43,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000676, train/loss_step=0.181, global_step=6226.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  62%|██████▏   | 748/1208 [20:39<12:42,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000676, train/loss_step=0.181, global_step=6226.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  62%|██████▏   | 748/1208 [20:39<12:42,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00956, train/loss_vlb_step=4.37e-5, train/loss_step=0.00956, global_step=6226.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  62%|██████▏   | 749/1208 [20:41<12:40,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00956, train/loss_vlb_step=4.37e-5, train/loss_step=0.00956, global_step=6226.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  62%|██████▏   | 749/1208 [20:41<12:40,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.000184, train/loss_step=0.0526, global_step=6227.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  62%|██████▏   | 750/1208 [20:42<12:38,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.000184, train/loss_step=0.0526, global_step=6227.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  62%|██████▏   | 750/1208 [20:42<12:38,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00738, train/loss_vlb_step=3.62e-5, train/loss_step=0.00738, global_step=6227.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  62%|██████▏   | 751/1208 [20:43<12:36,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00738, train/loss_vlb_step=3.62e-5, train/loss_step=0.00738, global_step=6227.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  62%|██████▏   | 751/1208 [20:43<12:36,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00387, train/loss_vlb_step=2.11e-5, train/loss_step=0.00387, global_step=6227.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  62%|██████▏   | 752/1208 [20:46<12:35,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00387, train/loss_vlb_step=2.11e-5, train/loss_step=0.00387, global_step=6227.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  62%|██████▏   | 752/1208 [20:46<12:35,  1.66s/it, loss=0.12, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00113, train/loss_step=0.267, global_step=6227.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]     Epoch 20:  62%|██████▏   | 753/1208 [20:47<12:33,  1.66s/it, loss=0.12, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00113, train/loss_step=0.267, global_step=6227.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  62%|██████▏   | 753/1208 [20:47<12:33,  1.66s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.6e-5, train/loss_step=0.00274, global_step=6228.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  62%|██████▏   | 754/1208 [20:48<12:31,  1.66s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.6e-5, train/loss_step=0.00274, global_step=6228.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  62%|██████▏   | 754/1208 [20:48<12:31,  1.66s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0447, train/loss_vlb_step=0.000162, train/loss_step=0.0447, global_step=6228.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  62%|██████▎   | 755/1208 [20:49<12:29,  1.65s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0447, train/loss_vlb_step=0.000162, train/loss_step=0.0447, global_step=6228.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  62%|██████▎   | 755/1208 [20:49<12:29,  1.65s/it, loss=0.117, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000468, train/loss_step=0.140, global_step=6228.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  63%|██████▎   | 756/1208 [20:52<12:28,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000468, train/loss_step=0.140, global_step=6228.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  63%|██████▎   | 756/1208 [20:52<12:28,  1.66s/it, loss=0.111, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000592, train/loss_step=0.172, global_step=6228.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  63%|██████▎   | 757/1208 [20:53<12:26,  1.66s/it, loss=0.111, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000592, train/loss_step=0.172, global_step=6228.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  63%|██████▎   | 757/1208 [20:53<12:26,  1.66s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00922, train/loss_vlb_step=4.41e-5, train/loss_step=0.00922, global_step=6229.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  63%|██████▎   | 758/1208 [20:54<12:24,  1.66s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00922, train/loss_vlb_step=4.41e-5, train/loss_step=0.00922, global_step=6229.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  63%|██████▎   | 758/1208 [20:54<12:24,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000806, train/loss_step=0.201, global_step=6229.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  63%|██████▎   | 759/1208 [20:55<12:22,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000806, train/loss_step=0.201, global_step=6229.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  63%|██████▎   | 759/1208 [20:55<12:22,  1.65s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.0518, train/loss_vlb_step=0.000185, train/loss_step=0.0518, global_step=6229.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  63%|██████▎   | 760/1208 [20:58<12:22,  1.66s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.0518, train/loss_vlb_step=0.000185, train/loss_step=0.0518, global_step=6229.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  63%|██████▎   | 760/1208 [20:58<12:22,  1.66s/it, loss=0.0997, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=6229.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  63%|██████▎   | 761/1208 [20:59<12:20,  1.66s/it, loss=0.0997, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=6229.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  63%|██████▎   | 761/1208 [20:59<12:20,  1.66s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.0863, train/loss_vlb_step=0.000284, train/loss_step=0.0863, global_step=6230.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  63%|██████▎   | 762/1208 [21:01<12:18,  1.65s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.0863, train/loss_vlb_step=0.000284, train/loss_step=0.0863, global_step=6230.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  63%|██████▎   | 762/1208 [21:01<12:18,  1.65s/it, loss=0.107, v_num=0, train/loss_simple_step=0.569, train/loss_vlb_step=0.00983, train/loss_step=0.569, global_step=6230.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  63%|██████▎   | 763/1208 [21:02<12:16,  1.65s/it, loss=0.107, v_num=0, train/loss_simple_step=0.569, train/loss_vlb_step=0.00983, train/loss_step=0.569, global_step=6230.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  63%|██████▎   | 763/1208 [21:02<12:16,  1.65s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0492, train/loss_vlb_step=0.000169, train/loss_step=0.0492, global_step=6230.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  63%|██████▎   | 764/1208 [21:05<12:15,  1.66s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0492, train/loss_vlb_step=0.000169, train/loss_step=0.0492, global_step=6230.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  63%|██████▎   | 764/1208 [21:05<12:15,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00109, train/loss_step=0.276, global_step=6230.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  63%|██████▎   | 765/1208 [21:06<12:13,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00109, train/loss_step=0.276, global_step=6230.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  63%|██████▎   | 765/1208 [21:06<12:13,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.001, train/loss_step=0.240, global_step=6231.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  63%|██████▎   | 766/1208 [21:07<12:11,  1.65s/it, loss=0.128, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.001, train/loss_step=0.240, global_step=6231.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  63%|██████▎   | 766/1208 [21:07<12:11,  1.65s/it, loss=0.132, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000609, train/loss_step=0.168, global_step=6231.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  63%|██████▎   | 767/1208 [21:08<12:09,  1.65s/it, loss=0.132, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000609, train/loss_step=0.168, global_step=6231.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  63%|██████▎   | 767/1208 [21:08<12:09,  1.65s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.24e-5, train/loss_step=0.0202, global_step=6231.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  64%|██████▎   | 768/1208 [21:11<12:08,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.24e-5, train/loss_step=0.0202, global_step=6231.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  64%|██████▎   | 768/1208 [21:11<12:08,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=6231.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  64%|██████▎   | 769/1208 [21:12<12:06,  1.65s/it, loss=0.128, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=6231.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  64%|██████▎   | 769/1208 [21:12<12:06,  1.65s/it, loss=0.142, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00192, train/loss_step=0.331, global_step=6232.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  64%|██████▎   | 770/1208 [21:13<12:04,  1.65s/it, loss=0.142, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00192, train/loss_step=0.331, global_step=6232.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  64%|██████▎   | 770/1208 [21:13<12:04,  1.65s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0805, train/loss_vlb_step=0.00027, train/loss_step=0.0805, global_step=6232.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  64%|██████▍   | 771/1208 [21:14<12:02,  1.65s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0805, train/loss_vlb_step=0.00027, train/loss_step=0.0805, global_step=6232.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  64%|██████▍   | 771/1208 [21:14<12:02,  1.65s/it, loss=0.173, v_num=0, train/loss_simple_step=0.539, train/loss_vlb_step=0.00569, train/loss_step=0.539, global_step=6232.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  64%|██████▍   | 772/1208 [21:17<12:01,  1.66s/it, loss=0.173, v_num=0, train/loss_simple_step=0.539, train/loss_vlb_step=0.00569, train/loss_step=0.539, global_step=6232.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  64%|██████▍   | 772/1208 [21:17<12:01,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0626, train/loss_vlb_step=0.00022, train/loss_step=0.0626, global_step=6232.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  64%|██████▍   | 773/1208 [21:18<11:59,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0626, train/loss_vlb_step=0.00022, train/loss_step=0.0626, global_step=6232.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  64%|██████▍   | 773/1208 [21:18<11:59,  1.65s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0743, train/loss_vlb_step=0.00025, train/loss_step=0.0743, global_step=6233.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  64%|██████▍   | 774/1208 [21:20<11:57,  1.65s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0743, train/loss_vlb_step=0.00025, train/loss_step=0.0743, global_step=6233.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  64%|██████▍   | 774/1208 [21:20<11:57,  1.65s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=1.05e-5, train/loss_step=0.00177, global_step=6233.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  64%|██████▍   | 775/1208 [21:21<11:55,  1.65s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=1.05e-5, train/loss_step=0.00177, global_step=6233.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  64%|██████▍   | 775/1208 [21:21<11:55,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=7e-5, train/loss_step=0.0156, global_step=6233.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]     Epoch 20:  64%|██████▍   | 776/1208 [21:24<11:54,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=7e-5, train/loss_step=0.0156, global_step=6233.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  64%|██████▍   | 776/1208 [21:24<11:54,  1.65s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000128, train/loss_step=0.0337, global_step=6233.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  64%|██████▍   | 777/1208 [21:25<11:52,  1.65s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000128, train/loss_step=0.0337, global_step=6233.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  64%|██████▍   | 777/1208 [21:25<11:52,  1.65s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00496, train/loss_vlb_step=2.55e-5, train/loss_step=0.00496, global_step=6234.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  64%|██████▍   | 778/1208 [21:26<11:50,  1.65s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00496, train/loss_vlb_step=2.55e-5, train/loss_step=0.00496, global_step=6234.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  64%|██████▍   | 778/1208 [21:26<11:50,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.000228, train/loss_step=0.0665, global_step=6234.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  64%|██████▍   | 779/1208 [21:27<11:48,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.000228, train/loss_step=0.0665, global_step=6234.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  64%|██████▍   | 779/1208 [21:27<11:48,  1.65s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00624, train/loss_vlb_step=3.11e-5, train/loss_step=0.00624, global_step=6234.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  65%|██████▍   | 780/1208 [21:30<11:48,  1.65s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00624, train/loss_vlb_step=3.11e-5, train/loss_step=0.00624, global_step=6234.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  65%|██████▍   | 780/1208 [21:30<11:48,  1.65s/it, loss=0.176, v_num=0, train/loss_simple_step=0.802, train/loss_vlb_step=0.0516, train/loss_step=0.802, global_step=6234.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]     Epoch 20:  65%|██████▍   | 781/1208 [21:31<11:46,  1.65s/it, loss=0.176, v_num=0, train/loss_simple_step=0.802, train/loss_vlb_step=0.0516, train/loss_step=0.802, global_step=6234.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  65%|██████▍   | 781/1208 [21:31<11:46,  1.65s/it, loss=0.19, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00265, train/loss_step=0.356, global_step=6235.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  65%|██████▍   | 782/1208 [21:32<11:44,  1.65s/it, loss=0.19, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00265, train/loss_step=0.356, global_step=6235.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  65%|██████▍   | 782/1208 [21:32<11:44,  1.65s/it, loss=0.178, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00166, train/loss_step=0.322, global_step=6235.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  65%|██████▍   | 783/1208 [21:33<11:42,  1.65s/it, loss=0.178, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00166, train/loss_step=0.322, global_step=6235.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  65%|██████▍   | 783/1208 [21:33<11:42,  1.65s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=1.29e-5, train/loss_step=0.00217, global_step=6235.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  65%|██████▍   | 784/1208 [21:36<11:41,  1.65s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=1.29e-5, train/loss_step=0.00217, global_step=6235.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  65%|██████▍   | 784/1208 [21:36<11:41,  1.65s/it, loss=0.176, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00138, train/loss_step=0.295, global_step=6235.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  65%|██████▍   | 785/1208 [21:38<11:39,  1.65s/it, loss=0.176, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00138, train/loss_step=0.295, global_step=6235.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  65%|██████▍   | 785/1208 [21:38<11:39,  1.65s/it, loss=0.167, v_num=0, train/loss_simple_step=0.066, train/loss_vlb_step=0.000219, train/loss_step=0.066, global_step=6236.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  65%|██████▌   | 786/1208 [21:39<11:37,  1.65s/it, loss=0.167, v_num=0, train/loss_simple_step=0.066, train/loss_vlb_step=0.000219, train/loss_step=0.066, global_step=6236.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  65%|██████▌   | 786/1208 [21:39<11:37,  1.65s/it, loss=0.17, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000892, train/loss_step=0.225, global_step=6236.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  65%|██████▌   | 787/1208 [21:40<11:35,  1.65s/it, loss=0.17, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000892, train/loss_step=0.225, global_step=6236.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  65%|██████▌   | 787/1208 [21:40<11:35,  1.65s/it, loss=0.184, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00133, train/loss_step=0.290, global_step=6236.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  65%|██████▌   | 788/1208 [21:42<11:34,  1.65s/it, loss=0.184, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00133, train/loss_step=0.290, global_step=6236.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  65%|██████▌   | 788/1208 [21:42<11:34,  1.65s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0866, train/loss_vlb_step=0.000286, train/loss_step=0.0866, global_step=6236.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  65%|██████▌   | 789/1208 [21:43<11:32,  1.65s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0866, train/loss_vlb_step=0.000286, train/loss_step=0.0866, global_step=6236.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  65%|██████▌   | 789/1208 [21:43<11:32,  1.65s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00252, train/loss_vlb_step=1.46e-5, train/loss_step=0.00252, global_step=6237.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  65%|██████▌   | 790/1208 [21:44<11:30,  1.65s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00252, train/loss_vlb_step=1.46e-5, train/loss_step=0.00252, global_step=6237.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  65%|██████▌   | 790/1208 [21:44<11:30,  1.65s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.000175, train/loss_step=0.0476, global_step=6237.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  65%|██████▌   | 791/1208 [21:45<11:28,  1.65s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.000175, train/loss_step=0.0476, global_step=6237.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  65%|██████▌   | 791/1208 [21:45<11:28,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.31e-5, train/loss_step=0.0117, global_step=6237.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  66%|██████▌   | 792/1208 [21:48<11:27,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.31e-5, train/loss_step=0.0117, global_step=6237.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  66%|██████▌   | 792/1208 [21:48<11:27,  1.65s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.7e-5, train/loss_step=0.0234, global_step=6237.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  66%|██████▌   | 793/1208 [21:49<11:25,  1.65s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.7e-5, train/loss_step=0.0234, global_step=6237.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  66%|██████▌   | 793/1208 [21:49<11:25,  1.65s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000121, train/loss_step=0.0332, global_step=6238.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  66%|██████▌   | 794/1208 [21:50<11:23,  1.65s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000121, train/loss_step=0.0332, global_step=6238.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  66%|██████▌   | 794/1208 [21:50<11:23,  1.65s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=9.95e-5, train/loss_step=0.0259, global_step=6238.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  66%|██████▌   | 795/1208 [21:51<11:21,  1.65s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=9.95e-5, train/loss_step=0.0259, global_step=6238.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  66%|██████▌   | 795/1208 [21:51<11:21,  1.65s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00474, train/loss_vlb_step=2.63e-5, train/loss_step=0.00474, global_step=6238.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  66%|██████▌   | 796/1208 [21:54<11:20,  1.65s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00474, train/loss_vlb_step=2.63e-5, train/loss_step=0.00474, global_step=6238.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  66%|██████▌   | 796/1208 [21:54<11:20,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.58e-5, train/loss_step=0.013, global_step=6238.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  66%|██████▌   | 797/1208 [21:55<11:18,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.58e-5, train/loss_step=0.013, global_step=6238.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  66%|██████▌   | 797/1208 [21:55<11:18,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00647, train/loss_vlb_step=3.25e-5, train/loss_step=0.00647, global_step=6239.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  66%|██████▌   | 798/1208 [21:56<11:16,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00647, train/loss_vlb_step=3.25e-5, train/loss_step=0.00647, global_step=6239.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  66%|██████▌   | 798/1208 [21:56<11:16,  1.65s/it, loss=0.137, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=6239.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  66%|██████▌   | 799/1208 [21:57<11:14,  1.65s/it, loss=0.137, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=6239.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  66%|██████▌   | 799/1208 [21:57<11:14,  1.65s/it, loss=0.176, v_num=0, train/loss_simple_step=0.789, train/loss_vlb_step=0.133, train/loss_step=0.789, global_step=6239.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  66%|██████▌   | 800/1208 [22:00<11:13,  1.65s/it, loss=0.176, v_num=0, train/loss_simple_step=0.789, train/loss_vlb_step=0.133, train/loss_step=0.789, global_step=6239.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  66%|██████▌   | 800/1208 [22:00<11:13,  1.65s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.46e-5, train/loss_step=0.0121, global_step=6239.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  66%|██████▋   | 801/1208 [22:01<11:11,  1.65s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.46e-5, train/loss_step=0.0121, global_step=6239.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  66%|██████▋   | 801/1208 [22:01<11:11,  1.65s/it, loss=0.136, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00186, train/loss_step=0.361, global_step=6240.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  66%|██████▋   | 802/1208 [22:02<11:09,  1.65s/it, loss=0.136, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00186, train/loss_step=0.361, global_step=6240.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  66%|██████▋   | 802/1208 [22:02<11:09,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000728, train/loss_step=0.193, global_step=6240.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  66%|██████▋   | 803/1208 [22:03<11:07,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000728, train/loss_step=0.193, global_step=6240.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  66%|██████▋   | 803/1208 [22:03<11:07,  1.65s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0578, train/loss_vlb_step=0.0002, train/loss_step=0.0578, global_step=6240.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  67%|██████▋   | 804/1208 [22:06<11:06,  1.65s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0578, train/loss_vlb_step=0.0002, train/loss_step=0.0578, global_step=6240.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  67%|██████▋   | 804/1208 [22:06<11:06,  1.65s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=1.26e-5, train/loss_step=0.00217, global_step=6240.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  67%|██████▋   | 805/1208 [22:07<11:04,  1.65s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=1.26e-5, train/loss_step=0.00217, global_step=6240.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  67%|██████▋   | 805/1208 [22:07<11:04,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00985, train/loss_vlb_step=4.7e-5, train/loss_step=0.00985, global_step=6241.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  67%|██████▋   | 806/1208 [22:08<11:02,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00985, train/loss_vlb_step=4.7e-5, train/loss_step=0.00985, global_step=6241.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  67%|██████▋   | 806/1208 [22:08<11:02,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000872, train/loss_step=0.210, global_step=6241.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  67%|██████▋   | 807/1208 [22:09<11:00,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000872, train/loss_step=0.210, global_step=6241.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  67%|██████▋   | 807/1208 [22:09<11:00,  1.65s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.88e-5, train/loss_step=0.0187, global_step=6241.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  67%|██████▋   | 808/1208 [22:12<10:59,  1.65s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.88e-5, train/loss_step=0.0187, global_step=6241.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  67%|██████▋   | 808/1208 [22:12<10:59,  1.65s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.32e-5, train/loss_step=0.0176, global_step=6241.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  67%|██████▋   | 809/1208 [22:13<10:57,  1.65s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.32e-5, train/loss_step=0.0176, global_step=6241.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  67%|██████▋   | 809/1208 [22:13<10:57,  1.65s/it, loss=0.125, v_num=0, train/loss_simple_step=0.543, train/loss_vlb_step=0.00785, train/loss_step=0.543, global_step=6242.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  67%|██████▋   | 810/1208 [22:14<10:55,  1.65s/it, loss=0.125, v_num=0, train/loss_simple_step=0.543, train/loss_vlb_step=0.00785, train/loss_step=0.543, global_step=6242.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  67%|██████▋   | 810/1208 [22:14<10:55,  1.65s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.44e-5, train/loss_step=0.0142, global_step=6242.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  67%|██████▋   | 811/1208 [22:15<10:53,  1.65s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.44e-5, train/loss_step=0.0142, global_step=6242.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  67%|██████▋   | 811/1208 [22:15<10:53,  1.65s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.000161, train/loss_step=0.0441, global_step=6242.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  67%|██████▋   | 812/1208 [22:18<10:52,  1.65s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.000161, train/loss_step=0.0441, global_step=6242.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  67%|██████▋   | 812/1208 [22:18<10:52,  1.65s/it, loss=0.135, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000877, train/loss_step=0.231, global_step=6242.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  67%|██████▋   | 813/1208 [22:19<10:50,  1.65s/it, loss=0.135, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000877, train/loss_step=0.231, global_step=6242.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  67%|██████▋   | 813/1208 [22:19<10:50,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00239, train/loss_step=0.373, global_step=6243.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  67%|██████▋   | 814/1208 [22:20<10:48,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00239, train/loss_step=0.373, global_step=6243.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  67%|██████▋   | 814/1208 [22:20<10:48,  1.65s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0729, train/loss_vlb_step=0.000246, train/loss_step=0.0729, global_step=6243.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  67%|██████▋   | 815/1208 [22:21<10:46,  1.65s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0729, train/loss_vlb_step=0.000246, train/loss_step=0.0729, global_step=6243.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  67%|██████▋   | 815/1208 [22:21<10:46,  1.65s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.000112, train/loss_step=0.0292, global_step=6243.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  68%|██████▊   | 816/1208 [22:24<10:45,  1.65s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.000112, train/loss_step=0.0292, global_step=6243.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  68%|██████▊   | 816/1208 [22:24<10:45,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000531, train/loss_step=0.158, global_step=6243.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  68%|██████▊   | 817/1208 [22:25<10:43,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000531, train/loss_step=0.158, global_step=6243.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  68%|██████▊   | 817/1208 [22:25<10:43,  1.65s/it, loss=0.173, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000767, train/loss_step=0.205, global_step=6244.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  68%|██████▊   | 818/1208 [22:26<10:41,  1.65s/it, loss=0.173, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000767, train/loss_step=0.205, global_step=6244.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  68%|██████▊   | 818/1208 [22:26<10:41,  1.65s/it, loss=0.19, v_num=0, train/loss_simple_step=0.449, train/loss_vlb_step=0.00413, train/loss_step=0.449, global_step=6244.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  68%|██████▊   | 819/1208 [22:27<10:39,  1.65s/it, loss=0.19, v_num=0, train/loss_simple_step=0.449, train/loss_vlb_step=0.00413, train/loss_step=0.449, global_step=6244.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  68%|██████▊   | 819/1208 [22:27<10:39,  1.65s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00633, train/loss_vlb_step=3.06e-5, train/loss_step=0.00633, global_step=6244.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  68%|██████▊   | 820/1208 [22:30<10:38,  1.65s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00633, train/loss_vlb_step=3.06e-5, train/loss_step=0.00633, global_step=6244.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  68%|██████▊   | 820/1208 [22:30<10:38,  1.65s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.35e-5, train/loss_step=0.0116, global_step=6244.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  68%|██████▊   | 821/1208 [22:31<10:36,  1.65s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.35e-5, train/loss_step=0.0116, global_step=6244.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  68%|██████▊   | 821/1208 [22:31<10:36,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0382, train/loss_vlb_step=0.000143, train/loss_step=0.0382, global_step=6245.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  68%|██████▊   | 822/1208 [22:32<10:35,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0382, train/loss_vlb_step=0.000143, train/loss_step=0.0382, global_step=6245.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  68%|██████▊   | 822/1208 [22:32<10:35,  1.65s/it, loss=0.133, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000606, train/loss_step=0.177, global_step=6245.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  68%|██████▊   | 823/1208 [22:33<10:33,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000606, train/loss_step=0.177, global_step=6245.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  68%|██████▊   | 823/1208 [22:33<10:33,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.61e-5, train/loss_step=0.0154, global_step=6245.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  68%|██████▊   | 824/1208 [22:36<10:32,  1.65s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.61e-5, train/loss_step=0.0154, global_step=6245.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  68%|██████▊   | 824/1208 [22:36<10:32,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000175, train/loss_step=0.051, global_step=6245.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  68%|██████▊   | 825/1208 [22:37<10:30,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000175, train/loss_step=0.051, global_step=6245.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  68%|██████▊   | 825/1208 [22:37<10:30,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.61e-5, train/loss_step=0.0209, global_step=6246.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  68%|██████▊   | 826/1208 [22:38<10:28,  1.64s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.61e-5, train/loss_step=0.0209, global_step=6246.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  68%|██████▊   | 826/1208 [22:38<10:28,  1.64s/it, loss=0.136, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00155, train/loss_step=0.253, global_step=6246.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  68%|██████▊   | 827/1208 [22:39<10:26,  1.64s/it, loss=0.136, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00155, train/loss_step=0.253, global_step=6246.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  68%|██████▊   | 827/1208 [22:39<10:26,  1.64s/it, loss=0.154, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00289, train/loss_step=0.378, global_step=6246.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  69%|██████▊   | 828/1208 [22:42<10:25,  1.65s/it, loss=0.154, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00289, train/loss_step=0.378, global_step=6246.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  69%|██████▊   | 828/1208 [22:42<10:25,  1.65s/it, loss=0.164, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000792, train/loss_step=0.214, global_step=6246.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  69%|██████▊   | 829/1208 [22:43<10:23,  1.64s/it, loss=0.164, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000792, train/loss_step=0.214, global_step=6246.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  69%|██████▊   | 829/1208 [22:43<10:23,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00559, train/loss_vlb_step=2.8e-5, train/loss_step=0.00559, global_step=6247.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  69%|██████▊   | 830/1208 [22:44<10:21,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00559, train/loss_vlb_step=2.8e-5, train/loss_step=0.00559, global_step=6247.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  69%|██████▊   | 830/1208 [22:44<10:21,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0728, train/loss_vlb_step=0.000244, train/loss_step=0.0728, global_step=6247.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  69%|██████▉   | 831/1208 [22:45<10:19,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0728, train/loss_vlb_step=0.000244, train/loss_step=0.0728, global_step=6247.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  69%|██████▉   | 831/1208 [22:45<10:19,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.000145, train/loss_step=0.0393, global_step=6247.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  69%|██████▉   | 832/1208 [22:48<10:18,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.000145, train/loss_step=0.0393, global_step=6247.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  69%|██████▉   | 832/1208 [22:48<10:18,  1.64s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0318, train/loss_vlb_step=0.000119, train/loss_step=0.0318, global_step=6247.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  69%|██████▉   | 833/1208 [22:49<10:16,  1.64s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0318, train/loss_vlb_step=0.000119, train/loss_step=0.0318, global_step=6247.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  69%|██████▉   | 833/1208 [22:49<10:16,  1.64s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000111, train/loss_step=0.0287, global_step=6248.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  69%|██████▉   | 834/1208 [22:50<10:14,  1.64s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000111, train/loss_step=0.0287, global_step=6248.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  69%|██████▉   | 834/1208 [22:50<10:14,  1.64s/it, loss=0.117, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000502, train/loss_step=0.151, global_step=6248.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  69%|██████▉   | 835/1208 [22:51<10:12,  1.64s/it, loss=0.117, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000502, train/loss_step=0.151, global_step=6248.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  69%|██████▉   | 835/1208 [22:51<10:12,  1.64s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00623, train/loss_vlb_step=3.14e-5, train/loss_step=0.00623, global_step=6248.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  69%|██████▉   | 836/1208 [22:53<10:11,  1.64s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00623, train/loss_vlb_step=3.14e-5, train/loss_step=0.00623, global_step=6248.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  69%|██████▉   | 836/1208 [22:53<10:11,  1.64s/it, loss=0.115, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000463, train/loss_step=0.139, global_step=6248.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  69%|██████▉   | 837/1208 [22:54<10:09,  1.64s/it, loss=0.115, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000463, train/loss_step=0.139, global_step=6248.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  69%|██████▉   | 837/1208 [22:54<10:09,  1.64s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00447, train/loss_vlb_step=2.43e-5, train/loss_step=0.00447, global_step=6249.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  69%|██████▉   | 838/1208 [22:55<10:07,  1.64s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00447, train/loss_vlb_step=2.43e-5, train/loss_step=0.00447, global_step=6249.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  69%|██████▉   | 838/1208 [22:55<10:07,  1.64s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.0637, train/loss_vlb_step=0.000216, train/loss_step=0.0637, global_step=6249.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  69%|██████▉   | 839/1208 [22:56<10:05,  1.64s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.0637, train/loss_vlb_step=0.000216, train/loss_step=0.0637, global_step=6249.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  69%|██████▉   | 839/1208 [22:56<10:05,  1.64s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.69e-5, train/loss_step=0.0128, global_step=6249.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  70%|██████▉   | 840/1208 [22:59<10:04,  1.64s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.69e-5, train/loss_step=0.0128, global_step=6249.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  70%|██████▉   | 840/1208 [22:59<10:04,  1.64s/it, loss=0.0858, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.64e-5, train/loss_step=0.0127, global_step=6249.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  70%|██████▉   | 841/1208 [23:00<10:02,  1.64s/it, loss=0.0858, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.64e-5, train/loss_step=0.0127, global_step=6249.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  70%|██████▉   | 841/1208 [23:00<10:02,  1.64s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.0472, train/loss_vlb_step=0.000169, train/loss_step=0.0472, global_step=6250.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  70%|██████▉   | 842/1208 [23:01<10:00,  1.64s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.0472, train/loss_vlb_step=0.000169, train/loss_step=0.0472, global_step=6250.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  70%|██████▉   | 842/1208 [23:01<10:00,  1.64s/it, loss=0.081, v_num=0, train/loss_simple_step=0.0722, train/loss_vlb_step=0.000261, train/loss_step=0.0722, global_step=6250.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  70%|██████▉   | 843/1208 [23:02<09:58,  1.64s/it, loss=0.081, v_num=0, train/loss_simple_step=0.0722, train/loss_vlb_step=0.000261, train/loss_step=0.0722, global_step=6250.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  70%|██████▉   | 843/1208 [23:02<09:58,  1.64s/it, loss=0.0808, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.53e-5, train/loss_step=0.0117, global_step=6250.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  70%|██████▉   | 844/1208 [23:05<09:57,  1.64s/it, loss=0.0808, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.53e-5, train/loss_step=0.0117, global_step=6250.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  70%|██████▉   | 844/1208 [23:05<09:57,  1.64s/it, loss=0.0866, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000577, train/loss_step=0.166, global_step=6250.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  70%|██████▉   | 845/1208 [23:06<09:55,  1.64s/it, loss=0.0866, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000577, train/loss_step=0.166, global_step=6250.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  70%|██████▉   | 845/1208 [23:06<09:55,  1.64s/it, loss=0.108, v_num=0, train/loss_simple_step=0.448, train/loss_vlb_step=0.00319, train/loss_step=0.448, global_step=6251.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  70%|███████   | 846/1208 [23:07<09:53,  1.64s/it, loss=0.108, v_num=0, train/loss_simple_step=0.448, train/loss_vlb_step=0.00319, train/loss_step=0.448, global_step=6251.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  70%|███████   | 846/1208 [23:07<09:53,  1.64s/it, loss=0.112, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00175, train/loss_step=0.340, global_step=6251.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  70%|███████   | 847/1208 [23:08<09:51,  1.64s/it, loss=0.112, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00175, train/loss_step=0.340, global_step=6251.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  70%|███████   | 847/1208 [23:08<09:51,  1.64s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.000193, train/loss_step=0.0527, global_step=6251.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  70%|███████   | 848/1208 [23:11<09:50,  1.64s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.000193, train/loss_step=0.0527, global_step=6251.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  70%|███████   | 848/1208 [23:11<09:50,  1.64s/it, loss=0.103, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00244, train/loss_step=0.362, global_step=6251.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  70%|███████   | 849/1208 [23:12<09:48,  1.64s/it, loss=0.103, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00244, train/loss_step=0.362, global_step=6251.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  70%|███████   | 849/1208 [23:12<09:48,  1.64s/it, loss=0.136, v_num=0, train/loss_simple_step=0.658, train/loss_vlb_step=0.0176, train/loss_step=0.658, global_step=6252.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  70%|███████   | 850/1208 [23:13<09:46,  1.64s/it, loss=0.136, v_num=0, train/loss_simple_step=0.658, train/loss_vlb_step=0.0176, train/loss_step=0.658, global_step=6252.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  70%|███████   | 850/1208 [23:13<09:46,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00774, train/loss_vlb_step=3.82e-5, train/loss_step=0.00774, global_step=6252.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  70%|███████   | 851/1208 [23:14<09:45,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00774, train/loss_vlb_step=3.82e-5, train/loss_step=0.00774, global_step=6252.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  70%|███████   | 851/1208 [23:14<09:45,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000573, train/loss_step=0.165, global_step=6252.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  71%|███████   | 852/1208 [23:17<09:43,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000573, train/loss_step=0.165, global_step=6252.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  71%|███████   | 852/1208 [23:17<09:43,  1.64s/it, loss=0.152, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00163, train/loss_step=0.299, global_step=6252.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  71%|███████   | 853/1208 [23:18<09:42,  1.64s/it, loss=0.152, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00163, train/loss_step=0.299, global_step=6252.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  71%|███████   | 853/1208 [23:18<09:42,  1.64s/it, loss=0.154, v_num=0, train/loss_simple_step=0.064, train/loss_vlb_step=0.000221, train/loss_step=0.064, global_step=6253.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  71%|███████   | 854/1208 [23:19<09:40,  1.64s/it, loss=0.154, v_num=0, train/loss_simple_step=0.064, train/loss_vlb_step=0.000221, train/loss_step=0.064, global_step=6253.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  71%|███████   | 854/1208 [23:19<09:40,  1.64s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.81e-5, train/loss_step=0.0162, global_step=6253.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  71%|███████   | 855/1208 [23:20<09:38,  1.64s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.81e-5, train/loss_step=0.0162, global_step=6253.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  71%|███████   | 855/1208 [23:20<09:38,  1.64s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.000121, train/loss_step=0.0326, global_step=6253.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  71%|███████   | 856/1208 [23:23<09:37,  1.64s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.000121, train/loss_step=0.0326, global_step=6253.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  71%|███████   | 856/1208 [23:23<09:37,  1.64s/it, loss=0.15, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000571, train/loss_step=0.165, global_step=6253.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  71%|███████   | 857/1208 [23:24<09:35,  1.64s/it, loss=0.15, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000571, train/loss_step=0.165, global_step=6253.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  71%|███████   | 857/1208 [23:24<09:35,  1.64s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.61e-5, train/loss_step=0.00278, global_step=6254.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  71%|███████   | 858/1208 [23:25<09:33,  1.64s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.61e-5, train/loss_step=0.00278, global_step=6254.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  71%|███████   | 858/1208 [23:25<09:33,  1.64s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0642, train/loss_vlb_step=0.000215, train/loss_step=0.0642, global_step=6254.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  71%|███████   | 859/1208 [23:26<09:31,  1.64s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0642, train/loss_vlb_step=0.000215, train/loss_step=0.0642, global_step=6254.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  71%|███████   | 859/1208 [23:26<09:31,  1.64s/it, loss=0.168, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.0028, train/loss_step=0.376, global_step=6254.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  71%|███████   | 860/1208 [23:29<09:30,  1.64s/it, loss=0.168, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.0028, train/loss_step=0.376, global_step=6254.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  71%|███████   | 860/1208 [23:29<09:30,  1.64s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0735, train/loss_vlb_step=0.000251, train/loss_step=0.0735, global_step=6254.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  71%|███████▏  | 861/1208 [23:30<09:28,  1.64s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0735, train/loss_vlb_step=0.000251, train/loss_step=0.0735, global_step=6254.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  71%|███████▏  | 861/1208 [23:30<09:28,  1.64s/it, loss=0.182, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00102, train/loss_step=0.263, global_step=6255.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  71%|███████▏  | 862/1208 [23:31<09:26,  1.64s/it, loss=0.182, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00102, train/loss_step=0.263, global_step=6255.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  71%|███████▏  | 862/1208 [23:31<09:26,  1.64s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0897, train/loss_vlb_step=0.000295, train/loss_step=0.0897, global_step=6255.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  71%|███████▏  | 863/1208 [23:32<09:24,  1.64s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0897, train/loss_vlb_step=0.000295, train/loss_step=0.0897, global_step=6255.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  71%|███████▏  | 863/1208 [23:32<09:24,  1.64s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=2.24e-5, train/loss_step=0.00405, global_step=6255.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  72%|███████▏  | 864/1208 [23:35<09:23,  1.64s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=2.24e-5, train/loss_step=0.00405, global_step=6255.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  72%|███████▏  | 864/1208 [23:35<09:23,  1.64s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.000103, train/loss_step=0.0249, global_step=6255.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  72%|███████▏  | 865/1208 [23:36<09:21,  1.64s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.000103, train/loss_step=0.0249, global_step=6255.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  72%|███████▏  | 865/1208 [23:36<09:21,  1.64s/it, loss=0.173, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00271, train/loss_step=0.399, global_step=6256.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  72%|███████▏  | 866/1208 [23:37<09:19,  1.64s/it, loss=0.173, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00271, train/loss_step=0.399, global_step=6256.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  72%|███████▏  | 866/1208 [23:37<09:19,  1.64s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0823, train/loss_vlb_step=0.000276, train/loss_step=0.0823, global_step=6256.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  72%|███████▏  | 867/1208 [23:38<09:17,  1.64s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0823, train/loss_vlb_step=0.000276, train/loss_step=0.0823, global_step=6256.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  72%|███████▏  | 867/1208 [23:38<09:17,  1.64s/it, loss=0.163, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000334, train/loss_step=0.102, global_step=6256.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  72%|███████▏  | 868/1208 [23:41<09:16,  1.64s/it, loss=0.163, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000334, train/loss_step=0.102, global_step=6256.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  72%|███████▏  | 868/1208 [23:41<09:16,  1.64s/it, loss=0.15, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000385, train/loss_step=0.116, global_step=6256.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  72%|███████▏  | 869/1208 [23:42<09:14,  1.64s/it, loss=0.15, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000385, train/loss_step=0.116, global_step=6256.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  72%|███████▏  | 869/1208 [23:42<09:14,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000355, train/loss_step=0.107, global_step=6257.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  72%|███████▏  | 870/1208 [23:43<09:12,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000355, train/loss_step=0.107, global_step=6257.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  72%|███████▏  | 870/1208 [23:43<09:12,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000708, train/loss_step=0.204, global_step=6257.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  72%|███████▏  | 871/1208 [23:44<09:11,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000708, train/loss_step=0.204, global_step=6257.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  72%|███████▏  | 871/1208 [23:44<09:11,  1.64s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00172, train/loss_vlb_step=1.04e-5, train/loss_step=0.00172, global_step=6257.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  72%|███████▏  | 872/1208 [23:47<09:09,  1.64s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00172, train/loss_vlb_step=1.04e-5, train/loss_step=0.00172, global_step=6257.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  72%|███████▏  | 872/1208 [23:47<09:09,  1.64s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00655, train/loss_vlb_step=3.31e-5, train/loss_step=0.00655, global_step=6257.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  72%|███████▏  | 873/1208 [23:48<09:08,  1.64s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00655, train/loss_vlb_step=3.31e-5, train/loss_step=0.00655, global_step=6257.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  72%|███████▏  | 873/1208 [23:48<09:08,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.673, train/loss_vlb_step=0.0433, train/loss_step=0.673, global_step=6258.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]     Epoch 20:  72%|███████▏  | 874/1208 [23:49<09:06,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.673, train/loss_vlb_step=0.0433, train/loss_step=0.673, global_step=6258.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  72%|███████▏  | 874/1208 [23:49<09:06,  1.64s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0303, train/loss_vlb_step=0.000114, train/loss_step=0.0303, global_step=6258.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  72%|███████▏  | 875/1208 [23:50<09:04,  1.63s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0303, train/loss_vlb_step=0.000114, train/loss_step=0.0303, global_step=6258.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  72%|███████▏  | 875/1208 [23:50<09:04,  1.63s/it, loss=0.148, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000624, train/loss_step=0.181, global_step=6258.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  73%|███████▎  | 876/1208 [23:53<09:03,  1.64s/it, loss=0.148, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000624, train/loss_step=0.181, global_step=6258.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  73%|███████▎  | 876/1208 [23:53<09:03,  1.64s/it, loss=0.149, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000581, train/loss_step=0.169, global_step=6258.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  73%|███████▎  | 877/1208 [23:54<09:01,  1.64s/it, loss=0.149, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000581, train/loss_step=0.169, global_step=6258.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  73%|███████▎  | 877/1208 [23:54<09:01,  1.64s/it, loss=0.155, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000479, train/loss_step=0.143, global_step=6259.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  73%|███████▎  | 878/1208 [23:55<08:59,  1.63s/it, loss=0.155, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000479, train/loss_step=0.143, global_step=6259.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  73%|███████▎  | 878/1208 [23:55<08:59,  1.63s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.000192, train/loss_step=0.0556, global_step=6259.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  73%|███████▎  | 879/1208 [23:56<08:57,  1.63s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.000192, train/loss_step=0.0556, global_step=6259.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  73%|███████▎  | 879/1208 [23:56<08:57,  1.63s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00544, train/loss_vlb_step=2.91e-5, train/loss_step=0.00544, global_step=6259.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  73%|███████▎  | 880/1208 [23:59<08:56,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00544, train/loss_vlb_step=2.91e-5, train/loss_step=0.00544, global_step=6259.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  73%|███████▎  | 880/1208 [23:59<08:56,  1.64s/it, loss=0.144, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.00083, train/loss_step=0.217, global_step=6259.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  73%|███████▎  | 881/1208 [24:00<08:54,  1.64s/it, loss=0.144, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.00083, train/loss_step=0.217, global_step=6259.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  73%|███████▎  | 881/1208 [24:00<08:54,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000543, train/loss_step=0.162, global_step=6260.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  73%|███████▎  | 882/1208 [24:01<08:52,  1.63s/it, loss=0.139, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000543, train/loss_step=0.162, global_step=6260.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  73%|███████▎  | 882/1208 [24:01<08:52,  1.63s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00436, train/loss_vlb_step=2.29e-5, train/loss_step=0.00436, global_step=6260.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  73%|███████▎  | 883/1208 [24:02<08:51,  1.63s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00436, train/loss_vlb_step=2.29e-5, train/loss_step=0.00436, global_step=6260.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  73%|███████▎  | 883/1208 [24:02<08:51,  1.63s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.000153, train/loss_step=0.0417, global_step=6260.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  73%|███████▎  | 884/1208 [24:05<08:49,  1.64s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.000153, train/loss_step=0.0417, global_step=6260.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  73%|███████▎  | 884/1208 [24:05<08:49,  1.64s/it, loss=0.135, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.7e-5, train/loss_step=0.003, global_step=6260.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  73%|███████▎  | 885/1208 [24:07<08:48,  1.64s/it, loss=0.135, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.7e-5, train/loss_step=0.003, global_step=6260.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  73%|███████▎  | 885/1208 [24:07<08:48,  1.64s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00367, train/loss_vlb_step=1.94e-5, train/loss_step=0.00367, global_step=6261.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  73%|███████▎  | 886/1208 [24:08<08:46,  1.63s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00367, train/loss_vlb_step=1.94e-5, train/loss_step=0.00367, global_step=6261.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  73%|███████▎  | 886/1208 [24:08<08:46,  1.63s/it, loss=0.117, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=6261.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  73%|███████▎  | 887/1208 [24:09<08:44,  1.63s/it, loss=0.117, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=6261.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  73%|███████▎  | 887/1208 [24:09<08:44,  1.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=9.82e-5, train/loss_step=0.0254, global_step=6261.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  74%|███████▎  | 888/1208 [24:12<08:43,  1.64s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=9.82e-5, train/loss_step=0.0254, global_step=6261.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  74%|███████▎  | 888/1208 [24:12<08:43,  1.64s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=7.23e-5, train/loss_step=0.0161, global_step=6261.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  74%|███████▎  | 889/1208 [24:13<08:41,  1.63s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=7.23e-5, train/loss_step=0.0161, global_step=6261.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  74%|███████▎  | 889/1208 [24:13<08:41,  1.63s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.62e-5, train/loss_step=0.0202, global_step=6262.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  74%|███████▎  | 890/1208 [24:14<08:39,  1.63s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.62e-5, train/loss_step=0.0202, global_step=6262.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  74%|███████▎  | 890/1208 [24:14<08:39,  1.63s/it, loss=0.14, v_num=0, train/loss_simple_step=0.927, train/loss_vlb_step=0.467, train/loss_step=0.927, global_step=6262.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]     Epoch 20:  74%|███████▍  | 891/1208 [24:15<08:37,  1.63s/it, loss=0.14, v_num=0, train/loss_simple_step=0.927, train/loss_vlb_step=0.467, train/loss_step=0.927, global_step=6262.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  74%|███████▍  | 891/1208 [24:15<08:37,  1.63s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000112, train/loss_step=0.0299, global_step=6262.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  74%|███████▍  | 892/1208 [24:18<08:36,  1.64s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000112, train/loss_step=0.0299, global_step=6262.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  74%|███████▍  | 892/1208 [24:18<08:36,  1.64s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0455, train/loss_vlb_step=0.000157, train/loss_step=0.0455, global_step=6262.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  74%|███████▍  | 893/1208 [24:19<08:34,  1.63s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0455, train/loss_vlb_step=0.000157, train/loss_step=0.0455, global_step=6262.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  74%|███████▍  | 893/1208 [24:19<08:34,  1.63s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00667, train/loss_vlb_step=3.31e-5, train/loss_step=0.00667, global_step=6263.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  74%|███████▍  | 894/1208 [24:20<08:33,  1.63s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00667, train/loss_vlb_step=3.31e-5, train/loss_step=0.00667, global_step=6263.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  74%|███████▍  | 894/1208 [24:20<08:33,  1.63s/it, loss=0.12, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000894, train/loss_step=0.229, global_step=6263.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  74%|███████▍  | 895/1208 [24:21<08:31,  1.63s/it, loss=0.12, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000894, train/loss_step=0.229, global_step=6263.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  74%|███████▍  | 895/1208 [24:21<08:31,  1.63s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0864, train/loss_vlb_step=0.000284, train/loss_step=0.0864, global_step=6263.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  74%|███████▍  | 896/1208 [24:24<08:30,  1.64s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0864, train/loss_vlb_step=0.000284, train/loss_step=0.0864, global_step=6263.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  74%|███████▍  | 896/1208 [24:24<08:30,  1.64s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00515, train/loss_vlb_step=2.63e-5, train/loss_step=0.00515, global_step=6263.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  74%|███████▍  | 897/1208 [24:26<08:28,  1.63s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00515, train/loss_vlb_step=2.63e-5, train/loss_step=0.00515, global_step=6263.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  74%|███████▍  | 897/1208 [24:26<08:28,  1.63s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00603, train/loss_vlb_step=3.05e-5, train/loss_step=0.00603, global_step=6264.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  74%|███████▍  | 898/1208 [24:27<08:26,  1.63s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00603, train/loss_vlb_step=3.05e-5, train/loss_step=0.00603, global_step=6264.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  74%|███████▍  | 898/1208 [24:27<08:26,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.522, train/loss_vlb_step=0.00901, train/loss_step=0.522, global_step=6264.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  74%|███████▍  | 899/1208 [24:28<08:24,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.522, train/loss_vlb_step=0.00901, train/loss_step=0.522, global_step=6264.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  74%|███████▍  | 899/1208 [24:28<08:24,  1.63s/it, loss=0.137, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00126, train/loss_step=0.271, global_step=6264.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  75%|███████▍  | 900/1208 [24:31<08:23,  1.63s/it, loss=0.137, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00126, train/loss_step=0.271, global_step=6264.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  75%|███████▍  | 900/1208 [24:31<08:23,  1.63s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.000128, train/loss_step=0.0347, global_step=6264.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.76it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.83it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.76it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.76it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.76it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.81it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.78it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.77it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.80it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 20:  75%|███████▍  | 901/1208 [25:01<08:31,  1.67s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.000128, train/loss_step=0.0347, global_step=6264.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  75%|███████▍  | 901/1208 [25:01<08:31,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.61e-5, train/loss_step=0.0232, global_step=6265.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  75%|███████▍  | 902/1208 [25:02<08:29,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.61e-5, train/loss_step=0.0232, global_step=6265.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  75%|███████▍  | 902/1208 [25:02<08:29,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.39e-5, train/loss_step=0.0148, global_step=6265.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  75%|███████▍  | 903/1208 [25:03<08:27,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.39e-5, train/loss_step=0.0148, global_step=6265.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  75%|███████▍  | 903/1208 [25:03<08:27,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.00048, train/loss_step=0.145, global_step=6265.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  75%|███████▍  | 904/1208 [25:07<08:26,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.00048, train/loss_step=0.145, global_step=6265.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  75%|███████▍  | 904/1208 [25:07<08:26,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.00486, train/loss_step=0.460, global_step=6265.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  75%|███████▍  | 905/1208 [25:08<08:24,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.00486, train/loss_step=0.460, global_step=6265.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  75%|███████▍  | 905/1208 [25:08<08:24,  1.67s/it, loss=0.159, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000744, train/loss_step=0.197, global_step=6266.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  75%|███████▌  | 906/1208 [25:09<08:23,  1.67s/it, loss=0.159, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000744, train/loss_step=0.197, global_step=6266.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  75%|███████▌  | 906/1208 [25:09<08:23,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000127, train/loss_step=0.0353, global_step=6266.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  75%|███████▌  | 907/1208 [25:10<08:21,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000127, train/loss_step=0.0353, global_step=6266.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  75%|███████▌  | 907/1208 [25:10<08:21,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.34e-5, train/loss_step=0.0182, global_step=6266.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  75%|███████▌  | 908/1208 [25:13<08:20,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.34e-5, train/loss_step=0.0182, global_step=6266.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  75%|███████▌  | 908/1208 [25:13<08:20,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000617, train/loss_step=0.175, global_step=6266.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  75%|███████▌  | 909/1208 [25:14<08:18,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000617, train/loss_step=0.175, global_step=6266.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  75%|███████▌  | 909/1208 [25:14<08:18,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00108, train/loss_step=0.260, global_step=6267.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  75%|███████▌  | 910/1208 [25:15<08:16,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00108, train/loss_step=0.260, global_step=6267.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  75%|███████▌  | 910/1208 [25:15<08:16,  1.67s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00636, train/loss_vlb_step=3.21e-5, train/loss_step=0.00636, global_step=6267.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  75%|███████▌  | 911/1208 [25:16<08:14,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00636, train/loss_vlb_step=3.21e-5, train/loss_step=0.00636, global_step=6267.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  75%|███████▌  | 911/1208 [25:16<08:14,  1.66s/it, loss=0.143, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.0014, train/loss_step=0.312, global_step=6267.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]     Epoch 20:  75%|███████▌  | 912/1208 [25:19<08:13,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.0014, train/loss_step=0.312, global_step=6267.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  75%|███████▌  | 912/1208 [25:19<08:13,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00503, train/loss_step=0.418, global_step=6267.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  76%|███████▌  | 913/1208 [25:20<08:11,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00503, train/loss_step=0.418, global_step=6267.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  76%|███████▌  | 913/1208 [25:20<08:11,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.43e-5, train/loss_step=0.0117, global_step=6268.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  76%|███████▌  | 914/1208 [25:21<08:09,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.43e-5, train/loss_step=0.0117, global_step=6268.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  76%|███████▌  | 914/1208 [25:21<08:09,  1.67s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00586, train/loss_vlb_step=2.94e-5, train/loss_step=0.00586, global_step=6268.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  76%|███████▌  | 915/1208 [25:22<08:07,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00586, train/loss_vlb_step=2.94e-5, train/loss_step=0.00586, global_step=6268.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  76%|███████▌  | 915/1208 [25:22<08:07,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0062, train/loss_vlb_step=3.33e-5, train/loss_step=0.0062, global_step=6268.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  76%|███████▌  | 916/1208 [25:26<08:06,  1.67s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0062, train/loss_vlb_step=3.33e-5, train/loss_step=0.0062, global_step=6268.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  76%|███████▌  | 916/1208 [25:26<08:06,  1.67s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00397, train/loss_vlb_step=2.14e-5, train/loss_step=0.00397, global_step=6268.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  76%|███████▌  | 917/1208 [25:27<08:04,  1.67s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00397, train/loss_vlb_step=2.14e-5, train/loss_step=0.00397, global_step=6268.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  76%|███████▌  | 917/1208 [25:27<08:04,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=7.82e-5, train/loss_step=0.0209, global_step=6269.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  76%|███████▌  | 918/1208 [25:28<08:02,  1.66s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=7.82e-5, train/loss_step=0.0209, global_step=6269.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  76%|███████▌  | 918/1208 [25:28<08:02,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000811, train/loss_step=0.205, global_step=6269.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  76%|███████▌  | 919/1208 [25:29<08:00,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000811, train/loss_step=0.205, global_step=6269.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  76%|███████▌  | 919/1208 [25:29<08:00,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0052, train/loss_vlb_step=2.79e-5, train/loss_step=0.0052, global_step=6269.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  76%|███████▌  | 920/1208 [25:32<07:59,  1.67s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0052, train/loss_vlb_step=2.79e-5, train/loss_step=0.0052, global_step=6269.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  76%|███████▌  | 920/1208 [25:32<07:59,  1.67s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00412, train/loss_vlb_step=2.26e-5, train/loss_step=0.00412, global_step=6269.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  76%|███████▌  | 921/1208 [25:33<07:57,  1.67s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00412, train/loss_vlb_step=2.26e-5, train/loss_step=0.00412, global_step=6269.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  76%|███████▌  | 921/1208 [25:33<07:57,  1.67s/it, loss=0.129, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00114, train/loss_step=0.283, global_step=6270.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  76%|███████▋  | 922/1208 [25:34<07:56,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00114, train/loss_step=0.283, global_step=6270.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  76%|███████▋  | 922/1208 [25:34<07:56,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000505, train/loss_step=0.149, global_step=6270.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  76%|███████▋  | 923/1208 [25:35<07:54,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000505, train/loss_step=0.149, global_step=6270.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  76%|███████▋  | 923/1208 [25:35<07:54,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0902, train/loss_vlb_step=0.000297, train/loss_step=0.0902, global_step=6270.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  76%|███████▋  | 924/1208 [25:38<07:52,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0902, train/loss_vlb_step=0.000297, train/loss_step=0.0902, global_step=6270.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  76%|███████▋  | 924/1208 [25:38<07:52,  1.67s/it, loss=0.126, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00177, train/loss_step=0.316, global_step=6270.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  77%|███████▋  | 925/1208 [25:39<07:51,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00177, train/loss_step=0.316, global_step=6270.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  77%|███████▋  | 925/1208 [25:39<07:51,  1.66s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.22e-5, train/loss_step=0.00209, global_step=6271.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  77%|███████▋  | 926/1208 [25:40<07:49,  1.66s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.22e-5, train/loss_step=0.00209, global_step=6271.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  77%|███████▋  | 926/1208 [25:40<07:49,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000576, train/loss_step=0.162, global_step=6271.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  77%|███████▋  | 927/1208 [25:41<07:47,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000576, train/loss_step=0.162, global_step=6271.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  77%|███████▋  | 927/1208 [25:41<07:47,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.0005, train/loss_step=0.149, global_step=6271.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  77%|███████▋  | 928/1208 [25:45<07:46,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.0005, train/loss_step=0.149, global_step=6271.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  77%|███████▋  | 928/1208 [25:45<07:46,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000117, train/loss_step=0.0302, global_step=6271.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  77%|███████▋  | 929/1208 [25:46<07:44,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000117, train/loss_step=0.0302, global_step=6271.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  77%|███████▋  | 929/1208 [25:46<07:44,  1.66s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000114, train/loss_step=0.0306, global_step=6272.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  77%|███████▋  | 930/1208 [25:47<07:42,  1.66s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000114, train/loss_step=0.0306, global_step=6272.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  77%|███████▋  | 930/1208 [25:47<07:42,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000547, train/loss_step=0.158, global_step=6272.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  77%|███████▋  | 931/1208 [25:48<07:40,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000547, train/loss_step=0.158, global_step=6272.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  77%|███████▋  | 931/1208 [25:48<07:40,  1.66s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0055, train/loss_vlb_step=2.78e-5, train/loss_step=0.0055, global_step=6272.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  77%|███████▋  | 932/1208 [25:51<07:39,  1.66s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0055, train/loss_vlb_step=2.78e-5, train/loss_step=0.0055, global_step=6272.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  77%|███████▋  | 932/1208 [25:51<07:39,  1.66s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.68e-5, train/loss_step=0.00299, global_step=6272.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  77%|███████▋  | 933/1208 [25:52<07:37,  1.66s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.68e-5, train/loss_step=0.00299, global_step=6272.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  77%|███████▋  | 933/1208 [25:52<07:37,  1.66s/it, loss=0.0887, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000475, train/loss_step=0.144, global_step=6273.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  77%|███████▋  | 934/1208 [25:53<07:35,  1.66s/it, loss=0.0887, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000475, train/loss_step=0.144, global_step=6273.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  77%|███████▋  | 934/1208 [25:53<07:35,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00265, train/loss_step=0.388, global_step=6273.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  77%|███████▋  | 935/1208 [25:54<07:33,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00265, train/loss_step=0.388, global_step=6273.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  77%|███████▋  | 935/1208 [25:54<07:33,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.633, train/loss_vlb_step=0.0154, train/loss_step=0.633, global_step=6273.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  77%|███████▋  | 936/1208 [25:57<07:32,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.633, train/loss_vlb_step=0.0154, train/loss_step=0.633, global_step=6273.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  77%|███████▋  | 936/1208 [25:57<07:32,  1.66s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0681, train/loss_vlb_step=0.000234, train/loss_step=0.0681, global_step=6273.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  78%|███████▊  | 937/1208 [25:58<07:30,  1.66s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0681, train/loss_vlb_step=0.000234, train/loss_step=0.0681, global_step=6273.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  78%|███████▊  | 937/1208 [25:58<07:30,  1.66s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.61e-5, train/loss_step=0.0127, global_step=6274.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  78%|███████▊  | 938/1208 [25:59<07:28,  1.66s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.61e-5, train/loss_step=0.0127, global_step=6274.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  78%|███████▊  | 938/1208 [25:59<07:28,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0419, train/loss_vlb_step=0.000156, train/loss_step=0.0419, global_step=6274.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  78%|███████▊  | 939/1208 [26:00<07:27,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0419, train/loss_vlb_step=0.000156, train/loss_step=0.0419, global_step=6274.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  78%|███████▊  | 939/1208 [26:00<07:27,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0432, train/loss_vlb_step=0.00016, train/loss_step=0.0432, global_step=6274.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  78%|███████▊  | 940/1208 [26:03<07:25,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0432, train/loss_vlb_step=0.00016, train/loss_step=0.0432, global_step=6274.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  78%|███████▊  | 940/1208 [26:03<07:25,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=1.11e-5, train/loss_step=0.00184, global_step=6274.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  78%|███████▊  | 941/1208 [26:05<07:24,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=1.11e-5, train/loss_step=0.00184, global_step=6274.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  78%|███████▊  | 941/1208 [26:05<07:24,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=1.4e-5, train/loss_step=0.0025, global_step=6275.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  78%|███████▊  | 942/1208 [26:06<07:22,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=1.4e-5, train/loss_step=0.0025, global_step=6275.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  78%|███████▊  | 942/1208 [26:06<07:22,  1.66s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000144, train/loss_step=0.0392, global_step=6275.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  78%|███████▊  | 943/1208 [26:07<07:20,  1.66s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000144, train/loss_step=0.0392, global_step=6275.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  78%|███████▊  | 943/1208 [26:07<07:20,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000903, train/loss_step=0.237, global_step=6275.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  78%|███████▊  | 944/1208 [26:10<07:19,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000903, train/loss_step=0.237, global_step=6275.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  78%|███████▊  | 944/1208 [26:10<07:19,  1.66s/it, loss=0.12, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00122, train/loss_step=0.249, global_step=6275.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  78%|███████▊  | 945/1208 [26:11<07:17,  1.66s/it, loss=0.12, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00122, train/loss_step=0.249, global_step=6275.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  78%|███████▊  | 945/1208 [26:11<07:17,  1.66s/it, loss=0.127, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000466, train/loss_step=0.137, global_step=6276.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  78%|███████▊  | 946/1208 [26:12<07:15,  1.66s/it, loss=0.127, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000466, train/loss_step=0.137, global_step=6276.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  78%|███████▊  | 946/1208 [26:12<07:15,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000394, train/loss_step=0.119, global_step=6276.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  78%|███████▊  | 947/1208 [26:13<07:13,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000394, train/loss_step=0.119, global_step=6276.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  78%|███████▊  | 947/1208 [26:13<07:13,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000107, train/loss_step=0.0267, global_step=6276.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  78%|███████▊  | 948/1208 [26:16<07:12,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000107, train/loss_step=0.0267, global_step=6276.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  78%|███████▊  | 948/1208 [26:16<07:12,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00152, train/loss_step=0.314, global_step=6276.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  79%|███████▊  | 949/1208 [26:17<07:10,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00152, train/loss_step=0.314, global_step=6276.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  79%|███████▊  | 949/1208 [26:17<07:10,  1.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.63e-5, train/loss_step=0.0125, global_step=6277.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  79%|███████▊  | 950/1208 [26:18<07:08,  1.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.63e-5, train/loss_step=0.0125, global_step=6277.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  79%|███████▊  | 950/1208 [26:18<07:08,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=2.39e-5, train/loss_step=0.00462, global_step=6277.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  79%|███████▊  | 951/1208 [26:19<07:06,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=2.39e-5, train/loss_step=0.00462, global_step=6277.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  79%|███████▊  | 951/1208 [26:19<07:06,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00669, train/loss_vlb_step=3.23e-5, train/loss_step=0.00669, global_step=6277.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  79%|███████▉  | 952/1208 [26:22<07:05,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00669, train/loss_vlb_step=3.23e-5, train/loss_step=0.00669, global_step=6277.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  79%|███████▉  | 952/1208 [26:22<07:05,  1.66s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0609, train/loss_vlb_step=0.000207, train/loss_step=0.0609, global_step=6277.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  79%|███████▉  | 953/1208 [26:23<07:03,  1.66s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0609, train/loss_vlb_step=0.000207, train/loss_step=0.0609, global_step=6277.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  79%|███████▉  | 953/1208 [26:23<07:03,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000132, train/loss_step=0.035, global_step=6278.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  79%|███████▉  | 954/1208 [26:25<07:02,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000132, train/loss_step=0.035, global_step=6278.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  79%|███████▉  | 954/1208 [26:25<07:02,  1.66s/it, loss=0.114, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000788, train/loss_step=0.226, global_step=6278.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  79%|███████▉  | 955/1208 [26:26<07:00,  1.66s/it, loss=0.114, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000788, train/loss_step=0.226, global_step=6278.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  79%|███████▉  | 955/1208 [26:26<07:00,  1.66s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.0703, train/loss_vlb_step=0.000236, train/loss_step=0.0703, global_step=6278.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  79%|███████▉  | 956/1208 [26:29<06:58,  1.66s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.0703, train/loss_vlb_step=0.000236, train/loss_step=0.0703, global_step=6278.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  79%|███████▉  | 956/1208 [26:29<06:58,  1.66s/it, loss=0.105, v_num=0, train/loss_simple_step=0.462, train/loss_vlb_step=0.00425, train/loss_step=0.462, global_step=6278.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  79%|███████▉  | 957/1208 [26:30<06:57,  1.66s/it, loss=0.105, v_num=0, train/loss_simple_step=0.462, train/loss_vlb_step=0.00425, train/loss_step=0.462, global_step=6278.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  79%|███████▉  | 957/1208 [26:30<06:57,  1.66s/it, loss=0.113, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.00058, train/loss_step=0.164, global_step=6279.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  79%|███████▉  | 958/1208 [26:31<06:55,  1.66s/it, loss=0.113, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.00058, train/loss_step=0.164, global_step=6279.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  79%|███████▉  | 958/1208 [26:31<06:55,  1.66s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.000152, train/loss_step=0.0441, global_step=6279.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  79%|███████▉  | 959/1208 [26:32<06:53,  1.66s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.000152, train/loss_step=0.0441, global_step=6279.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  79%|███████▉  | 959/1208 [26:32<06:53,  1.66s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00734, train/loss_vlb_step=3.59e-5, train/loss_step=0.00734, global_step=6279.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  79%|███████▉  | 960/1208 [26:35<06:52,  1.66s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00734, train/loss_vlb_step=3.59e-5, train/loss_step=0.00734, global_step=6279.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  79%|███████▉  | 960/1208 [26:35<06:52,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000292, train/loss_step=0.087, global_step=6279.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  80%|███████▉  | 961/1208 [26:36<06:50,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000292, train/loss_step=0.087, global_step=6279.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  80%|███████▉  | 961/1208 [26:36<06:50,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=1.07e-5, train/loss_step=0.00181, global_step=6280.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  80%|███████▉  | 962/1208 [26:37<06:48,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=1.07e-5, train/loss_step=0.00181, global_step=6280.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  80%|███████▉  | 962/1208 [26:37<06:48,  1.66s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00608, train/loss_vlb_step=3.22e-5, train/loss_step=0.00608, global_step=6280.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  80%|███████▉  | 963/1208 [26:38<06:46,  1.66s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00608, train/loss_vlb_step=3.22e-5, train/loss_step=0.00608, global_step=6280.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  80%|███████▉  | 963/1208 [26:38<06:46,  1.66s/it, loss=0.11, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000624, train/loss_step=0.176, global_step=6280.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  80%|███████▉  | 964/1208 [26:41<06:45,  1.66s/it, loss=0.11, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000624, train/loss_step=0.176, global_step=6280.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  80%|███████▉  | 964/1208 [26:41<06:45,  1.66s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.00892, train/loss_vlb_step=4.45e-5, train/loss_step=0.00892, global_step=6280.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  80%|███████▉  | 965/1208 [26:42<06:43,  1.66s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.00892, train/loss_vlb_step=4.45e-5, train/loss_step=0.00892, global_step=6280.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  80%|███████▉  | 965/1208 [26:42<06:43,  1.66s/it, loss=0.111, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00359, train/loss_step=0.381, global_step=6281.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]     Epoch 20:  80%|███████▉  | 966/1208 [26:43<06:41,  1.66s/it, loss=0.111, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00359, train/loss_step=0.381, global_step=6281.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  80%|███████▉  | 966/1208 [26:43<06:41,  1.66s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.31e-5, train/loss_step=0.00216, global_step=6281.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  80%|████████  | 967/1208 [26:44<06:40,  1.66s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.31e-5, train/loss_step=0.00216, global_step=6281.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  80%|████████  | 967/1208 [26:44<06:40,  1.66s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=2.21e-5, train/loss_step=0.00402, global_step=6281.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  80%|████████  | 968/1208 [26:47<06:38,  1.66s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=2.21e-5, train/loss_step=0.00402, global_step=6281.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  80%|████████  | 968/1208 [26:47<06:38,  1.66s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000139, train/loss_step=0.0374, global_step=6281.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  80%|████████  | 969/1208 [26:48<06:36,  1.66s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000139, train/loss_step=0.0374, global_step=6281.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  80%|████████  | 969/1208 [26:48<06:36,  1.66s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.63e-5, train/loss_step=0.0131, global_step=6282.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  80%|████████  | 970/1208 [26:49<06:34,  1.66s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.63e-5, train/loss_step=0.0131, global_step=6282.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  80%|████████  | 970/1208 [26:49<06:34,  1.66s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000618, train/loss_step=0.179, global_step=6282.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  80%|████████  | 971/1208 [26:50<06:33,  1.66s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000618, train/loss_step=0.179, global_step=6282.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  80%|████████  | 971/1208 [26:50<06:33,  1.66s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0761, train/loss_vlb_step=0.000252, train/loss_step=0.0761, global_step=6282.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  80%|████████  | 972/1208 [26:53<06:31,  1.66s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0761, train/loss_vlb_step=0.000252, train/loss_step=0.0761, global_step=6282.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  80%|████████  | 972/1208 [26:53<06:31,  1.66s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.23e-5, train/loss_step=0.0201, global_step=6282.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  81%|████████  | 973/1208 [26:54<06:30,  1.66s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.23e-5, train/loss_step=0.0201, global_step=6282.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  81%|████████  | 973/1208 [26:54<06:30,  1.66s/it, loss=0.109, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000764, train/loss_step=0.206, global_step=6283.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  81%|████████  | 974/1208 [26:55<06:28,  1.66s/it, loss=0.109, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000764, train/loss_step=0.206, global_step=6283.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  81%|████████  | 974/1208 [26:55<06:28,  1.66s/it, loss=0.103, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000403, train/loss_step=0.123, global_step=6283.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  81%|████████  | 975/1208 [26:56<06:26,  1.66s/it, loss=0.103, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000403, train/loss_step=0.123, global_step=6283.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  81%|████████  | 975/1208 [26:56<06:26,  1.66s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00732, train/loss_vlb_step=3.78e-5, train/loss_step=0.00732, global_step=6283.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  81%|████████  | 976/1208 [26:59<06:24,  1.66s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00732, train/loss_vlb_step=3.78e-5, train/loss_step=0.00732, global_step=6283.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  81%|████████  | 976/1208 [26:59<06:24,  1.66s/it, loss=0.0773, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.2e-5, train/loss_step=0.00209, global_step=6283.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  81%|████████  | 977/1208 [27:00<06:23,  1.66s/it, loss=0.0773, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.2e-5, train/loss_step=0.00209, global_step=6283.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  81%|████████  | 977/1208 [27:00<06:23,  1.66s/it, loss=0.0705, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000112, train/loss_step=0.0277, global_step=6284.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  81%|████████  | 978/1208 [27:01<06:21,  1.66s/it, loss=0.0705, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000112, train/loss_step=0.0277, global_step=6284.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  81%|████████  | 978/1208 [27:01<06:21,  1.66s/it, loss=0.0685, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=2.49e-5, train/loss_step=0.00481, global_step=6284.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  81%|████████  | 979/1208 [27:02<06:19,  1.66s/it, loss=0.0685, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=2.49e-5, train/loss_step=0.00481, global_step=6284.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  81%|████████  | 979/1208 [27:02<06:19,  1.66s/it, loss=0.0682, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=9.13e-6, train/loss_step=0.00155, global_step=6284.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  81%|████████  | 980/1208 [27:05<06:18,  1.66s/it, loss=0.0682, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=9.13e-6, train/loss_step=0.00155, global_step=6284.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  81%|████████  | 980/1208 [27:05<06:18,  1.66s/it, loss=0.0652, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000102, train/loss_step=0.026, global_step=6284.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  81%|████████  | 981/1208 [27:06<06:16,  1.66s/it, loss=0.0652, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000102, train/loss_step=0.026, global_step=6284.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  81%|████████  | 981/1208 [27:06<06:16,  1.66s/it, loss=0.0659, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.79e-5, train/loss_step=0.0158, global_step=6285.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  81%|████████▏ | 982/1208 [27:07<06:14,  1.66s/it, loss=0.0659, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.79e-5, train/loss_step=0.0158, global_step=6285.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  81%|████████▏ | 982/1208 [27:07<06:14,  1.66s/it, loss=0.0832, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00211, train/loss_step=0.353, global_step=6285.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  81%|████████▏ | 983/1208 [27:08<06:12,  1.66s/it, loss=0.0832, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00211, train/loss_step=0.353, global_step=6285.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  81%|████████▏ | 983/1208 [27:08<06:12,  1.66s/it, loss=0.0746, v_num=0, train/loss_simple_step=0.00427, train/loss_vlb_step=2.34e-5, train/loss_step=0.00427, global_step=6285.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  81%|████████▏ | 984/1208 [27:11<06:11,  1.66s/it, loss=0.0746, v_num=0, train/loss_simple_step=0.00427, train/loss_vlb_step=2.34e-5, train/loss_step=0.00427, global_step=6285.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  81%|████████▏ | 984/1208 [27:11<06:11,  1.66s/it, loss=0.0765, v_num=0, train/loss_simple_step=0.047, train/loss_vlb_step=0.000166, train/loss_step=0.047, global_step=6285.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  82%|████████▏ | 985/1208 [27:12<06:09,  1.66s/it, loss=0.0765, v_num=0, train/loss_simple_step=0.047, train/loss_vlb_step=0.000166, train/loss_step=0.047, global_step=6285.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  82%|████████▏ | 985/1208 [27:12<06:09,  1.66s/it, loss=0.0576, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=1.08e-5, train/loss_step=0.00184, global_step=6286.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  82%|████████▏ | 986/1208 [27:13<06:07,  1.66s/it, loss=0.0576, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=1.08e-5, train/loss_step=0.00184, global_step=6286.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  82%|████████▏ | 986/1208 [27:13<06:07,  1.66s/it, loss=0.0576, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.01e-5, train/loss_step=0.00176, global_step=6286.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  82%|████████▏ | 987/1208 [27:14<06:05,  1.66s/it, loss=0.0576, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.01e-5, train/loss_step=0.00176, global_step=6286.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  82%|████████▏ | 987/1208 [27:14<06:05,  1.66s/it, loss=0.0597, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.000167, train/loss_step=0.0459, global_step=6286.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  82%|████████▏ | 988/1208 [27:17<06:04,  1.66s/it, loss=0.0597, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.000167, train/loss_step=0.0459, global_step=6286.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  82%|████████▏ | 988/1208 [27:17<06:04,  1.66s/it, loss=0.0601, v_num=0, train/loss_simple_step=0.047, train/loss_vlb_step=0.000168, train/loss_step=0.047, global_step=6286.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  82%|████████▏ | 989/1208 [27:18<06:02,  1.66s/it, loss=0.0601, v_num=0, train/loss_simple_step=0.047, train/loss_vlb_step=0.000168, train/loss_step=0.047, global_step=6286.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  82%|████████▏ | 989/1208 [27:18<06:02,  1.66s/it, loss=0.0597, v_num=0, train/loss_simple_step=0.0051, train/loss_vlb_step=2.62e-5, train/loss_step=0.0051, global_step=6287.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  82%|████████▏ | 990/1208 [27:19<06:01,  1.66s/it, loss=0.0597, v_num=0, train/loss_simple_step=0.0051, train/loss_vlb_step=2.62e-5, train/loss_step=0.0051, global_step=6287.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  82%|████████▏ | 990/1208 [27:19<06:01,  1.66s/it, loss=0.0584, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000508, train/loss_step=0.151, global_step=6287.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  82%|████████▏ | 991/1208 [27:20<05:59,  1.66s/it, loss=0.0584, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000508, train/loss_step=0.151, global_step=6287.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  82%|████████▏ | 991/1208 [27:20<05:59,  1.66s/it, loss=0.0561, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000121, train/loss_step=0.0309, global_step=6287.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  82%|████████▏ | 992/1208 [27:23<05:57,  1.66s/it, loss=0.0561, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000121, train/loss_step=0.0309, global_step=6287.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  82%|████████▏ | 992/1208 [27:23<05:57,  1.66s/it, loss=0.0562, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.35e-5, train/loss_step=0.0228, global_step=6287.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  82%|████████▏ | 993/1208 [27:24<05:56,  1.66s/it, loss=0.0562, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.35e-5, train/loss_step=0.0228, global_step=6287.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  82%|████████▏ | 993/1208 [27:24<05:56,  1.66s/it, loss=0.057, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000842, train/loss_step=0.221, global_step=6288.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  82%|████████▏ | 994/1208 [27:25<05:54,  1.66s/it, loss=0.057, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000842, train/loss_step=0.221, global_step=6288.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  82%|████████▏ | 994/1208 [27:25<05:54,  1.66s/it, loss=0.0625, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.00101, train/loss_step=0.233, global_step=6288.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  82%|████████▏ | 995/1208 [27:26<05:52,  1.65s/it, loss=0.0625, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.00101, train/loss_step=0.233, global_step=6288.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  82%|████████▏ | 995/1208 [27:26<05:52,  1.65s/it, loss=0.069, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000456, train/loss_step=0.136, global_step=6288.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  82%|████████▏ | 996/1208 [27:29<05:51,  1.66s/it, loss=0.069, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000456, train/loss_step=0.136, global_step=6288.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  82%|████████▏ | 996/1208 [27:29<05:51,  1.66s/it, loss=0.0692, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=3.45e-5, train/loss_step=0.0072, global_step=6288.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  83%|████████▎ | 997/1208 [27:30<05:49,  1.66s/it, loss=0.0692, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=3.45e-5, train/loss_step=0.0072, global_step=6288.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  83%|████████▎ | 997/1208 [27:30<05:49,  1.66s/it, loss=0.0685, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.96e-5, train/loss_step=0.0132, global_step=6289.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  83%|████████▎ | 998/1208 [27:31<05:47,  1.65s/it, loss=0.0685, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.96e-5, train/loss_step=0.0132, global_step=6289.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  83%|████████▎ | 998/1208 [27:31<05:47,  1.65s/it, loss=0.0703, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000142, train/loss_step=0.0409, global_step=6289.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  83%|████████▎ | 999/1208 [27:32<05:45,  1.65s/it, loss=0.0703, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000142, train/loss_step=0.0409, global_step=6289.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  83%|████████▎ | 999/1208 [27:32<05:45,  1.65s/it, loss=0.0708, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.65e-5, train/loss_step=0.0105, global_step=6289.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  83%|████████▎ | 1000/1208 [27:35<05:44,  1.66s/it, loss=0.0708, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.65e-5, train/loss_step=0.0105, global_step=6289.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  83%|████████▎ | 1000/1208 [27:35<05:44,  1.66s/it, loss=0.074, v_num=0, train/loss_simple_step=0.0904, train/loss_vlb_step=0.000301, train/loss_step=0.0904, global_step=6289.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  83%|████████▎ | 1001/1208 [27:36<05:42,  1.65s/it, loss=0.074, v_num=0, train/loss_simple_step=0.0904, train/loss_vlb_step=0.000301, train/loss_step=0.0904, global_step=6289.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  83%|████████▎ | 1001/1208 [27:36<05:42,  1.65s/it, loss=0.082, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000623, train/loss_step=0.176, global_step=6290.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  83%|████████▎ | 1002/1208 [27:37<05:40,  1.65s/it, loss=0.082, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000623, train/loss_step=0.176, global_step=6290.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  83%|████████▎ | 1002/1208 [27:37<05:40,  1.65s/it, loss=0.0747, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000794, train/loss_step=0.206, global_step=6290.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  83%|████████▎ | 1003/1208 [27:38<05:38,  1.65s/it, loss=0.0747, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000794, train/loss_step=0.206, global_step=6290.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  83%|████████▎ | 1003/1208 [27:38<05:38,  1.65s/it, loss=0.0884, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00127, train/loss_step=0.278, global_step=6290.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  83%|████████▎ | 1004/1208 [27:41<05:37,  1.65s/it, loss=0.0884, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00127, train/loss_step=0.278, global_step=6290.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  83%|████████▎ | 1004/1208 [27:41<05:37,  1.65s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.00873, train/loss_vlb_step=4.2e-5, train/loss_step=0.00873, global_step=6290.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  83%|████████▎ | 1005/1208 [27:42<05:35,  1.65s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.00873, train/loss_vlb_step=4.2e-5, train/loss_step=0.00873, global_step=6290.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  83%|████████▎ | 1005/1208 [27:42<05:35,  1.65s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.46e-5, train/loss_step=0.00249, global_step=6291.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  83%|████████▎ | 1006/1208 [27:43<05:33,  1.65s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.46e-5, train/loss_step=0.00249, global_step=6291.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  83%|████████▎ | 1006/1208 [27:43<05:33,  1.65s/it, loss=0.095, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.00065, train/loss_step=0.172, global_step=6291.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]     Epoch 20:  83%|████████▎ | 1007/1208 [27:44<05:32,  1.65s/it, loss=0.095, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.00065, train/loss_step=0.172, global_step=6291.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  83%|████████▎ | 1007/1208 [27:44<05:32,  1.65s/it, loss=0.095, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000166, train/loss_step=0.0463, global_step=6291.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  83%|████████▎ | 1008/1208 [27:46<05:30,  1.65s/it, loss=0.095, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000166, train/loss_step=0.0463, global_step=6291.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  83%|████████▎ | 1008/1208 [27:46<05:30,  1.65s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.08e-5, train/loss_step=0.00186, global_step=6291.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  84%|████████▎ | 1009/1208 [27:48<05:28,  1.65s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.08e-5, train/loss_step=0.00186, global_step=6291.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  84%|████████▎ | 1009/1208 [27:48<05:28,  1.65s/it, loss=0.093, v_num=0, train/loss_simple_step=0.00925, train/loss_vlb_step=4.28e-5, train/loss_step=0.00925, global_step=6292.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  84%|████████▎ | 1010/1208 [27:49<05:27,  1.65s/it, loss=0.093, v_num=0, train/loss_simple_step=0.00925, train/loss_vlb_step=4.28e-5, train/loss_step=0.00925, global_step=6292.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  84%|████████▎ | 1010/1208 [27:49<05:27,  1.65s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000429, train/loss_step=0.129, global_step=6292.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  84%|████████▎ | 1011/1208 [27:50<05:25,  1.65s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000429, train/loss_step=0.129, global_step=6292.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  84%|████████▎ | 1011/1208 [27:50<05:25,  1.65s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.72e-5, train/loss_step=0.021, global_step=6292.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  84%|████████▍ | 1012/1208 [27:52<05:23,  1.65s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.72e-5, train/loss_step=0.021, global_step=6292.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  84%|████████▍ | 1012/1208 [27:52<05:23,  1.65s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.00418, train/loss_vlb_step=2.23e-5, train/loss_step=0.00418, global_step=6292.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  84%|████████▍ | 1013/1208 [27:53<05:22,  1.65s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.00418, train/loss_vlb_step=2.23e-5, train/loss_step=0.00418, global_step=6292.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  84%|████████▍ | 1013/1208 [27:53<05:22,  1.65s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=6293.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  84%|████████▍ | 1014/1208 [27:54<05:20,  1.65s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=6293.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  84%|████████▍ | 1014/1208 [27:54<05:20,  1.65s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00146, train/loss_step=0.260, global_step=6293.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  84%|████████▍ | 1015/1208 [27:55<05:18,  1.65s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00146, train/loss_step=0.260, global_step=6293.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  84%|████████▍ | 1015/1208 [27:55<05:18,  1.65s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00314, train/loss_step=0.374, global_step=6293.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  84%|████████▍ | 1016/1208 [27:58<05:17,  1.65s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00314, train/loss_step=0.374, global_step=6293.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  84%|████████▍ | 1016/1208 [27:58<05:17,  1.65s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.00731, train/loss_vlb_step=3.56e-5, train/loss_step=0.00731, global_step=6293.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  84%|████████▍ | 1017/1208 [27:59<05:15,  1.65s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.00731, train/loss_vlb_step=3.56e-5, train/loss_step=0.00731, global_step=6293.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  84%|████████▍ | 1017/1208 [27:59<05:15,  1.65s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000145, train/loss_step=0.0412, global_step=6294.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  84%|████████▍ | 1018/1208 [28:00<05:13,  1.65s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000145, train/loss_step=0.0412, global_step=6294.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  84%|████████▍ | 1018/1208 [28:00<05:13,  1.65s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.6e-5, train/loss_step=0.0029, global_step=6294.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  84%|████████▍ | 1019/1208 [28:01<05:11,  1.65s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.6e-5, train/loss_step=0.0029, global_step=6294.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  84%|████████▍ | 1019/1208 [28:01<05:11,  1.65s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.58e-5, train/loss_step=0.0147, global_step=6294.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  84%|████████▍ | 1020/1208 [28:04<05:10,  1.65s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.58e-5, train/loss_step=0.0147, global_step=6294.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  84%|████████▍ | 1020/1208 [28:04<05:10,  1.65s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.000297, train/loss_step=0.0894, global_step=6294.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  85%|████████▍ | 1021/1208 [28:05<05:08,  1.65s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.000297, train/loss_step=0.0894, global_step=6294.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  85%|████████▍ | 1021/1208 [28:05<05:08,  1.65s/it, loss=0.0895, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.21e-5, train/loss_step=0.00394, global_step=6295.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  85%|████████▍ | 1022/1208 [28:06<05:06,  1.65s/it, loss=0.0895, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.21e-5, train/loss_step=0.00394, global_step=6295.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  85%|████████▍ | 1022/1208 [28:06<05:06,  1.65s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00201, train/loss_step=0.346, global_step=6295.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  85%|████████▍ | 1023/1208 [28:07<05:05,  1.65s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00201, train/loss_step=0.346, global_step=6295.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  85%|████████▍ | 1023/1208 [28:07<05:05,  1.65s/it, loss=0.083, v_num=0, train/loss_simple_step=0.00858, train/loss_vlb_step=4.23e-5, train/loss_step=0.00858, global_step=6295.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  85%|████████▍ | 1024/1208 [28:10<05:03,  1.65s/it, loss=0.083, v_num=0, train/loss_simple_step=0.00858, train/loss_vlb_step=4.23e-5, train/loss_step=0.00858, global_step=6295.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  85%|████████▍ | 1024/1208 [28:10<05:03,  1.65s/it, loss=0.0832, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.6e-5, train/loss_step=0.013, global_step=6295.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  85%|████████▍ | 1025/1208 [28:11<05:02,  1.65s/it, loss=0.0832, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.6e-5, train/loss_step=0.013, global_step=6295.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  85%|████████▍ | 1025/1208 [28:11<05:02,  1.65s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.00052, train/loss_step=0.149, global_step=6296.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  85%|████████▍ | 1026/1208 [28:12<05:00,  1.65s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.00052, train/loss_step=0.149, global_step=6296.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  85%|████████▍ | 1026/1208 [28:12<05:00,  1.65s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.0575, train/loss_vlb_step=0.000201, train/loss_step=0.0575, global_step=6296.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  85%|████████▌ | 1027/1208 [28:13<04:58,  1.65s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.0575, train/loss_vlb_step=0.000201, train/loss_step=0.0575, global_step=6296.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  85%|████████▌ | 1027/1208 [28:13<04:58,  1.65s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.0536, train/loss_vlb_step=0.000185, train/loss_step=0.0536, global_step=6296.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  85%|████████▌ | 1028/1208 [28:16<04:57,  1.65s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.0536, train/loss_vlb_step=0.000185, train/loss_step=0.0536, global_step=6296.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  85%|████████▌ | 1028/1208 [28:16<04:57,  1.65s/it, loss=0.104, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00232, train/loss_step=0.388, global_step=6296.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  85%|████████▌ | 1029/1208 [28:17<04:55,  1.65s/it, loss=0.104, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00232, train/loss_step=0.388, global_step=6296.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  85%|████████▌ | 1029/1208 [28:17<04:55,  1.65s/it, loss=0.133, v_num=0, train/loss_simple_step=0.578, train/loss_vlb_step=0.0147, train/loss_step=0.578, global_step=6297.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  85%|████████▌ | 1030/1208 [28:18<04:53,  1.65s/it, loss=0.133, v_num=0, train/loss_simple_step=0.578, train/loss_vlb_step=0.0147, train/loss_step=0.578, global_step=6297.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  85%|████████▌ | 1030/1208 [28:18<04:53,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0756, train/loss_vlb_step=0.00025, train/loss_step=0.0756, global_step=6297.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  85%|████████▌ | 1031/1208 [28:19<04:51,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0756, train/loss_vlb_step=0.00025, train/loss_step=0.0756, global_step=6297.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  85%|████████▌ | 1031/1208 [28:19<04:51,  1.65s/it, loss=0.142, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.0011, train/loss_step=0.257, global_step=6297.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  85%|████████▌ | 1032/1208 [28:22<04:50,  1.65s/it, loss=0.142, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.0011, train/loss_step=0.257, global_step=6297.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  85%|████████▌ | 1032/1208 [28:22<04:50,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.052, train/loss_vlb_step=0.000185, train/loss_step=0.052, global_step=6297.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  86%|████████▌ | 1033/1208 [28:23<04:48,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.052, train/loss_vlb_step=0.000185, train/loss_step=0.052, global_step=6297.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  86%|████████▌ | 1033/1208 [28:23<04:48,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0994, train/loss_vlb_step=0.000329, train/loss_step=0.0994, global_step=6298.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  86%|████████▌ | 1034/1208 [28:24<04:46,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0994, train/loss_vlb_step=0.000329, train/loss_step=0.0994, global_step=6298.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  86%|████████▌ | 1034/1208 [28:24<04:46,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000645, train/loss_step=0.178, global_step=6298.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  86%|████████▌ | 1035/1208 [28:25<04:45,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000645, train/loss_step=0.178, global_step=6298.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  86%|████████▌ | 1035/1208 [28:25<04:45,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=6298.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  86%|████████▌ | 1036/1208 [28:28<04:43,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=6298.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  86%|████████▌ | 1036/1208 [28:28<04:43,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.745, train/loss_vlb_step=0.0545, train/loss_step=0.745, global_step=6298.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  86%|████████▌ | 1037/1208 [28:29<04:41,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.745, train/loss_vlb_step=0.0545, train/loss_step=0.745, global_step=6298.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  86%|████████▌ | 1037/1208 [28:29<04:41,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00417, train/loss_vlb_step=2.23e-5, train/loss_step=0.00417, global_step=6299.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  86%|████████▌ | 1038/1208 [28:30<04:40,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00417, train/loss_vlb_step=2.23e-5, train/loss_step=0.00417, global_step=6299.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  86%|████████▌ | 1038/1208 [28:30<04:40,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00535, train/loss_vlb_step=2.86e-5, train/loss_step=0.00535, global_step=6299.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  86%|████████▌ | 1039/1208 [28:31<04:38,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00535, train/loss_vlb_step=2.86e-5, train/loss_step=0.00535, global_step=6299.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  86%|████████▌ | 1039/1208 [28:31<04:38,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.87e-5, train/loss_step=0.0129, global_step=6299.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  86%|████████▌ | 1040/1208 [28:34<04:36,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.87e-5, train/loss_step=0.0129, global_step=6299.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  86%|████████▌ | 1040/1208 [28:34<04:36,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.6e-5, train/loss_step=0.016, global_step=6299.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  86%|████████▌ | 1041/1208 [28:35<04:35,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.6e-5, train/loss_step=0.016, global_step=6299.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  86%|████████▌ | 1041/1208 [28:35<04:35,  1.65s/it, loss=0.165, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.00057, train/loss_step=0.160, global_step=6300.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  86%|████████▋ | 1042/1208 [28:36<04:33,  1.65s/it, loss=0.165, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.00057, train/loss_step=0.160, global_step=6300.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  86%|████████▋ | 1042/1208 [28:36<04:33,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0879, train/loss_vlb_step=0.000291, train/loss_step=0.0879, global_step=6300.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  86%|████████▋ | 1043/1208 [28:37<04:31,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0879, train/loss_vlb_step=0.000291, train/loss_step=0.0879, global_step=6300.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  86%|████████▋ | 1043/1208 [28:37<04:31,  1.65s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.26e-5, train/loss_step=0.0111, global_step=6300.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  86%|████████▋ | 1044/1208 [28:40<04:30,  1.65s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.26e-5, train/loss_step=0.0111, global_step=6300.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  86%|████████▋ | 1044/1208 [28:40<04:30,  1.65s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.36e-5, train/loss_step=0.0171, global_step=6300.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  87%|████████▋ | 1045/1208 [28:41<04:28,  1.65s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.36e-5, train/loss_step=0.0171, global_step=6300.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  87%|████████▋ | 1045/1208 [28:41<04:28,  1.65s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00643, train/loss_vlb_step=3.19e-5, train/loss_step=0.00643, global_step=6301.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  87%|████████▋ | 1046/1208 [28:42<04:26,  1.65s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00643, train/loss_vlb_step=3.19e-5, train/loss_step=0.00643, global_step=6301.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  87%|████████▋ | 1046/1208 [28:42<04:26,  1.65s/it, loss=0.155, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000953, train/loss_step=0.241, global_step=6301.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  87%|████████▋ | 1047/1208 [28:43<04:24,  1.65s/it, loss=0.155, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000953, train/loss_step=0.241, global_step=6301.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  87%|████████▋ | 1047/1208 [28:43<04:24,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=1.36e-5, train/loss_step=0.0023, global_step=6301.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  87%|████████▋ | 1048/1208 [28:46<04:23,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=1.36e-5, train/loss_step=0.0023, global_step=6301.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  87%|████████▋ | 1048/1208 [28:46<04:23,  1.65s/it, loss=0.14, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000523, train/loss_step=0.151, global_step=6301.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  87%|████████▋ | 1049/1208 [28:47<04:21,  1.65s/it, loss=0.14, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000523, train/loss_step=0.151, global_step=6301.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  87%|████████▋ | 1049/1208 [28:47<04:21,  1.65s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0904, train/loss_vlb_step=0.000299, train/loss_step=0.0904, global_step=6302.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  87%|████████▋ | 1050/1208 [28:48<04:20,  1.65s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0904, train/loss_vlb_step=0.000299, train/loss_step=0.0904, global_step=6302.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  87%|████████▋ | 1050/1208 [28:48<04:20,  1.65s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00553, train/loss_vlb_step=2.84e-5, train/loss_step=0.00553, global_step=6302.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  87%|████████▋ | 1051/1208 [28:49<04:18,  1.65s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00553, train/loss_vlb_step=2.84e-5, train/loss_step=0.00553, global_step=6302.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  87%|████████▋ | 1051/1208 [28:49<04:18,  1.65s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.00493, train/loss_vlb_step=2.71e-5, train/loss_step=0.00493, global_step=6302.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  87%|████████▋ | 1052/1208 [28:52<04:16,  1.65s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.00493, train/loss_vlb_step=2.71e-5, train/loss_step=0.00493, global_step=6302.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  87%|████████▋ | 1052/1208 [28:52<04:16,  1.65s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9.17e-5, train/loss_step=0.0224, global_step=6302.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  87%|████████▋ | 1053/1208 [28:53<04:15,  1.65s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9.17e-5, train/loss_step=0.0224, global_step=6302.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  87%|████████▋ | 1053/1208 [28:53<04:15,  1.65s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.066, train/loss_vlb_step=0.000219, train/loss_step=0.066, global_step=6303.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  87%|████████▋ | 1054/1208 [28:54<04:13,  1.65s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.066, train/loss_vlb_step=0.000219, train/loss_step=0.066, global_step=6303.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  87%|████████▋ | 1054/1208 [28:54<04:13,  1.65s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.00718, train/loss_vlb_step=3.55e-5, train/loss_step=0.00718, global_step=6303.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  87%|████████▋ | 1055/1208 [28:55<04:11,  1.64s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.00718, train/loss_vlb_step=3.55e-5, train/loss_step=0.00718, global_step=6303.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  87%|████████▋ | 1055/1208 [28:55<04:11,  1.64s/it, loss=0.0838, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.96e-5, train/loss_step=0.0187, global_step=6303.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  87%|████████▋ | 1056/1208 [28:57<04:10,  1.65s/it, loss=0.0838, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.96e-5, train/loss_step=0.0187, global_step=6303.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  87%|████████▋ | 1056/1208 [28:57<04:10,  1.65s/it, loss=0.0522, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=6303.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  88%|████████▊ | 1057/1208 [28:59<04:08,  1.65s/it, loss=0.0522, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=6303.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  88%|████████▊ | 1057/1208 [28:59<04:08,  1.65s/it, loss=0.0535, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000116, train/loss_step=0.0297, global_step=6304.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  88%|████████▊ | 1058/1208 [29:00<04:06,  1.64s/it, loss=0.0535, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000116, train/loss_step=0.0297, global_step=6304.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  88%|████████▊ | 1058/1208 [29:00<04:06,  1.64s/it, loss=0.0533, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.59e-5, train/loss_step=0.00274, global_step=6304.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  88%|████████▊ | 1059/1208 [29:01<04:04,  1.64s/it, loss=0.0533, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.59e-5, train/loss_step=0.00274, global_step=6304.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  88%|████████▊ | 1059/1208 [29:01<04:04,  1.64s/it, loss=0.054, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=9.76e-5, train/loss_step=0.0254, global_step=6304.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  88%|████████▊ | 1060/1208 [29:03<04:03,  1.65s/it, loss=0.054, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=9.76e-5, train/loss_step=0.0254, global_step=6304.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  88%|████████▊ | 1060/1208 [29:03<04:03,  1.65s/it, loss=0.067, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00117, train/loss_step=0.276, global_step=6304.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  88%|████████▊ | 1061/1208 [29:04<04:01,  1.64s/it, loss=0.067, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00117, train/loss_step=0.276, global_step=6304.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  88%|████████▊ | 1061/1208 [29:04<04:01,  1.64s/it, loss=0.0599, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.65e-5, train/loss_step=0.0184, global_step=6305.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  88%|████████▊ | 1062/1208 [29:05<04:00,  1.64s/it, loss=0.0599, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.65e-5, train/loss_step=0.0184, global_step=6305.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  88%|████████▊ | 1062/1208 [29:05<04:00,  1.64s/it, loss=0.0628, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000491, train/loss_step=0.145, global_step=6305.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  88%|████████▊ | 1063/1208 [29:06<03:58,  1.64s/it, loss=0.0628, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000491, train/loss_step=0.145, global_step=6305.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  88%|████████▊ | 1063/1208 [29:06<03:58,  1.64s/it, loss=0.0656, v_num=0, train/loss_simple_step=0.0666, train/loss_vlb_step=0.000225, train/loss_step=0.0666, global_step=6305.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  88%|████████▊ | 1064/1208 [29:09<03:56,  1.64s/it, loss=0.0656, v_num=0, train/loss_simple_step=0.0666, train/loss_vlb_step=0.000225, train/loss_step=0.0666, global_step=6305.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  88%|████████▊ | 1064/1208 [29:09<03:56,  1.64s/it, loss=0.105, v_num=0, train/loss_simple_step=0.799, train/loss_vlb_step=0.202, train/loss_step=0.799, global_step=6305.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]      Epoch 20:  88%|████████▊ | 1065/1208 [29:10<03:55,  1.64s/it, loss=0.105, v_num=0, train/loss_simple_step=0.799, train/loss_vlb_step=0.202, train/loss_step=0.799, global_step=6305.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  88%|████████▊ | 1065/1208 [29:10<03:55,  1.64s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=8.31e-5, train/loss_step=0.0195, global_step=6306.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  88%|████████▊ | 1066/1208 [29:11<03:53,  1.64s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=8.31e-5, train/loss_step=0.0195, global_step=6306.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  88%|████████▊ | 1066/1208 [29:11<03:53,  1.64s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.0683, train/loss_vlb_step=0.000236, train/loss_step=0.0683, global_step=6306.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  88%|████████▊ | 1067/1208 [29:12<03:51,  1.64s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.0683, train/loss_vlb_step=0.000236, train/loss_step=0.0683, global_step=6306.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  88%|████████▊ | 1067/1208 [29:12<03:51,  1.64s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0734, train/loss_vlb_step=0.000249, train/loss_step=0.0734, global_step=6306.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  88%|████████▊ | 1068/1208 [29:15<03:50,  1.64s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0734, train/loss_vlb_step=0.000249, train/loss_step=0.0734, global_step=6306.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  88%|████████▊ | 1068/1208 [29:15<03:50,  1.64s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.069, train/loss_vlb_step=0.000231, train/loss_step=0.069, global_step=6306.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  88%|████████▊ | 1069/1208 [29:16<03:48,  1.64s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.069, train/loss_vlb_step=0.000231, train/loss_step=0.069, global_step=6306.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  88%|████████▊ | 1069/1208 [29:16<03:48,  1.64s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.0664, train/loss_vlb_step=0.000229, train/loss_step=0.0664, global_step=6307.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  89%|████████▊ | 1070/1208 [29:17<03:46,  1.64s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.0664, train/loss_vlb_step=0.000229, train/loss_step=0.0664, global_step=6307.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  89%|████████▊ | 1070/1208 [29:17<03:46,  1.64s/it, loss=0.107, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00118, train/loss_step=0.252, global_step=6307.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  89%|████████▊ | 1071/1208 [29:18<03:44,  1.64s/it, loss=0.107, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00118, train/loss_step=0.252, global_step=6307.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  89%|████████▊ | 1071/1208 [29:18<03:44,  1.64s/it, loss=0.112, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000363, train/loss_step=0.110, global_step=6307.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  89%|████████▊ | 1072/1208 [29:21<03:43,  1.64s/it, loss=0.112, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000363, train/loss_step=0.110, global_step=6307.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  89%|████████▊ | 1072/1208 [29:21<03:43,  1.64s/it, loss=0.124, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00113, train/loss_step=0.258, global_step=6307.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  89%|████████▉ | 1073/1208 [29:22<03:41,  1.64s/it, loss=0.124, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00113, train/loss_step=0.258, global_step=6307.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  89%|████████▉ | 1073/1208 [29:22<03:41,  1.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00167, train/loss_step=0.339, global_step=6308.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  89%|████████▉ | 1074/1208 [29:23<03:40,  1.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00167, train/loss_step=0.339, global_step=6308.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  89%|████████▉ | 1074/1208 [29:23<03:40,  1.64s/it, loss=0.162, v_num=0, train/loss_simple_step=0.497, train/loss_vlb_step=0.00441, train/loss_step=0.497, global_step=6308.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  89%|████████▉ | 1075/1208 [29:24<03:38,  1.64s/it, loss=0.162, v_num=0, train/loss_simple_step=0.497, train/loss_vlb_step=0.00441, train/loss_step=0.497, global_step=6308.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  89%|████████▉ | 1075/1208 [29:24<03:38,  1.64s/it, loss=0.171, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000729, train/loss_step=0.193, global_step=6308.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  89%|████████▉ | 1076/1208 [29:27<03:36,  1.64s/it, loss=0.171, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000729, train/loss_step=0.193, global_step=6308.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  89%|████████▉ | 1076/1208 [29:27<03:36,  1.64s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00706, train/loss_vlb_step=3.37e-5, train/loss_step=0.00706, global_step=6308.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  89%|████████▉ | 1077/1208 [29:28<03:35,  1.64s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00706, train/loss_vlb_step=3.37e-5, train/loss_step=0.00706, global_step=6308.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  89%|████████▉ | 1077/1208 [29:28<03:35,  1.64s/it, loss=0.174, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000688, train/loss_step=0.196, global_step=6309.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  89%|████████▉ | 1078/1208 [29:29<03:33,  1.64s/it, loss=0.174, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000688, train/loss_step=0.196, global_step=6309.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  89%|████████▉ | 1078/1208 [29:29<03:33,  1.64s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=1.08e-5, train/loss_step=0.00181, global_step=6309.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  89%|████████▉ | 1079/1208 [29:30<03:31,  1.64s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=1.08e-5, train/loss_step=0.00181, global_step=6309.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  89%|████████▉ | 1079/1208 [29:30<03:31,  1.64s/it, loss=0.178, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000349, train/loss_step=0.105, global_step=6309.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  89%|████████▉ | 1080/1208 [29:33<03:30,  1.64s/it, loss=0.178, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000349, train/loss_step=0.105, global_step=6309.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  89%|████████▉ | 1080/1208 [29:33<03:30,  1.64s/it, loss=0.175, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.00076, train/loss_step=0.208, global_step=6309.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  89%|████████▉ | 1081/1208 [29:34<03:28,  1.64s/it, loss=0.175, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.00076, train/loss_step=0.208, global_step=6309.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  89%|████████▉ | 1081/1208 [29:34<03:28,  1.64s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.16e-5, train/loss_step=0.00199, global_step=6310.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  90%|████████▉ | 1082/1208 [29:35<03:26,  1.64s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.16e-5, train/loss_step=0.00199, global_step=6310.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  90%|████████▉ | 1082/1208 [29:35<03:26,  1.64s/it, loss=0.176, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.00086, train/loss_step=0.199, global_step=6310.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  90%|████████▉ | 1083/1208 [29:36<03:25,  1.64s/it, loss=0.176, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.00086, train/loss_step=0.199, global_step=6310.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  90%|████████▉ | 1083/1208 [29:36<03:25,  1.64s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00972, train/loss_vlb_step=4.51e-5, train/loss_step=0.00972, global_step=6310.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  90%|████████▉ | 1084/1208 [29:39<03:23,  1.64s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00972, train/loss_vlb_step=4.51e-5, train/loss_step=0.00972, global_step=6310.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  90%|████████▉ | 1084/1208 [29:39<03:23,  1.64s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00682, train/loss_vlb_step=3.41e-5, train/loss_step=0.00682, global_step=6310.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  90%|████████▉ | 1085/1208 [29:40<03:21,  1.64s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00682, train/loss_vlb_step=3.41e-5, train/loss_step=0.00682, global_step=6310.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  90%|████████▉ | 1085/1208 [29:40<03:21,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.31e-5, train/loss_step=0.00218, global_step=6311.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  90%|████████▉ | 1086/1208 [29:41<03:20,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.31e-5, train/loss_step=0.00218, global_step=6311.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  90%|████████▉ | 1086/1208 [29:41<03:20,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0715, train/loss_vlb_step=0.000246, train/loss_step=0.0715, global_step=6311.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  90%|████████▉ | 1087/1208 [29:42<03:18,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0715, train/loss_vlb_step=0.000246, train/loss_step=0.0715, global_step=6311.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  90%|████████▉ | 1087/1208 [29:42<03:18,  1.64s/it, loss=0.142, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000945, train/loss_step=0.242, global_step=6311.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  90%|█████████ | 1088/1208 [29:45<03:16,  1.64s/it, loss=0.142, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000945, train/loss_step=0.242, global_step=6311.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  90%|█████████ | 1088/1208 [29:45<03:16,  1.64s/it, loss=0.156, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00197, train/loss_step=0.349, global_step=6311.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  90%|█████████ | 1089/1208 [29:46<03:15,  1.64s/it, loss=0.156, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00197, train/loss_step=0.349, global_step=6311.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  90%|█████████ | 1089/1208 [29:46<03:15,  1.64s/it, loss=0.171, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00195, train/loss_step=0.377, global_step=6312.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  90%|█████████ | 1090/1208 [29:47<03:13,  1.64s/it, loss=0.171, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00195, train/loss_step=0.377, global_step=6312.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  90%|█████████ | 1090/1208 [29:47<03:13,  1.64s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00809, train/loss_vlb_step=3.87e-5, train/loss_step=0.00809, global_step=6312.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  90%|█████████ | 1091/1208 [29:48<03:11,  1.64s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00809, train/loss_vlb_step=3.87e-5, train/loss_step=0.00809, global_step=6312.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  90%|█████████ | 1091/1208 [29:48<03:11,  1.64s/it, loss=0.167, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00111, train/loss_step=0.261, global_step=6312.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  90%|█████████ | 1092/1208 [29:51<03:10,  1.64s/it, loss=0.167, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00111, train/loss_step=0.261, global_step=6312.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  90%|█████████ | 1092/1208 [29:51<03:10,  1.64s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000116, train/loss_step=0.0284, global_step=6312.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  90%|█████████ | 1093/1208 [29:52<03:08,  1.64s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000116, train/loss_step=0.0284, global_step=6312.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  90%|█████████ | 1093/1208 [29:52<03:08,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00931, train/loss_vlb_step=4.34e-5, train/loss_step=0.00931, global_step=6313.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  91%|█████████ | 1094/1208 [29:53<03:06,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00931, train/loss_vlb_step=4.34e-5, train/loss_step=0.00931, global_step=6313.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  91%|█████████ | 1094/1208 [29:53<03:06,  1.64s/it, loss=0.119, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000361, train/loss_step=0.110, global_step=6313.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  91%|█████████ | 1095/1208 [29:54<03:05,  1.64s/it, loss=0.119, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000361, train/loss_step=0.110, global_step=6313.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  91%|█████████ | 1095/1208 [29:54<03:05,  1.64s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.00027, train/loss_step=0.0815, global_step=6313.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  91%|█████████ | 1096/1208 [29:57<03:03,  1.64s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.00027, train/loss_step=0.0815, global_step=6313.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  91%|█████████ | 1096/1208 [29:57<03:03,  1.64s/it, loss=0.122, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000588, train/loss_step=0.177, global_step=6313.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  91%|█████████ | 1097/1208 [29:58<03:01,  1.64s/it, loss=0.122, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000588, train/loss_step=0.177, global_step=6313.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  91%|█████████ | 1097/1208 [29:58<03:01,  1.64s/it, loss=0.125, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.00101, train/loss_step=0.241, global_step=6314.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  91%|█████████ | 1098/1208 [29:59<03:00,  1.64s/it, loss=0.125, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.00101, train/loss_step=0.241, global_step=6314.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  91%|█████████ | 1098/1208 [29:59<03:00,  1.64s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0589, train/loss_vlb_step=0.000201, train/loss_step=0.0589, global_step=6314.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  91%|█████████ | 1099/1208 [30:00<02:58,  1.64s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0589, train/loss_vlb_step=0.000201, train/loss_step=0.0589, global_step=6314.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  91%|█████████ | 1099/1208 [30:00<02:58,  1.64s/it, loss=0.134, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000877, train/loss_step=0.239, global_step=6314.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  91%|█████████ | 1100/1208 [30:02<02:57,  1.64s/it, loss=0.134, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000877, train/loss_step=0.239, global_step=6314.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  91%|█████████ | 1100/1208 [30:02<02:57,  1.64s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000105, train/loss_step=0.0272, global_step=6314.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  91%|█████████ | 1101/1208 [30:03<02:55,  1.64s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000105, train/loss_step=0.0272, global_step=6314.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  91%|█████████ | 1101/1208 [30:03<02:55,  1.64s/it, loss=0.13, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.00035, train/loss_step=0.107, global_step=6315.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  91%|█████████ | 1102/1208 [30:05<02:53,  1.64s/it, loss=0.13, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.00035, train/loss_step=0.107, global_step=6315.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  91%|█████████ | 1102/1208 [30:05<02:53,  1.64s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.33e-5, train/loss_step=0.0167, global_step=6315.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  91%|█████████▏| 1103/1208 [30:06<02:51,  1.64s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.33e-5, train/loss_step=0.0167, global_step=6315.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  91%|█████████▏| 1103/1208 [30:06<02:51,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.000148, train/loss_step=0.0403, global_step=6315.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  91%|█████████▏| 1104/1208 [30:08<02:50,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.000148, train/loss_step=0.0403, global_step=6315.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  91%|█████████▏| 1104/1208 [30:08<02:50,  1.64s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.58e-5, train/loss_step=0.00278, global_step=6315.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  91%|█████████▏| 1105/1208 [30:09<02:48,  1.64s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.58e-5, train/loss_step=0.00278, global_step=6315.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  91%|█████████▏| 1105/1208 [30:09<02:48,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000788, train/loss_step=0.209, global_step=6316.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  92%|█████████▏| 1106/1208 [30:10<02:47,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000788, train/loss_step=0.209, global_step=6316.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  92%|█████████▏| 1106/1208 [30:10<02:47,  1.64s/it, loss=0.144, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00173, train/loss_step=0.297, global_step=6316.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  92%|█████████▏| 1107/1208 [30:11<02:45,  1.64s/it, loss=0.144, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00173, train/loss_step=0.297, global_step=6316.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  92%|█████████▏| 1107/1208 [30:11<02:45,  1.64s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.000171, train/loss_step=0.0489, global_step=6316.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  92%|█████████▏| 1108/1208 [30:14<02:43,  1.64s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.000171, train/loss_step=0.0489, global_step=6316.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  92%|█████████▏| 1108/1208 [30:14<02:43,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00177, train/loss_step=0.307, global_step=6316.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  92%|█████████▏| 1109/1208 [30:15<02:42,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00177, train/loss_step=0.307, global_step=6316.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  92%|█████████▏| 1109/1208 [30:15<02:42,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.463, train/loss_vlb_step=0.00406, train/loss_step=0.463, global_step=6317.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  92%|█████████▏| 1110/1208 [30:16<02:40,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.463, train/loss_vlb_step=0.00406, train/loss_step=0.463, global_step=6317.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  92%|█████████▏| 1110/1208 [30:16<02:40,  1.64s/it, loss=0.16, v_num=0, train/loss_simple_step=0.475, train/loss_vlb_step=0.00487, train/loss_step=0.475, global_step=6317.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  92%|█████████▏| 1111/1208 [30:17<02:38,  1.64s/it, loss=0.16, v_num=0, train/loss_simple_step=0.475, train/loss_vlb_step=0.00487, train/loss_step=0.475, global_step=6317.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  92%|█████████▏| 1111/1208 [30:17<02:38,  1.64s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0324, train/loss_vlb_step=0.000127, train/loss_step=0.0324, global_step=6317.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  92%|█████████▏| 1112/1208 [30:20<02:37,  1.64s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0324, train/loss_vlb_step=0.000127, train/loss_step=0.0324, global_step=6317.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  92%|█████████▏| 1112/1208 [30:20<02:37,  1.64s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00515, train/loss_vlb_step=2.64e-5, train/loss_step=0.00515, global_step=6317.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  92%|█████████▏| 1113/1208 [30:21<02:35,  1.64s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00515, train/loss_vlb_step=2.64e-5, train/loss_step=0.00515, global_step=6317.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  92%|█████████▏| 1113/1208 [30:21<02:35,  1.64s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0742, train/loss_vlb_step=0.000247, train/loss_step=0.0742, global_step=6318.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  92%|█████████▏| 1114/1208 [30:22<02:33,  1.64s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0742, train/loss_vlb_step=0.000247, train/loss_step=0.0742, global_step=6318.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  92%|█████████▏| 1114/1208 [30:22<02:33,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=1.35e-5, train/loss_step=0.0023, global_step=6318.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  92%|█████████▏| 1115/1208 [30:23<02:32,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=1.35e-5, train/loss_step=0.0023, global_step=6318.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  92%|█████████▏| 1115/1208 [30:23<02:32,  1.64s/it, loss=0.155, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00116, train/loss_step=0.284, global_step=6318.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  92%|█████████▏| 1116/1208 [30:26<02:30,  1.64s/it, loss=0.155, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00116, train/loss_step=0.284, global_step=6318.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  92%|█████████▏| 1116/1208 [30:26<02:30,  1.64s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0997, train/loss_vlb_step=0.000328, train/loss_step=0.0997, global_step=6318.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  92%|█████████▏| 1117/1208 [30:27<02:28,  1.64s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0997, train/loss_vlb_step=0.000328, train/loss_step=0.0997, global_step=6318.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  92%|█████████▏| 1117/1208 [30:27<02:28,  1.64s/it, loss=0.179, v_num=0, train/loss_simple_step=0.794, train/loss_vlb_step=0.0582, train/loss_step=0.794, global_step=6319.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  93%|█████████▎| 1118/1208 [30:28<02:27,  1.64s/it, loss=0.179, v_num=0, train/loss_simple_step=0.794, train/loss_vlb_step=0.0582, train/loss_step=0.794, global_step=6319.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  93%|█████████▎| 1118/1208 [30:28<02:27,  1.64s/it, loss=0.191, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00206, train/loss_step=0.296, global_step=6319.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  93%|█████████▎| 1119/1208 [30:29<02:25,  1.64s/it, loss=0.191, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00206, train/loss_step=0.296, global_step=6319.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  93%|█████████▎| 1119/1208 [30:29<02:25,  1.64s/it, loss=0.185, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000401, train/loss_step=0.122, global_step=6319.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  93%|█████████▎| 1120/1208 [30:32<02:23,  1.64s/it, loss=0.185, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000401, train/loss_step=0.122, global_step=6319.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  93%|█████████▎| 1120/1208 [30:32<02:23,  1.64s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.000188, train/loss_step=0.0526, global_step=6319.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  93%|█████████▎| 1121/1208 [30:33<02:22,  1.64s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.000188, train/loss_step=0.0526, global_step=6319.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  93%|█████████▎| 1121/1208 [30:33<02:22,  1.64s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0391, train/loss_vlb_step=0.000147, train/loss_step=0.0391, global_step=6320.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  93%|█████████▎| 1122/1208 [30:34<02:20,  1.64s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0391, train/loss_vlb_step=0.000147, train/loss_step=0.0391, global_step=6320.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  93%|█████████▎| 1122/1208 [30:34<02:20,  1.64s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0622, train/loss_vlb_step=0.000211, train/loss_step=0.0622, global_step=6320.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  93%|█████████▎| 1123/1208 [30:35<02:18,  1.63s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0622, train/loss_vlb_step=0.000211, train/loss_step=0.0622, global_step=6320.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  93%|█████████▎| 1123/1208 [30:35<02:18,  1.63s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=2.04e-5, train/loss_step=0.00357, global_step=6320.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  93%|█████████▎| 1124/1208 [30:38<02:17,  1.64s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=2.04e-5, train/loss_step=0.00357, global_step=6320.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  93%|█████████▎| 1124/1208 [30:38<02:17,  1.64s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000114, train/loss_step=0.0286, global_step=6320.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  93%|█████████▎| 1125/1208 [30:39<02:15,  1.64s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000114, train/loss_step=0.0286, global_step=6320.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  93%|█████████▎| 1125/1208 [30:39<02:15,  1.64s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0907, train/loss_vlb_step=0.000302, train/loss_step=0.0907, global_step=6321.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  93%|█████████▎| 1126/1208 [30:40<02:14,  1.63s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0907, train/loss_vlb_step=0.000302, train/loss_step=0.0907, global_step=6321.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  93%|█████████▎| 1126/1208 [30:40<02:14,  1.63s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0414, train/loss_vlb_step=0.000142, train/loss_step=0.0414, global_step=6321.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  93%|█████████▎| 1127/1208 [30:41<02:12,  1.63s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0414, train/loss_vlb_step=0.000142, train/loss_step=0.0414, global_step=6321.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  93%|█████████▎| 1127/1208 [30:41<02:12,  1.63s/it, loss=0.172, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000565, train/loss_step=0.167, global_step=6321.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  93%|█████████▎| 1128/1208 [30:44<02:10,  1.64s/it, loss=0.172, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000565, train/loss_step=0.167, global_step=6321.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  93%|█████████▎| 1128/1208 [30:44<02:10,  1.64s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.85e-5, train/loss_step=0.00342, global_step=6321.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  93%|█████████▎| 1129/1208 [30:45<02:09,  1.63s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.85e-5, train/loss_step=0.00342, global_step=6321.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  93%|█████████▎| 1129/1208 [30:45<02:09,  1.63s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.00011, train/loss_step=0.0291, global_step=6322.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  94%|█████████▎| 1130/1208 [30:46<02:07,  1.63s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.00011, train/loss_step=0.0291, global_step=6322.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  94%|█████████▎| 1130/1208 [30:46<02:07,  1.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000126, train/loss_step=0.0335, global_step=6322.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  94%|█████████▎| 1131/1208 [30:47<02:05,  1.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000126, train/loss_step=0.0335, global_step=6322.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  94%|█████████▎| 1131/1208 [30:47<02:05,  1.63s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=8.06e-5, train/loss_step=0.0189, global_step=6322.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  94%|█████████▎| 1132/1208 [30:50<02:04,  1.63s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=8.06e-5, train/loss_step=0.0189, global_step=6322.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  94%|█████████▎| 1132/1208 [30:50<02:04,  1.63s/it, loss=0.114, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.000161, train/loss_step=0.043, global_step=6322.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  94%|█████████▍| 1133/1208 [30:51<02:02,  1.63s/it, loss=0.114, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.000161, train/loss_step=0.043, global_step=6322.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  94%|█████████▍| 1133/1208 [30:51<02:02,  1.63s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0939, train/loss_vlb_step=0.000311, train/loss_step=0.0939, global_step=6323.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  94%|█████████▍| 1134/1208 [30:52<02:00,  1.63s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0939, train/loss_vlb_step=0.000311, train/loss_step=0.0939, global_step=6323.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  94%|█████████▍| 1134/1208 [30:52<02:00,  1.63s/it, loss=0.119, v_num=0, train/loss_simple_step=0.078, train/loss_vlb_step=0.000263, train/loss_step=0.078, global_step=6323.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  94%|█████████▍| 1135/1208 [30:53<01:59,  1.63s/it, loss=0.119, v_num=0, train/loss_simple_step=0.078, train/loss_vlb_step=0.000263, train/loss_step=0.078, global_step=6323.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  94%|█████████▍| 1135/1208 [30:53<01:59,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00135, train/loss_step=0.327, global_step=6323.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  94%|█████████▍| 1136/1208 [30:56<01:57,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00135, train/loss_step=0.327, global_step=6323.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  94%|█████████▍| 1136/1208 [30:56<01:57,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000547, train/loss_step=0.161, global_step=6323.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  94%|█████████▍| 1137/1208 [30:57<01:55,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000547, train/loss_step=0.161, global_step=6323.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  94%|█████████▍| 1137/1208 [30:57<01:55,  1.63s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000415, train/loss_step=0.126, global_step=6324.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  94%|█████████▍| 1138/1208 [30:58<01:54,  1.63s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000415, train/loss_step=0.126, global_step=6324.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  94%|█████████▍| 1138/1208 [30:58<01:54,  1.63s/it, loss=0.0844, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000559, train/loss_step=0.166, global_step=6324.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  94%|█████████▍| 1139/1208 [30:59<01:52,  1.63s/it, loss=0.0844, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000559, train/loss_step=0.166, global_step=6324.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  94%|█████████▍| 1139/1208 [30:59<01:52,  1.63s/it, loss=0.0787, v_num=0, train/loss_simple_step=0.00713, train/loss_vlb_step=3.47e-5, train/loss_step=0.00713, global_step=6324.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  94%|█████████▍| 1140/1208 [31:02<01:51,  1.63s/it, loss=0.0787, v_num=0, train/loss_simple_step=0.00713, train/loss_vlb_step=3.47e-5, train/loss_step=0.00713, global_step=6324.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  94%|█████████▍| 1140/1208 [31:02<01:51,  1.63s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00159, train/loss_step=0.329, global_step=6324.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  94%|█████████▍| 1141/1208 [31:03<01:49,  1.63s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00159, train/loss_step=0.329, global_step=6324.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  94%|█████████▍| 1141/1208 [31:03<01:49,  1.63s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000573, train/loss_step=0.160, global_step=6325.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  95%|█████████▍| 1142/1208 [31:04<01:47,  1.63s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000573, train/loss_step=0.160, global_step=6325.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  95%|█████████▍| 1142/1208 [31:04<01:47,  1.63s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.0498, train/loss_vlb_step=0.000172, train/loss_step=0.0498, global_step=6325.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  95%|█████████▍| 1143/1208 [31:05<01:46,  1.63s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.0498, train/loss_vlb_step=0.000172, train/loss_step=0.0498, global_step=6325.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  95%|█████████▍| 1143/1208 [31:05<01:46,  1.63s/it, loss=0.127, v_num=0, train/loss_simple_step=0.579, train/loss_vlb_step=0.00674, train/loss_step=0.579, global_step=6325.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  95%|█████████▍| 1144/1208 [31:08<01:44,  1.63s/it, loss=0.127, v_num=0, train/loss_simple_step=0.579, train/loss_vlb_step=0.00674, train/loss_step=0.579, global_step=6325.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  95%|█████████▍| 1144/1208 [31:08<01:44,  1.63s/it, loss=0.135, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000747, train/loss_step=0.196, global_step=6325.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  95%|█████████▍| 1145/1208 [31:09<01:42,  1.63s/it, loss=0.135, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000747, train/loss_step=0.196, global_step=6325.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  95%|█████████▍| 1145/1208 [31:09<01:42,  1.63s/it, loss=0.138, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000492, train/loss_step=0.148, global_step=6326.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  95%|█████████▍| 1146/1208 [31:10<01:41,  1.63s/it, loss=0.138, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000492, train/loss_step=0.148, global_step=6326.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  95%|█████████▍| 1146/1208 [31:10<01:41,  1.63s/it, loss=0.167, v_num=0, train/loss_simple_step=0.620, train/loss_vlb_step=0.0121, train/loss_step=0.620, global_step=6326.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  95%|█████████▍| 1147/1208 [31:11<01:39,  1.63s/it, loss=0.167, v_num=0, train/loss_simple_step=0.620, train/loss_vlb_step=0.0121, train/loss_step=0.620, global_step=6326.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  95%|█████████▍| 1147/1208 [31:11<01:39,  1.63s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00447, train/loss_vlb_step=2.49e-5, train/loss_step=0.00447, global_step=6326.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  95%|█████████▌| 1148/1208 [31:13<01:37,  1.63s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00447, train/loss_vlb_step=2.49e-5, train/loss_step=0.00447, global_step=6326.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  95%|█████████▌| 1148/1208 [31:13<01:37,  1.63s/it, loss=0.187, v_num=0, train/loss_simple_step=0.574, train/loss_vlb_step=0.00869, train/loss_step=0.574, global_step=6326.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]    Epoch 20:  95%|█████████▌| 1149/1208 [31:14<01:36,  1.63s/it, loss=0.187, v_num=0, train/loss_simple_step=0.574, train/loss_vlb_step=0.00869, train/loss_step=0.574, global_step=6326.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  95%|█████████▌| 1149/1208 [31:14<01:36,  1.63s/it, loss=0.2, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00135, train/loss_step=0.285, global_step=6327.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  95%|█████████▌| 1150/1208 [31:15<01:34,  1.63s/it, loss=0.2, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00135, train/loss_step=0.285, global_step=6327.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  95%|█████████▌| 1150/1208 [31:15<01:34,  1.63s/it, loss=0.211, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00101, train/loss_step=0.244, global_step=6327.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  95%|█████████▌| 1151/1208 [31:16<01:32,  1.63s/it, loss=0.211, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00101, train/loss_step=0.244, global_step=6327.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  95%|█████████▌| 1151/1208 [31:16<01:32,  1.63s/it, loss=0.211, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=9.16e-5, train/loss_step=0.021, global_step=6327.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  95%|█████████▌| 1152/1208 [31:19<01:31,  1.63s/it, loss=0.211, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=9.16e-5, train/loss_step=0.021, global_step=6327.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  95%|█████████▌| 1152/1208 [31:19<01:31,  1.63s/it, loss=0.215, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000442, train/loss_step=0.133, global_step=6327.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  95%|█████████▌| 1153/1208 [31:20<01:29,  1.63s/it, loss=0.215, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000442, train/loss_step=0.133, global_step=6327.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  95%|█████████▌| 1153/1208 [31:20<01:29,  1.63s/it, loss=0.222, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.00101, train/loss_step=0.225, global_step=6328.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  96%|█████████▌| 1154/1208 [31:21<01:28,  1.63s/it, loss=0.222, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.00101, train/loss_step=0.225, global_step=6328.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  96%|█████████▌| 1154/1208 [31:21<01:28,  1.63s/it, loss=0.222, v_num=0, train/loss_simple_step=0.0729, train/loss_vlb_step=0.000252, train/loss_step=0.0729, global_step=6328.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  96%|█████████▌| 1155/1208 [31:22<01:26,  1.63s/it, loss=0.222, v_num=0, train/loss_simple_step=0.0729, train/loss_vlb_step=0.000252, train/loss_step=0.0729, global_step=6328.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  96%|█████████▌| 1155/1208 [31:22<01:26,  1.63s/it, loss=0.205, v_num=0, train/loss_simple_step=0.00476, train/loss_vlb_step=2.54e-5, train/loss_step=0.00476, global_step=6328.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  96%|█████████▌| 1156/1208 [31:25<01:24,  1.63s/it, loss=0.205, v_num=0, train/loss_simple_step=0.00476, train/loss_vlb_step=2.54e-5, train/loss_step=0.00476, global_step=6328.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  96%|█████████▌| 1156/1208 [31:25<01:24,  1.63s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00547, train/loss_vlb_step=2.89e-5, train/loss_step=0.00547, global_step=6328.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  96%|█████████▌| 1157/1208 [31:26<01:23,  1.63s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00547, train/loss_vlb_step=2.89e-5, train/loss_step=0.00547, global_step=6328.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  96%|█████████▌| 1157/1208 [31:26<01:23,  1.63s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0691, train/loss_vlb_step=0.000238, train/loss_step=0.0691, global_step=6329.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  96%|█████████▌| 1158/1208 [31:27<01:21,  1.63s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0691, train/loss_vlb_step=0.000238, train/loss_step=0.0691, global_step=6329.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  96%|█████████▌| 1158/1208 [31:27<01:21,  1.63s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.00014, train/loss_step=0.0373, global_step=6329.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  96%|█████████▌| 1159/1208 [31:28<01:19,  1.63s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.00014, train/loss_step=0.0373, global_step=6329.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  96%|█████████▌| 1159/1208 [31:28<01:19,  1.63s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=9.97e-5, train/loss_step=0.0266, global_step=6329.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  96%|█████████▌| 1160/1208 [31:31<01:18,  1.63s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=9.97e-5, train/loss_step=0.0266, global_step=6329.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  96%|█████████▌| 1160/1208 [31:31<01:18,  1.63s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=6.02e-5, train/loss_step=0.0128, global_step=6329.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  96%|█████████▌| 1161/1208 [31:32<01:16,  1.63s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=6.02e-5, train/loss_step=0.0128, global_step=6329.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  96%|█████████▌| 1161/1208 [31:32<01:16,  1.63s/it, loss=0.18, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00152, train/loss_step=0.301, global_step=6330.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  96%|█████████▌| 1162/1208 [31:33<01:14,  1.63s/it, loss=0.18, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00152, train/loss_step=0.301, global_step=6330.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  96%|█████████▌| 1162/1208 [31:33<01:14,  1.63s/it, loss=0.206, v_num=0, train/loss_simple_step=0.553, train/loss_vlb_step=0.0111, train/loss_step=0.553, global_step=6330.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  96%|█████████▋| 1163/1208 [31:34<01:13,  1.63s/it, loss=0.206, v_num=0, train/loss_simple_step=0.553, train/loss_vlb_step=0.0111, train/loss_step=0.553, global_step=6330.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  96%|█████████▋| 1163/1208 [31:34<01:13,  1.63s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=9.05e-5, train/loss_step=0.0208, global_step=6330.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  96%|█████████▋| 1164/1208 [31:37<01:11,  1.63s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=9.05e-5, train/loss_step=0.0208, global_step=6330.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  96%|█████████▋| 1164/1208 [31:37<01:11,  1.63s/it, loss=0.173, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=6330.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  96%|█████████▋| 1165/1208 [31:38<01:10,  1.63s/it, loss=0.173, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=6330.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  96%|█████████▋| 1165/1208 [31:38<01:10,  1.63s/it, loss=0.181, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00142, train/loss_step=0.293, global_step=6331.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  97%|█████████▋| 1166/1208 [31:39<01:08,  1.63s/it, loss=0.181, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00142, train/loss_step=0.293, global_step=6331.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  97%|█████████▋| 1166/1208 [31:39<01:08,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0408, train/loss_vlb_step=0.000148, train/loss_step=0.0408, global_step=6331.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  97%|█████████▋| 1167/1208 [31:40<01:06,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0408, train/loss_vlb_step=0.000148, train/loss_step=0.0408, global_step=6331.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  97%|█████████▋| 1167/1208 [31:40<01:06,  1.63s/it, loss=0.174, v_num=0, train/loss_simple_step=0.443, train/loss_vlb_step=0.00515, train/loss_step=0.443, global_step=6331.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  97%|█████████▋| 1168/1208 [31:43<01:05,  1.63s/it, loss=0.174, v_num=0, train/loss_simple_step=0.443, train/loss_vlb_step=0.00515, train/loss_step=0.443, global_step=6331.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  97%|█████████▋| 1168/1208 [31:43<01:05,  1.63s/it, loss=0.155, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000805, train/loss_step=0.204, global_step=6331.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  97%|█████████▋| 1169/1208 [31:44<01:03,  1.63s/it, loss=0.155, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000805, train/loss_step=0.204, global_step=6331.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  97%|█████████▋| 1169/1208 [31:44<01:03,  1.63s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.89e-5, train/loss_step=0.0104, global_step=6332.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  97%|█████████▋| 1170/1208 [31:45<01:01,  1.63s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.89e-5, train/loss_step=0.0104, global_step=6332.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  97%|█████████▋| 1170/1208 [31:45<01:01,  1.63s/it, loss=0.141, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.00103, train/loss_step=0.246, global_step=6332.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  97%|█████████▋| 1171/1208 [31:46<01:00,  1.63s/it, loss=0.141, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.00103, train/loss_step=0.246, global_step=6332.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  97%|█████████▋| 1171/1208 [31:46<01:00,  1.63s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000123, train/loss_step=0.0335, global_step=6332.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  97%|█████████▋| 1172/1208 [31:49<00:58,  1.63s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000123, train/loss_step=0.0335, global_step=6332.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  97%|█████████▋| 1172/1208 [31:49<00:58,  1.63s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0579, train/loss_vlb_step=0.000197, train/loss_step=0.0579, global_step=6332.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  97%|█████████▋| 1173/1208 [31:50<00:57,  1.63s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0579, train/loss_vlb_step=0.000197, train/loss_step=0.0579, global_step=6332.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  97%|█████████▋| 1173/1208 [31:50<00:57,  1.63s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0961, train/loss_vlb_step=0.000318, train/loss_step=0.0961, global_step=6333.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  97%|█████████▋| 1174/1208 [31:51<00:55,  1.63s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0961, train/loss_vlb_step=0.000318, train/loss_step=0.0961, global_step=6333.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  97%|█████████▋| 1174/1208 [31:51<00:55,  1.63s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=1.37e-5, train/loss_step=0.0023, global_step=6333.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  97%|█████████▋| 1175/1208 [31:52<00:53,  1.63s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=1.37e-5, train/loss_step=0.0023, global_step=6333.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  97%|█████████▋| 1175/1208 [31:52<00:53,  1.63s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.19e-5, train/loss_step=0.00205, global_step=6333.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  97%|█████████▋| 1176/1208 [31:55<00:52,  1.63s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.19e-5, train/loss_step=0.00205, global_step=6333.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  97%|█████████▋| 1176/1208 [31:55<00:52,  1.63s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.99e-5, train/loss_step=0.0136, global_step=6333.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  97%|█████████▋| 1177/1208 [31:56<00:50,  1.63s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.99e-5, train/loss_step=0.0136, global_step=6333.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  97%|█████████▋| 1177/1208 [31:56<00:50,  1.63s/it, loss=0.13, v_num=0, train/loss_simple_step=0.098, train/loss_vlb_step=0.000323, train/loss_step=0.098, global_step=6334.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  98%|█████████▊| 1178/1208 [31:57<00:48,  1.63s/it, loss=0.13, v_num=0, train/loss_simple_step=0.098, train/loss_vlb_step=0.000323, train/loss_step=0.098, global_step=6334.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  98%|█████████▊| 1178/1208 [31:57<00:48,  1.63s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0419, train/loss_vlb_step=0.000149, train/loss_step=0.0419, global_step=6334.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  98%|█████████▊| 1179/1208 [31:58<00:47,  1.63s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0419, train/loss_vlb_step=0.000149, train/loss_step=0.0419, global_step=6334.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  98%|█████████▊| 1179/1208 [31:58<00:47,  1.63s/it, loss=0.144, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00123, train/loss_step=0.293, global_step=6334.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  98%|█████████▊| 1180/1208 [32:01<00:45,  1.63s/it, loss=0.144, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00123, train/loss_step=0.293, global_step=6334.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  98%|█████████▊| 1180/1208 [32:01<00:45,  1.63s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.03e-5, train/loss_step=0.0229, global_step=6334.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  98%|█████████▊| 1181/1208 [32:02<00:43,  1.63s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.03e-5, train/loss_step=0.0229, global_step=6334.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  98%|█████████▊| 1181/1208 [32:02<00:43,  1.63s/it, loss=0.153, v_num=0, train/loss_simple_step=0.488, train/loss_vlb_step=0.00418, train/loss_step=0.488, global_step=6335.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  98%|█████████▊| 1182/1208 [32:03<00:42,  1.63s/it, loss=0.153, v_num=0, train/loss_simple_step=0.488, train/loss_vlb_step=0.00418, train/loss_step=0.488, global_step=6335.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  98%|█████████▊| 1182/1208 [32:03<00:42,  1.63s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00829, train/loss_vlb_step=3.91e-5, train/loss_step=0.00829, global_step=6335.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  98%|█████████▊| 1183/1208 [32:04<00:40,  1.63s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00829, train/loss_vlb_step=3.91e-5, train/loss_step=0.00829, global_step=6335.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  98%|█████████▊| 1183/1208 [32:04<00:40,  1.63s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00355, train/loss_vlb_step=1.86e-5, train/loss_step=0.00355, global_step=6335.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  98%|█████████▊| 1184/1208 [32:07<00:39,  1.63s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00355, train/loss_vlb_step=1.86e-5, train/loss_step=0.00355, global_step=6335.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  98%|█████████▊| 1184/1208 [32:07<00:39,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0631, train/loss_vlb_step=0.000214, train/loss_step=0.0631, global_step=6335.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  98%|█████████▊| 1185/1208 [32:08<00:37,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0631, train/loss_vlb_step=0.000214, train/loss_step=0.0631, global_step=6335.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  98%|█████████▊| 1185/1208 [32:08<00:37,  1.63s/it, loss=0.118, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000667, train/loss_step=0.183, global_step=6336.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20:  98%|█████████▊| 1186/1208 [32:09<00:35,  1.63s/it, loss=0.118, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000667, train/loss_step=0.183, global_step=6336.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  98%|█████████▊| 1186/1208 [32:09<00:35,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.29e-5, train/loss_step=0.0118, global_step=6336.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  98%|█████████▊| 1187/1208 [32:10<00:34,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.29e-5, train/loss_step=0.0118, global_step=6336.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  98%|█████████▊| 1187/1208 [32:10<00:34,  1.63s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000109, train/loss_step=0.0272, global_step=6336.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  98%|█████████▊| 1188/1208 [32:13<00:32,  1.63s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000109, train/loss_step=0.0272, global_step=6336.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  98%|█████████▊| 1188/1208 [32:13<00:32,  1.63s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=8.91e-5, train/loss_step=0.0218, global_step=6336.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  98%|█████████▊| 1189/1208 [32:14<00:30,  1.63s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=8.91e-5, train/loss_step=0.0218, global_step=6336.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  98%|█████████▊| 1189/1208 [32:14<00:30,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.461, train/loss_vlb_step=0.00472, train/loss_step=0.461, global_step=6337.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  99%|█████████▊| 1190/1208 [32:15<00:29,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.461, train/loss_vlb_step=0.00472, train/loss_step=0.461, global_step=6337.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  99%|█████████▊| 1190/1208 [32:15<00:29,  1.63s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.37e-5, train/loss_step=0.0201, global_step=6337.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  99%|█████████▊| 1191/1208 [32:16<00:27,  1.63s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.37e-5, train/loss_step=0.0201, global_step=6337.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  99%|█████████▊| 1191/1208 [32:16<00:27,  1.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00258, train/loss_step=0.353, global_step=6337.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  99%|█████████▊| 1192/1208 [32:18<00:26,  1.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00258, train/loss_step=0.353, global_step=6337.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  99%|█████████▊| 1192/1208 [32:18<00:26,  1.63s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000131, train/loss_step=0.0345, global_step=6337.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  99%|█████████▉| 1193/1208 [32:19<00:24,  1.63s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000131, train/loss_step=0.0345, global_step=6337.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  99%|█████████▉| 1193/1208 [32:19<00:24,  1.63s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0591, train/loss_vlb_step=0.000205, train/loss_step=0.0591, global_step=6338.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  99%|█████████▉| 1194/1208 [32:20<00:22,  1.63s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0591, train/loss_vlb_step=0.000205, train/loss_step=0.0591, global_step=6338.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  99%|█████████▉| 1194/1208 [32:20<00:22,  1.63s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0093, train/loss_vlb_step=4.43e-5, train/loss_step=0.0093, global_step=6338.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  99%|█████████▉| 1195/1208 [32:22<00:21,  1.63s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0093, train/loss_vlb_step=4.43e-5, train/loss_step=0.0093, global_step=6338.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  99%|█████████▉| 1195/1208 [32:22<00:21,  1.63s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.6e-5, train/loss_step=0.0213, global_step=6338.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  99%|█████████▉| 1196/1208 [32:24<00:19,  1.63s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.6e-5, train/loss_step=0.0213, global_step=6338.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  99%|█████████▉| 1196/1208 [32:24<00:19,  1.63s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0692, train/loss_vlb_step=0.000238, train/loss_step=0.0692, global_step=6338.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  99%|█████████▉| 1197/1208 [32:25<00:17,  1.63s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0692, train/loss_vlb_step=0.000238, train/loss_step=0.0692, global_step=6338.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  99%|█████████▉| 1197/1208 [32:25<00:17,  1.63s/it, loss=0.138, v_num=0, train/loss_simple_step=0.566, train/loss_vlb_step=0.00977, train/loss_step=0.566, global_step=6339.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]   Epoch 20:  99%|█████████▉| 1198/1208 [32:26<00:16,  1.63s/it, loss=0.138, v_num=0, train/loss_simple_step=0.566, train/loss_vlb_step=0.00977, train/loss_step=0.566, global_step=6339.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  99%|█████████▉| 1198/1208 [32:26<00:16,  1.63s/it, loss=0.141, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000377, train/loss_step=0.114, global_step=6339.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  99%|█████████▉| 1199/1208 [32:27<00:14,  1.62s/it, loss=0.141, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000377, train/loss_step=0.114, global_step=6339.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  99%|█████████▉| 1199/1208 [32:27<00:14,  1.62s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0572, train/loss_vlb_step=0.0002, train/loss_step=0.0572, global_step=6339.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20:  99%|█████████▉| 1200/1208 [32:30<00:13,  1.63s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0572, train/loss_vlb_step=0.0002, train/loss_step=0.0572, global_step=6339.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  99%|█████████▉| 1200/1208 [32:30<00:13,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00144, train/loss_step=0.298, global_step=6339.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.85it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.84it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.84it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:25,  1.86it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.84it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.85it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.85it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.85it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.83it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.85it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.83it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.85it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.85it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.85it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.84it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.85it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.84it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.84it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.83it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.85it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.84it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.85it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.84it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.84it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.84it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.84it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.84it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.84it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.84it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.85it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.84it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.85it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.84it/s][ADDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.84it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.84it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.84it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.84it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.84it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.84it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.85it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.84it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:12,  1.85it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.83it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.85it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.85it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.84it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.84it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.83it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.84it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.83it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.84it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]DDIM Sampler:  70%|███████   | 35/50 [00:18<00:08,  1.83it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.84it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.84it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.84it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.83it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.84it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.84it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.83it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.84it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.84it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.83it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.84it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.83it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.84it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.83it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.84it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.84it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.83it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.84it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.84it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.83it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.84it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.84it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.83it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.84it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.83it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.83it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.84it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.83it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:24<00:02,  1.84it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.84it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.78it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.84it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.83it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.84it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.83it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.83it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.84it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.84it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.83it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.83it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]Epoch 20:  99%|█████████▉| 1201/1208 [33:00<00:11,  1.65s/it, loss=0.143, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00144, train/loss_step=0.298, global_step=6339.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20:  99%|█████████▉| 1201/1208 [33:00<00:11,  1.65s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00966, train/loss_vlb_step=4.53e-5, train/loss_step=0.00966, global_step=6340.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20: 100%|█████████▉| 1202/1208 [33:01<00:09,  1.65s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00966, train/loss_vlb_step=4.53e-5, train/loss_step=0.00966, global_step=6340.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20: 100%|█████████▉| 1202/1208 [33:01<00:09,  1.65s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00974, train/loss_vlb_step=4.55e-5, train/loss_step=0.00974, global_step=6340.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20: 100%|█████████▉| 1203/1208 [33:02<00:08,  1.65s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00974, train/loss_vlb_step=4.55e-5, train/loss_step=0.00974, global_step=6340.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20: 100%|█████████▉| 1203/1208 [33:02<00:08,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000419, train/loss_step=0.127, global_step=6340.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]  Epoch 20: 100%|█████████▉| 1204/1208 [33:05<00:06,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000419, train/loss_step=0.127, global_step=6340.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20: 100%|█████████▉| 1204/1208 [33:05<00:06,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0641, train/loss_vlb_step=0.00022, train/loss_step=0.0641, global_step=6340.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20: 100%|█████████▉| 1205/1208 [33:06<00:04,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0641, train/loss_vlb_step=0.00022, train/loss_step=0.0641, global_step=6340.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20: 100%|█████████▉| 1205/1208 [33:06<00:04,  1.65s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0609, train/loss_vlb_step=0.00021, train/loss_step=0.0609, global_step=6341.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20: 100%|█████████▉| 1206/1208 [33:07<00:03,  1.65s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0609, train/loss_vlb_step=0.00021, train/loss_step=0.0609, global_step=6341.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20: 100%|█████████▉| 1206/1208 [33:07<00:03,  1.65s/it, loss=0.132, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00112, train/loss_step=0.252, global_step=6341.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] Epoch 20: 100%|█████████▉| 1207/1208 [33:08<00:01,  1.65s/it, loss=0.132, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00112, train/loss_step=0.252, global_step=6341.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20: 100%|█████████▉| 1207/1208 [33:08<00:01,  1.65s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00702, train/loss_vlb_step=3.45e-5, train/loss_step=0.00702, global_step=6341.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20: 100%|██████████| 1208/1208 [33:12<00:00,  1.65s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00702, train/loss_vlb_step=3.45e-5, train/loss_step=0.00702, global_step=6341.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 20: 100%|██████████| 1208/1208 [33:12<00:00,  1.65s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.000239, train/loss_step=0.0702, global_step=6341.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142] 
+
+
+Epoch 20:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.133, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.000239, train/loss_step=0.0702, global_step=6341.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]           Epoch 21:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.133, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.000239, train/loss_step=0.0702, global_step=6341.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][AData shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.86it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.85it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:25,  1.85it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.85it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.85it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.84it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.85it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.85it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.85it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.84it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.85it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.85it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.86it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.85it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.85it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.85it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.85it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.86it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.85it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.85it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.85it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.85it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.85it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.85it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:19,  1.85it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:19,  1.86it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.85it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.85it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:18,  1.85it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:18,  1.85it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.85it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.85it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.85it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.85it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.85it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.85it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.85it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.85it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.84it/s][ADDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.85it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.85it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.85it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.85it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.85it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.85it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:12<00:14,  1.84it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:12<00:14,  1.85it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.85it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.85it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:12,  1.85it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:12,  1.85it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.83it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.85it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.83it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.83it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.85it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.83it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.85it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.83it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.85it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.85it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.84it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.83it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.84it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.85it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.85it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.85it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.83it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:18<00:08,  1.85it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:18<00:08,  1.85it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.84it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.85it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.78it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.84it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.84it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.84it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.84it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.84it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.84it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.82it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.84it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.84it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.84it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.84it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.84it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.85it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.84it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.85it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.84it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.84it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:24<00:02,  1.84it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:24<00:02,  1.84it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.84it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.84it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:25<00:01,  1.84it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.84it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.84it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.84it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.85it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.85it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]Epoch 21:   0%|          | 1/1208 [00:30<10:19:25, 30.79s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.000239, train/loss_step=0.0702, global_step=6341.0, train/loss_simple_epoch=0.142, train/loss_vlb_epoch=0.00271, train/loss_epoch=0.142]Epoch 21:   0%|          | 1/1208 [00:30<10:19:27, 30.79s/it, loss=0.122, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.000983, train/loss_step=0.243, global_step=6342.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:   0%|          | 2/1208 [00:31<5:19:35, 15.90s/it, loss=0.122, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.000983, train/loss_step=0.243, global_step=6342.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:   0%|          | 2/1208 [00:31<5:19:36, 15.90s/it, loss=0.131, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000672, train/loss_step=0.190, global_step=6342.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   0%|          | 3/1208 [00:32<3:39:40, 10.94s/it, loss=0.131, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000672, train/loss_step=0.190, global_step=6342.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   0%|          | 3/1208 [00:32<3:39:40, 10.94s/it, loss=0.131, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00213, train/loss_step=0.354, global_step=6342.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:   0%|          | 4/1208 [00:35<2:58:39,  8.90s/it, loss=0.131, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00213, train/loss_step=0.354, global_step=6342.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   0%|          | 4/1208 [00:35<2:58:39,  8.90s/it, loss=0.136, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000479, train/loss_step=0.143, global_step=6342.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   0%|          | 5/1208 [00:36<2:26:51,  7.32s/it, loss=0.136, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000479, train/loss_step=0.143, global_step=6342.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   0%|          | 5/1208 [00:36<2:26:51,  7.32s/it, loss=0.151, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00191, train/loss_step=0.364, global_step=6343.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:   0%|          | 6/1208 [00:37<2:05:38,  6.27s/it, loss=0.151, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00191, train/loss_step=0.364, global_step=6343.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   0%|          | 6/1208 [00:37<2:05:38,  6.27s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.35e-5, train/loss_step=0.00233, global_step=6343.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   1%|          | 7/1208 [00:38<1:50:28,  5.52s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.35e-5, train/loss_step=0.00233, global_step=6343.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   1%|          | 7/1208 [00:38<1:50:28,  5.52s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000113, train/loss_step=0.0284, global_step=6343.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:   1%|          | 8/1208 [00:41<1:43:49,  5.19s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000113, train/loss_step=0.0284, global_step=6343.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   1%|          | 8/1208 [00:41<1:43:49,  5.19s/it, loss=0.153, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=6343.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:   1%|          | 9/1208 [00:42<1:34:28,  4.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=6343.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   1%|          | 9/1208 [00:42<1:34:28,  4.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000707, train/loss_step=0.196, global_step=6344.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   1%|          | 10/1208 [00:43<1:26:58,  4.36s/it, loss=0.135, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000707, train/loss_step=0.196, global_step=6344.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   1%|          | 10/1208 [00:43<1:26:58,  4.36s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.01e-5, train/loss_step=0.0179, global_step=6344.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   1%|          | 11/1208 [00:44<1:20:48,  4.05s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.01e-5, train/loss_step=0.0179, global_step=6344.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   1%|          | 11/1208 [00:44<1:20:49,  4.05s/it, loss=0.144, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00201, train/loss_step=0.337, global_step=6344.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:   1%|          | 12/1208 [00:47<1:18:48,  3.95s/it, loss=0.144, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00201, train/loss_step=0.337, global_step=6344.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   1%|          | 12/1208 [00:47<1:18:49,  3.95s/it, loss=0.13, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000106, train/loss_step=0.026, global_step=6344.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   1%|          | 13/1208 [00:48<1:14:14,  3.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000106, train/loss_step=0.026, global_step=6344.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   1%|          | 13/1208 [00:48<1:14:14,  3.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00142, train/loss_step=0.339, global_step=6345.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   1%|          | 14/1208 [00:49<1:10:19,  3.53s/it, loss=0.147, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00142, train/loss_step=0.339, global_step=6345.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   1%|          | 14/1208 [00:49<1:10:19,  3.53s/it, loss=0.161, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00158, train/loss_step=0.301, global_step=6345.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   1%|          | 15/1208 [00:50<1:06:55,  3.37s/it, loss=0.161, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00158, train/loss_step=0.301, global_step=6345.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   1%|          | 15/1208 [00:50<1:06:55,  3.37s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.000155, train/loss_step=0.0441, global_step=6345.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   1%|▏         | 16/1208 [00:53<1:06:15,  3.33s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.000155, train/loss_step=0.0441, global_step=6345.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   1%|▏         | 16/1208 [00:53<1:06:15,  3.33s/it, loss=0.159, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000348, train/loss_step=0.105, global_step=6345.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:   1%|▏         | 17/1208 [00:54<1:03:29,  3.20s/it, loss=0.159, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000348, train/loss_step=0.105, global_step=6345.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   1%|▏         | 17/1208 [00:54<1:03:29,  3.20s/it, loss=0.166, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000686, train/loss_step=0.195, global_step=6346.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   1%|▏         | 18/1208 [00:55<1:01:00,  3.08s/it, loss=0.166, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000686, train/loss_step=0.195, global_step=6346.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   1%|▏         | 18/1208 [00:55<1:01:00,  3.08s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.86e-5, train/loss_step=0.0105, global_step=6346.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   2%|▏         | 19/1208 [00:56<58:48,  2.97s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.86e-5, train/loss_step=0.0105, global_step=6346.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:   2%|▏         | 19/1208 [00:56<58:48,  2.97s/it, loss=0.164, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000772, train/loss_step=0.215, global_step=6346.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:   2%|▏         | 20/1208 [00:59<58:40,  2.96s/it, loss=0.164, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000772, train/loss_step=0.215, global_step=6346.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   2%|▏         | 20/1208 [00:59<58:40,  2.96s/it, loss=0.167, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000441, train/loss_step=0.131, global_step=6346.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   2%|▏         | 21/1208 [01:00<56:47,  2.87s/it, loss=0.167, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000441, train/loss_step=0.131, global_step=6346.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   2%|▏         | 21/1208 [01:00<56:48,  2.87s/it, loss=0.18, v_num=0, train/loss_simple_step=0.507, train/loss_vlb_step=0.00571, train/loss_step=0.507, global_step=6347.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:   2%|▏         | 22/1208 [01:01<55:04,  2.79s/it, loss=0.18, v_num=0, train/loss_simple_step=0.507, train/loss_vlb_step=0.00571, train/loss_step=0.507, global_step=6347.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   2%|▏         | 22/1208 [01:01<55:04,  2.79s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0983, train/loss_vlb_step=0.000323, train/loss_step=0.0983, global_step=6347.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   2%|▏         | 23/1208 [01:02<53:30,  2.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0983, train/loss_vlb_step=0.000323, train/loss_step=0.0983, global_step=6347.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   2%|▏         | 23/1208 [01:02<53:30,  2.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00538, train/loss_vlb_step=2.87e-5, train/loss_step=0.00538, global_step=6347.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   2%|▏         | 24/1208 [01:05<53:36,  2.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00538, train/loss_vlb_step=2.87e-5, train/loss_step=0.00538, global_step=6347.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   2%|▏         | 24/1208 [01:05<53:36,  2.72s/it, loss=0.198, v_num=0, train/loss_simple_step=0.925, train/loss_vlb_step=0.465, train/loss_step=0.925, global_step=6347.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]      Epoch 21:   2%|▏         | 25/1208 [01:06<52:13,  2.65s/it, loss=0.198, v_num=0, train/loss_simple_step=0.925, train/loss_vlb_step=0.465, train/loss_step=0.925, global_step=6347.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   2%|▏         | 25/1208 [01:06<52:13,  2.65s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0619, train/loss_vlb_step=0.000212, train/loss_step=0.0619, global_step=6348.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   2%|▏         | 26/1208 [01:07<50:56,  2.59s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0619, train/loss_vlb_step=0.000212, train/loss_step=0.0619, global_step=6348.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   2%|▏         | 26/1208 [01:07<50:56,  2.59s/it, loss=0.196, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00119, train/loss_step=0.271, global_step=6348.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:   2%|▏         | 27/1208 [01:08<49:45,  2.53s/it, loss=0.196, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00119, train/loss_step=0.271, global_step=6348.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   2%|▏         | 27/1208 [01:08<49:45,  2.53s/it, loss=0.213, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00276, train/loss_step=0.378, global_step=6348.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   2%|▏         | 28/1208 [01:11<49:57,  2.54s/it, loss=0.213, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00276, train/loss_step=0.378, global_step=6348.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   2%|▏         | 28/1208 [01:11<49:57,  2.54s/it, loss=0.209, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.33e-5, train/loss_step=0.0168, global_step=6348.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   2%|▏         | 29/1208 [01:12<48:54,  2.49s/it, loss=0.209, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.33e-5, train/loss_step=0.0168, global_step=6348.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   2%|▏         | 29/1208 [01:12<48:54,  2.49s/it, loss=0.215, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00148, train/loss_step=0.306, global_step=6349.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:   2%|▏         | 30/1208 [01:13<47:53,  2.44s/it, loss=0.215, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00148, train/loss_step=0.306, global_step=6349.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   2%|▏         | 30/1208 [01:13<47:53,  2.44s/it, loss=0.214, v_num=0, train/loss_simple_step=0.00355, train/loss_vlb_step=1.91e-5, train/loss_step=0.00355, global_step=6349.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   3%|▎         | 31/1208 [01:14<46:57,  2.39s/it, loss=0.214, v_num=0, train/loss_simple_step=0.00355, train/loss_vlb_step=1.91e-5, train/loss_step=0.00355, global_step=6349.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   3%|▎         | 31/1208 [01:14<46:57,  2.39s/it, loss=0.219, v_num=0, train/loss_simple_step=0.441, train/loss_vlb_step=0.00378, train/loss_step=0.441, global_step=6349.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:   3%|▎         | 32/1208 [01:17<47:11,  2.41s/it, loss=0.219, v_num=0, train/loss_simple_step=0.441, train/loss_vlb_step=0.00378, train/loss_step=0.441, global_step=6349.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   3%|▎         | 32/1208 [01:17<47:11,  2.41s/it, loss=0.218, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.64e-5, train/loss_step=0.00288, global_step=6349.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   3%|▎         | 33/1208 [01:18<46:20,  2.37s/it, loss=0.218, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.64e-5, train/loss_step=0.00288, global_step=6349.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   3%|▎         | 33/1208 [01:18<46:20,  2.37s/it, loss=0.202, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.64e-5, train/loss_step=0.015, global_step=6350.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:   3%|▎         | 34/1208 [01:19<45:31,  2.33s/it, loss=0.202, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.64e-5, train/loss_step=0.015, global_step=6350.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   3%|▎         | 34/1208 [01:19<45:31,  2.33s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0586, train/loss_vlb_step=0.000208, train/loss_step=0.0586, global_step=6350.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   3%|▎         | 35/1208 [01:20<44:45,  2.29s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0586, train/loss_vlb_step=0.000208, train/loss_step=0.0586, global_step=6350.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   3%|▎         | 35/1208 [01:20<44:45,  2.29s/it, loss=0.207, v_num=0, train/loss_simple_step=0.387, train/loss_vlb_step=0.00299, train/loss_step=0.387, global_step=6350.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:   3%|▎         | 36/1208 [01:22<45:02,  2.31s/it, loss=0.207, v_num=0, train/loss_simple_step=0.387, train/loss_vlb_step=0.00299, train/loss_step=0.387, global_step=6350.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   3%|▎         | 36/1208 [01:23<45:02,  2.31s/it, loss=0.219, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00192, train/loss_step=0.341, global_step=6350.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   3%|▎         | 37/1208 [01:24<44:19,  2.27s/it, loss=0.219, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00192, train/loss_step=0.341, global_step=6350.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   3%|▎         | 37/1208 [01:24<44:19,  2.27s/it, loss=0.209, v_num=0, train/loss_simple_step=0.00669, train/loss_vlb_step=3.32e-5, train/loss_step=0.00669, global_step=6351.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   3%|▎         | 38/1208 [01:25<43:38,  2.24s/it, loss=0.209, v_num=0, train/loss_simple_step=0.00669, train/loss_vlb_step=3.32e-5, train/loss_step=0.00669, global_step=6351.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   3%|▎         | 38/1208 [01:25<43:38,  2.24s/it, loss=0.222, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.0012, train/loss_step=0.267, global_step=6351.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]     Epoch 21:   3%|▎         | 39/1208 [01:26<42:59,  2.21s/it, loss=0.222, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.0012, train/loss_step=0.267, global_step=6351.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   3%|▎         | 39/1208 [01:26<42:59,  2.21s/it, loss=0.22, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000628, train/loss_step=0.179, global_step=6351.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   3%|▎         | 40/1208 [01:28<43:16,  2.22s/it, loss=0.22, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000628, train/loss_step=0.179, global_step=6351.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   3%|▎         | 40/1208 [01:28<43:16,  2.22s/it, loss=0.242, v_num=0, train/loss_simple_step=0.565, train/loss_vlb_step=0.011, train/loss_step=0.565, global_step=6351.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:   3%|▎         | 41/1208 [01:29<42:40,  2.19s/it, loss=0.242, v_num=0, train/loss_simple_step=0.565, train/loss_vlb_step=0.011, train/loss_step=0.565, global_step=6351.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   3%|▎         | 41/1208 [01:29<42:40,  2.19s/it, loss=0.217, v_num=0, train/loss_simple_step=0.00865, train/loss_vlb_step=4.06e-5, train/loss_step=0.00865, global_step=6352.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   3%|▎         | 42/1208 [01:30<42:05,  2.17s/it, loss=0.217, v_num=0, train/loss_simple_step=0.00865, train/loss_vlb_step=4.06e-5, train/loss_step=0.00865, global_step=6352.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   3%|▎         | 42/1208 [01:30<42:05,  2.17s/it, loss=0.215, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.000216, train/loss_step=0.0598, global_step=6352.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:   4%|▎         | 43/1208 [01:31<41:32,  2.14s/it, loss=0.215, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.000216, train/loss_step=0.0598, global_step=6352.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   4%|▎         | 43/1208 [01:31<41:32,  2.14s/it, loss=0.221, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=6352.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:   4%|▎         | 44/1208 [01:34<41:48,  2.16s/it, loss=0.221, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000402, train/loss_step=0.122, global_step=6352.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   4%|▎         | 44/1208 [01:34<41:48,  2.16s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.58e-5, train/loss_step=0.00278, global_step=6352.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   4%|▎         | 45/1208 [01:35<41:17,  2.13s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.58e-5, train/loss_step=0.00278, global_step=6352.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   4%|▎         | 45/1208 [01:35<41:17,  2.13s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0657, train/loss_vlb_step=0.000223, train/loss_step=0.0657, global_step=6353.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:   4%|▍         | 46/1208 [01:36<40:47,  2.11s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0657, train/loss_vlb_step=0.000223, train/loss_step=0.0657, global_step=6353.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   4%|▍         | 46/1208 [01:36<40:47,  2.11s/it, loss=0.171, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000697, train/loss_step=0.201, global_step=6353.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:   4%|▍         | 47/1208 [01:37<40:17,  2.08s/it, loss=0.171, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000697, train/loss_step=0.201, global_step=6353.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   4%|▍         | 47/1208 [01:37<40:17,  2.08s/it, loss=0.162, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000682, train/loss_step=0.198, global_step=6353.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   4%|▍         | 48/1208 [01:40<40:34,  2.10s/it, loss=0.162, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000682, train/loss_step=0.198, global_step=6353.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   4%|▍         | 48/1208 [01:40<40:34,  2.10s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.000118, train/loss_step=0.0312, global_step=6353.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   4%|▍         | 49/1208 [01:41<40:06,  2.08s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.000118, train/loss_step=0.0312, global_step=6353.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   4%|▍         | 49/1208 [01:41<40:06,  2.08s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.47e-5, train/loss_step=0.00254, global_step=6354.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   4%|▍         | 50/1208 [01:42<39:39,  2.05s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.47e-5, train/loss_step=0.00254, global_step=6354.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   4%|▍         | 50/1208 [01:42<39:39,  2.05s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.84e-5, train/loss_step=0.0243, global_step=6354.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:   4%|▍         | 51/1208 [01:43<39:13,  2.03s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.84e-5, train/loss_step=0.0243, global_step=6354.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   4%|▍         | 51/1208 [01:43<39:13,  2.03s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00688, train/loss_vlb_step=3.37e-5, train/loss_step=0.00688, global_step=6354.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   4%|▍         | 52/1208 [01:46<39:30,  2.05s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00688, train/loss_vlb_step=3.37e-5, train/loss_step=0.00688, global_step=6354.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   4%|▍         | 52/1208 [01:46<39:30,  2.05s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.72e-5, train/loss_step=0.0129, global_step=6354.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:   4%|▍         | 53/1208 [01:47<39:06,  2.03s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.72e-5, train/loss_step=0.0129, global_step=6354.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   4%|▍         | 53/1208 [01:47<39:06,  2.03s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.000181, train/loss_step=0.0527, global_step=6355.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   4%|▍         | 54/1208 [01:48<38:42,  2.01s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.000181, train/loss_step=0.0527, global_step=6355.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   4%|▍         | 54/1208 [01:48<38:42,  2.01s/it, loss=0.134, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000499, train/loss_step=0.150, global_step=6355.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:   5%|▍         | 55/1208 [01:49<38:19,  1.99s/it, loss=0.134, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000499, train/loss_step=0.150, global_step=6355.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   5%|▍         | 55/1208 [01:49<38:19,  1.99s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.48e-5, train/loss_step=0.00255, global_step=6355.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   5%|▍         | 56/1208 [01:52<38:35,  2.01s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.48e-5, train/loss_step=0.00255, global_step=6355.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   5%|▍         | 56/1208 [01:52<38:35,  2.01s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.00669, train/loss_vlb_step=3.21e-5, train/loss_step=0.00669, global_step=6355.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   5%|▍         | 57/1208 [01:53<38:13,  1.99s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.00669, train/loss_vlb_step=3.21e-5, train/loss_step=0.00669, global_step=6355.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   5%|▍         | 57/1208 [01:53<38:13,  1.99s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0678, train/loss_vlb_step=0.000229, train/loss_step=0.0678, global_step=6356.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:   5%|▍         | 58/1208 [01:54<37:51,  1.98s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0678, train/loss_vlb_step=0.000229, train/loss_step=0.0678, global_step=6356.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   5%|▍         | 58/1208 [01:54<37:51,  1.98s/it, loss=0.122, v_num=0, train/loss_simple_step=0.674, train/loss_vlb_step=0.0172, train/loss_step=0.674, global_step=6356.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:   5%|▍         | 59/1208 [01:55<37:30,  1.96s/it, loss=0.122, v_num=0, train/loss_simple_step=0.674, train/loss_vlb_step=0.0172, train/loss_step=0.674, global_step=6356.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   5%|▍         | 59/1208 [01:55<37:30,  1.96s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00435, train/loss_vlb_step=2.38e-5, train/loss_step=0.00435, global_step=6356.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   5%|▍         | 60/1208 [01:58<37:46,  1.97s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00435, train/loss_vlb_step=2.38e-5, train/loss_step=0.00435, global_step=6356.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   5%|▍         | 60/1208 [01:58<37:46,  1.97s/it, loss=0.101, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00173, train/loss_step=0.318, global_step=6356.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:   5%|▌         | 61/1208 [01:59<37:26,  1.96s/it, loss=0.101, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00173, train/loss_step=0.318, global_step=6356.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   5%|▌         | 61/1208 [01:59<37:26,  1.96s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.5e-5, train/loss_step=0.0121, global_step=6357.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   5%|▌         | 62/1208 [02:00<37:07,  1.94s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.5e-5, train/loss_step=0.0121, global_step=6357.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   5%|▌         | 62/1208 [02:00<37:07,  1.94s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.68e-5, train/loss_step=0.0237, global_step=6357.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   5%|▌         | 63/1208 [02:01<36:48,  1.93s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.68e-5, train/loss_step=0.0237, global_step=6357.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   5%|▌         | 63/1208 [02:01<36:48,  1.93s/it, loss=0.0929, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=1.39e-5, train/loss_step=0.00245, global_step=6357.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   5%|▌         | 64/1208 [02:04<37:03,  1.94s/it, loss=0.0929, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=1.39e-5, train/loss_step=0.00245, global_step=6357.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   5%|▌         | 64/1208 [02:04<37:03,  1.94s/it, loss=0.107, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00149, train/loss_step=0.289, global_step=6357.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]     Epoch 21:   5%|▌         | 65/1208 [02:05<36:44,  1.93s/it, loss=0.107, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00149, train/loss_step=0.289, global_step=6357.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   5%|▌         | 65/1208 [02:05<36:44,  1.93s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=3.87e-5, train/loss_step=0.00742, global_step=6358.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   5%|▌         | 66/1208 [02:06<36:26,  1.92s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=3.87e-5, train/loss_step=0.00742, global_step=6358.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   5%|▌         | 66/1208 [02:06<36:26,  1.92s/it, loss=0.1, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000403, train/loss_step=0.123, global_step=6358.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]     Epoch 21:   6%|▌         | 67/1208 [02:07<36:09,  1.90s/it, loss=0.1, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000403, train/loss_step=0.123, global_step=6358.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   6%|▌         | 67/1208 [02:07<36:09,  1.90s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.0638, train/loss_vlb_step=0.000227, train/loss_step=0.0638, global_step=6358.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   6%|▌         | 68/1208 [02:10<36:24,  1.92s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.0638, train/loss_vlb_step=0.000227, train/loss_step=0.0638, global_step=6358.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   6%|▌         | 68/1208 [02:10<36:24,  1.92s/it, loss=0.125, v_num=0, train/loss_simple_step=0.664, train/loss_vlb_step=0.0288, train/loss_step=0.664, global_step=6358.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]     Epoch 21:   6%|▌         | 69/1208 [02:11<36:07,  1.90s/it, loss=0.125, v_num=0, train/loss_simple_step=0.664, train/loss_vlb_step=0.0288, train/loss_step=0.664, global_step=6358.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   6%|▌         | 69/1208 [02:11<36:07,  1.90s/it, loss=0.139, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00127, train/loss_step=0.278, global_step=6359.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   6%|▌         | 70/1208 [02:12<35:50,  1.89s/it, loss=0.139, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00127, train/loss_step=0.278, global_step=6359.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   6%|▌         | 70/1208 [02:12<35:51,  1.89s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00369, train/loss_vlb_step=2.1e-5, train/loss_step=0.00369, global_step=6359.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   6%|▌         | 71/1208 [02:13<35:34,  1.88s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00369, train/loss_vlb_step=2.1e-5, train/loss_step=0.00369, global_step=6359.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   6%|▌         | 71/1208 [02:13<35:35,  1.88s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.36e-5, train/loss_step=0.0118, global_step=6359.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:   6%|▌         | 72/1208 [02:16<35:49,  1.89s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.36e-5, train/loss_step=0.0118, global_step=6359.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   6%|▌         | 72/1208 [02:16<35:49,  1.89s/it, loss=0.147, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000632, train/loss_step=0.185, global_step=6359.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:   6%|▌         | 73/1208 [02:17<35:33,  1.88s/it, loss=0.147, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000632, train/loss_step=0.185, global_step=6359.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   6%|▌         | 73/1208 [02:17<35:34,  1.88s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0593, train/loss_vlb_step=0.000204, train/loss_step=0.0593, global_step=6360.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   6%|▌         | 74/1208 [02:18<35:18,  1.87s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0593, train/loss_vlb_step=0.000204, train/loss_step=0.0593, global_step=6360.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   6%|▌         | 74/1208 [02:18<35:18,  1.87s/it, loss=0.157, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00169, train/loss_step=0.354, global_step=6360.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:   6%|▌         | 75/1208 [02:19<35:03,  1.86s/it, loss=0.157, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00169, train/loss_step=0.354, global_step=6360.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   6%|▌         | 75/1208 [02:19<35:03,  1.86s/it, loss=0.176, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00228, train/loss_step=0.372, global_step=6360.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   6%|▋         | 76/1208 [02:22<35:17,  1.87s/it, loss=0.176, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00228, train/loss_step=0.372, global_step=6360.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   6%|▋         | 76/1208 [02:22<35:17,  1.87s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=8.65e-6, train/loss_step=0.00142, global_step=6360.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   6%|▋         | 77/1208 [02:23<35:02,  1.86s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=8.65e-6, train/loss_step=0.00142, global_step=6360.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   6%|▋         | 77/1208 [02:23<35:02,  1.86s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0597, train/loss_vlb_step=0.000212, train/loss_step=0.0597, global_step=6361.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:   6%|▋         | 78/1208 [02:24<34:48,  1.85s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0597, train/loss_vlb_step=0.000212, train/loss_step=0.0597, global_step=6361.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   6%|▋         | 78/1208 [02:24<34:48,  1.85s/it, loss=0.156, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00128, train/loss_step=0.286, global_step=6361.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:   7%|▋         | 79/1208 [02:25<34:34,  1.84s/it, loss=0.156, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00128, train/loss_step=0.286, global_step=6361.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   7%|▋         | 79/1208 [02:25<34:34,  1.84s/it, loss=0.175, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00291, train/loss_step=0.377, global_step=6361.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   7%|▋         | 80/1208 [02:28<34:47,  1.85s/it, loss=0.175, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00291, train/loss_step=0.377, global_step=6361.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   7%|▋         | 80/1208 [02:28<34:47,  1.85s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=1.66e-5, train/loss_step=0.00295, global_step=6361.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   7%|▋         | 81/1208 [02:29<34:34,  1.84s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=1.66e-5, train/loss_step=0.00295, global_step=6361.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   7%|▋         | 81/1208 [02:29<34:34,  1.84s/it, loss=0.165, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000468, train/loss_step=0.142, global_step=6362.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:   7%|▋         | 82/1208 [02:30<34:20,  1.83s/it, loss=0.165, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000468, train/loss_step=0.142, global_step=6362.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   7%|▋         | 82/1208 [02:30<34:20,  1.83s/it, loss=0.18, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00171, train/loss_step=0.315, global_step=6362.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:   7%|▋         | 83/1208 [02:31<34:07,  1.82s/it, loss=0.18, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00171, train/loss_step=0.315, global_step=6362.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   7%|▋         | 83/1208 [02:31<34:07,  1.82s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.25e-5, train/loss_step=0.0139, global_step=6362.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   7%|▋         | 84/1208 [02:33<34:20,  1.83s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.25e-5, train/loss_step=0.0139, global_step=6362.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   7%|▋         | 84/1208 [02:33<34:20,  1.83s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000174, train/loss_step=0.0484, global_step=6362.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   7%|▋         | 85/1208 [02:34<34:07,  1.82s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000174, train/loss_step=0.0484, global_step=6362.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   7%|▋         | 85/1208 [02:34<34:07,  1.82s/it, loss=0.176, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.00055, train/loss_step=0.163, global_step=6363.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:   7%|▋         | 86/1208 [02:35<33:55,  1.81s/it, loss=0.176, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.00055, train/loss_step=0.163, global_step=6363.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   7%|▋         | 86/1208 [02:35<33:55,  1.81s/it, loss=0.176, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000421, train/loss_step=0.126, global_step=6363.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   7%|▋         | 87/1208 [02:36<33:42,  1.80s/it, loss=0.176, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000421, train/loss_step=0.126, global_step=6363.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   7%|▋         | 87/1208 [02:36<33:42,  1.80s/it, loss=0.179, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=6363.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   7%|▋         | 88/1208 [02:39<33:55,  1.82s/it, loss=0.179, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=6363.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   7%|▋         | 88/1208 [02:39<33:55,  1.82s/it, loss=0.172, v_num=0, train/loss_simple_step=0.523, train/loss_vlb_step=0.00654, train/loss_step=0.523, global_step=6363.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:   7%|▋         | 89/1208 [02:40<33:43,  1.81s/it, loss=0.172, v_num=0, train/loss_simple_step=0.523, train/loss_vlb_step=0.00654, train/loss_step=0.523, global_step=6363.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   7%|▋         | 89/1208 [02:40<33:43,  1.81s/it, loss=0.165, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000477, train/loss_step=0.144, global_step=6364.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   7%|▋         | 90/1208 [02:41<33:31,  1.80s/it, loss=0.165, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000477, train/loss_step=0.144, global_step=6364.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   7%|▋         | 90/1208 [02:41<33:31,  1.80s/it, loss=0.178, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.000965, train/loss_step=0.249, global_step=6364.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   8%|▊         | 91/1208 [02:42<33:20,  1.79s/it, loss=0.178, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.000965, train/loss_step=0.249, global_step=6364.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   8%|▊         | 91/1208 [02:42<33:20,  1.79s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=1.53e-5, train/loss_step=0.00259, global_step=6364.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   8%|▊         | 92/1208 [02:45<33:31,  1.80s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=1.53e-5, train/loss_step=0.00259, global_step=6364.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   8%|▊         | 92/1208 [02:45<33:31,  1.80s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.2e-5, train/loss_step=0.0111, global_step=6364.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:   8%|▊         | 93/1208 [02:46<33:19,  1.79s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.2e-5, train/loss_step=0.0111, global_step=6364.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   8%|▊         | 93/1208 [02:46<33:19,  1.79s/it, loss=0.177, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000878, train/loss_step=0.228, global_step=6365.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   8%|▊         | 94/1208 [02:47<33:08,  1.79s/it, loss=0.177, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000878, train/loss_step=0.228, global_step=6365.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   8%|▊         | 94/1208 [02:47<33:08,  1.79s/it, loss=0.176, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00234, train/loss_step=0.348, global_step=6365.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:   8%|▊         | 95/1208 [02:48<32:57,  1.78s/it, loss=0.176, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00234, train/loss_step=0.348, global_step=6365.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   8%|▊         | 95/1208 [02:48<32:57,  1.78s/it, loss=0.17, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00114, train/loss_step=0.237, global_step=6365.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:   8%|▊         | 96/1208 [02:51<33:09,  1.79s/it, loss=0.17, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00114, train/loss_step=0.237, global_step=6365.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   8%|▊         | 96/1208 [02:51<33:09,  1.79s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=1.88e-5, train/loss_step=0.0034, global_step=6365.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   8%|▊         | 97/1208 [02:52<32:58,  1.78s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=1.88e-5, train/loss_step=0.0034, global_step=6365.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   8%|▊         | 97/1208 [02:52<32:58,  1.78s/it, loss=0.173, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.00042, train/loss_step=0.126, global_step=6366.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:   8%|▊         | 98/1208 [02:53<32:47,  1.77s/it, loss=0.173, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.00042, train/loss_step=0.126, global_step=6366.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   8%|▊         | 98/1208 [02:53<32:47,  1.77s/it, loss=0.164, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.00037, train/loss_step=0.111, global_step=6366.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   8%|▊         | 99/1208 [02:54<32:37,  1.77s/it, loss=0.164, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.00037, train/loss_step=0.111, global_step=6366.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   8%|▊         | 99/1208 [02:54<32:37,  1.77s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6.07e-5, train/loss_step=0.0135, global_step=6366.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   8%|▊         | 100/1208 [02:57<32:48,  1.78s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6.07e-5, train/loss_step=0.0135, global_step=6366.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   8%|▊         | 100/1208 [02:57<32:48,  1.78s/it, loss=0.152, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000396, train/loss_step=0.121, global_step=6366.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:   8%|▊         | 101/1208 [02:58<32:38,  1.77s/it, loss=0.152, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000396, train/loss_step=0.121, global_step=6366.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   8%|▊         | 101/1208 [02:58<32:38,  1.77s/it, loss=0.153, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.00059, train/loss_step=0.166, global_step=6367.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:   8%|▊         | 102/1208 [02:59<32:28,  1.76s/it, loss=0.153, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.00059, train/loss_step=0.166, global_step=6367.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   8%|▊         | 102/1208 [02:59<32:28,  1.76s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=9.23e-5, train/loss_step=0.0223, global_step=6367.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   9%|▊         | 103/1208 [03:00<32:18,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=9.23e-5, train/loss_step=0.0223, global_step=6367.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   9%|▊         | 103/1208 [03:00<32:18,  1.75s/it, loss=0.149, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000808, train/loss_step=0.216, global_step=6367.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:   9%|▊         | 104/1208 [03:03<32:28,  1.76s/it, loss=0.149, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000808, train/loss_step=0.216, global_step=6367.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   9%|▊         | 104/1208 [03:03<32:28,  1.76s/it, loss=0.167, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00339, train/loss_step=0.413, global_step=6367.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:   9%|▊         | 105/1208 [03:04<32:18,  1.76s/it, loss=0.167, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00339, train/loss_step=0.413, global_step=6367.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   9%|▊         | 105/1208 [03:04<32:18,  1.76s/it, loss=0.173, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00143, train/loss_step=0.288, global_step=6368.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   9%|▉         | 106/1208 [03:05<32:09,  1.75s/it, loss=0.173, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00143, train/loss_step=0.288, global_step=6368.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   9%|▉         | 106/1208 [03:05<32:09,  1.75s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00647, train/loss_vlb_step=3.37e-5, train/loss_step=0.00647, global_step=6368.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   9%|▉         | 107/1208 [03:06<32:00,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00647, train/loss_vlb_step=3.37e-5, train/loss_step=0.00647, global_step=6368.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   9%|▉         | 107/1208 [03:06<32:00,  1.74s/it, loss=0.168, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000439, train/loss_step=0.128, global_step=6368.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:   9%|▉         | 108/1208 [03:09<32:09,  1.75s/it, loss=0.168, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000439, train/loss_step=0.128, global_step=6368.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   9%|▉         | 108/1208 [03:09<32:09,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00106, train/loss_step=0.251, global_step=6368.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:   9%|▉         | 109/1208 [03:10<32:00,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00106, train/loss_step=0.251, global_step=6368.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   9%|▉         | 109/1208 [03:10<32:00,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00135, train/loss_step=0.303, global_step=6369.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   9%|▉         | 110/1208 [03:11<31:51,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00135, train/loss_step=0.303, global_step=6369.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   9%|▉         | 110/1208 [03:11<31:51,  1.74s/it, loss=0.16, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000776, train/loss_step=0.198, global_step=6369.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   9%|▉         | 111/1208 [03:12<31:42,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000776, train/loss_step=0.198, global_step=6369.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   9%|▉         | 111/1208 [03:12<31:42,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0793, train/loss_vlb_step=0.000264, train/loss_step=0.0793, global_step=6369.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   9%|▉         | 112/1208 [03:15<31:51,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0793, train/loss_vlb_step=0.000264, train/loss_step=0.0793, global_step=6369.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   9%|▉         | 112/1208 [03:15<31:51,  1.74s/it, loss=0.173, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000716, train/loss_step=0.200, global_step=6369.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:   9%|▉         | 113/1208 [03:16<31:42,  1.74s/it, loss=0.173, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000716, train/loss_step=0.200, global_step=6369.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   9%|▉         | 113/1208 [03:16<31:42,  1.74s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0557, train/loss_vlb_step=0.000194, train/loss_step=0.0557, global_step=6370.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   9%|▉         | 114/1208 [03:17<31:34,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0557, train/loss_vlb_step=0.000194, train/loss_step=0.0557, global_step=6370.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:   9%|▉         | 114/1208 [03:17<31:34,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.32e-5, train/loss_step=0.00218, global_step=6370.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  10%|▉         | 115/1208 [03:18<31:25,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.32e-5, train/loss_step=0.00218, global_step=6370.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  10%|▉         | 115/1208 [03:18<31:25,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00544, train/loss_vlb_step=2.74e-5, train/loss_step=0.00544, global_step=6370.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  10%|▉         | 116/1208 [03:21<31:34,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00544, train/loss_vlb_step=2.74e-5, train/loss_step=0.00544, global_step=6370.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  10%|▉         | 116/1208 [03:21<31:34,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0945, train/loss_vlb_step=0.000318, train/loss_step=0.0945, global_step=6370.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  10%|▉         | 117/1208 [03:22<31:26,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0945, train/loss_vlb_step=0.000318, train/loss_step=0.0945, global_step=6370.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  10%|▉         | 117/1208 [03:22<31:26,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.81e-5, train/loss_step=0.0235, global_step=6371.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  10%|▉         | 118/1208 [03:23<31:17,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.81e-5, train/loss_step=0.0235, global_step=6371.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  10%|▉         | 118/1208 [03:23<31:17,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00223, train/loss_step=0.321, global_step=6371.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  10%|▉         | 119/1208 [03:24<31:09,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00223, train/loss_step=0.321, global_step=6371.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  10%|▉         | 119/1208 [03:24<31:09,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0586, train/loss_vlb_step=0.000196, train/loss_step=0.0586, global_step=6371.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  10%|▉         | 120/1208 [03:27<31:18,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0586, train/loss_vlb_step=0.000196, train/loss_step=0.0586, global_step=6371.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  10%|▉         | 120/1208 [03:27<31:18,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.64e-5, train/loss_step=0.00289, global_step=6371.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  10%|█         | 121/1208 [03:28<31:10,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.64e-5, train/loss_step=0.00289, global_step=6371.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  10%|█         | 121/1208 [03:28<31:10,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.6e-5, train/loss_step=0.0102, global_step=6372.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  10%|█         | 122/1208 [03:29<31:02,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.6e-5, train/loss_step=0.0102, global_step=6372.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  10%|█         | 122/1208 [03:29<31:02,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0062, train/loss_vlb_step=3.22e-5, train/loss_step=0.0062, global_step=6372.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  10%|█         | 123/1208 [03:30<30:54,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0062, train/loss_vlb_step=3.22e-5, train/loss_step=0.0062, global_step=6372.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  10%|█         | 123/1208 [03:30<30:54,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0552, train/loss_vlb_step=0.000194, train/loss_step=0.0552, global_step=6372.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  10%|█         | 124/1208 [03:33<31:02,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0552, train/loss_vlb_step=0.000194, train/loss_step=0.0552, global_step=6372.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  10%|█         | 124/1208 [03:33<31:02,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000856, train/loss_step=0.233, global_step=6372.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  10%|█         | 125/1208 [03:34<30:55,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000856, train/loss_step=0.233, global_step=6372.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  10%|█         | 125/1208 [03:34<30:55,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00255, train/loss_step=0.381, global_step=6373.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  10%|█         | 126/1208 [03:35<30:47,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00255, train/loss_step=0.381, global_step=6373.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  10%|█         | 126/1208 [03:35<30:47,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000147, train/loss_step=0.0392, global_step=6373.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  11%|█         | 127/1208 [03:36<30:39,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000147, train/loss_step=0.0392, global_step=6373.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  11%|█         | 127/1208 [03:36<30:39,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000437, train/loss_step=0.128, global_step=6373.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  11%|█         | 128/1208 [03:39<30:47,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000437, train/loss_step=0.128, global_step=6373.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  11%|█         | 128/1208 [03:39<30:47,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000458, train/loss_step=0.135, global_step=6373.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  11%|█         | 129/1208 [03:40<30:40,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000458, train/loss_step=0.135, global_step=6373.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  11%|█         | 129/1208 [03:40<30:40,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00307, train/loss_step=0.390, global_step=6374.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  11%|█         | 130/1208 [03:41<30:32,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00307, train/loss_step=0.390, global_step=6374.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  11%|█         | 130/1208 [03:41<30:32,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0953, train/loss_vlb_step=0.000315, train/loss_step=0.0953, global_step=6374.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  11%|█         | 131/1208 [03:42<30:25,  1.70s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0953, train/loss_vlb_step=0.000315, train/loss_step=0.0953, global_step=6374.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  11%|█         | 131/1208 [03:42<30:25,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00307, train/loss_vlb_step=1.68e-5, train/loss_step=0.00307, global_step=6374.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  11%|█         | 132/1208 [03:44<30:33,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00307, train/loss_vlb_step=1.68e-5, train/loss_step=0.00307, global_step=6374.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  11%|█         | 132/1208 [03:44<30:33,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000753, train/loss_step=0.204, global_step=6374.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  11%|█         | 133/1208 [03:45<30:26,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000753, train/loss_step=0.204, global_step=6374.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  11%|█         | 133/1208 [03:45<30:26,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.93e-5, train/loss_step=0.0108, global_step=6375.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  11%|█         | 134/1208 [03:46<30:18,  1.69s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.93e-5, train/loss_step=0.0108, global_step=6375.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  11%|█         | 134/1208 [03:46<30:18,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0338, train/loss_vlb_step=0.000122, train/loss_step=0.0338, global_step=6375.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  11%|█         | 135/1208 [03:47<30:11,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0338, train/loss_vlb_step=0.000122, train/loss_step=0.0338, global_step=6375.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  11%|█         | 135/1208 [03:47<30:11,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00847, train/loss_vlb_step=3.9e-5, train/loss_step=0.00847, global_step=6375.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  11%|█▏        | 136/1208 [03:50<30:19,  1.70s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00847, train/loss_vlb_step=3.9e-5, train/loss_step=0.00847, global_step=6375.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  11%|█▏        | 136/1208 [03:50<30:19,  1.70s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.54e-5, train/loss_step=0.00278, global_step=6375.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  11%|█▏        | 137/1208 [03:51<30:12,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.54e-5, train/loss_step=0.00278, global_step=6375.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  11%|█▏        | 137/1208 [03:51<30:12,  1.69s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000181, train/loss_step=0.0514, global_step=6376.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  11%|█▏        | 138/1208 [03:52<30:05,  1.69s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000181, train/loss_step=0.0514, global_step=6376.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  11%|█▏        | 138/1208 [03:52<30:05,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000652, train/loss_step=0.183, global_step=6376.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  12%|█▏        | 139/1208 [03:53<29:58,  1.68s/it, loss=0.102, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000652, train/loss_step=0.183, global_step=6376.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  12%|█▏        | 139/1208 [03:53<29:58,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.0021, train/loss_step=0.366, global_step=6376.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  12%|█▏        | 140/1208 [03:56<30:05,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.0021, train/loss_step=0.366, global_step=6376.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  12%|█▏        | 140/1208 [03:56<30:05,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=1.33e-5, train/loss_step=0.00229, global_step=6376.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  12%|█▏        | 141/1208 [03:57<29:59,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=1.33e-5, train/loss_step=0.00229, global_step=6376.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  12%|█▏        | 141/1208 [03:57<29:59,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.51e-5, train/loss_step=0.0216, global_step=6377.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  12%|█▏        | 142/1208 [03:58<29:52,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.51e-5, train/loss_step=0.0216, global_step=6377.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  12%|█▏        | 142/1208 [03:58<29:52,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.000176, train/loss_step=0.0482, global_step=6377.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  12%|█▏        | 143/1208 [03:59<29:45,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.000176, train/loss_step=0.0482, global_step=6377.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  12%|█▏        | 143/1208 [03:59<29:45,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000537, train/loss_step=0.160, global_step=6377.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  12%|█▏        | 144/1208 [04:02<29:52,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000537, train/loss_step=0.160, global_step=6377.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  12%|█▏        | 144/1208 [04:02<29:52,  1.69s/it, loss=0.156, v_num=0, train/loss_simple_step=0.852, train/loss_vlb_step=0.108, train/loss_step=0.852, global_step=6377.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  12%|█▏        | 145/1208 [04:03<29:46,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.852, train/loss_vlb_step=0.108, train/loss_step=0.852, global_step=6377.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  12%|█▏        | 145/1208 [04:03<29:46,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0505, train/loss_vlb_step=0.000187, train/loss_step=0.0505, global_step=6378.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  12%|█▏        | 146/1208 [04:04<29:39,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0505, train/loss_vlb_step=0.000187, train/loss_step=0.0505, global_step=6378.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  12%|█▏        | 146/1208 [04:04<29:39,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.000119, train/loss_step=0.0312, global_step=6378.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  12%|█▏        | 147/1208 [04:05<29:33,  1.67s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.000119, train/loss_step=0.0312, global_step=6378.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  12%|█▏        | 147/1208 [04:05<29:33,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=6378.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  12%|█▏        | 148/1208 [04:08<29:40,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=6378.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  12%|█▏        | 148/1208 [04:08<29:40,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00119, train/loss_step=0.279, global_step=6378.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  12%|█▏        | 149/1208 [04:09<29:33,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00119, train/loss_step=0.279, global_step=6378.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  12%|█▏        | 149/1208 [04:09<29:33,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000611, train/loss_step=0.178, global_step=6379.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  12%|█▏        | 150/1208 [04:10<29:27,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000611, train/loss_step=0.178, global_step=6379.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  12%|█▏        | 150/1208 [04:10<29:27,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00128, train/loss_step=0.274, global_step=6379.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  12%|█▎        | 151/1208 [04:11<29:21,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00128, train/loss_step=0.274, global_step=6379.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  12%|█▎        | 151/1208 [04:11<29:21,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000736, train/loss_step=0.197, global_step=6379.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  13%|█▎        | 152/1208 [04:14<29:27,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000736, train/loss_step=0.197, global_step=6379.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  13%|█▎        | 152/1208 [04:14<29:27,  1.67s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000104, train/loss_step=0.0267, global_step=6379.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  13%|█▎        | 153/1208 [04:15<29:21,  1.67s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000104, train/loss_step=0.0267, global_step=6379.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  13%|█▎        | 153/1208 [04:15<29:21,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000767, train/loss_step=0.205, global_step=6380.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  13%|█▎        | 154/1208 [04:16<29:15,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000767, train/loss_step=0.205, global_step=6380.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  13%|█▎        | 154/1208 [04:16<29:15,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000173, train/loss_step=0.0474, global_step=6380.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  13%|█▎        | 155/1208 [04:17<29:09,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000173, train/loss_step=0.0474, global_step=6380.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  13%|█▎        | 155/1208 [04:17<29:09,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00673, train/loss_vlb_step=3.25e-5, train/loss_step=0.00673, global_step=6380.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  13%|█▎        | 156/1208 [04:20<29:15,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00673, train/loss_vlb_step=3.25e-5, train/loss_step=0.00673, global_step=6380.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  13%|█▎        | 156/1208 [04:20<29:15,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000244, train/loss_step=0.0732, global_step=6380.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  13%|█▎        | 157/1208 [04:21<29:09,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000244, train/loss_step=0.0732, global_step=6380.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  13%|█▎        | 157/1208 [04:21<29:09,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000524, train/loss_step=0.156, global_step=6381.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  13%|█▎        | 158/1208 [04:22<29:03,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000524, train/loss_step=0.156, global_step=6381.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  13%|█▎        | 158/1208 [04:22<29:03,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000387, train/loss_step=0.117, global_step=6381.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  13%|█▎        | 159/1208 [04:23<28:57,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000387, train/loss_step=0.117, global_step=6381.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  13%|█▎        | 159/1208 [04:23<28:57,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000589, train/loss_step=0.165, global_step=6381.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  13%|█▎        | 160/1208 [04:26<29:04,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000589, train/loss_step=0.165, global_step=6381.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  13%|█▎        | 160/1208 [04:26<29:04,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00773, train/loss_vlb_step=3.7e-5, train/loss_step=0.00773, global_step=6381.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  13%|█▎        | 161/1208 [04:27<28:58,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00773, train/loss_vlb_step=3.7e-5, train/loss_step=0.00773, global_step=6381.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  13%|█▎        | 161/1208 [04:27<28:58,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000447, train/loss_step=0.133, global_step=6382.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  13%|█▎        | 162/1208 [04:28<28:52,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000447, train/loss_step=0.133, global_step=6382.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  13%|█▎        | 162/1208 [04:28<28:52,  1.66s/it, loss=0.164, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000869, train/loss_step=0.205, global_step=6382.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  13%|█▎        | 163/1208 [04:29<28:46,  1.65s/it, loss=0.164, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000869, train/loss_step=0.205, global_step=6382.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  13%|█▎        | 163/1208 [04:29<28:46,  1.65s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.94e-5, train/loss_step=0.0108, global_step=6382.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  14%|█▎        | 164/1208 [04:32<28:53,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.94e-5, train/loss_step=0.0108, global_step=6382.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  14%|█▎        | 164/1208 [04:32<28:53,  1.66s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00408, train/loss_vlb_step=2.16e-5, train/loss_step=0.00408, global_step=6382.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  14%|█▎        | 165/1208 [04:33<28:47,  1.66s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00408, train/loss_vlb_step=2.16e-5, train/loss_step=0.00408, global_step=6382.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  14%|█▎        | 165/1208 [04:33<28:47,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.0014, train/loss_step=0.302, global_step=6383.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]     Epoch 21:  14%|█▎        | 166/1208 [04:34<28:41,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.0014, train/loss_step=0.302, global_step=6383.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  14%|█▎        | 166/1208 [04:34<28:41,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.15e-5, train/loss_step=0.0234, global_step=6383.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  14%|█▍        | 167/1208 [04:35<28:35,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.15e-5, train/loss_step=0.0234, global_step=6383.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  14%|█▍        | 167/1208 [04:35<28:35,  1.65s/it, loss=0.127, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.00039, train/loss_step=0.119, global_step=6383.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  14%|█▍        | 168/1208 [04:38<28:41,  1.66s/it, loss=0.127, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.00039, train/loss_step=0.119, global_step=6383.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  14%|█▍        | 168/1208 [04:38<28:41,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00127, train/loss_step=0.254, global_step=6383.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  14%|█▍        | 169/1208 [04:39<28:36,  1.65s/it, loss=0.125, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00127, train/loss_step=0.254, global_step=6383.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  14%|█▍        | 169/1208 [04:39<28:36,  1.65s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=1.13e-5, train/loss_step=0.0019, global_step=6384.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  14%|█▍        | 170/1208 [04:40<28:30,  1.65s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=1.13e-5, train/loss_step=0.0019, global_step=6384.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  14%|█▍        | 170/1208 [04:40<28:30,  1.65s/it, loss=0.114, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000856, train/loss_step=0.233, global_step=6384.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  14%|█▍        | 171/1208 [04:41<28:25,  1.64s/it, loss=0.114, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000856, train/loss_step=0.233, global_step=6384.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  14%|█▍        | 171/1208 [04:41<28:25,  1.64s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0734, train/loss_vlb_step=0.000245, train/loss_step=0.0734, global_step=6384.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  14%|█▍        | 172/1208 [04:44<28:30,  1.65s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0734, train/loss_vlb_step=0.000245, train/loss_step=0.0734, global_step=6384.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  14%|█▍        | 172/1208 [04:44<28:31,  1.65s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.000214, train/loss_step=0.0615, global_step=6384.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  14%|█▍        | 173/1208 [04:45<28:25,  1.65s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.000214, train/loss_step=0.0615, global_step=6384.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  14%|█▍        | 173/1208 [04:45<28:25,  1.65s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0583, train/loss_vlb_step=0.000202, train/loss_step=0.0583, global_step=6385.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  14%|█▍        | 174/1208 [04:46<28:20,  1.64s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0583, train/loss_vlb_step=0.000202, train/loss_step=0.0583, global_step=6385.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  14%|█▍        | 174/1208 [04:46<28:20,  1.64s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000136, train/loss_step=0.0373, global_step=6385.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  14%|█▍        | 175/1208 [04:47<28:14,  1.64s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000136, train/loss_step=0.0373, global_step=6385.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  14%|█▍        | 175/1208 [04:47<28:14,  1.64s/it, loss=0.117, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00158, train/loss_step=0.311, global_step=6385.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  15%|█▍        | 176/1208 [04:49<28:20,  1.65s/it, loss=0.117, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00158, train/loss_step=0.311, global_step=6385.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  15%|█▍        | 176/1208 [04:49<28:20,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00143, train/loss_step=0.302, global_step=6385.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  15%|█▍        | 177/1208 [04:51<28:15,  1.64s/it, loss=0.129, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00143, train/loss_step=0.302, global_step=6385.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  15%|█▍        | 177/1208 [04:51<28:15,  1.64s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00579, train/loss_vlb_step=2.87e-5, train/loss_step=0.00579, global_step=6386.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  15%|█▍        | 178/1208 [04:52<28:09,  1.64s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00579, train/loss_vlb_step=2.87e-5, train/loss_step=0.00579, global_step=6386.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  15%|█▍        | 178/1208 [04:52<28:09,  1.64s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.44e-5, train/loss_step=0.0119, global_step=6386.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  15%|█▍        | 179/1208 [04:53<28:04,  1.64s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.44e-5, train/loss_step=0.0119, global_step=6386.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  15%|█▍        | 179/1208 [04:53<28:04,  1.64s/it, loss=0.109, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.47e-5, train/loss_step=0.021, global_step=6386.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  15%|█▍        | 180/1208 [04:55<28:10,  1.64s/it, loss=0.109, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.47e-5, train/loss_step=0.021, global_step=6386.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  15%|█▍        | 180/1208 [04:55<28:10,  1.64s/it, loss=0.117, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000557, train/loss_step=0.165, global_step=6386.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  15%|█▍        | 181/1208 [04:56<28:04,  1.64s/it, loss=0.117, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000557, train/loss_step=0.165, global_step=6386.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  15%|█▍        | 181/1208 [04:56<28:04,  1.64s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000102, train/loss_step=0.0255, global_step=6387.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  15%|█▌        | 182/1208 [04:57<27:59,  1.64s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000102, train/loss_step=0.0255, global_step=6387.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  15%|█▌        | 182/1208 [04:57<27:59,  1.64s/it, loss=0.13, v_num=0, train/loss_simple_step=0.580, train/loss_vlb_step=0.0155, train/loss_step=0.580, global_step=6387.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]     Epoch 21:  15%|█▌        | 183/1208 [04:58<27:54,  1.63s/it, loss=0.13, v_num=0, train/loss_simple_step=0.580, train/loss_vlb_step=0.0155, train/loss_step=0.580, global_step=6387.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  15%|█▌        | 183/1208 [04:58<27:54,  1.63s/it, loss=0.136, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.00043, train/loss_step=0.126, global_step=6387.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  15%|█▌        | 184/1208 [05:01<27:59,  1.64s/it, loss=0.136, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.00043, train/loss_step=0.126, global_step=6387.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  15%|█▌        | 184/1208 [05:01<27:59,  1.64s/it, loss=0.149, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00116, train/loss_step=0.274, global_step=6387.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  15%|█▌        | 185/1208 [05:02<27:54,  1.64s/it, loss=0.149, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00116, train/loss_step=0.274, global_step=6387.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  15%|█▌        | 185/1208 [05:02<27:54,  1.64s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.7e-5, train/loss_step=0.0127, global_step=6388.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  15%|█▌        | 186/1208 [05:03<27:49,  1.63s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.7e-5, train/loss_step=0.0127, global_step=6388.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  15%|█▌        | 186/1208 [05:03<27:49,  1.63s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00864, train/loss_vlb_step=3.96e-5, train/loss_step=0.00864, global_step=6388.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  15%|█▌        | 187/1208 [05:04<27:44,  1.63s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00864, train/loss_vlb_step=3.96e-5, train/loss_step=0.00864, global_step=6388.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  15%|█▌        | 187/1208 [05:04<27:44,  1.63s/it, loss=0.144, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00186, train/loss_step=0.317, global_step=6388.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  16%|█▌        | 188/1208 [05:07<27:49,  1.64s/it, loss=0.144, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00186, train/loss_step=0.317, global_step=6388.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  16%|█▌        | 188/1208 [05:07<27:49,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.9e-5, train/loss_step=0.00351, global_step=6388.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  16%|█▌        | 189/1208 [05:08<27:44,  1.63s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.9e-5, train/loss_step=0.00351, global_step=6388.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  16%|█▌        | 189/1208 [05:08<27:44,  1.63s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0827, train/loss_vlb_step=0.000275, train/loss_step=0.0827, global_step=6389.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  16%|█▌        | 190/1208 [05:09<27:39,  1.63s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0827, train/loss_vlb_step=0.000275, train/loss_step=0.0827, global_step=6389.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  16%|█▌        | 190/1208 [05:09<27:39,  1.63s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.49e-5, train/loss_step=0.0208, global_step=6389.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  16%|█▌        | 191/1208 [05:10<27:34,  1.63s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.49e-5, train/loss_step=0.0208, global_step=6389.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  16%|█▌        | 191/1208 [05:10<27:34,  1.63s/it, loss=0.129, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000524, train/loss_step=0.153, global_step=6389.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  16%|█▌        | 192/1208 [05:13<27:39,  1.63s/it, loss=0.129, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000524, train/loss_step=0.153, global_step=6389.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  16%|█▌        | 192/1208 [05:13<27:39,  1.63s/it, loss=0.135, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000698, train/loss_step=0.181, global_step=6389.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  16%|█▌        | 193/1208 [05:14<27:35,  1.63s/it, loss=0.135, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000698, train/loss_step=0.181, global_step=6389.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  16%|█▌        | 193/1208 [05:14<27:35,  1.63s/it, loss=0.138, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000417, train/loss_step=0.127, global_step=6390.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  16%|█▌        | 194/1208 [05:15<27:30,  1.63s/it, loss=0.138, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000417, train/loss_step=0.127, global_step=6390.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  16%|█▌        | 194/1208 [05:15<27:30,  1.63s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00815, train/loss_vlb_step=3.72e-5, train/loss_step=0.00815, global_step=6390.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  16%|█▌        | 195/1208 [05:16<27:25,  1.62s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00815, train/loss_vlb_step=3.72e-5, train/loss_step=0.00815, global_step=6390.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  16%|█▌        | 195/1208 [05:16<27:25,  1.62s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00931, train/loss_vlb_step=4.33e-5, train/loss_step=0.00931, global_step=6390.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  16%|█▌        | 196/1208 [05:19<27:30,  1.63s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00931, train/loss_vlb_step=4.33e-5, train/loss_step=0.00931, global_step=6390.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  16%|█▌        | 196/1208 [05:19<27:30,  1.63s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00339, train/loss_vlb_step=1.89e-5, train/loss_step=0.00339, global_step=6390.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  16%|█▋        | 197/1208 [05:20<27:25,  1.63s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00339, train/loss_vlb_step=1.89e-5, train/loss_step=0.00339, global_step=6390.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  16%|█▋        | 197/1208 [05:20<27:25,  1.63s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.23e-5, train/loss_step=0.00208, global_step=6391.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  16%|█▋        | 198/1208 [05:21<27:20,  1.62s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.23e-5, train/loss_step=0.00208, global_step=6391.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  16%|█▋        | 198/1208 [05:21<27:20,  1.62s/it, loss=0.116, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000752, train/loss_step=0.205, global_step=6391.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  16%|█▋        | 199/1208 [05:22<27:15,  1.62s/it, loss=0.116, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000752, train/loss_step=0.205, global_step=6391.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  16%|█▋        | 199/1208 [05:22<27:15,  1.62s/it, loss=0.121, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=6391.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  17%|█▋        | 200/1208 [05:25<27:20,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=6391.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  17%|█▋        | 200/1208 [05:25<27:20,  1.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00444, train/loss_vlb_step=2.33e-5, train/loss_step=0.00444, global_step=6391.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  17%|█▋        | 201/1208 [05:26<27:16,  1.62s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00444, train/loss_vlb_step=2.33e-5, train/loss_step=0.00444, global_step=6391.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  17%|█▋        | 201/1208 [05:26<27:16,  1.62s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00544, train/loss_vlb_step=2.85e-5, train/loss_step=0.00544, global_step=6392.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  17%|█▋        | 202/1208 [05:27<27:11,  1.62s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00544, train/loss_vlb_step=2.85e-5, train/loss_step=0.00544, global_step=6392.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  17%|█▋        | 202/1208 [05:27<27:11,  1.62s/it, loss=0.0834, v_num=0, train/loss_simple_step=0.00732, train/loss_vlb_step=3.61e-5, train/loss_step=0.00732, global_step=6392.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  17%|█▋        | 203/1208 [05:28<27:06,  1.62s/it, loss=0.0834, v_num=0, train/loss_simple_step=0.00732, train/loss_vlb_step=3.61e-5, train/loss_step=0.00732, global_step=6392.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  17%|█▋        | 203/1208 [05:28<27:06,  1.62s/it, loss=0.0793, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.000159, train/loss_step=0.0441, global_step=6392.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  17%|█▋        | 204/1208 [05:31<27:11,  1.62s/it, loss=0.0793, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.000159, train/loss_step=0.0441, global_step=6392.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  17%|█▋        | 204/1208 [05:31<27:11,  1.62s/it, loss=0.0746, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000638, train/loss_step=0.182, global_step=6392.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  17%|█▋        | 205/1208 [05:32<27:06,  1.62s/it, loss=0.0746, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000638, train/loss_step=0.182, global_step=6392.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  17%|█▋        | 205/1208 [05:32<27:06,  1.62s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00148, train/loss_step=0.311, global_step=6393.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  17%|█▋        | 206/1208 [05:33<27:02,  1.62s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00148, train/loss_step=0.311, global_step=6393.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  17%|█▋        | 206/1208 [05:33<27:02,  1.62s/it, loss=0.0912, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000148, train/loss_step=0.0409, global_step=6393.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  17%|█▋        | 207/1208 [05:34<26:57,  1.62s/it, loss=0.0912, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000148, train/loss_step=0.0409, global_step=6393.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  17%|█▋        | 207/1208 [05:34<26:57,  1.62s/it, loss=0.0812, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000388, train/loss_step=0.118, global_step=6393.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  17%|█▋        | 208/1208 [05:37<27:02,  1.62s/it, loss=0.0812, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000388, train/loss_step=0.118, global_step=6393.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  17%|█▋        | 208/1208 [05:37<27:02,  1.62s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=6393.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  17%|█▋        | 209/1208 [05:38<26:57,  1.62s/it, loss=0.0862, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=6393.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  17%|█▋        | 209/1208 [05:38<26:57,  1.62s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.0866, train/loss_vlb_step=0.000286, train/loss_step=0.0866, global_step=6394.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  17%|█▋        | 210/1208 [05:39<26:53,  1.62s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.0866, train/loss_vlb_step=0.000286, train/loss_step=0.0866, global_step=6394.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  17%|█▋        | 210/1208 [05:39<26:53,  1.62s/it, loss=0.088, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000181, train/loss_step=0.0524, global_step=6394.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  17%|█▋        | 211/1208 [05:40<26:48,  1.61s/it, loss=0.088, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000181, train/loss_step=0.0524, global_step=6394.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  17%|█▋        | 211/1208 [05:40<26:48,  1.61s/it, loss=0.1, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00255, train/loss_step=0.399, global_step=6394.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]     Epoch 21:  18%|█▊        | 212/1208 [05:43<26:52,  1.62s/it, loss=0.1, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00255, train/loss_step=0.399, global_step=6394.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  18%|█▊        | 212/1208 [05:43<26:52,  1.62s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000513, train/loss_step=0.149, global_step=6394.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  18%|█▊        | 213/1208 [05:44<26:48,  1.62s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000513, train/loss_step=0.149, global_step=6394.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  18%|█▊        | 213/1208 [05:44<26:48,  1.62s/it, loss=0.11, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00192, train/loss_step=0.349, global_step=6395.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  18%|█▊        | 214/1208 [05:45<26:43,  1.61s/it, loss=0.11, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00192, train/loss_step=0.349, global_step=6395.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  18%|█▊        | 214/1208 [05:45<26:43,  1.61s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00454, train/loss_vlb_step=2.31e-5, train/loss_step=0.00454, global_step=6395.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  18%|█▊        | 215/1208 [05:46<26:39,  1.61s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00454, train/loss_vlb_step=2.31e-5, train/loss_step=0.00454, global_step=6395.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  18%|█▊        | 215/1208 [05:46<26:39,  1.61s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0618, train/loss_vlb_step=0.000215, train/loss_step=0.0618, global_step=6395.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  18%|█▊        | 216/1208 [05:49<26:43,  1.62s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0618, train/loss_vlb_step=0.000215, train/loss_step=0.0618, global_step=6395.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  18%|█▊        | 216/1208 [05:49<26:43,  1.62s/it, loss=0.122, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000684, train/loss_step=0.197, global_step=6395.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  18%|█▊        | 217/1208 [05:50<26:39,  1.61s/it, loss=0.122, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000684, train/loss_step=0.197, global_step=6395.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  18%|█▊        | 217/1208 [05:50<26:39,  1.61s/it, loss=0.133, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000849, train/loss_step=0.221, global_step=6396.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  18%|█▊        | 218/1208 [05:51<26:35,  1.61s/it, loss=0.133, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000849, train/loss_step=0.221, global_step=6396.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  18%|█▊        | 218/1208 [05:51<26:35,  1.61s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.53e-5, train/loss_step=0.00265, global_step=6396.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  18%|█▊        | 219/1208 [05:52<26:30,  1.61s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.53e-5, train/loss_step=0.00265, global_step=6396.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  18%|█▊        | 219/1208 [05:52<26:30,  1.61s/it, loss=0.143, v_num=0, train/loss_simple_step=0.529, train/loss_vlb_step=0.00941, train/loss_step=0.529, global_step=6396.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  18%|█▊        | 220/1208 [05:55<26:34,  1.61s/it, loss=0.143, v_num=0, train/loss_simple_step=0.529, train/loss_vlb_step=0.00941, train/loss_step=0.529, global_step=6396.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  18%|█▊        | 220/1208 [05:55<26:34,  1.61s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.44e-5, train/loss_step=0.0119, global_step=6396.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  18%|█▊        | 221/1208 [05:56<26:30,  1.61s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.44e-5, train/loss_step=0.0119, global_step=6396.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  18%|█▊        | 221/1208 [05:56<26:30,  1.61s/it, loss=0.156, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00124, train/loss_step=0.259, global_step=6397.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  18%|█▊        | 222/1208 [05:57<26:26,  1.61s/it, loss=0.156, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00124, train/loss_step=0.259, global_step=6397.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  18%|█▊        | 222/1208 [05:57<26:26,  1.61s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=2.37e-5, train/loss_step=0.00451, global_step=6397.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  18%|█▊        | 223/1208 [05:58<26:21,  1.61s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=2.37e-5, train/loss_step=0.00451, global_step=6397.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  18%|█▊        | 223/1208 [05:58<26:21,  1.61s/it, loss=0.16, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000399, train/loss_step=0.121, global_step=6397.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  19%|█▊        | 224/1208 [06:01<26:25,  1.61s/it, loss=0.16, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000399, train/loss_step=0.121, global_step=6397.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  19%|█▊        | 224/1208 [06:01<26:25,  1.61s/it, loss=0.174, v_num=0, train/loss_simple_step=0.452, train/loss_vlb_step=0.00508, train/loss_step=0.452, global_step=6397.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  19%|█▊        | 225/1208 [06:02<26:21,  1.61s/it, loss=0.174, v_num=0, train/loss_simple_step=0.452, train/loss_vlb_step=0.00508, train/loss_step=0.452, global_step=6397.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  19%|█▊        | 225/1208 [06:02<26:21,  1.61s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0886, train/loss_vlb_step=0.000295, train/loss_step=0.0886, global_step=6398.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  19%|█▊        | 226/1208 [06:03<26:17,  1.61s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0886, train/loss_vlb_step=0.000295, train/loss_step=0.0886, global_step=6398.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  19%|█▊        | 226/1208 [06:03<26:17,  1.61s/it, loss=0.19, v_num=0, train/loss_simple_step=0.591, train/loss_vlb_step=0.0119, train/loss_step=0.591, global_step=6398.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]     Epoch 21:  19%|█▉        | 227/1208 [06:04<26:13,  1.60s/it, loss=0.19, v_num=0, train/loss_simple_step=0.591, train/loss_vlb_step=0.0119, train/loss_step=0.591, global_step=6398.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  19%|█▉        | 227/1208 [06:04<26:13,  1.60s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00732, train/loss_vlb_step=3.57e-5, train/loss_step=0.00732, global_step=6398.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  19%|█▉        | 228/1208 [06:06<26:17,  1.61s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00732, train/loss_vlb_step=3.57e-5, train/loss_step=0.00732, global_step=6398.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  19%|█▉        | 228/1208 [06:06<26:17,  1.61s/it, loss=0.195, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00201, train/loss_step=0.306, global_step=6398.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  19%|█▉        | 229/1208 [06:07<26:13,  1.61s/it, loss=0.195, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00201, train/loss_step=0.306, global_step=6398.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  19%|█▉        | 229/1208 [06:07<26:13,  1.61s/it, loss=0.191, v_num=0, train/loss_simple_step=0.00434, train/loss_vlb_step=2.28e-5, train/loss_step=0.00434, global_step=6399.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  19%|█▉        | 230/1208 [06:08<26:08,  1.60s/it, loss=0.191, v_num=0, train/loss_simple_step=0.00434, train/loss_vlb_step=2.28e-5, train/loss_step=0.00434, global_step=6399.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  19%|█▉        | 230/1208 [06:08<26:08,  1.60s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0455, train/loss_vlb_step=0.000167, train/loss_step=0.0455, global_step=6399.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  19%|█▉        | 231/1208 [06:09<26:04,  1.60s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0455, train/loss_vlb_step=0.000167, train/loss_step=0.0455, global_step=6399.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  19%|█▉        | 231/1208 [06:09<26:04,  1.60s/it, loss=0.179, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000576, train/loss_step=0.169, global_step=6399.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  19%|█▉        | 232/1208 [06:12<26:08,  1.61s/it, loss=0.179, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000576, train/loss_step=0.169, global_step=6399.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  19%|█▉        | 232/1208 [06:12<26:08,  1.61s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.53e-5, train/loss_step=0.0123, global_step=6399.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  19%|█▉        | 233/1208 [06:13<26:04,  1.60s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.53e-5, train/loss_step=0.0123, global_step=6399.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  19%|█▉        | 233/1208 [06:13<26:04,  1.60s/it, loss=0.167, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00116, train/loss_step=0.256, global_step=6400.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  19%|█▉        | 234/1208 [06:14<26:00,  1.60s/it, loss=0.167, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00116, train/loss_step=0.256, global_step=6400.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  19%|█▉        | 234/1208 [06:14<26:00,  1.60s/it, loss=0.18, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00122, train/loss_step=0.254, global_step=6400.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  19%|█▉        | 235/1208 [06:15<25:56,  1.60s/it, loss=0.18, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00122, train/loss_step=0.254, global_step=6400.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  19%|█▉        | 235/1208 [06:15<25:56,  1.60s/it, loss=0.197, v_num=0, train/loss_simple_step=0.416, train/loss_vlb_step=0.00321, train/loss_step=0.416, global_step=6400.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  20%|█▉        | 236/1208 [06:18<25:59,  1.60s/it, loss=0.197, v_num=0, train/loss_simple_step=0.416, train/loss_vlb_step=0.00321, train/loss_step=0.416, global_step=6400.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  20%|█▉        | 236/1208 [06:18<25:59,  1.60s/it, loss=0.197, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000706, train/loss_step=0.189, global_step=6400.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  20%|█▉        | 237/1208 [06:19<25:55,  1.60s/it, loss=0.197, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000706, train/loss_step=0.189, global_step=6400.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  20%|█▉        | 237/1208 [06:19<25:55,  1.60s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00558, train/loss_vlb_step=2.82e-5, train/loss_step=0.00558, global_step=6401.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  20%|█▉        | 238/1208 [06:20<25:51,  1.60s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00558, train/loss_vlb_step=2.82e-5, train/loss_step=0.00558, global_step=6401.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  20%|█▉        | 238/1208 [06:20<25:52,  1.60s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.000172, train/loss_step=0.0489, global_step=6401.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  20%|█▉        | 239/1208 [06:21<25:48,  1.60s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.000172, train/loss_step=0.0489, global_step=6401.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  20%|█▉        | 239/1208 [06:21<25:48,  1.60s/it, loss=0.172, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000662, train/loss_step=0.189, global_step=6401.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  20%|█▉        | 240/1208 [06:24<25:51,  1.60s/it, loss=0.172, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000662, train/loss_step=0.189, global_step=6401.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  20%|█▉        | 240/1208 [06:24<25:51,  1.60s/it, loss=0.195, v_num=0, train/loss_simple_step=0.490, train/loss_vlb_step=0.00781, train/loss_step=0.490, global_step=6401.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  20%|█▉        | 241/1208 [06:25<25:47,  1.60s/it, loss=0.195, v_num=0, train/loss_simple_step=0.490, train/loss_vlb_step=0.00781, train/loss_step=0.490, global_step=6401.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  20%|█▉        | 241/1208 [06:25<25:47,  1.60s/it, loss=0.188, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000355, train/loss_step=0.107, global_step=6402.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  20%|██        | 242/1208 [06:26<25:43,  1.60s/it, loss=0.188, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000355, train/loss_step=0.107, global_step=6402.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  20%|██        | 242/1208 [06:26<25:43,  1.60s/it, loss=0.188, v_num=0, train/loss_simple_step=0.00429, train/loss_vlb_step=2.27e-5, train/loss_step=0.00429, global_step=6402.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  20%|██        | 243/1208 [06:27<25:39,  1.60s/it, loss=0.188, v_num=0, train/loss_simple_step=0.00429, train/loss_vlb_step=2.27e-5, train/loss_step=0.00429, global_step=6402.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  20%|██        | 243/1208 [06:27<25:39,  1.60s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00892, train/loss_vlb_step=4.04e-5, train/loss_step=0.00892, global_step=6402.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  20%|██        | 244/1208 [06:30<25:43,  1.60s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00892, train/loss_vlb_step=4.04e-5, train/loss_step=0.00892, global_step=6402.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  20%|██        | 244/1208 [06:30<25:43,  1.60s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0885, train/loss_vlb_step=0.000291, train/loss_step=0.0885, global_step=6402.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  20%|██        | 245/1208 [06:31<25:39,  1.60s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0885, train/loss_vlb_step=0.000291, train/loss_step=0.0885, global_step=6402.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  20%|██        | 245/1208 [06:31<25:39,  1.60s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00812, train/loss_vlb_step=3.84e-5, train/loss_step=0.00812, global_step=6403.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  20%|██        | 246/1208 [06:32<25:35,  1.60s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00812, train/loss_vlb_step=3.84e-5, train/loss_step=0.00812, global_step=6403.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  20%|██        | 246/1208 [06:32<25:35,  1.60s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00825, train/loss_vlb_step=4.03e-5, train/loss_step=0.00825, global_step=6403.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  20%|██        | 247/1208 [06:33<25:31,  1.59s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00825, train/loss_vlb_step=4.03e-5, train/loss_step=0.00825, global_step=6403.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  20%|██        | 247/1208 [06:33<25:31,  1.59s/it, loss=0.151, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00293, train/loss_step=0.401, global_step=6403.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  21%|██        | 248/1208 [06:36<25:34,  1.60s/it, loss=0.151, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00293, train/loss_step=0.401, global_step=6403.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  21%|██        | 248/1208 [06:36<25:34,  1.60s/it, loss=0.157, v_num=0, train/loss_simple_step=0.441, train/loss_vlb_step=0.00427, train/loss_step=0.441, global_step=6403.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  21%|██        | 249/1208 [06:37<25:31,  1.60s/it, loss=0.157, v_num=0, train/loss_simple_step=0.441, train/loss_vlb_step=0.00427, train/loss_step=0.441, global_step=6403.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  21%|██        | 249/1208 [06:37<25:31,  1.60s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0789, train/loss_vlb_step=0.000268, train/loss_step=0.0789, global_step=6404.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  21%|██        | 250/1208 [06:38<25:27,  1.59s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0789, train/loss_vlb_step=0.000268, train/loss_step=0.0789, global_step=6404.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  21%|██        | 250/1208 [06:38<25:27,  1.59s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.24e-5, train/loss_step=0.00208, global_step=6404.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  21%|██        | 251/1208 [06:39<25:23,  1.59s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.24e-5, train/loss_step=0.00208, global_step=6404.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  21%|██        | 251/1208 [06:39<25:23,  1.59s/it, loss=0.156, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=6404.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  21%|██        | 252/1208 [06:42<25:26,  1.60s/it, loss=0.156, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=6404.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  21%|██        | 252/1208 [06:42<25:26,  1.60s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0691, train/loss_vlb_step=0.000237, train/loss_step=0.0691, global_step=6404.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  21%|██        | 253/1208 [06:43<25:22,  1.59s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0691, train/loss_vlb_step=0.000237, train/loss_step=0.0691, global_step=6404.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  21%|██        | 253/1208 [06:43<25:22,  1.59s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0713, train/loss_vlb_step=0.000239, train/loss_step=0.0713, global_step=6405.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  21%|██        | 254/1208 [06:44<25:18,  1.59s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0713, train/loss_vlb_step=0.000239, train/loss_step=0.0713, global_step=6405.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  21%|██        | 254/1208 [06:44<25:18,  1.59s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.000114, train/loss_step=0.0285, global_step=6405.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  21%|██        | 255/1208 [06:45<25:15,  1.59s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.000114, train/loss_step=0.0285, global_step=6405.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  21%|██        | 255/1208 [06:45<25:15,  1.59s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.68e-5, train/loss_step=0.0129, global_step=6405.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  21%|██        | 256/1208 [06:48<25:18,  1.59s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.68e-5, train/loss_step=0.0129, global_step=6405.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  21%|██        | 256/1208 [06:48<25:18,  1.59s/it, loss=0.13, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00289, train/loss_step=0.439, global_step=6405.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  21%|██▏       | 257/1208 [06:49<25:14,  1.59s/it, loss=0.13, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00289, train/loss_step=0.439, global_step=6405.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  21%|██▏       | 257/1208 [06:49<25:14,  1.59s/it, loss=0.152, v_num=0, train/loss_simple_step=0.437, train/loss_vlb_step=0.00429, train/loss_step=0.437, global_step=6406.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  21%|██▏       | 258/1208 [06:50<25:10,  1.59s/it, loss=0.152, v_num=0, train/loss_simple_step=0.437, train/loss_vlb_step=0.00429, train/loss_step=0.437, global_step=6406.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  21%|██▏       | 258/1208 [06:50<25:10,  1.59s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0976, train/loss_vlb_step=0.000321, train/loss_step=0.0976, global_step=6406.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  21%|██▏       | 259/1208 [06:51<25:07,  1.59s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0976, train/loss_vlb_step=0.000321, train/loss_step=0.0976, global_step=6406.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  21%|██▏       | 259/1208 [06:51<25:07,  1.59s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.28e-5, train/loss_step=0.00213, global_step=6406.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  22%|██▏       | 260/1208 [06:54<25:10,  1.59s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.28e-5, train/loss_step=0.00213, global_step=6406.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  22%|██▏       | 260/1208 [06:54<25:10,  1.59s/it, loss=0.134, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00114, train/loss_step=0.265, global_step=6406.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  22%|██▏       | 261/1208 [06:55<25:06,  1.59s/it, loss=0.134, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00114, train/loss_step=0.265, global_step=6406.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  22%|██▏       | 261/1208 [06:55<25:06,  1.59s/it, loss=0.136, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000468, train/loss_step=0.141, global_step=6407.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  22%|██▏       | 262/1208 [06:56<25:02,  1.59s/it, loss=0.136, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000468, train/loss_step=0.141, global_step=6407.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  22%|██▏       | 262/1208 [06:56<25:02,  1.59s/it, loss=0.159, v_num=0, train/loss_simple_step=0.480, train/loss_vlb_step=0.00624, train/loss_step=0.480, global_step=6407.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  22%|██▏       | 263/1208 [06:57<24:59,  1.59s/it, loss=0.159, v_num=0, train/loss_simple_step=0.480, train/loss_vlb_step=0.00624, train/loss_step=0.480, global_step=6407.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  22%|██▏       | 263/1208 [06:57<24:59,  1.59s/it, loss=0.175, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00164, train/loss_step=0.313, global_step=6407.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  22%|██▏       | 264/1208 [07:00<25:02,  1.59s/it, loss=0.175, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00164, train/loss_step=0.313, global_step=6407.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  22%|██▏       | 264/1208 [07:00<25:02,  1.59s/it, loss=0.199, v_num=0, train/loss_simple_step=0.570, train/loss_vlb_step=0.00789, train/loss_step=0.570, global_step=6407.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  22%|██▏       | 265/1208 [07:01<24:58,  1.59s/it, loss=0.199, v_num=0, train/loss_simple_step=0.570, train/loss_vlb_step=0.00789, train/loss_step=0.570, global_step=6407.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  22%|██▏       | 265/1208 [07:01<24:58,  1.59s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0784, train/loss_vlb_step=0.000261, train/loss_step=0.0784, global_step=6408.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  22%|██▏       | 266/1208 [07:02<24:55,  1.59s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0784, train/loss_vlb_step=0.000261, train/loss_step=0.0784, global_step=6408.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  22%|██▏       | 266/1208 [07:02<24:55,  1.59s/it, loss=0.214, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00105, train/loss_step=0.251, global_step=6408.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  22%|██▏       | 267/1208 [07:03<24:51,  1.59s/it, loss=0.214, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00105, train/loss_step=0.251, global_step=6408.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  22%|██▏       | 267/1208 [07:03<24:51,  1.59s/it, loss=0.194, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=1.75e-5, train/loss_step=0.00302, global_step=6408.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  22%|██▏       | 268/1208 [07:06<24:54,  1.59s/it, loss=0.194, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=1.75e-5, train/loss_step=0.00302, global_step=6408.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  22%|██▏       | 268/1208 [07:06<24:54,  1.59s/it, loss=0.179, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000468, train/loss_step=0.141, global_step=6408.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  22%|██▏       | 269/1208 [07:07<24:50,  1.59s/it, loss=0.179, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000468, train/loss_step=0.141, global_step=6408.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  22%|██▏       | 269/1208 [07:07<24:50,  1.59s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=5.81e-5, train/loss_step=0.0138, global_step=6409.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  22%|██▏       | 270/1208 [07:08<24:47,  1.59s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=5.81e-5, train/loss_step=0.0138, global_step=6409.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  22%|██▏       | 270/1208 [07:08<24:47,  1.59s/it, loss=0.206, v_num=0, train/loss_simple_step=0.600, train/loss_vlb_step=0.0104, train/loss_step=0.600, global_step=6409.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  22%|██▏       | 271/1208 [07:09<24:43,  1.58s/it, loss=0.206, v_num=0, train/loss_simple_step=0.600, train/loss_vlb_step=0.0104, train/loss_step=0.600, global_step=6409.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  22%|██▏       | 271/1208 [07:09<24:43,  1.58s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.27e-5, train/loss_step=0.0116, global_step=6409.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  23%|██▎       | 272/1208 [07:11<24:46,  1.59s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.27e-5, train/loss_step=0.0116, global_step=6409.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  23%|██▎       | 272/1208 [07:11<24:46,  1.59s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=1.22e-5, train/loss_step=0.00214, global_step=6409.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  23%|██▎       | 273/1208 [07:13<24:42,  1.59s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=1.22e-5, train/loss_step=0.00214, global_step=6409.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  23%|██▎       | 273/1208 [07:13<24:42,  1.59s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.29e-5, train/loss_step=0.0175, global_step=6410.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  23%|██▎       | 274/1208 [07:14<24:39,  1.58s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.29e-5, train/loss_step=0.0175, global_step=6410.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  23%|██▎       | 274/1208 [07:14<24:39,  1.58s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0782, train/loss_vlb_step=0.000261, train/loss_step=0.0782, global_step=6410.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  23%|██▎       | 275/1208 [07:15<24:35,  1.58s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0782, train/loss_vlb_step=0.000261, train/loss_step=0.0782, global_step=6410.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  23%|██▎       | 275/1208 [07:15<24:35,  1.58s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0488, train/loss_vlb_step=0.000173, train/loss_step=0.0488, global_step=6410.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  23%|██▎       | 276/1208 [07:17<24:38,  1.59s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0488, train/loss_vlb_step=0.000173, train/loss_step=0.0488, global_step=6410.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  23%|██▎       | 276/1208 [07:17<24:38,  1.59s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000115, train/loss_step=0.0299, global_step=6410.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  23%|██▎       | 277/1208 [07:18<24:35,  1.58s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000115, train/loss_step=0.0299, global_step=6410.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  23%|██▎       | 277/1208 [07:18<24:35,  1.58s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0862, train/loss_vlb_step=0.000286, train/loss_step=0.0862, global_step=6411.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  23%|██▎       | 278/1208 [07:19<24:31,  1.58s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0862, train/loss_vlb_step=0.000286, train/loss_step=0.0862, global_step=6411.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  23%|██▎       | 278/1208 [07:19<24:31,  1.58s/it, loss=0.177, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00347, train/loss_step=0.414, global_step=6411.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  23%|██▎       | 279/1208 [07:20<24:28,  1.58s/it, loss=0.177, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00347, train/loss_step=0.414, global_step=6411.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  23%|██▎       | 279/1208 [07:20<24:28,  1.58s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00358, train/loss_vlb_step=2.01e-5, train/loss_step=0.00358, global_step=6411.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  23%|██▎       | 280/1208 [07:23<24:30,  1.58s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00358, train/loss_vlb_step=2.01e-5, train/loss_step=0.00358, global_step=6411.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  23%|██▎       | 280/1208 [07:23<24:30,  1.58s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=1.37e-5, train/loss_step=0.00227, global_step=6411.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  23%|██▎       | 281/1208 [07:24<24:27,  1.58s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=1.37e-5, train/loss_step=0.00227, global_step=6411.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  23%|██▎       | 281/1208 [07:24<24:27,  1.58s/it, loss=0.168, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000993, train/loss_step=0.218, global_step=6412.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  23%|██▎       | 282/1208 [07:25<24:23,  1.58s/it, loss=0.168, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000993, train/loss_step=0.218, global_step=6412.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  23%|██▎       | 282/1208 [07:25<24:24,  1.58s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00439, train/loss_vlb_step=2.39e-5, train/loss_step=0.00439, global_step=6412.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  23%|██▎       | 283/1208 [07:26<24:20,  1.58s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00439, train/loss_vlb_step=2.39e-5, train/loss_step=0.00439, global_step=6412.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  23%|██▎       | 283/1208 [07:26<24:20,  1.58s/it, loss=0.145, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00158, train/loss_step=0.322, global_step=6412.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  24%|██▎       | 284/1208 [07:29<24:23,  1.58s/it, loss=0.145, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00158, train/loss_step=0.322, global_step=6412.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  24%|██▎       | 284/1208 [07:29<24:23,  1.58s/it, loss=0.123, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000441, train/loss_step=0.131, global_step=6412.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  24%|██▎       | 285/1208 [07:30<24:19,  1.58s/it, loss=0.123, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000441, train/loss_step=0.131, global_step=6412.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  24%|██▎       | 285/1208 [07:30<24:19,  1.58s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0486, train/loss_vlb_step=0.000175, train/loss_step=0.0486, global_step=6413.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  24%|██▎       | 286/1208 [07:31<24:16,  1.58s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0486, train/loss_vlb_step=0.000175, train/loss_step=0.0486, global_step=6413.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  24%|██▎       | 286/1208 [07:31<24:16,  1.58s/it, loss=0.114, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000361, train/loss_step=0.110, global_step=6413.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  24%|██▍       | 287/1208 [07:32<24:12,  1.58s/it, loss=0.114, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000361, train/loss_step=0.110, global_step=6413.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  24%|██▍       | 287/1208 [07:32<24:12,  1.58s/it, loss=0.131, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00215, train/loss_step=0.341, global_step=6413.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  24%|██▍       | 288/1208 [07:35<24:15,  1.58s/it, loss=0.131, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00215, train/loss_step=0.341, global_step=6413.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  24%|██▍       | 288/1208 [07:35<24:15,  1.58s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0635, train/loss_vlb_step=0.000216, train/loss_step=0.0635, global_step=6413.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  24%|██▍       | 289/1208 [07:36<24:11,  1.58s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0635, train/loss_vlb_step=0.000216, train/loss_step=0.0635, global_step=6413.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  24%|██▍       | 289/1208 [07:36<24:11,  1.58s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.64e-5, train/loss_step=0.0103, global_step=6414.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  24%|██▍       | 290/1208 [07:37<24:08,  1.58s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.64e-5, train/loss_step=0.0103, global_step=6414.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  24%|██▍       | 290/1208 [07:37<24:08,  1.58s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.47e-5, train/loss_step=0.00251, global_step=6414.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  24%|██▍       | 291/1208 [07:38<24:05,  1.58s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.47e-5, train/loss_step=0.00251, global_step=6414.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  24%|██▍       | 291/1208 [07:38<24:05,  1.58s/it, loss=0.105, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000551, train/loss_step=0.161, global_step=6414.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  24%|██▍       | 292/1208 [07:41<24:07,  1.58s/it, loss=0.105, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000551, train/loss_step=0.161, global_step=6414.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  24%|██▍       | 292/1208 [07:41<24:07,  1.58s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00666, train/loss_vlb_step=3.3e-5, train/loss_step=0.00666, global_step=6414.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  24%|██▍       | 293/1208 [07:42<24:04,  1.58s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00666, train/loss_vlb_step=3.3e-5, train/loss_step=0.00666, global_step=6414.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  24%|██▍       | 293/1208 [07:42<24:04,  1.58s/it, loss=0.116, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000886, train/loss_step=0.234, global_step=6415.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  24%|██▍       | 294/1208 [07:43<24:01,  1.58s/it, loss=0.116, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000886, train/loss_step=0.234, global_step=6415.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  24%|██▍       | 294/1208 [07:43<24:01,  1.58s/it, loss=0.123, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000866, train/loss_step=0.218, global_step=6415.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  24%|██▍       | 295/1208 [07:44<23:57,  1.57s/it, loss=0.123, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000866, train/loss_step=0.218, global_step=6415.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  24%|██▍       | 295/1208 [07:44<23:57,  1.57s/it, loss=0.132, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000803, train/loss_step=0.233, global_step=6415.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  25%|██▍       | 296/1208 [07:47<24:00,  1.58s/it, loss=0.132, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000803, train/loss_step=0.233, global_step=6415.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  25%|██▍       | 296/1208 [07:47<24:00,  1.58s/it, loss=0.142, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.0011, train/loss_step=0.239, global_step=6415.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  25%|██▍       | 297/1208 [07:48<23:56,  1.58s/it, loss=0.142, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.0011, train/loss_step=0.239, global_step=6415.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  25%|██▍       | 297/1208 [07:48<23:56,  1.58s/it, loss=0.15, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000953, train/loss_step=0.234, global_step=6416.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  25%|██▍       | 298/1208 [07:49<23:53,  1.58s/it, loss=0.15, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000953, train/loss_step=0.234, global_step=6416.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  25%|██▍       | 298/1208 [07:49<23:53,  1.58s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.66e-5, train/loss_step=0.0213, global_step=6416.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  25%|██▍       | 299/1208 [07:50<23:50,  1.57s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.66e-5, train/loss_step=0.0213, global_step=6416.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  25%|██▍       | 299/1208 [07:50<23:50,  1.57s/it, loss=0.142, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00094, train/loss_step=0.239, global_step=6416.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  25%|██▍       | 300/1208 [07:53<23:52,  1.58s/it, loss=0.142, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00094, train/loss_step=0.239, global_step=6416.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  25%|██▍       | 300/1208 [07:53<23:52,  1.58s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0993, train/loss_vlb_step=0.000327, train/loss_step=0.0993, global_step=6416.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.84it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.84it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.85it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.85it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.85it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.84it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.85it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.84it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.85it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.84it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.85it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.84it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.85it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.84it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.85it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.84it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.85it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.84it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.85it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.85it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.85it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:18,  1.84it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.85it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.84it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.84it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.83it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.78it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.82it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.81it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.75it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.80it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.75it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.75it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.75it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]Epoch 21:  25%|██▍       | 301/1208 [08:23<25:17,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0993, train/loss_vlb_step=0.000327, train/loss_step=0.0993, global_step=6416.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  25%|██▍       | 301/1208 [08:23<25:17,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.0012, train/loss_step=0.302, global_step=6417.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  25%|██▌       | 302/1208 [08:24<25:14,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.0012, train/loss_step=0.302, global_step=6417.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  25%|██▌       | 302/1208 [08:24<25:14,  1.67s/it, loss=0.166, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00199, train/loss_step=0.310, global_step=6417.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  25%|██▌       | 303/1208 [08:25<25:10,  1.67s/it, loss=0.166, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00199, train/loss_step=0.310, global_step=6417.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  25%|██▌       | 303/1208 [08:25<25:10,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.62e-5, train/loss_step=0.0209, global_step=6417.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  25%|██▌       | 304/1208 [08:28<25:13,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.62e-5, train/loss_step=0.0209, global_step=6417.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  25%|██▌       | 304/1208 [08:28<25:13,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=5.21e-5, train/loss_step=0.0106, global_step=6417.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  25%|██▌       | 305/1208 [08:29<25:09,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=5.21e-5, train/loss_step=0.0106, global_step=6417.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  25%|██▌       | 305/1208 [08:29<25:09,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000288, train/loss_step=0.087, global_step=6418.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  25%|██▌       | 306/1208 [08:30<25:06,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000288, train/loss_step=0.087, global_step=6418.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  25%|██▌       | 306/1208 [08:30<25:06,  1.67s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0068, train/loss_vlb_step=3.24e-5, train/loss_step=0.0068, global_step=6418.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  25%|██▌       | 307/1208 [08:31<25:02,  1.67s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0068, train/loss_vlb_step=3.24e-5, train/loss_step=0.0068, global_step=6418.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  25%|██▌       | 307/1208 [08:31<25:02,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000832, train/loss_step=0.221, global_step=6418.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  25%|██▌       | 308/1208 [08:35<25:05,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000832, train/loss_step=0.221, global_step=6418.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  25%|██▌       | 308/1208 [08:35<25:05,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.3e-5, train/loss_step=0.00222, global_step=6418.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  26%|██▌       | 309/1208 [08:36<25:01,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.3e-5, train/loss_step=0.00222, global_step=6418.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  26%|██▌       | 309/1208 [08:36<25:01,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000242, train/loss_step=0.0732, global_step=6419.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  26%|██▌       | 310/1208 [08:37<24:58,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000242, train/loss_step=0.0732, global_step=6419.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  26%|██▌       | 310/1208 [08:37<24:58,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.99e-5, train/loss_step=0.0185, global_step=6419.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  26%|██▌       | 311/1208 [08:38<24:54,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.99e-5, train/loss_step=0.0185, global_step=6419.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  26%|██▌       | 311/1208 [08:38<24:54,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000611, train/loss_step=0.181, global_step=6419.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  26%|██▌       | 312/1208 [08:41<24:57,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000611, train/loss_step=0.181, global_step=6419.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  26%|██▌       | 312/1208 [08:41<24:57,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.85e-5, train/loss_step=0.0033, global_step=6419.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  26%|██▌       | 313/1208 [08:42<24:53,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.85e-5, train/loss_step=0.0033, global_step=6419.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  26%|██▌       | 313/1208 [08:42<24:53,  1.67s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00641, train/loss_vlb_step=3.28e-5, train/loss_step=0.00641, global_step=6420.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  26%|██▌       | 314/1208 [08:43<24:50,  1.67s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00641, train/loss_vlb_step=3.28e-5, train/loss_step=0.00641, global_step=6420.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  26%|██▌       | 314/1208 [08:43<24:50,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0834, train/loss_vlb_step=0.000278, train/loss_step=0.0834, global_step=6420.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  26%|██▌       | 315/1208 [08:44<24:46,  1.66s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0834, train/loss_vlb_step=0.000278, train/loss_step=0.0834, global_step=6420.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  26%|██▌       | 315/1208 [08:44<24:46,  1.66s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000111, train/loss_step=0.0297, global_step=6420.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  26%|██▌       | 316/1208 [08:47<24:48,  1.67s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000111, train/loss_step=0.0297, global_step=6420.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  26%|██▌       | 316/1208 [08:47<24:48,  1.67s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000273, train/loss_step=0.0815, global_step=6420.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  26%|██▌       | 317/1208 [08:48<24:44,  1.67s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000273, train/loss_step=0.0815, global_step=6420.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  26%|██▌       | 317/1208 [08:48<24:44,  1.67s/it, loss=0.103, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00119, train/loss_step=0.272, global_step=6421.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  26%|██▋       | 318/1208 [08:49<24:41,  1.66s/it, loss=0.103, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00119, train/loss_step=0.272, global_step=6421.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  26%|██▋       | 318/1208 [08:49<24:41,  1.66s/it, loss=0.111, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000583, train/loss_step=0.173, global_step=6421.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  26%|██▋       | 319/1208 [08:50<24:37,  1.66s/it, loss=0.111, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000583, train/loss_step=0.173, global_step=6421.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  26%|██▋       | 319/1208 [08:50<24:37,  1.66s/it, loss=0.116, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00169, train/loss_step=0.344, global_step=6421.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  26%|██▋       | 320/1208 [08:53<24:39,  1.67s/it, loss=0.116, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00169, train/loss_step=0.344, global_step=6421.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  26%|██▋       | 320/1208 [08:53<24:39,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.445, train/loss_vlb_step=0.00369, train/loss_step=0.445, global_step=6421.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  27%|██▋       | 321/1208 [08:54<24:36,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.445, train/loss_vlb_step=0.00369, train/loss_step=0.445, global_step=6421.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  27%|██▋       | 321/1208 [08:54<24:36,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000793, train/loss_step=0.198, global_step=6422.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  27%|██▋       | 322/1208 [08:55<24:32,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000793, train/loss_step=0.198, global_step=6422.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  27%|██▋       | 322/1208 [08:55<24:32,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00143, train/loss_step=0.273, global_step=6422.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  27%|██▋       | 323/1208 [08:56<24:29,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00143, train/loss_step=0.273, global_step=6422.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  27%|██▋       | 323/1208 [08:56<24:29,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0687, train/loss_vlb_step=0.000232, train/loss_step=0.0687, global_step=6422.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  27%|██▋       | 324/1208 [08:59<24:30,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0687, train/loss_vlb_step=0.000232, train/loss_step=0.0687, global_step=6422.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  27%|██▋       | 324/1208 [08:59<24:30,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.492, train/loss_vlb_step=0.00992, train/loss_step=0.492, global_step=6422.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  27%|██▋       | 325/1208 [09:00<24:27,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.492, train/loss_vlb_step=0.00992, train/loss_step=0.492, global_step=6422.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  27%|██▋       | 325/1208 [09:00<24:27,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.58e-5, train/loss_step=0.00289, global_step=6423.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  27%|██▋       | 326/1208 [09:01<24:23,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.58e-5, train/loss_step=0.00289, global_step=6423.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  27%|██▋       | 326/1208 [09:01<24:23,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.618, train/loss_vlb_step=0.0231, train/loss_step=0.618, global_step=6423.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]     Epoch 21:  27%|██▋       | 327/1208 [09:02<24:20,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.618, train/loss_vlb_step=0.0231, train/loss_step=0.618, global_step=6423.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  27%|██▋       | 327/1208 [09:02<24:20,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000351, train/loss_step=0.106, global_step=6423.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  27%|██▋       | 328/1208 [09:04<24:22,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000351, train/loss_step=0.106, global_step=6423.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  27%|██▋       | 328/1208 [09:04<24:22,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=8.39e-5, train/loss_step=0.0195, global_step=6423.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  27%|██▋       | 329/1208 [09:05<24:18,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=8.39e-5, train/loss_step=0.0195, global_step=6423.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  27%|██▋       | 329/1208 [09:05<24:18,  1.66s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=9.9e-5, train/loss_step=0.0258, global_step=6424.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  27%|██▋       | 330/1208 [09:06<24:15,  1.66s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=9.9e-5, train/loss_step=0.0258, global_step=6424.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  27%|██▋       | 330/1208 [09:06<24:15,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000551, train/loss_step=0.156, global_step=6424.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  27%|██▋       | 331/1208 [09:08<24:11,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000551, train/loss_step=0.156, global_step=6424.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  27%|██▋       | 331/1208 [09:08<24:11,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.090, train/loss_vlb_step=0.000296, train/loss_step=0.090, global_step=6424.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  27%|██▋       | 332/1208 [09:10<24:13,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.090, train/loss_vlb_step=0.000296, train/loss_step=0.090, global_step=6424.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  27%|██▋       | 332/1208 [09:10<24:13,  1.66s/it, loss=0.2, v_num=0, train/loss_simple_step=0.518, train/loss_vlb_step=0.00624, train/loss_step=0.518, global_step=6424.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  28%|██▊       | 333/1208 [09:11<24:10,  1.66s/it, loss=0.2, v_num=0, train/loss_simple_step=0.518, train/loss_vlb_step=0.00624, train/loss_step=0.518, global_step=6424.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  28%|██▊       | 333/1208 [09:11<24:10,  1.66s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.000149, train/loss_step=0.0413, global_step=6425.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  28%|██▊       | 334/1208 [09:12<24:06,  1.66s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.000149, train/loss_step=0.0413, global_step=6425.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  28%|██▊       | 334/1208 [09:12<24:06,  1.66s/it, loss=0.214, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00161, train/loss_step=0.321, global_step=6425.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  28%|██▊       | 335/1208 [09:13<24:03,  1.65s/it, loss=0.214, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00161, train/loss_step=0.321, global_step=6425.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  28%|██▊       | 335/1208 [09:13<24:03,  1.65s/it, loss=0.242, v_num=0, train/loss_simple_step=0.588, train/loss_vlb_step=0.00814, train/loss_step=0.588, global_step=6425.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  28%|██▊       | 336/1208 [09:16<24:04,  1.66s/it, loss=0.242, v_num=0, train/loss_simple_step=0.588, train/loss_vlb_step=0.00814, train/loss_step=0.588, global_step=6425.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  28%|██▊       | 336/1208 [09:16<24:04,  1.66s/it, loss=0.238, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.58e-5, train/loss_step=0.0028, global_step=6425.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  28%|██▊       | 337/1208 [09:17<24:01,  1.66s/it, loss=0.238, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.58e-5, train/loss_step=0.0028, global_step=6425.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  28%|██▊       | 337/1208 [09:17<24:01,  1.66s/it, loss=0.226, v_num=0, train/loss_simple_step=0.039, train/loss_vlb_step=0.000145, train/loss_step=0.039, global_step=6426.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  28%|██▊       | 338/1208 [09:18<23:58,  1.65s/it, loss=0.226, v_num=0, train/loss_simple_step=0.039, train/loss_vlb_step=0.000145, train/loss_step=0.039, global_step=6426.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  28%|██▊       | 338/1208 [09:18<23:58,  1.65s/it, loss=0.242, v_num=0, train/loss_simple_step=0.489, train/loss_vlb_step=0.00691, train/loss_step=0.489, global_step=6426.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  28%|██▊       | 339/1208 [09:19<23:55,  1.65s/it, loss=0.242, v_num=0, train/loss_simple_step=0.489, train/loss_vlb_step=0.00691, train/loss_step=0.489, global_step=6426.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  28%|██▊       | 339/1208 [09:19<23:55,  1.65s/it, loss=0.227, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000147, train/loss_step=0.0412, global_step=6426.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  28%|██▊       | 340/1208 [09:22<23:56,  1.65s/it, loss=0.227, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000147, train/loss_step=0.0412, global_step=6426.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  28%|██▊       | 340/1208 [09:22<23:56,  1.65s/it, loss=0.212, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000517, train/loss_step=0.157, global_step=6426.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  28%|██▊       | 341/1208 [09:23<23:53,  1.65s/it, loss=0.212, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000517, train/loss_step=0.157, global_step=6426.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  28%|██▊       | 341/1208 [09:23<23:53,  1.65s/it, loss=0.212, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000631, train/loss_step=0.183, global_step=6427.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  28%|██▊       | 342/1208 [09:24<23:49,  1.65s/it, loss=0.212, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000631, train/loss_step=0.183, global_step=6427.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  28%|██▊       | 342/1208 [09:24<23:49,  1.65s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0719, train/loss_vlb_step=0.000238, train/loss_step=0.0719, global_step=6427.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  28%|██▊       | 343/1208 [09:25<23:46,  1.65s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0719, train/loss_vlb_step=0.000238, train/loss_step=0.0719, global_step=6427.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  28%|██▊       | 343/1208 [09:25<23:46,  1.65s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0495, train/loss_vlb_step=0.000177, train/loss_step=0.0495, global_step=6427.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  28%|██▊       | 344/1208 [09:28<23:48,  1.65s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0495, train/loss_vlb_step=0.000177, train/loss_step=0.0495, global_step=6427.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  28%|██▊       | 344/1208 [09:28<23:48,  1.65s/it, loss=0.182, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=6427.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  29%|██▊       | 345/1208 [09:29<23:44,  1.65s/it, loss=0.182, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=6427.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  29%|██▊       | 345/1208 [09:29<23:44,  1.65s/it, loss=0.189, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000491, train/loss_step=0.148, global_step=6428.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  29%|██▊       | 346/1208 [09:30<23:41,  1.65s/it, loss=0.189, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000491, train/loss_step=0.148, global_step=6428.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  29%|██▊       | 346/1208 [09:30<23:41,  1.65s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000143, train/loss_step=0.0369, global_step=6428.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  29%|██▊       | 347/1208 [09:31<23:38,  1.65s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000143, train/loss_step=0.0369, global_step=6428.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  29%|██▊       | 347/1208 [09:31<23:38,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0682, train/loss_vlb_step=0.000232, train/loss_step=0.0682, global_step=6428.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  29%|██▉       | 348/1208 [09:34<23:39,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0682, train/loss_vlb_step=0.000232, train/loss_step=0.0682, global_step=6428.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  29%|██▉       | 348/1208 [09:34<23:39,  1.65s/it, loss=0.171, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00113, train/loss_step=0.267, global_step=6428.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  29%|██▉       | 349/1208 [09:35<23:36,  1.65s/it, loss=0.171, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00113, train/loss_step=0.267, global_step=6428.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  29%|██▉       | 349/1208 [09:35<23:36,  1.65s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00919, train/loss_vlb_step=4.28e-5, train/loss_step=0.00919, global_step=6429.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  29%|██▉       | 350/1208 [09:36<23:33,  1.65s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00919, train/loss_vlb_step=4.28e-5, train/loss_step=0.00919, global_step=6429.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  29%|██▉       | 350/1208 [09:36<23:33,  1.65s/it, loss=0.175, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00115, train/loss_step=0.260, global_step=6429.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  29%|██▉       | 351/1208 [09:37<23:30,  1.65s/it, loss=0.175, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00115, train/loss_step=0.260, global_step=6429.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  29%|██▉       | 351/1208 [09:37<23:30,  1.65s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00697, train/loss_vlb_step=3.51e-5, train/loss_step=0.00697, global_step=6429.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  29%|██▉       | 352/1208 [09:40<23:31,  1.65s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00697, train/loss_vlb_step=3.51e-5, train/loss_step=0.00697, global_step=6429.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  29%|██▉       | 352/1208 [09:40<23:31,  1.65s/it, loss=0.147, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.00013, train/loss_step=0.035, global_step=6429.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  29%|██▉       | 353/1208 [09:41<23:28,  1.65s/it, loss=0.147, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.00013, train/loss_step=0.035, global_step=6429.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  29%|██▉       | 353/1208 [09:41<23:28,  1.65s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=9.89e-5, train/loss_step=0.0252, global_step=6430.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  29%|██▉       | 354/1208 [09:42<23:25,  1.65s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=9.89e-5, train/loss_step=0.0252, global_step=6430.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  29%|██▉       | 354/1208 [09:42<23:25,  1.65s/it, loss=0.138, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.00056, train/loss_step=0.162, global_step=6430.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  29%|██▉       | 355/1208 [09:43<23:21,  1.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.00056, train/loss_step=0.162, global_step=6430.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  29%|██▉       | 355/1208 [09:43<23:21,  1.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.583, train/loss_vlb_step=0.00883, train/loss_step=0.583, global_step=6430.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  29%|██▉       | 356/1208 [09:46<23:23,  1.65s/it, loss=0.138, v_num=0, train/loss_simple_step=0.583, train/loss_vlb_step=0.00883, train/loss_step=0.583, global_step=6430.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  29%|██▉       | 356/1208 [09:46<23:23,  1.65s/it, loss=0.14, v_num=0, train/loss_simple_step=0.058, train/loss_vlb_step=0.000197, train/loss_step=0.058, global_step=6430.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  30%|██▉       | 357/1208 [09:47<23:19,  1.65s/it, loss=0.14, v_num=0, train/loss_simple_step=0.058, train/loss_vlb_step=0.000197, train/loss_step=0.058, global_step=6430.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  30%|██▉       | 357/1208 [09:47<23:19,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.456, train/loss_vlb_step=0.00414, train/loss_step=0.456, global_step=6431.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  30%|██▉       | 358/1208 [09:48<23:16,  1.64s/it, loss=0.161, v_num=0, train/loss_simple_step=0.456, train/loss_vlb_step=0.00414, train/loss_step=0.456, global_step=6431.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  30%|██▉       | 358/1208 [09:48<23:16,  1.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.65e-5, train/loss_step=0.0214, global_step=6431.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  30%|██▉       | 359/1208 [09:49<23:13,  1.64s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.65e-5, train/loss_step=0.0214, global_step=6431.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  30%|██▉       | 359/1208 [09:49<23:13,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.00064, train/loss_step=0.188, global_step=6431.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  30%|██▉       | 360/1208 [09:52<23:14,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.00064, train/loss_step=0.188, global_step=6431.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  30%|██▉       | 360/1208 [09:52<23:14,  1.64s/it, loss=0.149, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000968, train/loss_step=0.233, global_step=6431.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  30%|██▉       | 361/1208 [09:53<23:11,  1.64s/it, loss=0.149, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000968, train/loss_step=0.233, global_step=6431.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  30%|██▉       | 361/1208 [09:53<23:11,  1.64s/it, loss=0.162, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00351, train/loss_step=0.454, global_step=6432.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  30%|██▉       | 362/1208 [09:54<23:08,  1.64s/it, loss=0.162, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00351, train/loss_step=0.454, global_step=6432.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  30%|██▉       | 362/1208 [09:54<23:08,  1.64s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0609, train/loss_vlb_step=0.000211, train/loss_step=0.0609, global_step=6432.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  30%|███       | 363/1208 [09:55<23:05,  1.64s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0609, train/loss_vlb_step=0.000211, train/loss_step=0.0609, global_step=6432.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  30%|███       | 363/1208 [09:55<23:05,  1.64s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000132, train/loss_step=0.0361, global_step=6432.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  30%|███       | 364/1208 [09:58<23:06,  1.64s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000132, train/loss_step=0.0361, global_step=6432.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  30%|███       | 364/1208 [09:58<23:06,  1.64s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.68e-5, train/loss_step=0.0131, global_step=6432.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  30%|███       | 365/1208 [09:59<23:03,  1.64s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.68e-5, train/loss_step=0.0131, global_step=6432.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  30%|███       | 365/1208 [09:59<23:03,  1.64s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.000103, train/loss_step=0.0256, global_step=6433.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  30%|███       | 366/1208 [10:00<23:00,  1.64s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.000103, train/loss_step=0.0256, global_step=6433.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  30%|███       | 366/1208 [10:00<23:00,  1.64s/it, loss=0.166, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00237, train/loss_step=0.353, global_step=6433.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  30%|███       | 367/1208 [10:01<22:57,  1.64s/it, loss=0.166, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00237, train/loss_step=0.353, global_step=6433.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  30%|███       | 367/1208 [10:01<22:57,  1.64s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0736, train/loss_vlb_step=0.000245, train/loss_step=0.0736, global_step=6433.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  30%|███       | 368/1208 [10:03<22:58,  1.64s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0736, train/loss_vlb_step=0.000245, train/loss_step=0.0736, global_step=6433.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  30%|███       | 368/1208 [10:03<22:58,  1.64s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00146, train/loss_vlb_step=8.83e-6, train/loss_step=0.00146, global_step=6433.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  31%|███       | 369/1208 [10:04<22:55,  1.64s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00146, train/loss_vlb_step=8.83e-6, train/loss_step=0.00146, global_step=6433.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  31%|███       | 369/1208 [10:04<22:55,  1.64s/it, loss=0.153, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.32e-5, train/loss_step=0.023, global_step=6434.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  31%|███       | 370/1208 [10:05<22:52,  1.64s/it, loss=0.153, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.32e-5, train/loss_step=0.023, global_step=6434.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  31%|███       | 370/1208 [10:05<22:52,  1.64s/it, loss=0.147, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000442, train/loss_step=0.132, global_step=6434.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  31%|███       | 371/1208 [10:07<22:49,  1.64s/it, loss=0.147, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000442, train/loss_step=0.132, global_step=6434.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  31%|███       | 371/1208 [10:07<22:49,  1.64s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0847, train/loss_vlb_step=0.00028, train/loss_step=0.0847, global_step=6434.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  31%|███       | 372/1208 [10:09<22:50,  1.64s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0847, train/loss_vlb_step=0.00028, train/loss_step=0.0847, global_step=6434.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  31%|███       | 372/1208 [10:09<22:50,  1.64s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.74e-5, train/loss_step=0.00299, global_step=6434.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  31%|███       | 373/1208 [10:10<22:47,  1.64s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.74e-5, train/loss_step=0.00299, global_step=6434.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  31%|███       | 373/1208 [10:10<22:47,  1.64s/it, loss=0.157, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.0006, train/loss_step=0.173, global_step=6435.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]     Epoch 21:  31%|███       | 374/1208 [10:11<22:44,  1.64s/it, loss=0.157, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.0006, train/loss_step=0.173, global_step=6435.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  31%|███       | 374/1208 [10:11<22:44,  1.64s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00963, train/loss_vlb_step=4.35e-5, train/loss_step=0.00963, global_step=6435.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  31%|███       | 375/1208 [10:12<22:41,  1.63s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00963, train/loss_vlb_step=4.35e-5, train/loss_step=0.00963, global_step=6435.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  31%|███       | 375/1208 [10:12<22:41,  1.63s/it, loss=0.13, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000723, train/loss_step=0.202, global_step=6435.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  31%|███       | 376/1208 [10:15<22:42,  1.64s/it, loss=0.13, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000723, train/loss_step=0.202, global_step=6435.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  31%|███       | 376/1208 [10:15<22:42,  1.64s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000104, train/loss_step=0.0263, global_step=6435.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  31%|███       | 377/1208 [10:16<22:39,  1.64s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000104, train/loss_step=0.0263, global_step=6435.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  31%|███       | 377/1208 [10:16<22:39,  1.64s/it, loss=0.116, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000776, train/loss_step=0.200, global_step=6436.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  31%|███▏      | 378/1208 [10:17<22:36,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000776, train/loss_step=0.200, global_step=6436.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  31%|███▏      | 378/1208 [10:17<22:36,  1.63s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000147, train/loss_step=0.0405, global_step=6436.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  31%|███▏      | 379/1208 [10:18<22:33,  1.63s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000147, train/loss_step=0.0405, global_step=6436.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  31%|███▏      | 379/1208 [10:18<22:33,  1.63s/it, loss=0.108, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.41e-5, train/loss_step=0.012, global_step=6436.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  31%|███▏      | 380/1208 [10:21<22:34,  1.64s/it, loss=0.108, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.41e-5, train/loss_step=0.012, global_step=6436.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  31%|███▏      | 380/1208 [10:21<22:34,  1.64s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0507, train/loss_vlb_step=0.00018, train/loss_step=0.0507, global_step=6436.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  32%|███▏      | 381/1208 [10:22<22:31,  1.63s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0507, train/loss_vlb_step=0.00018, train/loss_step=0.0507, global_step=6436.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  32%|███▏      | 381/1208 [10:22<22:31,  1.63s/it, loss=0.082, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.0004, train/loss_step=0.120, global_step=6437.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  32%|███▏      | 382/1208 [10:23<22:28,  1.63s/it, loss=0.082, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.0004, train/loss_step=0.120, global_step=6437.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  32%|███▏      | 382/1208 [10:23<22:28,  1.63s/it, loss=0.0833, v_num=0, train/loss_simple_step=0.0876, train/loss_vlb_step=0.00029, train/loss_step=0.0876, global_step=6437.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  32%|███▏      | 383/1208 [10:24<22:25,  1.63s/it, loss=0.0833, v_num=0, train/loss_simple_step=0.0876, train/loss_vlb_step=0.00029, train/loss_step=0.0876, global_step=6437.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  32%|███▏      | 383/1208 [10:24<22:25,  1.63s/it, loss=0.082, v_num=0, train/loss_simple_step=0.00977, train/loss_vlb_step=4.53e-5, train/loss_step=0.00977, global_step=6437.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  32%|███▏      | 384/1208 [10:27<22:26,  1.63s/it, loss=0.082, v_num=0, train/loss_simple_step=0.00977, train/loss_vlb_step=4.53e-5, train/loss_step=0.00977, global_step=6437.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  32%|███▏      | 384/1208 [10:27<22:26,  1.63s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.56e-5, train/loss_step=0.0179, global_step=6437.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  32%|███▏      | 385/1208 [10:28<22:23,  1.63s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.56e-5, train/loss_step=0.0179, global_step=6437.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  32%|███▏      | 385/1208 [10:28<22:23,  1.63s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=6438.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  32%|███▏      | 386/1208 [10:29<22:20,  1.63s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=6438.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  32%|███▏      | 386/1208 [10:29<22:20,  1.63s/it, loss=0.072, v_num=0, train/loss_simple_step=0.0421, train/loss_vlb_step=0.000152, train/loss_step=0.0421, global_step=6438.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  32%|███▏      | 387/1208 [10:30<22:17,  1.63s/it, loss=0.072, v_num=0, train/loss_simple_step=0.0421, train/loss_vlb_step=0.000152, train/loss_step=0.0421, global_step=6438.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  32%|███▏      | 387/1208 [10:30<22:17,  1.63s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.570, train/loss_vlb_step=0.00957, train/loss_step=0.570, global_step=6438.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  32%|███▏      | 388/1208 [10:33<22:18,  1.63s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.570, train/loss_vlb_step=0.00957, train/loss_step=0.570, global_step=6438.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  32%|███▏      | 388/1208 [10:33<22:18,  1.63s/it, loss=0.097, v_num=0, train/loss_simple_step=0.0054, train/loss_vlb_step=2.84e-5, train/loss_step=0.0054, global_step=6438.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  32%|███▏      | 389/1208 [10:34<22:15,  1.63s/it, loss=0.097, v_num=0, train/loss_simple_step=0.0054, train/loss_vlb_step=2.84e-5, train/loss_step=0.0054, global_step=6438.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  32%|███▏      | 389/1208 [10:34<22:15,  1.63s/it, loss=0.096, v_num=0, train/loss_simple_step=0.00338, train/loss_vlb_step=1.89e-5, train/loss_step=0.00338, global_step=6439.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  32%|███▏      | 390/1208 [10:35<22:12,  1.63s/it, loss=0.096, v_num=0, train/loss_simple_step=0.00338, train/loss_vlb_step=1.89e-5, train/loss_step=0.00338, global_step=6439.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  32%|███▏      | 390/1208 [10:35<22:12,  1.63s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.0004, train/loss_step=0.122, global_step=6439.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  32%|███▏      | 391/1208 [10:36<22:10,  1.63s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.0004, train/loss_step=0.122, global_step=6439.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  32%|███▏      | 391/1208 [10:36<22:10,  1.63s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.69e-5, train/loss_step=0.0125, global_step=6439.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  32%|███▏      | 392/1208 [10:39<22:11,  1.63s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.69e-5, train/loss_step=0.0125, global_step=6439.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  32%|███▏      | 392/1208 [10:39<22:11,  1.63s/it, loss=0.095, v_num=0, train/loss_simple_step=0.0663, train/loss_vlb_step=0.000228, train/loss_step=0.0663, global_step=6439.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  33%|███▎      | 393/1208 [10:40<22:08,  1.63s/it, loss=0.095, v_num=0, train/loss_simple_step=0.0663, train/loss_vlb_step=0.000228, train/loss_step=0.0663, global_step=6439.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  33%|███▎      | 393/1208 [10:40<22:08,  1.63s/it, loss=0.087, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.67e-5, train/loss_step=0.0127, global_step=6440.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  33%|███▎      | 394/1208 [10:41<22:05,  1.63s/it, loss=0.087, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.67e-5, train/loss_step=0.0127, global_step=6440.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  33%|███▎      | 394/1208 [10:41<22:05,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.691, train/loss_vlb_step=0.0506, train/loss_step=0.691, global_step=6440.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  33%|███▎      | 395/1208 [10:42<22:02,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.691, train/loss_vlb_step=0.0506, train/loss_step=0.691, global_step=6440.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  33%|███▎      | 395/1208 [10:42<22:02,  1.63s/it, loss=0.118, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000502, train/loss_step=0.149, global_step=6440.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  33%|███▎      | 396/1208 [10:45<22:03,  1.63s/it, loss=0.118, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000502, train/loss_step=0.149, global_step=6440.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  33%|███▎      | 396/1208 [10:45<22:03,  1.63s/it, loss=0.128, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000867, train/loss_step=0.221, global_step=6440.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  33%|███▎      | 397/1208 [10:46<22:00,  1.63s/it, loss=0.128, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000867, train/loss_step=0.221, global_step=6440.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  33%|███▎      | 397/1208 [10:46<22:00,  1.63s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.6e-5, train/loss_step=0.0183, global_step=6441.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  33%|███▎      | 398/1208 [10:47<21:57,  1.63s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.6e-5, train/loss_step=0.0183, global_step=6441.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  33%|███▎      | 398/1208 [10:47<21:57,  1.63s/it, loss=0.14, v_num=0, train/loss_simple_step=0.456, train/loss_vlb_step=0.00461, train/loss_step=0.456, global_step=6441.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  33%|███▎      | 399/1208 [10:48<21:54,  1.62s/it, loss=0.14, v_num=0, train/loss_simple_step=0.456, train/loss_vlb_step=0.00461, train/loss_step=0.456, global_step=6441.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  33%|███▎      | 399/1208 [10:48<21:54,  1.62s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.08e-5, train/loss_step=0.00182, global_step=6441.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  33%|███▎      | 400/1208 [10:51<21:55,  1.63s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.08e-5, train/loss_step=0.00182, global_step=6441.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  33%|███▎      | 400/1208 [10:51<21:55,  1.63s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00377, train/loss_vlb_step=2.01e-5, train/loss_step=0.00377, global_step=6441.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  33%|███▎      | 401/1208 [10:52<21:52,  1.63s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00377, train/loss_vlb_step=2.01e-5, train/loss_step=0.00377, global_step=6441.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  33%|███▎      | 401/1208 [10:52<21:52,  1.63s/it, loss=0.141, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000721, train/loss_step=0.200, global_step=6442.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  33%|███▎      | 402/1208 [10:53<21:49,  1.63s/it, loss=0.141, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000721, train/loss_step=0.200, global_step=6442.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  33%|███▎      | 402/1208 [10:53<21:49,  1.63s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00959, train/loss_vlb_step=4.57e-5, train/loss_step=0.00959, global_step=6442.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  33%|███▎      | 403/1208 [10:54<21:46,  1.62s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00959, train/loss_vlb_step=4.57e-5, train/loss_step=0.00959, global_step=6442.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  33%|███▎      | 403/1208 [10:54<21:46,  1.62s/it, loss=0.143, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=6442.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  33%|███▎      | 404/1208 [10:57<21:47,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=6442.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  33%|███▎      | 404/1208 [10:57<21:47,  1.63s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00323, train/loss_vlb_step=1.77e-5, train/loss_step=0.00323, global_step=6442.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  34%|███▎      | 405/1208 [10:58<21:44,  1.63s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00323, train/loss_vlb_step=1.77e-5, train/loss_step=0.00323, global_step=6442.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  34%|███▎      | 405/1208 [10:58<21:44,  1.63s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0624, train/loss_vlb_step=0.000218, train/loss_step=0.0624, global_step=6443.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  34%|███▎      | 406/1208 [10:59<21:42,  1.62s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0624, train/loss_vlb_step=0.000218, train/loss_step=0.0624, global_step=6443.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  34%|███▎      | 406/1208 [10:59<21:42,  1.62s/it, loss=0.15, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00134, train/loss_step=0.267, global_step=6443.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  34%|███▎      | 407/1208 [11:00<21:39,  1.62s/it, loss=0.15, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00134, train/loss_step=0.267, global_step=6443.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  34%|███▎      | 407/1208 [11:00<21:39,  1.62s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.69e-5, train/loss_step=0.0128, global_step=6443.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  34%|███▍      | 408/1208 [11:03<21:40,  1.63s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.69e-5, train/loss_step=0.0128, global_step=6443.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  34%|███▍      | 408/1208 [11:03<21:40,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.037, train/loss_vlb_step=0.000137, train/loss_step=0.037, global_step=6443.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  34%|███▍      | 409/1208 [11:04<21:37,  1.62s/it, loss=0.124, v_num=0, train/loss_simple_step=0.037, train/loss_vlb_step=0.000137, train/loss_step=0.037, global_step=6443.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  34%|███▍      | 409/1208 [11:04<21:37,  1.62s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0523, train/loss_vlb_step=0.000187, train/loss_step=0.0523, global_step=6444.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  34%|███▍      | 410/1208 [11:05<21:34,  1.62s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0523, train/loss_vlb_step=0.000187, train/loss_step=0.0523, global_step=6444.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  34%|███▍      | 410/1208 [11:05<21:34,  1.62s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.3e-5, train/loss_step=0.00222, global_step=6444.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  34%|███▍      | 411/1208 [11:06<21:31,  1.62s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.3e-5, train/loss_step=0.00222, global_step=6444.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  34%|███▍      | 411/1208 [11:06<21:31,  1.62s/it, loss=0.14, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00216, train/loss_step=0.404, global_step=6444.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  34%|███▍      | 412/1208 [11:08<21:32,  1.62s/it, loss=0.14, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00216, train/loss_step=0.404, global_step=6444.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  34%|███▍      | 412/1208 [11:08<21:32,  1.62s/it, loss=0.145, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000563, train/loss_step=0.169, global_step=6444.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  34%|███▍      | 413/1208 [11:10<21:29,  1.62s/it, loss=0.145, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000563, train/loss_step=0.169, global_step=6444.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  34%|███▍      | 413/1208 [11:10<21:29,  1.62s/it, loss=0.171, v_num=0, train/loss_simple_step=0.530, train/loss_vlb_step=0.00663, train/loss_step=0.530, global_step=6445.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  34%|███▍      | 414/1208 [11:11<21:26,  1.62s/it, loss=0.171, v_num=0, train/loss_simple_step=0.530, train/loss_vlb_step=0.00663, train/loss_step=0.530, global_step=6445.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  34%|███▍      | 414/1208 [11:11<21:26,  1.62s/it, loss=0.155, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00229, train/loss_step=0.361, global_step=6445.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  34%|███▍      | 415/1208 [11:12<21:24,  1.62s/it, loss=0.155, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00229, train/loss_step=0.361, global_step=6445.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  34%|███▍      | 415/1208 [11:12<21:24,  1.62s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.000141, train/loss_step=0.0379, global_step=6445.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  34%|███▍      | 416/1208 [11:14<21:24,  1.62s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.000141, train/loss_step=0.0379, global_step=6445.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  34%|███▍      | 416/1208 [11:14<21:24,  1.62s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0599, train/loss_vlb_step=0.0002, train/loss_step=0.0599, global_step=6445.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  35%|███▍      | 417/1208 [11:15<21:22,  1.62s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0599, train/loss_vlb_step=0.0002, train/loss_step=0.0599, global_step=6445.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  35%|███▍      | 417/1208 [11:15<21:22,  1.62s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000108, train/loss_step=0.0272, global_step=6446.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  35%|███▍      | 418/1208 [11:16<21:19,  1.62s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000108, train/loss_step=0.0272, global_step=6446.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  35%|███▍      | 418/1208 [11:16<21:19,  1.62s/it, loss=0.137, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00228, train/loss_step=0.367, global_step=6446.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  35%|███▍      | 419/1208 [11:17<21:16,  1.62s/it, loss=0.137, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00228, train/loss_step=0.367, global_step=6446.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  35%|███▍      | 419/1208 [11:17<21:16,  1.62s/it, loss=0.152, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00147, train/loss_step=0.293, global_step=6446.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  35%|███▍      | 420/1208 [11:20<21:17,  1.62s/it, loss=0.152, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00147, train/loss_step=0.293, global_step=6446.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  35%|███▍      | 420/1208 [11:20<21:17,  1.62s/it, loss=0.175, v_num=0, train/loss_simple_step=0.472, train/loss_vlb_step=0.00434, train/loss_step=0.472, global_step=6446.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  35%|███▍      | 421/1208 [11:21<21:14,  1.62s/it, loss=0.175, v_num=0, train/loss_simple_step=0.472, train/loss_vlb_step=0.00434, train/loss_step=0.472, global_step=6446.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  35%|███▍      | 421/1208 [11:21<21:14,  1.62s/it, loss=0.18, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00152, train/loss_step=0.300, global_step=6447.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  35%|███▍      | 422/1208 [11:22<21:11,  1.62s/it, loss=0.18, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00152, train/loss_step=0.300, global_step=6447.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  35%|███▍      | 422/1208 [11:22<21:11,  1.62s/it, loss=0.196, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00159, train/loss_step=0.333, global_step=6447.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  35%|███▌      | 423/1208 [11:23<21:09,  1.62s/it, loss=0.196, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00159, train/loss_step=0.333, global_step=6447.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  35%|███▌      | 423/1208 [11:23<21:09,  1.62s/it, loss=0.199, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000679, train/loss_step=0.196, global_step=6447.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  35%|███▌      | 424/1208 [11:27<21:10,  1.62s/it, loss=0.199, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000679, train/loss_step=0.196, global_step=6447.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  35%|███▌      | 424/1208 [11:27<21:10,  1.62s/it, loss=0.205, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000369, train/loss_step=0.111, global_step=6447.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  35%|███▌      | 425/1208 [11:28<21:07,  1.62s/it, loss=0.205, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000369, train/loss_step=0.111, global_step=6447.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  35%|███▌      | 425/1208 [11:28<21:07,  1.62s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0886, train/loss_vlb_step=0.000294, train/loss_step=0.0886, global_step=6448.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  35%|███▌      | 426/1208 [11:29<21:05,  1.62s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0886, train/loss_vlb_step=0.000294, train/loss_step=0.0886, global_step=6448.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  35%|███▌      | 426/1208 [11:29<21:05,  1.62s/it, loss=0.2, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.00047, train/loss_step=0.142, global_step=6448.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]     Epoch 21:  35%|███▌      | 427/1208 [11:30<21:02,  1.62s/it, loss=0.2, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.00047, train/loss_step=0.142, global_step=6448.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  35%|███▌      | 427/1208 [11:30<21:02,  1.62s/it, loss=0.231, v_num=0, train/loss_simple_step=0.643, train/loss_vlb_step=0.0139, train/loss_step=0.643, global_step=6448.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  35%|███▌      | 428/1208 [11:33<21:03,  1.62s/it, loss=0.231, v_num=0, train/loss_simple_step=0.643, train/loss_vlb_step=0.0139, train/loss_step=0.643, global_step=6448.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  35%|███▌      | 428/1208 [11:33<21:03,  1.62s/it, loss=0.23, v_num=0, train/loss_simple_step=0.00817, train/loss_vlb_step=3.95e-5, train/loss_step=0.00817, global_step=6448.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  36%|███▌      | 429/1208 [11:34<21:01,  1.62s/it, loss=0.23, v_num=0, train/loss_simple_step=0.00817, train/loss_vlb_step=3.95e-5, train/loss_step=0.00817, global_step=6448.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  36%|███▌      | 429/1208 [11:34<21:01,  1.62s/it, loss=0.244, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.0023, train/loss_step=0.342, global_step=6449.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  36%|███▌      | 430/1208 [11:35<20:58,  1.62s/it, loss=0.244, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.0023, train/loss_step=0.342, global_step=6449.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  36%|███▌      | 430/1208 [11:35<20:58,  1.62s/it, loss=0.246, v_num=0, train/loss_simple_step=0.0377, train/loss_vlb_step=0.00014, train/loss_step=0.0377, global_step=6449.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  36%|███▌      | 431/1208 [11:36<20:55,  1.62s/it, loss=0.246, v_num=0, train/loss_simple_step=0.0377, train/loss_vlb_step=0.00014, train/loss_step=0.0377, global_step=6449.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  36%|███▌      | 431/1208 [11:36<20:55,  1.62s/it, loss=0.227, v_num=0, train/loss_simple_step=0.0315, train/loss_vlb_step=0.000116, train/loss_step=0.0315, global_step=6449.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  36%|███▌      | 432/1208 [11:39<20:56,  1.62s/it, loss=0.227, v_num=0, train/loss_simple_step=0.0315, train/loss_vlb_step=0.000116, train/loss_step=0.0315, global_step=6449.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  36%|███▌      | 432/1208 [11:39<20:56,  1.62s/it, loss=0.231, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000908, train/loss_step=0.239, global_step=6449.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  36%|███▌      | 433/1208 [11:40<20:54,  1.62s/it, loss=0.231, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000908, train/loss_step=0.239, global_step=6449.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  36%|███▌      | 433/1208 [11:40<20:54,  1.62s/it, loss=0.215, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000818, train/loss_step=0.212, global_step=6450.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  36%|███▌      | 434/1208 [11:41<20:51,  1.62s/it, loss=0.215, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000818, train/loss_step=0.212, global_step=6450.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  36%|███▌      | 434/1208 [11:41<20:51,  1.62s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.000142, train/loss_step=0.0395, global_step=6450.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  36%|███▌      | 435/1208 [11:42<20:49,  1.62s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.000142, train/loss_step=0.0395, global_step=6450.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  36%|███▌      | 435/1208 [11:42<20:49,  1.62s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=1.85e-5, train/loss_step=0.00322, global_step=6450.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  36%|███▌      | 436/1208 [11:46<20:50,  1.62s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=1.85e-5, train/loss_step=0.00322, global_step=6450.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  36%|███▌      | 436/1208 [11:46<20:50,  1.62s/it, loss=0.199, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000333, train/loss_step=0.101, global_step=6450.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  36%|███▌      | 437/1208 [11:47<20:47,  1.62s/it, loss=0.199, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000333, train/loss_step=0.101, global_step=6450.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  36%|███▌      | 437/1208 [11:47<20:47,  1.62s/it, loss=0.202, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000286, train/loss_step=0.086, global_step=6451.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  36%|███▋      | 438/1208 [11:48<20:44,  1.62s/it, loss=0.202, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000286, train/loss_step=0.086, global_step=6451.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  36%|███▋      | 438/1208 [11:48<20:44,  1.62s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=2.08e-5, train/loss_step=0.00365, global_step=6451.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  36%|███▋      | 439/1208 [11:49<20:42,  1.62s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=2.08e-5, train/loss_step=0.00365, global_step=6451.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  36%|███▋      | 439/1208 [11:49<20:42,  1.62s/it, loss=0.21, v_num=0, train/loss_simple_step=0.804, train/loss_vlb_step=0.0685, train/loss_step=0.804, global_step=6451.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]      Epoch 21:  36%|███▋      | 440/1208 [11:52<20:43,  1.62s/it, loss=0.21, v_num=0, train/loss_simple_step=0.804, train/loss_vlb_step=0.0685, train/loss_step=0.804, global_step=6451.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  36%|███▋      | 440/1208 [11:52<20:43,  1.62s/it, loss=0.189, v_num=0, train/loss_simple_step=0.068, train/loss_vlb_step=0.000224, train/loss_step=0.068, global_step=6451.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  37%|███▋      | 441/1208 [11:53<20:40,  1.62s/it, loss=0.189, v_num=0, train/loss_simple_step=0.068, train/loss_vlb_step=0.000224, train/loss_step=0.068, global_step=6451.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  37%|███▋      | 441/1208 [11:53<20:40,  1.62s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0495, train/loss_vlb_step=0.000173, train/loss_step=0.0495, global_step=6452.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  37%|███▋      | 442/1208 [11:54<20:38,  1.62s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0495, train/loss_vlb_step=0.000173, train/loss_step=0.0495, global_step=6452.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  37%|███▋      | 442/1208 [11:54<20:38,  1.62s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00732, train/loss_vlb_step=3.5e-5, train/loss_step=0.00732, global_step=6452.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  37%|███▋      | 443/1208 [11:55<20:35,  1.62s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00732, train/loss_vlb_step=3.5e-5, train/loss_step=0.00732, global_step=6452.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  37%|███▋      | 443/1208 [11:55<20:35,  1.62s/it, loss=0.158, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000463, train/loss_step=0.140, global_step=6452.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  37%|███▋      | 444/1208 [11:58<20:36,  1.62s/it, loss=0.158, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000463, train/loss_step=0.140, global_step=6452.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  37%|███▋      | 444/1208 [11:58<20:36,  1.62s/it, loss=0.179, v_num=0, train/loss_simple_step=0.536, train/loss_vlb_step=0.00527, train/loss_step=0.536, global_step=6452.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  37%|███▋      | 445/1208 [11:59<20:34,  1.62s/it, loss=0.179, v_num=0, train/loss_simple_step=0.536, train/loss_vlb_step=0.00527, train/loss_step=0.536, global_step=6452.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  37%|███▋      | 445/1208 [11:59<20:34,  1.62s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00758, train/loss_vlb_step=3.58e-5, train/loss_step=0.00758, global_step=6453.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  37%|███▋      | 446/1208 [12:00<20:31,  1.62s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00758, train/loss_vlb_step=3.58e-5, train/loss_step=0.00758, global_step=6453.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  37%|███▋      | 446/1208 [12:00<20:31,  1.62s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0989, train/loss_vlb_step=0.000326, train/loss_step=0.0989, global_step=6453.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  37%|███▋      | 447/1208 [12:01<20:28,  1.61s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0989, train/loss_vlb_step=0.000326, train/loss_step=0.0989, global_step=6453.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  37%|███▋      | 447/1208 [12:01<20:28,  1.61s/it, loss=0.163, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00342, train/loss_step=0.442, global_step=6453.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  37%|███▋      | 448/1208 [12:04<20:29,  1.62s/it, loss=0.163, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00342, train/loss_step=0.442, global_step=6453.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  37%|███▋      | 448/1208 [12:04<20:29,  1.62s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0452, train/loss_vlb_step=0.000166, train/loss_step=0.0452, global_step=6453.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  37%|███▋      | 449/1208 [12:06<20:27,  1.62s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0452, train/loss_vlb_step=0.000166, train/loss_step=0.0452, global_step=6453.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  37%|███▋      | 449/1208 [12:06<20:27,  1.62s/it, loss=0.158, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.00081, train/loss_step=0.202, global_step=6454.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  37%|███▋      | 450/1208 [12:07<20:24,  1.62s/it, loss=0.158, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.00081, train/loss_step=0.202, global_step=6454.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  37%|███▋      | 450/1208 [12:07<20:24,  1.62s/it, loss=0.17, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00153, train/loss_step=0.284, global_step=6454.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  37%|███▋      | 451/1208 [12:08<20:22,  1.61s/it, loss=0.17, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00153, train/loss_step=0.284, global_step=6454.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  37%|███▋      | 451/1208 [12:08<20:22,  1.61s/it, loss=0.193, v_num=0, train/loss_simple_step=0.494, train/loss_vlb_step=0.00684, train/loss_step=0.494, global_step=6454.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  37%|███▋      | 452/1208 [12:11<20:23,  1.62s/it, loss=0.193, v_num=0, train/loss_simple_step=0.494, train/loss_vlb_step=0.00684, train/loss_step=0.494, global_step=6454.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  37%|███▋      | 452/1208 [12:11<20:23,  1.62s/it, loss=0.197, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00136, train/loss_step=0.309, global_step=6454.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  38%|███▊      | 453/1208 [12:12<20:20,  1.62s/it, loss=0.197, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00136, train/loss_step=0.309, global_step=6454.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  38%|███▊      | 453/1208 [12:12<20:20,  1.62s/it, loss=0.198, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000935, train/loss_step=0.236, global_step=6455.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  38%|███▊      | 454/1208 [12:13<20:18,  1.62s/it, loss=0.198, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000935, train/loss_step=0.236, global_step=6455.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  38%|███▊      | 454/1208 [12:13<20:18,  1.62s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.17e-5, train/loss_step=0.0109, global_step=6455.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  38%|███▊      | 455/1208 [12:14<20:15,  1.61s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.17e-5, train/loss_step=0.0109, global_step=6455.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  38%|███▊      | 455/1208 [12:14<20:15,  1.61s/it, loss=0.214, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00217, train/loss_step=0.350, global_step=6455.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  38%|███▊      | 456/1208 [12:17<20:16,  1.62s/it, loss=0.214, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00217, train/loss_step=0.350, global_step=6455.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  38%|███▊      | 456/1208 [12:17<20:16,  1.62s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.59e-5, train/loss_step=0.0177, global_step=6455.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  38%|███▊      | 457/1208 [12:18<20:13,  1.62s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.59e-5, train/loss_step=0.0177, global_step=6455.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  38%|███▊      | 457/1208 [12:18<20:13,  1.62s/it, loss=0.212, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000424, train/loss_step=0.129, global_step=6456.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  38%|███▊      | 458/1208 [12:19<20:11,  1.62s/it, loss=0.212, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000424, train/loss_step=0.129, global_step=6456.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  38%|███▊      | 458/1208 [12:19<20:11,  1.62s/it, loss=0.212, v_num=0, train/loss_simple_step=0.00585, train/loss_vlb_step=2.9e-5, train/loss_step=0.00585, global_step=6456.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  38%|███▊      | 459/1208 [12:20<20:08,  1.61s/it, loss=0.212, v_num=0, train/loss_simple_step=0.00585, train/loss_vlb_step=2.9e-5, train/loss_step=0.00585, global_step=6456.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  38%|███▊      | 459/1208 [12:20<20:08,  1.61s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0924, train/loss_vlb_step=0.000306, train/loss_step=0.0924, global_step=6456.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  38%|███▊      | 460/1208 [12:23<20:09,  1.62s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0924, train/loss_vlb_step=0.000306, train/loss_step=0.0924, global_step=6456.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  38%|███▊      | 460/1208 [12:23<20:09,  1.62s/it, loss=0.195, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.00308, train/loss_step=0.450, global_step=6456.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  38%|███▊      | 461/1208 [12:24<20:07,  1.62s/it, loss=0.195, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.00308, train/loss_step=0.450, global_step=6456.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  38%|███▊      | 461/1208 [12:24<20:07,  1.62s/it, loss=0.202, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000641, train/loss_step=0.182, global_step=6457.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  38%|███▊      | 462/1208 [12:26<20:04,  1.61s/it, loss=0.202, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000641, train/loss_step=0.182, global_step=6457.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  38%|███▊      | 462/1208 [12:26<20:04,  1.61s/it, loss=0.215, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00138, train/loss_step=0.277, global_step=6457.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  38%|███▊      | 463/1208 [12:27<20:02,  1.61s/it, loss=0.215, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00138, train/loss_step=0.277, global_step=6457.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  38%|███▊      | 463/1208 [12:27<20:02,  1.61s/it, loss=0.219, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000781, train/loss_step=0.207, global_step=6457.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  38%|███▊      | 464/1208 [12:30<20:02,  1.62s/it, loss=0.219, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000781, train/loss_step=0.207, global_step=6457.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  38%|███▊      | 464/1208 [12:30<20:02,  1.62s/it, loss=0.211, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00253, train/loss_step=0.381, global_step=6457.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  38%|███▊      | 465/1208 [12:31<20:00,  1.62s/it, loss=0.211, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00253, train/loss_step=0.381, global_step=6457.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  38%|███▊      | 465/1208 [12:31<20:00,  1.62s/it, loss=0.223, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000884, train/loss_step=0.237, global_step=6458.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  39%|███▊      | 466/1208 [12:32<19:57,  1.61s/it, loss=0.223, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000884, train/loss_step=0.237, global_step=6458.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  39%|███▊      | 466/1208 [12:32<19:57,  1.61s/it, loss=0.24, v_num=0, train/loss_simple_step=0.446, train/loss_vlb_step=0.00478, train/loss_step=0.446, global_step=6458.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  39%|███▊      | 467/1208 [12:33<19:55,  1.61s/it, loss=0.24, v_num=0, train/loss_simple_step=0.446, train/loss_vlb_step=0.00478, train/loss_step=0.446, global_step=6458.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  39%|███▊      | 467/1208 [12:33<19:55,  1.61s/it, loss=0.229, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000951, train/loss_step=0.227, global_step=6458.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  39%|███▊      | 468/1208 [12:36<19:56,  1.62s/it, loss=0.229, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000951, train/loss_step=0.227, global_step=6458.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  39%|███▊      | 468/1208 [12:36<19:56,  1.62s/it, loss=0.227, v_num=0, train/loss_simple_step=0.00914, train/loss_vlb_step=4.13e-5, train/loss_step=0.00914, global_step=6458.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  39%|███▉      | 469/1208 [12:37<19:53,  1.62s/it, loss=0.227, v_num=0, train/loss_simple_step=0.00914, train/loss_vlb_step=4.13e-5, train/loss_step=0.00914, global_step=6458.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  39%|███▉      | 469/1208 [12:37<19:53,  1.62s/it, loss=0.224, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000439, train/loss_step=0.133, global_step=6459.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  39%|███▉      | 470/1208 [12:38<19:51,  1.61s/it, loss=0.224, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000439, train/loss_step=0.133, global_step=6459.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  39%|███▉      | 470/1208 [12:38<19:51,  1.61s/it, loss=0.21, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=9.34e-6, train/loss_step=0.00156, global_step=6459.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  39%|███▉      | 471/1208 [12:39<19:48,  1.61s/it, loss=0.21, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=9.34e-6, train/loss_step=0.00156, global_step=6459.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  39%|███▉      | 471/1208 [12:39<19:48,  1.61s/it, loss=0.205, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00313, train/loss_step=0.402, global_step=6459.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  39%|███▉      | 472/1208 [12:42<19:49,  1.62s/it, loss=0.205, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00313, train/loss_step=0.402, global_step=6459.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  39%|███▉      | 472/1208 [12:42<19:49,  1.62s/it, loss=0.19, v_num=0, train/loss_simple_step=0.00567, train/loss_vlb_step=2.83e-5, train/loss_step=0.00567, global_step=6459.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  39%|███▉      | 473/1208 [12:43<19:47,  1.62s/it, loss=0.19, v_num=0, train/loss_simple_step=0.00567, train/loss_vlb_step=2.83e-5, train/loss_step=0.00567, global_step=6459.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  39%|███▉      | 473/1208 [12:43<19:47,  1.62s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0981, train/loss_vlb_step=0.000323, train/loss_step=0.0981, global_step=6460.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  39%|███▉      | 474/1208 [12:45<19:44,  1.61s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0981, train/loss_vlb_step=0.000323, train/loss_step=0.0981, global_step=6460.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  39%|███▉      | 474/1208 [12:45<19:44,  1.61s/it, loss=0.212, v_num=0, train/loss_simple_step=0.579, train/loss_vlb_step=0.0162, train/loss_step=0.579, global_step=6460.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  39%|███▉      | 475/1208 [12:46<19:42,  1.61s/it, loss=0.212, v_num=0, train/loss_simple_step=0.579, train/loss_vlb_step=0.0162, train/loss_step=0.579, global_step=6460.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  39%|███▉      | 475/1208 [12:46<19:42,  1.61s/it, loss=0.229, v_num=0, train/loss_simple_step=0.699, train/loss_vlb_step=0.0128, train/loss_step=0.699, global_step=6460.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  39%|███▉      | 476/1208 [12:49<19:42,  1.62s/it, loss=0.229, v_num=0, train/loss_simple_step=0.699, train/loss_vlb_step=0.0128, train/loss_step=0.699, global_step=6460.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  39%|███▉      | 476/1208 [12:49<19:42,  1.62s/it, loss=0.242, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00152, train/loss_step=0.280, global_step=6460.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  39%|███▉      | 477/1208 [12:50<19:40,  1.61s/it, loss=0.242, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00152, train/loss_step=0.280, global_step=6460.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  39%|███▉      | 477/1208 [12:50<19:40,  1.61s/it, loss=0.25, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00135, train/loss_step=0.292, global_step=6461.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  40%|███▉      | 478/1208 [12:51<19:38,  1.61s/it, loss=0.25, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00135, train/loss_step=0.292, global_step=6461.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  40%|███▉      | 478/1208 [12:51<19:38,  1.61s/it, loss=0.251, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.88e-5, train/loss_step=0.0108, global_step=6461.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  40%|███▉      | 479/1208 [12:52<19:35,  1.61s/it, loss=0.251, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.88e-5, train/loss_step=0.0108, global_step=6461.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  40%|███▉      | 479/1208 [12:52<19:35,  1.61s/it, loss=0.249, v_num=0, train/loss_simple_step=0.0692, train/loss_vlb_step=0.000236, train/loss_step=0.0692, global_step=6461.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  40%|███▉      | 480/1208 [12:55<19:36,  1.62s/it, loss=0.249, v_num=0, train/loss_simple_step=0.0692, train/loss_vlb_step=0.000236, train/loss_step=0.0692, global_step=6461.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  40%|███▉      | 480/1208 [12:55<19:36,  1.62s/it, loss=0.231, v_num=0, train/loss_simple_step=0.0768, train/loss_vlb_step=0.000255, train/loss_step=0.0768, global_step=6461.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  40%|███▉      | 481/1208 [12:56<19:33,  1.61s/it, loss=0.231, v_num=0, train/loss_simple_step=0.0768, train/loss_vlb_step=0.000255, train/loss_step=0.0768, global_step=6461.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  40%|███▉      | 481/1208 [12:56<19:33,  1.61s/it, loss=0.222, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=1.92e-5, train/loss_step=0.00345, global_step=6462.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  40%|███▉      | 482/1208 [12:57<19:31,  1.61s/it, loss=0.222, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=1.92e-5, train/loss_step=0.00345, global_step=6462.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  40%|███▉      | 482/1208 [12:57<19:31,  1.61s/it, loss=0.216, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000525, train/loss_step=0.154, global_step=6462.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  40%|███▉      | 483/1208 [12:58<19:28,  1.61s/it, loss=0.216, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000525, train/loss_step=0.154, global_step=6462.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  40%|███▉      | 483/1208 [12:58<19:28,  1.61s/it, loss=0.205, v_num=0, train/loss_simple_step=0.00306, train/loss_vlb_step=1.73e-5, train/loss_step=0.00306, global_step=6462.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  40%|████      | 484/1208 [13:01<19:29,  1.62s/it, loss=0.205, v_num=0, train/loss_simple_step=0.00306, train/loss_vlb_step=1.73e-5, train/loss_step=0.00306, global_step=6462.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  40%|████      | 484/1208 [13:01<19:29,  1.62s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0539, train/loss_vlb_step=0.000189, train/loss_step=0.0539, global_step=6462.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  40%|████      | 485/1208 [13:02<19:27,  1.61s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0539, train/loss_vlb_step=0.000189, train/loss_step=0.0539, global_step=6462.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  40%|████      | 485/1208 [13:02<19:27,  1.61s/it, loss=0.209, v_num=0, train/loss_simple_step=0.630, train/loss_vlb_step=0.0115, train/loss_step=0.630, global_step=6463.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  40%|████      | 486/1208 [13:04<19:24,  1.61s/it, loss=0.209, v_num=0, train/loss_simple_step=0.630, train/loss_vlb_step=0.0115, train/loss_step=0.630, global_step=6463.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  40%|████      | 486/1208 [13:04<19:24,  1.61s/it, loss=0.192, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000363, train/loss_step=0.110, global_step=6463.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  40%|████      | 487/1208 [13:05<19:22,  1.61s/it, loss=0.192, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000363, train/loss_step=0.110, global_step=6463.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  40%|████      | 487/1208 [13:05<19:22,  1.61s/it, loss=0.197, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00162, train/loss_step=0.331, global_step=6463.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  40%|████      | 488/1208 [13:08<19:23,  1.62s/it, loss=0.197, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00162, train/loss_step=0.331, global_step=6463.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  40%|████      | 488/1208 [13:08<19:23,  1.62s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000162, train/loss_step=0.0457, global_step=6463.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  40%|████      | 489/1208 [13:09<19:20,  1.61s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000162, train/loss_step=0.0457, global_step=6463.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  40%|████      | 489/1208 [13:09<19:20,  1.61s/it, loss=0.198, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000399, train/loss_step=0.121, global_step=6464.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  41%|████      | 490/1208 [13:10<19:18,  1.61s/it, loss=0.198, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000399, train/loss_step=0.121, global_step=6464.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  41%|████      | 490/1208 [13:10<19:18,  1.61s/it, loss=0.199, v_num=0, train/loss_simple_step=0.00562, train/loss_vlb_step=2.95e-5, train/loss_step=0.00562, global_step=6464.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  41%|████      | 491/1208 [13:11<19:15,  1.61s/it, loss=0.199, v_num=0, train/loss_simple_step=0.00562, train/loss_vlb_step=2.95e-5, train/loss_step=0.00562, global_step=6464.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  41%|████      | 491/1208 [13:11<19:15,  1.61s/it, loss=0.185, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000436, train/loss_step=0.133, global_step=6464.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  41%|████      | 492/1208 [13:14<19:16,  1.62s/it, loss=0.185, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000436, train/loss_step=0.133, global_step=6464.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  41%|████      | 492/1208 [13:14<19:16,  1.62s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.4e-5, train/loss_step=0.00249, global_step=6464.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  41%|████      | 493/1208 [13:15<19:13,  1.61s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.4e-5, train/loss_step=0.00249, global_step=6464.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  41%|████      | 493/1208 [13:15<19:13,  1.61s/it, loss=0.186, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.00041, train/loss_step=0.124, global_step=6465.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  41%|████      | 494/1208 [13:16<19:11,  1.61s/it, loss=0.186, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.00041, train/loss_step=0.124, global_step=6465.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  41%|████      | 494/1208 [13:16<19:11,  1.61s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=4.98e-5, train/loss_step=0.0111, global_step=6465.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  41%|████      | 495/1208 [13:17<19:08,  1.61s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=4.98e-5, train/loss_step=0.0111, global_step=6465.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  41%|████      | 495/1208 [13:17<19:09,  1.61s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.24e-5, train/loss_step=0.00212, global_step=6465.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  41%|████      | 496/1208 [13:20<19:09,  1.61s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.24e-5, train/loss_step=0.00212, global_step=6465.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  41%|████      | 496/1208 [13:20<19:09,  1.61s/it, loss=0.147, v_num=0, train/loss_simple_step=0.769, train/loss_vlb_step=0.0494, train/loss_step=0.769, global_step=6465.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]     Epoch 21:  41%|████      | 497/1208 [13:21<19:07,  1.61s/it, loss=0.147, v_num=0, train/loss_simple_step=0.769, train/loss_vlb_step=0.0494, train/loss_step=0.769, global_step=6465.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  41%|████      | 497/1208 [13:21<19:07,  1.61s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00275, train/loss_vlb_step=1.58e-5, train/loss_step=0.00275, global_step=6466.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  41%|████      | 498/1208 [13:22<19:04,  1.61s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00275, train/loss_vlb_step=1.58e-5, train/loss_step=0.00275, global_step=6466.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  41%|████      | 498/1208 [13:22<19:04,  1.61s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00647, train/loss_vlb_step=3.37e-5, train/loss_step=0.00647, global_step=6466.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  41%|████▏     | 499/1208 [13:23<19:02,  1.61s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00647, train/loss_vlb_step=3.37e-5, train/loss_step=0.00647, global_step=6466.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  41%|████▏     | 499/1208 [13:23<19:02,  1.61s/it, loss=0.157, v_num=0, train/loss_simple_step=0.550, train/loss_vlb_step=0.00608, train/loss_step=0.550, global_step=6466.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  41%|████▏     | 500/1208 [13:27<19:02,  1.61s/it, loss=0.157, v_num=0, train/loss_simple_step=0.550, train/loss_vlb_step=0.00608, train/loss_step=0.550, global_step=6466.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  41%|████▏     | 500/1208 [13:27<19:02,  1.61s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.64e-5, train/loss_step=0.0154, global_step=6466.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  41%|████▏     | 501/1208 [13:28<19:00,  1.61s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.64e-5, train/loss_step=0.0154, global_step=6466.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  41%|████▏     | 501/1208 [13:28<19:00,  1.61s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.2e-5, train/loss_step=0.0167, global_step=6467.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  42%|████▏     | 502/1208 [13:29<18:58,  1.61s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.2e-5, train/loss_step=0.0167, global_step=6467.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  42%|████▏     | 502/1208 [13:29<18:58,  1.61s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.00015, train/loss_step=0.0402, global_step=6467.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  42%|████▏     | 503/1208 [13:30<18:55,  1.61s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.00015, train/loss_step=0.0402, global_step=6467.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  42%|████▏     | 503/1208 [13:30<18:55,  1.61s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0935, train/loss_vlb_step=0.000308, train/loss_step=0.0935, global_step=6467.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  42%|████▏     | 504/1208 [13:33<18:56,  1.61s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0935, train/loss_vlb_step=0.000308, train/loss_step=0.0935, global_step=6467.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  42%|████▏     | 504/1208 [13:33<18:56,  1.61s/it, loss=0.17, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00219, train/loss_step=0.386, global_step=6467.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  42%|████▏     | 505/1208 [13:34<18:53,  1.61s/it, loss=0.17, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00219, train/loss_step=0.386, global_step=6467.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  42%|████▏     | 505/1208 [13:34<18:53,  1.61s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.14e-5, train/loss_step=0.0142, global_step=6468.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  42%|████▏     | 506/1208 [13:35<18:51,  1.61s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.14e-5, train/loss_step=0.0142, global_step=6468.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  42%|████▏     | 506/1208 [13:35<18:51,  1.61s/it, loss=0.139, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=6468.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  42%|████▏     | 507/1208 [13:36<18:49,  1.61s/it, loss=0.139, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=6468.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  42%|████▏     | 507/1208 [13:36<18:49,  1.61s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=1.7e-5, train/loss_step=0.00309, global_step=6468.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  42%|████▏     | 508/1208 [13:39<18:49,  1.61s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=1.7e-5, train/loss_step=0.00309, global_step=6468.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  42%|████▏     | 508/1208 [13:39<18:49,  1.61s/it, loss=0.133, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00117, train/loss_step=0.261, global_step=6468.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  42%|████▏     | 509/1208 [13:40<18:47,  1.61s/it, loss=0.133, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00117, train/loss_step=0.261, global_step=6468.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  42%|████▏     | 509/1208 [13:40<18:47,  1.61s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=8.86e-5, train/loss_step=0.0217, global_step=6469.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  42%|████▏     | 510/1208 [13:41<18:44,  1.61s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=8.86e-5, train/loss_step=0.0217, global_step=6469.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  42%|████▏     | 510/1208 [13:41<18:44,  1.61s/it, loss=0.144, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00172, train/loss_step=0.307, global_step=6469.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  42%|████▏     | 511/1208 [13:42<18:42,  1.61s/it, loss=0.144, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00172, train/loss_step=0.307, global_step=6469.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  42%|████▏     | 511/1208 [13:42<18:42,  1.61s/it, loss=0.162, v_num=0, train/loss_simple_step=0.511, train/loss_vlb_step=0.00584, train/loss_step=0.511, global_step=6469.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  42%|████▏     | 512/1208 [13:46<18:42,  1.61s/it, loss=0.162, v_num=0, train/loss_simple_step=0.511, train/loss_vlb_step=0.00584, train/loss_step=0.511, global_step=6469.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  42%|████▏     | 512/1208 [13:46<18:42,  1.61s/it, loss=0.169, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000429, train/loss_step=0.128, global_step=6469.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  42%|████▏     | 513/1208 [13:47<18:40,  1.61s/it, loss=0.169, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000429, train/loss_step=0.128, global_step=6469.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  42%|████▏     | 513/1208 [13:47<18:40,  1.61s/it, loss=0.186, v_num=0, train/loss_simple_step=0.477, train/loss_vlb_step=0.0045, train/loss_step=0.477, global_step=6470.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  43%|████▎     | 514/1208 [13:48<18:38,  1.61s/it, loss=0.186, v_num=0, train/loss_simple_step=0.477, train/loss_vlb_step=0.0045, train/loss_step=0.477, global_step=6470.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  43%|████▎     | 514/1208 [13:48<18:38,  1.61s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000121, train/loss_step=0.0327, global_step=6470.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  43%|████▎     | 515/1208 [13:49<18:35,  1.61s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000121, train/loss_step=0.0327, global_step=6470.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  43%|████▎     | 515/1208 [13:49<18:35,  1.61s/it, loss=0.22, v_num=0, train/loss_simple_step=0.653, train/loss_vlb_step=0.0193, train/loss_step=0.653, global_step=6470.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]     Epoch 21:  43%|████▎     | 516/1208 [13:52<18:36,  1.61s/it, loss=0.22, v_num=0, train/loss_simple_step=0.653, train/loss_vlb_step=0.0193, train/loss_step=0.653, global_step=6470.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  43%|████▎     | 516/1208 [13:52<18:36,  1.61s/it, loss=0.188, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.00041, train/loss_step=0.120, global_step=6470.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  43%|████▎     | 517/1208 [13:53<18:34,  1.61s/it, loss=0.188, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.00041, train/loss_step=0.120, global_step=6470.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  43%|████▎     | 517/1208 [13:53<18:34,  1.61s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0796, train/loss_vlb_step=0.000271, train/loss_step=0.0796, global_step=6471.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  43%|████▎     | 518/1208 [13:54<18:31,  1.61s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0796, train/loss_vlb_step=0.000271, train/loss_step=0.0796, global_step=6471.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  43%|████▎     | 518/1208 [13:54<18:31,  1.61s/it, loss=0.196, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000357, train/loss_step=0.108, global_step=6471.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  43%|████▎     | 519/1208 [13:55<18:29,  1.61s/it, loss=0.196, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000357, train/loss_step=0.108, global_step=6471.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  43%|████▎     | 519/1208 [13:55<18:29,  1.61s/it, loss=0.176, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000455, train/loss_step=0.137, global_step=6471.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  43%|████▎     | 520/1208 [13:58<18:29,  1.61s/it, loss=0.176, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000455, train/loss_step=0.137, global_step=6471.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  43%|████▎     | 520/1208 [13:58<18:29,  1.61s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.000122, train/loss_step=0.0313, global_step=6471.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  43%|████▎     | 521/1208 [13:59<18:27,  1.61s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.000122, train/loss_step=0.0313, global_step=6471.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  43%|████▎     | 521/1208 [13:59<18:27,  1.61s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.64e-5, train/loss_step=0.0156, global_step=6472.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  43%|████▎     | 522/1208 [14:00<18:25,  1.61s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.64e-5, train/loss_step=0.0156, global_step=6472.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  43%|████▎     | 522/1208 [14:00<18:25,  1.61s/it, loss=0.194, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.004, train/loss_step=0.390, global_step=6472.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  43%|████▎     | 523/1208 [14:01<18:22,  1.61s/it, loss=0.194, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.004, train/loss_step=0.390, global_step=6472.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  43%|████▎     | 523/1208 [14:01<18:22,  1.61s/it, loss=0.19, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.58e-5, train/loss_step=0.00272, global_step=6472.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  43%|████▎     | 524/1208 [14:05<18:23,  1.61s/it, loss=0.19, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.58e-5, train/loss_step=0.00272, global_step=6472.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  43%|████▎     | 524/1208 [14:05<18:23,  1.61s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00887, train/loss_vlb_step=4.27e-5, train/loss_step=0.00887, global_step=6472.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  43%|████▎     | 525/1208 [14:06<18:20,  1.61s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00887, train/loss_vlb_step=4.27e-5, train/loss_step=0.00887, global_step=6472.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  43%|████▎     | 525/1208 [14:06<18:20,  1.61s/it, loss=0.171, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000114, train/loss_step=0.029, global_step=6473.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  44%|████▎     | 526/1208 [14:07<18:18,  1.61s/it, loss=0.171, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000114, train/loss_step=0.029, global_step=6473.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  44%|████▎     | 526/1208 [14:07<18:18,  1.61s/it, loss=0.18, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00147, train/loss_step=0.280, global_step=6473.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  44%|████▎     | 527/1208 [14:08<18:16,  1.61s/it, loss=0.18, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00147, train/loss_step=0.280, global_step=6473.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  44%|████▎     | 527/1208 [14:08<18:16,  1.61s/it, loss=0.185, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.00035, train/loss_step=0.107, global_step=6473.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  44%|████▎     | 528/1208 [14:11<18:16,  1.61s/it, loss=0.185, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.00035, train/loss_step=0.107, global_step=6473.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  44%|████▎     | 528/1208 [14:11<18:16,  1.61s/it, loss=0.182, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000807, train/loss_step=0.206, global_step=6473.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  44%|████▍     | 529/1208 [14:12<18:14,  1.61s/it, loss=0.182, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000807, train/loss_step=0.206, global_step=6473.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  44%|████▍     | 529/1208 [14:12<18:14,  1.61s/it, loss=0.202, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00357, train/loss_step=0.425, global_step=6474.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  44%|████▍     | 530/1208 [14:13<18:11,  1.61s/it, loss=0.202, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00357, train/loss_step=0.425, global_step=6474.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  44%|████▍     | 530/1208 [14:13<18:11,  1.61s/it, loss=0.21, v_num=0, train/loss_simple_step=0.466, train/loss_vlb_step=0.00319, train/loss_step=0.466, global_step=6474.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  44%|████▍     | 531/1208 [14:14<18:09,  1.61s/it, loss=0.21, v_num=0, train/loss_simple_step=0.466, train/loss_vlb_step=0.00319, train/loss_step=0.466, global_step=6474.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  44%|████▍     | 531/1208 [14:14<18:09,  1.61s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00637, train/loss_vlb_step=3.24e-5, train/loss_step=0.00637, global_step=6474.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  44%|████▍     | 532/1208 [14:17<18:09,  1.61s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00637, train/loss_vlb_step=3.24e-5, train/loss_step=0.00637, global_step=6474.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  44%|████▍     | 532/1208 [14:17<18:09,  1.61s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000183, train/loss_step=0.0524, global_step=6474.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  44%|████▍     | 533/1208 [14:18<18:07,  1.61s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000183, train/loss_step=0.0524, global_step=6474.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  44%|████▍     | 533/1208 [14:18<18:07,  1.61s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000149, train/loss_step=0.0416, global_step=6475.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  44%|████▍     | 534/1208 [14:19<18:05,  1.61s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000149, train/loss_step=0.0416, global_step=6475.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  44%|████▍     | 534/1208 [14:19<18:05,  1.61s/it, loss=0.169, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000858, train/loss_step=0.216, global_step=6475.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  44%|████▍     | 535/1208 [14:20<18:02,  1.61s/it, loss=0.169, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000858, train/loss_step=0.216, global_step=6475.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  44%|████▍     | 535/1208 [14:20<18:02,  1.61s/it, loss=0.16, v_num=0, train/loss_simple_step=0.483, train/loss_vlb_step=0.0113, train/loss_step=0.483, global_step=6475.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  44%|████▍     | 536/1208 [14:23<18:03,  1.61s/it, loss=0.16, v_num=0, train/loss_simple_step=0.483, train/loss_vlb_step=0.0113, train/loss_step=0.483, global_step=6475.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  44%|████▍     | 536/1208 [14:23<18:03,  1.61s/it, loss=0.16, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=6475.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  44%|████▍     | 537/1208 [14:25<18:00,  1.61s/it, loss=0.16, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=6475.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  44%|████▍     | 537/1208 [14:25<18:00,  1.61s/it, loss=0.184, v_num=0, train/loss_simple_step=0.568, train/loss_vlb_step=0.0152, train/loss_step=0.568, global_step=6476.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  45%|████▍     | 538/1208 [14:26<17:58,  1.61s/it, loss=0.184, v_num=0, train/loss_simple_step=0.568, train/loss_vlb_step=0.0152, train/loss_step=0.568, global_step=6476.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  45%|████▍     | 538/1208 [14:26<17:58,  1.61s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.39e-5, train/loss_step=0.0124, global_step=6476.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  45%|████▍     | 539/1208 [14:27<17:56,  1.61s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.39e-5, train/loss_step=0.0124, global_step=6476.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  45%|████▍     | 539/1208 [14:27<17:56,  1.61s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00441, train/loss_vlb_step=2.32e-5, train/loss_step=0.00441, global_step=6476.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  45%|████▍     | 540/1208 [14:30<17:56,  1.61s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00441, train/loss_vlb_step=2.32e-5, train/loss_step=0.00441, global_step=6476.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  45%|████▍     | 540/1208 [14:30<17:56,  1.61s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0515, train/loss_vlb_step=0.000182, train/loss_step=0.0515, global_step=6476.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  45%|████▍     | 541/1208 [14:31<17:54,  1.61s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0515, train/loss_vlb_step=0.000182, train/loss_step=0.0515, global_step=6476.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  45%|████▍     | 541/1208 [14:31<17:54,  1.61s/it, loss=0.181, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000612, train/loss_step=0.167, global_step=6477.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  45%|████▍     | 542/1208 [14:32<17:52,  1.61s/it, loss=0.181, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000612, train/loss_step=0.167, global_step=6477.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  45%|████▍     | 542/1208 [14:32<17:52,  1.61s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0558, train/loss_vlb_step=0.000195, train/loss_step=0.0558, global_step=6477.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  45%|████▍     | 543/1208 [14:33<17:49,  1.61s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0558, train/loss_vlb_step=0.000195, train/loss_step=0.0558, global_step=6477.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  45%|████▍     | 543/1208 [14:33<17:49,  1.61s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0759, train/loss_vlb_step=0.000255, train/loss_step=0.0759, global_step=6477.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  45%|████▌     | 544/1208 [14:36<17:50,  1.61s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0759, train/loss_vlb_step=0.000255, train/loss_step=0.0759, global_step=6477.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  45%|████▌     | 544/1208 [14:36<17:50,  1.61s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0689, train/loss_vlb_step=0.000234, train/loss_step=0.0689, global_step=6477.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  45%|████▌     | 545/1208 [14:37<17:47,  1.61s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0689, train/loss_vlb_step=0.000234, train/loss_step=0.0689, global_step=6477.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  45%|████▌     | 545/1208 [14:37<17:47,  1.61s/it, loss=0.201, v_num=0, train/loss_simple_step=0.623, train/loss_vlb_step=0.0159, train/loss_step=0.623, global_step=6478.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  45%|████▌     | 546/1208 [14:38<17:45,  1.61s/it, loss=0.201, v_num=0, train/loss_simple_step=0.623, train/loss_vlb_step=0.0159, train/loss_step=0.623, global_step=6478.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  45%|████▌     | 546/1208 [14:38<17:45,  1.61s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0523, train/loss_vlb_step=0.000179, train/loss_step=0.0523, global_step=6478.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  45%|████▌     | 547/1208 [14:39<17:43,  1.61s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0523, train/loss_vlb_step=0.000179, train/loss_step=0.0523, global_step=6478.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  45%|████▌     | 547/1208 [14:39<17:43,  1.61s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.58e-5, train/loss_step=0.00267, global_step=6478.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  45%|████▌     | 548/1208 [14:42<17:43,  1.61s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.58e-5, train/loss_step=0.00267, global_step=6478.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  45%|████▌     | 548/1208 [14:42<17:43,  1.61s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0835, train/loss_vlb_step=0.000275, train/loss_step=0.0835, global_step=6478.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  45%|████▌     | 549/1208 [14:44<17:41,  1.61s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0835, train/loss_vlb_step=0.000275, train/loss_step=0.0835, global_step=6478.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  45%|████▌     | 549/1208 [14:44<17:41,  1.61s/it, loss=0.169, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00099, train/loss_step=0.244, global_step=6479.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  46%|████▌     | 550/1208 [14:45<17:38,  1.61s/it, loss=0.169, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00099, train/loss_step=0.244, global_step=6479.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  46%|████▌     | 550/1208 [14:45<17:38,  1.61s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=1.69e-5, train/loss_step=0.00309, global_step=6479.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  46%|████▌     | 551/1208 [14:46<17:36,  1.61s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=1.69e-5, train/loss_step=0.00309, global_step=6479.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  46%|████▌     | 551/1208 [14:46<17:36,  1.61s/it, loss=0.158, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000973, train/loss_step=0.238, global_step=6479.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  46%|████▌     | 552/1208 [14:49<17:36,  1.61s/it, loss=0.158, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000973, train/loss_step=0.238, global_step=6479.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  46%|████▌     | 552/1208 [14:49<17:36,  1.61s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=1.28e-5, train/loss_step=0.00214, global_step=6479.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  46%|████▌     | 553/1208 [14:50<17:34,  1.61s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=1.28e-5, train/loss_step=0.00214, global_step=6479.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  46%|████▌     | 553/1208 [14:50<17:34,  1.61s/it, loss=0.16, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000449, train/loss_step=0.136, global_step=6480.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  46%|████▌     | 554/1208 [14:51<17:32,  1.61s/it, loss=0.16, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000449, train/loss_step=0.136, global_step=6480.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  46%|████▌     | 554/1208 [14:51<17:32,  1.61s/it, loss=0.165, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00156, train/loss_step=0.326, global_step=6480.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  46%|████▌     | 555/1208 [14:52<17:30,  1.61s/it, loss=0.165, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00156, train/loss_step=0.326, global_step=6480.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  46%|████▌     | 555/1208 [14:52<17:30,  1.61s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000179, train/loss_step=0.0514, global_step=6480.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  46%|████▌     | 556/1208 [14:55<17:30,  1.61s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000179, train/loss_step=0.0514, global_step=6480.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  46%|████▌     | 556/1208 [14:55<17:30,  1.61s/it, loss=0.152, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00105, train/loss_step=0.271, global_step=6480.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  46%|████▌     | 557/1208 [14:56<17:28,  1.61s/it, loss=0.152, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00105, train/loss_step=0.271, global_step=6480.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  46%|████▌     | 557/1208 [14:56<17:28,  1.61s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0324, train/loss_vlb_step=0.000125, train/loss_step=0.0324, global_step=6481.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  46%|████▌     | 558/1208 [14:57<17:25,  1.61s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0324, train/loss_vlb_step=0.000125, train/loss_step=0.0324, global_step=6481.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  46%|████▌     | 558/1208 [14:57<17:25,  1.61s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=9.49e-6, train/loss_step=0.0016, global_step=6481.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  46%|████▋     | 559/1208 [14:58<17:23,  1.61s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=9.49e-6, train/loss_step=0.0016, global_step=6481.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  46%|████▋     | 559/1208 [14:58<17:23,  1.61s/it, loss=0.131, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000462, train/loss_step=0.139, global_step=6481.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  46%|████▋     | 560/1208 [15:01<17:23,  1.61s/it, loss=0.131, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000462, train/loss_step=0.139, global_step=6481.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  46%|████▋     | 560/1208 [15:01<17:23,  1.61s/it, loss=0.153, v_num=0, train/loss_simple_step=0.479, train/loss_vlb_step=0.00402, train/loss_step=0.479, global_step=6481.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  46%|████▋     | 561/1208 [15:02<17:21,  1.61s/it, loss=0.153, v_num=0, train/loss_simple_step=0.479, train/loss_vlb_step=0.00402, train/loss_step=0.479, global_step=6481.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  46%|████▋     | 561/1208 [15:02<17:21,  1.61s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0909, train/loss_vlb_step=0.000298, train/loss_step=0.0909, global_step=6482.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  47%|████▋     | 562/1208 [15:04<17:19,  1.61s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0909, train/loss_vlb_step=0.000298, train/loss_step=0.0909, global_step=6482.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  47%|████▋     | 562/1208 [15:04<17:19,  1.61s/it, loss=0.159, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.000976, train/loss_step=0.268, global_step=6482.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  47%|████▋     | 563/1208 [15:05<17:16,  1.61s/it, loss=0.159, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.000976, train/loss_step=0.268, global_step=6482.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  47%|████▋     | 563/1208 [15:05<17:16,  1.61s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=8.12e-5, train/loss_step=0.0195, global_step=6482.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  47%|████▋     | 564/1208 [15:08<17:17,  1.61s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=8.12e-5, train/loss_step=0.0195, global_step=6482.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  47%|████▋     | 564/1208 [15:08<17:17,  1.61s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.28e-5, train/loss_step=0.0171, global_step=6482.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  47%|████▋     | 565/1208 [15:09<17:14,  1.61s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.28e-5, train/loss_step=0.0171, global_step=6482.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  47%|████▋     | 565/1208 [15:09<17:14,  1.61s/it, loss=0.128, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000355, train/loss_step=0.107, global_step=6483.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  47%|████▋     | 566/1208 [15:10<17:12,  1.61s/it, loss=0.128, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000355, train/loss_step=0.107, global_step=6483.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  47%|████▋     | 566/1208 [15:10<17:12,  1.61s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0696, train/loss_vlb_step=0.00024, train/loss_step=0.0696, global_step=6483.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  47%|████▋     | 567/1208 [15:11<17:10,  1.61s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0696, train/loss_vlb_step=0.00024, train/loss_step=0.0696, global_step=6483.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  47%|████▋     | 567/1208 [15:11<17:10,  1.61s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00327, train/loss_vlb_step=1.77e-5, train/loss_step=0.00327, global_step=6483.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  47%|████▋     | 568/1208 [15:14<17:10,  1.61s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00327, train/loss_vlb_step=1.77e-5, train/loss_step=0.00327, global_step=6483.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  47%|████▋     | 568/1208 [15:14<17:10,  1.61s/it, loss=0.136, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.0009, train/loss_step=0.227, global_step=6483.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]     Epoch 21:  47%|████▋     | 569/1208 [15:15<17:08,  1.61s/it, loss=0.136, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.0009, train/loss_step=0.227, global_step=6483.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  47%|████▋     | 569/1208 [15:15<17:08,  1.61s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0519, train/loss_vlb_step=0.000182, train/loss_step=0.0519, global_step=6484.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  47%|████▋     | 570/1208 [15:16<17:06,  1.61s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0519, train/loss_vlb_step=0.000182, train/loss_step=0.0519, global_step=6484.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  47%|████▋     | 570/1208 [15:16<17:06,  1.61s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00554, train/loss_vlb_step=3.02e-5, train/loss_step=0.00554, global_step=6484.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  47%|████▋     | 571/1208 [15:17<17:03,  1.61s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00554, train/loss_vlb_step=3.02e-5, train/loss_step=0.00554, global_step=6484.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  47%|████▋     | 571/1208 [15:17<17:03,  1.61s/it, loss=0.123, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000583, train/loss_step=0.171, global_step=6484.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  47%|████▋     | 572/1208 [15:20<17:03,  1.61s/it, loss=0.123, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000583, train/loss_step=0.171, global_step=6484.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  47%|████▋     | 572/1208 [15:20<17:03,  1.61s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0764, train/loss_vlb_step=0.000253, train/loss_step=0.0764, global_step=6484.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  47%|████▋     | 573/1208 [15:21<17:01,  1.61s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0764, train/loss_vlb_step=0.000253, train/loss_step=0.0764, global_step=6484.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  47%|████▋     | 573/1208 [15:21<17:01,  1.61s/it, loss=0.126, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=6485.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  48%|████▊     | 574/1208 [15:22<16:59,  1.61s/it, loss=0.126, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=6485.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  48%|████▊     | 574/1208 [15:22<16:59,  1.61s/it, loss=0.131, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00296, train/loss_step=0.420, global_step=6485.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  48%|████▊     | 575/1208 [15:24<16:57,  1.61s/it, loss=0.131, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00296, train/loss_step=0.420, global_step=6485.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  48%|████▊     | 575/1208 [15:24<16:57,  1.61s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0643, train/loss_vlb_step=0.000216, train/loss_step=0.0643, global_step=6485.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  48%|████▊     | 576/1208 [15:27<16:57,  1.61s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0643, train/loss_vlb_step=0.000216, train/loss_step=0.0643, global_step=6485.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  48%|████▊     | 576/1208 [15:27<16:57,  1.61s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.02e-5, train/loss_step=0.0167, global_step=6485.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  48%|████▊     | 577/1208 [15:28<16:55,  1.61s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.02e-5, train/loss_step=0.0167, global_step=6485.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  48%|████▊     | 577/1208 [15:28<16:55,  1.61s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0343, train/loss_vlb_step=0.00013, train/loss_step=0.0343, global_step=6486.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  48%|████▊     | 578/1208 [15:29<16:52,  1.61s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0343, train/loss_vlb_step=0.00013, train/loss_step=0.0343, global_step=6486.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  48%|████▊     | 578/1208 [15:29<16:52,  1.61s/it, loss=0.125, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000415, train/loss_step=0.126, global_step=6486.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  48%|████▊     | 579/1208 [15:30<16:50,  1.61s/it, loss=0.125, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000415, train/loss_step=0.126, global_step=6486.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  48%|████▊     | 579/1208 [15:30<16:50,  1.61s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00437, train/loss_vlb_step=2.28e-5, train/loss_step=0.00437, global_step=6486.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  48%|████▊     | 580/1208 [15:33<16:50,  1.61s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00437, train/loss_vlb_step=2.28e-5, train/loss_step=0.00437, global_step=6486.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  48%|████▊     | 580/1208 [15:33<16:50,  1.61s/it, loss=0.121, v_num=0, train/loss_simple_step=0.527, train/loss_vlb_step=0.00762, train/loss_step=0.527, global_step=6486.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  48%|████▊     | 581/1208 [15:34<16:48,  1.61s/it, loss=0.121, v_num=0, train/loss_simple_step=0.527, train/loss_vlb_step=0.00762, train/loss_step=0.527, global_step=6486.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  48%|████▊     | 581/1208 [15:34<16:48,  1.61s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0366, train/loss_vlb_step=0.000136, train/loss_step=0.0366, global_step=6487.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  48%|████▊     | 582/1208 [15:35<16:46,  1.61s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0366, train/loss_vlb_step=0.000136, train/loss_step=0.0366, global_step=6487.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  48%|████▊     | 582/1208 [15:35<16:46,  1.61s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000109, train/loss_step=0.0288, global_step=6487.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  48%|████▊     | 583/1208 [15:36<16:44,  1.61s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000109, train/loss_step=0.0288, global_step=6487.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  48%|████▊     | 583/1208 [15:36<16:44,  1.61s/it, loss=0.11, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000356, train/loss_step=0.107, global_step=6487.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  48%|████▊     | 584/1208 [15:39<16:44,  1.61s/it, loss=0.11, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000356, train/loss_step=0.107, global_step=6487.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  48%|████▊     | 584/1208 [15:39<16:44,  1.61s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0951, train/loss_vlb_step=0.000313, train/loss_step=0.0951, global_step=6487.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  48%|████▊     | 585/1208 [15:40<16:42,  1.61s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0951, train/loss_vlb_step=0.000313, train/loss_step=0.0951, global_step=6487.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  48%|████▊     | 585/1208 [15:40<16:42,  1.61s/it, loss=0.124, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00157, train/loss_step=0.307, global_step=6488.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  49%|████▊     | 586/1208 [15:41<16:39,  1.61s/it, loss=0.124, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00157, train/loss_step=0.307, global_step=6488.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  49%|████▊     | 586/1208 [15:41<16:39,  1.61s/it, loss=0.132, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000851, train/loss_step=0.226, global_step=6488.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  49%|████▊     | 587/1208 [15:43<16:37,  1.61s/it, loss=0.132, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000851, train/loss_step=0.226, global_step=6488.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  49%|████▊     | 587/1208 [15:43<16:37,  1.61s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0772, train/loss_vlb_step=0.00026, train/loss_step=0.0772, global_step=6488.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  49%|████▊     | 588/1208 [15:46<16:37,  1.61s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0772, train/loss_vlb_step=0.00026, train/loss_step=0.0772, global_step=6488.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  49%|████▊     | 588/1208 [15:46<16:37,  1.61s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0657, train/loss_vlb_step=0.000222, train/loss_step=0.0657, global_step=6488.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  49%|████▉     | 589/1208 [15:47<16:35,  1.61s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0657, train/loss_vlb_step=0.000222, train/loss_step=0.0657, global_step=6488.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  49%|████▉     | 589/1208 [15:47<16:35,  1.61s/it, loss=0.141, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00155, train/loss_step=0.324, global_step=6489.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  49%|████▉     | 590/1208 [15:48<16:33,  1.61s/it, loss=0.141, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00155, train/loss_step=0.324, global_step=6489.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  49%|████▉     | 590/1208 [15:48<16:33,  1.61s/it, loss=0.164, v_num=0, train/loss_simple_step=0.465, train/loss_vlb_step=0.00484, train/loss_step=0.465, global_step=6489.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  49%|████▉     | 591/1208 [15:49<16:31,  1.61s/it, loss=0.164, v_num=0, train/loss_simple_step=0.465, train/loss_vlb_step=0.00484, train/loss_step=0.465, global_step=6489.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  49%|████▉     | 591/1208 [15:49<16:31,  1.61s/it, loss=0.172, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00168, train/loss_step=0.312, global_step=6489.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  49%|████▉     | 592/1208 [15:52<16:31,  1.61s/it, loss=0.172, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00168, train/loss_step=0.312, global_step=6489.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  49%|████▉     | 592/1208 [15:52<16:31,  1.61s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00455, train/loss_vlb_step=2.36e-5, train/loss_step=0.00455, global_step=6489.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  49%|████▉     | 593/1208 [15:53<16:28,  1.61s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00455, train/loss_vlb_step=2.36e-5, train/loss_step=0.00455, global_step=6489.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  49%|████▉     | 593/1208 [15:53<16:28,  1.61s/it, loss=0.171, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000649, train/loss_step=0.175, global_step=6490.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  49%|████▉     | 594/1208 [15:54<16:26,  1.61s/it, loss=0.171, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000649, train/loss_step=0.175, global_step=6490.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  49%|████▉     | 594/1208 [15:54<16:26,  1.61s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.89e-5, train/loss_step=0.0136, global_step=6490.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  49%|████▉     | 595/1208 [15:55<16:24,  1.61s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.89e-5, train/loss_step=0.0136, global_step=6490.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  49%|████▉     | 595/1208 [15:55<16:24,  1.61s/it, loss=0.16, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00109, train/loss_step=0.248, global_step=6490.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  49%|████▉     | 596/1208 [15:58<16:24,  1.61s/it, loss=0.16, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00109, train/loss_step=0.248, global_step=6490.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  49%|████▉     | 596/1208 [15:58<16:24,  1.61s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0624, train/loss_vlb_step=0.000209, train/loss_step=0.0624, global_step=6490.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  49%|████▉     | 597/1208 [15:59<16:22,  1.61s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0624, train/loss_vlb_step=0.000209, train/loss_step=0.0624, global_step=6490.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  49%|████▉     | 597/1208 [15:59<16:22,  1.61s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0473, train/loss_vlb_step=0.000165, train/loss_step=0.0473, global_step=6491.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  50%|████▉     | 598/1208 [16:00<16:20,  1.61s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0473, train/loss_vlb_step=0.000165, train/loss_step=0.0473, global_step=6491.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  50%|████▉     | 598/1208 [16:00<16:20,  1.61s/it, loss=0.171, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00143, train/loss_step=0.299, global_step=6491.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  50%|████▉     | 599/1208 [16:01<16:18,  1.61s/it, loss=0.171, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00143, train/loss_step=0.299, global_step=6491.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  50%|████▉     | 599/1208 [16:01<16:18,  1.61s/it, loss=0.18, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000671, train/loss_step=0.186, global_step=6491.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  50%|████▉     | 600/1208 [16:05<16:18,  1.61s/it, loss=0.18, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000671, train/loss_step=0.186, global_step=6491.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  50%|████▉     | 600/1208 [16:05<16:18,  1.61s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000101, train/loss_step=0.0264, global_step=6491.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.75it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.76it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.77it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.76it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.76it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.76it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.80it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.76it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.78it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.78it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.80it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 21:  50%|████▉     | 601/1208 [16:35<16:45,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000101, train/loss_step=0.0264, global_step=6491.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  50%|████▉     | 601/1208 [16:35<16:45,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00799, train/loss_vlb_step=4e-5, train/loss_step=0.00799, global_step=6492.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  50%|████▉     | 602/1208 [16:36<16:43,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00799, train/loss_vlb_step=4e-5, train/loss_step=0.00799, global_step=6492.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  50%|████▉     | 602/1208 [16:36<16:43,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000173, train/loss_step=0.0474, global_step=6492.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  50%|████▉     | 603/1208 [16:38<16:41,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000173, train/loss_step=0.0474, global_step=6492.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  50%|████▉     | 603/1208 [16:38<16:41,  1.66s/it, loss=0.157, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000525, train/loss_step=0.156, global_step=6492.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  50%|█████     | 604/1208 [16:41<16:41,  1.66s/it, loss=0.157, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000525, train/loss_step=0.156, global_step=6492.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  50%|█████     | 604/1208 [16:41<16:41,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0305, train/loss_vlb_step=0.000119, train/loss_step=0.0305, global_step=6492.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  50%|█████     | 605/1208 [16:42<16:38,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0305, train/loss_vlb_step=0.000119, train/loss_step=0.0305, global_step=6492.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  50%|█████     | 605/1208 [16:42<16:38,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000132, train/loss_step=0.0346, global_step=6493.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  50%|█████     | 606/1208 [16:43<16:36,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000132, train/loss_step=0.0346, global_step=6493.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  50%|█████     | 606/1208 [16:43<16:36,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0967, train/loss_vlb_step=0.000319, train/loss_step=0.0967, global_step=6493.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  50%|█████     | 607/1208 [16:44<16:34,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0967, train/loss_vlb_step=0.000319, train/loss_step=0.0967, global_step=6493.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  50%|█████     | 607/1208 [16:44<16:34,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.00057, train/loss_step=0.171, global_step=6493.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  50%|█████     | 608/1208 [16:47<16:34,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.00057, train/loss_step=0.171, global_step=6493.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  50%|█████     | 608/1208 [16:47<16:34,  1.66s/it, loss=0.143, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000505, train/loss_step=0.150, global_step=6493.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  50%|█████     | 609/1208 [16:48<16:31,  1.66s/it, loss=0.143, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000505, train/loss_step=0.150, global_step=6493.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  50%|█████     | 609/1208 [16:48<16:31,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000142, train/loss_step=0.0376, global_step=6494.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  50%|█████     | 610/1208 [16:49<16:29,  1.65s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000142, train/loss_step=0.0376, global_step=6494.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  50%|█████     | 610/1208 [16:49<16:29,  1.65s/it, loss=0.114, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000598, train/loss_step=0.175, global_step=6494.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  51%|█████     | 611/1208 [16:50<16:27,  1.65s/it, loss=0.114, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000598, train/loss_step=0.175, global_step=6494.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  51%|█████     | 611/1208 [16:50<16:27,  1.65s/it, loss=0.104, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000363, train/loss_step=0.110, global_step=6494.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  51%|█████     | 612/1208 [16:53<16:27,  1.66s/it, loss=0.104, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000363, train/loss_step=0.110, global_step=6494.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  51%|█████     | 612/1208 [16:53<16:27,  1.66s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.52e-5, train/loss_step=0.00268, global_step=6494.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  51%|█████     | 613/1208 [16:54<16:24,  1.66s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.52e-5, train/loss_step=0.00268, global_step=6494.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  51%|█████     | 613/1208 [16:54<16:24,  1.66s/it, loss=0.099, v_num=0, train/loss_simple_step=0.0796, train/loss_vlb_step=0.000265, train/loss_step=0.0796, global_step=6495.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  51%|█████     | 614/1208 [16:55<16:22,  1.65s/it, loss=0.099, v_num=0, train/loss_simple_step=0.0796, train/loss_vlb_step=0.000265, train/loss_step=0.0796, global_step=6495.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  51%|█████     | 614/1208 [16:55<16:22,  1.65s/it, loss=0.111, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00108, train/loss_step=0.248, global_step=6495.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  51%|█████     | 615/1208 [16:56<16:20,  1.65s/it, loss=0.111, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00108, train/loss_step=0.248, global_step=6495.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  51%|█████     | 615/1208 [16:56<16:20,  1.65s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.0043, train/loss_vlb_step=2.28e-5, train/loss_step=0.0043, global_step=6495.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  51%|█████     | 616/1208 [16:59<16:20,  1.66s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.0043, train/loss_vlb_step=2.28e-5, train/loss_step=0.0043, global_step=6495.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  51%|█████     | 616/1208 [17:00<16:20,  1.66s/it, loss=0.104, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000565, train/loss_step=0.170, global_step=6495.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  51%|█████     | 617/1208 [17:01<16:18,  1.65s/it, loss=0.104, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000565, train/loss_step=0.170, global_step=6495.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  51%|█████     | 617/1208 [17:01<16:18,  1.65s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0068, train/loss_vlb_step=3.37e-5, train/loss_step=0.0068, global_step=6496.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  51%|█████     | 618/1208 [17:02<16:15,  1.65s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0068, train/loss_vlb_step=3.37e-5, train/loss_step=0.0068, global_step=6496.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  51%|█████     | 618/1208 [17:02<16:15,  1.65s/it, loss=0.0943, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000497, train/loss_step=0.147, global_step=6496.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  51%|█████     | 619/1208 [17:03<16:13,  1.65s/it, loss=0.0943, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000497, train/loss_step=0.147, global_step=6496.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  51%|█████     | 619/1208 [17:03<16:13,  1.65s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=6496.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  51%|█████▏    | 620/1208 [17:06<16:13,  1.65s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=6496.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  51%|█████▏    | 620/1208 [17:06<16:13,  1.65s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.03e-5, train/loss_step=0.0194, global_step=6496.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  51%|█████▏    | 621/1208 [17:07<16:10,  1.65s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.03e-5, train/loss_step=0.0194, global_step=6496.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  51%|█████▏    | 621/1208 [17:07<16:10,  1.65s/it, loss=0.09, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.54e-5, train/loss_step=0.010, global_step=6497.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  51%|█████▏    | 622/1208 [17:08<16:08,  1.65s/it, loss=0.09, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.54e-5, train/loss_step=0.010, global_step=6497.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  51%|█████▏    | 622/1208 [17:08<16:08,  1.65s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000505, train/loss_step=0.149, global_step=6497.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  52%|█████▏    | 623/1208 [17:09<16:06,  1.65s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000505, train/loss_step=0.149, global_step=6497.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  52%|█████▏    | 623/1208 [17:09<16:06,  1.65s/it, loss=0.116, v_num=0, train/loss_simple_step=0.568, train/loss_vlb_step=0.0139, train/loss_step=0.568, global_step=6497.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  52%|█████▏    | 624/1208 [17:12<16:06,  1.65s/it, loss=0.116, v_num=0, train/loss_simple_step=0.568, train/loss_vlb_step=0.0139, train/loss_step=0.568, global_step=6497.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  52%|█████▏    | 624/1208 [17:12<16:06,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.0015, train/loss_step=0.317, global_step=6497.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  52%|█████▏    | 625/1208 [17:13<16:03,  1.65s/it, loss=0.13, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.0015, train/loss_step=0.317, global_step=6497.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  52%|█████▏    | 625/1208 [17:13<16:03,  1.65s/it, loss=0.136, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.00051, train/loss_step=0.149, global_step=6498.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  52%|█████▏    | 626/1208 [17:14<16:01,  1.65s/it, loss=0.136, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.00051, train/loss_step=0.149, global_step=6498.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  52%|█████▏    | 626/1208 [17:14<16:01,  1.65s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0096, train/loss_vlb_step=4.39e-5, train/loss_step=0.0096, global_step=6498.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  52%|█████▏    | 627/1208 [17:15<15:59,  1.65s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0096, train/loss_vlb_step=4.39e-5, train/loss_step=0.0096, global_step=6498.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  52%|█████▏    | 627/1208 [17:15<15:59,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0707, train/loss_vlb_step=0.000236, train/loss_step=0.0707, global_step=6498.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  52%|█████▏    | 628/1208 [17:18<15:59,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0707, train/loss_vlb_step=0.000236, train/loss_step=0.0707, global_step=6498.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  52%|█████▏    | 628/1208 [17:18<15:59,  1.65s/it, loss=0.138, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00269, train/loss_step=0.381, global_step=6498.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  52%|█████▏    | 629/1208 [17:19<15:56,  1.65s/it, loss=0.138, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00269, train/loss_step=0.381, global_step=6498.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  52%|█████▏    | 629/1208 [17:19<15:56,  1.65s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.28e-5, train/loss_step=0.0145, global_step=6499.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  52%|█████▏    | 630/1208 [17:20<15:54,  1.65s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.28e-5, train/loss_step=0.0145, global_step=6499.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  52%|█████▏    | 630/1208 [17:20<15:54,  1.65s/it, loss=0.136, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000514, train/loss_step=0.154, global_step=6499.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  52%|█████▏    | 631/1208 [17:21<15:52,  1.65s/it, loss=0.136, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000514, train/loss_step=0.154, global_step=6499.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  52%|█████▏    | 631/1208 [17:21<15:52,  1.65s/it, loss=0.137, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000458, train/loss_step=0.136, global_step=6499.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  52%|█████▏    | 632/1208 [17:24<15:52,  1.65s/it, loss=0.137, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000458, train/loss_step=0.136, global_step=6499.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  52%|█████▏    | 632/1208 [17:24<15:52,  1.65s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00856, train/loss_vlb_step=4.08e-5, train/loss_step=0.00856, global_step=6499.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  52%|█████▏    | 633/1208 [17:25<15:50,  1.65s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00856, train/loss_vlb_step=4.08e-5, train/loss_step=0.00856, global_step=6499.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  52%|█████▏    | 633/1208 [17:25<15:50,  1.65s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0619, train/loss_vlb_step=0.000217, train/loss_step=0.0619, global_step=6500.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  52%|█████▏    | 634/1208 [17:26<15:47,  1.65s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0619, train/loss_vlb_step=0.000217, train/loss_step=0.0619, global_step=6500.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  52%|█████▏    | 634/1208 [17:26<15:47,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00165, train/loss_step=0.299, global_step=6500.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  53%|█████▎    | 635/1208 [17:27<15:45,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00165, train/loss_step=0.299, global_step=6500.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  53%|█████▎    | 635/1208 [17:27<15:45,  1.65s/it, loss=0.18, v_num=0, train/loss_simple_step=0.831, train/loss_vlb_step=0.0609, train/loss_step=0.831, global_step=6500.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  53%|█████▎    | 636/1208 [17:31<15:45,  1.65s/it, loss=0.18, v_num=0, train/loss_simple_step=0.831, train/loss_vlb_step=0.0609, train/loss_step=0.831, global_step=6500.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  53%|█████▎    | 636/1208 [17:31<15:45,  1.65s/it, loss=0.184, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00096, train/loss_step=0.251, global_step=6500.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  53%|█████▎    | 637/1208 [17:32<15:43,  1.65s/it, loss=0.184, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00096, train/loss_step=0.251, global_step=6500.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  53%|█████▎    | 637/1208 [17:32<15:43,  1.65s/it, loss=0.191, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000442, train/loss_step=0.134, global_step=6501.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  53%|█████▎    | 638/1208 [17:33<15:41,  1.65s/it, loss=0.191, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000442, train/loss_step=0.134, global_step=6501.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  53%|█████▎    | 638/1208 [17:33<15:41,  1.65s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000123, train/loss_step=0.0332, global_step=6501.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  53%|█████▎    | 639/1208 [17:34<15:38,  1.65s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000123, train/loss_step=0.0332, global_step=6501.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  53%|█████▎    | 639/1208 [17:34<15:38,  1.65s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000117, train/loss_step=0.0306, global_step=6501.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  53%|█████▎    | 640/1208 [17:37<15:38,  1.65s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000117, train/loss_step=0.0306, global_step=6501.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  53%|█████▎    | 640/1208 [17:37<15:38,  1.65s/it, loss=0.223, v_num=0, train/loss_simple_step=0.851, train/loss_vlb_step=0.108, train/loss_step=0.851, global_step=6501.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]     Epoch 21:  53%|█████▎    | 641/1208 [17:38<15:36,  1.65s/it, loss=0.223, v_num=0, train/loss_simple_step=0.851, train/loss_vlb_step=0.108, train/loss_step=0.851, global_step=6501.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  53%|█████▎    | 641/1208 [17:38<15:36,  1.65s/it, loss=0.237, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.0012, train/loss_step=0.288, global_step=6502.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  53%|█████▎    | 642/1208 [17:39<15:34,  1.65s/it, loss=0.237, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.0012, train/loss_step=0.288, global_step=6502.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  53%|█████▎    | 642/1208 [17:39<15:34,  1.65s/it, loss=0.23, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.95e-5, train/loss_step=0.0134, global_step=6502.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  53%|█████▎    | 643/1208 [17:40<15:32,  1.65s/it, loss=0.23, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.95e-5, train/loss_step=0.0134, global_step=6502.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  53%|█████▎    | 643/1208 [17:40<15:32,  1.65s/it, loss=0.211, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000675, train/loss_step=0.185, global_step=6502.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  53%|█████▎    | 644/1208 [17:43<15:31,  1.65s/it, loss=0.211, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000675, train/loss_step=0.185, global_step=6502.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  53%|█████▎    | 644/1208 [17:43<15:31,  1.65s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.46e-5, train/loss_step=0.0229, global_step=6502.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  53%|█████▎    | 645/1208 [17:44<15:29,  1.65s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.46e-5, train/loss_step=0.0229, global_step=6502.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  53%|█████▎    | 645/1208 [17:44<15:29,  1.65s/it, loss=0.208, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00289, train/loss_step=0.381, global_step=6503.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  53%|█████▎    | 646/1208 [17:45<15:27,  1.65s/it, loss=0.208, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00289, train/loss_step=0.381, global_step=6503.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  53%|█████▎    | 646/1208 [17:45<15:27,  1.65s/it, loss=0.213, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000404, train/loss_step=0.121, global_step=6503.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  54%|█████▎    | 647/1208 [17:47<15:25,  1.65s/it, loss=0.213, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000404, train/loss_step=0.121, global_step=6503.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  54%|█████▎    | 647/1208 [17:47<15:25,  1.65s/it, loss=0.212, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000185, train/loss_step=0.050, global_step=6503.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  54%|█████▎    | 648/1208 [17:50<15:24,  1.65s/it, loss=0.212, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000185, train/loss_step=0.050, global_step=6503.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  54%|█████▎    | 648/1208 [17:50<15:24,  1.65s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0644, train/loss_vlb_step=0.000217, train/loss_step=0.0644, global_step=6503.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  54%|█████▎    | 649/1208 [17:51<15:22,  1.65s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0644, train/loss_vlb_step=0.000217, train/loss_step=0.0644, global_step=6503.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  54%|█████▎    | 649/1208 [17:51<15:22,  1.65s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0538, train/loss_vlb_step=0.000188, train/loss_step=0.0538, global_step=6504.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  54%|█████▍    | 650/1208 [17:52<15:20,  1.65s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0538, train/loss_vlb_step=0.000188, train/loss_step=0.0538, global_step=6504.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  54%|█████▍    | 650/1208 [17:52<15:20,  1.65s/it, loss=0.191, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.27e-5, train/loss_step=0.00215, global_step=6504.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  54%|█████▍    | 651/1208 [17:53<15:18,  1.65s/it, loss=0.191, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.27e-5, train/loss_step=0.00215, global_step=6504.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  54%|█████▍    | 651/1208 [17:53<15:18,  1.65s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00597, train/loss_vlb_step=3.03e-5, train/loss_step=0.00597, global_step=6504.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  54%|█████▍    | 652/1208 [17:56<15:18,  1.65s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00597, train/loss_vlb_step=3.03e-5, train/loss_step=0.00597, global_step=6504.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  54%|█████▍    | 652/1208 [17:56<15:18,  1.65s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=0.000101, train/loss_step=0.0259, global_step=6504.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  54%|█████▍    | 653/1208 [17:57<15:15,  1.65s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=0.000101, train/loss_step=0.0259, global_step=6504.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  54%|█████▍    | 653/1208 [17:57<15:15,  1.65s/it, loss=0.199, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00188, train/loss_step=0.341, global_step=6505.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  54%|█████▍    | 654/1208 [17:58<15:13,  1.65s/it, loss=0.199, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00188, train/loss_step=0.341, global_step=6505.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  54%|█████▍    | 654/1208 [17:58<15:13,  1.65s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.49e-5, train/loss_step=0.00265, global_step=6505.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  54%|█████▍    | 655/1208 [17:59<15:11,  1.65s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.49e-5, train/loss_step=0.00265, global_step=6505.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  54%|█████▍    | 655/1208 [17:59<15:11,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000719, train/loss_step=0.186, global_step=6505.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  54%|█████▍    | 656/1208 [18:02<15:11,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000719, train/loss_step=0.186, global_step=6505.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  54%|█████▍    | 656/1208 [18:02<15:11,  1.65s/it, loss=0.15, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000694, train/loss_step=0.198, global_step=6505.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  54%|█████▍    | 657/1208 [18:03<15:09,  1.65s/it, loss=0.15, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000694, train/loss_step=0.198, global_step=6505.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  54%|█████▍    | 657/1208 [18:03<15:09,  1.65s/it, loss=0.159, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00169, train/loss_step=0.320, global_step=6506.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  54%|█████▍    | 658/1208 [18:04<15:06,  1.65s/it, loss=0.159, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00169, train/loss_step=0.320, global_step=6506.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  54%|█████▍    | 658/1208 [18:04<15:06,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000105, train/loss_step=0.0258, global_step=6506.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  55%|█████▍    | 659/1208 [18:06<15:04,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000105, train/loss_step=0.0258, global_step=6506.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  55%|█████▍    | 659/1208 [18:06<15:04,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.02e-5, train/loss_step=0.0112, global_step=6506.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  55%|█████▍    | 660/1208 [18:09<15:04,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.02e-5, train/loss_step=0.0112, global_step=6506.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  55%|█████▍    | 660/1208 [18:09<15:04,  1.65s/it, loss=0.136, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00281, train/loss_step=0.418, global_step=6506.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  55%|█████▍    | 661/1208 [18:10<15:02,  1.65s/it, loss=0.136, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00281, train/loss_step=0.418, global_step=6506.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  55%|█████▍    | 661/1208 [18:10<15:02,  1.65s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000137, train/loss_step=0.0358, global_step=6507.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  55%|█████▍    | 662/1208 [18:11<15:00,  1.65s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000137, train/loss_step=0.0358, global_step=6507.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  55%|█████▍    | 662/1208 [18:11<15:00,  1.65s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.17e-5, train/loss_step=0.0115, global_step=6507.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  55%|█████▍    | 663/1208 [18:12<14:57,  1.65s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.17e-5, train/loss_step=0.0115, global_step=6507.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  55%|█████▍    | 663/1208 [18:12<14:57,  1.65s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.15e-5, train/loss_step=0.0115, global_step=6507.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  55%|█████▍    | 664/1208 [18:15<14:57,  1.65s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.15e-5, train/loss_step=0.0115, global_step=6507.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  55%|█████▍    | 664/1208 [18:15<14:57,  1.65s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=9.54e-6, train/loss_step=0.0016, global_step=6507.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  55%|█████▌    | 665/1208 [18:16<14:55,  1.65s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=9.54e-6, train/loss_step=0.0016, global_step=6507.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  55%|█████▌    | 665/1208 [18:16<14:55,  1.65s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.00485, train/loss_vlb_step=2.47e-5, train/loss_step=0.00485, global_step=6508.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  55%|█████▌    | 666/1208 [18:17<14:53,  1.65s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.00485, train/loss_vlb_step=2.47e-5, train/loss_step=0.00485, global_step=6508.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  55%|█████▌    | 666/1208 [18:17<14:53,  1.65s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000656, train/loss_step=0.186, global_step=6508.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  55%|█████▌    | 667/1208 [18:18<14:51,  1.65s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000656, train/loss_step=0.186, global_step=6508.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  55%|█████▌    | 667/1208 [18:18<14:51,  1.65s/it, loss=0.103, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000529, train/loss_step=0.151, global_step=6508.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  55%|█████▌    | 668/1208 [18:21<14:50,  1.65s/it, loss=0.103, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000529, train/loss_step=0.151, global_step=6508.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  55%|█████▌    | 668/1208 [18:21<14:50,  1.65s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00844, train/loss_vlb_step=4.11e-5, train/loss_step=0.00844, global_step=6508.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  55%|█████▌    | 669/1208 [18:22<14:48,  1.65s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00844, train/loss_vlb_step=4.11e-5, train/loss_step=0.00844, global_step=6508.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  55%|█████▌    | 669/1208 [18:22<14:48,  1.65s/it, loss=0.122, v_num=0, train/loss_simple_step=0.497, train/loss_vlb_step=0.00939, train/loss_step=0.497, global_step=6509.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  55%|█████▌    | 670/1208 [18:23<14:46,  1.65s/it, loss=0.122, v_num=0, train/loss_simple_step=0.497, train/loss_vlb_step=0.00939, train/loss_step=0.497, global_step=6509.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  55%|█████▌    | 670/1208 [18:23<14:46,  1.65s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.74e-5, train/loss_step=0.00313, global_step=6509.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  56%|█████▌    | 671/1208 [18:24<14:44,  1.65s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.74e-5, train/loss_step=0.00313, global_step=6509.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  56%|█████▌    | 671/1208 [18:24<14:44,  1.65s/it, loss=0.135, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00141, train/loss_step=0.259, global_step=6509.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  56%|█████▌    | 672/1208 [18:28<14:43,  1.65s/it, loss=0.135, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00141, train/loss_step=0.259, global_step=6509.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  56%|█████▌    | 672/1208 [18:28<14:43,  1.65s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0788, train/loss_vlb_step=0.000259, train/loss_step=0.0788, global_step=6509.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  56%|█████▌    | 673/1208 [18:29<14:41,  1.65s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0788, train/loss_vlb_step=0.000259, train/loss_step=0.0788, global_step=6509.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  56%|█████▌    | 673/1208 [18:29<14:41,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00116, train/loss_step=0.275, global_step=6510.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  56%|█████▌    | 674/1208 [18:30<14:39,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00116, train/loss_step=0.275, global_step=6510.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  56%|█████▌    | 674/1208 [18:30<14:39,  1.65s/it, loss=0.147, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.0011, train/loss_step=0.249, global_step=6510.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  56%|█████▌    | 675/1208 [18:31<14:37,  1.65s/it, loss=0.147, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.0011, train/loss_step=0.249, global_step=6510.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  56%|█████▌    | 675/1208 [18:31<14:37,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000157, train/loss_step=0.0437, global_step=6510.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  56%|█████▌    | 676/1208 [18:34<14:37,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000157, train/loss_step=0.0437, global_step=6510.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  56%|█████▌    | 676/1208 [18:34<14:37,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0919, train/loss_vlb_step=0.000304, train/loss_step=0.0919, global_step=6510.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  56%|█████▌    | 677/1208 [18:35<14:34,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0919, train/loss_vlb_step=0.000304, train/loss_step=0.0919, global_step=6510.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  56%|█████▌    | 677/1208 [18:35<14:34,  1.65s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.68e-5, train/loss_step=0.00304, global_step=6511.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  56%|█████▌    | 678/1208 [18:36<14:32,  1.65s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.68e-5, train/loss_step=0.00304, global_step=6511.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  56%|█████▌    | 678/1208 [18:36<14:32,  1.65s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.68e-5, train/loss_step=0.0156, global_step=6511.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  56%|█████▌    | 679/1208 [18:37<14:30,  1.65s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.68e-5, train/loss_step=0.0156, global_step=6511.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  56%|█████▌    | 679/1208 [18:37<14:30,  1.65s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.29e-5, train/loss_step=0.00213, global_step=6511.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  56%|█████▋    | 680/1208 [18:40<14:30,  1.65s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.29e-5, train/loss_step=0.00213, global_step=6511.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  56%|█████▋    | 680/1208 [18:40<14:30,  1.65s/it, loss=0.106, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.00064, train/loss_step=0.189, global_step=6511.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  56%|█████▋    | 681/1208 [18:41<14:28,  1.65s/it, loss=0.106, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.00064, train/loss_step=0.189, global_step=6511.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  56%|█████▋    | 681/1208 [18:41<14:28,  1.65s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000121, train/loss_step=0.0317, global_step=6512.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  56%|█████▋    | 682/1208 [18:42<14:26,  1.65s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000121, train/loss_step=0.0317, global_step=6512.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  56%|█████▋    | 682/1208 [18:42<14:26,  1.65s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0422, train/loss_vlb_step=0.000151, train/loss_step=0.0422, global_step=6512.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  57%|█████▋    | 683/1208 [18:43<14:23,  1.65s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0422, train/loss_vlb_step=0.000151, train/loss_step=0.0422, global_step=6512.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  57%|█████▋    | 683/1208 [18:43<14:23,  1.65s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.00013, train/loss_step=0.0344, global_step=6512.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  57%|█████▋    | 684/1208 [18:47<14:23,  1.65s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.00013, train/loss_step=0.0344, global_step=6512.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  57%|█████▋    | 684/1208 [18:47<14:23,  1.65s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0645, train/loss_vlb_step=0.000223, train/loss_step=0.0645, global_step=6512.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  57%|█████▋    | 685/1208 [18:48<14:21,  1.65s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0645, train/loss_vlb_step=0.000223, train/loss_step=0.0645, global_step=6512.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  57%|█████▋    | 685/1208 [18:48<14:21,  1.65s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.39e-5, train/loss_step=0.00241, global_step=6513.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  57%|█████▋    | 686/1208 [18:49<14:19,  1.65s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.39e-5, train/loss_step=0.00241, global_step=6513.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  57%|█████▋    | 686/1208 [18:49<14:19,  1.65s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0414, train/loss_vlb_step=0.000155, train/loss_step=0.0414, global_step=6513.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  57%|█████▋    | 687/1208 [18:50<14:17,  1.65s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0414, train/loss_vlb_step=0.000155, train/loss_step=0.0414, global_step=6513.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  57%|█████▋    | 687/1208 [18:50<14:17,  1.65s/it, loss=0.11, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00115, train/loss_step=0.264, global_step=6513.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  57%|█████▋    | 688/1208 [18:53<14:16,  1.65s/it, loss=0.11, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00115, train/loss_step=0.264, global_step=6513.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  57%|█████▋    | 688/1208 [18:53<14:16,  1.65s/it, loss=0.124, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00126, train/loss_step=0.284, global_step=6513.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  57%|█████▋    | 689/1208 [18:54<14:14,  1.65s/it, loss=0.124, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00126, train/loss_step=0.284, global_step=6513.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  57%|█████▋    | 689/1208 [18:54<14:14,  1.65s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000165, train/loss_step=0.0443, global_step=6514.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  57%|█████▋    | 690/1208 [18:55<14:12,  1.65s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000165, train/loss_step=0.0443, global_step=6514.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  57%|█████▋    | 690/1208 [18:55<14:12,  1.65s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0594, train/loss_vlb_step=0.000206, train/loss_step=0.0594, global_step=6514.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  57%|█████▋    | 691/1208 [18:56<14:10,  1.64s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0594, train/loss_vlb_step=0.000206, train/loss_step=0.0594, global_step=6514.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  57%|█████▋    | 691/1208 [18:56<14:10,  1.64s/it, loss=0.0918, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.74e-5, train/loss_step=0.0207, global_step=6514.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  57%|█████▋    | 692/1208 [18:59<14:09,  1.65s/it, loss=0.0918, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.74e-5, train/loss_step=0.0207, global_step=6514.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  57%|█████▋    | 692/1208 [18:59<14:09,  1.65s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000139, train/loss_step=0.0374, global_step=6514.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  57%|█████▋    | 693/1208 [19:00<14:07,  1.65s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000139, train/loss_step=0.0374, global_step=6514.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  57%|█████▋    | 693/1208 [19:00<14:07,  1.65s/it, loss=0.0762, v_num=0, train/loss_simple_step=0.00443, train/loss_vlb_step=2.36e-5, train/loss_step=0.00443, global_step=6515.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  57%|█████▋    | 694/1208 [19:01<14:05,  1.65s/it, loss=0.0762, v_num=0, train/loss_simple_step=0.00443, train/loss_vlb_step=2.36e-5, train/loss_step=0.00443, global_step=6515.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  57%|█████▋    | 694/1208 [19:01<14:05,  1.65s/it, loss=0.0648, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.06e-5, train/loss_step=0.0202, global_step=6515.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  58%|█████▊    | 695/1208 [19:02<14:03,  1.64s/it, loss=0.0648, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.06e-5, train/loss_step=0.0202, global_step=6515.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  58%|█████▊    | 695/1208 [19:02<14:03,  1.64s/it, loss=0.0639, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=0.000103, train/loss_step=0.0257, global_step=6515.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  58%|█████▊    | 696/1208 [19:06<14:03,  1.65s/it, loss=0.0639, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=0.000103, train/loss_step=0.0257, global_step=6515.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  58%|█████▊    | 696/1208 [19:06<14:03,  1.65s/it, loss=0.0653, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000394, train/loss_step=0.120, global_step=6515.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  58%|█████▊    | 697/1208 [19:07<14:01,  1.65s/it, loss=0.0653, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000394, train/loss_step=0.120, global_step=6515.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  58%|█████▊    | 697/1208 [19:07<14:01,  1.65s/it, loss=0.0806, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00156, train/loss_step=0.308, global_step=6516.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  58%|█████▊    | 698/1208 [19:08<13:58,  1.64s/it, loss=0.0806, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00156, train/loss_step=0.308, global_step=6516.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  58%|█████▊    | 698/1208 [19:08<13:58,  1.64s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.00091, train/loss_step=0.221, global_step=6516.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  58%|█████▊    | 699/1208 [19:09<13:56,  1.64s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.00091, train/loss_step=0.221, global_step=6516.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  58%|█████▊    | 699/1208 [19:09<13:56,  1.64s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=9.18e-6, train/loss_step=0.0015, global_step=6516.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  58%|█████▊    | 700/1208 [19:12<13:56,  1.65s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=9.18e-6, train/loss_step=0.0015, global_step=6516.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  58%|█████▊    | 700/1208 [19:12<13:56,  1.65s/it, loss=0.0846, v_num=0, train/loss_simple_step=0.0649, train/loss_vlb_step=0.000217, train/loss_step=0.0649, global_step=6516.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  58%|█████▊    | 701/1208 [19:13<13:54,  1.65s/it, loss=0.0846, v_num=0, train/loss_simple_step=0.0649, train/loss_vlb_step=0.000217, train/loss_step=0.0649, global_step=6516.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  58%|█████▊    | 701/1208 [19:13<13:54,  1.65s/it, loss=0.105, v_num=0, train/loss_simple_step=0.446, train/loss_vlb_step=0.00348, train/loss_step=0.446, global_step=6517.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  58%|█████▊    | 702/1208 [19:14<13:52,  1.64s/it, loss=0.105, v_num=0, train/loss_simple_step=0.446, train/loss_vlb_step=0.00348, train/loss_step=0.446, global_step=6517.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  58%|█████▊    | 702/1208 [19:14<13:52,  1.64s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0905, train/loss_vlb_step=0.000297, train/loss_step=0.0905, global_step=6517.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  58%|█████▊    | 703/1208 [19:15<13:50,  1.64s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0905, train/loss_vlb_step=0.000297, train/loss_step=0.0905, global_step=6517.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  58%|█████▊    | 703/1208 [19:15<13:50,  1.64s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00845, train/loss_vlb_step=4.05e-5, train/loss_step=0.00845, global_step=6517.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  58%|█████▊    | 704/1208 [19:18<13:49,  1.65s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00845, train/loss_vlb_step=4.05e-5, train/loss_step=0.00845, global_step=6517.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  58%|█████▊    | 704/1208 [19:18<13:49,  1.65s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00877, train/loss_vlb_step=4.36e-5, train/loss_step=0.00877, global_step=6517.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  58%|█████▊    | 705/1208 [19:19<13:47,  1.64s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00877, train/loss_vlb_step=4.36e-5, train/loss_step=0.00877, global_step=6517.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  58%|█████▊    | 705/1208 [19:19<13:47,  1.64s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.18e-5, train/loss_step=0.0114, global_step=6518.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  58%|█████▊    | 706/1208 [19:20<13:45,  1.64s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.18e-5, train/loss_step=0.0114, global_step=6518.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  58%|█████▊    | 706/1208 [19:20<13:45,  1.64s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.78e-5, train/loss_step=0.0157, global_step=6518.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  59%|█████▊    | 707/1208 [19:21<13:43,  1.64s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.78e-5, train/loss_step=0.0157, global_step=6518.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  59%|█████▊    | 707/1208 [19:21<13:43,  1.64s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000135, train/loss_step=0.0364, global_step=6518.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  59%|█████▊    | 708/1208 [19:24<13:42,  1.65s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000135, train/loss_step=0.0364, global_step=6518.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  59%|█████▊    | 708/1208 [19:24<13:42,  1.65s/it, loss=0.0826, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=6518.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  59%|█████▊    | 709/1208 [19:25<13:40,  1.64s/it, loss=0.0826, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=6518.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  59%|█████▊    | 709/1208 [19:25<13:40,  1.64s/it, loss=0.0842, v_num=0, train/loss_simple_step=0.0757, train/loss_vlb_step=0.00025, train/loss_step=0.0757, global_step=6519.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  59%|█████▉    | 710/1208 [19:26<13:38,  1.64s/it, loss=0.0842, v_num=0, train/loss_simple_step=0.0757, train/loss_vlb_step=0.00025, train/loss_step=0.0757, global_step=6519.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  59%|█████▉    | 710/1208 [19:27<13:38,  1.64s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000892, train/loss_step=0.232, global_step=6519.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  59%|█████▉    | 711/1208 [19:28<13:36,  1.64s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000892, train/loss_step=0.232, global_step=6519.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  59%|█████▉    | 711/1208 [19:28<13:36,  1.64s/it, loss=0.106, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00125, train/loss_step=0.292, global_step=6519.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  59%|█████▉    | 712/1208 [19:31<13:35,  1.64s/it, loss=0.106, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00125, train/loss_step=0.292, global_step=6519.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  59%|█████▉    | 712/1208 [19:31<13:35,  1.64s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0037, train/loss_vlb_step=1.96e-5, train/loss_step=0.0037, global_step=6519.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  59%|█████▉    | 713/1208 [19:32<13:33,  1.64s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0037, train/loss_vlb_step=1.96e-5, train/loss_step=0.0037, global_step=6519.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  59%|█████▉    | 713/1208 [19:32<13:33,  1.64s/it, loss=0.11, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000388, train/loss_step=0.117, global_step=6520.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  59%|█████▉    | 714/1208 [19:33<13:31,  1.64s/it, loss=0.11, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000388, train/loss_step=0.117, global_step=6520.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  59%|█████▉    | 714/1208 [19:33<13:31,  1.64s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.53e-5, train/loss_step=0.0238, global_step=6520.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  59%|█████▉    | 715/1208 [19:34<13:29,  1.64s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.53e-5, train/loss_step=0.0238, global_step=6520.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  59%|█████▉    | 715/1208 [19:34<13:29,  1.64s/it, loss=0.115, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.00039, train/loss_step=0.118, global_step=6520.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  59%|█████▉    | 716/1208 [19:37<13:28,  1.64s/it, loss=0.115, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.00039, train/loss_step=0.118, global_step=6520.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  59%|█████▉    | 716/1208 [19:37<13:28,  1.64s/it, loss=0.11, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.55e-5, train/loss_step=0.018, global_step=6520.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  59%|█████▉    | 717/1208 [19:38<13:26,  1.64s/it, loss=0.11, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.55e-5, train/loss_step=0.018, global_step=6520.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  59%|█████▉    | 717/1208 [19:38<13:26,  1.64s/it, loss=0.107, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000966, train/loss_step=0.245, global_step=6521.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  59%|█████▉    | 718/1208 [19:39<13:24,  1.64s/it, loss=0.107, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000966, train/loss_step=0.245, global_step=6521.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  59%|█████▉    | 718/1208 [19:39<13:24,  1.64s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000162, train/loss_step=0.0454, global_step=6521.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  60%|█████▉    | 719/1208 [19:40<13:22,  1.64s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000162, train/loss_step=0.0454, global_step=6521.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  60%|█████▉    | 719/1208 [19:40<13:22,  1.64s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.64e-5, train/loss_step=0.00286, global_step=6521.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  60%|█████▉    | 720/1208 [19:43<13:21,  1.64s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.64e-5, train/loss_step=0.00286, global_step=6521.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  60%|█████▉    | 720/1208 [19:43<13:21,  1.64s/it, loss=0.105, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000756, train/loss_step=0.202, global_step=6521.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  60%|█████▉    | 721/1208 [19:44<13:19,  1.64s/it, loss=0.105, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000756, train/loss_step=0.202, global_step=6521.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  60%|█████▉    | 721/1208 [19:44<13:19,  1.64s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.0014, train/loss_step=0.287, global_step=6522.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  60%|█████▉    | 722/1208 [19:45<13:17,  1.64s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.0014, train/loss_step=0.287, global_step=6522.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  60%|█████▉    | 722/1208 [19:45<13:17,  1.64s/it, loss=0.11, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00194, train/loss_step=0.352, global_step=6522.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  60%|█████▉    | 723/1208 [19:46<13:15,  1.64s/it, loss=0.11, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00194, train/loss_step=0.352, global_step=6522.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  60%|█████▉    | 723/1208 [19:46<13:15,  1.64s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=1.31e-5, train/loss_step=0.00229, global_step=6522.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  60%|█████▉    | 724/1208 [19:49<13:14,  1.64s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=1.31e-5, train/loss_step=0.00229, global_step=6522.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  60%|█████▉    | 724/1208 [19:49<13:14,  1.64s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=8.07e-5, train/loss_step=0.0193, global_step=6522.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  60%|██████    | 725/1208 [19:50<13:12,  1.64s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=8.07e-5, train/loss_step=0.0193, global_step=6522.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  60%|██████    | 725/1208 [19:50<13:12,  1.64s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000182, train/loss_step=0.0514, global_step=6523.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  60%|██████    | 726/1208 [19:51<13:10,  1.64s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000182, train/loss_step=0.0514, global_step=6523.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  60%|██████    | 726/1208 [19:51<13:10,  1.64s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000143, train/loss_step=0.0387, global_step=6523.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  60%|██████    | 727/1208 [19:52<13:08,  1.64s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000143, train/loss_step=0.0387, global_step=6523.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  60%|██████    | 727/1208 [19:52<13:08,  1.64s/it, loss=0.118, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000456, train/loss_step=0.136, global_step=6523.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  60%|██████    | 728/1208 [19:54<13:07,  1.64s/it, loss=0.118, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000456, train/loss_step=0.136, global_step=6523.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  60%|██████    | 728/1208 [19:54<13:07,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00247, train/loss_step=0.378, global_step=6523.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  60%|██████    | 729/1208 [19:55<13:05,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00247, train/loss_step=0.378, global_step=6523.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  60%|██████    | 729/1208 [19:55<13:05,  1.64s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00696, train/loss_vlb_step=3.47e-5, train/loss_step=0.00696, global_step=6524.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  60%|██████    | 730/1208 [19:56<13:03,  1.64s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00696, train/loss_vlb_step=3.47e-5, train/loss_step=0.00696, global_step=6524.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  60%|██████    | 730/1208 [19:56<13:03,  1.64s/it, loss=0.129, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000963, train/loss_step=0.244, global_step=6524.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  61%|██████    | 731/1208 [19:57<13:01,  1.64s/it, loss=0.129, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000963, train/loss_step=0.244, global_step=6524.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  61%|██████    | 731/1208 [19:57<13:01,  1.64s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.000176, train/loss_step=0.0485, global_step=6524.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  61%|██████    | 732/1208 [20:00<13:00,  1.64s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.000176, train/loss_step=0.0485, global_step=6524.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  61%|██████    | 732/1208 [20:00<13:00,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00145, train/loss_step=0.306, global_step=6524.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  61%|██████    | 733/1208 [20:01<12:58,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00145, train/loss_step=0.306, global_step=6524.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  61%|██████    | 733/1208 [20:01<12:58,  1.64s/it, loss=0.135, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000569, train/loss_step=0.166, global_step=6525.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  61%|██████    | 734/1208 [20:02<12:56,  1.64s/it, loss=0.135, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000569, train/loss_step=0.166, global_step=6525.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  61%|██████    | 734/1208 [20:02<12:56,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0614, train/loss_vlb_step=0.000213, train/loss_step=0.0614, global_step=6525.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  61%|██████    | 735/1208 [20:03<12:54,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0614, train/loss_vlb_step=0.000213, train/loss_step=0.0614, global_step=6525.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  61%|██████    | 735/1208 [20:03<12:54,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000131, train/loss_step=0.0365, global_step=6525.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  61%|██████    | 736/1208 [20:06<12:53,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000131, train/loss_step=0.0365, global_step=6525.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  61%|██████    | 736/1208 [20:06<12:53,  1.64s/it, loss=0.151, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00294, train/loss_step=0.380, global_step=6525.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  61%|██████    | 737/1208 [20:07<12:51,  1.64s/it, loss=0.151, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00294, train/loss_step=0.380, global_step=6525.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  61%|██████    | 737/1208 [20:07<12:51,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=6.82e-5, train/loss_step=0.0163, global_step=6526.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  61%|██████    | 738/1208 [20:08<12:49,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=6.82e-5, train/loss_step=0.0163, global_step=6526.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  61%|██████    | 738/1208 [20:08<12:49,  1.64s/it, loss=0.154, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.0025, train/loss_step=0.345, global_step=6526.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  61%|██████    | 739/1208 [20:09<12:47,  1.64s/it, loss=0.154, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.0025, train/loss_step=0.345, global_step=6526.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  61%|██████    | 739/1208 [20:09<12:47,  1.64s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.1e-5, train/loss_step=0.0227, global_step=6526.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  61%|██████▏   | 740/1208 [20:12<12:46,  1.64s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.1e-5, train/loss_step=0.0227, global_step=6526.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  61%|██████▏   | 740/1208 [20:12<12:46,  1.64s/it, loss=0.162, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00178, train/loss_step=0.335, global_step=6526.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  61%|██████▏   | 741/1208 [20:13<12:44,  1.64s/it, loss=0.162, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00178, train/loss_step=0.335, global_step=6526.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  61%|██████▏   | 741/1208 [20:13<12:44,  1.64s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000115, train/loss_step=0.0319, global_step=6527.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  61%|██████▏   | 742/1208 [20:14<12:42,  1.64s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000115, train/loss_step=0.0319, global_step=6527.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  61%|██████▏   | 742/1208 [20:14<12:42,  1.64s/it, loss=0.175, v_num=0, train/loss_simple_step=0.871, train/loss_vlb_step=0.220, train/loss_step=0.871, global_step=6527.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]     Epoch 21:  62%|██████▏   | 743/1208 [20:15<12:40,  1.64s/it, loss=0.175, v_num=0, train/loss_simple_step=0.871, train/loss_vlb_step=0.220, train/loss_step=0.871, global_step=6527.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  62%|██████▏   | 743/1208 [20:15<12:40,  1.64s/it, loss=0.186, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000955, train/loss_step=0.228, global_step=6527.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  62%|██████▏   | 744/1208 [20:18<12:39,  1.64s/it, loss=0.186, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000955, train/loss_step=0.228, global_step=6527.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  62%|██████▏   | 744/1208 [20:18<12:39,  1.64s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.49e-5, train/loss_step=0.0235, global_step=6527.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  62%|██████▏   | 745/1208 [20:19<12:37,  1.64s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.49e-5, train/loss_step=0.0235, global_step=6527.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  62%|██████▏   | 745/1208 [20:19<12:37,  1.64s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0655, train/loss_vlb_step=0.000219, train/loss_step=0.0655, global_step=6528.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  62%|██████▏   | 746/1208 [20:20<12:35,  1.64s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0655, train/loss_vlb_step=0.000219, train/loss_step=0.0655, global_step=6528.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  62%|██████▏   | 746/1208 [20:20<12:35,  1.64s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0562, train/loss_vlb_step=0.000204, train/loss_step=0.0562, global_step=6528.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  62%|██████▏   | 747/1208 [20:21<12:33,  1.64s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0562, train/loss_vlb_step=0.000204, train/loss_step=0.0562, global_step=6528.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  62%|██████▏   | 747/1208 [20:21<12:33,  1.64s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.37e-5, train/loss_step=0.00244, global_step=6528.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  62%|██████▏   | 748/1208 [20:24<12:33,  1.64s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.37e-5, train/loss_step=0.00244, global_step=6528.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  62%|██████▏   | 748/1208 [20:24<12:33,  1.64s/it, loss=0.188, v_num=0, train/loss_simple_step=0.515, train/loss_vlb_step=0.00762, train/loss_step=0.515, global_step=6528.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  62%|██████▏   | 749/1208 [20:25<12:31,  1.64s/it, loss=0.188, v_num=0, train/loss_simple_step=0.515, train/loss_vlb_step=0.00762, train/loss_step=0.515, global_step=6528.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  62%|██████▏   | 749/1208 [20:25<12:31,  1.64s/it, loss=0.211, v_num=0, train/loss_simple_step=0.461, train/loss_vlb_step=0.00453, train/loss_step=0.461, global_step=6529.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  62%|██████▏   | 750/1208 [20:26<12:29,  1.64s/it, loss=0.211, v_num=0, train/loss_simple_step=0.461, train/loss_vlb_step=0.00453, train/loss_step=0.461, global_step=6529.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  62%|██████▏   | 750/1208 [20:26<12:29,  1.64s/it, loss=0.205, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000452, train/loss_step=0.137, global_step=6529.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  62%|██████▏   | 751/1208 [20:27<12:26,  1.63s/it, loss=0.205, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000452, train/loss_step=0.137, global_step=6529.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  62%|██████▏   | 751/1208 [20:27<12:26,  1.63s/it, loss=0.245, v_num=0, train/loss_simple_step=0.832, train/loss_vlb_step=0.0708, train/loss_step=0.832, global_step=6529.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  62%|██████▏   | 752/1208 [20:30<12:26,  1.64s/it, loss=0.245, v_num=0, train/loss_simple_step=0.832, train/loss_vlb_step=0.0708, train/loss_step=0.832, global_step=6529.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  62%|██████▏   | 752/1208 [20:30<12:26,  1.64s/it, loss=0.229, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=1.01e-5, train/loss_step=0.00171, global_step=6529.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  62%|██████▏   | 753/1208 [20:31<12:24,  1.64s/it, loss=0.229, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=1.01e-5, train/loss_step=0.00171, global_step=6529.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  62%|██████▏   | 753/1208 [20:31<12:24,  1.64s/it, loss=0.236, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00139, train/loss_step=0.290, global_step=6530.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  62%|██████▏   | 754/1208 [20:32<12:22,  1.63s/it, loss=0.236, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00139, train/loss_step=0.290, global_step=6530.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  62%|██████▏   | 754/1208 [20:32<12:22,  1.63s/it, loss=0.233, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=2.51e-5, train/loss_step=0.00495, global_step=6530.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  62%|██████▎   | 755/1208 [20:33<12:20,  1.63s/it, loss=0.233, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=2.51e-5, train/loss_step=0.00495, global_step=6530.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  62%|██████▎   | 755/1208 [20:33<12:20,  1.63s/it, loss=0.232, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.51e-5, train/loss_step=0.0239, global_step=6530.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  63%|██████▎   | 756/1208 [20:36<12:19,  1.64s/it, loss=0.232, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.51e-5, train/loss_step=0.0239, global_step=6530.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  63%|██████▎   | 756/1208 [20:36<12:19,  1.64s/it, loss=0.229, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00158, train/loss_step=0.327, global_step=6530.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  63%|██████▎   | 757/1208 [20:37<12:17,  1.63s/it, loss=0.229, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00158, train/loss_step=0.327, global_step=6530.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  63%|██████▎   | 757/1208 [20:37<12:17,  1.63s/it, loss=0.241, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00099, train/loss_step=0.256, global_step=6531.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  63%|██████▎   | 758/1208 [20:38<12:15,  1.63s/it, loss=0.241, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00099, train/loss_step=0.256, global_step=6531.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  63%|██████▎   | 758/1208 [20:38<12:15,  1.63s/it, loss=0.248, v_num=0, train/loss_simple_step=0.479, train/loss_vlb_step=0.00401, train/loss_step=0.479, global_step=6531.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  63%|██████▎   | 759/1208 [20:39<12:13,  1.63s/it, loss=0.248, v_num=0, train/loss_simple_step=0.479, train/loss_vlb_step=0.00401, train/loss_step=0.479, global_step=6531.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  63%|██████▎   | 759/1208 [20:39<12:13,  1.63s/it, loss=0.248, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000106, train/loss_step=0.0262, global_step=6531.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  63%|██████▎   | 760/1208 [20:42<12:12,  1.63s/it, loss=0.248, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000106, train/loss_step=0.0262, global_step=6531.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  63%|██████▎   | 760/1208 [20:42<12:12,  1.63s/it, loss=0.232, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.51e-5, train/loss_step=0.0026, global_step=6531.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  63%|██████▎   | 761/1208 [20:43<12:10,  1.63s/it, loss=0.232, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.51e-5, train/loss_step=0.0026, global_step=6531.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  63%|██████▎   | 761/1208 [20:43<12:10,  1.63s/it, loss=0.242, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000998, train/loss_step=0.237, global_step=6532.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  63%|██████▎   | 762/1208 [20:44<12:08,  1.63s/it, loss=0.242, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000998, train/loss_step=0.237, global_step=6532.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  63%|██████▎   | 762/1208 [20:44<12:08,  1.63s/it, loss=0.222, v_num=0, train/loss_simple_step=0.471, train/loss_vlb_step=0.00589, train/loss_step=0.471, global_step=6532.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  63%|██████▎   | 763/1208 [20:45<12:06,  1.63s/it, loss=0.222, v_num=0, train/loss_simple_step=0.471, train/loss_vlb_step=0.00589, train/loss_step=0.471, global_step=6532.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  63%|██████▎   | 763/1208 [20:45<12:06,  1.63s/it, loss=0.211, v_num=0, train/loss_simple_step=0.00706, train/loss_vlb_step=3.43e-5, train/loss_step=0.00706, global_step=6532.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  63%|██████▎   | 764/1208 [20:48<12:05,  1.63s/it, loss=0.211, v_num=0, train/loss_simple_step=0.00706, train/loss_vlb_step=3.43e-5, train/loss_step=0.00706, global_step=6532.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  63%|██████▎   | 764/1208 [20:48<12:05,  1.63s/it, loss=0.21, v_num=0, train/loss_simple_step=0.00909, train/loss_vlb_step=4.5e-5, train/loss_step=0.00909, global_step=6532.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  63%|██████▎   | 765/1208 [20:49<12:03,  1.63s/it, loss=0.21, v_num=0, train/loss_simple_step=0.00909, train/loss_vlb_step=4.5e-5, train/loss_step=0.00909, global_step=6532.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  63%|██████▎   | 765/1208 [20:49<12:03,  1.63s/it, loss=0.242, v_num=0, train/loss_simple_step=0.694, train/loss_vlb_step=0.0204, train/loss_step=0.694, global_step=6533.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  63%|██████▎   | 766/1208 [20:50<12:01,  1.63s/it, loss=0.242, v_num=0, train/loss_simple_step=0.694, train/loss_vlb_step=0.0204, train/loss_step=0.694, global_step=6533.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  63%|██████▎   | 766/1208 [20:50<12:01,  1.63s/it, loss=0.25, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000759, train/loss_step=0.215, global_step=6533.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  63%|██████▎   | 767/1208 [20:51<11:59,  1.63s/it, loss=0.25, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000759, train/loss_step=0.215, global_step=6533.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  63%|██████▎   | 767/1208 [20:51<11:59,  1.63s/it, loss=0.281, v_num=0, train/loss_simple_step=0.624, train/loss_vlb_step=0.0111, train/loss_step=0.624, global_step=6533.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  64%|██████▎   | 768/1208 [20:54<11:58,  1.63s/it, loss=0.281, v_num=0, train/loss_simple_step=0.624, train/loss_vlb_step=0.0111, train/loss_step=0.624, global_step=6533.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  64%|██████▎   | 768/1208 [20:54<11:58,  1.63s/it, loss=0.255, v_num=0, train/loss_simple_step=0.00661, train/loss_vlb_step=3.46e-5, train/loss_step=0.00661, global_step=6533.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  64%|██████▎   | 769/1208 [20:55<11:56,  1.63s/it, loss=0.255, v_num=0, train/loss_simple_step=0.00661, train/loss_vlb_step=3.46e-5, train/loss_step=0.00661, global_step=6533.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  64%|██████▎   | 769/1208 [20:55<11:56,  1.63s/it, loss=0.263, v_num=0, train/loss_simple_step=0.617, train/loss_vlb_step=0.012, train/loss_step=0.617, global_step=6534.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]      Epoch 21:  64%|██████▎   | 770/1208 [20:56<11:54,  1.63s/it, loss=0.263, v_num=0, train/loss_simple_step=0.617, train/loss_vlb_step=0.012, train/loss_step=0.617, global_step=6534.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  64%|██████▎   | 770/1208 [20:56<11:54,  1.63s/it, loss=0.256, v_num=0, train/loss_simple_step=0.00516, train/loss_vlb_step=2.75e-5, train/loss_step=0.00516, global_step=6534.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  64%|██████▍   | 771/1208 [20:57<11:52,  1.63s/it, loss=0.256, v_num=0, train/loss_simple_step=0.00516, train/loss_vlb_step=2.75e-5, train/loss_step=0.00516, global_step=6534.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  64%|██████▍   | 771/1208 [20:57<11:52,  1.63s/it, loss=0.221, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=6534.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  64%|██████▍   | 772/1208 [21:00<11:51,  1.63s/it, loss=0.221, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=6534.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  64%|██████▍   | 772/1208 [21:00<11:51,  1.63s/it, loss=0.252, v_num=0, train/loss_simple_step=0.629, train/loss_vlb_step=0.00953, train/loss_step=0.629, global_step=6534.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  64%|██████▍   | 773/1208 [21:01<11:49,  1.63s/it, loss=0.252, v_num=0, train/loss_simple_step=0.629, train/loss_vlb_step=0.00953, train/loss_step=0.629, global_step=6534.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  64%|██████▍   | 773/1208 [21:01<11:49,  1.63s/it, loss=0.241, v_num=0, train/loss_simple_step=0.0773, train/loss_vlb_step=0.000257, train/loss_step=0.0773, global_step=6535.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  64%|██████▍   | 774/1208 [21:02<11:47,  1.63s/it, loss=0.241, v_num=0, train/loss_simple_step=0.0773, train/loss_vlb_step=0.000257, train/loss_step=0.0773, global_step=6535.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  64%|██████▍   | 774/1208 [21:02<11:47,  1.63s/it, loss=0.242, v_num=0, train/loss_simple_step=0.00751, train/loss_vlb_step=3.69e-5, train/loss_step=0.00751, global_step=6535.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  64%|██████▍   | 775/1208 [21:03<11:45,  1.63s/it, loss=0.242, v_num=0, train/loss_simple_step=0.00751, train/loss_vlb_step=3.69e-5, train/loss_step=0.00751, global_step=6535.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  64%|██████▍   | 775/1208 [21:03<11:45,  1.63s/it, loss=0.241, v_num=0, train/loss_simple_step=0.00854, train/loss_vlb_step=4.13e-5, train/loss_step=0.00854, global_step=6535.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  64%|██████▍   | 776/1208 [21:05<11:44,  1.63s/it, loss=0.241, v_num=0, train/loss_simple_step=0.00854, train/loss_vlb_step=4.13e-5, train/loss_step=0.00854, global_step=6535.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  64%|██████▍   | 776/1208 [21:05<11:44,  1.63s/it, loss=0.228, v_num=0, train/loss_simple_step=0.0717, train/loss_vlb_step=0.000244, train/loss_step=0.0717, global_step=6535.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  64%|██████▍   | 777/1208 [21:06<11:42,  1.63s/it, loss=0.228, v_num=0, train/loss_simple_step=0.0717, train/loss_vlb_step=0.000244, train/loss_step=0.0717, global_step=6535.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  64%|██████▍   | 777/1208 [21:06<11:42,  1.63s/it, loss=0.225, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000803, train/loss_step=0.204, global_step=6536.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  64%|██████▍   | 778/1208 [21:07<11:40,  1.63s/it, loss=0.225, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000803, train/loss_step=0.204, global_step=6536.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  64%|██████▍   | 778/1208 [21:07<11:40,  1.63s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000138, train/loss_step=0.0353, global_step=6536.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  64%|██████▍   | 779/1208 [21:08<11:38,  1.63s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000138, train/loss_step=0.0353, global_step=6536.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  64%|██████▍   | 779/1208 [21:08<11:38,  1.63s/it, loss=0.223, v_num=0, train/loss_simple_step=0.424, train/loss_vlb_step=0.0038, train/loss_step=0.424, global_step=6536.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  65%|██████▍   | 780/1208 [21:11<11:37,  1.63s/it, loss=0.223, v_num=0, train/loss_simple_step=0.424, train/loss_vlb_step=0.0038, train/loss_step=0.424, global_step=6536.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  65%|██████▍   | 780/1208 [21:11<11:37,  1.63s/it, loss=0.24, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00242, train/loss_step=0.346, global_step=6536.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  65%|██████▍   | 781/1208 [21:12<11:35,  1.63s/it, loss=0.24, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00242, train/loss_step=0.346, global_step=6536.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  65%|██████▍   | 781/1208 [21:12<11:35,  1.63s/it, loss=0.229, v_num=0, train/loss_simple_step=0.00717, train/loss_vlb_step=3.58e-5, train/loss_step=0.00717, global_step=6537.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  65%|██████▍   | 782/1208 [21:13<11:33,  1.63s/it, loss=0.229, v_num=0, train/loss_simple_step=0.00717, train/loss_vlb_step=3.58e-5, train/loss_step=0.00717, global_step=6537.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  65%|██████▍   | 782/1208 [21:13<11:33,  1.63s/it, loss=0.215, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000683, train/loss_step=0.193, global_step=6537.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  65%|██████▍   | 783/1208 [21:14<11:31,  1.63s/it, loss=0.215, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000683, train/loss_step=0.193, global_step=6537.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  65%|██████▍   | 783/1208 [21:14<11:31,  1.63s/it, loss=0.238, v_num=0, train/loss_simple_step=0.479, train/loss_vlb_step=0.00567, train/loss_step=0.479, global_step=6537.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  65%|██████▍   | 784/1208 [21:17<11:31,  1.63s/it, loss=0.238, v_num=0, train/loss_simple_step=0.479, train/loss_vlb_step=0.00567, train/loss_step=0.479, global_step=6537.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  65%|██████▍   | 784/1208 [21:17<11:31,  1.63s/it, loss=0.241, v_num=0, train/loss_simple_step=0.0638, train/loss_vlb_step=0.000216, train/loss_step=0.0638, global_step=6537.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  65%|██████▍   | 785/1208 [21:18<11:29,  1.63s/it, loss=0.241, v_num=0, train/loss_simple_step=0.0638, train/loss_vlb_step=0.000216, train/loss_step=0.0638, global_step=6537.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  65%|██████▍   | 785/1208 [21:18<11:29,  1.63s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=8.65e-5, train/loss_step=0.0204, global_step=6538.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  65%|██████▌   | 786/1208 [21:19<11:27,  1.63s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=8.65e-5, train/loss_step=0.0204, global_step=6538.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  65%|██████▌   | 786/1208 [21:19<11:27,  1.63s/it, loss=0.238, v_num=0, train/loss_simple_step=0.815, train/loss_vlb_step=0.206, train/loss_step=0.815, global_step=6538.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  65%|██████▌   | 787/1208 [21:20<11:25,  1.63s/it, loss=0.238, v_num=0, train/loss_simple_step=0.815, train/loss_vlb_step=0.206, train/loss_step=0.815, global_step=6538.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  65%|██████▌   | 787/1208 [21:20<11:25,  1.63s/it, loss=0.216, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000728, train/loss_step=0.202, global_step=6538.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  65%|██████▌   | 788/1208 [21:23<11:24,  1.63s/it, loss=0.216, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000728, train/loss_step=0.202, global_step=6538.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  65%|██████▌   | 788/1208 [21:23<11:24,  1.63s/it, loss=0.216, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=8.69e-6, train/loss_step=0.00142, global_step=6538.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  65%|██████▌   | 789/1208 [21:25<11:22,  1.63s/it, loss=0.216, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=8.69e-6, train/loss_step=0.00142, global_step=6538.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  65%|██████▌   | 789/1208 [21:25<11:22,  1.63s/it, loss=0.195, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000648, train/loss_step=0.191, global_step=6539.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  65%|██████▌   | 790/1208 [21:26<11:20,  1.63s/it, loss=0.195, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000648, train/loss_step=0.191, global_step=6539.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  65%|██████▌   | 790/1208 [21:26<11:20,  1.63s/it, loss=0.212, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00205, train/loss_step=0.339, global_step=6539.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  65%|██████▌   | 791/1208 [21:27<11:18,  1.63s/it, loss=0.212, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00205, train/loss_step=0.339, global_step=6539.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  65%|██████▌   | 791/1208 [21:27<11:18,  1.63s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0873, train/loss_vlb_step=0.000291, train/loss_step=0.0873, global_step=6539.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  66%|██████▌   | 792/1208 [21:30<11:17,  1.63s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0873, train/loss_vlb_step=0.000291, train/loss_step=0.0873, global_step=6539.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  66%|██████▌   | 792/1208 [21:30<11:17,  1.63s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0289, train/loss_vlb_step=0.000113, train/loss_step=0.0289, global_step=6539.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  66%|██████▌   | 793/1208 [21:31<11:15,  1.63s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0289, train/loss_vlb_step=0.000113, train/loss_step=0.0289, global_step=6539.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  66%|██████▌   | 793/1208 [21:31<11:15,  1.63s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.00019, train/loss_step=0.0526, global_step=6540.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  66%|██████▌   | 794/1208 [21:32<11:13,  1.63s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.00019, train/loss_step=0.0526, global_step=6540.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  66%|██████▌   | 794/1208 [21:32<11:13,  1.63s/it, loss=0.199, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.0026, train/loss_step=0.409, global_step=6540.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  66%|██████▌   | 795/1208 [21:33<11:11,  1.63s/it, loss=0.199, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.0026, train/loss_step=0.409, global_step=6540.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  66%|██████▌   | 795/1208 [21:33<11:11,  1.63s/it, loss=0.219, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00347, train/loss_step=0.409, global_step=6540.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  66%|██████▌   | 796/1208 [21:36<11:11,  1.63s/it, loss=0.219, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00347, train/loss_step=0.409, global_step=6540.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  66%|██████▌   | 796/1208 [21:36<11:11,  1.63s/it, loss=0.216, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.37e-5, train/loss_step=0.0174, global_step=6540.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  66%|██████▌   | 797/1208 [21:37<11:09,  1.63s/it, loss=0.216, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.37e-5, train/loss_step=0.0174, global_step=6540.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  66%|██████▌   | 797/1208 [21:37<11:09,  1.63s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000102, train/loss_step=0.0264, global_step=6541.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  66%|██████▌   | 798/1208 [21:38<11:07,  1.63s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000102, train/loss_step=0.0264, global_step=6541.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  66%|██████▌   | 798/1208 [21:38<11:07,  1.63s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.71e-5, train/loss_step=0.0245, global_step=6541.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  66%|██████▌   | 799/1208 [21:39<11:05,  1.63s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.71e-5, train/loss_step=0.0245, global_step=6541.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  66%|██████▌   | 799/1208 [21:39<11:05,  1.63s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00297, train/loss_vlb_step=1.64e-5, train/loss_step=0.00297, global_step=6541.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  66%|██████▌   | 800/1208 [21:42<11:04,  1.63s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00297, train/loss_vlb_step=1.64e-5, train/loss_step=0.00297, global_step=6541.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  66%|██████▌   | 800/1208 [21:42<11:04,  1.63s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0659, train/loss_vlb_step=0.000225, train/loss_step=0.0659, global_step=6541.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  66%|██████▋   | 801/1208 [21:43<11:02,  1.63s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0659, train/loss_vlb_step=0.000225, train/loss_step=0.0659, global_step=6541.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  66%|██████▋   | 801/1208 [21:43<11:02,  1.63s/it, loss=0.196, v_num=0, train/loss_simple_step=0.500, train/loss_vlb_step=0.00863, train/loss_step=0.500, global_step=6542.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  66%|██████▋   | 802/1208 [21:44<11:00,  1.63s/it, loss=0.196, v_num=0, train/loss_simple_step=0.500, train/loss_vlb_step=0.00863, train/loss_step=0.500, global_step=6542.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  66%|██████▋   | 802/1208 [21:44<11:00,  1.63s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.68e-5, train/loss_step=0.0188, global_step=6542.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  66%|██████▋   | 803/1208 [21:46<10:58,  1.63s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.68e-5, train/loss_step=0.0188, global_step=6542.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  66%|██████▋   | 803/1208 [21:46<10:58,  1.63s/it, loss=0.192, v_num=0, train/loss_simple_step=0.572, train/loss_vlb_step=0.00936, train/loss_step=0.572, global_step=6542.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  67%|██████▋   | 804/1208 [21:49<10:57,  1.63s/it, loss=0.192, v_num=0, train/loss_simple_step=0.572, train/loss_vlb_step=0.00936, train/loss_step=0.572, global_step=6542.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  67%|██████▋   | 804/1208 [21:49<10:57,  1.63s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.15e-5, train/loss_step=0.00195, global_step=6542.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  67%|██████▋   | 805/1208 [21:50<10:55,  1.63s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.15e-5, train/loss_step=0.00195, global_step=6542.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  67%|██████▋   | 805/1208 [21:50<10:55,  1.63s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.28e-5, train/loss_step=0.0121, global_step=6543.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  67%|██████▋   | 806/1208 [21:51<10:54,  1.63s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.28e-5, train/loss_step=0.0121, global_step=6543.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  67%|██████▋   | 806/1208 [21:51<10:54,  1.63s/it, loss=0.158, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000813, train/loss_step=0.208, global_step=6543.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  67%|██████▋   | 807/1208 [21:52<10:52,  1.63s/it, loss=0.158, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000813, train/loss_step=0.208, global_step=6543.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  67%|██████▋   | 807/1208 [21:52<10:52,  1.63s/it, loss=0.175, v_num=0, train/loss_simple_step=0.528, train/loss_vlb_step=0.00887, train/loss_step=0.528, global_step=6543.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  67%|██████▋   | 808/1208 [21:55<10:51,  1.63s/it, loss=0.175, v_num=0, train/loss_simple_step=0.528, train/loss_vlb_step=0.00887, train/loss_step=0.528, global_step=6543.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  67%|██████▋   | 808/1208 [21:55<10:51,  1.63s/it, loss=0.178, v_num=0, train/loss_simple_step=0.069, train/loss_vlb_step=0.000231, train/loss_step=0.069, global_step=6543.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  67%|██████▋   | 809/1208 [21:56<10:49,  1.63s/it, loss=0.178, v_num=0, train/loss_simple_step=0.069, train/loss_vlb_step=0.000231, train/loss_step=0.069, global_step=6543.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  67%|██████▋   | 809/1208 [21:56<10:49,  1.63s/it, loss=0.178, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000776, train/loss_step=0.193, global_step=6544.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  67%|██████▋   | 810/1208 [21:57<10:47,  1.63s/it, loss=0.178, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000776, train/loss_step=0.193, global_step=6544.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  67%|██████▋   | 810/1208 [21:57<10:47,  1.63s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.75e-5, train/loss_step=0.0215, global_step=6544.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  67%|██████▋   | 811/1208 [21:58<10:45,  1.63s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.75e-5, train/loss_step=0.0215, global_step=6544.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  67%|██████▋   | 811/1208 [21:58<10:45,  1.63s/it, loss=0.161, v_num=0, train/loss_simple_step=0.055, train/loss_vlb_step=0.000189, train/loss_step=0.055, global_step=6544.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  67%|██████▋   | 812/1208 [22:01<10:44,  1.63s/it, loss=0.161, v_num=0, train/loss_simple_step=0.055, train/loss_vlb_step=0.000189, train/loss_step=0.055, global_step=6544.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  67%|██████▋   | 812/1208 [22:01<10:44,  1.63s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0857, train/loss_vlb_step=0.000282, train/loss_step=0.0857, global_step=6544.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  67%|██████▋   | 813/1208 [22:02<10:42,  1.63s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0857, train/loss_vlb_step=0.000282, train/loss_step=0.0857, global_step=6544.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  67%|██████▋   | 813/1208 [22:02<10:42,  1.63s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.58e-5, train/loss_step=0.0124, global_step=6545.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  67%|██████▋   | 814/1208 [22:03<10:40,  1.63s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.58e-5, train/loss_step=0.0124, global_step=6545.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  67%|██████▋   | 814/1208 [22:03<10:40,  1.63s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.58e-5, train/loss_step=0.0152, global_step=6545.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  67%|██████▋   | 815/1208 [22:04<10:38,  1.63s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.58e-5, train/loss_step=0.0152, global_step=6545.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  67%|██████▋   | 815/1208 [22:04<10:38,  1.63s/it, loss=0.14, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00221, train/loss_step=0.377, global_step=6545.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  68%|██████▊   | 816/1208 [22:08<10:37,  1.63s/it, loss=0.14, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00221, train/loss_step=0.377, global_step=6545.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  68%|██████▊   | 816/1208 [22:08<10:37,  1.63s/it, loss=0.153, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00119, train/loss_step=0.264, global_step=6545.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  68%|██████▊   | 817/1208 [22:09<10:36,  1.63s/it, loss=0.153, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00119, train/loss_step=0.264, global_step=6545.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  68%|██████▊   | 817/1208 [22:09<10:36,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.33e-5, train/loss_step=0.0198, global_step=6546.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  68%|██████▊   | 818/1208 [22:10<10:34,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.33e-5, train/loss_step=0.0198, global_step=6546.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  68%|██████▊   | 818/1208 [22:10<10:34,  1.63s/it, loss=0.187, v_num=0, train/loss_simple_step=0.719, train/loss_vlb_step=0.0412, train/loss_step=0.719, global_step=6546.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  68%|██████▊   | 819/1208 [22:11<10:32,  1.63s/it, loss=0.187, v_num=0, train/loss_simple_step=0.719, train/loss_vlb_step=0.0412, train/loss_step=0.719, global_step=6546.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  68%|██████▊   | 819/1208 [22:11<10:32,  1.63s/it, loss=0.187, v_num=0, train/loss_simple_step=0.00944, train/loss_vlb_step=4.47e-5, train/loss_step=0.00944, global_step=6546.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  68%|██████▊   | 820/1208 [22:14<10:31,  1.63s/it, loss=0.187, v_num=0, train/loss_simple_step=0.00944, train/loss_vlb_step=4.47e-5, train/loss_step=0.00944, global_step=6546.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  68%|██████▊   | 820/1208 [22:14<10:31,  1.63s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0531, train/loss_vlb_step=0.000188, train/loss_step=0.0531, global_step=6546.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  68%|██████▊   | 821/1208 [22:15<10:29,  1.63s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0531, train/loss_vlb_step=0.000188, train/loss_step=0.0531, global_step=6546.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  68%|██████▊   | 821/1208 [22:15<10:29,  1.63s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000175, train/loss_step=0.0484, global_step=6547.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  68%|██████▊   | 822/1208 [22:16<10:27,  1.63s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000175, train/loss_step=0.0484, global_step=6547.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  68%|██████▊   | 822/1208 [22:16<10:27,  1.63s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0656, train/loss_vlb_step=0.000219, train/loss_step=0.0656, global_step=6547.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  68%|██████▊   | 823/1208 [22:17<10:25,  1.63s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0656, train/loss_vlb_step=0.000219, train/loss_step=0.0656, global_step=6547.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  68%|██████▊   | 823/1208 [22:17<10:25,  1.63s/it, loss=0.161, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00356, train/loss_step=0.457, global_step=6547.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  68%|██████▊   | 824/1208 [22:20<10:24,  1.63s/it, loss=0.161, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00356, train/loss_step=0.457, global_step=6547.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  68%|██████▊   | 824/1208 [22:20<10:24,  1.63s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.01e-5, train/loss_step=0.0109, global_step=6547.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  68%|██████▊   | 825/1208 [22:21<10:22,  1.63s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.01e-5, train/loss_step=0.0109, global_step=6547.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  68%|██████▊   | 825/1208 [22:21<10:22,  1.63s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000123, train/loss_step=0.0336, global_step=6548.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  68%|██████▊   | 826/1208 [22:22<10:20,  1.63s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000123, train/loss_step=0.0336, global_step=6548.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  68%|██████▊   | 826/1208 [22:22<10:20,  1.63s/it, loss=0.175, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00456, train/loss_step=0.458, global_step=6548.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  68%|██████▊   | 827/1208 [22:23<10:18,  1.62s/it, loss=0.175, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00456, train/loss_step=0.458, global_step=6548.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  68%|██████▊   | 827/1208 [22:23<10:18,  1.62s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=2.46e-5, train/loss_step=0.00469, global_step=6548.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  69%|██████▊   | 828/1208 [22:26<10:17,  1.63s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=2.46e-5, train/loss_step=0.00469, global_step=6548.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  69%|██████▊   | 828/1208 [22:26<10:17,  1.63s/it, loss=0.162, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00179, train/loss_step=0.335, global_step=6548.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  69%|██████▊   | 829/1208 [22:27<10:15,  1.63s/it, loss=0.162, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00179, train/loss_step=0.335, global_step=6548.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  69%|██████▊   | 829/1208 [22:27<10:15,  1.63s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00844, train/loss_vlb_step=4.03e-5, train/loss_step=0.00844, global_step=6549.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  69%|██████▊   | 830/1208 [22:28<10:14,  1.62s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00844, train/loss_vlb_step=4.03e-5, train/loss_step=0.00844, global_step=6549.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  69%|██████▊   | 830/1208 [22:28<10:14,  1.62s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0829, train/loss_vlb_step=0.000275, train/loss_step=0.0829, global_step=6549.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  69%|██████▉   | 831/1208 [22:29<10:12,  1.62s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0829, train/loss_vlb_step=0.000275, train/loss_step=0.0829, global_step=6549.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  69%|██████▉   | 831/1208 [22:29<10:12,  1.62s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.59e-5, train/loss_step=0.0182, global_step=6549.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  69%|██████▉   | 832/1208 [22:32<10:11,  1.63s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.59e-5, train/loss_step=0.0182, global_step=6549.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  69%|██████▉   | 832/1208 [22:32<10:11,  1.63s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0962, train/loss_vlb_step=0.000316, train/loss_step=0.0962, global_step=6549.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  69%|██████▉   | 833/1208 [22:33<10:09,  1.62s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0962, train/loss_vlb_step=0.000316, train/loss_step=0.0962, global_step=6549.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  69%|██████▉   | 833/1208 [22:33<10:09,  1.62s/it, loss=0.165, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000873, train/loss_step=0.226, global_step=6550.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  69%|██████▉   | 834/1208 [22:34<10:07,  1.62s/it, loss=0.165, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000873, train/loss_step=0.226, global_step=6550.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  69%|██████▉   | 834/1208 [22:34<10:07,  1.62s/it, loss=0.173, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000593, train/loss_step=0.174, global_step=6550.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  69%|██████▉   | 835/1208 [22:35<10:05,  1.62s/it, loss=0.173, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000593, train/loss_step=0.174, global_step=6550.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  69%|██████▉   | 835/1208 [22:35<10:05,  1.62s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.78e-5, train/loss_step=0.0161, global_step=6550.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  69%|██████▉   | 836/1208 [22:38<10:04,  1.62s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.78e-5, train/loss_step=0.0161, global_step=6550.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  69%|██████▉   | 836/1208 [22:38<10:04,  1.62s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.61e-5, train/loss_step=0.00284, global_step=6550.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  69%|██████▉   | 837/1208 [22:39<10:02,  1.62s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.61e-5, train/loss_step=0.00284, global_step=6550.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  69%|██████▉   | 837/1208 [22:39<10:02,  1.62s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00751, train/loss_vlb_step=3.54e-5, train/loss_step=0.00751, global_step=6551.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  69%|██████▉   | 838/1208 [22:40<10:00,  1.62s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00751, train/loss_vlb_step=3.54e-5, train/loss_step=0.00751, global_step=6551.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  69%|██████▉   | 838/1208 [22:40<10:00,  1.62s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0767, train/loss_vlb_step=0.00026, train/loss_step=0.0767, global_step=6551.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  69%|██████▉   | 839/1208 [22:41<09:58,  1.62s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0767, train/loss_vlb_step=0.00026, train/loss_step=0.0767, global_step=6551.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  69%|██████▉   | 839/1208 [22:41<09:58,  1.62s/it, loss=0.117, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000554, train/loss_step=0.168, global_step=6551.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  70%|██████▉   | 840/1208 [22:44<09:57,  1.62s/it, loss=0.117, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000554, train/loss_step=0.168, global_step=6551.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  70%|██████▉   | 840/1208 [22:44<09:57,  1.62s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0919, train/loss_vlb_step=0.000304, train/loss_step=0.0919, global_step=6551.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  70%|██████▉   | 841/1208 [22:45<09:55,  1.62s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0919, train/loss_vlb_step=0.000304, train/loss_step=0.0919, global_step=6551.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  70%|██████▉   | 841/1208 [22:45<09:55,  1.62s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.18e-5, train/loss_step=0.0232, global_step=6552.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  70%|██████▉   | 842/1208 [22:46<09:53,  1.62s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.18e-5, train/loss_step=0.0232, global_step=6552.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  70%|██████▉   | 842/1208 [22:46<09:53,  1.62s/it, loss=0.138, v_num=0, train/loss_simple_step=0.478, train/loss_vlb_step=0.00373, train/loss_step=0.478, global_step=6552.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  70%|██████▉   | 843/1208 [22:47<09:51,  1.62s/it, loss=0.138, v_num=0, train/loss_simple_step=0.478, train/loss_vlb_step=0.00373, train/loss_step=0.478, global_step=6552.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  70%|██████▉   | 843/1208 [22:47<09:51,  1.62s/it, loss=0.121, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000381, train/loss_step=0.115, global_step=6552.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  70%|██████▉   | 844/1208 [22:49<09:50,  1.62s/it, loss=0.121, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000381, train/loss_step=0.115, global_step=6552.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  70%|██████▉   | 844/1208 [22:49<09:50,  1.62s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00637, train/loss_vlb_step=3.15e-5, train/loss_step=0.00637, global_step=6552.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  70%|██████▉   | 845/1208 [22:50<09:48,  1.62s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00637, train/loss_vlb_step=3.15e-5, train/loss_step=0.00637, global_step=6552.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  70%|██████▉   | 845/1208 [22:50<09:48,  1.62s/it, loss=0.153, v_num=0, train/loss_simple_step=0.661, train/loss_vlb_step=0.0155, train/loss_step=0.661, global_step=6553.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]     Epoch 21:  70%|███████   | 846/1208 [22:51<09:47,  1.62s/it, loss=0.153, v_num=0, train/loss_simple_step=0.661, train/loss_vlb_step=0.0155, train/loss_step=0.661, global_step=6553.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  70%|███████   | 846/1208 [22:51<09:47,  1.62s/it, loss=0.13, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.67e-5, train/loss_step=0.003, global_step=6553.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  70%|███████   | 847/1208 [22:52<09:45,  1.62s/it, loss=0.13, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.67e-5, train/loss_step=0.003, global_step=6553.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  70%|███████   | 847/1208 [22:52<09:45,  1.62s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.00019, train/loss_step=0.0545, global_step=6553.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  70%|███████   | 848/1208 [22:55<09:44,  1.62s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.00019, train/loss_step=0.0545, global_step=6553.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  70%|███████   | 848/1208 [22:55<09:44,  1.62s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0305, train/loss_vlb_step=0.000117, train/loss_step=0.0305, global_step=6553.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  70%|███████   | 849/1208 [22:56<09:42,  1.62s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0305, train/loss_vlb_step=0.000117, train/loss_step=0.0305, global_step=6553.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  70%|███████   | 849/1208 [22:56<09:42,  1.62s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.00015, train/loss_step=0.0401, global_step=6554.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  70%|███████   | 850/1208 [22:57<09:40,  1.62s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.00015, train/loss_step=0.0401, global_step=6554.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  70%|███████   | 850/1208 [22:57<09:40,  1.62s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0502, train/loss_vlb_step=0.000175, train/loss_step=0.0502, global_step=6554.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  70%|███████   | 851/1208 [22:58<09:38,  1.62s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0502, train/loss_vlb_step=0.000175, train/loss_step=0.0502, global_step=6554.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  70%|███████   | 851/1208 [22:58<09:38,  1.62s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=1.03e-5, train/loss_step=0.00171, global_step=6554.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  71%|███████   | 852/1208 [23:01<09:37,  1.62s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=1.03e-5, train/loss_step=0.00171, global_step=6554.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  71%|███████   | 852/1208 [23:01<09:37,  1.62s/it, loss=0.127, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00178, train/loss_step=0.322, global_step=6554.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  71%|███████   | 853/1208 [23:02<09:35,  1.62s/it, loss=0.127, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00178, train/loss_step=0.322, global_step=6554.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  71%|███████   | 853/1208 [23:02<09:35,  1.62s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.56e-5, train/loss_step=0.0127, global_step=6555.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  71%|███████   | 854/1208 [23:03<09:33,  1.62s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.56e-5, train/loss_step=0.0127, global_step=6555.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  71%|███████   | 854/1208 [23:03<09:33,  1.62s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0763, train/loss_vlb_step=0.000259, train/loss_step=0.0763, global_step=6555.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  71%|███████   | 855/1208 [23:04<09:31,  1.62s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0763, train/loss_vlb_step=0.000259, train/loss_step=0.0763, global_step=6555.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  71%|███████   | 855/1208 [23:04<09:31,  1.62s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.51e-5, train/loss_step=0.00253, global_step=6555.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  71%|███████   | 856/1208 [23:07<09:30,  1.62s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.51e-5, train/loss_step=0.00253, global_step=6555.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  71%|███████   | 856/1208 [23:07<09:30,  1.62s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00722, train/loss_vlb_step=3.59e-5, train/loss_step=0.00722, global_step=6555.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  71%|███████   | 857/1208 [23:08<09:28,  1.62s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00722, train/loss_vlb_step=3.59e-5, train/loss_step=0.00722, global_step=6555.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  71%|███████   | 857/1208 [23:08<09:28,  1.62s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.38e-5, train/loss_step=0.0229, global_step=6556.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  71%|███████   | 858/1208 [23:09<09:26,  1.62s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.38e-5, train/loss_step=0.0229, global_step=6556.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  71%|███████   | 858/1208 [23:09<09:26,  1.62s/it, loss=0.112, v_num=0, train/loss_simple_step=0.082, train/loss_vlb_step=0.00027, train/loss_step=0.082, global_step=6556.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  71%|███████   | 859/1208 [23:10<09:25,  1.62s/it, loss=0.112, v_num=0, train/loss_simple_step=0.082, train/loss_vlb_step=0.00027, train/loss_step=0.082, global_step=6556.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  71%|███████   | 859/1208 [23:10<09:25,  1.62s/it, loss=0.111, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000442, train/loss_step=0.133, global_step=6556.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  71%|███████   | 860/1208 [23:13<09:23,  1.62s/it, loss=0.111, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000442, train/loss_step=0.133, global_step=6556.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  71%|███████   | 860/1208 [23:13<09:23,  1.62s/it, loss=0.124, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00246, train/loss_step=0.366, global_step=6556.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  71%|███████▏  | 861/1208 [23:14<09:22,  1.62s/it, loss=0.124, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00246, train/loss_step=0.366, global_step=6556.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  71%|███████▏  | 861/1208 [23:14<09:22,  1.62s/it, loss=0.143, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00474, train/loss_step=0.393, global_step=6557.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  71%|███████▏  | 862/1208 [23:15<09:20,  1.62s/it, loss=0.143, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00474, train/loss_step=0.393, global_step=6557.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  71%|███████▏  | 862/1208 [23:15<09:20,  1.62s/it, loss=0.126, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000428, train/loss_step=0.130, global_step=6557.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  71%|███████▏  | 863/1208 [23:16<09:18,  1.62s/it, loss=0.126, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000428, train/loss_step=0.130, global_step=6557.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  71%|███████▏  | 863/1208 [23:16<09:18,  1.62s/it, loss=0.131, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.00102, train/loss_step=0.233, global_step=6557.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  72%|███████▏  | 864/1208 [23:19<09:17,  1.62s/it, loss=0.131, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.00102, train/loss_step=0.233, global_step=6557.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  72%|███████▏  | 864/1208 [23:19<09:17,  1.62s/it, loss=0.149, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00238, train/loss_step=0.362, global_step=6557.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  72%|███████▏  | 865/1208 [23:20<09:15,  1.62s/it, loss=0.149, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00238, train/loss_step=0.362, global_step=6557.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  72%|███████▏  | 865/1208 [23:20<09:15,  1.62s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00397, train/loss_vlb_step=2.09e-5, train/loss_step=0.00397, global_step=6558.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  72%|███████▏  | 866/1208 [23:21<09:13,  1.62s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00397, train/loss_vlb_step=2.09e-5, train/loss_step=0.00397, global_step=6558.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  72%|███████▏  | 866/1208 [23:21<09:13,  1.62s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00958, train/loss_vlb_step=4.67e-5, train/loss_step=0.00958, global_step=6558.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  72%|███████▏  | 867/1208 [23:23<09:11,  1.62s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00958, train/loss_vlb_step=4.67e-5, train/loss_step=0.00958, global_step=6558.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  72%|███████▏  | 867/1208 [23:23<09:11,  1.62s/it, loss=0.132, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.0023, train/loss_step=0.364, global_step=6558.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]     Epoch 21:  72%|███████▏  | 868/1208 [23:26<09:10,  1.62s/it, loss=0.132, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.0023, train/loss_step=0.364, global_step=6558.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  72%|███████▏  | 868/1208 [23:26<09:10,  1.62s/it, loss=0.139, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.0006, train/loss_step=0.167, global_step=6558.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  72%|███████▏  | 869/1208 [23:27<09:08,  1.62s/it, loss=0.139, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.0006, train/loss_step=0.167, global_step=6558.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  72%|███████▏  | 869/1208 [23:27<09:08,  1.62s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0703, train/loss_vlb_step=0.00024, train/loss_step=0.0703, global_step=6559.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  72%|███████▏  | 870/1208 [23:28<09:07,  1.62s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0703, train/loss_vlb_step=0.00024, train/loss_step=0.0703, global_step=6559.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  72%|███████▏  | 870/1208 [23:28<09:07,  1.62s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.18e-5, train/loss_step=0.0111, global_step=6559.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  72%|███████▏  | 871/1208 [23:29<09:05,  1.62s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.18e-5, train/loss_step=0.0111, global_step=6559.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  72%|███████▏  | 871/1208 [23:29<09:05,  1.62s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000194, train/loss_step=0.0555, global_step=6559.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  72%|███████▏  | 872/1208 [23:32<09:04,  1.62s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000194, train/loss_step=0.0555, global_step=6559.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  72%|███████▏  | 872/1208 [23:32<09:04,  1.62s/it, loss=0.137, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.00109, train/loss_step=0.228, global_step=6559.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  72%|███████▏  | 873/1208 [23:33<09:02,  1.62s/it, loss=0.137, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.00109, train/loss_step=0.228, global_step=6559.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  72%|███████▏  | 873/1208 [23:33<09:02,  1.62s/it, loss=0.136, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.14e-5, train/loss_step=0.011, global_step=6560.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  72%|███████▏  | 874/1208 [23:34<09:00,  1.62s/it, loss=0.136, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.14e-5, train/loss_step=0.011, global_step=6560.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  72%|███████▏  | 874/1208 [23:34<09:00,  1.62s/it, loss=0.139, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000448, train/loss_step=0.136, global_step=6560.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  72%|███████▏  | 875/1208 [23:35<08:58,  1.62s/it, loss=0.139, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000448, train/loss_step=0.136, global_step=6560.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  72%|███████▏  | 875/1208 [23:35<08:58,  1.62s/it, loss=0.147, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000571, train/loss_step=0.163, global_step=6560.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  73%|███████▎  | 876/1208 [23:38<08:57,  1.62s/it, loss=0.147, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000571, train/loss_step=0.163, global_step=6560.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  73%|███████▎  | 876/1208 [23:38<08:57,  1.62s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.53e-5, train/loss_step=0.0176, global_step=6560.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  73%|███████▎  | 877/1208 [23:39<08:55,  1.62s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.53e-5, train/loss_step=0.0176, global_step=6560.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  73%|███████▎  | 877/1208 [23:39<08:55,  1.62s/it, loss=0.154, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000461, train/loss_step=0.137, global_step=6561.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  73%|███████▎  | 878/1208 [23:40<08:54,  1.62s/it, loss=0.154, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000461, train/loss_step=0.137, global_step=6561.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  73%|███████▎  | 878/1208 [23:40<08:54,  1.62s/it, loss=0.16, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000835, train/loss_step=0.216, global_step=6561.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  73%|███████▎  | 879/1208 [23:41<08:52,  1.62s/it, loss=0.16, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000835, train/loss_step=0.216, global_step=6561.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  73%|███████▎  | 879/1208 [23:41<08:52,  1.62s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.00013, train/loss_step=0.0365, global_step=6561.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  73%|███████▎  | 880/1208 [23:45<08:51,  1.62s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.00013, train/loss_step=0.0365, global_step=6561.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  73%|███████▎  | 880/1208 [23:45<08:51,  1.62s/it, loss=0.146, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000612, train/loss_step=0.182, global_step=6561.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  73%|███████▎  | 881/1208 [23:46<08:49,  1.62s/it, loss=0.146, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000612, train/loss_step=0.182, global_step=6561.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  73%|███████▎  | 881/1208 [23:46<08:49,  1.62s/it, loss=0.138, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.00102, train/loss_step=0.236, global_step=6562.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  73%|███████▎  | 882/1208 [23:47<08:47,  1.62s/it, loss=0.138, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.00102, train/loss_step=0.236, global_step=6562.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  73%|███████▎  | 882/1208 [23:47<08:47,  1.62s/it, loss=0.146, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00131, train/loss_step=0.271, global_step=6562.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  73%|███████▎  | 883/1208 [23:48<08:45,  1.62s/it, loss=0.146, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00131, train/loss_step=0.271, global_step=6562.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  73%|███████▎  | 883/1208 [23:48<08:45,  1.62s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00472, train/loss_vlb_step=2.43e-5, train/loss_step=0.00472, global_step=6562.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  73%|███████▎  | 884/1208 [23:51<08:44,  1.62s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00472, train/loss_vlb_step=2.43e-5, train/loss_step=0.00472, global_step=6562.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  73%|███████▎  | 884/1208 [23:51<08:44,  1.62s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.00017, train/loss_step=0.0471, global_step=6562.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  73%|███████▎  | 885/1208 [23:52<08:42,  1.62s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.00017, train/loss_step=0.0471, global_step=6562.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  73%|███████▎  | 885/1208 [23:52<08:42,  1.62s/it, loss=0.134, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00158, train/loss_step=0.306, global_step=6563.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  73%|███████▎  | 886/1208 [23:53<08:41,  1.62s/it, loss=0.134, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00158, train/loss_step=0.306, global_step=6563.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  73%|███████▎  | 886/1208 [23:53<08:41,  1.62s/it, loss=0.142, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000652, train/loss_step=0.176, global_step=6563.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  73%|███████▎  | 887/1208 [23:54<08:39,  1.62s/it, loss=0.142, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000652, train/loss_step=0.176, global_step=6563.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  73%|███████▎  | 887/1208 [23:54<08:39,  1.62s/it, loss=0.13, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000444, train/loss_step=0.133, global_step=6563.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  74%|███████▎  | 888/1208 [23:57<08:38,  1.62s/it, loss=0.13, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000444, train/loss_step=0.133, global_step=6563.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  74%|███████▎  | 888/1208 [23:57<08:38,  1.62s/it, loss=0.137, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00149, train/loss_step=0.296, global_step=6563.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  74%|███████▎  | 889/1208 [23:58<08:36,  1.62s/it, loss=0.137, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00149, train/loss_step=0.296, global_step=6563.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  74%|███████▎  | 889/1208 [23:58<08:36,  1.62s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.4e-5, train/loss_step=0.00236, global_step=6564.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  74%|███████▎  | 890/1208 [23:59<08:34,  1.62s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.4e-5, train/loss_step=0.00236, global_step=6564.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  74%|███████▎  | 890/1208 [23:59<08:34,  1.62s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=8.23e-5, train/loss_step=0.0191, global_step=6564.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  74%|███████▍  | 891/1208 [24:00<08:32,  1.62s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=8.23e-5, train/loss_step=0.0191, global_step=6564.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  74%|███████▍  | 891/1208 [24:00<08:32,  1.62s/it, loss=0.169, v_num=0, train/loss_simple_step=0.764, train/loss_vlb_step=0.0307, train/loss_step=0.764, global_step=6564.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  74%|███████▍  | 892/1208 [24:04<08:31,  1.62s/it, loss=0.169, v_num=0, train/loss_simple_step=0.764, train/loss_vlb_step=0.0307, train/loss_step=0.764, global_step=6564.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  74%|███████▍  | 892/1208 [24:04<08:31,  1.62s/it, loss=0.17, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.000882, train/loss_step=0.247, global_step=6564.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  74%|███████▍  | 893/1208 [24:05<08:29,  1.62s/it, loss=0.17, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.000882, train/loss_step=0.247, global_step=6564.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  74%|███████▍  | 893/1208 [24:05<08:29,  1.62s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00538, train/loss_vlb_step=2.8e-5, train/loss_step=0.00538, global_step=6565.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  74%|███████▍  | 894/1208 [24:06<08:27,  1.62s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00538, train/loss_vlb_step=2.8e-5, train/loss_step=0.00538, global_step=6565.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  74%|███████▍  | 894/1208 [24:06<08:27,  1.62s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0453, train/loss_vlb_step=0.000163, train/loss_step=0.0453, global_step=6565.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  74%|███████▍  | 895/1208 [24:07<08:26,  1.62s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0453, train/loss_vlb_step=0.000163, train/loss_step=0.0453, global_step=6565.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  74%|███████▍  | 895/1208 [24:07<08:26,  1.62s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00376, train/loss_vlb_step=2.05e-5, train/loss_step=0.00376, global_step=6565.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  74%|███████▍  | 896/1208 [24:10<08:25,  1.62s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00376, train/loss_vlb_step=2.05e-5, train/loss_step=0.00376, global_step=6565.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  74%|███████▍  | 896/1208 [24:10<08:25,  1.62s/it, loss=0.165, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000535, train/loss_step=0.163, global_step=6565.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  74%|███████▍  | 897/1208 [24:11<08:23,  1.62s/it, loss=0.165, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000535, train/loss_step=0.163, global_step=6565.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  74%|███████▍  | 897/1208 [24:11<08:23,  1.62s/it, loss=0.181, v_num=0, train/loss_simple_step=0.472, train/loss_vlb_step=0.00626, train/loss_step=0.472, global_step=6566.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  74%|███████▍  | 898/1208 [24:12<08:21,  1.62s/it, loss=0.181, v_num=0, train/loss_simple_step=0.472, train/loss_vlb_step=0.00626, train/loss_step=0.472, global_step=6566.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  74%|███████▍  | 898/1208 [24:12<08:21,  1.62s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0896, train/loss_vlb_step=0.000295, train/loss_step=0.0896, global_step=6566.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  74%|███████▍  | 899/1208 [24:13<08:19,  1.62s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0896, train/loss_vlb_step=0.000295, train/loss_step=0.0896, global_step=6566.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  74%|███████▍  | 899/1208 [24:13<08:19,  1.62s/it, loss=0.18, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000461, train/loss_step=0.137, global_step=6566.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  75%|███████▍  | 900/1208 [24:16<08:18,  1.62s/it, loss=0.18, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000461, train/loss_step=0.137, global_step=6566.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  75%|███████▍  | 900/1208 [24:16<08:18,  1.62s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000116, train/loss_step=0.0307, global_step=6566.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.80it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.76it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.80it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.76it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.78it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.78it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.78it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.78it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.78it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.77it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.78it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.75it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 21:  75%|███████▍  | 901/1208 [24:47<08:26,  1.65s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000116, train/loss_step=0.0307, global_step=6566.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  75%|███████▍  | 901/1208 [24:47<08:26,  1.65s/it, loss=0.166, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000367, train/loss_step=0.112, global_step=6567.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  75%|███████▍  | 902/1208 [24:48<08:25,  1.65s/it, loss=0.166, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000367, train/loss_step=0.112, global_step=6567.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  75%|███████▍  | 902/1208 [24:48<08:25,  1.65s/it, loss=0.174, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00397, train/loss_step=0.436, global_step=6567.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  75%|███████▍  | 903/1208 [24:49<08:23,  1.65s/it, loss=0.174, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00397, train/loss_step=0.436, global_step=6567.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  75%|███████▍  | 903/1208 [24:49<08:23,  1.65s/it, loss=0.183, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000599, train/loss_step=0.177, global_step=6567.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  75%|███████▍  | 904/1208 [24:52<08:22,  1.65s/it, loss=0.183, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000599, train/loss_step=0.177, global_step=6567.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  75%|███████▍  | 904/1208 [24:52<08:22,  1.65s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=2.56e-5, train/loss_step=0.00492, global_step=6567.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  75%|███████▍  | 905/1208 [24:53<08:20,  1.65s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=2.56e-5, train/loss_step=0.00492, global_step=6567.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  75%|███████▍  | 905/1208 [24:53<08:20,  1.65s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0879, train/loss_vlb_step=0.00029, train/loss_step=0.0879, global_step=6568.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  75%|███████▌  | 906/1208 [24:54<08:18,  1.65s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0879, train/loss_vlb_step=0.00029, train/loss_step=0.0879, global_step=6568.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  75%|███████▌  | 906/1208 [24:54<08:18,  1.65s/it, loss=0.171, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000722, train/loss_step=0.197, global_step=6568.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  75%|███████▌  | 907/1208 [24:55<08:16,  1.65s/it, loss=0.171, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000722, train/loss_step=0.197, global_step=6568.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  75%|███████▌  | 907/1208 [24:55<08:16,  1.65s/it, loss=0.196, v_num=0, train/loss_simple_step=0.622, train/loss_vlb_step=0.0233, train/loss_step=0.622, global_step=6568.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  75%|███████▌  | 908/1208 [24:59<08:15,  1.65s/it, loss=0.196, v_num=0, train/loss_simple_step=0.622, train/loss_vlb_step=0.0233, train/loss_step=0.622, global_step=6568.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  75%|███████▌  | 908/1208 [24:59<08:15,  1.65s/it, loss=0.19, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000615, train/loss_step=0.178, global_step=6568.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  75%|███████▌  | 909/1208 [25:00<08:13,  1.65s/it, loss=0.19, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000615, train/loss_step=0.178, global_step=6568.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  75%|███████▌  | 909/1208 [25:00<08:13,  1.65s/it, loss=0.202, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00108, train/loss_step=0.249, global_step=6569.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  75%|███████▌  | 910/1208 [25:01<08:11,  1.65s/it, loss=0.202, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00108, train/loss_step=0.249, global_step=6569.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  75%|███████▌  | 910/1208 [25:01<08:11,  1.65s/it, loss=0.201, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=2.4e-5, train/loss_step=0.00464, global_step=6569.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  75%|███████▌  | 911/1208 [25:02<08:09,  1.65s/it, loss=0.201, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=2.4e-5, train/loss_step=0.00464, global_step=6569.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  75%|███████▌  | 911/1208 [25:02<08:09,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00146, train/loss_vlb_step=8.48e-6, train/loss_step=0.00146, global_step=6569.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  75%|███████▌  | 912/1208 [25:05<08:08,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00146, train/loss_vlb_step=8.48e-6, train/loss_step=0.00146, global_step=6569.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  75%|███████▌  | 912/1208 [25:05<08:08,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=9.07e-5, train/loss_step=0.0219, global_step=6569.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  76%|███████▌  | 913/1208 [25:06<08:06,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=9.07e-5, train/loss_step=0.0219, global_step=6569.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  76%|███████▌  | 913/1208 [25:06<08:06,  1.65s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0652, train/loss_vlb_step=0.000219, train/loss_step=0.0652, global_step=6570.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  76%|███████▌  | 914/1208 [25:07<08:04,  1.65s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0652, train/loss_vlb_step=0.000219, train/loss_step=0.0652, global_step=6570.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  76%|███████▌  | 914/1208 [25:07<08:04,  1.65s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.05e-5, train/loss_step=0.00174, global_step=6570.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  76%|███████▌  | 915/1208 [25:08<08:03,  1.65s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.05e-5, train/loss_step=0.00174, global_step=6570.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  76%|███████▌  | 915/1208 [25:08<08:03,  1.65s/it, loss=0.164, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000917, train/loss_step=0.233, global_step=6570.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  76%|███████▌  | 916/1208 [25:11<08:01,  1.65s/it, loss=0.164, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000917, train/loss_step=0.233, global_step=6570.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  76%|███████▌  | 916/1208 [25:11<08:01,  1.65s/it, loss=0.167, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.00078, train/loss_step=0.211, global_step=6570.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  76%|███████▌  | 917/1208 [25:12<08:00,  1.65s/it, loss=0.167, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.00078, train/loss_step=0.211, global_step=6570.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  76%|███████▌  | 917/1208 [25:12<08:00,  1.65s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0628, train/loss_vlb_step=0.000218, train/loss_step=0.0628, global_step=6571.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  76%|███████▌  | 918/1208 [25:13<07:58,  1.65s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0628, train/loss_vlb_step=0.000218, train/loss_step=0.0628, global_step=6571.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  76%|███████▌  | 918/1208 [25:13<07:58,  1.65s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0895, train/loss_vlb_step=0.000295, train/loss_step=0.0895, global_step=6571.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  76%|███████▌  | 919/1208 [25:15<07:56,  1.65s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0895, train/loss_vlb_step=0.000295, train/loss_step=0.0895, global_step=6571.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  76%|███████▌  | 919/1208 [25:15<07:56,  1.65s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.82e-5, train/loss_step=0.0108, global_step=6571.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  76%|███████▌  | 920/1208 [25:18<07:55,  1.65s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.82e-5, train/loss_step=0.0108, global_step=6571.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  76%|███████▌  | 920/1208 [25:18<07:55,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.00036, train/loss_step=0.110, global_step=6571.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  76%|███████▌  | 921/1208 [25:19<07:53,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.00036, train/loss_step=0.110, global_step=6571.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  76%|███████▌  | 921/1208 [25:19<07:53,  1.65s/it, loss=0.145, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000475, train/loss_step=0.141, global_step=6572.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  76%|███████▋  | 922/1208 [25:20<07:51,  1.65s/it, loss=0.145, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000475, train/loss_step=0.141, global_step=6572.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  76%|███████▋  | 922/1208 [25:20<07:51,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0519, train/loss_vlb_step=0.000175, train/loss_step=0.0519, global_step=6572.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  76%|███████▋  | 923/1208 [25:21<07:49,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0519, train/loss_vlb_step=0.000175, train/loss_step=0.0519, global_step=6572.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  76%|███████▋  | 923/1208 [25:21<07:49,  1.65s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0565, train/loss_vlb_step=0.000194, train/loss_step=0.0565, global_step=6572.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  76%|███████▋  | 924/1208 [25:24<07:48,  1.65s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0565, train/loss_vlb_step=0.000194, train/loss_step=0.0565, global_step=6572.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  76%|███████▋  | 924/1208 [25:24<07:48,  1.65s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.000227, train/loss_step=0.0665, global_step=6572.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  77%|███████▋  | 925/1208 [25:25<07:46,  1.65s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.000227, train/loss_step=0.0665, global_step=6572.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  77%|███████▋  | 925/1208 [25:25<07:46,  1.65s/it, loss=0.127, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000565, train/loss_step=0.165, global_step=6573.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  77%|███████▋  | 926/1208 [25:26<07:44,  1.65s/it, loss=0.127, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000565, train/loss_step=0.165, global_step=6573.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  77%|███████▋  | 926/1208 [25:26<07:44,  1.65s/it, loss=0.148, v_num=0, train/loss_simple_step=0.621, train/loss_vlb_step=0.0107, train/loss_step=0.621, global_step=6573.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  77%|███████▋  | 927/1208 [25:27<07:43,  1.65s/it, loss=0.148, v_num=0, train/loss_simple_step=0.621, train/loss_vlb_step=0.0107, train/loss_step=0.621, global_step=6573.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  77%|███████▋  | 927/1208 [25:27<07:43,  1.65s/it, loss=0.123, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000409, train/loss_step=0.124, global_step=6573.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  77%|███████▋  | 928/1208 [25:31<07:41,  1.65s/it, loss=0.123, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000409, train/loss_step=0.124, global_step=6573.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  77%|███████▋  | 928/1208 [25:31<07:41,  1.65s/it, loss=0.132, v_num=0, train/loss_simple_step=0.358, train/loss_vlb_step=0.00259, train/loss_step=0.358, global_step=6573.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  77%|███████▋  | 929/1208 [25:32<07:40,  1.65s/it, loss=0.132, v_num=0, train/loss_simple_step=0.358, train/loss_vlb_step=0.00259, train/loss_step=0.358, global_step=6573.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  77%|███████▋  | 929/1208 [25:32<07:40,  1.65s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.35e-5, train/loss_step=0.0226, global_step=6574.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  77%|███████▋  | 930/1208 [25:33<07:38,  1.65s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.35e-5, train/loss_step=0.0226, global_step=6574.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  77%|███████▋  | 930/1208 [25:33<07:38,  1.65s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000188, train/loss_step=0.0545, global_step=6574.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  77%|███████▋  | 931/1208 [25:34<07:36,  1.65s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000188, train/loss_step=0.0545, global_step=6574.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  77%|███████▋  | 931/1208 [25:34<07:36,  1.65s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0958, train/loss_vlb_step=0.000315, train/loss_step=0.0958, global_step=6574.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  77%|███████▋  | 932/1208 [25:37<07:35,  1.65s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0958, train/loss_vlb_step=0.000315, train/loss_step=0.0958, global_step=6574.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  77%|███████▋  | 932/1208 [25:37<07:35,  1.65s/it, loss=0.133, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000401, train/loss_step=0.122, global_step=6574.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  77%|███████▋  | 933/1208 [25:38<07:33,  1.65s/it, loss=0.133, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000401, train/loss_step=0.122, global_step=6574.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  77%|███████▋  | 933/1208 [25:38<07:33,  1.65s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000104, train/loss_step=0.0284, global_step=6575.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  77%|███████▋  | 934/1208 [25:39<07:31,  1.65s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000104, train/loss_step=0.0284, global_step=6575.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  77%|███████▋  | 934/1208 [25:39<07:31,  1.65s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=0.000102, train/loss_step=0.0261, global_step=6575.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  77%|███████▋  | 935/1208 [25:40<07:29,  1.65s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=0.000102, train/loss_step=0.0261, global_step=6575.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  77%|███████▋  | 935/1208 [25:40<07:29,  1.65s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.76e-5, train/loss_step=0.0032, global_step=6575.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  77%|███████▋  | 936/1208 [25:43<07:28,  1.65s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.76e-5, train/loss_step=0.0032, global_step=6575.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  77%|███████▋  | 936/1208 [25:43<07:28,  1.65s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0585, train/loss_vlb_step=0.000201, train/loss_step=0.0585, global_step=6575.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  78%|███████▊  | 937/1208 [25:44<07:26,  1.65s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0585, train/loss_vlb_step=0.000201, train/loss_step=0.0585, global_step=6575.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  78%|███████▊  | 937/1208 [25:44<07:26,  1.65s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00753, train/loss_vlb_step=3.71e-5, train/loss_step=0.00753, global_step=6576.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  78%|███████▊  | 938/1208 [25:45<07:24,  1.65s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00753, train/loss_vlb_step=3.71e-5, train/loss_step=0.00753, global_step=6576.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  78%|███████▊  | 938/1208 [25:45<07:24,  1.65s/it, loss=0.112, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000396, train/loss_step=0.121, global_step=6576.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  78%|███████▊  | 939/1208 [25:46<07:23,  1.65s/it, loss=0.112, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000396, train/loss_step=0.121, global_step=6576.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  78%|███████▊  | 939/1208 [25:46<07:23,  1.65s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0956, train/loss_vlb_step=0.000314, train/loss_step=0.0956, global_step=6576.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  78%|███████▊  | 940/1208 [25:50<07:21,  1.65s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0956, train/loss_vlb_step=0.000314, train/loss_step=0.0956, global_step=6576.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  78%|███████▊  | 940/1208 [25:50<07:21,  1.65s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00593, train/loss_vlb_step=2.88e-5, train/loss_step=0.00593, global_step=6576.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  78%|███████▊  | 941/1208 [25:51<07:20,  1.65s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00593, train/loss_vlb_step=2.88e-5, train/loss_step=0.00593, global_step=6576.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  78%|███████▊  | 941/1208 [25:51<07:20,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.00081, train/loss_step=0.209, global_step=6577.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  78%|███████▊  | 942/1208 [25:52<07:18,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.00081, train/loss_step=0.209, global_step=6577.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  78%|███████▊  | 942/1208 [25:52<07:18,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0597, train/loss_vlb_step=0.000199, train/loss_step=0.0597, global_step=6577.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  78%|███████▊  | 943/1208 [25:53<07:16,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0597, train/loss_vlb_step=0.000199, train/loss_step=0.0597, global_step=6577.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  78%|███████▊  | 943/1208 [25:53<07:16,  1.65s/it, loss=0.113, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.95e-5, train/loss_step=0.011, global_step=6577.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  78%|███████▊  | 944/1208 [25:56<07:15,  1.65s/it, loss=0.113, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.95e-5, train/loss_step=0.011, global_step=6577.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  78%|███████▊  | 944/1208 [25:56<07:15,  1.65s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.69e-5, train/loss_step=0.0216, global_step=6577.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  78%|███████▊  | 945/1208 [25:57<07:13,  1.65s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.69e-5, train/loss_step=0.0216, global_step=6577.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  78%|███████▊  | 945/1208 [25:57<07:13,  1.65s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=1.7e-5, train/loss_step=0.00294, global_step=6578.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  78%|███████▊  | 946/1208 [25:58<07:11,  1.65s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=1.7e-5, train/loss_step=0.00294, global_step=6578.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  78%|███████▊  | 946/1208 [25:58<07:11,  1.65s/it, loss=0.0796, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000569, train/loss_step=0.165, global_step=6578.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  78%|███████▊  | 947/1208 [25:59<07:09,  1.65s/it, loss=0.0796, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000569, train/loss_step=0.165, global_step=6578.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  78%|███████▊  | 947/1208 [25:59<07:09,  1.65s/it, loss=0.0755, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.00015, train/loss_step=0.042, global_step=6578.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  78%|███████▊  | 948/1208 [26:02<07:08,  1.65s/it, loss=0.0755, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.00015, train/loss_step=0.042, global_step=6578.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  78%|███████▊  | 948/1208 [26:02<07:08,  1.65s/it, loss=0.0765, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00297, train/loss_step=0.378, global_step=6578.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  79%|███████▊  | 949/1208 [26:03<07:06,  1.65s/it, loss=0.0765, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00297, train/loss_step=0.378, global_step=6578.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  79%|███████▊  | 949/1208 [26:03<07:06,  1.65s/it, loss=0.0754, v_num=0, train/loss_simple_step=0.00122, train/loss_vlb_step=7.41e-6, train/loss_step=0.00122, global_step=6579.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  79%|███████▊  | 950/1208 [26:04<07:05,  1.65s/it, loss=0.0754, v_num=0, train/loss_simple_step=0.00122, train/loss_vlb_step=7.41e-6, train/loss_step=0.00122, global_step=6579.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  79%|███████▊  | 950/1208 [26:04<07:05,  1.65s/it, loss=0.0774, v_num=0, train/loss_simple_step=0.0939, train/loss_vlb_step=0.000308, train/loss_step=0.0939, global_step=6579.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  79%|███████▊  | 951/1208 [26:06<07:03,  1.65s/it, loss=0.0774, v_num=0, train/loss_simple_step=0.0939, train/loss_vlb_step=0.000308, train/loss_step=0.0939, global_step=6579.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  79%|███████▊  | 951/1208 [26:06<07:03,  1.65s/it, loss=0.0729, v_num=0, train/loss_simple_step=0.00579, train/loss_vlb_step=2.83e-5, train/loss_step=0.00579, global_step=6579.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  79%|███████▉  | 952/1208 [26:09<07:01,  1.65s/it, loss=0.0729, v_num=0, train/loss_simple_step=0.00579, train/loss_vlb_step=2.83e-5, train/loss_step=0.00579, global_step=6579.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  79%|███████▉  | 952/1208 [26:09<07:01,  1.65s/it, loss=0.0813, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00107, train/loss_step=0.292, global_step=6579.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  79%|███████▉  | 953/1208 [26:10<07:00,  1.65s/it, loss=0.0813, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00107, train/loss_step=0.292, global_step=6579.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  79%|███████▉  | 953/1208 [26:10<07:00,  1.65s/it, loss=0.0866, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000445, train/loss_step=0.133, global_step=6580.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  79%|███████▉  | 954/1208 [26:11<06:58,  1.65s/it, loss=0.0866, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000445, train/loss_step=0.133, global_step=6580.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  79%|███████▉  | 954/1208 [26:11<06:58,  1.65s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000571, train/loss_step=0.164, global_step=6580.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  79%|███████▉  | 955/1208 [26:12<06:56,  1.65s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000571, train/loss_step=0.164, global_step=6580.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  79%|███████▉  | 955/1208 [26:12<06:56,  1.65s/it, loss=0.0943, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.49e-5, train/loss_step=0.0205, global_step=6580.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  79%|███████▉  | 956/1208 [26:15<06:55,  1.65s/it, loss=0.0943, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.49e-5, train/loss_step=0.0205, global_step=6580.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  79%|███████▉  | 956/1208 [26:15<06:55,  1.65s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000422, train/loss_step=0.128, global_step=6580.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  79%|███████▉  | 957/1208 [26:16<06:53,  1.65s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000422, train/loss_step=0.128, global_step=6580.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  79%|███████▉  | 957/1208 [26:16<06:53,  1.65s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.2e-5, train/loss_step=0.00199, global_step=6581.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  79%|███████▉  | 958/1208 [26:17<06:51,  1.65s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.2e-5, train/loss_step=0.00199, global_step=6581.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  79%|███████▉  | 958/1208 [26:17<06:51,  1.65s/it, loss=0.105, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00115, train/loss_step=0.269, global_step=6581.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  79%|███████▉  | 959/1208 [26:18<06:49,  1.65s/it, loss=0.105, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00115, train/loss_step=0.269, global_step=6581.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  79%|███████▉  | 959/1208 [26:18<06:49,  1.65s/it, loss=0.102, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.000108, train/loss_step=0.027, global_step=6581.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  79%|███████▉  | 960/1208 [26:22<06:48,  1.65s/it, loss=0.102, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.000108, train/loss_step=0.027, global_step=6581.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  79%|███████▉  | 960/1208 [26:22<06:48,  1.65s/it, loss=0.119, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00237, train/loss_step=0.352, global_step=6581.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  80%|███████▉  | 961/1208 [26:23<06:46,  1.65s/it, loss=0.119, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00237, train/loss_step=0.352, global_step=6581.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  80%|███████▉  | 961/1208 [26:23<06:46,  1.65s/it, loss=0.12, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000981, train/loss_step=0.232, global_step=6582.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  80%|███████▉  | 962/1208 [26:24<06:45,  1.65s/it, loss=0.12, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000981, train/loss_step=0.232, global_step=6582.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  80%|███████▉  | 962/1208 [26:24<06:45,  1.65s/it, loss=0.14, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00606, train/loss_step=0.457, global_step=6582.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  80%|███████▉  | 963/1208 [26:25<06:43,  1.65s/it, loss=0.14, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00606, train/loss_step=0.457, global_step=6582.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  80%|███████▉  | 963/1208 [26:25<06:43,  1.65s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.28e-5, train/loss_step=0.0213, global_step=6582.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  80%|███████▉  | 964/1208 [26:28<06:42,  1.65s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.28e-5, train/loss_step=0.0213, global_step=6582.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  80%|███████▉  | 964/1208 [26:28<06:42,  1.65s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00665, train/loss_vlb_step=3.38e-5, train/loss_step=0.00665, global_step=6582.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  80%|███████▉  | 965/1208 [26:29<06:40,  1.65s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00665, train/loss_vlb_step=3.38e-5, train/loss_step=0.00665, global_step=6582.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  80%|███████▉  | 965/1208 [26:29<06:40,  1.65s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0678, train/loss_vlb_step=0.000235, train/loss_step=0.0678, global_step=6583.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  80%|███████▉  | 966/1208 [26:30<06:38,  1.65s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0678, train/loss_vlb_step=0.000235, train/loss_step=0.0678, global_step=6583.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  80%|███████▉  | 966/1208 [26:30<06:38,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000654, train/loss_step=0.182, global_step=6583.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  80%|████████  | 967/1208 [26:31<06:36,  1.65s/it, loss=0.144, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000654, train/loss_step=0.182, global_step=6583.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  80%|████████  | 967/1208 [26:31<06:36,  1.65s/it, loss=0.175, v_num=0, train/loss_simple_step=0.667, train/loss_vlb_step=0.0135, train/loss_step=0.667, global_step=6583.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  80%|████████  | 968/1208 [26:34<06:35,  1.65s/it, loss=0.175, v_num=0, train/loss_simple_step=0.667, train/loss_vlb_step=0.0135, train/loss_step=0.667, global_step=6583.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  80%|████████  | 968/1208 [26:34<06:35,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000375, train/loss_step=0.113, global_step=6583.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  80%|████████  | 969/1208 [26:35<06:33,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000375, train/loss_step=0.113, global_step=6583.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  80%|████████  | 969/1208 [26:35<06:33,  1.65s/it, loss=0.183, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00373, train/loss_step=0.425, global_step=6584.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  80%|████████  | 970/1208 [26:36<06:31,  1.65s/it, loss=0.183, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00373, train/loss_step=0.425, global_step=6584.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  80%|████████  | 970/1208 [26:36<06:31,  1.65s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000134, train/loss_step=0.0358, global_step=6584.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  80%|████████  | 971/1208 [26:37<06:30,  1.65s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000134, train/loss_step=0.0358, global_step=6584.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  80%|████████  | 971/1208 [26:37<06:30,  1.65s/it, loss=0.193, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00117, train/loss_step=0.263, global_step=6584.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  80%|████████  | 972/1208 [26:40<06:28,  1.65s/it, loss=0.193, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00117, train/loss_step=0.263, global_step=6584.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  80%|████████  | 972/1208 [26:40<06:28,  1.65s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=8.15e-5, train/loss_step=0.0204, global_step=6584.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  81%|████████  | 973/1208 [26:41<06:26,  1.65s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=8.15e-5, train/loss_step=0.0204, global_step=6584.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  81%|████████  | 973/1208 [26:41<06:26,  1.65s/it, loss=0.179, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000445, train/loss_step=0.133, global_step=6585.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  81%|████████  | 974/1208 [26:42<06:25,  1.65s/it, loss=0.179, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000445, train/loss_step=0.133, global_step=6585.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  81%|████████  | 974/1208 [26:42<06:25,  1.65s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=9.07e-5, train/loss_step=0.0222, global_step=6585.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  81%|████████  | 975/1208 [26:43<06:23,  1.65s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=9.07e-5, train/loss_step=0.0222, global_step=6585.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  81%|████████  | 975/1208 [26:43<06:23,  1.65s/it, loss=0.177, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000399, train/loss_step=0.121, global_step=6585.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  81%|████████  | 976/1208 [26:46<06:21,  1.65s/it, loss=0.177, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000399, train/loss_step=0.121, global_step=6585.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  81%|████████  | 976/1208 [26:46<06:21,  1.65s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.39e-5, train/loss_step=0.0122, global_step=6585.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  81%|████████  | 977/1208 [26:47<06:20,  1.65s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.39e-5, train/loss_step=0.0122, global_step=6585.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  81%|████████  | 977/1208 [26:47<06:20,  1.65s/it, loss=0.178, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000478, train/loss_step=0.138, global_step=6586.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  81%|████████  | 978/1208 [26:48<06:18,  1.65s/it, loss=0.178, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000478, train/loss_step=0.138, global_step=6586.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  81%|████████  | 978/1208 [26:48<06:18,  1.65s/it, loss=0.182, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.0019, train/loss_step=0.338, global_step=6586.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  81%|████████  | 979/1208 [26:49<06:16,  1.64s/it, loss=0.182, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.0019, train/loss_step=0.338, global_step=6586.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  81%|████████  | 979/1208 [26:49<06:16,  1.64s/it, loss=0.191, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000747, train/loss_step=0.202, global_step=6586.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  81%|████████  | 980/1208 [26:52<06:15,  1.65s/it, loss=0.191, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000747, train/loss_step=0.202, global_step=6586.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  81%|████████  | 980/1208 [26:52<06:15,  1.65s/it, loss=0.177, v_num=0, train/loss_simple_step=0.075, train/loss_vlb_step=0.000252, train/loss_step=0.075, global_step=6586.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  81%|████████  | 981/1208 [26:53<06:13,  1.64s/it, loss=0.177, v_num=0, train/loss_simple_step=0.075, train/loss_vlb_step=0.000252, train/loss_step=0.075, global_step=6586.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  81%|████████  | 981/1208 [26:53<06:13,  1.64s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=8.89e-5, train/loss_step=0.0223, global_step=6587.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  81%|████████▏ | 982/1208 [26:54<06:11,  1.64s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=8.89e-5, train/loss_step=0.0223, global_step=6587.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  81%|████████▏ | 982/1208 [26:54<06:11,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000106, train/loss_step=0.0268, global_step=6587.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  81%|████████▏ | 983/1208 [26:55<06:09,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000106, train/loss_step=0.0268, global_step=6587.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  81%|████████▏ | 983/1208 [26:55<06:09,  1.64s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0628, train/loss_vlb_step=0.000218, train/loss_step=0.0628, global_step=6587.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  81%|████████▏ | 984/1208 [26:58<06:08,  1.64s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0628, train/loss_vlb_step=0.000218, train/loss_step=0.0628, global_step=6587.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  81%|████████▏ | 984/1208 [26:58<06:08,  1.64s/it, loss=0.159, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00108, train/loss_step=0.243, global_step=6587.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  82%|████████▏ | 985/1208 [26:59<06:06,  1.64s/it, loss=0.159, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00108, train/loss_step=0.243, global_step=6587.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  82%|████████▏ | 985/1208 [26:59<06:06,  1.64s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=8.45e-6, train/loss_step=0.00139, global_step=6588.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  82%|████████▏ | 986/1208 [27:00<06:04,  1.64s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=8.45e-6, train/loss_step=0.00139, global_step=6588.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  82%|████████▏ | 986/1208 [27:00<06:04,  1.64s/it, loss=0.167, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00258, train/loss_step=0.420, global_step=6588.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  82%|████████▏ | 987/1208 [27:01<06:03,  1.64s/it, loss=0.167, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00258, train/loss_step=0.420, global_step=6588.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  82%|████████▏ | 987/1208 [27:01<06:03,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000345, train/loss_step=0.104, global_step=6588.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  82%|████████▏ | 988/1208 [27:04<06:01,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000345, train/loss_step=0.104, global_step=6588.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  82%|████████▏ | 988/1208 [27:04<06:01,  1.64s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000163, train/loss_step=0.0407, global_step=6588.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  82%|████████▏ | 989/1208 [27:05<05:59,  1.64s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000163, train/loss_step=0.0407, global_step=6588.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  82%|████████▏ | 989/1208 [27:05<05:59,  1.64s/it, loss=0.121, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000461, train/loss_step=0.139, global_step=6589.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  82%|████████▏ | 990/1208 [27:06<05:58,  1.64s/it, loss=0.121, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000461, train/loss_step=0.139, global_step=6589.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  82%|████████▏ | 990/1208 [27:06<05:58,  1.64s/it, loss=0.125, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000405, train/loss_step=0.123, global_step=6589.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  82%|████████▏ | 991/1208 [27:07<05:56,  1.64s/it, loss=0.125, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000405, train/loss_step=0.123, global_step=6589.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  82%|████████▏ | 991/1208 [27:07<05:56,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00287, train/loss_step=0.396, global_step=6589.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  82%|████████▏ | 992/1208 [27:10<05:55,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00287, train/loss_step=0.396, global_step=6589.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  82%|████████▏ | 992/1208 [27:10<05:55,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.62e-5, train/loss_step=0.00285, global_step=6589.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  82%|████████▏ | 993/1208 [27:11<05:53,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.62e-5, train/loss_step=0.00285, global_step=6589.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  82%|████████▏ | 993/1208 [27:11<05:53,  1.64s/it, loss=0.126, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.96e-5, train/loss_step=0.024, global_step=6590.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  82%|████████▏ | 994/1208 [27:12<05:51,  1.64s/it, loss=0.126, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.96e-5, train/loss_step=0.024, global_step=6590.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  82%|████████▏ | 994/1208 [27:12<05:51,  1.64s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00436, train/loss_vlb_step=2.33e-5, train/loss_step=0.00436, global_step=6590.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  82%|████████▏ | 995/1208 [27:13<05:49,  1.64s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00436, train/loss_vlb_step=2.33e-5, train/loss_step=0.00436, global_step=6590.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  82%|████████▏ | 995/1208 [27:13<05:49,  1.64s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.98e-5, train/loss_step=0.0107, global_step=6590.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  82%|████████▏ | 996/1208 [27:16<05:48,  1.64s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.98e-5, train/loss_step=0.0107, global_step=6590.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  82%|████████▏ | 996/1208 [27:16<05:48,  1.64s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.47e-5, train/loss_step=0.0151, global_step=6590.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  83%|████████▎ | 997/1208 [27:17<05:46,  1.64s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.47e-5, train/loss_step=0.0151, global_step=6590.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  83%|████████▎ | 997/1208 [27:17<05:46,  1.64s/it, loss=0.124, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000919, train/loss_step=0.236, global_step=6591.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  83%|████████▎ | 998/1208 [27:18<05:44,  1.64s/it, loss=0.124, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000919, train/loss_step=0.236, global_step=6591.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  83%|████████▎ | 998/1208 [27:18<05:44,  1.64s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00807, train/loss_vlb_step=3.71e-5, train/loss_step=0.00807, global_step=6591.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  83%|████████▎ | 999/1208 [27:19<05:42,  1.64s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00807, train/loss_vlb_step=3.71e-5, train/loss_step=0.00807, global_step=6591.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  83%|████████▎ | 999/1208 [27:19<05:42,  1.64s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.56e-5, train/loss_step=0.0205, global_step=6591.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  83%|████████▎ | 1000/1208 [27:22<05:41,  1.64s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.56e-5, train/loss_step=0.0205, global_step=6591.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  83%|████████▎ | 1000/1208 [27:22<05:41,  1.64s/it, loss=0.1, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000336, train/loss_step=0.101, global_step=6591.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  83%|████████▎ | 1001/1208 [27:23<05:39,  1.64s/it, loss=0.1, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000336, train/loss_step=0.101, global_step=6591.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  83%|████████▎ | 1001/1208 [27:23<05:39,  1.64s/it, loss=0.115, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00145, train/loss_step=0.322, global_step=6592.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  83%|████████▎ | 1002/1208 [27:24<05:38,  1.64s/it, loss=0.115, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00145, train/loss_step=0.322, global_step=6592.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  83%|████████▎ | 1002/1208 [27:24<05:38,  1.64s/it, loss=0.13, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00172, train/loss_step=0.326, global_step=6592.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  83%|████████▎ | 1003/1208 [27:25<05:36,  1.64s/it, loss=0.13, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00172, train/loss_step=0.326, global_step=6592.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  83%|████████▎ | 1003/1208 [27:25<05:36,  1.64s/it, loss=0.142, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00139, train/loss_step=0.310, global_step=6592.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  83%|████████▎ | 1004/1208 [27:28<05:34,  1.64s/it, loss=0.142, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00139, train/loss_step=0.310, global_step=6592.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  83%|████████▎ | 1004/1208 [27:28<05:34,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000113, train/loss_step=0.0288, global_step=6592.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  83%|████████▎ | 1005/1208 [27:29<05:33,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000113, train/loss_step=0.0288, global_step=6592.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  83%|████████▎ | 1005/1208 [27:29<05:33,  1.64s/it, loss=0.143, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.00089, train/loss_step=0.233, global_step=6593.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  83%|████████▎ | 1006/1208 [27:30<05:31,  1.64s/it, loss=0.143, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.00089, train/loss_step=0.233, global_step=6593.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  83%|████████▎ | 1006/1208 [27:30<05:31,  1.64s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00355, train/loss_vlb_step=1.93e-5, train/loss_step=0.00355, global_step=6593.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  83%|████████▎ | 1007/1208 [27:31<05:29,  1.64s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00355, train/loss_vlb_step=1.93e-5, train/loss_step=0.00355, global_step=6593.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  83%|████████▎ | 1007/1208 [27:31<05:29,  1.64s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00393, train/loss_vlb_step=2.17e-5, train/loss_step=0.00393, global_step=6593.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  83%|████████▎ | 1008/1208 [27:34<05:28,  1.64s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00393, train/loss_vlb_step=2.17e-5, train/loss_step=0.00393, global_step=6593.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  83%|████████▎ | 1008/1208 [27:34<05:28,  1.64s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0557, train/loss_vlb_step=0.000199, train/loss_step=0.0557, global_step=6593.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  84%|████████▎ | 1009/1208 [27:35<05:26,  1.64s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0557, train/loss_vlb_step=0.000199, train/loss_step=0.0557, global_step=6593.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  84%|████████▎ | 1009/1208 [27:35<05:26,  1.64s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.000163, train/loss_step=0.0483, global_step=6594.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  84%|████████▎ | 1010/1208 [27:36<05:24,  1.64s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.000163, train/loss_step=0.0483, global_step=6594.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  84%|████████▎ | 1010/1208 [27:36<05:24,  1.64s/it, loss=0.115, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000469, train/loss_step=0.143, global_step=6594.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  84%|████████▎ | 1011/1208 [27:37<05:22,  1.64s/it, loss=0.115, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000469, train/loss_step=0.143, global_step=6594.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  84%|████████▎ | 1011/1208 [27:37<05:22,  1.64s/it, loss=0.104, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000668, train/loss_step=0.192, global_step=6594.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  84%|████████▍ | 1012/1208 [27:40<05:21,  1.64s/it, loss=0.104, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000668, train/loss_step=0.192, global_step=6594.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  84%|████████▍ | 1012/1208 [27:40<05:21,  1.64s/it, loss=0.118, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00145, train/loss_step=0.275, global_step=6594.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  84%|████████▍ | 1013/1208 [27:41<05:19,  1.64s/it, loss=0.118, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00145, train/loss_step=0.275, global_step=6594.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  84%|████████▍ | 1013/1208 [27:41<05:19,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.561, train/loss_vlb_step=0.011, train/loss_step=0.561, global_step=6595.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  84%|████████▍ | 1014/1208 [27:42<05:17,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.561, train/loss_vlb_step=0.011, train/loss_step=0.561, global_step=6595.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  84%|████████▍ | 1014/1208 [27:42<05:17,  1.64s/it, loss=0.156, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000895, train/loss_step=0.221, global_step=6595.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  84%|████████▍ | 1015/1208 [27:43<05:16,  1.64s/it, loss=0.156, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000895, train/loss_step=0.221, global_step=6595.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  84%|████████▍ | 1015/1208 [27:43<05:16,  1.64s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=7.24e-5, train/loss_step=0.0164, global_step=6595.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  84%|████████▍ | 1016/1208 [27:45<05:14,  1.64s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=7.24e-5, train/loss_step=0.0164, global_step=6595.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  84%|████████▍ | 1016/1208 [27:45<05:14,  1.64s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0535, train/loss_vlb_step=0.000187, train/loss_step=0.0535, global_step=6595.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  84%|████████▍ | 1017/1208 [27:46<05:13,  1.64s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0535, train/loss_vlb_step=0.000187, train/loss_step=0.0535, global_step=6595.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  84%|████████▍ | 1017/1208 [27:46<05:13,  1.64s/it, loss=0.156, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000752, train/loss_step=0.196, global_step=6596.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  84%|████████▍ | 1018/1208 [27:47<05:11,  1.64s/it, loss=0.156, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000752, train/loss_step=0.196, global_step=6596.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  84%|████████▍ | 1018/1208 [27:47<05:11,  1.64s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0289, train/loss_vlb_step=0.000109, train/loss_step=0.0289, global_step=6596.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  84%|████████▍ | 1019/1208 [27:48<05:09,  1.64s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0289, train/loss_vlb_step=0.000109, train/loss_step=0.0289, global_step=6596.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  84%|████████▍ | 1019/1208 [27:48<05:09,  1.64s/it, loss=0.163, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.00051, train/loss_step=0.152, global_step=6596.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  84%|████████▍ | 1020/1208 [27:51<05:08,  1.64s/it, loss=0.163, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.00051, train/loss_step=0.152, global_step=6596.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  84%|████████▍ | 1020/1208 [27:51<05:08,  1.64s/it, loss=0.167, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000615, train/loss_step=0.174, global_step=6596.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  85%|████████▍ | 1021/1208 [27:52<05:06,  1.64s/it, loss=0.167, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000615, train/loss_step=0.174, global_step=6596.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  85%|████████▍ | 1021/1208 [27:52<05:06,  1.64s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.11e-5, train/loss_step=0.0137, global_step=6597.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  85%|████████▍ | 1022/1208 [27:53<05:04,  1.64s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.11e-5, train/loss_step=0.0137, global_step=6597.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  85%|████████▍ | 1022/1208 [27:53<05:04,  1.64s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.48e-5, train/loss_step=0.0112, global_step=6597.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  85%|████████▍ | 1023/1208 [27:54<05:02,  1.64s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.48e-5, train/loss_step=0.0112, global_step=6597.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  85%|████████▍ | 1023/1208 [27:54<05:02,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00103, train/loss_step=0.255, global_step=6597.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  85%|████████▍ | 1024/1208 [27:57<05:01,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00103, train/loss_step=0.255, global_step=6597.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  85%|████████▍ | 1024/1208 [27:57<05:01,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00327, train/loss_vlb_step=1.84e-5, train/loss_step=0.00327, global_step=6597.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  85%|████████▍ | 1025/1208 [27:58<04:59,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00327, train/loss_vlb_step=1.84e-5, train/loss_step=0.00327, global_step=6597.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  85%|████████▍ | 1025/1208 [27:58<04:59,  1.64s/it, loss=0.129, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000572, train/loss_step=0.167, global_step=6598.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  85%|████████▍ | 1026/1208 [27:59<04:57,  1.64s/it, loss=0.129, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000572, train/loss_step=0.167, global_step=6598.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  85%|████████▍ | 1026/1208 [27:59<04:57,  1.64s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.69e-5, train/loss_step=0.0103, global_step=6598.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  85%|████████▌ | 1027/1208 [28:00<04:56,  1.64s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.69e-5, train/loss_step=0.0103, global_step=6598.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  85%|████████▌ | 1027/1208 [28:00<04:56,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000812, train/loss_step=0.221, global_step=6598.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  85%|████████▌ | 1028/1208 [28:03<04:54,  1.64s/it, loss=0.14, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000812, train/loss_step=0.221, global_step=6598.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  85%|████████▌ | 1028/1208 [28:03<04:54,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.000137, train/loss_step=0.0359, global_step=6598.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  85%|████████▌ | 1029/1208 [28:04<04:53,  1.64s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.000137, train/loss_step=0.0359, global_step=6598.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  85%|████████▌ | 1029/1208 [28:04<04:53,  1.64s/it, loss=0.144, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.0005, train/loss_step=0.147, global_step=6599.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  85%|████████▌ | 1030/1208 [28:05<04:51,  1.64s/it, loss=0.144, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.0005, train/loss_step=0.147, global_step=6599.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  85%|████████▌ | 1030/1208 [28:05<04:51,  1.64s/it, loss=0.167, v_num=0, train/loss_simple_step=0.599, train/loss_vlb_step=0.016, train/loss_step=0.599, global_step=6599.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  85%|████████▌ | 1031/1208 [28:06<04:49,  1.64s/it, loss=0.167, v_num=0, train/loss_simple_step=0.599, train/loss_vlb_step=0.016, train/loss_step=0.599, global_step=6599.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  85%|████████▌ | 1031/1208 [28:06<04:49,  1.64s/it, loss=0.164, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000453, train/loss_step=0.138, global_step=6599.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  85%|████████▌ | 1032/1208 [28:09<04:48,  1.64s/it, loss=0.164, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000453, train/loss_step=0.138, global_step=6599.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  85%|████████▌ | 1032/1208 [28:09<04:48,  1.64s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000101, train/loss_step=0.0254, global_step=6599.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  86%|████████▌ | 1033/1208 [28:10<04:46,  1.64s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000101, train/loss_step=0.0254, global_step=6599.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  86%|████████▌ | 1033/1208 [28:10<04:46,  1.64s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.83e-5, train/loss_step=0.0104, global_step=6600.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  86%|████████▌ | 1034/1208 [28:11<04:44,  1.64s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.83e-5, train/loss_step=0.0104, global_step=6600.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  86%|████████▌ | 1034/1208 [28:11<04:44,  1.64s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.00013, train/loss_step=0.0362, global_step=6600.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  86%|████████▌ | 1035/1208 [28:12<04:42,  1.64s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.00013, train/loss_step=0.0362, global_step=6600.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  86%|████████▌ | 1035/1208 [28:12<04:42,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00291, train/loss_step=0.347, global_step=6600.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  86%|████████▌ | 1036/1208 [28:15<04:41,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00291, train/loss_step=0.347, global_step=6600.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  86%|████████▌ | 1036/1208 [28:15<04:41,  1.64s/it, loss=0.136, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000493, train/loss_step=0.148, global_step=6600.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  86%|████████▌ | 1037/1208 [28:16<04:39,  1.64s/it, loss=0.136, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000493, train/loss_step=0.148, global_step=6600.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  86%|████████▌ | 1037/1208 [28:16<04:39,  1.64s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0679, train/loss_vlb_step=0.000233, train/loss_step=0.0679, global_step=6601.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  86%|████████▌ | 1038/1208 [28:17<04:38,  1.64s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0679, train/loss_vlb_step=0.000233, train/loss_step=0.0679, global_step=6601.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  86%|████████▌ | 1038/1208 [28:17<04:38,  1.64s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.17e-5, train/loss_step=0.00194, global_step=6601.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  86%|████████▌ | 1039/1208 [28:18<04:36,  1.63s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.17e-5, train/loss_step=0.00194, global_step=6601.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  86%|████████▌ | 1039/1208 [28:18<04:36,  1.63s/it, loss=0.134, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.0012, train/loss_step=0.261, global_step=6601.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]     Epoch 21:  86%|████████▌ | 1040/1208 [28:21<04:34,  1.64s/it, loss=0.134, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.0012, train/loss_step=0.261, global_step=6601.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  86%|████████▌ | 1040/1208 [28:21<04:34,  1.64s/it, loss=0.13, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=6601.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  86%|████████▌ | 1041/1208 [28:22<04:33,  1.64s/it, loss=0.13, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=6601.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  86%|████████▌ | 1041/1208 [28:22<04:33,  1.64s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0946, train/loss_vlb_step=0.000312, train/loss_step=0.0946, global_step=6602.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  86%|████████▋ | 1042/1208 [28:23<04:31,  1.63s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0946, train/loss_vlb_step=0.000312, train/loss_step=0.0946, global_step=6602.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  86%|████████▋ | 1042/1208 [28:23<04:31,  1.63s/it, loss=0.14, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000401, train/loss_step=0.122, global_step=6602.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  86%|████████▋ | 1043/1208 [28:24<04:29,  1.63s/it, loss=0.14, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000401, train/loss_step=0.122, global_step=6602.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  86%|████████▋ | 1043/1208 [28:24<04:29,  1.63s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00866, train/loss_vlb_step=4.22e-5, train/loss_step=0.00866, global_step=6602.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  86%|████████▋ | 1044/1208 [28:27<04:28,  1.64s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00866, train/loss_vlb_step=4.22e-5, train/loss_step=0.00866, global_step=6602.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  86%|████████▋ | 1044/1208 [28:27<04:28,  1.64s/it, loss=0.161, v_num=0, train/loss_simple_step=0.676, train/loss_vlb_step=0.0388, train/loss_step=0.676, global_step=6602.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]     Epoch 21:  87%|████████▋ | 1045/1208 [28:28<04:26,  1.63s/it, loss=0.161, v_num=0, train/loss_simple_step=0.676, train/loss_vlb_step=0.0388, train/loss_step=0.676, global_step=6602.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  87%|████████▋ | 1045/1208 [28:28<04:26,  1.63s/it, loss=0.158, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=6603.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  87%|████████▋ | 1046/1208 [28:29<04:24,  1.63s/it, loss=0.158, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=6603.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  87%|████████▋ | 1046/1208 [28:29<04:24,  1.63s/it, loss=0.2, v_num=0, train/loss_simple_step=0.851, train/loss_vlb_step=0.144, train/loss_step=0.851, global_step=6603.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]     Epoch 21:  87%|████████▋ | 1047/1208 [28:30<04:23,  1.63s/it, loss=0.2, v_num=0, train/loss_simple_step=0.851, train/loss_vlb_step=0.144, train/loss_step=0.851, global_step=6603.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  87%|████████▋ | 1047/1208 [28:30<04:23,  1.63s/it, loss=0.226, v_num=0, train/loss_simple_step=0.737, train/loss_vlb_step=0.0751, train/loss_step=0.737, global_step=6603.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  87%|████████▋ | 1048/1208 [28:33<04:21,  1.63s/it, loss=0.226, v_num=0, train/loss_simple_step=0.737, train/loss_vlb_step=0.0751, train/loss_step=0.737, global_step=6603.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  87%|████████▋ | 1048/1208 [28:33<04:21,  1.63s/it, loss=0.236, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.00102, train/loss_step=0.234, global_step=6603.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  87%|████████▋ | 1049/1208 [28:34<04:19,  1.63s/it, loss=0.236, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.00102, train/loss_step=0.234, global_step=6603.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  87%|████████▋ | 1049/1208 [28:34<04:19,  1.63s/it, loss=0.233, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=6604.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  87%|████████▋ | 1050/1208 [28:35<04:18,  1.63s/it, loss=0.233, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=6604.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  87%|████████▋ | 1050/1208 [28:35<04:18,  1.63s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=9.99e-5, train/loss_step=0.0249, global_step=6604.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  87%|████████▋ | 1051/1208 [28:36<04:16,  1.63s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=9.99e-5, train/loss_step=0.0249, global_step=6604.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  87%|████████▋ | 1051/1208 [28:36<04:16,  1.63s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00625, train/loss_vlb_step=3.2e-5, train/loss_step=0.00625, global_step=6604.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  87%|████████▋ | 1052/1208 [28:39<04:14,  1.63s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00625, train/loss_vlb_step=3.2e-5, train/loss_step=0.00625, global_step=6604.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  87%|████████▋ | 1052/1208 [28:39<04:14,  1.63s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00642, train/loss_vlb_step=3.35e-5, train/loss_step=0.00642, global_step=6604.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  87%|████████▋ | 1053/1208 [28:40<04:13,  1.63s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00642, train/loss_vlb_step=3.35e-5, train/loss_step=0.00642, global_step=6604.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  87%|████████▋ | 1053/1208 [28:40<04:13,  1.63s/it, loss=0.211, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00115, train/loss_step=0.278, global_step=6605.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  87%|████████▋ | 1054/1208 [28:41<04:11,  1.63s/it, loss=0.211, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00115, train/loss_step=0.278, global_step=6605.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  87%|████████▋ | 1054/1208 [28:41<04:11,  1.63s/it, loss=0.227, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00284, train/loss_step=0.364, global_step=6605.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  87%|████████▋ | 1055/1208 [28:42<04:09,  1.63s/it, loss=0.227, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00284, train/loss_step=0.364, global_step=6605.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  87%|████████▋ | 1055/1208 [28:42<04:09,  1.63s/it, loss=0.21, v_num=0, train/loss_simple_step=0.00601, train/loss_vlb_step=3.04e-5, train/loss_step=0.00601, global_step=6605.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  87%|████████▋ | 1056/1208 [28:45<04:08,  1.63s/it, loss=0.21, v_num=0, train/loss_simple_step=0.00601, train/loss_vlb_step=3.04e-5, train/loss_step=0.00601, global_step=6605.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  87%|████████▋ | 1056/1208 [28:45<04:08,  1.63s/it, loss=0.204, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.000113, train/loss_step=0.0285, global_step=6605.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  88%|████████▊ | 1057/1208 [28:46<04:06,  1.63s/it, loss=0.204, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.000113, train/loss_step=0.0285, global_step=6605.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  88%|████████▊ | 1057/1208 [28:46<04:06,  1.63s/it, loss=0.209, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000561, train/loss_step=0.165, global_step=6606.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  88%|████████▊ | 1058/1208 [28:47<04:04,  1.63s/it, loss=0.209, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000561, train/loss_step=0.165, global_step=6606.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  88%|████████▊ | 1058/1208 [28:47<04:04,  1.63s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000138, train/loss_step=0.0363, global_step=6606.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  88%|████████▊ | 1059/1208 [28:48<04:03,  1.63s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000138, train/loss_step=0.0363, global_step=6606.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  88%|████████▊ | 1059/1208 [28:48<04:03,  1.63s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00567, train/loss_vlb_step=2.74e-5, train/loss_step=0.00567, global_step=6606.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  88%|████████▊ | 1060/1208 [28:50<04:01,  1.63s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00567, train/loss_vlb_step=2.74e-5, train/loss_step=0.00567, global_step=6606.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  88%|████████▊ | 1060/1208 [28:50<04:01,  1.63s/it, loss=0.21, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00159, train/loss_step=0.337, global_step=6606.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]     Epoch 21:  88%|████████▊ | 1061/1208 [28:51<03:59,  1.63s/it, loss=0.21, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00159, train/loss_step=0.337, global_step=6606.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  88%|████████▊ | 1061/1208 [28:51<03:59,  1.63s/it, loss=0.205, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.4e-5, train/loss_step=0.00233, global_step=6607.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  88%|████████▊ | 1062/1208 [28:52<03:58,  1.63s/it, loss=0.205, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.4e-5, train/loss_step=0.00233, global_step=6607.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  88%|████████▊ | 1062/1208 [28:52<03:58,  1.63s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.000167, train/loss_step=0.0462, global_step=6607.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  88%|████████▊ | 1063/1208 [28:54<03:56,  1.63s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.000167, train/loss_step=0.0462, global_step=6607.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  88%|████████▊ | 1063/1208 [28:54<03:56,  1.63s/it, loss=0.21, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.00072, train/loss_step=0.192, global_step=6607.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  88%|████████▊ | 1064/1208 [28:56<03:55,  1.63s/it, loss=0.21, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.00072, train/loss_step=0.192, global_step=6607.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  88%|████████▊ | 1064/1208 [28:56<03:55,  1.63s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0435, train/loss_vlb_step=0.000157, train/loss_step=0.0435, global_step=6607.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  88%|████████▊ | 1065/1208 [28:57<03:53,  1.63s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0435, train/loss_vlb_step=0.000157, train/loss_step=0.0435, global_step=6607.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  88%|████████▊ | 1065/1208 [28:57<03:53,  1.63s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00566, train/loss_vlb_step=3e-5, train/loss_step=0.00566, global_step=6608.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  88%|████████▊ | 1066/1208 [28:58<03:51,  1.63s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00566, train/loss_vlb_step=3e-5, train/loss_step=0.00566, global_step=6608.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  88%|████████▊ | 1066/1208 [28:58<03:51,  1.63s/it, loss=0.139, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.00054, train/loss_step=0.160, global_step=6608.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  88%|████████▊ | 1067/1208 [28:59<03:49,  1.63s/it, loss=0.139, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.00054, train/loss_step=0.160, global_step=6608.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  88%|████████▊ | 1067/1208 [28:59<03:49,  1.63s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.44e-5, train/loss_step=0.00251, global_step=6608.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  88%|████████▊ | 1068/1208 [29:02<03:48,  1.63s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.44e-5, train/loss_step=0.00251, global_step=6608.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  88%|████████▊ | 1068/1208 [29:02<03:48,  1.63s/it, loss=0.107, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00146, train/loss_step=0.333, global_step=6608.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  88%|████████▊ | 1069/1208 [29:03<03:46,  1.63s/it, loss=0.107, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00146, train/loss_step=0.333, global_step=6608.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  88%|████████▊ | 1069/1208 [29:03<03:46,  1.63s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0769, train/loss_vlb_step=0.000257, train/loss_step=0.0769, global_step=6609.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  89%|████████▊ | 1070/1208 [29:04<03:45,  1.63s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0769, train/loss_vlb_step=0.000257, train/loss_step=0.0769, global_step=6609.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  89%|████████▊ | 1070/1208 [29:04<03:45,  1.63s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=8.1e-5, train/loss_step=0.0191, global_step=6609.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  89%|████████▊ | 1071/1208 [29:05<03:43,  1.63s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=8.1e-5, train/loss_step=0.0191, global_step=6609.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  89%|████████▊ | 1071/1208 [29:05<03:43,  1.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000513, train/loss_step=0.152, global_step=6609.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  89%|████████▊ | 1072/1208 [29:08<03:41,  1.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000513, train/loss_step=0.152, global_step=6609.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  89%|████████▊ | 1072/1208 [29:08<03:41,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0707, train/loss_vlb_step=0.000238, train/loss_step=0.0707, global_step=6609.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  89%|████████▉ | 1073/1208 [29:09<03:40,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0707, train/loss_vlb_step=0.000238, train/loss_step=0.0707, global_step=6609.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  89%|████████▉ | 1073/1208 [29:09<03:40,  1.63s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.05e-5, train/loss_step=0.00175, global_step=6610.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  89%|████████▉ | 1074/1208 [29:10<03:38,  1.63s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.05e-5, train/loss_step=0.00175, global_step=6610.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  89%|████████▉ | 1074/1208 [29:10<03:38,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.778, train/loss_vlb_step=0.0988, train/loss_step=0.778, global_step=6610.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]     Epoch 21:  89%|████████▉ | 1075/1208 [29:11<03:36,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.778, train/loss_vlb_step=0.0988, train/loss_step=0.778, global_step=6610.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  89%|████████▉ | 1075/1208 [29:11<03:36,  1.63s/it, loss=0.133, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000744, train/loss_step=0.210, global_step=6610.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  89%|████████▉ | 1076/1208 [29:14<03:35,  1.63s/it, loss=0.133, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000744, train/loss_step=0.210, global_step=6610.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  89%|████████▉ | 1076/1208 [29:14<03:35,  1.63s/it, loss=0.144, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00101, train/loss_step=0.249, global_step=6610.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  89%|████████▉ | 1077/1208 [29:15<03:33,  1.63s/it, loss=0.144, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00101, train/loss_step=0.249, global_step=6610.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  89%|████████▉ | 1077/1208 [29:15<03:33,  1.63s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00376, train/loss_vlb_step=2.09e-5, train/loss_step=0.00376, global_step=6611.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  89%|████████▉ | 1078/1208 [29:16<03:31,  1.63s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00376, train/loss_vlb_step=2.09e-5, train/loss_step=0.00376, global_step=6611.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  89%|████████▉ | 1078/1208 [29:16<03:31,  1.63s/it, loss=0.141, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000407, train/loss_step=0.124, global_step=6611.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  89%|████████▉ | 1079/1208 [29:17<03:30,  1.63s/it, loss=0.141, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000407, train/loss_step=0.124, global_step=6611.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  89%|████████▉ | 1079/1208 [29:17<03:30,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000864, train/loss_step=0.241, global_step=6611.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  89%|████████▉ | 1080/1208 [29:20<03:28,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000864, train/loss_step=0.241, global_step=6611.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  89%|████████▉ | 1080/1208 [29:20<03:28,  1.63s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00867, train/loss_vlb_step=4.09e-5, train/loss_step=0.00867, global_step=6611.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  89%|████████▉ | 1081/1208 [29:21<03:26,  1.63s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00867, train/loss_vlb_step=4.09e-5, train/loss_step=0.00867, global_step=6611.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  89%|████████▉ | 1081/1208 [29:21<03:26,  1.63s/it, loss=0.145, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000606, train/loss_step=0.175, global_step=6612.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  90%|████████▉ | 1082/1208 [29:22<03:25,  1.63s/it, loss=0.145, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000606, train/loss_step=0.175, global_step=6612.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  90%|████████▉ | 1082/1208 [29:22<03:25,  1.63s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0852, train/loss_vlb_step=0.000282, train/loss_step=0.0852, global_step=6612.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  90%|████████▉ | 1083/1208 [29:23<03:23,  1.63s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0852, train/loss_vlb_step=0.000282, train/loss_step=0.0852, global_step=6612.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  90%|████████▉ | 1083/1208 [29:23<03:23,  1.63s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0558, train/loss_vlb_step=0.000192, train/loss_step=0.0558, global_step=6612.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  90%|████████▉ | 1084/1208 [29:26<03:22,  1.63s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0558, train/loss_vlb_step=0.000192, train/loss_step=0.0558, global_step=6612.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  90%|████████▉ | 1084/1208 [29:26<03:22,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000371, train/loss_step=0.113, global_step=6612.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  90%|████████▉ | 1085/1208 [29:27<03:20,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000371, train/loss_step=0.113, global_step=6612.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  90%|████████▉ | 1085/1208 [29:27<03:20,  1.63s/it, loss=0.176, v_num=0, train/loss_simple_step=0.653, train/loss_vlb_step=0.0308, train/loss_step=0.653, global_step=6613.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  90%|████████▉ | 1086/1208 [29:28<03:18,  1.63s/it, loss=0.176, v_num=0, train/loss_simple_step=0.653, train/loss_vlb_step=0.0308, train/loss_step=0.653, global_step=6613.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  90%|████████▉ | 1086/1208 [29:28<03:18,  1.63s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0857, train/loss_vlb_step=0.000283, train/loss_step=0.0857, global_step=6613.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  90%|████████▉ | 1087/1208 [29:29<03:16,  1.63s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0857, train/loss_vlb_step=0.000283, train/loss_step=0.0857, global_step=6613.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  90%|████████▉ | 1087/1208 [29:29<03:16,  1.63s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00714, train/loss_vlb_step=3.51e-5, train/loss_step=0.00714, global_step=6613.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  90%|█████████ | 1088/1208 [29:32<03:15,  1.63s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00714, train/loss_vlb_step=3.51e-5, train/loss_step=0.00714, global_step=6613.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  90%|█████████ | 1088/1208 [29:32<03:15,  1.63s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0038, train/loss_vlb_step=2.07e-5, train/loss_step=0.0038, global_step=6613.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  90%|█████████ | 1089/1208 [29:33<03:13,  1.63s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0038, train/loss_vlb_step=2.07e-5, train/loss_step=0.0038, global_step=6613.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  90%|█████████ | 1089/1208 [29:33<03:13,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.45e-5, train/loss_step=0.00248, global_step=6614.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  90%|█████████ | 1090/1208 [29:34<03:12,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.45e-5, train/loss_step=0.00248, global_step=6614.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  90%|█████████ | 1090/1208 [29:34<03:12,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.56e-5, train/loss_step=0.0191, global_step=6614.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  90%|█████████ | 1091/1208 [29:35<03:10,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.56e-5, train/loss_step=0.0191, global_step=6614.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  90%|█████████ | 1091/1208 [29:35<03:10,  1.63s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=8.72e-5, train/loss_step=0.0224, global_step=6614.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  90%|█████████ | 1092/1208 [29:38<03:08,  1.63s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=8.72e-5, train/loss_step=0.0224, global_step=6614.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  90%|█████████ | 1092/1208 [29:38<03:08,  1.63s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0519, train/loss_vlb_step=0.000184, train/loss_step=0.0519, global_step=6614.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  90%|█████████ | 1093/1208 [29:39<03:07,  1.63s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0519, train/loss_vlb_step=0.000184, train/loss_step=0.0519, global_step=6614.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  90%|█████████ | 1093/1208 [29:39<03:07,  1.63s/it, loss=0.156, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000991, train/loss_step=0.240, global_step=6615.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  91%|█████████ | 1094/1208 [29:40<03:05,  1.63s/it, loss=0.156, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000991, train/loss_step=0.240, global_step=6615.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  91%|█████████ | 1094/1208 [29:40<03:05,  1.63s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00651, train/loss_vlb_step=3.16e-5, train/loss_step=0.00651, global_step=6615.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  91%|█████████ | 1095/1208 [29:41<03:03,  1.63s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00651, train/loss_vlb_step=3.16e-5, train/loss_step=0.00651, global_step=6615.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  91%|█████████ | 1095/1208 [29:41<03:03,  1.63s/it, loss=0.126, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00285, train/loss_step=0.379, global_step=6615.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  91%|█████████ | 1096/1208 [29:44<03:02,  1.63s/it, loss=0.126, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00285, train/loss_step=0.379, global_step=6615.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  91%|█████████ | 1096/1208 [29:44<03:02,  1.63s/it, loss=0.134, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00292, train/loss_step=0.407, global_step=6615.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  91%|█████████ | 1097/1208 [29:45<03:00,  1.63s/it, loss=0.134, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00292, train/loss_step=0.407, global_step=6615.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  91%|█████████ | 1097/1208 [29:45<03:00,  1.63s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.33e-5, train/loss_step=0.0122, global_step=6616.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  91%|█████████ | 1098/1208 [29:46<02:58,  1.63s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.33e-5, train/loss_step=0.0122, global_step=6616.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  91%|█████████ | 1098/1208 [29:46<02:58,  1.63s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0781, train/loss_vlb_step=0.000257, train/loss_step=0.0781, global_step=6616.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  91%|█████████ | 1099/1208 [29:47<02:57,  1.63s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0781, train/loss_vlb_step=0.000257, train/loss_step=0.0781, global_step=6616.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  91%|█████████ | 1099/1208 [29:47<02:57,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=8.79e-5, train/loss_step=0.023, global_step=6616.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  91%|█████████ | 1100/1208 [29:50<02:55,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=8.79e-5, train/loss_step=0.023, global_step=6616.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  91%|█████████ | 1100/1208 [29:50<02:55,  1.63s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.23e-5, train/loss_step=0.0121, global_step=6616.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  91%|█████████ | 1101/1208 [29:51<02:54,  1.63s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.23e-5, train/loss_step=0.0121, global_step=6616.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  91%|█████████ | 1101/1208 [29:51<02:54,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000579, train/loss_step=0.165, global_step=6617.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  91%|█████████ | 1102/1208 [29:52<02:52,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000579, train/loss_step=0.165, global_step=6617.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  91%|█████████ | 1102/1208 [29:52<02:52,  1.63s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0645, train/loss_vlb_step=0.000225, train/loss_step=0.0645, global_step=6617.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  91%|█████████▏| 1103/1208 [29:53<02:50,  1.63s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0645, train/loss_vlb_step=0.000225, train/loss_step=0.0645, global_step=6617.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  91%|█████████▏| 1103/1208 [29:53<02:50,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0793, train/loss_vlb_step=0.000264, train/loss_step=0.0793, global_step=6617.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  91%|█████████▏| 1104/1208 [29:56<02:49,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0793, train/loss_vlb_step=0.000264, train/loss_step=0.0793, global_step=6617.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  91%|█████████▏| 1104/1208 [29:56<02:49,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00767, train/loss_vlb_step=3.57e-5, train/loss_step=0.00767, global_step=6617.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  91%|█████████▏| 1105/1208 [29:57<02:47,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00767, train/loss_vlb_step=3.57e-5, train/loss_step=0.00767, global_step=6617.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  91%|█████████▏| 1105/1208 [29:57<02:47,  1.63s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.15e-5, train/loss_step=0.00197, global_step=6618.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  92%|█████████▏| 1106/1208 [29:58<02:45,  1.63s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.15e-5, train/loss_step=0.00197, global_step=6618.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  92%|█████████▏| 1106/1208 [29:58<02:45,  1.63s/it, loss=0.0912, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.00111, train/loss_step=0.241, global_step=6618.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  92%|█████████▏| 1107/1208 [29:59<02:44,  1.63s/it, loss=0.0912, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.00111, train/loss_step=0.241, global_step=6618.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  92%|█████████▏| 1107/1208 [29:59<02:44,  1.63s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.00942, train/loss_vlb_step=4.39e-5, train/loss_step=0.00942, global_step=6618.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  92%|█████████▏| 1108/1208 [30:02<02:42,  1.63s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.00942, train/loss_vlb_step=4.39e-5, train/loss_step=0.00942, global_step=6618.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  92%|█████████▏| 1108/1208 [30:02<02:42,  1.63s/it, loss=0.0952, v_num=0, train/loss_simple_step=0.0811, train/loss_vlb_step=0.000271, train/loss_step=0.0811, global_step=6618.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  92%|█████████▏| 1109/1208 [30:03<02:40,  1.63s/it, loss=0.0952, v_num=0, train/loss_simple_step=0.0811, train/loss_vlb_step=0.000271, train/loss_step=0.0811, global_step=6618.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  92%|█████████▏| 1109/1208 [30:03<02:40,  1.63s/it, loss=0.114, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00294, train/loss_step=0.380, global_step=6619.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  92%|█████████▏| 1110/1208 [30:04<02:39,  1.63s/it, loss=0.114, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00294, train/loss_step=0.380, global_step=6619.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  92%|█████████▏| 1110/1208 [30:04<02:39,  1.63s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00892, train/loss_vlb_step=4.32e-5, train/loss_step=0.00892, global_step=6619.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  92%|█████████▏| 1111/1208 [30:05<02:37,  1.62s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00892, train/loss_vlb_step=4.32e-5, train/loss_step=0.00892, global_step=6619.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  92%|█████████▏| 1111/1208 [30:05<02:37,  1.62s/it, loss=0.124, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000905, train/loss_step=0.233, global_step=6619.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  92%|█████████▏| 1112/1208 [30:07<02:36,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000905, train/loss_step=0.233, global_step=6619.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  92%|█████████▏| 1112/1208 [30:07<02:36,  1.63s/it, loss=0.128, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000439, train/loss_step=0.133, global_step=6619.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  92%|█████████▏| 1113/1208 [30:09<02:34,  1.63s/it, loss=0.128, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000439, train/loss_step=0.133, global_step=6619.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  92%|█████████▏| 1113/1208 [30:09<02:34,  1.63s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.75e-5, train/loss_step=0.0215, global_step=6620.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  92%|█████████▏| 1114/1208 [30:10<02:32,  1.62s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.75e-5, train/loss_step=0.0215, global_step=6620.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  92%|█████████▏| 1114/1208 [30:10<02:32,  1.62s/it, loss=0.124, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000462, train/loss_step=0.139, global_step=6620.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  92%|█████████▏| 1115/1208 [30:11<02:31,  1.62s/it, loss=0.124, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000462, train/loss_step=0.139, global_step=6620.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  92%|█████████▏| 1115/1208 [30:11<02:31,  1.62s/it, loss=0.118, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.0014, train/loss_step=0.257, global_step=6620.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  92%|█████████▏| 1116/1208 [30:13<02:29,  1.63s/it, loss=0.118, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.0014, train/loss_step=0.257, global_step=6620.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  92%|█████████▏| 1116/1208 [30:13<02:29,  1.63s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0976, train/loss_vlb_step=0.000321, train/loss_step=0.0976, global_step=6620.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  92%|█████████▏| 1117/1208 [30:14<02:27,  1.62s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0976, train/loss_vlb_step=0.000321, train/loss_step=0.0976, global_step=6620.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  92%|█████████▏| 1117/1208 [30:14<02:27,  1.62s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000105, train/loss_step=0.0264, global_step=6621.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  93%|█████████▎| 1118/1208 [30:15<02:26,  1.62s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000105, train/loss_step=0.0264, global_step=6621.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  93%|█████████▎| 1118/1208 [30:15<02:26,  1.62s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0639, train/loss_vlb_step=0.000219, train/loss_step=0.0639, global_step=6621.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  93%|█████████▎| 1119/1208 [30:17<02:24,  1.62s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0639, train/loss_vlb_step=0.000219, train/loss_step=0.0639, global_step=6621.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  93%|█████████▎| 1119/1208 [30:17<02:24,  1.62s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0436, train/loss_vlb_step=0.000163, train/loss_step=0.0436, global_step=6621.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  93%|█████████▎| 1120/1208 [30:19<02:22,  1.62s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0436, train/loss_vlb_step=0.000163, train/loss_step=0.0436, global_step=6621.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  93%|█████████▎| 1120/1208 [30:19<02:22,  1.62s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00372, train/loss_vlb_step=2e-5, train/loss_step=0.00372, global_step=6621.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  93%|█████████▎| 1121/1208 [30:20<02:21,  1.62s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00372, train/loss_vlb_step=2e-5, train/loss_step=0.00372, global_step=6621.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  93%|█████████▎| 1121/1208 [30:20<02:21,  1.62s/it, loss=0.0993, v_num=0, train/loss_simple_step=0.0918, train/loss_vlb_step=0.000302, train/loss_step=0.0918, global_step=6622.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  93%|█████████▎| 1122/1208 [30:21<02:19,  1.62s/it, loss=0.0993, v_num=0, train/loss_simple_step=0.0918, train/loss_vlb_step=0.000302, train/loss_step=0.0918, global_step=6622.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  93%|█████████▎| 1122/1208 [30:21<02:19,  1.62s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=2.25e-5, train/loss_step=0.00481, global_step=6622.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  93%|█████████▎| 1123/1208 [30:22<02:17,  1.62s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=2.25e-5, train/loss_step=0.00481, global_step=6622.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  93%|█████████▎| 1123/1208 [30:22<02:17,  1.62s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000458, train/loss_step=0.138, global_step=6622.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  93%|█████████▎| 1124/1208 [30:25<02:16,  1.62s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000458, train/loss_step=0.138, global_step=6622.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  93%|█████████▎| 1124/1208 [30:25<02:16,  1.62s/it, loss=0.105, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00042, train/loss_step=0.128, global_step=6622.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  93%|█████████▎| 1125/1208 [30:26<02:14,  1.62s/it, loss=0.105, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00042, train/loss_step=0.128, global_step=6622.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  93%|█████████▎| 1125/1208 [30:26<02:14,  1.62s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.6e-5, train/loss_step=0.00281, global_step=6623.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  93%|█████████▎| 1126/1208 [30:27<02:13,  1.62s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.6e-5, train/loss_step=0.00281, global_step=6623.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  93%|█████████▎| 1126/1208 [30:27<02:13,  1.62s/it, loss=0.0945, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=9.78e-5, train/loss_step=0.0256, global_step=6623.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  93%|█████████▎| 1127/1208 [30:28<02:11,  1.62s/it, loss=0.0945, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=9.78e-5, train/loss_step=0.0256, global_step=6623.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  93%|█████████▎| 1127/1208 [30:28<02:11,  1.62s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000144, train/loss_step=0.0406, global_step=6623.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  93%|█████████▎| 1128/1208 [30:31<02:09,  1.62s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000144, train/loss_step=0.0406, global_step=6623.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  93%|█████████▎| 1128/1208 [30:31<02:09,  1.62s/it, loss=0.0929, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.12e-5, train/loss_step=0.0178, global_step=6623.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  93%|█████████▎| 1129/1208 [30:32<02:08,  1.62s/it, loss=0.0929, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.12e-5, train/loss_step=0.0178, global_step=6623.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  93%|█████████▎| 1129/1208 [30:32<02:08,  1.62s/it, loss=0.0784, v_num=0, train/loss_simple_step=0.0909, train/loss_vlb_step=0.000302, train/loss_step=0.0909, global_step=6624.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  94%|█████████▎| 1130/1208 [30:33<02:06,  1.62s/it, loss=0.0784, v_num=0, train/loss_simple_step=0.0909, train/loss_vlb_step=0.000302, train/loss_step=0.0909, global_step=6624.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  94%|█████████▎| 1130/1208 [30:33<02:06,  1.62s/it, loss=0.0782, v_num=0, train/loss_simple_step=0.00477, train/loss_vlb_step=2.52e-5, train/loss_step=0.00477, global_step=6624.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  94%|█████████▎| 1131/1208 [30:34<02:04,  1.62s/it, loss=0.0782, v_num=0, train/loss_simple_step=0.00477, train/loss_vlb_step=2.52e-5, train/loss_step=0.00477, global_step=6624.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  94%|█████████▎| 1131/1208 [30:34<02:04,  1.62s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.574, train/loss_vlb_step=0.00746, train/loss_step=0.574, global_step=6624.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  94%|█████████▎| 1132/1208 [30:37<02:03,  1.62s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.574, train/loss_vlb_step=0.00746, train/loss_step=0.574, global_step=6624.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  94%|█████████▎| 1132/1208 [30:37<02:03,  1.62s/it, loss=0.103, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00137, train/loss_step=0.290, global_step=6624.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  94%|█████████▍| 1133/1208 [30:38<02:01,  1.62s/it, loss=0.103, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00137, train/loss_step=0.290, global_step=6624.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  94%|█████████▍| 1133/1208 [30:38<02:01,  1.62s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.0001, train/loss_step=0.0258, global_step=6625.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  94%|█████████▍| 1134/1208 [30:39<02:00,  1.62s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.0001, train/loss_step=0.0258, global_step=6625.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  94%|█████████▍| 1134/1208 [30:39<02:00,  1.62s/it, loss=0.109, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.000936, train/loss_step=0.252, global_step=6625.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  94%|█████████▍| 1135/1208 [30:40<01:58,  1.62s/it, loss=0.109, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.000936, train/loss_step=0.252, global_step=6625.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  94%|█████████▍| 1135/1208 [30:40<01:58,  1.62s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.99e-5, train/loss_step=0.016, global_step=6625.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  94%|█████████▍| 1136/1208 [30:43<01:56,  1.62s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.99e-5, train/loss_step=0.016, global_step=6625.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  94%|█████████▍| 1136/1208 [30:43<01:56,  1.62s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.0886, train/loss_vlb_step=0.000301, train/loss_step=0.0886, global_step=6625.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  94%|█████████▍| 1137/1208 [30:44<01:55,  1.62s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.0886, train/loss_vlb_step=0.000301, train/loss_step=0.0886, global_step=6625.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  94%|█████████▍| 1137/1208 [30:44<01:55,  1.62s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.00701, train/loss_vlb_step=3.43e-5, train/loss_step=0.00701, global_step=6626.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  94%|█████████▍| 1138/1208 [30:45<01:53,  1.62s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.00701, train/loss_vlb_step=3.43e-5, train/loss_step=0.00701, global_step=6626.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  94%|█████████▍| 1138/1208 [30:45<01:53,  1.62s/it, loss=0.125, v_num=0, train/loss_simple_step=0.647, train/loss_vlb_step=0.026, train/loss_step=0.647, global_step=6626.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]       Epoch 21:  94%|█████████▍| 1139/1208 [30:46<01:51,  1.62s/it, loss=0.125, v_num=0, train/loss_simple_step=0.647, train/loss_vlb_step=0.026, train/loss_step=0.647, global_step=6626.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  94%|█████████▍| 1139/1208 [30:46<01:51,  1.62s/it, loss=0.13, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000568, train/loss_step=0.160, global_step=6626.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  94%|█████████▍| 1140/1208 [30:49<01:50,  1.62s/it, loss=0.13, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000568, train/loss_step=0.160, global_step=6626.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  94%|█████████▍| 1140/1208 [30:49<01:50,  1.62s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0843, train/loss_vlb_step=0.000281, train/loss_step=0.0843, global_step=6626.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  94%|█████████▍| 1141/1208 [30:50<01:48,  1.62s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0843, train/loss_vlb_step=0.000281, train/loss_step=0.0843, global_step=6626.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  94%|█████████▍| 1141/1208 [30:50<01:48,  1.62s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00626, train/loss_vlb_step=3.18e-5, train/loss_step=0.00626, global_step=6627.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  95%|█████████▍| 1142/1208 [30:51<01:47,  1.62s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00626, train/loss_vlb_step=3.18e-5, train/loss_step=0.00626, global_step=6627.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  95%|█████████▍| 1142/1208 [30:51<01:47,  1.62s/it, loss=0.14, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000743, train/loss_step=0.194, global_step=6627.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  95%|█████████▍| 1143/1208 [30:52<01:45,  1.62s/it, loss=0.14, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000743, train/loss_step=0.194, global_step=6627.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  95%|█████████▍| 1143/1208 [30:52<01:45,  1.62s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00916, train/loss_vlb_step=4.11e-5, train/loss_step=0.00916, global_step=6627.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  95%|█████████▍| 1144/1208 [30:55<01:43,  1.62s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00916, train/loss_vlb_step=4.11e-5, train/loss_step=0.00916, global_step=6627.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  95%|█████████▍| 1144/1208 [30:55<01:43,  1.62s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0963, train/loss_vlb_step=0.00032, train/loss_step=0.0963, global_step=6627.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  95%|█████████▍| 1145/1208 [30:56<01:42,  1.62s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0963, train/loss_vlb_step=0.00032, train/loss_step=0.0963, global_step=6627.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  95%|█████████▍| 1145/1208 [30:56<01:42,  1.62s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.46e-5, train/loss_step=0.00253, global_step=6628.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  95%|█████████▍| 1146/1208 [30:57<01:40,  1.62s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.46e-5, train/loss_step=0.00253, global_step=6628.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  95%|█████████▍| 1146/1208 [30:57<01:40,  1.62s/it, loss=0.158, v_num=0, train/loss_simple_step=0.546, train/loss_vlb_step=0.0128, train/loss_step=0.546, global_step=6628.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]     Epoch 21:  95%|█████████▍| 1147/1208 [30:58<01:38,  1.62s/it, loss=0.158, v_num=0, train/loss_simple_step=0.546, train/loss_vlb_step=0.0128, train/loss_step=0.546, global_step=6628.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  95%|█████████▍| 1147/1208 [30:58<01:38,  1.62s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0703, train/loss_vlb_step=0.000234, train/loss_step=0.0703, global_step=6628.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  95%|█████████▌| 1148/1208 [31:01<01:37,  1.62s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0703, train/loss_vlb_step=0.000234, train/loss_step=0.0703, global_step=6628.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  95%|█████████▌| 1148/1208 [31:01<01:37,  1.62s/it, loss=0.164, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=6628.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  95%|█████████▌| 1149/1208 [31:02<01:35,  1.62s/it, loss=0.164, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=6628.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  95%|█████████▌| 1149/1208 [31:02<01:35,  1.62s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00269, train/loss_vlb_step=1.53e-5, train/loss_step=0.00269, global_step=6629.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  95%|█████████▌| 1150/1208 [31:03<01:33,  1.62s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00269, train/loss_vlb_step=1.53e-5, train/loss_step=0.00269, global_step=6629.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  95%|█████████▌| 1150/1208 [31:03<01:33,  1.62s/it, loss=0.173, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.0013, train/loss_step=0.276, global_step=6629.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  95%|█████████▌| 1151/1208 [31:04<01:32,  1.62s/it, loss=0.173, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.0013, train/loss_step=0.276, global_step=6629.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  95%|█████████▌| 1151/1208 [31:04<01:32,  1.62s/it, loss=0.15, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=6629.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  95%|█████████▌| 1152/1208 [31:07<01:30,  1.62s/it, loss=0.15, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=6629.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  95%|█████████▌| 1152/1208 [31:07<01:30,  1.62s/it, loss=0.144, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000621, train/loss_step=0.165, global_step=6629.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  95%|█████████▌| 1153/1208 [31:08<01:29,  1.62s/it, loss=0.144, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000621, train/loss_step=0.165, global_step=6629.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  95%|█████████▌| 1153/1208 [31:08<01:29,  1.62s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.22e-5, train/loss_step=0.0119, global_step=6630.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  96%|█████████▌| 1154/1208 [31:09<01:27,  1.62s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.22e-5, train/loss_step=0.0119, global_step=6630.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  96%|█████████▌| 1154/1208 [31:09<01:27,  1.62s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0831, train/loss_vlb_step=0.000275, train/loss_step=0.0831, global_step=6630.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  96%|█████████▌| 1155/1208 [31:10<01:25,  1.62s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0831, train/loss_vlb_step=0.000275, train/loss_step=0.0831, global_step=6630.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  96%|█████████▌| 1155/1208 [31:10<01:25,  1.62s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.000116, train/loss_step=0.0316, global_step=6630.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  96%|█████████▌| 1156/1208 [31:13<01:24,  1.62s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.000116, train/loss_step=0.0316, global_step=6630.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  96%|█████████▌| 1156/1208 [31:13<01:24,  1.62s/it, loss=0.141, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000701, train/loss_step=0.195, global_step=6630.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  96%|█████████▌| 1157/1208 [31:14<01:22,  1.62s/it, loss=0.141, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000701, train/loss_step=0.195, global_step=6630.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  96%|█████████▌| 1157/1208 [31:14<01:22,  1.62s/it, loss=0.148, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000548, train/loss_step=0.157, global_step=6631.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  96%|█████████▌| 1158/1208 [31:15<01:20,  1.62s/it, loss=0.148, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000548, train/loss_step=0.157, global_step=6631.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  96%|█████████▌| 1158/1208 [31:15<01:20,  1.62s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.000174, train/loss_step=0.0482, global_step=6631.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  96%|█████████▌| 1159/1208 [31:16<01:19,  1.62s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.000174, train/loss_step=0.0482, global_step=6631.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  96%|█████████▌| 1159/1208 [31:16<01:19,  1.62s/it, loss=0.117, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000489, train/loss_step=0.145, global_step=6631.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  96%|█████████▌| 1160/1208 [31:18<01:17,  1.62s/it, loss=0.117, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000489, train/loss_step=0.145, global_step=6631.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  96%|█████████▌| 1160/1208 [31:18<01:17,  1.62s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=0.000102, train/loss_step=0.0246, global_step=6631.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  96%|█████████▌| 1161/1208 [31:19<01:16,  1.62s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=0.000102, train/loss_step=0.0246, global_step=6631.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  96%|█████████▌| 1161/1208 [31:19<01:16,  1.62s/it, loss=0.12, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000397, train/loss_step=0.121, global_step=6632.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  96%|█████████▌| 1162/1208 [31:20<01:14,  1.62s/it, loss=0.12, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000397, train/loss_step=0.121, global_step=6632.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  96%|█████████▌| 1162/1208 [31:20<01:14,  1.62s/it, loss=0.123, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.000988, train/loss_step=0.260, global_step=6632.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  96%|█████████▋| 1163/1208 [31:21<01:12,  1.62s/it, loss=0.123, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.000988, train/loss_step=0.260, global_step=6632.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  96%|█████████▋| 1163/1208 [31:21<01:12,  1.62s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=2.56e-5, train/loss_step=0.00492, global_step=6632.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  96%|█████████▋| 1164/1208 [31:24<01:11,  1.62s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=2.56e-5, train/loss_step=0.00492, global_step=6632.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  96%|█████████▋| 1164/1208 [31:24<01:11,  1.62s/it, loss=0.129, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000725, train/loss_step=0.206, global_step=6632.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  96%|█████████▋| 1165/1208 [31:25<01:09,  1.62s/it, loss=0.129, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000725, train/loss_step=0.206, global_step=6632.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  96%|█████████▋| 1165/1208 [31:25<01:09,  1.62s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0844, train/loss_vlb_step=0.000284, train/loss_step=0.0844, global_step=6633.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  97%|█████████▋| 1166/1208 [31:26<01:07,  1.62s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0844, train/loss_vlb_step=0.000284, train/loss_step=0.0844, global_step=6633.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  97%|█████████▋| 1166/1208 [31:26<01:07,  1.62s/it, loss=0.112, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000448, train/loss_step=0.135, global_step=6633.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  97%|█████████▋| 1167/1208 [31:27<01:06,  1.62s/it, loss=0.112, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000448, train/loss_step=0.135, global_step=6633.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  97%|█████████▋| 1167/1208 [31:27<01:06,  1.62s/it, loss=0.122, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00148, train/loss_step=0.268, global_step=6633.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  97%|█████████▋| 1168/1208 [31:30<01:04,  1.62s/it, loss=0.122, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00148, train/loss_step=0.268, global_step=6633.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  97%|█████████▋| 1168/1208 [31:30<01:04,  1.62s/it, loss=0.122, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=6633.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  97%|█████████▋| 1169/1208 [31:31<01:03,  1.62s/it, loss=0.122, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=6633.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  97%|█████████▋| 1169/1208 [31:31<01:03,  1.62s/it, loss=0.149, v_num=0, train/loss_simple_step=0.535, train/loss_vlb_step=0.00831, train/loss_step=0.535, global_step=6634.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  97%|█████████▋| 1170/1208 [31:32<01:01,  1.62s/it, loss=0.149, v_num=0, train/loss_simple_step=0.535, train/loss_vlb_step=0.00831, train/loss_step=0.535, global_step=6634.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  97%|█████████▋| 1170/1208 [31:32<01:01,  1.62s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0768, train/loss_vlb_step=0.000262, train/loss_step=0.0768, global_step=6634.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  97%|█████████▋| 1171/1208 [31:33<00:59,  1.62s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0768, train/loss_vlb_step=0.000262, train/loss_step=0.0768, global_step=6634.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  97%|█████████▋| 1171/1208 [31:33<00:59,  1.62s/it, loss=0.149, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00135, train/loss_step=0.305, global_step=6634.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  97%|█████████▋| 1172/1208 [31:36<00:58,  1.62s/it, loss=0.149, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00135, train/loss_step=0.305, global_step=6634.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  97%|█████████▋| 1172/1208 [31:36<00:58,  1.62s/it, loss=0.149, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000562, train/loss_step=0.167, global_step=6634.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  97%|█████████▋| 1173/1208 [31:37<00:56,  1.62s/it, loss=0.149, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000562, train/loss_step=0.167, global_step=6634.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  97%|█████████▋| 1173/1208 [31:37<00:56,  1.62s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0472, train/loss_vlb_step=0.000169, train/loss_step=0.0472, global_step=6635.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  97%|█████████▋| 1174/1208 [31:38<00:54,  1.62s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0472, train/loss_vlb_step=0.000169, train/loss_step=0.0472, global_step=6635.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  97%|█████████▋| 1174/1208 [31:38<00:54,  1.62s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0785, train/loss_vlb_step=0.000264, train/loss_step=0.0785, global_step=6635.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  97%|█████████▋| 1175/1208 [31:39<00:53,  1.62s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0785, train/loss_vlb_step=0.000264, train/loss_step=0.0785, global_step=6635.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  97%|█████████▋| 1175/1208 [31:39<00:53,  1.62s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0428, train/loss_vlb_step=0.000154, train/loss_step=0.0428, global_step=6635.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  97%|█████████▋| 1176/1208 [31:42<00:51,  1.62s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0428, train/loss_vlb_step=0.000154, train/loss_step=0.0428, global_step=6635.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  97%|█████████▋| 1176/1208 [31:42<00:51,  1.62s/it, loss=0.151, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000648, train/loss_step=0.191, global_step=6635.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]  Epoch 21:  97%|█████████▋| 1177/1208 [31:43<00:50,  1.62s/it, loss=0.151, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000648, train/loss_step=0.191, global_step=6635.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  97%|█████████▋| 1177/1208 [31:43<00:50,  1.62s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.79e-5, train/loss_step=0.0183, global_step=6636.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  98%|█████████▊| 1178/1208 [31:44<00:48,  1.62s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.79e-5, train/loss_step=0.0183, global_step=6636.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  98%|█████████▊| 1178/1208 [31:44<00:48,  1.62s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00868, train/loss_vlb_step=4.07e-5, train/loss_step=0.00868, global_step=6636.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  98%|█████████▊| 1179/1208 [31:45<00:46,  1.62s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00868, train/loss_vlb_step=4.07e-5, train/loss_step=0.00868, global_step=6636.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  98%|█████████▊| 1179/1208 [31:45<00:46,  1.62s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.6e-5, train/loss_step=0.0188, global_step=6636.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  98%|█████████▊| 1180/1208 [31:48<00:45,  1.62s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.6e-5, train/loss_step=0.0188, global_step=6636.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  98%|█████████▊| 1180/1208 [31:48<00:45,  1.62s/it, loss=0.138, v_num=0, train/loss_simple_step=0.080, train/loss_vlb_step=0.000271, train/loss_step=0.080, global_step=6636.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  98%|█████████▊| 1181/1208 [31:49<00:43,  1.62s/it, loss=0.138, v_num=0, train/loss_simple_step=0.080, train/loss_vlb_step=0.000271, train/loss_step=0.080, global_step=6636.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  98%|█████████▊| 1181/1208 [31:49<00:43,  1.62s/it, loss=0.154, v_num=0, train/loss_simple_step=0.438, train/loss_vlb_step=0.00414, train/loss_step=0.438, global_step=6637.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  98%|█████████▊| 1182/1208 [31:50<00:42,  1.62s/it, loss=0.154, v_num=0, train/loss_simple_step=0.438, train/loss_vlb_step=0.00414, train/loss_step=0.438, global_step=6637.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  98%|█████████▊| 1182/1208 [31:50<00:42,  1.62s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.61e-5, train/loss_step=0.0213, global_step=6637.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  98%|█████████▊| 1183/1208 [31:51<00:40,  1.62s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.61e-5, train/loss_step=0.0213, global_step=6637.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  98%|█████████▊| 1183/1208 [31:51<00:40,  1.62s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000149, train/loss_step=0.0407, global_step=6637.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  98%|█████████▊| 1184/1208 [31:54<00:38,  1.62s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000149, train/loss_step=0.0407, global_step=6637.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  98%|█████████▊| 1184/1208 [31:54<00:38,  1.62s/it, loss=0.16, v_num=0, train/loss_simple_step=0.522, train/loss_vlb_step=0.00723, train/loss_step=0.522, global_step=6637.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]    Epoch 21:  98%|█████████▊| 1185/1208 [31:55<00:37,  1.62s/it, loss=0.16, v_num=0, train/loss_simple_step=0.522, train/loss_vlb_step=0.00723, train/loss_step=0.522, global_step=6637.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  98%|█████████▊| 1185/1208 [31:55<00:37,  1.62s/it, loss=0.175, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00271, train/loss_step=0.397, global_step=6638.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  98%|█████████▊| 1186/1208 [31:56<00:35,  1.62s/it, loss=0.175, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00271, train/loss_step=0.397, global_step=6638.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  98%|█████████▊| 1186/1208 [31:56<00:35,  1.62s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=8.16e-5, train/loss_step=0.0188, global_step=6638.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  98%|█████████▊| 1187/1208 [31:57<00:33,  1.62s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=8.16e-5, train/loss_step=0.0188, global_step=6638.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  98%|█████████▊| 1187/1208 [31:57<00:33,  1.62s/it, loss=0.163, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000477, train/loss_step=0.144, global_step=6638.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  98%|█████████▊| 1188/1208 [32:00<00:32,  1.62s/it, loss=0.163, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000477, train/loss_step=0.144, global_step=6638.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  98%|█████████▊| 1188/1208 [32:00<00:32,  1.62s/it, loss=0.178, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00441, train/loss_step=0.411, global_step=6638.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  98%|█████████▊| 1189/1208 [32:01<00:30,  1.62s/it, loss=0.178, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00441, train/loss_step=0.411, global_step=6638.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  98%|█████████▊| 1189/1208 [32:01<00:30,  1.62s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.42e-5, train/loss_step=0.0122, global_step=6639.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  99%|█████████▊| 1190/1208 [32:02<00:29,  1.62s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.42e-5, train/loss_step=0.0122, global_step=6639.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  99%|█████████▊| 1190/1208 [32:02<00:29,  1.62s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000149, train/loss_step=0.0416, global_step=6639.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  99%|█████████▊| 1191/1208 [32:03<00:27,  1.61s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000149, train/loss_step=0.0416, global_step=6639.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  99%|█████████▊| 1191/1208 [32:03<00:27,  1.61s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.67e-5, train/loss_step=0.0182, global_step=6639.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  99%|█████████▊| 1192/1208 [32:06<00:25,  1.62s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.67e-5, train/loss_step=0.0182, global_step=6639.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  99%|█████████▊| 1192/1208 [32:06<00:25,  1.62s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=1.2e-5, train/loss_step=0.00201, global_step=6639.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  99%|█████████▉| 1193/1208 [32:07<00:24,  1.62s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=1.2e-5, train/loss_step=0.00201, global_step=6639.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  99%|█████████▉| 1193/1208 [32:07<00:24,  1.62s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0411, train/loss_vlb_step=0.000148, train/loss_step=0.0411, global_step=6640.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  99%|█████████▉| 1194/1208 [32:08<00:22,  1.61s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0411, train/loss_vlb_step=0.000148, train/loss_step=0.0411, global_step=6640.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  99%|█████████▉| 1194/1208 [32:08<00:22,  1.61s/it, loss=0.144, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.00314, train/loss_step=0.406, global_step=6640.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21:  99%|█████████▉| 1195/1208 [32:09<00:20,  1.61s/it, loss=0.144, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.00314, train/loss_step=0.406, global_step=6640.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  99%|█████████▉| 1195/1208 [32:09<00:20,  1.61s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00562, train/loss_vlb_step=2.83e-5, train/loss_step=0.00562, global_step=6640.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  99%|█████████▉| 1196/1208 [32:12<00:19,  1.62s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00562, train/loss_vlb_step=2.83e-5, train/loss_step=0.00562, global_step=6640.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  99%|█████████▉| 1196/1208 [32:12<00:19,  1.62s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0644, train/loss_vlb_step=0.000221, train/loss_step=0.0644, global_step=6640.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  99%|█████████▉| 1197/1208 [32:13<00:17,  1.62s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0644, train/loss_vlb_step=0.000221, train/loss_step=0.0644, global_step=6640.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  99%|█████████▉| 1197/1208 [32:13<00:17,  1.62s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0682, train/loss_vlb_step=0.00023, train/loss_step=0.0682, global_step=6641.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  99%|█████████▉| 1198/1208 [32:14<00:16,  1.61s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0682, train/loss_vlb_step=0.00023, train/loss_step=0.0682, global_step=6641.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  99%|█████████▉| 1198/1208 [32:14<00:16,  1.61s/it, loss=0.143, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000386, train/loss_step=0.116, global_step=6641.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21:  99%|█████████▉| 1199/1208 [32:15<00:14,  1.61s/it, loss=0.143, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000386, train/loss_step=0.116, global_step=6641.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  99%|█████████▉| 1199/1208 [32:15<00:14,  1.61s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000126, train/loss_step=0.0337, global_step=6641.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  99%|█████████▉| 1200/1208 [32:18<00:12,  1.62s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000126, train/loss_step=0.0337, global_step=6641.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  99%|█████████▉| 1200/1208 [32:18<00:12,  1.62s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.000172, train/loss_step=0.0476, global_step=6641.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.84it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.76it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:25,  1.85it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.84it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.85it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.84it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.84it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.85it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.83it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.84it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.83it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.83it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.84it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.79it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.84it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.84it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.84it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.84it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.82it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.84it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.84it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.84it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.84it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.84it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.84it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.84it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.84it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.84it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.84it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.84it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.84it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.84it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.84it/s][ADDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.84it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.83it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.84it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.83it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.84it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.84it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.83it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.83it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.85it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.83it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.84it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.85it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.83it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.83it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.85it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.83it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.84it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.83it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.84it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.83it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.84it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.83it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.84it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.83it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.84it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.83it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.83it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.83it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.83it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.84it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.83it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.78it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.83it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.83it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.83it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.77it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.83it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.83it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.84it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.78it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.83it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.84it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.78it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.83it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.84it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.83it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.84it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.84it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.84it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.84it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.84it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.84it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.84it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.83it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]Epoch 21:  99%|█████████▉| 1201/1208 [32:47<00:11,  1.64s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.000172, train/loss_step=0.0476, global_step=6641.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21:  99%|█████████▉| 1201/1208 [32:47<00:11,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0422, train/loss_vlb_step=0.000155, train/loss_step=0.0422, global_step=6642.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21: 100%|█████████▉| 1202/1208 [32:48<00:09,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0422, train/loss_vlb_step=0.000155, train/loss_step=0.0422, global_step=6642.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21: 100%|█████████▉| 1202/1208 [32:48<00:09,  1.64s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.27e-5, train/loss_step=0.0117, global_step=6642.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136] Epoch 21: 100%|█████████▉| 1203/1208 [32:49<00:08,  1.64s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.27e-5, train/loss_step=0.0117, global_step=6642.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21: 100%|█████████▉| 1203/1208 [32:49<00:08,  1.64s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=1.74e-5, train/loss_step=0.00322, global_step=6642.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21: 100%|█████████▉| 1204/1208 [32:52<00:06,  1.64s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=1.74e-5, train/loss_step=0.00322, global_step=6642.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21: 100%|█████████▉| 1204/1208 [32:52<00:06,  1.64s/it, loss=0.106, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00106, train/loss_step=0.244, global_step=6642.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]   Epoch 21: 100%|█████████▉| 1205/1208 [32:53<00:04,  1.64s/it, loss=0.106, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00106, train/loss_step=0.244, global_step=6642.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21: 100%|█████████▉| 1205/1208 [32:53<00:04,  1.64s/it, loss=0.112, v_num=0, train/loss_simple_step=0.510, train/loss_vlb_step=0.00437, train/loss_step=0.510, global_step=6643.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21: 100%|█████████▉| 1206/1208 [32:54<00:03,  1.64s/it, loss=0.112, v_num=0, train/loss_simple_step=0.510, train/loss_vlb_step=0.00437, train/loss_step=0.510, global_step=6643.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21: 100%|█████████▉| 1206/1208 [32:54<00:03,  1.64s/it, loss=0.119, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000511, train/loss_step=0.152, global_step=6643.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21: 100%|█████████▉| 1207/1208 [32:55<00:01,  1.64s/it, loss=0.119, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000511, train/loss_step=0.152, global_step=6643.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21: 100%|█████████▉| 1207/1208 [32:55<00:01,  1.64s/it, loss=0.122, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000706, train/loss_step=0.199, global_step=6643.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21: 100%|██████████| 1208/1208 [33:00<00:00,  1.64s/it, loss=0.122, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000706, train/loss_step=0.199, global_step=6643.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 21: 100%|██████████| 1208/1208 [33:00<00:00,  1.64s/it, loss=0.111, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000716, train/loss_step=0.202, global_step=6643.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]
+
+
+Epoch 21:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.111, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000716, train/loss_step=0.202, global_step=6643.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]           Epoch 22:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.111, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000716, train/loss_step=0.202, global_step=6643.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][AData shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.86it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:25,  1.85it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.84it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.85it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.84it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.85it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.84it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.85it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.85it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.86it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.85it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.85it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.85it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.86it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.85it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.85it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.85it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.85it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.85it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.85it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.85it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.83it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.85it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.85it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.84it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.85it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.76it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.85it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:18,  1.85it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:18,  1.85it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.85it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.85it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.85it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.85it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.85it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.85it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.84it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.85it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.84it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.85it/s][ADDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.84it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.85it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.84it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.85it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:12<00:14,  1.84it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.84it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.85it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.84it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.83it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.83it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.83it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.83it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.83it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.83it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.84it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.84it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.83it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.84it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.83it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]DDIM Sampler:  70%|███████   | 35/50 [00:18<00:08,  1.84it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:18<00:08,  1.83it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.78it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.84it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.84it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.84it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.84it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.84it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.84it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.84it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.85it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.82it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.84it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.75it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.84it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.78it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.84it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.84it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.85it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.83it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:24<00:02,  1.84it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.84it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.83it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.84it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.84it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.84it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.84it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.84it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.84it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]Epoch 22:   0%|          | 1/1208 [00:30<10:17:36, 30.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000716, train/loss_step=0.202, global_step=6643.0, train/loss_simple_epoch=0.136, train/loss_vlb_epoch=0.00308, train/loss_epoch=0.136]Epoch 22:   0%|          | 1/1208 [00:30<10:17:38, 30.70s/it, loss=0.115, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000332, train/loss_step=0.100, global_step=6644.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   0%|          | 2/1208 [00:31<5:18:46, 15.86s/it, loss=0.115, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000332, train/loss_step=0.100, global_step=6644.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:   0%|          | 2/1208 [00:31<5:18:46, 15.86s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000118, train/loss_step=0.0311, global_step=6644.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   0%|          | 3/1208 [00:32<3:39:05, 10.91s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000118, train/loss_step=0.0311, global_step=6644.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   0%|          | 3/1208 [00:32<3:39:05, 10.91s/it, loss=0.12, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000377, train/loss_step=0.115, global_step=6644.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:   0%|          | 4/1208 [00:35<2:59:31,  8.95s/it, loss=0.12, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000377, train/loss_step=0.115, global_step=6644.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   0%|          | 4/1208 [00:35<2:59:31,  8.95s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00781, train/loss_vlb_step=3.92e-5, train/loss_step=0.00781, global_step=6644.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   0%|          | 5/1208 [00:36<2:27:38,  7.36s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00781, train/loss_vlb_step=3.92e-5, train/loss_step=0.00781, global_step=6644.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   0%|          | 5/1208 [00:36<2:27:38,  7.36s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0601, train/loss_vlb_step=0.000208, train/loss_step=0.0601, global_step=6645.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   0%|          | 6/1208 [00:37<2:06:18,  6.30s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0601, train/loss_vlb_step=0.000208, train/loss_step=0.0601, global_step=6645.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   0%|          | 6/1208 [00:37<2:06:18,  6.30s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.22e-5, train/loss_step=0.00409, global_step=6645.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   1%|          | 7/1208 [00:38<1:51:04,  5.55s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.22e-5, train/loss_step=0.00409, global_step=6645.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   1%|          | 7/1208 [00:38<1:51:04,  5.55s/it, loss=0.114, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00109, train/loss_step=0.267, global_step=6645.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:   1%|          | 8/1208 [00:41<1:44:13,  5.21s/it, loss=0.114, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00109, train/loss_step=0.267, global_step=6645.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   1%|          | 8/1208 [00:41<1:44:13,  5.21s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00704, train/loss_vlb_step=3.48e-5, train/loss_step=0.00704, global_step=6645.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   1%|          | 9/1208 [00:42<1:34:49,  4.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00704, train/loss_vlb_step=3.48e-5, train/loss_step=0.00704, global_step=6645.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   1%|          | 9/1208 [00:42<1:34:49,  4.75s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000134, train/loss_step=0.0381, global_step=6646.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:   1%|          | 10/1208 [00:43<1:27:18,  4.37s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000134, train/loss_step=0.0381, global_step=6646.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   1%|          | 10/1208 [00:43<1:27:18,  4.37s/it, loss=0.123, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00187, train/loss_step=0.376, global_step=6646.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:   1%|          | 11/1208 [00:44<1:21:08,  4.07s/it, loss=0.123, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00187, train/loss_step=0.376, global_step=6646.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   1%|          | 11/1208 [00:44<1:21:08,  4.07s/it, loss=0.139, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00213, train/loss_step=0.352, global_step=6646.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   1%|          | 12/1208 [00:47<1:19:05,  3.97s/it, loss=0.139, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00213, train/loss_step=0.352, global_step=6646.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   1%|          | 12/1208 [00:47<1:19:05,  3.97s/it, loss=0.142, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=6646.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   1%|          | 13/1208 [00:48<1:14:30,  3.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=6646.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   1%|          | 13/1208 [00:48<1:14:31,  3.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0824, train/loss_vlb_step=0.000273, train/loss_step=0.0824, global_step=6647.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   1%|          | 14/1208 [00:49<1:10:34,  3.55s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0824, train/loss_vlb_step=0.000273, train/loss_step=0.0824, global_step=6647.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   1%|          | 14/1208 [00:49<1:10:34,  3.55s/it, loss=0.15, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000495, train/loss_step=0.142, global_step=6647.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:   1%|          | 15/1208 [00:50<1:07:09,  3.38s/it, loss=0.15, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000495, train/loss_step=0.142, global_step=6647.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   1%|          | 15/1208 [00:50<1:07:09,  3.38s/it, loss=0.176, v_num=0, train/loss_simple_step=0.517, train/loss_vlb_step=0.00634, train/loss_step=0.517, global_step=6647.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   1%|▏         | 16/1208 [00:53<1:06:27,  3.35s/it, loss=0.176, v_num=0, train/loss_simple_step=0.517, train/loss_vlb_step=0.00634, train/loss_step=0.517, global_step=6647.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   1%|▏         | 16/1208 [00:53<1:06:28,  3.35s/it, loss=0.18, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00184, train/loss_step=0.314, global_step=6647.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:   1%|▏         | 17/1208 [00:54<1:03:41,  3.21s/it, loss=0.18, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00184, train/loss_step=0.314, global_step=6647.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   1%|▏         | 17/1208 [00:54<1:03:41,  3.21s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.75e-5, train/loss_step=0.0129, global_step=6648.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   1%|▏         | 18/1208 [00:55<1:01:12,  3.09s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.75e-5, train/loss_step=0.0129, global_step=6648.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   1%|▏         | 18/1208 [00:55<1:01:13,  3.09s/it, loss=0.176, v_num=0, train/loss_simple_step=0.580, train/loss_vlb_step=0.00622, train/loss_step=0.580, global_step=6648.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:   2%|▏         | 19/1208 [00:56<59:00,  2.98s/it, loss=0.176, v_num=0, train/loss_simple_step=0.580, train/loss_vlb_step=0.00622, train/loss_step=0.580, global_step=6648.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:   2%|▏         | 19/1208 [00:56<59:00,  2.98s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.88e-5, train/loss_step=0.0242, global_step=6648.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   2%|▏         | 20/1208 [00:59<58:49,  2.97s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.88e-5, train/loss_step=0.0242, global_step=6648.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   2%|▏         | 20/1208 [00:59<58:49,  2.97s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000112, train/loss_step=0.0304, global_step=6648.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   2%|▏         | 21/1208 [01:00<56:56,  2.88s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000112, train/loss_step=0.0304, global_step=6648.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   2%|▏         | 21/1208 [01:00<56:56,  2.88s/it, loss=0.163, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000687, train/loss_step=0.185, global_step=6649.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:   2%|▏         | 22/1208 [01:01<55:12,  2.79s/it, loss=0.163, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000687, train/loss_step=0.185, global_step=6649.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   2%|▏         | 22/1208 [01:01<55:12,  2.79s/it, loss=0.175, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00112, train/loss_step=0.268, global_step=6649.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:   2%|▏         | 23/1208 [01:02<53:38,  2.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00112, train/loss_step=0.268, global_step=6649.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   2%|▏         | 23/1208 [01:02<53:38,  2.72s/it, loss=0.18, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000809, train/loss_step=0.213, global_step=6649.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   2%|▏         | 24/1208 [01:05<53:43,  2.72s/it, loss=0.18, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000809, train/loss_step=0.213, global_step=6649.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   2%|▏         | 24/1208 [01:05<53:43,  2.72s/it, loss=0.191, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000882, train/loss_step=0.234, global_step=6649.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   2%|▏         | 25/1208 [01:06<52:19,  2.65s/it, loss=0.191, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000882, train/loss_step=0.234, global_step=6649.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   2%|▏         | 25/1208 [01:06<52:19,  2.65s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0917, train/loss_vlb_step=0.000301, train/loss_step=0.0917, global_step=6650.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   2%|▏         | 26/1208 [01:07<51:02,  2.59s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0917, train/loss_vlb_step=0.000301, train/loss_step=0.0917, global_step=6650.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   2%|▏         | 26/1208 [01:07<51:02,  2.59s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000192, train/loss_step=0.0545, global_step=6650.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   2%|▏         | 27/1208 [01:08<49:51,  2.53s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000192, train/loss_step=0.0545, global_step=6650.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   2%|▏         | 27/1208 [01:08<49:51,  2.53s/it, loss=0.192, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000715, train/loss_step=0.196, global_step=6650.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:   2%|▏         | 28/1208 [01:11<50:03,  2.55s/it, loss=0.192, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000715, train/loss_step=0.196, global_step=6650.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   2%|▏         | 28/1208 [01:11<50:03,  2.55s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0088, train/loss_vlb_step=4.2e-5, train/loss_step=0.0088, global_step=6650.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   2%|▏         | 29/1208 [01:12<48:58,  2.49s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0088, train/loss_vlb_step=4.2e-5, train/loss_step=0.0088, global_step=6650.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   2%|▏         | 29/1208 [01:12<48:58,  2.49s/it, loss=0.206, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00145, train/loss_step=0.325, global_step=6651.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:   2%|▏         | 30/1208 [01:13<47:58,  2.44s/it, loss=0.206, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00145, train/loss_step=0.325, global_step=6651.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   2%|▏         | 30/1208 [01:13<47:58,  2.44s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0491, train/loss_vlb_step=0.000175, train/loss_step=0.0491, global_step=6651.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   3%|▎         | 31/1208 [01:14<47:01,  2.40s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0491, train/loss_vlb_step=0.000175, train/loss_step=0.0491, global_step=6651.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   3%|▎         | 31/1208 [01:14<47:01,  2.40s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.35e-5, train/loss_step=0.0198, global_step=6651.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   3%|▎         | 32/1208 [01:17<47:16,  2.41s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.35e-5, train/loss_step=0.0198, global_step=6651.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   3%|▎         | 32/1208 [01:17<47:16,  2.41s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.65e-5, train/loss_step=0.0129, global_step=6651.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   3%|▎         | 33/1208 [01:18<46:24,  2.37s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.65e-5, train/loss_step=0.0129, global_step=6651.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   3%|▎         | 33/1208 [01:18<46:24,  2.37s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.22e-5, train/loss_step=0.00208, global_step=6652.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   3%|▎         | 34/1208 [01:19<45:36,  2.33s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.22e-5, train/loss_step=0.00208, global_step=6652.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   3%|▎         | 34/1208 [01:19<45:36,  2.33s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00981, train/loss_vlb_step=4.68e-5, train/loss_step=0.00981, global_step=6652.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   3%|▎         | 35/1208 [01:20<44:49,  2.29s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00981, train/loss_vlb_step=4.68e-5, train/loss_step=0.00981, global_step=6652.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   3%|▎         | 35/1208 [01:20<44:49,  2.29s/it, loss=0.135, v_num=0, train/loss_simple_step=0.066, train/loss_vlb_step=0.00022, train/loss_step=0.066, global_step=6652.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:   3%|▎         | 36/1208 [01:23<45:04,  2.31s/it, loss=0.135, v_num=0, train/loss_simple_step=0.066, train/loss_vlb_step=0.00022, train/loss_step=0.066, global_step=6652.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   3%|▎         | 36/1208 [01:23<45:04,  2.31s/it, loss=0.128, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000633, train/loss_step=0.177, global_step=6652.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   3%|▎         | 37/1208 [01:24<44:21,  2.27s/it, loss=0.128, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000633, train/loss_step=0.177, global_step=6652.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   3%|▎         | 37/1208 [01:24<44:21,  2.27s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0886, train/loss_vlb_step=0.000295, train/loss_step=0.0886, global_step=6653.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   3%|▎         | 38/1208 [01:25<43:40,  2.24s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0886, train/loss_vlb_step=0.000295, train/loss_step=0.0886, global_step=6653.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   3%|▎         | 38/1208 [01:25<43:40,  2.24s/it, loss=0.108, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000347, train/loss_step=0.106, global_step=6653.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:   3%|▎         | 39/1208 [01:26<43:01,  2.21s/it, loss=0.108, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000347, train/loss_step=0.106, global_step=6653.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   3%|▎         | 39/1208 [01:26<43:01,  2.21s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=1.11e-5, train/loss_step=0.00183, global_step=6653.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   3%|▎         | 40/1208 [01:28<43:18,  2.22s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=1.11e-5, train/loss_step=0.00183, global_step=6653.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   3%|▎         | 40/1208 [01:28<43:18,  2.22s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.64e-5, train/loss_step=0.00286, global_step=6653.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   3%|▎         | 41/1208 [01:30<42:41,  2.20s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.64e-5, train/loss_step=0.00286, global_step=6653.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   3%|▎         | 41/1208 [01:30<42:41,  2.20s/it, loss=0.11, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00133, train/loss_step=0.280, global_step=6654.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]     Epoch 22:   3%|▎         | 42/1208 [01:31<42:07,  2.17s/it, loss=0.11, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00133, train/loss_step=0.280, global_step=6654.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   3%|▎         | 42/1208 [01:31<42:07,  2.17s/it, loss=0.12, v_num=0, train/loss_simple_step=0.453, train/loss_vlb_step=0.00307, train/loss_step=0.453, global_step=6654.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   4%|▎         | 43/1208 [01:32<41:33,  2.14s/it, loss=0.12, v_num=0, train/loss_simple_step=0.453, train/loss_vlb_step=0.00307, train/loss_step=0.453, global_step=6654.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   4%|▎         | 43/1208 [01:32<41:33,  2.14s/it, loss=0.119, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000826, train/loss_step=0.210, global_step=6654.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   4%|▎         | 44/1208 [01:34<41:50,  2.16s/it, loss=0.119, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000826, train/loss_step=0.210, global_step=6654.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   4%|▎         | 44/1208 [01:34<41:50,  2.16s/it, loss=0.108, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.17e-5, train/loss_step=0.014, global_step=6654.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:   4%|▎         | 45/1208 [01:35<41:19,  2.13s/it, loss=0.108, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.17e-5, train/loss_step=0.014, global_step=6654.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   4%|▎         | 45/1208 [01:35<41:19,  2.13s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.64e-5, train/loss_step=0.0239, global_step=6655.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   4%|▍         | 46/1208 [01:36<40:48,  2.11s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.64e-5, train/loss_step=0.0239, global_step=6655.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   4%|▍         | 46/1208 [01:36<40:48,  2.11s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00466, train/loss_vlb_step=2.48e-5, train/loss_step=0.00466, global_step=6655.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   4%|▍         | 47/1208 [01:37<40:19,  2.08s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00466, train/loss_vlb_step=2.48e-5, train/loss_step=0.00466, global_step=6655.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   4%|▍         | 47/1208 [01:37<40:19,  2.08s/it, loss=0.121, v_num=0, train/loss_simple_step=0.567, train/loss_vlb_step=0.0114, train/loss_step=0.567, global_step=6655.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]     Epoch 22:   4%|▍         | 48/1208 [01:40<40:36,  2.10s/it, loss=0.121, v_num=0, train/loss_simple_step=0.567, train/loss_vlb_step=0.0114, train/loss_step=0.567, global_step=6655.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   4%|▍         | 48/1208 [01:40<40:36,  2.10s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.00011, train/loss_step=0.0281, global_step=6655.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   4%|▍         | 49/1208 [01:41<40:08,  2.08s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.00011, train/loss_step=0.0281, global_step=6655.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   4%|▍         | 49/1208 [01:41<40:08,  2.08s/it, loss=0.114, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000556, train/loss_step=0.161, global_step=6656.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:   4%|▍         | 50/1208 [01:42<39:41,  2.06s/it, loss=0.114, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000556, train/loss_step=0.161, global_step=6656.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   4%|▍         | 50/1208 [01:42<39:41,  2.06s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0391, train/loss_vlb_step=0.000147, train/loss_step=0.0391, global_step=6656.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   4%|▍         | 51/1208 [01:43<39:16,  2.04s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0391, train/loss_vlb_step=0.000147, train/loss_step=0.0391, global_step=6656.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   4%|▍         | 51/1208 [01:43<39:16,  2.04s/it, loss=0.118, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.00038, train/loss_step=0.116, global_step=6656.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:   4%|▍         | 52/1208 [01:46<39:32,  2.05s/it, loss=0.118, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.00038, train/loss_step=0.116, global_step=6656.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   4%|▍         | 52/1208 [01:46<39:32,  2.05s/it, loss=0.13, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00107, train/loss_step=0.259, global_step=6656.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:   4%|▍         | 53/1208 [01:47<39:08,  2.03s/it, loss=0.13, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00107, train/loss_step=0.259, global_step=6656.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   4%|▍         | 53/1208 [01:47<39:08,  2.03s/it, loss=0.174, v_num=0, train/loss_simple_step=0.870, train/loss_vlb_step=0.438, train/loss_step=0.870, global_step=6657.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:   4%|▍         | 54/1208 [01:48<38:44,  2.01s/it, loss=0.174, v_num=0, train/loss_simple_step=0.870, train/loss_vlb_step=0.438, train/loss_step=0.870, global_step=6657.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   4%|▍         | 54/1208 [01:48<38:44,  2.01s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.04e-5, train/loss_step=0.0114, global_step=6657.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   5%|▍         | 55/1208 [01:49<38:20,  2.00s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.04e-5, train/loss_step=0.0114, global_step=6657.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   5%|▍         | 55/1208 [01:49<38:21,  2.00s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0823, train/loss_vlb_step=0.00028, train/loss_step=0.0823, global_step=6657.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   5%|▍         | 56/1208 [01:52<38:37,  2.01s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0823, train/loss_vlb_step=0.00028, train/loss_step=0.0823, global_step=6657.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   5%|▍         | 56/1208 [01:52<38:37,  2.01s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00632, train/loss_vlb_step=3.16e-5, train/loss_step=0.00632, global_step=6657.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   5%|▍         | 57/1208 [01:53<38:15,  1.99s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00632, train/loss_vlb_step=3.16e-5, train/loss_step=0.00632, global_step=6657.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   5%|▍         | 57/1208 [01:53<38:15,  1.99s/it, loss=0.179, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00179, train/loss_step=0.348, global_step=6658.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:   5%|▍         | 58/1208 [01:54<37:53,  1.98s/it, loss=0.179, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00179, train/loss_step=0.348, global_step=6658.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   5%|▍         | 58/1208 [01:54<37:53,  1.98s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00866, train/loss_vlb_step=4.37e-5, train/loss_step=0.00866, global_step=6658.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   5%|▍         | 59/1208 [01:55<37:33,  1.96s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00866, train/loss_vlb_step=4.37e-5, train/loss_step=0.00866, global_step=6658.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   5%|▍         | 59/1208 [01:55<37:33,  1.96s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=2.87e-5, train/loss_step=0.00572, global_step=6658.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   5%|▍         | 60/1208 [01:58<37:48,  1.98s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=2.87e-5, train/loss_step=0.00572, global_step=6658.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   5%|▍         | 60/1208 [01:58<37:48,  1.98s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=1.71e-5, train/loss_step=0.0031, global_step=6658.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:   5%|▌         | 61/1208 [01:59<37:28,  1.96s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=1.71e-5, train/loss_step=0.0031, global_step=6658.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   5%|▌         | 61/1208 [01:59<37:28,  1.96s/it, loss=0.177, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00228, train/loss_step=0.329, global_step=6659.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:   5%|▌         | 62/1208 [02:00<37:08,  1.94s/it, loss=0.177, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00228, train/loss_step=0.329, global_step=6659.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   5%|▌         | 62/1208 [02:00<37:08,  1.94s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.000147, train/loss_step=0.0401, global_step=6659.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   5%|▌         | 63/1208 [02:01<36:49,  1.93s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.000147, train/loss_step=0.0401, global_step=6659.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   5%|▌         | 63/1208 [02:01<36:49,  1.93s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00646, train/loss_vlb_step=3.18e-5, train/loss_step=0.00646, global_step=6659.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   5%|▌         | 64/1208 [02:04<37:04,  1.94s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00646, train/loss_vlb_step=3.18e-5, train/loss_step=0.00646, global_step=6659.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   5%|▌         | 64/1208 [02:04<37:04,  1.94s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0912, train/loss_vlb_step=0.000301, train/loss_step=0.0912, global_step=6659.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:   5%|▌         | 65/1208 [02:05<36:46,  1.93s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0912, train/loss_vlb_step=0.000301, train/loss_step=0.0912, global_step=6659.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   5%|▌         | 65/1208 [02:05<36:46,  1.93s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00774, train/loss_vlb_step=3.74e-5, train/loss_step=0.00774, global_step=6660.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   5%|▌         | 66/1208 [02:06<36:28,  1.92s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00774, train/loss_vlb_step=3.74e-5, train/loss_step=0.00774, global_step=6660.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   5%|▌         | 66/1208 [02:06<36:28,  1.92s/it, loss=0.156, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000496, train/loss_step=0.147, global_step=6660.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:   6%|▌         | 67/1208 [02:07<36:11,  1.90s/it, loss=0.156, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000496, train/loss_step=0.147, global_step=6660.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   6%|▌         | 67/1208 [02:07<36:11,  1.90s/it, loss=0.135, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.00049, train/loss_step=0.146, global_step=6660.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:   6%|▌         | 68/1208 [02:10<36:25,  1.92s/it, loss=0.135, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.00049, train/loss_step=0.146, global_step=6660.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   6%|▌         | 68/1208 [02:10<36:25,  1.92s/it, loss=0.154, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00462, train/loss_step=0.397, global_step=6660.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   6%|▌         | 69/1208 [02:11<36:08,  1.90s/it, loss=0.154, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00462, train/loss_step=0.397, global_step=6660.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   6%|▌         | 69/1208 [02:11<36:08,  1.90s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000115, train/loss_step=0.0298, global_step=6661.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   6%|▌         | 70/1208 [02:12<35:52,  1.89s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000115, train/loss_step=0.0298, global_step=6661.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   6%|▌         | 70/1208 [02:12<35:52,  1.89s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000131, train/loss_step=0.0344, global_step=6661.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   6%|▌         | 71/1208 [02:13<35:36,  1.88s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000131, train/loss_step=0.0344, global_step=6661.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   6%|▌         | 71/1208 [02:13<35:36,  1.88s/it, loss=0.171, v_num=0, train/loss_simple_step=0.606, train/loss_vlb_step=0.0142, train/loss_step=0.606, global_step=6661.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:   6%|▌         | 72/1208 [02:16<35:50,  1.89s/it, loss=0.171, v_num=0, train/loss_simple_step=0.606, train/loss_vlb_step=0.0142, train/loss_step=0.606, global_step=6661.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   6%|▌         | 72/1208 [02:16<35:50,  1.89s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=5.18e-5, train/loss_step=0.0106, global_step=6661.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   6%|▌         | 73/1208 [02:17<35:34,  1.88s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=5.18e-5, train/loss_step=0.0106, global_step=6661.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   6%|▌         | 73/1208 [02:17<35:34,  1.88s/it, loss=0.121, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=6662.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:   6%|▌         | 74/1208 [02:18<35:19,  1.87s/it, loss=0.121, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=6662.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   6%|▌         | 74/1208 [02:18<35:19,  1.87s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000109, train/loss_step=0.0286, global_step=6662.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   6%|▌         | 75/1208 [02:19<35:04,  1.86s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000109, train/loss_step=0.0286, global_step=6662.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   6%|▌         | 75/1208 [02:19<35:04,  1.86s/it, loss=0.125, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.00051, train/loss_step=0.147, global_step=6662.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:   6%|▋         | 76/1208 [02:22<35:17,  1.87s/it, loss=0.125, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.00051, train/loss_step=0.147, global_step=6662.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   6%|▋         | 76/1208 [02:22<35:17,  1.87s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.23e-5, train/loss_step=0.0198, global_step=6662.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   6%|▋         | 77/1208 [02:23<35:03,  1.86s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.23e-5, train/loss_step=0.0198, global_step=6662.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   6%|▋         | 77/1208 [02:23<35:03,  1.86s/it, loss=0.117, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000572, train/loss_step=0.166, global_step=6663.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:   6%|▋         | 78/1208 [02:24<34:49,  1.85s/it, loss=0.117, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000572, train/loss_step=0.166, global_step=6663.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   6%|▋         | 78/1208 [02:24<34:49,  1.85s/it, loss=0.146, v_num=0, train/loss_simple_step=0.602, train/loss_vlb_step=0.013, train/loss_step=0.602, global_step=6663.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:   7%|▋         | 79/1208 [02:25<34:35,  1.84s/it, loss=0.146, v_num=0, train/loss_simple_step=0.602, train/loss_vlb_step=0.013, train/loss_step=0.602, global_step=6663.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   7%|▋         | 79/1208 [02:25<34:35,  1.84s/it, loss=0.146, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.57e-5, train/loss_step=0.003, global_step=6663.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   7%|▋         | 80/1208 [02:28<34:48,  1.85s/it, loss=0.146, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.57e-5, train/loss_step=0.003, global_step=6663.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   7%|▋         | 80/1208 [02:28<34:48,  1.85s/it, loss=0.165, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00265, train/loss_step=0.391, global_step=6663.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   7%|▋         | 81/1208 [02:29<34:34,  1.84s/it, loss=0.165, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00265, train/loss_step=0.391, global_step=6663.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   7%|▋         | 81/1208 [02:29<34:34,  1.84s/it, loss=0.154, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=6664.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   7%|▋         | 82/1208 [02:30<34:21,  1.83s/it, loss=0.154, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=6664.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   7%|▋         | 82/1208 [02:30<34:21,  1.83s/it, loss=0.161, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000655, train/loss_step=0.169, global_step=6664.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   7%|▋         | 83/1208 [02:31<34:08,  1.82s/it, loss=0.161, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000655, train/loss_step=0.169, global_step=6664.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   7%|▋         | 83/1208 [02:31<34:08,  1.82s/it, loss=0.179, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00201, train/loss_step=0.365, global_step=6664.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:   7%|▋         | 84/1208 [02:34<34:21,  1.83s/it, loss=0.179, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00201, train/loss_step=0.365, global_step=6664.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   7%|▋         | 84/1208 [02:34<34:21,  1.83s/it, loss=0.195, v_num=0, train/loss_simple_step=0.421, train/loss_vlb_step=0.00357, train/loss_step=0.421, global_step=6664.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   7%|▋         | 85/1208 [02:35<34:08,  1.82s/it, loss=0.195, v_num=0, train/loss_simple_step=0.421, train/loss_vlb_step=0.00357, train/loss_step=0.421, global_step=6664.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   7%|▋         | 85/1208 [02:35<34:08,  1.82s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.89e-5, train/loss_step=0.0106, global_step=6665.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   7%|▋         | 86/1208 [02:36<33:56,  1.81s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.89e-5, train/loss_step=0.0106, global_step=6665.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   7%|▋         | 86/1208 [02:36<33:56,  1.81s/it, loss=0.198, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000703, train/loss_step=0.198, global_step=6665.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:   7%|▋         | 87/1208 [02:37<33:44,  1.81s/it, loss=0.198, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000703, train/loss_step=0.198, global_step=6665.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   7%|▋         | 87/1208 [02:37<33:44,  1.81s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.47e-5, train/loss_step=0.0188, global_step=6665.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   7%|▋         | 88/1208 [02:39<33:55,  1.82s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.47e-5, train/loss_step=0.0188, global_step=6665.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   7%|▋         | 88/1208 [02:39<33:55,  1.82s/it, loss=0.18, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000602, train/loss_step=0.167, global_step=6665.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:   7%|▋         | 89/1208 [02:40<33:44,  1.81s/it, loss=0.18, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000602, train/loss_step=0.167, global_step=6665.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   7%|▋         | 89/1208 [02:40<33:44,  1.81s/it, loss=0.189, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000792, train/loss_step=0.200, global_step=6666.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   7%|▋         | 90/1208 [02:41<33:32,  1.80s/it, loss=0.189, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000792, train/loss_step=0.200, global_step=6666.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   7%|▋         | 90/1208 [02:41<33:32,  1.80s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.39e-5, train/loss_step=0.0174, global_step=6666.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   8%|▊         | 91/1208 [02:42<33:20,  1.79s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.39e-5, train/loss_step=0.0174, global_step=6666.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   8%|▊         | 91/1208 [02:42<33:20,  1.79s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0433, train/loss_vlb_step=0.000154, train/loss_step=0.0433, global_step=6666.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   8%|▊         | 92/1208 [02:45<33:32,  1.80s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0433, train/loss_vlb_step=0.000154, train/loss_step=0.0433, global_step=6666.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   8%|▊         | 92/1208 [02:45<33:32,  1.80s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0651, train/loss_vlb_step=0.000219, train/loss_step=0.0651, global_step=6666.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   8%|▊         | 93/1208 [02:46<33:20,  1.79s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0651, train/loss_vlb_step=0.000219, train/loss_step=0.0651, global_step=6666.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   8%|▊         | 93/1208 [02:46<33:20,  1.79s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000128, train/loss_step=0.0358, global_step=6667.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   8%|▊         | 94/1208 [02:47<33:09,  1.79s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000128, train/loss_step=0.0358, global_step=6667.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   8%|▊         | 94/1208 [02:47<33:09,  1.79s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.44e-5, train/loss_step=0.0147, global_step=6667.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:   8%|▊         | 95/1208 [02:48<32:58,  1.78s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.44e-5, train/loss_step=0.0147, global_step=6667.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   8%|▊         | 95/1208 [02:48<32:58,  1.78s/it, loss=0.166, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00166, train/loss_step=0.310, global_step=6667.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:   8%|▊         | 96/1208 [02:51<33:09,  1.79s/it, loss=0.166, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00166, train/loss_step=0.310, global_step=6667.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   8%|▊         | 96/1208 [02:51<33:09,  1.79s/it, loss=0.167, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.00012, train/loss_step=0.032, global_step=6667.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   8%|▊         | 97/1208 [02:52<32:58,  1.78s/it, loss=0.167, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.00012, train/loss_step=0.032, global_step=6667.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   8%|▊         | 97/1208 [02:52<32:58,  1.78s/it, loss=0.176, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00228, train/loss_step=0.355, global_step=6668.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   8%|▊         | 98/1208 [02:53<32:48,  1.77s/it, loss=0.176, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00228, train/loss_step=0.355, global_step=6668.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   8%|▊         | 98/1208 [02:53<32:48,  1.77s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.66e-5, train/loss_step=0.0029, global_step=6668.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   8%|▊         | 99/1208 [02:54<32:37,  1.77s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.66e-5, train/loss_step=0.0029, global_step=6668.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   8%|▊         | 99/1208 [02:54<32:37,  1.77s/it, loss=0.152, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000411, train/loss_step=0.124, global_step=6668.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:   8%|▊         | 100/1208 [02:57<32:48,  1.78s/it, loss=0.152, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000411, train/loss_step=0.124, global_step=6668.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   8%|▊         | 100/1208 [02:57<32:48,  1.78s/it, loss=0.165, v_num=0, train/loss_simple_step=0.643, train/loss_vlb_step=0.0471, train/loss_step=0.643, global_step=6668.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:   8%|▊         | 101/1208 [02:58<32:38,  1.77s/it, loss=0.165, v_num=0, train/loss_simple_step=0.643, train/loss_vlb_step=0.0471, train/loss_step=0.643, global_step=6668.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   8%|▊         | 101/1208 [02:58<32:38,  1.77s/it, loss=0.183, v_num=0, train/loss_simple_step=0.462, train/loss_vlb_step=0.00396, train/loss_step=0.462, global_step=6669.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   8%|▊         | 102/1208 [02:59<32:28,  1.76s/it, loss=0.183, v_num=0, train/loss_simple_step=0.462, train/loss_vlb_step=0.00396, train/loss_step=0.462, global_step=6669.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   8%|▊         | 102/1208 [02:59<32:28,  1.76s/it, loss=0.186, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000986, train/loss_step=0.238, global_step=6669.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   9%|▊         | 103/1208 [03:00<32:18,  1.75s/it, loss=0.186, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000986, train/loss_step=0.238, global_step=6669.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   9%|▊         | 103/1208 [03:00<32:18,  1.75s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.91e-5, train/loss_step=0.00335, global_step=6669.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   9%|▊         | 104/1208 [03:03<32:28,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.91e-5, train/loss_step=0.00335, global_step=6669.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   9%|▊         | 104/1208 [03:03<32:28,  1.77s/it, loss=0.156, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000643, train/loss_step=0.188, global_step=6669.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:   9%|▊         | 105/1208 [03:04<32:19,  1.76s/it, loss=0.156, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000643, train/loss_step=0.188, global_step=6669.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   9%|▊         | 105/1208 [03:04<32:19,  1.76s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0751, train/loss_vlb_step=0.000252, train/loss_step=0.0751, global_step=6670.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   9%|▉         | 106/1208 [03:05<32:09,  1.75s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0751, train/loss_vlb_step=0.000252, train/loss_step=0.0751, global_step=6670.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   9%|▉         | 106/1208 [03:05<32:09,  1.75s/it, loss=0.178, v_num=0, train/loss_simple_step=0.567, train/loss_vlb_step=0.00738, train/loss_step=0.567, global_step=6670.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:   9%|▉         | 107/1208 [03:06<32:00,  1.74s/it, loss=0.178, v_num=0, train/loss_simple_step=0.567, train/loss_vlb_step=0.00738, train/loss_step=0.567, global_step=6670.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   9%|▉         | 107/1208 [03:06<32:00,  1.74s/it, loss=0.197, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00241, train/loss_step=0.391, global_step=6670.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   9%|▉         | 108/1208 [03:09<32:09,  1.75s/it, loss=0.197, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00241, train/loss_step=0.391, global_step=6670.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   9%|▉         | 108/1208 [03:09<32:09,  1.75s/it, loss=0.195, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000458, train/loss_step=0.139, global_step=6670.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   9%|▉         | 109/1208 [03:10<32:00,  1.75s/it, loss=0.195, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000458, train/loss_step=0.139, global_step=6670.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   9%|▉         | 109/1208 [03:10<32:00,  1.75s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=1.39e-5, train/loss_step=0.00239, global_step=6671.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   9%|▉         | 110/1208 [03:11<31:51,  1.74s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=1.39e-5, train/loss_step=0.00239, global_step=6671.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   9%|▉         | 110/1208 [03:11<31:51,  1.74s/it, loss=0.193, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.0006, train/loss_step=0.177, global_step=6671.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]     Epoch 22:   9%|▉         | 111/1208 [03:12<31:42,  1.73s/it, loss=0.193, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.0006, train/loss_step=0.177, global_step=6671.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   9%|▉         | 111/1208 [03:12<31:42,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0923, train/loss_vlb_step=0.000304, train/loss_step=0.0923, global_step=6671.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   9%|▉         | 112/1208 [03:15<31:52,  1.74s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0923, train/loss_vlb_step=0.000304, train/loss_step=0.0923, global_step=6671.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   9%|▉         | 112/1208 [03:15<31:52,  1.74s/it, loss=0.202, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000617, train/loss_step=0.182, global_step=6671.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:   9%|▉         | 113/1208 [03:16<31:43,  1.74s/it, loss=0.202, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000617, train/loss_step=0.182, global_step=6671.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   9%|▉         | 113/1208 [03:16<31:43,  1.74s/it, loss=0.204, v_num=0, train/loss_simple_step=0.0848, train/loss_vlb_step=0.000282, train/loss_step=0.0848, global_step=6672.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   9%|▉         | 114/1208 [03:17<31:34,  1.73s/it, loss=0.204, v_num=0, train/loss_simple_step=0.0848, train/loss_vlb_step=0.000282, train/loss_step=0.0848, global_step=6672.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:   9%|▉         | 114/1208 [03:17<31:34,  1.73s/it, loss=0.204, v_num=0, train/loss_simple_step=0.00459, train/loss_vlb_step=2.46e-5, train/loss_step=0.00459, global_step=6672.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  10%|▉         | 115/1208 [03:18<31:26,  1.73s/it, loss=0.204, v_num=0, train/loss_simple_step=0.00459, train/loss_vlb_step=2.46e-5, train/loss_step=0.00459, global_step=6672.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  10%|▉         | 115/1208 [03:18<31:26,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.75e-5, train/loss_step=0.0103, global_step=6672.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  10%|▉         | 116/1208 [03:21<31:35,  1.74s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.75e-5, train/loss_step=0.0103, global_step=6672.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  10%|▉         | 116/1208 [03:21<31:35,  1.74s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0816, train/loss_vlb_step=0.00027, train/loss_step=0.0816, global_step=6672.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  10%|▉         | 117/1208 [03:22<31:26,  1.73s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0816, train/loss_vlb_step=0.00027, train/loss_step=0.0816, global_step=6672.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  10%|▉         | 117/1208 [03:22<31:26,  1.73s/it, loss=0.192, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00236, train/loss_step=0.370, global_step=6673.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  10%|▉         | 118/1208 [03:23<31:18,  1.72s/it, loss=0.192, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00236, train/loss_step=0.370, global_step=6673.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  10%|▉         | 118/1208 [03:23<31:18,  1.72s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0709, train/loss_vlb_step=0.000237, train/loss_step=0.0709, global_step=6673.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  10%|▉         | 119/1208 [03:24<31:10,  1.72s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0709, train/loss_vlb_step=0.000237, train/loss_step=0.0709, global_step=6673.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  10%|▉         | 119/1208 [03:24<31:10,  1.72s/it, loss=0.197, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.00053, train/loss_step=0.159, global_step=6673.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  10%|▉         | 120/1208 [03:27<31:18,  1.73s/it, loss=0.197, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.00053, train/loss_step=0.159, global_step=6673.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  10%|▉         | 120/1208 [03:27<31:18,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.000101, train/loss_step=0.0256, global_step=6673.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  10%|█         | 121/1208 [03:28<31:11,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.000101, train/loss_step=0.0256, global_step=6673.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  10%|█         | 121/1208 [03:28<31:11,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.070, train/loss_vlb_step=0.000232, train/loss_step=0.070, global_step=6674.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  10%|█         | 122/1208 [03:29<31:03,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.070, train/loss_vlb_step=0.000232, train/loss_step=0.070, global_step=6674.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  10%|█         | 122/1208 [03:29<31:03,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0617, train/loss_vlb_step=0.000216, train/loss_step=0.0617, global_step=6674.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  10%|█         | 123/1208 [03:30<30:55,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0617, train/loss_vlb_step=0.000216, train/loss_step=0.0617, global_step=6674.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  10%|█         | 123/1208 [03:30<30:55,  1.71s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0736, train/loss_vlb_step=0.000246, train/loss_step=0.0736, global_step=6674.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  10%|█         | 124/1208 [03:33<31:03,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0736, train/loss_vlb_step=0.000246, train/loss_step=0.0736, global_step=6674.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  10%|█         | 124/1208 [03:33<31:03,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00656, train/loss_vlb_step=3.27e-5, train/loss_step=0.00656, global_step=6674.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  10%|█         | 125/1208 [03:34<30:55,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00656, train/loss_vlb_step=3.27e-5, train/loss_step=0.00656, global_step=6674.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  10%|█         | 125/1208 [03:34<30:55,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000626, train/loss_step=0.183, global_step=6675.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  10%|█         | 126/1208 [03:35<30:47,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000626, train/loss_step=0.183, global_step=6675.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  10%|█         | 126/1208 [03:35<30:47,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000814, train/loss_step=0.229, global_step=6675.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  11%|█         | 127/1208 [03:36<30:40,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000814, train/loss_step=0.229, global_step=6675.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  11%|█         | 127/1208 [03:36<30:40,  1.70s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0294, train/loss_vlb_step=0.000115, train/loss_step=0.0294, global_step=6675.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  11%|█         | 128/1208 [03:39<30:48,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0294, train/loss_vlb_step=0.000115, train/loss_step=0.0294, global_step=6675.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  11%|█         | 128/1208 [03:39<30:48,  1.71s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000148, train/loss_step=0.0406, global_step=6675.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  11%|█         | 129/1208 [03:40<30:40,  1.71s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000148, train/loss_step=0.0406, global_step=6675.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  11%|█         | 129/1208 [03:40<30:40,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.703, train/loss_vlb_step=0.0332, train/loss_step=0.703, global_step=6676.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]     Epoch 22:  11%|█         | 130/1208 [03:41<30:33,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.703, train/loss_vlb_step=0.0332, train/loss_step=0.703, global_step=6676.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  11%|█         | 130/1208 [03:41<30:33,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000488, train/loss_step=0.148, global_step=6676.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  11%|█         | 131/1208 [03:42<30:26,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000488, train/loss_step=0.148, global_step=6676.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  11%|█         | 131/1208 [03:42<30:26,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000424, train/loss_step=0.129, global_step=6676.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  11%|█         | 132/1208 [03:44<30:33,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000424, train/loss_step=0.129, global_step=6676.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  11%|█         | 132/1208 [03:44<30:33,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00104, train/loss_step=0.255, global_step=6676.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  11%|█         | 133/1208 [03:46<30:26,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00104, train/loss_step=0.255, global_step=6676.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  11%|█         | 133/1208 [03:46<30:26,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000794, train/loss_step=0.205, global_step=6677.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  11%|█         | 134/1208 [03:47<30:19,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000794, train/loss_step=0.205, global_step=6677.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  11%|█         | 134/1208 [03:47<30:19,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00174, train/loss_step=0.339, global_step=6677.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  11%|█         | 135/1208 [03:48<30:12,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00174, train/loss_step=0.339, global_step=6677.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  11%|█         | 135/1208 [03:48<30:12,  1.69s/it, loss=0.164, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000337, train/loss_step=0.102, global_step=6677.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  11%|█▏        | 136/1208 [03:50<30:20,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000337, train/loss_step=0.102, global_step=6677.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  11%|█▏        | 136/1208 [03:50<30:20,  1.70s/it, loss=0.172, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.00093, train/loss_step=0.233, global_step=6677.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  11%|█▏        | 137/1208 [03:51<30:13,  1.69s/it, loss=0.172, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.00093, train/loss_step=0.233, global_step=6677.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  11%|█▏        | 137/1208 [03:51<30:13,  1.69s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0355, train/loss_vlb_step=0.000132, train/loss_step=0.0355, global_step=6678.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  11%|█▏        | 138/1208 [03:52<30:06,  1.69s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0355, train/loss_vlb_step=0.000132, train/loss_step=0.0355, global_step=6678.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  11%|█▏        | 138/1208 [03:52<30:06,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00422, train/loss_vlb_step=2.28e-5, train/loss_step=0.00422, global_step=6678.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  12%|█▏        | 139/1208 [03:53<29:59,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00422, train/loss_vlb_step=2.28e-5, train/loss_step=0.00422, global_step=6678.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  12%|█▏        | 139/1208 [03:53<29:59,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0763, train/loss_vlb_step=0.000257, train/loss_step=0.0763, global_step=6678.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  12%|█▏        | 140/1208 [03:56<30:06,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0763, train/loss_vlb_step=0.000257, train/loss_step=0.0763, global_step=6678.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  12%|█▏        | 140/1208 [03:56<30:06,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00624, train/loss_vlb_step=3.14e-5, train/loss_step=0.00624, global_step=6678.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  12%|█▏        | 141/1208 [03:57<29:59,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00624, train/loss_vlb_step=3.14e-5, train/loss_step=0.00624, global_step=6678.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  12%|█▏        | 141/1208 [03:57<29:59,  1.69s/it, loss=0.168, v_num=0, train/loss_simple_step=0.508, train/loss_vlb_step=0.00385, train/loss_step=0.508, global_step=6679.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  12%|█▏        | 142/1208 [03:58<29:53,  1.68s/it, loss=0.168, v_num=0, train/loss_simple_step=0.508, train/loss_vlb_step=0.00385, train/loss_step=0.508, global_step=6679.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  12%|█▏        | 142/1208 [03:58<29:53,  1.68s/it, loss=0.174, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.00059, train/loss_step=0.178, global_step=6679.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  12%|█▏        | 143/1208 [03:59<29:46,  1.68s/it, loss=0.174, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.00059, train/loss_step=0.178, global_step=6679.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  12%|█▏        | 143/1208 [03:59<29:46,  1.68s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.000165, train/loss_step=0.0462, global_step=6679.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  12%|█▏        | 144/1208 [04:02<29:53,  1.69s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.000165, train/loss_step=0.0462, global_step=6679.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  12%|█▏        | 144/1208 [04:02<29:53,  1.69s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00781, train/loss_vlb_step=3.96e-5, train/loss_step=0.00781, global_step=6679.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  12%|█▏        | 145/1208 [04:03<29:46,  1.68s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00781, train/loss_vlb_step=3.96e-5, train/loss_step=0.00781, global_step=6679.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  12%|█▏        | 145/1208 [04:03<29:47,  1.68s/it, loss=0.181, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00242, train/loss_step=0.353, global_step=6680.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  12%|█▏        | 146/1208 [04:04<29:40,  1.68s/it, loss=0.181, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00242, train/loss_step=0.353, global_step=6680.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  12%|█▏        | 146/1208 [04:04<29:40,  1.68s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000108, train/loss_step=0.0281, global_step=6680.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  12%|█▏        | 147/1208 [04:05<29:34,  1.67s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000108, train/loss_step=0.0281, global_step=6680.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  12%|█▏        | 147/1208 [04:05<29:34,  1.67s/it, loss=0.183, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00104, train/loss_step=0.259, global_step=6680.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  12%|█▏        | 148/1208 [04:08<29:40,  1.68s/it, loss=0.183, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00104, train/loss_step=0.259, global_step=6680.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  12%|█▏        | 148/1208 [04:08<29:40,  1.68s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.2e-5, train/loss_step=0.0148, global_step=6680.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  12%|█▏        | 149/1208 [04:09<29:34,  1.68s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.2e-5, train/loss_step=0.0148, global_step=6680.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  12%|█▏        | 149/1208 [04:09<29:34,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=6681.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  12%|█▏        | 150/1208 [04:10<29:28,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=6681.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  12%|█▏        | 150/1208 [04:10<29:28,  1.67s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.64e-5, train/loss_step=0.0237, global_step=6681.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  12%|█▎        | 151/1208 [04:11<29:21,  1.67s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.64e-5, train/loss_step=0.0237, global_step=6681.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  12%|█▎        | 151/1208 [04:11<29:21,  1.67s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.000178, train/loss_step=0.0527, global_step=6681.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  13%|█▎        | 152/1208 [04:14<29:28,  1.67s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.000178, train/loss_step=0.0527, global_step=6681.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  13%|█▎        | 152/1208 [04:14<29:28,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.24e-5, train/loss_step=0.0115, global_step=6681.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  13%|█▎        | 153/1208 [04:15<29:22,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.24e-5, train/loss_step=0.0115, global_step=6681.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  13%|█▎        | 153/1208 [04:15<29:22,  1.67s/it, loss=0.124, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000313, train/loss_step=0.095, global_step=6682.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  13%|█▎        | 154/1208 [04:16<29:16,  1.67s/it, loss=0.124, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000313, train/loss_step=0.095, global_step=6682.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  13%|█▎        | 154/1208 [04:16<29:16,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=6682.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  13%|█▎        | 155/1208 [04:17<29:09,  1.66s/it, loss=0.114, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=6682.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  13%|█▎        | 155/1208 [04:17<29:09,  1.66s/it, loss=0.114, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=6682.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  13%|█▎        | 156/1208 [04:20<29:16,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=6682.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  13%|█▎        | 156/1208 [04:20<29:16,  1.67s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000105, train/loss_step=0.0264, global_step=6682.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  13%|█▎        | 157/1208 [04:21<29:10,  1.67s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000105, train/loss_step=0.0264, global_step=6682.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  13%|█▎        | 157/1208 [04:21<29:10,  1.67s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=0.000101, train/loss_step=0.0244, global_step=6683.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  13%|█▎        | 158/1208 [04:22<29:04,  1.66s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=0.000101, train/loss_step=0.0244, global_step=6683.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  13%|█▎        | 158/1208 [04:22<29:04,  1.66s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.00013, train/loss_step=0.0351, global_step=6683.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  13%|█▎        | 159/1208 [04:23<28:58,  1.66s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.00013, train/loss_step=0.0351, global_step=6683.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  13%|█▎        | 159/1208 [04:23<28:58,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.640, train/loss_vlb_step=0.0134, train/loss_step=0.640, global_step=6683.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  13%|█▎        | 160/1208 [04:26<29:04,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.640, train/loss_vlb_step=0.0134, train/loss_step=0.640, global_step=6683.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  13%|█▎        | 160/1208 [04:26<29:04,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.00057, train/loss_step=0.166, global_step=6683.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  13%|█▎        | 161/1208 [04:27<28:58,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.00057, train/loss_step=0.166, global_step=6683.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  13%|█▎        | 161/1208 [04:27<28:58,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00473, train/loss_vlb_step=2.42e-5, train/loss_step=0.00473, global_step=6684.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  13%|█▎        | 162/1208 [04:28<28:52,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00473, train/loss_vlb_step=2.42e-5, train/loss_step=0.00473, global_step=6684.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  13%|█▎        | 162/1208 [04:28<28:53,  1.66s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=2.26e-5, train/loss_step=0.00416, global_step=6684.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  13%|█▎        | 163/1208 [04:29<28:47,  1.65s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=2.26e-5, train/loss_step=0.00416, global_step=6684.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  13%|█▎        | 163/1208 [04:29<28:47,  1.65s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.66e-5, train/loss_step=0.0173, global_step=6684.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  14%|█▎        | 164/1208 [04:32<28:53,  1.66s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.66e-5, train/loss_step=0.0173, global_step=6684.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  14%|█▎        | 164/1208 [04:32<28:53,  1.66s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0091, train/loss_vlb_step=4.26e-5, train/loss_step=0.0091, global_step=6684.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  14%|█▎        | 165/1208 [04:33<28:47,  1.66s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0091, train/loss_vlb_step=4.26e-5, train/loss_step=0.0091, global_step=6684.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  14%|█▎        | 165/1208 [04:33<28:47,  1.66s/it, loss=0.0879, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=1.88e-5, train/loss_step=0.00322, global_step=6685.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  14%|█▎        | 166/1208 [04:34<28:41,  1.65s/it, loss=0.0879, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=1.88e-5, train/loss_step=0.00322, global_step=6685.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  14%|█▎        | 166/1208 [04:34<28:41,  1.65s/it, loss=0.0879, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000112, train/loss_step=0.0278, global_step=6685.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  14%|█▍        | 167/1208 [04:35<28:36,  1.65s/it, loss=0.0879, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000112, train/loss_step=0.0278, global_step=6685.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  14%|█▍        | 167/1208 [04:35<28:36,  1.65s/it, loss=0.0754, v_num=0, train/loss_simple_step=0.00913, train/loss_vlb_step=4.25e-5, train/loss_step=0.00913, global_step=6685.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  14%|█▍        | 168/1208 [04:38<28:42,  1.66s/it, loss=0.0754, v_num=0, train/loss_simple_step=0.00913, train/loss_vlb_step=4.25e-5, train/loss_step=0.00913, global_step=6685.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  14%|█▍        | 168/1208 [04:38<28:42,  1.66s/it, loss=0.0747, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=1.31e-5, train/loss_step=0.00227, global_step=6685.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  14%|█▍        | 169/1208 [04:39<28:36,  1.65s/it, loss=0.0747, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=1.31e-5, train/loss_step=0.00227, global_step=6685.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  14%|█▍        | 169/1208 [04:39<28:36,  1.65s/it, loss=0.077, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000541, train/loss_step=0.161, global_step=6686.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  14%|█▍        | 170/1208 [04:40<28:31,  1.65s/it, loss=0.077, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000541, train/loss_step=0.161, global_step=6686.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  14%|█▍        | 170/1208 [04:40<28:31,  1.65s/it, loss=0.0945, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00258, train/loss_step=0.374, global_step=6686.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  14%|█▍        | 171/1208 [04:41<28:25,  1.64s/it, loss=0.0945, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00258, train/loss_step=0.374, global_step=6686.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  14%|█▍        | 171/1208 [04:41<28:25,  1.64s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000447, train/loss_step=0.134, global_step=6686.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  14%|█▍        | 172/1208 [04:44<28:31,  1.65s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000447, train/loss_step=0.134, global_step=6686.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  14%|█▍        | 172/1208 [04:44<28:31,  1.65s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.000224, train/loss_step=0.0665, global_step=6686.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  14%|█▍        | 173/1208 [04:45<28:25,  1.65s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.000224, train/loss_step=0.0665, global_step=6686.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  14%|█▍        | 173/1208 [04:45<28:25,  1.65s/it, loss=0.105, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000558, train/loss_step=0.162, global_step=6687.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  14%|█▍        | 174/1208 [04:46<28:20,  1.64s/it, loss=0.105, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000558, train/loss_step=0.162, global_step=6687.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  14%|█▍        | 174/1208 [04:46<28:20,  1.64s/it, loss=0.114, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00142, train/loss_step=0.309, global_step=6687.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  14%|█▍        | 175/1208 [04:47<28:15,  1.64s/it, loss=0.114, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00142, train/loss_step=0.309, global_step=6687.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  14%|█▍        | 175/1208 [04:47<28:15,  1.64s/it, loss=0.114, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000357, train/loss_step=0.109, global_step=6687.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  15%|█▍        | 176/1208 [04:50<28:20,  1.65s/it, loss=0.114, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000357, train/loss_step=0.109, global_step=6687.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  15%|█▍        | 176/1208 [04:50<28:20,  1.65s/it, loss=0.124, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000813, train/loss_step=0.230, global_step=6687.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  15%|█▍        | 177/1208 [04:51<28:15,  1.64s/it, loss=0.124, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000813, train/loss_step=0.230, global_step=6687.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  15%|█▍        | 177/1208 [04:51<28:15,  1.64s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.88e-5, train/loss_step=0.0107, global_step=6688.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  15%|█▍        | 178/1208 [04:52<28:10,  1.64s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.88e-5, train/loss_step=0.0107, global_step=6688.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  15%|█▍        | 178/1208 [04:52<28:10,  1.64s/it, loss=0.142, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00259, train/loss_step=0.402, global_step=6688.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  15%|█▍        | 179/1208 [04:53<28:04,  1.64s/it, loss=0.142, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00259, train/loss_step=0.402, global_step=6688.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  15%|█▍        | 179/1208 [04:53<28:04,  1.64s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=8.88e-5, train/loss_step=0.0222, global_step=6688.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  15%|█▍        | 180/1208 [04:55<28:10,  1.64s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=8.88e-5, train/loss_step=0.0222, global_step=6688.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  15%|█▍        | 180/1208 [04:55<28:10,  1.64s/it, loss=0.117, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00175, train/loss_step=0.286, global_step=6688.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  15%|█▍        | 181/1208 [04:56<28:05,  1.64s/it, loss=0.117, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00175, train/loss_step=0.286, global_step=6688.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  15%|█▍        | 181/1208 [04:56<28:05,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000389, train/loss_step=0.117, global_step=6689.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  15%|█▌        | 182/1208 [04:58<27:59,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000389, train/loss_step=0.117, global_step=6689.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  15%|█▌        | 182/1208 [04:58<27:59,  1.64s/it, loss=0.13, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000524, train/loss_step=0.154, global_step=6689.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  15%|█▌        | 183/1208 [04:59<27:54,  1.63s/it, loss=0.13, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000524, train/loss_step=0.154, global_step=6689.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  15%|█▌        | 183/1208 [04:59<27:54,  1.63s/it, loss=0.151, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00354, train/loss_step=0.432, global_step=6689.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  15%|█▌        | 184/1208 [05:01<27:59,  1.64s/it, loss=0.151, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00354, train/loss_step=0.432, global_step=6689.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  15%|█▌        | 184/1208 [05:01<28:00,  1.64s/it, loss=0.166, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00152, train/loss_step=0.302, global_step=6689.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  15%|█▌        | 185/1208 [05:02<27:54,  1.64s/it, loss=0.166, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00152, train/loss_step=0.302, global_step=6689.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  15%|█▌        | 185/1208 [05:02<27:54,  1.64s/it, loss=0.171, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=6690.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  15%|█▌        | 186/1208 [05:03<27:49,  1.63s/it, loss=0.171, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=6690.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  15%|█▌        | 186/1208 [05:03<27:49,  1.63s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.15e-5, train/loss_step=0.00197, global_step=6690.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  15%|█▌        | 187/1208 [05:04<27:44,  1.63s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.15e-5, train/loss_step=0.00197, global_step=6690.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  15%|█▌        | 187/1208 [05:04<27:44,  1.63s/it, loss=0.17, v_num=0, train/loss_simple_step=0.030, train/loss_vlb_step=0.000114, train/loss_step=0.030, global_step=6690.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  16%|█▌        | 188/1208 [05:07<27:49,  1.64s/it, loss=0.17, v_num=0, train/loss_simple_step=0.030, train/loss_vlb_step=0.000114, train/loss_step=0.030, global_step=6690.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  16%|█▌        | 188/1208 [05:07<27:50,  1.64s/it, loss=0.178, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.00055, train/loss_step=0.161, global_step=6690.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  16%|█▌        | 189/1208 [05:08<27:45,  1.63s/it, loss=0.178, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.00055, train/loss_step=0.161, global_step=6690.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  16%|█▌        | 189/1208 [05:08<27:45,  1.63s/it, loss=0.197, v_num=0, train/loss_simple_step=0.539, train/loss_vlb_step=0.00958, train/loss_step=0.539, global_step=6691.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  16%|█▌        | 190/1208 [05:09<27:40,  1.63s/it, loss=0.197, v_num=0, train/loss_simple_step=0.539, train/loss_vlb_step=0.00958, train/loss_step=0.539, global_step=6691.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  16%|█▌        | 190/1208 [05:09<27:40,  1.63s/it, loss=0.185, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000426, train/loss_step=0.128, global_step=6691.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  16%|█▌        | 191/1208 [05:10<27:35,  1.63s/it, loss=0.185, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000426, train/loss_step=0.128, global_step=6691.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  16%|█▌        | 191/1208 [05:10<27:35,  1.63s/it, loss=0.183, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000338, train/loss_step=0.103, global_step=6691.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  16%|█▌        | 192/1208 [05:13<27:40,  1.63s/it, loss=0.183, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000338, train/loss_step=0.103, global_step=6691.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  16%|█▌        | 192/1208 [05:13<27:40,  1.63s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0948, train/loss_vlb_step=0.000312, train/loss_step=0.0948, global_step=6691.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  16%|█▌        | 193/1208 [05:14<27:35,  1.63s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0948, train/loss_vlb_step=0.000312, train/loss_step=0.0948, global_step=6691.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  16%|█▌        | 193/1208 [05:14<27:35,  1.63s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.91e-5, train/loss_step=0.0159, global_step=6692.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  16%|█▌        | 194/1208 [05:15<27:30,  1.63s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.91e-5, train/loss_step=0.0159, global_step=6692.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  16%|█▌        | 194/1208 [05:15<27:30,  1.63s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.53e-5, train/loss_step=0.0116, global_step=6692.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  16%|█▌        | 195/1208 [05:16<27:25,  1.62s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.53e-5, train/loss_step=0.0116, global_step=6692.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  16%|█▌        | 195/1208 [05:16<27:25,  1.62s/it, loss=0.172, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00145, train/loss_step=0.293, global_step=6692.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  16%|█▌        | 196/1208 [05:19<27:30,  1.63s/it, loss=0.172, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00145, train/loss_step=0.293, global_step=6692.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  16%|█▌        | 196/1208 [05:19<27:30,  1.63s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.66e-5, train/loss_step=0.0185, global_step=6692.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  16%|█▋        | 197/1208 [05:20<27:25,  1.63s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.66e-5, train/loss_step=0.0185, global_step=6692.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  16%|█▋        | 197/1208 [05:20<27:25,  1.63s/it, loss=0.168, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000518, train/loss_step=0.153, global_step=6693.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  16%|█▋        | 198/1208 [05:21<27:20,  1.62s/it, loss=0.168, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000518, train/loss_step=0.153, global_step=6693.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  16%|█▋        | 198/1208 [05:21<27:20,  1.62s/it, loss=0.16, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000842, train/loss_step=0.228, global_step=6693.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  16%|█▋        | 199/1208 [05:22<27:16,  1.62s/it, loss=0.16, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000842, train/loss_step=0.228, global_step=6693.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  16%|█▋        | 199/1208 [05:22<27:16,  1.62s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0812, train/loss_vlb_step=0.000274, train/loss_step=0.0812, global_step=6693.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  17%|█▋        | 200/1208 [05:25<27:22,  1.63s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0812, train/loss_vlb_step=0.000274, train/loss_step=0.0812, global_step=6693.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  17%|█▋        | 200/1208 [05:25<27:22,  1.63s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00648, train/loss_vlb_step=3.5e-5, train/loss_step=0.00648, global_step=6693.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  17%|█▋        | 201/1208 [05:26<27:17,  1.63s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00648, train/loss_vlb_step=3.5e-5, train/loss_step=0.00648, global_step=6693.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  17%|█▋        | 201/1208 [05:26<27:18,  1.63s/it, loss=0.148, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=6694.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  17%|█▋        | 202/1208 [05:28<27:13,  1.62s/it, loss=0.148, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=6694.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  17%|█▋        | 202/1208 [05:28<27:13,  1.62s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.000147, train/loss_step=0.0401, global_step=6694.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  17%|█▋        | 203/1208 [05:29<27:09,  1.62s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.000147, train/loss_step=0.0401, global_step=6694.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  17%|█▋        | 203/1208 [05:29<27:09,  1.62s/it, loss=0.128, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000508, train/loss_step=0.151, global_step=6694.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  17%|█▋        | 204/1208 [05:32<27:15,  1.63s/it, loss=0.128, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000508, train/loss_step=0.151, global_step=6694.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  17%|█▋        | 204/1208 [05:32<27:15,  1.63s/it, loss=0.122, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000615, train/loss_step=0.176, global_step=6694.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  17%|█▋        | 205/1208 [05:33<27:10,  1.63s/it, loss=0.122, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000615, train/loss_step=0.176, global_step=6694.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  17%|█▋        | 205/1208 [05:33<27:10,  1.63s/it, loss=0.146, v_num=0, train/loss_simple_step=0.583, train/loss_vlb_step=0.00906, train/loss_step=0.583, global_step=6695.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  17%|█▋        | 206/1208 [05:34<27:06,  1.62s/it, loss=0.146, v_num=0, train/loss_simple_step=0.583, train/loss_vlb_step=0.00906, train/loss_step=0.583, global_step=6695.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  17%|█▋        | 206/1208 [05:34<27:06,  1.62s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000106, train/loss_step=0.0262, global_step=6695.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  17%|█▋        | 207/1208 [05:35<27:01,  1.62s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000106, train/loss_step=0.0262, global_step=6695.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  17%|█▋        | 207/1208 [05:35<27:01,  1.62s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.06e-5, train/loss_step=0.0115, global_step=6695.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  17%|█▋        | 208/1208 [05:38<27:07,  1.63s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.06e-5, train/loss_step=0.0115, global_step=6695.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  17%|█▋        | 208/1208 [05:38<27:07,  1.63s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0548, train/loss_vlb_step=0.000184, train/loss_step=0.0548, global_step=6695.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  17%|█▋        | 209/1208 [05:39<27:03,  1.63s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0548, train/loss_vlb_step=0.000184, train/loss_step=0.0548, global_step=6695.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  17%|█▋        | 209/1208 [05:39<27:03,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.00066, train/loss_step=0.191, global_step=6696.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  17%|█▋        | 210/1208 [05:40<26:59,  1.62s/it, loss=0.123, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.00066, train/loss_step=0.191, global_step=6696.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  17%|█▋        | 210/1208 [05:40<26:59,  1.62s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.39e-5, train/loss_step=0.0198, global_step=6696.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  17%|█▋        | 211/1208 [05:41<26:54,  1.62s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.39e-5, train/loss_step=0.0198, global_step=6696.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  17%|█▋        | 211/1208 [05:41<26:54,  1.62s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00411, train/loss_vlb_step=2.19e-5, train/loss_step=0.00411, global_step=6696.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  18%|█▊        | 212/1208 [05:44<27:00,  1.63s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00411, train/loss_vlb_step=2.19e-5, train/loss_step=0.00411, global_step=6696.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  18%|█▊        | 212/1208 [05:44<27:00,  1.63s/it, loss=0.144, v_num=0, train/loss_simple_step=0.715, train/loss_vlb_step=0.0729, train/loss_step=0.715, global_step=6696.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]     Epoch 22:  18%|█▊        | 213/1208 [05:46<26:56,  1.62s/it, loss=0.144, v_num=0, train/loss_simple_step=0.715, train/loss_vlb_step=0.0729, train/loss_step=0.715, global_step=6696.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  18%|█▊        | 213/1208 [05:46<26:56,  1.62s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.26e-5, train/loss_step=0.00213, global_step=6697.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  18%|█▊        | 214/1208 [05:47<26:51,  1.62s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.26e-5, train/loss_step=0.00213, global_step=6697.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  18%|█▊        | 214/1208 [05:47<26:51,  1.62s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.000173, train/loss_step=0.0483, global_step=6697.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  18%|█▊        | 215/1208 [05:48<26:47,  1.62s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.000173, train/loss_step=0.0483, global_step=6697.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  18%|█▊        | 215/1208 [05:48<26:47,  1.62s/it, loss=0.136, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000351, train/loss_step=0.107, global_step=6697.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  18%|█▊        | 216/1208 [05:51<26:53,  1.63s/it, loss=0.136, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000351, train/loss_step=0.107, global_step=6697.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  18%|█▊        | 216/1208 [05:51<26:53,  1.63s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=9.81e-6, train/loss_step=0.00164, global_step=6697.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  18%|█▊        | 217/1208 [05:52<26:49,  1.62s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=9.81e-6, train/loss_step=0.00164, global_step=6697.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  18%|█▊        | 217/1208 [05:52<26:49,  1.62s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00911, train/loss_vlb_step=4.49e-5, train/loss_step=0.00911, global_step=6698.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  18%|█▊        | 218/1208 [05:53<26:45,  1.62s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00911, train/loss_vlb_step=4.49e-5, train/loss_step=0.00911, global_step=6698.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  18%|█▊        | 218/1208 [05:53<26:45,  1.62s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0533, train/loss_vlb_step=0.00018, train/loss_step=0.0533, global_step=6698.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  18%|█▊        | 219/1208 [05:54<26:40,  1.62s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0533, train/loss_vlb_step=0.00018, train/loss_step=0.0533, global_step=6698.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  18%|█▊        | 219/1208 [05:54<26:40,  1.62s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=8.12e-5, train/loss_step=0.0192, global_step=6698.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  18%|█▊        | 220/1208 [05:57<26:46,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=8.12e-5, train/loss_step=0.0192, global_step=6698.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  18%|█▊        | 220/1208 [05:57<26:46,  1.63s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0565, train/loss_vlb_step=0.000197, train/loss_step=0.0565, global_step=6698.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  18%|█▊        | 221/1208 [05:58<26:42,  1.62s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0565, train/loss_vlb_step=0.000197, train/loss_step=0.0565, global_step=6698.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  18%|█▊        | 221/1208 [05:58<26:42,  1.62s/it, loss=0.134, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00266, train/loss_step=0.404, global_step=6699.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  18%|█▊        | 222/1208 [05:59<26:37,  1.62s/it, loss=0.134, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00266, train/loss_step=0.404, global_step=6699.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  18%|█▊        | 222/1208 [05:59<26:37,  1.62s/it, loss=0.148, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00174, train/loss_step=0.321, global_step=6699.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  18%|█▊        | 223/1208 [06:00<26:33,  1.62s/it, loss=0.148, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00174, train/loss_step=0.321, global_step=6699.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  18%|█▊        | 223/1208 [06:00<26:33,  1.62s/it, loss=0.153, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00111, train/loss_step=0.249, global_step=6699.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  19%|█▊        | 224/1208 [06:03<26:38,  1.62s/it, loss=0.153, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00111, train/loss_step=0.249, global_step=6699.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  19%|█▊        | 224/1208 [06:03<26:38,  1.62s/it, loss=0.172, v_num=0, train/loss_simple_step=0.563, train/loss_vlb_step=0.00874, train/loss_step=0.563, global_step=6699.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  19%|█▊        | 225/1208 [06:05<26:34,  1.62s/it, loss=0.172, v_num=0, train/loss_simple_step=0.563, train/loss_vlb_step=0.00874, train/loss_step=0.563, global_step=6699.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  19%|█▊        | 225/1208 [06:05<26:34,  1.62s/it, loss=0.163, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00298, train/loss_step=0.411, global_step=6700.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  19%|█▊        | 226/1208 [06:06<26:30,  1.62s/it, loss=0.163, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00298, train/loss_step=0.411, global_step=6700.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  19%|█▊        | 226/1208 [06:06<26:30,  1.62s/it, loss=0.165, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.000223, train/loss_step=0.067, global_step=6700.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  19%|█▉        | 227/1208 [06:07<26:26,  1.62s/it, loss=0.165, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.000223, train/loss_step=0.067, global_step=6700.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  19%|█▉        | 227/1208 [06:07<26:26,  1.62s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000126, train/loss_step=0.0333, global_step=6700.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  19%|█▉        | 228/1208 [06:10<26:31,  1.62s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000126, train/loss_step=0.0333, global_step=6700.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  19%|█▉        | 228/1208 [06:10<26:31,  1.62s/it, loss=0.173, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000683, train/loss_step=0.191, global_step=6700.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  19%|█▉        | 229/1208 [06:11<26:27,  1.62s/it, loss=0.173, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000683, train/loss_step=0.191, global_step=6700.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  19%|█▉        | 229/1208 [06:11<26:27,  1.62s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00949, train/loss_vlb_step=4.47e-5, train/loss_step=0.00949, global_step=6701.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  19%|█▉        | 230/1208 [06:12<26:23,  1.62s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00949, train/loss_vlb_step=4.47e-5, train/loss_step=0.00949, global_step=6701.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  19%|█▉        | 230/1208 [06:12<26:23,  1.62s/it, loss=0.171, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.00049, train/loss_step=0.145, global_step=6701.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  19%|█▉        | 231/1208 [06:13<26:19,  1.62s/it, loss=0.171, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.00049, train/loss_step=0.145, global_step=6701.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  19%|█▉        | 231/1208 [06:13<26:19,  1.62s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.34e-5, train/loss_step=0.00233, global_step=6701.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  19%|█▉        | 232/1208 [06:16<26:22,  1.62s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.34e-5, train/loss_step=0.00233, global_step=6701.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  19%|█▉        | 232/1208 [06:16<26:22,  1.62s/it, loss=0.158, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.00417, train/loss_step=0.470, global_step=6701.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  19%|█▉        | 233/1208 [06:17<26:18,  1.62s/it, loss=0.158, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.00417, train/loss_step=0.470, global_step=6701.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  19%|█▉        | 233/1208 [06:17<26:18,  1.62s/it, loss=0.166, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000517, train/loss_step=0.153, global_step=6702.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  19%|█▉        | 234/1208 [06:18<26:14,  1.62s/it, loss=0.166, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000517, train/loss_step=0.153, global_step=6702.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  19%|█▉        | 234/1208 [06:18<26:14,  1.62s/it, loss=0.176, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00118, train/loss_step=0.250, global_step=6702.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  19%|█▉        | 235/1208 [06:19<26:10,  1.61s/it, loss=0.176, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00118, train/loss_step=0.250, global_step=6702.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  19%|█▉        | 235/1208 [06:19<26:10,  1.61s/it, loss=0.181, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000812, train/loss_step=0.219, global_step=6702.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  20%|█▉        | 236/1208 [06:22<26:13,  1.62s/it, loss=0.181, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000812, train/loss_step=0.219, global_step=6702.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  20%|█▉        | 236/1208 [06:22<26:13,  1.62s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=2.34e-5, train/loss_step=0.00471, global_step=6702.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  20%|█▉        | 237/1208 [06:23<26:09,  1.62s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=2.34e-5, train/loss_step=0.00471, global_step=6702.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  20%|█▉        | 237/1208 [06:23<26:09,  1.62s/it, loss=0.19, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000622, train/loss_step=0.177, global_step=6703.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  20%|█▉        | 238/1208 [06:24<26:05,  1.61s/it, loss=0.19, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000622, train/loss_step=0.177, global_step=6703.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  20%|█▉        | 238/1208 [06:24<26:05,  1.61s/it, loss=0.188, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.87e-5, train/loss_step=0.011, global_step=6703.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  20%|█▉        | 239/1208 [06:25<26:01,  1.61s/it, loss=0.188, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.87e-5, train/loss_step=0.011, global_step=6703.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  20%|█▉        | 239/1208 [06:25<26:01,  1.61s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000136, train/loss_step=0.0374, global_step=6703.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  20%|█▉        | 240/1208 [06:28<26:05,  1.62s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000136, train/loss_step=0.0374, global_step=6703.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  20%|█▉        | 240/1208 [06:28<26:05,  1.62s/it, loss=0.199, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00115, train/loss_step=0.265, global_step=6703.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  20%|█▉        | 241/1208 [06:29<26:01,  1.61s/it, loss=0.199, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00115, train/loss_step=0.265, global_step=6703.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  20%|█▉        | 241/1208 [06:29<26:01,  1.61s/it, loss=0.189, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000763, train/loss_step=0.205, global_step=6704.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  20%|██        | 242/1208 [06:30<25:57,  1.61s/it, loss=0.189, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000763, train/loss_step=0.205, global_step=6704.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  20%|██        | 242/1208 [06:30<25:57,  1.61s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0878, train/loss_vlb_step=0.00029, train/loss_step=0.0878, global_step=6704.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  20%|██        | 243/1208 [06:31<25:53,  1.61s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0878, train/loss_vlb_step=0.00029, train/loss_step=0.0878, global_step=6704.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  20%|██        | 243/1208 [06:31<25:53,  1.61s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000146, train/loss_step=0.0387, global_step=6704.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  20%|██        | 244/1208 [06:33<25:56,  1.61s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000146, train/loss_step=0.0387, global_step=6704.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  20%|██        | 244/1208 [06:33<25:56,  1.61s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.44e-5, train/loss_step=0.0207, global_step=6704.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  20%|██        | 245/1208 [06:34<25:52,  1.61s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.44e-5, train/loss_step=0.0207, global_step=6704.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  20%|██        | 245/1208 [06:34<25:52,  1.61s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.36e-5, train/loss_step=0.0144, global_step=6705.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  20%|██        | 246/1208 [06:36<25:48,  1.61s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.36e-5, train/loss_step=0.0144, global_step=6705.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  20%|██        | 246/1208 [06:36<25:48,  1.61s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000104, train/loss_step=0.0269, global_step=6705.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  20%|██        | 247/1208 [06:37<25:44,  1.61s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000104, train/loss_step=0.0269, global_step=6705.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  20%|██        | 247/1208 [06:37<25:44,  1.61s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0691, train/loss_vlb_step=0.000232, train/loss_step=0.0691, global_step=6705.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  21%|██        | 248/1208 [06:39<25:47,  1.61s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0691, train/loss_vlb_step=0.000232, train/loss_step=0.0691, global_step=6705.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  21%|██        | 248/1208 [06:39<25:47,  1.61s/it, loss=0.131, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00307, train/loss_step=0.409, global_step=6705.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  21%|██        | 249/1208 [06:40<25:44,  1.61s/it, loss=0.131, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00307, train/loss_step=0.409, global_step=6705.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  21%|██        | 249/1208 [06:40<25:44,  1.61s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.0001, train/loss_step=0.0255, global_step=6706.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  21%|██        | 250/1208 [06:41<25:40,  1.61s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.0001, train/loss_step=0.0255, global_step=6706.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  21%|██        | 250/1208 [06:41<25:40,  1.61s/it, loss=0.15, v_num=0, train/loss_simple_step=0.511, train/loss_vlb_step=0.0103, train/loss_step=0.511, global_step=6706.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  21%|██        | 251/1208 [06:42<25:36,  1.61s/it, loss=0.15, v_num=0, train/loss_simple_step=0.511, train/loss_vlb_step=0.0103, train/loss_step=0.511, global_step=6706.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  21%|██        | 251/1208 [06:42<25:36,  1.61s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00511, train/loss_vlb_step=2.68e-5, train/loss_step=0.00511, global_step=6706.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  21%|██        | 252/1208 [06:45<25:39,  1.61s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00511, train/loss_vlb_step=2.68e-5, train/loss_step=0.00511, global_step=6706.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  21%|██        | 252/1208 [06:45<25:39,  1.61s/it, loss=0.134, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000506, train/loss_step=0.149, global_step=6706.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  21%|██        | 253/1208 [06:46<25:35,  1.61s/it, loss=0.134, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000506, train/loss_step=0.149, global_step=6706.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  21%|██        | 253/1208 [06:46<25:35,  1.61s/it, loss=0.144, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.00259, train/loss_step=0.360, global_step=6707.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  21%|██        | 254/1208 [06:47<25:31,  1.61s/it, loss=0.144, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.00259, train/loss_step=0.360, global_step=6707.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  21%|██        | 254/1208 [06:47<25:31,  1.61s/it, loss=0.138, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000383, train/loss_step=0.116, global_step=6707.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  21%|██        | 255/1208 [06:48<25:27,  1.60s/it, loss=0.138, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000383, train/loss_step=0.116, global_step=6707.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  21%|██        | 255/1208 [06:48<25:27,  1.60s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.19e-5, train/loss_step=0.00204, global_step=6707.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  21%|██        | 256/1208 [06:51<25:31,  1.61s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.19e-5, train/loss_step=0.00204, global_step=6707.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  21%|██        | 256/1208 [06:51<25:31,  1.61s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00654, train/loss_vlb_step=3.06e-5, train/loss_step=0.00654, global_step=6707.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  21%|██▏       | 257/1208 [06:52<25:27,  1.61s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00654, train/loss_vlb_step=3.06e-5, train/loss_step=0.00654, global_step=6707.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  21%|██▏       | 257/1208 [06:52<25:27,  1.61s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00415, train/loss_vlb_step=2.14e-5, train/loss_step=0.00415, global_step=6708.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  21%|██▏       | 258/1208 [06:53<25:23,  1.60s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00415, train/loss_vlb_step=2.14e-5, train/loss_step=0.00415, global_step=6708.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  21%|██▏       | 258/1208 [06:53<25:23,  1.60s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000273, train/loss_step=0.0815, global_step=6708.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  21%|██▏       | 259/1208 [06:54<25:19,  1.60s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000273, train/loss_step=0.0815, global_step=6708.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  21%|██▏       | 259/1208 [06:54<25:19,  1.60s/it, loss=0.122, v_num=0, train/loss_simple_step=0.040, train/loss_vlb_step=0.000147, train/loss_step=0.040, global_step=6708.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  22%|██▏       | 260/1208 [06:57<25:22,  1.61s/it, loss=0.122, v_num=0, train/loss_simple_step=0.040, train/loss_vlb_step=0.000147, train/loss_step=0.040, global_step=6708.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  22%|██▏       | 260/1208 [06:57<25:22,  1.61s/it, loss=0.122, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00122, train/loss_step=0.267, global_step=6708.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  22%|██▏       | 261/1208 [06:58<25:19,  1.60s/it, loss=0.122, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00122, train/loss_step=0.267, global_step=6708.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  22%|██▏       | 261/1208 [06:58<25:19,  1.60s/it, loss=0.143, v_num=0, train/loss_simple_step=0.634, train/loss_vlb_step=0.0408, train/loss_step=0.634, global_step=6709.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  22%|██▏       | 262/1208 [06:59<25:15,  1.60s/it, loss=0.143, v_num=0, train/loss_simple_step=0.634, train/loss_vlb_step=0.0408, train/loss_step=0.634, global_step=6709.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  22%|██▏       | 262/1208 [06:59<25:15,  1.60s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00893, train/loss_vlb_step=4.23e-5, train/loss_step=0.00893, global_step=6709.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  22%|██▏       | 263/1208 [07:00<25:11,  1.60s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00893, train/loss_vlb_step=4.23e-5, train/loss_step=0.00893, global_step=6709.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  22%|██▏       | 263/1208 [07:00<25:11,  1.60s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.6e-5, train/loss_step=0.0129, global_step=6709.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  22%|██▏       | 264/1208 [07:03<25:14,  1.60s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.6e-5, train/loss_step=0.0129, global_step=6709.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  22%|██▏       | 264/1208 [07:03<25:14,  1.60s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00858, train/loss_vlb_step=4.03e-5, train/loss_step=0.00858, global_step=6709.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  22%|██▏       | 265/1208 [07:04<25:10,  1.60s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00858, train/loss_vlb_step=4.03e-5, train/loss_step=0.00858, global_step=6709.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  22%|██▏       | 265/1208 [07:04<25:10,  1.60s/it, loss=0.143, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=6710.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  22%|██▏       | 266/1208 [07:05<25:07,  1.60s/it, loss=0.143, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=6710.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  22%|██▏       | 266/1208 [07:05<25:07,  1.60s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00279, train/loss_vlb_step=1.58e-5, train/loss_step=0.00279, global_step=6710.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  22%|██▏       | 267/1208 [07:06<25:03,  1.60s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00279, train/loss_vlb_step=1.58e-5, train/loss_step=0.00279, global_step=6710.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  22%|██▏       | 267/1208 [07:06<25:03,  1.60s/it, loss=0.143, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=6710.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  22%|██▏       | 268/1208 [07:09<25:06,  1.60s/it, loss=0.143, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=6710.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  22%|██▏       | 268/1208 [07:09<25:06,  1.60s/it, loss=0.14, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.0021, train/loss_step=0.342, global_step=6710.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  22%|██▏       | 269/1208 [07:10<25:02,  1.60s/it, loss=0.14, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.0021, train/loss_step=0.342, global_step=6710.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  22%|██▏       | 269/1208 [07:10<25:02,  1.60s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.75e-5, train/loss_step=0.0213, global_step=6711.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  22%|██▏       | 270/1208 [07:11<24:59,  1.60s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.75e-5, train/loss_step=0.0213, global_step=6711.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  22%|██▏       | 270/1208 [07:11<24:59,  1.60s/it, loss=0.124, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000805, train/loss_step=0.202, global_step=6711.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  22%|██▏       | 271/1208 [07:12<24:55,  1.60s/it, loss=0.124, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000805, train/loss_step=0.202, global_step=6711.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  22%|██▏       | 271/1208 [07:12<24:55,  1.60s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0444, train/loss_vlb_step=0.000165, train/loss_step=0.0444, global_step=6711.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  23%|██▎       | 272/1208 [07:15<24:58,  1.60s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0444, train/loss_vlb_step=0.000165, train/loss_step=0.0444, global_step=6711.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  23%|██▎       | 272/1208 [07:15<24:58,  1.60s/it, loss=0.131, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000886, train/loss_step=0.242, global_step=6711.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  23%|██▎       | 273/1208 [07:16<24:54,  1.60s/it, loss=0.131, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000886, train/loss_step=0.242, global_step=6711.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  23%|██▎       | 273/1208 [07:16<24:54,  1.60s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=5.1e-5, train/loss_step=0.0105, global_step=6712.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  23%|██▎       | 274/1208 [07:17<24:51,  1.60s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=5.1e-5, train/loss_step=0.0105, global_step=6712.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  23%|██▎       | 274/1208 [07:17<24:51,  1.60s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0845, train/loss_vlb_step=0.000279, train/loss_step=0.0845, global_step=6712.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  23%|██▎       | 275/1208 [07:18<24:47,  1.59s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0845, train/loss_vlb_step=0.000279, train/loss_step=0.0845, global_step=6712.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  23%|██▎       | 275/1208 [07:18<24:47,  1.59s/it, loss=0.12, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000576, train/loss_step=0.168, global_step=6712.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  23%|██▎       | 276/1208 [07:21<24:50,  1.60s/it, loss=0.12, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000576, train/loss_step=0.168, global_step=6712.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  23%|██▎       | 276/1208 [07:21<24:50,  1.60s/it, loss=0.126, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000428, train/loss_step=0.127, global_step=6712.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  23%|██▎       | 277/1208 [07:22<24:46,  1.60s/it, loss=0.126, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000428, train/loss_step=0.127, global_step=6712.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  23%|██▎       | 277/1208 [07:22<24:46,  1.60s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00449, train/loss_vlb_step=2.36e-5, train/loss_step=0.00449, global_step=6713.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  23%|██▎       | 278/1208 [07:23<24:43,  1.59s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00449, train/loss_vlb_step=2.36e-5, train/loss_step=0.00449, global_step=6713.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  23%|██▎       | 278/1208 [07:23<24:43,  1.59s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.04e-5, train/loss_step=0.0113, global_step=6713.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  23%|██▎       | 279/1208 [07:24<24:39,  1.59s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.04e-5, train/loss_step=0.0113, global_step=6713.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  23%|██▎       | 279/1208 [07:24<24:39,  1.59s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000118, train/loss_step=0.0302, global_step=6713.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  23%|██▎       | 280/1208 [07:27<24:42,  1.60s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000118, train/loss_step=0.0302, global_step=6713.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  23%|██▎       | 280/1208 [07:27<24:42,  1.60s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0751, train/loss_vlb_step=0.000251, train/loss_step=0.0751, global_step=6713.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  23%|██▎       | 281/1208 [07:28<24:38,  1.60s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0751, train/loss_vlb_step=0.000251, train/loss_step=0.0751, global_step=6713.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  23%|██▎       | 281/1208 [07:28<24:38,  1.60s/it, loss=0.0816, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.26e-5, train/loss_step=0.014, global_step=6714.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  23%|██▎       | 282/1208 [07:29<24:35,  1.59s/it, loss=0.0816, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.26e-5, train/loss_step=0.014, global_step=6714.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  23%|██▎       | 282/1208 [07:29<24:35,  1.59s/it, loss=0.0836, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000181, train/loss_step=0.050, global_step=6714.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  23%|██▎       | 283/1208 [07:30<24:31,  1.59s/it, loss=0.0836, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000181, train/loss_step=0.050, global_step=6714.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  23%|██▎       | 283/1208 [07:30<24:31,  1.59s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000644, train/loss_step=0.184, global_step=6714.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  24%|██▎       | 284/1208 [07:33<24:34,  1.60s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000644, train/loss_step=0.184, global_step=6714.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  24%|██▎       | 284/1208 [07:33<24:34,  1.60s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.81e-5, train/loss_step=0.0132, global_step=6714.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  24%|██▎       | 285/1208 [07:34<24:30,  1.59s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.81e-5, train/loss_step=0.0132, global_step=6714.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  24%|██▎       | 285/1208 [07:34<24:30,  1.59s/it, loss=0.099, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00103, train/loss_step=0.249, global_step=6715.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  24%|██▎       | 286/1208 [07:35<24:27,  1.59s/it, loss=0.099, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00103, train/loss_step=0.249, global_step=6715.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  24%|██▎       | 286/1208 [07:35<24:27,  1.59s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.00673, train/loss_vlb_step=3.2e-5, train/loss_step=0.00673, global_step=6715.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  24%|██▍       | 287/1208 [07:36<24:23,  1.59s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.00673, train/loss_vlb_step=3.2e-5, train/loss_step=0.00673, global_step=6715.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  24%|██▍       | 287/1208 [07:36<24:23,  1.59s/it, loss=0.117, v_num=0, train/loss_simple_step=0.466, train/loss_vlb_step=0.00645, train/loss_step=0.466, global_step=6715.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  24%|██▍       | 288/1208 [07:39<24:26,  1.59s/it, loss=0.117, v_num=0, train/loss_simple_step=0.466, train/loss_vlb_step=0.00645, train/loss_step=0.466, global_step=6715.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  24%|██▍       | 288/1208 [07:39<24:26,  1.59s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.67e-5, train/loss_step=0.00311, global_step=6715.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  24%|██▍       | 289/1208 [07:40<24:23,  1.59s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.67e-5, train/loss_step=0.00311, global_step=6715.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  24%|██▍       | 289/1208 [07:40<24:23,  1.59s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.00432, train/loss_vlb_step=2.26e-5, train/loss_step=0.00432, global_step=6716.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  24%|██▍       | 290/1208 [07:41<24:19,  1.59s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.00432, train/loss_vlb_step=2.26e-5, train/loss_step=0.00432, global_step=6716.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  24%|██▍       | 290/1208 [07:41<24:19,  1.59s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.27e-5, train/loss_step=0.00215, global_step=6716.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  24%|██▍       | 291/1208 [07:42<24:16,  1.59s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.27e-5, train/loss_step=0.00215, global_step=6716.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  24%|██▍       | 291/1208 [07:42<24:16,  1.59s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.28e-5, train/loss_step=0.00211, global_step=6716.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  24%|██▍       | 292/1208 [07:44<24:18,  1.59s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.28e-5, train/loss_step=0.00211, global_step=6716.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  24%|██▍       | 292/1208 [07:44<24:18,  1.59s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00162, train/loss_step=0.304, global_step=6716.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  24%|██▍       | 293/1208 [07:45<24:15,  1.59s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00162, train/loss_step=0.304, global_step=6716.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  24%|██▍       | 293/1208 [07:45<24:15,  1.59s/it, loss=0.109, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.002, train/loss_step=0.373, global_step=6717.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  24%|██▍       | 294/1208 [07:46<24:11,  1.59s/it, loss=0.109, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.002, train/loss_step=0.373, global_step=6717.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  24%|██▍       | 294/1208 [07:46<24:11,  1.59s/it, loss=0.115, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000745, train/loss_step=0.208, global_step=6717.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  24%|██▍       | 295/1208 [07:47<24:08,  1.59s/it, loss=0.115, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000745, train/loss_step=0.208, global_step=6717.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  24%|██▍       | 295/1208 [07:47<24:08,  1.59s/it, loss=0.132, v_num=0, train/loss_simple_step=0.505, train/loss_vlb_step=0.00747, train/loss_step=0.505, global_step=6717.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  25%|██▍       | 296/1208 [07:50<24:10,  1.59s/it, loss=0.132, v_num=0, train/loss_simple_step=0.505, train/loss_vlb_step=0.00747, train/loss_step=0.505, global_step=6717.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  25%|██▍       | 296/1208 [07:50<24:10,  1.59s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.000171, train/loss_step=0.0462, global_step=6717.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  25%|██▍       | 297/1208 [07:51<24:07,  1.59s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.000171, train/loss_step=0.0462, global_step=6717.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  25%|██▍       | 297/1208 [07:51<24:07,  1.59s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00709, train/loss_vlb_step=3.51e-5, train/loss_step=0.00709, global_step=6718.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  25%|██▍       | 298/1208 [07:52<24:04,  1.59s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00709, train/loss_vlb_step=3.51e-5, train/loss_step=0.00709, global_step=6718.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  25%|██▍       | 298/1208 [07:52<24:04,  1.59s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0368, train/loss_vlb_step=0.000135, train/loss_step=0.0368, global_step=6718.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  25%|██▍       | 299/1208 [07:53<24:00,  1.59s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0368, train/loss_vlb_step=0.000135, train/loss_step=0.0368, global_step=6718.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  25%|██▍       | 299/1208 [07:53<24:00,  1.59s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00811, train/loss_vlb_step=3.94e-5, train/loss_step=0.00811, global_step=6718.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  25%|██▍       | 300/1208 [07:56<24:03,  1.59s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00811, train/loss_vlb_step=3.94e-5, train/loss_step=0.00811, global_step=6718.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  25%|██▍       | 300/1208 [07:56<24:03,  1.59s/it, loss=0.13, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000411, train/loss_step=0.125, global_step=6718.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.85it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.84it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:25,  1.85it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.84it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.85it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.84it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.85it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.84it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.85it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.84it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.84it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.84it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.84it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.79it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.84it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.84it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.84it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.84it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.84it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.83it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.84it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.84it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.84it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.84it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.84it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.84it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.84it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.84it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.84it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.84it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.84it/s][ADDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.85it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.84it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.84it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.83it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.84it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.84it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.84it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.83it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.83it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.83it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.83it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.83it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.84it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.84it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.84it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.83it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.84it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.84it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.84it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.84it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.83it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.84it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.83it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.84it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.83it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.84it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.83it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.83it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.82it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.83it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.84it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.83it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.84it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.83it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.84it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.84it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.84it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.84it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.84it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.83it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.84it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.83it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.84it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.78it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.83it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.83it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.83it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.80it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]Epoch 22:  25%|██▍       | 301/1208 [08:26<25:27,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000411, train/loss_step=0.125, global_step=6718.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  25%|██▍       | 301/1208 [08:27<25:27,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000383, train/loss_step=0.117, global_step=6719.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  25%|██▌       | 302/1208 [08:28<25:24,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000383, train/loss_step=0.117, global_step=6719.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  25%|██▌       | 302/1208 [08:28<25:24,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000406, train/loss_step=0.120, global_step=6719.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  25%|██▌       | 303/1208 [08:29<25:20,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000406, train/loss_step=0.120, global_step=6719.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  25%|██▌       | 303/1208 [08:29<25:20,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0766, train/loss_vlb_step=0.000254, train/loss_step=0.0766, global_step=6719.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  25%|██▌       | 304/1208 [08:32<25:22,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0766, train/loss_vlb_step=0.000254, train/loss_step=0.0766, global_step=6719.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  25%|██▌       | 304/1208 [08:32<25:22,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000777, train/loss_step=0.202, global_step=6719.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  25%|██▌       | 305/1208 [08:33<25:19,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000777, train/loss_step=0.202, global_step=6719.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  25%|██▌       | 305/1208 [08:33<25:19,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000943, train/loss_step=0.238, global_step=6720.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  25%|██▌       | 306/1208 [08:34<25:15,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000943, train/loss_step=0.238, global_step=6720.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  25%|██▌       | 306/1208 [08:34<25:15,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000373, train/loss_step=0.113, global_step=6720.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  25%|██▌       | 307/1208 [08:35<25:12,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000373, train/loss_step=0.113, global_step=6720.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  25%|██▌       | 307/1208 [08:35<25:12,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0921, train/loss_vlb_step=0.000302, train/loss_step=0.0921, global_step=6720.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  25%|██▌       | 308/1208 [08:38<25:15,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0921, train/loss_vlb_step=0.000302, train/loss_step=0.0921, global_step=6720.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  25%|██▌       | 308/1208 [08:38<25:15,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00623, train/loss_vlb_step=3.23e-5, train/loss_step=0.00623, global_step=6720.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  26%|██▌       | 309/1208 [08:39<25:11,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00623, train/loss_vlb_step=3.23e-5, train/loss_step=0.00623, global_step=6720.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  26%|██▌       | 309/1208 [08:39<25:11,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000568, train/loss_step=0.162, global_step=6721.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  26%|██▌       | 310/1208 [08:40<25:08,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000568, train/loss_step=0.162, global_step=6721.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  26%|██▌       | 310/1208 [08:40<25:08,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.58e-5, train/loss_step=0.0206, global_step=6721.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  26%|██▌       | 311/1208 [08:41<25:04,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.58e-5, train/loss_step=0.0206, global_step=6721.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  26%|██▌       | 311/1208 [08:41<25:04,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000504, train/loss_step=0.149, global_step=6721.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  26%|██▌       | 312/1208 [08:44<25:07,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000504, train/loss_step=0.149, global_step=6721.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  26%|██▌       | 312/1208 [08:44<25:07,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00161, train/loss_step=0.303, global_step=6721.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  26%|██▌       | 313/1208 [08:45<25:03,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00161, train/loss_step=0.303, global_step=6721.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  26%|██▌       | 313/1208 [08:45<25:03,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00191, train/loss_step=0.317, global_step=6722.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  26%|██▌       | 314/1208 [08:46<25:00,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00191, train/loss_step=0.317, global_step=6722.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  26%|██▌       | 314/1208 [08:46<25:00,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00171, train/loss_step=0.344, global_step=6722.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  26%|██▌       | 315/1208 [08:48<24:56,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00171, train/loss_step=0.344, global_step=6722.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  26%|██▌       | 315/1208 [08:48<24:56,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000471, train/loss_step=0.141, global_step=6722.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  26%|██▌       | 316/1208 [08:51<24:59,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000471, train/loss_step=0.141, global_step=6722.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  26%|██▌       | 316/1208 [08:51<24:59,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=8.16e-5, train/loss_step=0.0189, global_step=6722.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  26%|██▌       | 317/1208 [08:52<24:56,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=8.16e-5, train/loss_step=0.0189, global_step=6722.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  26%|██▌       | 317/1208 [08:52<24:56,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.468, train/loss_vlb_step=0.00544, train/loss_step=0.468, global_step=6723.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  26%|██▋       | 318/1208 [08:53<24:52,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.468, train/loss_vlb_step=0.00544, train/loss_step=0.468, global_step=6723.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  26%|██▋       | 318/1208 [08:53<24:52,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.15e-5, train/loss_step=0.0137, global_step=6723.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  26%|██▋       | 319/1208 [08:54<24:49,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.15e-5, train/loss_step=0.0137, global_step=6723.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  26%|██▋       | 319/1208 [08:54<24:49,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00817, train/loss_vlb_step=4.13e-5, train/loss_step=0.00817, global_step=6723.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  26%|██▋       | 320/1208 [08:57<24:51,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00817, train/loss_vlb_step=4.13e-5, train/loss_step=0.00817, global_step=6723.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  26%|██▋       | 320/1208 [08:57<24:51,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0998, train/loss_vlb_step=0.000328, train/loss_step=0.0998, global_step=6723.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  27%|██▋       | 321/1208 [08:58<24:48,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0998, train/loss_vlb_step=0.000328, train/loss_step=0.0998, global_step=6723.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  27%|██▋       | 321/1208 [08:58<24:48,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.88e-5, train/loss_step=0.00344, global_step=6724.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  27%|██▋       | 322/1208 [08:59<24:45,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.88e-5, train/loss_step=0.00344, global_step=6724.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  27%|██▋       | 322/1208 [08:59<24:45,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=6724.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  27%|██▋       | 323/1208 [09:00<24:41,  1.67s/it, loss=0.144, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=6724.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  27%|██▋       | 323/1208 [09:00<24:41,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.03e-5, train/loss_step=0.0138, global_step=6724.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  27%|██▋       | 324/1208 [09:03<24:44,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.03e-5, train/loss_step=0.0138, global_step=6724.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  27%|██▋       | 324/1208 [09:03<24:44,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.44e-5, train/loss_step=0.00251, global_step=6724.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  27%|██▋       | 325/1208 [09:05<24:40,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.44e-5, train/loss_step=0.00251, global_step=6724.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  27%|██▋       | 325/1208 [09:05<24:40,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.000118, train/loss_step=0.0312, global_step=6725.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  27%|██▋       | 326/1208 [09:06<24:37,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.000118, train/loss_step=0.0312, global_step=6725.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  27%|██▋       | 326/1208 [09:06<24:37,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00658, train/loss_vlb_step=3.24e-5, train/loss_step=0.00658, global_step=6725.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  27%|██▋       | 327/1208 [09:07<24:33,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00658, train/loss_vlb_step=3.24e-5, train/loss_step=0.00658, global_step=6725.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  27%|██▋       | 327/1208 [09:07<24:33,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0797, train/loss_vlb_step=0.000271, train/loss_step=0.0797, global_step=6725.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  27%|██▋       | 328/1208 [09:09<24:35,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0797, train/loss_vlb_step=0.000271, train/loss_step=0.0797, global_step=6725.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  27%|██▋       | 328/1208 [09:09<24:35,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000496, train/loss_step=0.145, global_step=6725.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  27%|██▋       | 329/1208 [09:10<24:31,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000496, train/loss_step=0.145, global_step=6725.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  27%|██▋       | 329/1208 [09:10<24:31,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=1.34e-5, train/loss_step=0.0023, global_step=6726.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  27%|██▋       | 330/1208 [09:11<24:28,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=1.34e-5, train/loss_step=0.0023, global_step=6726.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  27%|██▋       | 330/1208 [09:11<24:28,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000153, train/loss_step=0.042, global_step=6726.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  27%|██▋       | 331/1208 [09:12<24:25,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000153, train/loss_step=0.042, global_step=6726.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  27%|██▋       | 331/1208 [09:12<24:25,  1.67s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.32e-5, train/loss_step=0.0241, global_step=6726.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  27%|██▋       | 332/1208 [09:15<24:26,  1.67s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.32e-5, train/loss_step=0.0241, global_step=6726.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  27%|██▋       | 332/1208 [09:15<24:26,  1.67s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.00391, train/loss_vlb_step=2.13e-5, train/loss_step=0.00391, global_step=6726.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  28%|██▊       | 333/1208 [09:16<24:23,  1.67s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.00391, train/loss_vlb_step=2.13e-5, train/loss_step=0.00391, global_step=6726.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  28%|██▊       | 333/1208 [09:16<24:23,  1.67s/it, loss=0.101, v_num=0, train/loss_simple_step=0.461, train/loss_vlb_step=0.00453, train/loss_step=0.461, global_step=6727.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]     Epoch 22:  28%|██▊       | 334/1208 [09:17<24:19,  1.67s/it, loss=0.101, v_num=0, train/loss_simple_step=0.461, train/loss_vlb_step=0.00453, train/loss_step=0.461, global_step=6727.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  28%|██▊       | 334/1208 [09:17<24:19,  1.67s/it, loss=0.103, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.0027, train/loss_step=0.382, global_step=6727.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  28%|██▊       | 335/1208 [09:18<24:16,  1.67s/it, loss=0.103, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.0027, train/loss_step=0.382, global_step=6727.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  28%|██▊       | 335/1208 [09:18<24:16,  1.67s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.0442, train/loss_vlb_step=0.00016, train/loss_step=0.0442, global_step=6727.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  28%|██▊       | 336/1208 [09:21<24:17,  1.67s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.0442, train/loss_vlb_step=0.00016, train/loss_step=0.0442, global_step=6727.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  28%|██▊       | 336/1208 [09:21<24:17,  1.67s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0989, train/loss_vlb_step=0.000325, train/loss_step=0.0989, global_step=6727.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  28%|██▊       | 337/1208 [09:22<24:14,  1.67s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0989, train/loss_vlb_step=0.000325, train/loss_step=0.0989, global_step=6727.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  28%|██▊       | 337/1208 [09:22<24:14,  1.67s/it, loss=0.0797, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.000107, train/loss_step=0.0276, global_step=6728.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  28%|██▊       | 338/1208 [09:23<24:11,  1.67s/it, loss=0.0797, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.000107, train/loss_step=0.0276, global_step=6728.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  28%|██▊       | 338/1208 [09:23<24:11,  1.67s/it, loss=0.0836, v_num=0, train/loss_simple_step=0.0925, train/loss_vlb_step=0.000304, train/loss_step=0.0925, global_step=6728.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  28%|██▊       | 339/1208 [09:24<24:07,  1.67s/it, loss=0.0836, v_num=0, train/loss_simple_step=0.0925, train/loss_vlb_step=0.000304, train/loss_step=0.0925, global_step=6728.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  28%|██▊       | 339/1208 [09:24<24:07,  1.67s/it, loss=0.104, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00288, train/loss_step=0.412, global_step=6728.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  28%|██▊       | 340/1208 [09:27<24:09,  1.67s/it, loss=0.104, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00288, train/loss_step=0.412, global_step=6728.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  28%|██▊       | 340/1208 [09:27<24:09,  1.67s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0584, train/loss_vlb_step=0.000199, train/loss_step=0.0584, global_step=6728.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  28%|██▊       | 341/1208 [09:28<24:06,  1.67s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0584, train/loss_vlb_step=0.000199, train/loss_step=0.0584, global_step=6728.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  28%|██▊       | 341/1208 [09:28<24:06,  1.67s/it, loss=0.11, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000569, train/loss_step=0.171, global_step=6729.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  28%|██▊       | 342/1208 [09:29<24:02,  1.67s/it, loss=0.11, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000569, train/loss_step=0.171, global_step=6729.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  28%|██▊       | 342/1208 [09:29<24:02,  1.67s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0737, train/loss_vlb_step=0.000247, train/loss_step=0.0737, global_step=6729.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  28%|██▊       | 343/1208 [09:30<23:59,  1.66s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0737, train/loss_vlb_step=0.000247, train/loss_step=0.0737, global_step=6729.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  28%|██▊       | 343/1208 [09:30<23:59,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.24e-5, train/loss_step=0.00211, global_step=6729.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  28%|██▊       | 344/1208 [09:33<24:00,  1.67s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.24e-5, train/loss_step=0.00211, global_step=6729.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  28%|██▊       | 344/1208 [09:33<24:00,  1.67s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0709, train/loss_vlb_step=0.000236, train/loss_step=0.0709, global_step=6729.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  29%|██▊       | 345/1208 [09:34<23:57,  1.67s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0709, train/loss_vlb_step=0.000236, train/loss_step=0.0709, global_step=6729.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  29%|██▊       | 345/1208 [09:34<23:57,  1.67s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0701, train/loss_vlb_step=0.000236, train/loss_step=0.0701, global_step=6730.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  29%|██▊       | 346/1208 [09:35<23:54,  1.66s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0701, train/loss_vlb_step=0.000236, train/loss_step=0.0701, global_step=6730.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  29%|██▊       | 346/1208 [09:35<23:54,  1.66s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.42e-5, train/loss_step=0.00254, global_step=6730.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  29%|██▊       | 347/1208 [09:36<23:50,  1.66s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.42e-5, train/loss_step=0.00254, global_step=6730.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  29%|██▊       | 347/1208 [09:36<23:50,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00281, train/loss_step=0.402, global_step=6730.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  29%|██▉       | 348/1208 [09:39<23:52,  1.67s/it, loss=0.129, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00281, train/loss_step=0.402, global_step=6730.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  29%|██▉       | 348/1208 [09:39<23:52,  1.67s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0663, train/loss_vlb_step=0.000229, train/loss_step=0.0663, global_step=6730.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  29%|██▉       | 349/1208 [09:40<23:48,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0663, train/loss_vlb_step=0.000229, train/loss_step=0.0663, global_step=6730.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  29%|██▉       | 349/1208 [09:40<23:48,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00117, train/loss_step=0.270, global_step=6731.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  29%|██▉       | 350/1208 [09:41<23:45,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00117, train/loss_step=0.270, global_step=6731.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  29%|██▉       | 350/1208 [09:41<23:45,  1.66s/it, loss=0.143, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000442, train/loss_step=0.133, global_step=6731.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  29%|██▉       | 351/1208 [09:42<23:42,  1.66s/it, loss=0.143, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000442, train/loss_step=0.133, global_step=6731.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  29%|██▉       | 351/1208 [09:42<23:42,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00108, train/loss_step=0.256, global_step=6731.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  29%|██▉       | 352/1208 [09:45<23:43,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00108, train/loss_step=0.256, global_step=6731.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  29%|██▉       | 352/1208 [09:45<23:43,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.41e-5, train/loss_step=0.0156, global_step=6731.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  29%|██▉       | 353/1208 [09:46<23:40,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.41e-5, train/loss_step=0.0156, global_step=6731.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  29%|██▉       | 353/1208 [09:46<23:40,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000377, train/loss_step=0.115, global_step=6732.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  29%|██▉       | 354/1208 [09:47<23:37,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000377, train/loss_step=0.115, global_step=6732.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  29%|██▉       | 354/1208 [09:47<23:37,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=6732.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  29%|██▉       | 355/1208 [09:48<23:34,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=6732.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  29%|██▉       | 355/1208 [09:48<23:34,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00599, train/loss_vlb_step=3.01e-5, train/loss_step=0.00599, global_step=6732.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  29%|██▉       | 356/1208 [09:51<23:35,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00599, train/loss_vlb_step=3.01e-5, train/loss_step=0.00599, global_step=6732.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  29%|██▉       | 356/1208 [09:51<23:35,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.088, train/loss_vlb_step=0.000289, train/loss_step=0.088, global_step=6732.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  30%|██▉       | 357/1208 [09:52<23:32,  1.66s/it, loss=0.122, v_num=0, train/loss_simple_step=0.088, train/loss_vlb_step=0.000289, train/loss_step=0.088, global_step=6732.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  30%|██▉       | 357/1208 [09:52<23:32,  1.66s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.81e-5, train/loss_step=0.0101, global_step=6733.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  30%|██▉       | 358/1208 [09:53<23:28,  1.66s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.81e-5, train/loss_step=0.0101, global_step=6733.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  30%|██▉       | 358/1208 [09:53<23:28,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.54e-5, train/loss_step=0.0236, global_step=6733.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  30%|██▉       | 359/1208 [09:54<23:25,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.54e-5, train/loss_step=0.0236, global_step=6733.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  30%|██▉       | 359/1208 [09:54<23:25,  1.66s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.65e-5, train/loss_step=0.00281, global_step=6733.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  30%|██▉       | 360/1208 [09:57<23:26,  1.66s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.65e-5, train/loss_step=0.00281, global_step=6733.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  30%|██▉       | 360/1208 [09:57<23:26,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.0014, train/loss_step=0.283, global_step=6733.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]      Epoch 22:  30%|██▉       | 361/1208 [09:58<23:23,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.0014, train/loss_step=0.283, global_step=6733.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  30%|██▉       | 361/1208 [09:58<23:23,  1.66s/it, loss=0.112, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00101, train/loss_step=0.239, global_step=6734.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  30%|██▉       | 362/1208 [09:59<23:20,  1.66s/it, loss=0.112, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00101, train/loss_step=0.239, global_step=6734.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  30%|██▉       | 362/1208 [09:59<23:20,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.34e-5, train/loss_step=0.00233, global_step=6734.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  30%|███       | 363/1208 [10:00<23:17,  1.65s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.34e-5, train/loss_step=0.00233, global_step=6734.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  30%|███       | 363/1208 [10:00<23:17,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000516, train/loss_step=0.149, global_step=6734.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  30%|███       | 364/1208 [10:03<23:18,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000516, train/loss_step=0.149, global_step=6734.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  30%|███       | 364/1208 [10:03<23:18,  1.66s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0826, train/loss_vlb_step=0.000272, train/loss_step=0.0826, global_step=6734.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  30%|███       | 365/1208 [10:04<23:15,  1.66s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0826, train/loss_vlb_step=0.000272, train/loss_step=0.0826, global_step=6734.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  30%|███       | 365/1208 [10:04<23:15,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.00306, train/loss_step=0.400, global_step=6735.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  30%|███       | 366/1208 [10:05<23:12,  1.65s/it, loss=0.133, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.00306, train/loss_step=0.400, global_step=6735.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  30%|███       | 366/1208 [10:05<23:12,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000118, train/loss_step=0.0297, global_step=6735.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  30%|███       | 367/1208 [10:06<23:09,  1.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000118, train/loss_step=0.0297, global_step=6735.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  30%|███       | 367/1208 [10:06<23:09,  1.65s/it, loss=0.121, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000444, train/loss_step=0.134, global_step=6735.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  30%|███       | 368/1208 [10:09<23:10,  1.66s/it, loss=0.121, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000444, train/loss_step=0.134, global_step=6735.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  30%|███       | 368/1208 [10:09<23:10,  1.66s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000109, train/loss_step=0.0281, global_step=6735.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  31%|███       | 369/1208 [10:10<23:07,  1.65s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000109, train/loss_step=0.0281, global_step=6735.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  31%|███       | 369/1208 [10:10<23:07,  1.65s/it, loss=0.11, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.00033, train/loss_step=0.100, global_step=6736.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  31%|███       | 370/1208 [10:11<23:04,  1.65s/it, loss=0.11, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.00033, train/loss_step=0.100, global_step=6736.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  31%|███       | 370/1208 [10:11<23:04,  1.65s/it, loss=0.118, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00169, train/loss_step=0.283, global_step=6736.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  31%|███       | 371/1208 [10:12<23:01,  1.65s/it, loss=0.118, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00169, train/loss_step=0.283, global_step=6736.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  31%|███       | 371/1208 [10:12<23:01,  1.65s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0714, train/loss_vlb_step=0.000241, train/loss_step=0.0714, global_step=6736.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  31%|███       | 372/1208 [10:14<23:02,  1.65s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0714, train/loss_vlb_step=0.000241, train/loss_step=0.0714, global_step=6736.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  31%|███       | 372/1208 [10:14<23:02,  1.65s/it, loss=0.114, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000438, train/loss_step=0.130, global_step=6736.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  31%|███       | 373/1208 [10:16<22:58,  1.65s/it, loss=0.114, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000438, train/loss_step=0.130, global_step=6736.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  31%|███       | 373/1208 [10:16<22:58,  1.65s/it, loss=0.117, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000619, train/loss_step=0.180, global_step=6737.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  31%|███       | 374/1208 [10:17<22:55,  1.65s/it, loss=0.117, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000619, train/loss_step=0.180, global_step=6737.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  31%|███       | 374/1208 [10:17<22:55,  1.65s/it, loss=0.133, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00298, train/loss_step=0.415, global_step=6737.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  31%|███       | 375/1208 [10:18<22:52,  1.65s/it, loss=0.133, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00298, train/loss_step=0.415, global_step=6737.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  31%|███       | 375/1208 [10:18<22:52,  1.65s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.95e-5, train/loss_step=0.0159, global_step=6737.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  31%|███       | 376/1208 [10:20<22:53,  1.65s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.95e-5, train/loss_step=0.0159, global_step=6737.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  31%|███       | 376/1208 [10:20<22:53,  1.65s/it, loss=0.156, v_num=0, train/loss_simple_step=0.540, train/loss_vlb_step=0.0102, train/loss_step=0.540, global_step=6737.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  31%|███       | 377/1208 [10:21<22:50,  1.65s/it, loss=0.156, v_num=0, train/loss_simple_step=0.540, train/loss_vlb_step=0.0102, train/loss_step=0.540, global_step=6737.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  31%|███       | 377/1208 [10:21<22:50,  1.65s/it, loss=0.171, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00177, train/loss_step=0.310, global_step=6738.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  31%|███▏      | 378/1208 [10:22<22:47,  1.65s/it, loss=0.171, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00177, train/loss_step=0.310, global_step=6738.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  31%|███▏      | 378/1208 [10:22<22:47,  1.65s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0766, train/loss_vlb_step=0.000259, train/loss_step=0.0766, global_step=6738.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  31%|███▏      | 379/1208 [10:23<22:44,  1.65s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0766, train/loss_vlb_step=0.000259, train/loss_step=0.0766, global_step=6738.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  31%|███▏      | 379/1208 [10:23<22:44,  1.65s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0856, train/loss_vlb_step=0.000281, train/loss_step=0.0856, global_step=6738.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  31%|███▏      | 380/1208 [10:26<22:45,  1.65s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0856, train/loss_vlb_step=0.000281, train/loss_step=0.0856, global_step=6738.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  31%|███▏      | 380/1208 [10:26<22:45,  1.65s/it, loss=0.172, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000559, train/loss_step=0.165, global_step=6738.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  32%|███▏      | 381/1208 [10:27<22:42,  1.65s/it, loss=0.172, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000559, train/loss_step=0.165, global_step=6738.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  32%|███▏      | 381/1208 [10:27<22:42,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0549, train/loss_vlb_step=0.000189, train/loss_step=0.0549, global_step=6739.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  32%|███▏      | 382/1208 [10:28<22:39,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0549, train/loss_vlb_step=0.000189, train/loss_step=0.0549, global_step=6739.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  32%|███▏      | 382/1208 [10:28<22:39,  1.65s/it, loss=0.179, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00177, train/loss_step=0.321, global_step=6739.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  32%|███▏      | 383/1208 [10:29<22:36,  1.64s/it, loss=0.179, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00177, train/loss_step=0.321, global_step=6739.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  32%|███▏      | 383/1208 [10:29<22:36,  1.64s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00491, train/loss_vlb_step=2.54e-5, train/loss_step=0.00491, global_step=6739.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  32%|███▏      | 384/1208 [10:32<22:37,  1.65s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00491, train/loss_vlb_step=2.54e-5, train/loss_step=0.00491, global_step=6739.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  32%|███▏      | 384/1208 [10:32<22:37,  1.65s/it, loss=0.19, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00368, train/loss_step=0.458, global_step=6739.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]     Epoch 22:  32%|███▏      | 385/1208 [10:33<22:34,  1.65s/it, loss=0.19, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00368, train/loss_step=0.458, global_step=6739.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  32%|███▏      | 385/1208 [10:33<22:34,  1.65s/it, loss=0.187, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00168, train/loss_step=0.340, global_step=6740.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  32%|███▏      | 386/1208 [10:34<22:31,  1.64s/it, loss=0.187, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00168, train/loss_step=0.340, global_step=6740.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  32%|███▏      | 386/1208 [10:34<22:31,  1.64s/it, loss=0.192, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.00041, train/loss_step=0.125, global_step=6740.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  32%|███▏      | 387/1208 [10:35<22:28,  1.64s/it, loss=0.192, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.00041, train/loss_step=0.125, global_step=6740.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  32%|███▏      | 387/1208 [10:35<22:28,  1.64s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00684, train/loss_vlb_step=3.27e-5, train/loss_step=0.00684, global_step=6740.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  32%|███▏      | 388/1208 [10:38<22:29,  1.65s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00684, train/loss_vlb_step=3.27e-5, train/loss_step=0.00684, global_step=6740.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  32%|███▏      | 388/1208 [10:38<22:29,  1.65s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0991, train/loss_vlb_step=0.000327, train/loss_step=0.0991, global_step=6740.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  32%|███▏      | 389/1208 [10:39<22:26,  1.64s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0991, train/loss_vlb_step=0.000327, train/loss_step=0.0991, global_step=6740.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  32%|███▏      | 389/1208 [10:39<22:26,  1.64s/it, loss=0.212, v_num=0, train/loss_simple_step=0.562, train/loss_vlb_step=0.00745, train/loss_step=0.562, global_step=6741.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  32%|███▏      | 390/1208 [10:40<22:23,  1.64s/it, loss=0.212, v_num=0, train/loss_simple_step=0.562, train/loss_vlb_step=0.00745, train/loss_step=0.562, global_step=6741.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  32%|███▏      | 390/1208 [10:40<22:23,  1.64s/it, loss=0.207, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000667, train/loss_step=0.186, global_step=6741.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  32%|███▏      | 391/1208 [10:41<22:20,  1.64s/it, loss=0.207, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000667, train/loss_step=0.186, global_step=6741.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  32%|███▏      | 391/1208 [10:41<22:20,  1.64s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.000229, train/loss_step=0.0672, global_step=6741.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  32%|███▏      | 392/1208 [10:44<22:21,  1.64s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.000229, train/loss_step=0.0672, global_step=6741.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  32%|███▏      | 392/1208 [10:44<22:21,  1.64s/it, loss=0.211, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000748, train/loss_step=0.198, global_step=6741.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  33%|███▎      | 393/1208 [10:45<22:18,  1.64s/it, loss=0.211, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000748, train/loss_step=0.198, global_step=6741.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  33%|███▎      | 393/1208 [10:45<22:18,  1.64s/it, loss=0.202, v_num=0, train/loss_simple_step=0.00939, train/loss_vlb_step=4.5e-5, train/loss_step=0.00939, global_step=6742.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  33%|███▎      | 394/1208 [10:46<22:15,  1.64s/it, loss=0.202, v_num=0, train/loss_simple_step=0.00939, train/loss_vlb_step=4.5e-5, train/loss_step=0.00939, global_step=6742.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  33%|███▎      | 394/1208 [10:46<22:15,  1.64s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0528, train/loss_vlb_step=0.000187, train/loss_step=0.0528, global_step=6742.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  33%|███▎      | 395/1208 [10:47<22:12,  1.64s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0528, train/loss_vlb_step=0.000187, train/loss_step=0.0528, global_step=6742.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  33%|███▎      | 395/1208 [10:47<22:12,  1.64s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.36e-5, train/loss_step=0.0124, global_step=6742.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  33%|███▎      | 396/1208 [10:50<22:13,  1.64s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.36e-5, train/loss_step=0.0124, global_step=6742.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  33%|███▎      | 396/1208 [10:50<22:13,  1.64s/it, loss=0.185, v_num=0, train/loss_simple_step=0.560, train/loss_vlb_step=0.0103, train/loss_step=0.560, global_step=6742.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  33%|███▎      | 397/1208 [10:51<22:10,  1.64s/it, loss=0.185, v_num=0, train/loss_simple_step=0.560, train/loss_vlb_step=0.0103, train/loss_step=0.560, global_step=6742.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  33%|███▎      | 397/1208 [10:51<22:10,  1.64s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0466, train/loss_vlb_step=0.000171, train/loss_step=0.0466, global_step=6743.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  33%|███▎      | 398/1208 [10:52<22:07,  1.64s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0466, train/loss_vlb_step=0.000171, train/loss_step=0.0466, global_step=6743.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  33%|███▎      | 398/1208 [10:52<22:07,  1.64s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00832, train/loss_vlb_step=4.09e-5, train/loss_step=0.00832, global_step=6743.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  33%|███▎      | 399/1208 [10:53<22:05,  1.64s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00832, train/loss_vlb_step=4.09e-5, train/loss_step=0.00832, global_step=6743.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  33%|███▎      | 399/1208 [10:53<22:05,  1.64s/it, loss=0.176, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00112, train/loss_step=0.251, global_step=6743.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  33%|███▎      | 400/1208 [10:56<22:05,  1.64s/it, loss=0.176, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00112, train/loss_step=0.251, global_step=6743.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  33%|███▎      | 400/1208 [10:56<22:05,  1.64s/it, loss=0.183, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00126, train/loss_step=0.290, global_step=6743.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  33%|███▎      | 401/1208 [10:57<22:02,  1.64s/it, loss=0.183, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00126, train/loss_step=0.290, global_step=6743.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  33%|███▎      | 401/1208 [10:57<22:02,  1.64s/it, loss=0.198, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00265, train/loss_step=0.357, global_step=6744.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  33%|███▎      | 402/1208 [10:58<22:00,  1.64s/it, loss=0.198, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00265, train/loss_step=0.357, global_step=6744.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  33%|███▎      | 402/1208 [10:58<22:00,  1.64s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00411, train/loss_vlb_step=2.29e-5, train/loss_step=0.00411, global_step=6744.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  33%|███▎      | 403/1208 [10:59<21:57,  1.64s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00411, train/loss_vlb_step=2.29e-5, train/loss_step=0.00411, global_step=6744.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  33%|███▎      | 403/1208 [10:59<21:57,  1.64s/it, loss=0.192, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000719, train/loss_step=0.201, global_step=6744.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  33%|███▎      | 404/1208 [11:02<21:57,  1.64s/it, loss=0.192, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000719, train/loss_step=0.201, global_step=6744.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  33%|███▎      | 404/1208 [11:02<21:57,  1.64s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000166, train/loss_step=0.0474, global_step=6744.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  34%|███▎      | 405/1208 [11:03<21:55,  1.64s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000166, train/loss_step=0.0474, global_step=6744.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  34%|███▎      | 405/1208 [11:03<21:55,  1.64s/it, loss=0.168, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00108, train/loss_step=0.282, global_step=6745.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  34%|███▎      | 406/1208 [11:04<21:52,  1.64s/it, loss=0.168, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00108, train/loss_step=0.282, global_step=6745.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  34%|███▎      | 406/1208 [11:04<21:52,  1.64s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0085, train/loss_vlb_step=4.01e-5, train/loss_step=0.0085, global_step=6745.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  34%|███▎      | 407/1208 [11:05<21:49,  1.63s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0085, train/loss_vlb_step=4.01e-5, train/loss_step=0.0085, global_step=6745.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  34%|███▎      | 407/1208 [11:05<21:49,  1.63s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00745, train/loss_vlb_step=3.57e-5, train/loss_step=0.00745, global_step=6745.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  34%|███▍      | 408/1208 [11:08<21:50,  1.64s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00745, train/loss_vlb_step=3.57e-5, train/loss_step=0.00745, global_step=6745.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  34%|███▍      | 408/1208 [11:08<21:50,  1.64s/it, loss=0.168, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000793, train/loss_step=0.200, global_step=6745.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  34%|███▍      | 409/1208 [11:09<21:47,  1.64s/it, loss=0.168, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000793, train/loss_step=0.200, global_step=6745.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  34%|███▍      | 409/1208 [11:09<21:47,  1.64s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0738, train/loss_vlb_step=0.000246, train/loss_step=0.0738, global_step=6746.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  34%|███▍      | 410/1208 [11:10<21:44,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0738, train/loss_vlb_step=0.000246, train/loss_step=0.0738, global_step=6746.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  34%|███▍      | 410/1208 [11:10<21:44,  1.63s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0502, train/loss_vlb_step=0.00017, train/loss_step=0.0502, global_step=6746.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  34%|███▍      | 411/1208 [11:11<21:41,  1.63s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0502, train/loss_vlb_step=0.00017, train/loss_step=0.0502, global_step=6746.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  34%|███▍      | 411/1208 [11:11<21:41,  1.63s/it, loss=0.134, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.98e-5, train/loss_step=0.011, global_step=6746.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  34%|███▍      | 412/1208 [11:14<21:42,  1.64s/it, loss=0.134, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.98e-5, train/loss_step=0.011, global_step=6746.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  34%|███▍      | 412/1208 [11:14<21:42,  1.64s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000139, train/loss_step=0.0378, global_step=6746.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  34%|███▍      | 413/1208 [11:15<21:39,  1.63s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000139, train/loss_step=0.0378, global_step=6746.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  34%|███▍      | 413/1208 [11:15<21:39,  1.63s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.15e-5, train/loss_step=0.0137, global_step=6747.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  34%|███▍      | 414/1208 [11:16<21:36,  1.63s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.15e-5, train/loss_step=0.0137, global_step=6747.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  34%|███▍      | 414/1208 [11:16<21:36,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=2.46e-5, train/loss_step=0.00464, global_step=6747.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  34%|███▍      | 415/1208 [11:17<21:33,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=2.46e-5, train/loss_step=0.00464, global_step=6747.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  34%|███▍      | 415/1208 [11:17<21:33,  1.63s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0777, train/loss_vlb_step=0.000259, train/loss_step=0.0777, global_step=6747.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  34%|███▍      | 416/1208 [11:19<21:34,  1.63s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0777, train/loss_vlb_step=0.000259, train/loss_step=0.0777, global_step=6747.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  34%|███▍      | 416/1208 [11:19<21:34,  1.63s/it, loss=0.119, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00311, train/loss_step=0.407, global_step=6747.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  35%|███▍      | 417/1208 [11:21<21:31,  1.63s/it, loss=0.119, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00311, train/loss_step=0.407, global_step=6747.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  35%|███▍      | 417/1208 [11:21<21:31,  1.63s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00775, train/loss_vlb_step=3.76e-5, train/loss_step=0.00775, global_step=6748.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  35%|███▍      | 418/1208 [11:22<21:28,  1.63s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00775, train/loss_vlb_step=3.76e-5, train/loss_step=0.00775, global_step=6748.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  35%|███▍      | 418/1208 [11:22<21:28,  1.63s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.77e-5, train/loss_step=0.0128, global_step=6748.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  35%|███▍      | 419/1208 [11:23<21:26,  1.63s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.77e-5, train/loss_step=0.0128, global_step=6748.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  35%|███▍      | 419/1208 [11:23<21:26,  1.63s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.2e-5, train/loss_step=0.00216, global_step=6748.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  35%|███▍      | 420/1208 [11:25<21:26,  1.63s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.2e-5, train/loss_step=0.00216, global_step=6748.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  35%|███▍      | 420/1208 [11:25<21:26,  1.63s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.0606, train/loss_vlb_step=0.000207, train/loss_step=0.0606, global_step=6748.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  35%|███▍      | 421/1208 [11:26<21:24,  1.63s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.0606, train/loss_vlb_step=0.000207, train/loss_step=0.0606, global_step=6748.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  35%|███▍      | 421/1208 [11:26<21:24,  1.63s/it, loss=0.0756, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.39e-5, train/loss_step=0.00244, global_step=6749.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  35%|███▍      | 422/1208 [11:27<21:21,  1.63s/it, loss=0.0756, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.39e-5, train/loss_step=0.00244, global_step=6749.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  35%|███▍      | 422/1208 [11:27<21:21,  1.63s/it, loss=0.0806, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000347, train/loss_step=0.106, global_step=6749.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  35%|███▌      | 423/1208 [11:28<21:18,  1.63s/it, loss=0.0806, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000347, train/loss_step=0.106, global_step=6749.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  35%|███▌      | 423/1208 [11:28<21:18,  1.63s/it, loss=0.0721, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000115, train/loss_step=0.0298, global_step=6749.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  35%|███▌      | 424/1208 [11:31<21:19,  1.63s/it, loss=0.0721, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000115, train/loss_step=0.0298, global_step=6749.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  35%|███▌      | 424/1208 [11:31<21:19,  1.63s/it, loss=0.0701, v_num=0, train/loss_simple_step=0.00648, train/loss_vlb_step=3.28e-5, train/loss_step=0.00648, global_step=6749.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  35%|███▌      | 425/1208 [11:32<21:16,  1.63s/it, loss=0.0701, v_num=0, train/loss_simple_step=0.00648, train/loss_vlb_step=3.28e-5, train/loss_step=0.00648, global_step=6749.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  35%|███▌      | 425/1208 [11:32<21:16,  1.63s/it, loss=0.0698, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.0013, train/loss_step=0.277, global_step=6750.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]     Epoch 22:  35%|███▌      | 426/1208 [11:33<21:13,  1.63s/it, loss=0.0698, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.0013, train/loss_step=0.277, global_step=6750.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  35%|███▌      | 426/1208 [11:33<21:13,  1.63s/it, loss=0.087, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00227, train/loss_step=0.353, global_step=6750.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  35%|███▌      | 427/1208 [11:34<21:10,  1.63s/it, loss=0.087, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00227, train/loss_step=0.353, global_step=6750.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  35%|███▌      | 427/1208 [11:34<21:10,  1.63s/it, loss=0.089, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000166, train/loss_step=0.0478, global_step=6750.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  35%|███▌      | 428/1208 [11:37<21:11,  1.63s/it, loss=0.089, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000166, train/loss_step=0.0478, global_step=6750.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  35%|███▌      | 428/1208 [11:37<21:11,  1.63s/it, loss=0.0793, v_num=0, train/loss_simple_step=0.00524, train/loss_vlb_step=2.73e-5, train/loss_step=0.00524, global_step=6750.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  36%|███▌      | 429/1208 [11:38<21:08,  1.63s/it, loss=0.0793, v_num=0, train/loss_simple_step=0.00524, train/loss_vlb_step=2.73e-5, train/loss_step=0.00524, global_step=6750.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  36%|███▌      | 429/1208 [11:38<21:08,  1.63s/it, loss=0.0787, v_num=0, train/loss_simple_step=0.0613, train/loss_vlb_step=0.000211, train/loss_step=0.0613, global_step=6751.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  36%|███▌      | 430/1208 [11:39<21:06,  1.63s/it, loss=0.0787, v_num=0, train/loss_simple_step=0.0613, train/loss_vlb_step=0.000211, train/loss_step=0.0613, global_step=6751.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  36%|███▌      | 430/1208 [11:39<21:06,  1.63s/it, loss=0.091, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00134, train/loss_step=0.297, global_step=6751.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  36%|███▌      | 431/1208 [11:40<21:03,  1.63s/it, loss=0.091, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00134, train/loss_step=0.297, global_step=6751.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  36%|███▌      | 431/1208 [11:40<21:03,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.0024, train/loss_step=0.368, global_step=6751.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  36%|███▌      | 432/1208 [11:43<21:03,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.0024, train/loss_step=0.368, global_step=6751.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  36%|███▌      | 432/1208 [11:43<21:03,  1.63s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.28e-5, train/loss_step=0.0143, global_step=6751.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  36%|███▌      | 433/1208 [11:44<21:01,  1.63s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.28e-5, train/loss_step=0.0143, global_step=6751.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  36%|███▌      | 433/1208 [11:44<21:01,  1.63s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.000108, train/loss_step=0.0292, global_step=6752.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  36%|███▌      | 434/1208 [11:45<20:58,  1.63s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.000108, train/loss_step=0.0292, global_step=6752.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  36%|███▌      | 434/1208 [11:45<20:58,  1.63s/it, loss=0.132, v_num=0, train/loss_simple_step=0.471, train/loss_vlb_step=0.0045, train/loss_step=0.471, global_step=6752.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  36%|███▌      | 435/1208 [11:46<20:55,  1.62s/it, loss=0.132, v_num=0, train/loss_simple_step=0.471, train/loss_vlb_step=0.0045, train/loss_step=0.471, global_step=6752.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  36%|███▌      | 435/1208 [11:46<20:55,  1.62s/it, loss=0.151, v_num=0, train/loss_simple_step=0.462, train/loss_vlb_step=0.00588, train/loss_step=0.462, global_step=6752.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  36%|███▌      | 436/1208 [11:49<20:56,  1.63s/it, loss=0.151, v_num=0, train/loss_simple_step=0.462, train/loss_vlb_step=0.00588, train/loss_step=0.462, global_step=6752.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  36%|███▌      | 436/1208 [11:49<20:56,  1.63s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00889, train/loss_vlb_step=4.03e-5, train/loss_step=0.00889, global_step=6752.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  36%|███▌      | 437/1208 [11:50<20:53,  1.63s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00889, train/loss_vlb_step=4.03e-5, train/loss_step=0.00889, global_step=6752.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  36%|███▌      | 437/1208 [11:50<20:53,  1.63s/it, loss=0.144, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00104, train/loss_step=0.268, global_step=6753.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  36%|███▋      | 438/1208 [11:51<20:50,  1.62s/it, loss=0.144, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00104, train/loss_step=0.268, global_step=6753.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  36%|███▋      | 438/1208 [11:51<20:50,  1.62s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0578, train/loss_vlb_step=0.000196, train/loss_step=0.0578, global_step=6753.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  36%|███▋      | 439/1208 [11:52<20:48,  1.62s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0578, train/loss_vlb_step=0.000196, train/loss_step=0.0578, global_step=6753.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  36%|███▋      | 439/1208 [11:52<20:48,  1.62s/it, loss=0.155, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000564, train/loss_step=0.171, global_step=6753.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  36%|███▋      | 440/1208 [11:55<20:48,  1.63s/it, loss=0.155, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000564, train/loss_step=0.171, global_step=6753.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  36%|███▋      | 440/1208 [11:55<20:48,  1.63s/it, loss=0.167, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00181, train/loss_step=0.295, global_step=6753.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  37%|███▋      | 441/1208 [11:56<20:46,  1.62s/it, loss=0.167, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00181, train/loss_step=0.295, global_step=6753.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  37%|███▋      | 441/1208 [11:56<20:46,  1.62s/it, loss=0.173, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000429, train/loss_step=0.127, global_step=6754.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  37%|███▋      | 442/1208 [11:57<20:43,  1.62s/it, loss=0.173, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000429, train/loss_step=0.127, global_step=6754.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  37%|███▋      | 442/1208 [11:57<20:43,  1.62s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0944, train/loss_vlb_step=0.000312, train/loss_step=0.0944, global_step=6754.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  37%|███▋      | 443/1208 [11:58<20:40,  1.62s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0944, train/loss_vlb_step=0.000312, train/loss_step=0.0944, global_step=6754.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  37%|███▋      | 443/1208 [11:58<20:40,  1.62s/it, loss=0.183, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00117, train/loss_step=0.256, global_step=6754.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  37%|███▋      | 444/1208 [12:01<20:41,  1.62s/it, loss=0.183, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00117, train/loss_step=0.256, global_step=6754.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  37%|███▋      | 444/1208 [12:01<20:41,  1.62s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.81e-5, train/loss_step=0.0191, global_step=6754.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  37%|███▋      | 445/1208 [12:02<20:38,  1.62s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.81e-5, train/loss_step=0.0191, global_step=6754.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  37%|███▋      | 445/1208 [12:02<20:38,  1.62s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0611, train/loss_vlb_step=0.000211, train/loss_step=0.0611, global_step=6755.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  37%|███▋      | 446/1208 [12:03<20:36,  1.62s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0611, train/loss_vlb_step=0.000211, train/loss_step=0.0611, global_step=6755.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  37%|███▋      | 446/1208 [12:03<20:36,  1.62s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00556, train/loss_vlb_step=2.81e-5, train/loss_step=0.00556, global_step=6755.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  37%|███▋      | 447/1208 [12:04<20:33,  1.62s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00556, train/loss_vlb_step=2.81e-5, train/loss_step=0.00556, global_step=6755.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  37%|███▋      | 447/1208 [12:04<20:33,  1.62s/it, loss=0.168, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.0014, train/loss_step=0.289, global_step=6755.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]     Epoch 22:  37%|███▋      | 448/1208 [12:07<20:33,  1.62s/it, loss=0.168, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.0014, train/loss_step=0.289, global_step=6755.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  37%|███▋      | 448/1208 [12:07<20:33,  1.62s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.69e-5, train/loss_step=0.00557, global_step=6755.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  37%|███▋      | 449/1208 [12:08<20:31,  1.62s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.69e-5, train/loss_step=0.00557, global_step=6755.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  37%|███▋      | 449/1208 [12:08<20:31,  1.62s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00979, train/loss_vlb_step=4.57e-5, train/loss_step=0.00979, global_step=6756.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  37%|███▋      | 450/1208 [12:09<20:28,  1.62s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00979, train/loss_vlb_step=4.57e-5, train/loss_step=0.00979, global_step=6756.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  37%|███▋      | 450/1208 [12:09<20:28,  1.62s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0889, train/loss_vlb_step=0.000292, train/loss_step=0.0889, global_step=6756.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  37%|███▋      | 451/1208 [12:10<20:25,  1.62s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0889, train/loss_vlb_step=0.000292, train/loss_step=0.0889, global_step=6756.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  37%|███▋      | 451/1208 [12:10<20:25,  1.62s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00704, train/loss_vlb_step=3.41e-5, train/loss_step=0.00704, global_step=6756.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  37%|███▋      | 452/1208 [12:13<20:26,  1.62s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00704, train/loss_vlb_step=3.41e-5, train/loss_step=0.00704, global_step=6756.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  37%|███▋      | 452/1208 [12:13<20:26,  1.62s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.34e-5, train/loss_step=0.0151, global_step=6756.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  38%|███▊      | 453/1208 [12:14<20:23,  1.62s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.34e-5, train/loss_step=0.0151, global_step=6756.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  38%|███▊      | 453/1208 [12:14<20:23,  1.62s/it, loss=0.138, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.000173, train/loss_step=0.045, global_step=6757.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  38%|███▊      | 454/1208 [12:15<20:21,  1.62s/it, loss=0.138, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.000173, train/loss_step=0.045, global_step=6757.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  38%|███▊      | 454/1208 [12:15<20:21,  1.62s/it, loss=0.141, v_num=0, train/loss_simple_step=0.526, train/loss_vlb_step=0.00743, train/loss_step=0.526, global_step=6757.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  38%|███▊      | 455/1208 [12:16<20:18,  1.62s/it, loss=0.141, v_num=0, train/loss_simple_step=0.526, train/loss_vlb_step=0.00743, train/loss_step=0.526, global_step=6757.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  38%|███▊      | 455/1208 [12:16<20:18,  1.62s/it, loss=0.135, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.0022, train/loss_step=0.354, global_step=6757.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  38%|███▊      | 456/1208 [12:19<20:18,  1.62s/it, loss=0.135, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.0022, train/loss_step=0.354, global_step=6757.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  38%|███▊      | 456/1208 [12:19<20:18,  1.62s/it, loss=0.173, v_num=0, train/loss_simple_step=0.769, train/loss_vlb_step=0.0563, train/loss_step=0.769, global_step=6757.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  38%|███▊      | 457/1208 [12:20<20:16,  1.62s/it, loss=0.173, v_num=0, train/loss_simple_step=0.769, train/loss_vlb_step=0.0563, train/loss_step=0.769, global_step=6757.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  38%|███▊      | 457/1208 [12:20<20:16,  1.62s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00959, train/loss_vlb_step=4.46e-5, train/loss_step=0.00959, global_step=6758.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  38%|███▊      | 458/1208 [12:21<20:13,  1.62s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00959, train/loss_vlb_step=4.46e-5, train/loss_step=0.00959, global_step=6758.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  38%|███▊      | 458/1208 [12:21<20:13,  1.62s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0735, train/loss_vlb_step=0.000242, train/loss_step=0.0735, global_step=6758.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  38%|███▊      | 459/1208 [12:22<20:11,  1.62s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0735, train/loss_vlb_step=0.000242, train/loss_step=0.0735, global_step=6758.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  38%|███▊      | 459/1208 [12:22<20:11,  1.62s/it, loss=0.162, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000716, train/loss_step=0.193, global_step=6758.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  38%|███▊      | 460/1208 [12:25<20:11,  1.62s/it, loss=0.162, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000716, train/loss_step=0.193, global_step=6758.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  38%|███▊      | 460/1208 [12:25<20:11,  1.62s/it, loss=0.191, v_num=0, train/loss_simple_step=0.870, train/loss_vlb_step=0.438, train/loss_step=0.870, global_step=6758.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  38%|███▊      | 461/1208 [12:26<20:08,  1.62s/it, loss=0.191, v_num=0, train/loss_simple_step=0.870, train/loss_vlb_step=0.438, train/loss_step=0.870, global_step=6758.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  38%|███▊      | 461/1208 [12:26<20:08,  1.62s/it, loss=0.195, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000715, train/loss_step=0.201, global_step=6759.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  38%|███▊      | 462/1208 [12:27<20:06,  1.62s/it, loss=0.195, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000715, train/loss_step=0.201, global_step=6759.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  38%|███▊      | 462/1208 [12:27<20:06,  1.62s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0905, train/loss_vlb_step=0.000297, train/loss_step=0.0905, global_step=6759.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  38%|███▊      | 463/1208 [12:28<20:03,  1.62s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0905, train/loss_vlb_step=0.000297, train/loss_step=0.0905, global_step=6759.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  38%|███▊      | 463/1208 [12:28<20:03,  1.62s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.63e-5, train/loss_step=0.00286, global_step=6759.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  38%|███▊      | 464/1208 [12:30<20:04,  1.62s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.63e-5, train/loss_step=0.00286, global_step=6759.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  38%|███▊      | 464/1208 [12:30<20:04,  1.62s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=0.000101, train/loss_step=0.0252, global_step=6759.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  38%|███▊      | 465/1208 [12:31<20:01,  1.62s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=0.000101, train/loss_step=0.0252, global_step=6759.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  38%|███▊      | 465/1208 [12:31<20:01,  1.62s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.33e-5, train/loss_step=0.00225, global_step=6760.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  39%|███▊      | 466/1208 [12:32<19:58,  1.62s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.33e-5, train/loss_step=0.00225, global_step=6760.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  39%|███▊      | 466/1208 [12:32<19:58,  1.62s/it, loss=0.201, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.00351, train/loss_step=0.450, global_step=6760.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  39%|███▊      | 467/1208 [12:33<19:56,  1.61s/it, loss=0.201, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.00351, train/loss_step=0.450, global_step=6760.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  39%|███▊      | 467/1208 [12:33<19:56,  1.61s/it, loss=0.212, v_num=0, train/loss_simple_step=0.500, train/loss_vlb_step=0.00796, train/loss_step=0.500, global_step=6760.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  39%|███▊      | 468/1208 [12:36<19:56,  1.62s/it, loss=0.212, v_num=0, train/loss_simple_step=0.500, train/loss_vlb_step=0.00796, train/loss_step=0.500, global_step=6760.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  39%|███▊      | 468/1208 [12:36<19:56,  1.62s/it, loss=0.225, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00122, train/loss_step=0.269, global_step=6760.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  39%|███▉      | 469/1208 [12:37<19:54,  1.62s/it, loss=0.225, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00122, train/loss_step=0.269, global_step=6760.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  39%|███▉      | 469/1208 [12:37<19:54,  1.62s/it, loss=0.26, v_num=0, train/loss_simple_step=0.701, train/loss_vlb_step=0.0282, train/loss_step=0.701, global_step=6761.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  39%|███▉      | 470/1208 [12:38<19:51,  1.61s/it, loss=0.26, v_num=0, train/loss_simple_step=0.701, train/loss_vlb_step=0.0282, train/loss_step=0.701, global_step=6761.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  39%|███▉      | 470/1208 [12:38<19:51,  1.61s/it, loss=0.256, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.66e-5, train/loss_step=0.0148, global_step=6761.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  39%|███▉      | 471/1208 [12:39<19:49,  1.61s/it, loss=0.256, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.66e-5, train/loss_step=0.0148, global_step=6761.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  39%|███▉      | 471/1208 [12:39<19:49,  1.61s/it, loss=0.256, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.56e-5, train/loss_step=0.0185, global_step=6761.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  39%|███▉      | 472/1208 [12:42<19:49,  1.62s/it, loss=0.256, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.56e-5, train/loss_step=0.0185, global_step=6761.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  39%|███▉      | 472/1208 [12:42<19:49,  1.62s/it, loss=0.257, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.32e-5, train/loss_step=0.017, global_step=6761.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  39%|███▉      | 473/1208 [12:43<19:46,  1.61s/it, loss=0.257, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.32e-5, train/loss_step=0.017, global_step=6761.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  39%|███▉      | 473/1208 [12:43<19:46,  1.61s/it, loss=0.26, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=6762.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  39%|███▉      | 474/1208 [12:44<19:44,  1.61s/it, loss=0.26, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=6762.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  39%|███▉      | 474/1208 [12:44<19:44,  1.61s/it, loss=0.234, v_num=0, train/loss_simple_step=0.00437, train/loss_vlb_step=2.3e-5, train/loss_step=0.00437, global_step=6762.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  39%|███▉      | 475/1208 [12:45<19:41,  1.61s/it, loss=0.234, v_num=0, train/loss_simple_step=0.00437, train/loss_vlb_step=2.3e-5, train/loss_step=0.00437, global_step=6762.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  39%|███▉      | 475/1208 [12:45<19:41,  1.61s/it, loss=0.216, v_num=0, train/loss_simple_step=0.00624, train/loss_vlb_step=3.09e-5, train/loss_step=0.00624, global_step=6762.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  39%|███▉      | 476/1208 [12:48<19:42,  1.61s/it, loss=0.216, v_num=0, train/loss_simple_step=0.00624, train/loss_vlb_step=3.09e-5, train/loss_step=0.00624, global_step=6762.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  39%|███▉      | 476/1208 [12:48<19:42,  1.61s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=1.95e-5, train/loss_step=0.00361, global_step=6762.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  39%|███▉      | 477/1208 [12:49<19:39,  1.61s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=1.95e-5, train/loss_step=0.00361, global_step=6762.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  39%|███▉      | 477/1208 [12:49<19:39,  1.61s/it, loss=0.187, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000662, train/loss_step=0.187, global_step=6763.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  40%|███▉      | 478/1208 [12:50<19:36,  1.61s/it, loss=0.187, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000662, train/loss_step=0.187, global_step=6763.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  40%|███▉      | 478/1208 [12:50<19:36,  1.61s/it, loss=0.19, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000461, train/loss_step=0.139, global_step=6763.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  40%|███▉      | 479/1208 [12:51<19:34,  1.61s/it, loss=0.19, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000461, train/loss_step=0.139, global_step=6763.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  40%|███▉      | 479/1208 [12:51<19:34,  1.61s/it, loss=0.189, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000541, train/loss_step=0.162, global_step=6763.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  40%|███▉      | 480/1208 [12:54<19:34,  1.61s/it, loss=0.189, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000541, train/loss_step=0.162, global_step=6763.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  40%|███▉      | 480/1208 [12:54<19:34,  1.61s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00897, train/loss_vlb_step=4.26e-5, train/loss_step=0.00897, global_step=6763.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  40%|███▉      | 481/1208 [12:55<19:32,  1.61s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00897, train/loss_vlb_step=4.26e-5, train/loss_step=0.00897, global_step=6763.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  40%|███▉      | 481/1208 [12:55<19:32,  1.61s/it, loss=0.142, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=6764.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  40%|███▉      | 482/1208 [12:56<19:29,  1.61s/it, loss=0.142, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=6764.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  40%|███▉      | 482/1208 [12:56<19:29,  1.61s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0035, train/loss_vlb_step=1.92e-5, train/loss_step=0.0035, global_step=6764.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  40%|███▉      | 483/1208 [12:57<19:27,  1.61s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0035, train/loss_vlb_step=1.92e-5, train/loss_step=0.0035, global_step=6764.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  40%|███▉      | 483/1208 [12:57<19:27,  1.61s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.32e-5, train/loss_step=0.0147, global_step=6764.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  40%|████      | 484/1208 [13:00<19:27,  1.61s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.32e-5, train/loss_step=0.0147, global_step=6764.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  40%|████      | 484/1208 [13:00<19:27,  1.61s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0428, train/loss_vlb_step=0.000157, train/loss_step=0.0428, global_step=6764.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  40%|████      | 485/1208 [13:01<19:25,  1.61s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0428, train/loss_vlb_step=0.000157, train/loss_step=0.0428, global_step=6764.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  40%|████      | 485/1208 [13:01<19:25,  1.61s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0461, train/loss_vlb_step=0.00016, train/loss_step=0.0461, global_step=6765.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  40%|████      | 486/1208 [13:02<19:22,  1.61s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0461, train/loss_vlb_step=0.00016, train/loss_step=0.0461, global_step=6765.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  40%|████      | 486/1208 [13:02<19:22,  1.61s/it, loss=0.125, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000416, train/loss_step=0.126, global_step=6765.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  40%|████      | 487/1208 [13:03<19:20,  1.61s/it, loss=0.125, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000416, train/loss_step=0.126, global_step=6765.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  40%|████      | 487/1208 [13:03<19:20,  1.61s/it, loss=0.105, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=6765.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  40%|████      | 488/1208 [13:06<19:20,  1.61s/it, loss=0.105, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=6765.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  40%|████      | 488/1208 [13:06<19:20,  1.61s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.48e-5, train/loss_step=0.0241, global_step=6765.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  40%|████      | 489/1208 [13:07<19:17,  1.61s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.48e-5, train/loss_step=0.0241, global_step=6765.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  40%|████      | 489/1208 [13:07<19:17,  1.61s/it, loss=0.0731, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00158, train/loss_step=0.301, global_step=6766.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  41%|████      | 490/1208 [13:08<19:15,  1.61s/it, loss=0.0731, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00158, train/loss_step=0.301, global_step=6766.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  41%|████      | 490/1208 [13:08<19:15,  1.61s/it, loss=0.0739, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000118, train/loss_step=0.0311, global_step=6766.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  41%|████      | 491/1208 [13:09<19:12,  1.61s/it, loss=0.0739, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000118, train/loss_step=0.0311, global_step=6766.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  41%|████      | 491/1208 [13:09<19:12,  1.61s/it, loss=0.0749, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000139, train/loss_step=0.0378, global_step=6766.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  41%|████      | 492/1208 [13:12<19:13,  1.61s/it, loss=0.0749, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000139, train/loss_step=0.0378, global_step=6766.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  41%|████      | 492/1208 [13:12<19:13,  1.61s/it, loss=0.11, v_num=0, train/loss_simple_step=0.713, train/loss_vlb_step=0.0458, train/loss_step=0.713, global_step=6766.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]      Epoch 22:  41%|████      | 493/1208 [13:13<19:10,  1.61s/it, loss=0.11, v_num=0, train/loss_simple_step=0.713, train/loss_vlb_step=0.0458, train/loss_step=0.713, global_step=6766.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  41%|████      | 493/1208 [13:13<19:10,  1.61s/it, loss=0.11, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000383, train/loss_step=0.117, global_step=6767.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  41%|████      | 494/1208 [13:14<19:08,  1.61s/it, loss=0.11, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000383, train/loss_step=0.117, global_step=6767.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  41%|████      | 494/1208 [13:14<19:08,  1.61s/it, loss=0.119, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000683, train/loss_step=0.190, global_step=6767.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  41%|████      | 495/1208 [13:15<19:05,  1.61s/it, loss=0.119, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000683, train/loss_step=0.190, global_step=6767.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  41%|████      | 495/1208 [13:15<19:05,  1.61s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0945, train/loss_vlb_step=0.000313, train/loss_step=0.0945, global_step=6767.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  41%|████      | 496/1208 [13:18<19:05,  1.61s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0945, train/loss_vlb_step=0.000313, train/loss_step=0.0945, global_step=6767.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  41%|████      | 496/1208 [13:18<19:05,  1.61s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0522, train/loss_vlb_step=0.000188, train/loss_step=0.0522, global_step=6767.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  41%|████      | 497/1208 [13:19<19:03,  1.61s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0522, train/loss_vlb_step=0.000188, train/loss_step=0.0522, global_step=6767.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  41%|████      | 497/1208 [13:19<19:03,  1.61s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=9.82e-6, train/loss_step=0.00162, global_step=6768.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  41%|████      | 498/1208 [13:20<19:00,  1.61s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=9.82e-6, train/loss_step=0.00162, global_step=6768.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  41%|████      | 498/1208 [13:20<19:00,  1.61s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=2e-5, train/loss_step=0.0036, global_step=6768.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]      Epoch 22:  41%|████▏     | 499/1208 [13:21<18:58,  1.61s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=2e-5, train/loss_step=0.0036, global_step=6768.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  41%|████▏     | 499/1208 [13:21<18:58,  1.61s/it, loss=0.108, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000362, train/loss_step=0.109, global_step=6768.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  41%|████▏     | 500/1208 [13:24<18:58,  1.61s/it, loss=0.108, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000362, train/loss_step=0.109, global_step=6768.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  41%|████▏     | 500/1208 [13:24<18:58,  1.61s/it, loss=0.124, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00171, train/loss_step=0.334, global_step=6768.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  41%|████▏     | 501/1208 [13:25<18:56,  1.61s/it, loss=0.124, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00171, train/loss_step=0.334, global_step=6768.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  41%|████▏     | 501/1208 [13:25<18:56,  1.61s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.02e-5, train/loss_step=0.00173, global_step=6769.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  42%|████▏     | 502/1208 [13:26<18:53,  1.61s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.02e-5, train/loss_step=0.00173, global_step=6769.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  42%|████▏     | 502/1208 [13:26<18:53,  1.61s/it, loss=0.135, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00211, train/loss_step=0.351, global_step=6769.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  42%|████▏     | 503/1208 [13:27<18:51,  1.60s/it, loss=0.135, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00211, train/loss_step=0.351, global_step=6769.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  42%|████▏     | 503/1208 [13:27<18:51,  1.60s/it, loss=0.141, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000406, train/loss_step=0.123, global_step=6769.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  42%|████▏     | 504/1208 [13:30<18:51,  1.61s/it, loss=0.141, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000406, train/loss_step=0.123, global_step=6769.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  42%|████▏     | 504/1208 [13:30<18:51,  1.61s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00873, train/loss_vlb_step=4.08e-5, train/loss_step=0.00873, global_step=6769.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  42%|████▏     | 505/1208 [13:31<18:49,  1.61s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00873, train/loss_vlb_step=4.08e-5, train/loss_step=0.00873, global_step=6769.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  42%|████▏     | 505/1208 [13:31<18:49,  1.61s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.44e-5, train/loss_step=0.00261, global_step=6770.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  42%|████▏     | 506/1208 [13:32<18:46,  1.60s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.44e-5, train/loss_step=0.00261, global_step=6770.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  42%|████▏     | 506/1208 [13:32<18:46,  1.60s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.00024, train/loss_step=0.0702, global_step=6770.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  42%|████▏     | 507/1208 [13:33<18:44,  1.60s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.00024, train/loss_step=0.0702, global_step=6770.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  42%|████▏     | 507/1208 [13:33<18:44,  1.60s/it, loss=0.175, v_num=0, train/loss_simple_step=0.940, train/loss_vlb_step=0.473, train/loss_step=0.940, global_step=6770.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  42%|████▏     | 508/1208 [13:35<18:44,  1.61s/it, loss=0.175, v_num=0, train/loss_simple_step=0.940, train/loss_vlb_step=0.473, train/loss_step=0.940, global_step=6770.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  42%|████▏     | 508/1208 [13:35<18:44,  1.61s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=1.37e-5, train/loss_step=0.0023, global_step=6770.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  42%|████▏     | 509/1208 [13:36<18:41,  1.60s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=1.37e-5, train/loss_step=0.0023, global_step=6770.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  42%|████▏     | 509/1208 [13:36<18:41,  1.61s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.57e-5, train/loss_step=0.0205, global_step=6771.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  42%|████▏     | 510/1208 [13:37<18:39,  1.60s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.57e-5, train/loss_step=0.0205, global_step=6771.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  42%|████▏     | 510/1208 [13:37<18:39,  1.60s/it, loss=0.171, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00102, train/loss_step=0.250, global_step=6771.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  42%|████▏     | 511/1208 [13:38<18:37,  1.60s/it, loss=0.171, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00102, train/loss_step=0.250, global_step=6771.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  42%|████▏     | 511/1208 [13:38<18:37,  1.60s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00757, train/loss_vlb_step=3.71e-5, train/loss_step=0.00757, global_step=6771.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  42%|████▏     | 512/1208 [13:41<18:37,  1.61s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00757, train/loss_vlb_step=3.71e-5, train/loss_step=0.00757, global_step=6771.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  42%|████▏     | 512/1208 [13:41<18:37,  1.61s/it, loss=0.153, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00249, train/loss_step=0.378, global_step=6771.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  42%|████▏     | 513/1208 [13:42<18:34,  1.60s/it, loss=0.153, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00249, train/loss_step=0.378, global_step=6771.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  42%|████▏     | 513/1208 [13:42<18:34,  1.60s/it, loss=0.163, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00179, train/loss_step=0.329, global_step=6772.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  43%|████▎     | 514/1208 [13:43<18:32,  1.60s/it, loss=0.163, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00179, train/loss_step=0.329, global_step=6772.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  43%|████▎     | 514/1208 [13:43<18:32,  1.60s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=2.36e-5, train/loss_step=0.00451, global_step=6772.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  43%|████▎     | 515/1208 [13:44<18:29,  1.60s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=2.36e-5, train/loss_step=0.00451, global_step=6772.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  43%|████▎     | 515/1208 [13:44<18:29,  1.60s/it, loss=0.169, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00286, train/loss_step=0.399, global_step=6772.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  43%|████▎     | 516/1208 [13:47<18:30,  1.60s/it, loss=0.169, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00286, train/loss_step=0.399, global_step=6772.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  43%|████▎     | 516/1208 [13:47<18:30,  1.60s/it, loss=0.177, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000757, train/loss_step=0.210, global_step=6772.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  43%|████▎     | 517/1208 [13:48<18:27,  1.60s/it, loss=0.177, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000757, train/loss_step=0.210, global_step=6772.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  43%|████▎     | 517/1208 [13:48<18:27,  1.60s/it, loss=0.185, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000495, train/loss_step=0.148, global_step=6773.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  43%|████▎     | 518/1208 [13:49<18:25,  1.60s/it, loss=0.185, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000495, train/loss_step=0.148, global_step=6773.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  43%|████▎     | 518/1208 [13:49<18:25,  1.60s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.68e-5, train/loss_step=0.00289, global_step=6773.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  43%|████▎     | 519/1208 [13:50<18:22,  1.60s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.68e-5, train/loss_step=0.00289, global_step=6773.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  43%|████▎     | 519/1208 [13:50<18:22,  1.60s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000125, train/loss_step=0.0339, global_step=6773.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  43%|████▎     | 520/1208 [13:53<18:23,  1.60s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000125, train/loss_step=0.0339, global_step=6773.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  43%|████▎     | 520/1208 [13:53<18:23,  1.60s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0628, train/loss_vlb_step=0.000211, train/loss_step=0.0628, global_step=6773.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  43%|████▎     | 521/1208 [13:54<18:20,  1.60s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0628, train/loss_vlb_step=0.000211, train/loss_step=0.0628, global_step=6773.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  43%|████▎     | 521/1208 [13:54<18:20,  1.60s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.000173, train/loss_step=0.0499, global_step=6774.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  43%|████▎     | 522/1208 [13:55<18:18,  1.60s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.000173, train/loss_step=0.0499, global_step=6774.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  43%|████▎     | 522/1208 [13:55<18:18,  1.60s/it, loss=0.166, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00122, train/loss_step=0.276, global_step=6774.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  43%|████▎     | 523/1208 [13:56<18:15,  1.60s/it, loss=0.166, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00122, train/loss_step=0.276, global_step=6774.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  43%|████▎     | 523/1208 [13:56<18:15,  1.60s/it, loss=0.182, v_num=0, train/loss_simple_step=0.448, train/loss_vlb_step=0.00319, train/loss_step=0.448, global_step=6774.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  43%|████▎     | 524/1208 [13:59<18:15,  1.60s/it, loss=0.182, v_num=0, train/loss_simple_step=0.448, train/loss_vlb_step=0.00319, train/loss_step=0.448, global_step=6774.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  43%|████▎     | 524/1208 [13:59<18:15,  1.60s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.01e-5, train/loss_step=0.0149, global_step=6774.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  43%|████▎     | 525/1208 [14:00<18:13,  1.60s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.01e-5, train/loss_step=0.0149, global_step=6774.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  43%|████▎     | 525/1208 [14:00<18:13,  1.60s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.2e-5, train/loss_step=0.0194, global_step=6775.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  44%|████▎     | 526/1208 [14:01<18:11,  1.60s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.2e-5, train/loss_step=0.0194, global_step=6775.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  44%|████▎     | 526/1208 [14:01<18:11,  1.60s/it, loss=0.204, v_num=0, train/loss_simple_step=0.492, train/loss_vlb_step=0.00681, train/loss_step=0.492, global_step=6775.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  44%|████▎     | 527/1208 [14:02<18:08,  1.60s/it, loss=0.204, v_num=0, train/loss_simple_step=0.492, train/loss_vlb_step=0.00681, train/loss_step=0.492, global_step=6775.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  44%|████▎     | 527/1208 [14:02<18:08,  1.60s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.41e-5, train/loss_step=0.0199, global_step=6775.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  44%|████▎     | 528/1208 [14:05<18:08,  1.60s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.41e-5, train/loss_step=0.0199, global_step=6775.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  44%|████▎     | 528/1208 [14:05<18:08,  1.60s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.09e-5, train/loss_step=0.0141, global_step=6775.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  44%|████▍     | 529/1208 [14:06<18:06,  1.60s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.09e-5, train/loss_step=0.0141, global_step=6775.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  44%|████▍     | 529/1208 [14:06<18:06,  1.60s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00609, train/loss_vlb_step=3.1e-5, train/loss_step=0.00609, global_step=6776.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  44%|████▍     | 530/1208 [14:07<18:04,  1.60s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00609, train/loss_vlb_step=3.1e-5, train/loss_step=0.00609, global_step=6776.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  44%|████▍     | 530/1208 [14:07<18:04,  1.60s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=6.92e-5, train/loss_step=0.0165, global_step=6776.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  44%|████▍     | 531/1208 [14:08<18:01,  1.60s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=6.92e-5, train/loss_step=0.0165, global_step=6776.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  44%|████▍     | 531/1208 [14:08<18:01,  1.60s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.62e-5, train/loss_step=0.0177, global_step=6776.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  44%|████▍     | 532/1208 [14:11<18:01,  1.60s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.62e-5, train/loss_step=0.0177, global_step=6776.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  44%|████▍     | 532/1208 [14:11<18:01,  1.60s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00881, train/loss_vlb_step=4.11e-5, train/loss_step=0.00881, global_step=6776.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  44%|████▍     | 533/1208 [14:12<17:59,  1.60s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00881, train/loss_vlb_step=4.11e-5, train/loss_step=0.00881, global_step=6776.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  44%|████▍     | 533/1208 [14:12<17:59,  1.60s/it, loss=0.142, v_num=0, train/loss_simple_step=0.600, train/loss_vlb_step=0.0104, train/loss_step=0.600, global_step=6777.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]     Epoch 22:  44%|████▍     | 534/1208 [14:13<17:57,  1.60s/it, loss=0.142, v_num=0, train/loss_simple_step=0.600, train/loss_vlb_step=0.0104, train/loss_step=0.600, global_step=6777.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  44%|████▍     | 534/1208 [14:13<17:57,  1.60s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0058, train/loss_vlb_step=3.02e-5, train/loss_step=0.0058, global_step=6777.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  44%|████▍     | 535/1208 [14:14<17:54,  1.60s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0058, train/loss_vlb_step=3.02e-5, train/loss_step=0.0058, global_step=6777.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  44%|████▍     | 535/1208 [14:14<17:54,  1.60s/it, loss=0.156, v_num=0, train/loss_simple_step=0.684, train/loss_vlb_step=0.0118, train/loss_step=0.684, global_step=6777.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  44%|████▍     | 536/1208 [14:17<17:54,  1.60s/it, loss=0.156, v_num=0, train/loss_simple_step=0.684, train/loss_vlb_step=0.0118, train/loss_step=0.684, global_step=6777.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  44%|████▍     | 536/1208 [14:17<17:54,  1.60s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=8.56e-6, train/loss_step=0.00145, global_step=6777.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  44%|████▍     | 537/1208 [14:18<17:52,  1.60s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=8.56e-6, train/loss_step=0.00145, global_step=6777.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  44%|████▍     | 537/1208 [14:18<17:52,  1.60s/it, loss=0.142, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.000223, train/loss_step=0.062, global_step=6778.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  45%|████▍     | 538/1208 [14:19<17:50,  1.60s/it, loss=0.142, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.000223, train/loss_step=0.062, global_step=6778.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  45%|████▍     | 538/1208 [14:19<17:50,  1.60s/it, loss=0.148, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000402, train/loss_step=0.121, global_step=6778.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  45%|████▍     | 539/1208 [14:20<17:47,  1.60s/it, loss=0.148, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000402, train/loss_step=0.121, global_step=6778.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  45%|████▍     | 539/1208 [14:20<17:47,  1.60s/it, loss=0.149, v_num=0, train/loss_simple_step=0.056, train/loss_vlb_step=0.00019, train/loss_step=0.056, global_step=6778.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  45%|████▍     | 540/1208 [14:23<17:47,  1.60s/it, loss=0.149, v_num=0, train/loss_simple_step=0.056, train/loss_vlb_step=0.00019, train/loss_step=0.056, global_step=6778.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  45%|████▍     | 540/1208 [14:23<17:47,  1.60s/it, loss=0.147, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.63e-5, train/loss_step=0.021, global_step=6778.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  45%|████▍     | 541/1208 [14:24<17:45,  1.60s/it, loss=0.147, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.63e-5, train/loss_step=0.021, global_step=6778.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  45%|████▍     | 541/1208 [14:24<17:45,  1.60s/it, loss=0.157, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.0012, train/loss_step=0.265, global_step=6779.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  45%|████▍     | 542/1208 [14:25<17:43,  1.60s/it, loss=0.157, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.0012, train/loss_step=0.265, global_step=6779.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  45%|████▍     | 542/1208 [14:25<17:43,  1.60s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.000141, train/loss_step=0.0394, global_step=6779.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  45%|████▍     | 543/1208 [14:26<17:40,  1.60s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.000141, train/loss_step=0.0394, global_step=6779.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  45%|████▍     | 543/1208 [14:26<17:40,  1.60s/it, loss=0.13, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000425, train/loss_step=0.129, global_step=6779.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  45%|████▌     | 544/1208 [14:29<17:40,  1.60s/it, loss=0.13, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000425, train/loss_step=0.129, global_step=6779.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  45%|████▌     | 544/1208 [14:29<17:40,  1.60s/it, loss=0.16, v_num=0, train/loss_simple_step=0.613, train/loss_vlb_step=0.010, train/loss_step=0.613, global_step=6779.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  45%|████▌     | 545/1208 [14:30<17:38,  1.60s/it, loss=0.16, v_num=0, train/loss_simple_step=0.613, train/loss_vlb_step=0.010, train/loss_step=0.613, global_step=6779.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  45%|████▌     | 545/1208 [14:30<17:38,  1.60s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.23e-5, train/loss_step=0.0112, global_step=6780.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  45%|████▌     | 546/1208 [14:31<17:36,  1.60s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.23e-5, train/loss_step=0.0112, global_step=6780.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  45%|████▌     | 546/1208 [14:31<17:36,  1.60s/it, loss=0.135, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.15e-5, train/loss_step=0.017, global_step=6780.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  45%|████▌     | 547/1208 [14:32<17:33,  1.59s/it, loss=0.135, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.15e-5, train/loss_step=0.017, global_step=6780.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  45%|████▌     | 547/1208 [14:32<17:33,  1.59s/it, loss=0.147, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00104, train/loss_step=0.248, global_step=6780.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  45%|████▌     | 548/1208 [14:34<17:33,  1.60s/it, loss=0.147, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00104, train/loss_step=0.248, global_step=6780.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  45%|████▌     | 548/1208 [14:34<17:33,  1.60s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0487, train/loss_vlb_step=0.000173, train/loss_step=0.0487, global_step=6780.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  45%|████▌     | 549/1208 [14:36<17:31,  1.60s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0487, train/loss_vlb_step=0.000173, train/loss_step=0.0487, global_step=6780.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  45%|████▌     | 549/1208 [14:36<17:31,  1.60s/it, loss=0.155, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000432, train/loss_step=0.127, global_step=6781.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  46%|████▌     | 550/1208 [14:37<17:29,  1.59s/it, loss=0.155, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000432, train/loss_step=0.127, global_step=6781.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  46%|████▌     | 550/1208 [14:37<17:29,  1.59s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.48e-5, train/loss_step=0.0243, global_step=6781.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  46%|████▌     | 551/1208 [14:38<17:26,  1.59s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.48e-5, train/loss_step=0.0243, global_step=6781.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  46%|████▌     | 551/1208 [14:38<17:26,  1.59s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0655, train/loss_vlb_step=0.000231, train/loss_step=0.0655, global_step=6781.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  46%|████▌     | 552/1208 [14:40<17:26,  1.60s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0655, train/loss_vlb_step=0.000231, train/loss_step=0.0655, global_step=6781.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  46%|████▌     | 552/1208 [14:40<17:26,  1.60s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0511, train/loss_vlb_step=0.000182, train/loss_step=0.0511, global_step=6781.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  46%|████▌     | 553/1208 [14:41<17:24,  1.59s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0511, train/loss_vlb_step=0.000182, train/loss_step=0.0511, global_step=6781.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  46%|████▌     | 553/1208 [14:41<17:24,  1.59s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.76e-5, train/loss_step=0.00313, global_step=6782.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  46%|████▌     | 554/1208 [14:42<17:22,  1.59s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.76e-5, train/loss_step=0.00313, global_step=6782.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  46%|████▌     | 554/1208 [14:42<17:22,  1.59s/it, loss=0.138, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000633, train/loss_step=0.179, global_step=6782.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  46%|████▌     | 555/1208 [14:43<17:20,  1.59s/it, loss=0.138, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000633, train/loss_step=0.179, global_step=6782.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  46%|████▌     | 555/1208 [14:43<17:20,  1.59s/it, loss=0.111, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000462, train/loss_step=0.136, global_step=6782.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  46%|████▌     | 556/1208 [14:46<17:19,  1.59s/it, loss=0.111, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000462, train/loss_step=0.136, global_step=6782.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  46%|████▌     | 556/1208 [14:46<17:19,  1.59s/it, loss=0.113, v_num=0, train/loss_simple_step=0.053, train/loss_vlb_step=0.000188, train/loss_step=0.053, global_step=6782.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  46%|████▌     | 557/1208 [14:47<17:17,  1.59s/it, loss=0.113, v_num=0, train/loss_simple_step=0.053, train/loss_vlb_step=0.000188, train/loss_step=0.053, global_step=6782.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  46%|████▌     | 557/1208 [14:47<17:17,  1.59s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0816, train/loss_vlb_step=0.000268, train/loss_step=0.0816, global_step=6783.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  46%|████▌     | 558/1208 [14:48<17:15,  1.59s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0816, train/loss_vlb_step=0.000268, train/loss_step=0.0816, global_step=6783.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  46%|████▌     | 558/1208 [14:48<17:15,  1.59s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000108, train/loss_step=0.0281, global_step=6783.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  46%|████▋     | 559/1208 [14:49<17:13,  1.59s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000108, train/loss_step=0.0281, global_step=6783.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  46%|████▋     | 559/1208 [14:49<17:13,  1.59s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=2.1e-5, train/loss_step=0.00395, global_step=6783.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  46%|████▋     | 560/1208 [14:52<17:13,  1.59s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=2.1e-5, train/loss_step=0.00395, global_step=6783.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  46%|████▋     | 560/1208 [14:52<17:13,  1.59s/it, loss=0.122, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00152, train/loss_step=0.310, global_step=6783.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  46%|████▋     | 561/1208 [14:53<17:10,  1.59s/it, loss=0.122, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00152, train/loss_step=0.310, global_step=6783.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  46%|████▋     | 561/1208 [14:53<17:10,  1.59s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.000138, train/loss_step=0.0351, global_step=6784.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  47%|████▋     | 562/1208 [14:54<17:08,  1.59s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.000138, train/loss_step=0.0351, global_step=6784.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  47%|████▋     | 562/1208 [14:54<17:08,  1.59s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0563, train/loss_vlb_step=0.000195, train/loss_step=0.0563, global_step=6784.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  47%|████▋     | 563/1208 [14:55<17:06,  1.59s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0563, train/loss_vlb_step=0.000195, train/loss_step=0.0563, global_step=6784.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  47%|████▋     | 563/1208 [14:55<17:06,  1.59s/it, loss=0.125, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00379, train/loss_step=0.402, global_step=6784.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  47%|████▋     | 564/1208 [14:58<17:06,  1.59s/it, loss=0.125, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00379, train/loss_step=0.402, global_step=6784.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  47%|████▋     | 564/1208 [14:58<17:06,  1.59s/it, loss=0.115, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00344, train/loss_step=0.428, global_step=6784.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  47%|████▋     | 565/1208 [14:59<17:03,  1.59s/it, loss=0.115, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00344, train/loss_step=0.428, global_step=6784.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  47%|████▋     | 565/1208 [14:59<17:03,  1.59s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.83e-5, train/loss_step=0.0132, global_step=6785.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  47%|████▋     | 566/1208 [15:00<17:01,  1.59s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.83e-5, train/loss_step=0.0132, global_step=6785.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  47%|████▋     | 566/1208 [15:00<17:01,  1.59s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0289, train/loss_vlb_step=0.000109, train/loss_step=0.0289, global_step=6785.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  47%|████▋     | 567/1208 [15:01<16:59,  1.59s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0289, train/loss_vlb_step=0.000109, train/loss_step=0.0289, global_step=6785.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  47%|████▋     | 567/1208 [15:01<16:59,  1.59s/it, loss=0.105, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.43e-5, train/loss_step=0.021, global_step=6785.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  47%|████▋     | 568/1208 [15:04<16:59,  1.59s/it, loss=0.105, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.43e-5, train/loss_step=0.021, global_step=6785.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  47%|████▋     | 568/1208 [15:04<16:59,  1.59s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0983, train/loss_vlb_step=0.000324, train/loss_step=0.0983, global_step=6785.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  47%|████▋     | 569/1208 [15:05<16:56,  1.59s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0983, train/loss_vlb_step=0.000324, train/loss_step=0.0983, global_step=6785.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  47%|████▋     | 569/1208 [15:05<16:56,  1.59s/it, loss=0.111, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000694, train/loss_step=0.194, global_step=6786.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  47%|████▋     | 570/1208 [15:06<16:54,  1.59s/it, loss=0.111, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000694, train/loss_step=0.194, global_step=6786.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  47%|████▋     | 570/1208 [15:06<16:54,  1.59s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000124, train/loss_step=0.0333, global_step=6786.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  47%|████▋     | 571/1208 [15:07<16:52,  1.59s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000124, train/loss_step=0.0333, global_step=6786.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  47%|████▋     | 571/1208 [15:07<16:52,  1.59s/it, loss=0.118, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000855, train/loss_step=0.213, global_step=6786.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  47%|████▋     | 572/1208 [15:10<16:52,  1.59s/it, loss=0.118, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000855, train/loss_step=0.213, global_step=6786.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  47%|████▋     | 572/1208 [15:10<16:52,  1.59s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0773, train/loss_vlb_step=0.000258, train/loss_step=0.0773, global_step=6786.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  47%|████▋     | 573/1208 [15:11<16:50,  1.59s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0773, train/loss_vlb_step=0.000258, train/loss_step=0.0773, global_step=6786.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  47%|████▋     | 573/1208 [15:11<16:50,  1.59s/it, loss=0.134, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00116, train/loss_step=0.281, global_step=6787.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  48%|████▊     | 574/1208 [15:12<16:47,  1.59s/it, loss=0.134, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00116, train/loss_step=0.281, global_step=6787.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  48%|████▊     | 574/1208 [15:12<16:47,  1.59s/it, loss=0.147, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.00373, train/loss_step=0.450, global_step=6787.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  48%|████▊     | 575/1208 [15:13<16:45,  1.59s/it, loss=0.147, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.00373, train/loss_step=0.450, global_step=6787.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  48%|████▊     | 575/1208 [15:13<16:45,  1.59s/it, loss=0.154, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00126, train/loss_step=0.273, global_step=6787.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  48%|████▊     | 576/1208 [15:16<16:45,  1.59s/it, loss=0.154, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00126, train/loss_step=0.273, global_step=6787.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  48%|████▊     | 576/1208 [15:16<16:45,  1.59s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0809, train/loss_vlb_step=0.000269, train/loss_step=0.0809, global_step=6787.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  48%|████▊     | 577/1208 [15:17<16:43,  1.59s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0809, train/loss_vlb_step=0.000269, train/loss_step=0.0809, global_step=6787.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  48%|████▊     | 577/1208 [15:17<16:43,  1.59s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.67e-5, train/loss_step=0.0152, global_step=6788.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  48%|████▊     | 578/1208 [15:18<16:41,  1.59s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.67e-5, train/loss_step=0.0152, global_step=6788.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  48%|████▊     | 578/1208 [15:18<16:41,  1.59s/it, loss=0.156, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000345, train/loss_step=0.104, global_step=6788.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  48%|████▊     | 579/1208 [15:19<16:38,  1.59s/it, loss=0.156, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000345, train/loss_step=0.104, global_step=6788.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  48%|████▊     | 579/1208 [15:19<16:38,  1.59s/it, loss=0.17, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00116, train/loss_step=0.283, global_step=6788.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  48%|████▊     | 580/1208 [15:22<16:38,  1.59s/it, loss=0.17, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00116, train/loss_step=0.283, global_step=6788.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  48%|████▊     | 580/1208 [15:22<16:38,  1.59s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.000183, train/loss_step=0.0508, global_step=6788.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  48%|████▊     | 581/1208 [15:23<16:36,  1.59s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.000183, train/loss_step=0.0508, global_step=6788.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  48%|████▊     | 581/1208 [15:23<16:36,  1.59s/it, loss=0.168, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.0012, train/loss_step=0.266, global_step=6789.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  48%|████▊     | 582/1208 [15:24<16:34,  1.59s/it, loss=0.168, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.0012, train/loss_step=0.266, global_step=6789.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  48%|████▊     | 582/1208 [15:24<16:34,  1.59s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.96e-5, train/loss_step=0.0158, global_step=6789.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  48%|████▊     | 583/1208 [15:25<16:32,  1.59s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.96e-5, train/loss_step=0.0158, global_step=6789.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  48%|████▊     | 583/1208 [15:25<16:32,  1.59s/it, loss=0.156, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000731, train/loss_step=0.201, global_step=6789.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  48%|████▊     | 584/1208 [15:28<16:31,  1.59s/it, loss=0.156, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000731, train/loss_step=0.201, global_step=6789.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  48%|████▊     | 584/1208 [15:28<16:31,  1.59s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.99e-5, train/loss_step=0.0101, global_step=6789.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  48%|████▊     | 585/1208 [15:29<16:29,  1.59s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.99e-5, train/loss_step=0.0101, global_step=6789.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  48%|████▊     | 585/1208 [15:29<16:29,  1.59s/it, loss=0.151, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00155, train/loss_step=0.316, global_step=6790.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  49%|████▊     | 586/1208 [15:30<16:27,  1.59s/it, loss=0.151, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00155, train/loss_step=0.316, global_step=6790.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  49%|████▊     | 586/1208 [15:30<16:27,  1.59s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0724, train/loss_vlb_step=0.000244, train/loss_step=0.0724, global_step=6790.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  49%|████▊     | 587/1208 [15:31<16:25,  1.59s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0724, train/loss_vlb_step=0.000244, train/loss_step=0.0724, global_step=6790.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  49%|████▊     | 587/1208 [15:31<16:25,  1.59s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.62e-5, train/loss_step=0.0127, global_step=6790.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  49%|████▊     | 588/1208 [15:34<16:24,  1.59s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.62e-5, train/loss_step=0.0127, global_step=6790.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  49%|████▊     | 588/1208 [15:34<16:24,  1.59s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.46e-5, train/loss_step=0.0148, global_step=6790.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  49%|████▉     | 589/1208 [15:35<16:22,  1.59s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.46e-5, train/loss_step=0.0148, global_step=6790.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  49%|████▉     | 589/1208 [15:35<16:22,  1.59s/it, loss=0.149, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000762, train/loss_step=0.209, global_step=6791.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  49%|████▉     | 590/1208 [15:36<16:20,  1.59s/it, loss=0.149, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000762, train/loss_step=0.209, global_step=6791.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  49%|████▉     | 590/1208 [15:36<16:20,  1.59s/it, loss=0.162, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00159, train/loss_step=0.294, global_step=6791.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  49%|████▉     | 591/1208 [15:37<16:18,  1.59s/it, loss=0.162, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00159, train/loss_step=0.294, global_step=6791.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  49%|████▉     | 591/1208 [15:37<16:18,  1.59s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00646, train/loss_vlb_step=3.29e-5, train/loss_step=0.00646, global_step=6791.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  49%|████▉     | 592/1208 [15:40<16:18,  1.59s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00646, train/loss_vlb_step=3.29e-5, train/loss_step=0.00646, global_step=6791.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  49%|████▉     | 592/1208 [15:40<16:18,  1.59s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00678, train/loss_vlb_step=3.24e-5, train/loss_step=0.00678, global_step=6791.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  49%|████▉     | 593/1208 [15:41<16:15,  1.59s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00678, train/loss_vlb_step=3.24e-5, train/loss_step=0.00678, global_step=6791.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  49%|████▉     | 593/1208 [15:41<16:15,  1.59s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.23e-5, train/loss_step=0.0233, global_step=6792.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  49%|████▉     | 594/1208 [15:42<16:13,  1.59s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.23e-5, train/loss_step=0.0233, global_step=6792.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  49%|████▉     | 594/1208 [15:42<16:13,  1.59s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.27e-5, train/loss_step=0.00423, global_step=6792.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  49%|████▉     | 595/1208 [15:43<16:11,  1.58s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.27e-5, train/loss_step=0.00423, global_step=6792.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  49%|████▉     | 595/1208 [15:43<16:11,  1.58s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.0001, train/loss_step=0.0249, global_step=6792.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  49%|████▉     | 596/1208 [15:45<16:11,  1.59s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.0001, train/loss_step=0.0249, global_step=6792.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  49%|████▉     | 596/1208 [15:45<16:11,  1.59s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.72e-5, train/loss_step=0.00311, global_step=6792.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  49%|████▉     | 597/1208 [15:46<16:09,  1.59s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.72e-5, train/loss_step=0.00311, global_step=6792.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  49%|████▉     | 597/1208 [15:46<16:09,  1.59s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.00927, train/loss_vlb_step=4.44e-5, train/loss_step=0.00927, global_step=6793.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  50%|████▉     | 598/1208 [15:47<16:06,  1.59s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.00927, train/loss_vlb_step=4.44e-5, train/loss_step=0.00927, global_step=6793.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  50%|████▉     | 598/1208 [15:47<16:06,  1.59s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.0442, train/loss_vlb_step=0.00016, train/loss_step=0.0442, global_step=6793.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  50%|████▉     | 599/1208 [15:48<16:04,  1.58s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.0442, train/loss_vlb_step=0.00016, train/loss_step=0.0442, global_step=6793.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  50%|████▉     | 599/1208 [15:48<16:04,  1.58s/it, loss=0.0795, v_num=0, train/loss_simple_step=0.00385, train/loss_vlb_step=2.11e-5, train/loss_step=0.00385, global_step=6793.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  50%|████▉     | 600/1208 [15:51<16:04,  1.59s/it, loss=0.0795, v_num=0, train/loss_simple_step=0.00385, train/loss_vlb_step=2.11e-5, train/loss_step=0.00385, global_step=6793.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  50%|████▉     | 600/1208 [15:51<16:04,  1.59s/it, loss=0.0823, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=6793.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.86it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:25,  1.85it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.84it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.84it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.84it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.85it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.84it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.85it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.80it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.84it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.84it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.84it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.84it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.84it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.84it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.84it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.84it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.80it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.84it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.85it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.84it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.85it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.84it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.84it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.84it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.84it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:18,  1.84it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.84it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.79it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.85it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.84it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.85it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.84it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.85it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.84it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.85it/s][ADDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.84it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.85it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.84it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.85it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.84it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.85it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.84it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.85it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.84it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.85it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.85it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.85it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.84it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.84it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.85it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.84it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.83it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.85it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.84it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.83it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:18<00:08,  1.85it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.84it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.84it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.83it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.84it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.84it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.84it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.84it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.84it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.84it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.82it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.85it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.84it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.78it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.83it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.85it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.84it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.83it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.85it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.84it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.85it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.84it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.84it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.84it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:24<00:02,  1.84it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:24<00:02,  1.85it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.84it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.84it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.84it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.85it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.83it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.84it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.84it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]Epoch 22:  50%|████▉     | 601/1208 [16:21<16:31,  1.63s/it, loss=0.0823, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=6793.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  50%|████▉     | 601/1208 [16:21<16:31,  1.63s/it, loss=0.0845, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00132, train/loss_step=0.311, global_step=6794.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  50%|████▉     | 602/1208 [16:22<16:28,  1.63s/it, loss=0.0845, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00132, train/loss_step=0.311, global_step=6794.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  50%|████▉     | 602/1208 [16:22<16:28,  1.63s/it, loss=0.0844, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=6.03e-5, train/loss_step=0.0131, global_step=6794.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  50%|████▉     | 603/1208 [16:23<16:26,  1.63s/it, loss=0.0844, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=6.03e-5, train/loss_step=0.0131, global_step=6794.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  50%|████▉     | 603/1208 [16:23<16:26,  1.63s/it, loss=0.0764, v_num=0, train/loss_simple_step=0.0414, train/loss_vlb_step=0.00015, train/loss_step=0.0414, global_step=6794.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  50%|█████     | 604/1208 [16:26<16:26,  1.63s/it, loss=0.0764, v_num=0, train/loss_simple_step=0.0414, train/loss_vlb_step=0.00015, train/loss_step=0.0414, global_step=6794.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  50%|█████     | 604/1208 [16:26<16:26,  1.63s/it, loss=0.0858, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000678, train/loss_step=0.197, global_step=6794.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  50%|█████     | 605/1208 [16:27<16:24,  1.63s/it, loss=0.0858, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000678, train/loss_step=0.197, global_step=6794.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  50%|█████     | 605/1208 [16:27<16:24,  1.63s/it, loss=0.0701, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=1.81e-5, train/loss_step=0.00334, global_step=6795.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  50%|█████     | 606/1208 [16:28<16:21,  1.63s/it, loss=0.0701, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=1.81e-5, train/loss_step=0.00334, global_step=6795.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  50%|█████     | 606/1208 [16:28<16:21,  1.63s/it, loss=0.0687, v_num=0, train/loss_simple_step=0.0436, train/loss_vlb_step=0.000152, train/loss_step=0.0436, global_step=6795.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  50%|█████     | 607/1208 [16:29<16:19,  1.63s/it, loss=0.0687, v_num=0, train/loss_simple_step=0.0436, train/loss_vlb_step=0.000152, train/loss_step=0.0436, global_step=6795.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  50%|█████     | 607/1208 [16:29<16:19,  1.63s/it, loss=0.0697, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000124, train/loss_step=0.0336, global_step=6795.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  50%|█████     | 608/1208 [16:32<16:19,  1.63s/it, loss=0.0697, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000124, train/loss_step=0.0336, global_step=6795.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  50%|█████     | 608/1208 [16:32<16:19,  1.63s/it, loss=0.0696, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.09e-5, train/loss_step=0.0113, global_step=6795.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  50%|█████     | 609/1208 [16:33<16:17,  1.63s/it, loss=0.0696, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.09e-5, train/loss_step=0.0113, global_step=6795.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  50%|█████     | 609/1208 [16:33<16:17,  1.63s/it, loss=0.0598, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.29e-5, train/loss_step=0.0147, global_step=6796.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  50%|█████     | 610/1208 [16:34<16:14,  1.63s/it, loss=0.0598, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.29e-5, train/loss_step=0.0147, global_step=6796.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  50%|█████     | 610/1208 [16:34<16:14,  1.63s/it, loss=0.0513, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000412, train/loss_step=0.124, global_step=6796.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  51%|█████     | 611/1208 [16:35<16:12,  1.63s/it, loss=0.0513, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000412, train/loss_step=0.124, global_step=6796.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  51%|█████     | 611/1208 [16:35<16:12,  1.63s/it, loss=0.0514, v_num=0, train/loss_simple_step=0.00849, train/loss_vlb_step=4.12e-5, train/loss_step=0.00849, global_step=6796.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  51%|█████     | 612/1208 [16:38<16:12,  1.63s/it, loss=0.0514, v_num=0, train/loss_simple_step=0.00849, train/loss_vlb_step=4.12e-5, train/loss_step=0.00849, global_step=6796.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  51%|█████     | 612/1208 [16:38<16:12,  1.63s/it, loss=0.0541, v_num=0, train/loss_simple_step=0.0609, train/loss_vlb_step=0.00021, train/loss_step=0.0609, global_step=6796.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  51%|█████     | 613/1208 [16:39<16:09,  1.63s/it, loss=0.0541, v_num=0, train/loss_simple_step=0.0609, train/loss_vlb_step=0.00021, train/loss_step=0.0609, global_step=6796.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  51%|█████     | 613/1208 [16:39<16:09,  1.63s/it, loss=0.0531, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=1.87e-5, train/loss_step=0.0034, global_step=6797.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  51%|█████     | 614/1208 [16:40<16:07,  1.63s/it, loss=0.0531, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=1.87e-5, train/loss_step=0.0034, global_step=6797.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  51%|█████     | 614/1208 [16:40<16:07,  1.63s/it, loss=0.069, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00188, train/loss_step=0.323, global_step=6797.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  51%|█████     | 615/1208 [16:41<16:05,  1.63s/it, loss=0.069, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00188, train/loss_step=0.323, global_step=6797.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  51%|█████     | 615/1208 [16:41<16:05,  1.63s/it, loss=0.0709, v_num=0, train/loss_simple_step=0.0617, train/loss_vlb_step=0.000209, train/loss_step=0.0617, global_step=6797.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  51%|█████     | 616/1208 [16:44<16:05,  1.63s/it, loss=0.0709, v_num=0, train/loss_simple_step=0.0617, train/loss_vlb_step=0.000209, train/loss_step=0.0617, global_step=6797.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  51%|█████     | 616/1208 [16:44<16:05,  1.63s/it, loss=0.0733, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000188, train/loss_step=0.0524, global_step=6797.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  51%|█████     | 617/1208 [16:45<16:02,  1.63s/it, loss=0.0733, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000188, train/loss_step=0.0524, global_step=6797.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  51%|█████     | 617/1208 [16:45<16:02,  1.63s/it, loss=0.0731, v_num=0, train/loss_simple_step=0.00354, train/loss_vlb_step=1.89e-5, train/loss_step=0.00354, global_step=6798.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  51%|█████     | 618/1208 [16:46<16:00,  1.63s/it, loss=0.0731, v_num=0, train/loss_simple_step=0.00354, train/loss_vlb_step=1.89e-5, train/loss_step=0.00354, global_step=6798.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  51%|█████     | 618/1208 [16:46<16:00,  1.63s/it, loss=0.0776, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000451, train/loss_step=0.135, global_step=6798.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  51%|█████     | 619/1208 [16:47<15:58,  1.63s/it, loss=0.0776, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000451, train/loss_step=0.135, global_step=6798.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  51%|█████     | 619/1208 [16:47<15:58,  1.63s/it, loss=0.0815, v_num=0, train/loss_simple_step=0.0813, train/loss_vlb_step=0.000277, train/loss_step=0.0813, global_step=6798.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  51%|█████▏    | 620/1208 [16:50<15:57,  1.63s/it, loss=0.0815, v_num=0, train/loss_simple_step=0.0813, train/loss_vlb_step=0.000277, train/loss_step=0.0813, global_step=6798.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  51%|█████▏    | 620/1208 [16:50<15:57,  1.63s/it, loss=0.0803, v_num=0, train/loss_simple_step=0.0836, train/loss_vlb_step=0.000278, train/loss_step=0.0836, global_step=6798.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  51%|█████▏    | 621/1208 [16:51<15:55,  1.63s/it, loss=0.0803, v_num=0, train/loss_simple_step=0.0836, train/loss_vlb_step=0.000278, train/loss_step=0.0836, global_step=6798.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  51%|█████▏    | 621/1208 [16:51<15:55,  1.63s/it, loss=0.0651, v_num=0, train/loss_simple_step=0.00797, train/loss_vlb_step=3.83e-5, train/loss_step=0.00797, global_step=6799.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  51%|█████▏    | 622/1208 [16:52<15:53,  1.63s/it, loss=0.0651, v_num=0, train/loss_simple_step=0.00797, train/loss_vlb_step=3.83e-5, train/loss_step=0.00797, global_step=6799.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  51%|█████▏    | 622/1208 [16:52<15:53,  1.63s/it, loss=0.0648, v_num=0, train/loss_simple_step=0.00579, train/loss_vlb_step=2.92e-5, train/loss_step=0.00579, global_step=6799.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  52%|█████▏    | 623/1208 [16:53<15:51,  1.63s/it, loss=0.0648, v_num=0, train/loss_simple_step=0.00579, train/loss_vlb_step=2.92e-5, train/loss_step=0.00579, global_step=6799.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  52%|█████▏    | 623/1208 [16:53<15:51,  1.63s/it, loss=0.073, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000787, train/loss_step=0.207, global_step=6799.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  52%|█████▏    | 624/1208 [16:56<15:50,  1.63s/it, loss=0.073, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000787, train/loss_step=0.207, global_step=6799.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  52%|█████▏    | 624/1208 [16:56<15:50,  1.63s/it, loss=0.0633, v_num=0, train/loss_simple_step=0.00172, train/loss_vlb_step=1.02e-5, train/loss_step=0.00172, global_step=6799.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  52%|█████▏    | 625/1208 [16:57<15:48,  1.63s/it, loss=0.0633, v_num=0, train/loss_simple_step=0.00172, train/loss_vlb_step=1.02e-5, train/loss_step=0.00172, global_step=6799.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  52%|█████▏    | 625/1208 [16:57<15:48,  1.63s/it, loss=0.0739, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000796, train/loss_step=0.215, global_step=6800.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  52%|█████▏    | 626/1208 [16:58<15:46,  1.63s/it, loss=0.0739, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000796, train/loss_step=0.215, global_step=6800.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  52%|█████▏    | 626/1208 [16:58<15:46,  1.63s/it, loss=0.072, v_num=0, train/loss_simple_step=0.00483, train/loss_vlb_step=2.61e-5, train/loss_step=0.00483, global_step=6800.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  52%|█████▏    | 627/1208 [16:59<15:44,  1.63s/it, loss=0.072, v_num=0, train/loss_simple_step=0.00483, train/loss_vlb_step=2.61e-5, train/loss_step=0.00483, global_step=6800.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  52%|█████▏    | 627/1208 [16:59<15:44,  1.63s/it, loss=0.0779, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000516, train/loss_step=0.152, global_step=6800.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  52%|█████▏    | 628/1208 [17:01<15:43,  1.63s/it, loss=0.0779, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000516, train/loss_step=0.152, global_step=6800.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  52%|█████▏    | 628/1208 [17:01<15:43,  1.63s/it, loss=0.0787, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.0001, train/loss_step=0.0277, global_step=6800.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  52%|█████▏    | 629/1208 [17:02<15:41,  1.63s/it, loss=0.0787, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.0001, train/loss_step=0.0277, global_step=6800.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  52%|█████▏    | 629/1208 [17:02<15:41,  1.63s/it, loss=0.0782, v_num=0, train/loss_simple_step=0.00412, train/loss_vlb_step=2.28e-5, train/loss_step=0.00412, global_step=6801.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  52%|█████▏    | 630/1208 [17:03<15:39,  1.63s/it, loss=0.0782, v_num=0, train/loss_simple_step=0.00412, train/loss_vlb_step=2.28e-5, train/loss_step=0.00412, global_step=6801.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  52%|█████▏    | 630/1208 [17:03<15:39,  1.63s/it, loss=0.0726, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.26e-5, train/loss_step=0.0113, global_step=6801.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  52%|█████▏    | 631/1208 [17:05<15:37,  1.62s/it, loss=0.0726, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.26e-5, train/loss_step=0.0113, global_step=6801.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  52%|█████▏    | 631/1208 [17:05<15:37,  1.62s/it, loss=0.0755, v_num=0, train/loss_simple_step=0.0671, train/loss_vlb_step=0.000231, train/loss_step=0.0671, global_step=6801.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  52%|█████▏    | 632/1208 [17:07<15:36,  1.63s/it, loss=0.0755, v_num=0, train/loss_simple_step=0.0671, train/loss_vlb_step=0.000231, train/loss_step=0.0671, global_step=6801.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  52%|█████▏    | 632/1208 [17:07<15:36,  1.63s/it, loss=0.0783, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=6801.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  52%|█████▏    | 633/1208 [17:08<15:34,  1.63s/it, loss=0.0783, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=6801.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  52%|█████▏    | 633/1208 [17:08<15:34,  1.63s/it, loss=0.089, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000898, train/loss_step=0.218, global_step=6802.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  52%|█████▏    | 634/1208 [17:09<15:32,  1.62s/it, loss=0.089, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000898, train/loss_step=0.218, global_step=6802.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  52%|█████▏    | 634/1208 [17:09<15:32,  1.62s/it, loss=0.075, v_num=0, train/loss_simple_step=0.0427, train/loss_vlb_step=0.00015, train/loss_step=0.0427, global_step=6802.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  53%|█████▎    | 635/1208 [17:10<15:30,  1.62s/it, loss=0.075, v_num=0, train/loss_simple_step=0.0427, train/loss_vlb_step=0.00015, train/loss_step=0.0427, global_step=6802.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  53%|█████▎    | 635/1208 [17:10<15:30,  1.62s/it, loss=0.0721, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.91e-5, train/loss_step=0.00351, global_step=6802.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  53%|█████▎    | 636/1208 [17:13<15:29,  1.63s/it, loss=0.0721, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.91e-5, train/loss_step=0.00351, global_step=6802.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  53%|█████▎    | 636/1208 [17:13<15:29,  1.63s/it, loss=0.0765, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.00047, train/loss_step=0.141, global_step=6802.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  53%|█████▎    | 637/1208 [17:14<15:27,  1.62s/it, loss=0.0765, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.00047, train/loss_step=0.141, global_step=6802.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  53%|█████▎    | 637/1208 [17:14<15:27,  1.62s/it, loss=0.0809, v_num=0, train/loss_simple_step=0.0916, train/loss_vlb_step=0.000302, train/loss_step=0.0916, global_step=6803.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  53%|█████▎    | 638/1208 [17:15<15:25,  1.62s/it, loss=0.0809, v_num=0, train/loss_simple_step=0.0916, train/loss_vlb_step=0.000302, train/loss_step=0.0916, global_step=6803.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  53%|█████▎    | 638/1208 [17:15<15:25,  1.62s/it, loss=0.0768, v_num=0, train/loss_simple_step=0.0519, train/loss_vlb_step=0.000177, train/loss_step=0.0519, global_step=6803.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  53%|█████▎    | 639/1208 [17:16<15:23,  1.62s/it, loss=0.0768, v_num=0, train/loss_simple_step=0.0519, train/loss_vlb_step=0.000177, train/loss_step=0.0519, global_step=6803.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  53%|█████▎    | 639/1208 [17:16<15:23,  1.62s/it, loss=0.0731, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=3.38e-5, train/loss_step=0.00677, global_step=6803.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  53%|█████▎    | 640/1208 [17:19<15:22,  1.62s/it, loss=0.0731, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=3.38e-5, train/loss_step=0.00677, global_step=6803.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  53%|█████▎    | 640/1208 [17:19<15:22,  1.62s/it, loss=0.0726, v_num=0, train/loss_simple_step=0.0746, train/loss_vlb_step=0.000252, train/loss_step=0.0746, global_step=6803.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  53%|█████▎    | 641/1208 [17:20<15:20,  1.62s/it, loss=0.0726, v_num=0, train/loss_simple_step=0.0746, train/loss_vlb_step=0.000252, train/loss_step=0.0746, global_step=6803.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  53%|█████▎    | 641/1208 [17:20<15:20,  1.62s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000771, train/loss_step=0.198, global_step=6804.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  53%|█████▎    | 642/1208 [17:21<15:18,  1.62s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000771, train/loss_step=0.198, global_step=6804.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  53%|█████▎    | 642/1208 [17:21<15:18,  1.62s/it, loss=0.114, v_num=0, train/loss_simple_step=0.650, train/loss_vlb_step=0.0336, train/loss_step=0.650, global_step=6804.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  53%|█████▎    | 643/1208 [17:22<15:16,  1.62s/it, loss=0.114, v_num=0, train/loss_simple_step=0.650, train/loss_vlb_step=0.0336, train/loss_step=0.650, global_step=6804.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  53%|█████▎    | 643/1208 [17:22<15:16,  1.62s/it, loss=0.112, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000523, train/loss_step=0.154, global_step=6804.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  53%|█████▎    | 644/1208 [17:25<15:15,  1.62s/it, loss=0.112, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000523, train/loss_step=0.154, global_step=6804.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  53%|█████▎    | 644/1208 [17:25<15:15,  1.62s/it, loss=0.122, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000778, train/loss_step=0.208, global_step=6804.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  53%|█████▎    | 645/1208 [17:26<15:13,  1.62s/it, loss=0.122, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000778, train/loss_step=0.208, global_step=6804.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  53%|█████▎    | 645/1208 [17:26<15:13,  1.62s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.17e-5, train/loss_step=0.00203, global_step=6805.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  53%|█████▎    | 646/1208 [17:27<15:11,  1.62s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.17e-5, train/loss_step=0.00203, global_step=6805.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  53%|█████▎    | 646/1208 [17:27<15:11,  1.62s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0354, train/loss_vlb_step=0.000137, train/loss_step=0.0354, global_step=6805.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  54%|█████▎    | 647/1208 [17:28<15:09,  1.62s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0354, train/loss_vlb_step=0.000137, train/loss_step=0.0354, global_step=6805.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  54%|█████▎    | 647/1208 [17:28<15:09,  1.62s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00562, train/loss_vlb_step=2.85e-5, train/loss_step=0.00562, global_step=6805.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  54%|█████▎    | 648/1208 [17:31<15:08,  1.62s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00562, train/loss_vlb_step=2.85e-5, train/loss_step=0.00562, global_step=6805.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  54%|█████▎    | 648/1208 [17:31<15:08,  1.62s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00163, train/loss_vlb_step=9.71e-6, train/loss_step=0.00163, global_step=6805.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  54%|█████▎    | 649/1208 [17:32<15:06,  1.62s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00163, train/loss_vlb_step=9.71e-6, train/loss_step=0.00163, global_step=6805.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  54%|█████▎    | 649/1208 [17:32<15:06,  1.62s/it, loss=0.115, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000804, train/loss_step=0.218, global_step=6806.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  54%|█████▍    | 650/1208 [17:33<15:04,  1.62s/it, loss=0.115, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000804, train/loss_step=0.218, global_step=6806.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  54%|█████▍    | 650/1208 [17:33<15:04,  1.62s/it, loss=0.12, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000396, train/loss_step=0.120, global_step=6806.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  54%|█████▍    | 651/1208 [17:34<15:02,  1.62s/it, loss=0.12, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000396, train/loss_step=0.120, global_step=6806.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  54%|█████▍    | 651/1208 [17:34<15:02,  1.62s/it, loss=0.123, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=6806.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  54%|█████▍    | 652/1208 [17:37<15:01,  1.62s/it, loss=0.123, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=6806.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  54%|█████▍    | 652/1208 [17:37<15:01,  1.62s/it, loss=0.118, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.4e-5, train/loss_step=0.017, global_step=6806.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  54%|█████▍    | 653/1208 [17:38<14:59,  1.62s/it, loss=0.118, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.4e-5, train/loss_step=0.017, global_step=6806.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  54%|█████▍    | 653/1208 [17:38<14:59,  1.62s/it, loss=0.138, v_num=0, train/loss_simple_step=0.611, train/loss_vlb_step=0.0265, train/loss_step=0.611, global_step=6807.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  54%|█████▍    | 654/1208 [17:39<14:57,  1.62s/it, loss=0.138, v_num=0, train/loss_simple_step=0.611, train/loss_vlb_step=0.0265, train/loss_step=0.611, global_step=6807.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  54%|█████▍    | 654/1208 [17:39<14:57,  1.62s/it, loss=0.161, v_num=0, train/loss_simple_step=0.505, train/loss_vlb_step=0.0062, train/loss_step=0.505, global_step=6807.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  54%|█████▍    | 655/1208 [17:40<14:55,  1.62s/it, loss=0.161, v_num=0, train/loss_simple_step=0.505, train/loss_vlb_step=0.0062, train/loss_step=0.505, global_step=6807.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  54%|█████▍    | 655/1208 [17:40<14:55,  1.62s/it, loss=0.172, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000886, train/loss_step=0.240, global_step=6807.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  54%|█████▍    | 656/1208 [17:43<14:54,  1.62s/it, loss=0.172, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000886, train/loss_step=0.240, global_step=6807.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  54%|█████▍    | 656/1208 [17:43<14:54,  1.62s/it, loss=0.171, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=6807.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  54%|█████▍    | 657/1208 [17:44<14:52,  1.62s/it, loss=0.171, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=6807.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  54%|█████▍    | 657/1208 [17:44<14:52,  1.62s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0385, train/loss_vlb_step=0.000139, train/loss_step=0.0385, global_step=6808.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  54%|█████▍    | 658/1208 [17:45<14:50,  1.62s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0385, train/loss_vlb_step=0.000139, train/loss_step=0.0385, global_step=6808.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  54%|█████▍    | 658/1208 [17:45<14:50,  1.62s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.000131, train/loss_step=0.0351, global_step=6808.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  55%|█████▍    | 659/1208 [17:46<14:48,  1.62s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.000131, train/loss_step=0.0351, global_step=6808.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  55%|█████▍    | 659/1208 [17:46<14:48,  1.62s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0039, train/loss_vlb_step=2.06e-5, train/loss_step=0.0039, global_step=6808.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  55%|█████▍    | 660/1208 [17:49<14:47,  1.62s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0039, train/loss_vlb_step=2.06e-5, train/loss_step=0.0039, global_step=6808.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  55%|█████▍    | 660/1208 [17:49<14:47,  1.62s/it, loss=0.174, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000785, train/loss_step=0.208, global_step=6808.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  55%|█████▍    | 661/1208 [17:50<14:45,  1.62s/it, loss=0.174, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000785, train/loss_step=0.208, global_step=6808.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  55%|█████▍    | 661/1208 [17:50<14:45,  1.62s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.000102, train/loss_step=0.0256, global_step=6809.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  55%|█████▍    | 662/1208 [17:51<14:43,  1.62s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.000102, train/loss_step=0.0256, global_step=6809.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  55%|█████▍    | 662/1208 [17:51<14:43,  1.62s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.34e-5, train/loss_step=0.0182, global_step=6809.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  55%|█████▍    | 663/1208 [17:52<14:41,  1.62s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.34e-5, train/loss_step=0.0182, global_step=6809.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  55%|█████▍    | 663/1208 [17:52<14:41,  1.62s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.92e-5, train/loss_step=0.00341, global_step=6809.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  55%|█████▍    | 664/1208 [17:55<14:40,  1.62s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.92e-5, train/loss_step=0.00341, global_step=6809.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  55%|█████▍    | 664/1208 [17:55<14:40,  1.62s/it, loss=0.122, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000445, train/loss_step=0.133, global_step=6809.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  55%|█████▌    | 665/1208 [17:56<14:38,  1.62s/it, loss=0.122, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000445, train/loss_step=0.133, global_step=6809.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  55%|█████▌    | 665/1208 [17:56<14:38,  1.62s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.57e-5, train/loss_step=0.00278, global_step=6810.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  55%|█████▌    | 666/1208 [17:57<14:36,  1.62s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.57e-5, train/loss_step=0.00278, global_step=6810.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  55%|█████▌    | 666/1208 [17:57<14:36,  1.62s/it, loss=0.132, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000883, train/loss_step=0.217, global_step=6810.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  55%|█████▌    | 667/1208 [17:58<14:34,  1.62s/it, loss=0.132, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000883, train/loss_step=0.217, global_step=6810.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  55%|█████▌    | 667/1208 [17:58<14:34,  1.62s/it, loss=0.137, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000407, train/loss_step=0.124, global_step=6810.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  55%|█████▌    | 668/1208 [18:01<14:33,  1.62s/it, loss=0.137, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000407, train/loss_step=0.124, global_step=6810.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  55%|█████▌    | 668/1208 [18:01<14:33,  1.62s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.76e-5, train/loss_step=0.0215, global_step=6810.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  55%|█████▌    | 669/1208 [18:02<14:31,  1.62s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.76e-5, train/loss_step=0.0215, global_step=6810.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  55%|█████▌    | 669/1208 [18:02<14:31,  1.62s/it, loss=0.134, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000428, train/loss_step=0.128, global_step=6811.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  55%|█████▌    | 670/1208 [18:03<14:29,  1.62s/it, loss=0.134, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000428, train/loss_step=0.128, global_step=6811.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  55%|█████▌    | 670/1208 [18:03<14:29,  1.62s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.39e-5, train/loss_step=0.0233, global_step=6811.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  56%|█████▌    | 671/1208 [18:04<14:27,  1.62s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.39e-5, train/loss_step=0.0233, global_step=6811.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  56%|█████▌    | 671/1208 [18:04<14:27,  1.62s/it, loss=0.142, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00275, train/loss_step=0.383, global_step=6811.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  56%|█████▌    | 672/1208 [18:07<14:27,  1.62s/it, loss=0.142, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00275, train/loss_step=0.383, global_step=6811.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  56%|█████▌    | 672/1208 [18:07<14:27,  1.62s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00372, train/loss_vlb_step=1.99e-5, train/loss_step=0.00372, global_step=6811.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  56%|█████▌    | 673/1208 [18:08<14:24,  1.62s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00372, train/loss_vlb_step=1.99e-5, train/loss_step=0.00372, global_step=6811.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  56%|█████▌    | 673/1208 [18:08<14:24,  1.62s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.67e-5, train/loss_step=0.00305, global_step=6812.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  56%|█████▌    | 674/1208 [18:09<14:22,  1.62s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.67e-5, train/loss_step=0.00305, global_step=6812.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  56%|█████▌    | 674/1208 [18:09<14:22,  1.62s/it, loss=0.107, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00304, train/loss_step=0.423, global_step=6812.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  56%|█████▌    | 675/1208 [18:10<14:20,  1.61s/it, loss=0.107, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00304, train/loss_step=0.423, global_step=6812.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  56%|█████▌    | 675/1208 [18:10<14:20,  1.61s/it, loss=0.108, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00102, train/loss_step=0.253, global_step=6812.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  56%|█████▌    | 676/1208 [18:12<14:20,  1.62s/it, loss=0.108, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00102, train/loss_step=0.253, global_step=6812.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  56%|█████▌    | 676/1208 [18:12<14:20,  1.62s/it, loss=0.121, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00186, train/loss_step=0.380, global_step=6812.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  56%|█████▌    | 677/1208 [18:13<14:18,  1.62s/it, loss=0.121, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00186, train/loss_step=0.380, global_step=6812.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  56%|█████▌    | 677/1208 [18:13<14:18,  1.62s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0903, train/loss_vlb_step=0.0003, train/loss_step=0.0903, global_step=6813.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  56%|█████▌    | 678/1208 [18:14<14:15,  1.61s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0903, train/loss_vlb_step=0.0003, train/loss_step=0.0903, global_step=6813.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  56%|█████▌    | 678/1208 [18:14<14:15,  1.61s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.46e-5, train/loss_step=0.0127, global_step=6813.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  56%|█████▌    | 679/1208 [18:15<14:13,  1.61s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.46e-5, train/loss_step=0.0127, global_step=6813.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  56%|█████▌    | 679/1208 [18:15<14:13,  1.61s/it, loss=0.133, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000755, train/loss_step=0.209, global_step=6813.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  56%|█████▋    | 680/1208 [18:18<14:13,  1.62s/it, loss=0.133, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000755, train/loss_step=0.209, global_step=6813.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  56%|█████▋    | 680/1208 [18:18<14:13,  1.62s/it, loss=0.133, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000803, train/loss_step=0.212, global_step=6813.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  56%|█████▋    | 681/1208 [18:19<14:11,  1.62s/it, loss=0.133, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000803, train/loss_step=0.212, global_step=6813.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  56%|█████▋    | 681/1208 [18:19<14:11,  1.62s/it, loss=0.144, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000927, train/loss_step=0.235, global_step=6814.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  56%|█████▋    | 682/1208 [18:20<14:09,  1.61s/it, loss=0.144, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000927, train/loss_step=0.235, global_step=6814.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  56%|█████▋    | 682/1208 [18:20<14:09,  1.61s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0331, train/loss_vlb_step=0.000126, train/loss_step=0.0331, global_step=6814.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  57%|█████▋    | 683/1208 [18:21<14:06,  1.61s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0331, train/loss_vlb_step=0.000126, train/loss_step=0.0331, global_step=6814.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  57%|█████▋    | 683/1208 [18:21<14:06,  1.61s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.64e-5, train/loss_step=0.00286, global_step=6814.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  57%|█████▋    | 684/1208 [18:24<14:06,  1.62s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.64e-5, train/loss_step=0.00286, global_step=6814.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  57%|█████▋    | 684/1208 [18:24<14:06,  1.62s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00482, train/loss_vlb_step=2.48e-5, train/loss_step=0.00482, global_step=6814.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  57%|█████▋    | 685/1208 [18:25<14:04,  1.61s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00482, train/loss_vlb_step=2.48e-5, train/loss_step=0.00482, global_step=6814.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  57%|█████▋    | 685/1208 [18:25<14:04,  1.61s/it, loss=0.139, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.2e-5, train/loss_step=0.024, global_step=6815.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]     Epoch 22:  57%|█████▋    | 686/1208 [18:26<14:02,  1.61s/it, loss=0.139, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.2e-5, train/loss_step=0.024, global_step=6815.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  57%|█████▋    | 686/1208 [18:26<14:02,  1.61s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.42e-5, train/loss_step=0.0175, global_step=6815.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  57%|█████▋    | 687/1208 [18:27<14:00,  1.61s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.42e-5, train/loss_step=0.0175, global_step=6815.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  57%|█████▋    | 687/1208 [18:27<14:00,  1.61s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0475, train/loss_vlb_step=0.000169, train/loss_step=0.0475, global_step=6815.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  57%|█████▋    | 688/1208 [18:30<13:59,  1.61s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0475, train/loss_vlb_step=0.000169, train/loss_step=0.0475, global_step=6815.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  57%|█████▋    | 688/1208 [18:30<13:59,  1.61s/it, loss=0.131, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000453, train/loss_step=0.135, global_step=6815.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  57%|█████▋    | 689/1208 [18:31<13:57,  1.61s/it, loss=0.131, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000453, train/loss_step=0.135, global_step=6815.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  57%|█████▋    | 689/1208 [18:31<13:57,  1.61s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00746, train/loss_vlb_step=3.68e-5, train/loss_step=0.00746, global_step=6816.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  57%|█████▋    | 690/1208 [18:32<13:55,  1.61s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00746, train/loss_vlb_step=3.68e-5, train/loss_step=0.00746, global_step=6816.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  57%|█████▋    | 690/1208 [18:32<13:55,  1.61s/it, loss=0.129, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=6816.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  57%|█████▋    | 691/1208 [18:33<13:53,  1.61s/it, loss=0.129, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=6816.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  57%|█████▋    | 691/1208 [18:33<13:53,  1.61s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=1.22e-5, train/loss_step=0.00214, global_step=6816.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  57%|█████▋    | 692/1208 [18:36<13:52,  1.61s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=1.22e-5, train/loss_step=0.00214, global_step=6816.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  57%|█████▋    | 692/1208 [18:36<13:52,  1.61s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.22e-5, train/loss_step=0.00207, global_step=6816.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  57%|█████▋    | 693/1208 [18:37<13:50,  1.61s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.22e-5, train/loss_step=0.00207, global_step=6816.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  57%|█████▋    | 693/1208 [18:37<13:50,  1.61s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.6e-5, train/loss_step=0.00285, global_step=6817.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  57%|█████▋    | 694/1208 [18:38<13:48,  1.61s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.6e-5, train/loss_step=0.00285, global_step=6817.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  57%|█████▋    | 694/1208 [18:38<13:48,  1.61s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.26e-5, train/loss_step=0.0112, global_step=6817.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  58%|█████▊    | 695/1208 [18:39<13:46,  1.61s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.26e-5, train/loss_step=0.0112, global_step=6817.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  58%|█████▊    | 695/1208 [18:39<13:46,  1.61s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.416, train/loss_vlb_step=0.00294, train/loss_step=0.416, global_step=6817.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  58%|█████▊    | 696/1208 [18:42<13:45,  1.61s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.416, train/loss_vlb_step=0.00294, train/loss_step=0.416, global_step=6817.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  58%|█████▊    | 696/1208 [18:42<13:45,  1.61s/it, loss=0.0832, v_num=0, train/loss_simple_step=0.0898, train/loss_vlb_step=0.000298, train/loss_step=0.0898, global_step=6817.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  58%|█████▊    | 697/1208 [18:43<13:43,  1.61s/it, loss=0.0832, v_num=0, train/loss_simple_step=0.0898, train/loss_vlb_step=0.000298, train/loss_step=0.0898, global_step=6817.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  58%|█████▊    | 697/1208 [18:43<13:43,  1.61s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00111, train/loss_step=0.283, global_step=6818.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  58%|█████▊    | 698/1208 [18:44<13:41,  1.61s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00111, train/loss_step=0.283, global_step=6818.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  58%|█████▊    | 698/1208 [18:44<13:41,  1.61s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=6818.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  58%|█████▊    | 699/1208 [18:45<13:39,  1.61s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=6818.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  58%|█████▊    | 699/1208 [18:45<13:39,  1.61s/it, loss=0.1, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00107, train/loss_step=0.259, global_step=6818.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  58%|█████▊    | 700/1208 [18:48<13:38,  1.61s/it, loss=0.1, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00107, train/loss_step=0.259, global_step=6818.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  58%|█████▊    | 700/1208 [18:48<13:38,  1.61s/it, loss=0.108, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.0025, train/loss_step=0.365, global_step=6818.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  58%|█████▊    | 701/1208 [18:49<13:36,  1.61s/it, loss=0.108, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.0025, train/loss_step=0.365, global_step=6818.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  58%|█████▊    | 701/1208 [18:49<13:36,  1.61s/it, loss=0.101, v_num=0, train/loss_simple_step=0.099, train/loss_vlb_step=0.000326, train/loss_step=0.099, global_step=6819.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  58%|█████▊    | 702/1208 [18:50<13:34,  1.61s/it, loss=0.101, v_num=0, train/loss_simple_step=0.099, train/loss_vlb_step=0.000326, train/loss_step=0.099, global_step=6819.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  58%|█████▊    | 702/1208 [18:50<13:34,  1.61s/it, loss=0.105, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000367, train/loss_step=0.112, global_step=6819.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  58%|█████▊    | 703/1208 [18:51<13:32,  1.61s/it, loss=0.105, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000367, train/loss_step=0.112, global_step=6819.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  58%|█████▊    | 703/1208 [18:51<13:32,  1.61s/it, loss=0.118, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00136, train/loss_step=0.274, global_step=6819.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  58%|█████▊    | 704/1208 [18:54<13:32,  1.61s/it, loss=0.118, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00136, train/loss_step=0.274, global_step=6819.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  58%|█████▊    | 704/1208 [18:54<13:32,  1.61s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00534, train/loss_vlb_step=2.88e-5, train/loss_step=0.00534, global_step=6819.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  58%|█████▊    | 705/1208 [18:55<13:30,  1.61s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00534, train/loss_vlb_step=2.88e-5, train/loss_step=0.00534, global_step=6819.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  58%|█████▊    | 705/1208 [18:55<13:30,  1.61s/it, loss=0.132, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00136, train/loss_step=0.285, global_step=6820.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  58%|█████▊    | 706/1208 [18:56<13:28,  1.61s/it, loss=0.132, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00136, train/loss_step=0.285, global_step=6820.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  58%|█████▊    | 706/1208 [18:56<13:28,  1.61s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.13e-5, train/loss_step=0.0139, global_step=6820.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  59%|█████▊    | 707/1208 [18:57<13:25,  1.61s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.13e-5, train/loss_step=0.0139, global_step=6820.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  59%|█████▊    | 707/1208 [18:57<13:25,  1.61s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0357, train/loss_vlb_step=0.00013, train/loss_step=0.0357, global_step=6820.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  59%|█████▊    | 708/1208 [19:00<13:25,  1.61s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0357, train/loss_vlb_step=0.00013, train/loss_step=0.0357, global_step=6820.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  59%|█████▊    | 708/1208 [19:00<13:25,  1.61s/it, loss=0.153, v_num=0, train/loss_simple_step=0.589, train/loss_vlb_step=0.0157, train/loss_step=0.589, global_step=6820.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  59%|█████▊    | 709/1208 [19:01<13:23,  1.61s/it, loss=0.153, v_num=0, train/loss_simple_step=0.589, train/loss_vlb_step=0.0157, train/loss_step=0.589, global_step=6820.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  59%|█████▊    | 709/1208 [19:01<13:23,  1.61s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000116, train/loss_step=0.0293, global_step=6821.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  59%|█████▉    | 710/1208 [19:02<13:21,  1.61s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000116, train/loss_step=0.0293, global_step=6821.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  59%|█████▉    | 710/1208 [19:02<13:21,  1.61s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00468, train/loss_vlb_step=2.52e-5, train/loss_step=0.00468, global_step=6821.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  59%|█████▉    | 711/1208 [19:03<13:19,  1.61s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00468, train/loss_vlb_step=2.52e-5, train/loss_step=0.00468, global_step=6821.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  59%|█████▉    | 711/1208 [19:03<13:19,  1.61s/it, loss=0.158, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000625, train/loss_step=0.182, global_step=6821.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  59%|█████▉    | 712/1208 [19:06<13:18,  1.61s/it, loss=0.158, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000625, train/loss_step=0.182, global_step=6821.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  59%|█████▉    | 712/1208 [19:06<13:18,  1.61s/it, loss=0.161, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000174, train/loss_step=0.051, global_step=6821.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  59%|█████▉    | 713/1208 [19:07<13:16,  1.61s/it, loss=0.161, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000174, train/loss_step=0.051, global_step=6821.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  59%|█████▉    | 713/1208 [19:07<13:16,  1.61s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=9.49e-5, train/loss_step=0.0251, global_step=6822.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  59%|█████▉    | 714/1208 [19:08<13:14,  1.61s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=9.49e-5, train/loss_step=0.0251, global_step=6822.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  59%|█████▉    | 714/1208 [19:08<13:14,  1.61s/it, loss=0.178, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00185, train/loss_step=0.328, global_step=6822.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  59%|█████▉    | 715/1208 [19:09<13:12,  1.61s/it, loss=0.178, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00185, train/loss_step=0.328, global_step=6822.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  59%|█████▉    | 715/1208 [19:09<13:12,  1.61s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0721, train/loss_vlb_step=0.000243, train/loss_step=0.0721, global_step=6822.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  59%|█████▉    | 716/1208 [19:12<13:11,  1.61s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0721, train/loss_vlb_step=0.000243, train/loss_step=0.0721, global_step=6822.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  59%|█████▉    | 716/1208 [19:12<13:11,  1.61s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=1.35e-5, train/loss_step=0.00229, global_step=6822.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  59%|█████▉    | 717/1208 [19:13<13:09,  1.61s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=1.35e-5, train/loss_step=0.00229, global_step=6822.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  59%|█████▉    | 717/1208 [19:13<13:09,  1.61s/it, loss=0.155, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.000995, train/loss_step=0.252, global_step=6823.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  59%|█████▉    | 718/1208 [19:14<13:07,  1.61s/it, loss=0.155, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.000995, train/loss_step=0.252, global_step=6823.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  59%|█████▉    | 718/1208 [19:14<13:07,  1.61s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0547, train/loss_vlb_step=0.000186, train/loss_step=0.0547, global_step=6823.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  60%|█████▉    | 719/1208 [19:15<13:05,  1.61s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0547, train/loss_vlb_step=0.000186, train/loss_step=0.0547, global_step=6823.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  60%|█████▉    | 719/1208 [19:15<13:05,  1.61s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0922, train/loss_vlb_step=0.000304, train/loss_step=0.0922, global_step=6823.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  60%|█████▉    | 720/1208 [19:18<13:04,  1.61s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0922, train/loss_vlb_step=0.000304, train/loss_step=0.0922, global_step=6823.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  60%|█████▉    | 720/1208 [19:18<13:04,  1.61s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.41e-5, train/loss_step=0.0115, global_step=6823.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  60%|█████▉    | 721/1208 [19:19<13:02,  1.61s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.41e-5, train/loss_step=0.0115, global_step=6823.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  60%|█████▉    | 721/1208 [19:19<13:02,  1.61s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0722, train/loss_vlb_step=0.000249, train/loss_step=0.0722, global_step=6824.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  60%|█████▉    | 722/1208 [19:20<13:00,  1.61s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0722, train/loss_vlb_step=0.000249, train/loss_step=0.0722, global_step=6824.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  60%|█████▉    | 722/1208 [19:20<13:00,  1.61s/it, loss=0.141, v_num=0, train/loss_simple_step=0.443, train/loss_vlb_step=0.00352, train/loss_step=0.443, global_step=6824.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  60%|█████▉    | 723/1208 [19:21<12:58,  1.61s/it, loss=0.141, v_num=0, train/loss_simple_step=0.443, train/loss_vlb_step=0.00352, train/loss_step=0.443, global_step=6824.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  60%|█████▉    | 723/1208 [19:21<12:58,  1.61s/it, loss=0.133, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=6824.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  60%|█████▉    | 724/1208 [19:23<12:58,  1.61s/it, loss=0.133, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=6824.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  60%|█████▉    | 724/1208 [19:23<12:58,  1.61s/it, loss=0.14, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000484, train/loss_step=0.139, global_step=6824.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  60%|██████    | 725/1208 [19:24<12:56,  1.61s/it, loss=0.14, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000484, train/loss_step=0.139, global_step=6824.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  60%|██████    | 725/1208 [19:24<12:56,  1.61s/it, loss=0.143, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00191, train/loss_step=0.356, global_step=6825.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  60%|██████    | 726/1208 [19:25<12:54,  1.61s/it, loss=0.143, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00191, train/loss_step=0.356, global_step=6825.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  60%|██████    | 726/1208 [19:25<12:54,  1.61s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00424, train/loss_vlb_step=2.24e-5, train/loss_step=0.00424, global_step=6825.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  60%|██████    | 727/1208 [19:26<12:52,  1.61s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00424, train/loss_vlb_step=2.24e-5, train/loss_step=0.00424, global_step=6825.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  60%|██████    | 727/1208 [19:26<12:52,  1.61s/it, loss=0.148, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.00047, train/loss_step=0.139, global_step=6825.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  60%|██████    | 728/1208 [19:29<12:51,  1.61s/it, loss=0.148, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.00047, train/loss_step=0.139, global_step=6825.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  60%|██████    | 728/1208 [19:29<12:51,  1.61s/it, loss=0.148, v_num=0, train/loss_simple_step=0.585, train/loss_vlb_step=0.0172, train/loss_step=0.585, global_step=6825.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  60%|██████    | 729/1208 [19:30<12:49,  1.61s/it, loss=0.148, v_num=0, train/loss_simple_step=0.585, train/loss_vlb_step=0.0172, train/loss_step=0.585, global_step=6825.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  60%|██████    | 729/1208 [19:30<12:49,  1.61s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00512, train/loss_vlb_step=2.66e-5, train/loss_step=0.00512, global_step=6826.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  60%|██████    | 730/1208 [19:31<12:47,  1.61s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00512, train/loss_vlb_step=2.66e-5, train/loss_step=0.00512, global_step=6826.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  60%|██████    | 730/1208 [19:31<12:47,  1.61s/it, loss=0.154, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000532, train/loss_step=0.160, global_step=6826.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  61%|██████    | 731/1208 [19:32<12:45,  1.60s/it, loss=0.154, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000532, train/loss_step=0.160, global_step=6826.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  61%|██████    | 731/1208 [19:32<12:45,  1.60s/it, loss=0.151, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000377, train/loss_step=0.115, global_step=6826.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  61%|██████    | 732/1208 [19:35<12:44,  1.61s/it, loss=0.151, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000377, train/loss_step=0.115, global_step=6826.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  61%|██████    | 732/1208 [19:35<12:44,  1.61s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0834, train/loss_vlb_step=0.000277, train/loss_step=0.0834, global_step=6826.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  61%|██████    | 733/1208 [19:36<12:42,  1.61s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0834, train/loss_vlb_step=0.000277, train/loss_step=0.0834, global_step=6826.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  61%|██████    | 733/1208 [19:36<12:42,  1.61s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00486, train/loss_vlb_step=2.62e-5, train/loss_step=0.00486, global_step=6827.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  61%|██████    | 734/1208 [19:37<12:40,  1.60s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00486, train/loss_vlb_step=2.62e-5, train/loss_step=0.00486, global_step=6827.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  61%|██████    | 734/1208 [19:37<12:40,  1.60s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0694, train/loss_vlb_step=0.000232, train/loss_step=0.0694, global_step=6827.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  61%|██████    | 735/1208 [19:38<12:38,  1.60s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0694, train/loss_vlb_step=0.000232, train/loss_step=0.0694, global_step=6827.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  61%|██████    | 735/1208 [19:38<12:38,  1.60s/it, loss=0.141, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000403, train/loss_step=0.123, global_step=6827.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  61%|██████    | 736/1208 [19:41<12:37,  1.61s/it, loss=0.141, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000403, train/loss_step=0.123, global_step=6827.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  61%|██████    | 736/1208 [19:41<12:37,  1.61s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=2.02e-5, train/loss_step=0.00375, global_step=6827.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  61%|██████    | 737/1208 [19:42<12:35,  1.60s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=2.02e-5, train/loss_step=0.00375, global_step=6827.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  61%|██████    | 737/1208 [19:42<12:35,  1.60s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0063, train/loss_vlb_step=3.21e-5, train/loss_step=0.0063, global_step=6828.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  61%|██████    | 738/1208 [19:43<12:33,  1.60s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0063, train/loss_vlb_step=3.21e-5, train/loss_step=0.0063, global_step=6828.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  61%|██████    | 738/1208 [19:43<12:33,  1.60s/it, loss=0.137, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000886, train/loss_step=0.230, global_step=6828.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  61%|██████    | 739/1208 [19:44<12:31,  1.60s/it, loss=0.137, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000886, train/loss_step=0.230, global_step=6828.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  61%|██████    | 739/1208 [19:44<12:31,  1.60s/it, loss=0.147, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00155, train/loss_step=0.284, global_step=6828.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  61%|██████▏   | 740/1208 [19:47<12:31,  1.60s/it, loss=0.147, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00155, train/loss_step=0.284, global_step=6828.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  61%|██████▏   | 740/1208 [19:47<12:31,  1.60s/it, loss=0.153, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000461, train/loss_step=0.137, global_step=6828.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  61%|██████▏   | 741/1208 [19:48<12:29,  1.60s/it, loss=0.153, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000461, train/loss_step=0.137, global_step=6828.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  61%|██████▏   | 741/1208 [19:48<12:29,  1.60s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.86e-5, train/loss_step=0.0102, global_step=6829.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  61%|██████▏   | 742/1208 [19:49<12:27,  1.60s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.86e-5, train/loss_step=0.0102, global_step=6829.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  61%|██████▏   | 742/1208 [19:49<12:27,  1.60s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0475, train/loss_vlb_step=0.000171, train/loss_step=0.0475, global_step=6829.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  62%|██████▏   | 743/1208 [19:50<12:25,  1.60s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0475, train/loss_vlb_step=0.000171, train/loss_step=0.0475, global_step=6829.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  62%|██████▏   | 743/1208 [19:50<12:25,  1.60s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.000205, train/loss_step=0.0598, global_step=6829.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  62%|██████▏   | 744/1208 [19:53<12:24,  1.60s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.000205, train/loss_step=0.0598, global_step=6829.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  62%|██████▏   | 744/1208 [19:53<12:24,  1.60s/it, loss=0.14, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00196, train/loss_step=0.372, global_step=6829.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  62%|██████▏   | 745/1208 [19:54<12:22,  1.60s/it, loss=0.14, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00196, train/loss_step=0.372, global_step=6829.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  62%|██████▏   | 745/1208 [19:54<12:22,  1.60s/it, loss=0.151, v_num=0, train/loss_simple_step=0.576, train/loss_vlb_step=0.012, train/loss_step=0.576, global_step=6830.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  62%|██████▏   | 746/1208 [19:55<12:20,  1.60s/it, loss=0.151, v_num=0, train/loss_simple_step=0.576, train/loss_vlb_step=0.012, train/loss_step=0.576, global_step=6830.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  62%|██████▏   | 746/1208 [19:55<12:20,  1.60s/it, loss=0.166, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00155, train/loss_step=0.310, global_step=6830.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  62%|██████▏   | 747/1208 [19:56<12:18,  1.60s/it, loss=0.166, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00155, train/loss_step=0.310, global_step=6830.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  62%|██████▏   | 747/1208 [19:56<12:18,  1.60s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00655, train/loss_vlb_step=3.26e-5, train/loss_step=0.00655, global_step=6830.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  62%|██████▏   | 748/1208 [19:59<12:17,  1.60s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00655, train/loss_vlb_step=3.26e-5, train/loss_step=0.00655, global_step=6830.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  62%|██████▏   | 748/1208 [19:59<12:17,  1.60s/it, loss=0.141, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000948, train/loss_step=0.216, global_step=6830.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  62%|██████▏   | 749/1208 [20:00<12:15,  1.60s/it, loss=0.141, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000948, train/loss_step=0.216, global_step=6830.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  62%|██████▏   | 749/1208 [20:00<12:15,  1.60s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.36e-5, train/loss_step=0.0118, global_step=6831.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  62%|██████▏   | 750/1208 [20:01<12:13,  1.60s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.36e-5, train/loss_step=0.0118, global_step=6831.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  62%|██████▏   | 750/1208 [20:01<12:13,  1.60s/it, loss=0.14, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000458, train/loss_step=0.138, global_step=6831.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  62%|██████▏   | 751/1208 [20:02<12:11,  1.60s/it, loss=0.14, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000458, train/loss_step=0.138, global_step=6831.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  62%|██████▏   | 751/1208 [20:02<12:11,  1.60s/it, loss=0.139, v_num=0, train/loss_simple_step=0.097, train/loss_vlb_step=0.000319, train/loss_step=0.097, global_step=6831.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  62%|██████▏   | 752/1208 [20:05<12:10,  1.60s/it, loss=0.139, v_num=0, train/loss_simple_step=0.097, train/loss_vlb_step=0.000319, train/loss_step=0.097, global_step=6831.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  62%|██████▏   | 752/1208 [20:05<12:10,  1.60s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00573, train/loss_vlb_step=2.89e-5, train/loss_step=0.00573, global_step=6831.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  62%|██████▏   | 753/1208 [20:06<12:08,  1.60s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00573, train/loss_vlb_step=2.89e-5, train/loss_step=0.00573, global_step=6831.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  62%|██████▏   | 753/1208 [20:06<12:08,  1.60s/it, loss=0.146, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.00083, train/loss_step=0.207, global_step=6832.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  62%|██████▏   | 754/1208 [20:07<12:06,  1.60s/it, loss=0.146, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.00083, train/loss_step=0.207, global_step=6832.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  62%|██████▏   | 754/1208 [20:07<12:06,  1.60s/it, loss=0.151, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000637, train/loss_step=0.171, global_step=6832.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  62%|██████▎   | 755/1208 [20:08<12:05,  1.60s/it, loss=0.151, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000637, train/loss_step=0.171, global_step=6832.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  62%|██████▎   | 755/1208 [20:08<12:05,  1.60s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00627, train/loss_vlb_step=3.26e-5, train/loss_step=0.00627, global_step=6832.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  63%|██████▎   | 756/1208 [20:11<12:04,  1.60s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00627, train/loss_vlb_step=3.26e-5, train/loss_step=0.00627, global_step=6832.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  63%|██████▎   | 756/1208 [20:11<12:04,  1.60s/it, loss=0.152, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000545, train/loss_step=0.155, global_step=6832.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  63%|██████▎   | 757/1208 [20:12<12:02,  1.60s/it, loss=0.152, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000545, train/loss_step=0.155, global_step=6832.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  63%|██████▎   | 757/1208 [20:12<12:02,  1.60s/it, loss=0.178, v_num=0, train/loss_simple_step=0.519, train/loss_vlb_step=0.00503, train/loss_step=0.519, global_step=6833.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  63%|██████▎   | 758/1208 [20:13<12:00,  1.60s/it, loss=0.178, v_num=0, train/loss_simple_step=0.519, train/loss_vlb_step=0.00503, train/loss_step=0.519, global_step=6833.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  63%|██████▎   | 758/1208 [20:13<12:00,  1.60s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.00014, train/loss_step=0.0373, global_step=6833.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  63%|██████▎   | 759/1208 [20:14<11:58,  1.60s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.00014, train/loss_step=0.0373, global_step=6833.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  63%|██████▎   | 759/1208 [20:14<11:58,  1.60s/it, loss=0.159, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=6833.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  63%|██████▎   | 760/1208 [20:17<11:57,  1.60s/it, loss=0.159, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=6833.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  63%|██████▎   | 760/1208 [20:17<11:57,  1.60s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0632, train/loss_vlb_step=0.000216, train/loss_step=0.0632, global_step=6833.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  63%|██████▎   | 761/1208 [20:18<11:55,  1.60s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0632, train/loss_vlb_step=0.000216, train/loss_step=0.0632, global_step=6833.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  63%|██████▎   | 761/1208 [20:18<11:55,  1.60s/it, loss=0.156, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.21e-5, train/loss_step=0.023, global_step=6834.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  63%|██████▎   | 762/1208 [20:19<11:53,  1.60s/it, loss=0.156, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.21e-5, train/loss_step=0.023, global_step=6834.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  63%|██████▎   | 762/1208 [20:19<11:53,  1.60s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0706, train/loss_vlb_step=0.000234, train/loss_step=0.0706, global_step=6834.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  63%|██████▎   | 763/1208 [20:20<11:51,  1.60s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0706, train/loss_vlb_step=0.000234, train/loss_step=0.0706, global_step=6834.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  63%|██████▎   | 763/1208 [20:20<11:51,  1.60s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=8.18e-5, train/loss_step=0.0189, global_step=6834.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  63%|██████▎   | 764/1208 [20:23<11:50,  1.60s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=8.18e-5, train/loss_step=0.0189, global_step=6834.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  63%|██████▎   | 764/1208 [20:23<11:50,  1.60s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=9.55e-6, train/loss_step=0.00158, global_step=6834.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  63%|██████▎   | 765/1208 [20:24<11:48,  1.60s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=9.55e-6, train/loss_step=0.00158, global_step=6834.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  63%|██████▎   | 765/1208 [20:24<11:48,  1.60s/it, loss=0.133, v_num=0, train/loss_simple_step=0.495, train/loss_vlb_step=0.00566, train/loss_step=0.495, global_step=6835.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  63%|██████▎   | 766/1208 [20:25<11:46,  1.60s/it, loss=0.133, v_num=0, train/loss_simple_step=0.495, train/loss_vlb_step=0.00566, train/loss_step=0.495, global_step=6835.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  63%|██████▎   | 766/1208 [20:25<11:46,  1.60s/it, loss=0.128, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000755, train/loss_step=0.207, global_step=6835.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  63%|██████▎   | 767/1208 [20:26<11:44,  1.60s/it, loss=0.128, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000755, train/loss_step=0.207, global_step=6835.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  63%|██████▎   | 767/1208 [20:26<11:44,  1.60s/it, loss=0.16, v_num=0, train/loss_simple_step=0.652, train/loss_vlb_step=0.011, train/loss_step=0.652, global_step=6835.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  64%|██████▎   | 768/1208 [20:28<11:44,  1.60s/it, loss=0.16, v_num=0, train/loss_simple_step=0.652, train/loss_vlb_step=0.011, train/loss_step=0.652, global_step=6835.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  64%|██████▎   | 768/1208 [20:28<11:44,  1.60s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00476, train/loss_vlb_step=2.47e-5, train/loss_step=0.00476, global_step=6835.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  64%|██████▎   | 769/1208 [20:29<11:42,  1.60s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00476, train/loss_vlb_step=2.47e-5, train/loss_step=0.00476, global_step=6835.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  64%|██████▎   | 769/1208 [20:29<11:42,  1.60s/it, loss=0.182, v_num=0, train/loss_simple_step=0.658, train/loss_vlb_step=0.0231, train/loss_step=0.658, global_step=6836.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]     Epoch 22:  64%|██████▎   | 770/1208 [20:31<11:40,  1.60s/it, loss=0.182, v_num=0, train/loss_simple_step=0.658, train/loss_vlb_step=0.0231, train/loss_step=0.658, global_step=6836.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  64%|██████▎   | 770/1208 [20:31<11:40,  1.60s/it, loss=0.182, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000455, train/loss_step=0.137, global_step=6836.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  64%|██████▍   | 771/1208 [20:32<11:38,  1.60s/it, loss=0.182, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000455, train/loss_step=0.137, global_step=6836.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  64%|██████▍   | 771/1208 [20:32<11:38,  1.60s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0884, train/loss_vlb_step=0.000291, train/loss_step=0.0884, global_step=6836.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  64%|██████▍   | 772/1208 [20:34<11:37,  1.60s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0884, train/loss_vlb_step=0.000291, train/loss_step=0.0884, global_step=6836.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  64%|██████▍   | 772/1208 [20:34<11:37,  1.60s/it, loss=0.19, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000664, train/loss_step=0.188, global_step=6836.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  64%|██████▍   | 773/1208 [20:35<11:35,  1.60s/it, loss=0.19, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000664, train/loss_step=0.188, global_step=6836.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  64%|██████▍   | 773/1208 [20:35<11:35,  1.60s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.01e-5, train/loss_step=0.0136, global_step=6837.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  64%|██████▍   | 774/1208 [20:36<11:33,  1.60s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.01e-5, train/loss_step=0.0136, global_step=6837.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  64%|██████▍   | 774/1208 [20:36<11:33,  1.60s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=2.52e-5, train/loss_step=0.00471, global_step=6837.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  64%|██████▍   | 775/1208 [20:37<11:31,  1.60s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=2.52e-5, train/loss_step=0.00471, global_step=6837.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  64%|██████▍   | 775/1208 [20:37<11:31,  1.60s/it, loss=0.182, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000752, train/loss_step=0.208, global_step=6837.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  64%|██████▍   | 776/1208 [20:40<11:30,  1.60s/it, loss=0.182, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000752, train/loss_step=0.208, global_step=6837.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  64%|██████▍   | 776/1208 [20:40<11:30,  1.60s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=1.42e-5, train/loss_step=0.00239, global_step=6837.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  64%|██████▍   | 777/1208 [20:41<11:28,  1.60s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=1.42e-5, train/loss_step=0.00239, global_step=6837.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  64%|██████▍   | 777/1208 [20:41<11:28,  1.60s/it, loss=0.179, v_num=0, train/loss_simple_step=0.602, train/loss_vlb_step=0.0177, train/loss_step=0.602, global_step=6838.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]     Epoch 22:  64%|██████▍   | 778/1208 [20:42<11:26,  1.60s/it, loss=0.179, v_num=0, train/loss_simple_step=0.602, train/loss_vlb_step=0.0177, train/loss_step=0.602, global_step=6838.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  64%|██████▍   | 778/1208 [20:42<11:26,  1.60s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.54e-5, train/loss_step=0.00261, global_step=6838.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  64%|██████▍   | 779/1208 [20:43<11:24,  1.60s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.54e-5, train/loss_step=0.00261, global_step=6838.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  64%|██████▍   | 779/1208 [20:43<11:24,  1.60s/it, loss=0.193, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00486, train/loss_step=0.425, global_step=6838.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  65%|██████▍   | 780/1208 [20:46<11:24,  1.60s/it, loss=0.193, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00486, train/loss_step=0.425, global_step=6838.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  65%|██████▍   | 780/1208 [20:46<11:24,  1.60s/it, loss=0.19, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=1.1e-5, train/loss_step=0.00184, global_step=6838.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  65%|██████▍   | 781/1208 [20:47<11:22,  1.60s/it, loss=0.19, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=1.1e-5, train/loss_step=0.00184, global_step=6838.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  65%|██████▍   | 781/1208 [20:47<11:22,  1.60s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00713, train/loss_vlb_step=3.34e-5, train/loss_step=0.00713, global_step=6839.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  65%|██████▍   | 782/1208 [20:48<11:20,  1.60s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00713, train/loss_vlb_step=3.34e-5, train/loss_step=0.00713, global_step=6839.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  65%|██████▍   | 782/1208 [20:48<11:20,  1.60s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00558, train/loss_vlb_step=2.81e-5, train/loss_step=0.00558, global_step=6839.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  65%|██████▍   | 783/1208 [20:49<11:18,  1.60s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00558, train/loss_vlb_step=2.81e-5, train/loss_step=0.00558, global_step=6839.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  65%|██████▍   | 783/1208 [20:49<11:18,  1.60s/it, loss=0.19, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=6839.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  65%|██████▍   | 784/1208 [20:52<11:17,  1.60s/it, loss=0.19, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=6839.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  65%|██████▍   | 784/1208 [20:52<11:17,  1.60s/it, loss=0.191, v_num=0, train/loss_simple_step=0.00711, train/loss_vlb_step=3.49e-5, train/loss_step=0.00711, global_step=6839.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  65%|██████▍   | 785/1208 [20:53<11:15,  1.60s/it, loss=0.191, v_num=0, train/loss_simple_step=0.00711, train/loss_vlb_step=3.49e-5, train/loss_step=0.00711, global_step=6839.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  65%|██████▍   | 785/1208 [20:53<11:15,  1.60s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.00014, train/loss_step=0.0395, global_step=6840.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  65%|██████▌   | 786/1208 [20:54<11:13,  1.60s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.00014, train/loss_step=0.0395, global_step=6840.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  65%|██████▌   | 786/1208 [20:54<11:13,  1.60s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0426, train/loss_vlb_step=0.000154, train/loss_step=0.0426, global_step=6840.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  65%|██████▌   | 787/1208 [20:55<11:11,  1.60s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0426, train/loss_vlb_step=0.000154, train/loss_step=0.0426, global_step=6840.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  65%|██████▌   | 787/1208 [20:55<11:11,  1.60s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0923, train/loss_vlb_step=0.000309, train/loss_step=0.0923, global_step=6840.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  65%|██████▌   | 788/1208 [20:58<11:10,  1.60s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0923, train/loss_vlb_step=0.000309, train/loss_step=0.0923, global_step=6840.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  65%|██████▌   | 788/1208 [20:58<11:10,  1.60s/it, loss=0.143, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000857, train/loss_step=0.222, global_step=6840.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  65%|██████▌   | 789/1208 [20:59<11:08,  1.60s/it, loss=0.143, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000857, train/loss_step=0.222, global_step=6840.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  65%|██████▌   | 789/1208 [20:59<11:08,  1.60s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0766, train/loss_vlb_step=0.000263, train/loss_step=0.0766, global_step=6841.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  65%|██████▌   | 790/1208 [21:00<11:06,  1.60s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0766, train/loss_vlb_step=0.000263, train/loss_step=0.0766, global_step=6841.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  65%|██████▌   | 790/1208 [21:00<11:06,  1.60s/it, loss=0.113, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000431, train/loss_step=0.129, global_step=6841.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  65%|██████▌   | 791/1208 [21:01<11:05,  1.59s/it, loss=0.113, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000431, train/loss_step=0.129, global_step=6841.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  65%|██████▌   | 791/1208 [21:01<11:05,  1.59s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000163, train/loss_step=0.0454, global_step=6841.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  66%|██████▌   | 792/1208 [21:04<11:04,  1.60s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000163, train/loss_step=0.0454, global_step=6841.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  66%|██████▌   | 792/1208 [21:04<11:04,  1.60s/it, loss=0.11, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000616, train/loss_step=0.178, global_step=6841.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  66%|██████▌   | 793/1208 [21:05<11:02,  1.60s/it, loss=0.11, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000616, train/loss_step=0.178, global_step=6841.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  66%|██████▌   | 793/1208 [21:05<11:02,  1.60s/it, loss=0.116, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000449, train/loss_step=0.132, global_step=6842.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  66%|██████▌   | 794/1208 [21:06<11:00,  1.60s/it, loss=0.116, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000449, train/loss_step=0.132, global_step=6842.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  66%|██████▌   | 794/1208 [21:06<11:00,  1.60s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0572, train/loss_vlb_step=0.000196, train/loss_step=0.0572, global_step=6842.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  66%|██████▌   | 795/1208 [21:07<10:58,  1.59s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0572, train/loss_vlb_step=0.000196, train/loss_step=0.0572, global_step=6842.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  66%|██████▌   | 795/1208 [21:07<10:58,  1.59s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.95e-5, train/loss_step=0.0134, global_step=6842.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  66%|██████▌   | 796/1208 [21:10<10:57,  1.60s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.95e-5, train/loss_step=0.0134, global_step=6842.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  66%|██████▌   | 796/1208 [21:10<10:57,  1.60s/it, loss=0.135, v_num=0, train/loss_simple_step=0.515, train/loss_vlb_step=0.00656, train/loss_step=0.515, global_step=6842.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  66%|██████▌   | 797/1208 [21:11<10:55,  1.60s/it, loss=0.135, v_num=0, train/loss_simple_step=0.515, train/loss_vlb_step=0.00656, train/loss_step=0.515, global_step=6842.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  66%|██████▌   | 797/1208 [21:11<10:55,  1.60s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00436, train/loss_vlb_step=2.29e-5, train/loss_step=0.00436, global_step=6843.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  66%|██████▌   | 798/1208 [21:12<10:53,  1.59s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00436, train/loss_vlb_step=2.29e-5, train/loss_step=0.00436, global_step=6843.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  66%|██████▌   | 798/1208 [21:12<10:53,  1.59s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00764, train/loss_vlb_step=3.71e-5, train/loss_step=0.00764, global_step=6843.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  66%|██████▌   | 799/1208 [21:13<10:51,  1.59s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00764, train/loss_vlb_step=3.71e-5, train/loss_step=0.00764, global_step=6843.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  66%|██████▌   | 799/1208 [21:13<10:51,  1.59s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.00488, train/loss_vlb_step=2.5e-5, train/loss_step=0.00488, global_step=6843.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  66%|██████▌   | 800/1208 [21:16<10:50,  1.60s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.00488, train/loss_vlb_step=2.5e-5, train/loss_step=0.00488, global_step=6843.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  66%|██████▌   | 800/1208 [21:16<10:50,  1.60s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000494, train/loss_step=0.142, global_step=6843.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  66%|██████▋   | 801/1208 [21:17<10:48,  1.59s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000494, train/loss_step=0.142, global_step=6843.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  66%|██████▋   | 801/1208 [21:17<10:48,  1.59s/it, loss=0.093, v_num=0, train/loss_simple_step=0.0414, train/loss_vlb_step=0.000152, train/loss_step=0.0414, global_step=6844.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  66%|██████▋   | 802/1208 [21:18<10:47,  1.59s/it, loss=0.093, v_num=0, train/loss_simple_step=0.0414, train/loss_vlb_step=0.000152, train/loss_step=0.0414, global_step=6844.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  66%|██████▋   | 802/1208 [21:18<10:47,  1.59s/it, loss=0.115, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00433, train/loss_step=0.447, global_step=6844.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  66%|██████▋   | 803/1208 [21:19<10:45,  1.59s/it, loss=0.115, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00433, train/loss_step=0.447, global_step=6844.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  66%|██████▋   | 803/1208 [21:19<10:45,  1.59s/it, loss=0.118, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000527, train/loss_step=0.155, global_step=6844.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  67%|██████▋   | 804/1208 [21:22<10:44,  1.59s/it, loss=0.118, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000527, train/loss_step=0.155, global_step=6844.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  67%|██████▋   | 804/1208 [21:22<10:44,  1.59s/it, loss=0.125, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000482, train/loss_step=0.145, global_step=6844.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  67%|██████▋   | 805/1208 [21:23<10:42,  1.59s/it, loss=0.125, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000482, train/loss_step=0.145, global_step=6844.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  67%|██████▋   | 805/1208 [21:23<10:42,  1.59s/it, loss=0.14, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00187, train/loss_step=0.352, global_step=6845.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  67%|██████▋   | 806/1208 [21:24<10:40,  1.59s/it, loss=0.14, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00187, train/loss_step=0.352, global_step=6845.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  67%|██████▋   | 806/1208 [21:24<10:40,  1.59s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00667, train/loss_vlb_step=3.36e-5, train/loss_step=0.00667, global_step=6845.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  67%|██████▋   | 807/1208 [21:25<10:38,  1.59s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00667, train/loss_vlb_step=3.36e-5, train/loss_step=0.00667, global_step=6845.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  67%|██████▋   | 807/1208 [21:25<10:38,  1.59s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0636, train/loss_vlb_step=0.000217, train/loss_step=0.0636, global_step=6845.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  67%|██████▋   | 808/1208 [21:28<10:37,  1.59s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0636, train/loss_vlb_step=0.000217, train/loss_step=0.0636, global_step=6845.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  67%|██████▋   | 808/1208 [21:28<10:37,  1.59s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.000111, train/loss_step=0.0276, global_step=6845.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  67%|██████▋   | 809/1208 [21:29<10:35,  1.59s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.000111, train/loss_step=0.0276, global_step=6845.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  67%|██████▋   | 809/1208 [21:29<10:35,  1.59s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000129, train/loss_step=0.0353, global_step=6846.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  67%|██████▋   | 810/1208 [21:30<10:33,  1.59s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000129, train/loss_step=0.0353, global_step=6846.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  67%|██████▋   | 810/1208 [21:30<10:33,  1.59s/it, loss=0.144, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00478, train/loss_step=0.499, global_step=6846.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  67%|██████▋   | 811/1208 [21:31<10:32,  1.59s/it, loss=0.144, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00478, train/loss_step=0.499, global_step=6846.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  67%|██████▋   | 811/1208 [21:31<10:32,  1.59s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.000178, train/loss_step=0.0499, global_step=6846.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  67%|██████▋   | 812/1208 [21:34<10:31,  1.59s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.000178, train/loss_step=0.0499, global_step=6846.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  67%|██████▋   | 812/1208 [21:34<10:31,  1.59s/it, loss=0.148, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00111, train/loss_step=0.257, global_step=6846.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  67%|██████▋   | 813/1208 [21:35<10:29,  1.59s/it, loss=0.148, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00111, train/loss_step=0.257, global_step=6846.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  67%|██████▋   | 813/1208 [21:35<10:29,  1.59s/it, loss=0.155, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00132, train/loss_step=0.283, global_step=6847.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  67%|██████▋   | 814/1208 [21:36<10:27,  1.59s/it, loss=0.155, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00132, train/loss_step=0.283, global_step=6847.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  67%|██████▋   | 814/1208 [21:36<10:27,  1.59s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.00012, train/loss_step=0.0307, global_step=6847.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  67%|██████▋   | 815/1208 [21:37<10:25,  1.59s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.00012, train/loss_step=0.0307, global_step=6847.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  67%|██████▋   | 815/1208 [21:37<10:25,  1.59s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.96e-5, train/loss_step=0.0103, global_step=6847.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  68%|██████▊   | 816/1208 [21:39<10:24,  1.59s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.96e-5, train/loss_step=0.0103, global_step=6847.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  68%|██████▊   | 816/1208 [21:39<10:24,  1.59s/it, loss=0.142, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00115, train/loss_step=0.280, global_step=6847.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  68%|██████▊   | 817/1208 [21:40<10:22,  1.59s/it, loss=0.142, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00115, train/loss_step=0.280, global_step=6847.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  68%|██████▊   | 817/1208 [21:40<10:22,  1.59s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0582, train/loss_vlb_step=0.000201, train/loss_step=0.0582, global_step=6848.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  68%|██████▊   | 818/1208 [21:41<10:20,  1.59s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0582, train/loss_vlb_step=0.000201, train/loss_step=0.0582, global_step=6848.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  68%|██████▊   | 818/1208 [21:41<10:20,  1.59s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.000121, train/loss_step=0.0322, global_step=6848.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  68%|██████▊   | 819/1208 [21:42<10:18,  1.59s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.000121, train/loss_step=0.0322, global_step=6848.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  68%|██████▊   | 819/1208 [21:42<10:18,  1.59s/it, loss=0.178, v_num=0, train/loss_simple_step=0.650, train/loss_vlb_step=0.0152, train/loss_step=0.650, global_step=6848.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  68%|██████▊   | 820/1208 [21:45<10:17,  1.59s/it, loss=0.178, v_num=0, train/loss_simple_step=0.650, train/loss_vlb_step=0.0152, train/loss_step=0.650, global_step=6848.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  68%|██████▊   | 820/1208 [21:45<10:17,  1.59s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=7.98e-5, train/loss_step=0.0199, global_step=6848.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  68%|██████▊   | 821/1208 [21:46<10:16,  1.59s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=7.98e-5, train/loss_step=0.0199, global_step=6848.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  68%|██████▊   | 821/1208 [21:46<10:16,  1.59s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0784, train/loss_vlb_step=0.000262, train/loss_step=0.0784, global_step=6849.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  68%|██████▊   | 822/1208 [21:47<10:14,  1.59s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0784, train/loss_vlb_step=0.000262, train/loss_step=0.0784, global_step=6849.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  68%|██████▊   | 822/1208 [21:47<10:14,  1.59s/it, loss=0.164, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000997, train/loss_step=0.250, global_step=6849.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  68%|██████▊   | 823/1208 [21:48<10:12,  1.59s/it, loss=0.164, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000997, train/loss_step=0.250, global_step=6849.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  68%|██████▊   | 823/1208 [21:48<10:12,  1.59s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.05e-5, train/loss_step=0.00178, global_step=6849.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  68%|██████▊   | 824/1208 [21:51<10:11,  1.59s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.05e-5, train/loss_step=0.00178, global_step=6849.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  68%|██████▊   | 824/1208 [21:51<10:11,  1.59s/it, loss=0.157, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000489, train/loss_step=0.145, global_step=6849.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  68%|██████▊   | 825/1208 [21:52<10:09,  1.59s/it, loss=0.157, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000489, train/loss_step=0.145, global_step=6849.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  68%|██████▊   | 825/1208 [21:52<10:09,  1.59s/it, loss=0.15, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000863, train/loss_step=0.227, global_step=6850.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  68%|██████▊   | 826/1208 [21:53<10:07,  1.59s/it, loss=0.15, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000863, train/loss_step=0.227, global_step=6850.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  68%|██████▊   | 826/1208 [21:53<10:07,  1.59s/it, loss=0.163, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00108, train/loss_step=0.265, global_step=6850.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  68%|██████▊   | 827/1208 [21:54<10:05,  1.59s/it, loss=0.163, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00108, train/loss_step=0.265, global_step=6850.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  68%|██████▊   | 827/1208 [21:54<10:05,  1.59s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.13e-5, train/loss_step=0.0142, global_step=6850.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  69%|██████▊   | 828/1208 [21:57<10:04,  1.59s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.13e-5, train/loss_step=0.0142, global_step=6850.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  69%|██████▊   | 828/1208 [21:57<10:04,  1.59s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0271, train/loss_vlb_step=0.000105, train/loss_step=0.0271, global_step=6850.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  69%|██████▊   | 829/1208 [21:58<10:02,  1.59s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0271, train/loss_vlb_step=0.000105, train/loss_step=0.0271, global_step=6850.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  69%|██████▊   | 829/1208 [21:58<10:02,  1.59s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0711, train/loss_vlb_step=0.000235, train/loss_step=0.0711, global_step=6851.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  69%|██████▊   | 830/1208 [21:59<10:01,  1.59s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0711, train/loss_vlb_step=0.000235, train/loss_step=0.0711, global_step=6851.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  69%|██████▊   | 830/1208 [21:59<10:01,  1.59s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0607, train/loss_vlb_step=0.000201, train/loss_step=0.0607, global_step=6851.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  69%|██████▉   | 831/1208 [22:00<09:59,  1.59s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0607, train/loss_vlb_step=0.000201, train/loss_step=0.0607, global_step=6851.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  69%|██████▉   | 831/1208 [22:00<09:59,  1.59s/it, loss=0.143, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.00035, train/loss_step=0.106, global_step=6851.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  69%|██████▉   | 832/1208 [22:03<09:58,  1.59s/it, loss=0.143, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.00035, train/loss_step=0.106, global_step=6851.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  69%|██████▉   | 832/1208 [22:03<09:58,  1.59s/it, loss=0.144, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00114, train/loss_step=0.273, global_step=6851.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  69%|██████▉   | 833/1208 [22:04<09:56,  1.59s/it, loss=0.144, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00114, train/loss_step=0.273, global_step=6851.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  69%|██████▉   | 833/1208 [22:04<09:56,  1.59s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=2.02e-5, train/loss_step=0.00365, global_step=6852.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  69%|██████▉   | 834/1208 [22:05<09:54,  1.59s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=2.02e-5, train/loss_step=0.00365, global_step=6852.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  69%|██████▉   | 834/1208 [22:05<09:54,  1.59s/it, loss=0.136, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000501, train/loss_step=0.149, global_step=6852.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  69%|██████▉   | 835/1208 [22:06<09:52,  1.59s/it, loss=0.136, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000501, train/loss_step=0.149, global_step=6852.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  69%|██████▉   | 835/1208 [22:06<09:52,  1.59s/it, loss=0.145, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000708, train/loss_step=0.194, global_step=6852.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  69%|██████▉   | 836/1208 [22:09<09:51,  1.59s/it, loss=0.145, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000708, train/loss_step=0.194, global_step=6852.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  69%|██████▉   | 836/1208 [22:09<09:51,  1.59s/it, loss=0.137, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=6852.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  69%|██████▉   | 837/1208 [22:10<09:49,  1.59s/it, loss=0.137, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=6852.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  69%|██████▉   | 837/1208 [22:10<09:49,  1.59s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00595, train/loss_vlb_step=3.14e-5, train/loss_step=0.00595, global_step=6853.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  69%|██████▉   | 838/1208 [22:11<09:47,  1.59s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00595, train/loss_vlb_step=3.14e-5, train/loss_step=0.00595, global_step=6853.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  69%|██████▉   | 838/1208 [22:11<09:47,  1.59s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.31e-5, train/loss_step=0.0119, global_step=6853.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  69%|██████▉   | 839/1208 [22:12<09:46,  1.59s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.31e-5, train/loss_step=0.0119, global_step=6853.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  69%|██████▉   | 839/1208 [22:12<09:46,  1.59s/it, loss=0.109, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000591, train/loss_step=0.166, global_step=6853.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  70%|██████▉   | 840/1208 [22:15<09:45,  1.59s/it, loss=0.109, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000591, train/loss_step=0.166, global_step=6853.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  70%|██████▉   | 840/1208 [22:15<09:45,  1.59s/it, loss=0.138, v_num=0, train/loss_simple_step=0.593, train/loss_vlb_step=0.00858, train/loss_step=0.593, global_step=6853.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  70%|██████▉   | 841/1208 [22:16<09:43,  1.59s/it, loss=0.138, v_num=0, train/loss_simple_step=0.593, train/loss_vlb_step=0.00858, train/loss_step=0.593, global_step=6853.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  70%|██████▉   | 841/1208 [22:16<09:43,  1.59s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=9.41e-5, train/loss_step=0.0244, global_step=6854.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  70%|██████▉   | 842/1208 [22:17<09:41,  1.59s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=9.41e-5, train/loss_step=0.0244, global_step=6854.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  70%|██████▉   | 842/1208 [22:17<09:41,  1.59s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000129, train/loss_step=0.0344, global_step=6854.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  70%|██████▉   | 843/1208 [22:18<09:39,  1.59s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000129, train/loss_step=0.0344, global_step=6854.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  70%|██████▉   | 843/1208 [22:18<09:39,  1.59s/it, loss=0.135, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000754, train/loss_step=0.210, global_step=6854.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  70%|██████▉   | 844/1208 [22:21<09:38,  1.59s/it, loss=0.135, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000754, train/loss_step=0.210, global_step=6854.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  70%|██████▉   | 844/1208 [22:21<09:38,  1.59s/it, loss=0.138, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000909, train/loss_step=0.213, global_step=6854.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  70%|██████▉   | 845/1208 [22:22<09:36,  1.59s/it, loss=0.138, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000909, train/loss_step=0.213, global_step=6854.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  70%|██████▉   | 845/1208 [22:22<09:36,  1.59s/it, loss=0.149, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00349, train/loss_step=0.439, global_step=6855.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  70%|███████   | 846/1208 [22:23<09:34,  1.59s/it, loss=0.149, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00349, train/loss_step=0.439, global_step=6855.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  70%|███████   | 846/1208 [22:23<09:34,  1.59s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0091, train/loss_vlb_step=4.22e-5, train/loss_step=0.0091, global_step=6855.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  70%|███████   | 847/1208 [22:24<09:32,  1.59s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0091, train/loss_vlb_step=4.22e-5, train/loss_step=0.0091, global_step=6855.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  70%|███████   | 847/1208 [22:24<09:32,  1.59s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.000143, train/loss_step=0.0393, global_step=6855.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  70%|███████   | 848/1208 [22:27<09:31,  1.59s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.000143, train/loss_step=0.0393, global_step=6855.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  70%|███████   | 848/1208 [22:27<09:31,  1.59s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000127, train/loss_step=0.0337, global_step=6855.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  70%|███████   | 849/1208 [22:28<09:30,  1.59s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000127, train/loss_step=0.0337, global_step=6855.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  70%|███████   | 849/1208 [22:28<09:30,  1.59s/it, loss=0.139, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=6856.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  70%|███████   | 850/1208 [22:29<09:28,  1.59s/it, loss=0.139, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=6856.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  70%|███████   | 850/1208 [22:29<09:28,  1.59s/it, loss=0.15, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.0013, train/loss_step=0.284, global_step=6856.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  70%|███████   | 851/1208 [22:30<09:26,  1.59s/it, loss=0.15, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.0013, train/loss_step=0.284, global_step=6856.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  70%|███████   | 851/1208 [22:30<09:26,  1.59s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00981, train/loss_vlb_step=4.42e-5, train/loss_step=0.00981, global_step=6856.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  71%|███████   | 852/1208 [22:33<09:25,  1.59s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00981, train/loss_vlb_step=4.42e-5, train/loss_step=0.00981, global_step=6856.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  71%|███████   | 852/1208 [22:33<09:25,  1.59s/it, loss=0.14, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.00057, train/loss_step=0.170, global_step=6856.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]     Epoch 22:  71%|███████   | 853/1208 [22:34<09:23,  1.59s/it, loss=0.14, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.00057, train/loss_step=0.170, global_step=6856.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  71%|███████   | 853/1208 [22:34<09:23,  1.59s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0536, train/loss_vlb_step=0.000188, train/loss_step=0.0536, global_step=6857.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  71%|███████   | 854/1208 [22:35<09:21,  1.59s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0536, train/loss_vlb_step=0.000188, train/loss_step=0.0536, global_step=6857.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  71%|███████   | 854/1208 [22:35<09:21,  1.59s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00607, train/loss_vlb_step=3.05e-5, train/loss_step=0.00607, global_step=6857.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  71%|███████   | 855/1208 [22:36<09:19,  1.59s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00607, train/loss_vlb_step=3.05e-5, train/loss_step=0.00607, global_step=6857.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  71%|███████   | 855/1208 [22:36<09:19,  1.59s/it, loss=0.137, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000776, train/loss_step=0.215, global_step=6857.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  71%|███████   | 856/1208 [22:38<09:18,  1.59s/it, loss=0.137, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000776, train/loss_step=0.215, global_step=6857.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  71%|███████   | 856/1208 [22:38<09:18,  1.59s/it, loss=0.139, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000556, train/loss_step=0.162, global_step=6857.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  71%|███████   | 857/1208 [22:40<09:17,  1.59s/it, loss=0.139, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000556, train/loss_step=0.162, global_step=6857.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  71%|███████   | 857/1208 [22:40<09:17,  1.59s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00705, train/loss_vlb_step=3.58e-5, train/loss_step=0.00705, global_step=6858.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  71%|███████   | 858/1208 [22:41<09:15,  1.59s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00705, train/loss_vlb_step=3.58e-5, train/loss_step=0.00705, global_step=6858.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  71%|███████   | 858/1208 [22:41<09:15,  1.59s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.46e-5, train/loss_step=0.0173, global_step=6858.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  71%|███████   | 859/1208 [22:42<09:13,  1.59s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.46e-5, train/loss_step=0.0173, global_step=6858.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  71%|███████   | 859/1208 [22:42<09:13,  1.59s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00484, train/loss_vlb_step=2.56e-5, train/loss_step=0.00484, global_step=6858.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  71%|███████   | 860/1208 [22:44<09:12,  1.59s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00484, train/loss_vlb_step=2.56e-5, train/loss_step=0.00484, global_step=6858.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  71%|███████   | 860/1208 [22:44<09:12,  1.59s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.81e-5, train/loss_step=0.0032, global_step=6858.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  71%|███████▏  | 861/1208 [22:45<09:10,  1.59s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.81e-5, train/loss_step=0.0032, global_step=6858.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  71%|███████▏  | 861/1208 [22:45<09:10,  1.59s/it, loss=0.119, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00214, train/loss_step=0.364, global_step=6859.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  71%|███████▏  | 862/1208 [22:46<09:08,  1.59s/it, loss=0.119, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00214, train/loss_step=0.364, global_step=6859.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  71%|███████▏  | 862/1208 [22:46<09:08,  1.59s/it, loss=0.128, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000989, train/loss_step=0.223, global_step=6859.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  71%|███████▏  | 863/1208 [22:47<09:06,  1.59s/it, loss=0.128, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000989, train/loss_step=0.223, global_step=6859.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  71%|███████▏  | 863/1208 [22:47<09:06,  1.59s/it, loss=0.131, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00128, train/loss_step=0.266, global_step=6859.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  72%|███████▏  | 864/1208 [22:50<09:05,  1.59s/it, loss=0.131, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00128, train/loss_step=0.266, global_step=6859.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  72%|███████▏  | 864/1208 [22:50<09:05,  1.59s/it, loss=0.128, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000487, train/loss_step=0.146, global_step=6859.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  72%|███████▏  | 865/1208 [22:51<09:03,  1.59s/it, loss=0.128, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000487, train/loss_step=0.146, global_step=6859.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  72%|███████▏  | 865/1208 [22:51<09:03,  1.59s/it, loss=0.114, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000579, train/loss_step=0.169, global_step=6860.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  72%|███████▏  | 866/1208 [22:52<09:02,  1.59s/it, loss=0.114, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000579, train/loss_step=0.169, global_step=6860.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  72%|███████▏  | 866/1208 [22:52<09:02,  1.59s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.77e-5, train/loss_step=0.0102, global_step=6860.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  72%|███████▏  | 867/1208 [22:53<09:00,  1.58s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.77e-5, train/loss_step=0.0102, global_step=6860.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  72%|███████▏  | 867/1208 [22:53<09:00,  1.58s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0497, train/loss_vlb_step=0.000174, train/loss_step=0.0497, global_step=6860.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  72%|███████▏  | 868/1208 [22:56<08:59,  1.59s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0497, train/loss_vlb_step=0.000174, train/loss_step=0.0497, global_step=6860.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  72%|███████▏  | 868/1208 [22:56<08:59,  1.59s/it, loss=0.135, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00305, train/loss_step=0.435, global_step=6860.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  72%|███████▏  | 869/1208 [22:57<08:57,  1.59s/it, loss=0.135, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00305, train/loss_step=0.435, global_step=6860.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  72%|███████▏  | 869/1208 [22:57<08:57,  1.59s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0548, train/loss_vlb_step=0.000186, train/loss_step=0.0548, global_step=6861.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  72%|███████▏  | 870/1208 [22:58<08:55,  1.58s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0548, train/loss_vlb_step=0.000186, train/loss_step=0.0548, global_step=6861.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  72%|███████▏  | 870/1208 [22:58<08:55,  1.58s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.46e-5, train/loss_step=0.00257, global_step=6861.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  72%|███████▏  | 871/1208 [22:59<08:53,  1.58s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.46e-5, train/loss_step=0.00257, global_step=6861.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  72%|███████▏  | 871/1208 [22:59<08:53,  1.58s/it, loss=0.138, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00354, train/loss_step=0.399, global_step=6861.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  72%|███████▏  | 872/1208 [23:02<08:52,  1.59s/it, loss=0.138, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00354, train/loss_step=0.399, global_step=6861.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  72%|███████▏  | 872/1208 [23:02<08:52,  1.59s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.000209, train/loss_step=0.0615, global_step=6861.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  72%|███████▏  | 873/1208 [23:03<08:50,  1.58s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.000209, train/loss_step=0.0615, global_step=6861.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  72%|███████▏  | 873/1208 [23:03<08:50,  1.58s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000101, train/loss_step=0.0253, global_step=6862.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  72%|███████▏  | 874/1208 [23:04<08:49,  1.58s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000101, train/loss_step=0.0253, global_step=6862.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  72%|███████▏  | 874/1208 [23:04<08:49,  1.58s/it, loss=0.131, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.02e-5, train/loss_step=0.011, global_step=6862.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  72%|███████▏  | 875/1208 [23:05<08:47,  1.58s/it, loss=0.131, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.02e-5, train/loss_step=0.011, global_step=6862.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  72%|███████▏  | 875/1208 [23:05<08:47,  1.58s/it, loss=0.133, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.00101, train/loss_step=0.241, global_step=6862.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  73%|███████▎  | 876/1208 [23:08<08:46,  1.59s/it, loss=0.133, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.00101, train/loss_step=0.241, global_step=6862.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  73%|███████▎  | 876/1208 [23:08<08:46,  1.59s/it, loss=0.134, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000653, train/loss_step=0.181, global_step=6862.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  73%|███████▎  | 877/1208 [23:09<08:44,  1.58s/it, loss=0.134, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000653, train/loss_step=0.181, global_step=6862.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  73%|███████▎  | 877/1208 [23:09<08:44,  1.58s/it, loss=0.152, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00211, train/loss_step=0.377, global_step=6863.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  73%|███████▎  | 878/1208 [23:10<08:42,  1.58s/it, loss=0.152, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00211, train/loss_step=0.377, global_step=6863.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  73%|███████▎  | 878/1208 [23:10<08:42,  1.58s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=2.31e-5, train/loss_step=0.00452, global_step=6863.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  73%|███████▎  | 879/1208 [23:11<08:40,  1.58s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=2.31e-5, train/loss_step=0.00452, global_step=6863.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  73%|███████▎  | 879/1208 [23:11<08:40,  1.58s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.55e-5, train/loss_step=0.00272, global_step=6863.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  73%|███████▎  | 880/1208 [23:14<08:39,  1.58s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.55e-5, train/loss_step=0.00272, global_step=6863.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  73%|███████▎  | 880/1208 [23:14<08:39,  1.58s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00774, train/loss_vlb_step=3.73e-5, train/loss_step=0.00774, global_step=6863.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  73%|███████▎  | 881/1208 [23:15<08:37,  1.58s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00774, train/loss_vlb_step=3.73e-5, train/loss_step=0.00774, global_step=6863.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  73%|███████▎  | 881/1208 [23:15<08:37,  1.58s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000139, train/loss_step=0.0376, global_step=6864.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  73%|███████▎  | 882/1208 [23:16<08:36,  1.58s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000139, train/loss_step=0.0376, global_step=6864.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  73%|███████▎  | 882/1208 [23:16<08:36,  1.58s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0856, train/loss_vlb_step=0.000282, train/loss_step=0.0856, global_step=6864.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  73%|███████▎  | 883/1208 [23:17<08:34,  1.58s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0856, train/loss_vlb_step=0.000282, train/loss_step=0.0856, global_step=6864.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  73%|███████▎  | 883/1208 [23:17<08:34,  1.58s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0583, train/loss_vlb_step=0.000199, train/loss_step=0.0583, global_step=6864.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  73%|███████▎  | 884/1208 [23:20<08:33,  1.58s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0583, train/loss_vlb_step=0.000199, train/loss_step=0.0583, global_step=6864.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  73%|███████▎  | 884/1208 [23:20<08:33,  1.58s/it, loss=0.116, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=6864.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  73%|███████▎  | 885/1208 [23:21<08:31,  1.58s/it, loss=0.116, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=6864.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  73%|███████▎  | 885/1208 [23:21<08:31,  1.58s/it, loss=0.115, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000469, train/loss_step=0.142, global_step=6865.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  73%|███████▎  | 886/1208 [23:22<08:29,  1.58s/it, loss=0.115, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000469, train/loss_step=0.142, global_step=6865.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  73%|███████▎  | 886/1208 [23:22<08:29,  1.58s/it, loss=0.121, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000431, train/loss_step=0.131, global_step=6865.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  73%|███████▎  | 887/1208 [23:23<08:27,  1.58s/it, loss=0.121, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000431, train/loss_step=0.131, global_step=6865.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  73%|███████▎  | 887/1208 [23:23<08:27,  1.58s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.58e-5, train/loss_step=0.00288, global_step=6865.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  74%|███████▎  | 888/1208 [23:26<08:26,  1.58s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.58e-5, train/loss_step=0.00288, global_step=6865.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  74%|███████▎  | 888/1208 [23:26<08:26,  1.58s/it, loss=0.104, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000501, train/loss_step=0.149, global_step=6865.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  74%|███████▎  | 889/1208 [23:27<08:24,  1.58s/it, loss=0.104, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000501, train/loss_step=0.149, global_step=6865.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  74%|███████▎  | 889/1208 [23:27<08:24,  1.58s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.000243, train/loss_step=0.0702, global_step=6866.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  74%|███████▎  | 890/1208 [23:28<08:23,  1.58s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.000243, train/loss_step=0.0702, global_step=6866.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  74%|███████▎  | 890/1208 [23:28<08:23,  1.58s/it, loss=0.11, v_num=0, train/loss_simple_step=0.099, train/loss_vlb_step=0.000326, train/loss_step=0.099, global_step=6866.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  74%|███████▍  | 891/1208 [23:29<08:21,  1.58s/it, loss=0.11, v_num=0, train/loss_simple_step=0.099, train/loss_vlb_step=0.000326, train/loss_step=0.099, global_step=6866.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  74%|███████▍  | 891/1208 [23:29<08:21,  1.58s/it, loss=0.0904, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.06e-5, train/loss_step=0.011, global_step=6866.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  74%|███████▍  | 892/1208 [23:32<08:20,  1.58s/it, loss=0.0904, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.06e-5, train/loss_step=0.011, global_step=6866.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  74%|███████▍  | 892/1208 [23:32<08:20,  1.58s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=1.01e-5, train/loss_step=0.00167, global_step=6866.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  74%|███████▍  | 893/1208 [23:33<08:18,  1.58s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=1.01e-5, train/loss_step=0.00167, global_step=6866.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  74%|███████▍  | 893/1208 [23:33<08:18,  1.58s/it, loss=0.112, v_num=0, train/loss_simple_step=0.518, train/loss_vlb_step=0.0066, train/loss_step=0.518, global_step=6867.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]      Epoch 22:  74%|███████▍  | 894/1208 [23:34<08:16,  1.58s/it, loss=0.112, v_num=0, train/loss_simple_step=0.518, train/loss_vlb_step=0.0066, train/loss_step=0.518, global_step=6867.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  74%|███████▍  | 894/1208 [23:34<08:16,  1.58s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0458, train/loss_vlb_step=0.000159, train/loss_step=0.0458, global_step=6867.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  74%|███████▍  | 895/1208 [23:35<08:14,  1.58s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0458, train/loss_vlb_step=0.000159, train/loss_step=0.0458, global_step=6867.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  74%|███████▍  | 895/1208 [23:35<08:14,  1.58s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=1.88e-5, train/loss_step=0.00345, global_step=6867.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  74%|███████▍  | 896/1208 [23:38<08:13,  1.58s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=1.88e-5, train/loss_step=0.00345, global_step=6867.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  74%|███████▍  | 896/1208 [23:38<08:13,  1.58s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.95e-5, train/loss_step=0.013, global_step=6867.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  74%|███████▍  | 897/1208 [23:39<08:12,  1.58s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.95e-5, train/loss_step=0.013, global_step=6867.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  74%|███████▍  | 897/1208 [23:39<08:12,  1.58s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.440, train/loss_vlb_step=0.00377, train/loss_step=0.440, global_step=6868.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  74%|███████▍  | 898/1208 [23:40<08:10,  1.58s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.440, train/loss_vlb_step=0.00377, train/loss_step=0.440, global_step=6868.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  74%|███████▍  | 898/1208 [23:40<08:10,  1.58s/it, loss=0.1, v_num=0, train/loss_simple_step=0.078, train/loss_vlb_step=0.000259, train/loss_step=0.078, global_step=6868.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  74%|███████▍  | 899/1208 [23:41<08:08,  1.58s/it, loss=0.1, v_num=0, train/loss_simple_step=0.078, train/loss_vlb_step=0.000259, train/loss_step=0.078, global_step=6868.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  74%|███████▍  | 899/1208 [23:41<08:08,  1.58s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0892, train/loss_vlb_step=0.000293, train/loss_step=0.0892, global_step=6868.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  75%|███████▍  | 900/1208 [23:43<08:07,  1.58s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0892, train/loss_vlb_step=0.000293, train/loss_step=0.0892, global_step=6868.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  75%|███████▍  | 900/1208 [23:43<08:07,  1.58s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0078, train/loss_vlb_step=3.7e-5, train/loss_step=0.0078, global_step=6868.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.85it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.84it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.84it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.84it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.85it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.85it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.84it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.85it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.84it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.85it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.84it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.85it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.84it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.85it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.84it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.85it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.84it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.84it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.84it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.84it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.84it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.84it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.84it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.84it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.84it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.85it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.85it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.85it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.85it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.84it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s][ADDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.85it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.83it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.85it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.84it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.84it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.84it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.84it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.84it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.85it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.85it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.85it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.85it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.85it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.85it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.85it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.84it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.84it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.84it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.84it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.84it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]DDIM Sampler:  70%|███████   | 35/50 [00:18<00:08,  1.83it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.84it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.83it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.84it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.83it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.84it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.84it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.84it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.84it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.83it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.84it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.83it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.82it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.84it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.83it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.84it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.83it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.84it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.83it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.78it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.84it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.83it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.78it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.84it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.78it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:24<00:02,  1.85it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.83it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.85it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.83it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.78it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.83it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.85it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.83it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.83it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.85it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.84it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.85it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]Epoch 22:  75%|███████▍  | 901/1208 [24:13<08:15,  1.61s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0078, train/loss_vlb_step=3.7e-5, train/loss_step=0.0078, global_step=6868.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  75%|███████▍  | 901/1208 [24:13<08:15,  1.61s/it, loss=0.121, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00231, train/loss_step=0.362, global_step=6869.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  75%|███████▍  | 902/1208 [24:14<08:13,  1.61s/it, loss=0.121, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00231, train/loss_step=0.362, global_step=6869.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  75%|███████▍  | 902/1208 [24:14<08:13,  1.61s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00528, train/loss_vlb_step=2.78e-5, train/loss_step=0.00528, global_step=6869.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  75%|███████▍  | 903/1208 [24:15<08:11,  1.61s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00528, train/loss_vlb_step=2.78e-5, train/loss_step=0.00528, global_step=6869.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  75%|███████▍  | 903/1208 [24:15<08:11,  1.61s/it, loss=0.128, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.0015, train/loss_step=0.278, global_step=6869.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]     Epoch 22:  75%|███████▍  | 904/1208 [24:18<08:10,  1.61s/it, loss=0.128, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.0015, train/loss_step=0.278, global_step=6869.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  75%|███████▍  | 904/1208 [24:18<08:10,  1.61s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.000101, train/loss_step=0.0248, global_step=6869.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  75%|███████▍  | 905/1208 [24:19<08:08,  1.61s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.000101, train/loss_step=0.0248, global_step=6869.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  75%|███████▍  | 905/1208 [24:19<08:08,  1.61s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=2.4e-5, train/loss_step=0.00464, global_step=6870.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  75%|███████▌  | 906/1208 [24:20<08:06,  1.61s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=2.4e-5, train/loss_step=0.00464, global_step=6870.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  75%|███████▌  | 906/1208 [24:20<08:06,  1.61s/it, loss=0.123, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00103, train/loss_step=0.251, global_step=6870.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  75%|███████▌  | 907/1208 [24:21<08:05,  1.61s/it, loss=0.123, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00103, train/loss_step=0.251, global_step=6870.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  75%|███████▌  | 907/1208 [24:21<08:05,  1.61s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0601, train/loss_vlb_step=0.000207, train/loss_step=0.0601, global_step=6870.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  75%|███████▌  | 908/1208 [24:24<08:03,  1.61s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0601, train/loss_vlb_step=0.000207, train/loss_step=0.0601, global_step=6870.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  75%|███████▌  | 908/1208 [24:24<08:03,  1.61s/it, loss=0.15, v_num=0, train/loss_simple_step=0.639, train/loss_vlb_step=0.0138, train/loss_step=0.639, global_step=6870.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]     Epoch 22:  75%|███████▌  | 909/1208 [24:25<08:02,  1.61s/it, loss=0.15, v_num=0, train/loss_simple_step=0.639, train/loss_vlb_step=0.0138, train/loss_step=0.639, global_step=6870.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  75%|███████▌  | 909/1208 [24:25<08:02,  1.61s/it, loss=0.153, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.00039, train/loss_step=0.118, global_step=6871.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  75%|███████▌  | 910/1208 [24:26<08:00,  1.61s/it, loss=0.153, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.00039, train/loss_step=0.118, global_step=6871.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  75%|███████▌  | 910/1208 [24:26<08:00,  1.61s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000136, train/loss_step=0.0386, global_step=6871.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  75%|███████▌  | 911/1208 [24:27<07:58,  1.61s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000136, train/loss_step=0.0386, global_step=6871.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  75%|███████▌  | 911/1208 [24:27<07:58,  1.61s/it, loss=0.155, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000403, train/loss_step=0.123, global_step=6871.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  75%|███████▌  | 912/1208 [24:30<07:57,  1.61s/it, loss=0.155, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000403, train/loss_step=0.123, global_step=6871.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  75%|███████▌  | 912/1208 [24:30<07:57,  1.61s/it, loss=0.168, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00144, train/loss_step=0.261, global_step=6871.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  76%|███████▌  | 913/1208 [24:31<07:55,  1.61s/it, loss=0.168, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00144, train/loss_step=0.261, global_step=6871.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  76%|███████▌  | 913/1208 [24:31<07:55,  1.61s/it, loss=0.149, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000436, train/loss_step=0.131, global_step=6872.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  76%|███████▌  | 914/1208 [24:32<07:53,  1.61s/it, loss=0.149, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000436, train/loss_step=0.131, global_step=6872.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  76%|███████▌  | 914/1208 [24:32<07:53,  1.61s/it, loss=0.16, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00136, train/loss_step=0.281, global_step=6872.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  76%|███████▌  | 915/1208 [24:33<07:51,  1.61s/it, loss=0.16, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00136, train/loss_step=0.281, global_step=6872.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  76%|███████▌  | 915/1208 [24:33<07:51,  1.61s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.52e-5, train/loss_step=0.00261, global_step=6872.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  76%|███████▌  | 916/1208 [24:36<07:50,  1.61s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.52e-5, train/loss_step=0.00261, global_step=6872.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  76%|███████▌  | 916/1208 [24:36<07:50,  1.61s/it, loss=0.194, v_num=0, train/loss_simple_step=0.679, train/loss_vlb_step=0.0437, train/loss_step=0.679, global_step=6872.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  76%|███████▌  | 917/1208 [24:37<07:48,  1.61s/it, loss=0.194, v_num=0, train/loss_simple_step=0.679, train/loss_vlb_step=0.0437, train/loss_step=0.679, global_step=6872.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  76%|███████▌  | 917/1208 [24:37<07:48,  1.61s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00821, train/loss_vlb_step=3.8e-5, train/loss_step=0.00821, global_step=6873.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  76%|███████▌  | 918/1208 [24:38<07:47,  1.61s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00821, train/loss_vlb_step=3.8e-5, train/loss_step=0.00821, global_step=6873.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  76%|███████▌  | 918/1208 [24:38<07:47,  1.61s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00455, train/loss_vlb_step=2.47e-5, train/loss_step=0.00455, global_step=6873.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  76%|███████▌  | 919/1208 [24:39<07:45,  1.61s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00455, train/loss_vlb_step=2.47e-5, train/loss_step=0.00455, global_step=6873.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  76%|███████▌  | 919/1208 [24:39<07:45,  1.61s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0547, train/loss_vlb_step=0.000194, train/loss_step=0.0547, global_step=6873.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  76%|███████▌  | 920/1208 [24:42<07:44,  1.61s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0547, train/loss_vlb_step=0.000194, train/loss_step=0.0547, global_step=6873.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  76%|███████▌  | 920/1208 [24:42<07:44,  1.61s/it, loss=0.188, v_num=0, train/loss_simple_step=0.441, train/loss_vlb_step=0.00362, train/loss_step=0.441, global_step=6873.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  76%|███████▌  | 921/1208 [24:43<07:42,  1.61s/it, loss=0.188, v_num=0, train/loss_simple_step=0.441, train/loss_vlb_step=0.00362, train/loss_step=0.441, global_step=6873.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  76%|███████▌  | 921/1208 [24:43<07:42,  1.61s/it, loss=0.179, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000596, train/loss_step=0.172, global_step=6874.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  76%|███████▋  | 922/1208 [24:44<07:40,  1.61s/it, loss=0.179, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000596, train/loss_step=0.172, global_step=6874.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  76%|███████▋  | 922/1208 [24:44<07:40,  1.61s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.44e-5, train/loss_step=0.0118, global_step=6874.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  76%|███████▋  | 923/1208 [24:45<07:38,  1.61s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.44e-5, train/loss_step=0.0118, global_step=6874.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  76%|███████▋  | 923/1208 [24:45<07:38,  1.61s/it, loss=0.193, v_num=0, train/loss_simple_step=0.550, train/loss_vlb_step=0.00526, train/loss_step=0.550, global_step=6874.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  76%|███████▋  | 924/1208 [24:48<07:37,  1.61s/it, loss=0.193, v_num=0, train/loss_simple_step=0.550, train/loss_vlb_step=0.00526, train/loss_step=0.550, global_step=6874.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  76%|███████▋  | 924/1208 [24:48<07:37,  1.61s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0834, train/loss_vlb_step=0.000276, train/loss_step=0.0834, global_step=6874.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  77%|███████▋  | 925/1208 [24:49<07:35,  1.61s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0834, train/loss_vlb_step=0.000276, train/loss_step=0.0834, global_step=6874.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  77%|███████▋  | 925/1208 [24:49<07:35,  1.61s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00794, train/loss_vlb_step=3.87e-5, train/loss_step=0.00794, global_step=6875.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  77%|███████▋  | 926/1208 [24:50<07:33,  1.61s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00794, train/loss_vlb_step=3.87e-5, train/loss_step=0.00794, global_step=6875.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  77%|███████▋  | 926/1208 [24:50<07:33,  1.61s/it, loss=0.192, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000625, train/loss_step=0.176, global_step=6875.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  77%|███████▋  | 927/1208 [24:51<07:32,  1.61s/it, loss=0.192, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000625, train/loss_step=0.176, global_step=6875.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  77%|███████▋  | 927/1208 [24:51<07:32,  1.61s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=9.78e-6, train/loss_step=0.00167, global_step=6875.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  77%|███████▋  | 928/1208 [24:54<07:30,  1.61s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=9.78e-6, train/loss_step=0.00167, global_step=6875.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  77%|███████▋  | 928/1208 [24:54<07:30,  1.61s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0579, train/loss_vlb_step=0.000201, train/loss_step=0.0579, global_step=6875.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  77%|███████▋  | 929/1208 [24:55<07:29,  1.61s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0579, train/loss_vlb_step=0.000201, train/loss_step=0.0579, global_step=6875.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  77%|███████▋  | 929/1208 [24:55<07:29,  1.61s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.41e-5, train/loss_step=0.00253, global_step=6876.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  77%|███████▋  | 930/1208 [24:56<07:27,  1.61s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.41e-5, train/loss_step=0.00253, global_step=6876.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  77%|███████▋  | 930/1208 [24:56<07:27,  1.61s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.2e-5, train/loss_step=0.00208, global_step=6876.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  77%|███████▋  | 931/1208 [24:57<07:25,  1.61s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.2e-5, train/loss_step=0.00208, global_step=6876.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  77%|███████▋  | 931/1208 [24:57<07:25,  1.61s/it, loss=0.162, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00153, train/loss_step=0.308, global_step=6876.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  77%|███████▋  | 932/1208 [25:00<07:24,  1.61s/it, loss=0.162, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00153, train/loss_step=0.308, global_step=6876.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  77%|███████▋  | 932/1208 [25:00<07:24,  1.61s/it, loss=0.155, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000393, train/loss_step=0.120, global_step=6876.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  77%|███████▋  | 933/1208 [25:01<07:22,  1.61s/it, loss=0.155, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000393, train/loss_step=0.120, global_step=6876.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  77%|███████▋  | 933/1208 [25:01<07:22,  1.61s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.57e-5, train/loss_step=0.0149, global_step=6877.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  77%|███████▋  | 934/1208 [25:02<07:20,  1.61s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.57e-5, train/loss_step=0.0149, global_step=6877.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  77%|███████▋  | 934/1208 [25:02<07:20,  1.61s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.000146, train/loss_step=0.0403, global_step=6877.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  77%|███████▋  | 935/1208 [25:03<07:18,  1.61s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.000146, train/loss_step=0.0403, global_step=6877.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  77%|███████▋  | 935/1208 [25:03<07:18,  1.61s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0846, train/loss_vlb_step=0.000286, train/loss_step=0.0846, global_step=6877.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  77%|███████▋  | 936/1208 [25:05<07:17,  1.61s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0846, train/loss_vlb_step=0.000286, train/loss_step=0.0846, global_step=6877.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  77%|███████▋  | 936/1208 [25:05<07:17,  1.61s/it, loss=0.111, v_num=0, train/loss_simple_step=0.079, train/loss_vlb_step=0.000263, train/loss_step=0.079, global_step=6877.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  78%|███████▊  | 937/1208 [25:06<07:15,  1.61s/it, loss=0.111, v_num=0, train/loss_simple_step=0.079, train/loss_vlb_step=0.000263, train/loss_step=0.079, global_step=6877.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  78%|███████▊  | 937/1208 [25:06<07:15,  1.61s/it, loss=0.123, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00103, train/loss_step=0.253, global_step=6878.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  78%|███████▊  | 938/1208 [25:07<07:14,  1.61s/it, loss=0.123, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00103, train/loss_step=0.253, global_step=6878.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  78%|███████▊  | 938/1208 [25:07<07:14,  1.61s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.15e-5, train/loss_step=0.0148, global_step=6878.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  78%|███████▊  | 939/1208 [25:08<07:12,  1.61s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.15e-5, train/loss_step=0.0148, global_step=6878.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  78%|███████▊  | 939/1208 [25:09<07:12,  1.61s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.43e-5, train/loss_step=0.00254, global_step=6878.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  78%|███████▊  | 940/1208 [25:11<07:11,  1.61s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.43e-5, train/loss_step=0.00254, global_step=6878.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  78%|███████▊  | 940/1208 [25:11<07:11,  1.61s/it, loss=0.111, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.00092, train/loss_step=0.229, global_step=6878.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  78%|███████▊  | 941/1208 [25:12<07:09,  1.61s/it, loss=0.111, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.00092, train/loss_step=0.229, global_step=6878.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  78%|███████▊  | 941/1208 [25:12<07:09,  1.61s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=2.12e-5, train/loss_step=0.00395, global_step=6879.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  78%|███████▊  | 942/1208 [25:13<07:07,  1.61s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=2.12e-5, train/loss_step=0.00395, global_step=6879.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  78%|███████▊  | 942/1208 [25:13<07:07,  1.61s/it, loss=0.119, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00215, train/loss_step=0.355, global_step=6879.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  78%|███████▊  | 943/1208 [25:14<07:05,  1.61s/it, loss=0.119, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00215, train/loss_step=0.355, global_step=6879.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  78%|███████▊  | 943/1208 [25:14<07:05,  1.61s/it, loss=0.11, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00225, train/loss_step=0.369, global_step=6879.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  78%|███████▊  | 944/1208 [25:17<07:04,  1.61s/it, loss=0.11, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00225, train/loss_step=0.369, global_step=6879.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  78%|███████▊  | 944/1208 [25:17<07:04,  1.61s/it, loss=0.114, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000537, train/loss_step=0.156, global_step=6879.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  78%|███████▊  | 945/1208 [25:18<07:02,  1.61s/it, loss=0.114, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000537, train/loss_step=0.156, global_step=6879.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  78%|███████▊  | 945/1208 [25:18<07:02,  1.61s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00297, train/loss_vlb_step=1.66e-5, train/loss_step=0.00297, global_step=6880.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  78%|███████▊  | 946/1208 [25:19<07:00,  1.61s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00297, train/loss_vlb_step=1.66e-5, train/loss_step=0.00297, global_step=6880.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  78%|███████▊  | 946/1208 [25:19<07:00,  1.61s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=5.95e-5, train/loss_step=0.0141, global_step=6880.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  78%|███████▊  | 947/1208 [25:20<06:59,  1.61s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=5.95e-5, train/loss_step=0.0141, global_step=6880.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  78%|███████▊  | 947/1208 [25:20<06:59,  1.61s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00805, train/loss_vlb_step=3.97e-5, train/loss_step=0.00805, global_step=6880.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  78%|███████▊  | 948/1208 [25:23<06:57,  1.61s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00805, train/loss_vlb_step=3.97e-5, train/loss_step=0.00805, global_step=6880.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  78%|███████▊  | 948/1208 [25:23<06:57,  1.61s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=9.76e-5, train/loss_step=0.0253, global_step=6880.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  79%|███████▊  | 949/1208 [25:24<06:56,  1.61s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=9.76e-5, train/loss_step=0.0253, global_step=6880.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  79%|███████▊  | 949/1208 [25:24<06:56,  1.61s/it, loss=0.115, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.00082, train/loss_step=0.217, global_step=6881.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  79%|███████▊  | 950/1208 [25:25<06:54,  1.61s/it, loss=0.115, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.00082, train/loss_step=0.217, global_step=6881.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  79%|███████▊  | 950/1208 [25:25<06:54,  1.61s/it, loss=0.152, v_num=0, train/loss_simple_step=0.737, train/loss_vlb_step=0.0422, train/loss_step=0.737, global_step=6881.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  79%|███████▊  | 951/1208 [25:26<06:52,  1.61s/it, loss=0.152, v_num=0, train/loss_simple_step=0.737, train/loss_vlb_step=0.0422, train/loss_step=0.737, global_step=6881.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  79%|███████▊  | 951/1208 [25:26<06:52,  1.61s/it, loss=0.157, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00306, train/loss_step=0.415, global_step=6881.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  79%|███████▉  | 952/1208 [25:29<06:51,  1.61s/it, loss=0.157, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00306, train/loss_step=0.415, global_step=6881.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  79%|███████▉  | 952/1208 [25:29<06:51,  1.61s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0733, train/loss_vlb_step=0.000254, train/loss_step=0.0733, global_step=6881.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  79%|███████▉  | 953/1208 [25:30<06:49,  1.61s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0733, train/loss_vlb_step=0.000254, train/loss_step=0.0733, global_step=6881.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  79%|███████▉  | 953/1208 [25:30<06:49,  1.61s/it, loss=0.168, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00158, train/loss_step=0.290, global_step=6882.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  79%|███████▉  | 954/1208 [25:31<06:47,  1.61s/it, loss=0.168, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00158, train/loss_step=0.290, global_step=6882.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  79%|███████▉  | 954/1208 [25:31<06:47,  1.61s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0904, train/loss_vlb_step=0.0003, train/loss_step=0.0904, global_step=6882.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  79%|███████▉  | 955/1208 [25:32<06:46,  1.60s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0904, train/loss_vlb_step=0.0003, train/loss_step=0.0904, global_step=6882.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  79%|███████▉  | 955/1208 [25:32<06:46,  1.60s/it, loss=0.183, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00148, train/loss_step=0.318, global_step=6882.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  79%|███████▉  | 956/1208 [25:35<06:44,  1.61s/it, loss=0.183, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00148, train/loss_step=0.318, global_step=6882.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  79%|███████▉  | 956/1208 [25:35<06:44,  1.61s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.42e-5, train/loss_step=0.0234, global_step=6882.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  79%|███████▉  | 957/1208 [25:36<06:42,  1.61s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.42e-5, train/loss_step=0.0234, global_step=6882.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  79%|███████▉  | 957/1208 [25:36<06:42,  1.61s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0943, train/loss_vlb_step=0.000311, train/loss_step=0.0943, global_step=6883.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  79%|███████▉  | 958/1208 [25:37<06:41,  1.60s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0943, train/loss_vlb_step=0.000311, train/loss_step=0.0943, global_step=6883.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  79%|███████▉  | 958/1208 [25:37<06:41,  1.60s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00264, train/loss_vlb_step=1.55e-5, train/loss_step=0.00264, global_step=6883.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  79%|███████▉  | 959/1208 [25:38<06:39,  1.60s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00264, train/loss_vlb_step=1.55e-5, train/loss_step=0.00264, global_step=6883.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  79%|███████▉  | 959/1208 [25:38<06:39,  1.60s/it, loss=0.175, v_num=0, train/loss_simple_step=0.076, train/loss_vlb_step=0.000252, train/loss_step=0.076, global_step=6883.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  79%|███████▉  | 960/1208 [25:41<06:38,  1.61s/it, loss=0.175, v_num=0, train/loss_simple_step=0.076, train/loss_vlb_step=0.000252, train/loss_step=0.076, global_step=6883.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  79%|███████▉  | 960/1208 [25:41<06:38,  1.61s/it, loss=0.169, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=6883.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  80%|███████▉  | 961/1208 [25:42<06:36,  1.60s/it, loss=0.169, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=6883.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  80%|███████▉  | 961/1208 [25:42<06:36,  1.60s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.41e-5, train/loss_step=0.00241, global_step=6884.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  80%|███████▉  | 962/1208 [25:43<06:34,  1.60s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.41e-5, train/loss_step=0.00241, global_step=6884.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  80%|███████▉  | 962/1208 [25:43<06:34,  1.60s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000131, train/loss_step=0.0372, global_step=6884.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  80%|███████▉  | 963/1208 [25:44<06:32,  1.60s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000131, train/loss_step=0.0372, global_step=6884.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  80%|███████▉  | 963/1208 [25:44<06:32,  1.60s/it, loss=0.152, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00208, train/loss_step=0.350, global_step=6884.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  80%|███████▉  | 964/1208 [25:47<06:31,  1.61s/it, loss=0.152, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00208, train/loss_step=0.350, global_step=6884.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  80%|███████▉  | 964/1208 [25:47<06:31,  1.61s/it, loss=0.153, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000608, train/loss_step=0.173, global_step=6884.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  80%|███████▉  | 965/1208 [25:48<06:29,  1.60s/it, loss=0.153, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000608, train/loss_step=0.173, global_step=6884.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  80%|███████▉  | 965/1208 [25:48<06:29,  1.60s/it, loss=0.161, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000578, train/loss_step=0.166, global_step=6885.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  80%|███████▉  | 966/1208 [25:49<06:28,  1.60s/it, loss=0.161, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000578, train/loss_step=0.166, global_step=6885.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  80%|███████▉  | 966/1208 [25:49<06:28,  1.60s/it, loss=0.176, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00173, train/loss_step=0.327, global_step=6885.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  80%|████████  | 967/1208 [25:50<06:26,  1.60s/it, loss=0.176, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00173, train/loss_step=0.327, global_step=6885.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  80%|████████  | 967/1208 [25:50<06:26,  1.60s/it, loss=0.195, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00203, train/loss_step=0.384, global_step=6885.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  80%|████████  | 968/1208 [25:53<06:25,  1.61s/it, loss=0.195, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00203, train/loss_step=0.384, global_step=6885.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  80%|████████  | 968/1208 [25:53<06:25,  1.61s/it, loss=0.204, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000775, train/loss_step=0.206, global_step=6885.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  80%|████████  | 969/1208 [25:55<06:23,  1.60s/it, loss=0.204, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000775, train/loss_step=0.206, global_step=6885.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  80%|████████  | 969/1208 [25:55<06:23,  1.60s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000163, train/loss_step=0.0449, global_step=6886.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  80%|████████  | 970/1208 [25:56<06:21,  1.60s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000163, train/loss_step=0.0449, global_step=6886.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  80%|████████  | 970/1208 [25:56<06:21,  1.60s/it, loss=0.164, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.00034, train/loss_step=0.104, global_step=6886.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  80%|████████  | 971/1208 [25:57<06:20,  1.60s/it, loss=0.164, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.00034, train/loss_step=0.104, global_step=6886.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  80%|████████  | 971/1208 [25:57<06:20,  1.60s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00586, train/loss_vlb_step=3.02e-5, train/loss_step=0.00586, global_step=6886.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  80%|████████  | 972/1208 [26:00<06:18,  1.61s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00586, train/loss_vlb_step=3.02e-5, train/loss_step=0.00586, global_step=6886.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  80%|████████  | 972/1208 [26:00<06:18,  1.61s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.34e-5, train/loss_step=0.0155, global_step=6886.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  81%|████████  | 973/1208 [26:01<06:17,  1.60s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.34e-5, train/loss_step=0.0155, global_step=6886.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  81%|████████  | 973/1208 [26:01<06:17,  1.60s/it, loss=0.133, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000512, train/loss_step=0.148, global_step=6887.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  81%|████████  | 974/1208 [26:02<06:15,  1.60s/it, loss=0.133, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000512, train/loss_step=0.148, global_step=6887.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  81%|████████  | 974/1208 [26:02<06:15,  1.60s/it, loss=0.161, v_num=0, train/loss_simple_step=0.644, train/loss_vlb_step=0.0259, train/loss_step=0.644, global_step=6887.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  81%|████████  | 975/1208 [26:03<06:13,  1.60s/it, loss=0.161, v_num=0, train/loss_simple_step=0.644, train/loss_vlb_step=0.0259, train/loss_step=0.644, global_step=6887.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  81%|████████  | 975/1208 [26:03<06:13,  1.60s/it, loss=0.158, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00104, train/loss_step=0.256, global_step=6887.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  81%|████████  | 976/1208 [26:06<06:12,  1.61s/it, loss=0.158, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00104, train/loss_step=0.256, global_step=6887.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  81%|████████  | 976/1208 [26:06<06:12,  1.61s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7.35e-5, train/loss_step=0.0165, global_step=6887.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  81%|████████  | 977/1208 [26:07<06:10,  1.60s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7.35e-5, train/loss_step=0.0165, global_step=6887.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  81%|████████  | 977/1208 [26:07<06:10,  1.60s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.78e-5, train/loss_step=0.0187, global_step=6888.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  81%|████████  | 978/1208 [26:08<06:08,  1.60s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.78e-5, train/loss_step=0.0187, global_step=6888.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  81%|████████  | 978/1208 [26:08<06:08,  1.60s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000185, train/loss_step=0.0525, global_step=6888.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  81%|████████  | 979/1208 [26:09<06:07,  1.60s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000185, train/loss_step=0.0525, global_step=6888.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  81%|████████  | 979/1208 [26:09<06:07,  1.60s/it, loss=0.165, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000926, train/loss_step=0.245, global_step=6888.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  81%|████████  | 980/1208 [26:12<06:05,  1.61s/it, loss=0.165, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000926, train/loss_step=0.245, global_step=6888.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  81%|████████  | 980/1208 [26:12<06:05,  1.61s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000154, train/loss_step=0.0416, global_step=6888.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  81%|████████  | 981/1208 [26:14<06:04,  1.60s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000154, train/loss_step=0.0416, global_step=6888.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  81%|████████  | 981/1208 [26:14<06:04,  1.60s/it, loss=0.175, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.000988, train/loss_step=0.262, global_step=6889.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  81%|████████▏ | 982/1208 [26:15<06:02,  1.60s/it, loss=0.175, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.000988, train/loss_step=0.262, global_step=6889.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  81%|████████▏ | 982/1208 [26:15<06:02,  1.60s/it, loss=0.195, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00372, train/loss_step=0.430, global_step=6889.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  81%|████████▏ | 983/1208 [26:16<06:00,  1.60s/it, loss=0.195, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00372, train/loss_step=0.430, global_step=6889.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  81%|████████▏ | 983/1208 [26:16<06:00,  1.60s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.000153, train/loss_step=0.0413, global_step=6889.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  81%|████████▏ | 984/1208 [26:19<05:59,  1.61s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.000153, train/loss_step=0.0413, global_step=6889.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  81%|████████▏ | 984/1208 [26:19<05:59,  1.61s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000228, train/loss_step=0.0676, global_step=6889.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  82%|████████▏ | 985/1208 [26:20<05:57,  1.60s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000228, train/loss_step=0.0676, global_step=6889.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  82%|████████▏ | 985/1208 [26:20<05:57,  1.60s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.14e-5, train/loss_step=0.0115, global_step=6890.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  82%|████████▏ | 986/1208 [26:21<05:56,  1.60s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.14e-5, train/loss_step=0.0115, global_step=6890.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  82%|████████▏ | 986/1208 [26:21<05:56,  1.60s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0075, train/loss_vlb_step=3.81e-5, train/loss_step=0.0075, global_step=6890.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  82%|████████▏ | 987/1208 [26:22<05:54,  1.60s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0075, train/loss_vlb_step=3.81e-5, train/loss_step=0.0075, global_step=6890.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  82%|████████▏ | 987/1208 [26:22<05:54,  1.60s/it, loss=0.137, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=6890.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  82%|████████▏ | 988/1208 [26:25<05:53,  1.60s/it, loss=0.137, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=6890.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  82%|████████▏ | 988/1208 [26:25<05:53,  1.60s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0644, train/loss_vlb_step=0.000216, train/loss_step=0.0644, global_step=6890.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  82%|████████▏ | 989/1208 [26:26<05:51,  1.60s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0644, train/loss_vlb_step=0.000216, train/loss_step=0.0644, global_step=6890.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  82%|████████▏ | 989/1208 [26:26<05:51,  1.60s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00909, train/loss_vlb_step=4.25e-5, train/loss_step=0.00909, global_step=6891.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  82%|████████▏ | 990/1208 [26:27<05:49,  1.60s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00909, train/loss_vlb_step=4.25e-5, train/loss_step=0.00909, global_step=6891.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  82%|████████▏ | 990/1208 [26:27<05:49,  1.60s/it, loss=0.152, v_num=0, train/loss_simple_step=0.573, train/loss_vlb_step=0.0076, train/loss_step=0.573, global_step=6891.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]     Epoch 22:  82%|████████▏ | 991/1208 [26:28<05:47,  1.60s/it, loss=0.152, v_num=0, train/loss_simple_step=0.573, train/loss_vlb_step=0.0076, train/loss_step=0.573, global_step=6891.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  82%|████████▏ | 991/1208 [26:28<05:47,  1.60s/it, loss=0.153, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.00011, train/loss_step=0.027, global_step=6891.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  82%|████████▏ | 992/1208 [26:31<05:46,  1.60s/it, loss=0.153, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.00011, train/loss_step=0.027, global_step=6891.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  82%|████████▏ | 992/1208 [26:31<05:46,  1.60s/it, loss=0.171, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00215, train/loss_step=0.376, global_step=6891.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  82%|████████▏ | 993/1208 [26:32<05:44,  1.60s/it, loss=0.171, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00215, train/loss_step=0.376, global_step=6891.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  82%|████████▏ | 993/1208 [26:32<05:44,  1.60s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00287, train/loss_vlb_step=1.62e-5, train/loss_step=0.00287, global_step=6892.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  82%|████████▏ | 994/1208 [26:34<05:43,  1.60s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00287, train/loss_vlb_step=1.62e-5, train/loss_step=0.00287, global_step=6892.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  82%|████████▏ | 994/1208 [26:34<05:43,  1.60s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0752, train/loss_vlb_step=0.000248, train/loss_step=0.0752, global_step=6892.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  82%|████████▏ | 995/1208 [26:35<05:41,  1.60s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0752, train/loss_vlb_step=0.000248, train/loss_step=0.0752, global_step=6892.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  82%|████████▏ | 995/1208 [26:35<05:41,  1.60s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00603, train/loss_vlb_step=2.99e-5, train/loss_step=0.00603, global_step=6892.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  82%|████████▏ | 996/1208 [26:38<05:40,  1.60s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00603, train/loss_vlb_step=2.99e-5, train/loss_step=0.00603, global_step=6892.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  82%|████████▏ | 996/1208 [26:38<05:40,  1.60s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00571, train/loss_vlb_step=2.9e-5, train/loss_step=0.00571, global_step=6892.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  83%|████████▎ | 997/1208 [26:39<05:38,  1.60s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00571, train/loss_vlb_step=2.9e-5, train/loss_step=0.00571, global_step=6892.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  83%|████████▎ | 997/1208 [26:39<05:38,  1.60s/it, loss=0.126, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=6893.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  83%|████████▎ | 998/1208 [26:40<05:36,  1.60s/it, loss=0.126, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=6893.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  83%|████████▎ | 998/1208 [26:40<05:36,  1.60s/it, loss=0.135, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000915, train/loss_step=0.229, global_step=6893.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  83%|████████▎ | 999/1208 [26:41<05:35,  1.60s/it, loss=0.135, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000915, train/loss_step=0.229, global_step=6893.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  83%|████████▎ | 999/1208 [26:41<05:35,  1.60s/it, loss=0.134, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000865, train/loss_step=0.224, global_step=6893.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  83%|████████▎ | 1000/1208 [26:44<05:33,  1.60s/it, loss=0.134, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000865, train/loss_step=0.224, global_step=6893.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  83%|████████▎ | 1000/1208 [26:44<05:33,  1.60s/it, loss=0.155, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00455, train/loss_step=0.457, global_step=6893.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  83%|████████▎ | 1001/1208 [26:45<05:31,  1.60s/it, loss=0.155, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00455, train/loss_step=0.457, global_step=6893.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  83%|████████▎ | 1001/1208 [26:45<05:31,  1.60s/it, loss=0.163, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00445, train/loss_step=0.434, global_step=6894.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  83%|████████▎ | 1002/1208 [26:46<05:30,  1.60s/it, loss=0.163, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00445, train/loss_step=0.434, global_step=6894.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  83%|████████▎ | 1002/1208 [26:46<05:30,  1.60s/it, loss=0.145, v_num=0, train/loss_simple_step=0.063, train/loss_vlb_step=0.000217, train/loss_step=0.063, global_step=6894.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  83%|████████▎ | 1003/1208 [26:47<05:28,  1.60s/it, loss=0.145, v_num=0, train/loss_simple_step=0.063, train/loss_vlb_step=0.000217, train/loss_step=0.063, global_step=6894.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  83%|████████▎ | 1003/1208 [26:47<05:28,  1.60s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.6e-5, train/loss_step=0.0028, global_step=6894.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  83%|████████▎ | 1004/1208 [26:50<05:27,  1.60s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.6e-5, train/loss_step=0.0028, global_step=6894.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  83%|████████▎ | 1004/1208 [26:50<05:27,  1.60s/it, loss=0.142, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000149, train/loss_step=0.042, global_step=6894.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  83%|████████▎ | 1005/1208 [26:51<05:25,  1.60s/it, loss=0.142, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000149, train/loss_step=0.042, global_step=6894.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  83%|████████▎ | 1005/1208 [26:51<05:25,  1.60s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00826, train/loss_vlb_step=4.08e-5, train/loss_step=0.00826, global_step=6895.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  83%|████████▎ | 1006/1208 [26:52<05:23,  1.60s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00826, train/loss_vlb_step=4.08e-5, train/loss_step=0.00826, global_step=6895.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  83%|████████▎ | 1006/1208 [26:52<05:23,  1.60s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00585, train/loss_vlb_step=2.9e-5, train/loss_step=0.00585, global_step=6895.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  83%|████████▎ | 1007/1208 [26:53<05:22,  1.60s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00585, train/loss_vlb_step=2.9e-5, train/loss_step=0.00585, global_step=6895.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  83%|████████▎ | 1007/1208 [26:53<05:22,  1.60s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=2.11e-5, train/loss_step=0.00388, global_step=6895.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  83%|████████▎ | 1008/1208 [26:56<05:20,  1.60s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=2.11e-5, train/loss_step=0.00388, global_step=6895.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  83%|████████▎ | 1008/1208 [26:56<05:20,  1.60s/it, loss=0.148, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00182, train/loss_step=0.315, global_step=6895.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  84%|████████▎ | 1009/1208 [26:57<05:18,  1.60s/it, loss=0.148, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00182, train/loss_step=0.315, global_step=6895.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  84%|████████▎ | 1009/1208 [26:57<05:18,  1.60s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000171, train/loss_step=0.0463, global_step=6896.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  84%|████████▎ | 1010/1208 [26:58<05:17,  1.60s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000171, train/loss_step=0.0463, global_step=6896.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  84%|████████▎ | 1010/1208 [26:58<05:17,  1.60s/it, loss=0.127, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000392, train/loss_step=0.118, global_step=6896.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  84%|████████▎ | 1011/1208 [26:59<05:15,  1.60s/it, loss=0.127, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000392, train/loss_step=0.118, global_step=6896.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  84%|████████▎ | 1011/1208 [26:59<05:15,  1.60s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0492, train/loss_vlb_step=0.000177, train/loss_step=0.0492, global_step=6896.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  84%|████████▍ | 1012/1208 [27:02<05:14,  1.60s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0492, train/loss_vlb_step=0.000177, train/loss_step=0.0492, global_step=6896.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  84%|████████▍ | 1012/1208 [27:02<05:14,  1.60s/it, loss=0.117, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.00054, train/loss_step=0.140, global_step=6896.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  84%|████████▍ | 1013/1208 [27:03<05:12,  1.60s/it, loss=0.117, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.00054, train/loss_step=0.140, global_step=6896.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  84%|████████▍ | 1013/1208 [27:03<05:12,  1.60s/it, loss=0.126, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.00066, train/loss_step=0.180, global_step=6897.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  84%|████████▍ | 1014/1208 [27:04<05:10,  1.60s/it, loss=0.126, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.00066, train/loss_step=0.180, global_step=6897.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  84%|████████▍ | 1014/1208 [27:04<05:10,  1.60s/it, loss=0.133, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.00101, train/loss_step=0.235, global_step=6897.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  84%|████████▍ | 1015/1208 [27:05<05:09,  1.60s/it, loss=0.133, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.00101, train/loss_step=0.235, global_step=6897.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  84%|████████▍ | 1015/1208 [27:05<05:09,  1.60s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.000111, train/loss_step=0.0275, global_step=6897.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  84%|████████▍ | 1016/1208 [27:08<05:07,  1.60s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.000111, train/loss_step=0.0275, global_step=6897.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  84%|████████▍ | 1016/1208 [27:08<05:07,  1.60s/it, loss=0.169, v_num=0, train/loss_simple_step=0.701, train/loss_vlb_step=0.0363, train/loss_step=0.701, global_step=6897.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  84%|████████▍ | 1017/1208 [27:09<05:05,  1.60s/it, loss=0.169, v_num=0, train/loss_simple_step=0.701, train/loss_vlb_step=0.0363, train/loss_step=0.701, global_step=6897.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  84%|████████▍ | 1017/1208 [27:09<05:05,  1.60s/it, loss=0.176, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000992, train/loss_step=0.242, global_step=6898.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  84%|████████▍ | 1018/1208 [27:10<05:04,  1.60s/it, loss=0.176, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000992, train/loss_step=0.242, global_step=6898.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  84%|████████▍ | 1018/1208 [27:10<05:04,  1.60s/it, loss=0.177, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000875, train/loss_step=0.239, global_step=6898.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  84%|████████▍ | 1019/1208 [27:11<05:02,  1.60s/it, loss=0.177, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000875, train/loss_step=0.239, global_step=6898.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  84%|████████▍ | 1019/1208 [27:11<05:02,  1.60s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00744, train/loss_vlb_step=3.44e-5, train/loss_step=0.00744, global_step=6898.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  84%|████████▍ | 1020/1208 [27:14<05:01,  1.60s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00744, train/loss_vlb_step=3.44e-5, train/loss_step=0.00744, global_step=6898.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  84%|████████▍ | 1020/1208 [27:14<05:01,  1.60s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0649, train/loss_vlb_step=0.000222, train/loss_step=0.0649, global_step=6898.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  85%|████████▍ | 1021/1208 [27:15<04:59,  1.60s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0649, train/loss_vlb_step=0.000222, train/loss_step=0.0649, global_step=6898.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  85%|████████▍ | 1021/1208 [27:15<04:59,  1.60s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=3.72e-5, train/loss_step=0.00742, global_step=6899.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  85%|████████▍ | 1022/1208 [27:16<04:57,  1.60s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=3.72e-5, train/loss_step=0.00742, global_step=6899.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  85%|████████▍ | 1022/1208 [27:16<04:57,  1.60s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.76e-5, train/loss_step=0.00319, global_step=6899.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  85%|████████▍ | 1023/1208 [27:17<04:56,  1.60s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.76e-5, train/loss_step=0.00319, global_step=6899.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  85%|████████▍ | 1023/1208 [27:17<04:56,  1.60s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00805, train/loss_vlb_step=3.78e-5, train/loss_step=0.00805, global_step=6899.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  85%|████████▍ | 1024/1208 [27:20<04:54,  1.60s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00805, train/loss_vlb_step=3.78e-5, train/loss_step=0.00805, global_step=6899.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  85%|████████▍ | 1024/1208 [27:20<04:54,  1.60s/it, loss=0.126, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=6899.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  85%|████████▍ | 1025/1208 [27:21<04:53,  1.60s/it, loss=0.126, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=6899.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  85%|████████▍ | 1025/1208 [27:21<04:53,  1.60s/it, loss=0.145, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00277, train/loss_step=0.396, global_step=6900.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  85%|████████▍ | 1026/1208 [27:22<04:51,  1.60s/it, loss=0.145, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00277, train/loss_step=0.396, global_step=6900.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  85%|████████▍ | 1026/1208 [27:22<04:51,  1.60s/it, loss=0.152, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000526, train/loss_step=0.156, global_step=6900.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  85%|████████▌ | 1027/1208 [27:23<04:49,  1.60s/it, loss=0.152, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000526, train/loss_step=0.156, global_step=6900.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  85%|████████▌ | 1027/1208 [27:23<04:49,  1.60s/it, loss=0.167, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00126, train/loss_step=0.295, global_step=6900.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  85%|████████▌ | 1028/1208 [27:26<04:48,  1.60s/it, loss=0.167, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00126, train/loss_step=0.295, global_step=6900.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  85%|████████▌ | 1028/1208 [27:26<04:48,  1.60s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.83e-5, train/loss_step=0.0108, global_step=6900.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  85%|████████▌ | 1029/1208 [27:27<04:46,  1.60s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.83e-5, train/loss_step=0.0108, global_step=6900.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  85%|████████▌ | 1029/1208 [27:27<04:46,  1.60s/it, loss=0.155, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000371, train/loss_step=0.112, global_step=6901.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  85%|████████▌ | 1030/1208 [27:28<04:44,  1.60s/it, loss=0.155, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000371, train/loss_step=0.112, global_step=6901.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  85%|████████▌ | 1030/1208 [27:28<04:44,  1.60s/it, loss=0.161, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000994, train/loss_step=0.232, global_step=6901.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  85%|████████▌ | 1031/1208 [27:29<04:43,  1.60s/it, loss=0.161, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000994, train/loss_step=0.232, global_step=6901.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  85%|████████▌ | 1031/1208 [27:29<04:43,  1.60s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000121, train/loss_step=0.0327, global_step=6901.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  85%|████████▌ | 1032/1208 [27:33<04:41,  1.60s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000121, train/loss_step=0.0327, global_step=6901.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  85%|████████▌ | 1032/1208 [27:33<04:41,  1.60s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0863, train/loss_vlb_step=0.000289, train/loss_step=0.0863, global_step=6901.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  86%|████████▌ | 1033/1208 [27:34<04:40,  1.60s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0863, train/loss_vlb_step=0.000289, train/loss_step=0.0863, global_step=6901.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  86%|████████▌ | 1033/1208 [27:34<04:40,  1.60s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000103, train/loss_step=0.0265, global_step=6902.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  86%|████████▌ | 1034/1208 [27:35<04:38,  1.60s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000103, train/loss_step=0.0265, global_step=6902.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  86%|████████▌ | 1034/1208 [27:35<04:38,  1.60s/it, loss=0.156, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00262, train/loss_step=0.368, global_step=6902.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  86%|████████▌ | 1035/1208 [27:36<04:36,  1.60s/it, loss=0.156, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00262, train/loss_step=0.368, global_step=6902.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  86%|████████▌ | 1035/1208 [27:36<04:36,  1.60s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=1.27e-5, train/loss_step=0.00221, global_step=6902.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  86%|████████▌ | 1036/1208 [27:39<04:35,  1.60s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=1.27e-5, train/loss_step=0.00221, global_step=6902.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  86%|████████▌ | 1036/1208 [27:39<04:35,  1.60s/it, loss=0.126, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000417, train/loss_step=0.124, global_step=6902.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  86%|████████▌ | 1037/1208 [27:40<04:33,  1.60s/it, loss=0.126, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000417, train/loss_step=0.124, global_step=6902.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  86%|████████▌ | 1037/1208 [27:40<04:33,  1.60s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00398, train/loss_vlb_step=2.14e-5, train/loss_step=0.00398, global_step=6903.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  86%|████████▌ | 1038/1208 [27:41<04:32,  1.60s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00398, train/loss_vlb_step=2.14e-5, train/loss_step=0.00398, global_step=6903.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  86%|████████▌ | 1038/1208 [27:41<04:32,  1.60s/it, loss=0.124, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00514, train/loss_step=0.434, global_step=6903.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  86%|████████▌ | 1039/1208 [27:42<04:30,  1.60s/it, loss=0.124, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00514, train/loss_step=0.434, global_step=6903.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  86%|████████▌ | 1039/1208 [27:42<04:30,  1.60s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.31e-5, train/loss_step=0.0143, global_step=6903.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  86%|████████▌ | 1040/1208 [27:45<04:29,  1.60s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.31e-5, train/loss_step=0.0143, global_step=6903.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  86%|████████▌ | 1040/1208 [27:45<04:29,  1.60s/it, loss=0.14, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00284, train/loss_step=0.368, global_step=6903.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  86%|████████▌ | 1041/1208 [27:46<04:27,  1.60s/it, loss=0.14, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00284, train/loss_step=0.368, global_step=6903.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  86%|████████▌ | 1041/1208 [27:46<04:27,  1.60s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0884, train/loss_vlb_step=0.000292, train/loss_step=0.0884, global_step=6904.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  86%|████████▋ | 1042/1208 [27:47<04:25,  1.60s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0884, train/loss_vlb_step=0.000292, train/loss_step=0.0884, global_step=6904.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  86%|████████▋ | 1042/1208 [27:47<04:25,  1.60s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=1.14e-5, train/loss_step=0.00196, global_step=6904.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  86%|████████▋ | 1043/1208 [27:48<04:24,  1.60s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=1.14e-5, train/loss_step=0.00196, global_step=6904.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  86%|████████▋ | 1043/1208 [27:48<04:24,  1.60s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.98e-5, train/loss_step=0.0108, global_step=6904.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  86%|████████▋ | 1044/1208 [27:52<04:22,  1.60s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.98e-5, train/loss_step=0.0108, global_step=6904.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  86%|████████▋ | 1044/1208 [27:52<04:22,  1.60s/it, loss=0.145, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000486, train/loss_step=0.139, global_step=6904.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  87%|████████▋ | 1045/1208 [27:53<04:20,  1.60s/it, loss=0.145, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000486, train/loss_step=0.139, global_step=6904.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  87%|████████▋ | 1045/1208 [27:53<04:20,  1.60s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000189, train/loss_step=0.0555, global_step=6905.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  87%|████████▋ | 1046/1208 [27:54<04:19,  1.60s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000189, train/loss_step=0.0555, global_step=6905.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  87%|████████▋ | 1046/1208 [27:54<04:19,  1.60s/it, loss=0.131, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000767, train/loss_step=0.207, global_step=6905.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  87%|████████▋ | 1047/1208 [27:55<04:17,  1.60s/it, loss=0.131, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000767, train/loss_step=0.207, global_step=6905.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  87%|████████▋ | 1047/1208 [27:55<04:17,  1.60s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000244, train/loss_step=0.0741, global_step=6905.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  87%|████████▋ | 1048/1208 [27:58<04:16,  1.60s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000244, train/loss_step=0.0741, global_step=6905.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  87%|████████▋ | 1048/1208 [27:58<04:16,  1.60s/it, loss=0.127, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000532, train/loss_step=0.152, global_step=6905.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  87%|████████▋ | 1049/1208 [27:59<04:14,  1.60s/it, loss=0.127, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000532, train/loss_step=0.152, global_step=6905.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  87%|████████▋ | 1049/1208 [27:59<04:14,  1.60s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0069, train/loss_vlb_step=3.42e-5, train/loss_step=0.0069, global_step=6906.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  87%|████████▋ | 1050/1208 [28:00<04:12,  1.60s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0069, train/loss_vlb_step=3.42e-5, train/loss_step=0.0069, global_step=6906.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  87%|████████▋ | 1050/1208 [28:00<04:12,  1.60s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=7.81e-5, train/loss_step=0.0189, global_step=6906.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  87%|████████▋ | 1051/1208 [28:01<04:11,  1.60s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=7.81e-5, train/loss_step=0.0189, global_step=6906.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  87%|████████▋ | 1051/1208 [28:01<04:11,  1.60s/it, loss=0.129, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00358, train/loss_step=0.403, global_step=6906.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  87%|████████▋ | 1052/1208 [28:04<04:09,  1.60s/it, loss=0.129, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00358, train/loss_step=0.403, global_step=6906.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  87%|████████▋ | 1052/1208 [28:04<04:09,  1.60s/it, loss=0.135, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.00076, train/loss_step=0.211, global_step=6906.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  87%|████████▋ | 1053/1208 [28:05<04:08,  1.60s/it, loss=0.135, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.00076, train/loss_step=0.211, global_step=6906.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  87%|████████▋ | 1053/1208 [28:05<04:08,  1.60s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.39e-5, train/loss_step=0.0107, global_step=6907.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  87%|████████▋ | 1054/1208 [28:06<04:06,  1.60s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.39e-5, train/loss_step=0.0107, global_step=6907.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  87%|████████▋ | 1054/1208 [28:06<04:06,  1.60s/it, loss=0.124, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000547, train/loss_step=0.163, global_step=6907.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  87%|████████▋ | 1055/1208 [28:07<04:04,  1.60s/it, loss=0.124, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000547, train/loss_step=0.163, global_step=6907.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  87%|████████▋ | 1055/1208 [28:07<04:04,  1.60s/it, loss=0.167, v_num=0, train/loss_simple_step=0.862, train/loss_vlb_step=0.0735, train/loss_step=0.862, global_step=6907.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  87%|████████▋ | 1056/1208 [28:10<04:03,  1.60s/it, loss=0.167, v_num=0, train/loss_simple_step=0.862, train/loss_vlb_step=0.0735, train/loss_step=0.862, global_step=6907.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  87%|████████▋ | 1056/1208 [28:10<04:03,  1.60s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000139, train/loss_step=0.0388, global_step=6907.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  88%|████████▊ | 1057/1208 [28:12<04:01,  1.60s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000139, train/loss_step=0.0388, global_step=6907.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  88%|████████▊ | 1057/1208 [28:12<04:01,  1.60s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0318, train/loss_vlb_step=0.000124, train/loss_step=0.0318, global_step=6908.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  88%|████████▊ | 1058/1208 [28:13<04:00,  1.60s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0318, train/loss_vlb_step=0.000124, train/loss_step=0.0318, global_step=6908.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  88%|████████▊ | 1058/1208 [28:13<04:00,  1.60s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.29e-5, train/loss_step=0.00222, global_step=6908.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  88%|████████▊ | 1059/1208 [28:14<03:58,  1.60s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.29e-5, train/loss_step=0.00222, global_step=6908.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  88%|████████▊ | 1059/1208 [28:14<03:58,  1.60s/it, loss=0.167, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00722, train/loss_step=0.499, global_step=6908.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  88%|████████▊ | 1060/1208 [28:17<03:56,  1.60s/it, loss=0.167, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00722, train/loss_step=0.499, global_step=6908.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  88%|████████▊ | 1060/1208 [28:17<03:56,  1.60s/it, loss=0.157, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000532, train/loss_step=0.160, global_step=6908.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  88%|████████▊ | 1061/1208 [28:18<03:55,  1.60s/it, loss=0.157, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000532, train/loss_step=0.160, global_step=6908.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  88%|████████▊ | 1061/1208 [28:18<03:55,  1.60s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00924, train/loss_vlb_step=4.6e-5, train/loss_step=0.00924, global_step=6909.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  88%|████████▊ | 1062/1208 [28:19<03:53,  1.60s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00924, train/loss_vlb_step=4.6e-5, train/loss_step=0.00924, global_step=6909.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  88%|████████▊ | 1062/1208 [28:19<03:53,  1.60s/it, loss=0.162, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.00068, train/loss_step=0.186, global_step=6909.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  88%|████████▊ | 1063/1208 [28:20<03:51,  1.60s/it, loss=0.162, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.00068, train/loss_step=0.186, global_step=6909.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  88%|████████▊ | 1063/1208 [28:20<03:51,  1.60s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.31e-5, train/loss_step=0.0139, global_step=6909.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  88%|████████▊ | 1064/1208 [28:23<03:50,  1.60s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.31e-5, train/loss_step=0.0139, global_step=6909.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  88%|████████▊ | 1064/1208 [28:23<03:50,  1.60s/it, loss=0.162, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000443, train/loss_step=0.132, global_step=6909.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  88%|████████▊ | 1065/1208 [28:24<03:48,  1.60s/it, loss=0.162, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000443, train/loss_step=0.132, global_step=6909.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  88%|████████▊ | 1065/1208 [28:24<03:48,  1.60s/it, loss=0.17, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000747, train/loss_step=0.215, global_step=6910.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  88%|████████▊ | 1066/1208 [28:25<03:47,  1.60s/it, loss=0.17, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000747, train/loss_step=0.215, global_step=6910.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  88%|████████▊ | 1066/1208 [28:25<03:47,  1.60s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0667, train/loss_vlb_step=0.00023, train/loss_step=0.0667, global_step=6910.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  88%|████████▊ | 1067/1208 [28:26<03:45,  1.60s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0667, train/loss_vlb_step=0.00023, train/loss_step=0.0667, global_step=6910.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  88%|████████▊ | 1067/1208 [28:26<03:45,  1.60s/it, loss=0.165, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.00038, train/loss_step=0.115, global_step=6910.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  88%|████████▊ | 1068/1208 [28:29<03:44,  1.60s/it, loss=0.165, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.00038, train/loss_step=0.115, global_step=6910.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  88%|████████▊ | 1068/1208 [28:29<03:44,  1.60s/it, loss=0.177, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00423, train/loss_step=0.395, global_step=6910.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  88%|████████▊ | 1069/1208 [28:31<03:42,  1.60s/it, loss=0.177, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00423, train/loss_step=0.395, global_step=6910.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  88%|████████▊ | 1069/1208 [28:31<03:42,  1.60s/it, loss=0.195, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.0022, train/loss_step=0.370, global_step=6911.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  89%|████████▊ | 1070/1208 [28:32<03:40,  1.60s/it, loss=0.195, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.0022, train/loss_step=0.370, global_step=6911.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  89%|████████▊ | 1070/1208 [28:32<03:40,  1.60s/it, loss=0.2, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000418, train/loss_step=0.125, global_step=6911.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  89%|████████▊ | 1071/1208 [28:33<03:39,  1.60s/it, loss=0.2, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000418, train/loss_step=0.125, global_step=6911.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  89%|████████▊ | 1071/1208 [28:33<03:39,  1.60s/it, loss=0.191, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.00076, train/loss_step=0.207, global_step=6911.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  89%|████████▊ | 1072/1208 [28:36<03:37,  1.60s/it, loss=0.191, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.00076, train/loss_step=0.207, global_step=6911.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  89%|████████▊ | 1072/1208 [28:36<03:37,  1.60s/it, loss=0.199, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00352, train/loss_step=0.378, global_step=6911.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  89%|████████▉ | 1073/1208 [28:37<03:36,  1.60s/it, loss=0.199, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00352, train/loss_step=0.378, global_step=6911.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  89%|████████▉ | 1073/1208 [28:37<03:36,  1.60s/it, loss=0.205, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.00046, train/loss_step=0.139, global_step=6912.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  89%|████████▉ | 1074/1208 [28:38<03:34,  1.60s/it, loss=0.205, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.00046, train/loss_step=0.139, global_step=6912.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  89%|████████▉ | 1074/1208 [28:38<03:34,  1.60s/it, loss=0.207, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000734, train/loss_step=0.189, global_step=6912.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  89%|████████▉ | 1075/1208 [28:39<03:32,  1.60s/it, loss=0.207, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000734, train/loss_step=0.189, global_step=6912.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  89%|████████▉ | 1075/1208 [28:39<03:32,  1.60s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0639, train/loss_vlb_step=0.000221, train/loss_step=0.0639, global_step=6912.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  89%|████████▉ | 1076/1208 [28:42<03:31,  1.60s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0639, train/loss_vlb_step=0.000221, train/loss_step=0.0639, global_step=6912.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  89%|████████▉ | 1076/1208 [28:42<03:31,  1.60s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00656, train/loss_vlb_step=3.06e-5, train/loss_step=0.00656, global_step=6912.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  89%|████████▉ | 1077/1208 [28:43<03:29,  1.60s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00656, train/loss_vlb_step=3.06e-5, train/loss_step=0.00656, global_step=6912.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  89%|████████▉ | 1077/1208 [28:43<03:29,  1.60s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0816, train/loss_vlb_step=0.00027, train/loss_step=0.0816, global_step=6913.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  89%|████████▉ | 1078/1208 [28:44<03:27,  1.60s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0816, train/loss_vlb_step=0.00027, train/loss_step=0.0816, global_step=6913.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  89%|████████▉ | 1078/1208 [28:44<03:27,  1.60s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.78e-5, train/loss_step=0.0216, global_step=6913.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  89%|████████▉ | 1079/1208 [28:45<03:26,  1.60s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.78e-5, train/loss_step=0.0216, global_step=6913.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  89%|████████▉ | 1079/1208 [28:45<03:26,  1.60s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0577, train/loss_vlb_step=0.000198, train/loss_step=0.0577, global_step=6913.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  89%|████████▉ | 1080/1208 [28:48<03:24,  1.60s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0577, train/loss_vlb_step=0.000198, train/loss_step=0.0577, global_step=6913.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  89%|████████▉ | 1080/1208 [28:48<03:24,  1.60s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.58e-5, train/loss_step=0.00281, global_step=6913.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  89%|████████▉ | 1081/1208 [28:50<03:23,  1.60s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.58e-5, train/loss_step=0.00281, global_step=6913.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  89%|████████▉ | 1081/1208 [28:50<03:23,  1.60s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.96e-5, train/loss_step=0.0106, global_step=6914.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  90%|████████▉ | 1082/1208 [28:51<03:21,  1.60s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.96e-5, train/loss_step=0.0106, global_step=6914.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  90%|████████▉ | 1082/1208 [28:51<03:21,  1.60s/it, loss=0.147, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00159, train/loss_step=0.342, global_step=6914.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  90%|████████▉ | 1083/1208 [28:52<03:19,  1.60s/it, loss=0.147, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00159, train/loss_step=0.342, global_step=6914.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  90%|████████▉ | 1083/1208 [28:52<03:19,  1.60s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.85e-5, train/loss_step=0.00557, global_step=6914.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  90%|████████▉ | 1084/1208 [28:54<03:18,  1.60s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.85e-5, train/loss_step=0.00557, global_step=6914.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  90%|████████▉ | 1084/1208 [28:54<03:18,  1.60s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0453, train/loss_vlb_step=0.000163, train/loss_step=0.0453, global_step=6914.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  90%|████████▉ | 1085/1208 [28:55<03:16,  1.60s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0453, train/loss_vlb_step=0.000163, train/loss_step=0.0453, global_step=6914.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  90%|████████▉ | 1085/1208 [28:55<03:16,  1.60s/it, loss=0.152, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00275, train/loss_step=0.427, global_step=6915.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  90%|████████▉ | 1086/1208 [28:56<03:15,  1.60s/it, loss=0.152, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00275, train/loss_step=0.427, global_step=6915.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  90%|████████▉ | 1086/1208 [28:56<03:15,  1.60s/it, loss=0.159, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000754, train/loss_step=0.202, global_step=6915.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  90%|████████▉ | 1087/1208 [28:57<03:13,  1.60s/it, loss=0.159, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000754, train/loss_step=0.202, global_step=6915.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  90%|████████▉ | 1087/1208 [28:57<03:13,  1.60s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.09e-5, train/loss_step=0.0136, global_step=6915.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  90%|█████████ | 1088/1208 [29:01<03:12,  1.60s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.09e-5, train/loss_step=0.0136, global_step=6915.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  90%|█████████ | 1088/1208 [29:01<03:12,  1.60s/it, loss=0.169, v_num=0, train/loss_simple_step=0.701, train/loss_vlb_step=0.0304, train/loss_step=0.701, global_step=6915.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  90%|█████████ | 1089/1208 [29:02<03:10,  1.60s/it, loss=0.169, v_num=0, train/loss_simple_step=0.701, train/loss_vlb_step=0.0304, train/loss_step=0.701, global_step=6915.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  90%|█████████ | 1089/1208 [29:02<03:10,  1.60s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0783, train/loss_vlb_step=0.000264, train/loss_step=0.0783, global_step=6916.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  90%|█████████ | 1090/1208 [29:03<03:08,  1.60s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0783, train/loss_vlb_step=0.000264, train/loss_step=0.0783, global_step=6916.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  90%|█████████ | 1090/1208 [29:03<03:08,  1.60s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00908, train/loss_vlb_step=4.28e-5, train/loss_step=0.00908, global_step=6916.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  90%|█████████ | 1091/1208 [29:04<03:07,  1.60s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00908, train/loss_vlb_step=4.28e-5, train/loss_step=0.00908, global_step=6916.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  90%|█████████ | 1091/1208 [29:04<03:07,  1.60s/it, loss=0.145, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000406, train/loss_step=0.124, global_step=6916.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  90%|█████████ | 1092/1208 [29:07<03:05,  1.60s/it, loss=0.145, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000406, train/loss_step=0.124, global_step=6916.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  90%|█████████ | 1092/1208 [29:07<03:05,  1.60s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00396, train/loss_vlb_step=2.1e-5, train/loss_step=0.00396, global_step=6916.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  90%|█████████ | 1093/1208 [29:08<03:03,  1.60s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00396, train/loss_vlb_step=2.1e-5, train/loss_step=0.00396, global_step=6916.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  90%|█████████ | 1093/1208 [29:08<03:03,  1.60s/it, loss=0.128, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000619, train/loss_step=0.182, global_step=6917.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  91%|█████████ | 1094/1208 [29:09<03:02,  1.60s/it, loss=0.128, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000619, train/loss_step=0.182, global_step=6917.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  91%|█████████ | 1094/1208 [29:09<03:02,  1.60s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.63e-5, train/loss_step=0.00277, global_step=6917.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  91%|█████████ | 1095/1208 [29:10<03:00,  1.60s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.63e-5, train/loss_step=0.00277, global_step=6917.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  91%|█████████ | 1095/1208 [29:10<03:00,  1.60s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.65e-5, train/loss_step=0.00284, global_step=6917.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  91%|█████████ | 1096/1208 [29:13<02:59,  1.60s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.65e-5, train/loss_step=0.00284, global_step=6917.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  91%|█████████ | 1096/1208 [29:13<02:59,  1.60s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0829, train/loss_vlb_step=0.000272, train/loss_step=0.0829, global_step=6917.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  91%|█████████ | 1097/1208 [29:14<02:57,  1.60s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0829, train/loss_vlb_step=0.000272, train/loss_step=0.0829, global_step=6917.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  91%|█████████ | 1097/1208 [29:14<02:57,  1.60s/it, loss=0.127, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000994, train/loss_step=0.224, global_step=6918.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  91%|█████████ | 1098/1208 [29:15<02:55,  1.60s/it, loss=0.127, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000994, train/loss_step=0.224, global_step=6918.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  91%|█████████ | 1098/1208 [29:15<02:55,  1.60s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00399, train/loss_vlb_step=2.16e-5, train/loss_step=0.00399, global_step=6918.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  91%|█████████ | 1099/1208 [29:17<02:54,  1.60s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00399, train/loss_vlb_step=2.16e-5, train/loss_step=0.00399, global_step=6918.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  91%|█████████ | 1099/1208 [29:17<02:54,  1.60s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=2.57e-5, train/loss_step=0.00492, global_step=6918.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  91%|█████████ | 1100/1208 [29:20<02:52,  1.60s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=2.57e-5, train/loss_step=0.00492, global_step=6918.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  91%|█████████ | 1100/1208 [29:20<02:52,  1.60s/it, loss=0.132, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000567, train/loss_step=0.171, global_step=6918.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  91%|█████████ | 1101/1208 [29:21<02:51,  1.60s/it, loss=0.132, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000567, train/loss_step=0.171, global_step=6918.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  91%|█████████ | 1101/1208 [29:21<02:51,  1.60s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0428, train/loss_vlb_step=0.00016, train/loss_step=0.0428, global_step=6919.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  91%|█████████ | 1102/1208 [29:22<02:49,  1.60s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0428, train/loss_vlb_step=0.00016, train/loss_step=0.0428, global_step=6919.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  91%|█████████ | 1102/1208 [29:22<02:49,  1.60s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.14e-5, train/loss_step=0.0112, global_step=6919.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  91%|█████████▏| 1103/1208 [29:23<02:47,  1.60s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.14e-5, train/loss_step=0.0112, global_step=6919.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  91%|█████████▏| 1103/1208 [29:23<02:47,  1.60s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000111, train/loss_step=0.0308, global_step=6919.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  91%|█████████▏| 1104/1208 [29:26<02:46,  1.60s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000111, train/loss_step=0.0308, global_step=6919.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  91%|█████████▏| 1104/1208 [29:26<02:46,  1.60s/it, loss=0.127, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000902, train/loss_step=0.224, global_step=6919.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  91%|█████████▏| 1105/1208 [29:27<02:44,  1.60s/it, loss=0.127, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000902, train/loss_step=0.224, global_step=6919.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  91%|█████████▏| 1105/1208 [29:27<02:44,  1.60s/it, loss=0.116, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000732, train/loss_step=0.201, global_step=6920.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  92%|█████████▏| 1106/1208 [29:28<02:43,  1.60s/it, loss=0.116, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000732, train/loss_step=0.201, global_step=6920.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  92%|█████████▏| 1106/1208 [29:28<02:43,  1.60s/it, loss=0.115, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.00061, train/loss_step=0.178, global_step=6920.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  92%|█████████▏| 1107/1208 [29:29<02:41,  1.60s/it, loss=0.115, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.00061, train/loss_step=0.178, global_step=6920.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  92%|█████████▏| 1107/1208 [29:29<02:41,  1.60s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0606, train/loss_vlb_step=0.000208, train/loss_step=0.0606, global_step=6920.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  92%|█████████▏| 1108/1208 [29:32<02:40,  1.60s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0606, train/loss_vlb_step=0.000208, train/loss_step=0.0606, global_step=6920.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  92%|█████████▏| 1108/1208 [29:32<02:40,  1.60s/it, loss=0.0824, v_num=0, train/loss_simple_step=0.00939, train/loss_vlb_step=4.57e-5, train/loss_step=0.00939, global_step=6920.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  92%|█████████▏| 1109/1208 [29:33<02:38,  1.60s/it, loss=0.0824, v_num=0, train/loss_simple_step=0.00939, train/loss_vlb_step=4.57e-5, train/loss_step=0.00939, global_step=6920.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  92%|█████████▏| 1109/1208 [29:33<02:38,  1.60s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00372, train/loss_step=0.389, global_step=6921.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  92%|█████████▏| 1110/1208 [29:34<02:36,  1.60s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00372, train/loss_step=0.389, global_step=6921.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  92%|█████████▏| 1110/1208 [29:34<02:36,  1.60s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000107, train/loss_step=0.0277, global_step=6921.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  92%|█████████▏| 1111/1208 [29:35<02:35,  1.60s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000107, train/loss_step=0.0277, global_step=6921.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  92%|█████████▏| 1111/1208 [29:36<02:35,  1.60s/it, loss=0.099, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000428, train/loss_step=0.128, global_step=6921.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  92%|█████████▏| 1112/1208 [29:39<02:33,  1.60s/it, loss=0.099, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000428, train/loss_step=0.128, global_step=6921.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  92%|█████████▏| 1112/1208 [29:39<02:33,  1.60s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=6.04e-5, train/loss_step=0.0131, global_step=6921.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  92%|█████████▏| 1113/1208 [29:40<02:31,  1.60s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=6.04e-5, train/loss_step=0.0131, global_step=6921.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  92%|█████████▏| 1113/1208 [29:40<02:31,  1.60s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=1.93e-5, train/loss_step=0.00359, global_step=6922.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  92%|█████████▏| 1114/1208 [29:41<02:30,  1.60s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=1.93e-5, train/loss_step=0.00359, global_step=6922.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  92%|█████████▏| 1114/1208 [29:41<02:30,  1.60s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000123, train/loss_step=0.0348, global_step=6922.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  92%|█████████▏| 1115/1208 [29:42<02:28,  1.60s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000123, train/loss_step=0.0348, global_step=6922.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  92%|█████████▏| 1115/1208 [29:42<02:28,  1.60s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=6922.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  92%|█████████▏| 1116/1208 [29:45<02:27,  1.60s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=6922.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  92%|█████████▏| 1116/1208 [29:45<02:27,  1.60s/it, loss=0.0938, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.36e-5, train/loss_step=0.0119, global_step=6922.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  92%|█████████▏| 1117/1208 [29:46<02:25,  1.60s/it, loss=0.0938, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.36e-5, train/loss_step=0.0119, global_step=6922.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  92%|█████████▏| 1117/1208 [29:46<02:25,  1.60s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000761, train/loss_step=0.209, global_step=6923.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  93%|█████████▎| 1118/1208 [29:47<02:23,  1.60s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000761, train/loss_step=0.209, global_step=6923.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  93%|█████████▎| 1118/1208 [29:47<02:23,  1.60s/it, loss=0.103, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000748, train/loss_step=0.207, global_step=6923.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  93%|█████████▎| 1119/1208 [29:48<02:22,  1.60s/it, loss=0.103, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000748, train/loss_step=0.207, global_step=6923.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  93%|█████████▎| 1119/1208 [29:48<02:22,  1.60s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00442, train/loss_vlb_step=2.26e-5, train/loss_step=0.00442, global_step=6923.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  93%|█████████▎| 1120/1208 [29:51<02:20,  1.60s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00442, train/loss_vlb_step=2.26e-5, train/loss_step=0.00442, global_step=6923.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  93%|█████████▎| 1120/1208 [29:51<02:20,  1.60s/it, loss=0.101, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.00045, train/loss_step=0.137, global_step=6923.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  93%|█████████▎| 1121/1208 [29:52<02:19,  1.60s/it, loss=0.101, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.00045, train/loss_step=0.137, global_step=6923.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  93%|█████████▎| 1121/1208 [29:52<02:19,  1.60s/it, loss=0.112, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00112, train/loss_step=0.260, global_step=6924.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  93%|█████████▎| 1122/1208 [29:53<02:17,  1.60s/it, loss=0.112, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00112, train/loss_step=0.260, global_step=6924.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  93%|█████████▎| 1122/1208 [29:53<02:17,  1.60s/it, loss=0.12, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000577, train/loss_step=0.167, global_step=6924.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  93%|█████████▎| 1123/1208 [29:54<02:15,  1.60s/it, loss=0.12, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000577, train/loss_step=0.167, global_step=6924.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  93%|█████████▎| 1123/1208 [29:54<02:15,  1.60s/it, loss=0.124, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000367, train/loss_step=0.111, global_step=6924.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  93%|█████████▎| 1124/1208 [29:58<02:14,  1.60s/it, loss=0.124, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000367, train/loss_step=0.111, global_step=6924.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  93%|█████████▎| 1124/1208 [29:58<02:14,  1.60s/it, loss=0.131, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00207, train/loss_step=0.353, global_step=6924.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  93%|█████████▎| 1125/1208 [29:59<02:12,  1.60s/it, loss=0.131, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00207, train/loss_step=0.353, global_step=6924.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  93%|█████████▎| 1125/1208 [29:59<02:12,  1.60s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.36e-5, train/loss_step=0.0231, global_step=6925.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  93%|█████████▎| 1126/1208 [30:00<02:11,  1.60s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.36e-5, train/loss_step=0.0231, global_step=6925.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  93%|█████████▎| 1126/1208 [30:00<02:11,  1.60s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0479, train/loss_vlb_step=0.000169, train/loss_step=0.0479, global_step=6925.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  93%|█████████▎| 1127/1208 [30:01<02:09,  1.60s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0479, train/loss_vlb_step=0.000169, train/loss_step=0.0479, global_step=6925.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  93%|█████████▎| 1127/1208 [30:01<02:09,  1.60s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00538, train/loss_vlb_step=2.77e-5, train/loss_step=0.00538, global_step=6925.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  93%|█████████▎| 1128/1208 [30:04<02:07,  1.60s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00538, train/loss_vlb_step=2.77e-5, train/loss_step=0.00538, global_step=6925.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  93%|█████████▎| 1128/1208 [30:04<02:07,  1.60s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0568, train/loss_vlb_step=0.0002, train/loss_step=0.0568, global_step=6925.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  93%|█████████▎| 1129/1208 [30:05<02:06,  1.60s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0568, train/loss_vlb_step=0.0002, train/loss_step=0.0568, global_step=6925.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  93%|█████████▎| 1129/1208 [30:05<02:06,  1.60s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000123, train/loss_step=0.0349, global_step=6926.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  94%|█████████▎| 1130/1208 [30:06<02:04,  1.60s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000123, train/loss_step=0.0349, global_step=6926.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  94%|█████████▎| 1130/1208 [30:06<02:04,  1.60s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.0479, train/loss_vlb_step=0.000176, train/loss_step=0.0479, global_step=6926.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  94%|█████████▎| 1131/1208 [30:07<02:03,  1.60s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.0479, train/loss_vlb_step=0.000176, train/loss_step=0.0479, global_step=6926.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  94%|█████████▎| 1131/1208 [30:07<02:03,  1.60s/it, loss=0.0918, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=1.09e-5, train/loss_step=0.00179, global_step=6926.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  94%|█████████▎| 1132/1208 [30:10<02:01,  1.60s/it, loss=0.0918, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=1.09e-5, train/loss_step=0.00179, global_step=6926.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  94%|█████████▎| 1132/1208 [30:10<02:01,  1.60s/it, loss=0.11, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.0039, train/loss_step=0.370, global_step=6926.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]       Epoch 22:  94%|█████████▍| 1133/1208 [30:11<01:59,  1.60s/it, loss=0.11, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.0039, train/loss_step=0.370, global_step=6926.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  94%|█████████▍| 1133/1208 [30:11<01:59,  1.60s/it, loss=0.116, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000406, train/loss_step=0.123, global_step=6927.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  94%|█████████▍| 1134/1208 [30:12<01:58,  1.60s/it, loss=0.116, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000406, train/loss_step=0.123, global_step=6927.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  94%|█████████▍| 1134/1208 [30:12<01:58,  1.60s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00784, train/loss_vlb_step=3.71e-5, train/loss_step=0.00784, global_step=6927.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  94%|█████████▍| 1135/1208 [30:13<01:56,  1.60s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00784, train/loss_vlb_step=3.71e-5, train/loss_step=0.00784, global_step=6927.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  94%|█████████▍| 1135/1208 [30:13<01:56,  1.60s/it, loss=0.118, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000647, train/loss_step=0.181, global_step=6927.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  94%|█████████▍| 1136/1208 [30:17<01:55,  1.60s/it, loss=0.118, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000647, train/loss_step=0.181, global_step=6927.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  94%|█████████▍| 1136/1208 [30:17<01:55,  1.60s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.000114, train/loss_step=0.0292, global_step=6927.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  94%|█████████▍| 1137/1208 [30:18<01:53,  1.60s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.000114, train/loss_step=0.0292, global_step=6927.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  94%|█████████▍| 1137/1208 [30:18<01:53,  1.60s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0786, train/loss_vlb_step=0.000262, train/loss_step=0.0786, global_step=6928.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  94%|█████████▍| 1138/1208 [30:19<01:51,  1.60s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0786, train/loss_vlb_step=0.000262, train/loss_step=0.0786, global_step=6928.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  94%|█████████▍| 1138/1208 [30:19<01:51,  1.60s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.83e-5, train/loss_step=0.0107, global_step=6928.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  94%|█████████▍| 1139/1208 [30:20<01:50,  1.60s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.83e-5, train/loss_step=0.0107, global_step=6928.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  94%|█████████▍| 1139/1208 [30:20<01:50,  1.60s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.81e-5, train/loss_step=0.00324, global_step=6928.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  94%|█████████▍| 1140/1208 [30:23<01:48,  1.60s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.81e-5, train/loss_step=0.00324, global_step=6928.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  94%|█████████▍| 1140/1208 [30:23<01:48,  1.60s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.00882, train/loss_vlb_step=4.21e-5, train/loss_step=0.00882, global_step=6928.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  94%|█████████▍| 1141/1208 [30:24<01:47,  1.60s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.00882, train/loss_vlb_step=4.21e-5, train/loss_step=0.00882, global_step=6928.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  94%|█████████▍| 1141/1208 [30:24<01:47,  1.60s/it, loss=0.0881, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=6929.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  95%|█████████▍| 1142/1208 [30:25<01:45,  1.60s/it, loss=0.0881, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=6929.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  95%|█████████▍| 1142/1208 [30:25<01:45,  1.60s/it, loss=0.0904, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000772, train/loss_step=0.212, global_step=6929.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  95%|█████████▍| 1143/1208 [30:26<01:43,  1.60s/it, loss=0.0904, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000772, train/loss_step=0.212, global_step=6929.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  95%|█████████▍| 1143/1208 [30:26<01:43,  1.60s/it, loss=0.0895, v_num=0, train/loss_simple_step=0.0928, train/loss_vlb_step=0.000309, train/loss_step=0.0928, global_step=6929.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  95%|█████████▍| 1144/1208 [30:29<01:42,  1.60s/it, loss=0.0895, v_num=0, train/loss_simple_step=0.0928, train/loss_vlb_step=0.000309, train/loss_step=0.0928, global_step=6929.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  95%|█████████▍| 1144/1208 [30:29<01:42,  1.60s/it, loss=0.094, v_num=0, train/loss_simple_step=0.444, train/loss_vlb_step=0.00271, train/loss_step=0.444, global_step=6929.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  95%|█████████▍| 1145/1208 [30:30<01:40,  1.60s/it, loss=0.094, v_num=0, train/loss_simple_step=0.444, train/loss_vlb_step=0.00271, train/loss_step=0.444, global_step=6929.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  95%|█████████▍| 1145/1208 [30:30<01:40,  1.60s/it, loss=0.114, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00394, train/loss_step=0.418, global_step=6930.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  95%|█████████▍| 1146/1208 [30:32<01:39,  1.60s/it, loss=0.114, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00394, train/loss_step=0.418, global_step=6930.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  95%|█████████▍| 1146/1208 [30:32<01:39,  1.60s/it, loss=0.122, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000864, train/loss_step=0.221, global_step=6930.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  95%|█████████▍| 1147/1208 [30:33<01:37,  1.60s/it, loss=0.122, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000864, train/loss_step=0.221, global_step=6930.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  95%|█████████▍| 1147/1208 [30:33<01:37,  1.60s/it, loss=0.131, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000608, train/loss_step=0.177, global_step=6930.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  95%|█████████▌| 1148/1208 [30:36<01:35,  1.60s/it, loss=0.131, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000608, train/loss_step=0.177, global_step=6930.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  95%|█████████▌| 1148/1208 [30:36<01:35,  1.60s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=8.72e-5, train/loss_step=0.0223, global_step=6930.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  95%|█████████▌| 1149/1208 [30:37<01:34,  1.60s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=8.72e-5, train/loss_step=0.0223, global_step=6930.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  95%|█████████▌| 1149/1208 [30:37<01:34,  1.60s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000144, train/loss_step=0.0392, global_step=6931.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  95%|█████████▌| 1150/1208 [30:38<01:32,  1.60s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000144, train/loss_step=0.0392, global_step=6931.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  95%|█████████▌| 1150/1208 [30:38<01:32,  1.60s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00459, train/loss_vlb_step=2.49e-5, train/loss_step=0.00459, global_step=6931.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  95%|█████████▌| 1151/1208 [30:39<01:31,  1.60s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00459, train/loss_vlb_step=2.49e-5, train/loss_step=0.00459, global_step=6931.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  95%|█████████▌| 1151/1208 [30:39<01:31,  1.60s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0704, train/loss_vlb_step=0.000236, train/loss_step=0.0704, global_step=6931.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  95%|█████████▌| 1152/1208 [30:42<01:29,  1.60s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0704, train/loss_vlb_step=0.000236, train/loss_step=0.0704, global_step=6931.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  95%|█████████▌| 1152/1208 [30:42<01:29,  1.60s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.26e-5, train/loss_step=0.0173, global_step=6931.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  95%|█████████▌| 1153/1208 [30:43<01:27,  1.60s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.26e-5, train/loss_step=0.0173, global_step=6931.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  95%|█████████▌| 1153/1208 [30:43<01:27,  1.60s/it, loss=0.114, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000465, train/loss_step=0.141, global_step=6932.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  96%|█████████▌| 1154/1208 [30:44<01:26,  1.60s/it, loss=0.114, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000465, train/loss_step=0.141, global_step=6932.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  96%|█████████▌| 1154/1208 [30:44<01:26,  1.60s/it, loss=0.126, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00112, train/loss_step=0.248, global_step=6932.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  96%|█████████▌| 1155/1208 [30:45<01:24,  1.60s/it, loss=0.126, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00112, train/loss_step=0.248, global_step=6932.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  96%|█████████▌| 1155/1208 [30:45<01:24,  1.60s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.21e-5, train/loss_step=0.0118, global_step=6932.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  96%|█████████▌| 1156/1208 [30:49<01:23,  1.60s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.21e-5, train/loss_step=0.0118, global_step=6932.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  96%|█████████▌| 1156/1208 [30:49<01:23,  1.60s/it, loss=0.133, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00189, train/loss_step=0.335, global_step=6932.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  96%|█████████▌| 1157/1208 [30:50<01:21,  1.60s/it, loss=0.133, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00189, train/loss_step=0.335, global_step=6932.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  96%|█████████▌| 1157/1208 [30:50<01:21,  1.60s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.19e-5, train/loss_step=0.00202, global_step=6933.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  96%|█████████▌| 1158/1208 [30:51<01:19,  1.60s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.19e-5, train/loss_step=0.00202, global_step=6933.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  96%|█████████▌| 1158/1208 [30:51<01:19,  1.60s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.000158, train/loss_step=0.0441, global_step=6933.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  96%|█████████▌| 1159/1208 [30:52<01:18,  1.60s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.000158, train/loss_step=0.0441, global_step=6933.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  96%|█████████▌| 1159/1208 [30:52<01:18,  1.60s/it, loss=0.139, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000541, train/loss_step=0.161, global_step=6933.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  96%|█████████▌| 1160/1208 [30:55<01:16,  1.60s/it, loss=0.139, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000541, train/loss_step=0.161, global_step=6933.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  96%|█████████▌| 1160/1208 [30:55<01:16,  1.60s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=1.22e-5, train/loss_step=0.00206, global_step=6933.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  96%|█████████▌| 1161/1208 [30:56<01:15,  1.60s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=1.22e-5, train/loss_step=0.00206, global_step=6933.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  96%|█████████▌| 1161/1208 [30:56<01:15,  1.60s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00461, train/loss_vlb_step=2.42e-5, train/loss_step=0.00461, global_step=6934.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  96%|█████████▌| 1162/1208 [30:57<01:13,  1.60s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00461, train/loss_vlb_step=2.42e-5, train/loss_step=0.00461, global_step=6934.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  96%|█████████▌| 1162/1208 [30:57<01:13,  1.60s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=1.12e-5, train/loss_step=0.0019, global_step=6934.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  96%|█████████▋| 1163/1208 [30:58<01:11,  1.60s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=1.12e-5, train/loss_step=0.0019, global_step=6934.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  96%|█████████▋| 1163/1208 [30:58<01:11,  1.60s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0931, train/loss_vlb_step=0.00031, train/loss_step=0.0931, global_step=6934.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  96%|█████████▋| 1164/1208 [31:01<01:10,  1.60s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0931, train/loss_vlb_step=0.00031, train/loss_step=0.0931, global_step=6934.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  96%|█████████▋| 1164/1208 [31:01<01:10,  1.60s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0512, train/loss_vlb_step=0.00018, train/loss_step=0.0512, global_step=6934.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  96%|█████████▋| 1165/1208 [31:02<01:08,  1.60s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0512, train/loss_vlb_step=0.00018, train/loss_step=0.0512, global_step=6934.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  96%|█████████▋| 1165/1208 [31:02<01:08,  1.60s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.0014, train/loss_step=0.279, global_step=6935.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  97%|█████████▋| 1166/1208 [31:03<01:07,  1.60s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.0014, train/loss_step=0.279, global_step=6935.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  97%|█████████▋| 1166/1208 [31:03<01:07,  1.60s/it, loss=0.0856, v_num=0, train/loss_simple_step=0.00508, train/loss_vlb_step=2.71e-5, train/loss_step=0.00508, global_step=6935.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  97%|█████████▋| 1167/1208 [31:04<01:05,  1.60s/it, loss=0.0856, v_num=0, train/loss_simple_step=0.00508, train/loss_vlb_step=2.71e-5, train/loss_step=0.00508, global_step=6935.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  97%|█████████▋| 1167/1208 [31:04<01:05,  1.60s/it, loss=0.0853, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000562, train/loss_step=0.171, global_step=6935.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  97%|█████████▋| 1168/1208 [31:08<01:03,  1.60s/it, loss=0.0853, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000562, train/loss_step=0.171, global_step=6935.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  97%|█████████▋| 1168/1208 [31:08<01:03,  1.60s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=2e-5, train/loss_step=0.00345, global_step=6935.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  97%|█████████▋| 1169/1208 [31:09<01:02,  1.60s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=2e-5, train/loss_step=0.00345, global_step=6935.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  97%|█████████▋| 1169/1208 [31:09<01:02,  1.60s/it, loss=0.083, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.93e-5, train/loss_step=0.0133, global_step=6936.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  97%|█████████▋| 1170/1208 [31:10<01:00,  1.60s/it, loss=0.083, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.93e-5, train/loss_step=0.0133, global_step=6936.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  97%|█████████▋| 1170/1208 [31:10<01:00,  1.60s/it, loss=0.0867, v_num=0, train/loss_simple_step=0.0774, train/loss_vlb_step=0.000257, train/loss_step=0.0774, global_step=6936.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  97%|█████████▋| 1171/1208 [31:11<00:59,  1.60s/it, loss=0.0867, v_num=0, train/loss_simple_step=0.0774, train/loss_vlb_step=0.000257, train/loss_step=0.0774, global_step=6936.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  97%|█████████▋| 1171/1208 [31:11<00:59,  1.60s/it, loss=0.101, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00261, train/loss_step=0.357, global_step=6936.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  97%|█████████▋| 1172/1208 [31:14<00:57,  1.60s/it, loss=0.101, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00261, train/loss_step=0.357, global_step=6936.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  97%|█████████▋| 1172/1208 [31:14<00:57,  1.60s/it, loss=0.116, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00168, train/loss_step=0.326, global_step=6936.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  97%|█████████▋| 1173/1208 [31:15<00:55,  1.60s/it, loss=0.116, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00168, train/loss_step=0.326, global_step=6936.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  97%|█████████▋| 1173/1208 [31:15<00:55,  1.60s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00858, train/loss_vlb_step=3.95e-5, train/loss_step=0.00858, global_step=6937.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  97%|█████████▋| 1174/1208 [31:16<00:54,  1.60s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00858, train/loss_vlb_step=3.95e-5, train/loss_step=0.00858, global_step=6937.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  97%|█████████▋| 1174/1208 [31:16<00:54,  1.60s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0798, train/loss_vlb_step=0.000282, train/loss_step=0.0798, global_step=6937.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  97%|█████████▋| 1175/1208 [31:17<00:52,  1.60s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0798, train/loss_vlb_step=0.000282, train/loss_step=0.0798, global_step=6937.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  97%|█████████▋| 1175/1208 [31:17<00:52,  1.60s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00981, train/loss_vlb_step=4.47e-5, train/loss_step=0.00981, global_step=6937.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  97%|█████████▋| 1176/1208 [31:20<00:51,  1.60s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00981, train/loss_vlb_step=4.47e-5, train/loss_step=0.00981, global_step=6937.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  97%|█████████▋| 1176/1208 [31:20<00:51,  1.60s/it, loss=0.087, v_num=0, train/loss_simple_step=0.0506, train/loss_vlb_step=0.000182, train/loss_step=0.0506, global_step=6937.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  97%|█████████▋| 1177/1208 [31:21<00:49,  1.60s/it, loss=0.087, v_num=0, train/loss_simple_step=0.0506, train/loss_vlb_step=0.000182, train/loss_step=0.0506, global_step=6937.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  97%|█████████▋| 1177/1208 [31:21<00:49,  1.60s/it, loss=0.0874, v_num=0, train/loss_simple_step=0.00995, train/loss_vlb_step=4.53e-5, train/loss_step=0.00995, global_step=6938.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  98%|█████████▊| 1178/1208 [31:22<00:47,  1.60s/it, loss=0.0874, v_num=0, train/loss_simple_step=0.00995, train/loss_vlb_step=4.53e-5, train/loss_step=0.00995, global_step=6938.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  98%|█████████▊| 1178/1208 [31:22<00:47,  1.60s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=9.31e-5, train/loss_step=0.0225, global_step=6938.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  98%|█████████▊| 1179/1208 [31:23<00:46,  1.60s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=9.31e-5, train/loss_step=0.0225, global_step=6938.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  98%|█████████▊| 1179/1208 [31:23<00:46,  1.60s/it, loss=0.093, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00186, train/loss_step=0.295, global_step=6938.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  98%|█████████▊| 1180/1208 [31:27<00:44,  1.60s/it, loss=0.093, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00186, train/loss_step=0.295, global_step=6938.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  98%|█████████▊| 1180/1208 [31:27<00:44,  1.60s/it, loss=0.093, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=8.33e-6, train/loss_step=0.00137, global_step=6938.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  98%|█████████▊| 1181/1208 [31:28<00:43,  1.60s/it, loss=0.093, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=8.33e-6, train/loss_step=0.00137, global_step=6938.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  98%|█████████▊| 1181/1208 [31:28<00:43,  1.60s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000152, train/loss_step=0.0412, global_step=6939.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  98%|█████████▊| 1182/1208 [31:29<00:41,  1.60s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000152, train/loss_step=0.0412, global_step=6939.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  98%|█████████▊| 1182/1208 [31:29<00:41,  1.60s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.0542, train/loss_vlb_step=0.000189, train/loss_step=0.0542, global_step=6939.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  98%|█████████▊| 1183/1208 [31:30<00:39,  1.60s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.0542, train/loss_vlb_step=0.000189, train/loss_step=0.0542, global_step=6939.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  98%|█████████▊| 1183/1208 [31:30<00:39,  1.60s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.0079, train/loss_vlb_step=3.72e-5, train/loss_step=0.0079, global_step=6939.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  98%|█████████▊| 1184/1208 [31:33<00:38,  1.60s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.0079, train/loss_vlb_step=3.72e-5, train/loss_step=0.0079, global_step=6939.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  98%|█████████▊| 1184/1208 [31:33<00:38,  1.60s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.89e-5, train/loss_step=0.0133, global_step=6939.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  98%|█████████▊| 1185/1208 [31:34<00:36,  1.60s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.89e-5, train/loss_step=0.0133, global_step=6939.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  98%|█████████▊| 1185/1208 [31:34<00:36,  1.60s/it, loss=0.0775, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=1.42e-5, train/loss_step=0.00245, global_step=6940.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  98%|█████████▊| 1186/1208 [31:35<00:35,  1.60s/it, loss=0.0775, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=1.42e-5, train/loss_step=0.00245, global_step=6940.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  98%|█████████▊| 1186/1208 [31:35<00:35,  1.60s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.00043, train/loss_step=0.130, global_step=6940.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22:  98%|█████████▊| 1187/1208 [31:36<00:33,  1.60s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.00043, train/loss_step=0.130, global_step=6940.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  98%|█████████▊| 1187/1208 [31:36<00:33,  1.60s/it, loss=0.0765, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000101, train/loss_step=0.0264, global_step=6940.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  98%|█████████▊| 1188/1208 [31:39<00:31,  1.60s/it, loss=0.0765, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000101, train/loss_step=0.0264, global_step=6940.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  98%|█████████▊| 1188/1208 [31:39<00:31,  1.60s/it, loss=0.0764, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=1.39e-5, train/loss_step=0.00238, global_step=6940.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  98%|█████████▊| 1189/1208 [31:40<00:30,  1.60s/it, loss=0.0764, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=1.39e-5, train/loss_step=0.00238, global_step=6940.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  98%|█████████▊| 1189/1208 [31:40<00:30,  1.60s/it, loss=0.076, v_num=0, train/loss_simple_step=0.00383, train/loss_vlb_step=2.08e-5, train/loss_step=0.00383, global_step=6941.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  99%|█████████▊| 1190/1208 [31:41<00:28,  1.60s/it, loss=0.076, v_num=0, train/loss_simple_step=0.00383, train/loss_vlb_step=2.08e-5, train/loss_step=0.00383, global_step=6941.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  99%|█████████▊| 1190/1208 [31:41<00:28,  1.60s/it, loss=0.108, v_num=0, train/loss_simple_step=0.714, train/loss_vlb_step=0.0523, train/loss_step=0.714, global_step=6941.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]     Epoch 22:  99%|█████████▊| 1191/1208 [31:42<00:27,  1.60s/it, loss=0.108, v_num=0, train/loss_simple_step=0.714, train/loss_vlb_step=0.0523, train/loss_step=0.714, global_step=6941.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  99%|█████████▊| 1191/1208 [31:42<00:27,  1.60s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.18e-5, train/loss_step=0.0112, global_step=6941.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  99%|█████████▊| 1192/1208 [31:46<00:25,  1.60s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.18e-5, train/loss_step=0.0112, global_step=6941.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  99%|█████████▊| 1192/1208 [31:46<00:25,  1.60s/it, loss=0.08, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=6941.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]   Epoch 22:  99%|█████████▉| 1193/1208 [31:47<00:23,  1.60s/it, loss=0.08, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=6941.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  99%|█████████▉| 1193/1208 [31:47<00:23,  1.60s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000344, train/loss_step=0.104, global_step=6942.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  99%|█████████▉| 1194/1208 [31:48<00:22,  1.60s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000344, train/loss_step=0.104, global_step=6942.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  99%|█████████▉| 1194/1208 [31:48<00:22,  1.60s/it, loss=0.085, v_num=0, train/loss_simple_step=0.0847, train/loss_vlb_step=0.000281, train/loss_step=0.0847, global_step=6942.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  99%|█████████▉| 1195/1208 [31:49<00:20,  1.60s/it, loss=0.085, v_num=0, train/loss_simple_step=0.0847, train/loss_vlb_step=0.000281, train/loss_step=0.0847, global_step=6942.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  99%|█████████▉| 1195/1208 [31:49<00:20,  1.60s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.00058, train/loss_step=0.166, global_step=6942.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22:  99%|█████████▉| 1196/1208 [31:52<00:19,  1.60s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.00058, train/loss_step=0.166, global_step=6942.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  99%|█████████▉| 1196/1208 [31:52<00:19,  1.60s/it, loss=0.113, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00398, train/loss_step=0.454, global_step=6942.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  99%|█████████▉| 1197/1208 [31:53<00:17,  1.60s/it, loss=0.113, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00398, train/loss_step=0.454, global_step=6942.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  99%|█████████▉| 1197/1208 [31:53<00:17,  1.60s/it, loss=0.134, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00333, train/loss_step=0.435, global_step=6943.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  99%|█████████▉| 1198/1208 [31:54<00:15,  1.60s/it, loss=0.134, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00333, train/loss_step=0.435, global_step=6943.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  99%|█████████▉| 1198/1208 [31:54<00:15,  1.60s/it, loss=0.153, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00401, train/loss_step=0.397, global_step=6943.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  99%|█████████▉| 1199/1208 [31:55<00:14,  1.60s/it, loss=0.153, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00401, train/loss_step=0.397, global_step=6943.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  99%|█████████▉| 1199/1208 [31:55<00:14,  1.60s/it, loss=0.171, v_num=0, train/loss_simple_step=0.664, train/loss_vlb_step=0.0344, train/loss_step=0.664, global_step=6943.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22:  99%|█████████▉| 1200/1208 [31:58<00:12,  1.60s/it, loss=0.171, v_num=0, train/loss_simple_step=0.664, train/loss_vlb_step=0.0344, train/loss_step=0.664, global_step=6943.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  99%|█████████▉| 1200/1208 [31:58<00:12,  1.60s/it, loss=0.178, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000424, train/loss_step=0.129, global_step=6943.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.77it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.83it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.83it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.78it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.79it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.78it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.75it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.75it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.75it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.82it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 22:  99%|█████████▉| 1201/1208 [32:29<00:11,  1.62s/it, loss=0.178, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000424, train/loss_step=0.129, global_step=6943.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22:  99%|█████████▉| 1201/1208 [32:29<00:11,  1.62s/it, loss=0.195, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00308, train/loss_step=0.383, global_step=6944.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143] Epoch 22: 100%|█████████▉| 1202/1208 [32:30<00:09,  1.62s/it, loss=0.195, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00308, train/loss_step=0.383, global_step=6944.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22: 100%|█████████▉| 1202/1208 [32:30<00:09,  1.62s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00502, train/loss_vlb_step=2.56e-5, train/loss_step=0.00502, global_step=6944.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22: 100%|█████████▉| 1203/1208 [32:31<00:08,  1.62s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00502, train/loss_vlb_step=2.56e-5, train/loss_step=0.00502, global_step=6944.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22: 100%|█████████▉| 1203/1208 [32:31<00:08,  1.62s/it, loss=0.208, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00162, train/loss_step=0.328, global_step=6944.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]    Epoch 22: 100%|█████████▉| 1204/1208 [32:34<00:06,  1.62s/it, loss=0.208, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00162, train/loss_step=0.328, global_step=6944.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22: 100%|█████████▉| 1204/1208 [32:34<00:06,  1.62s/it, loss=0.213, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=6944.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22: 100%|█████████▉| 1205/1208 [32:35<00:04,  1.62s/it, loss=0.213, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=6944.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22: 100%|█████████▉| 1205/1208 [32:35<00:04,  1.62s/it, loss=0.218, v_num=0, train/loss_simple_step=0.0925, train/loss_vlb_step=0.000308, train/loss_step=0.0925, global_step=6945.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22: 100%|█████████▉| 1206/1208 [32:36<00:03,  1.62s/it, loss=0.218, v_num=0, train/loss_simple_step=0.0925, train/loss_vlb_step=0.000308, train/loss_step=0.0925, global_step=6945.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22: 100%|█████████▉| 1206/1208 [32:36<00:03,  1.62s/it, loss=0.212, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=8.5e-5, train/loss_step=0.0204, global_step=6945.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]  Epoch 22: 100%|█████████▉| 1207/1208 [32:37<00:01,  1.62s/it, loss=0.212, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=8.5e-5, train/loss_step=0.0204, global_step=6945.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22: 100%|█████████▉| 1207/1208 [32:37<00:01,  1.62s/it, loss=0.211, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.24e-5, train/loss_step=0.00216, global_step=6945.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22: 100%|██████████| 1208/1208 [32:43<00:00,  1.63s/it, loss=0.211, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.24e-5, train/loss_step=0.00216, global_step=6945.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 22: 100%|██████████| 1208/1208 [32:43<00:00,  1.63s/it, loss=0.23, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00172, train/loss_step=0.390, global_step=6945.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]     
+
+
+Epoch 22:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.23, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00172, train/loss_step=0.390, global_step=6945.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]           Epoch 23:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.23, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00172, train/loss_step=0.390, global_step=6945.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][AData shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.84it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.81it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.84it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.84it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.83it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.84it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.83it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.84it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.84it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.84it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.84it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.83it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.75it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.76it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.83it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.84it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.83it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.83it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.78it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.83it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.82it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.80it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.78it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.81it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.82it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.75it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.80it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.80it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 23:   0%|          | 1/1208 [00:32<10:59:16, 32.77s/it, loss=0.23, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00172, train/loss_step=0.390, global_step=6945.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00254, train/loss_epoch=0.143]Epoch 23:   0%|          | 1/1208 [00:32<10:59:18, 32.77s/it, loss=0.241, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000882, train/loss_step=0.218, global_step=6946.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   0%|          | 2/1208 [00:33<5:39:47, 16.91s/it, loss=0.241, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000882, train/loss_step=0.218, global_step=6946.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:   0%|          | 2/1208 [00:33<5:39:49, 16.91s/it, loss=0.208, v_num=0, train/loss_simple_step=0.046, train/loss_vlb_step=0.000164, train/loss_step=0.046, global_step=6946.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   0%|          | 3/1208 [00:34<3:53:14, 11.61s/it, loss=0.208, v_num=0, train/loss_simple_step=0.046, train/loss_vlb_step=0.000164, train/loss_step=0.046, global_step=6946.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   0%|          | 3/1208 [00:34<3:53:14, 11.61s/it, loss=0.236, v_num=0, train/loss_simple_step=0.588, train/loss_vlb_step=0.00672, train/loss_step=0.588, global_step=6946.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:   0%|          | 4/1208 [00:37<3:10:12,  9.48s/it, loss=0.236, v_num=0, train/loss_simple_step=0.588, train/loss_vlb_step=0.00672, train/loss_step=0.588, global_step=6946.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   0%|          | 4/1208 [00:37<3:10:12,  9.48s/it, loss=0.247, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00174, train/loss_step=0.323, global_step=6946.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   0%|          | 5/1208 [00:38<2:36:12,  7.79s/it, loss=0.247, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00174, train/loss_step=0.323, global_step=6946.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   0%|          | 5/1208 [00:38<2:36:12,  7.79s/it, loss=0.249, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000496, train/loss_step=0.149, global_step=6947.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   0%|          | 6/1208 [00:39<2:13:29,  6.66s/it, loss=0.249, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000496, train/loss_step=0.149, global_step=6947.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   0%|          | 6/1208 [00:39<2:13:30,  6.66s/it, loss=0.245, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=1.98e-5, train/loss_step=0.00373, global_step=6947.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   1%|          | 7/1208 [00:41<1:57:16,  5.86s/it, loss=0.245, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=1.98e-5, train/loss_step=0.00373, global_step=6947.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   1%|          | 7/1208 [00:41<1:57:16,  5.86s/it, loss=0.237, v_num=0, train/loss_simple_step=0.0053, train/loss_vlb_step=2.71e-5, train/loss_step=0.0053, global_step=6947.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:   1%|          | 8/1208 [00:44<1:50:42,  5.54s/it, loss=0.237, v_num=0, train/loss_simple_step=0.0053, train/loss_vlb_step=2.71e-5, train/loss_step=0.0053, global_step=6947.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   1%|          | 8/1208 [00:44<1:50:42,  5.54s/it, loss=0.232, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.00149, train/loss_step=0.360, global_step=6947.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:   1%|          | 9/1208 [00:45<1:40:37,  5.04s/it, loss=0.232, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.00149, train/loss_step=0.360, global_step=6947.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   1%|          | 9/1208 [00:45<1:40:37,  5.04s/it, loss=0.213, v_num=0, train/loss_simple_step=0.0518, train/loss_vlb_step=0.00018, train/loss_step=0.0518, global_step=6948.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   1%|          | 10/1208 [00:46<1:32:32,  4.63s/it, loss=0.213, v_num=0, train/loss_simple_step=0.0518, train/loss_vlb_step=0.00018, train/loss_step=0.0518, global_step=6948.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   1%|          | 10/1208 [00:46<1:32:32,  4.63s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.000194, train/loss_step=0.0543, global_step=6948.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   1%|          | 11/1208 [00:47<1:25:54,  4.31s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.000194, train/loss_step=0.0543, global_step=6948.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   1%|          | 11/1208 [00:47<1:25:55,  4.31s/it, loss=0.175, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.000935, train/loss_step=0.251, global_step=6948.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:   1%|          | 12/1208 [00:50<1:24:06,  4.22s/it, loss=0.175, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.000935, train/loss_step=0.251, global_step=6948.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   1%|          | 12/1208 [00:50<1:24:06,  4.22s/it, loss=0.177, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.00053, train/loss_step=0.154, global_step=6948.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:   1%|          | 13/1208 [00:51<1:19:10,  3.98s/it, loss=0.177, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.00053, train/loss_step=0.154, global_step=6948.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   1%|          | 13/1208 [00:51<1:19:10,  3.98s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00663, train/loss_vlb_step=3.18e-5, train/loss_step=0.00663, global_step=6949.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   1%|          | 14/1208 [00:52<1:14:54,  3.76s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00663, train/loss_vlb_step=3.18e-5, train/loss_step=0.00663, global_step=6949.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   1%|          | 14/1208 [00:52<1:14:54,  3.76s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000101, train/loss_step=0.0264, global_step=6949.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:   1%|          | 15/1208 [00:53<1:11:12,  3.58s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000101, train/loss_step=0.0264, global_step=6949.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   1%|          | 15/1208 [00:53<1:11:12,  3.58s/it, loss=0.161, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.0028, train/loss_step=0.366, global_step=6949.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:   1%|▏         | 16/1208 [00:56<1:10:44,  3.56s/it, loss=0.161, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.0028, train/loss_step=0.366, global_step=6949.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   1%|▏         | 16/1208 [00:56<1:10:44,  3.56s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0593, train/loss_vlb_step=0.000204, train/loss_step=0.0593, global_step=6949.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   1%|▏         | 17/1208 [00:58<1:07:44,  3.41s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0593, train/loss_vlb_step=0.000204, train/loss_step=0.0593, global_step=6949.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   1%|▏         | 17/1208 [00:58<1:07:45,  3.41s/it, loss=0.174, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00259, train/loss_step=0.397, global_step=6950.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:   1%|▏         | 18/1208 [00:59<1:05:04,  3.28s/it, loss=0.174, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00259, train/loss_step=0.397, global_step=6950.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   1%|▏         | 18/1208 [00:59<1:05:04,  3.28s/it, loss=0.179, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000406, train/loss_step=0.122, global_step=6950.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   2%|▏         | 19/1208 [01:00<1:02:39,  3.16s/it, loss=0.179, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000406, train/loss_step=0.122, global_step=6950.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   2%|▏         | 19/1208 [01:00<1:02:39,  3.16s/it, loss=0.194, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00146, train/loss_step=0.306, global_step=6950.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:   2%|▏         | 20/1208 [01:03<1:02:40,  3.17s/it, loss=0.194, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00146, train/loss_step=0.306, global_step=6950.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   2%|▏         | 20/1208 [01:03<1:02:40,  3.17s/it, loss=0.188, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00124, train/loss_step=0.271, global_step=6950.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   2%|▏         | 21/1208 [01:04<1:00:38,  3.07s/it, loss=0.188, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00124, train/loss_step=0.271, global_step=6950.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   2%|▏         | 21/1208 [01:04<1:00:38,  3.07s/it, loss=0.182, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000349, train/loss_step=0.105, global_step=6951.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   2%|▏         | 22/1208 [01:05<58:45,  2.97s/it, loss=0.182, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000349, train/loss_step=0.105, global_step=6951.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:   2%|▏         | 22/1208 [01:05<58:45,  2.97s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0641, train/loss_vlb_step=0.000217, train/loss_step=0.0641, global_step=6951.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   2%|▏         | 23/1208 [01:06<57:02,  2.89s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0641, train/loss_vlb_step=0.000217, train/loss_step=0.0641, global_step=6951.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   2%|▏         | 23/1208 [01:06<57:02,  2.89s/it, loss=0.158, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000288, train/loss_step=0.086, global_step=6951.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:   2%|▏         | 24/1208 [01:09<57:15,  2.90s/it, loss=0.158, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000288, train/loss_step=0.086, global_step=6951.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   2%|▏         | 24/1208 [01:09<57:15,  2.90s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000126, train/loss_step=0.0334, global_step=6951.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   2%|▏         | 25/1208 [01:10<55:44,  2.83s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000126, train/loss_step=0.0334, global_step=6951.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   2%|▏         | 25/1208 [01:10<55:44,  2.83s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.39e-5, train/loss_step=0.0146, global_step=6952.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:   2%|▏         | 26/1208 [01:11<54:20,  2.76s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.39e-5, train/loss_step=0.0146, global_step=6952.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   2%|▏         | 26/1208 [01:11<54:20,  2.76s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000101, train/loss_step=0.0268, global_step=6952.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   2%|▏         | 27/1208 [01:12<53:02,  2.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000101, train/loss_step=0.0268, global_step=6952.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   2%|▏         | 27/1208 [01:12<53:02,  2.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00106, train/loss_step=0.257, global_step=6952.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:   2%|▏         | 28/1208 [01:15<53:21,  2.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00106, train/loss_step=0.257, global_step=6952.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   2%|▏         | 28/1208 [01:15<53:21,  2.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00144, train/loss_step=0.299, global_step=6952.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   2%|▏         | 29/1208 [01:17<52:11,  2.66s/it, loss=0.147, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00144, train/loss_step=0.299, global_step=6952.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   2%|▏         | 29/1208 [01:17<52:11,  2.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00371, train/loss_vlb_step=2.06e-5, train/loss_step=0.00371, global_step=6953.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   2%|▏         | 30/1208 [01:18<51:05,  2.60s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00371, train/loss_vlb_step=2.06e-5, train/loss_step=0.00371, global_step=6953.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   2%|▏         | 30/1208 [01:18<51:05,  2.60s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0655, train/loss_vlb_step=0.000219, train/loss_step=0.0655, global_step=6953.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:   3%|▎         | 31/1208 [01:19<50:02,  2.55s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0655, train/loss_vlb_step=0.000219, train/loss_step=0.0655, global_step=6953.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   3%|▎         | 31/1208 [01:19<50:03,  2.55s/it, loss=0.143, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000796, train/loss_step=0.202, global_step=6953.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:   3%|▎         | 32/1208 [01:22<50:24,  2.57s/it, loss=0.143, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000796, train/loss_step=0.202, global_step=6953.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   3%|▎         | 32/1208 [01:22<50:24,  2.57s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=1.12e-5, train/loss_step=0.00184, global_step=6953.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   3%|▎         | 33/1208 [01:23<49:27,  2.53s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=1.12e-5, train/loss_step=0.00184, global_step=6953.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   3%|▎         | 33/1208 [01:23<49:27,  2.53s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.72e-5, train/loss_step=0.0134, global_step=6954.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:   3%|▎         | 34/1208 [01:24<48:33,  2.48s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.72e-5, train/loss_step=0.0134, global_step=6954.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   3%|▎         | 34/1208 [01:24<48:33,  2.48s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0841, train/loss_vlb_step=0.000277, train/loss_step=0.0841, global_step=6954.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   3%|▎         | 35/1208 [01:25<47:42,  2.44s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0841, train/loss_vlb_step=0.000277, train/loss_step=0.0841, global_step=6954.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   3%|▎         | 35/1208 [01:25<47:42,  2.44s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00353, train/loss_vlb_step=1.84e-5, train/loss_step=0.00353, global_step=6954.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   3%|▎         | 36/1208 [01:28<48:05,  2.46s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00353, train/loss_vlb_step=1.84e-5, train/loss_step=0.00353, global_step=6954.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   3%|▎         | 36/1208 [01:28<48:05,  2.46s/it, loss=0.154, v_num=0, train/loss_simple_step=0.718, train/loss_vlb_step=0.0312, train/loss_step=0.718, global_step=6954.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]     Epoch 23:   3%|▎         | 37/1208 [01:29<47:18,  2.42s/it, loss=0.154, v_num=0, train/loss_simple_step=0.718, train/loss_vlb_step=0.0312, train/loss_step=0.718, global_step=6954.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   3%|▎         | 37/1208 [01:29<47:18,  2.42s/it, loss=0.156, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00387, train/loss_step=0.436, global_step=6955.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   3%|▎         | 38/1208 [01:30<46:33,  2.39s/it, loss=0.156, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00387, train/loss_step=0.436, global_step=6955.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   3%|▎         | 38/1208 [01:30<46:33,  2.39s/it, loss=0.167, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00252, train/loss_step=0.354, global_step=6955.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   3%|▎         | 39/1208 [01:31<45:50,  2.35s/it, loss=0.167, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00252, train/loss_step=0.354, global_step=6955.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   3%|▎         | 39/1208 [01:31<45:51,  2.35s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0765, train/loss_vlb_step=0.000257, train/loss_step=0.0765, global_step=6955.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   3%|▎         | 40/1208 [01:34<46:13,  2.37s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0765, train/loss_vlb_step=0.000257, train/loss_step=0.0765, global_step=6955.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   3%|▎         | 40/1208 [01:34<46:13,  2.37s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000104, train/loss_step=0.0258, global_step=6955.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   3%|▎         | 41/1208 [01:36<45:33,  2.34s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000104, train/loss_step=0.0258, global_step=6955.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   3%|▎         | 41/1208 [01:36<45:33,  2.34s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0725, train/loss_vlb_step=0.000245, train/loss_step=0.0725, global_step=6956.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   3%|▎         | 42/1208 [01:37<44:54,  2.31s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0725, train/loss_vlb_step=0.000245, train/loss_step=0.0725, global_step=6956.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   3%|▎         | 42/1208 [01:37<44:54,  2.31s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000101, train/loss_step=0.0269, global_step=6956.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:   4%|▎         | 43/1208 [01:38<44:17,  2.28s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000101, train/loss_step=0.0269, global_step=6956.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   4%|▎         | 43/1208 [01:38<44:17,  2.28s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.43e-5, train/loss_step=0.0175, global_step=6956.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   4%|▎         | 44/1208 [01:41<44:38,  2.30s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.43e-5, train/loss_step=0.0175, global_step=6956.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   4%|▎         | 44/1208 [01:41<44:38,  2.30s/it, loss=0.14, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=6956.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:   4%|▎         | 45/1208 [01:42<44:04,  2.27s/it, loss=0.14, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=6956.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   4%|▎         | 45/1208 [01:42<44:04,  2.27s/it, loss=0.15, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000796, train/loss_step=0.209, global_step=6957.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   4%|▍         | 46/1208 [01:43<43:30,  2.25s/it, loss=0.15, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000796, train/loss_step=0.209, global_step=6957.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   4%|▍         | 46/1208 [01:43<43:30,  2.25s/it, loss=0.152, v_num=0, train/loss_simple_step=0.071, train/loss_vlb_step=0.000237, train/loss_step=0.071, global_step=6957.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   4%|▍         | 47/1208 [01:44<42:58,  2.22s/it, loss=0.152, v_num=0, train/loss_simple_step=0.071, train/loss_vlb_step=0.000237, train/loss_step=0.071, global_step=6957.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   4%|▍         | 47/1208 [01:44<42:58,  2.22s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.64e-5, train/loss_step=0.0209, global_step=6957.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   4%|▍         | 48/1208 [01:47<43:19,  2.24s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.64e-5, train/loss_step=0.0209, global_step=6957.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   4%|▍         | 48/1208 [01:47<43:19,  2.24s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00454, train/loss_vlb_step=2.4e-5, train/loss_step=0.00454, global_step=6957.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   4%|▍         | 49/1208 [01:48<42:49,  2.22s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00454, train/loss_vlb_step=2.4e-5, train/loss_step=0.00454, global_step=6957.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   4%|▍         | 49/1208 [01:48<42:49,  2.22s/it, loss=0.131, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000394, train/loss_step=0.119, global_step=6958.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:   4%|▍         | 50/1208 [01:49<42:19,  2.19s/it, loss=0.131, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000394, train/loss_step=0.119, global_step=6958.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   4%|▍         | 50/1208 [01:49<42:19,  2.19s/it, loss=0.14, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00103, train/loss_step=0.245, global_step=6958.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:   4%|▍         | 51/1208 [01:50<41:51,  2.17s/it, loss=0.14, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00103, train/loss_step=0.245, global_step=6958.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   4%|▍         | 51/1208 [01:50<41:51,  2.17s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00684, train/loss_vlb_step=3.38e-5, train/loss_step=0.00684, global_step=6958.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   4%|▍         | 52/1208 [01:53<42:12,  2.19s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00684, train/loss_vlb_step=3.38e-5, train/loss_step=0.00684, global_step=6958.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   4%|▍         | 52/1208 [01:53<42:12,  2.19s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0845, train/loss_vlb_step=0.000278, train/loss_step=0.0845, global_step=6958.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   4%|▍         | 53/1208 [01:54<41:45,  2.17s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0845, train/loss_vlb_step=0.000278, train/loss_step=0.0845, global_step=6958.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   4%|▍         | 53/1208 [01:54<41:45,  2.17s/it, loss=0.158, v_num=0, train/loss_simple_step=0.491, train/loss_vlb_step=0.00781, train/loss_step=0.491, global_step=6959.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:   4%|▍         | 54/1208 [01:55<41:18,  2.15s/it, loss=0.158, v_num=0, train/loss_simple_step=0.491, train/loss_vlb_step=0.00781, train/loss_step=0.491, global_step=6959.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   4%|▍         | 54/1208 [01:55<41:18,  2.15s/it, loss=0.161, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000433, train/loss_step=0.132, global_step=6959.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   5%|▍         | 55/1208 [01:57<40:53,  2.13s/it, loss=0.161, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000433, train/loss_step=0.132, global_step=6959.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   5%|▍         | 55/1208 [01:57<40:53,  2.13s/it, loss=0.183, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00315, train/loss_step=0.454, global_step=6959.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:   5%|▍         | 56/1208 [02:00<41:13,  2.15s/it, loss=0.183, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00315, train/loss_step=0.454, global_step=6959.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   5%|▍         | 56/1208 [02:00<41:13,  2.15s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=1.77e-5, train/loss_step=0.00326, global_step=6959.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   5%|▍         | 57/1208 [02:01<40:49,  2.13s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=1.77e-5, train/loss_step=0.00326, global_step=6959.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   5%|▍         | 57/1208 [02:01<40:49,  2.13s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00816, train/loss_vlb_step=3.87e-5, train/loss_step=0.00816, global_step=6960.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   5%|▍         | 58/1208 [02:02<40:24,  2.11s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00816, train/loss_vlb_step=3.87e-5, train/loss_step=0.00816, global_step=6960.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   5%|▍         | 58/1208 [02:02<40:25,  2.11s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.8e-5, train/loss_step=0.0186, global_step=6960.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:   5%|▍         | 59/1208 [02:03<40:01,  2.09s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.8e-5, train/loss_step=0.0186, global_step=6960.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   5%|▍         | 59/1208 [02:03<40:01,  2.09s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=9.97e-6, train/loss_step=0.00167, global_step=6960.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   5%|▍         | 60/1208 [02:06<40:20,  2.11s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=9.97e-6, train/loss_step=0.00167, global_step=6960.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   5%|▍         | 60/1208 [02:06<40:20,  2.11s/it, loss=0.111, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000418, train/loss_step=0.126, global_step=6960.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:   5%|▌         | 61/1208 [02:07<39:59,  2.09s/it, loss=0.111, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000418, train/loss_step=0.126, global_step=6960.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   5%|▌         | 61/1208 [02:07<39:59,  2.09s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000121, train/loss_step=0.0307, global_step=6961.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   5%|▌         | 62/1208 [02:08<39:37,  2.07s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000121, train/loss_step=0.0307, global_step=6961.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   5%|▌         | 62/1208 [02:08<39:37,  2.07s/it, loss=0.122, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00194, train/loss_step=0.286, global_step=6961.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:   5%|▌         | 63/1208 [02:09<39:16,  2.06s/it, loss=0.122, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00194, train/loss_step=0.286, global_step=6961.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   5%|▌         | 63/1208 [02:09<39:16,  2.06s/it, loss=0.128, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000476, train/loss_step=0.141, global_step=6961.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   5%|▌         | 64/1208 [02:12<39:33,  2.08s/it, loss=0.128, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000476, train/loss_step=0.141, global_step=6961.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   5%|▌         | 64/1208 [02:12<39:33,  2.08s/it, loss=0.128, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.00034, train/loss_step=0.103, global_step=6961.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:   5%|▌         | 65/1208 [02:13<39:13,  2.06s/it, loss=0.128, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.00034, train/loss_step=0.103, global_step=6961.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   5%|▌         | 65/1208 [02:13<39:13,  2.06s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.74e-5, train/loss_step=0.0105, global_step=6962.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   5%|▌         | 66/1208 [02:14<38:54,  2.04s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.74e-5, train/loss_step=0.0105, global_step=6962.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   5%|▌         | 66/1208 [02:14<38:54,  2.04s/it, loss=0.131, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00162, train/loss_step=0.341, global_step=6962.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:   6%|▌         | 67/1208 [02:15<38:34,  2.03s/it, loss=0.131, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00162, train/loss_step=0.341, global_step=6962.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   6%|▌         | 67/1208 [02:15<38:35,  2.03s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00852, train/loss_vlb_step=3.72e-5, train/loss_step=0.00852, global_step=6962.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   6%|▌         | 68/1208 [02:19<38:52,  2.05s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00852, train/loss_vlb_step=3.72e-5, train/loss_step=0.00852, global_step=6962.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   6%|▌         | 68/1208 [02:19<38:52,  2.05s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000162, train/loss_step=0.0457, global_step=6962.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:   6%|▌         | 69/1208 [02:20<38:34,  2.03s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000162, train/loss_step=0.0457, global_step=6962.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   6%|▌         | 69/1208 [02:20<38:34,  2.03s/it, loss=0.145, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00296, train/loss_step=0.357, global_step=6963.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:   6%|▌         | 70/1208 [02:21<38:15,  2.02s/it, loss=0.145, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00296, train/loss_step=0.357, global_step=6963.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   6%|▌         | 70/1208 [02:21<38:15,  2.02s/it, loss=0.143, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000706, train/loss_step=0.201, global_step=6963.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   6%|▌         | 71/1208 [02:22<37:58,  2.00s/it, loss=0.143, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000706, train/loss_step=0.201, global_step=6963.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   6%|▌         | 71/1208 [02:22<37:58,  2.00s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00812, train/loss_vlb_step=4.03e-5, train/loss_step=0.00812, global_step=6963.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   6%|▌         | 72/1208 [02:25<38:15,  2.02s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00812, train/loss_vlb_step=4.03e-5, train/loss_step=0.00812, global_step=6963.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   6%|▌         | 72/1208 [02:25<38:15,  2.02s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00264, train/loss_vlb_step=1.52e-5, train/loss_step=0.00264, global_step=6963.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   6%|▌         | 73/1208 [02:26<37:57,  2.01s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00264, train/loss_vlb_step=1.52e-5, train/loss_step=0.00264, global_step=6963.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   6%|▌         | 73/1208 [02:26<37:58,  2.01s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000139, train/loss_step=0.0373, global_step=6964.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:   6%|▌         | 74/1208 [02:27<37:40,  1.99s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000139, train/loss_step=0.0373, global_step=6964.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   6%|▌         | 74/1208 [02:27<37:40,  1.99s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0529, train/loss_vlb_step=0.000186, train/loss_step=0.0529, global_step=6964.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   6%|▌         | 75/1208 [02:28<37:24,  1.98s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0529, train/loss_vlb_step=0.000186, train/loss_step=0.0529, global_step=6964.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   6%|▌         | 75/1208 [02:28<37:24,  1.98s/it, loss=0.106, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00192, train/loss_step=0.333, global_step=6964.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:   6%|▋         | 76/1208 [02:31<37:41,  2.00s/it, loss=0.106, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00192, train/loss_step=0.333, global_step=6964.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   6%|▋         | 76/1208 [02:31<37:41,  2.00s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.000138, train/loss_step=0.0395, global_step=6964.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   6%|▋         | 77/1208 [02:32<37:25,  1.99s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.000138, train/loss_step=0.0395, global_step=6964.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   6%|▋         | 77/1208 [02:32<37:25,  1.99s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000131, train/loss_step=0.0353, global_step=6965.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   6%|▋         | 78/1208 [02:33<37:09,  1.97s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000131, train/loss_step=0.0353, global_step=6965.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   6%|▋         | 78/1208 [02:33<37:09,  1.97s/it, loss=0.114, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=6965.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:   7%|▋         | 79/1208 [02:34<36:54,  1.96s/it, loss=0.114, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=6965.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   7%|▋         | 79/1208 [02:34<36:54,  1.96s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0447, train/loss_vlb_step=0.000159, train/loss_step=0.0447, global_step=6965.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   7%|▋         | 80/1208 [02:38<37:09,  1.98s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0447, train/loss_vlb_step=0.000159, train/loss_step=0.0447, global_step=6965.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   7%|▋         | 80/1208 [02:38<37:09,  1.98s/it, loss=0.116, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000449, train/loss_step=0.136, global_step=6965.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:   7%|▋         | 81/1208 [02:39<36:54,  1.97s/it, loss=0.116, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000449, train/loss_step=0.136, global_step=6965.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   7%|▋         | 81/1208 [02:39<36:54,  1.97s/it, loss=0.123, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000541, train/loss_step=0.160, global_step=6966.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   7%|▋         | 82/1208 [02:40<36:39,  1.95s/it, loss=0.123, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000541, train/loss_step=0.160, global_step=6966.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   7%|▋         | 82/1208 [02:40<36:39,  1.95s/it, loss=0.129, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00347, train/loss_step=0.415, global_step=6966.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:   7%|▋         | 83/1208 [02:41<36:25,  1.94s/it, loss=0.129, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00347, train/loss_step=0.415, global_step=6966.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   7%|▋         | 83/1208 [02:41<36:25,  1.94s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=2.11e-5, train/loss_step=0.00378, global_step=6966.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   7%|▋         | 84/1208 [02:44<36:40,  1.96s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=2.11e-5, train/loss_step=0.00378, global_step=6966.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   7%|▋         | 84/1208 [02:44<36:40,  1.96s/it, loss=0.123, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000384, train/loss_step=0.117, global_step=6966.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:   7%|▋         | 85/1208 [02:45<36:26,  1.95s/it, loss=0.123, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000384, train/loss_step=0.117, global_step=6966.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   7%|▋         | 85/1208 [02:45<36:26,  1.95s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0809, train/loss_vlb_step=0.000269, train/loss_step=0.0809, global_step=6967.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   7%|▋         | 86/1208 [02:46<36:12,  1.94s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0809, train/loss_vlb_step=0.000269, train/loss_step=0.0809, global_step=6967.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   7%|▋         | 86/1208 [02:46<36:12,  1.94s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.000295, train/loss_step=0.0894, global_step=6967.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   7%|▋         | 87/1208 [02:47<35:59,  1.93s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.000295, train/loss_step=0.0894, global_step=6967.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   7%|▋         | 87/1208 [02:47<35:59,  1.93s/it, loss=0.128, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00163, train/loss_step=0.300, global_step=6967.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:   7%|▋         | 88/1208 [02:50<36:13,  1.94s/it, loss=0.128, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00163, train/loss_step=0.300, global_step=6967.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   7%|▋         | 88/1208 [02:50<36:13,  1.94s/it, loss=0.133, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.00045, train/loss_step=0.134, global_step=6967.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   7%|▋         | 89/1208 [02:51<36:00,  1.93s/it, loss=0.133, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.00045, train/loss_step=0.134, global_step=6967.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   7%|▋         | 89/1208 [02:51<36:00,  1.93s/it, loss=0.138, v_num=0, train/loss_simple_step=0.461, train/loss_vlb_step=0.0031, train/loss_step=0.461, global_step=6968.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:   7%|▋         | 90/1208 [02:52<35:47,  1.92s/it, loss=0.138, v_num=0, train/loss_simple_step=0.461, train/loss_vlb_step=0.0031, train/loss_step=0.461, global_step=6968.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   7%|▋         | 90/1208 [02:52<35:47,  1.92s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00279, train/loss_vlb_step=1.59e-5, train/loss_step=0.00279, global_step=6968.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   8%|▊         | 91/1208 [02:53<35:35,  1.91s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00279, train/loss_vlb_step=1.59e-5, train/loss_step=0.00279, global_step=6968.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   8%|▊         | 91/1208 [02:53<35:35,  1.91s/it, loss=0.143, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00189, train/loss_step=0.314, global_step=6968.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:   8%|▊         | 92/1208 [02:57<35:48,  1.93s/it, loss=0.143, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00189, train/loss_step=0.314, global_step=6968.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   8%|▊         | 92/1208 [02:57<35:48,  1.93s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000171, train/loss_step=0.0463, global_step=6968.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   8%|▊         | 93/1208 [02:58<35:36,  1.92s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000171, train/loss_step=0.0463, global_step=6968.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   8%|▊         | 93/1208 [02:58<35:36,  1.92s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0811, train/loss_vlb_step=0.000278, train/loss_step=0.0811, global_step=6969.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   8%|▊         | 94/1208 [02:59<35:23,  1.91s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0811, train/loss_vlb_step=0.000278, train/loss_step=0.0811, global_step=6969.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   8%|▊         | 94/1208 [02:59<35:23,  1.91s/it, loss=0.164, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00252, train/loss_step=0.378, global_step=6969.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:   8%|▊         | 95/1208 [03:00<35:11,  1.90s/it, loss=0.164, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00252, train/loss_step=0.378, global_step=6969.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   8%|▊         | 95/1208 [03:00<35:11,  1.90s/it, loss=0.149, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.27e-5, train/loss_step=0.023, global_step=6969.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   8%|▊         | 96/1208 [03:03<35:25,  1.91s/it, loss=0.149, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.27e-5, train/loss_step=0.023, global_step=6969.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   8%|▊         | 96/1208 [03:03<35:25,  1.91s/it, loss=0.156, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000647, train/loss_step=0.188, global_step=6969.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   8%|▊         | 97/1208 [03:04<35:13,  1.90s/it, loss=0.156, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000647, train/loss_step=0.188, global_step=6969.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   8%|▊         | 97/1208 [03:04<35:13,  1.90s/it, loss=0.16, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.00039, train/loss_step=0.117, global_step=6970.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:   8%|▊         | 98/1208 [03:05<35:01,  1.89s/it, loss=0.16, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.00039, train/loss_step=0.117, global_step=6970.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   8%|▊         | 98/1208 [03:05<35:02,  1.89s/it, loss=0.168, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00118, train/loss_step=0.264, global_step=6970.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   8%|▊         | 99/1208 [03:06<34:50,  1.88s/it, loss=0.168, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00118, train/loss_step=0.264, global_step=6970.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   8%|▊         | 99/1208 [03:06<34:50,  1.88s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000107, train/loss_step=0.0268, global_step=6970.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   8%|▊         | 100/1208 [03:09<35:03,  1.90s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000107, train/loss_step=0.0268, global_step=6970.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   8%|▊         | 100/1208 [03:09<35:03,  1.90s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00596, train/loss_vlb_step=2.93e-5, train/loss_step=0.00596, global_step=6970.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   8%|▊         | 101/1208 [03:10<34:52,  1.89s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00596, train/loss_vlb_step=2.93e-5, train/loss_step=0.00596, global_step=6970.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   8%|▊         | 101/1208 [03:10<34:52,  1.89s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.25e-5, train/loss_step=0.0144, global_step=6971.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:   8%|▊         | 102/1208 [03:11<34:40,  1.88s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.25e-5, train/loss_step=0.0144, global_step=6971.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   8%|▊         | 102/1208 [03:11<34:41,  1.88s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00189, train/loss_vlb_step=1.14e-5, train/loss_step=0.00189, global_step=6971.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   9%|▊         | 103/1208 [03:12<34:30,  1.87s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00189, train/loss_vlb_step=1.14e-5, train/loss_step=0.00189, global_step=6971.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   9%|▊         | 103/1208 [03:12<34:30,  1.87s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.2e-5, train/loss_step=0.00207, global_step=6971.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:   9%|▊         | 104/1208 [03:16<34:42,  1.89s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.2e-5, train/loss_step=0.00207, global_step=6971.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   9%|▊         | 104/1208 [03:16<34:42,  1.89s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0605, train/loss_vlb_step=0.000207, train/loss_step=0.0605, global_step=6971.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:   9%|▊         | 105/1208 [03:17<34:31,  1.88s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0605, train/loss_vlb_step=0.000207, train/loss_step=0.0605, global_step=6971.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   9%|▊         | 105/1208 [03:17<34:31,  1.88s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0421, train/loss_vlb_step=0.000153, train/loss_step=0.0421, global_step=6972.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   9%|▉         | 106/1208 [03:18<34:21,  1.87s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0421, train/loss_vlb_step=0.000153, train/loss_step=0.0421, global_step=6972.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   9%|▉         | 106/1208 [03:18<34:21,  1.87s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000115, train/loss_step=0.0293, global_step=6972.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   9%|▉         | 107/1208 [03:19<34:10,  1.86s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000115, train/loss_step=0.0293, global_step=6972.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   9%|▉         | 107/1208 [03:19<34:10,  1.86s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00762, train/loss_vlb_step=3.69e-5, train/loss_step=0.00762, global_step=6972.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   9%|▉         | 108/1208 [03:22<34:22,  1.88s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00762, train/loss_vlb_step=3.69e-5, train/loss_step=0.00762, global_step=6972.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   9%|▉         | 108/1208 [03:22<34:22,  1.88s/it, loss=0.109, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=6972.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:   9%|▉         | 109/1208 [03:23<34:12,  1.87s/it, loss=0.109, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=6972.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   9%|▉         | 109/1208 [03:23<34:12,  1.87s/it, loss=0.1, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00146, train/loss_step=0.289, global_step=6973.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:   9%|▉         | 110/1208 [03:24<34:02,  1.86s/it, loss=0.1, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00146, train/loss_step=0.289, global_step=6973.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   9%|▉         | 110/1208 [03:24<34:02,  1.86s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00915, train/loss_vlb_step=4.28e-5, train/loss_step=0.00915, global_step=6973.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   9%|▉         | 111/1208 [03:25<33:52,  1.85s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00915, train/loss_vlb_step=4.28e-5, train/loss_step=0.00915, global_step=6973.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   9%|▉         | 111/1208 [03:25<33:52,  1.85s/it, loss=0.0991, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00127, train/loss_step=0.284, global_step=6973.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:   9%|▉         | 112/1208 [03:28<34:04,  1.86s/it, loss=0.0991, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00127, train/loss_step=0.284, global_step=6973.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   9%|▉         | 112/1208 [03:28<34:04,  1.87s/it, loss=0.108, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.00107, train/loss_step=0.232, global_step=6973.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:   9%|▉         | 113/1208 [03:29<33:54,  1.86s/it, loss=0.108, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.00107, train/loss_step=0.232, global_step=6973.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   9%|▉         | 113/1208 [03:29<33:54,  1.86s/it, loss=0.119, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00162, train/loss_step=0.289, global_step=6974.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   9%|▉         | 114/1208 [03:30<33:44,  1.85s/it, loss=0.119, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00162, train/loss_step=0.289, global_step=6974.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:   9%|▉         | 114/1208 [03:30<33:44,  1.85s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.64e-5, train/loss_step=0.0237, global_step=6974.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  10%|▉         | 115/1208 [03:32<33:35,  1.84s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.64e-5, train/loss_step=0.0237, global_step=6974.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  10%|▉         | 115/1208 [03:32<33:35,  1.84s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=9.83e-6, train/loss_step=0.00164, global_step=6974.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  10%|▉         | 116/1208 [03:35<33:46,  1.86s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=9.83e-6, train/loss_step=0.00164, global_step=6974.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  10%|▉         | 116/1208 [03:35<33:46,  1.86s/it, loss=0.0907, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.27e-5, train/loss_step=0.00218, global_step=6974.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  10%|▉         | 117/1208 [03:36<33:36,  1.85s/it, loss=0.0907, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.27e-5, train/loss_step=0.00218, global_step=6974.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  10%|▉         | 117/1208 [03:36<33:36,  1.85s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.00535, train/loss_vlb_step=2.83e-5, train/loss_step=0.00535, global_step=6975.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  10%|▉         | 118/1208 [03:37<33:27,  1.84s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.00535, train/loss_vlb_step=2.83e-5, train/loss_step=0.00535, global_step=6975.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  10%|▉         | 118/1208 [03:37<33:27,  1.84s/it, loss=0.0725, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.9e-5, train/loss_step=0.0106, global_step=6975.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  10%|▉         | 119/1208 [03:38<33:18,  1.83s/it, loss=0.0725, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.9e-5, train/loss_step=0.0106, global_step=6975.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  10%|▉         | 119/1208 [03:38<33:18,  1.83s/it, loss=0.0806, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000687, train/loss_step=0.190, global_step=6975.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  10%|▉         | 120/1208 [03:41<33:28,  1.85s/it, loss=0.0806, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000687, train/loss_step=0.190, global_step=6975.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  10%|▉         | 120/1208 [03:41<33:28,  1.85s/it, loss=0.109, v_num=0, train/loss_simple_step=0.564, train/loss_vlb_step=0.0138, train/loss_step=0.564, global_step=6975.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  10%|█         | 121/1208 [03:42<33:19,  1.84s/it, loss=0.109, v_num=0, train/loss_simple_step=0.564, train/loss_vlb_step=0.0138, train/loss_step=0.564, global_step=6975.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  10%|█         | 121/1208 [03:42<33:19,  1.84s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00749, train/loss_vlb_step=3.6e-5, train/loss_step=0.00749, global_step=6976.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  10%|█         | 122/1208 [03:43<33:11,  1.83s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00749, train/loss_vlb_step=3.6e-5, train/loss_step=0.00749, global_step=6976.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  10%|█         | 122/1208 [03:43<33:11,  1.83s/it, loss=0.119, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000802, train/loss_step=0.209, global_step=6976.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  10%|█         | 123/1208 [03:44<33:02,  1.83s/it, loss=0.119, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000802, train/loss_step=0.209, global_step=6976.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  10%|█         | 123/1208 [03:44<33:02,  1.83s/it, loss=0.134, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00162, train/loss_step=0.304, global_step=6976.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  10%|█         | 124/1208 [03:47<33:12,  1.84s/it, loss=0.134, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00162, train/loss_step=0.304, global_step=6976.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  10%|█         | 124/1208 [03:47<33:12,  1.84s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=1.03e-5, train/loss_step=0.0017, global_step=6976.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  10%|█         | 125/1208 [03:48<33:03,  1.83s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=1.03e-5, train/loss_step=0.0017, global_step=6976.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  10%|█         | 125/1208 [03:48<33:03,  1.83s/it, loss=0.139, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000734, train/loss_step=0.208, global_step=6977.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  10%|█         | 126/1208 [03:50<32:55,  1.83s/it, loss=0.139, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000734, train/loss_step=0.208, global_step=6977.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  10%|█         | 126/1208 [03:50<32:55,  1.83s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00746, train/loss_vlb_step=3.68e-5, train/loss_step=0.00746, global_step=6977.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  11%|█         | 127/1208 [03:51<32:46,  1.82s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00746, train/loss_vlb_step=3.68e-5, train/loss_step=0.00746, global_step=6977.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  11%|█         | 127/1208 [03:51<32:46,  1.82s/it, loss=0.147, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.00067, train/loss_step=0.185, global_step=6977.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  11%|█         | 128/1208 [03:54<32:56,  1.83s/it, loss=0.147, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.00067, train/loss_step=0.185, global_step=6977.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  11%|█         | 128/1208 [03:54<32:56,  1.83s/it, loss=0.151, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000664, train/loss_step=0.188, global_step=6977.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  11%|█         | 129/1208 [03:55<32:48,  1.82s/it, loss=0.151, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000664, train/loss_step=0.188, global_step=6977.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  11%|█         | 129/1208 [03:55<32:48,  1.82s/it, loss=0.144, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000517, train/loss_step=0.153, global_step=6978.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  11%|█         | 130/1208 [03:56<32:39,  1.82s/it, loss=0.144, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000517, train/loss_step=0.153, global_step=6978.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  11%|█         | 130/1208 [03:56<32:39,  1.82s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=8.74e-5, train/loss_step=0.0218, global_step=6978.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  11%|█         | 131/1208 [03:57<32:31,  1.81s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=8.74e-5, train/loss_step=0.0218, global_step=6978.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  11%|█         | 131/1208 [03:57<32:31,  1.81s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.0001, train/loss_step=0.0253, global_step=6978.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  11%|█         | 132/1208 [04:00<32:41,  1.82s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.0001, train/loss_step=0.0253, global_step=6978.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  11%|█         | 132/1208 [04:00<32:41,  1.82s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000115, train/loss_step=0.0273, global_step=6978.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  11%|█         | 133/1208 [04:01<32:33,  1.82s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000115, train/loss_step=0.0273, global_step=6978.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  11%|█         | 133/1208 [04:01<32:33,  1.82s/it, loss=0.112, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000351, train/loss_step=0.107, global_step=6979.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  11%|█         | 134/1208 [04:02<32:25,  1.81s/it, loss=0.112, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000351, train/loss_step=0.107, global_step=6979.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  11%|█         | 134/1208 [04:02<32:25,  1.81s/it, loss=0.127, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.0017, train/loss_step=0.330, global_step=6979.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  11%|█         | 135/1208 [04:03<32:17,  1.81s/it, loss=0.127, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.0017, train/loss_step=0.330, global_step=6979.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  11%|█         | 135/1208 [04:03<32:17,  1.81s/it, loss=0.137, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000738, train/loss_step=0.202, global_step=6979.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  11%|█▏        | 136/1208 [04:06<32:26,  1.82s/it, loss=0.137, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000738, train/loss_step=0.202, global_step=6979.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  11%|█▏        | 136/1208 [04:06<32:26,  1.82s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00163, train/loss_vlb_step=9.55e-6, train/loss_step=0.00163, global_step=6979.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  11%|█▏        | 137/1208 [04:07<32:18,  1.81s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00163, train/loss_vlb_step=9.55e-6, train/loss_step=0.00163, global_step=6979.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  11%|█▏        | 137/1208 [04:07<32:18,  1.81s/it, loss=0.138, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.36e-5, train/loss_step=0.015, global_step=6980.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  11%|█▏        | 138/1208 [04:09<32:10,  1.80s/it, loss=0.138, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.36e-5, train/loss_step=0.015, global_step=6980.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  11%|█▏        | 138/1208 [04:09<32:10,  1.80s/it, loss=0.152, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00154, train/loss_step=0.302, global_step=6980.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  12%|█▏        | 139/1208 [04:10<32:03,  1.80s/it, loss=0.152, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00154, train/loss_step=0.302, global_step=6980.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  12%|█▏        | 139/1208 [04:10<32:03,  1.80s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.17e-5, train/loss_step=0.00203, global_step=6980.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  12%|█▏        | 140/1208 [04:13<32:12,  1.81s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.17e-5, train/loss_step=0.00203, global_step=6980.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  12%|█▏        | 140/1208 [04:13<32:12,  1.81s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0546, train/loss_vlb_step=0.000186, train/loss_step=0.0546, global_step=6980.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  12%|█▏        | 141/1208 [04:14<32:04,  1.80s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0546, train/loss_vlb_step=0.000186, train/loss_step=0.0546, global_step=6980.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  12%|█▏        | 141/1208 [04:14<32:04,  1.80s/it, loss=0.12, v_num=0, train/loss_simple_step=0.065, train/loss_vlb_step=0.000226, train/loss_step=0.065, global_step=6981.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  12%|█▏        | 142/1208 [04:15<31:57,  1.80s/it, loss=0.12, v_num=0, train/loss_simple_step=0.065, train/loss_vlb_step=0.000226, train/loss_step=0.065, global_step=6981.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  12%|█▏        | 142/1208 [04:15<31:57,  1.80s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000122, train/loss_step=0.0319, global_step=6981.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  12%|█▏        | 143/1208 [04:16<31:49,  1.79s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000122, train/loss_step=0.0319, global_step=6981.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  12%|█▏        | 143/1208 [04:16<31:49,  1.79s/it, loss=0.106, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000737, train/loss_step=0.198, global_step=6981.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  12%|█▏        | 144/1208 [04:19<31:57,  1.80s/it, loss=0.106, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000737, train/loss_step=0.198, global_step=6981.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  12%|█▏        | 144/1208 [04:19<31:58,  1.80s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0389, train/loss_vlb_step=0.000144, train/loss_step=0.0389, global_step=6981.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  12%|█▏        | 145/1208 [04:20<31:50,  1.80s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0389, train/loss_vlb_step=0.000144, train/loss_step=0.0389, global_step=6981.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  12%|█▏        | 145/1208 [04:20<31:50,  1.80s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.22e-5, train/loss_step=0.0173, global_step=6982.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  12%|█▏        | 146/1208 [04:21<31:43,  1.79s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.22e-5, train/loss_step=0.0173, global_step=6982.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  12%|█▏        | 146/1208 [04:21<31:43,  1.79s/it, loss=0.101, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.000163, train/loss_step=0.045, global_step=6982.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  12%|█▏        | 147/1208 [04:22<31:35,  1.79s/it, loss=0.101, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.000163, train/loss_step=0.045, global_step=6982.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  12%|█▏        | 147/1208 [04:22<31:35,  1.79s/it, loss=0.115, v_num=0, train/loss_simple_step=0.469, train/loss_vlb_step=0.00527, train/loss_step=0.469, global_step=6982.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  12%|█▏        | 148/1208 [04:25<31:44,  1.80s/it, loss=0.115, v_num=0, train/loss_simple_step=0.469, train/loss_vlb_step=0.00527, train/loss_step=0.469, global_step=6982.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  12%|█▏        | 148/1208 [04:25<31:44,  1.80s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0492, train/loss_vlb_step=0.00018, train/loss_step=0.0492, global_step=6982.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  12%|█▏        | 149/1208 [04:27<31:37,  1.79s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0492, train/loss_vlb_step=0.00018, train/loss_step=0.0492, global_step=6982.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  12%|█▏        | 149/1208 [04:27<31:37,  1.79s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0546, train/loss_vlb_step=0.000191, train/loss_step=0.0546, global_step=6983.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  12%|█▏        | 150/1208 [04:28<31:30,  1.79s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0546, train/loss_vlb_step=0.000191, train/loss_step=0.0546, global_step=6983.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  12%|█▏        | 150/1208 [04:28<31:30,  1.79s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0833, train/loss_vlb_step=0.000275, train/loss_step=0.0833, global_step=6983.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  12%|█▎        | 151/1208 [04:29<31:23,  1.78s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0833, train/loss_vlb_step=0.000275, train/loss_step=0.0833, global_step=6983.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  12%|█▎        | 151/1208 [04:29<31:23,  1.78s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0783, train/loss_vlb_step=0.000264, train/loss_step=0.0783, global_step=6983.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  13%|█▎        | 152/1208 [04:32<31:31,  1.79s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0783, train/loss_vlb_step=0.000264, train/loss_step=0.0783, global_step=6983.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  13%|█▎        | 152/1208 [04:32<31:31,  1.79s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000211, train/loss_step=0.0588, global_step=6983.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  13%|█▎        | 153/1208 [04:33<31:24,  1.79s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000211, train/loss_step=0.0588, global_step=6983.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  13%|█▎        | 153/1208 [04:33<31:24,  1.79s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.14e-5, train/loss_step=0.0227, global_step=6984.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  13%|█▎        | 154/1208 [04:34<31:18,  1.78s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.14e-5, train/loss_step=0.0227, global_step=6984.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  13%|█▎        | 154/1208 [04:34<31:18,  1.78s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.00328, train/loss_vlb_step=1.82e-5, train/loss_step=0.00328, global_step=6984.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  13%|█▎        | 155/1208 [04:35<31:11,  1.78s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.00328, train/loss_vlb_step=1.82e-5, train/loss_step=0.00328, global_step=6984.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  13%|█▎        | 155/1208 [04:35<31:11,  1.78s/it, loss=0.084, v_num=0, train/loss_simple_step=0.0892, train/loss_vlb_step=0.000293, train/loss_step=0.0892, global_step=6984.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  13%|█▎        | 156/1208 [04:38<31:19,  1.79s/it, loss=0.084, v_num=0, train/loss_simple_step=0.0892, train/loss_vlb_step=0.000293, train/loss_step=0.0892, global_step=6984.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  13%|█▎        | 156/1208 [04:38<31:19,  1.79s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.07e-5, train/loss_step=0.0232, global_step=6984.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  13%|█▎        | 157/1208 [04:39<31:12,  1.78s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.07e-5, train/loss_step=0.0232, global_step=6984.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  13%|█▎        | 157/1208 [04:39<31:12,  1.78s/it, loss=0.0844, v_num=0, train/loss_simple_step=0.00127, train/loss_vlb_step=7.75e-6, train/loss_step=0.00127, global_step=6985.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  13%|█▎        | 158/1208 [04:40<31:05,  1.78s/it, loss=0.0844, v_num=0, train/loss_simple_step=0.00127, train/loss_vlb_step=7.75e-6, train/loss_step=0.00127, global_step=6985.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  13%|█▎        | 158/1208 [04:40<31:05,  1.78s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.536, train/loss_vlb_step=0.00575, train/loss_step=0.536, global_step=6985.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  13%|█▎        | 159/1208 [04:41<30:58,  1.77s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.536, train/loss_vlb_step=0.00575, train/loss_step=0.536, global_step=6985.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  13%|█▎        | 159/1208 [04:41<30:58,  1.77s/it, loss=0.11, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00126, train/loss_step=0.272, global_step=6985.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  13%|█▎        | 160/1208 [04:44<31:06,  1.78s/it, loss=0.11, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00126, train/loss_step=0.272, global_step=6985.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  13%|█▎        | 160/1208 [04:44<31:06,  1.78s/it, loss=0.13, v_num=0, train/loss_simple_step=0.459, train/loss_vlb_step=0.00428, train/loss_step=0.459, global_step=6985.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  13%|█▎        | 161/1208 [04:46<31:00,  1.78s/it, loss=0.13, v_num=0, train/loss_simple_step=0.459, train/loss_vlb_step=0.00428, train/loss_step=0.459, global_step=6985.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  13%|█▎        | 161/1208 [04:46<31:00,  1.78s/it, loss=0.148, v_num=0, train/loss_simple_step=0.438, train/loss_vlb_step=0.00275, train/loss_step=0.438, global_step=6986.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  13%|█▎        | 162/1208 [04:47<30:53,  1.77s/it, loss=0.148, v_num=0, train/loss_simple_step=0.438, train/loss_vlb_step=0.00275, train/loss_step=0.438, global_step=6986.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  13%|█▎        | 162/1208 [04:47<30:53,  1.77s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.00015, train/loss_step=0.0425, global_step=6986.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  13%|█▎        | 163/1208 [04:48<30:46,  1.77s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.00015, train/loss_step=0.0425, global_step=6986.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  13%|█▎        | 163/1208 [04:48<30:46,  1.77s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.26e-5, train/loss_step=0.00211, global_step=6986.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  14%|█▎        | 164/1208 [04:51<30:54,  1.78s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.26e-5, train/loss_step=0.00211, global_step=6986.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  14%|█▎        | 164/1208 [04:51<30:54,  1.78s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.77e-5, train/loss_step=0.0106, global_step=6986.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  14%|█▎        | 165/1208 [04:52<30:48,  1.77s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.77e-5, train/loss_step=0.0106, global_step=6986.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  14%|█▎        | 165/1208 [04:52<30:48,  1.77s/it, loss=0.15, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00123, train/loss_step=0.261, global_step=6987.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  14%|█▎        | 166/1208 [04:53<30:41,  1.77s/it, loss=0.15, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00123, train/loss_step=0.261, global_step=6987.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  14%|█▎        | 166/1208 [04:53<30:41,  1.77s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00493, train/loss_vlb_step=2.54e-5, train/loss_step=0.00493, global_step=6987.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  14%|█▍        | 167/1208 [04:54<30:35,  1.76s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00493, train/loss_vlb_step=2.54e-5, train/loss_step=0.00493, global_step=6987.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  14%|█▍        | 167/1208 [04:54<30:35,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.29e-5, train/loss_step=0.0202, global_step=6987.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  14%|█▍        | 168/1208 [04:57<30:42,  1.77s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.29e-5, train/loss_step=0.0202, global_step=6987.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  14%|█▍        | 168/1208 [04:57<30:42,  1.77s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0575, train/loss_vlb_step=0.000198, train/loss_step=0.0575, global_step=6987.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  14%|█▍        | 169/1208 [04:58<30:36,  1.77s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0575, train/loss_vlb_step=0.000198, train/loss_step=0.0575, global_step=6987.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  14%|█▍        | 169/1208 [04:58<30:36,  1.77s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00372, train/loss_vlb_step=1.97e-5, train/loss_step=0.00372, global_step=6988.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  14%|█▍        | 170/1208 [04:59<30:30,  1.76s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00372, train/loss_vlb_step=1.97e-5, train/loss_step=0.00372, global_step=6988.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  14%|█▍        | 170/1208 [04:59<30:30,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.47e-5, train/loss_step=0.00246, global_step=6988.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  14%|█▍        | 171/1208 [05:00<30:23,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.47e-5, train/loss_step=0.00246, global_step=6988.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  14%|█▍        | 171/1208 [05:00<30:23,  1.76s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0839, train/loss_vlb_step=0.000281, train/loss_step=0.0839, global_step=6988.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  14%|█▍        | 172/1208 [05:04<30:31,  1.77s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0839, train/loss_vlb_step=0.000281, train/loss_step=0.0839, global_step=6988.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  14%|█▍        | 172/1208 [05:04<30:31,  1.77s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0092, train/loss_vlb_step=4.19e-5, train/loss_step=0.0092, global_step=6988.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  14%|█▍        | 173/1208 [05:05<30:24,  1.76s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0092, train/loss_vlb_step=4.19e-5, train/loss_step=0.0092, global_step=6988.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  14%|█▍        | 173/1208 [05:05<30:24,  1.76s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0873, train/loss_vlb_step=0.000288, train/loss_step=0.0873, global_step=6989.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  14%|█▍        | 174/1208 [05:06<30:18,  1.76s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0873, train/loss_vlb_step=0.000288, train/loss_step=0.0873, global_step=6989.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  14%|█▍        | 174/1208 [05:06<30:18,  1.76s/it, loss=0.122, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.000141, train/loss_step=0.038, global_step=6989.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  14%|█▍        | 175/1208 [05:07<30:12,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.000141, train/loss_step=0.038, global_step=6989.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  14%|█▍        | 175/1208 [05:07<30:12,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00152, train/loss_step=0.288, global_step=6989.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  15%|█▍        | 176/1208 [05:10<30:19,  1.76s/it, loss=0.132, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00152, train/loss_step=0.288, global_step=6989.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  15%|█▍        | 176/1208 [05:10<30:19,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.4e-5, train/loss_step=0.00248, global_step=6989.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  15%|█▍        | 177/1208 [05:11<30:13,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.4e-5, train/loss_step=0.00248, global_step=6989.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  15%|█▍        | 177/1208 [05:11<30:13,  1.76s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.6e-5, train/loss_step=0.0173, global_step=6990.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  15%|█▍        | 178/1208 [05:12<30:07,  1.76s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.6e-5, train/loss_step=0.0173, global_step=6990.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  15%|█▍        | 178/1208 [05:12<30:07,  1.76s/it, loss=0.133, v_num=0, train/loss_simple_step=0.566, train/loss_vlb_step=0.0144, train/loss_step=0.566, global_step=6990.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  15%|█▍        | 179/1208 [05:13<30:02,  1.75s/it, loss=0.133, v_num=0, train/loss_simple_step=0.566, train/loss_vlb_step=0.0144, train/loss_step=0.566, global_step=6990.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  15%|█▍        | 179/1208 [05:13<30:02,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=6990.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  15%|█▍        | 180/1208 [05:16<30:08,  1.76s/it, loss=0.125, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=6990.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  15%|█▍        | 180/1208 [05:16<30:08,  1.76s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.48e-5, train/loss_step=0.0236, global_step=6990.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  15%|█▍        | 181/1208 [05:17<30:02,  1.76s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.48e-5, train/loss_step=0.0236, global_step=6990.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  15%|█▍        | 181/1208 [05:17<30:02,  1.76s/it, loss=0.122, v_num=0, train/loss_simple_step=0.805, train/loss_vlb_step=0.0462, train/loss_step=0.805, global_step=6991.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  15%|█▌        | 182/1208 [05:18<29:57,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.805, train/loss_vlb_step=0.0462, train/loss_step=0.805, global_step=6991.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  15%|█▌        | 182/1208 [05:18<29:57,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000193, train/loss_step=0.0545, global_step=6991.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  15%|█▌        | 183/1208 [05:19<29:51,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000193, train/loss_step=0.0545, global_step=6991.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  15%|█▌        | 183/1208 [05:19<29:51,  1.75s/it, loss=0.135, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00106, train/loss_step=0.249, global_step=6991.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  15%|█▌        | 184/1208 [05:23<29:57,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00106, train/loss_step=0.249, global_step=6991.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  15%|█▌        | 184/1208 [05:23<29:57,  1.76s/it, loss=0.134, v_num=0, train/loss_simple_step=0.005, train/loss_vlb_step=2.59e-5, train/loss_step=0.005, global_step=6991.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  15%|█▌        | 185/1208 [05:24<29:52,  1.75s/it, loss=0.134, v_num=0, train/loss_simple_step=0.005, train/loss_vlb_step=2.59e-5, train/loss_step=0.005, global_step=6991.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  15%|█▌        | 185/1208 [05:24<29:52,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.11e-5, train/loss_step=0.0115, global_step=6992.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  15%|█▌        | 186/1208 [05:25<29:46,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.11e-5, train/loss_step=0.0115, global_step=6992.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  15%|█▌        | 186/1208 [05:25<29:46,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00594, train/loss_vlb_step=2.97e-5, train/loss_step=0.00594, global_step=6992.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  15%|█▌        | 187/1208 [05:26<29:40,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00594, train/loss_vlb_step=2.97e-5, train/loss_step=0.00594, global_step=6992.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  15%|█▌        | 187/1208 [05:26<29:40,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.66e-5, train/loss_step=0.0101, global_step=6992.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  16%|█▌        | 188/1208 [05:29<29:46,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.66e-5, train/loss_step=0.0101, global_step=6992.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  16%|█▌        | 188/1208 [05:29<29:46,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=3.5e-5, train/loss_step=0.00677, global_step=6992.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  16%|█▌        | 189/1208 [05:30<29:41,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=3.5e-5, train/loss_step=0.00677, global_step=6992.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  16%|█▌        | 189/1208 [05:30<29:41,  1.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.628, train/loss_vlb_step=0.0252, train/loss_step=0.628, global_step=6993.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]     Epoch 23:  16%|█▌        | 190/1208 [05:31<29:35,  1.74s/it, loss=0.15, v_num=0, train/loss_simple_step=0.628, train/loss_vlb_step=0.0252, train/loss_step=0.628, global_step=6993.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  16%|█▌        | 190/1208 [05:31<29:35,  1.74s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00886, train/loss_vlb_step=4.4e-5, train/loss_step=0.00886, global_step=6993.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  16%|█▌        | 191/1208 [05:32<29:30,  1.74s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00886, train/loss_vlb_step=4.4e-5, train/loss_step=0.00886, global_step=6993.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  16%|█▌        | 191/1208 [05:32<29:30,  1.74s/it, loss=0.158, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.00107, train/loss_step=0.241, global_step=6993.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  16%|█▌        | 192/1208 [05:35<29:36,  1.75s/it, loss=0.158, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.00107, train/loss_step=0.241, global_step=6993.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  16%|█▌        | 192/1208 [05:35<29:36,  1.75s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.81e-5, train/loss_step=0.0191, global_step=6993.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  16%|█▌        | 193/1208 [05:36<29:31,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.81e-5, train/loss_step=0.0191, global_step=6993.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  16%|█▌        | 193/1208 [05:36<29:31,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=1.71e-5, train/loss_step=0.00308, global_step=6994.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  16%|█▌        | 194/1208 [05:37<29:25,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=1.71e-5, train/loss_step=0.00308, global_step=6994.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  16%|█▌        | 194/1208 [05:37<29:25,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.00012, train/loss_step=0.0322, global_step=6994.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  16%|█▌        | 195/1208 [05:38<29:20,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.00012, train/loss_step=0.0322, global_step=6994.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  16%|█▌        | 195/1208 [05:38<29:20,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000364, train/loss_step=0.110, global_step=6994.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  16%|█▌        | 196/1208 [05:42<29:26,  1.75s/it, loss=0.145, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000364, train/loss_step=0.110, global_step=6994.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  16%|█▌        | 196/1208 [05:42<29:26,  1.75s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.28e-5, train/loss_step=0.00212, global_step=6994.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  16%|█▋        | 197/1208 [05:43<29:20,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.28e-5, train/loss_step=0.00212, global_step=6994.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  16%|█▋        | 197/1208 [05:43<29:20,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.57e-5, train/loss_step=0.00268, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  16%|█▋        | 198/1208 [05:44<29:15,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.57e-5, train/loss_step=0.00268, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  16%|█▋        | 198/1208 [05:44<29:15,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=1.87e-5, train/loss_step=0.00347, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  16%|█▋        | 199/1208 [05:45<29:10,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=1.87e-5, train/loss_step=0.00347, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  16%|█▋        | 199/1208 [05:45<29:10,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00849, train/loss_vlb_step=4.04e-5, train/loss_step=0.00849, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  17%|█▋        | 200/1208 [05:48<29:15,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00849, train/loss_vlb_step=4.04e-5, train/loss_step=0.00849, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  17%|█▋        | 200/1208 [05:48<29:15,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.59e-5, train/loss_step=0.0145, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  17%|█▋        | 201/1208 [05:49<29:10,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.59e-5, train/loss_step=0.0145, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  17%|█▋        | 201/1208 [05:49<29:10,  1.74s/it, loss=0.0735, v_num=0, train/loss_simple_step=0.0554, train/loss_vlb_step=0.000193, train/loss_step=0.0554, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  17%|█▋        | 202/1208 [05:50<29:05,  1.74s/it, loss=0.0735, v_num=0, train/loss_simple_step=0.0554, train/loss_vlb_step=0.000193, train/loss_step=0.0554, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  17%|█▋        | 202/1208 [05:50<29:05,  1.74s/it, loss=0.0736, v_num=0, train/loss_simple_step=0.0552, train/loss_vlb_step=0.000194, train/loss_step=0.0552, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  17%|█▋        | 203/1208 [05:51<29:00,  1.73s/it, loss=0.0736, v_num=0, train/loss_simple_step=0.0552, train/loss_vlb_step=0.000194, train/loss_step=0.0552, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  17%|█▋        | 203/1208 [05:51<29:00,  1.73s/it, loss=0.0733, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000978, train/loss_step=0.242, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  17%|█▋        | 204/1208 [05:54<29:05,  1.74s/it, loss=0.0733, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000978, train/loss_step=0.242, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  17%|█▋        | 204/1208 [05:54<29:05,  1.74s/it, loss=0.0741, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.83e-5, train/loss_step=0.0209, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  17%|█▋        | 205/1208 [05:55<29:00,  1.74s/it, loss=0.0741, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.83e-5, train/loss_step=0.0209, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  17%|█▋        | 205/1208 [05:55<29:00,  1.74s/it, loss=0.0802, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000441, train/loss_step=0.134, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  17%|█▋        | 206/1208 [05:56<28:55,  1.73s/it, loss=0.0802, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000441, train/loss_step=0.134, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  17%|█▋        | 206/1208 [05:56<28:55,  1.73s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.00017, train/loss_step=0.0468, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  17%|█▋        | 207/1208 [05:57<28:50,  1.73s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.00017, train/loss_step=0.0468, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  17%|█▋        | 207/1208 [05:57<28:50,  1.73s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00163, train/loss_step=0.316, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  17%|█▋        | 208/1208 [06:01<28:56,  1.74s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00163, train/loss_step=0.316, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  17%|█▋        | 208/1208 [06:01<28:56,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000504, train/loss_step=0.152, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  17%|█▋        | 209/1208 [06:02<28:51,  1.73s/it, loss=0.105, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000504, train/loss_step=0.152, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  17%|█▋        | 209/1208 [06:02<28:51,  1.73s/it, loss=0.083, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000672, train/loss_step=0.193, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  17%|█▋        | 210/1208 [06:03<28:45,  1.73s/it, loss=0.083, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000672, train/loss_step=0.193, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  17%|█▋        | 210/1208 [06:03<28:46,  1.73s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.00546, train/loss_vlb_step=2.77e-5, train/loss_step=0.00546, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  17%|█▋        | 211/1208 [06:04<28:40,  1.73s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.00546, train/loss_vlb_step=2.77e-5, train/loss_step=0.00546, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  17%|█▋        | 211/1208 [06:04<28:40,  1.73s/it, loss=0.0724, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000125, train/loss_step=0.0328, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  18%|█▊        | 212/1208 [06:07<28:46,  1.73s/it, loss=0.0724, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000125, train/loss_step=0.0328, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  18%|█▊        | 212/1208 [06:07<28:46,  1.73s/it, loss=0.0722, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.42e-5, train/loss_step=0.0151, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  18%|█▊        | 213/1208 [06:08<28:41,  1.73s/it, loss=0.0722, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.42e-5, train/loss_step=0.0151, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  18%|█▊        | 213/1208 [06:08<28:41,  1.73s/it, loss=0.0722, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=1.37e-5, train/loss_step=0.00234, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  18%|█▊        | 214/1208 [06:09<28:36,  1.73s/it, loss=0.0722, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=1.37e-5, train/loss_step=0.00234, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  18%|█▊        | 214/1208 [06:09<28:36,  1.73s/it, loss=0.071, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=3.91e-5, train/loss_step=0.00783, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  18%|█▊        | 215/1208 [06:10<28:31,  1.72s/it, loss=0.071, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=3.91e-5, train/loss_step=0.00783, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  18%|█▊        | 215/1208 [06:10<28:31,  1.72s/it, loss=0.0657, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=1.93e-5, train/loss_step=0.00345, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  18%|█▊        | 216/1208 [06:13<28:36,  1.73s/it, loss=0.0657, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=1.93e-5, train/loss_step=0.00345, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  18%|█▊        | 216/1208 [06:13<28:36,  1.73s/it, loss=0.0755, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.0007, train/loss_step=0.199, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]     Epoch 23:  18%|█▊        | 217/1208 [06:14<28:31,  1.73s/it, loss=0.0755, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.0007, train/loss_step=0.199, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  18%|█▊        | 217/1208 [06:14<28:31,  1.73s/it, loss=0.0756, v_num=0, train/loss_simple_step=0.00491, train/loss_vlb_step=2.5e-5, train/loss_step=0.00491, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  18%|█▊        | 218/1208 [06:15<28:26,  1.72s/it, loss=0.0756, v_num=0, train/loss_simple_step=0.00491, train/loss_vlb_step=2.5e-5, train/loss_step=0.00491, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  18%|█▊        | 218/1208 [06:15<28:26,  1.72s/it, loss=0.0758, v_num=0, train/loss_simple_step=0.00693, train/loss_vlb_step=3.44e-5, train/loss_step=0.00693, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  18%|█▊        | 219/1208 [06:16<28:22,  1.72s/it, loss=0.0758, v_num=0, train/loss_simple_step=0.00693, train/loss_vlb_step=3.44e-5, train/loss_step=0.00693, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  18%|█▊        | 219/1208 [06:16<28:22,  1.72s/it, loss=0.0759, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.58e-5, train/loss_step=0.0101, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  18%|█▊        | 220/1208 [06:20<28:27,  1.73s/it, loss=0.0759, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.58e-5, train/loss_step=0.0101, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  18%|█▊        | 220/1208 [06:20<28:27,  1.73s/it, loss=0.0784, v_num=0, train/loss_simple_step=0.0649, train/loss_vlb_step=0.000226, train/loss_step=0.0649, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  18%|█▊        | 221/1208 [06:21<28:22,  1.72s/it, loss=0.0784, v_num=0, train/loss_simple_step=0.0649, train/loss_vlb_step=0.000226, train/loss_step=0.0649, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  18%|█▊        | 221/1208 [06:21<28:22,  1.72s/it, loss=0.0762, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.49e-5, train/loss_step=0.0122, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  18%|█▊        | 222/1208 [06:22<28:17,  1.72s/it, loss=0.0762, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.49e-5, train/loss_step=0.0122, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  18%|█▊        | 222/1208 [06:22<28:17,  1.72s/it, loss=0.0766, v_num=0, train/loss_simple_step=0.063, train/loss_vlb_step=0.000222, train/loss_step=0.063, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  18%|█▊        | 223/1208 [06:23<28:12,  1.72s/it, loss=0.0766, v_num=0, train/loss_simple_step=0.063, train/loss_vlb_step=0.000222, train/loss_step=0.063, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  18%|█▊        | 223/1208 [06:23<28:12,  1.72s/it, loss=0.073, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.00058, train/loss_step=0.169, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  19%|█▊        | 224/1208 [06:26<28:17,  1.73s/it, loss=0.073, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.00058, train/loss_step=0.169, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  19%|█▊        | 224/1208 [06:26<28:17,  1.73s/it, loss=0.0722, v_num=0, train/loss_simple_step=0.00577, train/loss_vlb_step=2.89e-5, train/loss_step=0.00577, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  19%|█▊        | 225/1208 [06:27<28:13,  1.72s/it, loss=0.0722, v_num=0, train/loss_simple_step=0.00577, train/loss_vlb_step=2.89e-5, train/loss_step=0.00577, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  19%|█▊        | 225/1208 [06:27<28:13,  1.72s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.639, train/loss_vlb_step=0.0129, train/loss_step=0.639, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]     Epoch 23:  19%|█▊        | 226/1208 [06:28<28:08,  1.72s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.639, train/loss_vlb_step=0.0129, train/loss_step=0.639, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  19%|█▊        | 226/1208 [06:28<28:08,  1.72s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.0563, train/loss_vlb_step=0.000188, train/loss_step=0.0563, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  19%|█▉        | 227/1208 [06:29<28:03,  1.72s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.0563, train/loss_vlb_step=0.000188, train/loss_step=0.0563, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  19%|█▉        | 227/1208 [06:29<28:03,  1.72s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000848, train/loss_step=0.220, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  19%|█▉        | 228/1208 [06:32<28:08,  1.72s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000848, train/loss_step=0.220, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  19%|█▉        | 228/1208 [06:32<28:08,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00139, train/loss_step=0.297, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  19%|█▉        | 229/1208 [06:33<28:04,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00139, train/loss_step=0.297, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  19%|█▉        | 229/1208 [06:33<28:04,  1.72s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.00019, train/loss_step=0.0524, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  19%|█▉        | 230/1208 [06:34<27:59,  1.72s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.00019, train/loss_step=0.0524, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  19%|█▉        | 230/1208 [06:34<27:59,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.535, train/loss_vlb_step=0.00622, train/loss_step=0.535, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  19%|█▉        | 231/1208 [06:35<27:54,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.535, train/loss_vlb_step=0.00622, train/loss_step=0.535, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  19%|█▉        | 231/1208 [06:35<27:54,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00125, train/loss_step=0.271, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  19%|█▉        | 232/1208 [06:39<27:59,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00125, train/loss_step=0.271, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  19%|█▉        | 232/1208 [06:39<27:59,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=1.73e-5, train/loss_step=0.00315, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  19%|█▉        | 233/1208 [06:40<27:54,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=1.73e-5, train/loss_step=0.00315, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  19%|█▉        | 233/1208 [06:40<27:54,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000739, train/loss_step=0.210, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  19%|█▉        | 234/1208 [06:41<27:50,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000739, train/loss_step=0.210, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  19%|█▉        | 234/1208 [06:41<27:50,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.18e-5, train/loss_step=0.0143, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  19%|█▉        | 235/1208 [06:42<27:45,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.18e-5, train/loss_step=0.0143, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  19%|█▉        | 235/1208 [06:42<27:45,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0434, train/loss_vlb_step=0.000157, train/loss_step=0.0434, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  20%|█▉        | 236/1208 [06:45<27:50,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0434, train/loss_vlb_step=0.000157, train/loss_step=0.0434, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  20%|█▉        | 236/1208 [06:45<27:50,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.705, train/loss_vlb_step=0.0333, train/loss_step=0.705, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  20%|█▉        | 237/1208 [06:46<27:45,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.705, train/loss_vlb_step=0.0333, train/loss_step=0.705, global_step=7e+3, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  20%|█▉        | 237/1208 [06:46<27:45,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00159, train/loss_step=0.311, global_step=7005.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  20%|█▉        | 238/1208 [06:47<27:41,  1.71s/it, loss=0.184, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00159, train/loss_step=0.311, global_step=7005.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  20%|█▉        | 238/1208 [06:47<27:41,  1.71s/it, loss=0.197, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00128, train/loss_step=0.264, global_step=7005.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  20%|█▉        | 239/1208 [06:48<27:36,  1.71s/it, loss=0.197, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00128, train/loss_step=0.264, global_step=7005.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  20%|█▉        | 239/1208 [06:48<27:36,  1.71s/it, loss=0.206, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000718, train/loss_step=0.178, global_step=7005.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  20%|█▉        | 240/1208 [06:51<27:40,  1.72s/it, loss=0.206, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000718, train/loss_step=0.178, global_step=7005.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  20%|█▉        | 240/1208 [06:51<27:40,  1.72s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0522, train/loss_vlb_step=0.000181, train/loss_step=0.0522, global_step=7005.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  20%|█▉        | 241/1208 [06:52<27:36,  1.71s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0522, train/loss_vlb_step=0.000181, train/loss_step=0.0522, global_step=7005.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  20%|█▉        | 241/1208 [06:52<27:36,  1.71s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0811, train/loss_vlb_step=0.000269, train/loss_step=0.0811, global_step=7006.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  20%|██        | 242/1208 [06:53<27:32,  1.71s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0811, train/loss_vlb_step=0.000269, train/loss_step=0.0811, global_step=7006.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  20%|██        | 242/1208 [06:53<27:32,  1.71s/it, loss=0.212, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000437, train/loss_step=0.130, global_step=7006.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  20%|██        | 243/1208 [06:54<27:27,  1.71s/it, loss=0.212, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000437, train/loss_step=0.130, global_step=7006.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  20%|██        | 243/1208 [06:54<27:27,  1.71s/it, loss=0.204, v_num=0, train/loss_simple_step=0.00709, train/loss_vlb_step=3.49e-5, train/loss_step=0.00709, global_step=7006.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  20%|██        | 244/1208 [06:58<27:31,  1.71s/it, loss=0.204, v_num=0, train/loss_simple_step=0.00709, train/loss_vlb_step=3.49e-5, train/loss_step=0.00709, global_step=7006.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  20%|██        | 244/1208 [06:58<27:31,  1.71s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000125, train/loss_step=0.0309, global_step=7006.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  20%|██        | 245/1208 [06:59<27:27,  1.71s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000125, train/loss_step=0.0309, global_step=7006.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  20%|██        | 245/1208 [06:59<27:27,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0834, train/loss_vlb_step=0.000276, train/loss_step=0.0834, global_step=7007.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  20%|██        | 246/1208 [07:00<27:23,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0834, train/loss_vlb_step=0.000276, train/loss_step=0.0834, global_step=7007.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  20%|██        | 246/1208 [07:00<27:23,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.58e-5, train/loss_step=0.0243, global_step=7007.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  20%|██        | 247/1208 [07:01<27:19,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.58e-5, train/loss_step=0.0243, global_step=7007.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  20%|██        | 247/1208 [07:01<27:19,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00521, train/loss_vlb_step=2.71e-5, train/loss_step=0.00521, global_step=7007.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  21%|██        | 248/1208 [07:04<27:23,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00521, train/loss_vlb_step=2.71e-5, train/loss_step=0.00521, global_step=7007.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  21%|██        | 248/1208 [07:04<27:23,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.66e-5, train/loss_step=0.0124, global_step=7007.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  21%|██        | 249/1208 [07:05<27:18,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.66e-5, train/loss_step=0.0124, global_step=7007.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  21%|██        | 249/1208 [07:05<27:18,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000813, train/loss_step=0.189, global_step=7008.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  21%|██        | 250/1208 [07:06<27:14,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000813, train/loss_step=0.189, global_step=7008.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  21%|██        | 250/1208 [07:06<27:14,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00555, train/loss_vlb_step=2.93e-5, train/loss_step=0.00555, global_step=7008.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  21%|██        | 251/1208 [07:07<27:10,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00555, train/loss_vlb_step=2.93e-5, train/loss_step=0.00555, global_step=7008.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  21%|██        | 251/1208 [07:07<27:10,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000404, train/loss_step=0.123, global_step=7008.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  21%|██        | 252/1208 [07:10<27:12,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000404, train/loss_step=0.123, global_step=7008.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  21%|██        | 252/1208 [07:10<27:12,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0986, train/loss_vlb_step=0.000324, train/loss_step=0.0986, global_step=7008.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  21%|██        | 253/1208 [07:11<27:08,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0986, train/loss_vlb_step=0.000324, train/loss_step=0.0986, global_step=7008.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  21%|██        | 253/1208 [07:11<27:08,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00117, train/loss_step=0.270, global_step=7009.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  21%|██        | 254/1208 [07:12<27:04,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00117, train/loss_step=0.270, global_step=7009.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  21%|██        | 254/1208 [07:12<27:04,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.514, train/loss_vlb_step=0.00941, train/loss_step=0.514, global_step=7009.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  21%|██        | 255/1208 [07:13<26:59,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.514, train/loss_vlb_step=0.00941, train/loss_step=0.514, global_step=7009.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  21%|██        | 255/1208 [07:13<26:59,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.000119, train/loss_step=0.0312, global_step=7009.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  21%|██        | 256/1208 [07:16<27:02,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.000119, train/loss_step=0.0312, global_step=7009.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  21%|██        | 256/1208 [07:16<27:02,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.504, train/loss_vlb_step=0.00713, train/loss_step=0.504, global_step=7009.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  21%|██▏       | 257/1208 [07:17<26:58,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.504, train/loss_vlb_step=0.00713, train/loss_step=0.504, global_step=7009.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  21%|██▏       | 257/1208 [07:17<26:58,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000453, train/loss_step=0.138, global_step=7010.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  21%|██▏       | 258/1208 [07:18<26:54,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000453, train/loss_step=0.138, global_step=7010.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  21%|██▏       | 258/1208 [07:18<26:54,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0773, train/loss_vlb_step=0.000261, train/loss_step=0.0773, global_step=7010.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  21%|██▏       | 259/1208 [07:19<26:49,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0773, train/loss_vlb_step=0.000261, train/loss_step=0.0773, global_step=7010.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  21%|██▏       | 259/1208 [07:19<26:49,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000612, train/loss_step=0.175, global_step=7010.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  22%|██▏       | 260/1208 [07:22<26:52,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000612, train/loss_step=0.175, global_step=7010.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  22%|██▏       | 260/1208 [07:22<26:52,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000431, train/loss_step=0.130, global_step=7010.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  22%|██▏       | 261/1208 [07:23<26:48,  1.70s/it, loss=0.131, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000431, train/loss_step=0.130, global_step=7010.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  22%|██▏       | 261/1208 [07:23<26:48,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0942, train/loss_vlb_step=0.00031, train/loss_step=0.0942, global_step=7011.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  22%|██▏       | 262/1208 [07:24<26:44,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0942, train/loss_vlb_step=0.00031, train/loss_step=0.0942, global_step=7011.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  22%|██▏       | 262/1208 [07:24<26:44,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=2.15e-5, train/loss_step=0.00395, global_step=7011.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  22%|██▏       | 263/1208 [07:25<26:39,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=2.15e-5, train/loss_step=0.00395, global_step=7011.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  22%|██▏       | 263/1208 [07:25<26:39,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=6.98e-5, train/loss_step=0.0171, global_step=7011.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  22%|██▏       | 264/1208 [07:28<26:42,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=6.98e-5, train/loss_step=0.0171, global_step=7011.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  22%|██▏       | 264/1208 [07:28<26:42,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000661, train/loss_step=0.184, global_step=7011.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  22%|██▏       | 265/1208 [07:29<26:38,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000661, train/loss_step=0.184, global_step=7011.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  22%|██▏       | 265/1208 [07:29<26:38,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.71e-5, train/loss_step=0.0128, global_step=7012.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  22%|██▏       | 266/1208 [07:30<26:34,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.71e-5, train/loss_step=0.0128, global_step=7012.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  22%|██▏       | 266/1208 [07:30<26:34,  1.69s/it, loss=0.155, v_num=0, train/loss_simple_step=0.511, train/loss_vlb_step=0.00814, train/loss_step=0.511, global_step=7012.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  22%|██▏       | 267/1208 [07:31<26:30,  1.69s/it, loss=0.155, v_num=0, train/loss_simple_step=0.511, train/loss_vlb_step=0.00814, train/loss_step=0.511, global_step=7012.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  22%|██▏       | 267/1208 [07:31<26:30,  1.69s/it, loss=0.17, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00154, train/loss_step=0.307, global_step=7012.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  22%|██▏       | 268/1208 [07:34<26:32,  1.69s/it, loss=0.17, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00154, train/loss_step=0.307, global_step=7012.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  22%|██▏       | 268/1208 [07:34<26:32,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00455, train/loss_vlb_step=2.4e-5, train/loss_step=0.00455, global_step=7012.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  22%|██▏       | 269/1208 [07:35<26:28,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00455, train/loss_vlb_step=2.4e-5, train/loss_step=0.00455, global_step=7012.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  22%|██▏       | 269/1208 [07:35<26:28,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000619, train/loss_step=0.177, global_step=7013.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  22%|██▏       | 270/1208 [07:36<26:24,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000619, train/loss_step=0.177, global_step=7013.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  22%|██▏       | 270/1208 [07:36<26:24,  1.69s/it, loss=0.197, v_num=0, train/loss_simple_step=0.561, train/loss_vlb_step=0.00759, train/loss_step=0.561, global_step=7013.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  22%|██▏       | 271/1208 [07:37<26:20,  1.69s/it, loss=0.197, v_num=0, train/loss_simple_step=0.561, train/loss_vlb_step=0.00759, train/loss_step=0.561, global_step=7013.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  22%|██▏       | 271/1208 [07:37<26:20,  1.69s/it, loss=0.196, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.00035, train/loss_step=0.106, global_step=7013.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  23%|██▎       | 272/1208 [07:39<26:22,  1.69s/it, loss=0.196, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.00035, train/loss_step=0.106, global_step=7013.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  23%|██▎       | 272/1208 [07:39<26:22,  1.69s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000169, train/loss_step=0.0484, global_step=7013.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  23%|██▎       | 273/1208 [07:40<26:18,  1.69s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000169, train/loss_step=0.0484, global_step=7013.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  23%|██▎       | 273/1208 [07:40<26:18,  1.69s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.000141, train/loss_step=0.0395, global_step=7014.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  23%|██▎       | 274/1208 [07:41<26:14,  1.69s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.000141, train/loss_step=0.0395, global_step=7014.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  23%|██▎       | 274/1208 [07:41<26:14,  1.69s/it, loss=0.191, v_num=0, train/loss_simple_step=0.702, train/loss_vlb_step=0.0514, train/loss_step=0.702, global_step=7014.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  23%|██▎       | 275/1208 [07:42<26:10,  1.68s/it, loss=0.191, v_num=0, train/loss_simple_step=0.702, train/loss_vlb_step=0.0514, train/loss_step=0.702, global_step=7014.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  23%|██▎       | 275/1208 [07:42<26:10,  1.68s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0707, train/loss_vlb_step=0.000242, train/loss_step=0.0707, global_step=7014.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  23%|██▎       | 276/1208 [07:45<26:13,  1.69s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0707, train/loss_vlb_step=0.000242, train/loss_step=0.0707, global_step=7014.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  23%|██▎       | 276/1208 [07:45<26:13,  1.69s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0067, train/loss_vlb_step=3.45e-5, train/loss_step=0.0067, global_step=7014.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  23%|██▎       | 277/1208 [07:46<26:09,  1.69s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0067, train/loss_vlb_step=3.45e-5, train/loss_step=0.0067, global_step=7014.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  23%|██▎       | 277/1208 [07:46<26:09,  1.69s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0988, train/loss_vlb_step=0.000326, train/loss_step=0.0988, global_step=7015.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  23%|██▎       | 278/1208 [07:47<26:05,  1.68s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0988, train/loss_vlb_step=0.000326, train/loss_step=0.0988, global_step=7015.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  23%|██▎       | 278/1208 [07:47<26:05,  1.68s/it, loss=0.17, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000516, train/loss_step=0.152, global_step=7015.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  23%|██▎       | 279/1208 [07:48<26:01,  1.68s/it, loss=0.17, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000516, train/loss_step=0.152, global_step=7015.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  23%|██▎       | 279/1208 [07:48<26:01,  1.68s/it, loss=0.167, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000351, train/loss_step=0.106, global_step=7015.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  23%|██▎       | 280/1208 [07:51<26:03,  1.68s/it, loss=0.167, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000351, train/loss_step=0.106, global_step=7015.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  23%|██▎       | 280/1208 [07:51<26:03,  1.68s/it, loss=0.175, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00129, train/loss_step=0.291, global_step=7015.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  23%|██▎       | 281/1208 [07:52<25:59,  1.68s/it, loss=0.175, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00129, train/loss_step=0.291, global_step=7015.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  23%|██▎       | 281/1208 [07:52<25:59,  1.68s/it, loss=0.18, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000765, train/loss_step=0.209, global_step=7016.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  23%|██▎       | 282/1208 [07:53<25:55,  1.68s/it, loss=0.18, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000765, train/loss_step=0.209, global_step=7016.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  23%|██▎       | 282/1208 [07:53<25:55,  1.68s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0385, train/loss_vlb_step=0.000142, train/loss_step=0.0385, global_step=7016.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  23%|██▎       | 283/1208 [07:54<25:52,  1.68s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0385, train/loss_vlb_step=0.000142, train/loss_step=0.0385, global_step=7016.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  23%|██▎       | 283/1208 [07:54<25:52,  1.68s/it, loss=0.191, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000679, train/loss_step=0.190, global_step=7016.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  24%|██▎       | 284/1208 [07:57<25:54,  1.68s/it, loss=0.191, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000679, train/loss_step=0.190, global_step=7016.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  24%|██▎       | 284/1208 [07:57<25:54,  1.68s/it, loss=0.193, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00101, train/loss_step=0.237, global_step=7016.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  24%|██▎       | 285/1208 [07:58<25:50,  1.68s/it, loss=0.193, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00101, train/loss_step=0.237, global_step=7016.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  24%|██▎       | 285/1208 [07:58<25:50,  1.68s/it, loss=0.198, v_num=0, train/loss_simple_step=0.099, train/loss_vlb_step=0.000325, train/loss_step=0.099, global_step=7017.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  24%|██▎       | 286/1208 [07:59<25:46,  1.68s/it, loss=0.198, v_num=0, train/loss_simple_step=0.099, train/loss_vlb_step=0.000325, train/loss_step=0.099, global_step=7017.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  24%|██▎       | 286/1208 [07:59<25:46,  1.68s/it, loss=0.194, v_num=0, train/loss_simple_step=0.445, train/loss_vlb_step=0.00322, train/loss_step=0.445, global_step=7017.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  24%|██▍       | 287/1208 [08:00<25:42,  1.67s/it, loss=0.194, v_num=0, train/loss_simple_step=0.445, train/loss_vlb_step=0.00322, train/loss_step=0.445, global_step=7017.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  24%|██▍       | 287/1208 [08:00<25:42,  1.67s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.34e-5, train/loss_step=0.0156, global_step=7017.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  24%|██▍       | 288/1208 [08:03<25:44,  1.68s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.34e-5, train/loss_step=0.0156, global_step=7017.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  24%|██▍       | 288/1208 [08:03<25:44,  1.68s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.27e-5, train/loss_step=0.0237, global_step=7017.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  24%|██▍       | 289/1208 [08:04<25:40,  1.68s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.27e-5, train/loss_step=0.0237, global_step=7017.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  24%|██▍       | 289/1208 [08:04<25:40,  1.68s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.96e-5, train/loss_step=0.0191, global_step=7018.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  24%|██▍       | 290/1208 [08:05<25:37,  1.67s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.96e-5, train/loss_step=0.0191, global_step=7018.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  24%|██▍       | 290/1208 [08:05<25:37,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.18e-5, train/loss_step=0.00194, global_step=7018.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  24%|██▍       | 291/1208 [08:06<25:33,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.18e-5, train/loss_step=0.00194, global_step=7018.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  24%|██▍       | 291/1208 [08:06<25:33,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.52e-5, train/loss_step=0.00268, global_step=7018.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  24%|██▍       | 292/1208 [08:09<25:35,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.52e-5, train/loss_step=0.00268, global_step=7018.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  24%|██▍       | 292/1208 [08:09<25:35,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.18e-5, train/loss_step=0.0201, global_step=7018.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  24%|██▍       | 293/1208 [08:10<25:31,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.18e-5, train/loss_step=0.0201, global_step=7018.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  24%|██▍       | 293/1208 [08:10<25:31,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0837, train/loss_vlb_step=0.000279, train/loss_step=0.0837, global_step=7019.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  24%|██▍       | 294/1208 [08:11<25:28,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0837, train/loss_vlb_step=0.000279, train/loss_step=0.0837, global_step=7019.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  24%|██▍       | 294/1208 [08:11<25:28,  1.67s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0659, train/loss_vlb_step=0.000223, train/loss_step=0.0659, global_step=7019.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  24%|██▍       | 295/1208 [08:12<25:24,  1.67s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0659, train/loss_vlb_step=0.000223, train/loss_step=0.0659, global_step=7019.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  24%|██▍       | 295/1208 [08:12<25:24,  1.67s/it, loss=0.113, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000547, train/loss_step=0.163, global_step=7019.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  25%|██▍       | 296/1208 [08:15<25:26,  1.67s/it, loss=0.113, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000547, train/loss_step=0.163, global_step=7019.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  25%|██▍       | 296/1208 [08:15<25:26,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.42e-5, train/loss_step=0.0168, global_step=7019.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  25%|██▍       | 297/1208 [08:16<25:22,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.42e-5, train/loss_step=0.0168, global_step=7019.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  25%|██▍       | 297/1208 [08:16<25:22,  1.67s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00412, train/loss_vlb_step=2.2e-5, train/loss_step=0.00412, global_step=7020.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  25%|██▍       | 298/1208 [08:17<25:18,  1.67s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00412, train/loss_vlb_step=2.2e-5, train/loss_step=0.00412, global_step=7020.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  25%|██▍       | 298/1208 [08:17<25:18,  1.67s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0583, train/loss_vlb_step=0.000206, train/loss_step=0.0583, global_step=7020.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  25%|██▍       | 299/1208 [08:18<25:15,  1.67s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0583, train/loss_vlb_step=0.000206, train/loss_step=0.0583, global_step=7020.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  25%|██▍       | 299/1208 [08:18<25:15,  1.67s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0711, train/loss_vlb_step=0.000241, train/loss_step=0.0711, global_step=7020.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  25%|██▍       | 300/1208 [08:21<25:17,  1.67s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0711, train/loss_vlb_step=0.000241, train/loss_step=0.0711, global_step=7020.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  25%|██▍       | 300/1208 [08:21<25:17,  1.67s/it, loss=0.0892, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=8.21e-5, train/loss_step=0.0193, global_step=7020.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.84it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:25,  1.85it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.85it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.84it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.84it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.84it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.83it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.84it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.84it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.84it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.84it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.84it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.84it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.84it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.84it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.85it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.84it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.84it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.84it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.83it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.85it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.85it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.85it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.84it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.85it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:18,  1.85it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.84it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.84it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.84it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.84it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.84it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.85it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.84it/s][ADDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.85it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.84it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.84it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.84it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.84it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.84it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.84it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.84it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.83it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.83it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.83it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.85it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.83it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.85it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.85it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.84it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.84it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.84it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.84it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.84it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]DDIM Sampler:  70%|███████   | 35/50 [00:18<00:08,  1.84it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.84it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.84it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.84it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.84it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.84it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.83it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.85it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.84it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.84it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.85it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.82it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.85it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.84it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.85it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.84it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.84it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.84it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.84it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.84it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.84it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.84it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:24<00:02,  1.84it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.84it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.84it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.84it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.84it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.83it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.85it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.83it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.85it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.83it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]Epoch 23:  25%|██▍       | 301/1208 [08:50<26:39,  1.76s/it, loss=0.0892, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=8.21e-5, train/loss_step=0.0193, global_step=7020.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  25%|██▍       | 301/1208 [08:50<26:39,  1.76s/it, loss=0.0789, v_num=0, train/loss_simple_step=0.00293, train/loss_vlb_step=1.64e-5, train/loss_step=0.00293, global_step=7021.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  25%|██▌       | 302/1208 [08:51<26:35,  1.76s/it, loss=0.0789, v_num=0, train/loss_simple_step=0.00293, train/loss_vlb_step=1.64e-5, train/loss_step=0.00293, global_step=7021.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  25%|██▌       | 302/1208 [08:51<26:35,  1.76s/it, loss=0.0778, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.31e-5, train/loss_step=0.0169, global_step=7021.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  25%|██▌       | 303/1208 [08:52<26:31,  1.76s/it, loss=0.0778, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.31e-5, train/loss_step=0.0169, global_step=7021.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  25%|██▌       | 303/1208 [08:52<26:31,  1.76s/it, loss=0.0699, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000127, train/loss_step=0.0328, global_step=7021.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  25%|██▌       | 304/1208 [08:55<26:33,  1.76s/it, loss=0.0699, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000127, train/loss_step=0.0328, global_step=7021.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  25%|██▌       | 304/1208 [08:55<26:33,  1.76s/it, loss=0.0612, v_num=0, train/loss_simple_step=0.0618, train/loss_vlb_step=0.000213, train/loss_step=0.0618, global_step=7021.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  25%|██▌       | 305/1208 [08:56<26:29,  1.76s/it, loss=0.0612, v_num=0, train/loss_simple_step=0.0618, train/loss_vlb_step=0.000213, train/loss_step=0.0618, global_step=7021.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  25%|██▌       | 305/1208 [08:56<26:29,  1.76s/it, loss=0.0734, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00184, train/loss_step=0.344, global_step=7022.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  25%|██▌       | 306/1208 [08:57<26:25,  1.76s/it, loss=0.0734, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00184, train/loss_step=0.344, global_step=7022.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  25%|██▌       | 306/1208 [08:57<26:25,  1.76s/it, loss=0.0563, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=7022.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  25%|██▌       | 307/1208 [08:58<26:21,  1.76s/it, loss=0.0563, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=7022.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  25%|██▌       | 307/1208 [08:58<26:21,  1.76s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.817, train/loss_vlb_step=0.0526, train/loss_step=0.817, global_step=7022.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  25%|██▌       | 308/1208 [09:01<26:23,  1.76s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.817, train/loss_vlb_step=0.0526, train/loss_step=0.817, global_step=7022.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  25%|██▌       | 308/1208 [09:01<26:23,  1.76s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=2.2e-5, train/loss_step=0.00407, global_step=7022.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  26%|██▌       | 309/1208 [09:02<26:19,  1.76s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=2.2e-5, train/loss_step=0.00407, global_step=7022.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  26%|██▌       | 309/1208 [09:02<26:19,  1.76s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0853, train/loss_vlb_step=0.000282, train/loss_step=0.0853, global_step=7023.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  26%|██▌       | 310/1208 [09:03<26:15,  1.75s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0853, train/loss_vlb_step=0.000282, train/loss_step=0.0853, global_step=7023.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  26%|██▌       | 310/1208 [09:03<26:15,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0962, train/loss_vlb_step=0.000317, train/loss_step=0.0962, global_step=7023.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  26%|██▌       | 311/1208 [09:04<26:11,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0962, train/loss_vlb_step=0.000317, train/loss_step=0.0962, global_step=7023.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  26%|██▌       | 311/1208 [09:04<26:11,  1.75s/it, loss=0.11, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000435, train/loss_step=0.128, global_step=7023.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  26%|██▌       | 312/1208 [09:07<26:13,  1.76s/it, loss=0.11, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000435, train/loss_step=0.128, global_step=7023.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  26%|██▌       | 312/1208 [09:07<26:13,  1.76s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.68e-5, train/loss_step=0.0159, global_step=7023.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  26%|██▌       | 313/1208 [09:08<26:09,  1.75s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.68e-5, train/loss_step=0.0159, global_step=7023.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  26%|██▌       | 313/1208 [09:08<26:09,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000384, train/loss_step=0.116, global_step=7024.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  26%|██▌       | 314/1208 [09:09<26:05,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000384, train/loss_step=0.116, global_step=7024.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  26%|██▌       | 314/1208 [09:09<26:05,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00216, train/loss_step=0.361, global_step=7024.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  26%|██▌       | 315/1208 [09:10<26:01,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00216, train/loss_step=0.361, global_step=7024.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  26%|██▌       | 315/1208 [09:10<26:01,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.9e-5, train/loss_step=0.0213, global_step=7024.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  26%|██▌       | 316/1208 [09:13<26:03,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.9e-5, train/loss_step=0.0213, global_step=7024.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  26%|██▌       | 316/1208 [09:13<26:03,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0606, train/loss_vlb_step=0.000207, train/loss_step=0.0606, global_step=7024.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  26%|██▌       | 317/1208 [09:14<25:59,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0606, train/loss_vlb_step=0.000207, train/loss_step=0.0606, global_step=7024.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  26%|██▌       | 317/1208 [09:14<25:59,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0613, train/loss_vlb_step=0.000211, train/loss_step=0.0613, global_step=7025.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  26%|██▋       | 318/1208 [09:15<25:55,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0613, train/loss_vlb_step=0.000211, train/loss_step=0.0613, global_step=7025.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  26%|██▋       | 318/1208 [09:15<25:55,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.0028, train/loss_step=0.396, global_step=7025.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  26%|██▋       | 319/1208 [09:16<25:51,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.0028, train/loss_step=0.396, global_step=7025.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  26%|██▋       | 319/1208 [09:16<25:51,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=0.0001, train/loss_step=0.024, global_step=7025.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  26%|██▋       | 320/1208 [09:19<25:52,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=0.0001, train/loss_step=0.024, global_step=7025.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  26%|██▋       | 320/1208 [09:19<25:53,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.75e-5, train/loss_step=0.0101, global_step=7025.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  27%|██▋       | 321/1208 [09:20<25:49,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.75e-5, train/loss_step=0.0101, global_step=7025.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  27%|██▋       | 321/1208 [09:20<25:49,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000115, train/loss_step=0.0288, global_step=7026.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  27%|██▋       | 322/1208 [09:21<25:45,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000115, train/loss_step=0.0288, global_step=7026.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  27%|██▋       | 322/1208 [09:21<25:45,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.88e-5, train/loss_step=0.0128, global_step=7026.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  27%|██▋       | 323/1208 [09:22<25:41,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.88e-5, train/loss_step=0.0128, global_step=7026.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  27%|██▋       | 323/1208 [09:22<25:41,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00675, train/loss_vlb_step=3.33e-5, train/loss_step=0.00675, global_step=7026.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  27%|██▋       | 324/1208 [09:25<25:43,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00675, train/loss_vlb_step=3.33e-5, train/loss_step=0.00675, global_step=7026.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  27%|██▋       | 324/1208 [09:25<25:43,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.05e-5, train/loss_step=0.0197, global_step=7026.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  27%|██▋       | 325/1208 [09:26<25:39,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.05e-5, train/loss_step=0.0197, global_step=7026.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  27%|██▋       | 325/1208 [09:26<25:39,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00221, train/loss_step=0.379, global_step=7027.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  27%|██▋       | 326/1208 [09:27<25:35,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00221, train/loss_step=0.379, global_step=7027.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  27%|██▋       | 326/1208 [09:27<25:35,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=5.98e-5, train/loss_step=0.0139, global_step=7027.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  27%|██▋       | 327/1208 [09:28<25:31,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=5.98e-5, train/loss_step=0.0139, global_step=7027.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  27%|██▋       | 327/1208 [09:28<25:31,  1.74s/it, loss=0.0991, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000466, train/loss_step=0.141, global_step=7027.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  27%|██▋       | 328/1208 [09:31<25:33,  1.74s/it, loss=0.0991, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000466, train/loss_step=0.141, global_step=7027.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  27%|██▋       | 328/1208 [09:31<25:33,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.525, train/loss_vlb_step=0.00907, train/loss_step=0.525, global_step=7027.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  27%|██▋       | 329/1208 [09:32<25:29,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.525, train/loss_vlb_step=0.00907, train/loss_step=0.525, global_step=7027.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  27%|██▋       | 329/1208 [09:32<25:29,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000919, train/loss_step=0.232, global_step=7028.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  27%|██▋       | 330/1208 [09:33<25:25,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000919, train/loss_step=0.232, global_step=7028.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  27%|██▋       | 330/1208 [09:33<25:25,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.05e-5, train/loss_step=0.00173, global_step=7028.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  27%|██▋       | 331/1208 [09:34<25:22,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.05e-5, train/loss_step=0.00173, global_step=7028.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  27%|██▋       | 331/1208 [09:34<25:22,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00192, train/loss_step=0.362, global_step=7028.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  27%|██▋       | 332/1208 [09:37<25:23,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00192, train/loss_step=0.362, global_step=7028.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  27%|██▋       | 332/1208 [09:37<25:23,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.53e-5, train/loss_step=0.012, global_step=7028.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  28%|██▊       | 333/1208 [09:38<25:19,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.53e-5, train/loss_step=0.012, global_step=7028.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  28%|██▊       | 333/1208 [09:38<25:19,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000593, train/loss_step=0.169, global_step=7029.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  28%|██▊       | 334/1208 [09:39<25:16,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000593, train/loss_step=0.169, global_step=7029.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  28%|██▊       | 334/1208 [09:39<25:16,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00582, train/loss_vlb_step=3.06e-5, train/loss_step=0.00582, global_step=7029.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  28%|██▊       | 335/1208 [09:40<25:12,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00582, train/loss_vlb_step=3.06e-5, train/loss_step=0.00582, global_step=7029.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  28%|██▊       | 335/1208 [09:40<25:12,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.00017, train/loss_step=0.0468, global_step=7029.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  28%|██▊       | 336/1208 [09:43<25:13,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.00017, train/loss_step=0.0468, global_step=7029.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  28%|██▊       | 336/1208 [09:43<25:13,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000839, train/loss_step=0.223, global_step=7029.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  28%|██▊       | 337/1208 [09:44<25:10,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000839, train/loss_step=0.223, global_step=7029.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  28%|██▊       | 337/1208 [09:44<25:10,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00136, train/loss_step=0.269, global_step=7030.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  28%|██▊       | 338/1208 [09:45<25:06,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00136, train/loss_step=0.269, global_step=7030.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  28%|██▊       | 338/1208 [09:45<25:06,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00129, train/loss_step=0.256, global_step=7030.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  28%|██▊       | 339/1208 [09:46<25:03,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00129, train/loss_step=0.256, global_step=7030.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  28%|██▊       | 339/1208 [09:46<25:03,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=1.39e-5, train/loss_step=0.00234, global_step=7030.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  28%|██▊       | 340/1208 [09:49<25:04,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=1.39e-5, train/loss_step=0.00234, global_step=7030.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  28%|██▊       | 340/1208 [09:49<25:04,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00804, train/loss_vlb_step=3.93e-5, train/loss_step=0.00804, global_step=7030.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  28%|██▊       | 341/1208 [09:50<25:00,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00804, train/loss_vlb_step=3.93e-5, train/loss_step=0.00804, global_step=7030.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  28%|██▊       | 341/1208 [09:50<25:00,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00137, train/loss_step=0.281, global_step=7031.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  28%|██▊       | 342/1208 [09:51<24:57,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00137, train/loss_step=0.281, global_step=7031.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  28%|██▊       | 342/1208 [09:51<24:57,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.000165, train/loss_step=0.0476, global_step=7031.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  28%|██▊       | 343/1208 [09:52<24:53,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.000165, train/loss_step=0.0476, global_step=7031.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  28%|██▊       | 343/1208 [09:52<24:53,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.62e-5, train/loss_step=0.00281, global_step=7031.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  28%|██▊       | 344/1208 [09:55<24:54,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.62e-5, train/loss_step=0.00281, global_step=7031.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  28%|██▊       | 344/1208 [09:55<24:54,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0502, train/loss_vlb_step=0.000177, train/loss_step=0.0502, global_step=7031.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  29%|██▊       | 345/1208 [09:56<24:51,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0502, train/loss_vlb_step=0.000177, train/loss_step=0.0502, global_step=7031.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  29%|██▊       | 345/1208 [09:56<24:51,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.26e-5, train/loss_step=0.00211, global_step=7032.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  29%|██▊       | 346/1208 [09:57<24:47,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.26e-5, train/loss_step=0.00211, global_step=7032.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  29%|██▊       | 346/1208 [09:57<24:47,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000158, train/loss_step=0.0457, global_step=7032.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  29%|██▊       | 347/1208 [09:58<24:44,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000158, train/loss_step=0.0457, global_step=7032.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  29%|██▊       | 347/1208 [09:58<24:44,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000763, train/loss_step=0.209, global_step=7032.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  29%|██▉       | 348/1208 [10:01<24:45,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000763, train/loss_step=0.209, global_step=7032.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  29%|██▉       | 348/1208 [10:01<24:45,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000114, train/loss_step=0.0301, global_step=7032.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  29%|██▉       | 349/1208 [10:02<24:41,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000114, train/loss_step=0.0301, global_step=7032.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  29%|██▉       | 349/1208 [10:02<24:41,  1.73s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0095, train/loss_vlb_step=4.36e-5, train/loss_step=0.0095, global_step=7033.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  29%|██▉       | 350/1208 [10:03<24:38,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0095, train/loss_vlb_step=4.36e-5, train/loss_step=0.0095, global_step=7033.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  29%|██▉       | 350/1208 [10:03<24:38,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000525, train/loss_step=0.154, global_step=7033.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  29%|██▉       | 351/1208 [10:04<24:35,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000525, train/loss_step=0.154, global_step=7033.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  29%|██▉       | 351/1208 [10:04<24:35,  1.72s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000108, train/loss_step=0.0281, global_step=7033.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  29%|██▉       | 352/1208 [10:06<24:36,  1.72s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000108, train/loss_step=0.0281, global_step=7033.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  29%|██▉       | 352/1208 [10:06<24:36,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000767, train/loss_step=0.202, global_step=7033.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  29%|██▉       | 353/1208 [10:08<24:32,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000767, train/loss_step=0.202, global_step=7033.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  29%|██▉       | 353/1208 [10:08<24:32,  1.72s/it, loss=0.0939, v_num=0, train/loss_simple_step=0.00433, train/loss_vlb_step=2.27e-5, train/loss_step=0.00433, global_step=7034.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  29%|██▉       | 354/1208 [10:09<24:29,  1.72s/it, loss=0.0939, v_num=0, train/loss_simple_step=0.00433, train/loss_vlb_step=2.27e-5, train/loss_step=0.00433, global_step=7034.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  29%|██▉       | 354/1208 [10:09<24:29,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000686, train/loss_step=0.193, global_step=7034.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  29%|██▉       | 355/1208 [10:10<24:25,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000686, train/loss_step=0.193, global_step=7034.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  29%|██▉       | 355/1208 [10:10<24:25,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000148, train/loss_step=0.0399, global_step=7034.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  29%|██▉       | 356/1208 [10:12<24:26,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000148, train/loss_step=0.0399, global_step=7034.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  29%|██▉       | 356/1208 [10:12<24:26,  1.72s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.57e-5, train/loss_step=0.0144, global_step=7034.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  30%|██▉       | 357/1208 [10:13<24:23,  1.72s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.57e-5, train/loss_step=0.0144, global_step=7034.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  30%|██▉       | 357/1208 [10:13<24:23,  1.72s/it, loss=0.0839, v_num=0, train/loss_simple_step=0.0987, train/loss_vlb_step=0.000326, train/loss_step=0.0987, global_step=7035.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  30%|██▉       | 358/1208 [10:14<24:20,  1.72s/it, loss=0.0839, v_num=0, train/loss_simple_step=0.0987, train/loss_vlb_step=0.000326, train/loss_step=0.0987, global_step=7035.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  30%|██▉       | 358/1208 [10:14<24:20,  1.72s/it, loss=0.0841, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00111, train/loss_step=0.259, global_step=7035.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  30%|██▉       | 359/1208 [10:15<24:16,  1.72s/it, loss=0.0841, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00111, train/loss_step=0.259, global_step=7035.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  30%|██▉       | 359/1208 [10:15<24:16,  1.72s/it, loss=0.0853, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000103, train/loss_step=0.0267, global_step=7035.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  30%|██▉       | 360/1208 [10:18<24:17,  1.72s/it, loss=0.0853, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000103, train/loss_step=0.0267, global_step=7035.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  30%|██▉       | 360/1208 [10:18<24:17,  1.72s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.0303, train/loss_vlb_step=0.000118, train/loss_step=0.0303, global_step=7035.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  30%|██▉       | 361/1208 [10:19<24:14,  1.72s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.0303, train/loss_vlb_step=0.000118, train/loss_step=0.0303, global_step=7035.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  30%|██▉       | 361/1208 [10:19<24:14,  1.72s/it, loss=0.0734, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=8.82e-5, train/loss_step=0.0222, global_step=7036.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  30%|██▉       | 362/1208 [10:20<24:10,  1.71s/it, loss=0.0734, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=8.82e-5, train/loss_step=0.0222, global_step=7036.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  30%|██▉       | 362/1208 [10:20<24:10,  1.71s/it, loss=0.0869, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00157, train/loss_step=0.318, global_step=7036.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  30%|███       | 363/1208 [10:21<24:07,  1.71s/it, loss=0.0869, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00157, train/loss_step=0.318, global_step=7036.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  30%|███       | 363/1208 [10:21<24:07,  1.71s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000441, train/loss_step=0.131, global_step=7036.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  30%|███       | 364/1208 [10:24<24:08,  1.72s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000441, train/loss_step=0.131, global_step=7036.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  30%|███       | 364/1208 [10:24<24:08,  1.72s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.0859, train/loss_vlb_step=0.000283, train/loss_step=0.0859, global_step=7036.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  30%|███       | 365/1208 [10:25<24:05,  1.71s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.0859, train/loss_vlb_step=0.000283, train/loss_step=0.0859, global_step=7036.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  30%|███       | 365/1208 [10:25<24:05,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000495, train/loss_step=0.147, global_step=7037.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  30%|███       | 366/1208 [10:26<24:01,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000495, train/loss_step=0.147, global_step=7037.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  30%|███       | 366/1208 [10:26<24:01,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000334, train/loss_step=0.101, global_step=7037.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  30%|███       | 367/1208 [10:27<23:58,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000334, train/loss_step=0.101, global_step=7037.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  30%|███       | 367/1208 [10:27<23:58,  1.71s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=8.88e-6, train/loss_step=0.00147, global_step=7037.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  30%|███       | 368/1208 [10:30<23:59,  1.71s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=8.88e-6, train/loss_step=0.00147, global_step=7037.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  30%|███       | 368/1208 [10:30<23:59,  1.71s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.0585, train/loss_vlb_step=0.000205, train/loss_step=0.0585, global_step=7037.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  31%|███       | 369/1208 [10:31<23:56,  1.71s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.0585, train/loss_vlb_step=0.000205, train/loss_step=0.0585, global_step=7037.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  31%|███       | 369/1208 [10:31<23:56,  1.71s/it, loss=0.0959, v_num=0, train/loss_simple_step=0.00339, train/loss_vlb_step=1.93e-5, train/loss_step=0.00339, global_step=7038.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  31%|███       | 370/1208 [10:32<23:52,  1.71s/it, loss=0.0959, v_num=0, train/loss_simple_step=0.00339, train/loss_vlb_step=1.93e-5, train/loss_step=0.00339, global_step=7038.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  31%|███       | 370/1208 [10:32<23:52,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00132, train/loss_step=0.335, global_step=7038.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]     Epoch 23:  31%|███       | 371/1208 [10:33<23:49,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00132, train/loss_step=0.335, global_step=7038.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  31%|███       | 371/1208 [10:33<23:49,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.00018, train/loss_step=0.0476, global_step=7038.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  31%|███       | 372/1208 [10:36<23:50,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.00018, train/loss_step=0.0476, global_step=7038.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  31%|███       | 372/1208 [10:36<23:50,  1.71s/it, loss=0.098, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000157, train/loss_step=0.0443, global_step=7038.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  31%|███       | 373/1208 [10:37<23:47,  1.71s/it, loss=0.098, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000157, train/loss_step=0.0443, global_step=7038.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  31%|███       | 373/1208 [10:37<23:47,  1.71s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.00993, train/loss_vlb_step=4.63e-5, train/loss_step=0.00993, global_step=7039.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  31%|███       | 374/1208 [10:38<23:43,  1.71s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.00993, train/loss_vlb_step=4.63e-5, train/loss_step=0.00993, global_step=7039.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  31%|███       | 374/1208 [10:38<23:43,  1.71s/it, loss=0.0892, v_num=0, train/loss_simple_step=0.00932, train/loss_vlb_step=4.35e-5, train/loss_step=0.00932, global_step=7039.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  31%|███       | 375/1208 [10:39<23:40,  1.71s/it, loss=0.0892, v_num=0, train/loss_simple_step=0.00932, train/loss_vlb_step=4.35e-5, train/loss_step=0.00932, global_step=7039.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  31%|███       | 375/1208 [10:39<23:40,  1.71s/it, loss=0.0894, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000165, train/loss_step=0.0449, global_step=7039.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  31%|███       | 376/1208 [10:42<23:41,  1.71s/it, loss=0.0894, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000165, train/loss_step=0.0449, global_step=7039.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  31%|███       | 376/1208 [10:42<23:41,  1.71s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=7.72e-5, train/loss_step=0.0189, global_step=7039.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  31%|███       | 377/1208 [10:43<23:38,  1.71s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=7.72e-5, train/loss_step=0.0189, global_step=7039.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  31%|███       | 377/1208 [10:43<23:38,  1.71s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000434, train/loss_step=0.132, global_step=7040.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  31%|███▏      | 378/1208 [10:44<23:35,  1.70s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000434, train/loss_step=0.132, global_step=7040.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  31%|███▏      | 378/1208 [10:44<23:35,  1.70s/it, loss=0.0796, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000105, train/loss_step=0.0254, global_step=7040.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  31%|███▏      | 379/1208 [10:45<23:31,  1.70s/it, loss=0.0796, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000105, train/loss_step=0.0254, global_step=7040.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  31%|███▏      | 379/1208 [10:45<23:31,  1.70s/it, loss=0.0832, v_num=0, train/loss_simple_step=0.0978, train/loss_vlb_step=0.000322, train/loss_step=0.0978, global_step=7040.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  31%|███▏      | 380/1208 [10:48<23:32,  1.71s/it, loss=0.0832, v_num=0, train/loss_simple_step=0.0978, train/loss_vlb_step=0.000322, train/loss_step=0.0978, global_step=7040.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  31%|███▏      | 380/1208 [10:48<23:32,  1.71s/it, loss=0.0818, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=1.69e-5, train/loss_step=0.00294, global_step=7040.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  32%|███▏      | 381/1208 [10:49<23:29,  1.70s/it, loss=0.0818, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=1.69e-5, train/loss_step=0.00294, global_step=7040.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  32%|███▏      | 381/1208 [10:49<23:29,  1.70s/it, loss=0.0808, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.08e-5, train/loss_step=0.00182, global_step=7041.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  32%|███▏      | 382/1208 [10:50<23:26,  1.70s/it, loss=0.0808, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.08e-5, train/loss_step=0.00182, global_step=7041.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  32%|███▏      | 382/1208 [10:50<23:26,  1.70s/it, loss=0.0745, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000698, train/loss_step=0.192, global_step=7041.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  32%|███▏      | 383/1208 [10:51<23:23,  1.70s/it, loss=0.0745, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000698, train/loss_step=0.192, global_step=7041.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  32%|███▏      | 383/1208 [10:51<23:23,  1.70s/it, loss=0.0689, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.32e-5, train/loss_step=0.0205, global_step=7041.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  32%|███▏      | 384/1208 [10:54<23:24,  1.70s/it, loss=0.0689, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.32e-5, train/loss_step=0.0205, global_step=7041.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  32%|███▏      | 384/1208 [10:54<23:24,  1.71s/it, loss=0.0648, v_num=0, train/loss_simple_step=0.00339, train/loss_vlb_step=1.85e-5, train/loss_step=0.00339, global_step=7041.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  32%|███▏      | 385/1208 [10:55<23:21,  1.70s/it, loss=0.0648, v_num=0, train/loss_simple_step=0.00339, train/loss_vlb_step=1.85e-5, train/loss_step=0.00339, global_step=7041.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  32%|███▏      | 385/1208 [10:55<23:21,  1.70s/it, loss=0.0652, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000508, train/loss_step=0.154, global_step=7042.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  32%|███▏      | 386/1208 [10:56<23:18,  1.70s/it, loss=0.0652, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000508, train/loss_step=0.154, global_step=7042.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  32%|███▏      | 386/1208 [10:56<23:18,  1.70s/it, loss=0.0732, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00108, train/loss_step=0.262, global_step=7042.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  32%|███▏      | 387/1208 [10:57<23:15,  1.70s/it, loss=0.0732, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00108, train/loss_step=0.262, global_step=7042.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  32%|███▏      | 387/1208 [10:57<23:15,  1.70s/it, loss=0.074, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.37e-5, train/loss_step=0.0174, global_step=7042.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  32%|███▏      | 388/1208 [11:01<23:17,  1.70s/it, loss=0.074, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.37e-5, train/loss_step=0.0174, global_step=7042.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  32%|███▏      | 388/1208 [11:01<23:17,  1.70s/it, loss=0.0737, v_num=0, train/loss_simple_step=0.0529, train/loss_vlb_step=0.000179, train/loss_step=0.0529, global_step=7042.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  32%|███▏      | 389/1208 [11:02<23:14,  1.70s/it, loss=0.0737, v_num=0, train/loss_simple_step=0.0529, train/loss_vlb_step=0.000179, train/loss_step=0.0529, global_step=7042.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  32%|███▏      | 389/1208 [11:02<23:14,  1.70s/it, loss=0.0788, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000344, train/loss_step=0.104, global_step=7043.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  32%|███▏      | 390/1208 [11:03<23:10,  1.70s/it, loss=0.0788, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000344, train/loss_step=0.104, global_step=7043.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  32%|███▏      | 390/1208 [11:03<23:10,  1.70s/it, loss=0.0636, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000115, train/loss_step=0.0311, global_step=7043.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  32%|███▏      | 391/1208 [11:04<23:07,  1.70s/it, loss=0.0636, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000115, train/loss_step=0.0311, global_step=7043.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  32%|███▏      | 391/1208 [11:04<23:07,  1.70s/it, loss=0.0724, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000789, train/loss_step=0.224, global_step=7043.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  32%|███▏      | 392/1208 [11:07<23:09,  1.70s/it, loss=0.0724, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000789, train/loss_step=0.224, global_step=7043.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  32%|███▏      | 392/1208 [11:07<23:09,  1.70s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.421, train/loss_vlb_step=0.00365, train/loss_step=0.421, global_step=7043.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  33%|███▎      | 393/1208 [11:08<23:06,  1.70s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.421, train/loss_vlb_step=0.00365, train/loss_step=0.421, global_step=7043.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  33%|███▎      | 393/1208 [11:08<23:06,  1.70s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.0986, train/loss_vlb_step=0.000325, train/loss_step=0.0986, global_step=7044.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  33%|███▎      | 394/1208 [11:09<23:03,  1.70s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.0986, train/loss_vlb_step=0.000325, train/loss_step=0.0986, global_step=7044.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  33%|███▎      | 394/1208 [11:09<23:03,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000853, train/loss_step=0.215, global_step=7044.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  33%|███▎      | 395/1208 [11:10<23:00,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000853, train/loss_step=0.215, global_step=7044.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  33%|███▎      | 395/1208 [11:10<23:00,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00168, train/loss_step=0.330, global_step=7044.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  33%|███▎      | 396/1208 [11:13<23:01,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00168, train/loss_step=0.330, global_step=7044.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  33%|███▎      | 396/1208 [11:13<23:01,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.510, train/loss_vlb_step=0.00432, train/loss_step=0.510, global_step=7044.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  33%|███▎      | 397/1208 [11:14<22:58,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.510, train/loss_vlb_step=0.00432, train/loss_step=0.510, global_step=7044.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  33%|███▎      | 397/1208 [11:14<22:58,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00873, train/loss_vlb_step=3.92e-5, train/loss_step=0.00873, global_step=7045.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  33%|███▎      | 398/1208 [11:15<22:55,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00873, train/loss_vlb_step=3.92e-5, train/loss_step=0.00873, global_step=7045.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  33%|███▎      | 398/1208 [11:15<22:55,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00421, train/loss_step=0.458, global_step=7045.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]     Epoch 23:  33%|███▎      | 399/1208 [11:16<22:52,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00421, train/loss_step=0.458, global_step=7045.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  33%|███▎      | 399/1208 [11:16<22:52,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00256, train/loss_step=0.347, global_step=7045.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  33%|███▎      | 400/1208 [11:20<22:53,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00256, train/loss_step=0.347, global_step=7045.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  33%|███▎      | 400/1208 [11:20<22:53,  1.70s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=8.89e-5, train/loss_step=0.0221, global_step=7045.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  33%|███▎      | 401/1208 [11:21<22:50,  1.70s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=8.89e-5, train/loss_step=0.0221, global_step=7045.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  33%|███▎      | 401/1208 [11:21<22:50,  1.70s/it, loss=0.174, v_num=0, train/loss_simple_step=0.004, train/loss_vlb_step=2.11e-5, train/loss_step=0.004, global_step=7046.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  33%|███▎      | 402/1208 [11:22<22:47,  1.70s/it, loss=0.174, v_num=0, train/loss_simple_step=0.004, train/loss_vlb_step=2.11e-5, train/loss_step=0.004, global_step=7046.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  33%|███▎      | 402/1208 [11:22<22:47,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.74e-5, train/loss_step=0.0103, global_step=7046.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  33%|███▎      | 403/1208 [11:23<22:44,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.74e-5, train/loss_step=0.0103, global_step=7046.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  33%|███▎      | 403/1208 [11:23<22:44,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.037, train/loss_vlb_step=0.000133, train/loss_step=0.037, global_step=7046.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  33%|███▎      | 404/1208 [11:26<22:46,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.037, train/loss_vlb_step=0.000133, train/loss_step=0.037, global_step=7046.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  33%|███▎      | 404/1208 [11:26<22:46,  1.70s/it, loss=0.18, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.0016, train/loss_step=0.296, global_step=7046.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  34%|███▎      | 405/1208 [11:27<22:43,  1.70s/it, loss=0.18, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.0016, train/loss_step=0.296, global_step=7046.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  34%|███▎      | 405/1208 [11:27<22:43,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0924, train/loss_vlb_step=0.000307, train/loss_step=0.0924, global_step=7047.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  34%|███▎      | 406/1208 [11:28<22:40,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0924, train/loss_vlb_step=0.000307, train/loss_step=0.0924, global_step=7047.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  34%|███▎      | 406/1208 [11:28<22:40,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000607, train/loss_step=0.172, global_step=7047.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  34%|███▎      | 407/1208 [11:29<22:37,  1.69s/it, loss=0.173, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000607, train/loss_step=0.172, global_step=7047.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  34%|███▎      | 407/1208 [11:29<22:37,  1.69s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000138, train/loss_step=0.0388, global_step=7047.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  34%|███▍      | 408/1208 [11:32<22:38,  1.70s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000138, train/loss_step=0.0388, global_step=7047.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  34%|███▍      | 408/1208 [11:32<22:38,  1.70s/it, loss=0.206, v_num=0, train/loss_simple_step=0.690, train/loss_vlb_step=0.0588, train/loss_step=0.690, global_step=7047.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  34%|███▍      | 409/1208 [11:33<22:35,  1.70s/it, loss=0.206, v_num=0, train/loss_simple_step=0.690, train/loss_vlb_step=0.0588, train/loss_step=0.690, global_step=7047.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  34%|███▍      | 409/1208 [11:33<22:35,  1.70s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.00016, train/loss_step=0.0459, global_step=7048.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  34%|███▍      | 410/1208 [11:34<22:32,  1.69s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.00016, train/loss_step=0.0459, global_step=7048.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  34%|███▍      | 410/1208 [11:34<22:32,  1.69s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000135, train/loss_step=0.0358, global_step=7048.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  34%|███▍      | 411/1208 [11:35<22:29,  1.69s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000135, train/loss_step=0.0358, global_step=7048.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  34%|███▍      | 411/1208 [11:35<22:29,  1.69s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00667, train/loss_vlb_step=3.39e-5, train/loss_step=0.00667, global_step=7048.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  34%|███▍      | 412/1208 [11:39<22:30,  1.70s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00667, train/loss_vlb_step=3.39e-5, train/loss_step=0.00667, global_step=7048.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  34%|███▍      | 412/1208 [11:39<22:30,  1.70s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0635, train/loss_vlb_step=0.000218, train/loss_step=0.0635, global_step=7048.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  34%|███▍      | 413/1208 [11:40<22:27,  1.70s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0635, train/loss_vlb_step=0.000218, train/loss_step=0.0635, global_step=7048.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  34%|███▍      | 413/1208 [11:40<22:27,  1.70s/it, loss=0.192, v_num=0, train/loss_simple_step=0.461, train/loss_vlb_step=0.00395, train/loss_step=0.461, global_step=7049.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  34%|███▍      | 414/1208 [11:41<22:24,  1.69s/it, loss=0.192, v_num=0, train/loss_simple_step=0.461, train/loss_vlb_step=0.00395, train/loss_step=0.461, global_step=7049.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  34%|███▍      | 414/1208 [11:41<22:24,  1.69s/it, loss=0.187, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000334, train/loss_step=0.102, global_step=7049.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  34%|███▍      | 415/1208 [11:42<22:21,  1.69s/it, loss=0.187, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000334, train/loss_step=0.102, global_step=7049.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  34%|███▍      | 415/1208 [11:42<22:21,  1.69s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.34e-5, train/loss_step=0.0205, global_step=7049.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  34%|███▍      | 416/1208 [11:45<22:23,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.34e-5, train/loss_step=0.0205, global_step=7049.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  34%|███▍      | 416/1208 [11:45<22:23,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.34e-5, train/loss_step=0.00222, global_step=7049.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  35%|███▍      | 417/1208 [11:46<22:20,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.34e-5, train/loss_step=0.00222, global_step=7049.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  35%|███▍      | 417/1208 [11:46<22:20,  1.69s/it, loss=0.157, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.00102, train/loss_step=0.235, global_step=7050.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  35%|███▍      | 418/1208 [11:47<22:17,  1.69s/it, loss=0.157, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.00102, train/loss_step=0.235, global_step=7050.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  35%|███▍      | 418/1208 [11:47<22:17,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000333, train/loss_step=0.101, global_step=7050.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  35%|███▍      | 419/1208 [11:48<22:14,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000333, train/loss_step=0.101, global_step=7050.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  35%|███▍      | 419/1208 [11:48<22:14,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00237, train/loss_step=0.363, global_step=7050.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  35%|███▍      | 420/1208 [11:51<22:15,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00237, train/loss_step=0.363, global_step=7050.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  35%|███▍      | 420/1208 [11:51<22:15,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00119, train/loss_step=0.280, global_step=7050.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  35%|███▍      | 421/1208 [11:52<22:12,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00119, train/loss_step=0.280, global_step=7050.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  35%|███▍      | 421/1208 [11:52<22:12,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00151, train/loss_step=0.324, global_step=7051.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  35%|███▍      | 422/1208 [11:53<22:09,  1.69s/it, loss=0.169, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00151, train/loss_step=0.324, global_step=7051.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  35%|███▍      | 422/1208 [11:53<22:09,  1.69s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0531, train/loss_vlb_step=0.000182, train/loss_step=0.0531, global_step=7051.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  35%|███▌      | 423/1208 [11:54<22:06,  1.69s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0531, train/loss_vlb_step=0.000182, train/loss_step=0.0531, global_step=7051.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  35%|███▌      | 423/1208 [11:54<22:06,  1.69s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.24e-5, train/loss_step=0.0232, global_step=7051.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  35%|███▌      | 424/1208 [11:58<22:07,  1.69s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.24e-5, train/loss_step=0.0232, global_step=7051.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  35%|███▌      | 424/1208 [11:58<22:07,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0753, train/loss_vlb_step=0.000248, train/loss_step=0.0753, global_step=7051.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  35%|███▌      | 425/1208 [11:59<22:05,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0753, train/loss_vlb_step=0.000248, train/loss_step=0.0753, global_step=7051.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  35%|███▌      | 425/1208 [11:59<22:05,  1.69s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.05e-5, train/loss_step=0.00175, global_step=7052.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  35%|███▌      | 426/1208 [12:00<22:02,  1.69s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.05e-5, train/loss_step=0.00175, global_step=7052.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  35%|███▌      | 426/1208 [12:00<22:02,  1.69s/it, loss=0.155, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000614, train/loss_step=0.171, global_step=7052.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  35%|███▌      | 427/1208 [12:01<21:59,  1.69s/it, loss=0.155, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000614, train/loss_step=0.171, global_step=7052.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  35%|███▌      | 427/1208 [12:01<21:59,  1.69s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.22e-5, train/loss_step=0.0168, global_step=7052.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  35%|███▌      | 428/1208 [12:04<22:00,  1.69s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.22e-5, train/loss_step=0.0168, global_step=7052.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  35%|███▌      | 428/1208 [12:04<22:00,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000114, train/loss_step=0.0308, global_step=7052.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  36%|███▌      | 429/1208 [12:05<21:57,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000114, train/loss_step=0.0308, global_step=7052.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  36%|███▌      | 429/1208 [12:05<21:57,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000687, train/loss_step=0.192, global_step=7053.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  36%|███▌      | 430/1208 [12:06<21:54,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000687, train/loss_step=0.192, global_step=7053.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  36%|███▌      | 430/1208 [12:06<21:54,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0594, train/loss_vlb_step=0.000208, train/loss_step=0.0594, global_step=7053.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  36%|███▌      | 431/1208 [12:07<21:51,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0594, train/loss_vlb_step=0.000208, train/loss_step=0.0594, global_step=7053.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  36%|███▌      | 431/1208 [12:07<21:51,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.29e-5, train/loss_step=0.0116, global_step=7053.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  36%|███▌      | 432/1208 [12:10<21:52,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.29e-5, train/loss_step=0.0116, global_step=7053.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  36%|███▌      | 432/1208 [12:10<21:52,  1.69s/it, loss=0.145, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00228, train/loss_step=0.376, global_step=7053.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  36%|███▌      | 433/1208 [12:11<21:49,  1.69s/it, loss=0.145, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00228, train/loss_step=0.376, global_step=7053.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  36%|███▌      | 433/1208 [12:11<21:49,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.44e-5, train/loss_step=0.0187, global_step=7054.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  36%|███▌      | 434/1208 [12:12<21:47,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.44e-5, train/loss_step=0.0187, global_step=7054.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  36%|███▌      | 434/1208 [12:12<21:47,  1.69s/it, loss=0.119, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.22e-5, train/loss_step=0.014, global_step=7054.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  36%|███▌      | 435/1208 [12:13<21:44,  1.69s/it, loss=0.119, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.22e-5, train/loss_step=0.014, global_step=7054.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  36%|███▌      | 435/1208 [12:13<21:44,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000666, train/loss_step=0.196, global_step=7054.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  36%|███▌      | 436/1208 [12:17<21:45,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000666, train/loss_step=0.196, global_step=7054.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  36%|███▌      | 436/1208 [12:17<21:45,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0472, train/loss_vlb_step=0.000164, train/loss_step=0.0472, global_step=7054.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  36%|███▌      | 437/1208 [12:18<21:42,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0472, train/loss_vlb_step=0.000164, train/loss_step=0.0472, global_step=7054.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  36%|███▌      | 437/1208 [12:18<21:42,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00311, train/loss_step=0.434, global_step=7055.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  36%|███▋      | 438/1208 [12:19<21:39,  1.69s/it, loss=0.139, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00311, train/loss_step=0.434, global_step=7055.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  36%|███▋      | 438/1208 [12:19<21:39,  1.69s/it, loss=0.162, v_num=0, train/loss_simple_step=0.551, train/loss_vlb_step=0.00878, train/loss_step=0.551, global_step=7055.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  36%|███▋      | 439/1208 [12:20<21:36,  1.69s/it, loss=0.162, v_num=0, train/loss_simple_step=0.551, train/loss_vlb_step=0.00878, train/loss_step=0.551, global_step=7055.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  36%|███▋      | 439/1208 [12:20<21:36,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00796, train/loss_vlb_step=3.76e-5, train/loss_step=0.00796, global_step=7055.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  36%|███▋      | 440/1208 [12:23<21:37,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00796, train/loss_vlb_step=3.76e-5, train/loss_step=0.00796, global_step=7055.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  36%|███▋      | 440/1208 [12:23<21:37,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00626, train/loss_vlb_step=3.13e-5, train/loss_step=0.00626, global_step=7055.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  37%|███▋      | 441/1208 [12:24<21:34,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00626, train/loss_vlb_step=3.13e-5, train/loss_step=0.00626, global_step=7055.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  37%|███▋      | 441/1208 [12:24<21:34,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=7056.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  37%|███▋      | 442/1208 [12:25<21:32,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=7056.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  37%|███▋      | 442/1208 [12:25<21:32,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00152, train/loss_step=0.312, global_step=7056.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  37%|███▋      | 443/1208 [12:26<21:29,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00152, train/loss_step=0.312, global_step=7056.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  37%|███▋      | 443/1208 [12:26<21:29,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=8.97e-6, train/loss_step=0.00147, global_step=7056.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  37%|███▋      | 444/1208 [12:29<21:30,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=8.97e-6, train/loss_step=0.00147, global_step=7056.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  37%|███▋      | 444/1208 [12:29<21:30,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000132, train/loss_step=0.0344, global_step=7056.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  37%|███▋      | 445/1208 [12:30<21:27,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000132, train/loss_step=0.0344, global_step=7056.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  37%|███▋      | 445/1208 [12:30<21:27,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.000214, train/loss_step=0.0615, global_step=7057.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  37%|███▋      | 446/1208 [12:31<21:24,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.000214, train/loss_step=0.0615, global_step=7057.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  37%|███▋      | 446/1208 [12:31<21:24,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7e-5, train/loss_step=0.0163, global_step=7057.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  37%|███▋      | 447/1208 [12:32<21:21,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7e-5, train/loss_step=0.0163, global_step=7057.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  37%|███▋      | 447/1208 [12:32<21:21,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00516, train/loss_vlb_step=2.66e-5, train/loss_step=0.00516, global_step=7057.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  37%|███▋      | 448/1208 [12:36<21:22,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00516, train/loss_vlb_step=2.66e-5, train/loss_step=0.00516, global_step=7057.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  37%|███▋      | 448/1208 [12:36<21:22,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0546, train/loss_vlb_step=0.000184, train/loss_step=0.0546, global_step=7057.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  37%|███▋      | 449/1208 [12:37<21:20,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0546, train/loss_vlb_step=0.000184, train/loss_step=0.0546, global_step=7057.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  37%|███▋      | 449/1208 [12:37<21:20,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00418, train/loss_step=0.425, global_step=7058.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  37%|███▋      | 450/1208 [12:38<21:17,  1.69s/it, loss=0.137, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00418, train/loss_step=0.425, global_step=7058.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  37%|███▋      | 450/1208 [12:38<21:17,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00182, train/loss_step=0.338, global_step=7058.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  37%|███▋      | 451/1208 [12:39<21:14,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00182, train/loss_step=0.338, global_step=7058.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  37%|███▋      | 451/1208 [12:39<21:14,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.00011, train/loss_step=0.0281, global_step=7058.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  37%|███▋      | 452/1208 [12:42<21:15,  1.69s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.00011, train/loss_step=0.0281, global_step=7058.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  37%|███▋      | 452/1208 [12:42<21:15,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.42e-5, train/loss_step=0.00257, global_step=7058.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  38%|███▊      | 453/1208 [12:43<21:12,  1.69s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.42e-5, train/loss_step=0.00257, global_step=7058.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  38%|███▊      | 453/1208 [12:43<21:12,  1.69s/it, loss=0.143, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000737, train/loss_step=0.205, global_step=7059.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  38%|███▊      | 454/1208 [12:44<21:09,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000737, train/loss_step=0.205, global_step=7059.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  38%|███▊      | 454/1208 [12:44<21:09,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.67e-5, train/loss_step=0.00289, global_step=7059.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  38%|███▊      | 455/1208 [12:45<21:07,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.67e-5, train/loss_step=0.00289, global_step=7059.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  38%|███▊      | 455/1208 [12:45<21:07,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.544, train/loss_vlb_step=0.0114, train/loss_step=0.544, global_step=7059.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]      Epoch 23:  38%|███▊      | 456/1208 [12:48<21:07,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.544, train/loss_vlb_step=0.0114, train/loss_step=0.544, global_step=7059.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  38%|███▊      | 456/1208 [12:48<21:07,  1.69s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0734, train/loss_vlb_step=0.000247, train/loss_step=0.0734, global_step=7059.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  38%|███▊      | 457/1208 [12:49<21:05,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0734, train/loss_vlb_step=0.000247, train/loss_step=0.0734, global_step=7059.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  38%|███▊      | 457/1208 [12:49<21:05,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000139, train/loss_step=0.0376, global_step=7060.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  38%|███▊      | 458/1208 [12:50<21:02,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000139, train/loss_step=0.0376, global_step=7060.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  38%|███▊      | 458/1208 [12:50<21:02,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0839, train/loss_vlb_step=0.000277, train/loss_step=0.0839, global_step=7060.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  38%|███▊      | 459/1208 [12:51<20:59,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0839, train/loss_vlb_step=0.000277, train/loss_step=0.0839, global_step=7060.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  38%|███▊      | 459/1208 [12:51<20:59,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0618, train/loss_vlb_step=0.000217, train/loss_step=0.0618, global_step=7060.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  38%|███▊      | 460/1208 [12:55<21:00,  1.69s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0618, train/loss_vlb_step=0.000217, train/loss_step=0.0618, global_step=7060.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  38%|███▊      | 460/1208 [12:55<21:00,  1.69s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0271, train/loss_vlb_step=0.000106, train/loss_step=0.0271, global_step=7060.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  38%|███▊      | 461/1208 [12:56<20:57,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0271, train/loss_vlb_step=0.000106, train/loss_step=0.0271, global_step=7060.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  38%|███▊      | 461/1208 [12:56<20:57,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000494, train/loss_step=0.145, global_step=7061.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  38%|███▊      | 462/1208 [12:57<20:55,  1.68s/it, loss=0.123, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000494, train/loss_step=0.145, global_step=7061.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  38%|███▊      | 462/1208 [12:57<20:55,  1.68s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.18e-5, train/loss_step=0.00202, global_step=7061.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  38%|███▊      | 463/1208 [12:58<20:52,  1.68s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.18e-5, train/loss_step=0.00202, global_step=7061.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  38%|███▊      | 463/1208 [12:58<20:52,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000103, train/loss_step=0.0262, global_step=7061.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  38%|███▊      | 464/1208 [13:01<20:52,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000103, train/loss_step=0.0262, global_step=7061.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  38%|███▊      | 464/1208 [13:01<20:53,  1.68s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.72e-5, train/loss_step=0.0182, global_step=7061.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  38%|███▊      | 465/1208 [13:02<20:50,  1.68s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.72e-5, train/loss_step=0.0182, global_step=7061.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  38%|███▊      | 465/1208 [13:02<20:50,  1.68s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.000215, train/loss_step=0.0615, global_step=7062.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  39%|███▊      | 466/1208 [13:03<20:47,  1.68s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0615, train/loss_vlb_step=0.000215, train/loss_step=0.0615, global_step=7062.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  39%|███▊      | 466/1208 [13:03<20:47,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.000123, train/loss_step=0.0322, global_step=7062.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  39%|███▊      | 467/1208 [13:04<20:44,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.000123, train/loss_step=0.0322, global_step=7062.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  39%|███▊      | 467/1208 [13:04<20:44,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.49e-5, train/loss_step=0.0146, global_step=7062.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  39%|███▊      | 468/1208 [13:07<20:45,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.49e-5, train/loss_step=0.0146, global_step=7062.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  39%|███▊      | 468/1208 [13:07<20:45,  1.68s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=2.04e-5, train/loss_step=0.00384, global_step=7062.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  39%|███▉      | 469/1208 [13:08<20:42,  1.68s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=2.04e-5, train/loss_step=0.00384, global_step=7062.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  39%|███▉      | 469/1208 [13:08<20:42,  1.68s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.00566, train/loss_vlb_step=2.94e-5, train/loss_step=0.00566, global_step=7063.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  39%|███▉      | 470/1208 [13:09<20:40,  1.68s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.00566, train/loss_vlb_step=2.94e-5, train/loss_step=0.00566, global_step=7063.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  39%|███▉      | 470/1208 [13:09<20:40,  1.68s/it, loss=0.0725, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000245, train/loss_step=0.0732, global_step=7063.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  39%|███▉      | 471/1208 [13:10<20:37,  1.68s/it, loss=0.0725, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.000245, train/loss_step=0.0732, global_step=7063.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  39%|███▉      | 471/1208 [13:10<20:37,  1.68s/it, loss=0.072, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=8.43e-5, train/loss_step=0.0195, global_step=7063.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  39%|███▉      | 472/1208 [13:14<20:38,  1.68s/it, loss=0.072, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=8.43e-5, train/loss_step=0.0195, global_step=7063.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  39%|███▉      | 472/1208 [13:14<20:38,  1.68s/it, loss=0.0738, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000142, train/loss_step=0.0378, global_step=7063.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  39%|███▉      | 473/1208 [13:15<20:35,  1.68s/it, loss=0.0738, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000142, train/loss_step=0.0378, global_step=7063.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  39%|███▉      | 473/1208 [13:15<20:35,  1.68s/it, loss=0.0643, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.64e-5, train/loss_step=0.0155, global_step=7064.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  39%|███▉      | 474/1208 [13:16<20:32,  1.68s/it, loss=0.0643, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.64e-5, train/loss_step=0.0155, global_step=7064.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  39%|███▉      | 474/1208 [13:16<20:32,  1.68s/it, loss=0.0645, v_num=0, train/loss_simple_step=0.00618, train/loss_vlb_step=3.14e-5, train/loss_step=0.00618, global_step=7064.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  39%|███▉      | 475/1208 [13:17<20:30,  1.68s/it, loss=0.0645, v_num=0, train/loss_simple_step=0.00618, train/loss_vlb_step=3.14e-5, train/loss_step=0.00618, global_step=7064.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  39%|███▉      | 475/1208 [13:17<20:30,  1.68s/it, loss=0.0556, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00224, train/loss_step=0.368, global_step=7064.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  39%|███▉      | 476/1208 [13:20<20:30,  1.68s/it, loss=0.0556, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00224, train/loss_step=0.368, global_step=7064.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  39%|███▉      | 476/1208 [13:20<20:30,  1.68s/it, loss=0.0782, v_num=0, train/loss_simple_step=0.524, train/loss_vlb_step=0.014, train/loss_step=0.524, global_step=7064.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  39%|███▉      | 477/1208 [13:21<20:28,  1.68s/it, loss=0.0782, v_num=0, train/loss_simple_step=0.524, train/loss_vlb_step=0.014, train/loss_step=0.524, global_step=7064.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  39%|███▉      | 477/1208 [13:21<20:28,  1.68s/it, loss=0.098, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00426, train/loss_step=0.434, global_step=7065.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  40%|███▉      | 478/1208 [13:22<20:25,  1.68s/it, loss=0.098, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00426, train/loss_step=0.434, global_step=7065.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  40%|███▉      | 478/1208 [13:22<20:25,  1.68s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.75e-5, train/loss_step=0.0185, global_step=7065.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  40%|███▉      | 479/1208 [13:23<20:23,  1.68s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.75e-5, train/loss_step=0.0185, global_step=7065.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  40%|███▉      | 479/1208 [13:23<20:23,  1.68s/it, loss=0.0923, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.3e-5, train/loss_step=0.0143, global_step=7065.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  40%|███▉      | 480/1208 [13:26<20:23,  1.68s/it, loss=0.0923, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.3e-5, train/loss_step=0.0143, global_step=7065.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  40%|███▉      | 480/1208 [13:26<20:23,  1.68s/it, loss=0.094, v_num=0, train/loss_simple_step=0.0609, train/loss_vlb_step=0.00021, train/loss_step=0.0609, global_step=7065.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  40%|███▉      | 481/1208 [13:27<20:21,  1.68s/it, loss=0.094, v_num=0, train/loss_simple_step=0.0609, train/loss_vlb_step=0.00021, train/loss_step=0.0609, global_step=7065.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  40%|███▉      | 481/1208 [13:27<20:21,  1.68s/it, loss=0.0898, v_num=0, train/loss_simple_step=0.0603, train/loss_vlb_step=0.000206, train/loss_step=0.0603, global_step=7066.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  40%|███▉      | 482/1208 [13:28<20:18,  1.68s/it, loss=0.0898, v_num=0, train/loss_simple_step=0.0603, train/loss_vlb_step=0.000206, train/loss_step=0.0603, global_step=7066.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  40%|███▉      | 482/1208 [13:28<20:18,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.444, train/loss_vlb_step=0.00442, train/loss_step=0.444, global_step=7066.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  40%|███▉      | 483/1208 [13:29<20:15,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.444, train/loss_vlb_step=0.00442, train/loss_step=0.444, global_step=7066.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  40%|███▉      | 483/1208 [13:29<20:15,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.00413, train/loss_step=0.460, global_step=7066.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  40%|████      | 484/1208 [13:33<20:16,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.00413, train/loss_step=0.460, global_step=7066.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  40%|████      | 484/1208 [13:33<20:16,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000501, train/loss_step=0.150, global_step=7066.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  40%|████      | 485/1208 [13:34<20:13,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000501, train/loss_step=0.150, global_step=7066.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  40%|████      | 485/1208 [13:34<20:13,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.77e-5, train/loss_step=0.0125, global_step=7067.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  40%|████      | 486/1208 [13:35<20:11,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.77e-5, train/loss_step=0.0125, global_step=7067.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  40%|████      | 486/1208 [13:35<20:11,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.0011, train/loss_step=0.249, global_step=7067.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  40%|████      | 487/1208 [13:36<20:08,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.0011, train/loss_step=0.249, global_step=7067.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  40%|████      | 487/1208 [13:36<20:08,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0049, train/loss_vlb_step=2.57e-5, train/loss_step=0.0049, global_step=7067.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  40%|████      | 488/1208 [13:39<20:09,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0049, train/loss_vlb_step=2.57e-5, train/loss_step=0.0049, global_step=7067.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  40%|████      | 488/1208 [13:39<20:09,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.45e-5, train/loss_step=0.00253, global_step=7067.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  40%|████      | 489/1208 [13:40<20:06,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.45e-5, train/loss_step=0.00253, global_step=7067.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  40%|████      | 489/1208 [13:40<20:06,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0745, train/loss_vlb_step=0.000251, train/loss_step=0.0745, global_step=7068.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  41%|████      | 490/1208 [13:41<20:03,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0745, train/loss_vlb_step=0.000251, train/loss_step=0.0745, global_step=7068.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  41%|████      | 490/1208 [13:41<20:03,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000144, train/loss_step=0.0387, global_step=7068.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  41%|████      | 491/1208 [13:42<20:01,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000144, train/loss_step=0.0387, global_step=7068.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  41%|████      | 491/1208 [13:42<20:01,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000153, train/loss_step=0.0437, global_step=7068.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  41%|████      | 492/1208 [13:45<20:01,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000153, train/loss_step=0.0437, global_step=7068.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  41%|████      | 492/1208 [13:45<20:01,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00795, train/loss_vlb_step=3.82e-5, train/loss_step=0.00795, global_step=7068.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  41%|████      | 493/1208 [13:46<19:59,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00795, train/loss_vlb_step=3.82e-5, train/loss_step=0.00795, global_step=7068.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  41%|████      | 493/1208 [13:46<19:59,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=1.76e-5, train/loss_step=0.00298, global_step=7069.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  41%|████      | 494/1208 [13:48<19:56,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=1.76e-5, train/loss_step=0.00298, global_step=7069.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  41%|████      | 494/1208 [13:48<19:56,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00674, train/loss_vlb_step=3.29e-5, train/loss_step=0.00674, global_step=7069.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  41%|████      | 495/1208 [13:49<19:54,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00674, train/loss_vlb_step=3.29e-5, train/loss_step=0.00674, global_step=7069.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  41%|████      | 495/1208 [13:49<19:54,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.000146, train/loss_step=0.0417, global_step=7069.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  41%|████      | 496/1208 [13:52<19:54,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.000146, train/loss_step=0.0417, global_step=7069.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  41%|████      | 496/1208 [13:52<19:54,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000421, train/loss_step=0.126, global_step=7069.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  41%|████      | 497/1208 [13:53<19:52,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000421, train/loss_step=0.126, global_step=7069.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  41%|████      | 497/1208 [13:53<19:52,  1.68s/it, loss=0.106, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00139, train/loss_step=0.308, global_step=7070.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  41%|████      | 498/1208 [13:54<19:49,  1.68s/it, loss=0.106, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00139, train/loss_step=0.308, global_step=7070.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  41%|████      | 498/1208 [13:54<19:49,  1.68s/it, loss=0.107, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000113, train/loss_step=0.029, global_step=7070.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  41%|████▏     | 499/1208 [13:55<19:46,  1.67s/it, loss=0.107, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000113, train/loss_step=0.029, global_step=7070.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  41%|████▏     | 499/1208 [13:55<19:46,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000394, train/loss_step=0.120, global_step=7070.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  41%|████▏     | 500/1208 [13:58<19:47,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000394, train/loss_step=0.120, global_step=7070.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  41%|████▏     | 500/1208 [13:58<19:47,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.416, train/loss_vlb_step=0.0044, train/loss_step=0.416, global_step=7070.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  41%|████▏     | 501/1208 [13:59<19:44,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.416, train/loss_vlb_step=0.0044, train/loss_step=0.416, global_step=7070.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  41%|████▏     | 501/1208 [13:59<19:44,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00502, train/loss_vlb_step=2.6e-5, train/loss_step=0.00502, global_step=7071.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  42%|████▏     | 502/1208 [14:00<19:42,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00502, train/loss_vlb_step=2.6e-5, train/loss_step=0.00502, global_step=7071.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  42%|████▏     | 502/1208 [14:00<19:42,  1.67s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=5.93e-5, train/loss_step=0.0142, global_step=7071.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  42%|████▏     | 503/1208 [14:01<19:39,  1.67s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=5.93e-5, train/loss_step=0.0142, global_step=7071.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  42%|████▏     | 503/1208 [14:01<19:39,  1.67s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.68e-5, train/loss_step=0.00299, global_step=7071.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  42%|████▏     | 504/1208 [14:04<19:40,  1.68s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.68e-5, train/loss_step=0.00299, global_step=7071.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  42%|████▏     | 504/1208 [14:04<19:40,  1.68s/it, loss=0.0813, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000391, train/loss_step=0.118, global_step=7071.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  42%|████▏     | 505/1208 [14:05<19:37,  1.68s/it, loss=0.0813, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000391, train/loss_step=0.118, global_step=7071.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  42%|████▏     | 505/1208 [14:05<19:37,  1.68s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.0015, train/loss_step=0.275, global_step=7072.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  42%|████▏     | 506/1208 [14:07<19:35,  1.67s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.0015, train/loss_step=0.275, global_step=7072.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  42%|████▏     | 506/1208 [14:07<19:35,  1.67s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00129, train/loss_step=0.277, global_step=7072.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  42%|████▏     | 507/1208 [14:08<19:32,  1.67s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00129, train/loss_step=0.277, global_step=7072.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  42%|████▏     | 507/1208 [14:08<19:32,  1.67s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.76e-5, train/loss_step=0.0148, global_step=7072.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  42%|████▏     | 508/1208 [14:11<19:33,  1.68s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.76e-5, train/loss_step=0.0148, global_step=7072.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  42%|████▏     | 508/1208 [14:11<19:33,  1.68s/it, loss=0.111, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00136, train/loss_step=0.296, global_step=7072.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  42%|████▏     | 509/1208 [14:12<19:30,  1.67s/it, loss=0.111, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00136, train/loss_step=0.296, global_step=7072.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  42%|████▏     | 509/1208 [14:12<19:30,  1.67s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0792, train/loss_vlb_step=0.00026, train/loss_step=0.0792, global_step=7073.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  42%|████▏     | 510/1208 [14:13<19:27,  1.67s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0792, train/loss_vlb_step=0.00026, train/loss_step=0.0792, global_step=7073.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  42%|████▏     | 510/1208 [14:13<19:27,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0585, train/loss_vlb_step=0.000204, train/loss_step=0.0585, global_step=7073.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  42%|████▏     | 511/1208 [14:14<19:25,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0585, train/loss_vlb_step=0.000204, train/loss_step=0.0585, global_step=7073.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  42%|████▏     | 511/1208 [14:14<19:25,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.000172, train/loss_step=0.048, global_step=7073.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  42%|████▏     | 512/1208 [14:17<19:25,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.000172, train/loss_step=0.048, global_step=7073.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  42%|████▏     | 512/1208 [14:17<19:25,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00771, train/loss_vlb_step=3.79e-5, train/loss_step=0.00771, global_step=7073.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  42%|████▏     | 513/1208 [14:18<19:23,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00771, train/loss_vlb_step=3.79e-5, train/loss_step=0.00771, global_step=7073.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  42%|████▏     | 513/1208 [14:18<19:23,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.653, train/loss_vlb_step=0.042, train/loss_step=0.653, global_step=7074.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]      Epoch 23:  43%|████▎     | 514/1208 [14:19<19:20,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.653, train/loss_vlb_step=0.042, train/loss_step=0.653, global_step=7074.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  43%|████▎     | 514/1208 [14:19<19:20,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000578, train/loss_step=0.167, global_step=7074.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  43%|████▎     | 515/1208 [14:20<19:18,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000578, train/loss_step=0.167, global_step=7074.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  43%|████▎     | 515/1208 [14:20<19:18,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=8.72e-5, train/loss_step=0.022, global_step=7074.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  43%|████▎     | 516/1208 [14:23<19:18,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=8.72e-5, train/loss_step=0.022, global_step=7074.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  43%|████▎     | 516/1208 [14:23<19:18,  1.67s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0517, train/loss_vlb_step=0.000177, train/loss_step=0.0517, global_step=7074.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  43%|████▎     | 517/1208 [14:25<19:16,  1.67s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0517, train/loss_vlb_step=0.000177, train/loss_step=0.0517, global_step=7074.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  43%|████▎     | 517/1208 [14:25<19:16,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.480, train/loss_vlb_step=0.00879, train/loss_step=0.480, global_step=7075.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  43%|████▎     | 518/1208 [14:26<19:13,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.480, train/loss_vlb_step=0.00879, train/loss_step=0.480, global_step=7075.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  43%|████▎     | 518/1208 [14:26<19:13,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0271, train/loss_vlb_step=0.000107, train/loss_step=0.0271, global_step=7075.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  43%|████▎     | 519/1208 [14:27<19:11,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0271, train/loss_vlb_step=0.000107, train/loss_step=0.0271, global_step=7075.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  43%|████▎     | 519/1208 [14:27<19:11,  1.67s/it, loss=0.182, v_num=0, train/loss_simple_step=0.622, train/loss_vlb_step=0.009, train/loss_step=0.622, global_step=7075.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]     Epoch 23:  43%|████▎     | 520/1208 [14:30<19:11,  1.67s/it, loss=0.182, v_num=0, train/loss_simple_step=0.622, train/loss_vlb_step=0.009, train/loss_step=0.622, global_step=7075.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  43%|████▎     | 520/1208 [14:30<19:11,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00127, train/loss_step=0.287, global_step=7075.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  43%|████▎     | 521/1208 [14:31<19:08,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00127, train/loss_step=0.287, global_step=7075.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  43%|████▎     | 521/1208 [14:31<19:08,  1.67s/it, loss=0.184, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000753, train/loss_step=0.179, global_step=7076.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  43%|████▎     | 522/1208 [14:32<19:06,  1.67s/it, loss=0.184, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000753, train/loss_step=0.179, global_step=7076.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  43%|████▎     | 522/1208 [14:32<19:06,  1.67s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=9.92e-6, train/loss_step=0.00166, global_step=7076.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  43%|████▎     | 523/1208 [14:33<19:03,  1.67s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=9.92e-6, train/loss_step=0.00166, global_step=7076.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  43%|████▎     | 523/1208 [14:33<19:03,  1.67s/it, loss=0.199, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00157, train/loss_step=0.325, global_step=7076.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  43%|████▎     | 524/1208 [14:36<19:04,  1.67s/it, loss=0.199, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00157, train/loss_step=0.325, global_step=7076.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  43%|████▎     | 524/1208 [14:36<19:04,  1.67s/it, loss=0.232, v_num=0, train/loss_simple_step=0.767, train/loss_vlb_step=0.0974, train/loss_step=0.767, global_step=7076.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  43%|████▎     | 525/1208 [14:37<19:01,  1.67s/it, loss=0.232, v_num=0, train/loss_simple_step=0.767, train/loss_vlb_step=0.0974, train/loss_step=0.767, global_step=7076.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  43%|████▎     | 525/1208 [14:37<19:01,  1.67s/it, loss=0.233, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00137, train/loss_step=0.298, global_step=7077.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  44%|████▎     | 526/1208 [14:38<18:59,  1.67s/it, loss=0.233, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00137, train/loss_step=0.298, global_step=7077.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  44%|████▎     | 526/1208 [14:38<18:59,  1.67s/it, loss=0.235, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00169, train/loss_step=0.322, global_step=7077.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  44%|████▎     | 527/1208 [14:39<18:56,  1.67s/it, loss=0.235, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00169, train/loss_step=0.322, global_step=7077.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  44%|████▎     | 527/1208 [14:39<18:56,  1.67s/it, loss=0.253, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00286, train/loss_step=0.367, global_step=7077.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  44%|████▎     | 528/1208 [14:42<18:57,  1.67s/it, loss=0.253, v_num=0, train/loss_simple_step=0.367, train/loss_vlb_step=0.00286, train/loss_step=0.367, global_step=7077.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  44%|████▎     | 528/1208 [14:42<18:57,  1.67s/it, loss=0.255, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00167, train/loss_step=0.329, global_step=7077.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  44%|████▍     | 529/1208 [14:44<18:54,  1.67s/it, loss=0.255, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00167, train/loss_step=0.329, global_step=7077.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  44%|████▍     | 529/1208 [14:44<18:54,  1.67s/it, loss=0.257, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000431, train/loss_step=0.130, global_step=7078.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  44%|████▍     | 530/1208 [14:45<18:52,  1.67s/it, loss=0.257, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000431, train/loss_step=0.130, global_step=7078.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  44%|████▍     | 530/1208 [14:45<18:52,  1.67s/it, loss=0.259, v_num=0, train/loss_simple_step=0.0968, train/loss_vlb_step=0.000318, train/loss_step=0.0968, global_step=7078.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  44%|████▍     | 531/1208 [14:46<18:49,  1.67s/it, loss=0.259, v_num=0, train/loss_simple_step=0.0968, train/loss_vlb_step=0.000318, train/loss_step=0.0968, global_step=7078.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  44%|████▍     | 531/1208 [14:46<18:49,  1.67s/it, loss=0.263, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000428, train/loss_step=0.130, global_step=7078.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  44%|████▍     | 532/1208 [14:49<18:50,  1.67s/it, loss=0.263, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000428, train/loss_step=0.130, global_step=7078.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  44%|████▍     | 532/1208 [14:49<18:50,  1.67s/it, loss=0.264, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.41e-5, train/loss_step=0.0214, global_step=7078.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  44%|████▍     | 533/1208 [14:50<18:47,  1.67s/it, loss=0.264, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.41e-5, train/loss_step=0.0214, global_step=7078.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  44%|████▍     | 533/1208 [14:50<18:47,  1.67s/it, loss=0.251, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00267, train/loss_step=0.390, global_step=7079.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  44%|████▍     | 534/1208 [14:51<18:45,  1.67s/it, loss=0.251, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00267, train/loss_step=0.390, global_step=7079.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  44%|████▍     | 534/1208 [14:51<18:45,  1.67s/it, loss=0.244, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000107, train/loss_step=0.0268, global_step=7079.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  44%|████▍     | 535/1208 [14:52<18:42,  1.67s/it, loss=0.244, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000107, train/loss_step=0.0268, global_step=7079.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  44%|████▍     | 535/1208 [14:52<18:42,  1.67s/it, loss=0.25, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000489, train/loss_step=0.148, global_step=7079.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  44%|████▍     | 536/1208 [14:55<18:42,  1.67s/it, loss=0.25, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000489, train/loss_step=0.148, global_step=7079.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  44%|████▍     | 536/1208 [14:55<18:42,  1.67s/it, loss=0.252, v_num=0, train/loss_simple_step=0.0964, train/loss_vlb_step=0.000317, train/loss_step=0.0964, global_step=7079.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  44%|████▍     | 537/1208 [14:56<18:40,  1.67s/it, loss=0.252, v_num=0, train/loss_simple_step=0.0964, train/loss_vlb_step=0.000317, train/loss_step=0.0964, global_step=7079.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  44%|████▍     | 537/1208 [14:56<18:40,  1.67s/it, loss=0.236, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000513, train/loss_step=0.149, global_step=7080.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  45%|████▍     | 538/1208 [14:57<18:38,  1.67s/it, loss=0.236, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000513, train/loss_step=0.149, global_step=7080.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  45%|████▍     | 538/1208 [14:57<18:38,  1.67s/it, loss=0.236, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000127, train/loss_step=0.0333, global_step=7080.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  45%|████▍     | 539/1208 [14:58<18:35,  1.67s/it, loss=0.236, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000127, train/loss_step=0.0333, global_step=7080.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  45%|████▍     | 539/1208 [14:58<18:35,  1.67s/it, loss=0.205, v_num=0, train/loss_simple_step=0.00927, train/loss_vlb_step=4.19e-5, train/loss_step=0.00927, global_step=7080.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  45%|████▍     | 540/1208 [15:02<18:35,  1.67s/it, loss=0.205, v_num=0, train/loss_simple_step=0.00927, train/loss_vlb_step=4.19e-5, train/loss_step=0.00927, global_step=7080.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  45%|████▍     | 540/1208 [15:02<18:35,  1.67s/it, loss=0.191, v_num=0, train/loss_simple_step=0.00955, train/loss_vlb_step=4.48e-5, train/loss_step=0.00955, global_step=7080.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  45%|████▍     | 541/1208 [15:03<18:33,  1.67s/it, loss=0.191, v_num=0, train/loss_simple_step=0.00955, train/loss_vlb_step=4.48e-5, train/loss_step=0.00955, global_step=7080.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  45%|████▍     | 541/1208 [15:03<18:33,  1.67s/it, loss=0.188, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000379, train/loss_step=0.114, global_step=7081.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  45%|████▍     | 542/1208 [15:04<18:30,  1.67s/it, loss=0.188, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000379, train/loss_step=0.114, global_step=7081.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  45%|████▍     | 542/1208 [15:04<18:30,  1.67s/it, loss=0.202, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.0011, train/loss_step=0.282, global_step=7081.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  45%|████▍     | 543/1208 [15:05<18:28,  1.67s/it, loss=0.202, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.0011, train/loss_step=0.282, global_step=7081.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  45%|████▍     | 543/1208 [15:05<18:28,  1.67s/it, loss=0.192, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=7081.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  45%|████▌     | 544/1208 [15:08<18:28,  1.67s/it, loss=0.192, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=7081.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  45%|████▌     | 544/1208 [15:08<18:28,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000939, train/loss_step=0.228, global_step=7081.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  45%|████▌     | 545/1208 [15:09<18:26,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000939, train/loss_step=0.228, global_step=7081.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  45%|████▌     | 545/1208 [15:09<18:26,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000376, train/loss_step=0.114, global_step=7082.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  45%|████▌     | 546/1208 [15:10<18:23,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000376, train/loss_step=0.114, global_step=7082.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  45%|████▌     | 546/1208 [15:10<18:23,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000112, train/loss_step=0.0284, global_step=7082.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  45%|████▌     | 547/1208 [15:11<18:21,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000112, train/loss_step=0.0284, global_step=7082.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  45%|████▌     | 547/1208 [15:11<18:21,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00115, train/loss_step=0.300, global_step=7082.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  45%|████▌     | 548/1208 [15:14<18:21,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00115, train/loss_step=0.300, global_step=7082.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  45%|████▌     | 548/1208 [15:14<18:21,  1.67s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0384, train/loss_vlb_step=0.000143, train/loss_step=0.0384, global_step=7082.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  45%|████▌     | 549/1208 [15:15<18:19,  1.67s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0384, train/loss_vlb_step=0.000143, train/loss_step=0.0384, global_step=7082.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  45%|████▌     | 549/1208 [15:15<18:19,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00486, train/loss_vlb_step=2.53e-5, train/loss_step=0.00486, global_step=7083.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  46%|████▌     | 550/1208 [15:16<18:16,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00486, train/loss_vlb_step=2.53e-5, train/loss_step=0.00486, global_step=7083.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  46%|████▌     | 550/1208 [15:16<18:16,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000557, train/loss_step=0.163, global_step=7083.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  46%|████▌     | 551/1208 [15:17<18:14,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000557, train/loss_step=0.163, global_step=7083.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  46%|████▌     | 551/1208 [15:17<18:14,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.4e-5, train/loss_step=0.0143, global_step=7083.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  46%|████▌     | 552/1208 [15:20<18:14,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.4e-5, train/loss_step=0.0143, global_step=7083.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  46%|████▌     | 552/1208 [15:20<18:14,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000104, train/loss_step=0.0272, global_step=7083.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  46%|████▌     | 553/1208 [15:22<18:12,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000104, train/loss_step=0.0272, global_step=7083.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  46%|████▌     | 553/1208 [15:22<18:12,  1.67s/it, loss=0.113, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00186, train/loss_step=0.347, global_step=7084.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  46%|████▌     | 554/1208 [15:23<18:09,  1.67s/it, loss=0.113, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00186, train/loss_step=0.347, global_step=7084.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  46%|████▌     | 554/1208 [15:23<18:09,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000373, train/loss_step=0.113, global_step=7084.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  46%|████▌     | 555/1208 [15:24<18:07,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000373, train/loss_step=0.113, global_step=7084.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  46%|████▌     | 555/1208 [15:24<18:07,  1.67s/it, loss=0.125, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00159, train/loss_step=0.308, global_step=7084.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  46%|████▌     | 556/1208 [15:27<18:07,  1.67s/it, loss=0.125, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00159, train/loss_step=0.308, global_step=7084.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  46%|████▌     | 556/1208 [15:27<18:07,  1.67s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0715, train/loss_vlb_step=0.000243, train/loss_step=0.0715, global_step=7084.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  46%|████▌     | 557/1208 [15:28<18:04,  1.67s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0715, train/loss_vlb_step=0.000243, train/loss_step=0.0715, global_step=7084.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  46%|████▌     | 557/1208 [15:28<18:04,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.91e-5, train/loss_step=0.016, global_step=7085.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  46%|████▌     | 558/1208 [15:29<18:02,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.91e-5, train/loss_step=0.016, global_step=7085.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  46%|████▌     | 558/1208 [15:29<18:02,  1.67s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0738, train/loss_vlb_step=0.000249, train/loss_step=0.0738, global_step=7085.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  46%|████▋     | 559/1208 [15:30<18:00,  1.66s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0738, train/loss_vlb_step=0.000249, train/loss_step=0.0738, global_step=7085.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  46%|████▋     | 559/1208 [15:30<18:00,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000384, train/loss_step=0.117, global_step=7085.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  46%|████▋     | 560/1208 [15:33<18:00,  1.67s/it, loss=0.125, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000384, train/loss_step=0.117, global_step=7085.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  46%|████▋     | 560/1208 [15:33<18:00,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000461, train/loss_step=0.138, global_step=7085.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  46%|████▋     | 561/1208 [15:34<17:57,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000461, train/loss_step=0.138, global_step=7085.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  46%|████▋     | 561/1208 [15:34<17:57,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.00033, train/loss_step=0.101, global_step=7086.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  47%|████▋     | 562/1208 [15:35<17:55,  1.66s/it, loss=0.13, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.00033, train/loss_step=0.101, global_step=7086.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  47%|████▋     | 562/1208 [15:35<17:55,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.45e-5, train/loss_step=0.0121, global_step=7086.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  47%|████▋     | 563/1208 [15:36<17:53,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.45e-5, train/loss_step=0.0121, global_step=7086.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  47%|████▋     | 563/1208 [15:36<17:53,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0877, train/loss_vlb_step=0.000292, train/loss_step=0.0877, global_step=7086.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  47%|████▋     | 564/1208 [15:39<17:53,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0877, train/loss_vlb_step=0.000292, train/loss_step=0.0877, global_step=7086.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  47%|████▋     | 564/1208 [15:39<17:53,  1.67s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.71e-5, train/loss_step=0.0104, global_step=7086.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  47%|████▋     | 565/1208 [15:41<17:50,  1.67s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.71e-5, train/loss_step=0.0104, global_step=7086.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  47%|████▋     | 565/1208 [15:41<17:50,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.0012, train/loss_step=0.274, global_step=7087.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  47%|████▋     | 566/1208 [15:42<17:48,  1.66s/it, loss=0.112, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.0012, train/loss_step=0.274, global_step=7087.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  47%|████▋     | 566/1208 [15:42<17:48,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00143, train/loss_step=0.301, global_step=7087.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  47%|████▋     | 567/1208 [15:43<17:46,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00143, train/loss_step=0.301, global_step=7087.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  47%|████▋     | 567/1208 [15:43<17:46,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000469, train/loss_step=0.141, global_step=7087.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  47%|████▋     | 568/1208 [15:46<17:46,  1.67s/it, loss=0.118, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000469, train/loss_step=0.141, global_step=7087.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  47%|████▋     | 568/1208 [15:46<17:46,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.0016, train/loss_step=0.296, global_step=7087.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  47%|████▋     | 569/1208 [15:47<17:43,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.0016, train/loss_step=0.296, global_step=7087.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  47%|████▋     | 569/1208 [15:47<17:43,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.061, train/loss_vlb_step=0.000214, train/loss_step=0.061, global_step=7088.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  47%|████▋     | 570/1208 [15:48<17:41,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.061, train/loss_vlb_step=0.000214, train/loss_step=0.061, global_step=7088.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  47%|████▋     | 570/1208 [15:48<17:41,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000599, train/loss_step=0.174, global_step=7088.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  47%|████▋     | 571/1208 [15:49<17:39,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000599, train/loss_step=0.174, global_step=7088.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  47%|████▋     | 571/1208 [15:49<17:39,  1.66s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000251, train/loss_step=0.0754, global_step=7088.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  47%|████▋     | 572/1208 [15:52<17:39,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000251, train/loss_step=0.0754, global_step=7088.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  47%|████▋     | 572/1208 [15:52<17:39,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.530, train/loss_vlb_step=0.0165, train/loss_step=0.530, global_step=7088.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  47%|████▋     | 573/1208 [15:53<17:36,  1.66s/it, loss=0.162, v_num=0, train/loss_simple_step=0.530, train/loss_vlb_step=0.0165, train/loss_step=0.530, global_step=7088.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  47%|████▋     | 573/1208 [15:53<17:36,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000102, train/loss_step=0.0255, global_step=7089.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  48%|████▊     | 574/1208 [15:54<17:34,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000102, train/loss_step=0.0255, global_step=7089.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  48%|████▊     | 574/1208 [15:54<17:34,  1.66s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.52e-5, train/loss_step=0.0234, global_step=7089.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  48%|████▊     | 575/1208 [15:55<17:32,  1.66s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.52e-5, train/loss_step=0.0234, global_step=7089.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  48%|████▊     | 575/1208 [15:55<17:32,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.06e-5, train/loss_step=0.00174, global_step=7089.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  48%|████▊     | 576/1208 [15:58<17:32,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.06e-5, train/loss_step=0.00174, global_step=7089.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  48%|████▊     | 576/1208 [15:58<17:32,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00734, train/loss_vlb_step=3.56e-5, train/loss_step=0.00734, global_step=7089.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  48%|████▊     | 577/1208 [15:59<17:29,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00734, train/loss_vlb_step=3.56e-5, train/loss_step=0.00734, global_step=7089.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  48%|████▊     | 577/1208 [15:59<17:29,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.74e-5, train/loss_step=0.0135, global_step=7090.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  48%|████▊     | 578/1208 [16:00<17:27,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.74e-5, train/loss_step=0.0135, global_step=7090.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  48%|████▊     | 578/1208 [16:00<17:27,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00259, train/loss_step=0.379, global_step=7090.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  48%|████▊     | 579/1208 [16:02<17:25,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00259, train/loss_step=0.379, global_step=7090.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  48%|████▊     | 579/1208 [16:02<17:25,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0466, train/loss_vlb_step=0.000174, train/loss_step=0.0466, global_step=7090.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  48%|████▊     | 580/1208 [16:05<17:25,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0466, train/loss_vlb_step=0.000174, train/loss_step=0.0466, global_step=7090.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  48%|████▊     | 580/1208 [16:05<17:25,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.0026, train/loss_step=0.347, global_step=7090.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  48%|████▊     | 581/1208 [16:06<17:22,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.0026, train/loss_step=0.347, global_step=7090.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  48%|████▊     | 581/1208 [16:06<17:22,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00141, train/loss_step=0.284, global_step=7091.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  48%|████▊     | 582/1208 [16:07<17:20,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00141, train/loss_step=0.284, global_step=7091.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  48%|████▊     | 582/1208 [16:07<17:20,  1.66s/it, loss=0.183, v_num=0, train/loss_simple_step=0.591, train/loss_vlb_step=0.00676, train/loss_step=0.591, global_step=7091.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  48%|████▊     | 583/1208 [16:08<17:18,  1.66s/it, loss=0.183, v_num=0, train/loss_simple_step=0.591, train/loss_vlb_step=0.00676, train/loss_step=0.591, global_step=7091.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  48%|████▊     | 583/1208 [16:08<17:18,  1.66s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.000187, train/loss_step=0.0527, global_step=7091.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  48%|████▊     | 584/1208 [16:11<17:18,  1.66s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.000187, train/loss_step=0.0527, global_step=7091.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  48%|████▊     | 584/1208 [16:11<17:18,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.95e-5, train/loss_step=0.00349, global_step=7091.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  48%|████▊     | 585/1208 [16:12<17:15,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.95e-5, train/loss_step=0.00349, global_step=7091.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  48%|████▊     | 585/1208 [16:12<17:15,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=2.46e-5, train/loss_step=0.00471, global_step=7092.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  49%|████▊     | 586/1208 [16:13<17:13,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=2.46e-5, train/loss_step=0.00471, global_step=7092.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  49%|████▊     | 586/1208 [16:13<17:13,  1.66s/it, loss=0.182, v_num=0, train/loss_simple_step=0.577, train/loss_vlb_step=0.0109, train/loss_step=0.577, global_step=7092.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]     Epoch 23:  49%|████▊     | 587/1208 [16:14<17:11,  1.66s/it, loss=0.182, v_num=0, train/loss_simple_step=0.577, train/loss_vlb_step=0.0109, train/loss_step=0.577, global_step=7092.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  49%|████▊     | 587/1208 [16:14<17:11,  1.66s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00641, train/loss_vlb_step=3.25e-5, train/loss_step=0.00641, global_step=7092.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  49%|████▊     | 588/1208 [16:17<17:11,  1.66s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00641, train/loss_vlb_step=3.25e-5, train/loss_step=0.00641, global_step=7092.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  49%|████▊     | 588/1208 [16:17<17:11,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.00051, train/loss_step=0.152, global_step=7092.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  49%|████▉     | 589/1208 [16:18<17:08,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.00051, train/loss_step=0.152, global_step=7092.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  49%|████▉     | 589/1208 [16:18<17:08,  1.66s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=2.22e-5, train/loss_step=0.00413, global_step=7093.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  49%|████▉     | 590/1208 [16:19<17:06,  1.66s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=2.22e-5, train/loss_step=0.00413, global_step=7093.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  49%|████▉     | 590/1208 [16:19<17:06,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.48e-5, train/loss_step=0.00257, global_step=7093.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  49%|████▉     | 591/1208 [16:21<17:04,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.48e-5, train/loss_step=0.00257, global_step=7093.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  49%|████▉     | 591/1208 [16:21<17:04,  1.66s/it, loss=0.177, v_num=0, train/loss_simple_step=0.493, train/loss_vlb_step=0.00712, train/loss_step=0.493, global_step=7093.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  49%|████▉     | 592/1208 [16:24<17:04,  1.66s/it, loss=0.177, v_num=0, train/loss_simple_step=0.493, train/loss_vlb_step=0.00712, train/loss_step=0.493, global_step=7093.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  49%|████▉     | 592/1208 [16:24<17:04,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0907, train/loss_vlb_step=0.0003, train/loss_step=0.0907, global_step=7093.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  49%|████▉     | 593/1208 [16:25<17:01,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0907, train/loss_vlb_step=0.0003, train/loss_step=0.0907, global_step=7093.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  49%|████▉     | 593/1208 [16:25<17:01,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000431, train/loss_step=0.130, global_step=7094.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  49%|████▉     | 594/1208 [16:26<16:59,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000431, train/loss_step=0.130, global_step=7094.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  49%|████▉     | 594/1208 [16:26<16:59,  1.66s/it, loss=0.165, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=7094.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  49%|████▉     | 595/1208 [16:27<16:57,  1.66s/it, loss=0.165, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=7094.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  49%|████▉     | 595/1208 [16:27<16:57,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0993, train/loss_vlb_step=0.00033, train/loss_step=0.0993, global_step=7094.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  49%|████▉     | 596/1208 [16:30<16:57,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0993, train/loss_vlb_step=0.00033, train/loss_step=0.0993, global_step=7094.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  49%|████▉     | 596/1208 [16:30<16:57,  1.66s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.00014, train/loss_step=0.0379, global_step=7094.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  49%|████▉     | 597/1208 [16:31<16:54,  1.66s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.00014, train/loss_step=0.0379, global_step=7094.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  49%|████▉     | 597/1208 [16:31<16:54,  1.66s/it, loss=0.177, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000411, train/loss_step=0.122, global_step=7095.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  50%|████▉     | 598/1208 [16:32<16:52,  1.66s/it, loss=0.177, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000411, train/loss_step=0.122, global_step=7095.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  50%|████▉     | 598/1208 [16:32<16:52,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.453, train/loss_vlb_step=0.00423, train/loss_step=0.453, global_step=7095.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  50%|████▉     | 599/1208 [16:33<16:50,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.453, train/loss_vlb_step=0.00423, train/loss_step=0.453, global_step=7095.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  50%|████▉     | 599/1208 [16:33<16:50,  1.66s/it, loss=0.201, v_num=0, train/loss_simple_step=0.449, train/loss_vlb_step=0.00514, train/loss_step=0.449, global_step=7095.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  50%|████▉     | 600/1208 [16:36<16:50,  1.66s/it, loss=0.201, v_num=0, train/loss_simple_step=0.449, train/loss_vlb_step=0.00514, train/loss_step=0.449, global_step=7095.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  50%|████▉     | 600/1208 [16:36<16:50,  1.66s/it, loss=0.188, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000337, train/loss_step=0.102, global_step=7095.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.75it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.74it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.77it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.76it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.75it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 23:  50%|████▉     | 601/1208 [17:07<17:17,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000337, train/loss_step=0.102, global_step=7095.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  50%|████▉     | 601/1208 [17:07<17:17,  1.71s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.8e-5, train/loss_step=0.0134, global_step=7096.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  50%|████▉     | 602/1208 [17:08<17:15,  1.71s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.8e-5, train/loss_step=0.0134, global_step=7096.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  50%|████▉     | 602/1208 [17:08<17:15,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.18e-5, train/loss_step=0.00198, global_step=7096.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  50%|████▉     | 603/1208 [17:09<17:13,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.18e-5, train/loss_step=0.00198, global_step=7096.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  50%|████▉     | 603/1208 [17:09<17:13,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00185, train/loss_step=0.352, global_step=7096.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]     Epoch 23:  50%|█████     | 604/1208 [17:12<17:12,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00185, train/loss_step=0.352, global_step=7096.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  50%|█████     | 604/1208 [17:12<17:12,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00652, train/loss_vlb_step=3.33e-5, train/loss_step=0.00652, global_step=7096.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  50%|█████     | 605/1208 [17:13<17:10,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00652, train/loss_vlb_step=3.33e-5, train/loss_step=0.00652, global_step=7096.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  50%|█████     | 605/1208 [17:13<17:10,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=1.11e-5, train/loss_step=0.00187, global_step=7097.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  50%|█████     | 606/1208 [17:14<17:07,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=1.11e-5, train/loss_step=0.00187, global_step=7097.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  50%|█████     | 606/1208 [17:14<17:07,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000503, train/loss_step=0.152, global_step=7097.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  50%|█████     | 607/1208 [17:15<17:05,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000503, train/loss_step=0.152, global_step=7097.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  50%|█████     | 607/1208 [17:15<17:05,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000106, train/loss_step=0.0279, global_step=7097.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  50%|█████     | 608/1208 [17:19<17:05,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000106, train/loss_step=0.0279, global_step=7097.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  50%|█████     | 608/1208 [17:19<17:05,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000231, train/loss_step=0.0676, global_step=7097.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  50%|█████     | 609/1208 [17:20<17:03,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000231, train/loss_step=0.0676, global_step=7097.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  50%|█████     | 609/1208 [17:20<17:03,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0698, train/loss_vlb_step=0.000239, train/loss_step=0.0698, global_step=7098.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  50%|█████     | 610/1208 [17:21<17:00,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0698, train/loss_vlb_step=0.000239, train/loss_step=0.0698, global_step=7098.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  50%|█████     | 610/1208 [17:21<17:00,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.690, train/loss_vlb_step=0.0258, train/loss_step=0.690, global_step=7098.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  51%|█████     | 611/1208 [17:22<16:58,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.690, train/loss_vlb_step=0.0258, train/loss_step=0.690, global_step=7098.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  51%|█████     | 611/1208 [17:22<16:58,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.19e-5, train/loss_step=0.002, global_step=7098.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  51%|█████     | 612/1208 [17:25<16:58,  1.71s/it, loss=0.149, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.19e-5, train/loss_step=0.002, global_step=7098.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  51%|█████     | 612/1208 [17:25<16:58,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00207, train/loss_step=0.352, global_step=7098.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  51%|█████     | 613/1208 [17:26<16:55,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00207, train/loss_step=0.352, global_step=7098.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  51%|█████     | 613/1208 [17:26<16:55,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00756, train/loss_vlb_step=3.76e-5, train/loss_step=0.00756, global_step=7099.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  51%|█████     | 614/1208 [17:27<16:53,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00756, train/loss_vlb_step=3.76e-5, train/loss_step=0.00756, global_step=7099.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  51%|█████     | 614/1208 [17:27<16:53,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.0015, train/loss_step=0.292, global_step=7099.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]     Epoch 23:  51%|█████     | 615/1208 [17:28<16:51,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.0015, train/loss_step=0.292, global_step=7099.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  51%|█████     | 615/1208 [17:28<16:51,  1.70s/it, loss=0.165, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=7099.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  51%|█████     | 616/1208 [17:31<16:50,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=7099.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  51%|█████     | 616/1208 [17:31<16:50,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000102, train/loss_step=0.0258, global_step=7099.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  51%|█████     | 617/1208 [17:32<16:48,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000102, train/loss_step=0.0258, global_step=7099.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  51%|█████     | 617/1208 [17:32<16:48,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=5.08e-5, train/loss_step=0.0104, global_step=7100.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  51%|█████     | 618/1208 [17:33<16:46,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=5.08e-5, train/loss_step=0.0104, global_step=7100.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  51%|█████     | 618/1208 [17:33<16:46,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0704, train/loss_vlb_step=0.00024, train/loss_step=0.0704, global_step=7100.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  51%|█████     | 619/1208 [17:34<16:43,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0704, train/loss_vlb_step=0.00024, train/loss_step=0.0704, global_step=7100.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  51%|█████     | 619/1208 [17:34<16:43,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00205, train/loss_step=0.370, global_step=7100.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  51%|█████▏    | 620/1208 [17:38<16:43,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00205, train/loss_step=0.370, global_step=7100.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  51%|█████▏    | 620/1208 [17:38<16:43,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.097, train/loss_vlb_step=0.000319, train/loss_step=0.097, global_step=7100.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  51%|█████▏    | 621/1208 [17:39<16:41,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.097, train/loss_vlb_step=0.000319, train/loss_step=0.097, global_step=7100.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  51%|█████▏    | 621/1208 [17:39<16:41,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.661, train/loss_vlb_step=0.0195, train/loss_step=0.661, global_step=7101.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  51%|█████▏    | 622/1208 [17:40<16:38,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.661, train/loss_vlb_step=0.0195, train/loss_step=0.661, global_step=7101.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  51%|█████▏    | 622/1208 [17:40<16:38,  1.70s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.3e-5, train/loss_step=0.0152, global_step=7101.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  52%|█████▏    | 623/1208 [17:41<16:36,  1.70s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.3e-5, train/loss_step=0.0152, global_step=7101.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  52%|█████▏    | 623/1208 [17:41<16:36,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000177, train/loss_step=0.0525, global_step=7101.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  52%|█████▏    | 624/1208 [17:44<16:36,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000177, train/loss_step=0.0525, global_step=7101.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  52%|█████▏    | 624/1208 [17:44<16:36,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000568, train/loss_step=0.166, global_step=7101.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  52%|█████▏    | 625/1208 [17:45<16:33,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000568, train/loss_step=0.166, global_step=7101.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  52%|█████▏    | 625/1208 [17:45<16:33,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0984, train/loss_vlb_step=0.000324, train/loss_step=0.0984, global_step=7102.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  52%|█████▏    | 626/1208 [17:46<16:31,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0984, train/loss_vlb_step=0.000324, train/loss_step=0.0984, global_step=7102.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  52%|█████▏    | 626/1208 [17:46<16:31,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000545, train/loss_step=0.156, global_step=7102.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  52%|█████▏    | 627/1208 [17:47<16:29,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000545, train/loss_step=0.156, global_step=7102.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  52%|█████▏    | 627/1208 [17:47<16:29,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000519, train/loss_step=0.158, global_step=7102.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  52%|█████▏    | 628/1208 [17:50<16:28,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000519, train/loss_step=0.158, global_step=7102.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  52%|█████▏    | 628/1208 [17:50<16:28,  1.71s/it, loss=0.175, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000354, train/loss_step=0.107, global_step=7102.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  52%|█████▏    | 629/1208 [17:51<16:26,  1.70s/it, loss=0.175, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000354, train/loss_step=0.107, global_step=7102.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  52%|█████▏    | 629/1208 [17:51<16:26,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00115, train/loss_step=0.280, global_step=7103.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  52%|█████▏    | 630/1208 [17:52<16:24,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00115, train/loss_step=0.280, global_step=7103.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  52%|█████▏    | 630/1208 [17:52<16:24,  1.70s/it, loss=0.176, v_num=0, train/loss_simple_step=0.493, train/loss_vlb_step=0.00616, train/loss_step=0.493, global_step=7103.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  52%|█████▏    | 631/1208 [17:53<16:22,  1.70s/it, loss=0.176, v_num=0, train/loss_simple_step=0.493, train/loss_vlb_step=0.00616, train/loss_step=0.493, global_step=7103.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  52%|█████▏    | 631/1208 [17:53<16:22,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000583, train/loss_step=0.162, global_step=7103.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  52%|█████▏    | 632/1208 [17:57<16:21,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000583, train/loss_step=0.162, global_step=7103.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  52%|█████▏    | 632/1208 [17:57<16:21,  1.70s/it, loss=0.189, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.0031, train/loss_step=0.450, global_step=7103.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  52%|█████▏    | 633/1208 [17:58<16:19,  1.70s/it, loss=0.189, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.0031, train/loss_step=0.450, global_step=7103.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  52%|█████▏    | 633/1208 [17:58<16:19,  1.70s/it, loss=0.196, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000539, train/loss_step=0.158, global_step=7104.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  52%|█████▏    | 634/1208 [17:59<16:17,  1.70s/it, loss=0.196, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000539, train/loss_step=0.158, global_step=7104.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  52%|█████▏    | 634/1208 [17:59<16:17,  1.70s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=1.44e-5, train/loss_step=0.00256, global_step=7104.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  53%|█████▎    | 635/1208 [18:00<16:14,  1.70s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=1.44e-5, train/loss_step=0.00256, global_step=7104.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  53%|█████▎    | 635/1208 [18:00<16:14,  1.70s/it, loss=0.198, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00345, train/loss_step=0.433, global_step=7104.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  53%|█████▎    | 636/1208 [18:03<16:14,  1.70s/it, loss=0.198, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00345, train/loss_step=0.433, global_step=7104.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  53%|█████▎    | 636/1208 [18:03<16:14,  1.70s/it, loss=0.217, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.0035, train/loss_step=0.399, global_step=7104.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  53%|█████▎    | 637/1208 [18:04<16:12,  1.70s/it, loss=0.217, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.0035, train/loss_step=0.399, global_step=7104.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  53%|█████▎    | 637/1208 [18:04<16:12,  1.70s/it, loss=0.217, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=1.96e-5, train/loss_step=0.00345, global_step=7105.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  53%|█████▎    | 638/1208 [18:05<16:09,  1.70s/it, loss=0.217, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=1.96e-5, train/loss_step=0.00345, global_step=7105.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  53%|█████▎    | 638/1208 [18:05<16:09,  1.70s/it, loss=0.214, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.64e-5, train/loss_step=0.0154, global_step=7105.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  53%|█████▎    | 639/1208 [18:06<16:07,  1.70s/it, loss=0.214, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.64e-5, train/loss_step=0.0154, global_step=7105.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  53%|█████▎    | 639/1208 [18:06<16:07,  1.70s/it, loss=0.203, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000566, train/loss_step=0.161, global_step=7105.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  53%|█████▎    | 640/1208 [18:09<16:07,  1.70s/it, loss=0.203, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000566, train/loss_step=0.161, global_step=7105.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  53%|█████▎    | 640/1208 [18:09<16:07,  1.70s/it, loss=0.219, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00256, train/loss_step=0.401, global_step=7105.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  53%|█████▎    | 641/1208 [18:10<16:04,  1.70s/it, loss=0.219, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00256, train/loss_step=0.401, global_step=7105.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  53%|█████▎    | 641/1208 [18:10<16:04,  1.70s/it, loss=0.201, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00123, train/loss_step=0.319, global_step=7106.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  53%|█████▎    | 642/1208 [18:11<16:02,  1.70s/it, loss=0.201, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00123, train/loss_step=0.319, global_step=7106.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  53%|█████▎    | 642/1208 [18:11<16:02,  1.70s/it, loss=0.204, v_num=0, train/loss_simple_step=0.072, train/loss_vlb_step=0.00024, train/loss_step=0.072, global_step=7106.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  53%|█████▎    | 643/1208 [18:12<16:00,  1.70s/it, loss=0.204, v_num=0, train/loss_simple_step=0.072, train/loss_vlb_step=0.00024, train/loss_step=0.072, global_step=7106.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  53%|█████▎    | 643/1208 [18:12<16:00,  1.70s/it, loss=0.224, v_num=0, train/loss_simple_step=0.440, train/loss_vlb_step=0.00354, train/loss_step=0.440, global_step=7106.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  53%|█████▎    | 644/1208 [18:16<15:59,  1.70s/it, loss=0.224, v_num=0, train/loss_simple_step=0.440, train/loss_vlb_step=0.00354, train/loss_step=0.440, global_step=7106.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  53%|█████▎    | 644/1208 [18:16<15:59,  1.70s/it, loss=0.221, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=7106.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  53%|█████▎    | 645/1208 [18:17<15:57,  1.70s/it, loss=0.221, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=7106.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  53%|█████▎    | 645/1208 [18:17<15:57,  1.70s/it, loss=0.23, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00134, train/loss_step=0.284, global_step=7107.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  53%|█████▎    | 646/1208 [18:18<15:55,  1.70s/it, loss=0.23, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00134, train/loss_step=0.284, global_step=7107.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  53%|█████▎    | 646/1208 [18:18<15:55,  1.70s/it, loss=0.231, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000538, train/loss_step=0.162, global_step=7107.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  54%|█████▎    | 647/1208 [18:19<15:53,  1.70s/it, loss=0.231, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000538, train/loss_step=0.162, global_step=7107.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  54%|█████▎    | 647/1208 [18:19<15:53,  1.70s/it, loss=0.227, v_num=0, train/loss_simple_step=0.0919, train/loss_vlb_step=0.000311, train/loss_step=0.0919, global_step=7107.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  54%|█████▎    | 648/1208 [18:22<15:52,  1.70s/it, loss=0.227, v_num=0, train/loss_simple_step=0.0919, train/loss_vlb_step=0.000311, train/loss_step=0.0919, global_step=7107.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  54%|█████▎    | 648/1208 [18:22<15:52,  1.70s/it, loss=0.222, v_num=0, train/loss_simple_step=0.00558, train/loss_vlb_step=2.81e-5, train/loss_step=0.00558, global_step=7107.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  54%|█████▎    | 649/1208 [18:23<15:50,  1.70s/it, loss=0.222, v_num=0, train/loss_simple_step=0.00558, train/loss_vlb_step=2.81e-5, train/loss_step=0.00558, global_step=7107.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  54%|█████▎    | 649/1208 [18:23<15:50,  1.70s/it, loss=0.209, v_num=0, train/loss_simple_step=0.00655, train/loss_vlb_step=3.1e-5, train/loss_step=0.00655, global_step=7108.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  54%|█████▍    | 650/1208 [18:24<15:48,  1.70s/it, loss=0.209, v_num=0, train/loss_simple_step=0.00655, train/loss_vlb_step=3.1e-5, train/loss_step=0.00655, global_step=7108.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  54%|█████▍    | 650/1208 [18:24<15:48,  1.70s/it, loss=0.209, v_num=0, train/loss_simple_step=0.501, train/loss_vlb_step=0.00841, train/loss_step=0.501, global_step=7108.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  54%|█████▍    | 651/1208 [18:25<15:45,  1.70s/it, loss=0.209, v_num=0, train/loss_simple_step=0.501, train/loss_vlb_step=0.00841, train/loss_step=0.501, global_step=7108.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  54%|█████▍    | 651/1208 [18:25<15:45,  1.70s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0469, train/loss_vlb_step=0.000168, train/loss_step=0.0469, global_step=7108.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  54%|█████▍    | 652/1208 [18:28<15:45,  1.70s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0469, train/loss_vlb_step=0.000168, train/loss_step=0.0469, global_step=7108.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  54%|█████▍    | 652/1208 [18:28<15:45,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=7108.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  54%|█████▍    | 653/1208 [18:29<15:43,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=7108.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  54%|█████▍    | 653/1208 [18:29<15:43,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.00048, train/loss_step=0.137, global_step=7109.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  54%|█████▍    | 654/1208 [18:30<15:41,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.00048, train/loss_step=0.137, global_step=7109.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  54%|█████▍    | 654/1208 [18:30<15:41,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000108, train/loss_step=0.0274, global_step=7109.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  54%|█████▍    | 655/1208 [18:31<15:38,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000108, train/loss_step=0.0274, global_step=7109.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  54%|█████▍    | 655/1208 [18:31<15:38,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=7109.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  54%|█████▍    | 656/1208 [18:35<15:38,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=7109.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  54%|█████▍    | 656/1208 [18:35<15:38,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000756, train/loss_step=0.206, global_step=7109.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  54%|█████▍    | 657/1208 [18:36<15:36,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000756, train/loss_step=0.206, global_step=7109.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  54%|█████▍    | 657/1208 [18:36<15:36,  1.70s/it, loss=0.18, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00223, train/loss_step=0.396, global_step=7110.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  54%|█████▍    | 658/1208 [18:37<15:33,  1.70s/it, loss=0.18, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00223, train/loss_step=0.396, global_step=7110.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  54%|█████▍    | 658/1208 [18:37<15:33,  1.70s/it, loss=0.192, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00101, train/loss_step=0.247, global_step=7110.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  55%|█████▍    | 659/1208 [18:38<15:31,  1.70s/it, loss=0.192, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00101, train/loss_step=0.247, global_step=7110.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  55%|█████▍    | 659/1208 [18:38<15:31,  1.70s/it, loss=0.196, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.00105, train/loss_step=0.242, global_step=7110.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  55%|█████▍    | 660/1208 [18:41<15:31,  1.70s/it, loss=0.196, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.00105, train/loss_step=0.242, global_step=7110.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  55%|█████▍    | 660/1208 [18:41<15:31,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000141, train/loss_step=0.0386, global_step=7110.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  55%|█████▍    | 661/1208 [18:42<15:28,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000141, train/loss_step=0.0386, global_step=7110.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  55%|█████▍    | 661/1208 [18:42<15:28,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0825, train/loss_vlb_step=0.000272, train/loss_step=0.0825, global_step=7111.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  55%|█████▍    | 662/1208 [18:43<15:26,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0825, train/loss_vlb_step=0.000272, train/loss_step=0.0825, global_step=7111.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  55%|█████▍    | 662/1208 [18:43<15:26,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.000276, train/loss_step=0.0817, global_step=7111.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  55%|█████▍    | 663/1208 [18:44<15:24,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.000276, train/loss_step=0.0817, global_step=7111.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  55%|█████▍    | 663/1208 [18:44<15:24,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.22e-5, train/loss_step=0.020, global_step=7111.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  55%|█████▍    | 664/1208 [18:47<15:24,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.22e-5, train/loss_step=0.020, global_step=7111.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  55%|█████▍    | 664/1208 [18:47<15:24,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000678, train/loss_step=0.192, global_step=7111.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  55%|█████▌    | 665/1208 [18:48<15:21,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000678, train/loss_step=0.192, global_step=7111.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  55%|█████▌    | 665/1208 [18:48<15:21,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00179, train/loss_step=0.374, global_step=7112.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  55%|█████▌    | 666/1208 [18:49<15:19,  1.70s/it, loss=0.154, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00179, train/loss_step=0.374, global_step=7112.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  55%|█████▌    | 666/1208 [18:49<15:19,  1.70s/it, loss=0.155, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000657, train/loss_step=0.182, global_step=7112.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  55%|█████▌    | 667/1208 [18:50<15:17,  1.70s/it, loss=0.155, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000657, train/loss_step=0.182, global_step=7112.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  55%|█████▌    | 667/1208 [18:51<15:17,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.705, train/loss_vlb_step=0.0283, train/loss_step=0.705, global_step=7112.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  55%|█████▌    | 668/1208 [18:54<15:16,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.705, train/loss_vlb_step=0.0283, train/loss_step=0.705, global_step=7112.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  55%|█████▌    | 668/1208 [18:54<15:16,  1.70s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0637, train/loss_vlb_step=0.000218, train/loss_step=0.0637, global_step=7112.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  55%|█████▌    | 669/1208 [18:55<15:14,  1.70s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0637, train/loss_vlb_step=0.000218, train/loss_step=0.0637, global_step=7112.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  55%|█████▌    | 669/1208 [18:55<15:14,  1.70s/it, loss=0.196, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000545, train/loss_step=0.160, global_step=7113.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  55%|█████▌    | 670/1208 [18:56<15:12,  1.70s/it, loss=0.196, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000545, train/loss_step=0.160, global_step=7113.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  55%|█████▌    | 670/1208 [18:56<15:12,  1.70s/it, loss=0.179, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000566, train/loss_step=0.164, global_step=7113.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  56%|█████▌    | 671/1208 [18:57<15:10,  1.69s/it, loss=0.179, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000566, train/loss_step=0.164, global_step=7113.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  56%|█████▌    | 671/1208 [18:57<15:10,  1.69s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0063, train/loss_vlb_step=3.22e-5, train/loss_step=0.0063, global_step=7113.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  56%|█████▌    | 672/1208 [19:00<15:09,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0063, train/loss_vlb_step=3.22e-5, train/loss_step=0.0063, global_step=7113.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  56%|█████▌    | 672/1208 [19:00<15:09,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000105, train/loss_step=0.0284, global_step=7113.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  56%|█████▌    | 673/1208 [19:01<15:07,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000105, train/loss_step=0.0284, global_step=7113.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  56%|█████▌    | 673/1208 [19:01<15:07,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0057, train/loss_vlb_step=2.91e-5, train/loss_step=0.0057, global_step=7114.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  56%|█████▌    | 674/1208 [19:02<15:05,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0057, train/loss_vlb_step=2.91e-5, train/loss_step=0.0057, global_step=7114.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  56%|█████▌    | 674/1208 [19:02<15:05,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=9.64e-5, train/loss_step=0.0248, global_step=7114.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  56%|█████▌    | 675/1208 [19:03<15:03,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=9.64e-5, train/loss_step=0.0248, global_step=7114.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  56%|█████▌    | 675/1208 [19:03<15:03,  1.69s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00943, train/loss_vlb_step=4.37e-5, train/loss_step=0.00943, global_step=7114.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  56%|█████▌    | 676/1208 [19:06<15:02,  1.70s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00943, train/loss_vlb_step=4.37e-5, train/loss_step=0.00943, global_step=7114.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  56%|█████▌    | 676/1208 [19:06<15:02,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000374, train/loss_step=0.114, global_step=7114.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  56%|█████▌    | 677/1208 [19:07<15:00,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000374, train/loss_step=0.114, global_step=7114.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  56%|█████▌    | 677/1208 [19:07<15:00,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00098, train/loss_step=0.245, global_step=7115.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  56%|█████▌    | 678/1208 [19:08<14:58,  1.69s/it, loss=0.149, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00098, train/loss_step=0.245, global_step=7115.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  56%|█████▌    | 678/1208 [19:08<14:58,  1.69s/it, loss=0.145, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000514, train/loss_step=0.153, global_step=7115.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  56%|█████▌    | 679/1208 [19:09<14:55,  1.69s/it, loss=0.145, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000514, train/loss_step=0.153, global_step=7115.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  56%|█████▌    | 679/1208 [19:09<14:55,  1.69s/it, loss=0.148, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00156, train/loss_step=0.319, global_step=7115.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  56%|█████▋    | 680/1208 [19:13<14:55,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00156, train/loss_step=0.319, global_step=7115.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  56%|█████▋    | 680/1208 [19:13<14:55,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=9.87e-5, train/loss_step=0.0253, global_step=7115.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  56%|█████▋    | 681/1208 [19:14<14:53,  1.69s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=9.87e-5, train/loss_step=0.0253, global_step=7115.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  56%|█████▋    | 681/1208 [19:14<14:53,  1.69s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0961, train/loss_vlb_step=0.000316, train/loss_step=0.0961, global_step=7116.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  56%|█████▋    | 682/1208 [19:15<14:51,  1.69s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0961, train/loss_vlb_step=0.000316, train/loss_step=0.0961, global_step=7116.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  56%|█████▋    | 682/1208 [19:15<14:51,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00139, train/loss_step=0.293, global_step=7116.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  57%|█████▋    | 683/1208 [19:16<14:48,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00139, train/loss_step=0.293, global_step=7116.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  57%|█████▋    | 683/1208 [19:16<14:48,  1.69s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000113, train/loss_step=0.0291, global_step=7116.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  57%|█████▋    | 684/1208 [19:19<14:48,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000113, train/loss_step=0.0291, global_step=7116.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  57%|█████▋    | 684/1208 [19:19<14:48,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00124, train/loss_step=0.280, global_step=7116.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  57%|█████▋    | 685/1208 [19:20<14:46,  1.69s/it, loss=0.164, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00124, train/loss_step=0.280, global_step=7116.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  57%|█████▋    | 685/1208 [19:20<14:46,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=5.08e-5, train/loss_step=0.0106, global_step=7117.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  57%|█████▋    | 686/1208 [19:21<14:43,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=5.08e-5, train/loss_step=0.0106, global_step=7117.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  57%|█████▋    | 686/1208 [19:21<14:43,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000337, train/loss_step=0.103, global_step=7117.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  57%|█████▋    | 687/1208 [19:22<14:41,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000337, train/loss_step=0.103, global_step=7117.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  57%|█████▋    | 687/1208 [19:22<14:41,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.0013, train/loss_step=0.286, global_step=7117.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  57%|█████▋    | 688/1208 [19:25<14:41,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.0013, train/loss_step=0.286, global_step=7117.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  57%|█████▋    | 688/1208 [19:25<14:41,  1.69s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.32e-5, train/loss_step=0.0227, global_step=7117.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  57%|█████▋    | 689/1208 [19:26<14:38,  1.69s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.32e-5, train/loss_step=0.0227, global_step=7117.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  57%|█████▋    | 689/1208 [19:26<14:38,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00126, train/loss_step=0.287, global_step=7118.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  57%|█████▋    | 690/1208 [19:27<14:36,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00126, train/loss_step=0.287, global_step=7118.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  57%|█████▋    | 690/1208 [19:27<14:36,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000609, train/loss_step=0.174, global_step=7118.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  57%|█████▋    | 691/1208 [19:29<14:34,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000609, train/loss_step=0.174, global_step=7118.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  57%|█████▋    | 691/1208 [19:29<14:34,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0546, train/loss_vlb_step=0.000186, train/loss_step=0.0546, global_step=7118.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  57%|█████▋    | 692/1208 [19:32<14:34,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0546, train/loss_vlb_step=0.000186, train/loss_step=0.0546, global_step=7118.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  57%|█████▋    | 692/1208 [19:32<14:34,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.000117, train/loss_step=0.0322, global_step=7118.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  57%|█████▋    | 693/1208 [19:33<14:31,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.000117, train/loss_step=0.0322, global_step=7118.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  57%|█████▋    | 693/1208 [19:33<14:31,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.52e-5, train/loss_step=0.00475, global_step=7119.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  57%|█████▋    | 694/1208 [19:34<14:29,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.52e-5, train/loss_step=0.00475, global_step=7119.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  57%|█████▋    | 694/1208 [19:34<14:29,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.037, train/loss_vlb_step=0.000133, train/loss_step=0.037, global_step=7119.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  58%|█████▊    | 695/1208 [19:35<14:27,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.037, train/loss_vlb_step=0.000133, train/loss_step=0.037, global_step=7119.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  58%|█████▊    | 695/1208 [19:35<14:27,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0493, train/loss_vlb_step=0.000178, train/loss_step=0.0493, global_step=7119.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  58%|█████▊    | 696/1208 [19:38<14:26,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0493, train/loss_vlb_step=0.000178, train/loss_step=0.0493, global_step=7119.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  58%|█████▊    | 696/1208 [19:38<14:26,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000133, train/loss_step=0.0358, global_step=7119.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  58%|█████▊    | 697/1208 [19:39<14:24,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000133, train/loss_step=0.0358, global_step=7119.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  58%|█████▊    | 697/1208 [19:39<14:24,  1.69s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000274, train/loss_step=0.0815, global_step=7120.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  58%|█████▊    | 698/1208 [19:40<14:22,  1.69s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000274, train/loss_step=0.0815, global_step=7120.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  58%|█████▊    | 698/1208 [19:40<14:22,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.534, train/loss_vlb_step=0.0143, train/loss_step=0.534, global_step=7120.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  58%|█████▊    | 699/1208 [19:41<14:20,  1.69s/it, loss=0.138, v_num=0, train/loss_simple_step=0.534, train/loss_vlb_step=0.0143, train/loss_step=0.534, global_step=7120.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  58%|█████▊    | 699/1208 [19:41<14:20,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0924, train/loss_vlb_step=0.000308, train/loss_step=0.0924, global_step=7120.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  58%|█████▊    | 700/1208 [19:44<14:19,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0924, train/loss_vlb_step=0.000308, train/loss_step=0.0924, global_step=7120.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  58%|█████▊    | 700/1208 [19:44<14:19,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00301, train/loss_vlb_step=1.68e-5, train/loss_step=0.00301, global_step=7120.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  58%|█████▊    | 701/1208 [19:45<14:17,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00301, train/loss_vlb_step=1.68e-5, train/loss_step=0.00301, global_step=7120.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  58%|█████▊    | 701/1208 [19:45<14:17,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00542, train/loss_vlb_step=2.84e-5, train/loss_step=0.00542, global_step=7121.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  58%|█████▊    | 702/1208 [19:46<14:15,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00542, train/loss_vlb_step=2.84e-5, train/loss_step=0.00542, global_step=7121.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  58%|█████▊    | 702/1208 [19:46<14:15,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.06e-5, train/loss_step=0.0112, global_step=7121.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  58%|█████▊    | 703/1208 [19:47<14:13,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.06e-5, train/loss_step=0.0112, global_step=7121.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  58%|█████▊    | 703/1208 [19:47<14:13,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000453, train/loss_step=0.134, global_step=7121.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  58%|█████▊    | 704/1208 [19:51<14:12,  1.69s/it, loss=0.112, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000453, train/loss_step=0.134, global_step=7121.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  58%|█████▊    | 704/1208 [19:51<14:12,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0823, train/loss_vlb_step=0.000271, train/loss_step=0.0823, global_step=7121.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  58%|█████▊    | 705/1208 [19:52<14:10,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0823, train/loss_vlb_step=0.000271, train/loss_step=0.0823, global_step=7121.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  58%|█████▊    | 705/1208 [19:52<14:10,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00944, train/loss_vlb_step=4.45e-5, train/loss_step=0.00944, global_step=7122.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  58%|█████▊    | 706/1208 [19:53<14:08,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00944, train/loss_vlb_step=4.45e-5, train/loss_step=0.00944, global_step=7122.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  58%|█████▊    | 706/1208 [19:53<14:08,  1.69s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=3.19e-5, train/loss_step=0.00619, global_step=7122.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  59%|█████▊    | 707/1208 [19:54<14:06,  1.69s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=3.19e-5, train/loss_step=0.00619, global_step=7122.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  59%|█████▊    | 707/1208 [19:54<14:06,  1.69s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000472, train/loss_step=0.140, global_step=7122.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  59%|█████▊    | 708/1208 [19:57<14:05,  1.69s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000472, train/loss_step=0.140, global_step=7122.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  59%|█████▊    | 708/1208 [19:57<14:05,  1.69s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=1.3e-5, train/loss_step=0.00221, global_step=7122.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  59%|█████▊    | 709/1208 [19:58<14:03,  1.69s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=1.3e-5, train/loss_step=0.00221, global_step=7122.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  59%|█████▊    | 709/1208 [19:58<14:03,  1.69s/it, loss=0.0766, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000154, train/loss_step=0.0412, global_step=7123.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  59%|█████▉    | 710/1208 [19:59<14:01,  1.69s/it, loss=0.0766, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000154, train/loss_step=0.0412, global_step=7123.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  59%|█████▉    | 710/1208 [19:59<14:01,  1.69s/it, loss=0.0691, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.16e-5, train/loss_step=0.0241, global_step=7123.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  59%|█████▉    | 711/1208 [20:00<13:59,  1.69s/it, loss=0.0691, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.16e-5, train/loss_step=0.0241, global_step=7123.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  59%|█████▉    | 711/1208 [20:00<13:59,  1.69s/it, loss=0.0665, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.69e-5, train/loss_step=0.00311, global_step=7123.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  59%|█████▉    | 712/1208 [20:03<13:58,  1.69s/it, loss=0.0665, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.69e-5, train/loss_step=0.00311, global_step=7123.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  59%|█████▉    | 712/1208 [20:03<13:58,  1.69s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.613, train/loss_vlb_step=0.0215, train/loss_step=0.613, global_step=7123.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]     Epoch 23:  59%|█████▉    | 713/1208 [20:04<13:56,  1.69s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.613, train/loss_vlb_step=0.0215, train/loss_step=0.613, global_step=7123.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  59%|█████▉    | 713/1208 [20:04<13:56,  1.69s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.68e-5, train/loss_step=0.0214, global_step=7124.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  59%|█████▉    | 714/1208 [20:05<13:54,  1.69s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.68e-5, train/loss_step=0.0214, global_step=7124.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  59%|█████▉    | 714/1208 [20:05<13:54,  1.69s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.11e-5, train/loss_step=0.00188, global_step=7124.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  59%|█████▉    | 715/1208 [20:06<13:52,  1.69s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.11e-5, train/loss_step=0.00188, global_step=7124.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  59%|█████▉    | 715/1208 [20:06<13:52,  1.69s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.0834, train/loss_vlb_step=0.000277, train/loss_step=0.0834, global_step=7124.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  59%|█████▉    | 716/1208 [20:10<13:51,  1.69s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.0834, train/loss_vlb_step=0.000277, train/loss_step=0.0834, global_step=7124.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  59%|█████▉    | 716/1208 [20:10<13:51,  1.69s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000112, train/loss_step=0.0299, global_step=7124.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  59%|█████▉    | 717/1208 [20:11<13:49,  1.69s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000112, train/loss_step=0.0299, global_step=7124.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  59%|█████▉    | 717/1208 [20:11<13:49,  1.69s/it, loss=0.105, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00114, train/loss_step=0.267, global_step=7125.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  59%|█████▉    | 718/1208 [20:12<13:47,  1.69s/it, loss=0.105, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00114, train/loss_step=0.267, global_step=7125.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  59%|█████▉    | 718/1208 [20:12<13:47,  1.69s/it, loss=0.0791, v_num=0, train/loss_simple_step=0.00965, train/loss_vlb_step=4.53e-5, train/loss_step=0.00965, global_step=7125.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  60%|█████▉    | 719/1208 [20:13<13:45,  1.69s/it, loss=0.0791, v_num=0, train/loss_simple_step=0.00965, train/loss_vlb_step=4.53e-5, train/loss_step=0.00965, global_step=7125.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  60%|█████▉    | 719/1208 [20:13<13:45,  1.69s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00137, train/loss_step=0.288, global_step=7125.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  60%|█████▉    | 720/1208 [20:16<13:44,  1.69s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00137, train/loss_step=0.288, global_step=7125.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  60%|█████▉    | 720/1208 [20:16<13:44,  1.69s/it, loss=0.0945, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000383, train/loss_step=0.117, global_step=7125.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  60%|█████▉    | 721/1208 [20:17<13:42,  1.69s/it, loss=0.0945, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000383, train/loss_step=0.117, global_step=7125.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  60%|█████▉    | 721/1208 [20:17<13:42,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000515, train/loss_step=0.153, global_step=7126.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  60%|█████▉    | 722/1208 [20:18<13:40,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000515, train/loss_step=0.153, global_step=7126.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  60%|█████▉    | 722/1208 [20:18<13:40,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0366, train/loss_vlb_step=0.000135, train/loss_step=0.0366, global_step=7126.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  60%|█████▉    | 723/1208 [20:19<13:38,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0366, train/loss_vlb_step=0.000135, train/loss_step=0.0366, global_step=7126.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  60%|█████▉    | 723/1208 [20:19<13:38,  1.69s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.00683, train/loss_vlb_step=3.35e-5, train/loss_step=0.00683, global_step=7126.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  60%|█████▉    | 724/1208 [20:22<13:37,  1.69s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.00683, train/loss_vlb_step=3.35e-5, train/loss_step=0.00683, global_step=7126.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  60%|█████▉    | 724/1208 [20:22<13:37,  1.69s/it, loss=0.104, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000976, train/loss_step=0.226, global_step=7126.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  60%|██████    | 725/1208 [20:23<13:35,  1.69s/it, loss=0.104, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000976, train/loss_step=0.226, global_step=7126.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  60%|██████    | 725/1208 [20:23<13:35,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0963, train/loss_vlb_step=0.000317, train/loss_step=0.0963, global_step=7127.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  60%|██████    | 726/1208 [20:24<13:33,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0963, train/loss_vlb_step=0.000317, train/loss_step=0.0963, global_step=7127.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  60%|██████    | 726/1208 [20:24<13:33,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00204, train/loss_step=0.303, global_step=7127.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  60%|██████    | 727/1208 [20:25<13:31,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00204, train/loss_step=0.303, global_step=7127.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  60%|██████    | 727/1208 [20:25<13:31,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000795, train/loss_step=0.213, global_step=7127.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  60%|██████    | 728/1208 [20:29<13:30,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000795, train/loss_step=0.213, global_step=7127.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  60%|██████    | 728/1208 [20:29<13:30,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.0002, train/loss_step=0.0588, global_step=7127.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  60%|██████    | 729/1208 [20:30<13:28,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.0002, train/loss_step=0.0588, global_step=7127.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  60%|██████    | 729/1208 [20:30<13:28,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.000151, train/loss_step=0.041, global_step=7128.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  60%|██████    | 730/1208 [20:31<13:26,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.000151, train/loss_step=0.041, global_step=7128.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  60%|██████    | 730/1208 [20:31<13:26,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=8.05e-5, train/loss_step=0.0189, global_step=7128.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  61%|██████    | 731/1208 [20:32<13:24,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=8.05e-5, train/loss_step=0.0189, global_step=7128.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  61%|██████    | 731/1208 [20:32<13:24,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.82e-5, train/loss_step=0.0102, global_step=7128.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  61%|██████    | 732/1208 [20:35<13:23,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.82e-5, train/loss_step=0.0102, global_step=7128.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  61%|██████    | 732/1208 [20:35<13:23,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0873, train/loss_vlb_step=0.000287, train/loss_step=0.0873, global_step=7128.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  61%|██████    | 733/1208 [20:36<13:21,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0873, train/loss_vlb_step=0.000287, train/loss_step=0.0873, global_step=7128.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  61%|██████    | 733/1208 [20:36<13:21,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000398, train/loss_step=0.121, global_step=7129.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  61%|██████    | 734/1208 [20:37<13:19,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000398, train/loss_step=0.121, global_step=7129.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  61%|██████    | 734/1208 [20:37<13:19,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00168, train/loss_step=0.344, global_step=7129.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  61%|██████    | 735/1208 [20:38<13:17,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00168, train/loss_step=0.344, global_step=7129.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  61%|██████    | 735/1208 [20:38<13:17,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0668, train/loss_vlb_step=0.000228, train/loss_step=0.0668, global_step=7129.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  61%|██████    | 736/1208 [20:41<13:16,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0668, train/loss_vlb_step=0.000228, train/loss_step=0.0668, global_step=7129.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  61%|██████    | 736/1208 [20:41<13:16,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000528, train/loss_step=0.153, global_step=7129.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  61%|██████    | 737/1208 [20:42<13:14,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000528, train/loss_step=0.153, global_step=7129.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  61%|██████    | 737/1208 [20:42<13:14,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00297, train/loss_vlb_step=1.7e-5, train/loss_step=0.00297, global_step=7130.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  61%|██████    | 738/1208 [20:43<13:12,  1.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00297, train/loss_vlb_step=1.7e-5, train/loss_step=0.00297, global_step=7130.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  61%|██████    | 738/1208 [20:43<13:12,  1.69s/it, loss=0.144, v_num=0, train/loss_simple_step=0.539, train/loss_vlb_step=0.00606, train/loss_step=0.539, global_step=7130.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  61%|██████    | 739/1208 [20:44<13:10,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.539, train/loss_vlb_step=0.00606, train/loss_step=0.539, global_step=7130.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  61%|██████    | 739/1208 [20:44<13:10,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.595, train/loss_vlb_step=0.0116, train/loss_step=0.595, global_step=7130.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  61%|██████▏   | 740/1208 [20:48<13:09,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.595, train/loss_vlb_step=0.0116, train/loss_step=0.595, global_step=7130.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  61%|██████▏   | 740/1208 [20:48<13:09,  1.69s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=1.5e-5, train/loss_step=0.00262, global_step=7130.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  61%|██████▏   | 741/1208 [20:49<13:07,  1.69s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=1.5e-5, train/loss_step=0.00262, global_step=7130.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  61%|██████▏   | 741/1208 [20:49<13:07,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000109, train/loss_step=0.0281, global_step=7131.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  61%|██████▏   | 742/1208 [20:50<13:05,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000109, train/loss_step=0.0281, global_step=7131.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  61%|██████▏   | 742/1208 [20:50<13:05,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000109, train/loss_step=0.0283, global_step=7131.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  62%|██████▏   | 743/1208 [20:51<13:03,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000109, train/loss_step=0.0283, global_step=7131.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  62%|██████▏   | 743/1208 [20:51<13:03,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000676, train/loss_step=0.184, global_step=7131.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  62%|██████▏   | 744/1208 [20:54<13:02,  1.69s/it, loss=0.156, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000676, train/loss_step=0.184, global_step=7131.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  62%|██████▏   | 744/1208 [20:54<13:02,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0549, train/loss_vlb_step=0.000187, train/loss_step=0.0549, global_step=7131.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  62%|██████▏   | 745/1208 [20:55<13:00,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0549, train/loss_vlb_step=0.000187, train/loss_step=0.0549, global_step=7131.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  62%|██████▏   | 745/1208 [20:55<13:00,  1.69s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0549, train/loss_vlb_step=0.000191, train/loss_step=0.0549, global_step=7132.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  62%|██████▏   | 746/1208 [20:56<12:58,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0549, train/loss_vlb_step=0.000191, train/loss_step=0.0549, global_step=7132.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  62%|██████▏   | 746/1208 [20:56<12:58,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00811, train/loss_vlb_step=3.91e-5, train/loss_step=0.00811, global_step=7132.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  62%|██████▏   | 747/1208 [20:57<12:56,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00811, train/loss_vlb_step=3.91e-5, train/loss_step=0.00811, global_step=7132.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  62%|██████▏   | 747/1208 [20:57<12:56,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0762, train/loss_vlb_step=0.000253, train/loss_step=0.0762, global_step=7132.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  62%|██████▏   | 748/1208 [21:00<12:55,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0762, train/loss_vlb_step=0.000253, train/loss_step=0.0762, global_step=7132.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  62%|██████▏   | 748/1208 [21:00<12:55,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00426, train/loss_vlb_step=2.29e-5, train/loss_step=0.00426, global_step=7132.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  62%|██████▏   | 749/1208 [21:01<12:53,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00426, train/loss_vlb_step=2.29e-5, train/loss_step=0.00426, global_step=7132.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  62%|██████▏   | 749/1208 [21:01<12:53,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.92e-5, train/loss_step=0.0162, global_step=7133.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  62%|██████▏   | 750/1208 [21:02<12:51,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.92e-5, train/loss_step=0.0162, global_step=7133.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  62%|██████▏   | 750/1208 [21:02<12:51,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.000142, train/loss_step=0.0401, global_step=7133.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  62%|██████▏   | 751/1208 [21:03<12:49,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.000142, train/loss_step=0.0401, global_step=7133.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  62%|██████▏   | 751/1208 [21:03<12:49,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.550, train/loss_vlb_step=0.00564, train/loss_step=0.550, global_step=7133.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  62%|██████▏   | 752/1208 [21:07<12:48,  1.69s/it, loss=0.148, v_num=0, train/loss_simple_step=0.550, train/loss_vlb_step=0.00564, train/loss_step=0.550, global_step=7133.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  62%|██████▏   | 752/1208 [21:07<12:48,  1.69s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0398, train/loss_vlb_step=0.00014, train/loss_step=0.0398, global_step=7133.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  62%|██████▏   | 753/1208 [21:08<12:46,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0398, train/loss_vlb_step=0.00014, train/loss_step=0.0398, global_step=7133.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  62%|██████▏   | 753/1208 [21:08<12:46,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00857, train/loss_vlb_step=4.06e-5, train/loss_step=0.00857, global_step=7134.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  62%|██████▏   | 754/1208 [21:09<12:44,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00857, train/loss_vlb_step=4.06e-5, train/loss_step=0.00857, global_step=7134.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  62%|██████▏   | 754/1208 [21:09<12:44,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000894, train/loss_step=0.233, global_step=7134.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  62%|██████▎   | 755/1208 [21:10<12:42,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000894, train/loss_step=0.233, global_step=7134.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  62%|██████▎   | 755/1208 [21:10<12:42,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=1.09e-5, train/loss_step=0.0019, global_step=7134.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  63%|██████▎   | 756/1208 [21:13<12:41,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=1.09e-5, train/loss_step=0.0019, global_step=7134.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  63%|██████▎   | 756/1208 [21:13<12:41,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00149, train/loss_step=0.301, global_step=7134.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  63%|██████▎   | 757/1208 [21:14<12:39,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00149, train/loss_step=0.301, global_step=7134.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  63%|██████▎   | 757/1208 [21:14<12:39,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00691, train/loss_vlb_step=3.46e-5, train/loss_step=0.00691, global_step=7135.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  63%|██████▎   | 758/1208 [21:15<12:37,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00691, train/loss_vlb_step=3.46e-5, train/loss_step=0.00691, global_step=7135.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  63%|██████▎   | 758/1208 [21:15<12:37,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000436, train/loss_step=0.131, global_step=7135.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  63%|██████▎   | 759/1208 [21:16<12:35,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000436, train/loss_step=0.131, global_step=7135.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  63%|██████▎   | 759/1208 [21:16<12:35,  1.68s/it, loss=0.0892, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.35e-5, train/loss_step=0.0144, global_step=7135.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  63%|██████▎   | 760/1208 [21:19<12:34,  1.68s/it, loss=0.0892, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.35e-5, train/loss_step=0.0144, global_step=7135.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  63%|██████▎   | 760/1208 [21:19<12:34,  1.68s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.2e-5, train/loss_step=0.0168, global_step=7135.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  63%|██████▎   | 761/1208 [21:20<12:32,  1.68s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.2e-5, train/loss_step=0.0168, global_step=7135.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  63%|██████▎   | 761/1208 [21:20<12:32,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.487, train/loss_vlb_step=0.00566, train/loss_step=0.487, global_step=7136.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  63%|██████▎   | 762/1208 [21:21<12:30,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.487, train/loss_vlb_step=0.00566, train/loss_step=0.487, global_step=7136.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  63%|██████▎   | 762/1208 [21:21<12:30,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=7136.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  63%|██████▎   | 763/1208 [21:22<12:28,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=7136.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  63%|██████▎   | 763/1208 [21:22<12:28,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000802, train/loss_step=0.208, global_step=7136.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  63%|██████▎   | 764/1208 [21:26<12:27,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000802, train/loss_step=0.208, global_step=7136.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  63%|██████▎   | 764/1208 [21:26<12:27,  1.68s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.3e-5, train/loss_step=0.0138, global_step=7136.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  63%|██████▎   | 765/1208 [21:27<12:25,  1.68s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.3e-5, train/loss_step=0.0138, global_step=7136.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  63%|██████▎   | 765/1208 [21:27<12:25,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.000126, train/loss_step=0.033, global_step=7137.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  63%|██████▎   | 766/1208 [21:28<12:23,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.000126, train/loss_step=0.033, global_step=7137.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  63%|██████▎   | 766/1208 [21:28<12:23,  1.68s/it, loss=0.116, v_num=0, train/loss_simple_step=0.028, train/loss_vlb_step=0.000108, train/loss_step=0.028, global_step=7137.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  63%|██████▎   | 767/1208 [21:29<12:21,  1.68s/it, loss=0.116, v_num=0, train/loss_simple_step=0.028, train/loss_vlb_step=0.000108, train/loss_step=0.028, global_step=7137.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  63%|██████▎   | 767/1208 [21:29<12:21,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=9.23e-5, train/loss_step=0.0213, global_step=7137.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  64%|██████▎   | 768/1208 [21:32<12:20,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=9.23e-5, train/loss_step=0.0213, global_step=7137.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  64%|██████▎   | 768/1208 [21:32<12:20,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000464, train/loss_step=0.140, global_step=7137.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  64%|██████▎   | 769/1208 [21:33<12:18,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000464, train/loss_step=0.140, global_step=7137.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  64%|██████▎   | 769/1208 [21:33<12:18,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00109, train/loss_step=0.250, global_step=7138.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  64%|██████▎   | 770/1208 [21:34<12:16,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00109, train/loss_step=0.250, global_step=7138.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  64%|██████▎   | 770/1208 [21:34<12:16,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000593, train/loss_step=0.170, global_step=7138.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  64%|██████▍   | 771/1208 [21:35<12:14,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000593, train/loss_step=0.170, global_step=7138.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  64%|██████▍   | 771/1208 [21:35<12:14,  1.68s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00744, train/loss_vlb_step=3.62e-5, train/loss_step=0.00744, global_step=7138.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  64%|██████▍   | 772/1208 [21:38<12:13,  1.68s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00744, train/loss_vlb_step=3.62e-5, train/loss_step=0.00744, global_step=7138.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  64%|██████▍   | 772/1208 [21:38<12:13,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.8e-5, train/loss_step=0.00557, global_step=7138.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  64%|██████▍   | 773/1208 [21:39<12:11,  1.68s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.8e-5, train/loss_step=0.00557, global_step=7138.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  64%|██████▍   | 773/1208 [21:39<12:11,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000951, train/loss_step=0.245, global_step=7139.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  64%|██████▍   | 774/1208 [21:40<12:09,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000951, train/loss_step=0.245, global_step=7139.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  64%|██████▍   | 774/1208 [21:40<12:09,  1.68s/it, loss=0.11, v_num=0, train/loss_simple_step=0.005, train/loss_vlb_step=2.64e-5, train/loss_step=0.005, global_step=7139.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  64%|██████▍   | 775/1208 [21:41<12:07,  1.68s/it, loss=0.11, v_num=0, train/loss_simple_step=0.005, train/loss_vlb_step=2.64e-5, train/loss_step=0.005, global_step=7139.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  64%|██████▍   | 775/1208 [21:41<12:07,  1.68s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.05e-5, train/loss_step=0.00175, global_step=7139.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  64%|██████▍   | 776/1208 [21:45<12:06,  1.68s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.05e-5, train/loss_step=0.00175, global_step=7139.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  64%|██████▍   | 776/1208 [21:45<12:06,  1.68s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=0.000109, train/loss_step=0.0259, global_step=7139.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  64%|██████▍   | 777/1208 [21:46<12:04,  1.68s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=0.000109, train/loss_step=0.0259, global_step=7139.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  64%|██████▍   | 777/1208 [21:46<12:04,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.479, train/loss_vlb_step=0.00709, train/loss_step=0.479, global_step=7140.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  64%|██████▍   | 778/1208 [21:47<12:02,  1.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.479, train/loss_vlb_step=0.00709, train/loss_step=0.479, global_step=7140.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  64%|██████▍   | 778/1208 [21:47<12:02,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.52e-5, train/loss_step=0.00272, global_step=7140.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  64%|██████▍   | 779/1208 [21:48<12:00,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.52e-5, train/loss_step=0.00272, global_step=7140.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  64%|██████▍   | 779/1208 [21:48<12:00,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0305, train/loss_vlb_step=0.000111, train/loss_step=0.0305, global_step=7140.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  65%|██████▍   | 780/1208 [21:51<11:59,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0305, train/loss_vlb_step=0.000111, train/loss_step=0.0305, global_step=7140.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  65%|██████▍   | 780/1208 [21:51<11:59,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00702, train/loss_vlb_step=3.5e-5, train/loss_step=0.00702, global_step=7140.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  65%|██████▍   | 781/1208 [21:52<11:57,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00702, train/loss_vlb_step=3.5e-5, train/loss_step=0.00702, global_step=7140.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  65%|██████▍   | 781/1208 [21:52<11:57,  1.68s/it, loss=0.111, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00467, train/loss_step=0.435, global_step=7141.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  65%|██████▍   | 782/1208 [21:53<11:55,  1.68s/it, loss=0.111, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00467, train/loss_step=0.435, global_step=7141.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  65%|██████▍   | 782/1208 [21:53<11:55,  1.68s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.4e-5, train/loss_step=0.0144, global_step=7141.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  65%|██████▍   | 783/1208 [21:54<11:53,  1.68s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.4e-5, train/loss_step=0.0144, global_step=7141.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  65%|██████▍   | 783/1208 [21:54<11:53,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00152, train/loss_step=0.328, global_step=7141.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  65%|██████▍   | 784/1208 [21:57<11:52,  1.68s/it, loss=0.112, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00152, train/loss_step=0.328, global_step=7141.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  65%|██████▍   | 784/1208 [21:57<11:52,  1.68s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0935, train/loss_vlb_step=0.000309, train/loss_step=0.0935, global_step=7141.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  65%|██████▍   | 785/1208 [21:58<11:50,  1.68s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0935, train/loss_vlb_step=0.000309, train/loss_step=0.0935, global_step=7141.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  65%|██████▍   | 785/1208 [21:58<11:50,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.0022, train/loss_step=0.378, global_step=7142.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  65%|██████▌   | 786/1208 [21:59<11:48,  1.68s/it, loss=0.133, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.0022, train/loss_step=0.378, global_step=7142.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  65%|██████▌   | 786/1208 [21:59<11:48,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000521, train/loss_step=0.153, global_step=7142.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  65%|██████▌   | 787/1208 [22:00<11:46,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000521, train/loss_step=0.153, global_step=7142.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  65%|██████▌   | 787/1208 [22:00<11:46,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000456, train/loss_step=0.139, global_step=7142.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  65%|██████▌   | 788/1208 [22:04<11:45,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000456, train/loss_step=0.139, global_step=7142.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  65%|██████▌   | 788/1208 [22:04<11:45,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.451, train/loss_vlb_step=0.00587, train/loss_step=0.451, global_step=7142.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  65%|██████▌   | 789/1208 [22:05<11:43,  1.68s/it, loss=0.161, v_num=0, train/loss_simple_step=0.451, train/loss_vlb_step=0.00587, train/loss_step=0.451, global_step=7142.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  65%|██████▌   | 789/1208 [22:05<11:43,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000963, train/loss_step=0.237, global_step=7143.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  65%|██████▌   | 790/1208 [22:06<11:41,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000963, train/loss_step=0.237, global_step=7143.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  65%|██████▌   | 790/1208 [22:06<11:41,  1.68s/it, loss=0.185, v_num=0, train/loss_simple_step=0.666, train/loss_vlb_step=0.0207, train/loss_step=0.666, global_step=7143.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  65%|██████▌   | 791/1208 [22:07<11:39,  1.68s/it, loss=0.185, v_num=0, train/loss_simple_step=0.666, train/loss_vlb_step=0.0207, train/loss_step=0.666, global_step=7143.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  65%|██████▌   | 791/1208 [22:07<11:39,  1.68s/it, loss=0.193, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000604, train/loss_step=0.169, global_step=7143.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  66%|██████▌   | 792/1208 [22:10<11:38,  1.68s/it, loss=0.193, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000604, train/loss_step=0.169, global_step=7143.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  66%|██████▌   | 792/1208 [22:10<11:38,  1.68s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=2.65e-5, train/loss_step=0.00518, global_step=7143.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  66%|██████▌   | 793/1208 [22:11<11:36,  1.68s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=2.65e-5, train/loss_step=0.00518, global_step=7143.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  66%|██████▌   | 793/1208 [22:11<11:36,  1.68s/it, loss=0.182, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.37e-5, train/loss_step=0.012, global_step=7144.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  66%|██████▌   | 794/1208 [22:12<11:34,  1.68s/it, loss=0.182, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.37e-5, train/loss_step=0.012, global_step=7144.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  66%|██████▌   | 794/1208 [22:12<11:34,  1.68s/it, loss=0.211, v_num=0, train/loss_simple_step=0.595, train/loss_vlb_step=0.0109, train/loss_step=0.595, global_step=7144.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  66%|██████▌   | 795/1208 [22:13<11:32,  1.68s/it, loss=0.211, v_num=0, train/loss_simple_step=0.595, train/loss_vlb_step=0.0109, train/loss_step=0.595, global_step=7144.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  66%|██████▌   | 795/1208 [22:13<11:32,  1.68s/it, loss=0.225, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00127, train/loss_step=0.275, global_step=7144.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  66%|██████▌   | 796/1208 [22:16<11:31,  1.68s/it, loss=0.225, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00127, train/loss_step=0.275, global_step=7144.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  66%|██████▌   | 796/1208 [22:16<11:31,  1.68s/it, loss=0.225, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=8.1e-5, train/loss_step=0.0187, global_step=7144.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  66%|██████▌   | 797/1208 [22:17<11:29,  1.68s/it, loss=0.225, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=8.1e-5, train/loss_step=0.0187, global_step=7144.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  66%|██████▌   | 797/1208 [22:17<11:29,  1.68s/it, loss=0.204, v_num=0, train/loss_simple_step=0.077, train/loss_vlb_step=0.000261, train/loss_step=0.077, global_step=7145.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  66%|██████▌   | 798/1208 [22:18<11:27,  1.68s/it, loss=0.204, v_num=0, train/loss_simple_step=0.077, train/loss_vlb_step=0.000261, train/loss_step=0.077, global_step=7145.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  66%|██████▌   | 798/1208 [22:18<11:27,  1.68s/it, loss=0.204, v_num=0, train/loss_simple_step=0.0035, train/loss_vlb_step=1.88e-5, train/loss_step=0.0035, global_step=7145.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  66%|██████▌   | 799/1208 [22:19<11:25,  1.68s/it, loss=0.204, v_num=0, train/loss_simple_step=0.0035, train/loss_vlb_step=1.88e-5, train/loss_step=0.0035, global_step=7145.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  66%|██████▌   | 799/1208 [22:19<11:25,  1.68s/it, loss=0.223, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.0029, train/loss_step=0.403, global_step=7145.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  66%|██████▌   | 800/1208 [22:23<11:25,  1.68s/it, loss=0.223, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.0029, train/loss_step=0.403, global_step=7145.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  66%|██████▌   | 800/1208 [22:23<11:25,  1.68s/it, loss=0.234, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000961, train/loss_step=0.223, global_step=7145.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  66%|██████▋   | 801/1208 [22:24<11:23,  1.68s/it, loss=0.234, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000961, train/loss_step=0.223, global_step=7145.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  66%|██████▋   | 801/1208 [22:24<11:23,  1.68s/it, loss=0.223, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000806, train/loss_step=0.214, global_step=7146.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  66%|██████▋   | 802/1208 [22:25<11:21,  1.68s/it, loss=0.223, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000806, train/loss_step=0.214, global_step=7146.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  66%|██████▋   | 802/1208 [22:25<11:21,  1.68s/it, loss=0.249, v_num=0, train/loss_simple_step=0.533, train/loss_vlb_step=0.012, train/loss_step=0.533, global_step=7146.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  66%|██████▋   | 803/1208 [22:26<11:19,  1.68s/it, loss=0.249, v_num=0, train/loss_simple_step=0.533, train/loss_vlb_step=0.012, train/loss_step=0.533, global_step=7146.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  66%|██████▋   | 803/1208 [22:26<11:19,  1.68s/it, loss=0.234, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000131, train/loss_step=0.035, global_step=7146.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  67%|██████▋   | 804/1208 [22:29<11:18,  1.68s/it, loss=0.234, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000131, train/loss_step=0.035, global_step=7146.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  67%|██████▋   | 804/1208 [22:29<11:18,  1.68s/it, loss=0.23, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=9.06e-5, train/loss_step=0.0221, global_step=7146.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  67%|██████▋   | 805/1208 [22:30<11:16,  1.68s/it, loss=0.23, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=9.06e-5, train/loss_step=0.0221, global_step=7146.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  67%|██████▋   | 805/1208 [22:30<11:16,  1.68s/it, loss=0.213, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.28e-5, train/loss_step=0.0231, global_step=7147.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  67%|██████▋   | 806/1208 [22:31<11:14,  1.68s/it, loss=0.213, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.28e-5, train/loss_step=0.0231, global_step=7147.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  67%|██████▋   | 806/1208 [22:31<11:14,  1.68s/it, loss=0.205, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.32e-5, train/loss_step=0.00236, global_step=7147.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  67%|██████▋   | 807/1208 [22:32<11:12,  1.68s/it, loss=0.205, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.32e-5, train/loss_step=0.00236, global_step=7147.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  67%|██████▋   | 807/1208 [22:32<11:12,  1.68s/it, loss=0.216, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00208, train/loss_step=0.353, global_step=7147.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  67%|██████▋   | 808/1208 [22:35<11:11,  1.68s/it, loss=0.216, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00208, train/loss_step=0.353, global_step=7147.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  67%|██████▋   | 808/1208 [22:35<11:11,  1.68s/it, loss=0.204, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.00077, train/loss_step=0.207, global_step=7147.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  67%|██████▋   | 809/1208 [22:36<11:09,  1.68s/it, loss=0.204, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.00077, train/loss_step=0.207, global_step=7147.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  67%|██████▋   | 809/1208 [22:36<11:09,  1.68s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0549, train/loss_vlb_step=0.000192, train/loss_step=0.0549, global_step=7148.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  67%|██████▋   | 810/1208 [22:37<11:07,  1.68s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0549, train/loss_vlb_step=0.000192, train/loss_step=0.0549, global_step=7148.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  67%|██████▋   | 810/1208 [22:37<11:07,  1.68s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0987, train/loss_vlb_step=0.000324, train/loss_step=0.0987, global_step=7148.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  67%|██████▋   | 811/1208 [22:38<11:05,  1.68s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0987, train/loss_vlb_step=0.000324, train/loss_step=0.0987, global_step=7148.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  67%|██████▋   | 811/1208 [22:38<11:05,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.67e-5, train/loss_step=0.0101, global_step=7148.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  67%|██████▋   | 812/1208 [22:42<11:04,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.67e-5, train/loss_step=0.0101, global_step=7148.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  67%|██████▋   | 812/1208 [22:42<11:04,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.24e-5, train/loss_step=0.0203, global_step=7148.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  67%|██████▋   | 813/1208 [22:43<11:02,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.24e-5, train/loss_step=0.0203, global_step=7148.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  67%|██████▋   | 813/1208 [22:43<11:02,  1.68s/it, loss=0.177, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.0019, train/loss_step=0.371, global_step=7149.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  67%|██████▋   | 814/1208 [22:44<11:00,  1.68s/it, loss=0.177, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.0019, train/loss_step=0.371, global_step=7149.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  67%|██████▋   | 814/1208 [22:44<11:00,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000756, train/loss_step=0.205, global_step=7149.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  67%|██████▋   | 815/1208 [22:45<10:58,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000756, train/loss_step=0.205, global_step=7149.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  67%|██████▋   | 815/1208 [22:45<10:58,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00595, train/loss_vlb_step=3.05e-5, train/loss_step=0.00595, global_step=7149.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  68%|██████▊   | 816/1208 [22:48<10:57,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00595, train/loss_vlb_step=3.05e-5, train/loss_step=0.00595, global_step=7149.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  68%|██████▊   | 816/1208 [22:48<10:57,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.17e-5, train/loss_step=0.0144, global_step=7149.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  68%|██████▊   | 817/1208 [22:49<10:55,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.17e-5, train/loss_step=0.0144, global_step=7149.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  68%|██████▊   | 817/1208 [22:49<10:55,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.67e-5, train/loss_step=0.0105, global_step=7150.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  68%|██████▊   | 818/1208 [22:50<10:53,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.67e-5, train/loss_step=0.0105, global_step=7150.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  68%|██████▊   | 818/1208 [22:50<10:53,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.000171, train/loss_step=0.048, global_step=7150.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  68%|██████▊   | 819/1208 [22:51<10:51,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.000171, train/loss_step=0.048, global_step=7150.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  68%|██████▊   | 819/1208 [22:51<10:51,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0836, train/loss_vlb_step=0.000282, train/loss_step=0.0836, global_step=7150.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  68%|██████▊   | 820/1208 [22:54<10:50,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0836, train/loss_vlb_step=0.000282, train/loss_step=0.0836, global_step=7150.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  68%|██████▊   | 820/1208 [22:54<10:50,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=8.25e-5, train/loss_step=0.0195, global_step=7150.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  68%|██████▊   | 821/1208 [22:55<10:48,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=8.25e-5, train/loss_step=0.0195, global_step=7150.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  68%|██████▊   | 821/1208 [22:55<10:48,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00131, train/loss_step=0.299, global_step=7151.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  68%|██████▊   | 822/1208 [22:56<10:46,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00131, train/loss_step=0.299, global_step=7151.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  68%|██████▊   | 822/1208 [22:56<10:46,  1.67s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.00479, train/loss_vlb_step=2.43e-5, train/loss_step=0.00479, global_step=7151.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  68%|██████▊   | 823/1208 [22:57<10:44,  1.67s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.00479, train/loss_vlb_step=2.43e-5, train/loss_step=0.00479, global_step=7151.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  68%|██████▊   | 823/1208 [22:57<10:44,  1.67s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.0432, train/loss_vlb_step=0.000151, train/loss_step=0.0432, global_step=7151.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  68%|██████▊   | 824/1208 [23:01<10:43,  1.68s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.0432, train/loss_vlb_step=0.000151, train/loss_step=0.0432, global_step=7151.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  68%|██████▊   | 824/1208 [23:01<10:43,  1.68s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.0943, train/loss_vlb_step=0.00031, train/loss_step=0.0943, global_step=7151.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  68%|██████▊   | 825/1208 [23:02<10:41,  1.68s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.0943, train/loss_vlb_step=0.00031, train/loss_step=0.0943, global_step=7151.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  68%|██████▊   | 825/1208 [23:02<10:41,  1.68s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0689, train/loss_vlb_step=0.000235, train/loss_step=0.0689, global_step=7152.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  68%|██████▊   | 826/1208 [23:03<10:39,  1.67s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0689, train/loss_vlb_step=0.000235, train/loss_step=0.0689, global_step=7152.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  68%|██████▊   | 826/1208 [23:03<10:39,  1.67s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=9.83e-5, train/loss_step=0.0256, global_step=7152.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  68%|██████▊   | 827/1208 [23:04<10:37,  1.67s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=9.83e-5, train/loss_step=0.0256, global_step=7152.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  68%|██████▊   | 827/1208 [23:04<10:37,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.624, train/loss_vlb_step=0.0111, train/loss_step=0.624, global_step=7152.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  69%|██████▊   | 828/1208 [23:07<10:36,  1.68s/it, loss=0.115, v_num=0, train/loss_simple_step=0.624, train/loss_vlb_step=0.0111, train/loss_step=0.624, global_step=7152.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  69%|██████▊   | 828/1208 [23:07<10:36,  1.68s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.52e-5, train/loss_step=0.00273, global_step=7152.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  69%|██████▊   | 829/1208 [23:08<10:34,  1.67s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.52e-5, train/loss_step=0.00273, global_step=7152.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  69%|██████▊   | 829/1208 [23:08<10:34,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00148, train/loss_step=0.290, global_step=7153.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  69%|██████▊   | 830/1208 [23:09<10:32,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00148, train/loss_step=0.290, global_step=7153.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  69%|██████▊   | 830/1208 [23:09<10:32,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.000132, train/loss_step=0.0362, global_step=7153.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  69%|██████▉   | 831/1208 [23:10<10:30,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.000132, train/loss_step=0.0362, global_step=7153.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  69%|██████▉   | 831/1208 [23:10<10:30,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.21e-5, train/loss_step=0.020, global_step=7153.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  69%|██████▉   | 832/1208 [23:13<10:29,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.21e-5, train/loss_step=0.020, global_step=7153.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  69%|██████▉   | 832/1208 [23:13<10:29,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.98e-5, train/loss_step=0.0136, global_step=7153.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  69%|██████▉   | 833/1208 [23:14<10:27,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.98e-5, train/loss_step=0.0136, global_step=7153.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  69%|██████▉   | 833/1208 [23:14<10:27,  1.67s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.0792, train/loss_vlb_step=0.000269, train/loss_step=0.0792, global_step=7154.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  69%|██████▉   | 834/1208 [23:15<10:25,  1.67s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.0792, train/loss_vlb_step=0.000269, train/loss_step=0.0792, global_step=7154.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  69%|██████▉   | 834/1208 [23:15<10:25,  1.67s/it, loss=0.107, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00237, train/loss_step=0.351, global_step=7154.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  69%|██████▉   | 835/1208 [23:16<10:23,  1.67s/it, loss=0.107, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00237, train/loss_step=0.351, global_step=7154.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  69%|██████▉   | 835/1208 [23:16<10:23,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.518, train/loss_vlb_step=0.00613, train/loss_step=0.518, global_step=7154.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  69%|██████▉   | 836/1208 [23:20<10:22,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.518, train/loss_vlb_step=0.00613, train/loss_step=0.518, global_step=7154.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  69%|██████▉   | 836/1208 [23:20<10:22,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000634, train/loss_step=0.176, global_step=7154.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  69%|██████▉   | 837/1208 [23:21<10:21,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000634, train/loss_step=0.176, global_step=7154.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  69%|██████▉   | 837/1208 [23:21<10:21,  1.67s/it, loss=0.146, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000376, train/loss_step=0.114, global_step=7155.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  69%|██████▉   | 838/1208 [23:22<10:19,  1.67s/it, loss=0.146, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000376, train/loss_step=0.114, global_step=7155.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  69%|██████▉   | 838/1208 [23:22<10:19,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000752, train/loss_step=0.192, global_step=7155.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  69%|██████▉   | 839/1208 [23:23<10:17,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000752, train/loss_step=0.192, global_step=7155.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  69%|██████▉   | 839/1208 [23:23<10:17,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00355, train/loss_vlb_step=1.86e-5, train/loss_step=0.00355, global_step=7155.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  70%|██████▉   | 840/1208 [23:26<10:16,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00355, train/loss_vlb_step=1.86e-5, train/loss_step=0.00355, global_step=7155.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  70%|██████▉   | 840/1208 [23:26<10:16,  1.67s/it, loss=0.159, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000831, train/loss_step=0.227, global_step=7155.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  70%|██████▉   | 841/1208 [23:27<10:14,  1.67s/it, loss=0.159, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000831, train/loss_step=0.227, global_step=7155.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  70%|██████▉   | 841/1208 [23:27<10:14,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0626, train/loss_vlb_step=0.000215, train/loss_step=0.0626, global_step=7156.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  70%|██████▉   | 842/1208 [23:28<10:12,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0626, train/loss_vlb_step=0.000215, train/loss_step=0.0626, global_step=7156.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  70%|██████▉   | 842/1208 [23:28<10:12,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=1.1e-5, train/loss_step=0.00183, global_step=7156.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  70%|██████▉   | 843/1208 [23:29<10:10,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=1.1e-5, train/loss_step=0.00183, global_step=7156.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  70%|██████▉   | 843/1208 [23:29<10:10,  1.67s/it, loss=0.177, v_num=0, train/loss_simple_step=0.630, train/loss_vlb_step=0.0161, train/loss_step=0.630, global_step=7156.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  70%|██████▉   | 844/1208 [23:32<10:09,  1.67s/it, loss=0.177, v_num=0, train/loss_simple_step=0.630, train/loss_vlb_step=0.0161, train/loss_step=0.630, global_step=7156.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  70%|██████▉   | 844/1208 [23:32<10:09,  1.67s/it, loss=0.192, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00264, train/loss_step=0.398, global_step=7156.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  70%|██████▉   | 845/1208 [23:33<10:07,  1.67s/it, loss=0.192, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00264, train/loss_step=0.398, global_step=7156.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  70%|██████▉   | 845/1208 [23:33<10:07,  1.67s/it, loss=0.204, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00178, train/loss_step=0.320, global_step=7157.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  70%|███████   | 846/1208 [23:34<10:05,  1.67s/it, loss=0.204, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00178, train/loss_step=0.320, global_step=7157.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  70%|███████   | 846/1208 [23:34<10:05,  1.67s/it, loss=0.203, v_num=0, train/loss_simple_step=0.00857, train/loss_vlb_step=4.22e-5, train/loss_step=0.00857, global_step=7157.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  70%|███████   | 847/1208 [23:35<10:03,  1.67s/it, loss=0.203, v_num=0, train/loss_simple_step=0.00857, train/loss_vlb_step=4.22e-5, train/loss_step=0.00857, global_step=7157.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  70%|███████   | 847/1208 [23:35<10:03,  1.67s/it, loss=0.203, v_num=0, train/loss_simple_step=0.610, train/loss_vlb_step=0.0171, train/loss_step=0.610, global_step=7157.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]     Epoch 23:  70%|███████   | 848/1208 [23:39<10:02,  1.67s/it, loss=0.203, v_num=0, train/loss_simple_step=0.610, train/loss_vlb_step=0.0171, train/loss_step=0.610, global_step=7157.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  70%|███████   | 848/1208 [23:39<10:02,  1.67s/it, loss=0.216, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00136, train/loss_step=0.267, global_step=7157.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  70%|███████   | 849/1208 [23:40<10:00,  1.67s/it, loss=0.216, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00136, train/loss_step=0.267, global_step=7157.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  70%|███████   | 849/1208 [23:40<10:00,  1.67s/it, loss=0.228, v_num=0, train/loss_simple_step=0.526, train/loss_vlb_step=0.00817, train/loss_step=0.526, global_step=7158.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  70%|███████   | 850/1208 [23:41<09:58,  1.67s/it, loss=0.228, v_num=0, train/loss_simple_step=0.526, train/loss_vlb_step=0.00817, train/loss_step=0.526, global_step=7158.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  70%|███████   | 850/1208 [23:41<09:58,  1.67s/it, loss=0.226, v_num=0, train/loss_simple_step=0.00485, train/loss_vlb_step=2.47e-5, train/loss_step=0.00485, global_step=7158.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  70%|███████   | 851/1208 [23:42<09:56,  1.67s/it, loss=0.226, v_num=0, train/loss_simple_step=0.00485, train/loss_vlb_step=2.47e-5, train/loss_step=0.00485, global_step=7158.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  70%|███████   | 851/1208 [23:42<09:56,  1.67s/it, loss=0.24, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00144, train/loss_step=0.287, global_step=7158.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]     Epoch 23:  71%|███████   | 852/1208 [23:45<09:55,  1.67s/it, loss=0.24, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00144, train/loss_step=0.287, global_step=7158.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  71%|███████   | 852/1208 [23:45<09:55,  1.67s/it, loss=0.239, v_num=0, train/loss_simple_step=0.00604, train/loss_vlb_step=2.99e-5, train/loss_step=0.00604, global_step=7158.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  71%|███████   | 853/1208 [23:46<09:53,  1.67s/it, loss=0.239, v_num=0, train/loss_simple_step=0.00604, train/loss_vlb_step=2.99e-5, train/loss_step=0.00604, global_step=7158.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  71%|███████   | 853/1208 [23:46<09:53,  1.67s/it, loss=0.238, v_num=0, train/loss_simple_step=0.0646, train/loss_vlb_step=0.000219, train/loss_step=0.0646, global_step=7159.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  71%|███████   | 854/1208 [23:47<09:51,  1.67s/it, loss=0.238, v_num=0, train/loss_simple_step=0.0646, train/loss_vlb_step=0.000219, train/loss_step=0.0646, global_step=7159.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  71%|███████   | 854/1208 [23:47<09:51,  1.67s/it, loss=0.221, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=1.25e-5, train/loss_step=0.00217, global_step=7159.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  71%|███████   | 855/1208 [23:48<09:49,  1.67s/it, loss=0.221, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=1.25e-5, train/loss_step=0.00217, global_step=7159.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  71%|███████   | 855/1208 [23:48<09:49,  1.67s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.23e-5, train/loss_step=0.00423, global_step=7159.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  71%|███████   | 856/1208 [23:51<09:48,  1.67s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.23e-5, train/loss_step=0.00423, global_step=7159.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  71%|███████   | 856/1208 [23:51<09:48,  1.67s/it, loss=0.187, v_num=0, train/loss_simple_step=0.00385, train/loss_vlb_step=2.07e-5, train/loss_step=0.00385, global_step=7159.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  71%|███████   | 857/1208 [23:52<09:46,  1.67s/it, loss=0.187, v_num=0, train/loss_simple_step=0.00385, train/loss_vlb_step=2.07e-5, train/loss_step=0.00385, global_step=7159.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  71%|███████   | 857/1208 [23:52<09:46,  1.67s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0784, train/loss_vlb_step=0.000262, train/loss_step=0.0784, global_step=7160.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  71%|███████   | 858/1208 [23:53<09:44,  1.67s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0784, train/loss_vlb_step=0.000262, train/loss_step=0.0784, global_step=7160.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  71%|███████   | 858/1208 [23:53<09:44,  1.67s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.82e-5, train/loss_step=0.0105, global_step=7160.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  71%|███████   | 859/1208 [23:54<09:42,  1.67s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.82e-5, train/loss_step=0.0105, global_step=7160.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  71%|███████   | 859/1208 [23:54<09:42,  1.67s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0685, train/loss_vlb_step=0.000238, train/loss_step=0.0685, global_step=7160.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  71%|███████   | 860/1208 [23:58<09:41,  1.67s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0685, train/loss_vlb_step=0.000238, train/loss_step=0.0685, global_step=7160.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  71%|███████   | 860/1208 [23:58<09:41,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.15e-5, train/loss_step=0.00194, global_step=7160.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  71%|███████▏  | 861/1208 [23:59<09:40,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.15e-5, train/loss_step=0.00194, global_step=7160.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  71%|███████▏  | 861/1208 [23:59<09:40,  1.67s/it, loss=0.171, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000436, train/loss_step=0.129, global_step=7161.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  71%|███████▏  | 862/1208 [24:00<09:38,  1.67s/it, loss=0.171, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000436, train/loss_step=0.129, global_step=7161.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  71%|███████▏  | 862/1208 [24:00<09:38,  1.67s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.26e-5, train/loss_step=0.0116, global_step=7161.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  71%|███████▏  | 863/1208 [24:01<09:36,  1.67s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.26e-5, train/loss_step=0.0116, global_step=7161.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  71%|███████▏  | 863/1208 [24:01<09:36,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00805, train/loss_vlb_step=3.85e-5, train/loss_step=0.00805, global_step=7161.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  72%|███████▏  | 864/1208 [24:04<09:35,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00805, train/loss_vlb_step=3.85e-5, train/loss_step=0.00805, global_step=7161.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  72%|███████▏  | 864/1208 [24:04<09:35,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=3.23e-5, train/loss_step=0.00615, global_step=7161.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  72%|███████▏  | 865/1208 [24:05<09:33,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=3.23e-5, train/loss_step=0.00615, global_step=7161.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  72%|███████▏  | 865/1208 [24:05<09:33,  1.67s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=1.37e-5, train/loss_step=0.00243, global_step=7162.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  72%|███████▏  | 866/1208 [24:06<09:31,  1.67s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=1.37e-5, train/loss_step=0.00243, global_step=7162.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  72%|███████▏  | 866/1208 [24:06<09:31,  1.67s/it, loss=0.111, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000411, train/loss_step=0.124, global_step=7162.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  72%|███████▏  | 867/1208 [24:07<09:29,  1.67s/it, loss=0.111, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000411, train/loss_step=0.124, global_step=7162.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  72%|███████▏  | 867/1208 [24:07<09:29,  1.67s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000825, train/loss_step=0.224, global_step=7162.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  72%|███████▏  | 868/1208 [24:10<09:28,  1.67s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000825, train/loss_step=0.224, global_step=7162.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  72%|███████▏  | 868/1208 [24:10<09:28,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.741, train/loss_vlb_step=0.035, train/loss_step=0.741, global_step=7162.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  72%|███████▏  | 869/1208 [24:11<09:26,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.741, train/loss_vlb_step=0.035, train/loss_step=0.741, global_step=7162.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  72%|███████▏  | 869/1208 [24:11<09:26,  1.67s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=7.76e-5, train/loss_step=0.0192, global_step=7163.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  72%|███████▏  | 870/1208 [24:12<09:24,  1.67s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=7.76e-5, train/loss_step=0.0192, global_step=7163.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  72%|███████▏  | 870/1208 [24:12<09:24,  1.67s/it, loss=0.108, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00232, train/loss_step=0.375, global_step=7163.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  72%|███████▏  | 871/1208 [24:13<09:22,  1.67s/it, loss=0.108, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00232, train/loss_step=0.375, global_step=7163.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  72%|███████▏  | 871/1208 [24:13<09:22,  1.67s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.3e-5, train/loss_step=0.00219, global_step=7163.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  72%|███████▏  | 872/1208 [24:17<09:21,  1.67s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.3e-5, train/loss_step=0.00219, global_step=7163.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  72%|███████▏  | 872/1208 [24:17<09:21,  1.67s/it, loss=0.113, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00262, train/loss_step=0.378, global_step=7163.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  72%|███████▏  | 873/1208 [24:18<09:19,  1.67s/it, loss=0.113, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00262, train/loss_step=0.378, global_step=7163.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  72%|███████▏  | 873/1208 [24:18<09:19,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000981, train/loss_step=0.244, global_step=7164.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  72%|███████▏  | 874/1208 [24:19<09:17,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000981, train/loss_step=0.244, global_step=7164.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  72%|███████▏  | 874/1208 [24:19<09:17,  1.67s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0935, train/loss_vlb_step=0.00031, train/loss_step=0.0935, global_step=7164.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  72%|███████▏  | 875/1208 [24:20<09:15,  1.67s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0935, train/loss_vlb_step=0.00031, train/loss_step=0.0935, global_step=7164.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  72%|███████▏  | 875/1208 [24:20<09:15,  1.67s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0625, train/loss_vlb_step=0.000215, train/loss_step=0.0625, global_step=7164.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  73%|███████▎  | 876/1208 [24:23<09:14,  1.67s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0625, train/loss_vlb_step=0.000215, train/loss_step=0.0625, global_step=7164.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  73%|███████▎  | 876/1208 [24:23<09:14,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=7164.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  73%|███████▎  | 877/1208 [24:24<09:12,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=7164.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  73%|███████▎  | 877/1208 [24:24<09:12,  1.67s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000296, train/loss_step=0.0891, global_step=7165.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  73%|███████▎  | 878/1208 [24:25<09:10,  1.67s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000296, train/loss_step=0.0891, global_step=7165.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  73%|███████▎  | 878/1208 [24:25<09:10,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0755, train/loss_vlb_step=0.000254, train/loss_step=0.0755, global_step=7165.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  73%|███████▎  | 879/1208 [24:26<09:08,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0755, train/loss_vlb_step=0.000254, train/loss_step=0.0755, global_step=7165.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  73%|███████▎  | 879/1208 [24:26<09:08,  1.67s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=6.06e-5, train/loss_step=0.0132, global_step=7165.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  73%|███████▎  | 880/1208 [24:29<09:07,  1.67s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=6.06e-5, train/loss_step=0.0132, global_step=7165.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  73%|███████▎  | 880/1208 [24:29<09:07,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.527, train/loss_vlb_step=0.0091, train/loss_step=0.527, global_step=7165.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  73%|███████▎  | 881/1208 [24:30<09:05,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.527, train/loss_vlb_step=0.0091, train/loss_step=0.527, global_step=7165.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  73%|███████▎  | 881/1208 [24:30<09:05,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000481, train/loss_step=0.142, global_step=7166.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  73%|███████▎  | 882/1208 [24:31<09:04,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000481, train/loss_step=0.142, global_step=7166.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  73%|███████▎  | 882/1208 [24:31<09:04,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.6e-5, train/loss_step=0.00285, global_step=7166.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  73%|███████▎  | 883/1208 [24:33<09:02,  1.67s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.6e-5, train/loss_step=0.00285, global_step=7166.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  73%|███████▎  | 883/1208 [24:33<09:02,  1.67s/it, loss=0.174, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000981, train/loss_step=0.250, global_step=7166.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  73%|███████▎  | 884/1208 [24:36<09:01,  1.67s/it, loss=0.174, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000981, train/loss_step=0.250, global_step=7166.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  73%|███████▎  | 884/1208 [24:36<09:01,  1.67s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00839, train/loss_vlb_step=3.97e-5, train/loss_step=0.00839, global_step=7166.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  73%|███████▎  | 885/1208 [24:37<08:59,  1.67s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00839, train/loss_vlb_step=3.97e-5, train/loss_step=0.00839, global_step=7166.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  73%|███████▎  | 885/1208 [24:37<08:59,  1.67s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00459, train/loss_vlb_step=2.43e-5, train/loss_step=0.00459, global_step=7167.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  73%|███████▎  | 886/1208 [24:38<08:57,  1.67s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00459, train/loss_vlb_step=2.43e-5, train/loss_step=0.00459, global_step=7167.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  73%|███████▎  | 886/1208 [24:38<08:57,  1.67s/it, loss=0.185, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00226, train/loss_step=0.341, global_step=7167.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  73%|███████▎  | 887/1208 [24:39<08:55,  1.67s/it, loss=0.185, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00226, train/loss_step=0.341, global_step=7167.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  73%|███████▎  | 887/1208 [24:39<08:55,  1.67s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.14e-5, train/loss_step=0.0139, global_step=7167.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  74%|███████▎  | 888/1208 [24:42<08:54,  1.67s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.14e-5, train/loss_step=0.0139, global_step=7167.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  74%|███████▎  | 888/1208 [24:42<08:54,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0746, train/loss_vlb_step=0.000247, train/loss_step=0.0746, global_step=7167.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  74%|███████▎  | 889/1208 [24:43<08:52,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0746, train/loss_vlb_step=0.000247, train/loss_step=0.0746, global_step=7167.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  74%|███████▎  | 889/1208 [24:43<08:52,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00359, train/loss_step=0.418, global_step=7168.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  74%|███████▎  | 890/1208 [24:44<08:50,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00359, train/loss_step=0.418, global_step=7168.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  74%|███████▎  | 890/1208 [24:44<08:50,  1.67s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000117, train/loss_step=0.0307, global_step=7168.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  74%|███████▍  | 891/1208 [24:45<08:48,  1.67s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000117, train/loss_step=0.0307, global_step=7168.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  74%|███████▍  | 891/1208 [24:45<08:48,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.35e-5, train/loss_step=0.0234, global_step=7168.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  74%|███████▍  | 892/1208 [24:48<08:47,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.35e-5, train/loss_step=0.0234, global_step=7168.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  74%|███████▍  | 892/1208 [24:48<08:47,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.0004, train/loss_step=0.121, global_step=7168.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  74%|███████▍  | 893/1208 [24:49<08:45,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.0004, train/loss_step=0.121, global_step=7168.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  74%|███████▍  | 893/1208 [24:49<08:45,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.28e-5, train/loss_step=0.0115, global_step=7169.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  74%|███████▍  | 894/1208 [24:50<08:43,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.28e-5, train/loss_step=0.0115, global_step=7169.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  74%|███████▍  | 894/1208 [24:50<08:43,  1.67s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.3e-5, train/loss_step=0.0146, global_step=7169.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  74%|███████▍  | 895/1208 [24:51<08:41,  1.67s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.3e-5, train/loss_step=0.0146, global_step=7169.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  74%|███████▍  | 895/1208 [24:51<08:41,  1.67s/it, loss=0.144, v_num=0, train/loss_simple_step=0.618, train/loss_vlb_step=0.0104, train/loss_step=0.618, global_step=7169.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  74%|███████▍  | 896/1208 [24:55<08:40,  1.67s/it, loss=0.144, v_num=0, train/loss_simple_step=0.618, train/loss_vlb_step=0.0104, train/loss_step=0.618, global_step=7169.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  74%|███████▍  | 896/1208 [24:55<08:40,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.96e-5, train/loss_step=0.0183, global_step=7169.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  74%|███████▍  | 897/1208 [24:56<08:38,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.96e-5, train/loss_step=0.0183, global_step=7169.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  74%|███████▍  | 897/1208 [24:56<08:38,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.422, train/loss_vlb_step=0.00439, train/loss_step=0.422, global_step=7170.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  74%|███████▍  | 898/1208 [24:57<08:36,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.422, train/loss_vlb_step=0.00439, train/loss_step=0.422, global_step=7170.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  74%|███████▍  | 898/1208 [24:57<08:36,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0698, train/loss_vlb_step=0.000235, train/loss_step=0.0698, global_step=7170.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  74%|███████▍  | 899/1208 [24:58<08:34,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0698, train/loss_vlb_step=0.000235, train/loss_step=0.0698, global_step=7170.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  74%|███████▍  | 899/1208 [24:58<08:34,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000623, train/loss_step=0.178, global_step=7170.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  75%|███████▍  | 900/1208 [25:01<08:33,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000623, train/loss_step=0.178, global_step=7170.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  75%|███████▍  | 900/1208 [25:01<08:33,  1.67s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.61e-5, train/loss_step=0.0159, global_step=7170.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.84it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.75it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.73it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.76it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.83it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.76it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.80it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.76it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.76it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.76it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.76it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.76it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.76it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.76it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.76it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.76it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.76it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.80it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.77it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.81it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 23:  75%|███████▍  | 901/1208 [25:32<08:42,  1.70s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.61e-5, train/loss_step=0.0159, global_step=7170.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  75%|███████▍  | 901/1208 [25:32<08:42,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=8.88e-5, train/loss_step=0.0211, global_step=7171.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  75%|███████▍  | 902/1208 [25:33<08:40,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=8.88e-5, train/loss_step=0.0211, global_step=7171.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  75%|███████▍  | 902/1208 [25:33<08:40,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00422, train/loss_step=0.405, global_step=7171.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  75%|███████▍  | 903/1208 [25:34<08:38,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00422, train/loss_step=0.405, global_step=7171.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  75%|███████▍  | 903/1208 [25:34<08:38,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.51e-5, train/loss_step=0.00274, global_step=7171.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  75%|███████▍  | 904/1208 [25:37<08:36,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.51e-5, train/loss_step=0.00274, global_step=7171.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  75%|███████▍  | 904/1208 [25:37<08:36,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.448, train/loss_vlb_step=0.0036, train/loss_step=0.448, global_step=7171.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]     Epoch 23:  75%|███████▍  | 905/1208 [25:38<08:35,  1.70s/it, loss=0.163, v_num=0, train/loss_simple_step=0.448, train/loss_vlb_step=0.0036, train/loss_step=0.448, global_step=7171.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  75%|███████▍  | 905/1208 [25:38<08:35,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0843, train/loss_vlb_step=0.000281, train/loss_step=0.0843, global_step=7172.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  75%|███████▌  | 906/1208 [25:39<08:33,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0843, train/loss_vlb_step=0.000281, train/loss_step=0.0843, global_step=7172.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  75%|███████▌  | 906/1208 [25:39<08:33,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000467, train/loss_step=0.140, global_step=7172.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  75%|███████▌  | 907/1208 [25:40<08:31,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000467, train/loss_step=0.140, global_step=7172.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  75%|███████▌  | 907/1208 [25:40<08:31,  1.70s/it, loss=0.18, v_num=0, train/loss_simple_step=0.473, train/loss_vlb_step=0.00603, train/loss_step=0.473, global_step=7172.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  75%|███████▌  | 908/1208 [25:43<08:30,  1.70s/it, loss=0.18, v_num=0, train/loss_simple_step=0.473, train/loss_vlb_step=0.00603, train/loss_step=0.473, global_step=7172.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  75%|███████▌  | 908/1208 [25:43<08:30,  1.70s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00639, train/loss_vlb_step=3.16e-5, train/loss_step=0.00639, global_step=7172.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  75%|███████▌  | 909/1208 [25:44<08:28,  1.70s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00639, train/loss_vlb_step=3.16e-5, train/loss_step=0.00639, global_step=7172.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  75%|███████▌  | 909/1208 [25:44<08:28,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000155, train/loss_step=0.042, global_step=7173.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  75%|███████▌  | 910/1208 [25:45<08:26,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000155, train/loss_step=0.042, global_step=7173.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  75%|███████▌  | 910/1208 [25:45<08:26,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00102, train/loss_step=0.239, global_step=7173.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  75%|███████▌  | 911/1208 [25:46<08:24,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00102, train/loss_step=0.239, global_step=7173.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  75%|███████▌  | 911/1208 [25:46<08:24,  1.70s/it, loss=0.175, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000579, train/loss_step=0.165, global_step=7173.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  75%|███████▌  | 912/1208 [25:50<08:23,  1.70s/it, loss=0.175, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000579, train/loss_step=0.165, global_step=7173.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  75%|███████▌  | 912/1208 [25:50<08:23,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000114, train/loss_step=0.0307, global_step=7173.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  76%|███████▌  | 913/1208 [25:51<08:21,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000114, train/loss_step=0.0307, global_step=7173.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  76%|███████▌  | 913/1208 [25:51<08:21,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00174, train/loss_step=0.333, global_step=7174.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  76%|███████▌  | 914/1208 [25:52<08:19,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00174, train/loss_step=0.333, global_step=7174.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  76%|███████▌  | 914/1208 [25:52<08:19,  1.70s/it, loss=0.2, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00127, train/loss_step=0.290, global_step=7174.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  76%|███████▌  | 915/1208 [25:53<08:17,  1.70s/it, loss=0.2, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00127, train/loss_step=0.290, global_step=7174.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  76%|███████▌  | 915/1208 [25:53<08:17,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00205, train/loss_step=0.343, global_step=7174.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  76%|███████▌  | 916/1208 [25:56<08:16,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00205, train/loss_step=0.343, global_step=7174.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  76%|███████▌  | 916/1208 [25:56<08:16,  1.70s/it, loss=0.195, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.00066, train/loss_step=0.188, global_step=7174.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  76%|███████▌  | 917/1208 [25:57<08:14,  1.70s/it, loss=0.195, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.00066, train/loss_step=0.188, global_step=7174.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  76%|███████▌  | 917/1208 [25:57<08:14,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000929, train/loss_step=0.244, global_step=7175.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  76%|███████▌  | 918/1208 [25:58<08:12,  1.70s/it, loss=0.186, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000929, train/loss_step=0.244, global_step=7175.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  76%|███████▌  | 918/1208 [25:58<08:12,  1.70s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.66e-5, train/loss_step=0.0029, global_step=7175.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  76%|███████▌  | 919/1208 [25:59<08:10,  1.70s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.66e-5, train/loss_step=0.0029, global_step=7175.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  76%|███████▌  | 919/1208 [25:59<08:10,  1.70s/it, loss=0.18, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000434, train/loss_step=0.131, global_step=7175.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  76%|███████▌  | 920/1208 [26:02<08:09,  1.70s/it, loss=0.18, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000434, train/loss_step=0.131, global_step=7175.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  76%|███████▌  | 920/1208 [26:02<08:09,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0895, train/loss_vlb_step=0.000294, train/loss_step=0.0895, global_step=7175.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  76%|███████▌  | 921/1208 [26:03<08:07,  1.70s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0895, train/loss_vlb_step=0.000294, train/loss_step=0.0895, global_step=7175.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  76%|███████▌  | 921/1208 [26:03<08:07,  1.70s/it, loss=0.202, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00222, train/loss_step=0.383, global_step=7176.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  76%|███████▋  | 922/1208 [26:04<08:05,  1.70s/it, loss=0.202, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00222, train/loss_step=0.383, global_step=7176.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  76%|███████▋  | 922/1208 [26:04<08:05,  1.70s/it, loss=0.193, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000811, train/loss_step=0.219, global_step=7176.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  76%|███████▋  | 923/1208 [26:05<08:03,  1.70s/it, loss=0.193, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000811, train/loss_step=0.219, global_step=7176.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  76%|███████▋  | 923/1208 [26:05<08:03,  1.70s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0066, train/loss_vlb_step=3.25e-5, train/loss_step=0.0066, global_step=7176.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  76%|███████▋  | 924/1208 [26:09<08:02,  1.70s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0066, train/loss_vlb_step=3.25e-5, train/loss_step=0.0066, global_step=7176.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  76%|███████▋  | 924/1208 [26:09<08:02,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00136, train/loss_step=0.290, global_step=7176.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  77%|███████▋  | 925/1208 [26:10<08:00,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00136, train/loss_step=0.290, global_step=7176.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  77%|███████▋  | 925/1208 [26:10<08:00,  1.70s/it, loss=0.191, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000838, train/loss_step=0.210, global_step=7177.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  77%|███████▋  | 926/1208 [26:11<07:58,  1.70s/it, loss=0.191, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000838, train/loss_step=0.210, global_step=7177.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  77%|███████▋  | 926/1208 [26:11<07:58,  1.70s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0784, train/loss_vlb_step=0.000259, train/loss_step=0.0784, global_step=7177.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  77%|███████▋  | 927/1208 [26:12<07:56,  1.70s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0784, train/loss_vlb_step=0.000259, train/loss_step=0.0784, global_step=7177.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  77%|███████▋  | 927/1208 [26:12<07:56,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.00036, train/loss_step=0.110, global_step=7177.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  77%|███████▋  | 928/1208 [26:15<07:55,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.00036, train/loss_step=0.110, global_step=7177.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  77%|███████▋  | 928/1208 [26:15<07:55,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.68e-5, train/loss_step=0.00296, global_step=7177.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  77%|███████▋  | 929/1208 [26:16<07:53,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.68e-5, train/loss_step=0.00296, global_step=7177.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  77%|███████▋  | 929/1208 [26:16<07:53,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00138, train/loss_step=0.259, global_step=7178.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  77%|███████▋  | 930/1208 [26:17<07:51,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00138, train/loss_step=0.259, global_step=7178.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  77%|███████▋  | 930/1208 [26:17<07:51,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.00017, train/loss_step=0.0499, global_step=7178.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  77%|███████▋  | 931/1208 [26:18<07:49,  1.70s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.00017, train/loss_step=0.0499, global_step=7178.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  77%|███████▋  | 931/1208 [26:18<07:49,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.79e-5, train/loss_step=0.0227, global_step=7178.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  77%|███████▋  | 932/1208 [26:21<07:48,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.79e-5, train/loss_step=0.0227, global_step=7178.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  77%|███████▋  | 932/1208 [26:21<07:48,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000105, train/loss_step=0.0267, global_step=7178.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  77%|███████▋  | 933/1208 [26:22<07:46,  1.70s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000105, train/loss_step=0.0267, global_step=7178.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  77%|███████▋  | 933/1208 [26:22<07:46,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=7.79e-5, train/loss_step=0.0192, global_step=7179.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  77%|███████▋  | 934/1208 [26:23<07:44,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=7.79e-5, train/loss_step=0.0192, global_step=7179.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  77%|███████▋  | 934/1208 [26:23<07:44,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.29e-5, train/loss_step=0.00225, global_step=7179.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  77%|███████▋  | 935/1208 [26:24<07:42,  1.70s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.29e-5, train/loss_step=0.00225, global_step=7179.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  77%|███████▋  | 935/1208 [26:24<07:42,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000373, train/loss_step=0.113, global_step=7179.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  77%|███████▋  | 936/1208 [26:28<07:41,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000373, train/loss_step=0.113, global_step=7179.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  77%|███████▋  | 936/1208 [26:28<07:41,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.556, train/loss_vlb_step=0.00805, train/loss_step=0.556, global_step=7179.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  78%|███████▊  | 937/1208 [26:29<07:39,  1.70s/it, loss=0.141, v_num=0, train/loss_simple_step=0.556, train/loss_vlb_step=0.00805, train/loss_step=0.556, global_step=7179.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  78%|███████▊  | 937/1208 [26:29<07:39,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7.12e-5, train/loss_step=0.0165, global_step=7180.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  78%|███████▊  | 938/1208 [26:30<07:37,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7.12e-5, train/loss_step=0.0165, global_step=7180.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  78%|███████▊  | 938/1208 [26:30<07:37,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.81e-5, train/loss_step=0.0216, global_step=7180.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  78%|███████▊  | 939/1208 [26:31<07:35,  1.69s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.81e-5, train/loss_step=0.0216, global_step=7180.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  78%|███████▊  | 939/1208 [26:31<07:35,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.55e-5, train/loss_step=0.00281, global_step=7180.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  78%|███████▊  | 940/1208 [26:34<07:34,  1.70s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.55e-5, train/loss_step=0.00281, global_step=7180.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  78%|███████▊  | 940/1208 [26:34<07:34,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0694, train/loss_vlb_step=0.000234, train/loss_step=0.0694, global_step=7180.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  78%|███████▊  | 941/1208 [26:35<07:32,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0694, train/loss_vlb_step=0.000234, train/loss_step=0.0694, global_step=7180.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  78%|███████▊  | 941/1208 [26:35<07:32,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.64e-5, train/loss_step=0.0199, global_step=7181.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  78%|███████▊  | 942/1208 [26:36<07:30,  1.69s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.64e-5, train/loss_step=0.0199, global_step=7181.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  78%|███████▊  | 942/1208 [26:36<07:30,  1.69s/it, loss=0.0945, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.43e-5, train/loss_step=0.0125, global_step=7181.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  78%|███████▊  | 943/1208 [26:37<07:28,  1.69s/it, loss=0.0945, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.43e-5, train/loss_step=0.0125, global_step=7181.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  78%|███████▊  | 943/1208 [26:37<07:28,  1.69s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.0857, train/loss_vlb_step=0.000288, train/loss_step=0.0857, global_step=7181.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  78%|███████▊  | 944/1208 [26:40<07:27,  1.70s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.0857, train/loss_vlb_step=0.000288, train/loss_step=0.0857, global_step=7181.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  78%|███████▊  | 944/1208 [26:40<07:27,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00288, train/loss_step=0.340, global_step=7181.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  78%|███████▊  | 945/1208 [26:41<07:25,  1.70s/it, loss=0.101, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00288, train/loss_step=0.340, global_step=7181.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  78%|███████▊  | 945/1208 [26:41<07:25,  1.70s/it, loss=0.095, v_num=0, train/loss_simple_step=0.0914, train/loss_vlb_step=0.000302, train/loss_step=0.0914, global_step=7182.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  78%|███████▊  | 946/1208 [26:43<07:23,  1.69s/it, loss=0.095, v_num=0, train/loss_simple_step=0.0914, train/loss_vlb_step=0.000302, train/loss_step=0.0914, global_step=7182.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  78%|███████▊  | 946/1208 [26:43<07:23,  1.69s/it, loss=0.0939, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.000192, train/loss_step=0.0556, global_step=7182.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  78%|███████▊  | 947/1208 [26:44<07:22,  1.69s/it, loss=0.0939, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.000192, train/loss_step=0.0556, global_step=7182.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  78%|███████▊  | 947/1208 [26:44<07:22,  1.69s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=1.49e-5, train/loss_step=0.00256, global_step=7182.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  78%|███████▊  | 948/1208 [26:47<07:20,  1.70s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=1.49e-5, train/loss_step=0.00256, global_step=7182.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  78%|███████▊  | 948/1208 [26:47<07:20,  1.70s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.43e-5, train/loss_step=0.00251, global_step=7182.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  79%|███████▊  | 949/1208 [26:48<07:18,  1.69s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.43e-5, train/loss_step=0.00251, global_step=7182.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  79%|███████▊  | 949/1208 [26:48<07:18,  1.69s/it, loss=0.0801, v_num=0, train/loss_simple_step=0.0913, train/loss_vlb_step=0.000301, train/loss_step=0.0913, global_step=7183.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  79%|███████▊  | 950/1208 [26:49<07:17,  1.69s/it, loss=0.0801, v_num=0, train/loss_simple_step=0.0913, train/loss_vlb_step=0.000301, train/loss_step=0.0913, global_step=7183.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  79%|███████▊  | 950/1208 [26:49<07:17,  1.69s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00133, train/loss_step=0.299, global_step=7183.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  79%|███████▊  | 951/1208 [26:50<07:15,  1.69s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00133, train/loss_step=0.299, global_step=7183.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  79%|███████▊  | 951/1208 [26:50<07:15,  1.69s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.0776, train/loss_vlb_step=0.000259, train/loss_step=0.0776, global_step=7183.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  79%|███████▉  | 952/1208 [26:53<07:13,  1.69s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.0776, train/loss_vlb_step=0.000259, train/loss_step=0.0776, global_step=7183.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  79%|███████▉  | 952/1208 [26:53<07:13,  1.69s/it, loss=0.114, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.0027, train/loss_step=0.391, global_step=7183.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]     Epoch 23:  79%|███████▉  | 953/1208 [26:54<07:12,  1.69s/it, loss=0.114, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.0027, train/loss_step=0.391, global_step=7183.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  79%|███████▉  | 953/1208 [26:54<07:12,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.65e-5, train/loss_step=0.0131, global_step=7184.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  79%|███████▉  | 954/1208 [26:55<07:10,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.65e-5, train/loss_step=0.0131, global_step=7184.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  79%|███████▉  | 954/1208 [26:55<07:10,  1.69s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0632, train/loss_vlb_step=0.000217, train/loss_step=0.0632, global_step=7184.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  79%|███████▉  | 955/1208 [26:56<07:08,  1.69s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0632, train/loss_vlb_step=0.000217, train/loss_step=0.0632, global_step=7184.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  79%|███████▉  | 955/1208 [26:56<07:08,  1.69s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0591, train/loss_vlb_step=0.000202, train/loss_step=0.0591, global_step=7184.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  79%|███████▉  | 956/1208 [26:59<07:07,  1.69s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0591, train/loss_vlb_step=0.000202, train/loss_step=0.0591, global_step=7184.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  79%|███████▉  | 956/1208 [26:59<07:07,  1.69s/it, loss=0.0858, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=8.19e-6, train/loss_step=0.00135, global_step=7184.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  79%|███████▉  | 957/1208 [27:01<07:05,  1.69s/it, loss=0.0858, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=8.19e-6, train/loss_step=0.00135, global_step=7184.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  79%|███████▉  | 957/1208 [27:01<07:05,  1.69s/it, loss=0.0886, v_num=0, train/loss_simple_step=0.0726, train/loss_vlb_step=0.000243, train/loss_step=0.0726, global_step=7185.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  79%|███████▉  | 958/1208 [27:02<07:03,  1.69s/it, loss=0.0886, v_num=0, train/loss_simple_step=0.0726, train/loss_vlb_step=0.000243, train/loss_step=0.0726, global_step=7185.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  79%|███████▉  | 958/1208 [27:02<07:03,  1.69s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000859, train/loss_step=0.219, global_step=7185.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  79%|███████▉  | 959/1208 [27:03<07:01,  1.69s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000859, train/loss_step=0.219, global_step=7185.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  79%|███████▉  | 959/1208 [27:03<07:01,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000526, train/loss_step=0.156, global_step=7185.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  79%|███████▉  | 960/1208 [27:06<07:00,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000526, train/loss_step=0.156, global_step=7185.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  79%|███████▉  | 960/1208 [27:06<07:00,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0086, train/loss_vlb_step=4.04e-5, train/loss_step=0.0086, global_step=7185.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  80%|███████▉  | 961/1208 [27:07<06:58,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0086, train/loss_vlb_step=4.04e-5, train/loss_step=0.0086, global_step=7185.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  80%|███████▉  | 961/1208 [27:07<06:58,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00849, train/loss_vlb_step=4.23e-5, train/loss_step=0.00849, global_step=7186.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  80%|███████▉  | 962/1208 [27:08<06:56,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00849, train/loss_vlb_step=4.23e-5, train/loss_step=0.00849, global_step=7186.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  80%|███████▉  | 962/1208 [27:08<06:56,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0752, train/loss_vlb_step=0.000255, train/loss_step=0.0752, global_step=7186.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  80%|███████▉  | 963/1208 [27:09<06:54,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0752, train/loss_vlb_step=0.000255, train/loss_step=0.0752, global_step=7186.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  80%|███████▉  | 963/1208 [27:09<06:54,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000469, train/loss_step=0.138, global_step=7186.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  80%|███████▉  | 964/1208 [27:12<06:53,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000469, train/loss_step=0.138, global_step=7186.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  80%|███████▉  | 964/1208 [27:12<06:53,  1.69s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.08e-5, train/loss_step=0.00182, global_step=7186.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  80%|███████▉  | 965/1208 [27:13<06:51,  1.69s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.08e-5, train/loss_step=0.00182, global_step=7186.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  80%|███████▉  | 965/1208 [27:13<06:51,  1.69s/it, loss=0.0869, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=1.51e-5, train/loss_step=0.00259, global_step=7187.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  80%|███████▉  | 966/1208 [27:14<06:49,  1.69s/it, loss=0.0869, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=1.51e-5, train/loss_step=0.00259, global_step=7187.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  80%|███████▉  | 966/1208 [27:14<06:49,  1.69s/it, loss=0.0855, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.000102, train/loss_step=0.027, global_step=7187.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  80%|████████  | 967/1208 [27:15<06:47,  1.69s/it, loss=0.0855, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.000102, train/loss_step=0.027, global_step=7187.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  80%|████████  | 967/1208 [27:15<06:47,  1.69s/it, loss=0.0855, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.48e-5, train/loss_step=0.00248, global_step=7187.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  80%|████████  | 968/1208 [27:18<06:46,  1.69s/it, loss=0.0855, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.48e-5, train/loss_step=0.00248, global_step=7187.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  80%|████████  | 968/1208 [27:18<06:46,  1.69s/it, loss=0.0856, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=2.05e-5, train/loss_step=0.00378, global_step=7187.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  80%|████████  | 969/1208 [27:20<06:44,  1.69s/it, loss=0.0856, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=2.05e-5, train/loss_step=0.00378, global_step=7187.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  80%|████████  | 969/1208 [27:20<06:44,  1.69s/it, loss=0.0869, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=7188.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  80%|████████  | 970/1208 [27:21<06:42,  1.69s/it, loss=0.0869, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=7188.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  80%|████████  | 970/1208 [27:21<06:42,  1.69s/it, loss=0.0733, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000103, train/loss_step=0.0266, global_step=7188.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  80%|████████  | 971/1208 [27:22<06:40,  1.69s/it, loss=0.0733, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000103, train/loss_step=0.0266, global_step=7188.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  80%|████████  | 971/1208 [27:22<06:40,  1.69s/it, loss=0.0796, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000712, train/loss_step=0.203, global_step=7188.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  80%|████████  | 972/1208 [27:25<06:39,  1.69s/it, loss=0.0796, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000712, train/loss_step=0.203, global_step=7188.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  80%|████████  | 972/1208 [27:25<06:39,  1.69s/it, loss=0.0727, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.000984, train/loss_step=0.252, global_step=7188.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  81%|████████  | 973/1208 [27:26<06:37,  1.69s/it, loss=0.0727, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.000984, train/loss_step=0.252, global_step=7188.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  81%|████████  | 973/1208 [27:26<06:37,  1.69s/it, loss=0.0759, v_num=0, train/loss_simple_step=0.0773, train/loss_vlb_step=0.000254, train/loss_step=0.0773, global_step=7189.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  81%|████████  | 974/1208 [27:27<06:35,  1.69s/it, loss=0.0759, v_num=0, train/loss_simple_step=0.0773, train/loss_vlb_step=0.000254, train/loss_step=0.0773, global_step=7189.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  81%|████████  | 974/1208 [27:27<06:35,  1.69s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00504, train/loss_step=0.433, global_step=7189.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  81%|████████  | 975/1208 [27:28<06:33,  1.69s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00504, train/loss_step=0.433, global_step=7189.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  81%|████████  | 975/1208 [27:28<06:33,  1.69s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.0669, train/loss_vlb_step=0.000226, train/loss_step=0.0669, global_step=7189.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  81%|████████  | 976/1208 [27:31<06:32,  1.69s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.0669, train/loss_vlb_step=0.000226, train/loss_step=0.0669, global_step=7189.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  81%|████████  | 976/1208 [27:31<06:32,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000505, train/loss_step=0.149, global_step=7189.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  81%|████████  | 977/1208 [27:32<06:30,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000505, train/loss_step=0.149, global_step=7189.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  81%|████████  | 977/1208 [27:32<06:30,  1.69s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.000192, train/loss_step=0.0543, global_step=7190.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  81%|████████  | 978/1208 [27:33<06:28,  1.69s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.000192, train/loss_step=0.0543, global_step=7190.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  81%|████████  | 978/1208 [27:33<06:28,  1.69s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.00501, train/loss_vlb_step=2.56e-5, train/loss_step=0.00501, global_step=7190.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  81%|████████  | 979/1208 [27:34<06:27,  1.69s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.00501, train/loss_vlb_step=2.56e-5, train/loss_step=0.00501, global_step=7190.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  81%|████████  | 979/1208 [27:34<06:27,  1.69s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000178, train/loss_step=0.050, global_step=7190.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  81%|████████  | 980/1208 [27:37<06:25,  1.69s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000178, train/loss_step=0.050, global_step=7190.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  81%|████████  | 980/1208 [27:37<06:25,  1.69s/it, loss=0.0859, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9.19e-5, train/loss_step=0.0224, global_step=7190.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  81%|████████  | 981/1208 [27:39<06:23,  1.69s/it, loss=0.0859, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9.19e-5, train/loss_step=0.0224, global_step=7190.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  81%|████████  | 981/1208 [27:39<06:23,  1.69s/it, loss=0.0874, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000137, train/loss_step=0.0386, global_step=7191.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  81%|████████▏ | 982/1208 [27:40<06:22,  1.69s/it, loss=0.0874, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000137, train/loss_step=0.0386, global_step=7191.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  81%|████████▏ | 982/1208 [27:40<06:22,  1.69s/it, loss=0.0888, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=7191.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  81%|████████▏ | 983/1208 [27:41<06:20,  1.69s/it, loss=0.0888, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=7191.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  81%|████████▏ | 983/1208 [27:41<06:20,  1.69s/it, loss=0.0824, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.52e-5, train/loss_step=0.0101, global_step=7191.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  81%|████████▏ | 984/1208 [27:44<06:18,  1.69s/it, loss=0.0824, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.52e-5, train/loss_step=0.0101, global_step=7191.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  81%|████████▏ | 984/1208 [27:44<06:18,  1.69s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000357, train/loss_step=0.109, global_step=7191.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  82%|████████▏ | 985/1208 [27:45<06:17,  1.69s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000357, train/loss_step=0.109, global_step=7191.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  82%|████████▏ | 985/1208 [27:45<06:17,  1.69s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000527, train/loss_step=0.160, global_step=7192.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  82%|████████▏ | 986/1208 [27:46<06:15,  1.69s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000527, train/loss_step=0.160, global_step=7192.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  82%|████████▏ | 986/1208 [27:46<06:15,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000604, train/loss_step=0.168, global_step=7192.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  82%|████████▏ | 987/1208 [27:47<06:13,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000604, train/loss_step=0.168, global_step=7192.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  82%|████████▏ | 987/1208 [27:47<06:13,  1.69s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000125, train/loss_step=0.0353, global_step=7192.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  82%|████████▏ | 988/1208 [27:50<06:11,  1.69s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000125, train/loss_step=0.0353, global_step=7192.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  82%|████████▏ | 988/1208 [27:50<06:11,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0573, train/loss_vlb_step=0.000201, train/loss_step=0.0573, global_step=7192.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  82%|████████▏ | 989/1208 [27:51<06:10,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0573, train/loss_vlb_step=0.000201, train/loss_step=0.0573, global_step=7192.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  82%|████████▏ | 989/1208 [27:51<06:10,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.54e-5, train/loss_step=0.0145, global_step=7193.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  82%|████████▏ | 990/1208 [27:52<06:08,  1.69s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.54e-5, train/loss_step=0.0145, global_step=7193.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  82%|████████▏ | 990/1208 [27:52<06:08,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000394, train/loss_step=0.116, global_step=7193.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  82%|████████▏ | 991/1208 [27:53<06:06,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000394, train/loss_step=0.116, global_step=7193.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  82%|████████▏ | 991/1208 [27:53<06:06,  1.69s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0529, train/loss_vlb_step=0.000188, train/loss_step=0.0529, global_step=7193.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  82%|████████▏ | 992/1208 [27:56<06:05,  1.69s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0529, train/loss_vlb_step=0.000188, train/loss_step=0.0529, global_step=7193.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  82%|████████▏ | 992/1208 [27:56<06:05,  1.69s/it, loss=0.0868, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.77e-5, train/loss_step=0.0133, global_step=7193.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  82%|████████▏ | 993/1208 [27:57<06:03,  1.69s/it, loss=0.0868, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.77e-5, train/loss_step=0.0133, global_step=7193.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  82%|████████▏ | 993/1208 [27:57<06:03,  1.69s/it, loss=0.086, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.000217, train/loss_step=0.062, global_step=7194.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  82%|████████▏ | 994/1208 [27:59<06:01,  1.69s/it, loss=0.086, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.000217, train/loss_step=0.062, global_step=7194.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  82%|████████▏ | 994/1208 [27:59<06:01,  1.69s/it, loss=0.0771, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00101, train/loss_step=0.254, global_step=7194.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  82%|████████▏ | 995/1208 [28:00<05:59,  1.69s/it, loss=0.0771, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00101, train/loss_step=0.254, global_step=7194.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  82%|████████▏ | 995/1208 [28:00<05:59,  1.69s/it, loss=0.0842, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000814, train/loss_step=0.209, global_step=7194.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  82%|████████▏ | 996/1208 [28:03<05:58,  1.69s/it, loss=0.0842, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000814, train/loss_step=0.209, global_step=7194.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  82%|████████▏ | 996/1208 [28:03<05:58,  1.69s/it, loss=0.0783, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000112, train/loss_step=0.0309, global_step=7194.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  83%|████████▎ | 997/1208 [28:04<05:56,  1.69s/it, loss=0.0783, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000112, train/loss_step=0.0309, global_step=7194.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  83%|████████▎ | 997/1208 [28:04<05:56,  1.69s/it, loss=0.0784, v_num=0, train/loss_simple_step=0.0558, train/loss_vlb_step=0.000195, train/loss_step=0.0558, global_step=7195.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  83%|████████▎ | 998/1208 [28:05<05:54,  1.69s/it, loss=0.0784, v_num=0, train/loss_simple_step=0.0558, train/loss_vlb_step=0.000195, train/loss_step=0.0558, global_step=7195.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  83%|████████▎ | 998/1208 [28:05<05:54,  1.69s/it, loss=0.0783, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.63e-5, train/loss_step=0.00296, global_step=7195.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  83%|████████▎ | 999/1208 [28:06<05:52,  1.69s/it, loss=0.0783, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.63e-5, train/loss_step=0.00296, global_step=7195.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  83%|████████▎ | 999/1208 [28:06<05:52,  1.69s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000474, train/loss_step=0.142, global_step=7195.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  83%|████████▎ | 1000/1208 [28:09<05:51,  1.69s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000474, train/loss_step=0.142, global_step=7195.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  83%|████████▎ | 1000/1208 [28:09<05:51,  1.69s/it, loss=0.0839, v_num=0, train/loss_simple_step=0.044, train/loss_vlb_step=0.000157, train/loss_step=0.044, global_step=7195.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  83%|████████▎ | 1001/1208 [28:10<05:49,  1.69s/it, loss=0.0839, v_num=0, train/loss_simple_step=0.044, train/loss_vlb_step=0.000157, train/loss_step=0.044, global_step=7195.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  83%|████████▎ | 1001/1208 [28:10<05:49,  1.69s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=1.14e-5, train/loss_step=0.00196, global_step=7196.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  83%|████████▎ | 1002/1208 [28:11<05:47,  1.69s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=1.14e-5, train/loss_step=0.00196, global_step=7196.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  83%|████████▎ | 1002/1208 [28:11<05:47,  1.69s/it, loss=0.0781, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.77e-5, train/loss_step=0.0234, global_step=7196.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  83%|████████▎ | 1003/1208 [28:12<05:45,  1.69s/it, loss=0.0781, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.77e-5, train/loss_step=0.0234, global_step=7196.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  83%|████████▎ | 1003/1208 [28:12<05:45,  1.69s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00162, train/loss_step=0.310, global_step=7196.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  83%|████████▎ | 1004/1208 [28:15<05:44,  1.69s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00162, train/loss_step=0.310, global_step=7196.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  83%|████████▎ | 1004/1208 [28:15<05:44,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00282, train/loss_step=0.392, global_step=7196.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  83%|████████▎ | 1005/1208 [28:17<05:42,  1.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00282, train/loss_step=0.392, global_step=7196.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  83%|████████▎ | 1005/1208 [28:17<05:42,  1.69s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000137, train/loss_step=0.0369, global_step=7197.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  83%|████████▎ | 1006/1208 [28:18<05:40,  1.69s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000137, train/loss_step=0.0369, global_step=7197.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  83%|████████▎ | 1006/1208 [28:18<05:40,  1.69s/it, loss=0.0929, v_num=0, train/loss_simple_step=0.00419, train/loss_vlb_step=2.22e-5, train/loss_step=0.00419, global_step=7197.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  83%|████████▎ | 1007/1208 [28:19<05:39,  1.69s/it, loss=0.0929, v_num=0, train/loss_simple_step=0.00419, train/loss_vlb_step=2.22e-5, train/loss_step=0.00419, global_step=7197.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  83%|████████▎ | 1007/1208 [28:19<05:39,  1.69s/it, loss=0.101, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000727, train/loss_step=0.200, global_step=7197.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  83%|████████▎ | 1008/1208 [28:22<05:37,  1.69s/it, loss=0.101, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000727, train/loss_step=0.200, global_step=7197.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  83%|████████▎ | 1008/1208 [28:22<05:37,  1.69s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.000119, train/loss_step=0.032, global_step=7197.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  84%|████████▎ | 1009/1208 [28:23<05:35,  1.69s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.000119, train/loss_step=0.032, global_step=7197.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  84%|████████▎ | 1009/1208 [28:23<05:35,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000632, train/loss_step=0.181, global_step=7198.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  84%|████████▎ | 1010/1208 [28:24<05:34,  1.69s/it, loss=0.108, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000632, train/loss_step=0.181, global_step=7198.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  84%|████████▎ | 1010/1208 [28:24<05:34,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0662, train/loss_vlb_step=0.000221, train/loss_step=0.0662, global_step=7198.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  84%|████████▎ | 1011/1208 [28:25<05:32,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0662, train/loss_vlb_step=0.000221, train/loss_step=0.0662, global_step=7198.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  84%|████████▎ | 1011/1208 [28:25<05:32,  1.69s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.71e-5, train/loss_step=0.0101, global_step=7198.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  84%|████████▍ | 1012/1208 [28:28<05:30,  1.69s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.71e-5, train/loss_step=0.0101, global_step=7198.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  84%|████████▍ | 1012/1208 [28:28<05:30,  1.69s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0505, train/loss_vlb_step=0.000183, train/loss_step=0.0505, global_step=7198.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  84%|████████▍ | 1013/1208 [28:29<05:29,  1.69s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0505, train/loss_vlb_step=0.000183, train/loss_step=0.0505, global_step=7198.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  84%|████████▍ | 1013/1208 [28:29<05:29,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.00107, train/loss_step=0.246, global_step=7199.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  84%|████████▍ | 1014/1208 [28:30<05:27,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.00107, train/loss_step=0.246, global_step=7199.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  84%|████████▍ | 1014/1208 [28:30<05:27,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.500, train/loss_vlb_step=0.00863, train/loss_step=0.500, global_step=7199.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  84%|████████▍ | 1015/1208 [28:31<05:25,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.500, train/loss_vlb_step=0.00863, train/loss_step=0.500, global_step=7199.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  84%|████████▍ | 1015/1208 [28:31<05:25,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00995, train/loss_vlb_step=4.69e-5, train/loss_step=0.00995, global_step=7199.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  84%|████████▍ | 1016/1208 [28:34<05:24,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00995, train/loss_vlb_step=4.69e-5, train/loss_step=0.00995, global_step=7199.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  84%|████████▍ | 1016/1208 [28:34<05:24,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000751, train/loss_step=0.198, global_step=7199.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  84%|████████▍ | 1017/1208 [28:35<05:22,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000751, train/loss_step=0.198, global_step=7199.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  84%|████████▍ | 1017/1208 [28:35<05:22,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000664, train/loss_step=0.182, global_step=7200.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  84%|████████▍ | 1018/1208 [28:37<05:20,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000664, train/loss_step=0.182, global_step=7200.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  84%|████████▍ | 1018/1208 [28:37<05:20,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.00015, train/loss_step=0.0393, global_step=7200.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  84%|████████▍ | 1019/1208 [28:38<05:18,  1.69s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.00015, train/loss_step=0.0393, global_step=7200.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  84%|████████▍ | 1019/1208 [28:38<05:18,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.00016, train/loss_step=0.0456, global_step=7200.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  84%|████████▍ | 1020/1208 [28:41<05:17,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.00016, train/loss_step=0.0456, global_step=7200.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  84%|████████▍ | 1020/1208 [28:41<05:17,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.07e-5, train/loss_step=0.0173, global_step=7200.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  85%|████████▍ | 1021/1208 [28:42<05:15,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.07e-5, train/loss_step=0.0173, global_step=7200.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  85%|████████▍ | 1021/1208 [28:42<05:15,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00112, train/loss_step=0.258, global_step=7201.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  85%|████████▍ | 1022/1208 [28:43<05:13,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00112, train/loss_step=0.258, global_step=7201.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  85%|████████▍ | 1022/1208 [28:43<05:13,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=9.24e-5, train/loss_step=0.0222, global_step=7201.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  85%|████████▍ | 1023/1208 [28:44<05:11,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=9.24e-5, train/loss_step=0.0222, global_step=7201.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  85%|████████▍ | 1023/1208 [28:44<05:11,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.57e-5, train/loss_step=0.00285, global_step=7201.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  85%|████████▍ | 1024/1208 [28:47<05:10,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.57e-5, train/loss_step=0.00285, global_step=7201.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  85%|████████▍ | 1024/1208 [28:47<05:10,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000716, train/loss_step=0.196, global_step=7201.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  85%|████████▍ | 1025/1208 [28:48<05:08,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000716, train/loss_step=0.196, global_step=7201.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  85%|████████▍ | 1025/1208 [28:48<05:08,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00162, train/loss_step=0.295, global_step=7202.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  85%|████████▍ | 1026/1208 [28:49<05:06,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00162, train/loss_step=0.295, global_step=7202.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  85%|████████▍ | 1026/1208 [28:49<05:06,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0738, train/loss_vlb_step=0.00025, train/loss_step=0.0738, global_step=7202.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  85%|████████▌ | 1027/1208 [28:50<05:05,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0738, train/loss_vlb_step=0.00025, train/loss_step=0.0738, global_step=7202.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  85%|████████▌ | 1027/1208 [28:50<05:05,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.058, train/loss_vlb_step=0.000202, train/loss_step=0.058, global_step=7202.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  85%|████████▌ | 1028/1208 [28:53<05:03,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.058, train/loss_vlb_step=0.000202, train/loss_step=0.058, global_step=7202.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  85%|████████▌ | 1028/1208 [28:53<05:03,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.00037, train/loss_step=0.112, global_step=7202.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  85%|████████▌ | 1029/1208 [28:54<05:01,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.00037, train/loss_step=0.112, global_step=7202.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  85%|████████▌ | 1029/1208 [28:54<05:01,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000793, train/loss_step=0.203, global_step=7203.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  85%|████████▌ | 1030/1208 [28:56<05:00,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000793, train/loss_step=0.203, global_step=7203.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  85%|████████▌ | 1030/1208 [28:56<05:00,  1.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000329, train/loss_step=0.100, global_step=7203.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  85%|████████▌ | 1031/1208 [28:57<04:58,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000329, train/loss_step=0.100, global_step=7203.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  85%|████████▌ | 1031/1208 [28:57<04:58,  1.68s/it, loss=0.147, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00176, train/loss_step=0.328, global_step=7203.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  85%|████████▌ | 1032/1208 [29:00<04:56,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00176, train/loss_step=0.328, global_step=7203.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  85%|████████▌ | 1032/1208 [29:00<04:56,  1.69s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.88e-5, train/loss_step=0.0132, global_step=7203.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  86%|████████▌ | 1033/1208 [29:01<04:54,  1.69s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.88e-5, train/loss_step=0.0132, global_step=7203.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  86%|████████▌ | 1033/1208 [29:01<04:54,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00216, train/loss_step=0.345, global_step=7204.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  86%|████████▌ | 1034/1208 [29:02<04:53,  1.69s/it, loss=0.15, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00216, train/loss_step=0.345, global_step=7204.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  86%|████████▌ | 1034/1208 [29:02<04:53,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000157, train/loss_step=0.0463, global_step=7204.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  86%|████████▌ | 1035/1208 [29:03<04:51,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000157, train/loss_step=0.0463, global_step=7204.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  86%|████████▌ | 1035/1208 [29:03<04:51,  1.68s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.59e-5, train/loss_step=0.0186, global_step=7204.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  86%|████████▌ | 1036/1208 [29:06<04:49,  1.69s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.59e-5, train/loss_step=0.0186, global_step=7204.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  86%|████████▌ | 1036/1208 [29:06<04:49,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00171, train/loss_step=0.344, global_step=7204.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  86%|████████▌ | 1037/1208 [29:07<04:48,  1.69s/it, loss=0.135, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00171, train/loss_step=0.344, global_step=7204.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  86%|████████▌ | 1037/1208 [29:07<04:48,  1.69s/it, loss=0.126, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.16e-5, train/loss_step=0.002, global_step=7205.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  86%|████████▌ | 1038/1208 [29:08<04:46,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.16e-5, train/loss_step=0.002, global_step=7205.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  86%|████████▌ | 1038/1208 [29:08<04:46,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00728, train/loss_vlb_step=3.62e-5, train/loss_step=0.00728, global_step=7205.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  86%|████████▌ | 1039/1208 [29:09<04:44,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00728, train/loss_vlb_step=3.62e-5, train/loss_step=0.00728, global_step=7205.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  86%|████████▌ | 1039/1208 [29:09<04:44,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.469, train/loss_vlb_step=0.00422, train/loss_step=0.469, global_step=7205.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  86%|████████▌ | 1040/1208 [29:12<04:43,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.469, train/loss_vlb_step=0.00422, train/loss_step=0.469, global_step=7205.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  86%|████████▌ | 1040/1208 [29:12<04:43,  1.69s/it, loss=0.153, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000579, train/loss_step=0.166, global_step=7205.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  86%|████████▌ | 1041/1208 [29:14<04:41,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000579, train/loss_step=0.166, global_step=7205.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  86%|████████▌ | 1041/1208 [29:14<04:41,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00374, train/loss_vlb_step=1.99e-5, train/loss_step=0.00374, global_step=7206.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  86%|████████▋ | 1042/1208 [29:15<04:39,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00374, train/loss_vlb_step=1.99e-5, train/loss_step=0.00374, global_step=7206.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  86%|████████▋ | 1042/1208 [29:15<04:39,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000126, train/loss_step=0.0346, global_step=7206.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  86%|████████▋ | 1043/1208 [29:16<04:37,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000126, train/loss_step=0.0346, global_step=7206.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  86%|████████▋ | 1043/1208 [29:16<04:37,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.59e-5, train/loss_step=0.0186, global_step=7206.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  86%|████████▋ | 1044/1208 [29:19<04:36,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.59e-5, train/loss_step=0.0186, global_step=7206.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  86%|████████▋ | 1044/1208 [29:19<04:36,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000532, train/loss_step=0.158, global_step=7206.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  87%|████████▋ | 1045/1208 [29:20<04:34,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000532, train/loss_step=0.158, global_step=7206.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  87%|████████▋ | 1045/1208 [29:20<04:34,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000807, train/loss_step=0.195, global_step=7207.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  87%|████████▋ | 1046/1208 [29:21<04:32,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000807, train/loss_step=0.195, global_step=7207.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  87%|████████▋ | 1046/1208 [29:21<04:32,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.00468, train/loss_step=0.450, global_step=7207.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  87%|████████▋ | 1047/1208 [29:22<04:31,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.00468, train/loss_step=0.450, global_step=7207.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  87%|████████▋ | 1047/1208 [29:22<04:31,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00118, train/loss_step=0.267, global_step=7207.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  87%|████████▋ | 1048/1208 [29:25<04:29,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00118, train/loss_step=0.267, global_step=7207.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  87%|████████▋ | 1048/1208 [29:25<04:29,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.52e-5, train/loss_step=0.0124, global_step=7207.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  87%|████████▋ | 1049/1208 [29:26<04:27,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.52e-5, train/loss_step=0.0124, global_step=7207.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  87%|████████▋ | 1049/1208 [29:26<04:27,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0674, train/loss_vlb_step=0.000223, train/loss_step=0.0674, global_step=7208.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  87%|████████▋ | 1050/1208 [29:27<04:26,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0674, train/loss_vlb_step=0.000223, train/loss_step=0.0674, global_step=7208.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  87%|████████▋ | 1050/1208 [29:27<04:26,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000438, train/loss_step=0.132, global_step=7208.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  87%|████████▋ | 1051/1208 [29:28<04:24,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000438, train/loss_step=0.132, global_step=7208.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  87%|████████▋ | 1051/1208 [29:28<04:24,  1.68s/it, loss=0.162, v_num=0, train/loss_simple_step=0.483, train/loss_vlb_step=0.00715, train/loss_step=0.483, global_step=7208.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  87%|████████▋ | 1052/1208 [29:32<04:22,  1.68s/it, loss=0.162, v_num=0, train/loss_simple_step=0.483, train/loss_vlb_step=0.00715, train/loss_step=0.483, global_step=7208.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  87%|████████▋ | 1052/1208 [29:32<04:22,  1.68s/it, loss=0.178, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00246, train/loss_step=0.348, global_step=7208.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  87%|████████▋ | 1053/1208 [29:33<04:20,  1.68s/it, loss=0.178, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00246, train/loss_step=0.348, global_step=7208.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  87%|████████▋ | 1053/1208 [29:33<04:20,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0426, train/loss_vlb_step=0.000156, train/loss_step=0.0426, global_step=7209.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  87%|████████▋ | 1054/1208 [29:34<04:19,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0426, train/loss_vlb_step=0.000156, train/loss_step=0.0426, global_step=7209.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  87%|████████▋ | 1054/1208 [29:34<04:19,  1.68s/it, loss=0.178, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00198, train/loss_step=0.344, global_step=7209.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  87%|████████▋ | 1055/1208 [29:35<04:17,  1.68s/it, loss=0.178, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00198, train/loss_step=0.344, global_step=7209.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  87%|████████▋ | 1055/1208 [29:35<04:17,  1.68s/it, loss=0.191, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00142, train/loss_step=0.283, global_step=7209.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  87%|████████▋ | 1056/1208 [29:38<04:15,  1.68s/it, loss=0.191, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00142, train/loss_step=0.283, global_step=7209.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  87%|████████▋ | 1056/1208 [29:38<04:15,  1.68s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000163, train/loss_step=0.0454, global_step=7209.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  88%|████████▊ | 1057/1208 [29:39<04:14,  1.68s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000163, train/loss_step=0.0454, global_step=7209.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  88%|████████▊ | 1057/1208 [29:39<04:14,  1.68s/it, loss=0.188, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000956, train/loss_step=0.238, global_step=7210.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  88%|████████▊ | 1058/1208 [29:40<04:12,  1.68s/it, loss=0.188, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000956, train/loss_step=0.238, global_step=7210.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  88%|████████▊ | 1058/1208 [29:40<04:12,  1.68s/it, loss=0.188, v_num=0, train/loss_simple_step=0.00293, train/loss_vlb_step=1.66e-5, train/loss_step=0.00293, global_step=7210.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  88%|████████▊ | 1059/1208 [29:41<04:10,  1.68s/it, loss=0.188, v_num=0, train/loss_simple_step=0.00293, train/loss_vlb_step=1.66e-5, train/loss_step=0.00293, global_step=7210.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  88%|████████▊ | 1059/1208 [29:41<04:10,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00664, train/loss_vlb_step=3.26e-5, train/loss_step=0.00664, global_step=7210.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  88%|████████▊ | 1060/1208 [29:44<04:09,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00664, train/loss_vlb_step=3.26e-5, train/loss_step=0.00664, global_step=7210.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  88%|████████▊ | 1060/1208 [29:44<04:09,  1.68s/it, loss=0.167, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000813, train/loss_step=0.214, global_step=7210.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  88%|████████▊ | 1061/1208 [29:45<04:07,  1.68s/it, loss=0.167, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000813, train/loss_step=0.214, global_step=7210.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  88%|████████▊ | 1061/1208 [29:45<04:07,  1.68s/it, loss=0.173, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000373, train/loss_step=0.113, global_step=7211.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  88%|████████▊ | 1062/1208 [29:46<04:05,  1.68s/it, loss=0.173, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000373, train/loss_step=0.113, global_step=7211.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  88%|████████▊ | 1062/1208 [29:46<04:05,  1.68s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000127, train/loss_step=0.0336, global_step=7211.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  88%|████████▊ | 1063/1208 [29:47<04:03,  1.68s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000127, train/loss_step=0.0336, global_step=7211.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  88%|████████▊ | 1063/1208 [29:47<04:03,  1.68s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7.28e-5, train/loss_step=0.0165, global_step=7211.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  88%|████████▊ | 1064/1208 [29:51<04:02,  1.68s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7.28e-5, train/loss_step=0.0165, global_step=7211.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  88%|████████▊ | 1064/1208 [29:51<04:02,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.46e-5, train/loss_step=0.00254, global_step=7211.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  88%|████████▊ | 1065/1208 [29:52<04:00,  1.68s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.46e-5, train/loss_step=0.00254, global_step=7211.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  88%|████████▊ | 1065/1208 [29:52<04:00,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0465, train/loss_vlb_step=0.000163, train/loss_step=0.0465, global_step=7212.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  88%|████████▊ | 1066/1208 [29:53<03:58,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0465, train/loss_vlb_step=0.000163, train/loss_step=0.0465, global_step=7212.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  88%|████████▊ | 1066/1208 [29:53<03:58,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0582, train/loss_vlb_step=0.000203, train/loss_step=0.0582, global_step=7212.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  88%|████████▊ | 1067/1208 [29:54<03:57,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0582, train/loss_vlb_step=0.000203, train/loss_step=0.0582, global_step=7212.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  88%|████████▊ | 1067/1208 [29:54<03:57,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.424, train/loss_vlb_step=0.00297, train/loss_step=0.424, global_step=7212.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  88%|████████▊ | 1068/1208 [29:57<03:55,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.424, train/loss_vlb_step=0.00297, train/loss_step=0.424, global_step=7212.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  88%|████████▊ | 1068/1208 [29:57<03:55,  1.68s/it, loss=0.172, v_num=0, train/loss_simple_step=0.542, train/loss_vlb_step=0.00734, train/loss_step=0.542, global_step=7212.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  88%|████████▊ | 1069/1208 [29:58<03:53,  1.68s/it, loss=0.172, v_num=0, train/loss_simple_step=0.542, train/loss_vlb_step=0.00734, train/loss_step=0.542, global_step=7212.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  88%|████████▊ | 1069/1208 [29:58<03:53,  1.68s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0051, train/loss_vlb_step=2.63e-5, train/loss_step=0.0051, global_step=7213.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  89%|████████▊ | 1070/1208 [29:59<03:52,  1.68s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0051, train/loss_vlb_step=2.63e-5, train/loss_step=0.0051, global_step=7213.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  89%|████████▊ | 1070/1208 [29:59<03:52,  1.68s/it, loss=0.17, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.00047, train/loss_step=0.141, global_step=7213.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  89%|████████▊ | 1071/1208 [30:00<03:50,  1.68s/it, loss=0.17, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.00047, train/loss_step=0.141, global_step=7213.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  89%|████████▊ | 1071/1208 [30:00<03:50,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.0011, train/loss_step=0.260, global_step=7213.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  89%|████████▊ | 1072/1208 [30:03<03:48,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.0011, train/loss_step=0.260, global_step=7213.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  89%|████████▊ | 1072/1208 [30:03<03:48,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000128, train/loss_step=0.0345, global_step=7213.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  89%|████████▉ | 1073/1208 [30:04<03:47,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000128, train/loss_step=0.0345, global_step=7213.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  89%|████████▉ | 1073/1208 [30:04<03:47,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00191, train/loss_step=0.321, global_step=7214.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  89%|████████▉ | 1074/1208 [30:05<03:45,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00191, train/loss_step=0.321, global_step=7214.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  89%|████████▉ | 1074/1208 [30:05<03:45,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000421, train/loss_step=0.124, global_step=7214.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  89%|████████▉ | 1075/1208 [30:06<03:43,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000421, train/loss_step=0.124, global_step=7214.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  89%|████████▉ | 1075/1208 [30:06<03:43,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000788, train/loss_step=0.212, global_step=7214.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  89%|████████▉ | 1076/1208 [30:10<03:42,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000788, train/loss_step=0.212, global_step=7214.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  89%|████████▉ | 1076/1208 [30:10<03:42,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000391, train/loss_step=0.118, global_step=7214.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  89%|████████▉ | 1077/1208 [30:11<03:40,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000391, train/loss_step=0.118, global_step=7214.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  89%|████████▉ | 1077/1208 [30:11<03:40,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00663, train/loss_vlb_step=3.43e-5, train/loss_step=0.00663, global_step=7215.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  89%|████████▉ | 1078/1208 [30:12<03:38,  1.68s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00663, train/loss_vlb_step=3.43e-5, train/loss_step=0.00663, global_step=7215.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  89%|████████▉ | 1078/1208 [30:12<03:38,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.68e-5, train/loss_step=0.0215, global_step=7215.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  89%|████████▉ | 1079/1208 [30:13<03:36,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.68e-5, train/loss_step=0.0215, global_step=7215.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  89%|████████▉ | 1079/1208 [30:13<03:36,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0503, train/loss_vlb_step=0.000183, train/loss_step=0.0503, global_step=7215.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  89%|████████▉ | 1080/1208 [30:16<03:35,  1.68s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0503, train/loss_vlb_step=0.000183, train/loss_step=0.0503, global_step=7215.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  89%|████████▉ | 1080/1208 [30:16<03:35,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.53e-5, train/loss_step=0.00266, global_step=7215.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  89%|████████▉ | 1081/1208 [30:17<03:33,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.53e-5, train/loss_step=0.00266, global_step=7215.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  89%|████████▉ | 1081/1208 [30:17<03:33,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000515, train/loss_step=0.152, global_step=7216.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  90%|████████▉ | 1082/1208 [30:18<03:31,  1.68s/it, loss=0.129, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000515, train/loss_step=0.152, global_step=7216.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  90%|████████▉ | 1082/1208 [30:18<03:31,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0959, train/loss_vlb_step=0.000315, train/loss_step=0.0959, global_step=7216.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  90%|████████▉ | 1083/1208 [30:19<03:30,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0959, train/loss_vlb_step=0.000315, train/loss_step=0.0959, global_step=7216.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  90%|████████▉ | 1083/1208 [30:19<03:30,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.009, train/loss_vlb_step=4.43e-5, train/loss_step=0.009, global_step=7216.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  90%|████████▉ | 1084/1208 [30:22<03:28,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.009, train/loss_vlb_step=4.43e-5, train/loss_step=0.009, global_step=7216.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  90%|████████▉ | 1084/1208 [30:22<03:28,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00521, train/loss_vlb_step=2.67e-5, train/loss_step=0.00521, global_step=7216.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  90%|████████▉ | 1085/1208 [30:23<03:26,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00521, train/loss_vlb_step=2.67e-5, train/loss_step=0.00521, global_step=7216.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  90%|████████▉ | 1085/1208 [30:23<03:26,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00754, train/loss_vlb_step=3.7e-5, train/loss_step=0.00754, global_step=7217.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  90%|████████▉ | 1086/1208 [30:24<03:25,  1.68s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00754, train/loss_vlb_step=3.7e-5, train/loss_step=0.00754, global_step=7217.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  90%|████████▉ | 1086/1208 [30:24<03:25,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00456, train/loss_vlb_step=2.39e-5, train/loss_step=0.00456, global_step=7217.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  90%|████████▉ | 1087/1208 [30:25<03:23,  1.68s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00456, train/loss_vlb_step=2.39e-5, train/loss_step=0.00456, global_step=7217.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  90%|████████▉ | 1087/1208 [30:25<03:23,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.676, train/loss_vlb_step=0.0223, train/loss_step=0.676, global_step=7217.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]     Epoch 23:  90%|█████████ | 1088/1208 [30:29<03:21,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.676, train/loss_vlb_step=0.0223, train/loss_step=0.676, global_step=7217.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  90%|█████████ | 1088/1208 [30:29<03:21,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=2.61e-5, train/loss_step=0.00495, global_step=7217.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  90%|█████████ | 1089/1208 [30:30<03:20,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=2.61e-5, train/loss_step=0.00495, global_step=7217.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  90%|█████████ | 1089/1208 [30:30<03:20,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000455, train/loss_step=0.135, global_step=7218.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  90%|█████████ | 1090/1208 [30:31<03:18,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000455, train/loss_step=0.135, global_step=7218.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  90%|█████████ | 1090/1208 [30:31<03:18,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.24e-5, train/loss_step=0.0197, global_step=7218.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  90%|█████████ | 1091/1208 [30:32<03:16,  1.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.24e-5, train/loss_step=0.0197, global_step=7218.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  90%|█████████ | 1091/1208 [30:32<03:16,  1.68s/it, loss=0.11, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000789, train/loss_step=0.199, global_step=7218.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  90%|█████████ | 1092/1208 [30:35<03:14,  1.68s/it, loss=0.11, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000789, train/loss_step=0.199, global_step=7218.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  90%|█████████ | 1092/1208 [30:35<03:14,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000774, train/loss_step=0.210, global_step=7218.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  90%|█████████ | 1093/1208 [30:36<03:13,  1.68s/it, loss=0.119, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000774, train/loss_step=0.210, global_step=7218.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  90%|█████████ | 1093/1208 [30:36<03:13,  1.68s/it, loss=0.105, v_num=0, train/loss_simple_step=0.036, train/loss_vlb_step=0.000138, train/loss_step=0.036, global_step=7219.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  91%|█████████ | 1094/1208 [30:37<03:11,  1.68s/it, loss=0.105, v_num=0, train/loss_simple_step=0.036, train/loss_vlb_step=0.000138, train/loss_step=0.036, global_step=7219.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  91%|█████████ | 1094/1208 [30:37<03:11,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00263, train/loss_step=0.388, global_step=7219.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  91%|█████████ | 1095/1208 [30:38<03:09,  1.68s/it, loss=0.118, v_num=0, train/loss_simple_step=0.388, train/loss_vlb_step=0.00263, train/loss_step=0.388, global_step=7219.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  91%|█████████ | 1095/1208 [30:38<03:09,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00178, train/loss_step=0.305, global_step=7219.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  91%|█████████ | 1096/1208 [30:42<03:08,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00178, train/loss_step=0.305, global_step=7219.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  91%|█████████ | 1096/1208 [30:42<03:08,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00558, train/loss_vlb_step=2.95e-5, train/loss_step=0.00558, global_step=7219.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  91%|█████████ | 1097/1208 [30:43<03:06,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00558, train/loss_vlb_step=2.95e-5, train/loss_step=0.00558, global_step=7219.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  91%|█████████ | 1097/1208 [30:43<03:06,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000809, train/loss_step=0.201, global_step=7220.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  91%|█████████ | 1098/1208 [30:44<03:04,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000809, train/loss_step=0.201, global_step=7220.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  91%|█████████ | 1098/1208 [30:44<03:04,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.58e-5, train/loss_step=0.00274, global_step=7220.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  91%|█████████ | 1099/1208 [30:45<03:03,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.58e-5, train/loss_step=0.00274, global_step=7220.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  91%|█████████ | 1099/1208 [30:45<03:03,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000542, train/loss_step=0.159, global_step=7220.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  91%|█████████ | 1100/1208 [30:48<03:01,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000542, train/loss_step=0.159, global_step=7220.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  91%|█████████ | 1100/1208 [30:48<03:01,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.81e-5, train/loss_step=0.0187, global_step=7220.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  91%|█████████ | 1101/1208 [30:49<02:59,  1.68s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.81e-5, train/loss_step=0.0187, global_step=7220.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  91%|█████████ | 1101/1208 [30:49<02:59,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.770, train/loss_vlb_step=0.0363, train/loss_step=0.770, global_step=7221.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  91%|█████████ | 1102/1208 [30:50<02:57,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.770, train/loss_vlb_step=0.0363, train/loss_step=0.770, global_step=7221.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  91%|█████████ | 1102/1208 [30:50<02:57,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.000183, train/loss_step=0.0521, global_step=7221.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  91%|█████████▏| 1103/1208 [30:51<02:56,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.000183, train/loss_step=0.0521, global_step=7221.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  91%|█████████▏| 1103/1208 [30:51<02:56,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.070, train/loss_vlb_step=0.000244, train/loss_step=0.070, global_step=7221.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  91%|█████████▏| 1104/1208 [30:54<02:54,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.070, train/loss_vlb_step=0.000244, train/loss_step=0.070, global_step=7221.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  91%|█████████▏| 1104/1208 [30:54<02:54,  1.68s/it, loss=0.196, v_num=0, train/loss_simple_step=0.658, train/loss_vlb_step=0.0161, train/loss_step=0.658, global_step=7221.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  91%|█████████▏| 1105/1208 [30:55<02:52,  1.68s/it, loss=0.196, v_num=0, train/loss_simple_step=0.658, train/loss_vlb_step=0.0161, train/loss_step=0.658, global_step=7221.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  91%|█████████▏| 1105/1208 [30:55<02:52,  1.68s/it, loss=0.201, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=7222.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  92%|█████████▏| 1106/1208 [30:56<02:51,  1.68s/it, loss=0.201, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=7222.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  92%|█████████▏| 1106/1208 [30:56<02:51,  1.68s/it, loss=0.201, v_num=0, train/loss_simple_step=0.00536, train/loss_vlb_step=2.7e-5, train/loss_step=0.00536, global_step=7222.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  92%|█████████▏| 1107/1208 [30:57<02:49,  1.68s/it, loss=0.201, v_num=0, train/loss_simple_step=0.00536, train/loss_vlb_step=2.7e-5, train/loss_step=0.00536, global_step=7222.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  92%|█████████▏| 1107/1208 [30:57<02:49,  1.68s/it, loss=0.175, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000601, train/loss_step=0.166, global_step=7222.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  92%|█████████▏| 1108/1208 [31:01<02:47,  1.68s/it, loss=0.175, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000601, train/loss_step=0.166, global_step=7222.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  92%|█████████▏| 1108/1208 [31:01<02:47,  1.68s/it, loss=0.181, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000401, train/loss_step=0.120, global_step=7222.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  92%|█████████▏| 1109/1208 [31:02<02:46,  1.68s/it, loss=0.181, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000401, train/loss_step=0.120, global_step=7222.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  92%|█████████▏| 1109/1208 [31:02<02:46,  1.68s/it, loss=0.198, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.00374, train/loss_step=0.470, global_step=7223.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  92%|█████████▏| 1110/1208 [31:03<02:44,  1.68s/it, loss=0.198, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.00374, train/loss_step=0.470, global_step=7223.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  92%|█████████▏| 1110/1208 [31:03<02:44,  1.68s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.11e-5, train/loss_step=0.0171, global_step=7223.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  92%|█████████▏| 1111/1208 [31:04<02:42,  1.68s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.11e-5, train/loss_step=0.0171, global_step=7223.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  92%|█████████▏| 1111/1208 [31:04<02:42,  1.68s/it, loss=0.199, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000833, train/loss_step=0.220, global_step=7223.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  92%|█████████▏| 1112/1208 [31:07<02:41,  1.68s/it, loss=0.199, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000833, train/loss_step=0.220, global_step=7223.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  92%|█████████▏| 1112/1208 [31:07<02:41,  1.68s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0778, train/loss_vlb_step=0.000264, train/loss_step=0.0778, global_step=7223.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  92%|█████████▏| 1113/1208 [31:08<02:39,  1.68s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0778, train/loss_vlb_step=0.000264, train/loss_step=0.0778, global_step=7223.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  92%|█████████▏| 1113/1208 [31:08<02:39,  1.68s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000124, train/loss_step=0.0334, global_step=7224.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  92%|█████████▏| 1114/1208 [31:09<02:37,  1.68s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000124, train/loss_step=0.0334, global_step=7224.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  92%|█████████▏| 1114/1208 [31:09<02:37,  1.68s/it, loss=0.19, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00191, train/loss_step=0.351, global_step=7224.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  92%|█████████▏| 1115/1208 [31:10<02:36,  1.68s/it, loss=0.19, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00191, train/loss_step=0.351, global_step=7224.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  92%|█████████▏| 1115/1208 [31:10<02:36,  1.68s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000122, train/loss_step=0.0325, global_step=7224.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  92%|█████████▏| 1116/1208 [31:13<02:34,  1.68s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000122, train/loss_step=0.0325, global_step=7224.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  92%|█████████▏| 1116/1208 [31:13<02:34,  1.68s/it, loss=0.194, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.0019, train/loss_step=0.350, global_step=7224.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  92%|█████████▏| 1117/1208 [31:15<02:32,  1.68s/it, loss=0.194, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.0019, train/loss_step=0.350, global_step=7224.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  92%|█████████▏| 1117/1208 [31:15<02:32,  1.68s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000135, train/loss_step=0.0364, global_step=7225.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  93%|█████████▎| 1118/1208 [31:16<02:31,  1.68s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000135, train/loss_step=0.0364, global_step=7225.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  93%|█████████▎| 1118/1208 [31:16<02:31,  1.68s/it, loss=0.231, v_num=0, train/loss_simple_step=0.912, train/loss_vlb_step=0.459, train/loss_step=0.912, global_step=7225.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]     Epoch 23:  93%|█████████▎| 1119/1208 [31:17<02:29,  1.68s/it, loss=0.231, v_num=0, train/loss_simple_step=0.912, train/loss_vlb_step=0.459, train/loss_step=0.912, global_step=7225.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  93%|█████████▎| 1119/1208 [31:17<02:29,  1.68s/it, loss=0.226, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.000206, train/loss_step=0.0598, global_step=7225.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  93%|█████████▎| 1120/1208 [31:20<02:27,  1.68s/it, loss=0.226, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.000206, train/loss_step=0.0598, global_step=7225.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  93%|█████████▎| 1120/1208 [31:20<02:27,  1.68s/it, loss=0.227, v_num=0, train/loss_simple_step=0.0458, train/loss_vlb_step=0.000166, train/loss_step=0.0458, global_step=7225.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  93%|█████████▎| 1121/1208 [31:21<02:26,  1.68s/it, loss=0.227, v_num=0, train/loss_simple_step=0.0458, train/loss_vlb_step=0.000166, train/loss_step=0.0458, global_step=7225.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  93%|█████████▎| 1121/1208 [31:21<02:26,  1.68s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00704, train/loss_vlb_step=3.61e-5, train/loss_step=0.00704, global_step=7226.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  93%|█████████▎| 1122/1208 [31:22<02:24,  1.68s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00704, train/loss_vlb_step=3.61e-5, train/loss_step=0.00704, global_step=7226.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  93%|█████████▎| 1122/1208 [31:22<02:24,  1.68s/it, loss=0.199, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.00117, train/loss_step=0.241, global_step=7226.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  93%|█████████▎| 1123/1208 [31:23<02:22,  1.68s/it, loss=0.199, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.00117, train/loss_step=0.241, global_step=7226.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  93%|█████████▎| 1123/1208 [31:23<02:22,  1.68s/it, loss=0.209, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00119, train/loss_step=0.271, global_step=7226.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  93%|█████████▎| 1124/1208 [31:26<02:21,  1.68s/it, loss=0.209, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00119, train/loss_step=0.271, global_step=7226.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  93%|█████████▎| 1124/1208 [31:26<02:21,  1.68s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=2.84e-5, train/loss_step=0.00526, global_step=7226.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  93%|█████████▎| 1125/1208 [31:27<02:19,  1.68s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=2.84e-5, train/loss_step=0.00526, global_step=7226.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  93%|█████████▎| 1125/1208 [31:27<02:19,  1.68s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0804, train/loss_vlb_step=0.000267, train/loss_step=0.0804, global_step=7227.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  93%|█████████▎| 1126/1208 [31:28<02:17,  1.68s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0804, train/loss_vlb_step=0.000267, train/loss_step=0.0804, global_step=7227.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  93%|█████████▎| 1126/1208 [31:28<02:17,  1.68s/it, loss=0.197, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.00334, train/loss_step=0.450, global_step=7227.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  93%|█████████▎| 1127/1208 [31:29<02:15,  1.68s/it, loss=0.197, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.00334, train/loss_step=0.450, global_step=7227.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  93%|█████████▎| 1127/1208 [31:29<02:15,  1.68s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00911, train/loss_vlb_step=4.1e-5, train/loss_step=0.00911, global_step=7227.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  93%|█████████▎| 1128/1208 [31:33<02:14,  1.68s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00911, train/loss_vlb_step=4.1e-5, train/loss_step=0.00911, global_step=7227.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  93%|█████████▎| 1128/1208 [31:33<02:14,  1.68s/it, loss=0.19, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000406, train/loss_step=0.124, global_step=7227.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  93%|█████████▎| 1129/1208 [31:34<02:12,  1.68s/it, loss=0.19, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000406, train/loss_step=0.124, global_step=7227.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  93%|█████████▎| 1129/1208 [31:34<02:12,  1.68s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.48e-5, train/loss_step=0.00266, global_step=7228.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  94%|█████████▎| 1130/1208 [31:35<02:10,  1.68s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.48e-5, train/loss_step=0.00266, global_step=7228.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  94%|█████████▎| 1130/1208 [31:35<02:10,  1.68s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0577, train/loss_vlb_step=0.000199, train/loss_step=0.0577, global_step=7228.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  94%|█████████▎| 1131/1208 [31:36<02:09,  1.68s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0577, train/loss_vlb_step=0.000199, train/loss_step=0.0577, global_step=7228.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  94%|█████████▎| 1131/1208 [31:36<02:09,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000408, train/loss_step=0.123, global_step=7228.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  94%|█████████▎| 1132/1208 [31:39<02:07,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000408, train/loss_step=0.123, global_step=7228.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  94%|█████████▎| 1132/1208 [31:39<02:07,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.59e-5, train/loss_step=0.0154, global_step=7228.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  94%|█████████▍| 1133/1208 [31:40<02:05,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.59e-5, train/loss_step=0.0154, global_step=7228.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  94%|█████████▍| 1133/1208 [31:40<02:05,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=9.44e-5, train/loss_step=0.025, global_step=7229.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  94%|█████████▍| 1134/1208 [31:41<02:04,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=9.44e-5, train/loss_step=0.025, global_step=7229.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  94%|█████████▍| 1134/1208 [31:41<02:04,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0553, train/loss_vlb_step=0.000194, train/loss_step=0.0553, global_step=7229.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  94%|█████████▍| 1135/1208 [31:42<02:02,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0553, train/loss_vlb_step=0.000194, train/loss_step=0.0553, global_step=7229.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  94%|█████████▍| 1135/1208 [31:42<02:02,  1.68s/it, loss=0.17, v_num=0, train/loss_simple_step=0.537, train/loss_vlb_step=0.00418, train/loss_step=0.537, global_step=7229.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  94%|█████████▍| 1136/1208 [31:45<02:00,  1.68s/it, loss=0.17, v_num=0, train/loss_simple_step=0.537, train/loss_vlb_step=0.00418, train/loss_step=0.537, global_step=7229.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  94%|█████████▍| 1136/1208 [31:45<02:00,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000107, train/loss_step=0.0265, global_step=7229.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  94%|█████████▍| 1137/1208 [31:46<01:59,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000107, train/loss_step=0.0265, global_step=7229.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  94%|█████████▍| 1137/1208 [31:46<01:59,  1.68s/it, loss=0.182, v_num=0, train/loss_simple_step=0.595, train/loss_vlb_step=0.0185, train/loss_step=0.595, global_step=7230.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  94%|█████████▍| 1138/1208 [31:47<01:57,  1.68s/it, loss=0.182, v_num=0, train/loss_simple_step=0.595, train/loss_vlb_step=0.0185, train/loss_step=0.595, global_step=7230.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  94%|█████████▍| 1138/1208 [31:47<01:57,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.465, train/loss_vlb_step=0.00523, train/loss_step=0.465, global_step=7230.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  94%|█████████▍| 1139/1208 [31:48<01:55,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.465, train/loss_vlb_step=0.00523, train/loss_step=0.465, global_step=7230.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  94%|█████████▍| 1139/1208 [31:48<01:55,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00456, train/loss_vlb_step=2.38e-5, train/loss_step=0.00456, global_step=7230.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  94%|█████████▍| 1140/1208 [31:52<01:54,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00456, train/loss_vlb_step=2.38e-5, train/loss_step=0.00456, global_step=7230.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  94%|█████████▍| 1140/1208 [31:52<01:54,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000132, train/loss_step=0.0345, global_step=7230.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  94%|█████████▍| 1141/1208 [31:53<01:52,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000132, train/loss_step=0.0345, global_step=7230.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  94%|█████████▍| 1141/1208 [31:53<01:52,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000116, train/loss_step=0.0299, global_step=7231.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  95%|█████████▍| 1142/1208 [31:54<01:50,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000116, train/loss_step=0.0299, global_step=7231.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  95%|█████████▍| 1142/1208 [31:54<01:50,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0503, train/loss_vlb_step=0.000177, train/loss_step=0.0503, global_step=7231.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  95%|█████████▍| 1143/1208 [31:55<01:48,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0503, train/loss_vlb_step=0.000177, train/loss_step=0.0503, global_step=7231.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  95%|█████████▍| 1143/1208 [31:55<01:48,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.93e-5, train/loss_step=0.00351, global_step=7231.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  95%|█████████▍| 1144/1208 [31:58<01:47,  1.68s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.93e-5, train/loss_step=0.00351, global_step=7231.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  95%|█████████▍| 1144/1208 [31:58<01:47,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00323, train/loss_step=0.385, global_step=7231.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  95%|█████████▍| 1145/1208 [31:59<01:45,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00323, train/loss_step=0.385, global_step=7231.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  95%|█████████▍| 1145/1208 [31:59<01:45,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.075, train/loss_vlb_step=0.000252, train/loss_step=0.075, global_step=7232.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  95%|█████████▍| 1146/1208 [32:00<01:43,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.075, train/loss_vlb_step=0.000252, train/loss_step=0.075, global_step=7232.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  95%|█████████▍| 1146/1208 [32:00<01:43,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000627, train/loss_step=0.182, global_step=7232.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  95%|█████████▍| 1147/1208 [32:01<01:42,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000627, train/loss_step=0.182, global_step=7232.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  95%|█████████▍| 1147/1208 [32:01<01:42,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.00016, train/loss_step=0.0443, global_step=7232.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  95%|█████████▌| 1148/1208 [32:04<01:40,  1.68s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.00016, train/loss_step=0.0443, global_step=7232.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  95%|█████████▌| 1148/1208 [32:04<01:40,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000627, train/loss_step=0.179, global_step=7232.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  95%|█████████▌| 1149/1208 [32:05<01:38,  1.68s/it, loss=0.145, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000627, train/loss_step=0.179, global_step=7232.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  95%|█████████▌| 1149/1208 [32:05<01:38,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000371, train/loss_step=0.113, global_step=7233.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  95%|█████████▌| 1150/1208 [32:06<01:37,  1.68s/it, loss=0.15, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000371, train/loss_step=0.113, global_step=7233.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  95%|█████████▌| 1150/1208 [32:07<01:37,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0759, train/loss_vlb_step=0.00025, train/loss_step=0.0759, global_step=7233.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  95%|█████████▌| 1151/1208 [32:08<01:35,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0759, train/loss_vlb_step=0.00025, train/loss_step=0.0759, global_step=7233.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  95%|█████████▌| 1151/1208 [32:08<01:35,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000548, train/loss_step=0.161, global_step=7233.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  95%|█████████▌| 1152/1208 [32:11<01:33,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000548, train/loss_step=0.161, global_step=7233.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  95%|█████████▌| 1152/1208 [32:11<01:33,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.08e-5, train/loss_step=0.00178, global_step=7233.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  95%|█████████▌| 1153/1208 [32:12<01:32,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.08e-5, train/loss_step=0.00178, global_step=7233.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  95%|█████████▌| 1153/1208 [32:12<01:32,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.74e-5, train/loss_step=0.00305, global_step=7234.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  96%|█████████▌| 1154/1208 [32:13<01:30,  1.68s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.74e-5, train/loss_step=0.00305, global_step=7234.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  96%|█████████▌| 1154/1208 [32:13<01:30,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00633, train/loss_vlb_step=3.17e-5, train/loss_step=0.00633, global_step=7234.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  96%|█████████▌| 1155/1208 [32:14<01:28,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00633, train/loss_vlb_step=3.17e-5, train/loss_step=0.00633, global_step=7234.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  96%|█████████▌| 1155/1208 [32:14<01:28,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.82e-5, train/loss_step=0.0129, global_step=7234.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  96%|█████████▌| 1156/1208 [32:17<01:27,  1.68s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.82e-5, train/loss_step=0.0129, global_step=7234.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  96%|█████████▌| 1156/1208 [32:17<01:27,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00275, train/loss_vlb_step=1.61e-5, train/loss_step=0.00275, global_step=7234.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  96%|█████████▌| 1157/1208 [32:18<01:25,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00275, train/loss_vlb_step=1.61e-5, train/loss_step=0.00275, global_step=7234.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  96%|█████████▌| 1157/1208 [32:18<01:25,  1.68s/it, loss=0.092, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.77e-5, train/loss_step=0.0101, global_step=7235.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  96%|█████████▌| 1158/1208 [32:19<01:23,  1.68s/it, loss=0.092, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.77e-5, train/loss_step=0.0101, global_step=7235.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  96%|█████████▌| 1158/1208 [32:19<01:23,  1.68s/it, loss=0.0689, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=1.17e-5, train/loss_step=0.00201, global_step=7235.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  96%|█████████▌| 1159/1208 [32:20<01:22,  1.67s/it, loss=0.0689, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=1.17e-5, train/loss_step=0.00201, global_step=7235.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  96%|█████████▌| 1159/1208 [32:20<01:22,  1.67s/it, loss=0.0795, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000865, train/loss_step=0.217, global_step=7235.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  96%|█████████▌| 1160/1208 [32:24<01:20,  1.68s/it, loss=0.0795, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000865, train/loss_step=0.217, global_step=7235.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  96%|█████████▌| 1160/1208 [32:24<01:20,  1.68s/it, loss=0.078, v_num=0, train/loss_simple_step=0.00491, train/loss_vlb_step=2.54e-5, train/loss_step=0.00491, global_step=7235.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  96%|█████████▌| 1161/1208 [32:25<01:18,  1.68s/it, loss=0.078, v_num=0, train/loss_simple_step=0.00491, train/loss_vlb_step=2.54e-5, train/loss_step=0.00491, global_step=7235.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  96%|█████████▌| 1161/1208 [32:25<01:18,  1.68s/it, loss=0.0801, v_num=0, train/loss_simple_step=0.071, train/loss_vlb_step=0.000236, train/loss_step=0.071, global_step=7236.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  96%|█████████▌| 1162/1208 [32:26<01:17,  1.67s/it, loss=0.0801, v_num=0, train/loss_simple_step=0.071, train/loss_vlb_step=0.000236, train/loss_step=0.071, global_step=7236.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  96%|█████████▌| 1162/1208 [32:26<01:17,  1.67s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000604, train/loss_step=0.177, global_step=7236.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  96%|█████████▋| 1163/1208 [32:27<01:15,  1.67s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000604, train/loss_step=0.177, global_step=7236.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  96%|█████████▋| 1163/1208 [32:27<01:15,  1.67s/it, loss=0.0917, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000365, train/loss_step=0.110, global_step=7236.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  96%|█████████▋| 1164/1208 [32:30<01:13,  1.68s/it, loss=0.0917, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000365, train/loss_step=0.110, global_step=7236.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  96%|█████████▋| 1164/1208 [32:30<01:13,  1.68s/it, loss=0.078, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000364, train/loss_step=0.110, global_step=7236.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  96%|█████████▋| 1165/1208 [32:31<01:12,  1.68s/it, loss=0.078, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000364, train/loss_step=0.110, global_step=7236.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  96%|█████████▋| 1165/1208 [32:31<01:12,  1.68s/it, loss=0.0747, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.76e-5, train/loss_step=0.0102, global_step=7237.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  97%|█████████▋| 1166/1208 [32:32<01:10,  1.67s/it, loss=0.0747, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.76e-5, train/loss_step=0.0102, global_step=7237.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  97%|█████████▋| 1166/1208 [32:32<01:10,  1.67s/it, loss=0.0819, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00179, train/loss_step=0.326, global_step=7237.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  97%|█████████▋| 1167/1208 [32:33<01:08,  1.67s/it, loss=0.0819, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00179, train/loss_step=0.326, global_step=7237.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  97%|█████████▋| 1167/1208 [32:33<01:08,  1.67s/it, loss=0.08, v_num=0, train/loss_simple_step=0.00566, train/loss_vlb_step=2.99e-5, train/loss_step=0.00566, global_step=7237.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  97%|█████████▋| 1168/1208 [32:36<01:07,  1.68s/it, loss=0.08, v_num=0, train/loss_simple_step=0.00566, train/loss_vlb_step=2.99e-5, train/loss_step=0.00566, global_step=7237.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  97%|█████████▋| 1168/1208 [32:36<01:07,  1.68s/it, loss=0.0818, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000858, train/loss_step=0.215, global_step=7237.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  97%|█████████▋| 1169/1208 [32:37<01:05,  1.67s/it, loss=0.0818, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000858, train/loss_step=0.215, global_step=7237.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  97%|█████████▋| 1169/1208 [32:37<01:05,  1.67s/it, loss=0.0766, v_num=0, train/loss_simple_step=0.0099, train/loss_vlb_step=4.57e-5, train/loss_step=0.0099, global_step=7238.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  97%|█████████▋| 1170/1208 [32:38<01:03,  1.67s/it, loss=0.0766, v_num=0, train/loss_simple_step=0.0099, train/loss_vlb_step=4.57e-5, train/loss_step=0.0099, global_step=7238.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  97%|█████████▋| 1170/1208 [32:38<01:03,  1.67s/it, loss=0.0733, v_num=0, train/loss_simple_step=0.00924, train/loss_vlb_step=4.46e-5, train/loss_step=0.00924, global_step=7238.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  97%|█████████▋| 1171/1208 [32:39<01:01,  1.67s/it, loss=0.0733, v_num=0, train/loss_simple_step=0.00924, train/loss_vlb_step=4.46e-5, train/loss_step=0.00924, global_step=7238.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  97%|█████████▋| 1171/1208 [32:39<01:01,  1.67s/it, loss=0.0753, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000727, train/loss_step=0.202, global_step=7238.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  97%|█████████▋| 1172/1208 [32:43<01:00,  1.67s/it, loss=0.0753, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000727, train/loss_step=0.202, global_step=7238.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  97%|█████████▋| 1172/1208 [32:43<01:00,  1.67s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00292, train/loss_step=0.454, global_step=7238.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  97%|█████████▋| 1173/1208 [32:44<00:58,  1.67s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00292, train/loss_step=0.454, global_step=7238.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  97%|█████████▋| 1173/1208 [32:44<00:58,  1.67s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.00979, train/loss_vlb_step=4.68e-5, train/loss_step=0.00979, global_step=7239.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  97%|█████████▋| 1174/1208 [32:45<00:56,  1.67s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.00979, train/loss_vlb_step=4.68e-5, train/loss_step=0.00979, global_step=7239.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  97%|█████████▋| 1174/1208 [32:45<00:56,  1.67s/it, loss=0.098, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=1.32e-5, train/loss_step=0.00231, global_step=7239.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  97%|█████████▋| 1175/1208 [32:46<00:55,  1.67s/it, loss=0.098, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=1.32e-5, train/loss_step=0.00231, global_step=7239.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  97%|█████████▋| 1175/1208 [32:46<00:55,  1.67s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0607, train/loss_vlb_step=0.000211, train/loss_step=0.0607, global_step=7239.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  97%|█████████▋| 1176/1208 [32:49<00:53,  1.67s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0607, train/loss_vlb_step=0.000211, train/loss_step=0.0607, global_step=7239.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  97%|█████████▋| 1176/1208 [32:49<00:53,  1.67s/it, loss=0.109, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000691, train/loss_step=0.178, global_step=7239.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  97%|█████████▋| 1177/1208 [32:50<00:51,  1.67s/it, loss=0.109, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000691, train/loss_step=0.178, global_step=7239.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  97%|█████████▋| 1177/1208 [32:50<00:51,  1.67s/it, loss=0.123, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.0015, train/loss_step=0.290, global_step=7240.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  98%|█████████▊| 1178/1208 [32:51<00:50,  1.67s/it, loss=0.123, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.0015, train/loss_step=0.290, global_step=7240.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  98%|█████████▊| 1178/1208 [32:51<00:50,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.0033, train/loss_step=0.402, global_step=7240.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  98%|█████████▊| 1179/1208 [32:52<00:48,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.0033, train/loss_step=0.402, global_step=7240.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  98%|█████████▊| 1179/1208 [32:52<00:48,  1.67s/it, loss=0.148, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00205, train/loss_step=0.306, global_step=7240.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  98%|█████████▊| 1180/1208 [32:55<00:46,  1.67s/it, loss=0.148, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00205, train/loss_step=0.306, global_step=7240.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  98%|█████████▊| 1180/1208 [32:55<00:46,  1.67s/it, loss=0.166, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00185, train/loss_step=0.364, global_step=7240.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  98%|█████████▊| 1181/1208 [32:56<00:45,  1.67s/it, loss=0.166, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00185, train/loss_step=0.364, global_step=7240.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  98%|█████████▊| 1181/1208 [32:56<00:45,  1.67s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0946, train/loss_vlb_step=0.000311, train/loss_step=0.0946, global_step=7241.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  98%|█████████▊| 1182/1208 [32:57<00:43,  1.67s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0946, train/loss_vlb_step=0.000311, train/loss_step=0.0946, global_step=7241.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  98%|█████████▊| 1182/1208 [32:57<00:43,  1.67s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.54e-5, train/loss_step=0.0168, global_step=7241.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  98%|█████████▊| 1183/1208 [32:58<00:41,  1.67s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.54e-5, train/loss_step=0.0168, global_step=7241.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  98%|█████████▊| 1183/1208 [32:58<00:41,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.0015, train/loss_step=0.295, global_step=7241.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  98%|█████████▊| 1184/1208 [33:01<00:40,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.0015, train/loss_step=0.295, global_step=7241.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  98%|█████████▊| 1184/1208 [33:01<00:40,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000147, train/loss_step=0.0387, global_step=7241.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  98%|█████████▊| 1185/1208 [33:03<00:38,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000147, train/loss_step=0.0387, global_step=7241.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  98%|█████████▊| 1185/1208 [33:03<00:38,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000422, train/loss_step=0.127, global_step=7242.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  98%|█████████▊| 1186/1208 [33:04<00:36,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000422, train/loss_step=0.127, global_step=7242.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  98%|█████████▊| 1186/1208 [33:04<00:36,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.77e-5, train/loss_step=0.0101, global_step=7242.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  98%|█████████▊| 1187/1208 [33:05<00:35,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.77e-5, train/loss_step=0.0101, global_step=7242.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  98%|█████████▊| 1187/1208 [33:05<00:35,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00665, train/loss_vlb_step=3.34e-5, train/loss_step=0.00665, global_step=7242.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  98%|█████████▊| 1188/1208 [33:08<00:33,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00665, train/loss_vlb_step=3.34e-5, train/loss_step=0.00665, global_step=7242.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  98%|█████████▊| 1188/1208 [33:08<00:33,  1.67s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00531, train/loss_vlb_step=2.73e-5, train/loss_step=0.00531, global_step=7242.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  98%|█████████▊| 1189/1208 [33:09<00:31,  1.67s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00531, train/loss_vlb_step=2.73e-5, train/loss_step=0.00531, global_step=7242.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  98%|█████████▊| 1189/1208 [33:09<00:31,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000508, train/loss_step=0.151, global_step=7243.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]   Epoch 23:  99%|█████████▊| 1190/1208 [33:10<00:30,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000508, train/loss_step=0.151, global_step=7243.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  99%|█████████▊| 1190/1208 [33:10<00:30,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00242, train/loss_step=0.349, global_step=7243.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  99%|█████████▊| 1191/1208 [33:11<00:28,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00242, train/loss_step=0.349, global_step=7243.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  99%|█████████▊| 1191/1208 [33:11<00:28,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=7243.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  99%|█████████▊| 1192/1208 [33:14<00:26,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=7243.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  99%|█████████▊| 1192/1208 [33:14<00:26,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00139, train/loss_step=0.300, global_step=7243.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145] Epoch 23:  99%|█████████▉| 1193/1208 [33:15<00:25,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00139, train/loss_step=0.300, global_step=7243.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  99%|█████████▉| 1193/1208 [33:15<00:25,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.004, train/loss_vlb_step=2.24e-5, train/loss_step=0.004, global_step=7244.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  99%|█████████▉| 1194/1208 [33:16<00:23,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.004, train/loss_vlb_step=2.24e-5, train/loss_step=0.004, global_step=7244.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  99%|█████████▉| 1194/1208 [33:16<00:23,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000111, train/loss_step=0.0279, global_step=7244.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  99%|█████████▉| 1195/1208 [33:17<00:21,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000111, train/loss_step=0.0279, global_step=7244.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  99%|█████████▉| 1195/1208 [33:17<00:21,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00616, train/loss_vlb_step=3.1e-5, train/loss_step=0.00616, global_step=7244.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  99%|█████████▉| 1196/1208 [33:20<00:20,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00616, train/loss_vlb_step=3.1e-5, train/loss_step=0.00616, global_step=7244.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  99%|█████████▉| 1196/1208 [33:20<00:20,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000786, train/loss_step=0.202, global_step=7244.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23:  99%|█████████▉| 1197/1208 [33:21<00:18,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000786, train/loss_step=0.202, global_step=7244.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  99%|█████████▉| 1197/1208 [33:21<00:18,  1.67s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000108, train/loss_step=0.0274, global_step=7245.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  99%|█████████▉| 1198/1208 [33:22<00:16,  1.67s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000108, train/loss_step=0.0274, global_step=7245.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  99%|█████████▉| 1198/1208 [33:22<00:16,  1.67s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.000148, train/loss_step=0.0417, global_step=7245.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  99%|█████████▉| 1199/1208 [33:24<00:15,  1.67s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0417, train/loss_vlb_step=0.000148, train/loss_step=0.0417, global_step=7245.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  99%|█████████▉| 1199/1208 [33:24<00:15,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.431, train/loss_vlb_step=0.00333, train/loss_step=0.431, global_step=7245.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]    Epoch 23:  99%|█████████▉| 1200/1208 [33:27<00:13,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.431, train/loss_vlb_step=0.00333, train/loss_step=0.431, global_step=7245.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  99%|█████████▉| 1200/1208 [33:27<00:13,  1.67s/it, loss=0.126, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00148, train/loss_step=0.288, global_step=7245.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.76it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.83it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.83it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.78it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.80it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.81it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.77it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.83it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 23:  99%|█████████▉| 1201/1208 [33:57<00:11,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00148, train/loss_step=0.288, global_step=7245.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23:  99%|█████████▉| 1201/1208 [33:57<00:11,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0318, train/loss_vlb_step=0.00012, train/loss_step=0.0318, global_step=7246.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23: 100%|█████████▉| 1202/1208 [33:58<00:10,  1.70s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0318, train/loss_vlb_step=0.00012, train/loss_step=0.0318, global_step=7246.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23: 100%|█████████▉| 1202/1208 [33:58<00:10,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0946, train/loss_vlb_step=0.00032, train/loss_step=0.0946, global_step=7246.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23: 100%|█████████▉| 1203/1208 [33:59<00:08,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0946, train/loss_vlb_step=0.00032, train/loss_step=0.0946, global_step=7246.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23: 100%|█████████▉| 1203/1208 [33:59<00:08,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00121, train/loss_step=0.280, global_step=7246.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23: 100%|█████████▉| 1204/1208 [34:02<00:06,  1.70s/it, loss=0.126, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00121, train/loss_step=0.280, global_step=7246.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23: 100%|█████████▉| 1204/1208 [34:02<00:06,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000515, train/loss_step=0.156, global_step=7246.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23: 100%|█████████▉| 1205/1208 [34:03<00:05,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000515, train/loss_step=0.156, global_step=7246.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23: 100%|█████████▉| 1205/1208 [34:03<00:05,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0686, train/loss_vlb_step=0.00023, train/loss_step=0.0686, global_step=7247.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23: 100%|█████████▉| 1206/1208 [34:04<00:03,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0686, train/loss_vlb_step=0.00023, train/loss_step=0.0686, global_step=7247.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23: 100%|█████████▉| 1206/1208 [34:04<00:03,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00194, train/loss_step=0.354, global_step=7247.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]  Epoch 23: 100%|█████████▉| 1207/1208 [34:06<00:01,  1.70s/it, loss=0.147, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00194, train/loss_step=0.354, global_step=7247.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23: 100%|█████████▉| 1207/1208 [34:06<00:01,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0999, train/loss_vlb_step=0.000333, train/loss_step=0.0999, global_step=7247.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23: 100%|██████████| 1208/1208 [34:11<00:00,  1.70s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0999, train/loss_vlb_step=0.000333, train/loss_step=0.0999, global_step=7247.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 23: 100%|██████████| 1208/1208 [34:11<00:00,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000136, train/loss_step=0.0365, global_step=7247.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]
+
+
+Epoch 23:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.153, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000136, train/loss_step=0.0365, global_step=7247.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]           Epoch 24:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.153, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000136, train/loss_step=0.0365, global_step=7247.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][AData shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s][A
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.72it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.73it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.71it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.71it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.74it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.74it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.74it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.75it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.75it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.82it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.83it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.74it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.73it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.76it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.75it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.76it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.78it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.76it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.83it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.69it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.70it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.78it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.73it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:11,  1.72it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.74it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.74it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.78it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.75it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.79it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.78it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.78it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.82it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.77it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.78it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.78it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.82it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.82it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.78it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.77it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.82it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.83it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.73it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.71it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.78it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.75it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.75it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.77it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 24:   0%|          | 1/1208 [00:34<11:24:47, 34.04s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000136, train/loss_step=0.0365, global_step=7247.0, train/loss_simple_epoch=0.145, train/loss_vlb_epoch=0.00279, train/loss_epoch=0.145]Epoch 24:   0%|          | 1/1208 [00:34<11:24:48, 34.04s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000269, train/loss_step=0.0815, global_step=7248.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   0%|          | 2/1208 [00:35<5:52:29, 17.54s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000269, train/loss_step=0.0815, global_step=7248.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:   0%|          | 2/1208 [00:35<5:52:30, 17.54s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0529, train/loss_vlb_step=0.000183, train/loss_step=0.0529, global_step=7248.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   0%|          | 3/1208 [00:36<4:01:39, 12.03s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0529, train/loss_vlb_step=0.000183, train/loss_step=0.0529, global_step=7248.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   0%|          | 3/1208 [00:36<4:01:40, 12.03s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.3e-5, train/loss_step=0.0235, global_step=7248.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:   0%|          | 4/1208 [00:39<3:16:37,  9.80s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.3e-5, train/loss_step=0.0235, global_step=7248.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   0%|          | 4/1208 [00:39<3:16:38,  9.80s/it, loss=0.124, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000637, train/loss_step=0.175, global_step=7248.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   0%|          | 5/1208 [00:40<2:41:25,  8.05s/it, loss=0.124, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000637, train/loss_step=0.175, global_step=7248.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   0%|          | 5/1208 [00:40<2:41:25,  8.05s/it, loss=0.126, v_num=0, train/loss_simple_step=0.047, train/loss_vlb_step=0.000163, train/loss_step=0.047, global_step=7249.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   0%|          | 6/1208 [00:41<2:17:52,  6.88s/it, loss=0.126, v_num=0, train/loss_simple_step=0.047, train/loss_vlb_step=0.000163, train/loss_step=0.047, global_step=7249.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   0%|          | 6/1208 [00:41<2:17:52,  6.88s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0764, train/loss_vlb_step=0.000255, train/loss_step=0.0764, global_step=7249.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   1%|          | 7/1208 [00:42<2:01:01,  6.05s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0764, train/loss_vlb_step=0.000255, train/loss_step=0.0764, global_step=7249.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   1%|          | 7/1208 [00:42<2:01:01,  6.05s/it, loss=0.132, v_num=0, train/loss_simple_step=0.078, train/loss_vlb_step=0.00026, train/loss_step=0.078, global_step=7249.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:   1%|          | 8/1208 [00:45<1:53:52,  5.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.078, train/loss_vlb_step=0.00026, train/loss_step=0.078, global_step=7249.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   1%|          | 8/1208 [00:45<1:53:53,  5.69s/it, loss=0.131, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000591, train/loss_step=0.166, global_step=7249.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   1%|          | 9/1208 [00:46<1:43:29,  5.18s/it, loss=0.131, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000591, train/loss_step=0.166, global_step=7249.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   1%|          | 9/1208 [00:46<1:43:30,  5.18s/it, loss=0.146, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.0019, train/loss_step=0.332, global_step=7250.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:   1%|          | 10/1208 [00:47<1:35:07,  4.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.0019, train/loss_step=0.332, global_step=7250.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   1%|          | 10/1208 [00:47<1:35:07,  4.76s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00691, train/loss_vlb_step=3.47e-5, train/loss_step=0.00691, global_step=7250.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   1%|          | 11/1208 [00:48<1:28:15,  4.42s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00691, train/loss_vlb_step=3.47e-5, train/loss_step=0.00691, global_step=7250.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   1%|          | 11/1208 [00:48<1:28:15,  4.42s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.95e-5, train/loss_step=0.0134, global_step=7250.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:   1%|          | 12/1208 [00:51<1:26:13,  4.33s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.95e-5, train/loss_step=0.0134, global_step=7250.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   1%|          | 12/1208 [00:51<1:26:13,  4.33s/it, loss=0.124, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00147, train/loss_step=0.298, global_step=7250.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:   1%|          | 13/1208 [00:52<1:21:06,  4.07s/it, loss=0.124, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00147, train/loss_step=0.298, global_step=7250.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   1%|          | 13/1208 [00:52<1:21:06,  4.07s/it, loss=0.137, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00129, train/loss_step=0.298, global_step=7251.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   1%|          | 14/1208 [00:53<1:16:42,  3.85s/it, loss=0.137, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00129, train/loss_step=0.298, global_step=7251.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   1%|          | 14/1208 [00:53<1:16:42,  3.85s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.81e-5, train/loss_step=0.0135, global_step=7251.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   1%|          | 15/1208 [00:54<1:12:53,  3.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.81e-5, train/loss_step=0.0135, global_step=7251.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   1%|          | 15/1208 [00:54<1:12:53,  3.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0383, train/loss_vlb_step=0.000137, train/loss_step=0.0383, global_step=7251.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   1%|▏         | 16/1208 [00:58<1:12:23,  3.64s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0383, train/loss_vlb_step=0.000137, train/loss_step=0.0383, global_step=7251.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   1%|▏         | 16/1208 [00:58<1:12:24,  3.64s/it, loss=0.122, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000653, train/loss_step=0.175, global_step=7251.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:   1%|▏         | 17/1208 [00:59<1:09:17,  3.49s/it, loss=0.122, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000653, train/loss_step=0.175, global_step=7251.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   1%|▏         | 17/1208 [00:59<1:09:17,  3.49s/it, loss=0.13, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000857, train/loss_step=0.225, global_step=7252.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:   1%|▏         | 18/1208 [01:00<1:06:30,  3.35s/it, loss=0.13, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000857, train/loss_step=0.225, global_step=7252.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   1%|▏         | 18/1208 [01:00<1:06:30,  3.35s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00496, train/loss_vlb_step=2.53e-5, train/loss_step=0.00496, global_step=7252.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   2%|▏         | 19/1208 [01:01<1:04:01,  3.23s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00496, train/loss_vlb_step=2.53e-5, train/loss_step=0.00496, global_step=7252.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   2%|▏         | 19/1208 [01:01<1:04:02,  3.23s/it, loss=0.11, v_num=0, train/loss_simple_step=0.047, train/loss_vlb_step=0.000172, train/loss_step=0.047, global_step=7252.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:   2%|▏         | 20/1208 [01:04<1:04:03,  3.24s/it, loss=0.11, v_num=0, train/loss_simple_step=0.047, train/loss_vlb_step=0.000172, train/loss_step=0.047, global_step=7252.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   2%|▏         | 20/1208 [01:04<1:04:03,  3.24s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.23e-5, train/loss_step=0.0136, global_step=7252.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   2%|▏         | 21/1208 [01:05<1:01:57,  3.13s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.23e-5, train/loss_step=0.0136, global_step=7252.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   2%|▏         | 21/1208 [01:05<1:01:57,  3.13s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00644, train/loss_vlb_step=3.29e-5, train/loss_step=0.00644, global_step=7253.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   2%|▏         | 22/1208 [01:06<1:00:01,  3.04s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00644, train/loss_vlb_step=3.29e-5, train/loss_step=0.00644, global_step=7253.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   2%|▏         | 22/1208 [01:06<1:00:01,  3.04s/it, loss=0.136, v_num=0, train/loss_simple_step=0.690, train/loss_vlb_step=0.0357, train/loss_step=0.690, global_step=7253.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]     Epoch 24:   2%|▏         | 23/1208 [01:07<58:14,  2.95s/it, loss=0.136, v_num=0, train/loss_simple_step=0.690, train/loss_vlb_step=0.0357, train/loss_step=0.690, global_step=7253.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:   2%|▏         | 23/1208 [01:07<58:14,  2.95s/it, loss=0.148, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000977, train/loss_step=0.246, global_step=7253.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   2%|▏         | 24/1208 [01:11<58:26,  2.96s/it, loss=0.148, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000977, train/loss_step=0.246, global_step=7253.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   2%|▏         | 24/1208 [01:11<58:26,  2.96s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0803, train/loss_vlb_step=0.000266, train/loss_step=0.0803, global_step=7253.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   2%|▏         | 25/1208 [01:12<56:53,  2.89s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0803, train/loss_vlb_step=0.000266, train/loss_step=0.0803, global_step=7253.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   2%|▏         | 25/1208 [01:12<56:53,  2.89s/it, loss=0.154, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00111, train/loss_step=0.261, global_step=7254.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:   2%|▏         | 26/1208 [01:13<55:26,  2.81s/it, loss=0.154, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00111, train/loss_step=0.261, global_step=7254.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   2%|▏         | 26/1208 [01:13<55:26,  2.81s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.13e-5, train/loss_step=0.0113, global_step=7254.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   2%|▏         | 27/1208 [01:14<54:06,  2.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.13e-5, train/loss_step=0.0113, global_step=7254.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   2%|▏         | 27/1208 [01:14<54:06,  2.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0884, train/loss_vlb_step=0.000292, train/loss_step=0.0884, global_step=7254.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   2%|▏         | 28/1208 [01:17<54:24,  2.77s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0884, train/loss_vlb_step=0.000292, train/loss_step=0.0884, global_step=7254.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   2%|▏         | 28/1208 [01:17<54:24,  2.77s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00969, train/loss_vlb_step=4.45e-5, train/loss_step=0.00969, global_step=7254.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   2%|▏         | 29/1208 [01:18<53:11,  2.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00969, train/loss_vlb_step=4.45e-5, train/loss_step=0.00969, global_step=7254.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   2%|▏         | 29/1208 [01:18<53:11,  2.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.00011, train/loss_step=0.0288, global_step=7255.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:   2%|▏         | 30/1208 [01:19<52:02,  2.65s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.00011, train/loss_step=0.0288, global_step=7255.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   2%|▏         | 30/1208 [01:19<52:02,  2.65s/it, loss=0.134, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000447, train/loss_step=0.133, global_step=7255.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:   3%|▎         | 31/1208 [01:20<50:58,  2.60s/it, loss=0.134, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000447, train/loss_step=0.133, global_step=7255.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   3%|▎         | 31/1208 [01:20<50:58,  2.60s/it, loss=0.162, v_num=0, train/loss_simple_step=0.563, train/loss_vlb_step=0.011, train/loss_step=0.563, global_step=7255.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:   3%|▎         | 32/1208 [01:23<51:21,  2.62s/it, loss=0.162, v_num=0, train/loss_simple_step=0.563, train/loss_vlb_step=0.011, train/loss_step=0.563, global_step=7255.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   3%|▎         | 32/1208 [01:23<51:21,  2.62s/it, loss=0.158, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.00116, train/loss_step=0.229, global_step=7255.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   3%|▎         | 33/1208 [01:24<50:22,  2.57s/it, loss=0.158, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.00116, train/loss_step=0.229, global_step=7255.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   3%|▎         | 33/1208 [01:24<50:22,  2.57s/it, loss=0.156, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.001, train/loss_step=0.249, global_step=7256.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:   3%|▎         | 34/1208 [01:25<49:26,  2.53s/it, loss=0.156, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.001, train/loss_step=0.249, global_step=7256.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   3%|▎         | 34/1208 [01:25<49:26,  2.53s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9.06e-5, train/loss_step=0.0224, global_step=7256.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   3%|▎         | 35/1208 [01:26<48:33,  2.48s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9.06e-5, train/loss_step=0.0224, global_step=7256.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   3%|▎         | 35/1208 [01:26<48:33,  2.48s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000138, train/loss_step=0.0373, global_step=7256.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   3%|▎         | 36/1208 [01:30<48:56,  2.51s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000138, train/loss_step=0.0373, global_step=7256.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   3%|▎         | 36/1208 [01:30<48:56,  2.51s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.81e-5, train/loss_step=0.0033, global_step=7256.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:   3%|▎         | 37/1208 [01:31<48:08,  2.47s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.81e-5, train/loss_step=0.0033, global_step=7256.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   3%|▎         | 37/1208 [01:31<48:08,  2.47s/it, loss=0.169, v_num=0, train/loss_simple_step=0.646, train/loss_vlb_step=0.0165, train/loss_step=0.646, global_step=7257.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:   3%|▎         | 38/1208 [01:32<47:21,  2.43s/it, loss=0.169, v_num=0, train/loss_simple_step=0.646, train/loss_vlb_step=0.0165, train/loss_step=0.646, global_step=7257.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   3%|▎         | 38/1208 [01:32<47:21,  2.43s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.58e-5, train/loss_step=0.0148, global_step=7257.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   3%|▎         | 39/1208 [01:33<46:37,  2.39s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.58e-5, train/loss_step=0.0148, global_step=7257.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   3%|▎         | 39/1208 [01:33<46:37,  2.39s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000131, train/loss_step=0.0353, global_step=7257.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   3%|▎         | 40/1208 [01:36<46:59,  2.41s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000131, train/loss_step=0.0353, global_step=7257.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   3%|▎         | 40/1208 [01:36<46:59,  2.41s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00544, train/loss_vlb_step=2.78e-5, train/loss_step=0.00544, global_step=7257.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   3%|▎         | 41/1208 [01:37<46:18,  2.38s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00544, train/loss_vlb_step=2.78e-5, train/loss_step=0.00544, global_step=7257.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   3%|▎         | 41/1208 [01:37<46:18,  2.38s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=0.000104, train/loss_step=0.0259, global_step=7258.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:   3%|▎         | 42/1208 [01:38<45:38,  2.35s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=0.000104, train/loss_step=0.0259, global_step=7258.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   3%|▎         | 42/1208 [01:38<45:38,  2.35s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.24e-5, train/loss_step=0.00203, global_step=7258.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   4%|▎         | 43/1208 [01:39<45:00,  2.32s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.24e-5, train/loss_step=0.00203, global_step=7258.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   4%|▎         | 43/1208 [01:39<45:00,  2.32s/it, loss=0.133, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.0008, train/loss_step=0.217, global_step=7258.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]     Epoch 24:   4%|▎         | 44/1208 [01:42<45:22,  2.34s/it, loss=0.133, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.0008, train/loss_step=0.217, global_step=7258.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   4%|▎         | 44/1208 [01:42<45:23,  2.34s/it, loss=0.142, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00123, train/loss_step=0.251, global_step=7258.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   4%|▎         | 45/1208 [01:43<44:47,  2.31s/it, loss=0.142, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00123, train/loss_step=0.251, global_step=7258.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   4%|▎         | 45/1208 [01:43<44:47,  2.31s/it, loss=0.136, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000467, train/loss_step=0.141, global_step=7259.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   4%|▍         | 46/1208 [01:45<44:12,  2.28s/it, loss=0.136, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000467, train/loss_step=0.141, global_step=7259.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   4%|▍         | 46/1208 [01:45<44:12,  2.28s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00749, train/loss_vlb_step=3.74e-5, train/loss_step=0.00749, global_step=7259.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   4%|▍         | 47/1208 [01:46<43:39,  2.26s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00749, train/loss_vlb_step=3.74e-5, train/loss_step=0.00749, global_step=7259.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   4%|▍         | 47/1208 [01:46<43:39,  2.26s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.92e-5, train/loss_step=0.0136, global_step=7259.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:   4%|▍         | 48/1208 [01:49<44:01,  2.28s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.92e-5, train/loss_step=0.0136, global_step=7259.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   4%|▍         | 48/1208 [01:49<44:01,  2.28s/it, loss=0.138, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000428, train/loss_step=0.128, global_step=7259.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:   4%|▍         | 49/1208 [01:50<43:30,  2.25s/it, loss=0.138, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000428, train/loss_step=0.128, global_step=7259.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   4%|▍         | 49/1208 [01:50<43:30,  2.25s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00802, train/loss_vlb_step=3.79e-5, train/loss_step=0.00802, global_step=7260.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   4%|▍         | 50/1208 [01:51<42:59,  2.23s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00802, train/loss_vlb_step=3.79e-5, train/loss_step=0.00802, global_step=7260.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   4%|▍         | 50/1208 [01:51<42:59,  2.23s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000123, train/loss_step=0.0325, global_step=7260.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:   4%|▍         | 51/1208 [01:52<42:30,  2.20s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000123, train/loss_step=0.0325, global_step=7260.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   4%|▍         | 51/1208 [01:52<42:30,  2.20s/it, loss=0.111, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000511, train/loss_step=0.154, global_step=7260.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:   4%|▍         | 52/1208 [01:55<42:51,  2.22s/it, loss=0.111, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000511, train/loss_step=0.154, global_step=7260.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   4%|▍         | 52/1208 [01:55<42:51,  2.22s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.28e-5, train/loss_step=0.0237, global_step=7260.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   4%|▍         | 53/1208 [01:56<42:23,  2.20s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.28e-5, train/loss_step=0.0237, global_step=7260.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   4%|▍         | 53/1208 [01:56<42:23,  2.20s/it, loss=0.094, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=7261.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:   4%|▍         | 54/1208 [01:57<41:56,  2.18s/it, loss=0.094, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=7261.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   4%|▍         | 54/1208 [01:57<41:56,  2.18s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.23e-5, train/loss_step=0.0146, global_step=7261.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   5%|▍         | 55/1208 [01:58<41:30,  2.16s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.23e-5, train/loss_step=0.0146, global_step=7261.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   5%|▍         | 55/1208 [01:58<41:30,  2.16s/it, loss=0.104, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000952, train/loss_step=0.245, global_step=7261.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:   5%|▍         | 56/1208 [02:02<41:50,  2.18s/it, loss=0.104, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000952, train/loss_step=0.245, global_step=7261.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   5%|▍         | 56/1208 [02:02<41:50,  2.18s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0839, train/loss_vlb_step=0.000281, train/loss_step=0.0839, global_step=7261.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   5%|▍         | 57/1208 [02:03<41:25,  2.16s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0839, train/loss_vlb_step=0.000281, train/loss_step=0.0839, global_step=7261.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   5%|▍         | 57/1208 [02:03<41:25,  2.16s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000644, train/loss_step=0.188, global_step=7262.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:   5%|▍         | 58/1208 [02:04<41:00,  2.14s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000644, train/loss_step=0.188, global_step=7262.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   5%|▍         | 58/1208 [02:04<41:00,  2.14s/it, loss=0.113, v_num=0, train/loss_simple_step=0.575, train/loss_vlb_step=0.00993, train/loss_step=0.575, global_step=7262.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:   5%|▍         | 59/1208 [02:05<40:36,  2.12s/it, loss=0.113, v_num=0, train/loss_simple_step=0.575, train/loss_vlb_step=0.00993, train/loss_step=0.575, global_step=7262.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   5%|▍         | 59/1208 [02:05<40:36,  2.12s/it, loss=0.12, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000573, train/loss_step=0.171, global_step=7262.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   5%|▍         | 60/1208 [02:08<40:56,  2.14s/it, loss=0.12, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000573, train/loss_step=0.171, global_step=7262.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   5%|▍         | 60/1208 [02:08<40:56,  2.14s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.000122, train/loss_step=0.0322, global_step=7262.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   5%|▌         | 61/1208 [02:09<40:33,  2.12s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.000122, train/loss_step=0.0322, global_step=7262.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   5%|▌         | 61/1208 [02:09<40:33,  2.12s/it, loss=0.122, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000152, train/loss_step=0.042, global_step=7263.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:   5%|▌         | 62/1208 [02:10<40:11,  2.10s/it, loss=0.122, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000152, train/loss_step=0.042, global_step=7263.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   5%|▌         | 62/1208 [02:10<40:11,  2.10s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=6.02e-5, train/loss_step=0.0129, global_step=7263.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   5%|▌         | 63/1208 [02:11<39:49,  2.09s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=6.02e-5, train/loss_step=0.0129, global_step=7263.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   5%|▌         | 63/1208 [02:11<39:49,  2.09s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00474, train/loss_vlb_step=2.53e-5, train/loss_step=0.00474, global_step=7263.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   5%|▌         | 64/1208 [02:14<40:08,  2.11s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00474, train/loss_vlb_step=2.53e-5, train/loss_step=0.00474, global_step=7263.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   5%|▌         | 64/1208 [02:14<40:08,  2.11s/it, loss=0.107, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.00054, train/loss_step=0.158, global_step=7263.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:   5%|▌         | 65/1208 [02:15<39:48,  2.09s/it, loss=0.107, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.00054, train/loss_step=0.158, global_step=7263.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   5%|▌         | 65/1208 [02:15<39:48,  2.09s/it, loss=0.107, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000442, train/loss_step=0.133, global_step=7264.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   5%|▌         | 66/1208 [02:16<39:28,  2.07s/it, loss=0.107, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000442, train/loss_step=0.133, global_step=7264.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   5%|▌         | 66/1208 [02:16<39:28,  2.07s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00903, train/loss_vlb_step=4.42e-5, train/loss_step=0.00903, global_step=7264.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   6%|▌         | 67/1208 [02:17<39:08,  2.06s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00903, train/loss_vlb_step=4.42e-5, train/loss_step=0.00903, global_step=7264.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   6%|▌         | 67/1208 [02:17<39:08,  2.06s/it, loss=0.108, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.00011, train/loss_step=0.029, global_step=7264.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:   6%|▌         | 68/1208 [02:21<39:26,  2.08s/it, loss=0.108, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.00011, train/loss_step=0.029, global_step=7264.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   6%|▌         | 68/1208 [02:21<39:26,  2.08s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00316, train/loss_vlb_step=1.81e-5, train/loss_step=0.00316, global_step=7264.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   6%|▌         | 69/1208 [02:22<39:07,  2.06s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00316, train/loss_vlb_step=1.81e-5, train/loss_step=0.00316, global_step=7264.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   6%|▌         | 69/1208 [02:22<39:07,  2.06s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000138, train/loss_step=0.0387, global_step=7265.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:   6%|▌         | 70/1208 [02:23<38:48,  2.05s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000138, train/loss_step=0.0387, global_step=7265.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   6%|▌         | 70/1208 [02:23<38:48,  2.05s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=1.9e-5, train/loss_step=0.00345, global_step=7265.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   6%|▌         | 71/1208 [02:24<38:30,  2.03s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=1.9e-5, train/loss_step=0.00345, global_step=7265.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   6%|▌         | 71/1208 [02:24<38:30,  2.03s/it, loss=0.104, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000723, train/loss_step=0.194, global_step=7265.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:   6%|▌         | 72/1208 [02:27<38:47,  2.05s/it, loss=0.104, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000723, train/loss_step=0.194, global_step=7265.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   6%|▌         | 72/1208 [02:27<38:47,  2.05s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.69e-5, train/loss_step=0.0158, global_step=7265.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   6%|▌         | 73/1208 [02:28<38:29,  2.03s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.69e-5, train/loss_step=0.0158, global_step=7265.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   6%|▌         | 73/1208 [02:28<38:29,  2.03s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0562, train/loss_vlb_step=0.000187, train/loss_step=0.0562, global_step=7266.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   6%|▌         | 74/1208 [02:29<38:11,  2.02s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0562, train/loss_vlb_step=0.000187, train/loss_step=0.0562, global_step=7266.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   6%|▌         | 74/1208 [02:29<38:12,  2.02s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00542, train/loss_vlb_step=2.83e-5, train/loss_step=0.00542, global_step=7266.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:   6%|▌         | 75/1208 [02:30<37:54,  2.01s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00542, train/loss_vlb_step=2.83e-5, train/loss_step=0.00542, global_step=7266.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   6%|▌         | 75/1208 [02:30<37:54,  2.01s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000422, train/loss_step=0.128, global_step=7266.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   6%|▋         | 76/1208 [02:33<38:11,  2.02s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000422, train/loss_step=0.128, global_step=7266.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   6%|▋         | 76/1208 [02:33<38:11,  2.02s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.0491, train/loss_vlb_step=0.000178, train/loss_step=0.0491, global_step=7266.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   6%|▋         | 77/1208 [02:34<37:54,  2.01s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.0491, train/loss_vlb_step=0.000178, train/loss_step=0.0491, global_step=7266.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   6%|▋         | 77/1208 [02:34<37:54,  2.01s/it, loss=0.0833, v_num=0, train/loss_simple_step=0.00415, train/loss_vlb_step=2.16e-5, train/loss_step=0.00415, global_step=7267.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   6%|▋         | 78/1208 [02:35<37:37,  2.00s/it, loss=0.0833, v_num=0, train/loss_simple_step=0.00415, train/loss_vlb_step=2.16e-5, train/loss_step=0.00415, global_step=7267.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   6%|▋         | 78/1208 [02:35<37:37,  2.00s/it, loss=0.0663, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.001, train/loss_step=0.236, global_step=7267.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]      Epoch 24:   7%|▋         | 79/1208 [02:36<37:21,  1.99s/it, loss=0.0663, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.001, train/loss_step=0.236, global_step=7267.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   7%|▋         | 79/1208 [02:36<37:21,  1.99s/it, loss=0.0589, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.27e-5, train/loss_step=0.0232, global_step=7267.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   7%|▋         | 80/1208 [02:39<37:31,  2.00s/it, loss=0.0589, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.27e-5, train/loss_step=0.0232, global_step=7267.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   7%|▋         | 80/1208 [02:39<37:32,  2.00s/it, loss=0.0596, v_num=0, train/loss_simple_step=0.0446, train/loss_vlb_step=0.000159, train/loss_step=0.0446, global_step=7267.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   7%|▋         | 81/1208 [02:40<37:16,  1.98s/it, loss=0.0596, v_num=0, train/loss_simple_step=0.0446, train/loss_vlb_step=0.000159, train/loss_step=0.0446, global_step=7267.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   7%|▋         | 81/1208 [02:40<37:16,  1.98s/it, loss=0.06, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000179, train/loss_step=0.051, global_step=7268.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:   7%|▋         | 82/1208 [02:41<37:00,  1.97s/it, loss=0.06, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000179, train/loss_step=0.051, global_step=7268.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   7%|▋         | 82/1208 [02:41<37:00,  1.97s/it, loss=0.0595, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.97e-5, train/loss_step=0.00351, global_step=7268.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   7%|▋         | 83/1208 [02:42<36:45,  1.96s/it, loss=0.0595, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.97e-5, train/loss_step=0.00351, global_step=7268.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   7%|▋         | 83/1208 [02:42<36:45,  1.96s/it, loss=0.0607, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000112, train/loss_step=0.0284, global_step=7268.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:   7%|▋         | 84/1208 [02:45<36:56,  1.97s/it, loss=0.0607, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000112, train/loss_step=0.0284, global_step=7268.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   7%|▋         | 84/1208 [02:45<36:56,  1.97s/it, loss=0.0535, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.12e-5, train/loss_step=0.0145, global_step=7268.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:   7%|▋         | 85/1208 [02:46<36:41,  1.96s/it, loss=0.0535, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.12e-5, train/loss_step=0.0145, global_step=7268.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   7%|▋         | 85/1208 [02:46<36:41,  1.96s/it, loss=0.0474, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=4.94e-5, train/loss_step=0.0111, global_step=7269.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   7%|▋         | 86/1208 [02:47<36:27,  1.95s/it, loss=0.0474, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=4.94e-5, train/loss_step=0.0111, global_step=7269.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   7%|▋         | 86/1208 [02:47<36:27,  1.95s/it, loss=0.0509, v_num=0, train/loss_simple_step=0.0788, train/loss_vlb_step=0.000262, train/loss_step=0.0788, global_step=7269.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   7%|▋         | 87/1208 [02:48<36:13,  1.94s/it, loss=0.0509, v_num=0, train/loss_simple_step=0.0788, train/loss_vlb_step=0.000262, train/loss_step=0.0788, global_step=7269.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   7%|▋         | 87/1208 [02:48<36:13,  1.94s/it, loss=0.0611, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000859, train/loss_step=0.232, global_step=7269.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:   7%|▋         | 88/1208 [02:51<36:23,  1.95s/it, loss=0.0611, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000859, train/loss_step=0.232, global_step=7269.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   7%|▋         | 88/1208 [02:51<36:23,  1.95s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.467, train/loss_vlb_step=0.00396, train/loss_step=0.467, global_step=7269.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:   7%|▋         | 89/1208 [02:52<36:10,  1.94s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.467, train/loss_vlb_step=0.00396, train/loss_step=0.467, global_step=7269.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   7%|▋         | 89/1208 [02:52<36:10,  1.94s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.001, train/loss_step=0.262, global_step=7270.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:   7%|▋         | 90/1208 [02:53<35:56,  1.93s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.001, train/loss_step=0.262, global_step=7270.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   7%|▋         | 90/1208 [02:53<35:56,  1.93s/it, loss=0.117, v_num=0, train/loss_simple_step=0.431, train/loss_vlb_step=0.00268, train/loss_step=0.431, global_step=7270.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   8%|▊         | 91/1208 [02:54<35:43,  1.92s/it, loss=0.117, v_num=0, train/loss_simple_step=0.431, train/loss_vlb_step=0.00268, train/loss_step=0.431, global_step=7270.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   8%|▊         | 91/1208 [02:54<35:43,  1.92s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0535, train/loss_vlb_step=0.000177, train/loss_step=0.0535, global_step=7270.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   8%|▊         | 92/1208 [02:57<35:52,  1.93s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0535, train/loss_vlb_step=0.000177, train/loss_step=0.0535, global_step=7270.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   8%|▊         | 92/1208 [02:57<35:52,  1.93s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.88e-5, train/loss_step=0.0186, global_step=7270.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:   8%|▊         | 93/1208 [02:58<35:40,  1.92s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.88e-5, train/loss_step=0.0186, global_step=7270.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   8%|▊         | 93/1208 [02:58<35:40,  1.92s/it, loss=0.122, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00166, train/loss_step=0.297, global_step=7271.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:   8%|▊         | 94/1208 [02:59<35:27,  1.91s/it, loss=0.122, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00166, train/loss_step=0.297, global_step=7271.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   8%|▊         | 94/1208 [02:59<35:27,  1.91s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.19e-5, train/loss_step=0.0176, global_step=7271.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   8%|▊         | 95/1208 [03:00<35:15,  1.90s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.19e-5, train/loss_step=0.0176, global_step=7271.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   8%|▊         | 95/1208 [03:00<35:15,  1.90s/it, loss=0.124, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000493, train/loss_step=0.147, global_step=7271.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:   8%|▊         | 96/1208 [03:03<35:24,  1.91s/it, loss=0.124, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000493, train/loss_step=0.147, global_step=7271.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   8%|▊         | 96/1208 [03:03<35:24,  1.91s/it, loss=0.129, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.00054, train/loss_step=0.160, global_step=7271.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:   8%|▊         | 97/1208 [03:04<35:12,  1.90s/it, loss=0.129, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.00054, train/loss_step=0.160, global_step=7271.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   8%|▊         | 97/1208 [03:04<35:12,  1.90s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00515, train/loss_vlb_step=2.59e-5, train/loss_step=0.00515, global_step=7272.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   8%|▊         | 98/1208 [03:05<35:00,  1.89s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00515, train/loss_vlb_step=2.59e-5, train/loss_step=0.00515, global_step=7272.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   8%|▊         | 98/1208 [03:05<35:00,  1.89s/it, loss=0.132, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00125, train/loss_step=0.287, global_step=7272.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:   8%|▊         | 99/1208 [03:06<34:48,  1.88s/it, loss=0.132, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00125, train/loss_step=0.287, global_step=7272.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   8%|▊         | 99/1208 [03:06<34:48,  1.88s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.15e-5, train/loss_step=0.00194, global_step=7272.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   8%|▊         | 100/1208 [03:09<34:57,  1.89s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.15e-5, train/loss_step=0.00194, global_step=7272.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   8%|▊         | 100/1208 [03:09<34:57,  1.89s/it, loss=0.142, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00114, train/loss_step=0.267, global_step=7272.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:   8%|▊         | 101/1208 [03:10<34:45,  1.88s/it, loss=0.142, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00114, train/loss_step=0.267, global_step=7272.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   8%|▊         | 101/1208 [03:10<34:45,  1.88s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0582, train/loss_vlb_step=0.000202, train/loss_step=0.0582, global_step=7273.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   8%|▊         | 102/1208 [03:11<34:34,  1.88s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0582, train/loss_vlb_step=0.000202, train/loss_step=0.0582, global_step=7273.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   8%|▊         | 102/1208 [03:11<34:34,  1.88s/it, loss=0.156, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00129, train/loss_step=0.291, global_step=7273.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:   9%|▊         | 103/1208 [03:12<34:23,  1.87s/it, loss=0.156, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00129, train/loss_step=0.291, global_step=7273.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   9%|▊         | 103/1208 [03:12<34:23,  1.87s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000114, train/loss_step=0.0296, global_step=7273.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   9%|▊         | 104/1208 [03:15<34:31,  1.88s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000114, train/loss_step=0.0296, global_step=7273.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   9%|▊         | 104/1208 [03:15<34:31,  1.88s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000136, train/loss_step=0.0373, global_step=7273.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   9%|▊         | 105/1208 [03:16<34:21,  1.87s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000136, train/loss_step=0.0373, global_step=7273.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   9%|▊         | 105/1208 [03:16<34:21,  1.87s/it, loss=0.164, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.00048, train/loss_step=0.142, global_step=7274.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:   9%|▉         | 106/1208 [03:17<34:10,  1.86s/it, loss=0.164, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.00048, train/loss_step=0.142, global_step=7274.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   9%|▉         | 106/1208 [03:17<34:10,  1.86s/it, loss=0.167, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000466, train/loss_step=0.140, global_step=7274.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   9%|▉         | 107/1208 [03:18<33:59,  1.85s/it, loss=0.167, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000466, train/loss_step=0.140, global_step=7274.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   9%|▉         | 107/1208 [03:18<33:59,  1.85s/it, loss=0.165, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000722, train/loss_step=0.191, global_step=7274.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   9%|▉         | 108/1208 [03:21<34:08,  1.86s/it, loss=0.165, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000722, train/loss_step=0.191, global_step=7274.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   9%|▉         | 108/1208 [03:21<34:08,  1.86s/it, loss=0.166, v_num=0, train/loss_simple_step=0.484, train/loss_vlb_step=0.00419, train/loss_step=0.484, global_step=7274.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:   9%|▉         | 109/1208 [03:22<33:57,  1.85s/it, loss=0.166, v_num=0, train/loss_simple_step=0.484, train/loss_vlb_step=0.00419, train/loss_step=0.484, global_step=7274.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   9%|▉         | 109/1208 [03:22<33:57,  1.85s/it, loss=0.156, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000183, train/loss_step=0.051, global_step=7275.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   9%|▉         | 110/1208 [03:23<33:47,  1.85s/it, loss=0.156, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000183, train/loss_step=0.051, global_step=7275.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   9%|▉         | 110/1208 [03:23<33:47,  1.85s/it, loss=0.168, v_num=0, train/loss_simple_step=0.673, train/loss_vlb_step=0.0292, train/loss_step=0.673, global_step=7275.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:   9%|▉         | 111/1208 [03:24<33:37,  1.84s/it, loss=0.168, v_num=0, train/loss_simple_step=0.673, train/loss_vlb_step=0.0292, train/loss_step=0.673, global_step=7275.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   9%|▉         | 111/1208 [03:24<33:37,  1.84s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0796, train/loss_vlb_step=0.000263, train/loss_step=0.0796, global_step=7275.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   9%|▉         | 112/1208 [03:27<33:45,  1.85s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0796, train/loss_vlb_step=0.000263, train/loss_step=0.0796, global_step=7275.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   9%|▉         | 112/1208 [03:27<33:45,  1.85s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0937, train/loss_vlb_step=0.00031, train/loss_step=0.0937, global_step=7275.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:   9%|▉         | 113/1208 [03:28<33:35,  1.84s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0937, train/loss_vlb_step=0.00031, train/loss_step=0.0937, global_step=7275.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   9%|▉         | 113/1208 [03:28<33:35,  1.84s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0638, train/loss_vlb_step=0.000219, train/loss_step=0.0638, global_step=7276.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   9%|▉         | 114/1208 [03:29<33:26,  1.83s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0638, train/loss_vlb_step=0.000219, train/loss_step=0.0638, global_step=7276.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:   9%|▉         | 114/1208 [03:29<33:26,  1.83s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0098, train/loss_vlb_step=4.58e-5, train/loss_step=0.0098, global_step=7276.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  10%|▉         | 115/1208 [03:30<33:16,  1.83s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0098, train/loss_vlb_step=4.58e-5, train/loss_step=0.0098, global_step=7276.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  10%|▉         | 115/1208 [03:30<33:16,  1.83s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00532, train/loss_vlb_step=2.8e-5, train/loss_step=0.00532, global_step=7276.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  10%|▉         | 116/1208 [03:32<33:24,  1.84s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00532, train/loss_vlb_step=2.8e-5, train/loss_step=0.00532, global_step=7276.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  10%|▉         | 116/1208 [03:32<33:24,  1.84s/it, loss=0.165, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00379, train/loss_step=0.392, global_step=7276.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  10%|▉         | 117/1208 [03:33<33:15,  1.83s/it, loss=0.165, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00379, train/loss_step=0.392, global_step=7276.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  10%|▉         | 117/1208 [03:33<33:15,  1.83s/it, loss=0.167, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.000128, train/loss_step=0.033, global_step=7277.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  10%|▉         | 118/1208 [03:34<33:05,  1.82s/it, loss=0.167, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.000128, train/loss_step=0.033, global_step=7277.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  10%|▉         | 118/1208 [03:34<33:05,  1.82s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0762, train/loss_vlb_step=0.000258, train/loss_step=0.0762, global_step=7277.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  10%|▉         | 119/1208 [03:35<32:56,  1.81s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0762, train/loss_vlb_step=0.000258, train/loss_step=0.0762, global_step=7277.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  10%|▉         | 119/1208 [03:35<32:56,  1.81s/it, loss=0.157, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000111, train/loss_step=0.029, global_step=7277.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  10%|▉         | 120/1208 [03:38<33:04,  1.82s/it, loss=0.157, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000111, train/loss_step=0.029, global_step=7277.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  10%|▉         | 120/1208 [03:38<33:04,  1.82s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0988, train/loss_vlb_step=0.000325, train/loss_step=0.0988, global_step=7277.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  10%|█         | 121/1208 [03:39<32:55,  1.82s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0988, train/loss_vlb_step=0.000325, train/loss_step=0.0988, global_step=7277.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  10%|█         | 121/1208 [03:39<32:55,  1.82s/it, loss=0.177, v_num=0, train/loss_simple_step=0.616, train/loss_vlb_step=0.0144, train/loss_step=0.616, global_step=7278.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  10%|█         | 122/1208 [03:40<32:46,  1.81s/it, loss=0.177, v_num=0, train/loss_simple_step=0.616, train/loss_vlb_step=0.0144, train/loss_step=0.616, global_step=7278.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  10%|█         | 122/1208 [03:40<32:46,  1.81s/it, loss=0.17, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.00058, train/loss_step=0.165, global_step=7278.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  10%|█         | 123/1208 [03:41<32:37,  1.80s/it, loss=0.17, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.00058, train/loss_step=0.165, global_step=7278.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  10%|█         | 123/1208 [03:41<32:37,  1.80s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0444, train/loss_vlb_step=0.000158, train/loss_step=0.0444, global_step=7278.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  10%|█         | 124/1208 [03:44<32:44,  1.81s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0444, train/loss_vlb_step=0.000158, train/loss_step=0.0444, global_step=7278.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  10%|█         | 124/1208 [03:44<32:44,  1.81s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00638, train/loss_vlb_step=3.19e-5, train/loss_step=0.00638, global_step=7278.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  10%|█         | 125/1208 [03:45<32:36,  1.81s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00638, train/loss_vlb_step=3.19e-5, train/loss_step=0.00638, global_step=7278.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  10%|█         | 125/1208 [03:45<32:36,  1.81s/it, loss=0.183, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.00297, train/loss_step=0.400, global_step=7279.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  10%|█         | 126/1208 [03:46<32:27,  1.80s/it, loss=0.183, v_num=0, train/loss_simple_step=0.400, train/loss_vlb_step=0.00297, train/loss_step=0.400, global_step=7279.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  10%|█         | 126/1208 [03:46<32:27,  1.80s/it, loss=0.181, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.00036, train/loss_step=0.109, global_step=7279.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  11%|█         | 127/1208 [03:47<32:18,  1.79s/it, loss=0.181, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.00036, train/loss_step=0.109, global_step=7279.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  11%|█         | 127/1208 [03:47<32:18,  1.79s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000109, train/loss_step=0.0283, global_step=7279.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  11%|█         | 128/1208 [03:50<32:26,  1.80s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000109, train/loss_step=0.0283, global_step=7279.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  11%|█         | 128/1208 [03:50<32:26,  1.80s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0954, train/loss_vlb_step=0.000314, train/loss_step=0.0954, global_step=7279.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  11%|█         | 129/1208 [03:51<32:17,  1.80s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0954, train/loss_vlb_step=0.000314, train/loss_step=0.0954, global_step=7279.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  11%|█         | 129/1208 [03:51<32:17,  1.80s/it, loss=0.158, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000546, train/loss_step=0.148, global_step=7280.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  11%|█         | 130/1208 [03:52<32:09,  1.79s/it, loss=0.158, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000546, train/loss_step=0.148, global_step=7280.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  11%|█         | 130/1208 [03:52<32:09,  1.79s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0871, train/loss_vlb_step=0.00029, train/loss_step=0.0871, global_step=7280.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  11%|█         | 131/1208 [03:53<32:01,  1.78s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0871, train/loss_vlb_step=0.00029, train/loss_step=0.0871, global_step=7280.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  11%|█         | 131/1208 [03:53<32:01,  1.78s/it, loss=0.133, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000501, train/loss_step=0.150, global_step=7280.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  11%|█         | 132/1208 [03:56<32:10,  1.79s/it, loss=0.133, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000501, train/loss_step=0.150, global_step=7280.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  11%|█         | 132/1208 [03:56<32:10,  1.79s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0764, train/loss_vlb_step=0.000254, train/loss_step=0.0764, global_step=7280.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  11%|█         | 133/1208 [03:57<32:02,  1.79s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0764, train/loss_vlb_step=0.000254, train/loss_step=0.0764, global_step=7280.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  11%|█         | 133/1208 [03:57<32:02,  1.79s/it, loss=0.135, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000424, train/loss_step=0.128, global_step=7281.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  11%|█         | 134/1208 [03:58<31:54,  1.78s/it, loss=0.135, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000424, train/loss_step=0.128, global_step=7281.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  11%|█         | 134/1208 [03:58<31:54,  1.78s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000149, train/loss_step=0.0412, global_step=7281.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  11%|█         | 135/1208 [03:59<31:47,  1.78s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000149, train/loss_step=0.0412, global_step=7281.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  11%|█         | 135/1208 [03:59<31:47,  1.78s/it, loss=0.15, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00124, train/loss_step=0.269, global_step=7281.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  11%|█▏        | 136/1208 [04:03<31:56,  1.79s/it, loss=0.15, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00124, train/loss_step=0.269, global_step=7281.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  11%|█▏        | 136/1208 [04:03<31:56,  1.79s/it, loss=0.138, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000525, train/loss_step=0.157, global_step=7281.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  11%|█▏        | 137/1208 [04:04<31:48,  1.78s/it, loss=0.138, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000525, train/loss_step=0.157, global_step=7281.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  11%|█▏        | 137/1208 [04:04<31:49,  1.78s/it, loss=0.18, v_num=0, train/loss_simple_step=0.882, train/loss_vlb_step=0.444, train/loss_step=0.882, global_step=7282.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  11%|█▏        | 138/1208 [04:05<31:41,  1.78s/it, loss=0.18, v_num=0, train/loss_simple_step=0.882, train/loss_vlb_step=0.444, train/loss_step=0.882, global_step=7282.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  11%|█▏        | 138/1208 [04:05<31:41,  1.78s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.46e-5, train/loss_step=0.00251, global_step=7282.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  12%|█▏        | 139/1208 [04:06<31:33,  1.77s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.46e-5, train/loss_step=0.00251, global_step=7282.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  12%|█▏        | 139/1208 [04:06<31:33,  1.77s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00824, train/loss_vlb_step=3.88e-5, train/loss_step=0.00824, global_step=7282.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  12%|█▏        | 140/1208 [04:09<31:43,  1.78s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00824, train/loss_vlb_step=3.88e-5, train/loss_step=0.00824, global_step=7282.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  12%|█▏        | 140/1208 [04:09<31:43,  1.78s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0338, train/loss_vlb_step=0.000125, train/loss_step=0.0338, global_step=7282.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  12%|█▏        | 141/1208 [04:10<31:35,  1.78s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0338, train/loss_vlb_step=0.000125, train/loss_step=0.0338, global_step=7282.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  12%|█▏        | 141/1208 [04:10<31:35,  1.78s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.41e-5, train/loss_step=0.0168, global_step=7283.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  12%|█▏        | 142/1208 [04:11<31:28,  1.77s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.41e-5, train/loss_step=0.0168, global_step=7283.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  12%|█▏        | 142/1208 [04:11<31:28,  1.77s/it, loss=0.143, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000606, train/loss_step=0.176, global_step=7283.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  12%|█▏        | 143/1208 [04:12<31:21,  1.77s/it, loss=0.143, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000606, train/loss_step=0.176, global_step=7283.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  12%|█▏        | 143/1208 [04:12<31:21,  1.77s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00593, train/loss_vlb_step=3.16e-5, train/loss_step=0.00593, global_step=7283.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  12%|█▏        | 144/1208 [04:15<31:30,  1.78s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00593, train/loss_vlb_step=3.16e-5, train/loss_step=0.00593, global_step=7283.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  12%|█▏        | 144/1208 [04:15<31:30,  1.78s/it, loss=0.143, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000176, train/loss_step=0.050, global_step=7283.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  12%|█▏        | 145/1208 [04:16<31:23,  1.77s/it, loss=0.143, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000176, train/loss_step=0.050, global_step=7283.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  12%|█▏        | 145/1208 [04:16<31:23,  1.77s/it, loss=0.139, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00165, train/loss_step=0.310, global_step=7284.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  12%|█▏        | 146/1208 [04:17<31:16,  1.77s/it, loss=0.139, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00165, train/loss_step=0.310, global_step=7284.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  12%|█▏        | 146/1208 [04:17<31:16,  1.77s/it, loss=0.143, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000692, train/loss_step=0.194, global_step=7284.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  12%|█▏        | 147/1208 [04:18<31:09,  1.76s/it, loss=0.143, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000692, train/loss_step=0.194, global_step=7284.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  12%|█▏        | 147/1208 [04:18<31:09,  1.76s/it, loss=0.151, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000654, train/loss_step=0.188, global_step=7284.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  12%|█▏        | 148/1208 [04:22<31:17,  1.77s/it, loss=0.151, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000654, train/loss_step=0.188, global_step=7284.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  12%|█▏        | 148/1208 [04:22<31:17,  1.77s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0707, train/loss_vlb_step=0.000233, train/loss_step=0.0707, global_step=7284.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  12%|█▏        | 149/1208 [04:23<31:10,  1.77s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0707, train/loss_vlb_step=0.000233, train/loss_step=0.0707, global_step=7284.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  12%|█▏        | 149/1208 [04:23<31:10,  1.77s/it, loss=0.151, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000604, train/loss_step=0.171, global_step=7285.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  12%|█▏        | 150/1208 [04:24<31:03,  1.76s/it, loss=0.151, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000604, train/loss_step=0.171, global_step=7285.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  12%|█▏        | 150/1208 [04:24<31:03,  1.76s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0384, train/loss_vlb_step=0.000141, train/loss_step=0.0384, global_step=7285.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  12%|█▎        | 151/1208 [04:25<30:56,  1.76s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0384, train/loss_vlb_step=0.000141, train/loss_step=0.0384, global_step=7285.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  12%|█▎        | 151/1208 [04:25<30:56,  1.76s/it, loss=0.156, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00135, train/loss_step=0.297, global_step=7285.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  13%|█▎        | 152/1208 [04:28<31:05,  1.77s/it, loss=0.156, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00135, train/loss_step=0.297, global_step=7285.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  13%|█▎        | 152/1208 [04:28<31:05,  1.77s/it, loss=0.157, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=7285.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  13%|█▎        | 153/1208 [04:29<30:58,  1.76s/it, loss=0.157, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=7285.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  13%|█▎        | 153/1208 [04:29<30:58,  1.76s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000108, train/loss_step=0.0283, global_step=7286.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  13%|█▎        | 154/1208 [04:30<30:51,  1.76s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000108, train/loss_step=0.0283, global_step=7286.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  13%|█▎        | 154/1208 [04:30<30:51,  1.76s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0746, train/loss_vlb_step=0.000248, train/loss_step=0.0746, global_step=7286.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  13%|█▎        | 155/1208 [04:31<30:45,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0746, train/loss_vlb_step=0.000248, train/loss_step=0.0746, global_step=7286.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  13%|█▎        | 155/1208 [04:31<30:45,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0465, train/loss_vlb_step=0.00017, train/loss_step=0.0465, global_step=7286.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  13%|█▎        | 156/1208 [04:34<30:53,  1.76s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0465, train/loss_vlb_step=0.00017, train/loss_step=0.0465, global_step=7286.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  13%|█▎        | 156/1208 [04:34<30:53,  1.76s/it, loss=0.143, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000543, train/loss_step=0.159, global_step=7286.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  13%|█▎        | 157/1208 [04:35<30:47,  1.76s/it, loss=0.143, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000543, train/loss_step=0.159, global_step=7286.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  13%|█▎        | 157/1208 [04:35<30:47,  1.76s/it, loss=0.115, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00149, train/loss_step=0.323, global_step=7287.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  13%|█▎        | 158/1208 [04:36<30:40,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00149, train/loss_step=0.323, global_step=7287.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  13%|█▎        | 158/1208 [04:36<30:40,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.18e-5, train/loss_step=0.0208, global_step=7287.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  13%|█▎        | 159/1208 [04:37<30:33,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.18e-5, train/loss_step=0.0208, global_step=7287.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  13%|█▎        | 159/1208 [04:37<30:33,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000571, train/loss_step=0.164, global_step=7287.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  13%|█▎        | 160/1208 [04:41<30:42,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000571, train/loss_step=0.164, global_step=7287.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  13%|█▎        | 160/1208 [04:41<30:42,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00104, train/loss_step=0.266, global_step=7287.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  13%|█▎        | 161/1208 [04:42<30:35,  1.75s/it, loss=0.135, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00104, train/loss_step=0.266, global_step=7287.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  13%|█▎        | 161/1208 [04:42<30:35,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000581, train/loss_step=0.165, global_step=7288.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  13%|█▎        | 162/1208 [04:43<30:29,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000581, train/loss_step=0.165, global_step=7288.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  13%|█▎        | 162/1208 [04:43<30:29,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000654, train/loss_step=0.178, global_step=7288.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  13%|█▎        | 163/1208 [04:44<30:23,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000654, train/loss_step=0.178, global_step=7288.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  13%|█▎        | 163/1208 [04:44<30:23,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.0043, train/loss_step=0.401, global_step=7288.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  14%|█▎        | 164/1208 [04:47<30:30,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.0043, train/loss_step=0.401, global_step=7288.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  14%|█▎        | 164/1208 [04:47<30:30,  1.75s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00332, train/loss_vlb_step=1.85e-5, train/loss_step=0.00332, global_step=7288.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  14%|█▎        | 165/1208 [04:48<30:24,  1.75s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00332, train/loss_vlb_step=1.85e-5, train/loss_step=0.00332, global_step=7288.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  14%|█▎        | 165/1208 [04:48<30:24,  1.75s/it, loss=0.176, v_num=0, train/loss_simple_step=0.631, train/loss_vlb_step=0.00957, train/loss_step=0.631, global_step=7289.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  14%|█▎        | 166/1208 [04:49<30:18,  1.75s/it, loss=0.176, v_num=0, train/loss_simple_step=0.631, train/loss_vlb_step=0.00957, train/loss_step=0.631, global_step=7289.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  14%|█▎        | 166/1208 [04:49<30:18,  1.75s/it, loss=0.172, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.00038, train/loss_step=0.114, global_step=7289.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  14%|█▍        | 167/1208 [04:50<30:12,  1.74s/it, loss=0.172, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.00038, train/loss_step=0.114, global_step=7289.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  14%|█▍        | 167/1208 [04:50<30:12,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.47e-5, train/loss_step=0.0125, global_step=7289.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  14%|█▍        | 168/1208 [04:53<30:19,  1.75s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.47e-5, train/loss_step=0.0125, global_step=7289.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  14%|█▍        | 168/1208 [04:53<30:19,  1.75s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0584, train/loss_vlb_step=0.000196, train/loss_step=0.0584, global_step=7289.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  14%|█▍        | 169/1208 [04:55<30:13,  1.75s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0584, train/loss_vlb_step=0.000196, train/loss_step=0.0584, global_step=7289.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  14%|█▍        | 169/1208 [04:55<30:13,  1.75s/it, loss=0.164, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000717, train/loss_step=0.198, global_step=7290.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  14%|█▍        | 170/1208 [04:56<30:07,  1.74s/it, loss=0.164, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000717, train/loss_step=0.198, global_step=7290.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  14%|█▍        | 170/1208 [04:56<30:07,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.31e-5, train/loss_step=0.017, global_step=7290.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  14%|█▍        | 171/1208 [04:57<30:01,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.31e-5, train/loss_step=0.017, global_step=7290.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  14%|█▍        | 171/1208 [04:57<30:01,  1.74s/it, loss=0.175, v_num=0, train/loss_simple_step=0.538, train/loss_vlb_step=0.00744, train/loss_step=0.538, global_step=7290.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  14%|█▍        | 172/1208 [05:00<30:09,  1.75s/it, loss=0.175, v_num=0, train/loss_simple_step=0.538, train/loss_vlb_step=0.00744, train/loss_step=0.538, global_step=7290.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  14%|█▍        | 172/1208 [05:00<30:09,  1.75s/it, loss=0.179, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.00061, train/loss_step=0.178, global_step=7290.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  14%|█▍        | 173/1208 [05:01<30:03,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.00061, train/loss_step=0.178, global_step=7290.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  14%|█▍        | 173/1208 [05:01<30:03,  1.74s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00806, train/loss_vlb_step=3.97e-5, train/loss_step=0.00806, global_step=7291.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  14%|█▍        | 174/1208 [05:02<29:57,  1.74s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00806, train/loss_vlb_step=3.97e-5, train/loss_step=0.00806, global_step=7291.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  14%|█▍        | 174/1208 [05:02<29:57,  1.74s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.93e-5, train/loss_step=0.0134, global_step=7291.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  14%|█▍        | 175/1208 [05:03<29:51,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.93e-5, train/loss_step=0.0134, global_step=7291.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  14%|█▍        | 175/1208 [05:03<29:51,  1.73s/it, loss=0.192, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.00422, train/loss_step=0.382, global_step=7291.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  15%|█▍        | 176/1208 [05:06<29:58,  1.74s/it, loss=0.192, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.00422, train/loss_step=0.382, global_step=7291.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  15%|█▍        | 176/1208 [05:06<29:58,  1.74s/it, loss=0.192, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000586, train/loss_step=0.163, global_step=7291.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  15%|█▍        | 177/1208 [05:07<29:52,  1.74s/it, loss=0.192, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000586, train/loss_step=0.163, global_step=7291.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  15%|█▍        | 177/1208 [05:07<29:52,  1.74s/it, loss=0.191, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00139, train/loss_step=0.299, global_step=7292.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  15%|█▍        | 178/1208 [05:08<29:46,  1.73s/it, loss=0.191, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00139, train/loss_step=0.299, global_step=7292.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  15%|█▍        | 178/1208 [05:08<29:46,  1.73s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000148, train/loss_step=0.0392, global_step=7292.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  15%|█▍        | 179/1208 [05:09<29:40,  1.73s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000148, train/loss_step=0.0392, global_step=7292.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  15%|█▍        | 179/1208 [05:09<29:40,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.2e-5, train/loss_step=0.0021, global_step=7292.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  15%|█▍        | 180/1208 [05:13<29:47,  1.74s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.2e-5, train/loss_step=0.0021, global_step=7292.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  15%|█▍        | 180/1208 [05:13<29:47,  1.74s/it, loss=0.185, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00158, train/loss_step=0.297, global_step=7292.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  15%|█▍        | 181/1208 [05:14<29:42,  1.74s/it, loss=0.185, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00158, train/loss_step=0.297, global_step=7292.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  15%|█▍        | 181/1208 [05:14<29:42,  1.74s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.58e-5, train/loss_step=0.0213, global_step=7293.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  15%|█▌        | 182/1208 [05:15<29:36,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.58e-5, train/loss_step=0.0213, global_step=7293.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  15%|█▌        | 182/1208 [05:15<29:36,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.38e-5, train/loss_step=0.0184, global_step=7293.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  15%|█▌        | 183/1208 [05:16<29:30,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.38e-5, train/loss_step=0.0184, global_step=7293.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  15%|█▌        | 183/1208 [05:16<29:30,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00144, train/loss_step=0.283, global_step=7293.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  15%|█▌        | 184/1208 [05:19<29:37,  1.74s/it, loss=0.164, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00144, train/loss_step=0.283, global_step=7293.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  15%|█▌        | 184/1208 [05:19<29:37,  1.74s/it, loss=0.168, v_num=0, train/loss_simple_step=0.092, train/loss_vlb_step=0.000302, train/loss_step=0.092, global_step=7293.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  15%|█▌        | 185/1208 [05:20<29:31,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.092, train/loss_vlb_step=0.000302, train/loss_step=0.092, global_step=7293.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  15%|█▌        | 185/1208 [05:20<29:31,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0895, train/loss_vlb_step=0.000294, train/loss_step=0.0895, global_step=7294.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  15%|█▌        | 186/1208 [05:21<29:26,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0895, train/loss_vlb_step=0.000294, train/loss_step=0.0895, global_step=7294.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  15%|█▌        | 186/1208 [05:21<29:26,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00212, train/loss_step=0.375, global_step=7294.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  15%|█▌        | 187/1208 [05:22<29:20,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00212, train/loss_step=0.375, global_step=7294.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  15%|█▌        | 187/1208 [05:22<29:20,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.8e-5, train/loss_step=0.0187, global_step=7294.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  16%|█▌        | 188/1208 [05:25<29:27,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.8e-5, train/loss_step=0.0187, global_step=7294.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  16%|█▌        | 188/1208 [05:25<29:27,  1.73s/it, loss=0.197, v_num=0, train/loss_simple_step=0.917, train/loss_vlb_step=0.461, train/loss_step=0.917, global_step=7294.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  16%|█▌        | 189/1208 [05:26<29:22,  1.73s/it, loss=0.197, v_num=0, train/loss_simple_step=0.917, train/loss_vlb_step=0.461, train/loss_step=0.917, global_step=7294.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  16%|█▌        | 189/1208 [05:26<29:22,  1.73s/it, loss=0.188, v_num=0, train/loss_simple_step=0.00626, train/loss_vlb_step=3.28e-5, train/loss_step=0.00626, global_step=7295.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  16%|█▌        | 190/1208 [05:27<29:16,  1.73s/it, loss=0.188, v_num=0, train/loss_simple_step=0.00626, train/loss_vlb_step=3.28e-5, train/loss_step=0.00626, global_step=7295.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  16%|█▌        | 190/1208 [05:27<29:16,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000674, train/loss_step=0.186, global_step=7295.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  16%|█▌        | 191/1208 [05:28<29:10,  1.72s/it, loss=0.196, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000674, train/loss_step=0.186, global_step=7295.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  16%|█▌        | 191/1208 [05:28<29:10,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=1.06e-5, train/loss_step=0.00184, global_step=7295.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  16%|█▌        | 192/1208 [05:31<29:15,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=1.06e-5, train/loss_step=0.00184, global_step=7295.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  16%|█▌        | 192/1208 [05:31<29:15,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0529, train/loss_vlb_step=0.000182, train/loss_step=0.0529, global_step=7295.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  16%|█▌        | 193/1208 [05:32<29:10,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0529, train/loss_vlb_step=0.000182, train/loss_step=0.0529, global_step=7295.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  16%|█▌        | 193/1208 [05:32<29:10,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000111, train/loss_step=0.0279, global_step=7296.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  16%|█▌        | 194/1208 [05:33<29:04,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000111, train/loss_step=0.0279, global_step=7296.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  16%|█▌        | 194/1208 [05:33<29:04,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0453, train/loss_vlb_step=0.000164, train/loss_step=0.0453, global_step=7296.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  16%|█▌        | 195/1208 [05:34<28:59,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0453, train/loss_vlb_step=0.000164, train/loss_step=0.0453, global_step=7296.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  16%|█▌        | 195/1208 [05:34<28:59,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00788, train/loss_vlb_step=3.84e-5, train/loss_step=0.00788, global_step=7296.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  16%|█▌        | 196/1208 [05:37<29:03,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00788, train/loss_vlb_step=3.84e-5, train/loss_step=0.00788, global_step=7296.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  16%|█▌        | 196/1208 [05:37<29:03,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000895, train/loss_step=0.229, global_step=7296.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  16%|█▋        | 197/1208 [05:38<28:58,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000895, train/loss_step=0.229, global_step=7296.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  16%|█▋        | 197/1208 [05:38<28:58,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000578, train/loss_step=0.163, global_step=7297.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  16%|█▋        | 198/1208 [05:39<28:52,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000578, train/loss_step=0.163, global_step=7297.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  16%|█▋        | 198/1208 [05:39<28:52,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.66e-5, train/loss_step=0.0105, global_step=7297.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  16%|█▋        | 199/1208 [05:40<28:47,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.66e-5, train/loss_step=0.0105, global_step=7297.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  16%|█▋        | 199/1208 [05:40<28:47,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.055, train/loss_vlb_step=0.000186, train/loss_step=0.055, global_step=7297.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  17%|█▋        | 200/1208 [05:43<28:51,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.055, train/loss_vlb_step=0.000186, train/loss_step=0.055, global_step=7297.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  17%|█▋        | 200/1208 [05:43<28:51,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000625, train/loss_step=0.181, global_step=7297.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  17%|█▋        | 201/1208 [05:44<28:46,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000625, train/loss_step=0.181, global_step=7297.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  17%|█▋        | 201/1208 [05:44<28:46,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0974, train/loss_vlb_step=0.000321, train/loss_step=0.0974, global_step=7298.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  17%|█▋        | 202/1208 [05:45<28:41,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0974, train/loss_vlb_step=0.000321, train/loss_step=0.0974, global_step=7298.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  17%|█▋        | 202/1208 [05:45<28:41,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.86e-5, train/loss_step=0.0186, global_step=7298.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  17%|█▋        | 203/1208 [05:46<28:35,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.86e-5, train/loss_step=0.0186, global_step=7298.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  17%|█▋        | 203/1208 [05:46<28:36,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.000148, train/loss_step=0.0362, global_step=7298.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  17%|█▋        | 204/1208 [05:49<28:40,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.000148, train/loss_step=0.0362, global_step=7298.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  17%|█▋        | 204/1208 [05:49<28:40,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.08e-5, train/loss_step=0.0109, global_step=7298.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  17%|█▋        | 205/1208 [05:50<28:34,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.08e-5, train/loss_step=0.0109, global_step=7298.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  17%|█▋        | 205/1208 [05:50<28:34,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00725, train/loss_vlb_step=3.63e-5, train/loss_step=0.00725, global_step=7299.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  17%|█▋        | 206/1208 [05:51<28:29,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00725, train/loss_vlb_step=3.63e-5, train/loss_step=0.00725, global_step=7299.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  17%|█▋        | 206/1208 [05:51<28:29,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00179, train/loss_step=0.325, global_step=7299.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]     Epoch 24:  17%|█▋        | 207/1208 [05:52<28:24,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00179, train/loss_step=0.325, global_step=7299.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  17%|█▋        | 207/1208 [05:52<28:24,  1.70s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00914, train/loss_vlb_step=4.21e-5, train/loss_step=0.00914, global_step=7299.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  17%|█▋        | 208/1208 [05:55<28:28,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00914, train/loss_vlb_step=4.21e-5, train/loss_step=0.00914, global_step=7299.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  17%|█▋        | 208/1208 [05:55<28:28,  1.71s/it, loss=0.0745, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.58e-5, train/loss_step=0.0179, global_step=7299.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  17%|█▋        | 209/1208 [05:56<28:23,  1.71s/it, loss=0.0745, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.58e-5, train/loss_step=0.0179, global_step=7299.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  17%|█▋        | 209/1208 [05:56<28:23,  1.71s/it, loss=0.0744, v_num=0, train/loss_simple_step=0.00383, train/loss_vlb_step=2.08e-5, train/loss_step=0.00383, global_step=7300.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  17%|█▋        | 210/1208 [05:57<28:18,  1.70s/it, loss=0.0744, v_num=0, train/loss_simple_step=0.00383, train/loss_vlb_step=2.08e-5, train/loss_step=0.00383, global_step=7300.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  17%|█▋        | 210/1208 [05:57<28:18,  1.70s/it, loss=0.0732, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000553, train/loss_step=0.163, global_step=7300.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  17%|█▋        | 211/1208 [05:58<28:13,  1.70s/it, loss=0.0732, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000553, train/loss_step=0.163, global_step=7300.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  17%|█▋        | 211/1208 [05:58<28:13,  1.70s/it, loss=0.074, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.31e-5, train/loss_step=0.0176, global_step=7300.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  18%|█▊        | 212/1208 [06:01<28:17,  1.70s/it, loss=0.074, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.31e-5, train/loss_step=0.0176, global_step=7300.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  18%|█▊        | 212/1208 [06:01<28:17,  1.70s/it, loss=0.0818, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000776, train/loss_step=0.210, global_step=7300.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  18%|█▊        | 213/1208 [06:02<28:12,  1.70s/it, loss=0.0818, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000776, train/loss_step=0.210, global_step=7300.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  18%|█▊        | 213/1208 [06:02<28:12,  1.70s/it, loss=0.0828, v_num=0, train/loss_simple_step=0.0481, train/loss_vlb_step=0.000172, train/loss_step=0.0481, global_step=7301.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  18%|█▊        | 214/1208 [06:03<28:07,  1.70s/it, loss=0.0828, v_num=0, train/loss_simple_step=0.0481, train/loss_vlb_step=0.000172, train/loss_step=0.0481, global_step=7301.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  18%|█▊        | 214/1208 [06:03<28:07,  1.70s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000127, train/loss_step=0.0336, global_step=7301.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  18%|█▊        | 215/1208 [06:04<28:02,  1.69s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000127, train/loss_step=0.0336, global_step=7301.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  18%|█▊        | 215/1208 [06:04<28:02,  1.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.707, train/loss_vlb_step=0.0333, train/loss_step=0.707, global_step=7301.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]     Epoch 24:  18%|█▊        | 216/1208 [06:07<28:06,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.707, train/loss_vlb_step=0.0333, train/loss_step=0.707, global_step=7301.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  18%|█▊        | 216/1208 [06:07<28:06,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000891, train/loss_step=0.232, global_step=7301.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  18%|█▊        | 217/1208 [06:08<28:01,  1.70s/it, loss=0.117, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000891, train/loss_step=0.232, global_step=7301.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  18%|█▊        | 217/1208 [06:08<28:01,  1.70s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.000161, train/loss_step=0.0441, global_step=7302.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  18%|█▊        | 218/1208 [06:09<27:57,  1.69s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.000161, train/loss_step=0.0441, global_step=7302.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  18%|█▊        | 218/1208 [06:09<27:57,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.00105, train/loss_step=0.234, global_step=7302.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  18%|█▊        | 219/1208 [06:10<27:52,  1.69s/it, loss=0.123, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.00105, train/loss_step=0.234, global_step=7302.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  18%|█▊        | 219/1208 [06:10<27:52,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000458, train/loss_step=0.133, global_step=7302.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  18%|█▊        | 220/1208 [06:13<27:55,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000458, train/loss_step=0.133, global_step=7302.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  18%|█▊        | 220/1208 [06:13<27:55,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0752, train/loss_vlb_step=0.00025, train/loss_step=0.0752, global_step=7302.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  18%|█▊        | 221/1208 [06:14<27:51,  1.69s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0752, train/loss_vlb_step=0.00025, train/loss_step=0.0752, global_step=7302.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  18%|█▊        | 221/1208 [06:14<27:51,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000834, train/loss_step=0.210, global_step=7303.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  18%|█▊        | 222/1208 [06:15<27:46,  1.69s/it, loss=0.127, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000834, train/loss_step=0.210, global_step=7303.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  18%|█▊        | 222/1208 [06:15<27:46,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.658, train/loss_vlb_step=0.023, train/loss_step=0.658, global_step=7303.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  18%|█▊        | 223/1208 [06:16<27:41,  1.69s/it, loss=0.159, v_num=0, train/loss_simple_step=0.658, train/loss_vlb_step=0.023, train/loss_step=0.658, global_step=7303.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  18%|█▊        | 223/1208 [06:16<27:41,  1.69s/it, loss=0.19, v_num=0, train/loss_simple_step=0.653, train/loss_vlb_step=0.0159, train/loss_step=0.653, global_step=7303.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  19%|█▊        | 224/1208 [06:19<27:45,  1.69s/it, loss=0.19, v_num=0, train/loss_simple_step=0.653, train/loss_vlb_step=0.0159, train/loss_step=0.653, global_step=7303.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  19%|█▊        | 224/1208 [06:19<27:45,  1.69s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00548, train/loss_vlb_step=2.87e-5, train/loss_step=0.00548, global_step=7303.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  19%|█▊        | 225/1208 [06:20<27:40,  1.69s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00548, train/loss_vlb_step=2.87e-5, train/loss_step=0.00548, global_step=7303.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  19%|█▊        | 225/1208 [06:20<27:40,  1.69s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0585, train/loss_vlb_step=0.0002, train/loss_step=0.0585, global_step=7304.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  19%|█▊        | 226/1208 [06:21<27:36,  1.69s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0585, train/loss_vlb_step=0.0002, train/loss_step=0.0585, global_step=7304.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  19%|█▊        | 226/1208 [06:21<27:36,  1.69s/it, loss=0.181, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=7304.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  19%|█▉        | 227/1208 [06:22<27:31,  1.68s/it, loss=0.181, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=7304.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  19%|█▉        | 227/1208 [06:22<27:31,  1.68s/it, loss=0.21, v_num=0, train/loss_simple_step=0.579, train/loss_vlb_step=0.00784, train/loss_step=0.579, global_step=7304.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  19%|█▉        | 228/1208 [06:24<27:34,  1.69s/it, loss=0.21, v_num=0, train/loss_simple_step=0.579, train/loss_vlb_step=0.00784, train/loss_step=0.579, global_step=7304.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  19%|█▉        | 228/1208 [06:25<27:34,  1.69s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0294, train/loss_vlb_step=0.000116, train/loss_step=0.0294, global_step=7304.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  19%|█▉        | 229/1208 [06:26<27:30,  1.69s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0294, train/loss_vlb_step=0.000116, train/loss_step=0.0294, global_step=7304.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  19%|█▉        | 229/1208 [06:26<27:30,  1.69s/it, loss=0.214, v_num=0, train/loss_simple_step=0.089, train/loss_vlb_step=0.000293, train/loss_step=0.089, global_step=7305.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  19%|█▉        | 230/1208 [06:27<27:25,  1.68s/it, loss=0.214, v_num=0, train/loss_simple_step=0.089, train/loss_vlb_step=0.000293, train/loss_step=0.089, global_step=7305.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  19%|█▉        | 230/1208 [06:27<27:25,  1.68s/it, loss=0.222, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00176, train/loss_step=0.313, global_step=7305.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  19%|█▉        | 231/1208 [06:28<27:21,  1.68s/it, loss=0.222, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00176, train/loss_step=0.313, global_step=7305.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  19%|█▉        | 231/1208 [06:28<27:21,  1.68s/it, loss=0.241, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00281, train/loss_step=0.404, global_step=7305.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  19%|█▉        | 232/1208 [06:30<27:24,  1.68s/it, loss=0.241, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00281, train/loss_step=0.404, global_step=7305.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  19%|█▉        | 232/1208 [06:30<27:24,  1.68s/it, loss=0.241, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.0007, train/loss_step=0.200, global_step=7305.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  19%|█▉        | 233/1208 [06:31<27:20,  1.68s/it, loss=0.241, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.0007, train/loss_step=0.200, global_step=7305.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  19%|█▉        | 233/1208 [06:31<27:20,  1.68s/it, loss=0.254, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00141, train/loss_step=0.306, global_step=7306.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  19%|█▉        | 234/1208 [06:32<27:15,  1.68s/it, loss=0.254, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00141, train/loss_step=0.306, global_step=7306.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  19%|█▉        | 234/1208 [06:32<27:15,  1.68s/it, loss=0.256, v_num=0, train/loss_simple_step=0.0819, train/loss_vlb_step=0.000274, train/loss_step=0.0819, global_step=7306.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  19%|█▉        | 235/1208 [06:33<27:11,  1.68s/it, loss=0.256, v_num=0, train/loss_simple_step=0.0819, train/loss_vlb_step=0.000274, train/loss_step=0.0819, global_step=7306.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  19%|█▉        | 235/1208 [06:33<27:11,  1.68s/it, loss=0.229, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000545, train/loss_step=0.159, global_step=7306.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  20%|█▉        | 236/1208 [06:36<27:14,  1.68s/it, loss=0.229, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000545, train/loss_step=0.159, global_step=7306.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  20%|█▉        | 236/1208 [06:36<27:14,  1.68s/it, loss=0.23, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00134, train/loss_step=0.268, global_step=7306.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  20%|█▉        | 237/1208 [06:37<27:10,  1.68s/it, loss=0.23, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00134, train/loss_step=0.268, global_step=7306.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  20%|█▉        | 237/1208 [06:37<27:10,  1.68s/it, loss=0.231, v_num=0, train/loss_simple_step=0.0639, train/loss_vlb_step=0.000219, train/loss_step=0.0639, global_step=7307.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  20%|█▉        | 238/1208 [06:38<27:05,  1.68s/it, loss=0.231, v_num=0, train/loss_simple_step=0.0639, train/loss_vlb_step=0.000219, train/loss_step=0.0639, global_step=7307.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  20%|█▉        | 238/1208 [06:38<27:05,  1.68s/it, loss=0.22, v_num=0, train/loss_simple_step=0.00669, train/loss_vlb_step=3.38e-5, train/loss_step=0.00669, global_step=7307.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  20%|█▉        | 239/1208 [06:39<27:01,  1.67s/it, loss=0.22, v_num=0, train/loss_simple_step=0.00669, train/loss_vlb_step=3.38e-5, train/loss_step=0.00669, global_step=7307.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  20%|█▉        | 239/1208 [06:39<27:01,  1.67s/it, loss=0.226, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00112, train/loss_step=0.249, global_step=7307.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  20%|█▉        | 240/1208 [06:42<27:04,  1.68s/it, loss=0.226, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00112, train/loss_step=0.249, global_step=7307.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  20%|█▉        | 240/1208 [06:42<27:04,  1.68s/it, loss=0.223, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=9.97e-5, train/loss_step=0.025, global_step=7307.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  20%|█▉        | 241/1208 [06:43<27:00,  1.68s/it, loss=0.223, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=9.97e-5, train/loss_step=0.025, global_step=7307.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  20%|█▉        | 241/1208 [06:43<27:00,  1.68s/it, loss=0.218, v_num=0, train/loss_simple_step=0.0974, train/loss_vlb_step=0.00032, train/loss_step=0.0974, global_step=7308.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  20%|██        | 242/1208 [06:44<26:55,  1.67s/it, loss=0.218, v_num=0, train/loss_simple_step=0.0974, train/loss_vlb_step=0.00032, train/loss_step=0.0974, global_step=7308.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  20%|██        | 242/1208 [06:44<26:55,  1.67s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0899, train/loss_vlb_step=0.000295, train/loss_step=0.0899, global_step=7308.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  20%|██        | 243/1208 [06:45<26:51,  1.67s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0899, train/loss_vlb_step=0.000295, train/loss_step=0.0899, global_step=7308.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  20%|██        | 243/1208 [06:45<26:51,  1.67s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000151, train/loss_step=0.0405, global_step=7308.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  20%|██        | 244/1208 [06:48<26:54,  1.68s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000151, train/loss_step=0.0405, global_step=7308.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  20%|██        | 244/1208 [06:48<26:54,  1.68s/it, loss=0.182, v_num=0, train/loss_simple_step=0.475, train/loss_vlb_step=0.00455, train/loss_step=0.475, global_step=7308.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  20%|██        | 245/1208 [06:49<26:50,  1.67s/it, loss=0.182, v_num=0, train/loss_simple_step=0.475, train/loss_vlb_step=0.00455, train/loss_step=0.475, global_step=7308.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  20%|██        | 245/1208 [06:49<26:50,  1.67s/it, loss=0.182, v_num=0, train/loss_simple_step=0.056, train/loss_vlb_step=0.000194, train/loss_step=0.056, global_step=7309.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  20%|██        | 246/1208 [06:50<26:46,  1.67s/it, loss=0.182, v_num=0, train/loss_simple_step=0.056, train/loss_vlb_step=0.000194, train/loss_step=0.056, global_step=7309.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  20%|██        | 246/1208 [06:50<26:46,  1.67s/it, loss=0.182, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=7309.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  20%|██        | 247/1208 [06:51<26:41,  1.67s/it, loss=0.182, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=7309.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  20%|██        | 247/1208 [06:51<26:41,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.83e-5, train/loss_step=0.0164, global_step=7309.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  21%|██        | 248/1208 [06:54<26:45,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.83e-5, train/loss_step=0.0164, global_step=7309.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  21%|██        | 248/1208 [06:54<26:45,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00399, train/loss_vlb_step=2.07e-5, train/loss_step=0.00399, global_step=7309.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  21%|██        | 249/1208 [06:55<26:40,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00399, train/loss_vlb_step=2.07e-5, train/loss_step=0.00399, global_step=7309.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  21%|██        | 249/1208 [06:55<26:40,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0967, train/loss_vlb_step=0.000318, train/loss_step=0.0967, global_step=7310.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  21%|██        | 250/1208 [06:56<26:36,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0967, train/loss_vlb_step=0.000318, train/loss_step=0.0967, global_step=7310.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  21%|██        | 250/1208 [06:56<26:36,  1.67s/it, loss=0.16, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.00651, train/loss_step=0.450, global_step=7310.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  21%|██        | 251/1208 [06:57<26:32,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.00651, train/loss_step=0.450, global_step=7310.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  21%|██        | 251/1208 [06:57<26:32,  1.66s/it, loss=0.152, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00091, train/loss_step=0.250, global_step=7310.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  21%|██        | 252/1208 [07:00<26:35,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00091, train/loss_step=0.250, global_step=7310.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  21%|██        | 252/1208 [07:00<26:35,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=9.95e-5, train/loss_step=0.0249, global_step=7310.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  21%|██        | 253/1208 [07:01<26:31,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=9.95e-5, train/loss_step=0.0249, global_step=7310.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  21%|██        | 253/1208 [07:01<26:31,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000397, train/loss_step=0.120, global_step=7311.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  21%|██        | 254/1208 [07:02<26:27,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000397, train/loss_step=0.120, global_step=7311.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  21%|██        | 254/1208 [07:02<26:27,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.16e-5, train/loss_step=0.017, global_step=7311.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  21%|██        | 255/1208 [07:03<26:23,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.16e-5, train/loss_step=0.017, global_step=7311.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  21%|██        | 255/1208 [07:03<26:23,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00153, train/loss_step=0.318, global_step=7311.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  21%|██        | 256/1208 [07:06<26:26,  1.67s/it, loss=0.139, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00153, train/loss_step=0.318, global_step=7311.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  21%|██        | 256/1208 [07:06<26:26,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000582, train/loss_step=0.170, global_step=7311.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  21%|██▏       | 257/1208 [07:07<26:21,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000582, train/loss_step=0.170, global_step=7311.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  21%|██▏       | 257/1208 [07:07<26:21,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000756, train/loss_step=0.199, global_step=7312.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  21%|██▏       | 258/1208 [07:08<26:17,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000756, train/loss_step=0.199, global_step=7312.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  21%|██▏       | 258/1208 [07:08<26:17,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.59e-5, train/loss_step=0.00285, global_step=7312.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  21%|██▏       | 259/1208 [07:09<26:13,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.59e-5, train/loss_step=0.00285, global_step=7312.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  21%|██▏       | 259/1208 [07:09<26:13,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000461, train/loss_step=0.137, global_step=7312.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  22%|██▏       | 260/1208 [07:12<26:16,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000461, train/loss_step=0.137, global_step=7312.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  22%|██▏       | 260/1208 [07:12<26:16,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00177, train/loss_step=0.307, global_step=7312.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  22%|██▏       | 261/1208 [07:13<26:12,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00177, train/loss_step=0.307, global_step=7312.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  22%|██▏       | 261/1208 [07:13<26:12,  1.66s/it, loss=0.157, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00102, train/loss_step=0.262, global_step=7313.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  22%|██▏       | 262/1208 [07:14<26:08,  1.66s/it, loss=0.157, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00102, train/loss_step=0.262, global_step=7313.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  22%|██▏       | 262/1208 [07:14<26:08,  1.66s/it, loss=0.164, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000894, train/loss_step=0.218, global_step=7313.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  22%|██▏       | 263/1208 [07:15<26:04,  1.66s/it, loss=0.164, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000894, train/loss_step=0.218, global_step=7313.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  22%|██▏       | 263/1208 [07:15<26:04,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=8.94e-5, train/loss_step=0.0218, global_step=7313.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  22%|██▏       | 264/1208 [07:18<26:07,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=8.94e-5, train/loss_step=0.0218, global_step=7313.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  22%|██▏       | 264/1208 [07:18<26:07,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00522, train/loss_vlb_step=2.66e-5, train/loss_step=0.00522, global_step=7313.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  22%|██▏       | 265/1208 [07:19<26:03,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00522, train/loss_vlb_step=2.66e-5, train/loss_step=0.00522, global_step=7313.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  22%|██▏       | 265/1208 [07:19<26:03,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000505, train/loss_step=0.146, global_step=7314.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  22%|██▏       | 266/1208 [07:20<25:59,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000505, train/loss_step=0.146, global_step=7314.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  22%|██▏       | 266/1208 [07:20<25:59,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000427, train/loss_step=0.129, global_step=7314.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  22%|██▏       | 267/1208 [07:21<25:55,  1.65s/it, loss=0.145, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000427, train/loss_step=0.129, global_step=7314.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  22%|██▏       | 267/1208 [07:21<25:55,  1.65s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.16e-5, train/loss_step=0.0139, global_step=7314.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  22%|██▏       | 268/1208 [07:24<25:58,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.16e-5, train/loss_step=0.0139, global_step=7314.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  22%|██▏       | 268/1208 [07:24<25:58,  1.66s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0515, train/loss_vlb_step=0.000188, train/loss_step=0.0515, global_step=7314.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  22%|██▏       | 269/1208 [07:25<25:54,  1.66s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0515, train/loss_vlb_step=0.000188, train/loss_step=0.0515, global_step=7314.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  22%|██▏       | 269/1208 [07:25<25:54,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.00046, train/loss_step=0.138, global_step=7315.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  22%|██▏       | 270/1208 [07:26<25:50,  1.65s/it, loss=0.149, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.00046, train/loss_step=0.138, global_step=7315.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  22%|██▏       | 270/1208 [07:26<25:50,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0479, train/loss_vlb_step=0.000174, train/loss_step=0.0479, global_step=7315.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  22%|██▏       | 271/1208 [07:27<25:46,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0479, train/loss_vlb_step=0.000174, train/loss_step=0.0479, global_step=7315.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  22%|██▏       | 271/1208 [07:27<25:46,  1.65s/it, loss=0.119, v_num=0, train/loss_simple_step=0.055, train/loss_vlb_step=0.000197, train/loss_step=0.055, global_step=7315.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  23%|██▎       | 272/1208 [07:30<25:48,  1.65s/it, loss=0.119, v_num=0, train/loss_simple_step=0.055, train/loss_vlb_step=0.000197, train/loss_step=0.055, global_step=7315.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  23%|██▎       | 272/1208 [07:30<25:48,  1.65s/it, loss=0.125, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000475, train/loss_step=0.143, global_step=7315.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  23%|██▎       | 273/1208 [07:31<25:45,  1.65s/it, loss=0.125, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000475, train/loss_step=0.143, global_step=7315.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  23%|██▎       | 273/1208 [07:31<25:45,  1.65s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.05e-5, train/loss_step=0.0229, global_step=7316.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  23%|██▎       | 274/1208 [07:32<25:41,  1.65s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.05e-5, train/loss_step=0.0229, global_step=7316.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  23%|██▎       | 274/1208 [07:32<25:41,  1.65s/it, loss=0.128, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000588, train/loss_step=0.174, global_step=7316.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  23%|██▎       | 275/1208 [07:33<25:37,  1.65s/it, loss=0.128, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000588, train/loss_step=0.174, global_step=7316.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  23%|██▎       | 275/1208 [07:33<25:37,  1.65s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.07e-5, train/loss_step=0.00178, global_step=7316.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  23%|██▎       | 276/1208 [07:35<25:39,  1.65s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.07e-5, train/loss_step=0.00178, global_step=7316.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  23%|██▎       | 276/1208 [07:36<25:39,  1.65s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.000203, train/loss_step=0.0598, global_step=7316.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  23%|██▎       | 277/1208 [07:37<25:36,  1.65s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.000203, train/loss_step=0.0598, global_step=7316.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  23%|██▎       | 277/1208 [07:37<25:36,  1.65s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.00726, train/loss_vlb_step=3.58e-5, train/loss_step=0.00726, global_step=7317.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  23%|██▎       | 278/1208 [07:38<25:32,  1.65s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.00726, train/loss_vlb_step=3.58e-5, train/loss_step=0.00726, global_step=7317.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  23%|██▎       | 278/1208 [07:38<25:32,  1.65s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.00603, train/loss_vlb_step=2.95e-5, train/loss_step=0.00603, global_step=7317.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  23%|██▎       | 279/1208 [07:39<25:28,  1.65s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.00603, train/loss_vlb_step=2.95e-5, train/loss_step=0.00603, global_step=7317.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  23%|██▎       | 279/1208 [07:39<25:28,  1.65s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.00569, train/loss_vlb_step=2.89e-5, train/loss_step=0.00569, global_step=7317.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  23%|██▎       | 280/1208 [07:41<25:30,  1.65s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.00569, train/loss_vlb_step=2.89e-5, train/loss_step=0.00569, global_step=7317.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  23%|██▎       | 280/1208 [07:41<25:30,  1.65s/it, loss=0.0757, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=3.14e-5, train/loss_step=0.00619, global_step=7317.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  23%|██▎       | 281/1208 [07:42<25:27,  1.65s/it, loss=0.0757, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=3.14e-5, train/loss_step=0.00619, global_step=7317.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  23%|██▎       | 281/1208 [07:42<25:27,  1.65s/it, loss=0.0658, v_num=0, train/loss_simple_step=0.063, train/loss_vlb_step=0.00021, train/loss_step=0.063, global_step=7318.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  23%|██▎       | 282/1208 [07:43<25:23,  1.65s/it, loss=0.0658, v_num=0, train/loss_simple_step=0.063, train/loss_vlb_step=0.00021, train/loss_step=0.063, global_step=7318.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  23%|██▎       | 282/1208 [07:43<25:23,  1.65s/it, loss=0.0799, v_num=0, train/loss_simple_step=0.500, train/loss_vlb_step=0.00592, train/loss_step=0.500, global_step=7318.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  23%|██▎       | 283/1208 [07:44<25:19,  1.64s/it, loss=0.0799, v_num=0, train/loss_simple_step=0.500, train/loss_vlb_step=0.00592, train/loss_step=0.500, global_step=7318.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  23%|██▎       | 283/1208 [07:44<25:19,  1.64s/it, loss=0.0886, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000703, train/loss_step=0.196, global_step=7318.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  24%|██▎       | 284/1208 [07:47<25:22,  1.65s/it, loss=0.0886, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000703, train/loss_step=0.196, global_step=7318.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  24%|██▎       | 284/1208 [07:47<25:22,  1.65s/it, loss=0.102, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00135, train/loss_step=0.268, global_step=7318.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  24%|██▎       | 285/1208 [07:48<25:18,  1.65s/it, loss=0.102, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00135, train/loss_step=0.268, global_step=7318.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  24%|██▎       | 285/1208 [07:48<25:18,  1.65s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000152, train/loss_step=0.0415, global_step=7319.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  24%|██▎       | 286/1208 [07:49<25:14,  1.64s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000152, train/loss_step=0.0415, global_step=7319.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  24%|██▎       | 286/1208 [07:49<25:14,  1.64s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000533, train/loss_step=0.157, global_step=7319.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  24%|██▍       | 287/1208 [07:50<25:11,  1.64s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000533, train/loss_step=0.157, global_step=7319.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  24%|██▍       | 287/1208 [07:50<25:11,  1.64s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.00754, train/loss_vlb_step=3.68e-5, train/loss_step=0.00754, global_step=7319.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  24%|██▍       | 288/1208 [07:53<25:13,  1.64s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.00754, train/loss_vlb_step=3.68e-5, train/loss_step=0.00754, global_step=7319.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  24%|██▍       | 288/1208 [07:53<25:13,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.725, train/loss_vlb_step=0.0226, train/loss_step=0.725, global_step=7319.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]      Epoch 24:  24%|██▍       | 289/1208 [07:54<25:09,  1.64s/it, loss=0.131, v_num=0, train/loss_simple_step=0.725, train/loss_vlb_step=0.0226, train/loss_step=0.725, global_step=7319.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  24%|██▍       | 289/1208 [07:54<25:09,  1.64s/it, loss=0.126, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000114, train/loss_step=0.031, global_step=7320.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  24%|██▍       | 290/1208 [07:55<25:06,  1.64s/it, loss=0.126, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000114, train/loss_step=0.031, global_step=7320.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  24%|██▍       | 290/1208 [07:55<25:06,  1.64s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000125, train/loss_step=0.0339, global_step=7320.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  24%|██▍       | 291/1208 [07:56<25:02,  1.64s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000125, train/loss_step=0.0339, global_step=7320.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  24%|██▍       | 291/1208 [07:56<25:02,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.00067, train/loss_step=0.201, global_step=7320.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  24%|██▍       | 292/1208 [07:59<25:04,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.00067, train/loss_step=0.201, global_step=7320.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  24%|██▍       | 292/1208 [07:59<25:04,  1.64s/it, loss=0.134, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000609, train/loss_step=0.175, global_step=7320.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  24%|██▍       | 293/1208 [08:00<25:00,  1.64s/it, loss=0.134, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000609, train/loss_step=0.175, global_step=7320.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  24%|██▍       | 293/1208 [08:00<25:01,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00323, train/loss_vlb_step=1.84e-5, train/loss_step=0.00323, global_step=7321.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  24%|██▍       | 294/1208 [08:01<24:57,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00323, train/loss_vlb_step=1.84e-5, train/loss_step=0.00323, global_step=7321.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  24%|██▍       | 294/1208 [08:01<24:57,  1.64s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0766, train/loss_vlb_step=0.000256, train/loss_step=0.0766, global_step=7321.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  24%|██▍       | 295/1208 [08:02<24:53,  1.64s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0766, train/loss_vlb_step=0.000256, train/loss_step=0.0766, global_step=7321.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  24%|██▍       | 295/1208 [08:02<24:53,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000665, train/loss_step=0.179, global_step=7321.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  25%|██▍       | 296/1208 [08:05<24:55,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000665, train/loss_step=0.179, global_step=7321.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  25%|██▍       | 296/1208 [08:05<24:55,  1.64s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=8.82e-5, train/loss_step=0.0217, global_step=7321.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  25%|██▍       | 297/1208 [08:06<24:52,  1.64s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=8.82e-5, train/loss_step=0.0217, global_step=7321.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  25%|██▍       | 297/1208 [08:06<24:52,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000137, train/loss_step=0.0367, global_step=7322.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  25%|██▍       | 298/1208 [08:07<24:48,  1.64s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000137, train/loss_step=0.0367, global_step=7322.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  25%|██▍       | 298/1208 [08:07<24:48,  1.64s/it, loss=0.143, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=7322.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  25%|██▍       | 299/1208 [08:08<24:45,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=7322.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  25%|██▍       | 299/1208 [08:08<24:45,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00832, train/loss_vlb_step=4.02e-5, train/loss_step=0.00832, global_step=7322.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  25%|██▍       | 300/1208 [08:11<24:47,  1.64s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00832, train/loss_vlb_step=4.02e-5, train/loss_step=0.00832, global_step=7322.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  25%|██▍       | 300/1208 [08:11<24:47,  1.64s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00847, train/loss_vlb_step=4.14e-5, train/loss_step=0.00847, global_step=7322.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.85it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.85it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.84it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.84it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:24,  1.84it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.83it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.84it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.83it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:23,  1.84it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.84it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.83it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.83it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.84it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:05<00:21,  1.83it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.84it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.84it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.84it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.84it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.84it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.83it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.84it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.84it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.84it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.83it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.84it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.84it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.83it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.84it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.84it/s][ADDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.84it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.84it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.84it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:11<00:15,  1.84it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.84it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.84it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.84it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.84it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.85it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.84it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.83it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.84it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:11,  1.84it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.84it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.83it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.84it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.84it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.83it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.84it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:17<00:09,  1.84it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.84it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.84it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.83it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.84it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.83it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.84it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.83it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.84it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.83it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.83it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.83it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.83it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.83it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.83it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.83it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.83it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.83it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.83it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.83it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.83it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.78it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.83it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.83it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.78it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.84it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:23<00:03,  1.83it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.84it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.83it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.84it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.83it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.84it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.84it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.84it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.84it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.83it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.84it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.78it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.83it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]Epoch 24:  25%|██▍       | 301/1208 [08:40<26:09,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00847, train/loss_vlb_step=4.14e-5, train/loss_step=0.00847, global_step=7322.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  25%|██▍       | 301/1208 [08:40<26:09,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.527, train/loss_vlb_step=0.0185, train/loss_step=0.527, global_step=7323.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]     Epoch 24:  25%|██▌       | 302/1208 [08:41<26:05,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.527, train/loss_vlb_step=0.0185, train/loss_step=0.527, global_step=7323.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  25%|██▌       | 302/1208 [08:41<26:05,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00106, train/loss_step=0.259, global_step=7323.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  25%|██▌       | 303/1208 [08:42<26:02,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00106, train/loss_step=0.259, global_step=7323.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  25%|██▌       | 303/1208 [08:42<26:02,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00269, train/loss_vlb_step=1.52e-5, train/loss_step=0.00269, global_step=7323.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  25%|██▌       | 304/1208 [08:46<26:04,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00269, train/loss_vlb_step=1.52e-5, train/loss_step=0.00269, global_step=7323.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  25%|██▌       | 304/1208 [08:46<26:04,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00136, train/loss_step=0.286, global_step=7323.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  25%|██▌       | 305/1208 [08:47<26:00,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00136, train/loss_step=0.286, global_step=7323.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  25%|██▌       | 305/1208 [08:47<26:00,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0989, train/loss_vlb_step=0.000326, train/loss_step=0.0989, global_step=7324.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  25%|██▌       | 306/1208 [08:48<25:56,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0989, train/loss_vlb_step=0.000326, train/loss_step=0.0989, global_step=7324.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  25%|██▌       | 306/1208 [08:48<25:56,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.02e-5, train/loss_step=0.0136, global_step=7324.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  25%|██▌       | 307/1208 [08:49<25:52,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.02e-5, train/loss_step=0.0136, global_step=7324.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  25%|██▌       | 307/1208 [08:49<25:52,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.0025, train/loss_step=0.372, global_step=7324.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  25%|██▌       | 308/1208 [08:52<25:54,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.0025, train/loss_step=0.372, global_step=7324.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  25%|██▌       | 308/1208 [08:52<25:54,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000117, train/loss_step=0.0306, global_step=7324.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  26%|██▌       | 309/1208 [08:53<25:50,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000117, train/loss_step=0.0306, global_step=7324.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  26%|██▌       | 309/1208 [08:53<25:50,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00675, train/loss_vlb_step=3.24e-5, train/loss_step=0.00675, global_step=7325.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  26%|██▌       | 310/1208 [08:54<25:47,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00675, train/loss_vlb_step=3.24e-5, train/loss_step=0.00675, global_step=7325.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  26%|██▌       | 310/1208 [08:54<25:47,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000764, train/loss_step=0.216, global_step=7325.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  26%|██▌       | 311/1208 [08:55<25:43,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000764, train/loss_step=0.216, global_step=7325.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  26%|██▌       | 311/1208 [08:55<25:43,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00482, train/loss_vlb_step=2.46e-5, train/loss_step=0.00482, global_step=7325.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  26%|██▌       | 312/1208 [08:57<25:44,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00482, train/loss_vlb_step=2.46e-5, train/loss_step=0.00482, global_step=7325.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  26%|██▌       | 312/1208 [08:57<25:44,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.45e-5, train/loss_step=0.0227, global_step=7325.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  26%|██▌       | 313/1208 [08:58<25:41,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.45e-5, train/loss_step=0.0227, global_step=7325.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  26%|██▌       | 313/1208 [08:58<25:41,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.0011, train/loss_step=0.254, global_step=7326.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  26%|██▌       | 314/1208 [08:59<25:37,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.0011, train/loss_step=0.254, global_step=7326.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  26%|██▌       | 314/1208 [08:59<25:37,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00203, train/loss_step=0.369, global_step=7326.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  26%|██▌       | 315/1208 [09:00<25:33,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00203, train/loss_step=0.369, global_step=7326.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  26%|██▌       | 315/1208 [09:00<25:33,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00593, train/loss_vlb_step=3.04e-5, train/loss_step=0.00593, global_step=7326.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  26%|██▌       | 316/1208 [09:03<25:35,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00593, train/loss_vlb_step=3.04e-5, train/loss_step=0.00593, global_step=7326.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  26%|██▌       | 316/1208 [09:03<25:35,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.82e-5, train/loss_step=0.0106, global_step=7326.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  26%|██▌       | 317/1208 [09:04<25:31,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.82e-5, train/loss_step=0.0106, global_step=7326.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  26%|██▌       | 317/1208 [09:04<25:31,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.19e-5, train/loss_step=0.00199, global_step=7327.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  26%|██▋       | 318/1208 [09:05<25:27,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.19e-5, train/loss_step=0.00199, global_step=7327.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  26%|██▋       | 318/1208 [09:05<25:27,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000911, train/loss_step=0.224, global_step=7327.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  26%|██▋       | 319/1208 [09:06<25:24,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000911, train/loss_step=0.224, global_step=7327.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  26%|██▋       | 319/1208 [09:06<25:24,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00165, train/loss_step=0.329, global_step=7327.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  26%|██▋       | 320/1208 [09:09<25:25,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00165, train/loss_step=0.329, global_step=7327.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  26%|██▋       | 320/1208 [09:09<25:25,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000117, train/loss_step=0.0295, global_step=7327.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  27%|██▋       | 321/1208 [09:10<25:21,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000117, train/loss_step=0.0295, global_step=7327.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  27%|██▋       | 321/1208 [09:10<25:21,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000119, train/loss_step=0.0311, global_step=7328.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  27%|██▋       | 322/1208 [09:11<25:18,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000119, train/loss_step=0.0311, global_step=7328.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  27%|██▋       | 322/1208 [09:11<25:18,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.00104, train/loss_step=0.227, global_step=7328.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  27%|██▋       | 323/1208 [09:12<25:14,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.00104, train/loss_step=0.227, global_step=7328.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  27%|██▋       | 323/1208 [09:12<25:14,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.000123, train/loss_step=0.0326, global_step=7328.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  27%|██▋       | 324/1208 [09:15<25:15,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.000123, train/loss_step=0.0326, global_step=7328.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  27%|██▋       | 324/1208 [09:15<25:16,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.525, train/loss_vlb_step=0.00516, train/loss_step=0.525, global_step=7328.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  27%|██▋       | 325/1208 [09:16<25:12,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.525, train/loss_vlb_step=0.00516, train/loss_step=0.525, global_step=7328.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  27%|██▋       | 325/1208 [09:16<25:12,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00509, train/loss_vlb_step=2.68e-5, train/loss_step=0.00509, global_step=7329.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  27%|██▋       | 326/1208 [09:17<25:08,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00509, train/loss_vlb_step=2.68e-5, train/loss_step=0.00509, global_step=7329.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  27%|██▋       | 326/1208 [09:17<25:08,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0037, train/loss_vlb_step=2.01e-5, train/loss_step=0.0037, global_step=7329.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  27%|██▋       | 327/1208 [09:18<25:05,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0037, train/loss_vlb_step=2.01e-5, train/loss_step=0.0037, global_step=7329.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  27%|██▋       | 327/1208 [09:18<25:05,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.51e-5, train/loss_step=0.0182, global_step=7329.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  27%|██▋       | 328/1208 [09:21<25:06,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.51e-5, train/loss_step=0.0182, global_step=7329.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  27%|██▋       | 328/1208 [09:21<25:06,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000834, train/loss_step=0.220, global_step=7329.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  27%|██▋       | 329/1208 [09:22<25:03,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000834, train/loss_step=0.220, global_step=7329.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  27%|██▋       | 329/1208 [09:22<25:03,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00127, train/loss_step=0.263, global_step=7330.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  27%|██▋       | 330/1208 [09:23<24:59,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00127, train/loss_step=0.263, global_step=7330.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  27%|██▋       | 330/1208 [09:23<24:59,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.4e-5, train/loss_step=0.0123, global_step=7330.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  27%|██▋       | 331/1208 [09:24<24:55,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.4e-5, train/loss_step=0.0123, global_step=7330.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  27%|██▋       | 331/1208 [09:24<24:55,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0096, train/loss_vlb_step=4.56e-5, train/loss_step=0.0096, global_step=7330.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  27%|██▋       | 332/1208 [09:27<24:57,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0096, train/loss_vlb_step=4.56e-5, train/loss_step=0.0096, global_step=7330.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  27%|██▋       | 332/1208 [09:27<24:57,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00237, train/loss_step=0.365, global_step=7330.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  28%|██▊       | 333/1208 [09:28<24:53,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00237, train/loss_step=0.365, global_step=7330.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  28%|██▊       | 333/1208 [09:28<24:53,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.570, train/loss_vlb_step=0.0111, train/loss_step=0.570, global_step=7331.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  28%|██▊       | 334/1208 [09:29<24:50,  1.71s/it, loss=0.163, v_num=0, train/loss_simple_step=0.570, train/loss_vlb_step=0.0111, train/loss_step=0.570, global_step=7331.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  28%|██▊       | 334/1208 [09:29<24:50,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000505, train/loss_step=0.149, global_step=7331.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  28%|██▊       | 335/1208 [09:30<24:46,  1.70s/it, loss=0.152, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000505, train/loss_step=0.149, global_step=7331.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  28%|██▊       | 335/1208 [09:30<24:46,  1.70s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0872, train/loss_vlb_step=0.000287, train/loss_step=0.0872, global_step=7331.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  28%|██▊       | 336/1208 [09:33<24:48,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0872, train/loss_vlb_step=0.000287, train/loss_step=0.0872, global_step=7331.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  28%|██▊       | 336/1208 [09:33<24:48,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000846, train/loss_step=0.216, global_step=7331.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  28%|██▊       | 337/1208 [09:34<24:44,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000846, train/loss_step=0.216, global_step=7331.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  28%|██▊       | 337/1208 [09:34<24:44,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.5e-5, train/loss_step=0.0125, global_step=7332.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  28%|██▊       | 338/1208 [09:35<24:41,  1.70s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.5e-5, train/loss_step=0.0125, global_step=7332.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  28%|██▊       | 338/1208 [09:35<24:41,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000164, train/loss_step=0.0474, global_step=7332.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  28%|██▊       | 339/1208 [09:36<24:37,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000164, train/loss_step=0.0474, global_step=7332.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  28%|██▊       | 339/1208 [09:36<24:37,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.530, train/loss_vlb_step=0.00676, train/loss_step=0.530, global_step=7332.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  28%|██▊       | 340/1208 [09:39<24:38,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.530, train/loss_vlb_step=0.00676, train/loss_step=0.530, global_step=7332.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  28%|██▊       | 340/1208 [09:39<24:38,  1.70s/it, loss=0.187, v_num=0, train/loss_simple_step=0.419, train/loss_vlb_step=0.00352, train/loss_step=0.419, global_step=7332.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  28%|██▊       | 341/1208 [09:40<24:35,  1.70s/it, loss=0.187, v_num=0, train/loss_simple_step=0.419, train/loss_vlb_step=0.00352, train/loss_step=0.419, global_step=7332.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  28%|██▊       | 341/1208 [09:40<24:35,  1.70s/it, loss=0.195, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000731, train/loss_step=0.193, global_step=7333.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  28%|██▊       | 342/1208 [09:41<24:31,  1.70s/it, loss=0.195, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000731, train/loss_step=0.193, global_step=7333.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  28%|██▊       | 342/1208 [09:41<24:31,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.16e-5, train/loss_step=0.0226, global_step=7333.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  28%|██▊       | 343/1208 [09:42<24:28,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.16e-5, train/loss_step=0.0226, global_step=7333.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  28%|██▊       | 343/1208 [09:42<24:28,  1.70s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0738, train/loss_vlb_step=0.000255, train/loss_step=0.0738, global_step=7333.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  28%|██▊       | 344/1208 [09:45<24:29,  1.70s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0738, train/loss_vlb_step=0.000255, train/loss_step=0.0738, global_step=7333.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  28%|██▊       | 344/1208 [09:45<24:29,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00606, train/loss_vlb_step=3.16e-5, train/loss_step=0.00606, global_step=7333.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  29%|██▊       | 345/1208 [09:46<24:26,  1.70s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00606, train/loss_vlb_step=3.16e-5, train/loss_step=0.00606, global_step=7333.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  29%|██▊       | 345/1208 [09:46<24:26,  1.70s/it, loss=0.189, v_num=0, train/loss_simple_step=0.552, train/loss_vlb_step=0.0101, train/loss_step=0.552, global_step=7334.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]     Epoch 24:  29%|██▊       | 346/1208 [09:47<24:22,  1.70s/it, loss=0.189, v_num=0, train/loss_simple_step=0.552, train/loss_vlb_step=0.0101, train/loss_step=0.552, global_step=7334.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  29%|██▊       | 346/1208 [09:47<24:22,  1.70s/it, loss=0.207, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.00246, train/loss_step=0.382, global_step=7334.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  29%|██▊       | 347/1208 [09:48<24:19,  1.70s/it, loss=0.207, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.00246, train/loss_step=0.382, global_step=7334.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  29%|██▊       | 347/1208 [09:48<24:19,  1.70s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0871, train/loss_vlb_step=0.000287, train/loss_step=0.0871, global_step=7334.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  29%|██▉       | 348/1208 [09:51<24:20,  1.70s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0871, train/loss_vlb_step=0.000287, train/loss_step=0.0871, global_step=7334.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  29%|██▉       | 348/1208 [09:51<24:20,  1.70s/it, loss=0.2, v_num=0, train/loss_simple_step=0.00704, train/loss_vlb_step=3.52e-5, train/loss_step=0.00704, global_step=7334.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  29%|██▉       | 349/1208 [09:52<24:17,  1.70s/it, loss=0.2, v_num=0, train/loss_simple_step=0.00704, train/loss_vlb_step=3.52e-5, train/loss_step=0.00704, global_step=7334.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  29%|██▉       | 349/1208 [09:52<24:17,  1.70s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0568, train/loss_vlb_step=0.000197, train/loss_step=0.0568, global_step=7335.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  29%|██▉       | 350/1208 [09:53<24:13,  1.69s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0568, train/loss_vlb_step=0.000197, train/loss_step=0.0568, global_step=7335.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  29%|██▉       | 350/1208 [09:53<24:13,  1.69s/it, loss=0.192, v_num=0, train/loss_simple_step=0.061, train/loss_vlb_step=0.000208, train/loss_step=0.061, global_step=7335.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  29%|██▉       | 351/1208 [09:54<24:10,  1.69s/it, loss=0.192, v_num=0, train/loss_simple_step=0.061, train/loss_vlb_step=0.000208, train/loss_step=0.061, global_step=7335.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  29%|██▉       | 351/1208 [09:54<24:10,  1.69s/it, loss=0.194, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000132, train/loss_step=0.035, global_step=7335.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  29%|██▉       | 352/1208 [09:56<24:11,  1.70s/it, loss=0.194, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000132, train/loss_step=0.035, global_step=7335.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  29%|██▉       | 352/1208 [09:56<24:11,  1.70s/it, loss=0.176, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.66e-5, train/loss_step=0.013, global_step=7335.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  29%|██▉       | 353/1208 [09:57<24:08,  1.69s/it, loss=0.176, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.66e-5, train/loss_step=0.013, global_step=7335.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  29%|██▉       | 353/1208 [09:57<24:08,  1.69s/it, loss=0.168, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00258, train/loss_step=0.404, global_step=7336.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  29%|██▉       | 354/1208 [09:58<24:04,  1.69s/it, loss=0.168, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00258, train/loss_step=0.404, global_step=7336.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  29%|██▉       | 354/1208 [09:58<24:04,  1.69s/it, loss=0.164, v_num=0, train/loss_simple_step=0.076, train/loss_vlb_step=0.000251, train/loss_step=0.076, global_step=7336.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  29%|██▉       | 355/1208 [09:59<24:01,  1.69s/it, loss=0.164, v_num=0, train/loss_simple_step=0.076, train/loss_vlb_step=0.000251, train/loss_step=0.076, global_step=7336.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  29%|██▉       | 355/1208 [09:59<24:01,  1.69s/it, loss=0.176, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00188, train/loss_step=0.324, global_step=7336.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  29%|██▉       | 356/1208 [10:02<24:02,  1.69s/it, loss=0.176, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00188, train/loss_step=0.324, global_step=7336.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  29%|██▉       | 356/1208 [10:02<24:02,  1.69s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00818, train/loss_vlb_step=3.9e-5, train/loss_step=0.00818, global_step=7336.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  30%|██▉       | 357/1208 [10:03<23:59,  1.69s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00818, train/loss_vlb_step=3.9e-5, train/loss_step=0.00818, global_step=7336.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  30%|██▉       | 357/1208 [10:03<23:59,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0371, train/loss_vlb_step=0.000141, train/loss_step=0.0371, global_step=7337.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  30%|██▉       | 358/1208 [10:04<23:56,  1.69s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0371, train/loss_vlb_step=0.000141, train/loss_step=0.0371, global_step=7337.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  30%|██▉       | 358/1208 [10:04<23:56,  1.69s/it, loss=0.181, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00196, train/loss_step=0.336, global_step=7337.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  30%|██▉       | 359/1208 [10:05<23:52,  1.69s/it, loss=0.181, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00196, train/loss_step=0.336, global_step=7337.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  30%|██▉       | 359/1208 [10:05<23:52,  1.69s/it, loss=0.165, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000745, train/loss_step=0.208, global_step=7337.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  30%|██▉       | 360/1208 [10:08<23:54,  1.69s/it, loss=0.165, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000745, train/loss_step=0.208, global_step=7337.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  30%|██▉       | 360/1208 [10:08<23:54,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000427, train/loss_step=0.130, global_step=7337.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  30%|██▉       | 361/1208 [10:09<23:50,  1.69s/it, loss=0.151, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000427, train/loss_step=0.130, global_step=7337.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  30%|██▉       | 361/1208 [10:09<23:50,  1.69s/it, loss=0.156, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00135, train/loss_step=0.308, global_step=7338.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  30%|██▉       | 362/1208 [10:10<23:47,  1.69s/it, loss=0.156, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00135, train/loss_step=0.308, global_step=7338.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  30%|██▉       | 362/1208 [10:10<23:47,  1.69s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.68e-5, train/loss_step=0.0108, global_step=7338.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  30%|███       | 363/1208 [10:11<23:44,  1.69s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.68e-5, train/loss_step=0.0108, global_step=7338.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  30%|███       | 363/1208 [10:11<23:44,  1.69s/it, loss=0.166, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00121, train/loss_step=0.280, global_step=7338.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  30%|███       | 364/1208 [10:14<23:45,  1.69s/it, loss=0.166, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00121, train/loss_step=0.280, global_step=7338.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  30%|███       | 364/1208 [10:14<23:45,  1.69s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.73e-5, train/loss_step=0.0103, global_step=7338.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  30%|███       | 365/1208 [10:15<23:42,  1.69s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.73e-5, train/loss_step=0.0103, global_step=7338.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  30%|███       | 365/1208 [10:15<23:42,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0689, train/loss_vlb_step=0.000228, train/loss_step=0.0689, global_step=7339.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  30%|███       | 366/1208 [10:16<23:38,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0689, train/loss_vlb_step=0.000228, train/loss_step=0.0689, global_step=7339.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  30%|███       | 366/1208 [10:16<23:38,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=9.85e-5, train/loss_step=0.0259, global_step=7339.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  30%|███       | 367/1208 [10:17<23:35,  1.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=9.85e-5, train/loss_step=0.0259, global_step=7339.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  30%|███       | 367/1208 [10:17<23:35,  1.68s/it, loss=0.14, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00211, train/loss_step=0.396, global_step=7339.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  30%|███       | 368/1208 [10:20<23:36,  1.69s/it, loss=0.14, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00211, train/loss_step=0.396, global_step=7339.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  30%|███       | 368/1208 [10:20<23:36,  1.69s/it, loss=0.148, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.00058, train/loss_step=0.172, global_step=7339.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  31%|███       | 369/1208 [10:21<23:33,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.00058, train/loss_step=0.172, global_step=7339.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  31%|███       | 369/1208 [10:21<23:33,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00156, train/loss_step=0.304, global_step=7340.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  31%|███       | 370/1208 [10:22<23:30,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00156, train/loss_step=0.304, global_step=7340.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  31%|███       | 370/1208 [10:22<23:30,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.93e-5, train/loss_step=0.0107, global_step=7340.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  31%|███       | 371/1208 [10:23<23:26,  1.68s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.93e-5, train/loss_step=0.0107, global_step=7340.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  31%|███       | 371/1208 [10:23<23:26,  1.68s/it, loss=0.162, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000385, train/loss_step=0.116, global_step=7340.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  31%|███       | 372/1208 [10:26<23:27,  1.68s/it, loss=0.162, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000385, train/loss_step=0.116, global_step=7340.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  31%|███       | 372/1208 [10:26<23:27,  1.68s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.13e-5, train/loss_step=0.0234, global_step=7340.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  31%|███       | 373/1208 [10:27<23:24,  1.68s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.13e-5, train/loss_step=0.0234, global_step=7340.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  31%|███       | 373/1208 [10:27<23:24,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.18e-5, train/loss_step=0.0115, global_step=7341.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  31%|███       | 374/1208 [10:28<23:21,  1.68s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.18e-5, train/loss_step=0.0115, global_step=7341.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  31%|███       | 374/1208 [10:28<23:21,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00123, train/loss_step=0.267, global_step=7341.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  31%|███       | 375/1208 [10:29<23:18,  1.68s/it, loss=0.152, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00123, train/loss_step=0.267, global_step=7341.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  31%|███       | 375/1208 [10:29<23:18,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000142, train/loss_step=0.0392, global_step=7341.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  31%|███       | 376/1208 [10:32<23:19,  1.68s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000142, train/loss_step=0.0392, global_step=7341.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  31%|███       | 376/1208 [10:32<23:19,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.506, train/loss_vlb_step=0.00466, train/loss_step=0.506, global_step=7341.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  31%|███       | 377/1208 [10:33<23:16,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.506, train/loss_vlb_step=0.00466, train/loss_step=0.506, global_step=7341.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  31%|███       | 377/1208 [10:33<23:16,  1.68s/it, loss=0.18, v_num=0, train/loss_simple_step=0.387, train/loss_vlb_step=0.0036, train/loss_step=0.387, global_step=7342.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  31%|███▏      | 378/1208 [10:34<23:13,  1.68s/it, loss=0.18, v_num=0, train/loss_simple_step=0.387, train/loss_vlb_step=0.0036, train/loss_step=0.387, global_step=7342.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  31%|███▏      | 378/1208 [10:34<23:13,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00577, train/loss_vlb_step=2.92e-5, train/loss_step=0.00577, global_step=7342.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  31%|███▏      | 379/1208 [10:35<23:09,  1.68s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00577, train/loss_vlb_step=2.92e-5, train/loss_step=0.00577, global_step=7342.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  31%|███▏      | 379/1208 [10:35<23:09,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=6.04e-5, train/loss_step=0.0131, global_step=7342.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  31%|███▏      | 380/1208 [10:38<23:10,  1.68s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=6.04e-5, train/loss_step=0.0131, global_step=7342.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  31%|███▏      | 380/1208 [10:38<23:10,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00113, train/loss_step=0.244, global_step=7342.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  32%|███▏      | 381/1208 [10:39<23:07,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00113, train/loss_step=0.244, global_step=7342.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  32%|███▏      | 381/1208 [10:39<23:07,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=9.31e-5, train/loss_step=0.0244, global_step=7343.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  32%|███▏      | 382/1208 [10:40<23:04,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=9.31e-5, train/loss_step=0.0244, global_step=7343.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  32%|███▏      | 382/1208 [10:40<23:04,  1.68s/it, loss=0.16, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00141, train/loss_step=0.294, global_step=7343.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  32%|███▏      | 383/1208 [10:41<23:01,  1.67s/it, loss=0.16, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00141, train/loss_step=0.294, global_step=7343.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  32%|███▏      | 383/1208 [10:41<23:01,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000687, train/loss_step=0.197, global_step=7343.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  32%|███▏      | 384/1208 [10:44<23:02,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000687, train/loss_step=0.197, global_step=7343.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  32%|███▏      | 384/1208 [10:44<23:02,  1.68s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.71e-5, train/loss_step=0.00303, global_step=7343.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  32%|███▏      | 385/1208 [10:45<22:59,  1.68s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.71e-5, train/loss_step=0.00303, global_step=7343.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  32%|███▏      | 385/1208 [10:45<22:59,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000331, train/loss_step=0.100, global_step=7344.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  32%|███▏      | 386/1208 [10:46<22:56,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000331, train/loss_step=0.100, global_step=7344.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  32%|███▏      | 386/1208 [10:46<22:56,  1.67s/it, loss=0.176, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00283, train/loss_step=0.404, global_step=7344.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  32%|███▏      | 387/1208 [10:47<22:53,  1.67s/it, loss=0.176, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00283, train/loss_step=0.404, global_step=7344.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  32%|███▏      | 387/1208 [10:47<22:53,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00135, train/loss_step=0.285, global_step=7344.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  32%|███▏      | 388/1208 [10:50<22:54,  1.68s/it, loss=0.17, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00135, train/loss_step=0.285, global_step=7344.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  32%|███▏      | 388/1208 [10:50<22:54,  1.68s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0357, train/loss_vlb_step=0.000132, train/loss_step=0.0357, global_step=7344.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  32%|███▏      | 389/1208 [10:51<22:50,  1.67s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0357, train/loss_vlb_step=0.000132, train/loss_step=0.0357, global_step=7344.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  32%|███▏      | 389/1208 [10:51<22:50,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0247, train/loss_vlb_step=9.82e-5, train/loss_step=0.0247, global_step=7345.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  32%|███▏      | 390/1208 [10:52<22:47,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0247, train/loss_vlb_step=9.82e-5, train/loss_step=0.0247, global_step=7345.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  32%|███▏      | 390/1208 [10:52<22:47,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0385, train/loss_vlb_step=0.000138, train/loss_step=0.0385, global_step=7345.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  32%|███▏      | 391/1208 [10:53<22:44,  1.67s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0385, train/loss_vlb_step=0.000138, train/loss_step=0.0385, global_step=7345.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  32%|███▏      | 391/1208 [10:53<22:44,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00408, train/loss_vlb_step=2.16e-5, train/loss_step=0.00408, global_step=7345.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  32%|███▏      | 392/1208 [10:56<22:45,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00408, train/loss_vlb_step=2.16e-5, train/loss_step=0.00408, global_step=7345.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  32%|███▏      | 392/1208 [10:56<22:45,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0668, train/loss_vlb_step=0.000222, train/loss_step=0.0668, global_step=7345.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  33%|███▎      | 393/1208 [10:57<22:42,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0668, train/loss_vlb_step=0.000222, train/loss_step=0.0668, global_step=7345.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  33%|███▎      | 393/1208 [10:57<22:42,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00456, train/loss_vlb_step=2.43e-5, train/loss_step=0.00456, global_step=7346.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  33%|███▎      | 394/1208 [10:58<22:39,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00456, train/loss_vlb_step=2.43e-5, train/loss_step=0.00456, global_step=7346.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  33%|███▎      | 394/1208 [10:58<22:39,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.68e-5, train/loss_step=0.00289, global_step=7346.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  33%|███▎      | 395/1208 [10:59<22:36,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.68e-5, train/loss_step=0.00289, global_step=7346.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  33%|███▎      | 395/1208 [10:59<22:36,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=7346.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  33%|███▎      | 396/1208 [11:01<22:37,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=7346.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  33%|███▎      | 396/1208 [11:01<22:37,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0714, train/loss_vlb_step=0.000239, train/loss_step=0.0714, global_step=7346.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  33%|███▎      | 397/1208 [11:02<22:34,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0714, train/loss_vlb_step=0.000239, train/loss_step=0.0714, global_step=7346.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  33%|███▎      | 397/1208 [11:02<22:34,  1.67s/it, loss=0.109, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00127, train/loss_step=0.265, global_step=7347.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  33%|███▎      | 398/1208 [11:03<22:31,  1.67s/it, loss=0.109, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00127, train/loss_step=0.265, global_step=7347.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  33%|███▎      | 398/1208 [11:03<22:31,  1.67s/it, loss=0.118, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000621, train/loss_step=0.171, global_step=7347.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  33%|███▎      | 399/1208 [11:04<22:28,  1.67s/it, loss=0.118, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000621, train/loss_step=0.171, global_step=7347.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  33%|███▎      | 399/1208 [11:04<22:28,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00399, train/loss_step=0.423, global_step=7347.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  33%|███▎      | 400/1208 [11:07<22:29,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00399, train/loss_step=0.423, global_step=7347.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  33%|███▎      | 400/1208 [11:07<22:29,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000385, train/loss_step=0.116, global_step=7347.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  33%|███▎      | 401/1208 [11:08<22:26,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000385, train/loss_step=0.116, global_step=7347.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  33%|███▎      | 401/1208 [11:08<22:26,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.71e-5, train/loss_step=0.0246, global_step=7348.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  33%|███▎      | 402/1208 [11:09<22:23,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.71e-5, train/loss_step=0.0246, global_step=7348.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  33%|███▎      | 402/1208 [11:09<22:23,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00533, train/loss_vlb_step=2.69e-5, train/loss_step=0.00533, global_step=7348.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  33%|███▎      | 403/1208 [11:10<22:20,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00533, train/loss_vlb_step=2.69e-5, train/loss_step=0.00533, global_step=7348.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  33%|███▎      | 403/1208 [11:10<22:20,  1.66s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=1.27e-5, train/loss_step=0.00231, global_step=7348.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  33%|███▎      | 404/1208 [11:13<22:20,  1.67s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=1.27e-5, train/loss_step=0.00231, global_step=7348.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  33%|███▎      | 404/1208 [11:13<22:20,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.000999, train/loss_step=0.251, global_step=7348.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  34%|███▎      | 405/1208 [11:14<22:17,  1.67s/it, loss=0.12, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.000999, train/loss_step=0.251, global_step=7348.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  34%|███▎      | 405/1208 [11:14<22:17,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=7349.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  34%|███▎      | 406/1208 [11:15<22:14,  1.66s/it, loss=0.121, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=7349.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  34%|███▎      | 406/1208 [11:15<22:14,  1.66s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.52e-5, train/loss_step=0.0124, global_step=7349.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  34%|███▎      | 407/1208 [11:16<22:12,  1.66s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.52e-5, train/loss_step=0.0124, global_step=7349.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  34%|███▎      | 407/1208 [11:16<22:12,  1.66s/it, loss=0.088, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.92e-5, train/loss_step=0.0186, global_step=7349.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  34%|███▍      | 408/1208 [11:19<22:12,  1.67s/it, loss=0.088, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=7.92e-5, train/loss_step=0.0186, global_step=7349.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  34%|███▍      | 408/1208 [11:19<22:12,  1.67s/it, loss=0.0868, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.14e-5, train/loss_step=0.0113, global_step=7349.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  34%|███▍      | 409/1208 [11:20<22:09,  1.66s/it, loss=0.0868, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.14e-5, train/loss_step=0.0113, global_step=7349.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  34%|███▍      | 409/1208 [11:20<22:09,  1.66s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.0929, train/loss_vlb_step=0.000307, train/loss_step=0.0929, global_step=7350.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  34%|███▍      | 410/1208 [11:21<22:06,  1.66s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.0929, train/loss_vlb_step=0.000307, train/loss_step=0.0929, global_step=7350.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  34%|███▍      | 410/1208 [11:21<22:06,  1.66s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=2.11e-5, train/loss_step=0.00384, global_step=7350.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  34%|███▍      | 411/1208 [11:22<22:03,  1.66s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=2.11e-5, train/loss_step=0.00384, global_step=7350.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  34%|███▍      | 411/1208 [11:22<22:03,  1.66s/it, loss=0.091, v_num=0, train/loss_simple_step=0.0536, train/loss_vlb_step=0.000188, train/loss_step=0.0536, global_step=7350.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  34%|███▍      | 412/1208 [11:25<22:04,  1.66s/it, loss=0.091, v_num=0, train/loss_simple_step=0.0536, train/loss_vlb_step=0.000188, train/loss_step=0.0536, global_step=7350.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  34%|███▍      | 412/1208 [11:25<22:04,  1.66s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.000149, train/loss_step=0.0418, global_step=7350.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  34%|███▍      | 413/1208 [11:26<22:01,  1.66s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.000149, train/loss_step=0.0418, global_step=7350.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  34%|███▍      | 413/1208 [11:26<22:01,  1.66s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000634, train/loss_step=0.176, global_step=7351.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  34%|███▍      | 414/1208 [11:27<21:58,  1.66s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000634, train/loss_step=0.176, global_step=7351.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  34%|███▍      | 414/1208 [11:27<21:58,  1.66s/it, loss=0.109, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000817, train/loss_step=0.218, global_step=7351.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  34%|███▍      | 415/1208 [11:28<21:55,  1.66s/it, loss=0.109, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000817, train/loss_step=0.218, global_step=7351.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  34%|███▍      | 415/1208 [11:28<21:55,  1.66s/it, loss=0.114, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000788, train/loss_step=0.205, global_step=7351.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  34%|███▍      | 416/1208 [11:31<21:56,  1.66s/it, loss=0.114, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000788, train/loss_step=0.205, global_step=7351.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  34%|███▍      | 416/1208 [11:31<21:56,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.0014, train/loss_step=0.293, global_step=7351.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  35%|███▍      | 417/1208 [11:32<21:53,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.0014, train/loss_step=0.293, global_step=7351.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  35%|███▍      | 417/1208 [11:32<21:53,  1.66s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.000144, train/loss_step=0.0393, global_step=7352.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  35%|███▍      | 418/1208 [11:33<21:50,  1.66s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.000144, train/loss_step=0.0393, global_step=7352.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  35%|███▍      | 418/1208 [11:33<21:50,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00218, train/loss_step=0.369, global_step=7352.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  35%|███▍      | 419/1208 [11:34<21:47,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00218, train/loss_step=0.369, global_step=7352.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  35%|███▍      | 419/1208 [11:34<21:47,  1.66s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00269, train/loss_vlb_step=1.52e-5, train/loss_step=0.00269, global_step=7352.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  35%|███▍      | 420/1208 [11:37<21:48,  1.66s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00269, train/loss_vlb_step=1.52e-5, train/loss_step=0.00269, global_step=7352.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  35%|███▍      | 420/1208 [11:37<21:48,  1.66s/it, loss=0.11, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00112, train/loss_step=0.257, global_step=7352.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]     Epoch 24:  35%|███▍      | 421/1208 [11:38<21:45,  1.66s/it, loss=0.11, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00112, train/loss_step=0.257, global_step=7352.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  35%|███▍      | 421/1208 [11:38<21:45,  1.66s/it, loss=0.113, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000314, train/loss_step=0.095, global_step=7353.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  35%|███▍      | 422/1208 [11:39<21:42,  1.66s/it, loss=0.113, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000314, train/loss_step=0.095, global_step=7353.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  35%|███▍      | 422/1208 [11:39<21:42,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0707, train/loss_vlb_step=0.000248, train/loss_step=0.0707, global_step=7353.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  35%|███▌      | 423/1208 [11:40<21:40,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0707, train/loss_vlb_step=0.000248, train/loss_step=0.0707, global_step=7353.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  35%|███▌      | 423/1208 [11:40<21:40,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=2.66e-5, train/loss_step=0.00518, global_step=7353.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  35%|███▌      | 424/1208 [11:43<21:40,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=2.66e-5, train/loss_step=0.00518, global_step=7353.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  35%|███▌      | 424/1208 [11:43<21:40,  1.66s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.57e-5, train/loss_step=0.0212, global_step=7353.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  35%|███▌      | 425/1208 [11:44<21:37,  1.66s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.57e-5, train/loss_step=0.0212, global_step=7353.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  35%|███▌      | 425/1208 [11:44<21:37,  1.66s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=1.87e-5, train/loss_step=0.00326, global_step=7354.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  35%|███▌      | 426/1208 [11:45<21:34,  1.66s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=1.87e-5, train/loss_step=0.00326, global_step=7354.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  35%|███▌      | 426/1208 [11:45<21:34,  1.66s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.83e-5, train/loss_step=0.0154, global_step=7354.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  35%|███▌      | 427/1208 [11:46<21:32,  1.65s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.83e-5, train/loss_step=0.0154, global_step=7354.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  35%|███▌      | 427/1208 [11:46<21:32,  1.65s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000171, train/loss_step=0.0478, global_step=7354.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  35%|███▌      | 428/1208 [11:49<21:32,  1.66s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000171, train/loss_step=0.0478, global_step=7354.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  35%|███▌      | 428/1208 [11:49<21:32,  1.66s/it, loss=0.112, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000971, train/loss_step=0.239, global_step=7354.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  36%|███▌      | 429/1208 [11:50<21:29,  1.66s/it, loss=0.112, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000971, train/loss_step=0.239, global_step=7354.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  36%|███▌      | 429/1208 [11:50<21:29,  1.66s/it, loss=0.137, v_num=0, train/loss_simple_step=0.582, train/loss_vlb_step=0.0155, train/loss_step=0.582, global_step=7355.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  36%|███▌      | 430/1208 [11:51<21:27,  1.65s/it, loss=0.137, v_num=0, train/loss_simple_step=0.582, train/loss_vlb_step=0.0155, train/loss_step=0.582, global_step=7355.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  36%|███▌      | 430/1208 [11:51<21:27,  1.65s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0898, train/loss_vlb_step=0.000297, train/loss_step=0.0898, global_step=7355.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  36%|███▌      | 431/1208 [11:52<21:24,  1.65s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0898, train/loss_vlb_step=0.000297, train/loss_step=0.0898, global_step=7355.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  36%|███▌      | 431/1208 [11:52<21:24,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.64e-5, train/loss_step=0.0157, global_step=7355.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  36%|███▌      | 432/1208 [11:55<21:24,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.64e-5, train/loss_step=0.0157, global_step=7355.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  36%|███▌      | 432/1208 [11:55<21:24,  1.66s/it, loss=0.143, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000378, train/loss_step=0.114, global_step=7355.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  36%|███▌      | 433/1208 [11:56<21:21,  1.65s/it, loss=0.143, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000378, train/loss_step=0.114, global_step=7355.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  36%|███▌      | 433/1208 [11:56<21:21,  1.65s/it, loss=0.169, v_num=0, train/loss_simple_step=0.687, train/loss_vlb_step=0.0192, train/loss_step=0.687, global_step=7356.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  36%|███▌      | 434/1208 [11:57<21:19,  1.65s/it, loss=0.169, v_num=0, train/loss_simple_step=0.687, train/loss_vlb_step=0.0192, train/loss_step=0.687, global_step=7356.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  36%|███▌      | 434/1208 [11:57<21:19,  1.65s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0384, train/loss_vlb_step=0.000142, train/loss_step=0.0384, global_step=7356.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  36%|███▌      | 435/1208 [11:58<21:16,  1.65s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0384, train/loss_vlb_step=0.000142, train/loss_step=0.0384, global_step=7356.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  36%|███▌      | 435/1208 [11:58<21:16,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000696, train/loss_step=0.182, global_step=7356.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  36%|███▌      | 436/1208 [12:01<21:16,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000696, train/loss_step=0.182, global_step=7356.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  36%|███▌      | 436/1208 [12:01<21:16,  1.65s/it, loss=0.16, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00155, train/loss_step=0.319, global_step=7356.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  36%|███▌      | 437/1208 [12:02<21:14,  1.65s/it, loss=0.16, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00155, train/loss_step=0.319, global_step=7356.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  36%|███▌      | 437/1208 [12:02<21:14,  1.65s/it, loss=0.167, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000694, train/loss_step=0.194, global_step=7357.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  36%|███▋      | 438/1208 [12:03<21:11,  1.65s/it, loss=0.167, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000694, train/loss_step=0.194, global_step=7357.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  36%|███▋      | 438/1208 [12:03<21:11,  1.65s/it, loss=0.151, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.00012, train/loss_step=0.033, global_step=7357.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  36%|███▋      | 439/1208 [12:04<21:08,  1.65s/it, loss=0.151, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.00012, train/loss_step=0.033, global_step=7357.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  36%|███▋      | 439/1208 [12:04<21:08,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0331, train/loss_vlb_step=0.000129, train/loss_step=0.0331, global_step=7357.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  36%|███▋      | 440/1208 [12:07<21:08,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0331, train/loss_vlb_step=0.000129, train/loss_step=0.0331, global_step=7357.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  36%|███▋      | 440/1208 [12:07<21:08,  1.65s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0566, train/loss_vlb_step=0.000196, train/loss_step=0.0566, global_step=7357.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  37%|███▋      | 441/1208 [12:08<21:06,  1.65s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0566, train/loss_vlb_step=0.000196, train/loss_step=0.0566, global_step=7357.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  37%|███▋      | 441/1208 [12:08<21:06,  1.65s/it, loss=0.169, v_num=0, train/loss_simple_step=0.629, train/loss_vlb_step=0.0168, train/loss_step=0.629, global_step=7358.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  37%|███▋      | 442/1208 [12:09<21:03,  1.65s/it, loss=0.169, v_num=0, train/loss_simple_step=0.629, train/loss_vlb_step=0.0168, train/loss_step=0.629, global_step=7358.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  37%|███▋      | 442/1208 [12:09<21:03,  1.65s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.39e-5, train/loss_step=0.0242, global_step=7358.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  37%|███▋      | 443/1208 [12:10<21:00,  1.65s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.39e-5, train/loss_step=0.0242, global_step=7358.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  37%|███▋      | 443/1208 [12:10<21:00,  1.65s/it, loss=0.192, v_num=0, train/loss_simple_step=0.515, train/loss_vlb_step=0.00841, train/loss_step=0.515, global_step=7358.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  37%|███▋      | 444/1208 [12:12<21:01,  1.65s/it, loss=0.192, v_num=0, train/loss_simple_step=0.515, train/loss_vlb_step=0.00841, train/loss_step=0.515, global_step=7358.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  37%|███▋      | 444/1208 [12:12<21:01,  1.65s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.48e-5, train/loss_step=0.0121, global_step=7358.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  37%|███▋      | 445/1208 [12:13<20:58,  1.65s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.48e-5, train/loss_step=0.0121, global_step=7358.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  37%|███▋      | 445/1208 [12:13<20:58,  1.65s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=2.44e-5, train/loss_step=0.00451, global_step=7359.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  37%|███▋      | 446/1208 [12:14<20:55,  1.65s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=2.44e-5, train/loss_step=0.00451, global_step=7359.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  37%|███▋      | 446/1208 [12:14<20:55,  1.65s/it, loss=0.233, v_num=0, train/loss_simple_step=0.846, train/loss_vlb_step=0.143, train/loss_step=0.846, global_step=7359.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]      Epoch 24:  37%|███▋      | 447/1208 [12:15<20:52,  1.65s/it, loss=0.233, v_num=0, train/loss_simple_step=0.846, train/loss_vlb_step=0.143, train/loss_step=0.846, global_step=7359.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  37%|███▋      | 447/1208 [12:15<20:53,  1.65s/it, loss=0.235, v_num=0, train/loss_simple_step=0.0761, train/loss_vlb_step=0.00025, train/loss_step=0.0761, global_step=7359.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  37%|███▋      | 448/1208 [12:18<20:53,  1.65s/it, loss=0.235, v_num=0, train/loss_simple_step=0.0761, train/loss_vlb_step=0.00025, train/loss_step=0.0761, global_step=7359.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  37%|███▋      | 448/1208 [12:18<20:53,  1.65s/it, loss=0.241, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00397, train/loss_step=0.376, global_step=7359.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  37%|███▋      | 449/1208 [12:19<20:50,  1.65s/it, loss=0.241, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00397, train/loss_step=0.376, global_step=7359.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  37%|███▋      | 449/1208 [12:19<20:50,  1.65s/it, loss=0.216, v_num=0, train/loss_simple_step=0.0735, train/loss_vlb_step=0.000256, train/loss_step=0.0735, global_step=7360.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  37%|███▋      | 450/1208 [12:20<20:48,  1.65s/it, loss=0.216, v_num=0, train/loss_simple_step=0.0735, train/loss_vlb_step=0.000256, train/loss_step=0.0735, global_step=7360.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  37%|███▋      | 450/1208 [12:20<20:48,  1.65s/it, loss=0.222, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000799, train/loss_step=0.207, global_step=7360.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  37%|███▋      | 451/1208 [12:21<20:45,  1.65s/it, loss=0.222, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000799, train/loss_step=0.207, global_step=7360.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  37%|███▋      | 451/1208 [12:21<20:45,  1.65s/it, loss=0.221, v_num=0, train/loss_simple_step=0.00301, train/loss_vlb_step=1.71e-5, train/loss_step=0.00301, global_step=7360.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  37%|███▋      | 452/1208 [12:24<20:45,  1.65s/it, loss=0.221, v_num=0, train/loss_simple_step=0.00301, train/loss_vlb_step=1.71e-5, train/loss_step=0.00301, global_step=7360.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  37%|███▋      | 452/1208 [12:24<20:45,  1.65s/it, loss=0.216, v_num=0, train/loss_simple_step=0.00879, train/loss_vlb_step=4.19e-5, train/loss_step=0.00879, global_step=7360.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  38%|███▊      | 453/1208 [12:25<20:43,  1.65s/it, loss=0.216, v_num=0, train/loss_simple_step=0.00879, train/loss_vlb_step=4.19e-5, train/loss_step=0.00879, global_step=7360.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  38%|███▊      | 453/1208 [12:25<20:43,  1.65s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00415, train/loss_vlb_step=2.29e-5, train/loss_step=0.00415, global_step=7361.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  38%|███▊      | 454/1208 [12:26<20:40,  1.64s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00415, train/loss_vlb_step=2.29e-5, train/loss_step=0.00415, global_step=7361.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  38%|███▊      | 454/1208 [12:26<20:40,  1.64s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.56e-5, train/loss_step=0.00274, global_step=7361.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  38%|███▊      | 455/1208 [12:27<20:37,  1.64s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.56e-5, train/loss_step=0.00274, global_step=7361.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  38%|███▊      | 455/1208 [12:27<20:37,  1.64s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.95e-5, train/loss_step=0.0104, global_step=7361.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  38%|███▊      | 456/1208 [12:30<20:38,  1.65s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.95e-5, train/loss_step=0.0104, global_step=7361.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  38%|███▊      | 456/1208 [12:30<20:38,  1.65s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000121, train/loss_step=0.0317, global_step=7361.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  38%|███▊      | 457/1208 [12:31<20:35,  1.64s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000121, train/loss_step=0.0317, global_step=7361.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  38%|███▊      | 457/1208 [12:31<20:35,  1.64s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00621, train/loss_vlb_step=3.13e-5, train/loss_step=0.00621, global_step=7362.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  38%|███▊      | 458/1208 [12:32<20:32,  1.64s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00621, train/loss_vlb_step=3.13e-5, train/loss_step=0.00621, global_step=7362.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  38%|███▊      | 458/1208 [12:32<20:32,  1.64s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00604, train/loss_vlb_step=3.01e-5, train/loss_step=0.00604, global_step=7362.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  38%|███▊      | 459/1208 [12:33<20:29,  1.64s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00604, train/loss_vlb_step=3.01e-5, train/loss_step=0.00604, global_step=7362.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  38%|███▊      | 459/1208 [12:33<20:29,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00645, train/loss_vlb_step=3.23e-5, train/loss_step=0.00645, global_step=7362.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  38%|███▊      | 460/1208 [12:36<20:30,  1.64s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00645, train/loss_vlb_step=3.23e-5, train/loss_step=0.00645, global_step=7362.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  38%|███▊      | 460/1208 [12:36<20:30,  1.64s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000113, train/loss_step=0.0293, global_step=7362.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  38%|███▊      | 461/1208 [12:37<20:27,  1.64s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000113, train/loss_step=0.0293, global_step=7362.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  38%|███▊      | 461/1208 [12:37<20:27,  1.64s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0931, train/loss_vlb_step=0.000308, train/loss_step=0.0931, global_step=7363.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  38%|███▊      | 462/1208 [12:38<20:24,  1.64s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0931, train/loss_vlb_step=0.000308, train/loss_step=0.0931, global_step=7363.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  38%|███▊      | 462/1208 [12:38<20:24,  1.64s/it, loss=0.121, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=7363.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  38%|███▊      | 463/1208 [12:39<20:22,  1.64s/it, loss=0.121, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=7363.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  38%|███▊      | 463/1208 [12:39<20:22,  1.64s/it, loss=0.111, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00163, train/loss_step=0.300, global_step=7363.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  38%|███▊      | 464/1208 [12:42<20:22,  1.64s/it, loss=0.111, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00163, train/loss_step=0.300, global_step=7363.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  38%|███▊      | 464/1208 [12:42<20:22,  1.64s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.58e-5, train/loss_step=0.0028, global_step=7363.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  38%|███▊      | 465/1208 [12:43<20:20,  1.64s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.58e-5, train/loss_step=0.0028, global_step=7363.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  38%|███▊      | 465/1208 [12:43<20:20,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.461, train/loss_vlb_step=0.00356, train/loss_step=0.461, global_step=7364.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  39%|███▊      | 466/1208 [12:44<20:17,  1.64s/it, loss=0.133, v_num=0, train/loss_simple_step=0.461, train/loss_vlb_step=0.00356, train/loss_step=0.461, global_step=7364.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  39%|███▊      | 466/1208 [12:44<20:17,  1.64s/it, loss=0.0917, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=7.1e-5, train/loss_step=0.0164, global_step=7364.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  39%|███▊      | 467/1208 [12:45<20:14,  1.64s/it, loss=0.0917, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=7.1e-5, train/loss_step=0.0164, global_step=7364.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  39%|███▊      | 467/1208 [12:45<20:14,  1.64s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000387, train/loss_step=0.116, global_step=7364.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  39%|███▊      | 468/1208 [12:48<20:15,  1.64s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000387, train/loss_step=0.116, global_step=7364.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  39%|███▊      | 468/1208 [12:48<20:15,  1.64s/it, loss=0.075, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.44e-5, train/loss_step=0.00246, global_step=7364.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  39%|███▉      | 469/1208 [12:49<20:12,  1.64s/it, loss=0.075, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.44e-5, train/loss_step=0.00246, global_step=7364.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  39%|███▉      | 469/1208 [12:49<20:12,  1.64s/it, loss=0.0757, v_num=0, train/loss_simple_step=0.0878, train/loss_vlb_step=0.000294, train/loss_step=0.0878, global_step=7365.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  39%|███▉      | 470/1208 [12:50<20:09,  1.64s/it, loss=0.0757, v_num=0, train/loss_simple_step=0.0878, train/loss_vlb_step=0.000294, train/loss_step=0.0878, global_step=7365.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  39%|███▉      | 470/1208 [12:50<20:09,  1.64s/it, loss=0.0655, v_num=0, train/loss_simple_step=0.00329, train/loss_vlb_step=1.81e-5, train/loss_step=0.00329, global_step=7365.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  39%|███▉      | 471/1208 [12:51<20:07,  1.64s/it, loss=0.0655, v_num=0, train/loss_simple_step=0.00329, train/loss_vlb_step=1.81e-5, train/loss_step=0.00329, global_step=7365.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  39%|███▉      | 471/1208 [12:51<20:07,  1.64s/it, loss=0.0725, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.00047, train/loss_step=0.142, global_step=7365.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  39%|███▉      | 472/1208 [12:54<20:07,  1.64s/it, loss=0.0725, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.00047, train/loss_step=0.142, global_step=7365.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  39%|███▉      | 472/1208 [12:54<20:07,  1.64s/it, loss=0.0721, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=8.34e-6, train/loss_step=0.00139, global_step=7365.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  39%|███▉      | 473/1208 [12:55<20:04,  1.64s/it, loss=0.0721, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=8.34e-6, train/loss_step=0.00139, global_step=7365.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  39%|███▉      | 473/1208 [12:55<20:04,  1.64s/it, loss=0.0741, v_num=0, train/loss_simple_step=0.0442, train/loss_vlb_step=0.000158, train/loss_step=0.0442, global_step=7366.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  39%|███▉      | 474/1208 [12:56<20:02,  1.64s/it, loss=0.0741, v_num=0, train/loss_simple_step=0.0442, train/loss_vlb_step=0.000158, train/loss_step=0.0442, global_step=7366.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  39%|███▉      | 474/1208 [12:56<20:02,  1.64s/it, loss=0.075, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.31e-5, train/loss_step=0.0196, global_step=7366.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  39%|███▉      | 475/1208 [12:57<19:59,  1.64s/it, loss=0.075, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.31e-5, train/loss_step=0.0196, global_step=7366.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  39%|███▉      | 475/1208 [12:57<19:59,  1.64s/it, loss=0.0749, v_num=0, train/loss_simple_step=0.00916, train/loss_vlb_step=4.3e-5, train/loss_step=0.00916, global_step=7366.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  39%|███▉      | 476/1208 [13:00<19:59,  1.64s/it, loss=0.0749, v_num=0, train/loss_simple_step=0.00916, train/loss_vlb_step=4.3e-5, train/loss_step=0.00916, global_step=7366.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  39%|███▉      | 476/1208 [13:00<19:59,  1.64s/it, loss=0.0736, v_num=0, train/loss_simple_step=0.00542, train/loss_vlb_step=2.77e-5, train/loss_step=0.00542, global_step=7366.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  39%|███▉      | 477/1208 [13:01<19:57,  1.64s/it, loss=0.0736, v_num=0, train/loss_simple_step=0.00542, train/loss_vlb_step=2.77e-5, train/loss_step=0.00542, global_step=7366.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  39%|███▉      | 477/1208 [13:01<19:57,  1.64s/it, loss=0.0836, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000727, train/loss_step=0.207, global_step=7367.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  40%|███▉      | 478/1208 [13:02<19:54,  1.64s/it, loss=0.0836, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000727, train/loss_step=0.207, global_step=7367.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  40%|███▉      | 478/1208 [13:02<19:54,  1.64s/it, loss=0.0847, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000113, train/loss_step=0.0291, global_step=7367.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  40%|███▉      | 479/1208 [13:03<19:52,  1.64s/it, loss=0.0847, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000113, train/loss_step=0.0291, global_step=7367.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  40%|███▉      | 479/1208 [13:03<19:52,  1.64s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000975, train/loss_step=0.233, global_step=7367.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  40%|███▉      | 480/1208 [13:06<19:52,  1.64s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000975, train/loss_step=0.233, global_step=7367.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  40%|███▉      | 480/1208 [13:06<19:52,  1.64s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=2.22e-5, train/loss_step=0.00421, global_step=7367.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  40%|███▉      | 481/1208 [13:07<19:49,  1.64s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=2.22e-5, train/loss_step=0.00421, global_step=7367.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  40%|███▉      | 481/1208 [13:07<19:49,  1.64s/it, loss=0.102, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00101, train/loss_step=0.243, global_step=7368.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]     Epoch 24:  40%|███▉      | 482/1208 [13:08<19:47,  1.64s/it, loss=0.102, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00101, train/loss_step=0.243, global_step=7368.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  40%|███▉      | 482/1208 [13:08<19:47,  1.64s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.41e-5, train/loss_step=0.00246, global_step=7368.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  40%|███▉      | 483/1208 [13:09<19:44,  1.63s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.41e-5, train/loss_step=0.00246, global_step=7368.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  40%|███▉      | 483/1208 [13:09<19:44,  1.63s/it, loss=0.0904, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000623, train/loss_step=0.177, global_step=7368.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  40%|████      | 484/1208 [13:12<19:45,  1.64s/it, loss=0.0904, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000623, train/loss_step=0.177, global_step=7368.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  40%|████      | 484/1208 [13:12<19:45,  1.64s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000124, train/loss_step=0.0329, global_step=7368.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  40%|████      | 485/1208 [13:13<19:43,  1.64s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000124, train/loss_step=0.0329, global_step=7368.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  40%|████      | 485/1208 [13:13<19:43,  1.64s/it, loss=0.0692, v_num=0, train/loss_simple_step=0.00821, train/loss_vlb_step=3.87e-5, train/loss_step=0.00821, global_step=7369.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  40%|████      | 486/1208 [13:14<19:40,  1.64s/it, loss=0.0692, v_num=0, train/loss_simple_step=0.00821, train/loss_vlb_step=3.87e-5, train/loss_step=0.00821, global_step=7369.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  40%|████      | 486/1208 [13:14<19:40,  1.64s/it, loss=0.0777, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000678, train/loss_step=0.186, global_step=7369.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  40%|████      | 487/1208 [13:15<19:38,  1.63s/it, loss=0.0777, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000678, train/loss_step=0.186, global_step=7369.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  40%|████      | 487/1208 [13:15<19:38,  1.63s/it, loss=0.0771, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=7369.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  40%|████      | 488/1208 [13:18<19:38,  1.64s/it, loss=0.0771, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=7369.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  40%|████      | 488/1208 [13:18<19:38,  1.64s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.0023, train/loss_step=0.344, global_step=7369.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  40%|████      | 489/1208 [13:19<19:36,  1.64s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.0023, train/loss_step=0.344, global_step=7369.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  40%|████      | 489/1208 [13:19<19:36,  1.64s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.00726, train/loss_vlb_step=3.37e-5, train/loss_step=0.00726, global_step=7370.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  41%|████      | 490/1208 [13:20<19:33,  1.63s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.00726, train/loss_vlb_step=3.37e-5, train/loss_step=0.00726, global_step=7370.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  41%|████      | 490/1208 [13:20<19:33,  1.63s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000605, train/loss_step=0.168, global_step=7370.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  41%|████      | 491/1208 [13:21<19:31,  1.63s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000605, train/loss_step=0.168, global_step=7370.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  41%|████      | 491/1208 [13:21<19:31,  1.63s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.0957, train/loss_vlb_step=0.000316, train/loss_step=0.0957, global_step=7370.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  41%|████      | 492/1208 [13:25<19:31,  1.64s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.0957, train/loss_vlb_step=0.000316, train/loss_step=0.0957, global_step=7370.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  41%|████      | 492/1208 [13:25<19:31,  1.64s/it, loss=0.103, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000462, train/loss_step=0.140, global_step=7370.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  41%|████      | 493/1208 [13:26<19:29,  1.64s/it, loss=0.103, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000462, train/loss_step=0.140, global_step=7370.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  41%|████      | 493/1208 [13:26<19:29,  1.64s/it, loss=0.112, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000843, train/loss_step=0.228, global_step=7371.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  41%|████      | 494/1208 [13:27<19:26,  1.63s/it, loss=0.112, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000843, train/loss_step=0.228, global_step=7371.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  41%|████      | 494/1208 [13:27<19:26,  1.63s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=9.68e-6, train/loss_step=0.00161, global_step=7371.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  41%|████      | 495/1208 [13:28<19:24,  1.63s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=9.68e-6, train/loss_step=0.00161, global_step=7371.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  41%|████      | 495/1208 [13:28<19:24,  1.63s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0558, train/loss_vlb_step=0.0002, train/loss_step=0.0558, global_step=7371.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  41%|████      | 496/1208 [13:31<19:24,  1.64s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0558, train/loss_vlb_step=0.0002, train/loss_step=0.0558, global_step=7371.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  41%|████      | 496/1208 [13:31<19:24,  1.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00198, train/loss_step=0.371, global_step=7371.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  41%|████      | 497/1208 [13:32<19:22,  1.63s/it, loss=0.132, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00198, train/loss_step=0.371, global_step=7371.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  41%|████      | 497/1208 [13:32<19:22,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0384, train/loss_vlb_step=0.000143, train/loss_step=0.0384, global_step=7372.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  41%|████      | 498/1208 [13:33<19:19,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0384, train/loss_vlb_step=0.000143, train/loss_step=0.0384, global_step=7372.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  41%|████      | 498/1208 [13:33<19:19,  1.63s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=1.43e-5, train/loss_step=0.0025, global_step=7372.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  41%|████▏     | 499/1208 [13:34<19:17,  1.63s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=1.43e-5, train/loss_step=0.0025, global_step=7372.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  41%|████▏     | 499/1208 [13:34<19:17,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=7372.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  41%|████▏     | 500/1208 [13:37<19:17,  1.64s/it, loss=0.116, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=7372.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  41%|████▏     | 500/1208 [13:37<19:17,  1.64s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00442, train/loss_vlb_step=2.38e-5, train/loss_step=0.00442, global_step=7372.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  41%|████▏     | 501/1208 [13:38<19:15,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00442, train/loss_vlb_step=2.38e-5, train/loss_step=0.00442, global_step=7372.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  41%|████▏     | 501/1208 [13:38<19:15,  1.63s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0397, train/loss_vlb_step=0.000151, train/loss_step=0.0397, global_step=7373.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  42%|████▏     | 502/1208 [13:39<19:13,  1.63s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0397, train/loss_vlb_step=0.000151, train/loss_step=0.0397, global_step=7373.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  42%|████▏     | 502/1208 [13:39<19:13,  1.63s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000127, train/loss_step=0.0348, global_step=7373.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  42%|████▏     | 503/1208 [13:40<19:10,  1.63s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000127, train/loss_step=0.0348, global_step=7373.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  42%|████▏     | 503/1208 [13:40<19:10,  1.63s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0681, train/loss_vlb_step=0.000229, train/loss_step=0.0681, global_step=7373.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  42%|████▏     | 504/1208 [13:44<19:11,  1.64s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0681, train/loss_vlb_step=0.000229, train/loss_step=0.0681, global_step=7373.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  42%|████▏     | 504/1208 [13:44<19:11,  1.64s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0635, train/loss_vlb_step=0.000211, train/loss_step=0.0635, global_step=7373.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  42%|████▏     | 505/1208 [13:45<19:08,  1.63s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0635, train/loss_vlb_step=0.000211, train/loss_step=0.0635, global_step=7373.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  42%|████▏     | 505/1208 [13:45<19:08,  1.63s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00925, train/loss_vlb_step=4.25e-5, train/loss_step=0.00925, global_step=7374.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  42%|████▏     | 506/1208 [13:46<19:06,  1.63s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00925, train/loss_vlb_step=4.25e-5, train/loss_step=0.00925, global_step=7374.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  42%|████▏     | 506/1208 [13:46<19:06,  1.63s/it, loss=0.101, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000415, train/loss_step=0.126, global_step=7374.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  42%|████▏     | 507/1208 [13:47<19:03,  1.63s/it, loss=0.101, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000415, train/loss_step=0.126, global_step=7374.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  42%|████▏     | 507/1208 [13:47<19:03,  1.63s/it, loss=0.115, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00252, train/loss_step=0.392, global_step=7374.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  42%|████▏     | 508/1208 [13:50<19:04,  1.63s/it, loss=0.115, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00252, train/loss_step=0.392, global_step=7374.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  42%|████▏     | 508/1208 [13:50<19:04,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00217, train/loss_step=0.371, global_step=7374.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  42%|████▏     | 509/1208 [13:51<19:01,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00217, train/loss_step=0.371, global_step=7374.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  42%|████▏     | 509/1208 [13:51<19:01,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0985, train/loss_vlb_step=0.000324, train/loss_step=0.0985, global_step=7375.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  42%|████▏     | 510/1208 [13:52<18:59,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0985, train/loss_vlb_step=0.000324, train/loss_step=0.0985, global_step=7375.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  42%|████▏     | 510/1208 [13:52<18:59,  1.63s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000108, train/loss_step=0.0278, global_step=7375.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  42%|████▏     | 511/1208 [13:53<18:56,  1.63s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000108, train/loss_step=0.0278, global_step=7375.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  42%|████▏     | 511/1208 [13:53<18:56,  1.63s/it, loss=0.153, v_num=0, train/loss_simple_step=0.869, train/loss_vlb_step=0.437, train/loss_step=0.869, global_step=7375.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]     Epoch 24:  42%|████▏     | 512/1208 [13:56<18:57,  1.63s/it, loss=0.153, v_num=0, train/loss_simple_step=0.869, train/loss_vlb_step=0.437, train/loss_step=0.869, global_step=7375.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  42%|████▏     | 512/1208 [13:56<18:57,  1.63s/it, loss=0.169, v_num=0, train/loss_simple_step=0.475, train/loss_vlb_step=0.00738, train/loss_step=0.475, global_step=7375.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  42%|████▏     | 513/1208 [13:57<18:54,  1.63s/it, loss=0.169, v_num=0, train/loss_simple_step=0.475, train/loss_vlb_step=0.00738, train/loss_step=0.475, global_step=7375.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  42%|████▏     | 513/1208 [13:57<18:54,  1.63s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=2.45e-5, train/loss_step=0.00462, global_step=7376.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  43%|████▎     | 514/1208 [13:58<18:52,  1.63s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=2.45e-5, train/loss_step=0.00462, global_step=7376.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  43%|████▎     | 514/1208 [13:58<18:52,  1.63s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.05e-5, train/loss_step=0.0112, global_step=7376.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  43%|████▎     | 515/1208 [13:59<18:50,  1.63s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.05e-5, train/loss_step=0.0112, global_step=7376.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  43%|████▎     | 515/1208 [13:59<18:50,  1.63s/it, loss=0.161, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000367, train/loss_step=0.112, global_step=7376.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  43%|████▎     | 516/1208 [14:02<18:50,  1.63s/it, loss=0.161, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000367, train/loss_step=0.112, global_step=7376.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  43%|████▎     | 516/1208 [14:02<18:50,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=2.12e-5, train/loss_step=0.00378, global_step=7376.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  43%|████▎     | 517/1208 [14:04<18:48,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=2.12e-5, train/loss_step=0.00378, global_step=7376.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  43%|████▎     | 517/1208 [14:04<18:48,  1.63s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00393, train/loss_vlb_step=2.11e-5, train/loss_step=0.00393, global_step=7377.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  43%|████▎     | 518/1208 [14:05<18:45,  1.63s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00393, train/loss_vlb_step=2.11e-5, train/loss_step=0.00393, global_step=7377.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  43%|████▎     | 518/1208 [14:05<18:45,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000108, train/loss_step=0.0274, global_step=7377.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  43%|████▎     | 519/1208 [14:06<18:43,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000108, train/loss_step=0.0274, global_step=7377.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  43%|████▎     | 519/1208 [14:06<18:43,  1.63s/it, loss=0.15, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00109, train/loss_step=0.263, global_step=7377.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  43%|████▎     | 520/1208 [14:09<18:43,  1.63s/it, loss=0.15, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00109, train/loss_step=0.263, global_step=7377.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  43%|████▎     | 520/1208 [14:09<18:43,  1.63s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0718, train/loss_vlb_step=0.00024, train/loss_step=0.0718, global_step=7377.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  43%|████▎     | 521/1208 [14:10<18:41,  1.63s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0718, train/loss_vlb_step=0.00024, train/loss_step=0.0718, global_step=7377.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  43%|████▎     | 521/1208 [14:10<18:41,  1.63s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000102, train/loss_step=0.0267, global_step=7378.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  43%|████▎     | 522/1208 [14:11<18:38,  1.63s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000102, train/loss_step=0.0267, global_step=7378.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  43%|████▎     | 522/1208 [14:11<18:38,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=9.58e-5, train/loss_step=0.0244, global_step=7378.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  43%|████▎     | 523/1208 [14:12<18:36,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=9.58e-5, train/loss_step=0.0244, global_step=7378.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  43%|████▎     | 523/1208 [14:12<18:36,  1.63s/it, loss=0.16, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000798, train/loss_step=0.214, global_step=7378.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  43%|████▎     | 524/1208 [14:15<18:36,  1.63s/it, loss=0.16, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000798, train/loss_step=0.214, global_step=7378.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  43%|████▎     | 524/1208 [14:15<18:36,  1.63s/it, loss=0.178, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00325, train/loss_step=0.433, global_step=7378.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  43%|████▎     | 525/1208 [14:16<18:34,  1.63s/it, loss=0.178, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00325, train/loss_step=0.433, global_step=7378.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  43%|████▎     | 525/1208 [14:16<18:34,  1.63s/it, loss=0.179, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=0.000102, train/loss_step=0.025, global_step=7379.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  44%|████▎     | 526/1208 [14:17<18:31,  1.63s/it, loss=0.179, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=0.000102, train/loss_step=0.025, global_step=7379.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  44%|████▎     | 526/1208 [14:17<18:31,  1.63s/it, loss=0.182, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000629, train/loss_step=0.183, global_step=7379.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  44%|████▎     | 527/1208 [14:18<18:29,  1.63s/it, loss=0.182, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000629, train/loss_step=0.183, global_step=7379.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  44%|████▎     | 527/1208 [14:18<18:29,  1.63s/it, loss=0.173, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000832, train/loss_step=0.220, global_step=7379.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  44%|████▎     | 528/1208 [14:21<18:30,  1.63s/it, loss=0.173, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000832, train/loss_step=0.220, global_step=7379.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  44%|████▎     | 528/1208 [14:21<18:30,  1.63s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0375, train/loss_vlb_step=0.000135, train/loss_step=0.0375, global_step=7379.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  44%|████▍     | 529/1208 [14:22<18:27,  1.63s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0375, train/loss_vlb_step=0.000135, train/loss_step=0.0375, global_step=7379.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  44%|████▍     | 529/1208 [14:22<18:27,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00592, train/loss_vlb_step=3.02e-5, train/loss_step=0.00592, global_step=7380.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  44%|████▍     | 530/1208 [14:24<18:25,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00592, train/loss_vlb_step=3.02e-5, train/loss_step=0.00592, global_step=7380.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  44%|████▍     | 530/1208 [14:24<18:25,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000113, train/loss_step=0.0279, global_step=7380.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  44%|████▍     | 531/1208 [14:25<18:22,  1.63s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000113, train/loss_step=0.0279, global_step=7380.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  44%|████▍     | 531/1208 [14:25<18:22,  1.63s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000139, train/loss_step=0.0353, global_step=7380.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  44%|████▍     | 532/1208 [14:28<18:23,  1.63s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000139, train/loss_step=0.0353, global_step=7380.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  44%|████▍     | 532/1208 [14:28<18:23,  1.63s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000147, train/loss_step=0.0399, global_step=7380.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  44%|████▍     | 533/1208 [14:29<18:20,  1.63s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000147, train/loss_step=0.0399, global_step=7380.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  44%|████▍     | 533/1208 [14:29<18:20,  1.63s/it, loss=0.104, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00159, train/loss_step=0.320, global_step=7381.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  44%|████▍     | 534/1208 [14:30<18:18,  1.63s/it, loss=0.104, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00159, train/loss_step=0.320, global_step=7381.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  44%|████▍     | 534/1208 [14:30<18:18,  1.63s/it, loss=0.111, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000461, train/loss_step=0.140, global_step=7381.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  44%|████▍     | 535/1208 [14:31<18:16,  1.63s/it, loss=0.111, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000461, train/loss_step=0.140, global_step=7381.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  44%|████▍     | 535/1208 [14:31<18:16,  1.63s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=2.19e-5, train/loss_step=0.00416, global_step=7381.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  44%|████▍     | 536/1208 [14:34<18:16,  1.63s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=2.19e-5, train/loss_step=0.00416, global_step=7381.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  44%|████▍     | 536/1208 [14:34<18:16,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0747, train/loss_vlb_step=0.000249, train/loss_step=0.0747, global_step=7381.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  44%|████▍     | 537/1208 [14:35<18:14,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0747, train/loss_vlb_step=0.000249, train/loss_step=0.0747, global_step=7381.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  44%|████▍     | 537/1208 [14:35<18:14,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00159, train/loss_vlb_step=9.71e-6, train/loss_step=0.00159, global_step=7382.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  45%|████▍     | 538/1208 [14:36<18:11,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00159, train/loss_vlb_step=9.71e-6, train/loss_step=0.00159, global_step=7382.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  45%|████▍     | 538/1208 [14:36<18:11,  1.63s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.000175, train/loss_step=0.0483, global_step=7382.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  45%|████▍     | 539/1208 [14:37<18:09,  1.63s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.000175, train/loss_step=0.0483, global_step=7382.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  45%|████▍     | 539/1208 [14:37<18:09,  1.63s/it, loss=0.103, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000428, train/loss_step=0.130, global_step=7382.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  45%|████▍     | 540/1208 [14:40<18:09,  1.63s/it, loss=0.103, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000428, train/loss_step=0.130, global_step=7382.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  45%|████▍     | 540/1208 [14:40<18:09,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000678, train/loss_step=0.184, global_step=7382.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  45%|████▍     | 541/1208 [14:41<18:07,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000678, train/loss_step=0.184, global_step=7382.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  45%|████▍     | 541/1208 [14:41<18:07,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00106, train/loss_step=0.278, global_step=7383.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  45%|████▍     | 542/1208 [14:42<18:04,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00106, train/loss_step=0.278, global_step=7383.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  45%|████▍     | 542/1208 [14:42<18:04,  1.63s/it, loss=0.12, v_num=0, train/loss_simple_step=0.008, train/loss_vlb_step=3.84e-5, train/loss_step=0.008, global_step=7383.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  45%|████▍     | 543/1208 [14:43<18:02,  1.63s/it, loss=0.12, v_num=0, train/loss_simple_step=0.008, train/loss_vlb_step=3.84e-5, train/loss_step=0.008, global_step=7383.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  45%|████▍     | 543/1208 [14:43<18:02,  1.63s/it, loss=0.131, v_num=0, train/loss_simple_step=0.421, train/loss_vlb_step=0.00466, train/loss_step=0.421, global_step=7383.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  45%|████▌     | 544/1208 [14:47<18:02,  1.63s/it, loss=0.131, v_num=0, train/loss_simple_step=0.421, train/loss_vlb_step=0.00466, train/loss_step=0.421, global_step=7383.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  45%|████▌     | 544/1208 [14:47<18:02,  1.63s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0882, train/loss_vlb_step=0.000292, train/loss_step=0.0882, global_step=7383.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  45%|████▌     | 545/1208 [14:48<18:00,  1.63s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0882, train/loss_vlb_step=0.000292, train/loss_step=0.0882, global_step=7383.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  45%|████▌     | 545/1208 [14:48<18:00,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000846, train/loss_step=0.212, global_step=7384.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  45%|████▌     | 546/1208 [14:49<17:58,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000846, train/loss_step=0.212, global_step=7384.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  45%|████▌     | 546/1208 [14:49<17:58,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.00048, train/loss_step=0.143, global_step=7384.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  45%|████▌     | 547/1208 [14:50<17:55,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.00048, train/loss_step=0.143, global_step=7384.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  45%|████▌     | 547/1208 [14:50<17:55,  1.63s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.39e-5, train/loss_step=0.0228, global_step=7384.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  45%|████▌     | 548/1208 [14:53<17:56,  1.63s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.39e-5, train/loss_step=0.0228, global_step=7384.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  45%|████▌     | 548/1208 [14:53<17:56,  1.63s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.92e-5, train/loss_step=0.0162, global_step=7384.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  45%|████▌     | 549/1208 [14:54<17:53,  1.63s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.92e-5, train/loss_step=0.0162, global_step=7384.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  45%|████▌     | 549/1208 [14:54<17:53,  1.63s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.81e-5, train/loss_step=0.0103, global_step=7385.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  46%|████▌     | 550/1208 [14:55<17:51,  1.63s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.81e-5, train/loss_step=0.0103, global_step=7385.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  46%|████▌     | 550/1208 [14:55<17:51,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00488, train/loss_vlb_step=2.53e-5, train/loss_step=0.00488, global_step=7385.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  46%|████▌     | 551/1208 [14:56<17:49,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00488, train/loss_vlb_step=2.53e-5, train/loss_step=0.00488, global_step=7385.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  46%|████▌     | 551/1208 [14:56<17:49,  1.63s/it, loss=0.125, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00191, train/loss_step=0.347, global_step=7385.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  46%|████▌     | 552/1208 [14:59<17:49,  1.63s/it, loss=0.125, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00191, train/loss_step=0.347, global_step=7385.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  46%|████▌     | 552/1208 [14:59<17:49,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.52e-5, train/loss_step=0.0028, global_step=7385.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  46%|████▌     | 553/1208 [15:00<17:46,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.52e-5, train/loss_step=0.0028, global_step=7385.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  46%|████▌     | 553/1208 [15:00<17:46,  1.63s/it, loss=0.126, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.00313, train/loss_step=0.382, global_step=7386.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  46%|████▌     | 554/1208 [15:01<17:44,  1.63s/it, loss=0.126, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.00313, train/loss_step=0.382, global_step=7386.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  46%|████▌     | 554/1208 [15:01<17:44,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0421, train/loss_vlb_step=0.00015, train/loss_step=0.0421, global_step=7386.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  46%|████▌     | 555/1208 [15:02<17:42,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0421, train/loss_vlb_step=0.00015, train/loss_step=0.0421, global_step=7386.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  46%|████▌     | 555/1208 [15:02<17:42,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.44e-5, train/loss_step=0.0121, global_step=7386.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  46%|████▌     | 556/1208 [15:06<17:42,  1.63s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.44e-5, train/loss_step=0.0121, global_step=7386.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  46%|████▌     | 556/1208 [15:06<17:42,  1.63s/it, loss=0.128, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000787, train/loss_step=0.202, global_step=7386.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  46%|████▌     | 557/1208 [15:07<17:40,  1.63s/it, loss=0.128, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000787, train/loss_step=0.202, global_step=7386.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  46%|████▌     | 557/1208 [15:07<17:40,  1.63s/it, loss=0.134, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000454, train/loss_step=0.133, global_step=7387.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  46%|████▌     | 558/1208 [15:08<17:37,  1.63s/it, loss=0.134, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000454, train/loss_step=0.133, global_step=7387.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  46%|████▌     | 558/1208 [15:08<17:37,  1.63s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.05e-5, train/loss_step=0.00175, global_step=7387.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  46%|████▋     | 559/1208 [15:09<17:35,  1.63s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.05e-5, train/loss_step=0.00175, global_step=7387.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  46%|████▋     | 559/1208 [15:09<17:35,  1.63s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0857, train/loss_vlb_step=0.000285, train/loss_step=0.0857, global_step=7387.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  46%|████▋     | 560/1208 [15:12<17:35,  1.63s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0857, train/loss_vlb_step=0.000285, train/loss_step=0.0857, global_step=7387.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  46%|████▋     | 560/1208 [15:12<17:35,  1.63s/it, loss=0.128, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000514, train/loss_step=0.154, global_step=7387.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  46%|████▋     | 561/1208 [15:13<17:33,  1.63s/it, loss=0.128, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000514, train/loss_step=0.154, global_step=7387.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  46%|████▋     | 561/1208 [15:13<17:33,  1.63s/it, loss=0.117, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.000171, train/loss_step=0.048, global_step=7388.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  47%|████▋     | 562/1208 [15:14<17:31,  1.63s/it, loss=0.117, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.000171, train/loss_step=0.048, global_step=7388.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  47%|████▋     | 562/1208 [15:14<17:31,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000491, train/loss_step=0.149, global_step=7388.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  47%|████▋     | 563/1208 [15:15<17:28,  1.63s/it, loss=0.124, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000491, train/loss_step=0.149, global_step=7388.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  47%|████▋     | 563/1208 [15:15<17:28,  1.63s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.9e-5, train/loss_step=0.00344, global_step=7388.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  47%|████▋     | 564/1208 [15:18<17:29,  1.63s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.9e-5, train/loss_step=0.00344, global_step=7388.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  47%|████▋     | 564/1208 [15:18<17:29,  1.63s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0375, train/loss_vlb_step=0.000141, train/loss_step=0.0375, global_step=7388.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  47%|████▋     | 565/1208 [15:19<17:26,  1.63s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0375, train/loss_vlb_step=0.000141, train/loss_step=0.0375, global_step=7388.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  47%|████▋     | 565/1208 [15:19<17:26,  1.63s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=7389.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  47%|████▋     | 566/1208 [15:20<17:24,  1.63s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=7389.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  47%|████▋     | 566/1208 [15:20<17:24,  1.63s/it, loss=0.0892, v_num=0, train/loss_simple_step=0.00493, train/loss_vlb_step=2.5e-5, train/loss_step=0.00493, global_step=7389.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  47%|████▋     | 567/1208 [15:21<17:22,  1.63s/it, loss=0.0892, v_num=0, train/loss_simple_step=0.00493, train/loss_vlb_step=2.5e-5, train/loss_step=0.00493, global_step=7389.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  47%|████▋     | 567/1208 [15:21<17:22,  1.63s/it, loss=0.0898, v_num=0, train/loss_simple_step=0.0355, train/loss_vlb_step=0.000136, train/loss_step=0.0355, global_step=7389.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  47%|████▋     | 568/1208 [15:25<17:22,  1.63s/it, loss=0.0898, v_num=0, train/loss_simple_step=0.0355, train/loss_vlb_step=0.000136, train/loss_step=0.0355, global_step=7389.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  47%|████▋     | 568/1208 [15:25<17:22,  1.63s/it, loss=0.107, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00274, train/loss_step=0.365, global_step=7389.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  47%|████▋     | 569/1208 [15:26<17:20,  1.63s/it, loss=0.107, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00274, train/loss_step=0.365, global_step=7389.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  47%|████▋     | 569/1208 [15:26<17:20,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0538, train/loss_vlb_step=0.000186, train/loss_step=0.0538, global_step=7390.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  47%|████▋     | 570/1208 [15:27<17:17,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0538, train/loss_vlb_step=0.000186, train/loss_step=0.0538, global_step=7390.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  47%|████▋     | 570/1208 [15:27<17:17,  1.63s/it, loss=0.117, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000529, train/loss_step=0.152, global_step=7390.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  47%|████▋     | 571/1208 [15:28<17:15,  1.63s/it, loss=0.117, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000529, train/loss_step=0.152, global_step=7390.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  47%|████▋     | 571/1208 [15:28<17:15,  1.63s/it, loss=0.112, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00102, train/loss_step=0.245, global_step=7390.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  47%|████▋     | 572/1208 [15:31<17:15,  1.63s/it, loss=0.112, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00102, train/loss_step=0.245, global_step=7390.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  47%|████▋     | 572/1208 [15:31<17:15,  1.63s/it, loss=0.126, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00141, train/loss_step=0.297, global_step=7390.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  47%|████▋     | 573/1208 [15:32<17:13,  1.63s/it, loss=0.126, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00141, train/loss_step=0.297, global_step=7390.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  47%|████▋     | 573/1208 [15:32<17:13,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.000143, train/loss_step=0.0394, global_step=7391.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  48%|████▊     | 574/1208 [15:33<17:11,  1.63s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.000143, train/loss_step=0.0394, global_step=7391.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  48%|████▊     | 574/1208 [15:33<17:11,  1.63s/it, loss=0.115, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000571, train/loss_step=0.158, global_step=7391.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  48%|████▊     | 575/1208 [15:34<17:08,  1.63s/it, loss=0.115, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000571, train/loss_step=0.158, global_step=7391.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  48%|████▊     | 575/1208 [15:34<17:08,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.00013, train/loss_step=0.033, global_step=7391.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  48%|████▊     | 576/1208 [15:37<17:08,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.00013, train/loss_step=0.033, global_step=7391.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  48%|████▊     | 576/1208 [15:37<17:08,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000739, train/loss_step=0.206, global_step=7391.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  48%|████▊     | 577/1208 [15:38<17:06,  1.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000739, train/loss_step=0.206, global_step=7391.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  48%|████▊     | 577/1208 [15:38<17:06,  1.63s/it, loss=0.13, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00345, train/loss_step=0.412, global_step=7392.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  48%|████▊     | 578/1208 [15:39<17:04,  1.63s/it, loss=0.13, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00345, train/loss_step=0.412, global_step=7392.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  48%|████▊     | 578/1208 [15:39<17:04,  1.63s/it, loss=0.141, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000794, train/loss_step=0.214, global_step=7392.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  48%|████▊     | 579/1208 [15:40<17:02,  1.62s/it, loss=0.141, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000794, train/loss_step=0.214, global_step=7392.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  48%|████▊     | 579/1208 [15:40<17:02,  1.62s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.22e-5, train/loss_step=0.0228, global_step=7392.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  48%|████▊     | 580/1208 [15:43<17:02,  1.63s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.22e-5, train/loss_step=0.0228, global_step=7392.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  48%|████▊     | 580/1208 [15:43<17:02,  1.63s/it, loss=0.15, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00434, train/loss_step=0.405, global_step=7392.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  48%|████▊     | 581/1208 [15:45<16:59,  1.63s/it, loss=0.15, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00434, train/loss_step=0.405, global_step=7392.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  48%|████▊     | 581/1208 [15:45<16:59,  1.63s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.000198, train/loss_step=0.0556, global_step=7393.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  48%|████▊     | 582/1208 [15:46<16:57,  1.63s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.000198, train/loss_step=0.0556, global_step=7393.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  48%|████▊     | 582/1208 [15:46<16:57,  1.63s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00812, train/loss_vlb_step=4.02e-5, train/loss_step=0.00812, global_step=7393.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  48%|████▊     | 583/1208 [15:47<16:55,  1.62s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00812, train/loss_vlb_step=4.02e-5, train/loss_step=0.00812, global_step=7393.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  48%|████▊     | 583/1208 [15:47<16:55,  1.62s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000115, train/loss_step=0.0295, global_step=7393.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  48%|████▊     | 584/1208 [15:50<16:55,  1.63s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000115, train/loss_step=0.0295, global_step=7393.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  48%|████▊     | 584/1208 [15:50<16:55,  1.63s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0902, train/loss_vlb_step=0.000297, train/loss_step=0.0902, global_step=7393.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  48%|████▊     | 585/1208 [15:51<16:53,  1.63s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0902, train/loss_vlb_step=0.000297, train/loss_step=0.0902, global_step=7393.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  48%|████▊     | 585/1208 [15:51<16:53,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000108, train/loss_step=0.0277, global_step=7394.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  49%|████▊     | 586/1208 [15:52<16:50,  1.63s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000108, train/loss_step=0.0277, global_step=7394.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  49%|████▊     | 586/1208 [15:52<16:50,  1.63s/it, loss=0.149, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000403, train/loss_step=0.120, global_step=7394.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  49%|████▊     | 587/1208 [15:53<16:48,  1.62s/it, loss=0.149, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000403, train/loss_step=0.120, global_step=7394.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  49%|████▊     | 587/1208 [15:53<16:48,  1.62s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00339, train/loss_vlb_step=1.85e-5, train/loss_step=0.00339, global_step=7394.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  49%|████▊     | 588/1208 [15:56<16:48,  1.63s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00339, train/loss_vlb_step=1.85e-5, train/loss_step=0.00339, global_step=7394.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  49%|████▊     | 588/1208 [15:56<16:48,  1.63s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.2e-5, train/loss_step=0.0116, global_step=7394.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  49%|████▉     | 589/1208 [15:57<16:46,  1.63s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.2e-5, train/loss_step=0.0116, global_step=7394.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  49%|████▉     | 589/1208 [15:57<16:46,  1.63s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=0.000101, train/loss_step=0.0259, global_step=7395.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  49%|████▉     | 590/1208 [15:58<16:44,  1.63s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=0.000101, train/loss_step=0.0259, global_step=7395.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  49%|████▉     | 590/1208 [15:58<16:44,  1.63s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0585, train/loss_vlb_step=0.000201, train/loss_step=0.0585, global_step=7395.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  49%|████▉     | 591/1208 [15:59<16:42,  1.62s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0585, train/loss_vlb_step=0.000201, train/loss_step=0.0585, global_step=7395.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  49%|████▉     | 591/1208 [15:59<16:42,  1.62s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000102, train/loss_step=0.0266, global_step=7395.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  49%|████▉     | 592/1208 [16:03<16:42,  1.63s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.000102, train/loss_step=0.0266, global_step=7395.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  49%|████▉     | 592/1208 [16:03<16:42,  1.63s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.07e-5, train/loss_step=0.00178, global_step=7395.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  49%|████▉     | 593/1208 [16:04<16:39,  1.63s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.07e-5, train/loss_step=0.00178, global_step=7395.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  49%|████▉     | 593/1208 [16:04<16:39,  1.63s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.54e-5, train/loss_step=0.00278, global_step=7396.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  49%|████▉     | 594/1208 [16:05<16:37,  1.62s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.54e-5, train/loss_step=0.00278, global_step=7396.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  49%|████▉     | 594/1208 [16:05<16:37,  1.62s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.000172, train/loss_step=0.0489, global_step=7396.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  49%|████▉     | 595/1208 [16:06<16:35,  1.62s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.000172, train/loss_step=0.0489, global_step=7396.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  49%|████▉     | 595/1208 [16:06<16:35,  1.62s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.0608, train/loss_vlb_step=0.000204, train/loss_step=0.0608, global_step=7396.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  49%|████▉     | 596/1208 [16:09<16:35,  1.63s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.0608, train/loss_vlb_step=0.000204, train/loss_step=0.0608, global_step=7396.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  49%|████▉     | 596/1208 [16:09<16:35,  1.63s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00172, train/loss_step=0.324, global_step=7396.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  49%|████▉     | 597/1208 [16:10<16:33,  1.63s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00172, train/loss_step=0.324, global_step=7396.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  49%|████▉     | 597/1208 [16:10<16:33,  1.63s/it, loss=0.0776, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.59e-5, train/loss_step=0.0153, global_step=7397.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  50%|████▉     | 598/1208 [16:11<16:30,  1.62s/it, loss=0.0776, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.59e-5, train/loss_step=0.0153, global_step=7397.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  50%|████▉     | 598/1208 [16:11<16:30,  1.62s/it, loss=0.0702, v_num=0, train/loss_simple_step=0.0662, train/loss_vlb_step=0.000226, train/loss_step=0.0662, global_step=7397.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  50%|████▉     | 599/1208 [16:12<16:28,  1.62s/it, loss=0.0702, v_num=0, train/loss_simple_step=0.0662, train/loss_vlb_step=0.000226, train/loss_step=0.0662, global_step=7397.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  50%|████▉     | 599/1208 [16:12<16:28,  1.62s/it, loss=0.0887, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00309, train/loss_step=0.392, global_step=7397.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  50%|████▉     | 600/1208 [16:15<16:28,  1.63s/it, loss=0.0887, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00309, train/loss_step=0.392, global_step=7397.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  50%|████▉     | 600/1208 [16:15<16:28,  1.63s/it, loss=0.0809, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00105, train/loss_step=0.249, global_step=7397.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.77it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.82it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.76it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.80it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.77it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.80it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 24:  50%|████▉     | 601/1208 [16:46<16:56,  1.67s/it, loss=0.0809, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00105, train/loss_step=0.249, global_step=7397.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  50%|████▉     | 601/1208 [16:46<16:56,  1.67s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000973, train/loss_step=0.248, global_step=7398.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  50%|████▉     | 602/1208 [16:47<16:54,  1.67s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000973, train/loss_step=0.248, global_step=7398.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  50%|████▉     | 602/1208 [16:47<16:54,  1.67s/it, loss=0.099, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000613, train/loss_step=0.177, global_step=7398.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  50%|████▉     | 603/1208 [16:48<16:51,  1.67s/it, loss=0.099, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000613, train/loss_step=0.177, global_step=7398.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  50%|████▉     | 603/1208 [16:48<16:51,  1.67s/it, loss=0.113, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.0012, train/loss_step=0.308, global_step=7398.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  50%|█████     | 604/1208 [16:51<16:51,  1.67s/it, loss=0.113, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.0012, train/loss_step=0.308, global_step=7398.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  50%|█████     | 604/1208 [16:51<16:51,  1.67s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000139, train/loss_step=0.0374, global_step=7398.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  50%|█████     | 605/1208 [16:52<16:49,  1.67s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000139, train/loss_step=0.0374, global_step=7398.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  50%|█████     | 605/1208 [16:52<16:49,  1.67s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.89e-5, train/loss_step=0.00335, global_step=7399.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  50%|█████     | 606/1208 [16:53<16:46,  1.67s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.89e-5, train/loss_step=0.00335, global_step=7399.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  50%|█████     | 606/1208 [16:53<16:47,  1.67s/it, loss=0.109, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000403, train/loss_step=0.122, global_step=7399.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  50%|█████     | 607/1208 [16:54<16:44,  1.67s/it, loss=0.109, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000403, train/loss_step=0.122, global_step=7399.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  50%|█████     | 607/1208 [16:54<16:44,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00312, train/loss_step=0.439, global_step=7399.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  50%|█████     | 608/1208 [16:57<16:44,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00312, train/loss_step=0.439, global_step=7399.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  50%|█████     | 608/1208 [16:57<16:44,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000572, train/loss_step=0.159, global_step=7399.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  50%|█████     | 609/1208 [16:58<16:42,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000572, train/loss_step=0.159, global_step=7399.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  50%|█████     | 609/1208 [16:59<16:42,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.79e-5, train/loss_step=0.0106, global_step=7400.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  50%|█████     | 610/1208 [17:00<16:39,  1.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.79e-5, train/loss_step=0.0106, global_step=7400.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  50%|█████     | 610/1208 [17:00<16:39,  1.67s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.39e-5, train/loss_step=0.00247, global_step=7400.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  51%|█████     | 611/1208 [17:01<16:37,  1.67s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.39e-5, train/loss_step=0.00247, global_step=7400.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  51%|█████     | 611/1208 [17:01<16:37,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000935, train/loss_step=0.226, global_step=7400.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  51%|█████     | 612/1208 [17:04<16:37,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000935, train/loss_step=0.226, global_step=7400.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  51%|█████     | 612/1208 [17:04<16:37,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000502, train/loss_step=0.151, global_step=7400.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  51%|█████     | 613/1208 [17:05<16:35,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000502, train/loss_step=0.151, global_step=7400.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  51%|█████     | 613/1208 [17:05<16:35,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0515, train/loss_vlb_step=0.000178, train/loss_step=0.0515, global_step=7401.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  51%|█████     | 614/1208 [17:06<16:32,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0515, train/loss_vlb_step=0.000178, train/loss_step=0.0515, global_step=7401.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  51%|█████     | 614/1208 [17:06<16:32,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.26e-5, train/loss_step=0.0228, global_step=7401.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  51%|█████     | 615/1208 [17:07<16:30,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.26e-5, train/loss_step=0.0228, global_step=7401.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  51%|█████     | 615/1208 [17:07<16:30,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0959, train/loss_vlb_step=0.000315, train/loss_step=0.0959, global_step=7401.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  51%|█████     | 616/1208 [17:10<16:30,  1.67s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0959, train/loss_vlb_step=0.000315, train/loss_step=0.0959, global_step=7401.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  51%|█████     | 616/1208 [17:10<16:30,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0414, train/loss_vlb_step=0.000145, train/loss_step=0.0414, global_step=7401.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  51%|█████     | 617/1208 [17:11<16:28,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0414, train/loss_vlb_step=0.000145, train/loss_step=0.0414, global_step=7401.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  51%|█████     | 617/1208 [17:11<16:28,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000358, train/loss_step=0.107, global_step=7402.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  51%|█████     | 618/1208 [17:12<16:25,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000358, train/loss_step=0.107, global_step=7402.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  51%|█████     | 618/1208 [17:12<16:25,  1.67s/it, loss=0.188, v_num=0, train/loss_simple_step=0.922, train/loss_vlb_step=0.464, train/loss_step=0.922, global_step=7402.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  51%|█████     | 619/1208 [17:13<16:23,  1.67s/it, loss=0.188, v_num=0, train/loss_simple_step=0.922, train/loss_vlb_step=0.464, train/loss_step=0.922, global_step=7402.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  51%|█████     | 619/1208 [17:13<16:23,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.000108, train/loss_step=0.0276, global_step=7402.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  51%|█████▏    | 620/1208 [17:16<16:23,  1.67s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.000108, train/loss_step=0.0276, global_step=7402.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  51%|█████▏    | 620/1208 [17:16<16:23,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000774, train/loss_step=0.212, global_step=7402.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  51%|█████▏    | 621/1208 [17:17<16:21,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000774, train/loss_step=0.212, global_step=7402.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  51%|█████▏    | 621/1208 [17:17<16:21,  1.67s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0619, train/loss_vlb_step=0.000214, train/loss_step=0.0619, global_step=7403.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  51%|█████▏    | 622/1208 [17:18<16:18,  1.67s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0619, train/loss_vlb_step=0.000214, train/loss_step=0.0619, global_step=7403.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  51%|█████▏    | 622/1208 [17:18<16:18,  1.67s/it, loss=0.159, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000636, train/loss_step=0.176, global_step=7403.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  52%|█████▏    | 623/1208 [17:19<16:16,  1.67s/it, loss=0.159, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000636, train/loss_step=0.176, global_step=7403.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  52%|█████▏    | 623/1208 [17:19<16:16,  1.67s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00338, train/loss_vlb_step=1.87e-5, train/loss_step=0.00338, global_step=7403.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  52%|█████▏    | 624/1208 [17:23<16:16,  1.67s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00338, train/loss_vlb_step=1.87e-5, train/loss_step=0.00338, global_step=7403.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  52%|█████▏    | 624/1208 [17:23<16:16,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000736, train/loss_step=0.205, global_step=7403.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  52%|█████▏    | 625/1208 [17:24<16:14,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000736, train/loss_step=0.205, global_step=7403.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  52%|█████▏    | 625/1208 [17:24<16:14,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=7404.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  52%|█████▏    | 626/1208 [17:25<16:11,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=7404.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  52%|█████▏    | 626/1208 [17:25<16:11,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000119, train/loss_step=0.0306, global_step=7404.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  52%|█████▏    | 627/1208 [17:26<16:09,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000119, train/loss_step=0.0306, global_step=7404.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  52%|█████▏    | 627/1208 [17:26<16:09,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.78e-5, train/loss_step=0.00311, global_step=7404.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  52%|█████▏    | 628/1208 [17:29<16:09,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.78e-5, train/loss_step=0.00311, global_step=7404.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  52%|█████▏    | 628/1208 [17:29<16:09,  1.67s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0377, train/loss_vlb_step=0.000132, train/loss_step=0.0377, global_step=7404.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  52%|█████▏    | 629/1208 [17:30<16:07,  1.67s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0377, train/loss_vlb_step=0.000132, train/loss_step=0.0377, global_step=7404.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  52%|█████▏    | 629/1208 [17:30<16:07,  1.67s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00827, train/loss_vlb_step=3.99e-5, train/loss_step=0.00827, global_step=7405.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  52%|█████▏    | 630/1208 [17:31<16:04,  1.67s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00827, train/loss_vlb_step=3.99e-5, train/loss_step=0.00827, global_step=7405.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  52%|█████▏    | 630/1208 [17:31<16:04,  1.67s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0811, train/loss_vlb_step=0.000269, train/loss_step=0.0811, global_step=7405.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  52%|█████▏    | 631/1208 [17:32<16:02,  1.67s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0811, train/loss_vlb_step=0.000269, train/loss_step=0.0811, global_step=7405.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  52%|█████▏    | 631/1208 [17:32<16:02,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0827, train/loss_vlb_step=0.000272, train/loss_step=0.0827, global_step=7405.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  52%|█████▏    | 632/1208 [17:35<16:02,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0827, train/loss_vlb_step=0.000272, train/loss_step=0.0827, global_step=7405.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  52%|█████▏    | 632/1208 [17:35<16:02,  1.67s/it, loss=0.124, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.00068, train/loss_step=0.186, global_step=7405.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  52%|█████▏    | 633/1208 [17:36<16:00,  1.67s/it, loss=0.124, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.00068, train/loss_step=0.186, global_step=7405.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  52%|█████▏    | 633/1208 [17:36<16:00,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00274, train/loss_step=0.407, global_step=7406.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  52%|█████▏    | 634/1208 [17:37<15:57,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00274, train/loss_step=0.407, global_step=7406.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  52%|█████▏    | 634/1208 [17:37<15:57,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.558, train/loss_vlb_step=0.0196, train/loss_step=0.558, global_step=7406.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  53%|█████▎    | 635/1208 [17:38<15:55,  1.67s/it, loss=0.168, v_num=0, train/loss_simple_step=0.558, train/loss_vlb_step=0.0196, train/loss_step=0.558, global_step=7406.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  53%|█████▎    | 635/1208 [17:38<15:55,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000904, train/loss_step=0.231, global_step=7406.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  53%|█████▎    | 636/1208 [17:42<15:55,  1.67s/it, loss=0.175, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000904, train/loss_step=0.231, global_step=7406.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  53%|█████▎    | 636/1208 [17:42<15:55,  1.67s/it, loss=0.198, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.00693, train/loss_step=0.512, global_step=7406.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  53%|█████▎    | 637/1208 [17:43<15:53,  1.67s/it, loss=0.198, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.00693, train/loss_step=0.512, global_step=7406.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  53%|█████▎    | 637/1208 [17:43<15:53,  1.67s/it, loss=0.204, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000809, train/loss_step=0.213, global_step=7407.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  53%|█████▎    | 638/1208 [17:44<15:50,  1.67s/it, loss=0.204, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000809, train/loss_step=0.213, global_step=7407.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  53%|█████▎    | 638/1208 [17:44<15:50,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.62e-5, train/loss_step=0.0131, global_step=7407.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  53%|█████▎    | 639/1208 [17:45<15:48,  1.67s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.62e-5, train/loss_step=0.0131, global_step=7407.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  53%|█████▎    | 639/1208 [17:45<15:48,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.00045, train/loss_step=0.132, global_step=7407.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  53%|█████▎    | 640/1208 [17:48<15:48,  1.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.00045, train/loss_step=0.132, global_step=7407.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  53%|█████▎    | 640/1208 [17:48<15:48,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00906, train/loss_vlb_step=4.13e-5, train/loss_step=0.00906, global_step=7407.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  53%|█████▎    | 641/1208 [17:49<15:46,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00906, train/loss_vlb_step=4.13e-5, train/loss_step=0.00906, global_step=7407.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  53%|█████▎    | 641/1208 [17:49<15:46,  1.67s/it, loss=0.159, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000571, train/loss_step=0.170, global_step=7408.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  53%|█████▎    | 642/1208 [17:50<15:43,  1.67s/it, loss=0.159, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000571, train/loss_step=0.170, global_step=7408.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  53%|█████▎    | 642/1208 [17:50<15:43,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000448, train/loss_step=0.136, global_step=7408.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  53%|█████▎    | 643/1208 [17:51<15:41,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000448, train/loss_step=0.136, global_step=7408.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  53%|█████▎    | 643/1208 [17:51<15:41,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00836, train/loss_vlb_step=4.23e-5, train/loss_step=0.00836, global_step=7408.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  53%|█████▎    | 644/1208 [17:54<15:41,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00836, train/loss_vlb_step=4.23e-5, train/loss_step=0.00836, global_step=7408.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  53%|█████▎    | 644/1208 [17:54<15:41,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00154, train/loss_step=0.290, global_step=7408.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  53%|█████▎    | 645/1208 [17:55<15:39,  1.67s/it, loss=0.161, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00154, train/loss_step=0.290, global_step=7408.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  53%|█████▎    | 645/1208 [17:55<15:39,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.21e-5, train/loss_step=0.0144, global_step=7409.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  53%|█████▎    | 646/1208 [17:56<15:36,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.21e-5, train/loss_step=0.0144, global_step=7409.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  53%|█████▎    | 646/1208 [17:56<15:36,  1.67s/it, loss=0.176, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.00384, train/loss_step=0.417, global_step=7409.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  54%|█████▎    | 647/1208 [17:57<15:34,  1.67s/it, loss=0.176, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.00384, train/loss_step=0.417, global_step=7409.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  54%|█████▎    | 647/1208 [17:57<15:34,  1.67s/it, loss=0.193, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00205, train/loss_step=0.345, global_step=7409.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  54%|█████▎    | 648/1208 [18:01<15:34,  1.67s/it, loss=0.193, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00205, train/loss_step=0.345, global_step=7409.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  54%|█████▎    | 648/1208 [18:01<15:34,  1.67s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0976, train/loss_vlb_step=0.000322, train/loss_step=0.0976, global_step=7409.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  54%|█████▎    | 649/1208 [18:02<15:32,  1.67s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0976, train/loss_vlb_step=0.000322, train/loss_step=0.0976, global_step=7409.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  54%|█████▎    | 649/1208 [18:02<15:32,  1.67s/it, loss=0.196, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.5e-5, train/loss_step=0.021, global_step=7410.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  54%|█████▍    | 650/1208 [18:03<15:29,  1.67s/it, loss=0.196, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.5e-5, train/loss_step=0.021, global_step=7410.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  54%|█████▍    | 650/1208 [18:03<15:29,  1.67s/it, loss=0.201, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000602, train/loss_step=0.172, global_step=7410.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  54%|█████▍    | 651/1208 [18:04<15:27,  1.67s/it, loss=0.201, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000602, train/loss_step=0.172, global_step=7410.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  54%|█████▍    | 651/1208 [18:04<15:27,  1.67s/it, loss=0.217, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00353, train/loss_step=0.402, global_step=7410.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  54%|█████▍    | 652/1208 [18:07<15:27,  1.67s/it, loss=0.217, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00353, train/loss_step=0.402, global_step=7410.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  54%|█████▍    | 652/1208 [18:07<15:27,  1.67s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0748, train/loss_vlb_step=0.000247, train/loss_step=0.0748, global_step=7410.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  54%|█████▍    | 653/1208 [18:08<15:25,  1.67s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0748, train/loss_vlb_step=0.000247, train/loss_step=0.0748, global_step=7410.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  54%|█████▍    | 653/1208 [18:08<15:25,  1.67s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.67e-5, train/loss_step=0.0126, global_step=7411.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  54%|█████▍    | 654/1208 [18:09<15:22,  1.67s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.67e-5, train/loss_step=0.0126, global_step=7411.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  54%|█████▍    | 654/1208 [18:09<15:22,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000115, train/loss_step=0.0304, global_step=7411.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  54%|█████▍    | 655/1208 [18:10<15:20,  1.67s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000115, train/loss_step=0.0304, global_step=7411.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  54%|█████▍    | 655/1208 [18:10<15:20,  1.67s/it, loss=0.178, v_num=0, train/loss_simple_step=0.488, train/loss_vlb_step=0.00894, train/loss_step=0.488, global_step=7411.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  54%|█████▍    | 656/1208 [18:13<15:20,  1.67s/it, loss=0.178, v_num=0, train/loss_simple_step=0.488, train/loss_vlb_step=0.00894, train/loss_step=0.488, global_step=7411.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  54%|█████▍    | 656/1208 [18:13<15:20,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.64e-5, train/loss_step=0.0129, global_step=7411.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  54%|█████▍    | 657/1208 [18:14<15:18,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.64e-5, train/loss_step=0.0129, global_step=7411.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  54%|█████▍    | 657/1208 [18:14<15:18,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.000181, train/loss_step=0.0521, global_step=7412.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  54%|█████▍    | 658/1208 [18:15<15:16,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.000181, train/loss_step=0.0521, global_step=7412.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  54%|█████▍    | 658/1208 [18:15<15:16,  1.67s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0812, train/loss_vlb_step=0.000267, train/loss_step=0.0812, global_step=7412.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  55%|█████▍    | 659/1208 [18:16<15:13,  1.66s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0812, train/loss_vlb_step=0.000267, train/loss_step=0.0812, global_step=7412.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  55%|█████▍    | 659/1208 [18:16<15:13,  1.66s/it, loss=0.185, v_num=0, train/loss_simple_step=0.863, train/loss_vlb_step=0.434, train/loss_step=0.863, global_step=7412.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]     Epoch 24:  55%|█████▍    | 660/1208 [18:20<15:13,  1.67s/it, loss=0.185, v_num=0, train/loss_simple_step=0.863, train/loss_vlb_step=0.434, train/loss_step=0.863, global_step=7412.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  55%|█████▍    | 660/1208 [18:20<15:13,  1.67s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=1.06e-5, train/loss_step=0.00179, global_step=7412.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  55%|█████▍    | 661/1208 [18:21<15:11,  1.67s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=1.06e-5, train/loss_step=0.00179, global_step=7412.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  55%|█████▍    | 661/1208 [18:21<15:11,  1.67s/it, loss=0.186, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000689, train/loss_step=0.192, global_step=7413.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  55%|█████▍    | 662/1208 [18:22<15:09,  1.66s/it, loss=0.186, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000689, train/loss_step=0.192, global_step=7413.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  55%|█████▍    | 662/1208 [18:22<15:09,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000139, train/loss_step=0.0358, global_step=7413.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  55%|█████▍    | 663/1208 [18:23<15:06,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000139, train/loss_step=0.0358, global_step=7413.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  55%|█████▍    | 663/1208 [18:23<15:06,  1.66s/it, loss=0.201, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00395, train/loss_step=0.408, global_step=7413.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  55%|█████▍    | 664/1208 [18:26<15:06,  1.67s/it, loss=0.201, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00395, train/loss_step=0.408, global_step=7413.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  55%|█████▍    | 664/1208 [18:26<15:06,  1.67s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000128, train/loss_step=0.0349, global_step=7413.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  55%|█████▌    | 665/1208 [18:27<15:04,  1.67s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000128, train/loss_step=0.0349, global_step=7413.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  55%|█████▌    | 665/1208 [18:27<15:04,  1.67s/it, loss=0.196, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.00062, train/loss_step=0.177, global_step=7414.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  55%|█████▌    | 666/1208 [18:28<15:02,  1.66s/it, loss=0.196, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.00062, train/loss_step=0.177, global_step=7414.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  55%|█████▌    | 666/1208 [18:28<15:02,  1.66s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00436, train/loss_vlb_step=2.29e-5, train/loss_step=0.00436, global_step=7414.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  55%|█████▌    | 667/1208 [18:29<14:59,  1.66s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00436, train/loss_vlb_step=2.29e-5, train/loss_step=0.00436, global_step=7414.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  55%|█████▌    | 667/1208 [18:29<14:59,  1.66s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=9.06e-5, train/loss_step=0.0222, global_step=7414.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  55%|█████▌    | 668/1208 [18:32<14:59,  1.67s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=9.06e-5, train/loss_step=0.0222, global_step=7414.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  55%|█████▌    | 668/1208 [18:32<14:59,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.51e-5, train/loss_step=0.0245, global_step=7414.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  55%|█████▌    | 669/1208 [18:33<14:57,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.51e-5, train/loss_step=0.0245, global_step=7414.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  55%|█████▌    | 669/1208 [18:33<14:57,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000121, train/loss_step=0.0328, global_step=7415.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  55%|█████▌    | 670/1208 [18:34<14:55,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000121, train/loss_step=0.0328, global_step=7415.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  55%|█████▌    | 670/1208 [18:34<14:55,  1.66s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00576, train/loss_vlb_step=2.98e-5, train/loss_step=0.00576, global_step=7415.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  56%|█████▌    | 671/1208 [18:35<14:53,  1.66s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00576, train/loss_vlb_step=2.98e-5, train/loss_step=0.00576, global_step=7415.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  56%|█████▌    | 671/1208 [18:35<14:53,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.0012, train/loss_step=0.271, global_step=7415.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]     Epoch 24:  56%|█████▌    | 672/1208 [18:39<14:52,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.0012, train/loss_step=0.271, global_step=7415.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  56%|█████▌    | 672/1208 [18:39<14:52,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=6.17e-5, train/loss_step=0.0133, global_step=7415.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  56%|█████▌    | 673/1208 [18:40<14:50,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=6.17e-5, train/loss_step=0.0133, global_step=7415.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  56%|█████▌    | 673/1208 [18:40<14:50,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.66e-5, train/loss_step=0.0243, global_step=7416.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  56%|█████▌    | 674/1208 [18:41<14:48,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.66e-5, train/loss_step=0.0243, global_step=7416.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  56%|█████▌    | 674/1208 [18:41<14:48,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00103, train/loss_step=0.237, global_step=7416.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  56%|█████▌    | 675/1208 [18:42<14:46,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00103, train/loss_step=0.237, global_step=7416.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  56%|█████▌    | 675/1208 [18:42<14:46,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.31e-5, train/loss_step=0.00215, global_step=7416.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  56%|█████▌    | 676/1208 [18:45<14:45,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.31e-5, train/loss_step=0.00215, global_step=7416.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  56%|█████▌    | 676/1208 [18:45<14:45,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00968, train/loss_vlb_step=4.59e-5, train/loss_step=0.00968, global_step=7416.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  56%|█████▌    | 677/1208 [18:46<14:43,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00968, train/loss_vlb_step=4.59e-5, train/loss_step=0.00968, global_step=7416.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  56%|█████▌    | 677/1208 [18:46<14:43,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0371, train/loss_vlb_step=0.000135, train/loss_step=0.0371, global_step=7417.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  56%|█████▌    | 678/1208 [18:47<14:41,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0371, train/loss_vlb_step=0.000135, train/loss_step=0.0371, global_step=7417.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  56%|█████▌    | 678/1208 [18:47<14:41,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000362, train/loss_step=0.109, global_step=7417.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  56%|█████▌    | 679/1208 [18:48<14:39,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000362, train/loss_step=0.109, global_step=7417.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  56%|█████▌    | 679/1208 [18:48<14:39,  1.66s/it, loss=0.0824, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=2.86e-5, train/loss_step=0.00572, global_step=7417.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  56%|█████▋    | 680/1208 [18:51<14:38,  1.66s/it, loss=0.0824, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=2.86e-5, train/loss_step=0.00572, global_step=7417.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  56%|█████▋    | 680/1208 [18:51<14:38,  1.66s/it, loss=0.0883, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000394, train/loss_step=0.119, global_step=7417.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  56%|█████▋    | 681/1208 [18:52<14:36,  1.66s/it, loss=0.0883, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000394, train/loss_step=0.119, global_step=7417.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  56%|█████▋    | 681/1208 [18:52<14:36,  1.66s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00194, train/loss_step=0.383, global_step=7418.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  56%|█████▋    | 682/1208 [18:53<14:34,  1.66s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00194, train/loss_step=0.383, global_step=7418.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  56%|█████▋    | 682/1208 [18:53<14:34,  1.66s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.0693, train/loss_vlb_step=0.000234, train/loss_step=0.0693, global_step=7418.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  57%|█████▋    | 683/1208 [18:54<14:32,  1.66s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.0693, train/loss_vlb_step=0.000234, train/loss_step=0.0693, global_step=7418.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  57%|█████▋    | 683/1208 [18:54<14:32,  1.66s/it, loss=0.0815, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.000169, train/loss_step=0.048, global_step=7418.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  57%|█████▋    | 684/1208 [18:58<14:31,  1.66s/it, loss=0.0815, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.000169, train/loss_step=0.048, global_step=7418.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  57%|█████▋    | 684/1208 [18:58<14:31,  1.66s/it, loss=0.0867, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000459, train/loss_step=0.138, global_step=7418.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  57%|█████▋    | 685/1208 [18:59<14:29,  1.66s/it, loss=0.0867, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000459, train/loss_step=0.138, global_step=7418.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  57%|█████▋    | 685/1208 [18:59<14:29,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.747, train/loss_vlb_step=0.028, train/loss_step=0.747, global_step=7419.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  57%|█████▋    | 686/1208 [19:00<14:27,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.747, train/loss_vlb_step=0.028, train/loss_step=0.747, global_step=7419.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  57%|█████▋    | 686/1208 [19:00<14:27,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.059, train/loss_vlb_step=0.000202, train/loss_step=0.059, global_step=7419.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  57%|█████▋    | 687/1208 [19:01<14:25,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.059, train/loss_vlb_step=0.000202, train/loss_step=0.059, global_step=7419.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  57%|█████▋    | 687/1208 [19:01<14:25,  1.66s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0718, train/loss_vlb_step=0.000242, train/loss_step=0.0718, global_step=7419.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  57%|█████▋    | 688/1208 [19:04<14:24,  1.66s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0718, train/loss_vlb_step=0.000242, train/loss_step=0.0718, global_step=7419.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  57%|█████▋    | 688/1208 [19:04<14:24,  1.66s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.19e-5, train/loss_step=0.0241, global_step=7419.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  57%|█████▋    | 689/1208 [19:05<14:22,  1.66s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.19e-5, train/loss_step=0.0241, global_step=7419.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  57%|█████▋    | 689/1208 [19:05<14:22,  1.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00113, train/loss_step=0.260, global_step=7420.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  57%|█████▋    | 690/1208 [19:06<14:20,  1.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00113, train/loss_step=0.260, global_step=7420.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  57%|█████▋    | 690/1208 [19:06<14:20,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00345, train/loss_step=0.425, global_step=7420.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  57%|█████▋    | 691/1208 [19:07<14:18,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00345, train/loss_step=0.425, global_step=7420.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  57%|█████▋    | 691/1208 [19:07<14:18,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000493, train/loss_step=0.145, global_step=7420.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  57%|█████▋    | 692/1208 [19:10<14:18,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000493, train/loss_step=0.145, global_step=7420.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  57%|█████▋    | 692/1208 [19:10<14:18,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00228, train/loss_vlb_step=1.32e-5, train/loss_step=0.00228, global_step=7420.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  57%|█████▋    | 693/1208 [19:11<14:15,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00228, train/loss_vlb_step=1.32e-5, train/loss_step=0.00228, global_step=7420.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  57%|█████▋    | 693/1208 [19:11<14:15,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=7.08e-5, train/loss_step=0.016, global_step=7421.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  57%|█████▋    | 694/1208 [19:12<14:13,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=7.08e-5, train/loss_step=0.016, global_step=7421.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  57%|█████▋    | 694/1208 [19:12<14:13,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00215, train/loss_step=0.324, global_step=7421.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  58%|█████▊    | 695/1208 [19:13<14:11,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00215, train/loss_step=0.324, global_step=7421.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  58%|█████▊    | 695/1208 [19:13<14:11,  1.66s/it, loss=0.161, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000846, train/loss_step=0.227, global_step=7421.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  58%|█████▊    | 696/1208 [19:16<14:11,  1.66s/it, loss=0.161, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000846, train/loss_step=0.227, global_step=7421.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  58%|█████▊    | 696/1208 [19:17<14:11,  1.66s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0951, train/loss_vlb_step=0.000313, train/loss_step=0.0951, global_step=7421.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  58%|█████▊    | 697/1208 [19:18<14:09,  1.66s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0951, train/loss_vlb_step=0.000313, train/loss_step=0.0951, global_step=7421.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  58%|█████▊    | 697/1208 [19:18<14:09,  1.66s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00933, train/loss_vlb_step=4.3e-5, train/loss_step=0.00933, global_step=7422.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  58%|█████▊    | 698/1208 [19:19<14:06,  1.66s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00933, train/loss_vlb_step=4.3e-5, train/loss_step=0.00933, global_step=7422.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  58%|█████▊    | 698/1208 [19:19<14:06,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0839, train/loss_vlb_step=0.000278, train/loss_step=0.0839, global_step=7422.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  58%|█████▊    | 699/1208 [19:20<14:04,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0839, train/loss_vlb_step=0.000278, train/loss_step=0.0839, global_step=7422.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  58%|█████▊    | 699/1208 [19:20<14:04,  1.66s/it, loss=0.183, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00273, train/loss_step=0.412, global_step=7422.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  58%|█████▊    | 700/1208 [19:23<14:04,  1.66s/it, loss=0.183, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00273, train/loss_step=0.412, global_step=7422.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  58%|█████▊    | 700/1208 [19:23<14:04,  1.66s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00951, train/loss_vlb_step=4.39e-5, train/loss_step=0.00951, global_step=7422.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  58%|█████▊    | 701/1208 [19:24<14:02,  1.66s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00951, train/loss_vlb_step=4.39e-5, train/loss_step=0.00951, global_step=7422.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  58%|█████▊    | 701/1208 [19:24<14:02,  1.66s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=2.27e-5, train/loss_step=0.00413, global_step=7423.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  58%|█████▊    | 702/1208 [19:25<14:00,  1.66s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=2.27e-5, train/loss_step=0.00413, global_step=7423.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  58%|█████▊    | 702/1208 [19:25<14:00,  1.66s/it, loss=0.161, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000418, train/loss_step=0.127, global_step=7423.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  58%|█████▊    | 703/1208 [19:26<13:57,  1.66s/it, loss=0.161, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000418, train/loss_step=0.127, global_step=7423.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  58%|█████▊    | 703/1208 [19:26<13:57,  1.66s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0999, train/loss_vlb_step=0.00033, train/loss_step=0.0999, global_step=7423.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  58%|█████▊    | 704/1208 [19:29<13:57,  1.66s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0999, train/loss_vlb_step=0.00033, train/loss_step=0.0999, global_step=7423.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  58%|█████▊    | 704/1208 [19:29<13:57,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.86e-5, train/loss_step=0.0104, global_step=7423.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  58%|█████▊    | 705/1208 [19:30<13:55,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.86e-5, train/loss_step=0.0104, global_step=7423.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  58%|█████▊    | 705/1208 [19:30<13:55,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000786, train/loss_step=0.217, global_step=7424.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  58%|█████▊    | 706/1208 [19:31<13:53,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000786, train/loss_step=0.217, global_step=7424.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  58%|█████▊    | 706/1208 [19:31<13:53,  1.66s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000146, train/loss_step=0.0409, global_step=7424.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  59%|█████▊    | 707/1208 [19:32<13:51,  1.66s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000146, train/loss_step=0.0409, global_step=7424.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  59%|█████▊    | 707/1208 [19:32<13:51,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000455, train/loss_step=0.137, global_step=7424.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  59%|█████▊    | 708/1208 [19:35<13:50,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000455, train/loss_step=0.137, global_step=7424.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  59%|█████▊    | 708/1208 [19:35<13:50,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00129, train/loss_step=0.266, global_step=7424.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  59%|█████▊    | 709/1208 [19:37<13:48,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00129, train/loss_step=0.266, global_step=7424.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  59%|█████▊    | 709/1208 [19:37<13:48,  1.66s/it, loss=0.152, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00333, train/loss_step=0.398, global_step=7425.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  59%|█████▉    | 710/1208 [19:38<13:46,  1.66s/it, loss=0.152, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00333, train/loss_step=0.398, global_step=7425.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  59%|█████▉    | 710/1208 [19:38<13:46,  1.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00694, train/loss_vlb_step=3.54e-5, train/loss_step=0.00694, global_step=7425.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  59%|█████▉    | 711/1208 [19:39<13:44,  1.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00694, train/loss_vlb_step=3.54e-5, train/loss_step=0.00694, global_step=7425.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  59%|█████▉    | 711/1208 [19:39<13:44,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0074, train/loss_vlb_step=3.51e-5, train/loss_step=0.0074, global_step=7425.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  59%|█████▉    | 712/1208 [19:42<13:43,  1.66s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0074, train/loss_vlb_step=3.51e-5, train/loss_step=0.0074, global_step=7425.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  59%|█████▉    | 712/1208 [19:42<13:43,  1.66s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0529, train/loss_vlb_step=0.000182, train/loss_step=0.0529, global_step=7425.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  59%|█████▉    | 713/1208 [19:43<13:41,  1.66s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0529, train/loss_vlb_step=0.000182, train/loss_step=0.0529, global_step=7425.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  59%|█████▉    | 713/1208 [19:43<13:41,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000414, train/loss_step=0.124, global_step=7426.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  59%|█████▉    | 714/1208 [19:44<13:39,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000414, train/loss_step=0.124, global_step=7426.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  59%|█████▉    | 714/1208 [19:44<13:39,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=1.48e-5, train/loss_step=0.00263, global_step=7426.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  59%|█████▉    | 715/1208 [19:45<13:37,  1.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=1.48e-5, train/loss_step=0.00263, global_step=7426.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  59%|█████▉    | 715/1208 [19:45<13:37,  1.66s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=3.03e-5, train/loss_step=0.00615, global_step=7426.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  59%|█████▉    | 716/1208 [19:48<13:36,  1.66s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=3.03e-5, train/loss_step=0.00615, global_step=7426.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  59%|█████▉    | 716/1208 [19:48<13:36,  1.66s/it, loss=0.101, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.12e-5, train/loss_step=0.011, global_step=7426.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  59%|█████▉    | 717/1208 [19:49<13:34,  1.66s/it, loss=0.101, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.12e-5, train/loss_step=0.011, global_step=7426.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  59%|█████▉    | 717/1208 [19:49<13:34,  1.66s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0681, train/loss_vlb_step=0.000242, train/loss_step=0.0681, global_step=7427.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  59%|█████▉    | 718/1208 [19:50<13:32,  1.66s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0681, train/loss_vlb_step=0.000242, train/loss_step=0.0681, global_step=7427.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  59%|█████▉    | 718/1208 [19:50<13:32,  1.66s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00583, train/loss_vlb_step=2.92e-5, train/loss_step=0.00583, global_step=7427.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  60%|█████▉    | 719/1208 [19:51<13:30,  1.66s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00583, train/loss_vlb_step=2.92e-5, train/loss_step=0.00583, global_step=7427.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  60%|█████▉    | 719/1208 [19:51<13:30,  1.66s/it, loss=0.0836, v_num=0, train/loss_simple_step=0.0768, train/loss_vlb_step=0.00026, train/loss_step=0.0768, global_step=7427.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  60%|█████▉    | 720/1208 [19:54<13:29,  1.66s/it, loss=0.0836, v_num=0, train/loss_simple_step=0.0768, train/loss_vlb_step=0.00026, train/loss_step=0.0768, global_step=7427.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  60%|█████▉    | 720/1208 [19:54<13:29,  1.66s/it, loss=0.085, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000142, train/loss_step=0.0386, global_step=7427.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  60%|█████▉    | 721/1208 [19:55<13:27,  1.66s/it, loss=0.085, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000142, train/loss_step=0.0386, global_step=7427.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  60%|█████▉    | 721/1208 [19:55<13:27,  1.66s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.00591, train/loss_vlb_step=2.99e-5, train/loss_step=0.00591, global_step=7428.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  60%|█████▉    | 722/1208 [19:57<13:25,  1.66s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.00591, train/loss_vlb_step=2.99e-5, train/loss_step=0.00591, global_step=7428.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  60%|█████▉    | 722/1208 [19:57<13:25,  1.66s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00163, train/loss_step=0.330, global_step=7428.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  60%|█████▉    | 723/1208 [19:58<13:23,  1.66s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00163, train/loss_step=0.330, global_step=7428.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  60%|█████▉    | 723/1208 [19:58<13:23,  1.66s/it, loss=0.107, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00183, train/loss_step=0.326, global_step=7428.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  60%|█████▉    | 724/1208 [20:01<13:23,  1.66s/it, loss=0.107, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00183, train/loss_step=0.326, global_step=7428.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  60%|█████▉    | 724/1208 [20:01<13:23,  1.66s/it, loss=0.12, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00131, train/loss_step=0.270, global_step=7428.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  60%|██████    | 725/1208 [20:02<13:21,  1.66s/it, loss=0.12, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00131, train/loss_step=0.270, global_step=7428.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  60%|██████    | 725/1208 [20:02<13:21,  1.66s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00536, train/loss_vlb_step=2.77e-5, train/loss_step=0.00536, global_step=7429.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  60%|██████    | 726/1208 [20:03<13:18,  1.66s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00536, train/loss_vlb_step=2.77e-5, train/loss_step=0.00536, global_step=7429.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  60%|██████    | 726/1208 [20:03<13:18,  1.66s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000136, train/loss_step=0.0372, global_step=7429.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  60%|██████    | 727/1208 [20:04<13:16,  1.66s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000136, train/loss_step=0.0372, global_step=7429.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  60%|██████    | 727/1208 [20:04<13:16,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.541, train/loss_vlb_step=0.00992, train/loss_step=0.541, global_step=7429.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  60%|██████    | 728/1208 [20:07<13:16,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.541, train/loss_vlb_step=0.00992, train/loss_step=0.541, global_step=7429.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  60%|██████    | 728/1208 [20:07<13:16,  1.66s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0781, train/loss_vlb_step=0.000259, train/loss_step=0.0781, global_step=7429.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  60%|██████    | 729/1208 [20:08<13:14,  1.66s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0781, train/loss_vlb_step=0.000259, train/loss_step=0.0781, global_step=7429.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  60%|██████    | 729/1208 [20:08<13:14,  1.66s/it, loss=0.107, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000512, train/loss_step=0.153, global_step=7430.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  60%|██████    | 730/1208 [20:09<13:12,  1.66s/it, loss=0.107, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000512, train/loss_step=0.153, global_step=7430.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  60%|██████    | 730/1208 [20:09<13:12,  1.66s/it, loss=0.113, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=7430.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  61%|██████    | 731/1208 [20:10<13:10,  1.66s/it, loss=0.113, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=7430.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  61%|██████    | 731/1208 [20:10<13:10,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000986, train/loss_step=0.239, global_step=7430.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  61%|██████    | 732/1208 [20:13<13:09,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000986, train/loss_step=0.239, global_step=7430.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  61%|██████    | 732/1208 [20:13<13:09,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000482, train/loss_step=0.140, global_step=7430.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  61%|██████    | 733/1208 [20:15<13:07,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000482, train/loss_step=0.140, global_step=7430.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  61%|██████    | 733/1208 [20:15<13:07,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.0019, train/loss_step=0.314, global_step=7431.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  61%|██████    | 734/1208 [20:16<13:05,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.0019, train/loss_step=0.314, global_step=7431.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  61%|██████    | 734/1208 [20:16<13:05,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.4e-5, train/loss_step=0.0198, global_step=7431.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  61%|██████    | 735/1208 [20:17<13:03,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.4e-5, train/loss_step=0.0198, global_step=7431.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  61%|██████    | 735/1208 [20:17<13:03,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000332, train/loss_step=0.100, global_step=7431.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  61%|██████    | 736/1208 [20:20<13:02,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000332, train/loss_step=0.100, global_step=7431.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  61%|██████    | 736/1208 [20:20<13:02,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00101, train/loss_step=0.253, global_step=7431.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  61%|██████    | 737/1208 [20:21<13:00,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00101, train/loss_step=0.253, global_step=7431.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  61%|██████    | 737/1208 [20:21<13:00,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=5.96e-5, train/loss_step=0.0137, global_step=7432.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  61%|██████    | 738/1208 [20:22<12:58,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=5.96e-5, train/loss_step=0.0137, global_step=7432.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  61%|██████    | 738/1208 [20:22<12:58,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0694, train/loss_vlb_step=0.000236, train/loss_step=0.0694, global_step=7432.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  61%|██████    | 739/1208 [20:23<12:56,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0694, train/loss_vlb_step=0.000236, train/loss_step=0.0694, global_step=7432.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  61%|██████    | 739/1208 [20:23<12:56,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=2.53e-5, train/loss_step=0.00492, global_step=7432.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  61%|██████▏   | 740/1208 [20:26<12:55,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=2.53e-5, train/loss_step=0.00492, global_step=7432.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  61%|██████▏   | 740/1208 [20:26<12:55,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.0108, train/loss_step=0.460, global_step=7432.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]     Epoch 24:  61%|██████▏   | 741/1208 [20:27<12:53,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.0108, train/loss_step=0.460, global_step=7432.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  61%|██████▏   | 741/1208 [20:27<12:53,  1.66s/it, loss=0.18, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000419, train/loss_step=0.127, global_step=7433.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  61%|██████▏   | 742/1208 [20:28<12:51,  1.66s/it, loss=0.18, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000419, train/loss_step=0.127, global_step=7433.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  61%|██████▏   | 742/1208 [20:28<12:51,  1.66s/it, loss=0.171, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000541, train/loss_step=0.157, global_step=7433.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  62%|██████▏   | 743/1208 [20:29<12:49,  1.66s/it, loss=0.171, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000541, train/loss_step=0.157, global_step=7433.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  62%|██████▏   | 743/1208 [20:29<12:49,  1.66s/it, loss=0.166, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000821, train/loss_step=0.223, global_step=7433.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  62%|██████▏   | 744/1208 [20:32<12:48,  1.66s/it, loss=0.166, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000821, train/loss_step=0.223, global_step=7433.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  62%|██████▏   | 744/1208 [20:32<12:48,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6e-5, train/loss_step=0.014, global_step=7433.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  62%|██████▏   | 745/1208 [20:33<12:46,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6e-5, train/loss_step=0.014, global_step=7433.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  62%|██████▏   | 745/1208 [20:33<12:46,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.51e-5, train/loss_step=0.0117, global_step=7434.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  62%|██████▏   | 746/1208 [20:34<12:44,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.51e-5, train/loss_step=0.0117, global_step=7434.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  62%|██████▏   | 746/1208 [20:34<12:44,  1.66s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00131, train/loss_vlb_step=7.97e-6, train/loss_step=0.00131, global_step=7434.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  62%|██████▏   | 747/1208 [20:36<12:42,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00131, train/loss_vlb_step=7.97e-6, train/loss_step=0.00131, global_step=7434.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  62%|██████▏   | 747/1208 [20:36<12:42,  1.65s/it, loss=0.146, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00439, train/loss_step=0.428, global_step=7434.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  62%|██████▏   | 748/1208 [20:39<12:42,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00439, train/loss_step=0.428, global_step=7434.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  62%|██████▏   | 748/1208 [20:39<12:42,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000896, train/loss_step=0.210, global_step=7434.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  62%|██████▏   | 749/1208 [20:40<12:40,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000896, train/loss_step=0.210, global_step=7434.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  62%|██████▏   | 749/1208 [20:40<12:40,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000776, train/loss_step=0.203, global_step=7435.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  62%|██████▏   | 750/1208 [20:41<12:38,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000776, train/loss_step=0.203, global_step=7435.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  62%|██████▏   | 750/1208 [20:41<12:38,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.2e-5, train/loss_step=0.0201, global_step=7435.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  62%|██████▏   | 751/1208 [20:42<12:35,  1.65s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.2e-5, train/loss_step=0.0201, global_step=7435.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  62%|██████▏   | 751/1208 [20:42<12:35,  1.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.44e-5, train/loss_step=0.00254, global_step=7435.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  62%|██████▏   | 752/1208 [20:45<12:35,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.44e-5, train/loss_step=0.00254, global_step=7435.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  62%|██████▏   | 752/1208 [20:45<12:35,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=7435.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  62%|██████▏   | 753/1208 [20:46<12:33,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=7435.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  62%|██████▏   | 753/1208 [20:46<12:33,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000111, train/loss_step=0.0283, global_step=7436.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  62%|██████▏   | 754/1208 [20:47<12:31,  1.65s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000111, train/loss_step=0.0283, global_step=7436.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  62%|██████▏   | 754/1208 [20:47<12:31,  1.65s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0991, train/loss_vlb_step=0.000327, train/loss_step=0.0991, global_step=7436.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  62%|██████▎   | 755/1208 [20:48<12:29,  1.65s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0991, train/loss_vlb_step=0.000327, train/loss_step=0.0991, global_step=7436.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  62%|██████▎   | 755/1208 [20:48<12:29,  1.65s/it, loss=0.131, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.00063, train/loss_step=0.181, global_step=7436.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  63%|██████▎   | 756/1208 [20:51<12:28,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.00063, train/loss_step=0.181, global_step=7436.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  63%|██████▎   | 756/1208 [20:51<12:28,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0996, train/loss_vlb_step=0.000327, train/loss_step=0.0996, global_step=7436.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  63%|██████▎   | 757/1208 [20:52<12:26,  1.66s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0996, train/loss_vlb_step=0.000327, train/loss_step=0.0996, global_step=7436.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  63%|██████▎   | 757/1208 [20:52<12:26,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00614, train/loss_vlb_step=3e-5, train/loss_step=0.00614, global_step=7437.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  63%|██████▎   | 758/1208 [20:54<12:24,  1.65s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00614, train/loss_vlb_step=3e-5, train/loss_step=0.00614, global_step=7437.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  63%|██████▎   | 758/1208 [20:54<12:24,  1.65s/it, loss=0.135, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.0012, train/loss_step=0.297, global_step=7437.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  63%|██████▎   | 759/1208 [20:55<12:22,  1.65s/it, loss=0.135, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.0012, train/loss_step=0.297, global_step=7437.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  63%|██████▎   | 759/1208 [20:55<12:22,  1.65s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00556, train/loss_vlb_step=2.73e-5, train/loss_step=0.00556, global_step=7437.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  63%|██████▎   | 760/1208 [20:58<12:21,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00556, train/loss_vlb_step=2.73e-5, train/loss_step=0.00556, global_step=7437.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  63%|██████▎   | 760/1208 [20:58<12:21,  1.66s/it, loss=0.129, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00224, train/loss_step=0.351, global_step=7437.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  63%|██████▎   | 761/1208 [20:59<12:19,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00224, train/loss_step=0.351, global_step=7437.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  63%|██████▎   | 761/1208 [20:59<12:19,  1.65s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=8.91e-5, train/loss_step=0.0218, global_step=7438.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  63%|██████▎   | 762/1208 [21:00<12:17,  1.65s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=8.91e-5, train/loss_step=0.0218, global_step=7438.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  63%|██████▎   | 762/1208 [21:00<12:17,  1.65s/it, loss=0.133, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00172, train/loss_step=0.341, global_step=7438.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  63%|██████▎   | 763/1208 [21:01<12:15,  1.65s/it, loss=0.133, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00172, train/loss_step=0.341, global_step=7438.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  63%|██████▎   | 763/1208 [21:01<12:15,  1.65s/it, loss=0.132, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000767, train/loss_step=0.199, global_step=7438.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  63%|██████▎   | 764/1208 [21:04<12:14,  1.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000767, train/loss_step=0.199, global_step=7438.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  63%|██████▎   | 764/1208 [21:04<12:14,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00169, train/loss_vlb_step=1.02e-5, train/loss_step=0.00169, global_step=7438.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  63%|██████▎   | 765/1208 [21:05<12:12,  1.65s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00169, train/loss_vlb_step=1.02e-5, train/loss_step=0.00169, global_step=7438.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  63%|██████▎   | 765/1208 [21:05<12:12,  1.65s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000119, train/loss_step=0.0319, global_step=7439.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  63%|██████▎   | 766/1208 [21:06<12:10,  1.65s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000119, train/loss_step=0.0319, global_step=7439.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  63%|██████▎   | 766/1208 [21:06<12:10,  1.65s/it, loss=0.141, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.00064, train/loss_step=0.184, global_step=7439.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  63%|██████▎   | 767/1208 [21:07<12:08,  1.65s/it, loss=0.141, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.00064, train/loss_step=0.184, global_step=7439.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  63%|██████▎   | 767/1208 [21:07<12:08,  1.65s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000117, train/loss_step=0.0309, global_step=7439.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  64%|██████▎   | 768/1208 [21:10<12:08,  1.65s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000117, train/loss_step=0.0309, global_step=7439.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  64%|██████▎   | 768/1208 [21:10<12:08,  1.65s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00842, train/loss_vlb_step=4.12e-5, train/loss_step=0.00842, global_step=7439.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  64%|██████▎   | 769/1208 [21:12<12:06,  1.65s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00842, train/loss_vlb_step=4.12e-5, train/loss_step=0.00842, global_step=7439.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  64%|██████▎   | 769/1208 [21:12<12:06,  1.65s/it, loss=0.112, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000847, train/loss_step=0.217, global_step=7440.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  64%|██████▎   | 770/1208 [21:13<12:04,  1.65s/it, loss=0.112, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000847, train/loss_step=0.217, global_step=7440.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  64%|██████▎   | 770/1208 [21:13<12:04,  1.65s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0533, train/loss_vlb_step=0.000192, train/loss_step=0.0533, global_step=7440.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  64%|██████▍   | 771/1208 [21:14<12:02,  1.65s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0533, train/loss_vlb_step=0.000192, train/loss_step=0.0533, global_step=7440.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  64%|██████▍   | 771/1208 [21:14<12:02,  1.65s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.89e-5, train/loss_step=0.0033, global_step=7440.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  64%|██████▍   | 772/1208 [21:17<12:01,  1.65s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.89e-5, train/loss_step=0.0033, global_step=7440.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  64%|██████▍   | 772/1208 [21:17<12:01,  1.65s/it, loss=0.117, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000631, train/loss_step=0.171, global_step=7440.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  64%|██████▍   | 773/1208 [21:18<11:59,  1.65s/it, loss=0.117, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000631, train/loss_step=0.171, global_step=7440.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  64%|██████▍   | 773/1208 [21:18<11:59,  1.65s/it, loss=0.121, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=7441.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  64%|██████▍   | 774/1208 [21:19<11:57,  1.65s/it, loss=0.121, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=7441.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  64%|██████▍   | 774/1208 [21:19<11:57,  1.65s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00711, train/loss_vlb_step=3.45e-5, train/loss_step=0.00711, global_step=7441.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  64%|██████▍   | 775/1208 [21:20<11:55,  1.65s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00711, train/loss_vlb_step=3.45e-5, train/loss_step=0.00711, global_step=7441.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  64%|██████▍   | 775/1208 [21:20<11:55,  1.65s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=1.47e-5, train/loss_step=0.00259, global_step=7441.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  64%|██████▍   | 776/1208 [21:23<11:54,  1.65s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=1.47e-5, train/loss_step=0.00259, global_step=7441.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  64%|██████▍   | 776/1208 [21:23<11:54,  1.65s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0086, train/loss_vlb_step=4.17e-5, train/loss_step=0.0086, global_step=7441.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  64%|██████▍   | 777/1208 [21:24<11:52,  1.65s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0086, train/loss_vlb_step=4.17e-5, train/loss_step=0.0086, global_step=7441.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  64%|██████▍   | 777/1208 [21:24<11:52,  1.65s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0952, train/loss_vlb_step=0.000317, train/loss_step=0.0952, global_step=7442.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  64%|██████▍   | 778/1208 [21:25<11:50,  1.65s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0952, train/loss_vlb_step=0.000317, train/loss_step=0.0952, global_step=7442.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  64%|██████▍   | 778/1208 [21:25<11:50,  1.65s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.46e-5, train/loss_step=0.0142, global_step=7442.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  64%|██████▍   | 779/1208 [21:26<11:48,  1.65s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.46e-5, train/loss_step=0.0142, global_step=7442.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  64%|██████▍   | 779/1208 [21:26<11:48,  1.65s/it, loss=0.102, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000673, train/loss_step=0.187, global_step=7442.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  65%|██████▍   | 780/1208 [21:29<11:47,  1.65s/it, loss=0.102, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000673, train/loss_step=0.187, global_step=7442.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  65%|██████▍   | 780/1208 [21:29<11:47,  1.65s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.000126, train/loss_step=0.0322, global_step=7442.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  65%|██████▍   | 781/1208 [21:31<11:45,  1.65s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.000126, train/loss_step=0.0322, global_step=7442.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  65%|██████▍   | 781/1208 [21:31<11:45,  1.65s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000492, train/loss_step=0.146, global_step=7443.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  65%|██████▍   | 782/1208 [21:32<11:43,  1.65s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000492, train/loss_step=0.146, global_step=7443.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  65%|██████▍   | 782/1208 [21:32<11:43,  1.65s/it, loss=0.076, v_num=0, train/loss_simple_step=0.00992, train/loss_vlb_step=4.65e-5, train/loss_step=0.00992, global_step=7443.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  65%|██████▍   | 783/1208 [21:33<11:41,  1.65s/it, loss=0.076, v_num=0, train/loss_simple_step=0.00992, train/loss_vlb_step=4.65e-5, train/loss_step=0.00992, global_step=7443.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  65%|██████▍   | 783/1208 [21:33<11:41,  1.65s/it, loss=0.0662, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=8.45e-6, train/loss_step=0.00139, global_step=7443.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  65%|██████▍   | 784/1208 [21:36<11:41,  1.65s/it, loss=0.0662, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=8.45e-6, train/loss_step=0.00139, global_step=7443.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  65%|██████▍   | 784/1208 [21:36<11:41,  1.65s/it, loss=0.0765, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000826, train/loss_step=0.209, global_step=7443.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  65%|██████▍   | 785/1208 [21:37<11:39,  1.65s/it, loss=0.0765, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000826, train/loss_step=0.209, global_step=7443.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  65%|██████▍   | 785/1208 [21:37<11:39,  1.65s/it, loss=0.0756, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.09e-5, train/loss_step=0.0141, global_step=7444.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  65%|██████▌   | 786/1208 [21:38<11:37,  1.65s/it, loss=0.0756, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.09e-5, train/loss_step=0.0141, global_step=7444.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  65%|██████▌   | 786/1208 [21:38<11:37,  1.65s/it, loss=0.0665, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.32e-5, train/loss_step=0.00222, global_step=7444.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  65%|██████▌   | 787/1208 [21:39<11:35,  1.65s/it, loss=0.0665, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.32e-5, train/loss_step=0.00222, global_step=7444.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  65%|██████▌   | 787/1208 [21:39<11:35,  1.65s/it, loss=0.076, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000866, train/loss_step=0.220, global_step=7444.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  65%|██████▌   | 788/1208 [21:42<11:34,  1.65s/it, loss=0.076, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000866, train/loss_step=0.220, global_step=7444.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  65%|██████▌   | 788/1208 [21:42<11:34,  1.65s/it, loss=0.0757, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.82e-5, train/loss_step=0.00342, global_step=7444.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  65%|██████▌   | 789/1208 [21:43<11:32,  1.65s/it, loss=0.0757, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.82e-5, train/loss_step=0.00342, global_step=7444.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  65%|██████▌   | 789/1208 [21:43<11:32,  1.65s/it, loss=0.0654, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.85e-5, train/loss_step=0.0106, global_step=7445.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  65%|██████▌   | 790/1208 [21:44<11:30,  1.65s/it, loss=0.0654, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.85e-5, train/loss_step=0.0106, global_step=7445.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  65%|██████▌   | 790/1208 [21:44<11:30,  1.65s/it, loss=0.065, v_num=0, train/loss_simple_step=0.0451, train/loss_vlb_step=0.00016, train/loss_step=0.0451, global_step=7445.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  65%|██████▌   | 791/1208 [21:45<11:28,  1.65s/it, loss=0.065, v_num=0, train/loss_simple_step=0.0451, train/loss_vlb_step=0.00016, train/loss_step=0.0451, global_step=7445.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  65%|██████▌   | 791/1208 [21:45<11:28,  1.65s/it, loss=0.069, v_num=0, train/loss_simple_step=0.0842, train/loss_vlb_step=0.000281, train/loss_step=0.0842, global_step=7445.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  66%|██████▌   | 792/1208 [21:48<11:27,  1.65s/it, loss=0.069, v_num=0, train/loss_simple_step=0.0842, train/loss_vlb_step=0.000281, train/loss_step=0.0842, global_step=7445.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  66%|██████▌   | 792/1208 [21:48<11:27,  1.65s/it, loss=0.0609, v_num=0, train/loss_simple_step=0.00744, train/loss_vlb_step=3.55e-5, train/loss_step=0.00744, global_step=7445.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  66%|██████▌   | 793/1208 [21:50<11:25,  1.65s/it, loss=0.0609, v_num=0, train/loss_simple_step=0.00744, train/loss_vlb_step=3.55e-5, train/loss_step=0.00744, global_step=7445.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  66%|██████▌   | 793/1208 [21:50<11:25,  1.65s/it, loss=0.0551, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=9.03e-6, train/loss_step=0.00149, global_step=7446.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  66%|██████▌   | 794/1208 [21:51<11:23,  1.65s/it, loss=0.0551, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=9.03e-6, train/loss_step=0.00149, global_step=7446.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  66%|██████▌   | 794/1208 [21:51<11:23,  1.65s/it, loss=0.0731, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00237, train/loss_step=0.368, global_step=7446.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  66%|██████▌   | 795/1208 [21:52<11:21,  1.65s/it, loss=0.0731, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00237, train/loss_step=0.368, global_step=7446.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  66%|██████▌   | 795/1208 [21:52<11:21,  1.65s/it, loss=0.0753, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000163, train/loss_step=0.0463, global_step=7446.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  66%|██████▌   | 796/1208 [21:55<11:20,  1.65s/it, loss=0.0753, v_num=0, train/loss_simple_step=0.0463, train/loss_vlb_step=0.000163, train/loss_step=0.0463, global_step=7446.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  66%|██████▌   | 796/1208 [21:55<11:20,  1.65s/it, loss=0.075, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=1.38e-5, train/loss_step=0.0024, global_step=7446.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  66%|██████▌   | 797/1208 [21:56<11:18,  1.65s/it, loss=0.075, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=1.38e-5, train/loss_step=0.0024, global_step=7446.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  66%|██████▌   | 797/1208 [21:56<11:18,  1.65s/it, loss=0.0758, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000367, train/loss_step=0.112, global_step=7447.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  66%|██████▌   | 798/1208 [21:57<11:16,  1.65s/it, loss=0.0758, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000367, train/loss_step=0.112, global_step=7447.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  66%|██████▌   | 798/1208 [21:57<11:16,  1.65s/it, loss=0.0945, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00496, train/loss_step=0.389, global_step=7447.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  66%|██████▌   | 799/1208 [21:58<11:14,  1.65s/it, loss=0.0945, v_num=0, train/loss_simple_step=0.389, train/loss_vlb_step=0.00496, train/loss_step=0.389, global_step=7447.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  66%|██████▌   | 799/1208 [21:58<11:14,  1.65s/it, loss=0.0903, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=7447.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  66%|██████▌   | 800/1208 [22:01<11:14,  1.65s/it, loss=0.0903, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=7447.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  66%|██████▌   | 800/1208 [22:01<11:14,  1.65s/it, loss=0.103, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.0014, train/loss_step=0.286, global_step=7447.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  66%|██████▋   | 801/1208 [22:02<11:12,  1.65s/it, loss=0.103, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.0014, train/loss_step=0.286, global_step=7447.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  66%|██████▋   | 801/1208 [22:02<11:12,  1.65s/it, loss=0.105, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000613, train/loss_step=0.181, global_step=7448.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  66%|██████▋   | 802/1208 [22:03<11:10,  1.65s/it, loss=0.105, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000613, train/loss_step=0.181, global_step=7448.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  66%|██████▋   | 802/1208 [22:03<11:10,  1.65s/it, loss=0.107, v_num=0, train/loss_simple_step=0.053, train/loss_vlb_step=0.000184, train/loss_step=0.053, global_step=7448.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  66%|██████▋   | 803/1208 [22:04<11:08,  1.65s/it, loss=0.107, v_num=0, train/loss_simple_step=0.053, train/loss_vlb_step=0.000184, train/loss_step=0.053, global_step=7448.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  66%|██████▋   | 803/1208 [22:04<11:08,  1.65s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0096, train/loss_vlb_step=4.54e-5, train/loss_step=0.0096, global_step=7448.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  67%|██████▋   | 804/1208 [22:07<11:07,  1.65s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0096, train/loss_vlb_step=4.54e-5, train/loss_step=0.0096, global_step=7448.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  67%|██████▋   | 804/1208 [22:07<11:07,  1.65s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0656, train/loss_vlb_step=0.000222, train/loss_step=0.0656, global_step=7448.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  67%|██████▋   | 805/1208 [22:09<11:05,  1.65s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0656, train/loss_vlb_step=0.000222, train/loss_step=0.0656, global_step=7448.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  67%|██████▋   | 805/1208 [22:09<11:05,  1.65s/it, loss=0.106, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000473, train/loss_step=0.140, global_step=7449.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  67%|██████▋   | 806/1208 [22:10<11:03,  1.65s/it, loss=0.106, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000473, train/loss_step=0.140, global_step=7449.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  67%|██████▋   | 806/1208 [22:10<11:03,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000624, train/loss_step=0.180, global_step=7449.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  67%|██████▋   | 807/1208 [22:11<11:01,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000624, train/loss_step=0.180, global_step=7449.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  67%|██████▋   | 807/1208 [22:11<11:01,  1.65s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.000173, train/loss_step=0.0459, global_step=7449.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  67%|██████▋   | 808/1208 [22:14<11:00,  1.65s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.000173, train/loss_step=0.0459, global_step=7449.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  67%|██████▋   | 808/1208 [22:14<11:00,  1.65s/it, loss=0.114, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000533, train/loss_step=0.157, global_step=7449.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  67%|██████▋   | 809/1208 [22:15<10:58,  1.65s/it, loss=0.114, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000533, train/loss_step=0.157, global_step=7449.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  67%|██████▋   | 809/1208 [22:15<10:58,  1.65s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00618, train/loss_vlb_step=3.18e-5, train/loss_step=0.00618, global_step=7450.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  67%|██████▋   | 810/1208 [22:16<10:56,  1.65s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00618, train/loss_vlb_step=3.18e-5, train/loss_step=0.00618, global_step=7450.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  67%|██████▋   | 810/1208 [22:16<10:56,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.069, train/loss_vlb_step=0.000229, train/loss_step=0.069, global_step=7450.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  67%|██████▋   | 811/1208 [22:17<10:54,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.069, train/loss_vlb_step=0.000229, train/loss_step=0.069, global_step=7450.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  67%|██████▋   | 811/1208 [22:17<10:54,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.080, train/loss_vlb_step=0.000269, train/loss_step=0.080, global_step=7450.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  67%|██████▋   | 812/1208 [22:20<10:53,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.080, train/loss_vlb_step=0.000269, train/loss_step=0.080, global_step=7450.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  67%|██████▋   | 812/1208 [22:20<10:53,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.76e-5, train/loss_step=0.0106, global_step=7450.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  67%|██████▋   | 813/1208 [22:21<10:51,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.76e-5, train/loss_step=0.0106, global_step=7450.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  67%|██████▋   | 813/1208 [22:21<10:51,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00403, train/loss_vlb_step=2.15e-5, train/loss_step=0.00403, global_step=7451.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  67%|██████▋   | 814/1208 [22:22<10:49,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00403, train/loss_vlb_step=2.15e-5, train/loss_step=0.00403, global_step=7451.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  67%|██████▋   | 814/1208 [22:22<10:49,  1.65s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.46e-5, train/loss_step=0.015, global_step=7451.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  67%|██████▋   | 815/1208 [22:23<10:48,  1.65s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.46e-5, train/loss_step=0.015, global_step=7451.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  67%|██████▋   | 815/1208 [22:23<10:48,  1.65s/it, loss=0.101, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000374, train/loss_step=0.113, global_step=7451.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  68%|██████▊   | 816/1208 [22:27<10:47,  1.65s/it, loss=0.101, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000374, train/loss_step=0.113, global_step=7451.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  68%|██████▊   | 816/1208 [22:27<10:47,  1.65s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.4e-5, train/loss_step=0.0142, global_step=7451.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  68%|██████▊   | 817/1208 [22:28<10:45,  1.65s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.4e-5, train/loss_step=0.0142, global_step=7451.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  68%|██████▊   | 817/1208 [22:28<10:45,  1.65s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.65e-5, train/loss_step=0.0175, global_step=7452.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  68%|██████▊   | 818/1208 [22:29<10:43,  1.65s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.65e-5, train/loss_step=0.0175, global_step=7452.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  68%|██████▊   | 818/1208 [22:29<10:43,  1.65s/it, loss=0.078, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.83e-5, train/loss_step=0.0106, global_step=7452.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  68%|██████▊   | 819/1208 [22:30<10:41,  1.65s/it, loss=0.078, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.83e-5, train/loss_step=0.0106, global_step=7452.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  68%|██████▊   | 819/1208 [22:30<10:41,  1.65s/it, loss=0.0736, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.39e-5, train/loss_step=0.0137, global_step=7452.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  68%|██████▊   | 820/1208 [22:33<10:40,  1.65s/it, loss=0.0736, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.39e-5, train/loss_step=0.0137, global_step=7452.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  68%|██████▊   | 820/1208 [22:33<10:40,  1.65s/it, loss=0.0594, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.63e-5, train/loss_step=0.00282, global_step=7452.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  68%|██████▊   | 821/1208 [22:34<10:38,  1.65s/it, loss=0.0594, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.63e-5, train/loss_step=0.00282, global_step=7452.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  68%|██████▊   | 821/1208 [22:34<10:38,  1.65s/it, loss=0.0514, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.44e-5, train/loss_step=0.0208, global_step=7453.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  68%|██████▊   | 822/1208 [22:35<10:36,  1.65s/it, loss=0.0514, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.44e-5, train/loss_step=0.0208, global_step=7453.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  68%|██████▊   | 822/1208 [22:35<10:36,  1.65s/it, loss=0.0663, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00183, train/loss_step=0.351, global_step=7453.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  68%|██████▊   | 823/1208 [22:36<10:34,  1.65s/it, loss=0.0663, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00183, train/loss_step=0.351, global_step=7453.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  68%|██████▊   | 823/1208 [22:36<10:34,  1.65s/it, loss=0.0673, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000115, train/loss_step=0.0301, global_step=7453.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  68%|██████▊   | 824/1208 [22:39<10:33,  1.65s/it, loss=0.0673, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000115, train/loss_step=0.0301, global_step=7453.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  68%|██████▊   | 824/1208 [22:39<10:33,  1.65s/it, loss=0.0648, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.62e-5, train/loss_step=0.0152, global_step=7453.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  68%|██████▊   | 825/1208 [22:40<10:31,  1.65s/it, loss=0.0648, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.62e-5, train/loss_step=0.0152, global_step=7453.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  68%|██████▊   | 825/1208 [22:40<10:31,  1.65s/it, loss=0.0584, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.18e-5, train/loss_step=0.0113, global_step=7454.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  68%|██████▊   | 826/1208 [22:41<10:29,  1.65s/it, loss=0.0584, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.18e-5, train/loss_step=0.0113, global_step=7454.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  68%|██████▊   | 826/1208 [22:41<10:29,  1.65s/it, loss=0.0686, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00283, train/loss_step=0.384, global_step=7454.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  68%|██████▊   | 827/1208 [22:42<10:27,  1.65s/it, loss=0.0686, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00283, train/loss_step=0.384, global_step=7454.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  68%|██████▊   | 827/1208 [22:42<10:27,  1.65s/it, loss=0.0797, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00115, train/loss_step=0.268, global_step=7454.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  69%|██████▊   | 828/1208 [22:46<10:26,  1.65s/it, loss=0.0797, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00115, train/loss_step=0.268, global_step=7454.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  69%|██████▊   | 828/1208 [22:46<10:26,  1.65s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00194, train/loss_step=0.355, global_step=7454.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  69%|██████▊   | 829/1208 [22:47<10:25,  1.65s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00194, train/loss_step=0.355, global_step=7454.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  69%|██████▊   | 829/1208 [22:47<10:25,  1.65s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.0818, train/loss_vlb_step=0.00027, train/loss_step=0.0818, global_step=7455.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  69%|██████▊   | 830/1208 [22:48<10:23,  1.65s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.0818, train/loss_vlb_step=0.00027, train/loss_step=0.0818, global_step=7455.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  69%|██████▊   | 830/1208 [22:48<10:23,  1.65s/it, loss=0.0912, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000102, train/loss_step=0.0262, global_step=7455.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  69%|██████▉   | 831/1208 [22:49<10:21,  1.65s/it, loss=0.0912, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000102, train/loss_step=0.0262, global_step=7455.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  69%|██████▉   | 831/1208 [22:49<10:21,  1.65s/it, loss=0.119, v_num=0, train/loss_simple_step=0.639, train/loss_vlb_step=0.0239, train/loss_step=0.639, global_step=7455.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]     Epoch 24:  69%|██████▉   | 832/1208 [22:52<10:20,  1.65s/it, loss=0.119, v_num=0, train/loss_simple_step=0.639, train/loss_vlb_step=0.0239, train/loss_step=0.639, global_step=7455.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  69%|██████▉   | 832/1208 [22:52<10:20,  1.65s/it, loss=0.119, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.61e-5, train/loss_step=0.013, global_step=7455.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  69%|██████▉   | 833/1208 [22:53<10:18,  1.65s/it, loss=0.119, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.61e-5, train/loss_step=0.013, global_step=7455.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  69%|██████▉   | 833/1208 [22:53<10:18,  1.65s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.06e-5, train/loss_step=0.0197, global_step=7456.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  69%|██████▉   | 834/1208 [22:54<10:16,  1.65s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.06e-5, train/loss_step=0.0197, global_step=7456.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  69%|██████▉   | 834/1208 [22:54<10:16,  1.65s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0041, train/loss_vlb_step=2.31e-5, train/loss_step=0.0041, global_step=7456.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  69%|██████▉   | 835/1208 [22:55<10:14,  1.65s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0041, train/loss_vlb_step=2.31e-5, train/loss_step=0.0041, global_step=7456.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  69%|██████▉   | 835/1208 [22:55<10:14,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.86e-5, train/loss_step=0.0133, global_step=7456.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  69%|██████▉   | 836/1208 [22:58<10:13,  1.65s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.86e-5, train/loss_step=0.0133, global_step=7456.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  69%|██████▉   | 836/1208 [22:58<10:13,  1.65s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=3.13e-5, train/loss_step=0.00615, global_step=7456.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  69%|██████▉   | 837/1208 [22:59<10:11,  1.65s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=3.13e-5, train/loss_step=0.00615, global_step=7456.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  69%|██████▉   | 837/1208 [22:59<10:11,  1.65s/it, loss=0.127, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00128, train/loss_step=0.276, global_step=7457.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  69%|██████▉   | 838/1208 [23:01<10:09,  1.65s/it, loss=0.127, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00128, train/loss_step=0.276, global_step=7457.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  69%|██████▉   | 838/1208 [23:01<10:09,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.000174, train/loss_step=0.0485, global_step=7457.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  69%|██████▉   | 839/1208 [23:02<10:07,  1.65s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.000174, train/loss_step=0.0485, global_step=7457.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  69%|██████▉   | 839/1208 [23:02<10:07,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.687, train/loss_vlb_step=0.0161, train/loss_step=0.687, global_step=7457.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  70%|██████▉   | 840/1208 [23:05<10:06,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.687, train/loss_vlb_step=0.0161, train/loss_step=0.687, global_step=7457.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  70%|██████▉   | 840/1208 [23:05<10:06,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.47e-5, train/loss_step=0.018, global_step=7457.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  70%|██████▉   | 841/1208 [23:06<10:04,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.47e-5, train/loss_step=0.018, global_step=7457.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  70%|██████▉   | 841/1208 [23:06<10:04,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00617, train/loss_vlb_step=3.19e-5, train/loss_step=0.00617, global_step=7458.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  70%|██████▉   | 842/1208 [23:07<10:03,  1.65s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00617, train/loss_vlb_step=3.19e-5, train/loss_step=0.00617, global_step=7458.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  70%|██████▉   | 842/1208 [23:07<10:03,  1.65s/it, loss=0.17, v_num=0, train/loss_simple_step=0.506, train/loss_vlb_step=0.00419, train/loss_step=0.506, global_step=7458.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]     Epoch 24:  70%|██████▉   | 843/1208 [23:08<10:01,  1.65s/it, loss=0.17, v_num=0, train/loss_simple_step=0.506, train/loss_vlb_step=0.00419, train/loss_step=0.506, global_step=7458.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  70%|██████▉   | 843/1208 [23:08<10:01,  1.65s/it, loss=0.178, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000658, train/loss_step=0.178, global_step=7458.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  70%|██████▉   | 844/1208 [23:11<10:00,  1.65s/it, loss=0.178, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000658, train/loss_step=0.178, global_step=7458.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  70%|██████▉   | 844/1208 [23:11<10:00,  1.65s/it, loss=0.19, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00112, train/loss_step=0.268, global_step=7458.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  70%|██████▉   | 845/1208 [23:12<09:58,  1.65s/it, loss=0.19, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00112, train/loss_step=0.268, global_step=7458.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  70%|██████▉   | 845/1208 [23:12<09:58,  1.65s/it, loss=0.201, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000817, train/loss_step=0.228, global_step=7459.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  70%|███████   | 846/1208 [23:13<09:56,  1.65s/it, loss=0.201, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000817, train/loss_step=0.228, global_step=7459.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  70%|███████   | 846/1208 [23:13<09:56,  1.65s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=1.99e-5, train/loss_step=0.00362, global_step=7459.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  70%|███████   | 847/1208 [23:14<09:54,  1.65s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=1.99e-5, train/loss_step=0.00362, global_step=7459.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  70%|███████   | 847/1208 [23:14<09:54,  1.65s/it, loss=0.174, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000344, train/loss_step=0.104, global_step=7459.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  70%|███████   | 848/1208 [23:17<09:53,  1.65s/it, loss=0.174, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000344, train/loss_step=0.104, global_step=7459.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  70%|███████   | 848/1208 [23:17<09:53,  1.65s/it, loss=0.166, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000685, train/loss_step=0.192, global_step=7459.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  70%|███████   | 849/1208 [23:19<09:51,  1.65s/it, loss=0.166, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000685, train/loss_step=0.192, global_step=7459.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  70%|███████   | 849/1208 [23:19<09:51,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00775, train/loss_vlb_step=3.83e-5, train/loss_step=0.00775, global_step=7460.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  70%|███████   | 850/1208 [23:20<09:49,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00775, train/loss_vlb_step=3.83e-5, train/loss_step=0.00775, global_step=7460.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  70%|███████   | 850/1208 [23:20<09:49,  1.65s/it, loss=0.175, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00117, train/loss_step=0.280, global_step=7460.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  70%|███████   | 851/1208 [23:21<09:47,  1.65s/it, loss=0.175, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00117, train/loss_step=0.280, global_step=7460.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  70%|███████   | 851/1208 [23:21<09:47,  1.65s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0928, train/loss_vlb_step=0.000306, train/loss_step=0.0928, global_step=7460.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  71%|███████   | 852/1208 [23:24<09:46,  1.65s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0928, train/loss_vlb_step=0.000306, train/loss_step=0.0928, global_step=7460.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  71%|███████   | 852/1208 [23:24<09:46,  1.65s/it, loss=0.166, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00255, train/loss_step=0.376, global_step=7460.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  71%|███████   | 853/1208 [23:25<09:44,  1.65s/it, loss=0.166, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00255, train/loss_step=0.376, global_step=7460.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  71%|███████   | 853/1208 [23:25<09:44,  1.65s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.13e-5, train/loss_step=0.0139, global_step=7461.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  71%|███████   | 854/1208 [23:26<09:42,  1.65s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.13e-5, train/loss_step=0.0139, global_step=7461.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  71%|███████   | 854/1208 [23:26<09:42,  1.65s/it, loss=0.18, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00127, train/loss_step=0.299, global_step=7461.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  71%|███████   | 855/1208 [23:27<09:41,  1.65s/it, loss=0.18, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00127, train/loss_step=0.299, global_step=7461.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  71%|███████   | 855/1208 [23:27<09:41,  1.65s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0831, train/loss_vlb_step=0.000279, train/loss_step=0.0831, global_step=7461.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  71%|███████   | 856/1208 [23:30<09:40,  1.65s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0831, train/loss_vlb_step=0.000279, train/loss_step=0.0831, global_step=7461.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  71%|███████   | 856/1208 [23:30<09:40,  1.65s/it, loss=0.208, v_num=0, train/loss_simple_step=0.487, train/loss_vlb_step=0.00479, train/loss_step=0.487, global_step=7461.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  71%|███████   | 857/1208 [23:31<09:38,  1.65s/it, loss=0.208, v_num=0, train/loss_simple_step=0.487, train/loss_vlb_step=0.00479, train/loss_step=0.487, global_step=7461.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  71%|███████   | 857/1208 [23:31<09:38,  1.65s/it, loss=0.207, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00102, train/loss_step=0.251, global_step=7462.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  71%|███████   | 858/1208 [23:32<09:36,  1.65s/it, loss=0.207, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00102, train/loss_step=0.251, global_step=7462.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  71%|███████   | 858/1208 [23:32<09:36,  1.65s/it, loss=0.204, v_num=0, train/loss_simple_step=0.00372, train/loss_vlb_step=2.01e-5, train/loss_step=0.00372, global_step=7462.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  71%|███████   | 859/1208 [23:33<09:34,  1.65s/it, loss=0.204, v_num=0, train/loss_simple_step=0.00372, train/loss_vlb_step=2.01e-5, train/loss_step=0.00372, global_step=7462.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  71%|███████   | 859/1208 [23:33<09:34,  1.65s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.49e-5, train/loss_step=0.0026, global_step=7462.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  71%|███████   | 860/1208 [23:36<09:33,  1.65s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.49e-5, train/loss_step=0.0026, global_step=7462.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  71%|███████   | 860/1208 [23:36<09:33,  1.65s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00237, train/loss_vlb_step=1.4e-5, train/loss_step=0.00237, global_step=7462.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  71%|███████▏  | 861/1208 [23:38<09:31,  1.65s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00237, train/loss_vlb_step=1.4e-5, train/loss_step=0.00237, global_step=7462.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  71%|███████▏  | 861/1208 [23:38<09:31,  1.65s/it, loss=0.186, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00229, train/loss_step=0.346, global_step=7463.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  71%|███████▏  | 862/1208 [23:39<09:29,  1.65s/it, loss=0.186, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00229, train/loss_step=0.346, global_step=7463.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  71%|███████▏  | 862/1208 [23:39<09:29,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00389, train/loss_vlb_step=2.09e-5, train/loss_step=0.00389, global_step=7463.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  71%|███████▏  | 863/1208 [23:40<09:27,  1.65s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00389, train/loss_vlb_step=2.09e-5, train/loss_step=0.00389, global_step=7463.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  71%|███████▏  | 863/1208 [23:40<09:27,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.55e-5, train/loss_step=0.00278, global_step=7463.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  72%|███████▏  | 864/1208 [23:43<09:26,  1.65s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.55e-5, train/loss_step=0.00278, global_step=7463.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  72%|███████▏  | 864/1208 [23:43<09:26,  1.65s/it, loss=0.145, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.00038, train/loss_step=0.115, global_step=7463.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  72%|███████▏  | 865/1208 [23:44<09:24,  1.65s/it, loss=0.145, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.00038, train/loss_step=0.115, global_step=7463.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  72%|███████▏  | 865/1208 [23:44<09:24,  1.65s/it, loss=0.166, v_num=0, train/loss_simple_step=0.658, train/loss_vlb_step=0.0148, train/loss_step=0.658, global_step=7464.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  72%|███████▏  | 866/1208 [23:45<09:22,  1.65s/it, loss=0.166, v_num=0, train/loss_simple_step=0.658, train/loss_vlb_step=0.0148, train/loss_step=0.658, global_step=7464.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  72%|███████▏  | 866/1208 [23:45<09:22,  1.65s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000103, train/loss_step=0.0268, global_step=7464.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  72%|███████▏  | 867/1208 [23:46<09:21,  1.65s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000103, train/loss_step=0.0268, global_step=7464.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  72%|███████▏  | 867/1208 [23:46<09:21,  1.65s/it, loss=0.181, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.0021, train/loss_step=0.370, global_step=7464.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  72%|███████▏  | 868/1208 [23:49<09:19,  1.65s/it, loss=0.181, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.0021, train/loss_step=0.370, global_step=7464.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  72%|███████▏  | 868/1208 [23:49<09:19,  1.65s/it, loss=0.2, v_num=0, train/loss_simple_step=0.568, train/loss_vlb_step=0.0123, train/loss_step=0.568, global_step=7464.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  72%|███████▏  | 869/1208 [23:50<09:18,  1.65s/it, loss=0.2, v_num=0, train/loss_simple_step=0.568, train/loss_vlb_step=0.0123, train/loss_step=0.568, global_step=7464.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  72%|███████▏  | 869/1208 [23:50<09:18,  1.65s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.06e-5, train/loss_step=0.0153, global_step=7465.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  72%|███████▏  | 870/1208 [23:51<09:16,  1.65s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.06e-5, train/loss_step=0.0153, global_step=7465.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  72%|███████▏  | 870/1208 [23:51<09:16,  1.65s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000119, train/loss_step=0.0314, global_step=7465.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  72%|███████▏  | 871/1208 [23:52<09:14,  1.64s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000119, train/loss_step=0.0314, global_step=7465.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  72%|███████▏  | 871/1208 [23:52<09:14,  1.64s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.42e-5, train/loss_step=0.00251, global_step=7465.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  72%|███████▏  | 872/1208 [23:55<09:13,  1.65s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.42e-5, train/loss_step=0.00251, global_step=7465.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  72%|███████▏  | 872/1208 [23:55<09:13,  1.65s/it, loss=0.189, v_num=0, train/loss_simple_step=0.505, train/loss_vlb_step=0.00598, train/loss_step=0.505, global_step=7465.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  72%|███████▏  | 873/1208 [23:57<09:11,  1.65s/it, loss=0.189, v_num=0, train/loss_simple_step=0.505, train/loss_vlb_step=0.00598, train/loss_step=0.505, global_step=7465.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  72%|███████▏  | 873/1208 [23:57<09:11,  1.65s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0411, train/loss_vlb_step=0.000147, train/loss_step=0.0411, global_step=7466.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  72%|███████▏  | 874/1208 [23:58<09:09,  1.65s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0411, train/loss_vlb_step=0.000147, train/loss_step=0.0411, global_step=7466.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  72%|███████▏  | 874/1208 [23:58<09:09,  1.65s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000144, train/loss_step=0.0387, global_step=7466.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  72%|███████▏  | 875/1208 [23:59<09:07,  1.64s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000144, train/loss_step=0.0387, global_step=7466.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  72%|███████▏  | 875/1208 [23:59<09:07,  1.64s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=6.94e-5, train/loss_step=0.0163, global_step=7466.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  73%|███████▎  | 876/1208 [24:02<09:06,  1.65s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=6.94e-5, train/loss_step=0.0163, global_step=7466.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  73%|███████▎  | 876/1208 [24:02<09:06,  1.65s/it, loss=0.172, v_num=0, train/loss_simple_step=0.446, train/loss_vlb_step=0.00538, train/loss_step=0.446, global_step=7466.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  73%|███████▎  | 877/1208 [24:03<09:04,  1.65s/it, loss=0.172, v_num=0, train/loss_simple_step=0.446, train/loss_vlb_step=0.00538, train/loss_step=0.446, global_step=7466.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  73%|███████▎  | 877/1208 [24:03<09:04,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0532, train/loss_vlb_step=0.000189, train/loss_step=0.0532, global_step=7467.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  73%|███████▎  | 878/1208 [24:04<09:02,  1.65s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0532, train/loss_vlb_step=0.000189, train/loss_step=0.0532, global_step=7467.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  73%|███████▎  | 878/1208 [24:04<09:02,  1.65s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0357, train/loss_vlb_step=0.00013, train/loss_step=0.0357, global_step=7467.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  73%|███████▎  | 879/1208 [24:05<09:01,  1.64s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0357, train/loss_vlb_step=0.00013, train/loss_step=0.0357, global_step=7467.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  73%|███████▎  | 879/1208 [24:05<09:01,  1.64s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=4.97e-5, train/loss_step=0.0109, global_step=7467.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  73%|███████▎  | 880/1208 [24:08<08:59,  1.65s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=4.97e-5, train/loss_step=0.0109, global_step=7467.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  73%|███████▎  | 880/1208 [24:08<08:59,  1.65s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0997, train/loss_vlb_step=0.000333, train/loss_step=0.0997, global_step=7467.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  73%|███████▎  | 881/1208 [24:09<08:58,  1.65s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0997, train/loss_vlb_step=0.000333, train/loss_step=0.0997, global_step=7467.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  73%|███████▎  | 881/1208 [24:09<08:58,  1.65s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.45e-5, train/loss_step=0.0174, global_step=7468.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  73%|███████▎  | 882/1208 [24:10<08:56,  1.64s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.45e-5, train/loss_step=0.0174, global_step=7468.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  73%|███████▎  | 882/1208 [24:10<08:56,  1.64s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0826, train/loss_vlb_step=0.000272, train/loss_step=0.0826, global_step=7468.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  73%|███████▎  | 883/1208 [24:11<08:54,  1.64s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0826, train/loss_vlb_step=0.000272, train/loss_step=0.0826, global_step=7468.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  73%|███████▎  | 883/1208 [24:11<08:54,  1.64s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0566, train/loss_vlb_step=0.000196, train/loss_step=0.0566, global_step=7468.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  73%|███████▎  | 884/1208 [24:14<08:53,  1.65s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0566, train/loss_vlb_step=0.000196, train/loss_step=0.0566, global_step=7468.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  73%|███████▎  | 884/1208 [24:14<08:53,  1.65s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000157, train/loss_step=0.0448, global_step=7468.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  73%|███████▎  | 885/1208 [24:16<08:51,  1.65s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000157, train/loss_step=0.0448, global_step=7468.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  73%|███████▎  | 885/1208 [24:16<08:51,  1.65s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000162, train/loss_step=0.0449, global_step=7469.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  73%|███████▎  | 886/1208 [24:17<08:49,  1.64s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000162, train/loss_step=0.0449, global_step=7469.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  73%|███████▎  | 886/1208 [24:17<08:49,  1.64s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.000169, train/loss_step=0.0476, global_step=7469.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  73%|███████▎  | 887/1208 [24:18<08:47,  1.64s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.000169, train/loss_step=0.0476, global_step=7469.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  73%|███████▎  | 887/1208 [24:18<08:47,  1.64s/it, loss=0.114, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.00042, train/loss_step=0.127, global_step=7469.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  74%|███████▎  | 888/1208 [24:21<08:46,  1.65s/it, loss=0.114, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.00042, train/loss_step=0.127, global_step=7469.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  74%|███████▎  | 888/1208 [24:21<08:46,  1.65s/it, loss=0.096, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000793, train/loss_step=0.203, global_step=7469.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  74%|███████▎  | 889/1208 [24:22<08:44,  1.65s/it, loss=0.096, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000793, train/loss_step=0.203, global_step=7469.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  74%|███████▎  | 889/1208 [24:22<08:44,  1.65s/it, loss=0.103, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000528, train/loss_step=0.151, global_step=7470.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  74%|███████▎  | 890/1208 [24:23<08:42,  1.64s/it, loss=0.103, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000528, train/loss_step=0.151, global_step=7470.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  74%|███████▎  | 890/1208 [24:23<08:42,  1.64s/it, loss=0.111, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000766, train/loss_step=0.201, global_step=7470.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  74%|███████▍  | 891/1208 [24:24<08:41,  1.64s/it, loss=0.111, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000766, train/loss_step=0.201, global_step=7470.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  74%|███████▍  | 891/1208 [24:24<08:41,  1.64s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00866, train/loss_vlb_step=3.97e-5, train/loss_step=0.00866, global_step=7470.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  74%|███████▍  | 892/1208 [24:27<08:39,  1.65s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00866, train/loss_vlb_step=3.97e-5, train/loss_step=0.00866, global_step=7470.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  74%|███████▍  | 892/1208 [24:27<08:39,  1.65s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00108, train/loss_step=0.262, global_step=7470.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  74%|███████▍  | 893/1208 [24:28<08:38,  1.64s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00108, train/loss_step=0.262, global_step=7470.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  74%|███████▍  | 893/1208 [24:28<08:38,  1.64s/it, loss=0.119, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00326, train/loss_step=0.430, global_step=7471.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  74%|███████▍  | 894/1208 [24:29<08:36,  1.64s/it, loss=0.119, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00326, train/loss_step=0.430, global_step=7471.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  74%|███████▍  | 894/1208 [24:29<08:36,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000421, train/loss_step=0.128, global_step=7471.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  74%|███████▍  | 895/1208 [24:30<08:34,  1.64s/it, loss=0.123, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000421, train/loss_step=0.128, global_step=7471.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  74%|███████▍  | 895/1208 [24:30<08:34,  1.64s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0829, train/loss_vlb_step=0.000273, train/loss_step=0.0829, global_step=7471.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  74%|███████▍  | 896/1208 [24:34<08:33,  1.65s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0829, train/loss_vlb_step=0.000273, train/loss_step=0.0829, global_step=7471.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  74%|███████▍  | 896/1208 [24:34<08:33,  1.65s/it, loss=0.116, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000904, train/loss_step=0.239, global_step=7471.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  74%|███████▍  | 897/1208 [24:35<08:31,  1.64s/it, loss=0.116, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000904, train/loss_step=0.239, global_step=7471.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  74%|███████▍  | 897/1208 [24:35<08:31,  1.64s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0614, train/loss_vlb_step=0.000218, train/loss_step=0.0614, global_step=7472.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  74%|███████▍  | 898/1208 [24:36<08:29,  1.64s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0614, train/loss_vlb_step=0.000218, train/loss_step=0.0614, global_step=7472.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  74%|███████▍  | 898/1208 [24:36<08:29,  1.64s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.12e-5, train/loss_step=0.0108, global_step=7472.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  74%|███████▍  | 899/1208 [24:37<08:27,  1.64s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.12e-5, train/loss_step=0.0108, global_step=7472.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  74%|███████▍  | 899/1208 [24:37<08:27,  1.64s/it, loss=0.15, v_num=0, train/loss_simple_step=0.704, train/loss_vlb_step=0.0364, train/loss_step=0.704, global_step=7472.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  75%|███████▍  | 900/1208 [24:40<08:26,  1.64s/it, loss=0.15, v_num=0, train/loss_simple_step=0.704, train/loss_vlb_step=0.0364, train/loss_step=0.704, global_step=7472.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  75%|███████▍  | 900/1208 [24:40<08:26,  1.64s/it, loss=0.149, v_num=0, train/loss_simple_step=0.081, train/loss_vlb_step=0.000272, train/loss_step=0.081, global_step=7472.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.76it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.83it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.82it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.80it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.82it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.83it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.76it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.83it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.81it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.76it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.76it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.76it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.76it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.81it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.82it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.81it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 24:  75%|███████▍  | 901/1208 [25:10<08:34,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.081, train/loss_vlb_step=0.000272, train/loss_step=0.081, global_step=7472.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  75%|███████▍  | 901/1208 [25:10<08:34,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.61e-5, train/loss_step=0.0128, global_step=7473.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  75%|███████▍  | 902/1208 [25:11<08:32,  1.68s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.61e-5, train/loss_step=0.0128, global_step=7473.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  75%|███████▍  | 902/1208 [25:11<08:32,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.29e-5, train/loss_step=0.0166, global_step=7473.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  75%|███████▍  | 903/1208 [25:13<08:31,  1.68s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.29e-5, train/loss_step=0.0166, global_step=7473.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  75%|███████▍  | 903/1208 [25:13<08:31,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.57e-5, train/loss_step=0.0184, global_step=7473.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  75%|███████▍  | 904/1208 [25:16<08:29,  1.68s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.57e-5, train/loss_step=0.0184, global_step=7473.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  75%|███████▍  | 904/1208 [25:16<08:29,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00178, train/loss_step=0.321, global_step=7473.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  75%|███████▍  | 905/1208 [25:17<08:27,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00178, train/loss_step=0.321, global_step=7473.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  75%|███████▍  | 905/1208 [25:17<08:27,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00682, train/loss_vlb_step=3.51e-5, train/loss_step=0.00682, global_step=7474.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  75%|███████▌  | 906/1208 [25:18<08:26,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00682, train/loss_vlb_step=3.51e-5, train/loss_step=0.00682, global_step=7474.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  75%|███████▌  | 906/1208 [25:18<08:26,  1.68s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00587, train/loss_vlb_step=2.95e-5, train/loss_step=0.00587, global_step=7474.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  75%|███████▌  | 907/1208 [25:19<08:24,  1.67s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00587, train/loss_vlb_step=2.95e-5, train/loss_step=0.00587, global_step=7474.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  75%|███████▌  | 907/1208 [25:19<08:24,  1.67s/it, loss=0.156, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000623, train/loss_step=0.185, global_step=7474.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  75%|███████▌  | 908/1208 [25:22<08:23,  1.68s/it, loss=0.156, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000623, train/loss_step=0.185, global_step=7474.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  75%|███████▌  | 908/1208 [25:22<08:23,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000128, train/loss_step=0.0335, global_step=7474.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  75%|███████▌  | 909/1208 [25:23<08:21,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000128, train/loss_step=0.0335, global_step=7474.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  75%|███████▌  | 909/1208 [25:23<08:21,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.37e-5, train/loss_step=0.0142, global_step=7475.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  75%|███████▌  | 910/1208 [25:24<08:19,  1.68s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.37e-5, train/loss_step=0.0142, global_step=7475.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  75%|███████▌  | 910/1208 [25:24<08:19,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000559, train/loss_step=0.165, global_step=7475.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  75%|███████▌  | 911/1208 [25:25<08:17,  1.67s/it, loss=0.139, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000559, train/loss_step=0.165, global_step=7475.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  75%|███████▌  | 911/1208 [25:25<08:17,  1.67s/it, loss=0.157, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.0026, train/loss_step=0.356, global_step=7475.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  75%|███████▌  | 912/1208 [25:28<08:16,  1.68s/it, loss=0.157, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.0026, train/loss_step=0.356, global_step=7475.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  75%|███████▌  | 912/1208 [25:28<08:16,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0796, train/loss_vlb_step=0.000273, train/loss_step=0.0796, global_step=7475.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  76%|███████▌  | 913/1208 [25:29<08:14,  1.68s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0796, train/loss_vlb_step=0.000273, train/loss_step=0.0796, global_step=7475.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  76%|███████▌  | 913/1208 [25:29<08:14,  1.68s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0907, train/loss_vlb_step=0.0003, train/loss_step=0.0907, global_step=7476.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  76%|███████▌  | 914/1208 [25:30<08:12,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0907, train/loss_vlb_step=0.0003, train/loss_step=0.0907, global_step=7476.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  76%|███████▌  | 914/1208 [25:30<08:12,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0611, train/loss_vlb_step=0.000208, train/loss_step=0.0611, global_step=7476.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  76%|███████▌  | 915/1208 [25:31<08:10,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0611, train/loss_vlb_step=0.000208, train/loss_step=0.0611, global_step=7476.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  76%|███████▌  | 915/1208 [25:31<08:10,  1.67s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0578, train/loss_vlb_step=0.000197, train/loss_step=0.0578, global_step=7476.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  76%|███████▌  | 916/1208 [25:35<08:09,  1.68s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0578, train/loss_vlb_step=0.000197, train/loss_step=0.0578, global_step=7476.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  76%|███████▌  | 916/1208 [25:35<08:09,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.504, train/loss_vlb_step=0.00764, train/loss_step=0.504, global_step=7476.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  76%|███████▌  | 917/1208 [25:36<08:07,  1.68s/it, loss=0.139, v_num=0, train/loss_simple_step=0.504, train/loss_vlb_step=0.00764, train/loss_step=0.504, global_step=7476.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  76%|███████▌  | 917/1208 [25:36<08:07,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00456, train/loss_vlb_step=2.43e-5, train/loss_step=0.00456, global_step=7477.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  76%|███████▌  | 918/1208 [25:37<08:05,  1.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00456, train/loss_vlb_step=2.43e-5, train/loss_step=0.00456, global_step=7477.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  76%|███████▌  | 918/1208 [25:37<08:05,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=7477.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  76%|███████▌  | 919/1208 [25:38<08:03,  1.67s/it, loss=0.141, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=7477.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  76%|███████▌  | 919/1208 [25:38<08:03,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000846, train/loss_step=0.217, global_step=7477.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  76%|███████▌  | 920/1208 [25:41<08:02,  1.68s/it, loss=0.117, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000846, train/loss_step=0.217, global_step=7477.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  76%|███████▌  | 920/1208 [25:41<08:02,  1.68s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000109, train/loss_step=0.0282, global_step=7477.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  76%|███████▌  | 921/1208 [25:42<08:00,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000109, train/loss_step=0.0282, global_step=7477.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  76%|███████▌  | 921/1208 [25:42<08:00,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.00058, train/loss_step=0.166, global_step=7478.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  76%|███████▋  | 922/1208 [25:43<07:58,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.00058, train/loss_step=0.166, global_step=7478.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  76%|███████▋  | 922/1208 [25:43<07:58,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.12e-5, train/loss_step=0.0142, global_step=7478.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  76%|███████▋  | 923/1208 [25:44<07:56,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.12e-5, train/loss_step=0.0142, global_step=7478.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  76%|███████▋  | 923/1208 [25:44<07:56,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0051, train/loss_vlb_step=2.68e-5, train/loss_step=0.0051, global_step=7478.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  76%|███████▋  | 924/1208 [25:47<07:55,  1.68s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0051, train/loss_vlb_step=2.68e-5, train/loss_step=0.0051, global_step=7478.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  76%|███████▋  | 924/1208 [25:47<07:55,  1.68s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0492, train/loss_vlb_step=0.00017, train/loss_step=0.0492, global_step=7478.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  77%|███████▋  | 925/1208 [25:48<07:53,  1.67s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0492, train/loss_vlb_step=0.00017, train/loss_step=0.0492, global_step=7478.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  77%|███████▋  | 925/1208 [25:48<07:53,  1.67s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000147, train/loss_step=0.0402, global_step=7479.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  77%|███████▋  | 926/1208 [25:49<07:51,  1.67s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000147, train/loss_step=0.0402, global_step=7479.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  77%|███████▋  | 926/1208 [25:49<07:51,  1.67s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0854, train/loss_vlb_step=0.000281, train/loss_step=0.0854, global_step=7479.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  77%|███████▋  | 927/1208 [25:50<07:50,  1.67s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0854, train/loss_vlb_step=0.000281, train/loss_step=0.0854, global_step=7479.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  77%|███████▋  | 927/1208 [25:50<07:50,  1.67s/it, loss=0.107, v_num=0, train/loss_simple_step=0.064, train/loss_vlb_step=0.00022, train/loss_step=0.064, global_step=7479.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  77%|███████▋  | 928/1208 [25:54<07:48,  1.67s/it, loss=0.107, v_num=0, train/loss_simple_step=0.064, train/loss_vlb_step=0.00022, train/loss_step=0.064, global_step=7479.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  77%|███████▋  | 928/1208 [25:54<07:48,  1.67s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00588, train/loss_vlb_step=2.95e-5, train/loss_step=0.00588, global_step=7479.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  77%|███████▋  | 929/1208 [25:55<07:47,  1.67s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00588, train/loss_vlb_step=2.95e-5, train/loss_step=0.00588, global_step=7479.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  77%|███████▋  | 929/1208 [25:55<07:47,  1.67s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.35e-5, train/loss_step=0.00235, global_step=7480.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  77%|███████▋  | 930/1208 [25:56<07:45,  1.67s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.35e-5, train/loss_step=0.00235, global_step=7480.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  77%|███████▋  | 930/1208 [25:56<07:45,  1.67s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.000149, train/loss_step=0.041, global_step=7480.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  77%|███████▋  | 931/1208 [25:57<07:43,  1.67s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.000149, train/loss_step=0.041, global_step=7480.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  77%|███████▋  | 931/1208 [25:57<07:43,  1.67s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.054, train/loss_vlb_step=0.00019, train/loss_step=0.054, global_step=7480.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  77%|███████▋  | 932/1208 [26:00<07:42,  1.67s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.054, train/loss_vlb_step=0.00019, train/loss_step=0.054, global_step=7480.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  77%|███████▋  | 932/1208 [26:00<07:42,  1.67s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00119, train/loss_step=0.275, global_step=7480.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  77%|███████▋  | 933/1208 [26:01<07:40,  1.67s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00119, train/loss_step=0.275, global_step=7480.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  77%|███████▋  | 933/1208 [26:01<07:40,  1.67s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=7481.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  77%|███████▋  | 934/1208 [26:02<07:38,  1.67s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=7481.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  77%|███████▋  | 934/1208 [26:02<07:38,  1.67s/it, loss=0.105, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00106, train/loss_step=0.268, global_step=7481.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  77%|███████▋  | 935/1208 [26:03<07:36,  1.67s/it, loss=0.105, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00106, train/loss_step=0.268, global_step=7481.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  77%|███████▋  | 935/1208 [26:03<07:36,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00209, train/loss_step=0.369, global_step=7481.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  77%|███████▋  | 936/1208 [26:06<07:35,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00209, train/loss_step=0.369, global_step=7481.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  77%|███████▋  | 936/1208 [26:06<07:35,  1.67s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.0677, train/loss_vlb_step=0.000223, train/loss_step=0.0677, global_step=7481.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  78%|███████▊  | 937/1208 [26:07<07:33,  1.67s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.0677, train/loss_vlb_step=0.000223, train/loss_step=0.0677, global_step=7481.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  78%|███████▊  | 937/1208 [26:07<07:33,  1.67s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000128, train/loss_step=0.0342, global_step=7482.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  78%|███████▊  | 938/1208 [26:08<07:31,  1.67s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000128, train/loss_step=0.0342, global_step=7482.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  78%|███████▊  | 938/1208 [26:08<07:31,  1.67s/it, loss=0.101, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000393, train/loss_step=0.119, global_step=7482.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  78%|███████▊  | 939/1208 [26:09<07:29,  1.67s/it, loss=0.101, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000393, train/loss_step=0.119, global_step=7482.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  78%|███████▊  | 939/1208 [26:09<07:29,  1.67s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000145, train/loss_step=0.0406, global_step=7482.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  78%|███████▊  | 940/1208 [26:13<07:28,  1.67s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000145, train/loss_step=0.0406, global_step=7482.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  78%|███████▊  | 940/1208 [26:13<07:28,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.451, train/loss_vlb_step=0.00306, train/loss_step=0.451, global_step=7482.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  78%|███████▊  | 941/1208 [26:14<07:26,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.451, train/loss_vlb_step=0.00306, train/loss_step=0.451, global_step=7482.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  78%|███████▊  | 941/1208 [26:14<07:26,  1.67s/it, loss=0.119, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00124, train/loss_step=0.267, global_step=7483.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  78%|███████▊  | 942/1208 [26:15<07:24,  1.67s/it, loss=0.119, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00124, train/loss_step=0.267, global_step=7483.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  78%|███████▊  | 942/1208 [26:15<07:24,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000653, train/loss_step=0.187, global_step=7483.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  78%|███████▊  | 943/1208 [26:16<07:22,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000653, train/loss_step=0.187, global_step=7483.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  78%|███████▊  | 943/1208 [26:16<07:22,  1.67s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.36e-5, train/loss_step=0.0169, global_step=7483.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  78%|███████▊  | 944/1208 [26:19<07:21,  1.67s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.36e-5, train/loss_step=0.0169, global_step=7483.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  78%|███████▊  | 944/1208 [26:19<07:21,  1.67s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00514, train/loss_vlb_step=2.79e-5, train/loss_step=0.00514, global_step=7483.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  78%|███████▊  | 945/1208 [26:20<07:19,  1.67s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00514, train/loss_vlb_step=2.79e-5, train/loss_step=0.00514, global_step=7483.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  78%|███████▊  | 945/1208 [26:20<07:19,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000384, train/loss_step=0.116, global_step=7484.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  78%|███████▊  | 946/1208 [26:21<07:18,  1.67s/it, loss=0.13, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000384, train/loss_step=0.116, global_step=7484.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  78%|███████▊  | 946/1208 [26:21<07:18,  1.67s/it, loss=0.126, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.54e-5, train/loss_step=0.012, global_step=7484.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  78%|███████▊  | 947/1208 [26:22<07:16,  1.67s/it, loss=0.126, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.54e-5, train/loss_step=0.012, global_step=7484.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  78%|███████▊  | 947/1208 [26:22<07:16,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00318, train/loss_step=0.404, global_step=7484.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  78%|███████▊  | 948/1208 [26:25<07:14,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00318, train/loss_step=0.404, global_step=7484.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  78%|███████▊  | 948/1208 [26:25<07:14,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=2.45e-5, train/loss_step=0.00452, global_step=7484.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  79%|███████▊  | 949/1208 [26:26<07:13,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=2.45e-5, train/loss_step=0.00452, global_step=7484.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  79%|███████▊  | 949/1208 [26:26<07:13,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0795, train/loss_vlb_step=0.000272, train/loss_step=0.0795, global_step=7485.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  79%|███████▊  | 950/1208 [26:27<07:11,  1.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0795, train/loss_vlb_step=0.000272, train/loss_step=0.0795, global_step=7485.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  79%|███████▊  | 950/1208 [26:27<07:11,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=5.1e-5, train/loss_step=0.0107, global_step=7485.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  79%|███████▊  | 951/1208 [26:28<07:09,  1.67s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=5.1e-5, train/loss_step=0.0107, global_step=7485.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  79%|███████▊  | 951/1208 [26:28<07:09,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.58e-5, train/loss_step=0.0152, global_step=7485.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  79%|███████▉  | 952/1208 [26:32<07:08,  1.67s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.58e-5, train/loss_step=0.0152, global_step=7485.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  79%|███████▉  | 952/1208 [26:32<07:08,  1.67s/it, loss=0.142, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00107, train/loss_step=0.257, global_step=7485.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  79%|███████▉  | 953/1208 [26:33<07:06,  1.67s/it, loss=0.142, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00107, train/loss_step=0.257, global_step=7485.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  79%|███████▉  | 953/1208 [26:33<07:06,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000274, train/loss_step=0.0815, global_step=7486.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  79%|███████▉  | 954/1208 [26:34<07:04,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000274, train/loss_step=0.0815, global_step=7486.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  79%|███████▉  | 954/1208 [26:34<07:04,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000839, train/loss_step=0.220, global_step=7486.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  79%|███████▉  | 955/1208 [26:35<07:02,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000839, train/loss_step=0.220, global_step=7486.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  79%|███████▉  | 955/1208 [26:35<07:02,  1.67s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0927, train/loss_vlb_step=0.000306, train/loss_step=0.0927, global_step=7486.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  79%|███████▉  | 956/1208 [26:38<07:01,  1.67s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0927, train/loss_vlb_step=0.000306, train/loss_step=0.0927, global_step=7486.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  79%|███████▉  | 956/1208 [26:38<07:01,  1.67s/it, loss=0.126, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000386, train/loss_step=0.115, global_step=7486.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  79%|███████▉  | 957/1208 [26:39<06:59,  1.67s/it, loss=0.126, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000386, train/loss_step=0.115, global_step=7486.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  79%|███████▉  | 957/1208 [26:39<06:59,  1.67s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.000236, train/loss_step=0.0702, global_step=7487.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  79%|███████▉  | 958/1208 [26:40<06:57,  1.67s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.000236, train/loss_step=0.0702, global_step=7487.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  79%|███████▉  | 958/1208 [26:40<06:57,  1.67s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00995, train/loss_vlb_step=4.43e-5, train/loss_step=0.00995, global_step=7487.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  79%|███████▉  | 959/1208 [26:41<06:55,  1.67s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00995, train/loss_vlb_step=4.43e-5, train/loss_step=0.00995, global_step=7487.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  79%|███████▉  | 959/1208 [26:41<06:55,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000914, train/loss_step=0.223, global_step=7487.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  79%|███████▉  | 960/1208 [26:44<06:54,  1.67s/it, loss=0.132, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000914, train/loss_step=0.223, global_step=7487.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  79%|███████▉  | 960/1208 [26:44<06:54,  1.67s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.24e-5, train/loss_step=0.0021, global_step=7487.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  80%|███████▉  | 961/1208 [26:45<06:52,  1.67s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.24e-5, train/loss_step=0.0021, global_step=7487.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  80%|███████▉  | 961/1208 [26:45<06:52,  1.67s/it, loss=0.104, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000577, train/loss_step=0.167, global_step=7488.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  80%|███████▉  | 962/1208 [26:46<06:50,  1.67s/it, loss=0.104, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000577, train/loss_step=0.167, global_step=7488.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  80%|███████▉  | 962/1208 [26:46<06:50,  1.67s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.49e-5, train/loss_step=0.0142, global_step=7488.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  80%|███████▉  | 963/1208 [26:47<06:49,  1.67s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.49e-5, train/loss_step=0.0142, global_step=7488.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  80%|███████▉  | 963/1208 [26:47<06:49,  1.67s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.52e-5, train/loss_step=0.0121, global_step=7488.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  80%|███████▉  | 964/1208 [26:51<06:47,  1.67s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.52e-5, train/loss_step=0.0121, global_step=7488.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  80%|███████▉  | 964/1208 [26:51<06:47,  1.67s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.72e-5, train/loss_step=0.0234, global_step=7488.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  80%|███████▉  | 965/1208 [26:52<06:45,  1.67s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.72e-5, train/loss_step=0.0234, global_step=7488.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  80%|███████▉  | 965/1208 [26:52<06:45,  1.67s/it, loss=0.106, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.002, train/loss_step=0.314, global_step=7489.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]     Epoch 24:  80%|███████▉  | 966/1208 [26:53<06:44,  1.67s/it, loss=0.106, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.002, train/loss_step=0.314, global_step=7489.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  80%|███████▉  | 966/1208 [26:53<06:44,  1.67s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=3.01e-5, train/loss_step=0.00619, global_step=7489.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  80%|████████  | 967/1208 [26:54<06:42,  1.67s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=3.01e-5, train/loss_step=0.00619, global_step=7489.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  80%|████████  | 967/1208 [26:54<06:42,  1.67s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000667, train/loss_step=0.188, global_step=7489.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  80%|████████  | 968/1208 [26:57<06:41,  1.67s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000667, train/loss_step=0.188, global_step=7489.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  80%|████████  | 968/1208 [26:57<06:41,  1.67s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.0655, train/loss_vlb_step=0.000218, train/loss_step=0.0655, global_step=7489.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  80%|████████  | 969/1208 [26:58<06:39,  1.67s/it, loss=0.0983, v_num=0, train/loss_simple_step=0.0655, train/loss_vlb_step=0.000218, train/loss_step=0.0655, global_step=7489.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  80%|████████  | 969/1208 [26:58<06:39,  1.67s/it, loss=0.108, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00121, train/loss_step=0.267, global_step=7490.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  80%|████████  | 970/1208 [26:59<06:37,  1.67s/it, loss=0.108, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00121, train/loss_step=0.267, global_step=7490.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  80%|████████  | 970/1208 [26:59<06:37,  1.67s/it, loss=0.125, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00205, train/loss_step=0.349, global_step=7490.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  80%|████████  | 971/1208 [27:00<06:35,  1.67s/it, loss=0.125, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00205, train/loss_step=0.349, global_step=7490.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  80%|████████  | 971/1208 [27:00<06:35,  1.67s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000129, train/loss_step=0.0327, global_step=7490.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  80%|████████  | 972/1208 [27:03<06:34,  1.67s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000129, train/loss_step=0.0327, global_step=7490.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  80%|████████  | 972/1208 [27:03<06:34,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000141, train/loss_step=0.0386, global_step=7490.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  81%|████████  | 973/1208 [27:04<06:32,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000141, train/loss_step=0.0386, global_step=7490.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  81%|████████  | 973/1208 [27:04<06:32,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=7491.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  81%|████████  | 974/1208 [27:05<06:30,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=7491.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  81%|████████  | 974/1208 [27:05<06:30,  1.67s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.34e-5, train/loss_step=0.0147, global_step=7491.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  81%|████████  | 975/1208 [27:06<06:28,  1.67s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.34e-5, train/loss_step=0.0147, global_step=7491.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  81%|████████  | 975/1208 [27:06<06:28,  1.67s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0766, train/loss_vlb_step=0.000257, train/loss_step=0.0766, global_step=7491.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  81%|████████  | 976/1208 [27:10<06:27,  1.67s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0766, train/loss_vlb_step=0.000257, train/loss_step=0.0766, global_step=7491.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  81%|████████  | 976/1208 [27:10<06:27,  1.67s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.000294, train/loss_step=0.0894, global_step=7491.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  81%|████████  | 977/1208 [27:11<06:25,  1.67s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.000294, train/loss_step=0.0894, global_step=7491.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  81%|████████  | 977/1208 [27:11<06:25,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.422, train/loss_vlb_step=0.0029, train/loss_step=0.422, global_step=7492.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  81%|████████  | 978/1208 [27:12<06:23,  1.67s/it, loss=0.122, v_num=0, train/loss_simple_step=0.422, train/loss_vlb_step=0.0029, train/loss_step=0.422, global_step=7492.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  81%|████████  | 978/1208 [27:12<06:23,  1.67s/it, loss=0.129, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000494, train/loss_step=0.145, global_step=7492.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  81%|████████  | 979/1208 [27:13<06:22,  1.67s/it, loss=0.129, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000494, train/loss_step=0.145, global_step=7492.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  81%|████████  | 979/1208 [27:13<06:22,  1.67s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.6e-5, train/loss_step=0.00285, global_step=7492.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  81%|████████  | 980/1208 [27:16<06:20,  1.67s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.6e-5, train/loss_step=0.00285, global_step=7492.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  81%|████████  | 980/1208 [27:16<06:20,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00163, train/loss_step=0.323, global_step=7492.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  81%|████████  | 981/1208 [27:17<06:18,  1.67s/it, loss=0.134, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00163, train/loss_step=0.323, global_step=7492.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  81%|████████  | 981/1208 [27:17<06:18,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000982, train/loss_step=0.245, global_step=7493.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  81%|████████▏ | 982/1208 [27:18<06:17,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000982, train/loss_step=0.245, global_step=7493.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  81%|████████▏ | 982/1208 [27:18<06:17,  1.67s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0419, train/loss_vlb_step=0.000155, train/loss_step=0.0419, global_step=7493.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  81%|████████▏ | 983/1208 [27:19<06:15,  1.67s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0419, train/loss_vlb_step=0.000155, train/loss_step=0.0419, global_step=7493.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  81%|████████▏ | 983/1208 [27:19<06:15,  1.67s/it, loss=0.144, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000367, train/loss_step=0.112, global_step=7493.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  81%|████████▏ | 984/1208 [27:22<06:13,  1.67s/it, loss=0.144, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000367, train/loss_step=0.112, global_step=7493.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  81%|████████▏ | 984/1208 [27:22<06:13,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=7493.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  82%|████████▏ | 985/1208 [27:23<06:12,  1.67s/it, loss=0.149, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=7493.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  82%|████████▏ | 985/1208 [27:23<06:12,  1.67s/it, loss=0.135, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000176, train/loss_step=0.050, global_step=7494.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  82%|████████▏ | 986/1208 [27:24<06:10,  1.67s/it, loss=0.135, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000176, train/loss_step=0.050, global_step=7494.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  82%|████████▏ | 986/1208 [27:24<06:10,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0946, train/loss_vlb_step=0.000313, train/loss_step=0.0946, global_step=7494.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  82%|████████▏ | 987/1208 [27:25<06:08,  1.67s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0946, train/loss_vlb_step=0.000313, train/loss_step=0.0946, global_step=7494.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  82%|████████▏ | 987/1208 [27:25<06:08,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=1.79e-5, train/loss_step=0.00325, global_step=7494.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  82%|████████▏ | 988/1208 [27:29<06:07,  1.67s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=1.79e-5, train/loss_step=0.00325, global_step=7494.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  82%|████████▏ | 988/1208 [27:29<06:07,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.42e-5, train/loss_step=0.00247, global_step=7494.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  82%|████████▏ | 989/1208 [27:30<06:05,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.42e-5, train/loss_step=0.00247, global_step=7494.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  82%|████████▏ | 989/1208 [27:30<06:05,  1.67s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000149, train/loss_step=0.0407, global_step=7495.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  82%|████████▏ | 990/1208 [27:31<06:03,  1.67s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000149, train/loss_step=0.0407, global_step=7495.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  82%|████████▏ | 990/1208 [27:31<06:03,  1.67s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.95e-5, train/loss_step=0.0107, global_step=7495.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  82%|████████▏ | 991/1208 [27:32<06:01,  1.67s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.95e-5, train/loss_step=0.0107, global_step=7495.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  82%|████████▏ | 991/1208 [27:32<06:01,  1.67s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.3e-5, train/loss_step=0.00219, global_step=7495.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  82%|████████▏ | 992/1208 [27:35<06:00,  1.67s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.3e-5, train/loss_step=0.00219, global_step=7495.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  82%|████████▏ | 992/1208 [27:35<06:00,  1.67s/it, loss=0.101, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000334, train/loss_step=0.102, global_step=7495.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  82%|████████▏ | 993/1208 [27:36<05:58,  1.67s/it, loss=0.101, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000334, train/loss_step=0.102, global_step=7495.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  82%|████████▏ | 993/1208 [27:36<05:58,  1.67s/it, loss=0.107, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00119, train/loss_step=0.253, global_step=7496.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  82%|████████▏ | 994/1208 [27:37<05:56,  1.67s/it, loss=0.107, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00119, train/loss_step=0.253, global_step=7496.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  82%|████████▏ | 994/1208 [27:37<05:56,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00158, train/loss_step=0.294, global_step=7496.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  82%|████████▏ | 995/1208 [27:38<05:55,  1.67s/it, loss=0.121, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00158, train/loss_step=0.294, global_step=7496.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  82%|████████▏ | 995/1208 [27:38<05:55,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=9.11e-6, train/loss_step=0.00153, global_step=7496.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  82%|████████▏ | 996/1208 [27:41<05:53,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=9.11e-6, train/loss_step=0.00153, global_step=7496.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  82%|████████▏ | 996/1208 [27:41<05:53,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0712, train/loss_vlb_step=0.00024, train/loss_step=0.0712, global_step=7496.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  83%|████████▎ | 997/1208 [27:43<05:51,  1.67s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0712, train/loss_vlb_step=0.00024, train/loss_step=0.0712, global_step=7496.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  83%|████████▎ | 997/1208 [27:43<05:51,  1.67s/it, loss=0.097, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000119, train/loss_step=0.0307, global_step=7497.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  83%|████████▎ | 998/1208 [27:44<05:50,  1.67s/it, loss=0.097, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000119, train/loss_step=0.0307, global_step=7497.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  83%|████████▎ | 998/1208 [27:44<05:50,  1.67s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.67e-5, train/loss_step=0.0219, global_step=7497.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  83%|████████▎ | 999/1208 [27:45<05:48,  1.67s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.67e-5, train/loss_step=0.0219, global_step=7497.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  83%|████████▎ | 999/1208 [27:45<05:48,  1.67s/it, loss=0.105, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.0013, train/loss_step=0.285, global_step=7497.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  83%|████████▎ | 1000/1208 [27:48<05:47,  1.67s/it, loss=0.105, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.0013, train/loss_step=0.285, global_step=7497.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  83%|████████▎ | 1000/1208 [27:48<05:47,  1.67s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000129, train/loss_step=0.0336, global_step=7497.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  83%|████████▎ | 1001/1208 [27:49<05:45,  1.67s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000129, train/loss_step=0.0336, global_step=7497.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  83%|████████▎ | 1001/1208 [27:49<05:45,  1.67s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000781, train/loss_step=0.212, global_step=7498.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  83%|████████▎ | 1002/1208 [27:50<05:43,  1.67s/it, loss=0.0889, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000781, train/loss_step=0.212, global_step=7498.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  83%|████████▎ | 1002/1208 [27:50<05:43,  1.67s/it, loss=0.104, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00222, train/loss_step=0.340, global_step=7498.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  83%|████████▎ | 1003/1208 [27:51<05:41,  1.67s/it, loss=0.104, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00222, train/loss_step=0.340, global_step=7498.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  83%|████████▎ | 1003/1208 [27:51<05:41,  1.67s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0635, train/loss_vlb_step=0.000221, train/loss_step=0.0635, global_step=7498.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  83%|████████▎ | 1004/1208 [27:54<05:40,  1.67s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0635, train/loss_vlb_step=0.000221, train/loss_step=0.0635, global_step=7498.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  83%|████████▎ | 1004/1208 [27:54<05:40,  1.67s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.00015, train/loss_step=0.0407, global_step=7498.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  83%|████████▎ | 1005/1208 [27:55<05:38,  1.67s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.00015, train/loss_step=0.0407, global_step=7498.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  83%|████████▎ | 1005/1208 [27:55<05:38,  1.67s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.049, train/loss_vlb_step=0.000167, train/loss_step=0.049, global_step=7499.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  83%|████████▎ | 1006/1208 [27:56<05:36,  1.67s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.049, train/loss_vlb_step=0.000167, train/loss_step=0.049, global_step=7499.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  83%|████████▎ | 1006/1208 [27:56<05:36,  1.67s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=9.92e-5, train/loss_step=0.0252, global_step=7499.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  83%|████████▎ | 1007/1208 [27:57<05:34,  1.67s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=9.92e-5, train/loss_step=0.0252, global_step=7499.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  83%|████████▎ | 1007/1208 [27:57<05:34,  1.67s/it, loss=0.102, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000604, train/loss_step=0.167, global_step=7499.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  83%|████████▎ | 1008/1208 [28:01<05:33,  1.67s/it, loss=0.102, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000604, train/loss_step=0.167, global_step=7499.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  83%|████████▎ | 1008/1208 [28:01<05:33,  1.67s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.31e-5, train/loss_step=0.0143, global_step=7499.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  84%|████████▎ | 1009/1208 [28:02<05:31,  1.67s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.31e-5, train/loss_step=0.0143, global_step=7499.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  84%|████████▎ | 1009/1208 [28:02<05:31,  1.67s/it, loss=0.107, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000406, train/loss_step=0.123, global_step=7500.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  84%|████████▎ | 1010/1208 [28:03<05:29,  1.67s/it, loss=0.107, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000406, train/loss_step=0.123, global_step=7500.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  84%|████████▎ | 1010/1208 [28:03<05:29,  1.67s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000152, train/loss_step=0.0449, global_step=7500.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  84%|████████▎ | 1011/1208 [28:04<05:28,  1.67s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000152, train/loss_step=0.0449, global_step=7500.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  84%|████████▎ | 1011/1208 [28:04<05:28,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=7500.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  84%|████████▍ | 1012/1208 [28:07<05:26,  1.67s/it, loss=0.114, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=7500.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  84%|████████▍ | 1012/1208 [28:07<05:26,  1.67s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.00012, train/loss_step=0.0312, global_step=7500.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  84%|████████▍ | 1013/1208 [28:08<05:25,  1.67s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.00012, train/loss_step=0.0312, global_step=7500.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  84%|████████▍ | 1013/1208 [28:08<05:25,  1.67s/it, loss=0.104, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000367, train/loss_step=0.112, global_step=7501.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  84%|████████▍ | 1014/1208 [28:09<05:23,  1.67s/it, loss=0.104, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000367, train/loss_step=0.112, global_step=7501.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  84%|████████▍ | 1014/1208 [28:09<05:23,  1.67s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.00083, train/loss_step=0.209, global_step=7501.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  84%|████████▍ | 1015/1208 [28:10<05:21,  1.67s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.00083, train/loss_step=0.209, global_step=7501.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  84%|████████▍ | 1015/1208 [28:10<05:21,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000885, train/loss_step=0.244, global_step=7501.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  84%|████████▍ | 1016/1208 [28:13<05:20,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000885, train/loss_step=0.244, global_step=7501.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  84%|████████▍ | 1016/1208 [28:13<05:20,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000425, train/loss_step=0.129, global_step=7501.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  84%|████████▍ | 1017/1208 [28:14<05:18,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000425, train/loss_step=0.129, global_step=7501.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  84%|████████▍ | 1017/1208 [28:14<05:18,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00126, train/loss_step=0.273, global_step=7502.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  84%|████████▍ | 1018/1208 [28:15<05:16,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00126, train/loss_step=0.273, global_step=7502.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  84%|████████▍ | 1018/1208 [28:15<05:16,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00118, train/loss_step=0.247, global_step=7502.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  84%|████████▍ | 1019/1208 [28:16<05:14,  1.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00118, train/loss_step=0.247, global_step=7502.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  84%|████████▍ | 1019/1208 [28:16<05:14,  1.67s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.15e-5, train/loss_step=0.00197, global_step=7502.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  84%|████████▍ | 1020/1208 [28:20<05:13,  1.67s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.15e-5, train/loss_step=0.00197, global_step=7502.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  84%|████████▍ | 1020/1208 [28:20<05:13,  1.67s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000114, train/loss_step=0.0299, global_step=7502.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  85%|████████▍ | 1021/1208 [28:21<05:11,  1.67s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000114, train/loss_step=0.0299, global_step=7502.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  85%|████████▍ | 1021/1208 [28:21<05:11,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00169, train/loss_step=0.278, global_step=7503.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  85%|████████▍ | 1022/1208 [28:22<05:09,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00169, train/loss_step=0.278, global_step=7503.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  85%|████████▍ | 1022/1208 [28:22<05:09,  1.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0915, train/loss_vlb_step=0.000304, train/loss_step=0.0915, global_step=7503.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  85%|████████▍ | 1023/1208 [28:23<05:08,  1.66s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0915, train/loss_vlb_step=0.000304, train/loss_step=0.0915, global_step=7503.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  85%|████████▍ | 1023/1208 [28:23<05:08,  1.66s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00461, train/loss_vlb_step=2.43e-5, train/loss_step=0.00461, global_step=7503.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  85%|████████▍ | 1024/1208 [28:26<05:06,  1.67s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00461, train/loss_vlb_step=2.43e-5, train/loss_step=0.00461, global_step=7503.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  85%|████████▍ | 1024/1208 [28:26<05:06,  1.67s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.71e-5, train/loss_step=0.00303, global_step=7503.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  85%|████████▍ | 1025/1208 [28:27<05:04,  1.67s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.71e-5, train/loss_step=0.00303, global_step=7503.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  85%|████████▍ | 1025/1208 [28:27<05:04,  1.67s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=1.98e-5, train/loss_step=0.00356, global_step=7504.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  85%|████████▍ | 1026/1208 [28:28<05:03,  1.67s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=1.98e-5, train/loss_step=0.00356, global_step=7504.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  85%|████████▍ | 1026/1208 [28:28<05:03,  1.67s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=9.84e-6, train/loss_step=0.00165, global_step=7504.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  85%|████████▌ | 1027/1208 [28:29<05:01,  1.66s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=9.84e-6, train/loss_step=0.00165, global_step=7504.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  85%|████████▌ | 1027/1208 [28:29<05:01,  1.66s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0655, train/loss_vlb_step=0.000222, train/loss_step=0.0655, global_step=7504.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  85%|████████▌ | 1028/1208 [28:32<04:59,  1.67s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0655, train/loss_vlb_step=0.000222, train/loss_step=0.0655, global_step=7504.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  85%|████████▌ | 1028/1208 [28:32<04:59,  1.67s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.27e-5, train/loss_step=0.0022, global_step=7504.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  85%|████████▌ | 1029/1208 [28:33<04:58,  1.67s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.27e-5, train/loss_step=0.0022, global_step=7504.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  85%|████████▌ | 1029/1208 [28:33<04:58,  1.67s/it, loss=0.107, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000967, train/loss_step=0.245, global_step=7505.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  85%|████████▌ | 1030/1208 [28:34<04:56,  1.66s/it, loss=0.107, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000967, train/loss_step=0.245, global_step=7505.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  85%|████████▌ | 1030/1208 [28:34<04:56,  1.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.548, train/loss_vlb_step=0.00921, train/loss_step=0.548, global_step=7505.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  85%|████████▌ | 1031/1208 [28:35<04:54,  1.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.548, train/loss_vlb_step=0.00921, train/loss_step=0.548, global_step=7505.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  85%|████████▌ | 1031/1208 [28:35<04:54,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00398, train/loss_vlb_step=2.14e-5, train/loss_step=0.00398, global_step=7505.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  85%|████████▌ | 1032/1208 [28:39<04:53,  1.67s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00398, train/loss_vlb_step=2.14e-5, train/loss_step=0.00398, global_step=7505.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  85%|████████▌ | 1032/1208 [28:39<04:53,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.000137, train/loss_step=0.038, global_step=7505.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  86%|████████▌ | 1033/1208 [28:40<04:51,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.000137, train/loss_step=0.038, global_step=7505.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  86%|████████▌ | 1033/1208 [28:40<04:51,  1.67s/it, loss=0.127, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000401, train/loss_step=0.122, global_step=7506.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  86%|████████▌ | 1034/1208 [28:41<04:49,  1.66s/it, loss=0.127, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000401, train/loss_step=0.122, global_step=7506.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  86%|████████▌ | 1034/1208 [28:41<04:49,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.441, train/loss_vlb_step=0.00513, train/loss_step=0.441, global_step=7506.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  86%|████████▌ | 1035/1208 [28:42<04:47,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.441, train/loss_vlb_step=0.00513, train/loss_step=0.441, global_step=7506.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  86%|████████▌ | 1035/1208 [28:42<04:47,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000412, train/loss_step=0.124, global_step=7506.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  86%|████████▌ | 1036/1208 [28:45<04:46,  1.67s/it, loss=0.133, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000412, train/loss_step=0.124, global_step=7506.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  86%|████████▌ | 1036/1208 [28:45<04:46,  1.67s/it, loss=0.144, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00186, train/loss_step=0.347, global_step=7506.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  86%|████████▌ | 1037/1208 [28:46<04:44,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00186, train/loss_step=0.347, global_step=7506.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  86%|████████▌ | 1037/1208 [28:46<04:44,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00188, train/loss_step=0.324, global_step=7507.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  86%|████████▌ | 1038/1208 [28:47<04:42,  1.66s/it, loss=0.146, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00188, train/loss_step=0.324, global_step=7507.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  86%|████████▌ | 1038/1208 [28:47<04:42,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00236, train/loss_step=0.354, global_step=7507.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  86%|████████▌ | 1039/1208 [28:48<04:41,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00236, train/loss_step=0.354, global_step=7507.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  86%|████████▌ | 1039/1208 [28:48<04:41,  1.66s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00549, train/loss_vlb_step=2.81e-5, train/loss_step=0.00549, global_step=7507.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  86%|████████▌ | 1040/1208 [28:51<04:39,  1.67s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00549, train/loss_vlb_step=2.81e-5, train/loss_step=0.00549, global_step=7507.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  86%|████████▌ | 1040/1208 [28:51<04:39,  1.67s/it, loss=0.154, v_num=0, train/loss_simple_step=0.075, train/loss_vlb_step=0.00025, train/loss_step=0.075, global_step=7507.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  86%|████████▌ | 1041/1208 [28:52<04:37,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.075, train/loss_vlb_step=0.00025, train/loss_step=0.075, global_step=7507.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  86%|████████▌ | 1041/1208 [28:52<04:37,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00125, train/loss_step=0.281, global_step=7508.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  86%|████████▋ | 1042/1208 [28:53<04:36,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00125, train/loss_step=0.281, global_step=7508.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  86%|████████▋ | 1042/1208 [28:53<04:36,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00815, train/loss_vlb_step=3.89e-5, train/loss_step=0.00815, global_step=7508.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  86%|████████▋ | 1043/1208 [28:54<04:34,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00815, train/loss_vlb_step=3.89e-5, train/loss_step=0.00815, global_step=7508.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  86%|████████▋ | 1043/1208 [28:54<04:34,  1.66s/it, loss=0.161, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.00094, train/loss_step=0.233, global_step=7508.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  86%|████████▋ | 1044/1208 [28:58<04:33,  1.66s/it, loss=0.161, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.00094, train/loss_step=0.233, global_step=7508.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  86%|████████▋ | 1044/1208 [28:58<04:33,  1.66s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=1.35e-5, train/loss_step=0.00231, global_step=7508.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  87%|████████▋ | 1045/1208 [28:59<04:31,  1.66s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=1.35e-5, train/loss_step=0.00231, global_step=7508.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  87%|████████▋ | 1045/1208 [28:59<04:31,  1.66s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=1.39e-5, train/loss_step=0.00243, global_step=7509.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  87%|████████▋ | 1046/1208 [29:00<04:29,  1.66s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=1.39e-5, train/loss_step=0.00243, global_step=7509.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  87%|████████▋ | 1046/1208 [29:00<04:29,  1.66s/it, loss=0.189, v_num=0, train/loss_simple_step=0.565, train/loss_vlb_step=0.0158, train/loss_step=0.565, global_step=7509.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]     Epoch 24:  87%|████████▋ | 1047/1208 [29:01<04:27,  1.66s/it, loss=0.189, v_num=0, train/loss_simple_step=0.565, train/loss_vlb_step=0.0158, train/loss_step=0.565, global_step=7509.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  87%|████████▋ | 1047/1208 [29:01<04:27,  1.66s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.06e-5, train/loss_step=0.00178, global_step=7509.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  87%|████████▋ | 1048/1208 [29:04<04:26,  1.66s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.06e-5, train/loss_step=0.00178, global_step=7509.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  87%|████████▋ | 1048/1208 [29:04<04:26,  1.66s/it, loss=0.193, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000447, train/loss_step=0.134, global_step=7509.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  87%|████████▋ | 1049/1208 [29:05<04:24,  1.66s/it, loss=0.193, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000447, train/loss_step=0.134, global_step=7509.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  87%|████████▋ | 1049/1208 [29:05<04:24,  1.66s/it, loss=0.196, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00176, train/loss_step=0.312, global_step=7510.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  87%|████████▋ | 1050/1208 [29:06<04:22,  1.66s/it, loss=0.196, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00176, train/loss_step=0.312, global_step=7510.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  87%|████████▋ | 1050/1208 [29:06<04:22,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000807, train/loss_step=0.203, global_step=7510.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  87%|████████▋ | 1051/1208 [29:07<04:21,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000807, train/loss_step=0.203, global_step=7510.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  87%|████████▋ | 1051/1208 [29:07<04:21,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000147, train/loss_step=0.0405, global_step=7510.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  87%|████████▋ | 1052/1208 [29:10<04:19,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000147, train/loss_step=0.0405, global_step=7510.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  87%|████████▋ | 1052/1208 [29:10<04:19,  1.66s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0546, train/loss_vlb_step=0.000186, train/loss_step=0.0546, global_step=7510.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  87%|████████▋ | 1053/1208 [29:12<04:17,  1.66s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0546, train/loss_vlb_step=0.000186, train/loss_step=0.0546, global_step=7510.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  87%|████████▋ | 1053/1208 [29:12<04:17,  1.66s/it, loss=0.18, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000334, train/loss_step=0.101, global_step=7511.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  87%|████████▋ | 1054/1208 [29:13<04:16,  1.66s/it, loss=0.18, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000334, train/loss_step=0.101, global_step=7511.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  87%|████████▋ | 1054/1208 [29:13<04:16,  1.66s/it, loss=0.172, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00127, train/loss_step=0.266, global_step=7511.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  87%|████████▋ | 1055/1208 [29:14<04:14,  1.66s/it, loss=0.172, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00127, train/loss_step=0.266, global_step=7511.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  87%|████████▋ | 1055/1208 [29:14<04:14,  1.66s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.44e-5, train/loss_step=0.0114, global_step=7511.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  87%|████████▋ | 1056/1208 [29:17<04:12,  1.66s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.44e-5, train/loss_step=0.0114, global_step=7511.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  87%|████████▋ | 1056/1208 [29:17<04:12,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=1.99e-5, train/loss_step=0.00373, global_step=7511.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  88%|████████▊ | 1057/1208 [29:18<04:11,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=1.99e-5, train/loss_step=0.00373, global_step=7511.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  88%|████████▊ | 1057/1208 [29:18<04:11,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.000173, train/loss_step=0.0468, global_step=7512.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  88%|████████▊ | 1058/1208 [29:19<04:09,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.000173, train/loss_step=0.0468, global_step=7512.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  88%|████████▊ | 1058/1208 [29:19<04:09,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.42e-5, train/loss_step=0.0174, global_step=7512.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  88%|████████▊ | 1059/1208 [29:20<04:07,  1.66s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.42e-5, train/loss_step=0.0174, global_step=7512.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  88%|████████▊ | 1059/1208 [29:20<04:07,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00243, train/loss_step=0.391, global_step=7512.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  88%|████████▊ | 1060/1208 [29:23<04:06,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00243, train/loss_step=0.391, global_step=7512.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  88%|████████▊ | 1060/1208 [29:23<04:06,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.34e-5, train/loss_step=0.0171, global_step=7512.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  88%|████████▊ | 1061/1208 [29:24<04:04,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.34e-5, train/loss_step=0.0171, global_step=7512.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  88%|████████▊ | 1061/1208 [29:24<04:04,  1.66s/it, loss=0.13, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000687, train/loss_step=0.190, global_step=7513.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  88%|████████▊ | 1062/1208 [29:25<04:02,  1.66s/it, loss=0.13, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000687, train/loss_step=0.190, global_step=7513.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  88%|████████▊ | 1062/1208 [29:25<04:02,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0813, train/loss_vlb_step=0.000268, train/loss_step=0.0813, global_step=7513.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  88%|████████▊ | 1063/1208 [29:26<04:00,  1.66s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0813, train/loss_vlb_step=0.000268, train/loss_step=0.0813, global_step=7513.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  88%|████████▊ | 1063/1208 [29:26<04:00,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.0013, train/loss_step=0.282, global_step=7513.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  88%|████████▊ | 1064/1208 [29:29<03:59,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.0013, train/loss_step=0.282, global_step=7513.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  88%|████████▊ | 1064/1208 [29:29<03:59,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00249, train/loss_step=0.338, global_step=7513.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  88%|████████▊ | 1065/1208 [29:31<03:57,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00249, train/loss_step=0.338, global_step=7513.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  88%|████████▊ | 1065/1208 [29:31<03:57,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000489, train/loss_step=0.147, global_step=7514.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  88%|████████▊ | 1066/1208 [29:32<03:56,  1.66s/it, loss=0.16, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000489, train/loss_step=0.147, global_step=7514.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  88%|████████▊ | 1066/1208 [29:32<03:56,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0294, train/loss_vlb_step=0.000111, train/loss_step=0.0294, global_step=7514.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  88%|████████▊ | 1067/1208 [29:33<03:54,  1.66s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0294, train/loss_vlb_step=0.000111, train/loss_step=0.0294, global_step=7514.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  88%|████████▊ | 1067/1208 [29:33<03:54,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=7514.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  88%|████████▊ | 1068/1208 [29:36<03:52,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=7514.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  88%|████████▊ | 1068/1208 [29:36<03:52,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00168, train/loss_step=0.336, global_step=7514.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  88%|████████▊ | 1069/1208 [29:37<03:51,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00168, train/loss_step=0.336, global_step=7514.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  88%|████████▊ | 1069/1208 [29:37<03:51,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000442, train/loss_step=0.131, global_step=7515.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  89%|████████▊ | 1070/1208 [29:38<03:49,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000442, train/loss_step=0.131, global_step=7515.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  89%|████████▊ | 1070/1208 [29:38<03:49,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000431, train/loss_step=0.127, global_step=7515.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  89%|████████▊ | 1071/1208 [29:39<03:47,  1.66s/it, loss=0.136, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000431, train/loss_step=0.127, global_step=7515.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  89%|████████▊ | 1071/1208 [29:39<03:47,  1.66s/it, loss=0.169, v_num=0, train/loss_simple_step=0.700, train/loss_vlb_step=0.0231, train/loss_step=0.700, global_step=7515.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  89%|████████▊ | 1072/1208 [29:42<03:46,  1.66s/it, loss=0.169, v_num=0, train/loss_simple_step=0.700, train/loss_vlb_step=0.0231, train/loss_step=0.700, global_step=7515.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  89%|████████▊ | 1072/1208 [29:42<03:46,  1.66s/it, loss=0.178, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000923, train/loss_step=0.240, global_step=7515.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  89%|████████▉ | 1073/1208 [29:43<03:44,  1.66s/it, loss=0.178, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000923, train/loss_step=0.240, global_step=7515.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  89%|████████▉ | 1073/1208 [29:43<03:44,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00947, train/loss_vlb_step=4.65e-5, train/loss_step=0.00947, global_step=7516.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  89%|████████▉ | 1074/1208 [29:44<03:42,  1.66s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00947, train/loss_vlb_step=4.65e-5, train/loss_step=0.00947, global_step=7516.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  89%|████████▉ | 1074/1208 [29:44<03:42,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.00019, train/loss_step=0.0545, global_step=7516.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  89%|████████▉ | 1075/1208 [29:45<03:40,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.00019, train/loss_step=0.0545, global_step=7516.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  89%|████████▉ | 1075/1208 [29:45<03:40,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.31e-5, train/loss_step=0.0175, global_step=7516.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  89%|████████▉ | 1076/1208 [29:49<03:39,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.31e-5, train/loss_step=0.0175, global_step=7516.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  89%|████████▉ | 1076/1208 [29:49<03:39,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00164, train/loss_step=0.316, global_step=7516.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  89%|████████▉ | 1077/1208 [29:50<03:37,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00164, train/loss_step=0.316, global_step=7516.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  89%|████████▉ | 1077/1208 [29:50<03:37,  1.66s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.61e-5, train/loss_step=0.0147, global_step=7517.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  89%|████████▉ | 1078/1208 [29:51<03:36,  1.66s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.61e-5, train/loss_step=0.0147, global_step=7517.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  89%|████████▉ | 1078/1208 [29:51<03:36,  1.66s/it, loss=0.193, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00169, train/loss_step=0.337, global_step=7517.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  89%|████████▉ | 1079/1208 [29:52<03:34,  1.66s/it, loss=0.193, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00169, train/loss_step=0.337, global_step=7517.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  89%|████████▉ | 1079/1208 [29:52<03:34,  1.66s/it, loss=0.185, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000846, train/loss_step=0.216, global_step=7517.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  89%|████████▉ | 1080/1208 [29:55<03:32,  1.66s/it, loss=0.185, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000846, train/loss_step=0.216, global_step=7517.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  89%|████████▉ | 1080/1208 [29:55<03:32,  1.66s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000143, train/loss_step=0.0409, global_step=7517.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  89%|████████▉ | 1081/1208 [29:56<03:31,  1.66s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000143, train/loss_step=0.0409, global_step=7517.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  89%|████████▉ | 1081/1208 [29:56<03:31,  1.66s/it, loss=0.186, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000664, train/loss_step=0.187, global_step=7518.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  90%|████████▉ | 1082/1208 [29:57<03:29,  1.66s/it, loss=0.186, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000664, train/loss_step=0.187, global_step=7518.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  90%|████████▉ | 1082/1208 [29:57<03:29,  1.66s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0049, train/loss_vlb_step=2.55e-5, train/loss_step=0.0049, global_step=7518.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  90%|████████▉ | 1083/1208 [29:58<03:27,  1.66s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0049, train/loss_vlb_step=2.55e-5, train/loss_step=0.0049, global_step=7518.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  90%|████████▉ | 1083/1208 [29:58<03:27,  1.66s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0573, train/loss_vlb_step=0.000197, train/loss_step=0.0573, global_step=7518.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  90%|████████▉ | 1084/1208 [30:01<03:26,  1.66s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0573, train/loss_vlb_step=0.000197, train/loss_step=0.0573, global_step=7518.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  90%|████████▉ | 1084/1208 [30:01<03:26,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.38e-5, train/loss_step=0.0151, global_step=7518.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  90%|████████▉ | 1085/1208 [30:02<03:24,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.38e-5, train/loss_step=0.0151, global_step=7518.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  90%|████████▉ | 1085/1208 [30:02<03:24,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00142, train/loss_step=0.311, global_step=7519.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  90%|████████▉ | 1086/1208 [30:03<03:22,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00142, train/loss_step=0.311, global_step=7519.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  90%|████████▉ | 1086/1208 [30:03<03:22,  1.66s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0768, train/loss_vlb_step=0.000252, train/loss_step=0.0768, global_step=7519.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  90%|████████▉ | 1087/1208 [30:04<03:20,  1.66s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0768, train/loss_vlb_step=0.000252, train/loss_step=0.0768, global_step=7519.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  90%|████████▉ | 1087/1208 [30:04<03:20,  1.66s/it, loss=0.169, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000677, train/loss_step=0.188, global_step=7519.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  90%|█████████ | 1088/1208 [30:08<03:19,  1.66s/it, loss=0.169, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000677, train/loss_step=0.188, global_step=7519.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  90%|█████████ | 1088/1208 [30:08<03:19,  1.66s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=1.47e-5, train/loss_step=0.0025, global_step=7519.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  90%|█████████ | 1089/1208 [30:09<03:17,  1.66s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=1.47e-5, train/loss_step=0.0025, global_step=7519.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  90%|█████████ | 1089/1208 [30:09<03:17,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0644, train/loss_vlb_step=0.000225, train/loss_step=0.0644, global_step=7520.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  90%|█████████ | 1090/1208 [30:10<03:15,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0644, train/loss_vlb_step=0.000225, train/loss_step=0.0644, global_step=7520.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  90%|█████████ | 1090/1208 [30:10<03:15,  1.66s/it, loss=0.178, v_num=0, train/loss_simple_step=0.701, train/loss_vlb_step=0.0363, train/loss_step=0.701, global_step=7520.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  90%|█████████ | 1091/1208 [30:11<03:14,  1.66s/it, loss=0.178, v_num=0, train/loss_simple_step=0.701, train/loss_vlb_step=0.0363, train/loss_step=0.701, global_step=7520.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  90%|█████████ | 1091/1208 [30:11<03:14,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000569, train/loss_step=0.164, global_step=7520.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  90%|█████████ | 1092/1208 [30:14<03:12,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000569, train/loss_step=0.164, global_step=7520.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  90%|█████████ | 1092/1208 [30:14<03:12,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0398, train/loss_vlb_step=0.000144, train/loss_step=0.0398, global_step=7520.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  90%|█████████ | 1093/1208 [30:15<03:11,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0398, train/loss_vlb_step=0.000144, train/loss_step=0.0398, global_step=7520.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  90%|█████████ | 1093/1208 [30:15<03:11,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00825, train/loss_vlb_step=3.88e-5, train/loss_step=0.00825, global_step=7521.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  91%|█████████ | 1094/1208 [30:16<03:09,  1.66s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00825, train/loss_vlb_step=3.88e-5, train/loss_step=0.00825, global_step=7521.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  91%|█████████ | 1094/1208 [30:16<03:09,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.92e-5, train/loss_step=0.00342, global_step=7521.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  91%|█████████ | 1095/1208 [30:17<03:07,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.92e-5, train/loss_step=0.00342, global_step=7521.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  91%|█████████ | 1095/1208 [30:17<03:07,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00186, train/loss_step=0.364, global_step=7521.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  91%|█████████ | 1096/1208 [30:20<03:06,  1.66s/it, loss=0.156, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00186, train/loss_step=0.364, global_step=7521.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  91%|█████████ | 1096/1208 [30:20<03:06,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00812, train/loss_vlb_step=3.91e-5, train/loss_step=0.00812, global_step=7521.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  91%|█████████ | 1097/1208 [30:21<03:04,  1.66s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00812, train/loss_vlb_step=3.91e-5, train/loss_step=0.00812, global_step=7521.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  91%|█████████ | 1097/1208 [30:21<03:04,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000743, train/loss_step=0.193, global_step=7522.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  91%|█████████ | 1098/1208 [30:22<03:02,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000743, train/loss_step=0.193, global_step=7522.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  91%|█████████ | 1098/1208 [30:22<03:02,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.0004, train/loss_step=0.121, global_step=7522.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  91%|█████████ | 1099/1208 [30:23<03:00,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.0004, train/loss_step=0.121, global_step=7522.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  91%|█████████ | 1099/1208 [30:23<03:00,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00219, train/loss_step=0.325, global_step=7522.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  91%|█████████ | 1100/1208 [30:27<02:59,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00219, train/loss_step=0.325, global_step=7522.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  91%|█████████ | 1100/1208 [30:27<02:59,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.741, train/loss_vlb_step=0.035, train/loss_step=0.741, global_step=7522.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  91%|█████████ | 1101/1208 [30:28<02:57,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.741, train/loss_vlb_step=0.035, train/loss_step=0.741, global_step=7522.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  91%|█████████ | 1101/1208 [30:28<02:57,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00297, train/loss_vlb_step=1.67e-5, train/loss_step=0.00297, global_step=7523.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  91%|█████████ | 1102/1208 [30:29<02:55,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00297, train/loss_vlb_step=1.67e-5, train/loss_step=0.00297, global_step=7523.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  91%|█████████ | 1102/1208 [30:29<02:55,  1.66s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0791, train/loss_vlb_step=0.00027, train/loss_step=0.0791, global_step=7523.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  91%|█████████▏| 1103/1208 [30:30<02:54,  1.66s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0791, train/loss_vlb_step=0.00027, train/loss_step=0.0791, global_step=7523.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  91%|█████████▏| 1103/1208 [30:30<02:54,  1.66s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00491, train/loss_vlb_step=2.57e-5, train/loss_step=0.00491, global_step=7523.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  91%|█████████▏| 1104/1208 [30:33<02:52,  1.66s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00491, train/loss_vlb_step=2.57e-5, train/loss_step=0.00491, global_step=7523.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  91%|█████████▏| 1104/1208 [30:33<02:52,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00802, train/loss_vlb_step=3.85e-5, train/loss_step=0.00802, global_step=7523.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  91%|█████████▏| 1105/1208 [30:34<02:50,  1.66s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00802, train/loss_vlb_step=3.85e-5, train/loss_step=0.00802, global_step=7523.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  91%|█████████▏| 1105/1208 [30:34<02:50,  1.66s/it, loss=0.177, v_num=0, train/loss_simple_step=0.453, train/loss_vlb_step=0.00567, train/loss_step=0.453, global_step=7524.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  92%|█████████▏| 1106/1208 [30:35<02:49,  1.66s/it, loss=0.177, v_num=0, train/loss_simple_step=0.453, train/loss_vlb_step=0.00567, train/loss_step=0.453, global_step=7524.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  92%|█████████▏| 1106/1208 [30:35<02:49,  1.66s/it, loss=0.196, v_num=0, train/loss_simple_step=0.456, train/loss_vlb_step=0.00328, train/loss_step=0.456, global_step=7524.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  92%|█████████▏| 1107/1208 [30:36<02:47,  1.66s/it, loss=0.196, v_num=0, train/loss_simple_step=0.456, train/loss_vlb_step=0.00328, train/loss_step=0.456, global_step=7524.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  92%|█████████▏| 1107/1208 [30:36<02:47,  1.66s/it, loss=0.214, v_num=0, train/loss_simple_step=0.543, train/loss_vlb_step=0.0122, train/loss_step=0.543, global_step=7524.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  92%|█████████▏| 1108/1208 [30:39<02:46,  1.66s/it, loss=0.214, v_num=0, train/loss_simple_step=0.543, train/loss_vlb_step=0.0122, train/loss_step=0.543, global_step=7524.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  92%|█████████▏| 1108/1208 [30:39<02:46,  1.66s/it, loss=0.218, v_num=0, train/loss_simple_step=0.0782, train/loss_vlb_step=0.000259, train/loss_step=0.0782, global_step=7524.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  92%|█████████▏| 1109/1208 [30:40<02:44,  1.66s/it, loss=0.218, v_num=0, train/loss_simple_step=0.0782, train/loss_vlb_step=0.000259, train/loss_step=0.0782, global_step=7524.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  92%|█████████▏| 1109/1208 [30:40<02:44,  1.66s/it, loss=0.215, v_num=0, train/loss_simple_step=0.00482, train/loss_vlb_step=2.61e-5, train/loss_step=0.00482, global_step=7525.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  92%|█████████▏| 1110/1208 [30:41<02:42,  1.66s/it, loss=0.215, v_num=0, train/loss_simple_step=0.00482, train/loss_vlb_step=2.61e-5, train/loss_step=0.00482, global_step=7525.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  92%|█████████▏| 1110/1208 [30:41<02:42,  1.66s/it, loss=0.189, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000622, train/loss_step=0.185, global_step=7525.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  92%|█████████▏| 1111/1208 [30:42<02:40,  1.66s/it, loss=0.189, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000622, train/loss_step=0.185, global_step=7525.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  92%|█████████▏| 1111/1208 [30:42<02:40,  1.66s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0289, train/loss_vlb_step=0.000111, train/loss_step=0.0289, global_step=7525.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  92%|█████████▏| 1112/1208 [30:46<02:39,  1.66s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0289, train/loss_vlb_step=0.000111, train/loss_step=0.0289, global_step=7525.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  92%|█████████▏| 1112/1208 [30:46<02:39,  1.66s/it, loss=0.206, v_num=0, train/loss_simple_step=0.515, train/loss_vlb_step=0.00355, train/loss_step=0.515, global_step=7525.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  92%|█████████▏| 1113/1208 [30:47<02:37,  1.66s/it, loss=0.206, v_num=0, train/loss_simple_step=0.515, train/loss_vlb_step=0.00355, train/loss_step=0.515, global_step=7525.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  92%|█████████▏| 1113/1208 [30:47<02:37,  1.66s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0804, train/loss_vlb_step=0.000265, train/loss_step=0.0804, global_step=7526.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  92%|█████████▏| 1114/1208 [30:48<02:35,  1.66s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0804, train/loss_vlb_step=0.000265, train/loss_step=0.0804, global_step=7526.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  92%|█████████▏| 1114/1208 [30:48<02:35,  1.66s/it, loss=0.21, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=1.38e-5, train/loss_step=0.00238, global_step=7526.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  92%|█████████▏| 1115/1208 [30:49<02:34,  1.66s/it, loss=0.21, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=1.38e-5, train/loss_step=0.00238, global_step=7526.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  92%|█████████▏| 1115/1208 [30:49<02:34,  1.66s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.11e-5, train/loss_step=0.0112, global_step=7526.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  92%|█████████▏| 1116/1208 [30:52<02:32,  1.66s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.11e-5, train/loss_step=0.0112, global_step=7526.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  92%|█████████▏| 1116/1208 [30:52<02:32,  1.66s/it, loss=0.206, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00133, train/loss_step=0.283, global_step=7526.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  92%|█████████▏| 1117/1208 [30:53<02:30,  1.66s/it, loss=0.206, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00133, train/loss_step=0.283, global_step=7526.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  92%|█████████▏| 1117/1208 [30:53<02:31,  1.66s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5e-5, train/loss_step=0.0111, global_step=7527.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  93%|█████████▎| 1118/1208 [30:54<02:29,  1.66s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5e-5, train/loss_step=0.0111, global_step=7527.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  93%|█████████▎| 1118/1208 [30:54<02:29,  1.66s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000157, train/loss_step=0.0443, global_step=7527.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  93%|█████████▎| 1119/1208 [30:55<02:27,  1.66s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000157, train/loss_step=0.0443, global_step=7527.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  93%|█████████▎| 1119/1208 [30:55<02:27,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0877, train/loss_vlb_step=0.000289, train/loss_step=0.0877, global_step=7527.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  93%|█████████▎| 1120/1208 [30:58<02:26,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0877, train/loss_vlb_step=0.000289, train/loss_step=0.0877, global_step=7527.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  93%|█████████▎| 1120/1208 [30:58<02:26,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000758, train/loss_step=0.202, global_step=7527.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  93%|█████████▎| 1121/1208 [30:59<02:24,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000758, train/loss_step=0.202, global_step=7527.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  93%|█████████▎| 1121/1208 [30:59<02:24,  1.66s/it, loss=0.161, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000483, train/loss_step=0.140, global_step=7528.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  93%|█████████▎| 1122/1208 [31:00<02:22,  1.66s/it, loss=0.161, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000483, train/loss_step=0.140, global_step=7528.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  93%|█████████▎| 1122/1208 [31:00<02:22,  1.66s/it, loss=0.175, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00353, train/loss_step=0.364, global_step=7528.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  93%|█████████▎| 1123/1208 [31:01<02:20,  1.66s/it, loss=0.175, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00353, train/loss_step=0.364, global_step=7528.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  93%|█████████▎| 1123/1208 [31:01<02:20,  1.66s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00558, train/loss_vlb_step=2.78e-5, train/loss_step=0.00558, global_step=7528.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  93%|█████████▎| 1124/1208 [31:05<02:19,  1.66s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00558, train/loss_vlb_step=2.78e-5, train/loss_step=0.00558, global_step=7528.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  93%|█████████▎| 1124/1208 [31:05<02:19,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000382, train/loss_step=0.115, global_step=7528.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  93%|█████████▎| 1125/1208 [31:06<02:17,  1.66s/it, loss=0.181, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000382, train/loss_step=0.115, global_step=7528.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  93%|█████████▎| 1125/1208 [31:06<02:17,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00786, train/loss_vlb_step=3.81e-5, train/loss_step=0.00786, global_step=7529.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  93%|█████████▎| 1126/1208 [31:07<02:15,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00786, train/loss_vlb_step=3.81e-5, train/loss_step=0.00786, global_step=7529.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  93%|█████████▎| 1126/1208 [31:07<02:15,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00189, train/loss_step=0.342, global_step=7529.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  93%|█████████▎| 1127/1208 [31:08<02:14,  1.66s/it, loss=0.153, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00189, train/loss_step=0.342, global_step=7529.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  93%|█████████▎| 1127/1208 [31:08<02:14,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.85e-5, train/loss_step=0.0152, global_step=7529.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  93%|█████████▎| 1128/1208 [31:11<02:12,  1.66s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.85e-5, train/loss_step=0.0152, global_step=7529.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  93%|█████████▎| 1128/1208 [31:11<02:12,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.87e-5, train/loss_step=0.0106, global_step=7529.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  93%|█████████▎| 1129/1208 [31:12<02:11,  1.66s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.87e-5, train/loss_step=0.0106, global_step=7529.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  93%|█████████▎| 1129/1208 [31:12<02:11,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.0017, train/loss_step=0.314, global_step=7530.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  94%|█████████▎| 1130/1208 [31:13<02:09,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.0017, train/loss_step=0.314, global_step=7530.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  94%|█████████▎| 1130/1208 [31:13<02:09,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=7530.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  94%|█████████▎| 1131/1208 [31:14<02:07,  1.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=7530.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  94%|█████████▎| 1131/1208 [31:14<02:07,  1.66s/it, loss=0.147, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00105, train/loss_step=0.277, global_step=7530.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  94%|█████████▎| 1132/1208 [31:17<02:06,  1.66s/it, loss=0.147, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00105, train/loss_step=0.277, global_step=7530.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  94%|█████████▎| 1132/1208 [31:17<02:06,  1.66s/it, loss=0.137, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00164, train/loss_step=0.310, global_step=7530.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  94%|█████████▍| 1133/1208 [31:18<02:04,  1.66s/it, loss=0.137, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00164, train/loss_step=0.310, global_step=7530.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  94%|█████████▍| 1133/1208 [31:18<02:04,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000312, train/loss_step=0.095, global_step=7531.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  94%|█████████▍| 1134/1208 [31:19<02:02,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000312, train/loss_step=0.095, global_step=7531.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  94%|█████████▍| 1134/1208 [31:19<02:02,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.12e-5, train/loss_step=0.00199, global_step=7531.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  94%|█████████▍| 1135/1208 [31:20<02:00,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.12e-5, train/loss_step=0.00199, global_step=7531.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  94%|█████████▍| 1135/1208 [31:20<02:00,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000131, train/loss_step=0.035, global_step=7531.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  94%|█████████▍| 1136/1208 [31:24<01:59,  1.66s/it, loss=0.139, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000131, train/loss_step=0.035, global_step=7531.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  94%|█████████▍| 1136/1208 [31:24<01:59,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00345, train/loss_step=0.394, global_step=7531.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  94%|█████████▍| 1137/1208 [31:25<01:57,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00345, train/loss_step=0.394, global_step=7531.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  94%|█████████▍| 1137/1208 [31:25<01:57,  1.66s/it, loss=0.164, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00368, train/loss_step=0.405, global_step=7532.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  94%|█████████▍| 1138/1208 [31:26<01:56,  1.66s/it, loss=0.164, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00368, train/loss_step=0.405, global_step=7532.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  94%|█████████▍| 1138/1208 [31:26<01:56,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.47e-5, train/loss_step=0.0148, global_step=7532.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  94%|█████████▍| 1139/1208 [31:27<01:54,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.47e-5, train/loss_step=0.0148, global_step=7532.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  94%|█████████▍| 1139/1208 [31:27<01:54,  1.66s/it, loss=0.166, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000535, train/loss_step=0.156, global_step=7532.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  94%|█████████▍| 1140/1208 [31:30<01:52,  1.66s/it, loss=0.166, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000535, train/loss_step=0.156, global_step=7532.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  94%|█████████▍| 1140/1208 [31:30<01:52,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000128, train/loss_step=0.0348, global_step=7532.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  94%|█████████▍| 1141/1208 [31:31<01:51,  1.66s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000128, train/loss_step=0.0348, global_step=7532.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  94%|█████████▍| 1141/1208 [31:31<01:51,  1.66s/it, loss=0.166, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00173, train/loss_step=0.310, global_step=7533.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  95%|█████████▍| 1142/1208 [31:32<01:49,  1.66s/it, loss=0.166, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00173, train/loss_step=0.310, global_step=7533.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  95%|█████████▍| 1142/1208 [31:32<01:49,  1.66s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0869, train/loss_vlb_step=0.000286, train/loss_step=0.0869, global_step=7533.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  95%|█████████▍| 1143/1208 [31:33<01:47,  1.66s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0869, train/loss_vlb_step=0.000286, train/loss_step=0.0869, global_step=7533.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  95%|█████████▍| 1143/1208 [31:33<01:47,  1.66s/it, loss=0.198, v_num=0, train/loss_simple_step=0.908, train/loss_vlb_step=0.457, train/loss_step=0.908, global_step=7533.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]     Epoch 24:  95%|█████████▍| 1144/1208 [31:36<01:46,  1.66s/it, loss=0.198, v_num=0, train/loss_simple_step=0.908, train/loss_vlb_step=0.457, train/loss_step=0.908, global_step=7533.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  95%|█████████▍| 1144/1208 [31:36<01:46,  1.66s/it, loss=0.199, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000475, train/loss_step=0.143, global_step=7533.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  95%|█████████▍| 1145/1208 [31:37<01:44,  1.66s/it, loss=0.199, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000475, train/loss_step=0.143, global_step=7533.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  95%|█████████▍| 1145/1208 [31:37<01:44,  1.66s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0681, train/loss_vlb_step=0.00023, train/loss_step=0.0681, global_step=7534.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  95%|█████████▍| 1146/1208 [31:38<01:42,  1.66s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0681, train/loss_vlb_step=0.00023, train/loss_step=0.0681, global_step=7534.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  95%|█████████▍| 1146/1208 [31:38<01:42,  1.66s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000127, train/loss_step=0.0344, global_step=7534.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  95%|█████████▍| 1147/1208 [31:39<01:41,  1.66s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000127, train/loss_step=0.0344, global_step=7534.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  95%|█████████▍| 1147/1208 [31:39<01:41,  1.66s/it, loss=0.191, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000367, train/loss_step=0.111, global_step=7534.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  95%|█████████▌| 1148/1208 [31:43<01:39,  1.66s/it, loss=0.191, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000367, train/loss_step=0.111, global_step=7534.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  95%|█████████▌| 1148/1208 [31:43<01:39,  1.66s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.7e-5, train/loss_step=0.0208, global_step=7534.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  95%|█████████▌| 1149/1208 [31:44<01:37,  1.66s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.7e-5, train/loss_step=0.0208, global_step=7534.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  95%|█████████▌| 1149/1208 [31:44<01:37,  1.66s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=7.15e-5, train/loss_step=0.0162, global_step=7535.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  95%|█████████▌| 1150/1208 [31:45<01:36,  1.66s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=7.15e-5, train/loss_step=0.0162, global_step=7535.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  95%|█████████▌| 1150/1208 [31:45<01:36,  1.66s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.6e-5, train/loss_step=0.00289, global_step=7535.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  95%|█████████▌| 1151/1208 [31:46<01:34,  1.66s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.6e-5, train/loss_step=0.00289, global_step=7535.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  95%|█████████▌| 1151/1208 [31:46<01:34,  1.66s/it, loss=0.167, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000696, train/loss_step=0.192, global_step=7535.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  95%|█████████▌| 1152/1208 [31:49<01:32,  1.66s/it, loss=0.167, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000696, train/loss_step=0.192, global_step=7535.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  95%|█████████▌| 1152/1208 [31:49<01:32,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000173, train/loss_step=0.050, global_step=7535.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  95%|█████████▌| 1153/1208 [31:50<01:31,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000173, train/loss_step=0.050, global_step=7535.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  95%|█████████▌| 1153/1208 [31:50<01:31,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.44e-5, train/loss_step=0.0172, global_step=7536.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  96%|█████████▌| 1154/1208 [31:51<01:29,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.44e-5, train/loss_step=0.0172, global_step=7536.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  96%|█████████▌| 1154/1208 [31:51<01:29,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000108, train/loss_step=0.0279, global_step=7536.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  96%|█████████▌| 1155/1208 [31:52<01:27,  1.66s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000108, train/loss_step=0.0279, global_step=7536.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  96%|█████████▌| 1155/1208 [31:52<01:27,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00796, train/loss_vlb_step=3.91e-5, train/loss_step=0.00796, global_step=7536.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  96%|█████████▌| 1156/1208 [31:55<01:26,  1.66s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00796, train/loss_vlb_step=3.91e-5, train/loss_step=0.00796, global_step=7536.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  96%|█████████▌| 1156/1208 [31:55<01:26,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.646, train/loss_vlb_step=0.019, train/loss_step=0.646, global_step=7536.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]     Epoch 24:  96%|█████████▌| 1157/1208 [31:56<01:24,  1.66s/it, loss=0.163, v_num=0, train/loss_simple_step=0.646, train/loss_vlb_step=0.019, train/loss_step=0.646, global_step=7536.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  96%|█████████▌| 1157/1208 [31:56<01:24,  1.66s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=1.33e-5, train/loss_step=0.00231, global_step=7537.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  96%|█████████▌| 1158/1208 [31:57<01:22,  1.66s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=1.33e-5, train/loss_step=0.00231, global_step=7537.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  96%|█████████▌| 1158/1208 [31:57<01:22,  1.66s/it, loss=0.162, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00379, train/loss_step=0.407, global_step=7537.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  96%|█████████▌| 1159/1208 [31:58<01:21,  1.66s/it, loss=0.162, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00379, train/loss_step=0.407, global_step=7537.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  96%|█████████▌| 1159/1208 [31:58<01:21,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7.19e-5, train/loss_step=0.0165, global_step=7537.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  96%|█████████▌| 1160/1208 [32:02<01:19,  1.66s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7.19e-5, train/loss_step=0.0165, global_step=7537.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  96%|█████████▌| 1160/1208 [32:02<01:19,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.02e-5, train/loss_step=0.0138, global_step=7537.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  96%|█████████▌| 1161/1208 [32:03<01:17,  1.66s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.02e-5, train/loss_step=0.0138, global_step=7537.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  96%|█████████▌| 1161/1208 [32:03<01:17,  1.66s/it, loss=0.147, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000587, train/loss_step=0.169, global_step=7538.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  96%|█████████▌| 1162/1208 [32:04<01:16,  1.66s/it, loss=0.147, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000587, train/loss_step=0.169, global_step=7538.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  96%|█████████▌| 1162/1208 [32:04<01:16,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.00011, train/loss_step=0.0285, global_step=7538.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  96%|█████████▋| 1163/1208 [32:05<01:14,  1.66s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.00011, train/loss_step=0.0285, global_step=7538.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  96%|█████████▋| 1163/1208 [32:05<01:14,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.794, train/loss_vlb_step=0.134, train/loss_step=0.794, global_step=7538.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  96%|█████████▋| 1164/1208 [32:08<01:12,  1.66s/it, loss=0.138, v_num=0, train/loss_simple_step=0.794, train/loss_vlb_step=0.134, train/loss_step=0.794, global_step=7538.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  96%|█████████▋| 1164/1208 [32:08<01:12,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0039, train/loss_vlb_step=2.07e-5, train/loss_step=0.0039, global_step=7538.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  96%|█████████▋| 1165/1208 [32:09<01:11,  1.66s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0039, train/loss_vlb_step=2.07e-5, train/loss_step=0.0039, global_step=7538.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  96%|█████████▋| 1165/1208 [32:09<01:11,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=2.06e-5, train/loss_step=0.00381, global_step=7539.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  97%|█████████▋| 1166/1208 [32:10<01:09,  1.66s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=2.06e-5, train/loss_step=0.00381, global_step=7539.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  97%|█████████▋| 1166/1208 [32:10<01:09,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.835, train/loss_vlb_step=0.0851, train/loss_step=0.835, global_step=7539.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]     Epoch 24:  97%|█████████▋| 1167/1208 [32:11<01:07,  1.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.835, train/loss_vlb_step=0.0851, train/loss_step=0.835, global_step=7539.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  97%|█████████▋| 1167/1208 [32:11<01:07,  1.66s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0689, train/loss_vlb_step=0.00023, train/loss_step=0.0689, global_step=7539.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  97%|█████████▋| 1168/1208 [32:14<01:06,  1.66s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0689, train/loss_vlb_step=0.00023, train/loss_step=0.0689, global_step=7539.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  97%|█████████▋| 1168/1208 [32:14<01:06,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00106, train/loss_step=0.277, global_step=7539.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  97%|█████████▋| 1169/1208 [32:15<01:04,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00106, train/loss_step=0.277, global_step=7539.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  97%|█████████▋| 1169/1208 [32:15<01:04,  1.66s/it, loss=0.186, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000505, train/loss_step=0.149, global_step=7540.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  97%|█████████▋| 1170/1208 [32:16<01:02,  1.66s/it, loss=0.186, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000505, train/loss_step=0.149, global_step=7540.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  97%|█████████▋| 1170/1208 [32:16<01:02,  1.66s/it, loss=0.207, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00518, train/loss_step=0.430, global_step=7540.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  97%|█████████▋| 1171/1208 [32:17<01:01,  1.65s/it, loss=0.207, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00518, train/loss_step=0.430, global_step=7540.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  97%|█████████▋| 1171/1208 [32:17<01:01,  1.65s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00774, train/loss_vlb_step=3.68e-5, train/loss_step=0.00774, global_step=7540.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  97%|█████████▋| 1172/1208 [32:20<00:59,  1.66s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00774, train/loss_vlb_step=3.68e-5, train/loss_step=0.00774, global_step=7540.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  97%|█████████▋| 1172/1208 [32:20<00:59,  1.66s/it, loss=0.201, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=7540.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  97%|█████████▋| 1173/1208 [32:22<00:57,  1.66s/it, loss=0.201, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=7540.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  97%|█████████▋| 1173/1208 [32:22<00:57,  1.66s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0305, train/loss_vlb_step=0.000119, train/loss_step=0.0305, global_step=7541.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  97%|█████████▋| 1174/1208 [32:23<00:56,  1.66s/it, loss=0.202, v_num=0, train/loss_simple_step=0.0305, train/loss_vlb_step=0.000119, train/loss_step=0.0305, global_step=7541.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  97%|█████████▋| 1174/1208 [32:23<00:56,  1.66s/it, loss=0.204, v_num=0, train/loss_simple_step=0.081, train/loss_vlb_step=0.000267, train/loss_step=0.081, global_step=7541.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  97%|█████████▋| 1175/1208 [32:24<00:54,  1.65s/it, loss=0.204, v_num=0, train/loss_simple_step=0.081, train/loss_vlb_step=0.000267, train/loss_step=0.081, global_step=7541.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  97%|█████████▋| 1175/1208 [32:24<00:54,  1.65s/it, loss=0.204, v_num=0, train/loss_simple_step=0.00383, train/loss_vlb_step=2.09e-5, train/loss_step=0.00383, global_step=7541.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  97%|█████████▋| 1176/1208 [32:27<00:52,  1.66s/it, loss=0.204, v_num=0, train/loss_simple_step=0.00383, train/loss_vlb_step=2.09e-5, train/loss_step=0.00383, global_step=7541.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  97%|█████████▋| 1176/1208 [32:27<00:52,  1.66s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0965, train/loss_vlb_step=0.000322, train/loss_step=0.0965, global_step=7541.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  97%|█████████▋| 1177/1208 [32:28<00:51,  1.66s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0965, train/loss_vlb_step=0.000322, train/loss_step=0.0965, global_step=7541.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  97%|█████████▋| 1177/1208 [32:28<00:51,  1.66s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.29e-5, train/loss_step=0.00222, global_step=7542.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  98%|█████████▊| 1178/1208 [32:29<00:49,  1.65s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.29e-5, train/loss_step=0.00222, global_step=7542.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  98%|█████████▊| 1178/1208 [32:29<00:49,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0398, train/loss_vlb_step=0.000146, train/loss_step=0.0398, global_step=7542.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  98%|█████████▊| 1179/1208 [32:30<00:47,  1.65s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0398, train/loss_vlb_step=0.000146, train/loss_step=0.0398, global_step=7542.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  98%|█████████▊| 1179/1208 [32:30<00:47,  1.65s/it, loss=0.179, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.0031, train/loss_step=0.428, global_step=7542.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  98%|█████████▊| 1180/1208 [32:33<00:46,  1.66s/it, loss=0.179, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.0031, train/loss_step=0.428, global_step=7542.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  98%|█████████▊| 1180/1208 [32:33<00:46,  1.66s/it, loss=0.189, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000743, train/loss_step=0.208, global_step=7542.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  98%|█████████▊| 1181/1208 [32:34<00:44,  1.66s/it, loss=0.189, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000743, train/loss_step=0.208, global_step=7542.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  98%|█████████▊| 1181/1208 [32:34<00:44,  1.66s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0803, train/loss_vlb_step=0.000264, train/loss_step=0.0803, global_step=7543.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  98%|█████████▊| 1182/1208 [32:35<00:43,  1.65s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0803, train/loss_vlb_step=0.000264, train/loss_step=0.0803, global_step=7543.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  98%|█████████▊| 1182/1208 [32:35<00:43,  1.65s/it, loss=0.188, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000348, train/loss_step=0.106, global_step=7543.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  98%|█████████▊| 1183/1208 [32:36<00:41,  1.65s/it, loss=0.188, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000348, train/loss_step=0.106, global_step=7543.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  98%|█████████▊| 1183/1208 [32:36<00:41,  1.65s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.51e-5, train/loss_step=0.0121, global_step=7543.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  98%|█████████▊| 1184/1208 [32:39<00:39,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.51e-5, train/loss_step=0.0121, global_step=7543.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  98%|█████████▊| 1184/1208 [32:39<00:39,  1.66s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=2.35e-5, train/loss_step=0.00451, global_step=7543.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  98%|█████████▊| 1185/1208 [32:41<00:38,  1.65s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=2.35e-5, train/loss_step=0.00451, global_step=7543.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  98%|█████████▊| 1185/1208 [32:41<00:38,  1.65s/it, loss=0.16, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000973, train/loss_step=0.222, global_step=7544.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  98%|█████████▊| 1186/1208 [32:42<00:36,  1.65s/it, loss=0.16, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000973, train/loss_step=0.222, global_step=7544.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  98%|█████████▊| 1186/1208 [32:42<00:36,  1.65s/it, loss=0.128, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.00075, train/loss_step=0.195, global_step=7544.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  98%|█████████▊| 1187/1208 [32:43<00:34,  1.65s/it, loss=0.128, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.00075, train/loss_step=0.195, global_step=7544.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  98%|█████████▊| 1187/1208 [32:43<00:34,  1.65s/it, loss=0.145, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.0027, train/loss_step=0.407, global_step=7544.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  98%|█████████▊| 1188/1208 [32:46<00:33,  1.66s/it, loss=0.145, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.0027, train/loss_step=0.407, global_step=7544.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  98%|█████████▊| 1188/1208 [32:46<00:33,  1.66s/it, loss=0.148, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00165, train/loss_step=0.341, global_step=7544.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  98%|█████████▊| 1189/1208 [32:47<00:31,  1.65s/it, loss=0.148, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00165, train/loss_step=0.341, global_step=7544.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  98%|█████████▊| 1189/1208 [32:47<00:31,  1.65s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000113, train/loss_step=0.0311, global_step=7545.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  99%|█████████▊| 1190/1208 [32:48<00:29,  1.65s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000113, train/loss_step=0.0311, global_step=7545.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  99%|█████████▊| 1190/1208 [32:48<00:29,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=7545.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24:  99%|█████████▊| 1191/1208 [32:49<00:28,  1.65s/it, loss=0.126, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=7545.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  99%|█████████▊| 1191/1208 [32:49<00:28,  1.65s/it, loss=0.141, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00157, train/loss_step=0.319, global_step=7545.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  99%|█████████▊| 1192/1208 [32:52<00:26,  1.65s/it, loss=0.141, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00157, train/loss_step=0.319, global_step=7545.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  99%|█████████▊| 1192/1208 [32:52<00:26,  1.65s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=2.07e-5, train/loss_step=0.00357, global_step=7545.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  99%|█████████▉| 1193/1208 [32:53<00:24,  1.65s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=2.07e-5, train/loss_step=0.00357, global_step=7545.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  99%|█████████▉| 1193/1208 [32:53<00:24,  1.65s/it, loss=0.146, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000911, train/loss_step=0.231, global_step=7546.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  99%|█████████▉| 1194/1208 [32:54<00:23,  1.65s/it, loss=0.146, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000911, train/loss_step=0.231, global_step=7546.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  99%|█████████▉| 1194/1208 [32:54<00:23,  1.65s/it, loss=0.19, v_num=0, train/loss_simple_step=0.962, train/loss_vlb_step=0.484, train/loss_step=0.962, global_step=7546.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]    Epoch 24:  99%|█████████▉| 1195/1208 [32:55<00:21,  1.65s/it, loss=0.19, v_num=0, train/loss_simple_step=0.962, train/loss_vlb_step=0.484, train/loss_step=0.962, global_step=7546.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  99%|█████████▉| 1195/1208 [32:55<00:21,  1.65s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0641, train/loss_vlb_step=0.000222, train/loss_step=0.0641, global_step=7546.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  99%|█████████▉| 1196/1208 [32:58<00:19,  1.65s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0641, train/loss_vlb_step=0.000222, train/loss_step=0.0641, global_step=7546.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  99%|█████████▉| 1196/1208 [32:58<00:19,  1.65s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0368, train/loss_vlb_step=0.000133, train/loss_step=0.0368, global_step=7546.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24:  99%|█████████▉| 1197/1208 [32:59<00:18,  1.65s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0368, train/loss_vlb_step=0.000133, train/loss_step=0.0368, global_step=7546.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  99%|█████████▉| 1197/1208 [32:59<00:18,  1.65s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0939, train/loss_vlb_step=0.000309, train/loss_step=0.0939, global_step=7547.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  99%|█████████▉| 1198/1208 [33:01<00:16,  1.65s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0939, train/loss_vlb_step=0.000309, train/loss_step=0.0939, global_step=7547.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  99%|█████████▉| 1198/1208 [33:01<00:16,  1.65s/it, loss=0.204, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00093, train/loss_step=0.237, global_step=7547.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24:  99%|█████████▉| 1199/1208 [33:02<00:14,  1.65s/it, loss=0.204, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00093, train/loss_step=0.237, global_step=7547.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  99%|█████████▉| 1199/1208 [33:02<00:14,  1.65s/it, loss=0.191, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.00054, train/loss_step=0.160, global_step=7547.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  99%|█████████▉| 1200/1208 [33:05<00:13,  1.65s/it, loss=0.191, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.00054, train/loss_step=0.160, global_step=7547.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  99%|█████████▉| 1200/1208 [33:05<00:13,  1.65s/it, loss=0.195, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00126, train/loss_step=0.285, global_step=7547.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.84it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.76it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.74it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.74it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.75it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.75it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.75it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.76it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.76it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.76it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.82it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.82it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.76it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.82it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.80it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.81it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.78it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.81it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.80it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.78it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.79it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.75it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.75it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.82it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 24:  99%|█████████▉| 1201/1208 [33:35<00:11,  1.68s/it, loss=0.195, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00126, train/loss_step=0.285, global_step=7547.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24:  99%|█████████▉| 1201/1208 [33:35<00:11,  1.68s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.72e-5, train/loss_step=0.0178, global_step=7548.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24: 100%|█████████▉| 1202/1208 [33:36<00:10,  1.68s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.72e-5, train/loss_step=0.0178, global_step=7548.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24: 100%|█████████▉| 1202/1208 [33:36<00:10,  1.68s/it, loss=0.212, v_num=0, train/loss_simple_step=0.510, train/loss_vlb_step=0.00637, train/loss_step=0.510, global_step=7548.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]  Epoch 24: 100%|█████████▉| 1203/1208 [33:37<00:08,  1.68s/it, loss=0.212, v_num=0, train/loss_simple_step=0.510, train/loss_vlb_step=0.00637, train/loss_step=0.510, global_step=7548.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24: 100%|█████████▉| 1203/1208 [33:37<00:08,  1.68s/it, loss=0.211, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.28e-5, train/loss_step=0.00222, global_step=7548.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24: 100%|█████████▉| 1204/1208 [33:41<00:06,  1.68s/it, loss=0.211, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.28e-5, train/loss_step=0.00222, global_step=7548.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24: 100%|█████████▉| 1204/1208 [33:41<00:06,  1.68s/it, loss=0.217, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000409, train/loss_step=0.124, global_step=7548.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24: 100%|█████████▉| 1205/1208 [33:42<00:05,  1.68s/it, loss=0.217, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000409, train/loss_step=0.124, global_step=7548.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24: 100%|█████████▉| 1205/1208 [33:42<00:05,  1.68s/it, loss=0.246, v_num=0, train/loss_simple_step=0.806, train/loss_vlb_step=0.102, train/loss_step=0.806, global_step=7549.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]   Epoch 24: 100%|█████████▉| 1206/1208 [33:43<00:03,  1.68s/it, loss=0.246, v_num=0, train/loss_simple_step=0.806, train/loss_vlb_step=0.102, train/loss_step=0.806, global_step=7549.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24: 100%|█████████▉| 1206/1208 [33:43<00:03,  1.68s/it, loss=0.241, v_num=0, train/loss_simple_step=0.0801, train/loss_vlb_step=0.000265, train/loss_step=0.0801, global_step=7549.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24: 100%|█████████▉| 1207/1208 [33:44<00:01,  1.68s/it, loss=0.241, v_num=0, train/loss_simple_step=0.0801, train/loss_vlb_step=0.000265, train/loss_step=0.0801, global_step=7549.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24: 100%|█████████▉| 1207/1208 [33:44<00:01,  1.68s/it, loss=0.221, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.03e-5, train/loss_step=0.0138, global_step=7549.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140] Epoch 24: 100%|██████████| 1208/1208 [33:49<00:00,  1.68s/it, loss=0.221, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.03e-5, train/loss_step=0.0138, global_step=7549.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 24: 100%|██████████| 1208/1208 [33:49<00:00,  1.68s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0494, train/loss_vlb_step=0.000185, train/loss_step=0.0494, global_step=7549.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]
+
+
+Epoch 24:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.206, v_num=0, train/loss_simple_step=0.0494, train/loss_vlb_step=0.000185, train/loss_step=0.0494, global_step=7549.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]           Epoch 25:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.206, v_num=0, train/loss_simple_step=0.0494, train/loss_vlb_step=0.000185, train/loss_step=0.0494, global_step=7549.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][AData shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.83it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.84it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.75it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.84it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.75it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.83it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.76it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.84it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.83it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.75it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:20,  1.71it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.78it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.74it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.80it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.79it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.76it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.76it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.80it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.81it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.78it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.83it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.83it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.78it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.83it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.83it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.82it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.78it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.82it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.78it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.82it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.82it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.82it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.83it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.78it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.83it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.80it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.83it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.80it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.83it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.82it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.83it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.83it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]Epoch 25:   0%|          | 1/1208 [00:32<10:59:59, 32.81s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0494, train/loss_vlb_step=0.000185, train/loss_step=0.0494, global_step=7549.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00232, train/loss_epoch=0.140]Epoch 25:   0%|          | 1/1208 [00:32<11:00:01, 32.81s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0714, train/loss_vlb_step=0.000242, train/loss_step=0.0714, global_step=7550.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   0%|          | 2/1208 [00:33<5:40:03, 16.92s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0714, train/loss_vlb_step=0.000242, train/loss_step=0.0714, global_step=7550.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:   0%|          | 2/1208 [00:33<5:40:04, 16.92s/it, loss=0.204, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.4e-5, train/loss_step=0.0178, global_step=7550.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:   0%|          | 3/1208 [00:34<3:53:22, 11.62s/it, loss=0.204, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.4e-5, train/loss_step=0.0178, global_step=7550.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   0%|          | 3/1208 [00:34<3:53:23, 11.62s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0475, train/loss_vlb_step=0.000171, train/loss_step=0.0475, global_step=7550.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   0%|          | 4/1208 [00:37<3:10:18,  9.48s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0475, train/loss_vlb_step=0.000171, train/loss_step=0.0475, global_step=7550.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   0%|          | 4/1208 [00:37<3:10:19,  9.48s/it, loss=0.199, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000606, train/loss_step=0.171, global_step=7550.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:   0%|          | 5/1208 [00:38<2:36:19,  7.80s/it, loss=0.199, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000606, train/loss_step=0.171, global_step=7550.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   0%|          | 5/1208 [00:38<2:36:19,  7.80s/it, loss=0.209, v_num=0, train/loss_simple_step=0.424, train/loss_vlb_step=0.00271, train/loss_step=0.424, global_step=7551.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:   0%|          | 6/1208 [00:40<2:13:35,  6.67s/it, loss=0.209, v_num=0, train/loss_simple_step=0.424, train/loss_vlb_step=0.00271, train/loss_step=0.424, global_step=7551.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   0%|          | 6/1208 [00:40<2:13:35,  6.67s/it, loss=0.171, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000876, train/loss_step=0.209, global_step=7551.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   1%|          | 7/1208 [00:41<1:57:21,  5.86s/it, loss=0.171, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000876, train/loss_step=0.209, global_step=7551.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   1%|          | 7/1208 [00:41<1:57:22,  5.86s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.000135, train/loss_step=0.0356, global_step=7551.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   1%|          | 8/1208 [00:44<1:50:38,  5.53s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.000135, train/loss_step=0.0356, global_step=7551.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   1%|          | 8/1208 [00:44<1:50:38,  5.53s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.73e-5, train/loss_step=0.00311, global_step=7551.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   1%|          | 9/1208 [00:45<1:40:36,  5.03s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.73e-5, train/loss_step=0.00311, global_step=7551.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   1%|          | 9/1208 [00:45<1:40:36,  5.03s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0928, train/loss_vlb_step=0.000305, train/loss_step=0.0928, global_step=7552.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:   1%|          | 10/1208 [00:46<1:32:32,  4.63s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0928, train/loss_vlb_step=0.000305, train/loss_step=0.0928, global_step=7552.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   1%|          | 10/1208 [00:46<1:32:32,  4.63s/it, loss=0.163, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000508, train/loss_step=0.147, global_step=7552.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:   1%|          | 11/1208 [00:47<1:25:54,  4.31s/it, loss=0.163, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000508, train/loss_step=0.147, global_step=7552.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   1%|          | 11/1208 [00:47<1:25:55,  4.31s/it, loss=0.183, v_num=0, train/loss_simple_step=0.557, train/loss_vlb_step=0.0142, train/loss_step=0.557, global_step=7552.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:   1%|          | 12/1208 [00:50<1:24:02,  4.22s/it, loss=0.183, v_num=0, train/loss_simple_step=0.557, train/loss_vlb_step=0.0142, train/loss_step=0.557, global_step=7552.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   1%|          | 12/1208 [00:50<1:24:02,  4.22s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00454, train/loss_vlb_step=2.44e-5, train/loss_step=0.00454, global_step=7552.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   1%|          | 13/1208 [00:51<1:19:08,  3.97s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00454, train/loss_vlb_step=2.44e-5, train/loss_step=0.00454, global_step=7552.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   1%|          | 13/1208 [00:51<1:19:08,  3.97s/it, loss=0.173, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000315, train/loss_step=0.095, global_step=7553.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:   1%|          | 14/1208 [00:52<1:14:54,  3.76s/it, loss=0.173, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000315, train/loss_step=0.095, global_step=7553.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   1%|          | 14/1208 [00:52<1:14:54,  3.76s/it, loss=0.161, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00129, train/loss_step=0.277, global_step=7553.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:   1%|          | 15/1208 [00:53<1:11:12,  3.58s/it, loss=0.161, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00129, train/loss_step=0.277, global_step=7553.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   1%|          | 15/1208 [00:53<1:11:13,  3.58s/it, loss=0.177, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00161, train/loss_step=0.320, global_step=7553.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   1%|▏         | 16/1208 [00:56<1:10:40,  3.56s/it, loss=0.177, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00161, train/loss_step=0.320, global_step=7553.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   1%|▏         | 16/1208 [00:56<1:10:40,  3.56s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000102, train/loss_step=0.0263, global_step=7553.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   1%|▏         | 17/1208 [00:57<1:07:42,  3.41s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000102, train/loss_step=0.0263, global_step=7553.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   1%|▏         | 17/1208 [00:57<1:07:42,  3.41s/it, loss=0.156, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.00359, train/loss_step=0.470, global_step=7554.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:   1%|▏         | 18/1208 [00:59<1:05:01,  3.28s/it, loss=0.156, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.00359, train/loss_step=0.470, global_step=7554.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   1%|▏         | 18/1208 [00:59<1:05:01,  3.28s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0735, train/loss_vlb_step=0.000245, train/loss_step=0.0735, global_step=7554.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   2%|▏         | 19/1208 [01:00<1:02:37,  3.16s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0735, train/loss_vlb_step=0.000245, train/loss_step=0.0735, global_step=7554.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   2%|▏         | 19/1208 [01:00<1:02:37,  3.16s/it, loss=0.171, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00186, train/loss_step=0.332, global_step=7554.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:   2%|▏         | 20/1208 [01:03<1:02:37,  3.16s/it, loss=0.171, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00186, train/loss_step=0.332, global_step=7554.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   2%|▏         | 20/1208 [01:03<1:02:37,  3.16s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=2.61e-5, train/loss_step=0.00481, global_step=7554.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   2%|▏         | 21/1208 [01:04<1:00:34,  3.06s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=2.61e-5, train/loss_step=0.00481, global_step=7554.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   2%|▏         | 21/1208 [01:04<1:00:34,  3.06s/it, loss=0.172, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=7555.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:   2%|▏         | 22/1208 [01:05<58:41,  2.97s/it, loss=0.172, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=7555.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:   2%|▏         | 22/1208 [01:05<58:41,  2.97s/it, loss=0.199, v_num=0, train/loss_simple_step=0.556, train/loss_vlb_step=0.00886, train/loss_step=0.556, global_step=7555.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:   2%|▏         | 23/1208 [01:06<56:58,  2.88s/it, loss=0.199, v_num=0, train/loss_simple_step=0.556, train/loss_vlb_step=0.00886, train/loss_step=0.556, global_step=7555.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   2%|▏         | 23/1208 [01:06<56:58,  2.88s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=2.01e-5, train/loss_step=0.00356, global_step=7555.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   2%|▏         | 24/1208 [01:09<57:12,  2.90s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=2.01e-5, train/loss_step=0.00356, global_step=7555.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   2%|▏         | 24/1208 [01:09<57:12,  2.90s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0694, train/loss_vlb_step=0.000229, train/loss_step=0.0694, global_step=7555.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:   2%|▏         | 25/1208 [01:10<55:41,  2.82s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0694, train/loss_vlb_step=0.000229, train/loss_step=0.0694, global_step=7555.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   2%|▏         | 25/1208 [01:10<55:41,  2.82s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0724, train/loss_vlb_step=0.000249, train/loss_step=0.0724, global_step=7556.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   2%|▏         | 26/1208 [01:11<54:17,  2.76s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0724, train/loss_vlb_step=0.000249, train/loss_step=0.0724, global_step=7556.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   2%|▏         | 26/1208 [01:11<54:17,  2.76s/it, loss=0.195, v_num=0, train/loss_simple_step=0.644, train/loss_vlb_step=0.0369, train/loss_step=0.644, global_step=7556.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:   2%|▏         | 27/1208 [01:12<52:59,  2.69s/it, loss=0.195, v_num=0, train/loss_simple_step=0.644, train/loss_vlb_step=0.0369, train/loss_step=0.644, global_step=7556.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   2%|▏         | 27/1208 [01:12<52:59,  2.69s/it, loss=0.194, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.37e-5, train/loss_step=0.00235, global_step=7556.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   2%|▏         | 28/1208 [01:15<53:18,  2.71s/it, loss=0.194, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.37e-5, train/loss_step=0.00235, global_step=7556.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   2%|▏         | 28/1208 [01:15<53:18,  2.71s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0705, train/loss_vlb_step=0.000238, train/loss_step=0.0705, global_step=7556.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:   2%|▏         | 29/1208 [01:16<52:08,  2.65s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0705, train/loss_vlb_step=0.000238, train/loss_step=0.0705, global_step=7556.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   2%|▏         | 29/1208 [01:16<52:08,  2.65s/it, loss=0.193, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.48e-5, train/loss_step=0.015, global_step=7557.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:   2%|▏         | 30/1208 [01:17<51:02,  2.60s/it, loss=0.193, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.48e-5, train/loss_step=0.015, global_step=7557.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   2%|▏         | 30/1208 [01:17<51:02,  2.60s/it, loss=0.191, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=7557.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   3%|▎         | 31/1208 [01:19<50:00,  2.55s/it, loss=0.191, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000343, train/loss_step=0.104, global_step=7557.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   3%|▎         | 31/1208 [01:19<50:00,  2.55s/it, loss=0.196, v_num=0, train/loss_simple_step=0.647, train/loss_vlb_step=0.0135, train/loss_step=0.647, global_step=7557.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:   3%|▎         | 32/1208 [01:22<50:21,  2.57s/it, loss=0.196, v_num=0, train/loss_simple_step=0.647, train/loss_vlb_step=0.0135, train/loss_step=0.647, global_step=7557.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   3%|▎         | 32/1208 [01:22<50:21,  2.57s/it, loss=0.201, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.00037, train/loss_step=0.113, global_step=7557.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   3%|▎         | 33/1208 [01:23<49:24,  2.52s/it, loss=0.201, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.00037, train/loss_step=0.113, global_step=7557.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   3%|▎         | 33/1208 [01:23<49:24,  2.52s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.83e-5, train/loss_step=0.0209, global_step=7558.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   3%|▎         | 34/1208 [01:24<48:30,  2.48s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.83e-5, train/loss_step=0.0209, global_step=7558.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   3%|▎         | 34/1208 [01:24<48:30,  2.48s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.75e-5, train/loss_step=0.00311, global_step=7558.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   3%|▎         | 35/1208 [01:25<47:39,  2.44s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.75e-5, train/loss_step=0.00311, global_step=7558.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   3%|▎         | 35/1208 [01:25<47:39,  2.44s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0434, train/loss_vlb_step=0.000158, train/loss_step=0.0434, global_step=7558.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:   3%|▎         | 36/1208 [01:28<48:01,  2.46s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0434, train/loss_vlb_step=0.000158, train/loss_step=0.0434, global_step=7558.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   3%|▎         | 36/1208 [01:28<48:01,  2.46s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.59e-5, train/loss_step=0.0143, global_step=7558.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   3%|▎         | 37/1208 [01:29<47:14,  2.42s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.59e-5, train/loss_step=0.0143, global_step=7558.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   3%|▎         | 37/1208 [01:29<47:14,  2.42s/it, loss=0.166, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00336, train/loss_step=0.409, global_step=7559.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:   3%|▎         | 38/1208 [01:30<46:29,  2.38s/it, loss=0.166, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00336, train/loss_step=0.409, global_step=7559.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   3%|▎         | 38/1208 [01:30<46:29,  2.38s/it, loss=0.169, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000467, train/loss_step=0.141, global_step=7559.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   3%|▎         | 39/1208 [01:31<45:46,  2.35s/it, loss=0.169, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000467, train/loss_step=0.141, global_step=7559.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   3%|▎         | 39/1208 [01:31<45:46,  2.35s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.63e-5, train/loss_step=0.0151, global_step=7559.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   3%|▎         | 40/1208 [01:34<46:09,  2.37s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.63e-5, train/loss_step=0.0151, global_step=7559.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   3%|▎         | 40/1208 [01:34<46:09,  2.37s/it, loss=0.178, v_num=0, train/loss_simple_step=0.491, train/loss_vlb_step=0.00679, train/loss_step=0.491, global_step=7559.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:   3%|▎         | 41/1208 [01:35<45:29,  2.34s/it, loss=0.178, v_num=0, train/loss_simple_step=0.491, train/loss_vlb_step=0.00679, train/loss_step=0.491, global_step=7559.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   3%|▎         | 41/1208 [01:35<45:29,  2.34s/it, loss=0.188, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00249, train/loss_step=0.334, global_step=7560.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   3%|▎         | 42/1208 [01:36<44:51,  2.31s/it, loss=0.188, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00249, train/loss_step=0.334, global_step=7560.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   3%|▎         | 42/1208 [01:36<44:51,  2.31s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00926, train/loss_vlb_step=4.25e-5, train/loss_step=0.00926, global_step=7560.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   4%|▎         | 43/1208 [01:37<44:14,  2.28s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00926, train/loss_vlb_step=4.25e-5, train/loss_step=0.00926, global_step=7560.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   4%|▎         | 43/1208 [01:37<44:14,  2.28s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000122, train/loss_step=0.0349, global_step=7560.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:   4%|▎         | 44/1208 [01:41<44:36,  2.30s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000122, train/loss_step=0.0349, global_step=7560.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   4%|▎         | 44/1208 [01:41<44:36,  2.30s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00439, train/loss_vlb_step=2.36e-5, train/loss_step=0.00439, global_step=7560.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   4%|▎         | 45/1208 [01:42<44:02,  2.27s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00439, train/loss_vlb_step=2.36e-5, train/loss_step=0.00439, global_step=7560.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   4%|▎         | 45/1208 [01:42<44:02,  2.27s/it, loss=0.163, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000478, train/loss_step=0.144, global_step=7561.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:   4%|▍         | 46/1208 [01:43<43:29,  2.25s/it, loss=0.163, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000478, train/loss_step=0.144, global_step=7561.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   4%|▍         | 46/1208 [01:43<43:29,  2.25s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0446, train/loss_vlb_step=0.000159, train/loss_step=0.0446, global_step=7561.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   4%|▍         | 47/1208 [01:44<42:57,  2.22s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0446, train/loss_vlb_step=0.000159, train/loss_step=0.0446, global_step=7561.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   4%|▍         | 47/1208 [01:44<42:57,  2.22s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.72e-5, train/loss_step=0.0158, global_step=7561.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:   4%|▍         | 48/1208 [01:47<43:18,  2.24s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.72e-5, train/loss_step=0.0158, global_step=7561.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   4%|▍         | 48/1208 [01:47<43:18,  2.24s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=2.03e-5, train/loss_step=0.00361, global_step=7561.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   4%|▍         | 49/1208 [01:48<42:47,  2.22s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=2.03e-5, train/loss_step=0.00361, global_step=7561.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   4%|▍         | 49/1208 [01:48<42:47,  2.22s/it, loss=0.143, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.0011, train/loss_step=0.261, global_step=7562.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:   4%|▍         | 50/1208 [01:49<42:18,  2.19s/it, loss=0.143, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.0011, train/loss_step=0.261, global_step=7562.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   4%|▍         | 50/1208 [01:49<42:18,  2.19s/it, loss=0.156, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00231, train/loss_step=0.370, global_step=7562.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   4%|▍         | 51/1208 [01:50<41:49,  2.17s/it, loss=0.156, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00231, train/loss_step=0.370, global_step=7562.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   4%|▍         | 51/1208 [01:50<41:49,  2.17s/it, loss=0.138, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00135, train/loss_step=0.278, global_step=7562.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   4%|▍         | 52/1208 [01:53<42:10,  2.19s/it, loss=0.138, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00135, train/loss_step=0.278, global_step=7562.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   4%|▍         | 52/1208 [01:53<42:11,  2.19s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.86e-5, train/loss_step=0.00349, global_step=7562.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   4%|▍         | 53/1208 [01:54<41:44,  2.17s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.86e-5, train/loss_step=0.00349, global_step=7562.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   4%|▍         | 53/1208 [01:54<41:44,  2.17s/it, loss=0.136, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=7563.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:   4%|▍         | 54/1208 [01:55<41:18,  2.15s/it, loss=0.136, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=7563.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   4%|▍         | 54/1208 [01:55<41:18,  2.15s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.93e-5, train/loss_step=0.0158, global_step=7563.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   5%|▍         | 55/1208 [01:57<40:52,  2.13s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.93e-5, train/loss_step=0.0158, global_step=7563.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   5%|▍         | 55/1208 [01:57<40:52,  2.13s/it, loss=0.158, v_num=0, train/loss_simple_step=0.462, train/loss_vlb_step=0.0041, train/loss_step=0.462, global_step=7563.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:   5%|▍         | 56/1208 [02:00<41:11,  2.15s/it, loss=0.158, v_num=0, train/loss_simple_step=0.462, train/loss_vlb_step=0.0041, train/loss_step=0.462, global_step=7563.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   5%|▍         | 56/1208 [02:00<41:12,  2.15s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0803, train/loss_vlb_step=0.000267, train/loss_step=0.0803, global_step=7563.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   5%|▍         | 57/1208 [02:01<40:47,  2.13s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0803, train/loss_vlb_step=0.000267, train/loss_step=0.0803, global_step=7563.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   5%|▍         | 57/1208 [02:01<40:47,  2.13s/it, loss=0.17, v_num=0, train/loss_simple_step=0.590, train/loss_vlb_step=0.0207, train/loss_step=0.590, global_step=7564.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]     Epoch 25:   5%|▍         | 58/1208 [02:02<40:23,  2.11s/it, loss=0.17, v_num=0, train/loss_simple_step=0.590, train/loss_vlb_step=0.0207, train/loss_step=0.590, global_step=7564.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   5%|▍         | 58/1208 [02:02<40:23,  2.11s/it, loss=0.168, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=7564.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   5%|▍         | 59/1208 [02:03<40:00,  2.09s/it, loss=0.168, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=7564.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   5%|▍         | 59/1208 [02:03<40:00,  2.09s/it, loss=0.174, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000422, train/loss_step=0.126, global_step=7564.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   5%|▍         | 60/1208 [02:06<40:19,  2.11s/it, loss=0.174, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000422, train/loss_step=0.126, global_step=7564.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   5%|▍         | 60/1208 [02:06<40:19,  2.11s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0876, train/loss_vlb_step=0.000297, train/loss_step=0.0876, global_step=7564.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   5%|▌         | 61/1208 [02:07<39:58,  2.09s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0876, train/loss_vlb_step=0.000297, train/loss_step=0.0876, global_step=7564.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   5%|▌         | 61/1208 [02:07<39:58,  2.09s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0605, train/loss_vlb_step=0.000209, train/loss_step=0.0605, global_step=7565.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:   5%|▌         | 62/1208 [02:08<39:36,  2.07s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0605, train/loss_vlb_step=0.000209, train/loss_step=0.0605, global_step=7565.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   5%|▌         | 62/1208 [02:08<39:36,  2.07s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=6.94e-5, train/loss_step=0.0169, global_step=7565.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:   5%|▌         | 63/1208 [02:09<39:15,  2.06s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=6.94e-5, train/loss_step=0.0169, global_step=7565.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   5%|▌         | 63/1208 [02:09<39:15,  2.06s/it, loss=0.155, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00192, train/loss_step=0.326, global_step=7565.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:   5%|▌         | 64/1208 [02:12<39:33,  2.08s/it, loss=0.155, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00192, train/loss_step=0.326, global_step=7565.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   5%|▌         | 64/1208 [02:12<39:33,  2.08s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.25e-5, train/loss_step=0.0119, global_step=7565.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   5%|▌         | 65/1208 [02:13<39:13,  2.06s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.25e-5, train/loss_step=0.0119, global_step=7565.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   5%|▌         | 65/1208 [02:13<39:13,  2.06s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00543, train/loss_vlb_step=2.85e-5, train/loss_step=0.00543, global_step=7566.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   5%|▌         | 66/1208 [02:14<38:53,  2.04s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00543, train/loss_vlb_step=2.85e-5, train/loss_step=0.00543, global_step=7566.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   5%|▌         | 66/1208 [02:14<38:53,  2.04s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.46e-5, train/loss_step=0.00255, global_step=7566.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   6%|▌         | 67/1208 [02:15<38:34,  2.03s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.46e-5, train/loss_step=0.00255, global_step=7566.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   6%|▌         | 67/1208 [02:15<38:34,  2.03s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.37e-5, train/loss_step=0.00244, global_step=7566.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   6%|▌         | 68/1208 [02:19<38:52,  2.05s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.37e-5, train/loss_step=0.00244, global_step=7566.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   6%|▌         | 68/1208 [02:19<38:52,  2.05s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0431, train/loss_vlb_step=0.000155, train/loss_step=0.0431, global_step=7566.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:   6%|▌         | 69/1208 [02:20<38:34,  2.03s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0431, train/loss_vlb_step=0.000155, train/loss_step=0.0431, global_step=7566.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   6%|▌         | 69/1208 [02:20<38:34,  2.03s/it, loss=0.141, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000411, train/loss_step=0.122, global_step=7567.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:   6%|▌         | 70/1208 [02:21<38:16,  2.02s/it, loss=0.141, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000411, train/loss_step=0.122, global_step=7567.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   6%|▌         | 70/1208 [02:21<38:16,  2.02s/it, loss=0.136, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00134, train/loss_step=0.282, global_step=7567.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:   6%|▌         | 71/1208 [02:22<37:59,  2.00s/it, loss=0.136, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00134, train/loss_step=0.282, global_step=7567.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   6%|▌         | 71/1208 [02:22<37:59,  2.00s/it, loss=0.134, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000894, train/loss_step=0.231, global_step=7567.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   6%|▌         | 72/1208 [02:25<38:15,  2.02s/it, loss=0.134, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000894, train/loss_step=0.231, global_step=7567.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   6%|▌         | 72/1208 [02:25<38:15,  2.02s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00846, train/loss_vlb_step=4.17e-5, train/loss_step=0.00846, global_step=7567.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   6%|▌         | 73/1208 [02:26<37:58,  2.01s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00846, train/loss_vlb_step=4.17e-5, train/loss_step=0.00846, global_step=7567.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   6%|▌         | 73/1208 [02:26<37:58,  2.01s/it, loss=0.147, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00216, train/loss_step=0.361, global_step=7568.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:   6%|▌         | 74/1208 [02:27<37:41,  1.99s/it, loss=0.147, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00216, train/loss_step=0.361, global_step=7568.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   6%|▌         | 74/1208 [02:27<37:41,  1.99s/it, loss=0.154, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000544, train/loss_step=0.156, global_step=7568.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   6%|▌         | 75/1208 [02:28<37:24,  1.98s/it, loss=0.154, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000544, train/loss_step=0.156, global_step=7568.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   6%|▌         | 75/1208 [02:28<37:24,  1.98s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=1.1e-5, train/loss_step=0.00181, global_step=7568.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   6%|▋         | 76/1208 [02:31<37:40,  2.00s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=1.1e-5, train/loss_step=0.00181, global_step=7568.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   6%|▋         | 76/1208 [02:31<37:41,  2.00s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.35e-5, train/loss_step=0.00236, global_step=7568.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   6%|▋         | 77/1208 [02:32<37:25,  1.99s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.35e-5, train/loss_step=0.00236, global_step=7568.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   6%|▋         | 77/1208 [02:32<37:25,  1.99s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.00859, train/loss_vlb_step=4.1e-5, train/loss_step=0.00859, global_step=7569.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   6%|▋         | 78/1208 [02:33<37:09,  1.97s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.00859, train/loss_vlb_step=4.1e-5, train/loss_step=0.00859, global_step=7569.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   6%|▋         | 78/1208 [02:33<37:09,  1.97s/it, loss=0.0929, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.41e-5, train/loss_step=0.00253, global_step=7569.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   7%|▋         | 79/1208 [02:34<36:54,  1.96s/it, loss=0.0929, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.41e-5, train/loss_step=0.00253, global_step=7569.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   7%|▋         | 79/1208 [02:34<36:54,  1.96s/it, loss=0.089, v_num=0, train/loss_simple_step=0.0481, train/loss_vlb_step=0.000169, train/loss_step=0.0481, global_step=7569.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:   7%|▋         | 80/1208 [02:38<37:09,  1.98s/it, loss=0.089, v_num=0, train/loss_simple_step=0.0481, train/loss_vlb_step=0.000169, train/loss_step=0.0481, global_step=7569.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   7%|▋         | 80/1208 [02:38<37:09,  1.98s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.0559, train/loss_vlb_step=0.000186, train/loss_step=0.0559, global_step=7569.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   7%|▋         | 81/1208 [02:39<36:54,  1.97s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.0559, train/loss_vlb_step=0.000186, train/loss_step=0.0559, global_step=7569.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   7%|▋         | 81/1208 [02:39<36:54,  1.97s/it, loss=0.0845, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.14e-5, train/loss_step=0.00194, global_step=7570.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   7%|▋         | 82/1208 [02:40<36:39,  1.95s/it, loss=0.0845, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.14e-5, train/loss_step=0.00194, global_step=7570.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   7%|▋         | 82/1208 [02:40<36:39,  1.95s/it, loss=0.084, v_num=0, train/loss_simple_step=0.00571, train/loss_vlb_step=3.01e-5, train/loss_step=0.00571, global_step=7570.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:   7%|▋         | 83/1208 [02:41<36:25,  1.94s/it, loss=0.084, v_num=0, train/loss_simple_step=0.00571, train/loss_vlb_step=3.01e-5, train/loss_step=0.00571, global_step=7570.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   7%|▋         | 83/1208 [02:41<36:25,  1.94s/it, loss=0.0743, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.00044, train/loss_step=0.132, global_step=7570.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:   7%|▋         | 84/1208 [02:44<36:40,  1.96s/it, loss=0.0743, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.00044, train/loss_step=0.132, global_step=7570.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   7%|▋         | 84/1208 [02:44<36:40,  1.96s/it, loss=0.0737, v_num=0, train/loss_simple_step=0.00138, train/loss_vlb_step=8.4e-6, train/loss_step=0.00138, global_step=7570.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   7%|▋         | 85/1208 [02:45<36:26,  1.95s/it, loss=0.0737, v_num=0, train/loss_simple_step=0.00138, train/loss_vlb_step=8.4e-6, train/loss_step=0.00138, global_step=7570.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   7%|▋         | 85/1208 [02:45<36:26,  1.95s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000602, train/loss_step=0.174, global_step=7571.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:   7%|▋         | 86/1208 [02:46<36:12,  1.94s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000602, train/loss_step=0.174, global_step=7571.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   7%|▋         | 86/1208 [02:46<36:12,  1.94s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.68e-5, train/loss_step=0.00292, global_step=7571.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   7%|▋         | 87/1208 [02:47<35:59,  1.93s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.68e-5, train/loss_step=0.00292, global_step=7571.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   7%|▋         | 87/1208 [02:47<35:59,  1.93s/it, loss=0.084, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000143, train/loss_step=0.0386, global_step=7571.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:   7%|▋         | 88/1208 [02:50<36:13,  1.94s/it, loss=0.084, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000143, train/loss_step=0.0386, global_step=7571.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   7%|▋         | 88/1208 [02:50<36:13,  1.94s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.0375, train/loss_vlb_step=0.000139, train/loss_step=0.0375, global_step=7571.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   7%|▋         | 89/1208 [02:51<36:00,  1.93s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.0375, train/loss_vlb_step=0.000139, train/loss_step=0.0375, global_step=7571.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   7%|▋         | 89/1208 [02:51<36:00,  1.93s/it, loss=0.0777, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=1.07e-5, train/loss_step=0.00185, global_step=7572.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   7%|▋         | 90/1208 [02:52<35:47,  1.92s/it, loss=0.0777, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=1.07e-5, train/loss_step=0.00185, global_step=7572.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   7%|▋         | 90/1208 [02:52<35:47,  1.92s/it, loss=0.0766, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.0011, train/loss_step=0.260, global_step=7572.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]     Epoch 25:   8%|▊         | 91/1208 [02:53<35:34,  1.91s/it, loss=0.0766, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.0011, train/loss_step=0.260, global_step=7572.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   8%|▊         | 91/1208 [02:53<35:34,  1.91s/it, loss=0.0847, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00296, train/loss_step=0.394, global_step=7572.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   8%|▊         | 92/1208 [02:57<35:48,  1.92s/it, loss=0.0847, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00296, train/loss_step=0.394, global_step=7572.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   8%|▊         | 92/1208 [02:57<35:48,  1.92s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000529, train/loss_step=0.159, global_step=7572.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   8%|▊         | 93/1208 [02:58<35:35,  1.92s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000529, train/loss_step=0.159, global_step=7572.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   8%|▊         | 93/1208 [02:58<35:35,  1.92s/it, loss=0.075, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.83e-5, train/loss_step=0.0156, global_step=7573.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   8%|▊         | 94/1208 [02:59<35:23,  1.91s/it, loss=0.075, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.83e-5, train/loss_step=0.0156, global_step=7573.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   8%|▊         | 94/1208 [02:59<35:23,  1.91s/it, loss=0.0755, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000624, train/loss_step=0.168, global_step=7573.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   8%|▊         | 95/1208 [03:00<35:11,  1.90s/it, loss=0.0755, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000624, train/loss_step=0.168, global_step=7573.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   8%|▊         | 95/1208 [03:00<35:11,  1.90s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000568, train/loss_step=0.165, global_step=7573.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   8%|▊         | 96/1208 [03:03<35:24,  1.91s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000568, train/loss_step=0.165, global_step=7573.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   8%|▊         | 96/1208 [03:03<35:24,  1.91s/it, loss=0.0858, v_num=0, train/loss_simple_step=0.0446, train/loss_vlb_step=0.00016, train/loss_step=0.0446, global_step=7573.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   8%|▊         | 97/1208 [03:04<35:12,  1.90s/it, loss=0.0858, v_num=0, train/loss_simple_step=0.0446, train/loss_vlb_step=0.00016, train/loss_step=0.0446, global_step=7573.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   8%|▊         | 97/1208 [03:04<35:12,  1.90s/it, loss=0.101, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00147, train/loss_step=0.322, global_step=7574.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:   8%|▊         | 98/1208 [03:05<35:01,  1.89s/it, loss=0.101, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00147, train/loss_step=0.322, global_step=7574.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   8%|▊         | 98/1208 [03:05<35:01,  1.89s/it, loss=0.108, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000465, train/loss_step=0.139, global_step=7574.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   8%|▊         | 99/1208 [03:06<34:49,  1.88s/it, loss=0.108, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000465, train/loss_step=0.139, global_step=7574.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   8%|▊         | 99/1208 [03:06<34:49,  1.88s/it, loss=0.121, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00133, train/loss_step=0.308, global_step=7574.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:   8%|▊         | 100/1208 [03:09<35:02,  1.90s/it, loss=0.121, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00133, train/loss_step=0.308, global_step=7574.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   8%|▊         | 100/1208 [03:09<35:02,  1.90s/it, loss=0.142, v_num=0, train/loss_simple_step=0.474, train/loss_vlb_step=0.00516, train/loss_step=0.474, global_step=7574.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   8%|▊         | 101/1208 [03:10<34:51,  1.89s/it, loss=0.142, v_num=0, train/loss_simple_step=0.474, train/loss_vlb_step=0.00516, train/loss_step=0.474, global_step=7574.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   8%|▊         | 101/1208 [03:10<34:51,  1.89s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00157, train/loss_vlb_step=9.51e-6, train/loss_step=0.00157, global_step=7575.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   8%|▊         | 102/1208 [03:11<34:40,  1.88s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00157, train/loss_vlb_step=9.51e-6, train/loss_step=0.00157, global_step=7575.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   8%|▊         | 102/1208 [03:11<34:40,  1.88s/it, loss=0.166, v_num=0, train/loss_simple_step=0.483, train/loss_vlb_step=0.00812, train/loss_step=0.483, global_step=7575.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:   9%|▊         | 103/1208 [03:12<34:29,  1.87s/it, loss=0.166, v_num=0, train/loss_simple_step=0.483, train/loss_vlb_step=0.00812, train/loss_step=0.483, global_step=7575.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   9%|▊         | 103/1208 [03:12<34:29,  1.87s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000168, train/loss_step=0.0454, global_step=7575.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   9%|▊         | 104/1208 [03:16<34:41,  1.89s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000168, train/loss_step=0.0454, global_step=7575.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   9%|▊         | 104/1208 [03:16<34:41,  1.89s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.67e-5, train/loss_step=0.0104, global_step=7575.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:   9%|▊         | 105/1208 [03:17<34:31,  1.88s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.67e-5, train/loss_step=0.0104, global_step=7575.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   9%|▊         | 105/1208 [03:17<34:31,  1.88s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00337, train/loss_vlb_step=1.78e-5, train/loss_step=0.00337, global_step=7576.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   9%|▉         | 106/1208 [03:18<34:20,  1.87s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00337, train/loss_vlb_step=1.78e-5, train/loss_step=0.00337, global_step=7576.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   9%|▉         | 106/1208 [03:18<34:20,  1.87s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0473, train/loss_vlb_step=0.000169, train/loss_step=0.0473, global_step=7576.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:   9%|▉         | 107/1208 [03:19<34:10,  1.86s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0473, train/loss_vlb_step=0.000169, train/loss_step=0.0473, global_step=7576.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   9%|▉         | 107/1208 [03:19<34:10,  1.86s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0504, train/loss_vlb_step=0.000178, train/loss_step=0.0504, global_step=7576.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   9%|▉         | 108/1208 [03:22<34:21,  1.87s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0504, train/loss_vlb_step=0.000178, train/loss_step=0.0504, global_step=7576.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   9%|▉         | 108/1208 [03:22<34:21,  1.87s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=0.000101, train/loss_step=0.0244, global_step=7576.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   9%|▉         | 109/1208 [03:23<34:11,  1.87s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=0.000101, train/loss_step=0.0244, global_step=7576.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   9%|▉         | 109/1208 [03:23<34:11,  1.87s/it, loss=0.163, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000509, train/loss_step=0.154, global_step=7577.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:   9%|▉         | 110/1208 [03:24<34:01,  1.86s/it, loss=0.163, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000509, train/loss_step=0.154, global_step=7577.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   9%|▉         | 110/1208 [03:24<34:01,  1.86s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00639, train/loss_vlb_step=3.18e-5, train/loss_step=0.00639, global_step=7577.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   9%|▉         | 111/1208 [03:25<33:51,  1.85s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00639, train/loss_vlb_step=3.18e-5, train/loss_step=0.00639, global_step=7577.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   9%|▉         | 111/1208 [03:25<33:51,  1.85s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00554, train/loss_vlb_step=2.98e-5, train/loss_step=0.00554, global_step=7577.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   9%|▉         | 112/1208 [03:28<34:03,  1.86s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00554, train/loss_vlb_step=2.98e-5, train/loss_step=0.00554, global_step=7577.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   9%|▉         | 112/1208 [03:28<34:03,  1.86s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=2.31e-5, train/loss_step=0.00421, global_step=7577.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   9%|▉         | 113/1208 [03:29<33:53,  1.86s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=2.31e-5, train/loss_step=0.00421, global_step=7577.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   9%|▉         | 113/1208 [03:29<33:53,  1.86s/it, loss=0.161, v_num=0, train/loss_simple_step=0.771, train/loss_vlb_step=0.130, train/loss_step=0.771, global_step=7578.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]      Epoch 25:   9%|▉         | 114/1208 [03:30<33:44,  1.85s/it, loss=0.161, v_num=0, train/loss_simple_step=0.771, train/loss_vlb_step=0.130, train/loss_step=0.771, global_step=7578.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:   9%|▉         | 114/1208 [03:30<33:44,  1.85s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=2.84e-5, train/loss_step=0.00526, global_step=7578.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  10%|▉         | 115/1208 [03:31<33:34,  1.84s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=2.84e-5, train/loss_step=0.00526, global_step=7578.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  10%|▉         | 115/1208 [03:31<33:34,  1.84s/it, loss=0.15, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000365, train/loss_step=0.109, global_step=7578.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  10%|▉         | 116/1208 [03:35<33:45,  1.86s/it, loss=0.15, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000365, train/loss_step=0.109, global_step=7578.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  10%|▉         | 116/1208 [03:35<33:45,  1.86s/it, loss=0.166, v_num=0, train/loss_simple_step=0.358, train/loss_vlb_step=0.00243, train/loss_step=0.358, global_step=7578.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  10%|▉         | 117/1208 [03:36<33:36,  1.85s/it, loss=0.166, v_num=0, train/loss_simple_step=0.358, train/loss_vlb_step=0.00243, train/loss_step=0.358, global_step=7578.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  10%|▉         | 117/1208 [03:36<33:36,  1.85s/it, loss=0.179, v_num=0, train/loss_simple_step=0.582, train/loss_vlb_step=0.0148, train/loss_step=0.582, global_step=7579.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  10%|▉         | 118/1208 [03:37<33:27,  1.84s/it, loss=0.179, v_num=0, train/loss_simple_step=0.582, train/loss_vlb_step=0.0148, train/loss_step=0.582, global_step=7579.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  10%|▉         | 118/1208 [03:37<33:27,  1.84s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00763, train/loss_vlb_step=3.83e-5, train/loss_step=0.00763, global_step=7579.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  10%|▉         | 119/1208 [03:38<33:18,  1.84s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00763, train/loss_vlb_step=3.83e-5, train/loss_step=0.00763, global_step=7579.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  10%|▉         | 119/1208 [03:38<33:18,  1.84s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00903, train/loss_vlb_step=4.2e-5, train/loss_step=0.00903, global_step=7579.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  10%|▉         | 120/1208 [03:41<33:28,  1.85s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00903, train/loss_vlb_step=4.2e-5, train/loss_step=0.00903, global_step=7579.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  10%|▉         | 120/1208 [03:41<33:28,  1.85s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00666, train/loss_vlb_step=3.33e-5, train/loss_step=0.00666, global_step=7579.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  10%|█         | 121/1208 [03:42<33:19,  1.84s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00666, train/loss_vlb_step=3.33e-5, train/loss_step=0.00666, global_step=7579.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  10%|█         | 121/1208 [03:42<33:19,  1.84s/it, loss=0.156, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00357, train/loss_step=0.430, global_step=7580.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  10%|█         | 122/1208 [03:43<33:10,  1.83s/it, loss=0.156, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00357, train/loss_step=0.430, global_step=7580.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  10%|█         | 122/1208 [03:43<33:10,  1.83s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0428, train/loss_vlb_step=0.000153, train/loss_step=0.0428, global_step=7580.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  10%|█         | 123/1208 [03:44<33:01,  1.83s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0428, train/loss_vlb_step=0.000153, train/loss_step=0.0428, global_step=7580.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  10%|█         | 123/1208 [03:44<33:01,  1.83s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0678, train/loss_vlb_step=0.000227, train/loss_step=0.0678, global_step=7580.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  10%|█         | 124/1208 [03:47<33:11,  1.84s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0678, train/loss_vlb_step=0.000227, train/loss_step=0.0678, global_step=7580.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  10%|█         | 124/1208 [03:47<33:11,  1.84s/it, loss=0.142, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000529, train/loss_step=0.152, global_step=7580.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  10%|█         | 125/1208 [03:48<33:02,  1.83s/it, loss=0.142, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000529, train/loss_step=0.152, global_step=7580.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  10%|█         | 125/1208 [03:48<33:02,  1.83s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.53e-5, train/loss_step=0.0178, global_step=7581.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  10%|█         | 126/1208 [03:49<32:54,  1.82s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.53e-5, train/loss_step=0.0178, global_step=7581.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  10%|█         | 126/1208 [03:49<32:54,  1.82s/it, loss=0.152, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000942, train/loss_step=0.234, global_step=7581.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  11%|█         | 127/1208 [03:50<32:45,  1.82s/it, loss=0.152, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000942, train/loss_step=0.234, global_step=7581.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  11%|█         | 127/1208 [03:50<32:45,  1.82s/it, loss=0.159, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000657, train/loss_step=0.185, global_step=7581.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  11%|█         | 128/1208 [03:54<32:55,  1.83s/it, loss=0.159, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000657, train/loss_step=0.185, global_step=7581.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  11%|█         | 128/1208 [03:54<32:55,  1.83s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00555, train/loss_vlb_step=2.93e-5, train/loss_step=0.00555, global_step=7581.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  11%|█         | 129/1208 [03:55<32:47,  1.82s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00555, train/loss_vlb_step=2.93e-5, train/loss_step=0.00555, global_step=7581.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  11%|█         | 129/1208 [03:55<32:47,  1.82s/it, loss=0.161, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000945, train/loss_step=0.224, global_step=7582.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  11%|█         | 130/1208 [03:56<32:38,  1.82s/it, loss=0.161, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000945, train/loss_step=0.224, global_step=7582.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  11%|█         | 130/1208 [03:56<32:38,  1.82s/it, loss=0.172, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000823, train/loss_step=0.215, global_step=7582.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  11%|█         | 131/1208 [03:57<32:30,  1.81s/it, loss=0.172, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000823, train/loss_step=0.215, global_step=7582.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  11%|█         | 131/1208 [03:57<32:30,  1.81s/it, loss=0.178, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000434, train/loss_step=0.130, global_step=7582.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  11%|█         | 132/1208 [04:00<32:40,  1.82s/it, loss=0.178, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000434, train/loss_step=0.130, global_step=7582.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  11%|█         | 132/1208 [04:00<32:40,  1.82s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00376, train/loss_vlb_step=2.08e-5, train/loss_step=0.00376, global_step=7582.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  11%|█         | 133/1208 [04:01<32:32,  1.82s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00376, train/loss_vlb_step=2.08e-5, train/loss_step=0.00376, global_step=7582.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  11%|█         | 133/1208 [04:01<32:32,  1.82s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00718, train/loss_vlb_step=3.59e-5, train/loss_step=0.00718, global_step=7583.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  11%|█         | 134/1208 [04:02<32:24,  1.81s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00718, train/loss_vlb_step=3.59e-5, train/loss_step=0.00718, global_step=7583.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  11%|█         | 134/1208 [04:02<32:24,  1.81s/it, loss=0.147, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000504, train/loss_step=0.149, global_step=7583.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  11%|█         | 135/1208 [04:03<32:16,  1.81s/it, loss=0.147, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000504, train/loss_step=0.149, global_step=7583.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  11%|█         | 135/1208 [04:03<32:16,  1.81s/it, loss=0.148, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000429, train/loss_step=0.130, global_step=7583.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  11%|█▏        | 136/1208 [04:06<32:26,  1.82s/it, loss=0.148, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000429, train/loss_step=0.130, global_step=7583.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  11%|█▏        | 136/1208 [04:06<32:26,  1.82s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0624, train/loss_vlb_step=0.00021, train/loss_step=0.0624, global_step=7583.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  11%|█▏        | 137/1208 [04:07<32:18,  1.81s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0624, train/loss_vlb_step=0.00021, train/loss_step=0.0624, global_step=7583.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  11%|█▏        | 137/1208 [04:07<32:18,  1.81s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=9.84e-5, train/loss_step=0.0262, global_step=7584.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  11%|█▏        | 138/1208 [04:09<32:10,  1.80s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=9.84e-5, train/loss_step=0.0262, global_step=7584.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  11%|█▏        | 138/1208 [04:09<32:10,  1.80s/it, loss=0.112, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000484, train/loss_step=0.144, global_step=7584.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  12%|█▏        | 139/1208 [04:10<32:02,  1.80s/it, loss=0.112, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000484, train/loss_step=0.144, global_step=7584.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  12%|█▏        | 139/1208 [04:10<32:02,  1.80s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0925, train/loss_vlb_step=0.000306, train/loss_step=0.0925, global_step=7584.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  12%|█▏        | 140/1208 [04:13<32:11,  1.81s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0925, train/loss_vlb_step=0.000306, train/loss_step=0.0925, global_step=7584.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  12%|█▏        | 140/1208 [04:13<32:11,  1.81s/it, loss=0.123, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000447, train/loss_step=0.135, global_step=7584.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  12%|█▏        | 141/1208 [04:14<32:04,  1.80s/it, loss=0.123, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000447, train/loss_step=0.135, global_step=7584.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  12%|█▏        | 141/1208 [04:14<32:04,  1.80s/it, loss=0.109, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000571, train/loss_step=0.161, global_step=7585.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  12%|█▏        | 142/1208 [04:15<31:56,  1.80s/it, loss=0.109, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000571, train/loss_step=0.161, global_step=7585.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  12%|█▏        | 142/1208 [04:15<31:56,  1.80s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0689, train/loss_vlb_step=0.00024, train/loss_step=0.0689, global_step=7585.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  12%|█▏        | 143/1208 [04:16<31:49,  1.79s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0689, train/loss_vlb_step=0.00024, train/loss_step=0.0689, global_step=7585.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  12%|█▏        | 143/1208 [04:16<31:49,  1.79s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0836, train/loss_vlb_step=0.000281, train/loss_step=0.0836, global_step=7585.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  12%|█▏        | 144/1208 [04:19<31:57,  1.80s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0836, train/loss_vlb_step=0.000281, train/loss_step=0.0836, global_step=7585.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  12%|█▏        | 144/1208 [04:19<31:57,  1.80s/it, loss=0.115, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000826, train/loss_step=0.222, global_step=7585.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  12%|█▏        | 145/1208 [04:20<31:50,  1.80s/it, loss=0.115, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000826, train/loss_step=0.222, global_step=7585.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  12%|█▏        | 145/1208 [04:20<31:50,  1.80s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000119, train/loss_step=0.0306, global_step=7586.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  12%|█▏        | 146/1208 [04:21<31:43,  1.79s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.000119, train/loss_step=0.0306, global_step=7586.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  12%|█▏        | 146/1208 [04:21<31:43,  1.79s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.26e-5, train/loss_step=0.00225, global_step=7586.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  12%|█▏        | 147/1208 [04:22<31:35,  1.79s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.26e-5, train/loss_step=0.00225, global_step=7586.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  12%|█▏        | 147/1208 [04:22<31:35,  1.79s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.00328, train/loss_vlb_step=1.88e-5, train/loss_step=0.00328, global_step=7586.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  12%|█▏        | 148/1208 [04:25<31:43,  1.80s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.00328, train/loss_vlb_step=1.88e-5, train/loss_step=0.00328, global_step=7586.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  12%|█▏        | 148/1208 [04:25<31:43,  1.80s/it, loss=0.105, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000781, train/loss_step=0.204, global_step=7586.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  12%|█▏        | 149/1208 [04:26<31:36,  1.79s/it, loss=0.105, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000781, train/loss_step=0.204, global_step=7586.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  12%|█▏        | 149/1208 [04:26<31:36,  1.79s/it, loss=0.108, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00136, train/loss_step=0.285, global_step=7587.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  12%|█▏        | 150/1208 [04:27<31:29,  1.79s/it, loss=0.108, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00136, train/loss_step=0.285, global_step=7587.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  12%|█▏        | 150/1208 [04:27<31:29,  1.79s/it, loss=0.105, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000561, train/loss_step=0.165, global_step=7587.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  12%|█▎        | 151/1208 [04:28<31:22,  1.78s/it, loss=0.105, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000561, train/loss_step=0.165, global_step=7587.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  12%|█▎        | 151/1208 [04:28<31:22,  1.78s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0844, train/loss_vlb_step=0.000278, train/loss_step=0.0844, global_step=7587.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  13%|█▎        | 152/1208 [04:32<31:30,  1.79s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0844, train/loss_vlb_step=0.000278, train/loss_step=0.0844, global_step=7587.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  13%|█▎        | 152/1208 [04:32<31:30,  1.79s/it, loss=0.116, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.0013, train/loss_step=0.257, global_step=7587.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  13%|█▎        | 153/1208 [04:33<31:24,  1.79s/it, loss=0.116, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.0013, train/loss_step=0.257, global_step=7587.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  13%|█▎        | 153/1208 [04:33<31:24,  1.79s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=2.25e-5, train/loss_step=0.00421, global_step=7588.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  13%|█▎        | 154/1208 [04:34<31:17,  1.78s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=2.25e-5, train/loss_step=0.00421, global_step=7588.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  13%|█▎        | 154/1208 [04:34<31:17,  1.78s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.86e-5, train/loss_step=0.0188, global_step=7588.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  13%|█▎        | 155/1208 [04:35<31:10,  1.78s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.86e-5, train/loss_step=0.0188, global_step=7588.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  13%|█▎        | 155/1208 [04:35<31:10,  1.78s/it, loss=0.113, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000776, train/loss_step=0.211, global_step=7588.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  13%|█▎        | 156/1208 [04:38<31:18,  1.79s/it, loss=0.113, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000776, train/loss_step=0.211, global_step=7588.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  13%|█▎        | 156/1208 [04:38<31:18,  1.79s/it, loss=0.131, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.00332, train/loss_step=0.417, global_step=7588.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  13%|█▎        | 157/1208 [04:39<31:11,  1.78s/it, loss=0.131, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.00332, train/loss_step=0.417, global_step=7588.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  13%|█▎        | 157/1208 [04:39<31:11,  1.78s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0789, train/loss_vlb_step=0.000263, train/loss_step=0.0789, global_step=7589.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  13%|█▎        | 158/1208 [04:40<31:04,  1.78s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0789, train/loss_vlb_step=0.000263, train/loss_step=0.0789, global_step=7589.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  13%|█▎        | 158/1208 [04:40<31:04,  1.78s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.00016, train/loss_step=0.0454, global_step=7589.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  13%|█▎        | 159/1208 [04:41<30:58,  1.77s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.00016, train/loss_step=0.0454, global_step=7589.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  13%|█▎        | 159/1208 [04:41<30:58,  1.77s/it, loss=0.136, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000935, train/loss_step=0.240, global_step=7589.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  13%|█▎        | 160/1208 [04:44<31:05,  1.78s/it, loss=0.136, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000935, train/loss_step=0.240, global_step=7589.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  13%|█▎        | 160/1208 [04:44<31:05,  1.78s/it, loss=0.137, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000521, train/loss_step=0.157, global_step=7589.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  13%|█▎        | 161/1208 [04:45<30:59,  1.78s/it, loss=0.137, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000521, train/loss_step=0.157, global_step=7589.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  13%|█▎        | 161/1208 [04:45<30:59,  1.78s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0978, train/loss_vlb_step=0.000323, train/loss_step=0.0978, global_step=7590.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  13%|█▎        | 162/1208 [04:46<30:52,  1.77s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0978, train/loss_vlb_step=0.000323, train/loss_step=0.0978, global_step=7590.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  13%|█▎        | 162/1208 [04:46<30:52,  1.77s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0835, train/loss_vlb_step=0.000276, train/loss_step=0.0835, global_step=7590.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  13%|█▎        | 163/1208 [04:47<30:46,  1.77s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0835, train/loss_vlb_step=0.000276, train/loss_step=0.0835, global_step=7590.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  13%|█▎        | 163/1208 [04:47<30:46,  1.77s/it, loss=0.146, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00128, train/loss_step=0.305, global_step=7590.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  14%|█▎        | 164/1208 [04:51<30:53,  1.78s/it, loss=0.146, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00128, train/loss_step=0.305, global_step=7590.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  14%|█▎        | 164/1208 [04:51<30:53,  1.78s/it, loss=0.158, v_num=0, train/loss_simple_step=0.477, train/loss_vlb_step=0.00565, train/loss_step=0.477, global_step=7590.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  14%|█▎        | 165/1208 [04:52<30:47,  1.77s/it, loss=0.158, v_num=0, train/loss_simple_step=0.477, train/loss_vlb_step=0.00565, train/loss_step=0.477, global_step=7590.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  14%|█▎        | 165/1208 [04:52<30:47,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0995, train/loss_vlb_step=0.000329, train/loss_step=0.0995, global_step=7591.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  14%|█▎        | 166/1208 [04:53<30:40,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0995, train/loss_vlb_step=0.000329, train/loss_step=0.0995, global_step=7591.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  14%|█▎        | 166/1208 [04:53<30:40,  1.77s/it, loss=0.169, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000494, train/loss_step=0.147, global_step=7591.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  14%|█▍        | 167/1208 [04:54<30:34,  1.76s/it, loss=0.169, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000494, train/loss_step=0.147, global_step=7591.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  14%|█▍        | 167/1208 [04:54<30:34,  1.76s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.74e-5, train/loss_step=0.0214, global_step=7591.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  14%|█▍        | 168/1208 [04:57<30:41,  1.77s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.74e-5, train/loss_step=0.0214, global_step=7591.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  14%|█▍        | 168/1208 [04:57<30:41,  1.77s/it, loss=0.17, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000761, train/loss_step=0.207, global_step=7591.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  14%|█▍        | 169/1208 [04:58<30:35,  1.77s/it, loss=0.17, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000761, train/loss_step=0.207, global_step=7591.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  14%|█▍        | 169/1208 [04:58<30:35,  1.77s/it, loss=0.157, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.76e-5, train/loss_step=0.013, global_step=7592.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  14%|█▍        | 170/1208 [04:59<30:29,  1.76s/it, loss=0.157, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.76e-5, train/loss_step=0.013, global_step=7592.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  14%|█▍        | 170/1208 [04:59<30:29,  1.76s/it, loss=0.17, v_num=0, train/loss_simple_step=0.441, train/loss_vlb_step=0.00433, train/loss_step=0.441, global_step=7592.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  14%|█▍        | 171/1208 [05:00<30:22,  1.76s/it, loss=0.17, v_num=0, train/loss_simple_step=0.441, train/loss_vlb_step=0.00433, train/loss_step=0.441, global_step=7592.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  14%|█▍        | 171/1208 [05:00<30:22,  1.76s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0397, train/loss_vlb_step=0.000141, train/loss_step=0.0397, global_step=7592.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  14%|█▍        | 172/1208 [05:03<30:29,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0397, train/loss_vlb_step=0.000141, train/loss_step=0.0397, global_step=7592.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  14%|█▍        | 172/1208 [05:03<30:29,  1.77s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00376, train/loss_vlb_step=2.04e-5, train/loss_step=0.00376, global_step=7592.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  14%|█▍        | 173/1208 [05:04<30:23,  1.76s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00376, train/loss_vlb_step=2.04e-5, train/loss_step=0.00376, global_step=7592.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  14%|█▍        | 173/1208 [05:04<30:23,  1.76s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0651, train/loss_vlb_step=0.000217, train/loss_step=0.0651, global_step=7593.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  14%|█▍        | 174/1208 [05:05<30:17,  1.76s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0651, train/loss_vlb_step=0.000217, train/loss_step=0.0651, global_step=7593.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  14%|█▍        | 174/1208 [05:05<30:17,  1.76s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=1.14e-5, train/loss_step=0.0019, global_step=7593.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  14%|█▍        | 175/1208 [05:06<30:11,  1.75s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=1.14e-5, train/loss_step=0.0019, global_step=7593.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  14%|█▍        | 175/1208 [05:06<30:11,  1.75s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.00016, train/loss_step=0.0449, global_step=7593.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  15%|█▍        | 176/1208 [05:10<30:18,  1.76s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.00016, train/loss_step=0.0449, global_step=7593.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  15%|█▍        | 176/1208 [05:10<30:18,  1.76s/it, loss=0.14, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000815, train/loss_step=0.221, global_step=7593.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  15%|█▍        | 177/1208 [05:11<30:12,  1.76s/it, loss=0.14, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000815, train/loss_step=0.221, global_step=7593.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  15%|█▍        | 177/1208 [05:11<30:12,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0047, train/loss_vlb_step=2.47e-5, train/loss_step=0.0047, global_step=7594.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  15%|█▍        | 178/1208 [05:12<30:06,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0047, train/loss_vlb_step=2.47e-5, train/loss_step=0.0047, global_step=7594.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  15%|█▍        | 178/1208 [05:12<30:06,  1.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000536, train/loss_step=0.159, global_step=7594.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  15%|█▍        | 179/1208 [05:13<30:00,  1.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000536, train/loss_step=0.159, global_step=7594.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  15%|█▍        | 179/1208 [05:13<30:00,  1.75s/it, loss=0.149, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00309, train/loss_step=0.380, global_step=7594.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  15%|█▍        | 180/1208 [05:16<30:07,  1.76s/it, loss=0.149, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00309, train/loss_step=0.380, global_step=7594.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  15%|█▍        | 180/1208 [05:16<30:07,  1.76s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.000137, train/loss_step=0.0395, global_step=7594.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  15%|█▍        | 181/1208 [05:17<30:01,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.000137, train/loss_step=0.0395, global_step=7594.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  15%|█▍        | 181/1208 [05:17<30:01,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.63e-5, train/loss_step=0.0028, global_step=7595.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  15%|█▌        | 182/1208 [05:18<29:55,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.63e-5, train/loss_step=0.0028, global_step=7595.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  15%|█▌        | 182/1208 [05:18<29:55,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000519, train/loss_step=0.153, global_step=7595.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  15%|█▌        | 183/1208 [05:19<29:49,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000519, train/loss_step=0.153, global_step=7595.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  15%|█▌        | 183/1208 [05:19<29:49,  1.75s/it, loss=0.133, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000483, train/loss_step=0.146, global_step=7595.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  15%|█▌        | 184/1208 [05:22<29:56,  1.75s/it, loss=0.133, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000483, train/loss_step=0.146, global_step=7595.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  15%|█▌        | 184/1208 [05:22<29:56,  1.75s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.62e-5, train/loss_step=0.0124, global_step=7595.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  15%|█▌        | 185/1208 [05:23<29:50,  1.75s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.62e-5, train/loss_step=0.0124, global_step=7595.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  15%|█▌        | 185/1208 [05:23<29:50,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000508, train/loss_step=0.150, global_step=7596.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  15%|█▌        | 186/1208 [05:24<29:44,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000508, train/loss_step=0.150, global_step=7596.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  15%|█▌        | 186/1208 [05:24<29:44,  1.75s/it, loss=0.106, v_num=0, train/loss_simple_step=0.006, train/loss_vlb_step=3.01e-5, train/loss_step=0.006, global_step=7596.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  15%|█▌        | 187/1208 [05:25<29:39,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.006, train/loss_vlb_step=3.01e-5, train/loss_step=0.006, global_step=7596.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  15%|█▌        | 187/1208 [05:25<29:39,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.000132, train/loss_step=0.0347, global_step=7596.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  16%|█▌        | 188/1208 [05:29<29:45,  1.75s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.000132, train/loss_step=0.0347, global_step=7596.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  16%|█▌        | 188/1208 [05:29<29:45,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000465, train/loss_step=0.138, global_step=7596.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  16%|█▌        | 189/1208 [05:30<29:40,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000465, train/loss_step=0.138, global_step=7596.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  16%|█▌        | 189/1208 [05:30<29:40,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.84e-5, train/loss_step=0.0161, global_step=7597.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  16%|█▌        | 190/1208 [05:31<29:34,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.84e-5, train/loss_step=0.0161, global_step=7597.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  16%|█▌        | 190/1208 [05:31<29:34,  1.74s/it, loss=0.0845, v_num=0, train/loss_simple_step=0.0697, train/loss_vlb_step=0.000237, train/loss_step=0.0697, global_step=7597.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  16%|█▌        | 191/1208 [05:32<29:29,  1.74s/it, loss=0.0845, v_num=0, train/loss_simple_step=0.0697, train/loss_vlb_step=0.000237, train/loss_step=0.0697, global_step=7597.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  16%|█▌        | 191/1208 [05:32<29:29,  1.74s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000698, train/loss_step=0.199, global_step=7597.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  16%|█▌        | 192/1208 [05:35<29:35,  1.75s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000698, train/loss_step=0.199, global_step=7597.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  16%|█▌        | 192/1208 [05:35<29:35,  1.75s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000428, train/loss_step=0.130, global_step=7597.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  16%|█▌        | 193/1208 [05:36<29:29,  1.74s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000428, train/loss_step=0.130, global_step=7597.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  16%|█▌        | 193/1208 [05:36<29:29,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000419, train/loss_step=0.127, global_step=7598.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  16%|█▌        | 194/1208 [05:37<29:24,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000419, train/loss_step=0.127, global_step=7598.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  16%|█▌        | 194/1208 [05:37<29:24,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00159, train/loss_step=0.349, global_step=7598.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  16%|█▌        | 195/1208 [05:38<29:18,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00159, train/loss_step=0.349, global_step=7598.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  16%|█▌        | 195/1208 [05:38<29:18,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000169, train/loss_step=0.0478, global_step=7598.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  16%|█▌        | 196/1208 [05:41<29:24,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000169, train/loss_step=0.0478, global_step=7598.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  16%|█▌        | 196/1208 [05:41<29:24,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00568, train/loss_vlb_step=2.79e-5, train/loss_step=0.00568, global_step=7598.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  16%|█▋        | 197/1208 [05:42<29:19,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00568, train/loss_vlb_step=2.79e-5, train/loss_step=0.00568, global_step=7598.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  16%|█▋        | 197/1208 [05:42<29:19,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=9.79e-6, train/loss_step=0.00164, global_step=7599.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  16%|█▋        | 198/1208 [05:43<29:13,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=9.79e-6, train/loss_step=0.00164, global_step=7599.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  16%|█▋        | 198/1208 [05:43<29:13,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000192, train/loss_step=0.0545, global_step=7599.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  16%|█▋        | 199/1208 [05:44<29:08,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000192, train/loss_step=0.0545, global_step=7599.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  16%|█▋        | 199/1208 [05:44<29:08,  1.73s/it, loss=0.0846, v_num=0, train/loss_simple_step=0.00896, train/loss_vlb_step=4.18e-5, train/loss_step=0.00896, global_step=7599.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  17%|█▋        | 200/1208 [05:48<29:14,  1.74s/it, loss=0.0846, v_num=0, train/loss_simple_step=0.00896, train/loss_vlb_step=4.18e-5, train/loss_step=0.00896, global_step=7599.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  17%|█▋        | 200/1208 [05:48<29:14,  1.74s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00109, train/loss_step=0.256, global_step=7599.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  17%|█▋        | 201/1208 [05:49<29:09,  1.74s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00109, train/loss_step=0.256, global_step=7599.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  17%|█▋        | 201/1208 [05:49<29:09,  1.74s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.00012, train/loss_step=0.032, global_step=7600.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  17%|█▋        | 202/1208 [05:50<29:03,  1.73s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.00012, train/loss_step=0.032, global_step=7600.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  17%|█▋        | 202/1208 [05:50<29:03,  1.73s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.0885, train/loss_vlb_step=0.000293, train/loss_step=0.0885, global_step=7600.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  17%|█▋        | 203/1208 [05:51<28:58,  1.73s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.0885, train/loss_vlb_step=0.000293, train/loss_step=0.0885, global_step=7600.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  17%|█▋        | 203/1208 [05:51<28:58,  1.73s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=7600.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  17%|█▋        | 204/1208 [05:54<29:04,  1.74s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=7600.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  17%|█▋        | 204/1208 [05:54<29:04,  1.74s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.53e-5, train/loss_step=0.024, global_step=7600.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  17%|█▋        | 205/1208 [05:55<28:59,  1.73s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.53e-5, train/loss_step=0.024, global_step=7600.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  17%|█▋        | 205/1208 [05:55<28:59,  1.73s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.0613, train/loss_vlb_step=0.000215, train/loss_step=0.0613, global_step=7601.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  17%|█▋        | 206/1208 [05:56<28:53,  1.73s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.0613, train/loss_vlb_step=0.000215, train/loss_step=0.0613, global_step=7601.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  17%|█▋        | 206/1208 [05:56<28:53,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00241, train/loss_step=0.363, global_step=7601.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  17%|█▋        | 207/1208 [05:57<28:48,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00241, train/loss_step=0.363, global_step=7601.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  17%|█▋        | 207/1208 [05:57<28:48,  1.73s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=6.82e-5, train/loss_step=0.0165, global_step=7601.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  17%|█▋        | 208/1208 [06:00<28:54,  1.73s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=6.82e-5, train/loss_step=0.0165, global_step=7601.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  17%|█▋        | 208/1208 [06:00<28:54,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0872, train/loss_vlb_step=0.000291, train/loss_step=0.0872, global_step=7601.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  17%|█▋        | 209/1208 [06:01<28:49,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0872, train/loss_vlb_step=0.000291, train/loss_step=0.0872, global_step=7601.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  17%|█▋        | 209/1208 [06:01<28:49,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000482, train/loss_step=0.145, global_step=7602.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  17%|█▋        | 210/1208 [06:02<28:44,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000482, train/loss_step=0.145, global_step=7602.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  17%|█▋        | 210/1208 [06:02<28:44,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0763, train/loss_vlb_step=0.000261, train/loss_step=0.0763, global_step=7602.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  17%|█▋        | 211/1208 [06:03<28:39,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0763, train/loss_vlb_step=0.000261, train/loss_step=0.0763, global_step=7602.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  17%|█▋        | 211/1208 [06:03<28:39,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.16e-5, train/loss_step=0.0112, global_step=7602.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  18%|█▊        | 212/1208 [06:07<28:44,  1.73s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.16e-5, train/loss_step=0.0112, global_step=7602.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  18%|█▊        | 212/1208 [06:07<28:44,  1.73s/it, loss=0.0943, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7e-5, train/loss_step=0.0168, global_step=7602.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  18%|█▊        | 213/1208 [06:08<28:39,  1.73s/it, loss=0.0943, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7e-5, train/loss_step=0.0168, global_step=7602.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  18%|█▊        | 213/1208 [06:08<28:39,  1.73s/it, loss=0.0881, v_num=0, train/loss_simple_step=0.00189, train/loss_vlb_step=1.14e-5, train/loss_step=0.00189, global_step=7603.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  18%|█▊        | 214/1208 [06:09<28:34,  1.72s/it, loss=0.0881, v_num=0, train/loss_simple_step=0.00189, train/loss_vlb_step=1.14e-5, train/loss_step=0.00189, global_step=7603.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  18%|█▊        | 214/1208 [06:09<28:34,  1.72s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.0012, train/loss_step=0.291, global_step=7603.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]     Epoch 25:  18%|█▊        | 215/1208 [06:10<28:29,  1.72s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.0012, train/loss_step=0.291, global_step=7603.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  18%|█▊        | 215/1208 [06:10<28:29,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.0027, train/loss_step=0.366, global_step=7603.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  18%|█▊        | 216/1208 [06:13<28:34,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.0027, train/loss_step=0.366, global_step=7603.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  18%|█▊        | 216/1208 [06:13<28:34,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00138, train/loss_step=0.271, global_step=7603.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  18%|█▊        | 217/1208 [06:14<28:29,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00138, train/loss_step=0.271, global_step=7603.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  18%|█▊        | 217/1208 [06:14<28:29,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.78e-5, train/loss_step=0.0155, global_step=7604.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  18%|█▊        | 218/1208 [06:15<28:24,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.78e-5, train/loss_step=0.0155, global_step=7604.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  18%|█▊        | 218/1208 [06:15<28:24,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0724, train/loss_vlb_step=0.000246, train/loss_step=0.0724, global_step=7604.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  18%|█▊        | 219/1208 [06:16<28:20,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0724, train/loss_vlb_step=0.000246, train/loss_step=0.0724, global_step=7604.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  18%|█▊        | 219/1208 [06:16<28:20,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000818, train/loss_step=0.223, global_step=7604.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  18%|█▊        | 220/1208 [06:19<28:25,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000818, train/loss_step=0.223, global_step=7604.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  18%|█▊        | 220/1208 [06:19<28:25,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000464, train/loss_step=0.141, global_step=7604.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  18%|█▊        | 221/1208 [06:20<28:20,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000464, train/loss_step=0.141, global_step=7604.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  18%|█▊        | 221/1208 [06:20<28:20,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000462, train/loss_step=0.139, global_step=7605.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  18%|█▊        | 222/1208 [06:21<28:15,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000462, train/loss_step=0.139, global_step=7605.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  18%|█▊        | 222/1208 [06:21<28:15,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000641, train/loss_step=0.183, global_step=7605.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  18%|█▊        | 223/1208 [06:22<28:10,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000641, train/loss_step=0.183, global_step=7605.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  18%|█▊        | 223/1208 [06:22<28:10,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.0018, train/loss_step=0.355, global_step=7605.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  19%|█▊        | 224/1208 [06:26<28:15,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.0018, train/loss_step=0.355, global_step=7605.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  19%|█▊        | 224/1208 [06:26<28:15,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.00015, train/loss_step=0.0406, global_step=7605.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  19%|█▊        | 225/1208 [06:27<28:11,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.00015, train/loss_step=0.0406, global_step=7605.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  19%|█▊        | 225/1208 [06:27<28:11,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.090, train/loss_vlb_step=0.000296, train/loss_step=0.090, global_step=7606.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  19%|█▊        | 226/1208 [06:28<28:06,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.090, train/loss_vlb_step=0.000296, train/loss_step=0.090, global_step=7606.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  19%|█▊        | 226/1208 [06:28<28:06,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0639, train/loss_vlb_step=0.00022, train/loss_step=0.0639, global_step=7606.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  19%|█▉        | 227/1208 [06:29<28:01,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0639, train/loss_vlb_step=0.00022, train/loss_step=0.0639, global_step=7606.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  19%|█▉        | 227/1208 [06:29<28:01,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000495, train/loss_step=0.147, global_step=7606.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  19%|█▉        | 228/1208 [06:32<28:06,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000495, train/loss_step=0.147, global_step=7606.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  19%|█▉        | 228/1208 [06:32<28:06,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0837, train/loss_vlb_step=0.000278, train/loss_step=0.0837, global_step=7606.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  19%|█▉        | 229/1208 [06:33<28:01,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0837, train/loss_vlb_step=0.000278, train/loss_step=0.0837, global_step=7606.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  19%|█▉        | 229/1208 [06:33<28:01,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000522, train/loss_step=0.158, global_step=7607.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  19%|█▉        | 230/1208 [06:34<27:57,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000522, train/loss_step=0.158, global_step=7607.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  19%|█▉        | 230/1208 [06:34<27:57,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0712, train/loss_vlb_step=0.00024, train/loss_step=0.0712, global_step=7607.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  19%|█▉        | 231/1208 [06:35<27:52,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0712, train/loss_vlb_step=0.00024, train/loss_step=0.0712, global_step=7607.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  19%|█▉        | 231/1208 [06:35<27:52,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=1.29e-5, train/loss_step=0.00221, global_step=7607.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  19%|█▉        | 232/1208 [06:38<27:57,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=1.29e-5, train/loss_step=0.00221, global_step=7607.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  19%|█▉        | 232/1208 [06:38<27:57,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0998, train/loss_vlb_step=0.000328, train/loss_step=0.0998, global_step=7607.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  19%|█▉        | 233/1208 [06:39<27:52,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0998, train/loss_vlb_step=0.000328, train/loss_step=0.0998, global_step=7607.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  19%|█▉        | 233/1208 [06:39<27:52,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0908, train/loss_vlb_step=0.000302, train/loss_step=0.0908, global_step=7608.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  19%|█▉        | 234/1208 [06:40<27:48,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0908, train/loss_vlb_step=0.000302, train/loss_step=0.0908, global_step=7608.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  19%|█▉        | 234/1208 [06:40<27:48,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000455, train/loss_step=0.137, global_step=7608.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  19%|█▉        | 235/1208 [06:41<27:43,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000455, train/loss_step=0.137, global_step=7608.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  19%|█▉        | 235/1208 [06:41<27:43,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.00065, train/loss_step=0.185, global_step=7608.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  20%|█▉        | 236/1208 [06:45<27:48,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.00065, train/loss_step=0.185, global_step=7608.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  20%|█▉        | 236/1208 [06:45<27:48,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=7608.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  20%|█▉        | 237/1208 [06:46<27:43,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=7608.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  20%|█▉        | 237/1208 [06:46<27:43,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.691, train/loss_vlb_step=0.0204, train/loss_step=0.691, global_step=7609.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  20%|█▉        | 238/1208 [06:47<27:39,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.691, train/loss_vlb_step=0.0204, train/loss_step=0.691, global_step=7609.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  20%|█▉        | 238/1208 [06:47<27:39,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0973, train/loss_vlb_step=0.000322, train/loss_step=0.0973, global_step=7609.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  20%|█▉        | 239/1208 [06:48<27:34,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0973, train/loss_vlb_step=0.000322, train/loss_step=0.0973, global_step=7609.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  20%|█▉        | 239/1208 [06:48<27:34,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.000134, train/loss_step=0.0352, global_step=7609.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  20%|█▉        | 240/1208 [06:51<27:39,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.000134, train/loss_step=0.0352, global_step=7609.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  20%|█▉        | 240/1208 [06:51<27:39,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00249, train/loss_step=0.394, global_step=7609.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  20%|█▉        | 241/1208 [06:52<27:34,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00249, train/loss_step=0.394, global_step=7609.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  20%|█▉        | 241/1208 [06:52<27:34,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=7610.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  20%|██        | 242/1208 [06:53<27:30,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=7610.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  20%|██        | 242/1208 [06:53<27:30,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000929, train/loss_step=0.235, global_step=7610.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  20%|██        | 243/1208 [06:54<27:26,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000929, train/loss_step=0.235, global_step=7610.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  20%|██        | 243/1208 [06:54<27:26,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.98e-5, train/loss_step=0.00349, global_step=7610.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  20%|██        | 244/1208 [06:57<27:30,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.98e-5, train/loss_step=0.00349, global_step=7610.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  20%|██        | 244/1208 [06:57<27:30,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000434, train/loss_step=0.131, global_step=7610.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  20%|██        | 245/1208 [06:58<27:25,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000434, train/loss_step=0.131, global_step=7610.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  20%|██        | 245/1208 [06:58<27:25,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00923, train/loss_vlb_step=4.32e-5, train/loss_step=0.00923, global_step=7611.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  20%|██        | 246/1208 [06:59<27:21,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00923, train/loss_vlb_step=4.32e-5, train/loss_step=0.00923, global_step=7611.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  20%|██        | 246/1208 [06:59<27:21,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00696, train/loss_vlb_step=3.4e-5, train/loss_step=0.00696, global_step=7611.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  20%|██        | 247/1208 [07:00<27:17,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00696, train/loss_vlb_step=3.4e-5, train/loss_step=0.00696, global_step=7611.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  20%|██        | 247/1208 [07:00<27:17,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00473, train/loss_vlb_step=2.5e-5, train/loss_step=0.00473, global_step=7611.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  21%|██        | 248/1208 [07:04<27:21,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00473, train/loss_vlb_step=2.5e-5, train/loss_step=0.00473, global_step=7611.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  21%|██        | 248/1208 [07:04<27:21,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000658, train/loss_step=0.187, global_step=7611.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  21%|██        | 249/1208 [07:05<27:17,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000658, train/loss_step=0.187, global_step=7611.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  21%|██        | 249/1208 [07:05<27:17,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00236, train/loss_step=0.359, global_step=7612.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  21%|██        | 250/1208 [07:06<27:12,  1.70s/it, loss=0.148, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00236, train/loss_step=0.359, global_step=7612.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  21%|██        | 250/1208 [07:06<27:12,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.93e-5, train/loss_step=0.011, global_step=7612.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  21%|██        | 251/1208 [07:07<27:08,  1.70s/it, loss=0.145, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.93e-5, train/loss_step=0.011, global_step=7612.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  21%|██        | 251/1208 [07:07<27:08,  1.70s/it, loss=0.158, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00117, train/loss_step=0.263, global_step=7612.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  21%|██        | 252/1208 [07:10<27:12,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00117, train/loss_step=0.263, global_step=7612.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  21%|██        | 252/1208 [07:10<27:12,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.472, train/loss_vlb_step=0.00464, train/loss_step=0.472, global_step=7612.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  21%|██        | 253/1208 [07:11<27:08,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.472, train/loss_vlb_step=0.00464, train/loss_step=0.472, global_step=7612.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  21%|██        | 253/1208 [07:11<27:08,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000442, train/loss_step=0.133, global_step=7613.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  21%|██        | 254/1208 [07:12<27:04,  1.70s/it, loss=0.179, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000442, train/loss_step=0.133, global_step=7613.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  21%|██        | 254/1208 [07:12<27:04,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000642, train/loss_step=0.188, global_step=7613.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  21%|██        | 255/1208 [07:13<27:00,  1.70s/it, loss=0.181, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000642, train/loss_step=0.188, global_step=7613.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  21%|██        | 255/1208 [07:13<27:00,  1.70s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00279, train/loss_vlb_step=1.59e-5, train/loss_step=0.00279, global_step=7613.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  21%|██        | 256/1208 [07:16<27:04,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00279, train/loss_vlb_step=1.59e-5, train/loss_step=0.00279, global_step=7613.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  21%|██        | 256/1208 [07:16<27:04,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0645, train/loss_vlb_step=0.000224, train/loss_step=0.0645, global_step=7613.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  21%|██▏       | 257/1208 [07:17<27:00,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0645, train/loss_vlb_step=0.000224, train/loss_step=0.0645, global_step=7613.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  21%|██▏       | 257/1208 [07:17<27:00,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0929, train/loss_vlb_step=0.000309, train/loss_step=0.0929, global_step=7614.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  21%|██▏       | 258/1208 [07:18<26:56,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0929, train/loss_vlb_step=0.000309, train/loss_step=0.0929, global_step=7614.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  21%|██▏       | 258/1208 [07:18<26:56,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.85e-5, train/loss_step=0.0032, global_step=7614.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  21%|██▏       | 259/1208 [07:19<26:51,  1.70s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.85e-5, train/loss_step=0.0032, global_step=7614.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  21%|██▏       | 259/1208 [07:19<26:51,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.529, train/loss_vlb_step=0.00493, train/loss_step=0.529, global_step=7614.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  22%|██▏       | 260/1208 [07:23<26:55,  1.70s/it, loss=0.16, v_num=0, train/loss_simple_step=0.529, train/loss_vlb_step=0.00493, train/loss_step=0.529, global_step=7614.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  22%|██▏       | 260/1208 [07:23<26:55,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000124, train/loss_step=0.0339, global_step=7614.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  22%|██▏       | 261/1208 [07:24<26:51,  1.70s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000124, train/loss_step=0.0339, global_step=7614.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  22%|██▏       | 261/1208 [07:24<26:51,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.2e-5, train/loss_step=0.0118, global_step=7615.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  22%|██▏       | 262/1208 [07:25<26:47,  1.70s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.2e-5, train/loss_step=0.0118, global_step=7615.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  22%|██▏       | 262/1208 [07:25<26:47,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.885, train/loss_vlb_step=0.0569, train/loss_step=0.885, global_step=7615.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  22%|██▏       | 263/1208 [07:26<26:43,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.885, train/loss_vlb_step=0.0569, train/loss_step=0.885, global_step=7615.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  22%|██▏       | 263/1208 [07:26<26:43,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000571, train/loss_step=0.167, global_step=7615.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  22%|██▏       | 264/1208 [07:29<26:47,  1.70s/it, loss=0.178, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000571, train/loss_step=0.167, global_step=7615.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  22%|██▏       | 264/1208 [07:29<26:47,  1.70s/it, loss=0.192, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.0035, train/loss_step=0.417, global_step=7615.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  22%|██▏       | 265/1208 [07:30<26:43,  1.70s/it, loss=0.192, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.0035, train/loss_step=0.417, global_step=7615.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  22%|██▏       | 265/1208 [07:30<26:43,  1.70s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=1.1e-5, train/loss_step=0.00185, global_step=7616.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  22%|██▏       | 266/1208 [07:31<26:39,  1.70s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=1.1e-5, train/loss_step=0.00185, global_step=7616.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  22%|██▏       | 266/1208 [07:31<26:39,  1.70s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=0.000102, train/loss_step=0.0251, global_step=7616.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  22%|██▏       | 267/1208 [07:32<26:35,  1.70s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=0.000102, train/loss_step=0.0251, global_step=7616.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  22%|██▏       | 267/1208 [07:32<26:35,  1.70s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.33e-5, train/loss_step=0.0142, global_step=7616.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  22%|██▏       | 268/1208 [07:35<26:38,  1.70s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.33e-5, train/loss_step=0.0142, global_step=7616.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  22%|██▏       | 268/1208 [07:35<26:38,  1.70s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0931, train/loss_vlb_step=0.000306, train/loss_step=0.0931, global_step=7616.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  22%|██▏       | 269/1208 [07:36<26:34,  1.70s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0931, train/loss_vlb_step=0.000306, train/loss_step=0.0931, global_step=7616.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  22%|██▏       | 269/1208 [07:36<26:34,  1.70s/it, loss=0.19, v_num=0, train/loss_simple_step=0.387, train/loss_vlb_step=0.00271, train/loss_step=0.387, global_step=7617.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  22%|██▏       | 270/1208 [07:37<26:30,  1.70s/it, loss=0.19, v_num=0, train/loss_simple_step=0.387, train/loss_vlb_step=0.00271, train/loss_step=0.387, global_step=7617.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  22%|██▏       | 270/1208 [07:37<26:30,  1.70s/it, loss=0.213, v_num=0, train/loss_simple_step=0.472, train/loss_vlb_step=0.00336, train/loss_step=0.472, global_step=7617.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  22%|██▏       | 271/1208 [07:38<26:26,  1.69s/it, loss=0.213, v_num=0, train/loss_simple_step=0.472, train/loss_vlb_step=0.00336, train/loss_step=0.472, global_step=7617.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  22%|██▏       | 271/1208 [07:38<26:26,  1.69s/it, loss=0.209, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000657, train/loss_step=0.186, global_step=7617.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  23%|██▎       | 272/1208 [07:42<26:30,  1.70s/it, loss=0.209, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000657, train/loss_step=0.186, global_step=7617.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  23%|██▎       | 272/1208 [07:42<26:30,  1.70s/it, loss=0.197, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000834, train/loss_step=0.223, global_step=7617.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  23%|██▎       | 273/1208 [07:43<26:26,  1.70s/it, loss=0.197, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000834, train/loss_step=0.223, global_step=7617.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  23%|██▎       | 273/1208 [07:43<26:26,  1.70s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000114, train/loss_step=0.0283, global_step=7618.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  23%|██▎       | 274/1208 [07:44<26:22,  1.69s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000114, train/loss_step=0.0283, global_step=7618.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  23%|██▎       | 274/1208 [07:44<26:22,  1.69s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00736, train/loss_vlb_step=3.62e-5, train/loss_step=0.00736, global_step=7618.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  23%|██▎       | 275/1208 [07:45<26:18,  1.69s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00736, train/loss_vlb_step=3.62e-5, train/loss_step=0.00736, global_step=7618.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  23%|██▎       | 275/1208 [07:45<26:18,  1.69s/it, loss=0.199, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00238, train/loss_step=0.337, global_step=7618.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  23%|██▎       | 276/1208 [07:48<26:22,  1.70s/it, loss=0.199, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00238, train/loss_step=0.337, global_step=7618.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  23%|██▎       | 276/1208 [07:48<26:22,  1.70s/it, loss=0.207, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000819, train/loss_step=0.221, global_step=7618.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  23%|██▎       | 277/1208 [07:49<26:18,  1.70s/it, loss=0.207, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000819, train/loss_step=0.221, global_step=7618.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  23%|██▎       | 277/1208 [07:49<26:18,  1.70s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.93e-5, train/loss_step=0.0108, global_step=7619.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  23%|██▎       | 278/1208 [07:50<26:14,  1.69s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.93e-5, train/loss_step=0.0108, global_step=7619.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  23%|██▎       | 278/1208 [07:50<26:14,  1.69s/it, loss=0.203, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=1.97e-5, train/loss_step=0.00362, global_step=7619.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  23%|██▎       | 279/1208 [07:51<26:10,  1.69s/it, loss=0.203, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=1.97e-5, train/loss_step=0.00362, global_step=7619.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  23%|██▎       | 279/1208 [07:51<26:10,  1.69s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00576, train/loss_vlb_step=3.04e-5, train/loss_step=0.00576, global_step=7619.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  23%|██▎       | 280/1208 [07:54<26:14,  1.70s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00576, train/loss_vlb_step=3.04e-5, train/loss_step=0.00576, global_step=7619.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  23%|██▎       | 280/1208 [07:54<26:14,  1.70s/it, loss=0.182, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000478, train/loss_step=0.145, global_step=7619.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  23%|██▎       | 281/1208 [07:55<26:10,  1.69s/it, loss=0.182, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000478, train/loss_step=0.145, global_step=7619.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  23%|██▎       | 281/1208 [07:55<26:10,  1.69s/it, loss=0.191, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000672, train/loss_step=0.189, global_step=7620.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  23%|██▎       | 282/1208 [07:57<26:06,  1.69s/it, loss=0.191, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000672, train/loss_step=0.189, global_step=7620.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  23%|██▎       | 282/1208 [07:57<26:06,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.6e-5, train/loss_step=0.00285, global_step=7620.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  23%|██▎       | 283/1208 [07:58<26:02,  1.69s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.6e-5, train/loss_step=0.00285, global_step=7620.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  23%|██▎       | 283/1208 [07:58<26:02,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0644, train/loss_vlb_step=0.000216, train/loss_step=0.0644, global_step=7620.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  24%|██▎       | 284/1208 [08:01<26:05,  1.69s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0644, train/loss_vlb_step=0.000216, train/loss_step=0.0644, global_step=7620.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  24%|██▎       | 284/1208 [08:01<26:05,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0768, train/loss_vlb_step=0.000256, train/loss_step=0.0768, global_step=7620.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  24%|██▎       | 285/1208 [08:02<26:01,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0768, train/loss_vlb_step=0.000256, train/loss_step=0.0768, global_step=7620.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  24%|██▎       | 285/1208 [08:02<26:01,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000516, train/loss_step=0.153, global_step=7621.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  24%|██▎       | 286/1208 [08:03<25:58,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000516, train/loss_step=0.153, global_step=7621.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  24%|██▎       | 286/1208 [08:03<25:58,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.030, train/loss_vlb_step=0.000115, train/loss_step=0.030, global_step=7621.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  24%|██▍       | 287/1208 [08:04<25:54,  1.69s/it, loss=0.132, v_num=0, train/loss_simple_step=0.030, train/loss_vlb_step=0.000115, train/loss_step=0.030, global_step=7621.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  24%|██▍       | 287/1208 [08:04<25:54,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000292, train/loss_step=0.086, global_step=7621.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  24%|██▍       | 288/1208 [08:07<25:57,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000292, train/loss_step=0.086, global_step=7621.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  24%|██▍       | 288/1208 [08:07<25:57,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00136, train/loss_step=0.300, global_step=7621.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  24%|██▍       | 289/1208 [08:08<25:54,  1.69s/it, loss=0.146, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00136, train/loss_step=0.300, global_step=7621.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  24%|██▍       | 289/1208 [08:08<25:54,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000112, train/loss_step=0.0297, global_step=7622.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  24%|██▍       | 290/1208 [08:09<25:50,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000112, train/loss_step=0.0297, global_step=7622.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  24%|██▍       | 290/1208 [08:09<25:50,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.6e-5, train/loss_step=0.0133, global_step=7622.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  24%|██▍       | 291/1208 [08:10<25:46,  1.69s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.6e-5, train/loss_step=0.0133, global_step=7622.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  24%|██▍       | 291/1208 [08:10<25:46,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00204, train/loss_step=0.371, global_step=7622.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  24%|██▍       | 292/1208 [08:14<25:49,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00204, train/loss_step=0.371, global_step=7622.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  24%|██▍       | 292/1208 [08:14<25:49,  1.69s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.44e-5, train/loss_step=0.0149, global_step=7622.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  24%|██▍       | 293/1208 [08:15<25:46,  1.69s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.44e-5, train/loss_step=0.0149, global_step=7622.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  24%|██▍       | 293/1208 [08:15<25:46,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000727, train/loss_step=0.193, global_step=7623.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  24%|██▍       | 294/1208 [08:16<25:42,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000727, train/loss_step=0.193, global_step=7623.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  24%|██▍       | 294/1208 [08:16<25:42,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.000182, train/loss_step=0.0526, global_step=7623.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  24%|██▍       | 295/1208 [08:17<25:38,  1.69s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.000182, train/loss_step=0.0526, global_step=7623.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  24%|██▍       | 295/1208 [08:17<25:38,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00172, train/loss_step=0.300, global_step=7623.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  25%|██▍       | 296/1208 [08:20<25:42,  1.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00172, train/loss_step=0.300, global_step=7623.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  25%|██▍       | 296/1208 [08:20<25:42,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.64e-5, train/loss_step=0.0178, global_step=7623.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  25%|██▍       | 297/1208 [08:21<25:38,  1.69s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.64e-5, train/loss_step=0.0178, global_step=7623.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  25%|██▍       | 297/1208 [08:21<25:38,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00601, train/loss_step=0.434, global_step=7624.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  25%|██▍       | 298/1208 [08:22<25:34,  1.69s/it, loss=0.124, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00601, train/loss_step=0.434, global_step=7624.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  25%|██▍       | 298/1208 [08:22<25:34,  1.69s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0247, train/loss_vlb_step=9.92e-5, train/loss_step=0.0247, global_step=7624.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  25%|██▍       | 299/1208 [08:23<25:31,  1.68s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0247, train/loss_vlb_step=9.92e-5, train/loss_step=0.0247, global_step=7624.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  25%|██▍       | 299/1208 [08:23<25:31,  1.68s/it, loss=0.136, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000854, train/loss_step=0.216, global_step=7624.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  25%|██▍       | 300/1208 [08:26<25:34,  1.69s/it, loss=0.136, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000854, train/loss_step=0.216, global_step=7624.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  25%|██▍       | 300/1208 [08:26<25:34,  1.69s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=1.41e-5, train/loss_step=0.00245, global_step=7624.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.74it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.74it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.73it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.74it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.75it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.74it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.75it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.75it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.76it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.76it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.76it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.82it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.76it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.81it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.81it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.76it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.81it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.76it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.81it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.76it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.75it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.78it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.76it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.81it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.76it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.79it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.81it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.81it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.81it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.75it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.81it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.81it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.80it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.81it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.81it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.81it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.82it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.81it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.81it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.80it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.80it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]Epoch 25:  25%|██▍       | 301/1208 [08:57<27:00,  1.79s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=1.41e-5, train/loss_step=0.00245, global_step=7624.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  25%|██▍       | 301/1208 [08:57<27:00,  1.79s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00703, train/loss_vlb_step=3.47e-5, train/loss_step=0.00703, global_step=7625.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  25%|██▌       | 302/1208 [08:58<26:56,  1.78s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00703, train/loss_vlb_step=3.47e-5, train/loss_step=0.00703, global_step=7625.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  25%|██▌       | 302/1208 [08:58<26:56,  1.78s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.19e-5, train/loss_step=0.0134, global_step=7625.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  25%|██▌       | 303/1208 [08:59<26:52,  1.78s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.19e-5, train/loss_step=0.0134, global_step=7625.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  25%|██▌       | 303/1208 [08:59<26:52,  1.78s/it, loss=0.14, v_num=0, train/loss_simple_step=0.463, train/loss_vlb_step=0.00369, train/loss_step=0.463, global_step=7625.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  25%|██▌       | 304/1208 [09:02<26:54,  1.79s/it, loss=0.14, v_num=0, train/loss_simple_step=0.463, train/loss_vlb_step=0.00369, train/loss_step=0.463, global_step=7625.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  25%|██▌       | 304/1208 [09:02<26:54,  1.79s/it, loss=0.141, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.00035, train/loss_step=0.106, global_step=7625.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  25%|██▌       | 305/1208 [09:03<26:50,  1.78s/it, loss=0.141, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.00035, train/loss_step=0.106, global_step=7625.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  25%|██▌       | 305/1208 [09:03<26:50,  1.78s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0428, train/loss_vlb_step=0.00016, train/loss_step=0.0428, global_step=7626.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  25%|██▌       | 306/1208 [09:04<26:46,  1.78s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0428, train/loss_vlb_step=0.00016, train/loss_step=0.0428, global_step=7626.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  25%|██▌       | 306/1208 [09:04<26:46,  1.78s/it, loss=0.139, v_num=0, train/loss_simple_step=0.090, train/loss_vlb_step=0.000296, train/loss_step=0.090, global_step=7626.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  25%|██▌       | 307/1208 [09:05<26:42,  1.78s/it, loss=0.139, v_num=0, train/loss_simple_step=0.090, train/loss_vlb_step=0.000296, train/loss_step=0.090, global_step=7626.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  25%|██▌       | 307/1208 [09:05<26:42,  1.78s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00275, train/loss_vlb_step=1.54e-5, train/loss_step=0.00275, global_step=7626.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  25%|██▌       | 308/1208 [09:09<26:44,  1.78s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00275, train/loss_vlb_step=1.54e-5, train/loss_step=0.00275, global_step=7626.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  25%|██▌       | 308/1208 [09:09<26:44,  1.78s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000153, train/loss_step=0.0415, global_step=7626.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  26%|██▌       | 309/1208 [09:10<26:40,  1.78s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000153, train/loss_step=0.0415, global_step=7626.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  26%|██▌       | 309/1208 [09:10<26:40,  1.78s/it, loss=0.156, v_num=0, train/loss_simple_step=0.717, train/loss_vlb_step=0.0411, train/loss_step=0.717, global_step=7627.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  26%|██▌       | 310/1208 [09:11<26:36,  1.78s/it, loss=0.156, v_num=0, train/loss_simple_step=0.717, train/loss_vlb_step=0.0411, train/loss_step=0.717, global_step=7627.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  26%|██▌       | 310/1208 [09:11<26:36,  1.78s/it, loss=0.179, v_num=0, train/loss_simple_step=0.479, train/loss_vlb_step=0.0044, train/loss_step=0.479, global_step=7627.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  26%|██▌       | 311/1208 [09:12<26:32,  1.78s/it, loss=0.179, v_num=0, train/loss_simple_step=0.479, train/loss_vlb_step=0.0044, train/loss_step=0.479, global_step=7627.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  26%|██▌       | 311/1208 [09:12<26:32,  1.78s/it, loss=0.168, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000515, train/loss_step=0.152, global_step=7627.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  26%|██▌       | 312/1208 [09:15<26:35,  1.78s/it, loss=0.168, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000515, train/loss_step=0.152, global_step=7627.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  26%|██▌       | 312/1208 [09:15<26:35,  1.78s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0594, train/loss_vlb_step=0.000202, train/loss_step=0.0594, global_step=7627.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  26%|██▌       | 313/1208 [09:16<26:31,  1.78s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0594, train/loss_vlb_step=0.000202, train/loss_step=0.0594, global_step=7627.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  26%|██▌       | 313/1208 [09:16<26:31,  1.78s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0597, train/loss_vlb_step=0.000219, train/loss_step=0.0597, global_step=7628.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  26%|██▌       | 314/1208 [09:17<26:27,  1.78s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0597, train/loss_vlb_step=0.000219, train/loss_step=0.0597, global_step=7628.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  26%|██▌       | 314/1208 [09:17<26:27,  1.78s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.28e-5, train/loss_step=0.0117, global_step=7628.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  26%|██▌       | 315/1208 [09:18<26:23,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.28e-5, train/loss_step=0.0117, global_step=7628.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  26%|██▌       | 315/1208 [09:18<26:23,  1.77s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00536, train/loss_vlb_step=2.69e-5, train/loss_step=0.00536, global_step=7628.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  26%|██▌       | 316/1208 [09:21<26:25,  1.78s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00536, train/loss_vlb_step=2.69e-5, train/loss_step=0.00536, global_step=7628.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  26%|██▌       | 316/1208 [09:21<26:25,  1.78s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0659, train/loss_vlb_step=0.000226, train/loss_step=0.0659, global_step=7628.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  26%|██▌       | 317/1208 [09:22<26:22,  1.78s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0659, train/loss_vlb_step=0.000226, train/loss_step=0.0659, global_step=7628.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  26%|██▌       | 317/1208 [09:22<26:22,  1.78s/it, loss=0.162, v_num=0, train/loss_simple_step=0.677, train/loss_vlb_step=0.0388, train/loss_step=0.677, global_step=7629.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  26%|██▋       | 318/1208 [09:23<26:18,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.677, train/loss_vlb_step=0.0388, train/loss_step=0.677, global_step=7629.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  26%|██▋       | 318/1208 [09:23<26:18,  1.77s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.18e-5, train/loss_step=0.00207, global_step=7629.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  26%|██▋       | 319/1208 [09:24<26:14,  1.77s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.18e-5, train/loss_step=0.00207, global_step=7629.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  26%|██▋       | 319/1208 [09:24<26:14,  1.77s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.79e-5, train/loss_step=0.0175, global_step=7629.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  26%|██▋       | 320/1208 [09:28<26:16,  1.78s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.79e-5, train/loss_step=0.0175, global_step=7629.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  26%|██▋       | 320/1208 [09:28<26:16,  1.78s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=1.49e-5, train/loss_step=0.00262, global_step=7629.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  27%|██▋       | 321/1208 [09:29<26:12,  1.77s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=1.49e-5, train/loss_step=0.00262, global_step=7629.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  27%|██▋       | 321/1208 [09:29<26:12,  1.77s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0355, train/loss_vlb_step=0.000131, train/loss_step=0.0355, global_step=7630.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  27%|██▋       | 322/1208 [09:30<26:09,  1.77s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0355, train/loss_vlb_step=0.000131, train/loss_step=0.0355, global_step=7630.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  27%|██▋       | 322/1208 [09:30<26:09,  1.77s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=3.24e-5, train/loss_step=0.00677, global_step=7630.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  27%|██▋       | 323/1208 [09:31<26:05,  1.77s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=3.24e-5, train/loss_step=0.00677, global_step=7630.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  27%|██▋       | 323/1208 [09:31<26:05,  1.77s/it, loss=0.136, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000465, train/loss_step=0.139, global_step=7630.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  27%|██▋       | 324/1208 [09:34<26:07,  1.77s/it, loss=0.136, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000465, train/loss_step=0.139, global_step=7630.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  27%|██▋       | 324/1208 [09:34<26:07,  1.77s/it, loss=0.153, v_num=0, train/loss_simple_step=0.446, train/loss_vlb_step=0.00537, train/loss_step=0.446, global_step=7630.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  27%|██▋       | 325/1208 [09:35<26:03,  1.77s/it, loss=0.153, v_num=0, train/loss_simple_step=0.446, train/loss_vlb_step=0.00537, train/loss_step=0.446, global_step=7630.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  27%|██▋       | 325/1208 [09:35<26:03,  1.77s/it, loss=0.16, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000654, train/loss_step=0.187, global_step=7631.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  27%|██▋       | 326/1208 [09:36<26:00,  1.77s/it, loss=0.16, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000654, train/loss_step=0.187, global_step=7631.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  27%|██▋       | 326/1208 [09:36<26:00,  1.77s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.32e-5, train/loss_step=0.0144, global_step=7631.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  27%|██▋       | 327/1208 [09:37<25:56,  1.77s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.32e-5, train/loss_step=0.0144, global_step=7631.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  27%|██▋       | 327/1208 [09:37<25:56,  1.77s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.32e-5, train/loss_step=0.00225, global_step=7631.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  27%|██▋       | 328/1208 [09:40<25:58,  1.77s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.32e-5, train/loss_step=0.00225, global_step=7631.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  27%|██▋       | 328/1208 [09:40<25:58,  1.77s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0533, train/loss_vlb_step=0.000189, train/loss_step=0.0533, global_step=7631.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  27%|██▋       | 329/1208 [09:41<25:54,  1.77s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0533, train/loss_vlb_step=0.000189, train/loss_step=0.0533, global_step=7631.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  27%|██▋       | 329/1208 [09:41<25:54,  1.77s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0962, train/loss_vlb_step=0.000316, train/loss_step=0.0962, global_step=7632.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  27%|██▋       | 330/1208 [09:42<25:51,  1.77s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0962, train/loss_vlb_step=0.000316, train/loss_step=0.0962, global_step=7632.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  27%|██▋       | 330/1208 [09:42<25:51,  1.77s/it, loss=0.123, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00252, train/loss_step=0.432, global_step=7632.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  27%|██▋       | 331/1208 [09:44<25:47,  1.76s/it, loss=0.123, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00252, train/loss_step=0.432, global_step=7632.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  27%|██▋       | 331/1208 [09:44<25:47,  1.76s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0991, train/loss_vlb_step=0.000326, train/loss_step=0.0991, global_step=7632.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  27%|██▋       | 332/1208 [09:47<25:49,  1.77s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0991, train/loss_vlb_step=0.000326, train/loss_step=0.0991, global_step=7632.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  27%|██▋       | 332/1208 [09:47<25:49,  1.77s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.00025, train/loss_step=0.0732, global_step=7632.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  28%|██▊       | 333/1208 [09:48<25:45,  1.77s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0732, train/loss_vlb_step=0.00025, train/loss_step=0.0732, global_step=7632.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  28%|██▊       | 333/1208 [09:48<25:45,  1.77s/it, loss=0.144, v_num=0, train/loss_simple_step=0.511, train/loss_vlb_step=0.00665, train/loss_step=0.511, global_step=7633.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  28%|██▊       | 334/1208 [09:49<25:42,  1.76s/it, loss=0.144, v_num=0, train/loss_simple_step=0.511, train/loss_vlb_step=0.00665, train/loss_step=0.511, global_step=7633.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  28%|██▊       | 334/1208 [09:49<25:42,  1.76s/it, loss=0.15, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000458, train/loss_step=0.138, global_step=7633.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  28%|██▊       | 335/1208 [09:50<25:38,  1.76s/it, loss=0.15, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000458, train/loss_step=0.138, global_step=7633.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  28%|██▊       | 335/1208 [09:50<25:38,  1.76s/it, loss=0.174, v_num=0, train/loss_simple_step=0.480, train/loss_vlb_step=0.0054, train/loss_step=0.480, global_step=7633.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  28%|██▊       | 336/1208 [09:53<25:40,  1.77s/it, loss=0.174, v_num=0, train/loss_simple_step=0.480, train/loss_vlb_step=0.0054, train/loss_step=0.480, global_step=7633.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  28%|██▊       | 336/1208 [09:53<25:40,  1.77s/it, loss=0.181, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000856, train/loss_step=0.211, global_step=7633.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  28%|██▊       | 337/1208 [09:54<25:36,  1.76s/it, loss=0.181, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000856, train/loss_step=0.211, global_step=7633.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  28%|██▊       | 337/1208 [09:54<25:36,  1.76s/it, loss=0.163, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00151, train/loss_step=0.312, global_step=7634.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  28%|██▊       | 338/1208 [09:55<25:33,  1.76s/it, loss=0.163, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00151, train/loss_step=0.312, global_step=7634.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  28%|██▊       | 338/1208 [09:55<25:33,  1.76s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.15e-5, train/loss_step=0.0143, global_step=7634.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  28%|██▊       | 339/1208 [09:56<25:29,  1.76s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.15e-5, train/loss_step=0.0143, global_step=7634.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  28%|██▊       | 339/1208 [09:56<25:29,  1.76s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.63e-5, train/loss_step=0.0029, global_step=7634.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  28%|██▊       | 340/1208 [09:59<25:31,  1.76s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.63e-5, train/loss_step=0.0029, global_step=7634.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  28%|██▊       | 340/1208 [09:59<25:31,  1.76s/it, loss=0.171, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.00056, train/loss_step=0.169, global_step=7634.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  28%|██▊       | 341/1208 [10:01<25:28,  1.76s/it, loss=0.171, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.00056, train/loss_step=0.169, global_step=7634.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  28%|██▊       | 341/1208 [10:01<25:28,  1.76s/it, loss=0.177, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000507, train/loss_step=0.147, global_step=7635.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  28%|██▊       | 342/1208 [10:02<25:24,  1.76s/it, loss=0.177, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000507, train/loss_step=0.147, global_step=7635.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  28%|██▊       | 342/1208 [10:02<25:24,  1.76s/it, loss=0.186, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000674, train/loss_step=0.188, global_step=7635.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  28%|██▊       | 343/1208 [10:03<25:21,  1.76s/it, loss=0.186, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000674, train/loss_step=0.188, global_step=7635.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  28%|██▊       | 343/1208 [10:03<25:21,  1.76s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.9e-5, train/loss_step=0.00351, global_step=7635.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  28%|██▊       | 344/1208 [10:06<25:22,  1.76s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.9e-5, train/loss_step=0.00351, global_step=7635.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  28%|██▊       | 344/1208 [10:06<25:22,  1.76s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.96e-5, train/loss_step=0.0164, global_step=7635.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  29%|██▊       | 345/1208 [10:07<25:19,  1.76s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.96e-5, train/loss_step=0.0164, global_step=7635.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  29%|██▊       | 345/1208 [10:07<25:19,  1.76s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000113, train/loss_step=0.0308, global_step=7636.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  29%|██▊       | 346/1208 [10:08<25:15,  1.76s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000113, train/loss_step=0.0308, global_step=7636.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  29%|██▊       | 346/1208 [10:08<25:15,  1.76s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0824, train/loss_vlb_step=0.000275, train/loss_step=0.0824, global_step=7636.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  29%|██▊       | 347/1208 [10:09<25:12,  1.76s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0824, train/loss_vlb_step=0.000275, train/loss_step=0.0824, global_step=7636.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  29%|██▊       | 347/1208 [10:09<25:12,  1.76s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.61e-5, train/loss_step=0.0214, global_step=7636.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  29%|██▉       | 348/1208 [10:12<25:14,  1.76s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.61e-5, train/loss_step=0.0214, global_step=7636.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  29%|██▉       | 348/1208 [10:12<25:14,  1.76s/it, loss=0.154, v_num=0, train/loss_simple_step=0.055, train/loss_vlb_step=0.000193, train/loss_step=0.055, global_step=7636.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  29%|██▉       | 349/1208 [10:13<25:10,  1.76s/it, loss=0.154, v_num=0, train/loss_simple_step=0.055, train/loss_vlb_step=0.000193, train/loss_step=0.055, global_step=7636.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  29%|██▉       | 349/1208 [10:13<25:10,  1.76s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0574, train/loss_vlb_step=0.000203, train/loss_step=0.0574, global_step=7637.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  29%|██▉       | 350/1208 [10:14<25:07,  1.76s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0574, train/loss_vlb_step=0.000203, train/loss_step=0.0574, global_step=7637.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  29%|██▉       | 350/1208 [10:14<25:07,  1.76s/it, loss=0.141, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000801, train/loss_step=0.216, global_step=7637.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  29%|██▉       | 351/1208 [10:15<25:03,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000801, train/loss_step=0.216, global_step=7637.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  29%|██▉       | 351/1208 [10:15<25:03,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.77e-5, train/loss_step=0.00557, global_step=7637.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  29%|██▉       | 352/1208 [10:19<25:05,  1.76s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.77e-5, train/loss_step=0.00557, global_step=7637.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  29%|██▉       | 352/1208 [10:19<25:05,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.000225, train/loss_step=0.067, global_step=7637.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  29%|██▉       | 353/1208 [10:20<25:02,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.000225, train/loss_step=0.067, global_step=7637.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  29%|██▉       | 353/1208 [10:20<25:02,  1.76s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00637, train/loss_vlb_step=3.23e-5, train/loss_step=0.00637, global_step=7638.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  29%|██▉       | 354/1208 [10:21<24:58,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00637, train/loss_vlb_step=3.23e-5, train/loss_step=0.00637, global_step=7638.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  29%|██▉       | 354/1208 [10:21<24:58,  1.75s/it, loss=0.107, v_num=0, train/loss_simple_step=0.046, train/loss_vlb_step=0.000155, train/loss_step=0.046, global_step=7638.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  29%|██▉       | 355/1208 [10:22<24:55,  1.75s/it, loss=0.107, v_num=0, train/loss_simple_step=0.046, train/loss_vlb_step=0.000155, train/loss_step=0.046, global_step=7638.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  29%|██▉       | 355/1208 [10:22<24:55,  1.75s/it, loss=0.084, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.00011, train/loss_step=0.0276, global_step=7638.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  29%|██▉       | 356/1208 [10:25<24:57,  1.76s/it, loss=0.084, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.00011, train/loss_step=0.0276, global_step=7638.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  29%|██▉       | 356/1208 [10:25<24:57,  1.76s/it, loss=0.0831, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000734, train/loss_step=0.193, global_step=7638.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  30%|██▉       | 357/1208 [10:26<24:53,  1.76s/it, loss=0.0831, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000734, train/loss_step=0.193, global_step=7638.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  30%|██▉       | 357/1208 [10:26<24:53,  1.76s/it, loss=0.0682, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.14e-5, train/loss_step=0.0138, global_step=7639.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  30%|██▉       | 358/1208 [10:27<24:50,  1.75s/it, loss=0.0682, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.14e-5, train/loss_step=0.0138, global_step=7639.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  30%|██▉       | 358/1208 [10:27<24:50,  1.75s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.467, train/loss_vlb_step=0.00543, train/loss_step=0.467, global_step=7639.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  30%|██▉       | 359/1208 [10:28<24:47,  1.75s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.467, train/loss_vlb_step=0.00543, train/loss_step=0.467, global_step=7639.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  30%|██▉       | 359/1208 [10:28<24:47,  1.75s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.0509, train/loss_vlb_step=0.000184, train/loss_step=0.0509, global_step=7639.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  30%|██▉       | 360/1208 [10:32<24:49,  1.76s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.0509, train/loss_vlb_step=0.000184, train/loss_step=0.0509, global_step=7639.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  30%|██▉       | 360/1208 [10:32<24:49,  1.76s/it, loss=0.0886, v_num=0, train/loss_simple_step=0.0777, train/loss_vlb_step=0.000256, train/loss_step=0.0777, global_step=7639.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  30%|██▉       | 361/1208 [10:33<24:45,  1.75s/it, loss=0.0886, v_num=0, train/loss_simple_step=0.0777, train/loss_vlb_step=0.000256, train/loss_step=0.0777, global_step=7639.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  30%|██▉       | 361/1208 [10:33<24:45,  1.75s/it, loss=0.0912, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000725, train/loss_step=0.198, global_step=7640.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  30%|██▉       | 362/1208 [10:34<24:42,  1.75s/it, loss=0.0912, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000725, train/loss_step=0.198, global_step=7640.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  30%|██▉       | 362/1208 [10:34<24:42,  1.75s/it, loss=0.1, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00204, train/loss_step=0.366, global_step=7640.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  30%|███       | 363/1208 [10:35<24:38,  1.75s/it, loss=0.1, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00204, train/loss_step=0.366, global_step=7640.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  30%|███       | 363/1208 [10:35<24:38,  1.75s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=1.84e-5, train/loss_step=0.00334, global_step=7640.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  30%|███       | 364/1208 [10:38<24:40,  1.75s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=1.84e-5, train/loss_step=0.00334, global_step=7640.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  30%|███       | 364/1208 [10:38<24:40,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00242, train/loss_step=0.379, global_step=7640.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  30%|███       | 365/1208 [10:39<24:37,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00242, train/loss_step=0.379, global_step=7640.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  30%|███       | 365/1208 [10:39<24:37,  1.75s/it, loss=0.145, v_num=0, train/loss_simple_step=0.573, train/loss_vlb_step=0.0089, train/loss_step=0.573, global_step=7641.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  30%|███       | 366/1208 [10:40<24:33,  1.75s/it, loss=0.145, v_num=0, train/loss_simple_step=0.573, train/loss_vlb_step=0.0089, train/loss_step=0.573, global_step=7641.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  30%|███       | 366/1208 [10:40<24:33,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000137, train/loss_step=0.0363, global_step=7641.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  30%|███       | 367/1208 [10:41<24:30,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000137, train/loss_step=0.0363, global_step=7641.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  30%|███       | 367/1208 [10:41<24:30,  1.75s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0635, train/loss_vlb_step=0.000216, train/loss_step=0.0635, global_step=7641.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  30%|███       | 368/1208 [10:44<24:32,  1.75s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0635, train/loss_vlb_step=0.000216, train/loss_step=0.0635, global_step=7641.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  30%|███       | 368/1208 [10:44<24:32,  1.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000616, train/loss_step=0.170, global_step=7641.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  31%|███       | 369/1208 [10:45<24:28,  1.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000616, train/loss_step=0.170, global_step=7641.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  31%|███       | 369/1208 [10:45<24:28,  1.75s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0086, train/loss_vlb_step=4.28e-5, train/loss_step=0.0086, global_step=7642.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  31%|███       | 370/1208 [10:47<24:25,  1.75s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0086, train/loss_vlb_step=4.28e-5, train/loss_step=0.0086, global_step=7642.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  31%|███       | 370/1208 [10:47<24:25,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=1.08e-5, train/loss_step=0.00184, global_step=7642.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  31%|███       | 371/1208 [10:48<24:22,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=1.08e-5, train/loss_step=0.00184, global_step=7642.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  31%|███       | 371/1208 [10:48<24:22,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000127, train/loss_step=0.0346, global_step=7642.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  31%|███       | 372/1208 [10:51<24:23,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000127, train/loss_step=0.0346, global_step=7642.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  31%|███       | 372/1208 [10:51<24:23,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0876, train/loss_vlb_step=0.000289, train/loss_step=0.0876, global_step=7642.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  31%|███       | 373/1208 [10:52<24:20,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0876, train/loss_vlb_step=0.000289, train/loss_step=0.0876, global_step=7642.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  31%|███       | 373/1208 [10:52<24:20,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00161, train/loss_step=0.326, global_step=7643.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  31%|███       | 374/1208 [10:53<24:17,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00161, train/loss_step=0.326, global_step=7643.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  31%|███       | 374/1208 [10:53<24:17,  1.75s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000102, train/loss_step=0.0253, global_step=7643.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  31%|███       | 375/1208 [10:54<24:13,  1.75s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000102, train/loss_step=0.0253, global_step=7643.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  31%|███       | 375/1208 [10:54<24:13,  1.75s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0744, train/loss_vlb_step=0.000253, train/loss_step=0.0744, global_step=7643.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  31%|███       | 376/1208 [10:57<24:15,  1.75s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0744, train/loss_vlb_step=0.000253, train/loss_step=0.0744, global_step=7643.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  31%|███       | 376/1208 [10:57<24:15,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0823, train/loss_vlb_step=0.000275, train/loss_step=0.0823, global_step=7643.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  31%|███       | 377/1208 [10:58<24:12,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0823, train/loss_vlb_step=0.000275, train/loss_step=0.0823, global_step=7643.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  31%|███       | 377/1208 [10:58<24:12,  1.75s/it, loss=0.174, v_num=0, train/loss_simple_step=0.451, train/loss_vlb_step=0.00484, train/loss_step=0.451, global_step=7644.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  31%|███▏      | 378/1208 [10:59<24:08,  1.75s/it, loss=0.174, v_num=0, train/loss_simple_step=0.451, train/loss_vlb_step=0.00484, train/loss_step=0.451, global_step=7644.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  31%|███▏      | 378/1208 [10:59<24:09,  1.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.28e-5, train/loss_step=0.00219, global_step=7644.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  31%|███▏      | 379/1208 [11:00<24:05,  1.74s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.28e-5, train/loss_step=0.00219, global_step=7644.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  31%|███▏      | 379/1208 [11:00<24:05,  1.74s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.07e-5, train/loss_step=0.0228, global_step=7644.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  31%|███▏      | 380/1208 [11:04<24:07,  1.75s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.07e-5, train/loss_step=0.0228, global_step=7644.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  31%|███▏      | 380/1208 [11:04<24:07,  1.75s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=9.55e-6, train/loss_step=0.00158, global_step=7644.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  32%|███▏      | 381/1208 [11:05<24:04,  1.75s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=9.55e-6, train/loss_step=0.00158, global_step=7644.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  32%|███▏      | 381/1208 [11:05<24:04,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00526, train/loss_step=0.405, global_step=7645.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  32%|███▏      | 382/1208 [11:06<24:00,  1.74s/it, loss=0.156, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00526, train/loss_step=0.405, global_step=7645.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  32%|███▏      | 382/1208 [11:06<24:00,  1.74s/it, loss=0.151, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00102, train/loss_step=0.263, global_step=7645.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  32%|███▏      | 383/1208 [11:07<23:57,  1.74s/it, loss=0.151, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00102, train/loss_step=0.263, global_step=7645.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  32%|███▏      | 383/1208 [11:07<23:57,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0371, train/loss_vlb_step=0.000141, train/loss_step=0.0371, global_step=7645.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  32%|███▏      | 384/1208 [11:10<23:59,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0371, train/loss_vlb_step=0.000141, train/loss_step=0.0371, global_step=7645.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  32%|███▏      | 384/1208 [11:10<23:59,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000425, train/loss_step=0.128, global_step=7645.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  32%|███▏      | 385/1208 [11:11<23:55,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000425, train/loss_step=0.128, global_step=7645.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  32%|███▏      | 385/1208 [11:11<23:55,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.005, train/loss_vlb_step=2.65e-5, train/loss_step=0.005, global_step=7646.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  32%|███▏      | 386/1208 [11:12<23:52,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.005, train/loss_vlb_step=2.65e-5, train/loss_step=0.005, global_step=7646.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  32%|███▏      | 386/1208 [11:12<23:52,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.073, train/loss_vlb_step=0.000245, train/loss_step=0.073, global_step=7646.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  32%|███▏      | 387/1208 [11:13<23:49,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.073, train/loss_vlb_step=0.000245, train/loss_step=0.073, global_step=7646.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  32%|███▏      | 387/1208 [11:13<23:49,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0758, train/loss_vlb_step=0.000255, train/loss_step=0.0758, global_step=7646.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  32%|███▏      | 388/1208 [11:17<23:50,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0758, train/loss_vlb_step=0.000255, train/loss_step=0.0758, global_step=7646.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  32%|███▏      | 388/1208 [11:17<23:50,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000723, train/loss_step=0.202, global_step=7646.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  32%|███▏      | 389/1208 [11:18<23:47,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000723, train/loss_step=0.202, global_step=7646.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  32%|███▏      | 389/1208 [11:18<23:47,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000787, train/loss_step=0.209, global_step=7647.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  32%|███▏      | 390/1208 [11:19<23:44,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000787, train/loss_step=0.209, global_step=7647.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  32%|███▏      | 390/1208 [11:19<23:44,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0493, train/loss_vlb_step=0.000178, train/loss_step=0.0493, global_step=7647.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  32%|███▏      | 391/1208 [11:20<23:41,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0493, train/loss_vlb_step=0.000178, train/loss_step=0.0493, global_step=7647.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  32%|███▏      | 391/1208 [11:20<23:41,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.71e-5, train/loss_step=0.0104, global_step=7647.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  32%|███▏      | 392/1208 [11:23<23:42,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.71e-5, train/loss_step=0.0104, global_step=7647.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  32%|███▏      | 392/1208 [11:23<23:42,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00148, train/loss_step=0.307, global_step=7647.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  33%|███▎      | 393/1208 [11:24<23:39,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00148, train/loss_step=0.307, global_step=7647.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  33%|███▎      | 393/1208 [11:24<23:39,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000826, train/loss_step=0.225, global_step=7648.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  33%|███▎      | 394/1208 [11:25<23:36,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000826, train/loss_step=0.225, global_step=7648.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  33%|███▎      | 394/1208 [11:25<23:36,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.97e-5, train/loss_step=0.0106, global_step=7648.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  33%|███▎      | 395/1208 [11:26<23:33,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.97e-5, train/loss_step=0.0106, global_step=7648.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  33%|███▎      | 395/1208 [11:26<23:33,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00528, train/loss_vlb_step=2.83e-5, train/loss_step=0.00528, global_step=7648.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  33%|███▎      | 396/1208 [11:29<23:34,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00528, train/loss_vlb_step=2.83e-5, train/loss_step=0.00528, global_step=7648.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  33%|███▎      | 396/1208 [11:29<23:34,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000686, train/loss_step=0.190, global_step=7648.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  33%|███▎      | 397/1208 [11:31<23:31,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000686, train/loss_step=0.190, global_step=7648.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  33%|███▎      | 397/1208 [11:31<23:31,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00981, train/loss_vlb_step=4.62e-5, train/loss_step=0.00981, global_step=7649.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  33%|███▎      | 398/1208 [11:32<23:28,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00981, train/loss_vlb_step=4.62e-5, train/loss_step=0.00981, global_step=7649.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  33%|███▎      | 398/1208 [11:32<23:28,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=9.9e-5, train/loss_step=0.0254, global_step=7649.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  33%|███▎      | 399/1208 [11:33<23:25,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=9.9e-5, train/loss_step=0.0254, global_step=7649.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  33%|███▎      | 399/1208 [11:33<23:25,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00961, train/loss_vlb_step=4.37e-5, train/loss_step=0.00961, global_step=7649.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  33%|███▎      | 400/1208 [11:36<23:26,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00961, train/loss_vlb_step=4.37e-5, train/loss_step=0.00961, global_step=7649.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  33%|███▎      | 400/1208 [11:36<23:26,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.24e-5, train/loss_step=0.00204, global_step=7649.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  33%|███▎      | 401/1208 [11:37<23:23,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.24e-5, train/loss_step=0.00204, global_step=7649.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  33%|███▎      | 401/1208 [11:37<23:23,  1.74s/it, loss=0.0923, v_num=0, train/loss_simple_step=0.00997, train/loss_vlb_step=4.6e-5, train/loss_step=0.00997, global_step=7650.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  33%|███▎      | 402/1208 [11:38<23:20,  1.74s/it, loss=0.0923, v_num=0, train/loss_simple_step=0.00997, train/loss_vlb_step=4.6e-5, train/loss_step=0.00997, global_step=7650.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  33%|███▎      | 402/1208 [11:38<23:20,  1.74s/it, loss=0.0813, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.000155, train/loss_step=0.0418, global_step=7650.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  33%|███▎      | 403/1208 [11:39<23:17,  1.74s/it, loss=0.0813, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.000155, train/loss_step=0.0418, global_step=7650.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  33%|███▎      | 403/1208 [11:39<23:17,  1.74s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00126, train/loss_step=0.276, global_step=7650.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  33%|███▎      | 404/1208 [11:42<23:18,  1.74s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00126, train/loss_step=0.276, global_step=7650.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  33%|███▎      | 404/1208 [11:42<23:18,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.526, train/loss_vlb_step=0.00456, train/loss_step=0.526, global_step=7650.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  34%|███▎      | 405/1208 [11:43<23:15,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.526, train/loss_vlb_step=0.00456, train/loss_step=0.526, global_step=7650.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  34%|███▎      | 405/1208 [11:43<23:15,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.38e-5, train/loss_step=0.0148, global_step=7651.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  34%|███▎      | 406/1208 [11:44<23:12,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.38e-5, train/loss_step=0.0148, global_step=7651.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  34%|███▎      | 406/1208 [11:44<23:12,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.07e-5, train/loss_step=0.0113, global_step=7651.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  34%|███▎      | 407/1208 [11:46<23:09,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.07e-5, train/loss_step=0.0113, global_step=7651.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  34%|███▎      | 407/1208 [11:46<23:09,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.000169, train/loss_step=0.048, global_step=7651.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  34%|███▍      | 408/1208 [11:49<23:10,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.000169, train/loss_step=0.048, global_step=7651.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  34%|███▍      | 408/1208 [11:49<23:10,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.491, train/loss_vlb_step=0.00802, train/loss_step=0.491, global_step=7651.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  34%|███▍      | 409/1208 [11:50<23:07,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.491, train/loss_vlb_step=0.00802, train/loss_step=0.491, global_step=7651.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  34%|███▍      | 409/1208 [11:50<23:07,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000909, train/loss_step=0.227, global_step=7652.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  34%|███▍      | 410/1208 [11:51<23:04,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000909, train/loss_step=0.227, global_step=7652.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  34%|███▍      | 410/1208 [11:51<23:04,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00751, train/loss_vlb_step=3.67e-5, train/loss_step=0.00751, global_step=7652.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  34%|███▍      | 411/1208 [11:52<23:01,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00751, train/loss_vlb_step=3.67e-5, train/loss_step=0.00751, global_step=7652.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  34%|███▍      | 411/1208 [11:52<23:01,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=7652.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  34%|███▍      | 412/1208 [11:55<23:02,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=7652.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  34%|███▍      | 412/1208 [11:55<23:02,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000375, train/loss_step=0.111, global_step=7652.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  34%|███▍      | 413/1208 [11:56<22:59,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000375, train/loss_step=0.111, global_step=7652.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  34%|███▍      | 413/1208 [11:56<22:59,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000136, train/loss_step=0.0364, global_step=7653.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  34%|███▍      | 414/1208 [11:57<22:56,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000136, train/loss_step=0.0364, global_step=7653.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  34%|███▍      | 414/1208 [11:57<22:56,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00249, train/loss_step=0.344, global_step=7653.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  34%|███▍      | 415/1208 [11:58<22:53,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00249, train/loss_step=0.344, global_step=7653.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  34%|███▍      | 415/1208 [11:58<22:53,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.37e-5, train/loss_step=0.0174, global_step=7653.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  34%|███▍      | 416/1208 [12:02<22:54,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.37e-5, train/loss_step=0.0174, global_step=7653.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  34%|███▍      | 416/1208 [12:02<22:54,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.08e-5, train/loss_step=0.0137, global_step=7653.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  35%|███▍      | 417/1208 [12:03<22:51,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.08e-5, train/loss_step=0.0137, global_step=7653.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  35%|███▍      | 417/1208 [12:03<22:51,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000837, train/loss_step=0.210, global_step=7654.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  35%|███▍      | 418/1208 [12:04<22:48,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000837, train/loss_step=0.210, global_step=7654.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  35%|███▍      | 418/1208 [12:04<22:48,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000468, train/loss_step=0.136, global_step=7654.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  35%|███▍      | 419/1208 [12:05<22:45,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000468, train/loss_step=0.136, global_step=7654.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  35%|███▍      | 419/1208 [12:05<22:45,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0423, train/loss_vlb_step=0.000153, train/loss_step=0.0423, global_step=7654.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  35%|███▍      | 420/1208 [12:08<22:46,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0423, train/loss_vlb_step=0.000153, train/loss_step=0.0423, global_step=7654.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  35%|███▍      | 420/1208 [12:08<22:46,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000496, train/loss_step=0.147, global_step=7654.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  35%|███▍      | 421/1208 [12:09<22:43,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000496, train/loss_step=0.147, global_step=7654.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  35%|███▍      | 421/1208 [12:09<22:43,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=1.1e-5, train/loss_step=0.00181, global_step=7655.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  35%|███▍      | 422/1208 [12:10<22:40,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=1.1e-5, train/loss_step=0.00181, global_step=7655.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  35%|███▍      | 422/1208 [12:10<22:40,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.29e-5, train/loss_step=0.0172, global_step=7655.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  35%|███▌      | 423/1208 [12:11<22:38,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.29e-5, train/loss_step=0.0172, global_step=7655.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  35%|███▌      | 423/1208 [12:11<22:38,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000719, train/loss_step=0.199, global_step=7655.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  35%|███▌      | 424/1208 [12:14<22:39,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000719, train/loss_step=0.199, global_step=7655.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  35%|███▌      | 424/1208 [12:15<22:39,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00435, train/loss_vlb_step=2.35e-5, train/loss_step=0.00435, global_step=7655.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  35%|███▌      | 425/1208 [12:16<22:36,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00435, train/loss_vlb_step=2.35e-5, train/loss_step=0.00435, global_step=7655.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  35%|███▌      | 425/1208 [12:16<22:36,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.46e-5, train/loss_step=0.0146, global_step=7656.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  35%|███▌      | 426/1208 [12:17<22:33,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.46e-5, train/loss_step=0.0146, global_step=7656.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  35%|███▌      | 426/1208 [12:17<22:33,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000184, train/loss_step=0.051, global_step=7656.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  35%|███▌      | 427/1208 [12:18<22:30,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000184, train/loss_step=0.051, global_step=7656.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  35%|███▌      | 427/1208 [12:18<22:30,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6.06e-5, train/loss_step=0.0135, global_step=7656.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  35%|███▌      | 428/1208 [12:21<22:31,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6.06e-5, train/loss_step=0.0135, global_step=7656.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  35%|███▌      | 428/1208 [12:21<22:31,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.542, train/loss_vlb_step=0.006, train/loss_step=0.542, global_step=7656.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  36%|███▌      | 429/1208 [12:22<22:28,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.542, train/loss_vlb_step=0.006, train/loss_step=0.542, global_step=7656.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  36%|███▌      | 429/1208 [12:22<22:28,  1.73s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0865, train/loss_vlb_step=0.000284, train/loss_step=0.0865, global_step=7657.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  36%|███▌      | 430/1208 [12:23<22:25,  1.73s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0865, train/loss_vlb_step=0.000284, train/loss_step=0.0865, global_step=7657.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  36%|███▌      | 430/1208 [12:23<22:25,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=7657.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  36%|███▌      | 431/1208 [12:24<22:22,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=7657.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  36%|███▌      | 431/1208 [12:24<22:22,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.726, train/loss_vlb_step=0.0292, train/loss_step=0.726, global_step=7657.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  36%|███▌      | 432/1208 [12:27<22:23,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.726, train/loss_vlb_step=0.0292, train/loss_step=0.726, global_step=7657.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  36%|███▌      | 432/1208 [12:27<22:23,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=7657.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  36%|███▌      | 433/1208 [12:29<22:20,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=7657.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  36%|███▌      | 433/1208 [12:29<22:20,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0576, train/loss_vlb_step=0.000196, train/loss_step=0.0576, global_step=7658.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  36%|███▌      | 434/1208 [12:30<22:17,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0576, train/loss_vlb_step=0.000196, train/loss_step=0.0576, global_step=7658.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  36%|███▌      | 434/1208 [12:30<22:17,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=7.99e-5, train/loss_step=0.0201, global_step=7658.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  36%|███▌      | 435/1208 [12:31<22:14,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=7.99e-5, train/loss_step=0.0201, global_step=7658.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  36%|███▌      | 435/1208 [12:31<22:14,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00228, train/loss_step=0.341, global_step=7658.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  36%|███▌      | 436/1208 [12:34<22:15,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00228, train/loss_step=0.341, global_step=7658.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  36%|███▌      | 436/1208 [12:34<22:15,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00332, train/loss_vlb_step=1.89e-5, train/loss_step=0.00332, global_step=7658.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  36%|███▌      | 437/1208 [12:35<22:12,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00332, train/loss_vlb_step=1.89e-5, train/loss_step=0.00332, global_step=7658.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  36%|███▌      | 437/1208 [12:35<22:12,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000105, train/loss_step=0.0268, global_step=7659.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  36%|███▋      | 438/1208 [12:36<22:10,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000105, train/loss_step=0.0268, global_step=7659.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  36%|███▋      | 438/1208 [12:36<22:10,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=2.42e-5, train/loss_step=0.00469, global_step=7659.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  36%|███▋      | 439/1208 [12:37<22:07,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=2.42e-5, train/loss_step=0.00469, global_step=7659.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  36%|███▋      | 439/1208 [12:37<22:07,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000133, train/loss_step=0.0376, global_step=7659.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  36%|███▋      | 440/1208 [12:40<22:08,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000133, train/loss_step=0.0376, global_step=7659.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  36%|███▋      | 440/1208 [12:40<22:08,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00581, train/loss_vlb_step=2.94e-5, train/loss_step=0.00581, global_step=7659.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  37%|███▋      | 441/1208 [12:42<22:05,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00581, train/loss_vlb_step=2.94e-5, train/loss_step=0.00581, global_step=7659.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  37%|███▋      | 441/1208 [12:42<22:05,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.69e-5, train/loss_step=0.0241, global_step=7660.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  37%|███▋      | 442/1208 [12:43<22:02,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.69e-5, train/loss_step=0.0241, global_step=7660.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  37%|███▋      | 442/1208 [12:43<22:02,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00116, train/loss_step=0.263, global_step=7660.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  37%|███▋      | 443/1208 [12:44<21:59,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00116, train/loss_step=0.263, global_step=7660.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  37%|███▋      | 443/1208 [12:44<21:59,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00168, train/loss_step=0.277, global_step=7660.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  37%|███▋      | 444/1208 [12:47<22:00,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00168, train/loss_step=0.277, global_step=7660.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  37%|███▋      | 444/1208 [12:47<22:00,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.16e-5, train/loss_step=0.00197, global_step=7660.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  37%|███▋      | 445/1208 [12:48<21:57,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.16e-5, train/loss_step=0.00197, global_step=7660.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  37%|███▋      | 445/1208 [12:48<21:57,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0368, train/loss_vlb_step=0.000133, train/loss_step=0.0368, global_step=7661.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  37%|███▋      | 446/1208 [12:49<21:54,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0368, train/loss_vlb_step=0.000133, train/loss_step=0.0368, global_step=7661.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  37%|███▋      | 446/1208 [12:49<21:54,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000642, train/loss_step=0.183, global_step=7661.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  37%|███▋      | 447/1208 [12:50<21:52,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000642, train/loss_step=0.183, global_step=7661.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  37%|███▋      | 447/1208 [12:50<21:52,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000477, train/loss_step=0.144, global_step=7661.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  37%|███▋      | 448/1208 [12:54<21:53,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000477, train/loss_step=0.144, global_step=7661.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  37%|███▋      | 448/1208 [12:54<21:53,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0532, train/loss_vlb_step=0.000183, train/loss_step=0.0532, global_step=7661.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  37%|███▋      | 449/1208 [12:55<21:50,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0532, train/loss_vlb_step=0.000183, train/loss_step=0.0532, global_step=7661.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  37%|███▋      | 449/1208 [12:55<21:50,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=9.48e-6, train/loss_step=0.00158, global_step=7662.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  37%|███▋      | 450/1208 [12:56<21:47,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=9.48e-6, train/loss_step=0.00158, global_step=7662.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  37%|███▋      | 450/1208 [12:56<21:47,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00888, train/loss_vlb_step=4.36e-5, train/loss_step=0.00888, global_step=7662.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  37%|███▋      | 451/1208 [12:57<21:44,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00888, train/loss_vlb_step=4.36e-5, train/loss_step=0.00888, global_step=7662.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  37%|███▋      | 451/1208 [12:57<21:44,  1.72s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00175, train/loss_step=0.340, global_step=7662.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  37%|███▋      | 452/1208 [13:00<21:45,  1.73s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00175, train/loss_step=0.340, global_step=7662.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  37%|███▋      | 452/1208 [13:00<21:45,  1.73s/it, loss=0.102, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000799, train/loss_step=0.206, global_step=7662.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  38%|███▊      | 453/1208 [13:01<21:42,  1.73s/it, loss=0.102, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000799, train/loss_step=0.206, global_step=7662.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  38%|███▊      | 453/1208 [13:01<21:42,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.000139, train/loss_step=0.0362, global_step=7663.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  38%|███▊      | 454/1208 [13:02<21:39,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.000139, train/loss_step=0.0362, global_step=7663.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  38%|███▊      | 454/1208 [13:02<21:39,  1.72s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.68e-5, train/loss_step=0.00289, global_step=7663.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  38%|███▊      | 455/1208 [13:03<21:37,  1.72s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.68e-5, train/loss_step=0.00289, global_step=7663.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  38%|███▊      | 455/1208 [13:03<21:37,  1.72s/it, loss=0.0831, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=2.07e-5, train/loss_step=0.00361, global_step=7663.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  38%|███▊      | 456/1208 [13:07<21:37,  1.73s/it, loss=0.0831, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=2.07e-5, train/loss_step=0.00361, global_step=7663.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  38%|███▊      | 456/1208 [13:07<21:37,  1.73s/it, loss=0.0838, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.35e-5, train/loss_step=0.0174, global_step=7663.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  38%|███▊      | 457/1208 [13:08<21:35,  1.72s/it, loss=0.0838, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.35e-5, train/loss_step=0.0174, global_step=7663.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  38%|███▊      | 457/1208 [13:08<21:35,  1.72s/it, loss=0.0873, v_num=0, train/loss_simple_step=0.0979, train/loss_vlb_step=0.000322, train/loss_step=0.0979, global_step=7664.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  38%|███▊      | 458/1208 [13:09<21:32,  1.72s/it, loss=0.0873, v_num=0, train/loss_simple_step=0.0979, train/loss_vlb_step=0.000322, train/loss_step=0.0979, global_step=7664.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  38%|███▊      | 458/1208 [13:09<21:32,  1.72s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000508, train/loss_step=0.154, global_step=7664.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  38%|███▊      | 459/1208 [13:10<21:29,  1.72s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000508, train/loss_step=0.154, global_step=7664.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  38%|███▊      | 459/1208 [13:10<21:29,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000665, train/loss_step=0.190, global_step=7664.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  38%|███▊      | 460/1208 [13:13<21:30,  1.73s/it, loss=0.102, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000665, train/loss_step=0.190, global_step=7664.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  38%|███▊      | 460/1208 [13:13<21:30,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000808, train/loss_step=0.203, global_step=7664.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  38%|███▊      | 461/1208 [13:14<21:27,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000808, train/loss_step=0.203, global_step=7664.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  38%|███▊      | 461/1208 [13:14<21:27,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.02e-5, train/loss_step=0.0113, global_step=7665.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  38%|███▊      | 462/1208 [13:15<21:24,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.02e-5, train/loss_step=0.0113, global_step=7665.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  38%|███▊      | 462/1208 [13:15<21:24,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00132, train/loss_step=0.276, global_step=7665.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  38%|███▊      | 463/1208 [13:16<21:22,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00132, train/loss_step=0.276, global_step=7665.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  38%|███▊      | 463/1208 [13:16<21:22,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000836, train/loss_step=0.220, global_step=7665.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  38%|███▊      | 464/1208 [13:20<21:22,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000836, train/loss_step=0.220, global_step=7665.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  38%|███▊      | 464/1208 [13:20<21:22,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.453, train/loss_vlb_step=0.00458, train/loss_step=0.453, global_step=7665.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  38%|███▊      | 465/1208 [13:21<21:20,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.453, train/loss_vlb_step=0.00458, train/loss_step=0.453, global_step=7665.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  38%|███▊      | 465/1208 [13:21<21:20,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=8.11e-5, train/loss_step=0.0192, global_step=7666.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  39%|███▊      | 466/1208 [13:22<21:17,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=8.11e-5, train/loss_step=0.0192, global_step=7666.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  39%|███▊      | 466/1208 [13:22<21:17,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00178, train/loss_step=0.339, global_step=7666.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  39%|███▊      | 467/1208 [13:23<21:14,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00178, train/loss_step=0.339, global_step=7666.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  39%|███▊      | 467/1208 [13:23<21:14,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000587, train/loss_step=0.177, global_step=7666.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  39%|███▊      | 468/1208 [13:26<21:15,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000587, train/loss_step=0.177, global_step=7666.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  39%|███▊      | 468/1208 [13:26<21:15,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00386, train/loss_vlb_step=2.1e-5, train/loss_step=0.00386, global_step=7666.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  39%|███▉      | 469/1208 [13:27<21:12,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00386, train/loss_vlb_step=2.1e-5, train/loss_step=0.00386, global_step=7666.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  39%|███▉      | 469/1208 [13:27<21:12,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000104, train/loss_step=0.0263, global_step=7667.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  39%|███▉      | 470/1208 [13:28<21:09,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000104, train/loss_step=0.0263, global_step=7667.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  39%|███▉      | 470/1208 [13:28<21:09,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.91e-5, train/loss_step=0.0131, global_step=7667.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  39%|███▉      | 471/1208 [13:29<21:06,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.91e-5, train/loss_step=0.0131, global_step=7667.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  39%|███▉      | 471/1208 [13:29<21:06,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000111, train/loss_step=0.0279, global_step=7667.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  39%|███▉      | 472/1208 [13:32<21:07,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.000111, train/loss_step=0.0279, global_step=7667.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  39%|███▉      | 472/1208 [13:32<21:07,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.422, train/loss_vlb_step=0.00432, train/loss_step=0.422, global_step=7667.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  39%|███▉      | 473/1208 [13:33<21:04,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.422, train/loss_vlb_step=0.00432, train/loss_step=0.422, global_step=7667.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  39%|███▉      | 473/1208 [13:33<21:04,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.23e-5, train/loss_step=0.0197, global_step=7668.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  39%|███▉      | 474/1208 [13:35<21:02,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.23e-5, train/loss_step=0.0197, global_step=7668.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  39%|███▉      | 474/1208 [13:35<21:02,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.000149, train/loss_step=0.043, global_step=7668.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  39%|███▉      | 475/1208 [13:36<20:59,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.000149, train/loss_step=0.043, global_step=7668.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  39%|███▉      | 475/1208 [13:36<20:59,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00117, train/loss_step=0.243, global_step=7668.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  39%|███▉      | 476/1208 [13:39<21:00,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00117, train/loss_step=0.243, global_step=7668.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  39%|███▉      | 476/1208 [13:39<21:00,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.000225, train/loss_step=0.067, global_step=7668.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  39%|███▉      | 477/1208 [13:40<20:57,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.000225, train/loss_step=0.067, global_step=7668.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  39%|███▉      | 477/1208 [13:40<20:57,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00138, train/loss_step=0.268, global_step=7669.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  40%|███▉      | 478/1208 [13:41<20:54,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00138, train/loss_step=0.268, global_step=7669.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  40%|███▉      | 478/1208 [13:41<20:54,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00206, train/loss_step=0.333, global_step=7669.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  40%|███▉      | 479/1208 [13:42<20:52,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00206, train/loss_step=0.333, global_step=7669.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  40%|███▉      | 479/1208 [13:42<20:52,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000544, train/loss_step=0.163, global_step=7669.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  40%|███▉      | 480/1208 [13:45<20:52,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000544, train/loss_step=0.163, global_step=7669.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  40%|███▉      | 480/1208 [13:45<20:52,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00108, train/loss_step=0.247, global_step=7669.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  40%|███▉      | 481/1208 [13:47<20:50,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00108, train/loss_step=0.247, global_step=7669.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  40%|███▉      | 481/1208 [13:47<20:50,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.25e-5, train/loss_step=0.0235, global_step=7670.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  40%|███▉      | 482/1208 [13:48<20:47,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.25e-5, train/loss_step=0.0235, global_step=7670.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  40%|███▉      | 482/1208 [13:48<20:47,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000383, train/loss_step=0.116, global_step=7670.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  40%|███▉      | 483/1208 [13:49<20:44,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000383, train/loss_step=0.116, global_step=7670.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  40%|███▉      | 483/1208 [13:49<20:44,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00116, train/loss_step=0.266, global_step=7670.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  40%|████      | 484/1208 [13:52<20:45,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00116, train/loss_step=0.266, global_step=7670.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  40%|████      | 484/1208 [13:52<20:45,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000551, train/loss_step=0.166, global_step=7670.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  40%|████      | 485/1208 [13:53<20:42,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000551, train/loss_step=0.166, global_step=7670.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  40%|████      | 485/1208 [13:53<20:42,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00127, train/loss_step=0.265, global_step=7671.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  40%|████      | 486/1208 [13:54<20:39,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00127, train/loss_step=0.265, global_step=7671.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  40%|████      | 486/1208 [13:54<20:39,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.644, train/loss_vlb_step=0.020, train/loss_step=0.644, global_step=7671.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  40%|████      | 487/1208 [13:55<20:37,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.644, train/loss_vlb_step=0.020, train/loss_step=0.644, global_step=7671.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  40%|████      | 487/1208 [13:55<20:37,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000106, train/loss_step=0.0274, global_step=7671.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  40%|████      | 488/1208 [13:58<20:37,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000106, train/loss_step=0.0274, global_step=7671.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  40%|████      | 488/1208 [13:58<20:37,  1.72s/it, loss=0.187, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00219, train/loss_step=0.357, global_step=7671.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  40%|████      | 489/1208 [13:59<20:34,  1.72s/it, loss=0.187, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00219, train/loss_step=0.357, global_step=7671.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  40%|████      | 489/1208 [13:59<20:34,  1.72s/it, loss=0.195, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000703, train/loss_step=0.187, global_step=7672.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  41%|████      | 490/1208 [14:00<20:32,  1.72s/it, loss=0.195, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000703, train/loss_step=0.187, global_step=7672.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  41%|████      | 490/1208 [14:00<20:32,  1.72s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.000235, train/loss_step=0.0702, global_step=7672.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  41%|████      | 491/1208 [14:02<20:29,  1.71s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0702, train/loss_vlb_step=0.000235, train/loss_step=0.0702, global_step=7672.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  41%|████      | 491/1208 [14:02<20:29,  1.71s/it, loss=0.218, v_num=0, train/loss_simple_step=0.424, train/loss_vlb_step=0.00304, train/loss_step=0.424, global_step=7672.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  41%|████      | 492/1208 [14:05<20:30,  1.72s/it, loss=0.218, v_num=0, train/loss_simple_step=0.424, train/loss_vlb_step=0.00304, train/loss_step=0.424, global_step=7672.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  41%|████      | 492/1208 [14:05<20:30,  1.72s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.56e-5, train/loss_step=0.0121, global_step=7672.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  41%|████      | 493/1208 [14:06<20:27,  1.72s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.56e-5, train/loss_step=0.0121, global_step=7672.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  41%|████      | 493/1208 [14:06<20:27,  1.72s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00752, train/loss_vlb_step=3.61e-5, train/loss_step=0.00752, global_step=7673.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  41%|████      | 494/1208 [14:07<20:24,  1.72s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00752, train/loss_vlb_step=3.61e-5, train/loss_step=0.00752, global_step=7673.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  41%|████      | 494/1208 [14:07<20:24,  1.72s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00472, train/loss_vlb_step=2.43e-5, train/loss_step=0.00472, global_step=7673.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  41%|████      | 495/1208 [14:08<20:22,  1.71s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00472, train/loss_vlb_step=2.43e-5, train/loss_step=0.00472, global_step=7673.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  41%|████      | 495/1208 [14:08<20:22,  1.71s/it, loss=0.215, v_num=0, train/loss_simple_step=0.662, train/loss_vlb_step=0.0185, train/loss_step=0.662, global_step=7673.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]     Epoch 25:  41%|████      | 496/1208 [14:11<20:22,  1.72s/it, loss=0.215, v_num=0, train/loss_simple_step=0.662, train/loss_vlb_step=0.0185, train/loss_step=0.662, global_step=7673.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  41%|████      | 496/1208 [14:11<20:22,  1.72s/it, loss=0.226, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00127, train/loss_step=0.280, global_step=7673.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  41%|████      | 497/1208 [14:13<20:20,  1.72s/it, loss=0.226, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00127, train/loss_step=0.280, global_step=7673.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  41%|████      | 497/1208 [14:13<20:20,  1.72s/it, loss=0.218, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000334, train/loss_step=0.100, global_step=7674.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  41%|████      | 498/1208 [14:14<20:17,  1.71s/it, loss=0.218, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000334, train/loss_step=0.100, global_step=7674.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  41%|████      | 498/1208 [14:14<20:17,  1.72s/it, loss=0.201, v_num=0, train/loss_simple_step=0.00616, train/loss_vlb_step=3.05e-5, train/loss_step=0.00616, global_step=7674.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  41%|████▏     | 499/1208 [14:15<20:15,  1.71s/it, loss=0.201, v_num=0, train/loss_simple_step=0.00616, train/loss_vlb_step=3.05e-5, train/loss_step=0.00616, global_step=7674.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  41%|████▏     | 499/1208 [14:15<20:15,  1.71s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0728, train/loss_vlb_step=0.000242, train/loss_step=0.0728, global_step=7674.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  41%|████▏     | 500/1208 [14:18<20:15,  1.72s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0728, train/loss_vlb_step=0.000242, train/loss_step=0.0728, global_step=7674.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  41%|████▏     | 500/1208 [14:18<20:15,  1.72s/it, loss=0.198, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00106, train/loss_step=0.261, global_step=7674.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  41%|████▏     | 501/1208 [14:19<20:12,  1.72s/it, loss=0.198, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00106, train/loss_step=0.261, global_step=7674.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  41%|████▏     | 501/1208 [14:19<20:12,  1.72s/it, loss=0.204, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000518, train/loss_step=0.152, global_step=7675.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  42%|████▏     | 502/1208 [14:20<20:10,  1.71s/it, loss=0.204, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000518, train/loss_step=0.152, global_step=7675.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  42%|████▏     | 502/1208 [14:20<20:10,  1.71s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000116, train/loss_step=0.0302, global_step=7675.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  42%|████▏     | 503/1208 [14:21<20:07,  1.71s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000116, train/loss_step=0.0302, global_step=7675.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  42%|████▏     | 503/1208 [14:21<20:07,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0573, train/loss_vlb_step=0.000199, train/loss_step=0.0573, global_step=7675.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  42%|████▏     | 504/1208 [14:24<20:07,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0573, train/loss_vlb_step=0.000199, train/loss_step=0.0573, global_step=7675.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  42%|████▏     | 504/1208 [14:24<20:07,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.4e-5, train/loss_step=0.0176, global_step=7675.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  42%|████▏     | 505/1208 [14:25<20:05,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.4e-5, train/loss_step=0.0176, global_step=7675.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  42%|████▏     | 505/1208 [14:25<20:05,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000132, train/loss_step=0.0335, global_step=7676.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  42%|████▏     | 506/1208 [14:26<20:02,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000132, train/loss_step=0.0335, global_step=7676.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  42%|████▏     | 506/1208 [14:26<20:02,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00534, train/loss_vlb_step=2.79e-5, train/loss_step=0.00534, global_step=7676.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  42%|████▏     | 507/1208 [14:28<20:00,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00534, train/loss_vlb_step=2.79e-5, train/loss_step=0.00534, global_step=7676.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  42%|████▏     | 507/1208 [14:28<20:00,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0988, train/loss_vlb_step=0.000325, train/loss_step=0.0988, global_step=7676.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  42%|████▏     | 508/1208 [14:31<20:00,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0988, train/loss_vlb_step=0.000325, train/loss_step=0.0988, global_step=7676.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  42%|████▏     | 508/1208 [14:31<20:00,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=7676.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  42%|████▏     | 509/1208 [14:32<19:58,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=7676.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  42%|████▏     | 509/1208 [14:32<19:58,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000128, train/loss_step=0.0332, global_step=7677.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  42%|████▏     | 510/1208 [14:33<19:55,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000128, train/loss_step=0.0332, global_step=7677.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  42%|████▏     | 510/1208 [14:33<19:55,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000491, train/loss_step=0.144, global_step=7677.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  42%|████▏     | 511/1208 [14:34<19:52,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000491, train/loss_step=0.144, global_step=7677.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  42%|████▏     | 511/1208 [14:34<19:52,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00162, train/loss_step=0.296, global_step=7677.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  42%|████▏     | 512/1208 [14:37<19:53,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00162, train/loss_step=0.296, global_step=7677.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  42%|████▏     | 512/1208 [14:37<19:53,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00103, train/loss_step=0.274, global_step=7677.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  42%|████▏     | 513/1208 [14:38<19:50,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00103, train/loss_step=0.274, global_step=7677.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  42%|████▏     | 513/1208 [14:38<19:50,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1.29e-5, train/loss_step=0.00226, global_step=7678.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  43%|████▎     | 514/1208 [14:39<19:47,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1.29e-5, train/loss_step=0.00226, global_step=7678.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  43%|████▎     | 514/1208 [14:39<19:47,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000122, train/loss_step=0.0319, global_step=7678.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  43%|████▎     | 515/1208 [14:40<19:45,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000122, train/loss_step=0.0319, global_step=7678.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  43%|████▎     | 515/1208 [14:40<19:45,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000551, train/loss_step=0.167, global_step=7678.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  43%|████▎     | 516/1208 [14:44<19:45,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000551, train/loss_step=0.167, global_step=7678.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  43%|████▎     | 516/1208 [14:44<19:45,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.0047, train/loss_step=0.458, global_step=7678.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  43%|████▎     | 517/1208 [14:45<19:43,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.0047, train/loss_step=0.458, global_step=7678.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  43%|████▎     | 517/1208 [14:45<19:43,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000619, train/loss_step=0.177, global_step=7679.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  43%|████▎     | 518/1208 [14:46<19:40,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000619, train/loss_step=0.177, global_step=7679.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  43%|████▎     | 518/1208 [14:46<19:40,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.36e-5, train/loss_step=0.0194, global_step=7679.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  43%|████▎     | 519/1208 [14:47<19:38,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.36e-5, train/loss_step=0.0194, global_step=7679.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  43%|████▎     | 519/1208 [14:47<19:38,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00174, train/loss_step=0.354, global_step=7679.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  43%|████▎     | 520/1208 [14:50<19:38,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00174, train/loss_step=0.354, global_step=7679.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  43%|████▎     | 520/1208 [14:50<19:38,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000825, train/loss_step=0.206, global_step=7679.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  43%|████▎     | 521/1208 [14:51<19:35,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000825, train/loss_step=0.206, global_step=7679.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  43%|████▎     | 521/1208 [14:51<19:35,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=7680.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  43%|████▎     | 522/1208 [14:52<19:33,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=7680.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  43%|████▎     | 522/1208 [14:52<19:33,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.660, train/loss_vlb_step=0.0286, train/loss_step=0.660, global_step=7680.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  43%|████▎     | 523/1208 [14:53<19:30,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.660, train/loss_vlb_step=0.0286, train/loss_step=0.660, global_step=7680.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  43%|████▎     | 523/1208 [14:53<19:30,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.81e-5, train/loss_step=0.0103, global_step=7680.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  43%|████▎     | 524/1208 [14:57<19:31,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.81e-5, train/loss_step=0.0103, global_step=7680.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  43%|████▎     | 524/1208 [14:57<19:31,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000781, train/loss_step=0.202, global_step=7680.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  43%|████▎     | 525/1208 [14:58<19:28,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000781, train/loss_step=0.202, global_step=7680.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  43%|████▎     | 525/1208 [14:58<19:28,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.19e-5, train/loss_step=0.0145, global_step=7681.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  44%|████▎     | 526/1208 [14:59<19:26,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.19e-5, train/loss_step=0.0145, global_step=7681.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  44%|████▎     | 526/1208 [14:59<19:26,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.77e-5, train/loss_step=0.0105, global_step=7681.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  44%|████▎     | 527/1208 [15:00<19:23,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.77e-5, train/loss_step=0.0105, global_step=7681.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  44%|████▎     | 527/1208 [15:00<19:23,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.0016, train/loss_step=0.304, global_step=7681.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  44%|████▎     | 528/1208 [15:03<19:23,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.0016, train/loss_step=0.304, global_step=7681.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  44%|████▎     | 528/1208 [15:03<19:23,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.9e-5, train/loss_step=0.00352, global_step=7681.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  44%|████▍     | 529/1208 [15:04<19:21,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.9e-5, train/loss_step=0.00352, global_step=7681.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  44%|████▍     | 529/1208 [15:04<19:21,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0946, train/loss_vlb_step=0.000313, train/loss_step=0.0946, global_step=7682.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  44%|████▍     | 530/1208 [15:05<19:18,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0946, train/loss_vlb_step=0.000313, train/loss_step=0.0946, global_step=7682.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  44%|████▍     | 530/1208 [15:05<19:18,  1.71s/it, loss=0.21, v_num=0, train/loss_simple_step=0.807, train/loss_vlb_step=0.136, train/loss_step=0.807, global_step=7682.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]      Epoch 25:  44%|████▍     | 531/1208 [15:06<19:16,  1.71s/it, loss=0.21, v_num=0, train/loss_simple_step=0.807, train/loss_vlb_step=0.136, train/loss_step=0.807, global_step=7682.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  44%|████▍     | 531/1208 [15:06<19:16,  1.71s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000129, train/loss_step=0.0358, global_step=7682.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  44%|████▍     | 532/1208 [15:10<19:16,  1.71s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000129, train/loss_step=0.0358, global_step=7682.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  44%|████▍     | 532/1208 [15:10<19:16,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000501, train/loss_step=0.146, global_step=7682.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  44%|████▍     | 533/1208 [15:11<19:14,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000501, train/loss_step=0.146, global_step=7682.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  44%|████▍     | 533/1208 [15:11<19:14,  1.71s/it, loss=0.199, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000612, train/loss_step=0.178, global_step=7683.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  44%|████▍     | 534/1208 [15:12<19:11,  1.71s/it, loss=0.199, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000612, train/loss_step=0.178, global_step=7683.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  44%|████▍     | 534/1208 [15:12<19:11,  1.71s/it, loss=0.206, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000589, train/loss_step=0.166, global_step=7683.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  44%|████▍     | 535/1208 [15:13<19:08,  1.71s/it, loss=0.206, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000589, train/loss_step=0.166, global_step=7683.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  44%|████▍     | 535/1208 [15:13<19:08,  1.71s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=1.08e-5, train/loss_step=0.00183, global_step=7683.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  44%|████▍     | 536/1208 [15:16<19:09,  1.71s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=1.08e-5, train/loss_step=0.00183, global_step=7683.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  44%|████▍     | 536/1208 [15:16<19:09,  1.71s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00758, train/loss_vlb_step=3.71e-5, train/loss_step=0.00758, global_step=7683.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  44%|████▍     | 537/1208 [15:17<19:06,  1.71s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00758, train/loss_vlb_step=3.71e-5, train/loss_step=0.00758, global_step=7683.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  44%|████▍     | 537/1208 [15:17<19:06,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000383, train/loss_step=0.117, global_step=7684.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  45%|████▍     | 538/1208 [15:18<19:04,  1.71s/it, loss=0.172, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000383, train/loss_step=0.117, global_step=7684.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  45%|████▍     | 538/1208 [15:18<19:04,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0564, train/loss_vlb_step=0.000192, train/loss_step=0.0564, global_step=7684.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  45%|████▍     | 539/1208 [15:19<19:01,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0564, train/loss_vlb_step=0.000192, train/loss_step=0.0564, global_step=7684.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  45%|████▍     | 539/1208 [15:19<19:01,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.634, train/loss_vlb_step=0.0109, train/loss_step=0.634, global_step=7684.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  45%|████▍     | 540/1208 [15:23<19:01,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.634, train/loss_vlb_step=0.0109, train/loss_step=0.634, global_step=7684.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  45%|████▍     | 540/1208 [15:23<19:01,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000133, train/loss_step=0.0344, global_step=7684.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  45%|████▍     | 541/1208 [15:24<18:59,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000133, train/loss_step=0.0344, global_step=7684.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  45%|████▍     | 541/1208 [15:24<18:59,  1.71s/it, loss=0.194, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00296, train/loss_step=0.394, global_step=7685.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  45%|████▍     | 542/1208 [15:25<18:57,  1.71s/it, loss=0.194, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00296, train/loss_step=0.394, global_step=7685.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  45%|████▍     | 542/1208 [15:25<18:57,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000405, train/loss_step=0.123, global_step=7685.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  45%|████▍     | 543/1208 [15:26<18:54,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000405, train/loss_step=0.123, global_step=7685.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  45%|████▍     | 543/1208 [15:26<18:54,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000423, train/loss_step=0.127, global_step=7685.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  45%|████▌     | 544/1208 [15:29<18:54,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000423, train/loss_step=0.127, global_step=7685.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  45%|████▌     | 544/1208 [15:29<18:54,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.053, train/loss_vlb_step=0.000183, train/loss_step=0.053, global_step=7685.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  45%|████▌     | 545/1208 [15:30<18:52,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.053, train/loss_vlb_step=0.000183, train/loss_step=0.053, global_step=7685.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  45%|████▌     | 545/1208 [15:30<18:52,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0669, train/loss_vlb_step=0.000226, train/loss_step=0.0669, global_step=7686.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  45%|████▌     | 546/1208 [15:31<18:49,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0669, train/loss_vlb_step=0.000226, train/loss_step=0.0669, global_step=7686.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  45%|████▌     | 546/1208 [15:31<18:49,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000468, train/loss_step=0.137, global_step=7686.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  45%|████▌     | 547/1208 [15:32<18:47,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000468, train/loss_step=0.137, global_step=7686.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  45%|████▌     | 547/1208 [15:32<18:47,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0897, train/loss_vlb_step=0.000301, train/loss_step=0.0897, global_step=7686.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  45%|████▌     | 548/1208 [15:36<18:47,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0897, train/loss_vlb_step=0.000301, train/loss_step=0.0897, global_step=7686.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  45%|████▌     | 548/1208 [15:36<18:47,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000671, train/loss_step=0.191, global_step=7686.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  45%|████▌     | 549/1208 [15:37<18:44,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000671, train/loss_step=0.191, global_step=7686.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  45%|████▌     | 549/1208 [15:37<18:44,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.33e-5, train/loss_step=0.00236, global_step=7687.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  46%|████▌     | 550/1208 [15:38<18:42,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.33e-5, train/loss_step=0.00236, global_step=7687.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  46%|████▌     | 550/1208 [15:38<18:42,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00385, train/loss_vlb_step=2.1e-5, train/loss_step=0.00385, global_step=7687.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  46%|████▌     | 551/1208 [15:39<18:39,  1.70s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00385, train/loss_vlb_step=2.1e-5, train/loss_step=0.00385, global_step=7687.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  46%|████▌     | 551/1208 [15:39<18:39,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=2.03e-5, train/loss_step=0.00373, global_step=7687.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  46%|████▌     | 552/1208 [15:42<18:40,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=2.03e-5, train/loss_step=0.00373, global_step=7687.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  46%|████▌     | 552/1208 [15:42<18:40,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.524, train/loss_vlb_step=0.00758, train/loss_step=0.524, global_step=7687.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  46%|████▌     | 553/1208 [15:43<18:37,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.524, train/loss_vlb_step=0.00758, train/loss_step=0.524, global_step=7687.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  46%|████▌     | 553/1208 [15:43<18:37,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=9.77e-5, train/loss_step=0.0244, global_step=7688.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  46%|████▌     | 554/1208 [15:44<18:35,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=9.77e-5, train/loss_step=0.0244, global_step=7688.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  46%|████▌     | 554/1208 [15:44<18:35,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000639, train/loss_step=0.178, global_step=7688.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  46%|████▌     | 555/1208 [15:45<18:32,  1.70s/it, loss=0.138, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000639, train/loss_step=0.178, global_step=7688.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  46%|████▌     | 555/1208 [15:45<18:32,  1.70s/it, loss=0.144, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000401, train/loss_step=0.121, global_step=7688.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  46%|████▌     | 556/1208 [15:48<18:32,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000401, train/loss_step=0.121, global_step=7688.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  46%|████▌     | 556/1208 [15:48<18:32,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00107, train/loss_step=0.264, global_step=7688.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  46%|████▌     | 557/1208 [15:50<18:30,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00107, train/loss_step=0.264, global_step=7688.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  46%|████▌     | 557/1208 [15:50<18:30,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00144, train/loss_step=0.297, global_step=7689.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  46%|████▌     | 558/1208 [15:51<18:27,  1.70s/it, loss=0.166, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00144, train/loss_step=0.297, global_step=7689.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  46%|████▌     | 558/1208 [15:51<18:27,  1.70s/it, loss=0.174, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000769, train/loss_step=0.206, global_step=7689.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  46%|████▋     | 559/1208 [15:52<18:25,  1.70s/it, loss=0.174, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000769, train/loss_step=0.206, global_step=7689.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  46%|████▋     | 559/1208 [15:52<18:25,  1.70s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.39e-5, train/loss_step=0.0241, global_step=7689.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  46%|████▋     | 560/1208 [15:55<18:25,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.39e-5, train/loss_step=0.0241, global_step=7689.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  46%|████▋     | 560/1208 [15:55<18:25,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0873, train/loss_vlb_step=0.000291, train/loss_step=0.0873, global_step=7689.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  46%|████▋     | 561/1208 [15:56<18:23,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0873, train/loss_vlb_step=0.000291, train/loss_step=0.0873, global_step=7689.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  46%|████▋     | 561/1208 [15:56<18:23,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00329, train/loss_step=0.401, global_step=7690.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  47%|████▋     | 562/1208 [15:57<18:20,  1.70s/it, loss=0.146, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00329, train/loss_step=0.401, global_step=7690.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  47%|████▋     | 562/1208 [15:57<18:20,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00195, train/loss_step=0.346, global_step=7690.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  47%|████▋     | 563/1208 [15:58<18:18,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00195, train/loss_step=0.346, global_step=7690.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  47%|████▋     | 563/1208 [15:58<18:18,  1.70s/it, loss=0.157, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000367, train/loss_step=0.112, global_step=7690.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  47%|████▋     | 564/1208 [16:01<18:18,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000367, train/loss_step=0.112, global_step=7690.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  47%|████▋     | 564/1208 [16:01<18:18,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00132, train/loss_step=0.273, global_step=7690.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  47%|████▋     | 565/1208 [16:02<18:15,  1.70s/it, loss=0.168, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00132, train/loss_step=0.273, global_step=7690.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  47%|████▋     | 565/1208 [16:02<18:15,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000568, train/loss_step=0.166, global_step=7691.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  47%|████▋     | 566/1208 [16:04<18:13,  1.70s/it, loss=0.173, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000568, train/loss_step=0.166, global_step=7691.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  47%|████▋     | 566/1208 [16:04<18:13,  1.70s/it, loss=0.189, v_num=0, train/loss_simple_step=0.466, train/loss_vlb_step=0.00332, train/loss_step=0.466, global_step=7691.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  47%|████▋     | 567/1208 [16:05<18:11,  1.70s/it, loss=0.189, v_num=0, train/loss_simple_step=0.466, train/loss_vlb_step=0.00332, train/loss_step=0.466, global_step=7691.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  47%|████▋     | 567/1208 [16:05<18:11,  1.70s/it, loss=0.197, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.00102, train/loss_step=0.241, global_step=7691.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  47%|████▋     | 568/1208 [16:08<18:11,  1.71s/it, loss=0.197, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.00102, train/loss_step=0.241, global_step=7691.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  47%|████▋     | 568/1208 [16:08<18:11,  1.71s/it, loss=0.196, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.0006, train/loss_step=0.173, global_step=7691.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  47%|████▋     | 569/1208 [16:09<18:08,  1.70s/it, loss=0.196, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.0006, train/loss_step=0.173, global_step=7691.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  47%|████▋     | 569/1208 [16:09<18:08,  1.70s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0864, train/loss_vlb_step=0.000287, train/loss_step=0.0864, global_step=7692.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  47%|████▋     | 570/1208 [16:10<18:06,  1.70s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0864, train/loss_vlb_step=0.000287, train/loss_step=0.0864, global_step=7692.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  47%|████▋     | 570/1208 [16:10<18:06,  1.70s/it, loss=0.214, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00156, train/loss_step=0.286, global_step=7692.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  47%|████▋     | 571/1208 [16:11<18:03,  1.70s/it, loss=0.214, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00156, train/loss_step=0.286, global_step=7692.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  47%|████▋     | 571/1208 [16:11<18:03,  1.70s/it, loss=0.219, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=7692.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  47%|████▋     | 572/1208 [16:14<18:03,  1.70s/it, loss=0.219, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=7692.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  47%|████▋     | 572/1208 [16:14<18:03,  1.70s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00841, train/loss_vlb_step=3.96e-5, train/loss_step=0.00841, global_step=7692.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  47%|████▋     | 573/1208 [16:15<18:01,  1.70s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00841, train/loss_vlb_step=3.96e-5, train/loss_step=0.00841, global_step=7692.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  47%|████▋     | 573/1208 [16:15<18:01,  1.70s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000149, train/loss_step=0.0416, global_step=7693.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  48%|████▊     | 574/1208 [16:16<17:59,  1.70s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0416, train/loss_vlb_step=0.000149, train/loss_step=0.0416, global_step=7693.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  48%|████▊     | 574/1208 [16:16<17:59,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.24e-5, train/loss_step=0.00216, global_step=7693.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  48%|████▊     | 575/1208 [16:18<17:56,  1.70s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.24e-5, train/loss_step=0.00216, global_step=7693.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  48%|████▊     | 575/1208 [16:18<17:56,  1.70s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0509, train/loss_vlb_step=0.000181, train/loss_step=0.0509, global_step=7693.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  48%|████▊     | 576/1208 [16:21<17:56,  1.70s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0509, train/loss_vlb_step=0.000181, train/loss_step=0.0509, global_step=7693.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  48%|████▊     | 576/1208 [16:21<17:56,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000112, train/loss_step=0.0287, global_step=7693.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  48%|████▊     | 577/1208 [16:22<17:54,  1.70s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000112, train/loss_step=0.0287, global_step=7693.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  48%|████▊     | 577/1208 [16:22<17:54,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0836, train/loss_vlb_step=0.000278, train/loss_step=0.0836, global_step=7694.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  48%|████▊     | 578/1208 [16:23<17:51,  1.70s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0836, train/loss_vlb_step=0.000278, train/loss_step=0.0836, global_step=7694.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  48%|████▊     | 578/1208 [16:23<17:51,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=6.18e-5, train/loss_step=0.013, global_step=7694.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  48%|████▊     | 579/1208 [16:24<17:49,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=6.18e-5, train/loss_step=0.013, global_step=7694.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  48%|████▊     | 579/1208 [16:24<17:49,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0935, train/loss_vlb_step=0.000307, train/loss_step=0.0935, global_step=7694.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  48%|████▊     | 580/1208 [16:27<17:49,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0935, train/loss_vlb_step=0.000307, train/loss_step=0.0935, global_step=7694.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  48%|████▊     | 580/1208 [16:27<17:49,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00703, train/loss_vlb_step=3.42e-5, train/loss_step=0.00703, global_step=7694.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  48%|████▊     | 581/1208 [16:28<17:47,  1.70s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00703, train/loss_vlb_step=3.42e-5, train/loss_step=0.00703, global_step=7694.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  48%|████▊     | 581/1208 [16:28<17:47,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=0.000102, train/loss_step=0.025, global_step=7695.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  48%|████▊     | 582/1208 [16:29<17:44,  1.70s/it, loss=0.13, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=0.000102, train/loss_step=0.025, global_step=7695.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  48%|████▊     | 582/1208 [16:29<17:44,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00169, train/loss_step=0.314, global_step=7695.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  48%|████▊     | 583/1208 [16:30<17:42,  1.70s/it, loss=0.129, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00169, train/loss_step=0.314, global_step=7695.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  48%|████▊     | 583/1208 [16:30<17:42,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.0008, train/loss_step=0.206, global_step=7695.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  48%|████▊     | 584/1208 [16:34<17:42,  1.70s/it, loss=0.133, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.0008, train/loss_step=0.206, global_step=7695.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  48%|████▊     | 584/1208 [16:34<17:42,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.0001, train/loss_step=0.0249, global_step=7695.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  48%|████▊     | 585/1208 [16:35<17:39,  1.70s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.0001, train/loss_step=0.0249, global_step=7695.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  48%|████▊     | 585/1208 [16:35<17:39,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00122, train/loss_step=0.286, global_step=7696.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  49%|████▊     | 586/1208 [16:36<17:37,  1.70s/it, loss=0.127, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00122, train/loss_step=0.286, global_step=7696.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  49%|████▊     | 586/1208 [16:36<17:37,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000393, train/loss_step=0.119, global_step=7696.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  49%|████▊     | 587/1208 [16:37<17:35,  1.70s/it, loss=0.11, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000393, train/loss_step=0.119, global_step=7696.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  49%|████▊     | 587/1208 [16:37<17:35,  1.70s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.19e-5, train/loss_step=0.0229, global_step=7696.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  49%|████▊     | 588/1208 [16:40<17:35,  1.70s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.19e-5, train/loss_step=0.0229, global_step=7696.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  49%|████▊     | 588/1208 [16:40<17:35,  1.70s/it, loss=0.096, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000396, train/loss_step=0.121, global_step=7696.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  49%|████▉     | 589/1208 [16:41<17:32,  1.70s/it, loss=0.096, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000396, train/loss_step=0.121, global_step=7696.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  49%|████▉     | 589/1208 [16:41<17:32,  1.70s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000427, train/loss_step=0.128, global_step=7697.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  49%|████▉     | 590/1208 [16:42<17:30,  1.70s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000427, train/loss_step=0.128, global_step=7697.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  49%|████▉     | 590/1208 [16:42<17:30,  1.70s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.0655, train/loss_vlb_step=0.000232, train/loss_step=0.0655, global_step=7697.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  49%|████▉     | 591/1208 [16:43<17:28,  1.70s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.0655, train/loss_vlb_step=0.000232, train/loss_step=0.0655, global_step=7697.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  49%|████▉     | 591/1208 [16:43<17:28,  1.70s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000701, train/loss_step=0.204, global_step=7697.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  49%|████▉     | 592/1208 [16:47<17:27,  1.70s/it, loss=0.0922, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000701, train/loss_step=0.204, global_step=7697.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  49%|████▉     | 592/1208 [16:47<17:27,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00107, train/loss_step=0.267, global_step=7697.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  49%|████▉     | 593/1208 [16:48<17:25,  1.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00107, train/loss_step=0.267, global_step=7697.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  49%|████▉     | 593/1208 [16:48<17:25,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0506, train/loss_vlb_step=0.000179, train/loss_step=0.0506, global_step=7698.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  49%|████▉     | 594/1208 [16:49<17:23,  1.70s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0506, train/loss_vlb_step=0.000179, train/loss_step=0.0506, global_step=7698.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  49%|████▉     | 594/1208 [16:49<17:23,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00138, train/loss_step=0.332, global_step=7698.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  49%|████▉     | 595/1208 [16:50<17:20,  1.70s/it, loss=0.122, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00138, train/loss_step=0.332, global_step=7698.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  49%|████▉     | 595/1208 [16:50<17:20,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.47e-5, train/loss_step=0.0121, global_step=7698.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  49%|████▉     | 596/1208 [16:53<17:20,  1.70s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.47e-5, train/loss_step=0.0121, global_step=7698.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  49%|████▉     | 596/1208 [16:53<17:20,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00114, train/loss_step=0.272, global_step=7698.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  49%|████▉     | 597/1208 [16:54<17:18,  1.70s/it, loss=0.132, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00114, train/loss_step=0.272, global_step=7698.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  49%|████▉     | 597/1208 [16:54<17:18,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000959, train/loss_step=0.241, global_step=7699.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  50%|████▉     | 598/1208 [16:55<17:16,  1.70s/it, loss=0.14, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000959, train/loss_step=0.241, global_step=7699.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  50%|████▉     | 598/1208 [16:55<17:16,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00106, train/loss_step=0.259, global_step=7699.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  50%|████▉     | 599/1208 [16:56<17:13,  1.70s/it, loss=0.153, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00106, train/loss_step=0.259, global_step=7699.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  50%|████▉     | 599/1208 [16:56<17:13,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0397, train/loss_vlb_step=0.000142, train/loss_step=0.0397, global_step=7699.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  50%|████▉     | 600/1208 [17:00<17:13,  1.70s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0397, train/loss_vlb_step=0.000142, train/loss_step=0.0397, global_step=7699.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  50%|████▉     | 600/1208 [17:00<17:13,  1.70s/it, loss=0.182, v_num=0, train/loss_simple_step=0.642, train/loss_vlb_step=0.0164, train/loss_step=0.642, global_step=7699.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.73it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.70it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:30,  1.63it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:28,  1.70it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:28,  1.67it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:28,  1.68it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.68it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.77it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.71it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.73it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:26,  1.71it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:26,  1.73it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.74it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.72it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.74it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:25,  1.71it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.75it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.73it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.74it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.72it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.75it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:23,  1.73it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.75it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.74it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.76it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.75it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.75it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.76it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.76it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.75it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.76it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.74it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:20,  1.73it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.78it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.74it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.74it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.78it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.74it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.73it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.74it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.74it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:16,  1.75it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.75it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.75it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:14,  1.78it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:14<00:13,  1.79it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.75it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.78it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.76it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.75it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:16<00:12,  1.74it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:12,  1.73it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.78it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.73it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:11,  1.72it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.78it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.73it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.80it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:19<00:09,  1.73it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.74it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:20<00:08,  1.73it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.78it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:08,  1.73it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.74it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.74it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.78it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.77it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.73it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.75it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.78it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.78it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:23<00:05,  1.74it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.78it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.74it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.78it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:24<00:04,  1.75it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.78it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.75it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.74it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.78it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.72it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.73it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.78it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:27<00:01,  1.73it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.74it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:28<00:00,  1.72it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.68it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.73it/s]Epoch 25:  50%|████▉     | 601/1208 [17:31<17:42,  1.75s/it, loss=0.182, v_num=0, train/loss_simple_step=0.642, train/loss_vlb_step=0.0164, train/loss_step=0.642, global_step=7699.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  50%|████▉     | 601/1208 [17:31<17:42,  1.75s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0877, train/loss_vlb_step=0.000289, train/loss_step=0.0877, global_step=7700.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  50%|████▉     | 602/1208 [17:32<17:39,  1.75s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0877, train/loss_vlb_step=0.000289, train/loss_step=0.0877, global_step=7700.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  50%|████▉     | 602/1208 [17:32<17:39,  1.75s/it, loss=0.175, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000419, train/loss_step=0.128, global_step=7700.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  50%|████▉     | 603/1208 [17:33<17:37,  1.75s/it, loss=0.175, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000419, train/loss_step=0.128, global_step=7700.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  50%|████▉     | 603/1208 [17:33<17:37,  1.75s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.65e-5, train/loss_step=0.00291, global_step=7700.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  50%|█████     | 604/1208 [17:36<17:36,  1.75s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.65e-5, train/loss_step=0.00291, global_step=7700.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  50%|█████     | 604/1208 [17:36<17:36,  1.75s/it, loss=0.175, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000822, train/loss_step=0.221, global_step=7700.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  50%|█████     | 605/1208 [17:37<17:34,  1.75s/it, loss=0.175, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000822, train/loss_step=0.221, global_step=7700.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  50%|█████     | 605/1208 [17:37<17:34,  1.75s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0721, train/loss_vlb_step=0.000241, train/loss_step=0.0721, global_step=7701.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  50%|█████     | 606/1208 [17:38<17:31,  1.75s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0721, train/loss_vlb_step=0.000241, train/loss_step=0.0721, global_step=7701.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  50%|█████     | 606/1208 [17:38<17:31,  1.75s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000129, train/loss_step=0.0336, global_step=7701.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  50%|█████     | 607/1208 [17:39<17:29,  1.75s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000129, train/loss_step=0.0336, global_step=7701.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  50%|█████     | 607/1208 [17:39<17:29,  1.75s/it, loss=0.169, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000763, train/loss_step=0.208, global_step=7701.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  50%|█████     | 608/1208 [17:43<17:29,  1.75s/it, loss=0.169, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000763, train/loss_step=0.208, global_step=7701.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  50%|█████     | 608/1208 [17:43<17:29,  1.75s/it, loss=0.178, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00128, train/loss_step=0.297, global_step=7701.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  50%|█████     | 609/1208 [17:44<17:26,  1.75s/it, loss=0.178, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00128, train/loss_step=0.297, global_step=7701.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  50%|█████     | 609/1208 [17:44<17:26,  1.75s/it, loss=0.184, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000987, train/loss_step=0.246, global_step=7702.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  50%|█████     | 610/1208 [17:45<17:24,  1.75s/it, loss=0.184, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.000987, train/loss_step=0.246, global_step=7702.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  50%|█████     | 610/1208 [17:45<17:24,  1.75s/it, loss=0.186, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=7702.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  51%|█████     | 611/1208 [17:46<17:22,  1.75s/it, loss=0.186, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=7702.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  51%|█████     | 611/1208 [17:46<17:22,  1.75s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.23e-5, train/loss_step=0.0138, global_step=7702.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  51%|█████     | 612/1208 [17:49<17:21,  1.75s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.23e-5, train/loss_step=0.0138, global_step=7702.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  51%|█████     | 612/1208 [17:49<17:21,  1.75s/it, loss=0.173, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.00074, train/loss_step=0.194, global_step=7702.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  51%|█████     | 613/1208 [17:50<17:19,  1.75s/it, loss=0.173, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.00074, train/loss_step=0.194, global_step=7702.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  51%|█████     | 613/1208 [17:50<17:19,  1.75s/it, loss=0.196, v_num=0, train/loss_simple_step=0.510, train/loss_vlb_step=0.00934, train/loss_step=0.510, global_step=7703.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  51%|█████     | 614/1208 [17:51<17:17,  1.75s/it, loss=0.196, v_num=0, train/loss_simple_step=0.510, train/loss_vlb_step=0.00934, train/loss_step=0.510, global_step=7703.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  51%|█████     | 614/1208 [17:51<17:17,  1.75s/it, loss=0.195, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00166, train/loss_step=0.318, global_step=7703.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  51%|█████     | 615/1208 [17:53<17:14,  1.74s/it, loss=0.195, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00166, train/loss_step=0.318, global_step=7703.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  51%|█████     | 615/1208 [17:53<17:14,  1.74s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00711, train/loss_vlb_step=3.52e-5, train/loss_step=0.00711, global_step=7703.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  51%|█████     | 616/1208 [17:56<17:14,  1.75s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00711, train/loss_vlb_step=3.52e-5, train/loss_step=0.00711, global_step=7703.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  51%|█████     | 616/1208 [17:56<17:14,  1.75s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.0001, train/loss_step=0.0253, global_step=7703.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  51%|█████     | 617/1208 [17:57<17:11,  1.75s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.0001, train/loss_step=0.0253, global_step=7703.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  51%|█████     | 617/1208 [17:57<17:11,  1.75s/it, loss=0.186, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00154, train/loss_step=0.311, global_step=7704.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  51%|█████     | 618/1208 [17:58<17:09,  1.74s/it, loss=0.186, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00154, train/loss_step=0.311, global_step=7704.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  51%|█████     | 618/1208 [17:58<17:09,  1.74s/it, loss=0.177, v_num=0, train/loss_simple_step=0.083, train/loss_vlb_step=0.000279, train/loss_step=0.083, global_step=7704.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  51%|█████     | 619/1208 [17:59<17:07,  1.74s/it, loss=0.177, v_num=0, train/loss_simple_step=0.083, train/loss_vlb_step=0.000279, train/loss_step=0.083, global_step=7704.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  51%|█████     | 619/1208 [17:59<17:07,  1.74s/it, loss=0.194, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00359, train/loss_step=0.366, global_step=7704.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  51%|█████▏    | 620/1208 [18:02<17:06,  1.75s/it, loss=0.194, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00359, train/loss_step=0.366, global_step=7704.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  51%|█████▏    | 620/1208 [18:02<17:06,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=6.01e-5, train/loss_step=0.0131, global_step=7704.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  51%|█████▏    | 621/1208 [18:03<17:04,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=6.01e-5, train/loss_step=0.0131, global_step=7704.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  51%|█████▏    | 621/1208 [18:03<17:04,  1.75s/it, loss=0.169, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000955, train/loss_step=0.232, global_step=7705.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  51%|█████▏    | 622/1208 [18:04<17:02,  1.74s/it, loss=0.169, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000955, train/loss_step=0.232, global_step=7705.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  51%|█████▏    | 622/1208 [18:04<17:02,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000428, train/loss_step=0.130, global_step=7705.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  52%|█████▏    | 623/1208 [18:05<16:59,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000428, train/loss_step=0.130, global_step=7705.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  52%|█████▏    | 623/1208 [18:05<16:59,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000689, train/loss_step=0.194, global_step=7705.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  52%|█████▏    | 624/1208 [18:09<16:59,  1.75s/it, loss=0.179, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000689, train/loss_step=0.194, global_step=7705.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  52%|█████▏    | 624/1208 [18:09<16:59,  1.75s/it, loss=0.175, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000451, train/loss_step=0.137, global_step=7705.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  52%|█████▏    | 625/1208 [18:10<16:56,  1.74s/it, loss=0.175, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000451, train/loss_step=0.137, global_step=7705.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  52%|█████▏    | 625/1208 [18:10<16:56,  1.74s/it, loss=0.19, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00282, train/loss_step=0.379, global_step=7706.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  52%|█████▏    | 626/1208 [18:11<16:54,  1.74s/it, loss=0.19, v_num=0, train/loss_simple_step=0.379, train/loss_vlb_step=0.00282, train/loss_step=0.379, global_step=7706.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  52%|█████▏    | 626/1208 [18:11<16:54,  1.74s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=7.94e-5, train/loss_step=0.0197, global_step=7706.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  52%|█████▏    | 627/1208 [18:12<16:52,  1.74s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=7.94e-5, train/loss_step=0.0197, global_step=7706.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  52%|█████▏    | 627/1208 [18:12<16:52,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000152, train/loss_step=0.0406, global_step=7706.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  52%|█████▏    | 628/1208 [18:15<16:51,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000152, train/loss_step=0.0406, global_step=7706.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  52%|█████▏    | 628/1208 [18:15<16:51,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.29e-5, train/loss_step=0.0212, global_step=7706.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  52%|█████▏    | 629/1208 [18:16<16:49,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.29e-5, train/loss_step=0.0212, global_step=7706.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  52%|█████▏    | 629/1208 [18:16<16:49,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00668, train/loss_vlb_step=3.41e-5, train/loss_step=0.00668, global_step=7707.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  52%|█████▏    | 630/1208 [18:17<16:47,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00668, train/loss_vlb_step=3.41e-5, train/loss_step=0.00668, global_step=7707.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  52%|█████▏    | 630/1208 [18:17<16:47,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.0006, train/loss_step=0.173, global_step=7707.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]     Epoch 25:  52%|█████▏    | 631/1208 [18:18<16:44,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.0006, train/loss_step=0.173, global_step=7707.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  52%|█████▏    | 631/1208 [18:18<16:44,  1.74s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0512, train/loss_vlb_step=0.000179, train/loss_step=0.0512, global_step=7707.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  52%|█████▏    | 632/1208 [18:22<16:44,  1.74s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0512, train/loss_vlb_step=0.000179, train/loss_step=0.0512, global_step=7707.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  52%|█████▏    | 632/1208 [18:22<16:44,  1.74s/it, loss=0.157, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000407, train/loss_step=0.124, global_step=7707.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  52%|█████▏    | 633/1208 [18:23<16:42,  1.74s/it, loss=0.157, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000407, train/loss_step=0.124, global_step=7707.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  52%|█████▏    | 633/1208 [18:23<16:42,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0604, train/loss_vlb_step=0.000205, train/loss_step=0.0604, global_step=7708.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  52%|█████▏    | 634/1208 [18:24<16:39,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0604, train/loss_vlb_step=0.000205, train/loss_step=0.0604, global_step=7708.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  52%|█████▏    | 634/1208 [18:24<16:39,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=7708.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  53%|█████▎    | 635/1208 [18:25<16:37,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=7708.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  53%|█████▎    | 635/1208 [18:25<16:37,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0037, train/loss_vlb_step=1.86e-5, train/loss_step=0.0037, global_step=7708.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  53%|█████▎    | 636/1208 [18:28<16:36,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0037, train/loss_vlb_step=1.86e-5, train/loss_step=0.0037, global_step=7708.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  53%|█████▎    | 636/1208 [18:28<16:36,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000618, train/loss_step=0.179, global_step=7708.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  53%|█████▎    | 637/1208 [18:29<16:34,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000618, train/loss_step=0.179, global_step=7708.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  53%|█████▎    | 637/1208 [18:29<16:34,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00257, train/loss_step=0.361, global_step=7709.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  53%|█████▎    | 638/1208 [18:30<16:32,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00257, train/loss_step=0.361, global_step=7709.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  53%|█████▎    | 638/1208 [18:30<16:32,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00117, train/loss_step=0.267, global_step=7709.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  53%|█████▎    | 639/1208 [18:31<16:29,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00117, train/loss_step=0.267, global_step=7709.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  53%|█████▎    | 639/1208 [18:31<16:29,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.2e-5, train/loss_step=0.020, global_step=7709.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  53%|█████▎    | 640/1208 [18:34<16:29,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.2e-5, train/loss_step=0.020, global_step=7709.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  53%|█████▎    | 640/1208 [18:34<16:29,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00266, train/loss_step=0.384, global_step=7709.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  53%|█████▎    | 641/1208 [18:35<16:27,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00266, train/loss_step=0.384, global_step=7709.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  53%|█████▎    | 641/1208 [18:35<16:27,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=9.34e-6, train/loss_step=0.00156, global_step=7710.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  53%|█████▎    | 642/1208 [18:37<16:24,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=9.34e-6, train/loss_step=0.00156, global_step=7710.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  53%|█████▎    | 642/1208 [18:37<16:24,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0983, train/loss_vlb_step=0.000326, train/loss_step=0.0983, global_step=7710.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  53%|█████▎    | 643/1208 [18:38<16:22,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0983, train/loss_vlb_step=0.000326, train/loss_step=0.0983, global_step=7710.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  53%|█████▎    | 643/1208 [18:38<16:22,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00042, train/loss_step=0.128, global_step=7710.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  53%|█████▎    | 644/1208 [18:41<16:22,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00042, train/loss_step=0.128, global_step=7710.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  53%|█████▎    | 644/1208 [18:41<16:22,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00553, train/loss_vlb_step=2.8e-5, train/loss_step=0.00553, global_step=7710.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  53%|█████▎    | 645/1208 [18:42<16:19,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00553, train/loss_vlb_step=2.8e-5, train/loss_step=0.00553, global_step=7710.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  53%|█████▎    | 645/1208 [18:42<16:19,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0565, train/loss_vlb_step=0.000197, train/loss_step=0.0565, global_step=7711.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  53%|█████▎    | 646/1208 [18:43<16:17,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0565, train/loss_vlb_step=0.000197, train/loss_step=0.0565, global_step=7711.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  53%|█████▎    | 646/1208 [18:43<16:17,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.00014, train/loss_step=0.0387, global_step=7711.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  54%|█████▎    | 647/1208 [18:44<16:15,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.00014, train/loss_step=0.0387, global_step=7711.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  54%|█████▎    | 647/1208 [18:44<16:15,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00163, train/loss_vlb_step=9.88e-6, train/loss_step=0.00163, global_step=7711.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  54%|█████▎    | 648/1208 [18:47<16:14,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00163, train/loss_vlb_step=9.88e-6, train/loss_step=0.00163, global_step=7711.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  54%|█████▎    | 648/1208 [18:47<16:14,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0965, train/loss_vlb_step=0.000319, train/loss_step=0.0965, global_step=7711.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  54%|█████▎    | 649/1208 [18:48<16:12,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0965, train/loss_vlb_step=0.000319, train/loss_step=0.0965, global_step=7711.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  54%|█████▎    | 649/1208 [18:48<16:12,  1.74s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000134, train/loss_step=0.0349, global_step=7712.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  54%|█████▍    | 650/1208 [18:50<16:10,  1.74s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000134, train/loss_step=0.0349, global_step=7712.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  54%|█████▍    | 650/1208 [18:50<16:10,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.14e-5, train/loss_step=0.0144, global_step=7712.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  54%|█████▍    | 651/1208 [18:51<16:07,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.14e-5, train/loss_step=0.0144, global_step=7712.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  54%|█████▍    | 651/1208 [18:51<16:07,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00358, train/loss_step=0.414, global_step=7712.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  54%|█████▍    | 652/1208 [18:54<16:07,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00358, train/loss_step=0.414, global_step=7712.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  54%|█████▍    | 652/1208 [18:54<16:07,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=3.79e-5, train/loss_step=0.00783, global_step=7712.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  54%|█████▍    | 653/1208 [18:55<16:05,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=3.79e-5, train/loss_step=0.00783, global_step=7712.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  54%|█████▍    | 653/1208 [18:55<16:05,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000767, train/loss_step=0.203, global_step=7713.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  54%|█████▍    | 654/1208 [18:56<16:02,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000767, train/loss_step=0.203, global_step=7713.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  54%|█████▍    | 654/1208 [18:56<16:02,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.4e-5, train/loss_step=0.00254, global_step=7713.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  54%|█████▍    | 655/1208 [18:57<16:00,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.4e-5, train/loss_step=0.00254, global_step=7713.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  54%|█████▍    | 655/1208 [18:57<16:00,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000853, train/loss_step=0.231, global_step=7713.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  54%|█████▍    | 656/1208 [19:00<16:00,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000853, train/loss_step=0.231, global_step=7713.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  54%|█████▍    | 656/1208 [19:00<16:00,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.53e-5, train/loss_step=0.0123, global_step=7713.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  54%|█████▍    | 657/1208 [19:01<15:57,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.53e-5, train/loss_step=0.0123, global_step=7713.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  54%|█████▍    | 657/1208 [19:01<15:57,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.44e-5, train/loss_step=0.0234, global_step=7714.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  54%|█████▍    | 658/1208 [19:03<15:55,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.44e-5, train/loss_step=0.0234, global_step=7714.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  54%|█████▍    | 658/1208 [19:03<15:55,  1.74s/it, loss=0.0895, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.22e-5, train/loss_step=0.0176, global_step=7714.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  55%|█████▍    | 659/1208 [19:04<15:53,  1.74s/it, loss=0.0895, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.22e-5, train/loss_step=0.0176, global_step=7714.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  55%|█████▍    | 659/1208 [19:04<15:53,  1.74s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.25e-5, train/loss_step=0.023, global_step=7714.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  55%|█████▍    | 660/1208 [19:07<15:52,  1.74s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.25e-5, train/loss_step=0.023, global_step=7714.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  55%|█████▍    | 660/1208 [19:07<15:52,  1.74s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.580, train/loss_vlb_step=0.00924, train/loss_step=0.580, global_step=7714.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  55%|█████▍    | 661/1208 [19:08<15:50,  1.74s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.580, train/loss_vlb_step=0.00924, train/loss_step=0.580, global_step=7714.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  55%|█████▍    | 661/1208 [19:08<15:50,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00104, train/loss_step=0.251, global_step=7715.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  55%|█████▍    | 662/1208 [19:09<15:48,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00104, train/loss_step=0.251, global_step=7715.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  55%|█████▍    | 662/1208 [19:09<15:48,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00454, train/loss_vlb_step=2.39e-5, train/loss_step=0.00454, global_step=7715.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  55%|█████▍    | 663/1208 [19:10<15:45,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00454, train/loss_vlb_step=2.39e-5, train/loss_step=0.00454, global_step=7715.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  55%|█████▍    | 663/1208 [19:10<15:45,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.003, train/loss_step=0.403, global_step=7715.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]      Epoch 25:  55%|█████▍    | 664/1208 [19:13<15:45,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.003, train/loss_step=0.403, global_step=7715.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  55%|█████▍    | 664/1208 [19:13<15:45,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=0.000101, train/loss_step=0.0242, global_step=7715.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  55%|█████▌    | 665/1208 [19:14<15:43,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=0.000101, train/loss_step=0.0242, global_step=7715.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  55%|█████▌    | 665/1208 [19:14<15:43,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0991, train/loss_vlb_step=0.000326, train/loss_step=0.0991, global_step=7716.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  55%|█████▌    | 666/1208 [19:15<15:40,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0991, train/loss_vlb_step=0.000326, train/loss_step=0.0991, global_step=7716.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  55%|█████▌    | 666/1208 [19:15<15:40,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00718, train/loss_vlb_step=3.63e-5, train/loss_step=0.00718, global_step=7716.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  55%|█████▌    | 667/1208 [19:17<15:38,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00718, train/loss_vlb_step=3.63e-5, train/loss_step=0.00718, global_step=7716.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  55%|█████▌    | 667/1208 [19:17<15:38,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000768, train/loss_step=0.207, global_step=7716.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  55%|█████▌    | 668/1208 [19:20<15:37,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000768, train/loss_step=0.207, global_step=7716.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  55%|█████▌    | 668/1208 [19:20<15:37,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000173, train/loss_step=0.0484, global_step=7716.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  55%|█████▌    | 669/1208 [19:21<15:35,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000173, train/loss_step=0.0484, global_step=7716.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  55%|█████▌    | 669/1208 [19:21<15:35,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0774, train/loss_vlb_step=0.000259, train/loss_step=0.0774, global_step=7717.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  55%|█████▌    | 670/1208 [19:22<15:33,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0774, train/loss_vlb_step=0.000259, train/loss_step=0.0774, global_step=7717.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  55%|█████▌    | 670/1208 [19:22<15:33,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000122, train/loss_step=0.0327, global_step=7717.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  56%|█████▌    | 671/1208 [19:23<15:31,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000122, train/loss_step=0.0327, global_step=7717.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  56%|█████▌    | 671/1208 [19:23<15:31,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=8.31e-5, train/loss_step=0.0185, global_step=7717.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  56%|█████▌    | 672/1208 [19:26<15:30,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=8.31e-5, train/loss_step=0.0185, global_step=7717.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  56%|█████▌    | 672/1208 [19:26<15:30,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00292, train/loss_step=0.371, global_step=7717.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  56%|█████▌    | 673/1208 [19:27<15:28,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00292, train/loss_step=0.371, global_step=7717.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  56%|█████▌    | 673/1208 [19:27<15:28,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00962, train/loss_vlb_step=4.42e-5, train/loss_step=0.00962, global_step=7718.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  56%|█████▌    | 674/1208 [19:28<15:26,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00962, train/loss_vlb_step=4.42e-5, train/loss_step=0.00962, global_step=7718.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  56%|█████▌    | 674/1208 [19:28<15:26,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00133, train/loss_step=0.272, global_step=7718.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  56%|█████▌    | 675/1208 [19:29<15:23,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00133, train/loss_step=0.272, global_step=7718.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  56%|█████▌    | 675/1208 [19:29<15:23,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000725, train/loss_step=0.197, global_step=7718.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  56%|█████▌    | 676/1208 [19:33<15:23,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000725, train/loss_step=0.197, global_step=7718.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  56%|█████▌    | 676/1208 [19:33<15:23,  1.74s/it, loss=0.151, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.0017, train/loss_step=0.363, global_step=7718.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  56%|█████▌    | 677/1208 [19:34<15:21,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.0017, train/loss_step=0.363, global_step=7718.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  56%|█████▌    | 677/1208 [19:34<15:21,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=9.97e-5, train/loss_step=0.0252, global_step=7719.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  56%|█████▌    | 678/1208 [19:35<15:18,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=9.97e-5, train/loss_step=0.0252, global_step=7719.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  56%|█████▌    | 678/1208 [19:35<15:18,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000693, train/loss_step=0.202, global_step=7719.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  56%|█████▌    | 679/1208 [19:36<15:16,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000693, train/loss_step=0.202, global_step=7719.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  56%|█████▌    | 679/1208 [19:36<15:16,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000178, train/loss_step=0.0525, global_step=7719.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  56%|█████▋    | 680/1208 [19:39<15:16,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000178, train/loss_step=0.0525, global_step=7719.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  56%|█████▋    | 680/1208 [19:39<15:16,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00128, train/loss_step=0.291, global_step=7719.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  56%|█████▋    | 681/1208 [19:40<15:13,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00128, train/loss_step=0.291, global_step=7719.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  56%|█████▋    | 681/1208 [19:40<15:13,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00131, train/loss_step=0.313, global_step=7720.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  56%|█████▋    | 682/1208 [19:41<15:11,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00131, train/loss_step=0.313, global_step=7720.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  56%|█████▋    | 682/1208 [19:41<15:11,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00547, train/loss_vlb_step=2.81e-5, train/loss_step=0.00547, global_step=7720.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  57%|█████▋    | 683/1208 [19:43<15:09,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00547, train/loss_vlb_step=2.81e-5, train/loss_step=0.00547, global_step=7720.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  57%|█████▋    | 683/1208 [19:43<15:09,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=7720.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  57%|█████▋    | 684/1208 [19:46<15:08,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=7720.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  57%|█████▋    | 684/1208 [19:46<15:08,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00494, train/loss_vlb_step=2.6e-5, train/loss_step=0.00494, global_step=7720.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  57%|█████▋    | 685/1208 [19:47<15:06,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00494, train/loss_vlb_step=2.6e-5, train/loss_step=0.00494, global_step=7720.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  57%|█████▋    | 685/1208 [19:47<15:06,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00654, train/loss_vlb_step=3.24e-5, train/loss_step=0.00654, global_step=7721.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  57%|█████▋    | 686/1208 [19:48<15:04,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00654, train/loss_vlb_step=3.24e-5, train/loss_step=0.00654, global_step=7721.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  57%|█████▋    | 686/1208 [19:48<15:04,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.5e-5, train/loss_step=0.0203, global_step=7721.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  57%|█████▋    | 687/1208 [19:49<15:02,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.5e-5, train/loss_step=0.0203, global_step=7721.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  57%|█████▋    | 687/1208 [19:49<15:02,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0583, train/loss_vlb_step=0.000198, train/loss_step=0.0583, global_step=7721.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  57%|█████▋    | 688/1208 [19:52<15:01,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0583, train/loss_vlb_step=0.000198, train/loss_step=0.0583, global_step=7721.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  57%|█████▋    | 688/1208 [19:52<15:01,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000403, train/loss_step=0.121, global_step=7721.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  57%|█████▋    | 689/1208 [19:53<14:59,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000403, train/loss_step=0.121, global_step=7721.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  57%|█████▋    | 689/1208 [19:53<14:59,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000173, train/loss_step=0.0484, global_step=7722.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  57%|█████▋    | 690/1208 [19:55<14:57,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000173, train/loss_step=0.0484, global_step=7722.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  57%|█████▋    | 690/1208 [19:55<14:57,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000128, train/loss_step=0.0336, global_step=7722.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  57%|█████▋    | 691/1208 [19:56<14:54,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000128, train/loss_step=0.0336, global_step=7722.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  57%|█████▋    | 691/1208 [19:56<14:54,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.421, train/loss_vlb_step=0.003, train/loss_step=0.421, global_step=7722.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]     Epoch 25:  57%|█████▋    | 692/1208 [19:59<14:54,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.421, train/loss_vlb_step=0.003, train/loss_step=0.421, global_step=7722.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  57%|█████▋    | 692/1208 [19:59<14:54,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0688, train/loss_vlb_step=0.000233, train/loss_step=0.0688, global_step=7722.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  57%|█████▋    | 693/1208 [20:00<14:52,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0688, train/loss_vlb_step=0.000233, train/loss_step=0.0688, global_step=7722.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  57%|█████▋    | 693/1208 [20:00<14:52,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.000294, train/loss_step=0.0894, global_step=7723.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  57%|█████▋    | 694/1208 [20:01<14:49,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.000294, train/loss_step=0.0894, global_step=7723.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  57%|█████▋    | 694/1208 [20:01<14:49,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.553, train/loss_vlb_step=0.0104, train/loss_step=0.553, global_step=7723.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  58%|█████▊    | 695/1208 [20:02<14:47,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.553, train/loss_vlb_step=0.0104, train/loss_step=0.553, global_step=7723.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  58%|█████▊    | 695/1208 [20:02<14:47,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000445, train/loss_step=0.133, global_step=7723.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  58%|█████▊    | 696/1208 [20:05<14:47,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000445, train/loss_step=0.133, global_step=7723.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  58%|█████▊    | 696/1208 [20:05<14:47,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.08e-5, train/loss_step=0.014, global_step=7723.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  58%|█████▊    | 697/1208 [20:06<14:44,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.08e-5, train/loss_step=0.014, global_step=7723.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  58%|█████▊    | 697/1208 [20:06<14:44,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.22e-5, train/loss_step=0.0179, global_step=7724.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  58%|█████▊    | 698/1208 [20:08<14:42,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.22e-5, train/loss_step=0.0179, global_step=7724.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  58%|█████▊    | 698/1208 [20:08<14:42,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000661, train/loss_step=0.180, global_step=7724.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  58%|█████▊    | 699/1208 [20:09<14:40,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000661, train/loss_step=0.180, global_step=7724.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  58%|█████▊    | 699/1208 [20:09<14:40,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000449, train/loss_step=0.135, global_step=7724.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  58%|█████▊    | 700/1208 [20:12<14:39,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000449, train/loss_step=0.135, global_step=7724.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  58%|█████▊    | 700/1208 [20:12<14:39,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.000272, train/loss_step=0.0817, global_step=7724.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  58%|█████▊    | 701/1208 [20:13<14:37,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.000272, train/loss_step=0.0817, global_step=7724.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  58%|█████▊    | 701/1208 [20:13<14:37,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.00037, train/loss_step=0.112, global_step=7725.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  58%|█████▊    | 702/1208 [20:14<14:35,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.00037, train/loss_step=0.112, global_step=7725.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  58%|█████▊    | 702/1208 [20:14<14:35,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.92e-5, train/loss_step=0.011, global_step=7725.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  58%|█████▊    | 703/1208 [20:15<14:33,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.92e-5, train/loss_step=0.011, global_step=7725.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  58%|█████▊    | 703/1208 [20:15<14:33,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00609, train/loss_vlb_step=3.03e-5, train/loss_step=0.00609, global_step=7725.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  58%|█████▊    | 704/1208 [20:18<14:32,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00609, train/loss_vlb_step=3.03e-5, train/loss_step=0.00609, global_step=7725.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  58%|█████▊    | 704/1208 [20:18<14:32,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.75e-5, train/loss_step=0.00319, global_step=7725.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  58%|█████▊    | 705/1208 [20:19<14:30,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.75e-5, train/loss_step=0.00319, global_step=7725.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  58%|█████▊    | 705/1208 [20:19<14:30,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000269, train/loss_step=0.0815, global_step=7726.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  58%|█████▊    | 706/1208 [20:20<14:28,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000269, train/loss_step=0.0815, global_step=7726.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  58%|█████▊    | 706/1208 [20:20<14:28,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.0019, train/loss_step=0.370, global_step=7726.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  59%|█████▊    | 707/1208 [20:22<14:25,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.0019, train/loss_step=0.370, global_step=7726.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  59%|█████▊    | 707/1208 [20:22<14:25,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0757, train/loss_vlb_step=0.000256, train/loss_step=0.0757, global_step=7726.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  59%|█████▊    | 708/1208 [20:25<14:25,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0757, train/loss_vlb_step=0.000256, train/loss_step=0.0757, global_step=7726.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  59%|█████▊    | 708/1208 [20:25<14:25,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00573, train/loss_vlb_step=2.86e-5, train/loss_step=0.00573, global_step=7726.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  59%|█████▊    | 709/1208 [20:26<14:23,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00573, train/loss_vlb_step=2.86e-5, train/loss_step=0.00573, global_step=7726.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  59%|█████▊    | 709/1208 [20:26<14:23,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000131, train/loss_step=0.0345, global_step=7727.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  59%|█████▉    | 710/1208 [20:27<14:20,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000131, train/loss_step=0.0345, global_step=7727.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  59%|█████▉    | 710/1208 [20:27<14:20,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0383, train/loss_vlb_step=0.000143, train/loss_step=0.0383, global_step=7727.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  59%|█████▉    | 711/1208 [20:28<14:18,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0383, train/loss_vlb_step=0.000143, train/loss_step=0.0383, global_step=7727.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  59%|█████▉    | 711/1208 [20:28<14:18,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00188, train/loss_step=0.352, global_step=7727.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  59%|█████▉    | 712/1208 [20:31<14:18,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00188, train/loss_step=0.352, global_step=7727.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  59%|█████▉    | 712/1208 [20:31<14:18,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0642, train/loss_vlb_step=0.000217, train/loss_step=0.0642, global_step=7727.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  59%|█████▉    | 713/1208 [20:32<14:15,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0642, train/loss_vlb_step=0.000217, train/loss_step=0.0642, global_step=7727.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  59%|█████▉    | 713/1208 [20:32<14:15,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000226, train/loss_step=0.0676, global_step=7728.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  59%|█████▉    | 714/1208 [20:33<14:13,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000226, train/loss_step=0.0676, global_step=7728.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  59%|█████▉    | 714/1208 [20:33<14:13,  1.73s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.75e-5, train/loss_step=0.0135, global_step=7728.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  59%|█████▉    | 715/1208 [20:34<14:11,  1.73s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.75e-5, train/loss_step=0.0135, global_step=7728.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  59%|█████▉    | 715/1208 [20:34<14:11,  1.73s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000123, train/loss_step=0.0311, global_step=7728.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  59%|█████▉    | 716/1208 [20:38<14:10,  1.73s/it, loss=0.0848, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000123, train/loss_step=0.0311, global_step=7728.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  59%|█████▉    | 716/1208 [20:38<14:10,  1.73s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.00438, train/loss_vlb_step=2.35e-5, train/loss_step=0.00438, global_step=7728.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  59%|█████▉    | 717/1208 [20:39<14:08,  1.73s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.00438, train/loss_vlb_step=2.35e-5, train/loss_step=0.00438, global_step=7728.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  59%|█████▉    | 717/1208 [20:39<14:08,  1.73s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.0591, train/loss_vlb_step=0.000197, train/loss_step=0.0591, global_step=7729.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  59%|█████▉    | 718/1208 [20:40<14:06,  1.73s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.0591, train/loss_vlb_step=0.000197, train/loss_step=0.0591, global_step=7729.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  59%|█████▉    | 718/1208 [20:40<14:06,  1.73s/it, loss=0.0777, v_num=0, train/loss_simple_step=0.00648, train/loss_vlb_step=3.14e-5, train/loss_step=0.00648, global_step=7729.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  60%|█████▉    | 719/1208 [20:41<14:04,  1.73s/it, loss=0.0777, v_num=0, train/loss_simple_step=0.00648, train/loss_vlb_step=3.14e-5, train/loss_step=0.00648, global_step=7729.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  60%|█████▉    | 719/1208 [20:41<14:04,  1.73s/it, loss=0.0743, v_num=0, train/loss_simple_step=0.0658, train/loss_vlb_step=0.00022, train/loss_step=0.0658, global_step=7729.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  60%|█████▉    | 720/1208 [20:44<14:03,  1.73s/it, loss=0.0743, v_num=0, train/loss_simple_step=0.0658, train/loss_vlb_step=0.00022, train/loss_step=0.0658, global_step=7729.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  60%|█████▉    | 720/1208 [20:44<14:03,  1.73s/it, loss=0.0863, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00144, train/loss_step=0.323, global_step=7729.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  60%|█████▉    | 721/1208 [20:45<14:01,  1.73s/it, loss=0.0863, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00144, train/loss_step=0.323, global_step=7729.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  60%|█████▉    | 721/1208 [20:45<14:01,  1.73s/it, loss=0.0824, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000124, train/loss_step=0.0342, global_step=7730.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  60%|█████▉    | 722/1208 [20:46<13:59,  1.73s/it, loss=0.0824, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000124, train/loss_step=0.0342, global_step=7730.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  60%|█████▉    | 722/1208 [20:46<13:59,  1.73s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000596, train/loss_step=0.172, global_step=7730.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  60%|█████▉    | 723/1208 [20:47<13:57,  1.73s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000596, train/loss_step=0.172, global_step=7730.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  60%|█████▉    | 723/1208 [20:47<13:57,  1.73s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.0591, train/loss_vlb_step=0.000204, train/loss_step=0.0591, global_step=7730.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  60%|█████▉    | 724/1208 [20:51<13:56,  1.73s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.0591, train/loss_vlb_step=0.000204, train/loss_step=0.0591, global_step=7730.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  60%|█████▉    | 724/1208 [20:51<13:56,  1.73s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.81e-5, train/loss_step=0.024, global_step=7730.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  60%|██████    | 725/1208 [20:52<13:54,  1.73s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.81e-5, train/loss_step=0.024, global_step=7730.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  60%|██████    | 725/1208 [20:52<13:54,  1.73s/it, loss=0.102, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00102, train/loss_step=0.237, global_step=7731.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  60%|██████    | 726/1208 [20:53<13:52,  1.73s/it, loss=0.102, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00102, train/loss_step=0.237, global_step=7731.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  60%|██████    | 726/1208 [20:53<13:52,  1.73s/it, loss=0.099, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00174, train/loss_step=0.313, global_step=7731.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  60%|██████    | 727/1208 [20:54<13:49,  1.73s/it, loss=0.099, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00174, train/loss_step=0.313, global_step=7731.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  60%|██████    | 727/1208 [20:54<13:49,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00143, train/loss_step=0.286, global_step=7731.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  60%|██████    | 728/1208 [20:57<13:49,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00143, train/loss_step=0.286, global_step=7731.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  60%|██████    | 728/1208 [20:57<13:49,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.621, train/loss_vlb_step=0.0135, train/loss_step=0.621, global_step=7731.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  60%|██████    | 729/1208 [20:58<13:47,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.621, train/loss_vlb_step=0.0135, train/loss_step=0.621, global_step=7731.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  60%|██████    | 729/1208 [20:58<13:47,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00369, train/loss_vlb_step=2.02e-5, train/loss_step=0.00369, global_step=7732.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  60%|██████    | 730/1208 [20:59<13:44,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00369, train/loss_vlb_step=2.02e-5, train/loss_step=0.00369, global_step=7732.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  60%|██████    | 730/1208 [20:59<13:44,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0696, train/loss_vlb_step=0.000234, train/loss_step=0.0696, global_step=7732.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  61%|██████    | 731/1208 [21:00<13:42,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0696, train/loss_vlb_step=0.000234, train/loss_step=0.0696, global_step=7732.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  61%|██████    | 731/1208 [21:00<13:42,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=6.95e-5, train/loss_step=0.0172, global_step=7732.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  61%|██████    | 732/1208 [21:04<13:42,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=6.95e-5, train/loss_step=0.0172, global_step=7732.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  61%|██████    | 732/1208 [21:04<13:42,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=7.51e-5, train/loss_step=0.0193, global_step=7732.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  61%|██████    | 733/1208 [21:05<13:39,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=7.51e-5, train/loss_step=0.0193, global_step=7732.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  61%|██████    | 733/1208 [21:05<13:39,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000603, train/loss_step=0.171, global_step=7733.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  61%|██████    | 734/1208 [21:06<13:37,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000603, train/loss_step=0.171, global_step=7733.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  61%|██████    | 734/1208 [21:06<13:37,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00133, train/loss_step=0.284, global_step=7733.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  61%|██████    | 735/1208 [21:07<13:35,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00133, train/loss_step=0.284, global_step=7733.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  61%|██████    | 735/1208 [21:07<13:35,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.26e-5, train/loss_step=0.0179, global_step=7733.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  61%|██████    | 736/1208 [21:10<13:34,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.26e-5, train/loss_step=0.0179, global_step=7733.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  61%|██████    | 736/1208 [21:10<13:34,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=7733.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  61%|██████    | 737/1208 [21:11<13:32,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=7733.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  61%|██████    | 737/1208 [21:11<13:32,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=7734.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  61%|██████    | 738/1208 [21:12<13:30,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=7734.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  61%|██████    | 738/1208 [21:12<13:30,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.574, train/loss_vlb_step=0.00938, train/loss_step=0.574, global_step=7734.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  61%|██████    | 739/1208 [21:13<13:28,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.574, train/loss_vlb_step=0.00938, train/loss_step=0.574, global_step=7734.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  61%|██████    | 739/1208 [21:13<13:28,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.23e-5, train/loss_step=0.0171, global_step=7734.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  61%|██████▏   | 740/1208 [21:17<13:27,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.23e-5, train/loss_step=0.0171, global_step=7734.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  61%|██████▏   | 740/1208 [21:17<13:27,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0645, train/loss_vlb_step=0.000217, train/loss_step=0.0645, global_step=7734.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  61%|██████▏   | 741/1208 [21:18<13:25,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0645, train/loss_vlb_step=0.000217, train/loss_step=0.0645, global_step=7734.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  61%|██████▏   | 741/1208 [21:18<13:25,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00172, train/loss_step=0.311, global_step=7735.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  61%|██████▏   | 742/1208 [21:19<13:23,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00172, train/loss_step=0.311, global_step=7735.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  61%|██████▏   | 742/1208 [21:19<13:23,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00306, train/loss_vlb_step=1.67e-5, train/loss_step=0.00306, global_step=7735.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  62%|██████▏   | 743/1208 [21:20<13:21,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00306, train/loss_vlb_step=1.67e-5, train/loss_step=0.00306, global_step=7735.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  62%|██████▏   | 743/1208 [21:20<13:21,  1.72s/it, loss=0.18, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00165, train/loss_step=0.335, global_step=7735.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]     Epoch 25:  62%|██████▏   | 744/1208 [21:23<13:20,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00165, train/loss_step=0.335, global_step=7735.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  62%|██████▏   | 744/1208 [21:23<13:20,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.5e-5, train/loss_step=0.00261, global_step=7735.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  62%|██████▏   | 745/1208 [21:24<13:18,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=1.5e-5, train/loss_step=0.00261, global_step=7735.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  62%|██████▏   | 745/1208 [21:24<13:18,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000903, train/loss_step=0.221, global_step=7736.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  62%|██████▏   | 746/1208 [21:25<13:16,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000903, train/loss_step=0.221, global_step=7736.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  62%|██████▏   | 746/1208 [21:25<13:16,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.46e-5, train/loss_step=0.0175, global_step=7736.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  62%|██████▏   | 747/1208 [21:26<13:14,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.46e-5, train/loss_step=0.0175, global_step=7736.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  62%|██████▏   | 747/1208 [21:26<13:14,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00715, train/loss_vlb_step=3.64e-5, train/loss_step=0.00715, global_step=7736.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  62%|██████▏   | 748/1208 [21:29<13:13,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00715, train/loss_vlb_step=3.64e-5, train/loss_step=0.00715, global_step=7736.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  62%|██████▏   | 748/1208 [21:29<13:13,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.85e-5, train/loss_step=0.0214, global_step=7736.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  62%|██████▏   | 749/1208 [21:30<13:11,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.85e-5, train/loss_step=0.0214, global_step=7736.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  62%|██████▏   | 749/1208 [21:30<13:11,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.12e-5, train/loss_step=0.00409, global_step=7737.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  62%|██████▏   | 750/1208 [21:32<13:08,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.12e-5, train/loss_step=0.00409, global_step=7737.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  62%|██████▏   | 750/1208 [21:32<13:08,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000909, train/loss_step=0.240, global_step=7737.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  62%|██████▏   | 751/1208 [21:33<13:06,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000909, train/loss_step=0.240, global_step=7737.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  62%|██████▏   | 751/1208 [21:33<13:06,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0548, train/loss_vlb_step=0.000187, train/loss_step=0.0548, global_step=7737.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  62%|██████▏   | 752/1208 [21:36<13:06,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0548, train/loss_vlb_step=0.000187, train/loss_step=0.0548, global_step=7737.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  62%|██████▏   | 752/1208 [21:36<13:06,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00943, train/loss_vlb_step=4.63e-5, train/loss_step=0.00943, global_step=7737.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  62%|██████▏   | 753/1208 [21:37<13:03,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00943, train/loss_vlb_step=4.63e-5, train/loss_step=0.00943, global_step=7737.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  62%|██████▏   | 753/1208 [21:37<13:03,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=4.98e-5, train/loss_step=0.0109, global_step=7738.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  62%|██████▏   | 754/1208 [21:38<13:01,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=4.98e-5, train/loss_step=0.0109, global_step=7738.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  62%|██████▏   | 754/1208 [21:38<13:01,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.42e-5, train/loss_step=0.0143, global_step=7738.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  62%|██████▎   | 755/1208 [21:39<12:59,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.42e-5, train/loss_step=0.0143, global_step=7738.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  62%|██████▎   | 755/1208 [21:39<12:59,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00111, train/loss_step=0.254, global_step=7738.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  63%|██████▎   | 756/1208 [21:42<12:58,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00111, train/loss_step=0.254, global_step=7738.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  63%|██████▎   | 756/1208 [21:42<12:58,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00522, train/loss_vlb_step=2.65e-5, train/loss_step=0.00522, global_step=7738.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  63%|██████▎   | 757/1208 [21:44<12:56,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00522, train/loss_vlb_step=2.65e-5, train/loss_step=0.00522, global_step=7738.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  63%|██████▎   | 757/1208 [21:44<12:56,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0865, train/loss_vlb_step=0.000286, train/loss_step=0.0865, global_step=7739.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  63%|██████▎   | 758/1208 [21:45<12:54,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0865, train/loss_vlb_step=0.000286, train/loss_step=0.0865, global_step=7739.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  63%|██████▎   | 758/1208 [21:45<12:54,  1.72s/it, loss=0.0893, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000351, train/loss_step=0.107, global_step=7739.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  63%|██████▎   | 759/1208 [21:46<12:52,  1.72s/it, loss=0.0893, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000351, train/loss_step=0.107, global_step=7739.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  63%|██████▎   | 759/1208 [21:46<12:52,  1.72s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000411, train/loss_step=0.122, global_step=7739.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  63%|██████▎   | 760/1208 [21:49<12:51,  1.72s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000411, train/loss_step=0.122, global_step=7739.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  63%|██████▎   | 760/1208 [21:49<12:51,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00354, train/loss_step=0.432, global_step=7739.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  63%|██████▎   | 761/1208 [21:50<12:49,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00354, train/loss_step=0.432, global_step=7739.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  63%|██████▎   | 761/1208 [21:50<12:49,  1.72s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.66e-5, train/loss_step=0.0104, global_step=7740.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  63%|██████▎   | 762/1208 [21:51<12:47,  1.72s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.66e-5, train/loss_step=0.0104, global_step=7740.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  63%|██████▎   | 762/1208 [21:51<12:47,  1.72s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.00725, train/loss_vlb_step=3.64e-5, train/loss_step=0.00725, global_step=7740.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  63%|██████▎   | 763/1208 [21:52<12:45,  1.72s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.00725, train/loss_vlb_step=3.64e-5, train/loss_step=0.00725, global_step=7740.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  63%|██████▎   | 763/1208 [21:52<12:45,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.570, train/loss_vlb_step=0.00713, train/loss_step=0.570, global_step=7740.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]      Epoch 25:  63%|██████▎   | 764/1208 [21:55<12:44,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.570, train/loss_vlb_step=0.00713, train/loss_step=0.570, global_step=7740.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  63%|██████▎   | 764/1208 [21:55<12:44,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000752, train/loss_step=0.207, global_step=7740.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  63%|██████▎   | 765/1208 [21:56<12:42,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000752, train/loss_step=0.207, global_step=7740.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  63%|██████▎   | 765/1208 [21:56<12:42,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000539, train/loss_step=0.157, global_step=7741.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  63%|██████▎   | 766/1208 [21:57<12:40,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000539, train/loss_step=0.157, global_step=7741.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  63%|██████▎   | 766/1208 [21:57<12:40,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0629, train/loss_vlb_step=0.000212, train/loss_step=0.0629, global_step=7741.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  63%|██████▎   | 767/1208 [21:59<12:38,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0629, train/loss_vlb_step=0.000212, train/loss_step=0.0629, global_step=7741.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  63%|██████▎   | 767/1208 [21:59<12:38,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.95e-5, train/loss_step=0.0136, global_step=7741.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  64%|██████▎   | 768/1208 [22:02<12:37,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.95e-5, train/loss_step=0.0136, global_step=7741.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  64%|██████▎   | 768/1208 [22:02<12:37,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0765, train/loss_vlb_step=0.000255, train/loss_step=0.0765, global_step=7741.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  64%|██████▎   | 769/1208 [22:03<12:35,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0765, train/loss_vlb_step=0.000255, train/loss_step=0.0765, global_step=7741.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  64%|██████▎   | 769/1208 [22:03<12:35,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.32e-5, train/loss_step=0.00233, global_step=7742.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  64%|██████▎   | 770/1208 [22:04<12:33,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.32e-5, train/loss_step=0.00233, global_step=7742.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  64%|██████▎   | 770/1208 [22:04<12:33,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.00019, train/loss_step=0.0537, global_step=7742.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  64%|██████▍   | 771/1208 [22:05<12:31,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.00019, train/loss_step=0.0537, global_step=7742.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  64%|██████▍   | 771/1208 [22:05<12:31,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0507, train/loss_vlb_step=0.000179, train/loss_step=0.0507, global_step=7742.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  64%|██████▍   | 772/1208 [22:08<12:30,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0507, train/loss_vlb_step=0.000179, train/loss_step=0.0507, global_step=7742.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  64%|██████▍   | 772/1208 [22:08<12:30,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.489, train/loss_vlb_step=0.00429, train/loss_step=0.489, global_step=7742.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  64%|██████▍   | 773/1208 [22:09<12:28,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.489, train/loss_vlb_step=0.00429, train/loss_step=0.489, global_step=7742.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  64%|██████▍   | 773/1208 [22:09<12:28,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00899, train/loss_vlb_step=4.25e-5, train/loss_step=0.00899, global_step=7743.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  64%|██████▍   | 774/1208 [22:10<12:26,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00899, train/loss_vlb_step=4.25e-5, train/loss_step=0.00899, global_step=7743.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  64%|██████▍   | 774/1208 [22:10<12:26,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00276, train/loss_step=0.370, global_step=7743.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  64%|██████▍   | 775/1208 [22:11<12:24,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00276, train/loss_step=0.370, global_step=7743.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  64%|██████▍   | 775/1208 [22:11<12:24,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0623, train/loss_vlb_step=0.000211, train/loss_step=0.0623, global_step=7743.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  64%|██████▍   | 776/1208 [22:15<12:23,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0623, train/loss_vlb_step=0.000211, train/loss_step=0.0623, global_step=7743.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  64%|██████▍   | 776/1208 [22:15<12:23,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0961, train/loss_vlb_step=0.000316, train/loss_step=0.0961, global_step=7743.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  64%|██████▍   | 777/1208 [22:16<12:21,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0961, train/loss_vlb_step=0.000316, train/loss_step=0.0961, global_step=7743.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  64%|██████▍   | 777/1208 [22:16<12:21,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00925, train/loss_vlb_step=4.58e-5, train/loss_step=0.00925, global_step=7744.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  64%|██████▍   | 778/1208 [22:17<12:19,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00925, train/loss_vlb_step=4.58e-5, train/loss_step=0.00925, global_step=7744.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  64%|██████▍   | 778/1208 [22:17<12:19,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00759, train/loss_vlb_step=3.72e-5, train/loss_step=0.00759, global_step=7744.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  64%|██████▍   | 779/1208 [22:18<12:17,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00759, train/loss_vlb_step=3.72e-5, train/loss_step=0.00759, global_step=7744.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  64%|██████▍   | 779/1208 [22:18<12:17,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.431, train/loss_vlb_step=0.00205, train/loss_step=0.431, global_step=7744.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  65%|██████▍   | 780/1208 [22:21<12:16,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.431, train/loss_vlb_step=0.00205, train/loss_step=0.431, global_step=7744.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  65%|██████▍   | 780/1208 [22:21<12:16,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.028, train/loss_vlb_step=0.000114, train/loss_step=0.028, global_step=7744.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  65%|██████▍   | 781/1208 [22:22<12:14,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.028, train/loss_vlb_step=0.000114, train/loss_step=0.028, global_step=7744.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  65%|██████▍   | 781/1208 [22:22<12:14,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0855, train/loss_vlb_step=0.000282, train/loss_step=0.0855, global_step=7745.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  65%|██████▍   | 782/1208 [22:23<12:11,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0855, train/loss_vlb_step=0.000282, train/loss_step=0.0855, global_step=7745.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  65%|██████▍   | 782/1208 [22:23<12:11,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000887, train/loss_step=0.227, global_step=7745.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  65%|██████▍   | 783/1208 [22:24<12:09,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000887, train/loss_step=0.227, global_step=7745.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  65%|██████▍   | 783/1208 [22:24<12:09,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0974, train/loss_vlb_step=0.000321, train/loss_step=0.0974, global_step=7745.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  65%|██████▍   | 784/1208 [22:27<12:08,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0974, train/loss_vlb_step=0.000321, train/loss_step=0.0974, global_step=7745.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  65%|██████▍   | 784/1208 [22:27<12:08,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.00082, train/loss_step=0.212, global_step=7745.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  65%|██████▍   | 785/1208 [22:29<12:06,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.00082, train/loss_step=0.212, global_step=7745.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  65%|██████▍   | 785/1208 [22:29<12:06,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00812, train/loss_vlb_step=3.98e-5, train/loss_step=0.00812, global_step=7746.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  65%|██████▌   | 786/1208 [22:30<12:04,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00812, train/loss_vlb_step=3.98e-5, train/loss_step=0.00812, global_step=7746.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  65%|██████▌   | 786/1208 [22:30<12:04,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.706, train/loss_vlb_step=0.0405, train/loss_step=0.706, global_step=7746.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  65%|██████▌   | 787/1208 [22:31<12:02,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.706, train/loss_vlb_step=0.0405, train/loss_step=0.706, global_step=7746.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  65%|██████▌   | 787/1208 [22:31<12:02,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=7746.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  65%|██████▌   | 788/1208 [22:34<12:01,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000354, train/loss_step=0.108, global_step=7746.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  65%|██████▌   | 788/1208 [22:34<12:01,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00522, train/loss_vlb_step=2.81e-5, train/loss_step=0.00522, global_step=7746.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  65%|██████▌   | 789/1208 [22:35<11:59,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00522, train/loss_vlb_step=2.81e-5, train/loss_step=0.00522, global_step=7746.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  65%|██████▌   | 789/1208 [22:35<11:59,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0585, train/loss_vlb_step=0.000201, train/loss_step=0.0585, global_step=7747.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  65%|██████▌   | 790/1208 [22:36<11:57,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0585, train/loss_vlb_step=0.000201, train/loss_step=0.0585, global_step=7747.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  65%|██████▌   | 790/1208 [22:36<11:57,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000125, train/loss_step=0.0319, global_step=7747.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  65%|██████▌   | 791/1208 [22:37<11:55,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000125, train/loss_step=0.0319, global_step=7747.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  65%|██████▌   | 791/1208 [22:37<11:55,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.00041, train/loss_step=0.125, global_step=7747.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  66%|██████▌   | 792/1208 [22:40<11:54,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.00041, train/loss_step=0.125, global_step=7747.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  66%|██████▌   | 792/1208 [22:40<11:54,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00247, train/loss_step=0.375, global_step=7747.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  66%|██████▌   | 793/1208 [22:41<11:52,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00247, train/loss_step=0.375, global_step=7747.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  66%|██████▌   | 793/1208 [22:41<11:52,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000113, train/loss_step=0.0297, global_step=7748.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  66%|██████▌   | 794/1208 [22:43<11:50,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000113, train/loss_step=0.0297, global_step=7748.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  66%|██████▌   | 794/1208 [22:43<11:50,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.000125, train/loss_step=0.0347, global_step=7748.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  66%|██████▌   | 795/1208 [22:44<11:48,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.000125, train/loss_step=0.0347, global_step=7748.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  66%|██████▌   | 795/1208 [22:44<11:48,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.487, train/loss_vlb_step=0.00547, train/loss_step=0.487, global_step=7748.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  66%|██████▌   | 796/1208 [22:47<11:47,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.487, train/loss_vlb_step=0.00547, train/loss_step=0.487, global_step=7748.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  66%|██████▌   | 796/1208 [22:47<11:47,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.0007, train/loss_step=0.184, global_step=7748.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  66%|██████▌   | 797/1208 [22:48<11:45,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.0007, train/loss_step=0.184, global_step=7748.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  66%|██████▌   | 797/1208 [22:48<11:45,  1.72s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0509, train/loss_vlb_step=0.000181, train/loss_step=0.0509, global_step=7749.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  66%|██████▌   | 798/1208 [22:49<11:43,  1.72s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0509, train/loss_vlb_step=0.000181, train/loss_step=0.0509, global_step=7749.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  66%|██████▌   | 798/1208 [22:49<11:43,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000649, train/loss_step=0.190, global_step=7749.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  66%|██████▌   | 799/1208 [22:50<11:41,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000649, train/loss_step=0.190, global_step=7749.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  66%|██████▌   | 799/1208 [22:50<11:41,  1.72s/it, loss=0.18, v_num=0, train/loss_simple_step=0.556, train/loss_vlb_step=0.00708, train/loss_step=0.556, global_step=7749.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  66%|██████▌   | 800/1208 [22:53<11:40,  1.72s/it, loss=0.18, v_num=0, train/loss_simple_step=0.556, train/loss_vlb_step=0.00708, train/loss_step=0.556, global_step=7749.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  66%|██████▌   | 800/1208 [22:53<11:40,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.039, train/loss_vlb_step=0.000141, train/loss_step=0.039, global_step=7749.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  66%|██████▋   | 801/1208 [22:54<11:38,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.039, train/loss_vlb_step=0.000141, train/loss_step=0.039, global_step=7749.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  66%|██████▋   | 801/1208 [22:54<11:38,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000571, train/loss_step=0.162, global_step=7750.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  66%|██████▋   | 802/1208 [22:55<11:36,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000571, train/loss_step=0.162, global_step=7750.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  66%|██████▋   | 802/1208 [22:55<11:36,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0638, train/loss_vlb_step=0.000221, train/loss_step=0.0638, global_step=7750.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  66%|██████▋   | 803/1208 [22:57<11:34,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0638, train/loss_vlb_step=0.000221, train/loss_step=0.0638, global_step=7750.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  66%|██████▋   | 803/1208 [22:57<11:34,  1.71s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.12e-5, train/loss_step=0.00192, global_step=7750.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  67%|██████▋   | 804/1208 [23:00<11:33,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.12e-5, train/loss_step=0.00192, global_step=7750.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  67%|██████▋   | 804/1208 [23:00<11:33,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.59e-5, train/loss_step=0.0127, global_step=7750.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  67%|██████▋   | 805/1208 [23:01<11:31,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.59e-5, train/loss_step=0.0127, global_step=7750.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  67%|██████▋   | 805/1208 [23:01<11:31,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.11e-5, train/loss_step=0.0196, global_step=7751.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  67%|██████▋   | 806/1208 [23:02<11:29,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.11e-5, train/loss_step=0.0196, global_step=7751.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  67%|██████▋   | 806/1208 [23:02<11:29,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00269, train/loss_vlb_step=1.54e-5, train/loss_step=0.00269, global_step=7751.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  67%|██████▋   | 807/1208 [23:03<11:27,  1.71s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00269, train/loss_vlb_step=1.54e-5, train/loss_step=0.00269, global_step=7751.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  67%|██████▋   | 807/1208 [23:03<11:27,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.03e-5, train/loss_step=0.0241, global_step=7751.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  67%|██████▋   | 808/1208 [23:06<11:26,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.03e-5, train/loss_step=0.0241, global_step=7751.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  67%|██████▋   | 808/1208 [23:06<11:26,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00963, train/loss_vlb_step=4.27e-5, train/loss_step=0.00963, global_step=7751.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  67%|██████▋   | 809/1208 [23:07<11:24,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00963, train/loss_vlb_step=4.27e-5, train/loss_step=0.00963, global_step=7751.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  67%|██████▋   | 809/1208 [23:07<11:24,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0247, train/loss_vlb_step=9.33e-5, train/loss_step=0.0247, global_step=7752.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  67%|██████▋   | 810/1208 [23:08<11:22,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0247, train/loss_vlb_step=9.33e-5, train/loss_step=0.0247, global_step=7752.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  67%|██████▋   | 810/1208 [23:08<11:22,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00336, train/loss_step=0.401, global_step=7752.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  67%|██████▋   | 811/1208 [23:10<11:20,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.401, train/loss_vlb_step=0.00336, train/loss_step=0.401, global_step=7752.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  67%|██████▋   | 811/1208 [23:10<11:20,  1.71s/it, loss=0.169, v_num=0, train/loss_simple_step=0.718, train/loss_vlb_step=0.0372, train/loss_step=0.718, global_step=7752.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  67%|██████▋   | 812/1208 [23:13<11:19,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.718, train/loss_vlb_step=0.0372, train/loss_step=0.718, global_step=7752.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  67%|██████▋   | 812/1208 [23:13<11:19,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000533, train/loss_step=0.159, global_step=7752.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  67%|██████▋   | 813/1208 [23:14<11:17,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000533, train/loss_step=0.159, global_step=7752.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  67%|██████▋   | 813/1208 [23:14<11:17,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=2.09e-5, train/loss_step=0.00395, global_step=7753.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  67%|██████▋   | 814/1208 [23:15<11:15,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=2.09e-5, train/loss_step=0.00395, global_step=7753.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  67%|██████▋   | 814/1208 [23:15<11:15,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=7753.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  67%|██████▋   | 815/1208 [23:16<11:13,  1.71s/it, loss=0.161, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=7753.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  67%|██████▋   | 815/1208 [23:16<11:13,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.26e-5, train/loss_step=0.0184, global_step=7753.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  68%|██████▊   | 816/1208 [23:19<11:12,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.26e-5, train/loss_step=0.0184, global_step=7753.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  68%|██████▊   | 816/1208 [23:19<11:12,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.53e-5, train/loss_step=0.0232, global_step=7753.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  68%|██████▊   | 817/1208 [23:20<11:10,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.53e-5, train/loss_step=0.0232, global_step=7753.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  68%|██████▊   | 817/1208 [23:20<11:10,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000576, train/loss_step=0.171, global_step=7754.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  68%|██████▊   | 818/1208 [23:21<11:08,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000576, train/loss_step=0.171, global_step=7754.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  68%|██████▊   | 818/1208 [23:21<11:08,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=7754.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  68%|██████▊   | 819/1208 [23:22<11:06,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=7754.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  68%|██████▊   | 819/1208 [23:22<11:06,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.26e-5, train/loss_step=0.0175, global_step=7754.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  68%|██████▊   | 820/1208 [23:26<11:05,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.26e-5, train/loss_step=0.0175, global_step=7754.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  68%|██████▊   | 820/1208 [23:26<11:05,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.507, train/loss_vlb_step=0.00829, train/loss_step=0.507, global_step=7754.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  68%|██████▊   | 821/1208 [23:27<11:03,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.507, train/loss_vlb_step=0.00829, train/loss_step=0.507, global_step=7754.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  68%|██████▊   | 821/1208 [23:27<11:03,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000814, train/loss_step=0.218, global_step=7755.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  68%|██████▊   | 822/1208 [23:28<11:01,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000814, train/loss_step=0.218, global_step=7755.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  68%|██████▊   | 822/1208 [23:28<11:01,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.000152, train/loss_step=0.0413, global_step=7755.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  68%|██████▊   | 823/1208 [23:29<10:59,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.000152, train/loss_step=0.0413, global_step=7755.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  68%|██████▊   | 823/1208 [23:29<10:59,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.00011, train/loss_step=0.0291, global_step=7755.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  68%|██████▊   | 824/1208 [23:32<10:58,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.00011, train/loss_step=0.0291, global_step=7755.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  68%|██████▊   | 824/1208 [23:32<10:58,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000361, train/loss_step=0.110, global_step=7755.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  68%|██████▊   | 825/1208 [23:33<10:56,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000361, train/loss_step=0.110, global_step=7755.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  68%|██████▊   | 825/1208 [23:33<10:56,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.71e-5, train/loss_step=0.0123, global_step=7756.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  68%|██████▊   | 826/1208 [23:34<10:54,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.71e-5, train/loss_step=0.0123, global_step=7756.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  68%|██████▊   | 826/1208 [23:34<10:54,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000459, train/loss_step=0.138, global_step=7756.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  68%|██████▊   | 827/1208 [23:36<10:52,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000459, train/loss_step=0.138, global_step=7756.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  68%|██████▊   | 827/1208 [23:36<10:52,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00215, train/loss_step=0.383, global_step=7756.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  69%|██████▊   | 828/1208 [23:39<10:51,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00215, train/loss_step=0.383, global_step=7756.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  69%|██████▊   | 828/1208 [23:39<10:51,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000543, train/loss_step=0.158, global_step=7756.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  69%|██████▊   | 829/1208 [23:40<10:49,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000543, train/loss_step=0.158, global_step=7756.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  69%|██████▊   | 829/1208 [23:40<10:49,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00158, train/loss_step=0.316, global_step=7757.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  69%|██████▊   | 830/1208 [23:41<10:47,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00158, train/loss_step=0.316, global_step=7757.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  69%|██████▊   | 830/1208 [23:41<10:47,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00153, train/loss_step=0.312, global_step=7757.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  69%|██████▉   | 831/1208 [23:42<10:45,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00153, train/loss_step=0.312, global_step=7757.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  69%|██████▉   | 831/1208 [23:42<10:45,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.455, train/loss_vlb_step=0.00324, train/loss_step=0.455, global_step=7757.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  69%|██████▉   | 832/1208 [23:45<10:44,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.455, train/loss_vlb_step=0.00324, train/loss_step=0.455, global_step=7757.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  69%|██████▉   | 832/1208 [23:45<10:44,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.72e-5, train/loss_step=0.0129, global_step=7757.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  69%|██████▉   | 833/1208 [23:46<10:42,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.72e-5, train/loss_step=0.0129, global_step=7757.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  69%|██████▉   | 833/1208 [23:46<10:42,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.63e-5, train/loss_step=0.00299, global_step=7758.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  69%|██████▉   | 834/1208 [23:47<10:40,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.63e-5, train/loss_step=0.00299, global_step=7758.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  69%|██████▉   | 834/1208 [23:47<10:40,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0321, train/loss_vlb_step=0.000124, train/loss_step=0.0321, global_step=7758.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  69%|██████▉   | 835/1208 [23:48<10:38,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0321, train/loss_vlb_step=0.000124, train/loss_step=0.0321, global_step=7758.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  69%|██████▉   | 835/1208 [23:48<10:38,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.37e-5, train/loss_step=0.00249, global_step=7758.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  69%|██████▉   | 836/1208 [23:52<10:37,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.37e-5, train/loss_step=0.00249, global_step=7758.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  69%|██████▉   | 836/1208 [23:52<10:37,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00109, train/loss_step=0.264, global_step=7758.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  69%|██████▉   | 837/1208 [23:53<10:35,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00109, train/loss_step=0.264, global_step=7758.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  69%|██████▉   | 837/1208 [23:53<10:35,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.63e-5, train/loss_step=0.013, global_step=7759.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  69%|██████▉   | 838/1208 [23:54<10:33,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.63e-5, train/loss_step=0.013, global_step=7759.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  69%|██████▉   | 838/1208 [23:54<10:33,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.09e-5, train/loss_step=0.0113, global_step=7759.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  69%|██████▉   | 839/1208 [23:55<10:31,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.09e-5, train/loss_step=0.0113, global_step=7759.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  69%|██████▉   | 839/1208 [23:55<10:31,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.494, train/loss_vlb_step=0.00433, train/loss_step=0.494, global_step=7759.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  70%|██████▉   | 840/1208 [23:58<10:30,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.494, train/loss_vlb_step=0.00433, train/loss_step=0.494, global_step=7759.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  70%|██████▉   | 840/1208 [23:58<10:30,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00122, train/loss_step=0.271, global_step=7759.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  70%|██████▉   | 841/1208 [23:59<10:28,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00122, train/loss_step=0.271, global_step=7759.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  70%|██████▉   | 841/1208 [23:59<10:28,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.000138, train/loss_step=0.0352, global_step=7760.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  70%|██████▉   | 842/1208 [24:00<10:26,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.000138, train/loss_step=0.0352, global_step=7760.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  70%|██████▉   | 842/1208 [24:00<10:26,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.724, train/loss_vlb_step=0.0254, train/loss_step=0.724, global_step=7760.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  70%|██████▉   | 843/1208 [24:01<10:24,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.724, train/loss_vlb_step=0.0254, train/loss_step=0.724, global_step=7760.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  70%|██████▉   | 843/1208 [24:01<10:24,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0559, train/loss_vlb_step=0.0002, train/loss_step=0.0559, global_step=7760.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  70%|██████▉   | 844/1208 [24:05<10:23,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0559, train/loss_vlb_step=0.0002, train/loss_step=0.0559, global_step=7760.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  70%|██████▉   | 844/1208 [24:05<10:23,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.066, train/loss_vlb_step=0.000227, train/loss_step=0.066, global_step=7760.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  70%|██████▉   | 845/1208 [24:06<10:21,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.066, train/loss_vlb_step=0.000227, train/loss_step=0.066, global_step=7760.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  70%|██████▉   | 845/1208 [24:06<10:21,  1.71s/it, loss=0.215, v_num=0, train/loss_simple_step=0.546, train/loss_vlb_step=0.00725, train/loss_step=0.546, global_step=7761.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  70%|███████   | 846/1208 [24:07<10:19,  1.71s/it, loss=0.215, v_num=0, train/loss_simple_step=0.546, train/loss_vlb_step=0.00725, train/loss_step=0.546, global_step=7761.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  70%|███████   | 846/1208 [24:07<10:19,  1.71s/it, loss=0.211, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.000231, train/loss_step=0.067, global_step=7761.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  70%|███████   | 847/1208 [24:08<10:17,  1.71s/it, loss=0.211, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.000231, train/loss_step=0.067, global_step=7761.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  70%|███████   | 847/1208 [24:08<10:17,  1.71s/it, loss=0.204, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00107, train/loss_step=0.244, global_step=7761.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  70%|███████   | 848/1208 [24:11<10:16,  1.71s/it, loss=0.204, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00107, train/loss_step=0.244, global_step=7761.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  70%|███████   | 848/1208 [24:11<10:16,  1.71s/it, loss=0.203, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000478, train/loss_step=0.141, global_step=7761.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  70%|███████   | 849/1208 [24:12<10:14,  1.71s/it, loss=0.203, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000478, train/loss_step=0.141, global_step=7761.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  70%|███████   | 849/1208 [24:12<10:14,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000304, train/loss_step=0.0901, global_step=7762.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  70%|███████   | 850/1208 [24:13<10:12,  1.71s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000304, train/loss_step=0.0901, global_step=7762.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  70%|███████   | 850/1208 [24:13<10:12,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.66e-5, train/loss_step=0.0105, global_step=7762.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  70%|███████   | 851/1208 [24:14<10:10,  1.71s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.66e-5, train/loss_step=0.0105, global_step=7762.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  70%|███████   | 851/1208 [24:14<10:10,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0444, train/loss_vlb_step=0.000156, train/loss_step=0.0444, global_step=7762.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  71%|███████   | 852/1208 [24:18<10:09,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0444, train/loss_vlb_step=0.000156, train/loss_step=0.0444, global_step=7762.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  71%|███████   | 852/1208 [24:18<10:09,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00212, train/loss_step=0.357, global_step=7762.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  71%|███████   | 853/1208 [24:19<10:07,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00212, train/loss_step=0.357, global_step=7762.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  71%|███████   | 853/1208 [24:19<10:07,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00759, train/loss_vlb_step=3.66e-5, train/loss_step=0.00759, global_step=7763.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  71%|███████   | 854/1208 [24:20<10:05,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00759, train/loss_vlb_step=3.66e-5, train/loss_step=0.00759, global_step=7763.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  71%|███████   | 854/1208 [24:20<10:05,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0419, train/loss_vlb_step=0.000145, train/loss_step=0.0419, global_step=7763.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  71%|███████   | 855/1208 [24:21<10:03,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0419, train/loss_vlb_step=0.000145, train/loss_step=0.0419, global_step=7763.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  71%|███████   | 855/1208 [24:21<10:03,  1.71s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.47e-5, train/loss_step=0.0147, global_step=7763.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  71%|███████   | 856/1208 [24:24<10:02,  1.71s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.47e-5, train/loss_step=0.0147, global_step=7763.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  71%|███████   | 856/1208 [24:24<10:02,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00107, train/loss_step=0.275, global_step=7763.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  71%|███████   | 857/1208 [24:25<10:00,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00107, train/loss_step=0.275, global_step=7763.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  71%|███████   | 857/1208 [24:25<10:00,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000793, train/loss_step=0.214, global_step=7764.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  71%|███████   | 858/1208 [24:26<09:58,  1.71s/it, loss=0.186, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000793, train/loss_step=0.214, global_step=7764.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  71%|███████   | 858/1208 [24:26<09:58,  1.71s/it, loss=0.204, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00269, train/loss_step=0.381, global_step=7764.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  71%|███████   | 859/1208 [24:27<09:56,  1.71s/it, loss=0.204, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00269, train/loss_step=0.381, global_step=7764.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  71%|███████   | 859/1208 [24:27<09:56,  1.71s/it, loss=0.219, v_num=0, train/loss_simple_step=0.802, train/loss_vlb_step=0.0515, train/loss_step=0.802, global_step=7764.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  71%|███████   | 860/1208 [24:31<09:55,  1.71s/it, loss=0.219, v_num=0, train/loss_simple_step=0.802, train/loss_vlb_step=0.0515, train/loss_step=0.802, global_step=7764.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  71%|███████   | 860/1208 [24:31<09:55,  1.71s/it, loss=0.216, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.00076, train/loss_step=0.202, global_step=7764.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  71%|███████▏  | 861/1208 [24:32<09:53,  1.71s/it, loss=0.216, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.00076, train/loss_step=0.202, global_step=7764.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  71%|███████▏  | 861/1208 [24:32<09:53,  1.71s/it, loss=0.218, v_num=0, train/loss_simple_step=0.0693, train/loss_vlb_step=0.000238, train/loss_step=0.0693, global_step=7765.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  71%|███████▏  | 862/1208 [24:33<09:51,  1.71s/it, loss=0.218, v_num=0, train/loss_simple_step=0.0693, train/loss_vlb_step=0.000238, train/loss_step=0.0693, global_step=7765.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  71%|███████▏  | 862/1208 [24:33<09:51,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.00041, train/loss_step=0.125, global_step=7765.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  71%|███████▏  | 863/1208 [24:34<09:49,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.00041, train/loss_step=0.125, global_step=7765.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  71%|███████▏  | 863/1208 [24:34<09:49,  1.71s/it, loss=0.196, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000921, train/loss_step=0.221, global_step=7765.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  72%|███████▏  | 864/1208 [24:37<09:48,  1.71s/it, loss=0.196, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000921, train/loss_step=0.221, global_step=7765.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  72%|███████▏  | 864/1208 [24:37<09:48,  1.71s/it, loss=0.205, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000882, train/loss_step=0.248, global_step=7765.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  72%|███████▏  | 865/1208 [24:38<09:46,  1.71s/it, loss=0.205, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000882, train/loss_step=0.248, global_step=7765.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  72%|███████▏  | 865/1208 [24:38<09:46,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=5.02e-5, train/loss_step=0.0107, global_step=7766.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  72%|███████▏  | 866/1208 [24:39<09:44,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=5.02e-5, train/loss_step=0.0107, global_step=7766.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  72%|███████▏  | 866/1208 [24:39<09:44,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=7.94e-5, train/loss_step=0.0194, global_step=7766.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  72%|███████▏  | 867/1208 [24:40<09:42,  1.71s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=7.94e-5, train/loss_step=0.0194, global_step=7766.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  72%|███████▏  | 867/1208 [24:40<09:42,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00436, train/loss_vlb_step=2.3e-5, train/loss_step=0.00436, global_step=7766.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  72%|███████▏  | 868/1208 [24:44<09:41,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00436, train/loss_vlb_step=2.3e-5, train/loss_step=0.00436, global_step=7766.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  72%|███████▏  | 868/1208 [24:44<09:41,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.00404, train/loss_step=0.450, global_step=7766.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  72%|███████▏  | 869/1208 [24:45<09:39,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.00404, train/loss_step=0.450, global_step=7766.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  72%|███████▏  | 869/1208 [24:45<09:39,  1.71s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00408, train/loss_vlb_step=2.14e-5, train/loss_step=0.00408, global_step=7767.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  72%|███████▏  | 870/1208 [24:46<09:37,  1.71s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00408, train/loss_vlb_step=2.14e-5, train/loss_step=0.00408, global_step=7767.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  72%|███████▏  | 870/1208 [24:46<09:37,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000393, train/loss_step=0.119, global_step=7767.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  72%|███████▏  | 871/1208 [24:47<09:35,  1.71s/it, loss=0.18, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000393, train/loss_step=0.119, global_step=7767.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  72%|███████▏  | 871/1208 [24:47<09:35,  1.71s/it, loss=0.196, v_num=0, train/loss_simple_step=0.358, train/loss_vlb_step=0.00194, train/loss_step=0.358, global_step=7767.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  72%|███████▏  | 872/1208 [24:50<09:34,  1.71s/it, loss=0.196, v_num=0, train/loss_simple_step=0.358, train/loss_vlb_step=0.00194, train/loss_step=0.358, global_step=7767.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  72%|███████▏  | 872/1208 [24:50<09:34,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=9.31e-6, train/loss_step=0.00154, global_step=7767.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  72%|███████▏  | 873/1208 [24:51<09:32,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=9.31e-6, train/loss_step=0.00154, global_step=7767.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  72%|███████▏  | 873/1208 [24:51<09:32,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000474, train/loss_step=0.142, global_step=7768.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  72%|███████▏  | 874/1208 [24:52<09:30,  1.71s/it, loss=0.185, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000474, train/loss_step=0.142, global_step=7768.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  72%|███████▏  | 874/1208 [24:52<09:30,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=7768.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  72%|███████▏  | 875/1208 [24:53<09:28,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=7768.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  72%|███████▏  | 875/1208 [24:53<09:28,  1.71s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0657, train/loss_vlb_step=0.000225, train/loss_step=0.0657, global_step=7768.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  73%|███████▎  | 876/1208 [24:56<09:27,  1.71s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0657, train/loss_vlb_step=0.000225, train/loss_step=0.0657, global_step=7768.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  73%|███████▎  | 876/1208 [24:56<09:27,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.8e-5, train/loss_step=0.0179, global_step=7768.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  73%|███████▎  | 877/1208 [24:58<09:25,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.8e-5, train/loss_step=0.0179, global_step=7768.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  73%|███████▎  | 877/1208 [24:58<09:25,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=1.17e-5, train/loss_step=0.00201, global_step=7769.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  73%|███████▎  | 878/1208 [24:59<09:23,  1.71s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=1.17e-5, train/loss_step=0.00201, global_step=7769.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  73%|███████▎  | 878/1208 [24:59<09:23,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000844, train/loss_step=0.234, global_step=7769.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  73%|███████▎  | 879/1208 [25:00<09:21,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000844, train/loss_step=0.234, global_step=7769.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  73%|███████▎  | 879/1208 [25:00<09:21,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=7769.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  73%|███████▎  | 880/1208 [25:03<09:20,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=7769.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  73%|███████▎  | 880/1208 [25:03<09:20,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.23e-5, train/loss_step=0.00207, global_step=7769.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  73%|███████▎  | 881/1208 [25:04<09:18,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.23e-5, train/loss_step=0.00207, global_step=7769.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  73%|███████▎  | 881/1208 [25:04<09:18,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.78e-5, train/loss_step=0.0122, global_step=7770.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  73%|███████▎  | 882/1208 [25:05<09:16,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.78e-5, train/loss_step=0.0122, global_step=7770.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  73%|███████▎  | 882/1208 [25:05<09:16,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=9.73e-5, train/loss_step=0.0254, global_step=7770.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  73%|███████▎  | 883/1208 [25:06<09:14,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=9.73e-5, train/loss_step=0.0254, global_step=7770.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  73%|███████▎  | 883/1208 [25:06<09:14,  1.71s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000144, train/loss_step=0.0388, global_step=7770.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  73%|███████▎  | 884/1208 [25:09<09:13,  1.71s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000144, train/loss_step=0.0388, global_step=7770.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  73%|███████▎  | 884/1208 [25:09<09:13,  1.71s/it, loss=0.0901, v_num=0, train/loss_simple_step=0.0764, train/loss_vlb_step=0.000253, train/loss_step=0.0764, global_step=7770.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  73%|███████▎  | 885/1208 [25:11<09:11,  1.71s/it, loss=0.0901, v_num=0, train/loss_simple_step=0.0764, train/loss_vlb_step=0.000253, train/loss_step=0.0764, global_step=7770.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  73%|███████▎  | 885/1208 [25:11<09:11,  1.71s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=8.02e-5, train/loss_step=0.0184, global_step=7771.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  73%|███████▎  | 886/1208 [25:12<09:09,  1.71s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=8.02e-5, train/loss_step=0.0184, global_step=7771.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  73%|███████▎  | 886/1208 [25:12<09:09,  1.71s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000597, train/loss_step=0.165, global_step=7771.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  73%|███████▎  | 887/1208 [25:13<09:07,  1.71s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000597, train/loss_step=0.165, global_step=7771.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  73%|███████▎  | 887/1208 [25:13<09:07,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00264, train/loss_step=0.365, global_step=7771.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  74%|███████▎  | 888/1208 [25:16<09:06,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00264, train/loss_step=0.365, global_step=7771.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  74%|███████▎  | 888/1208 [25:16<09:06,  1.71s/it, loss=0.0945, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.32e-5, train/loss_step=0.0234, global_step=7771.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  74%|███████▎  | 889/1208 [25:17<09:04,  1.71s/it, loss=0.0945, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.32e-5, train/loss_step=0.0234, global_step=7771.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  74%|███████▎  | 889/1208 [25:17<09:04,  1.71s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000125, train/loss_step=0.0336, global_step=7772.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  74%|███████▎  | 890/1208 [25:18<09:02,  1.71s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000125, train/loss_step=0.0336, global_step=7772.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  74%|███████▎  | 890/1208 [25:18<09:02,  1.71s/it, loss=0.0903, v_num=0, train/loss_simple_step=0.00443, train/loss_vlb_step=2.34e-5, train/loss_step=0.00443, global_step=7772.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  74%|███████▍  | 891/1208 [25:19<09:00,  1.71s/it, loss=0.0903, v_num=0, train/loss_simple_step=0.00443, train/loss_vlb_step=2.34e-5, train/loss_step=0.00443, global_step=7772.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  74%|███████▍  | 891/1208 [25:19<09:00,  1.71s/it, loss=0.0725, v_num=0, train/loss_simple_step=0.00317, train/loss_vlb_step=1.73e-5, train/loss_step=0.00317, global_step=7772.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  74%|███████▍  | 892/1208 [25:22<08:59,  1.71s/it, loss=0.0725, v_num=0, train/loss_simple_step=0.00317, train/loss_vlb_step=1.73e-5, train/loss_step=0.00317, global_step=7772.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  74%|███████▍  | 892/1208 [25:22<08:59,  1.71s/it, loss=0.0734, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=7.72e-5, train/loss_step=0.0192, global_step=7772.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  74%|███████▍  | 893/1208 [25:24<08:57,  1.71s/it, loss=0.0734, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=7.72e-5, train/loss_step=0.0192, global_step=7772.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  74%|███████▍  | 893/1208 [25:24<08:57,  1.71s/it, loss=0.0668, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.4e-5, train/loss_step=0.0101, global_step=7773.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  74%|███████▍  | 894/1208 [25:25<08:55,  1.71s/it, loss=0.0668, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.4e-5, train/loss_step=0.0101, global_step=7773.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  74%|███████▍  | 894/1208 [25:25<08:55,  1.71s/it, loss=0.0636, v_num=0, train/loss_simple_step=0.0422, train/loss_vlb_step=0.000151, train/loss_step=0.0422, global_step=7773.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  74%|███████▍  | 895/1208 [25:26<08:53,  1.71s/it, loss=0.0636, v_num=0, train/loss_simple_step=0.0422, train/loss_vlb_step=0.000151, train/loss_step=0.0422, global_step=7773.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  74%|███████▍  | 895/1208 [25:26<08:53,  1.71s/it, loss=0.0674, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000478, train/loss_step=0.144, global_step=7773.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  74%|███████▍  | 896/1208 [25:29<08:52,  1.71s/it, loss=0.0674, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000478, train/loss_step=0.144, global_step=7773.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  74%|███████▍  | 896/1208 [25:29<08:52,  1.71s/it, loss=0.076, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000666, train/loss_step=0.188, global_step=7773.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  74%|███████▍  | 897/1208 [25:30<08:50,  1.71s/it, loss=0.076, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000666, train/loss_step=0.188, global_step=7773.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  74%|███████▍  | 897/1208 [25:30<08:50,  1.71s/it, loss=0.081, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.00034, train/loss_step=0.102, global_step=7774.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  74%|███████▍  | 898/1208 [25:31<08:48,  1.71s/it, loss=0.081, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.00034, train/loss_step=0.102, global_step=7774.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  74%|███████▍  | 898/1208 [25:31<08:48,  1.71s/it, loss=0.073, v_num=0, train/loss_simple_step=0.0739, train/loss_vlb_step=0.000244, train/loss_step=0.0739, global_step=7774.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  74%|███████▍  | 899/1208 [25:32<08:46,  1.70s/it, loss=0.073, v_num=0, train/loss_simple_step=0.0739, train/loss_vlb_step=0.000244, train/loss_step=0.0739, global_step=7774.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  74%|███████▍  | 899/1208 [25:32<08:46,  1.70s/it, loss=0.0677, v_num=0, train/loss_simple_step=0.00696, train/loss_vlb_step=3.39e-5, train/loss_step=0.00696, global_step=7774.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  75%|███████▍  | 900/1208 [25:36<08:45,  1.71s/it, loss=0.0677, v_num=0, train/loss_simple_step=0.00696, train/loss_vlb_step=3.39e-5, train/loss_step=0.00696, global_step=7774.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  75%|███████▍  | 900/1208 [25:36<08:45,  1.71s/it, loss=0.0927, v_num=0, train/loss_simple_step=0.502, train/loss_vlb_step=0.00617, train/loss_step=0.502, global_step=7774.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:30,  1.62it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.74it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.75it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:28,  1.66it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.72it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.74it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.68it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:27,  1.70it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.74it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.71it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:26,  1.73it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.76it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:26,  1.70it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.74it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.76it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.71it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.74it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:25,  1.71it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.74it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.72it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.76it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.74it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.72it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:23,  1.73it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:23,  1.72it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.76it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.73it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.73it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.75it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.74it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.74it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.74it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.80it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.75it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.75it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.75it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:20,  1.73it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.78it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.75it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.73it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:19,  1.73it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.74it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.74it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.74it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.76it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:11<00:17,  1.73it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.76it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.74it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.75it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.74it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:16,  1.73it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.73it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.74it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.75it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.76it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.74it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.75it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.75it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.73it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.75it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.76it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:15<00:13,  1.73it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.76it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.74it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.76it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.76it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:16<00:12,  1.76it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:16<00:12,  1.75it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:12,  1.74it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:12,  1.74it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.76it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.75it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.73it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.73it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.74it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.78it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.73it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.75it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.75it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.73it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.74it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.78it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:19<00:09,  1.73it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.74it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.75it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.72it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.75it/s]DDIM Sampler:  70%|███████   | 35/50 [00:20<00:08,  1.76it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:20<00:08,  1.73it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.75it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:08,  1.72it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.75it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.73it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.75it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.78it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.77it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.74it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.75it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:23<00:05,  1.74it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.75it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.74it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.75it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:24<00:04,  1.74it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:24<00:04,  1.75it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.75it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.75it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.78it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.76it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.74it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.75it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.78it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:26<00:02,  1.73it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.75it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.74it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.74it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.75it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.73it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.73it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:27<00:01,  1.72it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.74it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.78it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.75it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.72it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:28<00:00,  1.74it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:28<00:00,  1.72it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.73it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.71it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.73it/s]Epoch 25:  75%|███████▍  | 901/1208 [26:07<08:54,  1.74s/it, loss=0.0927, v_num=0, train/loss_simple_step=0.502, train/loss_vlb_step=0.00617, train/loss_step=0.502, global_step=7774.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  75%|███████▍  | 901/1208 [26:07<08:54,  1.74s/it, loss=0.097, v_num=0, train/loss_simple_step=0.0965, train/loss_vlb_step=0.00032, train/loss_step=0.0965, global_step=7775.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  75%|███████▍  | 902/1208 [26:08<08:52,  1.74s/it, loss=0.097, v_num=0, train/loss_simple_step=0.0965, train/loss_vlb_step=0.00032, train/loss_step=0.0965, global_step=7775.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  75%|███████▍  | 902/1208 [26:08<08:52,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.00497, train/loss_step=0.485, global_step=7775.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  75%|███████▍  | 903/1208 [26:09<08:50,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.00497, train/loss_step=0.485, global_step=7775.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  75%|███████▍  | 903/1208 [26:09<08:50,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00806, train/loss_vlb_step=3.69e-5, train/loss_step=0.00806, global_step=7775.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  75%|███████▍  | 904/1208 [26:12<08:48,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00806, train/loss_vlb_step=3.69e-5, train/loss_step=0.00806, global_step=7775.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  75%|███████▍  | 904/1208 [26:12<08:48,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000838, train/loss_step=0.210, global_step=7775.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  75%|███████▍  | 905/1208 [26:13<08:46,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000838, train/loss_step=0.210, global_step=7775.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  75%|███████▍  | 905/1208 [26:13<08:46,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.4e-5, train/loss_step=0.00244, global_step=7776.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  75%|███████▌  | 906/1208 [26:14<08:44,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.4e-5, train/loss_step=0.00244, global_step=7776.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  75%|███████▌  | 906/1208 [26:14<08:44,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000494, train/loss_step=0.147, global_step=7776.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  75%|███████▌  | 907/1208 [26:16<08:43,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000494, train/loss_step=0.147, global_step=7776.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  75%|███████▌  | 907/1208 [26:16<08:43,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00542, train/loss_vlb_step=2.88e-5, train/loss_step=0.00542, global_step=7776.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  75%|███████▌  | 908/1208 [26:19<08:41,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00542, train/loss_vlb_step=2.88e-5, train/loss_step=0.00542, global_step=7776.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  75%|███████▌  | 908/1208 [26:19<08:41,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.00058, train/loss_step=0.167, global_step=7776.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  75%|███████▌  | 909/1208 [26:20<08:39,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.00058, train/loss_step=0.167, global_step=7776.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  75%|███████▌  | 909/1208 [26:20<08:39,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.91e-5, train/loss_step=0.00352, global_step=7777.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  75%|███████▌  | 910/1208 [26:21<08:37,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.91e-5, train/loss_step=0.00352, global_step=7777.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  75%|███████▌  | 910/1208 [26:21<08:37,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.000163, train/loss_step=0.0456, global_step=7777.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  75%|███████▌  | 911/1208 [26:22<08:35,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.000163, train/loss_step=0.0456, global_step=7777.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  75%|███████▌  | 911/1208 [26:22<08:35,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00547, train/loss_vlb_step=2.74e-5, train/loss_step=0.00547, global_step=7777.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  75%|███████▌  | 912/1208 [26:25<08:34,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00547, train/loss_vlb_step=2.74e-5, train/loss_step=0.00547, global_step=7777.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  75%|███████▌  | 912/1208 [26:25<08:34,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0428, train/loss_vlb_step=0.000151, train/loss_step=0.0428, global_step=7777.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  76%|███████▌  | 913/1208 [26:26<08:32,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0428, train/loss_vlb_step=0.000151, train/loss_step=0.0428, global_step=7777.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  76%|███████▌  | 913/1208 [26:26<08:32,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=7778.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  76%|███████▌  | 914/1208 [26:27<08:30,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=7778.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  76%|███████▌  | 914/1208 [26:27<08:30,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.00011, train/loss_step=0.0279, global_step=7778.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  76%|███████▌  | 915/1208 [26:28<08:28,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.00011, train/loss_step=0.0279, global_step=7778.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  76%|███████▌  | 915/1208 [26:28<08:28,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00369, train/loss_vlb_step=1.98e-5, train/loss_step=0.00369, global_step=7778.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  76%|███████▌  | 916/1208 [26:32<08:27,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00369, train/loss_vlb_step=1.98e-5, train/loss_step=0.00369, global_step=7778.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  76%|███████▌  | 916/1208 [26:32<08:27,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=1.91e-5, train/loss_step=0.00363, global_step=7778.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  76%|███████▌  | 917/1208 [26:33<08:25,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=1.91e-5, train/loss_step=0.00363, global_step=7778.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  76%|███████▌  | 917/1208 [26:33<08:25,  1.74s/it, loss=0.104, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000446, train/loss_step=0.134, global_step=7779.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  76%|███████▌  | 918/1208 [26:34<08:23,  1.74s/it, loss=0.104, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000446, train/loss_step=0.134, global_step=7779.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  76%|███████▌  | 918/1208 [26:34<08:23,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000556, train/loss_step=0.162, global_step=7779.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  76%|███████▌  | 919/1208 [26:35<08:21,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000556, train/loss_step=0.162, global_step=7779.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  76%|███████▌  | 919/1208 [26:35<08:21,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.98e-5, train/loss_step=0.0101, global_step=7779.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  76%|███████▌  | 920/1208 [26:38<08:20,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.98e-5, train/loss_step=0.0101, global_step=7779.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  76%|███████▌  | 920/1208 [26:38<08:20,  1.74s/it, loss=0.087, v_num=0, train/loss_simple_step=0.0704, train/loss_vlb_step=0.000236, train/loss_step=0.0704, global_step=7779.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  76%|███████▌  | 921/1208 [26:39<08:18,  1.74s/it, loss=0.087, v_num=0, train/loss_simple_step=0.0704, train/loss_vlb_step=0.000236, train/loss_step=0.0704, global_step=7779.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  76%|███████▌  | 921/1208 [26:39<08:18,  1.74s/it, loss=0.0888, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=7780.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  76%|███████▋  | 922/1208 [26:41<08:16,  1.74s/it, loss=0.0888, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=7780.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  76%|███████▋  | 922/1208 [26:41<08:16,  1.74s/it, loss=0.066, v_num=0, train/loss_simple_step=0.030, train/loss_vlb_step=0.000116, train/loss_step=0.030, global_step=7780.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  76%|███████▋  | 923/1208 [26:42<08:14,  1.74s/it, loss=0.066, v_num=0, train/loss_simple_step=0.030, train/loss_vlb_step=0.000116, train/loss_step=0.030, global_step=7780.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  76%|███████▋  | 923/1208 [26:42<08:14,  1.74s/it, loss=0.073, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000501, train/loss_step=0.147, global_step=7780.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  76%|███████▋  | 924/1208 [26:45<08:13,  1.74s/it, loss=0.073, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000501, train/loss_step=0.147, global_step=7780.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  76%|███████▋  | 924/1208 [26:45<08:13,  1.74s/it, loss=0.0793, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00211, train/loss_step=0.336, global_step=7780.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  77%|███████▋  | 925/1208 [26:46<08:11,  1.74s/it, loss=0.0793, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00211, train/loss_step=0.336, global_step=7780.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  77%|███████▋  | 925/1208 [26:46<08:11,  1.74s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000394, train/loss_step=0.120, global_step=7781.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  77%|███████▋  | 926/1208 [26:47<08:09,  1.74s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000394, train/loss_step=0.120, global_step=7781.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  77%|███████▋  | 926/1208 [26:47<08:09,  1.74s/it, loss=0.0806, v_num=0, train/loss_simple_step=0.0566, train/loss_vlb_step=0.000197, train/loss_step=0.0566, global_step=7781.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  77%|███████▋  | 927/1208 [26:48<08:07,  1.74s/it, loss=0.0806, v_num=0, train/loss_simple_step=0.0566, train/loss_vlb_step=0.000197, train/loss_step=0.0566, global_step=7781.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  77%|███████▋  | 927/1208 [26:48<08:07,  1.74s/it, loss=0.0945, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00116, train/loss_step=0.283, global_step=7781.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  77%|███████▋  | 928/1208 [26:51<08:06,  1.74s/it, loss=0.0945, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00116, train/loss_step=0.283, global_step=7781.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  77%|███████▋  | 928/1208 [26:51<08:06,  1.74s/it, loss=0.101, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00129, train/loss_step=0.290, global_step=7781.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  77%|███████▋  | 929/1208 [26:52<08:04,  1.74s/it, loss=0.101, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00129, train/loss_step=0.290, global_step=7781.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  77%|███████▋  | 929/1208 [26:52<08:04,  1.74s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0616, train/loss_vlb_step=0.000218, train/loss_step=0.0616, global_step=7782.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  77%|███████▋  | 930/1208 [26:53<08:02,  1.74s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0616, train/loss_vlb_step=0.000218, train/loss_step=0.0616, global_step=7782.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  77%|███████▋  | 930/1208 [26:53<08:02,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000847, train/loss_step=0.250, global_step=7782.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  77%|███████▋  | 931/1208 [26:54<08:00,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000847, train/loss_step=0.250, global_step=7782.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  77%|███████▋  | 931/1208 [26:54<08:00,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.29e-5, train/loss_step=0.0173, global_step=7782.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  77%|███████▋  | 932/1208 [26:58<07:59,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.29e-5, train/loss_step=0.0173, global_step=7782.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  77%|███████▋  | 932/1208 [26:58<07:59,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000644, train/loss_step=0.179, global_step=7782.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  77%|███████▋  | 933/1208 [26:59<07:57,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000644, train/loss_step=0.179, global_step=7782.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  77%|███████▋  | 933/1208 [26:59<07:57,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.00044, train/loss_step=0.132, global_step=7783.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  77%|███████▋  | 934/1208 [27:00<07:55,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.00044, train/loss_step=0.132, global_step=7783.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  77%|███████▋  | 934/1208 [27:00<07:55,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00489, train/loss_vlb_step=2.61e-5, train/loss_step=0.00489, global_step=7783.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  77%|███████▋  | 935/1208 [27:01<07:53,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00489, train/loss_vlb_step=2.61e-5, train/loss_step=0.00489, global_step=7783.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  77%|███████▋  | 935/1208 [27:01<07:53,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.523, train/loss_vlb_step=0.0093, train/loss_step=0.523, global_step=7783.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]     Epoch 25:  77%|███████▋  | 936/1208 [27:04<07:52,  1.74s/it, loss=0.147, v_num=0, train/loss_simple_step=0.523, train/loss_vlb_step=0.0093, train/loss_step=0.523, global_step=7783.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  77%|███████▋  | 936/1208 [27:04<07:52,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.0016, train/loss_step=0.299, global_step=7783.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  78%|███████▊  | 937/1208 [27:05<07:50,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.0016, train/loss_step=0.299, global_step=7783.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  78%|███████▊  | 937/1208 [27:05<07:50,  1.74s/it, loss=0.165, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.00072, train/loss_step=0.202, global_step=7784.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  78%|███████▊  | 938/1208 [27:06<07:48,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.00072, train/loss_step=0.202, global_step=7784.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  78%|███████▊  | 938/1208 [27:06<07:48,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00232, train/loss_step=0.390, global_step=7784.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  78%|███████▊  | 939/1208 [27:07<07:46,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00232, train/loss_step=0.390, global_step=7784.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  78%|███████▊  | 939/1208 [27:07<07:46,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=7784.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  78%|███████▊  | 940/1208 [27:11<07:45,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=7784.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  78%|███████▊  | 940/1208 [27:11<07:45,  1.74s/it, loss=0.183, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=7784.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  78%|███████▊  | 941/1208 [27:12<07:43,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=7784.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  78%|███████▊  | 941/1208 [27:12<07:43,  1.73s/it, loss=0.193, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00212, train/loss_step=0.337, global_step=7785.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  78%|███████▊  | 942/1208 [27:13<07:41,  1.73s/it, loss=0.193, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00212, train/loss_step=0.337, global_step=7785.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  78%|███████▊  | 942/1208 [27:13<07:41,  1.73s/it, loss=0.218, v_num=0, train/loss_simple_step=0.522, train/loss_vlb_step=0.00791, train/loss_step=0.522, global_step=7785.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  78%|███████▊  | 943/1208 [27:14<07:39,  1.73s/it, loss=0.218, v_num=0, train/loss_simple_step=0.522, train/loss_vlb_step=0.00791, train/loss_step=0.522, global_step=7785.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  78%|███████▊  | 943/1208 [27:14<07:39,  1.73s/it, loss=0.218, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000471, train/loss_step=0.142, global_step=7785.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  78%|███████▊  | 944/1208 [27:17<07:37,  1.73s/it, loss=0.218, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000471, train/loss_step=0.142, global_step=7785.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  78%|███████▊  | 944/1208 [27:17<07:37,  1.73s/it, loss=0.214, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00101, train/loss_step=0.251, global_step=7785.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  78%|███████▊  | 945/1208 [27:18<07:36,  1.73s/it, loss=0.214, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00101, train/loss_step=0.251, global_step=7785.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  78%|███████▊  | 945/1208 [27:18<07:36,  1.73s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0435, train/loss_vlb_step=0.000164, train/loss_step=0.0435, global_step=7786.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  78%|███████▊  | 946/1208 [27:19<07:34,  1.73s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0435, train/loss_vlb_step=0.000164, train/loss_step=0.0435, global_step=7786.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  78%|███████▊  | 946/1208 [27:19<07:34,  1.73s/it, loss=0.236, v_num=0, train/loss_simple_step=0.588, train/loss_vlb_step=0.0206, train/loss_step=0.588, global_step=7786.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  78%|███████▊  | 947/1208 [27:20<07:32,  1.73s/it, loss=0.236, v_num=0, train/loss_simple_step=0.588, train/loss_vlb_step=0.0206, train/loss_step=0.588, global_step=7786.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  78%|███████▊  | 947/1208 [27:20<07:32,  1.73s/it, loss=0.223, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7.11e-5, train/loss_step=0.0165, global_step=7786.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  78%|███████▊  | 948/1208 [27:24<07:30,  1.73s/it, loss=0.223, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7.11e-5, train/loss_step=0.0165, global_step=7786.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  78%|███████▊  | 948/1208 [27:24<07:30,  1.73s/it, loss=0.209, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.92e-5, train/loss_step=0.0133, global_step=7786.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  79%|███████▊  | 949/1208 [27:25<07:28,  1.73s/it, loss=0.209, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.92e-5, train/loss_step=0.0133, global_step=7786.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  79%|███████▊  | 949/1208 [27:25<07:28,  1.73s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0908, train/loss_vlb_step=0.000299, train/loss_step=0.0908, global_step=7787.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  79%|███████▊  | 950/1208 [27:26<07:27,  1.73s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0908, train/loss_vlb_step=0.000299, train/loss_step=0.0908, global_step=7787.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  79%|███████▊  | 950/1208 [27:26<07:27,  1.73s/it, loss=0.206, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000566, train/loss_step=0.167, global_step=7787.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  79%|███████▊  | 951/1208 [27:27<07:25,  1.73s/it, loss=0.206, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000566, train/loss_step=0.167, global_step=7787.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  79%|███████▊  | 951/1208 [27:27<07:25,  1.73s/it, loss=0.22, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00121, train/loss_step=0.290, global_step=7787.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  79%|███████▉  | 952/1208 [27:30<07:23,  1.73s/it, loss=0.22, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00121, train/loss_step=0.290, global_step=7787.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  79%|███████▉  | 952/1208 [27:30<07:23,  1.73s/it, loss=0.218, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000443, train/loss_step=0.135, global_step=7787.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  79%|███████▉  | 953/1208 [27:31<07:21,  1.73s/it, loss=0.218, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000443, train/loss_step=0.135, global_step=7787.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  79%|███████▉  | 953/1208 [27:31<07:21,  1.73s/it, loss=0.244, v_num=0, train/loss_simple_step=0.655, train/loss_vlb_step=0.0193, train/loss_step=0.655, global_step=7788.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  79%|███████▉  | 954/1208 [27:32<07:19,  1.73s/it, loss=0.244, v_num=0, train/loss_simple_step=0.655, train/loss_vlb_step=0.0193, train/loss_step=0.655, global_step=7788.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  79%|███████▉  | 954/1208 [27:32<07:19,  1.73s/it, loss=0.275, v_num=0, train/loss_simple_step=0.631, train/loss_vlb_step=0.0326, train/loss_step=0.631, global_step=7788.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  79%|███████▉  | 955/1208 [27:33<07:18,  1.73s/it, loss=0.275, v_num=0, train/loss_simple_step=0.631, train/loss_vlb_step=0.0326, train/loss_step=0.631, global_step=7788.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  79%|███████▉  | 955/1208 [27:33<07:18,  1.73s/it, loss=0.249, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.75e-5, train/loss_step=0.00303, global_step=7788.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  79%|███████▉  | 956/1208 [27:36<07:16,  1.73s/it, loss=0.249, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.75e-5, train/loss_step=0.00303, global_step=7788.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  79%|███████▉  | 956/1208 [27:36<07:16,  1.73s/it, loss=0.263, v_num=0, train/loss_simple_step=0.578, train/loss_vlb_step=0.00971, train/loss_step=0.578, global_step=7788.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  79%|███████▉  | 957/1208 [27:38<07:14,  1.73s/it, loss=0.263, v_num=0, train/loss_simple_step=0.578, train/loss_vlb_step=0.00971, train/loss_step=0.578, global_step=7788.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  79%|███████▉  | 957/1208 [27:38<07:14,  1.73s/it, loss=0.257, v_num=0, train/loss_simple_step=0.0728, train/loss_vlb_step=0.000243, train/loss_step=0.0728, global_step=7789.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  79%|███████▉  | 958/1208 [27:39<07:12,  1.73s/it, loss=0.257, v_num=0, train/loss_simple_step=0.0728, train/loss_vlb_step=0.000243, train/loss_step=0.0728, global_step=7789.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  79%|███████▉  | 958/1208 [27:39<07:12,  1.73s/it, loss=0.237, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=2.41e-5, train/loss_step=0.00451, global_step=7789.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  79%|███████▉  | 959/1208 [27:40<07:11,  1.73s/it, loss=0.237, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=2.41e-5, train/loss_step=0.00451, global_step=7789.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  79%|███████▉  | 959/1208 [27:40<07:11,  1.73s/it, loss=0.232, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.43e-5, train/loss_step=0.00247, global_step=7789.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  79%|███████▉  | 960/1208 [27:43<07:09,  1.73s/it, loss=0.232, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.43e-5, train/loss_step=0.00247, global_step=7789.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  79%|███████▉  | 960/1208 [27:43<07:09,  1.73s/it, loss=0.228, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.4e-5, train/loss_step=0.0172, global_step=7789.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  80%|███████▉  | 961/1208 [27:44<07:07,  1.73s/it, loss=0.228, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.4e-5, train/loss_step=0.0172, global_step=7789.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  80%|███████▉  | 961/1208 [27:44<07:07,  1.73s/it, loss=0.229, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00273, train/loss_step=0.364, global_step=7790.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  80%|███████▉  | 962/1208 [27:45<07:05,  1.73s/it, loss=0.229, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00273, train/loss_step=0.364, global_step=7790.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  80%|███████▉  | 962/1208 [27:45<07:05,  1.73s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.000297, train/loss_step=0.0894, global_step=7790.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  80%|███████▉  | 963/1208 [27:46<07:04,  1.73s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.000297, train/loss_step=0.0894, global_step=7790.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  80%|███████▉  | 963/1208 [27:46<07:04,  1.73s/it, loss=0.201, v_num=0, train/loss_simple_step=0.00721, train/loss_vlb_step=3.56e-5, train/loss_step=0.00721, global_step=7790.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  80%|███████▉  | 964/1208 [27:49<07:02,  1.73s/it, loss=0.201, v_num=0, train/loss_simple_step=0.00721, train/loss_vlb_step=3.56e-5, train/loss_step=0.00721, global_step=7790.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  80%|███████▉  | 964/1208 [27:49<07:02,  1.73s/it, loss=0.218, v_num=0, train/loss_simple_step=0.593, train/loss_vlb_step=0.0158, train/loss_step=0.593, global_step=7790.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]     Epoch 25:  80%|███████▉  | 965/1208 [27:50<07:00,  1.73s/it, loss=0.218, v_num=0, train/loss_simple_step=0.593, train/loss_vlb_step=0.0158, train/loss_step=0.593, global_step=7790.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  80%|███████▉  | 965/1208 [27:50<07:00,  1.73s/it, loss=0.221, v_num=0, train/loss_simple_step=0.0965, train/loss_vlb_step=0.000318, train/loss_step=0.0965, global_step=7791.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  80%|███████▉  | 966/1208 [27:51<06:58,  1.73s/it, loss=0.221, v_num=0, train/loss_simple_step=0.0965, train/loss_vlb_step=0.000318, train/loss_step=0.0965, global_step=7791.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  80%|███████▉  | 966/1208 [27:51<06:58,  1.73s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000102, train/loss_step=0.0267, global_step=7791.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  80%|████████  | 967/1208 [27:53<06:56,  1.73s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000102, train/loss_step=0.0267, global_step=7791.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  80%|████████  | 967/1208 [27:53<06:56,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.080, train/loss_vlb_step=0.000277, train/loss_step=0.080, global_step=7791.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  80%|████████  | 968/1208 [27:56<06:55,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.080, train/loss_vlb_step=0.000277, train/loss_step=0.080, global_step=7791.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  80%|████████  | 968/1208 [27:56<06:55,  1.73s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=1.09e-5, train/loss_step=0.00183, global_step=7791.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  80%|████████  | 969/1208 [27:57<06:53,  1.73s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=1.09e-5, train/loss_step=0.00183, global_step=7791.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  80%|████████  | 969/1208 [27:57<06:53,  1.73s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.86e-5, train/loss_step=0.0104, global_step=7792.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  80%|████████  | 970/1208 [27:58<06:51,  1.73s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.86e-5, train/loss_step=0.0104, global_step=7792.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  80%|████████  | 970/1208 [27:58<06:51,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.14e-5, train/loss_step=0.0145, global_step=7792.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  80%|████████  | 971/1208 [27:59<06:49,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.14e-5, train/loss_step=0.0145, global_step=7792.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  80%|████████  | 971/1208 [27:59<06:49,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00476, train/loss_vlb_step=2.5e-5, train/loss_step=0.00476, global_step=7792.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  80%|████████  | 972/1208 [28:02<06:48,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00476, train/loss_vlb_step=2.5e-5, train/loss_step=0.00476, global_step=7792.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  80%|████████  | 972/1208 [28:02<06:48,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00814, train/loss_vlb_step=4.07e-5, train/loss_step=0.00814, global_step=7792.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  81%|████████  | 973/1208 [28:03<06:46,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00814, train/loss_vlb_step=4.07e-5, train/loss_step=0.00814, global_step=7792.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  81%|████████  | 973/1208 [28:03<06:46,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.090, train/loss_vlb_step=0.000296, train/loss_step=0.090, global_step=7793.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  81%|████████  | 974/1208 [28:04<06:44,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.090, train/loss_vlb_step=0.000296, train/loss_step=0.090, global_step=7793.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  81%|████████  | 974/1208 [28:04<06:44,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00417, train/loss_vlb_step=2.2e-5, train/loss_step=0.00417, global_step=7793.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  81%|████████  | 975/1208 [28:05<06:42,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00417, train/loss_vlb_step=2.2e-5, train/loss_step=0.00417, global_step=7793.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  81%|████████  | 975/1208 [28:05<06:42,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000534, train/loss_step=0.155, global_step=7793.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  81%|████████  | 976/1208 [28:09<06:41,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000534, train/loss_step=0.155, global_step=7793.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  81%|████████  | 976/1208 [28:09<06:41,  1.73s/it, loss=0.0823, v_num=0, train/loss_simple_step=0.00193, train/loss_vlb_step=1.14e-5, train/loss_step=0.00193, global_step=7793.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  81%|████████  | 977/1208 [28:10<06:39,  1.73s/it, loss=0.0823, v_num=0, train/loss_simple_step=0.00193, train/loss_vlb_step=1.14e-5, train/loss_step=0.00193, global_step=7793.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  81%|████████  | 977/1208 [28:10<06:39,  1.73s/it, loss=0.0845, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=7794.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  81%|████████  | 978/1208 [28:11<06:37,  1.73s/it, loss=0.0845, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=7794.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  81%|████████  | 978/1208 [28:11<06:37,  1.73s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000948, train/loss_step=0.245, global_step=7794.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  81%|████████  | 979/1208 [28:12<06:35,  1.73s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000948, train/loss_step=0.245, global_step=7794.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  81%|████████  | 979/1208 [28:12<06:35,  1.73s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.00436, train/loss_vlb_step=2.32e-5, train/loss_step=0.00436, global_step=7794.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  81%|████████  | 980/1208 [28:15<06:34,  1.73s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.00436, train/loss_vlb_step=2.32e-5, train/loss_step=0.00436, global_step=7794.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  81%|████████  | 980/1208 [28:15<06:34,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00381, train/loss_step=0.439, global_step=7794.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]     Epoch 25:  81%|████████  | 981/1208 [28:16<06:32,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00381, train/loss_step=0.439, global_step=7794.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  81%|████████  | 981/1208 [28:16<06:32,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.00083, train/loss_step=0.218, global_step=7795.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  81%|████████▏ | 982/1208 [28:17<06:30,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.00083, train/loss_step=0.218, global_step=7795.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  81%|████████▏ | 982/1208 [28:17<06:30,  1.73s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000117, train/loss_step=0.0293, global_step=7795.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  81%|████████▏ | 983/1208 [28:18<06:28,  1.73s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000117, train/loss_step=0.0293, global_step=7795.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  81%|████████▏ | 983/1208 [28:18<06:28,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00163, train/loss_step=0.346, global_step=7795.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  81%|████████▏ | 984/1208 [28:22<06:27,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00163, train/loss_step=0.346, global_step=7795.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  81%|████████▏ | 984/1208 [28:22<06:27,  1.73s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.0966, train/loss_vlb_step=0.000318, train/loss_step=0.0966, global_step=7795.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  82%|████████▏ | 985/1208 [28:23<06:25,  1.73s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.0966, train/loss_vlb_step=0.000318, train/loss_step=0.0966, global_step=7795.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  82%|████████▏ | 985/1208 [28:23<06:25,  1.73s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0805, train/loss_vlb_step=0.00027, train/loss_step=0.0805, global_step=7796.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  82%|████████▏ | 986/1208 [28:24<06:23,  1.73s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0805, train/loss_vlb_step=0.00027, train/loss_step=0.0805, global_step=7796.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  82%|████████▏ | 986/1208 [28:24<06:23,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00153, train/loss_step=0.314, global_step=7796.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  82%|████████▏ | 987/1208 [28:25<06:21,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00153, train/loss_step=0.314, global_step=7796.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  82%|████████▏ | 987/1208 [28:25<06:21,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=7.25e-5, train/loss_step=0.0159, global_step=7796.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  82%|████████▏ | 988/1208 [28:28<06:20,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=7.25e-5, train/loss_step=0.0159, global_step=7796.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  82%|████████▏ | 988/1208 [28:28<06:20,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0094, train/loss_vlb_step=4.53e-5, train/loss_step=0.0094, global_step=7796.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  82%|████████▏ | 989/1208 [28:29<06:18,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0094, train/loss_vlb_step=4.53e-5, train/loss_step=0.0094, global_step=7796.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  82%|████████▏ | 989/1208 [28:29<06:18,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000548, train/loss_step=0.162, global_step=7797.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  82%|████████▏ | 990/1208 [28:30<06:16,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000548, train/loss_step=0.162, global_step=7797.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  82%|████████▏ | 990/1208 [28:30<06:16,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000638, train/loss_step=0.182, global_step=7797.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  82%|████████▏ | 991/1208 [28:31<06:14,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000638, train/loss_step=0.182, global_step=7797.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  82%|████████▏ | 991/1208 [28:31<06:14,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0687, train/loss_vlb_step=0.000228, train/loss_step=0.0687, global_step=7797.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  82%|████████▏ | 992/1208 [28:35<06:13,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0687, train/loss_vlb_step=0.000228, train/loss_step=0.0687, global_step=7797.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  82%|████████▏ | 992/1208 [28:35<06:13,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.504, train/loss_vlb_step=0.0118, train/loss_step=0.504, global_step=7797.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  82%|████████▏ | 993/1208 [28:36<06:11,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.504, train/loss_vlb_step=0.0118, train/loss_step=0.504, global_step=7797.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  82%|████████▏ | 993/1208 [28:36<06:11,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000735, train/loss_step=0.198, global_step=7798.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  82%|████████▏ | 994/1208 [28:37<06:09,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000735, train/loss_step=0.198, global_step=7798.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  82%|████████▏ | 994/1208 [28:37<06:09,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=9.22e-5, train/loss_step=0.0222, global_step=7798.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  82%|████████▏ | 995/1208 [28:38<06:07,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=9.22e-5, train/loss_step=0.0222, global_step=7798.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  82%|████████▏ | 995/1208 [28:38<06:07,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.71e-5, train/loss_step=0.0136, global_step=7798.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  82%|████████▏ | 996/1208 [28:41<06:06,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.71e-5, train/loss_step=0.0136, global_step=7798.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  82%|████████▏ | 996/1208 [28:41<06:06,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00131, train/loss_step=0.287, global_step=7798.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  83%|████████▎ | 997/1208 [28:42<06:04,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00131, train/loss_step=0.287, global_step=7798.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  83%|████████▎ | 997/1208 [28:42<06:04,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0843, train/loss_vlb_step=0.000277, train/loss_step=0.0843, global_step=7799.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  83%|████████▎ | 998/1208 [28:43<06:02,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0843, train/loss_vlb_step=0.000277, train/loss_step=0.0843, global_step=7799.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  83%|████████▎ | 998/1208 [28:43<06:02,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=9.75e-5, train/loss_step=0.0244, global_step=7799.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  83%|████████▎ | 999/1208 [28:44<06:00,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=9.75e-5, train/loss_step=0.0244, global_step=7799.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  83%|████████▎ | 999/1208 [28:44<06:00,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0433, train/loss_vlb_step=0.000158, train/loss_step=0.0433, global_step=7799.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  83%|████████▎ | 1000/1208 [28:48<05:59,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0433, train/loss_vlb_step=0.000158, train/loss_step=0.0433, global_step=7799.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  83%|████████▎ | 1000/1208 [28:48<05:59,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000518, train/loss_step=0.153, global_step=7799.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  83%|████████▎ | 1001/1208 [28:49<05:57,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000518, train/loss_step=0.153, global_step=7799.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  83%|████████▎ | 1001/1208 [28:49<05:57,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00625, train/loss_vlb_step=3.07e-5, train/loss_step=0.00625, global_step=7800.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  83%|████████▎ | 1002/1208 [28:50<05:55,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00625, train/loss_vlb_step=3.07e-5, train/loss_step=0.00625, global_step=7800.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  83%|████████▎ | 1002/1208 [28:50<05:55,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.644, train/loss_vlb_step=0.0145, train/loss_step=0.644, global_step=7800.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]     Epoch 25:  83%|████████▎ | 1003/1208 [28:51<05:53,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.644, train/loss_vlb_step=0.0145, train/loss_step=0.644, global_step=7800.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  83%|████████▎ | 1003/1208 [28:51<05:53,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00714, train/loss_vlb_step=3.52e-5, train/loss_step=0.00714, global_step=7800.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  83%|████████▎ | 1004/1208 [28:54<05:52,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00714, train/loss_vlb_step=3.52e-5, train/loss_step=0.00714, global_step=7800.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  83%|████████▎ | 1004/1208 [28:54<05:52,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00257, train/loss_step=0.361, global_step=7800.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  83%|████████▎ | 1005/1208 [28:55<05:50,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00257, train/loss_step=0.361, global_step=7800.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  83%|████████▎ | 1005/1208 [28:55<05:50,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.71e-5, train/loss_step=0.0207, global_step=7801.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  83%|████████▎ | 1006/1208 [28:56<05:48,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.71e-5, train/loss_step=0.0207, global_step=7801.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  83%|████████▎ | 1006/1208 [28:56<05:48,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0974, train/loss_vlb_step=0.000321, train/loss_step=0.0974, global_step=7801.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  83%|████████▎ | 1007/1208 [28:57<05:46,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0974, train/loss_vlb_step=0.000321, train/loss_step=0.0974, global_step=7801.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  83%|████████▎ | 1007/1208 [28:57<05:46,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000535, train/loss_step=0.152, global_step=7801.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  83%|████████▎ | 1008/1208 [29:00<05:45,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000535, train/loss_step=0.152, global_step=7801.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  83%|████████▎ | 1008/1208 [29:00<05:45,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.65e-5, train/loss_step=0.00299, global_step=7801.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  84%|████████▎ | 1009/1208 [29:02<05:43,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.65e-5, train/loss_step=0.00299, global_step=7801.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  84%|████████▎ | 1009/1208 [29:02<05:43,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0655, train/loss_vlb_step=0.00022, train/loss_step=0.0655, global_step=7802.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  84%|████████▎ | 1010/1208 [29:03<05:41,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0655, train/loss_vlb_step=0.00022, train/loss_step=0.0655, global_step=7802.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  84%|████████▎ | 1010/1208 [29:03<05:41,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=7802.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  84%|████████▎ | 1011/1208 [29:04<05:39,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=7802.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  84%|████████▎ | 1011/1208 [29:04<05:39,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.061, train/loss_vlb_step=0.00021, train/loss_step=0.061, global_step=7802.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  84%|████████▍ | 1012/1208 [29:07<05:38,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.061, train/loss_vlb_step=0.00021, train/loss_step=0.061, global_step=7802.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  84%|████████▍ | 1012/1208 [29:07<05:38,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=9.64e-5, train/loss_step=0.0244, global_step=7802.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  84%|████████▍ | 1013/1208 [29:08<05:36,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=9.64e-5, train/loss_step=0.0244, global_step=7802.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  84%|████████▍ | 1013/1208 [29:08<05:36,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0625, train/loss_vlb_step=0.00021, train/loss_step=0.0625, global_step=7803.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  84%|████████▍ | 1014/1208 [29:09<05:34,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0625, train/loss_vlb_step=0.00021, train/loss_step=0.0625, global_step=7803.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  84%|████████▍ | 1014/1208 [29:09<05:34,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=1.39e-5, train/loss_step=0.00234, global_step=7803.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  84%|████████▍ | 1015/1208 [29:10<05:32,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=1.39e-5, train/loss_step=0.00234, global_step=7803.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  84%|████████▍ | 1015/1208 [29:10<05:32,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.37e-5, train/loss_step=0.00236, global_step=7803.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  84%|████████▍ | 1016/1208 [29:13<05:31,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.37e-5, train/loss_step=0.00236, global_step=7803.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  84%|████████▍ | 1016/1208 [29:13<05:31,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=7803.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  84%|████████▍ | 1017/1208 [29:14<05:29,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=7803.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  84%|████████▍ | 1017/1208 [29:14<05:29,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.0021, train/loss_step=0.339, global_step=7804.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  84%|████████▍ | 1018/1208 [29:16<05:27,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.0021, train/loss_step=0.339, global_step=7804.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  84%|████████▍ | 1018/1208 [29:16<05:27,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00231, train/loss_step=0.356, global_step=7804.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  84%|████████▍ | 1019/1208 [29:17<05:25,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00231, train/loss_step=0.356, global_step=7804.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  84%|████████▍ | 1019/1208 [29:17<05:25,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=1.43e-5, train/loss_step=0.0025, global_step=7804.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  84%|████████▍ | 1020/1208 [29:20<05:24,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=1.43e-5, train/loss_step=0.0025, global_step=7804.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  84%|████████▍ | 1020/1208 [29:20<05:24,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=7804.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  85%|████████▍ | 1021/1208 [29:21<05:22,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=7804.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  85%|████████▍ | 1021/1208 [29:21<05:22,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.5e-5, train/loss_step=0.00257, global_step=7805.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  85%|████████▍ | 1022/1208 [29:22<05:20,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.5e-5, train/loss_step=0.00257, global_step=7805.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  85%|████████▍ | 1022/1208 [29:22<05:20,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00129, train/loss_step=0.276, global_step=7805.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  85%|████████▍ | 1023/1208 [29:23<05:18,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00129, train/loss_step=0.276, global_step=7805.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  85%|████████▍ | 1023/1208 [29:23<05:18,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000395, train/loss_step=0.119, global_step=7805.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  85%|████████▍ | 1024/1208 [29:26<05:17,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000395, train/loss_step=0.119, global_step=7805.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  85%|████████▍ | 1024/1208 [29:26<05:17,  1.73s/it, loss=0.107, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.000954, train/loss_step=0.243, global_step=7805.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  85%|████████▍ | 1025/1208 [29:27<05:15,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.000954, train/loss_step=0.243, global_step=7805.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  85%|████████▍ | 1025/1208 [29:27<05:15,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0533, train/loss_vlb_step=0.000183, train/loss_step=0.0533, global_step=7806.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  85%|████████▍ | 1026/1208 [29:28<05:13,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0533, train/loss_vlb_step=0.000183, train/loss_step=0.0533, global_step=7806.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  85%|████████▍ | 1026/1208 [29:28<05:13,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000577, train/loss_step=0.168, global_step=7806.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  85%|████████▌ | 1027/1208 [29:30<05:11,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000577, train/loss_step=0.168, global_step=7806.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  85%|████████▌ | 1027/1208 [29:30<05:11,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00685, train/loss_vlb_step=3.32e-5, train/loss_step=0.00685, global_step=7806.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  85%|████████▌ | 1028/1208 [29:33<05:10,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00685, train/loss_vlb_step=3.32e-5, train/loss_step=0.00685, global_step=7806.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  85%|████████▌ | 1028/1208 [29:33<05:10,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000119, train/loss_step=0.0311, global_step=7806.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  85%|████████▌ | 1029/1208 [29:34<05:08,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000119, train/loss_step=0.0311, global_step=7806.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  85%|████████▌ | 1029/1208 [29:34<05:08,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.091, train/loss_vlb_step=0.000304, train/loss_step=0.091, global_step=7807.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  85%|████████▌ | 1030/1208 [29:35<05:06,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.091, train/loss_vlb_step=0.000304, train/loss_step=0.091, global_step=7807.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  85%|████████▌ | 1030/1208 [29:35<05:06,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00703, train/loss_vlb_step=3.48e-5, train/loss_step=0.00703, global_step=7807.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  85%|████████▌ | 1031/1208 [29:36<05:04,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00703, train/loss_vlb_step=3.48e-5, train/loss_step=0.00703, global_step=7807.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  85%|████████▌ | 1031/1208 [29:36<05:04,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.3e-5, train/loss_step=0.0114, global_step=7807.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]     Epoch 25:  85%|████████▌ | 1032/1208 [29:39<05:03,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.3e-5, train/loss_step=0.0114, global_step=7807.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  85%|████████▌ | 1032/1208 [29:39<05:03,  1.72s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.39e-5, train/loss_step=0.0176, global_step=7807.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  86%|████████▌ | 1033/1208 [29:40<05:01,  1.72s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.39e-5, train/loss_step=0.0176, global_step=7807.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  86%|████████▌ | 1033/1208 [29:40<05:01,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.070, train/loss_vlb_step=0.000235, train/loss_step=0.070, global_step=7808.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  86%|████████▌ | 1034/1208 [29:41<04:59,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.070, train/loss_vlb_step=0.000235, train/loss_step=0.070, global_step=7808.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  86%|████████▌ | 1034/1208 [29:41<04:59,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.51e-5, train/loss_step=0.0198, global_step=7808.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  86%|████████▌ | 1035/1208 [29:42<04:58,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.51e-5, train/loss_step=0.0198, global_step=7808.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  86%|████████▌ | 1035/1208 [29:42<04:58,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.03e-5, train/loss_step=0.0108, global_step=7808.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  86%|████████▌ | 1036/1208 [29:46<04:56,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.03e-5, train/loss_step=0.0108, global_step=7808.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  86%|████████▌ | 1036/1208 [29:46<04:56,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000948, train/loss_step=0.229, global_step=7808.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  86%|████████▌ | 1037/1208 [29:47<04:54,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000948, train/loss_step=0.229, global_step=7808.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  86%|████████▌ | 1037/1208 [29:47<04:54,  1.72s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.00925, train/loss_vlb_step=4.34e-5, train/loss_step=0.00925, global_step=7809.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  86%|████████▌ | 1038/1208 [29:48<04:52,  1.72s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.00925, train/loss_vlb_step=4.34e-5, train/loss_step=0.00925, global_step=7809.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  86%|████████▌ | 1038/1208 [29:48<04:52,  1.72s/it, loss=0.074, v_num=0, train/loss_simple_step=0.00622, train/loss_vlb_step=3.09e-5, train/loss_step=0.00622, global_step=7809.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  86%|████████▌ | 1039/1208 [29:49<04:51,  1.72s/it, loss=0.074, v_num=0, train/loss_simple_step=0.00622, train/loss_vlb_step=3.09e-5, train/loss_step=0.00622, global_step=7809.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  86%|████████▌ | 1039/1208 [29:49<04:51,  1.72s/it, loss=0.0743, v_num=0, train/loss_simple_step=0.00918, train/loss_vlb_step=4.27e-5, train/loss_step=0.00918, global_step=7809.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  86%|████████▌ | 1040/1208 [29:52<04:49,  1.72s/it, loss=0.0743, v_num=0, train/loss_simple_step=0.00918, train/loss_vlb_step=4.27e-5, train/loss_step=0.00918, global_step=7809.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  86%|████████▌ | 1040/1208 [29:52<04:49,  1.72s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00171, train/loss_step=0.327, global_step=7809.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  86%|████████▌ | 1041/1208 [29:53<04:47,  1.72s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00171, train/loss_step=0.327, global_step=7809.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  86%|████████▌ | 1041/1208 [29:53<04:47,  1.72s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=7810.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  86%|████████▋ | 1042/1208 [29:54<04:45,  1.72s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=7810.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  86%|████████▋ | 1042/1208 [29:54<04:45,  1.72s/it, loss=0.078, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000105, train/loss_step=0.0272, global_step=7810.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  86%|████████▋ | 1043/1208 [29:55<04:44,  1.72s/it, loss=0.078, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000105, train/loss_step=0.0272, global_step=7810.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  86%|████████▋ | 1043/1208 [29:55<04:44,  1.72s/it, loss=0.078, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.00039, train/loss_step=0.119, global_step=7810.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  86%|████████▋ | 1044/1208 [29:58<04:42,  1.72s/it, loss=0.078, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.00039, train/loss_step=0.119, global_step=7810.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  86%|████████▋ | 1044/1208 [29:58<04:42,  1.72s/it, loss=0.0824, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00203, train/loss_step=0.331, global_step=7810.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  87%|████████▋ | 1045/1208 [30:00<04:40,  1.72s/it, loss=0.0824, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00203, train/loss_step=0.331, global_step=7810.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  87%|████████▋ | 1045/1208 [30:00<04:40,  1.72s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00108, train/loss_step=0.268, global_step=7811.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  87%|████████▋ | 1046/1208 [30:01<04:38,  1.72s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00108, train/loss_step=0.268, global_step=7811.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  87%|████████▋ | 1046/1208 [30:01<04:38,  1.72s/it, loss=0.0866, v_num=0, train/loss_simple_step=0.0366, train/loss_vlb_step=0.000131, train/loss_step=0.0366, global_step=7811.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  87%|████████▋ | 1047/1208 [30:02<04:37,  1.72s/it, loss=0.0866, v_num=0, train/loss_simple_step=0.0366, train/loss_vlb_step=0.000131, train/loss_step=0.0366, global_step=7811.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  87%|████████▋ | 1047/1208 [30:02<04:37,  1.72s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000724, train/loss_step=0.199, global_step=7811.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  87%|████████▋ | 1048/1208 [30:05<04:35,  1.72s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000724, train/loss_step=0.199, global_step=7811.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  87%|████████▋ | 1048/1208 [30:05<04:35,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000719, train/loss_step=0.192, global_step=7811.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  87%|████████▋ | 1049/1208 [30:06<04:33,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000719, train/loss_step=0.192, global_step=7811.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  87%|████████▋ | 1049/1208 [30:06<04:33,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000576, train/loss_step=0.165, global_step=7812.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  87%|████████▋ | 1050/1208 [30:07<04:31,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000576, train/loss_step=0.165, global_step=7812.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  87%|████████▋ | 1050/1208 [30:07<04:31,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00832, train/loss_vlb_step=3.89e-5, train/loss_step=0.00832, global_step=7812.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  87%|████████▋ | 1051/1208 [30:08<04:30,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00832, train/loss_vlb_step=3.89e-5, train/loss_step=0.00832, global_step=7812.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  87%|████████▋ | 1051/1208 [30:08<04:30,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000173, train/loss_step=0.0474, global_step=7812.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  87%|████████▋ | 1052/1208 [30:11<04:28,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000173, train/loss_step=0.0474, global_step=7812.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  87%|████████▋ | 1052/1208 [30:11<04:28,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=7812.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  87%|████████▋ | 1053/1208 [30:12<04:26,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=7812.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  87%|████████▋ | 1053/1208 [30:12<04:26,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00478, train/loss_vlb_step=2.5e-5, train/loss_step=0.00478, global_step=7813.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  87%|████████▋ | 1054/1208 [30:13<04:25,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00478, train/loss_vlb_step=2.5e-5, train/loss_step=0.00478, global_step=7813.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  87%|████████▋ | 1054/1208 [30:13<04:25,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000467, train/loss_step=0.140, global_step=7813.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  87%|████████▋ | 1055/1208 [30:14<04:23,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000467, train/loss_step=0.140, global_step=7813.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  87%|████████▋ | 1055/1208 [30:14<04:23,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.515, train/loss_vlb_step=0.00632, train/loss_step=0.515, global_step=7813.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  87%|████████▋ | 1056/1208 [30:18<04:21,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.515, train/loss_vlb_step=0.00632, train/loss_step=0.515, global_step=7813.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  87%|████████▋ | 1056/1208 [30:18<04:21,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000629, train/loss_step=0.182, global_step=7813.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  88%|████████▊ | 1057/1208 [30:19<04:19,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000629, train/loss_step=0.182, global_step=7813.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  88%|████████▊ | 1057/1208 [30:19<04:19,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.57e-5, train/loss_step=0.0155, global_step=7814.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  88%|████████▊ | 1058/1208 [30:20<04:18,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.57e-5, train/loss_step=0.0155, global_step=7814.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  88%|████████▊ | 1058/1208 [30:20<04:18,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000663, train/loss_step=0.186, global_step=7814.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  88%|████████▊ | 1059/1208 [30:21<04:16,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000663, train/loss_step=0.186, global_step=7814.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  88%|████████▊ | 1059/1208 [30:21<04:16,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.71e-5, train/loss_step=0.0107, global_step=7814.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  88%|████████▊ | 1060/1208 [30:24<04:14,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.71e-5, train/loss_step=0.0107, global_step=7814.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  88%|████████▊ | 1060/1208 [30:24<04:14,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.503, train/loss_vlb_step=0.0128, train/loss_step=0.503, global_step=7814.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  88%|████████▊ | 1061/1208 [30:25<04:12,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.503, train/loss_vlb_step=0.0128, train/loss_step=0.503, global_step=7814.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  88%|████████▊ | 1061/1208 [30:25<04:12,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00164, train/loss_step=0.310, global_step=7815.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  88%|████████▊ | 1062/1208 [30:26<04:11,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00164, train/loss_step=0.310, global_step=7815.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  88%|████████▊ | 1062/1208 [30:26<04:11,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.58e-5, train/loss_step=0.0144, global_step=7815.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  88%|████████▊ | 1063/1208 [30:27<04:09,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.58e-5, train/loss_step=0.0144, global_step=7815.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  88%|████████▊ | 1063/1208 [30:27<04:09,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00136, train/loss_step=0.291, global_step=7815.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  88%|████████▊ | 1064/1208 [30:31<04:07,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00136, train/loss_step=0.291, global_step=7815.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  88%|████████▊ | 1064/1208 [30:31<04:07,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000535, train/loss_step=0.153, global_step=7815.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  88%|████████▊ | 1065/1208 [30:32<04:06,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000535, train/loss_step=0.153, global_step=7815.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  88%|████████▊ | 1065/1208 [30:32<04:06,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0432, train/loss_vlb_step=0.000157, train/loss_step=0.0432, global_step=7816.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  88%|████████▊ | 1066/1208 [30:33<04:04,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0432, train/loss_vlb_step=0.000157, train/loss_step=0.0432, global_step=7816.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  88%|████████▊ | 1066/1208 [30:33<04:04,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000102, train/loss_step=0.0263, global_step=7816.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  88%|████████▊ | 1067/1208 [30:34<04:02,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000102, train/loss_step=0.0263, global_step=7816.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  88%|████████▊ | 1067/1208 [30:34<04:02,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0444, train/loss_vlb_step=0.000163, train/loss_step=0.0444, global_step=7816.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  88%|████████▊ | 1068/1208 [30:37<04:00,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0444, train/loss_vlb_step=0.000163, train/loss_step=0.0444, global_step=7816.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  88%|████████▊ | 1068/1208 [30:37<04:00,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.27e-5, train/loss_step=0.0021, global_step=7816.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  88%|████████▊ | 1069/1208 [30:38<03:59,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.27e-5, train/loss_step=0.0021, global_step=7816.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  88%|████████▊ | 1069/1208 [30:38<03:59,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.000106, train/loss_step=0.0276, global_step=7817.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  89%|████████▊ | 1070/1208 [30:39<03:57,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.000106, train/loss_step=0.0276, global_step=7817.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  89%|████████▊ | 1070/1208 [30:39<03:57,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000955, train/loss_step=0.237, global_step=7817.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  89%|████████▊ | 1071/1208 [30:40<03:55,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000955, train/loss_step=0.237, global_step=7817.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  89%|████████▊ | 1071/1208 [30:40<03:55,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000113, train/loss_step=0.0308, global_step=7817.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  89%|████████▊ | 1072/1208 [30:44<03:53,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000113, train/loss_step=0.0308, global_step=7817.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  89%|████████▊ | 1072/1208 [30:44<03:53,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.69e-5, train/loss_step=0.00303, global_step=7817.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  89%|████████▉ | 1073/1208 [30:45<03:52,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.69e-5, train/loss_step=0.00303, global_step=7817.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  89%|████████▉ | 1073/1208 [30:45<03:52,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00687, train/loss_vlb_step=3.55e-5, train/loss_step=0.00687, global_step=7818.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  89%|████████▉ | 1074/1208 [30:46<03:50,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00687, train/loss_vlb_step=3.55e-5, train/loss_step=0.00687, global_step=7818.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  89%|████████▉ | 1074/1208 [30:46<03:50,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000875, train/loss_step=0.230, global_step=7818.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  89%|████████▉ | 1075/1208 [30:47<03:48,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000875, train/loss_step=0.230, global_step=7818.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  89%|████████▉ | 1075/1208 [30:47<03:48,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0674, train/loss_vlb_step=0.000227, train/loss_step=0.0674, global_step=7818.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  89%|████████▉ | 1076/1208 [30:50<03:47,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0674, train/loss_vlb_step=0.000227, train/loss_step=0.0674, global_step=7818.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  89%|████████▉ | 1076/1208 [30:50<03:47,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.0028, train/loss_step=0.417, global_step=7818.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  89%|████████▉ | 1077/1208 [30:51<03:45,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.0028, train/loss_step=0.417, global_step=7818.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  89%|████████▉ | 1077/1208 [30:51<03:45,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00132, train/loss_vlb_step=8.03e-6, train/loss_step=0.00132, global_step=7819.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  89%|████████▉ | 1078/1208 [30:52<03:43,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00132, train/loss_vlb_step=8.03e-6, train/loss_step=0.00132, global_step=7819.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  89%|████████▉ | 1078/1208 [30:52<03:43,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000105, train/loss_step=0.026, global_step=7819.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  89%|████████▉ | 1079/1208 [30:53<03:41,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000105, train/loss_step=0.026, global_step=7819.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  89%|████████▉ | 1079/1208 [30:53<03:41,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.094, train/loss_vlb_step=0.000309, train/loss_step=0.094, global_step=7819.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  89%|████████▉ | 1080/1208 [30:57<03:40,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.094, train/loss_vlb_step=0.000309, train/loss_step=0.094, global_step=7819.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  89%|████████▉ | 1080/1208 [30:57<03:40,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000888, train/loss_step=0.226, global_step=7819.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  89%|████████▉ | 1081/1208 [30:58<03:38,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000888, train/loss_step=0.226, global_step=7819.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  89%|████████▉ | 1081/1208 [30:58<03:38,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000956, train/loss_step=0.236, global_step=7820.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  90%|████████▉ | 1082/1208 [30:59<03:36,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000956, train/loss_step=0.236, global_step=7820.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  90%|████████▉ | 1082/1208 [30:59<03:36,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0892, train/loss_vlb_step=0.000293, train/loss_step=0.0892, global_step=7820.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  90%|████████▉ | 1083/1208 [31:00<03:34,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0892, train/loss_vlb_step=0.000293, train/loss_step=0.0892, global_step=7820.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  90%|████████▉ | 1083/1208 [31:00<03:34,  1.72s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.00748, train/loss_vlb_step=3.7e-5, train/loss_step=0.00748, global_step=7820.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  90%|████████▉ | 1084/1208 [31:03<03:33,  1.72s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.00748, train/loss_vlb_step=3.7e-5, train/loss_step=0.00748, global_step=7820.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  90%|████████▉ | 1084/1208 [31:03<03:33,  1.72s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.95e-5, train/loss_step=0.0135, global_step=7820.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  90%|████████▉ | 1085/1208 [31:04<03:31,  1.72s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.95e-5, train/loss_step=0.0135, global_step=7820.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  90%|████████▉ | 1085/1208 [31:04<03:31,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00139, train/loss_step=0.299, global_step=7821.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  90%|████████▉ | 1086/1208 [31:05<03:29,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00139, train/loss_step=0.299, global_step=7821.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  90%|████████▉ | 1086/1208 [31:05<03:29,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0609, train/loss_vlb_step=0.000208, train/loss_step=0.0609, global_step=7821.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  90%|████████▉ | 1087/1208 [31:06<03:27,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0609, train/loss_vlb_step=0.000208, train/loss_step=0.0609, global_step=7821.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  90%|████████▉ | 1087/1208 [31:06<03:27,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00311, train/loss_step=0.351, global_step=7821.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  90%|█████████ | 1088/1208 [31:10<03:26,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00311, train/loss_step=0.351, global_step=7821.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  90%|█████████ | 1088/1208 [31:10<03:26,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.0023, train/loss_step=0.363, global_step=7821.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  90%|█████████ | 1089/1208 [31:11<03:24,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.0023, train/loss_step=0.363, global_step=7821.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  90%|█████████ | 1089/1208 [31:11<03:24,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0384, train/loss_vlb_step=0.000135, train/loss_step=0.0384, global_step=7822.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  90%|█████████ | 1090/1208 [31:12<03:22,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0384, train/loss_vlb_step=0.000135, train/loss_step=0.0384, global_step=7822.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  90%|█████████ | 1090/1208 [31:12<03:22,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00642, train/loss_vlb_step=3.15e-5, train/loss_step=0.00642, global_step=7822.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  90%|█████████ | 1091/1208 [31:13<03:20,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00642, train/loss_vlb_step=3.15e-5, train/loss_step=0.00642, global_step=7822.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  90%|█████████ | 1091/1208 [31:13<03:20,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00641, train/loss_vlb_step=3.25e-5, train/loss_step=0.00641, global_step=7822.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  90%|█████████ | 1092/1208 [31:16<03:19,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00641, train/loss_vlb_step=3.25e-5, train/loss_step=0.00641, global_step=7822.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  90%|█████████ | 1092/1208 [31:16<03:19,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000527, train/loss_step=0.154, global_step=7822.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  90%|█████████ | 1093/1208 [31:17<03:17,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000527, train/loss_step=0.154, global_step=7822.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  90%|█████████ | 1093/1208 [31:17<03:17,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0035, train/loss_vlb_step=1.87e-5, train/loss_step=0.0035, global_step=7823.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  91%|█████████ | 1094/1208 [31:18<03:15,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0035, train/loss_vlb_step=1.87e-5, train/loss_step=0.0035, global_step=7823.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  91%|█████████ | 1094/1208 [31:18<03:15,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000586, train/loss_step=0.169, global_step=7823.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  91%|█████████ | 1095/1208 [31:19<03:13,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000586, train/loss_step=0.169, global_step=7823.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  91%|█████████ | 1095/1208 [31:19<03:13,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.00041, train/loss_step=0.125, global_step=7823.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  91%|█████████ | 1096/1208 [31:23<03:12,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.00041, train/loss_step=0.125, global_step=7823.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  91%|█████████ | 1096/1208 [31:23<03:12,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0793, train/loss_vlb_step=0.000265, train/loss_step=0.0793, global_step=7823.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  91%|█████████ | 1097/1208 [31:24<03:10,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0793, train/loss_vlb_step=0.000265, train/loss_step=0.0793, global_step=7823.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  91%|█████████ | 1097/1208 [31:24<03:10,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.452, train/loss_vlb_step=0.00416, train/loss_step=0.452, global_step=7824.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  91%|█████████ | 1098/1208 [31:25<03:08,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.452, train/loss_vlb_step=0.00416, train/loss_step=0.452, global_step=7824.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  91%|█████████ | 1098/1208 [31:25<03:08,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.649, train/loss_vlb_step=0.0158, train/loss_step=0.649, global_step=7824.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  91%|█████████ | 1099/1208 [31:26<03:07,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.649, train/loss_vlb_step=0.0158, train/loss_step=0.649, global_step=7824.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  91%|█████████ | 1099/1208 [31:26<03:07,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0597, train/loss_vlb_step=0.000208, train/loss_step=0.0597, global_step=7824.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  91%|█████████ | 1100/1208 [31:29<03:05,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0597, train/loss_vlb_step=0.000208, train/loss_step=0.0597, global_step=7824.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  91%|█████████ | 1100/1208 [31:29<03:05,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00776, train/loss_vlb_step=3.78e-5, train/loss_step=0.00776, global_step=7824.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  91%|█████████ | 1101/1208 [31:30<03:03,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00776, train/loss_vlb_step=3.78e-5, train/loss_step=0.00776, global_step=7824.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  91%|█████████ | 1101/1208 [31:30<03:03,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000545, train/loss_step=0.155, global_step=7825.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  91%|█████████ | 1102/1208 [31:31<03:01,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000545, train/loss_step=0.155, global_step=7825.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  91%|█████████ | 1102/1208 [31:31<03:01,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.071, train/loss_vlb_step=0.000241, train/loss_step=0.071, global_step=7825.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  91%|█████████▏| 1103/1208 [31:32<03:00,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.071, train/loss_vlb_step=0.000241, train/loss_step=0.071, global_step=7825.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  91%|█████████▏| 1103/1208 [31:32<03:00,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00282, train/loss_step=0.399, global_step=7825.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  91%|█████████▏| 1104/1208 [31:35<02:58,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00282, train/loss_step=0.399, global_step=7825.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  91%|█████████▏| 1104/1208 [31:35<02:58,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0511, train/loss_vlb_step=0.000178, train/loss_step=0.0511, global_step=7825.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  91%|█████████▏| 1105/1208 [31:37<02:56,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0511, train/loss_vlb_step=0.000178, train/loss_step=0.0511, global_step=7825.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  91%|█████████▏| 1105/1208 [31:37<02:56,  1.72s/it, loss=0.196, v_num=0, train/loss_simple_step=0.714, train/loss_vlb_step=0.0222, train/loss_step=0.714, global_step=7826.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  92%|█████████▏| 1106/1208 [31:38<02:55,  1.72s/it, loss=0.196, v_num=0, train/loss_simple_step=0.714, train/loss_vlb_step=0.0222, train/loss_step=0.714, global_step=7826.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  92%|█████████▏| 1106/1208 [31:38<02:55,  1.72s/it, loss=0.199, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000431, train/loss_step=0.130, global_step=7826.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  92%|█████████▏| 1107/1208 [31:39<02:53,  1.72s/it, loss=0.199, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000431, train/loss_step=0.130, global_step=7826.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  92%|█████████▏| 1107/1208 [31:39<02:53,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00337, train/loss_vlb_step=1.84e-5, train/loss_step=0.00337, global_step=7826.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  92%|█████████▏| 1108/1208 [31:42<02:51,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00337, train/loss_vlb_step=1.84e-5, train/loss_step=0.00337, global_step=7826.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  92%|█████████▏| 1108/1208 [31:42<02:51,  1.72s/it, loss=0.185, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.00502, train/loss_step=0.417, global_step=7826.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  92%|█████████▏| 1109/1208 [31:43<02:49,  1.72s/it, loss=0.185, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.00502, train/loss_step=0.417, global_step=7826.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  92%|█████████▏| 1109/1208 [31:43<02:49,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.56e-5, train/loss_step=0.0207, global_step=7827.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  92%|█████████▏| 1110/1208 [31:44<02:48,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.56e-5, train/loss_step=0.0207, global_step=7827.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  92%|█████████▏| 1110/1208 [31:44<02:48,  1.72s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.23e-5, train/loss_step=0.0239, global_step=7827.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  92%|█████████▏| 1111/1208 [31:45<02:46,  1.72s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.23e-5, train/loss_step=0.0239, global_step=7827.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  92%|█████████▏| 1111/1208 [31:45<02:46,  1.72s/it, loss=0.21, v_num=0, train/loss_simple_step=0.514, train/loss_vlb_step=0.00597, train/loss_step=0.514, global_step=7827.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  92%|█████████▏| 1112/1208 [31:48<02:44,  1.72s/it, loss=0.21, v_num=0, train/loss_simple_step=0.514, train/loss_vlb_step=0.00597, train/loss_step=0.514, global_step=7827.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  92%|█████████▏| 1112/1208 [31:48<02:44,  1.72s/it, loss=0.202, v_num=0, train/loss_simple_step=0.00567, train/loss_vlb_step=2.91e-5, train/loss_step=0.00567, global_step=7827.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  92%|█████████▏| 1113/1208 [31:49<02:43,  1.72s/it, loss=0.202, v_num=0, train/loss_simple_step=0.00567, train/loss_vlb_step=2.91e-5, train/loss_step=0.00567, global_step=7827.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  92%|█████████▏| 1113/1208 [31:49<02:43,  1.72s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.83e-5, train/loss_step=0.0103, global_step=7828.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  92%|█████████▏| 1114/1208 [31:50<02:41,  1.72s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.83e-5, train/loss_step=0.0103, global_step=7828.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  92%|█████████▏| 1114/1208 [31:50<02:41,  1.72s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0988, train/loss_vlb_step=0.000325, train/loss_step=0.0988, global_step=7828.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  92%|█████████▏| 1115/1208 [31:52<02:39,  1.71s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0988, train/loss_vlb_step=0.000325, train/loss_step=0.0988, global_step=7828.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  92%|█████████▏| 1115/1208 [31:52<02:39,  1.71s/it, loss=0.194, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.39e-5, train/loss_step=0.018, global_step=7828.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  92%|█████████▏| 1116/1208 [31:55<02:37,  1.72s/it, loss=0.194, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.39e-5, train/loss_step=0.018, global_step=7828.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  92%|█████████▏| 1116/1208 [31:55<02:37,  1.72s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.83e-5, train/loss_step=0.0106, global_step=7828.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  92%|█████████▏| 1117/1208 [31:56<02:36,  1.72s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.83e-5, train/loss_step=0.0106, global_step=7828.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  92%|█████████▏| 1117/1208 [31:56<02:36,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000565, train/loss_step=0.163, global_step=7829.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  93%|█████████▎| 1118/1208 [31:57<02:34,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000565, train/loss_step=0.163, global_step=7829.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  93%|█████████▎| 1118/1208 [31:57<02:34,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.06e-5, train/loss_step=0.0138, global_step=7829.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  93%|█████████▎| 1119/1208 [31:58<02:32,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.06e-5, train/loss_step=0.0138, global_step=7829.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  93%|█████████▎| 1119/1208 [31:58<02:32,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00193, train/loss_step=0.359, global_step=7829.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  93%|█████████▎| 1120/1208 [32:01<02:30,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00193, train/loss_step=0.359, global_step=7829.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  93%|█████████▎| 1120/1208 [32:01<02:30,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.500, train/loss_vlb_step=0.00424, train/loss_step=0.500, global_step=7829.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  93%|█████████▎| 1121/1208 [32:02<02:29,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.500, train/loss_vlb_step=0.00424, train/loss_step=0.500, global_step=7829.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  93%|█████████▎| 1121/1208 [32:02<02:29,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000123, train/loss_step=0.0332, global_step=7830.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  93%|█████████▎| 1122/1208 [32:03<02:27,  1.71s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000123, train/loss_step=0.0332, global_step=7830.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  93%|█████████▎| 1122/1208 [32:03<02:27,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0043, train/loss_vlb_step=2.13e-5, train/loss_step=0.0043, global_step=7830.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  93%|█████████▎| 1123/1208 [32:04<02:25,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0043, train/loss_vlb_step=2.13e-5, train/loss_step=0.0043, global_step=7830.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  93%|█████████▎| 1123/1208 [32:04<02:25,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0714, train/loss_vlb_step=0.000246, train/loss_step=0.0714, global_step=7830.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  93%|█████████▎| 1124/1208 [32:08<02:24,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0714, train/loss_vlb_step=0.000246, train/loss_step=0.0714, global_step=7830.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  93%|█████████▎| 1124/1208 [32:08<02:24,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=9.13e-6, train/loss_step=0.0015, global_step=7830.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  93%|█████████▎| 1125/1208 [32:09<02:22,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=9.13e-6, train/loss_step=0.0015, global_step=7830.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  93%|█████████▎| 1125/1208 [32:09<02:22,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.05e-5, train/loss_step=0.00173, global_step=7831.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  93%|█████████▎| 1126/1208 [32:10<02:20,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.05e-5, train/loss_step=0.00173, global_step=7831.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  93%|█████████▎| 1126/1208 [32:10<02:20,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=7831.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  93%|█████████▎| 1127/1208 [32:11<02:18,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=7831.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  93%|█████████▎| 1127/1208 [32:11<02:18,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000115, train/loss_step=0.0296, global_step=7831.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  93%|█████████▎| 1128/1208 [32:14<02:17,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000115, train/loss_step=0.0296, global_step=7831.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  93%|█████████▎| 1128/1208 [32:14<02:17,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00161, train/loss_step=0.325, global_step=7831.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  93%|█████████▎| 1129/1208 [32:15<02:15,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00161, train/loss_step=0.325, global_step=7831.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  93%|█████████▎| 1129/1208 [32:15<02:15,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000546, train/loss_step=0.159, global_step=7832.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  94%|█████████▎| 1130/1208 [32:16<02:13,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000546, train/loss_step=0.159, global_step=7832.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  94%|█████████▎| 1130/1208 [32:16<02:13,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.000946, train/loss_step=0.258, global_step=7832.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  94%|█████████▎| 1131/1208 [32:17<02:11,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.000946, train/loss_step=0.258, global_step=7832.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  94%|█████████▎| 1131/1208 [32:17<02:11,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00297, train/loss_vlb_step=1.65e-5, train/loss_step=0.00297, global_step=7832.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  94%|█████████▎| 1132/1208 [32:21<02:10,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00297, train/loss_vlb_step=1.65e-5, train/loss_step=0.00297, global_step=7832.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  94%|█████████▎| 1132/1208 [32:21<02:10,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00152, train/loss_step=0.310, global_step=7832.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  94%|█████████▍| 1133/1208 [32:22<02:08,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00152, train/loss_step=0.310, global_step=7832.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  94%|█████████▍| 1133/1208 [32:22<02:08,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00217, train/loss_step=0.365, global_step=7833.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  94%|█████████▍| 1134/1208 [32:23<02:06,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00217, train/loss_step=0.365, global_step=7833.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  94%|█████████▍| 1134/1208 [32:23<02:06,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000886, train/loss_step=0.213, global_step=7833.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  94%|█████████▍| 1135/1208 [32:24<02:05,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000886, train/loss_step=0.213, global_step=7833.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  94%|█████████▍| 1135/1208 [32:24<02:05,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00367, train/loss_vlb_step=2.1e-5, train/loss_step=0.00367, global_step=7833.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  94%|█████████▍| 1136/1208 [32:27<02:03,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00367, train/loss_vlb_step=2.1e-5, train/loss_step=0.00367, global_step=7833.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  94%|█████████▍| 1136/1208 [32:27<02:03,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00759, train/loss_vlb_step=3.89e-5, train/loss_step=0.00759, global_step=7833.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  94%|█████████▍| 1137/1208 [32:28<02:01,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00759, train/loss_vlb_step=3.89e-5, train/loss_step=0.00759, global_step=7833.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  94%|█████████▍| 1137/1208 [32:28<02:01,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000103, train/loss_step=0.0263, global_step=7834.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  94%|█████████▍| 1138/1208 [32:29<01:59,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000103, train/loss_step=0.0263, global_step=7834.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  94%|█████████▍| 1138/1208 [32:29<01:59,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.000972, train/loss_step=0.256, global_step=7834.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  94%|█████████▍| 1139/1208 [32:30<01:58,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.000972, train/loss_step=0.256, global_step=7834.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  94%|█████████▍| 1139/1208 [32:30<01:58,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0766, train/loss_vlb_step=0.000258, train/loss_step=0.0766, global_step=7834.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  94%|█████████▍| 1140/1208 [32:34<01:56,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0766, train/loss_vlb_step=0.000258, train/loss_step=0.0766, global_step=7834.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  94%|█████████▍| 1140/1208 [32:34<01:56,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0082, train/loss_vlb_step=3.99e-5, train/loss_step=0.0082, global_step=7834.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  94%|█████████▍| 1141/1208 [32:35<01:54,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0082, train/loss_vlb_step=3.99e-5, train/loss_step=0.0082, global_step=7834.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  94%|█████████▍| 1141/1208 [32:35<01:54,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0829, train/loss_vlb_step=0.000277, train/loss_step=0.0829, global_step=7835.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  95%|█████████▍| 1142/1208 [32:36<01:53,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0829, train/loss_vlb_step=0.000277, train/loss_step=0.0829, global_step=7835.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  95%|█████████▍| 1142/1208 [32:36<01:53,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0852, train/loss_vlb_step=0.000283, train/loss_step=0.0852, global_step=7835.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  95%|█████████▍| 1143/1208 [32:37<01:51,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0852, train/loss_vlb_step=0.000283, train/loss_step=0.0852, global_step=7835.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  95%|█████████▍| 1143/1208 [32:37<01:51,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.00085, train/loss_step=0.195, global_step=7835.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  95%|█████████▍| 1144/1208 [32:40<01:49,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.00085, train/loss_step=0.195, global_step=7835.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  95%|█████████▍| 1144/1208 [32:40<01:49,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.00077, train/loss_step=0.208, global_step=7835.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  95%|█████████▍| 1145/1208 [32:41<01:47,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.00077, train/loss_step=0.208, global_step=7835.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  95%|█████████▍| 1145/1208 [32:41<01:47,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00633, train/loss_vlb_step=3.09e-5, train/loss_step=0.00633, global_step=7836.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  95%|█████████▍| 1146/1208 [32:42<01:46,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00633, train/loss_vlb_step=3.09e-5, train/loss_step=0.00633, global_step=7836.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  95%|█████████▍| 1146/1208 [32:42<01:46,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00383, train/loss_vlb_step=2.05e-5, train/loss_step=0.00383, global_step=7836.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  95%|█████████▍| 1147/1208 [32:44<01:44,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00383, train/loss_vlb_step=2.05e-5, train/loss_step=0.00383, global_step=7836.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  95%|█████████▍| 1147/1208 [32:44<01:44,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.26e-5, train/loss_step=0.0138, global_step=7836.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  95%|█████████▌| 1148/1208 [32:47<01:42,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6.26e-5, train/loss_step=0.0138, global_step=7836.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  95%|█████████▌| 1148/1208 [32:47<01:42,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.0103, train/loss_step=0.512, global_step=7836.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  95%|█████████▌| 1149/1208 [32:48<01:41,  1.71s/it, loss=0.14, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.0103, train/loss_step=0.512, global_step=7836.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  95%|█████████▌| 1149/1208 [32:48<01:41,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.66e-5, train/loss_step=0.0209, global_step=7837.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  95%|█████████▌| 1150/1208 [32:49<01:39,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.66e-5, train/loss_step=0.0209, global_step=7837.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  95%|█████████▌| 1150/1208 [32:49<01:39,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00264, train/loss_step=0.348, global_step=7837.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  95%|█████████▌| 1151/1208 [32:50<01:37,  1.71s/it, loss=0.137, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00264, train/loss_step=0.348, global_step=7837.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  95%|█████████▌| 1151/1208 [32:50<01:37,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00183, train/loss_step=0.324, global_step=7837.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  95%|█████████▌| 1152/1208 [32:53<01:35,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00183, train/loss_step=0.324, global_step=7837.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  95%|█████████▌| 1152/1208 [32:53<01:35,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=9.84e-6, train/loss_step=0.00162, global_step=7837.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  95%|█████████▌| 1153/1208 [32:54<01:34,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=9.84e-6, train/loss_step=0.00162, global_step=7837.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  95%|█████████▌| 1153/1208 [32:54<01:34,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.49e-5, train/loss_step=0.0243, global_step=7838.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  96%|█████████▌| 1154/1208 [32:55<01:32,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.49e-5, train/loss_step=0.0243, global_step=7838.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  96%|█████████▌| 1154/1208 [32:55<01:32,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000866, train/loss_step=0.212, global_step=7838.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  96%|█████████▌| 1155/1208 [32:56<01:30,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000866, train/loss_step=0.212, global_step=7838.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  96%|█████████▌| 1155/1208 [32:56<01:30,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=9.84e-6, train/loss_step=0.00161, global_step=7838.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  96%|█████████▌| 1156/1208 [33:00<01:29,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=9.84e-6, train/loss_step=0.00161, global_step=7838.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  96%|█████████▌| 1156/1208 [33:00<01:29,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.79e-5, train/loss_step=0.013, global_step=7838.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  96%|█████████▌| 1157/1208 [33:01<01:27,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.79e-5, train/loss_step=0.013, global_step=7838.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  96%|█████████▌| 1157/1208 [33:01<01:27,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000723, train/loss_step=0.189, global_step=7839.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  96%|█████████▌| 1158/1208 [33:02<01:25,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000723, train/loss_step=0.189, global_step=7839.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  96%|█████████▌| 1158/1208 [33:02<01:25,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=1.36e-5, train/loss_step=0.00242, global_step=7839.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  96%|█████████▌| 1159/1208 [33:03<01:23,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=1.36e-5, train/loss_step=0.00242, global_step=7839.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  96%|█████████▌| 1159/1208 [33:03<01:23,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00275, train/loss_vlb_step=1.62e-5, train/loss_step=0.00275, global_step=7839.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  96%|█████████▌| 1160/1208 [33:06<01:22,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00275, train/loss_vlb_step=1.62e-5, train/loss_step=0.00275, global_step=7839.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  96%|█████████▌| 1160/1208 [33:06<01:22,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.34e-5, train/loss_step=0.0102, global_step=7839.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  96%|█████████▌| 1161/1208 [33:07<01:20,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.34e-5, train/loss_step=0.0102, global_step=7839.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  96%|█████████▌| 1161/1208 [33:07<01:20,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.6e-5, train/loss_step=0.0124, global_step=7840.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  96%|█████████▌| 1162/1208 [33:08<01:18,  1.71s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.6e-5, train/loss_step=0.0124, global_step=7840.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  96%|█████████▌| 1162/1208 [33:08<01:18,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000143, train/loss_step=0.0387, global_step=7840.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  96%|█████████▋| 1163/1208 [33:09<01:16,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000143, train/loss_step=0.0387, global_step=7840.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  96%|█████████▋| 1163/1208 [33:09<01:16,  1.71s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=1.02e-5, train/loss_step=0.0017, global_step=7840.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  96%|█████████▋| 1164/1208 [33:13<01:15,  1.71s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=1.02e-5, train/loss_step=0.0017, global_step=7840.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  96%|█████████▋| 1164/1208 [33:13<01:15,  1.71s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.00397, train/loss_vlb_step=2.06e-5, train/loss_step=0.00397, global_step=7840.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  96%|█████████▋| 1165/1208 [33:14<01:13,  1.71s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.00397, train/loss_vlb_step=2.06e-5, train/loss_step=0.00397, global_step=7840.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  96%|█████████▋| 1165/1208 [33:14<01:13,  1.71s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.00591, train/loss_vlb_step=2.92e-5, train/loss_step=0.00591, global_step=7841.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  97%|█████████▋| 1166/1208 [33:15<01:11,  1.71s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.00591, train/loss_vlb_step=2.92e-5, train/loss_step=0.00591, global_step=7841.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  97%|█████████▋| 1166/1208 [33:15<01:11,  1.71s/it, loss=0.09, v_num=0, train/loss_simple_step=0.0613, train/loss_vlb_step=0.000213, train/loss_step=0.0613, global_step=7841.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  97%|█████████▋| 1167/1208 [33:16<01:10,  1.71s/it, loss=0.09, v_num=0, train/loss_simple_step=0.0613, train/loss_vlb_step=0.000213, train/loss_step=0.0613, global_step=7841.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  97%|█████████▋| 1167/1208 [33:16<01:10,  1.71s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.0642, train/loss_vlb_step=0.000219, train/loss_step=0.0642, global_step=7841.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  97%|█████████▋| 1168/1208 [33:19<01:08,  1.71s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.0642, train/loss_vlb_step=0.000219, train/loss_step=0.0642, global_step=7841.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  97%|█████████▋| 1168/1208 [33:19<01:08,  1.71s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00292, train/loss_step=0.393, global_step=7841.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  97%|█████████▋| 1169/1208 [33:20<01:06,  1.71s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00292, train/loss_step=0.393, global_step=7841.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  97%|█████████▋| 1169/1208 [33:20<01:06,  1.71s/it, loss=0.095, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000684, train/loss_step=0.191, global_step=7842.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  97%|█████████▋| 1170/1208 [33:21<01:05,  1.71s/it, loss=0.095, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000684, train/loss_step=0.191, global_step=7842.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  97%|█████████▋| 1170/1208 [33:21<01:05,  1.71s/it, loss=0.0859, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000586, train/loss_step=0.166, global_step=7842.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  97%|█████████▋| 1171/1208 [33:22<01:03,  1.71s/it, loss=0.0859, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000586, train/loss_step=0.166, global_step=7842.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  97%|█████████▋| 1171/1208 [33:22<01:03,  1.71s/it, loss=0.0701, v_num=0, train/loss_simple_step=0.00683, train/loss_vlb_step=3.4e-5, train/loss_step=0.00683, global_step=7842.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  97%|█████████▋| 1172/1208 [33:25<01:01,  1.71s/it, loss=0.0701, v_num=0, train/loss_simple_step=0.00683, train/loss_vlb_step=3.4e-5, train/loss_step=0.00683, global_step=7842.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  97%|█████████▋| 1172/1208 [33:25<01:01,  1.71s/it, loss=0.0803, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000717, train/loss_step=0.207, global_step=7842.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  97%|█████████▋| 1173/1208 [33:26<00:59,  1.71s/it, loss=0.0803, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000717, train/loss_step=0.207, global_step=7842.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  97%|█████████▋| 1173/1208 [33:26<00:59,  1.71s/it, loss=0.0792, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=1.51e-5, train/loss_step=0.00271, global_step=7843.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  97%|█████████▋| 1174/1208 [33:28<00:58,  1.71s/it, loss=0.0792, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=1.51e-5, train/loss_step=0.00271, global_step=7843.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  97%|█████████▋| 1174/1208 [33:28<00:58,  1.71s/it, loss=0.073, v_num=0, train/loss_simple_step=0.0864, train/loss_vlb_step=0.000286, train/loss_step=0.0864, global_step=7843.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  97%|█████████▋| 1175/1208 [33:29<00:56,  1.71s/it, loss=0.073, v_num=0, train/loss_simple_step=0.0864, train/loss_vlb_step=0.000286, train/loss_step=0.0864, global_step=7843.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  97%|█████████▋| 1175/1208 [33:29<00:56,  1.71s/it, loss=0.0814, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.00067, train/loss_step=0.170, global_step=7843.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  97%|█████████▋| 1176/1208 [33:32<00:54,  1.71s/it, loss=0.0814, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.00067, train/loss_step=0.170, global_step=7843.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  97%|█████████▋| 1176/1208 [33:32<00:54,  1.71s/it, loss=0.0826, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000146, train/loss_step=0.0387, global_step=7843.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  97%|█████████▋| 1177/1208 [33:33<00:53,  1.71s/it, loss=0.0826, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000146, train/loss_step=0.0387, global_step=7843.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  97%|█████████▋| 1177/1208 [33:33<00:53,  1.71s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00215, train/loss_step=0.354, global_step=7844.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25:  98%|█████████▊| 1178/1208 [33:34<00:51,  1.71s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00215, train/loss_step=0.354, global_step=7844.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  98%|█████████▊| 1178/1208 [33:34<00:51,  1.71s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.28e-5, train/loss_step=0.0021, global_step=7844.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  98%|█████████▊| 1179/1208 [33:35<00:49,  1.71s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.28e-5, train/loss_step=0.0021, global_step=7844.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  98%|█████████▊| 1179/1208 [33:35<00:49,  1.71s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000638, train/loss_step=0.182, global_step=7844.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  98%|█████████▊| 1180/1208 [33:38<00:47,  1.71s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000638, train/loss_step=0.182, global_step=7844.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  98%|█████████▊| 1180/1208 [33:38<00:47,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000112, train/loss_step=0.029, global_step=7844.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  98%|█████████▊| 1181/1208 [33:39<00:46,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000112, train/loss_step=0.029, global_step=7844.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  98%|█████████▊| 1181/1208 [33:39<00:46,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.97e-5, train/loss_step=0.0154, global_step=7845.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  98%|█████████▊| 1182/1208 [33:40<00:44,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.97e-5, train/loss_step=0.0154, global_step=7845.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  98%|█████████▊| 1182/1208 [33:40<00:44,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0694, train/loss_vlb_step=0.000233, train/loss_step=0.0694, global_step=7845.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  98%|█████████▊| 1183/1208 [33:42<00:42,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0694, train/loss_vlb_step=0.000233, train/loss_step=0.0694, global_step=7845.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  98%|█████████▊| 1183/1208 [33:42<00:42,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00288, train/loss_step=0.352, global_step=7845.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  98%|█████████▊| 1184/1208 [33:45<00:41,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00288, train/loss_step=0.352, global_step=7845.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  98%|█████████▊| 1184/1208 [33:45<00:41,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000536, train/loss_step=0.158, global_step=7845.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  98%|█████████▊| 1185/1208 [33:46<00:39,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000536, train/loss_step=0.158, global_step=7845.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  98%|█████████▊| 1185/1208 [33:46<00:39,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00521, train/loss_vlb_step=2.8e-5, train/loss_step=0.00521, global_step=7846.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  98%|█████████▊| 1186/1208 [33:47<00:37,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00521, train/loss_vlb_step=2.8e-5, train/loss_step=0.00521, global_step=7846.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  98%|█████████▊| 1186/1208 [33:47<00:37,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=8.08e-5, train/loss_step=0.0191, global_step=7846.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  98%|█████████▊| 1187/1208 [33:48<00:35,  1.71s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=8.08e-5, train/loss_step=0.0191, global_step=7846.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  98%|█████████▊| 1187/1208 [33:48<00:35,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000457, train/loss_step=0.136, global_step=7846.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  98%|█████████▊| 1188/1208 [33:51<00:34,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000457, train/loss_step=0.136, global_step=7846.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  98%|█████████▊| 1188/1208 [33:51<00:34,  1.71s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=8.91e-5, train/loss_step=0.0211, global_step=7846.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  98%|█████████▊| 1189/1208 [33:52<00:32,  1.71s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=8.91e-5, train/loss_step=0.0211, global_step=7846.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  98%|█████████▊| 1189/1208 [33:52<00:32,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.64e-5, train/loss_step=0.013, global_step=7847.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  99%|█████████▊| 1190/1208 [33:53<00:30,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.64e-5, train/loss_step=0.013, global_step=7847.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  99%|█████████▊| 1190/1208 [33:53<00:30,  1.71s/it, loss=0.0938, v_num=0, train/loss_simple_step=0.00715, train/loss_vlb_step=3.57e-5, train/loss_step=0.00715, global_step=7847.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  99%|█████████▊| 1191/1208 [33:54<00:29,  1.71s/it, loss=0.0938, v_num=0, train/loss_simple_step=0.00715, train/loss_vlb_step=3.57e-5, train/loss_step=0.00715, global_step=7847.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  99%|█████████▊| 1191/1208 [33:54<00:29,  1.71s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.13e-5, train/loss_step=0.00409, global_step=7847.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  99%|█████████▊| 1192/1208 [33:58<00:27,  1.71s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=2.13e-5, train/loss_step=0.00409, global_step=7847.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  99%|█████████▊| 1192/1208 [33:58<00:27,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00175, train/loss_step=0.355, global_step=7847.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]     Epoch 25:  99%|█████████▉| 1193/1208 [33:59<00:25,  1.71s/it, loss=0.101, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00175, train/loss_step=0.355, global_step=7847.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  99%|█████████▉| 1193/1208 [33:59<00:25,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0856, train/loss_vlb_step=0.000284, train/loss_step=0.0856, global_step=7848.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  99%|█████████▉| 1194/1208 [34:00<00:23,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0856, train/loss_vlb_step=0.000284, train/loss_step=0.0856, global_step=7848.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  99%|█████████▉| 1194/1208 [34:00<00:23,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.0019, train/loss_step=0.317, global_step=7848.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]    Epoch 25:  99%|█████████▉| 1195/1208 [34:01<00:22,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.0019, train/loss_step=0.317, global_step=7848.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  99%|█████████▉| 1195/1208 [34:01<00:22,  1.71s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.000195, train/loss_step=0.0556, global_step=7848.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  99%|█████████▉| 1196/1208 [34:04<00:20,  1.71s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.000195, train/loss_step=0.0556, global_step=7848.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  99%|█████████▉| 1196/1208 [34:04<00:20,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000467, train/loss_step=0.140, global_step=7848.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  Epoch 25:  99%|█████████▉| 1197/1208 [34:05<00:18,  1.71s/it, loss=0.116, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000467, train/loss_step=0.140, global_step=7848.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  99%|█████████▉| 1197/1208 [34:05<00:18,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000464, train/loss_step=0.140, global_step=7849.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  99%|█████████▉| 1198/1208 [34:06<00:17,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000464, train/loss_step=0.140, global_step=7849.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  99%|█████████▉| 1198/1208 [34:06<00:17,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.463, train/loss_vlb_step=0.00482, train/loss_step=0.463, global_step=7849.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25:  99%|█████████▉| 1199/1208 [34:08<00:15,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.463, train/loss_vlb_step=0.00482, train/loss_step=0.463, global_step=7849.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  99%|█████████▉| 1199/1208 [34:08<00:15,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6.2e-5, train/loss_step=0.0135, global_step=7849.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  99%|█████████▉| 1200/1208 [34:11<00:13,  1.71s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6.2e-5, train/loss_step=0.0135, global_step=7849.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  99%|█████████▉| 1200/1208 [34:11<00:13,  1.71s/it, loss=0.129, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000783, train/loss_step=0.214, global_step=7849.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.73it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.74it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.76it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.72it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.72it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.73it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.71it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.71it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.75it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:26,  1.72it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:27,  1.66it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.76it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.71it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:26,  1.68it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.79it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:25,  1.72it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:25,  1.69it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.72it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.69it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.73it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.71it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.74it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:23,  1.71it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.74it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.72it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.74it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:07<00:22,  1.72it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.75it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.73it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.76it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.74it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:20,  1.74it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.76it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.76it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.75it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.76it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.75it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.75it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.76it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.76it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:11<00:17,  1.75it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.76it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.75it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.78it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.76it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:14,  1.78it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.78it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:15<00:13,  1.75it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.75it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:16<00:12,  1.74it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.75it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.78it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.76it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.76it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.75it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.78it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.78it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.78it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:20<00:08,  1.75it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.78it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.78it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:08,  1.74it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.77it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.75it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.75it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.78it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.75it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.75it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.75it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:24<00:04,  1.74it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.73it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.74it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.76it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.78it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.74it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.74it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.74it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.75it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.75it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.75it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.78it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:27<00:01,  1.75it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.75it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.78it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.74it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.75it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.74it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.74it/s]Epoch 25:  99%|█████████▉| 1201/1208 [34:42<00:12,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000783, train/loss_step=0.214, global_step=7849.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25:  99%|█████████▉| 1201/1208 [34:42<00:12,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00637, train/loss_vlb_step=3.19e-5, train/loss_step=0.00637, global_step=7850.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25: 100%|█████████▉| 1202/1208 [34:43<00:10,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00637, train/loss_vlb_step=3.19e-5, train/loss_step=0.00637, global_step=7850.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25: 100%|█████████▉| 1202/1208 [34:43<00:10,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000362, train/loss_step=0.108, global_step=7850.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25: 100%|█████████▉| 1203/1208 [34:44<00:08,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000362, train/loss_step=0.108, global_step=7850.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25: 100%|█████████▉| 1203/1208 [34:44<00:08,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0085, train/loss_vlb_step=4.09e-5, train/loss_step=0.0085, global_step=7850.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25: 100%|█████████▉| 1204/1208 [34:47<00:06,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0085, train/loss_vlb_step=4.09e-5, train/loss_step=0.0085, global_step=7850.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25: 100%|█████████▉| 1204/1208 [34:47<00:06,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.652, train/loss_vlb_step=0.0127, train/loss_step=0.652, global_step=7850.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]   Epoch 25: 100%|█████████▉| 1205/1208 [34:48<00:05,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.652, train/loss_vlb_step=0.0127, train/loss_step=0.652, global_step=7850.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25: 100%|█████████▉| 1205/1208 [34:48<00:05,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.0019, train/loss_step=0.309, global_step=7851.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25: 100%|█████████▉| 1206/1208 [34:49<00:03,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.0019, train/loss_step=0.309, global_step=7851.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25: 100%|█████████▉| 1206/1208 [34:49<00:03,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.42e-5, train/loss_step=0.0213, global_step=7851.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25: 100%|█████████▉| 1207/1208 [34:50<00:01,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.42e-5, train/loss_step=0.0213, global_step=7851.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25: 100%|█████████▉| 1207/1208 [34:50<00:01,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000725, train/loss_step=0.193, global_step=7851.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138] Epoch 25: 100%|██████████| 1208/1208 [34:56<00:00,  1.74s/it, loss=0.156, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000725, train/loss_step=0.193, global_step=7851.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 25: 100%|██████████| 1208/1208 [34:56<00:00,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00132, train/loss_step=0.301, global_step=7851.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]  
+
+
+Epoch 25:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.17, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00132, train/loss_step=0.301, global_step=7851.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]           Epoch 26:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.17, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00132, train/loss_step=0.301, global_step=7851.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.75it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.72it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.74it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.74it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:28,  1.70it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.75it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.70it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.70it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.77it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.71it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:27,  1.69it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.74it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:26,  1.67it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.74it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.69it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.75it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:25,  1.72it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.75it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.73it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.72it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:23,  1.73it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.73it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.73it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.74it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.76it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.75it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.76it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.76it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.79it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.75it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.75it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.78it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.74it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.76it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.75it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.75it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.76it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.75it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:16,  1.74it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.78it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.75it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.78it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.78it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.74it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.74it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.74it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.76it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.76it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.72it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.76it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.75it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:16<00:12,  1.74it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:12,  1.74it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.78it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.76it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.74it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.75it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.78it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.75it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.75it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.75it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.75it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:19<00:09,  1.75it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.75it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.75it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]DDIM Sampler:  70%|███████   | 35/50 [00:20<00:08,  1.75it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:08,  1.74it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:08,  1.66it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:08,  1.75it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.75it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.69it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.75it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.75it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:07,  1.71it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.74it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.78it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.72it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.77it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.75it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.73it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.79it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.71it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.78it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.73it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:24<00:04,  1.77it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.80it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.74it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.74it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.69it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.78it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.75it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.72it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.78it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.74it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.73it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:27<00:01,  1.74it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.73it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.74it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.74it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.75it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.74it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:28<00:00,  1.75it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.74it/s]Epoch 26:   0%|          | 1/1208 [00:33<11:23:42, 33.99s/it, loss=0.17, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00132, train/loss_step=0.301, global_step=7851.0, train/loss_simple_epoch=0.138, train/loss_vlb_epoch=0.00266, train/loss_epoch=0.138]Epoch 26:   0%|          | 1/1208 [00:33<11:23:44, 33.99s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0601, train/loss_vlb_step=0.000209, train/loss_step=0.0601, global_step=7852.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   0%|          | 2/1208 [00:35<5:52:17, 17.53s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0601, train/loss_vlb_step=0.000209, train/loss_step=0.0601, global_step=7852.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:   0%|          | 2/1208 [00:35<5:52:18, 17.53s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.000147, train/loss_step=0.0395, global_step=7852.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   0%|          | 3/1208 [00:36<4:01:54, 12.05s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.000147, train/loss_step=0.0395, global_step=7852.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   0%|          | 3/1208 [00:36<4:01:54, 12.05s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=3.24e-5, train/loss_step=0.00677, global_step=7852.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   0%|          | 4/1208 [00:39<3:16:28,  9.79s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=3.24e-5, train/loss_step=0.00677, global_step=7852.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   0%|          | 4/1208 [00:39<3:16:29,  9.79s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.54e-5, train/loss_step=0.0124, global_step=7852.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:   0%|          | 5/1208 [00:40<2:41:30,  8.06s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.54e-5, train/loss_step=0.0124, global_step=7852.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   0%|          | 5/1208 [00:40<2:41:32,  8.06s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0549, train/loss_vlb_step=0.000187, train/loss_step=0.0549, global_step=7853.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   0%|          | 6/1208 [00:41<2:18:22,  6.91s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0549, train/loss_vlb_step=0.000187, train/loss_step=0.0549, global_step=7853.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   0%|          | 6/1208 [00:41<2:18:22,  6.91s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0501, train/loss_vlb_step=0.000172, train/loss_step=0.0501, global_step=7853.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   1%|          | 7/1208 [00:42<2:01:35,  6.07s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0501, train/loss_vlb_step=0.000172, train/loss_step=0.0501, global_step=7853.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   1%|          | 7/1208 [00:42<2:01:35,  6.07s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0578, train/loss_vlb_step=0.000197, train/loss_step=0.0578, global_step=7853.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   1%|          | 8/1208 [00:45<1:54:13,  5.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0578, train/loss_vlb_step=0.000197, train/loss_step=0.0578, global_step=7853.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   1%|          | 8/1208 [00:45<1:54:14,  5.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=1.7e-5, train/loss_step=0.00302, global_step=7853.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   1%|          | 9/1208 [00:46<1:43:53,  5.20s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=1.7e-5, train/loss_step=0.00302, global_step=7853.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   1%|          | 9/1208 [00:46<1:43:53,  5.20s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.96e-5, train/loss_step=0.0105, global_step=7854.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:   1%|          | 10/1208 [00:47<1:35:32,  4.78s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.96e-5, train/loss_step=0.0105, global_step=7854.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   1%|          | 10/1208 [00:47<1:35:32,  4.79s/it, loss=0.12, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00135, train/loss_step=0.274, global_step=7854.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:   1%|          | 11/1208 [00:48<1:28:49,  4.45s/it, loss=0.12, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00135, train/loss_step=0.274, global_step=7854.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   1%|          | 11/1208 [00:48<1:28:49,  4.45s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00605, train/loss_vlb_step=2.98e-5, train/loss_step=0.00605, global_step=7854.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   1%|          | 12/1208 [00:52<1:26:41,  4.35s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00605, train/loss_vlb_step=2.98e-5, train/loss_step=0.00605, global_step=7854.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   1%|          | 12/1208 [00:52<1:26:42,  4.35s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.69e-5, train/loss_step=0.0135, global_step=7854.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:   1%|          | 13/1208 [00:53<1:21:35,  4.10s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.69e-5, train/loss_step=0.0135, global_step=7854.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   1%|          | 13/1208 [00:53<1:21:35,  4.10s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00461, train/loss_vlb_step=2.42e-5, train/loss_step=0.00461, global_step=7855.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   1%|          | 14/1208 [00:54<1:17:15,  3.88s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00461, train/loss_vlb_step=2.42e-5, train/loss_step=0.00461, global_step=7855.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   1%|          | 14/1208 [00:54<1:17:15,  3.88s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=0.000101, train/loss_step=0.0257, global_step=7855.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:   1%|          | 15/1208 [00:55<1:13:29,  3.70s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=0.000101, train/loss_step=0.0257, global_step=7855.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   1%|          | 15/1208 [00:55<1:13:29,  3.70s/it, loss=0.113, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000591, train/loss_step=0.169, global_step=7855.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:   1%|▏         | 16/1208 [00:58<1:12:52,  3.67s/it, loss=0.113, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000591, train/loss_step=0.169, global_step=7855.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   1%|▏         | 16/1208 [00:58<1:12:52,  3.67s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.0898, train/loss_vlb_step=0.000295, train/loss_step=0.0898, global_step=7855.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   1%|▏         | 17/1208 [00:59<1:09:50,  3.52s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.0898, train/loss_vlb_step=0.000295, train/loss_step=0.0898, global_step=7855.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   1%|▏         | 17/1208 [00:59<1:09:50,  3.52s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.492, train/loss_vlb_step=0.00603, train/loss_step=0.492, global_step=7856.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:   1%|▏         | 18/1208 [01:00<1:07:06,  3.38s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.492, train/loss_vlb_step=0.00603, train/loss_step=0.492, global_step=7856.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   1%|▏         | 18/1208 [01:00<1:07:07,  3.38s/it, loss=0.0997, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000437, train/loss_step=0.131, global_step=7856.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   2%|▏         | 19/1208 [01:01<1:04:39,  3.26s/it, loss=0.0997, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000437, train/loss_step=0.131, global_step=7856.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   2%|▏         | 19/1208 [01:01<1:04:39,  3.26s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000502, train/loss_step=0.142, global_step=7856.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   2%|▏         | 20/1208 [01:05<1:04:32,  3.26s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000502, train/loss_step=0.142, global_step=7856.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   2%|▏         | 20/1208 [01:05<1:04:32,  3.26s/it, loss=0.0836, v_num=0, train/loss_simple_step=0.0305, train/loss_vlb_step=0.000112, train/loss_step=0.0305, global_step=7856.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   2%|▏         | 21/1208 [01:06<1:02:29,  3.16s/it, loss=0.0836, v_num=0, train/loss_simple_step=0.0305, train/loss_vlb_step=0.000112, train/loss_step=0.0305, global_step=7856.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   2%|▏         | 21/1208 [01:06<1:02:29,  3.16s/it, loss=0.081, v_num=0, train/loss_simple_step=0.00772, train/loss_vlb_step=3.72e-5, train/loss_step=0.00772, global_step=7857.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   2%|▏         | 22/1208 [01:07<1:00:36,  3.07s/it, loss=0.081, v_num=0, train/loss_simple_step=0.00772, train/loss_vlb_step=3.72e-5, train/loss_step=0.00772, global_step=7857.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   2%|▏         | 22/1208 [01:07<1:00:36,  3.07s/it, loss=0.0825, v_num=0, train/loss_simple_step=0.0699, train/loss_vlb_step=0.000239, train/loss_step=0.0699, global_step=7857.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   2%|▏         | 23/1208 [01:08<58:51,  2.98s/it, loss=0.0825, v_num=0, train/loss_simple_step=0.0699, train/loss_vlb_step=0.000239, train/loss_step=0.0699, global_step=7857.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:   2%|▏         | 23/1208 [01:08<58:51,  2.98s/it, loss=0.083, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=7.06e-5, train/loss_step=0.016, global_step=7857.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:   2%|▏         | 24/1208 [01:11<58:53,  2.98s/it, loss=0.083, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=7.06e-5, train/loss_step=0.016, global_step=7857.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   2%|▏         | 24/1208 [01:11<58:53,  2.98s/it, loss=0.0911, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000676, train/loss_step=0.174, global_step=7857.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   2%|▏         | 25/1208 [01:12<57:22,  2.91s/it, loss=0.0911, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000676, train/loss_step=0.174, global_step=7857.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   2%|▏         | 25/1208 [01:12<57:22,  2.91s/it, loss=0.109, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00221, train/loss_step=0.413, global_step=7858.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:   2%|▏         | 26/1208 [01:13<55:56,  2.84s/it, loss=0.109, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00221, train/loss_step=0.413, global_step=7858.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   2%|▏         | 26/1208 [01:13<55:56,  2.84s/it, loss=0.112, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=7858.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   2%|▏         | 27/1208 [01:14<54:34,  2.77s/it, loss=0.112, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=7858.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   2%|▏         | 27/1208 [01:14<54:34,  2.77s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.000134, train/loss_step=0.0356, global_step=7858.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   2%|▏         | 28/1208 [01:18<54:54,  2.79s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.000134, train/loss_step=0.0356, global_step=7858.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   2%|▏         | 28/1208 [01:18<54:54,  2.79s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.92e-5, train/loss_step=0.0136, global_step=7858.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:   2%|▏         | 29/1208 [01:19<53:42,  2.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.92e-5, train/loss_step=0.0136, global_step=7858.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   2%|▏         | 29/1208 [01:19<53:42,  2.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.001, train/loss_step=0.255, global_step=7859.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:   2%|▏         | 30/1208 [01:20<52:34,  2.68s/it, loss=0.124, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.001, train/loss_step=0.255, global_step=7859.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   2%|▏         | 30/1208 [01:20<52:34,  2.68s/it, loss=0.116, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000426, train/loss_step=0.129, global_step=7859.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   3%|▎         | 31/1208 [01:21<51:31,  2.63s/it, loss=0.116, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000426, train/loss_step=0.129, global_step=7859.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   3%|▎         | 31/1208 [01:21<51:31,  2.63s/it, loss=0.138, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00273, train/loss_step=0.433, global_step=7859.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:   3%|▎         | 32/1208 [01:24<51:50,  2.65s/it, loss=0.138, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00273, train/loss_step=0.433, global_step=7859.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   3%|▎         | 32/1208 [01:24<51:50,  2.65s/it, loss=0.16, v_num=0, train/loss_simple_step=0.462, train/loss_vlb_step=0.0027, train/loss_step=0.462, global_step=7859.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:   3%|▎         | 33/1208 [01:25<50:51,  2.60s/it, loss=0.16, v_num=0, train/loss_simple_step=0.462, train/loss_vlb_step=0.0027, train/loss_step=0.462, global_step=7859.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   3%|▎         | 33/1208 [01:25<50:51,  2.60s/it, loss=0.169, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000654, train/loss_step=0.180, global_step=7860.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   3%|▎         | 34/1208 [01:26<49:57,  2.55s/it, loss=0.169, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000654, train/loss_step=0.180, global_step=7860.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   3%|▎         | 34/1208 [01:26<49:57,  2.55s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0715, train/loss_vlb_step=0.000243, train/loss_step=0.0715, global_step=7860.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   3%|▎         | 35/1208 [01:27<49:04,  2.51s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0715, train/loss_vlb_step=0.000243, train/loss_step=0.0715, global_step=7860.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   3%|▎         | 35/1208 [01:27<49:04,  2.51s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0832, train/loss_vlb_step=0.000278, train/loss_step=0.0832, global_step=7860.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   3%|▎         | 36/1208 [01:31<49:26,  2.53s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0832, train/loss_vlb_step=0.000278, train/loss_step=0.0832, global_step=7860.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   3%|▎         | 36/1208 [01:31<49:26,  2.53s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.00013, train/loss_step=0.0348, global_step=7860.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:   3%|▎         | 37/1208 [01:32<48:38,  2.49s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.00013, train/loss_step=0.0348, global_step=7860.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   3%|▎         | 37/1208 [01:32<48:38,  2.49s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=5.05e-5, train/loss_step=0.0106, global_step=7861.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:   3%|▎         | 38/1208 [01:33<47:51,  2.45s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=5.05e-5, train/loss_step=0.0106, global_step=7861.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   3%|▎         | 38/1208 [01:33<47:51,  2.45s/it, loss=0.15, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.002, train/loss_step=0.324, global_step=7861.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:   3%|▎         | 39/1208 [01:34<47:08,  2.42s/it, loss=0.15, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.002, train/loss_step=0.324, global_step=7861.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   3%|▎         | 39/1208 [01:34<47:08,  2.42s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00461, train/loss_vlb_step=2.45e-5, train/loss_step=0.00461, global_step=7861.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   3%|▎         | 40/1208 [01:37<47:30,  2.44s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00461, train/loss_vlb_step=2.45e-5, train/loss_step=0.00461, global_step=7861.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   3%|▎         | 40/1208 [01:37<47:30,  2.44s/it, loss=0.148, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000458, train/loss_step=0.136, global_step=7861.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:   3%|▎         | 41/1208 [01:38<46:50,  2.41s/it, loss=0.148, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000458, train/loss_step=0.136, global_step=7861.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   3%|▎         | 41/1208 [01:38<46:50,  2.41s/it, loss=0.149, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.65e-5, train/loss_step=0.016, global_step=7862.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:   3%|▎         | 42/1208 [01:39<46:11,  2.38s/it, loss=0.149, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.65e-5, train/loss_step=0.016, global_step=7862.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   3%|▎         | 42/1208 [01:39<46:11,  2.38s/it, loss=0.151, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000383, train/loss_step=0.117, global_step=7862.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   4%|▎         | 43/1208 [01:40<45:33,  2.35s/it, loss=0.151, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000383, train/loss_step=0.117, global_step=7862.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   4%|▎         | 43/1208 [01:40<45:33,  2.35s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00553, train/loss_vlb_step=2.79e-5, train/loss_step=0.00553, global_step=7862.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   4%|▎         | 44/1208 [01:44<45:51,  2.36s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00553, train/loss_vlb_step=2.79e-5, train/loss_step=0.00553, global_step=7862.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   4%|▎         | 44/1208 [01:44<45:51,  2.36s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0988, train/loss_vlb_step=0.000325, train/loss_step=0.0988, global_step=7862.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   4%|▎         | 45/1208 [01:45<45:16,  2.34s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0988, train/loss_vlb_step=0.000325, train/loss_step=0.0988, global_step=7862.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   4%|▎         | 45/1208 [01:45<45:16,  2.34s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0726, train/loss_vlb_step=0.000243, train/loss_step=0.0726, global_step=7863.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:   4%|▍         | 46/1208 [01:46<44:41,  2.31s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0726, train/loss_vlb_step=0.000243, train/loss_step=0.0726, global_step=7863.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   4%|▍         | 46/1208 [01:46<44:41,  2.31s/it, loss=0.137, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00114, train/loss_step=0.263, global_step=7863.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:   4%|▍         | 47/1208 [01:47<44:07,  2.28s/it, loss=0.137, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00114, train/loss_step=0.263, global_step=7863.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   4%|▍         | 47/1208 [01:47<44:07,  2.28s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0985, train/loss_vlb_step=0.000325, train/loss_step=0.0985, global_step=7863.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   4%|▍         | 48/1208 [01:50<44:29,  2.30s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0985, train/loss_vlb_step=0.000325, train/loss_step=0.0985, global_step=7863.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   4%|▍         | 48/1208 [01:50<44:29,  2.30s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.84e-5, train/loss_step=0.0104, global_step=7863.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:   4%|▍         | 49/1208 [01:51<43:57,  2.28s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.84e-5, train/loss_step=0.0104, global_step=7863.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   4%|▍         | 49/1208 [01:51<43:57,  2.28s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.00017, train/loss_step=0.0483, global_step=7864.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   4%|▍         | 50/1208 [01:52<43:27,  2.25s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.00017, train/loss_step=0.0483, global_step=7864.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   4%|▍         | 50/1208 [01:52<43:27,  2.25s/it, loss=0.13, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000449, train/loss_step=0.137, global_step=7864.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:   4%|▍         | 51/1208 [01:53<42:58,  2.23s/it, loss=0.13, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000449, train/loss_step=0.137, global_step=7864.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   4%|▍         | 51/1208 [01:53<42:58,  2.23s/it, loss=0.117, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000548, train/loss_step=0.159, global_step=7864.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   4%|▍         | 52/1208 [01:56<43:17,  2.25s/it, loss=0.117, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000548, train/loss_step=0.159, global_step=7864.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   4%|▍         | 52/1208 [01:56<43:17,  2.25s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000337, train/loss_step=0.102, global_step=7864.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   4%|▍         | 53/1208 [01:57<42:51,  2.23s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000337, train/loss_step=0.102, global_step=7864.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   4%|▍         | 53/1208 [01:57<42:51,  2.23s/it, loss=0.093, v_num=0, train/loss_simple_step=0.0685, train/loss_vlb_step=0.000234, train/loss_step=0.0685, global_step=7865.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   4%|▍         | 54/1208 [01:59<42:24,  2.21s/it, loss=0.093, v_num=0, train/loss_simple_step=0.0685, train/loss_vlb_step=0.000234, train/loss_step=0.0685, global_step=7865.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   4%|▍         | 54/1208 [01:59<42:24,  2.21s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=1.3e-5, train/loss_step=0.0023, global_step=7865.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:   5%|▍         | 55/1208 [02:00<41:59,  2.19s/it, loss=0.0896, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=1.3e-5, train/loss_step=0.0023, global_step=7865.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   5%|▍         | 55/1208 [02:00<41:59,  2.19s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.09e-5, train/loss_step=0.0199, global_step=7865.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   5%|▍         | 56/1208 [02:03<42:16,  2.20s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.09e-5, train/loss_step=0.0199, global_step=7865.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   5%|▍         | 56/1208 [02:03<42:16,  2.20s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000108, train/loss_step=0.0297, global_step=7865.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   5%|▍         | 57/1208 [02:04<41:51,  2.18s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.000108, train/loss_step=0.0297, global_step=7865.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   5%|▍         | 57/1208 [02:04<41:51,  2.18s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.47e-5, train/loss_step=0.00253, global_step=7866.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   5%|▍         | 58/1208 [02:05<41:27,  2.16s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.47e-5, train/loss_step=0.00253, global_step=7866.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   5%|▍         | 58/1208 [02:05<41:27,  2.16s/it, loss=0.0702, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.79e-5, train/loss_step=0.0136, global_step=7866.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:   5%|▍         | 59/1208 [02:06<41:03,  2.14s/it, loss=0.0702, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.79e-5, train/loss_step=0.0136, global_step=7866.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   5%|▍         | 59/1208 [02:06<41:03,  2.14s/it, loss=0.0701, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=8.49e-6, train/loss_step=0.0014, global_step=7866.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   5%|▍         | 60/1208 [02:09<41:23,  2.16s/it, loss=0.0701, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=8.49e-6, train/loss_step=0.0014, global_step=7866.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   5%|▍         | 60/1208 [02:09<41:23,  2.16s/it, loss=0.0779, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00133, train/loss_step=0.292, global_step=7866.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:   5%|▌         | 61/1208 [02:10<41:00,  2.15s/it, loss=0.0779, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00133, train/loss_step=0.292, global_step=7866.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   5%|▌         | 61/1208 [02:10<41:00,  2.15s/it, loss=0.079, v_num=0, train/loss_simple_step=0.0382, train/loss_vlb_step=0.000146, train/loss_step=0.0382, global_step=7867.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   5%|▌         | 62/1208 [02:11<40:38,  2.13s/it, loss=0.079, v_num=0, train/loss_simple_step=0.0382, train/loss_vlb_step=0.000146, train/loss_step=0.0382, global_step=7867.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   5%|▌         | 62/1208 [02:11<40:38,  2.13s/it, loss=0.0749, v_num=0, train/loss_simple_step=0.0341, train/loss_vlb_step=0.000131, train/loss_step=0.0341, global_step=7867.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   5%|▌         | 63/1208 [02:12<40:17,  2.11s/it, loss=0.0749, v_num=0, train/loss_simple_step=0.0341, train/loss_vlb_step=0.000131, train/loss_step=0.0341, global_step=7867.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   5%|▌         | 63/1208 [02:12<40:17,  2.11s/it, loss=0.075, v_num=0, train/loss_simple_step=0.00781, train/loss_vlb_step=3.84e-5, train/loss_step=0.00781, global_step=7867.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   5%|▌         | 64/1208 [02:16<40:36,  2.13s/it, loss=0.075, v_num=0, train/loss_simple_step=0.00781, train/loss_vlb_step=3.84e-5, train/loss_step=0.00781, global_step=7867.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   5%|▌         | 64/1208 [02:16<40:36,  2.13s/it, loss=0.0856, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00214, train/loss_step=0.311, global_step=7867.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:   5%|▌         | 65/1208 [02:17<40:15,  2.11s/it, loss=0.0856, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00214, train/loss_step=0.311, global_step=7867.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   5%|▌         | 65/1208 [02:17<40:15,  2.11s/it, loss=0.0842, v_num=0, train/loss_simple_step=0.0447, train/loss_vlb_step=0.000165, train/loss_step=0.0447, global_step=7868.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   5%|▌         | 66/1208 [02:18<39:55,  2.10s/it, loss=0.0842, v_num=0, train/loss_simple_step=0.0447, train/loss_vlb_step=0.000165, train/loss_step=0.0447, global_step=7868.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   5%|▌         | 66/1208 [02:18<39:55,  2.10s/it, loss=0.0712, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=1.66e-5, train/loss_step=0.00294, global_step=7868.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   6%|▌         | 67/1208 [02:19<39:35,  2.08s/it, loss=0.0712, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=1.66e-5, train/loss_step=0.00294, global_step=7868.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   6%|▌         | 67/1208 [02:19<39:35,  2.08s/it, loss=0.0665, v_num=0, train/loss_simple_step=0.00504, train/loss_vlb_step=2.55e-5, train/loss_step=0.00504, global_step=7868.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   6%|▌         | 68/1208 [02:22<39:54,  2.10s/it, loss=0.0665, v_num=0, train/loss_simple_step=0.00504, train/loss_vlb_step=2.55e-5, train/loss_step=0.00504, global_step=7868.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   6%|▌         | 68/1208 [02:22<39:54,  2.10s/it, loss=0.0731, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000467, train/loss_step=0.142, global_step=7868.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:   6%|▌         | 69/1208 [02:23<39:36,  2.09s/it, loss=0.0731, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000467, train/loss_step=0.142, global_step=7868.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   6%|▌         | 69/1208 [02:23<39:36,  2.09s/it, loss=0.0783, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000513, train/loss_step=0.152, global_step=7869.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   6%|▌         | 70/1208 [02:25<39:18,  2.07s/it, loss=0.0783, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000513, train/loss_step=0.152, global_step=7869.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   6%|▌         | 70/1208 [02:25<39:19,  2.07s/it, loss=0.0734, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.000142, train/loss_step=0.0394, global_step=7869.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   6%|▌         | 71/1208 [02:26<39:00,  2.06s/it, loss=0.0734, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.000142, train/loss_step=0.0394, global_step=7869.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   6%|▌         | 71/1208 [02:26<39:01,  2.06s/it, loss=0.0665, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.53e-5, train/loss_step=0.0207, global_step=7869.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:   6%|▌         | 72/1208 [02:29<39:14,  2.07s/it, loss=0.0665, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.53e-5, train/loss_step=0.0207, global_step=7869.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   6%|▌         | 72/1208 [02:29<39:14,  2.07s/it, loss=0.0689, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000499, train/loss_step=0.150, global_step=7869.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:   6%|▌         | 73/1208 [02:30<38:57,  2.06s/it, loss=0.0689, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000499, train/loss_step=0.150, global_step=7869.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   6%|▌         | 73/1208 [02:30<38:57,  2.06s/it, loss=0.0823, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00163, train/loss_step=0.338, global_step=7870.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:   6%|▌         | 74/1208 [02:31<38:40,  2.05s/it, loss=0.0823, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00163, train/loss_step=0.338, global_step=7870.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   6%|▌         | 74/1208 [02:31<38:40,  2.05s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000909, train/loss_step=0.239, global_step=7870.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   6%|▌         | 75/1208 [02:32<38:23,  2.03s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000909, train/loss_step=0.239, global_step=7870.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   6%|▌         | 75/1208 [02:32<38:23,  2.03s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000329, train/loss_step=0.100, global_step=7870.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   6%|▋         | 76/1208 [02:35<38:39,  2.05s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000329, train/loss_step=0.100, global_step=7870.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   6%|▋         | 76/1208 [02:35<38:39,  2.05s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0926, train/loss_vlb_step=0.000309, train/loss_step=0.0926, global_step=7870.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   6%|▋         | 77/1208 [02:36<38:23,  2.04s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0926, train/loss_vlb_step=0.000309, train/loss_step=0.0926, global_step=7870.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   6%|▋         | 77/1208 [02:36<38:23,  2.04s/it, loss=0.114, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00105, train/loss_step=0.248, global_step=7871.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:   6%|▋         | 78/1208 [02:37<38:07,  2.02s/it, loss=0.114, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00105, train/loss_step=0.248, global_step=7871.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   6%|▋         | 78/1208 [02:37<38:07,  2.02s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.36e-5, train/loss_step=0.0118, global_step=7871.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   7%|▋         | 79/1208 [02:38<37:51,  2.01s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.36e-5, train/loss_step=0.0118, global_step=7871.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   7%|▋         | 79/1208 [02:38<37:51,  2.01s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.99e-5, train/loss_step=0.0128, global_step=7871.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   7%|▋         | 80/1208 [02:42<38:07,  2.03s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.99e-5, train/loss_step=0.0128, global_step=7871.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   7%|▋         | 80/1208 [02:42<38:07,  2.03s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.18e-5, train/loss_step=0.00205, global_step=7871.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   7%|▋         | 81/1208 [02:43<37:52,  2.02s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.18e-5, train/loss_step=0.00205, global_step=7871.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   7%|▋         | 81/1208 [02:43<37:52,  2.02s/it, loss=0.122, v_num=0, train/loss_simple_step=0.492, train/loss_vlb_step=0.00573, train/loss_step=0.492, global_step=7872.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]     Epoch 26:   7%|▋         | 82/1208 [02:44<37:37,  2.00s/it, loss=0.122, v_num=0, train/loss_simple_step=0.492, train/loss_vlb_step=0.00573, train/loss_step=0.492, global_step=7872.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   7%|▋         | 82/1208 [02:44<37:37,  2.00s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00928, train/loss_vlb_step=4.31e-5, train/loss_step=0.00928, global_step=7872.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   7%|▋         | 83/1208 [02:45<37:22,  1.99s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00928, train/loss_vlb_step=4.31e-5, train/loss_step=0.00928, global_step=7872.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   7%|▋         | 83/1208 [02:45<37:22,  1.99s/it, loss=0.137, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00188, train/loss_step=0.326, global_step=7872.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:   7%|▋         | 84/1208 [02:48<37:37,  2.01s/it, loss=0.137, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00188, train/loss_step=0.326, global_step=7872.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   7%|▋         | 84/1208 [02:48<37:37,  2.01s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0925, train/loss_vlb_step=0.000307, train/loss_step=0.0925, global_step=7872.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   7%|▋         | 85/1208 [02:49<37:23,  2.00s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0925, train/loss_vlb_step=0.000307, train/loss_step=0.0925, global_step=7872.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   7%|▋         | 85/1208 [02:49<37:23,  2.00s/it, loss=0.126, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000179, train/loss_step=0.050, global_step=7873.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:   7%|▋         | 86/1208 [02:50<37:09,  1.99s/it, loss=0.126, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000179, train/loss_step=0.050, global_step=7873.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   7%|▋         | 86/1208 [02:50<37:09,  1.99s/it, loss=0.133, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000445, train/loss_step=0.135, global_step=7873.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   7%|▋         | 87/1208 [02:51<36:55,  1.98s/it, loss=0.133, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000445, train/loss_step=0.135, global_step=7873.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   7%|▋         | 87/1208 [02:51<36:55,  1.98s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=8.97e-5, train/loss_step=0.0232, global_step=7873.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   7%|▋         | 88/1208 [02:55<37:08,  1.99s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=8.97e-5, train/loss_step=0.0232, global_step=7873.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   7%|▋         | 88/1208 [02:55<37:08,  1.99s/it, loss=0.137, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000767, train/loss_step=0.211, global_step=7873.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:   7%|▋         | 89/1208 [02:56<36:55,  1.98s/it, loss=0.137, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000767, train/loss_step=0.211, global_step=7873.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   7%|▋         | 89/1208 [02:56<36:55,  1.98s/it, loss=0.15, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00239, train/loss_step=0.407, global_step=7874.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:   7%|▋         | 90/1208 [02:57<36:41,  1.97s/it, loss=0.15, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00239, train/loss_step=0.407, global_step=7874.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   7%|▋         | 90/1208 [02:57<36:41,  1.97s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=1.77e-5, train/loss_step=0.00326, global_step=7874.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   8%|▊         | 91/1208 [02:58<36:28,  1.96s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=1.77e-5, train/loss_step=0.00326, global_step=7874.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   8%|▊         | 91/1208 [02:58<36:28,  1.96s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00542, train/loss_vlb_step=2.84e-5, train/loss_step=0.00542, global_step=7874.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   8%|▊         | 92/1208 [03:01<36:41,  1.97s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00542, train/loss_vlb_step=2.84e-5, train/loss_step=0.00542, global_step=7874.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   8%|▊         | 92/1208 [03:01<36:41,  1.97s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.5e-5, train/loss_step=0.00257, global_step=7874.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:   8%|▊         | 93/1208 [03:02<36:29,  1.96s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.5e-5, train/loss_step=0.00257, global_step=7874.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   8%|▊         | 93/1208 [03:02<36:29,  1.96s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0999, train/loss_vlb_step=0.00033, train/loss_step=0.0999, global_step=7875.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   8%|▊         | 94/1208 [03:03<36:16,  1.95s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0999, train/loss_vlb_step=0.00033, train/loss_step=0.0999, global_step=7875.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   8%|▊         | 94/1208 [03:03<36:16,  1.95s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00567, train/loss_vlb_step=3.02e-5, train/loss_step=0.00567, global_step=7875.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   8%|▊         | 95/1208 [03:04<36:03,  1.94s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00567, train/loss_vlb_step=3.02e-5, train/loss_step=0.00567, global_step=7875.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   8%|▊         | 95/1208 [03:04<36:03,  1.94s/it, loss=0.118, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000401, train/loss_step=0.121, global_step=7875.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:   8%|▊         | 96/1208 [03:07<36:17,  1.96s/it, loss=0.118, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000401, train/loss_step=0.121, global_step=7875.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   8%|▊         | 96/1208 [03:07<36:17,  1.96s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.32e-5, train/loss_step=0.0208, global_step=7875.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   8%|▊         | 97/1208 [03:09<36:05,  1.95s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.32e-5, train/loss_step=0.0208, global_step=7875.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   8%|▊         | 97/1208 [03:09<36:05,  1.95s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000123, train/loss_step=0.0335, global_step=7876.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   8%|▊         | 98/1208 [03:10<35:53,  1.94s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000123, train/loss_step=0.0335, global_step=7876.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   8%|▊         | 98/1208 [03:10<35:53,  1.94s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0049, train/loss_vlb_step=2.47e-5, train/loss_step=0.0049, global_step=7876.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:   8%|▊         | 99/1208 [03:11<35:41,  1.93s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0049, train/loss_vlb_step=2.47e-5, train/loss_step=0.0049, global_step=7876.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   8%|▊         | 99/1208 [03:11<35:41,  1.93s/it, loss=0.105, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000181, train/loss_step=0.051, global_step=7876.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:   8%|▊         | 100/1208 [03:14<35:54,  1.94s/it, loss=0.105, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000181, train/loss_step=0.051, global_step=7876.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   8%|▊         | 100/1208 [03:14<35:54,  1.94s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000142, train/loss_step=0.0374, global_step=7876.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   8%|▊         | 101/1208 [03:15<35:42,  1.94s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000142, train/loss_step=0.0374, global_step=7876.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   8%|▊         | 101/1208 [03:15<35:42,  1.94s/it, loss=0.124, v_num=0, train/loss_simple_step=0.841, train/loss_vlb_step=0.423, train/loss_step=0.841, global_step=7877.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]     Epoch 26:   8%|▊         | 102/1208 [03:16<35:31,  1.93s/it, loss=0.124, v_num=0, train/loss_simple_step=0.841, train/loss_vlb_step=0.423, train/loss_step=0.841, global_step=7877.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   8%|▊         | 102/1208 [03:16<35:31,  1.93s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0581, train/loss_vlb_step=0.000207, train/loss_step=0.0581, global_step=7877.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   9%|▊         | 103/1208 [03:17<35:20,  1.92s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0581, train/loss_vlb_step=0.000207, train/loss_step=0.0581, global_step=7877.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   9%|▊         | 103/1208 [03:17<35:20,  1.92s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.02e-5, train/loss_step=0.0202, global_step=7877.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:   9%|▊         | 104/1208 [03:20<35:30,  1.93s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.02e-5, train/loss_step=0.0202, global_step=7877.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   9%|▊         | 104/1208 [03:20<35:30,  1.93s/it, loss=0.121, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00144, train/loss_step=0.289, global_step=7877.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:   9%|▊         | 105/1208 [03:21<35:19,  1.92s/it, loss=0.121, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00144, train/loss_step=0.289, global_step=7877.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   9%|▊         | 105/1208 [03:21<35:19,  1.92s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00804, train/loss_vlb_step=3.94e-5, train/loss_step=0.00804, global_step=7878.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   9%|▉         | 106/1208 [03:22<35:09,  1.91s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00804, train/loss_vlb_step=3.94e-5, train/loss_step=0.00804, global_step=7878.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   9%|▉         | 106/1208 [03:22<35:09,  1.91s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000101, train/loss_step=0.0267, global_step=7878.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:   9%|▉         | 107/1208 [03:23<34:58,  1.91s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000101, train/loss_step=0.0267, global_step=7878.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   9%|▉         | 107/1208 [03:23<34:58,  1.91s/it, loss=0.13, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.0025, train/loss_step=0.354, global_step=7878.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]     Epoch 26:   9%|▉         | 108/1208 [03:27<35:09,  1.92s/it, loss=0.13, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.0025, train/loss_step=0.354, global_step=7878.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   9%|▉         | 108/1208 [03:27<35:09,  1.92s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0294, train/loss_vlb_step=0.000113, train/loss_step=0.0294, global_step=7878.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   9%|▉         | 109/1208 [03:28<34:59,  1.91s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0294, train/loss_vlb_step=0.000113, train/loss_step=0.0294, global_step=7878.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   9%|▉         | 109/1208 [03:28<34:59,  1.91s/it, loss=0.106, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000401, train/loss_step=0.119, global_step=7879.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:   9%|▉         | 110/1208 [03:29<34:48,  1.90s/it, loss=0.106, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000401, train/loss_step=0.119, global_step=7879.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   9%|▉         | 110/1208 [03:29<34:48,  1.90s/it, loss=0.141, v_num=0, train/loss_simple_step=0.700, train/loss_vlb_step=0.0362, train/loss_step=0.700, global_step=7879.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:   9%|▉         | 111/1208 [03:30<34:39,  1.90s/it, loss=0.141, v_num=0, train/loss_simple_step=0.700, train/loss_vlb_step=0.0362, train/loss_step=0.700, global_step=7879.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   9%|▉         | 111/1208 [03:30<34:39,  1.90s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0453, train/loss_vlb_step=0.000162, train/loss_step=0.0453, global_step=7879.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   9%|▉         | 112/1208 [03:33<34:50,  1.91s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0453, train/loss_vlb_step=0.000162, train/loss_step=0.0453, global_step=7879.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   9%|▉         | 112/1208 [03:33<34:50,  1.91s/it, loss=0.158, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00124, train/loss_step=0.288, global_step=7879.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:   9%|▉         | 113/1208 [03:34<34:41,  1.90s/it, loss=0.158, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00124, train/loss_step=0.288, global_step=7879.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   9%|▉         | 113/1208 [03:34<34:41,  1.90s/it, loss=0.158, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000371, train/loss_step=0.113, global_step=7880.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   9%|▉         | 114/1208 [03:35<34:31,  1.89s/it, loss=0.158, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000371, train/loss_step=0.113, global_step=7880.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:   9%|▉         | 114/1208 [03:35<34:31,  1.89s/it, loss=0.171, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00107, train/loss_step=0.252, global_step=7880.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  10%|▉         | 115/1208 [03:36<34:22,  1.89s/it, loss=0.171, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00107, train/loss_step=0.252, global_step=7880.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  10%|▉         | 115/1208 [03:36<34:22,  1.89s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0634, train/loss_vlb_step=0.000213, train/loss_step=0.0634, global_step=7880.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  10%|▉         | 116/1208 [03:40<34:31,  1.90s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0634, train/loss_vlb_step=0.000213, train/loss_step=0.0634, global_step=7880.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  10%|▉         | 116/1208 [03:40<34:31,  1.90s/it, loss=0.174, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000528, train/loss_step=0.149, global_step=7880.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  10%|▉         | 117/1208 [03:41<34:23,  1.89s/it, loss=0.174, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000528, train/loss_step=0.149, global_step=7880.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  10%|▉         | 117/1208 [03:41<34:23,  1.89s/it, loss=0.186, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00127, train/loss_step=0.272, global_step=7881.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  10%|▉         | 118/1208 [03:42<34:14,  1.88s/it, loss=0.186, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00127, train/loss_step=0.272, global_step=7881.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  10%|▉         | 118/1208 [03:42<34:14,  1.88s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0077, train/loss_vlb_step=3.68e-5, train/loss_step=0.0077, global_step=7881.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  10%|▉         | 119/1208 [03:43<34:04,  1.88s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0077, train/loss_vlb_step=3.68e-5, train/loss_step=0.0077, global_step=7881.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  10%|▉         | 119/1208 [03:43<34:04,  1.88s/it, loss=0.203, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00253, train/loss_step=0.385, global_step=7881.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  10%|▉         | 120/1208 [03:46<34:14,  1.89s/it, loss=0.203, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00253, train/loss_step=0.385, global_step=7881.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  10%|▉         | 120/1208 [03:46<34:14,  1.89s/it, loss=0.212, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000824, train/loss_step=0.211, global_step=7881.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  10%|█         | 121/1208 [03:47<34:05,  1.88s/it, loss=0.212, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000824, train/loss_step=0.211, global_step=7881.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  10%|█         | 121/1208 [03:47<34:05,  1.88s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.14e-5, train/loss_step=0.00192, global_step=7882.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  10%|█         | 122/1208 [03:48<33:56,  1.87s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.14e-5, train/loss_step=0.00192, global_step=7882.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  10%|█         | 122/1208 [03:48<33:56,  1.87s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.63e-5, train/loss_step=0.0152, global_step=7882.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  10%|█         | 123/1208 [03:49<33:46,  1.87s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.63e-5, train/loss_step=0.0152, global_step=7882.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  10%|█         | 123/1208 [03:49<33:46,  1.87s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.72e-5, train/loss_step=0.0101, global_step=7882.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  10%|█         | 124/1208 [03:53<33:57,  1.88s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.72e-5, train/loss_step=0.0101, global_step=7882.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  10%|█         | 124/1208 [03:53<33:57,  1.88s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0419, train/loss_vlb_step=0.000153, train/loss_step=0.0419, global_step=7882.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  10%|█         | 125/1208 [03:54<33:48,  1.87s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0419, train/loss_vlb_step=0.000153, train/loss_step=0.0419, global_step=7882.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  10%|█         | 125/1208 [03:54<33:48,  1.87s/it, loss=0.164, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000671, train/loss_step=0.188, global_step=7883.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  10%|█         | 126/1208 [03:55<33:39,  1.87s/it, loss=0.164, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000671, train/loss_step=0.188, global_step=7883.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  10%|█         | 126/1208 [03:55<33:39,  1.87s/it, loss=0.184, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.0034, train/loss_step=0.436, global_step=7883.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  11%|█         | 127/1208 [03:56<33:31,  1.86s/it, loss=0.184, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.0034, train/loss_step=0.436, global_step=7883.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  11%|█         | 127/1208 [03:56<33:31,  1.86s/it, loss=0.204, v_num=0, train/loss_simple_step=0.746, train/loss_vlb_step=0.0635, train/loss_step=0.746, global_step=7883.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  11%|█         | 128/1208 [03:59<33:40,  1.87s/it, loss=0.204, v_num=0, train/loss_simple_step=0.746, train/loss_vlb_step=0.0635, train/loss_step=0.746, global_step=7883.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  11%|█         | 128/1208 [03:59<33:40,  1.87s/it, loss=0.202, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.06e-5, train/loss_step=0.00176, global_step=7883.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  11%|█         | 129/1208 [04:00<33:32,  1.86s/it, loss=0.202, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.06e-5, train/loss_step=0.00176, global_step=7883.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  11%|█         | 129/1208 [04:00<33:32,  1.86s/it, loss=0.227, v_num=0, train/loss_simple_step=0.609, train/loss_vlb_step=0.0127, train/loss_step=0.609, global_step=7884.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]     Epoch 26:  11%|█         | 130/1208 [04:01<33:23,  1.86s/it, loss=0.227, v_num=0, train/loss_simple_step=0.609, train/loss_vlb_step=0.0127, train/loss_step=0.609, global_step=7884.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  11%|█         | 130/1208 [04:01<33:23,  1.86s/it, loss=0.197, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000338, train/loss_step=0.102, global_step=7884.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  11%|█         | 131/1208 [04:02<33:15,  1.85s/it, loss=0.197, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000338, train/loss_step=0.102, global_step=7884.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  11%|█         | 131/1208 [04:02<33:15,  1.85s/it, loss=0.205, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000778, train/loss_step=0.214, global_step=7884.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  11%|█         | 132/1208 [04:05<33:24,  1.86s/it, loss=0.205, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000778, train/loss_step=0.214, global_step=7884.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  11%|█         | 132/1208 [04:05<33:24,  1.86s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.29e-5, train/loss_step=0.0171, global_step=7884.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  11%|█         | 133/1208 [04:07<33:16,  1.86s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.29e-5, train/loss_step=0.0171, global_step=7884.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  11%|█         | 133/1208 [04:07<33:16,  1.86s/it, loss=0.205, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00307, train/loss_step=0.374, global_step=7885.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  11%|█         | 134/1208 [04:08<33:08,  1.85s/it, loss=0.205, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00307, train/loss_step=0.374, global_step=7885.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  11%|█         | 134/1208 [04:08<33:08,  1.85s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.89e-5, train/loss_step=0.00351, global_step=7885.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  11%|█         | 135/1208 [04:09<33:00,  1.85s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.89e-5, train/loss_step=0.00351, global_step=7885.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  11%|█         | 135/1208 [04:09<33:00,  1.85s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.4e-5, train/loss_step=0.0144, global_step=7885.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  11%|█▏        | 136/1208 [04:12<33:09,  1.86s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.4e-5, train/loss_step=0.0144, global_step=7885.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  11%|█▏        | 136/1208 [04:12<33:09,  1.86s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000121, train/loss_step=0.0329, global_step=7885.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  11%|█▏        | 137/1208 [04:13<33:02,  1.85s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0329, train/loss_vlb_step=0.000121, train/loss_step=0.0329, global_step=7885.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  11%|█▏        | 137/1208 [04:13<33:02,  1.85s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.24e-5, train/loss_step=0.0113, global_step=7886.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  11%|█▏        | 138/1208 [04:14<32:54,  1.85s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.24e-5, train/loss_step=0.0113, global_step=7886.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  11%|█▏        | 138/1208 [04:14<32:54,  1.85s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0502, train/loss_vlb_step=0.000173, train/loss_step=0.0502, global_step=7886.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  12%|█▏        | 139/1208 [04:15<32:46,  1.84s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0502, train/loss_vlb_step=0.000173, train/loss_step=0.0502, global_step=7886.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  12%|█▏        | 139/1208 [04:15<32:46,  1.84s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.29e-5, train/loss_step=0.0169, global_step=7886.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  12%|█▏        | 140/1208 [04:18<32:54,  1.85s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.29e-5, train/loss_step=0.0169, global_step=7886.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  12%|█▏        | 140/1208 [04:18<32:54,  1.85s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.000113, train/loss_step=0.0292, global_step=7886.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  12%|█▏        | 141/1208 [04:19<32:47,  1.84s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.000113, train/loss_step=0.0292, global_step=7886.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  12%|█▏        | 141/1208 [04:19<32:47,  1.84s/it, loss=0.16, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00128, train/loss_step=0.284, global_step=7887.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  12%|█▏        | 142/1208 [04:21<32:39,  1.84s/it, loss=0.16, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00128, train/loss_step=0.284, global_step=7887.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  12%|█▏        | 142/1208 [04:21<32:39,  1.84s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0074, train/loss_vlb_step=3.55e-5, train/loss_step=0.0074, global_step=7887.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  12%|█▏        | 143/1208 [04:22<32:31,  1.83s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0074, train/loss_vlb_step=3.55e-5, train/loss_step=0.0074, global_step=7887.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  12%|█▏        | 143/1208 [04:22<32:31,  1.83s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.63e-5, train/loss_step=0.0246, global_step=7887.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  12%|█▏        | 144/1208 [04:25<32:40,  1.84s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.63e-5, train/loss_step=0.0246, global_step=7887.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  12%|█▏        | 144/1208 [04:25<32:40,  1.84s/it, loss=0.171, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00139, train/loss_step=0.265, global_step=7887.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  12%|█▏        | 145/1208 [04:26<32:32,  1.84s/it, loss=0.171, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00139, train/loss_step=0.265, global_step=7887.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  12%|█▏        | 145/1208 [04:26<32:32,  1.84s/it, loss=0.172, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000737, train/loss_step=0.200, global_step=7888.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  12%|█▏        | 146/1208 [04:27<32:25,  1.83s/it, loss=0.172, v_num=0, train/loss_simple_step=0.200, train/loss_vlb_step=0.000737, train/loss_step=0.200, global_step=7888.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  12%|█▏        | 146/1208 [04:27<32:25,  1.83s/it, loss=0.16, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000672, train/loss_step=0.187, global_step=7888.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  12%|█▏        | 147/1208 [04:28<32:18,  1.83s/it, loss=0.16, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000672, train/loss_step=0.187, global_step=7888.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  12%|█▏        | 147/1208 [04:28<32:18,  1.83s/it, loss=0.126, v_num=0, train/loss_simple_step=0.083, train/loss_vlb_step=0.000273, train/loss_step=0.083, global_step=7888.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  12%|█▏        | 148/1208 [04:31<32:26,  1.84s/it, loss=0.126, v_num=0, train/loss_simple_step=0.083, train/loss_vlb_step=0.000273, train/loss_step=0.083, global_step=7888.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  12%|█▏        | 148/1208 [04:31<32:26,  1.84s/it, loss=0.138, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000992, train/loss_step=0.240, global_step=7888.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  12%|█▏        | 149/1208 [04:32<32:19,  1.83s/it, loss=0.138, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000992, train/loss_step=0.240, global_step=7888.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  12%|█▏        | 149/1208 [04:32<32:19,  1.83s/it, loss=0.142, v_num=0, train/loss_simple_step=0.679, train/loss_vlb_step=0.020, train/loss_step=0.679, global_step=7889.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  12%|█▏        | 150/1208 [04:33<32:12,  1.83s/it, loss=0.142, v_num=0, train/loss_simple_step=0.679, train/loss_vlb_step=0.020, train/loss_step=0.679, global_step=7889.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  12%|█▏        | 150/1208 [04:33<32:12,  1.83s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.94e-5, train/loss_step=0.0107, global_step=7889.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  12%|█▎        | 151/1208 [04:34<32:04,  1.82s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.94e-5, train/loss_step=0.0107, global_step=7889.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  12%|█▎        | 151/1208 [04:34<32:04,  1.82s/it, loss=0.134, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000477, train/loss_step=0.144, global_step=7889.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  13%|█▎        | 152/1208 [04:38<32:13,  1.83s/it, loss=0.134, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000477, train/loss_step=0.144, global_step=7889.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  13%|█▎        | 152/1208 [04:38<32:13,  1.83s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=5.02e-5, train/loss_step=0.0104, global_step=7889.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  13%|█▎        | 153/1208 [04:39<32:06,  1.83s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=5.02e-5, train/loss_step=0.0104, global_step=7889.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  13%|█▎        | 153/1208 [04:39<32:06,  1.83s/it, loss=0.135, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00452, train/loss_step=0.408, global_step=7890.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  13%|█▎        | 154/1208 [04:40<31:59,  1.82s/it, loss=0.135, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00452, train/loss_step=0.408, global_step=7890.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  13%|█▎        | 154/1208 [04:40<31:59,  1.82s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00252, train/loss_vlb_step=1.48e-5, train/loss_step=0.00252, global_step=7890.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  13%|█▎        | 155/1208 [04:41<31:52,  1.82s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00252, train/loss_vlb_step=1.48e-5, train/loss_step=0.00252, global_step=7890.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  13%|█▎        | 155/1208 [04:41<31:52,  1.82s/it, loss=0.142, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000483, train/loss_step=0.146, global_step=7890.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  13%|█▎        | 156/1208 [04:44<32:00,  1.83s/it, loss=0.142, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000483, train/loss_step=0.146, global_step=7890.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  13%|█▎        | 156/1208 [04:44<32:00,  1.83s/it, loss=0.148, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000561, train/loss_step=0.163, global_step=7890.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  13%|█▎        | 157/1208 [04:45<31:54,  1.82s/it, loss=0.148, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000561, train/loss_step=0.163, global_step=7890.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  13%|█▎        | 157/1208 [04:45<31:54,  1.82s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0787, train/loss_vlb_step=0.00026, train/loss_step=0.0787, global_step=7891.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  13%|█▎        | 158/1208 [04:47<31:47,  1.82s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0787, train/loss_vlb_step=0.00026, train/loss_step=0.0787, global_step=7891.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  13%|█▎        | 158/1208 [04:47<31:47,  1.82s/it, loss=0.156, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000433, train/loss_step=0.132, global_step=7891.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  13%|█▎        | 159/1208 [04:48<31:40,  1.81s/it, loss=0.156, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000433, train/loss_step=0.132, global_step=7891.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  13%|█▎        | 159/1208 [04:48<31:40,  1.81s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.46e-5, train/loss_step=0.0209, global_step=7891.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  13%|█▎        | 160/1208 [04:51<31:48,  1.82s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.46e-5, train/loss_step=0.0209, global_step=7891.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  13%|█▎        | 160/1208 [04:51<31:48,  1.82s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=6.93e-5, train/loss_step=0.0174, global_step=7891.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  13%|█▎        | 161/1208 [04:52<31:41,  1.82s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=6.93e-5, train/loss_step=0.0174, global_step=7891.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  13%|█▎        | 161/1208 [04:52<31:41,  1.82s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=9.88e-6, train/loss_step=0.00165, global_step=7892.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  13%|█▎        | 162/1208 [04:53<31:34,  1.81s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=9.88e-6, train/loss_step=0.00165, global_step=7892.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  13%|█▎        | 162/1208 [04:53<31:34,  1.81s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.000165, train/loss_step=0.0462, global_step=7892.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  13%|█▎        | 163/1208 [04:54<31:28,  1.81s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.000165, train/loss_step=0.0462, global_step=7892.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  13%|█▎        | 163/1208 [04:54<31:28,  1.81s/it, loss=0.147, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=7892.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  14%|█▎        | 164/1208 [04:57<31:36,  1.82s/it, loss=0.147, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=7892.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  14%|█▎        | 164/1208 [04:57<31:36,  1.82s/it, loss=0.15, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00151, train/loss_step=0.322, global_step=7892.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  14%|█▎        | 165/1208 [04:58<31:29,  1.81s/it, loss=0.15, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00151, train/loss_step=0.322, global_step=7892.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  14%|█▎        | 165/1208 [04:58<31:29,  1.81s/it, loss=0.155, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00153, train/loss_step=0.299, global_step=7893.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  14%|█▎        | 166/1208 [05:00<31:23,  1.81s/it, loss=0.155, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00153, train/loss_step=0.299, global_step=7893.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  14%|█▎        | 166/1208 [05:00<31:23,  1.81s/it, loss=0.158, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00107, train/loss_step=0.249, global_step=7893.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  14%|█▍        | 167/1208 [05:01<31:17,  1.80s/it, loss=0.158, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00107, train/loss_step=0.249, global_step=7893.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  14%|█▍        | 167/1208 [05:01<31:17,  1.80s/it, loss=0.161, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000479, train/loss_step=0.145, global_step=7893.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  14%|█▍        | 168/1208 [05:04<31:24,  1.81s/it, loss=0.161, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000479, train/loss_step=0.145, global_step=7893.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  14%|█▍        | 168/1208 [05:04<31:24,  1.81s/it, loss=0.158, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000625, train/loss_step=0.180, global_step=7893.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  14%|█▍        | 169/1208 [05:05<31:18,  1.81s/it, loss=0.158, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000625, train/loss_step=0.180, global_step=7893.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  14%|█▍        | 169/1208 [05:05<31:18,  1.81s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00355, train/loss_vlb_step=1.95e-5, train/loss_step=0.00355, global_step=7894.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  14%|█▍        | 170/1208 [05:06<31:12,  1.80s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00355, train/loss_vlb_step=1.95e-5, train/loss_step=0.00355, global_step=7894.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  14%|█▍        | 170/1208 [05:06<31:12,  1.80s/it, loss=0.149, v_num=0, train/loss_simple_step=0.497, train/loss_vlb_step=0.00509, train/loss_step=0.497, global_step=7894.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  14%|█▍        | 171/1208 [05:07<31:05,  1.80s/it, loss=0.149, v_num=0, train/loss_simple_step=0.497, train/loss_vlb_step=0.00509, train/loss_step=0.497, global_step=7894.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  14%|█▍        | 171/1208 [05:07<31:05,  1.80s/it, loss=0.15, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000655, train/loss_step=0.176, global_step=7894.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  14%|█▍        | 172/1208 [05:10<31:12,  1.81s/it, loss=0.15, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000655, train/loss_step=0.176, global_step=7894.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  14%|█▍        | 172/1208 [05:10<31:12,  1.81s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.68e-5, train/loss_step=0.00292, global_step=7894.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  14%|█▍        | 173/1208 [05:12<31:06,  1.80s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.68e-5, train/loss_step=0.00292, global_step=7894.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  14%|█▍        | 173/1208 [05:12<31:06,  1.80s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0013, train/loss_vlb_step=7.86e-6, train/loss_step=0.0013, global_step=7895.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  14%|█▍        | 174/1208 [05:13<31:00,  1.80s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0013, train/loss_vlb_step=7.86e-6, train/loss_step=0.0013, global_step=7895.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  14%|█▍        | 174/1208 [05:13<31:00,  1.80s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.28e-5, train/loss_step=0.0171, global_step=7895.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  14%|█▍        | 175/1208 [05:14<30:54,  1.80s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.28e-5, train/loss_step=0.0171, global_step=7895.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  14%|█▍        | 175/1208 [05:14<30:54,  1.80s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000112, train/loss_step=0.0284, global_step=7895.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  15%|█▍        | 176/1208 [05:17<31:01,  1.80s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000112, train/loss_step=0.0284, global_step=7895.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  15%|█▍        | 176/1208 [05:17<31:01,  1.80s/it, loss=0.132, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00134, train/loss_step=0.315, global_step=7895.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  15%|█▍        | 177/1208 [05:18<30:55,  1.80s/it, loss=0.132, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00134, train/loss_step=0.315, global_step=7895.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  15%|█▍        | 177/1208 [05:18<30:55,  1.80s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0092, train/loss_vlb_step=4.39e-5, train/loss_step=0.0092, global_step=7896.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  15%|█▍        | 178/1208 [05:19<30:49,  1.80s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0092, train/loss_vlb_step=4.39e-5, train/loss_step=0.0092, global_step=7896.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  15%|█▍        | 178/1208 [05:19<30:49,  1.80s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0747, train/loss_vlb_step=0.000253, train/loss_step=0.0747, global_step=7896.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  15%|█▍        | 179/1208 [05:20<30:43,  1.79s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0747, train/loss_vlb_step=0.000253, train/loss_step=0.0747, global_step=7896.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  15%|█▍        | 179/1208 [05:20<30:43,  1.79s/it, loss=0.13, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000338, train/loss_step=0.103, global_step=7896.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  15%|█▍        | 180/1208 [05:23<30:49,  1.80s/it, loss=0.13, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000338, train/loss_step=0.103, global_step=7896.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  15%|█▍        | 180/1208 [05:23<30:49,  1.80s/it, loss=0.14, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000982, train/loss_step=0.228, global_step=7896.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  15%|█▍        | 181/1208 [05:24<30:43,  1.79s/it, loss=0.14, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000982, train/loss_step=0.228, global_step=7896.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  15%|█▍        | 181/1208 [05:24<30:43,  1.79s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=6.99e-5, train/loss_step=0.0168, global_step=7897.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  15%|█▌        | 182/1208 [05:25<30:37,  1.79s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=6.99e-5, train/loss_step=0.0168, global_step=7897.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  15%|█▌        | 182/1208 [05:25<30:37,  1.79s/it, loss=0.161, v_num=0, train/loss_simple_step=0.445, train/loss_vlb_step=0.0039, train/loss_step=0.445, global_step=7897.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  15%|█▌        | 183/1208 [05:26<30:31,  1.79s/it, loss=0.161, v_num=0, train/loss_simple_step=0.445, train/loss_vlb_step=0.0039, train/loss_step=0.445, global_step=7897.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  15%|█▌        | 183/1208 [05:26<30:31,  1.79s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0568, train/loss_vlb_step=0.000196, train/loss_step=0.0568, global_step=7897.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  15%|█▌        | 184/1208 [05:30<30:38,  1.80s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0568, train/loss_vlb_step=0.000196, train/loss_step=0.0568, global_step=7897.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  15%|█▌        | 184/1208 [05:30<30:38,  1.80s/it, loss=0.16, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00231, train/loss_step=0.356, global_step=7897.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  15%|█▌        | 185/1208 [05:31<30:32,  1.79s/it, loss=0.16, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00231, train/loss_step=0.356, global_step=7897.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  15%|█▌        | 185/1208 [05:31<30:32,  1.79s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.15e-5, train/loss_step=0.00197, global_step=7898.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  15%|█▌        | 186/1208 [05:32<30:26,  1.79s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.15e-5, train/loss_step=0.00197, global_step=7898.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  15%|█▌        | 186/1208 [05:32<30:26,  1.79s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.58e-5, train/loss_step=0.00272, global_step=7898.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  15%|█▌        | 187/1208 [05:33<30:20,  1.78s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.58e-5, train/loss_step=0.00272, global_step=7898.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  15%|█▌        | 187/1208 [05:33<30:21,  1.78s/it, loss=0.135, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000677, train/loss_step=0.192, global_step=7898.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  16%|█▌        | 188/1208 [05:36<30:27,  1.79s/it, loss=0.135, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000677, train/loss_step=0.192, global_step=7898.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  16%|█▌        | 188/1208 [05:36<30:27,  1.79s/it, loss=0.132, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.00035, train/loss_step=0.106, global_step=7898.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  16%|█▌        | 189/1208 [05:37<30:22,  1.79s/it, loss=0.132, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.00035, train/loss_step=0.106, global_step=7898.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  16%|█▌        | 189/1208 [05:37<30:22,  1.79s/it, loss=0.145, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00115, train/loss_step=0.268, global_step=7899.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  16%|█▌        | 190/1208 [05:39<30:16,  1.78s/it, loss=0.145, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00115, train/loss_step=0.268, global_step=7899.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  16%|█▌        | 190/1208 [05:39<30:16,  1.78s/it, loss=0.132, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.000965, train/loss_step=0.247, global_step=7899.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  16%|█▌        | 191/1208 [05:40<30:10,  1.78s/it, loss=0.132, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.000965, train/loss_step=0.247, global_step=7899.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  16%|█▌        | 191/1208 [05:40<30:10,  1.78s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000127, train/loss_step=0.0348, global_step=7899.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  16%|█▌        | 192/1208 [05:43<30:16,  1.79s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000127, train/loss_step=0.0348, global_step=7899.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  16%|█▌        | 192/1208 [05:43<30:16,  1.79s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00752, train/loss_vlb_step=3.7e-5, train/loss_step=0.00752, global_step=7899.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  16%|█▌        | 193/1208 [05:44<30:10,  1.78s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00752, train/loss_vlb_step=3.7e-5, train/loss_step=0.00752, global_step=7899.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  16%|█▌        | 193/1208 [05:44<30:10,  1.78s/it, loss=0.132, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000424, train/loss_step=0.129, global_step=7900.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  16%|█▌        | 194/1208 [05:45<30:05,  1.78s/it, loss=0.132, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000424, train/loss_step=0.129, global_step=7900.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  16%|█▌        | 194/1208 [05:45<30:05,  1.78s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0505, train/loss_vlb_step=0.000179, train/loss_step=0.0505, global_step=7900.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  16%|█▌        | 195/1208 [05:46<29:59,  1.78s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0505, train/loss_vlb_step=0.000179, train/loss_step=0.0505, global_step=7900.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  16%|█▌        | 195/1208 [05:46<29:59,  1.78s/it, loss=0.138, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000399, train/loss_step=0.121, global_step=7900.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  16%|█▌        | 196/1208 [05:49<30:05,  1.78s/it, loss=0.138, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000399, train/loss_step=0.121, global_step=7900.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  16%|█▌        | 196/1208 [05:49<30:05,  1.78s/it, loss=0.133, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000741, train/loss_step=0.203, global_step=7900.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  16%|█▋        | 197/1208 [05:50<30:00,  1.78s/it, loss=0.133, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000741, train/loss_step=0.203, global_step=7900.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  16%|█▋        | 197/1208 [05:50<30:00,  1.78s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00991, train/loss_vlb_step=4.6e-5, train/loss_step=0.00991, global_step=7901.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  16%|█▋        | 198/1208 [05:51<29:54,  1.78s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00991, train/loss_vlb_step=4.6e-5, train/loss_step=0.00991, global_step=7901.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  16%|█▋        | 198/1208 [05:51<29:54,  1.78s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=0.000101, train/loss_step=0.0252, global_step=7901.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  16%|█▋        | 199/1208 [05:52<29:49,  1.77s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=0.000101, train/loss_step=0.0252, global_step=7901.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  16%|█▋        | 199/1208 [05:52<29:49,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.850, train/loss_vlb_step=0.428, train/loss_step=0.850, global_step=7901.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  17%|█▋        | 200/1208 [05:56<29:54,  1.78s/it, loss=0.168, v_num=0, train/loss_simple_step=0.850, train/loss_vlb_step=0.428, train/loss_step=0.850, global_step=7901.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  17%|█▋        | 200/1208 [05:56<29:54,  1.78s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.53e-5, train/loss_step=0.0124, global_step=7901.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  17%|█▋        | 201/1208 [05:57<29:49,  1.78s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.53e-5, train/loss_step=0.0124, global_step=7901.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  17%|█▋        | 201/1208 [05:57<29:49,  1.78s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.26e-5, train/loss_step=0.0196, global_step=7902.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  17%|█▋        | 202/1208 [05:58<29:44,  1.77s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.26e-5, train/loss_step=0.0196, global_step=7902.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  17%|█▋        | 202/1208 [05:58<29:44,  1.77s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.65e-5, train/loss_step=0.0132, global_step=7902.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  17%|█▋        | 203/1208 [05:59<29:39,  1.77s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.65e-5, train/loss_step=0.0132, global_step=7902.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  17%|█▋        | 203/1208 [05:59<29:39,  1.77s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0898, train/loss_vlb_step=0.000295, train/loss_step=0.0898, global_step=7902.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  17%|█▋        | 204/1208 [06:02<29:44,  1.78s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0898, train/loss_vlb_step=0.000295, train/loss_step=0.0898, global_step=7902.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  17%|█▋        | 204/1208 [06:02<29:44,  1.78s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=3.41e-5, train/loss_step=0.0072, global_step=7902.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  17%|█▋        | 205/1208 [06:03<29:39,  1.77s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=3.41e-5, train/loss_step=0.0072, global_step=7902.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  17%|█▋        | 205/1208 [06:03<29:39,  1.77s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0584, train/loss_vlb_step=0.000198, train/loss_step=0.0584, global_step=7903.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  17%|█▋        | 206/1208 [06:04<29:34,  1.77s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0584, train/loss_vlb_step=0.000198, train/loss_step=0.0584, global_step=7903.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  17%|█▋        | 206/1208 [06:04<29:34,  1.77s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00764, train/loss_vlb_step=3.56e-5, train/loss_step=0.00764, global_step=7903.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  17%|█▋        | 207/1208 [06:05<29:29,  1.77s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00764, train/loss_vlb_step=3.56e-5, train/loss_step=0.00764, global_step=7903.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  17%|█▋        | 207/1208 [06:05<29:29,  1.77s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.74e-5, train/loss_step=0.0032, global_step=7903.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  17%|█▋        | 208/1208 [06:09<29:34,  1.77s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.74e-5, train/loss_step=0.0032, global_step=7903.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  17%|█▋        | 208/1208 [06:09<29:34,  1.77s/it, loss=0.122, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00143, train/loss_step=0.279, global_step=7903.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  17%|█▋        | 209/1208 [06:10<29:29,  1.77s/it, loss=0.122, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00143, train/loss_step=0.279, global_step=7903.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  17%|█▋        | 209/1208 [06:10<29:29,  1.77s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.04e-5, train/loss_step=0.00174, global_step=7904.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  17%|█▋        | 210/1208 [06:11<29:24,  1.77s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.04e-5, train/loss_step=0.00174, global_step=7904.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  17%|█▋        | 210/1208 [06:11<29:24,  1.77s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000156, train/loss_step=0.0438, global_step=7904.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  17%|█▋        | 211/1208 [06:12<29:19,  1.76s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000156, train/loss_step=0.0438, global_step=7904.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  17%|█▋        | 211/1208 [06:12<29:19,  1.76s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0703, train/loss_vlb_step=0.000238, train/loss_step=0.0703, global_step=7904.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  18%|█▊        | 212/1208 [06:15<29:24,  1.77s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0703, train/loss_vlb_step=0.000238, train/loss_step=0.0703, global_step=7904.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  18%|█▊        | 212/1208 [06:15<29:24,  1.77s/it, loss=0.126, v_num=0, train/loss_simple_step=0.530, train/loss_vlb_step=0.00606, train/loss_step=0.530, global_step=7904.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  18%|█▊        | 213/1208 [06:16<29:20,  1.77s/it, loss=0.126, v_num=0, train/loss_simple_step=0.530, train/loss_vlb_step=0.00606, train/loss_step=0.530, global_step=7904.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  18%|█▊        | 213/1208 [06:16<29:20,  1.77s/it, loss=0.132, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000966, train/loss_step=0.237, global_step=7905.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  18%|█▊        | 214/1208 [06:17<29:15,  1.77s/it, loss=0.132, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000966, train/loss_step=0.237, global_step=7905.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  18%|█▊        | 214/1208 [06:17<29:15,  1.77s/it, loss=0.141, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000875, train/loss_step=0.235, global_step=7905.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  18%|█▊        | 215/1208 [06:19<29:10,  1.76s/it, loss=0.141, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000875, train/loss_step=0.235, global_step=7905.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  18%|█▊        | 215/1208 [06:19<29:10,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000869, train/loss_step=0.232, global_step=7905.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  18%|█▊        | 216/1208 [06:22<29:15,  1.77s/it, loss=0.146, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000869, train/loss_step=0.232, global_step=7905.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  18%|█▊        | 216/1208 [06:22<29:15,  1.77s/it, loss=0.146, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000719, train/loss_step=0.197, global_step=7905.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  18%|█▊        | 217/1208 [06:23<29:10,  1.77s/it, loss=0.146, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000719, train/loss_step=0.197, global_step=7905.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  18%|█▊        | 217/1208 [06:23<29:10,  1.77s/it, loss=0.154, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000608, train/loss_step=0.176, global_step=7906.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  18%|█▊        | 218/1208 [06:24<29:05,  1.76s/it, loss=0.154, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000608, train/loss_step=0.176, global_step=7906.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  18%|█▊        | 218/1208 [06:24<29:05,  1.76s/it, loss=0.162, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000598, train/loss_step=0.170, global_step=7906.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  18%|█▊        | 219/1208 [06:25<29:00,  1.76s/it, loss=0.162, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000598, train/loss_step=0.170, global_step=7906.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  18%|█▊        | 219/1208 [06:25<29:00,  1.76s/it, loss=0.144, v_num=0, train/loss_simple_step=0.501, train/loss_vlb_step=0.00819, train/loss_step=0.501, global_step=7906.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  18%|█▊        | 220/1208 [06:28<29:05,  1.77s/it, loss=0.144, v_num=0, train/loss_simple_step=0.501, train/loss_vlb_step=0.00819, train/loss_step=0.501, global_step=7906.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  18%|█▊        | 220/1208 [06:28<29:05,  1.77s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.65e-5, train/loss_step=0.0183, global_step=7906.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  18%|█▊        | 221/1208 [06:29<29:00,  1.76s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.65e-5, train/loss_step=0.0183, global_step=7906.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  18%|█▊        | 221/1208 [06:29<29:00,  1.76s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00668, train/loss_vlb_step=3.38e-5, train/loss_step=0.00668, global_step=7907.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  18%|█▊        | 222/1208 [06:30<28:55,  1.76s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00668, train/loss_vlb_step=3.38e-5, train/loss_step=0.00668, global_step=7907.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  18%|█▊        | 222/1208 [06:30<28:55,  1.76s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00714, train/loss_vlb_step=3.63e-5, train/loss_step=0.00714, global_step=7907.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  18%|█▊        | 223/1208 [06:31<28:51,  1.76s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00714, train/loss_vlb_step=3.63e-5, train/loss_step=0.00714, global_step=7907.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  18%|█▊        | 223/1208 [06:31<28:51,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000487, train/loss_step=0.145, global_step=7907.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  19%|█▊        | 224/1208 [06:35<28:56,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000487, train/loss_step=0.145, global_step=7907.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  19%|█▊        | 224/1208 [06:35<28:56,  1.76s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000151, train/loss_step=0.0437, global_step=7907.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  19%|█▊        | 225/1208 [06:36<28:51,  1.76s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.000151, train/loss_step=0.0437, global_step=7907.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  19%|█▊        | 225/1208 [06:36<28:51,  1.76s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.75e-5, train/loss_step=0.00312, global_step=7908.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  19%|█▊        | 226/1208 [06:37<28:46,  1.76s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.75e-5, train/loss_step=0.00312, global_step=7908.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  19%|█▊        | 226/1208 [06:37<28:46,  1.76s/it, loss=0.169, v_num=0, train/loss_simple_step=0.488, train/loss_vlb_step=0.00548, train/loss_step=0.488, global_step=7908.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  19%|█▉        | 227/1208 [06:38<28:41,  1.76s/it, loss=0.169, v_num=0, train/loss_simple_step=0.488, train/loss_vlb_step=0.00548, train/loss_step=0.488, global_step=7908.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  19%|█▉        | 227/1208 [06:38<28:41,  1.76s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0711, train/loss_vlb_step=0.000235, train/loss_step=0.0711, global_step=7908.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  19%|█▉        | 228/1208 [06:41<28:46,  1.76s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0711, train/loss_vlb_step=0.000235, train/loss_step=0.0711, global_step=7908.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  19%|█▉        | 228/1208 [06:41<28:46,  1.76s/it, loss=0.196, v_num=0, train/loss_simple_step=0.753, train/loss_vlb_step=0.127, train/loss_step=0.753, global_step=7908.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]     Epoch 26:  19%|█▉        | 229/1208 [06:42<28:42,  1.76s/it, loss=0.196, v_num=0, train/loss_simple_step=0.753, train/loss_vlb_step=0.127, train/loss_step=0.753, global_step=7908.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  19%|█▉        | 229/1208 [06:42<28:42,  1.76s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.45e-5, train/loss_step=0.0151, global_step=7909.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  19%|█▉        | 230/1208 [06:43<28:37,  1.76s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.45e-5, train/loss_step=0.0151, global_step=7909.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  19%|█▉        | 230/1208 [06:43<28:37,  1.76s/it, loss=0.204, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000652, train/loss_step=0.183, global_step=7909.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  19%|█▉        | 231/1208 [06:44<28:32,  1.75s/it, loss=0.204, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000652, train/loss_step=0.183, global_step=7909.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  19%|█▉        | 231/1208 [06:44<28:32,  1.75s/it, loss=0.219, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00249, train/loss_step=0.366, global_step=7909.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  19%|█▉        | 232/1208 [06:48<28:36,  1.76s/it, loss=0.219, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00249, train/loss_step=0.366, global_step=7909.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  19%|█▉        | 232/1208 [06:48<28:36,  1.76s/it, loss=0.2, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000489, train/loss_step=0.144, global_step=7909.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  19%|█▉        | 233/1208 [06:49<28:32,  1.76s/it, loss=0.2, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000489, train/loss_step=0.144, global_step=7909.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  19%|█▉        | 233/1208 [06:49<28:32,  1.76s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=8.86e-5, train/loss_step=0.0229, global_step=7910.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  19%|█▉        | 234/1208 [06:50<28:27,  1.75s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=8.86e-5, train/loss_step=0.0229, global_step=7910.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  19%|█▉        | 234/1208 [06:50<28:27,  1.75s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0612, train/loss_vlb_step=0.000211, train/loss_step=0.0612, global_step=7910.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  19%|█▉        | 235/1208 [06:51<28:22,  1.75s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0612, train/loss_vlb_step=0.000211, train/loss_step=0.0612, global_step=7910.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  19%|█▉        | 235/1208 [06:51<28:22,  1.75s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.45e-5, train/loss_step=0.00475, global_step=7910.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  20%|█▉        | 236/1208 [06:54<28:27,  1.76s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.45e-5, train/loss_step=0.00475, global_step=7910.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  20%|█▉        | 236/1208 [06:54<28:27,  1.76s/it, loss=0.176, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00262, train/loss_step=0.349, global_step=7910.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  20%|█▉        | 237/1208 [06:55<28:23,  1.75s/it, loss=0.176, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00262, train/loss_step=0.349, global_step=7910.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  20%|█▉        | 237/1208 [06:55<28:23,  1.75s/it, loss=0.182, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00121, train/loss_step=0.279, global_step=7911.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  20%|█▉        | 238/1208 [06:56<28:18,  1.75s/it, loss=0.182, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00121, train/loss_step=0.279, global_step=7911.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  20%|█▉        | 238/1208 [06:56<28:18,  1.75s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0721, train/loss_vlb_step=0.000245, train/loss_step=0.0721, global_step=7911.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  20%|█▉        | 239/1208 [06:57<28:14,  1.75s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0721, train/loss_vlb_step=0.000245, train/loss_step=0.0721, global_step=7911.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  20%|█▉        | 239/1208 [06:57<28:14,  1.75s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0976, train/loss_vlb_step=0.000321, train/loss_step=0.0976, global_step=7911.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  20%|█▉        | 240/1208 [07:01<28:18,  1.75s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0976, train/loss_vlb_step=0.000321, train/loss_step=0.0976, global_step=7911.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  20%|█▉        | 240/1208 [07:01<28:18,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00944, train/loss_vlb_step=4.47e-5, train/loss_step=0.00944, global_step=7911.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  20%|█▉        | 241/1208 [07:02<28:14,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00944, train/loss_vlb_step=4.47e-5, train/loss_step=0.00944, global_step=7911.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  20%|█▉        | 241/1208 [07:02<28:14,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.2e-5, train/loss_step=0.0115, global_step=7912.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  20%|██        | 242/1208 [07:03<28:09,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.2e-5, train/loss_step=0.0115, global_step=7912.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  20%|██        | 242/1208 [07:03<28:09,  1.75s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=8.15e-5, train/loss_step=0.0188, global_step=7912.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  20%|██        | 243/1208 [07:04<28:05,  1.75s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=8.15e-5, train/loss_step=0.0188, global_step=7912.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  20%|██        | 243/1208 [07:04<28:05,  1.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=2.27e-5, train/loss_step=0.00421, global_step=7912.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  20%|██        | 244/1208 [07:07<28:09,  1.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=2.27e-5, train/loss_step=0.00421, global_step=7912.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  20%|██        | 244/1208 [07:07<28:09,  1.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000141, train/loss_step=0.0381, global_step=7912.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  20%|██        | 245/1208 [07:08<28:04,  1.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000141, train/loss_step=0.0381, global_step=7912.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  20%|██        | 245/1208 [07:08<28:04,  1.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00333, train/loss_vlb_step=1.83e-5, train/loss_step=0.00333, global_step=7913.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  20%|██        | 246/1208 [07:09<28:00,  1.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00333, train/loss_vlb_step=1.83e-5, train/loss_step=0.00333, global_step=7913.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  20%|██        | 246/1208 [07:09<28:00,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000128, train/loss_step=0.0344, global_step=7913.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  20%|██        | 247/1208 [07:10<27:56,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0344, train/loss_vlb_step=0.000128, train/loss_step=0.0344, global_step=7913.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  20%|██        | 247/1208 [07:10<27:56,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.05e-5, train/loss_step=0.00394, global_step=7913.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  21%|██        | 248/1208 [07:14<28:00,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.05e-5, train/loss_step=0.00394, global_step=7913.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  21%|██        | 248/1208 [07:14<28:00,  1.75s/it, loss=0.086, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.26e-5, train/loss_step=0.00215, global_step=7913.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  21%|██        | 249/1208 [07:15<27:56,  1.75s/it, loss=0.086, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.26e-5, train/loss_step=0.00215, global_step=7913.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  21%|██        | 249/1208 [07:15<27:56,  1.75s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=1.73e-5, train/loss_step=0.00302, global_step=7914.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  21%|██        | 250/1208 [07:16<27:52,  1.75s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=1.73e-5, train/loss_step=0.00302, global_step=7914.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  21%|██        | 250/1208 [07:16<27:52,  1.75s/it, loss=0.0782, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000137, train/loss_step=0.0381, global_step=7914.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  21%|██        | 251/1208 [07:17<27:48,  1.74s/it, loss=0.0782, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000137, train/loss_step=0.0381, global_step=7914.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  21%|██        | 251/1208 [07:17<27:48,  1.74s/it, loss=0.06, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.55e-5, train/loss_step=0.00281, global_step=7914.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  21%|██        | 252/1208 [07:20<27:51,  1.75s/it, loss=0.06, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.55e-5, train/loss_step=0.00281, global_step=7914.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  21%|██        | 252/1208 [07:20<27:51,  1.75s/it, loss=0.0683, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00143, train/loss_step=0.309, global_step=7914.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  21%|██        | 253/1208 [07:21<27:46,  1.75s/it, loss=0.0683, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00143, train/loss_step=0.309, global_step=7914.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  21%|██        | 253/1208 [07:21<27:46,  1.75s/it, loss=0.0739, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000446, train/loss_step=0.135, global_step=7915.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  21%|██        | 254/1208 [07:22<27:42,  1.74s/it, loss=0.0739, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000446, train/loss_step=0.135, global_step=7915.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  21%|██        | 254/1208 [07:22<27:42,  1.74s/it, loss=0.071, v_num=0, train/loss_simple_step=0.00387, train/loss_vlb_step=2.15e-5, train/loss_step=0.00387, global_step=7915.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  21%|██        | 255/1208 [07:23<27:38,  1.74s/it, loss=0.071, v_num=0, train/loss_simple_step=0.00387, train/loss_vlb_step=2.15e-5, train/loss_step=0.00387, global_step=7915.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  21%|██        | 255/1208 [07:23<27:38,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.815, train/loss_vlb_step=0.206, train/loss_step=0.815, global_step=7915.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]      Epoch 26:  21%|██        | 256/1208 [07:26<27:42,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.815, train/loss_vlb_step=0.206, train/loss_step=0.815, global_step=7915.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  21%|██        | 256/1208 [07:26<27:42,  1.75s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.91e-5, train/loss_step=0.0161, global_step=7915.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  21%|██▏       | 257/1208 [07:28<27:38,  1.74s/it, loss=0.0949, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.91e-5, train/loss_step=0.0161, global_step=7915.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  21%|██▏       | 257/1208 [07:28<27:38,  1.74s/it, loss=0.0833, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000169, train/loss_step=0.0474, global_step=7916.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  21%|██▏       | 258/1208 [07:29<27:33,  1.74s/it, loss=0.0833, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000169, train/loss_step=0.0474, global_step=7916.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  21%|██▏       | 258/1208 [07:29<27:33,  1.74s/it, loss=0.0842, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000294, train/loss_step=0.0891, global_step=7916.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  21%|██▏       | 259/1208 [07:30<27:29,  1.74s/it, loss=0.0842, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000294, train/loss_step=0.0891, global_step=7916.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  21%|██▏       | 259/1208 [07:30<27:29,  1.74s/it, loss=0.0819, v_num=0, train/loss_simple_step=0.0528, train/loss_vlb_step=0.000183, train/loss_step=0.0528, global_step=7916.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  22%|██▏       | 260/1208 [07:33<27:33,  1.74s/it, loss=0.0819, v_num=0, train/loss_simple_step=0.0528, train/loss_vlb_step=0.000183, train/loss_step=0.0528, global_step=7916.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  22%|██▏       | 260/1208 [07:33<27:33,  1.74s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00104, train/loss_step=0.268, global_step=7916.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  22%|██▏       | 261/1208 [07:34<27:29,  1.74s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00104, train/loss_step=0.268, global_step=7916.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  22%|██▏       | 261/1208 [07:34<27:29,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00126, train/loss_step=0.255, global_step=7917.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  22%|██▏       | 262/1208 [07:35<27:25,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00126, train/loss_step=0.255, global_step=7917.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  22%|██▏       | 262/1208 [07:35<27:25,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0911, train/loss_vlb_step=0.000301, train/loss_step=0.0911, global_step=7917.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  22%|██▏       | 263/1208 [07:36<27:21,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0911, train/loss_vlb_step=0.000301, train/loss_step=0.0911, global_step=7917.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  22%|██▏       | 263/1208 [07:36<27:21,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=1.7e-5, train/loss_step=0.00302, global_step=7917.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  22%|██▏       | 264/1208 [07:39<27:24,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=1.7e-5, train/loss_step=0.00302, global_step=7917.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  22%|██▏       | 264/1208 [07:39<27:24,  1.74s/it, loss=0.151, v_num=0, train/loss_simple_step=0.845, train/loss_vlb_step=0.213, train/loss_step=0.845, global_step=7917.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]     Epoch 26:  22%|██▏       | 265/1208 [07:41<27:20,  1.74s/it, loss=0.151, v_num=0, train/loss_simple_step=0.845, train/loss_vlb_step=0.213, train/loss_step=0.845, global_step=7917.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  22%|██▏       | 265/1208 [07:41<27:20,  1.74s/it, loss=0.171, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00255, train/loss_step=0.402, global_step=7918.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  22%|██▏       | 266/1208 [07:42<27:16,  1.74s/it, loss=0.171, v_num=0, train/loss_simple_step=0.402, train/loss_vlb_step=0.00255, train/loss_step=0.402, global_step=7918.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  22%|██▏       | 266/1208 [07:42<27:16,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=8.93e-5, train/loss_step=0.0222, global_step=7918.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  22%|██▏       | 267/1208 [07:43<27:12,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=8.93e-5, train/loss_step=0.0222, global_step=7918.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  22%|██▏       | 267/1208 [07:43<27:12,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00571, train/loss_vlb_step=2.94e-5, train/loss_step=0.00571, global_step=7918.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  22%|██▏       | 268/1208 [07:46<27:15,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00571, train/loss_vlb_step=2.94e-5, train/loss_step=0.00571, global_step=7918.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  22%|██▏       | 268/1208 [07:46<27:15,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.00056, train/loss_step=0.169, global_step=7918.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  22%|██▏       | 269/1208 [07:47<27:11,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.00056, train/loss_step=0.169, global_step=7918.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  22%|██▏       | 269/1208 [07:47<27:11,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.000155, train/loss_step=0.0425, global_step=7919.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  22%|██▏       | 270/1208 [07:48<27:07,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.000155, train/loss_step=0.0425, global_step=7919.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  22%|██▏       | 270/1208 [07:48<27:07,  1.74s/it, loss=0.187, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000538, train/loss_step=0.159, global_step=7919.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  22%|██▏       | 271/1208 [07:49<27:03,  1.73s/it, loss=0.187, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000538, train/loss_step=0.159, global_step=7919.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  22%|██▏       | 271/1208 [07:49<27:03,  1.73s/it, loss=0.192, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=7919.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  23%|██▎       | 272/1208 [07:52<27:07,  1.74s/it, loss=0.192, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=7919.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  23%|██▎       | 272/1208 [07:52<27:07,  1.74s/it, loss=0.189, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00112, train/loss_step=0.247, global_step=7919.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  23%|██▎       | 273/1208 [07:53<27:03,  1.74s/it, loss=0.189, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00112, train/loss_step=0.247, global_step=7919.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  23%|██▎       | 273/1208 [07:53<27:03,  1.74s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.83e-5, train/loss_step=0.0102, global_step=7920.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  23%|██▎       | 274/1208 [07:55<26:59,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.83e-5, train/loss_step=0.0102, global_step=7920.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  23%|██▎       | 274/1208 [07:55<26:59,  1.73s/it, loss=0.204, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00532, train/loss_step=0.442, global_step=7920.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  23%|██▎       | 275/1208 [07:56<26:55,  1.73s/it, loss=0.204, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00532, train/loss_step=0.442, global_step=7920.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  23%|██▎       | 275/1208 [07:56<26:55,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.06e-5, train/loss_step=0.0109, global_step=7920.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  23%|██▎       | 276/1208 [07:59<26:58,  1.74s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.06e-5, train/loss_step=0.0109, global_step=7920.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  23%|██▎       | 276/1208 [07:59<26:58,  1.74s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.53e-5, train/loss_step=0.0151, global_step=7920.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  23%|██▎       | 277/1208 [08:00<26:54,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.53e-5, train/loss_step=0.0151, global_step=7920.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  23%|██▎       | 277/1208 [08:00<26:54,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.62e-5, train/loss_step=0.00292, global_step=7921.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  23%|██▎       | 278/1208 [08:01<26:50,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.62e-5, train/loss_step=0.00292, global_step=7921.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  23%|██▎       | 278/1208 [08:01<26:50,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.001, train/loss_step=0.249, global_step=7921.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]       Epoch 26:  23%|██▎       | 279/1208 [08:02<26:46,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.001, train/loss_step=0.249, global_step=7921.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  23%|██▎       | 279/1208 [08:02<26:46,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000671, train/loss_step=0.187, global_step=7921.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  23%|██▎       | 280/1208 [08:05<26:49,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000671, train/loss_step=0.187, global_step=7921.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  23%|██▎       | 280/1208 [08:05<26:49,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00577, train/loss_vlb_step=3.07e-5, train/loss_step=0.00577, global_step=7921.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  23%|██▎       | 281/1208 [08:06<26:45,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00577, train/loss_vlb_step=3.07e-5, train/loss_step=0.00577, global_step=7921.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  23%|██▎       | 281/1208 [08:06<26:45,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00163, train/loss_step=0.292, global_step=7922.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  23%|██▎       | 282/1208 [08:07<26:41,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00163, train/loss_step=0.292, global_step=7922.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  23%|██▎       | 282/1208 [08:07<26:41,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00809, train/loss_vlb_step=3.98e-5, train/loss_step=0.00809, global_step=7922.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  23%|██▎       | 283/1208 [08:08<26:37,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00809, train/loss_vlb_step=3.98e-5, train/loss_step=0.00809, global_step=7922.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  23%|██▎       | 283/1208 [08:08<26:37,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000462, train/loss_step=0.141, global_step=7922.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  24%|██▎       | 284/1208 [08:12<26:41,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000462, train/loss_step=0.141, global_step=7922.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  24%|██▎       | 284/1208 [08:12<26:41,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000626, train/loss_step=0.183, global_step=7922.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  24%|██▎       | 285/1208 [08:13<26:37,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000626, train/loss_step=0.183, global_step=7922.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  24%|██▎       | 285/1208 [08:13<26:37,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.000166, train/loss_step=0.0471, global_step=7923.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  24%|██▎       | 286/1208 [08:14<26:33,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.000166, train/loss_step=0.0471, global_step=7923.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  24%|██▎       | 286/1208 [08:14<26:33,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.43e-5, train/loss_step=0.0235, global_step=7923.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  24%|██▍       | 287/1208 [08:15<26:30,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.43e-5, train/loss_step=0.0235, global_step=7923.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  24%|██▍       | 287/1208 [08:15<26:30,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00294, train/loss_step=0.366, global_step=7923.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  24%|██▍       | 288/1208 [08:18<26:33,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00294, train/loss_step=0.366, global_step=7923.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  24%|██▍       | 288/1208 [08:18<26:33,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0959, train/loss_vlb_step=0.000319, train/loss_step=0.0959, global_step=7923.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  24%|██▍       | 289/1208 [08:19<26:29,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0959, train/loss_vlb_step=0.000319, train/loss_step=0.0959, global_step=7923.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  24%|██▍       | 289/1208 [08:19<26:29,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000434, train/loss_step=0.129, global_step=7924.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  24%|██▍       | 290/1208 [08:20<26:25,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000434, train/loss_step=0.129, global_step=7924.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  24%|██▍       | 290/1208 [08:20<26:25,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.00014, train/loss_step=0.0372, global_step=7924.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  24%|██▍       | 291/1208 [08:21<26:21,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.00014, train/loss_step=0.0372, global_step=7924.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  24%|██▍       | 291/1208 [08:21<26:21,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000799, train/loss_step=0.212, global_step=7924.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  24%|██▍       | 292/1208 [08:25<26:24,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000799, train/loss_step=0.212, global_step=7924.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  24%|██▍       | 292/1208 [08:25<26:24,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00219, train/loss_step=0.353, global_step=7924.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  24%|██▍       | 293/1208 [08:26<26:21,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00219, train/loss_step=0.353, global_step=7924.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  24%|██▍       | 293/1208 [08:26<26:21,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.79e-5, train/loss_step=0.00319, global_step=7925.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  24%|██▍       | 294/1208 [08:27<26:17,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.79e-5, train/loss_step=0.00319, global_step=7925.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  24%|██▍       | 294/1208 [08:27<26:17,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.66e-5, train/loss_step=0.00313, global_step=7925.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  24%|██▍       | 295/1208 [08:28<26:13,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.66e-5, train/loss_step=0.00313, global_step=7925.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  24%|██▍       | 295/1208 [08:28<26:13,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000955, train/loss_step=0.241, global_step=7925.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  25%|██▍       | 296/1208 [08:31<26:16,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000955, train/loss_step=0.241, global_step=7925.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  25%|██▍       | 296/1208 [08:31<26:16,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.08e-5, train/loss_step=0.0114, global_step=7925.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  25%|██▍       | 297/1208 [08:32<26:12,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.08e-5, train/loss_step=0.0114, global_step=7925.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  25%|██▍       | 297/1208 [08:32<26:12,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0092, train/loss_vlb_step=4.45e-5, train/loss_step=0.0092, global_step=7926.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  25%|██▍       | 298/1208 [08:33<26:09,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0092, train/loss_vlb_step=4.45e-5, train/loss_step=0.0092, global_step=7926.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  25%|██▍       | 298/1208 [08:33<26:09,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=7926.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  25%|██▍       | 299/1208 [08:34<26:05,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=7926.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  25%|██▍       | 299/1208 [08:34<26:05,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0691, train/loss_vlb_step=0.000236, train/loss_step=0.0691, global_step=7926.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  25%|██▍       | 300/1208 [08:38<26:08,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0691, train/loss_vlb_step=0.000236, train/loss_step=0.0691, global_step=7926.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  25%|██▍       | 300/1208 [08:38<26:08,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00107, train/loss_step=0.253, global_step=7926.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:29,  1.68it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:29,  1.64it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:28,  1.69it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:28,  1.69it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.72it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.72it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.72it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.71it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.74it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:26,  1.72it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.73it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.71it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.74it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.73it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.75it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.74it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.78it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.75it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.74it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:23,  1.74it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.75it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.74it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.81it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:22,  1.72it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.76it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.73it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.72it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.76it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:20,  1.73it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.78it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.76it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.73it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.76it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.74it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.79it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.75it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.75it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.75it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.75it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.75it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:16,  1.75it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.77it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.78it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.74it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:15,  1.72it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.78it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.72it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.76it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:15<00:13,  1.72it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.75it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.74it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.76it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:16<00:12,  1.74it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:12,  1.74it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.76it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.74it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.75it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.75it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.75it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:19<00:09,  1.76it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.75it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:20<00:08,  1.74it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:08,  1.74it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.75it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.75it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.75it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.77it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.78it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.75it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:23<00:05,  1.76it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.75it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.78it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.73it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.74it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.74it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.78it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:24<00:04,  1.74it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.75it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.73it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.75it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.78it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.74it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.78it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.75it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.74it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.77it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.75it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:27<00:01,  1.75it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.75it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.78it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.74it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:28<00:00,  1.73it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.74it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.73it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.74it/s]Epoch 26:  25%|██▍       | 301/1208 [09:09<27:36,  1.83s/it, loss=0.129, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00107, train/loss_step=0.253, global_step=7926.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  25%|██▍       | 301/1208 [09:09<27:36,  1.83s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.47e-5, train/loss_step=0.00246, global_step=7927.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  25%|██▌       | 302/1208 [09:10<27:32,  1.82s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.47e-5, train/loss_step=0.00246, global_step=7927.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  25%|██▌       | 302/1208 [09:10<27:32,  1.82s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0819, train/loss_vlb_step=0.000269, train/loss_step=0.0819, global_step=7927.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  25%|██▌       | 303/1208 [09:11<27:28,  1.82s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0819, train/loss_vlb_step=0.000269, train/loss_step=0.0819, global_step=7927.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  25%|██▌       | 303/1208 [09:11<27:28,  1.82s/it, loss=0.133, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00479, train/loss_step=0.433, global_step=7927.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  25%|██▌       | 304/1208 [09:14<27:30,  1.83s/it, loss=0.133, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00479, train/loss_step=0.433, global_step=7927.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  25%|██▌       | 304/1208 [09:14<27:30,  1.83s/it, loss=0.136, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.00101, train/loss_step=0.246, global_step=7927.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  25%|██▌       | 305/1208 [09:15<27:25,  1.82s/it, loss=0.136, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.00101, train/loss_step=0.246, global_step=7927.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  25%|██▌       | 305/1208 [09:15<27:25,  1.82s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.48e-5, train/loss_step=0.0124, global_step=7928.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  25%|██▌       | 306/1208 [09:17<27:21,  1.82s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.48e-5, train/loss_step=0.0124, global_step=7928.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  25%|██▌       | 306/1208 [09:17<27:21,  1.82s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=1.47e-5, train/loss_step=0.00263, global_step=7928.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  25%|██▌       | 307/1208 [09:18<27:17,  1.82s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=1.47e-5, train/loss_step=0.00263, global_step=7928.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  25%|██▌       | 307/1208 [09:18<27:17,  1.82s/it, loss=0.127, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00105, train/loss_step=0.239, global_step=7928.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  25%|██▌       | 308/1208 [09:21<27:20,  1.82s/it, loss=0.127, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00105, train/loss_step=0.239, global_step=7928.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  25%|██▌       | 308/1208 [09:21<27:20,  1.82s/it, loss=0.128, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000375, train/loss_step=0.113, global_step=7928.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  26%|██▌       | 309/1208 [09:22<27:16,  1.82s/it, loss=0.128, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000375, train/loss_step=0.113, global_step=7928.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  26%|██▌       | 309/1208 [09:22<27:16,  1.82s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0893, train/loss_vlb_step=0.000297, train/loss_step=0.0893, global_step=7929.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  26%|██▌       | 310/1208 [09:23<27:12,  1.82s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0893, train/loss_vlb_step=0.000297, train/loss_step=0.0893, global_step=7929.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  26%|██▌       | 310/1208 [09:23<27:12,  1.82s/it, loss=0.136, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00114, train/loss_step=0.247, global_step=7929.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  26%|██▌       | 311/1208 [09:24<27:08,  1.82s/it, loss=0.136, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00114, train/loss_step=0.247, global_step=7929.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  26%|██▌       | 311/1208 [09:24<27:08,  1.82s/it, loss=0.15, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00929, train/loss_step=0.476, global_step=7929.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  26%|██▌       | 312/1208 [09:27<27:10,  1.82s/it, loss=0.15, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00929, train/loss_step=0.476, global_step=7929.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  26%|██▌       | 312/1208 [09:27<27:10,  1.82s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.000208, train/loss_step=0.0598, global_step=7929.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  26%|██▌       | 313/1208 [09:28<27:06,  1.82s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0598, train/loss_vlb_step=0.000208, train/loss_step=0.0598, global_step=7929.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  26%|██▌       | 313/1208 [09:28<27:06,  1.82s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.00012, train/loss_step=0.0322, global_step=7930.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  26%|██▌       | 314/1208 [09:30<27:03,  1.82s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.00012, train/loss_step=0.0322, global_step=7930.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  26%|██▌       | 314/1208 [09:30<27:03,  1.82s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.8e-5, train/loss_step=0.00313, global_step=7930.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  26%|██▌       | 315/1208 [09:31<26:59,  1.81s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.8e-5, train/loss_step=0.00313, global_step=7930.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  26%|██▌       | 315/1208 [09:31<26:59,  1.81s/it, loss=0.158, v_num=0, train/loss_simple_step=0.675, train/loss_vlb_step=0.0387, train/loss_step=0.675, global_step=7930.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  26%|██▌       | 316/1208 [09:34<27:01,  1.82s/it, loss=0.158, v_num=0, train/loss_simple_step=0.675, train/loss_vlb_step=0.0387, train/loss_step=0.675, global_step=7930.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  26%|██▌       | 316/1208 [09:34<27:01,  1.82s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=1.95e-5, train/loss_step=0.00362, global_step=7930.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  26%|██▌       | 317/1208 [09:35<26:57,  1.82s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=1.95e-5, train/loss_step=0.00362, global_step=7930.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  26%|██▌       | 317/1208 [09:35<26:57,  1.82s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.33e-5, train/loss_step=0.0229, global_step=7931.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  26%|██▋       | 318/1208 [09:36<26:53,  1.81s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.33e-5, train/loss_step=0.0229, global_step=7931.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  26%|██▋       | 318/1208 [09:36<26:53,  1.81s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000125, train/loss_step=0.0348, global_step=7931.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  26%|██▋       | 319/1208 [09:37<26:49,  1.81s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000125, train/loss_step=0.0348, global_step=7931.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  26%|██▋       | 319/1208 [09:37<26:49,  1.81s/it, loss=0.18, v_num=0, train/loss_simple_step=0.567, train/loss_vlb_step=0.00952, train/loss_step=0.567, global_step=7931.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  26%|██▋       | 320/1208 [09:40<26:51,  1.82s/it, loss=0.18, v_num=0, train/loss_simple_step=0.567, train/loss_vlb_step=0.00952, train/loss_step=0.567, global_step=7931.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  26%|██▋       | 320/1208 [09:40<26:51,  1.82s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0427, train/loss_vlb_step=0.000155, train/loss_step=0.0427, global_step=7931.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  27%|██▋       | 321/1208 [09:41<26:48,  1.81s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0427, train/loss_vlb_step=0.000155, train/loss_step=0.0427, global_step=7931.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  27%|██▋       | 321/1208 [09:41<26:48,  1.81s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0544, train/loss_vlb_step=0.00019, train/loss_step=0.0544, global_step=7932.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  27%|██▋       | 322/1208 [09:42<26:44,  1.81s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0544, train/loss_vlb_step=0.00019, train/loss_step=0.0544, global_step=7932.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  27%|██▋       | 322/1208 [09:42<26:44,  1.81s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0397, train/loss_vlb_step=0.000148, train/loss_step=0.0397, global_step=7932.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  27%|██▋       | 323/1208 [09:44<26:40,  1.81s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0397, train/loss_vlb_step=0.000148, train/loss_step=0.0397, global_step=7932.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  27%|██▋       | 323/1208 [09:44<26:40,  1.81s/it, loss=0.196, v_num=0, train/loss_simple_step=0.956, train/loss_vlb_step=0.481, train/loss_step=0.956, global_step=7932.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  27%|██▋       | 324/1208 [09:47<26:42,  1.81s/it, loss=0.196, v_num=0, train/loss_simple_step=0.956, train/loss_vlb_step=0.481, train/loss_step=0.956, global_step=7932.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  27%|██▋       | 324/1208 [09:47<26:42,  1.81s/it, loss=0.193, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000667, train/loss_step=0.189, global_step=7932.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  27%|██▋       | 325/1208 [09:48<26:38,  1.81s/it, loss=0.193, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000667, train/loss_step=0.189, global_step=7932.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  27%|██▋       | 325/1208 [09:48<26:38,  1.81s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0517, train/loss_vlb_step=0.000182, train/loss_step=0.0517, global_step=7933.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  27%|██▋       | 326/1208 [09:49<26:34,  1.81s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0517, train/loss_vlb_step=0.000182, train/loss_step=0.0517, global_step=7933.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  27%|██▋       | 326/1208 [09:49<26:34,  1.81s/it, loss=0.2, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000351, train/loss_step=0.107, global_step=7933.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  27%|██▋       | 327/1208 [09:50<26:31,  1.81s/it, loss=0.2, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000351, train/loss_step=0.107, global_step=7933.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  27%|██▋       | 327/1208 [09:50<26:31,  1.81s/it, loss=0.188, v_num=0, train/loss_simple_step=0.00372, train/loss_vlb_step=1.98e-5, train/loss_step=0.00372, global_step=7933.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  27%|██▋       | 328/1208 [09:53<26:32,  1.81s/it, loss=0.188, v_num=0, train/loss_simple_step=0.00372, train/loss_vlb_step=1.98e-5, train/loss_step=0.00372, global_step=7933.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  27%|██▋       | 328/1208 [09:53<26:32,  1.81s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0575, train/loss_vlb_step=0.000196, train/loss_step=0.0575, global_step=7933.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  27%|██▋       | 329/1208 [09:54<26:29,  1.81s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0575, train/loss_vlb_step=0.000196, train/loss_step=0.0575, global_step=7933.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  27%|██▋       | 329/1208 [09:54<26:29,  1.81s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0902, train/loss_vlb_step=0.000298, train/loss_step=0.0902, global_step=7934.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  27%|██▋       | 330/1208 [09:55<26:25,  1.81s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0902, train/loss_vlb_step=0.000298, train/loss_step=0.0902, global_step=7934.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  27%|██▋       | 330/1208 [09:55<26:25,  1.81s/it, loss=0.189, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00147, train/loss_step=0.307, global_step=7934.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  27%|██▋       | 331/1208 [09:56<26:21,  1.80s/it, loss=0.189, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00147, train/loss_step=0.307, global_step=7934.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  27%|██▋       | 331/1208 [09:56<26:21,  1.80s/it, loss=0.183, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00174, train/loss_step=0.355, global_step=7934.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  27%|██▋       | 332/1208 [10:00<26:23,  1.81s/it, loss=0.183, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00174, train/loss_step=0.355, global_step=7934.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  27%|██▋       | 332/1208 [10:00<26:23,  1.81s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0634, train/loss_vlb_step=0.000216, train/loss_step=0.0634, global_step=7934.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  28%|██▊       | 333/1208 [10:01<26:19,  1.81s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0634, train/loss_vlb_step=0.000216, train/loss_step=0.0634, global_step=7934.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  28%|██▊       | 333/1208 [10:01<26:19,  1.81s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000108, train/loss_step=0.0281, global_step=7935.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  28%|██▊       | 334/1208 [10:02<26:15,  1.80s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000108, train/loss_step=0.0281, global_step=7935.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  28%|██▊       | 334/1208 [10:02<26:15,  1.80s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=1.32e-5, train/loss_step=0.00223, global_step=7935.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  28%|██▊       | 335/1208 [10:03<26:12,  1.80s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=1.32e-5, train/loss_step=0.00223, global_step=7935.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  28%|██▊       | 335/1208 [10:03<26:12,  1.80s/it, loss=0.172, v_num=0, train/loss_simple_step=0.459, train/loss_vlb_step=0.00492, train/loss_step=0.459, global_step=7935.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  28%|██▊       | 336/1208 [10:06<26:14,  1.81s/it, loss=0.172, v_num=0, train/loss_simple_step=0.459, train/loss_vlb_step=0.00492, train/loss_step=0.459, global_step=7935.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  28%|██▊       | 336/1208 [10:06<26:14,  1.81s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0554, train/loss_vlb_step=0.000191, train/loss_step=0.0554, global_step=7935.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  28%|██▊       | 337/1208 [10:07<26:10,  1.80s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0554, train/loss_vlb_step=0.000191, train/loss_step=0.0554, global_step=7935.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  28%|██▊       | 337/1208 [10:07<26:10,  1.80s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0657, train/loss_vlb_step=0.000222, train/loss_step=0.0657, global_step=7936.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  28%|██▊       | 338/1208 [10:08<26:06,  1.80s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0657, train/loss_vlb_step=0.000222, train/loss_step=0.0657, global_step=7936.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  28%|██▊       | 338/1208 [10:08<26:06,  1.80s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6e-5, train/loss_step=0.0142, global_step=7936.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  28%|██▊       | 339/1208 [10:09<26:03,  1.80s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6e-5, train/loss_step=0.0142, global_step=7936.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  28%|██▊       | 339/1208 [10:09<26:03,  1.80s/it, loss=0.16, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00112, train/loss_step=0.260, global_step=7936.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  28%|██▊       | 340/1208 [10:13<26:05,  1.80s/it, loss=0.16, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00112, train/loss_step=0.260, global_step=7936.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  28%|██▊       | 340/1208 [10:13<26:05,  1.80s/it, loss=0.174, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.0024, train/loss_step=0.311, global_step=7936.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  28%|██▊       | 341/1208 [10:14<26:01,  1.80s/it, loss=0.174, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.0024, train/loss_step=0.311, global_step=7936.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  28%|██▊       | 341/1208 [10:14<26:01,  1.80s/it, loss=0.193, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.0028, train/loss_step=0.435, global_step=7937.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  28%|██▊       | 342/1208 [10:15<25:58,  1.80s/it, loss=0.193, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.0028, train/loss_step=0.435, global_step=7937.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  28%|██▊       | 342/1208 [10:15<25:58,  1.80s/it, loss=0.207, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00148, train/loss_step=0.326, global_step=7937.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  28%|██▊       | 343/1208 [10:16<25:54,  1.80s/it, loss=0.207, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.00148, train/loss_step=0.326, global_step=7937.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  28%|██▊       | 343/1208 [10:16<25:54,  1.80s/it, loss=0.176, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00236, train/loss_step=0.339, global_step=7937.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  28%|██▊       | 344/1208 [10:19<25:56,  1.80s/it, loss=0.176, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00236, train/loss_step=0.339, global_step=7937.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  28%|██▊       | 344/1208 [10:19<25:56,  1.80s/it, loss=0.175, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000599, train/loss_step=0.175, global_step=7937.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  29%|██▊       | 345/1208 [10:20<25:52,  1.80s/it, loss=0.175, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000599, train/loss_step=0.175, global_step=7937.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  29%|██▊       | 345/1208 [10:20<25:52,  1.80s/it, loss=0.189, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00211, train/loss_step=0.324, global_step=7938.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  29%|██▊       | 346/1208 [10:21<25:49,  1.80s/it, loss=0.189, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00211, train/loss_step=0.324, global_step=7938.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  29%|██▊       | 346/1208 [10:21<25:49,  1.80s/it, loss=0.191, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.00053, train/loss_step=0.155, global_step=7938.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  29%|██▊       | 347/1208 [10:22<25:45,  1.80s/it, loss=0.191, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.00053, train/loss_step=0.155, global_step=7938.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  29%|██▊       | 347/1208 [10:22<25:45,  1.80s/it, loss=0.196, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000317, train/loss_step=0.095, global_step=7938.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  29%|██▉       | 348/1208 [10:26<25:47,  1.80s/it, loss=0.196, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000317, train/loss_step=0.095, global_step=7938.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  29%|██▉       | 348/1208 [10:26<25:47,  1.80s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0069, train/loss_vlb_step=3.37e-5, train/loss_step=0.0069, global_step=7938.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  29%|██▉       | 349/1208 [10:27<25:44,  1.80s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0069, train/loss_vlb_step=3.37e-5, train/loss_step=0.0069, global_step=7938.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  29%|██▉       | 349/1208 [10:27<25:44,  1.80s/it, loss=0.2, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000844, train/loss_step=0.229, global_step=7939.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  29%|██▉       | 350/1208 [10:28<25:40,  1.80s/it, loss=0.2, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000844, train/loss_step=0.229, global_step=7939.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  29%|██▉       | 350/1208 [10:28<25:40,  1.80s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.21e-5, train/loss_step=0.0146, global_step=7939.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  29%|██▉       | 351/1208 [10:29<25:36,  1.79s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.21e-5, train/loss_step=0.0146, global_step=7939.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  29%|██▉       | 351/1208 [10:29<25:36,  1.79s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00661, train/loss_vlb_step=3.26e-5, train/loss_step=0.00661, global_step=7939.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  29%|██▉       | 352/1208 [10:32<25:38,  1.80s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00661, train/loss_vlb_step=3.26e-5, train/loss_step=0.00661, global_step=7939.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  29%|██▉       | 352/1208 [10:32<25:38,  1.80s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.2e-5, train/loss_step=0.0146, global_step=7939.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  29%|██▉       | 353/1208 [10:33<25:35,  1.80s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.2e-5, train/loss_step=0.0146, global_step=7939.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  29%|██▉       | 353/1208 [10:33<25:35,  1.80s/it, loss=0.176, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000867, train/loss_step=0.223, global_step=7940.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  29%|██▉       | 354/1208 [10:34<25:31,  1.79s/it, loss=0.176, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000867, train/loss_step=0.223, global_step=7940.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  29%|██▉       | 354/1208 [10:34<25:31,  1.79s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0968, train/loss_vlb_step=0.000319, train/loss_step=0.0968, global_step=7940.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  29%|██▉       | 355/1208 [10:35<25:28,  1.79s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0968, train/loss_vlb_step=0.000319, train/loss_step=0.0968, global_step=7940.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  29%|██▉       | 355/1208 [10:35<25:28,  1.79s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0681, train/loss_vlb_step=0.000229, train/loss_step=0.0681, global_step=7940.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  29%|██▉       | 356/1208 [10:39<25:29,  1.80s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0681, train/loss_vlb_step=0.000229, train/loss_step=0.0681, global_step=7940.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  29%|██▉       | 356/1208 [10:39<25:29,  1.80s/it, loss=0.172, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00111, train/loss_step=0.283, global_step=7940.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  30%|██▉       | 357/1208 [10:40<25:26,  1.79s/it, loss=0.172, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00111, train/loss_step=0.283, global_step=7940.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  30%|██▉       | 357/1208 [10:40<25:26,  1.79s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.63e-5, train/loss_step=0.0118, global_step=7941.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  30%|██▉       | 358/1208 [10:41<25:23,  1.79s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.63e-5, train/loss_step=0.0118, global_step=7941.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  30%|██▉       | 358/1208 [10:41<25:23,  1.79s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.35e-5, train/loss_step=0.0113, global_step=7941.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  30%|██▉       | 359/1208 [10:42<25:19,  1.79s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.35e-5, train/loss_step=0.0113, global_step=7941.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  30%|██▉       | 359/1208 [10:42<25:19,  1.79s/it, loss=0.195, v_num=0, train/loss_simple_step=0.783, train/loss_vlb_step=0.0995, train/loss_step=0.783, global_step=7941.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  30%|██▉       | 360/1208 [10:45<25:21,  1.79s/it, loss=0.195, v_num=0, train/loss_simple_step=0.783, train/loss_vlb_step=0.0995, train/loss_step=0.783, global_step=7941.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  30%|██▉       | 360/1208 [10:45<25:21,  1.79s/it, loss=0.187, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.0005, train/loss_step=0.146, global_step=7941.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  30%|██▉       | 361/1208 [10:46<25:17,  1.79s/it, loss=0.187, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.0005, train/loss_step=0.146, global_step=7941.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  30%|██▉       | 361/1208 [10:46<25:17,  1.79s/it, loss=0.171, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=7942.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  30%|██▉       | 362/1208 [10:47<25:14,  1.79s/it, loss=0.171, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=7942.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  30%|██▉       | 362/1208 [10:47<25:14,  1.79s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0516, train/loss_vlb_step=0.000183, train/loss_step=0.0516, global_step=7942.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  30%|███       | 363/1208 [10:49<25:10,  1.79s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0516, train/loss_vlb_step=0.000183, train/loss_step=0.0516, global_step=7942.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  30%|███       | 363/1208 [10:49<25:10,  1.79s/it, loss=0.15, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000758, train/loss_step=0.208, global_step=7942.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  30%|███       | 364/1208 [10:52<25:12,  1.79s/it, loss=0.15, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000758, train/loss_step=0.208, global_step=7942.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  30%|███       | 364/1208 [10:52<25:12,  1.79s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.05e-5, train/loss_step=0.00178, global_step=7942.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  30%|███       | 365/1208 [10:53<25:09,  1.79s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.05e-5, train/loss_step=0.00178, global_step=7942.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  30%|███       | 365/1208 [10:53<25:09,  1.79s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0934, train/loss_vlb_step=0.000307, train/loss_step=0.0934, global_step=7943.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  30%|███       | 366/1208 [10:54<25:05,  1.79s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0934, train/loss_vlb_step=0.000307, train/loss_step=0.0934, global_step=7943.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  30%|███       | 366/1208 [10:54<25:05,  1.79s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00293, train/loss_vlb_step=1.68e-5, train/loss_step=0.00293, global_step=7943.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  30%|███       | 367/1208 [10:55<25:02,  1.79s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00293, train/loss_vlb_step=1.68e-5, train/loss_step=0.00293, global_step=7943.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  30%|███       | 367/1208 [10:55<25:02,  1.79s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0842, train/loss_vlb_step=0.000277, train/loss_step=0.0842, global_step=7943.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  30%|███       | 368/1208 [10:58<25:03,  1.79s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0842, train/loss_vlb_step=0.000277, train/loss_step=0.0842, global_step=7943.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  30%|███       | 368/1208 [10:58<25:03,  1.79s/it, loss=0.139, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00239, train/loss_step=0.336, global_step=7943.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  31%|███       | 369/1208 [10:59<25:00,  1.79s/it, loss=0.139, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00239, train/loss_step=0.336, global_step=7943.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  31%|███       | 369/1208 [10:59<25:00,  1.79s/it, loss=0.135, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000535, train/loss_step=0.157, global_step=7944.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  31%|███       | 370/1208 [11:00<24:56,  1.79s/it, loss=0.135, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000535, train/loss_step=0.157, global_step=7944.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  31%|███       | 370/1208 [11:00<24:56,  1.79s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0637, train/loss_vlb_step=0.000216, train/loss_step=0.0637, global_step=7944.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  31%|███       | 371/1208 [11:01<24:53,  1.78s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0637, train/loss_vlb_step=0.000216, train/loss_step=0.0637, global_step=7944.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  31%|███       | 371/1208 [11:01<24:53,  1.78s/it, loss=0.172, v_num=0, train/loss_simple_step=0.690, train/loss_vlb_step=0.0242, train/loss_step=0.690, global_step=7944.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  31%|███       | 372/1208 [11:05<24:54,  1.79s/it, loss=0.172, v_num=0, train/loss_simple_step=0.690, train/loss_vlb_step=0.0242, train/loss_step=0.690, global_step=7944.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  31%|███       | 372/1208 [11:05<24:54,  1.79s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00729, train/loss_vlb_step=3.44e-5, train/loss_step=0.00729, global_step=7944.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  31%|███       | 373/1208 [11:06<24:51,  1.79s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00729, train/loss_vlb_step=3.44e-5, train/loss_step=0.00729, global_step=7944.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  31%|███       | 373/1208 [11:06<24:51,  1.79s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.6e-5, train/loss_step=0.00311, global_step=7945.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  31%|███       | 374/1208 [11:07<24:48,  1.78s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.6e-5, train/loss_step=0.00311, global_step=7945.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  31%|███       | 374/1208 [11:07<24:48,  1.78s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=8e-5, train/loss_step=0.0186, global_step=7945.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  31%|███       | 375/1208 [11:08<24:45,  1.78s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=8e-5, train/loss_step=0.0186, global_step=7945.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  31%|███       | 375/1208 [11:08<24:45,  1.78s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=8.92e-5, train/loss_step=0.0221, global_step=7945.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  31%|███       | 376/1208 [11:11<24:46,  1.79s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=8.92e-5, train/loss_step=0.0221, global_step=7945.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  31%|███       | 376/1208 [11:11<24:46,  1.79s/it, loss=0.147, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.00047, train/loss_step=0.139, global_step=7945.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  31%|███       | 377/1208 [11:12<24:42,  1.78s/it, loss=0.147, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.00047, train/loss_step=0.139, global_step=7945.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  31%|███       | 377/1208 [11:12<24:42,  1.78s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00379, train/loss_vlb_step=2.12e-5, train/loss_step=0.00379, global_step=7946.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  31%|███▏      | 378/1208 [11:13<24:39,  1.78s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00379, train/loss_vlb_step=2.12e-5, train/loss_step=0.00379, global_step=7946.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  31%|███▏      | 378/1208 [11:13<24:39,  1.78s/it, loss=0.17, v_num=0, train/loss_simple_step=0.475, train/loss_vlb_step=0.00845, train/loss_step=0.475, global_step=7946.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]     Epoch 26:  31%|███▏      | 379/1208 [11:14<24:36,  1.78s/it, loss=0.17, v_num=0, train/loss_simple_step=0.475, train/loss_vlb_step=0.00845, train/loss_step=0.475, global_step=7946.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  31%|███▏      | 379/1208 [11:14<24:36,  1.78s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0481, train/loss_vlb_step=0.000176, train/loss_step=0.0481, global_step=7946.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  31%|███▏      | 380/1208 [11:18<24:37,  1.78s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0481, train/loss_vlb_step=0.000176, train/loss_step=0.0481, global_step=7946.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  31%|███▏      | 380/1208 [11:18<24:37,  1.78s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000108, train/loss_step=0.0274, global_step=7946.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  32%|███▏      | 381/1208 [11:19<24:34,  1.78s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000108, train/loss_step=0.0274, global_step=7946.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  32%|███▏      | 381/1208 [11:19<24:34,  1.78s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0837, train/loss_vlb_step=0.000275, train/loss_step=0.0837, global_step=7947.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  32%|███▏      | 382/1208 [11:20<24:30,  1.78s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0837, train/loss_vlb_step=0.000275, train/loss_step=0.0837, global_step=7947.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  32%|███▏      | 382/1208 [11:20<24:30,  1.78s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0723, train/loss_vlb_step=0.000245, train/loss_step=0.0723, global_step=7947.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  32%|███▏      | 383/1208 [11:21<24:27,  1.78s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0723, train/loss_vlb_step=0.000245, train/loss_step=0.0723, global_step=7947.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  32%|███▏      | 383/1208 [11:21<24:27,  1.78s/it, loss=0.135, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00331, train/loss_step=0.369, global_step=7947.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  32%|███▏      | 384/1208 [11:24<24:28,  1.78s/it, loss=0.135, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00331, train/loss_step=0.369, global_step=7947.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  32%|███▏      | 384/1208 [11:24<24:28,  1.78s/it, loss=0.153, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00182, train/loss_step=0.357, global_step=7947.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  32%|███▏      | 385/1208 [11:25<24:25,  1.78s/it, loss=0.153, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00182, train/loss_step=0.357, global_step=7947.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  32%|███▏      | 385/1208 [11:25<24:25,  1.78s/it, loss=0.158, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000714, train/loss_step=0.197, global_step=7948.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  32%|███▏      | 386/1208 [11:26<24:22,  1.78s/it, loss=0.158, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000714, train/loss_step=0.197, global_step=7948.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  32%|███▏      | 386/1208 [11:26<24:22,  1.78s/it, loss=0.171, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00109, train/loss_step=0.257, global_step=7948.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  32%|███▏      | 387/1208 [11:27<24:18,  1.78s/it, loss=0.171, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00109, train/loss_step=0.257, global_step=7948.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  32%|███▏      | 387/1208 [11:27<24:18,  1.78s/it, loss=0.179, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.0011, train/loss_step=0.259, global_step=7948.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  32%|███▏      | 388/1208 [11:30<24:20,  1.78s/it, loss=0.179, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.0011, train/loss_step=0.259, global_step=7948.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  32%|███▏      | 388/1208 [11:30<24:20,  1.78s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0667, train/loss_vlb_step=0.000225, train/loss_step=0.0667, global_step=7948.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  32%|███▏      | 389/1208 [11:32<24:16,  1.78s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0667, train/loss_vlb_step=0.000225, train/loss_step=0.0667, global_step=7948.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  32%|███▏      | 389/1208 [11:32<24:16,  1.78s/it, loss=0.164, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000414, train/loss_step=0.123, global_step=7949.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  32%|███▏      | 390/1208 [11:33<24:13,  1.78s/it, loss=0.164, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000414, train/loss_step=0.123, global_step=7949.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  32%|███▏      | 390/1208 [11:33<24:13,  1.78s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.000195, train/loss_step=0.0537, global_step=7949.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  32%|███▏      | 391/1208 [11:34<24:10,  1.78s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.000195, train/loss_step=0.0537, global_step=7949.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  32%|███▏      | 391/1208 [11:34<24:10,  1.78s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0945, train/loss_vlb_step=0.000315, train/loss_step=0.0945, global_step=7949.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  32%|███▏      | 392/1208 [11:37<24:11,  1.78s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0945, train/loss_vlb_step=0.000315, train/loss_step=0.0945, global_step=7949.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  32%|███▏      | 392/1208 [11:37<24:11,  1.78s/it, loss=0.144, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000946, train/loss_step=0.215, global_step=7949.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  33%|███▎      | 393/1208 [11:38<24:08,  1.78s/it, loss=0.144, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000946, train/loss_step=0.215, global_step=7949.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  33%|███▎      | 393/1208 [11:38<24:08,  1.78s/it, loss=0.164, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00497, train/loss_step=0.390, global_step=7950.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  33%|███▎      | 394/1208 [11:39<24:05,  1.78s/it, loss=0.164, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00497, train/loss_step=0.390, global_step=7950.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  33%|███▎      | 394/1208 [11:39<24:05,  1.78s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=2.93e-5, train/loss_step=0.00572, global_step=7950.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  33%|███▎      | 395/1208 [11:40<24:02,  1.77s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=2.93e-5, train/loss_step=0.00572, global_step=7950.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  33%|███▎      | 395/1208 [11:40<24:02,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00903, train/loss_vlb_step=4.4e-5, train/loss_step=0.00903, global_step=7950.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  33%|███▎      | 396/1208 [11:43<24:03,  1.78s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00903, train/loss_vlb_step=4.4e-5, train/loss_step=0.00903, global_step=7950.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  33%|███▎      | 396/1208 [11:43<24:03,  1.78s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000152, train/loss_step=0.0415, global_step=7950.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  33%|███▎      | 397/1208 [11:44<24:00,  1.78s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000152, train/loss_step=0.0415, global_step=7950.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  33%|███▎      | 397/1208 [11:44<24:00,  1.78s/it, loss=0.183, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.00723, train/loss_step=0.512, global_step=7951.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  33%|███▎      | 398/1208 [11:46<23:56,  1.77s/it, loss=0.183, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.00723, train/loss_step=0.512, global_step=7951.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  33%|███▎      | 398/1208 [11:46<23:56,  1.77s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.42e-5, train/loss_step=0.0142, global_step=7951.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  33%|███▎      | 399/1208 [11:47<23:53,  1.77s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.42e-5, train/loss_step=0.0142, global_step=7951.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  33%|███▎      | 399/1208 [11:47<23:53,  1.77s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00436, train/loss_vlb_step=2.29e-5, train/loss_step=0.00436, global_step=7951.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  33%|███▎      | 400/1208 [11:50<23:54,  1.78s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00436, train/loss_vlb_step=2.29e-5, train/loss_step=0.00436, global_step=7951.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  33%|███▎      | 400/1208 [11:50<23:54,  1.78s/it, loss=0.164, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000541, train/loss_step=0.160, global_step=7951.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  33%|███▎      | 401/1208 [11:51<23:51,  1.77s/it, loss=0.164, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000541, train/loss_step=0.160, global_step=7951.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  33%|███▎      | 401/1208 [11:51<23:51,  1.77s/it, loss=0.178, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00293, train/loss_step=0.369, global_step=7952.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  33%|███▎      | 402/1208 [11:52<23:48,  1.77s/it, loss=0.178, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00293, train/loss_step=0.369, global_step=7952.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  33%|███▎      | 402/1208 [11:52<23:48,  1.77s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00838, train/loss_vlb_step=3.98e-5, train/loss_step=0.00838, global_step=7952.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  33%|███▎      | 403/1208 [11:53<23:45,  1.77s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00838, train/loss_vlb_step=3.98e-5, train/loss_step=0.00838, global_step=7952.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  33%|███▎      | 403/1208 [11:53<23:45,  1.77s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=6.46e-5, train/loss_step=0.0163, global_step=7952.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  33%|███▎      | 404/1208 [11:56<23:46,  1.77s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=6.46e-5, train/loss_step=0.0163, global_step=7952.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  33%|███▎      | 404/1208 [11:56<23:46,  1.77s/it, loss=0.15, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000684, train/loss_step=0.195, global_step=7952.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  34%|███▎      | 405/1208 [11:57<23:43,  1.77s/it, loss=0.15, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000684, train/loss_step=0.195, global_step=7952.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  34%|███▎      | 405/1208 [11:57<23:43,  1.77s/it, loss=0.146, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000448, train/loss_step=0.135, global_step=7953.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  34%|███▎      | 406/1208 [11:58<23:39,  1.77s/it, loss=0.146, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000448, train/loss_step=0.135, global_step=7953.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  34%|███▎      | 406/1208 [11:58<23:39,  1.77s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000144, train/loss_step=0.0381, global_step=7953.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  34%|███▎      | 407/1208 [11:59<23:36,  1.77s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000144, train/loss_step=0.0381, global_step=7953.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  34%|███▎      | 407/1208 [11:59<23:36,  1.77s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.54e-5, train/loss_step=0.00475, global_step=7953.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  34%|███▍      | 408/1208 [12:03<23:37,  1.77s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.54e-5, train/loss_step=0.00475, global_step=7953.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  34%|███▍      | 408/1208 [12:03<23:37,  1.77s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0592, train/loss_vlb_step=0.000198, train/loss_step=0.0592, global_step=7953.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  34%|███▍      | 409/1208 [12:04<23:34,  1.77s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0592, train/loss_vlb_step=0.000198, train/loss_step=0.0592, global_step=7953.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  34%|███▍      | 409/1208 [12:04<23:34,  1.77s/it, loss=0.127, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.00072, train/loss_step=0.215, global_step=7954.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  34%|███▍      | 410/1208 [12:05<23:31,  1.77s/it, loss=0.127, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.00072, train/loss_step=0.215, global_step=7954.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  34%|███▍      | 410/1208 [12:05<23:31,  1.77s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.66e-5, train/loss_step=0.0029, global_step=7954.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  34%|███▍      | 411/1208 [12:06<23:28,  1.77s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.66e-5, train/loss_step=0.0029, global_step=7954.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  34%|███▍      | 411/1208 [12:06<23:28,  1.77s/it, loss=0.138, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00265, train/loss_step=0.370, global_step=7954.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  34%|███▍      | 412/1208 [12:09<23:29,  1.77s/it, loss=0.138, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00265, train/loss_step=0.370, global_step=7954.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  34%|███▍      | 412/1208 [12:09<23:29,  1.77s/it, loss=0.13, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.000159, train/loss_step=0.045, global_step=7954.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  34%|███▍      | 413/1208 [12:10<23:26,  1.77s/it, loss=0.13, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.000159, train/loss_step=0.045, global_step=7954.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  34%|███▍      | 413/1208 [12:10<23:26,  1.77s/it, loss=0.122, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000993, train/loss_step=0.226, global_step=7955.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  34%|███▍      | 414/1208 [12:11<23:23,  1.77s/it, loss=0.122, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000993, train/loss_step=0.226, global_step=7955.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  34%|███▍      | 414/1208 [12:11<23:23,  1.77s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.00011, train/loss_step=0.0293, global_step=7955.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  34%|███▍      | 415/1208 [12:12<23:20,  1.77s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.00011, train/loss_step=0.0293, global_step=7955.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  34%|███▍      | 415/1208 [12:12<23:20,  1.77s/it, loss=0.13, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000546, train/loss_step=0.162, global_step=7955.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  34%|███▍      | 416/1208 [12:15<23:21,  1.77s/it, loss=0.13, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000546, train/loss_step=0.162, global_step=7955.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  34%|███▍      | 416/1208 [12:15<23:21,  1.77s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.44e-5, train/loss_step=0.00247, global_step=7955.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  35%|███▍      | 417/1208 [12:17<23:18,  1.77s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.44e-5, train/loss_step=0.00247, global_step=7955.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  35%|███▍      | 417/1208 [12:17<23:18,  1.77s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000127, train/loss_step=0.0327, global_step=7956.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  35%|███▍      | 418/1208 [12:18<23:14,  1.77s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000127, train/loss_step=0.0327, global_step=7956.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  35%|███▍      | 418/1208 [12:18<23:14,  1.77s/it, loss=0.119, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00144, train/loss_step=0.306, global_step=7956.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  35%|███▍      | 419/1208 [12:19<23:11,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00144, train/loss_step=0.306, global_step=7956.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  35%|███▍      | 419/1208 [12:19<23:11,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=1.96e-5, train/loss_step=0.00365, global_step=7956.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  35%|███▍      | 420/1208 [12:22<23:12,  1.77s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=1.96e-5, train/loss_step=0.00365, global_step=7956.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  35%|███▍      | 420/1208 [12:22<23:12,  1.77s/it, loss=0.117, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000415, train/loss_step=0.126, global_step=7956.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  35%|███▍      | 421/1208 [12:23<23:09,  1.77s/it, loss=0.117, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000415, train/loss_step=0.126, global_step=7956.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  35%|███▍      | 421/1208 [12:23<23:09,  1.77s/it, loss=0.12, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.0036, train/loss_step=0.420, global_step=7957.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  35%|███▍      | 422/1208 [12:24<23:06,  1.76s/it, loss=0.12, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.0036, train/loss_step=0.420, global_step=7957.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  35%|███▍      | 422/1208 [12:24<23:06,  1.76s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.36e-5, train/loss_step=0.00235, global_step=7957.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  35%|███▌      | 423/1208 [12:25<23:03,  1.76s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.36e-5, train/loss_step=0.00235, global_step=7957.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  35%|███▌      | 423/1208 [12:25<23:03,  1.76s/it, loss=0.129, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000786, train/loss_step=0.204, global_step=7957.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  35%|███▌      | 424/1208 [12:28<23:04,  1.77s/it, loss=0.129, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000786, train/loss_step=0.204, global_step=7957.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  35%|███▌      | 424/1208 [12:28<23:04,  1.77s/it, loss=0.134, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00165, train/loss_step=0.302, global_step=7957.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  35%|███▌      | 425/1208 [12:29<23:01,  1.76s/it, loss=0.134, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00165, train/loss_step=0.302, global_step=7957.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  35%|███▌      | 425/1208 [12:29<23:01,  1.76s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.94e-5, train/loss_step=0.0213, global_step=7958.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  35%|███▌      | 426/1208 [12:30<22:58,  1.76s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.94e-5, train/loss_step=0.0213, global_step=7958.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  35%|███▌      | 426/1208 [12:30<22:58,  1.76s/it, loss=0.134, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000491, train/loss_step=0.147, global_step=7958.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  35%|███▌      | 427/1208 [12:31<22:55,  1.76s/it, loss=0.134, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000491, train/loss_step=0.147, global_step=7958.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  35%|███▌      | 427/1208 [12:31<22:55,  1.76s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.74e-5, train/loss_step=0.0122, global_step=7958.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  35%|███▌      | 428/1208 [12:35<22:56,  1.76s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.74e-5, train/loss_step=0.0122, global_step=7958.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  35%|███▌      | 428/1208 [12:35<22:56,  1.76s/it, loss=0.145, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00123, train/loss_step=0.272, global_step=7958.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  36%|███▌      | 429/1208 [12:36<22:53,  1.76s/it, loss=0.145, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00123, train/loss_step=0.272, global_step=7958.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  36%|███▌      | 429/1208 [12:36<22:53,  1.76s/it, loss=0.14, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=7959.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  36%|███▌      | 430/1208 [12:37<22:50,  1.76s/it, loss=0.14, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=7959.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  36%|███▌      | 430/1208 [12:37<22:50,  1.76s/it, loss=0.15, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.00075, train/loss_step=0.201, global_step=7959.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  36%|███▌      | 431/1208 [12:38<22:46,  1.76s/it, loss=0.15, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.00075, train/loss_step=0.201, global_step=7959.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  36%|███▌      | 431/1208 [12:38<22:46,  1.76s/it, loss=0.134, v_num=0, train/loss_simple_step=0.049, train/loss_vlb_step=0.000181, train/loss_step=0.049, global_step=7959.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  36%|███▌      | 432/1208 [12:41<22:47,  1.76s/it, loss=0.134, v_num=0, train/loss_simple_step=0.049, train/loss_vlb_step=0.000181, train/loss_step=0.049, global_step=7959.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  36%|███▌      | 432/1208 [12:41<22:47,  1.76s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.83e-5, train/loss_step=0.0161, global_step=7959.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  36%|███▌      | 433/1208 [12:42<22:44,  1.76s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.83e-5, train/loss_step=0.0161, global_step=7959.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  36%|███▌      | 433/1208 [12:42<22:44,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0475, train/loss_vlb_step=0.000168, train/loss_step=0.0475, global_step=7960.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  36%|███▌      | 434/1208 [12:43<22:41,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0475, train/loss_vlb_step=0.000168, train/loss_step=0.0475, global_step=7960.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  36%|███▌      | 434/1208 [12:43<22:41,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.000132, train/loss_step=0.0379, global_step=7960.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  36%|███▌      | 435/1208 [12:44<22:38,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.000132, train/loss_step=0.0379, global_step=7960.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  36%|███▌      | 435/1208 [12:44<22:38,  1.76s/it, loss=0.125, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000586, train/loss_step=0.170, global_step=7960.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  36%|███▌      | 436/1208 [12:47<22:39,  1.76s/it, loss=0.125, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000586, train/loss_step=0.170, global_step=7960.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  36%|███▌      | 436/1208 [12:47<22:39,  1.76s/it, loss=0.132, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000537, train/loss_step=0.156, global_step=7960.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  36%|███▌      | 437/1208 [12:48<22:36,  1.76s/it, loss=0.132, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000537, train/loss_step=0.156, global_step=7960.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  36%|███▌      | 437/1208 [12:48<22:36,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00945, train/loss_vlb_step=4.34e-5, train/loss_step=0.00945, global_step=7961.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  36%|███▋      | 438/1208 [12:50<22:33,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00945, train/loss_vlb_step=4.34e-5, train/loss_step=0.00945, global_step=7961.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  36%|███▋      | 438/1208 [12:50<22:33,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000247, train/loss_step=0.0741, global_step=7961.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  36%|███▋      | 439/1208 [12:51<22:30,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000247, train/loss_step=0.0741, global_step=7961.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  36%|███▋      | 439/1208 [12:51<22:30,  1.76s/it, loss=0.132, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00103, train/loss_step=0.255, global_step=7961.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  36%|███▋      | 440/1208 [12:54<22:31,  1.76s/it, loss=0.132, v_num=0, train/loss_simple_step=0.255, train/loss_vlb_step=0.00103, train/loss_step=0.255, global_step=7961.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  36%|███▋      | 440/1208 [12:54<22:31,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000377, train/loss_step=0.114, global_step=7961.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  37%|███▋      | 441/1208 [12:55<22:28,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000377, train/loss_step=0.114, global_step=7961.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  37%|███▋      | 441/1208 [12:55<22:28,  1.76s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.58e-5, train/loss_step=0.0148, global_step=7962.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  37%|███▋      | 442/1208 [12:56<22:25,  1.76s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.58e-5, train/loss_step=0.0148, global_step=7962.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  37%|███▋      | 442/1208 [12:56<22:25,  1.76s/it, loss=0.127, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00152, train/loss_step=0.318, global_step=7962.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  37%|███▋      | 443/1208 [12:57<22:22,  1.76s/it, loss=0.127, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00152, train/loss_step=0.318, global_step=7962.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  37%|███▋      | 443/1208 [12:57<22:22,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000511, train/loss_step=0.147, global_step=7962.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  37%|███▋      | 444/1208 [13:00<22:23,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000511, train/loss_step=0.147, global_step=7962.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  37%|███▋      | 444/1208 [13:00<22:23,  1.76s/it, loss=0.153, v_num=0, train/loss_simple_step=0.872, train/loss_vlb_step=0.439, train/loss_step=0.872, global_step=7962.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  37%|███▋      | 445/1208 [13:01<22:20,  1.76s/it, loss=0.153, v_num=0, train/loss_simple_step=0.872, train/loss_vlb_step=0.439, train/loss_step=0.872, global_step=7962.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  37%|███▋      | 445/1208 [13:01<22:20,  1.76s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=2.09e-5, train/loss_step=0.00373, global_step=7963.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  37%|███▋      | 446/1208 [13:02<22:17,  1.76s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=2.09e-5, train/loss_step=0.00373, global_step=7963.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  37%|███▋      | 446/1208 [13:02<22:17,  1.76s/it, loss=0.16, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00168, train/loss_step=0.318, global_step=7963.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]     Epoch 26:  37%|███▋      | 447/1208 [13:03<22:14,  1.75s/it, loss=0.16, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00168, train/loss_step=0.318, global_step=7963.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  37%|███▋      | 447/1208 [13:03<22:14,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.00017, train/loss_step=0.0471, global_step=7963.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  37%|███▋      | 448/1208 [13:07<22:15,  1.76s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.00017, train/loss_step=0.0471, global_step=7963.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  37%|███▋      | 448/1208 [13:07<22:15,  1.76s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000196, train/loss_step=0.0545, global_step=7963.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  37%|███▋      | 449/1208 [13:08<22:12,  1.76s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000196, train/loss_step=0.0545, global_step=7963.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  37%|███▋      | 449/1208 [13:08<22:12,  1.76s/it, loss=0.166, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00298, train/loss_step=0.411, global_step=7964.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  37%|███▋      | 450/1208 [13:09<22:09,  1.75s/it, loss=0.166, v_num=0, train/loss_simple_step=0.411, train/loss_vlb_step=0.00298, train/loss_step=0.411, global_step=7964.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  37%|███▋      | 450/1208 [13:09<22:09,  1.75s/it, loss=0.174, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00212, train/loss_step=0.359, global_step=7964.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  37%|███▋      | 451/1208 [13:10<22:06,  1.75s/it, loss=0.174, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00212, train/loss_step=0.359, global_step=7964.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  37%|███▋      | 451/1208 [13:10<22:06,  1.75s/it, loss=0.212, v_num=0, train/loss_simple_step=0.822, train/loss_vlb_step=0.139, train/loss_step=0.822, global_step=7964.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  37%|███▋      | 452/1208 [13:13<22:07,  1.76s/it, loss=0.212, v_num=0, train/loss_simple_step=0.822, train/loss_vlb_step=0.139, train/loss_step=0.822, global_step=7964.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  37%|███▋      | 452/1208 [13:13<22:07,  1.76s/it, loss=0.217, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000329, train/loss_step=0.100, global_step=7964.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  38%|███▊      | 453/1208 [13:14<22:04,  1.75s/it, loss=0.217, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000329, train/loss_step=0.100, global_step=7964.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  38%|███▊      | 453/1208 [13:14<22:04,  1.75s/it, loss=0.232, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00285, train/loss_step=0.362, global_step=7965.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  38%|███▊      | 454/1208 [13:15<22:01,  1.75s/it, loss=0.232, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00285, train/loss_step=0.362, global_step=7965.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  38%|███▊      | 454/1208 [13:15<22:01,  1.75s/it, loss=0.235, v_num=0, train/loss_simple_step=0.0967, train/loss_vlb_step=0.000318, train/loss_step=0.0967, global_step=7965.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  38%|███▊      | 455/1208 [13:16<21:58,  1.75s/it, loss=0.235, v_num=0, train/loss_simple_step=0.0967, train/loss_vlb_step=0.000318, train/loss_step=0.0967, global_step=7965.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  38%|███▊      | 455/1208 [13:16<21:58,  1.75s/it, loss=0.228, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.48e-5, train/loss_step=0.0241, global_step=7965.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  38%|███▊      | 456/1208 [13:20<21:59,  1.75s/it, loss=0.228, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.48e-5, train/loss_step=0.0241, global_step=7965.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  38%|███▊      | 456/1208 [13:20<21:59,  1.75s/it, loss=0.227, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.00043, train/loss_step=0.129, global_step=7965.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  38%|███▊      | 457/1208 [13:21<21:56,  1.75s/it, loss=0.227, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.00043, train/loss_step=0.129, global_step=7965.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  38%|███▊      | 457/1208 [13:21<21:56,  1.75s/it, loss=0.227, v_num=0, train/loss_simple_step=0.00724, train/loss_vlb_step=3.52e-5, train/loss_step=0.00724, global_step=7966.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  38%|███▊      | 458/1208 [13:22<21:53,  1.75s/it, loss=0.227, v_num=0, train/loss_simple_step=0.00724, train/loss_vlb_step=3.52e-5, train/loss_step=0.00724, global_step=7966.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  38%|███▊      | 458/1208 [13:22<21:53,  1.75s/it, loss=0.224, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.38e-5, train/loss_step=0.0121, global_step=7966.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  38%|███▊      | 459/1208 [13:23<21:50,  1.75s/it, loss=0.224, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.38e-5, train/loss_step=0.0121, global_step=7966.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  38%|███▊      | 459/1208 [13:23<21:50,  1.75s/it, loss=0.212, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000121, train/loss_step=0.0311, global_step=7966.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  38%|███▊      | 460/1208 [13:26<21:51,  1.75s/it, loss=0.212, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000121, train/loss_step=0.0311, global_step=7966.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  38%|███▊      | 460/1208 [13:26<21:51,  1.75s/it, loss=0.222, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00202, train/loss_step=0.312, global_step=7966.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  38%|███▊      | 461/1208 [13:27<21:48,  1.75s/it, loss=0.222, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00202, train/loss_step=0.312, global_step=7966.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  38%|███▊      | 461/1208 [13:27<21:48,  1.75s/it, loss=0.222, v_num=0, train/loss_simple_step=0.00772, train/loss_vlb_step=3.76e-5, train/loss_step=0.00772, global_step=7967.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  38%|███▊      | 462/1208 [13:28<21:45,  1.75s/it, loss=0.222, v_num=0, train/loss_simple_step=0.00772, train/loss_vlb_step=3.76e-5, train/loss_step=0.00772, global_step=7967.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  38%|███▊      | 462/1208 [13:28<21:45,  1.75s/it, loss=0.206, v_num=0, train/loss_simple_step=0.00358, train/loss_vlb_step=1.96e-5, train/loss_step=0.00358, global_step=7967.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  38%|███▊      | 463/1208 [13:29<21:43,  1.75s/it, loss=0.206, v_num=0, train/loss_simple_step=0.00358, train/loss_vlb_step=1.96e-5, train/loss_step=0.00358, global_step=7967.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  38%|███▊      | 463/1208 [13:29<21:43,  1.75s/it, loss=0.199, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.25e-5, train/loss_step=0.00215, global_step=7967.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  38%|███▊      | 464/1208 [13:32<21:43,  1.75s/it, loss=0.199, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.25e-5, train/loss_step=0.00215, global_step=7967.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  38%|███▊      | 464/1208 [13:32<21:43,  1.75s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.83e-5, train/loss_step=0.0033, global_step=7967.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  38%|███▊      | 465/1208 [13:33<21:40,  1.75s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.83e-5, train/loss_step=0.0033, global_step=7967.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  38%|███▊      | 465/1208 [13:33<21:40,  1.75s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0368, train/loss_vlb_step=0.00013, train/loss_step=0.0368, global_step=7968.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  39%|███▊      | 466/1208 [13:35<21:37,  1.75s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0368, train/loss_vlb_step=0.00013, train/loss_step=0.0368, global_step=7968.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  39%|███▊      | 466/1208 [13:35<21:37,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.422, train/loss_vlb_step=0.00409, train/loss_step=0.422, global_step=7968.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  39%|███▊      | 467/1208 [13:36<21:35,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.422, train/loss_vlb_step=0.00409, train/loss_step=0.422, global_step=7968.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  39%|███▊      | 467/1208 [13:36<21:35,  1.75s/it, loss=0.167, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000504, train/loss_step=0.148, global_step=7968.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  39%|███▊      | 468/1208 [13:39<21:35,  1.75s/it, loss=0.167, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000504, train/loss_step=0.148, global_step=7968.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  39%|███▊      | 468/1208 [13:39<21:35,  1.75s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00573, train/loss_vlb_step=3.02e-5, train/loss_step=0.00573, global_step=7968.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  39%|███▉      | 469/1208 [13:40<21:32,  1.75s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00573, train/loss_vlb_step=3.02e-5, train/loss_step=0.00573, global_step=7968.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  39%|███▉      | 469/1208 [13:40<21:32,  1.75s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.29e-5, train/loss_step=0.0201, global_step=7969.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  39%|███▉      | 470/1208 [13:41<21:29,  1.75s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.29e-5, train/loss_step=0.0201, global_step=7969.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  39%|███▉      | 470/1208 [13:41<21:29,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.64e-5, train/loss_step=0.00278, global_step=7969.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  39%|███▉      | 471/1208 [13:42<21:27,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.64e-5, train/loss_step=0.00278, global_step=7969.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  39%|███▉      | 471/1208 [13:42<21:27,  1.75s/it, loss=0.0878, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000114, train/loss_step=0.0296, global_step=7969.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  39%|███▉      | 472/1208 [13:45<21:27,  1.75s/it, loss=0.0878, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000114, train/loss_step=0.0296, global_step=7969.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  39%|███▉      | 472/1208 [13:45<21:27,  1.75s/it, loss=0.0853, v_num=0, train/loss_simple_step=0.0492, train/loss_vlb_step=0.000169, train/loss_step=0.0492, global_step=7969.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  39%|███▉      | 473/1208 [13:46<21:24,  1.75s/it, loss=0.0853, v_num=0, train/loss_simple_step=0.0492, train/loss_vlb_step=0.000169, train/loss_step=0.0492, global_step=7969.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  39%|███▉      | 473/1208 [13:46<21:24,  1.75s/it, loss=0.0807, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00129, train/loss_step=0.270, global_step=7970.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  39%|███▉      | 474/1208 [13:47<21:22,  1.75s/it, loss=0.0807, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00129, train/loss_step=0.270, global_step=7970.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  39%|███▉      | 474/1208 [13:47<21:22,  1.75s/it, loss=0.0841, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000572, train/loss_step=0.166, global_step=7970.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  39%|███▉      | 475/1208 [13:48<21:19,  1.75s/it, loss=0.0841, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000572, train/loss_step=0.166, global_step=7970.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  39%|███▉      | 475/1208 [13:48<21:19,  1.75s/it, loss=0.104, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00317, train/loss_step=0.430, global_step=7970.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  39%|███▉      | 476/1208 [13:52<21:19,  1.75s/it, loss=0.104, v_num=0, train/loss_simple_step=0.430, train/loss_vlb_step=0.00317, train/loss_step=0.430, global_step=7970.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  39%|███▉      | 476/1208 [13:52<21:19,  1.75s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.00949, train/loss_vlb_step=4.59e-5, train/loss_step=0.00949, global_step=7970.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  39%|███▉      | 477/1208 [13:53<21:16,  1.75s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.00949, train/loss_vlb_step=4.59e-5, train/loss_step=0.00949, global_step=7970.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  39%|███▉      | 477/1208 [13:53<21:16,  1.75s/it, loss=0.0993, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.96e-5, train/loss_step=0.0243, global_step=7971.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  40%|███▉      | 478/1208 [13:54<21:14,  1.75s/it, loss=0.0993, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.96e-5, train/loss_step=0.0243, global_step=7971.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  40%|███▉      | 478/1208 [13:54<21:14,  1.75s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.78e-5, train/loss_step=0.0243, global_step=7971.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  40%|███▉      | 479/1208 [13:55<21:11,  1.74s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.78e-5, train/loss_step=0.0243, global_step=7971.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  40%|███▉      | 479/1208 [13:55<21:11,  1.74s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.16e-5, train/loss_step=0.00194, global_step=7971.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  40%|███▉      | 480/1208 [13:58<21:11,  1.75s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.16e-5, train/loss_step=0.00194, global_step=7971.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  40%|███▉      | 480/1208 [13:58<21:11,  1.75s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000612, train/loss_step=0.176, global_step=7971.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  40%|███▉      | 481/1208 [13:59<21:09,  1.75s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000612, train/loss_step=0.176, global_step=7971.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  40%|███▉      | 481/1208 [13:59<21:09,  1.75s/it, loss=0.106, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.0014, train/loss_step=0.300, global_step=7972.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  40%|███▉      | 482/1208 [14:00<21:06,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.0014, train/loss_step=0.300, global_step=7972.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  40%|███▉      | 482/1208 [14:00<21:06,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000547, train/loss_step=0.158, global_step=7972.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  40%|███▉      | 483/1208 [14:01<21:03,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000547, train/loss_step=0.158, global_step=7972.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  40%|███▉      | 483/1208 [14:01<21:03,  1.74s/it, loss=0.151, v_num=0, train/loss_simple_step=0.742, train/loss_vlb_step=0.0632, train/loss_step=0.742, global_step=7972.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  40%|████      | 484/1208 [14:05<21:04,  1.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.742, train/loss_vlb_step=0.0632, train/loss_step=0.742, global_step=7972.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  40%|████      | 484/1208 [14:05<21:04,  1.75s/it, loss=0.168, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00312, train/loss_step=0.351, global_step=7972.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  40%|████      | 485/1208 [14:06<21:01,  1.74s/it, loss=0.168, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00312, train/loss_step=0.351, global_step=7972.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  40%|████      | 485/1208 [14:06<21:01,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000461, train/loss_step=0.139, global_step=7973.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  40%|████      | 486/1208 [14:07<20:58,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000461, train/loss_step=0.139, global_step=7973.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  40%|████      | 486/1208 [14:07<20:58,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=9.45e-6, train/loss_step=0.00156, global_step=7973.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  40%|████      | 487/1208 [14:08<20:55,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=9.45e-6, train/loss_step=0.00156, global_step=7973.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  40%|████      | 487/1208 [14:08<20:55,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000586, train/loss_step=0.167, global_step=7973.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  40%|████      | 488/1208 [14:11<20:56,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000586, train/loss_step=0.167, global_step=7973.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  40%|████      | 488/1208 [14:11<20:56,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00412, train/loss_vlb_step=2.15e-5, train/loss_step=0.00412, global_step=7973.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  40%|████      | 489/1208 [14:12<20:53,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00412, train/loss_vlb_step=2.15e-5, train/loss_step=0.00412, global_step=7973.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  40%|████      | 489/1208 [14:12<20:53,  1.74s/it, loss=0.171, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00205, train/loss_step=0.380, global_step=7974.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  41%|████      | 490/1208 [14:13<20:50,  1.74s/it, loss=0.171, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00205, train/loss_step=0.380, global_step=7974.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  41%|████      | 490/1208 [14:13<20:50,  1.74s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0315, train/loss_vlb_step=0.00012, train/loss_step=0.0315, global_step=7974.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  41%|████      | 491/1208 [14:14<20:48,  1.74s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0315, train/loss_vlb_step=0.00012, train/loss_step=0.0315, global_step=7974.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  41%|████      | 491/1208 [14:14<20:48,  1.74s/it, loss=0.191, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.0028, train/loss_step=0.383, global_step=7974.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  41%|████      | 492/1208 [14:17<20:48,  1.74s/it, loss=0.191, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.0028, train/loss_step=0.383, global_step=7974.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  41%|████      | 492/1208 [14:17<20:48,  1.74s/it, loss=0.194, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000363, train/loss_step=0.111, global_step=7974.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  41%|████      | 493/1208 [14:18<20:45,  1.74s/it, loss=0.194, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000363, train/loss_step=0.111, global_step=7974.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  41%|████      | 493/1208 [14:18<20:45,  1.74s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0744, train/loss_vlb_step=0.00025, train/loss_step=0.0744, global_step=7975.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  41%|████      | 494/1208 [14:20<20:43,  1.74s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0744, train/loss_vlb_step=0.00025, train/loss_step=0.0744, global_step=7975.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  41%|████      | 494/1208 [14:20<20:43,  1.74s/it, loss=0.193, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00273, train/loss_step=0.351, global_step=7975.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  41%|████      | 495/1208 [14:21<20:40,  1.74s/it, loss=0.193, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00273, train/loss_step=0.351, global_step=7975.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  41%|████      | 495/1208 [14:21<20:40,  1.74s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00616, train/loss_vlb_step=3.11e-5, train/loss_step=0.00616, global_step=7975.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  41%|████      | 496/1208 [14:24<20:40,  1.74s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00616, train/loss_vlb_step=3.11e-5, train/loss_step=0.00616, global_step=7975.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  41%|████      | 496/1208 [14:24<20:40,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0617, train/loss_vlb_step=0.000212, train/loss_step=0.0617, global_step=7975.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  41%|████      | 497/1208 [14:25<20:38,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0617, train/loss_vlb_step=0.000212, train/loss_step=0.0617, global_step=7975.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  41%|████      | 497/1208 [14:25<20:38,  1.74s/it, loss=0.199, v_num=0, train/loss_simple_step=0.520, train/loss_vlb_step=0.0065, train/loss_step=0.520, global_step=7976.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  41%|████      | 498/1208 [14:26<20:35,  1.74s/it, loss=0.199, v_num=0, train/loss_simple_step=0.520, train/loss_vlb_step=0.0065, train/loss_step=0.520, global_step=7976.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  41%|████      | 498/1208 [14:26<20:35,  1.74s/it, loss=0.207, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000625, train/loss_step=0.170, global_step=7976.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  41%|████▏     | 499/1208 [14:27<20:32,  1.74s/it, loss=0.207, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000625, train/loss_step=0.170, global_step=7976.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  41%|████▏     | 499/1208 [14:27<20:32,  1.74s/it, loss=0.23, v_num=0, train/loss_simple_step=0.468, train/loss_vlb_step=0.00518, train/loss_step=0.468, global_step=7976.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  41%|████▏     | 500/1208 [14:30<20:32,  1.74s/it, loss=0.23, v_num=0, train/loss_simple_step=0.468, train/loss_vlb_step=0.00518, train/loss_step=0.468, global_step=7976.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  41%|████▏     | 500/1208 [14:30<20:32,  1.74s/it, loss=0.237, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00168, train/loss_step=0.316, global_step=7976.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  41%|████▏     | 501/1208 [14:31<20:30,  1.74s/it, loss=0.237, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00168, train/loss_step=0.316, global_step=7976.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  41%|████▏     | 501/1208 [14:31<20:30,  1.74s/it, loss=0.242, v_num=0, train/loss_simple_step=0.410, train/loss_vlb_step=0.00253, train/loss_step=0.410, global_step=7977.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  42%|████▏     | 502/1208 [14:32<20:27,  1.74s/it, loss=0.242, v_num=0, train/loss_simple_step=0.410, train/loss_vlb_step=0.00253, train/loss_step=0.410, global_step=7977.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  42%|████▏     | 502/1208 [14:32<20:27,  1.74s/it, loss=0.252, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00178, train/loss_step=0.344, global_step=7977.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  42%|████▏     | 503/1208 [14:33<20:24,  1.74s/it, loss=0.252, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00178, train/loss_step=0.344, global_step=7977.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  42%|████▏     | 503/1208 [14:33<20:24,  1.74s/it, loss=0.215, v_num=0, train/loss_simple_step=0.00717, train/loss_vlb_step=3.42e-5, train/loss_step=0.00717, global_step=7977.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  42%|████▏     | 504/1208 [14:37<20:25,  1.74s/it, loss=0.215, v_num=0, train/loss_simple_step=0.00717, train/loss_vlb_step=3.42e-5, train/loss_step=0.00717, global_step=7977.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  42%|████▏     | 504/1208 [14:37<20:25,  1.74s/it, loss=0.221, v_num=0, train/loss_simple_step=0.472, train/loss_vlb_step=0.00339, train/loss_step=0.472, global_step=7977.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  42%|████▏     | 505/1208 [14:38<20:22,  1.74s/it, loss=0.221, v_num=0, train/loss_simple_step=0.472, train/loss_vlb_step=0.00339, train/loss_step=0.472, global_step=7977.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  42%|████▏     | 505/1208 [14:38<20:22,  1.74s/it, loss=0.218, v_num=0, train/loss_simple_step=0.0825, train/loss_vlb_step=0.000274, train/loss_step=0.0825, global_step=7978.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  42%|████▏     | 506/1208 [14:39<20:19,  1.74s/it, loss=0.218, v_num=0, train/loss_simple_step=0.0825, train/loss_vlb_step=0.000274, train/loss_step=0.0825, global_step=7978.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  42%|████▏     | 506/1208 [14:39<20:19,  1.74s/it, loss=0.221, v_num=0, train/loss_simple_step=0.0627, train/loss_vlb_step=0.000218, train/loss_step=0.0627, global_step=7978.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  42%|████▏     | 507/1208 [14:40<20:17,  1.74s/it, loss=0.221, v_num=0, train/loss_simple_step=0.0627, train/loss_vlb_step=0.000218, train/loss_step=0.0627, global_step=7978.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  42%|████▏     | 507/1208 [14:40<20:17,  1.74s/it, loss=0.213, v_num=0, train/loss_simple_step=0.00908, train/loss_vlb_step=4.54e-5, train/loss_step=0.00908, global_step=7978.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  42%|████▏     | 508/1208 [14:43<20:17,  1.74s/it, loss=0.213, v_num=0, train/loss_simple_step=0.00908, train/loss_vlb_step=4.54e-5, train/loss_step=0.00908, global_step=7978.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  42%|████▏     | 508/1208 [14:43<20:17,  1.74s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0823, train/loss_vlb_step=0.00028, train/loss_step=0.0823, global_step=7978.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  42%|████▏     | 509/1208 [14:44<20:14,  1.74s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0823, train/loss_vlb_step=0.00028, train/loss_step=0.0823, global_step=7978.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  42%|████▏     | 509/1208 [14:44<20:14,  1.74s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0883, train/loss_vlb_step=0.000291, train/loss_step=0.0883, global_step=7979.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  42%|████▏     | 510/1208 [14:45<20:12,  1.74s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0883, train/loss_vlb_step=0.000291, train/loss_step=0.0883, global_step=7979.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  42%|████▏     | 510/1208 [14:45<20:12,  1.74s/it, loss=0.217, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.0013, train/loss_step=0.326, global_step=7979.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  42%|████▏     | 511/1208 [14:46<20:09,  1.74s/it, loss=0.217, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.0013, train/loss_step=0.326, global_step=7979.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  42%|████▏     | 511/1208 [14:46<20:09,  1.74s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0087, train/loss_vlb_step=4.14e-5, train/loss_step=0.0087, global_step=7979.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  42%|████▏     | 512/1208 [14:49<20:09,  1.74s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0087, train/loss_vlb_step=4.14e-5, train/loss_step=0.0087, global_step=7979.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  42%|████▏     | 512/1208 [14:49<20:09,  1.74s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00491, train/loss_vlb_step=2.54e-5, train/loss_step=0.00491, global_step=7979.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  42%|████▏     | 513/1208 [14:50<20:07,  1.74s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00491, train/loss_vlb_step=2.54e-5, train/loss_step=0.00491, global_step=7979.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  42%|████▏     | 513/1208 [14:50<20:07,  1.74s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0569, train/loss_vlb_step=0.000197, train/loss_step=0.0569, global_step=7980.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  43%|████▎     | 514/1208 [14:52<20:04,  1.74s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0569, train/loss_vlb_step=0.000197, train/loss_step=0.0569, global_step=7980.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  43%|████▎     | 514/1208 [14:52<20:04,  1.74s/it, loss=0.185, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000777, train/loss_step=0.206, global_step=7980.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  43%|████▎     | 515/1208 [14:53<20:01,  1.73s/it, loss=0.185, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000777, train/loss_step=0.206, global_step=7980.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  43%|████▎     | 515/1208 [14:53<20:01,  1.73s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.5e-5, train/loss_step=0.0125, global_step=7980.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  43%|████▎     | 516/1208 [14:56<20:02,  1.74s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.5e-5, train/loss_step=0.0125, global_step=7980.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  43%|████▎     | 516/1208 [14:56<20:02,  1.74s/it, loss=0.201, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.0023, train/loss_step=0.364, global_step=7980.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  43%|████▎     | 517/1208 [14:57<19:59,  1.74s/it, loss=0.201, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.0023, train/loss_step=0.364, global_step=7980.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  43%|████▎     | 517/1208 [14:57<19:59,  1.74s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000113, train/loss_step=0.0295, global_step=7981.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  43%|████▎     | 518/1208 [14:58<19:56,  1.73s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000113, train/loss_step=0.0295, global_step=7981.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  43%|████▎     | 518/1208 [14:58<19:56,  1.73s/it, loss=0.193, v_num=0, train/loss_simple_step=0.509, train/loss_vlb_step=0.0114, train/loss_step=0.509, global_step=7981.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  43%|████▎     | 519/1208 [14:59<19:54,  1.73s/it, loss=0.193, v_num=0, train/loss_simple_step=0.509, train/loss_vlb_step=0.0114, train/loss_step=0.509, global_step=7981.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  43%|████▎     | 519/1208 [14:59<19:54,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.56e-5, train/loss_step=0.015, global_step=7981.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  43%|████▎     | 520/1208 [15:02<19:54,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.56e-5, train/loss_step=0.015, global_step=7981.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  43%|████▎     | 520/1208 [15:02<19:54,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=2.85e-5, train/loss_step=0.00619, global_step=7981.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  43%|████▎     | 521/1208 [15:03<19:51,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=2.85e-5, train/loss_step=0.00619, global_step=7981.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  43%|████▎     | 521/1208 [15:03<19:51,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00799, train/loss_vlb_step=3.83e-5, train/loss_step=0.00799, global_step=7982.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  43%|████▎     | 522/1208 [15:04<19:49,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00799, train/loss_vlb_step=3.83e-5, train/loss_step=0.00799, global_step=7982.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  43%|████▎     | 522/1208 [15:04<19:49,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000161, train/loss_step=0.0448, global_step=7982.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  43%|████▎     | 523/1208 [15:05<19:46,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000161, train/loss_step=0.0448, global_step=7982.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  43%|████▎     | 523/1208 [15:05<19:46,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.26e-5, train/loss_step=0.00213, global_step=7982.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  43%|████▎     | 524/1208 [15:09<19:46,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.26e-5, train/loss_step=0.00213, global_step=7982.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  43%|████▎     | 524/1208 [15:09<19:46,  1.74s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.26e-5, train/loss_step=0.0235, global_step=7982.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  43%|████▎     | 525/1208 [15:10<19:44,  1.73s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.26e-5, train/loss_step=0.0235, global_step=7982.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  43%|████▎     | 525/1208 [15:10<19:44,  1.73s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.0693, train/loss_vlb_step=0.000233, train/loss_step=0.0693, global_step=7983.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  44%|████▎     | 526/1208 [15:11<19:41,  1.73s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.0693, train/loss_vlb_step=0.000233, train/loss_step=0.0693, global_step=7983.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  44%|████▎     | 526/1208 [15:11<19:41,  1.73s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.0619, train/loss_vlb_step=0.000212, train/loss_step=0.0619, global_step=7983.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  44%|████▎     | 527/1208 [15:12<19:38,  1.73s/it, loss=0.0964, v_num=0, train/loss_simple_step=0.0619, train/loss_vlb_step=0.000212, train/loss_step=0.0619, global_step=7983.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  44%|████▎     | 527/1208 [15:12<19:38,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.619, train/loss_vlb_step=0.0165, train/loss_step=0.619, global_step=7983.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]     Epoch 26:  44%|████▎     | 528/1208 [15:15<19:39,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.619, train/loss_vlb_step=0.0165, train/loss_step=0.619, global_step=7983.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  44%|████▎     | 528/1208 [15:15<19:39,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.59e-5, train/loss_step=0.0028, global_step=7983.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  44%|████▍     | 529/1208 [15:16<19:36,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.59e-5, train/loss_step=0.0028, global_step=7983.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  44%|████▍     | 529/1208 [15:16<19:36,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000734, train/loss_step=0.195, global_step=7984.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  44%|████▍     | 530/1208 [15:17<19:34,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000734, train/loss_step=0.195, global_step=7984.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  44%|████▍     | 530/1208 [15:17<19:34,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.23e-5, train/loss_step=0.0243, global_step=7984.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  44%|████▍     | 531/1208 [15:18<19:31,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.23e-5, train/loss_step=0.0243, global_step=7984.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  44%|████▍     | 531/1208 [15:18<19:31,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.881, train/loss_vlb_step=0.443, train/loss_step=0.881, global_step=7984.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  44%|████▍     | 532/1208 [15:22<19:31,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.881, train/loss_vlb_step=0.443, train/loss_step=0.881, global_step=7984.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  44%|████▍     | 532/1208 [15:22<19:31,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.484, train/loss_vlb_step=0.00617, train/loss_step=0.484, global_step=7984.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  44%|████▍     | 533/1208 [15:23<19:29,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.484, train/loss_vlb_step=0.00617, train/loss_step=0.484, global_step=7984.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  44%|████▍     | 533/1208 [15:23<19:29,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.00037, train/loss_step=0.112, global_step=7985.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  44%|████▍     | 534/1208 [15:24<19:26,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.00037, train/loss_step=0.112, global_step=7985.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  44%|████▍     | 534/1208 [15:24<19:26,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.00038, train/loss_step=0.116, global_step=7985.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  44%|████▍     | 535/1208 [15:25<19:23,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.00038, train/loss_step=0.116, global_step=7985.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  44%|████▍     | 535/1208 [15:25<19:23,  1.73s/it, loss=0.187, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000568, train/loss_step=0.164, global_step=7985.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  44%|████▍     | 536/1208 [15:28<19:24,  1.73s/it, loss=0.187, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000568, train/loss_step=0.164, global_step=7985.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  44%|████▍     | 536/1208 [15:28<19:24,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.562, train/loss_vlb_step=0.0051, train/loss_step=0.562, global_step=7985.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  44%|████▍     | 537/1208 [15:29<19:21,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.562, train/loss_vlb_step=0.0051, train/loss_step=0.562, global_step=7985.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  44%|████▍     | 537/1208 [15:29<19:21,  1.73s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00425, train/loss_vlb_step=2.33e-5, train/loss_step=0.00425, global_step=7986.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  45%|████▍     | 538/1208 [15:30<19:18,  1.73s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00425, train/loss_vlb_step=2.33e-5, train/loss_step=0.00425, global_step=7986.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  45%|████▍     | 538/1208 [15:30<19:18,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00609, train/loss_vlb_step=2.97e-5, train/loss_step=0.00609, global_step=7986.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  45%|████▍     | 539/1208 [15:31<19:16,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00609, train/loss_vlb_step=2.97e-5, train/loss_step=0.00609, global_step=7986.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  45%|████▍     | 539/1208 [15:31<19:16,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0653, train/loss_vlb_step=0.000223, train/loss_step=0.0653, global_step=7986.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  45%|████▍     | 540/1208 [15:34<19:16,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0653, train/loss_vlb_step=0.000223, train/loss_step=0.0653, global_step=7986.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  45%|████▍     | 540/1208 [15:34<19:16,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=9.33e-6, train/loss_step=0.00156, global_step=7986.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  45%|████▍     | 541/1208 [15:35<19:13,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=9.33e-6, train/loss_step=0.00156, global_step=7986.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  45%|████▍     | 541/1208 [15:35<19:13,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000986, train/loss_step=0.238, global_step=7987.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  45%|████▍     | 542/1208 [15:37<19:11,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000986, train/loss_step=0.238, global_step=7987.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  45%|████▍     | 542/1208 [15:37<19:11,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.61e-5, train/loss_step=0.024, global_step=7987.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  45%|████▍     | 543/1208 [15:38<19:08,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.61e-5, train/loss_step=0.024, global_step=7987.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  45%|████▍     | 543/1208 [15:38<19:08,  1.73s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.000162, train/loss_step=0.0462, global_step=7987.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  45%|████▌     | 544/1208 [15:41<19:08,  1.73s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.000162, train/loss_step=0.0462, global_step=7987.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  45%|████▌     | 544/1208 [15:41<19:08,  1.73s/it, loss=0.204, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00237, train/loss_step=0.399, global_step=7987.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  45%|████▌     | 545/1208 [15:42<19:06,  1.73s/it, loss=0.204, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00237, train/loss_step=0.399, global_step=7987.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  45%|████▌     | 545/1208 [15:42<19:06,  1.73s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0461, train/loss_vlb_step=0.000165, train/loss_step=0.0461, global_step=7988.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  45%|████▌     | 546/1208 [15:43<19:03,  1.73s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0461, train/loss_vlb_step=0.000165, train/loss_step=0.0461, global_step=7988.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  45%|████▌     | 546/1208 [15:43<19:03,  1.73s/it, loss=0.205, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000376, train/loss_step=0.114, global_step=7988.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  45%|████▌     | 547/1208 [15:44<19:01,  1.73s/it, loss=0.205, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000376, train/loss_step=0.114, global_step=7988.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  45%|████▌     | 547/1208 [15:44<19:01,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000562, train/loss_step=0.163, global_step=7988.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  45%|████▌     | 548/1208 [15:47<19:01,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000562, train/loss_step=0.163, global_step=7988.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  45%|████▌     | 548/1208 [15:47<19:01,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.47e-5, train/loss_step=0.00249, global_step=7988.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  45%|████▌     | 549/1208 [15:48<18:58,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.47e-5, train/loss_step=0.00249, global_step=7988.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  45%|████▌     | 549/1208 [15:48<18:58,  1.73s/it, loss=0.185, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.00089, train/loss_step=0.241, global_step=7989.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  46%|████▌     | 550/1208 [15:49<18:56,  1.73s/it, loss=0.185, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.00089, train/loss_step=0.241, global_step=7989.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  46%|████▌     | 550/1208 [15:49<18:56,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0086, train/loss_vlb_step=3.84e-5, train/loss_step=0.0086, global_step=7989.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  46%|████▌     | 551/1208 [15:50<18:53,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0086, train/loss_vlb_step=3.84e-5, train/loss_step=0.0086, global_step=7989.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  46%|████▌     | 551/1208 [15:50<18:53,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00649, train/loss_vlb_step=3.12e-5, train/loss_step=0.00649, global_step=7989.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  46%|████▌     | 552/1208 [15:54<18:53,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00649, train/loss_vlb_step=3.12e-5, train/loss_step=0.00649, global_step=7989.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  46%|████▌     | 552/1208 [15:54<18:53,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.486, train/loss_vlb_step=0.00498, train/loss_step=0.486, global_step=7989.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  46%|████▌     | 553/1208 [15:55<18:51,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.486, train/loss_vlb_step=0.00498, train/loss_step=0.486, global_step=7989.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  46%|████▌     | 553/1208 [15:55<18:51,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000163, train/loss_step=0.0443, global_step=7990.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  46%|████▌     | 554/1208 [15:56<18:49,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000163, train/loss_step=0.0443, global_step=7990.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  46%|████▌     | 554/1208 [15:56<18:49,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0781, train/loss_vlb_step=0.000262, train/loss_step=0.0781, global_step=7990.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  46%|████▌     | 555/1208 [15:57<18:46,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0781, train/loss_vlb_step=0.000262, train/loss_step=0.0781, global_step=7990.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  46%|████▌     | 555/1208 [15:57<18:46,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0967, train/loss_vlb_step=0.000319, train/loss_step=0.0967, global_step=7990.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  46%|████▌     | 556/1208 [16:00<18:46,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0967, train/loss_vlb_step=0.000319, train/loss_step=0.0967, global_step=7990.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  46%|████▌     | 556/1208 [16:00<18:46,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000525, train/loss_step=0.156, global_step=7990.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  46%|████▌     | 557/1208 [16:01<18:43,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000525, train/loss_step=0.156, global_step=7990.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  46%|████▌     | 557/1208 [16:01<18:43,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000462, train/loss_step=0.141, global_step=7991.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  46%|████▌     | 558/1208 [16:02<18:41,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000462, train/loss_step=0.141, global_step=7991.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  46%|████▌     | 558/1208 [16:02<18:41,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00112, train/loss_step=0.262, global_step=7991.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  46%|████▋     | 559/1208 [16:03<18:38,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00112, train/loss_step=0.262, global_step=7991.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  46%|████▋     | 559/1208 [16:03<18:38,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00115, train/loss_step=0.271, global_step=7991.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  46%|████▋     | 560/1208 [16:07<18:38,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00115, train/loss_step=0.271, global_step=7991.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  46%|████▋     | 560/1208 [16:07<18:38,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000704, train/loss_step=0.194, global_step=7991.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  46%|████▋     | 561/1208 [16:08<18:36,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000704, train/loss_step=0.194, global_step=7991.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  46%|████▋     | 561/1208 [16:08<18:36,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00194, train/loss_step=0.343, global_step=7992.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  47%|████▋     | 562/1208 [16:09<18:34,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00194, train/loss_step=0.343, global_step=7992.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  47%|████▋     | 562/1208 [16:09<18:34,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.672, train/loss_vlb_step=0.0251, train/loss_step=0.672, global_step=7992.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  47%|████▋     | 563/1208 [16:10<18:31,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.672, train/loss_vlb_step=0.0251, train/loss_step=0.672, global_step=7992.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  47%|████▋     | 563/1208 [16:10<18:31,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0599, train/loss_vlb_step=0.000199, train/loss_step=0.0599, global_step=7992.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  47%|████▋     | 564/1208 [16:13<18:31,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0599, train/loss_vlb_step=0.000199, train/loss_step=0.0599, global_step=7992.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  47%|████▋     | 564/1208 [16:13<18:31,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00339, train/loss_vlb_step=1.9e-5, train/loss_step=0.00339, global_step=7992.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  47%|████▋     | 565/1208 [16:14<18:29,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00339, train/loss_vlb_step=1.9e-5, train/loss_step=0.00339, global_step=7992.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  47%|████▋     | 565/1208 [16:14<18:29,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00167, train/loss_step=0.334, global_step=7993.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  47%|████▋     | 566/1208 [16:15<18:26,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00167, train/loss_step=0.334, global_step=7993.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  47%|████▋     | 566/1208 [16:15<18:26,  1.72s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.00012, train/loss_step=0.0319, global_step=7993.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  47%|████▋     | 567/1208 [16:16<18:24,  1.72s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.00012, train/loss_step=0.0319, global_step=7993.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  47%|████▋     | 567/1208 [16:16<18:24,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00634, train/loss_vlb_step=3.13e-5, train/loss_step=0.00634, global_step=7993.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  47%|████▋     | 568/1208 [16:19<18:23,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00634, train/loss_vlb_step=3.13e-5, train/loss_step=0.00634, global_step=7993.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  47%|████▋     | 568/1208 [16:19<18:23,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000102, train/loss_step=0.0269, global_step=7993.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  47%|████▋     | 569/1208 [16:20<18:21,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000102, train/loss_step=0.0269, global_step=7993.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  47%|████▋     | 569/1208 [16:20<18:21,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00674, train/loss_vlb_step=3.38e-5, train/loss_step=0.00674, global_step=7994.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  47%|████▋     | 570/1208 [16:21<18:18,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00674, train/loss_vlb_step=3.38e-5, train/loss_step=0.00674, global_step=7994.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  47%|████▋     | 570/1208 [16:21<18:18,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=7994.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  47%|████▋     | 571/1208 [16:22<18:16,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=7994.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  47%|████▋     | 571/1208 [16:22<18:16,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0722, train/loss_vlb_step=0.000243, train/loss_step=0.0722, global_step=7994.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  47%|████▋     | 572/1208 [16:25<18:15,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0722, train/loss_vlb_step=0.000243, train/loss_step=0.0722, global_step=7994.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  47%|████▋     | 572/1208 [16:25<18:15,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00665, train/loss_vlb_step=3.24e-5, train/loss_step=0.00665, global_step=7994.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  47%|████▋     | 573/1208 [16:26<18:13,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00665, train/loss_vlb_step=3.24e-5, train/loss_step=0.00665, global_step=7994.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  47%|████▋     | 573/1208 [16:26<18:13,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.507, train/loss_vlb_step=0.0102, train/loss_step=0.507, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]       Epoch 26:  48%|████▊     | 574/1208 [16:27<18:10,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.507, train/loss_vlb_step=0.0102, train/loss_step=0.507, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  48%|████▊     | 574/1208 [16:27<18:10,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00328, train/loss_vlb_step=1.74e-5, train/loss_step=0.00328, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  48%|████▊     | 575/1208 [16:28<18:08,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00328, train/loss_vlb_step=1.74e-5, train/loss_step=0.00328, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  48%|████▊     | 575/1208 [16:28<18:08,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.00082, train/loss_step=0.214, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  48%|████▊     | 576/1208 [16:31<18:08,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.00082, train/loss_step=0.214, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  48%|████▊     | 576/1208 [16:31<18:08,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.481, train/loss_vlb_step=0.0046, train/loss_step=0.481, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  48%|████▊     | 577/1208 [16:32<18:05,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.481, train/loss_vlb_step=0.0046, train/loss_step=0.481, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  48%|████▊     | 577/1208 [16:32<18:05,  1.72s/it, loss=0.194, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00112, train/loss_step=0.265, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  48%|████▊     | 578/1208 [16:33<18:03,  1.72s/it, loss=0.194, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00112, train/loss_step=0.265, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  48%|████▊     | 578/1208 [16:33<18:03,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00898, train/loss_vlb_step=4.17e-5, train/loss_step=0.00898, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  48%|████▊     | 579/1208 [16:34<18:00,  1.72s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00898, train/loss_vlb_step=4.17e-5, train/loss_step=0.00898, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  48%|████▊     | 579/1208 [16:34<18:00,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  48%|████▊     | 580/1208 [16:37<18:00,  1.72s/it, loss=0.173, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  48%|████▊     | 580/1208 [16:37<18:00,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=1.02e-5, train/loss_step=0.00171, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  48%|████▊     | 581/1208 [16:38<17:57,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=1.02e-5, train/loss_step=0.00171, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  48%|████▊     | 581/1208 [16:38<17:57,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0781, train/loss_vlb_step=0.000261, train/loss_step=0.0781, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  48%|████▊     | 582/1208 [16:39<17:55,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0781, train/loss_vlb_step=0.000261, train/loss_step=0.0781, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  48%|████▊     | 582/1208 [16:39<17:55,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00149, train/loss_step=0.288, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  48%|████▊     | 583/1208 [16:40<17:52,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00149, train/loss_step=0.288, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  48%|████▊     | 583/1208 [16:40<17:52,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000482, train/loss_step=0.142, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  48%|████▊     | 584/1208 [16:43<17:52,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000482, train/loss_step=0.142, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  48%|████▊     | 584/1208 [16:43<17:52,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00354, train/loss_step=0.418, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  48%|████▊     | 585/1208 [16:44<17:49,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00354, train/loss_step=0.418, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  48%|████▊     | 585/1208 [16:44<17:49,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=3.84e-5, train/loss_step=0.00783, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  49%|████▊     | 586/1208 [16:45<17:47,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=3.84e-5, train/loss_step=0.00783, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  49%|████▊     | 586/1208 [16:45<17:47,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  49%|████▊     | 587/1208 [16:46<17:44,  1.71s/it, loss=0.143, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  49%|████▊     | 587/1208 [16:46<17:44,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000461, train/loss_step=0.139, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  49%|████▊     | 588/1208 [16:49<17:44,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000461, train/loss_step=0.139, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  49%|████▊     | 588/1208 [16:49<17:44,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000545, train/loss_step=0.161, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  49%|████▉     | 589/1208 [16:50<17:41,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000545, train/loss_step=0.161, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  49%|████▉     | 589/1208 [16:50<17:41,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=1.27e-5, train/loss_step=0.00217, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  49%|████▉     | 590/1208 [16:51<17:39,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=1.27e-5, train/loss_step=0.00217, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  49%|████▉     | 590/1208 [16:51<17:39,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.53e-5, train/loss_step=0.0102, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  49%|████▉     | 591/1208 [16:52<17:37,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.53e-5, train/loss_step=0.0102, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  49%|████▉     | 591/1208 [16:52<17:37,  1.71s/it, loss=0.16, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.001, train/loss_step=0.257, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]     Epoch 26:  49%|████▉     | 592/1208 [16:55<17:36,  1.72s/it, loss=0.16, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.001, train/loss_step=0.257, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  49%|████▉     | 592/1208 [16:55<17:36,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000903, train/loss_step=0.215, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  49%|████▉     | 593/1208 [16:56<17:34,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000903, train/loss_step=0.215, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  49%|████▉     | 593/1208 [16:56<17:34,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000464, train/loss_step=0.138, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  49%|████▉     | 594/1208 [16:57<17:31,  1.71s/it, loss=0.152, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000464, train/loss_step=0.138, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  49%|████▉     | 594/1208 [16:57<17:31,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.07e-5, train/loss_step=0.0151, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  49%|████▉     | 595/1208 [16:58<17:29,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.07e-5, train/loss_step=0.0151, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  49%|████▉     | 595/1208 [16:58<17:29,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00103, train/loss_step=0.243, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  49%|████▉     | 596/1208 [17:01<17:28,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00103, train/loss_step=0.243, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  49%|████▉     | 596/1208 [17:01<17:28,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.21e-5, train/loss_step=0.00207, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  49%|████▉     | 597/1208 [17:02<17:26,  1.71s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.21e-5, train/loss_step=0.00207, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  49%|████▉     | 597/1208 [17:02<17:26,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.17e-5, train/loss_step=0.00204, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  50%|████▉     | 598/1208 [17:03<17:24,  1.71s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.17e-5, train/loss_step=0.00204, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  50%|████▉     | 598/1208 [17:03<17:24,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.00034, train/loss_step=0.103, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  50%|████▉     | 599/1208 [17:04<17:21,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.00034, train/loss_step=0.103, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  50%|████▉     | 599/1208 [17:04<17:21,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0838, train/loss_vlb_step=0.000285, train/loss_step=0.0838, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  50%|████▉     | 600/1208 [17:07<17:21,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0838, train/loss_vlb_step=0.000285, train/loss_step=0.0838, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  50%|████▉     | 600/1208 [17:07<17:21,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00111, train/loss_step=0.260, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.84it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.84it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.71it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.82it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.84it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.83it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.74it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.82it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.83it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.84it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.83it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.82it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.81it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.82it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.82it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:22,  1.83it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.82it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:21,  1.83it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.82it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.83it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.82it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.83it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.83it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.84it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.82it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.84it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.82it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.83it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.82it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:17,  1.84it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.81it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.84it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.82it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:09<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.83it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:16,  1.82it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.81it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.84it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:10<00:16,  1.83it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.83it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:15,  1.82it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.84it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.82it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.81it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.83it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.82it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:14,  1.81it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.83it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.82it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.81it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.84it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.83it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.82it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.83it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.83it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.82it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.83it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.83it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:14<00:12,  1.82it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.83it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.83it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.82it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.83it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:15<00:11,  1.82it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.82it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.84it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:10,  1.82it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.82it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:16<00:10,  1.83it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.82it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.83it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.83it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.81it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.83it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.83it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.82it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.83it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.83it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.83it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.83it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.81it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.83it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.83it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:19<00:07,  1.81it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.83it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.83it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.82it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.83it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.84it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:20<00:06,  1.82it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.83it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.82it/s]DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.84it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.78it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:21<00:05,  1.84it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.82it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.84it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.78it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.83it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:04,  1.83it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:22<00:04,  1.83it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.78it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.83it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.82it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.83it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.78it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.83it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:23<00:03,  1.82it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.83it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.78it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.82it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.83it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.78it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:24<00:02,  1.82it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.83it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.83it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.78it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.81it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.83it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.83it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.78it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:25<00:01,  1.81it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.84it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.83it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.82it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.84it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:26<00:00,  1.83it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.83it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.84it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.83it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.82it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.81it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]Epoch 26:  50%|████▉     | 601/1208 [17:37<17:47,  1.76s/it, loss=0.134, v_num=0, train/loss_simple_step=0.260, train/loss_vlb_step=0.00111, train/loss_step=0.260, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  50%|████▉     | 601/1208 [17:37<17:47,  1.76s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0532, train/loss_vlb_step=0.000184, train/loss_step=0.0532, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  50%|████▉     | 602/1208 [17:38<17:45,  1.76s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0532, train/loss_vlb_step=0.000184, train/loss_step=0.0532, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  50%|████▉     | 602/1208 [17:38<17:45,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000111, train/loss_step=0.0286, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  50%|████▉     | 603/1208 [17:39<17:42,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000111, train/loss_step=0.0286, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  50%|████▉     | 603/1208 [17:39<17:42,  1.76s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0701, train/loss_vlb_step=0.000233, train/loss_step=0.0701, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  50%|█████     | 604/1208 [17:42<17:42,  1.76s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0701, train/loss_vlb_step=0.000233, train/loss_step=0.0701, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  50%|█████     | 604/1208 [17:42<17:42,  1.76s/it, loss=0.101, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000369, train/loss_step=0.111, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  50%|█████     | 605/1208 [17:43<17:39,  1.76s/it, loss=0.101, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000369, train/loss_step=0.111, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  50%|█████     | 605/1208 [17:43<17:39,  1.76s/it, loss=0.128, v_num=0, train/loss_simple_step=0.564, train/loss_vlb_step=0.00948, train/loss_step=0.564, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  50%|█████     | 606/1208 [17:44<17:37,  1.76s/it, loss=0.128, v_num=0, train/loss_simple_step=0.564, train/loss_vlb_step=0.00948, train/loss_step=0.564, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  50%|█████     | 606/1208 [17:44<17:37,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.000102, train/loss_step=0.0248, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  50%|█████     | 607/1208 [17:45<17:34,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.000102, train/loss_step=0.0248, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  50%|█████     | 607/1208 [17:45<17:34,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00101, train/loss_step=0.268, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  50%|█████     | 608/1208 [17:48<17:34,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00101, train/loss_step=0.268, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  50%|█████     | 608/1208 [17:48<17:34,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.53e-5, train/loss_step=0.0245, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  50%|█████     | 609/1208 [17:49<17:31,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.53e-5, train/loss_step=0.0245, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  50%|█████     | 609/1208 [17:49<17:31,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00889, train/loss_vlb_step=4.16e-5, train/loss_step=0.00889, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  50%|█████     | 610/1208 [17:50<17:29,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00889, train/loss_vlb_step=4.16e-5, train/loss_step=0.00889, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  50%|█████     | 610/1208 [17:50<17:29,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.87e-5, train/loss_step=0.0175, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  51%|█████     | 611/1208 [17:51<17:26,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.87e-5, train/loss_step=0.0175, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  51%|█████     | 611/1208 [17:51<17:26,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=1.02e-5, train/loss_step=0.0017, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  51%|█████     | 612/1208 [17:54<17:25,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=1.02e-5, train/loss_step=0.0017, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  51%|█████     | 612/1208 [17:54<17:25,  1.75s/it, loss=0.102, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.12e-5, train/loss_step=0.011, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  51%|█████     | 613/1208 [17:55<17:23,  1.75s/it, loss=0.102, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.12e-5, train/loss_step=0.011, global_step=8e+3, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  51%|█████     | 613/1208 [17:55<17:23,  1.75s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.34e-5, train/loss_step=0.0146, global_step=8005.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  51%|█████     | 614/1208 [17:56<17:21,  1.75s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.34e-5, train/loss_step=0.0146, global_step=8005.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  51%|█████     | 614/1208 [17:56<17:21,  1.75s/it, loss=0.105, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000804, train/loss_step=0.203, global_step=8005.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  51%|█████     | 615/1208 [17:57<17:18,  1.75s/it, loss=0.105, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000804, train/loss_step=0.203, global_step=8005.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  51%|█████     | 615/1208 [17:57<17:18,  1.75s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000338, train/loss_step=0.103, global_step=8005.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  51%|█████     | 616/1208 [18:00<17:17,  1.75s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000338, train/loss_step=0.103, global_step=8005.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  51%|█████     | 616/1208 [18:00<17:17,  1.75s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.6e-5, train/loss_step=0.00286, global_step=8005.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  51%|█████     | 617/1208 [18:01<17:15,  1.75s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.6e-5, train/loss_step=0.00286, global_step=8005.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  51%|█████     | 617/1208 [18:01<17:15,  1.75s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.00875, train/loss_vlb_step=4.06e-5, train/loss_step=0.00875, global_step=8006.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  51%|█████     | 618/1208 [18:02<17:13,  1.75s/it, loss=0.0982, v_num=0, train/loss_simple_step=0.00875, train/loss_vlb_step=4.06e-5, train/loss_step=0.00875, global_step=8006.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  51%|█████     | 618/1208 [18:02<17:13,  1.75s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.42e-5, train/loss_step=0.0132, global_step=8006.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  51%|█████     | 619/1208 [18:03<17:10,  1.75s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.42e-5, train/loss_step=0.0132, global_step=8006.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  51%|█████     | 619/1208 [18:03<17:10,  1.75s/it, loss=0.096, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000433, train/loss_step=0.130, global_step=8006.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  51%|█████▏    | 620/1208 [18:06<17:10,  1.75s/it, loss=0.096, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000433, train/loss_step=0.130, global_step=8006.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  51%|█████▏    | 620/1208 [18:06<17:10,  1.75s/it, loss=0.0834, v_num=0, train/loss_simple_step=0.00855, train/loss_vlb_step=4.05e-5, train/loss_step=0.00855, global_step=8006.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  51%|█████▏    | 621/1208 [18:07<17:08,  1.75s/it, loss=0.0834, v_num=0, train/loss_simple_step=0.00855, train/loss_vlb_step=4.05e-5, train/loss_step=0.00855, global_step=8006.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  51%|█████▏    | 621/1208 [18:07<17:08,  1.75s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00139, train/loss_step=0.298, global_step=8007.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  51%|█████▏    | 622/1208 [18:08<17:05,  1.75s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00139, train/loss_step=0.298, global_step=8007.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  51%|█████▏    | 622/1208 [18:08<17:05,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.0018, train/loss_step=0.334, global_step=8007.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  52%|█████▏    | 623/1208 [18:09<17:03,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.0018, train/loss_step=0.334, global_step=8007.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  52%|█████▏    | 623/1208 [18:09<17:03,  1.75s/it, loss=0.11, v_num=0, train/loss_simple_step=0.059, train/loss_vlb_step=0.000208, train/loss_step=0.059, global_step=8007.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  52%|█████▏    | 624/1208 [18:12<17:02,  1.75s/it, loss=0.11, v_num=0, train/loss_simple_step=0.059, train/loss_vlb_step=0.000208, train/loss_step=0.059, global_step=8007.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  52%|█████▏    | 624/1208 [18:12<17:02,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000549, train/loss_step=0.161, global_step=8007.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  52%|█████▏    | 625/1208 [18:14<17:00,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000549, train/loss_step=0.161, global_step=8007.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  52%|█████▏    | 625/1208 [18:14<17:00,  1.75s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.000142, train/loss_step=0.0362, global_step=8008.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  52%|█████▏    | 626/1208 [18:15<16:58,  1.75s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.000142, train/loss_step=0.0362, global_step=8008.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  52%|█████▏    | 626/1208 [18:15<16:58,  1.75s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.0014, train/loss_step=0.282, global_step=8008.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  52%|█████▏    | 627/1208 [18:16<16:55,  1.75s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.0014, train/loss_step=0.282, global_step=8008.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  52%|█████▏    | 627/1208 [18:16<16:55,  1.75s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000662, train/loss_step=0.180, global_step=8008.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  52%|█████▏    | 628/1208 [18:19<16:55,  1.75s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000662, train/loss_step=0.180, global_step=8008.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  52%|█████▏    | 628/1208 [18:19<16:55,  1.75s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000286, train/loss_step=0.087, global_step=8008.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  52%|█████▏    | 629/1208 [18:20<16:53,  1.75s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000286, train/loss_step=0.087, global_step=8008.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  52%|█████▏    | 629/1208 [18:20<16:53,  1.75s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000114, train/loss_step=0.0282, global_step=8009.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  52%|█████▏    | 630/1208 [18:21<16:50,  1.75s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000114, train/loss_step=0.0282, global_step=8009.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  52%|█████▏    | 630/1208 [18:21<16:50,  1.75s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=9.82e-6, train/loss_step=0.00161, global_step=8009.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  52%|█████▏    | 631/1208 [18:22<16:48,  1.75s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=9.82e-6, train/loss_step=0.00161, global_step=8009.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  52%|█████▏    | 631/1208 [18:22<16:48,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=8009.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  52%|█████▏    | 632/1208 [18:25<16:47,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=8009.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  52%|█████▏    | 632/1208 [18:25<16:47,  1.75s/it, loss=0.114, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.00088, train/loss_step=0.216, global_step=8009.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  52%|█████▏    | 633/1208 [18:27<16:45,  1.75s/it, loss=0.114, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.00088, train/loss_step=0.216, global_step=8009.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  52%|█████▏    | 633/1208 [18:27<16:45,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000904, train/loss_step=0.242, global_step=8010.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  52%|█████▏    | 634/1208 [18:28<16:43,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000904, train/loss_step=0.242, global_step=8010.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  52%|█████▏    | 634/1208 [18:28<16:43,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000495, train/loss_step=0.148, global_step=8010.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  53%|█████▎    | 635/1208 [18:29<16:40,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000495, train/loss_step=0.148, global_step=8010.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  53%|█████▎    | 635/1208 [18:29<16:40,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000493, train/loss_step=0.149, global_step=8010.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  53%|█████▎    | 636/1208 [18:32<16:40,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000493, train/loss_step=0.149, global_step=8010.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  53%|█████▎    | 636/1208 [18:32<16:40,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000536, train/loss_step=0.158, global_step=8010.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  53%|█████▎    | 637/1208 [18:33<16:38,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000536, train/loss_step=0.158, global_step=8010.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  53%|█████▎    | 637/1208 [18:33<16:38,  1.75s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000231, train/loss_step=0.0676, global_step=8011.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  53%|█████▎    | 638/1208 [18:34<16:35,  1.75s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000231, train/loss_step=0.0676, global_step=8011.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  53%|█████▎    | 638/1208 [18:34<16:35,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00308, train/loss_step=0.418, global_step=8011.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  53%|█████▎    | 639/1208 [18:35<16:33,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.418, train/loss_vlb_step=0.00308, train/loss_step=0.418, global_step=8011.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  53%|█████▎    | 639/1208 [18:35<16:33,  1.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.24e-5, train/loss_step=0.0117, global_step=8011.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  53%|█████▎    | 640/1208 [18:38<16:33,  1.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.24e-5, train/loss_step=0.0117, global_step=8011.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  53%|█████▎    | 640/1208 [18:38<16:33,  1.75s/it, loss=0.155, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.00039, train/loss_step=0.118, global_step=8011.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  53%|█████▎    | 641/1208 [18:40<16:30,  1.75s/it, loss=0.155, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.00039, train/loss_step=0.118, global_step=8011.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  53%|█████▎    | 641/1208 [18:40<16:30,  1.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0408, train/loss_vlb_step=0.000149, train/loss_step=0.0408, global_step=8012.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  53%|█████▎    | 642/1208 [18:41<16:28,  1.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0408, train/loss_vlb_step=0.000149, train/loss_step=0.0408, global_step=8012.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  53%|█████▎    | 642/1208 [18:41<16:28,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.576, train/loss_vlb_step=0.0202, train/loss_step=0.576, global_step=8012.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  53%|█████▎    | 643/1208 [18:42<16:26,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.576, train/loss_vlb_step=0.0202, train/loss_step=0.576, global_step=8012.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  53%|█████▎    | 643/1208 [18:42<16:26,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0872, train/loss_vlb_step=0.000287, train/loss_step=0.0872, global_step=8012.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  53%|█████▎    | 644/1208 [18:45<16:25,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0872, train/loss_vlb_step=0.000287, train/loss_step=0.0872, global_step=8012.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  53%|█████▎    | 644/1208 [18:45<16:25,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000453, train/loss_step=0.131, global_step=8012.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  53%|█████▎    | 645/1208 [18:46<16:23,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000453, train/loss_step=0.131, global_step=8012.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  53%|█████▎    | 645/1208 [18:46<16:23,  1.75s/it, loss=0.161, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000647, train/loss_step=0.171, global_step=8013.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  53%|█████▎    | 646/1208 [18:47<16:20,  1.75s/it, loss=0.161, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000647, train/loss_step=0.171, global_step=8013.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  53%|█████▎    | 646/1208 [18:47<16:20,  1.75s/it, loss=0.153, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=8013.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  54%|█████▎    | 647/1208 [18:48<16:18,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000375, train/loss_step=0.114, global_step=8013.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  54%|█████▎    | 647/1208 [18:48<16:18,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.6e-5, train/loss_step=0.00288, global_step=8013.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  54%|█████▎    | 648/1208 [18:51<16:18,  1.75s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.6e-5, train/loss_step=0.00288, global_step=8013.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  54%|█████▎    | 648/1208 [18:51<16:18,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00601, train/loss_vlb_step=3.15e-5, train/loss_step=0.00601, global_step=8013.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  54%|█████▎    | 649/1208 [18:52<16:15,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00601, train/loss_vlb_step=3.15e-5, train/loss_step=0.00601, global_step=8013.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  54%|█████▎    | 649/1208 [18:52<16:15,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00161, train/loss_step=0.316, global_step=8014.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  54%|█████▍    | 650/1208 [18:54<16:13,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00161, train/loss_step=0.316, global_step=8014.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  54%|█████▍    | 650/1208 [18:54<16:13,  1.74s/it, loss=0.16, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=8014.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  54%|█████▍    | 651/1208 [18:55<16:11,  1.74s/it, loss=0.16, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=8014.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  54%|█████▍    | 651/1208 [18:55<16:11,  1.74s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0715, train/loss_vlb_step=0.000239, train/loss_step=0.0715, global_step=8014.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  54%|█████▍    | 652/1208 [18:58<16:10,  1.75s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0715, train/loss_vlb_step=0.000239, train/loss_step=0.0715, global_step=8014.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  54%|█████▍    | 652/1208 [18:58<16:10,  1.75s/it, loss=0.163, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00173, train/loss_step=0.312, global_step=8014.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  54%|█████▍    | 653/1208 [18:59<16:08,  1.75s/it, loss=0.163, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00173, train/loss_step=0.312, global_step=8014.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  54%|█████▍    | 653/1208 [18:59<16:08,  1.75s/it, loss=0.158, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000521, train/loss_step=0.157, global_step=8015.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  54%|█████▍    | 654/1208 [19:00<16:06,  1.74s/it, loss=0.158, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000521, train/loss_step=0.157, global_step=8015.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  54%|█████▍    | 654/1208 [19:00<16:06,  1.74s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.03e-5, train/loss_step=0.00174, global_step=8015.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  54%|█████▍    | 655/1208 [19:01<16:03,  1.74s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.03e-5, train/loss_step=0.00174, global_step=8015.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  54%|█████▍    | 655/1208 [19:01<16:03,  1.74s/it, loss=0.151, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000491, train/loss_step=0.149, global_step=8015.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  54%|█████▍    | 656/1208 [19:04<16:03,  1.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000491, train/loss_step=0.149, global_step=8015.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  54%|█████▍    | 656/1208 [19:04<16:03,  1.75s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.54e-5, train/loss_step=0.0125, global_step=8015.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  54%|█████▍    | 657/1208 [19:06<16:01,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.54e-5, train/loss_step=0.0125, global_step=8015.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  54%|█████▍    | 657/1208 [19:06<16:01,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0992, train/loss_vlb_step=0.000326, train/loss_step=0.0992, global_step=8016.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  54%|█████▍    | 658/1208 [19:07<15:58,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0992, train/loss_vlb_step=0.000326, train/loss_step=0.0992, global_step=8016.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  54%|█████▍    | 658/1208 [19:07<15:58,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=1.99e-5, train/loss_step=0.00368, global_step=8016.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  55%|█████▍    | 659/1208 [19:08<15:56,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=1.99e-5, train/loss_step=0.00368, global_step=8016.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  55%|█████▍    | 659/1208 [19:08<15:56,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.65e-5, train/loss_step=0.0127, global_step=8016.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  55%|█████▍    | 660/1208 [19:11<15:55,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.65e-5, train/loss_step=0.0127, global_step=8016.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  55%|█████▍    | 660/1208 [19:11<15:55,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.22e-5, train/loss_step=0.0117, global_step=8016.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  55%|█████▍    | 661/1208 [19:12<15:53,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.22e-5, train/loss_step=0.0117, global_step=8016.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  55%|█████▍    | 661/1208 [19:12<15:53,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000519, train/loss_step=0.154, global_step=8017.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  55%|█████▍    | 662/1208 [19:13<15:51,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000519, train/loss_step=0.154, global_step=8017.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  55%|█████▍    | 662/1208 [19:13<15:51,  1.74s/it, loss=0.0993, v_num=0, train/loss_simple_step=0.0635, train/loss_vlb_step=0.000216, train/loss_step=0.0635, global_step=8017.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  55%|█████▍    | 663/1208 [19:14<15:49,  1.74s/it, loss=0.0993, v_num=0, train/loss_simple_step=0.0635, train/loss_vlb_step=0.000216, train/loss_step=0.0635, global_step=8017.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  55%|█████▍    | 663/1208 [19:14<15:49,  1.74s/it, loss=0.098, v_num=0, train/loss_simple_step=0.0611, train/loss_vlb_step=0.000209, train/loss_step=0.0611, global_step=8017.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  55%|█████▍    | 664/1208 [19:17<15:48,  1.74s/it, loss=0.098, v_num=0, train/loss_simple_step=0.0611, train/loss_vlb_step=0.000209, train/loss_step=0.0611, global_step=8017.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  55%|█████▍    | 664/1208 [19:17<15:48,  1.74s/it, loss=0.0918, v_num=0, train/loss_simple_step=0.00591, train/loss_vlb_step=2.74e-5, train/loss_step=0.00591, global_step=8017.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  55%|█████▌    | 665/1208 [19:18<15:46,  1.74s/it, loss=0.0918, v_num=0, train/loss_simple_step=0.00591, train/loss_vlb_step=2.74e-5, train/loss_step=0.00591, global_step=8017.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  55%|█████▌    | 665/1208 [19:18<15:46,  1.74s/it, loss=0.0833, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.61e-5, train/loss_step=0.00288, global_step=8018.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  55%|█████▌    | 666/1208 [19:19<15:43,  1.74s/it, loss=0.0833, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.61e-5, train/loss_step=0.00288, global_step=8018.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  55%|█████▌    | 666/1208 [19:19<15:43,  1.74s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00187, train/loss_step=0.363, global_step=8018.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  55%|█████▌    | 667/1208 [19:20<15:41,  1.74s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00187, train/loss_step=0.363, global_step=8018.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  55%|█████▌    | 667/1208 [19:20<15:41,  1.74s/it, loss=0.104, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000579, train/loss_step=0.166, global_step=8018.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  55%|█████▌    | 668/1208 [19:24<15:41,  1.74s/it, loss=0.104, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000579, train/loss_step=0.166, global_step=8018.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  55%|█████▌    | 668/1208 [19:24<15:41,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0917, train/loss_vlb_step=0.000303, train/loss_step=0.0917, global_step=8018.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  55%|█████▌    | 669/1208 [19:25<15:38,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0917, train/loss_vlb_step=0.000303, train/loss_step=0.0917, global_step=8018.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  55%|█████▌    | 669/1208 [19:25<15:38,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000824, train/loss_step=0.214, global_step=8019.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  55%|█████▌    | 670/1208 [19:26<15:36,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000824, train/loss_step=0.214, global_step=8019.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  55%|█████▌    | 670/1208 [19:26<15:36,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00241, train/loss_step=0.378, global_step=8019.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  56%|█████▌    | 671/1208 [19:27<15:34,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.378, train/loss_vlb_step=0.00241, train/loss_step=0.378, global_step=8019.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  56%|█████▌    | 671/1208 [19:27<15:34,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.00104, train/loss_step=0.230, global_step=8019.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  56%|█████▌    | 672/1208 [19:30<15:33,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.00104, train/loss_step=0.230, global_step=8019.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  56%|█████▌    | 672/1208 [19:30<15:33,  1.74s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000103, train/loss_step=0.0255, global_step=8019.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  56%|█████▌    | 673/1208 [19:31<15:31,  1.74s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000103, train/loss_step=0.0255, global_step=8019.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  56%|█████▌    | 673/1208 [19:31<15:31,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.37e-5, train/loss_step=0.0147, global_step=8020.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  56%|█████▌    | 674/1208 [19:32<15:29,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.37e-5, train/loss_step=0.0147, global_step=8020.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  56%|█████▌    | 674/1208 [19:32<15:29,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000854, train/loss_step=0.235, global_step=8020.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  56%|█████▌    | 675/1208 [19:33<15:26,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000854, train/loss_step=0.235, global_step=8020.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  56%|█████▌    | 675/1208 [19:33<15:26,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00914, train/loss_vlb_step=4.16e-5, train/loss_step=0.00914, global_step=8020.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  56%|█████▌    | 676/1208 [19:37<15:26,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00914, train/loss_vlb_step=4.16e-5, train/loss_step=0.00914, global_step=8020.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  56%|█████▌    | 676/1208 [19:37<15:26,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000737, train/loss_step=0.208, global_step=8020.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  56%|█████▌    | 677/1208 [19:38<15:24,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000737, train/loss_step=0.208, global_step=8020.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  56%|█████▌    | 677/1208 [19:38<15:24,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000407, train/loss_step=0.122, global_step=8021.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  56%|█████▌    | 678/1208 [19:39<15:21,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000407, train/loss_step=0.122, global_step=8021.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  56%|█████▌    | 678/1208 [19:39<15:21,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00293, train/loss_step=0.372, global_step=8021.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  56%|█████▌    | 679/1208 [19:40<15:19,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00293, train/loss_step=0.372, global_step=8021.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  56%|█████▌    | 679/1208 [19:40<15:19,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0648, train/loss_vlb_step=0.000222, train/loss_step=0.0648, global_step=8021.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  56%|█████▋    | 680/1208 [19:43<15:19,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0648, train/loss_vlb_step=0.000222, train/loss_step=0.0648, global_step=8021.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  56%|█████▋    | 680/1208 [19:43<15:19,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000133, train/loss_step=0.0365, global_step=8021.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  56%|█████▋    | 681/1208 [19:44<15:16,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000133, train/loss_step=0.0365, global_step=8021.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  56%|█████▋    | 681/1208 [19:44<15:16,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000584, train/loss_step=0.167, global_step=8022.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  56%|█████▋    | 682/1208 [19:45<15:14,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000584, train/loss_step=0.167, global_step=8022.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  56%|█████▋    | 682/1208 [19:45<15:14,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=2.47e-5, train/loss_step=0.00469, global_step=8022.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  57%|█████▋    | 683/1208 [19:46<15:12,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=2.47e-5, train/loss_step=0.00469, global_step=8022.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  57%|█████▋    | 683/1208 [19:46<15:12,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000441, train/loss_step=0.132, global_step=8022.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  57%|█████▋    | 684/1208 [19:50<15:11,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000441, train/loss_step=0.132, global_step=8022.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  57%|█████▋    | 684/1208 [19:50<15:11,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00446, train/loss_vlb_step=2.3e-5, train/loss_step=0.00446, global_step=8022.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  57%|█████▋    | 685/1208 [19:51<15:09,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00446, train/loss_vlb_step=2.3e-5, train/loss_step=0.00446, global_step=8022.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  57%|█████▋    | 685/1208 [19:51<15:09,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000105, train/loss_step=0.0258, global_step=8023.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  57%|█████▋    | 686/1208 [19:52<15:07,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000105, train/loss_step=0.0258, global_step=8023.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  57%|█████▋    | 686/1208 [19:52<15:07,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00648, train/loss_vlb_step=3.17e-5, train/loss_step=0.00648, global_step=8023.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  57%|█████▋    | 687/1208 [19:53<15:05,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00648, train/loss_vlb_step=3.17e-5, train/loss_step=0.00648, global_step=8023.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  57%|█████▋    | 687/1208 [19:53<15:05,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.28e-5, train/loss_step=0.0142, global_step=8023.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  57%|█████▋    | 688/1208 [19:56<15:04,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.28e-5, train/loss_step=0.0142, global_step=8023.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  57%|█████▋    | 688/1208 [19:56<15:04,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000113, train/loss_step=0.0284, global_step=8023.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  57%|█████▋    | 689/1208 [19:57<15:02,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000113, train/loss_step=0.0284, global_step=8023.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  57%|█████▋    | 689/1208 [19:57<15:02,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000643, train/loss_step=0.185, global_step=8024.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  57%|█████▋    | 690/1208 [19:58<14:59,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000643, train/loss_step=0.185, global_step=8024.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  57%|█████▋    | 690/1208 [19:58<14:59,  1.74s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.23e-5, train/loss_step=0.00204, global_step=8024.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  57%|█████▋    | 691/1208 [19:59<14:57,  1.74s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.23e-5, train/loss_step=0.00204, global_step=8024.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  57%|█████▋    | 691/1208 [19:59<14:57,  1.74s/it, loss=0.0856, v_num=0, train/loss_simple_step=0.0547, train/loss_vlb_step=0.000193, train/loss_step=0.0547, global_step=8024.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  57%|█████▋    | 692/1208 [20:03<14:57,  1.74s/it, loss=0.0856, v_num=0, train/loss_simple_step=0.0547, train/loss_vlb_step=0.000193, train/loss_step=0.0547, global_step=8024.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  57%|█████▋    | 692/1208 [20:03<14:57,  1.74s/it, loss=0.0859, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.000118, train/loss_step=0.0312, global_step=8024.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  57%|█████▋    | 693/1208 [20:04<14:54,  1.74s/it, loss=0.0859, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.000118, train/loss_step=0.0312, global_step=8024.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  57%|█████▋    | 693/1208 [20:04<14:54,  1.74s/it, loss=0.0856, v_num=0, train/loss_simple_step=0.00898, train/loss_vlb_step=4.16e-5, train/loss_step=0.00898, global_step=8025.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  57%|█████▋    | 694/1208 [20:05<14:52,  1.74s/it, loss=0.0856, v_num=0, train/loss_simple_step=0.00898, train/loss_vlb_step=4.16e-5, train/loss_step=0.00898, global_step=8025.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  57%|█████▋    | 694/1208 [20:05<14:52,  1.74s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00158, train/loss_step=0.320, global_step=8025.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  58%|█████▊    | 695/1208 [20:06<14:50,  1.74s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00158, train/loss_step=0.320, global_step=8025.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  58%|█████▊    | 695/1208 [20:06<14:50,  1.74s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.0856, train/loss_vlb_step=0.000282, train/loss_step=0.0856, global_step=8025.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  58%|█████▊    | 696/1208 [20:09<14:49,  1.74s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.0856, train/loss_vlb_step=0.000282, train/loss_step=0.0856, global_step=8025.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  58%|█████▊    | 696/1208 [20:09<14:49,  1.74s/it, loss=0.0834, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.2e-5, train/loss_step=0.00203, global_step=8025.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  58%|█████▊    | 697/1208 [20:10<14:47,  1.74s/it, loss=0.0834, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.2e-5, train/loss_step=0.00203, global_step=8025.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  58%|█████▊    | 697/1208 [20:10<14:47,  1.74s/it, loss=0.0849, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000532, train/loss_step=0.153, global_step=8026.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  58%|█████▊    | 698/1208 [20:11<14:45,  1.74s/it, loss=0.0849, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000532, train/loss_step=0.153, global_step=8026.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  58%|█████▊    | 698/1208 [20:11<14:45,  1.74s/it, loss=0.0675, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=8.81e-5, train/loss_step=0.0218, global_step=8026.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  58%|█████▊    | 699/1208 [20:12<14:43,  1.74s/it, loss=0.0675, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=8.81e-5, train/loss_step=0.0218, global_step=8026.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  58%|█████▊    | 699/1208 [20:12<14:43,  1.74s/it, loss=0.0643, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.38e-5, train/loss_step=0.00235, global_step=8026.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  58%|█████▊    | 700/1208 [20:16<14:42,  1.74s/it, loss=0.0643, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.38e-5, train/loss_step=0.00235, global_step=8026.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  58%|█████▊    | 700/1208 [20:16<14:42,  1.74s/it, loss=0.0816, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00272, train/loss_step=0.383, global_step=8026.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  58%|█████▊    | 701/1208 [20:17<14:40,  1.74s/it, loss=0.0816, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00272, train/loss_step=0.383, global_step=8026.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  58%|█████▊    | 701/1208 [20:17<14:40,  1.74s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00164, train/loss_step=0.333, global_step=8027.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  58%|█████▊    | 702/1208 [20:18<14:38,  1.74s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00164, train/loss_step=0.333, global_step=8027.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  58%|█████▊    | 702/1208 [20:18<14:38,  1.74s/it, loss=0.09, v_num=0, train/loss_simple_step=0.00636, train/loss_vlb_step=3.22e-5, train/loss_step=0.00636, global_step=8027.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  58%|█████▊    | 703/1208 [20:19<14:36,  1.73s/it, loss=0.09, v_num=0, train/loss_simple_step=0.00636, train/loss_vlb_step=3.22e-5, train/loss_step=0.00636, global_step=8027.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  58%|█████▊    | 703/1208 [20:19<14:36,  1.73s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000428, train/loss_step=0.129, global_step=8027.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  58%|█████▊    | 704/1208 [20:22<14:35,  1.74s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000428, train/loss_step=0.129, global_step=8027.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  58%|█████▊    | 704/1208 [20:22<14:35,  1.74s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000623, train/loss_step=0.179, global_step=8027.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  58%|█████▊    | 705/1208 [20:23<14:33,  1.74s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000623, train/loss_step=0.179, global_step=8027.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  58%|█████▊    | 705/1208 [20:23<14:33,  1.74s/it, loss=0.11, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.000968, train/loss_step=0.259, global_step=8028.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  58%|█████▊    | 706/1208 [20:24<14:30,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.000968, train/loss_step=0.259, global_step=8028.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  58%|█████▊    | 706/1208 [20:24<14:30,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0742, train/loss_vlb_step=0.000253, train/loss_step=0.0742, global_step=8028.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  59%|█████▊    | 707/1208 [20:25<14:28,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0742, train/loss_vlb_step=0.000253, train/loss_step=0.0742, global_step=8028.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  59%|█████▊    | 707/1208 [20:25<14:28,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=8028.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  59%|█████▊    | 708/1208 [20:29<14:28,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000395, train/loss_step=0.120, global_step=8028.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  59%|█████▊    | 708/1208 [20:29<14:28,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0823, train/loss_vlb_step=0.000275, train/loss_step=0.0823, global_step=8028.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  59%|█████▊    | 709/1208 [20:30<14:25,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0823, train/loss_vlb_step=0.000275, train/loss_step=0.0823, global_step=8028.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  59%|█████▊    | 709/1208 [20:30<14:25,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00444, train/loss_vlb_step=2.32e-5, train/loss_step=0.00444, global_step=8029.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  59%|█████▉    | 710/1208 [20:31<14:23,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00444, train/loss_vlb_step=2.32e-5, train/loss_step=0.00444, global_step=8029.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  59%|█████▉    | 710/1208 [20:31<14:23,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.480, train/loss_vlb_step=0.00403, train/loss_step=0.480, global_step=8029.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  59%|█████▉    | 711/1208 [20:32<14:21,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.480, train/loss_vlb_step=0.00403, train/loss_step=0.480, global_step=8029.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  59%|█████▉    | 711/1208 [20:32<14:21,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.35e-5, train/loss_step=0.0226, global_step=8029.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  59%|█████▉    | 712/1208 [20:35<14:20,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.35e-5, train/loss_step=0.0226, global_step=8029.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  59%|█████▉    | 712/1208 [20:35<14:20,  1.74s/it, loss=0.147, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00134, train/loss_step=0.263, global_step=8029.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  59%|█████▉    | 713/1208 [20:36<14:18,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00134, train/loss_step=0.263, global_step=8029.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  59%|█████▉    | 713/1208 [20:36<14:18,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.00013, train/loss_step=0.0359, global_step=8030.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  59%|█████▉    | 714/1208 [20:37<14:16,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.00013, train/loss_step=0.0359, global_step=8030.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  59%|█████▉    | 714/1208 [20:37<14:16,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00442, train/loss_vlb_step=2.41e-5, train/loss_step=0.00442, global_step=8030.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  59%|█████▉    | 715/1208 [20:38<14:14,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00442, train/loss_vlb_step=2.41e-5, train/loss_step=0.00442, global_step=8030.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  59%|█████▉    | 715/1208 [20:38<14:14,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000598, train/loss_step=0.174, global_step=8030.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  59%|█████▉    | 716/1208 [20:42<14:13,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000598, train/loss_step=0.174, global_step=8030.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  59%|█████▉    | 716/1208 [20:42<14:13,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0041, train/loss_vlb_step=2.15e-5, train/loss_step=0.0041, global_step=8030.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  59%|█████▉    | 717/1208 [20:43<14:11,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0041, train/loss_vlb_step=2.15e-5, train/loss_step=0.0041, global_step=8030.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  59%|█████▉    | 717/1208 [20:43<14:11,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.64e-5, train/loss_step=0.0029, global_step=8031.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  59%|█████▉    | 718/1208 [20:44<14:09,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.64e-5, train/loss_step=0.0029, global_step=8031.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  59%|█████▉    | 718/1208 [20:44<14:09,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000408, train/loss_step=0.123, global_step=8031.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  60%|█████▉    | 719/1208 [20:45<14:06,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000408, train/loss_step=0.123, global_step=8031.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  60%|█████▉    | 719/1208 [20:45<14:06,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.000179, train/loss_step=0.0508, global_step=8031.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  60%|█████▉    | 720/1208 [20:48<14:06,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.000179, train/loss_step=0.0508, global_step=8031.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  60%|█████▉    | 720/1208 [20:48<14:06,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00297, train/loss_vlb_step=1.64e-5, train/loss_step=0.00297, global_step=8031.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  60%|█████▉    | 721/1208 [20:49<14:04,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00297, train/loss_vlb_step=1.64e-5, train/loss_step=0.00297, global_step=8031.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  60%|█████▉    | 721/1208 [20:49<14:04,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000643, train/loss_step=0.179, global_step=8032.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  60%|█████▉    | 722/1208 [20:50<14:01,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000643, train/loss_step=0.179, global_step=8032.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  60%|█████▉    | 722/1208 [20:50<14:01,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.755, train/loss_vlb_step=0.0249, train/loss_step=0.755, global_step=8032.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  60%|█████▉    | 723/1208 [20:51<13:59,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.755, train/loss_vlb_step=0.0249, train/loss_step=0.755, global_step=8032.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  60%|█████▉    | 723/1208 [20:51<13:59,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.98e-5, train/loss_step=0.0185, global_step=8032.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  60%|█████▉    | 724/1208 [20:55<13:59,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.98e-5, train/loss_step=0.0185, global_step=8032.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  60%|█████▉    | 724/1208 [20:55<13:59,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0711, train/loss_vlb_step=0.000235, train/loss_step=0.0711, global_step=8032.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  60%|██████    | 725/1208 [20:56<13:56,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0711, train/loss_vlb_step=0.000235, train/loss_step=0.0711, global_step=8032.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  60%|██████    | 725/1208 [20:56<13:56,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000113, train/loss_step=0.0299, global_step=8033.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  60%|██████    | 726/1208 [20:57<13:54,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000113, train/loss_step=0.0299, global_step=8033.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  60%|██████    | 726/1208 [20:57<13:54,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0506, train/loss_vlb_step=0.000182, train/loss_step=0.0506, global_step=8033.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  60%|██████    | 727/1208 [20:58<13:52,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0506, train/loss_vlb_step=0.000182, train/loss_step=0.0506, global_step=8033.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  60%|██████    | 727/1208 [20:58<13:52,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0777, train/loss_vlb_step=0.000258, train/loss_step=0.0777, global_step=8033.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  60%|██████    | 728/1208 [21:01<13:51,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0777, train/loss_vlb_step=0.000258, train/loss_step=0.0777, global_step=8033.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  60%|██████    | 728/1208 [21:01<13:51,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00585, train/loss_vlb_step=2.88e-5, train/loss_step=0.00585, global_step=8033.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  60%|██████    | 729/1208 [21:02<13:49,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00585, train/loss_vlb_step=2.88e-5, train/loss_step=0.00585, global_step=8033.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  60%|██████    | 729/1208 [21:02<13:49,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.55e-5, train/loss_step=0.0238, global_step=8034.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  60%|██████    | 730/1208 [21:03<13:47,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.55e-5, train/loss_step=0.0238, global_step=8034.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  60%|██████    | 730/1208 [21:03<13:47,  1.73s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000119, train/loss_step=0.0308, global_step=8034.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  61%|██████    | 731/1208 [21:04<13:45,  1.73s/it, loss=0.0963, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000119, train/loss_step=0.0308, global_step=8034.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  61%|██████    | 731/1208 [21:04<13:45,  1.73s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.8e-5, train/loss_step=0.00311, global_step=8034.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  61%|██████    | 732/1208 [21:08<13:44,  1.73s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.8e-5, train/loss_step=0.00311, global_step=8034.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  61%|██████    | 732/1208 [21:08<13:44,  1.73s/it, loss=0.0867, v_num=0, train/loss_simple_step=0.0918, train/loss_vlb_step=0.000303, train/loss_step=0.0918, global_step=8034.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  61%|██████    | 733/1208 [21:09<13:42,  1.73s/it, loss=0.0867, v_num=0, train/loss_simple_step=0.0918, train/loss_vlb_step=0.000303, train/loss_step=0.0918, global_step=8034.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  61%|██████    | 733/1208 [21:09<13:42,  1.73s/it, loss=0.0853, v_num=0, train/loss_simple_step=0.00676, train/loss_vlb_step=3.29e-5, train/loss_step=0.00676, global_step=8035.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  61%|██████    | 734/1208 [21:10<13:40,  1.73s/it, loss=0.0853, v_num=0, train/loss_simple_step=0.00676, train/loss_vlb_step=3.29e-5, train/loss_step=0.00676, global_step=8035.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  61%|██████    | 734/1208 [21:10<13:40,  1.73s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.87e-5, train/loss_step=0.00342, global_step=8035.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  61%|██████    | 735/1208 [21:11<13:38,  1.73s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.87e-5, train/loss_step=0.00342, global_step=8035.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  61%|██████    | 735/1208 [21:11<13:38,  1.73s/it, loss=0.0767, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.8e-5, train/loss_step=0.00331, global_step=8035.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  61%|██████    | 736/1208 [21:14<13:37,  1.73s/it, loss=0.0767, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.8e-5, train/loss_step=0.00331, global_step=8035.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  61%|██████    | 736/1208 [21:14<13:37,  1.73s/it, loss=0.077, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.85e-5, train/loss_step=0.0106, global_step=8035.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  61%|██████    | 737/1208 [21:15<13:35,  1.73s/it, loss=0.077, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.85e-5, train/loss_step=0.0106, global_step=8035.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  61%|██████    | 737/1208 [21:15<13:35,  1.73s/it, loss=0.0816, v_num=0, train/loss_simple_step=0.0948, train/loss_vlb_step=0.000313, train/loss_step=0.0948, global_step=8036.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  61%|██████    | 738/1208 [21:16<13:33,  1.73s/it, loss=0.0816, v_num=0, train/loss_simple_step=0.0948, train/loss_vlb_step=0.000313, train/loss_step=0.0948, global_step=8036.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  61%|██████    | 738/1208 [21:16<13:33,  1.73s/it, loss=0.0757, v_num=0, train/loss_simple_step=0.00505, train/loss_vlb_step=2.61e-5, train/loss_step=0.00505, global_step=8036.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  61%|██████    | 739/1208 [21:17<13:31,  1.73s/it, loss=0.0757, v_num=0, train/loss_simple_step=0.00505, train/loss_vlb_step=2.61e-5, train/loss_step=0.00505, global_step=8036.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  61%|██████    | 739/1208 [21:17<13:31,  1.73s/it, loss=0.0828, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000713, train/loss_step=0.192, global_step=8036.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  61%|██████▏   | 740/1208 [21:21<13:30,  1.73s/it, loss=0.0828, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000713, train/loss_step=0.192, global_step=8036.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  61%|██████▏   | 740/1208 [21:21<13:30,  1.73s/it, loss=0.0838, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.91e-5, train/loss_step=0.0237, global_step=8036.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  61%|██████▏   | 741/1208 [21:22<13:28,  1.73s/it, loss=0.0838, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.91e-5, train/loss_step=0.0237, global_step=8036.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  61%|██████▏   | 741/1208 [21:22<13:28,  1.73s/it, loss=0.0813, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00043, train/loss_step=0.128, global_step=8037.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  61%|██████▏   | 742/1208 [21:23<13:25,  1.73s/it, loss=0.0813, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.00043, train/loss_step=0.128, global_step=8037.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  61%|██████▏   | 742/1208 [21:23<13:25,  1.73s/it, loss=0.0454, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000138, train/loss_step=0.0367, global_step=8037.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  62%|██████▏   | 743/1208 [21:24<13:23,  1.73s/it, loss=0.0454, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000138, train/loss_step=0.0367, global_step=8037.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  62%|██████▏   | 743/1208 [21:24<13:23,  1.73s/it, loss=0.0637, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00248, train/loss_step=0.386, global_step=8037.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  62%|██████▏   | 744/1208 [21:27<13:23,  1.73s/it, loss=0.0637, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00248, train/loss_step=0.386, global_step=8037.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  62%|██████▏   | 744/1208 [21:27<13:23,  1.73s/it, loss=0.0623, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000145, train/loss_step=0.0415, global_step=8037.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  62%|██████▏   | 745/1208 [21:28<13:20,  1.73s/it, loss=0.0623, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000145, train/loss_step=0.0415, global_step=8037.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  62%|██████▏   | 745/1208 [21:28<13:20,  1.73s/it, loss=0.061, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.47e-5, train/loss_step=0.00475, global_step=8038.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  62%|██████▏   | 746/1208 [21:29<13:18,  1.73s/it, loss=0.061, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.47e-5, train/loss_step=0.00475, global_step=8038.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  62%|██████▏   | 746/1208 [21:29<13:18,  1.73s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.747, train/loss_vlb_step=0.0547, train/loss_step=0.747, global_step=8038.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  62%|██████▏   | 747/1208 [21:30<13:16,  1.73s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.747, train/loss_vlb_step=0.0547, train/loss_step=0.747, global_step=8038.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  62%|██████▏   | 747/1208 [21:30<13:16,  1.73s/it, loss=0.104, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000942, train/loss_step=0.238, global_step=8038.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  62%|██████▏   | 748/1208 [21:34<13:15,  1.73s/it, loss=0.104, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000942, train/loss_step=0.238, global_step=8038.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  62%|██████▏   | 748/1208 [21:34<13:15,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.084, train/loss_vlb_step=0.000277, train/loss_step=0.084, global_step=8038.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  62%|██████▏   | 749/1208 [21:35<13:13,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.084, train/loss_vlb_step=0.000277, train/loss_step=0.084, global_step=8038.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  62%|██████▏   | 749/1208 [21:35<13:13,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.916, train/loss_vlb_step=0.461, train/loss_step=0.916, global_step=8039.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  62%|██████▏   | 750/1208 [21:36<13:11,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.916, train/loss_vlb_step=0.461, train/loss_step=0.916, global_step=8039.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  62%|██████▏   | 750/1208 [21:36<13:11,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000838, train/loss_step=0.216, global_step=8039.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  62%|██████▏   | 751/1208 [21:37<13:09,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000838, train/loss_step=0.216, global_step=8039.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  62%|██████▏   | 751/1208 [21:37<13:09,  1.73s/it, loss=0.176, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.0014, train/loss_step=0.288, global_step=8039.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  62%|██████▏   | 752/1208 [21:40<13:08,  1.73s/it, loss=0.176, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.0014, train/loss_step=0.288, global_step=8039.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  62%|██████▏   | 752/1208 [21:40<13:08,  1.73s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0888, train/loss_vlb_step=0.000296, train/loss_step=0.0888, global_step=8039.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  62%|██████▏   | 753/1208 [21:41<13:06,  1.73s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0888, train/loss_vlb_step=0.000296, train/loss_step=0.0888, global_step=8039.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  62%|██████▏   | 753/1208 [21:41<13:06,  1.73s/it, loss=0.197, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00425, train/loss_step=0.432, global_step=8040.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  62%|██████▏   | 754/1208 [21:42<13:04,  1.73s/it, loss=0.197, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00425, train/loss_step=0.432, global_step=8040.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  62%|██████▏   | 754/1208 [21:42<13:04,  1.73s/it, loss=0.23, v_num=0, train/loss_simple_step=0.673, train/loss_vlb_step=0.0236, train/loss_step=0.673, global_step=8040.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  62%|██████▎   | 755/1208 [21:44<13:02,  1.73s/it, loss=0.23, v_num=0, train/loss_simple_step=0.673, train/loss_vlb_step=0.0236, train/loss_step=0.673, global_step=8040.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  62%|██████▎   | 755/1208 [21:44<13:02,  1.73s/it, loss=0.232, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.000121, train/loss_step=0.032, global_step=8040.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  63%|██████▎   | 756/1208 [21:47<13:01,  1.73s/it, loss=0.232, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.000121, train/loss_step=0.032, global_step=8040.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  63%|██████▎   | 756/1208 [21:47<13:01,  1.73s/it, loss=0.235, v_num=0, train/loss_simple_step=0.0742, train/loss_vlb_step=0.000253, train/loss_step=0.0742, global_step=8040.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  63%|██████▎   | 757/1208 [21:48<12:59,  1.73s/it, loss=0.235, v_num=0, train/loss_simple_step=0.0742, train/loss_vlb_step=0.000253, train/loss_step=0.0742, global_step=8040.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  63%|██████▎   | 757/1208 [21:48<12:59,  1.73s/it, loss=0.237, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000433, train/loss_step=0.132, global_step=8041.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  63%|██████▎   | 758/1208 [21:49<12:57,  1.73s/it, loss=0.237, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000433, train/loss_step=0.132, global_step=8041.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  63%|██████▎   | 758/1208 [21:49<12:57,  1.73s/it, loss=0.237, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=1.35e-5, train/loss_step=0.0023, global_step=8041.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  63%|██████▎   | 759/1208 [21:50<12:55,  1.73s/it, loss=0.237, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=1.35e-5, train/loss_step=0.0023, global_step=8041.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  63%|██████▎   | 759/1208 [21:50<12:55,  1.73s/it, loss=0.252, v_num=0, train/loss_simple_step=0.502, train/loss_vlb_step=0.00373, train/loss_step=0.502, global_step=8041.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  63%|██████▎   | 760/1208 [21:53<12:54,  1.73s/it, loss=0.252, v_num=0, train/loss_simple_step=0.502, train/loss_vlb_step=0.00373, train/loss_step=0.502, global_step=8041.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  63%|██████▎   | 760/1208 [21:53<12:54,  1.73s/it, loss=0.254, v_num=0, train/loss_simple_step=0.0659, train/loss_vlb_step=0.000223, train/loss_step=0.0659, global_step=8041.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  63%|██████▎   | 761/1208 [21:54<12:52,  1.73s/it, loss=0.254, v_num=0, train/loss_simple_step=0.0659, train/loss_vlb_step=0.000223, train/loss_step=0.0659, global_step=8041.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  63%|██████▎   | 761/1208 [21:54<12:52,  1.73s/it, loss=0.253, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000355, train/loss_step=0.107, global_step=8042.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  63%|██████▎   | 762/1208 [21:55<12:50,  1.73s/it, loss=0.253, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000355, train/loss_step=0.107, global_step=8042.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  63%|██████▎   | 762/1208 [21:55<12:50,  1.73s/it, loss=0.252, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=2.13e-5, train/loss_step=0.00402, global_step=8042.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  63%|██████▎   | 763/1208 [21:56<12:48,  1.73s/it, loss=0.252, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=2.13e-5, train/loss_step=0.00402, global_step=8042.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  63%|██████▎   | 763/1208 [21:56<12:48,  1.73s/it, loss=0.232, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.65e-5, train/loss_step=0.00292, global_step=8042.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  63%|██████▎   | 764/1208 [22:00<12:47,  1.73s/it, loss=0.232, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.65e-5, train/loss_step=0.00292, global_step=8042.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  63%|██████▎   | 764/1208 [22:00<12:47,  1.73s/it, loss=0.232, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000106, train/loss_step=0.0274, global_step=8042.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  63%|██████▎   | 765/1208 [22:01<12:45,  1.73s/it, loss=0.232, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000106, train/loss_step=0.0274, global_step=8042.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  63%|██████▎   | 765/1208 [22:01<12:45,  1.73s/it, loss=0.234, v_num=0, train/loss_simple_step=0.0458, train/loss_vlb_step=0.000163, train/loss_step=0.0458, global_step=8043.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  63%|██████▎   | 766/1208 [22:02<12:42,  1.73s/it, loss=0.234, v_num=0, train/loss_simple_step=0.0458, train/loss_vlb_step=0.000163, train/loss_step=0.0458, global_step=8043.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  63%|██████▎   | 766/1208 [22:02<12:42,  1.73s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=5.01e-5, train/loss_step=0.0105, global_step=8043.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  63%|██████▎   | 767/1208 [22:03<12:40,  1.73s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=5.01e-5, train/loss_step=0.0105, global_step=8043.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  63%|██████▎   | 767/1208 [22:03<12:40,  1.73s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0878, train/loss_vlb_step=0.000289, train/loss_step=0.0878, global_step=8043.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  64%|██████▎   | 768/1208 [22:06<12:40,  1.73s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0878, train/loss_vlb_step=0.000289, train/loss_step=0.0878, global_step=8043.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  64%|██████▎   | 768/1208 [22:06<12:40,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00484, train/loss_vlb_step=2.52e-5, train/loss_step=0.00484, global_step=8043.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  64%|██████▎   | 769/1208 [22:07<12:37,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00484, train/loss_vlb_step=2.52e-5, train/loss_step=0.00484, global_step=8043.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  64%|██████▎   | 769/1208 [22:07<12:37,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000401, train/loss_step=0.121, global_step=8044.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  64%|██████▎   | 770/1208 [22:08<12:35,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000401, train/loss_step=0.121, global_step=8044.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  64%|██████▎   | 770/1208 [22:08<12:35,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000437, train/loss_step=0.131, global_step=8044.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  64%|██████▍   | 771/1208 [22:09<12:33,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000437, train/loss_step=0.131, global_step=8044.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  64%|██████▍   | 771/1208 [22:09<12:33,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000853, train/loss_step=0.224, global_step=8044.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  64%|██████▍   | 772/1208 [22:13<12:32,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000853, train/loss_step=0.224, global_step=8044.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  64%|██████▍   | 772/1208 [22:13<12:32,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.510, train/loss_vlb_step=0.00651, train/loss_step=0.510, global_step=8044.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  64%|██████▍   | 773/1208 [22:14<12:30,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.510, train/loss_vlb_step=0.00651, train/loss_step=0.510, global_step=8044.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  64%|██████▍   | 773/1208 [22:14<12:30,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00338, train/loss_vlb_step=1.88e-5, train/loss_step=0.00338, global_step=8045.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  64%|██████▍   | 774/1208 [22:15<12:28,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00338, train/loss_vlb_step=1.88e-5, train/loss_step=0.00338, global_step=8045.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  64%|██████▍   | 774/1208 [22:15<12:28,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000506, train/loss_step=0.150, global_step=8045.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  64%|██████▍   | 775/1208 [22:16<12:26,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000506, train/loss_step=0.150, global_step=8045.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  64%|██████▍   | 775/1208 [22:16<12:26,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000397, train/loss_step=0.120, global_step=8045.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  64%|██████▍   | 776/1208 [22:19<12:25,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000397, train/loss_step=0.120, global_step=8045.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  64%|██████▍   | 776/1208 [22:19<12:25,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00509, train/loss_vlb_step=2.72e-5, train/loss_step=0.00509, global_step=8045.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  64%|██████▍   | 777/1208 [22:20<12:23,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00509, train/loss_vlb_step=2.72e-5, train/loss_step=0.00509, global_step=8045.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  64%|██████▍   | 777/1208 [22:20<12:23,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00167, train/loss_step=0.343, global_step=8046.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  64%|██████▍   | 778/1208 [22:21<12:21,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00167, train/loss_step=0.343, global_step=8046.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  64%|██████▍   | 778/1208 [22:21<12:21,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000479, train/loss_step=0.141, global_step=8046.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  64%|██████▍   | 779/1208 [22:22<12:19,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000479, train/loss_step=0.141, global_step=8046.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  64%|██████▍   | 779/1208 [22:22<12:19,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.449, train/loss_vlb_step=0.00381, train/loss_step=0.449, global_step=8046.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  65%|██████▍   | 780/1208 [22:26<12:18,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.449, train/loss_vlb_step=0.00381, train/loss_step=0.449, global_step=8046.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  65%|██████▍   | 780/1208 [22:26<12:18,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.31e-5, train/loss_step=0.00219, global_step=8046.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  65%|██████▍   | 781/1208 [22:27<12:16,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.31e-5, train/loss_step=0.00219, global_step=8046.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  65%|██████▍   | 781/1208 [22:27<12:16,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000736, train/loss_step=0.203, global_step=8047.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  65%|██████▍   | 782/1208 [22:28<12:14,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000736, train/loss_step=0.203, global_step=8047.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  65%|██████▍   | 782/1208 [22:28<12:14,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00142, train/loss_step=0.309, global_step=8047.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  65%|██████▍   | 783/1208 [22:29<12:12,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00142, train/loss_step=0.309, global_step=8047.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  65%|██████▍   | 783/1208 [22:29<12:12,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.00101, train/loss_step=0.230, global_step=8047.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  65%|██████▍   | 784/1208 [22:32<12:11,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.00101, train/loss_step=0.230, global_step=8047.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  65%|██████▍   | 784/1208 [22:32<12:11,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0093, train/loss_vlb_step=4.19e-5, train/loss_step=0.0093, global_step=8047.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  65%|██████▍   | 785/1208 [22:33<12:09,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0093, train/loss_vlb_step=4.19e-5, train/loss_step=0.0093, global_step=8047.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  65%|██████▍   | 785/1208 [22:33<12:09,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.57e-5, train/loss_step=0.00278, global_step=8048.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  65%|██████▌   | 786/1208 [22:34<12:07,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.57e-5, train/loss_step=0.00278, global_step=8048.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  65%|██████▌   | 786/1208 [22:34<12:07,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00188, train/loss_step=0.346, global_step=8048.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]     Epoch 26:  65%|██████▌   | 787/1208 [22:36<12:05,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00188, train/loss_step=0.346, global_step=8048.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  65%|██████▌   | 787/1208 [22:36<12:05,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000396, train/loss_step=0.120, global_step=8048.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  65%|██████▌   | 788/1208 [22:39<12:04,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000396, train/loss_step=0.120, global_step=8048.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  65%|██████▌   | 788/1208 [22:39<12:04,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=8048.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  65%|██████▌   | 789/1208 [22:40<12:02,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=8048.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  65%|██████▌   | 789/1208 [22:40<12:02,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000536, train/loss_step=0.155, global_step=8049.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  65%|██████▌   | 790/1208 [22:41<12:00,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000536, train/loss_step=0.155, global_step=8049.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  65%|██████▌   | 790/1208 [22:41<12:00,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.55e-5, train/loss_step=0.00278, global_step=8049.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  65%|██████▌   | 791/1208 [22:42<11:58,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.55e-5, train/loss_step=0.00278, global_step=8049.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  65%|██████▌   | 791/1208 [22:42<11:58,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=8049.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  66%|██████▌   | 792/1208 [22:45<11:57,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=8049.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  66%|██████▌   | 792/1208 [22:45<11:57,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0695, train/loss_vlb_step=0.000232, train/loss_step=0.0695, global_step=8049.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  66%|██████▌   | 793/1208 [22:46<11:55,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0695, train/loss_vlb_step=0.000232, train/loss_step=0.0695, global_step=8049.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  66%|██████▌   | 793/1208 [22:46<11:55,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.14e-5, train/loss_step=0.00188, global_step=8050.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  66%|██████▌   | 794/1208 [22:47<11:53,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.14e-5, train/loss_step=0.00188, global_step=8050.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  66%|██████▌   | 794/1208 [22:47<11:53,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000533, train/loss_step=0.155, global_step=8050.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  66%|██████▌   | 795/1208 [22:48<11:51,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000533, train/loss_step=0.155, global_step=8050.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  66%|██████▌   | 795/1208 [22:48<11:51,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00765, train/loss_vlb_step=3.74e-5, train/loss_step=0.00765, global_step=8050.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  66%|██████▌   | 796/1208 [22:52<11:50,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00765, train/loss_vlb_step=3.74e-5, train/loss_step=0.00765, global_step=8050.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  66%|██████▌   | 796/1208 [22:52<11:50,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0593, train/loss_vlb_step=0.000204, train/loss_step=0.0593, global_step=8050.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  66%|██████▌   | 797/1208 [22:53<11:48,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0593, train/loss_vlb_step=0.000204, train/loss_step=0.0593, global_step=8050.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  66%|██████▌   | 797/1208 [22:53<11:48,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0511, train/loss_vlb_step=0.00019, train/loss_step=0.0511, global_step=8051.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  66%|██████▌   | 798/1208 [22:54<11:46,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0511, train/loss_vlb_step=0.00019, train/loss_step=0.0511, global_step=8051.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  66%|██████▌   | 798/1208 [22:54<11:46,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.54e-5, train/loss_step=0.0127, global_step=8051.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  66%|██████▌   | 799/1208 [22:55<11:44,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.54e-5, train/loss_step=0.0127, global_step=8051.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  66%|██████▌   | 799/1208 [22:55<11:44,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.055, train/loss_vlb_step=0.000186, train/loss_step=0.055, global_step=8051.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  66%|██████▌   | 800/1208 [22:58<11:43,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.055, train/loss_vlb_step=0.000186, train/loss_step=0.055, global_step=8051.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  66%|██████▌   | 800/1208 [22:58<11:43,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00141, train/loss_step=0.327, global_step=8051.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  66%|██████▋   | 801/1208 [22:59<11:41,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00141, train/loss_step=0.327, global_step=8051.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  66%|██████▋   | 801/1208 [22:59<11:41,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.6e-5, train/loss_step=0.0215, global_step=8052.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  66%|██████▋   | 802/1208 [23:00<11:39,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.6e-5, train/loss_step=0.0215, global_step=8052.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  66%|██████▋   | 802/1208 [23:00<11:39,  1.72s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.00994, train/loss_vlb_step=4.87e-5, train/loss_step=0.00994, global_step=8052.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  66%|██████▋   | 803/1208 [23:02<11:37,  1.72s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.00994, train/loss_vlb_step=4.87e-5, train/loss_step=0.00994, global_step=8052.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  66%|██████▋   | 803/1208 [23:02<11:37,  1.72s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.47e-5, train/loss_step=0.015, global_step=8052.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  67%|██████▋   | 804/1208 [23:05<11:36,  1.72s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.47e-5, train/loss_step=0.015, global_step=8052.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  67%|██████▋   | 804/1208 [23:05<11:36,  1.72s/it, loss=0.0836, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000143, train/loss_step=0.0392, global_step=8052.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  67%|██████▋   | 805/1208 [23:06<11:34,  1.72s/it, loss=0.0836, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000143, train/loss_step=0.0392, global_step=8052.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  67%|██████▋   | 805/1208 [23:06<11:34,  1.72s/it, loss=0.0918, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000584, train/loss_step=0.169, global_step=8053.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  67%|██████▋   | 806/1208 [23:07<11:31,  1.72s/it, loss=0.0918, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000584, train/loss_step=0.169, global_step=8053.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  67%|██████▋   | 806/1208 [23:07<11:31,  1.72s/it, loss=0.0749, v_num=0, train/loss_simple_step=0.00646, train/loss_vlb_step=3.2e-5, train/loss_step=0.00646, global_step=8053.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  67%|██████▋   | 807/1208 [23:08<11:29,  1.72s/it, loss=0.0749, v_num=0, train/loss_simple_step=0.00646, train/loss_vlb_step=3.2e-5, train/loss_step=0.00646, global_step=8053.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  67%|██████▋   | 807/1208 [23:08<11:29,  1.72s/it, loss=0.0691, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=2.73e-5, train/loss_step=0.00518, global_step=8053.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  67%|██████▋   | 808/1208 [23:11<11:28,  1.72s/it, loss=0.0691, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=2.73e-5, train/loss_step=0.00518, global_step=8053.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  67%|██████▋   | 808/1208 [23:11<11:28,  1.72s/it, loss=0.064, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.48e-5, train/loss_step=0.00265, global_step=8053.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  67%|██████▋   | 809/1208 [23:12<11:26,  1.72s/it, loss=0.064, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.48e-5, train/loss_step=0.00265, global_step=8053.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  67%|██████▋   | 809/1208 [23:12<11:26,  1.72s/it, loss=0.0569, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=5.7e-5, train/loss_step=0.0138, global_step=8054.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  67%|██████▋   | 810/1208 [23:13<11:24,  1.72s/it, loss=0.0569, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=5.7e-5, train/loss_step=0.0138, global_step=8054.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  67%|██████▋   | 810/1208 [23:13<11:24,  1.72s/it, loss=0.0568, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.04e-5, train/loss_step=0.00173, global_step=8054.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  67%|██████▋   | 811/1208 [23:15<11:22,  1.72s/it, loss=0.0568, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.04e-5, train/loss_step=0.00173, global_step=8054.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  67%|██████▋   | 811/1208 [23:15<11:22,  1.72s/it, loss=0.0626, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000873, train/loss_step=0.227, global_step=8054.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  67%|██████▋   | 812/1208 [23:18<11:21,  1.72s/it, loss=0.0626, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000873, train/loss_step=0.227, global_step=8054.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  67%|██████▋   | 812/1208 [23:18<11:21,  1.72s/it, loss=0.0614, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.000171, train/loss_step=0.0468, global_step=8054.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  67%|██████▋   | 813/1208 [23:19<11:19,  1.72s/it, loss=0.0614, v_num=0, train/loss_simple_step=0.0468, train/loss_vlb_step=0.000171, train/loss_step=0.0468, global_step=8054.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  67%|██████▋   | 813/1208 [23:19<11:19,  1.72s/it, loss=0.071, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000697, train/loss_step=0.194, global_step=8055.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  67%|██████▋   | 814/1208 [23:20<11:17,  1.72s/it, loss=0.071, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000697, train/loss_step=0.194, global_step=8055.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  67%|██████▋   | 814/1208 [23:20<11:17,  1.72s/it, loss=0.078, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00156, train/loss_step=0.294, global_step=8055.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  67%|██████▋   | 815/1208 [23:21<11:15,  1.72s/it, loss=0.078, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00156, train/loss_step=0.294, global_step=8055.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  67%|██████▋   | 815/1208 [23:21<11:15,  1.72s/it, loss=0.0892, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000807, train/loss_step=0.233, global_step=8055.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  68%|██████▊   | 816/1208 [23:24<11:14,  1.72s/it, loss=0.0892, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000807, train/loss_step=0.233, global_step=8055.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  68%|██████▊   | 816/1208 [23:24<11:14,  1.72s/it, loss=0.0866, v_num=0, train/loss_simple_step=0.00634, train/loss_vlb_step=3.1e-5, train/loss_step=0.00634, global_step=8055.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  68%|██████▊   | 817/1208 [23:25<11:12,  1.72s/it, loss=0.0866, v_num=0, train/loss_simple_step=0.00634, train/loss_vlb_step=3.1e-5, train/loss_step=0.00634, global_step=8055.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  68%|██████▊   | 817/1208 [23:25<11:12,  1.72s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.00473, train/loss_vlb_step=2.59e-5, train/loss_step=0.00473, global_step=8056.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  68%|██████▊   | 818/1208 [23:27<11:10,  1.72s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.00473, train/loss_vlb_step=2.59e-5, train/loss_step=0.00473, global_step=8056.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  68%|██████▊   | 818/1208 [23:27<11:10,  1.72s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000814, train/loss_step=0.210, global_step=8056.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  68%|██████▊   | 819/1208 [23:28<11:08,  1.72s/it, loss=0.0942, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000814, train/loss_step=0.210, global_step=8056.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  68%|██████▊   | 819/1208 [23:28<11:08,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00172, train/loss_step=0.334, global_step=8056.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  68%|██████▊   | 820/1208 [23:31<11:07,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.00172, train/loss_step=0.334, global_step=8056.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  68%|██████▊   | 820/1208 [23:31<11:07,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00348, train/loss_step=0.420, global_step=8056.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  68%|██████▊   | 821/1208 [23:32<11:05,  1.72s/it, loss=0.113, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00348, train/loss_step=0.420, global_step=8056.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  68%|██████▊   | 821/1208 [23:32<11:05,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000146, train/loss_step=0.0396, global_step=8057.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  68%|██████▊   | 822/1208 [23:33<11:03,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000146, train/loss_step=0.0396, global_step=8057.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  68%|██████▊   | 822/1208 [23:33<11:03,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00867, train/loss_vlb_step=4.2e-5, train/loss_step=0.00867, global_step=8057.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  68%|██████▊   | 823/1208 [23:34<11:01,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00867, train/loss_vlb_step=4.2e-5, train/loss_step=0.00867, global_step=8057.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  68%|██████▊   | 823/1208 [23:34<11:01,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000689, train/loss_step=0.180, global_step=8057.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  68%|██████▊   | 824/1208 [23:37<11:00,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000689, train/loss_step=0.180, global_step=8057.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  68%|██████▊   | 824/1208 [23:37<11:00,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000113, train/loss_step=0.0295, global_step=8057.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  68%|██████▊   | 825/1208 [23:38<10:58,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000113, train/loss_step=0.0295, global_step=8057.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  68%|██████▊   | 825/1208 [23:38<10:58,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00108, train/loss_step=0.251, global_step=8058.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  68%|██████▊   | 826/1208 [23:39<10:56,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00108, train/loss_step=0.251, global_step=8058.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  68%|██████▊   | 826/1208 [23:39<10:56,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000146, train/loss_step=0.0392, global_step=8058.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  68%|██████▊   | 827/1208 [23:41<10:54,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000146, train/loss_step=0.0392, global_step=8058.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  68%|██████▊   | 827/1208 [23:41<10:54,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00981, train/loss_vlb_step=4.63e-5, train/loss_step=0.00981, global_step=8058.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  69%|██████▊   | 828/1208 [23:44<10:53,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00981, train/loss_vlb_step=4.63e-5, train/loss_step=0.00981, global_step=8058.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  69%|██████▊   | 828/1208 [23:44<10:53,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000435, train/loss_step=0.132, global_step=8058.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  69%|██████▊   | 829/1208 [23:45<10:51,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000435, train/loss_step=0.132, global_step=8058.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  69%|██████▊   | 829/1208 [23:45<10:51,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00144, train/loss_step=0.291, global_step=8059.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  69%|██████▊   | 830/1208 [23:46<10:49,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00144, train/loss_step=0.291, global_step=8059.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  69%|██████▊   | 830/1208 [23:46<10:49,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00284, train/loss_step=0.409, global_step=8059.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  69%|██████▉   | 831/1208 [23:47<10:47,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00284, train/loss_step=0.409, global_step=8059.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  69%|██████▉   | 831/1208 [23:47<10:47,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=6.76e-6, train/loss_step=0.00111, global_step=8059.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  69%|██████▉   | 832/1208 [23:50<10:46,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=6.76e-6, train/loss_step=0.00111, global_step=8059.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  69%|██████▉   | 832/1208 [23:50<10:46,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.479, train/loss_vlb_step=0.0108, train/loss_step=0.479, global_step=8059.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]     Epoch 26:  69%|██████▉   | 833/1208 [23:51<10:44,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.479, train/loss_vlb_step=0.0108, train/loss_step=0.479, global_step=8059.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  69%|██████▉   | 833/1208 [23:51<10:44,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000428, train/loss_step=0.126, global_step=8060.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  69%|██████▉   | 834/1208 [23:52<10:42,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000428, train/loss_step=0.126, global_step=8060.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  69%|██████▉   | 834/1208 [23:52<10:42,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00214, train/loss_step=0.369, global_step=8060.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  69%|██████▉   | 835/1208 [23:54<10:40,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00214, train/loss_step=0.369, global_step=8060.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  69%|██████▉   | 835/1208 [23:54<10:40,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00158, train/loss_step=0.325, global_step=8060.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  69%|██████▉   | 836/1208 [23:57<10:39,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00158, train/loss_step=0.325, global_step=8060.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  69%|██████▉   | 836/1208 [23:57<10:39,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=2.18e-5, train/loss_step=0.00375, global_step=8060.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  69%|██████▉   | 837/1208 [23:58<10:37,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=2.18e-5, train/loss_step=0.00375, global_step=8060.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  69%|██████▉   | 837/1208 [23:58<10:37,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0949, train/loss_vlb_step=0.000313, train/loss_step=0.0949, global_step=8061.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  69%|██████▉   | 838/1208 [23:59<10:35,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0949, train/loss_vlb_step=0.000313, train/loss_step=0.0949, global_step=8061.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  69%|██████▉   | 838/1208 [23:59<10:35,  1.72s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0599, train/loss_vlb_step=0.000207, train/loss_step=0.0599, global_step=8061.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  69%|██████▉   | 839/1208 [24:00<10:33,  1.72s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0599, train/loss_vlb_step=0.000207, train/loss_step=0.0599, global_step=8061.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  69%|██████▉   | 839/1208 [24:00<10:33,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00134, train/loss_vlb_step=8.17e-6, train/loss_step=0.00134, global_step=8061.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  70%|██████▉   | 840/1208 [24:03<10:32,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00134, train/loss_vlb_step=8.17e-6, train/loss_step=0.00134, global_step=8061.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  70%|██████▉   | 840/1208 [24:03<10:32,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00114, train/loss_step=0.248, global_step=8061.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  70%|██████▉   | 841/1208 [24:04<10:30,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00114, train/loss_step=0.248, global_step=8061.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  70%|██████▉   | 841/1208 [24:04<10:30,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0684, train/loss_vlb_step=0.000229, train/loss_step=0.0684, global_step=8062.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  70%|██████▉   | 842/1208 [24:05<10:28,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0684, train/loss_vlb_step=0.000229, train/loss_step=0.0684, global_step=8062.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  70%|██████▉   | 842/1208 [24:05<10:28,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000824, train/loss_step=0.221, global_step=8062.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  70%|██████▉   | 843/1208 [24:07<10:26,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000824, train/loss_step=0.221, global_step=8062.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  70%|██████▉   | 843/1208 [24:07<10:26,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0883, train/loss_vlb_step=0.000295, train/loss_step=0.0883, global_step=8062.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  70%|██████▉   | 844/1208 [24:10<10:25,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0883, train/loss_vlb_step=0.000295, train/loss_step=0.0883, global_step=8062.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  70%|██████▉   | 844/1208 [24:10<10:25,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00113, train/loss_step=0.263, global_step=8062.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  70%|██████▉   | 845/1208 [24:11<10:23,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00113, train/loss_step=0.263, global_step=8062.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  70%|██████▉   | 845/1208 [24:11<10:23,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00188, train/loss_step=0.306, global_step=8063.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  70%|███████   | 846/1208 [24:12<10:21,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00188, train/loss_step=0.306, global_step=8063.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  70%|███████   | 846/1208 [24:12<10:21,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.03e-5, train/loss_step=0.0166, global_step=8063.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  70%|███████   | 847/1208 [24:13<10:19,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.03e-5, train/loss_step=0.0166, global_step=8063.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  70%|███████   | 847/1208 [24:13<10:19,  1.72s/it, loss=0.196, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00483, train/loss_step=0.415, global_step=8063.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  70%|███████   | 848/1208 [24:16<10:18,  1.72s/it, loss=0.196, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00483, train/loss_step=0.415, global_step=8063.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  70%|███████   | 848/1208 [24:16<10:18,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.17e-5, train/loss_step=0.00199, global_step=8063.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  70%|███████   | 849/1208 [24:17<10:16,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.17e-5, train/loss_step=0.00199, global_step=8063.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  70%|███████   | 849/1208 [24:17<10:16,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0503, train/loss_vlb_step=0.000174, train/loss_step=0.0503, global_step=8064.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  70%|███████   | 850/1208 [24:19<10:14,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0503, train/loss_vlb_step=0.000174, train/loss_step=0.0503, global_step=8064.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  70%|███████   | 850/1208 [24:19<10:14,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.419, train/loss_vlb_step=0.00355, train/loss_step=0.419, global_step=8064.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  70%|███████   | 851/1208 [24:20<10:12,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.419, train/loss_vlb_step=0.00355, train/loss_step=0.419, global_step=8064.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  70%|███████   | 851/1208 [24:20<10:12,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.79e-5, train/loss_step=0.010, global_step=8064.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  71%|███████   | 852/1208 [24:23<10:11,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.79e-5, train/loss_step=0.010, global_step=8064.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  71%|███████   | 852/1208 [24:23<10:11,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000117, train/loss_step=0.0314, global_step=8064.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  71%|███████   | 853/1208 [24:24<10:09,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000117, train/loss_step=0.0314, global_step=8064.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  71%|███████   | 853/1208 [24:24<10:09,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000143, train/loss_step=0.0372, global_step=8065.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  71%|███████   | 854/1208 [24:25<10:07,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000143, train/loss_step=0.0372, global_step=8065.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  71%|███████   | 854/1208 [24:25<10:07,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000888, train/loss_step=0.233, global_step=8065.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  71%|███████   | 855/1208 [24:26<10:05,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000888, train/loss_step=0.233, global_step=8065.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  71%|███████   | 855/1208 [24:26<10:05,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00285, train/loss_step=0.403, global_step=8065.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  71%|███████   | 856/1208 [24:30<10:04,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00285, train/loss_step=0.403, global_step=8065.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  71%|███████   | 856/1208 [24:30<10:04,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.54e-5, train/loss_step=0.0212, global_step=8065.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  71%|███████   | 857/1208 [24:31<10:02,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.54e-5, train/loss_step=0.0212, global_step=8065.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  71%|███████   | 857/1208 [24:31<10:02,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.35e-5, train/loss_step=0.0177, global_step=8066.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  71%|███████   | 858/1208 [24:32<10:00,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.35e-5, train/loss_step=0.0177, global_step=8066.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  71%|███████   | 858/1208 [24:32<10:00,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0027, train/loss_vlb_step=1.56e-5, train/loss_step=0.0027, global_step=8066.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  71%|███████   | 859/1208 [24:33<09:58,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0027, train/loss_vlb_step=1.56e-5, train/loss_step=0.0027, global_step=8066.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  71%|███████   | 859/1208 [24:33<09:58,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000558, train/loss_step=0.161, global_step=8066.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  71%|███████   | 860/1208 [24:36<09:57,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000558, train/loss_step=0.161, global_step=8066.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  71%|███████   | 860/1208 [24:36<09:57,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.58e-5, train/loss_step=0.0156, global_step=8066.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  71%|███████▏  | 861/1208 [24:37<09:55,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.58e-5, train/loss_step=0.0156, global_step=8066.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  71%|███████▏  | 861/1208 [24:37<09:55,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000147, train/loss_step=0.0406, global_step=8067.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  71%|███████▏  | 862/1208 [24:38<09:53,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000147, train/loss_step=0.0406, global_step=8067.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  71%|███████▏  | 862/1208 [24:38<09:53,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00111, train/loss_step=0.253, global_step=8067.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  71%|███████▏  | 863/1208 [24:39<09:51,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00111, train/loss_step=0.253, global_step=8067.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  71%|███████▏  | 863/1208 [24:39<09:51,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.479, train/loss_vlb_step=0.00678, train/loss_step=0.479, global_step=8067.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  72%|███████▏  | 864/1208 [24:43<09:50,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.479, train/loss_vlb_step=0.00678, train/loss_step=0.479, global_step=8067.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  72%|███████▏  | 864/1208 [24:43<09:50,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.528, train/loss_vlb_step=0.00701, train/loss_step=0.528, global_step=8067.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  72%|███████▏  | 865/1208 [24:44<09:48,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.528, train/loss_vlb_step=0.00701, train/loss_step=0.528, global_step=8067.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  72%|███████▏  | 865/1208 [24:44<09:48,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.0011, train/loss_step=0.237, global_step=8068.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  72%|███████▏  | 866/1208 [24:45<09:46,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.0011, train/loss_step=0.237, global_step=8068.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  72%|███████▏  | 866/1208 [24:45<09:46,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.00017, train/loss_step=0.0476, global_step=8068.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  72%|███████▏  | 867/1208 [24:46<09:44,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.00017, train/loss_step=0.0476, global_step=8068.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  72%|███████▏  | 867/1208 [24:46<09:44,  1.71s/it, loss=0.155, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=8068.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  72%|███████▏  | 868/1208 [24:49<09:43,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=8068.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  72%|███████▏  | 868/1208 [24:49<09:43,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00484, train/loss_vlb_step=2.52e-5, train/loss_step=0.00484, global_step=8068.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  72%|███████▏  | 869/1208 [24:50<09:41,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00484, train/loss_vlb_step=2.52e-5, train/loss_step=0.00484, global_step=8068.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  72%|███████▏  | 869/1208 [24:50<09:41,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000107, train/loss_step=0.0291, global_step=8069.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  72%|███████▏  | 870/1208 [24:51<09:39,  1.71s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000107, train/loss_step=0.0291, global_step=8069.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  72%|███████▏  | 870/1208 [24:51<09:39,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00148, train/loss_step=0.270, global_step=8069.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  72%|███████▏  | 871/1208 [24:52<09:37,  1.71s/it, loss=0.146, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00148, train/loss_step=0.270, global_step=8069.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  72%|███████▏  | 871/1208 [24:52<09:37,  1.71s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0439, train/loss_vlb_step=0.000159, train/loss_step=0.0439, global_step=8069.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  72%|███████▏  | 872/1208 [24:56<09:36,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0439, train/loss_vlb_step=0.000159, train/loss_step=0.0439, global_step=8069.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  72%|███████▏  | 872/1208 [24:56<09:36,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000649, train/loss_step=0.185, global_step=8069.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  72%|███████▏  | 873/1208 [24:57<09:34,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000649, train/loss_step=0.185, global_step=8069.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  72%|███████▏  | 873/1208 [24:57<09:34,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00132, train/loss_step=0.271, global_step=8070.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  72%|███████▏  | 874/1208 [24:58<09:32,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00132, train/loss_step=0.271, global_step=8070.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  72%|███████▏  | 874/1208 [24:58<09:32,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000573, train/loss_step=0.164, global_step=8070.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  72%|███████▏  | 875/1208 [24:59<09:30,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000573, train/loss_step=0.164, global_step=8070.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  72%|███████▏  | 875/1208 [24:59<09:30,  1.71s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000103, train/loss_step=0.0263, global_step=8070.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  73%|███████▎  | 876/1208 [25:02<09:29,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000103, train/loss_step=0.0263, global_step=8070.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  73%|███████▎  | 876/1208 [25:02<09:29,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=1.19e-5, train/loss_step=0.00196, global_step=8070.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  73%|███████▎  | 877/1208 [25:03<09:27,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=1.19e-5, train/loss_step=0.00196, global_step=8070.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  73%|███████▎  | 877/1208 [25:03<09:27,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000248, train/loss_step=0.0741, global_step=8071.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  73%|███████▎  | 878/1208 [25:04<09:25,  1.71s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000248, train/loss_step=0.0741, global_step=8071.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  73%|███████▎  | 878/1208 [25:04<09:25,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0688, train/loss_vlb_step=0.000229, train/loss_step=0.0688, global_step=8071.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  73%|███████▎  | 879/1208 [25:05<09:23,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0688, train/loss_vlb_step=0.000229, train/loss_step=0.0688, global_step=8071.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  73%|███████▎  | 879/1208 [25:05<09:23,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.637, train/loss_vlb_step=0.0238, train/loss_step=0.637, global_step=8071.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  73%|███████▎  | 880/1208 [25:09<09:22,  1.71s/it, loss=0.174, v_num=0, train/loss_simple_step=0.637, train/loss_vlb_step=0.0238, train/loss_step=0.637, global_step=8071.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  73%|███████▎  | 880/1208 [25:09<09:22,  1.71s/it, loss=0.187, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.0012, train/loss_step=0.264, global_step=8071.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  73%|███████▎  | 881/1208 [25:10<09:20,  1.71s/it, loss=0.187, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.0012, train/loss_step=0.264, global_step=8071.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  73%|███████▎  | 881/1208 [25:10<09:20,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0883, train/loss_vlb_step=0.000295, train/loss_step=0.0883, global_step=8072.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  73%|███████▎  | 882/1208 [25:11<09:18,  1.71s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0883, train/loss_vlb_step=0.000295, train/loss_step=0.0883, global_step=8072.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  73%|███████▎  | 882/1208 [25:11<09:18,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0522, train/loss_vlb_step=0.000185, train/loss_step=0.0522, global_step=8072.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  73%|███████▎  | 883/1208 [25:12<09:16,  1.71s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0522, train/loss_vlb_step=0.000185, train/loss_step=0.0522, global_step=8072.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  73%|███████▎  | 883/1208 [25:12<09:16,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.73e-5, train/loss_step=0.0215, global_step=8072.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  73%|███████▎  | 884/1208 [25:15<09:15,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.73e-5, train/loss_step=0.0215, global_step=8072.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  73%|███████▎  | 884/1208 [25:15<09:15,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0927, train/loss_vlb_step=0.000314, train/loss_step=0.0927, global_step=8072.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  73%|███████▎  | 885/1208 [25:16<09:13,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0927, train/loss_vlb_step=0.000314, train/loss_step=0.0927, global_step=8072.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  73%|███████▎  | 885/1208 [25:16<09:13,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00482, train/loss_vlb_step=2.52e-5, train/loss_step=0.00482, global_step=8073.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  73%|███████▎  | 886/1208 [25:17<09:11,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00482, train/loss_vlb_step=2.52e-5, train/loss_step=0.00482, global_step=8073.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  73%|███████▎  | 886/1208 [25:17<09:11,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.00012, train/loss_step=0.033, global_step=8073.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  73%|███████▎  | 887/1208 [25:18<09:09,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.00012, train/loss_step=0.033, global_step=8073.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  73%|███████▎  | 887/1208 [25:18<09:09,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.000165, train/loss_step=0.0462, global_step=8073.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  74%|███████▎  | 888/1208 [25:22<09:08,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.000165, train/loss_step=0.0462, global_step=8073.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  74%|███████▎  | 888/1208 [25:22<09:08,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=1.97e-5, train/loss_step=0.00366, global_step=8073.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  74%|███████▎  | 889/1208 [25:23<09:06,  1.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=1.97e-5, train/loss_step=0.00366, global_step=8073.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  74%|███████▎  | 889/1208 [25:23<09:06,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0916, train/loss_vlb_step=0.000301, train/loss_step=0.0916, global_step=8074.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  74%|███████▎  | 890/1208 [25:24<09:04,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0916, train/loss_vlb_step=0.000301, train/loss_step=0.0916, global_step=8074.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  74%|███████▎  | 890/1208 [25:24<09:04,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.0018, train/loss_step=0.318, global_step=8074.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  74%|███████▍  | 891/1208 [25:25<09:02,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.0018, train/loss_step=0.318, global_step=8074.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  74%|███████▍  | 891/1208 [25:25<09:02,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00642, train/loss_vlb_step=3.33e-5, train/loss_step=0.00642, global_step=8074.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  74%|███████▍  | 892/1208 [25:28<09:01,  1.71s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00642, train/loss_vlb_step=3.33e-5, train/loss_step=0.00642, global_step=8074.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  74%|███████▍  | 892/1208 [25:28<09:01,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00456, train/loss_vlb_step=2.47e-5, train/loss_step=0.00456, global_step=8074.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  74%|███████▍  | 893/1208 [25:29<08:59,  1.71s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00456, train/loss_vlb_step=2.47e-5, train/loss_step=0.00456, global_step=8074.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  74%|███████▍  | 893/1208 [25:29<08:59,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000562, train/loss_step=0.164, global_step=8075.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  74%|███████▍  | 894/1208 [25:30<08:57,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000562, train/loss_step=0.164, global_step=8075.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  74%|███████▍  | 894/1208 [25:30<08:57,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0631, train/loss_vlb_step=0.000209, train/loss_step=0.0631, global_step=8075.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  74%|███████▍  | 895/1208 [25:31<08:55,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0631, train/loss_vlb_step=0.000209, train/loss_step=0.0631, global_step=8075.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  74%|███████▍  | 895/1208 [25:31<08:55,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.531, train/loss_vlb_step=0.0072, train/loss_step=0.531, global_step=8075.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  74%|███████▍  | 896/1208 [25:35<08:54,  1.71s/it, loss=0.128, v_num=0, train/loss_simple_step=0.531, train/loss_vlb_step=0.0072, train/loss_step=0.531, global_step=8075.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  74%|███████▍  | 896/1208 [25:35<08:54,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000513, train/loss_step=0.149, global_step=8075.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  74%|███████▍  | 897/1208 [25:36<08:52,  1.71s/it, loss=0.136, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000513, train/loss_step=0.149, global_step=8075.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  74%|███████▍  | 897/1208 [25:36<08:52,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.92e-5, train/loss_step=0.0216, global_step=8076.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  74%|███████▍  | 898/1208 [25:37<08:50,  1.71s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.92e-5, train/loss_step=0.0216, global_step=8076.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  74%|███████▍  | 898/1208 [25:37<08:50,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.00015, train/loss_step=0.0441, global_step=8076.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  74%|███████▍  | 899/1208 [25:38<08:48,  1.71s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.00015, train/loss_step=0.0441, global_step=8076.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  74%|███████▍  | 899/1208 [25:38<08:48,  1.71s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=1.85e-5, train/loss_step=0.00322, global_step=8076.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  75%|███████▍  | 900/1208 [25:41<08:47,  1.71s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=1.85e-5, train/loss_step=0.00322, global_step=8076.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  75%|███████▍  | 900/1208 [25:41<08:47,  1.71s/it, loss=0.0872, v_num=0, train/loss_simple_step=0.0047, train/loss_vlb_step=2.37e-5, train/loss_step=0.0047, global_step=8076.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.70it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.70it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:29,  1.65it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.76it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:28,  1.68it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:29,  1.61it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.70it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:28,  1.65it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.77it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.72it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:27,  1.68it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:26,  1.72it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:26,  1.70it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.74it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.71it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.74it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.72it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.75it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.72it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.81it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.75it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.75it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.75it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:23,  1.73it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.75it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.74it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.76it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.75it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.76it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.75it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.76it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.73it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.76it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:20,  1.74it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.78it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.78it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.76it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.76it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.76it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.76it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.78it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.75it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.76it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.76it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.75it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.75it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.75it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.76it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.75it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.75it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.76it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.76it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.75it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:16,  1.75it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.78it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.75it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.75it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.75it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.76it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.78it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.75it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.75it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.76it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.76it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.75it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.76it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.76it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.76it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:16<00:12,  1.76it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:16<00:12,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.76it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.77it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.75it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.75it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.78it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]DDIM Sampler:  70%|███████   | 35/50 [00:20<00:08,  1.76it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.78it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.76it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.74it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.75it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.75it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.77it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.78it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.75it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.75it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.78it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.75it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.75it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.78it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.75it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.78it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.74it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:24<00:04,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.75it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.74it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.74it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.78it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.74it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.75it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.74it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.78it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.75it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.75it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.75it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.78it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.75it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.74it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.75it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.75it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.74it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.78it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.75it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:28<00:00,  1.74it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]Epoch 26:  75%|███████▍  | 901/1208 [26:13<08:56,  1.75s/it, loss=0.0872, v_num=0, train/loss_simple_step=0.0047, train/loss_vlb_step=2.37e-5, train/loss_step=0.0047, global_step=8076.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  75%|███████▍  | 901/1208 [26:13<08:56,  1.75s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.55e-5, train/loss_step=0.00265, global_step=8077.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  75%|███████▍  | 902/1208 [26:14<08:54,  1.75s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.55e-5, train/loss_step=0.00265, global_step=8077.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  75%|███████▍  | 902/1208 [26:14<08:54,  1.75s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.0012, train/loss_step=0.259, global_step=8077.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]     Epoch 26:  75%|███████▍  | 903/1208 [26:15<08:52,  1.74s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.0012, train/loss_step=0.259, global_step=8077.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  75%|███████▍  | 903/1208 [26:15<08:52,  1.74s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.0712, train/loss_vlb_step=0.000247, train/loss_step=0.0712, global_step=8077.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  75%|███████▍  | 904/1208 [26:18<08:50,  1.75s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.0712, train/loss_vlb_step=0.000247, train/loss_step=0.0712, global_step=8077.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  75%|███████▍  | 904/1208 [26:18<08:50,  1.75s/it, loss=0.108, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00336, train/loss_step=0.347, global_step=8077.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  75%|███████▍  | 905/1208 [26:19<08:48,  1.75s/it, loss=0.108, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00336, train/loss_step=0.347, global_step=8077.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  75%|███████▍  | 905/1208 [26:19<08:48,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00122, train/loss_step=0.268, global_step=8078.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  75%|███████▌  | 906/1208 [26:20<08:46,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00122, train/loss_step=0.268, global_step=8078.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  75%|███████▌  | 906/1208 [26:20<08:46,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000256, train/loss_step=0.0754, global_step=8078.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  75%|███████▌  | 907/1208 [26:21<08:44,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000256, train/loss_step=0.0754, global_step=8078.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  75%|███████▌  | 907/1208 [26:21<08:44,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00291, train/loss_step=0.392, global_step=8078.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  75%|███████▌  | 908/1208 [26:24<08:43,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00291, train/loss_step=0.392, global_step=8078.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  75%|███████▌  | 908/1208 [26:24<08:43,  1.75s/it, loss=0.148, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000488, train/loss_step=0.144, global_step=8078.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  75%|███████▌  | 909/1208 [26:25<08:41,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000488, train/loss_step=0.144, global_step=8078.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  75%|███████▌  | 909/1208 [26:25<08:41,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.48e-5, train/loss_step=0.00249, global_step=8079.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  75%|███████▌  | 910/1208 [26:27<08:39,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.48e-5, train/loss_step=0.00249, global_step=8079.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  75%|███████▌  | 910/1208 [26:27<08:39,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000519, train/loss_step=0.155, global_step=8079.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  75%|███████▌  | 911/1208 [26:28<08:37,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000519, train/loss_step=0.155, global_step=8079.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  75%|███████▌  | 911/1208 [26:28<08:37,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00719, train/loss_vlb_step=3.48e-5, train/loss_step=0.00719, global_step=8079.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  75%|███████▌  | 912/1208 [26:31<08:36,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00719, train/loss_vlb_step=3.48e-5, train/loss_step=0.00719, global_step=8079.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  75%|███████▌  | 912/1208 [26:31<08:36,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0947, train/loss_vlb_step=0.000311, train/loss_step=0.0947, global_step=8079.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  76%|███████▌  | 913/1208 [26:32<08:34,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0947, train/loss_vlb_step=0.000311, train/loss_step=0.0947, global_step=8079.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  76%|███████▌  | 913/1208 [26:32<08:34,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.0004, train/loss_step=0.122, global_step=8080.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  76%|███████▌  | 914/1208 [26:33<08:32,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.0004, train/loss_step=0.122, global_step=8080.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  76%|███████▌  | 914/1208 [26:33<08:32,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.000108, train/loss_step=0.0276, global_step=8080.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  76%|███████▌  | 915/1208 [26:34<08:30,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.000108, train/loss_step=0.0276, global_step=8080.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  76%|███████▌  | 915/1208 [26:34<08:30,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00136, train/loss_step=0.291, global_step=8080.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  76%|███████▌  | 916/1208 [26:37<08:29,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00136, train/loss_step=0.291, global_step=8080.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  76%|███████▌  | 916/1208 [26:37<08:29,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000425, train/loss_step=0.125, global_step=8080.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  76%|███████▌  | 917/1208 [26:38<08:27,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000425, train/loss_step=0.125, global_step=8080.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  76%|███████▌  | 917/1208 [26:38<08:27,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000167, train/loss_step=0.0443, global_step=8081.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  76%|███████▌  | 918/1208 [26:40<08:25,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000167, train/loss_step=0.0443, global_step=8081.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  76%|███████▌  | 918/1208 [26:40<08:25,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.71e-5, train/loss_step=0.0207, global_step=8081.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  76%|███████▌  | 919/1208 [26:41<08:23,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.71e-5, train/loss_step=0.0207, global_step=8081.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  76%|███████▌  | 919/1208 [26:41<08:23,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0948, train/loss_vlb_step=0.000312, train/loss_step=0.0948, global_step=8081.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  76%|███████▌  | 920/1208 [26:44<08:22,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0948, train/loss_vlb_step=0.000312, train/loss_step=0.0948, global_step=8081.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  76%|███████▌  | 920/1208 [26:44<08:22,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0638, train/loss_vlb_step=0.000215, train/loss_step=0.0638, global_step=8081.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  76%|███████▌  | 921/1208 [26:45<08:20,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0638, train/loss_vlb_step=0.000215, train/loss_step=0.0638, global_step=8081.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  76%|███████▌  | 921/1208 [26:45<08:20,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.000136, train/loss_step=0.0356, global_step=8082.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  76%|███████▋  | 922/1208 [26:46<08:18,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.000136, train/loss_step=0.0356, global_step=8082.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  76%|███████▋  | 922/1208 [26:46<08:18,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000177, train/loss_step=0.051, global_step=8082.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  76%|███████▋  | 923/1208 [26:47<08:16,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000177, train/loss_step=0.051, global_step=8082.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  76%|███████▋  | 923/1208 [26:47<08:16,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000376, train/loss_step=0.114, global_step=8082.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  76%|███████▋  | 924/1208 [26:50<08:15,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000376, train/loss_step=0.114, global_step=8082.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  76%|███████▋  | 924/1208 [26:50<08:15,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=1.98e-5, train/loss_step=0.00368, global_step=8082.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  77%|███████▋  | 925/1208 [26:52<08:13,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=1.98e-5, train/loss_step=0.00368, global_step=8082.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  77%|███████▋  | 925/1208 [26:52<08:13,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00115, train/loss_step=0.269, global_step=8083.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  77%|███████▋  | 926/1208 [26:53<08:11,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00115, train/loss_step=0.269, global_step=8083.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  77%|███████▋  | 926/1208 [26:53<08:11,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.44e-5, train/loss_step=0.0126, global_step=8083.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  77%|███████▋  | 927/1208 [26:54<08:09,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.44e-5, train/loss_step=0.0126, global_step=8083.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  77%|███████▋  | 927/1208 [26:54<08:09,  1.74s/it, loss=0.0918, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000546, train/loss_step=0.157, global_step=8083.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  77%|███████▋  | 928/1208 [26:57<08:08,  1.74s/it, loss=0.0918, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000546, train/loss_step=0.157, global_step=8083.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  77%|███████▋  | 928/1208 [26:57<08:08,  1.74s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.15e-5, train/loss_step=0.0108, global_step=8083.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  77%|███████▋  | 929/1208 [26:58<08:06,  1.74s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.15e-5, train/loss_step=0.0108, global_step=8083.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  77%|███████▋  | 929/1208 [26:58<08:06,  1.74s/it, loss=0.0856, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.66e-5, train/loss_step=0.0125, global_step=8084.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  77%|███████▋  | 930/1208 [26:59<08:04,  1.74s/it, loss=0.0856, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.66e-5, train/loss_step=0.0125, global_step=8084.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  77%|███████▋  | 930/1208 [26:59<08:04,  1.74s/it, loss=0.0793, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000116, train/loss_step=0.0301, global_step=8084.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  77%|███████▋  | 931/1208 [27:00<08:02,  1.74s/it, loss=0.0793, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000116, train/loss_step=0.0301, global_step=8084.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  77%|███████▋  | 931/1208 [27:00<08:02,  1.74s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.00078, train/loss_step=0.225, global_step=8084.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  77%|███████▋  | 932/1208 [27:03<08:00,  1.74s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.00078, train/loss_step=0.225, global_step=8084.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  77%|███████▋  | 932/1208 [27:03<08:00,  1.74s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.31e-5, train/loss_step=0.00423, global_step=8084.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  77%|███████▋  | 933/1208 [27:05<07:58,  1.74s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.31e-5, train/loss_step=0.00423, global_step=8084.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  77%|███████▋  | 933/1208 [27:05<07:58,  1.74s/it, loss=0.0824, v_num=0, train/loss_simple_step=0.056, train/loss_vlb_step=0.000195, train/loss_step=0.056, global_step=8085.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  77%|███████▋  | 934/1208 [27:06<07:57,  1.74s/it, loss=0.0824, v_num=0, train/loss_simple_step=0.056, train/loss_vlb_step=0.000195, train/loss_step=0.056, global_step=8085.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  77%|███████▋  | 934/1208 [27:06<07:57,  1.74s/it, loss=0.0866, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.00037, train/loss_step=0.111, global_step=8085.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  77%|███████▋  | 935/1208 [27:07<07:55,  1.74s/it, loss=0.0866, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.00037, train/loss_step=0.111, global_step=8085.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  77%|███████▋  | 935/1208 [27:07<07:55,  1.74s/it, loss=0.079, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000473, train/loss_step=0.138, global_step=8085.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  77%|███████▋  | 936/1208 [27:10<07:53,  1.74s/it, loss=0.079, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000473, train/loss_step=0.138, global_step=8085.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  77%|███████▋  | 936/1208 [27:10<07:53,  1.74s/it, loss=0.0799, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000491, train/loss_step=0.143, global_step=8085.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  78%|███████▊  | 937/1208 [27:11<07:51,  1.74s/it, loss=0.0799, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000491, train/loss_step=0.143, global_step=8085.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  78%|███████▊  | 937/1208 [27:11<07:51,  1.74s/it, loss=0.0788, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=9.1e-5, train/loss_step=0.0216, global_step=8086.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  78%|███████▊  | 938/1208 [27:12<07:49,  1.74s/it, loss=0.0788, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=9.1e-5, train/loss_step=0.0216, global_step=8086.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  78%|███████▊  | 938/1208 [27:12<07:49,  1.74s/it, loss=0.0891, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.00085, train/loss_step=0.227, global_step=8086.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  78%|███████▊  | 939/1208 [27:13<07:47,  1.74s/it, loss=0.0891, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.00085, train/loss_step=0.227, global_step=8086.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  78%|███████▊  | 939/1208 [27:13<07:47,  1.74s/it, loss=0.0845, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.65e-5, train/loss_step=0.00284, global_step=8086.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  78%|███████▊  | 940/1208 [27:16<07:46,  1.74s/it, loss=0.0845, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.65e-5, train/loss_step=0.00284, global_step=8086.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  78%|███████▊  | 940/1208 [27:16<07:46,  1.74s/it, loss=0.0834, v_num=0, train/loss_simple_step=0.0414, train/loss_vlb_step=0.000159, train/loss_step=0.0414, global_step=8086.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  78%|███████▊  | 941/1208 [27:17<07:44,  1.74s/it, loss=0.0834, v_num=0, train/loss_simple_step=0.0414, train/loss_vlb_step=0.000159, train/loss_step=0.0414, global_step=8086.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  78%|███████▊  | 941/1208 [27:17<07:44,  1.74s/it, loss=0.0819, v_num=0, train/loss_simple_step=0.00551, train/loss_vlb_step=2.85e-5, train/loss_step=0.00551, global_step=8087.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  78%|███████▊  | 942/1208 [27:19<07:42,  1.74s/it, loss=0.0819, v_num=0, train/loss_simple_step=0.00551, train/loss_vlb_step=2.85e-5, train/loss_step=0.00551, global_step=8087.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  78%|███████▊  | 942/1208 [27:19<07:42,  1.74s/it, loss=0.083, v_num=0, train/loss_simple_step=0.0727, train/loss_vlb_step=0.000244, train/loss_step=0.0727, global_step=8087.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  78%|███████▊  | 943/1208 [27:20<07:40,  1.74s/it, loss=0.083, v_num=0, train/loss_simple_step=0.0727, train/loss_vlb_step=0.000244, train/loss_step=0.0727, global_step=8087.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  78%|███████▊  | 943/1208 [27:20<07:40,  1.74s/it, loss=0.088, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000873, train/loss_step=0.215, global_step=8087.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  78%|███████▊  | 944/1208 [27:23<07:39,  1.74s/it, loss=0.088, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000873, train/loss_step=0.215, global_step=8087.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  78%|███████▊  | 944/1208 [27:23<07:39,  1.74s/it, loss=0.0881, v_num=0, train/loss_simple_step=0.005, train/loss_vlb_step=2.61e-5, train/loss_step=0.005, global_step=8087.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  78%|███████▊  | 945/1208 [27:24<07:37,  1.74s/it, loss=0.0881, v_num=0, train/loss_simple_step=0.005, train/loss_vlb_step=2.61e-5, train/loss_step=0.005, global_step=8087.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  78%|███████▊  | 945/1208 [27:24<07:37,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.868, train/loss_vlb_step=0.219, train/loss_step=0.868, global_step=8088.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  78%|███████▊  | 946/1208 [27:25<07:35,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.868, train/loss_vlb_step=0.219, train/loss_step=0.868, global_step=8088.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  78%|███████▊  | 946/1208 [27:25<07:35,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.43e-5, train/loss_step=0.00257, global_step=8088.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  78%|███████▊  | 947/1208 [27:26<07:33,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.43e-5, train/loss_step=0.00257, global_step=8088.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  78%|███████▊  | 947/1208 [27:26<07:33,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000498, train/loss_step=0.145, global_step=8088.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  78%|███████▊  | 948/1208 [27:29<07:32,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000498, train/loss_step=0.145, global_step=8088.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  78%|███████▊  | 948/1208 [27:29<07:32,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00914, train/loss_vlb_step=4.41e-5, train/loss_step=0.00914, global_step=8088.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  79%|███████▊  | 949/1208 [27:31<07:30,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00914, train/loss_vlb_step=4.41e-5, train/loss_step=0.00914, global_step=8088.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  79%|███████▊  | 949/1208 [27:31<07:30,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.00079, train/loss_step=0.206, global_step=8089.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  79%|███████▊  | 950/1208 [27:32<07:28,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.00079, train/loss_step=0.206, global_step=8089.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  79%|███████▊  | 950/1208 [27:32<07:28,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000107, train/loss_step=0.0282, global_step=8089.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  79%|███████▊  | 951/1208 [27:33<07:26,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000107, train/loss_step=0.0282, global_step=8089.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  79%|███████▊  | 951/1208 [27:33<07:26,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00211, train/loss_step=0.342, global_step=8089.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  79%|███████▉  | 952/1208 [27:36<07:25,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00211, train/loss_step=0.342, global_step=8089.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  79%|███████▉  | 952/1208 [27:36<07:25,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000138, train/loss_step=0.0378, global_step=8089.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  79%|███████▉  | 953/1208 [27:37<07:23,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000138, train/loss_step=0.0378, global_step=8089.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  79%|███████▉  | 953/1208 [27:37<07:23,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.53e-5, train/loss_step=0.00273, global_step=8090.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  79%|███████▉  | 954/1208 [27:38<07:21,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.53e-5, train/loss_step=0.00273, global_step=8090.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  79%|███████▉  | 954/1208 [27:38<07:21,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.00017, train/loss_step=0.0482, global_step=8090.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  79%|███████▉  | 955/1208 [27:39<07:19,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.00017, train/loss_step=0.0482, global_step=8090.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  79%|███████▉  | 955/1208 [27:39<07:19,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.00075, train/loss_step=0.186, global_step=8090.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  79%|███████▉  | 956/1208 [27:42<07:18,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.00075, train/loss_step=0.186, global_step=8090.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  79%|███████▉  | 956/1208 [27:42<07:18,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.004, train/loss_vlb_step=2.16e-5, train/loss_step=0.004, global_step=8090.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  79%|███████▉  | 957/1208 [27:43<07:16,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.004, train/loss_vlb_step=2.16e-5, train/loss_step=0.004, global_step=8090.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  79%|███████▉  | 957/1208 [27:43<07:16,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.440, train/loss_vlb_step=0.00381, train/loss_step=0.440, global_step=8091.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  79%|███████▉  | 958/1208 [27:44<07:14,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.440, train/loss_vlb_step=0.00381, train/loss_step=0.440, global_step=8091.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  79%|███████▉  | 958/1208 [27:44<07:14,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00362, train/loss_step=0.427, global_step=8091.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  79%|███████▉  | 959/1208 [27:46<07:12,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00362, train/loss_step=0.427, global_step=8091.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  79%|███████▉  | 959/1208 [27:46<07:12,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.0006, train/loss_step=0.179, global_step=8091.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  79%|███████▉  | 960/1208 [27:49<07:11,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.0006, train/loss_step=0.179, global_step=8091.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  79%|███████▉  | 960/1208 [27:49<07:11,  1.74s/it, loss=0.172, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000809, train/loss_step=0.220, global_step=8091.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  80%|███████▉  | 961/1208 [27:50<07:09,  1.74s/it, loss=0.172, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.000809, train/loss_step=0.220, global_step=8091.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  80%|███████▉  | 961/1208 [27:50<07:09,  1.74s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0562, train/loss_vlb_step=0.000195, train/loss_step=0.0562, global_step=8092.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  80%|███████▉  | 962/1208 [27:51<07:07,  1.74s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0562, train/loss_vlb_step=0.000195, train/loss_step=0.0562, global_step=8092.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  80%|███████▉  | 962/1208 [27:51<07:07,  1.74s/it, loss=0.193, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00276, train/loss_step=0.434, global_step=8092.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  80%|███████▉  | 963/1208 [27:52<07:05,  1.74s/it, loss=0.193, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00276, train/loss_step=0.434, global_step=8092.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  80%|███████▉  | 963/1208 [27:52<07:05,  1.74s/it, loss=0.203, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00391, train/loss_step=0.425, global_step=8092.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  80%|███████▉  | 964/1208 [27:55<07:04,  1.74s/it, loss=0.203, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00391, train/loss_step=0.425, global_step=8092.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  80%|███████▉  | 964/1208 [27:55<07:04,  1.74s/it, loss=0.221, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00211, train/loss_step=0.351, global_step=8092.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  80%|███████▉  | 965/1208 [27:56<07:02,  1.74s/it, loss=0.221, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00211, train/loss_step=0.351, global_step=8092.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  80%|███████▉  | 965/1208 [27:56<07:02,  1.74s/it, loss=0.197, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00335, train/loss_step=0.399, global_step=8093.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  80%|███████▉  | 966/1208 [27:57<07:00,  1.74s/it, loss=0.197, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00335, train/loss_step=0.399, global_step=8093.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  80%|███████▉  | 966/1208 [27:57<07:00,  1.74s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.13e-5, train/loss_step=0.00191, global_step=8093.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  80%|████████  | 967/1208 [27:58<06:58,  1.74s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.13e-5, train/loss_step=0.00191, global_step=8093.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  80%|████████  | 967/1208 [27:58<06:58,  1.74s/it, loss=0.195, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=8093.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  80%|████████  | 968/1208 [28:02<06:57,  1.74s/it, loss=0.195, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=8093.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  80%|████████  | 968/1208 [28:02<06:57,  1.74s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0398, train/loss_vlb_step=0.000145, train/loss_step=0.0398, global_step=8093.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  80%|████████  | 969/1208 [28:03<06:55,  1.74s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0398, train/loss_vlb_step=0.000145, train/loss_step=0.0398, global_step=8093.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  80%|████████  | 969/1208 [28:03<06:55,  1.74s/it, loss=0.187, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=2.39e-5, train/loss_step=0.00448, global_step=8094.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  80%|████████  | 970/1208 [28:04<06:53,  1.74s/it, loss=0.187, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=2.39e-5, train/loss_step=0.00448, global_step=8094.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  80%|████████  | 970/1208 [28:04<06:53,  1.74s/it, loss=0.205, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00311, train/loss_step=0.394, global_step=8094.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  80%|████████  | 971/1208 [28:05<06:51,  1.74s/it, loss=0.205, v_num=0, train/loss_simple_step=0.394, train/loss_vlb_step=0.00311, train/loss_step=0.394, global_step=8094.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  80%|████████  | 971/1208 [28:05<06:51,  1.74s/it, loss=0.197, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000605, train/loss_step=0.172, global_step=8094.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  80%|████████  | 972/1208 [28:08<06:50,  1.74s/it, loss=0.197, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000605, train/loss_step=0.172, global_step=8094.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  80%|████████  | 972/1208 [28:08<06:50,  1.74s/it, loss=0.213, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00227, train/loss_step=0.368, global_step=8094.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  81%|████████  | 973/1208 [28:09<06:48,  1.74s/it, loss=0.213, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00227, train/loss_step=0.368, global_step=8094.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  81%|████████  | 973/1208 [28:09<06:48,  1.74s/it, loss=0.213, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=1.8e-5, train/loss_step=0.00315, global_step=8095.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  81%|████████  | 974/1208 [28:10<06:46,  1.74s/it, loss=0.213, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=1.8e-5, train/loss_step=0.00315, global_step=8095.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  81%|████████  | 974/1208 [28:10<06:46,  1.74s/it, loss=0.22, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000622, train/loss_step=0.176, global_step=8095.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  81%|████████  | 975/1208 [28:11<06:44,  1.74s/it, loss=0.22, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000622, train/loss_step=0.176, global_step=8095.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  81%|████████  | 975/1208 [28:11<06:44,  1.74s/it, loss=0.217, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000457, train/loss_step=0.136, global_step=8095.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  81%|████████  | 976/1208 [28:15<06:42,  1.74s/it, loss=0.217, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000457, train/loss_step=0.136, global_step=8095.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  81%|████████  | 976/1208 [28:15<06:42,  1.74s/it, loss=0.218, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.37e-5, train/loss_step=0.0142, global_step=8095.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  81%|████████  | 977/1208 [28:16<06:41,  1.74s/it, loss=0.218, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.37e-5, train/loss_step=0.0142, global_step=8095.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  81%|████████  | 977/1208 [28:16<06:41,  1.74s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.18e-5, train/loss_step=0.00202, global_step=8096.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  81%|████████  | 978/1208 [28:17<06:39,  1.74s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.18e-5, train/loss_step=0.00202, global_step=8096.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  81%|████████  | 978/1208 [28:17<06:39,  1.74s/it, loss=0.185, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000795, train/loss_step=0.208, global_step=8096.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  81%|████████  | 979/1208 [28:18<06:37,  1.73s/it, loss=0.185, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000795, train/loss_step=0.208, global_step=8096.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  81%|████████  | 979/1208 [28:18<06:37,  1.73s/it, loss=0.185, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000627, train/loss_step=0.185, global_step=8096.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  81%|████████  | 980/1208 [28:21<06:35,  1.74s/it, loss=0.185, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000627, train/loss_step=0.185, global_step=8096.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  81%|████████  | 980/1208 [28:21<06:35,  1.74s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.000147, train/loss_step=0.0413, global_step=8096.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  81%|████████  | 981/1208 [28:22<06:34,  1.74s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.000147, train/loss_step=0.0413, global_step=8096.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  81%|████████  | 981/1208 [28:22<06:34,  1.74s/it, loss=0.197, v_num=0, train/loss_simple_step=0.480, train/loss_vlb_step=0.00664, train/loss_step=0.480, global_step=8097.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  81%|████████▏ | 982/1208 [28:23<06:32,  1.74s/it, loss=0.197, v_num=0, train/loss_simple_step=0.480, train/loss_vlb_step=0.00664, train/loss_step=0.480, global_step=8097.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  81%|████████▏ | 982/1208 [28:23<06:32,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.00038, train/loss_step=0.116, global_step=8097.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  81%|████████▏ | 983/1208 [28:24<06:30,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.00038, train/loss_step=0.116, global_step=8097.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  81%|████████▏ | 983/1208 [28:24<06:30,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0974, train/loss_vlb_step=0.00032, train/loss_step=0.0974, global_step=8097.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  81%|████████▏ | 984/1208 [28:28<06:28,  1.74s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0974, train/loss_vlb_step=0.00032, train/loss_step=0.0974, global_step=8097.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  81%|████████▏ | 984/1208 [28:28<06:28,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.678, train/loss_vlb_step=0.0294, train/loss_step=0.678, global_step=8097.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  82%|████████▏ | 985/1208 [28:29<06:26,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.678, train/loss_vlb_step=0.0294, train/loss_step=0.678, global_step=8097.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  82%|████████▏ | 985/1208 [28:29<06:26,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00889, train/loss_vlb_step=4.26e-5, train/loss_step=0.00889, global_step=8098.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  82%|████████▏ | 986/1208 [28:30<06:25,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00889, train/loss_vlb_step=4.26e-5, train/loss_step=0.00889, global_step=8098.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  82%|████████▏ | 986/1208 [28:30<06:25,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.74e-5, train/loss_step=0.0143, global_step=8098.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  82%|████████▏ | 987/1208 [28:31<06:23,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.74e-5, train/loss_step=0.0143, global_step=8098.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  82%|████████▏ | 987/1208 [28:31<06:23,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.066, train/loss_vlb_step=0.000225, train/loss_step=0.066, global_step=8098.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  82%|████████▏ | 988/1208 [28:34<06:21,  1.74s/it, loss=0.16, v_num=0, train/loss_simple_step=0.066, train/loss_vlb_step=0.000225, train/loss_step=0.066, global_step=8098.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  82%|████████▏ | 988/1208 [28:34<06:21,  1.74s/it, loss=0.168, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000681, train/loss_step=0.196, global_step=8098.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  82%|████████▏ | 989/1208 [28:35<06:19,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000681, train/loss_step=0.196, global_step=8098.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  82%|████████▏ | 989/1208 [28:35<06:19,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0423, train/loss_vlb_step=0.000156, train/loss_step=0.0423, global_step=8099.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  82%|████████▏ | 990/1208 [28:36<06:18,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0423, train/loss_vlb_step=0.000156, train/loss_step=0.0423, global_step=8099.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  82%|████████▏ | 990/1208 [28:36<06:18,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0547, train/loss_vlb_step=0.000192, train/loss_step=0.0547, global_step=8099.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  82%|████████▏ | 991/1208 [28:37<06:16,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0547, train/loss_vlb_step=0.000192, train/loss_step=0.0547, global_step=8099.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  82%|████████▏ | 991/1208 [28:37<06:16,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000886, train/loss_step=0.236, global_step=8099.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  82%|████████▏ | 992/1208 [28:40<06:14,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000886, train/loss_step=0.236, global_step=8099.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  82%|████████▏ | 992/1208 [28:40<06:14,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000514, train/loss_step=0.149, global_step=8099.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  82%|████████▏ | 993/1208 [28:42<06:12,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000514, train/loss_step=0.149, global_step=8099.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  82%|████████▏ | 993/1208 [28:42<06:12,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.000123, train/loss_step=0.032, global_step=8100.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  82%|████████▏ | 994/1208 [28:43<06:10,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.000123, train/loss_step=0.032, global_step=8100.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  82%|████████▏ | 994/1208 [28:43<06:10,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.28e-5, train/loss_step=0.0022, global_step=8100.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  82%|████████▏ | 995/1208 [28:44<06:09,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.28e-5, train/loss_step=0.0022, global_step=8100.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  82%|████████▏ | 995/1208 [28:44<06:09,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.57e-5, train/loss_step=0.0101, global_step=8100.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  82%|████████▏ | 996/1208 [28:47<06:07,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.57e-5, train/loss_step=0.0101, global_step=8100.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  82%|████████▏ | 996/1208 [28:47<06:07,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00205, train/loss_step=0.335, global_step=8100.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  83%|████████▎ | 997/1208 [28:48<06:05,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00205, train/loss_step=0.335, global_step=8100.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  83%|████████▎ | 997/1208 [28:48<06:05,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=8.88e-5, train/loss_step=0.0232, global_step=8101.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  83%|████████▎ | 998/1208 [28:49<06:03,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=8.88e-5, train/loss_step=0.0232, global_step=8101.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  83%|████████▎ | 998/1208 [28:49<06:03,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=9.12e-5, train/loss_step=0.0218, global_step=8101.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  83%|████████▎ | 999/1208 [28:50<06:02,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=9.12e-5, train/loss_step=0.0218, global_step=8101.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  83%|████████▎ | 999/1208 [28:50<06:02,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.1e-5, train/loss_step=0.00394, global_step=8101.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  83%|████████▎ | 1000/1208 [28:53<06:00,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.1e-5, train/loss_step=0.00394, global_step=8101.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  83%|████████▎ | 1000/1208 [28:53<06:00,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=1e-5, train/loss_step=0.00166, global_step=8101.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  83%|████████▎ | 1001/1208 [28:54<05:58,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=1e-5, train/loss_step=0.00166, global_step=8101.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  83%|████████▎ | 1001/1208 [28:54<05:58,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000123, train/loss_step=0.0339, global_step=8102.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  83%|████████▎ | 1002/1208 [28:55<05:56,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000123, train/loss_step=0.0339, global_step=8102.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  83%|████████▎ | 1002/1208 [28:55<05:56,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00796, train/loss_vlb_step=3.85e-5, train/loss_step=0.00796, global_step=8102.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  83%|████████▎ | 1003/1208 [28:57<05:55,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00796, train/loss_vlb_step=3.85e-5, train/loss_step=0.00796, global_step=8102.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  83%|████████▎ | 1003/1208 [28:57<05:55,  1.73s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0906, train/loss_vlb_step=0.000303, train/loss_step=0.0906, global_step=8102.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  83%|████████▎ | 1004/1208 [29:00<05:53,  1.73s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0906, train/loss_vlb_step=0.000303, train/loss_step=0.0906, global_step=8102.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  83%|████████▎ | 1004/1208 [29:00<05:53,  1.73s/it, loss=0.0776, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000784, train/loss_step=0.222, global_step=8102.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  83%|████████▎ | 1005/1208 [29:01<05:51,  1.73s/it, loss=0.0776, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000784, train/loss_step=0.222, global_step=8102.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  83%|████████▎ | 1005/1208 [29:01<05:51,  1.73s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.00062, train/loss_step=0.180, global_step=8103.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  83%|████████▎ | 1006/1208 [29:02<05:49,  1.73s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.00062, train/loss_step=0.180, global_step=8103.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  83%|████████▎ | 1006/1208 [29:02<05:49,  1.73s/it, loss=0.0869, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000116, train/loss_step=0.0296, global_step=8103.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  83%|████████▎ | 1007/1208 [29:03<05:48,  1.73s/it, loss=0.0869, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000116, train/loss_step=0.0296, global_step=8103.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  83%|████████▎ | 1007/1208 [29:03<05:48,  1.73s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000485, train/loss_step=0.146, global_step=8103.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  83%|████████▎ | 1008/1208 [29:06<05:46,  1.73s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000485, train/loss_step=0.146, global_step=8103.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  83%|████████▎ | 1008/1208 [29:06<05:46,  1.73s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.00104, train/loss_step=0.240, global_step=8103.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  84%|████████▎ | 1009/1208 [29:07<05:44,  1.73s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.00104, train/loss_step=0.240, global_step=8103.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  84%|████████▎ | 1009/1208 [29:07<05:44,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.830, train/loss_vlb_step=0.140, train/loss_step=0.830, global_step=8104.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  84%|████████▎ | 1010/1208 [29:08<05:42,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.830, train/loss_vlb_step=0.140, train/loss_step=0.830, global_step=8104.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  84%|████████▎ | 1010/1208 [29:08<05:42,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000941, train/loss_step=0.230, global_step=8104.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  84%|████████▎ | 1011/1208 [29:09<05:40,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000941, train/loss_step=0.230, global_step=8104.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  84%|████████▎ | 1011/1208 [29:09<05:40,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.55e-5, train/loss_step=0.00272, global_step=8104.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  84%|████████▍ | 1012/1208 [29:13<05:39,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.55e-5, train/loss_step=0.00272, global_step=8104.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  84%|████████▍ | 1012/1208 [29:13<05:39,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.41e-5, train/loss_step=0.0177, global_step=8104.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  84%|████████▍ | 1013/1208 [29:14<05:37,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.41e-5, train/loss_step=0.0177, global_step=8104.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  84%|████████▍ | 1013/1208 [29:14<05:37,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000561, train/loss_step=0.167, global_step=8105.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  84%|████████▍ | 1014/1208 [29:15<05:35,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000561, train/loss_step=0.167, global_step=8105.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  84%|████████▍ | 1014/1208 [29:15<05:35,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.34e-5, train/loss_step=0.00236, global_step=8105.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  84%|████████▍ | 1015/1208 [29:16<05:33,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.34e-5, train/loss_step=0.00236, global_step=8105.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  84%|████████▍ | 1015/1208 [29:16<05:33,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00938, train/loss_vlb_step=4.45e-5, train/loss_step=0.00938, global_step=8105.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  84%|████████▍ | 1016/1208 [29:19<05:32,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00938, train/loss_vlb_step=4.45e-5, train/loss_step=0.00938, global_step=8105.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  84%|████████▍ | 1016/1208 [29:19<05:32,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00855, train/loss_vlb_step=4.08e-5, train/loss_step=0.00855, global_step=8105.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  84%|████████▍ | 1017/1208 [29:20<05:30,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00855, train/loss_vlb_step=4.08e-5, train/loss_step=0.00855, global_step=8105.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  84%|████████▍ | 1017/1208 [29:20<05:30,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.49e-5, train/loss_step=0.00265, global_step=8106.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  84%|████████▍ | 1018/1208 [29:21<05:28,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.49e-5, train/loss_step=0.00265, global_step=8106.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  84%|████████▍ | 1018/1208 [29:21<05:28,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000479, train/loss_step=0.145, global_step=8106.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  84%|████████▍ | 1019/1208 [29:22<05:26,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000479, train/loss_step=0.145, global_step=8106.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  84%|████████▍ | 1019/1208 [29:22<05:26,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000101, train/loss_step=0.0255, global_step=8106.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  84%|████████▍ | 1020/1208 [29:26<05:25,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000101, train/loss_step=0.0255, global_step=8106.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  84%|████████▍ | 1020/1208 [29:26<05:25,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000623, train/loss_step=0.186, global_step=8106.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  85%|████████▍ | 1021/1208 [29:27<05:23,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000623, train/loss_step=0.186, global_step=8106.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  85%|████████▍ | 1021/1208 [29:27<05:23,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00164, train/loss_step=0.348, global_step=8107.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  85%|████████▍ | 1022/1208 [29:28<05:21,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00164, train/loss_step=0.348, global_step=8107.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  85%|████████▍ | 1022/1208 [29:28<05:21,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0541, train/loss_vlb_step=0.000187, train/loss_step=0.0541, global_step=8107.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  85%|████████▍ | 1023/1208 [29:29<05:19,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0541, train/loss_vlb_step=0.000187, train/loss_step=0.0541, global_step=8107.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  85%|████████▍ | 1023/1208 [29:29<05:19,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.7e-5, train/loss_step=0.00299, global_step=8107.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  85%|████████▍ | 1024/1208 [29:32<05:18,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.7e-5, train/loss_step=0.00299, global_step=8107.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  85%|████████▍ | 1024/1208 [29:32<05:18,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000109, train/loss_step=0.0272, global_step=8107.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  85%|████████▍ | 1025/1208 [29:33<05:16,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000109, train/loss_step=0.0272, global_step=8107.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  85%|████████▍ | 1025/1208 [29:33<05:16,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.58e-5, train/loss_step=0.0181, global_step=8108.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  85%|████████▍ | 1026/1208 [29:34<05:14,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.58e-5, train/loss_step=0.0181, global_step=8108.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  85%|████████▍ | 1026/1208 [29:34<05:14,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0756, train/loss_vlb_step=0.00025, train/loss_step=0.0756, global_step=8108.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  85%|████████▌ | 1027/1208 [29:35<05:12,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0756, train/loss_vlb_step=0.00025, train/loss_step=0.0756, global_step=8108.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  85%|████████▌ | 1027/1208 [29:35<05:12,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.900, train/loss_vlb_step=0.227, train/loss_step=0.900, global_step=8108.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  85%|████████▌ | 1028/1208 [29:38<05:11,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.900, train/loss_vlb_step=0.227, train/loss_step=0.900, global_step=8108.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  85%|████████▌ | 1028/1208 [29:38<05:11,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000107, train/loss_step=0.0273, global_step=8108.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  85%|████████▌ | 1029/1208 [29:40<05:09,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000107, train/loss_step=0.0273, global_step=8108.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  85%|████████▌ | 1029/1208 [29:40<05:09,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.472, train/loss_vlb_step=0.00549, train/loss_step=0.472, global_step=8109.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  85%|████████▌ | 1030/1208 [29:41<05:07,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.472, train/loss_vlb_step=0.00549, train/loss_step=0.472, global_step=8109.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  85%|████████▌ | 1030/1208 [29:41<05:07,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00811, train/loss_vlb_step=3.88e-5, train/loss_step=0.00811, global_step=8109.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  85%|████████▌ | 1031/1208 [29:42<05:05,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00811, train/loss_vlb_step=3.88e-5, train/loss_step=0.00811, global_step=8109.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  85%|████████▌ | 1031/1208 [29:42<05:05,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0795, train/loss_vlb_step=0.000267, train/loss_step=0.0795, global_step=8109.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  85%|████████▌ | 1032/1208 [29:45<05:04,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0795, train/loss_vlb_step=0.000267, train/loss_step=0.0795, global_step=8109.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  85%|████████▌ | 1032/1208 [29:45<05:04,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=8109.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  86%|████████▌ | 1033/1208 [29:46<05:02,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=8109.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  86%|████████▌ | 1033/1208 [29:46<05:02,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.89e-5, train/loss_step=0.024, global_step=8110.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  86%|████████▌ | 1034/1208 [29:47<05:00,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.89e-5, train/loss_step=0.024, global_step=8110.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  86%|████████▌ | 1034/1208 [29:47<05:00,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000917, train/loss_step=0.232, global_step=8110.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  86%|████████▌ | 1035/1208 [29:48<04:58,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.000917, train/loss_step=0.232, global_step=8110.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  86%|████████▌ | 1035/1208 [29:48<04:58,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000856, train/loss_step=0.237, global_step=8110.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  86%|████████▌ | 1036/1208 [29:51<04:57,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000856, train/loss_step=0.237, global_step=8110.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  86%|████████▌ | 1036/1208 [29:51<04:57,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.13e-5, train/loss_step=0.0235, global_step=8110.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  86%|████████▌ | 1037/1208 [29:52<04:55,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.13e-5, train/loss_step=0.0235, global_step=8110.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  86%|████████▌ | 1037/1208 [29:52<04:55,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000546, train/loss_step=0.160, global_step=8111.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  86%|████████▌ | 1038/1208 [29:54<04:53,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000546, train/loss_step=0.160, global_step=8111.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  86%|████████▌ | 1038/1208 [29:54<04:53,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.43e-5, train/loss_step=0.0148, global_step=8111.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  86%|████████▌ | 1039/1208 [29:55<04:51,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.43e-5, train/loss_step=0.0148, global_step=8111.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  86%|████████▌ | 1039/1208 [29:55<04:51,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00172, train/loss_vlb_step=1.05e-5, train/loss_step=0.00172, global_step=8111.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  86%|████████▌ | 1040/1208 [29:58<04:50,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00172, train/loss_vlb_step=1.05e-5, train/loss_step=0.00172, global_step=8111.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  86%|████████▌ | 1040/1208 [29:58<04:50,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0927, train/loss_vlb_step=0.000309, train/loss_step=0.0927, global_step=8111.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  86%|████████▌ | 1041/1208 [29:59<04:48,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0927, train/loss_vlb_step=0.000309, train/loss_step=0.0927, global_step=8111.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  86%|████████▌ | 1041/1208 [29:59<04:48,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00574, train/loss_vlb_step=2.88e-5, train/loss_step=0.00574, global_step=8112.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  86%|████████▋ | 1042/1208 [30:00<04:46,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00574, train/loss_vlb_step=2.88e-5, train/loss_step=0.00574, global_step=8112.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  86%|████████▋ | 1042/1208 [30:00<04:46,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000534, train/loss_step=0.161, global_step=8112.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  86%|████████▋ | 1043/1208 [30:01<04:45,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000534, train/loss_step=0.161, global_step=8112.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  86%|████████▋ | 1043/1208 [30:01<04:45,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00108, train/loss_step=0.263, global_step=8112.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  86%|████████▋ | 1044/1208 [30:04<04:43,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00108, train/loss_step=0.263, global_step=8112.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  86%|████████▋ | 1044/1208 [30:04<04:43,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00698, train/loss_vlb_step=3.55e-5, train/loss_step=0.00698, global_step=8112.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  87%|████████▋ | 1045/1208 [30:05<04:41,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00698, train/loss_vlb_step=3.55e-5, train/loss_step=0.00698, global_step=8112.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  87%|████████▋ | 1045/1208 [30:05<04:41,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.096, train/loss_vlb_step=0.000319, train/loss_step=0.096, global_step=8113.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  87%|████████▋ | 1046/1208 [30:07<04:39,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.096, train/loss_vlb_step=0.000319, train/loss_step=0.096, global_step=8113.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  87%|████████▋ | 1046/1208 [30:07<04:39,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000493, train/loss_step=0.146, global_step=8113.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  87%|████████▋ | 1047/1208 [30:08<04:38,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000493, train/loss_step=0.146, global_step=8113.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  87%|████████▋ | 1047/1208 [30:08<04:38,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00962, train/loss_vlb_step=4.73e-5, train/loss_step=0.00962, global_step=8113.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  87%|████████▋ | 1048/1208 [30:11<04:36,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00962, train/loss_vlb_step=4.73e-5, train/loss_step=0.00962, global_step=8113.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  87%|████████▋ | 1048/1208 [30:11<04:36,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.0022, train/loss_step=0.342, global_step=8113.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]     Epoch 26:  87%|████████▋ | 1049/1208 [30:12<04:34,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.0022, train/loss_step=0.342, global_step=8113.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  87%|████████▋ | 1049/1208 [30:12<04:34,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.41e-5, train/loss_step=0.0116, global_step=8114.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  87%|████████▋ | 1050/1208 [30:13<04:32,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.41e-5, train/loss_step=0.0116, global_step=8114.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  87%|████████▋ | 1050/1208 [30:13<04:32,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000819, train/loss_step=0.213, global_step=8114.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  87%|████████▋ | 1051/1208 [30:14<04:31,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000819, train/loss_step=0.213, global_step=8114.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  87%|████████▋ | 1051/1208 [30:14<04:31,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00906, train/loss_vlb_step=4.33e-5, train/loss_step=0.00906, global_step=8114.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  87%|████████▋ | 1052/1208 [30:17<04:29,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00906, train/loss_vlb_step=4.33e-5, train/loss_step=0.00906, global_step=8114.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  87%|████████▋ | 1052/1208 [30:17<04:29,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.23e-5, train/loss_step=0.0194, global_step=8114.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  87%|████████▋ | 1053/1208 [30:18<04:27,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.23e-5, train/loss_step=0.0194, global_step=8114.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  87%|████████▋ | 1053/1208 [30:18<04:27,  1.73s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0442, train/loss_vlb_step=0.000159, train/loss_step=0.0442, global_step=8115.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  87%|████████▋ | 1054/1208 [30:20<04:25,  1.73s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0442, train/loss_vlb_step=0.000159, train/loss_step=0.0442, global_step=8115.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  87%|████████▋ | 1054/1208 [30:20<04:25,  1.73s/it, loss=0.0929, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.25e-5, train/loss_step=0.0021, global_step=8115.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  87%|████████▋ | 1055/1208 [30:21<04:24,  1.73s/it, loss=0.0929, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.25e-5, train/loss_step=0.0021, global_step=8115.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  87%|████████▋ | 1055/1208 [30:21<04:24,  1.73s/it, loss=0.0838, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000194, train/loss_step=0.0545, global_step=8115.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  87%|████████▋ | 1056/1208 [30:24<04:22,  1.73s/it, loss=0.0838, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000194, train/loss_step=0.0545, global_step=8115.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  87%|████████▋ | 1056/1208 [30:24<04:22,  1.73s/it, loss=0.0866, v_num=0, train/loss_simple_step=0.0789, train/loss_vlb_step=0.000264, train/loss_step=0.0789, global_step=8115.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  88%|████████▊ | 1057/1208 [30:25<04:20,  1.73s/it, loss=0.0866, v_num=0, train/loss_simple_step=0.0789, train/loss_vlb_step=0.000264, train/loss_step=0.0789, global_step=8115.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  88%|████████▊ | 1057/1208 [30:25<04:20,  1.73s/it, loss=0.0863, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000507, train/loss_step=0.153, global_step=8116.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  88%|████████▊ | 1058/1208 [30:26<04:18,  1.73s/it, loss=0.0863, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000507, train/loss_step=0.153, global_step=8116.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  88%|████████▊ | 1058/1208 [30:26<04:18,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.614, train/loss_vlb_step=0.00831, train/loss_step=0.614, global_step=8116.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  88%|████████▊ | 1059/1208 [30:27<04:17,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.614, train/loss_vlb_step=0.00831, train/loss_step=0.614, global_step=8116.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  88%|████████▊ | 1059/1208 [30:27<04:17,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0957, train/loss_vlb_step=0.000324, train/loss_step=0.0957, global_step=8116.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  88%|████████▊ | 1060/1208 [30:30<04:15,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0957, train/loss_vlb_step=0.000324, train/loss_step=0.0957, global_step=8116.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  88%|████████▊ | 1060/1208 [30:30<04:15,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00486, train/loss_vlb_step=2.48e-5, train/loss_step=0.00486, global_step=8116.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  88%|████████▊ | 1061/1208 [30:31<04:13,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00486, train/loss_vlb_step=2.48e-5, train/loss_step=0.00486, global_step=8116.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  88%|████████▊ | 1061/1208 [30:31<04:13,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00222, train/loss_step=0.357, global_step=8117.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  88%|████████▊ | 1062/1208 [30:32<04:11,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00222, train/loss_step=0.357, global_step=8117.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  88%|████████▊ | 1062/1208 [30:33<04:11,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0515, train/loss_vlb_step=0.000174, train/loss_step=0.0515, global_step=8117.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  88%|████████▊ | 1063/1208 [30:34<04:10,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0515, train/loss_vlb_step=0.000174, train/loss_step=0.0515, global_step=8117.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  88%|████████▊ | 1063/1208 [30:34<04:10,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00155, train/loss_step=0.308, global_step=8117.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  88%|████████▊ | 1064/1208 [30:37<04:08,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00155, train/loss_step=0.308, global_step=8117.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  88%|████████▊ | 1064/1208 [30:37<04:08,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0847, train/loss_vlb_step=0.000284, train/loss_step=0.0847, global_step=8117.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  88%|████████▊ | 1065/1208 [30:38<04:06,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0847, train/loss_vlb_step=0.000284, train/loss_step=0.0847, global_step=8117.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  88%|████████▊ | 1065/1208 [30:38<04:06,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.451, train/loss_vlb_step=0.00324, train/loss_step=0.451, global_step=8118.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  88%|████████▊ | 1066/1208 [30:39<04:05,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.451, train/loss_vlb_step=0.00324, train/loss_step=0.451, global_step=8118.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  88%|████████▊ | 1066/1208 [30:39<04:05,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.07e-5, train/loss_step=0.0113, global_step=8118.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  88%|████████▊ | 1067/1208 [30:40<04:03,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.07e-5, train/loss_step=0.0113, global_step=8118.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  88%|████████▊ | 1067/1208 [30:40<04:03,  1.72s/it, loss=0.165, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00309, train/loss_step=0.385, global_step=8118.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  88%|████████▊ | 1068/1208 [30:43<04:01,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00309, train/loss_step=0.385, global_step=8118.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  88%|████████▊ | 1068/1208 [30:43<04:01,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000613, train/loss_step=0.180, global_step=8118.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  88%|████████▊ | 1069/1208 [30:45<03:59,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000613, train/loss_step=0.180, global_step=8118.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  88%|████████▊ | 1069/1208 [30:45<03:59,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00159, train/loss_step=0.356, global_step=8119.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  89%|████████▊ | 1070/1208 [30:46<03:58,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00159, train/loss_step=0.356, global_step=8119.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  89%|████████▊ | 1070/1208 [30:46<03:58,  1.73s/it, loss=0.185, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00374, train/loss_step=0.447, global_step=8119.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  89%|████████▊ | 1071/1208 [30:47<03:56,  1.72s/it, loss=0.185, v_num=0, train/loss_simple_step=0.447, train/loss_vlb_step=0.00374, train/loss_step=0.447, global_step=8119.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  89%|████████▊ | 1071/1208 [30:47<03:56,  1.72s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.34e-5, train/loss_step=0.0202, global_step=8119.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  89%|████████▊ | 1072/1208 [30:50<03:54,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.34e-5, train/loss_step=0.0202, global_step=8119.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  89%|████████▊ | 1072/1208 [30:50<03:54,  1.73s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.21e-5, train/loss_step=0.00209, global_step=8119.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  89%|████████▉ | 1073/1208 [30:51<03:52,  1.73s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.21e-5, train/loss_step=0.00209, global_step=8119.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  89%|████████▉ | 1073/1208 [30:51<03:52,  1.73s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0974, train/loss_vlb_step=0.000321, train/loss_step=0.0974, global_step=8120.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  89%|████████▉ | 1074/1208 [30:52<03:51,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0974, train/loss_vlb_step=0.000321, train/loss_step=0.0974, global_step=8120.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  89%|████████▉ | 1074/1208 [30:52<03:51,  1.72s/it, loss=0.2, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00102, train/loss_step=0.258, global_step=8120.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]     Epoch 26:  89%|████████▉ | 1075/1208 [30:53<03:49,  1.72s/it, loss=0.2, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00102, train/loss_step=0.258, global_step=8120.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  89%|████████▉ | 1075/1208 [30:53<03:49,  1.72s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.0001, train/loss_step=0.0256, global_step=8120.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  89%|████████▉ | 1076/1208 [30:56<03:47,  1.73s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.0001, train/loss_step=0.0256, global_step=8120.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  89%|████████▉ | 1076/1208 [30:56<03:47,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=8.02e-5, train/loss_step=0.019, global_step=8120.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  89%|████████▉ | 1077/1208 [30:57<03:45,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=8.02e-5, train/loss_step=0.019, global_step=8120.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  89%|████████▉ | 1077/1208 [30:57<03:45,  1.73s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0473, train/loss_vlb_step=0.000171, train/loss_step=0.0473, global_step=8121.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  89%|████████▉ | 1078/1208 [30:59<03:44,  1.72s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0473, train/loss_vlb_step=0.000171, train/loss_step=0.0473, global_step=8121.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  89%|████████▉ | 1078/1208 [30:59<03:44,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.84e-5, train/loss_step=0.0103, global_step=8121.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  89%|████████▉ | 1079/1208 [31:00<03:42,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.84e-5, train/loss_step=0.0103, global_step=8121.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  89%|████████▉ | 1079/1208 [31:00<03:42,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.48e-5, train/loss_step=0.0152, global_step=8121.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  89%|████████▉ | 1080/1208 [31:03<03:40,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.48e-5, train/loss_step=0.0152, global_step=8121.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  89%|████████▉ | 1080/1208 [31:03<03:40,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0331, train/loss_vlb_step=0.000128, train/loss_step=0.0331, global_step=8121.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  89%|████████▉ | 1081/1208 [31:04<03:39,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0331, train/loss_vlb_step=0.000128, train/loss_step=0.0331, global_step=8121.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  89%|████████▉ | 1081/1208 [31:04<03:39,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00194, train/loss_step=0.318, global_step=8122.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  90%|████████▉ | 1082/1208 [31:05<03:37,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00194, train/loss_step=0.318, global_step=8122.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  90%|████████▉ | 1082/1208 [31:05<03:37,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00527, train/loss_vlb_step=2.81e-5, train/loss_step=0.00527, global_step=8122.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  90%|████████▉ | 1083/1208 [31:06<03:35,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00527, train/loss_vlb_step=2.81e-5, train/loss_step=0.00527, global_step=8122.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  90%|████████▉ | 1083/1208 [31:06<03:35,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.000133, train/loss_step=0.0356, global_step=8122.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  90%|████████▉ | 1084/1208 [31:09<03:33,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.000133, train/loss_step=0.0356, global_step=8122.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  90%|████████▉ | 1084/1208 [31:09<03:33,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.504, train/loss_vlb_step=0.00983, train/loss_step=0.504, global_step=8122.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  90%|████████▉ | 1085/1208 [31:10<03:32,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.504, train/loss_vlb_step=0.00983, train/loss_step=0.504, global_step=8122.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  90%|████████▉ | 1085/1208 [31:10<03:32,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00755, train/loss_vlb_step=3.86e-5, train/loss_step=0.00755, global_step=8123.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  90%|████████▉ | 1086/1208 [31:11<03:30,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00755, train/loss_vlb_step=3.86e-5, train/loss_step=0.00755, global_step=8123.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  90%|████████▉ | 1086/1208 [31:11<03:30,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0989, train/loss_vlb_step=0.000325, train/loss_step=0.0989, global_step=8123.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  90%|████████▉ | 1087/1208 [31:12<03:28,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0989, train/loss_vlb_step=0.000325, train/loss_step=0.0989, global_step=8123.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  90%|████████▉ | 1087/1208 [31:12<03:28,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000873, train/loss_step=0.231, global_step=8123.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  90%|█████████ | 1088/1208 [31:16<03:26,  1.72s/it, loss=0.136, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000873, train/loss_step=0.231, global_step=8123.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  90%|█████████ | 1088/1208 [31:16<03:26,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000882, train/loss_step=0.233, global_step=8123.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  90%|█████████ | 1089/1208 [31:17<03:25,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000882, train/loss_step=0.233, global_step=8123.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  90%|█████████ | 1089/1208 [31:17<03:25,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0758, train/loss_vlb_step=0.000253, train/loss_step=0.0758, global_step=8124.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  90%|█████████ | 1090/1208 [31:18<03:23,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0758, train/loss_vlb_step=0.000253, train/loss_step=0.0758, global_step=8124.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  90%|█████████ | 1090/1208 [31:18<03:23,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.29e-5, train/loss_step=0.00216, global_step=8124.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  90%|█████████ | 1091/1208 [31:19<03:21,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.29e-5, train/loss_step=0.00216, global_step=8124.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  90%|█████████ | 1091/1208 [31:19<03:21,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.42e-5, train/loss_step=0.00236, global_step=8124.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  90%|█████████ | 1092/1208 [31:22<03:19,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.42e-5, train/loss_step=0.00236, global_step=8124.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  90%|█████████ | 1092/1208 [31:22<03:19,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00448, train/loss_step=0.399, global_step=8124.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  90%|█████████ | 1093/1208 [31:23<03:18,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.399, train/loss_vlb_step=0.00448, train/loss_step=0.399, global_step=8124.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  90%|█████████ | 1093/1208 [31:23<03:18,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.83e-5, train/loss_step=0.0216, global_step=8125.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  91%|█████████ | 1094/1208 [31:24<03:16,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.83e-5, train/loss_step=0.0216, global_step=8125.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  91%|█████████ | 1094/1208 [31:24<03:16,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000136, train/loss_step=0.0373, global_step=8125.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  91%|█████████ | 1095/1208 [31:25<03:14,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000136, train/loss_step=0.0373, global_step=8125.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  91%|█████████ | 1095/1208 [31:25<03:14,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00123, train/loss_step=0.251, global_step=8125.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  91%|█████████ | 1096/1208 [31:29<03:13,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00123, train/loss_step=0.251, global_step=8125.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  91%|█████████ | 1096/1208 [31:29<03:13,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.503, train/loss_vlb_step=0.00607, train/loss_step=0.503, global_step=8125.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  91%|█████████ | 1097/1208 [31:30<03:11,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.503, train/loss_vlb_step=0.00607, train/loss_step=0.503, global_step=8125.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  91%|█████████ | 1097/1208 [31:30<03:11,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.473, train/loss_vlb_step=0.00541, train/loss_step=0.473, global_step=8126.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  91%|█████████ | 1098/1208 [31:31<03:09,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.473, train/loss_vlb_step=0.00541, train/loss_step=0.473, global_step=8126.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  91%|█████████ | 1098/1208 [31:31<03:09,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000831, train/loss_step=0.225, global_step=8126.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  91%|█████████ | 1099/1208 [31:32<03:07,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000831, train/loss_step=0.225, global_step=8126.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  91%|█████████ | 1099/1208 [31:32<03:07,  1.72s/it, loss=0.202, v_num=0, train/loss_simple_step=0.577, train/loss_vlb_step=0.0116, train/loss_step=0.577, global_step=8126.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  91%|█████████ | 1100/1208 [31:35<03:06,  1.72s/it, loss=0.202, v_num=0, train/loss_simple_step=0.577, train/loss_vlb_step=0.0116, train/loss_step=0.577, global_step=8126.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  91%|█████████ | 1100/1208 [31:35<03:06,  1.72s/it, loss=0.219, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00263, train/loss_step=0.376, global_step=8126.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  91%|█████████ | 1101/1208 [31:36<03:04,  1.72s/it, loss=0.219, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00263, train/loss_step=0.376, global_step=8126.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  91%|█████████ | 1101/1208 [31:36<03:04,  1.72s/it, loss=0.218, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00133, train/loss_step=0.297, global_step=8127.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  91%|█████████ | 1102/1208 [31:37<03:02,  1.72s/it, loss=0.218, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00133, train/loss_step=0.297, global_step=8127.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  91%|█████████ | 1102/1208 [31:37<03:02,  1.72s/it, loss=0.218, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.65e-5, train/loss_step=0.0161, global_step=8127.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  91%|█████████▏| 1103/1208 [31:38<03:00,  1.72s/it, loss=0.218, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.65e-5, train/loss_step=0.0161, global_step=8127.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  91%|█████████▏| 1103/1208 [31:38<03:00,  1.72s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.79e-5, train/loss_step=0.0132, global_step=8127.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  91%|█████████▏| 1104/1208 [31:42<02:59,  1.72s/it, loss=0.217, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.79e-5, train/loss_step=0.0132, global_step=8127.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  91%|█████████▏| 1104/1208 [31:42<02:59,  1.72s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=1.92e-5, train/loss_step=0.00356, global_step=8127.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  91%|█████████▏| 1105/1208 [31:43<02:57,  1.72s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=1.92e-5, train/loss_step=0.00356, global_step=8127.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  91%|█████████▏| 1105/1208 [31:43<02:57,  1.72s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0592, train/loss_vlb_step=0.000202, train/loss_step=0.0592, global_step=8128.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  92%|█████████▏| 1106/1208 [31:44<02:55,  1.72s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0592, train/loss_vlb_step=0.000202, train/loss_step=0.0592, global_step=8128.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  92%|█████████▏| 1106/1208 [31:44<02:55,  1.72s/it, loss=0.206, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00162, train/loss_step=0.320, global_step=8128.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  92%|█████████▏| 1107/1208 [31:45<02:53,  1.72s/it, loss=0.206, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00162, train/loss_step=0.320, global_step=8128.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  92%|█████████▏| 1107/1208 [31:45<02:53,  1.72s/it, loss=0.206, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00103, train/loss_step=0.243, global_step=8128.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  92%|█████████▏| 1108/1208 [31:48<02:52,  1.72s/it, loss=0.206, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00103, train/loss_step=0.243, global_step=8128.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  92%|█████████▏| 1108/1208 [31:48<02:52,  1.72s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0553, train/loss_vlb_step=0.000194, train/loss_step=0.0553, global_step=8128.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  92%|█████████▏| 1109/1208 [31:49<02:50,  1.72s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0553, train/loss_vlb_step=0.000194, train/loss_step=0.0553, global_step=8128.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  92%|█████████▏| 1109/1208 [31:49<02:50,  1.72s/it, loss=0.199, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=8129.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  92%|█████████▏| 1110/1208 [31:50<02:48,  1.72s/it, loss=0.199, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000366, train/loss_step=0.111, global_step=8129.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  92%|█████████▏| 1110/1208 [31:50<02:48,  1.72s/it, loss=0.22, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00327, train/loss_step=0.420, global_step=8129.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  92%|█████████▏| 1111/1208 [31:51<02:46,  1.72s/it, loss=0.22, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00327, train/loss_step=0.420, global_step=8129.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  92%|█████████▏| 1111/1208 [31:51<02:46,  1.72s/it, loss=0.221, v_num=0, train/loss_simple_step=0.00842, train/loss_vlb_step=4.17e-5, train/loss_step=0.00842, global_step=8129.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  92%|█████████▏| 1112/1208 [31:55<02:45,  1.72s/it, loss=0.221, v_num=0, train/loss_simple_step=0.00842, train/loss_vlb_step=4.17e-5, train/loss_step=0.00842, global_step=8129.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  92%|█████████▏| 1112/1208 [31:55<02:45,  1.72s/it, loss=0.222, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00426, train/loss_step=0.428, global_step=8129.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  92%|█████████▏| 1113/1208 [31:56<02:43,  1.72s/it, loss=0.222, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00426, train/loss_step=0.428, global_step=8129.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  92%|█████████▏| 1113/1208 [31:56<02:43,  1.72s/it, loss=0.225, v_num=0, train/loss_simple_step=0.0779, train/loss_vlb_step=0.000257, train/loss_step=0.0779, global_step=8130.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  92%|█████████▏| 1114/1208 [31:57<02:41,  1.72s/it, loss=0.225, v_num=0, train/loss_simple_step=0.0779, train/loss_vlb_step=0.000257, train/loss_step=0.0779, global_step=8130.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  92%|█████████▏| 1114/1208 [31:57<02:41,  1.72s/it, loss=0.225, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000123, train/loss_step=0.0333, global_step=8130.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  92%|█████████▏| 1115/1208 [31:58<02:40,  1.72s/it, loss=0.225, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000123, train/loss_step=0.0333, global_step=8130.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  92%|█████████▏| 1115/1208 [31:58<02:40,  1.72s/it, loss=0.216, v_num=0, train/loss_simple_step=0.0858, train/loss_vlb_step=0.000282, train/loss_step=0.0858, global_step=8130.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  92%|█████████▏| 1116/1208 [32:01<02:38,  1.72s/it, loss=0.216, v_num=0, train/loss_simple_step=0.0858, train/loss_vlb_step=0.000282, train/loss_step=0.0858, global_step=8130.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  92%|█████████▏| 1116/1208 [32:01<02:38,  1.72s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0885, train/loss_vlb_step=0.000292, train/loss_step=0.0885, global_step=8130.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  92%|█████████▏| 1117/1208 [32:02<02:36,  1.72s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0885, train/loss_vlb_step=0.000292, train/loss_step=0.0885, global_step=8130.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  92%|█████████▏| 1117/1208 [32:02<02:36,  1.72s/it, loss=0.196, v_num=0, train/loss_simple_step=0.473, train/loss_vlb_step=0.00373, train/loss_step=0.473, global_step=8131.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  93%|█████████▎| 1118/1208 [32:03<02:34,  1.72s/it, loss=0.196, v_num=0, train/loss_simple_step=0.473, train/loss_vlb_step=0.00373, train/loss_step=0.473, global_step=8131.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  93%|█████████▎| 1118/1208 [32:03<02:34,  1.72s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.86e-5, train/loss_step=0.0187, global_step=8131.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  93%|█████████▎| 1119/1208 [32:04<02:33,  1.72s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.86e-5, train/loss_step=0.0187, global_step=8131.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  93%|█████████▎| 1119/1208 [32:04<02:33,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00202, train/loss_step=0.311, global_step=8131.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  93%|█████████▎| 1120/1208 [32:08<02:31,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00202, train/loss_step=0.311, global_step=8131.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  93%|█████████▎| 1120/1208 [32:08<02:31,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00555, train/loss_vlb_step=2.96e-5, train/loss_step=0.00555, global_step=8131.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  93%|█████████▎| 1121/1208 [32:09<02:29,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00555, train/loss_vlb_step=2.96e-5, train/loss_step=0.00555, global_step=8131.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  93%|█████████▎| 1121/1208 [32:09<02:29,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00145, train/loss_step=0.278, global_step=8132.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  93%|█████████▎| 1122/1208 [32:10<02:27,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00145, train/loss_step=0.278, global_step=8132.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  93%|█████████▎| 1122/1208 [32:10<02:27,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00391, train/loss_vlb_step=2.17e-5, train/loss_step=0.00391, global_step=8132.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  93%|█████████▎| 1123/1208 [32:11<02:26,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00391, train/loss_vlb_step=2.17e-5, train/loss_step=0.00391, global_step=8132.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  93%|█████████▎| 1123/1208 [32:11<02:26,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0793, train/loss_vlb_step=0.000273, train/loss_step=0.0793, global_step=8132.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  93%|█████████▎| 1124/1208 [32:14<02:24,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0793, train/loss_vlb_step=0.000273, train/loss_step=0.0793, global_step=8132.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  93%|█████████▎| 1124/1208 [32:14<02:24,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0516, train/loss_vlb_step=0.000184, train/loss_step=0.0516, global_step=8132.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  93%|█████████▎| 1125/1208 [32:15<02:22,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0516, train/loss_vlb_step=0.000184, train/loss_step=0.0516, global_step=8132.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  93%|█████████▎| 1125/1208 [32:15<02:22,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000662, train/loss_step=0.179, global_step=8133.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  93%|█████████▎| 1126/1208 [32:16<02:21,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000662, train/loss_step=0.179, global_step=8133.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  93%|█████████▎| 1126/1208 [32:16<02:21,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.5e-5, train/loss_step=0.00254, global_step=8133.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  93%|█████████▎| 1127/1208 [32:17<02:19,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.5e-5, train/loss_step=0.00254, global_step=8133.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  93%|█████████▎| 1127/1208 [32:17<02:19,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0871, train/loss_vlb_step=0.000289, train/loss_step=0.0871, global_step=8133.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  93%|█████████▎| 1128/1208 [32:20<02:17,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0871, train/loss_vlb_step=0.000289, train/loss_step=0.0871, global_step=8133.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  93%|█████████▎| 1128/1208 [32:20<02:17,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.43e-5, train/loss_step=0.0108, global_step=8133.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  93%|█████████▎| 1129/1208 [32:22<02:15,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.43e-5, train/loss_step=0.0108, global_step=8133.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  93%|█████████▎| 1129/1208 [32:22<02:15,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.54e-5, train/loss_step=0.0146, global_step=8134.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  94%|█████████▎| 1130/1208 [32:23<02:14,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.54e-5, train/loss_step=0.0146, global_step=8134.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  94%|█████████▎| 1130/1208 [32:23<02:14,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0436, train/loss_vlb_step=0.000152, train/loss_step=0.0436, global_step=8134.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  94%|█████████▎| 1131/1208 [32:24<02:12,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0436, train/loss_vlb_step=0.000152, train/loss_step=0.0436, global_step=8134.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  94%|█████████▎| 1131/1208 [32:24<02:12,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00784, train/loss_vlb_step=3.85e-5, train/loss_step=0.00784, global_step=8134.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  94%|█████████▎| 1132/1208 [32:27<02:10,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00784, train/loss_vlb_step=3.85e-5, train/loss_step=0.00784, global_step=8134.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  94%|█████████▎| 1132/1208 [32:27<02:10,  1.72s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=7.99e-5, train/loss_step=0.020, global_step=8134.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  94%|█████████▍| 1133/1208 [32:28<02:08,  1.72s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=7.99e-5, train/loss_step=0.020, global_step=8134.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  94%|█████████▍| 1133/1208 [32:28<02:08,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000802, train/loss_step=0.212, global_step=8135.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  94%|█████████▍| 1134/1208 [32:29<02:07,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000802, train/loss_step=0.212, global_step=8135.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  94%|█████████▍| 1134/1208 [32:29<02:07,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.704, train/loss_vlb_step=0.0172, train/loss_step=0.704, global_step=8135.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  94%|█████████▍| 1135/1208 [32:30<02:05,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.704, train/loss_vlb_step=0.0172, train/loss_step=0.704, global_step=8135.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  94%|█████████▍| 1135/1208 [32:30<02:05,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.818, train/loss_vlb_step=0.138, train/loss_step=0.818, global_step=8135.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  94%|█████████▍| 1136/1208 [32:33<02:03,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.818, train/loss_vlb_step=0.138, train/loss_step=0.818, global_step=8135.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  94%|█████████▍| 1136/1208 [32:33<02:03,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0771, train/loss_vlb_step=0.000261, train/loss_step=0.0771, global_step=8135.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  94%|█████████▍| 1137/1208 [32:34<02:02,  1.72s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0771, train/loss_vlb_step=0.000261, train/loss_step=0.0771, global_step=8135.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  94%|█████████▍| 1137/1208 [32:34<02:02,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0768, train/loss_vlb_step=0.000261, train/loss_step=0.0768, global_step=8136.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  94%|█████████▍| 1138/1208 [32:36<02:00,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0768, train/loss_vlb_step=0.000261, train/loss_step=0.0768, global_step=8136.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  94%|█████████▍| 1138/1208 [32:36<02:00,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000657, train/loss_step=0.190, global_step=8136.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  94%|█████████▍| 1139/1208 [32:37<01:58,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000657, train/loss_step=0.190, global_step=8136.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  94%|█████████▍| 1139/1208 [32:37<01:58,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00369, train/loss_vlb_step=2.01e-5, train/loss_step=0.00369, global_step=8136.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  94%|█████████▍| 1140/1208 [32:40<01:56,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00369, train/loss_vlb_step=2.01e-5, train/loss_step=0.00369, global_step=8136.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  94%|█████████▍| 1140/1208 [32:40<01:56,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00593, train/loss_vlb_step=2.97e-5, train/loss_step=0.00593, global_step=8136.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  94%|█████████▍| 1141/1208 [32:41<01:55,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00593, train/loss_vlb_step=2.97e-5, train/loss_step=0.00593, global_step=8136.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  94%|█████████▍| 1141/1208 [32:41<01:55,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00307, train/loss_vlb_step=1.67e-5, train/loss_step=0.00307, global_step=8137.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  95%|█████████▍| 1142/1208 [32:42<01:53,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00307, train/loss_vlb_step=1.67e-5, train/loss_step=0.00307, global_step=8137.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  95%|█████████▍| 1142/1208 [32:42<01:53,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=8137.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  95%|█████████▍| 1143/1208 [32:43<01:51,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=8137.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  95%|█████████▍| 1143/1208 [32:43<01:51,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0397, train/loss_vlb_step=0.000143, train/loss_step=0.0397, global_step=8137.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  95%|█████████▍| 1144/1208 [32:46<01:50,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0397, train/loss_vlb_step=0.000143, train/loss_step=0.0397, global_step=8137.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  95%|█████████▍| 1144/1208 [32:46<01:50,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.777, train/loss_vlb_step=0.0569, train/loss_step=0.777, global_step=8137.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  95%|█████████▍| 1145/1208 [32:47<01:48,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.777, train/loss_vlb_step=0.0569, train/loss_step=0.777, global_step=8137.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  95%|█████████▍| 1145/1208 [32:47<01:48,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.000168, train/loss_step=0.0476, global_step=8138.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  95%|█████████▍| 1146/1208 [32:48<01:46,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.000168, train/loss_step=0.0476, global_step=8138.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  95%|█████████▍| 1146/1208 [32:48<01:46,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000361, train/loss_step=0.110, global_step=8138.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  95%|█████████▍| 1147/1208 [32:49<01:44,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000361, train/loss_step=0.110, global_step=8138.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  95%|█████████▍| 1147/1208 [32:49<01:44,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.74e-5, train/loss_step=0.0154, global_step=8138.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  95%|█████████▌| 1148/1208 [32:53<01:43,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.74e-5, train/loss_step=0.0154, global_step=8138.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  95%|█████████▌| 1148/1208 [32:53<01:43,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0826, train/loss_vlb_step=0.000273, train/loss_step=0.0826, global_step=8138.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  95%|█████████▌| 1149/1208 [32:54<01:41,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0826, train/loss_vlb_step=0.000273, train/loss_step=0.0826, global_step=8138.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  95%|█████████▌| 1149/1208 [32:54<01:41,  1.72s/it, loss=0.194, v_num=0, train/loss_simple_step=0.552, train/loss_vlb_step=0.00954, train/loss_step=0.552, global_step=8139.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  95%|█████████▌| 1150/1208 [32:55<01:39,  1.72s/it, loss=0.194, v_num=0, train/loss_simple_step=0.552, train/loss_vlb_step=0.00954, train/loss_step=0.552, global_step=8139.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  95%|█████████▌| 1150/1208 [32:55<01:39,  1.72s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000168, train/loss_step=0.0478, global_step=8139.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  95%|█████████▌| 1151/1208 [32:56<01:37,  1.72s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000168, train/loss_step=0.0478, global_step=8139.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  95%|█████████▌| 1151/1208 [32:56<01:37,  1.72s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.00011, train/loss_step=0.0277, global_step=8139.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  95%|█████████▌| 1152/1208 [32:59<01:36,  1.72s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.00011, train/loss_step=0.0277, global_step=8139.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  95%|█████████▌| 1152/1208 [32:59<01:36,  1.72s/it, loss=0.204, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000626, train/loss_step=0.179, global_step=8139.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  95%|█████████▌| 1153/1208 [33:00<01:34,  1.72s/it, loss=0.204, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000626, train/loss_step=0.179, global_step=8139.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  95%|█████████▌| 1153/1208 [33:00<01:34,  1.72s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0881, train/loss_vlb_step=0.00029, train/loss_step=0.0881, global_step=8140.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  96%|█████████▌| 1154/1208 [33:01<01:32,  1.72s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0881, train/loss_vlb_step=0.00029, train/loss_step=0.0881, global_step=8140.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  96%|█████████▌| 1154/1208 [33:01<01:32,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0099, train/loss_vlb_step=4.55e-5, train/loss_step=0.0099, global_step=8140.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  96%|█████████▌| 1155/1208 [33:02<01:30,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0099, train/loss_vlb_step=4.55e-5, train/loss_step=0.0099, global_step=8140.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  96%|█████████▌| 1155/1208 [33:02<01:30,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00208, train/loss_step=0.339, global_step=8140.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  96%|█████████▌| 1156/1208 [33:06<01:29,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.00208, train/loss_step=0.339, global_step=8140.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  96%|█████████▌| 1156/1208 [33:06<01:29,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.416, train/loss_vlb_step=0.00313, train/loss_step=0.416, global_step=8140.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  96%|█████████▌| 1157/1208 [33:07<01:27,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.416, train/loss_vlb_step=0.00313, train/loss_step=0.416, global_step=8140.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  96%|█████████▌| 1157/1208 [33:07<01:27,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.01e-5, train/loss_step=0.0112, global_step=8141.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  96%|█████████▌| 1158/1208 [33:08<01:25,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.01e-5, train/loss_step=0.0112, global_step=8141.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  96%|█████████▌| 1158/1208 [33:08<01:25,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000254, train/loss_step=0.0754, global_step=8141.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  96%|█████████▌| 1159/1208 [33:09<01:24,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000254, train/loss_step=0.0754, global_step=8141.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  96%|█████████▌| 1159/1208 [33:09<01:24,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000645, train/loss_step=0.178, global_step=8141.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  96%|█████████▌| 1160/1208 [33:12<01:22,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000645, train/loss_step=0.178, global_step=8141.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  96%|█████████▌| 1160/1208 [33:12<01:22,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00165, train/loss_step=0.320, global_step=8141.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  96%|█████████▌| 1161/1208 [33:13<01:20,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.00165, train/loss_step=0.320, global_step=8141.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  96%|█████████▌| 1161/1208 [33:13<01:20,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0871, train/loss_vlb_step=0.000286, train/loss_step=0.0871, global_step=8142.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  96%|█████████▌| 1162/1208 [33:14<01:18,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0871, train/loss_vlb_step=0.000286, train/loss_step=0.0871, global_step=8142.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  96%|█████████▌| 1162/1208 [33:14<01:18,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000425, train/loss_step=0.129, global_step=8142.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  96%|█████████▋| 1163/1208 [33:15<01:17,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000425, train/loss_step=0.129, global_step=8142.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  96%|█████████▋| 1163/1208 [33:15<01:17,  1.72s/it, loss=0.185, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000752, train/loss_step=0.205, global_step=8142.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  96%|█████████▋| 1164/1208 [33:18<01:15,  1.72s/it, loss=0.185, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000752, train/loss_step=0.205, global_step=8142.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  96%|█████████▋| 1164/1208 [33:18<01:15,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.55e-5, train/loss_step=0.0213, global_step=8142.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  96%|█████████▋| 1165/1208 [33:19<01:13,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.55e-5, train/loss_step=0.0213, global_step=8142.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  96%|█████████▋| 1165/1208 [33:19<01:13,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.44e-5, train/loss_step=0.0126, global_step=8143.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  97%|█████████▋| 1166/1208 [33:21<01:12,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.44e-5, train/loss_step=0.0126, global_step=8143.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  97%|█████████▋| 1166/1208 [33:21<01:12,  1.72s/it, loss=0.165, v_num=0, train/loss_simple_step=0.500, train/loss_vlb_step=0.00664, train/loss_step=0.500, global_step=8143.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  97%|█████████▋| 1167/1208 [33:22<01:10,  1.72s/it, loss=0.165, v_num=0, train/loss_simple_step=0.500, train/loss_vlb_step=0.00664, train/loss_step=0.500, global_step=8143.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  97%|█████████▋| 1167/1208 [33:22<01:10,  1.72s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.42e-5, train/loss_step=0.0175, global_step=8143.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  97%|█████████▋| 1168/1208 [33:25<01:08,  1.72s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.42e-5, train/loss_step=0.0175, global_step=8143.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  97%|█████████▋| 1168/1208 [33:25<01:08,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00173, train/loss_step=0.319, global_step=8143.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  97%|█████████▋| 1169/1208 [33:26<01:06,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00173, train/loss_step=0.319, global_step=8143.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  97%|█████████▋| 1169/1208 [33:26<01:06,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000535, train/loss_step=0.157, global_step=8144.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  97%|█████████▋| 1170/1208 [33:27<01:05,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000535, train/loss_step=0.157, global_step=8144.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  97%|█████████▋| 1170/1208 [33:27<01:05,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.73e-5, train/loss_step=0.0104, global_step=8144.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  97%|█████████▋| 1171/1208 [33:28<01:03,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.73e-5, train/loss_step=0.0104, global_step=8144.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  97%|█████████▋| 1171/1208 [33:28<01:03,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00125, train/loss_step=0.258, global_step=8144.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  97%|█████████▋| 1172/1208 [33:31<01:01,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00125, train/loss_step=0.258, global_step=8144.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  97%|█████████▋| 1172/1208 [33:31<01:01,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.00405, train/loss_step=0.406, global_step=8144.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  97%|█████████▋| 1173/1208 [33:32<01:00,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.406, train/loss_vlb_step=0.00405, train/loss_step=0.406, global_step=8144.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  97%|█████████▋| 1173/1208 [33:32<01:00,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0315, train/loss_vlb_step=0.000112, train/loss_step=0.0315, global_step=8145.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  97%|█████████▋| 1174/1208 [33:34<00:58,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0315, train/loss_vlb_step=0.000112, train/loss_step=0.0315, global_step=8145.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  97%|█████████▋| 1174/1208 [33:34<00:58,  1.72s/it, loss=0.196, v_num=0, train/loss_simple_step=0.421, train/loss_vlb_step=0.00346, train/loss_step=0.421, global_step=8145.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  97%|█████████▋| 1175/1208 [33:35<00:56,  1.72s/it, loss=0.196, v_num=0, train/loss_simple_step=0.421, train/loss_vlb_step=0.00346, train/loss_step=0.421, global_step=8145.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  97%|█████████▋| 1175/1208 [33:35<00:56,  1.72s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.4e-5, train/loss_step=0.0146, global_step=8145.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  97%|█████████▋| 1176/1208 [33:38<00:54,  1.72s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.4e-5, train/loss_step=0.0146, global_step=8145.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  97%|█████████▋| 1176/1208 [33:38<00:54,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0964, train/loss_vlb_step=0.000317, train/loss_step=0.0964, global_step=8145.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  97%|█████████▋| 1177/1208 [33:39<00:53,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0964, train/loss_vlb_step=0.000317, train/loss_step=0.0964, global_step=8145.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  97%|█████████▋| 1177/1208 [33:39<00:53,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00364, train/loss_step=0.376, global_step=8146.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  98%|█████████▊| 1178/1208 [33:40<00:51,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.376, train/loss_vlb_step=0.00364, train/loss_step=0.376, global_step=8146.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  98%|█████████▊| 1178/1208 [33:40<00:51,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000812, train/loss_step=0.205, global_step=8146.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  98%|█████████▊| 1179/1208 [33:41<00:49,  1.71s/it, loss=0.188, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000812, train/loss_step=0.205, global_step=8146.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  98%|█████████▊| 1179/1208 [33:41<00:49,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.056, train/loss_vlb_step=0.000192, train/loss_step=0.056, global_step=8146.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  98%|█████████▊| 1180/1208 [33:44<00:48,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.056, train/loss_vlb_step=0.000192, train/loss_step=0.056, global_step=8146.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  98%|█████████▊| 1180/1208 [33:44<00:48,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0926, train/loss_vlb_step=0.000304, train/loss_step=0.0926, global_step=8146.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  98%|█████████▊| 1181/1208 [33:45<00:46,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0926, train/loss_vlb_step=0.000304, train/loss_step=0.0926, global_step=8146.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  98%|█████████▊| 1181/1208 [33:45<00:46,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000137, train/loss_step=0.0358, global_step=8147.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  98%|█████████▊| 1182/1208 [33:46<00:44,  1.71s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000137, train/loss_step=0.0358, global_step=8147.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  98%|█████████▊| 1182/1208 [33:46<00:44,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000542, train/loss_step=0.158, global_step=8147.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  98%|█████████▊| 1183/1208 [33:47<00:42,  1.71s/it, loss=0.17, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000542, train/loss_step=0.158, global_step=8147.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  98%|█████████▊| 1183/1208 [33:47<00:42,  1.71s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0496, train/loss_vlb_step=0.000175, train/loss_step=0.0496, global_step=8147.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  98%|█████████▊| 1184/1208 [33:51<00:41,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0496, train/loss_vlb_step=0.000175, train/loss_step=0.0496, global_step=8147.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  98%|█████████▊| 1184/1208 [33:51<00:41,  1.72s/it, loss=0.191, v_num=0, train/loss_simple_step=0.599, train/loss_vlb_step=0.0241, train/loss_step=0.599, global_step=8147.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  98%|█████████▊| 1185/1208 [33:52<00:39,  1.72s/it, loss=0.191, v_num=0, train/loss_simple_step=0.599, train/loss_vlb_step=0.0241, train/loss_step=0.599, global_step=8147.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  98%|█████████▊| 1185/1208 [33:52<00:39,  1.72s/it, loss=0.19, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=1.99e-5, train/loss_step=0.00347, global_step=8148.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  98%|█████████▊| 1186/1208 [33:53<00:37,  1.71s/it, loss=0.19, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=1.99e-5, train/loss_step=0.00347, global_step=8148.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  98%|█████████▊| 1186/1208 [33:53<00:37,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.94e-5, train/loss_step=0.0185, global_step=8148.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  98%|█████████▊| 1187/1208 [33:54<00:35,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.94e-5, train/loss_step=0.0185, global_step=8148.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  98%|█████████▊| 1187/1208 [33:54<00:35,  1.71s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=1.12e-5, train/loss_step=0.00185, global_step=8148.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  98%|█████████▊| 1188/1208 [33:57<00:34,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=1.12e-5, train/loss_step=0.00185, global_step=8148.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  98%|█████████▊| 1188/1208 [33:57<00:34,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.33e-5, train/loss_step=0.0148, global_step=8148.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]   Epoch 26:  98%|█████████▊| 1189/1208 [33:58<00:32,  1.71s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.33e-5, train/loss_step=0.0148, global_step=8148.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  98%|█████████▊| 1189/1208 [33:58<00:32,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00132, train/loss_step=0.296, global_step=8149.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  99%|█████████▊| 1190/1208 [33:59<00:30,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00132, train/loss_step=0.296, global_step=8149.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  99%|█████████▊| 1190/1208 [33:59<00:30,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.94e-5, train/loss_step=0.0185, global_step=8149.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  99%|█████████▊| 1191/1208 [34:00<00:29,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.94e-5, train/loss_step=0.0185, global_step=8149.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  99%|█████████▊| 1191/1208 [34:00<00:29,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00139, train/loss_step=0.283, global_step=8149.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]  Epoch 26:  99%|█████████▊| 1192/1208 [34:04<00:27,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00139, train/loss_step=0.283, global_step=8149.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  99%|█████████▊| 1192/1208 [34:04<00:27,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00446, train/loss_vlb_step=2.37e-5, train/loss_step=0.00446, global_step=8149.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  99%|█████████▉| 1193/1208 [34:05<00:25,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00446, train/loss_vlb_step=2.37e-5, train/loss_step=0.00446, global_step=8149.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  99%|█████████▉| 1193/1208 [34:05<00:25,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000109, train/loss_step=0.0282, global_step=8150.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26:  99%|█████████▉| 1194/1208 [34:06<00:23,  1.71s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000109, train/loss_step=0.0282, global_step=8150.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  99%|█████████▉| 1194/1208 [34:06<00:23,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00847, train/loss_vlb_step=4.05e-5, train/loss_step=0.00847, global_step=8150.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  99%|█████████▉| 1195/1208 [34:07<00:22,  1.71s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00847, train/loss_vlb_step=4.05e-5, train/loss_step=0.00847, global_step=8150.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  99%|█████████▉| 1195/1208 [34:07<00:22,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.487, train/loss_vlb_step=0.00492, train/loss_step=0.487, global_step=8150.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  99%|█████████▉| 1196/1208 [34:10<00:20,  1.71s/it, loss=0.142, v_num=0, train/loss_simple_step=0.487, train/loss_vlb_step=0.00492, train/loss_step=0.487, global_step=8150.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  99%|█████████▉| 1196/1208 [34:10<00:20,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=7.06e-5, train/loss_step=0.0162, global_step=8150.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  99%|█████████▉| 1197/1208 [34:11<00:18,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=7.06e-5, train/loss_step=0.0162, global_step=8150.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  99%|█████████▉| 1197/1208 [34:11<00:18,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.000179, train/loss_step=0.0508, global_step=8151.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  99%|█████████▉| 1198/1208 [34:12<00:17,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0508, train/loss_vlb_step=0.000179, train/loss_step=0.0508, global_step=8151.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  99%|█████████▉| 1198/1208 [34:12<00:17,  1.71s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0579, train/loss_vlb_step=0.000202, train/loss_step=0.0579, global_step=8151.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  99%|█████████▉| 1199/1208 [34:13<00:15,  1.71s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0579, train/loss_vlb_step=0.000202, train/loss_step=0.0579, global_step=8151.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  99%|█████████▉| 1199/1208 [34:13<00:15,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.0011, train/loss_step=0.270, global_step=8151.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26:  99%|█████████▉| 1200/1208 [34:16<00:13,  1.71s/it, loss=0.125, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.0011, train/loss_step=0.270, global_step=8151.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  99%|█████████▉| 1200/1208 [34:16<00:13,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00139, train/loss_step=0.284, global_step=8151.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.71it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.72it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:29,  1.67it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.70it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.72it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:28,  1.70it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:28,  1.70it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:28,  1.66it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.71it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.71it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.73it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.77it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.71it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.71it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:27,  1.70it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:26,  1.73it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:26,  1.73it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:26,  1.71it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.72it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.71it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.71it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.74it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.74it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.72it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.75it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.75it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.71it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.75it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.76it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.73it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:23,  1.71it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.76it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.71it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.75it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:07<00:22,  1.72it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.75it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.75it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.69it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.76it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.75it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.71it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.76it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:20,  1.73it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.78it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.73it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:19,  1.73it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.75it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.74it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.75it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:11<00:17,  1.74it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.76it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.75it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.76it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.76it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.77it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.75it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:16,  1.74it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:16,  1.75it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.75it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.74it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.74it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.75it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:15,  1.72it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.75it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.73it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.74it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.76it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:15<00:13,  1.72it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.76it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.76it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.75it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.72it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.76it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.76it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:16<00:12,  1.74it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:12,  1.74it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.75it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.76it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.74it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.75it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.74it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.75it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:19<00:09,  1.75it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.75it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  70%|███████   | 35/50 [00:20<00:08,  1.74it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.78it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:08,  1.75it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.73it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.77it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.73it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.73it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.74it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.75it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.75it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.74it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.75it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.78it/s]DDIM Sampler:  80%|████████  | 40/50 [00:23<00:05,  1.70it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.72it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.73it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:24<00:04,  1.73it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.74it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.78it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.74it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.76it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.75it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.74it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:26<00:02,  1.74it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.75it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.74it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.75it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.78it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:27<00:01,  1.75it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.75it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.75it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.74it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:28<00:00,  1.74it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.72it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.74it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.73it/s]Epoch 26:  99%|█████████▉| 1201/1208 [34:48<00:12,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00139, train/loss_step=0.284, global_step=8151.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26:  99%|█████████▉| 1201/1208 [34:48<00:12,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000131, train/loss_step=0.0327, global_step=8152.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26: 100%|█████████▉| 1202/1208 [34:49<00:10,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000131, train/loss_step=0.0327, global_step=8152.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26: 100%|█████████▉| 1202/1208 [34:49<00:10,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.91e-5, train/loss_step=0.00331, global_step=8152.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26: 100%|█████████▉| 1203/1208 [34:50<00:08,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.91e-5, train/loss_step=0.00331, global_step=8152.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26: 100%|█████████▉| 1203/1208 [34:50<00:08,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00121, train/loss_step=0.281, global_step=8152.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]    Epoch 26: 100%|█████████▉| 1204/1208 [34:53<00:06,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00121, train/loss_step=0.281, global_step=8152.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26: 100%|█████████▉| 1204/1208 [34:53<00:06,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=1.57e-5, train/loss_step=0.00276, global_step=8152.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26: 100%|█████████▉| 1205/1208 [34:54<00:05,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=1.57e-5, train/loss_step=0.00276, global_step=8152.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26: 100%|█████████▉| 1205/1208 [34:54<00:05,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0688, train/loss_vlb_step=0.000236, train/loss_step=0.0688, global_step=8153.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26: 100%|█████████▉| 1206/1208 [34:56<00:03,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0688, train/loss_vlb_step=0.000236, train/loss_step=0.0688, global_step=8153.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26: 100%|█████████▉| 1206/1208 [34:56<00:03,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0606, train/loss_vlb_step=0.000216, train/loss_step=0.0606, global_step=8153.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26: 100%|█████████▉| 1207/1208 [34:57<00:01,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0606, train/loss_vlb_step=0.000216, train/loss_step=0.0606, global_step=8153.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26: 100%|█████████▉| 1207/1208 [34:57<00:01,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.16e-5, train/loss_step=0.0234, global_step=8153.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] Epoch 26: 100%|██████████| 1208/1208 [35:02<00:00,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.16e-5, train/loss_step=0.0234, global_step=8153.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 26: 100%|██████████| 1208/1208 [35:02<00:00,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000111, train/loss_step=0.029, global_step=8153.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140] 
+
+
+Epoch 26:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.115, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000111, train/loss_step=0.029, global_step=8153.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]           Epoch 27:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.115, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000111, train/loss_step=0.029, global_step=8153.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.75it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:29,  1.69it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:29,  1.67it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.81it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:28,  1.71it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:28,  1.71it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:28,  1.69it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:25,  1.81it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.72it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.70it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:28,  1.67it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.82it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.73it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.72it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:27,  1.69it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.82it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.74it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.75it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:26,  1.69it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.75it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.76it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:26,  1.66it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.76it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.76it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:04<00:25,  1.68it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.69it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.79it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.76it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.76it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:24,  1.71it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:23,  1.72it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.75it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.72it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.76it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:07<00:22,  1.71it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.73it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.76it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.74it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.76it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:20,  1.74it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.78it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.76it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.74it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.74it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.78it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.74it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:11<00:17,  1.74it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.74it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.74it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:16,  1.74it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.78it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.79it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.74it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:15,  1.71it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.75it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.78it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.70it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.75it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:14,  1.71it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:15<00:13,  1.75it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.73it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.75it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.81it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.74it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:16<00:12,  1.74it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.75it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:12,  1.74it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.76it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.72it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.73it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.74it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.81it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.78it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:19<00:09,  1.75it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.79it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.75it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.78it/s]DDIM Sampler:  70%|███████   | 35/50 [00:20<00:08,  1.75it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.80it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:08,  1.75it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.77it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.75it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.77it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.77it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.80it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.78it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.71it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.78it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.78it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:24<00:04,  1.71it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.75it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.72it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.78it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.73it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.74it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.78it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:26<00:02,  1.73it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.75it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.74it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.75it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.77it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.79it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:27<00:01,  1.74it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.75it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.78it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.74it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.80it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.73it/s]Epoch 27:   0%|          | 1/1208 [00:33<11:23:20, 33.97s/it, loss=0.115, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000111, train/loss_step=0.029, global_step=8153.0, train/loss_simple_epoch=0.140, train/loss_vlb_epoch=0.00237, train/loss_epoch=0.140]Epoch 27:   0%|          | 1/1208 [00:33<11:23:23, 33.97s/it, loss=0.106, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=8154.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   0%|          | 2/1208 [00:35<5:51:52, 17.51s/it, loss=0.106, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=8154.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:   0%|          | 2/1208 [00:35<5:51:53, 17.51s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0903, train/loss_vlb_step=0.000301, train/loss_step=0.0903, global_step=8154.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   0%|          | 3/1208 [00:36<4:01:24, 12.02s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0903, train/loss_vlb_step=0.000301, train/loss_step=0.0903, global_step=8154.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   0%|          | 3/1208 [00:36<4:01:25, 12.02s/it, loss=0.123, v_num=0, train/loss_simple_step=0.557, train/loss_vlb_step=0.00588, train/loss_step=0.557, global_step=8154.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:   0%|          | 4/1208 [00:39<3:15:53,  9.76s/it, loss=0.123, v_num=0, train/loss_simple_step=0.557, train/loss_vlb_step=0.00588, train/loss_step=0.557, global_step=8154.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   0%|          | 4/1208 [00:39<3:15:54,  9.76s/it, loss=0.129, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=8154.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   0%|          | 5/1208 [00:40<2:40:52,  8.02s/it, loss=0.129, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=8154.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   0%|          | 5/1208 [00:40<2:40:53,  8.02s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0492, train/loss_vlb_step=0.000172, train/loss_step=0.0492, global_step=8155.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   0%|          | 6/1208 [00:41<2:17:28,  6.86s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0492, train/loss_vlb_step=0.000172, train/loss_step=0.0492, global_step=8155.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   0%|          | 6/1208 [00:41<2:17:28,  6.86s/it, loss=0.136, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000467, train/loss_step=0.138, global_step=8155.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:   1%|          | 7/1208 [00:42<2:00:46,  6.03s/it, loss=0.136, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000467, train/loss_step=0.138, global_step=8155.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   1%|          | 7/1208 [00:42<2:00:47,  6.03s/it, loss=0.118, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000387, train/loss_step=0.116, global_step=8155.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   1%|          | 8/1208 [00:45<1:53:52,  5.69s/it, loss=0.118, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000387, train/loss_step=0.116, global_step=8155.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   1%|          | 8/1208 [00:45<1:53:53,  5.69s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0076, train/loss_vlb_step=3.78e-5, train/loss_step=0.0076, global_step=8155.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   1%|          | 9/1208 [00:46<1:43:33,  5.18s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0076, train/loss_vlb_step=3.78e-5, train/loss_step=0.0076, global_step=8155.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   1%|          | 9/1208 [00:46<1:43:33,  5.18s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000117, train/loss_step=0.0314, global_step=8156.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   1%|          | 10/1208 [00:47<1:35:13,  4.77s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0314, train/loss_vlb_step=0.000117, train/loss_step=0.0314, global_step=8156.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   1%|          | 10/1208 [00:47<1:35:13,  4.77s/it, loss=0.117, v_num=0, train/loss_simple_step=0.084, train/loss_vlb_step=0.000287, train/loss_step=0.084, global_step=8156.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:   1%|          | 11/1208 [00:48<1:28:24,  4.43s/it, loss=0.117, v_num=0, train/loss_simple_step=0.084, train/loss_vlb_step=0.000287, train/loss_step=0.084, global_step=8156.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   1%|          | 11/1208 [00:48<1:28:24,  4.43s/it, loss=0.115, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000787, train/loss_step=0.213, global_step=8156.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   1%|          | 12/1208 [00:51<1:26:22,  4.33s/it, loss=0.115, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000787, train/loss_step=0.213, global_step=8156.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   1%|          | 12/1208 [00:51<1:26:22,  4.33s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.00016, train/loss_step=0.0454, global_step=8156.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   1%|          | 13/1208 [00:53<1:21:17,  4.08s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.00016, train/loss_step=0.0454, global_step=8156.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   1%|          | 13/1208 [00:53<1:21:17,  4.08s/it, loss=0.114, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.000941, train/loss_step=0.259, global_step=8157.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:   1%|          | 14/1208 [00:54<1:16:56,  3.87s/it, loss=0.114, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.000941, train/loss_step=0.259, global_step=8157.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   1%|          | 14/1208 [00:54<1:16:56,  3.87s/it, loss=0.12, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000438, train/loss_step=0.132, global_step=8157.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:   1%|          | 15/1208 [00:55<1:13:07,  3.68s/it, loss=0.12, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000438, train/loss_step=0.132, global_step=8157.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   1%|          | 15/1208 [00:55<1:13:07,  3.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=8157.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   1%|▏         | 16/1208 [00:58<1:12:31,  3.65s/it, loss=0.113, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=8157.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   1%|▏         | 16/1208 [00:58<1:12:32,  3.65s/it, loss=0.139, v_num=0, train/loss_simple_step=0.529, train/loss_vlb_step=0.00576, train/loss_step=0.529, global_step=8157.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:   1%|▏         | 17/1208 [00:59<1:09:27,  3.50s/it, loss=0.139, v_num=0, train/loss_simple_step=0.529, train/loss_vlb_step=0.00576, train/loss_step=0.529, global_step=8157.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   1%|▏         | 17/1208 [00:59<1:09:27,  3.50s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000159, train/loss_step=0.0448, global_step=8158.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   1%|▏         | 18/1208 [01:00<1:06:42,  3.36s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0448, train/loss_vlb_step=0.000159, train/loss_step=0.0448, global_step=8158.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   1%|▏         | 18/1208 [01:00<1:06:42,  3.36s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00812, train/loss_vlb_step=3.94e-5, train/loss_step=0.00812, global_step=8158.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   2%|▏         | 19/1208 [01:01<1:04:15,  3.24s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00812, train/loss_vlb_step=3.94e-5, train/loss_step=0.00812, global_step=8158.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   2%|▏         | 19/1208 [01:01<1:04:15,  3.24s/it, loss=0.157, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00591, train/loss_step=0.454, global_step=8158.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:   2%|▏         | 20/1208 [01:04<1:04:12,  3.24s/it, loss=0.157, v_num=0, train/loss_simple_step=0.454, train/loss_vlb_step=0.00591, train/loss_step=0.454, global_step=8158.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   2%|▏         | 20/1208 [01:04<1:04:13,  3.24s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0973, train/loss_vlb_step=0.000322, train/loss_step=0.0973, global_step=8158.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   2%|▏         | 21/1208 [01:05<1:02:06,  3.14s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0973, train/loss_vlb_step=0.000322, train/loss_step=0.0973, global_step=8158.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   2%|▏         | 21/1208 [01:05<1:02:06,  3.14s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0892, train/loss_vlb_step=0.000298, train/loss_step=0.0892, global_step=8159.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   2%|▏         | 22/1208 [01:06<1:00:11,  3.05s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0892, train/loss_vlb_step=0.000298, train/loss_step=0.0892, global_step=8159.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   2%|▏         | 22/1208 [01:06<1:00:11,  3.05s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.3e-5, train/loss_step=0.00225, global_step=8159.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   2%|▏         | 23/1208 [01:08<58:26,  2.96s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.3e-5, train/loss_step=0.00225, global_step=8159.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:   2%|▏         | 23/1208 [01:08<58:26,  2.96s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00681, train/loss_vlb_step=3.25e-5, train/loss_step=0.00681, global_step=8159.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   2%|▏         | 24/1208 [01:11<58:34,  2.97s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00681, train/loss_vlb_step=3.25e-5, train/loss_step=0.00681, global_step=8159.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   2%|▏         | 24/1208 [01:11<58:34,  2.97s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.08e-5, train/loss_step=0.0111, global_step=8159.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:   2%|▏         | 25/1208 [01:12<57:02,  2.89s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.08e-5, train/loss_step=0.0111, global_step=8159.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   2%|▏         | 25/1208 [01:12<57:02,  2.89s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00588, train/loss_vlb_step=3.12e-5, train/loss_step=0.00588, global_step=8160.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   2%|▏         | 26/1208 [01:13<55:36,  2.82s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00588, train/loss_vlb_step=3.12e-5, train/loss_step=0.00588, global_step=8160.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   2%|▏         | 26/1208 [01:13<55:37,  2.82s/it, loss=0.124, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000793, train/loss_step=0.209, global_step=8160.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:   2%|▏         | 27/1208 [01:14<54:18,  2.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000793, train/loss_step=0.209, global_step=8160.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   2%|▏         | 27/1208 [01:14<54:18,  2.76s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0465, train/loss_vlb_step=0.000167, train/loss_step=0.0465, global_step=8160.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   2%|▏         | 28/1208 [01:17<54:33,  2.77s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0465, train/loss_vlb_step=0.000167, train/loss_step=0.0465, global_step=8160.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   2%|▏         | 28/1208 [01:17<54:33,  2.77s/it, loss=0.146, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.00776, train/loss_step=0.512, global_step=8160.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:   2%|▏         | 29/1208 [01:18<53:22,  2.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.00776, train/loss_step=0.512, global_step=8160.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   2%|▏         | 29/1208 [01:18<53:22,  2.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.479, train/loss_vlb_step=0.0042, train/loss_step=0.479, global_step=8161.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:   2%|▏         | 30/1208 [01:19<52:15,  2.66s/it, loss=0.168, v_num=0, train/loss_simple_step=0.479, train/loss_vlb_step=0.0042, train/loss_step=0.479, global_step=8161.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   2%|▏         | 30/1208 [01:19<52:15,  2.66s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=9.85e-5, train/loss_step=0.0252, global_step=8161.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   3%|▎         | 31/1208 [01:20<51:11,  2.61s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=9.85e-5, train/loss_step=0.0252, global_step=8161.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   3%|▎         | 31/1208 [01:20<51:11,  2.61s/it, loss=0.167, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00106, train/loss_step=0.251, global_step=8161.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:   3%|▎         | 32/1208 [01:24<51:31,  2.63s/it, loss=0.167, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00106, train/loss_step=0.251, global_step=8161.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   3%|▎         | 32/1208 [01:24<51:31,  2.63s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00905, train/loss_vlb_step=4.36e-5, train/loss_step=0.00905, global_step=8161.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   3%|▎         | 33/1208 [01:25<50:34,  2.58s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00905, train/loss_vlb_step=4.36e-5, train/loss_step=0.00905, global_step=8161.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   3%|▎         | 33/1208 [01:25<50:34,  2.58s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.00019, train/loss_step=0.0556, global_step=8162.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:   3%|▎         | 34/1208 [01:26<49:40,  2.54s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.00019, train/loss_step=0.0556, global_step=8162.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   3%|▎         | 34/1208 [01:26<49:40,  2.54s/it, loss=0.156, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.00053, train/loss_step=0.155, global_step=8162.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:   3%|▎         | 35/1208 [01:27<48:48,  2.50s/it, loss=0.156, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.00053, train/loss_step=0.155, global_step=8162.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   3%|▎         | 35/1208 [01:27<48:48,  2.50s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.3e-5, train/loss_step=0.0112, global_step=8162.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   3%|▎         | 36/1208 [01:30<49:08,  2.52s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.3e-5, train/loss_step=0.0112, global_step=8162.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   3%|▎         | 36/1208 [01:30<49:08,  2.52s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=9.32e-6, train/loss_step=0.00161, global_step=8162.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   3%|▎         | 37/1208 [01:31<48:20,  2.48s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=9.32e-6, train/loss_step=0.00161, global_step=8162.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   3%|▎         | 37/1208 [01:31<48:20,  2.48s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=1.74e-5, train/loss_step=0.0031, global_step=8163.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:   3%|▎         | 38/1208 [01:32<47:34,  2.44s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=1.74e-5, train/loss_step=0.0031, global_step=8163.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   3%|▎         | 38/1208 [01:32<47:34,  2.44s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=1.5e-5, train/loss_step=0.00259, global_step=8163.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   3%|▎         | 39/1208 [01:33<46:50,  2.40s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=1.5e-5, train/loss_step=0.00259, global_step=8163.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   3%|▎         | 39/1208 [01:33<46:50,  2.40s/it, loss=0.106, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000519, train/loss_step=0.146, global_step=8163.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:   3%|▎         | 40/1208 [01:37<47:13,  2.43s/it, loss=0.106, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000519, train/loss_step=0.146, global_step=8163.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   3%|▎         | 40/1208 [01:37<47:13,  2.43s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.27e-5, train/loss_step=0.0166, global_step=8163.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   3%|▎         | 41/1208 [01:38<46:32,  2.39s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=7.27e-5, train/loss_step=0.0166, global_step=8163.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   3%|▎         | 41/1208 [01:38<46:32,  2.39s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.00433, train/loss_vlb_step=2.33e-5, train/loss_step=0.00433, global_step=8164.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   3%|▎         | 42/1208 [01:39<45:52,  2.36s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.00433, train/loss_vlb_step=2.33e-5, train/loss_step=0.00433, global_step=8164.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   3%|▎         | 42/1208 [01:39<45:53,  2.36s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.00567, train/loss_vlb_step=2.95e-5, train/loss_step=0.00567, global_step=8164.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   4%|▎         | 43/1208 [01:40<45:15,  2.33s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.00567, train/loss_vlb_step=2.95e-5, train/loss_step=0.00567, global_step=8164.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   4%|▎         | 43/1208 [01:40<45:15,  2.33s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0503, train/loss_vlb_step=0.000172, train/loss_step=0.0503, global_step=8164.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:   4%|▎         | 44/1208 [01:43<45:36,  2.35s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0503, train/loss_vlb_step=0.000172, train/loss_step=0.0503, global_step=8164.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   4%|▎         | 44/1208 [01:43<45:36,  2.35s/it, loss=0.108, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000572, train/loss_step=0.169, global_step=8164.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   4%|▎         | 45/1208 [01:44<45:01,  2.32s/it, loss=0.108, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000572, train/loss_step=0.169, global_step=8164.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   4%|▎         | 45/1208 [01:44<45:01,  2.32s/it, loss=0.117, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000637, train/loss_step=0.181, global_step=8165.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   4%|▍         | 46/1208 [01:45<44:26,  2.29s/it, loss=0.117, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000637, train/loss_step=0.181, global_step=8165.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   4%|▍         | 46/1208 [01:45<44:26,  2.29s/it, loss=0.145, v_num=0, train/loss_simple_step=0.767, train/loss_vlb_step=0.0562, train/loss_step=0.767, global_step=8165.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:   4%|▍         | 47/1208 [01:46<43:52,  2.27s/it, loss=0.145, v_num=0, train/loss_simple_step=0.767, train/loss_vlb_step=0.0562, train/loss_step=0.767, global_step=8165.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   4%|▍         | 47/1208 [01:46<43:53,  2.27s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.6e-5, train/loss_step=0.0128, global_step=8165.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   4%|▍         | 48/1208 [01:49<44:15,  2.29s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.6e-5, train/loss_step=0.0128, global_step=8165.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   4%|▍         | 48/1208 [01:49<44:15,  2.29s/it, loss=0.135, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00263, train/loss_step=0.363, global_step=8165.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:   4%|▍         | 49/1208 [01:50<43:44,  2.26s/it, loss=0.135, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00263, train/loss_step=0.363, global_step=8165.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   4%|▍         | 49/1208 [01:50<43:44,  2.26s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.61e-5, train/loss_step=0.0238, global_step=8166.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   4%|▍         | 50/1208 [01:51<43:13,  2.24s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.61e-5, train/loss_step=0.0238, global_step=8166.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   4%|▍         | 50/1208 [01:51<43:13,  2.24s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.26e-5, train/loss_step=0.0118, global_step=8166.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   4%|▍         | 51/1208 [01:53<42:43,  2.22s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.26e-5, train/loss_step=0.0118, global_step=8166.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   4%|▍         | 51/1208 [01:53<42:43,  2.22s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.46e-5, train/loss_step=0.0148, global_step=8166.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:   4%|▍         | 52/1208 [01:56<43:06,  2.24s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.46e-5, train/loss_step=0.0148, global_step=8166.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   4%|▍         | 52/1208 [01:56<43:06,  2.24s/it, loss=0.129, v_num=0, train/loss_simple_step=0.585, train/loss_vlb_step=0.0122, train/loss_step=0.585, global_step=8166.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:   4%|▍         | 53/1208 [01:57<42:38,  2.22s/it, loss=0.129, v_num=0, train/loss_simple_step=0.585, train/loss_vlb_step=0.0122, train/loss_step=0.585, global_step=8166.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   4%|▍         | 53/1208 [01:57<42:38,  2.22s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00847, train/loss_vlb_step=4.03e-5, train/loss_step=0.00847, global_step=8167.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   4%|▍         | 54/1208 [01:58<42:11,  2.19s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00847, train/loss_vlb_step=4.03e-5, train/loss_step=0.00847, global_step=8167.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   4%|▍         | 54/1208 [01:58<42:11,  2.19s/it, loss=0.124, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000333, train/loss_step=0.101, global_step=8167.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:   5%|▍         | 55/1208 [01:59<41:45,  2.17s/it, loss=0.124, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000333, train/loss_step=0.101, global_step=8167.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   5%|▍         | 55/1208 [01:59<41:45,  2.17s/it, loss=0.124, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.57e-5, train/loss_step=0.016, global_step=8167.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:   5%|▍         | 56/1208 [02:02<42:04,  2.19s/it, loss=0.124, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.57e-5, train/loss_step=0.016, global_step=8167.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   5%|▍         | 56/1208 [02:02<42:04,  2.19s/it, loss=0.131, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000484, train/loss_step=0.146, global_step=8167.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   5%|▍         | 57/1208 [02:03<41:40,  2.17s/it, loss=0.131, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000484, train/loss_step=0.146, global_step=8167.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   5%|▍         | 57/1208 [02:03<41:40,  2.17s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00928, train/loss_vlb_step=4.49e-5, train/loss_step=0.00928, global_step=8168.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   5%|▍         | 58/1208 [02:04<41:17,  2.15s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00928, train/loss_vlb_step=4.49e-5, train/loss_step=0.00928, global_step=8168.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   5%|▍         | 58/1208 [02:04<41:17,  2.15s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=9.67e-5, train/loss_step=0.0248, global_step=8168.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:   5%|▍         | 59/1208 [02:06<40:54,  2.14s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=9.67e-5, train/loss_step=0.0248, global_step=8168.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   5%|▍         | 59/1208 [02:06<40:54,  2.14s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00594, train/loss_vlb_step=2.95e-5, train/loss_step=0.00594, global_step=8168.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   5%|▍         | 60/1208 [02:09<41:11,  2.15s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00594, train/loss_vlb_step=2.95e-5, train/loss_step=0.00594, global_step=8168.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   5%|▍         | 60/1208 [02:09<41:11,  2.15s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00658, train/loss_vlb_step=3.19e-5, train/loss_step=0.00658, global_step=8168.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   5%|▌         | 61/1208 [02:10<40:49,  2.14s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00658, train/loss_vlb_step=3.19e-5, train/loss_step=0.00658, global_step=8168.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   5%|▌         | 61/1208 [02:10<40:49,  2.14s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00837, train/loss_vlb_step=3.89e-5, train/loss_step=0.00837, global_step=8169.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   5%|▌         | 62/1208 [02:11<40:27,  2.12s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00837, train/loss_vlb_step=3.89e-5, train/loss_step=0.00837, global_step=8169.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   5%|▌         | 62/1208 [02:11<40:27,  2.12s/it, loss=0.141, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00167, train/loss_step=0.312, global_step=8169.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:   5%|▌         | 63/1208 [02:12<40:06,  2.10s/it, loss=0.141, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00167, train/loss_step=0.312, global_step=8169.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   5%|▌         | 63/1208 [02:12<40:06,  2.10s/it, loss=0.153, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00136, train/loss_step=0.291, global_step=8169.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   5%|▌         | 64/1208 [02:15<40:23,  2.12s/it, loss=0.153, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00136, train/loss_step=0.291, global_step=8169.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   5%|▌         | 64/1208 [02:15<40:23,  2.12s/it, loss=0.156, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000907, train/loss_step=0.238, global_step=8169.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   5%|▌         | 65/1208 [02:16<40:02,  2.10s/it, loss=0.156, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000907, train/loss_step=0.238, global_step=8169.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   5%|▌         | 65/1208 [02:16<40:02,  2.10s/it, loss=0.167, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00225, train/loss_step=0.393, global_step=8170.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:   5%|▌         | 66/1208 [02:17<39:42,  2.09s/it, loss=0.167, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00225, train/loss_step=0.393, global_step=8170.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   5%|▌         | 66/1208 [02:17<39:42,  2.09s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=2e-5, train/loss_step=0.00366, global_step=8170.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   6%|▌         | 67/1208 [02:18<39:23,  2.07s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=2e-5, train/loss_step=0.00366, global_step=8170.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   6%|▌         | 67/1208 [02:18<39:23,  2.07s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=6.72e-5, train/loss_step=0.0174, global_step=8170.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   6%|▌         | 68/1208 [02:22<39:41,  2.09s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=6.72e-5, train/loss_step=0.0174, global_step=8170.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   6%|▌         | 68/1208 [02:22<39:41,  2.09s/it, loss=0.124, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00121, train/loss_step=0.273, global_step=8170.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:   6%|▌         | 69/1208 [02:23<39:22,  2.07s/it, loss=0.124, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00121, train/loss_step=0.273, global_step=8170.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   6%|▌         | 69/1208 [02:23<39:22,  2.07s/it, loss=0.134, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000837, train/loss_step=0.219, global_step=8171.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   6%|▌         | 70/1208 [02:24<39:03,  2.06s/it, loss=0.134, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000837, train/loss_step=0.219, global_step=8171.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   6%|▌         | 70/1208 [02:24<39:03,  2.06s/it, loss=0.143, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000643, train/loss_step=0.178, global_step=8171.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   6%|▌         | 71/1208 [02:25<38:45,  2.05s/it, loss=0.143, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000643, train/loss_step=0.178, global_step=8171.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   6%|▌         | 71/1208 [02:25<38:45,  2.05s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.17e-5, train/loss_step=0.00194, global_step=8171.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   6%|▌         | 72/1208 [02:28<39:00,  2.06s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.17e-5, train/loss_step=0.00194, global_step=8171.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   6%|▌         | 72/1208 [02:28<39:00,  2.06s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.000125, train/loss_step=0.0359, global_step=8171.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:   6%|▌         | 73/1208 [02:29<38:43,  2.05s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.000125, train/loss_step=0.0359, global_step=8171.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   6%|▌         | 73/1208 [02:29<38:43,  2.05s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00293, train/loss_vlb_step=1.64e-5, train/loss_step=0.00293, global_step=8172.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   6%|▌         | 74/1208 [02:30<38:26,  2.03s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00293, train/loss_vlb_step=1.64e-5, train/loss_step=0.00293, global_step=8172.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   6%|▌         | 74/1208 [02:30<38:26,  2.03s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.04e-5, train/loss_step=0.0109, global_step=8172.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:   6%|▌         | 75/1208 [02:31<38:09,  2.02s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.04e-5, train/loss_step=0.0109, global_step=8172.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   6%|▌         | 75/1208 [02:31<38:09,  2.02s/it, loss=0.115, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000434, train/loss_step=0.131, global_step=8172.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   6%|▋         | 76/1208 [02:34<38:25,  2.04s/it, loss=0.115, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000434, train/loss_step=0.131, global_step=8172.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   6%|▋         | 76/1208 [02:34<38:25,  2.04s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.000111, train/loss_step=0.0292, global_step=8172.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   6%|▋         | 77/1208 [02:35<38:09,  2.02s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.000111, train/loss_step=0.0292, global_step=8172.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   6%|▋         | 77/1208 [02:35<38:09,  2.02s/it, loss=0.123, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00162, train/loss_step=0.287, global_step=8173.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:   6%|▋         | 78/1208 [02:36<37:53,  2.01s/it, loss=0.123, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00162, train/loss_step=0.287, global_step=8173.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   6%|▋         | 78/1208 [02:36<37:53,  2.01s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000134, train/loss_step=0.0367, global_step=8173.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   7%|▋         | 79/1208 [02:37<37:37,  2.00s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000134, train/loss_step=0.0367, global_step=8173.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   7%|▋         | 79/1208 [02:37<37:37,  2.00s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.000225, train/loss_step=0.0665, global_step=8173.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   7%|▋         | 80/1208 [02:41<37:54,  2.02s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0665, train/loss_vlb_step=0.000225, train/loss_step=0.0665, global_step=8173.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   7%|▋         | 80/1208 [02:41<37:54,  2.02s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.02e-5, train/loss_step=0.0139, global_step=8173.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:   7%|▋         | 81/1208 [02:42<37:39,  2.00s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.02e-5, train/loss_step=0.0139, global_step=8173.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   7%|▋         | 81/1208 [02:42<37:39,  2.00s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=1.09e-5, train/loss_step=0.00184, global_step=8174.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   7%|▋         | 82/1208 [02:43<37:24,  1.99s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=1.09e-5, train/loss_step=0.00184, global_step=8174.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   7%|▋         | 82/1208 [02:43<37:24,  1.99s/it, loss=0.126, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00136, train/loss_step=0.286, global_step=8174.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:   7%|▋         | 83/1208 [02:44<37:09,  1.98s/it, loss=0.126, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00136, train/loss_step=0.286, global_step=8174.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   7%|▋         | 83/1208 [02:44<37:09,  1.98s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000113, train/loss_step=0.0286, global_step=8174.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   7%|▋         | 84/1208 [02:47<37:23,  2.00s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000113, train/loss_step=0.0286, global_step=8174.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   7%|▋         | 84/1208 [02:47<37:23,  2.00s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00669, train/loss_vlb_step=3.37e-5, train/loss_step=0.00669, global_step=8174.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   7%|▋         | 85/1208 [02:48<37:09,  1.99s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00669, train/loss_vlb_step=3.37e-5, train/loss_step=0.00669, global_step=8174.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   7%|▋         | 85/1208 [02:48<37:09,  1.99s/it, loss=0.0888, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000484, train/loss_step=0.146, global_step=8175.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:   7%|▋         | 86/1208 [02:49<36:55,  1.97s/it, loss=0.0888, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000484, train/loss_step=0.146, global_step=8175.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   7%|▋         | 86/1208 [02:49<36:55,  1.97s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.0653, train/loss_vlb_step=0.000217, train/loss_step=0.0653, global_step=8175.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   7%|▋         | 87/1208 [02:50<36:41,  1.96s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.0653, train/loss_vlb_step=0.000217, train/loss_step=0.0653, global_step=8175.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   7%|▋         | 87/1208 [02:50<36:41,  1.96s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000674, train/loss_step=0.179, global_step=8175.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:   7%|▋         | 88/1208 [02:54<36:56,  1.98s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000674, train/loss_step=0.179, global_step=8175.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   7%|▋         | 88/1208 [02:54<36:56,  1.98s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.0434, train/loss_vlb_step=0.000154, train/loss_step=0.0434, global_step=8175.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   7%|▋         | 89/1208 [02:55<36:43,  1.97s/it, loss=0.0885, v_num=0, train/loss_simple_step=0.0434, train/loss_vlb_step=0.000154, train/loss_step=0.0434, global_step=8175.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   7%|▋         | 89/1208 [02:55<36:43,  1.97s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000707, train/loss_step=0.192, global_step=8176.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:   7%|▋         | 90/1208 [02:56<36:29,  1.96s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000707, train/loss_step=0.192, global_step=8176.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   7%|▋         | 90/1208 [02:56<36:29,  1.96s/it, loss=0.0792, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=8.12e-5, train/loss_step=0.0192, global_step=8176.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   8%|▊         | 91/1208 [02:57<36:16,  1.95s/it, loss=0.0792, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=8.12e-5, train/loss_step=0.0192, global_step=8176.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   8%|▊         | 91/1208 [02:57<36:16,  1.95s/it, loss=0.0802, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.16e-5, train/loss_step=0.0231, global_step=8176.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   8%|▊         | 92/1208 [03:00<36:30,  1.96s/it, loss=0.0802, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.16e-5, train/loss_step=0.0231, global_step=8176.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   8%|▊         | 92/1208 [03:00<36:30,  1.96s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.0728, train/loss_vlb_step=0.000248, train/loss_step=0.0728, global_step=8176.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   8%|▊         | 93/1208 [03:01<36:18,  1.95s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.0728, train/loss_vlb_step=0.000248, train/loss_step=0.0728, global_step=8176.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   8%|▊         | 93/1208 [03:01<36:18,  1.95s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.00329, train/loss_vlb_step=1.82e-5, train/loss_step=0.00329, global_step=8177.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   8%|▊         | 94/1208 [03:02<36:05,  1.94s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.00329, train/loss_vlb_step=1.82e-5, train/loss_step=0.00329, global_step=8177.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   8%|▊         | 94/1208 [03:02<36:05,  1.94s/it, loss=0.0827, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.69e-5, train/loss_step=0.0231, global_step=8177.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:   8%|▊         | 95/1208 [03:03<35:53,  1.93s/it, loss=0.0827, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.69e-5, train/loss_step=0.0231, global_step=8177.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   8%|▊         | 95/1208 [03:03<35:53,  1.93s/it, loss=0.0786, v_num=0, train/loss_simple_step=0.0481, train/loss_vlb_step=0.000166, train/loss_step=0.0481, global_step=8177.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   8%|▊         | 96/1208 [03:06<36:05,  1.95s/it, loss=0.0786, v_num=0, train/loss_simple_step=0.0481, train/loss_vlb_step=0.000166, train/loss_step=0.0481, global_step=8177.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   8%|▊         | 96/1208 [03:06<36:05,  1.95s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00176, train/loss_step=0.330, global_step=8177.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:   8%|▊         | 97/1208 [03:08<35:54,  1.94s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.330, train/loss_vlb_step=0.00176, train/loss_step=0.330, global_step=8177.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   8%|▊         | 97/1208 [03:08<35:54,  1.94s/it, loss=0.0794, v_num=0, train/loss_simple_step=0.00453, train/loss_vlb_step=2.44e-5, train/loss_step=0.00453, global_step=8178.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   8%|▊         | 98/1208 [03:09<35:42,  1.93s/it, loss=0.0794, v_num=0, train/loss_simple_step=0.00453, train/loss_vlb_step=2.44e-5, train/loss_step=0.00453, global_step=8178.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   8%|▊         | 98/1208 [03:09<35:42,  1.93s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00166, train/loss_step=0.312, global_step=8178.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:   8%|▊         | 99/1208 [03:10<35:31,  1.92s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00166, train/loss_step=0.312, global_step=8178.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   8%|▊         | 99/1208 [03:10<35:31,  1.92s/it, loss=0.0901, v_num=0, train/loss_simple_step=0.00498, train/loss_vlb_step=2.54e-5, train/loss_step=0.00498, global_step=8178.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   8%|▊         | 100/1208 [03:13<35:42,  1.93s/it, loss=0.0901, v_num=0, train/loss_simple_step=0.00498, train/loss_vlb_step=2.54e-5, train/loss_step=0.00498, global_step=8178.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   8%|▊         | 100/1208 [03:13<35:42,  1.93s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000534, train/loss_step=0.159, global_step=8178.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:   8%|▊         | 101/1208 [03:14<35:31,  1.93s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000534, train/loss_step=0.159, global_step=8178.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   8%|▊         | 101/1208 [03:14<35:31,  1.93s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.00739, train/loss_vlb_step=3.65e-5, train/loss_step=0.00739, global_step=8179.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   8%|▊         | 102/1208 [03:15<35:19,  1.92s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.00739, train/loss_vlb_step=3.65e-5, train/loss_step=0.00739, global_step=8179.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   8%|▊         | 102/1208 [03:15<35:19,  1.92s/it, loss=0.0838, v_num=0, train/loss_simple_step=0.00734, train/loss_vlb_step=3.57e-5, train/loss_step=0.00734, global_step=8179.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   9%|▊         | 103/1208 [03:16<35:08,  1.91s/it, loss=0.0838, v_num=0, train/loss_simple_step=0.00734, train/loss_vlb_step=3.57e-5, train/loss_step=0.00734, global_step=8179.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   9%|▊         | 103/1208 [03:16<35:08,  1.91s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.0547, train/loss_vlb_step=0.000191, train/loss_step=0.0547, global_step=8179.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:   9%|▊         | 104/1208 [03:19<35:20,  1.92s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.0547, train/loss_vlb_step=0.000191, train/loss_step=0.0547, global_step=8179.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   9%|▊         | 104/1208 [03:19<35:20,  1.92s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.00704, train/loss_vlb_step=3.57e-5, train/loss_step=0.00704, global_step=8179.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   9%|▊         | 105/1208 [03:20<35:10,  1.91s/it, loss=0.0851, v_num=0, train/loss_simple_step=0.00704, train/loss_vlb_step=3.57e-5, train/loss_step=0.00704, global_step=8179.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   9%|▊         | 105/1208 [03:20<35:10,  1.91s/it, loss=0.0779, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.16e-5, train/loss_step=0.00192, global_step=8180.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   9%|▉         | 106/1208 [03:21<34:59,  1.90s/it, loss=0.0779, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.16e-5, train/loss_step=0.00192, global_step=8180.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   9%|▉         | 106/1208 [03:21<34:59,  1.90s/it, loss=0.0749, v_num=0, train/loss_simple_step=0.00633, train/loss_vlb_step=3.12e-5, train/loss_step=0.00633, global_step=8180.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   9%|▉         | 107/1208 [03:22<34:48,  1.90s/it, loss=0.0749, v_num=0, train/loss_simple_step=0.00633, train/loss_vlb_step=3.12e-5, train/loss_step=0.00633, global_step=8180.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   9%|▉         | 107/1208 [03:22<34:48,  1.90s/it, loss=0.0664, v_num=0, train/loss_simple_step=0.00704, train/loss_vlb_step=3.37e-5, train/loss_step=0.00704, global_step=8180.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   9%|▉         | 108/1208 [03:26<35:00,  1.91s/it, loss=0.0664, v_num=0, train/loss_simple_step=0.00704, train/loss_vlb_step=3.37e-5, train/loss_step=0.00704, global_step=8180.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   9%|▉         | 108/1208 [03:26<35:00,  1.91s/it, loss=0.0656, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000111, train/loss_step=0.0288, global_step=8180.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:   9%|▉         | 109/1208 [03:27<34:50,  1.90s/it, loss=0.0656, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000111, train/loss_step=0.0288, global_step=8180.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   9%|▉         | 109/1208 [03:27<34:50,  1.90s/it, loss=0.0572, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=8.87e-5, train/loss_step=0.0224, global_step=8181.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:   9%|▉         | 110/1208 [03:28<34:40,  1.89s/it, loss=0.0572, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=8.87e-5, train/loss_step=0.0224, global_step=8181.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   9%|▉         | 110/1208 [03:28<34:40,  1.89s/it, loss=0.0658, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000702, train/loss_step=0.193, global_step=8181.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:   9%|▉         | 111/1208 [03:29<34:30,  1.89s/it, loss=0.0658, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000702, train/loss_step=0.193, global_step=8181.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   9%|▉         | 111/1208 [03:29<34:30,  1.89s/it, loss=0.0754, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000895, train/loss_step=0.215, global_step=8181.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   9%|▉         | 112/1208 [03:32<34:41,  1.90s/it, loss=0.0754, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000895, train/loss_step=0.215, global_step=8181.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   9%|▉         | 112/1208 [03:32<34:41,  1.90s/it, loss=0.0833, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000864, train/loss_step=0.229, global_step=8181.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   9%|▉         | 113/1208 [03:33<34:31,  1.89s/it, loss=0.0833, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000864, train/loss_step=0.229, global_step=8181.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   9%|▉         | 113/1208 [03:33<34:31,  1.89s/it, loss=0.089, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=8182.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:   9%|▉         | 114/1208 [03:34<34:21,  1.88s/it, loss=0.089, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=8182.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:   9%|▉         | 114/1208 [03:34<34:21,  1.88s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000685, train/loss_step=0.186, global_step=8182.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  10%|▉         | 115/1208 [03:35<34:11,  1.88s/it, loss=0.0971, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000685, train/loss_step=0.186, global_step=8182.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  10%|▉         | 115/1208 [03:35<34:11,  1.88s/it, loss=0.095, v_num=0, train/loss_simple_step=0.0055, train/loss_vlb_step=2.87e-5, train/loss_step=0.0055, global_step=8182.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  10%|▉         | 116/1208 [03:39<34:22,  1.89s/it, loss=0.095, v_num=0, train/loss_simple_step=0.0055, train/loss_vlb_step=2.87e-5, train/loss_step=0.0055, global_step=8182.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  10%|▉         | 116/1208 [03:39<34:22,  1.89s/it, loss=0.083, v_num=0, train/loss_simple_step=0.0899, train/loss_vlb_step=0.000297, train/loss_step=0.0899, global_step=8182.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  10%|▉         | 117/1208 [03:40<34:12,  1.88s/it, loss=0.083, v_num=0, train/loss_simple_step=0.0899, train/loss_vlb_step=0.000297, train/loss_step=0.0899, global_step=8182.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  10%|▉         | 117/1208 [03:40<34:12,  1.88s/it, loss=0.109, v_num=0, train/loss_simple_step=0.518, train/loss_vlb_step=0.00716, train/loss_step=0.518, global_step=8183.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  10%|▉         | 118/1208 [03:41<34:03,  1.87s/it, loss=0.109, v_num=0, train/loss_simple_step=0.518, train/loss_vlb_step=0.00716, train/loss_step=0.518, global_step=8183.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  10%|▉         | 118/1208 [03:41<34:03,  1.87s/it, loss=0.103, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000715, train/loss_step=0.194, global_step=8183.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  10%|▉         | 119/1208 [03:42<33:53,  1.87s/it, loss=0.103, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000715, train/loss_step=0.194, global_step=8183.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  10%|▉         | 119/1208 [03:42<33:53,  1.87s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00706, train/loss_vlb_step=3.5e-5, train/loss_step=0.00706, global_step=8183.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  10%|▉         | 120/1208 [03:45<34:05,  1.88s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00706, train/loss_vlb_step=3.5e-5, train/loss_step=0.00706, global_step=8183.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  10%|▉         | 120/1208 [03:45<34:05,  1.88s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.0797, train/loss_vlb_step=0.000265, train/loss_step=0.0797, global_step=8183.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  10%|█         | 121/1208 [03:46<33:56,  1.87s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.0797, train/loss_vlb_step=0.000265, train/loss_step=0.0797, global_step=8183.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  10%|█         | 121/1208 [03:46<33:56,  1.87s/it, loss=0.103, v_num=0, train/loss_simple_step=0.080, train/loss_vlb_step=0.000269, train/loss_step=0.080, global_step=8184.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  10%|█         | 122/1208 [03:47<33:47,  1.87s/it, loss=0.103, v_num=0, train/loss_simple_step=0.080, train/loss_vlb_step=0.000269, train/loss_step=0.080, global_step=8184.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  10%|█         | 122/1208 [03:47<33:47,  1.87s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0779, train/loss_vlb_step=0.000262, train/loss_step=0.0779, global_step=8184.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  10%|█         | 123/1208 [03:48<33:38,  1.86s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0779, train/loss_vlb_step=0.000262, train/loss_step=0.0779, global_step=8184.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  10%|█         | 123/1208 [03:48<33:38,  1.86s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0916, train/loss_vlb_step=0.000301, train/loss_step=0.0916, global_step=8184.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  10%|█         | 124/1208 [03:52<33:48,  1.87s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0916, train/loss_vlb_step=0.000301, train/loss_step=0.0916, global_step=8184.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  10%|█         | 124/1208 [03:52<33:48,  1.87s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=1.38e-5, train/loss_step=0.0024, global_step=8184.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  10%|█         | 125/1208 [03:53<33:39,  1.87s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=1.38e-5, train/loss_step=0.0024, global_step=8184.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  10%|█         | 125/1208 [03:53<33:39,  1.87s/it, loss=0.116, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000591, train/loss_step=0.169, global_step=8185.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  10%|█         | 126/1208 [03:54<33:30,  1.86s/it, loss=0.116, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000591, train/loss_step=0.169, global_step=8185.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  10%|█         | 126/1208 [03:54<33:30,  1.86s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.59e-5, train/loss_step=0.0214, global_step=8185.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  11%|█         | 127/1208 [03:55<33:22,  1.85s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.59e-5, train/loss_step=0.0214, global_step=8185.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  11%|█         | 127/1208 [03:55<33:22,  1.85s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0779, train/loss_vlb_step=0.000264, train/loss_step=0.0779, global_step=8185.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  11%|█         | 128/1208 [03:58<33:32,  1.86s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0779, train/loss_vlb_step=0.000264, train/loss_step=0.0779, global_step=8185.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  11%|█         | 128/1208 [03:58<33:32,  1.86s/it, loss=0.121, v_num=0, train/loss_simple_step=0.052, train/loss_vlb_step=0.00018, train/loss_step=0.052, global_step=8185.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  11%|█         | 129/1208 [03:59<33:23,  1.86s/it, loss=0.121, v_num=0, train/loss_simple_step=0.052, train/loss_vlb_step=0.00018, train/loss_step=0.052, global_step=8185.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  11%|█         | 129/1208 [03:59<33:23,  1.86s/it, loss=0.127, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000441, train/loss_step=0.134, global_step=8186.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  11%|█         | 130/1208 [04:00<33:15,  1.85s/it, loss=0.127, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000441, train/loss_step=0.134, global_step=8186.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  11%|█         | 130/1208 [04:00<33:15,  1.85s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000248, train/loss_step=0.0741, global_step=8186.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  11%|█         | 131/1208 [04:01<33:07,  1.85s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0741, train/loss_vlb_step=0.000248, train/loss_step=0.0741, global_step=8186.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  11%|█         | 131/1208 [04:01<33:07,  1.85s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00393, train/loss_vlb_step=2.07e-5, train/loss_step=0.00393, global_step=8186.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  11%|█         | 132/1208 [04:04<33:15,  1.85s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00393, train/loss_vlb_step=2.07e-5, train/loss_step=0.00393, global_step=8186.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  11%|█         | 132/1208 [04:04<33:15,  1.85s/it, loss=0.113, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00113, train/loss_step=0.276, global_step=8186.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  11%|█         | 133/1208 [04:05<33:07,  1.85s/it, loss=0.113, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00113, train/loss_step=0.276, global_step=8186.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  11%|█         | 133/1208 [04:05<33:07,  1.85s/it, loss=0.117, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000708, train/loss_step=0.197, global_step=8187.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  11%|█         | 134/1208 [04:06<32:59,  1.84s/it, loss=0.117, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000708, train/loss_step=0.197, global_step=8187.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  11%|█         | 134/1208 [04:06<32:59,  1.84s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0726, train/loss_vlb_step=0.000246, train/loss_step=0.0726, global_step=8187.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  11%|█         | 135/1208 [04:08<32:51,  1.84s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0726, train/loss_vlb_step=0.000246, train/loss_step=0.0726, global_step=8187.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  11%|█         | 135/1208 [04:08<32:51,  1.84s/it, loss=0.121, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000781, train/loss_step=0.211, global_step=8187.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  11%|█▏        | 136/1208 [04:11<33:01,  1.85s/it, loss=0.121, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000781, train/loss_step=0.211, global_step=8187.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  11%|█▏        | 136/1208 [04:11<33:01,  1.85s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=1.32e-5, train/loss_step=0.0023, global_step=8187.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  11%|█▏        | 137/1208 [04:12<32:53,  1.84s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=1.32e-5, train/loss_step=0.0023, global_step=8187.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  11%|█▏        | 137/1208 [04:12<32:53,  1.84s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.0742, train/loss_vlb_step=0.000248, train/loss_step=0.0742, global_step=8188.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  11%|█▏        | 138/1208 [04:13<32:45,  1.84s/it, loss=0.0948, v_num=0, train/loss_simple_step=0.0742, train/loss_vlb_step=0.000248, train/loss_step=0.0742, global_step=8188.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  11%|█▏        | 138/1208 [04:13<32:45,  1.84s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.39e-5, train/loss_step=0.012, global_step=8188.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  12%|█▏        | 139/1208 [04:14<32:37,  1.83s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.39e-5, train/loss_step=0.012, global_step=8188.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  12%|█▏        | 139/1208 [04:14<32:37,  1.83s/it, loss=0.0907, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000351, train/loss_step=0.107, global_step=8188.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  12%|█▏        | 140/1208 [04:17<32:46,  1.84s/it, loss=0.0907, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000351, train/loss_step=0.107, global_step=8188.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  12%|█▏        | 140/1208 [04:17<32:46,  1.84s/it, loss=0.11, v_num=0, train/loss_simple_step=0.471, train/loss_vlb_step=0.00482, train/loss_step=0.471, global_step=8188.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  12%|█▏        | 141/1208 [04:18<32:38,  1.84s/it, loss=0.11, v_num=0, train/loss_simple_step=0.471, train/loss_vlb_step=0.00482, train/loss_step=0.471, global_step=8188.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  12%|█▏        | 141/1208 [04:18<32:38,  1.84s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00871, train/loss_vlb_step=4.3e-5, train/loss_step=0.00871, global_step=8189.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  12%|█▏        | 142/1208 [04:19<32:31,  1.83s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00871, train/loss_vlb_step=4.3e-5, train/loss_step=0.00871, global_step=8189.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  12%|█▏        | 142/1208 [04:19<32:31,  1.83s/it, loss=0.112, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000682, train/loss_step=0.179, global_step=8189.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  12%|█▏        | 143/1208 [04:20<32:23,  1.83s/it, loss=0.112, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000682, train/loss_step=0.179, global_step=8189.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  12%|█▏        | 143/1208 [04:20<32:23,  1.83s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0906, train/loss_vlb_step=0.000298, train/loss_step=0.0906, global_step=8189.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  12%|█▏        | 144/1208 [04:24<32:32,  1.84s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0906, train/loss_vlb_step=0.000298, train/loss_step=0.0906, global_step=8189.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  12%|█▏        | 144/1208 [04:24<32:32,  1.84s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0479, train/loss_vlb_step=0.000163, train/loss_step=0.0479, global_step=8189.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  12%|█▏        | 145/1208 [04:25<32:25,  1.83s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0479, train/loss_vlb_step=0.000163, train/loss_step=0.0479, global_step=8189.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  12%|█▏        | 145/1208 [04:25<32:25,  1.83s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=1.3e-5, train/loss_step=0.00221, global_step=8190.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  12%|█▏        | 146/1208 [04:26<32:17,  1.82s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=1.3e-5, train/loss_step=0.00221, global_step=8190.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  12%|█▏        | 146/1208 [04:26<32:17,  1.82s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0869, train/loss_vlb_step=0.000286, train/loss_step=0.0869, global_step=8190.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  12%|█▏        | 147/1208 [04:27<32:10,  1.82s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0869, train/loss_vlb_step=0.000286, train/loss_step=0.0869, global_step=8190.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  12%|█▏        | 147/1208 [04:27<32:10,  1.82s/it, loss=0.144, v_num=0, train/loss_simple_step=0.770, train/loss_vlb_step=0.0441, train/loss_step=0.770, global_step=8190.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  12%|█▏        | 148/1208 [04:30<32:19,  1.83s/it, loss=0.144, v_num=0, train/loss_simple_step=0.770, train/loss_vlb_step=0.0441, train/loss_step=0.770, global_step=8190.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  12%|█▏        | 148/1208 [04:30<32:19,  1.83s/it, loss=0.152, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000947, train/loss_step=0.231, global_step=8190.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  12%|█▏        | 149/1208 [04:31<32:11,  1.82s/it, loss=0.152, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000947, train/loss_step=0.231, global_step=8190.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  12%|█▏        | 149/1208 [04:31<32:11,  1.82s/it, loss=0.167, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00478, train/loss_step=0.425, global_step=8191.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  12%|█▏        | 150/1208 [04:32<32:04,  1.82s/it, loss=0.167, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00478, train/loss_step=0.425, global_step=8191.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  12%|█▏        | 150/1208 [04:32<32:04,  1.82s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0571, train/loss_vlb_step=0.000197, train/loss_step=0.0571, global_step=8191.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  12%|█▎        | 151/1208 [04:33<31:57,  1.81s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0571, train/loss_vlb_step=0.000197, train/loss_step=0.0571, global_step=8191.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  12%|█▎        | 151/1208 [04:33<31:57,  1.81s/it, loss=0.175, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000579, train/loss_step=0.176, global_step=8191.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  13%|█▎        | 152/1208 [04:37<32:05,  1.82s/it, loss=0.175, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000579, train/loss_step=0.176, global_step=8191.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  13%|█▎        | 152/1208 [04:37<32:05,  1.82s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00348, train/loss_vlb_step=1.9e-5, train/loss_step=0.00348, global_step=8191.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  13%|█▎        | 153/1208 [04:38<31:58,  1.82s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00348, train/loss_vlb_step=1.9e-5, train/loss_step=0.00348, global_step=8191.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  13%|█▎        | 153/1208 [04:38<31:58,  1.82s/it, loss=0.162, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000834, train/loss_step=0.222, global_step=8192.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  13%|█▎        | 154/1208 [04:39<31:51,  1.81s/it, loss=0.162, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000834, train/loss_step=0.222, global_step=8192.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  13%|█▎        | 154/1208 [04:39<31:51,  1.81s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=1.33e-5, train/loss_step=0.00224, global_step=8192.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  13%|█▎        | 155/1208 [04:40<31:44,  1.81s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=1.33e-5, train/loss_step=0.00224, global_step=8192.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  13%|█▎        | 155/1208 [04:40<31:44,  1.81s/it, loss=0.157, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.00056, train/loss_step=0.163, global_step=8192.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  13%|█▎        | 156/1208 [04:43<31:51,  1.82s/it, loss=0.157, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.00056, train/loss_step=0.163, global_step=8192.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  13%|█▎        | 156/1208 [04:43<31:51,  1.82s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0503, train/loss_vlb_step=0.00018, train/loss_step=0.0503, global_step=8192.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  13%|█▎        | 157/1208 [04:44<31:45,  1.81s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0503, train/loss_vlb_step=0.00018, train/loss_step=0.0503, global_step=8192.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  13%|█▎        | 157/1208 [04:44<31:45,  1.81s/it, loss=0.171, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00178, train/loss_step=0.313, global_step=8193.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  13%|█▎        | 158/1208 [04:45<31:38,  1.81s/it, loss=0.171, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00178, train/loss_step=0.313, global_step=8193.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  13%|█▎        | 158/1208 [04:45<31:38,  1.81s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.000115, train/loss_step=0.0312, global_step=8193.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  13%|█▎        | 159/1208 [04:46<31:31,  1.80s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.000115, train/loss_step=0.0312, global_step=8193.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  13%|█▎        | 159/1208 [04:46<31:31,  1.80s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=8.99e-5, train/loss_step=0.0245, global_step=8193.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  13%|█▎        | 160/1208 [04:49<31:38,  1.81s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=8.99e-5, train/loss_step=0.0245, global_step=8193.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  13%|█▎        | 160/1208 [04:49<31:38,  1.81s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00383, train/loss_vlb_step=2.08e-5, train/loss_step=0.00383, global_step=8193.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  13%|█▎        | 161/1208 [04:50<31:32,  1.81s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00383, train/loss_vlb_step=2.08e-5, train/loss_step=0.00383, global_step=8193.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  13%|█▎        | 161/1208 [04:50<31:32,  1.81s/it, loss=0.149, v_num=0, train/loss_simple_step=0.092, train/loss_vlb_step=0.000303, train/loss_step=0.092, global_step=8194.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  13%|█▎        | 162/1208 [04:52<31:25,  1.80s/it, loss=0.149, v_num=0, train/loss_simple_step=0.092, train/loss_vlb_step=0.000303, train/loss_step=0.092, global_step=8194.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  13%|█▎        | 162/1208 [04:52<31:25,  1.80s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000102, train/loss_step=0.0255, global_step=8194.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  13%|█▎        | 163/1208 [04:53<31:18,  1.80s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000102, train/loss_step=0.0255, global_step=8194.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  13%|█▎        | 163/1208 [04:53<31:18,  1.80s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000116, train/loss_step=0.0302, global_step=8194.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  14%|█▎        | 164/1208 [04:56<31:25,  1.81s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000116, train/loss_step=0.0302, global_step=8194.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  14%|█▎        | 164/1208 [04:56<31:25,  1.81s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0506, train/loss_vlb_step=0.000178, train/loss_step=0.0506, global_step=8194.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  14%|█▎        | 165/1208 [04:57<31:19,  1.80s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0506, train/loss_vlb_step=0.000178, train/loss_step=0.0506, global_step=8194.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  14%|█▎        | 165/1208 [04:57<31:19,  1.80s/it, loss=0.162, v_num=0, train/loss_simple_step=0.483, train/loss_vlb_step=0.00419, train/loss_step=0.483, global_step=8195.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  14%|█▎        | 166/1208 [04:58<31:12,  1.80s/it, loss=0.162, v_num=0, train/loss_simple_step=0.483, train/loss_vlb_step=0.00419, train/loss_step=0.483, global_step=8195.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  14%|█▎        | 166/1208 [04:58<31:12,  1.80s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000125, train/loss_step=0.0336, global_step=8195.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  14%|█▍        | 167/1208 [04:59<31:06,  1.79s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000125, train/loss_step=0.0336, global_step=8195.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  14%|█▍        | 167/1208 [04:59<31:06,  1.79s/it, loss=0.145, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.0042, train/loss_step=0.485, global_step=8195.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  14%|█▍        | 168/1208 [05:02<31:13,  1.80s/it, loss=0.145, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.0042, train/loss_step=0.485, global_step=8195.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  14%|█▍        | 168/1208 [05:02<31:13,  1.80s/it, loss=0.139, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=8195.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  14%|█▍        | 169/1208 [05:03<31:07,  1.80s/it, loss=0.139, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=8195.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  14%|█▍        | 169/1208 [05:03<31:07,  1.80s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000107, train/loss_step=0.0278, global_step=8196.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  14%|█▍        | 170/1208 [05:04<31:01,  1.79s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000107, train/loss_step=0.0278, global_step=8196.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  14%|█▍        | 170/1208 [05:04<31:01,  1.79s/it, loss=0.125, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000561, train/loss_step=0.163, global_step=8196.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  14%|█▍        | 171/1208 [05:05<30:54,  1.79s/it, loss=0.125, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000561, train/loss_step=0.163, global_step=8196.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  14%|█▍        | 171/1208 [05:05<30:54,  1.79s/it, loss=0.122, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=8196.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  14%|█▍        | 172/1208 [05:09<31:01,  1.80s/it, loss=0.122, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=8196.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  14%|█▍        | 172/1208 [05:09<31:01,  1.80s/it, loss=0.131, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000768, train/loss_step=0.195, global_step=8196.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  14%|█▍        | 173/1208 [05:10<30:55,  1.79s/it, loss=0.131, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000768, train/loss_step=0.195, global_step=8196.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  14%|█▍        | 173/1208 [05:10<30:55,  1.79s/it, loss=0.142, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00441, train/loss_step=0.442, global_step=8197.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  14%|█▍        | 174/1208 [05:11<30:49,  1.79s/it, loss=0.142, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00441, train/loss_step=0.442, global_step=8197.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  14%|█▍        | 174/1208 [05:11<30:49,  1.79s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=9.27e-5, train/loss_step=0.0223, global_step=8197.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  14%|█▍        | 175/1208 [05:12<30:43,  1.78s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=9.27e-5, train/loss_step=0.0223, global_step=8197.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  14%|█▍        | 175/1208 [05:12<30:43,  1.78s/it, loss=0.142, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000411, train/loss_step=0.124, global_step=8197.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  15%|█▍        | 176/1208 [05:15<30:49,  1.79s/it, loss=0.142, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000411, train/loss_step=0.124, global_step=8197.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  15%|█▍        | 176/1208 [05:15<30:49,  1.79s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0974, train/loss_vlb_step=0.00032, train/loss_step=0.0974, global_step=8197.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  15%|█▍        | 177/1208 [05:16<30:43,  1.79s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0974, train/loss_vlb_step=0.00032, train/loss_step=0.0974, global_step=8197.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  15%|█▍        | 177/1208 [05:16<30:43,  1.79s/it, loss=0.163, v_num=0, train/loss_simple_step=0.700, train/loss_vlb_step=0.0164, train/loss_step=0.700, global_step=8198.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  15%|█▍        | 178/1208 [05:17<30:37,  1.78s/it, loss=0.163, v_num=0, train/loss_simple_step=0.700, train/loss_vlb_step=0.0164, train/loss_step=0.700, global_step=8198.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  15%|█▍        | 178/1208 [05:17<30:37,  1.78s/it, loss=0.176, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00135, train/loss_step=0.295, global_step=8198.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  15%|█▍        | 179/1208 [05:18<30:32,  1.78s/it, loss=0.176, v_num=0, train/loss_simple_step=0.295, train/loss_vlb_step=0.00135, train/loss_step=0.295, global_step=8198.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  15%|█▍        | 179/1208 [05:18<30:32,  1.78s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0712, train/loss_vlb_step=0.000244, train/loss_step=0.0712, global_step=8198.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  15%|█▍        | 180/1208 [05:21<30:38,  1.79s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0712, train/loss_vlb_step=0.000244, train/loss_step=0.0712, global_step=8198.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  15%|█▍        | 180/1208 [05:21<30:38,  1.79s/it, loss=0.189, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000848, train/loss_step=0.213, global_step=8198.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  15%|█▍        | 181/1208 [05:22<30:32,  1.78s/it, loss=0.189, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000848, train/loss_step=0.213, global_step=8198.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  15%|█▍        | 181/1208 [05:22<30:32,  1.78s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00141, train/loss_vlb_step=8.43e-6, train/loss_step=0.00141, global_step=8199.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  15%|█▌        | 182/1208 [05:23<30:26,  1.78s/it, loss=0.185, v_num=0, train/loss_simple_step=0.00141, train/loss_vlb_step=8.43e-6, train/loss_step=0.00141, global_step=8199.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  15%|█▌        | 182/1208 [05:23<30:26,  1.78s/it, loss=0.184, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.61e-5, train/loss_step=0.003, global_step=8199.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  15%|█▌        | 183/1208 [05:25<30:20,  1.78s/it, loss=0.184, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.61e-5, train/loss_step=0.003, global_step=8199.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  15%|█▌        | 183/1208 [05:25<30:20,  1.78s/it, loss=0.189, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000427, train/loss_step=0.129, global_step=8199.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  15%|█▌        | 184/1208 [05:28<30:26,  1.78s/it, loss=0.189, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000427, train/loss_step=0.129, global_step=8199.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  15%|█▌        | 184/1208 [05:28<30:26,  1.78s/it, loss=0.2, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00153, train/loss_step=0.288, global_step=8199.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  15%|█▌        | 185/1208 [05:29<30:20,  1.78s/it, loss=0.2, v_num=0, train/loss_simple_step=0.288, train/loss_vlb_step=0.00153, train/loss_step=0.288, global_step=8199.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  15%|█▌        | 185/1208 [05:29<30:20,  1.78s/it, loss=0.21, v_num=0, train/loss_simple_step=0.682, train/loss_vlb_step=0.0174, train/loss_step=0.682, global_step=8200.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  15%|█▌        | 186/1208 [05:30<30:15,  1.78s/it, loss=0.21, v_num=0, train/loss_simple_step=0.682, train/loss_vlb_step=0.0174, train/loss_step=0.682, global_step=8200.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  15%|█▌        | 186/1208 [05:30<30:15,  1.78s/it, loss=0.209, v_num=0, train/loss_simple_step=0.00551, train/loss_vlb_step=2.91e-5, train/loss_step=0.00551, global_step=8200.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  15%|█▌        | 187/1208 [05:31<30:09,  1.77s/it, loss=0.209, v_num=0, train/loss_simple_step=0.00551, train/loss_vlb_step=2.91e-5, train/loss_step=0.00551, global_step=8200.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  15%|█▌        | 187/1208 [05:31<30:09,  1.77s/it, loss=0.21, v_num=0, train/loss_simple_step=0.506, train/loss_vlb_step=0.00383, train/loss_step=0.506, global_step=8200.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]     Epoch 27:  16%|█▌        | 188/1208 [05:34<30:15,  1.78s/it, loss=0.21, v_num=0, train/loss_simple_step=0.506, train/loss_vlb_step=0.00383, train/loss_step=0.506, global_step=8200.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  16%|█▌        | 188/1208 [05:34<30:15,  1.78s/it, loss=0.213, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000651, train/loss_step=0.183, global_step=8200.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  16%|█▌        | 189/1208 [05:35<30:10,  1.78s/it, loss=0.213, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000651, train/loss_step=0.183, global_step=8200.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  16%|█▌        | 189/1208 [05:35<30:10,  1.78s/it, loss=0.214, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.00012, train/loss_step=0.0296, global_step=8201.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  16%|█▌        | 190/1208 [05:36<30:04,  1.77s/it, loss=0.214, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.00012, train/loss_step=0.0296, global_step=8201.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  16%|█▌        | 190/1208 [05:36<30:04,  1.77s/it, loss=0.215, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000713, train/loss_step=0.193, global_step=8201.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  16%|█▌        | 191/1208 [05:37<29:59,  1.77s/it, loss=0.215, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.000713, train/loss_step=0.193, global_step=8201.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  16%|█▌        | 191/1208 [05:37<29:59,  1.77s/it, loss=0.209, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.38e-5, train/loss_step=0.00236, global_step=8201.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  16%|█▌        | 192/1208 [05:41<30:04,  1.78s/it, loss=0.209, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.38e-5, train/loss_step=0.00236, global_step=8201.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  16%|█▌        | 192/1208 [05:41<30:04,  1.78s/it, loss=0.2, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.54e-5, train/loss_step=0.00268, global_step=8201.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  16%|█▌        | 193/1208 [05:42<29:59,  1.77s/it, loss=0.2, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.54e-5, train/loss_step=0.00268, global_step=8201.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  16%|█▌        | 193/1208 [05:42<29:59,  1.77s/it, loss=0.179, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=8.59e-5, train/loss_step=0.022, global_step=8202.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  16%|█▌        | 194/1208 [05:43<29:54,  1.77s/it, loss=0.179, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=8.59e-5, train/loss_step=0.022, global_step=8202.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  16%|█▌        | 194/1208 [05:43<29:54,  1.77s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=2.12e-5, train/loss_step=0.00395, global_step=8202.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  16%|█▌        | 195/1208 [05:44<29:48,  1.77s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=2.12e-5, train/loss_step=0.00395, global_step=8202.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  16%|█▌        | 195/1208 [05:44<29:48,  1.77s/it, loss=0.184, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00116, train/loss_step=0.256, global_step=8202.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  16%|█▌        | 196/1208 [05:47<29:54,  1.77s/it, loss=0.184, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00116, train/loss_step=0.256, global_step=8202.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  16%|█▌        | 196/1208 [05:47<29:54,  1.77s/it, loss=0.19, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000711, train/loss_step=0.204, global_step=8202.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  16%|█▋        | 197/1208 [05:48<29:49,  1.77s/it, loss=0.19, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000711, train/loss_step=0.204, global_step=8202.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  16%|█▋        | 197/1208 [05:48<29:49,  1.77s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0624, train/loss_vlb_step=0.000214, train/loss_step=0.0624, global_step=8203.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  16%|█▋        | 198/1208 [05:49<29:43,  1.77s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0624, train/loss_vlb_step=0.000214, train/loss_step=0.0624, global_step=8203.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  16%|█▋        | 198/1208 [05:49<29:43,  1.77s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0338, train/loss_vlb_step=0.000125, train/loss_step=0.0338, global_step=8203.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  16%|█▋        | 199/1208 [05:50<29:38,  1.76s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0338, train/loss_vlb_step=0.000125, train/loss_step=0.0338, global_step=8203.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  16%|█▋        | 199/1208 [05:50<29:38,  1.76s/it, loss=0.161, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00303, train/loss_step=0.404, global_step=8203.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  17%|█▋        | 200/1208 [05:53<29:44,  1.77s/it, loss=0.161, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00303, train/loss_step=0.404, global_step=8203.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  17%|█▋        | 200/1208 [05:53<29:44,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000928, train/loss_step=0.227, global_step=8203.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  17%|█▋        | 201/1208 [05:55<29:38,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000928, train/loss_step=0.227, global_step=8203.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  17%|█▋        | 201/1208 [05:55<29:38,  1.77s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0899, train/loss_vlb_step=0.000296, train/loss_step=0.0899, global_step=8204.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  17%|█▋        | 202/1208 [05:56<29:33,  1.76s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0899, train/loss_vlb_step=0.000296, train/loss_step=0.0899, global_step=8204.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  17%|█▋        | 202/1208 [05:56<29:33,  1.76s/it, loss=0.174, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000541, train/loss_step=0.162, global_step=8204.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  17%|█▋        | 203/1208 [05:57<29:28,  1.76s/it, loss=0.174, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000541, train/loss_step=0.162, global_step=8204.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  17%|█▋        | 203/1208 [05:57<29:28,  1.76s/it, loss=0.169, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.28e-5, train/loss_step=0.023, global_step=8204.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  17%|█▋        | 204/1208 [06:00<29:34,  1.77s/it, loss=0.169, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.28e-5, train/loss_step=0.023, global_step=8204.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  17%|█▋        | 204/1208 [06:00<29:34,  1.77s/it, loss=0.17, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.0017, train/loss_step=0.312, global_step=8204.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  17%|█▋        | 205/1208 [06:01<29:28,  1.76s/it, loss=0.17, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.0017, train/loss_step=0.312, global_step=8204.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  17%|█▋        | 205/1208 [06:01<29:28,  1.76s/it, loss=0.155, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00208, train/loss_step=0.369, global_step=8205.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  17%|█▋        | 206/1208 [06:02<29:23,  1.76s/it, loss=0.155, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00208, train/loss_step=0.369, global_step=8205.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  17%|█▋        | 206/1208 [06:02<29:23,  1.76s/it, loss=0.16, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000351, train/loss_step=0.107, global_step=8205.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  17%|█▋        | 207/1208 [06:03<29:18,  1.76s/it, loss=0.16, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000351, train/loss_step=0.107, global_step=8205.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  17%|█▋        | 207/1208 [06:03<29:18,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=3.5e-5, train/loss_step=0.00742, global_step=8205.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  17%|█▋        | 208/1208 [06:06<29:24,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=3.5e-5, train/loss_step=0.00742, global_step=8205.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  17%|█▋        | 208/1208 [06:06<29:24,  1.76s/it, loss=0.134, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000588, train/loss_step=0.169, global_step=8205.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  17%|█▋        | 209/1208 [06:07<29:18,  1.76s/it, loss=0.134, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000588, train/loss_step=0.169, global_step=8205.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  17%|█▋        | 209/1208 [06:07<29:18,  1.76s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00443, train/loss_vlb_step=2.45e-5, train/loss_step=0.00443, global_step=8206.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  17%|█▋        | 210/1208 [06:09<29:13,  1.76s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00443, train/loss_vlb_step=2.45e-5, train/loss_step=0.00443, global_step=8206.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  17%|█▋        | 210/1208 [06:09<29:13,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.000984, train/loss_step=0.267, global_step=8206.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  17%|█▋        | 211/1208 [06:10<29:08,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.000984, train/loss_step=0.267, global_step=8206.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  17%|█▋        | 211/1208 [06:10<29:08,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0954, train/loss_vlb_step=0.000314, train/loss_step=0.0954, global_step=8206.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  18%|█▊        | 212/1208 [06:13<29:13,  1.76s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0954, train/loss_vlb_step=0.000314, train/loss_step=0.0954, global_step=8206.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  18%|█▊        | 212/1208 [06:13<29:13,  1.76s/it, loss=0.154, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00102, train/loss_step=0.262, global_step=8206.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  18%|█▊        | 213/1208 [06:14<29:08,  1.76s/it, loss=0.154, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00102, train/loss_step=0.262, global_step=8206.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  18%|█▊        | 213/1208 [06:14<29:08,  1.76s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0775, train/loss_vlb_step=0.00026, train/loss_step=0.0775, global_step=8207.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  18%|█▊        | 214/1208 [06:15<29:03,  1.75s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0775, train/loss_vlb_step=0.00026, train/loss_step=0.0775, global_step=8207.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  18%|█▊        | 214/1208 [06:15<29:03,  1.75s/it, loss=0.167, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000774, train/loss_step=0.201, global_step=8207.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  18%|█▊        | 215/1208 [06:16<28:58,  1.75s/it, loss=0.167, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000774, train/loss_step=0.201, global_step=8207.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  18%|█▊        | 215/1208 [06:16<28:58,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0502, train/loss_vlb_step=0.000171, train/loss_step=0.0502, global_step=8207.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  18%|█▊        | 216/1208 [06:19<29:04,  1.76s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0502, train/loss_vlb_step=0.000171, train/loss_step=0.0502, global_step=8207.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  18%|█▊        | 216/1208 [06:19<29:04,  1.76s/it, loss=0.162, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00144, train/loss_step=0.315, global_step=8207.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  18%|█▊        | 217/1208 [06:20<28:59,  1.76s/it, loss=0.162, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00144, train/loss_step=0.315, global_step=8207.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  18%|█▊        | 217/1208 [06:20<28:59,  1.76s/it, loss=0.165, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000414, train/loss_step=0.126, global_step=8208.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  18%|█▊        | 218/1208 [06:22<28:54,  1.75s/it, loss=0.165, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000414, train/loss_step=0.126, global_step=8208.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  18%|█▊        | 218/1208 [06:22<28:54,  1.75s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00494, train/loss_vlb_step=2.6e-5, train/loss_step=0.00494, global_step=8208.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  18%|█▊        | 219/1208 [06:23<28:50,  1.75s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00494, train/loss_vlb_step=2.6e-5, train/loss_step=0.00494, global_step=8208.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  18%|█▊        | 219/1208 [06:23<28:50,  1.75s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.6e-5, train/loss_step=0.0147, global_step=8208.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  18%|█▊        | 220/1208 [06:26<28:55,  1.76s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.6e-5, train/loss_step=0.0147, global_step=8208.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  18%|█▊        | 220/1208 [06:26<28:55,  1.76s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00818, train/loss_vlb_step=3.86e-5, train/loss_step=0.00818, global_step=8208.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  18%|█▊        | 221/1208 [06:27<28:50,  1.75s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00818, train/loss_vlb_step=3.86e-5, train/loss_step=0.00818, global_step=8208.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  18%|█▊        | 221/1208 [06:27<28:50,  1.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.441, train/loss_vlb_step=0.00427, train/loss_step=0.441, global_step=8209.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  18%|█▊        | 222/1208 [06:28<28:45,  1.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.441, train/loss_vlb_step=0.00427, train/loss_step=0.441, global_step=8209.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  18%|█▊        | 222/1208 [06:28<28:45,  1.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000559, train/loss_step=0.158, global_step=8209.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  18%|█▊        | 223/1208 [06:29<28:40,  1.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000559, train/loss_step=0.158, global_step=8209.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  18%|█▊        | 223/1208 [06:29<28:40,  1.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=6.96e-5, train/loss_step=0.0173, global_step=8209.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  19%|█▊        | 224/1208 [06:32<28:45,  1.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=6.96e-5, train/loss_step=0.0173, global_step=8209.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  19%|█▊        | 224/1208 [06:32<28:45,  1.75s/it, loss=0.149, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00146, train/loss_step=0.280, global_step=8209.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  19%|█▊        | 225/1208 [06:33<28:40,  1.75s/it, loss=0.149, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00146, train/loss_step=0.280, global_step=8209.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  19%|█▊        | 225/1208 [06:33<28:40,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.26e-5, train/loss_step=0.0021, global_step=8210.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  19%|█▊        | 226/1208 [06:34<28:35,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.26e-5, train/loss_step=0.0021, global_step=8210.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  19%|█▊        | 226/1208 [06:34<28:35,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0481, train/loss_vlb_step=0.000172, train/loss_step=0.0481, global_step=8210.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  19%|█▉        | 227/1208 [06:35<28:31,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0481, train/loss_vlb_step=0.000172, train/loss_step=0.0481, global_step=8210.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  19%|█▉        | 227/1208 [06:35<28:31,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00117, train/loss_step=0.262, global_step=8210.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  19%|█▉        | 228/1208 [06:39<28:35,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00117, train/loss_step=0.262, global_step=8210.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  19%|█▉        | 228/1208 [06:39<28:35,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0978, train/loss_vlb_step=0.000323, train/loss_step=0.0978, global_step=8210.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  19%|█▉        | 229/1208 [06:40<28:31,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0978, train/loss_vlb_step=0.000323, train/loss_step=0.0978, global_step=8210.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  19%|█▉        | 229/1208 [06:40<28:31,  1.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=8211.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  19%|█▉        | 230/1208 [06:41<28:26,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=8211.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  19%|█▉        | 230/1208 [06:41<28:26,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=9.82e-5, train/loss_step=0.0249, global_step=8211.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  19%|█▉        | 231/1208 [06:42<28:21,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=9.82e-5, train/loss_step=0.0249, global_step=8211.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  19%|█▉        | 231/1208 [06:42<28:21,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.24e-5, train/loss_step=0.0214, global_step=8211.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  19%|█▉        | 232/1208 [06:45<28:26,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.24e-5, train/loss_step=0.0214, global_step=8211.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  19%|█▉        | 232/1208 [06:45<28:26,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0602, train/loss_vlb_step=0.000203, train/loss_step=0.0602, global_step=8211.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  19%|█▉        | 233/1208 [06:46<28:21,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0602, train/loss_vlb_step=0.000203, train/loss_step=0.0602, global_step=8211.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  19%|█▉        | 233/1208 [06:46<28:21,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0766, train/loss_vlb_step=0.000254, train/loss_step=0.0766, global_step=8212.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  19%|█▉        | 234/1208 [06:47<28:17,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0766, train/loss_vlb_step=0.000254, train/loss_step=0.0766, global_step=8212.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  19%|█▉        | 234/1208 [06:47<28:17,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00379, train/loss_step=0.386, global_step=8212.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  19%|█▉        | 235/1208 [06:48<28:12,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00379, train/loss_step=0.386, global_step=8212.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  19%|█▉        | 235/1208 [06:48<28:12,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000139, train/loss_step=0.0386, global_step=8212.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  20%|█▉        | 236/1208 [06:51<28:16,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000139, train/loss_step=0.0386, global_step=8212.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  20%|█▉        | 236/1208 [06:51<28:16,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000614, train/loss_step=0.177, global_step=8212.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  20%|█▉        | 237/1208 [06:53<28:12,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000614, train/loss_step=0.177, global_step=8212.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  20%|█▉        | 237/1208 [06:53<28:12,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000485, train/loss_step=0.145, global_step=8213.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  20%|█▉        | 238/1208 [06:54<28:07,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000485, train/loss_step=0.145, global_step=8213.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  20%|█▉        | 238/1208 [06:54<28:07,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.0013, train/loss_step=0.254, global_step=8213.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  20%|█▉        | 239/1208 [06:55<28:03,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.0013, train/loss_step=0.254, global_step=8213.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  20%|█▉        | 239/1208 [06:55<28:03,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000107, train/loss_step=0.0272, global_step=8213.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  20%|█▉        | 240/1208 [06:58<28:07,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000107, train/loss_step=0.0272, global_step=8213.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  20%|█▉        | 240/1208 [06:58<28:07,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.000163, train/loss_step=0.0456, global_step=8213.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  20%|█▉        | 241/1208 [06:59<28:03,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.000163, train/loss_step=0.0456, global_step=8213.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  20%|█▉        | 241/1208 [06:59<28:03,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.486, train/loss_vlb_step=0.00607, train/loss_step=0.486, global_step=8214.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  20%|██        | 242/1208 [07:00<27:58,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.486, train/loss_vlb_step=0.00607, train/loss_step=0.486, global_step=8214.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  20%|██        | 242/1208 [07:00<27:58,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0487, train/loss_vlb_step=0.000168, train/loss_step=0.0487, global_step=8214.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  20%|██        | 243/1208 [07:01<27:54,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0487, train/loss_vlb_step=0.000168, train/loss_step=0.0487, global_step=8214.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  20%|██        | 243/1208 [07:01<27:54,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000424, train/loss_step=0.128, global_step=8214.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  20%|██        | 244/1208 [07:04<27:58,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000424, train/loss_step=0.128, global_step=8214.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  20%|██        | 244/1208 [07:04<27:58,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.78e-5, train/loss_step=0.0161, global_step=8214.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  20%|██        | 245/1208 [07:05<27:53,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.78e-5, train/loss_step=0.0161, global_step=8214.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  20%|██        | 245/1208 [07:05<27:53,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0532, train/loss_vlb_step=0.000182, train/loss_step=0.0532, global_step=8215.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  20%|██        | 246/1208 [07:06<27:49,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0532, train/loss_vlb_step=0.000182, train/loss_step=0.0532, global_step=8215.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  20%|██        | 246/1208 [07:06<27:49,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.15e-5, train/loss_step=0.0233, global_step=8215.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  20%|██        | 247/1208 [07:07<27:44,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=9.15e-5, train/loss_step=0.0233, global_step=8215.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  20%|██        | 247/1208 [07:07<27:44,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.523, train/loss_vlb_step=0.00654, train/loss_step=0.523, global_step=8215.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  21%|██        | 248/1208 [07:11<27:49,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.523, train/loss_vlb_step=0.00654, train/loss_step=0.523, global_step=8215.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  21%|██        | 248/1208 [07:11<27:49,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00569, train/loss_vlb_step=3.02e-5, train/loss_step=0.00569, global_step=8215.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  21%|██        | 249/1208 [07:12<27:45,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00569, train/loss_vlb_step=3.02e-5, train/loss_step=0.00569, global_step=8215.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  21%|██        | 249/1208 [07:12<27:45,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000744, train/loss_step=0.207, global_step=8216.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  21%|██        | 250/1208 [07:13<27:40,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000744, train/loss_step=0.207, global_step=8216.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  21%|██        | 250/1208 [07:13<27:40,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000448, train/loss_step=0.135, global_step=8216.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  21%|██        | 251/1208 [07:14<27:36,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000448, train/loss_step=0.135, global_step=8216.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  21%|██        | 251/1208 [07:14<27:36,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.523, train/loss_vlb_step=0.00561, train/loss_step=0.523, global_step=8216.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  21%|██        | 252/1208 [07:17<27:40,  1.74s/it, loss=0.168, v_num=0, train/loss_simple_step=0.523, train/loss_vlb_step=0.00561, train/loss_step=0.523, global_step=8216.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  21%|██        | 252/1208 [07:17<27:40,  1.74s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00657, train/loss_vlb_step=3.29e-5, train/loss_step=0.00657, global_step=8216.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  21%|██        | 253/1208 [07:18<27:35,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00657, train/loss_vlb_step=3.29e-5, train/loss_step=0.00657, global_step=8216.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  21%|██        | 253/1208 [07:18<27:35,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000452, train/loss_step=0.136, global_step=8217.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  21%|██        | 254/1208 [07:19<27:31,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000452, train/loss_step=0.136, global_step=8217.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  21%|██        | 254/1208 [07:19<27:31,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00114, train/loss_step=0.275, global_step=8217.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  21%|██        | 255/1208 [07:20<27:27,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00114, train/loss_step=0.275, global_step=8217.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  21%|██        | 255/1208 [07:20<27:27,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.000131, train/loss_step=0.0347, global_step=8217.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  21%|██        | 256/1208 [07:24<27:31,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.000131, train/loss_step=0.0347, global_step=8217.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  21%|██        | 256/1208 [07:24<27:31,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0612, train/loss_vlb_step=0.000207, train/loss_step=0.0612, global_step=8217.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  21%|██▏       | 257/1208 [07:25<27:27,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0612, train/loss_vlb_step=0.000207, train/loss_step=0.0612, global_step=8217.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  21%|██▏       | 257/1208 [07:25<27:27,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0439, train/loss_vlb_step=0.000156, train/loss_step=0.0439, global_step=8218.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  21%|██▏       | 258/1208 [07:26<27:22,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0439, train/loss_vlb_step=0.000156, train/loss_step=0.0439, global_step=8218.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  21%|██▏       | 258/1208 [07:26<27:22,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000657, train/loss_step=0.186, global_step=8218.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  21%|██▏       | 259/1208 [07:27<27:18,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000657, train/loss_step=0.186, global_step=8218.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  21%|██▏       | 259/1208 [07:27<27:18,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00146, train/loss_step=0.296, global_step=8218.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  22%|██▏       | 260/1208 [07:30<27:22,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00146, train/loss_step=0.296, global_step=8218.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  22%|██▏       | 260/1208 [07:30<27:22,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00137, train/loss_step=0.278, global_step=8218.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  22%|██▏       | 261/1208 [07:31<27:18,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00137, train/loss_step=0.278, global_step=8218.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  22%|██▏       | 261/1208 [07:31<27:18,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00164, train/loss_step=0.278, global_step=8219.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  22%|██▏       | 262/1208 [07:32<27:14,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00164, train/loss_step=0.278, global_step=8219.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  22%|██▏       | 262/1208 [07:32<27:14,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000181, train/loss_step=0.051, global_step=8219.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  22%|██▏       | 263/1208 [07:33<27:10,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000181, train/loss_step=0.051, global_step=8219.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  22%|██▏       | 263/1208 [07:33<27:10,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=8219.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  22%|██▏       | 264/1208 [07:36<27:13,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=8219.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  22%|██▏       | 264/1208 [07:36<27:13,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.08e-5, train/loss_step=0.014, global_step=8219.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  22%|██▏       | 265/1208 [07:37<27:09,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.08e-5, train/loss_step=0.014, global_step=8219.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  22%|██▏       | 265/1208 [07:37<27:09,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00114, train/loss_step=0.244, global_step=8220.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  22%|██▏       | 266/1208 [07:39<27:05,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00114, train/loss_step=0.244, global_step=8220.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  22%|██▏       | 266/1208 [07:39<27:05,  1.73s/it, loss=0.176, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000349, train/loss_step=0.105, global_step=8220.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  22%|██▏       | 267/1208 [07:40<27:01,  1.72s/it, loss=0.176, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000349, train/loss_step=0.105, global_step=8220.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  22%|██▏       | 267/1208 [07:40<27:01,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=1.28e-5, train/loss_step=0.00227, global_step=8220.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  22%|██▏       | 268/1208 [07:43<27:05,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=1.28e-5, train/loss_step=0.00227, global_step=8220.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  22%|██▏       | 268/1208 [07:43<27:05,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00387, train/loss_vlb_step=2.05e-5, train/loss_step=0.00387, global_step=8220.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  22%|██▏       | 269/1208 [07:44<27:01,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00387, train/loss_vlb_step=2.05e-5, train/loss_step=0.00387, global_step=8220.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  22%|██▏       | 269/1208 [07:44<27:01,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000513, train/loss_step=0.154, global_step=8221.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  22%|██▏       | 270/1208 [07:45<26:56,  1.72s/it, loss=0.147, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000513, train/loss_step=0.154, global_step=8221.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  22%|██▏       | 270/1208 [07:45<26:56,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000771, train/loss_step=0.208, global_step=8221.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  22%|██▏       | 271/1208 [07:46<26:52,  1.72s/it, loss=0.15, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000771, train/loss_step=0.208, global_step=8221.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  22%|██▏       | 271/1208 [07:46<26:52,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000528, train/loss_step=0.152, global_step=8221.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  23%|██▎       | 272/1208 [07:49<26:56,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000528, train/loss_step=0.152, global_step=8221.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  23%|██▎       | 272/1208 [07:49<26:56,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0541, train/loss_vlb_step=0.000193, train/loss_step=0.0541, global_step=8221.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  23%|██▎       | 273/1208 [07:50<26:52,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0541, train/loss_vlb_step=0.000193, train/loss_step=0.0541, global_step=8221.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  23%|██▎       | 273/1208 [07:50<26:52,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.58e-5, train/loss_step=0.013, global_step=8222.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  23%|██▎       | 274/1208 [07:51<26:48,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.58e-5, train/loss_step=0.013, global_step=8222.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  23%|██▎       | 274/1208 [07:51<26:48,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00364, train/loss_step=0.457, global_step=8222.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  23%|██▎       | 275/1208 [07:53<26:44,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.00364, train/loss_step=0.457, global_step=8222.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  23%|██▎       | 275/1208 [07:53<26:44,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000639, train/loss_step=0.173, global_step=8222.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  23%|██▎       | 276/1208 [07:56<26:48,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000639, train/loss_step=0.173, global_step=8222.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  23%|██▎       | 276/1208 [07:56<26:48,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00138, train/loss_step=0.311, global_step=8222.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  23%|██▎       | 277/1208 [07:57<26:44,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00138, train/loss_step=0.311, global_step=8222.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  23%|██▎       | 277/1208 [07:57<26:44,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00387, train/loss_vlb_step=2.11e-5, train/loss_step=0.00387, global_step=8223.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  23%|██▎       | 278/1208 [07:58<26:40,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00387, train/loss_vlb_step=2.11e-5, train/loss_step=0.00387, global_step=8223.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  23%|██▎       | 278/1208 [07:58<26:40,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00187, train/loss_step=0.317, global_step=8223.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  23%|██▎       | 279/1208 [07:59<26:36,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00187, train/loss_step=0.317, global_step=8223.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  23%|██▎       | 279/1208 [07:59<26:36,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000106, train/loss_step=0.0282, global_step=8223.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  23%|██▎       | 280/1208 [08:02<26:40,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000106, train/loss_step=0.0282, global_step=8223.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  23%|██▎       | 280/1208 [08:02<26:40,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0943, train/loss_vlb_step=0.00031, train/loss_step=0.0943, global_step=8223.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  23%|██▎       | 281/1208 [08:03<26:36,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0943, train/loss_vlb_step=0.00031, train/loss_step=0.0943, global_step=8223.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  23%|██▎       | 281/1208 [08:03<26:36,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.591, train/loss_vlb_step=0.00801, train/loss_step=0.591, global_step=8224.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  23%|██▎       | 282/1208 [08:04<26:32,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.591, train/loss_vlb_step=0.00801, train/loss_step=0.591, global_step=8224.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  23%|██▎       | 282/1208 [08:04<26:32,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000449, train/loss_step=0.135, global_step=8224.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  23%|██▎       | 283/1208 [08:05<26:28,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000449, train/loss_step=0.135, global_step=8224.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  23%|██▎       | 283/1208 [08:05<26:28,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00383, train/loss_vlb_step=2.08e-5, train/loss_step=0.00383, global_step=8224.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  24%|██▎       | 284/1208 [08:09<26:31,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00383, train/loss_vlb_step=2.08e-5, train/loss_step=0.00383, global_step=8224.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  24%|██▎       | 284/1208 [08:09<26:31,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.73e-5, train/loss_step=0.0101, global_step=8224.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  24%|██▎       | 285/1208 [08:10<26:27,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.73e-5, train/loss_step=0.0101, global_step=8224.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  24%|██▎       | 285/1208 [08:10<26:27,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0853, train/loss_vlb_step=0.000283, train/loss_step=0.0853, global_step=8225.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  24%|██▎       | 286/1208 [08:11<26:23,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0853, train/loss_vlb_step=0.000283, train/loss_step=0.0853, global_step=8225.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  24%|██▎       | 286/1208 [08:11<26:23,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0981, train/loss_vlb_step=0.000323, train/loss_step=0.0981, global_step=8225.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  24%|██▍       | 287/1208 [08:12<26:19,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0981, train/loss_vlb_step=0.000323, train/loss_step=0.0981, global_step=8225.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  24%|██▍       | 287/1208 [08:12<26:19,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0798, train/loss_vlb_step=0.000267, train/loss_step=0.0798, global_step=8225.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  24%|██▍       | 288/1208 [08:15<26:23,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0798, train/loss_vlb_step=0.000267, train/loss_step=0.0798, global_step=8225.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  24%|██▍       | 288/1208 [08:15<26:23,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000157, train/loss_step=0.0443, global_step=8225.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  24%|██▍       | 289/1208 [08:16<26:19,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000157, train/loss_step=0.0443, global_step=8225.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  24%|██▍       | 289/1208 [08:16<26:19,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.15e-5, train/loss_step=0.0197, global_step=8226.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  24%|██▍       | 290/1208 [08:17<26:15,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.15e-5, train/loss_step=0.0197, global_step=8226.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  24%|██▍       | 290/1208 [08:17<26:15,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00523, train/loss_vlb_step=2.62e-5, train/loss_step=0.00523, global_step=8226.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  24%|██▍       | 291/1208 [08:18<26:12,  1.71s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00523, train/loss_vlb_step=2.62e-5, train/loss_step=0.00523, global_step=8226.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  24%|██▍       | 291/1208 [08:18<26:12,  1.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000646, train/loss_step=0.182, global_step=8226.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  24%|██▍       | 292/1208 [08:22<26:15,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000646, train/loss_step=0.182, global_step=8226.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  24%|██▍       | 292/1208 [08:22<26:15,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000111, train/loss_step=0.0301, global_step=8226.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  24%|██▍       | 293/1208 [08:23<26:11,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000111, train/loss_step=0.0301, global_step=8226.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  24%|██▍       | 293/1208 [08:23<26:11,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0751, train/loss_vlb_step=0.000251, train/loss_step=0.0751, global_step=8227.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  24%|██▍       | 294/1208 [08:24<26:08,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0751, train/loss_vlb_step=0.000251, train/loss_step=0.0751, global_step=8227.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  24%|██▍       | 294/1208 [08:24<26:08,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000678, train/loss_step=0.195, global_step=8227.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  24%|██▍       | 295/1208 [08:25<26:04,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000678, train/loss_step=0.195, global_step=8227.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  24%|██▍       | 295/1208 [08:25<26:04,  1.71s/it, loss=0.124, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000597, train/loss_step=0.169, global_step=8227.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  25%|██▍       | 296/1208 [08:28<26:07,  1.72s/it, loss=0.124, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000597, train/loss_step=0.169, global_step=8227.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  25%|██▍       | 296/1208 [08:28<26:07,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.67e-5, train/loss_step=0.0181, global_step=8227.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  25%|██▍       | 297/1208 [08:29<26:03,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.67e-5, train/loss_step=0.0181, global_step=8227.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  25%|██▍       | 297/1208 [08:29<26:03,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000903, train/loss_step=0.236, global_step=8228.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  25%|██▍       | 298/1208 [08:30<25:59,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000903, train/loss_step=0.236, global_step=8228.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  25%|██▍       | 298/1208 [08:30<25:59,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0086, train/loss_vlb_step=4.12e-5, train/loss_step=0.0086, global_step=8228.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  25%|██▍       | 299/1208 [08:31<25:56,  1.71s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0086, train/loss_vlb_step=4.12e-5, train/loss_step=0.0086, global_step=8228.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  25%|██▍       | 299/1208 [08:31<25:56,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0742, train/loss_vlb_step=0.000249, train/loss_step=0.0742, global_step=8228.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  25%|██▍       | 300/1208 [08:35<25:58,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0742, train/loss_vlb_step=0.000249, train/loss_step=0.0742, global_step=8228.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  25%|██▍       | 300/1208 [08:35<25:58,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=1.47e-5, train/loss_step=0.00262, global_step=8228.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.75it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.74it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:29,  1.68it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.73it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.75it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:28,  1.68it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.75it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.71it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.74it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.73it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:26,  1.71it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.76it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.72it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.75it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.73it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.75it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.75it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.73it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.74it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.71it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.75it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:23,  1.72it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.76it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.73it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.75it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:07<00:22,  1.70it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.76it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.71it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.75it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.72it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.76it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:20,  1.73it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.79it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.78it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.74it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.76it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.75it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.75it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.76it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.76it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.75it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.76it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.76it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.76it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.76it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.76it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.76it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.76it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.75it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.75it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.75it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.76it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.75it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.75it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.75it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.76it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.76it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.74it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.75it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.76it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.73it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.74it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.76it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.73it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.75it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.75it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.74it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:16<00:12,  1.75it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:12,  1.74it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:12,  1.75it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.76it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.75it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.75it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.75it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.75it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.74it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.75it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.75it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.75it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.74it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.75it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.74it/s]DDIM Sampler:  70%|███████   | 35/50 [00:20<00:08,  1.75it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.75it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.75it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.75it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.73it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.72it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.77it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.73it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.73it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.74it/s]DDIM Sampler:  80%|████████  | 40/50 [00:23<00:05,  1.73it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.75it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.73it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.75it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.78it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.74it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:24<00:04,  1.74it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.74it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.74it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.78it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.74it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.75it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.75it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.78it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.74it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.74it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.72it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.75it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.78it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:27<00:01,  1.73it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.78it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.78it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.71it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.75it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:28<00:00,  1.73it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.73it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.74it/s]Epoch 27:  25%|██▍       | 301/1208 [09:06<27:27,  1.82s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=1.47e-5, train/loss_step=0.00262, global_step=8228.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  25%|██▍       | 301/1208 [09:06<27:27,  1.82s/it, loss=0.0817, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000574, train/loss_step=0.163, global_step=8229.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  25%|██▌       | 302/1208 [09:07<27:23,  1.81s/it, loss=0.0817, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000574, train/loss_step=0.163, global_step=8229.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  25%|██▌       | 302/1208 [09:07<27:23,  1.81s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00336, train/loss_step=0.356, global_step=8229.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  25%|██▌       | 303/1208 [09:08<27:19,  1.81s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00336, train/loss_step=0.356, global_step=8229.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  25%|██▌       | 303/1208 [09:08<27:19,  1.81s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=7.9e-5, train/loss_step=0.0192, global_step=8229.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  25%|██▌       | 304/1208 [09:11<27:20,  1.81s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=7.9e-5, train/loss_step=0.0192, global_step=8229.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  25%|██▌       | 304/1208 [09:11<27:20,  1.81s/it, loss=0.13, v_num=0, train/loss_simple_step=0.730, train/loss_vlb_step=0.0158, train/loss_step=0.730, global_step=8229.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  25%|██▌       | 305/1208 [09:12<27:16,  1.81s/it, loss=0.13, v_num=0, train/loss_simple_step=0.730, train/loss_vlb_step=0.0158, train/loss_step=0.730, global_step=8229.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  25%|██▌       | 305/1208 [09:12<27:16,  1.81s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0693, train/loss_vlb_step=0.000231, train/loss_step=0.0693, global_step=8230.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  25%|██▌       | 306/1208 [09:13<27:12,  1.81s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0693, train/loss_vlb_step=0.000231, train/loss_step=0.0693, global_step=8230.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  25%|██▌       | 306/1208 [09:13<27:12,  1.81s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000164, train/loss_step=0.0445, global_step=8230.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  25%|██▌       | 307/1208 [09:15<27:08,  1.81s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000164, train/loss_step=0.0445, global_step=8230.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  25%|██▌       | 307/1208 [09:15<27:08,  1.81s/it, loss=0.137, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00193, train/loss_step=0.304, global_step=8230.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  25%|██▌       | 308/1208 [09:18<27:11,  1.81s/it, loss=0.137, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00193, train/loss_step=0.304, global_step=8230.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  25%|██▌       | 308/1208 [09:18<27:11,  1.81s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.59e-5, train/loss_step=0.0131, global_step=8230.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  26%|██▌       | 309/1208 [09:19<27:07,  1.81s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.59e-5, train/loss_step=0.0131, global_step=8230.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  26%|██▌       | 309/1208 [09:19<27:07,  1.81s/it, loss=0.15, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00134, train/loss_step=0.300, global_step=8231.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  26%|██▌       | 310/1208 [09:20<27:03,  1.81s/it, loss=0.15, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00134, train/loss_step=0.300, global_step=8231.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  26%|██▌       | 310/1208 [09:20<27:03,  1.81s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0895, train/loss_vlb_step=0.000298, train/loss_step=0.0895, global_step=8231.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  26%|██▌       | 311/1208 [09:21<26:59,  1.81s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0895, train/loss_vlb_step=0.000298, train/loss_step=0.0895, global_step=8231.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  26%|██▌       | 311/1208 [09:21<26:59,  1.81s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00321, train/loss_vlb_step=1.81e-5, train/loss_step=0.00321, global_step=8231.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  26%|██▌       | 312/1208 [09:24<27:01,  1.81s/it, loss=0.145, v_num=0, train/loss_simple_step=0.00321, train/loss_vlb_step=1.81e-5, train/loss_step=0.00321, global_step=8231.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  26%|██▌       | 312/1208 [09:24<27:01,  1.81s/it, loss=0.15, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.00046, train/loss_step=0.139, global_step=8231.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]     Epoch 27:  26%|██▌       | 313/1208 [09:25<26:57,  1.81s/it, loss=0.15, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.00046, train/loss_step=0.139, global_step=8231.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  26%|██▌       | 313/1208 [09:25<26:57,  1.81s/it, loss=0.156, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000676, train/loss_step=0.190, global_step=8232.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  26%|██▌       | 314/1208 [09:26<26:53,  1.81s/it, loss=0.156, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000676, train/loss_step=0.190, global_step=8232.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  26%|██▌       | 314/1208 [09:26<26:53,  1.81s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.000139, train/loss_step=0.0394, global_step=8232.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  26%|██▌       | 315/1208 [09:27<26:49,  1.80s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.000139, train/loss_step=0.0394, global_step=8232.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  26%|██▌       | 315/1208 [09:27<26:49,  1.80s/it, loss=0.157, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00175, train/loss_step=0.348, global_step=8232.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  26%|██▌       | 316/1208 [09:31<26:52,  1.81s/it, loss=0.157, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00175, train/loss_step=0.348, global_step=8232.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  26%|██▌       | 316/1208 [09:31<26:52,  1.81s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0532, train/loss_vlb_step=0.000195, train/loss_step=0.0532, global_step=8232.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  26%|██▌       | 317/1208 [09:32<26:48,  1.80s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0532, train/loss_vlb_step=0.000195, train/loss_step=0.0532, global_step=8232.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  26%|██▌       | 317/1208 [09:32<26:48,  1.80s/it, loss=0.154, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=8233.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  26%|██▋       | 318/1208 [09:33<26:44,  1.80s/it, loss=0.154, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=8233.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  26%|██▋       | 318/1208 [09:33<26:44,  1.80s/it, loss=0.173, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00226, train/loss_step=0.392, global_step=8233.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  26%|██▋       | 319/1208 [09:34<26:40,  1.80s/it, loss=0.173, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00226, train/loss_step=0.392, global_step=8233.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  26%|██▋       | 319/1208 [09:34<26:40,  1.80s/it, loss=0.187, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00197, train/loss_step=0.351, global_step=8233.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  26%|██▋       | 320/1208 [09:37<26:42,  1.80s/it, loss=0.187, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00197, train/loss_step=0.351, global_step=8233.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  26%|██▋       | 320/1208 [09:37<26:42,  1.80s/it, loss=0.201, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00151, train/loss_step=0.301, global_step=8233.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  27%|██▋       | 321/1208 [09:38<26:38,  1.80s/it, loss=0.201, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00151, train/loss_step=0.301, global_step=8233.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  27%|██▋       | 321/1208 [09:38<26:38,  1.80s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=1.94e-5, train/loss_step=0.00345, global_step=8234.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  27%|██▋       | 322/1208 [09:39<26:34,  1.80s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=1.94e-5, train/loss_step=0.00345, global_step=8234.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  27%|██▋       | 322/1208 [09:39<26:34,  1.80s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00473, train/loss_vlb_step=2.46e-5, train/loss_step=0.00473, global_step=8234.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  27%|██▋       | 323/1208 [09:40<26:31,  1.80s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00473, train/loss_vlb_step=2.46e-5, train/loss_step=0.00473, global_step=8234.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  27%|██▋       | 323/1208 [09:40<26:31,  1.80s/it, loss=0.182, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000509, train/loss_step=0.145, global_step=8234.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  27%|██▋       | 324/1208 [09:43<26:33,  1.80s/it, loss=0.182, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000509, train/loss_step=0.145, global_step=8234.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  27%|██▋       | 324/1208 [09:43<26:33,  1.80s/it, loss=0.154, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000534, train/loss_step=0.156, global_step=8234.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  27%|██▋       | 325/1208 [09:44<26:29,  1.80s/it, loss=0.154, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000534, train/loss_step=0.156, global_step=8234.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  27%|██▋       | 325/1208 [09:44<26:29,  1.80s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.05e-5, train/loss_step=0.0163, global_step=8235.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  27%|██▋       | 326/1208 [09:46<26:25,  1.80s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=7.05e-5, train/loss_step=0.0163, global_step=8235.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  27%|██▋       | 326/1208 [09:46<26:25,  1.80s/it, loss=0.162, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00119, train/loss_step=0.265, global_step=8235.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  27%|██▋       | 327/1208 [09:47<26:21,  1.80s/it, loss=0.162, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00119, train/loss_step=0.265, global_step=8235.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  27%|██▋       | 327/1208 [09:47<26:21,  1.80s/it, loss=0.163, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.0018, train/loss_step=0.317, global_step=8235.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  27%|██▋       | 328/1208 [09:50<26:23,  1.80s/it, loss=0.163, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.0018, train/loss_step=0.317, global_step=8235.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  27%|██▋       | 328/1208 [09:50<26:23,  1.80s/it, loss=0.164, v_num=0, train/loss_simple_step=0.039, train/loss_vlb_step=0.000143, train/loss_step=0.039, global_step=8235.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  27%|██▋       | 329/1208 [09:51<26:20,  1.80s/it, loss=0.164, v_num=0, train/loss_simple_step=0.039, train/loss_vlb_step=0.000143, train/loss_step=0.039, global_step=8235.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  27%|██▋       | 329/1208 [09:51<26:20,  1.80s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00926, train/loss_vlb_step=4.28e-5, train/loss_step=0.00926, global_step=8236.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  27%|██▋       | 330/1208 [09:52<26:16,  1.80s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00926, train/loss_vlb_step=4.28e-5, train/loss_step=0.00926, global_step=8236.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  27%|██▋       | 330/1208 [09:52<26:16,  1.80s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.00013, train/loss_step=0.0356, global_step=8236.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  27%|██▋       | 331/1208 [09:53<26:13,  1.79s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.00013, train/loss_step=0.0356, global_step=8236.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  27%|██▋       | 331/1208 [09:53<26:13,  1.79s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00489, train/loss_vlb_step=2.49e-5, train/loss_step=0.00489, global_step=8236.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  27%|██▋       | 332/1208 [09:56<26:14,  1.80s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00489, train/loss_vlb_step=2.49e-5, train/loss_step=0.00489, global_step=8236.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  27%|██▋       | 332/1208 [09:56<26:14,  1.80s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=1.72e-5, train/loss_step=0.00325, global_step=8236.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  28%|██▊       | 333/1208 [09:57<26:11,  1.80s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=1.72e-5, train/loss_step=0.00325, global_step=8236.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  28%|██▊       | 333/1208 [09:57<26:11,  1.80s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00684, train/loss_vlb_step=3.4e-5, train/loss_step=0.00684, global_step=8237.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  28%|██▊       | 334/1208 [09:59<26:07,  1.79s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00684, train/loss_vlb_step=3.4e-5, train/loss_step=0.00684, global_step=8237.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  28%|██▊       | 334/1208 [09:59<26:07,  1.79s/it, loss=0.146, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00258, train/loss_step=0.353, global_step=8237.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  28%|██▊       | 335/1208 [10:00<26:03,  1.79s/it, loss=0.146, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.00258, train/loss_step=0.353, global_step=8237.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  28%|██▊       | 335/1208 [10:00<26:03,  1.79s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.11e-5, train/loss_step=0.0108, global_step=8237.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  28%|██▊       | 336/1208 [10:03<26:05,  1.80s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.11e-5, train/loss_step=0.0108, global_step=8237.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  28%|██▊       | 336/1208 [10:03<26:05,  1.80s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.000177, train/loss_step=0.0483, global_step=8237.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  28%|██▊       | 337/1208 [10:04<26:02,  1.79s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.000177, train/loss_step=0.0483, global_step=8237.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  28%|██▊       | 337/1208 [10:04<26:02,  1.79s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000109, train/loss_step=0.0286, global_step=8238.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  28%|██▊       | 338/1208 [10:05<25:58,  1.79s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000109, train/loss_step=0.0286, global_step=8238.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  28%|██▊       | 338/1208 [10:05<25:58,  1.79s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=1.39e-5, train/loss_step=0.00243, global_step=8238.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  28%|██▊       | 339/1208 [10:06<25:55,  1.79s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=1.39e-5, train/loss_step=0.00243, global_step=8238.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  28%|██▊       | 339/1208 [10:06<25:55,  1.79s/it, loss=0.113, v_num=0, train/loss_simple_step=0.504, train/loss_vlb_step=0.00643, train/loss_step=0.504, global_step=8238.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  28%|██▊       | 340/1208 [10:09<25:56,  1.79s/it, loss=0.113, v_num=0, train/loss_simple_step=0.504, train/loss_vlb_step=0.00643, train/loss_step=0.504, global_step=8238.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  28%|██▊       | 340/1208 [10:09<25:56,  1.79s/it, loss=0.104, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000409, train/loss_step=0.123, global_step=8238.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  28%|██▊       | 341/1208 [10:10<25:53,  1.79s/it, loss=0.104, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000409, train/loss_step=0.123, global_step=8238.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  28%|██▊       | 341/1208 [10:10<25:53,  1.79s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00369, train/loss_vlb_step=2.06e-5, train/loss_step=0.00369, global_step=8239.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  28%|██▊       | 342/1208 [10:11<25:49,  1.79s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00369, train/loss_vlb_step=2.06e-5, train/loss_step=0.00369, global_step=8239.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  28%|██▊       | 342/1208 [10:11<25:49,  1.79s/it, loss=0.111, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.0005, train/loss_step=0.148, global_step=8239.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]     Epoch 27:  28%|██▊       | 343/1208 [10:13<25:46,  1.79s/it, loss=0.111, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.0005, train/loss_step=0.148, global_step=8239.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  28%|██▊       | 343/1208 [10:13<25:46,  1.79s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0571, train/loss_vlb_step=0.000199, train/loss_step=0.0571, global_step=8239.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  28%|██▊       | 344/1208 [10:16<25:47,  1.79s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0571, train/loss_vlb_step=0.000199, train/loss_step=0.0571, global_step=8239.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  28%|██▊       | 344/1208 [10:16<25:47,  1.79s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.00824, train/loss_vlb_step=3.83e-5, train/loss_step=0.00824, global_step=8239.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  29%|██▊       | 345/1208 [10:17<25:44,  1.79s/it, loss=0.0992, v_num=0, train/loss_simple_step=0.00824, train/loss_vlb_step=3.83e-5, train/loss_step=0.00824, global_step=8239.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  29%|██▊       | 345/1208 [10:17<25:44,  1.79s/it, loss=0.105, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.00043, train/loss_step=0.131, global_step=8240.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]     Epoch 27:  29%|██▊       | 346/1208 [10:18<25:40,  1.79s/it, loss=0.105, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.00043, train/loss_step=0.131, global_step=8240.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  29%|██▊       | 346/1208 [10:18<25:40,  1.79s/it, loss=0.0991, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000494, train/loss_step=0.148, global_step=8240.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  29%|██▊       | 347/1208 [10:19<25:37,  1.79s/it, loss=0.0991, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000494, train/loss_step=0.148, global_step=8240.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  29%|██▊       | 347/1208 [10:19<25:37,  1.79s/it, loss=0.0869, v_num=0, train/loss_simple_step=0.0718, train/loss_vlb_step=0.000242, train/loss_step=0.0718, global_step=8240.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  29%|██▉       | 348/1208 [10:22<25:38,  1.79s/it, loss=0.0869, v_num=0, train/loss_simple_step=0.0718, train/loss_vlb_step=0.000242, train/loss_step=0.0718, global_step=8240.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  29%|██▉       | 348/1208 [10:22<25:38,  1.79s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00125, train/loss_step=0.281, global_step=8240.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  29%|██▉       | 349/1208 [10:23<25:35,  1.79s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00125, train/loss_step=0.281, global_step=8240.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  29%|██▉       | 349/1208 [10:23<25:35,  1.79s/it, loss=0.111, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.00102, train/loss_step=0.242, global_step=8241.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  29%|██▉       | 350/1208 [10:24<25:31,  1.79s/it, loss=0.111, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.00102, train/loss_step=0.242, global_step=8241.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  29%|██▉       | 350/1208 [10:24<25:31,  1.79s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0632, train/loss_vlb_step=0.000213, train/loss_step=0.0632, global_step=8241.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  29%|██▉       | 351/1208 [10:25<25:28,  1.78s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0632, train/loss_vlb_step=0.000213, train/loss_step=0.0632, global_step=8241.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  29%|██▉       | 351/1208 [10:25<25:28,  1.78s/it, loss=0.123, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000871, train/loss_step=0.233, global_step=8241.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  29%|██▉       | 352/1208 [10:29<25:29,  1.79s/it, loss=0.123, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000871, train/loss_step=0.233, global_step=8241.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  29%|██▉       | 352/1208 [10:29<25:29,  1.79s/it, loss=0.124, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=7.99e-5, train/loss_step=0.020, global_step=8241.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  29%|██▉       | 353/1208 [10:30<25:26,  1.79s/it, loss=0.124, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=7.99e-5, train/loss_step=0.020, global_step=8241.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  29%|██▉       | 353/1208 [10:30<25:26,  1.79s/it, loss=0.132, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.00054, train/loss_step=0.161, global_step=8242.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  29%|██▉       | 354/1208 [10:31<25:22,  1.78s/it, loss=0.132, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.00054, train/loss_step=0.161, global_step=8242.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  29%|██▉       | 354/1208 [10:31<25:22,  1.78s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.74e-5, train/loss_step=0.0103, global_step=8242.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  29%|██▉       | 355/1208 [10:32<25:19,  1.78s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.74e-5, train/loss_step=0.0103, global_step=8242.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  29%|██▉       | 355/1208 [10:32<25:19,  1.78s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0986, train/loss_vlb_step=0.000325, train/loss_step=0.0986, global_step=8242.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  29%|██▉       | 356/1208 [10:35<25:21,  1.79s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0986, train/loss_vlb_step=0.000325, train/loss_step=0.0986, global_step=8242.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  29%|██▉       | 356/1208 [10:35<25:21,  1.79s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000156, train/loss_step=0.0407, global_step=8242.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  30%|██▉       | 357/1208 [10:36<25:17,  1.78s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000156, train/loss_step=0.0407, global_step=8242.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  30%|██▉       | 357/1208 [10:36<25:17,  1.78s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0654, train/loss_vlb_step=0.000221, train/loss_step=0.0654, global_step=8243.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  30%|██▉       | 358/1208 [10:37<25:14,  1.78s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0654, train/loss_vlb_step=0.000221, train/loss_step=0.0654, global_step=8243.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  30%|██▉       | 358/1208 [10:37<25:14,  1.78s/it, loss=0.137, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00192, train/loss_step=0.325, global_step=8243.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  30%|██▉       | 359/1208 [10:38<25:10,  1.78s/it, loss=0.137, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00192, train/loss_step=0.325, global_step=8243.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  30%|██▉       | 359/1208 [10:38<25:10,  1.78s/it, loss=0.128, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00269, train/loss_step=0.338, global_step=8243.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  30%|██▉       | 360/1208 [10:41<25:12,  1.78s/it, loss=0.128, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00269, train/loss_step=0.338, global_step=8243.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  30%|██▉       | 360/1208 [10:42<25:12,  1.78s/it, loss=0.128, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000388, train/loss_step=0.118, global_step=8243.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  30%|██▉       | 361/1208 [10:43<25:08,  1.78s/it, loss=0.128, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000388, train/loss_step=0.118, global_step=8243.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  30%|██▉       | 361/1208 [10:43<25:08,  1.78s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000118, train/loss_step=0.0309, global_step=8244.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  30%|██▉       | 362/1208 [10:44<25:05,  1.78s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000118, train/loss_step=0.0309, global_step=8244.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  30%|██▉       | 362/1208 [10:44<25:05,  1.78s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1.32e-5, train/loss_step=0.00226, global_step=8244.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  30%|███       | 363/1208 [10:45<25:01,  1.78s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1.32e-5, train/loss_step=0.00226, global_step=8244.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  30%|███       | 363/1208 [10:45<25:02,  1.78s/it, loss=0.135, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.0015, train/loss_step=0.312, global_step=8244.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]     Epoch 27:  30%|███       | 364/1208 [10:48<25:03,  1.78s/it, loss=0.135, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.0015, train/loss_step=0.312, global_step=8244.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  30%|███       | 364/1208 [10:48<25:03,  1.78s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=1.03e-5, train/loss_step=0.0017, global_step=8244.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  30%|███       | 365/1208 [10:49<25:00,  1.78s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=1.03e-5, train/loss_step=0.0017, global_step=8244.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  30%|███       | 365/1208 [10:49<25:00,  1.78s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000168, train/loss_step=0.0474, global_step=8245.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  30%|███       | 366/1208 [10:50<24:56,  1.78s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000168, train/loss_step=0.0474, global_step=8245.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  30%|███       | 366/1208 [10:50<24:56,  1.78s/it, loss=0.143, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00278, train/loss_step=0.404, global_step=8245.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  30%|███       | 367/1208 [10:51<24:53,  1.78s/it, loss=0.143, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00278, train/loss_step=0.404, global_step=8245.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  30%|███       | 367/1208 [10:51<24:53,  1.78s/it, loss=0.152, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000995, train/loss_step=0.250, global_step=8245.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  30%|███       | 368/1208 [10:54<24:54,  1.78s/it, loss=0.152, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000995, train/loss_step=0.250, global_step=8245.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  30%|███       | 368/1208 [10:54<24:54,  1.78s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000111, train/loss_step=0.0273, global_step=8245.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  31%|███       | 369/1208 [10:55<24:51,  1.78s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000111, train/loss_step=0.0273, global_step=8245.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  31%|███       | 369/1208 [10:55<24:51,  1.78s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00778, train/loss_vlb_step=3.82e-5, train/loss_step=0.00778, global_step=8246.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  31%|███       | 370/1208 [10:56<24:47,  1.78s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00778, train/loss_vlb_step=3.82e-5, train/loss_step=0.00778, global_step=8246.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  31%|███       | 370/1208 [10:56<24:47,  1.78s/it, loss=0.134, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000733, train/loss_step=0.183, global_step=8246.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  31%|███       | 371/1208 [10:58<24:44,  1.77s/it, loss=0.134, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000733, train/loss_step=0.183, global_step=8246.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  31%|███       | 371/1208 [10:58<24:44,  1.77s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0544, train/loss_vlb_step=0.000189, train/loss_step=0.0544, global_step=8246.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  31%|███       | 372/1208 [11:01<24:45,  1.78s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0544, train/loss_vlb_step=0.000189, train/loss_step=0.0544, global_step=8246.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  31%|███       | 372/1208 [11:01<24:45,  1.78s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.66e-5, train/loss_step=0.0179, global_step=8246.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  31%|███       | 373/1208 [11:02<24:42,  1.78s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.66e-5, train/loss_step=0.0179, global_step=8246.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  31%|███       | 373/1208 [11:02<24:42,  1.78s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0633, train/loss_vlb_step=0.000217, train/loss_step=0.0633, global_step=8247.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  31%|███       | 374/1208 [11:03<24:39,  1.77s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0633, train/loss_vlb_step=0.000217, train/loss_step=0.0633, global_step=8247.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  31%|███       | 374/1208 [11:03<24:39,  1.77s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00598, train/loss_vlb_step=3.01e-5, train/loss_step=0.00598, global_step=8247.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  31%|███       | 375/1208 [11:04<24:36,  1.77s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00598, train/loss_vlb_step=3.01e-5, train/loss_step=0.00598, global_step=8247.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  31%|███       | 375/1208 [11:04<24:36,  1.77s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=7.85e-5, train/loss_step=0.0189, global_step=8247.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  31%|███       | 376/1208 [11:07<24:37,  1.78s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=7.85e-5, train/loss_step=0.0189, global_step=8247.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  31%|███       | 376/1208 [11:07<24:37,  1.78s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0446, train/loss_vlb_step=0.000155, train/loss_step=0.0446, global_step=8247.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  31%|███       | 377/1208 [11:08<24:33,  1.77s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0446, train/loss_vlb_step=0.000155, train/loss_step=0.0446, global_step=8247.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  31%|███       | 377/1208 [11:08<24:33,  1.77s/it, loss=0.129, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00141, train/loss_step=0.319, global_step=8248.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  31%|███▏      | 378/1208 [11:09<24:30,  1.77s/it, loss=0.129, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00141, train/loss_step=0.319, global_step=8248.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  31%|███▏      | 378/1208 [11:09<24:30,  1.77s/it, loss=0.118, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=8248.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  31%|███▏      | 379/1208 [11:10<24:27,  1.77s/it, loss=0.118, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=8248.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  31%|███▏      | 379/1208 [11:10<24:27,  1.77s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000228, train/loss_step=0.0676, global_step=8248.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  31%|███▏      | 380/1208 [11:13<24:28,  1.77s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0676, train/loss_vlb_step=0.000228, train/loss_step=0.0676, global_step=8248.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  31%|███▏      | 380/1208 [11:13<24:28,  1.77s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0354, train/loss_vlb_step=0.000131, train/loss_step=0.0354, global_step=8248.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  32%|███▏      | 381/1208 [11:15<24:25,  1.77s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0354, train/loss_vlb_step=0.000131, train/loss_step=0.0354, global_step=8248.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  32%|███▏      | 381/1208 [11:15<24:25,  1.77s/it, loss=0.107, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000623, train/loss_step=0.177, global_step=8249.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  32%|███▏      | 382/1208 [11:16<24:22,  1.77s/it, loss=0.107, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000623, train/loss_step=0.177, global_step=8249.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  32%|███▏      | 382/1208 [11:16<24:22,  1.77s/it, loss=0.117, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000718, train/loss_step=0.195, global_step=8249.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  32%|███▏      | 383/1208 [11:17<24:18,  1.77s/it, loss=0.117, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000718, train/loss_step=0.195, global_step=8249.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  32%|███▏      | 383/1208 [11:17<24:18,  1.77s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.000171, train/loss_step=0.0476, global_step=8249.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  32%|███▏      | 384/1208 [11:20<24:20,  1.77s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.000171, train/loss_step=0.0476, global_step=8249.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  32%|███▏      | 384/1208 [11:20<24:20,  1.77s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0423, train/loss_vlb_step=0.000151, train/loss_step=0.0423, global_step=8249.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  32%|███▏      | 385/1208 [11:21<24:16,  1.77s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0423, train/loss_vlb_step=0.000151, train/loss_step=0.0423, global_step=8249.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  32%|███▏      | 385/1208 [11:21<24:17,  1.77s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0579, train/loss_vlb_step=0.000205, train/loss_step=0.0579, global_step=8250.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  32%|███▏      | 386/1208 [11:22<24:13,  1.77s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0579, train/loss_vlb_step=0.000205, train/loss_step=0.0579, global_step=8250.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  32%|███▏      | 386/1208 [11:22<24:13,  1.77s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.0808, train/loss_vlb_step=0.000272, train/loss_step=0.0808, global_step=8250.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  32%|███▏      | 387/1208 [11:23<24:10,  1.77s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.0808, train/loss_vlb_step=0.000272, train/loss_step=0.0808, global_step=8250.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  32%|███▏      | 387/1208 [11:23<24:10,  1.77s/it, loss=0.0794, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000124, train/loss_step=0.0328, global_step=8250.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  32%|███▏      | 388/1208 [11:26<24:11,  1.77s/it, loss=0.0794, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000124, train/loss_step=0.0328, global_step=8250.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  32%|███▏      | 388/1208 [11:26<24:11,  1.77s/it, loss=0.0794, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000104, train/loss_step=0.0269, global_step=8250.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  32%|███▏      | 389/1208 [11:27<24:08,  1.77s/it, loss=0.0794, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000104, train/loss_step=0.0269, global_step=8250.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  32%|███▏      | 389/1208 [11:27<24:08,  1.77s/it, loss=0.096, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00202, train/loss_step=0.341, global_step=8251.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  32%|███▏      | 390/1208 [11:28<24:05,  1.77s/it, loss=0.096, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00202, train/loss_step=0.341, global_step=8251.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  32%|███▏      | 390/1208 [11:28<24:05,  1.77s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000506, train/loss_step=0.154, global_step=8251.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  32%|███▏      | 391/1208 [11:30<24:01,  1.76s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000506, train/loss_step=0.154, global_step=8251.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  32%|███▏      | 391/1208 [11:30<24:01,  1.76s/it, loss=0.11, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.0019, train/loss_step=0.357, global_step=8251.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  32%|███▏      | 392/1208 [11:33<24:03,  1.77s/it, loss=0.11, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.0019, train/loss_step=0.357, global_step=8251.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  32%|███▏      | 392/1208 [11:33<24:03,  1.77s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.64e-5, train/loss_step=0.0178, global_step=8251.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  33%|███▎      | 393/1208 [11:34<24:00,  1.77s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.64e-5, train/loss_step=0.0178, global_step=8251.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  33%|███▎      | 393/1208 [11:34<24:00,  1.77s/it, loss=0.125, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00184, train/loss_step=0.370, global_step=8252.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  33%|███▎      | 394/1208 [11:35<23:56,  1.77s/it, loss=0.125, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.00184, train/loss_step=0.370, global_step=8252.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  33%|███▎      | 394/1208 [11:35<23:56,  1.77s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0061, train/loss_vlb_step=3.09e-5, train/loss_step=0.0061, global_step=8252.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  33%|███▎      | 395/1208 [11:36<23:53,  1.76s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0061, train/loss_vlb_step=3.09e-5, train/loss_step=0.0061, global_step=8252.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  33%|███▎      | 395/1208 [11:36<23:53,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0408, train/loss_vlb_step=0.000145, train/loss_step=0.0408, global_step=8252.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  33%|███▎      | 396/1208 [11:39<23:54,  1.77s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0408, train/loss_vlb_step=0.000145, train/loss_step=0.0408, global_step=8252.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  33%|███▎      | 396/1208 [11:39<23:54,  1.77s/it, loss=0.133, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.00067, train/loss_step=0.190, global_step=8252.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  33%|███▎      | 397/1208 [11:40<23:51,  1.77s/it, loss=0.133, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.00067, train/loss_step=0.190, global_step=8252.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  33%|███▎      | 397/1208 [11:40<23:51,  1.77s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00915, train/loss_vlb_step=4.33e-5, train/loss_step=0.00915, global_step=8253.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  33%|███▎      | 398/1208 [11:42<23:48,  1.76s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00915, train/loss_vlb_step=4.33e-5, train/loss_step=0.00915, global_step=8253.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  33%|███▎      | 398/1208 [11:42<23:48,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000845, train/loss_step=0.233, global_step=8253.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  33%|███▎      | 399/1208 [11:43<23:45,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000845, train/loss_step=0.233, global_step=8253.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  33%|███▎      | 399/1208 [11:43<23:45,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0677, train/loss_vlb_step=0.00023, train/loss_step=0.0677, global_step=8253.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  33%|███▎      | 400/1208 [11:46<23:46,  1.77s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0677, train/loss_vlb_step=0.00023, train/loss_step=0.0677, global_step=8253.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  33%|███▎      | 400/1208 [11:46<23:46,  1.77s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00445, train/loss_vlb_step=2.38e-5, train/loss_step=0.00445, global_step=8253.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  33%|███▎      | 401/1208 [11:47<23:43,  1.76s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00445, train/loss_vlb_step=2.38e-5, train/loss_step=0.00445, global_step=8253.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  33%|███▎      | 401/1208 [11:47<23:43,  1.76s/it, loss=0.12, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000415, train/loss_step=0.126, global_step=8254.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  33%|███▎      | 402/1208 [11:48<23:40,  1.76s/it, loss=0.12, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000415, train/loss_step=0.126, global_step=8254.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  33%|███▎      | 402/1208 [11:48<23:40,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000673, train/loss_step=0.184, global_step=8254.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  33%|███▎      | 403/1208 [11:49<23:37,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000673, train/loss_step=0.184, global_step=8254.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  33%|███▎      | 403/1208 [11:49<23:37,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00112, train/loss_step=0.277, global_step=8254.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  33%|███▎      | 404/1208 [11:52<23:38,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00112, train/loss_step=0.277, global_step=8254.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  33%|███▎      | 404/1208 [11:52<23:38,  1.76s/it, loss=0.149, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.0026, train/loss_step=0.395, global_step=8254.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  34%|███▎      | 405/1208 [11:53<23:35,  1.76s/it, loss=0.149, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.0026, train/loss_step=0.395, global_step=8254.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  34%|███▎      | 405/1208 [11:53<23:35,  1.76s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0709, train/loss_vlb_step=0.000237, train/loss_step=0.0709, global_step=8255.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  34%|███▎      | 406/1208 [11:55<23:32,  1.76s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0709, train/loss_vlb_step=0.000237, train/loss_step=0.0709, global_step=8255.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  34%|███▎      | 406/1208 [11:55<23:32,  1.76s/it, loss=0.151, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000397, train/loss_step=0.121, global_step=8255.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  34%|███▎      | 407/1208 [11:56<23:29,  1.76s/it, loss=0.151, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000397, train/loss_step=0.121, global_step=8255.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  34%|███▎      | 407/1208 [11:56<23:29,  1.76s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00749, train/loss_vlb_step=3.64e-5, train/loss_step=0.00749, global_step=8255.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  34%|███▍      | 408/1208 [11:59<23:30,  1.76s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00749, train/loss_vlb_step=3.64e-5, train/loss_step=0.00749, global_step=8255.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  34%|███▍      | 408/1208 [11:59<23:30,  1.76s/it, loss=0.178, v_num=0, train/loss_simple_step=0.582, train/loss_vlb_step=0.00927, train/loss_step=0.582, global_step=8255.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  34%|███▍      | 409/1208 [12:00<23:27,  1.76s/it, loss=0.178, v_num=0, train/loss_simple_step=0.582, train/loss_vlb_step=0.00927, train/loss_step=0.582, global_step=8255.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  34%|███▍      | 409/1208 [12:00<23:27,  1.76s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00831, train/loss_vlb_step=3.97e-5, train/loss_step=0.00831, global_step=8256.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  34%|███▍      | 410/1208 [12:01<23:24,  1.76s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00831, train/loss_vlb_step=3.97e-5, train/loss_step=0.00831, global_step=8256.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  34%|███▍      | 410/1208 [12:01<23:24,  1.76s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000112, train/loss_step=0.0293, global_step=8256.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  34%|███▍      | 411/1208 [12:02<23:21,  1.76s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000112, train/loss_step=0.0293, global_step=8256.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  34%|███▍      | 411/1208 [12:02<23:21,  1.76s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00713, train/loss_vlb_step=3.36e-5, train/loss_step=0.00713, global_step=8256.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  34%|███▍      | 412/1208 [12:05<23:22,  1.76s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00713, train/loss_vlb_step=3.36e-5, train/loss_step=0.00713, global_step=8256.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  34%|███▍      | 412/1208 [12:05<23:22,  1.76s/it, loss=0.15, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00156, train/loss_step=0.279, global_step=8256.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]     Epoch 27:  34%|███▍      | 413/1208 [12:06<23:19,  1.76s/it, loss=0.15, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00156, train/loss_step=0.279, global_step=8256.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  34%|███▍      | 413/1208 [12:06<23:19,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00169, train/loss_step=0.283, global_step=8257.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  34%|███▍      | 414/1208 [12:08<23:16,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00169, train/loss_step=0.283, global_step=8257.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  34%|███▍      | 414/1208 [12:08<23:16,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=2.12e-5, train/loss_step=0.00395, global_step=8257.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  34%|███▍      | 415/1208 [12:09<23:13,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=2.12e-5, train/loss_step=0.00395, global_step=8257.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  34%|███▍      | 415/1208 [12:09<23:13,  1.76s/it, loss=0.162, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00357, train/loss_step=0.359, global_step=8257.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  34%|███▍      | 416/1208 [12:12<23:13,  1.76s/it, loss=0.162, v_num=0, train/loss_simple_step=0.359, train/loss_vlb_step=0.00357, train/loss_step=0.359, global_step=8257.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  34%|███▍      | 416/1208 [12:12<23:13,  1.76s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=9.02e-6, train/loss_step=0.00152, global_step=8257.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  35%|███▍      | 417/1208 [12:13<23:10,  1.76s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=9.02e-6, train/loss_step=0.00152, global_step=8257.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  35%|███▍      | 417/1208 [12:13<23:10,  1.76s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0848, train/loss_vlb_step=0.000284, train/loss_step=0.0848, global_step=8258.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  35%|███▍      | 418/1208 [12:14<23:07,  1.76s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0848, train/loss_vlb_step=0.000284, train/loss_step=0.0848, global_step=8258.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  35%|███▍      | 418/1208 [12:14<23:07,  1.76s/it, loss=0.149, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000286, train/loss_step=0.086, global_step=8258.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  35%|███▍      | 419/1208 [12:15<23:04,  1.76s/it, loss=0.149, v_num=0, train/loss_simple_step=0.086, train/loss_vlb_step=0.000286, train/loss_step=0.086, global_step=8258.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  35%|███▍      | 419/1208 [12:15<23:04,  1.76s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.14e-5, train/loss_step=0.0229, global_step=8258.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  35%|███▍      | 420/1208 [12:18<23:05,  1.76s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=9.14e-5, train/loss_step=0.0229, global_step=8258.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  35%|███▍      | 420/1208 [12:18<23:05,  1.76s/it, loss=0.152, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000348, train/loss_step=0.105, global_step=8258.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  35%|███▍      | 421/1208 [12:19<23:02,  1.76s/it, loss=0.152, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000348, train/loss_step=0.105, global_step=8258.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  35%|███▍      | 421/1208 [12:19<23:02,  1.76s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000122, train/loss_step=0.0327, global_step=8259.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  35%|███▍      | 422/1208 [12:20<23:00,  1.76s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000122, train/loss_step=0.0327, global_step=8259.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  35%|███▍      | 422/1208 [12:20<23:00,  1.76s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.000145, train/loss_step=0.0403, global_step=8259.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  35%|███▌      | 423/1208 [12:22<22:57,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.000145, train/loss_step=0.0403, global_step=8259.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  35%|███▌      | 423/1208 [12:22<22:57,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00376, train/loss_vlb_step=1.94e-5, train/loss_step=0.00376, global_step=8259.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  35%|███▌      | 424/1208 [12:25<22:57,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00376, train/loss_vlb_step=1.94e-5, train/loss_step=0.00376, global_step=8259.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  35%|███▌      | 424/1208 [12:25<22:57,  1.76s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=1.01e-5, train/loss_step=0.00166, global_step=8259.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  35%|███▌      | 425/1208 [12:26<22:54,  1.76s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=1.01e-5, train/loss_step=0.00166, global_step=8259.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  35%|███▌      | 425/1208 [12:26<22:54,  1.76s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000115, train/loss_step=0.0301, global_step=8260.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  35%|███▌      | 426/1208 [12:27<22:51,  1.75s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000115, train/loss_step=0.0301, global_step=8260.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  35%|███▌      | 426/1208 [12:27<22:51,  1.75s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.0049, train/loss_vlb_step=2.53e-5, train/loss_step=0.0049, global_step=8260.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  35%|███▌      | 427/1208 [12:28<22:48,  1.75s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.0049, train/loss_vlb_step=2.53e-5, train/loss_step=0.0049, global_step=8260.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  35%|███▌      | 427/1208 [12:28<22:48,  1.75s/it, loss=0.108, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000674, train/loss_step=0.185, global_step=8260.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  35%|███▌      | 428/1208 [12:31<22:49,  1.76s/it, loss=0.108, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000674, train/loss_step=0.185, global_step=8260.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  35%|███▌      | 428/1208 [12:31<22:49,  1.76s/it, loss=0.0793, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.89e-5, train/loss_step=0.0188, global_step=8260.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  36%|███▌      | 429/1208 [12:32<22:46,  1.75s/it, loss=0.0793, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.89e-5, train/loss_step=0.0188, global_step=8260.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  36%|███▌      | 429/1208 [12:32<22:46,  1.75s/it, loss=0.0791, v_num=0, train/loss_simple_step=0.00398, train/loss_vlb_step=2.15e-5, train/loss_step=0.00398, global_step=8261.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  36%|███▌      | 430/1208 [12:33<22:44,  1.75s/it, loss=0.0791, v_num=0, train/loss_simple_step=0.00398, train/loss_vlb_step=2.15e-5, train/loss_step=0.00398, global_step=8261.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  36%|███▌      | 430/1208 [12:33<22:44,  1.75s/it, loss=0.0789, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.77e-5, train/loss_step=0.024, global_step=8261.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  36%|███▌      | 431/1208 [12:35<22:41,  1.75s/it, loss=0.0789, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.77e-5, train/loss_step=0.024, global_step=8261.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  36%|███▌      | 431/1208 [12:35<22:41,  1.75s/it, loss=0.0816, v_num=0, train/loss_simple_step=0.0624, train/loss_vlb_step=0.000214, train/loss_step=0.0624, global_step=8261.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  36%|███▌      | 432/1208 [12:38<22:41,  1.75s/it, loss=0.0816, v_num=0, train/loss_simple_step=0.0624, train/loss_vlb_step=0.000214, train/loss_step=0.0624, global_step=8261.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  36%|███▌      | 432/1208 [12:38<22:41,  1.75s/it, loss=0.0678, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=1.84e-5, train/loss_step=0.00347, global_step=8261.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  36%|███▌      | 433/1208 [12:39<22:38,  1.75s/it, loss=0.0678, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=1.84e-5, train/loss_step=0.00347, global_step=8261.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  36%|███▌      | 433/1208 [12:39<22:38,  1.75s/it, loss=0.0566, v_num=0, train/loss_simple_step=0.0589, train/loss_vlb_step=0.000201, train/loss_step=0.0589, global_step=8262.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  36%|███▌      | 434/1208 [12:40<22:35,  1.75s/it, loss=0.0566, v_num=0, train/loss_simple_step=0.0589, train/loss_vlb_step=0.000201, train/loss_step=0.0589, global_step=8262.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  36%|███▌      | 434/1208 [12:40<22:35,  1.75s/it, loss=0.0849, v_num=0, train/loss_simple_step=0.570, train/loss_vlb_step=0.0128, train/loss_step=0.570, global_step=8262.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  36%|███▌      | 435/1208 [12:41<22:32,  1.75s/it, loss=0.0849, v_num=0, train/loss_simple_step=0.570, train/loss_vlb_step=0.0128, train/loss_step=0.570, global_step=8262.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  36%|███▌      | 435/1208 [12:41<22:32,  1.75s/it, loss=0.0683, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000108, train/loss_step=0.0258, global_step=8262.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  36%|███▌      | 436/1208 [12:44<22:33,  1.75s/it, loss=0.0683, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000108, train/loss_step=0.0258, global_step=8262.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  36%|███▌      | 436/1208 [12:44<22:33,  1.75s/it, loss=0.0809, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00121, train/loss_step=0.254, global_step=8262.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  36%|███▌      | 437/1208 [12:45<22:30,  1.75s/it, loss=0.0809, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00121, train/loss_step=0.254, global_step=8262.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  36%|███▌      | 437/1208 [12:45<22:30,  1.75s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.0049, train/loss_step=0.457, global_step=8263.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  36%|███▋      | 438/1208 [12:46<22:27,  1.75s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.457, train/loss_vlb_step=0.0049, train/loss_step=0.457, global_step=8263.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  36%|███▋      | 438/1208 [12:46<22:27,  1.75s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.05e-5, train/loss_step=0.00174, global_step=8263.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  36%|███▋      | 439/1208 [12:47<22:25,  1.75s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.05e-5, train/loss_step=0.00174, global_step=8263.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  36%|███▋      | 439/1208 [12:47<22:25,  1.75s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.000108, train/loss_step=0.0292, global_step=8263.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  36%|███▋      | 440/1208 [12:51<22:25,  1.75s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.0292, train/loss_vlb_step=0.000108, train/loss_step=0.0292, global_step=8263.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  36%|███▋      | 440/1208 [12:51<22:25,  1.75s/it, loss=0.109, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00241, train/loss_step=0.368, global_step=8263.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  37%|███▋      | 441/1208 [12:52<22:22,  1.75s/it, loss=0.109, v_num=0, train/loss_simple_step=0.368, train/loss_vlb_step=0.00241, train/loss_step=0.368, global_step=8263.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  37%|███▋      | 441/1208 [12:52<22:22,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.00287, train/loss_step=0.382, global_step=8264.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  37%|███▋      | 442/1208 [12:53<22:20,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.00287, train/loss_step=0.382, global_step=8264.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  37%|███▋      | 442/1208 [12:53<22:20,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.48e-5, train/loss_step=0.0177, global_step=8264.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  37%|███▋      | 443/1208 [12:54<22:17,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.48e-5, train/loss_step=0.0177, global_step=8264.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  37%|███▋      | 443/1208 [12:54<22:17,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.00104, train/loss_step=0.246, global_step=8264.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  37%|███▋      | 444/1208 [12:57<22:17,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.00104, train/loss_step=0.246, global_step=8264.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  37%|███▋      | 444/1208 [12:57<22:17,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0382, train/loss_vlb_step=0.000134, train/loss_step=0.0382, global_step=8264.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  37%|███▋      | 445/1208 [12:58<22:14,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0382, train/loss_vlb_step=0.000134, train/loss_step=0.0382, global_step=8264.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  37%|███▋      | 445/1208 [12:58<22:14,  1.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0934, train/loss_vlb_step=0.000308, train/loss_step=0.0934, global_step=8265.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  37%|███▋      | 446/1208 [12:59<22:12,  1.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0934, train/loss_vlb_step=0.000308, train/loss_step=0.0934, global_step=8265.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  37%|███▋      | 446/1208 [12:59<22:12,  1.75s/it, loss=0.172, v_num=0, train/loss_simple_step=0.601, train/loss_vlb_step=0.00957, train/loss_step=0.601, global_step=8265.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  37%|███▋      | 447/1208 [13:00<22:09,  1.75s/it, loss=0.172, v_num=0, train/loss_simple_step=0.601, train/loss_vlb_step=0.00957, train/loss_step=0.601, global_step=8265.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  37%|███▋      | 447/1208 [13:00<22:09,  1.75s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.000166, train/loss_step=0.0471, global_step=8265.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  37%|███▋      | 448/1208 [13:04<22:10,  1.75s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.000166, train/loss_step=0.0471, global_step=8265.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  37%|███▋      | 448/1208 [13:04<22:10,  1.75s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00396, train/loss_vlb_step=2.17e-5, train/loss_step=0.00396, global_step=8265.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  37%|███▋      | 449/1208 [13:05<22:07,  1.75s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00396, train/loss_vlb_step=2.17e-5, train/loss_step=0.00396, global_step=8265.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  37%|███▋      | 449/1208 [13:05<22:07,  1.75s/it, loss=0.198, v_num=0, train/loss_simple_step=0.667, train/loss_vlb_step=0.0345, train/loss_step=0.667, global_step=8266.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]     Epoch 27:  37%|███▋      | 450/1208 [13:06<22:04,  1.75s/it, loss=0.198, v_num=0, train/loss_simple_step=0.667, train/loss_vlb_step=0.0345, train/loss_step=0.667, global_step=8266.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  37%|███▋      | 450/1208 [13:06<22:04,  1.75s/it, loss=0.207, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.00083, train/loss_step=0.216, global_step=8266.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  37%|███▋      | 451/1208 [13:07<22:01,  1.75s/it, loss=0.207, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.00083, train/loss_step=0.216, global_step=8266.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  37%|███▋      | 451/1208 [13:07<22:01,  1.75s/it, loss=0.213, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000658, train/loss_step=0.183, global_step=8266.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  37%|███▋      | 452/1208 [13:10<22:02,  1.75s/it, loss=0.213, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000658, train/loss_step=0.183, global_step=8266.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  37%|███▋      | 452/1208 [13:10<22:02,  1.75s/it, loss=0.244, v_num=0, train/loss_simple_step=0.630, train/loss_vlb_step=0.0127, train/loss_step=0.630, global_step=8266.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  38%|███▊      | 453/1208 [13:11<21:59,  1.75s/it, loss=0.244, v_num=0, train/loss_simple_step=0.630, train/loss_vlb_step=0.0127, train/loss_step=0.630, global_step=8266.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  38%|███▊      | 453/1208 [13:11<21:59,  1.75s/it, loss=0.259, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00218, train/loss_step=0.351, global_step=8267.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  38%|███▊      | 454/1208 [13:12<21:56,  1.75s/it, loss=0.259, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00218, train/loss_step=0.351, global_step=8267.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  38%|███▊      | 454/1208 [13:12<21:56,  1.75s/it, loss=0.231, v_num=0, train/loss_simple_step=0.0092, train/loss_vlb_step=4.17e-5, train/loss_step=0.0092, global_step=8267.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  38%|███▊      | 455/1208 [13:13<21:53,  1.74s/it, loss=0.231, v_num=0, train/loss_simple_step=0.0092, train/loss_vlb_step=4.17e-5, train/loss_step=0.0092, global_step=8267.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  38%|███▊      | 455/1208 [13:13<21:53,  1.74s/it, loss=0.23, v_num=0, train/loss_simple_step=0.00936, train/loss_vlb_step=4.34e-5, train/loss_step=0.00936, global_step=8267.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  38%|███▊      | 456/1208 [13:16<21:54,  1.75s/it, loss=0.23, v_num=0, train/loss_simple_step=0.00936, train/loss_vlb_step=4.34e-5, train/loss_step=0.00936, global_step=8267.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  38%|███▊      | 456/1208 [13:16<21:54,  1.75s/it, loss=0.218, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=3.04e-5, train/loss_step=0.00572, global_step=8267.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  38%|███▊      | 457/1208 [13:17<21:51,  1.75s/it, loss=0.218, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=3.04e-5, train/loss_step=0.00572, global_step=8267.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  38%|███▊      | 457/1208 [13:17<21:51,  1.75s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=1.05e-5, train/loss_step=0.00179, global_step=8268.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  38%|███▊      | 458/1208 [13:19<21:48,  1.74s/it, loss=0.195, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=1.05e-5, train/loss_step=0.00179, global_step=8268.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  38%|███▊      | 458/1208 [13:19<21:48,  1.74s/it, loss=0.196, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.17e-5, train/loss_step=0.014, global_step=8268.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  38%|███▊      | 459/1208 [13:20<21:45,  1.74s/it, loss=0.196, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.17e-5, train/loss_step=0.014, global_step=8268.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  38%|███▊      | 459/1208 [13:20<21:45,  1.74s/it, loss=0.2, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=8268.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  38%|███▊      | 460/1208 [13:23<21:46,  1.75s/it, loss=0.2, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=8268.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  38%|███▊      | 460/1208 [13:23<21:46,  1.75s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.24e-5, train/loss_step=0.00208, global_step=8268.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  38%|███▊      | 461/1208 [13:24<21:43,  1.75s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.24e-5, train/loss_step=0.00208, global_step=8268.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  38%|███▊      | 461/1208 [13:24<21:43,  1.75s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000103, train/loss_step=0.0263, global_step=8269.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  38%|███▊      | 462/1208 [13:25<21:40,  1.74s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000103, train/loss_step=0.0263, global_step=8269.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  38%|███▊      | 462/1208 [13:25<21:40,  1.74s/it, loss=0.191, v_num=0, train/loss_simple_step=0.560, train/loss_vlb_step=0.00687, train/loss_step=0.560, global_step=8269.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  38%|███▊      | 463/1208 [13:26<21:37,  1.74s/it, loss=0.191, v_num=0, train/loss_simple_step=0.560, train/loss_vlb_step=0.00687, train/loss_step=0.560, global_step=8269.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  38%|███▊      | 463/1208 [13:26<21:38,  1.74s/it, loss=0.199, v_num=0, train/loss_simple_step=0.410, train/loss_vlb_step=0.00461, train/loss_step=0.410, global_step=8269.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  38%|███▊      | 464/1208 [13:29<21:38,  1.75s/it, loss=0.199, v_num=0, train/loss_simple_step=0.410, train/loss_vlb_step=0.00461, train/loss_step=0.410, global_step=8269.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  38%|███▊      | 464/1208 [13:29<21:38,  1.75s/it, loss=0.206, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000612, train/loss_step=0.175, global_step=8269.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  38%|███▊      | 465/1208 [13:30<21:35,  1.74s/it, loss=0.206, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000612, train/loss_step=0.175, global_step=8269.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  38%|███▊      | 465/1208 [13:30<21:35,  1.74s/it, loss=0.215, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00124, train/loss_step=0.272, global_step=8270.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  39%|███▊      | 466/1208 [13:31<21:32,  1.74s/it, loss=0.215, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00124, train/loss_step=0.272, global_step=8270.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  39%|███▊      | 466/1208 [13:31<21:32,  1.74s/it, loss=0.209, v_num=0, train/loss_simple_step=0.489, train/loss_vlb_step=0.00468, train/loss_step=0.489, global_step=8270.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  39%|███▊      | 467/1208 [13:33<21:30,  1.74s/it, loss=0.209, v_num=0, train/loss_simple_step=0.489, train/loss_vlb_step=0.00468, train/loss_step=0.489, global_step=8270.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  39%|███▊      | 467/1208 [13:33<21:30,  1.74s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=0.000101, train/loss_step=0.0252, global_step=8270.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  39%|███▊      | 468/1208 [13:36<21:30,  1.74s/it, loss=0.208, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=0.000101, train/loss_step=0.0252, global_step=8270.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  39%|███▊      | 468/1208 [13:36<21:30,  1.74s/it, loss=0.213, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=8270.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  39%|███▉      | 469/1208 [13:37<21:27,  1.74s/it, loss=0.213, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=8270.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  39%|███▉      | 469/1208 [13:37<21:27,  1.74s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000299, train/loss_step=0.0901, global_step=8271.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  39%|███▉      | 470/1208 [13:38<21:25,  1.74s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000299, train/loss_step=0.0901, global_step=8271.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  39%|███▉      | 470/1208 [13:38<21:25,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00575, train/loss_vlb_step=2.95e-5, train/loss_step=0.00575, global_step=8271.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  39%|███▉      | 471/1208 [13:39<21:22,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00575, train/loss_vlb_step=2.95e-5, train/loss_step=0.00575, global_step=8271.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  39%|███▉      | 471/1208 [13:39<21:22,  1.74s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0696, train/loss_vlb_step=0.000238, train/loss_step=0.0696, global_step=8271.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  39%|███▉      | 472/1208 [13:42<21:22,  1.74s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0696, train/loss_vlb_step=0.000238, train/loss_step=0.0696, global_step=8271.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  39%|███▉      | 472/1208 [13:42<21:22,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00132, train/loss_step=0.303, global_step=8271.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  39%|███▉      | 473/1208 [13:43<21:20,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00132, train/loss_step=0.303, global_step=8271.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  39%|███▉      | 473/1208 [13:43<21:20,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000115, train/loss_step=0.0293, global_step=8272.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  39%|███▉      | 474/1208 [13:44<21:17,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000115, train/loss_step=0.0293, global_step=8272.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  39%|███▉      | 474/1208 [13:44<21:17,  1.74s/it, loss=0.151, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00263, train/loss_step=0.323, global_step=8272.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  39%|███▉      | 475/1208 [13:46<21:14,  1.74s/it, loss=0.151, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00263, train/loss_step=0.323, global_step=8272.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  39%|███▉      | 475/1208 [13:46<21:14,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.0009, train/loss_step=0.220, global_step=8272.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  39%|███▉      | 476/1208 [13:49<21:15,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.220, train/loss_vlb_step=0.0009, train/loss_step=0.220, global_step=8272.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  39%|███▉      | 476/1208 [13:49<21:15,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0323, train/loss_vlb_step=0.000124, train/loss_step=0.0323, global_step=8272.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  39%|███▉      | 477/1208 [13:50<21:12,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0323, train/loss_vlb_step=0.000124, train/loss_step=0.0323, global_step=8272.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  39%|███▉      | 477/1208 [13:50<21:12,  1.74s/it, loss=0.186, v_num=0, train/loss_simple_step=0.461, train/loss_vlb_step=0.00366, train/loss_step=0.461, global_step=8273.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  40%|███▉      | 478/1208 [13:51<21:09,  1.74s/it, loss=0.186, v_num=0, train/loss_simple_step=0.461, train/loss_vlb_step=0.00366, train/loss_step=0.461, global_step=8273.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  40%|███▉      | 478/1208 [13:51<21:09,  1.74s/it, loss=0.195, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000702, train/loss_step=0.191, global_step=8273.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  40%|███▉      | 479/1208 [13:52<21:06,  1.74s/it, loss=0.195, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000702, train/loss_step=0.191, global_step=8273.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  40%|███▉      | 479/1208 [13:52<21:06,  1.74s/it, loss=0.214, v_num=0, train/loss_simple_step=0.488, train/loss_vlb_step=0.00428, train/loss_step=0.488, global_step=8273.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  40%|███▉      | 480/1208 [13:55<21:07,  1.74s/it, loss=0.214, v_num=0, train/loss_simple_step=0.488, train/loss_vlb_step=0.00428, train/loss_step=0.488, global_step=8273.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  40%|███▉      | 480/1208 [13:55<21:07,  1.74s/it, loss=0.222, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000532, train/loss_step=0.154, global_step=8273.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  40%|███▉      | 481/1208 [13:56<21:04,  1.74s/it, loss=0.222, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000532, train/loss_step=0.154, global_step=8273.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  40%|███▉      | 481/1208 [13:56<21:04,  1.74s/it, loss=0.223, v_num=0, train/loss_simple_step=0.0501, train/loss_vlb_step=0.000175, train/loss_step=0.0501, global_step=8274.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  40%|███▉      | 482/1208 [13:57<21:01,  1.74s/it, loss=0.223, v_num=0, train/loss_simple_step=0.0501, train/loss_vlb_step=0.000175, train/loss_step=0.0501, global_step=8274.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  40%|███▉      | 482/1208 [13:57<21:01,  1.74s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000139, train/loss_step=0.0396, global_step=8274.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  40%|███▉      | 483/1208 [13:58<20:59,  1.74s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000139, train/loss_step=0.0396, global_step=8274.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  40%|███▉      | 483/1208 [13:58<20:59,  1.74s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.52e-5, train/loss_step=0.0212, global_step=8274.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  40%|████      | 484/1208 [14:02<20:59,  1.74s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.52e-5, train/loss_step=0.0212, global_step=8274.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  40%|████      | 484/1208 [14:02<20:59,  1.74s/it, loss=0.215, v_num=0, train/loss_simple_step=0.926, train/loss_vlb_step=0.466, train/loss_step=0.926, global_step=8274.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  40%|████      | 485/1208 [14:03<20:56,  1.74s/it, loss=0.215, v_num=0, train/loss_simple_step=0.926, train/loss_vlb_step=0.466, train/loss_step=0.926, global_step=8274.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  40%|████      | 485/1208 [14:03<20:56,  1.74s/it, loss=0.203, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000131, train/loss_step=0.035, global_step=8275.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  40%|████      | 486/1208 [14:04<20:54,  1.74s/it, loss=0.203, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000131, train/loss_step=0.035, global_step=8275.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  40%|████      | 486/1208 [14:04<20:54,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00948, train/loss_vlb_step=4.45e-5, train/loss_step=0.00948, global_step=8275.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  40%|████      | 487/1208 [14:05<20:51,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00948, train/loss_vlb_step=4.45e-5, train/loss_step=0.00948, global_step=8275.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  40%|████      | 487/1208 [14:05<20:51,  1.74s/it, loss=0.193, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00133, train/loss_step=0.298, global_step=8275.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  40%|████      | 488/1208 [14:08<20:51,  1.74s/it, loss=0.193, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00133, train/loss_step=0.298, global_step=8275.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  40%|████      | 488/1208 [14:08<20:51,  1.74s/it, loss=0.19, v_num=0, train/loss_simple_step=0.044, train/loss_vlb_step=0.000158, train/loss_step=0.044, global_step=8275.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  40%|████      | 489/1208 [14:09<20:49,  1.74s/it, loss=0.19, v_num=0, train/loss_simple_step=0.044, train/loss_vlb_step=0.000158, train/loss_step=0.044, global_step=8275.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  40%|████      | 489/1208 [14:09<20:49,  1.74s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0382, train/loss_vlb_step=0.000146, train/loss_step=0.0382, global_step=8276.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  41%|████      | 490/1208 [14:10<20:46,  1.74s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0382, train/loss_vlb_step=0.000146, train/loss_step=0.0382, global_step=8276.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  41%|████      | 490/1208 [14:10<20:46,  1.74s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000141, train/loss_step=0.0373, global_step=8276.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  41%|████      | 491/1208 [14:11<20:43,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000141, train/loss_step=0.0373, global_step=8276.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  41%|████      | 491/1208 [14:11<20:43,  1.73s/it, loss=0.194, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000639, train/loss_step=0.185, global_step=8276.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  41%|████      | 492/1208 [14:14<20:44,  1.74s/it, loss=0.194, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000639, train/loss_step=0.185, global_step=8276.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  41%|████      | 492/1208 [14:14<20:44,  1.74s/it, loss=0.18, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.34e-5, train/loss_step=0.021, global_step=8276.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  41%|████      | 493/1208 [14:16<20:41,  1.74s/it, loss=0.18, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=8.34e-5, train/loss_step=0.021, global_step=8276.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  41%|████      | 493/1208 [14:16<20:41,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=1.12e-5, train/loss_step=0.0019, global_step=8277.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  41%|████      | 494/1208 [14:17<20:38,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=1.12e-5, train/loss_step=0.0019, global_step=8277.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  41%|████      | 494/1208 [14:17<20:38,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00814, train/loss_vlb_step=3.75e-5, train/loss_step=0.00814, global_step=8277.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  41%|████      | 495/1208 [14:18<20:36,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00814, train/loss_vlb_step=3.75e-5, train/loss_step=0.00814, global_step=8277.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  41%|████      | 495/1208 [14:18<20:36,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.71e-5, train/loss_step=0.0216, global_step=8277.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  41%|████      | 496/1208 [14:21<20:36,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=8.71e-5, train/loss_step=0.0216, global_step=8277.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  41%|████      | 496/1208 [14:21<20:36,  1.74s/it, loss=0.158, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000442, train/loss_step=0.134, global_step=8277.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  41%|████      | 497/1208 [14:22<20:33,  1.74s/it, loss=0.158, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000442, train/loss_step=0.134, global_step=8277.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  41%|████      | 497/1208 [14:22<20:33,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.73e-5, train/loss_step=0.0124, global_step=8278.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  41%|████      | 498/1208 [14:23<20:31,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.73e-5, train/loss_step=0.0124, global_step=8278.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  41%|████      | 498/1208 [14:23<20:31,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000634, train/loss_step=0.178, global_step=8278.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  41%|████▏     | 499/1208 [14:24<20:28,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000634, train/loss_step=0.178, global_step=8278.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  41%|████▏     | 499/1208 [14:24<20:28,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.688, train/loss_vlb_step=0.0149, train/loss_step=0.688, global_step=8278.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  41%|████▏     | 500/1208 [14:27<20:28,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.688, train/loss_vlb_step=0.0149, train/loss_step=0.688, global_step=8278.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  41%|████▏     | 500/1208 [14:27<20:28,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=8278.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  41%|████▏     | 501/1208 [14:28<20:26,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=8278.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  41%|████▏     | 501/1208 [14:28<20:26,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=1.39e-5, train/loss_step=0.00242, global_step=8279.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  42%|████▏     | 502/1208 [14:29<20:23,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=1.39e-5, train/loss_step=0.00242, global_step=8279.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  42%|████▏     | 502/1208 [14:29<20:23,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000552, train/loss_step=0.167, global_step=8279.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  42%|████▏     | 503/1208 [14:31<20:20,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000552, train/loss_step=0.167, global_step=8279.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  42%|████▏     | 503/1208 [14:31<20:20,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00181, train/loss_step=0.337, global_step=8279.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  42%|████▏     | 504/1208 [14:34<20:21,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00181, train/loss_step=0.337, global_step=8279.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  42%|████▏     | 504/1208 [14:34<20:21,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.18e-5, train/loss_step=0.0109, global_step=8279.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  42%|████▏     | 505/1208 [14:35<20:18,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.18e-5, train/loss_step=0.0109, global_step=8279.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  42%|████▏     | 505/1208 [14:35<20:18,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.51e-5, train/loss_step=0.00257, global_step=8280.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  42%|████▏     | 506/1208 [14:36<20:15,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.51e-5, train/loss_step=0.00257, global_step=8280.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  42%|████▏     | 506/1208 [14:36<20:15,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00152, train/loss_step=0.289, global_step=8280.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]     Epoch 27:  42%|████▏     | 507/1208 [14:37<20:13,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00152, train/loss_step=0.289, global_step=8280.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  42%|████▏     | 507/1208 [14:37<20:13,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000287, train/loss_step=0.087, global_step=8280.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  42%|████▏     | 508/1208 [14:40<20:13,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000287, train/loss_step=0.087, global_step=8280.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  42%|████▏     | 508/1208 [14:40<20:13,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000433, train/loss_step=0.130, global_step=8280.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  42%|████▏     | 509/1208 [14:41<20:10,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000433, train/loss_step=0.130, global_step=8280.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  42%|████▏     | 509/1208 [14:41<20:10,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00256, train/loss_step=0.415, global_step=8281.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  42%|████▏     | 510/1208 [14:42<20:08,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.415, train/loss_vlb_step=0.00256, train/loss_step=0.415, global_step=8281.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  42%|████▏     | 510/1208 [14:42<20:08,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000455, train/loss_step=0.138, global_step=8281.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  42%|████▏     | 511/1208 [14:43<20:05,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000455, train/loss_step=0.138, global_step=8281.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  42%|████▏     | 511/1208 [14:43<20:05,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.71e-5, train/loss_step=0.0104, global_step=8281.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  42%|████▏     | 512/1208 [14:47<20:05,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.71e-5, train/loss_step=0.0104, global_step=8281.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  42%|████▏     | 512/1208 [14:47<20:05,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0035, train/loss_vlb_step=1.99e-5, train/loss_step=0.0035, global_step=8281.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  42%|████▏     | 513/1208 [14:48<20:03,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0035, train/loss_vlb_step=1.99e-5, train/loss_step=0.0035, global_step=8281.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  42%|████▏     | 513/1208 [14:48<20:03,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.62e-5, train/loss_step=0.0101, global_step=8282.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  43%|████▎     | 514/1208 [14:49<20:00,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.62e-5, train/loss_step=0.0101, global_step=8282.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  43%|████▎     | 514/1208 [14:49<20:00,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.614, train/loss_vlb_step=0.0181, train/loss_step=0.614, global_step=8282.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  43%|████▎     | 515/1208 [14:50<19:58,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.614, train/loss_vlb_step=0.0181, train/loss_step=0.614, global_step=8282.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  43%|████▎     | 515/1208 [14:50<19:58,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00279, train/loss_vlb_step=1.58e-5, train/loss_step=0.00279, global_step=8282.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  43%|████▎     | 516/1208 [14:53<19:58,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00279, train/loss_vlb_step=1.58e-5, train/loss_step=0.00279, global_step=8282.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  43%|████▎     | 516/1208 [14:53<19:58,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.060, train/loss_vlb_step=0.000209, train/loss_step=0.060, global_step=8282.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  43%|████▎     | 517/1208 [14:54<19:55,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.060, train/loss_vlb_step=0.000209, train/loss_step=0.060, global_step=8282.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  43%|████▎     | 517/1208 [14:54<19:55,  1.73s/it, loss=0.191, v_num=0, train/loss_simple_step=0.554, train/loss_vlb_step=0.0084, train/loss_step=0.554, global_step=8283.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  43%|████▎     | 518/1208 [14:55<19:53,  1.73s/it, loss=0.191, v_num=0, train/loss_simple_step=0.554, train/loss_vlb_step=0.0084, train/loss_step=0.554, global_step=8283.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  43%|████▎     | 518/1208 [14:55<19:53,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=2.13e-5, train/loss_step=0.00405, global_step=8283.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  43%|████▎     | 519/1208 [14:56<19:50,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=2.13e-5, train/loss_step=0.00405, global_step=8283.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  43%|████▎     | 519/1208 [14:56<19:50,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000814, train/loss_step=0.213, global_step=8283.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  43%|████▎     | 520/1208 [14:59<19:50,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000814, train/loss_step=0.213, global_step=8283.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  43%|████▎     | 520/1208 [14:59<19:50,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.71e-5, train/loss_step=0.0162, global_step=8283.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  43%|████▎     | 521/1208 [15:00<19:48,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.71e-5, train/loss_step=0.0162, global_step=8283.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  43%|████▎     | 521/1208 [15:00<19:48,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00189, train/loss_step=0.319, global_step=8284.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  43%|████▎     | 522/1208 [15:02<19:45,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.319, train/loss_vlb_step=0.00189, train/loss_step=0.319, global_step=8284.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  43%|████▎     | 522/1208 [15:02<19:45,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=2.8e-5, train/loss_step=0.00545, global_step=8284.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  43%|████▎     | 523/1208 [15:03<19:42,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=2.8e-5, train/loss_step=0.00545, global_step=8284.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  43%|████▎     | 523/1208 [15:03<19:42,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=9.87e-5, train/loss_step=0.0257, global_step=8284.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  43%|████▎     | 524/1208 [15:06<19:43,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=9.87e-5, train/loss_step=0.0257, global_step=8284.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  43%|████▎     | 524/1208 [15:06<19:43,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=9.04e-5, train/loss_step=0.0222, global_step=8284.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  43%|████▎     | 525/1208 [15:07<19:40,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=9.04e-5, train/loss_step=0.0222, global_step=8284.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  43%|████▎     | 525/1208 [15:07<19:40,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.0014, train/loss_step=0.299, global_step=8285.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  44%|████▎     | 526/1208 [15:08<19:37,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.0014, train/loss_step=0.299, global_step=8285.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  44%|████▎     | 526/1208 [15:08<19:37,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.0004, train/loss_step=0.122, global_step=8285.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  44%|████▎     | 527/1208 [15:09<19:35,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.0004, train/loss_step=0.122, global_step=8285.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  44%|████▎     | 527/1208 [15:09<19:35,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0384, train/loss_vlb_step=0.00014, train/loss_step=0.0384, global_step=8285.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  44%|████▎     | 528/1208 [15:12<19:35,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0384, train/loss_vlb_step=0.00014, train/loss_step=0.0384, global_step=8285.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  44%|████▎     | 528/1208 [15:12<19:35,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0321, train/loss_vlb_step=0.000123, train/loss_step=0.0321, global_step=8285.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  44%|████▍     | 529/1208 [15:13<19:33,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0321, train/loss_vlb_step=0.000123, train/loss_step=0.0321, global_step=8285.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  44%|████▍     | 529/1208 [15:13<19:33,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000335, train/loss_step=0.101, global_step=8286.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  44%|████▍     | 530/1208 [15:15<19:30,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000335, train/loss_step=0.101, global_step=8286.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  44%|████▍     | 530/1208 [15:15<19:30,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0071, train/loss_vlb_step=3.2e-5, train/loss_step=0.0071, global_step=8286.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  44%|████▍     | 531/1208 [15:16<19:27,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0071, train/loss_vlb_step=3.2e-5, train/loss_step=0.0071, global_step=8286.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  44%|████▍     | 531/1208 [15:16<19:27,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000102, train/loss_step=0.0263, global_step=8286.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  44%|████▍     | 532/1208 [15:19<19:28,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000102, train/loss_step=0.0263, global_step=8286.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  44%|████▍     | 532/1208 [15:19<19:28,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0786, train/loss_vlb_step=0.000267, train/loss_step=0.0786, global_step=8286.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  44%|████▍     | 533/1208 [15:20<19:25,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0786, train/loss_vlb_step=0.000267, train/loss_step=0.0786, global_step=8286.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  44%|████▍     | 533/1208 [15:20<19:25,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00606, train/loss_vlb_step=3.04e-5, train/loss_step=0.00606, global_step=8287.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  44%|████▍     | 534/1208 [15:21<19:23,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00606, train/loss_vlb_step=3.04e-5, train/loss_step=0.00606, global_step=8287.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  44%|████▍     | 534/1208 [15:21<19:23,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0873, train/loss_vlb_step=0.000287, train/loss_step=0.0873, global_step=8287.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  44%|████▍     | 535/1208 [15:22<19:20,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0873, train/loss_vlb_step=0.000287, train/loss_step=0.0873, global_step=8287.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  44%|████▍     | 535/1208 [15:22<19:20,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000337, train/loss_step=0.100, global_step=8287.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  44%|████▍     | 536/1208 [15:25<19:20,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000337, train/loss_step=0.100, global_step=8287.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  44%|████▍     | 536/1208 [15:25<19:20,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00789, train/loss_vlb_step=3.89e-5, train/loss_step=0.00789, global_step=8287.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  44%|████▍     | 537/1208 [15:26<19:18,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00789, train/loss_vlb_step=3.89e-5, train/loss_step=0.00789, global_step=8287.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  44%|████▍     | 537/1208 [15:26<19:18,  1.73s/it, loss=0.0757, v_num=0, train/loss_simple_step=0.00279, train/loss_vlb_step=1.52e-5, train/loss_step=0.00279, global_step=8288.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  45%|████▍     | 538/1208 [15:28<19:15,  1.72s/it, loss=0.0757, v_num=0, train/loss_simple_step=0.00279, train/loss_vlb_step=1.52e-5, train/loss_step=0.00279, global_step=8288.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  45%|████▍     | 538/1208 [15:28<19:15,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.657, train/loss_vlb_step=0.0128, train/loss_step=0.657, global_step=8288.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]      Epoch 27:  45%|████▍     | 539/1208 [15:29<19:13,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.657, train/loss_vlb_step=0.0128, train/loss_step=0.657, global_step=8288.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  45%|████▍     | 539/1208 [15:29<19:13,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000888, train/loss_step=0.235, global_step=8288.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  45%|████▍     | 540/1208 [15:32<19:13,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000888, train/loss_step=0.235, global_step=8288.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  45%|████▍     | 540/1208 [15:32<19:13,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000454, train/loss_step=0.138, global_step=8288.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  45%|████▍     | 541/1208 [15:33<19:10,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000454, train/loss_step=0.138, global_step=8288.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  45%|████▍     | 541/1208 [15:33<19:10,  1.73s/it, loss=0.105, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=8289.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  45%|████▍     | 542/1208 [15:34<19:08,  1.72s/it, loss=0.105, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=8289.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  45%|████▍     | 542/1208 [15:34<19:08,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000113, train/loss_step=0.0301, global_step=8289.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  45%|████▍     | 543/1208 [15:35<19:05,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000113, train/loss_step=0.0301, global_step=8289.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  45%|████▍     | 543/1208 [15:35<19:05,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.080, train/loss_vlb_step=0.000263, train/loss_step=0.080, global_step=8289.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  45%|████▌     | 544/1208 [15:38<19:05,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.080, train/loss_vlb_step=0.000263, train/loss_step=0.080, global_step=8289.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  45%|████▌     | 544/1208 [15:38<19:05,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0899, train/loss_vlb_step=0.000298, train/loss_step=0.0899, global_step=8289.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  45%|████▌     | 545/1208 [15:39<19:03,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0899, train/loss_vlb_step=0.000298, train/loss_step=0.0899, global_step=8289.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  45%|████▌     | 545/1208 [15:39<19:03,  1.72s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.1e-5, train/loss_step=0.0167, global_step=8290.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  45%|████▌     | 546/1208 [15:40<19:00,  1.72s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.1e-5, train/loss_step=0.0167, global_step=8290.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  45%|████▌     | 546/1208 [15:40<19:00,  1.72s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.0371, train/loss_vlb_step=0.000131, train/loss_step=0.0371, global_step=8290.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  45%|████▌     | 547/1208 [15:41<18:58,  1.72s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.0371, train/loss_vlb_step=0.000131, train/loss_step=0.0371, global_step=8290.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  45%|████▌     | 547/1208 [15:41<18:58,  1.72s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=1.77e-5, train/loss_step=0.0031, global_step=8290.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  45%|████▌     | 548/1208 [15:45<18:58,  1.72s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=1.77e-5, train/loss_step=0.0031, global_step=8290.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  45%|████▌     | 548/1208 [15:45<18:58,  1.72s/it, loss=0.0911, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.33e-5, train/loss_step=0.0169, global_step=8290.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  45%|████▌     | 549/1208 [15:46<18:55,  1.72s/it, loss=0.0911, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.33e-5, train/loss_step=0.0169, global_step=8290.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  45%|████▌     | 549/1208 [15:46<18:55,  1.72s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.00107, train/loss_step=0.236, global_step=8291.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  46%|████▌     | 550/1208 [15:47<18:53,  1.72s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.00107, train/loss_step=0.236, global_step=8291.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  46%|████▌     | 550/1208 [15:47<18:53,  1.72s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.00332, train/loss_vlb_step=1.87e-5, train/loss_step=0.00332, global_step=8291.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  46%|████▌     | 551/1208 [15:48<18:50,  1.72s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.00332, train/loss_vlb_step=1.87e-5, train/loss_step=0.00332, global_step=8291.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  46%|████▌     | 551/1208 [15:48<18:50,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000523, train/loss_step=0.157, global_step=8291.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  46%|████▌     | 552/1208 [15:51<18:50,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000523, train/loss_step=0.157, global_step=8291.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  46%|████▌     | 552/1208 [15:51<18:50,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.59e-5, train/loss_step=0.0126, global_step=8291.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  46%|████▌     | 553/1208 [15:52<18:48,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.59e-5, train/loss_step=0.0126, global_step=8291.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  46%|████▌     | 553/1208 [15:52<18:48,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0694, train/loss_vlb_step=0.000241, train/loss_step=0.0694, global_step=8292.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  46%|████▌     | 554/1208 [15:53<18:45,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0694, train/loss_vlb_step=0.000241, train/loss_step=0.0694, global_step=8292.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  46%|████▌     | 554/1208 [15:53<18:45,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000383, train/loss_step=0.117, global_step=8292.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  46%|████▌     | 555/1208 [15:54<18:43,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000383, train/loss_step=0.117, global_step=8292.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  46%|████▌     | 555/1208 [15:54<18:43,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00564, train/loss_vlb_step=2.91e-5, train/loss_step=0.00564, global_step=8292.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  46%|████▌     | 556/1208 [15:58<18:43,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00564, train/loss_vlb_step=2.91e-5, train/loss_step=0.00564, global_step=8292.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  46%|████▌     | 556/1208 [15:58<18:43,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000503, train/loss_step=0.148, global_step=8292.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  46%|████▌     | 557/1208 [15:59<18:40,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000503, train/loss_step=0.148, global_step=8292.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  46%|████▌     | 557/1208 [15:59<18:40,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.76e-5, train/loss_step=0.0032, global_step=8293.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  46%|████▌     | 558/1208 [16:00<18:38,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.76e-5, train/loss_step=0.0032, global_step=8293.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  46%|████▌     | 558/1208 [16:00<18:38,  1.72s/it, loss=0.0751, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.38e-5, train/loss_step=0.00248, global_step=8293.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  46%|████▋     | 559/1208 [16:01<18:36,  1.72s/it, loss=0.0751, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.38e-5, train/loss_step=0.00248, global_step=8293.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  46%|████▋     | 559/1208 [16:01<18:36,  1.72s/it, loss=0.0684, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000329, train/loss_step=0.100, global_step=8293.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  46%|████▋     | 560/1208 [16:04<18:36,  1.72s/it, loss=0.0684, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000329, train/loss_step=0.100, global_step=8293.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  46%|████▋     | 560/1208 [16:04<18:36,  1.72s/it, loss=0.0625, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.71e-5, train/loss_step=0.0208, global_step=8293.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  46%|████▋     | 561/1208 [16:05<18:33,  1.72s/it, loss=0.0625, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.71e-5, train/loss_step=0.0208, global_step=8293.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  46%|████▋     | 561/1208 [16:05<18:33,  1.72s/it, loss=0.0661, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000593, train/loss_step=0.173, global_step=8294.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  47%|████▋     | 562/1208 [16:06<18:31,  1.72s/it, loss=0.0661, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000593, train/loss_step=0.173, global_step=8294.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  47%|████▋     | 562/1208 [16:06<18:31,  1.72s/it, loss=0.0794, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.0017, train/loss_step=0.297, global_step=8294.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  47%|████▋     | 563/1208 [16:07<18:28,  1.72s/it, loss=0.0794, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.0017, train/loss_step=0.297, global_step=8294.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  47%|████▋     | 563/1208 [16:07<18:28,  1.72s/it, loss=0.0796, v_num=0, train/loss_simple_step=0.0843, train/loss_vlb_step=0.000281, train/loss_step=0.0843, global_step=8294.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  47%|████▋     | 564/1208 [16:10<18:28,  1.72s/it, loss=0.0796, v_num=0, train/loss_simple_step=0.0843, train/loss_vlb_step=0.000281, train/loss_step=0.0843, global_step=8294.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  47%|████▋     | 564/1208 [16:10<18:28,  1.72s/it, loss=0.0939, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00194, train/loss_step=0.374, global_step=8294.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  47%|████▋     | 565/1208 [16:12<18:26,  1.72s/it, loss=0.0939, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00194, train/loss_step=0.374, global_step=8294.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  47%|████▋     | 565/1208 [16:12<18:26,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000567, train/loss_step=0.166, global_step=8295.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  47%|████▋     | 566/1208 [16:13<18:23,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000567, train/loss_step=0.166, global_step=8295.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  47%|████▋     | 566/1208 [16:13<18:23,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.00041, train/loss_step=0.124, global_step=8295.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  47%|████▋     | 567/1208 [16:14<18:21,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.00041, train/loss_step=0.124, global_step=8295.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  47%|████▋     | 567/1208 [16:14<18:21,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000287, train/loss_step=0.087, global_step=8295.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  47%|████▋     | 568/1208 [16:17<18:21,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000287, train/loss_step=0.087, global_step=8295.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  47%|████▋     | 568/1208 [16:17<18:21,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000508, train/loss_step=0.153, global_step=8295.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  47%|████▋     | 569/1208 [16:18<18:18,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000508, train/loss_step=0.153, global_step=8295.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  47%|████▋     | 569/1208 [16:18<18:18,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000407, train/loss_step=0.122, global_step=8296.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  47%|████▋     | 570/1208 [16:19<18:16,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000407, train/loss_step=0.122, global_step=8296.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  47%|████▋     | 570/1208 [16:19<18:16,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00301, train/loss_step=0.409, global_step=8296.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  47%|████▋     | 571/1208 [16:20<18:14,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00301, train/loss_step=0.409, global_step=8296.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  47%|████▋     | 571/1208 [16:20<18:14,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.438, train/loss_vlb_step=0.00548, train/loss_step=0.438, global_step=8296.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  47%|████▋     | 572/1208 [16:23<18:14,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.438, train/loss_vlb_step=0.00548, train/loss_step=0.438, global_step=8296.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  47%|████▋     | 572/1208 [16:23<18:14,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.00011, train/loss_step=0.027, global_step=8296.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  47%|████▋     | 573/1208 [16:25<18:11,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.00011, train/loss_step=0.027, global_step=8296.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  47%|████▋     | 573/1208 [16:25<18:11,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00627, train/loss_vlb_step=3.17e-5, train/loss_step=0.00627, global_step=8297.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  48%|████▊     | 574/1208 [16:26<18:09,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00627, train/loss_vlb_step=3.17e-5, train/loss_step=0.00627, global_step=8297.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  48%|████▊     | 574/1208 [16:26<18:09,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.058, train/loss_vlb_step=0.000203, train/loss_step=0.058, global_step=8297.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  48%|████▊     | 575/1208 [16:27<18:06,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.058, train/loss_vlb_step=0.000203, train/loss_step=0.058, global_step=8297.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  48%|████▊     | 575/1208 [16:27<18:06,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00422, train/loss_vlb_step=2.27e-5, train/loss_step=0.00422, global_step=8297.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  48%|████▊     | 576/1208 [16:30<18:06,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00422, train/loss_vlb_step=2.27e-5, train/loss_step=0.00422, global_step=8297.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  48%|████▊     | 576/1208 [16:30<18:06,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000741, train/loss_step=0.199, global_step=8297.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  48%|████▊     | 577/1208 [16:31<18:04,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000741, train/loss_step=0.199, global_step=8297.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  48%|████▊     | 577/1208 [16:31<18:04,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=9.44e-6, train/loss_step=0.00155, global_step=8298.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  48%|████▊     | 578/1208 [16:32<18:01,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=9.44e-6, train/loss_step=0.00155, global_step=8298.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  48%|████▊     | 578/1208 [16:32<18:01,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.510, train/loss_vlb_step=0.00469, train/loss_step=0.510, global_step=8298.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  48%|████▊     | 579/1208 [16:33<17:59,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.510, train/loss_vlb_step=0.00469, train/loss_step=0.510, global_step=8298.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  48%|████▊     | 579/1208 [16:33<17:59,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00379, train/loss_step=0.407, global_step=8298.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  48%|████▊     | 580/1208 [16:36<17:59,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.407, train/loss_vlb_step=0.00379, train/loss_step=0.407, global_step=8298.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  48%|████▊     | 580/1208 [16:36<17:59,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.86e-5, train/loss_step=0.00324, global_step=8298.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  48%|████▊     | 581/1208 [16:37<17:56,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.86e-5, train/loss_step=0.00324, global_step=8298.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  48%|████▊     | 581/1208 [16:37<17:56,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.0015, train/loss_step=0.302, global_step=8299.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]     Epoch 27:  48%|████▊     | 582/1208 [16:38<17:54,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.0015, train/loss_step=0.302, global_step=8299.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  48%|████▊     | 582/1208 [16:38<17:54,  1.72s/it, loss=0.198, v_num=0, train/loss_simple_step=0.477, train/loss_vlb_step=0.00482, train/loss_step=0.477, global_step=8299.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  48%|████▊     | 583/1208 [16:39<17:52,  1.72s/it, loss=0.198, v_num=0, train/loss_simple_step=0.477, train/loss_vlb_step=0.00482, train/loss_step=0.477, global_step=8299.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  48%|████▊     | 583/1208 [16:39<17:52,  1.72s/it, loss=0.194, v_num=0, train/loss_simple_step=0.00568, train/loss_vlb_step=2.93e-5, train/loss_step=0.00568, global_step=8299.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  48%|████▊     | 584/1208 [16:43<17:51,  1.72s/it, loss=0.194, v_num=0, train/loss_simple_step=0.00568, train/loss_vlb_step=2.93e-5, train/loss_step=0.00568, global_step=8299.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  48%|████▊     | 584/1208 [16:43<17:51,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000569, train/loss_step=0.168, global_step=8299.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  48%|████▊     | 585/1208 [16:44<17:49,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000569, train/loss_step=0.168, global_step=8299.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  48%|████▊     | 585/1208 [16:44<17:49,  1.72s/it, loss=0.187, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00107, train/loss_step=0.244, global_step=8300.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  49%|████▊     | 586/1208 [16:45<17:47,  1.72s/it, loss=0.187, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00107, train/loss_step=0.244, global_step=8300.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  49%|████▊     | 586/1208 [16:45<17:47,  1.72s/it, loss=0.198, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00171, train/loss_step=0.346, global_step=8300.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  49%|████▊     | 587/1208 [16:46<17:44,  1.71s/it, loss=0.198, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00171, train/loss_step=0.346, global_step=8300.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  49%|████▊     | 587/1208 [16:46<17:44,  1.71s/it, loss=0.198, v_num=0, train/loss_simple_step=0.072, train/loss_vlb_step=0.000244, train/loss_step=0.072, global_step=8300.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  49%|████▊     | 588/1208 [16:49<17:44,  1.72s/it, loss=0.198, v_num=0, train/loss_simple_step=0.072, train/loss_vlb_step=0.000244, train/loss_step=0.072, global_step=8300.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  49%|████▊     | 588/1208 [16:49<17:44,  1.72s/it, loss=0.192, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000175, train/loss_step=0.050, global_step=8300.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  49%|████▉     | 589/1208 [16:50<17:42,  1.72s/it, loss=0.192, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.000175, train/loss_step=0.050, global_step=8300.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  49%|████▉     | 589/1208 [16:50<17:42,  1.72s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.65e-5, train/loss_step=0.0156, global_step=8301.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  49%|████▉     | 590/1208 [16:51<17:39,  1.71s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.65e-5, train/loss_step=0.0156, global_step=8301.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  49%|████▉     | 590/1208 [16:51<17:39,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000456, train/loss_step=0.136, global_step=8301.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  49%|████▉     | 591/1208 [16:52<17:37,  1.71s/it, loss=0.173, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000456, train/loss_step=0.136, global_step=8301.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  49%|████▉     | 591/1208 [16:52<17:37,  1.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.42e-5, train/loss_step=0.0239, global_step=8301.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  49%|████▉     | 592/1208 [16:56<17:37,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.42e-5, train/loss_step=0.0239, global_step=8301.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  49%|████▉     | 592/1208 [16:56<17:37,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000489, train/loss_step=0.144, global_step=8301.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  49%|████▉     | 593/1208 [16:57<17:34,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000489, train/loss_step=0.144, global_step=8301.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  49%|████▉     | 593/1208 [16:57<17:34,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.34e-5, train/loss_step=0.0155, global_step=8302.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  49%|████▉     | 594/1208 [16:58<17:32,  1.71s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.34e-5, train/loss_step=0.0155, global_step=8302.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  49%|████▉     | 594/1208 [16:58<17:32,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00509, train/loss_vlb_step=2.67e-5, train/loss_step=0.00509, global_step=8302.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  49%|████▉     | 595/1208 [16:59<17:30,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00509, train/loss_vlb_step=2.67e-5, train/loss_step=0.00509, global_step=8302.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  49%|████▉     | 595/1208 [16:59<17:30,  1.71s/it, loss=0.164, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000515, train/loss_step=0.154, global_step=8302.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  49%|████▉     | 596/1208 [17:02<17:30,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000515, train/loss_step=0.154, global_step=8302.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  49%|████▉     | 596/1208 [17:02<17:30,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0904, train/loss_vlb_step=0.000298, train/loss_step=0.0904, global_step=8302.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  49%|████▉     | 597/1208 [17:03<17:27,  1.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0904, train/loss_vlb_step=0.000298, train/loss_step=0.0904, global_step=8302.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  49%|████▉     | 597/1208 [17:03<17:27,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.463, train/loss_vlb_step=0.00579, train/loss_step=0.463, global_step=8303.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  50%|████▉     | 598/1208 [17:04<17:25,  1.71s/it, loss=0.182, v_num=0, train/loss_simple_step=0.463, train/loss_vlb_step=0.00579, train/loss_step=0.463, global_step=8303.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  50%|████▉     | 598/1208 [17:04<17:25,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000606, train/loss_step=0.176, global_step=8303.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  50%|████▉     | 599/1208 [17:05<17:22,  1.71s/it, loss=0.165, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000606, train/loss_step=0.176, global_step=8303.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  50%|████▉     | 599/1208 [17:05<17:22,  1.71s/it, loss=0.157, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00112, train/loss_step=0.245, global_step=8303.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  50%|████▉     | 600/1208 [17:09<17:22,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.00112, train/loss_step=0.245, global_step=8303.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  50%|████▉     | 600/1208 [17:09<17:22,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000102, train/loss_step=0.0263, global_step=8303.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:29,  1.65it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:28,  1.70it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.71it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.77it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.77it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.73it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.73it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.75it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.73it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.79it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.73it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.73it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.74it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.74it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.73it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.74it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.74it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:23,  1.74it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.76it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.71it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.73it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.75it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.73it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.73it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.75it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.73it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.76it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.75it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.73it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.76it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.76it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:20,  1.72it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.76it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.71it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.76it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:19,  1.73it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.78it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.78it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.74it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.74it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.74it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.75it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.75it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:16,  1.75it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.75it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.75it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.78it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.78it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.78it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.76it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.76it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.76it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.75it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:16<00:12,  1.76it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:12,  1.73it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:12,  1.75it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.74it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.75it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.76it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.76it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.75it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.75it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.75it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.76it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.75it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.75it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.75it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.78it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.75it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.74it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:20<00:08,  1.74it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.75it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.75it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.75it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.76it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.75it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.75it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.75it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.75it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.77it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.77it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.75it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.75it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.78it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.75it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.75it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.75it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:24<00:04,  1.72it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.75it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.73it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.76it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.74it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.75it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.75it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.74it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.75it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.74it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.75it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.74it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.75it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.75it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.75it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.75it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.79it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.74it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.74it/s]Epoch 27:  50%|████▉     | 601/1208 [17:40<17:51,  1.77s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000102, train/loss_step=0.0263, global_step=8303.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  50%|████▉     | 601/1208 [17:40<17:51,  1.77s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.56e-5, train/loss_step=0.00288, global_step=8304.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  50%|████▉     | 602/1208 [17:41<17:48,  1.76s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.56e-5, train/loss_step=0.00288, global_step=8304.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  50%|████▉     | 602/1208 [17:41<17:48,  1.76s/it, loss=0.141, v_num=0, train/loss_simple_step=0.440, train/loss_vlb_step=0.0052, train/loss_step=0.440, global_step=8304.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]     Epoch 27:  50%|████▉     | 603/1208 [17:42<17:46,  1.76s/it, loss=0.141, v_num=0, train/loss_simple_step=0.440, train/loss_vlb_step=0.0052, train/loss_step=0.440, global_step=8304.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  50%|████▉     | 603/1208 [17:42<17:46,  1.76s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000116, train/loss_step=0.0304, global_step=8304.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  50%|█████     | 604/1208 [17:45<17:45,  1.76s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0304, train/loss_vlb_step=0.000116, train/loss_step=0.0304, global_step=8304.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  50%|█████     | 604/1208 [17:45<17:45,  1.76s/it, loss=0.149, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00173, train/loss_step=0.300, global_step=8304.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  50%|█████     | 605/1208 [17:47<17:43,  1.76s/it, loss=0.149, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00173, train/loss_step=0.300, global_step=8304.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  50%|█████     | 605/1208 [17:47<17:43,  1.76s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.54e-5, train/loss_step=0.00273, global_step=8305.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  50%|█████     | 606/1208 [17:48<17:41,  1.76s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.54e-5, train/loss_step=0.00273, global_step=8305.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  50%|█████     | 606/1208 [17:48<17:41,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00181, train/loss_step=0.336, global_step=8305.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  50%|█████     | 607/1208 [17:49<17:38,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.336, train/loss_vlb_step=0.00181, train/loss_step=0.336, global_step=8305.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  50%|█████     | 607/1208 [17:49<17:38,  1.76s/it, loss=0.141, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.00058, train/loss_step=0.167, global_step=8305.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  50%|█████     | 608/1208 [17:52<17:38,  1.76s/it, loss=0.141, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.00058, train/loss_step=0.167, global_step=8305.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  50%|█████     | 608/1208 [17:52<17:38,  1.76s/it, loss=0.157, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.0024, train/loss_step=0.373, global_step=8305.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  50%|█████     | 609/1208 [17:53<17:35,  1.76s/it, loss=0.157, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.0024, train/loss_step=0.373, global_step=8305.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  50%|█████     | 609/1208 [17:53<17:35,  1.76s/it, loss=0.164, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000476, train/loss_step=0.140, global_step=8306.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  50%|█████     | 610/1208 [17:54<17:33,  1.76s/it, loss=0.164, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000476, train/loss_step=0.140, global_step=8306.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  50%|█████     | 610/1208 [17:54<17:33,  1.76s/it, loss=0.17, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.0011, train/loss_step=0.259, global_step=8306.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  51%|█████     | 611/1208 [17:55<17:30,  1.76s/it, loss=0.17, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.0011, train/loss_step=0.259, global_step=8306.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  51%|█████     | 611/1208 [17:55<17:30,  1.76s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0341, train/loss_vlb_step=0.000128, train/loss_step=0.0341, global_step=8306.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  51%|█████     | 612/1208 [17:58<17:30,  1.76s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0341, train/loss_vlb_step=0.000128, train/loss_step=0.0341, global_step=8306.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  51%|█████     | 612/1208 [17:58<17:30,  1.76s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0466, train/loss_vlb_step=0.000162, train/loss_step=0.0466, global_step=8306.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  51%|█████     | 613/1208 [17:59<17:28,  1.76s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0466, train/loss_vlb_step=0.000162, train/loss_step=0.0466, global_step=8306.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  51%|█████     | 613/1208 [17:59<17:28,  1.76s/it, loss=0.17, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000384, train/loss_step=0.117, global_step=8307.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  51%|█████     | 614/1208 [18:01<17:25,  1.76s/it, loss=0.17, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000384, train/loss_step=0.117, global_step=8307.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  51%|█████     | 614/1208 [18:01<17:25,  1.76s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00594, train/loss_vlb_step=3.07e-5, train/loss_step=0.00594, global_step=8307.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  51%|█████     | 615/1208 [18:02<17:23,  1.76s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00594, train/loss_vlb_step=3.07e-5, train/loss_step=0.00594, global_step=8307.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  51%|█████     | 615/1208 [18:02<17:23,  1.76s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00544, train/loss_vlb_step=2.85e-5, train/loss_step=0.00544, global_step=8307.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  51%|█████     | 616/1208 [18:05<17:23,  1.76s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00544, train/loss_vlb_step=2.85e-5, train/loss_step=0.00544, global_step=8307.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  51%|█████     | 616/1208 [18:05<17:23,  1.76s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0523, train/loss_vlb_step=0.000182, train/loss_step=0.0523, global_step=8307.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  51%|█████     | 617/1208 [18:06<17:20,  1.76s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0523, train/loss_vlb_step=0.000182, train/loss_step=0.0523, global_step=8307.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  51%|█████     | 617/1208 [18:06<17:20,  1.76s/it, loss=0.143, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=8308.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  51%|█████     | 618/1208 [18:07<17:18,  1.76s/it, loss=0.143, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000344, train/loss_step=0.105, global_step=8308.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  51%|█████     | 618/1208 [18:07<17:18,  1.76s/it, loss=0.154, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.0039, train/loss_step=0.386, global_step=8308.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  51%|█████     | 619/1208 [18:08<17:15,  1.76s/it, loss=0.154, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.0039, train/loss_step=0.386, global_step=8308.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  51%|█████     | 619/1208 [18:08<17:15,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0981, train/loss_vlb_step=0.000323, train/loss_step=0.0981, global_step=8308.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  51%|█████▏    | 620/1208 [18:11<17:15,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0981, train/loss_vlb_step=0.000323, train/loss_step=0.0981, global_step=8308.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  51%|█████▏    | 620/1208 [18:11<17:15,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.2e-5, train/loss_step=0.0207, global_step=8308.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  51%|█████▏    | 621/1208 [18:12<17:13,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.2e-5, train/loss_step=0.0207, global_step=8308.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  51%|█████▏    | 621/1208 [18:12<17:13,  1.76s/it, loss=0.184, v_num=0, train/loss_simple_step=0.758, train/loss_vlb_step=0.0223, train/loss_step=0.758, global_step=8309.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  51%|█████▏    | 622/1208 [18:13<17:10,  1.76s/it, loss=0.184, v_num=0, train/loss_simple_step=0.758, train/loss_vlb_step=0.0223, train/loss_step=0.758, global_step=8309.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  51%|█████▏    | 622/1208 [18:13<17:10,  1.76s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000125, train/loss_step=0.0327, global_step=8309.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  52%|█████▏    | 623/1208 [18:15<17:08,  1.76s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000125, train/loss_step=0.0327, global_step=8309.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  52%|█████▏    | 623/1208 [18:15<17:08,  1.76s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00138, train/loss_vlb_step=8.3e-6, train/loss_step=0.00138, global_step=8309.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  52%|█████▏    | 624/1208 [18:18<17:07,  1.76s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00138, train/loss_vlb_step=8.3e-6, train/loss_step=0.00138, global_step=8309.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  52%|█████▏    | 624/1208 [18:18<17:07,  1.76s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=9.17e-5, train/loss_step=0.0222, global_step=8309.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  52%|█████▏    | 625/1208 [18:19<17:05,  1.76s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=9.17e-5, train/loss_step=0.0222, global_step=8309.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  52%|█████▏    | 625/1208 [18:19<17:05,  1.76s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.68e-5, train/loss_step=0.00296, global_step=8310.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  52%|█████▏    | 626/1208 [18:20<17:03,  1.76s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.68e-5, train/loss_step=0.00296, global_step=8310.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  52%|█████▏    | 626/1208 [18:20<17:03,  1.76s/it, loss=0.142, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.00074, train/loss_step=0.206, global_step=8310.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  52%|█████▏    | 627/1208 [18:21<17:00,  1.76s/it, loss=0.142, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.00074, train/loss_step=0.206, global_step=8310.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  52%|█████▏    | 627/1208 [18:21<17:00,  1.76s/it, loss=0.147, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00107, train/loss_step=0.273, global_step=8310.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  52%|█████▏    | 628/1208 [18:24<17:00,  1.76s/it, loss=0.147, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00107, train/loss_step=0.273, global_step=8310.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  52%|█████▏    | 628/1208 [18:24<17:00,  1.76s/it, loss=0.141, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00101, train/loss_step=0.249, global_step=8310.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  52%|█████▏    | 629/1208 [18:25<16:58,  1.76s/it, loss=0.141, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00101, train/loss_step=0.249, global_step=8310.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  52%|█████▏    | 629/1208 [18:25<16:58,  1.76s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00546, train/loss_vlb_step=2.78e-5, train/loss_step=0.00546, global_step=8311.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  52%|█████▏    | 630/1208 [18:27<16:55,  1.76s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00546, train/loss_vlb_step=2.78e-5, train/loss_step=0.00546, global_step=8311.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  52%|█████▏    | 630/1208 [18:27<16:55,  1.76s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0717, train/loss_vlb_step=0.000241, train/loss_step=0.0717, global_step=8311.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  52%|█████▏    | 631/1208 [18:28<16:53,  1.76s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0717, train/loss_vlb_step=0.000241, train/loss_step=0.0717, global_step=8311.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  52%|█████▏    | 631/1208 [18:28<16:53,  1.76s/it, loss=0.128, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=8311.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  52%|█████▏    | 632/1208 [18:31<16:52,  1.76s/it, loss=0.128, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000345, train/loss_step=0.105, global_step=8311.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  52%|█████▏    | 632/1208 [18:31<16:52,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1.28e-5, train/loss_step=0.00226, global_step=8311.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  52%|█████▏    | 633/1208 [18:32<16:50,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1.28e-5, train/loss_step=0.00226, global_step=8311.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  52%|█████▏    | 633/1208 [18:32<16:50,  1.76s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00531, train/loss_vlb_step=2.85e-5, train/loss_step=0.00531, global_step=8312.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  52%|█████▏    | 634/1208 [18:33<16:48,  1.76s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00531, train/loss_vlb_step=2.85e-5, train/loss_step=0.00531, global_step=8312.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  52%|█████▏    | 634/1208 [18:33<16:48,  1.76s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00607, train/loss_vlb_step=2.99e-5, train/loss_step=0.00607, global_step=8312.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  53%|█████▎    | 635/1208 [18:34<16:45,  1.76s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00607, train/loss_vlb_step=2.99e-5, train/loss_step=0.00607, global_step=8312.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  53%|█████▎    | 635/1208 [18:34<16:45,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=8312.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  53%|█████▎    | 636/1208 [18:37<16:45,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000369, train/loss_step=0.112, global_step=8312.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  53%|█████▎    | 636/1208 [18:37<16:45,  1.76s/it, loss=0.143, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.003, train/loss_step=0.403, global_step=8312.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  53%|█████▎    | 637/1208 [18:38<16:42,  1.76s/it, loss=0.143, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.003, train/loss_step=0.403, global_step=8312.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  53%|█████▎    | 637/1208 [18:38<16:42,  1.76s/it, loss=0.158, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00235, train/loss_step=0.392, global_step=8313.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  53%|█████▎    | 638/1208 [18:39<16:40,  1.76s/it, loss=0.158, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00235, train/loss_step=0.392, global_step=8313.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  53%|█████▎    | 638/1208 [18:39<16:40,  1.76s/it, loss=0.144, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000384, train/loss_step=0.117, global_step=8313.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  53%|█████▎    | 639/1208 [18:40<16:38,  1.75s/it, loss=0.144, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000384, train/loss_step=0.117, global_step=8313.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  53%|█████▎    | 639/1208 [18:40<16:38,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.69e-5, train/loss_step=0.0199, global_step=8313.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  53%|█████▎    | 640/1208 [18:44<16:37,  1.76s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.69e-5, train/loss_step=0.0199, global_step=8313.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  53%|█████▎    | 640/1208 [18:44<16:37,  1.76s/it, loss=0.154, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00128, train/loss_step=0.285, global_step=8313.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  53%|█████▎    | 641/1208 [18:45<16:35,  1.76s/it, loss=0.154, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00128, train/loss_step=0.285, global_step=8313.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  53%|█████▎    | 641/1208 [18:45<16:35,  1.76s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0825, train/loss_vlb_step=0.000272, train/loss_step=0.0825, global_step=8314.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  53%|█████▎    | 642/1208 [18:46<16:33,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0825, train/loss_vlb_step=0.000272, train/loss_step=0.0825, global_step=8314.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  53%|█████▎    | 642/1208 [18:46<16:33,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00119, train/loss_step=0.259, global_step=8314.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  53%|█████▎    | 643/1208 [18:47<16:30,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00119, train/loss_step=0.259, global_step=8314.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  53%|█████▎    | 643/1208 [18:47<16:30,  1.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00292, train/loss_step=0.397, global_step=8314.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  53%|█████▎    | 644/1208 [18:50<16:30,  1.76s/it, loss=0.151, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00292, train/loss_step=0.397, global_step=8314.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  53%|█████▎    | 644/1208 [18:50<16:30,  1.76s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0477, train/loss_vlb_step=0.000169, train/loss_step=0.0477, global_step=8314.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  53%|█████▎    | 645/1208 [18:51<16:27,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0477, train/loss_vlb_step=0.000169, train/loss_step=0.0477, global_step=8314.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  53%|█████▎    | 645/1208 [18:51<16:27,  1.75s/it, loss=0.159, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000466, train/loss_step=0.140, global_step=8315.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  53%|█████▎    | 646/1208 [18:52<16:25,  1.75s/it, loss=0.159, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000466, train/loss_step=0.140, global_step=8315.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  53%|█████▎    | 646/1208 [18:52<16:25,  1.75s/it, loss=0.167, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00192, train/loss_step=0.366, global_step=8315.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  54%|█████▎    | 647/1208 [18:54<16:23,  1.75s/it, loss=0.167, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00192, train/loss_step=0.366, global_step=8315.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  54%|█████▎    | 647/1208 [18:54<16:23,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0056, train/loss_vlb_step=2.82e-5, train/loss_step=0.0056, global_step=8315.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  54%|█████▎    | 648/1208 [18:57<16:22,  1.76s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0056, train/loss_vlb_step=2.82e-5, train/loss_step=0.0056, global_step=8315.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  54%|█████▎    | 648/1208 [18:57<16:22,  1.76s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.52e-5, train/loss_step=0.00274, global_step=8315.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  54%|█████▎    | 649/1208 [18:58<16:20,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.52e-5, train/loss_step=0.00274, global_step=8315.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  54%|█████▎    | 649/1208 [18:58<16:20,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00237, train/loss_vlb_step=1.36e-5, train/loss_step=0.00237, global_step=8316.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  54%|█████▍    | 650/1208 [18:59<16:18,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00237, train/loss_vlb_step=1.36e-5, train/loss_step=0.00237, global_step=8316.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  54%|█████▍    | 650/1208 [18:59<16:18,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000145, train/loss_step=0.0376, global_step=8316.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  54%|█████▍    | 651/1208 [19:00<16:15,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000145, train/loss_step=0.0376, global_step=8316.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  54%|█████▍    | 651/1208 [19:00<16:15,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0723, train/loss_vlb_step=0.000242, train/loss_step=0.0723, global_step=8316.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  54%|█████▍    | 652/1208 [19:03<16:15,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0723, train/loss_vlb_step=0.000242, train/loss_step=0.0723, global_step=8316.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  54%|█████▍    | 652/1208 [19:03<16:15,  1.75s/it, loss=0.147, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000697, train/loss_step=0.189, global_step=8316.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  54%|█████▍    | 653/1208 [19:04<16:13,  1.75s/it, loss=0.147, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000697, train/loss_step=0.189, global_step=8316.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  54%|█████▍    | 653/1208 [19:04<16:13,  1.75s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.4e-5, train/loss_step=0.0124, global_step=8317.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  54%|█████▍    | 654/1208 [19:05<16:10,  1.75s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.4e-5, train/loss_step=0.0124, global_step=8317.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  54%|█████▍    | 654/1208 [19:05<16:10,  1.75s/it, loss=0.153, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=8317.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  54%|█████▍    | 655/1208 [19:07<16:08,  1.75s/it, loss=0.153, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000387, train/loss_step=0.118, global_step=8317.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  54%|█████▍    | 655/1208 [19:07<16:08,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000443, train/loss_step=0.130, global_step=8317.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  54%|█████▍    | 656/1208 [19:10<16:07,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000443, train/loss_step=0.130, global_step=8317.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  54%|█████▍    | 656/1208 [19:10<16:07,  1.75s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00498, train/loss_vlb_step=2.67e-5, train/loss_step=0.00498, global_step=8317.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  54%|█████▍    | 657/1208 [19:11<16:05,  1.75s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00498, train/loss_vlb_step=2.67e-5, train/loss_step=0.00498, global_step=8317.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  54%|█████▍    | 657/1208 [19:11<16:05,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00101, train/loss_step=0.258, global_step=8318.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  54%|█████▍    | 658/1208 [19:12<16:03,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00101, train/loss_step=0.258, global_step=8318.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  54%|█████▍    | 658/1208 [19:12<16:03,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0035, train/loss_vlb_step=1.92e-5, train/loss_step=0.0035, global_step=8318.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  55%|█████▍    | 659/1208 [19:13<16:01,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0035, train/loss_vlb_step=1.92e-5, train/loss_step=0.0035, global_step=8318.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  55%|█████▍    | 659/1208 [19:13<16:01,  1.75s/it, loss=0.134, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00138, train/loss_step=0.263, global_step=8318.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  55%|█████▍    | 660/1208 [19:16<16:00,  1.75s/it, loss=0.134, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00138, train/loss_step=0.263, global_step=8318.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  55%|█████▍    | 660/1208 [19:16<16:00,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000115, train/loss_step=0.0302, global_step=8318.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  55%|█████▍    | 661/1208 [19:17<15:58,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.000115, train/loss_step=0.0302, global_step=8318.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  55%|█████▍    | 661/1208 [19:17<15:58,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=9.01e-5, train/loss_step=0.0225, global_step=8319.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  55%|█████▍    | 662/1208 [19:19<15:55,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=9.01e-5, train/loss_step=0.0225, global_step=8319.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  55%|█████▍    | 662/1208 [19:19<15:55,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000543, train/loss_step=0.157, global_step=8319.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  55%|█████▍    | 663/1208 [19:20<15:53,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000543, train/loss_step=0.157, global_step=8319.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  55%|█████▍    | 663/1208 [19:20<15:53,  1.75s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.0829, train/loss_vlb_step=0.000275, train/loss_step=0.0829, global_step=8319.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  55%|█████▍    | 664/1208 [19:23<15:52,  1.75s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.0829, train/loss_vlb_step=0.000275, train/loss_step=0.0829, global_step=8319.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  55%|█████▍    | 664/1208 [19:23<15:52,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.506, train/loss_vlb_step=0.00465, train/loss_step=0.506, global_step=8319.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]     Epoch 27:  55%|█████▌    | 665/1208 [19:24<15:50,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.506, train/loss_vlb_step=0.00465, train/loss_step=0.506, global_step=8319.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  55%|█████▌    | 665/1208 [19:24<15:50,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0909, train/loss_vlb_step=0.000304, train/loss_step=0.0909, global_step=8320.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  55%|█████▌    | 666/1208 [19:25<15:48,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0909, train/loss_vlb_step=0.000304, train/loss_step=0.0909, global_step=8320.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  55%|█████▌    | 666/1208 [19:25<15:48,  1.75s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.2e-5, train/loss_step=0.0169, global_step=8320.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  55%|█████▌    | 667/1208 [19:26<15:46,  1.75s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.2e-5, train/loss_step=0.0169, global_step=8320.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  55%|█████▌    | 667/1208 [19:26<15:46,  1.75s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.02e-5, train/loss_step=0.00173, global_step=8320.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  55%|█████▌    | 668/1208 [19:29<15:45,  1.75s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.02e-5, train/loss_step=0.00173, global_step=8320.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  55%|█████▌    | 668/1208 [19:29<15:45,  1.75s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000137, train/loss_step=0.0364, global_step=8320.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  55%|█████▌    | 669/1208 [19:30<15:43,  1.75s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000137, train/loss_step=0.0364, global_step=8320.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  55%|█████▌    | 669/1208 [19:30<15:43,  1.75s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000137, train/loss_step=0.0372, global_step=8321.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  55%|█████▌    | 670/1208 [19:31<15:40,  1.75s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000137, train/loss_step=0.0372, global_step=8321.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  55%|█████▌    | 670/1208 [19:31<15:40,  1.75s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00327, train/loss_vlb_step=1.84e-5, train/loss_step=0.00327, global_step=8321.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  56%|█████▌    | 671/1208 [19:32<15:38,  1.75s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00327, train/loss_vlb_step=1.84e-5, train/loss_step=0.00327, global_step=8321.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  56%|█████▌    | 671/1208 [19:32<15:38,  1.75s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.00473, train/loss_vlb_step=2.5e-5, train/loss_step=0.00473, global_step=8321.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  56%|█████▌    | 672/1208 [19:36<15:38,  1.75s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.00473, train/loss_vlb_step=2.5e-5, train/loss_step=0.00473, global_step=8321.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  56%|█████▌    | 672/1208 [19:36<15:38,  1.75s/it, loss=0.0898, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.68e-5, train/loss_step=0.0154, global_step=8321.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  56%|█████▌    | 673/1208 [19:37<15:35,  1.75s/it, loss=0.0898, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.68e-5, train/loss_step=0.0154, global_step=8321.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  56%|█████▌    | 673/1208 [19:37<15:35,  1.75s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000126, train/loss_step=0.0328, global_step=8322.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  56%|█████▌    | 674/1208 [19:38<15:33,  1.75s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000126, train/loss_step=0.0328, global_step=8322.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  56%|█████▌    | 674/1208 [19:38<15:33,  1.75s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=3.1e-5, train/loss_step=0.00611, global_step=8322.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  56%|█████▌    | 675/1208 [19:39<15:31,  1.75s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=3.1e-5, train/loss_step=0.00611, global_step=8322.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  56%|█████▌    | 675/1208 [19:39<15:31,  1.75s/it, loss=0.0789, v_num=0, train/loss_simple_step=0.00346, train/loss_vlb_step=1.87e-5, train/loss_step=0.00346, global_step=8322.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  56%|█████▌    | 676/1208 [19:42<15:30,  1.75s/it, loss=0.0789, v_num=0, train/loss_simple_step=0.00346, train/loss_vlb_step=1.87e-5, train/loss_step=0.00346, global_step=8322.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  56%|█████▌    | 676/1208 [19:42<15:30,  1.75s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00121, train/loss_step=0.269, global_step=8322.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  56%|█████▌    | 677/1208 [19:43<15:28,  1.75s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00121, train/loss_step=0.269, global_step=8322.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  56%|█████▌    | 677/1208 [19:43<15:28,  1.75s/it, loss=0.0839, v_num=0, train/loss_simple_step=0.0934, train/loss_vlb_step=0.000307, train/loss_step=0.0934, global_step=8323.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  56%|█████▌    | 678/1208 [19:44<15:26,  1.75s/it, loss=0.0839, v_num=0, train/loss_simple_step=0.0934, train/loss_vlb_step=0.000307, train/loss_step=0.0934, global_step=8323.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  56%|█████▌    | 678/1208 [19:44<15:26,  1.75s/it, loss=0.0838, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=9.78e-6, train/loss_step=0.00161, global_step=8323.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  56%|█████▌    | 679/1208 [19:45<15:23,  1.75s/it, loss=0.0838, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=9.78e-6, train/loss_step=0.00161, global_step=8323.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  56%|█████▌    | 679/1208 [19:45<15:23,  1.75s/it, loss=0.0716, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.91e-5, train/loss_step=0.019, global_step=8323.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  56%|█████▋    | 680/1208 [19:48<15:23,  1.75s/it, loss=0.0716, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=7.91e-5, train/loss_step=0.019, global_step=8323.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  56%|█████▋    | 680/1208 [19:48<15:23,  1.75s/it, loss=0.0705, v_num=0, train/loss_simple_step=0.00896, train/loss_vlb_step=4.41e-5, train/loss_step=0.00896, global_step=8323.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  56%|█████▋    | 681/1208 [19:49<15:20,  1.75s/it, loss=0.0705, v_num=0, train/loss_simple_step=0.00896, train/loss_vlb_step=4.41e-5, train/loss_step=0.00896, global_step=8323.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  56%|█████▋    | 681/1208 [19:49<15:20,  1.75s/it, loss=0.0697, v_num=0, train/loss_simple_step=0.00648, train/loss_vlb_step=3.19e-5, train/loss_step=0.00648, global_step=8324.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  56%|█████▋    | 682/1208 [19:50<15:18,  1.75s/it, loss=0.0697, v_num=0, train/loss_simple_step=0.00648, train/loss_vlb_step=3.19e-5, train/loss_step=0.00648, global_step=8324.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  56%|█████▋    | 682/1208 [19:50<15:18,  1.75s/it, loss=0.0939, v_num=0, train/loss_simple_step=0.641, train/loss_vlb_step=0.0125, train/loss_step=0.641, global_step=8324.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]     Epoch 27:  57%|█████▋    | 683/1208 [19:52<15:16,  1.75s/it, loss=0.0939, v_num=0, train/loss_simple_step=0.641, train/loss_vlb_step=0.0125, train/loss_step=0.641, global_step=8324.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  57%|█████▋    | 683/1208 [19:52<15:16,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.449, train/loss_vlb_step=0.00474, train/loss_step=0.449, global_step=8324.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  57%|█████▋    | 684/1208 [19:55<15:15,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.449, train/loss_vlb_step=0.00474, train/loss_step=0.449, global_step=8324.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  57%|█████▋    | 684/1208 [19:55<15:15,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.650, train/loss_vlb_step=0.0202, train/loss_step=0.650, global_step=8324.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  57%|█████▋    | 685/1208 [19:56<15:13,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.650, train/loss_vlb_step=0.0202, train/loss_step=0.650, global_step=8324.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  57%|█████▋    | 685/1208 [19:56<15:13,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=1.11e-5, train/loss_step=0.00187, global_step=8325.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  57%|█████▋    | 686/1208 [19:57<15:11,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=1.11e-5, train/loss_step=0.00187, global_step=8325.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  57%|█████▋    | 686/1208 [19:57<15:11,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0324, train/loss_vlb_step=0.000125, train/loss_step=0.0324, global_step=8325.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  57%|█████▋    | 687/1208 [19:58<15:08,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0324, train/loss_vlb_step=0.000125, train/loss_step=0.0324, global_step=8325.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  57%|█████▋    | 687/1208 [19:58<15:08,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.41e-5, train/loss_step=0.0206, global_step=8325.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  57%|█████▋    | 688/1208 [20:01<15:08,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.41e-5, train/loss_step=0.0206, global_step=8325.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  57%|█████▋    | 688/1208 [20:01<15:08,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.076, train/loss_vlb_step=0.000258, train/loss_step=0.076, global_step=8325.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  57%|█████▋    | 689/1208 [20:02<15:06,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.076, train/loss_vlb_step=0.000258, train/loss_step=0.076, global_step=8325.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  57%|█████▋    | 689/1208 [20:02<15:06,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000506, train/loss_step=0.150, global_step=8326.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  57%|█████▋    | 690/1208 [20:03<15:03,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000506, train/loss_step=0.150, global_step=8326.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  57%|█████▋    | 690/1208 [20:03<15:03,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=8326.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  57%|█████▋    | 691/1208 [20:04<15:01,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=8326.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  57%|█████▋    | 691/1208 [20:04<15:01,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.465, train/loss_vlb_step=0.00571, train/loss_step=0.465, global_step=8326.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  57%|█████▋    | 692/1208 [20:08<15:00,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.465, train/loss_vlb_step=0.00571, train/loss_step=0.465, global_step=8326.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  57%|█████▋    | 692/1208 [20:08<15:00,  1.75s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.83e-5, train/loss_step=0.00313, global_step=8326.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  57%|█████▋    | 693/1208 [20:09<14:58,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.83e-5, train/loss_step=0.00313, global_step=8326.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  57%|█████▋    | 693/1208 [20:09<14:58,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0048, train/loss_vlb_step=2.57e-5, train/loss_step=0.0048, global_step=8327.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  57%|█████▋    | 694/1208 [20:10<14:56,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0048, train/loss_vlb_step=2.57e-5, train/loss_step=0.0048, global_step=8327.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  57%|█████▋    | 694/1208 [20:10<14:56,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=1.95e-5, train/loss_step=0.00365, global_step=8327.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  58%|█████▊    | 695/1208 [20:11<14:54,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=1.95e-5, train/loss_step=0.00365, global_step=8327.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  58%|█████▊    | 695/1208 [20:11<14:54,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.87e-5, train/loss_step=0.0133, global_step=8327.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  58%|█████▊    | 696/1208 [20:14<14:53,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.87e-5, train/loss_step=0.0133, global_step=8327.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  58%|█████▊    | 696/1208 [20:14<14:53,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000336, train/loss_step=0.101, global_step=8327.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  58%|█████▊    | 697/1208 [20:15<14:51,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000336, train/loss_step=0.101, global_step=8327.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  58%|█████▊    | 697/1208 [20:15<14:51,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00456, train/loss_vlb_step=2.45e-5, train/loss_step=0.00456, global_step=8328.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  58%|█████▊    | 698/1208 [20:16<14:48,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00456, train/loss_vlb_step=2.45e-5, train/loss_step=0.00456, global_step=8328.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  58%|█████▊    | 698/1208 [20:16<14:48,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000644, train/loss_step=0.183, global_step=8328.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  58%|█████▊    | 699/1208 [20:17<14:46,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.183, train/loss_vlb_step=0.000644, train/loss_step=0.183, global_step=8328.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  58%|█████▊    | 699/1208 [20:17<14:46,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000528, train/loss_step=0.153, global_step=8328.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  58%|█████▊    | 700/1208 [20:20<14:46,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000528, train/loss_step=0.153, global_step=8328.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  58%|█████▊    | 700/1208 [20:20<14:46,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.17e-5, train/loss_step=0.00195, global_step=8328.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  58%|█████▊    | 701/1208 [20:22<14:43,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.17e-5, train/loss_step=0.00195, global_step=8328.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  58%|█████▊    | 701/1208 [20:22<14:43,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.06e-5, train/loss_step=0.00178, global_step=8329.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  58%|█████▊    | 702/1208 [20:23<14:41,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.06e-5, train/loss_step=0.00178, global_step=8329.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  58%|█████▊    | 702/1208 [20:23<14:41,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0779, train/loss_vlb_step=0.000258, train/loss_step=0.0779, global_step=8329.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  58%|█████▊    | 703/1208 [20:24<14:39,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0779, train/loss_vlb_step=0.000258, train/loss_step=0.0779, global_step=8329.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  58%|█████▊    | 703/1208 [20:24<14:39,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00227, train/loss_step=0.351, global_step=8329.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  58%|█████▊    | 704/1208 [20:27<14:38,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00227, train/loss_step=0.351, global_step=8329.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  58%|█████▊    | 704/1208 [20:27<14:38,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.539, train/loss_vlb_step=0.0053, train/loss_step=0.539, global_step=8329.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  58%|█████▊    | 705/1208 [20:28<14:36,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.539, train/loss_vlb_step=0.0053, train/loss_step=0.539, global_step=8329.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  58%|█████▊    | 705/1208 [20:28<14:36,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.064, train/loss_vlb_step=0.00022, train/loss_step=0.064, global_step=8330.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  58%|█████▊    | 706/1208 [20:29<14:34,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.064, train/loss_vlb_step=0.00022, train/loss_step=0.064, global_step=8330.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  58%|█████▊    | 706/1208 [20:29<14:34,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.49e-5, train/loss_step=0.0125, global_step=8330.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  59%|█████▊    | 707/1208 [20:30<14:31,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.49e-5, train/loss_step=0.0125, global_step=8330.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  59%|█████▊    | 707/1208 [20:30<14:31,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.0001, train/loss_step=0.0265, global_step=8330.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  59%|█████▊    | 708/1208 [20:33<14:31,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.0001, train/loss_step=0.0265, global_step=8330.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  59%|█████▊    | 708/1208 [20:33<14:31,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=2.01e-5, train/loss_step=0.00359, global_step=8330.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  59%|█████▊    | 709/1208 [20:34<14:29,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=2.01e-5, train/loss_step=0.00359, global_step=8330.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  59%|█████▊    | 709/1208 [20:34<14:29,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00529, train/loss_vlb_step=2.63e-5, train/loss_step=0.00529, global_step=8331.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  59%|█████▉    | 710/1208 [20:35<14:26,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00529, train/loss_vlb_step=2.63e-5, train/loss_step=0.00529, global_step=8331.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  59%|█████▉    | 710/1208 [20:35<14:26,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.92e-5, train/loss_step=0.0159, global_step=8331.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  59%|█████▉    | 711/1208 [20:36<14:24,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.92e-5, train/loss_step=0.0159, global_step=8331.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  59%|█████▉    | 711/1208 [20:36<14:24,  1.74s/it, loss=0.0816, v_num=0, train/loss_simple_step=0.066, train/loss_vlb_step=0.000219, train/loss_step=0.066, global_step=8331.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  59%|█████▉    | 712/1208 [20:40<14:23,  1.74s/it, loss=0.0816, v_num=0, train/loss_simple_step=0.066, train/loss_vlb_step=0.000219, train/loss_step=0.066, global_step=8331.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  59%|█████▉    | 712/1208 [20:40<14:23,  1.74s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000787, train/loss_step=0.196, global_step=8331.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  59%|█████▉    | 713/1208 [20:41<14:21,  1.74s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000787, train/loss_step=0.196, global_step=8331.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  59%|█████▉    | 713/1208 [20:41<14:21,  1.74s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.0512, train/loss_vlb_step=0.00018, train/loss_step=0.0512, global_step=8332.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  59%|█████▉    | 714/1208 [20:42<14:19,  1.74s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.0512, train/loss_vlb_step=0.00018, train/loss_step=0.0512, global_step=8332.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  59%|█████▉    | 714/1208 [20:42<14:19,  1.74s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.0671, train/loss_vlb_step=0.000225, train/loss_step=0.0671, global_step=8332.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  59%|█████▉    | 715/1208 [20:43<14:17,  1.74s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.0671, train/loss_vlb_step=0.000225, train/loss_step=0.0671, global_step=8332.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  59%|█████▉    | 715/1208 [20:43<14:17,  1.74s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000127, train/loss_step=0.0342, global_step=8332.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  59%|█████▉    | 716/1208 [20:46<14:16,  1.74s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000127, train/loss_step=0.0342, global_step=8332.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  59%|█████▉    | 716/1208 [20:46<14:16,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.0013, train/loss_step=0.270, global_step=8332.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]     Epoch 27:  59%|█████▉    | 717/1208 [20:47<14:14,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.0013, train/loss_step=0.270, global_step=8332.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  59%|█████▉    | 717/1208 [20:47<14:14,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.001, train/loss_step=0.254, global_step=8333.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  59%|█████▉    | 718/1208 [20:48<14:12,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.001, train/loss_step=0.254, global_step=8333.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  59%|█████▉    | 718/1208 [20:48<14:12,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00179, train/loss_step=0.328, global_step=8333.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  60%|█████▉    | 719/1208 [20:49<14:09,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00179, train/loss_step=0.328, global_step=8333.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  60%|█████▉    | 719/1208 [20:49<14:09,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.0019, train/loss_step=0.354, global_step=8333.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  60%|█████▉    | 720/1208 [20:52<14:09,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.0019, train/loss_step=0.354, global_step=8333.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  60%|█████▉    | 720/1208 [20:52<14:09,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=8.07e-5, train/loss_step=0.0193, global_step=8333.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  60%|█████▉    | 721/1208 [20:54<14:07,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=8.07e-5, train/loss_step=0.0193, global_step=8333.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  60%|█████▉    | 721/1208 [20:54<14:07,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=9.91e-5, train/loss_step=0.0252, global_step=8334.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  60%|█████▉    | 722/1208 [20:55<14:04,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=9.91e-5, train/loss_step=0.0252, global_step=8334.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  60%|█████▉    | 722/1208 [20:55<14:04,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000549, train/loss_step=0.159, global_step=8334.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  60%|█████▉    | 723/1208 [20:56<14:02,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000549, train/loss_step=0.159, global_step=8334.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  60%|█████▉    | 723/1208 [20:56<14:02,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000837, train/loss_step=0.216, global_step=8334.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  60%|█████▉    | 724/1208 [20:59<14:01,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000837, train/loss_step=0.216, global_step=8334.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  60%|█████▉    | 724/1208 [20:59<14:01,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.26e-5, train/loss_step=0.0112, global_step=8334.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  60%|██████    | 725/1208 [21:00<13:59,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.26e-5, train/loss_step=0.0112, global_step=8334.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  60%|██████    | 725/1208 [21:00<13:59,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000394, train/loss_step=0.119, global_step=8335.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  60%|██████    | 726/1208 [21:01<13:57,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000394, train/loss_step=0.119, global_step=8335.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  60%|██████    | 726/1208 [21:01<13:57,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00504, train/loss_vlb_step=2.59e-5, train/loss_step=0.00504, global_step=8335.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  60%|██████    | 727/1208 [21:02<13:55,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00504, train/loss_vlb_step=2.59e-5, train/loss_step=0.00504, global_step=8335.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  60%|██████    | 727/1208 [21:02<13:55,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0711, train/loss_vlb_step=0.000243, train/loss_step=0.0711, global_step=8335.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  60%|██████    | 728/1208 [21:05<13:54,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0711, train/loss_vlb_step=0.000243, train/loss_step=0.0711, global_step=8335.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  60%|██████    | 728/1208 [21:05<13:54,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.17e-5, train/loss_step=0.0167, global_step=8335.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  60%|██████    | 729/1208 [21:06<13:52,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.17e-5, train/loss_step=0.0167, global_step=8335.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  60%|██████    | 729/1208 [21:06<13:52,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.67e-5, train/loss_step=0.0105, global_step=8336.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  60%|██████    | 730/1208 [21:08<13:50,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.67e-5, train/loss_step=0.0105, global_step=8336.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  60%|██████    | 730/1208 [21:08<13:50,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0466, train/loss_vlb_step=0.000169, train/loss_step=0.0466, global_step=8336.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  61%|██████    | 731/1208 [21:09<13:48,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0466, train/loss_vlb_step=0.000169, train/loss_step=0.0466, global_step=8336.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  61%|██████    | 731/1208 [21:09<13:48,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000442, train/loss_step=0.135, global_step=8336.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  61%|██████    | 732/1208 [21:12<13:47,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000442, train/loss_step=0.135, global_step=8336.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  61%|██████    | 732/1208 [21:12<13:47,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000644, train/loss_step=0.180, global_step=8336.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  61%|██████    | 733/1208 [21:13<13:45,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000644, train/loss_step=0.180, global_step=8336.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  61%|██████    | 733/1208 [21:13<13:45,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=2.12e-5, train/loss_step=0.00395, global_step=8337.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  61%|██████    | 734/1208 [21:14<13:43,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=2.12e-5, train/loss_step=0.00395, global_step=8337.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  61%|██████    | 734/1208 [21:14<13:43,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=8337.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  61%|██████    | 735/1208 [21:15<13:40,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000352, train/loss_step=0.107, global_step=8337.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  61%|██████    | 735/1208 [21:15<13:40,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0593, train/loss_vlb_step=0.000197, train/loss_step=0.0593, global_step=8337.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  61%|██████    | 736/1208 [21:18<13:40,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0593, train/loss_vlb_step=0.000197, train/loss_step=0.0593, global_step=8337.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  61%|██████    | 736/1208 [21:18<13:40,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000495, train/loss_step=0.149, global_step=8337.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  61%|██████    | 737/1208 [21:19<13:37,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000495, train/loss_step=0.149, global_step=8337.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  61%|██████    | 737/1208 [21:19<13:37,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000133, train/loss_step=0.0361, global_step=8338.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  61%|██████    | 738/1208 [21:21<13:35,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000133, train/loss_step=0.0361, global_step=8338.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  61%|██████    | 738/1208 [21:21<13:35,  1.74s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.8e-5, train/loss_step=0.00324, global_step=8338.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  61%|██████    | 739/1208 [21:22<13:33,  1.73s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.8e-5, train/loss_step=0.00324, global_step=8338.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  61%|██████    | 739/1208 [21:22<13:33,  1.73s/it, loss=0.0709, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000168, train/loss_step=0.0457, global_step=8338.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  61%|██████▏   | 740/1208 [21:25<13:32,  1.74s/it, loss=0.0709, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000168, train/loss_step=0.0457, global_step=8338.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  61%|██████▏   | 740/1208 [21:25<13:32,  1.74s/it, loss=0.0831, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00108, train/loss_step=0.262, global_step=8338.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  61%|██████▏   | 741/1208 [21:26<13:30,  1.74s/it, loss=0.0831, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00108, train/loss_step=0.262, global_step=8338.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  61%|██████▏   | 741/1208 [21:26<13:30,  1.74s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.00511, train/loss_vlb_step=2.69e-5, train/loss_step=0.00511, global_step=8339.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  61%|██████▏   | 742/1208 [21:27<13:28,  1.74s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.00511, train/loss_vlb_step=2.69e-5, train/loss_step=0.00511, global_step=8339.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  61%|██████▏   | 742/1208 [21:27<13:28,  1.74s/it, loss=0.076, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000139, train/loss_step=0.0378, global_step=8339.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  62%|██████▏   | 743/1208 [21:28<13:26,  1.73s/it, loss=0.076, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000139, train/loss_step=0.0378, global_step=8339.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  62%|██████▏   | 743/1208 [21:28<13:26,  1.73s/it, loss=0.0668, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000118, train/loss_step=0.0311, global_step=8339.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  62%|██████▏   | 744/1208 [21:31<13:25,  1.74s/it, loss=0.0668, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000118, train/loss_step=0.0311, global_step=8339.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  62%|██████▏   | 744/1208 [21:31<13:25,  1.74s/it, loss=0.0668, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.27e-5, train/loss_step=0.0116, global_step=8339.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  62%|██████▏   | 745/1208 [21:32<13:23,  1.74s/it, loss=0.0668, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.27e-5, train/loss_step=0.0116, global_step=8339.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  62%|██████▏   | 745/1208 [21:32<13:23,  1.74s/it, loss=0.0609, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.04e-5, train/loss_step=0.00182, global_step=8340.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  62%|██████▏   | 746/1208 [21:33<13:21,  1.73s/it, loss=0.0609, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.04e-5, train/loss_step=0.00182, global_step=8340.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  62%|██████▏   | 746/1208 [21:33<13:21,  1.73s/it, loss=0.0911, v_num=0, train/loss_simple_step=0.608, train/loss_vlb_step=0.0213, train/loss_step=0.608, global_step=8340.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]     Epoch 27:  62%|██████▏   | 747/1208 [21:35<13:19,  1.73s/it, loss=0.0911, v_num=0, train/loss_simple_step=0.608, train/loss_vlb_step=0.0213, train/loss_step=0.608, global_step=8340.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  62%|██████▏   | 747/1208 [21:35<13:19,  1.73s/it, loss=0.0887, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.18e-5, train/loss_step=0.0231, global_step=8340.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  62%|██████▏   | 748/1208 [21:38<13:18,  1.74s/it, loss=0.0887, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.18e-5, train/loss_step=0.0231, global_step=8340.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  62%|██████▏   | 748/1208 [21:38<13:18,  1.74s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000499, train/loss_step=0.150, global_step=8340.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  62%|██████▏   | 749/1208 [21:39<13:16,  1.73s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000499, train/loss_step=0.150, global_step=8340.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  62%|██████▏   | 749/1208 [21:39<13:16,  1.73s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.0831, train/loss_vlb_step=0.000274, train/loss_step=0.0831, global_step=8341.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  62%|██████▏   | 750/1208 [21:40<13:14,  1.73s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.0831, train/loss_vlb_step=0.000274, train/loss_step=0.0831, global_step=8341.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  62%|██████▏   | 750/1208 [21:40<13:14,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.088, train/loss_vlb_step=0.00029, train/loss_step=0.088, global_step=8341.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  62%|██████▏   | 751/1208 [21:41<13:12,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.088, train/loss_vlb_step=0.00029, train/loss_step=0.088, global_step=8341.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  62%|██████▏   | 751/1208 [21:41<13:12,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00143, train/loss_step=0.298, global_step=8341.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  62%|██████▏   | 752/1208 [21:44<13:11,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00143, train/loss_step=0.298, global_step=8341.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  62%|██████▏   | 752/1208 [21:44<13:11,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.466, train/loss_vlb_step=0.00439, train/loss_step=0.466, global_step=8341.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  62%|██████▏   | 753/1208 [21:45<13:09,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.466, train/loss_vlb_step=0.00439, train/loss_step=0.466, global_step=8341.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  62%|██████▏   | 753/1208 [21:45<13:09,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0722, train/loss_vlb_step=0.000242, train/loss_step=0.0722, global_step=8342.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  62%|██████▏   | 754/1208 [21:46<13:06,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0722, train/loss_vlb_step=0.000242, train/loss_step=0.0722, global_step=8342.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  62%|██████▏   | 754/1208 [21:46<13:06,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.001, train/loss_step=0.238, global_step=8342.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]     Epoch 27:  62%|██████▎   | 755/1208 [21:47<13:04,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.001, train/loss_step=0.238, global_step=8342.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  62%|██████▎   | 755/1208 [21:47<13:04,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000861, train/loss_step=0.239, global_step=8342.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  63%|██████▎   | 756/1208 [21:51<13:03,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000861, train/loss_step=0.239, global_step=8342.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  63%|██████▎   | 756/1208 [21:51<13:03,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=8342.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  63%|██████▎   | 757/1208 [21:52<13:01,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=8342.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  63%|██████▎   | 757/1208 [21:52<13:01,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000173, train/loss_step=0.0484, global_step=8343.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  63%|██████▎   | 758/1208 [21:53<12:59,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0484, train/loss_vlb_step=0.000173, train/loss_step=0.0484, global_step=8343.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  63%|██████▎   | 758/1208 [21:53<12:59,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.52e-5, train/loss_step=0.0174, global_step=8343.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  63%|██████▎   | 759/1208 [21:54<12:57,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.52e-5, train/loss_step=0.0174, global_step=8343.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  63%|██████▎   | 759/1208 [21:54<12:57,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0713, train/loss_vlb_step=0.000242, train/loss_step=0.0713, global_step=8343.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  63%|██████▎   | 760/1208 [21:57<12:56,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0713, train/loss_vlb_step=0.000242, train/loss_step=0.0713, global_step=8343.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  63%|██████▎   | 760/1208 [21:57<12:56,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.23e-5, train/loss_step=0.0113, global_step=8343.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  63%|██████▎   | 761/1208 [21:58<12:54,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.23e-5, train/loss_step=0.0113, global_step=8343.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  63%|██████▎   | 761/1208 [21:58<12:54,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00386, train/loss_vlb_step=2.1e-5, train/loss_step=0.00386, global_step=8344.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  63%|██████▎   | 762/1208 [21:59<12:52,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00386, train/loss_vlb_step=2.1e-5, train/loss_step=0.00386, global_step=8344.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  63%|██████▎   | 762/1208 [21:59<12:52,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00446, train/loss_vlb_step=2.38e-5, train/loss_step=0.00446, global_step=8344.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  63%|██████▎   | 763/1208 [22:00<12:50,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00446, train/loss_vlb_step=2.38e-5, train/loss_step=0.00446, global_step=8344.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  63%|██████▎   | 763/1208 [22:00<12:50,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.61e-5, train/loss_step=0.023, global_step=8344.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  63%|██████▎   | 764/1208 [22:03<12:49,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.61e-5, train/loss_step=0.023, global_step=8344.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  63%|██████▎   | 764/1208 [22:03<12:49,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0081, train/loss_vlb_step=3.93e-5, train/loss_step=0.0081, global_step=8344.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  63%|██████▎   | 765/1208 [22:04<12:47,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0081, train/loss_vlb_step=3.93e-5, train/loss_step=0.0081, global_step=8344.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  63%|██████▎   | 765/1208 [22:04<12:47,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.061, train/loss_vlb_step=0.000208, train/loss_step=0.061, global_step=8345.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  63%|██████▎   | 766/1208 [22:06<12:45,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.061, train/loss_vlb_step=0.000208, train/loss_step=0.061, global_step=8345.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  63%|██████▎   | 766/1208 [22:06<12:45,  1.73s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0691, train/loss_vlb_step=0.000232, train/loss_step=0.0691, global_step=8345.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  63%|██████▎   | 767/1208 [22:07<12:43,  1.73s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0691, train/loss_vlb_step=0.000232, train/loss_step=0.0691, global_step=8345.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  63%|██████▎   | 767/1208 [22:07<12:43,  1.73s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=8.85e-5, train/loss_step=0.0233, global_step=8345.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  64%|██████▎   | 768/1208 [22:10<12:42,  1.73s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=8.85e-5, train/loss_step=0.0233, global_step=8345.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  64%|██████▎   | 768/1208 [22:10<12:42,  1.73s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.00799, train/loss_vlb_step=3.92e-5, train/loss_step=0.00799, global_step=8345.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  64%|██████▎   | 769/1208 [22:11<12:40,  1.73s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.00799, train/loss_vlb_step=3.92e-5, train/loss_step=0.00799, global_step=8345.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  64%|██████▎   | 769/1208 [22:11<12:40,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00113, train/loss_step=0.268, global_step=8346.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]     Epoch 27:  64%|██████▎   | 770/1208 [22:12<12:37,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.268, train/loss_vlb_step=0.00113, train/loss_step=0.268, global_step=8346.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  64%|██████▎   | 770/1208 [22:12<12:37,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000612, train/loss_step=0.177, global_step=8346.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  64%|██████▍   | 771/1208 [22:13<12:35,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000612, train/loss_step=0.177, global_step=8346.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  64%|██████▍   | 771/1208 [22:13<12:35,  1.73s/it, loss=0.096, v_num=0, train/loss_simple_step=0.00701, train/loss_vlb_step=3.45e-5, train/loss_step=0.00701, global_step=8346.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  64%|██████▍   | 772/1208 [22:16<12:34,  1.73s/it, loss=0.096, v_num=0, train/loss_simple_step=0.00701, train/loss_vlb_step=3.45e-5, train/loss_step=0.00701, global_step=8346.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  64%|██████▍   | 772/1208 [22:16<12:34,  1.73s/it, loss=0.0808, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000537, train/loss_step=0.160, global_step=8346.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  64%|██████▍   | 773/1208 [22:17<12:32,  1.73s/it, loss=0.0808, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000537, train/loss_step=0.160, global_step=8346.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  64%|██████▍   | 773/1208 [22:17<12:32,  1.73s/it, loss=0.0791, v_num=0, train/loss_simple_step=0.0389, train/loss_vlb_step=0.000142, train/loss_step=0.0389, global_step=8347.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  64%|██████▍   | 774/1208 [22:18<12:30,  1.73s/it, loss=0.0791, v_num=0, train/loss_simple_step=0.0389, train/loss_vlb_step=0.000142, train/loss_step=0.0389, global_step=8347.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  64%|██████▍   | 774/1208 [22:18<12:30,  1.73s/it, loss=0.0718, v_num=0, train/loss_simple_step=0.0923, train/loss_vlb_step=0.000305, train/loss_step=0.0923, global_step=8347.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  64%|██████▍   | 775/1208 [22:19<12:28,  1.73s/it, loss=0.0718, v_num=0, train/loss_simple_step=0.0923, train/loss_vlb_step=0.000305, train/loss_step=0.0923, global_step=8347.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  64%|██████▍   | 775/1208 [22:19<12:28,  1.73s/it, loss=0.0613, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000114, train/loss_step=0.0293, global_step=8347.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  64%|██████▍   | 776/1208 [22:23<12:27,  1.73s/it, loss=0.0613, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000114, train/loss_step=0.0293, global_step=8347.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  64%|██████▍   | 776/1208 [22:23<12:27,  1.73s/it, loss=0.0587, v_num=0, train/loss_simple_step=0.0506, train/loss_vlb_step=0.000179, train/loss_step=0.0506, global_step=8347.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  64%|██████▍   | 777/1208 [22:24<12:25,  1.73s/it, loss=0.0587, v_num=0, train/loss_simple_step=0.0506, train/loss_vlb_step=0.000179, train/loss_step=0.0506, global_step=8347.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  64%|██████▍   | 777/1208 [22:24<12:25,  1.73s/it, loss=0.0566, v_num=0, train/loss_simple_step=0.00816, train/loss_vlb_step=3.82e-5, train/loss_step=0.00816, global_step=8348.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  64%|██████▍   | 778/1208 [22:25<12:23,  1.73s/it, loss=0.0566, v_num=0, train/loss_simple_step=0.00816, train/loss_vlb_step=3.82e-5, train/loss_step=0.00816, global_step=8348.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  64%|██████▍   | 778/1208 [22:25<12:23,  1.73s/it, loss=0.066, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.00072, train/loss_step=0.205, global_step=8348.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]     Epoch 27:  64%|██████▍   | 779/1208 [22:26<12:21,  1.73s/it, loss=0.066, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.00072, train/loss_step=0.205, global_step=8348.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  64%|██████▍   | 779/1208 [22:26<12:21,  1.73s/it, loss=0.0626, v_num=0, train/loss_simple_step=0.00399, train/loss_vlb_step=2.08e-5, train/loss_step=0.00399, global_step=8348.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  65%|██████▍   | 780/1208 [22:29<12:20,  1.73s/it, loss=0.0626, v_num=0, train/loss_simple_step=0.00399, train/loss_vlb_step=2.08e-5, train/loss_step=0.00399, global_step=8348.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  65%|██████▍   | 780/1208 [22:29<12:20,  1.73s/it, loss=0.0635, v_num=0, train/loss_simple_step=0.0294, train/loss_vlb_step=0.000111, train/loss_step=0.0294, global_step=8348.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  65%|██████▍   | 781/1208 [22:30<12:18,  1.73s/it, loss=0.0635, v_num=0, train/loss_simple_step=0.0294, train/loss_vlb_step=0.000111, train/loss_step=0.0294, global_step=8348.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  65%|██████▍   | 781/1208 [22:30<12:18,  1.73s/it, loss=0.064, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.9e-5, train/loss_step=0.0132, global_step=8349.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  65%|██████▍   | 782/1208 [22:31<12:16,  1.73s/it, loss=0.064, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.9e-5, train/loss_step=0.0132, global_step=8349.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  65%|██████▍   | 782/1208 [22:31<12:16,  1.73s/it, loss=0.083, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00231, train/loss_step=0.384, global_step=8349.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  65%|██████▍   | 783/1208 [22:32<12:14,  1.73s/it, loss=0.083, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00231, train/loss_step=0.384, global_step=8349.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  65%|██████▍   | 783/1208 [22:32<12:14,  1.73s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=8.61e-5, train/loss_step=0.0204, global_step=8349.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  65%|██████▍   | 784/1208 [22:36<12:13,  1.73s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=8.61e-5, train/loss_step=0.0204, global_step=8349.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  65%|██████▍   | 784/1208 [22:36<12:13,  1.73s/it, loss=0.0853, v_num=0, train/loss_simple_step=0.0563, train/loss_vlb_step=0.000193, train/loss_step=0.0563, global_step=8349.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  65%|██████▍   | 785/1208 [22:37<12:11,  1.73s/it, loss=0.0853, v_num=0, train/loss_simple_step=0.0563, train/loss_vlb_step=0.000193, train/loss_step=0.0563, global_step=8349.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  65%|██████▍   | 785/1208 [22:37<12:11,  1.73s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000101, train/loss_step=0.0263, global_step=8350.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  65%|██████▌   | 786/1208 [22:38<12:09,  1.73s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000101, train/loss_step=0.0263, global_step=8350.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  65%|██████▌   | 786/1208 [22:38<12:09,  1.73s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00353, train/loss_step=0.374, global_step=8350.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  65%|██████▌   | 787/1208 [22:39<12:07,  1.73s/it, loss=0.0988, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00353, train/loss_step=0.374, global_step=8350.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  65%|██████▌   | 787/1208 [22:39<12:07,  1.73s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.29e-5, train/loss_step=0.0203, global_step=8350.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  65%|██████▌   | 788/1208 [22:42<12:06,  1.73s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=8.29e-5, train/loss_step=0.0203, global_step=8350.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  65%|██████▌   | 788/1208 [22:42<12:06,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0627, train/loss_vlb_step=0.00021, train/loss_step=0.0627, global_step=8350.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  65%|██████▌   | 789/1208 [22:43<12:04,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0627, train/loss_vlb_step=0.00021, train/loss_step=0.0627, global_step=8350.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  65%|██████▌   | 789/1208 [22:43<12:04,  1.73s/it, loss=0.1, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000917, train/loss_step=0.241, global_step=8351.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  65%|██████▌   | 790/1208 [22:44<12:02,  1.73s/it, loss=0.1, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000917, train/loss_step=0.241, global_step=8351.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  65%|██████▌   | 790/1208 [22:44<12:02,  1.73s/it, loss=0.0952, v_num=0, train/loss_simple_step=0.0809, train/loss_vlb_step=0.000271, train/loss_step=0.0809, global_step=8351.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  65%|██████▌   | 791/1208 [22:45<12:00,  1.73s/it, loss=0.0952, v_num=0, train/loss_simple_step=0.0809, train/loss_vlb_step=0.000271, train/loss_step=0.0809, global_step=8351.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  65%|██████▌   | 791/1208 [22:45<12:00,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000914, train/loss_step=0.226, global_step=8351.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  66%|██████▌   | 792/1208 [22:49<11:59,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.000914, train/loss_step=0.226, global_step=8351.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  66%|██████▌   | 792/1208 [22:49<11:59,  1.73s/it, loss=0.104, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=8351.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  66%|██████▌   | 793/1208 [22:50<11:57,  1.73s/it, loss=0.104, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=8351.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  66%|██████▌   | 793/1208 [22:50<11:57,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0915, train/loss_vlb_step=0.000301, train/loss_step=0.0915, global_step=8352.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  66%|██████▌   | 794/1208 [22:51<11:54,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0915, train/loss_vlb_step=0.000301, train/loss_step=0.0915, global_step=8352.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  66%|██████▌   | 794/1208 [22:51<11:54,  1.73s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0659, train/loss_vlb_step=0.000221, train/loss_step=0.0659, global_step=8352.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  66%|██████▌   | 795/1208 [22:52<11:52,  1.73s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0659, train/loss_vlb_step=0.000221, train/loss_step=0.0659, global_step=8352.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  66%|██████▌   | 795/1208 [22:52<11:52,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00138, train/loss_step=0.300, global_step=8352.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  66%|██████▌   | 796/1208 [22:55<11:51,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00138, train/loss_step=0.300, global_step=8352.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  66%|██████▌   | 796/1208 [22:55<11:51,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.496, train/loss_vlb_step=0.00734, train/loss_step=0.496, global_step=8352.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  66%|██████▌   | 797/1208 [22:56<11:49,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.496, train/loss_vlb_step=0.00734, train/loss_step=0.496, global_step=8352.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  66%|██████▌   | 797/1208 [22:56<11:49,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.58e-5, train/loss_step=0.0209, global_step=8353.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  66%|██████▌   | 798/1208 [22:57<11:47,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=8.58e-5, train/loss_step=0.0209, global_step=8353.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  66%|██████▌   | 798/1208 [22:57<11:47,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.00112, train/loss_step=0.242, global_step=8353.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  66%|██████▌   | 799/1208 [22:58<11:45,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.00112, train/loss_step=0.242, global_step=8353.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  66%|██████▌   | 799/1208 [22:58<11:45,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000541, train/loss_step=0.161, global_step=8353.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  66%|██████▌   | 800/1208 [23:01<11:44,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000541, train/loss_step=0.161, global_step=8353.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  66%|██████▌   | 800/1208 [23:01<11:44,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=1.83e-5, train/loss_step=0.00322, global_step=8353.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  66%|██████▋   | 801/1208 [23:02<11:42,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=1.83e-5, train/loss_step=0.00322, global_step=8353.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  66%|██████▋   | 801/1208 [23:02<11:42,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.809, train/loss_vlb_step=0.137, train/loss_step=0.809, global_step=8354.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]     Epoch 27:  66%|██████▋   | 802/1208 [23:04<11:40,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.809, train/loss_vlb_step=0.137, train/loss_step=0.809, global_step=8354.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  66%|██████▋   | 802/1208 [23:04<11:40,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0818, train/loss_vlb_step=0.00027, train/loss_step=0.0818, global_step=8354.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  66%|██████▋   | 803/1208 [23:05<11:38,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0818, train/loss_vlb_step=0.00027, train/loss_step=0.0818, global_step=8354.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  66%|██████▋   | 803/1208 [23:05<11:38,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00355, train/loss_vlb_step=1.95e-5, train/loss_step=0.00355, global_step=8354.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  67%|██████▋   | 804/1208 [23:08<11:37,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00355, train/loss_vlb_step=1.95e-5, train/loss_step=0.00355, global_step=8354.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  67%|██████▋   | 804/1208 [23:08<11:37,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000156, train/loss_step=0.0438, global_step=8354.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  67%|██████▋   | 805/1208 [23:09<11:35,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000156, train/loss_step=0.0438, global_step=8354.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  67%|██████▋   | 805/1208 [23:09<11:35,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000116, train/loss_step=0.0311, global_step=8355.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  67%|██████▋   | 806/1208 [23:10<11:33,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000116, train/loss_step=0.0311, global_step=8355.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  67%|██████▋   | 806/1208 [23:10<11:33,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0883, train/loss_vlb_step=0.000293, train/loss_step=0.0883, global_step=8355.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  67%|██████▋   | 807/1208 [23:11<11:31,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0883, train/loss_vlb_step=0.000293, train/loss_step=0.0883, global_step=8355.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  67%|██████▋   | 807/1208 [23:11<11:31,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.74e-5, train/loss_step=0.0154, global_step=8355.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  67%|██████▋   | 808/1208 [23:14<11:30,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.74e-5, train/loss_step=0.0154, global_step=8355.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  67%|██████▋   | 808/1208 [23:14<11:30,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0925, train/loss_vlb_step=0.000307, train/loss_step=0.0925, global_step=8355.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  67%|██████▋   | 809/1208 [23:15<11:28,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0925, train/loss_vlb_step=0.000307, train/loss_step=0.0925, global_step=8355.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  67%|██████▋   | 809/1208 [23:15<11:28,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.535, train/loss_vlb_step=0.00874, train/loss_step=0.535, global_step=8356.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  67%|██████▋   | 810/1208 [23:16<11:26,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.535, train/loss_vlb_step=0.00874, train/loss_step=0.535, global_step=8356.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  67%|██████▋   | 810/1208 [23:16<11:26,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0613, train/loss_vlb_step=0.00021, train/loss_step=0.0613, global_step=8356.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  67%|██████▋   | 811/1208 [23:17<11:24,  1.72s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0613, train/loss_vlb_step=0.00021, train/loss_step=0.0613, global_step=8356.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  67%|██████▋   | 811/1208 [23:17<11:24,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.94e-5, train/loss_step=0.016, global_step=8356.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  67%|██████▋   | 812/1208 [23:21<11:23,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.94e-5, train/loss_step=0.016, global_step=8356.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  67%|██████▋   | 812/1208 [23:21<11:23,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.48e-5, train/loss_step=0.0141, global_step=8356.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  67%|██████▋   | 813/1208 [23:22<11:21,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.48e-5, train/loss_step=0.0141, global_step=8356.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  67%|██████▋   | 813/1208 [23:22<11:21,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0421, train/loss_vlb_step=0.000155, train/loss_step=0.0421, global_step=8357.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  67%|██████▋   | 814/1208 [23:23<11:19,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0421, train/loss_vlb_step=0.000155, train/loss_step=0.0421, global_step=8357.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  67%|██████▋   | 814/1208 [23:23<11:19,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=8357.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  67%|██████▋   | 815/1208 [23:24<11:17,  1.72s/it, loss=0.159, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=8357.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  67%|██████▋   | 815/1208 [23:24<11:17,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00329, train/loss_vlb_step=1.76e-5, train/loss_step=0.00329, global_step=8357.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  68%|██████▊   | 816/1208 [23:27<11:16,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00329, train/loss_vlb_step=1.76e-5, train/loss_step=0.00329, global_step=8357.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  68%|██████▊   | 816/1208 [23:27<11:16,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00149, train/loss_step=0.305, global_step=8357.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  68%|██████▊   | 817/1208 [23:28<11:14,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.305, train/loss_vlb_step=0.00149, train/loss_step=0.305, global_step=8357.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  68%|██████▊   | 817/1208 [23:28<11:14,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.39e-5, train/loss_step=0.0232, global_step=8358.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  68%|██████▊   | 818/1208 [23:29<11:12,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=9.39e-5, train/loss_step=0.0232, global_step=8358.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  68%|██████▊   | 818/1208 [23:29<11:12,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00925, train/loss_vlb_step=4.41e-5, train/loss_step=0.00925, global_step=8358.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  68%|██████▊   | 819/1208 [23:30<11:10,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00925, train/loss_vlb_step=4.41e-5, train/loss_step=0.00925, global_step=8358.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  68%|██████▊   | 819/1208 [23:30<11:10,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=2.15e-5, train/loss_step=0.00407, global_step=8358.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  68%|██████▊   | 820/1208 [23:34<11:09,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=2.15e-5, train/loss_step=0.00407, global_step=8358.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  68%|██████▊   | 820/1208 [23:34<11:09,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000145, train/loss_step=0.0406, global_step=8358.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  68%|██████▊   | 821/1208 [23:35<11:07,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000145, train/loss_step=0.0406, global_step=8358.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  68%|██████▊   | 821/1208 [23:35<11:07,  1.72s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000635, train/loss_step=0.182, global_step=8359.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  68%|██████▊   | 822/1208 [23:36<11:05,  1.72s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000635, train/loss_step=0.182, global_step=8359.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  68%|██████▊   | 822/1208 [23:36<11:05,  1.72s/it, loss=0.0831, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000135, train/loss_step=0.0363, global_step=8359.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  68%|██████▊   | 823/1208 [23:37<11:03,  1.72s/it, loss=0.0831, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000135, train/loss_step=0.0363, global_step=8359.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  68%|██████▊   | 823/1208 [23:37<11:03,  1.72s/it, loss=0.0831, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.71e-5, train/loss_step=0.00305, global_step=8359.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  68%|██████▊   | 824/1208 [23:40<11:02,  1.72s/it, loss=0.0831, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.71e-5, train/loss_step=0.00305, global_step=8359.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  68%|██████▊   | 824/1208 [23:40<11:02,  1.72s/it, loss=0.0839, v_num=0, train/loss_simple_step=0.0603, train/loss_vlb_step=0.000205, train/loss_step=0.0603, global_step=8359.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  68%|██████▊   | 825/1208 [23:41<11:00,  1.72s/it, loss=0.0839, v_num=0, train/loss_simple_step=0.0603, train/loss_vlb_step=0.000205, train/loss_step=0.0603, global_step=8359.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  68%|██████▊   | 825/1208 [23:41<11:00,  1.72s/it, loss=0.092, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000701, train/loss_step=0.192, global_step=8360.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  68%|██████▊   | 826/1208 [23:42<10:57,  1.72s/it, loss=0.092, v_num=0, train/loss_simple_step=0.192, train/loss_vlb_step=0.000701, train/loss_step=0.192, global_step=8360.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  68%|██████▊   | 826/1208 [23:42<10:57,  1.72s/it, loss=0.0888, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=0.000102, train/loss_step=0.0244, global_step=8360.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  68%|██████▊   | 827/1208 [23:43<10:56,  1.72s/it, loss=0.0888, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=0.000102, train/loss_step=0.0244, global_step=8360.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  68%|██████▊   | 827/1208 [23:43<10:56,  1.72s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.0007, train/loss_step=0.198, global_step=8360.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  69%|██████▊   | 828/1208 [23:46<10:54,  1.72s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.0007, train/loss_step=0.198, global_step=8360.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  69%|██████▊   | 828/1208 [23:46<10:54,  1.72s/it, loss=0.099, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000377, train/loss_step=0.114, global_step=8360.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  69%|██████▊   | 829/1208 [23:48<10:52,  1.72s/it, loss=0.099, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000377, train/loss_step=0.114, global_step=8360.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  69%|██████▊   | 829/1208 [23:48<10:52,  1.72s/it, loss=0.0725, v_num=0, train/loss_simple_step=0.00439, train/loss_vlb_step=2.3e-5, train/loss_step=0.00439, global_step=8361.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  69%|██████▊   | 830/1208 [23:49<10:50,  1.72s/it, loss=0.0725, v_num=0, train/loss_simple_step=0.00439, train/loss_vlb_step=2.3e-5, train/loss_step=0.00439, global_step=8361.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  69%|██████▊   | 830/1208 [23:49<10:50,  1.72s/it, loss=0.07, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.17e-5, train/loss_step=0.0114, global_step=8361.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  69%|██████▉   | 831/1208 [23:50<10:48,  1.72s/it, loss=0.07, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.17e-5, train/loss_step=0.0114, global_step=8361.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  69%|██████▉   | 831/1208 [23:50<10:48,  1.72s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00136, train/loss_step=0.302, global_step=8361.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  69%|██████▉   | 832/1208 [23:53<10:47,  1.72s/it, loss=0.0843, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00136, train/loss_step=0.302, global_step=8361.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  69%|██████▉   | 832/1208 [23:53<10:47,  1.72s/it, loss=0.0903, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.00045, train/loss_step=0.135, global_step=8361.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  69%|██████▉   | 833/1208 [23:54<10:45,  1.72s/it, loss=0.0903, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.00045, train/loss_step=0.135, global_step=8361.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  69%|██████▉   | 833/1208 [23:54<10:45,  1.72s/it, loss=0.0918, v_num=0, train/loss_simple_step=0.0725, train/loss_vlb_step=0.000256, train/loss_step=0.0725, global_step=8362.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  69%|██████▉   | 834/1208 [23:55<10:43,  1.72s/it, loss=0.0918, v_num=0, train/loss_simple_step=0.0725, train/loss_vlb_step=0.000256, train/loss_step=0.0725, global_step=8362.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  69%|██████▉   | 834/1208 [23:55<10:43,  1.72s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=8.45e-6, train/loss_step=0.0014, global_step=8362.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  69%|██████▉   | 835/1208 [23:56<10:41,  1.72s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=8.45e-6, train/loss_step=0.0014, global_step=8362.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  69%|██████▉   | 835/1208 [23:56<10:41,  1.72s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000685, train/loss_step=0.187, global_step=8362.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  69%|██████▉   | 836/1208 [23:59<10:40,  1.72s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000685, train/loss_step=0.187, global_step=8362.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  69%|██████▉   | 836/1208 [23:59<10:40,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00433, train/loss_step=0.435, global_step=8362.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  69%|██████▉   | 837/1208 [24:00<10:38,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00433, train/loss_step=0.435, global_step=8362.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  69%|██████▉   | 837/1208 [24:00<10:38,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00177, train/loss_step=0.392, global_step=8363.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  69%|██████▉   | 838/1208 [24:02<10:36,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00177, train/loss_step=0.392, global_step=8363.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  69%|██████▉   | 838/1208 [24:02<10:36,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00144, train/loss_step=0.263, global_step=8363.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  69%|██████▉   | 839/1208 [24:03<10:34,  1.72s/it, loss=0.133, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00144, train/loss_step=0.263, global_step=8363.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  69%|██████▉   | 839/1208 [24:03<10:34,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000406, train/loss_step=0.122, global_step=8363.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  70%|██████▉   | 840/1208 [24:06<10:33,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000406, train/loss_step=0.122, global_step=8363.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  70%|██████▉   | 840/1208 [24:06<10:33,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.070, train/loss_vlb_step=0.000239, train/loss_step=0.070, global_step=8363.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  70%|██████▉   | 841/1208 [24:07<10:31,  1.72s/it, loss=0.14, v_num=0, train/loss_simple_step=0.070, train/loss_vlb_step=0.000239, train/loss_step=0.070, global_step=8363.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  70%|██████▉   | 841/1208 [24:07<10:31,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0712, train/loss_vlb_step=0.000237, train/loss_step=0.0712, global_step=8364.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  70%|██████▉   | 842/1208 [24:08<10:29,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0712, train/loss_vlb_step=0.000237, train/loss_step=0.0712, global_step=8364.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  70%|██████▉   | 842/1208 [24:08<10:29,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00126, train/loss_step=0.296, global_step=8364.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  70%|██████▉   | 843/1208 [24:09<10:27,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.00126, train/loss_step=0.296, global_step=8364.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  70%|██████▉   | 843/1208 [24:09<10:27,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1.31e-5, train/loss_step=0.00226, global_step=8364.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  70%|██████▉   | 844/1208 [24:12<10:26,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1.31e-5, train/loss_step=0.00226, global_step=8364.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  70%|██████▉   | 844/1208 [24:12<10:26,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000929, train/loss_step=0.229, global_step=8364.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  70%|██████▉   | 845/1208 [24:13<10:24,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000929, train/loss_step=0.229, global_step=8364.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  70%|██████▉   | 845/1208 [24:13<10:24,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0466, train/loss_vlb_step=0.000165, train/loss_step=0.0466, global_step=8365.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  70%|███████   | 846/1208 [24:14<10:22,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0466, train/loss_vlb_step=0.000165, train/loss_step=0.0466, global_step=8365.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  70%|███████   | 846/1208 [24:14<10:22,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0847, train/loss_vlb_step=0.00028, train/loss_step=0.0847, global_step=8365.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  70%|███████   | 847/1208 [24:15<10:20,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0847, train/loss_vlb_step=0.00028, train/loss_step=0.0847, global_step=8365.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  70%|███████   | 847/1208 [24:15<10:20,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00264, train/loss_vlb_step=1.48e-5, train/loss_step=0.00264, global_step=8365.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  70%|███████   | 848/1208 [24:19<10:19,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00264, train/loss_vlb_step=1.48e-5, train/loss_step=0.00264, global_step=8365.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  70%|███████   | 848/1208 [24:19<10:19,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.0011, train/loss_step=0.252, global_step=8365.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]     Epoch 27:  70%|███████   | 849/1208 [24:20<10:17,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.0011, train/loss_step=0.252, global_step=8365.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  70%|███████   | 849/1208 [24:20<10:17,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00662, train/loss_vlb_step=3.34e-5, train/loss_step=0.00662, global_step=8366.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  70%|███████   | 850/1208 [24:21<10:15,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00662, train/loss_vlb_step=3.34e-5, train/loss_step=0.00662, global_step=8366.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  70%|███████   | 850/1208 [24:21<10:15,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000934, train/loss_step=0.241, global_step=8366.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  70%|███████   | 851/1208 [24:22<10:13,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.241, train/loss_vlb_step=0.000934, train/loss_step=0.241, global_step=8366.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  70%|███████   | 851/1208 [24:22<10:13,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00406, train/loss_vlb_step=2.19e-5, train/loss_step=0.00406, global_step=8366.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  71%|███████   | 852/1208 [24:25<10:12,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00406, train/loss_vlb_step=2.19e-5, train/loss_step=0.00406, global_step=8366.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  71%|███████   | 852/1208 [24:25<10:12,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.583, train/loss_vlb_step=0.0155, train/loss_step=0.583, global_step=8366.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]     Epoch 27:  71%|███████   | 853/1208 [24:26<10:10,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.583, train/loss_vlb_step=0.0155, train/loss_step=0.583, global_step=8366.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  71%|███████   | 853/1208 [24:26<10:10,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.479, train/loss_vlb_step=0.00649, train/loss_step=0.479, global_step=8367.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  71%|███████   | 854/1208 [24:27<10:08,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.479, train/loss_vlb_step=0.00649, train/loss_step=0.479, global_step=8367.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  71%|███████   | 854/1208 [24:27<10:08,  1.72s/it, loss=0.193, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=8367.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  71%|███████   | 855/1208 [24:28<10:06,  1.72s/it, loss=0.193, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=8367.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  71%|███████   | 855/1208 [24:28<10:06,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00393, train/loss_vlb_step=2.15e-5, train/loss_step=0.00393, global_step=8367.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  71%|███████   | 856/1208 [24:32<10:05,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00393, train/loss_vlb_step=2.15e-5, train/loss_step=0.00393, global_step=8367.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  71%|███████   | 856/1208 [24:32<10:05,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00157, train/loss_step=0.297, global_step=8367.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  71%|███████   | 857/1208 [24:33<10:03,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00157, train/loss_step=0.297, global_step=8367.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  71%|███████   | 857/1208 [24:33<10:03,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00971, train/loss_vlb_step=4.73e-5, train/loss_step=0.00971, global_step=8368.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  71%|███████   | 858/1208 [24:34<10:01,  1.72s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00971, train/loss_vlb_step=4.73e-5, train/loss_step=0.00971, global_step=8368.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  71%|███████   | 858/1208 [24:34<10:01,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=8368.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  71%|███████   | 859/1208 [24:35<09:59,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=8368.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  71%|███████   | 859/1208 [24:35<09:59,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00271, train/loss_step=0.377, global_step=8368.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  71%|███████   | 860/1208 [24:38<09:58,  1.72s/it, loss=0.164, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00271, train/loss_step=0.377, global_step=8368.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  71%|███████   | 860/1208 [24:38<09:58,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000604, train/loss_step=0.173, global_step=8368.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  71%|███████▏  | 861/1208 [24:39<09:56,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000604, train/loss_step=0.173, global_step=8368.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  71%|███████▏  | 861/1208 [24:39<09:56,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.000888, train/loss_step=0.243, global_step=8369.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  71%|███████▏  | 862/1208 [24:40<09:54,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.000888, train/loss_step=0.243, global_step=8369.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  71%|███████▏  | 862/1208 [24:40<09:54,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00155, train/loss_step=0.308, global_step=8369.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  71%|███████▏  | 863/1208 [24:41<09:52,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00155, train/loss_step=0.308, global_step=8369.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  71%|███████▏  | 863/1208 [24:41<09:52,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00573, train/loss_vlb_step=2.84e-5, train/loss_step=0.00573, global_step=8369.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  72%|███████▏  | 864/1208 [24:45<09:51,  1.72s/it, loss=0.178, v_num=0, train/loss_simple_step=0.00573, train/loss_vlb_step=2.84e-5, train/loss_step=0.00573, global_step=8369.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  72%|███████▏  | 864/1208 [24:45<09:51,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00993, train/loss_vlb_step=4.65e-5, train/loss_step=0.00993, global_step=8369.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  72%|███████▏  | 865/1208 [24:46<09:49,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00993, train/loss_vlb_step=4.65e-5, train/loss_step=0.00993, global_step=8369.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  72%|███████▏  | 865/1208 [24:46<09:49,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.1e-5, train/loss_step=0.0146, global_step=8370.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  72%|███████▏  | 866/1208 [24:47<09:47,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.1e-5, train/loss_step=0.0146, global_step=8370.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  72%|███████▏  | 866/1208 [24:47<09:47,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=9.76e-5, train/loss_step=0.0244, global_step=8370.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  72%|███████▏  | 867/1208 [24:48<09:45,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=9.76e-5, train/loss_step=0.0244, global_step=8370.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  72%|███████▏  | 867/1208 [24:48<09:45,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.0029, train/loss_step=0.327, global_step=8370.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  72%|███████▏  | 868/1208 [24:51<09:44,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.0029, train/loss_step=0.327, global_step=8370.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  72%|███████▏  | 868/1208 [24:51<09:44,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0964, train/loss_vlb_step=0.000317, train/loss_step=0.0964, global_step=8370.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  72%|███████▏  | 869/1208 [24:52<09:42,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0964, train/loss_vlb_step=0.000317, train/loss_step=0.0964, global_step=8370.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  72%|███████▏  | 869/1208 [24:52<09:42,  1.72s/it, loss=0.19, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00267, train/loss_step=0.385, global_step=8371.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  72%|███████▏  | 870/1208 [24:53<09:40,  1.72s/it, loss=0.19, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00267, train/loss_step=0.385, global_step=8371.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  72%|███████▏  | 870/1208 [24:53<09:40,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0832, train/loss_vlb_step=0.000278, train/loss_step=0.0832, global_step=8371.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  72%|███████▏  | 871/1208 [24:54<09:38,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0832, train/loss_vlb_step=0.000278, train/loss_step=0.0832, global_step=8371.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  72%|███████▏  | 871/1208 [24:54<09:38,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.5e-5, train/loss_step=0.0206, global_step=8371.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  72%|███████▏  | 872/1208 [24:58<09:37,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.5e-5, train/loss_step=0.0206, global_step=8371.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  72%|███████▏  | 872/1208 [24:58<09:37,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00337, train/loss_vlb_step=1.84e-5, train/loss_step=0.00337, global_step=8371.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  72%|███████▏  | 873/1208 [24:59<09:35,  1.72s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00337, train/loss_vlb_step=1.84e-5, train/loss_step=0.00337, global_step=8371.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  72%|███████▏  | 873/1208 [24:59<09:35,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0455, train/loss_vlb_step=0.000166, train/loss_step=0.0455, global_step=8372.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  72%|███████▏  | 874/1208 [25:00<09:33,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0455, train/loss_vlb_step=0.000166, train/loss_step=0.0455, global_step=8372.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  72%|███████▏  | 874/1208 [25:00<09:33,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0355, train/loss_vlb_step=0.000135, train/loss_step=0.0355, global_step=8372.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  72%|███████▏  | 875/1208 [25:01<09:31,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0355, train/loss_vlb_step=0.000135, train/loss_step=0.0355, global_step=8372.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  72%|███████▏  | 875/1208 [25:01<09:31,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.54e-5, train/loss_step=0.00267, global_step=8372.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  73%|███████▎  | 876/1208 [25:04<09:30,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.54e-5, train/loss_step=0.00267, global_step=8372.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  73%|███████▎  | 876/1208 [25:04<09:30,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00169, train/loss_step=0.314, global_step=8372.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]     Epoch 27:  73%|███████▎  | 877/1208 [25:05<09:28,  1.72s/it, loss=0.13, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00169, train/loss_step=0.314, global_step=8372.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  73%|███████▎  | 877/1208 [25:05<09:28,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0436, train/loss_vlb_step=0.000156, train/loss_step=0.0436, global_step=8373.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  73%|███████▎  | 878/1208 [25:06<09:26,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0436, train/loss_vlb_step=0.000156, train/loss_step=0.0436, global_step=8373.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  73%|███████▎  | 878/1208 [25:06<09:26,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000956, train/loss_step=0.228, global_step=8373.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  73%|███████▎  | 879/1208 [25:07<09:24,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000956, train/loss_step=0.228, global_step=8373.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  73%|███████▎  | 879/1208 [25:07<09:24,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00748, train/loss_vlb_step=3.67e-5, train/loss_step=0.00748, global_step=8373.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  73%|███████▎  | 880/1208 [25:10<09:23,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00748, train/loss_vlb_step=3.67e-5, train/loss_step=0.00748, global_step=8373.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  73%|███████▎  | 880/1208 [25:10<09:23,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000123, train/loss_step=0.0333, global_step=8373.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  73%|███████▎  | 881/1208 [25:12<09:21,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000123, train/loss_step=0.0333, global_step=8373.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  73%|███████▎  | 881/1208 [25:12<09:21,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6e-5, train/loss_step=0.0135, global_step=8374.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]      Epoch 27:  73%|███████▎  | 882/1208 [25:13<09:19,  1.72s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=6e-5, train/loss_step=0.0135, global_step=8374.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  73%|███████▎  | 882/1208 [25:13<09:19,  1.72s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.0606, train/loss_vlb_step=0.000205, train/loss_step=0.0606, global_step=8374.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  73%|███████▎  | 883/1208 [25:14<09:17,  1.71s/it, loss=0.0877, v_num=0, train/loss_simple_step=0.0606, train/loss_vlb_step=0.000205, train/loss_step=0.0606, global_step=8374.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  73%|███████▎  | 883/1208 [25:14<09:17,  1.71s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000358, train/loss_step=0.108, global_step=8374.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  73%|███████▎  | 884/1208 [25:17<09:16,  1.72s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000358, train/loss_step=0.108, global_step=8374.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  73%|███████▎  | 884/1208 [25:17<09:16,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.497, train/loss_vlb_step=0.00792, train/loss_step=0.497, global_step=8374.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  73%|███████▎  | 885/1208 [25:18<09:14,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.497, train/loss_vlb_step=0.00792, train/loss_step=0.497, global_step=8374.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  73%|███████▎  | 885/1208 [25:18<09:14,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=1.43e-5, train/loss_step=0.00239, global_step=8375.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  73%|███████▎  | 886/1208 [25:19<09:12,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=1.43e-5, train/loss_step=0.00239, global_step=8375.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  73%|███████▎  | 886/1208 [25:19<09:12,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.573, train/loss_vlb_step=0.00937, train/loss_step=0.573, global_step=8375.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  73%|███████▎  | 887/1208 [25:20<09:10,  1.71s/it, loss=0.144, v_num=0, train/loss_simple_step=0.573, train/loss_vlb_step=0.00937, train/loss_step=0.573, global_step=8375.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  73%|███████▎  | 887/1208 [25:20<09:10,  1.71s/it, loss=0.131, v_num=0, train/loss_simple_step=0.060, train/loss_vlb_step=0.000208, train/loss_step=0.060, global_step=8375.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  74%|███████▎  | 888/1208 [25:23<09:09,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.060, train/loss_vlb_step=0.000208, train/loss_step=0.060, global_step=8375.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  74%|███████▎  | 888/1208 [25:23<09:09,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.08e-5, train/loss_step=0.0139, global_step=8375.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  74%|███████▎  | 889/1208 [25:24<09:07,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.08e-5, train/loss_step=0.0139, global_step=8375.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  74%|███████▎  | 889/1208 [25:24<09:07,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.14e-5, train/loss_step=0.0116, global_step=8376.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  74%|███████▎  | 890/1208 [25:26<09:05,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.14e-5, train/loss_step=0.0116, global_step=8376.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  74%|███████▎  | 890/1208 [25:26<09:05,  1.71s/it, loss=0.115, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000985, train/loss_step=0.224, global_step=8376.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  74%|███████▍  | 891/1208 [25:27<09:03,  1.71s/it, loss=0.115, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000985, train/loss_step=0.224, global_step=8376.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  74%|███████▍  | 891/1208 [25:27<09:03,  1.71s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000111, train/loss_step=0.0278, global_step=8376.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  74%|███████▍  | 892/1208 [25:30<09:02,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.000111, train/loss_step=0.0278, global_step=8376.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  74%|███████▍  | 892/1208 [25:30<09:02,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=1.12e-5, train/loss_step=0.00184, global_step=8376.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  74%|███████▍  | 893/1208 [25:31<09:00,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=1.12e-5, train/loss_step=0.00184, global_step=8376.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  74%|███████▍  | 893/1208 [25:31<09:00,  1.72s/it, loss=0.122, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000666, train/loss_step=0.189, global_step=8377.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  74%|███████▍  | 894/1208 [25:32<08:58,  1.71s/it, loss=0.122, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000666, train/loss_step=0.189, global_step=8377.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  74%|███████▍  | 894/1208 [25:32<08:58,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.88e-5, train/loss_step=0.0133, global_step=8377.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  74%|███████▍  | 895/1208 [25:33<08:56,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.88e-5, train/loss_step=0.0133, global_step=8377.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  74%|███████▍  | 895/1208 [25:33<08:56,  1.71s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.18e-5, train/loss_step=0.00203, global_step=8377.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  74%|███████▍  | 896/1208 [25:36<08:55,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.18e-5, train/loss_step=0.00203, global_step=8377.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  74%|███████▍  | 896/1208 [25:36<08:55,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0574, train/loss_vlb_step=0.000202, train/loss_step=0.0574, global_step=8377.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  74%|███████▍  | 897/1208 [25:37<08:53,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0574, train/loss_vlb_step=0.000202, train/loss_step=0.0574, global_step=8377.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  74%|███████▍  | 897/1208 [25:37<08:53,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00519, train/loss_vlb_step=2.58e-5, train/loss_step=0.00519, global_step=8378.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  74%|███████▍  | 898/1208 [25:38<08:51,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00519, train/loss_vlb_step=2.58e-5, train/loss_step=0.00519, global_step=8378.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  74%|███████▍  | 898/1208 [25:38<08:51,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.863, train/loss_vlb_step=0.088, train/loss_step=0.863, global_step=8378.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]      Epoch 27:  74%|███████▍  | 899/1208 [25:40<08:49,  1.71s/it, loss=0.138, v_num=0, train/loss_simple_step=0.863, train/loss_vlb_step=0.088, train/loss_step=0.863, global_step=8378.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  74%|███████▍  | 899/1208 [25:40<08:49,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00121, train/loss_step=0.262, global_step=8378.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  75%|███████▍  | 900/1208 [25:43<08:48,  1.71s/it, loss=0.151, v_num=0, train/loss_simple_step=0.262, train/loss_vlb_step=0.00121, train/loss_step=0.262, global_step=8378.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  75%|███████▍  | 900/1208 [25:43<08:48,  1.71s/it, loss=0.156, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000459, train/loss_step=0.140, global_step=8378.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:29,  1.67it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:28,  1.71it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.72it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.71it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.73it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.71it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:27,  1.70it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:26,  1.69it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:26,  1.71it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.71it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.70it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.73it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.72it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.74it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.73it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.72it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.74it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.74it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.72it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:23,  1.73it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:23,  1.73it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:23,  1.73it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.75it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.74it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.72it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.81it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.75it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.74it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.75it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.74it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.75it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.74it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.81it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.76it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:20,  1.74it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.78it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:18,  1.79it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.74it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:19,  1.73it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.74it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.74it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.75it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.75it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.75it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.76it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.77it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.75it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.75it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.75it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.75it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:14<00:13,  1.79it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.75it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.75it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.78it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.75it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.75it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.75it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.74it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:16<00:12,  1.75it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.75it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.73it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.78it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.75it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.74it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.78it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.75it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.75it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.75it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.74it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.74it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.75it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.75it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.72it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:20<00:08,  1.74it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.75it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:08,  1.72it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.75it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.72it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.76it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.74it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.72it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.75it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.76it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.73it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.75it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.74it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.75it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.75it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.74it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.75it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.75it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.75it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.74it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.75it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.75it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:24<00:04,  1.75it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.73it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.75it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.75it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.72it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.75it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.75it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.72it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.75it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.76it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.74it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.74it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.74it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.73it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.75it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.74it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.74it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.75it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.74it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.74it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:28<00:00,  1.75it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.74it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.74it/s]Epoch 27:  75%|███████▍  | 901/1208 [26:14<08:56,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000459, train/loss_step=0.140, global_step=8378.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  75%|███████▍  | 901/1208 [26:14<08:56,  1.75s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.04e-5, train/loss_step=0.0196, global_step=8379.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  75%|███████▍  | 902/1208 [26:15<08:54,  1.75s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=8.04e-5, train/loss_step=0.0196, global_step=8379.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  75%|███████▍  | 902/1208 [26:15<08:54,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000565, train/loss_step=0.164, global_step=8379.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  75%|███████▍  | 903/1208 [26:16<08:52,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000565, train/loss_step=0.164, global_step=8379.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  75%|███████▍  | 903/1208 [26:16<08:52,  1.75s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00808, train/loss_vlb_step=4e-5, train/loss_step=0.00808, global_step=8379.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  75%|███████▍  | 904/1208 [26:19<08:51,  1.75s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00808, train/loss_vlb_step=4e-5, train/loss_step=0.00808, global_step=8379.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  75%|███████▍  | 904/1208 [26:19<08:51,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00788, train/loss_vlb_step=4.02e-5, train/loss_step=0.00788, global_step=8379.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  75%|███████▍  | 905/1208 [26:20<08:49,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00788, train/loss_vlb_step=4.02e-5, train/loss_step=0.00788, global_step=8379.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  75%|███████▍  | 905/1208 [26:20<08:49,  1.75s/it, loss=0.148, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00137, train/loss_step=0.321, global_step=8380.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  75%|███████▌  | 906/1208 [26:21<08:47,  1.75s/it, loss=0.148, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00137, train/loss_step=0.321, global_step=8380.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  75%|███████▌  | 906/1208 [26:21<08:47,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.48e-5, train/loss_step=0.00254, global_step=8380.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  75%|███████▌  | 907/1208 [26:22<08:45,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.48e-5, train/loss_step=0.00254, global_step=8380.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  75%|███████▌  | 907/1208 [26:22<08:45,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.000272, train/loss_step=0.0817, global_step=8380.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  75%|███████▌  | 908/1208 [26:26<08:44,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.000272, train/loss_step=0.0817, global_step=8380.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  75%|███████▌  | 908/1208 [26:26<08:44,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0756, train/loss_vlb_step=0.000251, train/loss_step=0.0756, global_step=8380.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  75%|███████▌  | 909/1208 [26:27<08:42,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0756, train/loss_vlb_step=0.000251, train/loss_step=0.0756, global_step=8380.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  75%|███████▌  | 909/1208 [26:27<08:42,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00412, train/loss_vlb_step=2.16e-5, train/loss_step=0.00412, global_step=8381.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  75%|███████▌  | 910/1208 [26:28<08:40,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00412, train/loss_vlb_step=2.16e-5, train/loss_step=0.00412, global_step=8381.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  75%|███████▌  | 910/1208 [26:28<08:40,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=1.37e-5, train/loss_step=0.00232, global_step=8381.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  75%|███████▌  | 911/1208 [26:29<08:38,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=1.37e-5, train/loss_step=0.00232, global_step=8381.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  75%|███████▌  | 911/1208 [26:29<08:38,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0066, train/loss_vlb_step=3.45e-5, train/loss_step=0.0066, global_step=8381.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  75%|███████▌  | 912/1208 [26:32<08:36,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0066, train/loss_vlb_step=3.45e-5, train/loss_step=0.0066, global_step=8381.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  75%|███████▌  | 912/1208 [26:32<08:36,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000126, train/loss_step=0.0334, global_step=8381.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  76%|███████▌  | 913/1208 [26:33<08:34,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.000126, train/loss_step=0.0334, global_step=8381.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  76%|███████▌  | 913/1208 [26:33<08:34,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00168, train/loss_step=0.325, global_step=8382.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  76%|███████▌  | 914/1208 [26:34<08:32,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00168, train/loss_step=0.325, global_step=8382.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  76%|███████▌  | 914/1208 [26:34<08:32,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.077, train/loss_vlb_step=0.000256, train/loss_step=0.077, global_step=8382.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  76%|███████▌  | 915/1208 [26:35<08:30,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.077, train/loss_vlb_step=0.000256, train/loss_step=0.077, global_step=8382.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  76%|███████▌  | 915/1208 [26:35<08:30,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.98e-5, train/loss_step=0.0191, global_step=8382.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  76%|███████▌  | 916/1208 [26:39<08:29,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=7.98e-5, train/loss_step=0.0191, global_step=8382.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  76%|███████▌  | 916/1208 [26:39<08:29,  1.75s/it, loss=0.148, v_num=0, train/loss_simple_step=0.538, train/loss_vlb_step=0.00714, train/loss_step=0.538, global_step=8382.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  76%|███████▌  | 917/1208 [26:40<08:27,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.538, train/loss_vlb_step=0.00714, train/loss_step=0.538, global_step=8382.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  76%|███████▌  | 917/1208 [26:40<08:27,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00458, train/loss_vlb_step=2.32e-5, train/loss_step=0.00458, global_step=8383.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  76%|███████▌  | 918/1208 [26:41<08:25,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00458, train/loss_vlb_step=2.32e-5, train/loss_step=0.00458, global_step=8383.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  76%|███████▌  | 918/1208 [26:41<08:25,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.62e-5, train/loss_step=0.0029, global_step=8383.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  76%|███████▌  | 919/1208 [26:42<08:23,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.62e-5, train/loss_step=0.0029, global_step=8383.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  76%|███████▌  | 919/1208 [26:42<08:23,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00212, train/loss_step=0.386, global_step=8383.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  76%|███████▌  | 920/1208 [26:45<08:22,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.386, train/loss_vlb_step=0.00212, train/loss_step=0.386, global_step=8383.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  76%|███████▌  | 920/1208 [26:45<08:22,  1.75s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.36e-5, train/loss_step=0.0208, global_step=8383.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  76%|███████▌  | 921/1208 [26:46<08:20,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.36e-5, train/loss_step=0.0208, global_step=8383.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  76%|███████▌  | 921/1208 [26:46<08:20,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00253, train/loss_step=0.361, global_step=8384.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  76%|███████▋  | 922/1208 [26:47<08:18,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00253, train/loss_step=0.361, global_step=8384.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  76%|███████▋  | 922/1208 [26:47<08:18,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.77e-5, train/loss_step=0.0154, global_step=8384.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  76%|███████▋  | 923/1208 [26:48<08:16,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.77e-5, train/loss_step=0.0154, global_step=8384.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  76%|███████▋  | 923/1208 [26:48<08:16,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00104, train/loss_step=0.258, global_step=8384.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  76%|███████▋  | 924/1208 [26:51<08:15,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00104, train/loss_step=0.258, global_step=8384.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  76%|███████▋  | 924/1208 [26:51<08:15,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.4e-5, train/loss_step=0.00254, global_step=8384.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  77%|███████▋  | 925/1208 [26:53<08:13,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.4e-5, train/loss_step=0.00254, global_step=8384.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  77%|███████▋  | 925/1208 [26:53<08:13,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0553, train/loss_vlb_step=0.000194, train/loss_step=0.0553, global_step=8385.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  77%|███████▋  | 926/1208 [26:54<08:11,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0553, train/loss_vlb_step=0.000194, train/loss_step=0.0553, global_step=8385.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  77%|███████▋  | 926/1208 [26:54<08:11,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000347, train/loss_step=0.104, global_step=8385.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  77%|███████▋  | 927/1208 [26:55<08:09,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000347, train/loss_step=0.104, global_step=8385.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  77%|███████▋  | 927/1208 [26:55<08:09,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000132, train/loss_step=0.0358, global_step=8385.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  77%|███████▋  | 928/1208 [26:58<08:08,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000132, train/loss_step=0.0358, global_step=8385.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  77%|███████▋  | 928/1208 [26:58<08:08,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0513, train/loss_vlb_step=0.000175, train/loss_step=0.0513, global_step=8385.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  77%|███████▋  | 929/1208 [26:59<08:06,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0513, train/loss_vlb_step=0.000175, train/loss_step=0.0513, global_step=8385.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  77%|███████▋  | 929/1208 [26:59<08:06,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0568, train/loss_vlb_step=0.000195, train/loss_step=0.0568, global_step=8386.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  77%|███████▋  | 930/1208 [27:00<08:04,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0568, train/loss_vlb_step=0.000195, train/loss_step=0.0568, global_step=8386.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  77%|███████▋  | 930/1208 [27:00<08:04,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000576, train/loss_step=0.169, global_step=8386.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  77%|███████▋  | 931/1208 [27:01<08:02,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000576, train/loss_step=0.169, global_step=8386.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  77%|███████▋  | 931/1208 [27:01<08:02,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000713, train/loss_step=0.199, global_step=8386.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  77%|███████▋  | 932/1208 [27:04<08:01,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.199, train/loss_vlb_step=0.000713, train/loss_step=0.199, global_step=8386.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  77%|███████▋  | 932/1208 [27:04<08:01,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000454, train/loss_step=0.138, global_step=8386.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  77%|███████▋  | 933/1208 [27:05<07:59,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000454, train/loss_step=0.138, global_step=8386.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  77%|███████▋  | 933/1208 [27:05<07:59,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.4e-5, train/loss_step=0.00241, global_step=8387.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  77%|███████▋  | 934/1208 [27:06<07:57,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.4e-5, train/loss_step=0.00241, global_step=8387.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  77%|███████▋  | 934/1208 [27:06<07:57,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.22e-5, train/loss_step=0.00212, global_step=8387.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  77%|███████▋  | 935/1208 [27:08<07:55,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.22e-5, train/loss_step=0.00212, global_step=8387.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  77%|███████▋  | 935/1208 [27:08<07:55,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00676, train/loss_vlb_step=3.28e-5, train/loss_step=0.00676, global_step=8387.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  77%|███████▋  | 936/1208 [27:11<07:54,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00676, train/loss_vlb_step=3.28e-5, train/loss_step=0.00676, global_step=8387.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  77%|███████▋  | 936/1208 [27:11<07:54,  1.74s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=9.21e-5, train/loss_step=0.022, global_step=8387.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  78%|███████▊  | 937/1208 [27:12<07:52,  1.74s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=9.21e-5, train/loss_step=0.022, global_step=8387.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  78%|███████▊  | 937/1208 [27:12<07:52,  1.74s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=8.76e-5, train/loss_step=0.0211, global_step=8388.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  78%|███████▊  | 938/1208 [27:13<07:50,  1.74s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=8.76e-5, train/loss_step=0.0211, global_step=8388.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  78%|███████▊  | 938/1208 [27:13<07:50,  1.74s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.35e-5, train/loss_step=0.0226, global_step=8388.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  78%|███████▊  | 939/1208 [27:14<07:48,  1.74s/it, loss=0.0965, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.35e-5, train/loss_step=0.0226, global_step=8388.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  78%|███████▊  | 939/1208 [27:14<07:48,  1.74s/it, loss=0.093, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00162, train/loss_step=0.315, global_step=8388.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  78%|███████▊  | 940/1208 [27:17<07:46,  1.74s/it, loss=0.093, v_num=0, train/loss_simple_step=0.315, train/loss_vlb_step=0.00162, train/loss_step=0.315, global_step=8388.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  78%|███████▊  | 940/1208 [27:17<07:46,  1.74s/it, loss=0.1, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000571, train/loss_step=0.163, global_step=8388.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  78%|███████▊  | 941/1208 [27:18<07:44,  1.74s/it, loss=0.1, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000571, train/loss_step=0.163, global_step=8388.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  78%|███████▊  | 941/1208 [27:18<07:44,  1.74s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00232, train/loss_step=0.348, global_step=8389.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  78%|███████▊  | 942/1208 [27:19<07:43,  1.74s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00232, train/loss_step=0.348, global_step=8389.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  78%|███████▊  | 942/1208 [27:19<07:43,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00238, train/loss_step=0.303, global_step=8389.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  78%|███████▊  | 943/1208 [27:20<07:41,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00238, train/loss_step=0.303, global_step=8389.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  78%|███████▊  | 943/1208 [27:20<07:41,  1.74s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00852, train/loss_vlb_step=4.12e-5, train/loss_step=0.00852, global_step=8389.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  78%|███████▊  | 944/1208 [27:24<07:39,  1.74s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00852, train/loss_vlb_step=4.12e-5, train/loss_step=0.00852, global_step=8389.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  78%|███████▊  | 944/1208 [27:24<07:39,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.0035, train/loss_step=0.390, global_step=8389.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]     Epoch 27:  78%|███████▊  | 945/1208 [27:25<07:37,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.0035, train/loss_step=0.390, global_step=8389.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  78%|███████▊  | 945/1208 [27:25<07:37,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00179, train/loss_step=0.311, global_step=8390.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  78%|███████▊  | 946/1208 [27:26<07:35,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00179, train/loss_step=0.311, global_step=8390.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  78%|███████▊  | 946/1208 [27:26<07:35,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00664, train/loss_vlb_step=3.29e-5, train/loss_step=0.00664, global_step=8390.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  78%|███████▊  | 947/1208 [27:27<07:34,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00664, train/loss_vlb_step=3.29e-5, train/loss_step=0.00664, global_step=8390.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  78%|███████▊  | 947/1208 [27:27<07:34,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00654, train/loss_vlb_step=3.22e-5, train/loss_step=0.00654, global_step=8390.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  78%|███████▊  | 948/1208 [27:30<07:32,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00654, train/loss_vlb_step=3.22e-5, train/loss_step=0.00654, global_step=8390.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  78%|███████▊  | 948/1208 [27:30<07:32,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000398, train/loss_step=0.121, global_step=8390.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  79%|███████▊  | 949/1208 [27:31<07:30,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000398, train/loss_step=0.121, global_step=8390.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  79%|███████▊  | 949/1208 [27:31<07:30,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.00049, train/loss_step=0.145, global_step=8391.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  79%|███████▊  | 950/1208 [27:32<07:28,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.00049, train/loss_step=0.145, global_step=8391.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  79%|███████▊  | 950/1208 [27:32<07:28,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00861, train/loss_vlb_step=4.08e-5, train/loss_step=0.00861, global_step=8391.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  79%|███████▊  | 951/1208 [27:33<07:26,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00861, train/loss_vlb_step=4.08e-5, train/loss_step=0.00861, global_step=8391.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  79%|███████▊  | 951/1208 [27:33<07:26,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.91e-5, train/loss_step=0.0246, global_step=8391.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  79%|███████▉  | 952/1208 [27:36<07:25,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=9.91e-5, train/loss_step=0.0246, global_step=8391.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  79%|███████▉  | 952/1208 [27:36<07:25,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0041, train/loss_vlb_step=2.15e-5, train/loss_step=0.0041, global_step=8391.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  79%|███████▉  | 953/1208 [27:38<07:23,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0041, train/loss_vlb_step=2.15e-5, train/loss_step=0.0041, global_step=8391.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  79%|███████▉  | 953/1208 [27:38<07:23,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0775, train/loss_vlb_step=0.000255, train/loss_step=0.0775, global_step=8392.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  79%|███████▉  | 954/1208 [27:39<07:21,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0775, train/loss_vlb_step=0.000255, train/loss_step=0.0775, global_step=8392.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  79%|███████▉  | 954/1208 [27:39<07:21,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.507, train/loss_vlb_step=0.00498, train/loss_step=0.507, global_step=8392.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  79%|███████▉  | 955/1208 [27:40<07:19,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.507, train/loss_vlb_step=0.00498, train/loss_step=0.507, global_step=8392.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  79%|███████▉  | 955/1208 [27:40<07:19,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.000963, train/loss_step=0.249, global_step=8392.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  79%|███████▉  | 956/1208 [27:43<07:18,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.000963, train/loss_step=0.249, global_step=8392.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  79%|███████▉  | 956/1208 [27:43<07:18,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00193, train/loss_vlb_step=1.13e-5, train/loss_step=0.00193, global_step=8392.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  79%|███████▉  | 957/1208 [27:44<07:16,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00193, train/loss_vlb_step=1.13e-5, train/loss_step=0.00193, global_step=8392.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  79%|███████▉  | 957/1208 [27:44<07:16,  1.74s/it, loss=0.172, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00221, train/loss_step=0.428, global_step=8393.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  79%|███████▉  | 958/1208 [27:45<07:14,  1.74s/it, loss=0.172, v_num=0, train/loss_simple_step=0.428, train/loss_vlb_step=0.00221, train/loss_step=0.428, global_step=8393.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  79%|███████▉  | 958/1208 [27:45<07:14,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0698, train/loss_vlb_step=0.000237, train/loss_step=0.0698, global_step=8393.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  79%|███████▉  | 959/1208 [27:46<07:12,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0698, train/loss_vlb_step=0.000237, train/loss_step=0.0698, global_step=8393.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  79%|███████▉  | 959/1208 [27:46<07:12,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00453, train/loss_vlb_step=2.33e-5, train/loss_step=0.00453, global_step=8393.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  79%|███████▉  | 960/1208 [27:49<07:11,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00453, train/loss_vlb_step=2.33e-5, train/loss_step=0.00453, global_step=8393.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  79%|███████▉  | 960/1208 [27:49<07:11,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0774, train/loss_vlb_step=0.000261, train/loss_step=0.0774, global_step=8393.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  80%|███████▉  | 961/1208 [27:51<07:09,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0774, train/loss_vlb_step=0.000261, train/loss_step=0.0774, global_step=8393.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  80%|███████▉  | 961/1208 [27:51<07:09,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0833, train/loss_vlb_step=0.000278, train/loss_step=0.0833, global_step=8394.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  80%|███████▉  | 962/1208 [27:52<07:07,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0833, train/loss_vlb_step=0.000278, train/loss_step=0.0833, global_step=8394.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  80%|███████▉  | 962/1208 [27:52<07:07,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.48e-5, train/loss_step=0.018, global_step=8394.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  80%|███████▉  | 963/1208 [27:53<07:05,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=7.48e-5, train/loss_step=0.018, global_step=8394.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  80%|███████▉  | 963/1208 [27:53<07:05,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0536, train/loss_vlb_step=0.000186, train/loss_step=0.0536, global_step=8394.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  80%|███████▉  | 964/1208 [27:56<07:04,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0536, train/loss_vlb_step=0.000186, train/loss_step=0.0536, global_step=8394.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  80%|███████▉  | 964/1208 [27:56<07:04,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000754, train/loss_step=0.209, global_step=8394.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  80%|███████▉  | 965/1208 [27:57<07:02,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000754, train/loss_step=0.209, global_step=8394.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  80%|███████▉  | 965/1208 [27:57<07:02,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.06e-5, train/loss_step=0.0194, global_step=8395.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  80%|███████▉  | 966/1208 [27:58<07:00,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.06e-5, train/loss_step=0.0194, global_step=8395.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  80%|███████▉  | 966/1208 [27:58<07:00,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000102, train/loss_step=0.026, global_step=8395.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  80%|████████  | 967/1208 [27:59<06:58,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000102, train/loss_step=0.026, global_step=8395.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  80%|████████  | 967/1208 [27:59<06:58,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0589, train/loss_vlb_step=0.0002, train/loss_step=0.0589, global_step=8395.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  80%|████████  | 968/1208 [28:02<06:57,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0589, train/loss_vlb_step=0.0002, train/loss_step=0.0589, global_step=8395.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  80%|████████  | 968/1208 [28:02<06:57,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00118, train/loss_step=0.279, global_step=8395.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  80%|████████  | 969/1208 [28:04<06:55,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00118, train/loss_step=0.279, global_step=8395.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  80%|████████  | 969/1208 [28:04<06:55,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000603, train/loss_step=0.177, global_step=8396.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  80%|████████  | 970/1208 [28:05<06:53,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000603, train/loss_step=0.177, global_step=8396.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  80%|████████  | 970/1208 [28:05<06:53,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.17e-5, train/loss_step=0.00197, global_step=8396.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  80%|████████  | 971/1208 [28:06<06:51,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.17e-5, train/loss_step=0.00197, global_step=8396.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  80%|████████  | 971/1208 [28:06<06:51,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00214, train/loss_step=0.328, global_step=8396.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  80%|████████  | 972/1208 [28:09<06:50,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00214, train/loss_step=0.328, global_step=8396.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  80%|████████  | 972/1208 [28:09<06:50,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00109, train/loss_step=0.252, global_step=8396.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  81%|████████  | 973/1208 [28:10<06:48,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00109, train/loss_step=0.252, global_step=8396.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  81%|████████  | 973/1208 [28:10<06:48,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.000125, train/loss_step=0.034, global_step=8397.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  81%|████████  | 974/1208 [28:11<06:46,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.000125, train/loss_step=0.034, global_step=8397.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  81%|████████  | 974/1208 [28:11<06:46,  1.74s/it, loss=0.15, v_num=0, train/loss_simple_step=0.621, train/loss_vlb_step=0.0218, train/loss_step=0.621, global_step=8397.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  81%|████████  | 975/1208 [28:12<06:44,  1.74s/it, loss=0.15, v_num=0, train/loss_simple_step=0.621, train/loss_vlb_step=0.0218, train/loss_step=0.621, global_step=8397.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  81%|████████  | 975/1208 [28:12<06:44,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000488, train/loss_step=0.144, global_step=8397.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  81%|████████  | 976/1208 [28:16<06:43,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000488, train/loss_step=0.144, global_step=8397.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  81%|████████  | 976/1208 [28:16<06:43,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=5.92e-5, train/loss_step=0.014, global_step=8397.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  81%|████████  | 977/1208 [28:17<06:41,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=5.92e-5, train/loss_step=0.014, global_step=8397.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  81%|████████  | 977/1208 [28:17<06:41,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0765, train/loss_vlb_step=0.000256, train/loss_step=0.0765, global_step=8398.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  81%|████████  | 978/1208 [28:18<06:39,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0765, train/loss_vlb_step=0.000256, train/loss_step=0.0765, global_step=8398.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  81%|████████  | 978/1208 [28:18<06:39,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00165, train/loss_step=0.346, global_step=8398.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  81%|████████  | 979/1208 [28:19<06:37,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00165, train/loss_step=0.346, global_step=8398.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  81%|████████  | 979/1208 [28:19<06:37,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0366, train/loss_vlb_step=0.000134, train/loss_step=0.0366, global_step=8398.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  81%|████████  | 980/1208 [28:22<06:36,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0366, train/loss_vlb_step=0.000134, train/loss_step=0.0366, global_step=8398.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  81%|████████  | 980/1208 [28:22<06:36,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00231, train/loss_step=0.392, global_step=8398.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  81%|████████  | 981/1208 [28:23<06:34,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00231, train/loss_step=0.392, global_step=8398.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  81%|████████  | 981/1208 [28:23<06:34,  1.74s/it, loss=0.16, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000412, train/loss_step=0.122, global_step=8399.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  81%|████████▏ | 982/1208 [28:24<06:32,  1.74s/it, loss=0.16, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000412, train/loss_step=0.122, global_step=8399.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  81%|████████▏ | 982/1208 [28:24<06:32,  1.74s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=9.97e-6, train/loss_step=0.00168, global_step=8399.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  81%|████████▏ | 983/1208 [28:25<06:30,  1.74s/it, loss=0.16, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=9.97e-6, train/loss_step=0.00168, global_step=8399.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  81%|████████▏ | 983/1208 [28:25<06:30,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.00038, train/loss_step=0.115, global_step=8399.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  81%|████████▏ | 984/1208 [28:28<06:29,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.00038, train/loss_step=0.115, global_step=8399.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  81%|████████▏ | 984/1208 [28:28<06:29,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.06e-5, train/loss_step=0.00176, global_step=8399.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  82%|████████▏ | 985/1208 [28:29<06:27,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.06e-5, train/loss_step=0.00176, global_step=8399.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  82%|████████▏ | 985/1208 [28:29<06:27,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0467, train/loss_vlb_step=0.000168, train/loss_step=0.0467, global_step=8400.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  82%|████████▏ | 986/1208 [28:31<06:25,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0467, train/loss_vlb_step=0.000168, train/loss_step=0.0467, global_step=8400.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  82%|████████▏ | 986/1208 [28:31<06:25,  1.74s/it, loss=0.201, v_num=0, train/loss_simple_step=0.961, train/loss_vlb_step=0.484, train/loss_step=0.961, global_step=8400.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]     Epoch 27:  82%|████████▏ | 987/1208 [28:32<06:23,  1.73s/it, loss=0.201, v_num=0, train/loss_simple_step=0.961, train/loss_vlb_step=0.484, train/loss_step=0.961, global_step=8400.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  82%|████████▏ | 987/1208 [28:32<06:23,  1.73s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.58e-5, train/loss_step=0.00281, global_step=8400.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  82%|████████▏ | 988/1208 [28:35<06:21,  1.74s/it, loss=0.198, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.58e-5, train/loss_step=0.00281, global_step=8400.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  82%|████████▏ | 988/1208 [28:35<06:21,  1.74s/it, loss=0.216, v_num=0, train/loss_simple_step=0.650, train/loss_vlb_step=0.0243, train/loss_step=0.650, global_step=8400.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]     Epoch 27:  82%|████████▏ | 989/1208 [28:36<06:20,  1.74s/it, loss=0.216, v_num=0, train/loss_simple_step=0.650, train/loss_vlb_step=0.0243, train/loss_step=0.650, global_step=8400.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  82%|████████▏ | 989/1208 [28:36<06:20,  1.74s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0431, train/loss_vlb_step=0.000157, train/loss_step=0.0431, global_step=8401.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  82%|████████▏ | 990/1208 [28:37<06:18,  1.73s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0431, train/loss_vlb_step=0.000157, train/loss_step=0.0431, global_step=8401.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  82%|████████▏ | 990/1208 [28:37<06:18,  1.73s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000128, train/loss_step=0.0361, global_step=8401.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  82%|████████▏ | 991/1208 [28:38<06:16,  1.73s/it, loss=0.211, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000128, train/loss_step=0.0361, global_step=8401.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  82%|████████▏ | 991/1208 [28:38<06:16,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000104, train/loss_step=0.026, global_step=8401.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  82%|████████▏ | 992/1208 [28:41<06:14,  1.74s/it, loss=0.196, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000104, train/loss_step=0.026, global_step=8401.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  82%|████████▏ | 992/1208 [28:41<06:14,  1.74s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00692, train/loss_vlb_step=3.61e-5, train/loss_step=0.00692, global_step=8401.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  82%|████████▏ | 993/1208 [28:43<06:13,  1.74s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00692, train/loss_vlb_step=3.61e-5, train/loss_step=0.00692, global_step=8401.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  82%|████████▏ | 993/1208 [28:43<06:13,  1.74s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.19e-5, train/loss_step=0.00203, global_step=8402.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  82%|████████▏ | 994/1208 [28:44<06:11,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.19e-5, train/loss_step=0.00203, global_step=8402.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  82%|████████▏ | 994/1208 [28:44<06:11,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.22e-5, train/loss_step=0.0175, global_step=8402.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  82%|████████▏ | 995/1208 [28:45<06:09,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.22e-5, train/loss_step=0.0175, global_step=8402.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  82%|████████▏ | 995/1208 [28:45<06:09,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0661, train/loss_vlb_step=0.000226, train/loss_step=0.0661, global_step=8402.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  82%|████████▏ | 996/1208 [28:48<06:07,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0661, train/loss_vlb_step=0.000226, train/loss_step=0.0661, global_step=8402.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  82%|████████▏ | 996/1208 [28:48<06:07,  1.74s/it, loss=0.157, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000681, train/loss_step=0.196, global_step=8402.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  83%|████████▎ | 997/1208 [28:49<06:06,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000681, train/loss_step=0.196, global_step=8402.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  83%|████████▎ | 997/1208 [28:49<06:06,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00189, train/loss_step=0.357, global_step=8403.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  83%|████████▎ | 998/1208 [28:50<06:04,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00189, train/loss_step=0.357, global_step=8403.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  83%|████████▎ | 998/1208 [28:50<06:04,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=1.31e-5, train/loss_step=0.00224, global_step=8403.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  83%|████████▎ | 999/1208 [28:51<06:02,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=1.31e-5, train/loss_step=0.00224, global_step=8403.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  83%|████████▎ | 999/1208 [28:51<06:02,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00503, train/loss_vlb_step=2.57e-5, train/loss_step=0.00503, global_step=8403.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  83%|████████▎ | 1000/1208 [28:54<06:00,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00503, train/loss_vlb_step=2.57e-5, train/loss_step=0.00503, global_step=8403.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  83%|████████▎ | 1000/1208 [28:54<06:00,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.000162, train/loss_step=0.0441, global_step=8403.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  83%|████████▎ | 1001/1208 [28:55<05:58,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.000162, train/loss_step=0.0441, global_step=8403.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  83%|████████▎ | 1001/1208 [28:55<05:58,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0651, train/loss_vlb_step=0.000219, train/loss_step=0.0651, global_step=8404.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  83%|████████▎ | 1002/1208 [28:57<05:57,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0651, train/loss_vlb_step=0.000219, train/loss_step=0.0651, global_step=8404.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  83%|████████▎ | 1002/1208 [28:57<05:57,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000114, train/loss_step=0.0284, global_step=8404.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  83%|████████▎ | 1003/1208 [28:58<05:55,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000114, train/loss_step=0.0284, global_step=8404.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  83%|████████▎ | 1003/1208 [28:58<05:55,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000415, train/loss_step=0.126, global_step=8404.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  83%|████████▎ | 1004/1208 [29:01<05:53,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000415, train/loss_step=0.126, global_step=8404.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  83%|████████▎ | 1004/1208 [29:01<05:53,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00107, train/loss_step=0.263, global_step=8404.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  83%|████████▎ | 1005/1208 [29:02<05:51,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00107, train/loss_step=0.263, global_step=8404.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  83%|████████▎ | 1005/1208 [29:02<05:51,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.632, train/loss_vlb_step=0.0137, train/loss_step=0.632, global_step=8405.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  83%|████████▎ | 1006/1208 [29:03<05:50,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.632, train/loss_vlb_step=0.0137, train/loss_step=0.632, global_step=8405.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  83%|████████▎ | 1006/1208 [29:03<05:50,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.437, train/loss_vlb_step=0.00392, train/loss_step=0.437, global_step=8405.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  83%|████████▎ | 1007/1208 [29:04<05:48,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.437, train/loss_vlb_step=0.00392, train/loss_step=0.437, global_step=8405.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  83%|████████▎ | 1007/1208 [29:04<05:48,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00453, train/loss_vlb_step=2.31e-5, train/loss_step=0.00453, global_step=8405.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  83%|████████▎ | 1008/1208 [29:07<05:46,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00453, train/loss_vlb_step=2.31e-5, train/loss_step=0.00453, global_step=8405.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  83%|████████▎ | 1008/1208 [29:07<05:46,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00213, train/loss_step=0.356, global_step=8405.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  84%|████████▎ | 1009/1208 [29:08<05:44,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00213, train/loss_step=0.356, global_step=8405.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  84%|████████▎ | 1009/1208 [29:08<05:44,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=8406.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  84%|████████▎ | 1010/1208 [29:09<05:43,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=8406.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  84%|████████▎ | 1010/1208 [29:09<05:43,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.534, train/loss_vlb_step=0.00873, train/loss_step=0.534, global_step=8406.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  84%|████████▎ | 1011/1208 [29:11<05:41,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.534, train/loss_vlb_step=0.00873, train/loss_step=0.534, global_step=8406.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  84%|████████▎ | 1011/1208 [29:11<05:41,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00146, train/loss_step=0.301, global_step=8406.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  84%|████████▍ | 1012/1208 [29:14<05:39,  1.73s/it, loss=0.178, v_num=0, train/loss_simple_step=0.301, train/loss_vlb_step=0.00146, train/loss_step=0.301, global_step=8406.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  84%|████████▍ | 1012/1208 [29:14<05:39,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0535, train/loss_vlb_step=0.000186, train/loss_step=0.0535, global_step=8406.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  84%|████████▍ | 1013/1208 [29:15<05:37,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0535, train/loss_vlb_step=0.000186, train/loss_step=0.0535, global_step=8406.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  84%|████████▍ | 1013/1208 [29:15<05:37,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=8407.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  84%|████████▍ | 1014/1208 [29:16<05:36,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=8407.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  84%|████████▍ | 1014/1208 [29:16<05:36,  1.73s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.00014, train/loss_step=0.0395, global_step=8407.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  84%|████████▍ | 1015/1208 [29:17<05:34,  1.73s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.00014, train/loss_step=0.0395, global_step=8407.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  84%|████████▍ | 1015/1208 [29:17<05:34,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000377, train/loss_step=0.113, global_step=8407.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  84%|████████▍ | 1016/1208 [29:20<05:32,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000377, train/loss_step=0.113, global_step=8407.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  84%|████████▍ | 1016/1208 [29:20<05:32,  1.73s/it, loss=0.187, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000546, train/loss_step=0.162, global_step=8407.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  84%|████████▍ | 1017/1208 [29:21<05:30,  1.73s/it, loss=0.187, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000546, train/loss_step=0.162, global_step=8407.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  84%|████████▍ | 1017/1208 [29:21<05:30,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000534, train/loss_step=0.157, global_step=8408.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  84%|████████▍ | 1018/1208 [29:22<05:29,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000534, train/loss_step=0.157, global_step=8408.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  84%|████████▍ | 1018/1208 [29:22<05:29,  1.73s/it, loss=0.197, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00205, train/loss_step=0.384, global_step=8408.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  84%|████████▍ | 1019/1208 [29:23<05:27,  1.73s/it, loss=0.197, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00205, train/loss_step=0.384, global_step=8408.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  84%|████████▍ | 1019/1208 [29:23<05:27,  1.73s/it, loss=0.234, v_num=0, train/loss_simple_step=0.749, train/loss_vlb_step=0.0388, train/loss_step=0.749, global_step=8408.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  84%|████████▍ | 1020/1208 [29:27<05:25,  1.73s/it, loss=0.234, v_num=0, train/loss_simple_step=0.749, train/loss_vlb_step=0.0388, train/loss_step=0.749, global_step=8408.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  84%|████████▍ | 1020/1208 [29:27<05:25,  1.73s/it, loss=0.238, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000413, train/loss_step=0.126, global_step=8408.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  85%|████████▍ | 1021/1208 [29:28<05:23,  1.73s/it, loss=0.238, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000413, train/loss_step=0.126, global_step=8408.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  85%|████████▍ | 1021/1208 [29:28<05:23,  1.73s/it, loss=0.249, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00133, train/loss_step=0.281, global_step=8409.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  85%|████████▍ | 1022/1208 [29:29<05:22,  1.73s/it, loss=0.249, v_num=0, train/loss_simple_step=0.281, train/loss_vlb_step=0.00133, train/loss_step=0.281, global_step=8409.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  85%|████████▍ | 1022/1208 [29:29<05:22,  1.73s/it, loss=0.279, v_num=0, train/loss_simple_step=0.630, train/loss_vlb_step=0.0361, train/loss_step=0.630, global_step=8409.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  85%|████████▍ | 1023/1208 [29:30<05:20,  1.73s/it, loss=0.279, v_num=0, train/loss_simple_step=0.630, train/loss_vlb_step=0.0361, train/loss_step=0.630, global_step=8409.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  85%|████████▍ | 1023/1208 [29:30<05:20,  1.73s/it, loss=0.304, v_num=0, train/loss_simple_step=0.636, train/loss_vlb_step=0.0178, train/loss_step=0.636, global_step=8409.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  85%|████████▍ | 1024/1208 [29:33<05:18,  1.73s/it, loss=0.304, v_num=0, train/loss_simple_step=0.636, train/loss_vlb_step=0.0178, train/loss_step=0.636, global_step=8409.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  85%|████████▍ | 1024/1208 [29:33<05:18,  1.73s/it, loss=0.312, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.0028, train/loss_step=0.420, global_step=8409.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  85%|████████▍ | 1025/1208 [29:34<05:16,  1.73s/it, loss=0.312, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.0028, train/loss_step=0.420, global_step=8409.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  85%|████████▍ | 1025/1208 [29:34<05:16,  1.73s/it, loss=0.281, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.69e-5, train/loss_step=0.0125, global_step=8410.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  85%|████████▍ | 1026/1208 [29:35<05:15,  1.73s/it, loss=0.281, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.69e-5, train/loss_step=0.0125, global_step=8410.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  85%|████████▍ | 1026/1208 [29:35<05:15,  1.73s/it, loss=0.268, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000609, train/loss_step=0.172, global_step=8410.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  85%|████████▌ | 1027/1208 [29:36<05:13,  1.73s/it, loss=0.268, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000609, train/loss_step=0.172, global_step=8410.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  85%|████████▌ | 1027/1208 [29:36<05:13,  1.73s/it, loss=0.268, v_num=0, train/loss_simple_step=0.00419, train/loss_vlb_step=2.24e-5, train/loss_step=0.00419, global_step=8410.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  85%|████████▌ | 1028/1208 [29:40<05:11,  1.73s/it, loss=0.268, v_num=0, train/loss_simple_step=0.00419, train/loss_vlb_step=2.24e-5, train/loss_step=0.00419, global_step=8410.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  85%|████████▌ | 1028/1208 [29:40<05:11,  1.73s/it, loss=0.266, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00148, train/loss_step=0.311, global_step=8410.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  85%|████████▌ | 1029/1208 [29:41<05:09,  1.73s/it, loss=0.266, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00148, train/loss_step=0.311, global_step=8410.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  85%|████████▌ | 1029/1208 [29:41<05:09,  1.73s/it, loss=0.262, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000135, train/loss_step=0.0374, global_step=8411.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  85%|████████▌ | 1030/1208 [29:42<05:08,  1.73s/it, loss=0.262, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000135, train/loss_step=0.0374, global_step=8411.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  85%|████████▌ | 1030/1208 [29:42<05:08,  1.73s/it, loss=0.245, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000744, train/loss_step=0.202, global_step=8411.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  85%|████████▌ | 1031/1208 [29:43<05:06,  1.73s/it, loss=0.245, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000744, train/loss_step=0.202, global_step=8411.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  85%|████████▌ | 1031/1208 [29:43<05:06,  1.73s/it, loss=0.232, v_num=0, train/loss_simple_step=0.0469, train/loss_vlb_step=0.000162, train/loss_step=0.0469, global_step=8411.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  85%|████████▌ | 1032/1208 [29:46<05:04,  1.73s/it, loss=0.232, v_num=0, train/loss_simple_step=0.0469, train/loss_vlb_step=0.000162, train/loss_step=0.0469, global_step=8411.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  85%|████████▌ | 1032/1208 [29:46<05:04,  1.73s/it, loss=0.239, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000675, train/loss_step=0.189, global_step=8411.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  86%|████████▌ | 1033/1208 [29:47<05:02,  1.73s/it, loss=0.239, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000675, train/loss_step=0.189, global_step=8411.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  86%|████████▌ | 1033/1208 [29:47<05:02,  1.73s/it, loss=0.241, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.00054, train/loss_step=0.154, global_step=8412.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  86%|████████▌ | 1034/1208 [29:48<05:01,  1.73s/it, loss=0.241, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.00054, train/loss_step=0.154, global_step=8412.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  86%|████████▌ | 1034/1208 [29:48<05:01,  1.73s/it, loss=0.24, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.5e-5, train/loss_step=0.0126, global_step=8412.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  86%|████████▌ | 1035/1208 [29:49<04:59,  1.73s/it, loss=0.24, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.5e-5, train/loss_step=0.0126, global_step=8412.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  86%|████████▌ | 1035/1208 [29:49<04:59,  1.73s/it, loss=0.246, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.00103, train/loss_step=0.226, global_step=8412.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  86%|████████▌ | 1036/1208 [29:53<04:57,  1.73s/it, loss=0.246, v_num=0, train/loss_simple_step=0.226, train/loss_vlb_step=0.00103, train/loss_step=0.226, global_step=8412.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  86%|████████▌ | 1036/1208 [29:53<04:57,  1.73s/it, loss=0.247, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000704, train/loss_step=0.194, global_step=8412.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  86%|████████▌ | 1037/1208 [29:54<04:55,  1.73s/it, loss=0.247, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000704, train/loss_step=0.194, global_step=8412.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  86%|████████▌ | 1037/1208 [29:54<04:55,  1.73s/it, loss=0.24, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.21e-5, train/loss_step=0.0141, global_step=8413.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  86%|████████▌ | 1038/1208 [29:55<04:54,  1.73s/it, loss=0.24, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=6.21e-5, train/loss_step=0.0141, global_step=8413.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  86%|████████▌ | 1038/1208 [29:55<04:54,  1.73s/it, loss=0.234, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00131, train/loss_step=0.269, global_step=8413.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  86%|████████▌ | 1039/1208 [29:56<04:52,  1.73s/it, loss=0.234, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00131, train/loss_step=0.269, global_step=8413.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  86%|████████▌ | 1039/1208 [29:56<04:52,  1.73s/it, loss=0.212, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00173, train/loss_step=0.312, global_step=8413.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  86%|████████▌ | 1040/1208 [29:59<04:50,  1.73s/it, loss=0.212, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00173, train/loss_step=0.312, global_step=8413.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  86%|████████▌ | 1040/1208 [29:59<04:50,  1.73s/it, loss=0.216, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000649, train/loss_step=0.191, global_step=8413.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  86%|████████▌ | 1041/1208 [30:00<04:48,  1.73s/it, loss=0.216, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000649, train/loss_step=0.191, global_step=8413.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  86%|████████▌ | 1041/1208 [30:00<04:48,  1.73s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000107, train/loss_step=0.0268, global_step=8414.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  86%|████████▋ | 1042/1208 [30:01<04:47,  1.73s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000107, train/loss_step=0.0268, global_step=8414.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  86%|████████▋ | 1042/1208 [30:01<04:47,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00882, train/loss_vlb_step=4.09e-5, train/loss_step=0.00882, global_step=8414.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  86%|████████▋ | 1043/1208 [30:02<04:45,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00882, train/loss_vlb_step=4.09e-5, train/loss_step=0.00882, global_step=8414.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  86%|████████▋ | 1043/1208 [30:02<04:45,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=8414.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  86%|████████▋ | 1044/1208 [30:05<04:43,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=8414.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  86%|████████▋ | 1044/1208 [30:05<04:43,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00487, train/loss_step=0.476, global_step=8414.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  87%|████████▋ | 1045/1208 [30:07<04:41,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00487, train/loss_step=0.476, global_step=8414.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  87%|████████▋ | 1045/1208 [30:07<04:41,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0825, train/loss_vlb_step=0.000272, train/loss_step=0.0825, global_step=8415.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  87%|████████▋ | 1046/1208 [30:08<04:40,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0825, train/loss_vlb_step=0.000272, train/loss_step=0.0825, global_step=8415.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  87%|████████▋ | 1046/1208 [30:08<04:40,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.86e-5, train/loss_step=0.0162, global_step=8415.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  87%|████████▋ | 1047/1208 [30:09<04:38,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.86e-5, train/loss_step=0.0162, global_step=8415.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  87%|████████▋ | 1047/1208 [30:09<04:38,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0899, train/loss_vlb_step=0.000296, train/loss_step=0.0899, global_step=8415.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  87%|████████▋ | 1048/1208 [30:12<04:36,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0899, train/loss_vlb_step=0.000296, train/loss_step=0.0899, global_step=8415.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  87%|████████▋ | 1048/1208 [30:12<04:36,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00315, train/loss_step=0.412, global_step=8415.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  87%|████████▋ | 1049/1208 [30:13<04:34,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.00315, train/loss_step=0.412, global_step=8415.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  87%|████████▋ | 1049/1208 [30:13<04:34,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00124, train/loss_step=0.282, global_step=8416.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  87%|████████▋ | 1050/1208 [30:14<04:33,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.00124, train/loss_step=0.282, global_step=8416.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  87%|████████▋ | 1050/1208 [30:14<04:33,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0789, train/loss_vlb_step=0.000264, train/loss_step=0.0789, global_step=8416.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  87%|████████▋ | 1051/1208 [30:15<04:31,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0789, train/loss_vlb_step=0.000264, train/loss_step=0.0789, global_step=8416.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  87%|████████▋ | 1051/1208 [30:15<04:31,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0516, train/loss_vlb_step=0.00018, train/loss_step=0.0516, global_step=8416.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  87%|████████▋ | 1052/1208 [30:18<04:29,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0516, train/loss_vlb_step=0.00018, train/loss_step=0.0516, global_step=8416.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  87%|████████▋ | 1052/1208 [30:18<04:29,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.464, train/loss_vlb_step=0.00422, train/loss_step=0.464, global_step=8416.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  87%|████████▋ | 1053/1208 [30:19<04:27,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.464, train/loss_vlb_step=0.00422, train/loss_step=0.464, global_step=8416.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  87%|████████▋ | 1053/1208 [30:19<04:27,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00101, train/loss_step=0.257, global_step=8417.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  87%|████████▋ | 1054/1208 [30:21<04:26,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00101, train/loss_step=0.257, global_step=8417.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  87%|████████▋ | 1054/1208 [30:21<04:26,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0509, train/loss_vlb_step=0.000179, train/loss_step=0.0509, global_step=8417.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  87%|████████▋ | 1055/1208 [30:22<04:24,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0509, train/loss_vlb_step=0.000179, train/loss_step=0.0509, global_step=8417.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  87%|████████▋ | 1055/1208 [30:22<04:24,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00554, train/loss_vlb_step=2.86e-5, train/loss_step=0.00554, global_step=8417.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  87%|████████▋ | 1056/1208 [30:25<04:22,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00554, train/loss_vlb_step=2.86e-5, train/loss_step=0.00554, global_step=8417.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  87%|████████▋ | 1056/1208 [30:25<04:22,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.582, train/loss_vlb_step=0.0163, train/loss_step=0.582, global_step=8417.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  88%|████████▊ | 1057/1208 [30:26<04:20,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.582, train/loss_vlb_step=0.0163, train/loss_step=0.582, global_step=8417.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  88%|████████▊ | 1057/1208 [30:26<04:20,  1.73s/it, loss=0.201, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00104, train/loss_step=0.237, global_step=8418.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  88%|████████▊ | 1058/1208 [30:27<04:19,  1.73s/it, loss=0.201, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00104, train/loss_step=0.237, global_step=8418.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  88%|████████▊ | 1058/1208 [30:27<04:19,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000618, train/loss_step=0.181, global_step=8418.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  88%|████████▊ | 1059/1208 [30:28<04:17,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000618, train/loss_step=0.181, global_step=8418.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  88%|████████▊ | 1059/1208 [30:28<04:17,  1.73s/it, loss=0.187, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000397, train/loss_step=0.120, global_step=8418.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  88%|████████▊ | 1060/1208 [30:31<04:15,  1.73s/it, loss=0.187, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000397, train/loss_step=0.120, global_step=8418.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  88%|████████▊ | 1060/1208 [30:31<04:15,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0331, train/loss_vlb_step=0.000125, train/loss_step=0.0331, global_step=8418.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  88%|████████▊ | 1061/1208 [30:32<04:13,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0331, train/loss_vlb_step=0.000125, train/loss_step=0.0331, global_step=8418.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  88%|████████▊ | 1061/1208 [30:32<04:13,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0884, train/loss_vlb_step=0.000292, train/loss_step=0.0884, global_step=8419.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  88%|████████▊ | 1062/1208 [30:34<04:12,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0884, train/loss_vlb_step=0.000292, train/loss_step=0.0884, global_step=8419.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  88%|████████▊ | 1062/1208 [30:34<04:12,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000509, train/loss_step=0.150, global_step=8419.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  88%|████████▊ | 1063/1208 [30:35<04:10,  1.73s/it, loss=0.189, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000509, train/loss_step=0.150, global_step=8419.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  88%|████████▊ | 1063/1208 [30:35<04:10,  1.73s/it, loss=0.202, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00278, train/loss_step=0.381, global_step=8419.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  88%|████████▊ | 1064/1208 [30:38<04:08,  1.73s/it, loss=0.202, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00278, train/loss_step=0.381, global_step=8419.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  88%|████████▊ | 1064/1208 [30:38<04:08,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.14e-5, train/loss_step=0.0114, global_step=8419.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  88%|████████▊ | 1065/1208 [30:39<04:06,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.14e-5, train/loss_step=0.0114, global_step=8419.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  88%|████████▊ | 1065/1208 [30:39<04:06,  1.73s/it, loss=0.19, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00163, train/loss_step=0.308, global_step=8420.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  88%|████████▊ | 1066/1208 [30:40<04:05,  1.73s/it, loss=0.19, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00163, train/loss_step=0.308, global_step=8420.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  88%|████████▊ | 1066/1208 [30:40<04:05,  1.73s/it, loss=0.214, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00413, train/loss_step=0.499, global_step=8420.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  88%|████████▊ | 1067/1208 [30:41<04:03,  1.73s/it, loss=0.214, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00413, train/loss_step=0.499, global_step=8420.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  88%|████████▊ | 1067/1208 [30:41<04:03,  1.73s/it, loss=0.212, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.000165, train/loss_step=0.0462, global_step=8420.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  88%|████████▊ | 1068/1208 [30:44<04:01,  1.73s/it, loss=0.212, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.000165, train/loss_step=0.0462, global_step=8420.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  88%|████████▊ | 1068/1208 [30:44<04:01,  1.73s/it, loss=0.2, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000655, train/loss_step=0.178, global_step=8420.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  88%|████████▊ | 1069/1208 [30:45<04:00,  1.73s/it, loss=0.2, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000655, train/loss_step=0.178, global_step=8420.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  88%|████████▊ | 1069/1208 [30:45<04:00,  1.73s/it, loss=0.194, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.00053, train/loss_step=0.157, global_step=8421.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  89%|████████▊ | 1070/1208 [30:46<03:58,  1.73s/it, loss=0.194, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.00053, train/loss_step=0.157, global_step=8421.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  89%|████████▊ | 1070/1208 [30:46<03:58,  1.73s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0941, train/loss_vlb_step=0.00031, train/loss_step=0.0941, global_step=8421.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  89%|████████▊ | 1071/1208 [30:47<03:56,  1.73s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0941, train/loss_vlb_step=0.00031, train/loss_step=0.0941, global_step=8421.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  89%|████████▊ | 1071/1208 [30:47<03:56,  1.73s/it, loss=0.204, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00105, train/loss_step=0.243, global_step=8421.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  89%|████████▊ | 1072/1208 [30:51<03:54,  1.73s/it, loss=0.204, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00105, train/loss_step=0.243, global_step=8421.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  89%|████████▊ | 1072/1208 [30:51<03:54,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.047, train/loss_vlb_step=0.000167, train/loss_step=0.047, global_step=8421.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  89%|████████▉ | 1073/1208 [30:52<03:53,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.047, train/loss_vlb_step=0.000167, train/loss_step=0.047, global_step=8421.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  89%|████████▉ | 1073/1208 [30:52<03:53,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000418, train/loss_step=0.125, global_step=8422.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  89%|████████▉ | 1074/1208 [30:53<03:51,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000418, train/loss_step=0.125, global_step=8422.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  89%|████████▉ | 1074/1208 [30:53<03:51,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=2.09e-5, train/loss_step=0.00378, global_step=8422.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  89%|████████▉ | 1075/1208 [30:54<03:49,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=2.09e-5, train/loss_step=0.00378, global_step=8422.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  89%|████████▉ | 1075/1208 [30:54<03:49,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=8422.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  89%|████████▉ | 1076/1208 [30:57<03:47,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=8422.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  89%|████████▉ | 1076/1208 [30:57<03:47,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000794, train/loss_step=0.215, global_step=8422.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  89%|████████▉ | 1077/1208 [30:58<03:46,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000794, train/loss_step=0.215, global_step=8422.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  89%|████████▉ | 1077/1208 [30:58<03:46,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000606, train/loss_step=0.171, global_step=8423.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  89%|████████▉ | 1078/1208 [30:59<03:44,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000606, train/loss_step=0.171, global_step=8423.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  89%|████████▉ | 1078/1208 [30:59<03:44,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000438, train/loss_step=0.133, global_step=8423.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  89%|████████▉ | 1079/1208 [31:00<03:42,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000438, train/loss_step=0.133, global_step=8423.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  89%|████████▉ | 1079/1208 [31:00<03:42,  1.72s/it, loss=0.165, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00173, train/loss_step=0.307, global_step=8423.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  89%|████████▉ | 1080/1208 [31:04<03:40,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00173, train/loss_step=0.307, global_step=8423.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  89%|████████▉ | 1080/1208 [31:04<03:40,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0956, train/loss_vlb_step=0.000315, train/loss_step=0.0956, global_step=8423.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  89%|████████▉ | 1081/1208 [31:05<03:39,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0956, train/loss_vlb_step=0.000315, train/loss_step=0.0956, global_step=8423.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  89%|████████▉ | 1081/1208 [31:05<03:39,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00104, train/loss_step=0.257, global_step=8424.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  90%|████████▉ | 1082/1208 [31:06<03:37,  1.72s/it, loss=0.177, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00104, train/loss_step=0.257, global_step=8424.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  90%|████████▉ | 1082/1208 [31:06<03:37,  1.72s/it, loss=0.18, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000727, train/loss_step=0.202, global_step=8424.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  90%|████████▉ | 1083/1208 [31:07<03:35,  1.72s/it, loss=0.18, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000727, train/loss_step=0.202, global_step=8424.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  90%|████████▉ | 1083/1208 [31:07<03:35,  1.72s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.000186, train/loss_step=0.0537, global_step=8424.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  90%|████████▉ | 1084/1208 [31:10<03:33,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0537, train/loss_vlb_step=0.000186, train/loss_step=0.0537, global_step=8424.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  90%|████████▉ | 1084/1208 [31:10<03:33,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=8424.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  90%|████████▉ | 1085/1208 [31:11<03:32,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.000412, train/loss_step=0.125, global_step=8424.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  90%|████████▉ | 1085/1208 [31:11<03:32,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.000986, train/loss_step=0.247, global_step=8425.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  90%|████████▉ | 1086/1208 [31:12<03:30,  1.72s/it, loss=0.166, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.000986, train/loss_step=0.247, global_step=8425.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  90%|████████▉ | 1086/1208 [31:12<03:30,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000453, train/loss_step=0.134, global_step=8425.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  90%|████████▉ | 1087/1208 [31:13<03:28,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000453, train/loss_step=0.134, global_step=8425.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  90%|████████▉ | 1087/1208 [31:13<03:28,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00215, train/loss_step=0.343, global_step=8425.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  90%|█████████ | 1088/1208 [31:16<03:27,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00215, train/loss_step=0.343, global_step=8425.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  90%|█████████ | 1088/1208 [31:16<03:27,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000498, train/loss_step=0.150, global_step=8425.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  90%|█████████ | 1089/1208 [31:18<03:25,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000498, train/loss_step=0.150, global_step=8425.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  90%|█████████ | 1089/1208 [31:18<03:25,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00509, train/loss_vlb_step=2.65e-5, train/loss_step=0.00509, global_step=8426.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  90%|█████████ | 1090/1208 [31:19<03:23,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00509, train/loss_vlb_step=2.65e-5, train/loss_step=0.00509, global_step=8426.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  90%|█████████ | 1090/1208 [31:19<03:23,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.26e-5, train/loss_step=0.00215, global_step=8426.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  90%|█████████ | 1091/1208 [31:20<03:21,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.26e-5, train/loss_step=0.00215, global_step=8426.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  90%|█████████ | 1091/1208 [31:20<03:21,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000895, train/loss_step=0.233, global_step=8426.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  90%|█████████ | 1092/1208 [31:23<03:20,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000895, train/loss_step=0.233, global_step=8426.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  90%|█████████ | 1092/1208 [31:23<03:20,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.730, train/loss_vlb_step=0.0418, train/loss_step=0.730, global_step=8426.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  90%|█████████ | 1093/1208 [31:24<03:18,  1.72s/it, loss=0.183, v_num=0, train/loss_simple_step=0.730, train/loss_vlb_step=0.0418, train/loss_step=0.730, global_step=8426.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  90%|█████████ | 1093/1208 [31:24<03:18,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000395, train/loss_step=0.119, global_step=8427.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  91%|█████████ | 1094/1208 [31:25<03:16,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000395, train/loss_step=0.119, global_step=8427.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  91%|█████████ | 1094/1208 [31:25<03:16,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.000118, train/loss_step=0.0316, global_step=8427.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  91%|█████████ | 1095/1208 [31:26<03:14,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0316, train/loss_vlb_step=0.000118, train/loss_step=0.0316, global_step=8427.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  91%|█████████ | 1095/1208 [31:26<03:14,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000386, train/loss_step=0.116, global_step=8427.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  91%|█████████ | 1096/1208 [31:29<03:13,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000386, train/loss_step=0.116, global_step=8427.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  91%|█████████ | 1096/1208 [31:29<03:13,  1.72s/it, loss=0.185, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000795, train/loss_step=0.237, global_step=8427.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  91%|█████████ | 1097/1208 [31:30<03:11,  1.72s/it, loss=0.185, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000795, train/loss_step=0.237, global_step=8427.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  91%|█████████ | 1097/1208 [31:30<03:11,  1.72s/it, loss=0.195, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00211, train/loss_step=0.374, global_step=8428.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  91%|█████████ | 1098/1208 [31:31<03:09,  1.72s/it, loss=0.195, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00211, train/loss_step=0.374, global_step=8428.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  91%|█████████ | 1098/1208 [31:31<03:09,  1.72s/it, loss=0.207, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00214, train/loss_step=0.375, global_step=8428.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  91%|█████████ | 1099/1208 [31:33<03:07,  1.72s/it, loss=0.207, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00214, train/loss_step=0.375, global_step=8428.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  91%|█████████ | 1099/1208 [31:33<03:07,  1.72s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.58e-5, train/loss_step=0.00277, global_step=8428.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  91%|█████████ | 1100/1208 [31:36<03:06,  1.72s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.58e-5, train/loss_step=0.00277, global_step=8428.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  91%|█████████ | 1100/1208 [31:36<03:06,  1.72s/it, loss=0.204, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00253, train/loss_step=0.349, global_step=8428.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  91%|█████████ | 1101/1208 [31:37<03:04,  1.72s/it, loss=0.204, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00253, train/loss_step=0.349, global_step=8428.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  91%|█████████ | 1101/1208 [31:37<03:04,  1.72s/it, loss=0.209, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00195, train/loss_step=0.352, global_step=8429.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  91%|█████████ | 1102/1208 [31:38<03:02,  1.72s/it, loss=0.209, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00195, train/loss_step=0.352, global_step=8429.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  91%|█████████ | 1102/1208 [31:38<03:02,  1.72s/it, loss=0.211, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000959, train/loss_step=0.248, global_step=8429.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  91%|█████████▏| 1103/1208 [31:39<03:00,  1.72s/it, loss=0.211, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.000959, train/loss_step=0.248, global_step=8429.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  91%|█████████▏| 1103/1208 [31:39<03:00,  1.72s/it, loss=0.213, v_num=0, train/loss_simple_step=0.0949, train/loss_vlb_step=0.000313, train/loss_step=0.0949, global_step=8429.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  91%|█████████▏| 1104/1208 [31:42<02:59,  1.72s/it, loss=0.213, v_num=0, train/loss_simple_step=0.0949, train/loss_vlb_step=0.000313, train/loss_step=0.0949, global_step=8429.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  91%|█████████▏| 1104/1208 [31:42<02:59,  1.72s/it, loss=0.207, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=1.68e-5, train/loss_step=0.00295, global_step=8429.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  91%|█████████▏| 1105/1208 [31:43<02:57,  1.72s/it, loss=0.207, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=1.68e-5, train/loss_step=0.00295, global_step=8429.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  91%|█████████▏| 1105/1208 [31:43<02:57,  1.72s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0723, train/loss_vlb_step=0.000246, train/loss_step=0.0723, global_step=8430.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  92%|█████████▏| 1106/1208 [31:44<02:55,  1.72s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0723, train/loss_vlb_step=0.000246, train/loss_step=0.0723, global_step=8430.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  92%|█████████▏| 1106/1208 [31:44<02:55,  1.72s/it, loss=0.21, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00188, train/loss_step=0.372, global_step=8430.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  92%|█████████▏| 1107/1208 [31:46<02:53,  1.72s/it, loss=0.21, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.00188, train/loss_step=0.372, global_step=8430.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  92%|█████████▏| 1107/1208 [31:46<02:53,  1.72s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=1.1e-5, train/loss_step=0.00181, global_step=8430.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  92%|█████████▏| 1108/1208 [31:49<02:52,  1.72s/it, loss=0.193, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=1.1e-5, train/loss_step=0.00181, global_step=8430.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  92%|█████████▏| 1108/1208 [31:49<02:52,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0486, train/loss_vlb_step=0.000162, train/loss_step=0.0486, global_step=8430.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  92%|█████████▏| 1109/1208 [31:50<02:50,  1.72s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0486, train/loss_vlb_step=0.000162, train/loss_step=0.0486, global_step=8430.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  92%|█████████▏| 1109/1208 [31:50<02:50,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.43e-5, train/loss_step=0.0118, global_step=8431.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  92%|█████████▏| 1110/1208 [31:51<02:48,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.43e-5, train/loss_step=0.0118, global_step=8431.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  92%|█████████▏| 1110/1208 [31:51<02:48,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.24e-5, train/loss_step=0.0021, global_step=8431.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  92%|█████████▏| 1111/1208 [31:52<02:46,  1.72s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.24e-5, train/loss_step=0.0021, global_step=8431.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  92%|█████████▏| 1111/1208 [31:52<02:46,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0946, train/loss_vlb_step=0.000312, train/loss_step=0.0946, global_step=8431.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  92%|█████████▏| 1112/1208 [31:55<02:45,  1.72s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0946, train/loss_vlb_step=0.000312, train/loss_step=0.0946, global_step=8431.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  92%|█████████▏| 1112/1208 [31:55<02:45,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000493, train/loss_step=0.148, global_step=8431.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  92%|█████████▏| 1113/1208 [31:56<02:43,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000493, train/loss_step=0.148, global_step=8431.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  92%|█████████▏| 1113/1208 [31:56<02:43,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=7.17e-5, train/loss_step=0.0164, global_step=8432.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  92%|█████████▏| 1114/1208 [31:57<02:41,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=7.17e-5, train/loss_step=0.0164, global_step=8432.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  92%|█████████▏| 1114/1208 [31:57<02:41,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000487, train/loss_step=0.145, global_step=8432.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  92%|█████████▏| 1115/1208 [31:58<02:40,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000487, train/loss_step=0.145, global_step=8432.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  92%|█████████▏| 1115/1208 [31:58<02:40,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00116, train/loss_step=0.265, global_step=8432.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  92%|█████████▏| 1116/1208 [32:02<02:38,  1.72s/it, loss=0.161, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00116, train/loss_step=0.265, global_step=8432.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  92%|█████████▏| 1116/1208 [32:02<02:38,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0532, train/loss_vlb_step=0.000183, train/loss_step=0.0532, global_step=8432.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  92%|█████████▏| 1117/1208 [32:03<02:36,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0532, train/loss_vlb_step=0.000183, train/loss_step=0.0532, global_step=8432.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  92%|█████████▏| 1117/1208 [32:03<02:36,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.001, train/loss_step=0.245, global_step=8433.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]     Epoch 27:  93%|█████████▎| 1118/1208 [32:04<02:34,  1.72s/it, loss=0.145, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.001, train/loss_step=0.245, global_step=8433.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  93%|█████████▎| 1118/1208 [32:04<02:34,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0559, train/loss_vlb_step=0.000195, train/loss_step=0.0559, global_step=8433.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  93%|█████████▎| 1119/1208 [32:05<02:33,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0559, train/loss_vlb_step=0.000195, train/loss_step=0.0559, global_step=8433.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  93%|█████████▎| 1119/1208 [32:05<02:33,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=2.1e-5, train/loss_step=0.00405, global_step=8433.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  93%|█████████▎| 1120/1208 [32:08<02:31,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=2.1e-5, train/loss_step=0.00405, global_step=8433.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  93%|█████████▎| 1120/1208 [32:08<02:31,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000645, train/loss_step=0.173, global_step=8433.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  93%|█████████▎| 1121/1208 [32:09<02:29,  1.72s/it, loss=0.12, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000645, train/loss_step=0.173, global_step=8433.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  93%|█████████▎| 1121/1208 [32:09<02:29,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.072, train/loss_vlb_step=0.000241, train/loss_step=0.072, global_step=8434.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  93%|█████████▎| 1122/1208 [32:10<02:27,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.072, train/loss_vlb_step=0.000241, train/loss_step=0.072, global_step=8434.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  93%|█████████▎| 1122/1208 [32:10<02:27,  1.72s/it, loss=0.099, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000337, train/loss_step=0.103, global_step=8434.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  93%|█████████▎| 1123/1208 [32:11<02:26,  1.72s/it, loss=0.099, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000337, train/loss_step=0.103, global_step=8434.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  93%|█████████▎| 1123/1208 [32:11<02:26,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000573, train/loss_step=0.162, global_step=8434.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  93%|█████████▎| 1124/1208 [32:14<02:24,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000573, train/loss_step=0.162, global_step=8434.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  93%|█████████▎| 1124/1208 [32:14<02:24,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00114, train/loss_step=0.259, global_step=8434.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  93%|█████████▎| 1125/1208 [32:15<02:22,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00114, train/loss_step=0.259, global_step=8434.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  93%|█████████▎| 1125/1208 [32:15<02:22,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00083, train/loss_step=0.237, global_step=8435.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  93%|█████████▎| 1126/1208 [32:17<02:21,  1.72s/it, loss=0.123, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00083, train/loss_step=0.237, global_step=8435.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  93%|█████████▎| 1126/1208 [32:17<02:21,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0834, train/loss_vlb_step=0.000276, train/loss_step=0.0834, global_step=8435.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  93%|█████████▎| 1127/1208 [32:18<02:19,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0834, train/loss_vlb_step=0.000276, train/loss_step=0.0834, global_step=8435.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  93%|█████████▎| 1127/1208 [32:18<02:19,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000374, train/loss_step=0.114, global_step=8435.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  93%|█████████▎| 1128/1208 [32:21<02:17,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000374, train/loss_step=0.114, global_step=8435.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  93%|█████████▎| 1128/1208 [32:21<02:17,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000139, train/loss_step=0.0387, global_step=8435.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  93%|█████████▎| 1129/1208 [32:22<02:15,  1.72s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.000139, train/loss_step=0.0387, global_step=8435.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  93%|█████████▎| 1129/1208 [32:22<02:15,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.358, train/loss_vlb_step=0.00237, train/loss_step=0.358, global_step=8436.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  94%|█████████▎| 1130/1208 [32:23<02:14,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.358, train/loss_vlb_step=0.00237, train/loss_step=0.358, global_step=8436.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  94%|█████████▎| 1130/1208 [32:23<02:14,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0751, train/loss_vlb_step=0.000259, train/loss_step=0.0751, global_step=8436.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  94%|█████████▎| 1131/1208 [32:24<02:12,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0751, train/loss_vlb_step=0.000259, train/loss_step=0.0751, global_step=8436.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  94%|█████████▎| 1131/1208 [32:24<02:12,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000935, train/loss_step=0.229, global_step=8436.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  94%|█████████▎| 1132/1208 [32:27<02:10,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000935, train/loss_step=0.229, global_step=8436.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  94%|█████████▎| 1132/1208 [32:27<02:10,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.34e-5, train/loss_step=0.0143, global_step=8436.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  94%|█████████▍| 1133/1208 [32:28<02:09,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=6.34e-5, train/loss_step=0.0143, global_step=8436.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  94%|█████████▍| 1133/1208 [32:28<02:09,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00114, train/loss_step=0.291, global_step=8437.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  94%|█████████▍| 1134/1208 [32:30<02:07,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00114, train/loss_step=0.291, global_step=8437.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  94%|█████████▍| 1134/1208 [32:30<02:07,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=1.39e-5, train/loss_step=0.00234, global_step=8437.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  94%|█████████▍| 1135/1208 [32:31<02:05,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=1.39e-5, train/loss_step=0.00234, global_step=8437.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  94%|█████████▍| 1135/1208 [32:31<02:05,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000429, train/loss_step=0.130, global_step=8437.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  94%|█████████▍| 1136/1208 [32:34<02:03,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000429, train/loss_step=0.130, global_step=8437.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  94%|█████████▍| 1136/1208 [32:34<02:03,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000617, train/loss_step=0.173, global_step=8437.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  94%|█████████▍| 1137/1208 [32:35<02:02,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000617, train/loss_step=0.173, global_step=8437.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  94%|█████████▍| 1137/1208 [32:35<02:02,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.000209, train/loss_step=0.062, global_step=8438.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  94%|█████████▍| 1138/1208 [32:36<02:00,  1.72s/it, loss=0.132, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.000209, train/loss_step=0.062, global_step=8438.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  94%|█████████▍| 1138/1208 [32:36<02:00,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00331, train/loss_step=0.408, global_step=8438.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  94%|█████████▍| 1139/1208 [32:37<01:58,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00331, train/loss_step=0.408, global_step=8438.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  94%|█████████▍| 1139/1208 [32:37<01:58,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=8.19e-6, train/loss_step=0.00135, global_step=8438.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  94%|█████████▍| 1140/1208 [32:40<01:56,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=8.19e-6, train/loss_step=0.00135, global_step=8438.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  94%|█████████▍| 1140/1208 [32:40<01:56,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=1.83e-5, train/loss_step=0.00322, global_step=8438.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  94%|█████████▍| 1141/1208 [32:41<01:55,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=1.83e-5, train/loss_step=0.00322, global_step=8438.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  94%|█████████▍| 1141/1208 [32:41<01:55,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00135, train/loss_step=0.284, global_step=8439.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  95%|█████████▍| 1142/1208 [32:42<01:53,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00135, train/loss_step=0.284, global_step=8439.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  95%|█████████▍| 1142/1208 [32:42<01:53,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000655, train/loss_step=0.170, global_step=8439.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  95%|█████████▍| 1143/1208 [32:43<01:51,  1.72s/it, loss=0.155, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000655, train/loss_step=0.170, global_step=8439.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  95%|█████████▍| 1143/1208 [32:43<01:51,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000641, train/loss_step=0.180, global_step=8439.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  95%|█████████▍| 1144/1208 [32:47<01:50,  1.72s/it, loss=0.156, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000641, train/loss_step=0.180, global_step=8439.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  95%|█████████▍| 1144/1208 [32:47<01:50,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00252, train/loss_vlb_step=1.49e-5, train/loss_step=0.00252, global_step=8439.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  95%|█████████▍| 1145/1208 [32:48<01:48,  1.72s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00252, train/loss_vlb_step=1.49e-5, train/loss_step=0.00252, global_step=8439.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  95%|█████████▍| 1145/1208 [32:48<01:48,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000763, train/loss_step=0.215, global_step=8440.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  95%|█████████▍| 1146/1208 [32:49<01:46,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000763, train/loss_step=0.215, global_step=8440.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  95%|█████████▍| 1146/1208 [32:49<01:46,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.88e-5, train/loss_step=0.0164, global_step=8440.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  95%|█████████▍| 1147/1208 [32:50<01:44,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.88e-5, train/loss_step=0.0164, global_step=8440.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  95%|█████████▍| 1147/1208 [32:50<01:44,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=8440.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  95%|█████████▌| 1148/1208 [32:53<01:43,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.000389, train/loss_step=0.118, global_step=8440.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  95%|█████████▌| 1148/1208 [32:53<01:43,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0788, train/loss_vlb_step=0.000265, train/loss_step=0.0788, global_step=8440.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  95%|█████████▌| 1149/1208 [32:54<01:41,  1.72s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0788, train/loss_vlb_step=0.000265, train/loss_step=0.0788, global_step=8440.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  95%|█████████▌| 1149/1208 [32:54<01:41,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0855, train/loss_vlb_step=0.000284, train/loss_step=0.0855, global_step=8441.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  95%|█████████▌| 1150/1208 [32:56<01:39,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0855, train/loss_vlb_step=0.000284, train/loss_step=0.0855, global_step=8441.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  95%|█████████▌| 1150/1208 [32:56<01:39,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.00037, train/loss_step=0.112, global_step=8441.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  95%|█████████▌| 1151/1208 [32:57<01:37,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.00037, train/loss_step=0.112, global_step=8441.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  95%|█████████▌| 1151/1208 [32:57<01:37,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.0013, train/loss_step=0.273, global_step=8441.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  95%|█████████▌| 1152/1208 [33:00<01:36,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.0013, train/loss_step=0.273, global_step=8441.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  95%|█████████▌| 1152/1208 [33:00<01:36,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00631, train/loss_vlb_step=3.11e-5, train/loss_step=0.00631, global_step=8441.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  95%|█████████▌| 1153/1208 [33:01<01:34,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00631, train/loss_vlb_step=3.11e-5, train/loss_step=0.00631, global_step=8441.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  95%|█████████▌| 1153/1208 [33:01<01:34,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000651, train/loss_step=0.181, global_step=8442.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  96%|█████████▌| 1154/1208 [33:02<01:32,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000651, train/loss_step=0.181, global_step=8442.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  96%|█████████▌| 1154/1208 [33:02<01:32,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00736, train/loss_vlb_step=3.48e-5, train/loss_step=0.00736, global_step=8442.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  96%|█████████▌| 1155/1208 [33:03<01:31,  1.72s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00736, train/loss_vlb_step=3.48e-5, train/loss_step=0.00736, global_step=8442.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  96%|█████████▌| 1155/1208 [33:03<01:31,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00151, train/loss_step=0.316, global_step=8442.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  96%|█████████▌| 1156/1208 [33:06<01:29,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.316, train/loss_vlb_step=0.00151, train/loss_step=0.316, global_step=8442.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  96%|█████████▌| 1156/1208 [33:06<01:29,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0609, train/loss_vlb_step=0.000212, train/loss_step=0.0609, global_step=8442.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  96%|█████████▌| 1157/1208 [33:07<01:27,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0609, train/loss_vlb_step=0.000212, train/loss_step=0.0609, global_step=8442.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  96%|█████████▌| 1157/1208 [33:07<01:27,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.88e-5, train/loss_step=0.0101, global_step=8443.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  96%|█████████▌| 1158/1208 [33:09<01:25,  1.72s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.88e-5, train/loss_step=0.0101, global_step=8443.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  96%|█████████▌| 1158/1208 [33:09<01:25,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00289, train/loss_step=0.403, global_step=8443.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  96%|█████████▌| 1159/1208 [33:10<01:24,  1.72s/it, loss=0.126, v_num=0, train/loss_simple_step=0.403, train/loss_vlb_step=0.00289, train/loss_step=0.403, global_step=8443.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  96%|█████████▌| 1159/1208 [33:10<01:24,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000961, train/loss_step=0.238, global_step=8443.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  96%|█████████▌| 1160/1208 [33:13<01:22,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000961, train/loss_step=0.238, global_step=8443.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  96%|█████████▌| 1160/1208 [33:13<01:22,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000518, train/loss_step=0.155, global_step=8443.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  96%|█████████▌| 1161/1208 [33:14<01:20,  1.72s/it, loss=0.146, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000518, train/loss_step=0.155, global_step=8443.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  96%|█████████▌| 1161/1208 [33:14<01:20,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00102, train/loss_step=0.257, global_step=8444.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  96%|█████████▌| 1162/1208 [33:15<01:18,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.257, train/loss_vlb_step=0.00102, train/loss_step=0.257, global_step=8444.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  96%|█████████▌| 1162/1208 [33:15<01:18,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000124, train/loss_step=0.0337, global_step=8444.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  96%|█████████▋| 1163/1208 [33:16<01:17,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000124, train/loss_step=0.0337, global_step=8444.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  96%|█████████▋| 1163/1208 [33:16<01:17,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00438, train/loss_vlb_step=2.33e-5, train/loss_step=0.00438, global_step=8444.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  96%|█████████▋| 1164/1208 [33:19<01:15,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00438, train/loss_vlb_step=2.33e-5, train/loss_step=0.00438, global_step=8444.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  96%|█████████▋| 1164/1208 [33:19<01:15,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000432, train/loss_step=0.129, global_step=8444.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  96%|█████████▋| 1165/1208 [33:20<01:13,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000432, train/loss_step=0.129, global_step=8444.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  96%|█████████▋| 1165/1208 [33:20<01:13,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000835, train/loss_step=0.213, global_step=8445.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  97%|█████████▋| 1166/1208 [33:21<01:12,  1.72s/it, loss=0.135, v_num=0, train/loss_simple_step=0.213, train/loss_vlb_step=0.000835, train/loss_step=0.213, global_step=8445.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  97%|█████████▋| 1166/1208 [33:21<01:12,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0659, train/loss_vlb_step=0.000221, train/loss_step=0.0659, global_step=8445.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  97%|█████████▋| 1167/1208 [33:23<01:10,  1.72s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0659, train/loss_vlb_step=0.000221, train/loss_step=0.0659, global_step=8445.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  97%|█████████▋| 1167/1208 [33:23<01:10,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000424, train/loss_step=0.128, global_step=8445.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  97%|█████████▋| 1168/1208 [33:26<01:08,  1.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000424, train/loss_step=0.128, global_step=8445.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  97%|█████████▋| 1168/1208 [33:26<01:08,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.59e-5, train/loss_step=0.0101, global_step=8445.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  97%|█████████▋| 1169/1208 [33:27<01:06,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.59e-5, train/loss_step=0.0101, global_step=8445.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  97%|█████████▋| 1169/1208 [33:27<01:06,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.000109, train/loss_step=0.027, global_step=8446.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  97%|█████████▋| 1170/1208 [33:28<01:05,  1.72s/it, loss=0.131, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.000109, train/loss_step=0.027, global_step=8446.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  97%|█████████▋| 1170/1208 [33:28<01:05,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0562, train/loss_vlb_step=0.000197, train/loss_step=0.0562, global_step=8446.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  97%|█████████▋| 1171/1208 [33:29<01:03,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0562, train/loss_vlb_step=0.000197, train/loss_step=0.0562, global_step=8446.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  97%|█████████▋| 1171/1208 [33:29<01:03,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.54e-5, train/loss_step=0.00266, global_step=8446.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  97%|█████████▋| 1172/1208 [33:32<01:01,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.54e-5, train/loss_step=0.00266, global_step=8446.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  97%|█████████▋| 1172/1208 [33:32<01:01,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000122, train/loss_step=0.0325, global_step=8446.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  97%|█████████▋| 1173/1208 [33:33<01:00,  1.72s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000122, train/loss_step=0.0325, global_step=8446.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  97%|█████████▋| 1173/1208 [33:33<01:00,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.47e-5, train/loss_step=0.0184, global_step=8447.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  97%|█████████▋| 1174/1208 [33:34<00:58,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=7.47e-5, train/loss_step=0.0184, global_step=8447.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  97%|█████████▋| 1174/1208 [33:34<00:58,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.6e-5, train/loss_step=0.0227, global_step=8447.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  97%|█████████▋| 1175/1208 [33:35<00:56,  1.72s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.6e-5, train/loss_step=0.0227, global_step=8447.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  97%|█████████▋| 1175/1208 [33:35<00:56,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000512, train/loss_step=0.154, global_step=8447.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  97%|█████████▋| 1176/1208 [33:39<00:54,  1.72s/it, loss=0.101, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000512, train/loss_step=0.154, global_step=8447.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  97%|█████████▋| 1176/1208 [33:39<00:54,  1.72s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.03e-5, train/loss_step=0.0145, global_step=8447.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  97%|█████████▋| 1177/1208 [33:40<00:53,  1.72s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.03e-5, train/loss_step=0.0145, global_step=8447.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  97%|█████████▋| 1177/1208 [33:40<00:53,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.00089, train/loss_step=0.227, global_step=8448.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  98%|█████████▊| 1178/1208 [33:41<00:51,  1.72s/it, loss=0.11, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.00089, train/loss_step=0.227, global_step=8448.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  98%|█████████▊| 1178/1208 [33:41<00:51,  1.72s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.00951, train/loss_vlb_step=4.36e-5, train/loss_step=0.00951, global_step=8448.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  98%|█████████▊| 1179/1208 [33:42<00:49,  1.72s/it, loss=0.0899, v_num=0, train/loss_simple_step=0.00951, train/loss_vlb_step=4.36e-5, train/loss_step=0.00951, global_step=8448.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  98%|█████████▊| 1179/1208 [33:42<00:49,  1.72s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00109, train/loss_step=0.270, global_step=8448.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    Epoch 27:  98%|█████████▊| 1180/1208 [33:45<00:48,  1.72s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00109, train/loss_step=0.270, global_step=8448.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  98%|█████████▊| 1180/1208 [33:45<00:48,  1.72s/it, loss=0.0839, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=1.93e-5, train/loss_step=0.00345, global_step=8448.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  98%|█████████▊| 1181/1208 [33:46<00:46,  1.72s/it, loss=0.0839, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=1.93e-5, train/loss_step=0.00345, global_step=8448.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  98%|█████████▊| 1181/1208 [33:46<00:46,  1.72s/it, loss=0.0717, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.46e-5, train/loss_step=0.0127, global_step=8449.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  98%|█████████▊| 1182/1208 [33:47<00:44,  1.72s/it, loss=0.0717, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=5.46e-5, train/loss_step=0.0127, global_step=8449.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  98%|█████████▊| 1182/1208 [33:47<00:44,  1.72s/it, loss=0.0713, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.000101, train/loss_step=0.0248, global_step=8449.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  98%|█████████▊| 1183/1208 [33:48<00:42,  1.72s/it, loss=0.0713, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.000101, train/loss_step=0.0248, global_step=8449.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  98%|█████████▊| 1183/1208 [33:48<00:42,  1.72s/it, loss=0.0718, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.34e-5, train/loss_step=0.0142, global_step=8449.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  98%|█████████▊| 1184/1208 [33:52<00:41,  1.72s/it, loss=0.0718, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.34e-5, train/loss_step=0.0142, global_step=8449.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  98%|█████████▊| 1184/1208 [33:52<00:41,  1.72s/it, loss=0.0762, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000798, train/loss_step=0.216, global_step=8449.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  98%|█████████▊| 1185/1208 [33:53<00:39,  1.72s/it, loss=0.0762, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000798, train/loss_step=0.216, global_step=8449.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  98%|█████████▊| 1185/1208 [33:53<00:39,  1.72s/it, loss=0.073, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000514, train/loss_step=0.149, global_step=8450.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  98%|█████████▊| 1186/1208 [33:54<00:37,  1.72s/it, loss=0.073, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000514, train/loss_step=0.149, global_step=8450.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  98%|█████████▊| 1186/1208 [33:54<00:37,  1.72s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.002, train/loss_step=0.370, global_step=8450.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  98%|█████████▊| 1187/1208 [33:55<00:36,  1.71s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.370, train/loss_vlb_step=0.002, train/loss_step=0.370, global_step=8450.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  98%|█████████▊| 1187/1208 [33:55<00:36,  1.71s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000127, train/loss_step=0.0346, global_step=8450.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  98%|█████████▊| 1188/1208 [33:58<00:34,  1.72s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000127, train/loss_step=0.0346, global_step=8450.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  98%|█████████▊| 1188/1208 [33:58<00:34,  1.72s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00105, train/loss_step=0.249, global_step=8450.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]   Epoch 27:  98%|█████████▊| 1189/1208 [33:59<00:32,  1.72s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00105, train/loss_step=0.249, global_step=8450.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  98%|█████████▊| 1189/1208 [33:59<00:32,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00113, train/loss_step=0.272, global_step=8451.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27:  99%|█████████▊| 1190/1208 [34:00<00:30,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00113, train/loss_step=0.272, global_step=8451.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  99%|█████████▊| 1190/1208 [34:00<00:30,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.74e-5, train/loss_step=0.0234, global_step=8451.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  99%|█████████▊| 1191/1208 [34:01<00:29,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.74e-5, train/loss_step=0.0234, global_step=8451.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  99%|█████████▊| 1191/1208 [34:01<00:29,  1.71s/it, loss=0.108, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.00012, train/loss_step=0.032, global_step=8451.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  99%|█████████▊| 1192/1208 [34:05<00:27,  1.72s/it, loss=0.108, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.00012, train/loss_step=0.032, global_step=8451.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  99%|█████████▊| 1192/1208 [34:05<00:27,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=8451.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  99%|█████████▉| 1193/1208 [34:06<00:25,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=8451.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  99%|█████████▉| 1193/1208 [34:06<00:25,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.04e-5, train/loss_step=0.0112, global_step=8452.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  99%|█████████▉| 1194/1208 [34:07<00:24,  1.71s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.04e-5, train/loss_step=0.0112, global_step=8452.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  99%|█████████▉| 1194/1208 [34:07<00:24,  1.71s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00811, train/loss_vlb_step=3.95e-5, train/loss_step=0.00811, global_step=8452.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  99%|█████████▉| 1195/1208 [34:08<00:22,  1.71s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00811, train/loss_vlb_step=3.95e-5, train/loss_step=0.00811, global_step=8452.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  99%|█████████▉| 1195/1208 [34:08<00:22,  1.71s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.15e-5, train/loss_step=0.00195, global_step=8452.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  99%|█████████▉| 1196/1208 [34:11<00:20,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.15e-5, train/loss_step=0.00195, global_step=8452.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  99%|█████████▉| 1196/1208 [34:11<00:20,  1.72s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00329, train/loss_vlb_step=1.74e-5, train/loss_step=0.00329, global_step=8452.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  99%|█████████▉| 1197/1208 [34:12<00:18,  1.71s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00329, train/loss_vlb_step=1.74e-5, train/loss_step=0.00329, global_step=8452.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  99%|█████████▉| 1197/1208 [34:12<00:18,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.0017, train/loss_step=0.306, global_step=8453.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]     Epoch 27:  99%|█████████▉| 1198/1208 [34:13<00:17,  1.71s/it, loss=0.106, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.0017, train/loss_step=0.306, global_step=8453.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  99%|█████████▉| 1198/1208 [34:13<00:17,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000133, train/loss_step=0.0372, global_step=8453.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  99%|█████████▉| 1199/1208 [34:14<00:15,  1.71s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000133, train/loss_step=0.0372, global_step=8453.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  99%|█████████▉| 1199/1208 [34:14<00:15,  1.71s/it, loss=0.104, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000683, train/loss_step=0.196, global_step=8453.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  Epoch 27:  99%|█████████▉| 1200/1208 [34:18<00:13,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000683, train/loss_step=0.196, global_step=8453.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  99%|█████████▉| 1200/1208 [34:18<00:13,  1.72s/it, loss=0.134, v_num=0, train/loss_simple_step=0.602, train/loss_vlb_step=0.0187, train/loss_step=0.602, global_step=8453.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]  
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.74it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:29,  1.68it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.74it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:30,  1.63it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:28,  1.71it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.72it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:29,  1.65it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.70it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.72it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:28,  1.66it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.72it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.73it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:27,  1.65it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:26,  1.72it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:26,  1.70it/s]DDIM Sampler:  10%|█         | 5/50 [00:03<00:26,  1.68it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.72it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.70it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:26,  1.68it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.73it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:04<00:25,  1.72it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:25,  1.70it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.78it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.74it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.72it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.70it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.75it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.72it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.72it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.75it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.75it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:23,  1.72it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.75it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.74it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.73it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.81it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.74it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:07<00:22,  1.72it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.74it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.73it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.77it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.75it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.73it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.75it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:20,  1.73it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.78it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.74it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.74it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.75it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.74it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.76it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.74it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.74it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:11<00:17,  1.75it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.75it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.74it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.76it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.74it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.80it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:16,  1.75it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.80it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.79it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.75it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.76it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:14<00:13,  1.80it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.78it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.74it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.80it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.80it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:15<00:13,  1.74it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.75it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.80it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:16<00:12,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:16<00:12,  1.74it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.80it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.81it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:12,  1.71it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.78it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.80it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.72it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:09,  1.80it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.73it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.78it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.80it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.74it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:18<00:08,  1.81it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:19<00:09,  1.74it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.79it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.78it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.75it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:20<00:08,  1.74it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:08,  1.75it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.77it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.75it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.78it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.75it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.75it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.78it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.79it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:23<00:05,  1.75it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.78it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.78it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.74it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.78it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.78it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:24<00:04,  1.74it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.78it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.75it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.74it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.78it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.78it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:26<00:02,  1.73it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.75it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.73it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.75it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.77it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.79it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:27<00:01,  1.73it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.71it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.73it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.70it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:27<00:00,  1.79it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:28<00:00,  1.73it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.71it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.72it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.73it/s]Epoch 27:  99%|█████████▉| 1201/1208 [34:49<00:12,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.602, train/loss_vlb_step=0.0187, train/loss_step=0.602, global_step=8453.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27:  99%|█████████▉| 1201/1208 [34:49<00:12,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.0013, train/loss_step=0.296, global_step=8454.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27: 100%|█████████▉| 1202/1208 [34:50<00:10,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.296, train/loss_vlb_step=0.0013, train/loss_step=0.296, global_step=8454.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27: 100%|█████████▉| 1202/1208 [34:50<00:10,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.42e-5, train/loss_step=0.0181, global_step=8454.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27: 100%|█████████▉| 1203/1208 [34:51<00:08,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.42e-5, train/loss_step=0.0181, global_step=8454.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27: 100%|█████████▉| 1203/1208 [34:51<00:08,  1.74s/it, loss=0.158, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000806, train/loss_step=0.216, global_step=8454.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141] Epoch 27: 100%|█████████▉| 1204/1208 [34:54<00:06,  1.74s/it, loss=0.158, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000806, train/loss_step=0.216, global_step=8454.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27: 100%|█████████▉| 1204/1208 [34:54<00:06,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000445, train/loss_step=0.135, global_step=8454.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27: 100%|█████████▉| 1205/1208 [34:55<00:05,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000445, train/loss_step=0.135, global_step=8454.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27: 100%|█████████▉| 1205/1208 [34:55<00:05,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000395, train/loss_step=0.119, global_step=8455.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27: 100%|█████████▉| 1206/1208 [34:57<00:03,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000395, train/loss_step=0.119, global_step=8455.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27: 100%|█████████▉| 1206/1208 [34:57<00:03,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000537, train/loss_step=0.158, global_step=8455.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27: 100%|█████████▉| 1207/1208 [34:58<00:01,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000537, train/loss_step=0.158, global_step=8455.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27: 100%|█████████▉| 1207/1208 [34:58<00:01,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0634, train/loss_vlb_step=0.000215, train/loss_step=0.0634, global_step=8455.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27: 100%|██████████| 1208/1208 [35:04<00:00,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0634, train/loss_vlb_step=0.000215, train/loss_step=0.0634, global_step=8455.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 27: 100%|██████████| 1208/1208 [35:04<00:00,  1.74s/it, loss=0.147, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.0016, train/loss_step=0.339, global_step=8455.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]    
+
+
+Epoch 27:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.147, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.0016, train/loss_step=0.339, global_step=8455.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]           Epoch 28:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.147, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.0016, train/loss_step=0.339, global_step=8455.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][AData shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:26,  1.82it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:29,  1.67it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.74it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.72it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.77it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.71it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:27,  1.70it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:26,  1.73it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:26,  1.71it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.72it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.73it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.74it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.75it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.73it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.75it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.76it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.74it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.75it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.74it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:23,  1.73it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.74it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.73it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.75it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:22,  1.73it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.74it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.75it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.73it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.73it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:21,  1.71it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:20,  1.75it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.76it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:20,  1.72it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.73it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.74it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:19,  1.73it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.75it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.74it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.75it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.74it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.74it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.75it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.76it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.74it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.75it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.73it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:16,  1.75it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.78it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.75it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.79it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.76it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:13,  1.79it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.75it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.76it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.74it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.75it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.73it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.75it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:16<00:12,  1.72it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:12,  1.73it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:12,  1.72it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.78it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.74it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.78it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.73it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.75it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.74it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.77it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.78it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.75it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.75it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  70%|███████   | 35/50 [00:20<00:08,  1.76it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:08,  1.74it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.75it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.75it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.77it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.75it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.76it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.78it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.75it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.75it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.75it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.79it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.75it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.75it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:24<00:04,  1.76it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.73it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.74it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.80it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.72it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.75it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.78it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.74it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.78it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.74it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.80it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.73it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.74it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.74it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.77it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.75it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.79it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.73it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.78it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:28<00:00,  1.73it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.79it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.73it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.74it/s]Epoch 28:   0%|          | 1/1208 [00:33<11:17:21, 33.67s/it, loss=0.147, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.0016, train/loss_step=0.339, global_step=8455.0, train/loss_simple_epoch=0.141, train/loss_vlb_epoch=0.00326, train/loss_epoch=0.141]Epoch 28:   0%|          | 1/1208 [00:33<11:17:23, 33.67s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000163, train/loss_step=0.0443, global_step=8456.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   0%|          | 2/1208 [00:34<5:49:08, 17.37s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.000163, train/loss_step=0.0443, global_step=8456.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:   0%|          | 2/1208 [00:34<5:49:09, 17.37s/it, loss=0.147, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00103, train/loss_step=0.250, global_step=8456.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:   0%|          | 3/1208 [00:35<3:59:43, 11.94s/it, loss=0.147, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00103, train/loss_step=0.250, global_step=8456.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   0%|          | 3/1208 [00:35<3:59:44, 11.94s/it, loss=0.153, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000511, train/loss_step=0.152, global_step=8456.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   0%|          | 4/1208 [00:38<3:14:48,  9.71s/it, loss=0.153, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000511, train/loss_step=0.152, global_step=8456.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   0%|          | 4/1208 [00:38<3:14:49,  9.71s/it, loss=0.158, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000731, train/loss_step=0.196, global_step=8456.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   0%|          | 5/1208 [00:39<2:40:12,  7.99s/it, loss=0.158, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000731, train/loss_step=0.196, global_step=8456.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   0%|          | 5/1208 [00:39<2:40:13,  7.99s/it, loss=0.164, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000457, train/loss_step=0.134, global_step=8457.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   0%|          | 6/1208 [00:41<2:17:14,  6.85s/it, loss=0.164, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000457, train/loss_step=0.134, global_step=8457.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   0%|          | 6/1208 [00:41<2:17:14,  6.85s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00692, train/loss_vlb_step=3.47e-5, train/loss_step=0.00692, global_step=8457.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   1%|          | 7/1208 [00:42<2:00:41,  6.03s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00692, train/loss_vlb_step=3.47e-5, train/loss_step=0.00692, global_step=8457.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   1%|          | 7/1208 [00:42<2:00:42,  6.03s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.78e-5, train/loss_step=0.00324, global_step=8457.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   1%|          | 8/1208 [00:45<1:53:21,  5.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.78e-5, train/loss_step=0.00324, global_step=8457.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   1%|          | 8/1208 [00:45<1:53:21,  5.67s/it, loss=0.164, v_num=0, train/loss_simple_step=0.007, train/loss_vlb_step=3.37e-5, train/loss_step=0.007, global_step=8457.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:   1%|          | 9/1208 [00:46<1:43:05,  5.16s/it, loss=0.164, v_num=0, train/loss_simple_step=0.007, train/loss_vlb_step=3.37e-5, train/loss_step=0.007, global_step=8457.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   1%|          | 9/1208 [00:46<1:43:06,  5.16s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0271, train/loss_vlb_step=0.000104, train/loss_step=0.0271, global_step=8458.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   1%|          | 10/1208 [00:47<1:34:48,  4.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0271, train/loss_vlb_step=0.000104, train/loss_step=0.0271, global_step=8458.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   1%|          | 10/1208 [00:47<1:34:48,  4.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.075, train/loss_vlb_step=0.000249, train/loss_step=0.075, global_step=8458.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:   1%|          | 11/1208 [00:48<1:28:01,  4.41s/it, loss=0.152, v_num=0, train/loss_simple_step=0.075, train/loss_vlb_step=0.000249, train/loss_step=0.075, global_step=8458.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   1%|          | 11/1208 [00:48<1:28:02,  4.41s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.28e-5, train/loss_step=0.0121, global_step=8458.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   1%|          | 12/1208 [00:51<1:25:56,  4.31s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.28e-5, train/loss_step=0.0121, global_step=8458.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   1%|          | 12/1208 [00:51<1:25:56,  4.31s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0064, train/loss_vlb_step=3.45e-5, train/loss_step=0.0064, global_step=8458.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   1%|          | 13/1208 [00:52<1:20:57,  4.06s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0064, train/loss_vlb_step=3.45e-5, train/loss_step=0.0064, global_step=8458.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   1%|          | 13/1208 [00:52<1:20:57,  4.06s/it, loss=0.099, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.44e-5, train/loss_step=0.020, global_step=8459.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:   1%|          | 14/1208 [00:53<1:16:38,  3.85s/it, loss=0.099, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.44e-5, train/loss_step=0.020, global_step=8459.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   1%|          | 14/1208 [00:53<1:16:39,  3.85s/it, loss=0.115, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00285, train/loss_step=0.329, global_step=8459.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   1%|          | 15/1208 [00:54<1:12:52,  3.67s/it, loss=0.115, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00285, train/loss_step=0.329, global_step=8459.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   1%|          | 15/1208 [00:54<1:12:52,  3.67s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.99e-5, train/loss_step=0.0161, global_step=8459.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   1%|▏         | 16/1208 [00:58<1:12:14,  3.64s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.99e-5, train/loss_step=0.0161, global_step=8459.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   1%|▏         | 16/1208 [00:58<1:12:14,  3.64s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.8e-5, train/loss_step=0.0159, global_step=8459.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   1%|▏         | 17/1208 [00:59<1:09:11,  3.49s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.8e-5, train/loss_step=0.0159, global_step=8459.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   1%|▏         | 17/1208 [00:59<1:09:11,  3.49s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.00793, train/loss_vlb_step=3.83e-5, train/loss_step=0.00793, global_step=8460.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   1%|▏         | 18/1208 [01:00<1:06:27,  3.35s/it, loss=0.0931, v_num=0, train/loss_simple_step=0.00793, train/loss_vlb_step=3.83e-5, train/loss_step=0.00793, global_step=8460.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   1%|▏         | 18/1208 [01:00<1:06:28,  3.35s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.00036, train/loss_step=0.108, global_step=8460.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:   2%|▏         | 19/1208 [01:01<1:04:00,  3.23s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.00036, train/loss_step=0.108, global_step=8460.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   2%|▏         | 19/1208 [01:01<1:04:00,  3.23s/it, loss=0.113, v_num=0, train/loss_simple_step=0.506, train/loss_vlb_step=0.00807, train/loss_step=0.506, global_step=8460.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:   2%|▏         | 20/1208 [01:04<1:03:58,  3.23s/it, loss=0.113, v_num=0, train/loss_simple_step=0.506, train/loss_vlb_step=0.00807, train/loss_step=0.506, global_step=8460.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   2%|▏         | 20/1208 [01:04<1:03:58,  3.23s/it, loss=0.117, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00433, train/loss_step=0.423, global_step=8460.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   2%|▏         | 21/1208 [01:05<1:01:54,  3.13s/it, loss=0.117, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00433, train/loss_step=0.423, global_step=8460.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   2%|▏         | 21/1208 [01:05<1:01:54,  3.13s/it, loss=0.128, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00106, train/loss_step=0.259, global_step=8461.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   2%|▏         | 22/1208 [01:06<1:00:01,  3.04s/it, loss=0.128, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00106, train/loss_step=0.259, global_step=8461.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   2%|▏         | 22/1208 [01:06<1:00:01,  3.04s/it, loss=0.121, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=8461.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   2%|▏         | 23/1208 [01:07<58:16,  2.95s/it, loss=0.121, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=8461.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:   2%|▏         | 23/1208 [01:07<58:16,  2.95s/it, loss=0.131, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00177, train/loss_step=0.349, global_step=8461.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:   2%|▏         | 24/1208 [01:11<58:30,  2.97s/it, loss=0.131, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00177, train/loss_step=0.349, global_step=8461.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   2%|▏         | 24/1208 [01:11<58:30,  2.97s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00547, train/loss_vlb_step=2.79e-5, train/loss_step=0.00547, global_step=8461.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   2%|▏         | 25/1208 [01:12<57:00,  2.89s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00547, train/loss_vlb_step=2.79e-5, train/loss_step=0.00547, global_step=8461.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   2%|▏         | 25/1208 [01:12<57:00,  2.89s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.000177, train/loss_step=0.0499, global_step=8462.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:   2%|▏         | 26/1208 [01:13<55:33,  2.82s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.000177, train/loss_step=0.0499, global_step=8462.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   2%|▏         | 26/1208 [01:13<55:33,  2.82s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00829, train/loss_vlb_step=4.04e-5, train/loss_step=0.00829, global_step=8462.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   2%|▏         | 27/1208 [01:14<54:13,  2.76s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00829, train/loss_vlb_step=4.04e-5, train/loss_step=0.00829, global_step=8462.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   2%|▏         | 27/1208 [01:14<54:13,  2.76s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.000108, train/loss_step=0.0275, global_step=8462.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:   2%|▏         | 28/1208 [01:17<54:29,  2.77s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.000108, train/loss_step=0.0275, global_step=8462.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   2%|▏         | 28/1208 [01:17<54:29,  2.77s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.9e-5, train/loss_step=0.0159, global_step=8462.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:   2%|▏         | 29/1208 [01:18<53:19,  2.71s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.9e-5, train/loss_step=0.0159, global_step=8462.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   2%|▏         | 29/1208 [01:18<53:19,  2.71s/it, loss=0.135, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00259, train/loss_step=0.354, global_step=8463.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:   2%|▏         | 30/1208 [01:19<52:13,  2.66s/it, loss=0.135, v_num=0, train/loss_simple_step=0.354, train/loss_vlb_step=0.00259, train/loss_step=0.354, global_step=8463.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   2%|▏         | 30/1208 [01:19<52:13,  2.66s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00773, train/loss_vlb_step=3.9e-5, train/loss_step=0.00773, global_step=8463.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   3%|▎         | 31/1208 [01:20<51:10,  2.61s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00773, train/loss_vlb_step=3.9e-5, train/loss_step=0.00773, global_step=8463.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   3%|▎         | 31/1208 [01:20<51:10,  2.61s/it, loss=0.138, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000473, train/loss_step=0.142, global_step=8463.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:   3%|▎         | 32/1208 [01:24<51:28,  2.63s/it, loss=0.138, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000473, train/loss_step=0.142, global_step=8463.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   3%|▎         | 32/1208 [01:24<51:29,  2.63s/it, loss=0.153, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00155, train/loss_step=0.309, global_step=8463.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:   3%|▎         | 33/1208 [01:25<50:32,  2.58s/it, loss=0.153, v_num=0, train/loss_simple_step=0.309, train/loss_vlb_step=0.00155, train/loss_step=0.309, global_step=8463.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   3%|▎         | 33/1208 [01:25<50:32,  2.58s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00321, train/loss_vlb_step=1.73e-5, train/loss_step=0.00321, global_step=8464.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   3%|▎         | 34/1208 [01:26<49:38,  2.54s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00321, train/loss_vlb_step=1.73e-5, train/loss_step=0.00321, global_step=8464.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   3%|▎         | 34/1208 [01:26<49:38,  2.54s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0714, train/loss_vlb_step=0.000244, train/loss_step=0.0714, global_step=8464.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:   3%|▎         | 35/1208 [01:27<48:45,  2.49s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0714, train/loss_vlb_step=0.000244, train/loss_step=0.0714, global_step=8464.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   3%|▎         | 35/1208 [01:27<48:45,  2.49s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00943, train/loss_vlb_step=4.44e-5, train/loss_step=0.00943, global_step=8464.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   3%|▎         | 36/1208 [01:30<49:07,  2.52s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00943, train/loss_vlb_step=4.44e-5, train/loss_step=0.00943, global_step=8464.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   3%|▎         | 36/1208 [01:30<49:07,  2.52s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00484, train/loss_vlb_step=2.48e-5, train/loss_step=0.00484, global_step=8464.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   3%|▎         | 37/1208 [01:31<48:19,  2.48s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00484, train/loss_vlb_step=2.48e-5, train/loss_step=0.00484, global_step=8464.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   3%|▎         | 37/1208 [01:31<48:19,  2.48s/it, loss=0.148, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000824, train/loss_step=0.201, global_step=8465.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:   3%|▎         | 38/1208 [01:32<47:32,  2.44s/it, loss=0.148, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000824, train/loss_step=0.201, global_step=8465.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   3%|▎         | 38/1208 [01:32<47:32,  2.44s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=8.58e-6, train/loss_step=0.00142, global_step=8465.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   3%|▎         | 39/1208 [01:33<46:48,  2.40s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=8.58e-6, train/loss_step=0.00142, global_step=8465.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   3%|▎         | 39/1208 [01:33<46:48,  2.40s/it, loss=0.127, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000682, train/loss_step=0.189, global_step=8465.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:   3%|▎         | 40/1208 [01:36<47:11,  2.42s/it, loss=0.127, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000682, train/loss_step=0.189, global_step=8465.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   3%|▎         | 40/1208 [01:36<47:11,  2.42s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000136, train/loss_step=0.0369, global_step=8465.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   3%|▎         | 41/1208 [01:38<46:31,  2.39s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000136, train/loss_step=0.0369, global_step=8465.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   3%|▎         | 41/1208 [01:38<46:31,  2.39s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.0487, train/loss_vlb_step=0.000175, train/loss_step=0.0487, global_step=8466.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   3%|▎         | 42/1208 [01:39<45:52,  2.36s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.0487, train/loss_vlb_step=0.000175, train/loss_step=0.0487, global_step=8466.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   3%|▎         | 42/1208 [01:39<45:52,  2.36s/it, loss=0.0927, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.76e-5, train/loss_step=0.0183, global_step=8466.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:   4%|▎         | 43/1208 [01:40<45:17,  2.33s/it, loss=0.0927, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.76e-5, train/loss_step=0.0183, global_step=8466.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   4%|▎         | 43/1208 [01:40<45:17,  2.33s/it, loss=0.0753, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.2e-5, train/loss_step=0.00202, global_step=8466.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   4%|▎         | 44/1208 [01:43<45:37,  2.35s/it, loss=0.0753, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.2e-5, train/loss_step=0.00202, global_step=8466.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   4%|▎         | 44/1208 [01:43<45:37,  2.35s/it, loss=0.0754, v_num=0, train/loss_simple_step=0.00661, train/loss_vlb_step=3.37e-5, train/loss_step=0.00661, global_step=8466.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   4%|▎         | 45/1208 [01:44<45:02,  2.32s/it, loss=0.0754, v_num=0, train/loss_simple_step=0.00661, train/loss_vlb_step=3.37e-5, train/loss_step=0.00661, global_step=8466.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   4%|▎         | 45/1208 [01:44<45:02,  2.32s/it, loss=0.0746, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000117, train/loss_step=0.0332, global_step=8467.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:   4%|▍         | 46/1208 [01:45<44:28,  2.30s/it, loss=0.0746, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000117, train/loss_step=0.0332, global_step=8467.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   4%|▍         | 46/1208 [01:45<44:28,  2.30s/it, loss=0.0743, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=1.64e-5, train/loss_step=0.00295, global_step=8467.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   4%|▍         | 47/1208 [01:46<43:55,  2.27s/it, loss=0.0743, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=1.64e-5, train/loss_step=0.00295, global_step=8467.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   4%|▍         | 47/1208 [01:46<43:56,  2.27s/it, loss=0.0739, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.12e-5, train/loss_step=0.020, global_step=8467.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:   4%|▍         | 48/1208 [01:49<44:14,  2.29s/it, loss=0.0739, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.12e-5, train/loss_step=0.020, global_step=8467.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   4%|▍         | 48/1208 [01:49<44:14,  2.29s/it, loss=0.0783, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=8467.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   4%|▍         | 49/1208 [01:50<43:43,  2.26s/it, loss=0.0783, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=8467.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   4%|▍         | 49/1208 [01:50<43:43,  2.26s/it, loss=0.0608, v_num=0, train/loss_simple_step=0.00497, train/loss_vlb_step=2.53e-5, train/loss_step=0.00497, global_step=8468.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   4%|▍         | 50/1208 [01:52<43:15,  2.24s/it, loss=0.0608, v_num=0, train/loss_simple_step=0.00497, train/loss_vlb_step=2.53e-5, train/loss_step=0.00497, global_step=8468.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   4%|▍         | 50/1208 [01:52<43:15,  2.24s/it, loss=0.0621, v_num=0, train/loss_simple_step=0.0331, train/loss_vlb_step=0.000126, train/loss_step=0.0331, global_step=8468.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:   4%|▍         | 51/1208 [01:53<42:46,  2.22s/it, loss=0.0621, v_num=0, train/loss_simple_step=0.0331, train/loss_vlb_step=0.000126, train/loss_step=0.0331, global_step=8468.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   4%|▍         | 51/1208 [01:53<42:46,  2.22s/it, loss=0.0555, v_num=0, train/loss_simple_step=0.0097, train/loss_vlb_step=4.6e-5, train/loss_step=0.0097, global_step=8468.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:   4%|▍         | 52/1208 [01:56<43:07,  2.24s/it, loss=0.0555, v_num=0, train/loss_simple_step=0.0097, train/loss_vlb_step=4.6e-5, train/loss_step=0.0097, global_step=8468.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   4%|▍         | 52/1208 [01:56<43:07,  2.24s/it, loss=0.0409, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.53e-5, train/loss_step=0.0175, global_step=8468.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   4%|▍         | 53/1208 [01:57<42:41,  2.22s/it, loss=0.0409, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=7.53e-5, train/loss_step=0.0175, global_step=8468.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   4%|▍         | 53/1208 [01:57<42:41,  2.22s/it, loss=0.0513, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000777, train/loss_step=0.211, global_step=8469.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:   4%|▍         | 54/1208 [01:58<42:14,  2.20s/it, loss=0.0513, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000777, train/loss_step=0.211, global_step=8469.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   4%|▍         | 54/1208 [01:58<42:14,  2.20s/it, loss=0.0501, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000181, train/loss_step=0.0478, global_step=8469.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   5%|▍         | 55/1208 [01:59<41:48,  2.18s/it, loss=0.0501, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000181, train/loss_step=0.0478, global_step=8469.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   5%|▍         | 55/1208 [01:59<41:48,  2.18s/it, loss=0.081, v_num=0, train/loss_simple_step=0.628, train/loss_vlb_step=0.0167, train/loss_step=0.628, global_step=8469.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]     Epoch 28:   5%|▍         | 56/1208 [02:02<42:08,  2.20s/it, loss=0.081, v_num=0, train/loss_simple_step=0.628, train/loss_vlb_step=0.0167, train/loss_step=0.628, global_step=8469.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   5%|▍         | 56/1208 [02:02<42:08,  2.20s/it, loss=0.083, v_num=0, train/loss_simple_step=0.0433, train/loss_vlb_step=0.000158, train/loss_step=0.0433, global_step=8469.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   5%|▍         | 57/1208 [02:04<41:44,  2.18s/it, loss=0.083, v_num=0, train/loss_simple_step=0.0433, train/loss_vlb_step=0.000158, train/loss_step=0.0433, global_step=8469.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   5%|▍         | 57/1208 [02:04<41:44,  2.18s/it, loss=0.073, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.15e-5, train/loss_step=0.00197, global_step=8470.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   5%|▍         | 58/1208 [02:05<41:19,  2.16s/it, loss=0.073, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.15e-5, train/loss_step=0.00197, global_step=8470.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   5%|▍         | 58/1208 [02:05<41:19,  2.16s/it, loss=0.0732, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=2.65e-5, train/loss_step=0.00495, global_step=8470.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   5%|▍         | 59/1208 [02:06<40:56,  2.14s/it, loss=0.0732, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=2.65e-5, train/loss_step=0.00495, global_step=8470.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   5%|▍         | 59/1208 [02:06<40:56,  2.14s/it, loss=0.0639, v_num=0, train/loss_simple_step=0.00333, train/loss_vlb_step=1.86e-5, train/loss_step=0.00333, global_step=8470.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   5%|▍         | 60/1208 [02:09<41:17,  2.16s/it, loss=0.0639, v_num=0, train/loss_simple_step=0.00333, train/loss_vlb_step=1.86e-5, train/loss_step=0.00333, global_step=8470.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   5%|▍         | 60/1208 [02:09<41:17,  2.16s/it, loss=0.0824, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00362, train/loss_step=0.408, global_step=8470.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:   5%|▌         | 61/1208 [02:10<40:54,  2.14s/it, loss=0.0824, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00362, train/loss_step=0.408, global_step=8470.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   5%|▌         | 61/1208 [02:10<40:54,  2.14s/it, loss=0.104, v_num=0, train/loss_simple_step=0.489, train/loss_vlb_step=0.00568, train/loss_step=0.489, global_step=8471.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:   5%|▌         | 62/1208 [02:11<40:32,  2.12s/it, loss=0.104, v_num=0, train/loss_simple_step=0.489, train/loss_vlb_step=0.00568, train/loss_step=0.489, global_step=8471.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   5%|▌         | 62/1208 [02:11<40:32,  2.12s/it, loss=0.105, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.000105, train/loss_step=0.027, global_step=8471.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   5%|▌         | 63/1208 [02:12<40:11,  2.11s/it, loss=0.105, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.000105, train/loss_step=0.027, global_step=8471.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   5%|▌         | 63/1208 [02:12<40:11,  2.11s/it, loss=0.116, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000865, train/loss_step=0.230, global_step=8471.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   5%|▌         | 64/1208 [02:16<40:32,  2.13s/it, loss=0.116, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000865, train/loss_step=0.230, global_step=8471.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   5%|▌         | 64/1208 [02:16<40:32,  2.13s/it, loss=0.128, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000983, train/loss_step=0.238, global_step=8471.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   5%|▌         | 65/1208 [02:17<40:12,  2.11s/it, loss=0.128, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000983, train/loss_step=0.238, global_step=8471.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   5%|▌         | 65/1208 [02:17<40:12,  2.11s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=8.2e-5, train/loss_step=0.0191, global_step=8472.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   5%|▌         | 66/1208 [02:18<39:52,  2.09s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=8.2e-5, train/loss_step=0.0191, global_step=8472.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   5%|▌         | 66/1208 [02:18<39:52,  2.09s/it, loss=0.133, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=8472.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   6%|▌         | 67/1208 [02:19<39:33,  2.08s/it, loss=0.133, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=8472.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   6%|▌         | 67/1208 [02:19<39:33,  2.08s/it, loss=0.151, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.00259, train/loss_step=0.382, global_step=8472.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:   6%|▌         | 68/1208 [02:22<39:49,  2.10s/it, loss=0.151, v_num=0, train/loss_simple_step=0.382, train/loss_vlb_step=0.00259, train/loss_step=0.382, global_step=8472.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   6%|▌         | 68/1208 [02:22<39:49,  2.10s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0653, train/loss_vlb_step=0.000223, train/loss_step=0.0653, global_step=8472.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   6%|▌         | 69/1208 [02:23<39:31,  2.08s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0653, train/loss_vlb_step=0.000223, train/loss_step=0.0653, global_step=8472.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   6%|▌         | 69/1208 [02:23<39:31,  2.08s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0047, train/loss_vlb_step=2.47e-5, train/loss_step=0.0047, global_step=8473.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:   6%|▌         | 70/1208 [02:24<39:13,  2.07s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0047, train/loss_vlb_step=2.47e-5, train/loss_step=0.0047, global_step=8473.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   6%|▌         | 70/1208 [02:24<39:13,  2.07s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.36e-5, train/loss_step=0.0178, global_step=8473.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   6%|▌         | 71/1208 [02:25<38:55,  2.05s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.36e-5, train/loss_step=0.0178, global_step=8473.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   6%|▌         | 71/1208 [02:25<38:55,  2.05s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.41e-5, train/loss_step=0.0144, global_step=8473.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   6%|▌         | 72/1208 [02:29<39:12,  2.07s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.41e-5, train/loss_step=0.0144, global_step=8473.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   6%|▌         | 72/1208 [02:29<39:12,  2.07s/it, loss=0.166, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00243, train/loss_step=0.377, global_step=8473.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:   6%|▌         | 73/1208 [02:30<38:55,  2.06s/it, loss=0.166, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00243, train/loss_step=0.377, global_step=8473.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   6%|▌         | 73/1208 [02:30<38:55,  2.06s/it, loss=0.187, v_num=0, train/loss_simple_step=0.617, train/loss_vlb_step=0.0182, train/loss_step=0.617, global_step=8474.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:   6%|▌         | 74/1208 [02:31<38:37,  2.04s/it, loss=0.187, v_num=0, train/loss_simple_step=0.617, train/loss_vlb_step=0.0182, train/loss_step=0.617, global_step=8474.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   6%|▌         | 74/1208 [02:31<38:37,  2.04s/it, loss=0.19, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=8474.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   6%|▌         | 75/1208 [02:32<38:21,  2.03s/it, loss=0.19, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000379, train/loss_step=0.115, global_step=8474.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   6%|▌         | 75/1208 [02:32<38:21,  2.03s/it, loss=0.169, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000768, train/loss_step=0.206, global_step=8474.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   6%|▋         | 76/1208 [02:35<38:37,  2.05s/it, loss=0.169, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000768, train/loss_step=0.206, global_step=8474.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   6%|▋         | 76/1208 [02:35<38:37,  2.05s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0699, train/loss_vlb_step=0.000237, train/loss_step=0.0699, global_step=8474.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   6%|▋         | 77/1208 [02:36<38:21,  2.03s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0699, train/loss_vlb_step=0.000237, train/loss_step=0.0699, global_step=8474.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   6%|▋         | 77/1208 [02:36<38:21,  2.03s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.74e-5, train/loss_step=0.0159, global_step=8475.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   6%|▋         | 78/1208 [02:37<38:06,  2.02s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.74e-5, train/loss_step=0.0159, global_step=8475.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   6%|▋         | 78/1208 [02:37<38:06,  2.02s/it, loss=0.183, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00101, train/loss_step=0.248, global_step=8475.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:   7%|▋         | 79/1208 [02:38<37:50,  2.01s/it, loss=0.183, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00101, train/loss_step=0.248, global_step=8475.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   7%|▋         | 79/1208 [02:38<37:50,  2.01s/it, loss=0.189, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000405, train/loss_step=0.123, global_step=8475.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   7%|▋         | 80/1208 [02:42<38:06,  2.03s/it, loss=0.189, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000405, train/loss_step=0.123, global_step=8475.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   7%|▋         | 80/1208 [02:42<38:06,  2.03s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0701, train/loss_vlb_step=0.000234, train/loss_step=0.0701, global_step=8475.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   7%|▋         | 81/1208 [02:43<37:51,  2.02s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0701, train/loss_vlb_step=0.000234, train/loss_step=0.0701, global_step=8475.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   7%|▋         | 81/1208 [02:43<37:51,  2.02s/it, loss=0.169, v_num=0, train/loss_simple_step=0.431, train/loss_vlb_step=0.00232, train/loss_step=0.431, global_step=8476.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:   7%|▋         | 82/1208 [02:44<37:36,  2.00s/it, loss=0.169, v_num=0, train/loss_simple_step=0.431, train/loss_vlb_step=0.00232, train/loss_step=0.431, global_step=8476.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   7%|▋         | 82/1208 [02:44<37:36,  2.00s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0397, train/loss_vlb_step=0.000144, train/loss_step=0.0397, global_step=8476.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   7%|▋         | 83/1208 [02:45<37:21,  1.99s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0397, train/loss_vlb_step=0.000144, train/loss_step=0.0397, global_step=8476.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   7%|▋         | 83/1208 [02:45<37:21,  1.99s/it, loss=0.171, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00104, train/loss_step=0.253, global_step=8476.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:   7%|▋         | 84/1208 [02:48<37:36,  2.01s/it, loss=0.171, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00104, train/loss_step=0.253, global_step=8476.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   7%|▋         | 84/1208 [02:48<37:36,  2.01s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0494, train/loss_vlb_step=0.000177, train/loss_step=0.0494, global_step=8476.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   7%|▋         | 85/1208 [02:49<37:23,  2.00s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0494, train/loss_vlb_step=0.000177, train/loss_step=0.0494, global_step=8476.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   7%|▋         | 85/1208 [02:49<37:23,  2.00s/it, loss=0.166, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=8477.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:   7%|▋         | 86/1208 [02:50<37:08,  1.99s/it, loss=0.166, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000362, train/loss_step=0.110, global_step=8477.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   7%|▋         | 86/1208 [02:50<37:08,  1.99s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.26e-5, train/loss_step=0.00215, global_step=8477.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   7%|▋         | 87/1208 [02:51<36:55,  1.98s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.26e-5, train/loss_step=0.00215, global_step=8477.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   7%|▋         | 87/1208 [02:51<36:55,  1.98s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0419, train/loss_vlb_step=0.000148, train/loss_step=0.0419, global_step=8477.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:   7%|▋         | 88/1208 [02:55<37:09,  1.99s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0419, train/loss_vlb_step=0.000148, train/loss_step=0.0419, global_step=8477.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   7%|▋         | 88/1208 [02:55<37:09,  1.99s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.45e-5, train/loss_step=0.0124, global_step=8477.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:   7%|▋         | 89/1208 [02:56<36:55,  1.98s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.45e-5, train/loss_step=0.0124, global_step=8477.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   7%|▋         | 89/1208 [02:56<36:55,  1.98s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0767, train/loss_vlb_step=0.000257, train/loss_step=0.0767, global_step=8478.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   7%|▋         | 90/1208 [02:57<36:42,  1.97s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0767, train/loss_vlb_step=0.000257, train/loss_step=0.0767, global_step=8478.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   7%|▋         | 90/1208 [02:57<36:42,  1.97s/it, loss=0.165, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00289, train/loss_step=0.423, global_step=8478.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:   8%|▊         | 91/1208 [02:58<36:29,  1.96s/it, loss=0.165, v_num=0, train/loss_simple_step=0.423, train/loss_vlb_step=0.00289, train/loss_step=0.423, global_step=8478.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   8%|▊         | 91/1208 [02:58<36:29,  1.96s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00661, train/loss_vlb_step=3.3e-5, train/loss_step=0.00661, global_step=8478.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   8%|▊         | 92/1208 [03:01<36:44,  1.98s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00661, train/loss_vlb_step=3.3e-5, train/loss_step=0.00661, global_step=8478.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   8%|▊         | 92/1208 [03:01<36:44,  1.98s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00971, train/loss_vlb_step=4.6e-5, train/loss_step=0.00971, global_step=8478.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   8%|▊         | 93/1208 [03:02<36:31,  1.97s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00971, train/loss_vlb_step=4.6e-5, train/loss_step=0.00971, global_step=8478.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   8%|▊         | 93/1208 [03:02<36:31,  1.97s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=1.3e-5, train/loss_step=0.00227, global_step=8479.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   8%|▊         | 94/1208 [03:03<36:18,  1.96s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=1.3e-5, train/loss_step=0.00227, global_step=8479.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   8%|▊         | 94/1208 [03:03<36:18,  1.96s/it, loss=0.134, v_num=0, train/loss_simple_step=0.481, train/loss_vlb_step=0.0057, train/loss_step=0.481, global_step=8479.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:   8%|▊         | 95/1208 [03:04<36:06,  1.95s/it, loss=0.134, v_num=0, train/loss_simple_step=0.481, train/loss_vlb_step=0.0057, train/loss_step=0.481, global_step=8479.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   8%|▊         | 95/1208 [03:04<36:06,  1.95s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.86e-5, train/loss_step=0.00341, global_step=8479.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   8%|▊         | 96/1208 [03:08<36:19,  1.96s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.86e-5, train/loss_step=0.00341, global_step=8479.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   8%|▊         | 96/1208 [03:08<36:20,  1.96s/it, loss=0.133, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00117, train/loss_step=0.266, global_step=8479.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:   8%|▊         | 97/1208 [03:09<36:07,  1.95s/it, loss=0.133, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00117, train/loss_step=0.266, global_step=8479.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   8%|▊         | 97/1208 [03:09<36:07,  1.95s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000135, train/loss_step=0.0353, global_step=8480.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   8%|▊         | 98/1208 [03:10<35:55,  1.94s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000135, train/loss_step=0.0353, global_step=8480.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   8%|▊         | 98/1208 [03:10<35:55,  1.94s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0343, train/loss_vlb_step=0.00013, train/loss_step=0.0343, global_step=8480.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:   8%|▊         | 99/1208 [03:11<35:44,  1.93s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0343, train/loss_vlb_step=0.00013, train/loss_step=0.0343, global_step=8480.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   8%|▊         | 99/1208 [03:11<35:44,  1.93s/it, loss=0.127, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000772, train/loss_step=0.201, global_step=8480.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:   8%|▊         | 100/1208 [03:14<35:57,  1.95s/it, loss=0.127, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000772, train/loss_step=0.201, global_step=8480.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   8%|▊         | 100/1208 [03:14<35:57,  1.95s/it, loss=0.143, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.0029, train/loss_step=0.372, global_step=8480.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:   8%|▊         | 101/1208 [03:15<35:45,  1.94s/it, loss=0.143, v_num=0, train/loss_simple_step=0.372, train/loss_vlb_step=0.0029, train/loss_step=0.372, global_step=8480.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   8%|▊         | 101/1208 [03:15<35:45,  1.94s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0716, train/loss_vlb_step=0.000254, train/loss_step=0.0716, global_step=8481.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   8%|▊         | 102/1208 [03:16<35:34,  1.93s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0716, train/loss_vlb_step=0.000254, train/loss_step=0.0716, global_step=8481.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   8%|▊         | 102/1208 [03:16<35:34,  1.93s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0447, train/loss_vlb_step=0.000156, train/loss_step=0.0447, global_step=8481.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   9%|▊         | 103/1208 [03:17<35:22,  1.92s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0447, train/loss_vlb_step=0.000156, train/loss_step=0.0447, global_step=8481.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   9%|▊         | 103/1208 [03:17<35:22,  1.92s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.000173, train/loss_step=0.0483, global_step=8481.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   9%|▊         | 104/1208 [03:21<35:35,  1.93s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.000173, train/loss_step=0.0483, global_step=8481.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   9%|▊         | 104/1208 [03:21<35:35,  1.93s/it, loss=0.123, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000837, train/loss_step=0.224, global_step=8481.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:   9%|▊         | 105/1208 [03:22<35:24,  1.93s/it, loss=0.123, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000837, train/loss_step=0.224, global_step=8481.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   9%|▊         | 105/1208 [03:22<35:24,  1.93s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.89e-5, train/loss_step=0.00557, global_step=8482.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   9%|▉         | 106/1208 [03:23<35:14,  1.92s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.89e-5, train/loss_step=0.00557, global_step=8482.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   9%|▉         | 106/1208 [03:23<35:14,  1.92s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0581, train/loss_vlb_step=0.000202, train/loss_step=0.0581, global_step=8482.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:   9%|▉         | 107/1208 [03:24<35:03,  1.91s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0581, train/loss_vlb_step=0.000202, train/loss_step=0.0581, global_step=8482.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   9%|▉         | 107/1208 [03:24<35:03,  1.91s/it, loss=0.131, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00104, train/loss_step=0.239, global_step=8482.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:   9%|▉         | 108/1208 [03:27<35:16,  1.92s/it, loss=0.131, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00104, train/loss_step=0.239, global_step=8482.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   9%|▉         | 108/1208 [03:27<35:16,  1.92s/it, loss=0.142, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000951, train/loss_step=0.231, global_step=8482.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   9%|▉         | 109/1208 [03:28<35:06,  1.92s/it, loss=0.142, v_num=0, train/loss_simple_step=0.231, train/loss_vlb_step=0.000951, train/loss_step=0.231, global_step=8482.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   9%|▉         | 109/1208 [03:28<35:06,  1.92s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000135, train/loss_step=0.0364, global_step=8483.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   9%|▉         | 110/1208 [03:29<34:55,  1.91s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0364, train/loss_vlb_step=0.000135, train/loss_step=0.0364, global_step=8483.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   9%|▉         | 110/1208 [03:29<34:55,  1.91s/it, loss=0.12, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.5e-5, train/loss_step=0.024, global_step=8483.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:   9%|▉         | 111/1208 [03:31<34:45,  1.90s/it, loss=0.12, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=9.5e-5, train/loss_step=0.024, global_step=8483.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   9%|▉         | 111/1208 [03:31<34:45,  1.90s/it, loss=0.12, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.71e-5, train/loss_step=0.010, global_step=8483.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   9%|▉         | 112/1208 [03:34<34:56,  1.91s/it, loss=0.12, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.71e-5, train/loss_step=0.010, global_step=8483.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   9%|▉         | 112/1208 [03:34<34:56,  1.91s/it, loss=0.145, v_num=0, train/loss_simple_step=0.514, train/loss_vlb_step=0.00543, train/loss_step=0.514, global_step=8483.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   9%|▉         | 113/1208 [03:35<34:47,  1.91s/it, loss=0.145, v_num=0, train/loss_simple_step=0.514, train/loss_vlb_step=0.00543, train/loss_step=0.514, global_step=8483.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   9%|▉         | 113/1208 [03:35<34:47,  1.91s/it, loss=0.163, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00212, train/loss_step=0.356, global_step=8484.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   9%|▉         | 114/1208 [03:36<34:37,  1.90s/it, loss=0.163, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00212, train/loss_step=0.356, global_step=8484.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:   9%|▉         | 114/1208 [03:36<34:37,  1.90s/it, loss=0.147, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000547, train/loss_step=0.157, global_step=8484.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  10%|▉         | 115/1208 [03:37<34:28,  1.89s/it, loss=0.147, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000547, train/loss_step=0.157, global_step=8484.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  10%|▉         | 115/1208 [03:37<34:28,  1.89s/it, loss=0.174, v_num=0, train/loss_simple_step=0.562, train/loss_vlb_step=0.00778, train/loss_step=0.562, global_step=8484.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  10%|▉         | 116/1208 [03:40<34:38,  1.90s/it, loss=0.174, v_num=0, train/loss_simple_step=0.562, train/loss_vlb_step=0.00778, train/loss_step=0.562, global_step=8484.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  10%|▉         | 116/1208 [03:40<34:38,  1.90s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=0.000105, train/loss_step=0.0257, global_step=8484.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  10%|▉         | 117/1208 [03:41<34:29,  1.90s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=0.000105, train/loss_step=0.0257, global_step=8484.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  10%|▉         | 117/1208 [03:41<34:29,  1.90s/it, loss=0.167, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000432, train/loss_step=0.130, global_step=8485.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  10%|▉         | 118/1208 [03:43<34:20,  1.89s/it, loss=0.167, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000432, train/loss_step=0.130, global_step=8485.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  10%|▉         | 118/1208 [03:43<34:20,  1.89s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.34e-5, train/loss_step=0.0231, global_step=8485.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  10%|▉         | 119/1208 [03:44<34:11,  1.88s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=9.34e-5, train/loss_step=0.0231, global_step=8485.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  10%|▉         | 119/1208 [03:44<34:11,  1.88s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000111, train/loss_step=0.0268, global_step=8485.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  10%|▉         | 120/1208 [03:47<34:21,  1.89s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.000111, train/loss_step=0.0268, global_step=8485.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  10%|▉         | 120/1208 [03:47<34:21,  1.89s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=9.97e-5, train/loss_step=0.0249, global_step=8485.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  10%|█         | 121/1208 [03:48<34:12,  1.89s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=9.97e-5, train/loss_step=0.0249, global_step=8485.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  10%|█         | 121/1208 [03:48<34:12,  1.89s/it, loss=0.146, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000676, train/loss_step=0.185, global_step=8486.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  10%|█         | 122/1208 [03:49<34:03,  1.88s/it, loss=0.146, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000676, train/loss_step=0.185, global_step=8486.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  10%|█         | 122/1208 [03:49<34:03,  1.88s/it, loss=0.151, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000441, train/loss_step=0.134, global_step=8486.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  10%|█         | 123/1208 [03:50<33:54,  1.88s/it, loss=0.151, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000441, train/loss_step=0.134, global_step=8486.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  10%|█         | 123/1208 [03:50<33:54,  1.88s/it, loss=0.162, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00131, train/loss_step=0.277, global_step=8486.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  10%|█         | 124/1208 [03:53<34:03,  1.89s/it, loss=0.162, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00131, train/loss_step=0.277, global_step=8486.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  10%|█         | 124/1208 [03:53<34:03,  1.89s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.45e-5, train/loss_step=0.0152, global_step=8486.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  10%|█         | 125/1208 [03:54<33:54,  1.88s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.45e-5, train/loss_step=0.0152, global_step=8486.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  10%|█         | 125/1208 [03:54<33:54,  1.88s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0964, train/loss_vlb_step=0.000318, train/loss_step=0.0964, global_step=8487.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  10%|█         | 126/1208 [03:55<33:45,  1.87s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0964, train/loss_vlb_step=0.000318, train/loss_step=0.0964, global_step=8487.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  10%|█         | 126/1208 [03:55<33:45,  1.87s/it, loss=0.16, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000431, train/loss_step=0.131, global_step=8487.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  11%|█         | 127/1208 [03:56<33:36,  1.87s/it, loss=0.16, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000431, train/loss_step=0.131, global_step=8487.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  11%|█         | 127/1208 [03:56<33:36,  1.87s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0897, train/loss_vlb_step=0.000298, train/loss_step=0.0897, global_step=8487.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  11%|█         | 128/1208 [04:00<33:47,  1.88s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0897, train/loss_vlb_step=0.000298, train/loss_step=0.0897, global_step=8487.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  11%|█         | 128/1208 [04:00<33:47,  1.88s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=3.14e-5, train/loss_step=0.00615, global_step=8487.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  11%|█         | 129/1208 [04:01<33:38,  1.87s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=3.14e-5, train/loss_step=0.00615, global_step=8487.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  11%|█         | 129/1208 [04:01<33:38,  1.87s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00866, train/loss_vlb_step=4.25e-5, train/loss_step=0.00866, global_step=8488.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  11%|█         | 130/1208 [04:02<33:30,  1.86s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00866, train/loss_vlb_step=4.25e-5, train/loss_step=0.00866, global_step=8488.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  11%|█         | 130/1208 [04:02<33:30,  1.86s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00364, train/loss_vlb_step=1.95e-5, train/loss_step=0.00364, global_step=8488.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  11%|█         | 131/1208 [04:03<33:22,  1.86s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00364, train/loss_vlb_step=1.95e-5, train/loss_step=0.00364, global_step=8488.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  11%|█         | 131/1208 [04:03<33:22,  1.86s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0503, train/loss_vlb_step=0.000181, train/loss_step=0.0503, global_step=8488.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  11%|█         | 132/1208 [04:06<33:30,  1.87s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0503, train/loss_vlb_step=0.000181, train/loss_step=0.0503, global_step=8488.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  11%|█         | 132/1208 [04:06<33:31,  1.87s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00401, train/loss_vlb_step=2.03e-5, train/loss_step=0.00401, global_step=8488.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  11%|█         | 133/1208 [04:07<33:22,  1.86s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00401, train/loss_vlb_step=2.03e-5, train/loss_step=0.00401, global_step=8488.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  11%|█         | 133/1208 [04:07<33:22,  1.86s/it, loss=0.107, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000653, train/loss_step=0.184, global_step=8489.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  11%|█         | 134/1208 [04:08<33:14,  1.86s/it, loss=0.107, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000653, train/loss_step=0.184, global_step=8489.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  11%|█         | 134/1208 [04:08<33:14,  1.86s/it, loss=0.106, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000494, train/loss_step=0.146, global_step=8489.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  11%|█         | 135/1208 [04:09<33:06,  1.85s/it, loss=0.106, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000494, train/loss_step=0.146, global_step=8489.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  11%|█         | 135/1208 [04:09<33:06,  1.85s/it, loss=0.0808, v_num=0, train/loss_simple_step=0.0548, train/loss_vlb_step=0.000186, train/loss_step=0.0548, global_step=8489.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  11%|█▏        | 136/1208 [04:13<33:15,  1.86s/it, loss=0.0808, v_num=0, train/loss_simple_step=0.0548, train/loss_vlb_step=0.000186, train/loss_step=0.0548, global_step=8489.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  11%|█▏        | 136/1208 [04:13<33:15,  1.86s/it, loss=0.104, v_num=0, train/loss_simple_step=0.489, train/loss_vlb_step=0.00779, train/loss_step=0.489, global_step=8489.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  11%|█▏        | 137/1208 [04:14<33:08,  1.86s/it, loss=0.104, v_num=0, train/loss_simple_step=0.489, train/loss_vlb_step=0.00779, train/loss_step=0.489, global_step=8489.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  11%|█▏        | 137/1208 [04:14<33:08,  1.86s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.00635, train/loss_vlb_step=3.14e-5, train/loss_step=0.00635, global_step=8490.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  11%|█▏        | 138/1208 [04:15<33:00,  1.85s/it, loss=0.0978, v_num=0, train/loss_simple_step=0.00635, train/loss_vlb_step=3.14e-5, train/loss_step=0.00635, global_step=8490.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  11%|█▏        | 138/1208 [04:15<33:00,  1.85s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.03e-5, train/loss_step=0.0194, global_step=8490.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  12%|█▏        | 139/1208 [04:16<32:52,  1.85s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.03e-5, train/loss_step=0.0194, global_step=8490.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  12%|█▏        | 139/1208 [04:16<32:52,  1.85s/it, loss=0.103, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000473, train/loss_step=0.143, global_step=8490.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  12%|█▏        | 140/1208 [04:19<33:00,  1.85s/it, loss=0.103, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000473, train/loss_step=0.143, global_step=8490.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  12%|█▏        | 140/1208 [04:19<33:00,  1.85s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.32e-5, train/loss_step=0.0207, global_step=8490.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  12%|█▏        | 141/1208 [04:20<32:53,  1.85s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.32e-5, train/loss_step=0.0207, global_step=8490.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  12%|█▏        | 141/1208 [04:20<32:53,  1.85s/it, loss=0.1, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000432, train/loss_step=0.130, global_step=8491.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  12%|█▏        | 142/1208 [04:21<32:45,  1.84s/it, loss=0.1, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000432, train/loss_step=0.130, global_step=8491.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  12%|█▏        | 142/1208 [04:21<32:45,  1.84s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=8.1e-5, train/loss_step=0.019, global_step=8491.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  12%|█▏        | 143/1208 [04:22<32:38,  1.84s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=8.1e-5, train/loss_step=0.019, global_step=8491.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  12%|█▏        | 143/1208 [04:22<32:38,  1.84s/it, loss=0.083, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.000153, train/loss_step=0.0425, global_step=8491.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  12%|█▏        | 144/1208 [04:26<32:46,  1.85s/it, loss=0.083, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.000153, train/loss_step=0.0425, global_step=8491.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  12%|█▏        | 144/1208 [04:26<32:46,  1.85s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000519, train/loss_step=0.149, global_step=8491.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  12%|█▏        | 145/1208 [04:27<32:38,  1.84s/it, loss=0.0897, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000519, train/loss_step=0.149, global_step=8491.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  12%|█▏        | 145/1208 [04:27<32:38,  1.84s/it, loss=0.0849, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.15e-5, train/loss_step=0.00197, global_step=8492.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  12%|█▏        | 146/1208 [04:28<32:31,  1.84s/it, loss=0.0849, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.15e-5, train/loss_step=0.00197, global_step=8492.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  12%|█▏        | 146/1208 [04:28<32:31,  1.84s/it, loss=0.0787, v_num=0, train/loss_simple_step=0.0067, train/loss_vlb_step=3.44e-5, train/loss_step=0.0067, global_step=8492.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  12%|█▏        | 147/1208 [04:29<32:23,  1.83s/it, loss=0.0787, v_num=0, train/loss_simple_step=0.0067, train/loss_vlb_step=3.44e-5, train/loss_step=0.0067, global_step=8492.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  12%|█▏        | 147/1208 [04:29<32:23,  1.83s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000994, train/loss_step=0.228, global_step=8492.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  12%|█▏        | 148/1208 [04:32<32:32,  1.84s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000994, train/loss_step=0.228, global_step=8492.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  12%|█▏        | 148/1208 [04:32<32:32,  1.84s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.00707, train/loss_vlb_step=3.51e-5, train/loss_step=0.00707, global_step=8492.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  12%|█▏        | 149/1208 [04:33<32:24,  1.84s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.00707, train/loss_vlb_step=3.51e-5, train/loss_step=0.00707, global_step=8492.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  12%|█▏        | 149/1208 [04:33<32:24,  1.84s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=9.66e-5, train/loss_step=0.0249, global_step=8493.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  12%|█▏        | 150/1208 [04:34<32:17,  1.83s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=9.66e-5, train/loss_step=0.0249, global_step=8493.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  12%|█▏        | 150/1208 [04:34<32:17,  1.83s/it, loss=0.0917, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=8493.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  12%|█▎        | 151/1208 [04:35<32:10,  1.83s/it, loss=0.0917, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=8493.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  12%|█▎        | 151/1208 [04:35<32:10,  1.83s/it, loss=0.102, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00117, train/loss_step=0.252, global_step=8493.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  13%|█▎        | 152/1208 [04:39<32:18,  1.84s/it, loss=0.102, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00117, train/loss_step=0.252, global_step=8493.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  13%|█▎        | 152/1208 [04:39<32:18,  1.84s/it, loss=0.107, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=8493.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  13%|█▎        | 153/1208 [04:40<32:11,  1.83s/it, loss=0.107, v_num=0, train/loss_simple_step=0.115, train/loss_vlb_step=0.000378, train/loss_step=0.115, global_step=8493.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  13%|█▎        | 153/1208 [04:40<32:11,  1.83s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0875, train/loss_vlb_step=0.00029, train/loss_step=0.0875, global_step=8494.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  13%|█▎        | 154/1208 [04:41<32:04,  1.83s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0875, train/loss_vlb_step=0.00029, train/loss_step=0.0875, global_step=8494.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  13%|█▎        | 154/1208 [04:41<32:04,  1.83s/it, loss=0.102, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000417, train/loss_step=0.126, global_step=8494.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  13%|█▎        | 155/1208 [04:42<31:57,  1.82s/it, loss=0.102, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000417, train/loss_step=0.126, global_step=8494.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  13%|█▎        | 155/1208 [04:42<31:57,  1.82s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0271, train/loss_vlb_step=0.000104, train/loss_step=0.0271, global_step=8494.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  13%|█▎        | 156/1208 [04:45<32:06,  1.83s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0271, train/loss_vlb_step=0.000104, train/loss_step=0.0271, global_step=8494.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  13%|█▎        | 156/1208 [04:45<32:06,  1.83s/it, loss=0.0791, v_num=0, train/loss_simple_step=0.0677, train/loss_vlb_step=0.000231, train/loss_step=0.0677, global_step=8494.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  13%|█▎        | 157/1208 [04:46<31:59,  1.83s/it, loss=0.0791, v_num=0, train/loss_simple_step=0.0677, train/loss_vlb_step=0.000231, train/loss_step=0.0677, global_step=8494.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  13%|█▎        | 157/1208 [04:46<31:59,  1.83s/it, loss=0.0923, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00115, train/loss_step=0.269, global_step=8495.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  13%|█▎        | 158/1208 [04:47<31:52,  1.82s/it, loss=0.0923, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00115, train/loss_step=0.269, global_step=8495.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  13%|█▎        | 158/1208 [04:47<31:52,  1.82s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.0893, train/loss_vlb_step=0.000294, train/loss_step=0.0893, global_step=8495.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  13%|█▎        | 159/1208 [04:49<31:46,  1.82s/it, loss=0.0958, v_num=0, train/loss_simple_step=0.0893, train/loss_vlb_step=0.000294, train/loss_step=0.0893, global_step=8495.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  13%|█▎        | 159/1208 [04:49<31:46,  1.82s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000688, train/loss_step=0.186, global_step=8495.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  13%|█▎        | 160/1208 [04:52<31:53,  1.83s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000688, train/loss_step=0.186, global_step=8495.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  13%|█▎        | 160/1208 [04:52<31:53,  1.83s/it, loss=0.097, v_num=0, train/loss_simple_step=0.00228, train/loss_vlb_step=1.37e-5, train/loss_step=0.00228, global_step=8495.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  13%|█▎        | 161/1208 [04:53<31:46,  1.82s/it, loss=0.097, v_num=0, train/loss_simple_step=0.00228, train/loss_vlb_step=1.37e-5, train/loss_step=0.00228, global_step=8495.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  13%|█▎        | 161/1208 [04:53<31:46,  1.82s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=7.61e-6, train/loss_step=0.00125, global_step=8496.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  13%|█▎        | 162/1208 [04:54<31:39,  1.82s/it, loss=0.0906, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=7.61e-6, train/loss_step=0.00125, global_step=8496.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  13%|█▎        | 162/1208 [04:54<31:39,  1.82s/it, loss=0.0917, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000149, train/loss_step=0.0405, global_step=8496.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  13%|█▎        | 163/1208 [04:55<31:33,  1.81s/it, loss=0.0917, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000149, train/loss_step=0.0405, global_step=8496.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  13%|█▎        | 163/1208 [04:55<31:33,  1.81s/it, loss=0.101, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000886, train/loss_step=0.225, global_step=8496.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  14%|█▎        | 164/1208 [04:58<31:40,  1.82s/it, loss=0.101, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000886, train/loss_step=0.225, global_step=8496.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  14%|█▎        | 164/1208 [04:58<31:40,  1.82s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.00043, train/loss_step=0.131, global_step=8496.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  14%|█▎        | 165/1208 [04:59<31:34,  1.82s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.00043, train/loss_step=0.131, global_step=8496.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  14%|█▎        | 165/1208 [04:59<31:34,  1.82s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0888, train/loss_vlb_step=0.000294, train/loss_step=0.0888, global_step=8497.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  14%|█▎        | 166/1208 [05:00<31:27,  1.81s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0888, train/loss_vlb_step=0.000294, train/loss_step=0.0888, global_step=8497.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  14%|█▎        | 166/1208 [05:00<31:27,  1.81s/it, loss=0.122, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00219, train/loss_step=0.364, global_step=8497.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  14%|█▍        | 167/1208 [05:01<31:21,  1.81s/it, loss=0.122, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00219, train/loss_step=0.364, global_step=8497.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  14%|█▍        | 167/1208 [05:01<31:21,  1.81s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00376, train/loss_vlb_step=1.98e-5, train/loss_step=0.00376, global_step=8497.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  14%|█▍        | 168/1208 [05:05<31:28,  1.82s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00376, train/loss_vlb_step=1.98e-5, train/loss_step=0.00376, global_step=8497.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  14%|█▍        | 168/1208 [05:05<31:28,  1.82s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0054, train/loss_vlb_step=2.87e-5, train/loss_step=0.0054, global_step=8497.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  14%|█▍        | 169/1208 [05:06<31:22,  1.81s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0054, train/loss_vlb_step=2.87e-5, train/loss_step=0.0054, global_step=8497.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  14%|█▍        | 169/1208 [05:06<31:22,  1.81s/it, loss=0.134, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.0067, train/loss_step=0.485, global_step=8498.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  14%|█▍        | 170/1208 [05:07<31:16,  1.81s/it, loss=0.134, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.0067, train/loss_step=0.485, global_step=8498.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  14%|█▍        | 170/1208 [05:07<31:16,  1.81s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0053, train/loss_vlb_step=2.73e-5, train/loss_step=0.0053, global_step=8498.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  14%|█▍        | 171/1208 [05:08<31:10,  1.80s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0053, train/loss_vlb_step=2.73e-5, train/loss_step=0.0053, global_step=8498.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  14%|█▍        | 171/1208 [05:08<31:10,  1.80s/it, loss=0.126, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000761, train/loss_step=0.202, global_step=8498.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  14%|█▍        | 172/1208 [05:11<31:16,  1.81s/it, loss=0.126, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000761, train/loss_step=0.202, global_step=8498.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  14%|█▍        | 172/1208 [05:11<31:16,  1.81s/it, loss=0.133, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.00105, train/loss_step=0.246, global_step=8498.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  14%|█▍        | 173/1208 [05:12<31:10,  1.81s/it, loss=0.133, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.00105, train/loss_step=0.246, global_step=8498.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  14%|█▍        | 173/1208 [05:12<31:10,  1.81s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00476, train/loss_vlb_step=2.49e-5, train/loss_step=0.00476, global_step=8499.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  14%|█▍        | 174/1208 [05:13<31:04,  1.80s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00476, train/loss_vlb_step=2.49e-5, train/loss_step=0.00476, global_step=8499.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  14%|█▍        | 174/1208 [05:13<31:04,  1.80s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0882, train/loss_vlb_step=0.000293, train/loss_step=0.0882, global_step=8499.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  14%|█▍        | 175/1208 [05:14<30:57,  1.80s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0882, train/loss_vlb_step=0.000293, train/loss_step=0.0882, global_step=8499.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  14%|█▍        | 175/1208 [05:14<30:57,  1.80s/it, loss=0.139, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00133, train/loss_step=0.279, global_step=8499.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  15%|█▍        | 176/1208 [05:17<31:04,  1.81s/it, loss=0.139, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00133, train/loss_step=0.279, global_step=8499.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  15%|█▍        | 176/1208 [05:17<31:04,  1.81s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0294, train/loss_vlb_step=0.000114, train/loss_step=0.0294, global_step=8499.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  15%|█▍        | 177/1208 [05:19<30:58,  1.80s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0294, train/loss_vlb_step=0.000114, train/loss_step=0.0294, global_step=8499.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  15%|█▍        | 177/1208 [05:19<30:58,  1.80s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00564, train/loss_vlb_step=2.84e-5, train/loss_step=0.00564, global_step=8500.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  15%|█▍        | 178/1208 [05:20<30:52,  1.80s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00564, train/loss_vlb_step=2.84e-5, train/loss_step=0.00564, global_step=8500.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  15%|█▍        | 178/1208 [05:20<30:52,  1.80s/it, loss=0.134, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.0014, train/loss_step=0.282, global_step=8500.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]     Epoch 28:  15%|█▍        | 179/1208 [05:21<30:46,  1.79s/it, loss=0.134, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.0014, train/loss_step=0.282, global_step=8500.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  15%|█▍        | 179/1208 [05:21<30:46,  1.79s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00686, train/loss_vlb_step=3.37e-5, train/loss_step=0.00686, global_step=8500.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  15%|█▍        | 180/1208 [05:24<30:52,  1.80s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00686, train/loss_vlb_step=3.37e-5, train/loss_step=0.00686, global_step=8500.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  15%|█▍        | 180/1208 [05:24<30:52,  1.80s/it, loss=0.132, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000521, train/loss_step=0.151, global_step=8500.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  15%|█▍        | 181/1208 [05:25<30:47,  1.80s/it, loss=0.132, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000521, train/loss_step=0.151, global_step=8500.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  15%|█▍        | 181/1208 [05:25<30:47,  1.80s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00353, train/loss_vlb_step=1.9e-5, train/loss_step=0.00353, global_step=8501.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  15%|█▌        | 182/1208 [05:26<30:41,  1.79s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00353, train/loss_vlb_step=1.9e-5, train/loss_step=0.00353, global_step=8501.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  15%|█▌        | 182/1208 [05:26<30:41,  1.79s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00419, train/loss_vlb_step=2.32e-5, train/loss_step=0.00419, global_step=8501.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  15%|█▌        | 183/1208 [05:27<30:35,  1.79s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00419, train/loss_vlb_step=2.32e-5, train/loss_step=0.00419, global_step=8501.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  15%|█▌        | 183/1208 [05:27<30:35,  1.79s/it, loss=0.136, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00189, train/loss_step=0.335, global_step=8501.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  15%|█▌        | 184/1208 [05:30<30:41,  1.80s/it, loss=0.136, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00189, train/loss_step=0.335, global_step=8501.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  15%|█▌        | 184/1208 [05:30<30:41,  1.80s/it, loss=0.14, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000855, train/loss_step=0.216, global_step=8501.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  15%|█▌        | 185/1208 [05:31<30:35,  1.79s/it, loss=0.14, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000855, train/loss_step=0.216, global_step=8501.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  15%|█▌        | 185/1208 [05:31<30:35,  1.79s/it, loss=0.141, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000363, train/loss_step=0.109, global_step=8502.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  15%|█▌        | 186/1208 [05:33<30:30,  1.79s/it, loss=0.141, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000363, train/loss_step=0.109, global_step=8502.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  15%|█▌        | 186/1208 [05:33<30:30,  1.79s/it, loss=0.131, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000543, train/loss_step=0.162, global_step=8502.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  15%|█▌        | 187/1208 [05:34<30:24,  1.79s/it, loss=0.131, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000543, train/loss_step=0.162, global_step=8502.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  15%|█▌        | 187/1208 [05:34<30:24,  1.79s/it, loss=0.148, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00194, train/loss_step=0.347, global_step=8502.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  16%|█▌        | 188/1208 [05:37<30:29,  1.79s/it, loss=0.148, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00194, train/loss_step=0.347, global_step=8502.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  16%|█▌        | 188/1208 [05:37<30:29,  1.79s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0321, train/loss_vlb_step=0.000126, train/loss_step=0.0321, global_step=8502.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  16%|█▌        | 189/1208 [05:38<30:24,  1.79s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0321, train/loss_vlb_step=0.000126, train/loss_step=0.0321, global_step=8502.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  16%|█▌        | 189/1208 [05:38<30:24,  1.79s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000121, train/loss_step=0.0327, global_step=8503.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  16%|█▌        | 190/1208 [05:39<30:19,  1.79s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000121, train/loss_step=0.0327, global_step=8503.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  16%|█▌        | 190/1208 [05:39<30:19,  1.79s/it, loss=0.135, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.00052, train/loss_step=0.155, global_step=8503.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  16%|█▌        | 191/1208 [05:40<30:13,  1.78s/it, loss=0.135, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.00052, train/loss_step=0.155, global_step=8503.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  16%|█▌        | 191/1208 [05:40<30:13,  1.78s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=1.11e-5, train/loss_step=0.00185, global_step=8503.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  16%|█▌        | 192/1208 [05:43<30:19,  1.79s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=1.11e-5, train/loss_step=0.00185, global_step=8503.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  16%|█▌        | 192/1208 [05:43<30:19,  1.79s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=3.69e-5, train/loss_step=0.00742, global_step=8503.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  16%|█▌        | 193/1208 [05:44<30:14,  1.79s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=3.69e-5, train/loss_step=0.00742, global_step=8503.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  16%|█▌        | 193/1208 [05:44<30:14,  1.79s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0869, train/loss_vlb_step=0.000287, train/loss_step=0.0869, global_step=8504.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  16%|█▌        | 194/1208 [05:46<30:08,  1.78s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0869, train/loss_vlb_step=0.000287, train/loss_step=0.0869, global_step=8504.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  16%|█▌        | 194/1208 [05:46<30:08,  1.78s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=9.37e-6, train/loss_step=0.00161, global_step=8504.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  16%|█▌        | 195/1208 [05:47<30:03,  1.78s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=9.37e-6, train/loss_step=0.00161, global_step=8504.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  16%|█▌        | 195/1208 [05:47<30:03,  1.78s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.00389, train/loss_vlb_step=2.12e-5, train/loss_step=0.00389, global_step=8504.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  16%|█▌        | 196/1208 [05:50<30:08,  1.79s/it, loss=0.0986, v_num=0, train/loss_simple_step=0.00389, train/loss_vlb_step=2.12e-5, train/loss_step=0.00389, global_step=8504.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  16%|█▌        | 196/1208 [05:50<30:08,  1.79s/it, loss=0.103, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000367, train/loss_step=0.112, global_step=8504.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  16%|█▋        | 197/1208 [05:51<30:02,  1.78s/it, loss=0.103, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000367, train/loss_step=0.112, global_step=8504.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  16%|█▋        | 197/1208 [05:51<30:02,  1.78s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00618, train/loss_vlb_step=3.07e-5, train/loss_step=0.00618, global_step=8505.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  16%|█▋        | 198/1208 [05:52<29:57,  1.78s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00618, train/loss_vlb_step=3.07e-5, train/loss_step=0.00618, global_step=8505.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  16%|█▋        | 198/1208 [05:52<29:57,  1.78s/it, loss=0.102, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00123, train/loss_step=0.266, global_step=8505.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  16%|█▋        | 199/1208 [05:53<29:51,  1.78s/it, loss=0.102, v_num=0, train/loss_simple_step=0.266, train/loss_vlb_step=0.00123, train/loss_step=0.266, global_step=8505.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  16%|█▋        | 199/1208 [05:53<29:51,  1.78s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00338, train/loss_vlb_step=1.81e-5, train/loss_step=0.00338, global_step=8505.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  17%|█▋        | 200/1208 [05:56<29:57,  1.78s/it, loss=0.102, v_num=0, train/loss_simple_step=0.00338, train/loss_vlb_step=1.81e-5, train/loss_step=0.00338, global_step=8505.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  17%|█▋        | 200/1208 [05:56<29:57,  1.78s/it, loss=0.119, v_num=0, train/loss_simple_step=0.493, train/loss_vlb_step=0.00454, train/loss_step=0.493, global_step=8505.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  17%|█▋        | 201/1208 [05:57<29:52,  1.78s/it, loss=0.119, v_num=0, train/loss_simple_step=0.493, train/loss_vlb_step=0.00454, train/loss_step=0.493, global_step=8505.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  17%|█▋        | 201/1208 [05:57<29:52,  1.78s/it, loss=0.136, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00211, train/loss_step=0.343, global_step=8506.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  17%|█▋        | 202/1208 [05:58<29:46,  1.78s/it, loss=0.136, v_num=0, train/loss_simple_step=0.343, train/loss_vlb_step=0.00211, train/loss_step=0.343, global_step=8506.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  17%|█▋        | 202/1208 [05:58<29:46,  1.78s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.69e-5, train/loss_step=0.0235, global_step=8506.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  17%|█▋        | 203/1208 [05:59<29:41,  1.77s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.69e-5, train/loss_step=0.0235, global_step=8506.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  17%|█▋        | 203/1208 [05:59<29:41,  1.77s/it, loss=0.132, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.00101, train/loss_step=0.238, global_step=8506.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  17%|█▋        | 204/1208 [06:03<29:47,  1.78s/it, loss=0.132, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.00101, train/loss_step=0.238, global_step=8506.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  17%|█▋        | 204/1208 [06:03<29:47,  1.78s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0582, train/loss_vlb_step=0.000206, train/loss_step=0.0582, global_step=8506.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  17%|█▋        | 205/1208 [06:04<29:42,  1.78s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0582, train/loss_vlb_step=0.000206, train/loss_step=0.0582, global_step=8506.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  17%|█▋        | 205/1208 [06:04<29:42,  1.78s/it, loss=0.131, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.00116, train/loss_step=0.242, global_step=8507.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  17%|█▋        | 206/1208 [06:05<29:37,  1.77s/it, loss=0.131, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.00116, train/loss_step=0.242, global_step=8507.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  17%|█▋        | 206/1208 [06:05<29:37,  1.77s/it, loss=0.147, v_num=0, train/loss_simple_step=0.477, train/loss_vlb_step=0.00468, train/loss_step=0.477, global_step=8507.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  17%|█▋        | 207/1208 [06:06<29:31,  1.77s/it, loss=0.147, v_num=0, train/loss_simple_step=0.477, train/loss_vlb_step=0.00468, train/loss_step=0.477, global_step=8507.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  17%|█▋        | 207/1208 [06:06<29:31,  1.77s/it, loss=0.149, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00329, train/loss_step=0.396, global_step=8507.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  17%|█▋        | 208/1208 [06:09<29:37,  1.78s/it, loss=0.149, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.00329, train/loss_step=0.396, global_step=8507.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  17%|█▋        | 208/1208 [06:09<29:37,  1.78s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0701, train/loss_vlb_step=0.000234, train/loss_step=0.0701, global_step=8507.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  17%|█▋        | 209/1208 [06:10<29:32,  1.77s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0701, train/loss_vlb_step=0.000234, train/loss_step=0.0701, global_step=8507.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  17%|█▋        | 209/1208 [06:10<29:32,  1.77s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0466, train/loss_vlb_step=0.000164, train/loss_step=0.0466, global_step=8508.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  17%|█▋        | 210/1208 [06:11<29:27,  1.77s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0466, train/loss_vlb_step=0.000164, train/loss_step=0.0466, global_step=8508.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  17%|█▋        | 210/1208 [06:11<29:27,  1.77s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.000119, train/loss_step=0.0322, global_step=8508.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  17%|█▋        | 211/1208 [06:12<29:21,  1.77s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.000119, train/loss_step=0.0322, global_step=8508.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  17%|█▋        | 211/1208 [06:12<29:21,  1.77s/it, loss=0.158, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00124, train/loss_step=0.259, global_step=8508.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  18%|█▊        | 212/1208 [06:16<29:27,  1.77s/it, loss=0.158, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00124, train/loss_step=0.259, global_step=8508.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  18%|█▊        | 212/1208 [06:16<29:27,  1.77s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.21e-5, train/loss_step=0.00199, global_step=8508.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  18%|█▊        | 213/1208 [06:17<29:22,  1.77s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.21e-5, train/loss_step=0.00199, global_step=8508.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  18%|█▊        | 213/1208 [06:17<29:22,  1.77s/it, loss=0.176, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00571, train/loss_step=0.439, global_step=8509.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  18%|█▊        | 214/1208 [06:18<29:17,  1.77s/it, loss=0.176, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00571, train/loss_step=0.439, global_step=8509.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  18%|█▊        | 214/1208 [06:18<29:17,  1.77s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=9.1e-5, train/loss_step=0.0218, global_step=8509.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  18%|█▊        | 215/1208 [06:19<29:12,  1.76s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=9.1e-5, train/loss_step=0.0218, global_step=8509.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  18%|█▊        | 215/1208 [06:19<29:12,  1.76s/it, loss=0.183, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000401, train/loss_step=0.121, global_step=8509.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  18%|█▊        | 216/1208 [06:22<29:17,  1.77s/it, loss=0.183, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000401, train/loss_step=0.121, global_step=8509.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  18%|█▊        | 216/1208 [06:22<29:17,  1.77s/it, loss=0.185, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000571, train/loss_step=0.168, global_step=8509.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  18%|█▊        | 217/1208 [06:23<29:12,  1.77s/it, loss=0.185, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000571, train/loss_step=0.168, global_step=8509.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  18%|█▊        | 217/1208 [06:23<29:12,  1.77s/it, loss=0.194, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000578, train/loss_step=0.173, global_step=8510.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  18%|█▊        | 218/1208 [06:24<29:07,  1.77s/it, loss=0.194, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000578, train/loss_step=0.173, global_step=8510.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  18%|█▊        | 218/1208 [06:24<29:07,  1.77s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000104, train/loss_step=0.0262, global_step=8510.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  18%|█▊        | 219/1208 [06:25<29:02,  1.76s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000104, train/loss_step=0.0262, global_step=8510.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  18%|█▊        | 219/1208 [06:25<29:02,  1.76s/it, loss=0.197, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00211, train/loss_step=0.314, global_step=8510.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  18%|█▊        | 220/1208 [06:29<29:08,  1.77s/it, loss=0.197, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.00211, train/loss_step=0.314, global_step=8510.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  18%|█▊        | 220/1208 [06:29<29:08,  1.77s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9.33e-5, train/loss_step=0.0224, global_step=8510.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  18%|█▊        | 221/1208 [06:30<29:03,  1.77s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9.33e-5, train/loss_step=0.0224, global_step=8510.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  18%|█▊        | 221/1208 [06:30<29:03,  1.77s/it, loss=0.164, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000494, train/loss_step=0.148, global_step=8511.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  18%|█▊        | 222/1208 [06:31<28:58,  1.76s/it, loss=0.164, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000494, train/loss_step=0.148, global_step=8511.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  18%|█▊        | 222/1208 [06:31<28:58,  1.76s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0618, train/loss_vlb_step=0.000205, train/loss_step=0.0618, global_step=8511.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  18%|█▊        | 223/1208 [06:32<28:53,  1.76s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0618, train/loss_vlb_step=0.000205, train/loss_step=0.0618, global_step=8511.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  18%|█▊        | 223/1208 [06:32<28:53,  1.76s/it, loss=0.163, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000668, train/loss_step=0.182, global_step=8511.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  19%|█▊        | 224/1208 [06:35<28:57,  1.77s/it, loss=0.163, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000668, train/loss_step=0.182, global_step=8511.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  19%|█▊        | 224/1208 [06:35<28:57,  1.77s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.87e-5, train/loss_step=0.0104, global_step=8511.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  19%|█▊        | 225/1208 [06:36<28:53,  1.76s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.87e-5, train/loss_step=0.0104, global_step=8511.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  19%|█▊        | 225/1208 [06:36<28:53,  1.76s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=9.86e-6, train/loss_step=0.00165, global_step=8512.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  19%|█▊        | 226/1208 [06:37<28:48,  1.76s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=9.86e-6, train/loss_step=0.00165, global_step=8512.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  19%|█▊        | 226/1208 [06:37<28:48,  1.76s/it, loss=0.127, v_num=0, train/loss_simple_step=0.037, train/loss_vlb_step=0.000138, train/loss_step=0.037, global_step=8512.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  19%|█▉        | 227/1208 [06:38<28:43,  1.76s/it, loss=0.127, v_num=0, train/loss_simple_step=0.037, train/loss_vlb_step=0.000138, train/loss_step=0.037, global_step=8512.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  19%|█▉        | 227/1208 [06:38<28:43,  1.76s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=1.67e-5, train/loss_step=0.00295, global_step=8512.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  19%|█▉        | 228/1208 [06:42<28:48,  1.76s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=1.67e-5, train/loss_step=0.00295, global_step=8512.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  19%|█▉        | 228/1208 [06:42<28:48,  1.76s/it, loss=0.114, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.00072, train/loss_step=0.217, global_step=8512.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  19%|█▉        | 229/1208 [06:43<28:43,  1.76s/it, loss=0.114, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.00072, train/loss_step=0.217, global_step=8512.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  19%|█▉        | 229/1208 [06:43<28:43,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=8.87e-5, train/loss_step=0.0232, global_step=8513.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  19%|█▉        | 230/1208 [06:44<28:38,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=8.87e-5, train/loss_step=0.0232, global_step=8513.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  19%|█▉        | 230/1208 [06:44<28:38,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000538, train/loss_step=0.152, global_step=8513.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  19%|█▉        | 231/1208 [06:45<28:34,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000538, train/loss_step=0.152, global_step=8513.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  19%|█▉        | 231/1208 [06:45<28:34,  1.75s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00433, train/loss_vlb_step=2.23e-5, train/loss_step=0.00433, global_step=8513.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  19%|█▉        | 232/1208 [06:48<28:38,  1.76s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00433, train/loss_vlb_step=2.23e-5, train/loss_step=0.00433, global_step=8513.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  19%|█▉        | 232/1208 [06:48<28:38,  1.76s/it, loss=0.122, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00153, train/loss_step=0.308, global_step=8513.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  19%|█▉        | 233/1208 [06:49<28:34,  1.76s/it, loss=0.122, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00153, train/loss_step=0.308, global_step=8513.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  19%|█▉        | 233/1208 [06:49<28:34,  1.76s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=1.73e-5, train/loss_step=0.00298, global_step=8514.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  19%|█▉        | 234/1208 [06:50<28:29,  1.76s/it, loss=0.0999, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=1.73e-5, train/loss_step=0.00298, global_step=8514.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  19%|█▉        | 234/1208 [06:50<28:29,  1.76s/it, loss=0.0991, v_num=0, train/loss_simple_step=0.0067, train/loss_vlb_step=3.37e-5, train/loss_step=0.0067, global_step=8514.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  19%|█▉        | 235/1208 [06:51<28:24,  1.75s/it, loss=0.0991, v_num=0, train/loss_simple_step=0.0067, train/loss_vlb_step=3.37e-5, train/loss_step=0.0067, global_step=8514.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  19%|█▉        | 235/1208 [06:51<28:24,  1.75s/it, loss=0.108, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00159, train/loss_step=0.303, global_step=8514.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  20%|█▉        | 236/1208 [06:54<28:28,  1.76s/it, loss=0.108, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00159, train/loss_step=0.303, global_step=8514.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  20%|█▉        | 236/1208 [06:54<28:28,  1.76s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0366, train/loss_vlb_step=0.000138, train/loss_step=0.0366, global_step=8514.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  20%|█▉        | 237/1208 [06:56<28:24,  1.76s/it, loss=0.102, v_num=0, train/loss_simple_step=0.0366, train/loss_vlb_step=0.000138, train/loss_step=0.0366, global_step=8514.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  20%|█▉        | 237/1208 [06:56<28:24,  1.76s/it, loss=0.106, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00113, train/loss_step=0.264, global_step=8515.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  20%|█▉        | 238/1208 [06:57<28:19,  1.75s/it, loss=0.106, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00113, train/loss_step=0.264, global_step=8515.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  20%|█▉        | 238/1208 [06:57<28:19,  1.75s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0516, train/loss_vlb_step=0.000178, train/loss_step=0.0516, global_step=8515.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  20%|█▉        | 239/1208 [06:58<28:15,  1.75s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0516, train/loss_vlb_step=0.000178, train/loss_step=0.0516, global_step=8515.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  20%|█▉        | 239/1208 [06:58<28:15,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00352, train/loss_step=0.434, global_step=8515.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  20%|█▉        | 240/1208 [07:01<28:19,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00352, train/loss_step=0.434, global_step=8515.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  20%|█▉        | 240/1208 [07:01<28:19,  1.76s/it, loss=0.134, v_num=0, train/loss_simple_step=0.441, train/loss_vlb_step=0.00304, train/loss_step=0.441, global_step=8515.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  20%|█▉        | 241/1208 [07:02<28:15,  1.75s/it, loss=0.134, v_num=0, train/loss_simple_step=0.441, train/loss_vlb_step=0.00304, train/loss_step=0.441, global_step=8515.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  20%|█▉        | 241/1208 [07:02<28:15,  1.75s/it, loss=0.135, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000543, train/loss_step=0.154, global_step=8516.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  20%|██        | 242/1208 [07:03<28:10,  1.75s/it, loss=0.135, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000543, train/loss_step=0.154, global_step=8516.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  20%|██        | 242/1208 [07:03<28:10,  1.75s/it, loss=0.164, v_num=0, train/loss_simple_step=0.642, train/loss_vlb_step=0.0114, train/loss_step=0.642, global_step=8516.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  20%|██        | 243/1208 [07:04<28:06,  1.75s/it, loss=0.164, v_num=0, train/loss_simple_step=0.642, train/loss_vlb_step=0.0114, train/loss_step=0.642, global_step=8516.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  20%|██        | 243/1208 [07:04<28:06,  1.75s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00403, train/loss_vlb_step=2.17e-5, train/loss_step=0.00403, global_step=8516.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  20%|██        | 244/1208 [07:07<28:10,  1.75s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00403, train/loss_vlb_step=2.17e-5, train/loss_step=0.00403, global_step=8516.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  20%|██        | 244/1208 [07:07<28:10,  1.75s/it, loss=0.184, v_num=0, train/loss_simple_step=0.594, train/loss_vlb_step=0.0175, train/loss_step=0.594, global_step=8516.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]     Epoch 28:  20%|██        | 245/1208 [07:08<28:06,  1.75s/it, loss=0.184, v_num=0, train/loss_simple_step=0.594, train/loss_vlb_step=0.0175, train/loss_step=0.594, global_step=8516.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  20%|██        | 245/1208 [07:08<28:06,  1.75s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.51e-5, train/loss_step=0.0242, global_step=8517.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  20%|██        | 246/1208 [07:10<28:01,  1.75s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.51e-5, train/loss_step=0.0242, global_step=8517.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  20%|██        | 246/1208 [07:10<28:01,  1.75s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0502, train/loss_vlb_step=0.000178, train/loss_step=0.0502, global_step=8517.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  20%|██        | 247/1208 [07:11<27:57,  1.75s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0502, train/loss_vlb_step=0.000178, train/loss_step=0.0502, global_step=8517.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  20%|██        | 247/1208 [07:11<27:57,  1.75s/it, loss=0.193, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000501, train/loss_step=0.146, global_step=8517.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  21%|██        | 248/1208 [07:14<28:01,  1.75s/it, loss=0.193, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000501, train/loss_step=0.146, global_step=8517.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  21%|██        | 248/1208 [07:14<28:01,  1.75s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.21e-5, train/loss_step=0.00205, global_step=8517.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  21%|██        | 249/1208 [07:15<27:56,  1.75s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.21e-5, train/loss_step=0.00205, global_step=8517.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  21%|██        | 249/1208 [07:15<27:56,  1.75s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0691, train/loss_vlb_step=0.000229, train/loss_step=0.0691, global_step=8518.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  21%|██        | 250/1208 [07:16<27:52,  1.75s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0691, train/loss_vlb_step=0.000229, train/loss_step=0.0691, global_step=8518.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  21%|██        | 250/1208 [07:16<27:52,  1.75s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0699, train/loss_vlb_step=0.000235, train/loss_step=0.0699, global_step=8518.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  21%|██        | 251/1208 [07:17<27:48,  1.74s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0699, train/loss_vlb_step=0.000235, train/loss_step=0.0699, global_step=8518.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  21%|██        | 251/1208 [07:17<27:48,  1.74s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000111, train/loss_step=0.0282, global_step=8518.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  21%|██        | 252/1208 [07:20<27:52,  1.75s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000111, train/loss_step=0.0282, global_step=8518.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  21%|██        | 252/1208 [07:20<27:52,  1.75s/it, loss=0.178, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00102, train/loss_step=0.237, global_step=8518.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  21%|██        | 253/1208 [07:21<27:47,  1.75s/it, loss=0.178, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.00102, train/loss_step=0.237, global_step=8518.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  21%|██        | 253/1208 [07:21<27:47,  1.75s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.66e-5, train/loss_step=0.0245, global_step=8519.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  21%|██        | 254/1208 [07:22<27:43,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=9.66e-5, train/loss_step=0.0245, global_step=8519.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  21%|██        | 254/1208 [07:22<27:43,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=5.69e-5, train/loss_step=0.0138, global_step=8519.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  21%|██        | 255/1208 [07:23<27:39,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=5.69e-5, train/loss_step=0.0138, global_step=8519.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  21%|██        | 255/1208 [07:23<27:39,  1.74s/it, loss=0.187, v_num=0, train/loss_simple_step=0.459, train/loss_vlb_step=0.00445, train/loss_step=0.459, global_step=8519.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  21%|██        | 256/1208 [07:27<27:42,  1.75s/it, loss=0.187, v_num=0, train/loss_simple_step=0.459, train/loss_vlb_step=0.00445, train/loss_step=0.459, global_step=8519.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  21%|██        | 256/1208 [07:27<27:42,  1.75s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00934, train/loss_vlb_step=4.45e-5, train/loss_step=0.00934, global_step=8519.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  21%|██▏       | 257/1208 [07:28<27:38,  1.74s/it, loss=0.186, v_num=0, train/loss_simple_step=0.00934, train/loss_vlb_step=4.45e-5, train/loss_step=0.00934, global_step=8519.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  21%|██▏       | 257/1208 [07:28<27:38,  1.74s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.75e-5, train/loss_step=0.00291, global_step=8520.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  21%|██▏       | 258/1208 [07:29<27:34,  1.74s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.75e-5, train/loss_step=0.00291, global_step=8520.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  21%|██▏       | 258/1208 [07:29<27:34,  1.74s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.92e-5, train/loss_step=0.0161, global_step=8520.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  21%|██▏       | 259/1208 [07:30<27:30,  1.74s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.92e-5, train/loss_step=0.0161, global_step=8520.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  21%|██▏       | 259/1208 [07:30<27:30,  1.74s/it, loss=0.165, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00167, train/loss_step=0.313, global_step=8520.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  22%|██▏       | 260/1208 [07:33<27:34,  1.74s/it, loss=0.165, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00167, train/loss_step=0.313, global_step=8520.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  22%|██▏       | 260/1208 [07:33<27:34,  1.74s/it, loss=0.149, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000383, train/loss_step=0.116, global_step=8520.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  22%|██▏       | 261/1208 [07:34<27:29,  1.74s/it, loss=0.149, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000383, train/loss_step=0.116, global_step=8520.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  22%|██▏       | 261/1208 [07:34<27:29,  1.74s/it, loss=0.161, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00228, train/loss_step=0.395, global_step=8521.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  22%|██▏       | 262/1208 [07:35<27:25,  1.74s/it, loss=0.161, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00228, train/loss_step=0.395, global_step=8521.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  22%|██▏       | 262/1208 [07:35<27:25,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000434, train/loss_step=0.130, global_step=8521.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  22%|██▏       | 263/1208 [07:36<27:21,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.130, train/loss_vlb_step=0.000434, train/loss_step=0.130, global_step=8521.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  22%|██▏       | 263/1208 [07:36<27:21,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.34e-5, train/loss_step=0.0179, global_step=8521.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  22%|██▏       | 264/1208 [07:40<27:25,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.34e-5, train/loss_step=0.0179, global_step=8521.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  22%|██▏       | 264/1208 [07:40<27:25,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.534, train/loss_vlb_step=0.00668, train/loss_step=0.534, global_step=8521.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  22%|██▏       | 265/1208 [07:41<27:21,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.534, train/loss_vlb_step=0.00668, train/loss_step=0.534, global_step=8521.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  22%|██▏       | 265/1208 [07:41<27:21,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000865, train/loss_step=0.223, global_step=8522.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  22%|██▏       | 266/1208 [07:42<27:17,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000865, train/loss_step=0.223, global_step=8522.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  22%|██▏       | 266/1208 [07:42<27:17,  1.74s/it, loss=0.15, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000705, train/loss_step=0.203, global_step=8522.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  22%|██▏       | 267/1208 [07:43<27:13,  1.74s/it, loss=0.15, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000705, train/loss_step=0.203, global_step=8522.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  22%|██▏       | 267/1208 [07:43<27:13,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.000104, train/loss_step=0.027, global_step=8522.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  22%|██▏       | 268/1208 [07:46<27:16,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.000104, train/loss_step=0.027, global_step=8522.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  22%|██▏       | 268/1208 [07:46<27:16,  1.74s/it, loss=0.156, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000895, train/loss_step=0.234, global_step=8522.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  22%|██▏       | 269/1208 [07:47<27:12,  1.74s/it, loss=0.156, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.000895, train/loss_step=0.234, global_step=8522.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  22%|██▏       | 269/1208 [07:47<27:12,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0516, train/loss_vlb_step=0.000178, train/loss_step=0.0516, global_step=8523.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  22%|██▏       | 270/1208 [07:48<27:08,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0516, train/loss_vlb_step=0.000178, train/loss_step=0.0516, global_step=8523.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  22%|██▏       | 270/1208 [07:48<27:08,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00355, train/loss_vlb_step=1.9e-5, train/loss_step=0.00355, global_step=8523.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  22%|██▏       | 271/1208 [07:49<27:04,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00355, train/loss_vlb_step=1.9e-5, train/loss_step=0.00355, global_step=8523.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  22%|██▏       | 271/1208 [07:49<27:04,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0735, train/loss_vlb_step=0.000244, train/loss_step=0.0735, global_step=8523.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  23%|██▎       | 272/1208 [07:53<27:08,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0735, train/loss_vlb_step=0.000244, train/loss_step=0.0735, global_step=8523.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  23%|██▎       | 272/1208 [07:53<27:08,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.71e-5, train/loss_step=0.0177, global_step=8523.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  23%|██▎       | 273/1208 [07:54<27:04,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.71e-5, train/loss_step=0.0177, global_step=8523.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  23%|██▎       | 273/1208 [07:54<27:04,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.27e-5, train/loss_step=0.0116, global_step=8524.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  23%|██▎       | 274/1208 [07:55<27:00,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.27e-5, train/loss_step=0.0116, global_step=8524.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  23%|██▎       | 274/1208 [07:55<27:00,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.00012, train/loss_step=0.032, global_step=8524.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  23%|██▎       | 275/1208 [07:56<26:56,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.00012, train/loss_step=0.032, global_step=8524.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  23%|██▎       | 275/1208 [07:56<26:56,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0433, train/loss_vlb_step=0.000155, train/loss_step=0.0433, global_step=8524.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  23%|██▎       | 276/1208 [07:59<27:00,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0433, train/loss_vlb_step=0.000155, train/loss_step=0.0433, global_step=8524.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  23%|██▎       | 276/1208 [07:59<27:00,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0707, train/loss_vlb_step=0.000232, train/loss_step=0.0707, global_step=8524.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  23%|██▎       | 277/1208 [08:00<26:56,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0707, train/loss_vlb_step=0.000232, train/loss_step=0.0707, global_step=8524.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  23%|██▎       | 277/1208 [08:00<26:56,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00703, train/loss_vlb_step=3.38e-5, train/loss_step=0.00703, global_step=8525.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  23%|██▎       | 278/1208 [08:02<26:52,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00703, train/loss_vlb_step=3.38e-5, train/loss_step=0.00703, global_step=8525.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  23%|██▎       | 278/1208 [08:02<26:52,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000124, train/loss_step=0.0332, global_step=8525.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  23%|██▎       | 279/1208 [08:03<26:48,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000124, train/loss_step=0.0332, global_step=8525.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  23%|██▎       | 279/1208 [08:03<26:48,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000531, train/loss_step=0.161, global_step=8525.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  23%|██▎       | 280/1208 [08:06<26:51,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000531, train/loss_step=0.161, global_step=8525.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  23%|██▎       | 280/1208 [08:06<26:52,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.475, train/loss_vlb_step=0.00443, train/loss_step=0.475, global_step=8525.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  23%|██▎       | 281/1208 [08:07<26:48,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.475, train/loss_vlb_step=0.00443, train/loss_step=0.475, global_step=8525.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  23%|██▎       | 281/1208 [08:07<26:48,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000617, train/loss_step=0.169, global_step=8526.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  23%|██▎       | 282/1208 [08:08<26:44,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000617, train/loss_step=0.169, global_step=8526.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  23%|██▎       | 282/1208 [08:08<26:44,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.463, train/loss_vlb_step=0.00372, train/loss_step=0.463, global_step=8526.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  23%|██▎       | 283/1208 [08:09<26:40,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.463, train/loss_vlb_step=0.00372, train/loss_step=0.463, global_step=8526.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  23%|██▎       | 283/1208 [08:09<26:40,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00121, train/loss_step=0.271, global_step=8526.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  24%|██▎       | 284/1208 [08:13<26:44,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00121, train/loss_step=0.271, global_step=8526.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  24%|██▎       | 284/1208 [08:13<26:44,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000442, train/loss_step=0.132, global_step=8526.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  24%|██▎       | 285/1208 [08:14<26:40,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000442, train/loss_step=0.132, global_step=8526.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  24%|██▎       | 285/1208 [08:14<26:40,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.63e-5, train/loss_step=0.00296, global_step=8527.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  24%|██▎       | 286/1208 [08:15<26:36,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.63e-5, train/loss_step=0.00296, global_step=8527.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  24%|██▎       | 286/1208 [08:15<26:36,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=1.79e-5, train/loss_step=0.00325, global_step=8527.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  24%|██▍       | 287/1208 [08:16<26:32,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=1.79e-5, train/loss_step=0.00325, global_step=8527.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  24%|██▍       | 287/1208 [08:16<26:32,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000663, train/loss_step=0.190, global_step=8527.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  24%|██▍       | 288/1208 [08:19<26:36,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000663, train/loss_step=0.190, global_step=8527.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  24%|██▍       | 288/1208 [08:19<26:36,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000606, train/loss_step=0.172, global_step=8527.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  24%|██▍       | 289/1208 [08:20<26:32,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000606, train/loss_step=0.172, global_step=8527.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  24%|██▍       | 289/1208 [08:20<26:32,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000588, train/loss_step=0.158, global_step=8528.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  24%|██▍       | 290/1208 [08:21<26:28,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000588, train/loss_step=0.158, global_step=8528.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  24%|██▍       | 290/1208 [08:21<26:28,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.15e-5, train/loss_step=0.00192, global_step=8528.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  24%|██▍       | 291/1208 [08:22<26:24,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.15e-5, train/loss_step=0.00192, global_step=8528.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  24%|██▍       | 291/1208 [08:22<26:24,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00276, train/loss_step=0.432, global_step=8528.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  24%|██▍       | 292/1208 [08:26<26:27,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00276, train/loss_step=0.432, global_step=8528.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  24%|██▍       | 292/1208 [08:26<26:27,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.437, train/loss_vlb_step=0.00441, train/loss_step=0.437, global_step=8528.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  24%|██▍       | 293/1208 [08:27<26:24,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.437, train/loss_vlb_step=0.00441, train/loss_step=0.437, global_step=8528.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  24%|██▍       | 293/1208 [08:27<26:24,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.000146, train/loss_step=0.041, global_step=8529.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  24%|██▍       | 294/1208 [08:28<26:20,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.000146, train/loss_step=0.041, global_step=8529.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  24%|██▍       | 294/1208 [08:28<26:20,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00895, train/loss_vlb_step=4.39e-5, train/loss_step=0.00895, global_step=8529.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  24%|██▍       | 295/1208 [08:29<26:16,  1.73s/it, loss=0.164, v_num=0, train/loss_simple_step=0.00895, train/loss_vlb_step=4.39e-5, train/loss_step=0.00895, global_step=8529.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  24%|██▍       | 295/1208 [08:29<26:16,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00986, train/loss_vlb_step=4.63e-5, train/loss_step=0.00986, global_step=8529.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  25%|██▍       | 296/1208 [08:32<26:19,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00986, train/loss_vlb_step=4.63e-5, train/loss_step=0.00986, global_step=8529.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  25%|██▍       | 296/1208 [08:32<26:19,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000596, train/loss_step=0.172, global_step=8529.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  25%|██▍       | 297/1208 [08:33<26:15,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000596, train/loss_step=0.172, global_step=8529.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  25%|██▍       | 297/1208 [08:33<26:15,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=1.03e-5, train/loss_step=0.00171, global_step=8530.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  25%|██▍       | 298/1208 [08:34<26:11,  1.73s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=1.03e-5, train/loss_step=0.00171, global_step=8530.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  25%|██▍       | 298/1208 [08:34<26:11,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0077, train/loss_vlb_step=3.72e-5, train/loss_step=0.0077, global_step=8530.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  25%|██▍       | 299/1208 [08:35<26:08,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0077, train/loss_vlb_step=3.72e-5, train/loss_step=0.0077, global_step=8530.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  25%|██▍       | 299/1208 [08:35<26:08,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00145, train/loss_step=0.249, global_step=8530.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  25%|██▍       | 300/1208 [08:39<26:11,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00145, train/loss_step=0.249, global_step=8530.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  25%|██▍       | 300/1208 [08:39<26:11,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.511, train/loss_vlb_step=0.00774, train/loss_step=0.511, global_step=8530.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.74it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.74it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:28,  1.71it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.70it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:28,  1.66it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.71it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:27,  1.70it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.75it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.77it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:26,  1.70it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:26,  1.72it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.75it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.70it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.69it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.75it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:04<00:25,  1.70it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.72it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.75it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.70it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.72it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.74it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:24,  1.70it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.72it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:23,  1.74it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:23,  1.72it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.74it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.73it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.72it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.75it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.73it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.76it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:07<00:21,  1.73it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.74it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.73it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.74it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.74it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:20,  1.74it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:20,  1.73it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.78it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.76it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.73it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.74it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:19,  1.72it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.78it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.76it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.73it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.75it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:11<00:17,  1.73it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.74it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.72it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.75it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.73it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:16,  1.73it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.79it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.74it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.74it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:14<00:13,  1.80it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.75it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:15<00:13,  1.74it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.75it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:16<00:12,  1.75it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.75it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.79it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.75it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.75it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.78it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:19<00:09,  1.76it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.79it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.78it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.79it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:20<00:08,  1.76it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.78it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.75it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.78it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.80it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.75it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.79it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.80it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.73it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.78it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.79it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.80it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.74it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:23<00:05,  1.74it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.78it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.78it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.74it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.78it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:24<00:04,  1.74it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.78it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.74it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.74it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.78it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.75it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.75it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.74it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.78it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.75it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.79it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.75it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.79it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.74it/s]Epoch 28:  25%|██▍       | 301/1208 [09:10<27:39,  1.83s/it, loss=0.172, v_num=0, train/loss_simple_step=0.511, train/loss_vlb_step=0.00774, train/loss_step=0.511, global_step=8530.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  25%|██▍       | 301/1208 [09:10<27:39,  1.83s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.00012, train/loss_step=0.0313, global_step=8531.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  25%|██▌       | 302/1208 [09:11<27:35,  1.83s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.00012, train/loss_step=0.0313, global_step=8531.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  25%|██▌       | 302/1208 [09:11<27:35,  1.83s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00972, train/loss_vlb_step=4.43e-5, train/loss_step=0.00972, global_step=8531.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  25%|██▌       | 303/1208 [09:12<27:31,  1.82s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00972, train/loss_vlb_step=4.43e-5, train/loss_step=0.00972, global_step=8531.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  25%|██▌       | 303/1208 [09:12<27:31,  1.82s/it, loss=0.146, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00234, train/loss_step=0.345, global_step=8531.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  25%|██▌       | 304/1208 [09:15<27:32,  1.83s/it, loss=0.146, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.00234, train/loss_step=0.345, global_step=8531.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  25%|██▌       | 304/1208 [09:15<27:32,  1.83s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.00013, train/loss_step=0.0352, global_step=8531.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  25%|██▌       | 305/1208 [09:16<27:28,  1.83s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.00013, train/loss_step=0.0352, global_step=8531.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  25%|██▌       | 305/1208 [09:16<27:28,  1.83s/it, loss=0.149, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000554, train/loss_step=0.159, global_step=8532.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  25%|██▌       | 306/1208 [09:17<27:24,  1.82s/it, loss=0.149, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000554, train/loss_step=0.159, global_step=8532.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  25%|██▌       | 306/1208 [09:17<27:24,  1.82s/it, loss=0.172, v_num=0, train/loss_simple_step=0.465, train/loss_vlb_step=0.00439, train/loss_step=0.465, global_step=8532.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  25%|██▌       | 307/1208 [09:19<27:20,  1.82s/it, loss=0.172, v_num=0, train/loss_simple_step=0.465, train/loss_vlb_step=0.00439, train/loss_step=0.465, global_step=8532.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  25%|██▌       | 307/1208 [09:19<27:20,  1.82s/it, loss=0.176, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00113, train/loss_step=0.277, global_step=8532.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  25%|██▌       | 308/1208 [09:22<27:22,  1.83s/it, loss=0.176, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00113, train/loss_step=0.277, global_step=8532.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  25%|██▌       | 308/1208 [09:22<27:22,  1.83s/it, loss=0.182, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00134, train/loss_step=0.280, global_step=8532.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  26%|██▌       | 309/1208 [09:23<27:18,  1.82s/it, loss=0.182, v_num=0, train/loss_simple_step=0.280, train/loss_vlb_step=0.00134, train/loss_step=0.280, global_step=8532.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  26%|██▌       | 309/1208 [09:23<27:19,  1.82s/it, loss=0.186, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000933, train/loss_step=0.244, global_step=8533.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  26%|██▌       | 310/1208 [09:24<27:14,  1.82s/it, loss=0.186, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000933, train/loss_step=0.244, global_step=8533.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  26%|██▌       | 310/1208 [09:24<27:14,  1.82s/it, loss=0.218, v_num=0, train/loss_simple_step=0.634, train/loss_vlb_step=0.0116, train/loss_step=0.634, global_step=8533.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  26%|██▌       | 311/1208 [09:25<27:10,  1.82s/it, loss=0.218, v_num=0, train/loss_simple_step=0.634, train/loss_vlb_step=0.0116, train/loss_step=0.634, global_step=8533.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  26%|██▌       | 311/1208 [09:25<27:10,  1.82s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.09e-5, train/loss_step=0.0118, global_step=8533.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  26%|██▌       | 312/1208 [09:28<27:13,  1.82s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.09e-5, train/loss_step=0.0118, global_step=8533.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  26%|██▌       | 312/1208 [09:28<27:13,  1.82s/it, loss=0.195, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00403, train/loss_step=0.405, global_step=8533.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  26%|██▌       | 313/1208 [09:29<27:09,  1.82s/it, loss=0.195, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00403, train/loss_step=0.405, global_step=8533.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  26%|██▌       | 313/1208 [09:29<27:09,  1.82s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.86e-5, train/loss_step=0.0033, global_step=8534.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  26%|██▌       | 314/1208 [09:30<27:05,  1.82s/it, loss=0.193, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.86e-5, train/loss_step=0.0033, global_step=8534.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  26%|██▌       | 314/1208 [09:30<27:05,  1.82s/it, loss=0.203, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000856, train/loss_step=0.215, global_step=8534.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  26%|██▌       | 315/1208 [09:31<27:01,  1.82s/it, loss=0.203, v_num=0, train/loss_simple_step=0.215, train/loss_vlb_step=0.000856, train/loss_step=0.215, global_step=8534.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  26%|██▌       | 315/1208 [09:31<27:01,  1.82s/it, loss=0.21, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000476, train/loss_step=0.144, global_step=8534.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  26%|██▌       | 316/1208 [09:35<27:03,  1.82s/it, loss=0.21, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000476, train/loss_step=0.144, global_step=8534.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  26%|██▌       | 316/1208 [09:35<27:03,  1.82s/it, loss=0.203, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.15e-5, train/loss_step=0.023, global_step=8534.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  26%|██▌       | 317/1208 [09:36<26:59,  1.82s/it, loss=0.203, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.15e-5, train/loss_step=0.023, global_step=8534.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  26%|██▌       | 317/1208 [09:36<26:59,  1.82s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0966, train/loss_vlb_step=0.000319, train/loss_step=0.0966, global_step=8535.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  26%|██▋       | 318/1208 [09:37<26:55,  1.82s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0966, train/loss_vlb_step=0.000319, train/loss_step=0.0966, global_step=8535.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  26%|██▋       | 318/1208 [09:37<26:55,  1.82s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0546, train/loss_vlb_step=0.000196, train/loss_step=0.0546, global_step=8535.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  26%|██▋       | 319/1208 [09:38<26:51,  1.81s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0546, train/loss_vlb_step=0.000196, train/loss_step=0.0546, global_step=8535.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  26%|██▋       | 319/1208 [09:38<26:51,  1.81s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.65e-5, train/loss_step=0.0238, global_step=8535.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  26%|██▋       | 320/1208 [09:41<26:54,  1.82s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.65e-5, train/loss_step=0.0238, global_step=8535.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  26%|██▋       | 320/1208 [09:41<26:54,  1.82s/it, loss=0.192, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00297, train/loss_step=0.380, global_step=8535.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  27%|██▋       | 321/1208 [09:42<26:50,  1.82s/it, loss=0.192, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00297, train/loss_step=0.380, global_step=8535.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  27%|██▋       | 321/1208 [09:42<26:50,  1.82s/it, loss=0.206, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00198, train/loss_step=0.307, global_step=8536.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  27%|██▋       | 322/1208 [09:43<26:46,  1.81s/it, loss=0.206, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00198, train/loss_step=0.307, global_step=8536.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  27%|██▋       | 322/1208 [09:43<26:46,  1.81s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000117, train/loss_step=0.0291, global_step=8536.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  27%|██▋       | 323/1208 [09:44<26:42,  1.81s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000117, train/loss_step=0.0291, global_step=8536.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  27%|██▋       | 323/1208 [09:44<26:42,  1.81s/it, loss=0.202, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.00112, train/loss_step=0.242, global_step=8536.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  27%|██▋       | 324/1208 [09:48<26:44,  1.82s/it, loss=0.202, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.00112, train/loss_step=0.242, global_step=8536.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  27%|██▋       | 324/1208 [09:48<26:44,  1.82s/it, loss=0.207, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000452, train/loss_step=0.137, global_step=8536.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  27%|██▋       | 325/1208 [09:49<26:41,  1.81s/it, loss=0.207, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000452, train/loss_step=0.137, global_step=8536.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  27%|██▋       | 325/1208 [09:49<26:41,  1.81s/it, loss=0.202, v_num=0, train/loss_simple_step=0.074, train/loss_vlb_step=0.000248, train/loss_step=0.074, global_step=8537.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  27%|██▋       | 326/1208 [09:50<26:37,  1.81s/it, loss=0.202, v_num=0, train/loss_simple_step=0.074, train/loss_vlb_step=0.000248, train/loss_step=0.074, global_step=8537.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  27%|██▋       | 326/1208 [09:50<26:37,  1.81s/it, loss=0.19, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000763, train/loss_step=0.211, global_step=8537.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  27%|██▋       | 327/1208 [09:51<26:33,  1.81s/it, loss=0.19, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000763, train/loss_step=0.211, global_step=8537.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  27%|██▋       | 327/1208 [09:51<26:33,  1.81s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000109, train/loss_step=0.0284, global_step=8537.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  27%|██▋       | 328/1208 [09:54<26:35,  1.81s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000109, train/loss_step=0.0284, global_step=8537.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  27%|██▋       | 328/1208 [09:54<26:35,  1.81s/it, loss=0.174, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000757, train/loss_step=0.205, global_step=8537.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  27%|██▋       | 329/1208 [09:55<26:31,  1.81s/it, loss=0.174, v_num=0, train/loss_simple_step=0.205, train/loss_vlb_step=0.000757, train/loss_step=0.205, global_step=8537.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  27%|██▋       | 329/1208 [09:55<26:31,  1.81s/it, loss=0.168, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000447, train/loss_step=0.134, global_step=8538.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  27%|██▋       | 330/1208 [09:56<26:28,  1.81s/it, loss=0.168, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000447, train/loss_step=0.134, global_step=8538.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  27%|██▋       | 330/1208 [09:56<26:28,  1.81s/it, loss=0.143, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000443, train/loss_step=0.132, global_step=8538.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  27%|██▋       | 331/1208 [09:57<26:24,  1.81s/it, loss=0.143, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000443, train/loss_step=0.132, global_step=8538.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  27%|██▋       | 331/1208 [09:57<26:24,  1.81s/it, loss=0.156, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00124, train/loss_step=0.272, global_step=8538.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  27%|██▋       | 332/1208 [10:01<26:26,  1.81s/it, loss=0.156, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00124, train/loss_step=0.272, global_step=8538.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  27%|██▋       | 332/1208 [10:01<26:26,  1.81s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.26e-5, train/loss_step=0.0134, global_step=8538.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  28%|██▊       | 333/1208 [10:02<26:22,  1.81s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.26e-5, train/loss_step=0.0134, global_step=8538.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  28%|██▊       | 333/1208 [10:02<26:22,  1.81s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00819, train/loss_vlb_step=3.98e-5, train/loss_step=0.00819, global_step=8539.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  28%|██▊       | 334/1208 [10:03<26:19,  1.81s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00819, train/loss_vlb_step=3.98e-5, train/loss_step=0.00819, global_step=8539.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  28%|██▊       | 334/1208 [10:03<26:19,  1.81s/it, loss=0.134, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000584, train/loss_step=0.169, global_step=8539.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  28%|██▊       | 335/1208 [10:04<26:15,  1.80s/it, loss=0.134, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000584, train/loss_step=0.169, global_step=8539.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  28%|██▊       | 335/1208 [10:04<26:15,  1.80s/it, loss=0.155, v_num=0, train/loss_simple_step=0.560, train/loss_vlb_step=0.0137, train/loss_step=0.560, global_step=8539.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  28%|██▊       | 336/1208 [10:07<26:16,  1.81s/it, loss=0.155, v_num=0, train/loss_simple_step=0.560, train/loss_vlb_step=0.0137, train/loss_step=0.560, global_step=8539.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  28%|██▊       | 336/1208 [10:07<26:16,  1.81s/it, loss=0.173, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00249, train/loss_step=0.390, global_step=8539.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  28%|██▊       | 337/1208 [10:08<26:13,  1.81s/it, loss=0.173, v_num=0, train/loss_simple_step=0.390, train/loss_vlb_step=0.00249, train/loss_step=0.390, global_step=8539.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  28%|██▊       | 337/1208 [10:08<26:13,  1.81s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.53e-5, train/loss_step=0.0146, global_step=8540.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  28%|██▊       | 338/1208 [10:09<26:09,  1.80s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.53e-5, train/loss_step=0.0146, global_step=8540.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  28%|██▊       | 338/1208 [10:09<26:09,  1.80s/it, loss=0.195, v_num=0, train/loss_simple_step=0.571, train/loss_vlb_step=0.00664, train/loss_step=0.571, global_step=8540.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  28%|██▊       | 339/1208 [10:10<26:05,  1.80s/it, loss=0.195, v_num=0, train/loss_simple_step=0.571, train/loss_vlb_step=0.00664, train/loss_step=0.571, global_step=8540.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  28%|██▊       | 339/1208 [10:10<26:05,  1.80s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.000171, train/loss_step=0.0483, global_step=8540.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  28%|██▊       | 340/1208 [10:14<26:07,  1.81s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0483, train/loss_vlb_step=0.000171, train/loss_step=0.0483, global_step=8540.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  28%|██▊       | 340/1208 [10:14<26:07,  1.81s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000251, train/loss_step=0.0754, global_step=8540.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  28%|██▊       | 341/1208 [10:15<26:04,  1.80s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000251, train/loss_step=0.0754, global_step=8540.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  28%|██▊       | 341/1208 [10:15<26:04,  1.80s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00297, train/loss_vlb_step=1.64e-5, train/loss_step=0.00297, global_step=8541.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  28%|██▊       | 342/1208 [10:16<26:00,  1.80s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00297, train/loss_vlb_step=1.64e-5, train/loss_step=0.00297, global_step=8541.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  28%|██▊       | 342/1208 [10:16<26:00,  1.80s/it, loss=0.172, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000501, train/loss_step=0.146, global_step=8541.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  28%|██▊       | 343/1208 [10:17<25:56,  1.80s/it, loss=0.172, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000501, train/loss_step=0.146, global_step=8541.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  28%|██▊       | 343/1208 [10:17<25:56,  1.80s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000125, train/loss_step=0.0333, global_step=8541.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  28%|██▊       | 344/1208 [10:20<25:58,  1.80s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000125, train/loss_step=0.0333, global_step=8541.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  28%|██▊       | 344/1208 [10:20<25:58,  1.80s/it, loss=0.165, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000776, train/loss_step=0.206, global_step=8541.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  29%|██▊       | 345/1208 [10:21<25:55,  1.80s/it, loss=0.165, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000776, train/loss_step=0.206, global_step=8541.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  29%|██▊       | 345/1208 [10:21<25:55,  1.80s/it, loss=0.169, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000548, train/loss_step=0.154, global_step=8542.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  29%|██▊       | 346/1208 [10:22<25:51,  1.80s/it, loss=0.169, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000548, train/loss_step=0.154, global_step=8542.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  29%|██▊       | 346/1208 [10:22<25:51,  1.80s/it, loss=0.172, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00128, train/loss_step=0.273, global_step=8542.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  29%|██▊       | 347/1208 [10:23<25:47,  1.80s/it, loss=0.172, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.00128, train/loss_step=0.273, global_step=8542.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  29%|██▊       | 347/1208 [10:23<25:47,  1.80s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00669, train/loss_vlb_step=3.27e-5, train/loss_step=0.00669, global_step=8542.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  29%|██▉       | 348/1208 [10:27<25:49,  1.80s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00669, train/loss_vlb_step=3.27e-5, train/loss_step=0.00669, global_step=8542.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  29%|██▉       | 348/1208 [10:27<25:49,  1.80s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0502, train/loss_vlb_step=0.000172, train/loss_step=0.0502, global_step=8542.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  29%|██▉       | 349/1208 [10:28<25:46,  1.80s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0502, train/loss_vlb_step=0.000172, train/loss_step=0.0502, global_step=8542.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  29%|██▉       | 349/1208 [10:28<25:46,  1.80s/it, loss=0.176, v_num=0, train/loss_simple_step=0.387, train/loss_vlb_step=0.00288, train/loss_step=0.387, global_step=8543.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  29%|██▉       | 350/1208 [10:29<25:42,  1.80s/it, loss=0.176, v_num=0, train/loss_simple_step=0.387, train/loss_vlb_step=0.00288, train/loss_step=0.387, global_step=8543.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  29%|██▉       | 350/1208 [10:29<25:42,  1.80s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0669, train/loss_vlb_step=0.000231, train/loss_step=0.0669, global_step=8543.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  29%|██▉       | 351/1208 [10:30<25:39,  1.80s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0669, train/loss_vlb_step=0.000231, train/loss_step=0.0669, global_step=8543.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  29%|██▉       | 351/1208 [10:30<25:39,  1.80s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.43e-5, train/loss_step=0.0228, global_step=8543.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  29%|██▉       | 352/1208 [10:33<25:40,  1.80s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.43e-5, train/loss_step=0.0228, global_step=8543.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  29%|██▉       | 352/1208 [10:33<25:40,  1.80s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.87e-5, train/loss_step=0.0106, global_step=8543.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  29%|██▉       | 353/1208 [10:34<25:37,  1.80s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.87e-5, train/loss_step=0.0106, global_step=8543.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  29%|██▉       | 353/1208 [10:34<25:37,  1.80s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000117, train/loss_step=0.0317, global_step=8544.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  29%|██▉       | 354/1208 [10:35<25:33,  1.80s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000117, train/loss_step=0.0317, global_step=8544.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  29%|██▉       | 354/1208 [10:35<25:33,  1.80s/it, loss=0.172, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.003, train/loss_step=0.396, global_step=8544.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]     Epoch 28:  29%|██▉       | 355/1208 [10:36<25:30,  1.79s/it, loss=0.172, v_num=0, train/loss_simple_step=0.396, train/loss_vlb_step=0.003, train/loss_step=0.396, global_step=8544.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  29%|██▉       | 355/1208 [10:36<25:30,  1.79s/it, loss=0.147, v_num=0, train/loss_simple_step=0.053, train/loss_vlb_step=0.000184, train/loss_step=0.053, global_step=8544.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  29%|██▉       | 356/1208 [10:40<25:31,  1.80s/it, loss=0.147, v_num=0, train/loss_simple_step=0.053, train/loss_vlb_step=0.000184, train/loss_step=0.053, global_step=8544.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  29%|██▉       | 356/1208 [10:40<25:31,  1.80s/it, loss=0.14, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00098, train/loss_step=0.250, global_step=8544.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  30%|██▉       | 357/1208 [10:41<25:28,  1.80s/it, loss=0.14, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00098, train/loss_step=0.250, global_step=8544.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  30%|██▉       | 357/1208 [10:41<25:28,  1.80s/it, loss=0.15, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000775, train/loss_step=0.211, global_step=8545.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  30%|██▉       | 358/1208 [10:42<25:24,  1.79s/it, loss=0.15, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000775, train/loss_step=0.211, global_step=8545.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  30%|██▉       | 358/1208 [10:42<25:24,  1.79s/it, loss=0.128, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000418, train/loss_step=0.126, global_step=8545.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  30%|██▉       | 359/1208 [10:43<25:21,  1.79s/it, loss=0.128, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000418, train/loss_step=0.126, global_step=8545.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  30%|██▉       | 359/1208 [10:43<25:21,  1.79s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0048, train/loss_vlb_step=2.52e-5, train/loss_step=0.0048, global_step=8545.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  30%|██▉       | 360/1208 [10:46<25:22,  1.80s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0048, train/loss_vlb_step=2.52e-5, train/loss_step=0.0048, global_step=8545.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  30%|██▉       | 360/1208 [10:46<25:22,  1.80s/it, loss=0.132, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.00071, train/loss_step=0.204, global_step=8545.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  30%|██▉       | 361/1208 [10:47<25:19,  1.79s/it, loss=0.132, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.00071, train/loss_step=0.204, global_step=8545.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  30%|██▉       | 361/1208 [10:47<25:19,  1.79s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0873, train/loss_vlb_step=0.000288, train/loss_step=0.0873, global_step=8546.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  30%|██▉       | 362/1208 [10:48<25:15,  1.79s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0873, train/loss_vlb_step=0.000288, train/loss_step=0.0873, global_step=8546.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  30%|██▉       | 362/1208 [10:48<25:15,  1.79s/it, loss=0.136, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000465, train/loss_step=0.135, global_step=8546.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  30%|███       | 363/1208 [10:49<25:12,  1.79s/it, loss=0.136, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000465, train/loss_step=0.135, global_step=8546.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  30%|███       | 363/1208 [10:49<25:12,  1.79s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0486, train/loss_vlb_step=0.000171, train/loss_step=0.0486, global_step=8546.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  30%|███       | 364/1208 [10:52<25:13,  1.79s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0486, train/loss_vlb_step=0.000171, train/loss_step=0.0486, global_step=8546.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  30%|███       | 364/1208 [10:52<25:13,  1.79s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00916, train/loss_vlb_step=4.34e-5, train/loss_step=0.00916, global_step=8546.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  30%|███       | 365/1208 [10:53<25:10,  1.79s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00916, train/loss_vlb_step=4.34e-5, train/loss_step=0.00916, global_step=8546.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  30%|███       | 365/1208 [10:53<25:10,  1.79s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0582, train/loss_vlb_step=0.000212, train/loss_step=0.0582, global_step=8547.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  30%|███       | 366/1208 [10:55<25:06,  1.79s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0582, train/loss_vlb_step=0.000212, train/loss_step=0.0582, global_step=8547.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  30%|███       | 366/1208 [10:55<25:06,  1.79s/it, loss=0.115, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000445, train/loss_step=0.132, global_step=8547.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  30%|███       | 367/1208 [10:56<25:03,  1.79s/it, loss=0.115, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000445, train/loss_step=0.132, global_step=8547.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  30%|███       | 367/1208 [10:56<25:03,  1.79s/it, loss=0.121, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000473, train/loss_step=0.142, global_step=8547.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  30%|███       | 368/1208 [10:59<25:04,  1.79s/it, loss=0.121, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000473, train/loss_step=0.142, global_step=8547.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  30%|███       | 368/1208 [10:59<25:04,  1.79s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0544, train/loss_vlb_step=0.00019, train/loss_step=0.0544, global_step=8547.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  31%|███       | 369/1208 [11:00<25:01,  1.79s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0544, train/loss_vlb_step=0.00019, train/loss_step=0.0544, global_step=8547.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  31%|███       | 369/1208 [11:00<25:01,  1.79s/it, loss=0.12, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00213, train/loss_step=0.356, global_step=8548.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  31%|███       | 370/1208 [11:01<24:58,  1.79s/it, loss=0.12, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00213, train/loss_step=0.356, global_step=8548.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  31%|███       | 370/1208 [11:01<24:58,  1.79s/it, loss=0.145, v_num=0, train/loss_simple_step=0.569, train/loss_vlb_step=0.0074, train/loss_step=0.569, global_step=8548.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  31%|███       | 371/1208 [11:02<24:54,  1.79s/it, loss=0.145, v_num=0, train/loss_simple_step=0.569, train/loss_vlb_step=0.0074, train/loss_step=0.569, global_step=8548.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  31%|███       | 371/1208 [11:02<24:54,  1.79s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000135, train/loss_step=0.0372, global_step=8548.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  31%|███       | 372/1208 [11:05<24:56,  1.79s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000135, train/loss_step=0.0372, global_step=8548.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  31%|███       | 372/1208 [11:05<24:56,  1.79s/it, loss=0.156, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000737, train/loss_step=0.204, global_step=8548.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  31%|███       | 373/1208 [11:06<24:52,  1.79s/it, loss=0.156, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000737, train/loss_step=0.204, global_step=8548.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  31%|███       | 373/1208 [11:06<24:52,  1.79s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.000147, train/loss_step=0.0418, global_step=8549.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  31%|███       | 374/1208 [11:07<24:49,  1.79s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.000147, train/loss_step=0.0418, global_step=8549.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  31%|███       | 374/1208 [11:07<24:49,  1.79s/it, loss=0.148, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000862, train/loss_step=0.230, global_step=8549.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  31%|███       | 375/1208 [11:09<24:46,  1.78s/it, loss=0.148, v_num=0, train/loss_simple_step=0.230, train/loss_vlb_step=0.000862, train/loss_step=0.230, global_step=8549.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  31%|███       | 375/1208 [11:09<24:46,  1.78s/it, loss=0.17, v_num=0, train/loss_simple_step=0.503, train/loss_vlb_step=0.00823, train/loss_step=0.503, global_step=8549.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  31%|███       | 376/1208 [11:12<24:47,  1.79s/it, loss=0.17, v_num=0, train/loss_simple_step=0.503, train/loss_vlb_step=0.00823, train/loss_step=0.503, global_step=8549.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  31%|███       | 376/1208 [11:12<24:47,  1.79s/it, loss=0.173, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00162, train/loss_step=0.313, global_step=8549.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  31%|███       | 377/1208 [11:13<24:44,  1.79s/it, loss=0.173, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00162, train/loss_step=0.313, global_step=8549.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  31%|███       | 377/1208 [11:13<24:44,  1.79s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.13e-5, train/loss_step=0.00192, global_step=8550.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  31%|███▏      | 378/1208 [11:14<24:40,  1.78s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.13e-5, train/loss_step=0.00192, global_step=8550.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  31%|███▏      | 378/1208 [11:14<24:40,  1.78s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=7.12e-5, train/loss_step=0.0161, global_step=8550.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  31%|███▏      | 379/1208 [11:15<24:37,  1.78s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=7.12e-5, train/loss_step=0.0161, global_step=8550.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  31%|███▏      | 379/1208 [11:15<24:37,  1.78s/it, loss=0.165, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000496, train/loss_step=0.149, global_step=8550.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  31%|███▏      | 380/1208 [11:18<24:38,  1.79s/it, loss=0.165, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000496, train/loss_step=0.149, global_step=8550.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  31%|███▏      | 380/1208 [11:18<24:38,  1.79s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0783, train/loss_vlb_step=0.000262, train/loss_step=0.0783, global_step=8550.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  32%|███▏      | 381/1208 [11:19<24:35,  1.78s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0783, train/loss_vlb_step=0.000262, train/loss_step=0.0783, global_step=8550.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  32%|███▏      | 381/1208 [11:19<24:35,  1.78s/it, loss=0.183, v_num=0, train/loss_simple_step=0.574, train/loss_vlb_step=0.00606, train/loss_step=0.574, global_step=8551.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  32%|███▏      | 382/1208 [11:20<24:32,  1.78s/it, loss=0.183, v_num=0, train/loss_simple_step=0.574, train/loss_vlb_step=0.00606, train/loss_step=0.574, global_step=8551.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  32%|███▏      | 382/1208 [11:20<24:32,  1.78s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00399, train/loss_vlb_step=2.25e-5, train/loss_step=0.00399, global_step=8551.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  32%|███▏      | 383/1208 [11:21<24:28,  1.78s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00399, train/loss_vlb_step=2.25e-5, train/loss_step=0.00399, global_step=8551.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  32%|███▏      | 383/1208 [11:21<24:28,  1.78s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=7.8e-5, train/loss_step=0.0189, global_step=8551.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  32%|███▏      | 384/1208 [11:25<24:30,  1.78s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=7.8e-5, train/loss_step=0.0189, global_step=8551.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  32%|███▏      | 384/1208 [11:25<24:30,  1.78s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.85e-5, train/loss_step=0.0129, global_step=8551.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  32%|███▏      | 385/1208 [11:26<24:26,  1.78s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.85e-5, train/loss_step=0.0129, global_step=8551.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  32%|███▏      | 385/1208 [11:26<24:26,  1.78s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.63e-5, train/loss_step=0.00296, global_step=8552.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  32%|███▏      | 386/1208 [11:27<24:23,  1.78s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.63e-5, train/loss_step=0.00296, global_step=8552.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  32%|███▏      | 386/1208 [11:27<24:23,  1.78s/it, loss=0.173, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000543, train/loss_step=0.158, global_step=8552.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  32%|███▏      | 387/1208 [11:28<24:20,  1.78s/it, loss=0.173, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000543, train/loss_step=0.158, global_step=8552.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  32%|███▏      | 387/1208 [11:28<24:20,  1.78s/it, loss=0.205, v_num=0, train/loss_simple_step=0.784, train/loss_vlb_step=0.0799, train/loss_step=0.784, global_step=8552.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  32%|███▏      | 388/1208 [11:31<24:21,  1.78s/it, loss=0.205, v_num=0, train/loss_simple_step=0.784, train/loss_vlb_step=0.0799, train/loss_step=0.784, global_step=8552.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  32%|███▏      | 388/1208 [11:31<24:21,  1.78s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.00014, train/loss_step=0.0387, global_step=8552.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  32%|███▏      | 389/1208 [11:32<24:18,  1.78s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.00014, train/loss_step=0.0387, global_step=8552.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  32%|███▏      | 389/1208 [11:32<24:18,  1.78s/it, loss=0.187, v_num=0, train/loss_simple_step=0.00474, train/loss_vlb_step=2.55e-5, train/loss_step=0.00474, global_step=8553.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  32%|███▏      | 390/1208 [11:33<24:15,  1.78s/it, loss=0.187, v_num=0, train/loss_simple_step=0.00474, train/loss_vlb_step=2.55e-5, train/loss_step=0.00474, global_step=8553.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  32%|███▏      | 390/1208 [11:33<24:15,  1.78s/it, loss=0.165, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000454, train/loss_step=0.137, global_step=8553.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  32%|███▏      | 391/1208 [11:34<24:11,  1.78s/it, loss=0.165, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.000454, train/loss_step=0.137, global_step=8553.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  32%|███▏      | 391/1208 [11:34<24:11,  1.78s/it, loss=0.18, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00196, train/loss_step=0.331, global_step=8553.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  32%|███▏      | 392/1208 [11:37<24:12,  1.78s/it, loss=0.18, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00196, train/loss_step=0.331, global_step=8553.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  32%|███▏      | 392/1208 [11:37<24:12,  1.78s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000107, train/loss_step=0.0277, global_step=8553.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  33%|███▎      | 393/1208 [11:39<24:09,  1.78s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000107, train/loss_step=0.0277, global_step=8553.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  33%|███▎      | 393/1208 [11:39<24:09,  1.78s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000129, train/loss_step=0.0358, global_step=8554.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  33%|███▎      | 394/1208 [11:40<24:06,  1.78s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0358, train/loss_vlb_step=0.000129, train/loss_step=0.0358, global_step=8554.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  33%|███▎      | 394/1208 [11:40<24:06,  1.78s/it, loss=0.161, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000102, train/loss_step=0.026, global_step=8554.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  33%|███▎      | 395/1208 [11:41<24:03,  1.78s/it, loss=0.161, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000102, train/loss_step=0.026, global_step=8554.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  33%|███▎      | 395/1208 [11:41<24:03,  1.78s/it, loss=0.158, v_num=0, train/loss_simple_step=0.451, train/loss_vlb_step=0.00652, train/loss_step=0.451, global_step=8554.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  33%|███▎      | 396/1208 [11:44<24:04,  1.78s/it, loss=0.158, v_num=0, train/loss_simple_step=0.451, train/loss_vlb_step=0.00652, train/loss_step=0.451, global_step=8554.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  33%|███▎      | 396/1208 [11:44<24:04,  1.78s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00751, train/loss_vlb_step=3.61e-5, train/loss_step=0.00751, global_step=8554.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  33%|███▎      | 397/1208 [11:45<24:01,  1.78s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00751, train/loss_vlb_step=3.61e-5, train/loss_step=0.00751, global_step=8554.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  33%|███▎      | 397/1208 [11:45<24:01,  1.78s/it, loss=0.158, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00137, train/loss_step=0.300, global_step=8555.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  33%|███▎      | 398/1208 [11:46<23:58,  1.78s/it, loss=0.158, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00137, train/loss_step=0.300, global_step=8555.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  33%|███▎      | 398/1208 [11:46<23:58,  1.78s/it, loss=0.163, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=8555.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  33%|███▎      | 399/1208 [11:47<23:54,  1.77s/it, loss=0.163, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=8555.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  33%|███▎      | 399/1208 [11:47<23:54,  1.77s/it, loss=0.165, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000676, train/loss_step=0.188, global_step=8555.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  33%|███▎      | 400/1208 [11:50<23:55,  1.78s/it, loss=0.165, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000676, train/loss_step=0.188, global_step=8555.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  33%|███▎      | 400/1208 [11:50<23:55,  1.78s/it, loss=0.177, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00189, train/loss_step=0.332, global_step=8555.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  33%|███▎      | 401/1208 [11:51<23:52,  1.78s/it, loss=0.177, v_num=0, train/loss_simple_step=0.332, train/loss_vlb_step=0.00189, train/loss_step=0.332, global_step=8555.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  33%|███▎      | 401/1208 [11:51<23:52,  1.78s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.58e-5, train/loss_step=0.0236, global_step=8556.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  33%|███▎      | 402/1208 [11:52<23:49,  1.77s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.58e-5, train/loss_step=0.0236, global_step=8556.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  33%|███▎      | 402/1208 [11:52<23:49,  1.77s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0542, train/loss_vlb_step=0.000191, train/loss_step=0.0542, global_step=8556.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  33%|███▎      | 403/1208 [11:54<23:46,  1.77s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0542, train/loss_vlb_step=0.000191, train/loss_step=0.0542, global_step=8556.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  33%|███▎      | 403/1208 [11:54<23:46,  1.77s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0608, train/loss_vlb_step=0.000211, train/loss_step=0.0608, global_step=8556.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  33%|███▎      | 404/1208 [11:57<23:47,  1.78s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0608, train/loss_vlb_step=0.000211, train/loss_step=0.0608, global_step=8556.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  33%|███▎      | 404/1208 [11:57<23:47,  1.78s/it, loss=0.182, v_num=0, train/loss_simple_step=0.573, train/loss_vlb_step=0.00869, train/loss_step=0.573, global_step=8556.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  34%|███▎      | 405/1208 [11:58<23:44,  1.77s/it, loss=0.182, v_num=0, train/loss_simple_step=0.573, train/loss_vlb_step=0.00869, train/loss_step=0.573, global_step=8556.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  34%|███▎      | 405/1208 [11:58<23:44,  1.77s/it, loss=0.191, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000589, train/loss_step=0.171, global_step=8557.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  34%|███▎      | 406/1208 [11:59<23:40,  1.77s/it, loss=0.191, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000589, train/loss_step=0.171, global_step=8557.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  34%|███▎      | 406/1208 [11:59<23:40,  1.77s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.12e-5, train/loss_step=0.0227, global_step=8557.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  34%|███▎      | 407/1208 [12:00<23:37,  1.77s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.12e-5, train/loss_step=0.0227, global_step=8557.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  34%|███▎      | 407/1208 [12:00<23:37,  1.77s/it, loss=0.155, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000663, train/loss_step=0.195, global_step=8557.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  34%|███▍      | 408/1208 [12:03<23:39,  1.77s/it, loss=0.155, v_num=0, train/loss_simple_step=0.195, train/loss_vlb_step=0.000663, train/loss_step=0.195, global_step=8557.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  34%|███▍      | 408/1208 [12:03<23:39,  1.77s/it, loss=0.159, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000383, train/loss_step=0.117, global_step=8557.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  34%|███▍      | 409/1208 [12:04<23:35,  1.77s/it, loss=0.159, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000383, train/loss_step=0.117, global_step=8557.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  34%|███▍      | 409/1208 [12:04<23:35,  1.77s/it, loss=0.164, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000351, train/loss_step=0.107, global_step=8558.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  34%|███▍      | 410/1208 [12:05<23:32,  1.77s/it, loss=0.164, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000351, train/loss_step=0.107, global_step=8558.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  34%|███▍      | 410/1208 [12:05<23:32,  1.77s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0688, train/loss_vlb_step=0.000234, train/loss_step=0.0688, global_step=8558.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  34%|███▍      | 411/1208 [12:06<23:29,  1.77s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0688, train/loss_vlb_step=0.000234, train/loss_step=0.0688, global_step=8558.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  34%|███▍      | 411/1208 [12:06<23:29,  1.77s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0747, train/loss_vlb_step=0.000249, train/loss_step=0.0747, global_step=8558.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  34%|███▍      | 412/1208 [12:10<23:30,  1.77s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0747, train/loss_vlb_step=0.000249, train/loss_step=0.0747, global_step=8558.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  34%|███▍      | 412/1208 [12:10<23:30,  1.77s/it, loss=0.148, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.00013, train/loss_step=0.034, global_step=8558.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  34%|███▍      | 413/1208 [12:11<23:27,  1.77s/it, loss=0.148, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.00013, train/loss_step=0.034, global_step=8558.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  34%|███▍      | 413/1208 [12:11<23:27,  1.77s/it, loss=0.16, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00117, train/loss_step=0.286, global_step=8559.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  34%|███▍      | 414/1208 [12:12<23:24,  1.77s/it, loss=0.16, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00117, train/loss_step=0.286, global_step=8559.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  34%|███▍      | 414/1208 [12:12<23:24,  1.77s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.28e-5, train/loss_step=0.0237, global_step=8559.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  34%|███▍      | 415/1208 [12:13<23:21,  1.77s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.28e-5, train/loss_step=0.0237, global_step=8559.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  34%|███▍      | 415/1208 [12:13<23:21,  1.77s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.23e-5, train/loss_step=0.0021, global_step=8559.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  34%|███▍      | 416/1208 [12:16<23:22,  1.77s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.23e-5, train/loss_step=0.0021, global_step=8559.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  34%|███▍      | 416/1208 [12:16<23:22,  1.77s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.24e-5, train/loss_step=0.00209, global_step=8559.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  35%|███▍      | 417/1208 [12:17<23:19,  1.77s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.24e-5, train/loss_step=0.00209, global_step=8559.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  35%|███▍      | 417/1208 [12:17<23:19,  1.77s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0488, train/loss_vlb_step=0.000178, train/loss_step=0.0488, global_step=8560.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  35%|███▍      | 418/1208 [12:18<23:16,  1.77s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0488, train/loss_vlb_step=0.000178, train/loss_step=0.0488, global_step=8560.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  35%|███▍      | 418/1208 [12:18<23:16,  1.77s/it, loss=0.159, v_num=0, train/loss_simple_step=0.805, train/loss_vlb_step=0.136, train/loss_step=0.805, global_step=8560.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]     Epoch 28:  35%|███▍      | 419/1208 [12:19<23:13,  1.77s/it, loss=0.159, v_num=0, train/loss_simple_step=0.805, train/loss_vlb_step=0.136, train/loss_step=0.805, global_step=8560.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  35%|███▍      | 419/1208 [12:19<23:13,  1.77s/it, loss=0.183, v_num=0, train/loss_simple_step=0.665, train/loss_vlb_step=0.0381, train/loss_step=0.665, global_step=8560.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  35%|███▍      | 420/1208 [12:23<23:14,  1.77s/it, loss=0.183, v_num=0, train/loss_simple_step=0.665, train/loss_vlb_step=0.0381, train/loss_step=0.665, global_step=8560.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  35%|███▍      | 420/1208 [12:23<23:14,  1.77s/it, loss=0.182, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00157, train/loss_step=0.310, global_step=8560.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  35%|███▍      | 421/1208 [12:24<23:11,  1.77s/it, loss=0.182, v_num=0, train/loss_simple_step=0.310, train/loss_vlb_step=0.00157, train/loss_step=0.310, global_step=8560.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  35%|███▍      | 421/1208 [12:24<23:11,  1.77s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00801, train/loss_vlb_step=3.86e-5, train/loss_step=0.00801, global_step=8561.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  35%|███▍      | 422/1208 [12:25<23:08,  1.77s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00801, train/loss_vlb_step=3.86e-5, train/loss_step=0.00801, global_step=8561.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  35%|███▍      | 422/1208 [12:25<23:08,  1.77s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000108, train/loss_step=0.0281, global_step=8561.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  35%|███▌      | 423/1208 [12:26<23:04,  1.76s/it, loss=0.18, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000108, train/loss_step=0.0281, global_step=8561.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  35%|███▌      | 423/1208 [12:26<23:04,  1.76s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.26e-5, train/loss_step=0.00219, global_step=8561.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  35%|███▌      | 424/1208 [12:29<23:05,  1.77s/it, loss=0.177, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.26e-5, train/loss_step=0.00219, global_step=8561.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  35%|███▌      | 424/1208 [12:29<23:05,  1.77s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.27e-5, train/loss_step=0.00423, global_step=8561.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  35%|███▌      | 425/1208 [12:30<23:02,  1.77s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.27e-5, train/loss_step=0.00423, global_step=8561.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  35%|███▌      | 425/1208 [12:30<23:02,  1.77s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.51e-5, train/loss_step=0.0206, global_step=8562.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  35%|███▌      | 426/1208 [12:31<22:59,  1.76s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=8.51e-5, train/loss_step=0.0206, global_step=8562.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  35%|███▌      | 426/1208 [12:31<22:59,  1.76s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.83e-5, train/loss_step=0.0124, global_step=8562.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  35%|███▌      | 427/1208 [12:32<22:56,  1.76s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.83e-5, train/loss_step=0.0124, global_step=8562.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  35%|███▌      | 427/1208 [12:32<22:56,  1.76s/it, loss=0.14, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000657, train/loss_step=0.184, global_step=8562.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  35%|███▌      | 428/1208 [12:35<22:57,  1.77s/it, loss=0.14, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000657, train/loss_step=0.184, global_step=8562.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  35%|███▌      | 428/1208 [12:35<22:57,  1.77s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0763, train/loss_vlb_step=0.000254, train/loss_step=0.0763, global_step=8562.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  36%|███▌      | 429/1208 [12:37<22:54,  1.76s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0763, train/loss_vlb_step=0.000254, train/loss_step=0.0763, global_step=8562.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  36%|███▌      | 429/1208 [12:37<22:54,  1.76s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00564, train/loss_vlb_step=2.84e-5, train/loss_step=0.00564, global_step=8563.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  36%|███▌      | 430/1208 [12:38<22:51,  1.76s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00564, train/loss_vlb_step=2.84e-5, train/loss_step=0.00564, global_step=8563.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  36%|███▌      | 430/1208 [12:38<22:51,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000329, train/loss_step=0.100, global_step=8563.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  36%|███▌      | 431/1208 [12:39<22:48,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000329, train/loss_step=0.100, global_step=8563.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  36%|███▌      | 431/1208 [12:39<22:48,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00779, train/loss_vlb_step=3.66e-5, train/loss_step=0.00779, global_step=8563.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  36%|███▌      | 432/1208 [12:42<22:49,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00779, train/loss_vlb_step=3.66e-5, train/loss_step=0.00779, global_step=8563.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  36%|███▌      | 432/1208 [12:42<22:49,  1.76s/it, loss=0.144, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00126, train/loss_step=0.285, global_step=8563.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  36%|███▌      | 433/1208 [12:43<22:46,  1.76s/it, loss=0.144, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00126, train/loss_step=0.285, global_step=8563.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  36%|███▌      | 433/1208 [12:43<22:46,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000112, train/loss_step=0.0291, global_step=8564.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  36%|███▌      | 434/1208 [12:44<22:43,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000112, train/loss_step=0.0291, global_step=8564.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  36%|███▌      | 434/1208 [12:44<22:43,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000387, train/loss_step=0.116, global_step=8564.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  36%|███▌      | 435/1208 [12:45<22:40,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000387, train/loss_step=0.116, global_step=8564.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  36%|███▌      | 435/1208 [12:45<22:40,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.44e-5, train/loss_step=0.00251, global_step=8564.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  36%|███▌      | 436/1208 [12:48<22:41,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.44e-5, train/loss_step=0.00251, global_step=8564.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  36%|███▌      | 436/1208 [12:48<22:41,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000915, train/loss_step=0.216, global_step=8564.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  36%|███▌      | 437/1208 [12:50<22:38,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000915, train/loss_step=0.216, global_step=8564.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  36%|███▌      | 437/1208 [12:50<22:38,  1.76s/it, loss=0.152, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000532, train/loss_step=0.160, global_step=8565.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  36%|███▋      | 438/1208 [12:51<22:35,  1.76s/it, loss=0.152, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000532, train/loss_step=0.160, global_step=8565.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  36%|███▋      | 438/1208 [12:51<22:35,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000535, train/loss_step=0.154, global_step=8565.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  36%|███▋      | 439/1208 [12:52<22:32,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000535, train/loss_step=0.154, global_step=8565.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  36%|███▋      | 439/1208 [12:52<22:32,  1.76s/it, loss=0.109, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.00442, train/loss_step=0.450, global_step=8565.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  36%|███▋      | 440/1208 [12:55<22:33,  1.76s/it, loss=0.109, v_num=0, train/loss_simple_step=0.450, train/loss_vlb_step=0.00442, train/loss_step=0.450, global_step=8565.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  36%|███▋      | 440/1208 [12:55<22:33,  1.76s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.84e-5, train/loss_step=0.0187, global_step=8565.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  37%|███▋      | 441/1208 [12:56<22:30,  1.76s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=7.84e-5, train/loss_step=0.0187, global_step=8565.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  37%|███▋      | 441/1208 [12:56<22:30,  1.76s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.3e-5, train/loss_step=0.014, global_step=8566.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  37%|███▋      | 442/1208 [12:57<22:27,  1.76s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.3e-5, train/loss_step=0.014, global_step=8566.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  37%|███▋      | 442/1208 [12:57<22:27,  1.76s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=8.86e-5, train/loss_step=0.0223, global_step=8566.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  37%|███▋      | 443/1208 [12:58<22:24,  1.76s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=8.86e-5, train/loss_step=0.0223, global_step=8566.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  37%|███▋      | 443/1208 [12:58<22:24,  1.76s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.00754, train/loss_vlb_step=3.68e-5, train/loss_step=0.00754, global_step=8566.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  37%|███▋      | 444/1208 [13:01<22:25,  1.76s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.00754, train/loss_vlb_step=3.68e-5, train/loss_step=0.00754, global_step=8566.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  37%|███▋      | 444/1208 [13:01<22:25,  1.76s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.000144, train/loss_step=0.041, global_step=8566.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  37%|███▋      | 445/1208 [13:03<22:22,  1.76s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.000144, train/loss_step=0.041, global_step=8566.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  37%|███▋      | 445/1208 [13:03<22:22,  1.76s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.0461, train/loss_vlb_step=0.000176, train/loss_step=0.0461, global_step=8567.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  37%|███▋      | 446/1208 [13:04<22:19,  1.76s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.0461, train/loss_vlb_step=0.000176, train/loss_step=0.0461, global_step=8567.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  37%|███▋      | 446/1208 [13:04<22:19,  1.76s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000197, train/loss_step=0.0555, global_step=8567.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  37%|███▋      | 447/1208 [13:05<22:16,  1.76s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.0555, train/loss_vlb_step=0.000197, train/loss_step=0.0555, global_step=8567.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  37%|███▋      | 447/1208 [13:05<22:16,  1.76s/it, loss=0.1, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000672, train/loss_step=0.191, global_step=8567.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]     Epoch 28:  37%|███▋      | 448/1208 [13:08<22:17,  1.76s/it, loss=0.1, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000672, train/loss_step=0.191, global_step=8567.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  37%|███▋      | 448/1208 [13:08<22:17,  1.76s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0866, train/loss_vlb_step=0.000289, train/loss_step=0.0866, global_step=8567.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  37%|███▋      | 449/1208 [13:09<22:14,  1.76s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0866, train/loss_vlb_step=0.000289, train/loss_step=0.0866, global_step=8567.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  37%|███▋      | 449/1208 [13:09<22:14,  1.76s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00601, train/loss_vlb_step=2.93e-5, train/loss_step=0.00601, global_step=8568.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  37%|███▋      | 450/1208 [13:10<22:11,  1.76s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00601, train/loss_vlb_step=2.93e-5, train/loss_step=0.00601, global_step=8568.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  37%|███▋      | 450/1208 [13:10<22:11,  1.76s/it, loss=0.108, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00113, train/loss_step=0.248, global_step=8568.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  37%|███▋      | 451/1208 [13:11<22:08,  1.76s/it, loss=0.108, v_num=0, train/loss_simple_step=0.248, train/loss_vlb_step=0.00113, train/loss_step=0.248, global_step=8568.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  37%|███▋      | 451/1208 [13:11<22:08,  1.76s/it, loss=0.11, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.000163, train/loss_step=0.045, global_step=8568.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  37%|███▋      | 452/1208 [13:14<22:09,  1.76s/it, loss=0.11, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.000163, train/loss_step=0.045, global_step=8568.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  37%|███▋      | 452/1208 [13:14<22:09,  1.76s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000182, train/loss_step=0.0525, global_step=8568.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  38%|███▊      | 453/1208 [13:16<22:06,  1.76s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000182, train/loss_step=0.0525, global_step=8568.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  38%|███▊      | 453/1208 [13:16<22:06,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00191, train/loss_step=0.324, global_step=8569.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  38%|███▊      | 454/1208 [13:17<22:03,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00191, train/loss_step=0.324, global_step=8569.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  38%|███▊      | 454/1208 [13:17<22:03,  1.76s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000155, train/loss_step=0.0449, global_step=8569.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  38%|███▊      | 455/1208 [13:18<22:00,  1.75s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0449, train/loss_vlb_step=0.000155, train/loss_step=0.0449, global_step=8569.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  38%|███▊      | 455/1208 [13:18<22:00,  1.75s/it, loss=0.11, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.81e-5, train/loss_step=0.016, global_step=8569.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  38%|███▊      | 456/1208 [13:21<22:01,  1.76s/it, loss=0.11, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.81e-5, train/loss_step=0.016, global_step=8569.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  38%|███▊      | 456/1208 [13:21<22:01,  1.76s/it, loss=0.0997, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.69e-5, train/loss_step=0.010, global_step=8569.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  38%|███▊      | 457/1208 [13:22<21:58,  1.76s/it, loss=0.0997, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.69e-5, train/loss_step=0.010, global_step=8569.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  38%|███▊      | 457/1208 [13:22<21:58,  1.76s/it, loss=0.0918, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=1.89e-5, train/loss_step=0.00356, global_step=8570.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  38%|███▊      | 458/1208 [13:23<21:55,  1.75s/it, loss=0.0918, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=1.89e-5, train/loss_step=0.00356, global_step=8570.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  38%|███▊      | 458/1208 [13:23<21:55,  1.75s/it, loss=0.0894, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=8570.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  38%|███▊      | 459/1208 [13:24<21:53,  1.75s/it, loss=0.0894, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=8570.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  38%|███▊      | 459/1208 [13:24<21:53,  1.75s/it, loss=0.0671, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=2.21e-5, train/loss_step=0.00413, global_step=8570.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  38%|███▊      | 460/1208 [13:27<21:53,  1.76s/it, loss=0.0671, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=2.21e-5, train/loss_step=0.00413, global_step=8570.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  38%|███▊      | 460/1208 [13:27<21:53,  1.76s/it, loss=0.0766, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000843, train/loss_step=0.210, global_step=8570.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  38%|███▊      | 461/1208 [13:28<21:50,  1.75s/it, loss=0.0766, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000843, train/loss_step=0.210, global_step=8570.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  38%|███▊      | 461/1208 [13:28<21:50,  1.75s/it, loss=0.0888, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00106, train/loss_step=0.258, global_step=8571.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  38%|███▊      | 462/1208 [13:30<21:48,  1.75s/it, loss=0.0888, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00106, train/loss_step=0.258, global_step=8571.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  38%|███▊      | 462/1208 [13:30<21:48,  1.75s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000996, train/loss_step=0.219, global_step=8571.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  38%|███▊      | 463/1208 [13:31<21:45,  1.75s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000996, train/loss_step=0.219, global_step=8571.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  38%|███▊      | 463/1208 [13:31<21:45,  1.75s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000127, train/loss_step=0.0339, global_step=8571.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  38%|███▊      | 464/1208 [13:34<21:45,  1.76s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000127, train/loss_step=0.0339, global_step=8571.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  38%|███▊      | 464/1208 [13:34<21:45,  1.76s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.69e-5, train/loss_step=0.0155, global_step=8571.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  38%|███▊      | 465/1208 [13:35<21:43,  1.75s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.69e-5, train/loss_step=0.0155, global_step=8571.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  38%|███▊      | 465/1208 [13:35<21:43,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.609, train/loss_vlb_step=0.018, train/loss_step=0.609, global_step=8572.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]     Epoch 28:  39%|███▊      | 466/1208 [13:36<21:40,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.609, train/loss_vlb_step=0.018, train/loss_step=0.609, global_step=8572.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  39%|███▊      | 466/1208 [13:36<21:40,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.05e-5, train/loss_step=0.0194, global_step=8572.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  39%|███▊      | 467/1208 [13:37<21:37,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.05e-5, train/loss_step=0.0194, global_step=8572.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  39%|███▊      | 467/1208 [13:37<21:37,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000377, train/loss_step=0.112, global_step=8572.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  39%|███▊      | 468/1208 [13:40<21:38,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000377, train/loss_step=0.112, global_step=8572.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  39%|███▊      | 468/1208 [13:40<21:38,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00911, train/loss_vlb_step=4.25e-5, train/loss_step=0.00911, global_step=8572.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  39%|███▉      | 469/1208 [13:42<21:35,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00911, train/loss_vlb_step=4.25e-5, train/loss_step=0.00911, global_step=8572.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  39%|███▉      | 469/1208 [13:42<21:35,  1.75s/it, loss=0.133, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00148, train/loss_step=0.312, global_step=8573.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  39%|███▉      | 470/1208 [13:43<21:32,  1.75s/it, loss=0.133, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00148, train/loss_step=0.312, global_step=8573.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  39%|███▉      | 470/1208 [13:43<21:32,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0622, train/loss_vlb_step=0.000205, train/loss_step=0.0622, global_step=8573.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  39%|███▉      | 471/1208 [13:44<21:29,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0622, train/loss_vlb_step=0.000205, train/loss_step=0.0622, global_step=8573.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  39%|███▉      | 471/1208 [13:44<21:29,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00853, train/loss_vlb_step=4.09e-5, train/loss_step=0.00853, global_step=8573.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  39%|███▉      | 472/1208 [13:47<21:30,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.00853, train/loss_vlb_step=4.09e-5, train/loss_step=0.00853, global_step=8573.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  39%|███▉      | 472/1208 [13:47<21:30,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.000112, train/loss_step=0.0285, global_step=8573.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  39%|███▉      | 473/1208 [13:48<21:27,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.000112, train/loss_step=0.0285, global_step=8573.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  39%|███▉      | 473/1208 [13:48<21:27,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00267, train/loss_step=0.369, global_step=8574.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  39%|███▉      | 474/1208 [13:49<21:24,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00267, train/loss_step=0.369, global_step=8574.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  39%|███▉      | 474/1208 [13:49<21:24,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.29e-5, train/loss_step=0.0145, global_step=8574.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  39%|███▉      | 475/1208 [13:50<21:21,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.29e-5, train/loss_step=0.0145, global_step=8574.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  39%|███▉      | 475/1208 [13:50<21:21,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0076, train/loss_vlb_step=3.7e-5, train/loss_step=0.0076, global_step=8574.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  39%|███▉      | 476/1208 [13:53<21:22,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0076, train/loss_vlb_step=3.7e-5, train/loss_step=0.0076, global_step=8574.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  39%|███▉      | 476/1208 [13:53<21:22,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.67e-5, train/loss_step=0.012, global_step=8574.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  39%|███▉      | 477/1208 [13:55<21:19,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.67e-5, train/loss_step=0.012, global_step=8574.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  39%|███▉      | 477/1208 [13:55<21:19,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00236, train/loss_step=0.409, global_step=8575.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  40%|███▉      | 478/1208 [13:56<21:16,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.409, train/loss_vlb_step=0.00236, train/loss_step=0.409, global_step=8575.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  40%|███▉      | 478/1208 [13:56<21:16,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00857, train/loss_vlb_step=4.14e-5, train/loss_step=0.00857, global_step=8575.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  40%|███▉      | 479/1208 [13:57<21:14,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00857, train/loss_vlb_step=4.14e-5, train/loss_step=0.00857, global_step=8575.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  40%|███▉      | 479/1208 [13:57<21:14,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00965, train/loss_vlb_step=4.59e-5, train/loss_step=0.00965, global_step=8575.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  40%|███▉      | 480/1208 [14:00<21:14,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00965, train/loss_vlb_step=4.59e-5, train/loss_step=0.00965, global_step=8575.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  40%|███▉      | 480/1208 [14:00<21:14,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00832, train/loss_vlb_step=3.89e-5, train/loss_step=0.00832, global_step=8575.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  40%|███▉      | 481/1208 [14:01<21:11,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00832, train/loss_vlb_step=3.89e-5, train/loss_step=0.00832, global_step=8575.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  40%|███▉      | 481/1208 [14:01<21:11,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000405, train/loss_step=0.122, global_step=8576.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  40%|███▉      | 482/1208 [14:02<21:09,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000405, train/loss_step=0.122, global_step=8576.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  40%|███▉      | 482/1208 [14:02<21:09,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000722, train/loss_step=0.201, global_step=8576.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  40%|███▉      | 483/1208 [14:03<21:06,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000722, train/loss_step=0.201, global_step=8576.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  40%|███▉      | 483/1208 [14:03<21:06,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=9.03e-5, train/loss_step=0.0223, global_step=8576.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  40%|████      | 484/1208 [14:06<21:06,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=9.03e-5, train/loss_step=0.0223, global_step=8576.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  40%|████      | 484/1208 [14:06<21:06,  1.75s/it, loss=0.145, v_num=0, train/loss_simple_step=0.560, train/loss_vlb_step=0.0143, train/loss_step=0.560, global_step=8576.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  40%|████      | 485/1208 [14:07<21:03,  1.75s/it, loss=0.145, v_num=0, train/loss_simple_step=0.560, train/loss_vlb_step=0.0143, train/loss_step=0.560, global_step=8576.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  40%|████      | 485/1208 [14:07<21:03,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000718, train/loss_step=0.201, global_step=8577.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  40%|████      | 486/1208 [14:08<21:01,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000718, train/loss_step=0.201, global_step=8577.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  40%|████      | 486/1208 [14:08<21:01,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=9.66e-5, train/loss_step=0.0244, global_step=8577.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  40%|████      | 487/1208 [14:09<20:58,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=9.66e-5, train/loss_step=0.0244, global_step=8577.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  40%|████      | 487/1208 [14:09<20:58,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00554, train/loss_vlb_step=2.74e-5, train/loss_step=0.00554, global_step=8577.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  40%|████      | 488/1208 [14:13<20:58,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00554, train/loss_vlb_step=2.74e-5, train/loss_step=0.00554, global_step=8577.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  40%|████      | 488/1208 [14:13<20:58,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=1.97e-5, train/loss_step=0.00357, global_step=8577.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  40%|████      | 489/1208 [14:14<20:56,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=1.97e-5, train/loss_step=0.00357, global_step=8577.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  40%|████      | 489/1208 [14:14<20:56,  1.75s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0501, train/loss_vlb_step=0.000176, train/loss_step=0.0501, global_step=8578.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  41%|████      | 490/1208 [14:15<20:53,  1.75s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0501, train/loss_vlb_step=0.000176, train/loss_step=0.0501, global_step=8578.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  41%|████      | 490/1208 [14:15<20:53,  1.75s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00508, train/loss_vlb_step=2.65e-5, train/loss_step=0.00508, global_step=8578.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  41%|████      | 491/1208 [14:16<20:50,  1.74s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00508, train/loss_vlb_step=2.65e-5, train/loss_step=0.00508, global_step=8578.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  41%|████      | 491/1208 [14:16<20:50,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=1.08e-5, train/loss_step=0.00181, global_step=8578.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  41%|████      | 492/1208 [14:19<20:51,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=1.08e-5, train/loss_step=0.00181, global_step=8578.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  41%|████      | 492/1208 [14:19<20:51,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00105, train/loss_step=0.271, global_step=8578.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  41%|████      | 493/1208 [14:20<20:48,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00105, train/loss_step=0.271, global_step=8578.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  41%|████      | 493/1208 [14:20<20:48,  1.75s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.00012, train/loss_step=0.0313, global_step=8579.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  41%|████      | 494/1208 [14:21<20:45,  1.74s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.00012, train/loss_step=0.0313, global_step=8579.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  41%|████      | 494/1208 [14:21<20:45,  1.74s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.000179, train/loss_step=0.0526, global_step=8579.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  41%|████      | 495/1208 [14:22<20:42,  1.74s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.000179, train/loss_step=0.0526, global_step=8579.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  41%|████      | 495/1208 [14:22<20:42,  1.74s/it, loss=0.106, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.00038, train/loss_step=0.116, global_step=8579.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  41%|████      | 496/1208 [14:26<20:43,  1.75s/it, loss=0.106, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.00038, train/loss_step=0.116, global_step=8579.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  41%|████      | 496/1208 [14:26<20:43,  1.75s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00897, train/loss_vlb_step=4.35e-5, train/loss_step=0.00897, global_step=8579.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  41%|████      | 497/1208 [14:27<20:40,  1.75s/it, loss=0.106, v_num=0, train/loss_simple_step=0.00897, train/loss_vlb_step=4.35e-5, train/loss_step=0.00897, global_step=8579.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  41%|████      | 497/1208 [14:27<20:40,  1.75s/it, loss=0.0911, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.00039, train/loss_step=0.119, global_step=8580.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  41%|████      | 498/1208 [14:28<20:37,  1.74s/it, loss=0.0911, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.00039, train/loss_step=0.119, global_step=8580.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  41%|████      | 498/1208 [14:28<20:37,  1.74s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000206, train/loss_step=0.0588, global_step=8580.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  41%|████▏     | 499/1208 [14:29<20:35,  1.74s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000206, train/loss_step=0.0588, global_step=8580.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  41%|████▏     | 499/1208 [14:29<20:35,  1.74s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.00015, train/loss_step=0.0403, global_step=8580.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  41%|████▏     | 500/1208 [14:32<20:35,  1.75s/it, loss=0.0951, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.00015, train/loss_step=0.0403, global_step=8580.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  41%|████▏     | 500/1208 [14:32<20:35,  1.75s/it, loss=0.0952, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.75e-5, train/loss_step=0.010, global_step=8580.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  41%|████▏     | 501/1208 [14:33<20:33,  1.74s/it, loss=0.0952, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.75e-5, train/loss_step=0.010, global_step=8580.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  41%|████▏     | 501/1208 [14:33<20:33,  1.74s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.0571, train/loss_vlb_step=0.000213, train/loss_step=0.0571, global_step=8581.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  42%|████▏     | 502/1208 [14:34<20:30,  1.74s/it, loss=0.0919, v_num=0, train/loss_simple_step=0.0571, train/loss_vlb_step=0.000213, train/loss_step=0.0571, global_step=8581.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  42%|████▏     | 502/1208 [14:34<20:30,  1.74s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00101, train/loss_step=0.251, global_step=8581.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  42%|████▏     | 503/1208 [14:35<20:27,  1.74s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00101, train/loss_step=0.251, global_step=8581.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  42%|████▏     | 503/1208 [14:35<20:27,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000645, train/loss_step=0.184, global_step=8581.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  42%|████▏     | 504/1208 [14:39<20:28,  1.74s/it, loss=0.102, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000645, train/loss_step=0.184, global_step=8581.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  42%|████▏     | 504/1208 [14:39<20:28,  1.74s/it, loss=0.0767, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000158, train/loss_step=0.0438, global_step=8581.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  42%|████▏     | 505/1208 [14:40<20:25,  1.74s/it, loss=0.0767, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000158, train/loss_step=0.0438, global_step=8581.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  42%|████▏     | 505/1208 [14:40<20:25,  1.74s/it, loss=0.0744, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000526, train/loss_step=0.155, global_step=8582.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  42%|████▏     | 506/1208 [14:41<20:22,  1.74s/it, loss=0.0744, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000526, train/loss_step=0.155, global_step=8582.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  42%|████▏     | 506/1208 [14:41<20:22,  1.74s/it, loss=0.0888, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00197, train/loss_step=0.312, global_step=8582.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  42%|████▏     | 507/1208 [14:42<20:20,  1.74s/it, loss=0.0888, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00197, train/loss_step=0.312, global_step=8582.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  42%|████▏     | 507/1208 [14:42<20:20,  1.74s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.0973, train/loss_vlb_step=0.00032, train/loss_step=0.0973, global_step=8582.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  42%|████▏     | 508/1208 [14:45<20:20,  1.74s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.0973, train/loss_vlb_step=0.00032, train/loss_step=0.0973, global_step=8582.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  42%|████▏     | 508/1208 [14:45<20:20,  1.74s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.0501, train/loss_vlb_step=0.00018, train/loss_step=0.0501, global_step=8582.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  42%|████▏     | 509/1208 [14:46<20:17,  1.74s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.0501, train/loss_vlb_step=0.00018, train/loss_step=0.0501, global_step=8582.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  42%|████▏     | 509/1208 [14:46<20:17,  1.74s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.0694, train/loss_vlb_step=0.000237, train/loss_step=0.0694, global_step=8583.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  42%|████▏     | 510/1208 [14:47<20:15,  1.74s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.0694, train/loss_vlb_step=0.000237, train/loss_step=0.0694, global_step=8583.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  42%|████▏     | 510/1208 [14:47<20:15,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000825, train/loss_step=0.206, global_step=8583.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  42%|████▏     | 511/1208 [14:48<20:12,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.000825, train/loss_step=0.206, global_step=8583.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  42%|████▏     | 511/1208 [14:48<20:12,  1.74s/it, loss=0.11, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.000215, train/loss_step=0.062, global_step=8583.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  42%|████▏     | 512/1208 [14:52<20:12,  1.74s/it, loss=0.11, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.000215, train/loss_step=0.062, global_step=8583.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  42%|████▏     | 512/1208 [14:52<20:12,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000662, train/loss_step=0.175, global_step=8583.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  42%|████▏     | 513/1208 [14:53<20:10,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000662, train/loss_step=0.175, global_step=8583.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  42%|████▏     | 513/1208 [14:53<20:10,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.23e-5, train/loss_step=0.00211, global_step=8584.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  43%|████▎     | 514/1208 [14:54<20:07,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.23e-5, train/loss_step=0.00211, global_step=8584.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  43%|████▎     | 514/1208 [14:54<20:07,  1.74s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.93e-5, train/loss_step=0.0107, global_step=8584.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  43%|████▎     | 515/1208 [14:55<20:04,  1.74s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.93e-5, train/loss_step=0.0107, global_step=8584.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  43%|████▎     | 515/1208 [14:55<20:04,  1.74s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.67e-5, train/loss_step=0.0105, global_step=8584.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  43%|████▎     | 516/1208 [14:58<20:05,  1.74s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.67e-5, train/loss_step=0.0105, global_step=8584.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  43%|████▎     | 516/1208 [14:58<20:05,  1.74s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.00996, train/loss_vlb_step=4.48e-5, train/loss_step=0.00996, global_step=8584.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  43%|████▎     | 517/1208 [14:59<20:02,  1.74s/it, loss=0.0962, v_num=0, train/loss_simple_step=0.00996, train/loss_vlb_step=4.48e-5, train/loss_step=0.00996, global_step=8584.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  43%|████▎     | 517/1208 [14:59<20:02,  1.74s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=9.03e-5, train/loss_step=0.0221, global_step=8585.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  43%|████▎     | 518/1208 [15:00<19:59,  1.74s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=9.03e-5, train/loss_step=0.0221, global_step=8585.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  43%|████▎     | 518/1208 [15:00<19:59,  1.74s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.0978, train/loss_vlb_step=0.000321, train/loss_step=0.0978, global_step=8585.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  43%|████▎     | 519/1208 [15:01<19:57,  1.74s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.0978, train/loss_vlb_step=0.000321, train/loss_step=0.0978, global_step=8585.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  43%|████▎     | 519/1208 [15:01<19:57,  1.74s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.00732, train/loss_vlb_step=3.73e-5, train/loss_step=0.00732, global_step=8585.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  43%|████▎     | 520/1208 [15:05<19:57,  1.74s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.00732, train/loss_vlb_step=3.73e-5, train/loss_step=0.00732, global_step=8585.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  43%|████▎     | 520/1208 [15:05<19:57,  1.74s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000424, train/loss_step=0.129, global_step=8585.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  43%|████▎     | 521/1208 [15:06<19:54,  1.74s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000424, train/loss_step=0.129, global_step=8585.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  43%|████▎     | 521/1208 [15:06<19:54,  1.74s/it, loss=0.095, v_num=0, train/loss_simple_step=0.00602, train/loss_vlb_step=3.02e-5, train/loss_step=0.00602, global_step=8586.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  43%|████▎     | 522/1208 [15:07<19:52,  1.74s/it, loss=0.095, v_num=0, train/loss_simple_step=0.00602, train/loss_vlb_step=3.02e-5, train/loss_step=0.00602, global_step=8586.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  43%|████▎     | 522/1208 [15:07<19:52,  1.74s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00137, train/loss_step=0.298, global_step=8586.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  43%|████▎     | 523/1208 [15:08<19:49,  1.74s/it, loss=0.0974, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00137, train/loss_step=0.298, global_step=8586.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  43%|████▎     | 523/1208 [15:08<19:49,  1.74s/it, loss=0.0887, v_num=0, train/loss_simple_step=0.00951, train/loss_vlb_step=4.63e-5, train/loss_step=0.00951, global_step=8586.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  43%|████▎     | 524/1208 [15:11<19:49,  1.74s/it, loss=0.0887, v_num=0, train/loss_simple_step=0.00951, train/loss_vlb_step=4.63e-5, train/loss_step=0.00951, global_step=8586.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  43%|████▎     | 524/1208 [15:11<19:49,  1.74s/it, loss=0.0878, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000105, train/loss_step=0.0273, global_step=8586.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  43%|████▎     | 525/1208 [15:12<19:47,  1.74s/it, loss=0.0878, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000105, train/loss_step=0.0273, global_step=8586.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  43%|████▎     | 525/1208 [15:12<19:47,  1.74s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.0004, train/loss_step=0.121, global_step=8587.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  44%|████▎     | 526/1208 [15:13<19:44,  1.74s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.0004, train/loss_step=0.121, global_step=8587.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  44%|████▎     | 526/1208 [15:13<19:44,  1.74s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00112, train/loss_step=0.259, global_step=8587.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  44%|████▎     | 527/1208 [15:14<19:42,  1.74s/it, loss=0.0835, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00112, train/loss_step=0.259, global_step=8587.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  44%|████▎     | 527/1208 [15:14<19:42,  1.74s/it, loss=0.0886, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000702, train/loss_step=0.201, global_step=8587.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  44%|████▎     | 528/1208 [15:17<19:42,  1.74s/it, loss=0.0886, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000702, train/loss_step=0.201, global_step=8587.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  44%|████▎     | 528/1208 [15:17<19:42,  1.74s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.0943, train/loss_vlb_step=0.000311, train/loss_step=0.0943, global_step=8587.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  44%|████▍     | 529/1208 [15:19<19:39,  1.74s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.0943, train/loss_vlb_step=0.000311, train/loss_step=0.0943, global_step=8587.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  44%|████▍     | 529/1208 [15:19<19:39,  1.74s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.99e-5, train/loss_step=0.00352, global_step=8588.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  44%|████▍     | 530/1208 [15:20<19:37,  1.74s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.99e-5, train/loss_step=0.00352, global_step=8588.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  44%|████▍     | 530/1208 [15:20<19:37,  1.74s/it, loss=0.081, v_num=0, train/loss_simple_step=0.075, train/loss_vlb_step=0.000247, train/loss_step=0.075, global_step=8588.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  44%|████▍     | 531/1208 [15:21<19:34,  1.73s/it, loss=0.081, v_num=0, train/loss_simple_step=0.075, train/loss_vlb_step=0.000247, train/loss_step=0.075, global_step=8588.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  44%|████▍     | 531/1208 [15:21<19:34,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.833, train/loss_vlb_step=0.071, train/loss_step=0.833, global_step=8588.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  44%|████▍     | 532/1208 [15:24<19:34,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.833, train/loss_vlb_step=0.071, train/loss_step=0.833, global_step=8588.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  44%|████▍     | 532/1208 [15:24<19:34,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000148, train/loss_step=0.0406, global_step=8588.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  44%|████▍     | 533/1208 [15:25<19:32,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0406, train/loss_vlb_step=0.000148, train/loss_step=0.0406, global_step=8588.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  44%|████▍     | 533/1208 [15:25<19:32,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.32e-5, train/loss_step=0.0173, global_step=8589.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  44%|████▍     | 534/1208 [15:26<19:29,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.32e-5, train/loss_step=0.0173, global_step=8589.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  44%|████▍     | 534/1208 [15:26<19:29,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00976, train/loss_vlb_step=4.49e-5, train/loss_step=0.00976, global_step=8589.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  44%|████▍     | 535/1208 [15:27<19:26,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00976, train/loss_vlb_step=4.49e-5, train/loss_step=0.00976, global_step=8589.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  44%|████▍     | 535/1208 [15:27<19:26,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00325, train/loss_step=0.432, global_step=8589.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  44%|████▍     | 536/1208 [15:30<19:27,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00325, train/loss_step=0.432, global_step=8589.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  44%|████▍     | 536/1208 [15:30<19:27,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000128, train/loss_step=0.0345, global_step=8589.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  44%|████▍     | 537/1208 [15:32<19:24,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0345, train/loss_vlb_step=0.000128, train/loss_step=0.0345, global_step=8589.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  44%|████▍     | 537/1208 [15:32<19:24,  1.74s/it, loss=0.15, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00175, train/loss_step=0.308, global_step=8590.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  45%|████▍     | 538/1208 [15:33<19:22,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00175, train/loss_step=0.308, global_step=8590.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  45%|████▍     | 538/1208 [15:33<19:22,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0617, train/loss_vlb_step=0.000213, train/loss_step=0.0617, global_step=8590.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  45%|████▍     | 539/1208 [15:34<19:19,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0617, train/loss_vlb_step=0.000213, train/loss_step=0.0617, global_step=8590.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  45%|████▍     | 539/1208 [15:34<19:19,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0522, train/loss_vlb_step=0.00018, train/loss_step=0.0522, global_step=8590.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  45%|████▍     | 540/1208 [15:37<19:19,  1.74s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0522, train/loss_vlb_step=0.00018, train/loss_step=0.0522, global_step=8590.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  45%|████▍     | 540/1208 [15:37<19:19,  1.74s/it, loss=0.16, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00156, train/loss_step=0.307, global_step=8590.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  45%|████▍     | 541/1208 [15:38<19:16,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00156, train/loss_step=0.307, global_step=8590.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  45%|████▍     | 541/1208 [15:38<19:16,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000589, train/loss_step=0.166, global_step=8591.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  45%|████▍     | 542/1208 [15:39<19:14,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.000589, train/loss_step=0.166, global_step=8591.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  45%|████▍     | 542/1208 [15:39<19:14,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000121, train/loss_step=0.031, global_step=8591.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  45%|████▍     | 543/1208 [15:40<19:11,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000121, train/loss_step=0.031, global_step=8591.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  45%|████▍     | 543/1208 [15:40<19:11,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00963, train/loss_vlb_step=4.37e-5, train/loss_step=0.00963, global_step=8591.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  45%|████▌     | 544/1208 [15:43<19:11,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00963, train/loss_vlb_step=4.37e-5, train/loss_step=0.00963, global_step=8591.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  45%|████▌     | 544/1208 [15:43<19:11,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0781, train/loss_vlb_step=0.000257, train/loss_step=0.0781, global_step=8591.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  45%|████▌     | 545/1208 [15:44<19:09,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0781, train/loss_vlb_step=0.000257, train/loss_step=0.0781, global_step=8591.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  45%|████▌     | 545/1208 [15:44<19:09,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00184, train/loss_step=0.311, global_step=8592.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  45%|████▌     | 546/1208 [15:45<19:06,  1.73s/it, loss=0.166, v_num=0, train/loss_simple_step=0.311, train/loss_vlb_step=0.00184, train/loss_step=0.311, global_step=8592.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  45%|████▌     | 546/1208 [15:45<19:06,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00369, train/loss_step=0.436, global_step=8592.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  45%|████▌     | 547/1208 [15:46<19:04,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.436, train/loss_vlb_step=0.00369, train/loss_step=0.436, global_step=8592.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  45%|████▌     | 547/1208 [15:46<19:04,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.0015, train/loss_step=0.282, global_step=8592.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  45%|████▌     | 548/1208 [15:50<19:04,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.0015, train/loss_step=0.282, global_step=8592.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  45%|████▌     | 548/1208 [15:50<19:04,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000463, train/loss_step=0.140, global_step=8592.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  45%|████▌     | 549/1208 [15:51<19:01,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000463, train/loss_step=0.140, global_step=8592.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  45%|████▌     | 549/1208 [15:51<19:01,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0042, train/loss_vlb_step=2.27e-5, train/loss_step=0.0042, global_step=8593.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  46%|████▌     | 550/1208 [15:52<18:59,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0042, train/loss_vlb_step=2.27e-5, train/loss_step=0.0042, global_step=8593.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  46%|████▌     | 550/1208 [15:52<18:59,  1.73s/it, loss=0.2, v_num=0, train/loss_simple_step=0.448, train/loss_vlb_step=0.0062, train/loss_step=0.448, global_step=8593.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]     Epoch 28:  46%|████▌     | 551/1208 [15:53<18:56,  1.73s/it, loss=0.2, v_num=0, train/loss_simple_step=0.448, train/loss_vlb_step=0.0062, train/loss_step=0.448, global_step=8593.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  46%|████▌     | 551/1208 [15:53<18:56,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000124, train/loss_step=0.0327, global_step=8593.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  46%|████▌     | 552/1208 [15:56<18:56,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000124, train/loss_step=0.0327, global_step=8593.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  46%|████▌     | 552/1208 [15:56<18:56,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000449, train/loss_step=0.134, global_step=8593.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  46%|████▌     | 553/1208 [15:57<18:54,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000449, train/loss_step=0.134, global_step=8593.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  46%|████▌     | 553/1208 [15:57<18:54,  1.73s/it, loss=0.176, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.00101, train/loss_step=0.233, global_step=8594.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  46%|████▌     | 554/1208 [15:58<18:51,  1.73s/it, loss=0.176, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.00101, train/loss_step=0.233, global_step=8594.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  46%|████▌     | 554/1208 [15:58<18:51,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000521, train/loss_step=0.153, global_step=8594.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  46%|████▌     | 555/1208 [15:59<18:49,  1.73s/it, loss=0.183, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000521, train/loss_step=0.153, global_step=8594.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  46%|████▌     | 555/1208 [15:59<18:49,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.54e-5, train/loss_step=0.00266, global_step=8594.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  46%|████▌     | 556/1208 [16:03<18:49,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.54e-5, train/loss_step=0.00266, global_step=8594.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  46%|████▌     | 556/1208 [16:03<18:49,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.23e-5, train/loss_step=0.0136, global_step=8594.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  46%|████▌     | 557/1208 [16:04<18:46,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.23e-5, train/loss_step=0.0136, global_step=8594.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  46%|████▌     | 557/1208 [16:04<18:46,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=8595.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  46%|████▌     | 558/1208 [16:05<18:44,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000372, train/loss_step=0.113, global_step=8595.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  46%|████▌     | 558/1208 [16:05<18:44,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000666, train/loss_step=0.187, global_step=8595.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  46%|████▋     | 559/1208 [16:06<18:41,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000666, train/loss_step=0.187, global_step=8595.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  46%|████▋     | 559/1208 [16:06<18:41,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000753, train/loss_step=0.211, global_step=8595.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  46%|████▋     | 560/1208 [16:09<18:41,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000753, train/loss_step=0.211, global_step=8595.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  46%|████▋     | 560/1208 [16:09<18:41,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.67e-5, train/loss_step=0.0155, global_step=8595.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  46%|████▋     | 561/1208 [16:10<18:39,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.67e-5, train/loss_step=0.0155, global_step=8595.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  46%|████▋     | 561/1208 [16:10<18:39,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.060, train/loss_vlb_step=0.000206, train/loss_step=0.060, global_step=8596.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  47%|████▋     | 562/1208 [16:11<18:36,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.060, train/loss_vlb_step=0.000206, train/loss_step=0.060, global_step=8596.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  47%|████▋     | 562/1208 [16:11<18:36,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.91e-5, train/loss_step=0.0243, global_step=8596.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  47%|████▋     | 563/1208 [16:12<18:34,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.91e-5, train/loss_step=0.0243, global_step=8596.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  47%|████▋     | 563/1208 [16:12<18:34,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=1.84e-5, train/loss_step=0.0034, global_step=8596.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  47%|████▋     | 564/1208 [16:15<18:34,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=1.84e-5, train/loss_step=0.0034, global_step=8596.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  47%|████▋     | 564/1208 [16:15<18:34,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=1.22e-5, train/loss_step=0.00201, global_step=8596.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  47%|████▋     | 565/1208 [16:17<18:31,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=1.22e-5, train/loss_step=0.00201, global_step=8596.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  47%|████▋     | 565/1208 [16:17<18:31,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0607, train/loss_vlb_step=0.000204, train/loss_step=0.0607, global_step=8597.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  47%|████▋     | 566/1208 [16:18<18:29,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0607, train/loss_vlb_step=0.000204, train/loss_step=0.0607, global_step=8597.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  47%|████▋     | 566/1208 [16:18<18:29,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00117, train/loss_step=0.250, global_step=8597.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  47%|████▋     | 567/1208 [16:19<18:26,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.00117, train/loss_step=0.250, global_step=8597.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  47%|████▋     | 567/1208 [16:19<18:26,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.532, train/loss_vlb_step=0.00652, train/loss_step=0.532, global_step=8597.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  47%|████▋     | 568/1208 [16:22<18:26,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.532, train/loss_vlb_step=0.00652, train/loss_step=0.532, global_step=8597.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  47%|████▋     | 568/1208 [16:22<18:26,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0918, train/loss_vlb_step=0.000315, train/loss_step=0.0918, global_step=8597.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  47%|████▋     | 569/1208 [16:23<18:24,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0918, train/loss_vlb_step=0.000315, train/loss_step=0.0918, global_step=8597.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  47%|████▋     | 569/1208 [16:23<18:24,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000392, train/loss_step=0.117, global_step=8598.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  47%|████▋     | 570/1208 [16:24<18:22,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000392, train/loss_step=0.117, global_step=8598.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  47%|████▋     | 570/1208 [16:24<18:22,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000551, train/loss_step=0.163, global_step=8598.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  47%|████▋     | 571/1208 [16:25<18:19,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000551, train/loss_step=0.163, global_step=8598.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  47%|████▋     | 571/1208 [16:25<18:19,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000843, train/loss_step=0.212, global_step=8598.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  47%|████▋     | 572/1208 [16:28<18:19,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000843, train/loss_step=0.212, global_step=8598.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  47%|████▋     | 572/1208 [16:28<18:19,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000204, train/loss_step=0.0588, global_step=8598.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  47%|████▋     | 573/1208 [16:29<18:17,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000204, train/loss_step=0.0588, global_step=8598.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  47%|████▋     | 573/1208 [16:29<18:17,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00449, train/loss_vlb_step=2.52e-5, train/loss_step=0.00449, global_step=8599.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  48%|████▊     | 574/1208 [16:31<18:14,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00449, train/loss_vlb_step=2.52e-5, train/loss_step=0.00449, global_step=8599.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  48%|████▊     | 574/1208 [16:31<18:14,  1.73s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.06e-5, train/loss_step=0.0145, global_step=8599.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  48%|████▊     | 575/1208 [16:32<18:12,  1.73s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.06e-5, train/loss_step=0.0145, global_step=8599.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  48%|████▊     | 575/1208 [16:32<18:12,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000254, train/loss_step=0.0754, global_step=8599.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  48%|████▊     | 576/1208 [16:35<18:12,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000254, train/loss_step=0.0754, global_step=8599.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  48%|████▊     | 576/1208 [16:35<18:12,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00185, train/loss_step=0.321, global_step=8599.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  48%|████▊     | 577/1208 [16:36<18:09,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00185, train/loss_step=0.321, global_step=8599.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  48%|████▊     | 577/1208 [16:36<18:09,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.31e-5, train/loss_step=0.0173, global_step=8600.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  48%|████▊     | 578/1208 [16:37<18:07,  1.73s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.31e-5, train/loss_step=0.0173, global_step=8600.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  48%|████▊     | 578/1208 [16:37<18:07,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00401, train/loss_vlb_step=2.11e-5, train/loss_step=0.00401, global_step=8600.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  48%|████▊     | 579/1208 [16:38<18:04,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00401, train/loss_vlb_step=2.11e-5, train/loss_step=0.00401, global_step=8600.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  48%|████▊     | 579/1208 [16:38<18:04,  1.72s/it, loss=0.115, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00105, train/loss_step=0.265, global_step=8600.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  48%|████▊     | 580/1208 [16:41<18:04,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00105, train/loss_step=0.265, global_step=8600.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  48%|████▊     | 580/1208 [16:41<18:04,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=9e-5, train/loss_step=0.0219, global_step=8600.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  48%|████▊     | 581/1208 [16:43<18:02,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=9e-5, train/loss_step=0.0219, global_step=8600.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  48%|████▊     | 581/1208 [16:43<18:02,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00634, train/loss_vlb_step=3.23e-5, train/loss_step=0.00634, global_step=8601.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  48%|████▊     | 582/1208 [16:44<18:00,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00634, train/loss_vlb_step=3.23e-5, train/loss_step=0.00634, global_step=8601.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  48%|████▊     | 582/1208 [16:44<18:00,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.0015, train/loss_step=0.333, global_step=8601.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]     Epoch 28:  48%|████▊     | 583/1208 [16:45<17:57,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.0015, train/loss_step=0.333, global_step=8601.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  48%|████▊     | 583/1208 [16:45<17:57,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000927, train/loss_step=0.228, global_step=8601.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  48%|████▊     | 584/1208 [16:48<17:57,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000927, train/loss_step=0.228, global_step=8601.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  48%|████▊     | 584/1208 [16:48<17:57,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.486, train/loss_vlb_step=0.00597, train/loss_step=0.486, global_step=8601.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  48%|████▊     | 585/1208 [16:49<17:55,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.486, train/loss_vlb_step=0.00597, train/loss_step=0.486, global_step=8601.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  48%|████▊     | 585/1208 [16:49<17:55,  1.73s/it, loss=0.19, v_num=0, train/loss_simple_step=0.590, train/loss_vlb_step=0.0157, train/loss_step=0.590, global_step=8602.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  49%|████▊     | 586/1208 [16:50<17:52,  1.72s/it, loss=0.19, v_num=0, train/loss_simple_step=0.590, train/loss_vlb_step=0.0157, train/loss_step=0.590, global_step=8602.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  49%|████▊     | 586/1208 [16:50<17:52,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0389, train/loss_vlb_step=0.000141, train/loss_step=0.0389, global_step=8602.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  49%|████▊     | 587/1208 [16:51<17:50,  1.72s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0389, train/loss_vlb_step=0.000141, train/loss_step=0.0389, global_step=8602.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  49%|████▊     | 587/1208 [16:51<17:50,  1.72s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00588, train/loss_vlb_step=2.88e-5, train/loss_step=0.00588, global_step=8602.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  49%|████▊     | 588/1208 [16:55<17:50,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.00588, train/loss_vlb_step=2.88e-5, train/loss_step=0.00588, global_step=8602.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  49%|████▊     | 588/1208 [16:55<17:50,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.535, train/loss_vlb_step=0.00519, train/loss_step=0.535, global_step=8602.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  49%|████▉     | 589/1208 [16:56<17:47,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.535, train/loss_vlb_step=0.00519, train/loss_step=0.535, global_step=8602.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  49%|████▉     | 589/1208 [16:56<17:47,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0532, train/loss_vlb_step=0.000182, train/loss_step=0.0532, global_step=8603.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  49%|████▉     | 590/1208 [16:57<17:45,  1.72s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0532, train/loss_vlb_step=0.000182, train/loss_step=0.0532, global_step=8603.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  49%|████▉     | 590/1208 [16:57<17:45,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000957, train/loss_step=0.237, global_step=8603.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  49%|████▉     | 591/1208 [16:58<17:42,  1.72s/it, loss=0.175, v_num=0, train/loss_simple_step=0.237, train/loss_vlb_step=0.000957, train/loss_step=0.237, global_step=8603.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  49%|████▉     | 591/1208 [16:58<17:42,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000429, train/loss_step=0.128, global_step=8603.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  49%|████▉     | 592/1208 [17:01<17:42,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.128, train/loss_vlb_step=0.000429, train/loss_step=0.128, global_step=8603.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  49%|████▉     | 592/1208 [17:01<17:42,  1.73s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.89e-5, train/loss_step=0.0102, global_step=8603.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  49%|████▉     | 593/1208 [17:02<17:40,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.89e-5, train/loss_step=0.0102, global_step=8603.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  49%|████▉     | 593/1208 [17:02<17:40,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00654, train/loss_vlb_step=3.34e-5, train/loss_step=0.00654, global_step=8604.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  49%|████▉     | 594/1208 [17:03<17:38,  1.72s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00654, train/loss_vlb_step=3.34e-5, train/loss_step=0.00654, global_step=8604.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  49%|████▉     | 594/1208 [17:03<17:38,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1.32e-5, train/loss_step=0.00226, global_step=8604.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  49%|████▉     | 595/1208 [17:04<17:35,  1.72s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1.32e-5, train/loss_step=0.00226, global_step=8604.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  49%|████▉     | 595/1208 [17:04<17:35,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0461, train/loss_vlb_step=0.000164, train/loss_step=0.0461, global_step=8604.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  49%|████▉     | 596/1208 [17:07<17:35,  1.72s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0461, train/loss_vlb_step=0.000164, train/loss_step=0.0461, global_step=8604.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  49%|████▉     | 596/1208 [17:07<17:35,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.67e-5, train/loss_step=0.0158, global_step=8604.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  49%|████▉     | 597/1208 [17:08<17:33,  1.72s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.67e-5, train/loss_step=0.0158, global_step=8604.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  49%|████▉     | 597/1208 [17:08<17:33,  1.72s/it, loss=0.185, v_num=0, train/loss_simple_step=0.680, train/loss_vlb_step=0.0352, train/loss_step=0.680, global_step=8605.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  50%|████▉     | 598/1208 [17:10<17:30,  1.72s/it, loss=0.185, v_num=0, train/loss_simple_step=0.680, train/loss_vlb_step=0.0352, train/loss_step=0.680, global_step=8605.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  50%|████▉     | 598/1208 [17:10<17:30,  1.72s/it, loss=0.191, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.00044, train/loss_step=0.132, global_step=8605.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  50%|████▉     | 599/1208 [17:11<17:28,  1.72s/it, loss=0.191, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.00044, train/loss_step=0.132, global_step=8605.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  50%|████▉     | 599/1208 [17:11<17:28,  1.72s/it, loss=0.208, v_num=0, train/loss_simple_step=0.610, train/loss_vlb_step=0.018, train/loss_step=0.610, global_step=8605.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  50%|████▉     | 600/1208 [17:14<17:28,  1.72s/it, loss=0.208, v_num=0, train/loss_simple_step=0.610, train/loss_vlb_step=0.018, train/loss_step=0.610, global_step=8605.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  50%|████▉     | 600/1208 [17:14<17:28,  1.72s/it, loss=0.207, v_num=0, train/loss_simple_step=0.00348, train/loss_vlb_step=1.88e-5, train/loss_step=0.00348, global_step=8605.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.79it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.71it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.73it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:28,  1.71it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:28,  1.68it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.68it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.72it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:27,  1.69it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.71it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.74it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:26,  1.70it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.74it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.74it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.71it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.75it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.79it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.73it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.73it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.76it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.73it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.72it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.74it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.73it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:23,  1.74it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:23,  1.72it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.74it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.74it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.76it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.74it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.76it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.73it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:19,  1.81it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.76it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.73it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.75it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:20,  1.73it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.79it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.76it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.74it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.76it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.74it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.73it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.76it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:11<00:17,  1.74it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.73it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.73it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:16,  1.74it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.78it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.78it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.78it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.73it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.74it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:14,  1.77it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.78it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.75it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.76it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:15<00:13,  1.75it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.76it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.76it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.75it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.76it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:16<00:12,  1.75it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:12,  1.74it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.75it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.75it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.75it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.78it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.78it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.75it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:19<00:09,  1.74it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.79it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.75it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:20<00:08,  1.73it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.80it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:08,  1.74it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.73it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.76it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.73it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.77it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.78it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.73it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.79it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:23<00:05,  1.74it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.78it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.73it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:24<00:04,  1.73it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.75it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.73it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.75it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.75it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.79it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.73it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.75it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.74it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.75it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.80it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.74it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.75it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.80it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:27<00:01,  1.75it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.73it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.81it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.75it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.73it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.78it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.79it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:28<00:00,  1.74it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.74it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.73it/s]Epoch 28:  50%|████▉     | 601/1208 [17:45<17:56,  1.77s/it, loss=0.207, v_num=0, train/loss_simple_step=0.00348, train/loss_vlb_step=1.88e-5, train/loss_step=0.00348, global_step=8605.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  50%|████▉     | 601/1208 [17:45<17:56,  1.77s/it, loss=0.207, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=1.3e-5, train/loss_step=0.00221, global_step=8606.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  50%|████▉     | 602/1208 [17:46<17:53,  1.77s/it, loss=0.207, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=1.3e-5, train/loss_step=0.00221, global_step=8606.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  50%|████▉     | 602/1208 [17:46<17:53,  1.77s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0819, train/loss_vlb_step=0.000271, train/loss_step=0.0819, global_step=8606.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  50%|████▉     | 603/1208 [17:47<17:51,  1.77s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0819, train/loss_vlb_step=0.000271, train/loss_step=0.0819, global_step=8606.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  50%|████▉     | 603/1208 [17:47<17:51,  1.77s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00638, train/loss_vlb_step=3.23e-5, train/loss_step=0.00638, global_step=8606.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  50%|█████     | 604/1208 [17:50<17:50,  1.77s/it, loss=0.184, v_num=0, train/loss_simple_step=0.00638, train/loss_vlb_step=3.23e-5, train/loss_step=0.00638, global_step=8606.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  50%|█████     | 604/1208 [17:50<17:50,  1.77s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0767, train/loss_vlb_step=0.000252, train/loss_step=0.0767, global_step=8606.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  50%|█████     | 605/1208 [17:51<17:48,  1.77s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0767, train/loss_vlb_step=0.000252, train/loss_step=0.0767, global_step=8606.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  50%|█████     | 605/1208 [17:51<17:48,  1.77s/it, loss=0.139, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=8607.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  50%|█████     | 606/1208 [17:53<17:46,  1.77s/it, loss=0.139, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000346, train/loss_step=0.105, global_step=8607.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  50%|█████     | 606/1208 [17:53<17:46,  1.77s/it, loss=0.147, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000677, train/loss_step=0.201, global_step=8607.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  50%|█████     | 607/1208 [17:54<17:43,  1.77s/it, loss=0.147, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000677, train/loss_step=0.201, global_step=8607.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  50%|█████     | 607/1208 [17:54<17:43,  1.77s/it, loss=0.16, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00113, train/loss_step=0.265, global_step=8607.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  50%|█████     | 608/1208 [17:57<17:43,  1.77s/it, loss=0.16, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00113, train/loss_step=0.265, global_step=8607.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  50%|█████     | 608/1208 [17:57<17:43,  1.77s/it, loss=0.145, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000896, train/loss_step=0.228, global_step=8607.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  50%|█████     | 609/1208 [17:58<17:40,  1.77s/it, loss=0.145, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000896, train/loss_step=0.228, global_step=8607.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  50%|█████     | 609/1208 [17:58<17:40,  1.77s/it, loss=0.146, v_num=0, train/loss_simple_step=0.081, train/loss_vlb_step=0.00027, train/loss_step=0.081, global_step=8608.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  50%|█████     | 610/1208 [17:59<17:38,  1.77s/it, loss=0.146, v_num=0, train/loss_simple_step=0.081, train/loss_vlb_step=0.00027, train/loss_step=0.081, global_step=8608.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  50%|█████     | 610/1208 [17:59<17:38,  1.77s/it, loss=0.141, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000478, train/loss_step=0.145, global_step=8608.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  51%|█████     | 611/1208 [18:00<17:35,  1.77s/it, loss=0.141, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000478, train/loss_step=0.145, global_step=8608.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  51%|█████     | 611/1208 [18:00<17:35,  1.77s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0868, train/loss_vlb_step=0.000291, train/loss_step=0.0868, global_step=8608.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  51%|█████     | 612/1208 [18:03<17:35,  1.77s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0868, train/loss_vlb_step=0.000291, train/loss_step=0.0868, global_step=8608.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  51%|█████     | 612/1208 [18:03<17:35,  1.77s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000275, train/loss_step=0.0815, global_step=8608.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  51%|█████     | 613/1208 [18:05<17:33,  1.77s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000275, train/loss_step=0.0815, global_step=8608.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  51%|█████     | 613/1208 [18:05<17:33,  1.77s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.47e-5, train/loss_step=0.0238, global_step=8609.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  51%|█████     | 614/1208 [18:06<17:30,  1.77s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.47e-5, train/loss_step=0.0238, global_step=8609.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  51%|█████     | 614/1208 [18:06<17:30,  1.77s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0429, train/loss_vlb_step=0.000151, train/loss_step=0.0429, global_step=8609.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  51%|█████     | 615/1208 [18:07<17:28,  1.77s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0429, train/loss_vlb_step=0.000151, train/loss_step=0.0429, global_step=8609.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  51%|█████     | 615/1208 [18:07<17:28,  1.77s/it, loss=0.165, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00422, train/loss_step=0.435, global_step=8609.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  51%|█████     | 616/1208 [18:10<17:27,  1.77s/it, loss=0.165, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00422, train/loss_step=0.435, global_step=8609.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  51%|█████     | 616/1208 [18:10<17:27,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0626, train/loss_vlb_step=0.000212, train/loss_step=0.0626, global_step=8609.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  51%|█████     | 617/1208 [18:11<17:25,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0626, train/loss_vlb_step=0.000212, train/loss_step=0.0626, global_step=8609.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  51%|█████     | 617/1208 [18:11<17:25,  1.77s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.69e-5, train/loss_step=0.00296, global_step=8610.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  51%|█████     | 618/1208 [18:12<17:23,  1.77s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.69e-5, train/loss_step=0.00296, global_step=8610.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  51%|█████     | 618/1208 [18:12<17:23,  1.77s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.26e-5, train/loss_step=0.00233, global_step=8610.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  51%|█████     | 619/1208 [18:13<17:20,  1.77s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.26e-5, train/loss_step=0.00233, global_step=8610.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  51%|█████     | 619/1208 [18:13<17:20,  1.77s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=1.08e-5, train/loss_step=0.00177, global_step=8610.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  51%|█████▏    | 620/1208 [18:16<17:20,  1.77s/it, loss=0.0968, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=1.08e-5, train/loss_step=0.00177, global_step=8610.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  51%|█████▏    | 620/1208 [18:16<17:20,  1.77s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.00461, train/loss_vlb_step=2.42e-5, train/loss_step=0.00461, global_step=8610.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  51%|█████▏    | 621/1208 [18:18<17:17,  1.77s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.00461, train/loss_vlb_step=2.42e-5, train/loss_step=0.00461, global_step=8610.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  51%|█████▏    | 621/1208 [18:18<17:17,  1.77s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.24e-5, train/loss_step=0.0114, global_step=8611.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  51%|█████▏    | 622/1208 [18:19<17:15,  1.77s/it, loss=0.0973, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.24e-5, train/loss_step=0.0114, global_step=8611.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  51%|█████▏    | 622/1208 [18:19<17:15,  1.77s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=1.28e-5, train/loss_step=0.00214, global_step=8611.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  52%|█████▏    | 623/1208 [18:20<17:13,  1.77s/it, loss=0.0933, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=1.28e-5, train/loss_step=0.00214, global_step=8611.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  52%|█████▏    | 623/1208 [18:20<17:13,  1.77s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.73e-5, train/loss_step=0.0104, global_step=8611.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  52%|█████▏    | 624/1208 [18:23<17:12,  1.77s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.73e-5, train/loss_step=0.0104, global_step=8611.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  52%|█████▏    | 624/1208 [18:23<17:12,  1.77s/it, loss=0.0898, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=1.5e-5, train/loss_step=0.00258, global_step=8611.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  52%|█████▏    | 625/1208 [18:24<17:10,  1.77s/it, loss=0.0898, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=1.5e-5, train/loss_step=0.00258, global_step=8611.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  52%|█████▏    | 625/1208 [18:24<17:10,  1.77s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.00056, train/loss_step=0.160, global_step=8612.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  52%|█████▏    | 626/1208 [18:25<17:07,  1.77s/it, loss=0.0926, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.00056, train/loss_step=0.160, global_step=8612.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  52%|█████▏    | 626/1208 [18:25<17:07,  1.77s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.0927, train/loss_vlb_step=0.000306, train/loss_step=0.0927, global_step=8612.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  52%|█████▏    | 627/1208 [18:26<17:05,  1.77s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.0927, train/loss_vlb_step=0.000306, train/loss_step=0.0927, global_step=8612.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  52%|█████▏    | 627/1208 [18:26<17:05,  1.77s/it, loss=0.0748, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=8.03e-5, train/loss_step=0.0191, global_step=8612.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  52%|█████▏    | 628/1208 [18:30<17:05,  1.77s/it, loss=0.0748, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=8.03e-5, train/loss_step=0.0191, global_step=8612.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  52%|█████▏    | 628/1208 [18:30<17:05,  1.77s/it, loss=0.0733, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000683, train/loss_step=0.197, global_step=8612.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  52%|█████▏    | 629/1208 [18:31<17:02,  1.77s/it, loss=0.0733, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000683, train/loss_step=0.197, global_step=8612.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  52%|█████▏    | 629/1208 [18:31<17:02,  1.77s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00471, train/loss_step=0.432, global_step=8613.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  52%|█████▏    | 630/1208 [18:32<17:00,  1.77s/it, loss=0.0908, v_num=0, train/loss_simple_step=0.432, train/loss_vlb_step=0.00471, train/loss_step=0.432, global_step=8613.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  52%|█████▏    | 630/1208 [18:32<17:00,  1.77s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.000133, train/loss_step=0.0362, global_step=8613.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  52%|█████▏    | 631/1208 [18:33<16:58,  1.76s/it, loss=0.0854, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.000133, train/loss_step=0.0362, global_step=8613.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  52%|█████▏    | 631/1208 [18:33<16:58,  1.76s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00195, train/loss_step=0.312, global_step=8613.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  52%|█████▏    | 632/1208 [18:36<16:57,  1.77s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.00195, train/loss_step=0.312, global_step=8613.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  52%|█████▏    | 632/1208 [18:36<16:57,  1.77s/it, loss=0.0927, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.64e-5, train/loss_step=0.00296, global_step=8613.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  52%|█████▏    | 633/1208 [18:37<16:55,  1.77s/it, loss=0.0927, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.64e-5, train/loss_step=0.00296, global_step=8613.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  52%|█████▏    | 633/1208 [18:37<16:55,  1.77s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.11e-5, train/loss_step=0.0176, global_step=8614.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  52%|█████▏    | 634/1208 [18:38<16:52,  1.76s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=7.11e-5, train/loss_step=0.0176, global_step=8614.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  52%|█████▏    | 634/1208 [18:38<16:52,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.444, train/loss_vlb_step=0.00431, train/loss_step=0.444, global_step=8614.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  53%|█████▎    | 635/1208 [18:39<16:50,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.444, train/loss_vlb_step=0.00431, train/loss_step=0.444, global_step=8614.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  53%|█████▎    | 635/1208 [18:39<16:50,  1.76s/it, loss=0.094, v_num=0, train/loss_simple_step=0.065, train/loss_vlb_step=0.000225, train/loss_step=0.065, global_step=8614.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  53%|█████▎    | 636/1208 [18:43<16:50,  1.77s/it, loss=0.094, v_num=0, train/loss_simple_step=0.065, train/loss_vlb_step=0.000225, train/loss_step=0.065, global_step=8614.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  53%|█████▎    | 636/1208 [18:43<16:50,  1.77s/it, loss=0.0945, v_num=0, train/loss_simple_step=0.0724, train/loss_vlb_step=0.000242, train/loss_step=0.0724, global_step=8614.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  53%|█████▎    | 637/1208 [18:44<16:47,  1.76s/it, loss=0.0945, v_num=0, train/loss_simple_step=0.0724, train/loss_vlb_step=0.000242, train/loss_step=0.0724, global_step=8614.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  53%|█████▎    | 637/1208 [18:44<16:47,  1.76s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.47e-5, train/loss_step=0.0234, global_step=8615.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  53%|█████▎    | 638/1208 [18:45<16:45,  1.76s/it, loss=0.0955, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=9.47e-5, train/loss_step=0.0234, global_step=8615.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  53%|█████▎    | 638/1208 [18:45<16:45,  1.76s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=1.98e-5, train/loss_step=0.00366, global_step=8615.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  53%|█████▎    | 639/1208 [18:46<16:42,  1.76s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=1.98e-5, train/loss_step=0.00366, global_step=8615.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  53%|█████▎    | 639/1208 [18:46<16:42,  1.76s/it, loss=0.099, v_num=0, train/loss_simple_step=0.0711, train/loss_vlb_step=0.00024, train/loss_step=0.0711, global_step=8615.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  53%|█████▎    | 640/1208 [18:49<16:42,  1.76s/it, loss=0.099, v_num=0, train/loss_simple_step=0.0711, train/loss_vlb_step=0.00024, train/loss_step=0.0711, global_step=8615.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  53%|█████▎    | 640/1208 [18:49<16:42,  1.76s/it, loss=0.109, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000751, train/loss_step=0.201, global_step=8615.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  53%|█████▎    | 641/1208 [18:50<16:40,  1.76s/it, loss=0.109, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000751, train/loss_step=0.201, global_step=8615.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  53%|█████▎    | 641/1208 [18:50<16:40,  1.76s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0496, train/loss_vlb_step=0.000169, train/loss_step=0.0496, global_step=8616.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  53%|█████▎    | 642/1208 [18:51<16:37,  1.76s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0496, train/loss_vlb_step=0.000169, train/loss_step=0.0496, global_step=8616.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  53%|█████▎    | 642/1208 [18:51<16:37,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.498, train/loss_vlb_step=0.00941, train/loss_step=0.498, global_step=8616.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  53%|█████▎    | 643/1208 [18:52<16:35,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.498, train/loss_vlb_step=0.00941, train/loss_step=0.498, global_step=8616.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  53%|█████▎    | 643/1208 [18:52<16:35,  1.76s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0762, train/loss_vlb_step=0.000257, train/loss_step=0.0762, global_step=8616.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  53%|█████▎    | 644/1208 [18:56<16:34,  1.76s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0762, train/loss_vlb_step=0.000257, train/loss_step=0.0762, global_step=8616.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  53%|█████▎    | 644/1208 [18:56<16:34,  1.76s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0718, train/loss_vlb_step=0.00024, train/loss_step=0.0718, global_step=8616.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  53%|█████▎    | 645/1208 [18:57<16:32,  1.76s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0718, train/loss_vlb_step=0.00024, train/loss_step=0.0718, global_step=8616.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  53%|█████▎    | 645/1208 [18:57<16:32,  1.76s/it, loss=0.138, v_num=0, train/loss_simple_step=0.071, train/loss_vlb_step=0.000235, train/loss_step=0.071, global_step=8617.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  53%|█████▎    | 646/1208 [18:58<16:30,  1.76s/it, loss=0.138, v_num=0, train/loss_simple_step=0.071, train/loss_vlb_step=0.000235, train/loss_step=0.071, global_step=8617.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  53%|█████▎    | 646/1208 [18:58<16:30,  1.76s/it, loss=0.143, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000704, train/loss_step=0.196, global_step=8617.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  54%|█████▎    | 647/1208 [18:59<16:27,  1.76s/it, loss=0.143, v_num=0, train/loss_simple_step=0.196, train/loss_vlb_step=0.000704, train/loss_step=0.196, global_step=8617.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  54%|█████▎    | 647/1208 [18:59<16:27,  1.76s/it, loss=0.147, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000341, train/loss_step=0.103, global_step=8617.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  54%|█████▎    | 648/1208 [19:02<16:27,  1.76s/it, loss=0.147, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000341, train/loss_step=0.103, global_step=8617.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  54%|█████▎    | 648/1208 [19:02<16:27,  1.76s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=0.000102, train/loss_step=0.0246, global_step=8617.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  54%|█████▎    | 649/1208 [19:03<16:25,  1.76s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=0.000102, train/loss_step=0.0246, global_step=8617.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  54%|█████▎    | 649/1208 [19:03<16:25,  1.76s/it, loss=0.129, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.00101, train/loss_step=0.232, global_step=8618.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  54%|█████▍    | 650/1208 [19:04<16:22,  1.76s/it, loss=0.129, v_num=0, train/loss_simple_step=0.232, train/loss_vlb_step=0.00101, train/loss_step=0.232, global_step=8618.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  54%|█████▍    | 650/1208 [19:04<16:22,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00196, train/loss_step=0.380, global_step=8618.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  54%|█████▍    | 651/1208 [19:05<16:20,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.380, train/loss_vlb_step=0.00196, train/loss_step=0.380, global_step=8618.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  54%|█████▍    | 651/1208 [19:05<16:20,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.94e-5, train/loss_step=0.0103, global_step=8618.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  54%|█████▍    | 652/1208 [19:08<16:19,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.94e-5, train/loss_step=0.0103, global_step=8618.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  54%|█████▍    | 652/1208 [19:08<16:19,  1.76s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0726, train/loss_vlb_step=0.00025, train/loss_step=0.0726, global_step=8618.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  54%|█████▍    | 653/1208 [19:10<16:17,  1.76s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0726, train/loss_vlb_step=0.00025, train/loss_step=0.0726, global_step=8618.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  54%|█████▍    | 653/1208 [19:10<16:17,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000153, train/loss_step=0.042, global_step=8619.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  54%|█████▍    | 654/1208 [19:11<16:15,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000153, train/loss_step=0.042, global_step=8619.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  54%|█████▍    | 654/1208 [19:11<16:15,  1.76s/it, loss=0.123, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000739, train/loss_step=0.194, global_step=8619.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  54%|█████▍    | 655/1208 [19:12<16:12,  1.76s/it, loss=0.123, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000739, train/loss_step=0.194, global_step=8619.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  54%|█████▍    | 655/1208 [19:12<16:12,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0847, train/loss_vlb_step=0.00028, train/loss_step=0.0847, global_step=8619.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  54%|█████▍    | 656/1208 [19:15<16:12,  1.76s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0847, train/loss_vlb_step=0.00028, train/loss_step=0.0847, global_step=8619.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  54%|█████▍    | 656/1208 [19:15<16:12,  1.76s/it, loss=0.127, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000424, train/loss_step=0.126, global_step=8619.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  54%|█████▍    | 657/1208 [19:16<16:09,  1.76s/it, loss=0.127, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000424, train/loss_step=0.126, global_step=8619.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  54%|█████▍    | 657/1208 [19:16<16:09,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.53e-5, train/loss_step=0.020, global_step=8620.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  54%|█████▍    | 658/1208 [19:17<16:07,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.53e-5, train/loss_step=0.020, global_step=8620.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  54%|█████▍    | 658/1208 [19:17<16:07,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000676, train/loss_step=0.191, global_step=8620.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  55%|█████▍    | 659/1208 [19:18<16:05,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000676, train/loss_step=0.191, global_step=8620.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  55%|█████▍    | 659/1208 [19:18<16:05,  1.76s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.06e-5, train/loss_step=0.0242, global_step=8620.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  55%|█████▍    | 660/1208 [19:21<16:04,  1.76s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.06e-5, train/loss_step=0.0242, global_step=8620.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  55%|█████▍    | 660/1208 [19:21<16:04,  1.76s/it, loss=0.14, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00175, train/loss_step=0.333, global_step=8620.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  55%|█████▍    | 661/1208 [19:22<16:02,  1.76s/it, loss=0.14, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00175, train/loss_step=0.333, global_step=8620.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  55%|█████▍    | 661/1208 [19:22<16:02,  1.76s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.93e-5, train/loss_step=0.0162, global_step=8621.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  55%|█████▍    | 662/1208 [19:24<16:00,  1.76s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.93e-5, train/loss_step=0.0162, global_step=8621.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  55%|█████▍    | 662/1208 [19:24<16:00,  1.76s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.09e-5, train/loss_step=0.0168, global_step=8621.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  55%|█████▍    | 663/1208 [19:25<15:57,  1.76s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.09e-5, train/loss_step=0.0168, global_step=8621.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  55%|█████▍    | 663/1208 [19:25<15:57,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0596, train/loss_vlb_step=0.000205, train/loss_step=0.0596, global_step=8621.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  55%|█████▍    | 664/1208 [19:28<15:57,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0596, train/loss_vlb_step=0.000205, train/loss_step=0.0596, global_step=8621.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  55%|█████▍    | 664/1208 [19:28<15:57,  1.76s/it, loss=0.116, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000435, train/loss_step=0.132, global_step=8621.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  55%|█████▌    | 665/1208 [19:29<15:54,  1.76s/it, loss=0.116, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000435, train/loss_step=0.132, global_step=8621.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  55%|█████▌    | 665/1208 [19:29<15:54,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=8622.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  55%|█████▌    | 666/1208 [19:30<15:52,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000392, train/loss_step=0.119, global_step=8622.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  55%|█████▌    | 666/1208 [19:30<15:52,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0685, train/loss_vlb_step=0.000231, train/loss_step=0.0685, global_step=8622.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  55%|█████▌    | 667/1208 [19:31<15:50,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0685, train/loss_vlb_step=0.000231, train/loss_step=0.0685, global_step=8622.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  55%|█████▌    | 667/1208 [19:31<15:50,  1.76s/it, loss=0.123, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00173, train/loss_step=0.318, global_step=8622.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  55%|█████▌    | 668/1208 [19:34<15:49,  1.76s/it, loss=0.123, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00173, train/loss_step=0.318, global_step=8622.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  55%|█████▌    | 668/1208 [19:34<15:49,  1.76s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00663, train/loss_vlb_step=3.31e-5, train/loss_step=0.00663, global_step=8622.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  55%|█████▌    | 669/1208 [19:35<15:47,  1.76s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00663, train/loss_vlb_step=3.31e-5, train/loss_step=0.00663, global_step=8622.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  55%|█████▌    | 669/1208 [19:35<15:47,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.500, train/loss_vlb_step=0.0089, train/loss_step=0.500, global_step=8623.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]     Epoch 28:  55%|█████▌    | 670/1208 [19:36<15:45,  1.76s/it, loss=0.136, v_num=0, train/loss_simple_step=0.500, train/loss_vlb_step=0.0089, train/loss_step=0.500, global_step=8623.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  55%|█████▌    | 670/1208 [19:36<15:45,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00149, train/loss_step=0.279, global_step=8623.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  56%|█████▌    | 671/1208 [19:38<15:42,  1.76s/it, loss=0.131, v_num=0, train/loss_simple_step=0.279, train/loss_vlb_step=0.00149, train/loss_step=0.279, global_step=8623.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  56%|█████▌    | 671/1208 [19:38<15:42,  1.76s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0054, train/loss_vlb_step=2.73e-5, train/loss_step=0.0054, global_step=8623.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  56%|█████▌    | 672/1208 [19:41<15:42,  1.76s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0054, train/loss_vlb_step=2.73e-5, train/loss_step=0.0054, global_step=8623.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  56%|█████▌    | 672/1208 [19:41<15:42,  1.76s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0501, train/loss_vlb_step=0.000179, train/loss_step=0.0501, global_step=8623.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  56%|█████▌    | 673/1208 [19:42<15:39,  1.76s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0501, train/loss_vlb_step=0.000179, train/loss_step=0.0501, global_step=8623.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  56%|█████▌    | 673/1208 [19:42<15:39,  1.76s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00343, train/loss_vlb_step=1.83e-5, train/loss_step=0.00343, global_step=8624.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  56%|█████▌    | 674/1208 [19:43<15:37,  1.76s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00343, train/loss_vlb_step=1.83e-5, train/loss_step=0.00343, global_step=8624.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  56%|█████▌    | 674/1208 [19:43<15:37,  1.76s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.65e-5, train/loss_step=0.0154, global_step=8624.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  56%|█████▌    | 675/1208 [19:44<15:35,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.65e-5, train/loss_step=0.0154, global_step=8624.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  56%|█████▌    | 675/1208 [19:44<15:35,  1.75s/it, loss=0.144, v_num=0, train/loss_simple_step=0.589, train/loss_vlb_step=0.0194, train/loss_step=0.589, global_step=8624.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  56%|█████▌    | 676/1208 [19:47<15:34,  1.76s/it, loss=0.144, v_num=0, train/loss_simple_step=0.589, train/loss_vlb_step=0.0194, train/loss_step=0.589, global_step=8624.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  56%|█████▌    | 676/1208 [19:47<15:34,  1.76s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000113, train/loss_step=0.0288, global_step=8624.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  56%|█████▌    | 677/1208 [19:48<15:32,  1.76s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000113, train/loss_step=0.0288, global_step=8624.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  56%|█████▌    | 677/1208 [19:48<15:32,  1.76s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00638, train/loss_vlb_step=3.21e-5, train/loss_step=0.00638, global_step=8625.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  56%|█████▌    | 678/1208 [19:49<15:30,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00638, train/loss_vlb_step=3.21e-5, train/loss_step=0.00638, global_step=8625.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  56%|█████▌    | 678/1208 [19:49<15:30,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0728, train/loss_vlb_step=0.000249, train/loss_step=0.0728, global_step=8625.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  56%|█████▌    | 679/1208 [19:50<15:27,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0728, train/loss_vlb_step=0.000249, train/loss_step=0.0728, global_step=8625.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  56%|█████▌    | 679/1208 [19:50<15:27,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.44e-5, train/loss_step=0.0124, global_step=8625.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  56%|█████▋    | 680/1208 [19:54<15:27,  1.76s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.44e-5, train/loss_step=0.0124, global_step=8625.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  56%|█████▋    | 680/1208 [19:54<15:27,  1.76s/it, loss=0.138, v_num=0, train/loss_simple_step=0.461, train/loss_vlb_step=0.00546, train/loss_step=0.461, global_step=8625.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  56%|█████▋    | 681/1208 [19:55<15:24,  1.76s/it, loss=0.138, v_num=0, train/loss_simple_step=0.461, train/loss_vlb_step=0.00546, train/loss_step=0.461, global_step=8625.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  56%|█████▋    | 681/1208 [19:55<15:24,  1.76s/it, loss=0.149, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000966, train/loss_step=0.228, global_step=8626.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  56%|█████▋    | 682/1208 [19:56<15:22,  1.75s/it, loss=0.149, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000966, train/loss_step=0.228, global_step=8626.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  56%|█████▋    | 682/1208 [19:56<15:22,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00143, train/loss_step=0.287, global_step=8626.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  57%|█████▋    | 683/1208 [19:57<15:20,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.287, train/loss_vlb_step=0.00143, train/loss_step=0.287, global_step=8626.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  57%|█████▋    | 683/1208 [19:57<15:20,  1.75s/it, loss=0.165, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000383, train/loss_step=0.117, global_step=8626.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  57%|█████▋    | 684/1208 [20:00<15:19,  1.76s/it, loss=0.165, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000383, train/loss_step=0.117, global_step=8626.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  57%|█████▋    | 684/1208 [20:00<15:19,  1.76s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.86e-5, train/loss_step=0.0105, global_step=8626.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  57%|█████▋    | 685/1208 [20:01<15:17,  1.75s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.86e-5, train/loss_step=0.0105, global_step=8626.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  57%|█████▋    | 685/1208 [20:01<15:17,  1.75s/it, loss=0.157, v_num=0, train/loss_simple_step=0.088, train/loss_vlb_step=0.00029, train/loss_step=0.088, global_step=8627.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  57%|█████▋    | 686/1208 [20:02<15:15,  1.75s/it, loss=0.157, v_num=0, train/loss_simple_step=0.088, train/loss_vlb_step=0.00029, train/loss_step=0.088, global_step=8627.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  57%|█████▋    | 686/1208 [20:02<15:15,  1.75s/it, loss=0.166, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.0011, train/loss_step=0.246, global_step=8627.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  57%|█████▋    | 687/1208 [20:03<15:12,  1.75s/it, loss=0.166, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.0011, train/loss_step=0.246, global_step=8627.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  57%|█████▋    | 687/1208 [20:03<15:12,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.000135, train/loss_step=0.0351, global_step=8627.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  57%|█████▋    | 688/1208 [20:07<15:12,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.000135, train/loss_step=0.0351, global_step=8627.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  57%|█████▋    | 688/1208 [20:07<15:12,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=2.17e-5, train/loss_step=0.00402, global_step=8627.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  57%|█████▋    | 689/1208 [20:08<15:10,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=2.17e-5, train/loss_step=0.00402, global_step=8627.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  57%|█████▋    | 689/1208 [20:08<15:10,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.25e-5, train/loss_step=0.0167, global_step=8628.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  57%|█████▋    | 690/1208 [20:09<15:07,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.25e-5, train/loss_step=0.0167, global_step=8628.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  57%|█████▋    | 690/1208 [20:09<15:07,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000111, train/loss_step=0.0273, global_step=8628.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  57%|█████▋    | 691/1208 [20:10<15:05,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000111, train/loss_step=0.0273, global_step=8628.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  57%|█████▋    | 691/1208 [20:10<15:05,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00143, train/loss_step=0.294, global_step=8628.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  57%|█████▋    | 692/1208 [20:13<15:04,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00143, train/loss_step=0.294, global_step=8628.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  57%|█████▋    | 692/1208 [20:13<15:04,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=8.04e-5, train/loss_step=0.0192, global_step=8628.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  57%|█████▋    | 693/1208 [20:14<15:02,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=8.04e-5, train/loss_step=0.0192, global_step=8628.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  57%|█████▋    | 693/1208 [20:14<15:02,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0492, train/loss_vlb_step=0.000175, train/loss_step=0.0492, global_step=8629.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  57%|█████▋    | 694/1208 [20:15<15:00,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0492, train/loss_vlb_step=0.000175, train/loss_step=0.0492, global_step=8629.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  57%|█████▋    | 694/1208 [20:15<15:00,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000896, train/loss_step=0.203, global_step=8629.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  58%|█████▊    | 695/1208 [20:16<14:58,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000896, train/loss_step=0.203, global_step=8629.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  58%|█████▊    | 695/1208 [20:16<14:58,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.29e-5, train/loss_step=0.0219, global_step=8629.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  58%|█████▊    | 696/1208 [20:20<14:57,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.29e-5, train/loss_step=0.0219, global_step=8629.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  58%|█████▊    | 696/1208 [20:20<14:57,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.00052, train/loss_step=0.156, global_step=8629.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  58%|█████▊    | 697/1208 [20:21<14:55,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.00052, train/loss_step=0.156, global_step=8629.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  58%|█████▊    | 697/1208 [20:21<14:55,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000915, train/loss_step=0.210, global_step=8630.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  58%|█████▊    | 698/1208 [20:22<14:53,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000915, train/loss_step=0.210, global_step=8630.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  58%|█████▊    | 698/1208 [20:22<14:53,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=9.84e-6, train/loss_step=0.00164, global_step=8630.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  58%|█████▊    | 699/1208 [20:23<14:50,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=9.84e-6, train/loss_step=0.00164, global_step=8630.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  58%|█████▊    | 699/1208 [20:23<14:50,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.87e-5, train/loss_step=0.016, global_step=8630.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  58%|█████▊    | 700/1208 [20:26<14:50,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.87e-5, train/loss_step=0.016, global_step=8630.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  58%|█████▊    | 700/1208 [20:26<14:50,  1.75s/it, loss=0.108, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000403, train/loss_step=0.123, global_step=8630.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  58%|█████▊    | 701/1208 [20:27<14:47,  1.75s/it, loss=0.108, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000403, train/loss_step=0.123, global_step=8630.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  58%|█████▊    | 701/1208 [20:27<14:47,  1.75s/it, loss=0.102, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.00038, train/loss_step=0.116, global_step=8631.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  58%|█████▊    | 702/1208 [20:28<14:45,  1.75s/it, loss=0.102, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.00038, train/loss_step=0.116, global_step=8631.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  58%|█████▊    | 702/1208 [20:28<14:45,  1.75s/it, loss=0.0898, v_num=0, train/loss_simple_step=0.0423, train/loss_vlb_step=0.000161, train/loss_step=0.0423, global_step=8631.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  58%|█████▊    | 703/1208 [20:29<14:43,  1.75s/it, loss=0.0898, v_num=0, train/loss_simple_step=0.0423, train/loss_vlb_step=0.000161, train/loss_step=0.0423, global_step=8631.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  58%|█████▊    | 703/1208 [20:29<14:43,  1.75s/it, loss=0.0911, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000473, train/loss_step=0.142, global_step=8631.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  58%|█████▊    | 704/1208 [20:33<14:42,  1.75s/it, loss=0.0911, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000473, train/loss_step=0.142, global_step=8631.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  58%|█████▊    | 704/1208 [20:33<14:42,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.421, train/loss_vlb_step=0.0031, train/loss_step=0.421, global_step=8631.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  58%|█████▊    | 705/1208 [20:34<14:40,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.421, train/loss_vlb_step=0.0031, train/loss_step=0.421, global_step=8631.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  58%|█████▊    | 705/1208 [20:34<14:40,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00213, train/loss_step=0.333, global_step=8632.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  58%|█████▊    | 706/1208 [20:35<14:38,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.333, train/loss_vlb_step=0.00213, train/loss_step=0.333, global_step=8632.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  58%|█████▊    | 706/1208 [20:35<14:38,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0748, train/loss_vlb_step=0.000257, train/loss_step=0.0748, global_step=8632.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  59%|█████▊    | 707/1208 [20:36<14:36,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0748, train/loss_vlb_step=0.000257, train/loss_step=0.0748, global_step=8632.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  59%|█████▊    | 707/1208 [20:36<14:36,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000449, train/loss_step=0.136, global_step=8632.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  59%|█████▊    | 708/1208 [20:39<14:35,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000449, train/loss_step=0.136, global_step=8632.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  59%|█████▊    | 708/1208 [20:39<14:35,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000565, train/loss_step=0.165, global_step=8632.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  59%|█████▊    | 709/1208 [20:40<14:33,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000565, train/loss_step=0.165, global_step=8632.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  59%|█████▊    | 709/1208 [20:40<14:33,  1.75s/it, loss=0.144, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00185, train/loss_step=0.327, global_step=8633.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  59%|█████▉    | 710/1208 [20:41<14:30,  1.75s/it, loss=0.144, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.00185, train/loss_step=0.327, global_step=8633.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  59%|█████▉    | 710/1208 [20:41<14:30,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.00102, train/loss_step=0.227, global_step=8633.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  59%|█████▉    | 711/1208 [20:42<14:28,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.00102, train/loss_step=0.227, global_step=8633.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  59%|█████▉    | 711/1208 [20:42<14:28,  1.75s/it, loss=0.174, v_num=0, train/loss_simple_step=0.707, train/loss_vlb_step=0.0248, train/loss_step=0.707, global_step=8633.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  59%|█████▉    | 712/1208 [20:46<14:28,  1.75s/it, loss=0.174, v_num=0, train/loss_simple_step=0.707, train/loss_vlb_step=0.0248, train/loss_step=0.707, global_step=8633.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  59%|█████▉    | 712/1208 [20:46<14:28,  1.75s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00778, train/loss_vlb_step=3.79e-5, train/loss_step=0.00778, global_step=8633.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  59%|█████▉    | 713/1208 [20:47<14:25,  1.75s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00778, train/loss_vlb_step=3.79e-5, train/loss_step=0.00778, global_step=8633.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  59%|█████▉    | 713/1208 [20:47<14:25,  1.75s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0924, train/loss_vlb_step=0.000307, train/loss_step=0.0924, global_step=8634.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  59%|█████▉    | 714/1208 [20:48<14:23,  1.75s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0924, train/loss_vlb_step=0.000307, train/loss_step=0.0924, global_step=8634.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  59%|█████▉    | 714/1208 [20:48<14:23,  1.75s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.5e-5, train/loss_step=0.0188, global_step=8634.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  59%|█████▉    | 715/1208 [20:49<14:21,  1.75s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.5e-5, train/loss_step=0.0188, global_step=8634.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  59%|█████▉    | 715/1208 [20:49<14:21,  1.75s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=8.99e-5, train/loss_step=0.0226, global_step=8634.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  59%|█████▉    | 716/1208 [20:52<14:20,  1.75s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=8.99e-5, train/loss_step=0.0226, global_step=8634.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  59%|█████▉    | 716/1208 [20:52<14:20,  1.75s/it, loss=0.174, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00173, train/loss_step=0.303, global_step=8634.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  59%|█████▉    | 717/1208 [20:53<14:18,  1.75s/it, loss=0.174, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00173, train/loss_step=0.303, global_step=8634.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  59%|█████▉    | 717/1208 [20:53<14:18,  1.75s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000147, train/loss_step=0.0396, global_step=8635.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  59%|█████▉    | 718/1208 [20:54<14:16,  1.75s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0396, train/loss_vlb_step=0.000147, train/loss_step=0.0396, global_step=8635.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  59%|█████▉    | 718/1208 [20:54<14:16,  1.75s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.77e-5, train/loss_step=0.0131, global_step=8635.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  60%|█████▉    | 719/1208 [20:55<14:14,  1.75s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.77e-5, train/loss_step=0.0131, global_step=8635.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  60%|█████▉    | 719/1208 [20:55<14:14,  1.75s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0619, train/loss_vlb_step=0.000212, train/loss_step=0.0619, global_step=8635.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  60%|█████▉    | 720/1208 [20:59<14:13,  1.75s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0619, train/loss_vlb_step=0.000212, train/loss_step=0.0619, global_step=8635.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  60%|█████▉    | 720/1208 [20:59<14:13,  1.75s/it, loss=0.165, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.000154, train/loss_step=0.045, global_step=8635.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  60%|█████▉    | 721/1208 [21:00<14:11,  1.75s/it, loss=0.165, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.000154, train/loss_step=0.045, global_step=8635.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  60%|█████▉    | 721/1208 [21:00<14:11,  1.75s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00457, train/loss_vlb_step=2.42e-5, train/loss_step=0.00457, global_step=8636.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  60%|█████▉    | 722/1208 [21:01<14:09,  1.75s/it, loss=0.159, v_num=0, train/loss_simple_step=0.00457, train/loss_vlb_step=2.42e-5, train/loss_step=0.00457, global_step=8636.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  60%|█████▉    | 722/1208 [21:01<14:09,  1.75s/it, loss=0.177, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00276, train/loss_step=0.398, global_step=8636.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  60%|█████▉    | 723/1208 [21:02<14:06,  1.75s/it, loss=0.177, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00276, train/loss_step=0.398, global_step=8636.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  60%|█████▉    | 723/1208 [21:02<14:06,  1.75s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.81e-5, train/loss_step=0.0136, global_step=8636.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  60%|█████▉    | 724/1208 [21:05<14:06,  1.75s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.81e-5, train/loss_step=0.0136, global_step=8636.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  60%|█████▉    | 724/1208 [21:05<14:06,  1.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00866, train/loss_vlb_step=4e-5, train/loss_step=0.00866, global_step=8636.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  60%|██████    | 725/1208 [21:06<14:03,  1.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00866, train/loss_vlb_step=4e-5, train/loss_step=0.00866, global_step=8636.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  60%|██████    | 725/1208 [21:06<14:03,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0572, train/loss_vlb_step=0.000198, train/loss_step=0.0572, global_step=8637.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  60%|██████    | 726/1208 [21:07<14:01,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0572, train/loss_vlb_step=0.000198, train/loss_step=0.0572, global_step=8637.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  60%|██████    | 726/1208 [21:07<14:01,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000405, train/loss_step=0.123, global_step=8637.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  60%|██████    | 727/1208 [21:08<13:59,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000405, train/loss_step=0.123, global_step=8637.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  60%|██████    | 727/1208 [21:08<13:59,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00386, train/loss_vlb_step=2.05e-5, train/loss_step=0.00386, global_step=8637.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  60%|██████    | 728/1208 [21:12<13:58,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00386, train/loss_vlb_step=2.05e-5, train/loss_step=0.00386, global_step=8637.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  60%|██████    | 728/1208 [21:12<13:58,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.41e-5, train/loss_step=0.017, global_step=8637.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  60%|██████    | 729/1208 [21:13<13:56,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.41e-5, train/loss_step=0.017, global_step=8637.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  60%|██████    | 729/1208 [21:13<13:56,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.464, train/loss_vlb_step=0.00443, train/loss_step=0.464, global_step=8638.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  60%|██████    | 730/1208 [21:14<13:54,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.464, train/loss_vlb_step=0.00443, train/loss_step=0.464, global_step=8638.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  60%|██████    | 730/1208 [21:14<13:54,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=8638.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  61%|██████    | 731/1208 [21:15<13:52,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=8638.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  61%|██████    | 731/1208 [21:15<13:52,  1.74s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000597, train/loss_step=0.173, global_step=8638.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  61%|██████    | 732/1208 [21:18<13:51,  1.75s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000597, train/loss_step=0.173, global_step=8638.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  61%|██████    | 732/1208 [21:18<13:51,  1.75s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.27e-5, train/loss_step=0.0169, global_step=8638.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  61%|██████    | 733/1208 [21:19<13:49,  1.75s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.27e-5, train/loss_step=0.0169, global_step=8638.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  61%|██████    | 733/1208 [21:19<13:49,  1.75s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.0577, train/loss_vlb_step=0.000197, train/loss_step=0.0577, global_step=8639.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  61%|██████    | 734/1208 [21:20<13:47,  1.74s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.0577, train/loss_vlb_step=0.000197, train/loss_step=0.0577, global_step=8639.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  61%|██████    | 734/1208 [21:20<13:47,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.000926, train/loss_step=0.252, global_step=8639.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  61%|██████    | 735/1208 [21:21<13:44,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.000926, train/loss_step=0.252, global_step=8639.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  61%|██████    | 735/1208 [21:21<13:44,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.08e-5, train/loss_step=0.0151, global_step=8639.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  61%|██████    | 736/1208 [21:25<13:44,  1.75s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.08e-5, train/loss_step=0.0151, global_step=8639.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  61%|██████    | 736/1208 [21:25<13:44,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00286, train/loss_step=0.371, global_step=8639.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  61%|██████    | 737/1208 [21:26<13:41,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.371, train/loss_vlb_step=0.00286, train/loss_step=0.371, global_step=8639.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  61%|██████    | 737/1208 [21:26<13:41,  1.75s/it, loss=0.112, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.000156, train/loss_step=0.043, global_step=8640.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  61%|██████    | 738/1208 [21:27<13:39,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.000156, train/loss_step=0.043, global_step=8640.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  61%|██████    | 738/1208 [21:27<13:39,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000411, train/loss_step=0.124, global_step=8640.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  61%|██████    | 739/1208 [21:28<13:37,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000411, train/loss_step=0.124, global_step=8640.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  61%|██████    | 739/1208 [21:28<13:37,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.53e-5, train/loss_step=0.0124, global_step=8640.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  61%|██████▏   | 740/1208 [21:31<13:36,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.53e-5, train/loss_step=0.0124, global_step=8640.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  61%|██████▏   | 740/1208 [21:31<13:36,  1.75s/it, loss=0.134, v_num=0, train/loss_simple_step=0.421, train/loss_vlb_step=0.00507, train/loss_step=0.421, global_step=8640.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  61%|██████▏   | 741/1208 [21:32<13:34,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.421, train/loss_vlb_step=0.00507, train/loss_step=0.421, global_step=8640.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  61%|██████▏   | 741/1208 [21:32<13:34,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000475, train/loss_step=0.142, global_step=8641.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  61%|██████▏   | 742/1208 [21:33<13:32,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000475, train/loss_step=0.142, global_step=8641.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  61%|██████▏   | 742/1208 [21:33<13:32,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.505, train/loss_vlb_step=0.0033, train/loss_step=0.505, global_step=8641.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  62%|██████▏   | 743/1208 [21:34<13:30,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.505, train/loss_vlb_step=0.0033, train/loss_step=0.505, global_step=8641.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  62%|██████▏   | 743/1208 [21:34<13:30,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.0041, train/loss_step=0.412, global_step=8641.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  62%|██████▏   | 744/1208 [21:38<13:29,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.0041, train/loss_step=0.412, global_step=8641.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  62%|██████▏   | 744/1208 [21:38<13:29,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000118, train/loss_step=0.0296, global_step=8641.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  62%|██████▏   | 745/1208 [21:39<13:27,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000118, train/loss_step=0.0296, global_step=8641.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  62%|██████▏   | 745/1208 [21:39<13:27,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00145, train/loss_step=0.289, global_step=8642.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  62%|██████▏   | 746/1208 [21:40<13:25,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00145, train/loss_step=0.289, global_step=8642.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  62%|██████▏   | 746/1208 [21:40<13:25,  1.74s/it, loss=0.189, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.0015, train/loss_step=0.320, global_step=8642.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  62%|██████▏   | 747/1208 [21:41<13:23,  1.74s/it, loss=0.189, v_num=0, train/loss_simple_step=0.320, train/loss_vlb_step=0.0015, train/loss_step=0.320, global_step=8642.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  62%|██████▏   | 747/1208 [21:41<13:23,  1.74s/it, loss=0.198, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000723, train/loss_step=0.190, global_step=8642.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  62%|██████▏   | 748/1208 [21:44<13:22,  1.74s/it, loss=0.198, v_num=0, train/loss_simple_step=0.190, train/loss_vlb_step=0.000723, train/loss_step=0.190, global_step=8642.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  62%|██████▏   | 748/1208 [21:44<13:22,  1.74s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=1.72e-5, train/loss_step=0.00309, global_step=8642.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  62%|██████▏   | 749/1208 [21:45<13:20,  1.74s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=1.72e-5, train/loss_step=0.00309, global_step=8642.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  62%|██████▏   | 749/1208 [21:45<13:20,  1.74s/it, loss=0.183, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000581, train/loss_step=0.172, global_step=8643.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  62%|██████▏   | 750/1208 [21:46<13:17,  1.74s/it, loss=0.183, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000581, train/loss_step=0.172, global_step=8643.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  62%|██████▏   | 750/1208 [21:46<13:17,  1.74s/it, loss=0.198, v_num=0, train/loss_simple_step=0.419, train/loss_vlb_step=0.00472, train/loss_step=0.419, global_step=8643.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  62%|██████▏   | 751/1208 [21:47<13:15,  1.74s/it, loss=0.198, v_num=0, train/loss_simple_step=0.419, train/loss_vlb_step=0.00472, train/loss_step=0.419, global_step=8643.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  62%|██████▏   | 751/1208 [21:47<13:15,  1.74s/it, loss=0.199, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000723, train/loss_step=0.191, global_step=8643.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  62%|██████▏   | 752/1208 [21:50<13:14,  1.74s/it, loss=0.199, v_num=0, train/loss_simple_step=0.191, train/loss_vlb_step=0.000723, train/loss_step=0.191, global_step=8643.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  62%|██████▏   | 752/1208 [21:50<13:14,  1.74s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.000173, train/loss_step=0.0485, global_step=8643.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  62%|██████▏   | 753/1208 [21:52<13:12,  1.74s/it, loss=0.201, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.000173, train/loss_step=0.0485, global_step=8643.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  62%|██████▏   | 753/1208 [21:52<13:12,  1.74s/it, loss=0.221, v_num=0, train/loss_simple_step=0.452, train/loss_vlb_step=0.00397, train/loss_step=0.452, global_step=8644.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  62%|██████▏   | 754/1208 [21:53<13:10,  1.74s/it, loss=0.221, v_num=0, train/loss_simple_step=0.452, train/loss_vlb_step=0.00397, train/loss_step=0.452, global_step=8644.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  62%|██████▏   | 754/1208 [21:53<13:10,  1.74s/it, loss=0.214, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000401, train/loss_step=0.122, global_step=8644.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  62%|██████▎   | 755/1208 [21:54<13:08,  1.74s/it, loss=0.214, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000401, train/loss_step=0.122, global_step=8644.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  62%|██████▎   | 755/1208 [21:54<13:08,  1.74s/it, loss=0.214, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=2.76e-5, train/loss_step=0.00518, global_step=8644.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  63%|██████▎   | 756/1208 [21:57<13:07,  1.74s/it, loss=0.214, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=2.76e-5, train/loss_step=0.00518, global_step=8644.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  63%|██████▎   | 756/1208 [21:57<13:07,  1.74s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0819, train/loss_vlb_step=0.000274, train/loss_step=0.0819, global_step=8644.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  63%|██████▎   | 757/1208 [21:58<13:05,  1.74s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0819, train/loss_vlb_step=0.000274, train/loss_step=0.0819, global_step=8644.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  63%|██████▎   | 757/1208 [21:58<13:05,  1.74s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00931, train/loss_vlb_step=4.38e-5, train/loss_step=0.00931, global_step=8645.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  63%|██████▎   | 758/1208 [21:59<13:03,  1.74s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00931, train/loss_vlb_step=4.38e-5, train/loss_step=0.00931, global_step=8645.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  63%|██████▎   | 758/1208 [21:59<13:03,  1.74s/it, loss=0.203, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000935, train/loss_step=0.233, global_step=8645.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  63%|██████▎   | 759/1208 [22:00<13:01,  1.74s/it, loss=0.203, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000935, train/loss_step=0.233, global_step=8645.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  63%|██████▎   | 759/1208 [22:00<13:01,  1.74s/it, loss=0.207, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000338, train/loss_step=0.103, global_step=8645.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  63%|██████▎   | 760/1208 [22:03<13:00,  1.74s/it, loss=0.207, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000338, train/loss_step=0.103, global_step=8645.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  63%|██████▎   | 760/1208 [22:03<13:00,  1.74s/it, loss=0.191, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=8645.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  63%|██████▎   | 761/1208 [22:04<12:58,  1.74s/it, loss=0.191, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=8645.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  63%|██████▎   | 761/1208 [22:04<12:58,  1.74s/it, loss=0.204, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00345, train/loss_step=0.398, global_step=8646.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  63%|██████▎   | 762/1208 [22:05<12:56,  1.74s/it, loss=0.204, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00345, train/loss_step=0.398, global_step=8646.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  63%|██████▎   | 762/1208 [22:05<12:56,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=2.08e-5, train/loss_step=0.00392, global_step=8646.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  63%|██████▎   | 763/1208 [22:07<12:53,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=2.08e-5, train/loss_step=0.00392, global_step=8646.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  63%|██████▎   | 763/1208 [22:07<12:53,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000519, train/loss_step=0.155, global_step=8646.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  63%|██████▎   | 764/1208 [22:10<12:53,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000519, train/loss_step=0.155, global_step=8646.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  63%|██████▎   | 764/1208 [22:10<12:53,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000108, train/loss_step=0.0277, global_step=8646.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  63%|██████▎   | 765/1208 [22:11<12:51,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000108, train/loss_step=0.0277, global_step=8646.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  63%|██████▎   | 765/1208 [22:11<12:51,  1.74s/it, loss=0.158, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=8647.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  63%|██████▎   | 766/1208 [22:12<12:48,  1.74s/it, loss=0.158, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000386, train/loss_step=0.117, global_step=8647.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  63%|██████▎   | 766/1208 [22:12<12:48,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0658, train/loss_vlb_step=0.000223, train/loss_step=0.0658, global_step=8647.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  63%|██████▎   | 767/1208 [22:13<12:46,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0658, train/loss_vlb_step=0.000223, train/loss_step=0.0658, global_step=8647.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  63%|██████▎   | 767/1208 [22:13<12:46,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000753, train/loss_step=0.207, global_step=8647.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  64%|██████▎   | 768/1208 [22:16<12:45,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000753, train/loss_step=0.207, global_step=8647.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  64%|██████▎   | 768/1208 [22:16<12:45,  1.74s/it, loss=0.157, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000936, train/loss_step=0.218, global_step=8647.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  64%|██████▎   | 769/1208 [22:18<12:43,  1.74s/it, loss=0.157, v_num=0, train/loss_simple_step=0.218, train/loss_vlb_step=0.000936, train/loss_step=0.218, global_step=8647.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  64%|██████▎   | 769/1208 [22:18<12:43,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.075, train/loss_vlb_step=0.000253, train/loss_step=0.075, global_step=8648.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  64%|██████▎   | 770/1208 [22:19<12:41,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.075, train/loss_vlb_step=0.000253, train/loss_step=0.075, global_step=8648.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  64%|██████▎   | 770/1208 [22:19<12:41,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00346, train/loss_vlb_step=1.86e-5, train/loss_step=0.00346, global_step=8648.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  64%|██████▍   | 771/1208 [22:20<12:39,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.00346, train/loss_vlb_step=1.86e-5, train/loss_step=0.00346, global_step=8648.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  64%|██████▍   | 771/1208 [22:20<12:39,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000132, train/loss_step=0.035, global_step=8648.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  64%|██████▍   | 772/1208 [22:23<12:38,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000132, train/loss_step=0.035, global_step=8648.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  64%|██████▍   | 772/1208 [22:23<12:38,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000418, train/loss_step=0.127, global_step=8648.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  64%|██████▍   | 773/1208 [22:24<12:36,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000418, train/loss_step=0.127, global_step=8648.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  64%|██████▍   | 773/1208 [22:24<12:36,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0856, train/loss_vlb_step=0.000281, train/loss_step=0.0856, global_step=8649.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  64%|██████▍   | 774/1208 [22:25<12:34,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0856, train/loss_vlb_step=0.000281, train/loss_step=0.0856, global_step=8649.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  64%|██████▍   | 774/1208 [22:25<12:34,  1.74s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=8.09e-5, train/loss_step=0.0193, global_step=8649.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  64%|██████▍   | 775/1208 [22:26<12:32,  1.74s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=8.09e-5, train/loss_step=0.0193, global_step=8649.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  64%|██████▍   | 775/1208 [22:26<12:32,  1.74s/it, loss=0.11, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000448, train/loss_step=0.135, global_step=8649.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  64%|██████▍   | 776/1208 [22:29<12:31,  1.74s/it, loss=0.11, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000448, train/loss_step=0.135, global_step=8649.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  64%|██████▍   | 776/1208 [22:29<12:31,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00124, train/loss_step=0.265, global_step=8649.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  64%|██████▍   | 777/1208 [22:31<12:29,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00124, train/loss_step=0.265, global_step=8649.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  64%|██████▍   | 777/1208 [22:31<12:29,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=8650.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  64%|██████▍   | 778/1208 [22:32<12:27,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000368, train/loss_step=0.112, global_step=8650.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  64%|██████▍   | 778/1208 [22:32<12:27,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00167, train/loss_step=0.277, global_step=8650.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  64%|██████▍   | 779/1208 [22:33<12:25,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00167, train/loss_step=0.277, global_step=8650.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  64%|██████▍   | 779/1208 [22:33<12:25,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000129, train/loss_step=0.035, global_step=8650.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  65%|██████▍   | 780/1208 [22:36<12:24,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000129, train/loss_step=0.035, global_step=8650.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  65%|██████▍   | 780/1208 [22:36<12:24,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000116, train/loss_step=0.0307, global_step=8650.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  65%|██████▍   | 781/1208 [22:37<12:22,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000116, train/loss_step=0.0307, global_step=8650.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  65%|██████▍   | 781/1208 [22:37<12:22,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.00101, train/loss_step=0.240, global_step=8651.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  65%|██████▍   | 782/1208 [22:38<12:20,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.00101, train/loss_step=0.240, global_step=8651.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  65%|██████▍   | 782/1208 [22:38<12:20,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0881, train/loss_vlb_step=0.000294, train/loss_step=0.0881, global_step=8651.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  65%|██████▍   | 783/1208 [22:39<12:17,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0881, train/loss_vlb_step=0.000294, train/loss_step=0.0881, global_step=8651.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  65%|██████▍   | 783/1208 [22:39<12:17,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00488, train/loss_step=0.405, global_step=8651.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  65%|██████▍   | 784/1208 [22:42<12:17,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00488, train/loss_step=0.405, global_step=8651.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  65%|██████▍   | 784/1208 [22:42<12:17,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.0044, train/loss_step=0.417, global_step=8651.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  65%|██████▍   | 785/1208 [22:43<12:14,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.417, train/loss_vlb_step=0.0044, train/loss_step=0.417, global_step=8651.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  65%|██████▍   | 785/1208 [22:43<12:14,  1.74s/it, loss=0.149, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000472, train/loss_step=0.142, global_step=8652.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  65%|██████▌   | 786/1208 [22:45<12:12,  1.74s/it, loss=0.149, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000472, train/loss_step=0.142, global_step=8652.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  65%|██████▌   | 786/1208 [22:45<12:12,  1.74s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0658, train/loss_vlb_step=0.000226, train/loss_step=0.0658, global_step=8652.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  65%|██████▌   | 787/1208 [22:46<12:10,  1.74s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0658, train/loss_vlb_step=0.000226, train/loss_step=0.0658, global_step=8652.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  65%|██████▌   | 787/1208 [22:46<12:10,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.00577, train/loss_step=0.470, global_step=8652.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  65%|██████▌   | 788/1208 [22:49<12:09,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.470, train/loss_vlb_step=0.00577, train/loss_step=0.470, global_step=8652.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  65%|██████▌   | 788/1208 [22:49<12:09,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00132, train/loss_step=0.285, global_step=8652.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  65%|██████▌   | 789/1208 [22:50<12:07,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.285, train/loss_vlb_step=0.00132, train/loss_step=0.285, global_step=8652.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  65%|██████▌   | 789/1208 [22:50<12:07,  1.74s/it, loss=0.169, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000478, train/loss_step=0.142, global_step=8653.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  65%|██████▌   | 790/1208 [22:51<12:05,  1.74s/it, loss=0.169, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000478, train/loss_step=0.142, global_step=8653.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  65%|██████▌   | 790/1208 [22:51<12:05,  1.74s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0505, train/loss_vlb_step=0.000174, train/loss_step=0.0505, global_step=8653.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  65%|██████▌   | 791/1208 [22:52<12:03,  1.74s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0505, train/loss_vlb_step=0.000174, train/loss_step=0.0505, global_step=8653.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  65%|██████▌   | 791/1208 [22:52<12:03,  1.74s/it, loss=0.176, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000409, train/loss_step=0.122, global_step=8653.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  66%|██████▌   | 792/1208 [22:55<12:02,  1.74s/it, loss=0.176, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000409, train/loss_step=0.122, global_step=8653.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  66%|██████▌   | 792/1208 [22:55<12:02,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00602, train/loss_vlb_step=3.03e-5, train/loss_step=0.00602, global_step=8653.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  66%|██████▌   | 793/1208 [22:56<12:00,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00602, train/loss_vlb_step=3.03e-5, train/loss_step=0.00602, global_step=8653.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  66%|██████▌   | 793/1208 [22:56<12:00,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.81e-5, train/loss_step=0.0106, global_step=8654.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  66%|██████▌   | 794/1208 [22:58<11:58,  1.74s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.81e-5, train/loss_step=0.0106, global_step=8654.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  66%|██████▌   | 794/1208 [22:58<11:58,  1.74s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0607, train/loss_vlb_step=0.000203, train/loss_step=0.0607, global_step=8654.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  66%|██████▌   | 795/1208 [22:59<11:56,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0607, train/loss_vlb_step=0.000203, train/loss_step=0.0607, global_step=8654.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  66%|██████▌   | 795/1208 [22:59<11:56,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.000144, train/loss_step=0.0393, global_step=8654.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  66%|██████▌   | 796/1208 [23:02<11:55,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.000144, train/loss_step=0.0393, global_step=8654.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  66%|██████▌   | 796/1208 [23:02<11:55,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000331, train/loss_step=0.100, global_step=8654.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  66%|██████▌   | 797/1208 [23:03<11:53,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.000331, train/loss_step=0.100, global_step=8654.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  66%|██████▌   | 797/1208 [23:03<11:53,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0954, train/loss_vlb_step=0.000319, train/loss_step=0.0954, global_step=8655.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  66%|██████▌   | 798/1208 [23:04<11:51,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0954, train/loss_vlb_step=0.000319, train/loss_step=0.0954, global_step=8655.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  66%|██████▌   | 798/1208 [23:04<11:51,  1.74s/it, loss=0.16, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00227, train/loss_step=0.393, global_step=8655.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  66%|██████▌   | 799/1208 [23:05<11:49,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.393, train/loss_vlb_step=0.00227, train/loss_step=0.393, global_step=8655.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  66%|██████▌   | 799/1208 [23:05<11:49,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00108, train/loss_step=0.251, global_step=8655.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  66%|██████▌   | 800/1208 [23:08<11:48,  1.74s/it, loss=0.171, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00108, train/loss_step=0.251, global_step=8655.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  66%|██████▌   | 800/1208 [23:08<11:48,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.77e-5, train/loss_step=0.016, global_step=8655.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  66%|██████▋   | 801/1208 [23:09<11:46,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.77e-5, train/loss_step=0.016, global_step=8655.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  66%|██████▋   | 801/1208 [23:09<11:46,  1.74s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0692, train/loss_vlb_step=0.000234, train/loss_step=0.0692, global_step=8656.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  66%|██████▋   | 802/1208 [23:10<11:44,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0692, train/loss_vlb_step=0.000234, train/loss_step=0.0692, global_step=8656.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  66%|██████▋   | 802/1208 [23:10<11:44,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.443, train/loss_vlb_step=0.00292, train/loss_step=0.443, global_step=8656.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  66%|██████▋   | 803/1208 [23:11<11:42,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.443, train/loss_vlb_step=0.00292, train/loss_step=0.443, global_step=8656.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  66%|██████▋   | 803/1208 [23:11<11:42,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.547, train/loss_vlb_step=0.00919, train/loss_step=0.547, global_step=8656.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  67%|██████▋   | 804/1208 [23:15<11:41,  1.74s/it, loss=0.186, v_num=0, train/loss_simple_step=0.547, train/loss_vlb_step=0.00919, train/loss_step=0.547, global_step=8656.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  67%|██████▋   | 804/1208 [23:15<11:41,  1.74s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.000146, train/loss_step=0.0401, global_step=8656.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  67%|██████▋   | 805/1208 [23:16<11:39,  1.73s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.000146, train/loss_step=0.0401, global_step=8656.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  67%|██████▋   | 805/1208 [23:16<11:39,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=3.32e-5, train/loss_step=0.00677, global_step=8657.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  67%|██████▋   | 806/1208 [23:17<11:36,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=3.32e-5, train/loss_step=0.00677, global_step=8657.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  67%|██████▋   | 806/1208 [23:17<11:36,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=2.8e-5, train/loss_step=0.00545, global_step=8657.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  67%|██████▋   | 807/1208 [23:18<11:34,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=2.8e-5, train/loss_step=0.00545, global_step=8657.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  67%|██████▋   | 807/1208 [23:18<11:34,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000521, train/loss_step=0.148, global_step=8657.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  67%|██████▋   | 808/1208 [23:21<11:33,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000521, train/loss_step=0.148, global_step=8657.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  67%|██████▋   | 808/1208 [23:21<11:33,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=9.7e-5, train/loss_step=0.0258, global_step=8657.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  67%|██████▋   | 809/1208 [23:22<11:31,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=9.7e-5, train/loss_step=0.0258, global_step=8657.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  67%|██████▋   | 809/1208 [23:22<11:31,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.77e-5, train/loss_step=0.0152, global_step=8658.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  67%|██████▋   | 810/1208 [23:23<11:29,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.77e-5, train/loss_step=0.0152, global_step=8658.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  67%|██████▋   | 810/1208 [23:23<11:29,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.16e-5, train/loss_step=0.00202, global_step=8658.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  67%|██████▋   | 811/1208 [23:24<11:27,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.16e-5, train/loss_step=0.00202, global_step=8658.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  67%|██████▋   | 811/1208 [23:24<11:27,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00359, train/loss_step=0.366, global_step=8658.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  67%|██████▋   | 812/1208 [23:28<11:26,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00359, train/loss_step=0.366, global_step=8658.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  67%|██████▋   | 812/1208 [23:28<11:26,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00379, train/loss_vlb_step=2.09e-5, train/loss_step=0.00379, global_step=8658.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  67%|██████▋   | 813/1208 [23:29<11:24,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00379, train/loss_vlb_step=2.09e-5, train/loss_step=0.00379, global_step=8658.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  67%|██████▋   | 813/1208 [23:29<11:24,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=8659.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  67%|██████▋   | 814/1208 [23:30<11:22,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=8659.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  67%|██████▋   | 814/1208 [23:30<11:22,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.32e-5, train/loss_step=0.0194, global_step=8659.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  67%|██████▋   | 815/1208 [23:31<11:20,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.32e-5, train/loss_step=0.0194, global_step=8659.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  67%|██████▋   | 815/1208 [23:31<11:20,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0486, train/loss_vlb_step=0.00017, train/loss_step=0.0486, global_step=8659.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  68%|██████▊   | 816/1208 [23:34<11:19,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0486, train/loss_vlb_step=0.00017, train/loss_step=0.0486, global_step=8659.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  68%|██████▊   | 816/1208 [23:34<11:19,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.6e-5, train/loss_step=0.0181, global_step=8659.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  68%|██████▊   | 817/1208 [23:35<11:17,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.6e-5, train/loss_step=0.0181, global_step=8659.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  68%|██████▊   | 817/1208 [23:35<11:17,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000348, train/loss_step=0.106, global_step=8660.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  68%|██████▊   | 818/1208 [23:36<11:15,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000348, train/loss_step=0.106, global_step=8660.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  68%|██████▊   | 818/1208 [23:36<11:15,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000103, train/loss_step=0.0262, global_step=8660.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  68%|██████▊   | 819/1208 [23:38<11:13,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000103, train/loss_step=0.0262, global_step=8660.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  68%|██████▊   | 819/1208 [23:38<11:13,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00104, train/loss_step=0.244, global_step=8660.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  68%|██████▊   | 820/1208 [23:41<11:12,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.00104, train/loss_step=0.244, global_step=8660.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  68%|██████▊   | 820/1208 [23:41<11:12,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0422, train/loss_vlb_step=0.000152, train/loss_step=0.0422, global_step=8660.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  68%|██████▊   | 821/1208 [23:42<11:10,  1.73s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0422, train/loss_vlb_step=0.000152, train/loss_step=0.0422, global_step=8660.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  68%|██████▊   | 821/1208 [23:42<11:10,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.689, train/loss_vlb_step=0.0175, train/loss_step=0.689, global_step=8661.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  68%|██████▊   | 822/1208 [23:43<11:08,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.689, train/loss_vlb_step=0.0175, train/loss_step=0.689, global_step=8661.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  68%|██████▊   | 822/1208 [23:43<11:08,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.000122, train/loss_step=0.032, global_step=8661.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  68%|██████▊   | 823/1208 [23:44<11:06,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.000122, train/loss_step=0.032, global_step=8661.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  68%|██████▊   | 823/1208 [23:44<11:06,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000942, train/loss_step=0.240, global_step=8661.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  68%|██████▊   | 824/1208 [23:47<11:05,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000942, train/loss_step=0.240, global_step=8661.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  68%|██████▊   | 824/1208 [23:47<11:05,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00578, train/loss_vlb_step=3e-5, train/loss_step=0.00578, global_step=8661.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  68%|██████▊   | 825/1208 [23:48<11:03,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00578, train/loss_vlb_step=3e-5, train/loss_step=0.00578, global_step=8661.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  68%|██████▊   | 825/1208 [23:48<11:03,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00177, train/loss_step=0.325, global_step=8662.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  68%|██████▊   | 826/1208 [23:49<11:01,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00177, train/loss_step=0.325, global_step=8662.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  68%|██████▊   | 826/1208 [23:49<11:01,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000622, train/loss_step=0.184, global_step=8662.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  68%|██████▊   | 827/1208 [23:51<10:59,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000622, train/loss_step=0.184, global_step=8662.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  68%|██████▊   | 827/1208 [23:51<10:59,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0648, train/loss_vlb_step=0.000222, train/loss_step=0.0648, global_step=8662.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  69%|██████▊   | 828/1208 [23:54<10:58,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0648, train/loss_vlb_step=0.000222, train/loss_step=0.0648, global_step=8662.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  69%|██████▊   | 828/1208 [23:54<10:58,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.76e-5, train/loss_step=0.0154, global_step=8662.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  69%|██████▊   | 829/1208 [23:55<10:56,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.76e-5, train/loss_step=0.0154, global_step=8662.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  69%|██████▊   | 829/1208 [23:55<10:56,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00146, train/loss_step=0.272, global_step=8663.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  69%|██████▊   | 830/1208 [23:56<10:54,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.00146, train/loss_step=0.272, global_step=8663.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  69%|██████▊   | 830/1208 [23:56<10:54,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0957, train/loss_vlb_step=0.000315, train/loss_step=0.0957, global_step=8663.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  69%|██████▉   | 831/1208 [23:57<10:52,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0957, train/loss_vlb_step=0.000315, train/loss_step=0.0957, global_step=8663.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  69%|██████▉   | 831/1208 [23:57<10:52,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.000271, train/loss_step=0.0817, global_step=8663.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  69%|██████▉   | 832/1208 [24:00<10:51,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0817, train/loss_vlb_step=0.000271, train/loss_step=0.0817, global_step=8663.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  69%|██████▉   | 832/1208 [24:00<10:51,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=8663.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  69%|██████▉   | 833/1208 [24:01<10:49,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=8663.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  69%|██████▉   | 833/1208 [24:01<10:49,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00516, train/loss_vlb_step=2.59e-5, train/loss_step=0.00516, global_step=8664.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  69%|██████▉   | 834/1208 [24:02<10:47,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00516, train/loss_vlb_step=2.59e-5, train/loss_step=0.00516, global_step=8664.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  69%|██████▉   | 834/1208 [24:02<10:47,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000107, train/loss_step=0.0286, global_step=8664.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  69%|██████▉   | 835/1208 [24:04<10:45,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.000107, train/loss_step=0.0286, global_step=8664.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  69%|██████▉   | 835/1208 [24:04<10:45,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.62e-5, train/loss_step=0.0101, global_step=8664.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  69%|██████▉   | 836/1208 [24:07<10:43,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.62e-5, train/loss_step=0.0101, global_step=8664.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  69%|██████▉   | 836/1208 [24:07<10:43,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0625, train/loss_vlb_step=0.000219, train/loss_step=0.0625, global_step=8664.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  69%|██████▉   | 837/1208 [24:08<10:41,  1.73s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0625, train/loss_vlb_step=0.000219, train/loss_step=0.0625, global_step=8664.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  69%|██████▉   | 837/1208 [24:08<10:41,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000397, train/loss_step=0.119, global_step=8665.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  69%|██████▉   | 838/1208 [24:09<10:39,  1.73s/it, loss=0.133, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000397, train/loss_step=0.119, global_step=8665.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  69%|██████▉   | 838/1208 [24:09<10:39,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.452, train/loss_vlb_step=0.00392, train/loss_step=0.452, global_step=8665.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  69%|██████▉   | 839/1208 [24:10<10:37,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.452, train/loss_vlb_step=0.00392, train/loss_step=0.452, global_step=8665.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  69%|██████▉   | 839/1208 [24:10<10:37,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00156, train/loss_step=0.325, global_step=8665.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  70%|██████▉   | 840/1208 [24:13<10:36,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.325, train/loss_vlb_step=0.00156, train/loss_step=0.325, global_step=8665.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  70%|██████▉   | 840/1208 [24:13<10:36,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00425, train/loss_vlb_step=2.2e-5, train/loss_step=0.00425, global_step=8665.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  70%|██████▉   | 841/1208 [24:14<10:34,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00425, train/loss_vlb_step=2.2e-5, train/loss_step=0.00425, global_step=8665.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  70%|██████▉   | 841/1208 [24:14<10:34,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.59e-5, train/loss_step=0.00282, global_step=8666.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  70%|██████▉   | 842/1208 [24:15<10:32,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.59e-5, train/loss_step=0.00282, global_step=8666.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  70%|██████▉   | 842/1208 [24:15<10:32,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00354, train/loss_step=0.413, global_step=8666.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  70%|██████▉   | 843/1208 [24:16<10:30,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.413, train/loss_vlb_step=0.00354, train/loss_step=0.413, global_step=8666.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  70%|██████▉   | 843/1208 [24:16<10:30,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=7.83e-5, train/loss_step=0.0196, global_step=8666.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  70%|██████▉   | 844/1208 [24:20<10:29,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=7.83e-5, train/loss_step=0.0196, global_step=8666.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  70%|██████▉   | 844/1208 [24:20<10:29,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000474, train/loss_step=0.141, global_step=8666.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  70%|██████▉   | 845/1208 [24:21<10:27,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000474, train/loss_step=0.141, global_step=8666.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  70%|██████▉   | 845/1208 [24:21<10:27,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.636, train/loss_vlb_step=0.0409, train/loss_step=0.636, global_step=8667.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  70%|███████   | 846/1208 [24:22<10:25,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.636, train/loss_vlb_step=0.0409, train/loss_step=0.636, global_step=8667.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  70%|███████   | 846/1208 [24:22<10:25,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00606, train/loss_vlb_step=3.05e-5, train/loss_step=0.00606, global_step=8667.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  70%|███████   | 847/1208 [24:23<10:23,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00606, train/loss_vlb_step=3.05e-5, train/loss_step=0.00606, global_step=8667.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  70%|███████   | 847/1208 [24:23<10:23,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.00017, train/loss_step=0.0482, global_step=8667.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  70%|███████   | 848/1208 [24:26<10:22,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.00017, train/loss_step=0.0482, global_step=8667.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  70%|███████   | 848/1208 [24:26<10:22,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=9.64e-5, train/loss_step=0.0254, global_step=8667.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  70%|███████   | 849/1208 [24:27<10:20,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=9.64e-5, train/loss_step=0.0254, global_step=8667.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  70%|███████   | 849/1208 [24:27<10:20,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.000955, train/loss_step=0.249, global_step=8668.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  70%|███████   | 850/1208 [24:28<10:18,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.000955, train/loss_step=0.249, global_step=8668.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  70%|███████   | 850/1208 [24:28<10:18,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000393, train/loss_step=0.119, global_step=8668.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  70%|███████   | 851/1208 [24:29<10:16,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000393, train/loss_step=0.119, global_step=8668.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  70%|███████   | 851/1208 [24:30<10:16,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.83e-5, train/loss_step=0.0103, global_step=8668.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  71%|███████   | 852/1208 [24:33<10:15,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.83e-5, train/loss_step=0.0103, global_step=8668.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  71%|███████   | 852/1208 [24:33<10:15,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.00055, train/loss_step=0.161, global_step=8668.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  71%|███████   | 853/1208 [24:34<10:13,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.00055, train/loss_step=0.161, global_step=8668.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  71%|███████   | 853/1208 [24:34<10:13,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0779, train/loss_vlb_step=0.000263, train/loss_step=0.0779, global_step=8669.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  71%|███████   | 854/1208 [24:35<10:11,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0779, train/loss_vlb_step=0.000263, train/loss_step=0.0779, global_step=8669.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  71%|███████   | 854/1208 [24:35<10:11,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.600, train/loss_vlb_step=0.0104, train/loss_step=0.600, global_step=8669.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  71%|███████   | 855/1208 [24:36<10:09,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.600, train/loss_vlb_step=0.0104, train/loss_step=0.600, global_step=8669.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  71%|███████   | 855/1208 [24:36<10:09,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000541, train/loss_step=0.159, global_step=8669.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  71%|███████   | 856/1208 [24:39<10:08,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000541, train/loss_step=0.159, global_step=8669.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  71%|███████   | 856/1208 [24:39<10:08,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000496, train/loss_step=0.148, global_step=8669.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  71%|███████   | 857/1208 [24:40<10:06,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000496, train/loss_step=0.148, global_step=8669.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  71%|███████   | 857/1208 [24:40<10:06,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00958, train/loss_vlb_step=4.32e-5, train/loss_step=0.00958, global_step=8670.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  71%|███████   | 858/1208 [24:41<10:04,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.00958, train/loss_vlb_step=4.32e-5, train/loss_step=0.00958, global_step=8670.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  71%|███████   | 858/1208 [24:41<10:04,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.52e-5, train/loss_step=0.0182, global_step=8670.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  71%|███████   | 859/1208 [24:43<10:02,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.52e-5, train/loss_step=0.0182, global_step=8670.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  71%|███████   | 859/1208 [24:43<10:02,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.63e-5, train/loss_step=0.0102, global_step=8670.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  71%|███████   | 860/1208 [24:46<10:01,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.63e-5, train/loss_step=0.0102, global_step=8670.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  71%|███████   | 860/1208 [24:46<10:01,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.000233, train/loss_step=0.0672, global_step=8670.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  71%|███████▏  | 861/1208 [24:47<09:59,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.000233, train/loss_step=0.0672, global_step=8670.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  71%|███████▏  | 861/1208 [24:47<09:59,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.000111, train/loss_step=0.0275, global_step=8671.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  71%|███████▏  | 862/1208 [24:48<09:57,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.000111, train/loss_step=0.0275, global_step=8671.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  71%|███████▏  | 862/1208 [24:48<09:57,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0061, train/loss_vlb_step=3.07e-5, train/loss_step=0.0061, global_step=8671.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  71%|███████▏  | 863/1208 [24:49<09:55,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0061, train/loss_vlb_step=3.07e-5, train/loss_step=0.0061, global_step=8671.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  71%|███████▏  | 863/1208 [24:49<09:55,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00199, train/loss_step=0.331, global_step=8671.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  72%|███████▏  | 864/1208 [24:52<09:54,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.331, train/loss_vlb_step=0.00199, train/loss_step=0.331, global_step=8671.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  72%|███████▏  | 864/1208 [24:52<09:54,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000119, train/loss_step=0.0309, global_step=8671.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  72%|███████▏  | 865/1208 [24:53<09:52,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000119, train/loss_step=0.0309, global_step=8671.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  72%|███████▏  | 865/1208 [24:53<09:52,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000786, train/loss_step=0.211, global_step=8672.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  72%|███████▏  | 866/1208 [24:54<09:50,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.211, train/loss_vlb_step=0.000786, train/loss_step=0.211, global_step=8672.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  72%|███████▏  | 866/1208 [24:54<09:50,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00258, train/loss_step=0.433, global_step=8672.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  72%|███████▏  | 867/1208 [24:55<09:48,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.433, train/loss_vlb_step=0.00258, train/loss_step=0.433, global_step=8672.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  72%|███████▏  | 867/1208 [24:55<09:48,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000789, train/loss_step=0.212, global_step=8672.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  72%|███████▏  | 868/1208 [24:59<09:47,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000789, train/loss_step=0.212, global_step=8672.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  72%|███████▏  | 868/1208 [24:59<09:47,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=5.98e-5, train/loss_step=0.0144, global_step=8672.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  72%|███████▏  | 869/1208 [25:00<09:45,  1.73s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=5.98e-5, train/loss_step=0.0144, global_step=8672.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  72%|███████▏  | 869/1208 [25:00<09:45,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000145, train/loss_step=0.0386, global_step=8673.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  72%|███████▏  | 870/1208 [25:01<09:43,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000145, train/loss_step=0.0386, global_step=8673.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  72%|███████▏  | 870/1208 [25:01<09:43,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=2.33e-5, train/loss_step=0.00451, global_step=8673.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  72%|███████▏  | 871/1208 [25:02<09:41,  1.72s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=2.33e-5, train/loss_step=0.00451, global_step=8673.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  72%|███████▏  | 871/1208 [25:02<09:41,  1.72s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00328, train/loss_vlb_step=1.78e-5, train/loss_step=0.00328, global_step=8673.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  72%|███████▏  | 872/1208 [25:05<09:40,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00328, train/loss_vlb_step=1.78e-5, train/loss_step=0.00328, global_step=8673.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  72%|███████▏  | 872/1208 [25:05<09:40,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000184, train/loss_step=0.0545, global_step=8673.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  72%|███████▏  | 873/1208 [25:06<09:38,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000184, train/loss_step=0.0545, global_step=8673.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  72%|███████▏  | 873/1208 [25:06<09:38,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=2.21e-5, train/loss_step=0.00413, global_step=8674.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  72%|███████▏  | 874/1208 [25:07<09:36,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=2.21e-5, train/loss_step=0.00413, global_step=8674.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  72%|███████▏  | 874/1208 [25:07<09:36,  1.72s/it, loss=0.09, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.1e-5, train/loss_step=0.0167, global_step=8674.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  72%|███████▏  | 875/1208 [25:08<09:34,  1.72s/it, loss=0.09, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=7.1e-5, train/loss_step=0.0167, global_step=8674.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  72%|███████▏  | 875/1208 [25:08<09:34,  1.72s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=1.74e-5, train/loss_step=0.00308, global_step=8674.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  73%|███████▎  | 876/1208 [25:11<09:33,  1.73s/it, loss=0.0822, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=1.74e-5, train/loss_step=0.00308, global_step=8674.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  73%|███████▎  | 876/1208 [25:11<09:33,  1.73s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000639, train/loss_step=0.178, global_step=8674.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  73%|███████▎  | 877/1208 [25:13<09:31,  1.73s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000639, train/loss_step=0.178, global_step=8674.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  73%|███████▎  | 877/1208 [25:13<09:31,  1.73s/it, loss=0.0867, v_num=0, train/loss_simple_step=0.0683, train/loss_vlb_step=0.000233, train/loss_step=0.0683, global_step=8675.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  73%|███████▎  | 878/1208 [25:14<09:29,  1.72s/it, loss=0.0867, v_num=0, train/loss_simple_step=0.0683, train/loss_vlb_step=0.000233, train/loss_step=0.0683, global_step=8675.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  73%|███████▎  | 878/1208 [25:14<09:29,  1.72s/it, loss=0.086, v_num=0, train/loss_simple_step=0.0049, train/loss_vlb_step=2.59e-5, train/loss_step=0.0049, global_step=8675.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  73%|███████▎  | 879/1208 [25:15<09:27,  1.72s/it, loss=0.086, v_num=0, train/loss_simple_step=0.0049, train/loss_vlb_step=2.59e-5, train/loss_step=0.0049, global_step=8675.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  73%|███████▎  | 879/1208 [25:15<09:27,  1.72s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000746, train/loss_step=0.203, global_step=8675.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  73%|███████▎  | 880/1208 [25:18<09:25,  1.73s/it, loss=0.0957, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000746, train/loss_step=0.203, global_step=8675.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  73%|███████▎  | 880/1208 [25:18<09:25,  1.73s/it, loss=0.0929, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.52e-5, train/loss_step=0.0125, global_step=8675.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  73%|███████▎  | 881/1208 [25:19<09:23,  1.72s/it, loss=0.0929, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.52e-5, train/loss_step=0.0125, global_step=8675.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  73%|███████▎  | 881/1208 [25:19<09:23,  1.72s/it, loss=0.0938, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000155, train/loss_step=0.0445, global_step=8676.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  73%|███████▎  | 882/1208 [25:20<09:22,  1.72s/it, loss=0.0938, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000155, train/loss_step=0.0445, global_step=8676.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  73%|███████▎  | 882/1208 [25:20<09:22,  1.72s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=8.58e-5, train/loss_step=0.0225, global_step=8676.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  73%|███████▎  | 883/1208 [25:21<09:20,  1.72s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=8.58e-5, train/loss_step=0.0225, global_step=8676.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  73%|███████▎  | 883/1208 [25:21<09:20,  1.72s/it, loss=0.0803, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000158, train/loss_step=0.0454, global_step=8676.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  73%|███████▎  | 884/1208 [25:24<09:18,  1.72s/it, loss=0.0803, v_num=0, train/loss_simple_step=0.0454, train/loss_vlb_step=0.000158, train/loss_step=0.0454, global_step=8676.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  73%|███████▎  | 884/1208 [25:24<09:18,  1.72s/it, loss=0.0803, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000121, train/loss_step=0.0311, global_step=8676.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  73%|███████▎  | 885/1208 [25:25<09:16,  1.72s/it, loss=0.0803, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000121, train/loss_step=0.0311, global_step=8676.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  73%|███████▎  | 885/1208 [25:25<09:16,  1.72s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00281, train/loss_step=0.408, global_step=8677.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  73%|███████▎  | 886/1208 [25:27<09:14,  1.72s/it, loss=0.0902, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00281, train/loss_step=0.408, global_step=8677.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  73%|███████▎  | 886/1208 [25:27<09:14,  1.72s/it, loss=0.0755, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000461, train/loss_step=0.139, global_step=8677.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  73%|███████▎  | 887/1208 [25:28<09:13,  1.72s/it, loss=0.0755, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000461, train/loss_step=0.139, global_step=8677.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  73%|███████▎  | 887/1208 [25:28<09:13,  1.72s/it, loss=0.0696, v_num=0, train/loss_simple_step=0.0934, train/loss_vlb_step=0.000309, train/loss_step=0.0934, global_step=8677.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  74%|███████▎  | 888/1208 [25:31<09:11,  1.72s/it, loss=0.0696, v_num=0, train/loss_simple_step=0.0934, train/loss_vlb_step=0.000309, train/loss_step=0.0934, global_step=8677.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  74%|███████▎  | 888/1208 [25:31<09:11,  1.72s/it, loss=0.0702, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000103, train/loss_step=0.0269, global_step=8677.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  74%|███████▎  | 889/1208 [25:32<09:09,  1.72s/it, loss=0.0702, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000103, train/loss_step=0.0269, global_step=8677.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  74%|███████▎  | 889/1208 [25:32<09:09,  1.72s/it, loss=0.0845, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00163, train/loss_step=0.324, global_step=8678.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  74%|███████▎  | 890/1208 [25:33<09:07,  1.72s/it, loss=0.0845, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00163, train/loss_step=0.324, global_step=8678.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  74%|███████▎  | 890/1208 [25:33<09:07,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00291, train/loss_step=0.381, global_step=8678.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  74%|███████▍  | 891/1208 [25:34<09:05,  1.72s/it, loss=0.103, v_num=0, train/loss_simple_step=0.381, train/loss_vlb_step=0.00291, train/loss_step=0.381, global_step=8678.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  74%|███████▍  | 891/1208 [25:34<09:05,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0679, train/loss_vlb_step=0.000228, train/loss_step=0.0679, global_step=8678.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  74%|███████▍  | 892/1208 [25:37<09:04,  1.72s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0679, train/loss_vlb_step=0.000228, train/loss_step=0.0679, global_step=8678.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  74%|███████▍  | 892/1208 [25:37<09:04,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00189, train/loss_step=0.308, global_step=8678.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  74%|███████▍  | 893/1208 [25:38<09:02,  1.72s/it, loss=0.119, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00189, train/loss_step=0.308, global_step=8678.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  74%|███████▍  | 893/1208 [25:38<09:02,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.455, train/loss_vlb_step=0.0069, train/loss_step=0.455, global_step=8679.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  74%|███████▍  | 894/1208 [25:39<09:00,  1.72s/it, loss=0.142, v_num=0, train/loss_simple_step=0.455, train/loss_vlb_step=0.0069, train/loss_step=0.455, global_step=8679.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  74%|███████▍  | 894/1208 [25:39<09:00,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.00078, train/loss_step=0.206, global_step=8679.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  74%|███████▍  | 895/1208 [25:41<08:58,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.00078, train/loss_step=0.206, global_step=8679.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  74%|███████▍  | 895/1208 [25:41<08:58,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.00039, train/loss_step=0.118, global_step=8679.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  74%|███████▍  | 896/1208 [25:44<08:57,  1.72s/it, loss=0.157, v_num=0, train/loss_simple_step=0.118, train/loss_vlb_step=0.00039, train/loss_step=0.118, global_step=8679.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  74%|███████▍  | 896/1208 [25:44<08:57,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00321, train/loss_vlb_step=1.79e-5, train/loss_step=0.00321, global_step=8679.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  74%|███████▍  | 897/1208 [25:45<08:55,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.00321, train/loss_vlb_step=1.79e-5, train/loss_step=0.00321, global_step=8679.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  74%|███████▍  | 897/1208 [25:45<08:55,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.057, train/loss_vlb_step=0.000194, train/loss_step=0.057, global_step=8680.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  74%|███████▍  | 898/1208 [25:46<08:53,  1.72s/it, loss=0.148, v_num=0, train/loss_simple_step=0.057, train/loss_vlb_step=0.000194, train/loss_step=0.057, global_step=8680.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  74%|███████▍  | 898/1208 [25:46<08:53,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00127, train/loss_step=0.302, global_step=8680.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  74%|███████▍  | 899/1208 [25:47<08:51,  1.72s/it, loss=0.162, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.00127, train/loss_step=0.302, global_step=8680.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  74%|███████▍  | 899/1208 [25:47<08:51,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00226, train/loss_step=0.365, global_step=8680.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  75%|███████▍  | 900/1208 [25:50<08:50,  1.72s/it, loss=0.171, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00226, train/loss_step=0.365, global_step=8680.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  75%|███████▍  | 900/1208 [25:50<08:50,  1.72s/it, loss=0.184, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00127, train/loss_step=0.276, global_step=8680.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.75it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.73it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.74it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:28,  1.68it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.72it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:27,  1.68it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:26,  1.70it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:26,  1.67it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.72it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:26,  1.69it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.79it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.77it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.73it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:25,  1.70it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.73it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.72it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.75it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.73it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.74it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.79it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.75it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:23,  1.73it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.74it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.76it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.75it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.75it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.75it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.76it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.75it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.75it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.75it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.75it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.75it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:20,  1.75it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.79it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.78it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.75it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.76it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.75it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.74it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.76it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.76it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.74it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.75it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.74it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.75it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.75it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.76it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.75it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.75it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.75it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.77it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.76it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.80it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.75it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.75it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.79it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.75it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.76it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.76it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.76it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:16<00:12,  1.76it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:16<00:12,  1.76it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.76it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.76it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.76it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.75it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.75it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.77it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.75it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.75it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.75it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.75it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.78it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.75it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.75it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.75it/s]DDIM Sampler:  70%|███████   | 35/50 [00:20<00:08,  1.75it/s]DDIM Sampler:  70%|███████   | 35/50 [00:20<00:08,  1.77it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.75it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:08,  1.75it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.75it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.76it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.75it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.79it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.75it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.78it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.73it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.78it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.75it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.74it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.75it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.75it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:24<00:04,  1.74it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.78it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:24<00:04,  1.74it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.74it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.78it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.74it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.75it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.78it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.74it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.78it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.75it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.78it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.73it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.75it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.73it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.74it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.79it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.72it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.75it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.78it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.73it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:28<00:00,  1.74it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:28<00:00,  1.74it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.74it/s]Epoch 28:  75%|███████▍  | 901/1208 [26:22<08:59,  1.76s/it, loss=0.184, v_num=0, train/loss_simple_step=0.276, train/loss_vlb_step=0.00127, train/loss_step=0.276, global_step=8680.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  75%|███████▍  | 901/1208 [26:22<08:59,  1.76s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=1.29e-5, train/loss_step=0.00229, global_step=8681.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  75%|███████▍  | 902/1208 [26:23<08:57,  1.76s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=1.29e-5, train/loss_step=0.00229, global_step=8681.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  75%|███████▍  | 902/1208 [26:23<08:57,  1.76s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00626, train/loss_vlb_step=2.87e-5, train/loss_step=0.00626, global_step=8681.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  75%|███████▍  | 903/1208 [26:24<08:55,  1.75s/it, loss=0.181, v_num=0, train/loss_simple_step=0.00626, train/loss_vlb_step=2.87e-5, train/loss_step=0.00626, global_step=8681.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  75%|███████▍  | 903/1208 [26:24<08:55,  1.75s/it, loss=0.198, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00267, train/loss_step=0.385, global_step=8681.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  75%|███████▍  | 904/1208 [26:27<08:53,  1.76s/it, loss=0.198, v_num=0, train/loss_simple_step=0.385, train/loss_vlb_step=0.00267, train/loss_step=0.385, global_step=8681.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  75%|███████▍  | 904/1208 [26:27<08:53,  1.76s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0745, train/loss_vlb_step=0.000252, train/loss_step=0.0745, global_step=8681.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  75%|███████▍  | 905/1208 [26:28<08:51,  1.76s/it, loss=0.2, v_num=0, train/loss_simple_step=0.0745, train/loss_vlb_step=0.000252, train/loss_step=0.0745, global_step=8681.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  75%|███████▍  | 905/1208 [26:28<08:51,  1.76s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0729, train/loss_vlb_step=0.00024, train/loss_step=0.0729, global_step=8682.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  75%|███████▌  | 906/1208 [26:29<08:49,  1.75s/it, loss=0.183, v_num=0, train/loss_simple_step=0.0729, train/loss_vlb_step=0.00024, train/loss_step=0.0729, global_step=8682.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  75%|███████▌  | 906/1208 [26:29<08:49,  1.75s/it, loss=0.183, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000489, train/loss_step=0.144, global_step=8682.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  75%|███████▌  | 907/1208 [26:30<08:47,  1.75s/it, loss=0.183, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000489, train/loss_step=0.144, global_step=8682.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  75%|███████▌  | 907/1208 [26:30<08:47,  1.75s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00664, train/loss_vlb_step=3.35e-5, train/loss_step=0.00664, global_step=8682.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  75%|███████▌  | 908/1208 [26:33<08:46,  1.76s/it, loss=0.179, v_num=0, train/loss_simple_step=0.00664, train/loss_vlb_step=3.35e-5, train/loss_step=0.00664, global_step=8682.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  75%|███████▌  | 908/1208 [26:33<08:46,  1.76s/it, loss=0.184, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000394, train/loss_step=0.120, global_step=8682.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  75%|███████▌  | 909/1208 [26:34<08:44,  1.75s/it, loss=0.184, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000394, train/loss_step=0.120, global_step=8682.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  75%|███████▌  | 909/1208 [26:34<08:44,  1.75s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0303, train/loss_vlb_step=0.000118, train/loss_step=0.0303, global_step=8683.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  75%|███████▌  | 910/1208 [26:35<08:42,  1.75s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0303, train/loss_vlb_step=0.000118, train/loss_step=0.0303, global_step=8683.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  75%|███████▌  | 910/1208 [26:36<08:42,  1.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0305, train/loss_vlb_step=0.00011, train/loss_step=0.0305, global_step=8683.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  75%|███████▌  | 911/1208 [26:37<08:40,  1.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0305, train/loss_vlb_step=0.00011, train/loss_step=0.0305, global_step=8683.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  75%|███████▌  | 911/1208 [26:37<08:40,  1.75s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.55e-5, train/loss_step=0.0157, global_step=8683.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  75%|███████▌  | 912/1208 [26:40<08:39,  1.75s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.55e-5, train/loss_step=0.0157, global_step=8683.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  75%|███████▌  | 912/1208 [26:40<08:39,  1.75s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00445, train/loss_vlb_step=2.34e-5, train/loss_step=0.00445, global_step=8683.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  76%|███████▌  | 913/1208 [26:41<08:37,  1.75s/it, loss=0.134, v_num=0, train/loss_simple_step=0.00445, train/loss_vlb_step=2.34e-5, train/loss_step=0.00445, global_step=8683.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  76%|███████▌  | 913/1208 [26:41<08:37,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000124, train/loss_step=0.0317, global_step=8684.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  76%|███████▌  | 914/1208 [26:42<08:35,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000124, train/loss_step=0.0317, global_step=8684.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  76%|███████▌  | 914/1208 [26:42<08:35,  1.75s/it, loss=0.11, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000535, train/loss_step=0.160, global_step=8684.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  76%|███████▌  | 915/1208 [26:43<08:33,  1.75s/it, loss=0.11, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000535, train/loss_step=0.160, global_step=8684.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  76%|███████▌  | 915/1208 [26:43<08:33,  1.75s/it, loss=0.105, v_num=0, train/loss_simple_step=0.007, train/loss_vlb_step=3.48e-5, train/loss_step=0.007, global_step=8684.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  76%|███████▌  | 916/1208 [26:46<08:32,  1.75s/it, loss=0.105, v_num=0, train/loss_simple_step=0.007, train/loss_vlb_step=3.48e-5, train/loss_step=0.007, global_step=8684.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  76%|███████▌  | 916/1208 [26:46<08:32,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000588, train/loss_step=0.175, global_step=8684.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  76%|███████▌  | 917/1208 [26:48<08:30,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.175, train/loss_vlb_step=0.000588, train/loss_step=0.175, global_step=8684.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  76%|███████▌  | 917/1208 [26:48<08:30,  1.75s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0624, train/loss_vlb_step=0.000215, train/loss_step=0.0624, global_step=8685.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  76%|███████▌  | 918/1208 [26:49<08:28,  1.75s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0624, train/loss_vlb_step=0.000215, train/loss_step=0.0624, global_step=8685.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  76%|███████▌  | 918/1208 [26:49<08:28,  1.75s/it, loss=0.0993, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=7.09e-5, train/loss_step=0.0161, global_step=8685.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  76%|███████▌  | 919/1208 [26:50<08:26,  1.75s/it, loss=0.0993, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=7.09e-5, train/loss_step=0.0161, global_step=8685.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  76%|███████▌  | 919/1208 [26:50<08:26,  1.75s/it, loss=0.0817, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.69e-5, train/loss_step=0.0134, global_step=8685.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  76%|███████▌  | 920/1208 [26:53<08:25,  1.75s/it, loss=0.0817, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.69e-5, train/loss_step=0.0134, global_step=8685.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  76%|███████▌  | 920/1208 [26:53<08:25,  1.75s/it, loss=0.0713, v_num=0, train/loss_simple_step=0.0667, train/loss_vlb_step=0.000227, train/loss_step=0.0667, global_step=8685.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  76%|███████▌  | 921/1208 [26:54<08:23,  1.75s/it, loss=0.0713, v_num=0, train/loss_simple_step=0.0667, train/loss_vlb_step=0.000227, train/loss_step=0.0667, global_step=8685.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  76%|███████▌  | 921/1208 [26:54<08:23,  1.75s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00142, train/loss_step=0.291, global_step=8686.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  76%|███████▋  | 922/1208 [26:55<08:21,  1.75s/it, loss=0.0857, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00142, train/loss_step=0.291, global_step=8686.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  76%|███████▋  | 922/1208 [26:55<08:21,  1.75s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00108, train/loss_step=0.261, global_step=8686.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  76%|███████▋  | 923/1208 [26:56<08:19,  1.75s/it, loss=0.0984, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.00108, train/loss_step=0.261, global_step=8686.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  76%|███████▋  | 923/1208 [26:56<08:19,  1.75s/it, loss=0.0793, v_num=0, train/loss_simple_step=0.00189, train/loss_vlb_step=1.14e-5, train/loss_step=0.00189, global_step=8686.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  76%|███████▋  | 924/1208 [26:59<08:17,  1.75s/it, loss=0.0793, v_num=0, train/loss_simple_step=0.00189, train/loss_vlb_step=1.14e-5, train/loss_step=0.00189, global_step=8686.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  76%|███████▋  | 924/1208 [26:59<08:17,  1.75s/it, loss=0.0757, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.37e-5, train/loss_step=0.00244, global_step=8686.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  77%|███████▋  | 925/1208 [27:00<08:15,  1.75s/it, loss=0.0757, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.37e-5, train/loss_step=0.00244, global_step=8686.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  77%|███████▋  | 925/1208 [27:00<08:15,  1.75s/it, loss=0.0731, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.86e-5, train/loss_step=0.0219, global_step=8687.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  77%|███████▋  | 926/1208 [27:01<08:13,  1.75s/it, loss=0.0731, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=8.86e-5, train/loss_step=0.0219, global_step=8687.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  77%|███████▋  | 926/1208 [27:01<08:13,  1.75s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00268, train/loss_step=0.357, global_step=8687.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  77%|███████▋  | 927/1208 [27:02<08:11,  1.75s/it, loss=0.0837, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00268, train/loss_step=0.357, global_step=8687.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  77%|███████▋  | 927/1208 [27:02<08:11,  1.75s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00114, train/loss_step=0.269, global_step=8687.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  77%|███████▋  | 928/1208 [27:06<08:10,  1.75s/it, loss=0.0969, v_num=0, train/loss_simple_step=0.269, train/loss_vlb_step=0.00114, train/loss_step=0.269, global_step=8687.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  77%|███████▋  | 928/1208 [27:06<08:10,  1.75s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.0745, train/loss_vlb_step=0.000252, train/loss_step=0.0745, global_step=8687.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  77%|███████▋  | 929/1208 [27:07<08:08,  1.75s/it, loss=0.0946, v_num=0, train/loss_simple_step=0.0745, train/loss_vlb_step=0.000252, train/loss_step=0.0745, global_step=8687.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  77%|███████▋  | 929/1208 [27:07<08:08,  1.75s/it, loss=0.1, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000474, train/loss_step=0.142, global_step=8688.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]     Epoch 28:  77%|███████▋  | 930/1208 [27:08<08:06,  1.75s/it, loss=0.1, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000474, train/loss_step=0.142, global_step=8688.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  77%|███████▋  | 930/1208 [27:08<08:06,  1.75s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.51e-5, train/loss_step=0.0236, global_step=8688.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  77%|███████▋  | 931/1208 [27:09<08:04,  1.75s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.51e-5, train/loss_step=0.0236, global_step=8688.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  77%|███████▋  | 931/1208 [27:09<08:04,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.0028, train/loss_step=0.345, global_step=8688.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  77%|███████▋  | 932/1208 [27:12<08:03,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.345, train/loss_vlb_step=0.0028, train/loss_step=0.345, global_step=8688.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  77%|███████▋  | 932/1208 [27:12<08:03,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0501, train/loss_vlb_step=0.000182, train/loss_step=0.0501, global_step=8688.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  77%|███████▋  | 933/1208 [27:13<08:01,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0501, train/loss_vlb_step=0.000182, train/loss_step=0.0501, global_step=8688.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  77%|███████▋  | 933/1208 [27:13<08:01,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00399, train/loss_vlb_step=2.15e-5, train/loss_step=0.00399, global_step=8689.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  77%|███████▋  | 934/1208 [27:14<07:59,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00399, train/loss_vlb_step=2.15e-5, train/loss_step=0.00399, global_step=8689.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  77%|███████▋  | 934/1208 [27:14<07:59,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000518, train/loss_step=0.157, global_step=8689.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  77%|███████▋  | 935/1208 [27:15<07:57,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000518, train/loss_step=0.157, global_step=8689.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  77%|███████▋  | 935/1208 [27:15<07:57,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00123, train/loss_step=0.251, global_step=8689.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  77%|███████▋  | 936/1208 [27:19<07:56,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00123, train/loss_step=0.251, global_step=8689.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  77%|███████▋  | 936/1208 [27:19<07:56,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.66e-5, train/loss_step=0.0122, global_step=8689.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  78%|███████▊  | 937/1208 [27:20<07:54,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.66e-5, train/loss_step=0.0122, global_step=8689.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  78%|███████▊  | 937/1208 [27:20<07:54,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.756, train/loss_vlb_step=0.0283, train/loss_step=0.756, global_step=8690.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  78%|███████▊  | 938/1208 [27:21<07:52,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.756, train/loss_vlb_step=0.0283, train/loss_step=0.756, global_step=8690.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  78%|███████▊  | 938/1208 [27:21<07:52,  1.75s/it, loss=0.164, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000605, train/loss_step=0.177, global_step=8690.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  78%|███████▊  | 939/1208 [27:22<07:50,  1.75s/it, loss=0.164, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.000605, train/loss_step=0.177, global_step=8690.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  78%|███████▊  | 939/1208 [27:22<07:50,  1.75s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.25e-5, train/loss_step=0.00209, global_step=8690.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  78%|███████▊  | 940/1208 [27:25<07:49,  1.75s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.25e-5, train/loss_step=0.00209, global_step=8690.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  78%|███████▊  | 940/1208 [27:25<07:49,  1.75s/it, loss=0.178, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.0026, train/loss_step=0.353, global_step=8690.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]     Epoch 28:  78%|███████▊  | 941/1208 [27:26<07:47,  1.75s/it, loss=0.178, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.0026, train/loss_step=0.353, global_step=8690.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  78%|███████▊  | 941/1208 [27:26<07:47,  1.75s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.51e-5, train/loss_step=0.0198, global_step=8691.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  78%|███████▊  | 942/1208 [27:27<07:45,  1.75s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.51e-5, train/loss_step=0.0198, global_step=8691.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  78%|███████▊  | 942/1208 [27:27<07:45,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.5e-5, train/loss_step=0.0157, global_step=8691.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  78%|███████▊  | 943/1208 [27:28<07:43,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.5e-5, train/loss_step=0.0157, global_step=8691.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  78%|███████▊  | 943/1208 [27:28<07:43,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0421, train/loss_vlb_step=0.000151, train/loss_step=0.0421, global_step=8691.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  78%|███████▊  | 944/1208 [27:32<07:42,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0421, train/loss_vlb_step=0.000151, train/loss_step=0.0421, global_step=8691.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  78%|███████▊  | 944/1208 [27:32<07:42,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000534, train/loss_step=0.159, global_step=8691.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  78%|███████▊  | 945/1208 [27:33<07:40,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000534, train/loss_step=0.159, global_step=8691.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  78%|███████▊  | 945/1208 [27:33<07:40,  1.75s/it, loss=0.167, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000435, train/loss_step=0.132, global_step=8692.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  78%|███████▊  | 946/1208 [27:34<07:38,  1.75s/it, loss=0.167, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000435, train/loss_step=0.132, global_step=8692.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  78%|███████▊  | 946/1208 [27:34<07:38,  1.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.00014, train/loss_step=0.038, global_step=8692.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  78%|███████▊  | 947/1208 [27:35<07:36,  1.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.038, train/loss_vlb_step=0.00014, train/loss_step=0.038, global_step=8692.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  78%|███████▊  | 947/1208 [27:35<07:36,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00844, train/loss_vlb_step=3.88e-5, train/loss_step=0.00844, global_step=8692.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  78%|███████▊  | 948/1208 [27:38<07:34,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00844, train/loss_vlb_step=3.88e-5, train/loss_step=0.00844, global_step=8692.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  78%|███████▊  | 948/1208 [27:38<07:34,  1.75s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=1.99e-5, train/loss_step=0.00375, global_step=8692.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  79%|███████▊  | 949/1208 [27:39<07:32,  1.75s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=1.99e-5, train/loss_step=0.00375, global_step=8692.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  79%|███████▊  | 949/1208 [27:39<07:32,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0954, train/loss_vlb_step=0.000315, train/loss_step=0.0954, global_step=8693.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  79%|███████▊  | 950/1208 [27:40<07:31,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0954, train/loss_vlb_step=0.000315, train/loss_step=0.0954, global_step=8693.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  79%|███████▊  | 950/1208 [27:40<07:31,  1.75s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.000132, train/loss_step=0.0347, global_step=8693.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  79%|███████▊  | 951/1208 [27:42<07:29,  1.75s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.000132, train/loss_step=0.0347, global_step=8693.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  79%|███████▊  | 951/1208 [27:42<07:29,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.67e-5, train/loss_step=0.0185, global_step=8693.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  79%|███████▉  | 952/1208 [27:45<07:27,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.67e-5, train/loss_step=0.0185, global_step=8693.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  79%|███████▉  | 952/1208 [27:45<07:27,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000616, train/loss_step=0.176, global_step=8693.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  79%|███████▉  | 953/1208 [27:46<07:25,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000616, train/loss_step=0.176, global_step=8693.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  79%|███████▉  | 953/1208 [27:46<07:25,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00476, train/loss_vlb_step=2.38e-5, train/loss_step=0.00476, global_step=8694.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  79%|███████▉  | 954/1208 [27:47<07:23,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00476, train/loss_vlb_step=2.38e-5, train/loss_step=0.00476, global_step=8694.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  79%|███████▉  | 954/1208 [27:47<07:23,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00435, train/loss_vlb_step=2.27e-5, train/loss_step=0.00435, global_step=8694.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  79%|███████▉  | 955/1208 [27:48<07:21,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00435, train/loss_vlb_step=2.27e-5, train/loss_step=0.00435, global_step=8694.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  79%|███████▉  | 955/1208 [27:48<07:21,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000746, train/loss_step=0.207, global_step=8694.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  79%|███████▉  | 956/1208 [27:51<07:20,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000746, train/loss_step=0.207, global_step=8694.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  79%|███████▉  | 956/1208 [27:51<07:20,  1.75s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000106, train/loss_step=0.0258, global_step=8694.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  79%|███████▉  | 957/1208 [27:52<07:18,  1.75s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000106, train/loss_step=0.0258, global_step=8694.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  79%|███████▉  | 957/1208 [27:52<07:18,  1.75s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.0019, train/loss_step=0.339, global_step=8695.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  79%|███████▉  | 958/1208 [27:53<07:16,  1.75s/it, loss=0.0928, v_num=0, train/loss_simple_step=0.339, train/loss_vlb_step=0.0019, train/loss_step=0.339, global_step=8695.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  79%|███████▉  | 958/1208 [27:53<07:16,  1.75s/it, loss=0.0841, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=9.06e-6, train/loss_step=0.00158, global_step=8695.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  79%|███████▉  | 959/1208 [27:54<07:14,  1.75s/it, loss=0.0841, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=9.06e-6, train/loss_step=0.00158, global_step=8695.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  79%|███████▉  | 959/1208 [27:54<07:14,  1.75s/it, loss=0.0884, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.000294, train/loss_step=0.0894, global_step=8695.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  79%|███████▉  | 960/1208 [27:58<07:13,  1.75s/it, loss=0.0884, v_num=0, train/loss_simple_step=0.0894, train/loss_vlb_step=0.000294, train/loss_step=0.0894, global_step=8695.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  79%|███████▉  | 960/1208 [27:58<07:13,  1.75s/it, loss=0.105, v_num=0, train/loss_simple_step=0.679, train/loss_vlb_step=0.0437, train/loss_step=0.679, global_step=8695.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]     Epoch 28:  80%|███████▉  | 961/1208 [27:59<07:11,  1.75s/it, loss=0.105, v_num=0, train/loss_simple_step=0.679, train/loss_vlb_step=0.0437, train/loss_step=0.679, global_step=8695.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  80%|███████▉  | 961/1208 [27:59<07:11,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00424, train/loss_step=0.420, global_step=8696.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  80%|███████▉  | 962/1208 [28:00<07:09,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.420, train/loss_vlb_step=0.00424, train/loss_step=0.420, global_step=8696.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  80%|███████▉  | 962/1208 [28:00<07:09,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=1.05e-5, train/loss_step=0.00177, global_step=8696.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  80%|███████▉  | 963/1208 [28:01<07:07,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=1.05e-5, train/loss_step=0.00177, global_step=8696.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  80%|███████▉  | 963/1208 [28:01<07:07,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=7.03e-5, train/loss_step=0.016, global_step=8696.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  80%|███████▉  | 964/1208 [28:04<07:06,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=7.03e-5, train/loss_step=0.016, global_step=8696.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  80%|███████▉  | 964/1208 [28:04<07:06,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00822, train/loss_vlb_step=4.07e-5, train/loss_step=0.00822, global_step=8696.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  80%|███████▉  | 965/1208 [28:05<07:04,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00822, train/loss_vlb_step=4.07e-5, train/loss_step=0.00822, global_step=8696.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  80%|███████▉  | 965/1208 [28:05<07:04,  1.75s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.31e-5, train/loss_step=0.0185, global_step=8697.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  80%|███████▉  | 966/1208 [28:06<07:02,  1.75s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=7.31e-5, train/loss_step=0.0185, global_step=8697.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  80%|███████▉  | 966/1208 [28:06<07:02,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.00436, train/loss_step=0.485, global_step=8697.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  80%|████████  | 967/1208 [28:07<07:00,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.00436, train/loss_step=0.485, global_step=8697.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  80%|████████  | 967/1208 [28:07<07:00,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.28e-5, train/loss_step=0.00219, global_step=8697.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  80%|████████  | 968/1208 [28:11<06:59,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.28e-5, train/loss_step=0.00219, global_step=8697.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  80%|████████  | 968/1208 [28:11<06:59,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0842, train/loss_vlb_step=0.000277, train/loss_step=0.0842, global_step=8697.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  80%|████████  | 969/1208 [28:12<06:57,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0842, train/loss_vlb_step=0.000277, train/loss_step=0.0842, global_step=8697.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  80%|████████  | 969/1208 [28:12<06:57,  1.75s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0929, train/loss_vlb_step=0.00031, train/loss_step=0.0929, global_step=8698.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  80%|████████  | 970/1208 [28:13<06:55,  1.75s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0929, train/loss_vlb_step=0.00031, train/loss_step=0.0929, global_step=8698.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  80%|████████  | 970/1208 [28:13<06:55,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0551, train/loss_vlb_step=0.000187, train/loss_step=0.0551, global_step=8698.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  80%|████████  | 971/1208 [28:14<06:53,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0551, train/loss_vlb_step=0.000187, train/loss_step=0.0551, global_step=8698.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  80%|████████  | 971/1208 [28:14<06:53,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.2e-5, train/loss_step=0.0134, global_step=8698.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  80%|████████  | 972/1208 [28:17<06:52,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.2e-5, train/loss_step=0.0134, global_step=8698.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  80%|████████  | 972/1208 [28:17<06:52,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=3.02e-5, train/loss_step=0.00611, global_step=8698.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  81%|████████  | 973/1208 [28:18<06:50,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=3.02e-5, train/loss_step=0.00611, global_step=8698.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  81%|████████  | 973/1208 [28:18<06:50,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000124, train/loss_step=0.0328, global_step=8699.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  81%|████████  | 974/1208 [28:19<06:48,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0328, train/loss_vlb_step=0.000124, train/loss_step=0.0328, global_step=8699.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  81%|████████  | 974/1208 [28:19<06:48,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=9.78e-5, train/loss_step=0.0244, global_step=8699.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  81%|████████  | 975/1208 [28:21<06:46,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=9.78e-5, train/loss_step=0.0244, global_step=8699.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  81%|████████  | 975/1208 [28:21<06:46,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0919, train/loss_vlb_step=0.000302, train/loss_step=0.0919, global_step=8699.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  81%|████████  | 976/1208 [28:24<06:45,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0919, train/loss_vlb_step=0.000302, train/loss_step=0.0919, global_step=8699.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  81%|████████  | 976/1208 [28:24<06:45,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=8699.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  81%|████████  | 977/1208 [28:25<06:43,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=8699.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  81%|████████  | 977/1208 [28:25<06:43,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0951, train/loss_vlb_step=0.000313, train/loss_step=0.0951, global_step=8700.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  81%|████████  | 978/1208 [28:26<06:41,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0951, train/loss_vlb_step=0.000313, train/loss_step=0.0951, global_step=8700.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  81%|████████  | 978/1208 [28:26<06:41,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000706, train/loss_step=0.203, global_step=8700.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  81%|████████  | 979/1208 [28:27<06:39,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000706, train/loss_step=0.203, global_step=8700.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  81%|████████  | 979/1208 [28:27<06:39,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000482, train/loss_step=0.145, global_step=8700.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  81%|████████  | 980/1208 [28:30<06:37,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000482, train/loss_step=0.145, global_step=8700.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  81%|████████  | 980/1208 [28:30<06:37,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00177, train/loss_step=0.355, global_step=8700.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  81%|████████  | 981/1208 [28:31<06:36,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00177, train/loss_step=0.355, global_step=8700.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  81%|████████  | 981/1208 [28:31<06:36,  1.74s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=6.93e-5, train/loss_step=0.0163, global_step=8701.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  81%|████████▏ | 982/1208 [28:32<06:34,  1.74s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=6.93e-5, train/loss_step=0.0163, global_step=8701.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  81%|████████▏ | 982/1208 [28:32<06:34,  1.74s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.25e-5, train/loss_step=0.0205, global_step=8701.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  81%|████████▏ | 983/1208 [28:33<06:32,  1.74s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.25e-5, train/loss_step=0.0205, global_step=8701.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  81%|████████▏ | 983/1208 [28:33<06:32,  1.74s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.26e-5, train/loss_step=0.0227, global_step=8701.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  81%|████████▏ | 984/1208 [28:37<06:30,  1.75s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=9.26e-5, train/loss_step=0.0227, global_step=8701.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  81%|████████▏ | 984/1208 [28:37<06:30,  1.75s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.0424, train/loss_vlb_step=0.000154, train/loss_step=0.0424, global_step=8701.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  82%|████████▏ | 985/1208 [28:38<06:29,  1.74s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.0424, train/loss_vlb_step=0.000154, train/loss_step=0.0424, global_step=8701.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  82%|████████▏ | 985/1208 [28:38<06:29,  1.74s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.94e-5, train/loss_step=0.00352, global_step=8702.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  82%|████████▏ | 986/1208 [28:39<06:27,  1.74s/it, loss=0.0947, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.94e-5, train/loss_step=0.00352, global_step=8702.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  82%|████████▏ | 986/1208 [28:39<06:27,  1.74s/it, loss=0.0714, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.99e-5, train/loss_step=0.0188, global_step=8702.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  82%|████████▏ | 987/1208 [28:40<06:25,  1.74s/it, loss=0.0714, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.99e-5, train/loss_step=0.0188, global_step=8702.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  82%|████████▏ | 987/1208 [28:40<06:25,  1.74s/it, loss=0.0883, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00194, train/loss_step=0.340, global_step=8702.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  82%|████████▏ | 988/1208 [28:43<06:23,  1.74s/it, loss=0.0883, v_num=0, train/loss_simple_step=0.340, train/loss_vlb_step=0.00194, train/loss_step=0.340, global_step=8702.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  82%|████████▏ | 988/1208 [28:43<06:23,  1.74s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.0005, train/loss_step=0.149, global_step=8702.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  82%|████████▏ | 989/1208 [28:44<06:21,  1.74s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.0005, train/loss_step=0.149, global_step=8702.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  82%|████████▏ | 989/1208 [28:44<06:21,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.599, train/loss_vlb_step=0.0153, train/loss_step=0.599, global_step=8703.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  82%|████████▏ | 990/1208 [28:45<06:20,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.599, train/loss_vlb_step=0.0153, train/loss_step=0.599, global_step=8703.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  82%|████████▏ | 990/1208 [28:45<06:20,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00845, train/loss_vlb_step=4.04e-5, train/loss_step=0.00845, global_step=8703.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  82%|████████▏ | 991/1208 [28:46<06:18,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00845, train/loss_vlb_step=4.04e-5, train/loss_step=0.00845, global_step=8703.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  82%|████████▏ | 991/1208 [28:46<06:18,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0751, train/loss_vlb_step=0.000251, train/loss_step=0.0751, global_step=8703.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  82%|████████▏ | 992/1208 [28:50<06:16,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0751, train/loss_vlb_step=0.000251, train/loss_step=0.0751, global_step=8703.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  82%|████████▏ | 992/1208 [28:50<06:16,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.046, train/loss_vlb_step=0.000168, train/loss_step=0.046, global_step=8703.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  82%|████████▏ | 993/1208 [28:51<06:14,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.046, train/loss_vlb_step=0.000168, train/loss_step=0.046, global_step=8703.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  82%|████████▏ | 993/1208 [28:51<06:14,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000484, train/loss_step=0.144, global_step=8704.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  82%|████████▏ | 994/1208 [28:52<06:12,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000484, train/loss_step=0.144, global_step=8704.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  82%|████████▏ | 994/1208 [28:52<06:12,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00159, train/loss_step=0.304, global_step=8704.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  82%|████████▏ | 995/1208 [28:53<06:11,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00159, train/loss_step=0.304, global_step=8704.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  82%|████████▏ | 995/1208 [28:53<06:11,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.000188, train/loss_step=0.0521, global_step=8704.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  82%|████████▏ | 996/1208 [28:56<06:09,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0521, train/loss_vlb_step=0.000188, train/loss_step=0.0521, global_step=8704.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  82%|████████▏ | 996/1208 [28:56<06:09,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=8704.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  83%|████████▎ | 997/1208 [28:57<06:07,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=8704.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  83%|████████▎ | 997/1208 [28:57<06:07,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000431, train/loss_step=0.129, global_step=8705.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  83%|████████▎ | 998/1208 [28:58<06:05,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000431, train/loss_step=0.129, global_step=8705.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  83%|████████▎ | 998/1208 [28:58<06:05,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0515, train/loss_vlb_step=0.000181, train/loss_step=0.0515, global_step=8705.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  83%|████████▎ | 999/1208 [28:59<06:04,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0515, train/loss_vlb_step=0.000181, train/loss_step=0.0515, global_step=8705.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  83%|████████▎ | 999/1208 [28:59<06:04,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=9.89e-5, train/loss_step=0.0273, global_step=8705.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  83%|████████▎ | 1000/1208 [29:03<06:02,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=9.89e-5, train/loss_step=0.0273, global_step=8705.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  83%|████████▎ | 1000/1208 [29:03<06:02,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.62e-5, train/loss_step=0.00285, global_step=8705.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  83%|████████▎ | 1001/1208 [29:04<06:00,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.62e-5, train/loss_step=0.00285, global_step=8705.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  83%|████████▎ | 1001/1208 [29:04<06:00,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.58e-5, train/loss_step=0.0101, global_step=8706.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  83%|████████▎ | 1002/1208 [29:05<05:58,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.58e-5, train/loss_step=0.0101, global_step=8706.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  83%|████████▎ | 1002/1208 [29:05<05:58,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.27e-5, train/loss_step=0.00216, global_step=8706.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  83%|████████▎ | 1003/1208 [29:06<05:56,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.27e-5, train/loss_step=0.00216, global_step=8706.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  83%|████████▎ | 1003/1208 [29:06<05:56,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00107, train/loss_step=0.263, global_step=8706.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  83%|████████▎ | 1004/1208 [29:09<05:55,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00107, train/loss_step=0.263, global_step=8706.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  83%|████████▎ | 1004/1208 [29:09<05:55,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000401, train/loss_step=0.121, global_step=8706.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  83%|████████▎ | 1005/1208 [29:10<05:53,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.121, train/loss_vlb_step=0.000401, train/loss_step=0.121, global_step=8706.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  83%|████████▎ | 1005/1208 [29:10<05:53,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0681, train/loss_vlb_step=0.00023, train/loss_step=0.0681, global_step=8707.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  83%|████████▎ | 1006/1208 [29:11<05:51,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0681, train/loss_vlb_step=0.00023, train/loss_step=0.0681, global_step=8707.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  83%|████████▎ | 1006/1208 [29:11<05:51,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00165, train/loss_step=0.278, global_step=8707.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  83%|████████▎ | 1007/1208 [29:12<05:49,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.278, train/loss_vlb_step=0.00165, train/loss_step=0.278, global_step=8707.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  83%|████████▎ | 1007/1208 [29:12<05:49,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.61e-5, train/loss_step=0.00281, global_step=8707.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  83%|████████▎ | 1008/1208 [29:16<05:48,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.61e-5, train/loss_step=0.00281, global_step=8707.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  83%|████████▎ | 1008/1208 [29:16<05:48,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.509, train/loss_vlb_step=0.00856, train/loss_step=0.509, global_step=8707.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  84%|████████▎ | 1009/1208 [29:17<05:46,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.509, train/loss_vlb_step=0.00856, train/loss_step=0.509, global_step=8707.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  84%|████████▎ | 1009/1208 [29:17<05:46,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000478, train/loss_step=0.143, global_step=8708.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  84%|████████▎ | 1010/1208 [29:18<05:44,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000478, train/loss_step=0.143, global_step=8708.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  84%|████████▎ | 1010/1208 [29:18<05:44,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.061, train/loss_vlb_step=0.000215, train/loss_step=0.061, global_step=8708.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  84%|████████▎ | 1011/1208 [29:19<05:42,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.061, train/loss_vlb_step=0.000215, train/loss_step=0.061, global_step=8708.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  84%|████████▎ | 1011/1208 [29:19<05:42,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000468, train/loss_step=0.141, global_step=8708.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  84%|████████▍ | 1012/1208 [29:22<05:41,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000468, train/loss_step=0.141, global_step=8708.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  84%|████████▍ | 1012/1208 [29:22<05:41,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000832, train/loss_step=0.216, global_step=8708.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  84%|████████▍ | 1013/1208 [29:23<05:39,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000832, train/loss_step=0.216, global_step=8708.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  84%|████████▍ | 1013/1208 [29:23<05:39,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000434, train/loss_step=0.132, global_step=8709.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  84%|████████▍ | 1014/1208 [29:24<05:37,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000434, train/loss_step=0.132, global_step=8709.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  84%|████████▍ | 1014/1208 [29:24<05:37,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0641, train/loss_vlb_step=0.000219, train/loss_step=0.0641, global_step=8709.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  84%|████████▍ | 1015/1208 [29:26<05:35,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0641, train/loss_vlb_step=0.000219, train/loss_step=0.0641, global_step=8709.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  84%|████████▍ | 1015/1208 [29:26<05:35,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00116, train/loss_step=0.264, global_step=8709.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  84%|████████▍ | 1016/1208 [29:29<05:34,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.264, train/loss_vlb_step=0.00116, train/loss_step=0.264, global_step=8709.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  84%|████████▍ | 1016/1208 [29:29<05:34,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.91e-5, train/loss_step=0.00344, global_step=8709.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  84%|████████▍ | 1017/1208 [29:30<05:32,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.91e-5, train/loss_step=0.00344, global_step=8709.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  84%|████████▍ | 1017/1208 [29:30<05:32,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0986, train/loss_vlb_step=0.000324, train/loss_step=0.0986, global_step=8710.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  84%|████████▍ | 1018/1208 [29:31<05:30,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0986, train/loss_vlb_step=0.000324, train/loss_step=0.0986, global_step=8710.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  84%|████████▍ | 1018/1208 [29:31<05:30,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00113, train/loss_step=0.263, global_step=8710.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  84%|████████▍ | 1019/1208 [29:32<05:28,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.263, train/loss_vlb_step=0.00113, train/loss_step=0.263, global_step=8710.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  84%|████████▍ | 1019/1208 [29:32<05:28,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00792, train/loss_vlb_step=3.76e-5, train/loss_step=0.00792, global_step=8710.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  84%|████████▍ | 1020/1208 [29:35<05:27,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00792, train/loss_vlb_step=3.76e-5, train/loss_step=0.00792, global_step=8710.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  84%|████████▍ | 1020/1208 [29:35<05:27,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.95e-5, train/loss_step=0.00342, global_step=8710.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  85%|████████▍ | 1021/1208 [29:36<05:25,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.95e-5, train/loss_step=0.00342, global_step=8710.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  85%|████████▍ | 1021/1208 [29:36<05:25,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0915, train/loss_vlb_step=0.000304, train/loss_step=0.0915, global_step=8711.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  85%|████████▍ | 1022/1208 [29:37<05:23,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0915, train/loss_vlb_step=0.000304, train/loss_step=0.0915, global_step=8711.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  85%|████████▍ | 1022/1208 [29:37<05:23,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00802, train/loss_vlb_step=3.83e-5, train/loss_step=0.00802, global_step=8711.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  85%|████████▍ | 1023/1208 [29:38<05:21,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00802, train/loss_vlb_step=3.83e-5, train/loss_step=0.00802, global_step=8711.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  85%|████████▍ | 1023/1208 [29:38<05:21,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000492, train/loss_step=0.147, global_step=8711.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  85%|████████▍ | 1024/1208 [29:42<05:20,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000492, train/loss_step=0.147, global_step=8711.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  85%|████████▍ | 1024/1208 [29:42<05:20,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000688, train/loss_step=0.198, global_step=8711.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  85%|████████▍ | 1025/1208 [29:43<05:18,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000688, train/loss_step=0.198, global_step=8711.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  85%|████████▍ | 1025/1208 [29:43<05:18,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00758, train/loss_vlb_step=3.63e-5, train/loss_step=0.00758, global_step=8712.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  85%|████████▍ | 1026/1208 [29:44<05:16,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00758, train/loss_vlb_step=3.63e-5, train/loss_step=0.00758, global_step=8712.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  85%|████████▍ | 1026/1208 [29:44<05:16,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00107, train/loss_step=0.251, global_step=8712.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  85%|████████▌ | 1027/1208 [29:45<05:14,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00107, train/loss_step=0.251, global_step=8712.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  85%|████████▌ | 1027/1208 [29:45<05:14,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.0013, train/loss_step=0.284, global_step=8712.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  85%|████████▌ | 1028/1208 [29:48<05:13,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.0013, train/loss_step=0.284, global_step=8712.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  85%|████████▌ | 1028/1208 [29:48<05:13,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=8712.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  85%|████████▌ | 1029/1208 [29:49<05:11,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000335, train/loss_step=0.102, global_step=8712.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  85%|████████▌ | 1029/1208 [29:49<05:11,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000425, train/loss_step=0.126, global_step=8713.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  85%|████████▌ | 1030/1208 [29:50<05:09,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000425, train/loss_step=0.126, global_step=8713.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  85%|████████▌ | 1030/1208 [29:50<05:09,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000731, train/loss_step=0.203, global_step=8713.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  85%|████████▌ | 1031/1208 [29:52<05:07,  1.74s/it, loss=0.131, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000731, train/loss_step=0.203, global_step=8713.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  85%|████████▌ | 1031/1208 [29:52<05:07,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0096, train/loss_vlb_step=4.55e-5, train/loss_step=0.0096, global_step=8713.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  85%|████████▌ | 1032/1208 [29:55<05:06,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0096, train/loss_vlb_step=4.55e-5, train/loss_step=0.0096, global_step=8713.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  85%|████████▌ | 1032/1208 [29:55<05:06,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.00062, train/loss_step=0.177, global_step=8713.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  86%|████████▌ | 1033/1208 [29:56<05:04,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.177, train/loss_vlb_step=0.00062, train/loss_step=0.177, global_step=8713.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  86%|████████▌ | 1033/1208 [29:56<05:04,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0488, train/loss_vlb_step=0.000168, train/loss_step=0.0488, global_step=8714.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  86%|████████▌ | 1034/1208 [29:57<05:02,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0488, train/loss_vlb_step=0.000168, train/loss_step=0.0488, global_step=8714.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  86%|████████▌ | 1034/1208 [29:57<05:02,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=8714.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  86%|████████▌ | 1035/1208 [29:58<05:00,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=8714.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  86%|████████▌ | 1035/1208 [29:58<05:00,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00159, train/loss_vlb_step=9.27e-6, train/loss_step=0.00159, global_step=8714.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  86%|████████▌ | 1036/1208 [30:01<04:59,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00159, train/loss_vlb_step=9.27e-6, train/loss_step=0.00159, global_step=8714.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  86%|████████▌ | 1036/1208 [30:01<04:59,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000108, train/loss_step=0.0282, global_step=8714.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  86%|████████▌ | 1037/1208 [30:02<04:57,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000108, train/loss_step=0.0282, global_step=8714.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  86%|████████▌ | 1037/1208 [30:02<04:57,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00579, train/loss_vlb_step=2.99e-5, train/loss_step=0.00579, global_step=8715.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  86%|████████▌ | 1038/1208 [30:04<04:55,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00579, train/loss_vlb_step=2.99e-5, train/loss_step=0.00579, global_step=8715.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  86%|████████▌ | 1038/1208 [30:04<04:55,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00346, train/loss_step=0.439, global_step=8715.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  86%|████████▌ | 1039/1208 [30:05<04:53,  1.74s/it, loss=0.112, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00346, train/loss_step=0.439, global_step=8715.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  86%|████████▌ | 1039/1208 [30:05<04:53,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000549, train/loss_step=0.164, global_step=8715.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  86%|████████▌ | 1040/1208 [30:08<04:52,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000549, train/loss_step=0.164, global_step=8715.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  86%|████████▌ | 1040/1208 [30:08<04:52,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.75e-5, train/loss_step=0.0107, global_step=8715.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  86%|████████▌ | 1041/1208 [30:09<04:50,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.75e-5, train/loss_step=0.0107, global_step=8715.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  86%|████████▌ | 1041/1208 [30:09<04:50,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00207, train/loss_step=0.337, global_step=8716.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  86%|████████▋ | 1042/1208 [30:10<04:48,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.337, train/loss_vlb_step=0.00207, train/loss_step=0.337, global_step=8716.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  86%|████████▋ | 1042/1208 [30:10<04:48,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000768, train/loss_step=0.203, global_step=8716.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  86%|████████▋ | 1043/1208 [30:11<04:46,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000768, train/loss_step=0.203, global_step=8716.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  86%|████████▋ | 1043/1208 [30:11<04:46,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00155, train/loss_step=0.349, global_step=8716.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  86%|████████▋ | 1044/1208 [30:14<04:45,  1.74s/it, loss=0.152, v_num=0, train/loss_simple_step=0.349, train/loss_vlb_step=0.00155, train/loss_step=0.349, global_step=8716.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  86%|████████▋ | 1044/1208 [30:14<04:45,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00354, train/loss_vlb_step=1.93e-5, train/loss_step=0.00354, global_step=8716.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  87%|████████▋ | 1045/1208 [30:15<04:43,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00354, train/loss_vlb_step=1.93e-5, train/loss_step=0.00354, global_step=8716.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  87%|████████▋ | 1045/1208 [30:15<04:43,  1.74s/it, loss=0.161, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00212, train/loss_step=0.373, global_step=8717.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  87%|████████▋ | 1046/1208 [30:17<04:41,  1.74s/it, loss=0.161, v_num=0, train/loss_simple_step=0.373, train/loss_vlb_step=0.00212, train/loss_step=0.373, global_step=8717.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  87%|████████▋ | 1046/1208 [30:17<04:41,  1.74s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=7.06e-5, train/loss_step=0.0157, global_step=8717.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  87%|████████▋ | 1047/1208 [30:18<04:39,  1.74s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=7.06e-5, train/loss_step=0.0157, global_step=8717.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  87%|████████▋ | 1047/1208 [30:18<04:39,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000387, train/loss_step=0.117, global_step=8717.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  87%|████████▋ | 1048/1208 [30:21<04:38,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000387, train/loss_step=0.117, global_step=8717.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  87%|████████▋ | 1048/1208 [30:21<04:38,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00109, train/loss_step=0.249, global_step=8717.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  87%|████████▋ | 1049/1208 [30:22<04:36,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.249, train/loss_vlb_step=0.00109, train/loss_step=0.249, global_step=8717.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  87%|████████▋ | 1049/1208 [30:22<04:36,  1.74s/it, loss=0.15, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000525, train/loss_step=0.152, global_step=8718.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  87%|████████▋ | 1050/1208 [30:23<04:34,  1.74s/it, loss=0.15, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000525, train/loss_step=0.152, global_step=8718.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  87%|████████▋ | 1050/1208 [30:23<04:34,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00402, train/loss_step=0.458, global_step=8718.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  87%|████████▋ | 1051/1208 [30:24<04:32,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.458, train/loss_vlb_step=0.00402, train/loss_step=0.458, global_step=8718.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  87%|████████▋ | 1051/1208 [30:24<04:32,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000361, train/loss_step=0.110, global_step=8718.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  87%|████████▋ | 1052/1208 [30:27<04:31,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000361, train/loss_step=0.110, global_step=8718.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  87%|████████▋ | 1052/1208 [30:27<04:31,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.445, train/loss_vlb_step=0.00331, train/loss_step=0.445, global_step=8718.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  87%|████████▋ | 1053/1208 [30:28<04:29,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.445, train/loss_vlb_step=0.00331, train/loss_step=0.445, global_step=8718.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  87%|████████▋ | 1053/1208 [30:28<04:29,  1.74s/it, loss=0.184, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000361, train/loss_step=0.110, global_step=8719.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  87%|████████▋ | 1054/1208 [30:29<04:27,  1.74s/it, loss=0.184, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000361, train/loss_step=0.110, global_step=8719.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  87%|████████▋ | 1054/1208 [30:29<04:27,  1.74s/it, loss=0.191, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00102, train/loss_step=0.247, global_step=8719.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  87%|████████▋ | 1055/1208 [30:30<04:25,  1.74s/it, loss=0.191, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.00102, train/loss_step=0.247, global_step=8719.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  87%|████████▋ | 1055/1208 [30:30<04:25,  1.74s/it, loss=0.199, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.00055, train/loss_step=0.163, global_step=8719.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  87%|████████▋ | 1056/1208 [30:34<04:24,  1.74s/it, loss=0.199, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.00055, train/loss_step=0.163, global_step=8719.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  87%|████████▋ | 1056/1208 [30:34<04:24,  1.74s/it, loss=0.208, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000794, train/loss_step=0.208, global_step=8719.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  88%|████████▊ | 1057/1208 [30:35<04:22,  1.74s/it, loss=0.208, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.000794, train/loss_step=0.208, global_step=8719.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  88%|████████▊ | 1057/1208 [30:35<04:22,  1.74s/it, loss=0.208, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.29e-5, train/loss_step=0.00222, global_step=8720.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  88%|████████▊ | 1058/1208 [30:36<04:20,  1.74s/it, loss=0.208, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.29e-5, train/loss_step=0.00222, global_step=8720.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  88%|████████▊ | 1058/1208 [30:36<04:20,  1.74s/it, loss=0.191, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=8720.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  88%|████████▊ | 1059/1208 [30:37<04:18,  1.74s/it, loss=0.191, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=8720.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  88%|████████▊ | 1059/1208 [30:37<04:18,  1.74s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00879, train/loss_vlb_step=4.16e-5, train/loss_step=0.00879, global_step=8720.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  88%|████████▊ | 1060/1208 [30:40<04:17,  1.74s/it, loss=0.183, v_num=0, train/loss_simple_step=0.00879, train/loss_vlb_step=4.16e-5, train/loss_step=0.00879, global_step=8720.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  88%|████████▊ | 1060/1208 [30:40<04:17,  1.74s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0973, train/loss_vlb_step=0.000323, train/loss_step=0.0973, global_step=8720.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  88%|████████▊ | 1061/1208 [30:41<04:15,  1.74s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0973, train/loss_vlb_step=0.000323, train/loss_step=0.0973, global_step=8720.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  88%|████████▊ | 1061/1208 [30:41<04:15,  1.74s/it, loss=0.185, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00148, train/loss_step=0.290, global_step=8721.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  88%|████████▊ | 1062/1208 [30:42<04:13,  1.74s/it, loss=0.185, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00148, train/loss_step=0.290, global_step=8721.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  88%|████████▊ | 1062/1208 [30:42<04:13,  1.74s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000252, train/loss_step=0.0754, global_step=8721.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  88%|████████▊ | 1063/1208 [30:44<04:11,  1.73s/it, loss=0.179, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000252, train/loss_step=0.0754, global_step=8721.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  88%|████████▊ | 1063/1208 [30:44<04:11,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0426, train/loss_vlb_step=0.000154, train/loss_step=0.0426, global_step=8721.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  88%|████████▊ | 1064/1208 [30:47<04:10,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0426, train/loss_vlb_step=0.000154, train/loss_step=0.0426, global_step=8721.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  88%|████████▊ | 1064/1208 [30:47<04:10,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000785, train/loss_step=0.221, global_step=8721.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  88%|████████▊ | 1065/1208 [30:48<04:08,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000785, train/loss_step=0.221, global_step=8721.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  88%|████████▊ | 1065/1208 [30:48<04:08,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.058, train/loss_vlb_step=0.000199, train/loss_step=0.058, global_step=8722.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  88%|████████▊ | 1066/1208 [30:49<04:06,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.058, train/loss_vlb_step=0.000199, train/loss_step=0.058, global_step=8722.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  88%|████████▊ | 1066/1208 [30:49<04:06,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.37e-5, train/loss_step=0.0146, global_step=8722.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  88%|████████▊ | 1067/1208 [30:50<04:04,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.37e-5, train/loss_step=0.0146, global_step=8722.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  88%|████████▊ | 1067/1208 [30:50<04:04,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.000135, train/loss_step=0.0359, global_step=8722.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  88%|████████▊ | 1068/1208 [30:53<04:03,  1.74s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.000135, train/loss_step=0.0359, global_step=8722.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  88%|████████▊ | 1068/1208 [30:53<04:03,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.18e-5, train/loss_step=0.0197, global_step=8722.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  88%|████████▊ | 1069/1208 [30:54<04:01,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.18e-5, train/loss_step=0.0197, global_step=8722.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  88%|████████▊ | 1069/1208 [30:54<04:01,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00948, train/loss_vlb_step=4.39e-5, train/loss_step=0.00948, global_step=8723.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  89%|████████▊ | 1070/1208 [30:56<03:59,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00948, train/loss_vlb_step=4.39e-5, train/loss_step=0.00948, global_step=8723.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  89%|████████▊ | 1070/1208 [30:56<03:59,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00207, train/loss_step=0.363, global_step=8723.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  89%|████████▊ | 1071/1208 [30:57<03:57,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.363, train/loss_vlb_step=0.00207, train/loss_step=0.363, global_step=8723.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  89%|████████▊ | 1071/1208 [30:57<03:57,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0323, train/loss_vlb_step=0.000121, train/loss_step=0.0323, global_step=8723.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  89%|████████▊ | 1072/1208 [31:00<03:56,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0323, train/loss_vlb_step=0.000121, train/loss_step=0.0323, global_step=8723.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  89%|████████▊ | 1072/1208 [31:00<03:56,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000415, train/loss_step=0.126, global_step=8723.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  89%|████████▉ | 1073/1208 [31:01<03:54,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000415, train/loss_step=0.126, global_step=8723.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  89%|████████▉ | 1073/1208 [31:01<03:54,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000516, train/loss_step=0.150, global_step=8724.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  89%|████████▉ | 1074/1208 [31:02<03:52,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.150, train/loss_vlb_step=0.000516, train/loss_step=0.150, global_step=8724.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  89%|████████▉ | 1074/1208 [31:02<03:52,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00179, train/loss_step=0.308, global_step=8724.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  89%|████████▉ | 1075/1208 [31:03<03:50,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00179, train/loss_step=0.308, global_step=8724.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  89%|████████▉ | 1075/1208 [31:03<03:50,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=8724.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  89%|████████▉ | 1076/1208 [31:06<03:49,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000339, train/loss_step=0.103, global_step=8724.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  89%|████████▉ | 1076/1208 [31:06<03:49,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000572, train/loss_step=0.163, global_step=8724.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  89%|████████▉ | 1077/1208 [31:07<03:47,  1.73s/it, loss=0.111, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000572, train/loss_step=0.163, global_step=8724.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  89%|████████▉ | 1077/1208 [31:07<03:47,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00157, train/loss_step=0.329, global_step=8725.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  89%|████████▉ | 1078/1208 [31:09<03:45,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.329, train/loss_vlb_step=0.00157, train/loss_step=0.329, global_step=8725.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  89%|████████▉ | 1078/1208 [31:09<03:45,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0801, train/loss_vlb_step=0.000264, train/loss_step=0.0801, global_step=8725.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  89%|████████▉ | 1079/1208 [31:10<03:43,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0801, train/loss_vlb_step=0.000264, train/loss_step=0.0801, global_step=8725.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  89%|████████▉ | 1079/1208 [31:10<03:43,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.91e-5, train/loss_step=0.0133, global_step=8725.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  89%|████████▉ | 1080/1208 [31:13<03:42,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=5.91e-5, train/loss_step=0.0133, global_step=8725.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  89%|████████▉ | 1080/1208 [31:13<03:42,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=8.63e-5, train/loss_step=0.0217, global_step=8725.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  89%|████████▉ | 1081/1208 [31:14<03:40,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=8.63e-5, train/loss_step=0.0217, global_step=8725.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  89%|████████▉ | 1081/1208 [31:14<03:40,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000407, train/loss_step=0.123, global_step=8726.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  90%|████████▉ | 1082/1208 [31:15<03:38,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.000407, train/loss_step=0.123, global_step=8726.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  90%|████████▉ | 1082/1208 [31:15<03:38,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.55e-5, train/loss_step=0.0188, global_step=8726.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  90%|████████▉ | 1083/1208 [31:16<03:36,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.55e-5, train/loss_step=0.0188, global_step=8726.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  90%|████████▉ | 1083/1208 [31:16<03:36,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00646, train/loss_vlb_step=3.14e-5, train/loss_step=0.00646, global_step=8726.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  90%|████████▉ | 1084/1208 [31:19<03:35,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00646, train/loss_vlb_step=3.14e-5, train/loss_step=0.00646, global_step=8726.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  90%|████████▉ | 1084/1208 [31:19<03:35,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.00055, train/loss_step=0.154, global_step=8726.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  90%|████████▉ | 1085/1208 [31:20<03:33,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.00055, train/loss_step=0.154, global_step=8726.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  90%|████████▉ | 1085/1208 [31:20<03:33,  1.73s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0703, train/loss_vlb_step=0.000243, train/loss_step=0.0703, global_step=8727.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  90%|████████▉ | 1086/1208 [31:22<03:31,  1.73s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0703, train/loss_vlb_step=0.000243, train/loss_step=0.0703, global_step=8727.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  90%|████████▉ | 1086/1208 [31:22<03:31,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000564, train/loss_step=0.163, global_step=8727.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  90%|████████▉ | 1087/1208 [31:23<03:29,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000564, train/loss_step=0.163, global_step=8727.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  90%|████████▉ | 1087/1208 [31:23<03:29,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00974, train/loss_vlb_step=4.43e-5, train/loss_step=0.00974, global_step=8727.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  90%|█████████ | 1088/1208 [31:26<03:28,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00974, train/loss_vlb_step=4.43e-5, train/loss_step=0.00974, global_step=8727.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  90%|█████████ | 1088/1208 [31:26<03:28,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0094, train/loss_vlb_step=4.44e-5, train/loss_step=0.0094, global_step=8727.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  90%|█████████ | 1089/1208 [31:27<03:26,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0094, train/loss_vlb_step=4.44e-5, train/loss_step=0.0094, global_step=8727.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  90%|█████████ | 1089/1208 [31:27<03:26,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000765, train/loss_step=0.204, global_step=8728.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  90%|█████████ | 1090/1208 [31:28<03:24,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000765, train/loss_step=0.204, global_step=8728.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  90%|█████████ | 1090/1208 [31:28<03:24,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=8728.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  90%|█████████ | 1091/1208 [31:29<03:22,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000356, train/loss_step=0.108, global_step=8728.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  90%|█████████ | 1091/1208 [31:29<03:22,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000848, train/loss_step=0.222, global_step=8728.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  90%|█████████ | 1092/1208 [31:32<03:21,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000848, train/loss_step=0.222, global_step=8728.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  90%|█████████ | 1092/1208 [31:32<03:21,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00917, train/loss_vlb_step=4.4e-5, train/loss_step=0.00917, global_step=8728.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  90%|█████████ | 1093/1208 [31:34<03:19,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00917, train/loss_vlb_step=4.4e-5, train/loss_step=0.00917, global_step=8728.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  90%|█████████ | 1093/1208 [31:34<03:19,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.95e-5, train/loss_step=0.0104, global_step=8729.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  91%|█████████ | 1094/1208 [31:35<03:17,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.95e-5, train/loss_step=0.0104, global_step=8729.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  91%|█████████ | 1094/1208 [31:35<03:17,  1.73s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.0083, train/loss_vlb_step=3.87e-5, train/loss_step=0.0083, global_step=8729.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  91%|█████████ | 1095/1208 [31:36<03:15,  1.73s/it, loss=0.0913, v_num=0, train/loss_simple_step=0.0083, train/loss_vlb_step=3.87e-5, train/loss_step=0.0083, global_step=8729.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  91%|█████████ | 1095/1208 [31:36<03:15,  1.73s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000918, train/loss_step=0.235, global_step=8729.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  91%|█████████ | 1096/1208 [31:39<03:14,  1.73s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000918, train/loss_step=0.235, global_step=8729.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  91%|█████████ | 1096/1208 [31:39<03:14,  1.73s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000473, train/loss_step=0.140, global_step=8729.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  91%|█████████ | 1097/1208 [31:40<03:12,  1.73s/it, loss=0.0967, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000473, train/loss_step=0.140, global_step=8729.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  91%|█████████ | 1097/1208 [31:40<03:12,  1.73s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00234, train/loss_step=0.364, global_step=8730.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  91%|█████████ | 1098/1208 [31:41<03:10,  1.73s/it, loss=0.0985, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00234, train/loss_step=0.364, global_step=8730.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  91%|█████████ | 1098/1208 [31:41<03:10,  1.73s/it, loss=0.097, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.000184, train/loss_step=0.0499, global_step=8730.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  91%|█████████ | 1099/1208 [31:42<03:08,  1.73s/it, loss=0.097, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.000184, train/loss_step=0.0499, global_step=8730.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  91%|█████████ | 1099/1208 [31:42<03:08,  1.73s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.00479, train/loss_vlb_step=2.4e-5, train/loss_step=0.00479, global_step=8730.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  91%|█████████ | 1100/1208 [31:45<03:07,  1.73s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.00479, train/loss_vlb_step=2.4e-5, train/loss_step=0.00479, global_step=8730.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  91%|█████████ | 1100/1208 [31:45<03:07,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000488, train/loss_step=0.142, global_step=8730.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  91%|█████████ | 1101/1208 [31:46<03:05,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000488, train/loss_step=0.142, global_step=8730.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  91%|█████████ | 1101/1208 [31:46<03:05,  1.73s/it, loss=0.102, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000354, train/loss_step=0.107, global_step=8731.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  91%|█████████ | 1102/1208 [31:48<03:03,  1.73s/it, loss=0.102, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000354, train/loss_step=0.107, global_step=8731.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  91%|█████████ | 1102/1208 [31:48<03:03,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000584, train/loss_step=0.176, global_step=8731.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  91%|█████████▏| 1103/1208 [31:49<03:01,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000584, train/loss_step=0.176, global_step=8731.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  91%|█████████▏| 1103/1208 [31:49<03:01,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.14e-5, train/loss_step=0.0155, global_step=8731.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  91%|█████████▏| 1104/1208 [31:52<03:00,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.14e-5, train/loss_step=0.0155, global_step=8731.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  91%|█████████▏| 1104/1208 [31:52<03:00,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0689, train/loss_vlb_step=0.000227, train/loss_step=0.0689, global_step=8731.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  91%|█████████▏| 1105/1208 [31:53<02:58,  1.73s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0689, train/loss_vlb_step=0.000227, train/loss_step=0.0689, global_step=8731.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  91%|█████████▏| 1105/1208 [31:53<02:58,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00785, train/loss_vlb_step=3.56e-5, train/loss_step=0.00785, global_step=8732.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  92%|█████████▏| 1106/1208 [31:54<02:56,  1.73s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00785, train/loss_vlb_step=3.56e-5, train/loss_step=0.00785, global_step=8732.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  92%|█████████▏| 1106/1208 [31:54<02:56,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.926, train/loss_vlb_step=0.466, train/loss_step=0.926, global_step=8732.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]      Epoch 28:  92%|█████████▏| 1107/1208 [31:55<02:54,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.926, train/loss_vlb_step=0.466, train/loss_step=0.926, global_step=8732.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  92%|█████████▏| 1107/1208 [31:55<02:54,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00139, train/loss_step=0.292, global_step=8732.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  92%|█████████▏| 1108/1208 [31:58<02:53,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00139, train/loss_step=0.292, global_step=8732.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  92%|█████████▏| 1108/1208 [31:58<02:53,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00524, train/loss_vlb_step=2.71e-5, train/loss_step=0.00524, global_step=8732.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  92%|█████████▏| 1109/1208 [32:00<02:51,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.00524, train/loss_vlb_step=2.71e-5, train/loss_step=0.00524, global_step=8732.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  92%|█████████▏| 1109/1208 [32:00<02:51,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000155, train/loss_step=0.0445, global_step=8733.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  92%|█████████▏| 1110/1208 [32:01<02:49,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000155, train/loss_step=0.0445, global_step=8733.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  92%|█████████▏| 1110/1208 [32:01<02:49,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=1.72e-5, train/loss_step=0.00302, global_step=8733.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  92%|█████████▏| 1111/1208 [32:02<02:47,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=1.72e-5, train/loss_step=0.00302, global_step=8733.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  92%|█████████▏| 1111/1208 [32:02<02:47,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000593, train/loss_step=0.170, global_step=8733.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  92%|█████████▏| 1112/1208 [32:05<02:46,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000593, train/loss_step=0.170, global_step=8733.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  92%|█████████▏| 1112/1208 [32:05<02:46,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.0016, train/loss_step=0.302, global_step=8733.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  92%|█████████▏| 1113/1208 [32:06<02:44,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.302, train/loss_vlb_step=0.0016, train/loss_step=0.302, global_step=8733.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  92%|█████████▏| 1113/1208 [32:06<02:44,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000568, train/loss_step=0.169, global_step=8734.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  92%|█████████▏| 1114/1208 [32:07<02:42,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000568, train/loss_step=0.169, global_step=8734.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  92%|█████████▏| 1114/1208 [32:07<02:42,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=1.99e-5, train/loss_step=0.00365, global_step=8734.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  92%|█████████▏| 1115/1208 [32:08<02:40,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=1.99e-5, train/loss_step=0.00365, global_step=8734.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  92%|█████████▏| 1115/1208 [32:08<02:40,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000139, train/loss_step=0.0365, global_step=8734.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  92%|█████████▏| 1116/1208 [32:12<02:39,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000139, train/loss_step=0.0365, global_step=8734.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  92%|█████████▏| 1116/1208 [32:12<02:39,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0701, train/loss_vlb_step=0.000237, train/loss_step=0.0701, global_step=8734.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  92%|█████████▏| 1117/1208 [32:13<02:37,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0701, train/loss_vlb_step=0.000237, train/loss_step=0.0701, global_step=8734.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  92%|█████████▏| 1117/1208 [32:13<02:37,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00514, train/loss_vlb_step=2.64e-5, train/loss_step=0.00514, global_step=8735.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  93%|█████████▎| 1118/1208 [32:14<02:35,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00514, train/loss_vlb_step=2.64e-5, train/loss_step=0.00514, global_step=8735.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  93%|█████████▎| 1118/1208 [32:14<02:35,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00883, train/loss_vlb_step=4.09e-5, train/loss_step=0.00883, global_step=8735.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  93%|█████████▎| 1119/1208 [32:15<02:33,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00883, train/loss_vlb_step=4.09e-5, train/loss_step=0.00883, global_step=8735.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  93%|█████████▎| 1119/1208 [32:15<02:33,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.00077, train/loss_step=0.208, global_step=8735.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  93%|█████████▎| 1120/1208 [32:18<02:32,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.208, train/loss_vlb_step=0.00077, train/loss_step=0.208, global_step=8735.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  93%|█████████▎| 1120/1208 [32:18<02:32,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0576, train/loss_vlb_step=0.000197, train/loss_step=0.0576, global_step=8735.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  93%|█████████▎| 1121/1208 [32:19<02:30,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0576, train/loss_vlb_step=0.000197, train/loss_step=0.0576, global_step=8735.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  93%|█████████▎| 1121/1208 [32:19<02:30,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000869, train/loss_step=0.217, global_step=8736.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  93%|█████████▎| 1122/1208 [32:20<02:28,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000869, train/loss_step=0.217, global_step=8736.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  93%|█████████▎| 1122/1208 [32:20<02:28,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.506, train/loss_vlb_step=0.00672, train/loss_step=0.506, global_step=8736.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  93%|█████████▎| 1123/1208 [32:21<02:26,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.506, train/loss_vlb_step=0.00672, train/loss_step=0.506, global_step=8736.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  93%|█████████▎| 1123/1208 [32:21<02:26,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0867, train/loss_vlb_step=0.000286, train/loss_step=0.0867, global_step=8736.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  93%|█████████▎| 1124/1208 [32:24<02:25,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0867, train/loss_vlb_step=0.000286, train/loss_step=0.0867, global_step=8736.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  93%|█████████▎| 1124/1208 [32:24<02:25,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00961, train/loss_vlb_step=4.63e-5, train/loss_step=0.00961, global_step=8736.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  93%|█████████▎| 1125/1208 [32:26<02:23,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00961, train/loss_vlb_step=4.63e-5, train/loss_step=0.00961, global_step=8736.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  93%|█████████▎| 1125/1208 [32:26<02:23,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.000141, train/loss_step=0.0393, global_step=8737.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  93%|█████████▎| 1126/1208 [32:27<02:21,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.000141, train/loss_step=0.0393, global_step=8737.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  93%|█████████▎| 1126/1208 [32:27<02:21,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000183, train/loss_step=0.051, global_step=8737.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  93%|█████████▎| 1127/1208 [32:28<02:20,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.051, train/loss_vlb_step=0.000183, train/loss_step=0.051, global_step=8737.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  93%|█████████▎| 1127/1208 [32:28<02:20,  1.73s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.00415, train/loss_vlb_step=2.3e-5, train/loss_step=0.00415, global_step=8737.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  93%|█████████▎| 1128/1208 [32:31<02:18,  1.73s/it, loss=0.0998, v_num=0, train/loss_simple_step=0.00415, train/loss_vlb_step=2.3e-5, train/loss_step=0.00415, global_step=8737.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  93%|█████████▎| 1128/1208 [32:31<02:18,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000113, train/loss_step=0.0296, global_step=8737.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  93%|█████████▎| 1129/1208 [32:32<02:16,  1.73s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000113, train/loss_step=0.0296, global_step=8737.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  93%|█████████▎| 1129/1208 [32:32<02:16,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000727, train/loss_step=0.202, global_step=8738.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  94%|█████████▎| 1130/1208 [32:33<02:14,  1.73s/it, loss=0.109, v_num=0, train/loss_simple_step=0.202, train/loss_vlb_step=0.000727, train/loss_step=0.202, global_step=8738.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  94%|█████████▎| 1130/1208 [32:33<02:14,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0699, train/loss_vlb_step=0.000236, train/loss_step=0.0699, global_step=8738.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  94%|█████████▎| 1131/1208 [32:34<02:13,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0699, train/loss_vlb_step=0.000236, train/loss_step=0.0699, global_step=8738.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  94%|█████████▎| 1131/1208 [32:34<02:13,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0864, train/loss_vlb_step=0.000285, train/loss_step=0.0864, global_step=8738.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  94%|█████████▎| 1132/1208 [32:37<02:11,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0864, train/loss_vlb_step=0.000285, train/loss_step=0.0864, global_step=8738.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  94%|█████████▎| 1132/1208 [32:37<02:11,  1.73s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.0923, train/loss_vlb_step=0.000304, train/loss_step=0.0923, global_step=8738.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  94%|█████████▍| 1133/1208 [32:39<02:09,  1.73s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.0923, train/loss_vlb_step=0.000304, train/loss_step=0.0923, global_step=8738.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  94%|█████████▍| 1133/1208 [32:39<02:09,  1.73s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000156, train/loss_step=0.0445, global_step=8739.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  94%|█████████▍| 1134/1208 [32:40<02:07,  1.73s/it, loss=0.0914, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000156, train/loss_step=0.0445, global_step=8739.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  94%|█████████▍| 1134/1208 [32:40<02:07,  1.73s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.00787, train/loss_vlb_step=4.02e-5, train/loss_step=0.00787, global_step=8739.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  94%|█████████▍| 1135/1208 [32:41<02:06,  1.73s/it, loss=0.0916, v_num=0, train/loss_simple_step=0.00787, train/loss_vlb_step=4.02e-5, train/loss_step=0.00787, global_step=8739.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  94%|█████████▍| 1135/1208 [32:41<02:06,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00299, train/loss_step=0.398, global_step=8739.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]      Epoch 28:  94%|█████████▍| 1136/1208 [32:44<02:04,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.398, train/loss_vlb_step=0.00299, train/loss_step=0.398, global_step=8739.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  94%|█████████▍| 1136/1208 [32:44<02:04,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000121, train/loss_step=0.0336, global_step=8739.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  94%|█████████▍| 1137/1208 [32:45<02:02,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000121, train/loss_step=0.0336, global_step=8739.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  94%|█████████▍| 1137/1208 [32:45<02:02,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.576, train/loss_vlb_step=0.0109, train/loss_step=0.576, global_step=8740.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  94%|█████████▍| 1138/1208 [32:46<02:00,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.576, train/loss_vlb_step=0.0109, train/loss_step=0.576, global_step=8740.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  94%|█████████▍| 1138/1208 [32:46<02:00,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.030, train/loss_vlb_step=0.00012, train/loss_step=0.030, global_step=8740.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  94%|█████████▍| 1139/1208 [32:47<01:59,  1.73s/it, loss=0.137, v_num=0, train/loss_simple_step=0.030, train/loss_vlb_step=0.00012, train/loss_step=0.030, global_step=8740.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  94%|█████████▍| 1139/1208 [32:47<01:59,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00272, train/loss_step=0.405, global_step=8740.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  94%|█████████▍| 1140/1208 [32:51<01:57,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00272, train/loss_step=0.405, global_step=8740.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  94%|█████████▍| 1140/1208 [32:51<01:57,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0662, train/loss_vlb_step=0.000226, train/loss_step=0.0662, global_step=8740.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  94%|█████████▍| 1141/1208 [32:52<01:55,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.0662, train/loss_vlb_step=0.000226, train/loss_step=0.0662, global_step=8740.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  94%|█████████▍| 1141/1208 [32:52<01:55,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0959, train/loss_vlb_step=0.000315, train/loss_step=0.0959, global_step=8741.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  95%|█████████▍| 1142/1208 [32:53<01:54,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0959, train/loss_vlb_step=0.000315, train/loss_step=0.0959, global_step=8741.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  95%|█████████▍| 1142/1208 [32:53<01:54,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.00053, train/loss_step=0.156, global_step=8741.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  95%|█████████▍| 1143/1208 [32:54<01:52,  1.73s/it, loss=0.124, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.00053, train/loss_step=0.156, global_step=8741.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  95%|█████████▍| 1143/1208 [32:54<01:52,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000374, train/loss_step=0.114, global_step=8741.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  95%|█████████▍| 1144/1208 [32:57<01:50,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000374, train/loss_step=0.114, global_step=8741.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  95%|█████████▍| 1144/1208 [32:57<01:50,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00136, train/loss_step=0.292, global_step=8741.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  95%|█████████▍| 1145/1208 [32:58<01:48,  1.73s/it, loss=0.14, v_num=0, train/loss_simple_step=0.292, train/loss_vlb_step=0.00136, train/loss_step=0.292, global_step=8741.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  95%|█████████▍| 1145/1208 [32:58<01:48,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0875, train/loss_vlb_step=0.000288, train/loss_step=0.0875, global_step=8742.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  95%|█████████▍| 1146/1208 [32:59<01:47,  1.73s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0875, train/loss_vlb_step=0.000288, train/loss_step=0.0875, global_step=8742.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  95%|█████████▍| 1146/1208 [32:59<01:47,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.00067, train/loss_step=0.186, global_step=8742.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  95%|█████████▍| 1147/1208 [33:00<01:45,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.00067, train/loss_step=0.186, global_step=8742.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  95%|█████████▍| 1147/1208 [33:00<01:45,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=8742.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  95%|█████████▌| 1148/1208 [33:03<01:43,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000353, train/loss_step=0.107, global_step=8742.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  95%|█████████▌| 1148/1208 [33:03<01:43,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0472, train/loss_vlb_step=0.000171, train/loss_step=0.0472, global_step=8742.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  95%|█████████▌| 1149/1208 [33:04<01:41,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0472, train/loss_vlb_step=0.000171, train/loss_step=0.0472, global_step=8742.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  95%|█████████▌| 1149/1208 [33:04<01:41,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000633, train/loss_step=0.174, global_step=8743.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  95%|█████████▌| 1150/1208 [33:05<01:40,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000633, train/loss_step=0.174, global_step=8743.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  95%|█████████▌| 1150/1208 [33:05<01:40,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000949, train/loss_step=0.235, global_step=8743.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  95%|█████████▌| 1151/1208 [33:07<01:38,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000949, train/loss_step=0.235, global_step=8743.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  95%|█████████▌| 1151/1208 [33:07<01:38,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0774, train/loss_vlb_step=0.000257, train/loss_step=0.0774, global_step=8743.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  95%|█████████▌| 1152/1208 [33:10<01:36,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0774, train/loss_vlb_step=0.000257, train/loss_step=0.0774, global_step=8743.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  95%|█████████▌| 1152/1208 [33:10<01:36,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00726, train/loss_vlb_step=3.59e-5, train/loss_step=0.00726, global_step=8743.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  95%|█████████▌| 1153/1208 [33:11<01:34,  1.73s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00726, train/loss_vlb_step=3.59e-5, train/loss_step=0.00726, global_step=8743.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  95%|█████████▌| 1153/1208 [33:11<01:34,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00544, train/loss_step=0.499, global_step=8744.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]     Epoch 28:  96%|█████████▌| 1154/1208 [33:12<01:33,  1.73s/it, loss=0.18, v_num=0, train/loss_simple_step=0.499, train/loss_vlb_step=0.00544, train/loss_step=0.499, global_step=8744.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  96%|█████████▌| 1154/1208 [33:12<01:33,  1.73s/it, loss=0.209, v_num=0, train/loss_simple_step=0.599, train/loss_vlb_step=0.0153, train/loss_step=0.599, global_step=8744.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  96%|█████████▌| 1155/1208 [33:13<01:31,  1.73s/it, loss=0.209, v_num=0, train/loss_simple_step=0.599, train/loss_vlb_step=0.0153, train/loss_step=0.599, global_step=8744.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  96%|█████████▌| 1155/1208 [33:13<01:31,  1.73s/it, loss=0.199, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000644, train/loss_step=0.184, global_step=8744.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  96%|█████████▌| 1156/1208 [33:16<01:29,  1.73s/it, loss=0.199, v_num=0, train/loss_simple_step=0.184, train/loss_vlb_step=0.000644, train/loss_step=0.184, global_step=8744.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  96%|█████████▌| 1156/1208 [33:16<01:29,  1.73s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=1.13e-5, train/loss_step=0.00196, global_step=8744.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  96%|█████████▌| 1157/1208 [33:17<01:28,  1.73s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=1.13e-5, train/loss_step=0.00196, global_step=8744.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  96%|█████████▌| 1157/1208 [33:17<01:28,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0544, train/loss_vlb_step=0.000185, train/loss_step=0.0544, global_step=8745.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  96%|█████████▌| 1158/1208 [33:18<01:26,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0544, train/loss_vlb_step=0.000185, train/loss_step=0.0544, global_step=8745.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  96%|█████████▌| 1158/1208 [33:18<01:26,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.22e-5, train/loss_step=0.00203, global_step=8745.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  96%|█████████▌| 1159/1208 [33:20<01:24,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.22e-5, train/loss_step=0.00203, global_step=8745.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  96%|█████████▌| 1159/1208 [33:20<01:24,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00133, train/loss_step=0.274, global_step=8745.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  96%|█████████▌| 1160/1208 [33:23<01:22,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00133, train/loss_step=0.274, global_step=8745.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  96%|█████████▌| 1160/1208 [33:23<01:22,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000707, train/loss_step=0.198, global_step=8745.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  96%|█████████▌| 1161/1208 [33:24<01:21,  1.73s/it, loss=0.17, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000707, train/loss_step=0.198, global_step=8745.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  96%|█████████▌| 1161/1208 [33:24<01:21,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00575, train/loss_vlb_step=2.98e-5, train/loss_step=0.00575, global_step=8746.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  96%|█████████▌| 1162/1208 [33:25<01:19,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00575, train/loss_vlb_step=2.98e-5, train/loss_step=0.00575, global_step=8746.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  96%|█████████▌| 1162/1208 [33:25<01:19,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.00564, train/loss_step=0.485, global_step=8746.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  96%|█████████▋| 1163/1208 [33:26<01:17,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.00564, train/loss_step=0.485, global_step=8746.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  96%|█████████▋| 1163/1208 [33:26<01:17,  1.73s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.38e-5, train/loss_step=0.0124, global_step=8746.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  96%|█████████▋| 1164/1208 [33:29<01:15,  1.73s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.38e-5, train/loss_step=0.0124, global_step=8746.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  96%|█████████▋| 1164/1208 [33:29<01:15,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00674, train/loss_vlb_step=3.22e-5, train/loss_step=0.00674, global_step=8746.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  96%|█████████▋| 1165/1208 [33:30<01:14,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00674, train/loss_vlb_step=3.22e-5, train/loss_step=0.00674, global_step=8746.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  96%|█████████▋| 1165/1208 [33:30<01:14,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=2.21e-5, train/loss_step=0.00416, global_step=8747.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  97%|█████████▋| 1166/1208 [33:31<01:12,  1.73s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=2.21e-5, train/loss_step=0.00416, global_step=8747.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  97%|█████████▋| 1166/1208 [33:31<01:12,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00539, train/loss_vlb_step=2.73e-5, train/loss_step=0.00539, global_step=8747.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  97%|█████████▋| 1167/1208 [33:32<01:10,  1.72s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00539, train/loss_vlb_step=2.73e-5, train/loss_step=0.00539, global_step=8747.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  97%|█████████▋| 1167/1208 [33:32<01:10,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0065, train/loss_vlb_step=3.31e-5, train/loss_step=0.0065, global_step=8747.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  97%|█████████▋| 1168/1208 [33:36<01:09,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0065, train/loss_vlb_step=3.31e-5, train/loss_step=0.0065, global_step=8747.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  97%|█████████▋| 1168/1208 [33:36<01:09,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000523, train/loss_step=0.156, global_step=8747.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  97%|█████████▋| 1169/1208 [33:37<01:07,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000523, train/loss_step=0.156, global_step=8747.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  97%|█████████▋| 1169/1208 [33:37<01:07,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0699, train/loss_vlb_step=0.00024, train/loss_step=0.0699, global_step=8748.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  97%|█████████▋| 1170/1208 [33:38<01:05,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0699, train/loss_vlb_step=0.00024, train/loss_step=0.0699, global_step=8748.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  97%|█████████▋| 1170/1208 [33:38<01:05,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000444, train/loss_step=0.135, global_step=8748.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  97%|█████████▋| 1171/1208 [33:39<01:03,  1.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000444, train/loss_step=0.135, global_step=8748.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  97%|█████████▋| 1171/1208 [33:39<01:03,  1.72s/it, loss=0.151, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00144, train/loss_step=0.318, global_step=8748.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  97%|█████████▋| 1172/1208 [33:42<01:02,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00144, train/loss_step=0.318, global_step=8748.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  97%|█████████▋| 1172/1208 [33:42<01:02,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000101, train/loss_step=0.0288, global_step=8748.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  97%|█████████▋| 1173/1208 [33:43<01:00,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000101, train/loss_step=0.0288, global_step=8748.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  97%|█████████▋| 1173/1208 [33:43<01:00,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.0019, train/loss_step=0.326, global_step=8749.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  97%|█████████▋| 1174/1208 [33:44<00:58,  1.72s/it, loss=0.144, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.0019, train/loss_step=0.326, global_step=8749.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  97%|█████████▋| 1174/1208 [33:44<00:58,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000523, train/loss_step=0.151, global_step=8749.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  97%|█████████▋| 1175/1208 [33:45<00:56,  1.72s/it, loss=0.121, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000523, train/loss_step=0.151, global_step=8749.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  97%|█████████▋| 1175/1208 [33:45<00:56,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=9e-6, train/loss_step=0.0015, global_step=8749.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  97%|█████████▋| 1176/1208 [33:49<00:55,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=9e-6, train/loss_step=0.0015, global_step=8749.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  97%|█████████▋| 1176/1208 [33:49<00:55,  1.73s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=1.38e-5, train/loss_step=0.00232, global_step=8749.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  97%|█████████▋| 1177/1208 [33:50<00:53,  1.72s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=1.38e-5, train/loss_step=0.00232, global_step=8749.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  97%|█████████▋| 1177/1208 [33:50<00:53,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000101, train/loss_step=0.0262, global_step=8750.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  98%|█████████▊| 1178/1208 [33:51<00:51,  1.72s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000101, train/loss_step=0.0262, global_step=8750.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  98%|█████████▊| 1178/1208 [33:51<00:51,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000495, train/loss_step=0.142, global_step=8750.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  98%|█████████▊| 1179/1208 [33:52<00:49,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.142, train/loss_vlb_step=0.000495, train/loss_step=0.142, global_step=8750.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  98%|█████████▊| 1179/1208 [33:52<00:49,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=1.42e-5, train/loss_step=0.00239, global_step=8750.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  98%|█████████▊| 1180/1208 [33:55<00:48,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=1.42e-5, train/loss_step=0.00239, global_step=8750.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  98%|█████████▊| 1180/1208 [33:55<00:48,  1.72s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000201, train/loss_step=0.0588, global_step=8750.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  98%|█████████▊| 1181/1208 [33:56<00:46,  1.72s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.000201, train/loss_step=0.0588, global_step=8750.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  98%|█████████▊| 1181/1208 [33:56<00:46,  1.72s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.28e-5, train/loss_step=0.0241, global_step=8751.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  98%|█████████▊| 1182/1208 [33:57<00:44,  1.72s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.28e-5, train/loss_step=0.0241, global_step=8751.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  98%|█████████▊| 1182/1208 [33:57<00:44,  1.72s/it, loss=0.0746, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.75e-5, train/loss_step=0.0156, global_step=8751.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  98%|█████████▊| 1183/1208 [33:58<00:43,  1.72s/it, loss=0.0746, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.75e-5, train/loss_step=0.0156, global_step=8751.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  98%|█████████▊| 1183/1208 [33:58<00:43,  1.72s/it, loss=0.087, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.0011, train/loss_step=0.261, global_step=8751.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]    Epoch 28:  98%|█████████▊| 1184/1208 [34:01<00:41,  1.72s/it, loss=0.087, v_num=0, train/loss_simple_step=0.261, train/loss_vlb_step=0.0011, train/loss_step=0.261, global_step=8751.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  98%|█████████▊| 1184/1208 [34:01<00:41,  1.72s/it, loss=0.0874, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.28e-5, train/loss_step=0.0146, global_step=8751.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  98%|█████████▊| 1185/1208 [34:02<00:39,  1.72s/it, loss=0.0874, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.28e-5, train/loss_step=0.0146, global_step=8751.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  98%|█████████▊| 1185/1208 [34:02<00:39,  1.72s/it, loss=0.099, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000866, train/loss_step=0.236, global_step=8752.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  98%|█████████▊| 1186/1208 [34:04<00:37,  1.72s/it, loss=0.099, v_num=0, train/loss_simple_step=0.236, train/loss_vlb_step=0.000866, train/loss_step=0.236, global_step=8752.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  98%|█████████▊| 1186/1208 [34:04<00:37,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0957, train/loss_vlb_step=0.000314, train/loss_step=0.0957, global_step=8752.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  98%|█████████▊| 1187/1208 [34:05<00:36,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0957, train/loss_vlb_step=0.000314, train/loss_step=0.0957, global_step=8752.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  98%|█████████▊| 1187/1208 [34:05<00:36,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.28e-5, train/loss_step=0.0115, global_step=8752.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  98%|█████████▊| 1188/1208 [34:08<00:34,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.28e-5, train/loss_step=0.0115, global_step=8752.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  98%|█████████▊| 1188/1208 [34:08<00:34,  1.72s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=9.2e-6, train/loss_step=0.00151, global_step=8752.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  98%|█████████▊| 1189/1208 [34:09<00:32,  1.72s/it, loss=0.0961, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=9.2e-6, train/loss_step=0.00151, global_step=8752.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  98%|█████████▊| 1189/1208 [34:09<00:32,  1.72s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=9.09e-5, train/loss_step=0.0219, global_step=8753.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  99%|█████████▊| 1190/1208 [34:10<00:31,  1.72s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=9.09e-5, train/loss_step=0.0219, global_step=8753.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  99%|█████████▊| 1190/1208 [34:10<00:31,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00245, train/loss_step=0.391, global_step=8753.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28:  99%|█████████▊| 1191/1208 [34:11<00:29,  1.72s/it, loss=0.106, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00245, train/loss_step=0.391, global_step=8753.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  99%|█████████▊| 1191/1208 [34:11<00:29,  1.72s/it, loss=0.0907, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=1.34e-5, train/loss_step=0.00231, global_step=8753.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  99%|█████████▊| 1192/1208 [34:14<00:27,  1.72s/it, loss=0.0907, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=1.34e-5, train/loss_step=0.00231, global_step=8753.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  99%|█████████▊| 1192/1208 [34:14<00:27,  1.72s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.0845, train/loss_vlb_step=0.00028, train/loss_step=0.0845, global_step=8753.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  99%|█████████▉| 1193/1208 [34:15<00:25,  1.72s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.0845, train/loss_vlb_step=0.00028, train/loss_step=0.0845, global_step=8753.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  99%|█████████▉| 1193/1208 [34:15<00:25,  1.72s/it, loss=0.0778, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.35e-5, train/loss_step=0.0117, global_step=8754.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  99%|█████████▉| 1194/1208 [34:16<00:24,  1.72s/it, loss=0.0778, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.35e-5, train/loss_step=0.0117, global_step=8754.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  99%|█████████▉| 1194/1208 [34:16<00:24,  1.72s/it, loss=0.075, v_num=0, train/loss_simple_step=0.0956, train/loss_vlb_step=0.000316, train/loss_step=0.0956, global_step=8754.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  99%|█████████▉| 1195/1208 [34:17<00:22,  1.72s/it, loss=0.075, v_num=0, train/loss_simple_step=0.0956, train/loss_vlb_step=0.000316, train/loss_step=0.0956, global_step=8754.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  99%|█████████▉| 1195/1208 [34:17<00:22,  1.72s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00126, train/loss_step=0.267, global_step=8754.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28:  99%|█████████▉| 1196/1208 [34:21<00:20,  1.72s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00126, train/loss_step=0.267, global_step=8754.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  99%|█████████▉| 1196/1208 [34:21<00:20,  1.72s/it, loss=0.0886, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.88e-5, train/loss_step=0.0103, global_step=8754.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  99%|█████████▉| 1197/1208 [34:22<00:18,  1.72s/it, loss=0.0886, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.88e-5, train/loss_step=0.0103, global_step=8754.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  99%|█████████▉| 1197/1208 [34:22<00:18,  1.72s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=8755.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  99%|█████████▉| 1198/1208 [34:23<00:17,  1.72s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000336, train/loss_step=0.102, global_step=8755.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  99%|█████████▉| 1198/1208 [34:23<00:17,  1.72s/it, loss=0.0881, v_num=0, train/loss_simple_step=0.0547, train/loss_vlb_step=0.000189, train/loss_step=0.0547, global_step=8755.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  99%|█████████▉| 1199/1208 [34:24<00:15,  1.72s/it, loss=0.0881, v_num=0, train/loss_simple_step=0.0547, train/loss_vlb_step=0.000189, train/loss_step=0.0547, global_step=8755.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  99%|█████████▉| 1199/1208 [34:24<00:15,  1.72s/it, loss=0.0883, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=3.53e-5, train/loss_step=0.0072, global_step=8755.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28:  99%|█████████▉| 1200/1208 [34:27<00:13,  1.72s/it, loss=0.0883, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=3.53e-5, train/loss_step=0.0072, global_step=8755.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  99%|█████████▉| 1200/1208 [34:27<00:13,  1.72s/it, loss=0.104, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00215, train/loss_step=0.377, global_step=8755.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.77it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.76it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.70it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.78it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.75it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:28,  1.67it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.73it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:28,  1.66it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.69it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.81it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.76it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:27,  1.69it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:27,  1.67it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.80it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.75it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:26,  1.71it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:26,  1.69it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.77it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.73it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.71it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.79it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.76it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.73it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.72it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.73it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.74it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.74it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.74it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.74it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.74it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.76it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.74it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.75it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.74it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.76it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.74it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.78it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.76it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.74it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.76it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:20,  1.74it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.78it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:18,  1.79it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.76it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.74it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.76it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:19,  1.74it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.74it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.73it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.79it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.73it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.79it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.73it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:16,  1.73it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.76it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.76it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.78it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.74it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.76it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.74it/s]DDIM Sampler:  50%|█████     | 25/50 [00:13<00:14,  1.77it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.78it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.75it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.78it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.75it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.75it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.79it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:16<00:12,  1.75it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.79it/s]DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.78it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.75it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.78it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.78it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.74it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.78it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.74it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.78it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.78it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.75it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.79it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.74it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.78it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.80it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.73it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s]DDIM Sampler:  70%|███████   | 35/50 [00:20<00:08,  1.72it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:08,  1.71it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.77it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.72it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.73it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.77it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.77it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.79it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.73it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.77it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.79it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:23<00:05,  1.73it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.78it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.72it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:24<00:04,  1.72it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.79it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.71it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.80it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.78it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.72it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.77it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.79it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.72it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.73it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.78it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.79it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:27<00:01,  1.73it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.78it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.73it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:28<00:00,  1.73it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.71it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.73it/s]Epoch 28:  99%|█████████▉| 1201/1208 [34:59<00:12,  1.75s/it, loss=0.104, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00215, train/loss_step=0.377, global_step=8755.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28:  99%|█████████▉| 1201/1208 [34:59<00:12,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00408, train/loss_vlb_step=2.16e-5, train/loss_step=0.00408, global_step=8756.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28: 100%|█████████▉| 1202/1208 [35:00<00:10,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00408, train/loss_vlb_step=2.16e-5, train/loss_step=0.00408, global_step=8756.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28: 100%|█████████▉| 1202/1208 [35:00<00:10,  1.75s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000301, train/loss_step=0.0901, global_step=8756.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28: 100%|█████████▉| 1203/1208 [35:01<00:08,  1.75s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000301, train/loss_step=0.0901, global_step=8756.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28: 100%|█████████▉| 1203/1208 [35:01<00:08,  1.75s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0414, train/loss_vlb_step=0.00015, train/loss_step=0.0414, global_step=8756.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28: 100%|█████████▉| 1204/1208 [35:04<00:06,  1.75s/it, loss=0.096, v_num=0, train/loss_simple_step=0.0414, train/loss_vlb_step=0.00015, train/loss_step=0.0414, global_step=8756.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28: 100%|█████████▉| 1204/1208 [35:04<00:06,  1.75s/it, loss=0.0959, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.15e-5, train/loss_step=0.012, global_step=8756.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143] Epoch 28: 100%|█████████▉| 1205/1208 [35:05<00:05,  1.75s/it, loss=0.0959, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.15e-5, train/loss_step=0.012, global_step=8756.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28: 100%|█████████▉| 1205/1208 [35:05<00:05,  1.75s/it, loss=0.0867, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000192, train/loss_step=0.0525, global_step=8757.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28: 100%|█████████▉| 1206/1208 [35:06<00:03,  1.75s/it, loss=0.0867, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000192, train/loss_step=0.0525, global_step=8757.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28: 100%|█████████▉| 1206/1208 [35:06<00:03,  1.75s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000714, train/loss_step=0.203, global_step=8757.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]  Epoch 28: 100%|█████████▉| 1207/1208 [35:07<00:01,  1.75s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000714, train/loss_step=0.203, global_step=8757.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28: 100%|█████████▉| 1207/1208 [35:07<00:01,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.543, train/loss_vlb_step=0.0061, train/loss_step=0.543, global_step=8757.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]   Epoch 28: 100%|██████████| 1208/1208 [35:17<00:00,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.543, train/loss_vlb_step=0.0061, train/loss_step=0.543, global_step=8757.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 28: 100%|██████████| 1208/1208 [35:17<00:00,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0682, train/loss_vlb_step=0.000232, train/loss_step=0.0682, global_step=8757.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]
+
+
+Epoch 28:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.122, v_num=0, train/loss_simple_step=0.0682, train/loss_vlb_step=0.000232, train/loss_step=0.0682, global_step=8757.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]           Epoch 29:   0%|          | 0/1208 [00:00<?, ?it/s, loss=0.122, v_num=0, train/loss_simple_step=0.0682, train/loss_vlb_step=0.000232, train/loss_step=0.0682, global_step=8757.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][AData shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.74it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.71it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:29,  1.67it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.76it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.75it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:29,  1.62it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.74it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.74it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:28,  1.67it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.74it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.71it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.74it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.74it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:26,  1.71it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.74it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.74it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.71it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.80it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.74it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.75it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:25,  1.72it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.81it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.75it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.75it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.73it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.81it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.75it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.75it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.74it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.81it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.75it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.75it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.74it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.75it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.74it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.76it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.82it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.75it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.74it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.74it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.71it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.76it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.74it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:21,  1.71it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.76it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:20,  1.74it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:20,  1.71it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.75it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.78it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.74it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.71it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.75it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.74it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:19,  1.73it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:19,  1.72it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.75it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.74it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.71it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.72it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.74it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:18,  1.72it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:18,  1.72it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.75it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.73it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.73it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.75it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.75it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.73it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.75it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:16,  1.72it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.77it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.75it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.75it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.71it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.75it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.75it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.76it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:15,  1.73it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.76it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.74it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.74it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.73it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.75it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.75it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:15<00:13,  1.73it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.76it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.75it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.75it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:16<00:12,  1.76it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:16<00:12,  1.75it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:16<00:12,  1.76it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.75it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.73it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.75it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.76it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.75it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.75it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.74it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.74it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.74it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.75it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.73it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:19<00:09,  1.76it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.75it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.73it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.75it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:20<00:08,  1.76it/s]DDIM Sampler:  70%|███████   | 35/50 [00:20<00:08,  1.74it/s]DDIM Sampler:  70%|███████   | 35/50 [00:20<00:08,  1.71it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:08,  1.72it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:08,  1.74it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:08,  1.74it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.73it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.75it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.75it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.75it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.74it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.74it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.75it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.76it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.73it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.75it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.74it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.75it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.73it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.74it/s]DDIM Sampler:  80%|████████  | 40/50 [00:23<00:05,  1.75it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.73it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.74it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.74it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:24<00:04,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:24<00:04,  1.77it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.74it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.75it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.77it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.77it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.75it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.75it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.75it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.73it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.75it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.77it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:27<00:01,  1.72it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.73it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.78it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.73it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.74it/s][ADDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.75it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:28<00:00,  1.78it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:28<00:00,  1.75it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.74it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.74it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.74it/s]Epoch 29:   0%|          | 1/1208 [00:33<11:19:21, 33.77s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0682, train/loss_vlb_step=0.000232, train/loss_step=0.0682, global_step=8757.0, train/loss_simple_epoch=0.143, train/loss_vlb_epoch=0.00269, train/loss_epoch=0.143]Epoch 29:   0%|          | 1/1208 [00:33<11:19:22, 33.77s/it, loss=0.129, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000546, train/loss_step=0.158, global_step=8758.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:   0%|          | 2/1208 [00:34<5:50:07, 17.42s/it, loss=0.129, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.000546, train/loss_step=0.158, global_step=8758.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:   0%|          | 2/1208 [00:34<5:50:08, 17.42s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0455, train/loss_vlb_step=0.000165, train/loss_step=0.0455, global_step=8758.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   0%|          | 3/1208 [00:35<4:00:18, 11.97s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0455, train/loss_vlb_step=0.000165, train/loss_step=0.0455, global_step=8758.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   0%|          | 3/1208 [00:35<4:00:19, 11.97s/it, loss=0.122, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.00076, train/loss_step=0.209, global_step=8758.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:   0%|          | 4/1208 [00:38<3:15:14,  9.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.00076, train/loss_step=0.209, global_step=8758.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   0%|          | 4/1208 [00:38<3:15:14,  9.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000559, train/loss_step=0.163, global_step=8758.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   0%|          | 5/1208 [00:40<2:40:24,  8.00s/it, loss=0.126, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000559, train/loss_step=0.163, global_step=8758.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   0%|          | 5/1208 [00:40<2:40:24,  8.00s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=1.07e-5, train/loss_step=0.00181, global_step=8759.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   0%|          | 6/1208 [00:41<2:17:02,  6.84s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=1.07e-5, train/loss_step=0.00181, global_step=8759.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   0%|          | 6/1208 [00:41<2:17:02,  6.84s/it, loss=0.126, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000363, train/loss_step=0.110, global_step=8759.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:   1%|          | 7/1208 [00:42<2:00:22,  6.01s/it, loss=0.126, v_num=0, train/loss_simple_step=0.110, train/loss_vlb_step=0.000363, train/loss_step=0.110, global_step=8759.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   1%|          | 7/1208 [00:42<2:00:22,  6.01s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=1.41e-5, train/loss_step=0.00243, global_step=8759.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   1%|          | 8/1208 [00:45<1:53:37,  5.68s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=1.41e-5, train/loss_step=0.00243, global_step=8759.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   1%|          | 8/1208 [00:45<1:53:44,  5.69s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00958, train/loss_vlb_step=4.43e-5, train/loss_step=0.00958, global_step=8759.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   1%|          | 9/1208 [00:46<1:43:44,  5.19s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00958, train/loss_vlb_step=4.43e-5, train/loss_step=0.00958, global_step=8759.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   1%|          | 9/1208 [00:46<1:43:44,  5.19s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.76e-5, train/loss_step=0.0242, global_step=8760.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:   1%|          | 10/1208 [00:47<1:35:32,  4.79s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=9.76e-5, train/loss_step=0.0242, global_step=8760.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   1%|          | 10/1208 [00:47<1:35:33,  4.79s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0078, train/loss_vlb_step=3.92e-5, train/loss_step=0.0078, global_step=8760.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   1%|          | 11/1208 [00:48<1:28:40,  4.45s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0078, train/loss_vlb_step=3.92e-5, train/loss_step=0.0078, global_step=8760.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   1%|          | 11/1208 [00:48<1:28:40,  4.45s/it, loss=0.117, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000975, train/loss_step=0.225, global_step=8760.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:   1%|          | 12/1208 [00:51<1:26:20,  4.33s/it, loss=0.117, v_num=0, train/loss_simple_step=0.225, train/loss_vlb_step=0.000975, train/loss_step=0.225, global_step=8760.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   1%|          | 12/1208 [00:51<1:26:20,  4.33s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000182, train/loss_step=0.0514, global_step=8760.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   1%|          | 13/1208 [00:53<1:21:18,  4.08s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.000182, train/loss_step=0.0514, global_step=8760.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   1%|          | 13/1208 [00:53<1:21:18,  4.08s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00567, train/loss_vlb_step=2.84e-5, train/loss_step=0.00567, global_step=8761.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   1%|          | 14/1208 [00:54<1:17:00,  3.87s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00567, train/loss_vlb_step=2.84e-5, train/loss_step=0.00567, global_step=8761.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   1%|          | 14/1208 [00:54<1:17:00,  3.87s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.0579, train/loss_vlb_step=0.000194, train/loss_step=0.0579, global_step=8761.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   1%|          | 15/1208 [00:55<1:13:17,  3.69s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.0579, train/loss_vlb_step=0.000194, train/loss_step=0.0579, global_step=8761.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   1%|          | 15/1208 [00:55<1:13:17,  3.69s/it, loss=0.107, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000722, train/loss_step=0.198, global_step=8761.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:   1%|▏         | 16/1208 [00:58<1:12:39,  3.66s/it, loss=0.107, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000722, train/loss_step=0.198, global_step=8761.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   1%|▏         | 16/1208 [00:58<1:12:39,  3.66s/it, loss=0.117, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000764, train/loss_step=0.209, global_step=8761.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   1%|▏         | 17/1208 [00:59<1:09:34,  3.50s/it, loss=0.117, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000764, train/loss_step=0.209, global_step=8761.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   1%|▏         | 17/1208 [00:59<1:09:34,  3.50s/it, loss=0.121, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.00047, train/loss_step=0.138, global_step=8762.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:   1%|▏         | 18/1208 [01:00<1:06:47,  3.37s/it, loss=0.121, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.00047, train/loss_step=0.138, global_step=8762.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   1%|▏         | 18/1208 [01:00<1:06:47,  3.37s/it, loss=0.12, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000553, train/loss_step=0.165, global_step=8762.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   2%|▏         | 19/1208 [01:01<1:04:19,  3.25s/it, loss=0.12, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000553, train/loss_step=0.165, global_step=8762.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   2%|▏         | 19/1208 [01:01<1:04:19,  3.25s/it, loss=0.111, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00232, train/loss_step=0.366, global_step=8762.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   2%|▏         | 20/1208 [01:05<1:04:23,  3.25s/it, loss=0.111, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00232, train/loss_step=0.366, global_step=8762.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   2%|▏         | 20/1208 [01:05<1:04:23,  3.25s/it, loss=0.122, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00162, train/loss_step=0.304, global_step=8762.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   2%|▏         | 21/1208 [01:06<1:02:16,  3.15s/it, loss=0.122, v_num=0, train/loss_simple_step=0.304, train/loss_vlb_step=0.00162, train/loss_step=0.304, global_step=8762.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   2%|▏         | 21/1208 [01:06<1:02:16,  3.15s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00499, train/loss_vlb_step=2.58e-5, train/loss_step=0.00499, global_step=8763.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   2%|▏         | 22/1208 [01:07<1:00:22,  3.05s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00499, train/loss_vlb_step=2.58e-5, train/loss_step=0.00499, global_step=8763.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   2%|▏         | 22/1208 [01:07<1:00:22,  3.05s/it, loss=0.128, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00164, train/loss_step=0.300, global_step=8763.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:   2%|▏         | 23/1208 [01:08<58:38,  2.97s/it, loss=0.128, v_num=0, train/loss_simple_step=0.300, train/loss_vlb_step=0.00164, train/loss_step=0.300, global_step=8763.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:   2%|▏         | 23/1208 [01:08<58:39,  2.97s/it, loss=0.126, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000611, train/loss_step=0.173, global_step=8763.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   2%|▏         | 24/1208 [01:11<58:49,  2.98s/it, loss=0.126, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000611, train/loss_step=0.173, global_step=8763.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   2%|▏         | 24/1208 [01:11<58:49,  2.98s/it, loss=0.119, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.000103, train/loss_step=0.027, global_step=8763.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   2%|▏         | 25/1208 [01:12<57:16,  2.91s/it, loss=0.119, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.000103, train/loss_step=0.027, global_step=8763.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   2%|▏         | 25/1208 [01:12<57:16,  2.91s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0883, train/loss_vlb_step=0.000291, train/loss_step=0.0883, global_step=8764.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   2%|▏         | 26/1208 [01:13<55:50,  2.83s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0883, train/loss_vlb_step=0.000291, train/loss_step=0.0883, global_step=8764.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   2%|▏         | 26/1208 [01:13<55:50,  2.83s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0968, train/loss_vlb_step=0.000318, train/loss_step=0.0968, global_step=8764.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   2%|▏         | 27/1208 [01:14<54:31,  2.77s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0968, train/loss_vlb_step=0.000318, train/loss_step=0.0968, global_step=8764.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   2%|▏         | 27/1208 [01:14<54:31,  2.77s/it, loss=0.13, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000512, train/loss_step=0.154, global_step=8764.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:   2%|▏         | 28/1208 [01:17<54:44,  2.78s/it, loss=0.13, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000512, train/loss_step=0.154, global_step=8764.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   2%|▏         | 28/1208 [01:17<54:44,  2.78s/it, loss=0.139, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000615, train/loss_step=0.180, global_step=8764.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   2%|▏         | 29/1208 [01:18<53:31,  2.72s/it, loss=0.139, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000615, train/loss_step=0.180, global_step=8764.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   2%|▏         | 29/1208 [01:18<53:31,  2.72s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.34e-5, train/loss_step=0.00236, global_step=8765.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   2%|▏         | 30/1208 [01:20<52:22,  2.67s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.34e-5, train/loss_step=0.00236, global_step=8765.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   2%|▏         | 30/1208 [01:20<52:23,  2.67s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=2.22e-5, train/loss_step=0.00407, global_step=8765.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   3%|▎         | 31/1208 [01:21<51:19,  2.62s/it, loss=0.137, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=2.22e-5, train/loss_step=0.00407, global_step=8765.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   3%|▎         | 31/1208 [01:21<51:19,  2.62s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.2e-5, train/loss_step=0.0117, global_step=8765.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:   3%|▎         | 32/1208 [01:24<51:41,  2.64s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.2e-5, train/loss_step=0.0117, global_step=8765.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   3%|▎         | 32/1208 [01:24<51:41,  2.64s/it, loss=0.132, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000522, train/loss_step=0.151, global_step=8765.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   3%|▎         | 33/1208 [01:25<50:44,  2.59s/it, loss=0.132, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000522, train/loss_step=0.151, global_step=8765.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   3%|▎         | 33/1208 [01:25<50:44,  2.59s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000268, train/loss_step=0.0815, global_step=8766.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   3%|▎         | 34/1208 [01:26<49:48,  2.55s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0815, train/loss_vlb_step=0.000268, train/loss_step=0.0815, global_step=8766.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   3%|▎         | 34/1208 [01:26<49:48,  2.55s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.82e-5, train/loss_step=0.0126, global_step=8766.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:   3%|▎         | 35/1208 [01:27<48:56,  2.50s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.82e-5, train/loss_step=0.0126, global_step=8766.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   3%|▎         | 35/1208 [01:27<48:57,  2.50s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.42e-5, train/loss_step=0.0235, global_step=8766.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   3%|▎         | 36/1208 [01:30<49:18,  2.52s/it, loss=0.125, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=9.42e-5, train/loss_step=0.0235, global_step=8766.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   3%|▎         | 36/1208 [01:30<49:18,  2.52s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0641, train/loss_vlb_step=0.000213, train/loss_step=0.0641, global_step=8766.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   3%|▎         | 37/1208 [01:31<48:31,  2.49s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0641, train/loss_vlb_step=0.000213, train/loss_step=0.0641, global_step=8766.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   3%|▎         | 37/1208 [01:31<48:31,  2.49s/it, loss=0.144, v_num=0, train/loss_simple_step=0.673, train/loss_vlb_step=0.027, train/loss_step=0.673, global_step=8767.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]     Epoch 29:   3%|▎         | 38/1208 [01:33<47:45,  2.45s/it, loss=0.144, v_num=0, train/loss_simple_step=0.673, train/loss_vlb_step=0.027, train/loss_step=0.673, global_step=8767.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   3%|▎         | 38/1208 [01:33<47:45,  2.45s/it, loss=0.147, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000902, train/loss_step=0.228, global_step=8767.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   3%|▎         | 39/1208 [01:34<47:00,  2.41s/it, loss=0.147, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000902, train/loss_step=0.228, global_step=8767.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   3%|▎         | 39/1208 [01:34<47:00,  2.41s/it, loss=0.146, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00203, train/loss_step=0.335, global_step=8767.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:   3%|▎         | 40/1208 [01:37<47:23,  2.43s/it, loss=0.146, v_num=0, train/loss_simple_step=0.335, train/loss_vlb_step=0.00203, train/loss_step=0.335, global_step=8767.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   3%|▎         | 40/1208 [01:37<47:23,  2.43s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000118, train/loss_step=0.0319, global_step=8767.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   3%|▎         | 41/1208 [01:38<46:43,  2.40s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.000118, train/loss_step=0.0319, global_step=8767.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   3%|▎         | 41/1208 [01:38<46:43,  2.40s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=1.07e-5, train/loss_step=0.00177, global_step=8768.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   3%|▎         | 42/1208 [01:39<46:04,  2.37s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=1.07e-5, train/loss_step=0.00177, global_step=8768.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   3%|▎         | 42/1208 [01:39<46:04,  2.37s/it, loss=0.133, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00125, train/loss_step=0.317, global_step=8768.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:   4%|▎         | 43/1208 [01:40<45:26,  2.34s/it, loss=0.133, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00125, train/loss_step=0.317, global_step=8768.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   4%|▎         | 43/1208 [01:40<45:26,  2.34s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000138, train/loss_step=0.0378, global_step=8768.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   4%|▎         | 44/1208 [01:43<45:48,  2.36s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.000138, train/loss_step=0.0378, global_step=8768.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   4%|▎         | 44/1208 [01:43<45:48,  2.36s/it, loss=0.128, v_num=0, train/loss_simple_step=0.073, train/loss_vlb_step=0.000242, train/loss_step=0.073, global_step=8768.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:   4%|▎         | 45/1208 [01:45<45:13,  2.33s/it, loss=0.128, v_num=0, train/loss_simple_step=0.073, train/loss_vlb_step=0.000242, train/loss_step=0.073, global_step=8768.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   4%|▎         | 45/1208 [01:45<45:13,  2.33s/it, loss=0.139, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00145, train/loss_step=0.293, global_step=8769.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:   4%|▍         | 46/1208 [01:46<44:39,  2.31s/it, loss=0.139, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00145, train/loss_step=0.293, global_step=8769.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   4%|▍         | 46/1208 [01:46<44:39,  2.31s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.69e-5, train/loss_step=0.0239, global_step=8769.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   4%|▍         | 47/1208 [01:47<44:08,  2.28s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.69e-5, train/loss_step=0.0239, global_step=8769.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   4%|▍         | 47/1208 [01:47<44:08,  2.28s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.38e-5, train/loss_step=0.0243, global_step=8769.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   4%|▍         | 48/1208 [01:50<44:28,  2.30s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=9.38e-5, train/loss_step=0.0243, global_step=8769.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   4%|▍         | 48/1208 [01:50<44:28,  2.30s/it, loss=0.143, v_num=0, train/loss_simple_step=0.478, train/loss_vlb_step=0.00566, train/loss_step=0.478, global_step=8769.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:   4%|▍         | 49/1208 [01:51<43:59,  2.28s/it, loss=0.143, v_num=0, train/loss_simple_step=0.478, train/loss_vlb_step=0.00566, train/loss_step=0.478, global_step=8769.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   4%|▍         | 49/1208 [01:51<43:59,  2.28s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.92e-5, train/loss_step=0.0134, global_step=8770.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   4%|▍         | 50/1208 [01:52<43:28,  2.25s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.92e-5, train/loss_step=0.0134, global_step=8770.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   4%|▍         | 50/1208 [01:52<43:28,  2.25s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=8.51e-5, train/loss_step=0.0211, global_step=8770.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   4%|▍         | 51/1208 [01:53<42:59,  2.23s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=8.51e-5, train/loss_step=0.0211, global_step=8770.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   4%|▍         | 51/1208 [01:53<42:59,  2.23s/it, loss=0.156, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.00106, train/loss_step=0.246, global_step=8770.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:   4%|▍         | 52/1208 [01:57<43:21,  2.25s/it, loss=0.156, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.00106, train/loss_step=0.246, global_step=8770.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   4%|▍         | 52/1208 [01:57<43:21,  2.25s/it, loss=0.179, v_num=0, train/loss_simple_step=0.605, train/loss_vlb_step=0.0118, train/loss_step=0.605, global_step=8770.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:   4%|▍         | 53/1208 [01:58<42:53,  2.23s/it, loss=0.179, v_num=0, train/loss_simple_step=0.605, train/loss_vlb_step=0.0118, train/loss_step=0.605, global_step=8770.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   4%|▍         | 53/1208 [01:58<42:53,  2.23s/it, loss=0.2, v_num=0, train/loss_simple_step=0.501, train/loss_vlb_step=0.00841, train/loss_step=0.501, global_step=8771.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:   4%|▍         | 54/1208 [01:59<42:26,  2.21s/it, loss=0.2, v_num=0, train/loss_simple_step=0.501, train/loss_vlb_step=0.00841, train/loss_step=0.501, global_step=8771.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   4%|▍         | 54/1208 [01:59<42:26,  2.21s/it, loss=0.231, v_num=0, train/loss_simple_step=0.623, train/loss_vlb_step=0.0233, train/loss_step=0.623, global_step=8771.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   5%|▍         | 55/1208 [02:00<42:00,  2.19s/it, loss=0.231, v_num=0, train/loss_simple_step=0.623, train/loss_vlb_step=0.0233, train/loss_step=0.623, global_step=8771.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   5%|▍         | 55/1208 [02:00<42:00,  2.19s/it, loss=0.231, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000125, train/loss_step=0.0333, global_step=8771.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   5%|▍         | 56/1208 [02:03<42:21,  2.21s/it, loss=0.231, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000125, train/loss_step=0.0333, global_step=8771.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   5%|▍         | 56/1208 [02:03<42:21,  2.21s/it, loss=0.246, v_num=0, train/loss_simple_step=0.358, train/loss_vlb_step=0.00194, train/loss_step=0.358, global_step=8771.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:   5%|▍         | 57/1208 [02:04<41:56,  2.19s/it, loss=0.246, v_num=0, train/loss_simple_step=0.358, train/loss_vlb_step=0.00194, train/loss_step=0.358, global_step=8771.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   5%|▍         | 57/1208 [02:04<41:56,  2.19s/it, loss=0.216, v_num=0, train/loss_simple_step=0.0808, train/loss_vlb_step=0.000271, train/loss_step=0.0808, global_step=8772.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   5%|▍         | 58/1208 [02:05<41:31,  2.17s/it, loss=0.216, v_num=0, train/loss_simple_step=0.0808, train/loss_vlb_step=0.000271, train/loss_step=0.0808, global_step=8772.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   5%|▍         | 58/1208 [02:05<41:31,  2.17s/it, loss=0.217, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000906, train/loss_step=0.244, global_step=8772.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:   5%|▍         | 59/1208 [02:06<41:07,  2.15s/it, loss=0.217, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000906, train/loss_step=0.244, global_step=8772.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   5%|▍         | 59/1208 [02:06<41:07,  2.15s/it, loss=0.2, v_num=0, train/loss_simple_step=0.00339, train/loss_vlb_step=1.88e-5, train/loss_step=0.00339, global_step=8772.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   5%|▍         | 60/1208 [02:09<41:26,  2.17s/it, loss=0.2, v_num=0, train/loss_simple_step=0.00339, train/loss_vlb_step=1.88e-5, train/loss_step=0.00339, global_step=8772.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   5%|▍         | 60/1208 [02:09<41:26,  2.17s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0745, train/loss_vlb_step=0.00025, train/loss_step=0.0745, global_step=8772.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   5%|▌         | 61/1208 [02:11<41:04,  2.15s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0745, train/loss_vlb_step=0.00025, train/loss_step=0.0745, global_step=8772.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   5%|▌         | 61/1208 [02:11<41:04,  2.15s/it, loss=0.203, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.47e-5, train/loss_step=0.00254, global_step=8773.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   5%|▌         | 62/1208 [02:12<40:42,  2.13s/it, loss=0.203, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.47e-5, train/loss_step=0.00254, global_step=8773.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   5%|▌         | 62/1208 [02:12<40:42,  2.13s/it, loss=0.192, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=8773.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:   5%|▌         | 63/1208 [02:13<40:21,  2.11s/it, loss=0.192, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=8773.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   5%|▌         | 63/1208 [02:13<40:21,  2.11s/it, loss=0.192, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000131, train/loss_step=0.035, global_step=8773.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   5%|▌         | 64/1208 [02:16<40:38,  2.13s/it, loss=0.192, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000131, train/loss_step=0.035, global_step=8773.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   5%|▌         | 64/1208 [02:16<40:38,  2.13s/it, loss=0.188, v_num=0, train/loss_simple_step=0.00533, train/loss_vlb_step=2.8e-5, train/loss_step=0.00533, global_step=8773.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   5%|▌         | 65/1208 [02:17<40:18,  2.12s/it, loss=0.188, v_num=0, train/loss_simple_step=0.00533, train/loss_vlb_step=2.8e-5, train/loss_step=0.00533, global_step=8773.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   5%|▌         | 65/1208 [02:17<40:18,  2.12s/it, loss=0.188, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00125, train/loss_step=0.274, global_step=8774.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:   5%|▌         | 66/1208 [02:18<39:57,  2.10s/it, loss=0.188, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00125, train/loss_step=0.274, global_step=8774.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   5%|▌         | 66/1208 [02:18<39:57,  2.10s/it, loss=0.208, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00416, train/loss_step=0.435, global_step=8774.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   6%|▌         | 67/1208 [02:19<39:38,  2.08s/it, loss=0.208, v_num=0, train/loss_simple_step=0.435, train/loss_vlb_step=0.00416, train/loss_step=0.435, global_step=8774.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   6%|▌         | 67/1208 [02:19<39:38,  2.08s/it, loss=0.213, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=8774.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   6%|▌         | 68/1208 [02:22<39:55,  2.10s/it, loss=0.213, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000408, train/loss_step=0.124, global_step=8774.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   6%|▌         | 68/1208 [02:22<39:55,  2.10s/it, loss=0.198, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000635, train/loss_step=0.180, global_step=8774.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   6%|▌         | 69/1208 [02:23<39:36,  2.09s/it, loss=0.198, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000635, train/loss_step=0.180, global_step=8774.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   6%|▌         | 69/1208 [02:23<39:36,  2.09s/it, loss=0.215, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00231, train/loss_step=0.356, global_step=8775.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:   6%|▌         | 70/1208 [02:25<39:18,  2.07s/it, loss=0.215, v_num=0, train/loss_simple_step=0.356, train/loss_vlb_step=0.00231, train/loss_step=0.356, global_step=8775.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   6%|▌         | 70/1208 [02:25<39:18,  2.07s/it, loss=0.228, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00121, train/loss_step=0.270, global_step=8775.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   6%|▌         | 71/1208 [02:26<39:00,  2.06s/it, loss=0.228, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00121, train/loss_step=0.270, global_step=8775.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   6%|▌         | 71/1208 [02:26<39:00,  2.06s/it, loss=0.224, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000582, train/loss_step=0.164, global_step=8775.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   6%|▌         | 72/1208 [02:29<39:16,  2.07s/it, loss=0.224, v_num=0, train/loss_simple_step=0.164, train/loss_vlb_step=0.000582, train/loss_step=0.164, global_step=8775.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   6%|▌         | 72/1208 [02:29<39:16,  2.07s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0638, train/loss_vlb_step=0.000222, train/loss_step=0.0638, global_step=8775.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   6%|▌         | 73/1208 [02:30<38:59,  2.06s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0638, train/loss_vlb_step=0.000222, train/loss_step=0.0638, global_step=8775.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   6%|▌         | 73/1208 [02:30<38:59,  2.06s/it, loss=0.183, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000844, train/loss_step=0.227, global_step=8776.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:   6%|▌         | 74/1208 [02:31<38:41,  2.05s/it, loss=0.183, v_num=0, train/loss_simple_step=0.227, train/loss_vlb_step=0.000844, train/loss_step=0.227, global_step=8776.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   6%|▌         | 74/1208 [02:31<38:41,  2.05s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.49e-5, train/loss_step=0.0236, global_step=8776.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   6%|▌         | 75/1208 [02:32<38:24,  2.03s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=9.49e-5, train/loss_step=0.0236, global_step=8776.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   6%|▌         | 75/1208 [02:32<38:24,  2.03s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000108, train/loss_step=0.0272, global_step=8776.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   6%|▋         | 76/1208 [02:35<38:39,  2.05s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0272, train/loss_vlb_step=0.000108, train/loss_step=0.0272, global_step=8776.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   6%|▋         | 76/1208 [02:35<38:39,  2.05s/it, loss=0.141, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000442, train/loss_step=0.133, global_step=8776.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:   6%|▋         | 77/1208 [02:36<38:23,  2.04s/it, loss=0.141, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000442, train/loss_step=0.133, global_step=8776.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   6%|▋         | 77/1208 [02:36<38:23,  2.04s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.75e-5, train/loss_step=0.0106, global_step=8777.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   6%|▋         | 78/1208 [02:37<38:07,  2.02s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.75e-5, train/loss_step=0.0106, global_step=8777.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   6%|▋         | 78/1208 [02:37<38:08,  2.02s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.21e-5, train/loss_step=0.0113, global_step=8777.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   7%|▋         | 79/1208 [02:38<37:52,  2.01s/it, loss=0.126, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.21e-5, train/loss_step=0.0113, global_step=8777.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   7%|▋         | 79/1208 [02:38<37:52,  2.01s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.51e-5, train/loss_step=0.0148, global_step=8777.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   7%|▋         | 80/1208 [02:42<38:08,  2.03s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=6.51e-5, train/loss_step=0.0148, global_step=8777.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   7%|▋         | 80/1208 [02:42<38:08,  2.03s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00746, train/loss_vlb_step=3.66e-5, train/loss_step=0.00746, global_step=8777.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   7%|▋         | 81/1208 [02:43<37:54,  2.02s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00746, train/loss_vlb_step=3.66e-5, train/loss_step=0.00746, global_step=8777.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   7%|▋         | 81/1208 [02:43<37:54,  2.02s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.24e-5, train/loss_step=0.00213, global_step=8778.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   7%|▋         | 82/1208 [02:44<37:39,  2.01s/it, loss=0.123, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.24e-5, train/loss_step=0.00213, global_step=8778.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   7%|▋         | 82/1208 [02:44<37:39,  2.01s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=1e-5, train/loss_step=0.00167, global_step=8778.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:   7%|▋         | 83/1208 [02:45<37:25,  2.00s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=1e-5, train/loss_step=0.00167, global_step=8778.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   7%|▋         | 83/1208 [02:45<37:25,  2.00s/it, loss=0.12, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.000229, train/loss_step=0.067, global_step=8778.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:   7%|▋         | 84/1208 [02:48<37:37,  2.01s/it, loss=0.12, v_num=0, train/loss_simple_step=0.067, train/loss_vlb_step=0.000229, train/loss_step=0.067, global_step=8778.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   7%|▋         | 84/1208 [02:48<37:37,  2.01s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=5.02e-5, train/loss_step=0.0107, global_step=8778.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   7%|▋         | 85/1208 [02:49<37:22,  2.00s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=5.02e-5, train/loss_step=0.0107, global_step=8778.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   7%|▋         | 85/1208 [02:49<37:22,  2.00s/it, loss=0.114, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000486, train/loss_step=0.145, global_step=8779.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   7%|▋         | 86/1208 [02:50<37:08,  1.99s/it, loss=0.114, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000486, train/loss_step=0.145, global_step=8779.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   7%|▋         | 86/1208 [02:50<37:08,  1.99s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.55e-5, train/loss_step=0.00281, global_step=8779.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   7%|▋         | 87/1208 [02:51<36:54,  1.98s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.55e-5, train/loss_step=0.00281, global_step=8779.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   7%|▋         | 87/1208 [02:51<36:54,  1.98s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.00012, train/loss_step=0.031, global_step=8779.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:   7%|▋         | 88/1208 [02:55<37:09,  1.99s/it, loss=0.0875, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.00012, train/loss_step=0.031, global_step=8779.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   7%|▋         | 88/1208 [02:55<37:09,  1.99s/it, loss=0.0786, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.21e-5, train/loss_step=0.00209, global_step=8779.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   7%|▋         | 89/1208 [02:56<36:55,  1.98s/it, loss=0.0786, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.21e-5, train/loss_step=0.00209, global_step=8779.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   7%|▋         | 89/1208 [02:56<36:55,  1.98s/it, loss=0.061, v_num=0, train/loss_simple_step=0.0039, train/loss_vlb_step=2.08e-5, train/loss_step=0.0039, global_step=8780.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:   7%|▋         | 90/1208 [02:57<36:42,  1.97s/it, loss=0.061, v_num=0, train/loss_simple_step=0.0039, train/loss_vlb_step=2.08e-5, train/loss_step=0.0039, global_step=8780.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   7%|▋         | 90/1208 [02:57<36:42,  1.97s/it, loss=0.0482, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.15e-5, train/loss_step=0.0142, global_step=8780.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   8%|▊         | 91/1208 [02:58<36:29,  1.96s/it, loss=0.0482, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.15e-5, train/loss_step=0.0142, global_step=8780.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   8%|▊         | 91/1208 [02:58<36:29,  1.96s/it, loss=0.0627, v_num=0, train/loss_simple_step=0.455, train/loss_vlb_step=0.00657, train/loss_step=0.455, global_step=8780.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:   8%|▊         | 92/1208 [03:01<36:43,  1.97s/it, loss=0.0627, v_num=0, train/loss_simple_step=0.455, train/loss_vlb_step=0.00657, train/loss_step=0.455, global_step=8780.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   8%|▊         | 92/1208 [03:01<36:43,  1.97s/it, loss=0.0677, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000635, train/loss_step=0.163, global_step=8780.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   8%|▊         | 93/1208 [03:02<36:30,  1.96s/it, loss=0.0677, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000635, train/loss_step=0.163, global_step=8780.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   8%|▊         | 93/1208 [03:02<36:30,  1.96s/it, loss=0.0594, v_num=0, train/loss_simple_step=0.0626, train/loss_vlb_step=0.000218, train/loss_step=0.0626, global_step=8781.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   8%|▊         | 94/1208 [03:03<36:18,  1.96s/it, loss=0.0594, v_num=0, train/loss_simple_step=0.0626, train/loss_vlb_step=0.000218, train/loss_step=0.0626, global_step=8781.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   8%|▊         | 94/1208 [03:03<36:18,  1.96s/it, loss=0.061, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.000184, train/loss_step=0.0543, global_step=8781.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:   8%|▊         | 95/1208 [03:04<36:05,  1.95s/it, loss=0.061, v_num=0, train/loss_simple_step=0.0543, train/loss_vlb_step=0.000184, train/loss_step=0.0543, global_step=8781.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   8%|▊         | 95/1208 [03:04<36:05,  1.95s/it, loss=0.0602, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.95e-5, train/loss_step=0.0108, global_step=8781.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   8%|▊         | 96/1208 [03:08<36:21,  1.96s/it, loss=0.0602, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.95e-5, train/loss_step=0.0108, global_step=8781.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   8%|▊         | 96/1208 [03:08<36:21,  1.96s/it, loss=0.0637, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000717, train/loss_step=0.204, global_step=8781.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:   8%|▊         | 97/1208 [03:09<36:09,  1.95s/it, loss=0.0637, v_num=0, train/loss_simple_step=0.204, train/loss_vlb_step=0.000717, train/loss_step=0.204, global_step=8781.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   8%|▊         | 97/1208 [03:09<36:09,  1.95s/it, loss=0.0695, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000415, train/loss_step=0.126, global_step=8782.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   8%|▊         | 98/1208 [03:10<35:58,  1.94s/it, loss=0.0695, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000415, train/loss_step=0.126, global_step=8782.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   8%|▊         | 98/1208 [03:10<35:58,  1.94s/it, loss=0.0774, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000584, train/loss_step=0.170, global_step=8782.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   8%|▊         | 99/1208 [03:11<35:46,  1.94s/it, loss=0.0774, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000584, train/loss_step=0.170, global_step=8782.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   8%|▊         | 99/1208 [03:11<35:46,  1.94s/it, loss=0.102, v_num=0, train/loss_simple_step=0.511, train/loss_vlb_step=0.00453, train/loss_step=0.511, global_step=8782.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:   8%|▊         | 100/1208 [03:14<35:58,  1.95s/it, loss=0.102, v_num=0, train/loss_simple_step=0.511, train/loss_vlb_step=0.00453, train/loss_step=0.511, global_step=8782.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   8%|▊         | 100/1208 [03:14<35:58,  1.95s/it, loss=0.102, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.41e-5, train/loss_step=0.012, global_step=8782.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   8%|▊         | 101/1208 [03:15<35:47,  1.94s/it, loss=0.102, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.41e-5, train/loss_step=0.012, global_step=8782.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   8%|▊         | 101/1208 [03:15<35:47,  1.94s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00882, train/loss_vlb_step=4.07e-5, train/loss_step=0.00882, global_step=8783.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   8%|▊         | 102/1208 [03:16<35:35,  1.93s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00882, train/loss_vlb_step=4.07e-5, train/loss_step=0.00882, global_step=8783.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   8%|▊         | 102/1208 [03:16<35:35,  1.93s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00634, train/loss_vlb_step=3.19e-5, train/loss_step=0.00634, global_step=8783.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   9%|▊         | 103/1208 [03:18<35:24,  1.92s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00634, train/loss_vlb_step=3.19e-5, train/loss_step=0.00634, global_step=8783.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   9%|▊         | 103/1208 [03:18<35:24,  1.92s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00585, train/loss_vlb_step=2.93e-5, train/loss_step=0.00585, global_step=8783.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:   9%|▊         | 104/1208 [03:21<35:37,  1.94s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00585, train/loss_vlb_step=2.93e-5, train/loss_step=0.00585, global_step=8783.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   9%|▊         | 104/1208 [03:21<35:37,  1.94s/it, loss=0.113, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00104, train/loss_step=0.267, global_step=8783.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:   9%|▊         | 105/1208 [03:22<35:26,  1.93s/it, loss=0.113, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00104, train/loss_step=0.267, global_step=8783.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   9%|▊         | 105/1208 [03:22<35:26,  1.93s/it, loss=0.121, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00138, train/loss_step=0.303, global_step=8784.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   9%|▉         | 106/1208 [03:23<35:16,  1.92s/it, loss=0.121, v_num=0, train/loss_simple_step=0.303, train/loss_vlb_step=0.00138, train/loss_step=0.303, global_step=8784.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   9%|▉         | 106/1208 [03:23<35:16,  1.92s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=7.15e-5, train/loss_step=0.0162, global_step=8784.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   9%|▉         | 107/1208 [03:24<35:05,  1.91s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=7.15e-5, train/loss_step=0.0162, global_step=8784.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   9%|▉         | 107/1208 [03:24<35:05,  1.91s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.000136, train/loss_step=0.0362, global_step=8784.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   9%|▉         | 108/1208 [03:27<35:17,  1.92s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.000136, train/loss_step=0.0362, global_step=8784.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   9%|▉         | 108/1208 [03:27<35:17,  1.92s/it, loss=0.128, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000471, train/loss_step=0.138, global_step=8784.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:   9%|▉         | 109/1208 [03:28<35:06,  1.92s/it, loss=0.128, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000471, train/loss_step=0.138, global_step=8784.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   9%|▉         | 109/1208 [03:28<35:06,  1.92s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=2.57e-5, train/loss_step=0.00495, global_step=8785.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   9%|▉         | 110/1208 [03:30<34:56,  1.91s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=2.57e-5, train/loss_step=0.00495, global_step=8785.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   9%|▉         | 110/1208 [03:30<34:56,  1.91s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0696, train/loss_vlb_step=0.000236, train/loss_step=0.0696, global_step=8785.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:   9%|▉         | 111/1208 [03:31<34:45,  1.90s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0696, train/loss_vlb_step=0.000236, train/loss_step=0.0696, global_step=8785.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   9%|▉         | 111/1208 [03:31<34:45,  1.90s/it, loss=0.122, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.0011, train/loss_step=0.273, global_step=8785.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:   9%|▉         | 112/1208 [03:34<34:58,  1.92s/it, loss=0.122, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.0011, train/loss_step=0.273, global_step=8785.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   9%|▉         | 112/1208 [03:34<34:58,  1.92s/it, loss=0.138, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00799, train/loss_step=0.476, global_step=8785.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   9%|▉         | 113/1208 [03:35<34:49,  1.91s/it, loss=0.138, v_num=0, train/loss_simple_step=0.476, train/loss_vlb_step=0.00799, train/loss_step=0.476, global_step=8785.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   9%|▉         | 113/1208 [03:35<34:49,  1.91s/it, loss=0.144, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000673, train/loss_step=0.185, global_step=8786.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   9%|▉         | 114/1208 [03:36<34:39,  1.90s/it, loss=0.144, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000673, train/loss_step=0.185, global_step=8786.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:   9%|▉         | 114/1208 [03:36<34:39,  1.90s/it, loss=0.15, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000591, train/loss_step=0.170, global_step=8786.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  10%|▉         | 115/1208 [03:37<34:29,  1.89s/it, loss=0.15, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000591, train/loss_step=0.170, global_step=8786.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  10%|▉         | 115/1208 [03:37<34:29,  1.89s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.72e-5, train/loss_step=0.0213, global_step=8786.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  10%|▉         | 116/1208 [03:41<34:40,  1.91s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=8.72e-5, train/loss_step=0.0213, global_step=8786.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  10%|▉         | 116/1208 [03:41<34:40,  1.91s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0486, train/loss_vlb_step=0.000175, train/loss_step=0.0486, global_step=8786.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  10%|▉         | 117/1208 [03:42<34:31,  1.90s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0486, train/loss_vlb_step=0.000175, train/loss_step=0.0486, global_step=8786.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  10%|▉         | 117/1208 [03:42<34:31,  1.90s/it, loss=0.144, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000546, train/loss_step=0.157, global_step=8787.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  10%|▉         | 118/1208 [03:43<34:21,  1.89s/it, loss=0.144, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000546, train/loss_step=0.157, global_step=8787.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  10%|▉         | 118/1208 [03:43<34:21,  1.89s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000144, train/loss_step=0.0405, global_step=8787.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  10%|▉         | 119/1208 [03:44<34:12,  1.89s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000144, train/loss_step=0.0405, global_step=8787.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  10%|▉         | 119/1208 [03:44<34:12,  1.89s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.1e-5, train/loss_step=0.00394, global_step=8787.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  10%|▉         | 120/1208 [03:47<34:23,  1.90s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.1e-5, train/loss_step=0.00394, global_step=8787.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  10%|▉         | 120/1208 [03:47<34:23,  1.90s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00823, train/loss_vlb_step=3.99e-5, train/loss_step=0.00823, global_step=8787.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  10%|█         | 121/1208 [03:48<34:14,  1.89s/it, loss=0.112, v_num=0, train/loss_simple_step=0.00823, train/loss_vlb_step=3.99e-5, train/loss_step=0.00823, global_step=8787.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  10%|█         | 121/1208 [03:48<34:14,  1.89s/it, loss=0.13, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00185, train/loss_step=0.369, global_step=8788.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]     Epoch 29:  10%|█         | 122/1208 [03:49<34:04,  1.88s/it, loss=0.13, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00185, train/loss_step=0.369, global_step=8788.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  10%|█         | 122/1208 [03:49<34:05,  1.88s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00327, train/loss_vlb_step=1.77e-5, train/loss_step=0.00327, global_step=8788.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  10%|█         | 123/1208 [03:50<33:55,  1.88s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00327, train/loss_vlb_step=1.77e-5, train/loss_step=0.00327, global_step=8788.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  10%|█         | 123/1208 [03:50<33:56,  1.88s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0532, train/loss_vlb_step=0.00019, train/loss_step=0.0532, global_step=8788.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  10%|█         | 124/1208 [03:53<34:05,  1.89s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0532, train/loss_vlb_step=0.00019, train/loss_step=0.0532, global_step=8788.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  10%|█         | 124/1208 [03:53<34:05,  1.89s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0088, train/loss_vlb_step=4.15e-5, train/loss_step=0.0088, global_step=8788.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  10%|█         | 125/1208 [03:55<33:56,  1.88s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0088, train/loss_vlb_step=4.15e-5, train/loss_step=0.0088, global_step=8788.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  10%|█         | 125/1208 [03:55<33:56,  1.88s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.81e-5, train/loss_step=0.0104, global_step=8789.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  10%|█         | 126/1208 [03:56<33:47,  1.87s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.81e-5, train/loss_step=0.0104, global_step=8789.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  10%|█         | 126/1208 [03:56<33:47,  1.87s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0404, train/loss_vlb_step=0.00015, train/loss_step=0.0404, global_step=8789.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  11%|█         | 127/1208 [03:57<33:38,  1.87s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0404, train/loss_vlb_step=0.00015, train/loss_step=0.0404, global_step=8789.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  11%|█         | 127/1208 [03:57<33:38,  1.87s/it, loss=0.124, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00305, train/loss_step=0.391, global_step=8789.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  11%|█         | 128/1208 [04:00<33:49,  1.88s/it, loss=0.124, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00305, train/loss_step=0.391, global_step=8789.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  11%|█         | 128/1208 [04:00<33:49,  1.88s/it, loss=0.122, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=8789.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  11%|█         | 129/1208 [04:01<33:40,  1.87s/it, loss=0.122, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000365, train/loss_step=0.111, global_step=8789.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  11%|█         | 129/1208 [04:01<33:40,  1.87s/it, loss=0.127, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=8790.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  11%|█         | 130/1208 [04:02<33:32,  1.87s/it, loss=0.127, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000349, train/loss_step=0.106, global_step=8790.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  11%|█         | 130/1208 [04:02<33:32,  1.87s/it, loss=0.143, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00296, train/loss_step=0.391, global_step=8790.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  11%|█         | 131/1208 [04:03<33:23,  1.86s/it, loss=0.143, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00296, train/loss_step=0.391, global_step=8790.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  11%|█         | 131/1208 [04:03<33:23,  1.86s/it, loss=0.147, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00251, train/loss_step=0.347, global_step=8790.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  11%|█         | 132/1208 [04:06<33:32,  1.87s/it, loss=0.147, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00251, train/loss_step=0.347, global_step=8790.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  11%|█         | 132/1208 [04:06<33:32,  1.87s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00829, train/loss_vlb_step=3.98e-5, train/loss_step=0.00829, global_step=8790.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  11%|█         | 133/1208 [04:08<33:25,  1.87s/it, loss=0.124, v_num=0, train/loss_simple_step=0.00829, train/loss_vlb_step=3.98e-5, train/loss_step=0.00829, global_step=8790.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  11%|█         | 133/1208 [04:08<33:25,  1.87s/it, loss=0.133, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00206, train/loss_step=0.366, global_step=8791.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  11%|█         | 134/1208 [04:09<33:16,  1.86s/it, loss=0.133, v_num=0, train/loss_simple_step=0.366, train/loss_vlb_step=0.00206, train/loss_step=0.366, global_step=8791.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  11%|█         | 134/1208 [04:09<33:16,  1.86s/it, loss=0.125, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=4.95e-5, train/loss_step=0.012, global_step=8791.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  11%|█         | 135/1208 [04:10<33:08,  1.85s/it, loss=0.125, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=4.95e-5, train/loss_step=0.012, global_step=8791.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  11%|█         | 135/1208 [04:10<33:08,  1.85s/it, loss=0.131, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000521, train/loss_step=0.155, global_step=8791.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  11%|█▏        | 136/1208 [04:13<33:17,  1.86s/it, loss=0.131, v_num=0, train/loss_simple_step=0.155, train/loss_vlb_step=0.000521, train/loss_step=0.155, global_step=8791.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  11%|█▏        | 136/1208 [04:13<33:17,  1.86s/it, loss=0.144, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00173, train/loss_step=0.307, global_step=8791.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  11%|█▏        | 137/1208 [04:14<33:09,  1.86s/it, loss=0.144, v_num=0, train/loss_simple_step=0.307, train/loss_vlb_step=0.00173, train/loss_step=0.307, global_step=8791.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  11%|█▏        | 137/1208 [04:14<33:09,  1.86s/it, loss=0.144, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000539, train/loss_step=0.159, global_step=8792.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  11%|█▏        | 138/1208 [04:15<33:01,  1.85s/it, loss=0.144, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000539, train/loss_step=0.159, global_step=8792.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  11%|█▏        | 138/1208 [04:15<33:01,  1.85s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.39e-5, train/loss_step=0.0119, global_step=8792.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  12%|█▏        | 139/1208 [04:16<32:53,  1.85s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.39e-5, train/loss_step=0.0119, global_step=8792.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  12%|█▏        | 139/1208 [04:16<32:53,  1.85s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0864, train/loss_vlb_step=0.000287, train/loss_step=0.0864, global_step=8792.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  12%|█▏        | 140/1208 [04:20<33:03,  1.86s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0864, train/loss_vlb_step=0.000287, train/loss_step=0.0864, global_step=8792.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  12%|█▏        | 140/1208 [04:20<33:03,  1.86s/it, loss=0.161, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00123, train/loss_step=0.275, global_step=8792.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  12%|█▏        | 141/1208 [04:21<32:55,  1.85s/it, loss=0.161, v_num=0, train/loss_simple_step=0.275, train/loss_vlb_step=0.00123, train/loss_step=0.275, global_step=8792.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  12%|█▏        | 141/1208 [04:21<32:55,  1.85s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.000131, train/loss_step=0.0352, global_step=8793.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  12%|█▏        | 142/1208 [04:22<32:48,  1.85s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.000131, train/loss_step=0.0352, global_step=8793.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  12%|█▏        | 142/1208 [04:22<32:48,  1.85s/it, loss=0.144, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.69e-5, train/loss_step=0.013, global_step=8793.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  12%|█▏        | 143/1208 [04:23<32:40,  1.84s/it, loss=0.144, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.69e-5, train/loss_step=0.013, global_step=8793.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  12%|█▏        | 143/1208 [04:23<32:40,  1.84s/it, loss=0.15, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000597, train/loss_step=0.172, global_step=8793.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  12%|█▏        | 144/1208 [04:26<32:49,  1.85s/it, loss=0.15, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000597, train/loss_step=0.172, global_step=8793.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  12%|█▏        | 144/1208 [04:26<32:49,  1.85s/it, loss=0.166, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00144, train/loss_step=0.322, global_step=8793.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  12%|█▏        | 145/1208 [04:27<32:42,  1.85s/it, loss=0.166, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00144, train/loss_step=0.322, global_step=8793.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  12%|█▏        | 145/1208 [04:27<32:42,  1.85s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0883, train/loss_vlb_step=0.00029, train/loss_step=0.0883, global_step=8794.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  12%|█▏        | 146/1208 [04:28<32:34,  1.84s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0883, train/loss_vlb_step=0.00029, train/loss_step=0.0883, global_step=8794.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  12%|█▏        | 146/1208 [04:28<32:34,  1.84s/it, loss=0.175, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000488, train/loss_step=0.145, global_step=8794.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  12%|█▏        | 147/1208 [04:29<32:27,  1.84s/it, loss=0.175, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000488, train/loss_step=0.145, global_step=8794.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  12%|█▏        | 147/1208 [04:29<32:27,  1.84s/it, loss=0.172, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.0021, train/loss_step=0.334, global_step=8794.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  12%|█▏        | 148/1208 [04:32<32:35,  1.84s/it, loss=0.172, v_num=0, train/loss_simple_step=0.334, train/loss_vlb_step=0.0021, train/loss_step=0.334, global_step=8794.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  12%|█▏        | 148/1208 [04:32<32:35,  1.84s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.36e-5, train/loss_step=0.0124, global_step=8794.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  12%|█▏        | 149/1208 [04:34<32:27,  1.84s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.36e-5, train/loss_step=0.0124, global_step=8794.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  12%|█▏        | 149/1208 [04:34<32:27,  1.84s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.000232, train/loss_step=0.0672, global_step=8795.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  12%|█▏        | 150/1208 [04:35<32:20,  1.83s/it, loss=0.165, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.000232, train/loss_step=0.0672, global_step=8795.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  12%|█▏        | 150/1208 [04:35<32:20,  1.83s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=1.07e-5, train/loss_step=0.00179, global_step=8795.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  12%|█▎        | 151/1208 [04:36<32:13,  1.83s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=1.07e-5, train/loss_step=0.00179, global_step=8795.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  12%|█▎        | 151/1208 [04:36<32:13,  1.83s/it, loss=0.138, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000668, train/loss_step=0.197, global_step=8795.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  13%|█▎        | 152/1208 [04:39<32:22,  1.84s/it, loss=0.138, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000668, train/loss_step=0.197, global_step=8795.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  13%|█▎        | 152/1208 [04:39<32:22,  1.84s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=1.65e-5, train/loss_step=0.00298, global_step=8795.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  13%|█▎        | 153/1208 [04:40<32:14,  1.83s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=1.65e-5, train/loss_step=0.00298, global_step=8795.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  13%|█▎        | 153/1208 [04:40<32:14,  1.83s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00942, train/loss_vlb_step=4.45e-5, train/loss_step=0.00942, global_step=8796.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  13%|█▎        | 154/1208 [04:41<32:07,  1.83s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00942, train/loss_vlb_step=4.45e-5, train/loss_step=0.00942, global_step=8796.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  13%|█▎        | 154/1208 [04:41<32:07,  1.83s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=2.46e-5, train/loss_step=0.00492, global_step=8796.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  13%|█▎        | 155/1208 [04:42<32:01,  1.82s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=2.46e-5, train/loss_step=0.00492, global_step=8796.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  13%|█▎        | 155/1208 [04:42<32:01,  1.82s/it, loss=0.134, v_num=0, train/loss_simple_step=0.443, train/loss_vlb_step=0.00342, train/loss_step=0.443, global_step=8796.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  13%|█▎        | 156/1208 [04:46<32:09,  1.83s/it, loss=0.134, v_num=0, train/loss_simple_step=0.443, train/loss_vlb_step=0.00342, train/loss_step=0.443, global_step=8796.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  13%|█▎        | 156/1208 [04:46<32:09,  1.83s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0731, train/loss_vlb_step=0.000245, train/loss_step=0.0731, global_step=8796.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  13%|█▎        | 157/1208 [04:47<32:01,  1.83s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0731, train/loss_vlb_step=0.000245, train/loss_step=0.0731, global_step=8796.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  13%|█▎        | 157/1208 [04:47<32:02,  1.83s/it, loss=0.142, v_num=0, train/loss_simple_step=0.546, train/loss_vlb_step=0.0139, train/loss_step=0.546, global_step=8797.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  13%|█▎        | 158/1208 [04:48<31:55,  1.82s/it, loss=0.142, v_num=0, train/loss_simple_step=0.546, train/loss_vlb_step=0.0139, train/loss_step=0.546, global_step=8797.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  13%|█▎        | 158/1208 [04:48<31:55,  1.82s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0731, train/loss_vlb_step=0.000242, train/loss_step=0.0731, global_step=8797.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  13%|█▎        | 159/1208 [04:49<31:48,  1.82s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0731, train/loss_vlb_step=0.000242, train/loss_step=0.0731, global_step=8797.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  13%|█▎        | 159/1208 [04:49<31:48,  1.82s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.000175, train/loss_step=0.0489, global_step=8797.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  13%|█▎        | 160/1208 [04:52<31:56,  1.83s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0489, train/loss_vlb_step=0.000175, train/loss_step=0.0489, global_step=8797.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  13%|█▎        | 160/1208 [04:52<31:56,  1.83s/it, loss=0.134, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000286, train/loss_step=0.087, global_step=8797.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  13%|█▎        | 161/1208 [04:53<31:49,  1.82s/it, loss=0.134, v_num=0, train/loss_simple_step=0.087, train/loss_vlb_step=0.000286, train/loss_step=0.087, global_step=8797.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  13%|█▎        | 161/1208 [04:53<31:49,  1.82s/it, loss=0.134, v_num=0, train/loss_simple_step=0.037, train/loss_vlb_step=0.00013, train/loss_step=0.037, global_step=8798.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  13%|█▎        | 162/1208 [04:54<31:42,  1.82s/it, loss=0.134, v_num=0, train/loss_simple_step=0.037, train/loss_vlb_step=0.00013, train/loss_step=0.037, global_step=8798.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  13%|█▎        | 162/1208 [04:54<31:42,  1.82s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.000184, train/loss_step=0.0527, global_step=8798.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  13%|█▎        | 163/1208 [04:55<31:36,  1.81s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.000184, train/loss_step=0.0527, global_step=8798.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  13%|█▎        | 163/1208 [04:55<31:36,  1.81s/it, loss=0.134, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=8798.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  14%|█▎        | 164/1208 [04:59<31:43,  1.82s/it, loss=0.134, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000432, train/loss_step=0.131, global_step=8798.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  14%|█▎        | 164/1208 [04:59<31:43,  1.82s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.72e-5, train/loss_step=0.0228, global_step=8798.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  14%|█▎        | 165/1208 [05:00<31:37,  1.82s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.72e-5, train/loss_step=0.0228, global_step=8798.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  14%|█▎        | 165/1208 [05:00<31:37,  1.82s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00924, train/loss_vlb_step=4.4e-5, train/loss_step=0.00924, global_step=8799.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  14%|█▎        | 166/1208 [05:01<31:30,  1.81s/it, loss=0.115, v_num=0, train/loss_simple_step=0.00924, train/loss_vlb_step=4.4e-5, train/loss_step=0.00924, global_step=8799.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  14%|█▎        | 166/1208 [05:01<31:30,  1.81s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0427, train/loss_vlb_step=0.000154, train/loss_step=0.0427, global_step=8799.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  14%|█▍        | 167/1208 [05:02<31:24,  1.81s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0427, train/loss_vlb_step=0.000154, train/loss_step=0.0427, global_step=8799.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  14%|█▍        | 167/1208 [05:02<31:24,  1.81s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=7.84e-5, train/loss_step=0.0207, global_step=8799.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  14%|█▍        | 168/1208 [05:05<31:31,  1.82s/it, loss=0.0941, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=7.84e-5, train/loss_step=0.0207, global_step=8799.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  14%|█▍        | 168/1208 [05:05<31:31,  1.82s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.28e-5, train/loss_step=0.00423, global_step=8799.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  14%|█▍        | 169/1208 [05:06<31:24,  1.81s/it, loss=0.0937, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.28e-5, train/loss_step=0.00423, global_step=8799.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  14%|█▍        | 169/1208 [05:06<31:25,  1.81s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=5.08e-5, train/loss_step=0.0107, global_step=8800.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  14%|█▍        | 170/1208 [05:07<31:18,  1.81s/it, loss=0.0909, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=5.08e-5, train/loss_step=0.0107, global_step=8800.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  14%|█▍        | 170/1208 [05:07<31:18,  1.81s/it, loss=0.093, v_num=0, train/loss_simple_step=0.0436, train/loss_vlb_step=0.000156, train/loss_step=0.0436, global_step=8800.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  14%|█▍        | 171/1208 [05:08<31:12,  1.81s/it, loss=0.093, v_num=0, train/loss_simple_step=0.0436, train/loss_vlb_step=0.000156, train/loss_step=0.0436, global_step=8800.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  14%|█▍        | 171/1208 [05:08<31:12,  1.81s/it, loss=0.098, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00134, train/loss_step=0.298, global_step=8800.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  14%|█▍        | 172/1208 [05:12<31:19,  1.81s/it, loss=0.098, v_num=0, train/loss_simple_step=0.298, train/loss_vlb_step=0.00134, train/loss_step=0.298, global_step=8800.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  14%|█▍        | 172/1208 [05:12<31:19,  1.81s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=6.87e-5, train/loss_step=0.0163, global_step=8800.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  14%|█▍        | 173/1208 [05:13<31:13,  1.81s/it, loss=0.0987, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=6.87e-5, train/loss_step=0.0163, global_step=8800.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  14%|█▍        | 173/1208 [05:13<31:13,  1.81s/it, loss=0.106, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.0005, train/loss_step=0.147, global_step=8801.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  14%|█▍        | 174/1208 [05:14<31:07,  1.81s/it, loss=0.106, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.0005, train/loss_step=0.147, global_step=8801.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  14%|█▍        | 174/1208 [05:14<31:07,  1.81s/it, loss=0.126, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00257, train/loss_step=0.404, global_step=8801.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  14%|█▍        | 175/1208 [05:15<31:01,  1.80s/it, loss=0.126, v_num=0, train/loss_simple_step=0.404, train/loss_vlb_step=0.00257, train/loss_step=0.404, global_step=8801.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  14%|█▍        | 175/1208 [05:15<31:01,  1.80s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0531, train/loss_vlb_step=0.000184, train/loss_step=0.0531, global_step=8801.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  15%|█▍        | 176/1208 [05:18<31:07,  1.81s/it, loss=0.106, v_num=0, train/loss_simple_step=0.0531, train/loss_vlb_step=0.000184, train/loss_step=0.0531, global_step=8801.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  15%|█▍        | 176/1208 [05:18<31:07,  1.81s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0943, train/loss_vlb_step=0.000312, train/loss_step=0.0943, global_step=8801.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  15%|█▍        | 177/1208 [05:19<31:01,  1.81s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0943, train/loss_vlb_step=0.000312, train/loss_step=0.0943, global_step=8801.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  15%|█▍        | 177/1208 [05:19<31:01,  1.81s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000354, train/loss_step=0.107, global_step=8802.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  15%|█▍        | 178/1208 [05:20<30:55,  1.80s/it, loss=0.0852, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000354, train/loss_step=0.107, global_step=8802.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  15%|█▍        | 178/1208 [05:20<30:55,  1.80s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.06e-5, train/loss_step=0.0108, global_step=8802.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  15%|█▍        | 179/1208 [05:21<30:49,  1.80s/it, loss=0.0821, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.06e-5, train/loss_step=0.0108, global_step=8802.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  15%|█▍        | 179/1208 [05:21<30:49,  1.80s/it, loss=0.083, v_num=0, train/loss_simple_step=0.0668, train/loss_vlb_step=0.000222, train/loss_step=0.0668, global_step=8802.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  15%|█▍        | 180/1208 [05:24<30:56,  1.81s/it, loss=0.083, v_num=0, train/loss_simple_step=0.0668, train/loss_vlb_step=0.000222, train/loss_step=0.0668, global_step=8802.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  15%|█▍        | 180/1208 [05:24<30:56,  1.81s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00132, train/loss_step=0.277, global_step=8802.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  15%|█▍        | 181/1208 [05:26<30:49,  1.80s/it, loss=0.0925, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00132, train/loss_step=0.277, global_step=8802.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  15%|█▍        | 181/1208 [05:26<30:49,  1.80s/it, loss=0.112, v_num=0, train/loss_simple_step=0.419, train/loss_vlb_step=0.00284, train/loss_step=0.419, global_step=8803.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  15%|█▌        | 182/1208 [05:27<30:44,  1.80s/it, loss=0.112, v_num=0, train/loss_simple_step=0.419, train/loss_vlb_step=0.00284, train/loss_step=0.419, global_step=8803.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  15%|█▌        | 182/1208 [05:27<30:44,  1.80s/it, loss=0.117, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000547, train/loss_step=0.157, global_step=8803.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  15%|█▌        | 183/1208 [05:28<30:38,  1.79s/it, loss=0.117, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000547, train/loss_step=0.157, global_step=8803.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  15%|█▌        | 183/1208 [05:28<30:38,  1.79s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.55e-5, train/loss_step=0.0178, global_step=8803.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  15%|█▌        | 184/1208 [05:31<30:44,  1.80s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.55e-5, train/loss_step=0.0178, global_step=8803.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  15%|█▌        | 184/1208 [05:31<30:44,  1.80s/it, loss=0.118, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000545, train/loss_step=0.159, global_step=8803.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  15%|█▌        | 185/1208 [05:32<30:39,  1.80s/it, loss=0.118, v_num=0, train/loss_simple_step=0.159, train/loss_vlb_step=0.000545, train/loss_step=0.159, global_step=8803.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  15%|█▌        | 185/1208 [05:32<30:39,  1.80s/it, loss=0.137, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00245, train/loss_step=0.395, global_step=8804.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  15%|█▌        | 186/1208 [05:33<30:33,  1.79s/it, loss=0.137, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00245, train/loss_step=0.395, global_step=8804.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  15%|█▌        | 186/1208 [05:33<30:33,  1.79s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0763, train/loss_vlb_step=0.000255, train/loss_step=0.0763, global_step=8804.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  15%|█▌        | 187/1208 [05:34<30:27,  1.79s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0763, train/loss_vlb_step=0.000255, train/loss_step=0.0763, global_step=8804.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  15%|█▌        | 187/1208 [05:34<30:27,  1.79s/it, loss=0.147, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000625, train/loss_step=0.174, global_step=8804.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  16%|█▌        | 188/1208 [05:37<30:33,  1.80s/it, loss=0.147, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000625, train/loss_step=0.174, global_step=8804.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  16%|█▌        | 188/1208 [05:37<30:33,  1.80s/it, loss=0.154, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.00052, train/loss_step=0.152, global_step=8804.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  16%|█▌        | 189/1208 [05:39<30:28,  1.79s/it, loss=0.154, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.00052, train/loss_step=0.152, global_step=8804.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  16%|█▌        | 189/1208 [05:39<30:28,  1.79s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.000157, train/loss_step=0.0441, global_step=8805.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  16%|█▌        | 190/1208 [05:40<30:22,  1.79s/it, loss=0.156, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.000157, train/loss_step=0.0441, global_step=8805.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  16%|█▌        | 190/1208 [05:40<30:22,  1.79s/it, loss=0.169, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00164, train/loss_step=0.306, global_step=8805.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  16%|█▌        | 191/1208 [05:41<30:16,  1.79s/it, loss=0.169, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00164, train/loss_step=0.306, global_step=8805.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  16%|█▌        | 191/1208 [05:41<30:16,  1.79s/it, loss=0.163, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000683, train/loss_step=0.179, global_step=8805.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  16%|█▌        | 192/1208 [05:44<30:23,  1.79s/it, loss=0.163, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000683, train/loss_step=0.179, global_step=8805.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  16%|█▌        | 192/1208 [05:44<30:23,  1.79s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0035, train/loss_vlb_step=1.91e-5, train/loss_step=0.0035, global_step=8805.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  16%|█▌        | 193/1208 [05:45<30:17,  1.79s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0035, train/loss_vlb_step=1.91e-5, train/loss_step=0.0035, global_step=8805.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  16%|█▌        | 193/1208 [05:45<30:17,  1.79s/it, loss=0.16, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000347, train/loss_step=0.105, global_step=8806.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  16%|█▌        | 194/1208 [05:46<30:12,  1.79s/it, loss=0.16, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000347, train/loss_step=0.105, global_step=8806.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  16%|█▌        | 194/1208 [05:46<30:12,  1.79s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000115, train/loss_step=0.0299, global_step=8806.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  16%|█▌        | 195/1208 [05:47<30:06,  1.78s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000115, train/loss_step=0.0299, global_step=8806.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  16%|█▌        | 195/1208 [05:47<30:06,  1.78s/it, loss=0.139, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.9e-5, train/loss_step=0.013, global_step=8806.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  16%|█▌        | 196/1208 [05:50<30:12,  1.79s/it, loss=0.139, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.9e-5, train/loss_step=0.013, global_step=8806.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  16%|█▌        | 196/1208 [05:50<30:12,  1.79s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.32e-5, train/loss_step=0.0149, global_step=8806.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  16%|█▋        | 197/1208 [05:52<30:06,  1.79s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.32e-5, train/loss_step=0.0149, global_step=8806.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  16%|█▋        | 197/1208 [05:52<30:06,  1.79s/it, loss=0.149, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00267, train/loss_step=0.375, global_step=8807.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  16%|█▋        | 198/1208 [05:53<30:01,  1.78s/it, loss=0.149, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00267, train/loss_step=0.375, global_step=8807.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  16%|█▋        | 198/1208 [05:53<30:01,  1.78s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0902, train/loss_vlb_step=0.000298, train/loss_step=0.0902, global_step=8807.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  16%|█▋        | 199/1208 [05:54<29:56,  1.78s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0902, train/loss_vlb_step=0.000298, train/loss_step=0.0902, global_step=8807.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  16%|█▋        | 199/1208 [05:54<29:56,  1.78s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00995, train/loss_vlb_step=4.75e-5, train/loss_step=0.00995, global_step=8807.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  17%|█▋        | 200/1208 [05:57<30:01,  1.79s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00995, train/loss_vlb_step=4.75e-5, train/loss_step=0.00995, global_step=8807.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  17%|█▋        | 200/1208 [05:57<30:01,  1.79s/it, loss=0.154, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00222, train/loss_step=0.365, global_step=8807.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  17%|█▋        | 201/1208 [05:58<29:56,  1.78s/it, loss=0.154, v_num=0, train/loss_simple_step=0.365, train/loss_vlb_step=0.00222, train/loss_step=0.365, global_step=8807.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  17%|█▋        | 201/1208 [05:58<29:56,  1.78s/it, loss=0.141, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.00058, train/loss_step=0.162, global_step=8808.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  17%|█▋        | 202/1208 [05:59<29:51,  1.78s/it, loss=0.141, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.00058, train/loss_step=0.162, global_step=8808.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  17%|█▋        | 202/1208 [05:59<29:51,  1.78s/it, loss=0.146, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00103, train/loss_step=0.254, global_step=8808.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  17%|█▋        | 203/1208 [06:00<29:45,  1.78s/it, loss=0.146, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00103, train/loss_step=0.254, global_step=8808.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  17%|█▋        | 203/1208 [06:00<29:45,  1.78s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00645, train/loss_vlb_step=3.16e-5, train/loss_step=0.00645, global_step=8808.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  17%|█▋        | 204/1208 [06:04<29:51,  1.78s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00645, train/loss_vlb_step=3.16e-5, train/loss_step=0.00645, global_step=8808.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  17%|█▋        | 204/1208 [06:04<29:51,  1.78s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00951, train/loss_vlb_step=4.38e-5, train/loss_step=0.00951, global_step=8808.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  17%|█▋        | 205/1208 [06:05<29:46,  1.78s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00951, train/loss_vlb_step=4.38e-5, train/loss_step=0.00951, global_step=8808.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  17%|█▋        | 205/1208 [06:05<29:46,  1.78s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00415, train/loss_vlb_step=2.22e-5, train/loss_step=0.00415, global_step=8809.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  17%|█▋        | 206/1208 [06:06<29:41,  1.78s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00415, train/loss_vlb_step=2.22e-5, train/loss_step=0.00415, global_step=8809.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  17%|█▋        | 206/1208 [06:06<29:41,  1.78s/it, loss=0.122, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000451, train/loss_step=0.135, global_step=8809.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  17%|█▋        | 207/1208 [06:07<29:35,  1.77s/it, loss=0.122, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000451, train/loss_step=0.135, global_step=8809.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  17%|█▋        | 207/1208 [06:07<29:35,  1.77s/it, loss=0.134, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00376, train/loss_step=0.414, global_step=8809.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  17%|█▋        | 208/1208 [06:10<29:41,  1.78s/it, loss=0.134, v_num=0, train/loss_simple_step=0.414, train/loss_vlb_step=0.00376, train/loss_step=0.414, global_step=8809.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  17%|█▋        | 208/1208 [06:10<29:41,  1.78s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000151, train/loss_step=0.0415, global_step=8809.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  17%|█▋        | 209/1208 [06:11<29:36,  1.78s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000151, train/loss_step=0.0415, global_step=8809.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  17%|█▋        | 209/1208 [06:11<29:36,  1.78s/it, loss=0.136, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000724, train/loss_step=0.203, global_step=8810.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  17%|█▋        | 210/1208 [06:12<29:31,  1.77s/it, loss=0.136, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000724, train/loss_step=0.203, global_step=8810.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  17%|█▋        | 210/1208 [06:12<29:31,  1.77s/it, loss=0.128, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000504, train/loss_step=0.151, global_step=8810.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  17%|█▋        | 211/1208 [06:13<29:26,  1.77s/it, loss=0.128, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000504, train/loss_step=0.151, global_step=8810.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  17%|█▋        | 211/1208 [06:13<29:26,  1.77s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00193, train/loss_vlb_step=1.15e-5, train/loss_step=0.00193, global_step=8810.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  18%|█▊        | 212/1208 [06:17<29:31,  1.78s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00193, train/loss_vlb_step=1.15e-5, train/loss_step=0.00193, global_step=8810.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  18%|█▊        | 212/1208 [06:17<29:31,  1.78s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.62e-5, train/loss_step=0.0135, global_step=8810.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  18%|█▊        | 213/1208 [06:18<29:26,  1.78s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.62e-5, train/loss_step=0.0135, global_step=8810.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  18%|█▊        | 213/1208 [06:18<29:26,  1.78s/it, loss=0.127, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00121, train/loss_step=0.254, global_step=8811.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  18%|█▊        | 214/1208 [06:19<29:21,  1.77s/it, loss=0.127, v_num=0, train/loss_simple_step=0.254, train/loss_vlb_step=0.00121, train/loss_step=0.254, global_step=8811.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  18%|█▊        | 214/1208 [06:19<29:21,  1.77s/it, loss=0.141, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00161, train/loss_step=0.293, global_step=8811.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  18%|█▊        | 215/1208 [06:20<29:16,  1.77s/it, loss=0.141, v_num=0, train/loss_simple_step=0.293, train/loss_vlb_step=0.00161, train/loss_step=0.293, global_step=8811.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  18%|█▊        | 215/1208 [06:20<29:16,  1.77s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00389, train/loss_vlb_step=2.11e-5, train/loss_step=0.00389, global_step=8811.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  18%|█▊        | 216/1208 [06:23<29:21,  1.78s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00389, train/loss_vlb_step=2.11e-5, train/loss_step=0.00389, global_step=8811.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  18%|█▊        | 216/1208 [06:23<29:21,  1.78s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.03e-5, train/loss_step=0.0139, global_step=8811.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  18%|█▊        | 217/1208 [06:24<29:16,  1.77s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.03e-5, train/loss_step=0.0139, global_step=8811.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  18%|█▊        | 217/1208 [06:24<29:16,  1.77s/it, loss=0.146, v_num=0, train/loss_simple_step=0.491, train/loss_vlb_step=0.00571, train/loss_step=0.491, global_step=8812.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  18%|█▊        | 218/1208 [06:25<29:11,  1.77s/it, loss=0.146, v_num=0, train/loss_simple_step=0.491, train/loss_vlb_step=0.00571, train/loss_step=0.491, global_step=8812.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  18%|█▊        | 218/1208 [06:25<29:11,  1.77s/it, loss=0.16, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00254, train/loss_step=0.369, global_step=8812.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  18%|█▊        | 219/1208 [06:26<29:06,  1.77s/it, loss=0.16, v_num=0, train/loss_simple_step=0.369, train/loss_vlb_step=0.00254, train/loss_step=0.369, global_step=8812.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  18%|█▊        | 219/1208 [06:26<29:06,  1.77s/it, loss=0.166, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000442, train/loss_step=0.134, global_step=8812.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  18%|█▊        | 220/1208 [06:30<29:11,  1.77s/it, loss=0.166, v_num=0, train/loss_simple_step=0.134, train/loss_vlb_step=0.000442, train/loss_step=0.134, global_step=8812.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  18%|█▊        | 220/1208 [06:30<29:11,  1.77s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=6.99e-5, train/loss_step=0.0175, global_step=8812.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  18%|█▊        | 221/1208 [06:31<29:06,  1.77s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=6.99e-5, train/loss_step=0.0175, global_step=8812.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  18%|█▊        | 221/1208 [06:31<29:06,  1.77s/it, loss=0.163, v_num=0, train/loss_simple_step=0.444, train/loss_vlb_step=0.00455, train/loss_step=0.444, global_step=8813.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  18%|█▊        | 222/1208 [06:32<29:01,  1.77s/it, loss=0.163, v_num=0, train/loss_simple_step=0.444, train/loss_vlb_step=0.00455, train/loss_step=0.444, global_step=8813.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  18%|█▊        | 222/1208 [06:32<29:01,  1.77s/it, loss=0.155, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=8813.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  18%|█▊        | 223/1208 [06:33<28:56,  1.76s/it, loss=0.155, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=8813.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  18%|█▊        | 223/1208 [06:33<28:56,  1.76s/it, loss=0.165, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000742, train/loss_step=0.197, global_step=8813.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  19%|█▊        | 224/1208 [06:36<29:01,  1.77s/it, loss=0.165, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000742, train/loss_step=0.197, global_step=8813.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  19%|█▊        | 224/1208 [06:36<29:01,  1.77s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00596, train/loss_vlb_step=3e-5, train/loss_step=0.00596, global_step=8813.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  19%|█▊        | 225/1208 [06:37<28:56,  1.77s/it, loss=0.165, v_num=0, train/loss_simple_step=0.00596, train/loss_vlb_step=3e-5, train/loss_step=0.00596, global_step=8813.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  19%|█▊        | 225/1208 [06:37<28:56,  1.77s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000146, train/loss_step=0.0409, global_step=8814.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  19%|█▊        | 226/1208 [06:38<28:52,  1.76s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.000146, train/loss_step=0.0409, global_step=8814.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  19%|█▊        | 226/1208 [06:38<28:52,  1.76s/it, loss=0.168, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000549, train/loss_step=0.157, global_step=8814.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  19%|█▉        | 227/1208 [06:39<28:47,  1.76s/it, loss=0.168, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000549, train/loss_step=0.157, global_step=8814.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  19%|█▉        | 227/1208 [06:39<28:47,  1.76s/it, loss=0.168, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00347, train/loss_step=0.427, global_step=8814.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  19%|█▉        | 228/1208 [06:43<28:52,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.427, train/loss_vlb_step=0.00347, train/loss_step=0.427, global_step=8814.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  19%|█▉        | 228/1208 [06:43<28:52,  1.77s/it, loss=0.167, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.98e-5, train/loss_step=0.011, global_step=8814.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  19%|█▉        | 229/1208 [06:44<28:47,  1.76s/it, loss=0.167, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.98e-5, train/loss_step=0.011, global_step=8814.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  19%|█▉        | 229/1208 [06:44<28:47,  1.76s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0687, train/loss_vlb_step=0.000233, train/loss_step=0.0687, global_step=8815.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  19%|█▉        | 230/1208 [06:45<28:42,  1.76s/it, loss=0.16, v_num=0, train/loss_simple_step=0.0687, train/loss_vlb_step=0.000233, train/loss_step=0.0687, global_step=8815.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  19%|█▉        | 230/1208 [06:45<28:42,  1.76s/it, loss=0.16, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000485, train/loss_step=0.145, global_step=8815.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  19%|█▉        | 231/1208 [06:46<28:38,  1.76s/it, loss=0.16, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.000485, train/loss_step=0.145, global_step=8815.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  19%|█▉        | 231/1208 [06:46<28:38,  1.76s/it, loss=0.171, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000934, train/loss_step=0.219, global_step=8815.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  19%|█▉        | 232/1208 [06:49<28:43,  1.77s/it, loss=0.171, v_num=0, train/loss_simple_step=0.219, train/loss_vlb_step=0.000934, train/loss_step=0.219, global_step=8815.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  19%|█▉        | 232/1208 [06:49<28:43,  1.77s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00712, train/loss_vlb_step=3.64e-5, train/loss_step=0.00712, global_step=8815.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  19%|█▉        | 233/1208 [06:50<28:38,  1.76s/it, loss=0.17, v_num=0, train/loss_simple_step=0.00712, train/loss_vlb_step=3.64e-5, train/loss_step=0.00712, global_step=8815.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  19%|█▉        | 233/1208 [06:50<28:38,  1.76s/it, loss=0.166, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.00063, train/loss_step=0.174, global_step=8816.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  19%|█▉        | 234/1208 [06:51<28:33,  1.76s/it, loss=0.166, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.00063, train/loss_step=0.174, global_step=8816.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  19%|█▉        | 234/1208 [06:51<28:33,  1.76s/it, loss=0.182, v_num=0, train/loss_simple_step=0.598, train/loss_vlb_step=0.00827, train/loss_step=0.598, global_step=8816.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  19%|█▉        | 235/1208 [06:52<28:29,  1.76s/it, loss=0.182, v_num=0, train/loss_simple_step=0.598, train/loss_vlb_step=0.00827, train/loss_step=0.598, global_step=8816.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  19%|█▉        | 235/1208 [06:52<28:29,  1.76s/it, loss=0.189, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000476, train/loss_step=0.144, global_step=8816.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  20%|█▉        | 236/1208 [06:56<28:33,  1.76s/it, loss=0.189, v_num=0, train/loss_simple_step=0.144, train/loss_vlb_step=0.000476, train/loss_step=0.144, global_step=8816.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  20%|█▉        | 236/1208 [06:56<28:33,  1.76s/it, loss=0.206, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.0017, train/loss_step=0.353, global_step=8816.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  20%|█▉        | 237/1208 [06:57<28:29,  1.76s/it, loss=0.206, v_num=0, train/loss_simple_step=0.353, train/loss_vlb_step=0.0017, train/loss_step=0.353, global_step=8816.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  20%|█▉        | 237/1208 [06:57<28:29,  1.76s/it, loss=0.204, v_num=0, train/loss_simple_step=0.462, train/loss_vlb_step=0.0046, train/loss_step=0.462, global_step=8817.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  20%|█▉        | 238/1208 [06:58<28:24,  1.76s/it, loss=0.204, v_num=0, train/loss_simple_step=0.462, train/loss_vlb_step=0.0046, train/loss_step=0.462, global_step=8817.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  20%|█▉        | 238/1208 [06:58<28:24,  1.76s/it, loss=0.202, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00165, train/loss_step=0.321, global_step=8817.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  20%|█▉        | 239/1208 [06:59<28:20,  1.75s/it, loss=0.202, v_num=0, train/loss_simple_step=0.321, train/loss_vlb_step=0.00165, train/loss_step=0.321, global_step=8817.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  20%|█▉        | 239/1208 [06:59<28:20,  1.75s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000145, train/loss_step=0.0386, global_step=8817.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  20%|█▉        | 240/1208 [07:02<28:24,  1.76s/it, loss=0.197, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.000145, train/loss_step=0.0386, global_step=8817.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  20%|█▉        | 240/1208 [07:02<28:24,  1.76s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000158, train/loss_step=0.0445, global_step=8817.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  20%|█▉        | 241/1208 [07:03<28:20,  1.76s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0445, train/loss_vlb_step=0.000158, train/loss_step=0.0445, global_step=8817.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  20%|█▉        | 241/1208 [07:03<28:20,  1.76s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000144, train/loss_step=0.0402, global_step=8818.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  20%|██        | 242/1208 [07:04<28:15,  1.76s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0402, train/loss_vlb_step=0.000144, train/loss_step=0.0402, global_step=8818.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  20%|██        | 242/1208 [07:04<28:15,  1.76s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=1.74e-5, train/loss_step=0.00315, global_step=8818.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  20%|██        | 243/1208 [07:05<28:11,  1.75s/it, loss=0.173, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=1.74e-5, train/loss_step=0.00315, global_step=8818.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  20%|██        | 243/1208 [07:05<28:11,  1.75s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00564, train/loss_vlb_step=2.82e-5, train/loss_step=0.00564, global_step=8818.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  20%|██        | 244/1208 [07:09<28:15,  1.76s/it, loss=0.163, v_num=0, train/loss_simple_step=0.00564, train/loss_vlb_step=2.82e-5, train/loss_step=0.00564, global_step=8818.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  20%|██        | 244/1208 [07:09<28:15,  1.76s/it, loss=0.184, v_num=0, train/loss_simple_step=0.429, train/loss_vlb_step=0.00558, train/loss_step=0.429, global_step=8818.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  20%|██        | 245/1208 [07:10<28:11,  1.76s/it, loss=0.184, v_num=0, train/loss_simple_step=0.429, train/loss_vlb_step=0.00558, train/loss_step=0.429, global_step=8818.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  20%|██        | 245/1208 [07:10<28:11,  1.76s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000106, train/loss_step=0.0264, global_step=8819.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  20%|██        | 246/1208 [07:11<28:06,  1.75s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000106, train/loss_step=0.0264, global_step=8819.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  20%|██        | 246/1208 [07:11<28:06,  1.75s/it, loss=0.19, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00116, train/loss_step=0.277, global_step=8819.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  20%|██        | 247/1208 [07:12<28:02,  1.75s/it, loss=0.19, v_num=0, train/loss_simple_step=0.277, train/loss_vlb_step=0.00116, train/loss_step=0.277, global_step=8819.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  20%|██        | 247/1208 [07:12<28:02,  1.75s/it, loss=0.174, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000393, train/loss_step=0.119, global_step=8819.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  21%|██        | 248/1208 [07:15<28:06,  1.76s/it, loss=0.174, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000393, train/loss_step=0.119, global_step=8819.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  21%|██        | 248/1208 [07:15<28:06,  1.76s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00668, train/loss_vlb_step=3.32e-5, train/loss_step=0.00668, global_step=8819.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  21%|██        | 249/1208 [07:16<28:01,  1.75s/it, loss=0.174, v_num=0, train/loss_simple_step=0.00668, train/loss_vlb_step=3.32e-5, train/loss_step=0.00668, global_step=8819.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  21%|██        | 249/1208 [07:16<28:01,  1.75s/it, loss=0.175, v_num=0, train/loss_simple_step=0.078, train/loss_vlb_step=0.000262, train/loss_step=0.078, global_step=8820.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  21%|██        | 250/1208 [07:17<27:57,  1.75s/it, loss=0.175, v_num=0, train/loss_simple_step=0.078, train/loss_vlb_step=0.000262, train/loss_step=0.078, global_step=8820.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  21%|██        | 250/1208 [07:17<27:57,  1.75s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000305, train/loss_step=0.0901, global_step=8820.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  21%|██        | 251/1208 [07:18<27:53,  1.75s/it, loss=0.172, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000305, train/loss_step=0.0901, global_step=8820.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  21%|██        | 251/1208 [07:18<27:53,  1.75s/it, loss=0.169, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000583, train/loss_step=0.169, global_step=8820.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  21%|██        | 252/1208 [07:22<27:57,  1.75s/it, loss=0.169, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000583, train/loss_step=0.169, global_step=8820.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  21%|██        | 252/1208 [07:22<27:57,  1.75s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0461, train/loss_vlb_step=0.000158, train/loss_step=0.0461, global_step=8820.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  21%|██        | 253/1208 [07:23<27:53,  1.75s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0461, train/loss_vlb_step=0.000158, train/loss_step=0.0461, global_step=8820.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  21%|██        | 253/1208 [07:23<27:53,  1.75s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.21e-5, train/loss_step=0.0111, global_step=8821.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  21%|██        | 254/1208 [07:24<27:49,  1.75s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.21e-5, train/loss_step=0.0111, global_step=8821.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  21%|██        | 254/1208 [07:24<27:49,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.053, train/loss_vlb_step=0.00019, train/loss_step=0.053, global_step=8821.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  21%|██        | 255/1208 [07:25<27:44,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.053, train/loss_vlb_step=0.00019, train/loss_step=0.053, global_step=8821.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  21%|██        | 255/1208 [07:25<27:44,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.73e-5, train/loss_step=0.0128, global_step=8821.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  21%|██        | 256/1208 [07:28<27:49,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.73e-5, train/loss_step=0.0128, global_step=8821.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  21%|██        | 256/1208 [07:28<27:49,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.533, train/loss_vlb_step=0.00975, train/loss_step=0.533, global_step=8821.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  21%|██▏       | 257/1208 [07:29<27:44,  1.75s/it, loss=0.138, v_num=0, train/loss_simple_step=0.533, train/loss_vlb_step=0.00975, train/loss_step=0.533, global_step=8821.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  21%|██▏       | 257/1208 [07:29<27:44,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=5.96e-5, train/loss_step=0.0138, global_step=8822.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  21%|██▏       | 258/1208 [07:30<27:40,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=5.96e-5, train/loss_step=0.0138, global_step=8822.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  21%|██▏       | 258/1208 [07:30<27:40,  1.75s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.67e-5, train/loss_step=0.00288, global_step=8822.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  21%|██▏       | 259/1208 [07:32<27:36,  1.75s/it, loss=0.1, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.67e-5, train/loss_step=0.00288, global_step=8822.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  21%|██▏       | 259/1208 [07:32<27:36,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00288, train/loss_step=0.425, global_step=8822.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  22%|██▏       | 260/1208 [07:35<27:39,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00288, train/loss_step=0.425, global_step=8822.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  22%|██▏       | 260/1208 [07:35<27:39,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.000125, train/loss_step=0.034, global_step=8822.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  22%|██▏       | 261/1208 [07:36<27:35,  1.75s/it, loss=0.119, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.000125, train/loss_step=0.034, global_step=8822.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  22%|██▏       | 261/1208 [07:36<27:35,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00103, train/loss_step=0.239, global_step=8823.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  22%|██▏       | 262/1208 [07:37<27:31,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00103, train/loss_step=0.239, global_step=8823.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  22%|██▏       | 262/1208 [07:37<27:31,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00159, train/loss_vlb_step=9.51e-6, train/loss_step=0.00159, global_step=8823.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  22%|██▏       | 263/1208 [07:38<27:27,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00159, train/loss_vlb_step=9.51e-6, train/loss_step=0.00159, global_step=8823.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  22%|██▏       | 263/1208 [07:38<27:27,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=8823.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  22%|██▏       | 264/1208 [07:41<27:30,  1.75s/it, loss=0.134, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000364, train/loss_step=0.111, global_step=8823.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  22%|██▏       | 264/1208 [07:41<27:31,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0577, train/loss_vlb_step=0.000196, train/loss_step=0.0577, global_step=8823.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  22%|██▏       | 265/1208 [07:42<27:26,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0577, train/loss_vlb_step=0.000196, train/loss_step=0.0577, global_step=8823.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  22%|██▏       | 265/1208 [07:42<27:26,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00116, train/loss_step=0.274, global_step=8824.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  22%|██▏       | 266/1208 [07:43<27:22,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.274, train/loss_vlb_step=0.00116, train/loss_step=0.274, global_step=8824.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  22%|██▏       | 266/1208 [07:43<27:22,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.55e-5, train/loss_step=0.0178, global_step=8824.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  22%|██▏       | 267/1208 [07:44<27:18,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.55e-5, train/loss_step=0.0178, global_step=8824.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  22%|██▏       | 267/1208 [07:44<27:18,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000149, train/loss_step=0.0405, global_step=8824.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  22%|██▏       | 268/1208 [07:48<27:22,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.0405, train/loss_vlb_step=0.000149, train/loss_step=0.0405, global_step=8824.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  22%|██▏       | 268/1208 [07:48<27:22,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00486, train/loss_vlb_step=2.62e-5, train/loss_step=0.00486, global_step=8824.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  22%|██▏       | 269/1208 [07:49<27:18,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00486, train/loss_vlb_step=2.62e-5, train/loss_step=0.00486, global_step=8824.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  22%|██▏       | 269/1208 [07:49<27:18,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=2.57e-5, train/loss_step=0.00518, global_step=8825.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  22%|██▏       | 270/1208 [07:50<27:13,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=2.57e-5, train/loss_step=0.00518, global_step=8825.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  22%|██▏       | 270/1208 [07:50<27:13,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.12e-5, train/loss_step=0.00188, global_step=8825.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  22%|██▏       | 271/1208 [07:51<27:09,  1.74s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.12e-5, train/loss_step=0.00188, global_step=8825.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  22%|██▏       | 271/1208 [07:51<27:09,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00336, train/loss_step=0.439, global_step=8825.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  23%|██▎       | 272/1208 [07:54<27:13,  1.75s/it, loss=0.116, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00336, train/loss_step=0.439, global_step=8825.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  23%|██▎       | 272/1208 [07:54<27:13,  1.75s/it, loss=0.121, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000476, train/loss_step=0.141, global_step=8825.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  23%|██▎       | 273/1208 [07:55<27:09,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.141, train/loss_vlb_step=0.000476, train/loss_step=0.141, global_step=8825.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  23%|██▎       | 273/1208 [07:55<27:09,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.49e-5, train/loss_step=0.0121, global_step=8826.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  23%|██▎       | 274/1208 [07:56<27:05,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.49e-5, train/loss_step=0.0121, global_step=8826.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  23%|██▎       | 274/1208 [07:56<27:05,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000435, train/loss_step=0.132, global_step=8826.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  23%|██▎       | 275/1208 [07:57<27:01,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000435, train/loss_step=0.132, global_step=8826.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  23%|██▎       | 275/1208 [07:57<27:01,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0826, train/loss_vlb_step=0.000275, train/loss_step=0.0826, global_step=8826.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  23%|██▎       | 276/1208 [08:01<27:04,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0826, train/loss_vlb_step=0.000275, train/loss_step=0.0826, global_step=8826.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  23%|██▎       | 276/1208 [08:01<27:04,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.0017, train/loss_step=0.327, global_step=8826.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  23%|██▎       | 277/1208 [08:02<27:00,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.327, train/loss_vlb_step=0.0017, train/loss_step=0.327, global_step=8826.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  23%|██▎       | 277/1208 [08:02<27:00,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00764, train/loss_vlb_step=3.82e-5, train/loss_step=0.00764, global_step=8827.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  23%|██▎       | 278/1208 [08:03<26:57,  1.74s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00764, train/loss_vlb_step=3.82e-5, train/loss_step=0.00764, global_step=8827.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  23%|██▎       | 278/1208 [08:03<26:57,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000552, train/loss_step=0.163, global_step=8827.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  23%|██▎       | 279/1208 [08:04<26:53,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000552, train/loss_step=0.163, global_step=8827.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  23%|██▎       | 279/1208 [08:04<26:53,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.471, train/loss_vlb_step=0.00638, train/loss_step=0.471, global_step=8827.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  23%|██▎       | 280/1208 [08:07<26:56,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.471, train/loss_vlb_step=0.00638, train/loss_step=0.471, global_step=8827.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  23%|██▎       | 280/1208 [08:07<26:56,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000754, train/loss_step=0.212, global_step=8827.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  23%|██▎       | 281/1208 [08:08<26:52,  1.74s/it, loss=0.137, v_num=0, train/loss_simple_step=0.212, train/loss_vlb_step=0.000754, train/loss_step=0.212, global_step=8827.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  23%|██▎       | 281/1208 [08:08<26:52,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00317, train/loss_step=0.383, global_step=8828.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  23%|██▎       | 282/1208 [08:09<26:48,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.383, train/loss_vlb_step=0.00317, train/loss_step=0.383, global_step=8828.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  23%|██▎       | 282/1208 [08:09<26:48,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.039, train/loss_vlb_step=0.00014, train/loss_step=0.039, global_step=8828.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  23%|██▎       | 283/1208 [08:11<26:45,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.039, train/loss_vlb_step=0.00014, train/loss_step=0.039, global_step=8828.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  23%|██▎       | 283/1208 [08:11<26:45,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.0024, train/loss_step=0.360, global_step=8828.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  24%|██▎       | 284/1208 [08:14<26:48,  1.74s/it, loss=0.159, v_num=0, train/loss_simple_step=0.360, train/loss_vlb_step=0.0024, train/loss_step=0.360, global_step=8828.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  24%|██▎       | 284/1208 [08:14<26:48,  1.74s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00406, train/loss_vlb_step=2.14e-5, train/loss_step=0.00406, global_step=8828.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  24%|██▎       | 285/1208 [08:15<26:44,  1.74s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00406, train/loss_vlb_step=2.14e-5, train/loss_step=0.00406, global_step=8828.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  24%|██▎       | 285/1208 [08:15<26:44,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00881, train/loss_vlb_step=4.15e-5, train/loss_step=0.00881, global_step=8829.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  24%|██▎       | 286/1208 [08:16<26:40,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00881, train/loss_vlb_step=4.15e-5, train/loss_step=0.00881, global_step=8829.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  24%|██▎       | 286/1208 [08:16<26:40,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0845, train/loss_vlb_step=0.000278, train/loss_step=0.0845, global_step=8829.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  24%|██▍       | 287/1208 [08:17<26:36,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0845, train/loss_vlb_step=0.000278, train/loss_step=0.0845, global_step=8829.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  24%|██▍       | 287/1208 [08:17<26:36,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0591, train/loss_vlb_step=0.000199, train/loss_step=0.0591, global_step=8829.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  24%|██▍       | 288/1208 [08:20<26:40,  1.74s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0591, train/loss_vlb_step=0.000199, train/loss_step=0.0591, global_step=8829.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  24%|██▍       | 288/1208 [08:20<26:40,  1.74s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.52e-5, train/loss_step=0.00272, global_step=8829.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  24%|██▍       | 289/1208 [08:22<26:36,  1.74s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.52e-5, train/loss_step=0.00272, global_step=8829.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  24%|██▍       | 289/1208 [08:22<26:36,  1.74s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=1.88e-5, train/loss_step=0.00345, global_step=8830.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  24%|██▍       | 290/1208 [08:23<26:32,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=1.88e-5, train/loss_step=0.00345, global_step=8830.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  24%|██▍       | 290/1208 [08:23<26:32,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.070, train/loss_vlb_step=0.000237, train/loss_step=0.070, global_step=8830.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  24%|██▍       | 291/1208 [08:24<26:28,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.070, train/loss_vlb_step=0.000237, train/loss_step=0.070, global_step=8830.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  24%|██▍       | 291/1208 [08:24<26:28,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00186, train/loss_step=0.348, global_step=8830.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  24%|██▍       | 292/1208 [08:27<26:31,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.348, train/loss_vlb_step=0.00186, train/loss_step=0.348, global_step=8830.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  24%|██▍       | 292/1208 [08:27<26:31,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.000172, train/loss_step=0.0482, global_step=8830.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  24%|██▍       | 293/1208 [08:28<26:28,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.000172, train/loss_step=0.0482, global_step=8830.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  24%|██▍       | 293/1208 [08:28<26:28,  1.74s/it, loss=0.148, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000515, train/loss_step=0.152, global_step=8831.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  24%|██▍       | 294/1208 [08:29<26:24,  1.73s/it, loss=0.148, v_num=0, train/loss_simple_step=0.152, train/loss_vlb_step=0.000515, train/loss_step=0.152, global_step=8831.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  24%|██▍       | 294/1208 [08:29<26:24,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000297, train/loss_step=0.0901, global_step=8831.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  24%|██▍       | 295/1208 [08:30<26:20,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0901, train/loss_vlb_step=0.000297, train/loss_step=0.0901, global_step=8831.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  24%|██▍       | 295/1208 [08:30<26:20,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000802, train/loss_step=0.223, global_step=8831.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  25%|██▍       | 296/1208 [08:34<26:23,  1.74s/it, loss=0.153, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000802, train/loss_step=0.223, global_step=8831.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  25%|██▍       | 296/1208 [08:34<26:23,  1.74s/it, loss=0.143, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.0004, train/loss_step=0.122, global_step=8831.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  25%|██▍       | 297/1208 [08:35<26:19,  1.73s/it, loss=0.143, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.0004, train/loss_step=0.122, global_step=8831.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  25%|██▍       | 297/1208 [08:35<26:20,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000636, train/loss_step=0.180, global_step=8832.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  25%|██▍       | 298/1208 [08:36<26:16,  1.73s/it, loss=0.151, v_num=0, train/loss_simple_step=0.180, train/loss_vlb_step=0.000636, train/loss_step=0.180, global_step=8832.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  25%|██▍       | 298/1208 [08:36<26:16,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.38e-5, train/loss_step=0.0121, global_step=8832.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  25%|██▍       | 299/1208 [08:37<26:12,  1.73s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.38e-5, train/loss_step=0.0121, global_step=8832.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  25%|██▍       | 299/1208 [08:37<26:12,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0515, train/loss_vlb_step=0.000179, train/loss_step=0.0515, global_step=8832.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  25%|██▍       | 300/1208 [08:40<26:15,  1.73s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0515, train/loss_vlb_step=0.000179, train/loss_step=0.0515, global_step=8832.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  25%|██▍       | 300/1208 [08:40<26:15,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0877, train/loss_vlb_step=0.00029, train/loss_step=0.0877, global_step=8832.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] 
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.71it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.73it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.72it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.73it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:28,  1.70it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:28,  1.71it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.74it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.71it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.72it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.78it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.73it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.74it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.72it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.74it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:26,  1.72it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.73it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.75it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.73it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.70it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.79it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.75it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.74it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:25,  1.71it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.76it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.74it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.72it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.76it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.76it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.73it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.78it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:23,  1.74it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.80it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.77it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.74it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.78it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.79it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.75it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.80it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.75it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.75it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.79it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.76it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:20,  1.74it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:18,  1.80it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.76it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.74it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.80it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.75it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:19,  1.74it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.80it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.76it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.74it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.80it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.76it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.73it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.80it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.72it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.80it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.76it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.73it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.79it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.76it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:16,  1.73it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.77it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.77it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.73it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.76it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.75it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:14,  1.77it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.78it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.74it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.76it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.76it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.75it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.76it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.76it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.75it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.75it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.76it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:16<00:12,  1.74it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.75it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:12,  1.74it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.74it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.74it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.75it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.75it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.78it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.75it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.78it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:08,  1.78it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:19<00:09,  1.75it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.75it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.74it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.75it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.76it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.78it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:20<00:08,  1.74it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.76it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:08,  1.74it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.77it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.73it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.78it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.74it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.74it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.76it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.78it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.73it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.75it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.78it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:23<00:05,  1.72it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.74it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.75it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.73it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.75it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.75it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.79it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:24<00:04,  1.74it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.75it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.78it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.74it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.73it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.76it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.78it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.74it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.74it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.78it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.74it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.75it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.77it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.79it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.75it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.78it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.78it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:27<00:01,  1.74it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.78it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.78it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.75it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.78it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:28<00:00,  1.74it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.74it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.74it/s]Epoch 29:  25%|██▍       | 301/1208 [09:11<27:42,  1.83s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0877, train/loss_vlb_step=0.00029, train/loss_step=0.0877, global_step=8832.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  25%|██▍       | 301/1208 [09:11<27:42,  1.83s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.7e-5, train/loss_step=0.0164, global_step=8833.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  25%|██▌       | 302/1208 [09:12<27:38,  1.83s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.7e-5, train/loss_step=0.0164, global_step=8833.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  25%|██▌       | 302/1208 [09:12<27:38,  1.83s/it, loss=0.141, v_num=0, train/loss_simple_step=0.890, train/loss_vlb_step=0.0652, train/loss_step=0.890, global_step=8833.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  25%|██▌       | 303/1208 [09:13<27:34,  1.83s/it, loss=0.141, v_num=0, train/loss_simple_step=0.890, train/loss_vlb_step=0.0652, train/loss_step=0.890, global_step=8833.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  25%|██▌       | 303/1208 [09:13<27:34,  1.83s/it, loss=0.123, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.69e-5, train/loss_step=0.003, global_step=8833.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  25%|██▌       | 304/1208 [09:16<27:36,  1.83s/it, loss=0.123, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.69e-5, train/loss_step=0.003, global_step=8833.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  25%|██▌       | 304/1208 [09:16<27:36,  1.83s/it, loss=0.129, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000433, train/loss_step=0.129, global_step=8833.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  25%|██▌       | 305/1208 [09:17<27:32,  1.83s/it, loss=0.129, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000433, train/loss_step=0.129, global_step=8833.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  25%|██▌       | 305/1208 [09:17<27:32,  1.83s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0825, train/loss_vlb_step=0.000277, train/loss_step=0.0825, global_step=8834.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  25%|██▌       | 306/1208 [09:19<27:27,  1.83s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0825, train/loss_vlb_step=0.000277, train/loss_step=0.0825, global_step=8834.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  25%|██▌       | 306/1208 [09:19<27:27,  1.83s/it, loss=0.134, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000339, train/loss_step=0.102, global_step=8834.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  25%|██▌       | 307/1208 [09:20<27:23,  1.82s/it, loss=0.134, v_num=0, train/loss_simple_step=0.102, train/loss_vlb_step=0.000339, train/loss_step=0.102, global_step=8834.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  25%|██▌       | 307/1208 [09:20<27:23,  1.82s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0607, train/loss_vlb_step=0.000209, train/loss_step=0.0607, global_step=8834.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  25%|██▌       | 308/1208 [09:23<27:26,  1.83s/it, loss=0.134, v_num=0, train/loss_simple_step=0.0607, train/loss_vlb_step=0.000209, train/loss_step=0.0607, global_step=8834.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  25%|██▌       | 308/1208 [09:23<27:26,  1.83s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0771, train/loss_vlb_step=0.000258, train/loss_step=0.0771, global_step=8834.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  26%|██▌       | 309/1208 [09:24<27:22,  1.83s/it, loss=0.137, v_num=0, train/loss_simple_step=0.0771, train/loss_vlb_step=0.000258, train/loss_step=0.0771, global_step=8834.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  26%|██▌       | 309/1208 [09:24<27:22,  1.83s/it, loss=0.147, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.00069, train/loss_step=0.189, global_step=8835.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  26%|██▌       | 310/1208 [09:25<27:18,  1.82s/it, loss=0.147, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.00069, train/loss_step=0.189, global_step=8835.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  26%|██▌       | 310/1208 [09:25<27:18,  1.82s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00437, train/loss_vlb_step=2.33e-5, train/loss_step=0.00437, global_step=8835.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  26%|██▌       | 311/1208 [09:26<27:14,  1.82s/it, loss=0.143, v_num=0, train/loss_simple_step=0.00437, train/loss_vlb_step=2.33e-5, train/loss_step=0.00437, global_step=8835.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  26%|██▌       | 311/1208 [09:26<27:14,  1.82s/it, loss=0.14, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00131, train/loss_step=0.284, global_step=8835.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]     Epoch 29:  26%|██▌       | 312/1208 [09:29<27:16,  1.83s/it, loss=0.14, v_num=0, train/loss_simple_step=0.284, train/loss_vlb_step=0.00131, train/loss_step=0.284, global_step=8835.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  26%|██▌       | 312/1208 [09:29<27:16,  1.83s/it, loss=0.144, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000407, train/loss_step=0.122, global_step=8835.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  26%|██▌       | 313/1208 [09:30<27:12,  1.82s/it, loss=0.144, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000407, train/loss_step=0.122, global_step=8835.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  26%|██▌       | 313/1208 [09:30<27:12,  1.82s/it, loss=0.147, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000831, train/loss_step=0.217, global_step=8836.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  26%|██▌       | 314/1208 [09:31<27:08,  1.82s/it, loss=0.147, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000831, train/loss_step=0.217, global_step=8836.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  26%|██▌       | 314/1208 [09:31<27:08,  1.82s/it, loss=0.149, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000405, train/loss_step=0.122, global_step=8836.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  26%|██▌       | 315/1208 [09:33<27:04,  1.82s/it, loss=0.149, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000405, train/loss_step=0.122, global_step=8836.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  26%|██▌       | 315/1208 [09:33<27:04,  1.82s/it, loss=0.145, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000501, train/loss_step=0.147, global_step=8836.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  26%|██▌       | 316/1208 [09:36<27:06,  1.82s/it, loss=0.145, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000501, train/loss_step=0.147, global_step=8836.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  26%|██▌       | 316/1208 [09:36<27:06,  1.82s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.38e-5, train/loss_step=0.0149, global_step=8836.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  26%|██▌       | 317/1208 [09:37<27:03,  1.82s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.38e-5, train/loss_step=0.0149, global_step=8836.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  26%|██▌       | 317/1208 [09:37<27:03,  1.82s/it, loss=0.156, v_num=0, train/loss_simple_step=0.503, train/loss_vlb_step=0.00667, train/loss_step=0.503, global_step=8837.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  26%|██▋       | 318/1208 [09:38<26:59,  1.82s/it, loss=0.156, v_num=0, train/loss_simple_step=0.503, train/loss_vlb_step=0.00667, train/loss_step=0.503, global_step=8837.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  26%|██▋       | 318/1208 [09:38<26:59,  1.82s/it, loss=0.168, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00107, train/loss_step=0.258, global_step=8837.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  26%|██▋       | 319/1208 [09:39<26:55,  1.82s/it, loss=0.168, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00107, train/loss_step=0.258, global_step=8837.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  26%|██▋       | 319/1208 [09:39<26:55,  1.82s/it, loss=0.199, v_num=0, train/loss_simple_step=0.667, train/loss_vlb_step=0.0187, train/loss_step=0.667, global_step=8837.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  26%|██▋       | 320/1208 [09:42<26:57,  1.82s/it, loss=0.199, v_num=0, train/loss_simple_step=0.667, train/loss_vlb_step=0.0187, train/loss_step=0.667, global_step=8837.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  26%|██▋       | 320/1208 [09:42<26:57,  1.82s/it, loss=0.202, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000509, train/loss_step=0.146, global_step=8837.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  27%|██▋       | 321/1208 [09:44<26:53,  1.82s/it, loss=0.202, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000509, train/loss_step=0.146, global_step=8837.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  27%|██▋       | 321/1208 [09:44<26:53,  1.82s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.000148, train/loss_step=0.0418, global_step=8838.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  27%|██▋       | 322/1208 [09:45<26:49,  1.82s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.000148, train/loss_step=0.0418, global_step=8838.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  27%|██▋       | 322/1208 [09:45<26:49,  1.82s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0551, train/loss_vlb_step=0.000198, train/loss_step=0.0551, global_step=8838.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  27%|██▋       | 323/1208 [09:46<26:46,  1.81s/it, loss=0.161, v_num=0, train/loss_simple_step=0.0551, train/loss_vlb_step=0.000198, train/loss_step=0.0551, global_step=8838.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  27%|██▋       | 323/1208 [09:46<26:46,  1.81s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0303, train/loss_vlb_step=0.000118, train/loss_step=0.0303, global_step=8838.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  27%|██▋       | 324/1208 [09:49<26:48,  1.82s/it, loss=0.163, v_num=0, train/loss_simple_step=0.0303, train/loss_vlb_step=0.000118, train/loss_step=0.0303, global_step=8838.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  27%|██▋       | 324/1208 [09:49<26:48,  1.82s/it, loss=0.172, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.0019, train/loss_step=0.314, global_step=8838.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  27%|██▋       | 325/1208 [09:50<26:44,  1.82s/it, loss=0.172, v_num=0, train/loss_simple_step=0.314, train/loss_vlb_step=0.0019, train/loss_step=0.314, global_step=8838.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  27%|██▋       | 325/1208 [09:50<26:44,  1.82s/it, loss=0.174, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000383, train/loss_step=0.116, global_step=8839.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  27%|██▋       | 326/1208 [09:51<26:40,  1.81s/it, loss=0.174, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000383, train/loss_step=0.116, global_step=8839.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  27%|██▋       | 326/1208 [09:51<26:40,  1.81s/it, loss=0.186, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00158, train/loss_step=0.347, global_step=8839.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  27%|██▋       | 327/1208 [09:52<26:36,  1.81s/it, loss=0.186, v_num=0, train/loss_simple_step=0.347, train/loss_vlb_step=0.00158, train/loss_step=0.347, global_step=8839.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  27%|██▋       | 327/1208 [09:52<26:36,  1.81s/it, loss=0.205, v_num=0, train/loss_simple_step=0.443, train/loss_vlb_step=0.00454, train/loss_step=0.443, global_step=8839.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  27%|██▋       | 328/1208 [09:55<26:38,  1.82s/it, loss=0.205, v_num=0, train/loss_simple_step=0.443, train/loss_vlb_step=0.00454, train/loss_step=0.443, global_step=8839.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  27%|██▋       | 328/1208 [09:55<26:38,  1.82s/it, loss=0.206, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=8839.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  27%|██▋       | 329/1208 [09:56<26:34,  1.81s/it, loss=0.206, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000342, train/loss_step=0.104, global_step=8839.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  27%|██▋       | 329/1208 [09:56<26:34,  1.81s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.66e-5, train/loss_step=0.0207, global_step=8840.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  27%|██▋       | 330/1208 [09:58<26:31,  1.81s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=8.66e-5, train/loss_step=0.0207, global_step=8840.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  27%|██▋       | 330/1208 [09:58<26:31,  1.81s/it, loss=0.206, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000614, train/loss_step=0.170, global_step=8840.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  27%|██▋       | 331/1208 [09:59<26:27,  1.81s/it, loss=0.206, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000614, train/loss_step=0.170, global_step=8840.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  27%|██▋       | 331/1208 [09:59<26:27,  1.81s/it, loss=0.205, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00114, train/loss_step=0.267, global_step=8840.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  27%|██▋       | 332/1208 [10:02<26:29,  1.81s/it, loss=0.205, v_num=0, train/loss_simple_step=0.267, train/loss_vlb_step=0.00114, train/loss_step=0.267, global_step=8840.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  27%|██▋       | 332/1208 [10:02<26:29,  1.81s/it, loss=0.213, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.0013, train/loss_step=0.282, global_step=8840.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  28%|██▊       | 333/1208 [10:03<26:25,  1.81s/it, loss=0.213, v_num=0, train/loss_simple_step=0.282, train/loss_vlb_step=0.0013, train/loss_step=0.282, global_step=8840.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  28%|██▊       | 333/1208 [10:03<26:25,  1.81s/it, loss=0.204, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=8.95e-5, train/loss_step=0.0221, global_step=8841.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  28%|██▊       | 334/1208 [10:04<26:22,  1.81s/it, loss=0.204, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=8.95e-5, train/loss_step=0.0221, global_step=8841.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  28%|██▊       | 334/1208 [10:04<26:22,  1.81s/it, loss=0.207, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000661, train/loss_step=0.188, global_step=8841.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  28%|██▊       | 335/1208 [10:05<26:18,  1.81s/it, loss=0.207, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000661, train/loss_step=0.188, global_step=8841.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  28%|██▊       | 335/1208 [10:05<26:18,  1.81s/it, loss=0.233, v_num=0, train/loss_simple_step=0.675, train/loss_vlb_step=0.021, train/loss_step=0.675, global_step=8841.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  28%|██▊       | 336/1208 [10:08<26:20,  1.81s/it, loss=0.233, v_num=0, train/loss_simple_step=0.675, train/loss_vlb_step=0.021, train/loss_step=0.675, global_step=8841.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  28%|██▊       | 336/1208 [10:08<26:20,  1.81s/it, loss=0.249, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00167, train/loss_step=0.338, global_step=8841.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  28%|██▊       | 337/1208 [10:09<26:16,  1.81s/it, loss=0.249, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00167, train/loss_step=0.338, global_step=8841.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  28%|██▊       | 337/1208 [10:09<26:16,  1.81s/it, loss=0.226, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000136, train/loss_step=0.0363, global_step=8842.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  28%|██▊       | 338/1208 [10:10<26:12,  1.81s/it, loss=0.226, v_num=0, train/loss_simple_step=0.0363, train/loss_vlb_step=0.000136, train/loss_step=0.0363, global_step=8842.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  28%|██▊       | 338/1208 [10:10<26:12,  1.81s/it, loss=0.219, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=8842.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  28%|██▊       | 339/1208 [10:12<26:08,  1.81s/it, loss=0.219, v_num=0, train/loss_simple_step=0.117, train/loss_vlb_step=0.000385, train/loss_step=0.117, global_step=8842.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  28%|██▊       | 339/1208 [10:12<26:08,  1.81s/it, loss=0.198, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000992, train/loss_step=0.244, global_step=8842.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  28%|██▊       | 340/1208 [10:15<26:10,  1.81s/it, loss=0.198, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000992, train/loss_step=0.244, global_step=8842.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  28%|██▊       | 340/1208 [10:15<26:10,  1.81s/it, loss=0.206, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00159, train/loss_step=0.313, global_step=8842.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  28%|██▊       | 341/1208 [10:16<26:07,  1.81s/it, loss=0.206, v_num=0, train/loss_simple_step=0.313, train/loss_vlb_step=0.00159, train/loss_step=0.313, global_step=8842.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  28%|██▊       | 341/1208 [10:16<26:07,  1.81s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0594, train/loss_vlb_step=0.00021, train/loss_step=0.0594, global_step=8843.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  28%|██▊       | 342/1208 [10:17<26:03,  1.81s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0594, train/loss_vlb_step=0.00021, train/loss_step=0.0594, global_step=8843.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  28%|██▊       | 342/1208 [10:17<26:03,  1.81s/it, loss=0.222, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00221, train/loss_step=0.351, global_step=8843.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  28%|██▊       | 343/1208 [10:18<25:59,  1.80s/it, loss=0.222, v_num=0, train/loss_simple_step=0.351, train/loss_vlb_step=0.00221, train/loss_step=0.351, global_step=8843.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  28%|██▊       | 343/1208 [10:18<25:59,  1.80s/it, loss=0.223, v_num=0, train/loss_simple_step=0.0494, train/loss_vlb_step=0.000175, train/loss_step=0.0494, global_step=8843.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  28%|██▊       | 344/1208 [10:21<26:01,  1.81s/it, loss=0.223, v_num=0, train/loss_simple_step=0.0494, train/loss_vlb_step=0.000175, train/loss_step=0.0494, global_step=8843.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  28%|██▊       | 344/1208 [10:21<26:01,  1.81s/it, loss=0.226, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00222, train/loss_step=0.384, global_step=8843.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  29%|██▊       | 345/1208 [10:22<25:57,  1.81s/it, loss=0.226, v_num=0, train/loss_simple_step=0.384, train/loss_vlb_step=0.00222, train/loss_step=0.384, global_step=8843.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  29%|██▊       | 345/1208 [10:22<25:57,  1.81s/it, loss=0.221, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=1.79e-5, train/loss_step=0.00309, global_step=8844.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  29%|██▊       | 346/1208 [10:23<25:54,  1.80s/it, loss=0.221, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=1.79e-5, train/loss_step=0.00309, global_step=8844.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  29%|██▊       | 346/1208 [10:23<25:54,  1.80s/it, loss=0.22, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00176, train/loss_step=0.341, global_step=8844.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]     Epoch 29:  29%|██▊       | 347/1208 [10:25<25:50,  1.80s/it, loss=0.22, v_num=0, train/loss_simple_step=0.341, train/loss_vlb_step=0.00176, train/loss_step=0.341, global_step=8844.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  29%|██▊       | 347/1208 [10:25<25:50,  1.80s/it, loss=0.216, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00216, train/loss_step=0.361, global_step=8844.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  29%|██▉       | 348/1208 [10:28<25:52,  1.81s/it, loss=0.216, v_num=0, train/loss_simple_step=0.361, train/loss_vlb_step=0.00216, train/loss_step=0.361, global_step=8844.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  29%|██▉       | 348/1208 [10:28<25:52,  1.81s/it, loss=0.212, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=8.57e-5, train/loss_step=0.0224, global_step=8844.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  29%|██▉       | 349/1208 [10:29<25:48,  1.80s/it, loss=0.212, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=8.57e-5, train/loss_step=0.0224, global_step=8844.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  29%|██▉       | 349/1208 [10:29<25:48,  1.80s/it, loss=0.212, v_num=0, train/loss_simple_step=0.00726, train/loss_vlb_step=3.59e-5, train/loss_step=0.00726, global_step=8845.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  29%|██▉       | 350/1208 [10:30<25:45,  1.80s/it, loss=0.212, v_num=0, train/loss_simple_step=0.00726, train/loss_vlb_step=3.59e-5, train/loss_step=0.00726, global_step=8845.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  29%|██▉       | 350/1208 [10:30<25:45,  1.80s/it, loss=0.204, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.17e-5, train/loss_step=0.0134, global_step=8845.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  29%|██▉       | 351/1208 [10:31<25:41,  1.80s/it, loss=0.204, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.17e-5, train/loss_step=0.0134, global_step=8845.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  29%|██▉       | 351/1208 [10:31<25:41,  1.80s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.000103, train/loss_step=0.0275, global_step=8845.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  29%|██▉       | 352/1208 [10:34<25:43,  1.80s/it, loss=0.192, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.000103, train/loss_step=0.0275, global_step=8845.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  29%|██▉       | 352/1208 [10:34<25:43,  1.80s/it, loss=0.192, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00147, train/loss_step=0.297, global_step=8845.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  29%|██▉       | 353/1208 [10:35<25:40,  1.80s/it, loss=0.192, v_num=0, train/loss_simple_step=0.297, train/loss_vlb_step=0.00147, train/loss_step=0.297, global_step=8845.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  29%|██▉       | 353/1208 [10:35<25:40,  1.80s/it, loss=0.2, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000591, train/loss_step=0.165, global_step=8846.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  29%|██▉       | 354/1208 [10:36<25:36,  1.80s/it, loss=0.2, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000591, train/loss_step=0.165, global_step=8846.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  29%|██▉       | 354/1208 [10:36<25:36,  1.80s/it, loss=0.191, v_num=0, train/loss_simple_step=0.00825, train/loss_vlb_step=4.03e-5, train/loss_step=0.00825, global_step=8846.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  29%|██▉       | 355/1208 [10:38<25:33,  1.80s/it, loss=0.191, v_num=0, train/loss_simple_step=0.00825, train/loss_vlb_step=4.03e-5, train/loss_step=0.00825, global_step=8846.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  29%|██▉       | 355/1208 [10:38<25:33,  1.80s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=2.38e-5, train/loss_step=0.00451, global_step=8846.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  29%|██▉       | 356/1208 [10:41<25:34,  1.80s/it, loss=0.157, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=2.38e-5, train/loss_step=0.00451, global_step=8846.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  29%|██▉       | 356/1208 [10:41<25:34,  1.80s/it, loss=0.167, v_num=0, train/loss_simple_step=0.527, train/loss_vlb_step=0.00491, train/loss_step=0.527, global_step=8846.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  30%|██▉       | 357/1208 [10:42<25:31,  1.80s/it, loss=0.167, v_num=0, train/loss_simple_step=0.527, train/loss_vlb_step=0.00491, train/loss_step=0.527, global_step=8846.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  30%|██▉       | 357/1208 [10:42<25:31,  1.80s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0659, train/loss_vlb_step=0.000222, train/loss_step=0.0659, global_step=8847.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  30%|██▉       | 358/1208 [10:43<25:27,  1.80s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0659, train/loss_vlb_step=0.000222, train/loss_step=0.0659, global_step=8847.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  30%|██▉       | 358/1208 [10:43<25:27,  1.80s/it, loss=0.19, v_num=0, train/loss_simple_step=0.556, train/loss_vlb_step=0.013, train/loss_step=0.556, global_step=8847.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]      Epoch 29:  30%|██▉       | 359/1208 [10:44<25:24,  1.80s/it, loss=0.19, v_num=0, train/loss_simple_step=0.556, train/loss_vlb_step=0.013, train/loss_step=0.556, global_step=8847.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  30%|██▉       | 359/1208 [10:44<25:24,  1.80s/it, loss=0.184, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000437, train/loss_step=0.132, global_step=8847.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  30%|██▉       | 360/1208 [10:47<25:25,  1.80s/it, loss=0.184, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000437, train/loss_step=0.132, global_step=8847.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  30%|██▉       | 360/1208 [10:47<25:25,  1.80s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=1.66e-5, train/loss_step=0.00295, global_step=8847.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  30%|██▉       | 361/1208 [10:48<25:22,  1.80s/it, loss=0.169, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=1.66e-5, train/loss_step=0.00295, global_step=8847.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  30%|██▉       | 361/1208 [10:48<25:22,  1.80s/it, loss=0.199, v_num=0, train/loss_simple_step=0.659, train/loss_vlb_step=0.0148, train/loss_step=0.659, global_step=8848.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]     Epoch 29:  30%|██▉       | 362/1208 [10:49<25:18,  1.80s/it, loss=0.199, v_num=0, train/loss_simple_step=0.659, train/loss_vlb_step=0.0148, train/loss_step=0.659, global_step=8848.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  30%|██▉       | 362/1208 [10:49<25:18,  1.80s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0562, train/loss_vlb_step=0.000193, train/loss_step=0.0562, global_step=8848.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  30%|███       | 363/1208 [10:50<25:15,  1.79s/it, loss=0.184, v_num=0, train/loss_simple_step=0.0562, train/loss_vlb_step=0.000193, train/loss_step=0.0562, global_step=8848.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  30%|███       | 363/1208 [10:50<25:15,  1.79s/it, loss=0.191, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000732, train/loss_step=0.194, global_step=8848.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  30%|███       | 364/1208 [10:54<25:16,  1.80s/it, loss=0.191, v_num=0, train/loss_simple_step=0.194, train/loss_vlb_step=0.000732, train/loss_step=0.194, global_step=8848.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  30%|███       | 364/1208 [10:54<25:16,  1.80s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.56e-5, train/loss_step=0.0142, global_step=8848.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  30%|███       | 365/1208 [10:55<25:13,  1.80s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=6.56e-5, train/loss_step=0.0142, global_step=8848.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  30%|███       | 365/1208 [10:55<25:13,  1.80s/it, loss=0.194, v_num=0, train/loss_simple_step=0.424, train/loss_vlb_step=0.00411, train/loss_step=0.424, global_step=8849.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  30%|███       | 366/1208 [10:56<25:09,  1.79s/it, loss=0.194, v_num=0, train/loss_simple_step=0.424, train/loss_vlb_step=0.00411, train/loss_step=0.424, global_step=8849.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  30%|███       | 366/1208 [10:56<25:09,  1.79s/it, loss=0.205, v_num=0, train/loss_simple_step=0.569, train/loss_vlb_step=0.0139, train/loss_step=0.569, global_step=8849.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  30%|███       | 367/1208 [10:57<25:06,  1.79s/it, loss=0.205, v_num=0, train/loss_simple_step=0.569, train/loss_vlb_step=0.0139, train/loss_step=0.569, global_step=8849.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  30%|███       | 367/1208 [10:57<25:06,  1.79s/it, loss=0.22, v_num=0, train/loss_simple_step=0.648, train/loss_vlb_step=0.026, train/loss_step=0.648, global_step=8849.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  30%|███       | 368/1208 [11:00<25:08,  1.80s/it, loss=0.22, v_num=0, train/loss_simple_step=0.648, train/loss_vlb_step=0.026, train/loss_step=0.648, global_step=8849.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  30%|███       | 368/1208 [11:00<25:08,  1.80s/it, loss=0.219, v_num=0, train/loss_simple_step=0.00317, train/loss_vlb_step=1.74e-5, train/loss_step=0.00317, global_step=8849.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  31%|███       | 369/1208 [11:01<25:04,  1.79s/it, loss=0.219, v_num=0, train/loss_simple_step=0.00317, train/loss_vlb_step=1.74e-5, train/loss_step=0.00317, global_step=8849.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  31%|███       | 369/1208 [11:01<25:04,  1.79s/it, loss=0.222, v_num=0, train/loss_simple_step=0.0769, train/loss_vlb_step=0.000259, train/loss_step=0.0769, global_step=8850.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  31%|███       | 370/1208 [11:02<25:01,  1.79s/it, loss=0.222, v_num=0, train/loss_simple_step=0.0769, train/loss_vlb_step=0.000259, train/loss_step=0.0769, global_step=8850.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  31%|███       | 370/1208 [11:02<25:01,  1.79s/it, loss=0.227, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=8850.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  31%|███       | 371/1208 [11:03<24:57,  1.79s/it, loss=0.227, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000391, train/loss_step=0.119, global_step=8850.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  31%|███       | 371/1208 [11:03<24:57,  1.79s/it, loss=0.227, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.47e-5, train/loss_step=0.0239, global_step=8850.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  31%|███       | 372/1208 [11:07<24:59,  1.79s/it, loss=0.227, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=9.47e-5, train/loss_step=0.0239, global_step=8850.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  31%|███       | 372/1208 [11:07<24:59,  1.79s/it, loss=0.213, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=3.54e-5, train/loss_step=0.00742, global_step=8850.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  31%|███       | 373/1208 [11:08<24:56,  1.79s/it, loss=0.213, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=3.54e-5, train/loss_step=0.00742, global_step=8850.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  31%|███       | 373/1208 [11:08<24:56,  1.79s/it, loss=0.214, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000821, train/loss_step=0.198, global_step=8851.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  31%|███       | 374/1208 [11:09<24:52,  1.79s/it, loss=0.214, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000821, train/loss_step=0.198, global_step=8851.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  31%|███       | 374/1208 [11:09<24:52,  1.79s/it, loss=0.234, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00401, train/loss_step=0.408, global_step=8851.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  31%|███       | 375/1208 [11:10<24:49,  1.79s/it, loss=0.234, v_num=0, train/loss_simple_step=0.408, train/loss_vlb_step=0.00401, train/loss_step=0.408, global_step=8851.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  31%|███       | 375/1208 [11:10<24:49,  1.79s/it, loss=0.241, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000472, train/loss_step=0.140, global_step=8851.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  31%|███       | 376/1208 [11:13<24:50,  1.79s/it, loss=0.241, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000472, train/loss_step=0.140, global_step=8851.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  31%|███       | 376/1208 [11:13<24:50,  1.79s/it, loss=0.224, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000642, train/loss_step=0.186, global_step=8851.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  31%|███       | 377/1208 [11:14<24:47,  1.79s/it, loss=0.224, v_num=0, train/loss_simple_step=0.186, train/loss_vlb_step=0.000642, train/loss_step=0.186, global_step=8851.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  31%|███       | 377/1208 [11:14<24:47,  1.79s/it, loss=0.221, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=2.1e-5, train/loss_step=0.00392, global_step=8852.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  31%|███▏      | 378/1208 [11:15<24:43,  1.79s/it, loss=0.221, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=2.1e-5, train/loss_step=0.00392, global_step=8852.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  31%|███▏      | 378/1208 [11:15<24:43,  1.79s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.000123, train/loss_step=0.0322, global_step=8852.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  31%|███▏      | 379/1208 [11:16<24:40,  1.79s/it, loss=0.195, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.000123, train/loss_step=0.0322, global_step=8852.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  31%|███▏      | 379/1208 [11:16<24:40,  1.79s/it, loss=0.203, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00129, train/loss_step=0.289, global_step=8852.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  31%|███▏      | 380/1208 [11:20<24:41,  1.79s/it, loss=0.203, v_num=0, train/loss_simple_step=0.289, train/loss_vlb_step=0.00129, train/loss_step=0.289, global_step=8852.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  31%|███▏      | 380/1208 [11:20<24:41,  1.79s/it, loss=0.211, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000539, train/loss_step=0.162, global_step=8852.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  32%|███▏      | 381/1208 [11:21<24:38,  1.79s/it, loss=0.211, v_num=0, train/loss_simple_step=0.162, train/loss_vlb_step=0.000539, train/loss_step=0.162, global_step=8852.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  32%|███▏      | 381/1208 [11:21<24:38,  1.79s/it, loss=0.2, v_num=0, train/loss_simple_step=0.445, train/loss_vlb_step=0.00351, train/loss_step=0.445, global_step=8853.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  32%|███▏      | 382/1208 [11:22<24:35,  1.79s/it, loss=0.2, v_num=0, train/loss_simple_step=0.445, train/loss_vlb_step=0.00351, train/loss_step=0.445, global_step=8853.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  32%|███▏      | 382/1208 [11:22<24:35,  1.79s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00576, train/loss_vlb_step=2.99e-5, train/loss_step=0.00576, global_step=8853.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  32%|███▏      | 383/1208 [11:23<24:31,  1.78s/it, loss=0.197, v_num=0, train/loss_simple_step=0.00576, train/loss_vlb_step=2.99e-5, train/loss_step=0.00576, global_step=8853.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  32%|███▏      | 383/1208 [11:23<24:31,  1.78s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0607, train/loss_vlb_step=0.000202, train/loss_step=0.0607, global_step=8853.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  32%|███▏      | 384/1208 [11:26<24:33,  1.79s/it, loss=0.191, v_num=0, train/loss_simple_step=0.0607, train/loss_vlb_step=0.000202, train/loss_step=0.0607, global_step=8853.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  32%|███▏      | 384/1208 [11:26<24:33,  1.79s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0889, train/loss_vlb_step=0.000294, train/loss_step=0.0889, global_step=8853.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  32%|███▏      | 385/1208 [11:27<24:30,  1.79s/it, loss=0.194, v_num=0, train/loss_simple_step=0.0889, train/loss_vlb_step=0.000294, train/loss_step=0.0889, global_step=8853.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  32%|███▏      | 385/1208 [11:27<24:30,  1.79s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0965, train/loss_vlb_step=0.000317, train/loss_step=0.0965, global_step=8854.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  32%|███▏      | 386/1208 [11:28<24:26,  1.78s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0965, train/loss_vlb_step=0.000317, train/loss_step=0.0965, global_step=8854.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  32%|███▏      | 386/1208 [11:28<24:26,  1.78s/it, loss=0.158, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000627, train/loss_step=0.172, global_step=8854.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  32%|███▏      | 387/1208 [11:29<24:23,  1.78s/it, loss=0.158, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000627, train/loss_step=0.172, global_step=8854.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  32%|███▏      | 387/1208 [11:29<24:23,  1.78s/it, loss=0.132, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000394, train/loss_step=0.119, global_step=8854.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  32%|███▏      | 388/1208 [11:33<24:24,  1.79s/it, loss=0.132, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000394, train/loss_step=0.119, global_step=8854.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  32%|███▏      | 388/1208 [11:33<24:24,  1.79s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.2e-5, train/loss_step=0.0139, global_step=8854.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  32%|███▏      | 389/1208 [11:34<24:21,  1.78s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.2e-5, train/loss_step=0.0139, global_step=8854.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  32%|███▏      | 389/1208 [11:34<24:21,  1.78s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.32e-5, train/loss_step=0.00222, global_step=8855.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  32%|███▏      | 390/1208 [11:35<24:18,  1.78s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.32e-5, train/loss_step=0.00222, global_step=8855.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  32%|███▏      | 390/1208 [11:35<24:18,  1.78s/it, loss=0.13, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000475, train/loss_step=0.138, global_step=8855.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  32%|███▏      | 391/1208 [11:36<24:14,  1.78s/it, loss=0.13, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000475, train/loss_step=0.138, global_step=8855.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  32%|███▏      | 391/1208 [11:36<24:14,  1.78s/it, loss=0.14, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000941, train/loss_step=0.222, global_step=8855.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  32%|███▏      | 392/1208 [11:39<24:16,  1.78s/it, loss=0.14, v_num=0, train/loss_simple_step=0.222, train/loss_vlb_step=0.000941, train/loss_step=0.222, global_step=8855.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  32%|███▏      | 392/1208 [11:39<24:16,  1.78s/it, loss=0.149, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.0007, train/loss_step=0.193, global_step=8855.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  33%|███▎      | 393/1208 [11:40<24:12,  1.78s/it, loss=0.149, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.0007, train/loss_step=0.193, global_step=8855.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  33%|███▎      | 393/1208 [11:40<24:12,  1.78s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00999, train/loss_vlb_step=4.72e-5, train/loss_step=0.00999, global_step=8856.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  33%|███▎      | 394/1208 [11:41<24:09,  1.78s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00999, train/loss_vlb_step=4.72e-5, train/loss_step=0.00999, global_step=8856.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  33%|███▎      | 394/1208 [11:41<24:09,  1.78s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000252, train/loss_step=0.0754, global_step=8856.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  33%|███▎      | 395/1208 [11:42<24:06,  1.78s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0754, train/loss_vlb_step=0.000252, train/loss_step=0.0754, global_step=8856.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  33%|███▎      | 395/1208 [11:42<24:06,  1.78s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000189, train/loss_step=0.0525, global_step=8856.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  33%|███▎      | 396/1208 [11:46<24:07,  1.78s/it, loss=0.118, v_num=0, train/loss_simple_step=0.0525, train/loss_vlb_step=0.000189, train/loss_step=0.0525, global_step=8856.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  33%|███▎      | 396/1208 [11:46<24:07,  1.78s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9.23e-5, train/loss_step=0.0224, global_step=8856.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  33%|███▎      | 397/1208 [11:47<24:04,  1.78s/it, loss=0.11, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9.23e-5, train/loss_step=0.0224, global_step=8856.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  33%|███▎      | 397/1208 [11:47<24:04,  1.78s/it, loss=0.126, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00141, train/loss_step=0.323, global_step=8857.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  33%|███▎      | 398/1208 [11:48<24:01,  1.78s/it, loss=0.126, v_num=0, train/loss_simple_step=0.323, train/loss_vlb_step=0.00141, train/loss_step=0.323, global_step=8857.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  33%|███▎      | 398/1208 [11:48<24:01,  1.78s/it, loss=0.134, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000628, train/loss_step=0.182, global_step=8857.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  33%|███▎      | 399/1208 [11:49<23:58,  1.78s/it, loss=0.134, v_num=0, train/loss_simple_step=0.182, train/loss_vlb_step=0.000628, train/loss_step=0.182, global_step=8857.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  33%|███▎      | 399/1208 [11:49<23:58,  1.78s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=1.31e-5, train/loss_step=0.00227, global_step=8857.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  33%|███▎      | 400/1208 [11:52<23:59,  1.78s/it, loss=0.119, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=1.31e-5, train/loss_step=0.00227, global_step=8857.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  33%|███▎      | 400/1208 [11:52<23:59,  1.78s/it, loss=0.122, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000808, train/loss_step=0.214, global_step=8857.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  33%|███▎      | 401/1208 [11:53<23:56,  1.78s/it, loss=0.122, v_num=0, train/loss_simple_step=0.214, train/loss_vlb_step=0.000808, train/loss_step=0.214, global_step=8857.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  33%|███▎      | 401/1208 [11:53<23:56,  1.78s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0566, train/loss_vlb_step=0.000199, train/loss_step=0.0566, global_step=8858.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  33%|███▎      | 402/1208 [11:54<23:53,  1.78s/it, loss=0.103, v_num=0, train/loss_simple_step=0.0566, train/loss_vlb_step=0.000199, train/loss_step=0.0566, global_step=8858.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  33%|███▎      | 402/1208 [11:54<23:53,  1.78s/it, loss=0.113, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000883, train/loss_step=0.224, global_step=8858.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  33%|███▎      | 403/1208 [11:55<23:49,  1.78s/it, loss=0.113, v_num=0, train/loss_simple_step=0.224, train/loss_vlb_step=0.000883, train/loss_step=0.224, global_step=8858.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  33%|███▎      | 403/1208 [11:55<23:49,  1.78s/it, loss=0.137, v_num=0, train/loss_simple_step=0.538, train/loss_vlb_step=0.00713, train/loss_step=0.538, global_step=8858.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  33%|███▎      | 404/1208 [11:59<23:51,  1.78s/it, loss=0.137, v_num=0, train/loss_simple_step=0.538, train/loss_vlb_step=0.00713, train/loss_step=0.538, global_step=8858.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  33%|███▎      | 404/1208 [11:59<23:51,  1.78s/it, loss=0.14, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.00048, train/loss_step=0.143, global_step=8858.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  34%|███▎      | 405/1208 [12:00<23:47,  1.78s/it, loss=0.14, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.00048, train/loss_step=0.143, global_step=8858.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  34%|███▎      | 405/1208 [12:00<23:47,  1.78s/it, loss=0.152, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00204, train/loss_step=0.328, global_step=8859.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  34%|███▎      | 406/1208 [12:01<23:44,  1.78s/it, loss=0.152, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00204, train/loss_step=0.328, global_step=8859.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  34%|███▎      | 406/1208 [12:01<23:44,  1.78s/it, loss=0.151, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000576, train/loss_step=0.160, global_step=8859.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  34%|███▎      | 407/1208 [12:02<23:41,  1.77s/it, loss=0.151, v_num=0, train/loss_simple_step=0.160, train/loss_vlb_step=0.000576, train/loss_step=0.160, global_step=8859.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  34%|███▎      | 407/1208 [12:02<23:41,  1.77s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0975, train/loss_vlb_step=0.000322, train/loss_step=0.0975, global_step=8859.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  34%|███▍      | 408/1208 [12:05<23:42,  1.78s/it, loss=0.15, v_num=0, train/loss_simple_step=0.0975, train/loss_vlb_step=0.000322, train/loss_step=0.0975, global_step=8859.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  34%|███▍      | 408/1208 [12:05<23:42,  1.78s/it, loss=0.166, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00227, train/loss_step=0.346, global_step=8859.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  34%|███▍      | 409/1208 [12:06<23:39,  1.78s/it, loss=0.166, v_num=0, train/loss_simple_step=0.346, train/loss_vlb_step=0.00227, train/loss_step=0.346, global_step=8859.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  34%|███▍      | 409/1208 [12:06<23:39,  1.78s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00743, train/loss_vlb_step=3.65e-5, train/loss_step=0.00743, global_step=8860.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  34%|███▍      | 410/1208 [12:07<23:36,  1.78s/it, loss=0.167, v_num=0, train/loss_simple_step=0.00743, train/loss_vlb_step=3.65e-5, train/loss_step=0.00743, global_step=8860.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  34%|███▍      | 410/1208 [12:07<23:36,  1.78s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0411, train/loss_vlb_step=0.000148, train/loss_step=0.0411, global_step=8860.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  34%|███▍      | 411/1208 [12:08<23:33,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0411, train/loss_vlb_step=0.000148, train/loss_step=0.0411, global_step=8860.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  34%|███▍      | 411/1208 [12:08<23:33,  1.77s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00872, train/loss_vlb_step=4.22e-5, train/loss_step=0.00872, global_step=8860.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  34%|███▍      | 412/1208 [12:12<23:34,  1.78s/it, loss=0.151, v_num=0, train/loss_simple_step=0.00872, train/loss_vlb_step=4.22e-5, train/loss_step=0.00872, global_step=8860.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  34%|███▍      | 412/1208 [12:12<23:34,  1.78s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=1.03e-5, train/loss_step=0.00168, global_step=8860.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  34%|███▍      | 413/1208 [12:13<23:31,  1.78s/it, loss=0.142, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=1.03e-5, train/loss_step=0.00168, global_step=8860.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  34%|███▍      | 413/1208 [12:13<23:31,  1.78s/it, loss=0.147, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000416, train/loss_step=0.127, global_step=8861.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  34%|███▍      | 414/1208 [12:14<23:28,  1.77s/it, loss=0.147, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.000416, train/loss_step=0.127, global_step=8861.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  34%|███▍      | 414/1208 [12:14<23:28,  1.77s/it, loss=0.155, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000846, train/loss_step=0.221, global_step=8861.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  34%|███▍      | 415/1208 [12:15<23:25,  1.77s/it, loss=0.155, v_num=0, train/loss_simple_step=0.221, train/loss_vlb_step=0.000846, train/loss_step=0.221, global_step=8861.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  34%|███▍      | 415/1208 [12:15<23:25,  1.77s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00404, train/loss_vlb_step=2.13e-5, train/loss_step=0.00404, global_step=8861.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  34%|███▍      | 416/1208 [12:18<23:26,  1.78s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00404, train/loss_vlb_step=2.13e-5, train/loss_step=0.00404, global_step=8861.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  34%|███▍      | 416/1208 [12:18<23:26,  1.78s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00585, train/loss_vlb_step=2.87e-5, train/loss_step=0.00585, global_step=8861.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  35%|███▍      | 417/1208 [12:19<23:22,  1.77s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00585, train/loss_vlb_step=2.87e-5, train/loss_step=0.00585, global_step=8861.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  35%|███▍      | 417/1208 [12:19<23:22,  1.77s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0684, train/loss_vlb_step=0.000229, train/loss_step=0.0684, global_step=8862.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  35%|███▍      | 418/1208 [12:20<23:19,  1.77s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0684, train/loss_vlb_step=0.000229, train/loss_step=0.0684, global_step=8862.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  35%|███▍      | 418/1208 [12:20<23:19,  1.77s/it, loss=0.138, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.00055, train/loss_step=0.158, global_step=8862.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  35%|███▍      | 419/1208 [12:21<23:16,  1.77s/it, loss=0.138, v_num=0, train/loss_simple_step=0.158, train/loss_vlb_step=0.00055, train/loss_step=0.158, global_step=8862.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  35%|███▍      | 419/1208 [12:21<23:16,  1.77s/it, loss=0.144, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000474, train/loss_step=0.139, global_step=8862.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  35%|███▍      | 420/1208 [12:25<23:17,  1.77s/it, loss=0.144, v_num=0, train/loss_simple_step=0.139, train/loss_vlb_step=0.000474, train/loss_step=0.139, global_step=8862.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  35%|███▍      | 420/1208 [12:25<23:17,  1.77s/it, loss=0.141, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000512, train/loss_step=0.149, global_step=8862.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  35%|███▍      | 421/1208 [12:26<23:14,  1.77s/it, loss=0.141, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000512, train/loss_step=0.149, global_step=8862.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  35%|███▍      | 421/1208 [12:26<23:14,  1.77s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=2.03e-5, train/loss_step=0.00356, global_step=8863.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  35%|███▍      | 422/1208 [12:27<23:11,  1.77s/it, loss=0.138, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=2.03e-5, train/loss_step=0.00356, global_step=8863.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  35%|███▍      | 422/1208 [12:27<23:11,  1.77s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.4e-5, train/loss_step=0.0152, global_step=8863.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  35%|███▌      | 423/1208 [12:28<23:08,  1.77s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=6.4e-5, train/loss_step=0.0152, global_step=8863.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  35%|███▌      | 423/1208 [12:28<23:08,  1.77s/it, loss=0.13, v_num=0, train/loss_simple_step=0.585, train/loss_vlb_step=0.0164, train/loss_step=0.585, global_step=8863.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  35%|███▌      | 424/1208 [12:31<23:09,  1.77s/it, loss=0.13, v_num=0, train/loss_simple_step=0.585, train/loss_vlb_step=0.0164, train/loss_step=0.585, global_step=8863.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  35%|███▌      | 424/1208 [12:31<23:09,  1.77s/it, loss=0.129, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000396, train/loss_step=0.120, global_step=8863.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  35%|███▌      | 425/1208 [12:32<23:06,  1.77s/it, loss=0.129, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000396, train/loss_step=0.120, global_step=8863.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  35%|███▌      | 425/1208 [12:32<23:06,  1.77s/it, loss=0.131, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00181, train/loss_step=0.355, global_step=8864.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  35%|███▌      | 426/1208 [12:33<23:03,  1.77s/it, loss=0.131, v_num=0, train/loss_simple_step=0.355, train/loss_vlb_step=0.00181, train/loss_step=0.355, global_step=8864.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  35%|███▌      | 426/1208 [12:33<23:03,  1.77s/it, loss=0.144, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00386, train/loss_step=0.425, global_step=8864.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  35%|███▌      | 427/1208 [12:34<23:00,  1.77s/it, loss=0.144, v_num=0, train/loss_simple_step=0.425, train/loss_vlb_step=0.00386, train/loss_step=0.425, global_step=8864.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  35%|███▌      | 427/1208 [12:34<23:00,  1.77s/it, loss=0.145, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000408, train/loss_step=0.122, global_step=8864.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  35%|███▌      | 428/1208 [12:38<23:01,  1.77s/it, loss=0.145, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000408, train/loss_step=0.122, global_step=8864.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  35%|███▌      | 428/1208 [12:38<23:01,  1.77s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0094, train/loss_vlb_step=4.44e-5, train/loss_step=0.0094, global_step=8864.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  36%|███▌      | 429/1208 [12:39<22:58,  1.77s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0094, train/loss_vlb_step=4.44e-5, train/loss_step=0.0094, global_step=8864.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  36%|███▌      | 429/1208 [12:39<22:58,  1.77s/it, loss=0.136, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000568, train/loss_step=0.165, global_step=8865.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  36%|███▌      | 430/1208 [12:40<22:55,  1.77s/it, loss=0.136, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.000568, train/loss_step=0.165, global_step=8865.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  36%|███▌      | 430/1208 [12:40<22:55,  1.77s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00745, train/loss_vlb_step=3.68e-5, train/loss_step=0.00745, global_step=8865.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  36%|███▌      | 431/1208 [12:41<22:52,  1.77s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00745, train/loss_vlb_step=3.68e-5, train/loss_step=0.00745, global_step=8865.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  36%|███▌      | 431/1208 [12:41<22:52,  1.77s/it, loss=0.146, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.000942, train/loss_step=0.247, global_step=8865.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  36%|███▌      | 432/1208 [12:44<22:53,  1.77s/it, loss=0.146, v_num=0, train/loss_simple_step=0.247, train/loss_vlb_step=0.000942, train/loss_step=0.247, global_step=8865.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  36%|███▌      | 432/1208 [12:44<22:53,  1.77s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=1.07e-5, train/loss_step=0.0018, global_step=8865.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  36%|███▌      | 433/1208 [12:45<22:50,  1.77s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=1.07e-5, train/loss_step=0.0018, global_step=8865.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  36%|███▌      | 433/1208 [12:45<22:50,  1.77s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=8.11e-5, train/loss_step=0.0193, global_step=8866.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  36%|███▌      | 434/1208 [12:46<22:47,  1.77s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=8.11e-5, train/loss_step=0.0193, global_step=8866.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  36%|███▌      | 434/1208 [12:46<22:47,  1.77s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=1.92e-5, train/loss_step=0.00347, global_step=8866.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  36%|███▌      | 435/1208 [12:47<22:44,  1.77s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=1.92e-5, train/loss_step=0.00347, global_step=8866.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  36%|███▌      | 435/1208 [12:47<22:44,  1.77s/it, loss=0.159, v_num=0, train/loss_simple_step=0.586, train/loss_vlb_step=0.0182, train/loss_step=0.586, global_step=8866.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  36%|███▌      | 436/1208 [12:50<22:45,  1.77s/it, loss=0.159, v_num=0, train/loss_simple_step=0.586, train/loss_vlb_step=0.0182, train/loss_step=0.586, global_step=8866.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  36%|███▌      | 436/1208 [12:50<22:45,  1.77s/it, loss=0.171, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000922, train/loss_step=0.244, global_step=8866.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  36%|███▌      | 437/1208 [12:52<22:42,  1.77s/it, loss=0.171, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.000922, train/loss_step=0.244, global_step=8866.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  36%|███▌      | 437/1208 [12:52<22:42,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=3.56e-5, train/loss_step=0.00742, global_step=8867.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  36%|███▋      | 438/1208 [12:53<22:39,  1.77s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=3.56e-5, train/loss_step=0.00742, global_step=8867.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  36%|███▋      | 438/1208 [12:53<22:39,  1.77s/it, loss=0.169, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000601, train/loss_step=0.169, global_step=8867.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  36%|███▋      | 439/1208 [12:54<22:36,  1.76s/it, loss=0.169, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000601, train/loss_step=0.169, global_step=8867.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  36%|███▋      | 439/1208 [12:54<22:36,  1.76s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.41e-5, train/loss_step=0.00241, global_step=8867.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  36%|███▋      | 440/1208 [12:57<22:36,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.41e-5, train/loss_step=0.00241, global_step=8867.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  36%|███▋      | 440/1208 [12:57<22:36,  1.77s/it, loss=0.163, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000644, train/loss_step=0.181, global_step=8867.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  37%|███▋      | 441/1208 [12:58<22:33,  1.77s/it, loss=0.163, v_num=0, train/loss_simple_step=0.181, train/loss_vlb_step=0.000644, train/loss_step=0.181, global_step=8867.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  37%|███▋      | 441/1208 [12:58<22:33,  1.77s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=4.86e-5, train/loss_step=0.0112, global_step=8868.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  37%|███▋      | 442/1208 [12:59<22:30,  1.76s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=4.86e-5, train/loss_step=0.0112, global_step=8868.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  37%|███▋      | 442/1208 [12:59<22:30,  1.76s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0642, train/loss_vlb_step=0.000218, train/loss_step=0.0642, global_step=8868.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  37%|███▋      | 443/1208 [13:00<22:27,  1.76s/it, loss=0.166, v_num=0, train/loss_simple_step=0.0642, train/loss_vlb_step=0.000218, train/loss_step=0.0642, global_step=8868.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  37%|███▋      | 443/1208 [13:00<22:27,  1.76s/it, loss=0.145, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.00057, train/loss_step=0.165, global_step=8868.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  37%|███▋      | 444/1208 [13:03<22:28,  1.77s/it, loss=0.145, v_num=0, train/loss_simple_step=0.165, train/loss_vlb_step=0.00057, train/loss_step=0.165, global_step=8868.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  37%|███▋      | 444/1208 [13:03<22:28,  1.77s/it, loss=0.155, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00184, train/loss_step=0.324, global_step=8868.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  37%|███▋      | 445/1208 [13:04<22:25,  1.76s/it, loss=0.155, v_num=0, train/loss_simple_step=0.324, train/loss_vlb_step=0.00184, train/loss_step=0.324, global_step=8868.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  37%|███▋      | 445/1208 [13:04<22:25,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000584, train/loss_step=0.170, global_step=8869.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  37%|███▋      | 446/1208 [13:05<22:22,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.170, train/loss_vlb_step=0.000584, train/loss_step=0.170, global_step=8869.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  37%|███▋      | 446/1208 [13:05<22:22,  1.76s/it, loss=0.138, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00106, train/loss_step=0.258, global_step=8869.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  37%|███▋      | 447/1208 [13:07<22:19,  1.76s/it, loss=0.138, v_num=0, train/loss_simple_step=0.258, train/loss_vlb_step=0.00106, train/loss_step=0.258, global_step=8869.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  37%|███▋      | 447/1208 [13:07<22:19,  1.76s/it, loss=0.155, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.00446, train/loss_step=0.460, global_step=8869.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  37%|███▋      | 448/1208 [13:10<22:20,  1.76s/it, loss=0.155, v_num=0, train/loss_simple_step=0.460, train/loss_vlb_step=0.00446, train/loss_step=0.460, global_step=8869.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  37%|███▋      | 448/1208 [13:10<22:20,  1.76s/it, loss=0.181, v_num=0, train/loss_simple_step=0.537, train/loss_vlb_step=0.0116, train/loss_step=0.537, global_step=8869.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  37%|███▋      | 449/1208 [13:11<22:17,  1.76s/it, loss=0.181, v_num=0, train/loss_simple_step=0.537, train/loss_vlb_step=0.0116, train/loss_step=0.537, global_step=8869.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  37%|███▋      | 449/1208 [13:11<22:17,  1.76s/it, loss=0.189, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00185, train/loss_step=0.317, global_step=8870.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  37%|███▋      | 450/1208 [13:12<22:14,  1.76s/it, loss=0.189, v_num=0, train/loss_simple_step=0.317, train/loss_vlb_step=0.00185, train/loss_step=0.317, global_step=8870.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  37%|███▋      | 450/1208 [13:12<22:14,  1.76s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.00011, train/loss_step=0.0295, global_step=8870.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  37%|███▋      | 451/1208 [13:13<22:11,  1.76s/it, loss=0.19, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.00011, train/loss_step=0.0295, global_step=8870.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  37%|███▋      | 451/1208 [13:13<22:11,  1.76s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.85e-5, train/loss_step=0.0131, global_step=8870.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  37%|███▋      | 452/1208 [13:16<22:12,  1.76s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.85e-5, train/loss_step=0.0131, global_step=8870.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  37%|███▋      | 452/1208 [13:16<22:12,  1.76s/it, loss=0.197, v_num=0, train/loss_simple_step=0.387, train/loss_vlb_step=0.00308, train/loss_step=0.387, global_step=8870.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  38%|███▊      | 453/1208 [13:17<22:09,  1.76s/it, loss=0.197, v_num=0, train/loss_simple_step=0.387, train/loss_vlb_step=0.00308, train/loss_step=0.387, global_step=8870.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  38%|███▊      | 453/1208 [13:17<22:09,  1.76s/it, loss=0.207, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000727, train/loss_step=0.203, global_step=8871.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  38%|███▊      | 454/1208 [13:18<22:06,  1.76s/it, loss=0.207, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000727, train/loss_step=0.203, global_step=8871.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  38%|███▊      | 454/1208 [13:18<22:06,  1.76s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.15e-5, train/loss_step=0.0115, global_step=8871.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  38%|███▊      | 455/1208 [13:19<22:03,  1.76s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.15e-5, train/loss_step=0.0115, global_step=8871.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  38%|███▊      | 455/1208 [13:19<22:03,  1.76s/it, loss=0.192, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00123, train/loss_step=0.283, global_step=8871.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  38%|███▊      | 456/1208 [13:23<22:04,  1.76s/it, loss=0.192, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00123, train/loss_step=0.283, global_step=8871.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  38%|███▊      | 456/1208 [13:23<22:04,  1.76s/it, loss=0.185, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000351, train/loss_step=0.107, global_step=8871.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  38%|███▊      | 457/1208 [13:24<22:01,  1.76s/it, loss=0.185, v_num=0, train/loss_simple_step=0.107, train/loss_vlb_step=0.000351, train/loss_step=0.107, global_step=8871.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  38%|███▊      | 457/1208 [13:24<22:01,  1.76s/it, loss=0.196, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000865, train/loss_step=0.229, global_step=8872.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  38%|███▊      | 458/1208 [13:25<21:58,  1.76s/it, loss=0.196, v_num=0, train/loss_simple_step=0.229, train/loss_vlb_step=0.000865, train/loss_step=0.229, global_step=8872.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  38%|███▊      | 458/1208 [13:25<21:58,  1.76s/it, loss=0.188, v_num=0, train/loss_simple_step=0.00993, train/loss_vlb_step=4.82e-5, train/loss_step=0.00993, global_step=8872.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  38%|███▊      | 459/1208 [13:26<21:56,  1.76s/it, loss=0.188, v_num=0, train/loss_simple_step=0.00993, train/loss_vlb_step=4.82e-5, train/loss_step=0.00993, global_step=8872.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  38%|███▊      | 459/1208 [13:26<21:56,  1.76s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=6.89e-5, train/loss_step=0.0167, global_step=8872.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  38%|███▊      | 460/1208 [13:29<21:56,  1.76s/it, loss=0.189, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=6.89e-5, train/loss_step=0.0167, global_step=8872.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  38%|███▊      | 460/1208 [13:29<21:56,  1.76s/it, loss=0.185, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000371, train/loss_step=0.113, global_step=8872.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  38%|███▊      | 461/1208 [13:30<21:54,  1.76s/it, loss=0.185, v_num=0, train/loss_simple_step=0.113, train/loss_vlb_step=0.000371, train/loss_step=0.113, global_step=8872.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  38%|███▊      | 461/1208 [13:30<21:54,  1.76s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000188, train/loss_step=0.0524, global_step=8873.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  38%|███▊      | 462/1208 [13:32<21:51,  1.76s/it, loss=0.188, v_num=0, train/loss_simple_step=0.0524, train/loss_vlb_step=0.000188, train/loss_step=0.0524, global_step=8873.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  38%|███▊      | 462/1208 [13:32<21:51,  1.76s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.2e-5, train/loss_step=0.0199, global_step=8873.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  38%|███▊      | 463/1208 [13:33<21:48,  1.76s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.2e-5, train/loss_step=0.0199, global_step=8873.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  38%|███▊      | 463/1208 [13:33<21:48,  1.76s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0723, train/loss_vlb_step=0.00024, train/loss_step=0.0723, global_step=8873.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  38%|███▊      | 464/1208 [13:36<21:48,  1.76s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0723, train/loss_vlb_step=0.00024, train/loss_step=0.0723, global_step=8873.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  38%|███▊      | 464/1208 [13:36<21:48,  1.76s/it, loss=0.171, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.00041, train/loss_step=0.125, global_step=8873.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  38%|███▊      | 465/1208 [13:37<21:46,  1.76s/it, loss=0.171, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.00041, train/loss_step=0.125, global_step=8873.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  38%|███▊      | 465/1208 [13:37<21:46,  1.76s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.83e-5, train/loss_step=0.0032, global_step=8874.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  39%|███▊      | 466/1208 [13:38<21:43,  1.76s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.83e-5, train/loss_step=0.0032, global_step=8874.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  39%|███▊      | 466/1208 [13:38<21:43,  1.76s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00899, train/loss_vlb_step=4.25e-5, train/loss_step=0.00899, global_step=8874.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  39%|███▊      | 467/1208 [13:39<21:40,  1.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.00899, train/loss_vlb_step=4.25e-5, train/loss_step=0.00899, global_step=8874.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  39%|███▊      | 467/1208 [13:39<21:40,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.000134, train/loss_step=0.0359, global_step=8874.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  39%|███▊      | 468/1208 [13:42<21:40,  1.76s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0359, train/loss_vlb_step=0.000134, train/loss_step=0.0359, global_step=8874.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  39%|███▊      | 468/1208 [13:42<21:40,  1.76s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0603, train/loss_vlb_step=0.000207, train/loss_step=0.0603, global_step=8874.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  39%|███▉      | 469/1208 [13:43<21:38,  1.76s/it, loss=0.105, v_num=0, train/loss_simple_step=0.0603, train/loss_vlb_step=0.000207, train/loss_step=0.0603, global_step=8874.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  39%|███▉      | 469/1208 [13:43<21:38,  1.76s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000837, train/loss_step=0.209, global_step=8875.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  39%|███▉      | 470/1208 [13:44<21:35,  1.76s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.000837, train/loss_step=0.209, global_step=8875.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  39%|███▉      | 470/1208 [13:44<21:35,  1.76s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.34e-5, train/loss_step=0.00233, global_step=8875.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  39%|███▉      | 471/1208 [13:45<21:32,  1.75s/it, loss=0.0981, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.34e-5, train/loss_step=0.00233, global_step=8875.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  39%|███▉      | 471/1208 [13:45<21:32,  1.75s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.00901, train/loss_vlb_step=4.28e-5, train/loss_step=0.00901, global_step=8875.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  39%|███▉      | 472/1208 [13:49<21:33,  1.76s/it, loss=0.0979, v_num=0, train/loss_simple_step=0.00901, train/loss_vlb_step=4.28e-5, train/loss_step=0.00901, global_step=8875.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  39%|███▉      | 472/1208 [13:49<21:33,  1.76s/it, loss=0.086, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.0005, train/loss_step=0.149, global_step=8875.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]      Epoch 29:  39%|███▉      | 473/1208 [13:50<21:30,  1.76s/it, loss=0.086, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.0005, train/loss_step=0.149, global_step=8875.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  39%|███▉      | 473/1208 [13:50<21:30,  1.76s/it, loss=0.0785, v_num=0, train/loss_simple_step=0.0536, train/loss_vlb_step=0.000187, train/loss_step=0.0536, global_step=8876.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  39%|███▉      | 474/1208 [13:51<21:27,  1.75s/it, loss=0.0785, v_num=0, train/loss_simple_step=0.0536, train/loss_vlb_step=0.000187, train/loss_step=0.0536, global_step=8876.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  39%|███▉      | 474/1208 [13:51<21:27,  1.75s/it, loss=0.085, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000469, train/loss_step=0.140, global_step=8876.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  39%|███▉      | 475/1208 [13:52<21:24,  1.75s/it, loss=0.085, v_num=0, train/loss_simple_step=0.140, train/loss_vlb_step=0.000469, train/loss_step=0.140, global_step=8876.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  39%|███▉      | 475/1208 [13:52<21:24,  1.75s/it, loss=0.0709, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.19e-5, train/loss_step=0.00203, global_step=8876.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  39%|███▉      | 476/1208 [13:55<21:25,  1.76s/it, loss=0.0709, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.19e-5, train/loss_step=0.00203, global_step=8876.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  39%|███▉      | 476/1208 [13:55<21:25,  1.76s/it, loss=0.0672, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.000121, train/loss_step=0.032, global_step=8876.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  39%|███▉      | 477/1208 [13:56<21:22,  1.75s/it, loss=0.0672, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.000121, train/loss_step=0.032, global_step=8876.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  39%|███▉      | 477/1208 [13:56<21:22,  1.75s/it, loss=0.0616, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=8877.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  40%|███▉      | 478/1208 [13:57<21:19,  1.75s/it, loss=0.0616, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000381, train/loss_step=0.116, global_step=8877.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  40%|███▉      | 478/1208 [13:57<21:19,  1.75s/it, loss=0.0623, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=9.92e-5, train/loss_step=0.0251, global_step=8877.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  40%|███▉      | 479/1208 [13:58<21:16,  1.75s/it, loss=0.0623, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=9.92e-5, train/loss_step=0.0251, global_step=8877.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  40%|███▉      | 479/1208 [13:58<21:16,  1.75s/it, loss=0.0655, v_num=0, train/loss_simple_step=0.0808, train/loss_vlb_step=0.00027, train/loss_step=0.0808, global_step=8877.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  40%|███▉      | 480/1208 [14:02<21:17,  1.75s/it, loss=0.0655, v_num=0, train/loss_simple_step=0.0808, train/loss_vlb_step=0.00027, train/loss_step=0.0808, global_step=8877.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  40%|███▉      | 480/1208 [14:02<21:17,  1.75s/it, loss=0.0605, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.05e-5, train/loss_step=0.0113, global_step=8877.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  40%|███▉      | 481/1208 [14:03<21:14,  1.75s/it, loss=0.0605, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.05e-5, train/loss_step=0.0113, global_step=8877.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  40%|███▉      | 481/1208 [14:03<21:14,  1.75s/it, loss=0.0652, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000503, train/loss_step=0.148, global_step=8878.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  40%|███▉      | 482/1208 [14:04<21:11,  1.75s/it, loss=0.0652, v_num=0, train/loss_simple_step=0.148, train/loss_vlb_step=0.000503, train/loss_step=0.148, global_step=8878.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  40%|███▉      | 482/1208 [14:04<21:11,  1.75s/it, loss=0.0644, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=1.73e-5, train/loss_step=0.00315, global_step=8878.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  40%|███▉      | 483/1208 [14:05<21:08,  1.75s/it, loss=0.0644, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=1.73e-5, train/loss_step=0.00315, global_step=8878.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  40%|███▉      | 483/1208 [14:05<21:08,  1.75s/it, loss=0.0609, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.2e-5, train/loss_step=0.00204, global_step=8878.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  40%|████      | 484/1208 [14:08<21:09,  1.75s/it, loss=0.0609, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.2e-5, train/loss_step=0.00204, global_step=8878.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  40%|████      | 484/1208 [14:08<21:09,  1.75s/it, loss=0.0572, v_num=0, train/loss_simple_step=0.0506, train/loss_vlb_step=0.000173, train/loss_step=0.0506, global_step=8878.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  40%|████      | 485/1208 [14:09<21:06,  1.75s/it, loss=0.0572, v_num=0, train/loss_simple_step=0.0506, train/loss_vlb_step=0.000173, train/loss_step=0.0506, global_step=8878.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  40%|████      | 485/1208 [14:09<21:06,  1.75s/it, loss=0.0673, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.00076, train/loss_step=0.206, global_step=8879.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  40%|████      | 486/1208 [14:10<21:04,  1.75s/it, loss=0.0673, v_num=0, train/loss_simple_step=0.206, train/loss_vlb_step=0.00076, train/loss_step=0.206, global_step=8879.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  40%|████      | 486/1208 [14:10<21:04,  1.75s/it, loss=0.0672, v_num=0, train/loss_simple_step=0.00755, train/loss_vlb_step=3.87e-5, train/loss_step=0.00755, global_step=8879.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  40%|████      | 487/1208 [14:11<21:01,  1.75s/it, loss=0.0672, v_num=0, train/loss_simple_step=0.00755, train/loss_vlb_step=3.87e-5, train/loss_step=0.00755, global_step=8879.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  40%|████      | 487/1208 [14:11<21:01,  1.75s/it, loss=0.0658, v_num=0, train/loss_simple_step=0.00627, train/loss_vlb_step=3.21e-5, train/loss_step=0.00627, global_step=8879.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  40%|████      | 488/1208 [14:15<21:01,  1.75s/it, loss=0.0658, v_num=0, train/loss_simple_step=0.00627, train/loss_vlb_step=3.21e-5, train/loss_step=0.00627, global_step=8879.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  40%|████      | 488/1208 [14:15<21:01,  1.75s/it, loss=0.0763, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00141, train/loss_step=0.271, global_step=8879.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  40%|████      | 489/1208 [14:16<20:58,  1.75s/it, loss=0.0763, v_num=0, train/loss_simple_step=0.271, train/loss_vlb_step=0.00141, train/loss_step=0.271, global_step=8879.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  40%|████      | 489/1208 [14:16<20:58,  1.75s/it, loss=0.0929, v_num=0, train/loss_simple_step=0.542, train/loss_vlb_step=0.006, train/loss_step=0.542, global_step=8880.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  41%|████      | 490/1208 [14:17<20:56,  1.75s/it, loss=0.0929, v_num=0, train/loss_simple_step=0.542, train/loss_vlb_step=0.006, train/loss_step=0.542, global_step=8880.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  41%|████      | 490/1208 [14:17<20:56,  1.75s/it, loss=0.105, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.00118, train/loss_step=0.246, global_step=8880.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  41%|████      | 491/1208 [14:18<20:53,  1.75s/it, loss=0.105, v_num=0, train/loss_simple_step=0.246, train/loss_vlb_step=0.00118, train/loss_step=0.246, global_step=8880.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  41%|████      | 491/1208 [14:18<20:53,  1.75s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0531, train/loss_vlb_step=0.000186, train/loss_step=0.0531, global_step=8880.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  41%|████      | 492/1208 [14:21<20:54,  1.75s/it, loss=0.107, v_num=0, train/loss_simple_step=0.0531, train/loss_vlb_step=0.000186, train/loss_step=0.0531, global_step=8880.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  41%|████      | 492/1208 [14:21<20:54,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.622, train/loss_vlb_step=0.0121, train/loss_step=0.622, global_step=8880.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  41%|████      | 493/1208 [14:22<20:51,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.622, train/loss_vlb_step=0.0121, train/loss_step=0.622, global_step=8880.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  41%|████      | 493/1208 [14:22<20:51,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.22e-5, train/loss_step=0.0114, global_step=8881.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  41%|████      | 494/1208 [14:23<20:48,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.22e-5, train/loss_step=0.0114, global_step=8881.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  41%|████      | 494/1208 [14:23<20:48,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.57e-5, train/loss_step=0.00288, global_step=8881.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  41%|████      | 495/1208 [14:24<20:45,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.57e-5, train/loss_step=0.00288, global_step=8881.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  41%|████      | 495/1208 [14:24<20:45,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=8881.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  41%|████      | 496/1208 [14:28<20:46,  1.75s/it, loss=0.127, v_num=0, train/loss_simple_step=0.108, train/loss_vlb_step=0.000355, train/loss_step=0.108, global_step=8881.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  41%|████      | 496/1208 [14:28<20:46,  1.75s/it, loss=0.133, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000518, train/loss_step=0.154, global_step=8881.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  41%|████      | 497/1208 [14:29<20:43,  1.75s/it, loss=0.133, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000518, train/loss_step=0.154, global_step=8881.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  41%|████      | 497/1208 [14:29<20:43,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=2.19e-5, train/loss_step=0.00416, global_step=8882.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  41%|████      | 498/1208 [14:30<20:40,  1.75s/it, loss=0.128, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=2.19e-5, train/loss_step=0.00416, global_step=8882.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  41%|████      | 498/1208 [14:30<20:40,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0913, train/loss_vlb_step=0.000303, train/loss_step=0.0913, global_step=8882.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  41%|████▏     | 499/1208 [14:31<20:38,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0913, train/loss_vlb_step=0.000303, train/loss_step=0.0913, global_step=8882.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  41%|████▏     | 499/1208 [14:31<20:38,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0691, train/loss_vlb_step=0.000237, train/loss_step=0.0691, global_step=8882.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  41%|████▏     | 500/1208 [14:34<20:38,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0691, train/loss_vlb_step=0.000237, train/loss_step=0.0691, global_step=8882.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  41%|████▏     | 500/1208 [14:34<20:38,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000595, train/loss_step=0.176, global_step=8882.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  41%|████▏     | 501/1208 [14:35<20:35,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000595, train/loss_step=0.176, global_step=8882.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  41%|████▏     | 501/1208 [14:35<20:35,  1.75s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0736, train/loss_vlb_step=0.000245, train/loss_step=0.0736, global_step=8883.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  42%|████▏     | 502/1208 [14:36<20:33,  1.75s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0736, train/loss_vlb_step=0.000245, train/loss_step=0.0736, global_step=8883.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  42%|████▏     | 502/1208 [14:36<20:33,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000562, train/loss_step=0.157, global_step=8883.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  42%|████▏     | 503/1208 [14:37<20:30,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000562, train/loss_step=0.157, global_step=8883.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  42%|████▏     | 503/1208 [14:37<20:30,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.6e-5, train/loss_step=0.0153, global_step=8883.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  42%|████▏     | 504/1208 [14:41<20:30,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.6e-5, train/loss_step=0.0153, global_step=8883.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  42%|████▏     | 504/1208 [14:41<20:30,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00678, train/loss_vlb_step=3.08e-5, train/loss_step=0.00678, global_step=8883.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  42%|████▏     | 505/1208 [14:42<20:27,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00678, train/loss_vlb_step=3.08e-5, train/loss_step=0.00678, global_step=8883.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  42%|████▏     | 505/1208 [14:42<20:27,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.2e-5, train/loss_step=0.023, global_step=8884.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]     Epoch 29:  42%|████▏     | 506/1208 [14:43<20:25,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=9.2e-5, train/loss_step=0.023, global_step=8884.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  42%|████▏     | 506/1208 [14:43<20:25,  1.75s/it, loss=0.144, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.001, train/loss_step=0.244, global_step=8884.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  42%|████▏     | 507/1208 [14:44<20:22,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.001, train/loss_step=0.244, global_step=8884.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  42%|████▏     | 507/1208 [14:44<20:22,  1.74s/it, loss=0.147, v_num=0, train/loss_simple_step=0.059, train/loss_vlb_step=0.000205, train/loss_step=0.059, global_step=8884.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  42%|████▏     | 508/1208 [14:47<20:22,  1.75s/it, loss=0.147, v_num=0, train/loss_simple_step=0.059, train/loss_vlb_step=0.000205, train/loss_step=0.059, global_step=8884.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  42%|████▏     | 508/1208 [14:47<20:22,  1.75s/it, loss=0.164, v_num=0, train/loss_simple_step=0.626, train/loss_vlb_step=0.0234, train/loss_step=0.626, global_step=8884.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  42%|████▏     | 509/1208 [14:48<20:20,  1.75s/it, loss=0.164, v_num=0, train/loss_simple_step=0.626, train/loss_vlb_step=0.0234, train/loss_step=0.626, global_step=8884.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  42%|████▏     | 509/1208 [14:48<20:20,  1.75s/it, loss=0.145, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.00049, train/loss_step=0.147, global_step=8885.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  42%|████▏     | 510/1208 [14:49<20:17,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.00049, train/loss_step=0.147, global_step=8885.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  42%|████▏     | 510/1208 [14:49<20:17,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.89e-5, train/loss_step=0.00344, global_step=8885.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  42%|████▏     | 511/1208 [14:50<20:14,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.89e-5, train/loss_step=0.00344, global_step=8885.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  42%|████▏     | 511/1208 [14:50<20:14,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.86e-5, train/loss_step=0.0132, global_step=8885.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  42%|████▏     | 512/1208 [14:53<20:15,  1.75s/it, loss=0.13, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.86e-5, train/loss_step=0.0132, global_step=8885.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  42%|████▏     | 512/1208 [14:53<20:15,  1.75s/it, loss=0.111, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00097, train/loss_step=0.239, global_step=8885.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  42%|████▏     | 513/1208 [14:55<20:12,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.00097, train/loss_step=0.239, global_step=8885.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  42%|████▏     | 513/1208 [14:55<20:12,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.45e-5, train/loss_step=0.012, global_step=8886.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  43%|████▎     | 514/1208 [14:56<20:09,  1.74s/it, loss=0.111, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.45e-5, train/loss_step=0.012, global_step=8886.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  43%|████▎     | 514/1208 [14:56<20:09,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00245, train/loss_step=0.344, global_step=8886.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  43%|████▎     | 515/1208 [14:57<20:07,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.344, train/loss_vlb_step=0.00245, train/loss_step=0.344, global_step=8886.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  43%|████▎     | 515/1208 [14:57<20:07,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00209, train/loss_step=0.357, global_step=8886.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  43%|████▎     | 516/1208 [15:00<20:07,  1.75s/it, loss=0.141, v_num=0, train/loss_simple_step=0.357, train/loss_vlb_step=0.00209, train/loss_step=0.357, global_step=8886.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  43%|████▎     | 516/1208 [15:00<20:07,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000514, train/loss_step=0.147, global_step=8886.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  43%|████▎     | 517/1208 [15:01<20:04,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000514, train/loss_step=0.147, global_step=8886.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  43%|████▎     | 517/1208 [15:01<20:04,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.77e-5, train/loss_step=0.0132, global_step=8887.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  43%|████▎     | 518/1208 [15:02<20:02,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.77e-5, train/loss_step=0.0132, global_step=8887.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  43%|████▎     | 518/1208 [15:02<20:02,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000293, train/loss_step=0.0891, global_step=8887.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  43%|████▎     | 519/1208 [15:03<19:59,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000293, train/loss_step=0.0891, global_step=8887.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  43%|████▎     | 519/1208 [15:03<19:59,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.00012, train/loss_step=0.032, global_step=8887.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  43%|████▎     | 520/1208 [15:06<19:59,  1.74s/it, loss=0.139, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.00012, train/loss_step=0.032, global_step=8887.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  43%|████▎     | 520/1208 [15:06<19:59,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0632, train/loss_vlb_step=0.000216, train/loss_step=0.0632, global_step=8887.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  43%|████▎     | 521/1208 [15:07<19:57,  1.74s/it, loss=0.133, v_num=0, train/loss_simple_step=0.0632, train/loss_vlb_step=0.000216, train/loss_step=0.0632, global_step=8887.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  43%|████▎     | 521/1208 [15:07<19:57,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00129, train/loss_step=0.290, global_step=8888.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  43%|████▎     | 522/1208 [15:09<19:54,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00129, train/loss_step=0.290, global_step=8888.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  43%|████▎     | 522/1208 [15:09<19:54,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00403, train/loss_vlb_step=2.21e-5, train/loss_step=0.00403, global_step=8888.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  43%|████▎     | 523/1208 [15:10<19:52,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.00403, train/loss_vlb_step=2.21e-5, train/loss_step=0.00403, global_step=8888.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  43%|████▎     | 523/1208 [15:10<19:52,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=6.01e-5, train/loss_step=0.0132, global_step=8888.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  43%|████▎     | 524/1208 [15:13<19:52,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=6.01e-5, train/loss_step=0.0132, global_step=8888.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  43%|████▎     | 524/1208 [15:13<19:52,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000124, train/loss_step=0.0333, global_step=8888.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  43%|████▎     | 525/1208 [15:14<19:49,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000124, train/loss_step=0.0333, global_step=8888.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  43%|████▎     | 525/1208 [15:14<19:49,  1.74s/it, loss=0.161, v_num=0, train/loss_simple_step=0.494, train/loss_vlb_step=0.00878, train/loss_step=0.494, global_step=8889.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  44%|████▎     | 526/1208 [15:15<19:46,  1.74s/it, loss=0.161, v_num=0, train/loss_simple_step=0.494, train/loss_vlb_step=0.00878, train/loss_step=0.494, global_step=8889.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  44%|████▎     | 526/1208 [15:15<19:46,  1.74s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00228, train/loss_vlb_step=1.33e-5, train/loss_step=0.00228, global_step=8889.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  44%|████▎     | 527/1208 [15:16<19:44,  1.74s/it, loss=0.149, v_num=0, train/loss_simple_step=0.00228, train/loss_vlb_step=1.33e-5, train/loss_step=0.00228, global_step=8889.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  44%|████▎     | 527/1208 [15:16<19:44,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000558, train/loss_step=0.168, global_step=8889.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  44%|████▎     | 528/1208 [15:19<19:44,  1.74s/it, loss=0.155, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000558, train/loss_step=0.168, global_step=8889.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  44%|████▎     | 528/1208 [15:19<19:44,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0996, train/loss_vlb_step=0.000328, train/loss_step=0.0996, global_step=8889.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  44%|████▍     | 529/1208 [15:20<19:41,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.0996, train/loss_vlb_step=0.000328, train/loss_step=0.0996, global_step=8889.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  44%|████▍     | 529/1208 [15:20<19:41,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000576, train/loss_step=0.174, global_step=8890.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  44%|████▍     | 530/1208 [15:21<19:39,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000576, train/loss_step=0.174, global_step=8890.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  44%|████▍     | 530/1208 [15:21<19:39,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00154, train/loss_step=0.291, global_step=8890.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  44%|████▍     | 531/1208 [15:23<19:36,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.291, train/loss_vlb_step=0.00154, train/loss_step=0.291, global_step=8890.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  44%|████▍     | 531/1208 [15:23<19:36,  1.74s/it, loss=0.149, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=8890.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  44%|████▍     | 532/1208 [15:26<19:36,  1.74s/it, loss=0.149, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000358, train/loss_step=0.109, global_step=8890.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  44%|████▍     | 532/1208 [15:26<19:36,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000106, train/loss_step=0.0282, global_step=8890.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  44%|████▍     | 533/1208 [15:27<19:34,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000106, train/loss_step=0.0282, global_step=8890.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  44%|████▍     | 533/1208 [15:27<19:34,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000137, train/loss_step=0.0376, global_step=8891.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  44%|████▍     | 534/1208 [15:28<19:31,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000137, train/loss_step=0.0376, global_step=8891.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  44%|████▍     | 534/1208 [15:28<19:31,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00323, train/loss_vlb_step=1.77e-5, train/loss_step=0.00323, global_step=8891.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  44%|████▍     | 535/1208 [15:29<19:29,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.00323, train/loss_vlb_step=1.77e-5, train/loss_step=0.00323, global_step=8891.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  44%|████▍     | 535/1208 [15:29<19:29,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00528, train/loss_vlb_step=2.74e-5, train/loss_step=0.00528, global_step=8891.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  44%|████▍     | 536/1208 [15:32<19:29,  1.74s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00528, train/loss_vlb_step=2.74e-5, train/loss_step=0.00528, global_step=8891.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  44%|████▍     | 536/1208 [15:32<19:29,  1.74s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=1.44e-5, train/loss_step=0.00258, global_step=8891.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  44%|████▍     | 537/1208 [15:33<19:26,  1.74s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=1.44e-5, train/loss_step=0.00258, global_step=8891.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  44%|████▍     | 537/1208 [15:33<19:26,  1.74s/it, loss=0.101, v_num=0, train/loss_simple_step=0.079, train/loss_vlb_step=0.000266, train/loss_step=0.079, global_step=8892.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  45%|████▍     | 538/1208 [15:34<19:24,  1.74s/it, loss=0.101, v_num=0, train/loss_simple_step=0.079, train/loss_vlb_step=0.000266, train/loss_step=0.079, global_step=8892.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  45%|████▍     | 538/1208 [15:34<19:24,  1.74s/it, loss=0.097, v_num=0, train/loss_simple_step=0.00969, train/loss_vlb_step=4.52e-5, train/loss_step=0.00969, global_step=8892.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  45%|████▍     | 539/1208 [15:36<19:21,  1.74s/it, loss=0.097, v_num=0, train/loss_simple_step=0.00969, train/loss_vlb_step=4.52e-5, train/loss_step=0.00969, global_step=8892.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  45%|████▍     | 539/1208 [15:36<19:21,  1.74s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.0467, train/loss_vlb_step=0.000169, train/loss_step=0.0467, global_step=8892.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  45%|████▍     | 540/1208 [15:39<19:21,  1.74s/it, loss=0.0977, v_num=0, train/loss_simple_step=0.0467, train/loss_vlb_step=0.000169, train/loss_step=0.0467, global_step=8892.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  45%|████▍     | 540/1208 [15:39<19:21,  1.74s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.0612, train/loss_vlb_step=0.000212, train/loss_step=0.0612, global_step=8892.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  45%|████▍     | 541/1208 [15:40<19:19,  1.74s/it, loss=0.0976, v_num=0, train/loss_simple_step=0.0612, train/loss_vlb_step=0.000212, train/loss_step=0.0612, global_step=8892.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  45%|████▍     | 541/1208 [15:40<19:19,  1.74s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000494, train/loss_step=0.149, global_step=8893.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  45%|████▍     | 542/1208 [15:41<19:16,  1.74s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000494, train/loss_step=0.149, global_step=8893.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  45%|████▍     | 542/1208 [15:41<19:16,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.672, train/loss_vlb_step=0.0236, train/loss_step=0.672, global_step=8893.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  45%|████▍     | 543/1208 [15:42<19:14,  1.74s/it, loss=0.124, v_num=0, train/loss_simple_step=0.672, train/loss_vlb_step=0.0236, train/loss_step=0.672, global_step=8893.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  45%|████▍     | 543/1208 [15:42<19:14,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=8893.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  45%|████▌     | 544/1208 [15:45<19:14,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000331, train/loss_step=0.101, global_step=8893.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  45%|████▌     | 544/1208 [15:45<19:14,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000641, train/loss_step=0.167, global_step=8893.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  45%|████▌     | 545/1208 [15:46<19:11,  1.74s/it, loss=0.135, v_num=0, train/loss_simple_step=0.167, train/loss_vlb_step=0.000641, train/loss_step=0.167, global_step=8893.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  45%|████▌     | 545/1208 [15:46<19:11,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=8894.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  45%|████▌     | 546/1208 [15:48<19:09,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000332, train/loss_step=0.101, global_step=8894.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  45%|████▌     | 546/1208 [15:48<19:09,  1.74s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0916, train/loss_vlb_step=0.000302, train/loss_step=0.0916, global_step=8894.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  45%|████▌     | 547/1208 [15:49<19:06,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0916, train/loss_vlb_step=0.000302, train/loss_step=0.0916, global_step=8894.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  45%|████▌     | 547/1208 [15:49<19:06,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.592, train/loss_vlb_step=0.0307, train/loss_step=0.592, global_step=8894.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  45%|████▌     | 548/1208 [15:52<19:06,  1.74s/it, loss=0.141, v_num=0, train/loss_simple_step=0.592, train/loss_vlb_step=0.0307, train/loss_step=0.592, global_step=8894.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  45%|████▌     | 548/1208 [15:52<19:06,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000531, train/loss_step=0.156, global_step=8894.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  45%|████▌     | 549/1208 [15:53<19:04,  1.74s/it, loss=0.144, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000531, train/loss_step=0.156, global_step=8894.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  45%|████▌     | 549/1208 [15:53<19:04,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0884, train/loss_vlb_step=0.000293, train/loss_step=0.0884, global_step=8895.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  46%|████▌     | 550/1208 [15:54<19:01,  1.74s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0884, train/loss_vlb_step=0.000293, train/loss_step=0.0884, global_step=8895.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  46%|████▌     | 550/1208 [15:54<19:01,  1.74s/it, loss=0.149, v_num=0, train/loss_simple_step=0.472, train/loss_vlb_step=0.00864, train/loss_step=0.472, global_step=8895.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  46%|████▌     | 551/1208 [15:55<18:59,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.472, train/loss_vlb_step=0.00864, train/loss_step=0.472, global_step=8895.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  46%|████▌     | 551/1208 [15:55<18:59,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0779, train/loss_vlb_step=0.000268, train/loss_step=0.0779, global_step=8895.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  46%|████▌     | 552/1208 [15:58<18:59,  1.74s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0779, train/loss_vlb_step=0.000268, train/loss_step=0.0779, global_step=8895.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  46%|████▌     | 552/1208 [15:58<18:59,  1.74s/it, loss=0.171, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.00416, train/loss_step=0.512, global_step=8895.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  46%|████▌     | 553/1208 [15:59<18:56,  1.74s/it, loss=0.171, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.00416, train/loss_step=0.512, global_step=8895.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  46%|████▌     | 553/1208 [15:59<18:56,  1.74s/it, loss=0.174, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.00033, train/loss_step=0.100, global_step=8896.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  46%|████▌     | 554/1208 [16:00<18:54,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.00033, train/loss_step=0.100, global_step=8896.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  46%|████▌     | 554/1208 [16:00<18:54,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.24e-5, train/loss_step=0.0194, global_step=8896.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  46%|████▌     | 555/1208 [16:01<18:51,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.24e-5, train/loss_step=0.0194, global_step=8896.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  46%|████▌     | 555/1208 [16:01<18:51,  1.73s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00478, train/loss_vlb_step=2.52e-5, train/loss_step=0.00478, global_step=8896.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  46%|████▌     | 556/1208 [16:05<18:51,  1.74s/it, loss=0.175, v_num=0, train/loss_simple_step=0.00478, train/loss_vlb_step=2.52e-5, train/loss_step=0.00478, global_step=8896.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  46%|████▌     | 556/1208 [16:05<18:51,  1.74s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0429, train/loss_vlb_step=0.000159, train/loss_step=0.0429, global_step=8896.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  46%|████▌     | 557/1208 [16:06<18:49,  1.73s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0429, train/loss_vlb_step=0.000159, train/loss_step=0.0429, global_step=8896.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  46%|████▌     | 557/1208 [16:06<18:49,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000591, train/loss_step=0.178, global_step=8897.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  46%|████▌     | 558/1208 [16:07<18:46,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000591, train/loss_step=0.178, global_step=8897.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  46%|████▌     | 558/1208 [16:07<18:46,  1.73s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0701, train/loss_vlb_step=0.000233, train/loss_step=0.0701, global_step=8897.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  46%|████▋     | 559/1208 [16:08<18:44,  1.73s/it, loss=0.185, v_num=0, train/loss_simple_step=0.0701, train/loss_vlb_step=0.000233, train/loss_step=0.0701, global_step=8897.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  46%|████▋     | 559/1208 [16:08<18:44,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.000231, train/loss_step=0.0672, global_step=8897.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  46%|████▋     | 560/1208 [16:11<18:44,  1.73s/it, loss=0.186, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.000231, train/loss_step=0.0672, global_step=8897.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  46%|████▋     | 560/1208 [16:11<18:44,  1.73s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0756, train/loss_vlb_step=0.000252, train/loss_step=0.0756, global_step=8897.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  46%|████▋     | 561/1208 [16:12<18:41,  1.73s/it, loss=0.187, v_num=0, train/loss_simple_step=0.0756, train/loss_vlb_step=0.000252, train/loss_step=0.0756, global_step=8897.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  46%|████▋     | 561/1208 [16:12<18:41,  1.73s/it, loss=0.205, v_num=0, train/loss_simple_step=0.508, train/loss_vlb_step=0.00529, train/loss_step=0.508, global_step=8898.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  47%|████▋     | 562/1208 [16:13<18:39,  1.73s/it, loss=0.205, v_num=0, train/loss_simple_step=0.508, train/loss_vlb_step=0.00529, train/loss_step=0.508, global_step=8898.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  47%|████▋     | 562/1208 [16:13<18:39,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00105, train/loss_step=0.251, global_step=8898.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  47%|████▋     | 563/1208 [16:14<18:36,  1.73s/it, loss=0.184, v_num=0, train/loss_simple_step=0.251, train/loss_vlb_step=0.00105, train/loss_step=0.251, global_step=8898.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  47%|████▋     | 563/1208 [16:14<18:36,  1.73s/it, loss=0.19, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000784, train/loss_step=0.216, global_step=8898.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  47%|████▋     | 564/1208 [16:18<18:36,  1.73s/it, loss=0.19, v_num=0, train/loss_simple_step=0.216, train/loss_vlb_step=0.000784, train/loss_step=0.216, global_step=8898.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  47%|████▋     | 564/1208 [16:18<18:36,  1.73s/it, loss=0.201, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00234, train/loss_step=0.405, global_step=8898.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  47%|████▋     | 565/1208 [16:19<18:34,  1.73s/it, loss=0.201, v_num=0, train/loss_simple_step=0.405, train/loss_vlb_step=0.00234, train/loss_step=0.405, global_step=8898.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  47%|████▋     | 565/1208 [16:19<18:34,  1.73s/it, loss=0.208, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000983, train/loss_step=0.233, global_step=8899.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  47%|████▋     | 566/1208 [16:20<18:31,  1.73s/it, loss=0.208, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000983, train/loss_step=0.233, global_step=8899.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  47%|████▋     | 566/1208 [16:20<18:31,  1.73s/it, loss=0.219, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00135, train/loss_step=0.318, global_step=8899.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  47%|████▋     | 567/1208 [16:21<18:29,  1.73s/it, loss=0.219, v_num=0, train/loss_simple_step=0.318, train/loss_vlb_step=0.00135, train/loss_step=0.318, global_step=8899.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  47%|████▋     | 567/1208 [16:21<18:29,  1.73s/it, loss=0.204, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00144, train/loss_step=0.286, global_step=8899.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  47%|████▋     | 568/1208 [16:24<18:29,  1.73s/it, loss=0.204, v_num=0, train/loss_simple_step=0.286, train/loss_vlb_step=0.00144, train/loss_step=0.286, global_step=8899.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  47%|████▋     | 568/1208 [16:24<18:29,  1.73s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0625, train/loss_vlb_step=0.000218, train/loss_step=0.0625, global_step=8899.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  47%|████▋     | 569/1208 [16:25<18:26,  1.73s/it, loss=0.199, v_num=0, train/loss_simple_step=0.0625, train/loss_vlb_step=0.000218, train/loss_step=0.0625, global_step=8899.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  47%|████▋     | 569/1208 [16:25<18:26,  1.73s/it, loss=0.229, v_num=0, train/loss_simple_step=0.675, train/loss_vlb_step=0.0434, train/loss_step=0.675, global_step=8900.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  47%|████▋     | 570/1208 [16:26<18:24,  1.73s/it, loss=0.229, v_num=0, train/loss_simple_step=0.675, train/loss_vlb_step=0.0434, train/loss_step=0.675, global_step=8900.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  47%|████▋     | 570/1208 [16:26<18:24,  1.73s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.13e-5, train/loss_step=0.0113, global_step=8900.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  47%|████▋     | 571/1208 [16:27<18:21,  1.73s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.13e-5, train/loss_step=0.0113, global_step=8900.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  47%|████▋     | 571/1208 [16:27<18:21,  1.73s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000127, train/loss_step=0.0317, global_step=8900.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  47%|████▋     | 572/1208 [16:30<18:21,  1.73s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000127, train/loss_step=0.0317, global_step=8900.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  47%|████▋     | 572/1208 [16:30<18:21,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0731, train/loss_vlb_step=0.000247, train/loss_step=0.0731, global_step=8900.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  47%|████▋     | 573/1208 [16:32<18:19,  1.73s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0731, train/loss_vlb_step=0.000247, train/loss_step=0.0731, global_step=8900.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  47%|████▋     | 573/1208 [16:32<18:19,  1.73s/it, loss=0.19, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.0011, train/loss_step=0.273, global_step=8901.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]     Epoch 29:  48%|████▊     | 574/1208 [16:33<18:16,  1.73s/it, loss=0.19, v_num=0, train/loss_simple_step=0.273, train/loss_vlb_step=0.0011, train/loss_step=0.273, global_step=8901.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  48%|████▊     | 574/1208 [16:33<18:16,  1.73s/it, loss=0.208, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00313, train/loss_step=0.374, global_step=8901.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  48%|████▊     | 575/1208 [16:34<18:14,  1.73s/it, loss=0.208, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00313, train/loss_step=0.374, global_step=8901.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  48%|████▊     | 575/1208 [16:34<18:14,  1.73s/it, loss=0.209, v_num=0, train/loss_simple_step=0.0303, train/loss_vlb_step=0.000116, train/loss_step=0.0303, global_step=8901.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  48%|████▊     | 576/1208 [16:37<18:14,  1.73s/it, loss=0.209, v_num=0, train/loss_simple_step=0.0303, train/loss_vlb_step=0.000116, train/loss_step=0.0303, global_step=8901.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  48%|████▊     | 576/1208 [16:37<18:14,  1.73s/it, loss=0.213, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=8901.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  48%|████▊     | 577/1208 [16:38<18:12,  1.73s/it, loss=0.213, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=8901.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  48%|████▊     | 577/1208 [16:38<18:12,  1.73s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.55e-5, train/loss_step=0.0241, global_step=8902.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  48%|████▊     | 578/1208 [16:39<18:09,  1.73s/it, loss=0.205, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=9.55e-5, train/loss_step=0.0241, global_step=8902.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  48%|████▊     | 578/1208 [16:39<18:09,  1.73s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000139, train/loss_step=0.0388, global_step=8902.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  48%|████▊     | 579/1208 [16:40<18:07,  1.73s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0388, train/loss_vlb_step=0.000139, train/loss_step=0.0388, global_step=8902.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  48%|████▊     | 579/1208 [16:40<18:07,  1.73s/it, loss=0.212, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.00104, train/loss_step=0.234, global_step=8902.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  48%|████▊     | 580/1208 [16:43<18:07,  1.73s/it, loss=0.212, v_num=0, train/loss_simple_step=0.234, train/loss_vlb_step=0.00104, train/loss_step=0.234, global_step=8902.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  48%|████▊     | 580/1208 [16:43<18:07,  1.73s/it, loss=0.23, v_num=0, train/loss_simple_step=0.438, train/loss_vlb_step=0.00271, train/loss_step=0.438, global_step=8902.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  48%|████▊     | 581/1208 [16:45<18:04,  1.73s/it, loss=0.23, v_num=0, train/loss_simple_step=0.438, train/loss_vlb_step=0.00271, train/loss_step=0.438, global_step=8902.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  48%|████▊     | 581/1208 [16:45<18:04,  1.73s/it, loss=0.218, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.0011, train/loss_step=0.265, global_step=8903.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  48%|████▊     | 582/1208 [16:46<18:02,  1.73s/it, loss=0.218, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.0011, train/loss_step=0.265, global_step=8903.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  48%|████▊     | 582/1208 [16:46<18:02,  1.73s/it, loss=0.206, v_num=0, train/loss_simple_step=0.00886, train/loss_vlb_step=4.43e-5, train/loss_step=0.00886, global_step=8903.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  48%|████▊     | 583/1208 [16:47<17:59,  1.73s/it, loss=0.206, v_num=0, train/loss_simple_step=0.00886, train/loss_vlb_step=4.43e-5, train/loss_step=0.00886, global_step=8903.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  48%|████▊     | 583/1208 [16:47<17:59,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=0.000104, train/loss_step=0.0261, global_step=8903.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  48%|████▊     | 584/1208 [16:50<17:59,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0261, train/loss_vlb_step=0.000104, train/loss_step=0.0261, global_step=8903.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  48%|████▊     | 584/1208 [16:50<17:59,  1.73s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00424, train/loss_vlb_step=2.26e-5, train/loss_step=0.00424, global_step=8903.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  48%|████▊     | 585/1208 [16:51<17:57,  1.73s/it, loss=0.176, v_num=0, train/loss_simple_step=0.00424, train/loss_vlb_step=2.26e-5, train/loss_step=0.00424, global_step=8903.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  48%|████▊     | 585/1208 [16:51<17:57,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000406, train/loss_step=0.122, global_step=8904.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  49%|████▊     | 586/1208 [16:52<17:54,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000406, train/loss_step=0.122, global_step=8904.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  49%|████▊     | 586/1208 [16:52<17:54,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000564, train/loss_step=0.161, global_step=8904.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  49%|████▊     | 587/1208 [16:53<17:52,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000564, train/loss_step=0.161, global_step=8904.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  49%|████▊     | 587/1208 [16:53<17:52,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=1.03e-5, train/loss_step=0.0017, global_step=8904.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  49%|████▊     | 588/1208 [16:56<17:52,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=1.03e-5, train/loss_step=0.0017, global_step=8904.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  49%|████▊     | 588/1208 [16:56<17:52,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.14e-5, train/loss_step=0.00195, global_step=8904.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  49%|████▉     | 589/1208 [16:57<17:49,  1.73s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.14e-5, train/loss_step=0.00195, global_step=8904.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  49%|████▉     | 589/1208 [16:57<17:49,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000659, train/loss_step=0.174, global_step=8905.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  49%|████▉     | 590/1208 [16:59<17:47,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.174, train/loss_vlb_step=0.000659, train/loss_step=0.174, global_step=8905.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  49%|████▉     | 590/1208 [16:59<17:47,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.00046, train/loss_step=0.137, global_step=8905.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  49%|████▉     | 591/1208 [17:00<17:44,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.137, train/loss_vlb_step=0.00046, train/loss_step=0.137, global_step=8905.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  49%|████▉     | 591/1208 [17:00<17:44,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.497, train/loss_vlb_step=0.00412, train/loss_step=0.497, global_step=8905.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  49%|████▉     | 592/1208 [17:03<17:44,  1.73s/it, loss=0.15, v_num=0, train/loss_simple_step=0.497, train/loss_vlb_step=0.00412, train/loss_step=0.497, global_step=8905.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  49%|████▉     | 592/1208 [17:03<17:44,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.99e-5, train/loss_step=0.0161, global_step=8905.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  49%|████▉     | 593/1208 [17:04<17:42,  1.73s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.99e-5, train/loss_step=0.0161, global_step=8905.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  49%|████▉     | 593/1208 [17:04<17:42,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.73e-5, train/loss_step=0.016, global_step=8906.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  49%|████▉     | 594/1208 [17:05<17:40,  1.73s/it, loss=0.134, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.73e-5, train/loss_step=0.016, global_step=8906.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  49%|████▉     | 594/1208 [17:05<17:40,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=9.87e-5, train/loss_step=0.0255, global_step=8906.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  49%|████▉     | 595/1208 [17:06<17:37,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=9.87e-5, train/loss_step=0.0255, global_step=8906.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  49%|████▉     | 595/1208 [17:06<17:37,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000451, train/loss_step=0.136, global_step=8906.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  49%|████▉     | 596/1208 [17:09<17:37,  1.73s/it, loss=0.122, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000451, train/loss_step=0.136, global_step=8906.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  49%|████▉     | 596/1208 [17:09<17:37,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0435, train/loss_vlb_step=0.000148, train/loss_step=0.0435, global_step=8906.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  49%|████▉     | 597/1208 [17:10<17:35,  1.73s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0435, train/loss_vlb_step=0.000148, train/loss_step=0.0435, global_step=8906.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  49%|████▉     | 597/1208 [17:10<17:35,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000174, train/loss_step=0.0478, global_step=8907.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  50%|████▉     | 598/1208 [17:12<17:32,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0478, train/loss_vlb_step=0.000174, train/loss_step=0.0478, global_step=8907.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  50%|████▉     | 598/1208 [17:12<17:32,  1.73s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.09e-5, train/loss_step=0.00394, global_step=8907.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  50%|████▉     | 599/1208 [17:13<17:30,  1.72s/it, loss=0.118, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.09e-5, train/loss_step=0.00394, global_step=8907.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  50%|████▉     | 599/1208 [17:13<17:30,  1.72s/it, loss=0.117, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000754, train/loss_step=0.217, global_step=8907.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  50%|████▉     | 600/1208 [17:16<17:30,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.217, train/loss_vlb_step=0.000754, train/loss_step=0.217, global_step=8907.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  50%|████▉     | 600/1208 [17:16<17:30,  1.73s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0993, train/loss_vlb_step=0.000327, train/loss_step=0.0993, global_step=8907.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.81it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.80it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.71it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.75it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.77it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.72it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:27,  1.76it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.80it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.76it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.70it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.70it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.72it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.75it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:24,  1.81it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.75it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:26,  1.73it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.75it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.80it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.73it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.74it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.76it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.81it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.74it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.73it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.74it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.80it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.75it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.74it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.75it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:04<00:22,  1.80it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.75it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.74it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.74it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.76it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:23,  1.72it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.74it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.81it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.75it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.74it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.76it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:20,  1.81it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.73it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.75it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.81it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.76it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.73it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.76it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.80it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.74it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.76it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.80it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.75it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:20,  1.72it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.78it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.77it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.73it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:19,  1.74it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.75it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.79it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.75it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.74it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.76it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.73it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:16,  1.73it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.77it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.78it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.71it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.76it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:15,  1.72it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:13<00:14,  1.77it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.72it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.76it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.77it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:15<00:13,  1.72it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.76it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.78it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.72it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.76it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.78it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:16<00:12,  1.74it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.77it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.78it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:12,  1.70it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.76it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.78it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.79it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.71it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.78it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:17<00:10,  1.79it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:11,  1.72it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.78it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.79it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.72it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:19<00:09,  1.72it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.76it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.73it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.78it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:20<00:08,  1.73it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.78it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:08,  1.74it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.75it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.78it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.77it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.73it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.74it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.77it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.74it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.73it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.77it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.74it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.73it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.75it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:22<00:05,  1.76it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:23<00:05,  1.74it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.74it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.77it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.75it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.75it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.78it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:24<00:04,  1.75it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.75it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.78it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.75it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.77it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.75it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.72it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.76it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.74it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.73it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.76it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.75it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.74it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.75it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:26<00:01,  1.76it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:27<00:01,  1.74it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.73it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.75it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.71it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.71it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.75it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.74it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.73it/s]Epoch 29:  50%|████▉     | 601/1208 [17:47<17:58,  1.78s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0993, train/loss_vlb_step=0.000327, train/loss_step=0.0993, global_step=8907.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  50%|████▉     | 601/1208 [17:47<17:58,  1.78s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00111, train/loss_step=0.252, global_step=8908.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  50%|████▉     | 602/1208 [17:48<17:55,  1.78s/it, loss=0.0996, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00111, train/loss_step=0.252, global_step=8908.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  50%|████▉     | 602/1208 [17:48<17:55,  1.78s/it, loss=0.0997, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.66e-5, train/loss_step=0.0125, global_step=8908.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  50%|████▉     | 603/1208 [17:49<17:53,  1.77s/it, loss=0.0997, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.66e-5, train/loss_step=0.0125, global_step=8908.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  50%|████▉     | 603/1208 [17:49<17:53,  1.77s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.00016, train/loss_step=0.0441, global_step=8908.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  50%|█████     | 604/1208 [17:52<17:52,  1.78s/it, loss=0.101, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.00016, train/loss_step=0.0441, global_step=8908.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  50%|█████     | 604/1208 [17:52<17:52,  1.78s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00587, train/loss_vlb_step=3.06e-5, train/loss_step=0.00587, global_step=8908.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  50%|█████     | 605/1208 [17:54<17:50,  1.78s/it, loss=0.101, v_num=0, train/loss_simple_step=0.00587, train/loss_vlb_step=3.06e-5, train/loss_step=0.00587, global_step=8908.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  50%|█████     | 605/1208 [17:54<17:50,  1.78s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.66e-5, train/loss_step=0.0157, global_step=8909.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  50%|█████     | 606/1208 [17:55<17:48,  1.77s/it, loss=0.0954, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=6.66e-5, train/loss_step=0.0157, global_step=8909.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  50%|█████     | 606/1208 [17:55<17:48,  1.77s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000411, train/loss_step=0.124, global_step=8909.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  50%|█████     | 607/1208 [17:56<17:45,  1.77s/it, loss=0.0935, v_num=0, train/loss_simple_step=0.124, train/loss_vlb_step=0.000411, train/loss_step=0.124, global_step=8909.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  50%|█████     | 607/1208 [17:56<17:45,  1.77s/it, loss=0.099, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000367, train/loss_step=0.111, global_step=8909.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  50%|█████     | 608/1208 [17:59<17:45,  1.78s/it, loss=0.099, v_num=0, train/loss_simple_step=0.111, train/loss_vlb_step=0.000367, train/loss_step=0.111, global_step=8909.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  50%|█████     | 608/1208 [17:59<17:45,  1.78s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.36e-5, train/loss_step=0.0117, global_step=8909.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  50%|█████     | 609/1208 [18:00<17:42,  1.77s/it, loss=0.0995, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.36e-5, train/loss_step=0.0117, global_step=8909.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  50%|█████     | 609/1208 [18:00<17:42,  1.77s/it, loss=0.109, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00228, train/loss_step=0.374, global_step=8910.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  50%|█████     | 610/1208 [18:01<17:40,  1.77s/it, loss=0.109, v_num=0, train/loss_simple_step=0.374, train/loss_vlb_step=0.00228, train/loss_step=0.374, global_step=8910.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  50%|█████     | 610/1208 [18:01<17:40,  1.77s/it, loss=0.104, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.000101, train/loss_step=0.027, global_step=8910.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  51%|█████     | 611/1208 [18:02<17:37,  1.77s/it, loss=0.104, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.000101, train/loss_step=0.027, global_step=8910.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  51%|█████     | 611/1208 [18:02<17:37,  1.77s/it, loss=0.0797, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.44e-5, train/loss_step=0.012, global_step=8910.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  51%|█████     | 612/1208 [18:05<17:37,  1.77s/it, loss=0.0797, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.44e-5, train/loss_step=0.012, global_step=8910.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  51%|█████     | 612/1208 [18:05<17:37,  1.77s/it, loss=0.0825, v_num=0, train/loss_simple_step=0.0709, train/loss_vlb_step=0.000237, train/loss_step=0.0709, global_step=8910.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  51%|█████     | 613/1208 [18:06<17:35,  1.77s/it, loss=0.0825, v_num=0, train/loss_simple_step=0.0709, train/loss_vlb_step=0.000237, train/loss_step=0.0709, global_step=8910.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  51%|█████     | 613/1208 [18:06<17:35,  1.77s/it, loss=0.0832, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000106, train/loss_step=0.0296, global_step=8911.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  51%|█████     | 614/1208 [18:07<17:32,  1.77s/it, loss=0.0832, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000106, train/loss_step=0.0296, global_step=8911.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  51%|█████     | 614/1208 [18:07<17:32,  1.77s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.0916, train/loss_vlb_step=0.000301, train/loss_step=0.0916, global_step=8911.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  51%|█████     | 615/1208 [18:09<17:30,  1.77s/it, loss=0.0865, v_num=0, train/loss_simple_step=0.0916, train/loss_vlb_step=0.000301, train/loss_step=0.0916, global_step=8911.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  51%|█████     | 615/1208 [18:09<17:30,  1.77s/it, loss=0.0809, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.000101, train/loss_step=0.0249, global_step=8911.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  51%|█████     | 616/1208 [18:12<17:29,  1.77s/it, loss=0.0809, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.000101, train/loss_step=0.0249, global_step=8911.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  51%|█████     | 616/1208 [18:12<17:29,  1.77s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000512, train/loss_step=0.154, global_step=8911.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  51%|█████     | 617/1208 [18:13<17:27,  1.77s/it, loss=0.0864, v_num=0, train/loss_simple_step=0.154, train/loss_vlb_step=0.000512, train/loss_step=0.154, global_step=8911.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  51%|█████     | 617/1208 [18:13<17:27,  1.77s/it, loss=0.085, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=7.84e-5, train/loss_step=0.0194, global_step=8912.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  51%|█████     | 618/1208 [18:14<17:24,  1.77s/it, loss=0.085, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=7.84e-5, train/loss_step=0.0194, global_step=8912.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  51%|█████     | 618/1208 [18:14<17:24,  1.77s/it, loss=0.0858, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.59e-5, train/loss_step=0.0205, global_step=8912.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  51%|█████     | 619/1208 [18:15<17:22,  1.77s/it, loss=0.0858, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=8.59e-5, train/loss_step=0.0205, global_step=8912.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  51%|█████     | 619/1208 [18:15<17:22,  1.77s/it, loss=0.0798, v_num=0, train/loss_simple_step=0.0954, train/loss_vlb_step=0.000314, train/loss_step=0.0954, global_step=8912.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  51%|█████▏    | 620/1208 [18:18<17:22,  1.77s/it, loss=0.0798, v_num=0, train/loss_simple_step=0.0954, train/loss_vlb_step=0.000314, train/loss_step=0.0954, global_step=8912.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  51%|█████▏    | 620/1208 [18:18<17:22,  1.77s/it, loss=0.0763, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.00011, train/loss_step=0.0299, global_step=8912.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  51%|█████▏    | 621/1208 [18:20<17:19,  1.77s/it, loss=0.0763, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.00011, train/loss_step=0.0299, global_step=8912.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  51%|█████▏    | 621/1208 [18:20<17:19,  1.77s/it, loss=0.0868, v_num=0, train/loss_simple_step=0.463, train/loss_vlb_step=0.0038, train/loss_step=0.463, global_step=8913.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  51%|█████▏    | 622/1208 [18:21<17:17,  1.77s/it, loss=0.0868, v_num=0, train/loss_simple_step=0.463, train/loss_vlb_step=0.0038, train/loss_step=0.463, global_step=8913.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  51%|█████▏    | 622/1208 [18:21<17:17,  1.77s/it, loss=0.118, v_num=0, train/loss_simple_step=0.629, train/loss_vlb_step=0.00802, train/loss_step=0.629, global_step=8913.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  52%|█████▏    | 623/1208 [18:22<17:14,  1.77s/it, loss=0.118, v_num=0, train/loss_simple_step=0.629, train/loss_vlb_step=0.00802, train/loss_step=0.629, global_step=8913.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  52%|█████▏    | 623/1208 [18:22<17:14,  1.77s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00598, train/loss_vlb_step=3.08e-5, train/loss_step=0.00598, global_step=8913.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  52%|█████▏    | 624/1208 [18:25<17:14,  1.77s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00598, train/loss_vlb_step=3.08e-5, train/loss_step=0.00598, global_step=8913.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  52%|█████▏    | 624/1208 [18:25<17:14,  1.77s/it, loss=0.122, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000404, train/loss_step=0.122, global_step=8913.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  52%|█████▏    | 625/1208 [18:26<17:12,  1.77s/it, loss=0.122, v_num=0, train/loss_simple_step=0.122, train/loss_vlb_step=0.000404, train/loss_step=0.122, global_step=8913.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  52%|█████▏    | 625/1208 [18:26<17:12,  1.77s/it, loss=0.122, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.000128, train/loss_step=0.033, global_step=8914.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  52%|█████▏    | 626/1208 [18:27<17:09,  1.77s/it, loss=0.122, v_num=0, train/loss_simple_step=0.033, train/loss_vlb_step=0.000128, train/loss_step=0.033, global_step=8914.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  52%|█████▏    | 626/1208 [18:27<17:09,  1.77s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.44e-5, train/loss_step=0.0171, global_step=8914.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  52%|█████▏    | 627/1208 [18:28<17:07,  1.77s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=7.44e-5, train/loss_step=0.0171, global_step=8914.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  52%|█████▏    | 627/1208 [18:28<17:07,  1.77s/it, loss=0.117, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.00035, train/loss_step=0.106, global_step=8914.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  52%|█████▏    | 628/1208 [18:31<17:06,  1.77s/it, loss=0.117, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.00035, train/loss_step=0.106, global_step=8914.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  52%|█████▏    | 628/1208 [18:31<17:06,  1.77s/it, loss=0.124, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000506, train/loss_step=0.153, global_step=8914.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  52%|█████▏    | 629/1208 [18:32<17:04,  1.77s/it, loss=0.124, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000506, train/loss_step=0.153, global_step=8914.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  52%|█████▏    | 629/1208 [18:32<17:04,  1.77s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00369, train/loss_vlb_step=2.08e-5, train/loss_step=0.00369, global_step=8915.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  52%|█████▏    | 630/1208 [18:34<17:02,  1.77s/it, loss=0.105, v_num=0, train/loss_simple_step=0.00369, train/loss_vlb_step=2.08e-5, train/loss_step=0.00369, global_step=8915.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  52%|█████▏    | 630/1208 [18:34<17:02,  1.77s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00795, train/loss_vlb_step=3.79e-5, train/loss_step=0.00795, global_step=8915.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  52%|█████▏    | 631/1208 [18:35<16:59,  1.77s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00795, train/loss_vlb_step=3.79e-5, train/loss_step=0.00795, global_step=8915.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  52%|█████▏    | 631/1208 [18:35<16:59,  1.77s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00576, train/loss_vlb_step=2.98e-5, train/loss_step=0.00576, global_step=8915.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  52%|█████▏    | 632/1208 [18:38<16:59,  1.77s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00576, train/loss_vlb_step=2.98e-5, train/loss_step=0.00576, global_step=8915.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  52%|█████▏    | 632/1208 [18:38<16:59,  1.77s/it, loss=0.109, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000575, train/loss_step=0.172, global_step=8915.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  52%|█████▏    | 633/1208 [18:39<16:56,  1.77s/it, loss=0.109, v_num=0, train/loss_simple_step=0.172, train/loss_vlb_step=0.000575, train/loss_step=0.172, global_step=8915.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  52%|█████▏    | 633/1208 [18:39<16:56,  1.77s/it, loss=0.121, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00122, train/loss_step=0.259, global_step=8916.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  52%|█████▏    | 634/1208 [18:40<16:54,  1.77s/it, loss=0.121, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00122, train/loss_step=0.259, global_step=8916.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  52%|█████▏    | 634/1208 [18:40<16:54,  1.77s/it, loss=0.128, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000988, train/loss_step=0.239, global_step=8916.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  53%|█████▎    | 635/1208 [18:41<16:52,  1.77s/it, loss=0.128, v_num=0, train/loss_simple_step=0.239, train/loss_vlb_step=0.000988, train/loss_step=0.239, global_step=8916.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  53%|█████▎    | 635/1208 [18:41<16:52,  1.77s/it, loss=0.132, v_num=0, train/loss_simple_step=0.096, train/loss_vlb_step=0.000316, train/loss_step=0.096, global_step=8916.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  53%|█████▎    | 636/1208 [18:44<16:51,  1.77s/it, loss=0.132, v_num=0, train/loss_simple_step=0.096, train/loss_vlb_step=0.000316, train/loss_step=0.096, global_step=8916.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  53%|█████▎    | 636/1208 [18:44<16:51,  1.77s/it, loss=0.144, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00183, train/loss_step=0.397, global_step=8916.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  53%|█████▎    | 637/1208 [18:46<16:49,  1.77s/it, loss=0.144, v_num=0, train/loss_simple_step=0.397, train/loss_vlb_step=0.00183, train/loss_step=0.397, global_step=8916.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  53%|█████▎    | 637/1208 [18:46<16:49,  1.77s/it, loss=0.155, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000945, train/loss_step=0.250, global_step=8917.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  53%|█████▎    | 638/1208 [18:47<16:47,  1.77s/it, loss=0.155, v_num=0, train/loss_simple_step=0.250, train/loss_vlb_step=0.000945, train/loss_step=0.250, global_step=8917.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  53%|█████▎    | 638/1208 [18:47<16:47,  1.77s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0937, train/loss_vlb_step=0.000311, train/loss_step=0.0937, global_step=8917.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  53%|█████▎    | 639/1208 [18:48<16:44,  1.77s/it, loss=0.159, v_num=0, train/loss_simple_step=0.0937, train/loss_vlb_step=0.000311, train/loss_step=0.0937, global_step=8917.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  53%|█████▎    | 639/1208 [18:48<16:44,  1.77s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.22e-5, train/loss_step=0.00215, global_step=8917.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  53%|█████▎    | 640/1208 [18:51<16:44,  1.77s/it, loss=0.154, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.22e-5, train/loss_step=0.00215, global_step=8917.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  53%|█████▎    | 640/1208 [18:51<16:44,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000633, train/loss_step=0.176, global_step=8917.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  53%|█████▎    | 641/1208 [18:52<16:41,  1.77s/it, loss=0.162, v_num=0, train/loss_simple_step=0.176, train/loss_vlb_step=0.000633, train/loss_step=0.176, global_step=8917.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  53%|█████▎    | 641/1208 [18:52<16:41,  1.77s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000104, train/loss_step=0.0262, global_step=8918.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  53%|█████▎    | 642/1208 [18:53<16:39,  1.77s/it, loss=0.14, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.000104, train/loss_step=0.0262, global_step=8918.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  53%|█████▎    | 642/1208 [18:53<16:39,  1.77s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0095, train/loss_vlb_step=4.45e-5, train/loss_step=0.0095, global_step=8918.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  53%|█████▎    | 643/1208 [18:54<16:37,  1.76s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0095, train/loss_vlb_step=4.45e-5, train/loss_step=0.0095, global_step=8918.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  53%|█████▎    | 643/1208 [18:54<16:37,  1.76s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=4.97e-5, train/loss_step=0.0112, global_step=8918.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  53%|█████▎    | 644/1208 [18:57<16:36,  1.77s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=4.97e-5, train/loss_step=0.0112, global_step=8918.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  53%|█████▎    | 644/1208 [18:57<16:36,  1.77s/it, loss=0.109, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000367, train/loss_step=0.112, global_step=8918.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  53%|█████▎    | 645/1208 [18:59<16:34,  1.77s/it, loss=0.109, v_num=0, train/loss_simple_step=0.112, train/loss_vlb_step=0.000367, train/loss_step=0.112, global_step=8918.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  53%|█████▎    | 645/1208 [18:59<16:34,  1.77s/it, loss=0.115, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000559, train/loss_step=0.163, global_step=8919.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  53%|█████▎    | 646/1208 [19:00<16:31,  1.76s/it, loss=0.115, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000559, train/loss_step=0.163, global_step=8919.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  53%|█████▎    | 646/1208 [19:00<16:31,  1.76s/it, loss=0.12, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000383, train/loss_step=0.114, global_step=8919.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  54%|█████▎    | 647/1208 [19:01<16:29,  1.76s/it, loss=0.12, v_num=0, train/loss_simple_step=0.114, train/loss_vlb_step=0.000383, train/loss_step=0.114, global_step=8919.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  54%|█████▎    | 647/1208 [19:01<16:29,  1.76s/it, loss=0.123, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.00055, train/loss_step=0.166, global_step=8919.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  54%|█████▎    | 648/1208 [19:04<16:29,  1.77s/it, loss=0.123, v_num=0, train/loss_simple_step=0.166, train/loss_vlb_step=0.00055, train/loss_step=0.166, global_step=8919.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  54%|█████▎    | 648/1208 [19:04<16:29,  1.77s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.74e-5, train/loss_step=0.0159, global_step=8919.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  54%|█████▎    | 649/1208 [19:05<16:26,  1.77s/it, loss=0.116, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.74e-5, train/loss_step=0.0159, global_step=8919.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  54%|█████▎    | 649/1208 [19:05<16:26,  1.77s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000101, train/loss_step=0.0253, global_step=8920.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  54%|█████▍    | 650/1208 [19:06<16:24,  1.76s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000101, train/loss_step=0.0253, global_step=8920.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  54%|█████▍    | 650/1208 [19:06<16:24,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.000147, train/loss_step=0.0401, global_step=8920.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  54%|█████▍    | 651/1208 [19:07<16:21,  1.76s/it, loss=0.119, v_num=0, train/loss_simple_step=0.0401, train/loss_vlb_step=0.000147, train/loss_step=0.0401, global_step=8920.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  54%|█████▍    | 651/1208 [19:07<16:21,  1.76s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000117, train/loss_step=0.0301, global_step=8920.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  54%|█████▍    | 652/1208 [19:11<16:21,  1.77s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000117, train/loss_step=0.0301, global_step=8920.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  54%|█████▍    | 652/1208 [19:11<16:21,  1.77s/it, loss=0.112, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.31e-5, train/loss_step=0.020, global_step=8920.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  54%|█████▍    | 653/1208 [19:12<16:19,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.31e-5, train/loss_step=0.020, global_step=8920.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  54%|█████▍    | 653/1208 [19:12<16:19,  1.76s/it, loss=0.105, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000364, train/loss_step=0.109, global_step=8921.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  54%|█████▍    | 654/1208 [19:13<16:16,  1.76s/it, loss=0.105, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000364, train/loss_step=0.109, global_step=8921.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  54%|█████▍    | 654/1208 [19:13<16:16,  1.76s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.32e-5, train/loss_step=0.0113, global_step=8921.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  54%|█████▍    | 655/1208 [19:14<16:14,  1.76s/it, loss=0.0934, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.32e-5, train/loss_step=0.0113, global_step=8921.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  54%|█████▍    | 655/1208 [19:14<16:14,  1.76s/it, loss=0.101, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000904, train/loss_step=0.240, global_step=8921.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  54%|█████▍    | 656/1208 [19:17<16:13,  1.76s/it, loss=0.101, v_num=0, train/loss_simple_step=0.240, train/loss_vlb_step=0.000904, train/loss_step=0.240, global_step=8921.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  54%|█████▍    | 656/1208 [19:17<16:13,  1.76s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000932, train/loss_step=0.235, global_step=8921.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  54%|█████▍    | 657/1208 [19:18<16:11,  1.76s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.000932, train/loss_step=0.235, global_step=8921.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  54%|█████▍    | 657/1208 [19:18<16:11,  1.76s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.0597, train/loss_vlb_step=0.000201, train/loss_step=0.0597, global_step=8922.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  54%|█████▍    | 658/1208 [19:19<16:09,  1.76s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.0597, train/loss_vlb_step=0.000201, train/loss_step=0.0597, global_step=8922.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  54%|█████▍    | 658/1208 [19:19<16:09,  1.76s/it, loss=0.0883, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000729, train/loss_step=0.201, global_step=8922.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  55%|█████▍    | 659/1208 [19:20<16:06,  1.76s/it, loss=0.0883, v_num=0, train/loss_simple_step=0.201, train/loss_vlb_step=0.000729, train/loss_step=0.201, global_step=8922.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  55%|█████▍    | 659/1208 [19:20<16:06,  1.76s/it, loss=0.0883, v_num=0, train/loss_simple_step=0.00264, train/loss_vlb_step=1.47e-5, train/loss_step=0.00264, global_step=8922.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  55%|█████▍    | 660/1208 [19:23<16:06,  1.76s/it, loss=0.0883, v_num=0, train/loss_simple_step=0.00264, train/loss_vlb_step=1.47e-5, train/loss_step=0.00264, global_step=8922.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  55%|█████▍    | 660/1208 [19:23<16:06,  1.76s/it, loss=0.0868, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.00048, train/loss_step=0.145, global_step=8922.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  55%|█████▍    | 661/1208 [19:25<16:04,  1.76s/it, loss=0.0868, v_num=0, train/loss_simple_step=0.145, train/loss_vlb_step=0.00048, train/loss_step=0.145, global_step=8922.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  55%|█████▍    | 661/1208 [19:25<16:04,  1.76s/it, loss=0.0867, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.55e-5, train/loss_step=0.0238, global_step=8923.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  55%|█████▍    | 662/1208 [19:26<16:01,  1.76s/it, loss=0.0867, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.55e-5, train/loss_step=0.0238, global_step=8923.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  55%|█████▍    | 662/1208 [19:26<16:01,  1.76s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000348, train/loss_step=0.106, global_step=8923.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  55%|█████▍    | 663/1208 [19:27<15:59,  1.76s/it, loss=0.0915, v_num=0, train/loss_simple_step=0.106, train/loss_vlb_step=0.000348, train/loss_step=0.106, global_step=8923.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  55%|█████▍    | 663/1208 [19:27<15:59,  1.76s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000108, train/loss_step=0.029, global_step=8923.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  55%|█████▍    | 664/1208 [19:30<15:59,  1.76s/it, loss=0.0924, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000108, train/loss_step=0.029, global_step=8923.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  55%|█████▍    | 664/1208 [19:30<15:59,  1.76s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.000111, train/loss_step=0.0275, global_step=8923.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  55%|█████▌    | 665/1208 [19:31<15:56,  1.76s/it, loss=0.0882, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.000111, train/loss_step=0.0275, global_step=8923.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  55%|█████▌    | 665/1208 [19:31<15:56,  1.76s/it, loss=0.101, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.0031, train/loss_step=0.412, global_step=8924.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]     Epoch 29:  55%|█████▌    | 666/1208 [19:32<15:54,  1.76s/it, loss=0.101, v_num=0, train/loss_simple_step=0.412, train/loss_vlb_step=0.0031, train/loss_step=0.412, global_step=8924.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  55%|█████▌    | 666/1208 [19:32<15:54,  1.76s/it, loss=0.1, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000338, train/loss_step=0.103, global_step=8924.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  55%|█████▌    | 667/1208 [19:33<15:52,  1.76s/it, loss=0.1, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000338, train/loss_step=0.103, global_step=8924.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  55%|█████▌    | 667/1208 [19:33<15:52,  1.76s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.0535, train/loss_vlb_step=0.000185, train/loss_step=0.0535, global_step=8924.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  55%|█████▌    | 668/1208 [19:37<15:51,  1.76s/it, loss=0.0944, v_num=0, train/loss_simple_step=0.0535, train/loss_vlb_step=0.000185, train/loss_step=0.0535, global_step=8924.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  55%|█████▌    | 668/1208 [19:37<15:51,  1.76s/it, loss=0.103, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000696, train/loss_step=0.197, global_step=8924.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  55%|█████▌    | 669/1208 [19:38<15:49,  1.76s/it, loss=0.103, v_num=0, train/loss_simple_step=0.197, train/loss_vlb_step=0.000696, train/loss_step=0.197, global_step=8924.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  55%|█████▌    | 669/1208 [19:38<15:49,  1.76s/it, loss=0.109, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000438, train/loss_step=0.133, global_step=8925.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  55%|█████▌    | 670/1208 [19:39<15:46,  1.76s/it, loss=0.109, v_num=0, train/loss_simple_step=0.133, train/loss_vlb_step=0.000438, train/loss_step=0.133, global_step=8925.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  55%|█████▌    | 670/1208 [19:39<15:46,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0941, train/loss_vlb_step=0.000309, train/loss_step=0.0941, global_step=8925.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  56%|█████▌    | 671/1208 [19:40<15:44,  1.76s/it, loss=0.112, v_num=0, train/loss_simple_step=0.0941, train/loss_vlb_step=0.000309, train/loss_step=0.0941, global_step=8925.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  56%|█████▌    | 671/1208 [19:40<15:44,  1.76s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00467, train/loss_vlb_step=2.43e-5, train/loss_step=0.00467, global_step=8925.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  56%|█████▌    | 672/1208 [19:43<15:44,  1.76s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00467, train/loss_vlb_step=2.43e-5, train/loss_step=0.00467, global_step=8925.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  56%|█████▌    | 672/1208 [19:43<15:44,  1.76s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00376, train/loss_vlb_step=2.04e-5, train/loss_step=0.00376, global_step=8925.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  56%|█████▌    | 673/1208 [19:44<15:41,  1.76s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00376, train/loss_vlb_step=2.04e-5, train/loss_step=0.00376, global_step=8925.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  56%|█████▌    | 673/1208 [19:44<15:41,  1.76s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.74e-5, train/loss_step=0.00311, global_step=8926.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  56%|█████▌    | 674/1208 [19:45<15:39,  1.76s/it, loss=0.104, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.74e-5, train/loss_step=0.00311, global_step=8926.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  56%|█████▌    | 674/1208 [19:45<15:39,  1.76s/it, loss=0.128, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.0101, train/loss_step=0.485, global_step=8926.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]     Epoch 29:  56%|█████▌    | 675/1208 [19:46<15:37,  1.76s/it, loss=0.128, v_num=0, train/loss_simple_step=0.485, train/loss_vlb_step=0.0101, train/loss_step=0.485, global_step=8926.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  56%|█████▌    | 675/1208 [19:46<15:37,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000827, train/loss_step=0.198, global_step=8926.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  56%|█████▌    | 676/1208 [19:50<15:36,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.198, train/loss_vlb_step=0.000827, train/loss_step=0.198, global_step=8926.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  56%|█████▌    | 676/1208 [19:50<15:36,  1.76s/it, loss=0.122, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000498, train/loss_step=0.149, global_step=8926.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  56%|█████▌    | 677/1208 [19:51<15:34,  1.76s/it, loss=0.122, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000498, train/loss_step=0.149, global_step=8926.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  56%|█████▌    | 677/1208 [19:51<15:34,  1.76s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=8.97e-5, train/loss_step=0.0224, global_step=8927.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  56%|█████▌    | 678/1208 [19:52<15:31,  1.76s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=8.97e-5, train/loss_step=0.0224, global_step=8927.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  56%|█████▌    | 678/1208 [19:52<15:31,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0566, train/loss_vlb_step=0.000198, train/loss_step=0.0566, global_step=8927.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  56%|█████▌    | 679/1208 [19:53<15:29,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.0566, train/loss_vlb_step=0.000198, train/loss_step=0.0566, global_step=8927.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  56%|█████▌    | 679/1208 [19:53<15:29,  1.76s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000117, train/loss_step=0.0301, global_step=8927.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  56%|█████▋    | 680/1208 [19:56<15:29,  1.76s/it, loss=0.114, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.000117, train/loss_step=0.0301, global_step=8927.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  56%|█████▋    | 680/1208 [19:56<15:29,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.568, train/loss_vlb_step=0.0151, train/loss_step=0.568, global_step=8927.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  56%|█████▋    | 681/1208 [19:57<15:26,  1.76s/it, loss=0.135, v_num=0, train/loss_simple_step=0.568, train/loss_vlb_step=0.0151, train/loss_step=0.568, global_step=8927.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  56%|█████▋    | 681/1208 [19:57<15:26,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.001, train/loss_step=0.244, global_step=8928.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  56%|█████▋    | 682/1208 [19:58<15:24,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.244, train/loss_vlb_step=0.001, train/loss_step=0.244, global_step=8928.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  56%|█████▋    | 682/1208 [19:58<15:24,  1.76s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.65e-5, train/loss_step=0.00292, global_step=8928.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  57%|█████▋    | 683/1208 [19:59<15:22,  1.76s/it, loss=0.141, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.65e-5, train/loss_step=0.00292, global_step=8928.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  57%|█████▋    | 683/1208 [19:59<15:22,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000445, train/loss_step=0.131, global_step=8928.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  57%|█████▋    | 684/1208 [20:02<15:21,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.131, train/loss_vlb_step=0.000445, train/loss_step=0.131, global_step=8928.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  57%|█████▋    | 684/1208 [20:02<15:21,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.00013, train/loss_step=0.0352, global_step=8928.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  57%|█████▋    | 685/1208 [20:03<15:19,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0352, train/loss_vlb_step=0.00013, train/loss_step=0.0352, global_step=8928.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  57%|█████▋    | 685/1208 [20:03<15:19,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00772, train/loss_vlb_step=3.67e-5, train/loss_step=0.00772, global_step=8929.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  57%|█████▋    | 686/1208 [20:05<15:16,  1.76s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00772, train/loss_vlb_step=3.67e-5, train/loss_step=0.00772, global_step=8929.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  57%|█████▋    | 686/1208 [20:05<15:16,  1.76s/it, loss=0.127, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000383, train/loss_step=0.116, global_step=8929.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  57%|█████▋    | 687/1208 [20:06<15:14,  1.76s/it, loss=0.127, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000383, train/loss_step=0.116, global_step=8929.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  57%|█████▋    | 687/1208 [20:06<15:14,  1.76s/it, loss=0.156, v_num=0, train/loss_simple_step=0.635, train/loss_vlb_step=0.030, train/loss_step=0.635, global_step=8929.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  57%|█████▋    | 688/1208 [20:09<15:13,  1.76s/it, loss=0.156, v_num=0, train/loss_simple_step=0.635, train/loss_vlb_step=0.030, train/loss_step=0.635, global_step=8929.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  57%|█████▋    | 688/1208 [20:09<15:13,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.89e-5, train/loss_step=0.00349, global_step=8929.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  57%|█████▋    | 689/1208 [20:10<15:11,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.89e-5, train/loss_step=0.00349, global_step=8929.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  57%|█████▋    | 689/1208 [20:10<15:11,  1.76s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00827, train/loss_vlb_step=4.09e-5, train/loss_step=0.00827, global_step=8930.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  57%|█████▋    | 690/1208 [20:11<15:09,  1.76s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00827, train/loss_vlb_step=4.09e-5, train/loss_step=0.00827, global_step=8930.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  57%|█████▋    | 690/1208 [20:11<15:09,  1.76s/it, loss=0.161, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.0103, train/loss_step=0.512, global_step=8930.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  57%|█████▋    | 691/1208 [20:12<15:07,  1.75s/it, loss=0.161, v_num=0, train/loss_simple_step=0.512, train/loss_vlb_step=0.0103, train/loss_step=0.512, global_step=8930.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  57%|█████▋    | 691/1208 [20:12<15:07,  1.75s/it, loss=0.168, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000545, train/loss_step=0.156, global_step=8930.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  57%|█████▋    | 692/1208 [20:15<15:06,  1.76s/it, loss=0.168, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000545, train/loss_step=0.156, global_step=8930.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  57%|█████▋    | 692/1208 [20:15<15:06,  1.76s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=2.37e-5, train/loss_step=0.00451, global_step=8930.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  57%|█████▋    | 693/1208 [20:16<15:04,  1.76s/it, loss=0.168, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=2.37e-5, train/loss_step=0.00451, global_step=8930.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  57%|█████▋    | 693/1208 [20:16<15:04,  1.76s/it, loss=0.198, v_num=0, train/loss_simple_step=0.593, train/loss_vlb_step=0.0145, train/loss_step=0.593, global_step=8931.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]     Epoch 29:  57%|█████▋    | 694/1208 [20:17<15:01,  1.75s/it, loss=0.198, v_num=0, train/loss_simple_step=0.593, train/loss_vlb_step=0.0145, train/loss_step=0.593, global_step=8931.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  57%|█████▋    | 694/1208 [20:17<15:01,  1.75s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.03e-5, train/loss_step=0.0139, global_step=8931.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  58%|█████▊    | 695/1208 [20:18<14:59,  1.75s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.03e-5, train/loss_step=0.0139, global_step=8931.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  58%|█████▊    | 695/1208 [20:18<14:59,  1.75s/it, loss=0.174, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.00071, train/loss_step=0.193, global_step=8931.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  58%|█████▊    | 696/1208 [20:22<14:59,  1.76s/it, loss=0.174, v_num=0, train/loss_simple_step=0.193, train/loss_vlb_step=0.00071, train/loss_step=0.193, global_step=8931.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  58%|█████▊    | 696/1208 [20:22<14:59,  1.76s/it, loss=0.175, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000614, train/loss_step=0.173, global_step=8931.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  58%|█████▊    | 697/1208 [20:23<14:56,  1.76s/it, loss=0.175, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000614, train/loss_step=0.173, global_step=8931.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  58%|█████▊    | 697/1208 [20:23<14:56,  1.76s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000149, train/loss_step=0.0415, global_step=8932.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  58%|█████▊    | 698/1208 [20:24<14:54,  1.75s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0415, train/loss_vlb_step=0.000149, train/loss_step=0.0415, global_step=8932.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  58%|█████▊    | 698/1208 [20:24<14:54,  1.75s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0899, train/loss_vlb_step=0.000295, train/loss_step=0.0899, global_step=8932.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  58%|█████▊    | 699/1208 [20:25<14:52,  1.75s/it, loss=0.178, v_num=0, train/loss_simple_step=0.0899, train/loss_vlb_step=0.000295, train/loss_step=0.0899, global_step=8932.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  58%|█████▊    | 699/1208 [20:25<14:52,  1.75s/it, loss=0.194, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00257, train/loss_step=0.352, global_step=8932.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  58%|█████▊    | 700/1208 [20:28<14:51,  1.76s/it, loss=0.194, v_num=0, train/loss_simple_step=0.352, train/loss_vlb_step=0.00257, train/loss_step=0.352, global_step=8932.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  58%|█████▊    | 700/1208 [20:28<14:51,  1.76s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0723, train/loss_vlb_step=0.000249, train/loss_step=0.0723, global_step=8932.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  58%|█████▊    | 701/1208 [20:29<14:49,  1.75s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0723, train/loss_vlb_step=0.000249, train/loss_step=0.0723, global_step=8932.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  58%|█████▊    | 701/1208 [20:29<14:49,  1.75s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=9.46e-5, train/loss_step=0.0251, global_step=8933.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  58%|█████▊    | 702/1208 [20:31<14:47,  1.75s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=9.46e-5, train/loss_step=0.0251, global_step=8933.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  58%|█████▊    | 702/1208 [20:31<14:47,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0769, train/loss_vlb_step=0.000258, train/loss_step=0.0769, global_step=8933.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  58%|█████▊    | 703/1208 [20:32<14:45,  1.75s/it, loss=0.162, v_num=0, train/loss_simple_step=0.0769, train/loss_vlb_step=0.000258, train/loss_step=0.0769, global_step=8933.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  58%|█████▊    | 703/1208 [20:32<14:45,  1.75s/it, loss=0.165, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000638, train/loss_step=0.189, global_step=8933.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  58%|█████▊    | 704/1208 [20:35<14:44,  1.75s/it, loss=0.165, v_num=0, train/loss_simple_step=0.189, train/loss_vlb_step=0.000638, train/loss_step=0.189, global_step=8933.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  58%|█████▊    | 704/1208 [20:35<14:44,  1.75s/it, loss=0.179, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.002, train/loss_step=0.326, global_step=8933.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  58%|█████▊    | 705/1208 [20:36<14:42,  1.75s/it, loss=0.179, v_num=0, train/loss_simple_step=0.326, train/loss_vlb_step=0.002, train/loss_step=0.326, global_step=8933.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  58%|█████▊    | 705/1208 [20:36<14:42,  1.75s/it, loss=0.186, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000455, train/loss_step=0.138, global_step=8934.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  58%|█████▊    | 706/1208 [20:37<14:39,  1.75s/it, loss=0.186, v_num=0, train/loss_simple_step=0.138, train/loss_vlb_step=0.000455, train/loss_step=0.138, global_step=8934.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  58%|█████▊    | 706/1208 [20:37<14:39,  1.75s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.73e-5, train/loss_step=0.0151, global_step=8934.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  59%|█████▊    | 707/1208 [20:38<14:37,  1.75s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.73e-5, train/loss_step=0.0151, global_step=8934.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  59%|█████▊    | 707/1208 [20:38<14:37,  1.75s/it, loss=0.158, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000574, train/loss_step=0.168, global_step=8934.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  59%|█████▊    | 708/1208 [20:41<14:36,  1.75s/it, loss=0.158, v_num=0, train/loss_simple_step=0.168, train/loss_vlb_step=0.000574, train/loss_step=0.168, global_step=8934.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  59%|█████▊    | 708/1208 [20:41<14:36,  1.75s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.69e-5, train/loss_step=0.0155, global_step=8934.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  59%|█████▊    | 709/1208 [20:42<14:34,  1.75s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=6.69e-5, train/loss_step=0.0155, global_step=8934.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  59%|█████▊    | 709/1208 [20:42<14:34,  1.75s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00337, train/loss_vlb_step=1.8e-5, train/loss_step=0.00337, global_step=8935.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  59%|█████▉    | 710/1208 [20:43<14:32,  1.75s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00337, train/loss_vlb_step=1.8e-5, train/loss_step=0.00337, global_step=8935.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  59%|█████▉    | 710/1208 [20:43<14:32,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.67e-5, train/loss_step=0.0029, global_step=8935.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  59%|█████▉    | 711/1208 [20:44<14:30,  1.75s/it, loss=0.132, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.67e-5, train/loss_step=0.0029, global_step=8935.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  59%|█████▉    | 711/1208 [20:44<14:30,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.00041, train/loss_step=0.125, global_step=8935.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  59%|█████▉    | 712/1208 [20:48<14:29,  1.75s/it, loss=0.131, v_num=0, train/loss_simple_step=0.125, train/loss_vlb_step=0.00041, train/loss_step=0.125, global_step=8935.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  59%|█████▉    | 712/1208 [20:48<14:29,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000393, train/loss_step=0.120, global_step=8935.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  59%|█████▉    | 713/1208 [20:49<14:27,  1.75s/it, loss=0.137, v_num=0, train/loss_simple_step=0.120, train/loss_vlb_step=0.000393, train/loss_step=0.120, global_step=8935.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  59%|█████▉    | 713/1208 [20:49<14:27,  1.75s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.17e-5, train/loss_step=0.00194, global_step=8936.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  59%|█████▉    | 714/1208 [20:50<14:25,  1.75s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=1.17e-5, train/loss_step=0.00194, global_step=8936.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  59%|█████▉    | 714/1208 [20:50<14:25,  1.75s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00667, train/loss_vlb_step=3.23e-5, train/loss_step=0.00667, global_step=8936.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  59%|█████▉    | 715/1208 [20:51<14:22,  1.75s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00667, train/loss_vlb_step=3.23e-5, train/loss_step=0.00667, global_step=8936.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  59%|█████▉    | 715/1208 [20:51<14:22,  1.75s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.00391, train/loss_vlb_step=2.16e-5, train/loss_step=0.00391, global_step=8936.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  59%|█████▉    | 716/1208 [20:54<14:22,  1.75s/it, loss=0.0972, v_num=0, train/loss_simple_step=0.00391, train/loss_vlb_step=2.16e-5, train/loss_step=0.00391, global_step=8936.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  59%|█████▉    | 716/1208 [20:54<14:22,  1.75s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.0922, train/loss_vlb_step=0.000304, train/loss_step=0.0922, global_step=8936.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  59%|█████▉    | 717/1208 [20:55<14:19,  1.75s/it, loss=0.0932, v_num=0, train/loss_simple_step=0.0922, train/loss_vlb_step=0.000304, train/loss_step=0.0922, global_step=8936.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  59%|█████▉    | 717/1208 [20:55<14:19,  1.75s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.0893, train/loss_vlb_step=0.000296, train/loss_step=0.0893, global_step=8937.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  59%|█████▉    | 718/1208 [20:56<14:17,  1.75s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.0893, train/loss_vlb_step=0.000296, train/loss_step=0.0893, global_step=8937.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  59%|█████▉    | 718/1208 [20:56<14:17,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.586, train/loss_vlb_step=0.00719, train/loss_step=0.586, global_step=8937.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]     Epoch 29:  60%|█████▉    | 719/1208 [20:57<14:15,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.586, train/loss_vlb_step=0.00719, train/loss_step=0.586, global_step=8937.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  60%|█████▉    | 719/1208 [20:57<14:15,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.54e-5, train/loss_step=0.00272, global_step=8937.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  60%|█████▉    | 720/1208 [21:01<14:14,  1.75s/it, loss=0.103, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.54e-5, train/loss_step=0.00272, global_step=8937.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  60%|█████▉    | 720/1208 [21:01<14:14,  1.75s/it, loss=0.0997, v_num=0, train/loss_simple_step=0.0069, train/loss_vlb_step=3.29e-5, train/loss_step=0.0069, global_step=8937.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  60%|█████▉    | 721/1208 [21:02<14:12,  1.75s/it, loss=0.0997, v_num=0, train/loss_simple_step=0.0069, train/loss_vlb_step=3.29e-5, train/loss_step=0.0069, global_step=8937.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  60%|█████▉    | 721/1208 [21:02<14:12,  1.75s/it, loss=0.0997, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=0.000105, train/loss_step=0.0259, global_step=8938.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  60%|█████▉    | 722/1208 [21:03<14:10,  1.75s/it, loss=0.0997, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=0.000105, train/loss_step=0.0259, global_step=8938.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  60%|█████▉    | 722/1208 [21:03<14:10,  1.75s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.0696, train/loss_vlb_step=0.000239, train/loss_step=0.0696, global_step=8938.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  60%|█████▉    | 723/1208 [21:04<14:08,  1.75s/it, loss=0.0994, v_num=0, train/loss_simple_step=0.0696, train/loss_vlb_step=0.000239, train/loss_step=0.0696, global_step=8938.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  60%|█████▉    | 723/1208 [21:04<14:08,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.641, train/loss_vlb_step=0.0224, train/loss_step=0.641, global_step=8938.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]     Epoch 29:  60%|█████▉    | 724/1208 [21:07<14:07,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.641, train/loss_vlb_step=0.0224, train/loss_step=0.641, global_step=8938.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  60%|█████▉    | 724/1208 [21:07<14:07,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000884, train/loss_step=0.238, global_step=8938.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  60%|██████    | 725/1208 [21:08<14:05,  1.75s/it, loss=0.118, v_num=0, train/loss_simple_step=0.238, train/loss_vlb_step=0.000884, train/loss_step=0.238, global_step=8938.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  60%|██████    | 725/1208 [21:08<14:05,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.0015, train/loss_step=0.290, global_step=8939.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  60%|██████    | 726/1208 [21:09<14:03,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.0015, train/loss_step=0.290, global_step=8939.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  60%|██████    | 726/1208 [21:09<14:03,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.600, train/loss_vlb_step=0.021, train/loss_step=0.600, global_step=8939.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  60%|██████    | 727/1208 [21:10<14:00,  1.75s/it, loss=0.154, v_num=0, train/loss_simple_step=0.600, train/loss_vlb_step=0.021, train/loss_step=0.600, global_step=8939.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  60%|██████    | 727/1208 [21:10<14:00,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000753, train/loss_step=0.210, global_step=8939.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  60%|██████    | 728/1208 [21:14<14:00,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000753, train/loss_step=0.210, global_step=8939.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  60%|██████    | 728/1208 [21:14<14:00,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=1.12e-5, train/loss_step=0.00185, global_step=8939.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  60%|██████    | 729/1208 [21:15<13:57,  1.75s/it, loss=0.156, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=1.12e-5, train/loss_step=0.00185, global_step=8939.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  60%|██████    | 729/1208 [21:15<13:57,  1.75s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0507, train/loss_vlb_step=0.000173, train/loss_step=0.0507, global_step=8940.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  60%|██████    | 730/1208 [21:16<13:55,  1.75s/it, loss=0.158, v_num=0, train/loss_simple_step=0.0507, train/loss_vlb_step=0.000173, train/loss_step=0.0507, global_step=8940.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  60%|██████    | 730/1208 [21:16<13:55,  1.75s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.08e-5, train/loss_step=0.00178, global_step=8940.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  61%|██████    | 731/1208 [21:17<13:53,  1.75s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=1.08e-5, train/loss_step=0.00178, global_step=8940.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  61%|██████    | 731/1208 [21:17<13:53,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00637, train/loss_vlb_step=3.18e-5, train/loss_step=0.00637, global_step=8940.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  61%|██████    | 732/1208 [21:20<13:52,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00637, train/loss_vlb_step=3.18e-5, train/loss_step=0.00637, global_step=8940.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  61%|██████    | 732/1208 [21:20<13:52,  1.75s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=7.05e-5, train/loss_step=0.0159, global_step=8940.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  61%|██████    | 733/1208 [21:21<13:50,  1.75s/it, loss=0.147, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=7.05e-5, train/loss_step=0.0159, global_step=8940.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  61%|██████    | 733/1208 [21:21<13:50,  1.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.053, train/loss_vlb_step=0.000184, train/loss_step=0.053, global_step=8941.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  61%|██████    | 734/1208 [21:22<13:48,  1.75s/it, loss=0.15, v_num=0, train/loss_simple_step=0.053, train/loss_vlb_step=0.000184, train/loss_step=0.053, global_step=8941.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  61%|██████    | 734/1208 [21:22<13:48,  1.75s/it, loss=0.161, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000893, train/loss_step=0.228, global_step=8941.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  61%|██████    | 735/1208 [21:23<13:46,  1.75s/it, loss=0.161, v_num=0, train/loss_simple_step=0.228, train/loss_vlb_step=0.000893, train/loss_step=0.228, global_step=8941.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  61%|██████    | 735/1208 [21:23<13:46,  1.75s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0641, train/loss_vlb_step=0.000215, train/loss_step=0.0641, global_step=8941.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  61%|██████    | 736/1208 [21:27<13:45,  1.75s/it, loss=0.164, v_num=0, train/loss_simple_step=0.0641, train/loss_vlb_step=0.000215, train/loss_step=0.0641, global_step=8941.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  61%|██████    | 736/1208 [21:27<13:45,  1.75s/it, loss=0.168, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000775, train/loss_step=0.185, global_step=8941.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  61%|██████    | 737/1208 [21:28<13:43,  1.75s/it, loss=0.168, v_num=0, train/loss_simple_step=0.185, train/loss_vlb_step=0.000775, train/loss_step=0.185, global_step=8941.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  61%|██████    | 737/1208 [21:28<13:43,  1.75s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0952, train/loss_vlb_step=0.000313, train/loss_step=0.0952, global_step=8942.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  61%|██████    | 738/1208 [21:29<13:41,  1.75s/it, loss=0.169, v_num=0, train/loss_simple_step=0.0952, train/loss_vlb_step=0.000313, train/loss_step=0.0952, global_step=8942.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  61%|██████    | 738/1208 [21:29<13:41,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00706, train/loss_vlb_step=3.61e-5, train/loss_step=0.00706, global_step=8942.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  61%|██████    | 739/1208 [21:30<13:38,  1.75s/it, loss=0.14, v_num=0, train/loss_simple_step=0.00706, train/loss_vlb_step=3.61e-5, train/loss_step=0.00706, global_step=8942.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  61%|██████    | 739/1208 [21:30<13:38,  1.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000167, train/loss_step=0.0474, global_step=8942.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  61%|██████▏   | 740/1208 [21:33<13:38,  1.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0474, train/loss_vlb_step=0.000167, train/loss_step=0.0474, global_step=8942.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  61%|██████▏   | 740/1208 [21:33<13:38,  1.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.51e-5, train/loss_step=0.0177, global_step=8942.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  61%|██████▏   | 741/1208 [21:34<13:35,  1.75s/it, loss=0.142, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=7.51e-5, train/loss_step=0.0177, global_step=8942.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  61%|██████▏   | 741/1208 [21:34<13:35,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000114, train/loss_step=0.0287, global_step=8943.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  61%|██████▏   | 742/1208 [21:35<13:33,  1.75s/it, loss=0.143, v_num=0, train/loss_simple_step=0.0287, train/loss_vlb_step=0.000114, train/loss_step=0.0287, global_step=8943.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  61%|██████▏   | 742/1208 [21:35<13:33,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.17e-5, train/loss_step=0.00199, global_step=8943.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  62%|██████▏   | 743/1208 [21:36<13:31,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.17e-5, train/loss_step=0.00199, global_step=8943.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  62%|██████▏   | 743/1208 [21:36<13:31,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00249, train/loss_step=0.375, global_step=8943.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  62%|██████▏   | 744/1208 [21:40<13:30,  1.75s/it, loss=0.126, v_num=0, train/loss_simple_step=0.375, train/loss_vlb_step=0.00249, train/loss_step=0.375, global_step=8943.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  62%|██████▏   | 744/1208 [21:40<13:30,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=7.98e-5, train/loss_step=0.0198, global_step=8943.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  62%|██████▏   | 745/1208 [21:41<13:28,  1.75s/it, loss=0.115, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=7.98e-5, train/loss_step=0.0198, global_step=8943.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  62%|██████▏   | 745/1208 [21:41<13:28,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00278, train/loss_step=0.328, global_step=8944.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  62%|██████▏   | 746/1208 [21:42<13:26,  1.75s/it, loss=0.117, v_num=0, train/loss_simple_step=0.328, train/loss_vlb_step=0.00278, train/loss_step=0.328, global_step=8944.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  62%|██████▏   | 746/1208 [21:42<13:26,  1.75s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000344, train/loss_step=0.104, global_step=8944.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  62%|██████▏   | 747/1208 [21:43<13:24,  1.74s/it, loss=0.0921, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000344, train/loss_step=0.104, global_step=8944.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  62%|██████▏   | 747/1208 [21:43<13:24,  1.74s/it, loss=0.0817, v_num=0, train/loss_simple_step=0.00279, train/loss_vlb_step=1.65e-5, train/loss_step=0.00279, global_step=8944.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  62%|██████▏   | 748/1208 [21:46<13:23,  1.75s/it, loss=0.0817, v_num=0, train/loss_simple_step=0.00279, train/loss_vlb_step=1.65e-5, train/loss_step=0.00279, global_step=8944.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  62%|██████▏   | 748/1208 [21:46<13:23,  1.75s/it, loss=0.0826, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.5e-5, train/loss_step=0.0199, global_step=8944.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  62%|██████▏   | 749/1208 [21:47<13:21,  1.75s/it, loss=0.0826, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=8.5e-5, train/loss_step=0.0199, global_step=8944.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  62%|██████▏   | 749/1208 [21:47<13:21,  1.75s/it, loss=0.0867, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000439, train/loss_step=0.132, global_step=8945.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  62%|██████▏   | 750/1208 [21:48<13:19,  1.74s/it, loss=0.0867, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000439, train/loss_step=0.132, global_step=8945.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  62%|██████▏   | 750/1208 [21:48<13:19,  1.74s/it, loss=0.104, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00172, train/loss_step=0.342, global_step=8945.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  62%|██████▏   | 751/1208 [21:49<13:17,  1.74s/it, loss=0.104, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00172, train/loss_step=0.342, global_step=8945.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  62%|██████▏   | 751/1208 [21:49<13:17,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=8945.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  62%|██████▏   | 752/1208 [21:53<13:16,  1.75s/it, loss=0.109, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=8945.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  62%|██████▏   | 752/1208 [21:53<13:16,  1.75s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.00012, train/loss_step=0.0302, global_step=8945.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  62%|██████▏   | 753/1208 [21:54<13:14,  1.75s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.00012, train/loss_step=0.0302, global_step=8945.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  62%|██████▏   | 753/1208 [21:54<13:14,  1.75s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.83e-5, train/loss_step=0.00342, global_step=8946.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  62%|██████▏   | 754/1208 [21:55<13:11,  1.74s/it, loss=0.107, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.83e-5, train/loss_step=0.00342, global_step=8946.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  62%|██████▏   | 754/1208 [21:55<13:11,  1.74s/it, loss=0.0997, v_num=0, train/loss_simple_step=0.085, train/loss_vlb_step=0.000286, train/loss_step=0.085, global_step=8946.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  62%|██████▎   | 755/1208 [21:56<13:09,  1.74s/it, loss=0.0997, v_num=0, train/loss_simple_step=0.085, train/loss_vlb_step=0.000286, train/loss_step=0.085, global_step=8946.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  62%|██████▎   | 755/1208 [21:56<13:09,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000856, train/loss_step=0.223, global_step=8946.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  63%|██████▎   | 756/1208 [21:59<13:08,  1.75s/it, loss=0.108, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.000856, train/loss_step=0.223, global_step=8946.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  63%|██████▎   | 756/1208 [21:59<13:08,  1.75s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000131, train/loss_step=0.0349, global_step=8946.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  63%|██████▎   | 757/1208 [22:00<13:06,  1.74s/it, loss=0.1, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000131, train/loss_step=0.0349, global_step=8946.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  63%|██████▎   | 757/1208 [22:00<13:06,  1.74s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000157, train/loss_step=0.0438, global_step=8947.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  63%|██████▎   | 758/1208 [22:01<13:04,  1.74s/it, loss=0.0975, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000157, train/loss_step=0.0438, global_step=8947.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  63%|██████▎   | 758/1208 [22:01<13:04,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00192, train/loss_step=0.364, global_step=8947.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  63%|██████▎   | 759/1208 [22:02<13:02,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.364, train/loss_vlb_step=0.00192, train/loss_step=0.364, global_step=8947.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  63%|██████▎   | 759/1208 [22:02<13:02,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00418, train/loss_vlb_step=2.28e-5, train/loss_step=0.00418, global_step=8947.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  63%|██████▎   | 760/1208 [22:06<13:01,  1.74s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00418, train/loss_vlb_step=2.28e-5, train/loss_step=0.00418, global_step=8947.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  63%|██████▎   | 760/1208 [22:06<13:01,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000442, train/loss_step=0.132, global_step=8947.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  63%|██████▎   | 761/1208 [22:07<12:59,  1.74s/it, loss=0.119, v_num=0, train/loss_simple_step=0.132, train/loss_vlb_step=0.000442, train/loss_step=0.132, global_step=8947.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  63%|██████▎   | 761/1208 [22:07<12:59,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0867, train/loss_vlb_step=0.00029, train/loss_step=0.0867, global_step=8948.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  63%|██████▎   | 762/1208 [22:08<12:57,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0867, train/loss_vlb_step=0.00029, train/loss_step=0.0867, global_step=8948.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  63%|██████▎   | 762/1208 [22:08<12:57,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00105, train/loss_step=0.253, global_step=8948.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  63%|██████▎   | 763/1208 [22:09<12:55,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00105, train/loss_step=0.253, global_step=8948.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  63%|██████▎   | 763/1208 [22:09<12:55,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000782, train/loss_step=0.203, global_step=8948.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  63%|██████▎   | 764/1208 [22:12<12:54,  1.74s/it, loss=0.126, v_num=0, train/loss_simple_step=0.203, train/loss_vlb_step=0.000782, train/loss_step=0.203, global_step=8948.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  63%|██████▎   | 764/1208 [22:12<12:54,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00843, train/loss_vlb_step=4.09e-5, train/loss_step=0.00843, global_step=8948.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  63%|██████▎   | 765/1208 [22:13<12:52,  1.74s/it, loss=0.125, v_num=0, train/loss_simple_step=0.00843, train/loss_vlb_step=4.09e-5, train/loss_step=0.00843, global_step=8948.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  63%|██████▎   | 765/1208 [22:13<12:52,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=2.02e-5, train/loss_step=0.00368, global_step=8949.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  63%|██████▎   | 766/1208 [22:14<12:50,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=2.02e-5, train/loss_step=0.00368, global_step=8949.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  63%|██████▎   | 766/1208 [22:14<12:50,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00102, train/loss_step=0.243, global_step=8949.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  63%|██████▎   | 767/1208 [22:15<12:48,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00102, train/loss_step=0.243, global_step=8949.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  63%|██████▎   | 767/1208 [22:15<12:48,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=8949.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  64%|██████▎   | 768/1208 [22:19<12:47,  1.74s/it, loss=0.121, v_num=0, train/loss_simple_step=0.109, train/loss_vlb_step=0.000359, train/loss_step=0.109, global_step=8949.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  64%|██████▎   | 768/1208 [22:19<12:47,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00122, train/loss_step=0.270, global_step=8949.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  64%|██████▎   | 769/1208 [22:20<12:45,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.270, train/loss_vlb_step=0.00122, train/loss_step=0.270, global_step=8949.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  64%|██████▎   | 769/1208 [22:20<12:45,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00566, train/loss_vlb_step=2.87e-5, train/loss_step=0.00566, global_step=8950.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  64%|██████▎   | 770/1208 [22:21<12:42,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00566, train/loss_vlb_step=2.87e-5, train/loss_step=0.00566, global_step=8950.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  64%|██████▎   | 770/1208 [22:21<12:42,  1.74s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=1.29e-5, train/loss_step=0.00224, global_step=8950.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  64%|██████▍   | 771/1208 [22:22<12:40,  1.74s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=1.29e-5, train/loss_step=0.00224, global_step=8950.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  64%|██████▍   | 771/1208 [22:22<12:40,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0805, train/loss_vlb_step=0.000265, train/loss_step=0.0805, global_step=8950.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  64%|██████▍   | 772/1208 [22:25<12:39,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0805, train/loss_vlb_step=0.000265, train/loss_step=0.0805, global_step=8950.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  64%|██████▍   | 772/1208 [22:25<12:39,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00683, train/loss_vlb_step=3.41e-5, train/loss_step=0.00683, global_step=8950.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  64%|██████▍   | 773/1208 [22:26<12:37,  1.74s/it, loss=0.108, v_num=0, train/loss_simple_step=0.00683, train/loss_vlb_step=3.41e-5, train/loss_step=0.00683, global_step=8950.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  64%|██████▍   | 773/1208 [22:26<12:37,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.2e-5, train/loss_step=0.0168, global_step=8951.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  64%|██████▍   | 774/1208 [22:27<12:35,  1.74s/it, loss=0.109, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=7.2e-5, train/loss_step=0.0168, global_step=8951.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  64%|██████▍   | 774/1208 [22:27<12:35,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000674, train/loss_step=0.188, global_step=8951.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  64%|██████▍   | 775/1208 [22:28<12:33,  1.74s/it, loss=0.114, v_num=0, train/loss_simple_step=0.188, train/loss_vlb_step=0.000674, train/loss_step=0.188, global_step=8951.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  64%|██████▍   | 775/1208 [22:28<12:33,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00196, train/loss_step=0.392, global_step=8951.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  64%|██████▍   | 776/1208 [22:32<12:32,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.392, train/loss_vlb_step=0.00196, train/loss_step=0.392, global_step=8951.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  64%|██████▍   | 776/1208 [22:32<12:32,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.00012, train/loss_step=0.0313, global_step=8951.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  64%|██████▍   | 777/1208 [22:33<12:30,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.00012, train/loss_step=0.0313, global_step=8951.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  64%|██████▍   | 777/1208 [22:33<12:30,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00185, train/loss_step=0.350, global_step=8952.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  64%|██████▍   | 778/1208 [22:34<12:28,  1.74s/it, loss=0.138, v_num=0, train/loss_simple_step=0.350, train/loss_vlb_step=0.00185, train/loss_step=0.350, global_step=8952.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  64%|██████▍   | 778/1208 [22:34<12:28,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0731, train/loss_vlb_step=0.000244, train/loss_step=0.0731, global_step=8952.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  64%|██████▍   | 779/1208 [22:35<12:26,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0731, train/loss_vlb_step=0.000244, train/loss_step=0.0731, global_step=8952.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  64%|██████▍   | 779/1208 [22:35<12:26,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00227, train/loss_step=0.377, global_step=8952.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  65%|██████▍   | 780/1208 [22:38<12:25,  1.74s/it, loss=0.142, v_num=0, train/loss_simple_step=0.377, train/loss_vlb_step=0.00227, train/loss_step=0.377, global_step=8952.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  65%|██████▍   | 780/1208 [22:38<12:25,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.00081, train/loss_step=0.223, global_step=8952.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  65%|██████▍   | 781/1208 [22:39<12:23,  1.74s/it, loss=0.146, v_num=0, train/loss_simple_step=0.223, train/loss_vlb_step=0.00081, train/loss_step=0.223, global_step=8952.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  65%|██████▍   | 781/1208 [22:39<12:23,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0559, train/loss_vlb_step=0.000193, train/loss_step=0.0559, global_step=8953.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  65%|██████▍   | 782/1208 [22:40<12:21,  1.74s/it, loss=0.145, v_num=0, train/loss_simple_step=0.0559, train/loss_vlb_step=0.000193, train/loss_step=0.0559, global_step=8953.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  65%|██████▍   | 782/1208 [22:40<12:21,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00505, train/loss_vlb_step=2.57e-5, train/loss_step=0.00505, global_step=8953.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  65%|██████▍   | 783/1208 [22:42<12:19,  1.74s/it, loss=0.132, v_num=0, train/loss_simple_step=0.00505, train/loss_vlb_step=2.57e-5, train/loss_step=0.00505, global_step=8953.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  65%|██████▍   | 783/1208 [22:42<12:19,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.0014, train/loss_step=0.272, global_step=8953.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]     Epoch 29:  65%|██████▍   | 784/1208 [22:45<12:18,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.272, train/loss_vlb_step=0.0014, train/loss_step=0.272, global_step=8953.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  65%|██████▍   | 784/1208 [22:45<12:18,  1.74s/it, loss=0.176, v_num=0, train/loss_simple_step=0.805, train/loss_vlb_step=0.0518, train/loss_step=0.805, global_step=8953.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  65%|██████▍   | 785/1208 [22:46<12:16,  1.74s/it, loss=0.176, v_num=0, train/loss_simple_step=0.805, train/loss_vlb_step=0.0518, train/loss_step=0.805, global_step=8953.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  65%|██████▍   | 785/1208 [22:46<12:16,  1.74s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000148, train/loss_step=0.0412, global_step=8954.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  65%|██████▌   | 786/1208 [22:47<12:14,  1.74s/it, loss=0.177, v_num=0, train/loss_simple_step=0.0412, train/loss_vlb_step=0.000148, train/loss_step=0.0412, global_step=8954.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  65%|██████▌   | 786/1208 [22:47<12:14,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0857, train/loss_vlb_step=0.000286, train/loss_step=0.0857, global_step=8954.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  65%|██████▌   | 787/1208 [22:48<12:12,  1.74s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0857, train/loss_vlb_step=0.000286, train/loss_step=0.0857, global_step=8954.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  65%|██████▌   | 787/1208 [22:48<12:12,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0649, train/loss_vlb_step=0.000224, train/loss_step=0.0649, global_step=8954.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  65%|██████▌   | 788/1208 [22:51<12:11,  1.74s/it, loss=0.167, v_num=0, train/loss_simple_step=0.0649, train/loss_vlb_step=0.000224, train/loss_step=0.0649, global_step=8954.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  65%|██████▌   | 788/1208 [22:51<12:11,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000608, train/loss_step=0.179, global_step=8954.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  65%|██████▌   | 789/1208 [22:52<12:09,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.179, train/loss_vlb_step=0.000608, train/loss_step=0.179, global_step=8954.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  65%|██████▌   | 789/1208 [22:52<12:09,  1.74s/it, loss=0.202, v_num=0, train/loss_simple_step=0.786, train/loss_vlb_step=0.0801, train/loss_step=0.786, global_step=8955.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  65%|██████▌   | 790/1208 [22:54<12:07,  1.74s/it, loss=0.202, v_num=0, train/loss_simple_step=0.786, train/loss_vlb_step=0.0801, train/loss_step=0.786, global_step=8955.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  65%|██████▌   | 790/1208 [22:54<12:07,  1.74s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.33e-5, train/loss_step=0.0201, global_step=8955.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  65%|██████▌   | 791/1208 [22:55<12:04,  1.74s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.33e-5, train/loss_step=0.0201, global_step=8955.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  65%|██████▌   | 791/1208 [22:55<12:04,  1.74s/it, loss=0.209, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000747, train/loss_step=0.207, global_step=8955.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  66%|██████▌   | 792/1208 [22:58<12:03,  1.74s/it, loss=0.209, v_num=0, train/loss_simple_step=0.207, train/loss_vlb_step=0.000747, train/loss_step=0.207, global_step=8955.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  66%|██████▌   | 792/1208 [22:58<12:03,  1.74s/it, loss=0.222, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00116, train/loss_step=0.259, global_step=8955.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  66%|██████▌   | 793/1208 [22:59<12:01,  1.74s/it, loss=0.222, v_num=0, train/loss_simple_step=0.259, train/loss_vlb_step=0.00116, train/loss_step=0.259, global_step=8955.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  66%|██████▌   | 793/1208 [22:59<12:01,  1.74s/it, loss=0.252, v_num=0, train/loss_simple_step=0.624, train/loss_vlb_step=0.0251, train/loss_step=0.624, global_step=8956.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  66%|██████▌   | 794/1208 [23:00<11:59,  1.74s/it, loss=0.252, v_num=0, train/loss_simple_step=0.624, train/loss_vlb_step=0.0251, train/loss_step=0.624, global_step=8956.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  66%|██████▌   | 794/1208 [23:00<11:59,  1.74s/it, loss=0.255, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000912, train/loss_step=0.245, global_step=8956.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  66%|██████▌   | 795/1208 [23:01<11:57,  1.74s/it, loss=0.255, v_num=0, train/loss_simple_step=0.245, train/loss_vlb_step=0.000912, train/loss_step=0.245, global_step=8956.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  66%|██████▌   | 795/1208 [23:01<11:57,  1.74s/it, loss=0.243, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000541, train/loss_step=0.157, global_step=8956.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  66%|██████▌   | 796/1208 [23:04<11:56,  1.74s/it, loss=0.243, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000541, train/loss_step=0.157, global_step=8956.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  66%|██████▌   | 796/1208 [23:04<11:56,  1.74s/it, loss=0.25, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000613, train/loss_step=0.171, global_step=8956.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  66%|██████▌   | 797/1208 [23:05<11:54,  1.74s/it, loss=0.25, v_num=0, train/loss_simple_step=0.171, train/loss_vlb_step=0.000613, train/loss_step=0.171, global_step=8956.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  66%|██████▌   | 797/1208 [23:05<11:54,  1.74s/it, loss=0.269, v_num=0, train/loss_simple_step=0.718, train/loss_vlb_step=0.0372, train/loss_step=0.718, global_step=8957.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  66%|██████▌   | 798/1208 [23:07<11:52,  1.74s/it, loss=0.269, v_num=0, train/loss_simple_step=0.718, train/loss_vlb_step=0.0372, train/loss_step=0.718, global_step=8957.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  66%|██████▌   | 798/1208 [23:07<11:52,  1.74s/it, loss=0.272, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000489, train/loss_step=0.143, global_step=8957.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  66%|██████▌   | 799/1208 [23:08<11:50,  1.74s/it, loss=0.272, v_num=0, train/loss_simple_step=0.143, train/loss_vlb_step=0.000489, train/loss_step=0.143, global_step=8957.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  66%|██████▌   | 799/1208 [23:08<11:50,  1.74s/it, loss=0.257, v_num=0, train/loss_simple_step=0.0795, train/loss_vlb_step=0.000269, train/loss_step=0.0795, global_step=8957.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  66%|██████▌   | 800/1208 [23:11<11:49,  1.74s/it, loss=0.257, v_num=0, train/loss_simple_step=0.0795, train/loss_vlb_step=0.000269, train/loss_step=0.0795, global_step=8957.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  66%|██████▌   | 800/1208 [23:11<11:49,  1.74s/it, loss=0.247, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.53e-5, train/loss_step=0.0238, global_step=8957.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  66%|██████▋   | 801/1208 [23:12<11:47,  1.74s/it, loss=0.247, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.53e-5, train/loss_step=0.0238, global_step=8957.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  66%|██████▋   | 801/1208 [23:12<11:47,  1.74s/it, loss=0.249, v_num=0, train/loss_simple_step=0.0982, train/loss_vlb_step=0.000323, train/loss_step=0.0982, global_step=8958.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  66%|██████▋   | 802/1208 [23:13<11:45,  1.74s/it, loss=0.249, v_num=0, train/loss_simple_step=0.0982, train/loss_vlb_step=0.000323, train/loss_step=0.0982, global_step=8958.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  66%|██████▋   | 802/1208 [23:13<11:45,  1.74s/it, loss=0.249, v_num=0, train/loss_simple_step=0.0045, train/loss_vlb_step=2.47e-5, train/loss_step=0.0045, global_step=8958.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  66%|██████▋   | 803/1208 [23:14<11:43,  1.74s/it, loss=0.249, v_num=0, train/loss_simple_step=0.0045, train/loss_vlb_step=2.47e-5, train/loss_step=0.0045, global_step=8958.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  66%|██████▋   | 803/1208 [23:14<11:43,  1.74s/it, loss=0.236, v_num=0, train/loss_simple_step=0.00301, train/loss_vlb_step=1.68e-5, train/loss_step=0.00301, global_step=8958.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  67%|██████▋   | 804/1208 [23:17<11:42,  1.74s/it, loss=0.236, v_num=0, train/loss_simple_step=0.00301, train/loss_vlb_step=1.68e-5, train/loss_step=0.00301, global_step=8958.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  67%|██████▋   | 804/1208 [23:17<11:42,  1.74s/it, loss=0.203, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000493, train/loss_step=0.146, global_step=8958.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  67%|██████▋   | 805/1208 [23:19<11:40,  1.74s/it, loss=0.203, v_num=0, train/loss_simple_step=0.146, train/loss_vlb_step=0.000493, train/loss_step=0.146, global_step=8958.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  67%|██████▋   | 805/1208 [23:19<11:40,  1.74s/it, loss=0.209, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000581, train/loss_step=0.173, global_step=8959.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  67%|██████▋   | 806/1208 [23:20<11:38,  1.74s/it, loss=0.209, v_num=0, train/loss_simple_step=0.173, train/loss_vlb_step=0.000581, train/loss_step=0.173, global_step=8959.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  67%|██████▋   | 806/1208 [23:20<11:38,  1.74s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.32e-5, train/loss_step=0.0201, global_step=8959.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  67%|██████▋   | 807/1208 [23:21<11:36,  1.74s/it, loss=0.206, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=8.32e-5, train/loss_step=0.0201, global_step=8959.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  67%|██████▋   | 807/1208 [23:21<11:36,  1.74s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0826, train/loss_vlb_step=0.000273, train/loss_step=0.0826, global_step=8959.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  67%|██████▋   | 808/1208 [23:24<11:35,  1.74s/it, loss=0.207, v_num=0, train/loss_simple_step=0.0826, train/loss_vlb_step=0.000273, train/loss_step=0.0826, global_step=8959.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  67%|██████▋   | 808/1208 [23:24<11:35,  1.74s/it, loss=0.22, v_num=0, train/loss_simple_step=0.445, train/loss_vlb_step=0.00603, train/loss_step=0.445, global_step=8959.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  67%|██████▋   | 809/1208 [23:25<11:33,  1.74s/it, loss=0.22, v_num=0, train/loss_simple_step=0.445, train/loss_vlb_step=0.00603, train/loss_step=0.445, global_step=8959.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  67%|██████▋   | 809/1208 [23:25<11:33,  1.74s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.18e-5, train/loss_step=0.0137, global_step=8960.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  67%|██████▋   | 810/1208 [23:26<11:31,  1.74s/it, loss=0.182, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.18e-5, train/loss_step=0.0137, global_step=8960.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  67%|██████▋   | 810/1208 [23:26<11:31,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0062, train/loss_vlb_step=3.09e-5, train/loss_step=0.0062, global_step=8960.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  67%|██████▋   | 811/1208 [23:27<11:29,  1.74s/it, loss=0.181, v_num=0, train/loss_simple_step=0.0062, train/loss_vlb_step=3.09e-5, train/loss_step=0.0062, global_step=8960.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  67%|██████▋   | 811/1208 [23:27<11:29,  1.74s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00758, train/loss_vlb_step=3.69e-5, train/loss_step=0.00758, global_step=8960.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  67%|██████▋   | 812/1208 [23:30<11:28,  1.74s/it, loss=0.171, v_num=0, train/loss_simple_step=0.00758, train/loss_vlb_step=3.69e-5, train/loss_step=0.00758, global_step=8960.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  67%|██████▋   | 812/1208 [23:30<11:28,  1.74s/it, loss=0.16, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000101, train/loss_step=0.026, global_step=8960.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  67%|██████▋   | 813/1208 [23:32<11:26,  1.74s/it, loss=0.16, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000101, train/loss_step=0.026, global_step=8960.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  67%|██████▋   | 813/1208 [23:32<11:26,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00445, train/loss_vlb_step=2.34e-5, train/loss_step=0.00445, global_step=8961.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  67%|██████▋   | 814/1208 [23:33<11:23,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00445, train/loss_vlb_step=2.34e-5, train/loss_step=0.00445, global_step=8961.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  67%|██████▋   | 814/1208 [23:33<11:23,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=2.11e-5, train/loss_step=0.00407, global_step=8961.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  67%|██████▋   | 815/1208 [23:34<11:21,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=2.11e-5, train/loss_step=0.00407, global_step=8961.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  67%|██████▋   | 815/1208 [23:34<11:21,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00131, train/loss_step=0.265, global_step=8961.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  68%|██████▊   | 816/1208 [23:37<11:20,  1.74s/it, loss=0.122, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00131, train/loss_step=0.265, global_step=8961.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  68%|██████▊   | 816/1208 [23:37<11:20,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0724, train/loss_vlb_step=0.000244, train/loss_step=0.0724, global_step=8961.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  68%|██████▊   | 817/1208 [23:38<11:18,  1.74s/it, loss=0.117, v_num=0, train/loss_simple_step=0.0724, train/loss_vlb_step=0.000244, train/loss_step=0.0724, global_step=8961.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  68%|██████▊   | 817/1208 [23:38<11:18,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.686, train/loss_vlb_step=0.0394, train/loss_step=0.686, global_step=8962.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  68%|██████▊   | 818/1208 [23:39<11:16,  1.74s/it, loss=0.115, v_num=0, train/loss_simple_step=0.686, train/loss_vlb_step=0.0394, train/loss_step=0.686, global_step=8962.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  68%|██████▊   | 818/1208 [23:39<11:16,  1.74s/it, loss=0.116, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000496, train/loss_step=0.149, global_step=8962.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  68%|██████▊   | 819/1208 [23:40<11:14,  1.73s/it, loss=0.116, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000496, train/loss_step=0.149, global_step=8962.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  68%|██████▊   | 819/1208 [23:40<11:14,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00206, train/loss_step=0.306, global_step=8962.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  68%|██████▊   | 820/1208 [23:44<11:13,  1.74s/it, loss=0.127, v_num=0, train/loss_simple_step=0.306, train/loss_vlb_step=0.00206, train/loss_step=0.306, global_step=8962.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  68%|██████▊   | 820/1208 [23:44<11:13,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000549, train/loss_step=0.161, global_step=8962.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  68%|██████▊   | 821/1208 [23:45<11:11,  1.74s/it, loss=0.134, v_num=0, train/loss_simple_step=0.161, train/loss_vlb_step=0.000549, train/loss_step=0.161, global_step=8962.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  68%|██████▊   | 821/1208 [23:45<11:11,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00786, train/loss_vlb_step=3.71e-5, train/loss_step=0.00786, global_step=8963.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  68%|██████▊   | 822/1208 [23:46<11:09,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00786, train/loss_vlb_step=3.71e-5, train/loss_step=0.00786, global_step=8963.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  68%|██████▊   | 822/1208 [23:46<11:09,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00893, train/loss_vlb_step=4.19e-5, train/loss_step=0.00893, global_step=8963.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  68%|██████▊   | 823/1208 [23:47<11:07,  1.73s/it, loss=0.129, v_num=0, train/loss_simple_step=0.00893, train/loss_vlb_step=4.19e-5, train/loss_step=0.00893, global_step=8963.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  68%|██████▊   | 823/1208 [23:47<11:07,  1.73s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00503, train/loss_vlb_step=2.65e-5, train/loss_step=0.00503, global_step=8963.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  68%|██████▊   | 824/1208 [23:50<11:06,  1.74s/it, loss=0.13, v_num=0, train/loss_simple_step=0.00503, train/loss_vlb_step=2.65e-5, train/loss_step=0.00503, global_step=8963.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  68%|██████▊   | 824/1208 [23:50<11:06,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.82e-5, train/loss_step=0.0132, global_step=8963.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  68%|██████▊   | 825/1208 [23:52<11:04,  1.74s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.82e-5, train/loss_step=0.0132, global_step=8963.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  68%|██████▊   | 825/1208 [23:52<11:04,  1.74s/it, loss=0.128, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00125, train/loss_step=0.283, global_step=8964.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  68%|██████▊   | 826/1208 [23:53<11:02,  1.73s/it, loss=0.128, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00125, train/loss_step=0.283, global_step=8964.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  68%|██████▊   | 826/1208 [23:53<11:02,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0748, train/loss_vlb_step=0.000253, train/loss_step=0.0748, global_step=8964.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  68%|██████▊   | 827/1208 [23:54<11:00,  1.73s/it, loss=0.131, v_num=0, train/loss_simple_step=0.0748, train/loss_vlb_step=0.000253, train/loss_step=0.0748, global_step=8964.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  68%|██████▊   | 827/1208 [23:54<11:00,  1.73s/it, loss=0.149, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00523, train/loss_step=0.442, global_step=8964.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  69%|██████▊   | 828/1208 [23:57<10:59,  1.74s/it, loss=0.149, v_num=0, train/loss_simple_step=0.442, train/loss_vlb_step=0.00523, train/loss_step=0.442, global_step=8964.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  69%|██████▊   | 828/1208 [23:57<10:59,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0451, train/loss_vlb_step=0.000162, train/loss_step=0.0451, global_step=8964.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  69%|██████▊   | 829/1208 [23:58<10:57,  1.74s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0451, train/loss_vlb_step=0.000162, train/loss_step=0.0451, global_step=8964.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  69%|██████▊   | 829/1208 [23:58<10:57,  1.74s/it, loss=0.136, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000543, train/loss_step=0.157, global_step=8965.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  69%|██████▊   | 830/1208 [23:59<10:55,  1.73s/it, loss=0.136, v_num=0, train/loss_simple_step=0.157, train/loss_vlb_step=0.000543, train/loss_step=0.157, global_step=8965.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  69%|██████▊   | 830/1208 [23:59<10:55,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0916, train/loss_vlb_step=0.000302, train/loss_step=0.0916, global_step=8965.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  69%|██████▉   | 831/1208 [24:00<10:53,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0916, train/loss_vlb_step=0.000302, train/loss_step=0.0916, global_step=8965.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  69%|██████▉   | 831/1208 [24:00<10:53,  1.73s/it, loss=0.163, v_num=0, train/loss_simple_step=0.455, train/loss_vlb_step=0.00424, train/loss_step=0.455, global_step=8965.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  69%|██████▉   | 832/1208 [24:04<10:52,  1.74s/it, loss=0.163, v_num=0, train/loss_simple_step=0.455, train/loss_vlb_step=0.00424, train/loss_step=0.455, global_step=8965.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  69%|██████▉   | 832/1208 [24:04<10:52,  1.74s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.85e-5, train/loss_step=0.00324, global_step=8965.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  69%|██████▉   | 833/1208 [24:05<10:50,  1.73s/it, loss=0.162, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.85e-5, train/loss_step=0.00324, global_step=8965.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  69%|██████▉   | 833/1208 [24:05<10:50,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000814, train/loss_step=0.210, global_step=8966.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  69%|██████▉   | 834/1208 [24:06<10:48,  1.73s/it, loss=0.172, v_num=0, train/loss_simple_step=0.210, train/loss_vlb_step=0.000814, train/loss_step=0.210, global_step=8966.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  69%|██████▉   | 834/1208 [24:06<10:48,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0427, train/loss_vlb_step=0.000154, train/loss_step=0.0427, global_step=8966.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  69%|██████▉   | 835/1208 [24:07<10:46,  1.73s/it, loss=0.174, v_num=0, train/loss_simple_step=0.0427, train/loss_vlb_step=0.000154, train/loss_step=0.0427, global_step=8966.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  69%|██████▉   | 835/1208 [24:07<10:46,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000902, train/loss_step=0.242, global_step=8966.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  69%|██████▉   | 836/1208 [24:10<10:45,  1.74s/it, loss=0.173, v_num=0, train/loss_simple_step=0.242, train/loss_vlb_step=0.000902, train/loss_step=0.242, global_step=8966.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  69%|██████▉   | 836/1208 [24:10<10:45,  1.74s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0719, train/loss_vlb_step=0.000248, train/loss_step=0.0719, global_step=8966.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  69%|██████▉   | 837/1208 [24:11<10:43,  1.73s/it, loss=0.173, v_num=0, train/loss_simple_step=0.0719, train/loss_vlb_step=0.000248, train/loss_step=0.0719, global_step=8966.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  69%|██████▉   | 837/1208 [24:11<10:43,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0424, train/loss_vlb_step=0.000148, train/loss_step=0.0424, global_step=8967.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  69%|██████▉   | 838/1208 [24:12<10:41,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.0424, train/loss_vlb_step=0.000148, train/loss_step=0.0424, global_step=8967.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  69%|██████▉   | 838/1208 [24:12<10:41,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0464, train/loss_vlb_step=0.000155, train/loss_step=0.0464, global_step=8967.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  69%|██████▉   | 839/1208 [24:13<10:39,  1.73s/it, loss=0.135, v_num=0, train/loss_simple_step=0.0464, train/loss_vlb_step=0.000155, train/loss_step=0.0464, global_step=8967.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  69%|██████▉   | 839/1208 [24:13<10:39,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.089, train/loss_vlb_step=0.000294, train/loss_step=0.089, global_step=8967.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  70%|██████▉   | 840/1208 [24:16<10:38,  1.73s/it, loss=0.125, v_num=0, train/loss_simple_step=0.089, train/loss_vlb_step=0.000294, train/loss_step=0.089, global_step=8967.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  70%|██████▉   | 840/1208 [24:16<10:38,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0633, train/loss_vlb_step=0.000209, train/loss_step=0.0633, global_step=8967.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  70%|██████▉   | 841/1208 [24:18<10:36,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0633, train/loss_vlb_step=0.000209, train/loss_step=0.0633, global_step=8967.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  70%|██████▉   | 841/1208 [24:18<10:36,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000526, train/loss_step=0.153, global_step=8968.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  70%|██████▉   | 842/1208 [24:19<10:34,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.153, train/loss_vlb_step=0.000526, train/loss_step=0.153, global_step=8968.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  70%|██████▉   | 842/1208 [24:19<10:34,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=1.36e-5, train/loss_step=0.00234, global_step=8968.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  70%|██████▉   | 843/1208 [24:20<10:32,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=1.36e-5, train/loss_step=0.00234, global_step=8968.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  70%|██████▉   | 843/1208 [24:20<10:32,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0039, train/loss_vlb_step=2.09e-5, train/loss_step=0.0039, global_step=8968.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  70%|██████▉   | 844/1208 [24:23<10:31,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0039, train/loss_vlb_step=2.09e-5, train/loss_step=0.0039, global_step=8968.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  70%|██████▉   | 844/1208 [24:23<10:31,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.44e-5, train/loss_step=0.0122, global_step=8968.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  70%|██████▉   | 845/1208 [24:24<10:29,  1.73s/it, loss=0.127, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.44e-5, train/loss_step=0.0122, global_step=8968.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  70%|██████▉   | 845/1208 [24:24<10:29,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=7.91e-5, train/loss_step=0.020, global_step=8969.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  70%|███████   | 846/1208 [24:25<10:27,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=7.91e-5, train/loss_step=0.020, global_step=8969.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  70%|███████   | 846/1208 [24:25<10:27,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=1.3e-5, train/loss_step=0.00229, global_step=8969.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  70%|███████   | 847/1208 [24:26<10:25,  1.73s/it, loss=0.11, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=1.3e-5, train/loss_step=0.00229, global_step=8969.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  70%|███████   | 847/1208 [24:26<10:25,  1.73s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000625, train/loss_step=0.178, global_step=8969.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  70%|███████   | 848/1208 [24:30<10:24,  1.73s/it, loss=0.0966, v_num=0, train/loss_simple_step=0.178, train/loss_vlb_step=0.000625, train/loss_step=0.178, global_step=8969.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  70%|███████   | 848/1208 [24:30<10:24,  1.73s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.96e-5, train/loss_step=0.0188, global_step=8969.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  70%|███████   | 849/1208 [24:31<10:22,  1.73s/it, loss=0.0953, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=7.96e-5, train/loss_step=0.0188, global_step=8969.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  70%|███████   | 849/1208 [24:31<10:22,  1.73s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.0607, train/loss_vlb_step=0.000213, train/loss_step=0.0607, global_step=8970.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  70%|███████   | 850/1208 [24:32<10:20,  1.73s/it, loss=0.0905, v_num=0, train/loss_simple_step=0.0607, train/loss_vlb_step=0.000213, train/loss_step=0.0607, global_step=8970.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  70%|███████   | 850/1208 [24:32<10:20,  1.73s/it, loss=0.091, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000334, train/loss_step=0.101, global_step=8970.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  70%|███████   | 851/1208 [24:33<10:18,  1.73s/it, loss=0.091, v_num=0, train/loss_simple_step=0.101, train/loss_vlb_step=0.000334, train/loss_step=0.101, global_step=8970.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  70%|███████   | 851/1208 [24:33<10:18,  1.73s/it, loss=0.0757, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000507, train/loss_step=0.151, global_step=8970.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  71%|███████   | 852/1208 [24:36<10:16,  1.73s/it, loss=0.0757, v_num=0, train/loss_simple_step=0.151, train/loss_vlb_step=0.000507, train/loss_step=0.151, global_step=8970.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  71%|███████   | 852/1208 [24:36<10:16,  1.73s/it, loss=0.0758, v_num=0, train/loss_simple_step=0.00426, train/loss_vlb_step=2.39e-5, train/loss_step=0.00426, global_step=8970.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  71%|███████   | 853/1208 [24:37<10:14,  1.73s/it, loss=0.0758, v_num=0, train/loss_simple_step=0.00426, train/loss_vlb_step=2.39e-5, train/loss_step=0.00426, global_step=8970.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  71%|███████   | 853/1208 [24:37<10:14,  1.73s/it, loss=0.066, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6e-5, train/loss_step=0.0138, global_step=8971.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]      Epoch 29:  71%|███████   | 854/1208 [24:38<10:12,  1.73s/it, loss=0.066, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=6e-5, train/loss_step=0.0138, global_step=8971.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  71%|███████   | 854/1208 [24:38<10:12,  1.73s/it, loss=0.0723, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000589, train/loss_step=0.169, global_step=8971.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  71%|███████   | 855/1208 [24:39<10:10,  1.73s/it, loss=0.0723, v_num=0, train/loss_simple_step=0.169, train/loss_vlb_step=0.000589, train/loss_step=0.169, global_step=8971.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  71%|███████   | 855/1208 [24:39<10:10,  1.73s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.518, train/loss_vlb_step=0.00673, train/loss_step=0.518, global_step=8971.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  71%|███████   | 856/1208 [24:43<10:09,  1.73s/it, loss=0.0861, v_num=0, train/loss_simple_step=0.518, train/loss_vlb_step=0.00673, train/loss_step=0.518, global_step=8971.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  71%|███████   | 856/1208 [24:43<10:09,  1.73s/it, loss=0.085, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.00018, train/loss_step=0.0514, global_step=8971.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  71%|███████   | 857/1208 [24:44<10:07,  1.73s/it, loss=0.085, v_num=0, train/loss_simple_step=0.0514, train/loss_vlb_step=0.00018, train/loss_step=0.0514, global_step=8971.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  71%|███████   | 857/1208 [24:44<10:07,  1.73s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.0831, train/loss_vlb_step=0.000275, train/loss_step=0.0831, global_step=8972.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  71%|███████   | 858/1208 [24:45<10:05,  1.73s/it, loss=0.0871, v_num=0, train/loss_simple_step=0.0831, train/loss_vlb_step=0.000275, train/loss_step=0.0831, global_step=8972.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  71%|███████   | 858/1208 [24:45<10:05,  1.73s/it, loss=0.085, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=2.41e-5, train/loss_step=0.0046, global_step=8972.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  71%|███████   | 859/1208 [24:46<10:03,  1.73s/it, loss=0.085, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=2.41e-5, train/loss_step=0.0046, global_step=8972.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  71%|███████   | 859/1208 [24:46<10:03,  1.73s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.000164, train/loss_step=0.0471, global_step=8972.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  71%|███████   | 860/1208 [24:49<10:02,  1.73s/it, loss=0.0829, v_num=0, train/loss_simple_step=0.0471, train/loss_vlb_step=0.000164, train/loss_step=0.0471, global_step=8972.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  71%|███████   | 860/1208 [24:49<10:02,  1.73s/it, loss=0.0803, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.44e-5, train/loss_step=0.0121, global_step=8972.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  71%|███████▏  | 861/1208 [24:50<10:00,  1.73s/it, loss=0.0803, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.44e-5, train/loss_step=0.0121, global_step=8972.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  71%|███████▏  | 861/1208 [24:50<10:00,  1.73s/it, loss=0.0746, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.00014, train/loss_step=0.0387, global_step=8973.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  71%|███████▏  | 862/1208 [24:51<09:58,  1.73s/it, loss=0.0746, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.00014, train/loss_step=0.0387, global_step=8973.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  71%|███████▏  | 862/1208 [24:51<09:58,  1.73s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.488, train/loss_vlb_step=0.00923, train/loss_step=0.488, global_step=8973.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  71%|███████▏  | 863/1208 [24:52<09:56,  1.73s/it, loss=0.0989, v_num=0, train/loss_simple_step=0.488, train/loss_vlb_step=0.00923, train/loss_step=0.488, global_step=8973.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  71%|███████▏  | 863/1208 [24:52<09:56,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00167, train/loss_step=0.308, global_step=8973.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  72%|███████▏  | 864/1208 [24:56<09:55,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.308, train/loss_vlb_step=0.00167, train/loss_step=0.308, global_step=8973.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  72%|███████▏  | 864/1208 [24:56<09:55,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00652, train/loss_vlb_step=3.19e-5, train/loss_step=0.00652, global_step=8973.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  72%|███████▏  | 865/1208 [24:57<09:53,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.00652, train/loss_vlb_step=3.19e-5, train/loss_step=0.00652, global_step=8973.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  72%|███████▏  | 865/1208 [24:57<09:53,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.6e-5, train/loss_step=0.00288, global_step=8974.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  72%|███████▏  | 866/1208 [24:58<09:51,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.6e-5, train/loss_step=0.00288, global_step=8974.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  72%|███████▏  | 866/1208 [24:58<09:51,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00496, train/loss_vlb_step=2.76e-5, train/loss_step=0.00496, global_step=8974.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  72%|███████▏  | 867/1208 [24:59<09:49,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00496, train/loss_vlb_step=2.76e-5, train/loss_step=0.00496, global_step=8974.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  72%|███████▏  | 867/1208 [24:59<09:49,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0745, train/loss_vlb_step=0.000253, train/loss_step=0.0745, global_step=8974.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  72%|███████▏  | 868/1208 [25:02<09:48,  1.73s/it, loss=0.108, v_num=0, train/loss_simple_step=0.0745, train/loss_vlb_step=0.000253, train/loss_step=0.0745, global_step=8974.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  72%|███████▏  | 868/1208 [25:02<09:48,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00119, train/loss_step=0.252, global_step=8974.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  72%|███████▏  | 869/1208 [25:03<09:46,  1.73s/it, loss=0.12, v_num=0, train/loss_simple_step=0.252, train/loss_vlb_step=0.00119, train/loss_step=0.252, global_step=8974.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  72%|███████▏  | 869/1208 [25:03<09:46,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00919, train/loss_vlb_step=4.17e-5, train/loss_step=0.00919, global_step=8975.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  72%|███████▏  | 870/1208 [25:04<09:44,  1.73s/it, loss=0.117, v_num=0, train/loss_simple_step=0.00919, train/loss_vlb_step=4.17e-5, train/loss_step=0.00919, global_step=8975.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  72%|███████▏  | 870/1208 [25:04<09:44,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.000107, train/loss_step=0.027, global_step=8975.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  72%|███████▏  | 871/1208 [25:06<09:42,  1.73s/it, loss=0.113, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.000107, train/loss_step=0.027, global_step=8975.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  72%|███████▏  | 871/1208 [25:06<09:42,  1.73s/it, loss=0.107, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.09e-5, train/loss_step=0.020, global_step=8975.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  72%|███████▏  | 872/1208 [25:09<09:41,  1.73s/it, loss=0.107, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=8.09e-5, train/loss_step=0.020, global_step=8975.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  72%|███████▏  | 872/1208 [25:09<09:41,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000523, train/loss_step=0.156, global_step=8975.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  72%|███████▏  | 873/1208 [25:10<09:39,  1.73s/it, loss=0.114, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000523, train/loss_step=0.156, global_step=8975.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  72%|███████▏  | 873/1208 [25:10<09:39,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.495, train/loss_vlb_step=0.00906, train/loss_step=0.495, global_step=8976.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  72%|███████▏  | 874/1208 [25:11<09:37,  1.73s/it, loss=0.138, v_num=0, train/loss_simple_step=0.495, train/loss_vlb_step=0.00906, train/loss_step=0.495, global_step=8976.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  72%|███████▏  | 874/1208 [25:11<09:37,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.622, train/loss_vlb_step=0.0218, train/loss_step=0.622, global_step=8976.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  72%|███████▏  | 875/1208 [25:12<09:35,  1.73s/it, loss=0.161, v_num=0, train/loss_simple_step=0.622, train/loss_vlb_step=0.0218, train/loss_step=0.622, global_step=8976.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  72%|███████▏  | 875/1208 [25:12<09:35,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0701, train/loss_vlb_step=0.000237, train/loss_step=0.0701, global_step=8976.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  73%|███████▎  | 876/1208 [25:15<09:34,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0701, train/loss_vlb_step=0.000237, train/loss_step=0.0701, global_step=8976.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  73%|███████▎  | 876/1208 [25:15<09:34,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0636, train/loss_vlb_step=0.000212, train/loss_step=0.0636, global_step=8976.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  73%|███████▎  | 877/1208 [25:16<09:32,  1.73s/it, loss=0.139, v_num=0, train/loss_simple_step=0.0636, train/loss_vlb_step=0.000212, train/loss_step=0.0636, global_step=8976.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  73%|███████▎  | 877/1208 [25:16<09:32,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.00042, train/loss_step=0.127, global_step=8977.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  73%|███████▎  | 878/1208 [25:17<09:30,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.127, train/loss_vlb_step=0.00042, train/loss_step=0.127, global_step=8977.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  73%|███████▎  | 878/1208 [25:17<09:30,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00126, train/loss_step=0.265, global_step=8977.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  73%|███████▎  | 879/1208 [25:18<09:28,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.265, train/loss_vlb_step=0.00126, train/loss_step=0.265, global_step=8977.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  73%|███████▎  | 879/1208 [25:18<09:28,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00725, train/loss_vlb_step=3.66e-5, train/loss_step=0.00725, global_step=8977.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  73%|███████▎  | 880/1208 [25:22<09:27,  1.73s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00725, train/loss_vlb_step=3.66e-5, train/loss_step=0.00725, global_step=8977.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  73%|███████▎  | 880/1208 [25:22<09:27,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=7.97e-5, train/loss_step=0.0197, global_step=8977.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  73%|███████▎  | 881/1208 [25:23<09:25,  1.73s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=7.97e-5, train/loss_step=0.0197, global_step=8977.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  73%|███████▎  | 881/1208 [25:23<09:25,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00132, train/loss_step=0.290, global_step=8978.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  73%|███████▎  | 882/1208 [25:24<09:23,  1.73s/it, loss=0.165, v_num=0, train/loss_simple_step=0.290, train/loss_vlb_step=0.00132, train/loss_step=0.290, global_step=8978.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  73%|███████▎  | 882/1208 [25:24<09:23,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.62e-5, train/loss_step=0.003, global_step=8978.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  73%|███████▎  | 883/1208 [25:25<09:21,  1.73s/it, loss=0.141, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.62e-5, train/loss_step=0.003, global_step=8978.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  73%|███████▎  | 883/1208 [25:25<09:21,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00808, train/loss_vlb_step=3.74e-5, train/loss_step=0.00808, global_step=8978.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  73%|███████▎  | 884/1208 [25:28<09:20,  1.73s/it, loss=0.126, v_num=0, train/loss_simple_step=0.00808, train/loss_vlb_step=3.74e-5, train/loss_step=0.00808, global_step=8978.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  73%|███████▎  | 884/1208 [25:28<09:20,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.909, train/loss_vlb_step=0.457, train/loss_step=0.909, global_step=8978.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]      Epoch 29:  73%|███████▎  | 885/1208 [25:29<09:18,  1.73s/it, loss=0.171, v_num=0, train/loss_simple_step=0.909, train/loss_vlb_step=0.457, train/loss_step=0.909, global_step=8978.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  73%|███████▎  | 885/1208 [25:29<09:18,  1.73s/it, loss=0.193, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00323, train/loss_step=0.439, global_step=8979.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  73%|███████▎  | 886/1208 [25:30<09:16,  1.73s/it, loss=0.193, v_num=0, train/loss_simple_step=0.439, train/loss_vlb_step=0.00323, train/loss_step=0.439, global_step=8979.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  73%|███████▎  | 886/1208 [25:30<09:16,  1.73s/it, loss=0.212, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00294, train/loss_step=0.391, global_step=8979.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  73%|███████▎  | 887/1208 [25:31<09:14,  1.73s/it, loss=0.212, v_num=0, train/loss_simple_step=0.391, train/loss_vlb_step=0.00294, train/loss_step=0.391, global_step=8979.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  73%|███████▎  | 887/1208 [25:31<09:14,  1.73s/it, loss=0.209, v_num=0, train/loss_simple_step=0.00424, train/loss_vlb_step=2.27e-5, train/loss_step=0.00424, global_step=8979.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  74%|███████▎  | 888/1208 [25:35<09:13,  1.73s/it, loss=0.209, v_num=0, train/loss_simple_step=0.00424, train/loss_vlb_step=2.27e-5, train/loss_step=0.00424, global_step=8979.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  74%|███████▎  | 888/1208 [25:35<09:13,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=7.59e-6, train/loss_step=0.00125, global_step=8979.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  74%|███████▎  | 889/1208 [25:36<09:11,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=7.59e-6, train/loss_step=0.00125, global_step=8979.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  74%|███████▎  | 889/1208 [25:36<09:11,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.62e-5, train/loss_step=0.0101, global_step=8980.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  74%|███████▎  | 890/1208 [25:37<09:09,  1.73s/it, loss=0.196, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.62e-5, train/loss_step=0.0101, global_step=8980.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  74%|███████▎  | 890/1208 [25:37<09:09,  1.73s/it, loss=0.201, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000435, train/loss_step=0.126, global_step=8980.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  74%|███████▍  | 891/1208 [25:38<09:07,  1.73s/it, loss=0.201, v_num=0, train/loss_simple_step=0.126, train/loss_vlb_step=0.000435, train/loss_step=0.126, global_step=8980.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  74%|███████▍  | 891/1208 [25:38<09:07,  1.73s/it, loss=0.211, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.00077, train/loss_step=0.209, global_step=8980.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  74%|███████▍  | 892/1208 [25:41<09:06,  1.73s/it, loss=0.211, v_num=0, train/loss_simple_step=0.209, train/loss_vlb_step=0.00077, train/loss_step=0.209, global_step=8980.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  74%|███████▍  | 892/1208 [25:41<09:06,  1.73s/it, loss=0.206, v_num=0, train/loss_simple_step=0.063, train/loss_vlb_step=0.000216, train/loss_step=0.063, global_step=8980.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  74%|███████▍  | 893/1208 [25:42<09:04,  1.73s/it, loss=0.206, v_num=0, train/loss_simple_step=0.063, train/loss_vlb_step=0.000216, train/loss_step=0.063, global_step=8980.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  74%|███████▍  | 893/1208 [25:42<09:04,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00929, train/loss_vlb_step=4.34e-5, train/loss_step=0.00929, global_step=8981.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  74%|███████▍  | 894/1208 [25:43<09:02,  1.73s/it, loss=0.182, v_num=0, train/loss_simple_step=0.00929, train/loss_vlb_step=4.34e-5, train/loss_step=0.00929, global_step=8981.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  74%|███████▍  | 894/1208 [25:43<09:02,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.00033, train/loss_step=0.100, global_step=8981.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  74%|███████▍  | 895/1208 [25:44<09:00,  1.73s/it, loss=0.156, v_num=0, train/loss_simple_step=0.100, train/loss_vlb_step=0.00033, train/loss_step=0.100, global_step=8981.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  74%|███████▍  | 895/1208 [25:44<09:00,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000425, train/loss_step=0.129, global_step=8981.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  74%|███████▍  | 896/1208 [25:47<08:59,  1.73s/it, loss=0.159, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000425, train/loss_step=0.129, global_step=8981.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  74%|███████▍  | 896/1208 [25:47<08:59,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000317, train/loss_step=0.095, global_step=8981.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  74%|███████▍  | 897/1208 [25:48<08:57,  1.73s/it, loss=0.16, v_num=0, train/loss_simple_step=0.095, train/loss_vlb_step=0.000317, train/loss_step=0.095, global_step=8981.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  74%|███████▍  | 897/1208 [25:48<08:57,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=4.96e-5, train/loss_step=0.0109, global_step=8982.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  74%|███████▍  | 898/1208 [25:50<08:55,  1.73s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=4.96e-5, train/loss_step=0.0109, global_step=8982.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  74%|███████▍  | 898/1208 [25:50<08:55,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00112, train/loss_step=0.253, global_step=8982.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  74%|███████▍  | 899/1208 [25:51<08:53,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.253, train/loss_vlb_step=0.00112, train/loss_step=0.253, global_step=8982.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  74%|███████▍  | 899/1208 [25:51<08:53,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.71e-5, train/loss_step=0.0151, global_step=8982.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  75%|███████▍  | 900/1208 [25:54<08:51,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.71e-5, train/loss_step=0.0151, global_step=8982.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  75%|███████▍  | 900/1208 [25:54<08:51,  1.73s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0042, train/loss_vlb_step=2.29e-5, train/loss_step=0.0042, global_step=8982.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s][A
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+Data shape for DDIM sampling is (1, 4, 64, 128), eta 0.0
+Running DDIM Sampling with 50 timesteps
+DDIM Sampler:   0%|          | 0/50 [00:00<?, ?it/s]
+DDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.75it/s][ADDIM Sampler:   2%|▏         | 1/50 [00:00<00:27,  1.78it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:29,  1.66it/s]DDIM Sampler:   2%|▏         | 1/50 [00:00<00:28,  1.72it/s]
+DDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.78it/s][ADDIM Sampler:   4%|▍         | 2/50 [00:01<00:26,  1.79it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:28,  1.71it/s]DDIM Sampler:   4%|▍         | 2/50 [00:01<00:28,  1.71it/s]
+DDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.79it/s][ADDIM Sampler:   6%|▌         | 3/50 [00:01<00:26,  1.78it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.70it/s]DDIM Sampler:   6%|▌         | 3/50 [00:01<00:27,  1.72it/s]
+DDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.80it/s][ADDIM Sampler:   8%|▊         | 4/50 [00:02<00:25,  1.79it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.72it/s]DDIM Sampler:   8%|▊         | 4/50 [00:02<00:26,  1.72it/s]
+DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.79it/s][ADDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.78it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:25,  1.74it/s]DDIM Sampler:  10%|█         | 5/50 [00:02<00:26,  1.72it/s]
+DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.78it/s][ADDIM Sampler:  12%|█▏        | 6/50 [00:03<00:24,  1.79it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.74it/s]DDIM Sampler:  12%|█▏        | 6/50 [00:03<00:25,  1.73it/s]
+DDIM Sampler:  14%|█▍        | 7/50 [00:03<00:23,  1.79it/s][ADDIM Sampler:  14%|█▍        | 7/50 [00:03<00:24,  1.78it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.75it/s]DDIM Sampler:  14%|█▍        | 7/50 [00:04<00:24,  1.73it/s]
+DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.79it/s][ADDIM Sampler:  16%|█▌        | 8/50 [00:04<00:23,  1.77it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.75it/s]DDIM Sampler:  16%|█▌        | 8/50 [00:04<00:24,  1.72it/s]
+DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:22,  1.79it/s][ADDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.77it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.75it/s]DDIM Sampler:  18%|█▊        | 9/50 [00:05<00:23,  1.72it/s]
+DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.80it/s][ADDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.77it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:22,  1.75it/s]DDIM Sampler:  20%|██        | 10/50 [00:05<00:23,  1.73it/s]
+DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:21,  1.79it/s][ADDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.75it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.76it/s]DDIM Sampler:  22%|██▏       | 11/50 [00:06<00:22,  1.74it/s]
+DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.80it/s][ADDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.77it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.76it/s]DDIM Sampler:  24%|██▍       | 12/50 [00:06<00:21,  1.74it/s]
+DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.78it/s][ADDIM Sampler:  26%|██▌       | 13/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.76it/s]DDIM Sampler:  26%|██▌       | 13/50 [00:07<00:21,  1.74it/s]
+DDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.79it/s][ADDIM Sampler:  28%|██▊       | 14/50 [00:07<00:20,  1.77it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.75it/s]DDIM Sampler:  28%|██▊       | 14/50 [00:08<00:20,  1.75it/s]
+DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.77it/s][ADDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.78it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:19,  1.75it/s]DDIM Sampler:  30%|███       | 15/50 [00:08<00:20,  1.74it/s]
+DDIM Sampler:  32%|███▏      | 16/50 [00:08<00:19,  1.79it/s][ADDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.78it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.76it/s]DDIM Sampler:  32%|███▏      | 16/50 [00:09<00:19,  1.75it/s]
+DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.79it/s][ADDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.78it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.77it/s]DDIM Sampler:  34%|███▍      | 17/50 [00:09<00:18,  1.75it/s]
+DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.79it/s][ADDIM Sampler:  36%|███▌      | 18/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.77it/s]DDIM Sampler:  36%|███▌      | 18/50 [00:10<00:18,  1.75it/s]
+DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s][ADDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.78it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.77it/s]DDIM Sampler:  38%|███▊      | 19/50 [00:10<00:17,  1.75it/s]
+DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s][ADDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  40%|████      | 20/50 [00:11<00:17,  1.75it/s]
+DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.75it/s][ADDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.78it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:11<00:16,  1.77it/s]DDIM Sampler:  42%|████▏     | 21/50 [00:12<00:16,  1.75it/s]
+DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s][ADDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.77it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:15,  1.78it/s]DDIM Sampler:  44%|████▍     | 22/50 [00:12<00:16,  1.75it/s]
+DDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.75it/s][ADDIM Sampler:  46%|████▌     | 23/50 [00:12<00:15,  1.76it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.79it/s]DDIM Sampler:  46%|████▌     | 23/50 [00:13<00:15,  1.75it/s]
+DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.77it/s][ADDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.75it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.78it/s]DDIM Sampler:  48%|████▊     | 24/50 [00:13<00:14,  1.75it/s]
+DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.77it/s][ADDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.75it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:13,  1.79it/s]DDIM Sampler:  50%|█████     | 25/50 [00:14<00:14,  1.74it/s]
+DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.78it/s][ADDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.73it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.78it/s]DDIM Sampler:  52%|█████▏    | 26/50 [00:14<00:13,  1.74it/s]
+DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.78it/s][ADDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.74it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  54%|█████▍    | 27/50 [00:15<00:13,  1.73it/s]
+DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.76it/s][ADDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.75it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:15<00:12,  1.77it/s]DDIM Sampler:  56%|█████▌    | 28/50 [00:16<00:12,  1.74it/s]
+DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:12,  1.74it/s][ADDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:12,  1.75it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:11,  1.76it/s]DDIM Sampler:  58%|█████▊    | 29/50 [00:16<00:12,  1.74it/s]
+DDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.75it/s][ADDIM Sampler:  60%|██████    | 30/50 [00:16<00:11,  1.75it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.77it/s]DDIM Sampler:  60%|██████    | 30/50 [00:17<00:11,  1.74it/s]
+DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.77it/s][ADDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.75it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.76it/s]DDIM Sampler:  62%|██████▏   | 31/50 [00:17<00:10,  1.75it/s]
+DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s][ADDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.77it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.75it/s]DDIM Sampler:  64%|██████▍   | 32/50 [00:18<00:10,  1.76it/s]
+DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.77it/s][ADDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.76it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.75it/s]DDIM Sampler:  66%|██████▌   | 33/50 [00:18<00:09,  1.74it/s]
+DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s][ADDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.77it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.75it/s]DDIM Sampler:  68%|██████▊   | 34/50 [00:19<00:09,  1.75it/s]
+DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.78it/s][ADDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.77it/s]DDIM Sampler:  70%|███████   | 35/50 [00:19<00:08,  1.74it/s]DDIM Sampler:  70%|███████   | 35/50 [00:20<00:08,  1.75it/s]
+DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.79it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:08,  1.75it/s]
+DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.79it/s][ADDIM Sampler:  72%|███████▏  | 36/50 [00:20<00:07,  1.75it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:20<00:07,  1.77it/s]DDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.74it/s]
+DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s][ADDIM Sampler:  74%|███████▍  | 37/50 [00:21<00:07,  1.75it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.78it/s]DDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.75it/s]
+DDIM Sampler:  78%|███████▊  | 39/50 [00:21<00:06,  1.77it/s][ADDIM Sampler:  76%|███████▌  | 38/50 [00:21<00:06,  1.74it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.78it/s]DDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.75it/s]
+DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.78it/s][ADDIM Sampler:  78%|███████▊  | 39/50 [00:22<00:06,  1.74it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]DDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.76it/s]
+DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.79it/s][ADDIM Sampler:  80%|████████  | 40/50 [00:22<00:05,  1.74it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.76it/s]DDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.77it/s]
+DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.79it/s][ADDIM Sampler:  82%|████████▏ | 41/50 [00:23<00:05,  1.73it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]DDIM Sampler:  84%|████████▍ | 42/50 [00:23<00:04,  1.76it/s]
+DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.78it/s][ADDIM Sampler:  84%|████████▍ | 42/50 [00:24<00:04,  1.74it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.77it/s]DDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:03,  1.76it/s]
+DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.77it/s][ADDIM Sampler:  86%|████████▌ | 43/50 [00:24<00:04,  1.72it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:24<00:03,  1.76it/s]DDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.76it/s]
+DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.78it/s][ADDIM Sampler:  88%|████████▊ | 44/50 [00:25<00:03,  1.74it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.76it/s]DDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.75it/s]
+DDIM Sampler:  92%|█████████▏| 46/50 [00:25<00:02,  1.78it/s][ADDIM Sampler:  90%|█████████ | 45/50 [00:25<00:02,  1.74it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.75it/s]DDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.75it/s]
+DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s][ADDIM Sampler:  92%|█████████▏| 46/50 [00:26<00:02,  1.75it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.76it/s]DDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.75it/s]
+DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.77it/s][ADDIM Sampler:  94%|█████████▍| 47/50 [00:26<00:01,  1.74it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.76it/s]DDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.75it/s]
+DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s][ADDIM Sampler:  96%|█████████▌| 48/50 [00:27<00:01,  1.73it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.77it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:27<00:00,  1.76it/s]
+DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s][ADDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.78it/s]DDIM Sampler:  98%|█████████▊| 49/50 [00:28<00:00,  1.74it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.77it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.76it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.74it/s]DDIM Sampler: 100%|██████████| 50/50 [00:28<00:00,  1.74it/s]Epoch 29:  75%|███████▍  | 901/1208 [26:25<09:00,  1.76s/it, loss=0.154, v_num=0, train/loss_simple_step=0.0042, train/loss_vlb_step=2.29e-5, train/loss_step=0.0042, global_step=8982.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  75%|███████▍  | 901/1208 [26:25<09:00,  1.76s/it, loss=0.151, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00101, train/loss_step=0.243, global_step=8983.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  75%|███████▍  | 902/1208 [26:26<08:58,  1.76s/it, loss=0.151, v_num=0, train/loss_simple_step=0.243, train/loss_vlb_step=0.00101, train/loss_step=0.243, global_step=8983.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  75%|███████▍  | 902/1208 [26:26<08:58,  1.76s/it, loss=0.158, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000495, train/loss_step=0.147, global_step=8983.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  75%|███████▍  | 903/1208 [26:27<08:56,  1.76s/it, loss=0.158, v_num=0, train/loss_simple_step=0.147, train/loss_vlb_step=0.000495, train/loss_step=0.147, global_step=8983.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  75%|███████▍  | 903/1208 [26:27<08:56,  1.76s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00623, train/loss_vlb_step=3.01e-5, train/loss_step=0.00623, global_step=8983.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  75%|███████▍  | 904/1208 [26:30<08:54,  1.76s/it, loss=0.158, v_num=0, train/loss_simple_step=0.00623, train/loss_vlb_step=3.01e-5, train/loss_step=0.00623, global_step=8983.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  75%|███████▍  | 904/1208 [26:30<08:54,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=1.96e-5, train/loss_step=0.00363, global_step=8983.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  75%|███████▍  | 905/1208 [26:31<08:52,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=1.96e-5, train/loss_step=0.00363, global_step=8983.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  75%|███████▍  | 905/1208 [26:31<08:52,  1.76s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.0898, train/loss_vlb_step=0.000296, train/loss_step=0.0898, global_step=8984.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  75%|███████▌  | 906/1208 [26:32<08:50,  1.76s/it, loss=0.0956, v_num=0, train/loss_simple_step=0.0898, train/loss_vlb_step=0.000296, train/loss_step=0.0898, global_step=8984.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  75%|███████▌  | 906/1208 [26:32<08:50,  1.76s/it, loss=0.091, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00148, train/loss_step=0.299, global_step=8984.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  75%|███████▌  | 907/1208 [26:34<08:49,  1.76s/it, loss=0.091, v_num=0, train/loss_simple_step=0.299, train/loss_vlb_step=0.00148, train/loss_step=0.299, global_step=8984.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  75%|███████▌  | 907/1208 [26:34<08:49,  1.76s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.0565, train/loss_vlb_step=0.000195, train/loss_step=0.0565, global_step=8984.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  75%|███████▌  | 908/1208 [26:37<08:47,  1.76s/it, loss=0.0936, v_num=0, train/loss_simple_step=0.0565, train/loss_vlb_step=0.000195, train/loss_step=0.0565, global_step=8984.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  75%|███████▌  | 908/1208 [26:37<08:47,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00281, train/loss_step=0.395, global_step=8984.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  75%|███████▌  | 909/1208 [26:38<08:45,  1.76s/it, loss=0.113, v_num=0, train/loss_simple_step=0.395, train/loss_vlb_step=0.00281, train/loss_step=0.395, global_step=8984.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  75%|███████▌  | 909/1208 [26:38<08:45,  1.76s/it, loss=0.121, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000531, train/loss_step=0.156, global_step=8985.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  75%|███████▌  | 910/1208 [26:39<08:43,  1.76s/it, loss=0.121, v_num=0, train/loss_simple_step=0.156, train/loss_vlb_step=0.000531, train/loss_step=0.156, global_step=8985.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  75%|███████▌  | 910/1208 [26:39<08:43,  1.76s/it, loss=0.121, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000447, train/loss_step=0.135, global_step=8985.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  75%|███████▌  | 911/1208 [26:40<08:41,  1.76s/it, loss=0.121, v_num=0, train/loss_simple_step=0.135, train/loss_vlb_step=0.000447, train/loss_step=0.135, global_step=8985.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  75%|███████▌  | 911/1208 [26:40<08:41,  1.76s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.19e-5, train/loss_step=0.00209, global_step=8985.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  75%|███████▌  | 912/1208 [26:43<08:40,  1.76s/it, loss=0.111, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.19e-5, train/loss_step=0.00209, global_step=8985.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  75%|███████▌  | 912/1208 [26:43<08:40,  1.76s/it, loss=0.129, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00427, train/loss_step=0.434, global_step=8985.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  76%|███████▌  | 913/1208 [26:44<08:38,  1.76s/it, loss=0.129, v_num=0, train/loss_simple_step=0.434, train/loss_vlb_step=0.00427, train/loss_step=0.434, global_step=8985.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  76%|███████▌  | 913/1208 [26:44<08:38,  1.76s/it, loss=0.157, v_num=0, train/loss_simple_step=0.555, train/loss_vlb_step=0.0125, train/loss_step=0.555, global_step=8986.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  76%|███████▌  | 914/1208 [26:45<08:36,  1.76s/it, loss=0.157, v_num=0, train/loss_simple_step=0.555, train/loss_vlb_step=0.0125, train/loss_step=0.555, global_step=8986.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  76%|███████▌  | 914/1208 [26:45<08:36,  1.76s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00252, train/loss_vlb_step=1.45e-5, train/loss_step=0.00252, global_step=8986.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  76%|███████▌  | 915/1208 [26:47<08:34,  1.76s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00252, train/loss_vlb_step=1.45e-5, train/loss_step=0.00252, global_step=8986.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  76%|███████▌  | 915/1208 [26:47<08:34,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.96e-5, train/loss_step=0.0164, global_step=8986.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  76%|███████▌  | 916/1208 [26:50<08:33,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.96e-5, train/loss_step=0.0164, global_step=8986.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  76%|███████▌  | 916/1208 [26:50<08:33,  1.76s/it, loss=0.153, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.00097, train/loss_step=0.235, global_step=8986.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  76%|███████▌  | 917/1208 [26:51<08:31,  1.76s/it, loss=0.153, v_num=0, train/loss_simple_step=0.235, train/loss_vlb_step=0.00097, train/loss_step=0.235, global_step=8986.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  76%|███████▌  | 917/1208 [26:51<08:31,  1.76s/it, loss=0.17, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00177, train/loss_step=0.342, global_step=8987.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  76%|███████▌  | 918/1208 [26:52<08:29,  1.76s/it, loss=0.17, v_num=0, train/loss_simple_step=0.342, train/loss_vlb_step=0.00177, train/loss_step=0.342, global_step=8987.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  76%|███████▌  | 918/1208 [26:52<08:29,  1.76s/it, loss=0.172, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.0015, train/loss_step=0.312, global_step=8987.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  76%|███████▌  | 919/1208 [26:53<08:27,  1.76s/it, loss=0.172, v_num=0, train/loss_simple_step=0.312, train/loss_vlb_step=0.0015, train/loss_step=0.312, global_step=8987.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  76%|███████▌  | 919/1208 [26:53<08:27,  1.76s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=2.21e-5, train/loss_step=0.00392, global_step=8987.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  76%|███████▌  | 920/1208 [26:56<08:26,  1.76s/it, loss=0.172, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=2.21e-5, train/loss_step=0.00392, global_step=8987.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  76%|███████▌  | 920/1208 [26:56<08:26,  1.76s/it, loss=0.178, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000401, train/loss_step=0.119, global_step=8987.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  76%|███████▌  | 921/1208 [26:57<08:24,  1.76s/it, loss=0.178, v_num=0, train/loss_simple_step=0.119, train/loss_vlb_step=0.000401, train/loss_step=0.119, global_step=8987.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  76%|███████▌  | 921/1208 [26:57<08:24,  1.76s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0503, train/loss_vlb_step=0.000175, train/loss_step=0.0503, global_step=8988.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  76%|███████▋  | 922/1208 [26:59<08:22,  1.76s/it, loss=0.168, v_num=0, train/loss_simple_step=0.0503, train/loss_vlb_step=0.000175, train/loss_step=0.0503, global_step=8988.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  76%|███████▋  | 922/1208 [26:59<08:22,  1.76s/it, loss=0.167, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000424, train/loss_step=0.129, global_step=8988.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  76%|███████▋  | 923/1208 [27:00<08:20,  1.76s/it, loss=0.167, v_num=0, train/loss_simple_step=0.129, train/loss_vlb_step=0.000424, train/loss_step=0.129, global_step=8988.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  76%|███████▋  | 923/1208 [27:00<08:20,  1.76s/it, loss=0.172, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000341, train/loss_step=0.103, global_step=8988.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  76%|███████▋  | 924/1208 [27:03<08:18,  1.76s/it, loss=0.172, v_num=0, train/loss_simple_step=0.103, train/loss_vlb_step=0.000341, train/loss_step=0.103, global_step=8988.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  76%|███████▋  | 924/1208 [27:03<08:18,  1.76s/it, loss=0.19, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00191, train/loss_step=0.362, global_step=8988.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  77%|███████▋  | 925/1208 [27:04<08:17,  1.76s/it, loss=0.19, v_num=0, train/loss_simple_step=0.362, train/loss_vlb_step=0.00191, train/loss_step=0.362, global_step=8988.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  77%|███████▋  | 925/1208 [27:04<08:17,  1.76s/it, loss=0.222, v_num=0, train/loss_simple_step=0.730, train/loss_vlb_step=0.0195, train/loss_step=0.730, global_step=8989.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  77%|███████▋  | 926/1208 [27:05<08:15,  1.76s/it, loss=0.222, v_num=0, train/loss_simple_step=0.730, train/loss_vlb_step=0.0195, train/loss_step=0.730, global_step=8989.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  77%|███████▋  | 926/1208 [27:05<08:15,  1.76s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0708, train/loss_vlb_step=0.000235, train/loss_step=0.0708, global_step=8989.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  77%|███████▋  | 927/1208 [27:06<08:13,  1.75s/it, loss=0.21, v_num=0, train/loss_simple_step=0.0708, train/loss_vlb_step=0.000235, train/loss_step=0.0708, global_step=8989.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  77%|███████▋  | 927/1208 [27:06<08:13,  1.75s/it, loss=0.222, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00137, train/loss_step=0.283, global_step=8989.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  77%|███████▋  | 928/1208 [27:09<08:11,  1.76s/it, loss=0.222, v_num=0, train/loss_simple_step=0.283, train/loss_vlb_step=0.00137, train/loss_step=0.283, global_step=8989.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  77%|███████▋  | 928/1208 [27:09<08:11,  1.76s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9.18e-5, train/loss_step=0.0224, global_step=8989.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  77%|███████▋  | 929/1208 [27:10<08:09,  1.76s/it, loss=0.203, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=9.18e-5, train/loss_step=0.0224, global_step=8989.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  77%|███████▋  | 929/1208 [27:10<08:09,  1.76s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0603, train/loss_vlb_step=0.000205, train/loss_step=0.0603, global_step=8990.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  77%|███████▋  | 930/1208 [27:12<08:07,  1.75s/it, loss=0.198, v_num=0, train/loss_simple_step=0.0603, train/loss_vlb_step=0.000205, train/loss_step=0.0603, global_step=8990.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  77%|███████▋  | 930/1208 [27:12<08:07,  1.75s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00636, train/loss_vlb_step=3.17e-5, train/loss_step=0.00636, global_step=8990.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  77%|███████▋  | 931/1208 [27:13<08:05,  1.75s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00636, train/loss_vlb_step=3.17e-5, train/loss_step=0.00636, global_step=8990.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  77%|███████▋  | 931/1208 [27:13<08:05,  1.75s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00697, train/loss_vlb_step=3.44e-5, train/loss_step=0.00697, global_step=8990.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  77%|███████▋  | 932/1208 [27:16<08:04,  1.76s/it, loss=0.192, v_num=0, train/loss_simple_step=0.00697, train/loss_vlb_step=3.44e-5, train/loss_step=0.00697, global_step=8990.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  77%|███████▋  | 932/1208 [27:16<08:04,  1.76s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.26e-5, train/loss_step=0.0114, global_step=8990.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  77%|███████▋  | 933/1208 [27:17<08:02,  1.76s/it, loss=0.171, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.26e-5, train/loss_step=0.0114, global_step=8990.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  77%|███████▋  | 933/1208 [27:17<08:02,  1.76s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.44e-5, train/loss_step=0.00475, global_step=8991.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  77%|███████▋  | 934/1208 [27:18<08:00,  1.75s/it, loss=0.144, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.44e-5, train/loss_step=0.00475, global_step=8991.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  77%|███████▋  | 934/1208 [27:18<08:00,  1.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000496, train/loss_step=0.149, global_step=8991.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  77%|███████▋  | 935/1208 [27:19<07:58,  1.75s/it, loss=0.151, v_num=0, train/loss_simple_step=0.149, train/loss_vlb_step=0.000496, train/loss_step=0.149, global_step=8991.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  77%|███████▋  | 935/1208 [27:19<07:58,  1.75s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0898, train/loss_vlb_step=0.000297, train/loss_step=0.0898, global_step=8991.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  77%|███████▋  | 936/1208 [27:22<07:57,  1.76s/it, loss=0.155, v_num=0, train/loss_simple_step=0.0898, train/loss_vlb_step=0.000297, train/loss_step=0.0898, global_step=8991.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  77%|███████▋  | 936/1208 [27:22<07:57,  1.76s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0611, train/loss_vlb_step=0.000208, train/loss_step=0.0611, global_step=8991.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  78%|███████▊  | 937/1208 [27:24<07:55,  1.75s/it, loss=0.146, v_num=0, train/loss_simple_step=0.0611, train/loss_vlb_step=0.000208, train/loss_step=0.0611, global_step=8991.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  78%|███████▊  | 937/1208 [27:24<07:55,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000451, train/loss_step=0.136, global_step=8992.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  78%|███████▊  | 938/1208 [27:25<07:53,  1.75s/it, loss=0.136, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000451, train/loss_step=0.136, global_step=8992.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  78%|███████▊  | 938/1208 [27:25<07:53,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.84e-5, train/loss_step=0.00344, global_step=8992.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  78%|███████▊  | 939/1208 [27:26<07:51,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.84e-5, train/loss_step=0.00344, global_step=8992.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  78%|███████▊  | 939/1208 [27:26<07:51,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0607, train/loss_vlb_step=0.000207, train/loss_step=0.0607, global_step=8992.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  78%|███████▊  | 940/1208 [27:29<07:50,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0607, train/loss_vlb_step=0.000207, train/loss_step=0.0607, global_step=8992.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  78%|███████▊  | 940/1208 [27:29<07:50,  1.75s/it, loss=0.144, v_num=0, train/loss_simple_step=0.532, train/loss_vlb_step=0.0149, train/loss_step=0.532, global_step=8992.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  78%|███████▊  | 941/1208 [27:30<07:48,  1.75s/it, loss=0.144, v_num=0, train/loss_simple_step=0.532, train/loss_vlb_step=0.0149, train/loss_step=0.532, global_step=8992.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  78%|███████▊  | 941/1208 [27:30<07:48,  1.75s/it, loss=0.146, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=8993.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  78%|███████▊  | 942/1208 [27:31<07:46,  1.75s/it, loss=0.146, v_num=0, train/loss_simple_step=0.104, train/loss_vlb_step=0.000341, train/loss_step=0.104, global_step=8993.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  78%|███████▊  | 942/1208 [27:31<07:46,  1.75s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0802, train/loss_vlb_step=0.000266, train/loss_step=0.0802, global_step=8993.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  78%|███████▊  | 943/1208 [27:32<07:44,  1.75s/it, loss=0.144, v_num=0, train/loss_simple_step=0.0802, train/loss_vlb_step=0.000266, train/loss_step=0.0802, global_step=8993.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  78%|███████▊  | 943/1208 [27:32<07:44,  1.75s/it, loss=0.146, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000451, train/loss_step=0.136, global_step=8993.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  78%|███████▊  | 944/1208 [27:36<07:43,  1.75s/it, loss=0.146, v_num=0, train/loss_simple_step=0.136, train/loss_vlb_step=0.000451, train/loss_step=0.136, global_step=8993.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  78%|███████▊  | 944/1208 [27:36<07:43,  1.75s/it, loss=0.158, v_num=0, train/loss_simple_step=0.621, train/loss_vlb_step=0.00989, train/loss_step=0.621, global_step=8993.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  78%|███████▊  | 945/1208 [27:37<07:41,  1.75s/it, loss=0.158, v_num=0, train/loss_simple_step=0.621, train/loss_vlb_step=0.00989, train/loss_step=0.621, global_step=8993.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  78%|███████▊  | 945/1208 [27:37<07:41,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.000212, train/loss_step=0.062, global_step=8994.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  78%|███████▊  | 946/1208 [27:38<07:39,  1.75s/it, loss=0.125, v_num=0, train/loss_simple_step=0.062, train/loss_vlb_step=0.000212, train/loss_step=0.062, global_step=8994.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  78%|███████▊  | 946/1208 [27:38<07:39,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.63e-5, train/loss_step=0.010, global_step=8994.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  78%|███████▊  | 947/1208 [27:39<07:37,  1.75s/it, loss=0.122, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.63e-5, train/loss_step=0.010, global_step=8994.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  78%|███████▊  | 947/1208 [27:39<07:37,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000347, train/loss_step=0.105, global_step=8994.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  78%|███████▊  | 948/1208 [27:42<07:35,  1.75s/it, loss=0.113, v_num=0, train/loss_simple_step=0.105, train/loss_vlb_step=0.000347, train/loss_step=0.105, global_step=8994.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  78%|███████▊  | 948/1208 [27:42<07:35,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000563, train/loss_step=0.163, global_step=8994.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  79%|███████▊  | 949/1208 [27:43<07:34,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.163, train/loss_vlb_step=0.000563, train/loss_step=0.163, global_step=8994.0, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  79%|███████▊  | 949/1208 [27:43<07:34,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0495, train/loss_vlb_step=0.000175, train/loss_step=0.0495, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  79%|███████▊  | 950/1208 [27:44<07:32,  1.75s/it, loss=0.12, v_num=0, train/loss_simple_step=0.0495, train/loss_vlb_step=0.000175, train/loss_step=0.0495, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  79%|███████▊  | 950/1208 [27:44<07:32,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0686, train/loss_vlb_step=0.000232, train/loss_step=0.0686, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  79%|███████▊  | 951/1208 [27:45<07:30,  1.75s/it, loss=0.123, v_num=0, train/loss_simple_step=0.0686, train/loss_vlb_step=0.000232, train/loss_step=0.0686, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  79%|███████▊  | 951/1208 [27:45<07:30,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000126, train/loss_step=0.0339, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  79%|███████▉  | 952/1208 [27:49<07:28,  1.75s/it, loss=0.124, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000126, train/loss_step=0.0339, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  79%|███████▉  | 952/1208 [27:49<07:28,  1.75s/it, loss=0.135, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000813, train/loss_step=0.233, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  79%|███████▉  | 953/1208 [27:50<07:26,  1.75s/it, loss=0.135, v_num=0, train/loss_simple_step=0.233, train/loss_vlb_step=0.000813, train/loss_step=0.233, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  79%|███████▉  | 953/1208 [27:50<07:26,  1.75s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=1.26e-5, train/loss_step=0.00223, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  79%|███████▉  | 954/1208 [27:51<07:24,  1.75s/it, loss=0.135, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=1.26e-5, train/loss_step=0.00223, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  79%|███████▉  | 954/1208 [27:51<07:24,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000133, train/loss_step=0.0346, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139] Epoch 29:  79%|███████▉  | 955/1208 [27:52<07:23,  1.75s/it, loss=0.129, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000133, train/loss_step=0.0346, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  79%|███████▉  | 955/1208 [27:52<07:23,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00135, train/loss_step=0.294, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  79%|███████▉  | 956/1208 [27:55<07:21,  1.75s/it, loss=0.139, v_num=0, train/loss_simple_step=0.294, train/loss_vlb_step=0.00135, train/loss_step=0.294, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  79%|███████▉  | 956/1208 [27:55<07:21,  1.75s/it, loss=0.146, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000646, train/loss_step=0.187, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  79%|███████▉  | 957/1208 [27:56<07:19,  1.75s/it, loss=0.146, v_num=0, train/loss_simple_step=0.187, train/loss_vlb_step=0.000646, train/loss_step=0.187, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  79%|███████▉  | 957/1208 [27:56<07:19,  1.75s/it, loss=0.172, v_num=0, train/loss_simple_step=0.656, train/loss_vlb_step=0.016, train/loss_step=0.656, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  79%|███████▉  | 958/1208 [27:57<07:17,  1.75s/it, loss=0.172, v_num=0, train/loss_simple_step=0.656, train/loss_vlb_step=0.016, train/loss_step=0.656, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  79%|███████▉  | 958/1208 [27:57<07:17,  1.75s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0923, train/loss_vlb_step=0.000312, train/loss_step=0.0923, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  79%|███████▉  | 959/1208 [27:58<07:15,  1.75s/it, loss=0.176, v_num=0, train/loss_simple_step=0.0923, train/loss_vlb_step=0.000312, train/loss_step=0.0923, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  79%|███████▉  | 959/1208 [27:58<07:15,  1.75s/it, loss=0.179, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  79%|███████▉  | 960/1208 [28:01<07:14,  1.75s/it, loss=0.179, v_num=0, train/loss_simple_step=0.116, train/loss_vlb_step=0.000382, train/loss_step=0.116, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  79%|███████▉  | 960/1208 [28:01<07:14,  1.75s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0897, train/loss_vlb_step=0.0003, train/loss_step=0.0897, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  80%|███████▉  | 961/1208 [28:02<07:12,  1.75s/it, loss=0.157, v_num=0, train/loss_simple_step=0.0897, train/loss_vlb_step=0.0003, train/loss_step=0.0897, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  80%|███████▉  | 961/1208 [28:02<07:12,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00283, train/loss_vlb_step=1.57e-5, train/loss_step=0.00283, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  80%|███████▉  | 962/1208 [28:04<07:10,  1.75s/it, loss=0.152, v_num=0, train/loss_simple_step=0.00283, train/loss_vlb_step=1.57e-5, train/loss_step=0.00283, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  80%|███████▉  | 962/1208 [28:04<07:10,  1.75s/it, loss=0.161, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00106, train/loss_step=0.256, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]    Epoch 29:  80%|███████▉  | 963/1208 [28:05<07:08,  1.75s/it, loss=0.161, v_num=0, train/loss_simple_step=0.256, train/loss_vlb_step=0.00106, train/loss_step=0.256, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  80%|███████▉  | 963/1208 [28:05<07:08,  1.75s/it, loss=0.181, v_num=0, train/loss_simple_step=0.545, train/loss_vlb_step=0.011, train/loss_step=0.545, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]  Epoch 29:  80%|███████▉  | 964/1208 [28:08<07:07,  1.75s/it, loss=0.181, v_num=0, train/loss_simple_step=0.545, train/loss_vlb_step=0.011, train/loss_step=0.545, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  80%|███████▉  | 964/1208 [28:08<07:07,  1.75s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0531, train/loss_vlb_step=0.000185, train/loss_step=0.0531, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  80%|███████▉  | 965/1208 [28:09<07:05,  1.75s/it, loss=0.153, v_num=0, train/loss_simple_step=0.0531, train/loss_vlb_step=0.000185, train/loss_step=0.0531, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  80%|███████▉  | 965/1208 [28:09<07:05,  1.75s/it, loss=0.166, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00176, train/loss_step=0.338, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  80%|███████▉  | 966/1208 [28:10<07:03,  1.75s/it, loss=0.166, v_num=0, train/loss_simple_step=0.338, train/loss_vlb_step=0.00176, train/loss_step=0.338, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  80%|███████▉  | 966/1208 [28:10<07:03,  1.75s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00913, train/loss_vlb_step=4.3e-5, train/loss_step=0.00913, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  80%|████████  | 967/1208 [28:11<07:01,  1.75s/it, loss=0.166, v_num=0, train/loss_simple_step=0.00913, train/loss_vlb_step=4.3e-5, train/loss_step=0.00913, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  80%|████████  | 967/1208 [28:11<07:01,  1.75s/it, loss=0.177, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00195, train/loss_step=0.322, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]   Epoch 29:  80%|████████  | 968/1208 [28:14<07:00,  1.75s/it, loss=0.177, v_num=0, train/loss_simple_step=0.322, train/loss_vlb_step=0.00195, train/loss_step=0.322, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]Epoch 29:  80%|████████  | 968/1208 [28:14<07:00,  1.75s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.7e-5, train/loss_step=0.0156, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]
+
+
+Epoch 29:  80%|████████  | 968/1208 [29:31<07:19,  1.83s/it, loss=0.17, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=6.7e-5, train/loss_step=0.0156, global_step=9e+3, train/loss_simple_epoch=0.139, train/loss_vlb_epoch=0.00255, train/loss_epoch=0.139]
+
diff --git a/finetune/tutorial_dataset.py b/finetune/tutorial_dataset.py
new file mode 100644
index 0000000000..72c37d613c
--- /dev/null
+++ b/finetune/tutorial_dataset.py
@@ -0,0 +1,42 @@
+import json
+import cv2
+import os
+import numpy as np
+
+from torch.utils.data import Dataset
+
+# '/home/data2/yangsp22/dataset/CODA-ft/CODA2022-val/ade20k' '/home/data2/yangsp22/dataset/SAM/CODA-2022val'
+input_path = '/home/data2/yangsp22/dataset/SAM-new/CODA-all'
+
+class MyDataset(Dataset):
+    def __init__(self):
+        self.data = []
+        with open(os.path.join(input_path, 'prompt.json'), 'rt') as f:
+            for line in f:
+                self.data.append(json.loads(line))
+
+    def __len__(self):
+        return len(self.data)
+
+    def __getitem__(self, idx):
+        item = self.data[idx]
+
+        source_filename = item['source']
+        target_filename = item['target']
+        prompt = item['prompt']
+
+        source = cv2.imread(os.path.join(input_path, source_filename))
+        target = cv2.imread(os.path.join(input_path, target_filename))
+
+        # Do not forget that OpenCV read images in BGR order.
+        source = cv2.cvtColor(source, cv2.COLOR_BGR2RGB)
+        target = cv2.cvtColor(target, cv2.COLOR_BGR2RGB)
+
+        # Normalize source images to [0, 1].
+        source = source.astype(np.float32) / 255.0
+
+        # Normalize target images to [-1, 1].
+        target = (target.astype(np.float32) / 127.5) - 1.0
+
+        return dict(jpg=target, txt=prompt, hint=source)
+
diff --git a/finetune/tutorial_dataset_test.py b/finetune/tutorial_dataset_test.py
new file mode 100644
index 0000000000..263a0c79f1
--- /dev/null
+++ b/finetune/tutorial_dataset_test.py
@@ -0,0 +1,12 @@
+from tutorial_dataset import MyDataset
+
+dataset = MyDataset()
+print(len(dataset))
+
+item = dataset[9000]
+jpg = item['jpg']
+txt = item['txt']
+hint = item['hint']
+print(txt)
+print(jpg.shape)
+print(hint.shape)
diff --git a/finetune/tutorial_train_sd21.py b/finetune/tutorial_train_sd21.py
new file mode 100644
index 0000000000..6474dc2170
--- /dev/null
+++ b/finetune/tutorial_train_sd21.py
@@ -0,0 +1,48 @@
+from share import *
+
+import pytorch_lightning as pl
+from torch.utils.data import DataLoader
+from tutorial_dataset import MyDataset
+import sys
+sys.path.append("/home/data2/yangsp22/code/ControlNet")
+from cldm.logger import ImageLogger
+from cldm.model import create_model, load_state_dict
+
+# 运行指令参考
+# python tutorial_train_sd21.py
+# CUDA_VISIBLE_DEVICES=3,4,5,6,7 nohup python /home/data2/yangsp22/code/ControlNet/finetune/tutorial_train_sd21.py > /home/data2/yangsp22/code/finetune-output/sam-new/CODA-all/output2.log 2>&1 &
+
+# Configs
+resume_path = '/home/data2/yangsp22/code/ControlNet/models/control_sd21_ini.ckpt'
+batch_size = 1
+accumulate_grad_batches = 4
+logger_freq = 300
+learning_rate = 1e-5
+max_steps = 20000 #训练多少步后停止，-1表示没有限制，一步指的是一次学习batch_size个样本 # 9000steps
+max_epochs = -1 #训练多少轮后停止，-1表示没有限制，一轮指的是每个样本都学习过一次了 # 8epochs
+sd_locked = True
+only_mid_control = False
+weights_save_path = '/home/data2/yangsp22/code/finetune-output/sam-new/CODA-all/weights'
+default_root_dir = '/home/data2/yangsp22/code/finetune-output/sam-new/CODA-all'
+
+
+# First use cpu to load models. Pytorch Lightning will automatically move it to GPUs.
+model = create_model('/home/data2/yangsp22/code/ControlNet/models/cldm_v21.yaml').cpu()
+model.load_state_dict(load_state_dict(resume_path, location='cpu'))
+model.learning_rate = learning_rate
+model.sd_locked = sd_locked
+model.only_mid_control = only_mid_control
+
+
+# Misc
+dataset = MyDataset()
+dataloader = DataLoader(dataset, num_workers=4, pin_memory=True, batch_size=batch_size, shuffle=True)
+logger = ImageLogger(batch_frequency=logger_freq)
+trainer = pl.Trainer(gpus=5, precision=32, callbacks=[logger], accumulate_grad_batches=accumulate_grad_batches,
+                     max_steps=max_steps, max_epochs=max_epochs, 
+                     weights_save_path=weights_save_path, default_root_dir=default_root_dir, strategy="ddp")
+
+
+# Train!
+# if __name__ == '__main__': 
+trainer.fit(model, dataloader)
diff --git a/gradio_annotator.py b/gradio_annotator.py
deleted file mode 100644
index 2b1a29ebbe..0000000000
--- a/gradio_annotator.py
+++ /dev/null
@@ -1,160 +0,0 @@
-import gradio as gr
-
-from annotator.util import resize_image, HWC3
-
-
-model_canny = None
-
-
-def canny(img, res, l, h):
-    img = resize_image(HWC3(img), res)
-    global model_canny
-    if model_canny is None:
-        from annotator.canny import CannyDetector
-        model_canny = CannyDetector()
-    result = model_canny(img, l, h)
-    return [result]
-
-
-model_hed = None
-
-
-def hed(img, res):
-    img = resize_image(HWC3(img), res)
-    global model_hed
-    if model_hed is None:
-        from annotator.hed import HEDdetector
-        model_hed = HEDdetector()
-    result = model_hed(img)
-    return [result]
-
-
-model_mlsd = None
-
-
-def mlsd(img, res, thr_v, thr_d):
-    img = resize_image(HWC3(img), res)
-    global model_mlsd
-    if model_mlsd is None:
-        from annotator.mlsd import MLSDdetector
-        model_mlsd = MLSDdetector()
-    result = model_mlsd(img, thr_v, thr_d)
-    return [result]
-
-
-model_midas = None
-
-
-def midas(img, res, a):
-    img = resize_image(HWC3(img), res)
-    global model_midas
-    if model_midas is None:
-        from annotator.midas import MidasDetector
-        model_midas = MidasDetector()
-    results = model_midas(img, a)
-    return results
-
-
-model_openpose = None
-
-
-def openpose(img, res, has_hand):
-    img = resize_image(HWC3(img), res)
-    global model_openpose
-    if model_openpose is None:
-        from annotator.openpose import OpenposeDetector
-        model_openpose = OpenposeDetector()
-    result, _ = model_openpose(img, has_hand)
-    return [result]
-
-
-model_uniformer = None
-
-
-def uniformer(img, res):
-    img = resize_image(HWC3(img), res)
-    global model_uniformer
-    if model_uniformer is None:
-        from annotator.uniformer import UniformerDetector
-        model_uniformer = UniformerDetector()
-    result = model_uniformer(img)
-    return [result]
-
-
-block = gr.Blocks().queue()
-with block:
-    with gr.Row():
-        gr.Markdown("## Canny Edge")
-    with gr.Row():
-        with gr.Column():
-            input_image = gr.Image(source='upload', type="numpy")
-            low_threshold = gr.Slider(label="low_threshold", minimum=1, maximum=255, value=100, step=1)
-            high_threshold = gr.Slider(label="high_threshold", minimum=1, maximum=255, value=200, step=1)
-            resolution = gr.Slider(label="resolution", minimum=256, maximum=1024, value=512, step=64)
-            run_button = gr.Button(label="Run")
-        with gr.Column():
-            gallery = gr.Gallery(label="Generated images", show_label=False).style(height="auto")
-    run_button.click(fn=canny, inputs=[input_image, resolution, low_threshold, high_threshold], outputs=[gallery])
-
-    with gr.Row():
-        gr.Markdown("## HED Edge")
-    with gr.Row():
-        with gr.Column():
-            input_image = gr.Image(source='upload', type="numpy")
-            resolution = gr.Slider(label="resolution", minimum=256, maximum=1024, value=512, step=64)
-            run_button = gr.Button(label="Run")
-        with gr.Column():
-            gallery = gr.Gallery(label="Generated images", show_label=False).style(height="auto")
-    run_button.click(fn=hed, inputs=[input_image, resolution], outputs=[gallery])
-
-    with gr.Row():
-        gr.Markdown("## MLSD Edge")
-    with gr.Row():
-        with gr.Column():
-            input_image = gr.Image(source='upload', type="numpy")
-            value_threshold = gr.Slider(label="value_threshold", minimum=0.01, maximum=2.0, value=0.1, step=0.01)
-            distance_threshold = gr.Slider(label="distance_threshold", minimum=0.01, maximum=20.0, value=0.1, step=0.01)
-            resolution = gr.Slider(label="resolution", minimum=256, maximum=1024, value=384, step=64)
-            run_button = gr.Button(label="Run")
-        with gr.Column():
-            gallery = gr.Gallery(label="Generated images", show_label=False).style(height="auto")
-    run_button.click(fn=mlsd, inputs=[input_image, resolution, value_threshold, distance_threshold], outputs=[gallery])
-
-    with gr.Row():
-        gr.Markdown("## MIDAS Depth and Normal")
-    with gr.Row():
-        with gr.Column():
-            input_image = gr.Image(source='upload', type="numpy")
-            alpha = gr.Slider(label="alpha", minimum=0.1, maximum=20.0, value=6.2, step=0.01)
-            resolution = gr.Slider(label="resolution", minimum=256, maximum=1024, value=384, step=64)
-            run_button = gr.Button(label="Run")
-        with gr.Column():
-            gallery = gr.Gallery(label="Generated images", show_label=False).style(height="auto")
-    run_button.click(fn=midas, inputs=[input_image, resolution, alpha], outputs=[gallery])
-
-    with gr.Row():
-        gr.Markdown("## Openpose")
-    with gr.Row():
-        with gr.Column():
-            input_image = gr.Image(source='upload', type="numpy")
-            hand = gr.Checkbox(label='detect hand', value=False)
-            resolution = gr.Slider(label="resolution", minimum=256, maximum=1024, value=512, step=64)
-            run_button = gr.Button(label="Run")
-        with gr.Column():
-            gallery = gr.Gallery(label="Generated images", show_label=False).style(height="auto")
-    run_button.click(fn=openpose, inputs=[input_image, resolution, hand], outputs=[gallery])
-
-
-    with gr.Row():
-        gr.Markdown("## Uniformer Segmentation")
-    with gr.Row():
-        with gr.Column():
-            input_image = gr.Image(source='upload', type="numpy")
-            resolution = gr.Slider(label="resolution", minimum=256, maximum=1024, value=512, step=64)
-            run_button = gr.Button(label="Run")
-        with gr.Column():
-            gallery = gr.Gallery(label="Generated images", show_label=False).style(height="auto")
-    run_button.click(fn=uniformer, inputs=[input_image, resolution], outputs=[gallery])
-
-
-block.launch(server_name='0.0.0.0')
diff --git a/gradio_canny2image.py b/gradio_canny2image.py
deleted file mode 100644
index 9866cac5b3..0000000000
--- a/gradio_canny2image.py
+++ /dev/null
@@ -1,97 +0,0 @@
-from share import *
-import config
-
-import cv2
-import einops
-import gradio as gr
-import numpy as np
-import torch
-import random
-
-from pytorch_lightning import seed_everything
-from annotator.util import resize_image, HWC3
-from annotator.canny import CannyDetector
-from cldm.model import create_model, load_state_dict
-from cldm.ddim_hacked import DDIMSampler
-
-
-apply_canny = CannyDetector()
-
-model = create_model('./models/cldm_v15.yaml').cpu()
-model.load_state_dict(load_state_dict('./models/control_sd15_canny.pth', location='cuda'))
-model = model.cuda()
-ddim_sampler = DDIMSampler(model)
-
-
-def process(input_image, prompt, a_prompt, n_prompt, num_samples, image_resolution, ddim_steps, guess_mode, strength, scale, seed, eta, low_threshold, high_threshold):
-    with torch.no_grad():
-        img = resize_image(HWC3(input_image), image_resolution)
-        H, W, C = img.shape
-
-        detected_map = apply_canny(img, low_threshold, high_threshold)
-        detected_map = HWC3(detected_map)
-
-        control = torch.from_numpy(detected_map.copy()).float().cuda() / 255.0
-        control = torch.stack([control for _ in range(num_samples)], dim=0)
-        control = einops.rearrange(control, 'b h w c -> b c h w').clone()
-
-        if seed == -1:
-            seed = random.randint(0, 65535)
-        seed_everything(seed)
-
-        if config.save_memory:
-            model.low_vram_shift(is_diffusing=False)
-
-        cond = {"c_concat": [control], "c_crossattn": [model.get_learned_conditioning([prompt + ', ' + a_prompt] * num_samples)]}
-        un_cond = {"c_concat": None if guess_mode else [control], "c_crossattn": [model.get_learned_conditioning([n_prompt] * num_samples)]}
-        shape = (4, H // 8, W // 8)
-
-        if config.save_memory:
-            model.low_vram_shift(is_diffusing=True)
-
-        model.control_scales = [strength * (0.825 ** float(12 - i)) for i in range(13)] if guess_mode else ([strength] * 13)  # Magic number. IDK why. Perhaps because 0.825**12<0.01 but 0.826**12>0.01
-        samples, intermediates = ddim_sampler.sample(ddim_steps, num_samples,
-                                                     shape, cond, verbose=False, eta=eta,
-                                                     unconditional_guidance_scale=scale,
-                                                     unconditional_conditioning=un_cond)
-
-        if config.save_memory:
-            model.low_vram_shift(is_diffusing=False)
-
-        x_samples = model.decode_first_stage(samples)
-        x_samples = (einops.rearrange(x_samples, 'b c h w -> b h w c') * 127.5 + 127.5).cpu().numpy().clip(0, 255).astype(np.uint8)
-
-        results = [x_samples[i] for i in range(num_samples)]
-    return [255 - detected_map] + results
-
-
-block = gr.Blocks().queue()
-with block:
-    with gr.Row():
-        gr.Markdown("## Control Stable Diffusion with Canny Edge Maps")
-    with gr.Row():
-        with gr.Column():
-            input_image = gr.Image(source='upload', type="numpy")
-            prompt = gr.Textbox(label="Prompt")
-            run_button = gr.Button(label="Run")
-            with gr.Accordion("Advanced options", open=False):
-                num_samples = gr.Slider(label="Images", minimum=1, maximum=12, value=1, step=1)
-                image_resolution = gr.Slider(label="Image Resolution", minimum=256, maximum=768, value=512, step=64)
-                strength = gr.Slider(label="Control Strength", minimum=0.0, maximum=2.0, value=1.0, step=0.01)
-                guess_mode = gr.Checkbox(label='Guess Mode', value=False)
-                low_threshold = gr.Slider(label="Canny low threshold", minimum=1, maximum=255, value=100, step=1)
-                high_threshold = gr.Slider(label="Canny high threshold", minimum=1, maximum=255, value=200, step=1)
-                ddim_steps = gr.Slider(label="Steps", minimum=1, maximum=100, value=20, step=1)
-                scale = gr.Slider(label="Guidance Scale", minimum=0.1, maximum=30.0, value=9.0, step=0.1)
-                seed = gr.Slider(label="Seed", minimum=-1, maximum=2147483647, step=1, randomize=True)
-                eta = gr.Number(label="eta (DDIM)", value=0.0)
-                a_prompt = gr.Textbox(label="Added Prompt", value='best quality, extremely detailed')
-                n_prompt = gr.Textbox(label="Negative Prompt",
-                                      value='longbody, lowres, bad anatomy, bad hands, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality')
-        with gr.Column():
-            result_gallery = gr.Gallery(label='Output', show_label=False, elem_id="gallery").style(grid=2, height='auto')
-    ips = [input_image, prompt, a_prompt, n_prompt, num_samples, image_resolution, ddim_steps, guess_mode, strength, scale, seed, eta, low_threshold, high_threshold]
-    run_button.click(fn=process, inputs=ips, outputs=[result_gallery])
-
-
-block.launch(server_name='0.0.0.0')
diff --git a/gradio_depth2image.py b/gradio_depth2image.py
deleted file mode 100644
index ee678999ae..0000000000
--- a/gradio_depth2image.py
+++ /dev/null
@@ -1,98 +0,0 @@
-from share import *
-import config
-
-import cv2
-import einops
-import gradio as gr
-import numpy as np
-import torch
-import random
-
-from pytorch_lightning import seed_everything
-from annotator.util import resize_image, HWC3
-from annotator.midas import MidasDetector
-from cldm.model import create_model, load_state_dict
-from cldm.ddim_hacked import DDIMSampler
-
-
-apply_midas = MidasDetector()
-
-model = create_model('./models/cldm_v15.yaml').cpu()
-model.load_state_dict(load_state_dict('./models/control_sd15_depth.pth', location='cuda'))
-model = model.cuda()
-ddim_sampler = DDIMSampler(model)
-
-
-def process(input_image, prompt, a_prompt, n_prompt, num_samples, image_resolution, detect_resolution, ddim_steps, guess_mode, strength, scale, seed, eta):
-    with torch.no_grad():
-        input_image = HWC3(input_image)
-        detected_map, _ = apply_midas(resize_image(input_image, detect_resolution))
-        detected_map = HWC3(detected_map)
-        img = resize_image(input_image, image_resolution)
-        H, W, C = img.shape
-
-        detected_map = cv2.resize(detected_map, (W, H), interpolation=cv2.INTER_LINEAR)
-
-        control = torch.from_numpy(detected_map.copy()).float().cuda() / 255.0
-        control = torch.stack([control for _ in range(num_samples)], dim=0)
-        control = einops.rearrange(control, 'b h w c -> b c h w').clone()
-
-        if seed == -1:
-            seed = random.randint(0, 65535)
-        seed_everything(seed)
-
-        if config.save_memory:
-            model.low_vram_shift(is_diffusing=False)
-
-        cond = {"c_concat": [control], "c_crossattn": [model.get_learned_conditioning([prompt + ', ' + a_prompt] * num_samples)]}
-        un_cond = {"c_concat": None if guess_mode else [control], "c_crossattn": [model.get_learned_conditioning([n_prompt] * num_samples)]}
-        shape = (4, H // 8, W // 8)
-
-        if config.save_memory:
-            model.low_vram_shift(is_diffusing=True)
-
-        model.control_scales = [strength * (0.825 ** float(12 - i)) for i in range(13)] if guess_mode else ([strength] * 13)  # Magic number. IDK why. Perhaps because 0.825**12<0.01 but 0.826**12>0.01
-        samples, intermediates = ddim_sampler.sample(ddim_steps, num_samples,
-                                                     shape, cond, verbose=False, eta=eta,
-                                                     unconditional_guidance_scale=scale,
-                                                     unconditional_conditioning=un_cond)
-
-        if config.save_memory:
-            model.low_vram_shift(is_diffusing=False)
-
-        x_samples = model.decode_first_stage(samples)
-        x_samples = (einops.rearrange(x_samples, 'b c h w -> b h w c') * 127.5 + 127.5).cpu().numpy().clip(0, 255).astype(np.uint8)
-
-        results = [x_samples[i] for i in range(num_samples)]
-    return [detected_map] + results
-
-
-block = gr.Blocks().queue()
-with block:
-    with gr.Row():
-        gr.Markdown("## Control Stable Diffusion with Depth Maps")
-    with gr.Row():
-        with gr.Column():
-            input_image = gr.Image(source='upload', type="numpy")
-            prompt = gr.Textbox(label="Prompt")
-            run_button = gr.Button(label="Run")
-            with gr.Accordion("Advanced options", open=False):
-                num_samples = gr.Slider(label="Images", minimum=1, maximum=12, value=1, step=1)
-                image_resolution = gr.Slider(label="Image Resolution", minimum=256, maximum=768, value=512, step=64)
-                strength = gr.Slider(label="Control Strength", minimum=0.0, maximum=2.0, value=1.0, step=0.01)
-                guess_mode = gr.Checkbox(label='Guess Mode', value=False)
-                detect_resolution = gr.Slider(label="Depth Resolution", minimum=128, maximum=1024, value=384, step=1)
-                ddim_steps = gr.Slider(label="Steps", minimum=1, maximum=100, value=20, step=1)
-                scale = gr.Slider(label="Guidance Scale", minimum=0.1, maximum=30.0, value=9.0, step=0.1)
-                seed = gr.Slider(label="Seed", minimum=-1, maximum=2147483647, step=1, randomize=True)
-                eta = gr.Number(label="eta (DDIM)", value=0.0)
-                a_prompt = gr.Textbox(label="Added Prompt", value='best quality, extremely detailed')
-                n_prompt = gr.Textbox(label="Negative Prompt",
-                                      value='longbody, lowres, bad anatomy, bad hands, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality')
-        with gr.Column():
-            result_gallery = gr.Gallery(label='Output', show_label=False, elem_id="gallery").style(grid=2, height='auto')
-    ips = [input_image, prompt, a_prompt, n_prompt, num_samples, image_resolution, detect_resolution, ddim_steps, guess_mode, strength, scale, seed, eta]
-    run_button.click(fn=process, inputs=ips, outputs=[result_gallery])
-
-
-block.launch(server_name='0.0.0.0')
diff --git a/gradio_fake_scribble2image.py b/gradio_fake_scribble2image.py
deleted file mode 100644
index a7cd375f75..0000000000
--- a/gradio_fake_scribble2image.py
+++ /dev/null
@@ -1,102 +0,0 @@
-from share import *
-import config
-
-import cv2
-import einops
-import gradio as gr
-import numpy as np
-import torch
-import random
-
-from pytorch_lightning import seed_everything
-from annotator.util import resize_image, HWC3
-from annotator.hed import HEDdetector, nms
-from cldm.model import create_model, load_state_dict
-from cldm.ddim_hacked import DDIMSampler
-
-
-apply_hed = HEDdetector()
-
-model = create_model('./models/cldm_v15.yaml').cpu()
-model.load_state_dict(load_state_dict('./models/control_sd15_scribble.pth', location='cuda'))
-model = model.cuda()
-ddim_sampler = DDIMSampler(model)
-
-
-def process(input_image, prompt, a_prompt, n_prompt, num_samples, image_resolution, detect_resolution, ddim_steps, guess_mode, strength, scale, seed, eta):
-    with torch.no_grad():
-        input_image = HWC3(input_image)
-        detected_map = apply_hed(resize_image(input_image, detect_resolution))
-        detected_map = HWC3(detected_map)
-        img = resize_image(input_image, image_resolution)
-        H, W, C = img.shape
-
-        detected_map = cv2.resize(detected_map, (W, H), interpolation=cv2.INTER_LINEAR)
-        detected_map = nms(detected_map, 127, 3.0)
-        detected_map = cv2.GaussianBlur(detected_map, (0, 0), 3.0)
-        detected_map[detected_map > 4] = 255
-        detected_map[detected_map < 255] = 0
-
-        control = torch.from_numpy(detected_map.copy()).float().cuda() / 255.0
-        control = torch.stack([control for _ in range(num_samples)], dim=0)
-        control = einops.rearrange(control, 'b h w c -> b c h w').clone()
-
-        if seed == -1:
-            seed = random.randint(0, 65535)
-        seed_everything(seed)
-
-        if config.save_memory:
-            model.low_vram_shift(is_diffusing=False)
-
-        cond = {"c_concat": [control], "c_crossattn": [model.get_learned_conditioning([prompt + ', ' + a_prompt] * num_samples)]}
-        un_cond = {"c_concat": None if guess_mode else [control], "c_crossattn": [model.get_learned_conditioning([n_prompt] * num_samples)]}
-        shape = (4, H // 8, W // 8)
-
-        if config.save_memory:
-            model.low_vram_shift(is_diffusing=True)
-
-        model.control_scales = [strength * (0.825 ** float(12 - i)) for i in range(13)] if guess_mode else ([strength] * 13)  # Magic number. IDK why. Perhaps because 0.825**12<0.01 but 0.826**12>0.01
-        samples, intermediates = ddim_sampler.sample(ddim_steps, num_samples,
-                                                     shape, cond, verbose=False, eta=eta,
-                                                     unconditional_guidance_scale=scale,
-                                                     unconditional_conditioning=un_cond)
-
-        if config.save_memory:
-            model.low_vram_shift(is_diffusing=False)
-
-        x_samples = model.decode_first_stage(samples)
-        x_samples = (einops.rearrange(x_samples, 'b c h w -> b h w c') * 127.5 + 127.5).cpu().numpy().clip(0, 255).astype(np.uint8)
-
-        results = [x_samples[i] for i in range(num_samples)]
-    return [255 - detected_map] + results
-
-
-block = gr.Blocks().queue()
-with block:
-    with gr.Row():
-        gr.Markdown("## Control Stable Diffusion with Fake Scribble Maps")
-    with gr.Row():
-        with gr.Column():
-            input_image = gr.Image(source='upload', type="numpy")
-            prompt = gr.Textbox(label="Prompt")
-            run_button = gr.Button(label="Run")
-            with gr.Accordion("Advanced options", open=False):
-                num_samples = gr.Slider(label="Images", minimum=1, maximum=12, value=1, step=1)
-                image_resolution = gr.Slider(label="Image Resolution", minimum=256, maximum=768, value=512, step=64)
-                strength = gr.Slider(label="Control Strength", minimum=0.0, maximum=2.0, value=1.0, step=0.01)
-                guess_mode = gr.Checkbox(label='Guess Mode', value=False)
-                detect_resolution = gr.Slider(label="HED Resolution", minimum=128, maximum=1024, value=512, step=1)
-                ddim_steps = gr.Slider(label="Steps", minimum=1, maximum=100, value=20, step=1)
-                scale = gr.Slider(label="Guidance Scale", minimum=0.1, maximum=30.0, value=9.0, step=0.1)
-                seed = gr.Slider(label="Seed", minimum=-1, maximum=2147483647, step=1, randomize=True)
-                eta = gr.Number(label="eta (DDIM)", value=0.0)
-                a_prompt = gr.Textbox(label="Added Prompt", value='best quality, extremely detailed')
-                n_prompt = gr.Textbox(label="Negative Prompt",
-                                      value='longbody, lowres, bad anatomy, bad hands, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality')
-        with gr.Column():
-            result_gallery = gr.Gallery(label='Output', show_label=False, elem_id="gallery").style(grid=2, height='auto')
-    ips = [input_image, prompt, a_prompt, n_prompt, num_samples, image_resolution, detect_resolution, ddim_steps, guess_mode, strength, scale, seed, eta]
-    run_button.click(fn=process, inputs=ips, outputs=[result_gallery])
-
-
-block.launch(server_name='0.0.0.0')
diff --git a/gradio_hed2image.py b/gradio_hed2image.py
deleted file mode 100644
index 1ceff67969..0000000000
--- a/gradio_hed2image.py
+++ /dev/null
@@ -1,98 +0,0 @@
-from share import *
-import config
-
-import cv2
-import einops
-import gradio as gr
-import numpy as np
-import torch
-import random
-
-from pytorch_lightning import seed_everything
-from annotator.util import resize_image, HWC3
-from annotator.hed import HEDdetector
-from cldm.model import create_model, load_state_dict
-from cldm.ddim_hacked import DDIMSampler
-
-
-apply_hed = HEDdetector()
-
-model = create_model('./models/cldm_v15.yaml').cpu()
-model.load_state_dict(load_state_dict('./models/control_sd15_hed.pth', location='cuda'))
-model = model.cuda()
-ddim_sampler = DDIMSampler(model)
-
-
-def process(input_image, prompt, a_prompt, n_prompt, num_samples, image_resolution, detect_resolution, ddim_steps, guess_mode, strength, scale, seed, eta):
-    with torch.no_grad():
-        input_image = HWC3(input_image)
-        detected_map = apply_hed(resize_image(input_image, detect_resolution))
-        detected_map = HWC3(detected_map)
-        img = resize_image(input_image, image_resolution)
-        H, W, C = img.shape
-
-        detected_map = cv2.resize(detected_map, (W, H), interpolation=cv2.INTER_LINEAR)
-
-        control = torch.from_numpy(detected_map.copy()).float().cuda() / 255.0
-        control = torch.stack([control for _ in range(num_samples)], dim=0)
-        control = einops.rearrange(control, 'b h w c -> b c h w').clone()
-
-        if seed == -1:
-            seed = random.randint(0, 65535)
-        seed_everything(seed)
-
-        if config.save_memory:
-            model.low_vram_shift(is_diffusing=False)
-
-        cond = {"c_concat": [control], "c_crossattn": [model.get_learned_conditioning([prompt + ', ' + a_prompt] * num_samples)]}
-        un_cond = {"c_concat": None if guess_mode else [control], "c_crossattn": [model.get_learned_conditioning([n_prompt] * num_samples)]}
-        shape = (4, H // 8, W // 8)
-
-        if config.save_memory:
-            model.low_vram_shift(is_diffusing=True)
-
-        model.control_scales = [strength * (0.825 ** float(12 - i)) for i in range(13)] if guess_mode else ([strength] * 13)  # Magic number. IDK why. Perhaps because 0.825**12<0.01 but 0.826**12>0.01
-        samples, intermediates = ddim_sampler.sample(ddim_steps, num_samples,
-                                                     shape, cond, verbose=False, eta=eta,
-                                                     unconditional_guidance_scale=scale,
-                                                     unconditional_conditioning=un_cond)
-
-        if config.save_memory:
-            model.low_vram_shift(is_diffusing=False)
-
-        x_samples = model.decode_first_stage(samples)
-        x_samples = (einops.rearrange(x_samples, 'b c h w -> b h w c') * 127.5 + 127.5).cpu().numpy().clip(0, 255).astype(np.uint8)
-
-        results = [x_samples[i] for i in range(num_samples)]
-    return [detected_map] + results
-
-
-block = gr.Blocks().queue()
-with block:
-    with gr.Row():
-        gr.Markdown("## Control Stable Diffusion with HED Maps")
-    with gr.Row():
-        with gr.Column():
-            input_image = gr.Image(source='upload', type="numpy")
-            prompt = gr.Textbox(label="Prompt")
-            run_button = gr.Button(label="Run")
-            with gr.Accordion("Advanced options", open=False):
-                num_samples = gr.Slider(label="Images", minimum=1, maximum=12, value=1, step=1)
-                image_resolution = gr.Slider(label="Image Resolution", minimum=256, maximum=768, value=512, step=64)
-                strength = gr.Slider(label="Control Strength", minimum=0.0, maximum=2.0, value=1.0, step=0.01)
-                guess_mode = gr.Checkbox(label='Guess Mode', value=False)
-                detect_resolution = gr.Slider(label="HED Resolution", minimum=128, maximum=1024, value=512, step=1)
-                ddim_steps = gr.Slider(label="Steps", minimum=1, maximum=100, value=20, step=1)
-                scale = gr.Slider(label="Guidance Scale", minimum=0.1, maximum=30.0, value=9.0, step=0.1)
-                seed = gr.Slider(label="Seed", minimum=-1, maximum=2147483647, step=1, randomize=True)
-                eta = gr.Number(label="eta (DDIM)", value=0.0)
-                a_prompt = gr.Textbox(label="Added Prompt", value='best quality, extremely detailed')
-                n_prompt = gr.Textbox(label="Negative Prompt",
-                                      value='longbody, lowres, bad anatomy, bad hands, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality')
-        with gr.Column():
-            result_gallery = gr.Gallery(label='Output', show_label=False, elem_id="gallery").style(grid=2, height='auto')
-    ips = [input_image, prompt, a_prompt, n_prompt, num_samples, image_resolution, detect_resolution, ddim_steps, guess_mode, strength, scale, seed, eta]
-    run_button.click(fn=process, inputs=ips, outputs=[result_gallery])
-
-
-block.launch(server_name='0.0.0.0')
diff --git a/gradio_hough2image.py b/gradio_hough2image.py
deleted file mode 100644
index 6095eeb676..0000000000
--- a/gradio_hough2image.py
+++ /dev/null
@@ -1,100 +0,0 @@
-from share import *
-import config
-
-import cv2
-import einops
-import gradio as gr
-import numpy as np
-import torch
-import random
-
-from pytorch_lightning import seed_everything
-from annotator.util import resize_image, HWC3
-from annotator.mlsd import MLSDdetector
-from cldm.model import create_model, load_state_dict
-from cldm.ddim_hacked import DDIMSampler
-
-
-apply_mlsd = MLSDdetector()
-
-model = create_model('./models/cldm_v15.yaml').cpu()
-model.load_state_dict(load_state_dict('./models/control_sd15_mlsd.pth', location='cuda'))
-model = model.cuda()
-ddim_sampler = DDIMSampler(model)
-
-
-def process(input_image, prompt, a_prompt, n_prompt, num_samples, image_resolution, detect_resolution, ddim_steps, guess_mode, strength, scale, seed, eta, value_threshold, distance_threshold):
-    with torch.no_grad():
-        input_image = HWC3(input_image)
-        detected_map = apply_mlsd(resize_image(input_image, detect_resolution), value_threshold, distance_threshold)
-        detected_map = HWC3(detected_map)
-        img = resize_image(input_image, image_resolution)
-        H, W, C = img.shape
-
-        detected_map = cv2.resize(detected_map, (W, H), interpolation=cv2.INTER_NEAREST)
-
-        control = torch.from_numpy(detected_map.copy()).float().cuda() / 255.0
-        control = torch.stack([control for _ in range(num_samples)], dim=0)
-        control = einops.rearrange(control, 'b h w c -> b c h w').clone()
-
-        if seed == -1:
-            seed = random.randint(0, 65535)
-        seed_everything(seed)
-
-        if config.save_memory:
-            model.low_vram_shift(is_diffusing=False)
-
-        cond = {"c_concat": [control], "c_crossattn": [model.get_learned_conditioning([prompt + ', ' + a_prompt] * num_samples)]}
-        un_cond = {"c_concat": None if guess_mode else [control], "c_crossattn": [model.get_learned_conditioning([n_prompt] * num_samples)]}
-        shape = (4, H // 8, W // 8)
-
-        if config.save_memory:
-            model.low_vram_shift(is_diffusing=True)
-
-        model.control_scales = [strength * (0.825 ** float(12 - i)) for i in range(13)] if guess_mode else ([strength] * 13)  # Magic number. IDK why. Perhaps because 0.825**12<0.01 but 0.826**12>0.01
-        samples, intermediates = ddim_sampler.sample(ddim_steps, num_samples,
-                                                     shape, cond, verbose=False, eta=eta,
-                                                     unconditional_guidance_scale=scale,
-                                                     unconditional_conditioning=un_cond)
-
-        if config.save_memory:
-            model.low_vram_shift(is_diffusing=False)
-
-        x_samples = model.decode_first_stage(samples)
-        x_samples = (einops.rearrange(x_samples, 'b c h w -> b h w c') * 127.5 + 127.5).cpu().numpy().clip(0, 255).astype(np.uint8)
-
-        results = [x_samples[i] for i in range(num_samples)]
-    return [255 - cv2.dilate(detected_map, np.ones(shape=(3, 3), dtype=np.uint8), iterations=1)] + results
-
-
-block = gr.Blocks().queue()
-with block:
-    with gr.Row():
-        gr.Markdown("## Control Stable Diffusion with Hough Line Maps")
-    with gr.Row():
-        with gr.Column():
-            input_image = gr.Image(source='upload', type="numpy")
-            prompt = gr.Textbox(label="Prompt")
-            run_button = gr.Button(label="Run")
-            with gr.Accordion("Advanced options", open=False):
-                num_samples = gr.Slider(label="Images", minimum=1, maximum=12, value=1, step=1)
-                image_resolution = gr.Slider(label="Image Resolution", minimum=256, maximum=768, value=512, step=64)
-                strength = gr.Slider(label="Control Strength", minimum=0.0, maximum=2.0, value=1.0, step=0.01)
-                guess_mode = gr.Checkbox(label='Guess Mode', value=False)
-                detect_resolution = gr.Slider(label="Hough Resolution", minimum=128, maximum=1024, value=512, step=1)
-                value_threshold = gr.Slider(label="Hough value threshold (MLSD)", minimum=0.01, maximum=2.0, value=0.1, step=0.01)
-                distance_threshold = gr.Slider(label="Hough distance threshold (MLSD)", minimum=0.01, maximum=20.0, value=0.1, step=0.01)
-                ddim_steps = gr.Slider(label="Steps", minimum=1, maximum=100, value=20, step=1)
-                scale = gr.Slider(label="Guidance Scale", minimum=0.1, maximum=30.0, value=9.0, step=0.1)
-                seed = gr.Slider(label="Seed", minimum=-1, maximum=2147483647, step=1, randomize=True)
-                eta = gr.Number(label="eta (DDIM)", value=0.0)
-                a_prompt = gr.Textbox(label="Added Prompt", value='best quality, extremely detailed')
-                n_prompt = gr.Textbox(label="Negative Prompt",
-                                      value='longbody, lowres, bad anatomy, bad hands, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality')
-        with gr.Column():
-            result_gallery = gr.Gallery(label='Output', show_label=False, elem_id="gallery").style(grid=2, height='auto')
-    ips = [input_image, prompt, a_prompt, n_prompt, num_samples, image_resolution, detect_resolution, ddim_steps, guess_mode, strength, scale, seed, eta, value_threshold, distance_threshold]
-    run_button.click(fn=process, inputs=ips, outputs=[result_gallery])
-
-
-block.launch(server_name='0.0.0.0')
diff --git a/gradio_normal2image.py b/gradio_normal2image.py
deleted file mode 100644
index 30aea2f8d4..0000000000
--- a/gradio_normal2image.py
+++ /dev/null
@@ -1,99 +0,0 @@
-from share import *
-import config
-
-import cv2
-import einops
-import gradio as gr
-import numpy as np
-import torch
-import random
-
-from pytorch_lightning import seed_everything
-from annotator.util import resize_image, HWC3
-from annotator.midas import MidasDetector
-from cldm.model import create_model, load_state_dict
-from cldm.ddim_hacked import DDIMSampler
-
-
-apply_midas = MidasDetector()
-
-model = create_model('./models/cldm_v15.yaml').cpu()
-model.load_state_dict(load_state_dict('./models/control_sd15_normal.pth', location='cuda'))
-model = model.cuda()
-ddim_sampler = DDIMSampler(model)
-
-
-def process(input_image, prompt, a_prompt, n_prompt, num_samples, image_resolution, detect_resolution, ddim_steps, guess_mode, strength, scale, seed, eta, bg_threshold):
-    with torch.no_grad():
-        input_image = HWC3(input_image)
-        _, detected_map = apply_midas(resize_image(input_image, detect_resolution), bg_th=bg_threshold)
-        detected_map = HWC3(detected_map)
-        img = resize_image(input_image, image_resolution)
-        H, W, C = img.shape
-
-        detected_map = cv2.resize(detected_map, (W, H), interpolation=cv2.INTER_LINEAR)
-
-        control = torch.from_numpy(detected_map[:, :, ::-1].copy()).float().cuda() / 255.0
-        control = torch.stack([control for _ in range(num_samples)], dim=0)
-        control = einops.rearrange(control, 'b h w c -> b c h w').clone()
-
-        if seed == -1:
-            seed = random.randint(0, 65535)
-        seed_everything(seed)
-
-        if config.save_memory:
-            model.low_vram_shift(is_diffusing=False)
-
-        cond = {"c_concat": [control], "c_crossattn": [model.get_learned_conditioning([prompt + ', ' + a_prompt] * num_samples)]}
-        un_cond = {"c_concat": None if guess_mode else [control], "c_crossattn": [model.get_learned_conditioning([n_prompt] * num_samples)]}
-        shape = (4, H // 8, W // 8)
-
-        if config.save_memory:
-            model.low_vram_shift(is_diffusing=True)
-
-        model.control_scales = [strength * (0.825 ** float(12 - i)) for i in range(13)] if guess_mode else ([strength] * 13)  # Magic number. IDK why. Perhaps because 0.825**12<0.01 but 0.826**12>0.01
-        samples, intermediates = ddim_sampler.sample(ddim_steps, num_samples,
-                                                     shape, cond, verbose=False, eta=eta,
-                                                     unconditional_guidance_scale=scale,
-                                                     unconditional_conditioning=un_cond)
-
-        if config.save_memory:
-            model.low_vram_shift(is_diffusing=False)
-
-        x_samples = model.decode_first_stage(samples)
-        x_samples = (einops.rearrange(x_samples, 'b c h w -> b h w c') * 127.5 + 127.5).cpu().numpy().clip(0, 255).astype(np.uint8)
-
-        results = [x_samples[i] for i in range(num_samples)]
-    return [detected_map] + results
-
-
-block = gr.Blocks().queue()
-with block:
-    with gr.Row():
-        gr.Markdown("## Control Stable Diffusion with Normal Maps")
-    with gr.Row():
-        with gr.Column():
-            input_image = gr.Image(source='upload', type="numpy")
-            prompt = gr.Textbox(label="Prompt")
-            run_button = gr.Button(label="Run")
-            with gr.Accordion("Advanced options", open=False):
-                num_samples = gr.Slider(label="Images", minimum=1, maximum=12, value=1, step=1)
-                image_resolution = gr.Slider(label="Image Resolution", minimum=256, maximum=768, value=512, step=64)
-                strength = gr.Slider(label="Control Strength", minimum=0.0, maximum=2.0, value=1.0, step=0.01)
-                guess_mode = gr.Checkbox(label='Guess Mode', value=False)
-                detect_resolution = gr.Slider(label="Normal Resolution", minimum=128, maximum=1024, value=384, step=1)
-                bg_threshold = gr.Slider(label="Normal background threshold", minimum=0.0, maximum=1.0, value=0.4, step=0.01)
-                ddim_steps = gr.Slider(label="Steps", minimum=1, maximum=100, value=20, step=1)
-                scale = gr.Slider(label="Guidance Scale", minimum=0.1, maximum=30.0, value=9.0, step=0.1)
-                seed = gr.Slider(label="Seed", minimum=-1, maximum=2147483647, step=1, randomize=True)
-                eta = gr.Number(label="eta (DDIM)", value=0.0)
-                a_prompt = gr.Textbox(label="Added Prompt", value='best quality, extremely detailed')
-                n_prompt = gr.Textbox(label="Negative Prompt",
-                                      value='longbody, lowres, bad anatomy, bad hands, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality')
-        with gr.Column():
-            result_gallery = gr.Gallery(label='Output', show_label=False, elem_id="gallery").style(grid=2, height='auto')
-    ips = [input_image, prompt, a_prompt, n_prompt, num_samples, image_resolution, detect_resolution, ddim_steps, guess_mode, strength, scale, seed, eta, bg_threshold]
-    run_button.click(fn=process, inputs=ips, outputs=[result_gallery])
-
-
-block.launch(server_name='0.0.0.0')
diff --git a/gradio_pose2image.py b/gradio_pose2image.py
deleted file mode 100644
index 700973bfab..0000000000
--- a/gradio_pose2image.py
+++ /dev/null
@@ -1,98 +0,0 @@
-from share import *
-import config
-
-import cv2
-import einops
-import gradio as gr
-import numpy as np
-import torch
-import random
-
-from pytorch_lightning import seed_everything
-from annotator.util import resize_image, HWC3
-from annotator.openpose import OpenposeDetector
-from cldm.model import create_model, load_state_dict
-from cldm.ddim_hacked import DDIMSampler
-
-
-apply_openpose = OpenposeDetector()
-
-model = create_model('./models/cldm_v15.yaml').cpu()
-model.load_state_dict(load_state_dict('./models/control_sd15_openpose.pth', location='cuda'))
-model = model.cuda()
-ddim_sampler = DDIMSampler(model)
-
-
-def process(input_image, prompt, a_prompt, n_prompt, num_samples, image_resolution, detect_resolution, ddim_steps, guess_mode, strength, scale, seed, eta):
-    with torch.no_grad():
-        input_image = HWC3(input_image)
-        detected_map, _ = apply_openpose(resize_image(input_image, detect_resolution))
-        detected_map = HWC3(detected_map)
-        img = resize_image(input_image, image_resolution)
-        H, W, C = img.shape
-
-        detected_map = cv2.resize(detected_map, (W, H), interpolation=cv2.INTER_NEAREST)
-
-        control = torch.from_numpy(detected_map.copy()).float().cuda() / 255.0
-        control = torch.stack([control for _ in range(num_samples)], dim=0)
-        control = einops.rearrange(control, 'b h w c -> b c h w').clone()
-
-        if seed == -1:
-            seed = random.randint(0, 65535)
-        seed_everything(seed)
-
-        if config.save_memory:
-            model.low_vram_shift(is_diffusing=False)
-
-        cond = {"c_concat": [control], "c_crossattn": [model.get_learned_conditioning([prompt + ', ' + a_prompt] * num_samples)]}
-        un_cond = {"c_concat": None if guess_mode else [control], "c_crossattn": [model.get_learned_conditioning([n_prompt] * num_samples)]}
-        shape = (4, H // 8, W // 8)
-
-        if config.save_memory:
-            model.low_vram_shift(is_diffusing=True)
-
-        model.control_scales = [strength * (0.825 ** float(12 - i)) for i in range(13)] if guess_mode else ([strength] * 13)  # Magic number. IDK why. Perhaps because 0.825**12<0.01 but 0.826**12>0.01
-        samples, intermediates = ddim_sampler.sample(ddim_steps, num_samples,
-                                                     shape, cond, verbose=False, eta=eta,
-                                                     unconditional_guidance_scale=scale,
-                                                     unconditional_conditioning=un_cond)
-
-        if config.save_memory:
-            model.low_vram_shift(is_diffusing=False)
-
-        x_samples = model.decode_first_stage(samples)
-        x_samples = (einops.rearrange(x_samples, 'b c h w -> b h w c') * 127.5 + 127.5).cpu().numpy().clip(0, 255).astype(np.uint8)
-
-        results = [x_samples[i] for i in range(num_samples)]
-    return [detected_map] + results
-
-
-block = gr.Blocks().queue()
-with block:
-    with gr.Row():
-        gr.Markdown("## Control Stable Diffusion with Human Pose")
-    with gr.Row():
-        with gr.Column():
-            input_image = gr.Image(source='upload', type="numpy")
-            prompt = gr.Textbox(label="Prompt")
-            run_button = gr.Button(label="Run")
-            with gr.Accordion("Advanced options", open=False):
-                num_samples = gr.Slider(label="Images", minimum=1, maximum=12, value=1, step=1)
-                image_resolution = gr.Slider(label="Image Resolution", minimum=256, maximum=768, value=512, step=64)
-                strength = gr.Slider(label="Control Strength", minimum=0.0, maximum=2.0, value=1.0, step=0.01)
-                guess_mode = gr.Checkbox(label='Guess Mode', value=False)
-                detect_resolution = gr.Slider(label="OpenPose Resolution", minimum=128, maximum=1024, value=512, step=1)
-                ddim_steps = gr.Slider(label="Steps", minimum=1, maximum=100, value=20, step=1)
-                scale = gr.Slider(label="Guidance Scale", minimum=0.1, maximum=30.0, value=9.0, step=0.1)
-                seed = gr.Slider(label="Seed", minimum=-1, maximum=2147483647, step=1, randomize=True)
-                eta = gr.Number(label="eta (DDIM)", value=0.0)
-                a_prompt = gr.Textbox(label="Added Prompt", value='best quality, extremely detailed')
-                n_prompt = gr.Textbox(label="Negative Prompt",
-                                      value='longbody, lowres, bad anatomy, bad hands, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality')
-        with gr.Column():
-            result_gallery = gr.Gallery(label='Output', show_label=False, elem_id="gallery").style(grid=2, height='auto')
-    ips = [input_image, prompt, a_prompt, n_prompt, num_samples, image_resolution, detect_resolution, ddim_steps, guess_mode, strength, scale, seed, eta]
-    run_button.click(fn=process, inputs=ips, outputs=[result_gallery])
-
-
-block.launch(server_name='0.0.0.0')
diff --git a/gradio_scribble2image.py b/gradio_scribble2image.py
deleted file mode 100644
index 8abbc25bde..0000000000
--- a/gradio_scribble2image.py
+++ /dev/null
@@ -1,92 +0,0 @@
-from share import *
-import config
-
-import cv2
-import einops
-import gradio as gr
-import numpy as np
-import torch
-import random
-
-from pytorch_lightning import seed_everything
-from annotator.util import resize_image, HWC3
-from cldm.model import create_model, load_state_dict
-from cldm.ddim_hacked import DDIMSampler
-
-
-model = create_model('./models/cldm_v15.yaml').cpu()
-model.load_state_dict(load_state_dict('./models/control_sd15_scribble.pth', location='cuda'))
-model = model.cuda()
-ddim_sampler = DDIMSampler(model)
-
-
-def process(input_image, prompt, a_prompt, n_prompt, num_samples, image_resolution, ddim_steps, guess_mode, strength, scale, seed, eta):
-    with torch.no_grad():
-        img = resize_image(HWC3(input_image), image_resolution)
-        H, W, C = img.shape
-
-        detected_map = np.zeros_like(img, dtype=np.uint8)
-        detected_map[np.min(img, axis=2) < 127] = 255
-
-        control = torch.from_numpy(detected_map.copy()).float().cuda() / 255.0
-        control = torch.stack([control for _ in range(num_samples)], dim=0)
-        control = einops.rearrange(control, 'b h w c -> b c h w').clone()
-
-        if seed == -1:
-            seed = random.randint(0, 65535)
-        seed_everything(seed)
-
-        if config.save_memory:
-            model.low_vram_shift(is_diffusing=False)
-
-        cond = {"c_concat": [control], "c_crossattn": [model.get_learned_conditioning([prompt + ', ' + a_prompt] * num_samples)]}
-        un_cond = {"c_concat": None if guess_mode else [control], "c_crossattn": [model.get_learned_conditioning([n_prompt] * num_samples)]}
-        shape = (4, H // 8, W // 8)
-
-        if config.save_memory:
-            model.low_vram_shift(is_diffusing=True)
-
-        model.control_scales = [strength * (0.825 ** float(12 - i)) for i in range(13)] if guess_mode else ([strength] * 13)  # Magic number. IDK why. Perhaps because 0.825**12<0.01 but 0.826**12>0.01
-        samples, intermediates = ddim_sampler.sample(ddim_steps, num_samples,
-                                                     shape, cond, verbose=False, eta=eta,
-                                                     unconditional_guidance_scale=scale,
-                                                     unconditional_conditioning=un_cond)
-
-        if config.save_memory:
-            model.low_vram_shift(is_diffusing=False)
-
-        x_samples = model.decode_first_stage(samples)
-        x_samples = (einops.rearrange(x_samples, 'b c h w -> b h w c') * 127.5 + 127.5).cpu().numpy().clip(0, 255).astype(np.uint8)
-
-        results = [x_samples[i] for i in range(num_samples)]
-    return [255 - detected_map] + results
-
-
-block = gr.Blocks().queue()
-with block:
-    with gr.Row():
-        gr.Markdown("## Control Stable Diffusion with Scribble Maps")
-    with gr.Row():
-        with gr.Column():
-            input_image = gr.Image(source='upload', type="numpy")
-            prompt = gr.Textbox(label="Prompt")
-            run_button = gr.Button(label="Run")
-            with gr.Accordion("Advanced options", open=False):
-                num_samples = gr.Slider(label="Images", minimum=1, maximum=12, value=1, step=1)
-                image_resolution = gr.Slider(label="Image Resolution", minimum=256, maximum=768, value=512, step=64)
-                strength = gr.Slider(label="Control Strength", minimum=0.0, maximum=2.0, value=1.0, step=0.01)
-                guess_mode = gr.Checkbox(label='Guess Mode', value=False)
-                ddim_steps = gr.Slider(label="Steps", minimum=1, maximum=100, value=20, step=1)
-                scale = gr.Slider(label="Guidance Scale", minimum=0.1, maximum=30.0, value=9.0, step=0.1)
-                seed = gr.Slider(label="Seed", minimum=-1, maximum=2147483647, step=1, randomize=True)
-                eta = gr.Number(label="eta (DDIM)", value=0.0)
-                a_prompt = gr.Textbox(label="Added Prompt", value='best quality, extremely detailed')
-                n_prompt = gr.Textbox(label="Negative Prompt",
-                                      value='longbody, lowres, bad anatomy, bad hands, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality')
-        with gr.Column():
-            result_gallery = gr.Gallery(label='Output', show_label=False, elem_id="gallery").style(grid=2, height='auto')
-    ips = [input_image, prompt, a_prompt, n_prompt, num_samples, image_resolution, ddim_steps, guess_mode, strength, scale, seed, eta]
-    run_button.click(fn=process, inputs=ips, outputs=[result_gallery])
-
-
-block.launch(server_name='0.0.0.0')
diff --git a/gradio_scribble2image_interactive.py b/gradio_scribble2image_interactive.py
deleted file mode 100644
index 7308bcc1bb..0000000000
--- a/gradio_scribble2image_interactive.py
+++ /dev/null
@@ -1,102 +0,0 @@
-from share import *
-import config
-
-import cv2
-import einops
-import gradio as gr
-import numpy as np
-import torch
-import random
-
-from pytorch_lightning import seed_everything
-from annotator.util import resize_image, HWC3
-from cldm.model import create_model, load_state_dict
-from cldm.ddim_hacked import DDIMSampler
-
-
-model = create_model('./models/cldm_v15.yaml').cpu()
-model.load_state_dict(load_state_dict('./models/control_sd15_scribble.pth', location='cuda'))
-model = model.cuda()
-ddim_sampler = DDIMSampler(model)
-
-
-def process(input_image, prompt, a_prompt, n_prompt, num_samples, image_resolution, ddim_steps, guess_mode, strength, scale, seed, eta):
-    with torch.no_grad():
-        img = resize_image(HWC3(input_image['mask'][:, :, 0]), image_resolution)
-        H, W, C = img.shape
-
-        detected_map = np.zeros_like(img, dtype=np.uint8)
-        detected_map[np.min(img, axis=2) > 127] = 255
-
-        control = torch.from_numpy(detected_map.copy()).float().cuda() / 255.0
-        control = torch.stack([control for _ in range(num_samples)], dim=0)
-        control = einops.rearrange(control, 'b h w c -> b c h w').clone()
-
-        if seed == -1:
-            seed = random.randint(0, 65535)
-        seed_everything(seed)
-
-        if config.save_memory:
-            model.low_vram_shift(is_diffusing=False)
-
-        cond = {"c_concat": [control], "c_crossattn": [model.get_learned_conditioning([prompt + ', ' + a_prompt] * num_samples)]}
-        un_cond = {"c_concat": None if guess_mode else [control], "c_crossattn": [model.get_learned_conditioning([n_prompt] * num_samples)]}
-        shape = (4, H // 8, W // 8)
-
-        if config.save_memory:
-            model.low_vram_shift(is_diffusing=True)
-
-        model.control_scales = [strength * (0.825 ** float(12 - i)) for i in range(13)] if guess_mode else ([strength] * 13)  # Magic number. IDK why. Perhaps because 0.825**12<0.01 but 0.826**12>0.01
-        samples, intermediates = ddim_sampler.sample(ddim_steps, num_samples,
-                                                     shape, cond, verbose=False, eta=eta,
-                                                     unconditional_guidance_scale=scale,
-                                                     unconditional_conditioning=un_cond)
-
-        if config.save_memory:
-            model.low_vram_shift(is_diffusing=False)
-
-        x_samples = model.decode_first_stage(samples)
-        x_samples = (einops.rearrange(x_samples, 'b c h w -> b h w c') * 127.5 + 127.5).cpu().numpy().clip(0, 255).astype(np.uint8)
-
-        results = [x_samples[i] for i in range(num_samples)]
-    return [255 - detected_map] + results
-
-
-def create_canvas(w, h):
-    return np.zeros(shape=(h, w, 3), dtype=np.uint8) + 255
-
-
-block = gr.Blocks().queue()
-with block:
-    with gr.Row():
-        gr.Markdown("## Control Stable Diffusion with Interactive Scribbles")
-    with gr.Row():
-        with gr.Column():
-            canvas_width = gr.Slider(label="Canvas Width", minimum=256, maximum=1024, value=512, step=1)
-            canvas_height = gr.Slider(label="Canvas Height", minimum=256, maximum=1024, value=512, step=1)
-            create_button = gr.Button(label="Start", value='Open drawing canvas!')
-            input_image = gr.Image(source='upload', type='numpy', tool='sketch')
-            gr.Markdown(value='Do not forget to change your brush width to make it thinner. (Gradio do not allow developers to set brush width so you need to do it manually.) '
-                              'Just click on the small pencil icon in the upper right corner of the above block.')
-            create_button.click(fn=create_canvas, inputs=[canvas_width, canvas_height], outputs=[input_image])
-            prompt = gr.Textbox(label="Prompt")
-            run_button = gr.Button(label="Run")
-            with gr.Accordion("Advanced options", open=False):
-                num_samples = gr.Slider(label="Images", minimum=1, maximum=12, value=1, step=1)
-                image_resolution = gr.Slider(label="Image Resolution", minimum=256, maximum=768, value=512, step=64)
-                strength = gr.Slider(label="Control Strength", minimum=0.0, maximum=2.0, value=1.0, step=0.01)
-                guess_mode = gr.Checkbox(label='Guess Mode', value=False)
-                ddim_steps = gr.Slider(label="Steps", minimum=1, maximum=100, value=20, step=1)
-                scale = gr.Slider(label="Guidance Scale", minimum=0.1, maximum=30.0, value=9.0, step=0.1)
-                seed = gr.Slider(label="Seed", minimum=-1, maximum=2147483647, step=1, randomize=True)
-                eta = gr.Number(label="eta (DDIM)", value=0.0)
-                a_prompt = gr.Textbox(label="Added Prompt", value='best quality, extremely detailed')
-                n_prompt = gr.Textbox(label="Negative Prompt",
-                                      value='longbody, lowres, bad anatomy, bad hands, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality')
-        with gr.Column():
-            result_gallery = gr.Gallery(label='Output', show_label=False, elem_id="gallery").style(grid=2, height='auto')
-    ips = [input_image, prompt, a_prompt, n_prompt, num_samples, image_resolution, ddim_steps, guess_mode, strength, scale, seed, eta]
-    run_button.click(fn=process, inputs=ips, outputs=[result_gallery])
-
-
-block.launch(server_name='0.0.0.0')
diff --git a/gradio_seg2image.py b/gradio_seg2image-sd21-mask_input.py
similarity index 57%
rename from gradio_seg2image.py
rename to gradio_seg2image-sd21-mask_input.py
index c3854dc762..db37c613c0 100644
--- a/gradio_seg2image.py
+++ b/gradio_seg2image-sd21-mask_input.py
@@ -10,47 +10,76 @@
 
 from pytorch_lightning import seed_everything
 from annotator.util import resize_image, HWC3
-from annotator.uniformer import UniformerDetector
 from cldm.model import create_model, load_state_dict
 from cldm.ddim_hacked import DDIMSampler
 
+#输入图片为分割图！！！
 
-apply_uniformer = UniformerDetector()
-
-model = create_model('./models/cldm_v15.yaml').cpu()
-model.load_state_dict(load_state_dict('./models/control_sd15_seg.pth', location='cuda'))
+model = create_model('/home/tmp/workspace/old_diff/models/cldm_v21.yaml').cpu()
+# /home/data2/yangsp22/code/finetune-output/sam-new/CODA-all/weights/lightning_logs/version_1/checkpoints/epoch=40-step=19999.ckpt
+model.load_state_dict(load_state_dict('/home/tmp/workspace/diffusion_app/backend/epoch=9-step=35139.ckpt', location='cuda'))
 model = model.cuda()
 ddim_sampler = DDIMSampler(model)
 
 
-def process(input_image, prompt, a_prompt, n_prompt, num_samples, image_resolution, detect_resolution, ddim_steps, guess_mode, strength, scale, seed, eta):
+def process(detected_map, prompt, a_prompt, n_prompt, num_samples, image_resolution, detect_resolution, ddim_steps, guess_mode, strength, scale, seed, eta):
+    print(detected_map.shape, "detected_map.shape")
+    print(prompt, "prompt")
+    print(a_prompt, "a_prompt")
+    print(n_prompt, "n_prompt")
+    print(num_samples, type(num_samples), "num_samples")
+    print(image_resolution, type(image_resolution), "image_resolution")
+    print(detect_resolution, type(detect_resolution), "detect_resolution")
+    print(ddim_steps, type(ddim_steps), "ddim_steps")
+    print(guess_mode, type(guess_mode), "guess_mode")
+    print(strength, type(strength), "strength")
+    print(scale, type(scale), "scale")
+    print(seed, type(seed), "seed")
+    print(eta, type(eta), "eta")
+    print("111")
     with torch.no_grad():
-        input_image = HWC3(input_image)
-        detected_map = apply_uniformer(resize_image(input_image, detect_resolution))
-        img = resize_image(input_image, image_resolution)
-        H, W, C = img.shape
-
+        detected_map = HWC3(detected_map) # 以输入图片1020 x 1920为例，(h, w, c) （高，宽，channel）(1020, 1920, 3)
+        img = resize_image(detected_map, image_resolution) # (1020, 1920, 3) -> (512, 960, 3)
+        H, W, C = img.shape # 512, 960, 3
+        print(11111)
+        # cv2.INTER_NEAREST：最邻近插值
+        # 使用 最邻近插值法 将图像 detected_map 调整为指定大小 (W, H)
         detected_map = cv2.resize(detected_map, (W, H), interpolation=cv2.INTER_NEAREST)
 
-        control = torch.from_numpy(detected_map.copy()).float().cuda() / 255.0
-        control = torch.stack([control for _ in range(num_samples)], dim=0)
-        control = einops.rearrange(control, 'b h w c -> b c h w').clone()
+        control = torch.from_numpy(detected_map.copy()).float().cuda() / 255.0 # shape=torch.size([512,960,3]), dtype=torch.float32, 值在0-1区间
+        control = torch.stack([control for _ in range(num_samples)], dim=0) # num_samples=1, shape=torch.size([1,512,960,3])
+        control = einops.rearrange(control, 'b h w c -> b c h w').clone() # b h w c -> b c h w
 
         if seed == -1:
             seed = random.randint(0, 65535)
-        seed_everything(seed)
+        seed_everything(seed) #随机种子
 
         if config.save_memory:
             model.low_vram_shift(is_diffusing=False)
-
+        
+        # !!!
+        # obstruction_prompt="A construction zone occupies part of the right lane, with cones, workers, and safety signs."
+        
+        # !!!
+        # cond（正向控制条件）：图片转成control，prompt+a_prompt作为交叉注意力的控制条件
         cond = {"c_concat": [control], "c_crossattn": [model.get_learned_conditioning([prompt + ', ' + a_prompt] * num_samples)]}
+        # cond = {"c_concat": [control], "c_crossattn": [model.get_learned_conditioning([prompt + ', ' + a_prompt] * num_samples)], 
+        #         "obstruction_c_crossattn": [model.get_learned_conditioning([obstruction_prompt] * num_samples)]}
+        
+        # !!!
+        # un_cond（反向控制条件）：图片转成control，n_prompt作为交叉注意力的负面控制条件
         un_cond = {"c_concat": None if guess_mode else [control], "c_crossattn": [model.get_learned_conditioning([n_prompt] * num_samples)]}
-        shape = (4, H // 8, W // 8)
+        # un_cond = {"c_concat": None if guess_mode else [control], "c_crossattn": [model.get_learned_conditioning([n_prompt] * num_samples)], 
+        #         "obstruction_c_crossattn": None}
+        
+        shape = (4, H // 8, W // 8) # H 512, W 960 -> shape (4, 64, 120)
 
         if config.save_memory:
             model.low_vram_shift(is_diffusing=True)
 
+        # 控制权重
         model.control_scales = [strength * (0.825 ** float(12 - i)) for i in range(13)] if guess_mode else ([strength] * 13)  # Magic number. IDK why. Perhaps because 0.825**12<0.01 but 0.826**12>0.01
+        # samples -> shape=torch.size([1,4,64,120])
         samples, intermediates = ddim_sampler.sample(ddim_steps, num_samples,
                                                      shape, cond, verbose=False, eta=eta,
                                                      unconditional_guidance_scale=scale,
@@ -59,17 +88,17 @@ def process(input_image, prompt, a_prompt, n_prompt, num_samples, image_resoluti
         if config.save_memory:
             model.low_vram_shift(is_diffusing=False)
 
-        x_samples = model.decode_first_stage(samples)
+        x_samples = model.decode_first_stage(samples) # shape=torch.size([1,3,512,960])
         x_samples = (einops.rearrange(x_samples, 'b c h w -> b h w c') * 127.5 + 127.5).cpu().numpy().clip(0, 255).astype(np.uint8)
 
-        results = [x_samples[i] for i in range(num_samples)]
+        results = [x_samples[i] for i in range(num_samples)] # list
     return [detected_map] + results
 
 
 block = gr.Blocks().queue()
 with block:
     with gr.Row():
-        gr.Markdown("## Control Stable Diffusion with Segmentation Maps")
+        gr.Markdown("## Control Stable Diffusion with Segmentation Maps (Mask input)")
     with gr.Row():
         with gr.Column():
             input_image = gr.Image(source='upload', type="numpy")
diff --git a/ldm/models/diffusion/ddpm.py b/ldm/models/diffusion/ddpm.py
index f71a44af48..9e95e0e73d 100644
--- a/ldm/models/diffusion/ddpm.py
+++ b/ldm/models/diffusion/ddpm.py
@@ -17,7 +17,8 @@
 import itertools
 from tqdm import tqdm
 from torchvision.utils import make_grid
-from pytorch_lightning.utilities.distributed import rank_zero_only
+# from pytorch_lightning.utilities.distributed import rank_zero_only
+from pytorch_lightning.utilities.rank_zero import rank_zero_only
 from omegaconf import ListConfig
 
 from ldm.util import log_txt_as_img, exists, default, ismap, isimage, mean_flat, count_params, instantiate_from_config
@@ -445,11 +446,11 @@ def training_step(self, batch, batch_idx):
                       logger=True, on_step=True, on_epoch=True)
 
         self.log("global_step", self.global_step,
-                 prog_bar=True, logger=True, on_step=True, on_epoch=False)
+                 prog_bar=True, logger=True, on_step=True, on_epoch=False, batch_size=len(batch['txt']))
 
         if self.use_scheduler:
             lr = self.optimizers().param_groups[0]['lr']
-            self.log('lr_abs', lr, prog_bar=True, logger=True, on_step=True, on_epoch=False)
+            self.log('lr_abs', lr, prog_bar=True, logger=True, on_step=True, on_epoch=False, batch_size=len(batch['txt']))
 
         return loss
 
diff --git a/ldm/modules/encoders/modules.py b/ldm/modules/encoders/modules.py
index 4edd5496b9..8521394dac 100644
--- a/ldm/modules/encoders/modules.py
+++ b/ldm/modules/encoders/modules.py
@@ -92,7 +92,9 @@ class FrozenCLIPEmbedder(AbstractEncoder):
         "pooled",
         "hidden"
     ]
-    def __init__(self, version="openai/clip-vit-large-patch14", device="cuda", max_length=77,
+    # def __init__(self, version="/home/data2/yangsp22/openaiclip-vit-large-patch14", device="cuda", max_length=77,
+    #              freeze=True, layer="last", layer_idx=None):  # clip-vit-base-patch32
+    def __init__(self, version="clip-vit-base-patch32", device="cuda", max_length=77,
                  freeze=True, layer="last", layer_idx=None):  # clip-vit-base-patch32
         super().__init__()
         assert layer in self.LAYERS
@@ -140,8 +142,10 @@ class FrozenOpenCLIPEmbedder(AbstractEncoder):
         "last",
         "penultimate"
     ]
+    # def __init__(self, arch="ViT-H-14", version="/home/data2/yangsp22/CLIP-ViT-H-14-laion2B-s32B-b79K/open_clip_pytorch_model.bin", device="cuda", max_length=77,
+    #              freeze=True, layer="last"): # version="laion2b_s32b_b79k"
     def __init__(self, arch="ViT-H-14", version="laion2b_s32b_b79k", device="cuda", max_length=77,
-                 freeze=True, layer="last"):
+                 freeze=True, layer="last"): # version="laion2b_s32b_b79k"
         super().__init__()
         assert layer in self.LAYERS
         model, _, _ = open_clip.create_model_and_transforms(arch, device=torch.device('cpu'), pretrained=version)
diff --git a/ldm/util.py b/ldm/util.py
index 45cb050ece..ef3183f86b 100644
--- a/ldm/util.py
+++ b/ldm/util.py
@@ -76,6 +76,7 @@ def instantiate_from_config(config):
         elif config == "__is_unconditional__":
             return None
         raise KeyError("Expected key `target` to instantiate.")
+    #!!!
     return get_obj_from_str(config["target"])(**config.get("params", dict()))
 
 
@@ -84,6 +85,8 @@ def get_obj_from_str(string, reload=False):
     if reload:
         module_imp = importlib.import_module(module)
         importlib.reload(module_imp)
+    #!!!
+    # print(getattr(importlib.import_module(module, package=None), cls))
     return getattr(importlib.import_module(module, package=None), cls)